亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

以運動圖像連續(xù)拍攝文檔來產(chǎn)生電子文檔的方法和設(shè)備的制作方法

文檔序號:6628310閱讀:174來源:國知局
專利名稱:以運動圖像連續(xù)拍攝文檔來產(chǎn)生電子文檔的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
符合本發(fā)明的設(shè)備和方法涉及通過以運動圖像連續(xù)拍攝文檔來產(chǎn)生電子文檔,更具體地講,涉及通過以運動圖像連續(xù)拍攝具有多頁的文檔來產(chǎn)生電子文檔。
背景技術(shù)
由于運動圖像壓縮技術(shù)、便攜式裝置制造技術(shù)、和小型存儲裝置近來的發(fā)展,諸如數(shù)碼攝像機或具有內(nèi)建的數(shù)碼相機的移動電話的可拍攝運動圖像的便攜式裝置已被開發(fā)。由于這種裝置易于攜帶,所以無論何時并且無論何地這種裝置都可產(chǎn)生、編輯、并存儲多媒體數(shù)據(jù)。
傳統(tǒng)上,為了使用這種裝置將打印的文檔、書等轉(zhuǎn)換為電子文檔,使用掃描儀、數(shù)碼相機等掃描文檔或書,并且將掃描的數(shù)據(jù)輸入到文檔識別系統(tǒng)。其后,使用眾多的文本識別算法識別輸入的圖像數(shù)據(jù),并且將圖像數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)。
圖1是產(chǎn)生電子文檔的傳統(tǒng)系統(tǒng)的方框圖。圖像數(shù)據(jù)輸入單元110接收將經(jīng)由相機、掃描儀等被轉(zhuǎn)換為電子文檔的文檔或書的圖像數(shù)據(jù)。例如,輸入圖像數(shù)據(jù)可為位圖格式。文本識別單元120使用眾多文本識別算法識別圖像數(shù)據(jù),并且將圖像數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)。生成的文本數(shù)據(jù)被存儲在存儲器130中。用戶接口單元140接收用戶的命令,并且將該命令發(fā)送到控制產(chǎn)生電子文檔的系統(tǒng)的控制器150。顯示單元160顯示諸如文本識別的結(jié)果或處理用戶命令的狀態(tài)的信息。盡管圖1中未示出,諸如用于通過編輯存儲在存儲器130中的文本數(shù)據(jù)來以期望的形式創(chuàng)建電子文檔的編輯功能執(zhí)行單元的其它單元可被包括在系統(tǒng)中。
圖2是產(chǎn)生電子文檔的傳統(tǒng)方法的流程圖。使用諸如相機或掃描儀的輸入裝置將將被制成電子文檔的主題(例如,紙文檔、書等)拍攝或掃描,其后將拍攝的或掃描的圖像數(shù)據(jù)輸入到系統(tǒng)(S210)。諸如輸入開始命令的命令可經(jīng)包括在用戶接口單元140中的按鈕、鼠標(biāo)等而被輸入。例如,通過按下相機的記錄按鈕或掃描儀的掃描開始按鈕來創(chuàng)建圖像數(shù)據(jù)。創(chuàng)建的圖像數(shù)據(jù)被存儲在存儲器130中(S220)。其后,對存儲的圖像數(shù)據(jù)執(zhí)行文本識別以將圖像數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)(S230)。以這種方式產(chǎn)生的文本數(shù)據(jù)被存儲在存儲器130中。通過文本識別產(chǎn)生的文本數(shù)據(jù)被轉(zhuǎn)換為具有由用戶設(shè)置的預(yù)定格式的電子文檔。電子文檔也被存儲在存儲器130中。
然而,如果文檔由幾頁而非僅一頁構(gòu)成,則上述處理對每一頁重復(fù)并且為每頁產(chǎn)生一個電子文件。其后,所有的電子文件被編輯在一起以構(gòu)成一個電子文件。在此處理中,諸如拍攝的圖像的中間處理結(jié)果或最終識別結(jié)果經(jīng)由顯示單元160而被顯示。
由于圖像處理和文本識別技術(shù)近來的發(fā)展,即使在有一些損壞的圖像中,圖像識別也有很高的成功率。然而,使用通過使用相機或掃描儀執(zhí)行文本識別來產(chǎn)生電子文檔的傳統(tǒng)方法來處理具有多頁的文檔是不方便的。即,當(dāng)在將被制成電子文檔的文檔中有多頁時,圖像輸入和文本識別處理需要對每一頁重復(fù)執(zhí)行,并且需要其它處理。其它處理可包括分別存儲輸入圖像數(shù)據(jù)和由文本識別創(chuàng)建的文本數(shù)據(jù),其后在編輯處理中將圖像數(shù)據(jù)和文本數(shù)據(jù)編輯為一個電子文檔。因此,花費了大量時間和金錢。

發(fā)明內(nèi)容
本發(fā)明提供一種用于通過通過使用可拍攝運動圖像的各種數(shù)碼拍攝裝置(例如,攝像機、個人數(shù)字助理、移動電話、個人計算機攝像頭等)連續(xù)地拍攝文檔并對連續(xù)拍攝文檔的結(jié)果執(zhí)行文本識別來有效地將由多頁構(gòu)成的文檔轉(zhuǎn)換為電子文檔從而創(chuàng)建電子文檔的方法和設(shè)備。
根據(jù)本發(fā)明的一方面,提供一種產(chǎn)生電子文檔的方法。該方法包括拍攝文檔并產(chǎn)生運動圖像數(shù)據(jù);通過對產(chǎn)生的運動圖像數(shù)據(jù)執(zhí)行運動估計來檢測文檔的一頁的數(shù)據(jù),對文檔的一頁的數(shù)據(jù)執(zhí)行文檔識別,并且將文檔的一頁的數(shù)據(jù)存儲為文本數(shù)據(jù);通過對運動圖像數(shù)據(jù)執(zhí)行運動估計來檢測下一頁的數(shù)據(jù)是否被輸入,對下一頁的數(shù)據(jù)執(zhí)行文檔識別,并且將下一頁的數(shù)據(jù)存儲為文本數(shù)據(jù);以及將全部文本數(shù)據(jù)存儲為一個電子文檔。
檢測一頁的數(shù)據(jù)的步驟包括對產(chǎn)生的運動圖像數(shù)據(jù)執(zhí)行運動估計;如果文檔是雙側(cè)的,則檢測一幀之內(nèi)的頁間的邊界并且在將該幀分為兩頁之后將兩頁上的數(shù)據(jù)存儲為圖像數(shù)據(jù);以及對圖像數(shù)據(jù)執(zhí)行文檔識別并且存儲識別的文本數(shù)據(jù)。
檢測一頁的數(shù)據(jù)的步驟可包括確定是否由于在預(yù)定時段缺少運動從而當(dāng)前幀的運動值的總值小于預(yù)定的第一臨界值。如果當(dāng)前幀的運動值的總值小于第一臨界值,則從達(dá)到該點而被處理的多個幀中檢測一幀作為文檔的一頁,對該一頁執(zhí)行文檔識別,并且該一頁被存儲為文本數(shù)據(jù)。
檢測下一頁的數(shù)據(jù)是否被輸入的步驟可包括確定當(dāng)由于對文檔的翻頁導(dǎo)致運動值增加時,當(dāng)前幀的運動值的總值是否大于預(yù)定的第二臨界值,以及下一頁的開始點。而且,還可確定連續(xù)輸入幀的運動值的總值是否小于第一臨界值和下一頁的數(shù)據(jù)是否被輸入,并且如果下一頁的數(shù)據(jù)被輸入,則通過執(zhí)行文檔識別來將下一頁的數(shù)據(jù)存儲為文本數(shù)據(jù)。
根據(jù)本發(fā)明的另一方面,提供一種用于產(chǎn)生電子文檔的設(shè)備。該設(shè)備包括圖像數(shù)據(jù)輸入單元,其拍攝文檔并產(chǎn)生運動圖像數(shù)據(jù);運動檢測單元,其對產(chǎn)生的運動圖像數(shù)據(jù)執(zhí)行運動估計,并且檢測運動;數(shù)據(jù)處理單元,其根據(jù)運動檢測的結(jié)果區(qū)分文檔的頁,并且通過對頁執(zhí)行文檔識別而將該頁轉(zhuǎn)換為文本數(shù)據(jù)。
該設(shè)備還包括用戶接口單元,其從用戶接收命令并且設(shè)置用于文檔識別的拍攝模式,設(shè)置與具有左側(cè)和右側(cè)的雙側(cè)文檔或具有頂部和底部的雙側(cè)文檔或單側(cè)文檔相應(yīng)的模式,并且選擇以其存儲通過執(zhí)行文檔識別獲得的文本數(shù)據(jù)的文件格式。
在再現(xiàn)預(yù)存儲的運動圖像的同時,用戶接口單元可從用戶接收命令用于文檔識別,并且將該命令發(fā)送到數(shù)據(jù)處理單元,從而數(shù)據(jù)處理單元不考慮運動檢測的結(jié)果而產(chǎn)生電子文檔。
該設(shè)備還包括顯示單元,例如,其指示當(dāng)前幀的圖像是否被無錯地存儲、文檔識別的結(jié)果、或偶發(fā)錯誤。
數(shù)據(jù)處理單元包括圖像處理器,其根據(jù)運動檢測的結(jié)果選擇一頁的幀;雙側(cè)文檔處理器,當(dāng)文檔為雙側(cè)文檔時,其檢測一幀內(nèi)的頁之間的邊界,并且在將該幀分為兩頁之后將兩頁上的數(shù)據(jù)存儲為圖像數(shù)據(jù);以及文檔識別器,其對圖像數(shù)據(jù)執(zhí)行文檔識別,并且將圖像數(shù)據(jù)輸出為文本數(shù)據(jù)。


通過下面參照附圖進行的對本發(fā)明示例性實施例的詳細(xì)描述,本發(fā)明的上述和其他方面將會變得更加清楚,其中圖1是產(chǎn)生電子文檔傳統(tǒng)系統(tǒng)的方框圖;圖2是產(chǎn)生電子文檔的傳統(tǒng)方法的流程圖;圖3是根據(jù)本發(fā)明示例性實施例的產(chǎn)生電子文檔的設(shè)備的方框圖;圖4是圖3所示的用于產(chǎn)生電子文檔的設(shè)備的詳細(xì)方框圖;以及圖5是根據(jù)本發(fā)明示例性實施例的產(chǎn)生電子文檔的方法的流程圖。
具體實施例方式
現(xiàn)在,參照其中示出本發(fā)明的示例性實施例的附圖來充分描述本發(fā)明。
根據(jù)本發(fā)明的產(chǎn)生電子文檔的方法通過使用拍攝運動圖像的數(shù)碼拍攝裝置連續(xù)拍攝文檔來將具有多頁的文檔轉(zhuǎn)換為一個相應(yīng)的電子文檔??杀晦D(zhuǎn)換為電子文檔的文檔的類型包括其中一次僅示出頁的一側(cè)的單側(cè)文檔、和其中一次示出左頁和右頁、或頂頁和底頁的類似于書的雙側(cè)文檔。單側(cè)和雙側(cè)文檔都可被轉(zhuǎn)換為電子文檔。
圖3是根據(jù)本發(fā)明示例性實施例的產(chǎn)生電子文檔的設(shè)備的方框圖。用于產(chǎn)生電子文檔的設(shè)備包括圖像數(shù)據(jù)輸入單元310、運動檢測單元320、數(shù)據(jù)處理單元330、存儲器340、用戶接口單元350、和顯示單元360。
圖像數(shù)據(jù)輸入單元310拍攝文檔,并且將其轉(zhuǎn)換為數(shù)字運動圖像數(shù)據(jù),并且可為各種能夠拍攝運動圖像的數(shù)碼拍攝裝置的任一種。例如,數(shù)碼拍攝裝置包括數(shù)碼攝像機、個人數(shù)字助理(PDA)、具有內(nèi)置的數(shù)碼相機的移動電話、個人計算機(PC)攝像頭等。以這種方式拍攝的數(shù)字運動圖像數(shù)據(jù)被輸入到運動檢測單元320。運動檢測單元320檢測屏幕中拍攝的運動。當(dāng)拍攝一頁時沒有檢測到運動,但是當(dāng)翻頁以拍攝下一頁時,檢測到屏幕上的運動。因此,運動檢測單元320檢測屏幕上的運動并且將一拍攝的頁與下一頁區(qū)分開。數(shù)據(jù)處理單元330通過雙側(cè)處理和文本識別處理將產(chǎn)生的運動圖像數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù),其后創(chuàng)建預(yù)定形式的電子文檔。雙側(cè)處理和文本識別處理將在下面描述。
存儲器340臨時存儲運動圖像數(shù)據(jù)或存儲完整的電子文檔。用戶接口單元350接收用戶的選擇,例如拍攝開始/結(jié)束命令或規(guī)定單側(cè)或雙側(cè)文檔的拍攝的拍攝選擇。其后,用戶的選擇被發(fā)送到數(shù)據(jù)處理單元330,并且滿足用戶的選擇的電子文檔被產(chǎn)生。顯示單元360為用戶提供關(guān)于圖像的中間處理結(jié)果的信息、圖像的文本識別結(jié)果、或電子文檔處理結(jié)果。
圖4是圖3中所示的用于產(chǎn)生電子文檔設(shè)備的詳細(xì)方框圖。諸如數(shù)碼攝像機的拍攝運動圖像的數(shù)碼拍攝裝置對輸入圖像執(zhí)行壓縮編碼。執(zhí)行這種壓縮編碼的編碼單元420包括運動估計器421、運動補償器422、變換器和量化器423、熵編碼器424、和幀存儲器425。編碼單元420根據(jù)預(yù)定的壓縮編碼的方法編碼輸入的圖像。預(yù)定的壓縮編碼的方法可為基于運動預(yù)測壓縮編碼運動圖像的任一方法(例如,運動圖像專家組(MPEG)方法和H.264方法)。而且,拍攝運動圖像的數(shù)碼拍攝裝置可為能夠拍攝運動圖像的數(shù)碼攝像機、PDA、PC攝像頭、和移動電話中的任一個。
圖像數(shù)據(jù)輸入單元310經(jīng)由拍攝運動圖像的數(shù)碼拍攝裝置接收單側(cè)或雙側(cè)文檔。用戶接口單元350接收用于文檔識別的拍攝模式、用于單側(cè)/雙側(cè)文檔識別模式的選擇、或拍攝開始/結(jié)束命令以從由多頁構(gòu)成的文檔中創(chuàng)建電子文檔。而且,可通過在在再現(xiàn)存儲在數(shù)碼拍攝裝置上的運動圖像同時用戶想要開始文檔識別的點輸入手動文檔識別命令來由用戶手動創(chuàng)建電子文檔。經(jīng)由用戶接口單元350將手動文檔識別命令發(fā)送到數(shù)據(jù)處理單元330。
編碼單元420根據(jù)運動預(yù)測算法對從圖像數(shù)據(jù)輸入單元310接收的運動圖像執(zhí)行編碼。在此處理中,運動估計器421從輸入的運動圖像計算運動信息,并且將該運動信息發(fā)送到圖像處理器440。即,運動估計器421從參考幀內(nèi)的預(yù)定搜索區(qū)域中找到當(dāng)前幀的宏塊的運動預(yù)測,并且計算與前一幀在運動中的差值。圖像處理器440選擇作為文檔識別的對象的幀,并且基于從運動估計器421接收的運動信息將該幀處理為適于文檔識別的圖像。換言之,圖像處理器440從運動估計器421接收指示直到當(dāng)運動圖像數(shù)據(jù)與一頁相應(yīng)時的運動信息,在同一頁上在運動圖像數(shù)據(jù)中選擇最聚焦的幀,并且將該幀制成一個文檔圖像。即,圖像處理器440將該幀轉(zhuǎn)換為可對一頁執(zhí)行文本識別的形式。
當(dāng)在雙側(cè)文檔識別模式下時,雙側(cè)文檔處理器450將一幀分為兩幀。下面將參照圖5來描述將該幀分為兩幀的方法。文檔識別器460從以這種方式創(chuàng)建的圖像中提取諸如特征信息或圖像信息的信息。例如,將被識別的文檔可為文本文檔、圖畫文檔、或照片文檔。當(dāng)文檔是文本文檔時,文檔識別器460對作為存儲在存儲器340中的文本識別的對象的運動圖像執(zhí)行文本識別,僅檢測可識別的運動圖像,并根據(jù)用戶已經(jīng)設(shè)置的文件格式將該結(jié)果存儲在存儲器340中,或?qū)⒃摻Y(jié)果記錄在一個或多個外部存儲裝置中。在文檔的拍攝結(jié)束之后,可經(jīng)諸如串行通信端口或通用串行總線(USB)的外部接口、或經(jīng)網(wǎng)絡(luò)將拍攝的電子文檔發(fā)送到設(shè)備之外。
當(dāng)用戶希望在執(zhí)行文檔識別同時存儲輸入的運動圖像數(shù)據(jù)時,包括在編碼單元420中的其它部件壓縮輸入的運動圖像數(shù)據(jù)。顯示單元360提供文檔識別處理的結(jié)果。存儲單元(例如,存儲器340)臨時存儲文檔的運動圖像數(shù)據(jù),或存儲完整的電子文檔。當(dāng)輸入的文檔是地址列表或是外語時,存儲的電子文檔可被轉(zhuǎn)換為地址列表或可被還可包括在該設(shè)備中的翻譯單元(未示出)自動翻譯。
圖5是根據(jù)本發(fā)明示例性實施例的產(chǎn)生電子文檔的方法的流程圖。首先,產(chǎn)生電子文檔的設(shè)備被初始化(S510)。即,用戶首先經(jīng)由用戶接口單元350設(shè)置用于文檔識別的拍攝模式,其后設(shè)置左側(cè)和右側(cè)或頂部和底部的文檔、或單側(cè)文檔識別模式,并選擇文檔識別結(jié)果將以其存儲的文件格式(例如,“pdf”、“txt”等)。因此,拍攝拍攝的對象(例如,小說、電話薄、照片等)的準(zhǔn)備被完成。
在準(zhǔn)備被完成之后,經(jīng)由用戶接口單元350將拍攝開始命令發(fā)送到該設(shè)備,并且開始對對象的拍攝(S520)。即,例如,通過按下數(shù)碼攝像機、PDA、或移動電話的拍攝按鈕或另外激活例如PC攝像頭的拍攝裝置來將拍攝開始命令發(fā)送到該設(shè)備。
數(shù)據(jù)處理單元330確定用于產(chǎn)生電子文檔的設(shè)備是否處于用于文檔識別的拍攝模式(S530)。如果用于文檔識別的拍攝模式在初始化(S510)期間被設(shè)置以創(chuàng)建電子文檔,則用于識別文檔的拍攝被執(zhí)行,并且如果常規(guī)的運動圖像拍攝模式被設(shè)置,則壓縮的運動圖像被產(chǎn)生并被存儲為處于一般運動圖像拍攝模式(S535)。
如果在用于文檔識別的拍攝模式下,則通過在運動圖像數(shù)據(jù)中的運動檢測來檢測一頁(S540)。如果沒有預(yù)定量時間的運動,則確定用于當(dāng)前幀的運動的總值是否小于預(yù)定的第一臨界值TH1。在當(dāng)沒有預(yù)定量時間的運動時確定是否當(dāng)前幀的運動的總值小于第一預(yù)定臨界值之后,檢測運動以及時地存儲到該點而被感知的多個幀中的一幀作為與該文檔的一頁相應(yīng)的圖像數(shù)據(jù)。更具體地講,當(dāng)文檔的拍攝開始時,由運動估計器421對每一幀計算經(jīng)由圖像數(shù)據(jù)輸入單元310輸入的運動圖像的運動值,其后當(dāng)前幀的運動值被輸入到圖像處理器440。圖像處理器440找到具有比預(yù)定的第一臨界值TH1小的當(dāng)前輸入幀的運動值的總值的第一幀,并且執(zhí)行選擇的幀的文檔識別所需的處理。文檔識別可能需要的處理的例子是圖像增強處理。第一臨界值可通過實驗而被設(shè)置為足夠小的值。由于當(dāng)識別文檔時沒有運動,所以第一臨界值被設(shè)置為接近0。而且,計算運動值的總值所需的預(yù)定時段,即拍攝一頁要多久被決定。
以這種方式處理的當(dāng)前幀被存儲為一頁的圖像(S550)。例如,經(jīng)由液晶顯示器(LCD)或發(fā)光二極管(LED)顯示器構(gòu)成的顯示單元360通知用戶一頁的數(shù)據(jù)被無錯地存儲。由于用戶被通知當(dāng)前頁被適當(dāng)存儲,所以用戶可在保持在拍攝模式的同時繼續(xù)拍攝下一頁。
接下來,確定當(dāng)前拍攝模式是否是雙側(cè)文檔識別模式(S560)。如果處于雙側(cè)文檔識別模式,則在當(dāng)前幀的中心部分檢測邊界,其后將當(dāng)前幀存儲為分離的兩頁(S570)。更具體地講,由圖像處理器440存儲的圖像的邊界被雙側(cè)文檔處理器450檢測。在由左側(cè)和右側(cè)構(gòu)成的雙側(cè)文檔的中心部分的垂直線上檢測邊界,并且在由頂部和底部構(gòu)成的雙側(cè)文檔的中心部分的水平線上檢測邊界。在檢測的邊界中,可在圖像的中心部分區(qū)分雙側(cè)文檔的側(cè)的、比參考值長的垂直或水平邊界候選者被選擇。通過找到最長的垂直或水平邊界候選者,在左側(cè)和右側(cè)或頂部和底部的頁可被分開并單獨存儲。如果處于單側(cè)文檔識別模式,則雙側(cè)文檔處理器450不工作,并且下一操作被發(fā)送到文檔識別器460(S575)。
接下來,文檔的文檔識別和存儲被執(zhí)行(S580)。在文本文檔的情況下執(zhí)行的字符識別可通過眾多字符識別算法的任一種執(zhí)行。通過字符識別產(chǎn)生的文本數(shù)據(jù)被存儲在存儲單元中(即,存儲器340)。其后,確定拍攝是否已經(jīng)結(jié)束(S582)。如果確定拍攝還未結(jié)束,則拍攝下一頁的開始點被檢測(S585)。通過例子的方式,可以以下方式檢測下一頁的開始點。當(dāng)翻頁時,運動值增加。因此,確定用于當(dāng)前幀的運動值的總值是否大于第二臨界值TH2。還可通過實驗決定第二臨界值。第二臨界值TH2大于第一臨界值TH1。即,連續(xù)輸入的幀的運動值被連續(xù)檢查。如果運動值大于用于預(yù)定時段的第二臨界值TH2,則確定這時是用戶在翻頁。如果下一頁的開始點未被檢測到,則處理返回操作S582。如果下一頁的開始點被檢測到,則確定是否從用戶接收到拍攝結(jié)束命令(S590)。如果接收到拍攝結(jié)束命令,則拍攝結(jié)束。如果未接收到拍攝結(jié)束命令,則文檔的下一頁被連續(xù)拍攝并且繼續(xù)文檔識別。
產(chǎn)生電子文檔的方法可被寫為計算機程序。配置計算機程序的代碼和代碼段可由本發(fā)明所屬的本領(lǐng)域計算機程序員容易地構(gòu)造。而且,計算機程序被存儲在計算機可讀介質(zhì)中,并且通過經(jīng)由計算機讀取并執(zhí)行計算機程序來實現(xiàn)產(chǎn)生電子文檔的方法。例如,計算機可讀記錄媒體包括磁記錄媒體、光學(xué)數(shù)據(jù)存儲媒體、和載波媒體。
根據(jù)用于產(chǎn)生電子文檔的上述方法和設(shè)備,通過拍攝單一運動圖像而不對單側(cè)或雙側(cè)紙文檔的每一頁進行單獨掃描或拍攝,單側(cè)或雙側(cè)紙文檔的多頁可被容易地轉(zhuǎn)換為電子文檔。因此,例如,電話薄、地址薄等可被容易地輸入并轉(zhuǎn)換為電子文檔。
而且,例如,可通過使用包括在傳統(tǒng)運動圖像編碼單元中的運動估計器檢測運動來更容易地執(zhí)行將具有多頁的文檔轉(zhuǎn)換為電子文檔。而且,可通過文檔識別將存儲為文本數(shù)據(jù)的文檔轉(zhuǎn)換為地址列表。另外,通過通過文檔識別翻譯以外語寫的文檔并輸出該文檔,文檔的形式或外語可被快速地轉(zhuǎn)換或翻譯。
盡管已參照本發(fā)明示例性實施例顯示并描述了本發(fā)明,但是,本領(lǐng)域技術(shù)人員應(yīng)該理解,在不脫離由所附權(quán)利要求限定的本發(fā)明的精神和范圍的情況下,可以在形式上和細(xì)節(jié)上進行各種改變。
權(quán)利要求
1.一種產(chǎn)生電子文檔的方法,該方法包括拍攝具有多頁的文檔并產(chǎn)生運動圖像數(shù)據(jù);通過對該運動圖像數(shù)據(jù)執(zhí)行運動估計來檢測文檔的一頁的數(shù)據(jù),對該文檔的一頁的數(shù)據(jù)執(zhí)行文檔識別,并且將文檔的一頁的數(shù)據(jù)存儲為第一文本數(shù)據(jù);通過對運動圖像數(shù)據(jù)執(zhí)行運動估計來檢測下一頁的數(shù)據(jù)是否被輸入,并且如果下一頁的數(shù)據(jù)被檢測到,則對下一頁的數(shù)據(jù)執(zhí)行文檔識別,并且將下一頁的數(shù)據(jù)存儲為第二文本數(shù)據(jù);以及將第一文本數(shù)據(jù)和第二文本數(shù)據(jù)存儲為一個電子文檔。
2.如權(quán)利要求1所述的方法,還包括,在拍攝該文檔之前經(jīng)由用戶接口單元設(shè)置用于頁文檔識別的拍攝模式;設(shè)置與具有左側(cè)和右側(cè)的雙側(cè)文檔、具有頂部和底部的雙側(cè)文檔、和單側(cè)文檔之一相應(yīng)的模式;以及選擇文檔在被轉(zhuǎn)換為電子文檔之后以其被存儲的文件的格式。
3.如權(quán)利要求1所述的方法,其中,檢測一頁的數(shù)據(jù)和檢測下一頁的數(shù)據(jù)是否被輸入的步驟包括,如果在預(yù)存儲的運動圖像被再現(xiàn)時用于用戶選擇的幀的文檔識別的命令被輸入,則對用戶選擇的幀執(zhí)行文檔識別并將幀存儲為文本數(shù)據(jù)。
4.如權(quán)利要求1所述的方法,其中,檢測一頁的數(shù)據(jù)的步驟包括對運動圖像數(shù)據(jù)執(zhí)行運動估計;如果文檔是雙側(cè)的,則檢測一幀之內(nèi)的兩頁間的邊界,將該幀分為兩頁,并且將兩頁上的數(shù)據(jù)存儲為圖像數(shù)據(jù);以及對圖像數(shù)據(jù)執(zhí)行文檔識別并且將識別結(jié)果存儲為文本數(shù)據(jù)。
5.如權(quán)利要求4所述的方法,其中,在檢測兩頁之間的邊界的步驟中,如果雙側(cè)文檔具有左側(cè)和右側(cè),則檢測幀的中心部分的垂直線上的邊界,并且如果雙側(cè)文檔具有頂部和底部,則檢測幀的中心部分的水平線上的邊界;該幀被分為兩頁;以及兩頁上的數(shù)據(jù)被存儲為圖像數(shù)據(jù)。
6.如權(quán)利要求5所述的方法,其中,在檢測兩頁之間的邊界的步驟中,選擇比參考值長的垂直邊界和水平邊界候選者之一,并且其中,參考值在檢測的邊界區(qū)分在幀的中心部分上的兩頁,并且通過在邊界候選者中找到具有最高值的邊界來劃分左頁和右頁或頂頁和底頁。
7.如權(quán)利要求1所述的方法,其中,在拍攝文檔的步驟中,使用圖像數(shù)據(jù)輸入裝置拍攝文檔,并且從拍攝的文檔產(chǎn)生運動圖像數(shù)據(jù)。
8.如權(quán)利要求7所述的方法,其中,所述圖像數(shù)據(jù)輸入裝置是相機、攝像機、個人數(shù)字助理、和個人計算機攝像頭中的任一個。
9.如權(quán)利要求1所述的方法,其中,檢測一頁的數(shù)據(jù)的步驟包括確定是否由于在預(yù)定時段缺少運動從而當(dāng)前幀的運動值的總值小于預(yù)定的第一臨界值,并且如果運動值的總值小于第一臨界值,則從達(dá)到該點而被處理的多個幀中檢測一幀作為文檔的一頁,對該一頁執(zhí)行文檔識別,并且該一頁被存儲為文本數(shù)據(jù)。
10.如權(quán)利要求1所述的方法,還包括經(jīng)由顯示單元通知用戶當(dāng)前幀的圖像是否被無錯地存儲、文檔識別的結(jié)果、和偶發(fā)錯誤中的至少一個。
11.如權(quán)利要求1所述的方法,還包括,在檢測下一頁的數(shù)據(jù)是否被輸入的步驟中確定如果由于對文檔的翻頁導(dǎo)致運動值增加,則當(dāng)前幀的運動值的總值是否大于預(yù)定的第二臨界值;以及確定文檔的下一頁的開始點。
12.如權(quán)利要求11所述的方法,還包括確定多個連續(xù)輸入幀的運動值的總值是否小于第一臨界值,所述第一臨界值小于所述第二臨界值;檢測下一頁的數(shù)據(jù)是否被輸入;以及對下一頁的數(shù)據(jù)執(zhí)行文檔識別來將下一頁的數(shù)據(jù)存儲為文本數(shù)據(jù)。
13.一種用于產(chǎn)生電子文檔的設(shè)備,包括圖像數(shù)據(jù)輸入單元,其拍攝具有多頁的文檔并產(chǎn)生運動圖像數(shù)據(jù);運動檢測單元,其對運動圖像數(shù)據(jù)執(zhí)行運動估計以檢測運動;數(shù)據(jù)處理單元,其根據(jù)運動檢測的結(jié)果區(qū)分文檔的頁,并且通過對頁執(zhí)行文檔識別而將每一頁轉(zhuǎn)換為文本數(shù)據(jù)。
14.如權(quán)利要求13所述的設(shè)備,還包括用戶接口單元,其從用戶接收命令并且設(shè)置用于文檔識別的拍攝模式;設(shè)置與具有左側(cè)和右側(cè)的雙側(cè)文檔、具有頂部和底部的雙側(cè)文檔、或單側(cè)文檔中的一個相應(yīng)的模式;以及選擇以其存儲通過執(zhí)行文檔識別獲得的文本數(shù)據(jù)的文件格式。
15.如權(quán)利要求14所述的設(shè)備,其中,在再現(xiàn)預(yù)存儲的運動圖像的同時,用戶接口單元從用戶接收命令用于文檔識別,并且將該命令發(fā)送到數(shù)據(jù)處理單元,并且數(shù)據(jù)處理單元不考慮運動檢測的結(jié)果而從預(yù)存儲的運動圖像產(chǎn)生電子文檔。
16.如權(quán)利要求13所述的設(shè)備,還包括顯示單元,例如,其指示當(dāng)前幀的圖像是否被無錯地存儲、文檔識別的結(jié)果、或偶發(fā)錯誤中的至少一個。
17.如權(quán)利要求13所述的設(shè)備,其中,數(shù)據(jù)處理單元包括圖像處理器,其根據(jù)運動檢測的結(jié)果選擇一頁的幀;雙側(cè)文檔處理器,如果文檔為雙側(cè)文檔,則其檢測一幀內(nèi)的兩頁之間的邊界;將該幀分為兩頁;并且將兩頁上的數(shù)據(jù)存儲為圖像數(shù)據(jù);以及文檔識別器,其對圖像數(shù)據(jù)執(zhí)行文檔識別,并且將圖像數(shù)據(jù)輸出為文本數(shù)據(jù)。
18.如權(quán)利要求17所述的設(shè)備,其中,如果該文檔是具有左側(cè)和右側(cè)的雙側(cè)文檔,則雙側(cè)文檔處理器檢測該幀的中心部分的垂直線上的邊界,或者如果該文檔是具有底部和底部的雙側(cè)文檔,則雙側(cè)文檔處理器檢測該幀的中心部分的水平線上的邊界,并且將該幀存儲為與兩頁中的每一頁相應(yīng)的分開的圖像數(shù)據(jù)。
19.如權(quán)利要求17所述的設(shè)備,其中,圖像處理器確定是否由于在預(yù)定時段缺少運動從而當(dāng)前幀的運動值的總值小于預(yù)定的第一臨界值,并且在達(dá)到該點而被處理的多個幀中檢測一幀作為該文檔的一頁。
20.如權(quán)利要求17所述的設(shè)備,其中,如果由于對文檔翻頁導(dǎo)致運動值增加,則圖像處理器確定當(dāng)前幀的運動值的總值是否大于預(yù)定的第二臨界值,并且檢測下一頁的開始點。
21.一種計算機可讀記錄介質(zhì),其上記錄有能夠被計算機讀取并執(zhí)行的計算機程序,所述計算機程序通過執(zhí)行以下操作產(chǎn)生電子文檔通過拍攝具有多頁的文檔來產(chǎn)生運動圖像數(shù)據(jù);通過對該運動圖像數(shù)據(jù)執(zhí)行運動估計來檢測文檔的一頁的數(shù)據(jù),對該文檔的一頁的數(shù)據(jù)執(zhí)行文檔識別,并且將文檔的一頁的數(shù)據(jù)存儲為第一文本數(shù)據(jù);通過對運動圖像數(shù)據(jù)執(zhí)行運動估計來檢測下一頁的數(shù)據(jù)是否被輸入,并且如果下一頁的數(shù)據(jù)被檢測到,則對下一頁的數(shù)據(jù)執(zhí)行文檔識別,并且將下一頁的數(shù)據(jù)存儲為第二文本數(shù)據(jù);以及將第一文本數(shù)據(jù)和第二文本數(shù)據(jù)存儲為一個電子文檔。
全文摘要
一種通過連續(xù)拍攝具有多頁的文檔作為運動圖像來產(chǎn)生電子文檔的方法包括拍攝文檔并產(chǎn)生運動圖像數(shù)據(jù);通過對運動圖像數(shù)據(jù)執(zhí)行運動估計來檢測文檔的一頁的數(shù)據(jù),對一頁的數(shù)據(jù)執(zhí)行文檔識別,并且將一頁的數(shù)據(jù)存儲為文本數(shù)據(jù);通過對運動圖像數(shù)據(jù)執(zhí)行運動估計來檢測下一頁的數(shù)據(jù)是否被輸入,對下一頁的數(shù)據(jù)執(zhí)行文檔識別,并且將下一頁的數(shù)據(jù)存儲為文本數(shù)據(jù);以及將全部頁存儲為一個電子文檔。因此,通過拍攝單一運動圖像而不必須單獨拍攝文檔的每一頁,具有多頁的文檔可被容易地轉(zhuǎn)換為電子文檔。
文檔編號G06K9/20GK1722134SQ20051008287
公開日2006年1月18日 申請日期2005年7月11日 優(yōu)先權(quán)日2004年7月12日
發(fā)明者姜羽錫 申請人:三星電子株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1