亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于編輯光學(xué)字符識別結(jié)果的方法和系統(tǒng)的制作方法

文檔序號:6546088閱讀:120來源:國知局
專利名稱:用于編輯光學(xué)字符識別結(jié)果的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明總的來說(但非排他地)涉及在手持電子裝置中編輯光學(xué)字符識別(OCR)結(jié)果,尤其涉及用于顯示可由電子裝置的用戶編輯的OCR結(jié)果的方法和系統(tǒng)。
背景技術(shù)
光學(xué)字符識別(OCR)可以被定義為將文本圖像數(shù)據(jù)轉(zhuǎn)換為例如ASCII的可由文字處理應(yīng)用程序讀取的字符代碼格式。在原始文本圖像數(shù)據(jù)中,文本字符由各個像素按照與其他類型的圖像數(shù)據(jù)(例如圖畫或線條)相同的方式構(gòu)成。在轉(zhuǎn)換成字符代碼格式后,文本字符的原始圖像常常不再可用于幫助編輯和校正轉(zhuǎn)換結(jié)果中的錯誤。因此OCR處理需要各字符的相當(dāng)高質(zhì)量的圖像,以便將圖像轉(zhuǎn)換成特定的字符代碼。然而,高質(zhì)量圖像往往是很大的、高分辨率的圖像。處理高分辨率圖像通常需要大量的存儲和處理器資源,并且可能大大增加執(zhí)行字符識別所需的時間。
對于內(nèi)嵌在手持電子裝置中的圖像分析引擎來說,處理高分辨率圖像可能尤其成問題。許多手持裝置,例如移動電話、個人數(shù)字助理(PDA)和數(shù)碼相機,或這些裝置的組合,都包括用于識別圖像中的文本的OCR部件。例如,移動電話可以包括數(shù)字?jǐn)z像頭,它使得用戶能夠捕獲名片的圖像,分析該圖像以識別圖像中的文本,然后將相關(guān)的名字和地址自動存儲在電話的聯(lián)系文件中。但是移動電話的有限的存儲和處理器資源可能導(dǎo)致從名片識別名字和地址的OCR處理含有大量錯誤。另外,例如名片的文件經(jīng)常將例如名字、地址和電話號碼字段等標(biāo)準(zhǔn)字段以不同的順序來布置或布置在名片上不同的位置,這也可能導(dǎo)致OCR錯誤,需要通過編輯處理來校正。
存在小型文本編輯器,用于校正手持電子裝置的OCR結(jié)果中的錯誤;然而,這種現(xiàn)有技術(shù)編輯器常常很難用,因為它們需要在小鍵盤上鍵入各個字符。而且,這種編輯器在執(zhí)行OCR錯誤校正時通常需要用戶參考原始文件。這常常是很不方便的,因為當(dāng)用戶試圖編輯OCR結(jié)果時很可能忘記將名片放在了什么地方并且經(jīng)常找不到。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個方面,本發(fā)明是一種用于在顯示屏上顯示能夠由電子裝置的用戶編輯的光學(xué)字符識別(OCR)結(jié)果的方法。該方法包括在顯示屏的第一部分上顯示包括至少一個文本區(qū)域的文件圖像。然后在顯示屏的第二部分上顯示能夠由裝置的用戶編輯的文本信息。在屏幕的第一部分上的文件圖像和在屏幕的第二部分上的文本信息同時顯示,并且所述文本信息從對所述文件圖像的至少一個文本區(qū)域的OCR分析得到。由于文件圖像在編輯過程中再現(xiàn),因此不需要用戶使用諸如名片的原始硬拷貝文件。實際上,對照文件圖像的文本區(qū)域,可以容易地檢查OCR處理的結(jié)果。
根據(jù)本發(fā)明的另一方面,在如上所述同時顯示文件圖像和文本信息之后,可以選擇所述文件圖像的一個文本區(qū)域。然后文件圖像的選擇文本區(qū)域被復(fù)制和粘貼到顯示屏的第一部分。然后使用OCR引擎對文件圖像的選擇文本區(qū)域進(jìn)行處理以產(chǎn)生編輯的文本輸出。最后,編輯的文本輸出在顯示屏的第一部分中顯示??梢栽谄聊坏牡谝缓偷诙糠种型瑫r顯示的文件圖像和文本信息之間使用方便的拖放程序操作來對從OCR處理得到的文本信息進(jìn)行校正。
根據(jù)本發(fā)明的再一方面,本發(fā)明是一種用于顯示能夠由用戶編輯的光學(xué)字符識別(OCR)結(jié)果的系統(tǒng)。該系統(tǒng)包括電子裝置的顯示屏。在顯示屏的第一部分顯示包括至少一個文本區(qū)域的文件圖像,并且與顯示屏的第一部分上的文件圖像的顯示同時,在顯示屏的第二部分上顯示能夠由裝置的用戶編輯的文本信息。所述文本信息從對所述文件圖像的至少一個文本區(qū)域的OCR分析得到。


為使本發(fā)明容易理解,并產(chǎn)生實際效果,將根據(jù)附圖對示出的示范實施例進(jìn)行說明,其中相同的參考數(shù)字指的是相同的元件,其中圖1是示出根據(jù)本發(fā)明實施例的手持電子裝置的顯示屏的第一實施例的示意圖;圖2是示出根據(jù)本發(fā)明實施例的手持電子裝置的顯示屏的第二實施例的示意圖;圖3是示出根據(jù)本發(fā)明實施例的手持電子裝置的顯示屏的第三實施例的示意圖;圖4是示出根據(jù)本發(fā)明實施例的手持電子裝置的顯示屏的第四實施例的示意圖;圖5是示出根據(jù)本發(fā)明實施例的手持電子裝置的顯示屏的第五實施例的示意圖;圖6是示出根據(jù)本發(fā)明實施例的手持電子裝置的顯示屏的第六實施例的示意圖;圖7是示出根據(jù)本發(fā)明實施例的方法的流程圖。
具體實施例方式
參考圖1,示出根據(jù)本發(fā)明實施例的手持電子裝置的顯示屏100的示意圖。屏幕100包括顯示文件圖像110的第一部分105,文件圖像110例如是名片的局部圖像,包括至少一個文本區(qū)域115。屏幕100進(jìn)一步包括顯示文本信息125的第二部分120。如圖1所示,在屏幕100的第一部分105上的文件圖像110和在屏幕100的第二部分120上的文本信息同時顯示。文本信息125通過對文件圖像110的至少一個文本區(qū)域115的光學(xué)字符識別(OCR)分析來得到。因此本發(fā)明的分割屏幕100通過顯示能夠用于檢查OCR結(jié)果準(zhǔn)確性的文件圖像110使得能夠在手持裝置上更有效和更方便地編輯OCR結(jié)果。
根據(jù)本發(fā)明的一個實施例,例如人名的單行文本信息125通常從單行文本區(qū)域115得到。已通過OCR分析識別的文件圖像110的文本區(qū)域115可在文件圖像110上用可見標(biāo)記來表示。例如,圖1所示的文本區(qū)域115用人名周圍的黑框來表示。在編輯文件圖像110的第二部分120中的OCR結(jié)果時,可見標(biāo)記可能是有用的。例如,如果可見標(biāo)記指示在文件圖像110中只有文本行的一部分通過OCR處理被識別,或者如果由不存在可見標(biāo)記而指示OCR處理完全遺漏了文件圖像110中的一行文本,那么用戶可以采取步驟來編輯和校正顯示屏100的第二部分120中的文本信息125??梢姌?biāo)記可以是各種形式,例如形成圍繞文本區(qū)域115的矩形的線條(如圖1至4所示)。其他標(biāo)記可以包括著重點以及文本區(qū)域115的顏色改變。例如,在彩色顯示屏100上,在屏幕100的第一部分105中的背景文件圖像110可以呈現(xiàn)為黑白,而已通過OCR處理識別的文本區(qū)域115可以呈現(xiàn)為紅色。
圖2是示出與圖1所示相同的顯示屏100的示意圖;不過,在屏幕100的第一部分105中,文件圖像110顯示移至左側(cè)。根據(jù)本發(fā)明的一個實施例,該特征使得本發(fā)明的用戶能夠相對于手持裝置的小屏幕100在任意方向移動文件圖像110,以便查看較大圖像的多個片段。
圖3和圖4顯示了本發(fā)明實施例的另一個特征,其中顯示屏100的第一和第二部分105、120可相對于彼此調(diào)整。該特征也增加了在小顯示屏100上編輯OCR結(jié)果的容易和便利,因為用戶被給予了很大的靈活性來在屏幕100上僅顯示當(dāng)前被編輯的文件圖像110的那些方面和相關(guān)的OCR結(jié)果。
本發(fā)明因此可用于各種類型的具有小顯示屏100的電子裝置。這種裝置包括例如移動電話、個人數(shù)字助理、數(shù)碼相機和一些膝上型電腦。使用這種裝置編輯文本文件有時可能是一個笨拙的過程,因為這些裝置通常沒有連接至全尺寸鍵盤或鼠標(biāo)。因此編輯常常需要使用小鍵盤或觸摸屏部件,它們用手指或觸筆來操作。本發(fā)明能夠有助于最小化對鍵盤或觸摸屏輸入的數(shù)量,這些輸入是在這種裝置上編輯OCR結(jié)果所需要的,因此節(jié)省了裝置的用戶的時間和精力。
例如,本發(fā)明的實施例能夠包括在結(jié)合有數(shù)字?jǐn)z像頭的移動電話中。該電話的用戶可能例如收到一張新名片,并試圖將名片上的信息輸入到他或她的電話上的存儲器中存儲的個人電子地址簿中。根據(jù)本發(fā)明,用戶可以簡單地使用該電話對該名片進(jìn)行照相,然后啟動電話上的OCR處理來識別得到的圖像110的文本區(qū)域115。由于文件圖像110包括原始名片的完整圖片,因此該用戶不需要保存原始名片。該用戶然后可以根據(jù)本發(fā)明在他或她方便的時候通過僅參考存儲在電話上的文件圖像110來編輯OCR結(jié)果。
除了能夠在編輯OCR結(jié)果時參考原始文件的文件圖像110以外,本發(fā)明的實施例還使得用戶能夠從文件圖像110將文本區(qū)域復(fù)制到在顯示屏100的第二部分120中顯示的文本信息125的行之中。該能力能夠顯著降低編輯所需的時間。例如,如果屏幕100的第二部分120中的文本信息125不正確,或者如果文本信息125從屏幕100的第二部分120中完全遺漏了,那么用戶可以選擇從屏幕100的第一部分105選擇并復(fù)制有關(guān)的文本區(qū)域,并將它粘貼到屏幕100的第二部分120的適當(dāng)位置。這種復(fù)制和粘貼過程可以使用本領(lǐng)域技術(shù)人員熟悉的“拖放”程序來執(zhí)行。然后電子裝置使用OCR引擎處理選擇的文本區(qū)域115,以產(chǎn)生文本輸出,作為新文本信息125在屏幕100的第二部分120中顯示。因此拖放處理促使該裝置使用OCR對文件圖像110的不正確的已分析過的文本區(qū)域115進(jìn)行重新分析,或者在初始的OCR處理期間文本區(qū)域115被遺漏時可以促使該裝置對文本區(qū)域115進(jìn)行第一次分析。
本發(fā)明可以使用適于減小尺寸的電子裝置的各種類型的OCR處理和系統(tǒng)。如本領(lǐng)域技術(shù)人員已知的,這種OCR系統(tǒng)可以包括矩陣匹配、特征提取和其他類型的OCR技術(shù)。
參考圖5,提供根據(jù)本發(fā)明實施例的電子裝置的顯示屏100的另一個示意圖。這里屏幕100僅包括圖1至圖4所示的屏幕100的第二部分120。因此,在用戶已經(jīng)通過回顧顯示屏100的第一部分105中的文件圖像110檢查了OCR結(jié)果之后,用戶能夠切換到第二部分120的全屏幕形式,只顯示文本信息125。下拉菜單500還可用于增加編輯諸如名片標(biāo)題等標(biāo)準(zhǔn)化文本的便利。下拉菜單500可以包括默認(rèn)字段名稱,例如在文件圖像110時名片時的“名字”、“單位”、“頭銜”、“地址”、“電話號碼”、“傳真號碼”、“電子郵件”和“網(wǎng)址”或其他適于特定類型文件的字段。這種下拉菜單500允許用戶以最少的動作來正確標(biāo)記未曾正確標(biāo)記的文本信息125。
參考圖6,提供根據(jù)本發(fā)明實施例的電子裝置的顯示屏100的另一個示意圖。這里屏幕100又是僅包括圖1至圖4所示的屏幕100的第二部分120。還示出了觸摸屏式小型鍵盤600,它能夠被用于編輯文本信息125,包括在擴展文本框605中的文本,擴展文本框可用于顯示可作為文本信息125顯示的文本的概要版本之外的附加文本。
參考圖7,示出用于在顯示屏100上顯示能夠由電子裝置的用戶編輯的OCR結(jié)果的通用方法700的流程圖。首先,在步驟705,在顯示屏100的第一部分105上顯示包括至少一個文本區(qū)域115的文件圖像110。文件圖像110可以從連接到電子裝置的任何來源(例如攝像機)接收。在步驟710,在顯示屏100的第二部分120上顯示能夠由裝置的用戶編輯的文本信息125。顯示屏100的第一和第二部分105、120同時顯示在屏幕100上,并且從對文件圖像110的至少一個文本區(qū)域115的OCR分析得到文本信息125。
接下來,在步驟715,由電子裝置的用戶選擇文件圖像110的文本區(qū)域115。在步驟720,文件圖像110的選擇文本區(qū)域115被復(fù)制和粘貼到顯示屏100的第一部分105。在步驟725,使用OCR引擎對文件圖像110的選擇文本區(qū)域115進(jìn)行處理以產(chǎn)生文本輸出。最后,在步驟730,文本輸出作為文本信息125在顯示屏100的第二部分120中顯示。
總而言之,本發(fā)明是用于在電子裝置的顯示屏100上以允許電子裝置的用戶方便和快捷地編輯結(jié)果的方式來顯示OCR結(jié)果的方法和系統(tǒng)。由于文件圖像110在編輯過程中再現(xiàn),因此不需要用戶使用原始硬拷貝文件,例如名片。實際上,可以對照文件圖像110的文本區(qū)域115來容易地檢查OCR處理的結(jié)果。而且,可以在屏幕100的第一和第二部分105、120中同時顯示的文件圖像110和文本信息125之間使用方便的拖放程序操作來對從OCR處理得到的文本信息125進(jìn)行校正。包括在本發(fā)明的一些實施例中的其他特征允許文件圖像110相對于顯示屏100移動,以便能夠在小屏幕100上分別觀看文件的多個片段,并且還包括下拉菜單500以簡化編輯過程。
上面的詳細(xì)描述僅提供了示范實施例,并且不是為了限制本發(fā)明的范圍、應(yīng)用或配置。相反,示范實施例的詳細(xì)描述為本領(lǐng)域技術(shù)人員提供了用于實施本發(fā)明示范實施例的開放說明。應(yīng)該理解,在元件和步驟的功能和配置方面可以作出各種改變,而不脫離在所附的權(quán)利要求中提出的本發(fā)明的要旨和范圍。
權(quán)利要求
1.一種用于在顯示屏上顯示能夠由電子裝置的用戶編輯的光學(xué)字符識別(OCR)結(jié)果的方法,該方法包括以下步驟在顯示屏的第一部分上顯示包括至少一個文本區(qū)域的文件圖像;以及在顯示屏的第二部分上顯示能夠由所述裝置的用戶編輯的文本信息,其中,在屏幕的第一部分上的文件圖像和在屏幕的第二部分上的文本信息同時顯示,并且從對所述文件圖像的至少一個文本區(qū)域的OCR分析得到所述文本信息。
2.如權(quán)利要求1所述的方法,進(jìn)一步包括以下步驟在顯示所述文件圖像和文本信息之后選擇所述文件圖像的文本區(qū)域;復(fù)制所述文件圖像的選擇文本區(qū)域并將它粘貼到顯示屏的第一部分;使用OCR引擎處理所述文件圖像的選擇文本區(qū)域以產(chǎn)生編輯的文本輸出;在顯示屏的第一部分中顯示所述編輯的文本輸出。
3.如權(quán)利要求1所述的方法,進(jìn)一步包括隨后的步驟使用OCR引擎在顯示屏的第二部分中處理選擇的文本區(qū)域,以產(chǎn)生編輯的文本輸出,然后在顯示屏的第一部分中顯示該編輯的文本輸出。
4.如權(quán)利要求1所述的方法,其中,通過OCR分析已經(jīng)識別的文件圖像的文本區(qū)域被在所述文件圖像上的可見標(biāo)記指示。
5.如權(quán)利要求4所述的方法,其中,所述可見標(biāo)記是從以下組中選擇的線、著重點、文本區(qū)域的顏色改變。
6.如權(quán)利要求1所述的方法,其中,所述文件圖像表示名片,并且顯示屏的第二部分包括能夠由所述裝置的用戶選擇和改變的默認(rèn)字段名字。
7.如權(quán)利要求6所述的方法,其中,所述默認(rèn)字段名字中的至少一些是從以下組中選擇的“名字”、“單位”、“頭銜”、“地址”、“電話號碼”、“傳真號碼”、“電子郵件”和“網(wǎng)址”。
8.如權(quán)利要求1所述的方法,其中,所述文件圖像表示一個文件的片段,并且所述圖像相對于顯示屏是可移動的,以使用戶能夠觀看表示文件的其他片段的其他圖像。
9.如權(quán)利要求2所述的方法,其中,所述復(fù)制文件圖像的選擇文本區(qū)域并將它粘貼到顯示屏的第一部分的步驟使用“拖放”程序來執(zhí)行。
10.一種用于顯示能夠由用戶編輯的光學(xué)字符識別(OCR)結(jié)果的系統(tǒng),其包括電子裝置的顯示屏;在顯示屏的第一部分顯示的包括至少一個文本區(qū)域的文件圖像;和在顯示屏的第二部分上與顯示屏的第一部分上的文件圖像的顯示同時顯示的、能夠由所述裝置的用戶編輯的文本信息,其中,所述文本信息從對所述文件圖像的至少一個文本區(qū)域的OCR分析得到。
11.如權(quán)利要求10所述的系統(tǒng),其中,所述電子裝置從包括以下組中選擇移動電話、個人數(shù)字助理、數(shù)碼相機和膝上型電腦。
12.如權(quán)利要求10所述的系統(tǒng),其中,通過OCR分析已經(jīng)識別的文件圖像的文本區(qū)域被在所述文件圖像上的可見標(biāo)記指示。
13.如權(quán)利要求12所述的系統(tǒng),其中,所述可見標(biāo)記是從以下組中選擇的線、著重點、文本區(qū)域的顏色改變。
14.如權(quán)利要求10所述的系統(tǒng),其中,所述文件圖像表示名片,并且顯示屏的第二部分包括能夠由所述裝置的用戶選擇和改變的默認(rèn)字段名字。
15.如權(quán)利要求14所述的方法,其中,所述默認(rèn)字段名字中的至少一些是從以下組中選擇的“名字”、“單位”、“頭銜”、“地址”、“電話號碼”、“傳真號碼”、“電子郵件”和“網(wǎng)址”。
16.如權(quán)利要求10所述的方法,其中,所述文件圖像表示一個文件的片段,并且所述圖像相對于顯示屏是可移動的,以使用戶能夠觀看表示文件的其他片段的其他圖像。
全文摘要
用于在顯示屏(100)上顯示文件圖像(110)和光學(xué)字符識別(OCR)結(jié)果的方法和系統(tǒng)對于編輯OCR結(jié)果是有用的。該方法包括在顯示屏(100)的第一部分(105)顯示包括指示一個文本區(qū)域(115)的文件圖像(110)。然后在顯示屏(100)的第二部分(120)顯示能夠由裝置的用戶編輯的文本信息(125)。屏幕(100)的第一部分(105)上的文件圖像(110)和屏幕(100)的第二部分(120)上的文本信息(125)同時顯示,并且文本信息(125)從對文件圖像(110)的至少一個文本區(qū)域(115)的OCR分析得到。
文檔編號G06K9/00GK1848109SQ20051006498
公開日2006年10月18日 申請日期2005年4月13日 優(yōu)先權(quán)日2005年4月13日
發(fā)明者鎮(zhèn)立新, 羅希平 申請人:摩托羅拉公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1