專(zhuān)利名稱(chēng):基于網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及基于網(wǎng)絡(luò)服務(wù)應(yīng)用(web service application)的光學(xué)字符識(shí)別(OCR,optical character recognition)系統(tǒng)。更具體地說(shuō),本發(fā)明涉及一種基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法和光學(xué)字符識(shí)別系統(tǒng),其中用戶(hù)能夠控制整個(gè)識(shí)別處理流程,并且效率得到提高。
背景技術(shù):
OCR是一種識(shí)別手寫(xiě)字符或掃描字符的公知技術(shù)。隨著近年來(lái)包括因特網(wǎng)和內(nèi)部網(wǎng)等的飛速發(fā)展,不需要各個(gè)用戶(hù)配備單獨(dú)的OCR裝置的遠(yuǎn)程O(píng)CR系統(tǒng)已經(jīng)得到了快速發(fā)展和大范圍的普及。
但是,大多數(shù)現(xiàn)存的遠(yuǎn)程O(píng)CR系統(tǒng)都以非常簡(jiǎn)單的方式運(yùn)行,僅僅包括上載(用于進(jìn)行OCR的圖像文件)和下載(識(shí)別結(jié)果)。用戶(hù)不能控制識(shí)別處理流程。例如,用戶(hù)無(wú)法選擇需要識(shí)別的圖像區(qū)域,用戶(hù)不能使用用于人工校對(duì)的識(shí)別過(guò)程中生成的候選字符。
除了上述OCR功能,還應(yīng)該考慮OCR系統(tǒng)的效率。在傳統(tǒng)方式中,原始圖像文件的數(shù)據(jù)必須與其它的從OCR操作中收到的數(shù)據(jù)一起傳輸。相應(yīng)地,所采取的操作越多,則需要的傳輸越頻繁。由于服務(wù)器硬件和網(wǎng)絡(luò)帶寬的限制,不可避免地使整個(gè)系統(tǒng)的效率低下。
發(fā)明內(nèi)容
因此,本發(fā)明的目的是為了解決上述問(wèn)題,提供一種基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法和光學(xué)字符識(shí)別系統(tǒng),其中用戶(hù)能夠控制整個(gè)識(shí)別處理流程,并且效率得到提高。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供一種基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,所述方法包括步驟a)使用網(wǎng)絡(luò)瀏覽器將原始圖像的圖像文件上載到網(wǎng)絡(luò)服務(wù)器;b)存儲(chǔ)所述上載的圖像文件;c)通過(guò)網(wǎng)絡(luò)服務(wù)應(yīng)用轉(zhuǎn)換所述上載的圖像文件并保存所轉(zhuǎn)換的圖像文件;d)圖像小程序通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用,識(shí)別選擇的需要識(shí)別的圖像區(qū)域;以及e)返回所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供一種基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),所述系統(tǒng)包括網(wǎng)絡(luò)瀏覽器,用于上載原始圖像的圖像文件;網(wǎng)絡(luò)服務(wù)器;網(wǎng)絡(luò)服務(wù)應(yīng)用單元,用于轉(zhuǎn)換所述上載的圖像文件并保存所轉(zhuǎn)換的圖像文件;以及圖像小程序單元,用于通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用單元,以識(shí)別選擇的需要識(shí)別的圖像區(qū)域。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的再一方面,提供一種用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,所述方法包括步驟接收原始圖像的圖像文件;存儲(chǔ)所接收的圖像文件;轉(zhuǎn)換所述圖像文件并保存轉(zhuǎn)換后的圖像文件;將轉(zhuǎn)換后的圖像文件發(fā)送到控制字符識(shí)別處理的OCR結(jié)果接收裝置;從OCR結(jié)果接收裝置接收關(guān)于轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;根據(jù)所接收的指令對(duì)原始圖像執(zhí)行字符識(shí)別處理;以及將執(zhí)行的字符識(shí)別處理的結(jié)果發(fā)送到OCR結(jié)果接收裝置。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的又一方面,提供一種OCR服務(wù)提供裝置,包括圖像處理單元,用于接收和轉(zhuǎn)換需要識(shí)別的原始圖像,并將轉(zhuǎn)換后的圖像文件發(fā)送到OCR結(jié)果接收裝置;以及OCR識(shí)別單元,用于接收關(guān)于轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令,并且執(zhí)行字符識(shí)別處理。所述圖像處理單元包括輸入部件,用于接收原始圖像的圖像文件;存儲(chǔ)器部件,用于存儲(chǔ)所接收的圖像文件;轉(zhuǎn)換部件,用于轉(zhuǎn)換所述圖像文件并保存轉(zhuǎn)換后的圖像文件;和圖像輸出部件,用于將轉(zhuǎn)換后的圖像文件發(fā)送到控制字符識(shí)別處理的OCR結(jié)果接收裝置。所述OCR識(shí)別單元包括指令接收部件,用于從OCR結(jié)果接收裝置接收關(guān)于轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;識(shí)別部件,用于根據(jù)所接收的指令對(duì)原始圖像執(zhí)行字符識(shí)別處理;以及識(shí)別結(jié)果輸出部件,用于將所執(zhí)行的字符識(shí)別處理的結(jié)果發(fā)送到OCR結(jié)果接收裝置。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的再一方面,提供一種用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,所述方法包括步驟從OCR服務(wù)提供裝置接收轉(zhuǎn)換后的圖像文件,所述轉(zhuǎn)換后的圖像文件由OCR服務(wù)提供裝置轉(zhuǎn)換原始圖像的原始圖像文件生成;根據(jù)用戶(hù)指令發(fā)送關(guān)于所接收的轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;以及從OCR服務(wù)提供裝置接收對(duì)原始圖像進(jìn)行的字符識(shí)別處理的結(jié)果,根據(jù)OCR結(jié)果接收裝置所發(fā)送的控制指令OCR服務(wù)提供裝置進(jìn)行所述字符識(shí)別處理。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供一種OCR結(jié)果接收裝置,包括圖像接收單元,用于從OCR服務(wù)提供裝置接收轉(zhuǎn)換后的圖像文件,所述轉(zhuǎn)換后的圖像文件由OCR服務(wù)提供裝置轉(zhuǎn)換原始圖像的原始圖像文件生成;指令發(fā)送單元,用于根據(jù)用戶(hù)指令發(fā)送關(guān)于所接收的轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;以及識(shí)別結(jié)果接收單元,用于從OCR服務(wù)提供裝置接收對(duì)原始圖像進(jìn)行的字符識(shí)別處理的結(jié)果,根據(jù)所發(fā)送的控制指令OCR服務(wù)提供裝置進(jìn)行所述字符識(shí)別處理。
使用根據(jù)本發(fā)明的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法和光學(xué)字符識(shí)別系統(tǒng),用戶(hù)能夠控制整個(gè)識(shí)別處理流程,并且OCR的效率得到提高。
在知曉了下面對(duì)優(yōu)選實(shí)施例的詳細(xì)描述之后,本發(fā)明的其它目的、特征和優(yōu)點(diǎn)將更加清楚。構(gòu)成本說(shuō)明書(shū)一部分的附圖示出本發(fā)明的實(shí)施例,并與下面的描述一起用于解釋說(shuō)明本發(fā)明的原理。其中圖1示出用于實(shí)現(xiàn)本發(fā)明的光學(xué)字符識(shí)別方法的基本系統(tǒng)結(jié)構(gòu);
圖2示出根據(jù)本發(fā)明的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法的流程圖;圖3示出根據(jù)本發(fā)明的光學(xué)字符識(shí)別方法的實(shí)施示例的網(wǎng)頁(yè);圖4示出使用本發(fā)明的光學(xué)字符識(shí)別方法時(shí)、圖3所示的網(wǎng)頁(yè)的識(shí)別結(jié)果;圖5示出根據(jù)本發(fā)明的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng)的方框圖;以及圖6示出根據(jù)本發(fā)明的服務(wù)器一側(cè)(OCR服務(wù)提供裝置602)和客戶(hù)端一側(cè)(OCR結(jié)果接收裝置601)各自的詳細(xì)結(jié)構(gòu)。
具體實(shí)施例方式
下面將結(jié)合附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。
如圖1所示,根據(jù)本發(fā)明的光學(xué)字符識(shí)別(OCR)系統(tǒng)基于B/S架構(gòu)。B/S架構(gòu)是根據(jù)文本、表、線、畫(huà)面等的對(duì)象屬性將輸入圖像分割成多個(gè)區(qū)域,以及選擇其中需要進(jìn)行識(shí)別的區(qū)域進(jìn)行OCR處理的過(guò)程。OCR功能由網(wǎng)絡(luò)服務(wù)器102和OCR網(wǎng)絡(luò)服務(wù)應(yīng)用103在服務(wù)器一側(cè)完成,用戶(hù)使用網(wǎng)絡(luò)瀏覽器101進(jìn)行OCR操作。
用戶(hù)使用網(wǎng)絡(luò)瀏覽器101進(jìn)行OCR操作。用戶(hù)能夠在網(wǎng)絡(luò)瀏覽器中觀看圖像、旋轉(zhuǎn)圖像、進(jìn)行圖像色反轉(zhuǎn)、以及人工或自動(dòng)地進(jìn)行圖像區(qū)域選擇。并且,對(duì)選擇的圖像區(qū)域進(jìn)行識(shí)別。
根據(jù)本發(fā)明的OCR系統(tǒng)將OCR功能和用戶(hù)界面(interface)分成兩部分。OCR功能由網(wǎng)絡(luò)服務(wù)應(yīng)用實(shí)現(xiàn),其公用界面能夠被其它系統(tǒng)調(diào)用。用戶(hù)界面通過(guò)網(wǎng)頁(yè)實(shí)現(xiàn)。兩個(gè)Java小程序用于主用戶(hù)界面中。這兩個(gè)小程序執(zhí)行大多數(shù)的人工操作。一個(gè)小程序(ImageApplet,圖像小程序)用于圖像顯示和處理,另一個(gè)小程序(ProofApplet,校對(duì)小程序)用于校對(duì)。這兩個(gè)小程序與網(wǎng)絡(luò)服務(wù)器進(jìn)行通信,網(wǎng)絡(luò)服務(wù)器反過(guò)來(lái)調(diào)用OCR網(wǎng)絡(luò)服務(wù)應(yīng)用進(jìn)行OCR處理。
除了OCR功能之外,為了提高OCR系統(tǒng)的效率,而不是按照傳統(tǒng)的方式那樣將圖像文件的數(shù)據(jù)與其它從OCR操作接收的數(shù)據(jù)一起發(fā)送,本發(fā)明采用了三種關(guān)鍵的處理方法來(lái)將網(wǎng)絡(luò)上的數(shù)據(jù)傳輸減少到最少。
第一,在OCR操作期間,為了方便用戶(hù),上載到服務(wù)器的圖像應(yīng)該在客戶(hù)端顯示。將保存在服務(wù)器上的圖像數(shù)據(jù)轉(zhuǎn)換成GIF格式并返回到客戶(hù)端用于顯示,作為原始圖像文件的替代。當(dāng)圖像文件數(shù)據(jù)從其它圖像格式轉(zhuǎn)換為GIF格式時(shí),其文件尺寸將減小為原始圖像格式(通常為T(mén)IFF、BMP、JPG等)的四分之一或更小。
第二,對(duì)于一些圖像處理,比如圖像旋轉(zhuǎn)和反轉(zhuǎn),使用圖像小程序來(lái)完成該任務(wù),而用不到OCR網(wǎng)絡(luò)服務(wù)應(yīng)用。由此,可以避免圖像數(shù)據(jù)的傳輸。另外,僅將少許操作信息記錄下來(lái)以備將來(lái)使用。
第三,對(duì)于塊選擇和塊識(shí)別,數(shù)據(jù)傳輸簡(jiǎn)化為僅傳輸從塊選擇或塊識(shí)別中獲得的數(shù)據(jù),并且在客戶(hù)端使用預(yù)先傳輸?shù)腉IF圖像替換原始圖像文件。而且,對(duì)于原始圖像文件不再需要進(jìn)行網(wǎng)絡(luò)傳輸。
下面將描述根據(jù)本發(fā)明的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法的詳細(xì)處理過(guò)程,該方法的完整處理流程圖在圖2中示出。
如圖2所示,根據(jù)在識(shí)別過(guò)程中執(zhí)行的事件處理步驟劃分為5個(gè)階段,即,打開(kāi)文件、圖像處理、塊選擇、塊識(shí)別、以及文本校對(duì)和保存結(jié)果。下面將參照?qǐng)D2所示的流程圖詳細(xì)描述這5個(gè)階段。
1.打開(kāi)文件首先,在步驟SP101,用戶(hù)使用網(wǎng)絡(luò)瀏覽器將圖像文件上載到網(wǎng)絡(luò)服務(wù)器,與此同時(shí),網(wǎng)絡(luò)服務(wù)器調(diào)用OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元并將該圖像文件發(fā)送到OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元,OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元保存該圖像文件。
接著,在步驟SP102,OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元將所述上載的圖像文件轉(zhuǎn)換成GIF格式的文件。
之后,圖像小程序單元通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元,以得到GIF格式的原始圖像的黑白(B/W)圖像拷貝。
2.圖像處理在打開(kāi)文件并由圖像小程序單元得到GIF格式的圖像文件之后,開(kāi)始圖像處理過(guò)程。
在步驟SP201,用戶(hù)可以使用圖像小程序單元進(jìn)行圖像處理,比如圖像旋轉(zhuǎn)、圖像色反轉(zhuǎn)等。在這些圖像處理之后,關(guān)于相關(guān)圖像處理的參數(shù)通過(guò)網(wǎng)絡(luò)服務(wù)器發(fā)送到OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元。
然后,在步驟SP202,如果需要進(jìn)行歪斜校正,則調(diào)用OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元對(duì)其所保存的圖像數(shù)據(jù)進(jìn)行自動(dòng)歪斜校正。在這種情況下,由圖像小程序單元發(fā)送給OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元的是有關(guān)如何校正歪斜圖像的指令或者關(guān)于歪斜圖像的參數(shù)。
圖像小程序單元也可以將關(guān)于需要識(shí)別的圖像區(qū)域的編輯信息,比如需要識(shí)別的圖像是用中文還是英文書(shū)寫(xiě)的、需要識(shí)別的圖像是用Excel程序編輯的表格等等,通過(guò)網(wǎng)絡(luò)服務(wù)器發(fā)送給OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元。
之后,在步驟SP203,將更新后的圖像的GIF格式的黑/白圖像拷貝返回給圖像小程序單元用于顯示。
3.塊選擇在完成圖像處理以及GIF格式的更新后的圖像已經(jīng)顯示在圖像小程序單元之后,用戶(hù)可以選擇需要由OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元識(shí)別的圖像區(qū)域。
使用圖像小程序單元,用戶(hù)可以如圖2的步驟SP301中所示人工進(jìn)行圖像區(qū)域選擇,也可以如步驟SP302所示進(jìn)行自動(dòng)選擇。
如果需要識(shí)別的圖像區(qū)域是在步驟SP302中自動(dòng)選擇的,則OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元在步驟SP303中將塊信息數(shù)據(jù)返回圖像小程序單元。
4.塊識(shí)別在上面的處理中確定需要識(shí)別的圖像區(qū)域之后,在步驟SP401,用戶(hù)可以使用圖像小程序單元通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元,以對(duì)所選擇的需要識(shí)別的圖像區(qū)域進(jìn)行識(shí)別。
在步驟SP402,OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元返回識(shí)別信息數(shù)據(jù)給校對(duì)小程序單元。應(yīng)該指出的是,返回給校對(duì)小程序單元的是所選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù),而不是識(shí)別的圖像本身。
之后,在步驟SP403中,校對(duì)小程序單元解析所返回的數(shù)據(jù),并且顯示解析后的文本。
5.文本校對(duì)和保存結(jié)果在解析后的文本顯示在校對(duì)小程序單元上之后,在步驟SP501中,用戶(hù)可以使用校對(duì)小程序單元進(jìn)行校對(duì)??梢赃x擇候選字符替換舊字符。
然后,在步驟SP502中,用戶(hù)調(diào)用使用校對(duì)小程序單元通過(guò)網(wǎng)絡(luò)服務(wù)器OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元以生成結(jié)果文件。在步驟SP503,OCR網(wǎng)絡(luò)服務(wù)應(yīng)用單元將所述結(jié)果文件保存成格式文件(HTML或RTF格式文件)。
最后,在步驟SP504中,將HTML格式或RTF格式的文件發(fā)回,并且結(jié)束整個(gè)識(shí)別處理。
識(shí)別結(jié)果的一個(gè)示例在圖3和圖4中示出。
圖3示出根據(jù)本發(fā)明的光學(xué)字符識(shí)別方法的實(shí)施示例的網(wǎng)頁(yè)。如圖3所示,由圖像小程序單元執(zhí)行的處理顯示在屏幕的左側(cè)。需要識(shí)別的圖像顯示在屏幕的中間,其中頂部示出其內(nèi)容是用中文書(shū)寫(xiě)的圖像、中部示出其內(nèi)容是用英文書(shū)寫(xiě)的圖像和不需要識(shí)別的畫(huà)面圖像、以及底部示出其內(nèi)容是用Excel程序編輯的圖像。關(guān)于上述表明的圖像的識(shí)別結(jié)果顯示在屏幕的右側(cè)。
圖4示出使用本發(fā)明的光學(xué)字符識(shí)別方法時(shí)、圖3所示的網(wǎng)頁(yè)的最后識(shí)別結(jié)果。如圖4所示,識(shí)別結(jié)果以HTML格式或RTF格式顯示,并且在圖3所示的識(shí)別數(shù)據(jù)中存在的錯(cuò)誤已經(jīng)由用戶(hù)使用校對(duì)小程序單元進(jìn)行了校對(duì)。
上面描述的光學(xué)字符識(shí)別方法是在根據(jù)本發(fā)明的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng)中實(shí)現(xiàn)的。圖5示出該光學(xué)字符識(shí)別系統(tǒng)的方框圖。
如圖5所示,根據(jù)本發(fā)明的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng)包括網(wǎng)絡(luò)瀏覽器501,用于上載原始圖像的圖像文件;網(wǎng)絡(luò)服務(wù)器502;網(wǎng)絡(luò)服務(wù)應(yīng)用單元503,用于轉(zhuǎn)換所述上載的圖像文件并保存所轉(zhuǎn)換的圖像文件;圖像小程序單元504,用于通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用單元,以識(shí)別選擇的需要識(shí)別的圖像區(qū)域;以及校對(duì)小程序單元505,用于接收所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)。
網(wǎng)絡(luò)服務(wù)應(yīng)用單元503將上載的圖像文件轉(zhuǎn)換成GIF格式的文件,并且圖像小程序單元504通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用單元來(lái)獲取GIF格式的原始圖像的黑/白圖像拷貝。
所述選擇的需要識(shí)別的圖像區(qū)域通過(guò)使用圖像小程序單元504人工或自動(dòng)選擇,并且網(wǎng)絡(luò)服務(wù)應(yīng)用單元503將所述選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)返回圖像小程序單元504。
在選擇需要識(shí)別的圖像區(qū)域之前,圖像小程序單元504事先處理所獲取的GIF格式的原始圖像的黑/白圖像拷貝。由圖像小程序單元504執(zhí)行的所述處理包括圖像旋轉(zhuǎn)和圖像色反轉(zhuǎn)等。圖像小程序單元504通過(guò)網(wǎng)絡(luò)服務(wù)器將關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息發(fā)送到網(wǎng)絡(luò)服務(wù)應(yīng)用單元503。
如果需要歪斜校正,則調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用單元503對(duì)其所保存的圖像數(shù)據(jù)執(zhí)行自動(dòng)歪斜校正,然后將更新后的GIF格式的黑/白圖像拷貝返回圖像小程序單元504用于顯示。圖像小程序單元504通過(guò)網(wǎng)絡(luò)服務(wù)器502將關(guān)于如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)發(fā)送給網(wǎng)絡(luò)服務(wù)應(yīng)用單元503。
所接收的所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)由校對(duì)小程序單元505解析并顯示所解析的文本。校對(duì)小程序單元505還將舊的不適當(dāng)?shù)淖址闷溥m當(dāng)?shù)暮蜻x字符替換。
校對(duì)小程序單元505通過(guò)網(wǎng)絡(luò)服務(wù)器502調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用單元503,以將舊的不適當(dāng)?shù)淖址延闷溥m當(dāng)?shù)暮蜻x字符替換的識(shí)別數(shù)據(jù)保存為格式文件。該格式文件是HTML格式文件或RTF格式文件。
如上所述,根據(jù)本發(fā)明的光學(xué)字符識(shí)別系統(tǒng)基于B/S架構(gòu)。也就是說(shuō),OCR功能在服務(wù)器一側(cè)完成,而OCR操作則由用戶(hù)在客戶(hù)端一側(cè)進(jìn)行處理。圖6示出根據(jù)本發(fā)明的服務(wù)器一側(cè)(OCR服務(wù)提供裝置602)和客戶(hù)端一側(cè)(OCR結(jié)果接收裝置601)各自的詳細(xì)結(jié)構(gòu)。
如圖6所示,OCR服務(wù)提供裝置602包括圖像處理單元6021,用于接收和轉(zhuǎn)換需要識(shí)別的原始圖像,并將轉(zhuǎn)換后的圖像文件發(fā)送到OCR結(jié)果接收裝置601;以及OCR識(shí)別單元6022,用于接收關(guān)于轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令,并且執(zhí)行字符識(shí)別處理。
圖像處理單元6021包括輸入部件701,用于接收原始圖像的圖像文件;存儲(chǔ)器部件702,用于存儲(chǔ)所接收的圖像文件;轉(zhuǎn)換部件703,用于轉(zhuǎn)換所述圖像文件并保存轉(zhuǎn)換后的圖像文件;和圖像輸出部件704,用于將轉(zhuǎn)換后的圖像文件發(fā)送到控制字符識(shí)別處理的OCR結(jié)果接收裝置601。
OCR識(shí)別單元6022包括指令接收部件801,用于從OCR結(jié)果接收裝置601接收關(guān)于轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;識(shí)別部件802,用于根據(jù)所接收的指令對(duì)原始圖像執(zhí)行字符識(shí)別處理;以及識(shí)別結(jié)果輸出部件803,用于將所執(zhí)行的字符識(shí)別處理的結(jié)果發(fā)送到OCR結(jié)果接收裝置601。
在根據(jù)本發(fā)明的OCR服務(wù)提供裝置的一個(gè)實(shí)施例中,將接收的圖像文件轉(zhuǎn)換成GIF格式的文件,并且將GIF格式的原始圖像的黑/白圖像拷貝發(fā)送到OCR結(jié)果接收裝置601。相應(yīng)地,需要識(shí)別的圖像區(qū)域根據(jù)GIF格式的原始圖像的黑/白圖像拷貝在OCR結(jié)果接收裝置601上人工或自動(dòng)選擇,并且OCR服務(wù)提供裝置602接收所選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)。
優(yōu)選地,GIF格式的原始圖像的黑/白圖像拷貝由OCR結(jié)果接收裝置601處理和編輯,并且OCR服務(wù)提供裝置602接收關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息。
如果需要歪斜校正,則OCR服務(wù)提供裝置602對(duì)其所保存的圖像數(shù)據(jù)執(zhí)行自動(dòng)歪斜校正,并將更新后圖像的GIF格式的黑/白圖像拷貝發(fā)送給OCR結(jié)果接收裝置601。在這種情況下,OCR服務(wù)提供裝置602還從OCR結(jié)果接收裝置601接收如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)。
在根據(jù)本發(fā)明的OCR服務(wù)提供裝置的另一實(shí)施例中,還包括識(shí)別結(jié)果轉(zhuǎn)換單元6023,用于從OCR結(jié)果接收裝置601接收用于替換舊的不適當(dāng)?shù)淖址倪m當(dāng)?shù)暮蜻x字符。在這種情況下,識(shí)別結(jié)果轉(zhuǎn)換單元6023還將舊的不適當(dāng)?shù)淖址呀?jīng)用其適當(dāng)?shù)暮蜻x字符替換的識(shí)別數(shù)據(jù)轉(zhuǎn)換為格式文件。所述格式文件最好是HTML格式文件或RTF格式文件。
下面將結(jié)合圖6的左半部分描述根據(jù)本發(fā)明的客戶(hù)端一側(cè)的OCR結(jié)果接收裝置601。
如圖6中所示,OCR結(jié)果接收裝置601包括圖像發(fā)送單元6011,用于將原始圖像的原始圖像文件發(fā)送給OCR服務(wù)提供裝置602;圖像接收單元6012,用于從OCR服務(wù)提供裝置602接收轉(zhuǎn)換后的圖像文件,所述轉(zhuǎn)換后的圖像文件由OCR服務(wù)提供裝置602轉(zhuǎn)換原始圖像的原始圖像文件生成;指令發(fā)送單元6013,用于根據(jù)用戶(hù)指令發(fā)送關(guān)于所接收的轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;以及識(shí)別結(jié)果接收單元6014,用于從OCR服務(wù)提供裝置602接收對(duì)原始圖像進(jìn)行的字符識(shí)別處理的結(jié)果,根據(jù)所發(fā)送的控制指令OCR服務(wù)提供裝置602進(jìn)行所述字符識(shí)別處理。
在根據(jù)本發(fā)明的OCR結(jié)果接收裝置601的一個(gè)實(shí)施例中,轉(zhuǎn)換后的圖像文件是GIF格式的文件,并且從OCR服務(wù)提供裝置602接收原始圖像的黑/白圖像拷貝。
在根據(jù)本發(fā)明的OCR結(jié)果接收裝置601的另一實(shí)施例中,OCR結(jié)果接收裝置601還包括圖像處理單元6015,用于選擇原始圖像的需要識(shí)別的圖像區(qū)域,并且指令發(fā)送單元6013將所選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)返回給OCR服務(wù)提供裝置602。
最好,在選擇所述需要識(shí)別的圖像區(qū)域之前,圖像處理單元6015對(duì)GIF格式的原始圖像的黑/白圖像拷貝事先進(jìn)行處理。該處理包括圖像旋轉(zhuǎn)和圖像色反轉(zhuǎn)。在圖像處理單元6015執(zhí)行的處理完成之后,指令發(fā)送單元6013將關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息發(fā)送給OCR服務(wù)提供裝置602。
此外,如需要歪斜校正,指令發(fā)送單元6013還將如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)發(fā)送給OCR服務(wù)提供裝置602。
在根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,OCR結(jié)果接收裝置601還包括編輯單元6016,用于對(duì)接收的所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)進(jìn)行解析,并且在網(wǎng)絡(luò)瀏覽器單元6018上顯示所解析的文本。編輯單元6016將舊的不適當(dāng)?shù)淖址闷溥m當(dāng)?shù)暮蜻x字符替換。在編輯單元6016執(zhí)行的編輯完成之后,編輯結(jié)果由編輯結(jié)果發(fā)送單元6017發(fā)送給OCR服務(wù)提供裝置602。
上面結(jié)合附圖6描述了根據(jù)本發(fā)明的服務(wù)器一側(cè)的OCR服務(wù)提供裝置602和客戶(hù)端一側(cè)的OCR結(jié)果接收裝置601的結(jié)構(gòu)。相應(yīng)地,根據(jù)本發(fā)明的用于控制OCR結(jié)果接收裝置601的光學(xué)字符識(shí)別方法和用于控制OCR服務(wù)提供裝置602的光學(xué)字符識(shí)別方法可以分別在服務(wù)器一側(cè)和客戶(hù)端一側(cè)實(shí)現(xiàn)。
下面,將參照?qǐng)D6分別描述根據(jù)本發(fā)明的用于控制OCR服務(wù)提供裝置602的光學(xué)字符識(shí)別方法和用于控制OCR結(jié)果接收裝置601的光學(xué)字符識(shí)別方法。
根據(jù)本發(fā)明的用于控制OCR服務(wù)提供裝置602的光學(xué)字符識(shí)別方法包括步驟輸入部件701接收原始圖像的圖像文件;存儲(chǔ)器部件702存儲(chǔ)所接收的圖像文件;轉(zhuǎn)換部件703轉(zhuǎn)換所述圖像文件并保存轉(zhuǎn)換后的圖像文件;圖像輸出部件704將轉(zhuǎn)換后的圖像文件發(fā)送到控制字符識(shí)別處理的OCR結(jié)果接收裝置;指令接收部件801從OCR結(jié)果接收裝置接收關(guān)于轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;識(shí)別部件802根據(jù)所接收的指令對(duì)原始圖像執(zhí)行字符識(shí)別處理;以及識(shí)別結(jié)果輸出部件803將執(zhí)行的字符識(shí)別處理的結(jié)果發(fā)送到OCR結(jié)果接收裝置。
在根據(jù)本發(fā)明的一個(gè)實(shí)施例中,將接收的圖像文件轉(zhuǎn)換成GIF格式的文件,并且將GIF格式的原始圖像的黑/白圖像拷貝發(fā)送到OCR結(jié)果接收裝置601。需要識(shí)別的圖像區(qū)域根據(jù)GIF格式的原始圖像的黑/白圖像拷貝在OCR結(jié)果接收裝置601上人工或自動(dòng)選擇,并且OCR服務(wù)提供裝置602接收所選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)。
在根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,GIF格式的原始圖像的黑/白圖像拷貝由OCR結(jié)果接收裝置601處理和編輯,并且OCR服務(wù)提供裝置602接收關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息。
如果需要歪斜校正,則OCR服務(wù)提供裝置602對(duì)其所保存的圖像數(shù)據(jù)執(zhí)行自動(dòng)歪斜校正,并將更新后圖像的GIF格式的黑/白圖像拷貝發(fā)送給OCR結(jié)果接收裝置601。然后,OCR服務(wù)提供裝置602從OCR結(jié)果接收裝置601接收如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)。
在根據(jù)本發(fā)明的另一實(shí)施例中,OCR服務(wù)提供裝置602還從OCR結(jié)果接收裝置601接收用于替換舊的不適當(dāng)?shù)淖址倪m當(dāng)?shù)暮蜻x字符,并且將舊的不適當(dāng)?shù)淖址呀?jīng)用其適當(dāng)?shù)暮蜻x字符替換的識(shí)別數(shù)據(jù)轉(zhuǎn)換為格式文件。所述格式文件最好是HTML格式文件或RTF格式文件。
下面將結(jié)合圖6詳細(xì)描述根據(jù)本發(fā)明的用于控制OCR結(jié)果接收裝置601的光學(xué)字符識(shí)別方法。
如圖6所示,根據(jù)本發(fā)明的用于控制OCR結(jié)果接收裝置601的光學(xué)字符識(shí)別方法包括步驟圖像接收單元6012從OCR服務(wù)提供裝置602接收轉(zhuǎn)換后的圖像文件,所述轉(zhuǎn)換后的圖像文件由OCR服務(wù)提供裝置602轉(zhuǎn)換原始圖像的原始圖像文件生成;指令發(fā)送單元6013根據(jù)用戶(hù)指令發(fā)送關(guān)于所接收的轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;以及識(shí)別結(jié)果接收單元6014從OCR服務(wù)提供裝置602接收對(duì)原始圖像進(jìn)行的字符識(shí)別處理的結(jié)果,根據(jù)OCR結(jié)果接收裝置601所發(fā)送的控制指令OCR服務(wù)提供裝置602進(jìn)行所述字符識(shí)別處理。
在本發(fā)明的一個(gè)實(shí)施例中,所述原始圖像的原始圖像文件由OCR結(jié)果接收裝置601的圖像發(fā)送單元6011發(fā)送給OCR服務(wù)提供裝置602或者從諸如因特網(wǎng)和內(nèi)部網(wǎng)的網(wǎng)絡(luò)上下載。
最好,轉(zhuǎn)換后的圖像文件是GIF格式的文件,并且從OCR服務(wù)提供裝置602接收原始圖像的黑/白圖像拷貝。
在根據(jù)本發(fā)明的用于控制OCR結(jié)果接收裝置601的光學(xué)字符識(shí)別方法的另一實(shí)施例中,還包括步驟人工或自動(dòng)選擇原始圖像的需要識(shí)別的圖像區(qū)域,并且由圖像處理單元6015將所選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)返回給OCR服務(wù)提供裝置602。
最好,在選擇所述需要識(shí)別的圖像區(qū)域之前,對(duì)GIF格式的原始圖像的黑/白圖像拷貝事先進(jìn)行處理。該處理包括圖像旋轉(zhuǎn)和圖像色反轉(zhuǎn)。然后,將關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息發(fā)送給OCR服務(wù)提供裝置602。
如果需要歪斜校正,則根據(jù)本發(fā)明的用于控制OCR結(jié)果接收裝置601的光學(xué)字符識(shí)別方法還包括步驟將如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)發(fā)送給OCR服務(wù)提供裝置。
在本發(fā)明的優(yōu)選實(shí)施例中,對(duì)接收的所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)進(jìn)行解析,并且顯示所解析的文本。將舊的不適當(dāng)?shù)淖址闷溥m當(dāng)?shù)暮蜻x字符替換。然后,將關(guān)于替換的字符的信息發(fā)送給OCR服務(wù)提供裝置602。
同樣應(yīng)當(dāng)指出的是,本發(fā)明包括通過(guò)將實(shí)現(xiàn)前述實(shí)施例功能的軟件程序(與各實(shí)施例中的所示流程圖相對(duì)應(yīng)的程序)直接或遠(yuǎn)程提供給一個(gè)系統(tǒng)或裝置并且由該系統(tǒng)或裝置的計(jì)算機(jī)讀出并執(zhí)行所提供的程序碼來(lái)實(shí)現(xiàn)本發(fā)明的情況。在該情況下,形式并不限于程序,只要可以提供程序功能即可。
因此,安裝在計(jì)算機(jī)中以使用計(jì)算機(jī)實(shí)現(xiàn)本發(fā)明的功能處理的程序碼本身實(shí)現(xiàn)本發(fā)明。也就是,本發(fā)明包括用于實(shí)現(xiàn)本發(fā)明的功能處理的計(jì)算機(jī)程序本身。
在這種情況下,程序的形式不受到特定的限制,并且可以使用目標(biāo)碼、由解釋器執(zhí)行的程序、提供給OS的腳本數(shù)據(jù)等,只要它們具有程序功能即可。
可以使用例如軟盤(pán)、硬盤(pán)、光盤(pán)、磁光盤(pán)、MO、CD-ROM、CD-R、CD-RW、磁帶、非易失性存儲(chǔ)卡、ROM、DVD(DVD-ROM、DVD-R)等作為用于提供程序的記錄介質(zhì)。
作為另一種程序提供方法,可以在客戶(hù)計(jì)算機(jī)上使用瀏覽器建立與因特網(wǎng)上的給定主頁(yè)的連接,并且可以將經(jīng)過(guò)壓縮且包括自動(dòng)安裝功能的本發(fā)明計(jì)算機(jī)程序本身或文件從該主頁(yè)下載到記錄介質(zhì)如硬盤(pán)等,從而提供程序。另外,形成本發(fā)明程序的程序碼可以分成多個(gè)文件,并且可以從不同主頁(yè)下載這些文件。也就是,本發(fā)明還包括使多個(gè)用戶(hù)下載用于使用計(jì)算機(jī)實(shí)現(xiàn)本發(fā)明的功能處理的程序文件的WWW服務(wù)器。
另外,存儲(chǔ)本發(fā)明加密程序的存儲(chǔ)介質(zhì)如CD-ROM等可以交付給用戶(hù),已清除預(yù)定條件的用戶(hù)可以允許通過(guò)因特網(wǎng)從網(wǎng)頁(yè)下載對(duì)程序解密的密鑰信息,并且可以使用該密鑰信息執(zhí)行加密程序以安裝在計(jì)算機(jī)上,從而實(shí)現(xiàn)本發(fā)明。
前述實(shí)施例的功能可以不僅通過(guò)由計(jì)算機(jī)執(zhí)行讀出程序碼而且通過(guò)根據(jù)該程序指令由運(yùn)行在計(jì)算機(jī)上的OS等執(zhí)行的一些或所有實(shí)際處理操作來(lái)實(shí)現(xiàn)。
而且,在從記錄介質(zhì)讀出的程序?qū)懭朐诠δ軘U(kuò)展板或單元的存儲(chǔ)器中之后,前述實(shí)施例的功能可以通過(guò)安置在功能擴(kuò)展板或功能擴(kuò)展單元中的CPU等所執(zhí)行的一些或所有實(shí)際處理來(lái)實(shí)現(xiàn),其中,功能擴(kuò)展板或功能擴(kuò)展單元插入在計(jì)算機(jī)中或者連接到計(jì)算機(jī)。
本發(fā)明的描述是為了示例和描述起見(jiàn)而給出的,而并不是無(wú)遺漏的或者將本發(fā)明限于所公開(kāi)的形式。很多修改和變化對(duì)于本領(lǐng)域的普通技術(shù)人員而言是顯然的。選擇和描述實(shí)施例是為了更好說(shuō)明本發(fā)明的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計(jì)適于特定用途的帶有各種修改的各種實(shí)施例。
權(quán)利要求
1.一種基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,所述方法包括步驟a)使用網(wǎng)絡(luò)瀏覽器將原始圖像的圖像文件上載到網(wǎng)絡(luò)服務(wù)器;b)存儲(chǔ)所述上載的圖像文件;c)通過(guò)網(wǎng)絡(luò)服務(wù)應(yīng)用轉(zhuǎn)換所述上載的圖像文件并保存所轉(zhuǎn)換的圖像文件;d)圖像小程序通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用,識(shí)別選擇的需要識(shí)別的圖像區(qū)域;以及e)返回所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,將上載的圖像文件轉(zhuǎn)換成GIF格式的文件,以及在執(zhí)行步驟d)之前圖像小程序通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用來(lái)獲取GIF格式的原始圖像的黑/白圖像拷貝。
3.根據(jù)權(quán)利要求2所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,所述選擇的需要識(shí)別的圖像區(qū)域通過(guò)使用圖像小程序人工或自動(dòng)選擇,并且網(wǎng)絡(luò)服務(wù)應(yīng)用將所述選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)返回圖像小程序。
4.根據(jù)權(quán)利要求2或3所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,在選擇需要識(shí)別的圖像區(qū)域之前,所獲取的GIF格式的原始圖像的黑/白圖像拷貝由圖像小程序處理。
5.根據(jù)權(quán)利要求4所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,由圖像小程序執(zhí)行的所述處理包括圖像旋轉(zhuǎn)和圖像色反轉(zhuǎn)。
6.根據(jù)權(quán)利要求5所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,圖像小程序通過(guò)網(wǎng)絡(luò)服務(wù)器將關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息發(fā)送到網(wǎng)絡(luò)服務(wù)應(yīng)用。
7.根據(jù)權(quán)利要求6所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,如果需要歪斜校正,則調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用對(duì)其所保存的圖像數(shù)據(jù)執(zhí)行自動(dòng)歪斜校正,然后將更新后的GIF格式的黑/白圖像拷貝返回圖像小程序用于顯示。
8.根據(jù)權(quán)利要求7所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,圖像小程序通過(guò)網(wǎng)絡(luò)服務(wù)器將關(guān)于如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)發(fā)送給網(wǎng)絡(luò)服務(wù)應(yīng)用。
9.根據(jù)權(quán)利要求1至8任一所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)返回給校對(duì)小程序,并解析所返回的所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù),將所解析的文本顯示在校對(duì)小程序上。
10.根據(jù)權(quán)利要求9所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,將舊的不適當(dāng)?shù)淖址闷溥m當(dāng)?shù)暮蜻x字符替換。
11.根據(jù)權(quán)利要求10所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,還包括步驟校對(duì)小程序通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用,以便將舊的不適當(dāng)?shù)淖址呀?jīng)用其適當(dāng)?shù)暮蜻x字符替換的識(shí)別數(shù)據(jù)保存為格式文件。
12.根據(jù)權(quán)利要求11所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法,其特征在于,所述格式文件是HTML格式文件或RTF格式文件。
13.一種基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),所述系統(tǒng)包括網(wǎng)絡(luò)瀏覽器,用于上載原始圖像的圖像文件;網(wǎng)絡(luò)服務(wù)器;網(wǎng)絡(luò)服務(wù)應(yīng)用單元,用于轉(zhuǎn)換所述上載的圖像文件并保存所轉(zhuǎn)換的圖像文件;以及圖像小程序單元,用于通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用單元,以識(shí)別選擇的需要識(shí)別的圖像區(qū)域。
14.根據(jù)權(quán)利要求13所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,網(wǎng)絡(luò)服務(wù)應(yīng)用單元將上載的圖像文件轉(zhuǎn)換成GIF格式的文件,以及圖像小程序單元通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用單元來(lái)獲取GIF格式的原始圖像的黑/白圖像拷貝。
15.根據(jù)權(quán)利要求14所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,所述選擇的需要識(shí)別的圖像區(qū)域通過(guò)使用圖像小程序單元人工或自動(dòng)選擇,并且網(wǎng)絡(luò)服務(wù)應(yīng)用單元將所述選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)返回圖像小程序單元。
16.根據(jù)權(quán)利要求14或15所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,在選擇需要識(shí)別的圖像區(qū)域之前,圖像小程序單元事先處理所獲取的GIF格式的原始圖像的黑/白圖像拷貝。
17.根據(jù)權(quán)利要求16所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,由圖像小程序單元執(zhí)行的所述處理包括圖像旋轉(zhuǎn)和圖像色反轉(zhuǎn)。
18.根據(jù)權(quán)利要求17所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,圖像小程序單元通過(guò)網(wǎng)絡(luò)服務(wù)器將關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息發(fā)送到網(wǎng)絡(luò)服務(wù)應(yīng)用單元。
19.根據(jù)權(quán)利要求18所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,如果需要歪斜校正,則調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用單元對(duì)其所保存的圖像數(shù)據(jù)執(zhí)行自動(dòng)歪斜校正,然后將更新后的GIF格式的黑/白圖像拷貝返回圖像小程序單元用于顯示。
20.根據(jù)權(quán)利要求19所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,圖像小程序單元通過(guò)網(wǎng)絡(luò)服務(wù)器將關(guān)于如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)發(fā)送給網(wǎng)絡(luò)服務(wù)應(yīng)用單元。
21.根據(jù)權(quán)利要求13至20任一所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),還包括校對(duì)小程序單元,用于接收所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù),并解析所接收的所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù),以及將所解析的文本顯示在校對(duì)小程序單元上。
22.根據(jù)權(quán)利要求21所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,校對(duì)小程序單元將舊的不適當(dāng)?shù)淖址闷溥m當(dāng)?shù)暮蜻x字符替換。
23.根據(jù)權(quán)利要求22所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,校對(duì)小程序單元通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用單元,以便將舊的不適當(dāng)?shù)淖址呀?jīng)用其適當(dāng)?shù)暮蜻x字符替換的識(shí)別數(shù)據(jù)保存為格式文件。
24.根據(jù)權(quán)利要求23所述的基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別系統(tǒng),其特征在于,所述格式文件是HTML格式文件或RTF格式文件。
25.一種記錄在至少一種計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品,包括當(dāng)計(jì)算機(jī)使用時(shí),使計(jì)算機(jī)執(zhí)行權(quán)利要求1~12中任何一個(gè)所述的方法步驟的功能性描述素材。
26.一種用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,所述方法包括步驟接收原始圖像的圖像文件;存儲(chǔ)所接收的圖像文件;轉(zhuǎn)換所述圖像文件并保存轉(zhuǎn)換后的圖像文件;將轉(zhuǎn)換后的圖像文件發(fā)送到控制字符識(shí)別處理的OCR結(jié)果接收裝置;從OCR結(jié)果接收裝置接收關(guān)于轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;根據(jù)所接收的指令對(duì)原始圖像執(zhí)行字符識(shí)別處理;以及將執(zhí)行的字符識(shí)別處理的結(jié)果發(fā)送到OCR結(jié)果接收裝置。
27.根據(jù)權(quán)利要求26所述的用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,其特征在于,將接收的圖像文件轉(zhuǎn)換成GIF格式的文件,并且將GIF格式的原始圖像的黑/白圖像拷貝發(fā)送到OCR結(jié)果接收裝置。
28.根據(jù)權(quán)利要求27所述的用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,其特征在于,根據(jù)GIF格式的原始圖像的黑/白圖像拷貝在OCR結(jié)果接收裝置上人工或自動(dòng)選擇需要識(shí)別的圖像區(qū)域,并且OCR服務(wù)提供裝置接收所選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)。
29.根據(jù)權(quán)利要求28所述的用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,其特征在于,GIF格式的原始圖像的黑/白圖像拷貝由OCR結(jié)果接收裝置處理和編輯,并且OCR服務(wù)提供裝置接收關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息。
30.根據(jù)權(quán)利要求29所述的用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,其特征在于,如果需要歪斜校正,則OCR服務(wù)提供裝置對(duì)其所保存的圖像數(shù)據(jù)執(zhí)行自動(dòng)歪斜校正,并將更新后圖像的GIF格式的黑/白圖像拷貝發(fā)送給OCR結(jié)果接收裝置。
31.根據(jù)權(quán)利要求30所述的用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,其特征在于,OCR服務(wù)提供裝置還從OCR結(jié)果接收裝置接收如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)。
32.根據(jù)權(quán)利要求31所述的用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,其特征在于,OCR服務(wù)提供裝置還從OCR結(jié)果接收裝置接收用于替換舊的不適當(dāng)?shù)淖址倪m當(dāng)?shù)暮蜻x字符。
33.根據(jù)權(quán)利要求32所述的用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,還包括步驟將舊的不適當(dāng)?shù)淖址呀?jīng)用其適當(dāng)?shù)暮蜻x字符替換的識(shí)別數(shù)據(jù)轉(zhuǎn)換為格式文件。
34.根據(jù)權(quán)利要求33所述的用于控制OCR服務(wù)提供裝置的光學(xué)字符識(shí)別方法,其特征在于,所述格式文件是HTML格式文件或RTF格式文件。
35.一種OCR服務(wù)提供裝置,包括圖像處理單元,用于接收和轉(zhuǎn)換需要識(shí)別的原始圖像,并將轉(zhuǎn)換后的圖像文件發(fā)送到OCR結(jié)果接收裝置;以及OCR識(shí)別單元,用于接收關(guān)于轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令,并且執(zhí)行字符識(shí)別處理。
36.根據(jù)權(quán)利要求35所述的OCR服務(wù)提供裝置,其特征在于,所述圖像處理單元包括輸入部件,用于接收原始圖像的圖像文件;存儲(chǔ)器部件,用于存儲(chǔ)所接收的圖像文件;轉(zhuǎn)換部件,用于轉(zhuǎn)換所述圖像文件并保存轉(zhuǎn)換后的圖像文件;和圖像輸出部件,用于將轉(zhuǎn)換后的圖像文件發(fā)送到控制字符識(shí)別處理的OCR結(jié)果接收裝置。
37.根據(jù)權(quán)利要求35或36所述的OCR服務(wù)提供裝置,其特征在于,所述OCR識(shí)別單元包括指令接收部件,用于從OCR結(jié)果接收裝置接收關(guān)于轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;識(shí)別部件,用于根據(jù)所接收的指令對(duì)原始圖像執(zhí)行字符識(shí)別處理;以及識(shí)別結(jié)果輸出部件,用于將所執(zhí)行的字符識(shí)別處理的結(jié)果發(fā)送到OCR結(jié)果接收裝置。
38.根據(jù)權(quán)利要求37所述的OCR服務(wù)提供裝置,其特征在于,將接收的圖像文件轉(zhuǎn)換成GIF格式的文件,并且將GIF格式的原始圖像的黑/白圖像拷貝發(fā)送到OCR結(jié)果接收裝置。
39.根據(jù)權(quán)利要求38所述的OCR服務(wù)提供裝置,其特征在于,根據(jù)GIF格式的原始圖像的黑/白圖像拷貝在OCR結(jié)果接收裝置上人工或自動(dòng)選擇需要識(shí)別的圖像區(qū)域,并且OCR服務(wù)提供裝置接收所選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)。
40.根據(jù)權(quán)利要求39所述的OCR服務(wù)提供裝置,其特征在于,GIF格式的原始圖像的黑/白圖像拷貝由OCR結(jié)果接收裝置處理和編輯,并且OCR服務(wù)提供裝置接收關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息。
41.根據(jù)權(quán)利要求40所述的OCR服務(wù)提供裝置,其特征在于,如果需要歪斜校正,則OCR服務(wù)提供裝置對(duì)其所保存的圖像數(shù)據(jù)執(zhí)行自動(dòng)歪斜校正,并將更新后圖像的GIF格式的黑/白圖像拷貝發(fā)送給OCR結(jié)果接收裝置。
42.根據(jù)權(quán)利要求41所述的OCR服務(wù)提供裝置,其特征在于,OCR服務(wù)提供裝置還從OCR結(jié)果接收裝置接收如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)。
43.根據(jù)權(quán)利要求42所述的OCR服務(wù)提供裝置,其特征在于,還包括識(shí)別結(jié)果轉(zhuǎn)換單元,用于從OCR結(jié)果接收裝置接收用于替換舊的不適當(dāng)?shù)淖址倪m當(dāng)?shù)暮蜻x字符。
44.根據(jù)權(quán)利要求43所述的OCR服務(wù)提供裝置,其特征在于,所述識(shí)別結(jié)果轉(zhuǎn)換單元還將舊的不適當(dāng)?shù)淖址呀?jīng)用其適當(dāng)?shù)暮蜻x字符替換的識(shí)別數(shù)據(jù)轉(zhuǎn)換為格式文件。
45.根據(jù)權(quán)利要求44所述的OCR服務(wù)提供裝置,其特征在于,所述格式文件是HTML格式文件或RTF格式文件。
46.一種記錄在至少一種計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品,包括當(dāng)計(jì)算機(jī)使用時(shí),使計(jì)算機(jī)執(zhí)行權(quán)利要求26~34中任何一個(gè)所述的方法步驟的功能性描述素材。
47.一種用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,所述方法包括步驟從OCR服務(wù)提供裝置接收轉(zhuǎn)換后的圖像文件,所述轉(zhuǎn)換后的圖像文件由OCR服務(wù)提供裝置轉(zhuǎn)換原始圖像的原始圖像文件生成;根據(jù)用戶(hù)指令發(fā)送關(guān)于所接收的轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;以及從OCR服務(wù)提供裝置接收對(duì)原始圖像進(jìn)行的字符識(shí)別處理的結(jié)果,根據(jù)OCR結(jié)果接收裝置所發(fā)送的控制指令OCR服務(wù)提供裝置進(jìn)行所述字符識(shí)別處理。
48.根據(jù)權(quán)利要求47所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于,所述原始圖像的原始圖像文件由OCR結(jié)果接收裝置發(fā)送給OCR服務(wù)提供裝置或者從網(wǎng)絡(luò)上下載。
49.根據(jù)權(quán)利要求47或48所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于,轉(zhuǎn)換后的圖像文件是GIF格式的文件,并且從OCR服務(wù)提供裝置接收原始圖像的黑/白圖像拷貝。
50.根據(jù)權(quán)利要求49所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于還包括步驟人工或自動(dòng)選擇原始圖像的需要識(shí)別的圖像區(qū)域,并且將所選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)返回給OCR服務(wù)提供裝置。
51.根據(jù)權(quán)利要求50所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于,在選擇所述需要識(shí)別的圖像區(qū)域之前,對(duì)GIF格式的原始圖像的黑/白圖像拷貝事先進(jìn)行處理。
52.根據(jù)權(quán)利要求51所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于,所述處理包括圖像旋轉(zhuǎn)和圖像色反轉(zhuǎn)。
53.根據(jù)權(quán)利要求52所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于還包括步驟將關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息發(fā)送給OCR服務(wù)提供裝置。
54.根據(jù)權(quán)利要求53所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于還包括步驟如果需要歪斜校正,則將如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)發(fā)送給OCR服務(wù)提供裝置。
55.根據(jù)權(quán)利要求54所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于,對(duì)接收的所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)進(jìn)行解析,并且顯示所解析的文本。
56.根據(jù)權(quán)利要求55所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于,將舊的不適當(dāng)?shù)淖址闷溥m當(dāng)?shù)暮蜻x字符替換。
57.根據(jù)權(quán)利要求56所述的用于控制OCR結(jié)果接收裝置的光學(xué)字符識(shí)別方法,其特征在于還包括步驟將關(guān)于替換的字符的信息發(fā)送給OCR服務(wù)提供裝置。
58.一種OCR結(jié)果接收裝置,包括圖像接收單元,用于從OCR服務(wù)提供裝置接收轉(zhuǎn)換后的圖像文件,所述轉(zhuǎn)換后的圖像文件由OCR服務(wù)提供裝置轉(zhuǎn)換原始圖像的原始圖像文件生成;指令發(fā)送單元,用于根據(jù)用戶(hù)指令發(fā)送關(guān)于所接收的轉(zhuǎn)換后的圖像文件的字符識(shí)別處理的控制指令;以及識(shí)別結(jié)果接收單元,用于從OCR服務(wù)提供裝置接收對(duì)原始圖像進(jìn)行的字符識(shí)別處理的結(jié)果,根據(jù)所發(fā)送的控制指令OCR服務(wù)提供裝置進(jìn)行所述字符識(shí)別處理。
59.根據(jù)權(quán)利要求58所述的OCR結(jié)果接收裝置,其特征在于還包括圖像發(fā)送單元,用于將所述原始圖像的原始圖像文件發(fā)送給OCR服務(wù)提供裝置。
60.根據(jù)權(quán)利要求58或59所述的OCR結(jié)果接收裝置,其特征在于,轉(zhuǎn)換后的圖像文件是GIF格式的文件,并且從OCR服務(wù)提供裝置接收原始圖像的黑/白圖像拷貝。
61.根據(jù)權(quán)利要求60所述的OCR結(jié)果接收裝置,其特征在于還包括圖像處理單元,用于選擇原始圖像的需要識(shí)別的圖像區(qū)域,并且指令發(fā)送單元將所選擇的需要識(shí)別的圖像區(qū)域的塊信息數(shù)據(jù)返回給OCR服務(wù)提供裝置。
62.根據(jù)權(quán)利要求61所述的OCR結(jié)果接收裝置,其特征在于,在選擇所述需要識(shí)別的圖像區(qū)域之前,圖像處理單元對(duì)GIF格式的原始圖像的黑/白圖像拷貝事先進(jìn)行處理。
63.根據(jù)權(quán)利要求62所述的OCR結(jié)果接收裝置,其特征在于,所述處理包括圖像旋轉(zhuǎn)和圖像色反轉(zhuǎn)。
64.根據(jù)權(quán)利要求63所述的OCR結(jié)果接收裝置,其特征在于,指令發(fā)送單元將關(guān)于圖像處理的參數(shù)和所述選擇的需要識(shí)別的圖像區(qū)域的編輯信息發(fā)送給OCR服務(wù)提供裝置。
65.根據(jù)權(quán)利要求64所述的OCR結(jié)果接收裝置,其特征在于,如果需要歪斜校正,指令發(fā)送單元還將如何校正歪斜圖像的指令或關(guān)于歪斜圖像的參數(shù)發(fā)送給OCR服務(wù)提供裝置。
66.根據(jù)權(quán)利要求65所述的OCR結(jié)果接收裝置,其特征在于還包括編輯單元,用于對(duì)接收的所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)進(jìn)行解析,并且顯示所解析的文本。
67.根據(jù)權(quán)利要求66所述的OCR結(jié)果接收裝置,其特征在于,將舊的不適當(dāng)?shù)淖址闷溥m當(dāng)?shù)暮蜻x字符替換。
68.根據(jù)權(quán)利要求67所述的OCR結(jié)果接收裝置,其特征在于還包括編輯結(jié)果發(fā)送單元,用于將編輯結(jié)果發(fā)送給OCR服務(wù)提供裝置。
69.一種記錄在至少一種計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品,包括當(dāng)計(jì)算機(jī)使用時(shí),使計(jì)算機(jī)執(zhí)行權(quán)利要求47~57中任何一個(gè)所述的方法步驟的功能性描述素材。
全文摘要
本發(fā)明公開(kāi)一種基于網(wǎng)絡(luò)上的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法和光學(xué)字符識(shí)別系統(tǒng)。所述方法包括步驟a)使用網(wǎng)絡(luò)瀏覽器將原始圖像的圖像文件上載到網(wǎng)絡(luò)服務(wù)器;b)存儲(chǔ)所述上載的圖像文件;c)通過(guò)網(wǎng)絡(luò)服務(wù)應(yīng)用轉(zhuǎn)換所述上載的圖像文件并保存所轉(zhuǎn)換的圖像文件;d)圖像小程序通過(guò)網(wǎng)絡(luò)服務(wù)器調(diào)用網(wǎng)絡(luò)服務(wù)應(yīng)用,識(shí)別選擇的需要識(shí)別的圖像區(qū)域;以及e)返回所述選擇的需要識(shí)別的圖像區(qū)域的識(shí)別信息數(shù)據(jù)。使用該基于網(wǎng)絡(luò)的網(wǎng)絡(luò)服務(wù)應(yīng)用的光學(xué)字符識(shí)別方法和光學(xué)字符識(shí)別系統(tǒng),用戶(hù)能夠控制整個(gè)識(shí)別處理流程,并且效率得到提高。
文檔編號(hào)G06K9/34GK1680973SQ20041003252
公開(kāi)日2005年10月12日 申請(qǐng)日期2004年4月8日 優(yōu)先權(quán)日2004年4月8日
發(fā)明者郭瑞山, 倪勇 申請(qǐng)人:佳能株式會(huì)社