專利名稱:一種用于帶攝像裝置的移動(dòng)終端上實(shí)現(xiàn)ocr功能的新型輔助定位技術(shù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明提供了一種用于帶攝像裝置的移動(dòng)終端上實(shí)現(xiàn)OCR功能的新型輔助定位技術(shù)。它通過(guò)一種帶有原點(diǎn)的十字光標(biāo)輔助定位方法來(lái)實(shí)現(xiàn)終端操作者對(duì)待識(shí)別字符進(jìn)行準(zhǔn)確定位,結(jié)合OCR達(dá)到操作者快速獲得信息的目的。
背景技術(shù):
現(xiàn)有的具有OCR功能的智能終端和PDA等設(shè)備,在對(duì)光符識(shí)別前定位技術(shù)的實(shí)現(xiàn)方式上存在著一定的不便和缺陷,不能方便的定位到需要識(shí)別的字符上,帶來(lái)了識(shí)別過(guò)程計(jì)算量大、消耗時(shí)間長(zhǎng)等缺點(diǎn)。
現(xiàn)有的OCR功能手機(jī)在進(jìn)行名片識(shí)別定位時(shí),已采用的方法既有用一根紅線壓到目標(biāo)字符上,也有直接識(shí)別名片上全部?jī)?nèi)容的方法,還有用一個(gè)矩形框選擇目標(biāo)字符串的方法。
但是這些方法,都會(huì)存在一些缺陷。如利用一根紅線壓到目標(biāo)字符上的方法,比較方便,但是不能防止出現(xiàn)拍攝字符傾斜的問(wèn)題,這樣就造成了識(shí)別率降低;而對(duì)于整個(gè)名片全部識(shí)別的辦法,不但工作量加大,而且更加不能防止拍攝圖像的傾斜情況出現(xiàn)。同時(shí)因?yàn)橛袑?duì)操作者來(lái)說(shuō)的許多無(wú)用信息存在,干擾操作者獲取感興趣信息的過(guò)程;對(duì)于用矩形框定位情況,矩形框的大小不易確定又給拍攝帶來(lái)不便,過(guò)大則包括了不必要的內(nèi)容,過(guò)小又不能完整包含要識(shí)別的目標(biāo)字符。
發(fā)明內(nèi)容
本發(fā)明提供了一種用于帶攝像裝置的移動(dòng)終端上實(shí)現(xiàn)OCR功能的新型輔助定位技術(shù),它通過(guò)一種帶有原點(diǎn)的十字光標(biāo)輔助定位方法來(lái)實(shí)現(xiàn)終端操作者對(duì)待識(shí)別字符進(jìn)行準(zhǔn)確定位,結(jié)合OCR達(dá)到操作者快速獲得信息的目的。通過(guò)該定位方法,可以準(zhǔn)確選擇目標(biāo)字符,縮小圖像選擇范圍,提高運(yùn)算速度、減小運(yùn)算量,同時(shí)由于十字光標(biāo)的橫坐標(biāo)和縱坐標(biāo)存在,還可以具有防止傾斜的作用。
在人機(jī)交互界面實(shí)現(xiàn)上,該方法實(shí)現(xiàn)方式之一在拍攝后的OCR過(guò)程時(shí)采用十字光標(biāo)形式,可以把光標(biāo)定位到目標(biāo)字符區(qū)域內(nèi)部或者左下角(定位于目標(biāo)字符的左上角、右上角及右下角等也在本公司申請(qǐng)的專利覆蓋范圍內(nèi)),都可以做到準(zhǔn)確定位。同時(shí)在定位方式的算法上,采用了與此相適應(yīng)的算法;該方法實(shí)現(xiàn)方式之二在進(jìn)行OCR目的拍攝前即顯示十字光標(biāo),此時(shí)在操作者調(diào)整十字光標(biāo)原點(diǎn)至目標(biāo)字符區(qū)域內(nèi)部或者左下角(定位于目標(biāo)字符的左上角、右上角及右下角等也在本公司申請(qǐng)的專利覆蓋范圍內(nèi)),都可以做到準(zhǔn)確定位。同時(shí)在定位方式的算法上,采用了與此相適應(yīng)的算法。
本發(fā)明解決的問(wèn)題首先,也是最主要的一個(gè),就是輔助定位功能。對(duì)于名片識(shí)別,一般情況下,拍攝的圖像是整個(gè)名片,要做到對(duì)具體個(gè)別的號(hào)碼,需要準(zhǔn)確確定識(shí)別目標(biāo),有多種方法可以采用,本專利采用的這種方法,通過(guò)定位到目標(biāo)字符的內(nèi)部或者左下角(定位于目標(biāo)字符的左上角、右上角及右下角等也在本公司申請(qǐng)的專利覆蓋范圍內(nèi)),就可以方便選定要識(shí)別的目標(biāo)字符;其次,本專利還有另一個(gè)優(yōu)點(diǎn),就是可以幫助帶攝像裝置的移動(dòng)終端使用者選擇目標(biāo)字符的同時(shí),防止拍攝圖像的傾斜。因?yàn)橛惺止鈽?biāo)的關(guān)系,操作者可以通過(guò)與十字光標(biāo)的縱坐標(biāo)及橫坐標(biāo)的對(duì)比就可以通過(guò)目測(cè)檢查到圖像中的字符區(qū)域是否處在正確位置。
由于這種方法的采用,它具有了更好更強(qiáng)的功能,可以準(zhǔn)確定位,而且可以防止拍攝圖像的傾斜。
本發(fā)明的有益效果是,更加準(zhǔn)確的選擇目標(biāo)字符,縮小圖像選擇范圍,提高運(yùn)算速度、減小運(yùn)算量,同時(shí)由于十字光標(biāo)的橫縱坐標(biāo)存在,還可以具有防止傾斜的作用。
附圖1(包括a,b)為本發(fā)明的流程圖;附圖2為本發(fā)明的一種具體實(shí)施例的操作過(guò)程顯示狀態(tài)示意圖;附圖3為本發(fā)明的一種具體實(shí)施例的操作過(guò)程顯示狀態(tài)示意圖。
具體實(shí)施例方式
下面將結(jié)合說(shuō)明書(shū)附圖及具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
實(shí)現(xiàn)方式之一第一步,操作者啟動(dòng)帶攝像裝置的移動(dòng)終端的攝像功能,拍攝圖像。此時(shí)要求待識(shí)別字符在拍攝后的圖像中的位置沒(méi)有較大的水平或者垂直傾斜、翻轉(zhuǎn)。
第二步,帶攝像裝置的移動(dòng)終端使用者啟動(dòng)輔助定位功能,在帶攝像裝置的移動(dòng)終端顯示屏上出一個(gè)十字定位光標(biāo)。定位光標(biāo)的形狀是十字形狀的,橫坐標(biāo)和縱坐標(biāo)可以是實(shí)線,也可以是虛線,原點(diǎn)是一個(gè)實(shí)心或者空心的圓點(diǎn)。
第三步,帶攝像裝置的移動(dòng)終端使用者通過(guò)操作按鍵移動(dòng)定位光標(biāo)原點(diǎn)到待識(shí)別的字符區(qū)域(包括電話號(hào)碼或者email等)內(nèi)部,或者左下角(定位于目標(biāo)字符的左上角、右上角及右下角等也在本公司申請(qǐng)的專利覆蓋范圍內(nèi))。這樣可以方便的定位(具體情況看附圖所示,圖2、圖3分別表示壓到字符串中心和字符串左下角)。操作按鍵可以使得定位光標(biāo)在拍攝圖像上向上下左右四個(gè)方向移動(dòng),從而達(dá)到鎖定待識(shí)別字符區(qū)域的目的。
通過(guò)這種輔助定位方法,可以縮小識(shí)別目標(biāo)的范圍,從而減小識(shí)別處理模塊的運(yùn)算量,提高運(yùn)算速度,縮短運(yùn)算時(shí)間。
第四步,確定好拍攝圖像的位置后,帶攝像裝置的移動(dòng)終端的操作者可以按下確定鍵,則帶攝像裝置的移動(dòng)終端的識(shí)別功能模塊自動(dòng)鎖定要識(shí)別內(nèi)容,開(kāi)始字符的自動(dòng)識(shí)別。
實(shí)現(xiàn)方式之二第一步,操作者啟動(dòng)帶攝像裝置的移動(dòng)終端的攝像功能,并且選擇是OCR拍攝。此時(shí)不同于一般的拍攝,在移動(dòng)終端的顯示器上會(huì)出現(xiàn)一個(gè)位置固定的十字定位光標(biāo)。
第二步,帶攝像裝置的移動(dòng)終端的使用者通過(guò)調(diào)整拍攝的相對(duì)位置使得定位光標(biāo)原點(diǎn)到達(dá)待識(shí)別的字符區(qū)域(包括電話號(hào)碼或者email等)內(nèi)部,或者左下角(定位于目標(biāo)字符的左上角、右上角及右下角等也在本公司申請(qǐng)的專利覆蓋范圍內(nèi))。這樣可以方便的定位(具體情況看附圖所示,圖2、圖3分別表示壓到待識(shí)別的字符區(qū)域中心和待識(shí)別的字符區(qū)域左下角)。同時(shí),在調(diào)整拍攝的相對(duì)位置時(shí),帶攝像裝置的移動(dòng)終端使用者需要根據(jù)十字光標(biāo)的橫坐標(biāo)軸和縱坐標(biāo)軸,調(diào)整攝像頭或者被拍攝目標(biāo)的角度,使字符區(qū)域底邊的方向和十字光標(biāo)的橫坐標(biāo)軸平行,字符區(qū)域底邊的方向和十字光標(biāo)的縱坐標(biāo)軸垂直。
通過(guò)這種輔助定位方法,可以縮小識(shí)別目標(biāo)的范圍,從而減小識(shí)別處理模塊的運(yùn)算量,提高運(yùn)算速度,縮短運(yùn)算時(shí)間。同時(shí),可以防止拍攝的待識(shí)別的字符區(qū)域圖像發(fā)生傾斜。這樣,在進(jìn)行字符識(shí)別時(shí),不會(huì)因?yàn)榕臄z角度發(fā)生傾斜而降低字符識(shí)別準(zhǔn)確率。
第三步,確定好拍攝待識(shí)別的字符區(qū)域圖像的位置和角度后,帶攝像裝置的移動(dòng)終端操作者可以按下確定鍵,拍攝圖像。
第四步,操作者利用帶攝像頭的移動(dòng)終端進(jìn)行拍攝之后,光符識(shí)別功能模塊自動(dòng)啟動(dòng),分析并鎖定待識(shí)別內(nèi)容,開(kāi)始對(duì)字符進(jìn)行自動(dòng)識(shí)別,并輸出識(shí)別結(jié)果。
本發(fā)明所描述帶攝像頭裝置的移動(dòng)終端的光符識(shí)別處理方法,并不僅僅限于說(shuō)明書(shū)和實(shí)施方式中所列運(yùn)用,上述的這種方案也可以應(yīng)用于其它可攝影電子產(chǎn)品中,如數(shù)字相機(jī),PDA,數(shù)字?jǐn)z像機(jī)等等,它完全可以被適用于各種適合本發(fā)明之領(lǐng)域,對(duì)于熟悉本領(lǐng)域的人員而言可容易地實(shí)現(xiàn)另外的優(yōu)點(diǎn)和進(jìn)行修改,因此在不背離權(quán)利要求及等同范圍所限定的一般概念的精神和范圍的情況下,本發(fā)明并不限于特定的細(xì)節(jié)、代表性的設(shè)備和這里示出與描述的圖示示例。
權(quán)利要求
1.一種帶攝像裝置的移動(dòng)終端對(duì)圖片上字符進(jìn)行識(shí)別的輔助定位方法,其中圖片是指包括名片、身份證、駕照、廣告牌等,其輔助定位方法可以包括如下步驟步驟1、操作者利用帶攝像裝置的移動(dòng)終端拍攝目標(biāo),此時(shí)要求待識(shí)別字符在拍攝后的圖像中的位置沒(méi)有較大的水平或者垂直傾斜、翻轉(zhuǎn);步驟2、移動(dòng)終端操作者啟動(dòng)輔助定位功能,屏幕出現(xiàn)十字定位光標(biāo);步驟3、移動(dòng)終端操作者通過(guò)操作按鍵移動(dòng)定位光標(biāo)原點(diǎn)到要識(shí)別的字符區(qū)域內(nèi)部,或者左下角,定位于目標(biāo)字符的左上角、右上角及右下角等也在本公司申請(qǐng)的專利覆蓋范圍內(nèi),然后確定;步驟4、移動(dòng)終端啟動(dòng)自動(dòng)識(shí)別模塊,對(duì)選定的字符進(jìn)行后續(xù)識(shí)別并輸出識(shí)別結(jié)果。輔助定位方法也可以包括如下步驟步驟1、操作者啟動(dòng)帶攝像裝置的移動(dòng)終端的拍攝功能,并且選擇是OCR拍攝。此時(shí)不同于一般的拍攝,在移動(dòng)終端的顯示器上會(huì)出現(xiàn)一個(gè)位置固定的十字定位光標(biāo)。步驟2、操作者在拍攝前可以調(diào)整拍攝的相對(duì)位置使得十字光標(biāo)的原點(diǎn)落在要識(shí)別目標(biāo)字符的內(nèi)部區(qū)域,或者字符區(qū)域的左下角,定位于目標(biāo)字符的左上角、右上角及右下角等也在本公司申請(qǐng)的專利覆蓋范圍內(nèi)。同時(shí)調(diào)整待識(shí)別目標(biāo)字符區(qū)域的底邊與十字光標(biāo)的橫軸平行,待識(shí)別字符區(qū)域的底邊方向與十字光標(biāo)的縱軸相垂直。步驟3、確定位置后,操作者可以按下拍攝鍵或拍攝快門(mén)。步驟4、移動(dòng)終端進(jìn)行拍攝之后,光符識(shí)別功能模塊自動(dòng)啟動(dòng),分析并鎖定待識(shí)別內(nèi)容,開(kāi)始對(duì)字符進(jìn)行自動(dòng)識(shí)別,并輸出識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的輔助定位方法,其特征是用于顯示定位的光標(biāo)是十字形狀的,光標(biāo)的顯示可以是虛線,也可以是實(shí)線;十字光標(biāo)可大可小,最大時(shí)十字光標(biāo)可以穿過(guò)整個(gè)屏幕,且可帶箭頭即顯示為十字坐標(biāo)軸的形式;光標(biāo)上可以有計(jì)量刻度標(biāo)識(shí)。
3.根據(jù)權(quán)利要求1所述的輔助定位方法,其特征是當(dāng)帶攝像裝置的移動(dòng)終端操作者啟動(dòng)定位功能以后,進(jìn)行定位時(shí),光標(biāo)的原點(diǎn)可以置位于待識(shí)別字符或者電話號(hào)碼的內(nèi)部位置,也可以置位于待識(shí)別的左下角、左上角、右下角、右上角等部位,都在本專利申明范圍內(nèi)。
4.根據(jù)權(quán)利要求2所述的輔助定位方法,其特征是十字光標(biāo)的原點(diǎn),可以是一個(gè)實(shí)心原點(diǎn),也可以是一個(gè)空心原點(diǎn),等等可以明顯表示的原點(diǎn)位置的圖形都在本專利聲明范圍內(nèi);十字光標(biāo)的原點(diǎn),也可以不必有明確標(biāo)示圖形的原點(diǎn)。
5.據(jù)權(quán)利要求2所述的輔助定位方法,其特征是十字光標(biāo)的橫、縱坐標(biāo)可以用來(lái)防止拍攝圖像的傾斜,提高識(shí)別的準(zhǔn)確度。帶攝像裝置的移動(dòng)終端操作者可以通過(guò)LCD上顯示的所見(jiàn)即所得圖象中的待識(shí)別字符區(qū)域的底邊方向與十字光標(biāo)的橫軸相平行,待識(shí)別字符區(qū)域的底邊方向與十字光標(biāo)的縱軸相垂直來(lái)調(diào)整帶攝像頭終端的機(jī)位,使拍攝圖像位置正確sa,以便準(zhǔn)確快速識(shí)別出結(jié)果。
全文摘要
本發(fā)明公開(kāi)了一種用于帶攝像頭的移動(dòng)終端實(shí)施光符識(shí)別(OCR)功能的針對(duì)待識(shí)別文字的輔助定位技術(shù),可根據(jù)OCR功能具體實(shí)施的兩種情況分別有如下步驟其一,首先操作者利用移動(dòng)終端對(duì)包含字符圖像信息的物體進(jìn)行拍攝;其次,啟動(dòng)輔助定位功能,屏幕上會(huì)出現(xiàn)十字光標(biāo)。操作者移動(dòng)光標(biāo),使其原點(diǎn)位于待識(shí)別文字內(nèi)部或左下角;最后,按確定鍵并自動(dòng)識(shí)別。其二,操作者打開(kāi)移動(dòng)終端OCR拍攝功能,移動(dòng)終端屏幕會(huì)顯示出一個(gè)十字光標(biāo)。然后,操作者調(diào)整拍攝的相對(duì)位置使光標(biāo)原點(diǎn)落在待識(shí)別目標(biāo)字符的內(nèi)部或左下角;最后,拍攝圖像并自動(dòng)識(shí)別。本發(fā)明有益效果是,更準(zhǔn)確選擇待識(shí)別的選擇范圍,減小識(shí)別計(jì)算量,同時(shí)具有防止拍攝傾斜的作用,提高識(shí)別率。
文檔編號(hào)G06K9/00GK1804858SQ200510000578
公開(kāi)日2006年7月19日 申請(qǐng)日期2005年1月10日 優(yōu)先權(quán)日2005年1月10日
發(fā)明者趙國(guó)成, 楊健, 張軍強(qiáng) 申請(qǐng)人:趙國(guó)成