專利名稱:一種用手機拍照方式的文字輸入方法
技術領域:
本發(fā)明涉及手機信息輸入領域,尤其涉及一種在拍照手機上用拍照方式輸入文字的方法。
背景技術:
手機如今成為現(xiàn)代人必備的信息處理工具,但在手機上輸入文字卻是一個難題,也存在一個巨大的市場。尤其是短信的迅猛發(fā)展,更刺激了手機文字輸入技術的快速發(fā)展。在手機輸入法中,一般可分為鍵盤輸入及手寫輸入兩大類,這些輸入法一般用于用戶自寫短信或通訊錄時的輸入方法。也有的時候,用戶需要將隨時看到的其他現(xiàn)有媒體上的文字信息記錄下來,如報紙、戶外廣告、名片等,但用手寫或鍵盤逐字輸入,可能不方便,如時間來不及,或在戶外人群擁擠,或受其他限制無法操作手機鍵盤輸入,此時最方便的就是將目標文字用手機拍攝下來,先作為照片貯存起來,以后查看。有時也需要將拍下來的照片中的文字轉換為文字字符,便于在其它軟件中使用或發(fā)短信給其他人,如拍下來的名片,需要將其中的文字提取出來才能加入到通訊錄中。但手工再照著錄入仍然不方便,尤其是在不方便使用電腦時,在手機上一邊看照片一邊錄入,效率非常低,而且許多手機也沒有提供多任務功能,如照片瀏覽功能與通訊錄編輯功能只能選擇一個,使用其中一個就要關閉另一下,這樣,在手機上用戶就無法實現(xiàn)看著照片錄入文字。
發(fā)明內容本發(fā)明的目的是克服目前的手機在錄入現(xiàn)成文字信息中存在的缺陷,提出一種用手機拍照方式的文字輸入方法,用普通拍照手機拍攝目標文字照片,再由手機中內置的軟件將照片中的文字識別為文本字符,要實現(xiàn)本方法,手機中包括一個光學拍照模塊及一個照片文字識別模塊,文字識別模塊中包括GB2312的字符集,系統(tǒng)對字符集中的字符根據(jù)其在社會公開出版中的使用頻度從高到低建立一個索引表,本方法的具體步驟如下步驟A用手機將目標文字材料拍攝為多張照片,在拍攝時,需要將調節(jié)拍照的距離,使拍攝的文字能基本清晰,否則手機就難以識別,為了達到較好的拍攝效果,在手機上可設置微距拍攝方式;步驟B手機文字識別模塊對每張照片逐個分析,根據(jù)字符輪廓勾畫出照片上的每個字符區(qū)域范圍,即字符塊,在這里主要是把要識別的每個字符的邊界先勾畫出來,一般來說是一個字符是一個方塊,包含了字符的所有筆劃;步驟C文字識別模塊對每張照片中的每個字符塊逐個分析,分析字符塊中字符的筆劃線條,并從字符集中選擇多個相近的字符,按相似程度從高到低排列,并自動選擇相似程度最高的第一個字符默認為字符塊對應的識別后的文本字符,這是字符識別的關鍵步驟,該技術也比較成熟,已廣泛應用于文字識別OCR軟件中,如清華紫光OCR、尚書OCR等;步驟D對系統(tǒng)自動默認選擇錯誤的字符,用戶可以手工在其他候選字符中選擇,如果正確的字符不在候選字列表中,由用戶手工輸入,受目標文字本身清晰度及拍攝質量的影響,有時手機識別得不一定準確,需要用戶手工處理,如所拍照上的字符筆劃缺少或不清楚時,用戶可通過手寫方式補充缺乏或不清楚的筆劃,另外,用戶手工調整過的候選字符,作為下一次識別相似字符時的第一個候選字符。
步驟E對識別輸入時確認應用過的字符,系統(tǒng)自動將其使用頻度增加一個單位,這個步驟主要是增加系統(tǒng)的學習功能,手機在出廠時,安裝的字符使用頻度索引表是一個語言學機構統(tǒng)計的通用表,但用戶在實際使用過程中,因用戶的興趣愛好、職業(yè)特點等收集的資料中字符的實際使用頻度會有差異,因此系統(tǒng)如果逐步適應用戶的特點,用戶使用手機識別輸入就越來越得心應手,在這里通過自動調整字符集的使用頻度就可達到目的。
上述技術方案的進一步改進在于拍照手機在拍攝文字照片時可自動調節(jié)圖像亮度,使其達到文字識別預定值,這個預定值在手機出廠時有默認值,用戶還可以修改。
上述技術方案的進一步改進在于拍照手機在拍攝文字照片時可自動調節(jié)拍攝焦距,使其達到文字識別預定值。通過調焦可提高照片的清晰度,有助于提高字符識別的準確率,普通的數(shù)碼變焦鏡頭手機來講,只通過軟件來調節(jié)就可以了,要想達到理想的效果,還需要有光學變焦的支持,只有一些高端手機才有此功能。
上述技術方案的進一步改進在于照片文字識別模塊在識別字符時可分為漢字識別、數(shù)字識別、大小寫英文字母識別、符號識別,用戶可指定其中的一種或多種混合識別,這樣便于提高識別效率,一般來說,可選字符的范圍越廣,識別準確率越低,按這樣推算,數(shù)字的識別準確率是最高的,英文字母次之,然后是符號,漢字識別效果最差,如果是混合識別,效果比任何單一類型的識別率都低,因此用戶盡量選擇單一字符類型識別,而且所選的識別類型盡量與目標照片中文字的類別相一致。其中,用戶可在符號識別中添加自定義符號,該自定義符號來自手機其他文本文件或用戶手寫的自創(chuàng)造符號。
上述技術方案的進一步改進在于在手機的拍照鏡頭上增加一個微型放大鏡,該放大鏡可設計成活動式的,在拍攝景物在移開,只有在拍攝文字類照片時將微型放大鏡推到鏡前。而且,微型放大鏡有焦距微調裝置,這樣相當于光學變焦,可以將文字拍攝得很清晰,便于識別。
本發(fā)明可帶來的有益效果是本發(fā)明在現(xiàn)有的手機的基本硬件基礎上實現(xiàn),只通過開發(fā)特定的軟件就可以實現(xiàn),成本低,但實用價值很高,普通的低象素手機就可以做到,這樣可以將手機的拍照功能充份挖掘出來,也讓用戶隨時隨地用手機收集資料成為可能。
無附圖具體實施方式為了便于本領域技術人員更好地實施本發(fā)明,下面結合具體實施方式
對本發(fā)明作進一步的詳細描述。
這里以名片的拍照及識別輸入為例來說明,名片是最常見的需要手機用戶輸入的資料,信息量較少,可識別的字符范圍小,是手機識別輸入的理想應用之一。考慮到有些名片上的字比較小,可以在手機的拍照鏡頭上增加一個微型放大鏡,這樣可以將小字放大顯示,拍出的效果就比較好。
在使用手機拍照前,先要調試好手機的相關參數(shù),主要調節(jié)好拍照的亮度,如果手機有自動調節(jié)亮度功能,就無須改變。還要把微型放大鏡拉到鏡頭前,使拍照通過放大鏡,得到清晰的照片,如果放大有焦距微調功能,還要調節(jié)其焦距,使手機屏幕上的照片文字顯示最為清晰時為止。
在選好名片開始拍照時,盡量將名片上的內容拍攝到一個照片中,如果名片上內容較多,只拍成多張,但一個照片上的內容最好是有一定完整性??梢耘耐暌粡埫⒓醋R別,也可以一次將多張名片拍攝完,再統(tǒng)一識別。
在開始識別后,手機文字識別模塊對照片先進行總體分析,根據(jù)字符輪廓勾畫出照片上的每個字符區(qū)域范圍,即字符塊,也就是把一個個要識別的字符先找出來,相鄰字符間正確劃界分開,如果有的相鄰的字符連在一起系統(tǒng)無法準確識別,需要用戶手工處理,將其正確分開。
然后文字識別模塊對每張照片中的每個字符塊逐個分析,主要是分析字符塊中字符的筆劃線條,將字符正確識別出來。為了提高識別的準確率,可以采用一些簡潔的技術手段,考慮到名片上的字符是有一定規(guī)律的,系統(tǒng)在分析時,可充分依據(jù)規(guī)律來識別??蓪⒚系淖址诸惾缦聨最悂碜R別(1)姓名一般是名片片面中的獨立的二至四個漢字,而且比其他字符較大,第一個字符是百家姓中的字符,依據(jù)這些特點,就可以將姓名字符識別出來。
(2)電話號碼特點是多個數(shù)字字符連續(xù)排列,有的前面還有“電話”、“手機”、“號碼”等字樣,也容易識別出來,電話中還可進一點分為“手機”、“辦公電話”、“傳真”、“總機”等,均有一定的特點,有時名片中同時存在多個電話,可根據(jù)分析識別連續(xù)數(shù)字之間的空格,符合等,將多個電話正確分開。
(3)郵箱最大的特點就是字符串中有符號“@”,很容易識別。
(4)網(wǎng)址最大的特點就是字符串中有字母“WWW”,也很容易識別。
(5)公司名稱一小段連續(xù)的漢字字符,結尾處有“公司”、“集團”、“中心”、“局”、“所”、“院”、“大學為”、“學校”等字樣,也比較容易識別。
(6)地址連續(xù)的一小段漢字字符,特點是字符串中開頭處有“地址”、地名,字符串結束處有“大廈”、“花園”、“號”、“室”、“房”等字樣,也容易識別。
(7)職務主要是一些職務類字符,如“總裁”、“經(jīng)理”等字樣。
有了上述的分類,可以將一張名片上的內容基本上識別出來并自動填寫到通訊錄中,對系統(tǒng)識別有誤的地方,用戶可手工調整。
對照片中文字的識別輸入總是有一定誤差的,這主要是照片中字符的相似程度高及拍照的清晰程度低所引起,為了糾正這種誤差,系統(tǒng)每識別一個字符,均列多個在筆劃結構上相似的字符,并將最相近的一個排列在最前面,作為默認選擇的字符,另外在相似程度相近系統(tǒng)難以分辨時,將使用頻度高的排在前面,如“人”與“入”,“薯”與“蓍”,有時系統(tǒng)就難以分辨出來,就可以將使用頻度高的排列在前面,可有效地提高識別準確率。
本識別系統(tǒng)還有智能學習功能,主要是對識別候選字符集使用頻度的自動調整,在手機出廠時,安裝的字符使用頻度索引表是一個語言學機構統(tǒng)計的通用表,但用戶在實際使用過程中,因用戶的興趣愛好、職業(yè)特點等收集的資料中字符的使用頻度會有差異,因此系統(tǒng)如果逐步適應用戶的特點,用戶使用手機識別輸入就越來越得心應手,在這里通過自動調整字符集的使用頻度就可達到目的。如某個字符被選過一次,其頻度值就增加1。另外對系統(tǒng)識別有誤的字符,用戶可手工選擇,用戶手工選擇過的字符,其頻度可增加的幅度大一些,如增加2。這樣在不斷的使用,系統(tǒng)就會越來越適合用戶的習慣,識別準確率不斷提高。
權利要求
1.一種用手機拍照方式的文字輸入方法,用普通拍照手機拍攝目標文字照片,再由手機中內置的軟件將照片中的文字識別為文本字符,要實現(xiàn)本方法,手機中包括一個光學拍照模塊及一個照片文字識別模塊,文字識別模塊中包括GB2312的字符集,系統(tǒng)對字符集中的字符根據(jù)其在社會公開出版中的使用頻度從高到低建立一個索引表,本方法的具體步驟如下步驟A用手機將目標文字材料拍攝為多張照片;步驟B手機文字識別模塊對每張照片逐個分析,根據(jù)字符輪廓勾畫出照片上的每個字符區(qū)域范圍,即字符塊;步驟C文字識別模塊對每張照片中的每個字符塊逐個分析,分析字符塊中字符的筆劃線條,并從字符集中選擇多個相近的字符,按相似程度從高到低排列,并自動選擇相似程度最高的第一個字符默認為字符塊對應的識別后的文本字符;步驟D對系統(tǒng)自動默認選擇錯誤的字符,用戶可以手工在其他候選字符中選擇,如果正確的字符不在候選字列表中,由用戶手工輸入;步驟E對識別輸入時確認使用過的字符,每使用一次,系統(tǒng)自動將其使用頻度增加一個單位。
2.根據(jù)權利要求1所述的文字輸入方法,其特征在于所述的拍照手機在拍攝目標文字照片時采用微距拍攝方式。
3.根據(jù)權利要求1所述的文字輸入方法,其特征在拍照手機有手寫輸入裝置,所拍照上的字符筆劃缺少或不清楚時,用戶可通過手寫方式補充缺乏或不清楚的筆劃。
4.根據(jù)權利要求1所述的文字輸入方法,其特征在于所述的拍照手機在拍攝文字照片時可自動調節(jié)圖像亮度,使其達到文字識別預定值。
5.根據(jù)權利要求1所述的文字輸入方法,其特征在于所述的拍照手機在拍攝文字照片時可自動調節(jié)拍攝焦距,使其達到文字識別預定值。
6.根據(jù)權利要求1所述的文字輸入方法,其特征在于照片文字識別模塊在識別字符時可分為漢字識別、數(shù)字識別、大小寫英文字母識別、符號識別,用戶可指定其中的一種或多種混合識別。
7.根據(jù)權利要求6所述的文字輸入方法,其特征在于,用戶可在符號識別中添加自定義符號,該自定義符號來自手機其他文本文件或用戶手寫的自創(chuàng)造符號。
8.根據(jù)權利要求1所述的文字輸入方法,其特征在于,在照片的文本字符識別過程中,用戶手工調整過的候選字符,作為下一次識別相似字符時的第一個候選字符。
9.根據(jù)權利要求1所述的文字輸入方法,其特征在于,在手機的拍照鏡頭上增加一個微型放大鏡,該放大鏡可設計成活動式的,在拍攝景物在移開,只有在拍攝文字類照片時將微型放大鏡推到鏡前。
10.根據(jù)權利要求1所述的文字輸入方法,其特征在于所述的微型放大鏡有焦距微調裝置。
全文摘要
本發(fā)明公開了一種用手機拍照方式的文字輸入方法,用普通拍照手機拍攝目標文字照片,再由手機中內置的軟件將照片中的文字識別為文本字符。具體步驟為用手機將目標文字材料拍攝為多張照片;文字識別模塊對每張照片逐個分析,根據(jù)字符輪廓勾畫出照片上的每個字符塊;并分析字符塊中字符的筆劃線條,并從字符集中選擇多個相近的字符,由系統(tǒng)自動選定或用戶人工選擇,如果正確的字符不在候選字列表中,由用戶手工輸入。本發(fā)明在現(xiàn)有的手機的基本硬件基礎上實現(xiàn),只通過開發(fā)特定的軟件就可以實現(xiàn),成本低,但實用價值很高,普通的低象素手機就可以做到,這樣可以將手機的拍照功能充份挖掘出來,也讓用戶隨時隨地用手機收集資料成為可能。
文檔編號H04Q7/32GK101059840SQ20071007453
公開日2007年10月24日 申請日期2007年5月24日 優(yōu)先權日2007年5月24日
發(fā)明者趙忠華 申請人:深圳市杰特電信控股有限公司