一種信息輸入方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及到智能輸入技術領域,特別涉及到一種信息輸入方法及裝置。
【背景技術】
[0002]移動終端(如手機)具有大容量存儲空間、強大的處理能力,人們可通過該移動終端打電話、發(fā)送短信、收發(fā)郵件、上網(wǎng)瀏覽等,當人們需要輸入文字信息時,一般都是通過拼音輸入法、五筆輸入法、手寫輸入法等類型。當我們需要將大量紙質(zhì)文檔中的文字錄入到移動終端時,如果通過上述幾種輸入法進行錄入,費時又費力。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的主要目的為提供一種信息輸入方法及裝置,旨在解決現(xiàn)有技術中在移動終端錄入信息的費時費力的缺陷,實現(xiàn)信息的快速輸入。
[0004]本發(fā)明提供一種信息輸入方法,該方法包括:
[0005]通過圖像獲取模塊獲取圖像;
[0006]對獲取的圖像中的字符進行切割處理;
[0007]對各個切割字符進行文字識別,以識別出各個切割字符對應的文字;
[0008]將識別的各個文字按對應的切割字符在所述圖像的字符版面中的位置,進行文字排版;
[0009]將排版后的文字按文字排版格式輸出到文本輸入框。
[0010]優(yōu)選地,所述對獲取的圖像中的字符進行切割處理的步驟包括:
[0011]對獲取的圖像中的所有字符進行切割處理;或者
[0012]提供選擇操作界面,供用戶在獲取的圖像中選擇待識別的圖像區(qū)域,鎖定用戶基于所述操作界面選擇的圖像區(qū)域,并對選擇的圖像區(qū)域中的字符進行切割處理。
[0013]優(yōu)選地,所述對獲取的圖像中的字符進行切割處理的步驟包括:
[0014]對獲取的圖像進行二值化、傾斜校正、分段落分行及字符切割。
[0015]優(yōu)選地,所述鎖定用戶基于所述操作界面選擇的圖像區(qū)域的步驟包括:
[0016]A、獲取用戶在所述操作界面的第一選擇手勢,所述第一選擇手勢為一條帶有預設寬度的直線,根據(jù)該第一選擇手勢將該帶有預設寬度的直線覆蓋的圖像區(qū)域鎖定為待識別的圖像區(qū)域;及/或
[0017]B、獲取用戶在所述操作界面的第二選擇手勢,所述第二選擇手勢為兩條連續(xù)的直線,根據(jù)該第二選擇手勢中的兩條連續(xù)的直線鎖定一個平行四邊形區(qū)域作為待識別的圖像區(qū)域。
[0018]優(yōu)選地,所述將識別的各個文字按對應的切割字符在所述圖像的字符版面中的位置,進行文字排版;的步驟之后,該方法還包括:
[0019]將排版后的文字按文字排版格式傳送給終端。
[0020]本發(fā)明還提供一種信息輸入裝置,該裝置包括:
[0021]圖像獲取模塊,用于獲取圖像;
[0022]切割處理模塊,用于對獲取的圖像中的字符進行切割處理;
[0023]OCR識別模塊,用于對各個切割字符進行文字識別,以識別出各個切割字符對應的文字;
[0024]排版模塊,用于將識別的各個文字按對應的切割字符在所述圖像的字符版面中的位置,進行文字排版;
[0025]輸入模塊,用于將排版后的文字按文字排版格式輸出到文本輸入框。
[0026]優(yōu)選地,所述切割處理模塊包括第一子切割處理單元或者第二子切割處理單元;
[0027]所述第一子切割處理單元,用于對獲取的圖像中的所有字符進行切割處理;
[0028]所述第二子切割處理單元,用于提供選擇操作界面,供用戶在獲取的圖像中選擇待識別的圖像區(qū)域,鎖定用戶基于所述操作界面選擇的圖像區(qū)域,并對選擇的圖像區(qū)域中的字符進行切割處理。
[0029]優(yōu)選地,所述切割處理模塊還用于對獲取的圖像進行二值化、傾斜校正、分段落分行及字符切割。
[0030]優(yōu)選地,所述第二子切割處理單元包括:
[0031]提供單元,用于提供選擇操作界面,供用戶在獲取的圖像中選擇待識別的圖像區(qū)域;
[0032]鎖定單元,用于獲取用戶在所述操作界面的第一選擇手勢,所述第一選擇手勢為一條帶有預設寬度的直線,根據(jù)該第一選擇手勢將該帶有預設寬度的直線覆蓋的圖像區(qū)域鎖定為待識別的圖像區(qū)域;及/或用于獲取用戶在所述操作界面的第二選擇手勢,所述第二選擇手勢為兩條連續(xù)的直線,根據(jù)該第二選擇手勢中的兩條連續(xù)的直線鎖定一個平行四邊形區(qū)域作為待識別的圖像區(qū)域;
[0033]處理單元,用于對鎖定單元鎖定的待識別的圖像區(qū)域進行切割處理。
[0034]優(yōu)選地,所述裝置還包括與所述排版模塊連接的輸出模塊,所述輸出模塊用于將排版后的文字按文字排版格式傳送給終端。
[0035]采用本發(fā)明實施例,可通過圖像獲取模塊獲取圖像;對獲取的圖像中的字符進行切割處理;對各個切割字符進行文字識別,以識別出各個切割字符對應的文字;將識別的各個文字按對應的切割字符在所述圖像的字符版面中的位置,進行文字排版;將排版后的文字按文字排版格式輸出到文本輸入框??煞奖愕膶崿F(xiàn)信息輸入,省時省力,提高信息輸入效率。
【附圖說明】
[0036]圖1為本發(fā)明的信息輸入方法的第一實施例流程示意圖;
[0037]圖2為本發(fā)明的信息輸入方法的第一實施例中的待識別區(qū)域的一示意圖;
[0038]圖3為本發(fā)明的信息輸入方法的第一實施例中的待識別區(qū)域的又一示意圖;
[0039]圖4為本發(fā)明的信息輸入方法的第二實施例流程示意圖;
[0040]圖5為本發(fā)明的信息輸入裝置的第一實施例結(jié)構框圖;
[0041]圖6為本發(fā)明的信息輸入裝置的第二實施例結(jié)構框圖。
[0042]本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。
【具體實施方式】
[0043]應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0044]參照圖1,圖1為本發(fā)明的信息輸入方法的第一實施例流程示意圖,該方法包括:
[0045]S10、通過圖像獲取模塊獲取圖像。
[0046]該圖像獲取模塊可以是攝像頭,該攝像頭可以是數(shù)字攝像頭和模擬攝像頭。當用戶需要將外部的非計算機可識別信息變成計算機可識別信息時(如將紙質(zhì)文檔中的文字轉(zhuǎn)換成計算機可識別信息),通過圖像獲取模塊獲取非計算機可識別信息的圖像,如通過攝像頭拍攝需要輸入信息所在紙的圖像。在該步驟中,還可對獲取的圖像進行圖像清晰度判斷,如,用戶通過該圖像獲取模塊獲取圖像時,由于手抖動或被拍攝物體抖動,導致拍攝的圖像很模糊,達不到在后面步驟的文字識別要求;因此可先對獲取的圖像進行圖像清晰度判斷,當判斷結(jié)果為圖像的清晰度沒達到預設閥值時,則提醒用戶重新通過圖像獲取模塊獲取圖像。在對獲取的圖形信息進行圖像清晰度判斷時,可利用圖像的平均邊緣強度作為檢測值,當平均邊緣強度小于預設邊緣強度閥值時,則認為拍攝的圖像模糊,當平均邊緣強度大于或等于預設邊緣強度閥值時,則認為拍攝的圖像清楚。該平均邊緣強度是指由邊緣算法(如Sobel算法等)獲得。
[0047]S20、對獲取的圖像中的字符進行切割處理。
[0048]在該步驟S20中,對獲取的圖像中的字符進行切割處理,具體的,可先對獲取的圖像進行前景色噪聲過濾及背景色噪聲過濾,然后對噪聲過濾后的圖像進行二值化、傾斜校正、分段落分行、字符切割。其中,二值化就是將圖像上的像素點的灰度值設置為O或255,也就是將整個圖像呈現(xiàn)出明顯的只有黑和白的視覺效果;傾斜校正,是對圖像中的傾斜內(nèi)容進行校正(在通過圖像獲取模塊獲取圖像時,當被拍攝物傾斜放置時,將使得獲得的內(nèi)容傾斜),可預先設置一個水平基準線,再判斷該圖像邊緣(可通過圖像邊緣檢測檢測出圖像邊緣,如通過以下步驟檢測圖像邊緣:1、濾波:邊緣檢測主要基于導數(shù)計算,但受噪聲影響,但濾波器在降低噪聲的同時也導致邊緣強度的損失;2、增強:增強算法將領域中灰度有顯著變化的點突出顯示。一般通過計算梯度幅值完成;3、檢測:但在有些圖像中梯度幅值較大的并不是邊緣點;4、定位:精確確定邊緣的位置。)與該水平基準線的夾角值,當該夾角值大于預設的傾斜角度值時,認為該圖像傾斜,則對該圖像進行傾斜校正,以使得該圖像邊緣與水平基準線的夾角值小于或等于預設的傾斜角度值,當該夾角值小于或等于預設的傾斜角度值時,認為該圖像不傾斜,不需要進行傾斜校正;分段落分行,對圖像中的文檔圖片先進行分段落在分行即進行版面分析。
[0049]S30、對各個切割字符進行文字識別,以識別出各個切割字符對應的文字。
[0050]在該步驟S30中,對各個切割字符進行文字識別,以識別出各個切割字符對應的文字,具體的,可通過預設的字符庫與算法對各個切割字符進行識別,以識別出各個切割字符對應的文字。在該步驟中,可采用微軟公司提供的OCR引擎進行文字識別,它是一個公開的編程接口。