一種掃描輸入裝置及掃描輸入方法

文檔序號：6489308閱讀：175來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種掃描輸入裝置及掃描輸入方法
【專利摘要】本發(fā)明公開了一種掃描輸入裝置，包括：圖像傳感器，用于對掃描介質(zhì)上的字符聚焦成像，生成圖像，送入控制器進(jìn)行處理；控制器，用于對所述圖像進(jìn)行處理，并根據(jù)掃描方式或識別結(jié)果判斷所掃描的圖像是字符還是控制命令，若輸入的是控制命令則執(zhí)行該命令，否則保存字符。本發(fā)明通過將字符或符號等信息印于可攜帶的模擬鍵盤上，實現(xiàn)了控制命令和字符無障礙輸入，單詞的隨意查詢，并實現(xiàn)了計算器功能。控制命令和字符無障礙輸入，使設(shè)備擺脫鍵盤，降低成本，縮小體積。同時，與手寫輸入相比，具有較高的輸入效率，節(jié)省了用戶的操作時間。
【專利說明】一種掃描輸入裝置及掃描輸入方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及光學(xué)字符識別領(lǐng)域，具體涉及一種掃描輸入裝置與掃描輸入方法，通過掃描進(jìn)行控制命令和字符的輸入。
【背景技術(shù)】
[0002]在現(xiàn)有的計算機(jī)、便攜設(shè)備中，主要輸入方式為按鍵、觸摸屏、手寫等。按鍵輸入方式與觸摸屏輸入方式需要硬件支持，增加成本的同時，增大設(shè)備的體積。手寫輸入方式受用戶手寫速度限制，導(dǎo)致輸入效率較低。
[0003]光學(xué)字符識別(Optical Character Recognition, OCR)技術(shù)的出現(xiàn),為大規(guī)模文本的快速輸入提供了便利，使得紙質(zhì)文檔轉(zhuǎn)為電子存儲方式成為可能。
[0004]利用軟件識別技術(shù)，專利申請?zhí)枮?00620077723.2的專利文獻(xiàn)公開了一種用文字掃描或攝像技術(shù)直接查閱電子字典。所述電子字典采用數(shù)字轉(zhuǎn)換模式，將內(nèi)置的掃描輸入裝置所拍攝的文字單詞圖像信息，轉(zhuǎn)換成數(shù)字信息，與存儲在字庫里的信息相對照，繼而直接查找出該單詞，并進(jìn)行翻譯。
[0005]專利申請?zhí)枮?00620123568的專利文獻(xiàn)公開了一種便攜式圖像識別裝置。所述裝置的圖像傳感器獲取圖像后，識別轉(zhuǎn)換器截取第一個單詞，通過OCR轉(zhuǎn)換和字典查找，完成一個取詞-識別-翻譯-顯示的過程。
[0006]上述專利文獻(xiàn)公開的方案均實現(xiàn)了單詞的快速錄入，對于印刷有單詞的紙質(zhì)文檔，利用圖像采集設(shè)備采集圖像，并實現(xiàn)了圖像識別查詞技術(shù)。
[0007]然而，雖然專利文獻(xiàn)200620123568與專利文獻(xiàn)200620077723.2所采用的圖像識
別技術(shù)可以實現(xiàn)單詞的快速錄入，但是該技術(shù)只能錄入并查找紙質(zhì)文檔中已有的單詞，對于保存于復(fù)雜介質(zhì)中的單詞，如印在復(fù)雜背景的圖像上的字符或手寫字符，識別率不高。另夕卜，黑板上，廣告牌上或口述字符，無法通過掃描進(jìn)行輸入，無法完成錄入及查詞工作，因此該技術(shù)無法滿足用戶多樣化的錄入需求。
[0008]而且在上述專利文獻(xiàn)中，通過執(zhí)行鍵，確認(rèn)掃描，當(dāng)翻譯結(jié)果錯誤時，用上下鍵選擇一個正確單詞來修正。這些按鍵支持增加設(shè)備體積，使裝置外觀不夠簡潔，操作動作繁瑣，降低用戶友好。

【發(fā)明內(nèi)容】

[0009]本發(fā)明公開了一種掃描輸入裝置，可實現(xiàn)控制命令和字符的掃描輸入，并且實現(xiàn)了字符和控制命令的切換，設(shè)備外觀簡潔，操作更加流暢，增強(qiáng)了用戶友好，該掃描輸入裝置帶有模擬鍵盤，掃描輸入裝置可實現(xiàn)字符的自由輸入，滿足用戶的多樣化需求。
[0010]本發(fā)明提出的掃描輸入裝置包括:圖像傳感器，用于對掃描介質(zhì)上的控制命令或字符聚焦成像，生成圖像，送入控制器進(jìn)行處理，所述掃描介質(zhì)上制作有控制命令和字符的至少一種，所述掃描介質(zhì)上的控制命令或字符由手寫或印刷形成；控制器，用于對所述圖像進(jìn)行處理，并根據(jù)掃描方式或識別結(jié)果判斷所掃描的圖像是字符還是控制命令，若輸入的是控制命令則執(zhí)行該命令，否則保存字符信息。
[0011]其中，該掃描輸入裝置進(jìn)一步包括觸發(fā)裝置、光路裝置和光學(xué)鏡頭，其中觸發(fā)裝置用于當(dāng)掃描輸入裝置接觸掃描介質(zhì)進(jìn)行掃描時，產(chǎn)生工作信號，來控制光路裝置形成光路，光路產(chǎn)生的光經(jīng)掃描介質(zhì)反射后，再經(jīng)光學(xué)鏡頭匯聚到圖像傳感器中用于圖像傳感器成像。
[0012]其中，該控制器進(jìn)一步包括:圖像處理單元，用于對所述圖像進(jìn)行圖像預(yù)處理；識別引擎，對經(jīng)圖像處理單元處理后的圖像進(jìn)行識別，識別結(jié)果為輸入的圖像；判斷單元，用于根據(jù)多幀圖像位移來判斷掃描輸入是控制命令還是字符、或者通過按鍵信號判斷輸入的是控制命令還是字符、或者根據(jù)對掃描輸入圖像的識別結(jié)果判斷輸入的是控制命令還是字符，若判斷輸入的是控制命令，則執(zhí)行此圖像代表的命令，若輸入的是字符則保存識別結(jié)果O
[0013]所述字符包括數(shù)字、字母或文字，所述控制命令包括符號或圖案，控制命令不限于結(jié)束命令、刪除命令、拼首命令、查詞翻譯命令、返回命令、退出命令、語目切換命令、左移命令、上移命令、下移命令和/或右移命令；所述掃描介質(zhì)上制作的控制命令和字符的至少一種形成鍵盤布局。
[0014]本發(fā)明還提出一種掃描輸入方法，包括:步驟1，對掃描介質(zhì)上的控制命令或字符聚焦成像，生成圖像，送入控制器進(jìn)行處理，所述掃描介質(zhì)上制作有控制命令和字符的至少一種，所述掃描介質(zhì)上的控制命令或字符由手寫或印刷形成；步驟2，對所述圖像進(jìn)行處理，并根據(jù)掃描方式或識別結(jié)果判斷所掃描的圖像是字符還是控制命令，若輸入的是控制命令則執(zhí)行該命令，否則保存字符。
[0015]其中步驟I進(jìn)一步包括按照以下三種方式中的一種來輸入字符和控制命令:第一種方式:當(dāng)需要輸入控制命令時，將掃描輸入裝置置于掃描介質(zhì)控制命令上，擠壓觸發(fā)裝置，掃描輸入裝置靜止不動，采集控制命令，當(dāng)需要輸入字符時，將掃描輸入裝置置于掃描介質(zhì)字符上，擠壓觸發(fā)裝置，移動掃描輸入裝置來采集輸入字符；第二種方式:當(dāng)需要輸入控制命令時，通過擠壓觸發(fā)裝置，同時按住掃描輸入裝置的某一按鍵來掃描輸入控制命令，而輸入字符時則不按所述按鍵；第三種方式:當(dāng)需要輸入控制命令時，采集代表控制命令的特定圖像，需要輸入字符時，則采集不同于所述特定圖像的圖像。
[0016]其中步驟2進(jìn)一步包括按照以下三種方式中的一種來判斷輸入的是字符還是控制命令:第一種方式:根據(jù)多幀圖像位移來判斷掃描輸入是控制命令還是字符；第二種方式:通過按鍵信號判斷輸入的是控制命令還是字符；第三種方式:根據(jù)對掃描輸入圖像的識別結(jié)果判斷輸入的是控制命令還是字符，若判斷輸入是控制命令，則執(zhí)行此圖像代表的命令，若輸入是字符則保存識別結(jié)果。
[0017]本發(fā)明還提出另外一種掃描輸入裝置，該裝置包括:掃描單元，用于對掃描介質(zhì)上的控制命令或字符聚焦成像，生成圖像，送入控制器進(jìn)行處理，所述掃描介質(zhì)上制作有控制命令和字符的至少一種，所述掃描介質(zhì)上的控制命令或字符由手寫或印刷形成；圖像處理單元，對所述圖像進(jìn)行處理，并根據(jù)掃描方式或識別結(jié)果判斷所掃描的圖像是字符還是控制命令，若輸入的是控制命令則執(zhí)行該命令，否則保存字符。
[0018]其中所述掃描單元按照以下三種方式中的一種來輸入字符和控制命令:第一種方式:當(dāng)需要輸入控制命令時，將掃描輸入裝置置于掃描介質(zhì)控制命令上，擠壓觸發(fā)裝置，掃描輸入裝置靜止不動，采集控制命令，當(dāng)需要輸入字符時，將掃描輸入裝置置于掃描介質(zhì)字符上，擠壓觸發(fā)裝置，移動掃描輸入裝置來采集輸入字符；第二種方式:當(dāng)需要輸入控制命令時，通過擠壓觸發(fā)裝置，同時按住掃描輸入裝置的一按鍵來掃描輸入控制命令，而輸入字符時則不按所述按鍵；第三種方式:當(dāng)需要輸入控制命令時，采集代表控制命令的特定圖像，需要輸入字符時，則采集不同于所述特定圖像的圖像；
[0019]所述圖像處理單元按照以下三種方式中的一種來判斷輸入的是字符還是控制命令:第一種方式:根據(jù)多幀圖像位移來判斷掃描輸入是控制命令還是字符；第二種方式:通過按鍵信號判斷輸入的是控制命令還是字符；第三種方式:根據(jù)對掃描輸入圖像的識別結(jié)果判斷輸入的是控制命令還是字符，若判斷輸入是控制命令，則執(zhí)行此圖像代表的命令，若輸入是字符則保存識別結(jié)果。
[0020]本發(fā)明通過將字符或符號等信息印于可攜帶掃描介質(zhì)上，在該掃描介質(zhì)上形成模擬鍵盤，或者是在掃描介質(zhì)上書寫需要采集輸入的內(nèi)容，掃描輸入裝置通過掃描需要輸入的字符或控制命令，實現(xiàn)了控制命令和字符的無障礙輸入。借此，實現(xiàn)了單詞的隨意查詢，并實現(xiàn)了計算器功能?？刂泼詈妥址麩o障礙輸入，使設(shè)備擺脫鍵盤，降低成本，外觀簡潔，縮小體積。同時，與手寫輸入相比，具有較高的輸入效率，節(jié)省了用戶的操作時間。
【專利附圖】

【附圖說明】
[0021]圖1為本發(fā)明掃描輸入裝置的結(jié)構(gòu)示意圖；
[0022]圖2a為本發(fā)明的包括字母和符號的模擬鍵盤示意圖；
[0023]圖2b為本發(fā)明的又一包括字母和符號的模擬鍵盤示意圖；
[0024]圖2c為本發(fā)明的再一包括數(shù)字和符號的模擬鍵盤示意圖；
[0025]圖3為本發(fā)明掃描輸入方法流程圖；
[0026]圖4為利用本發(fā)明的掃描輸入方法輸入單詞與詞組的流程圖；
[0027]圖5為利用本發(fā)明的掃描輸入方法進(jìn)行計算的流程圖。
【具體實施方式】
[0028]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白，以下結(jié)合具體實施例，并參照附圖，對本發(fā)明進(jìn)一步詳細(xì)說明。
[0029]本發(fā)明提供一種掃描輸入裝置和掃描輸入方法，可實現(xiàn)控制命令輸入和字符輸入，該掃描輸入裝置可配備有一個模擬鍵盤，并可以不同方式掃描模擬鍵盤上或其他掃描介質(zhì)上的字符或符號，通過圖像識別技術(shù)，實現(xiàn)控制命令輸入和字符輸入的自由切換，從而實現(xiàn)字符的無鍵盤快速輸入，不借助鍵盤與手寫，將各種介質(zhì)中的字符進(jìn)行輸入，實現(xiàn)無障礙輸入。
[0030]圖1為本發(fā)明掃描輸入裝置的功能結(jié)構(gòu)圖。參照圖1，該掃描輸入裝置包括殼體1，控制器2，圖像傳感器3，顯示屏4，光學(xué)鏡頭5、開孔6、觸發(fā)裝置7、光路裝置8。
[0031]控制器2設(shè)置在殼體I內(nèi)部，優(yōu)選為嵌入式處理器，用于控制文字掃描輸入，進(jìn)行文字識別等處理。圖像傳感器3設(shè)置在殼體I內(nèi)部，且與控制器2相連，用于對掃描介質(zhì)上的文字聚焦成像，生成圖像，送入控制器2進(jìn)行圖像增強(qiáng)、灰度處理或圖像二值化等圖像預(yù)處理和識別處理，控制器2的處理結(jié)果顯示在顯示屏4上，圖像傳感器3能夠獲取模擬鍵盤或其它掃描介質(zhì)上的字符或控制命令的圖像。在外殼I與圖像傳感器3對應(yīng)的位置處開設(shè)一開孔6，使得圖像傳感器3透過開孔6獲取模擬鍵盤或掃描資料上的字符。觸發(fā)裝置7用于當(dāng)掃描輸入裝置接觸掃描介質(zhì)進(jìn)行掃描時，產(chǎn)生工作信號，來控制光路裝置8形成光路，光路產(chǎn)生的光經(jīng)掃描介質(zhì)反射后，再經(jīng)光學(xué)鏡頭5直接匯聚到圖像傳感器3中用于圖像傳感器3成像。光路裝置8優(yōu)選使用光路照明LED。
[0032]上述模擬鍵盤可以為任何便于攜帶的可識別介質(zhì)，如本設(shè)備的包裝皮套或紙質(zhì)材料等，具有體積小，方便攜帶的特點。模擬鍵盤上包括但不僅限于數(shù)字、字母、符號，也可以是其它字符、控制命令或其它圖形。另外模擬鍵盤可以為任何便于攜帶的可識別介質(zhì)，如本設(shè)備的包裝皮套或紙質(zhì)材料。上述其他掃描介質(zhì)上的字符或符號可以由用戶在可識別介質(zhì)上書寫形成。
[0033]圖2a為本發(fā)明一種模擬鍵盤的示意圖。如圖2a所示，該模擬鍵盤包括字母和符號。其中“=”約定為結(jié)束符，符號“一”約定為刪除操作，空白圖像約定為空格。
[0034]圖2b為本發(fā)明另外一種模擬鍵盤的示意圖。如圖2b所示，該模擬鍵盤包括字母和符號，其中“掛”約定為拼音命令,“查”約定為查詞翻譯命令，“刪”約定為刪除命令，
Θ約定為返回命令，“一”約定為左移，“丨”約定為上移，“丨”約定下移，“一”約定為右移。
[0035]掃描輸入裝置可按照下面三種方式中的任一種來輸入控制命令和字符:第一種方式:當(dāng)需要輸入控制命令時，將掃描輸入裝置置于模擬鍵盤或其它掃描介質(zhì)控制命令上，通過擠壓觸發(fā)裝置7，打開LED照明，光學(xué)鏡頭5工作，掃描輸入裝置靜止不動，采集控制命令并通過圖像傳感器送入控制器2，掃描輸入裝置當(dāng)需要輸入字符時，將掃描輸入裝置置于模擬鍵盤或其它掃描介質(zhì)上，通過擠壓觸發(fā)裝置7，打開LED照明，光學(xué)鏡頭5工作，移動掃描裝置，采集輸入字符并通過圖像傳感器送入控制器2。第二種方式:當(dāng)需要輸入控制命令時，移動掃描輸入裝置同時按住某按鍵，字符輸入時只移動掃描輸入裝置，不按按鍵。第三種方式:當(dāng)需要輸入控制命令時，采集代表控制命令的特定圖像，需要輸入字符時，則采集不同于所述特定圖像的圖像，在這種方式中，控制命令和字符都是通過移動掃描輸入裝置的方式輸入，或者都是通過點擊的方式輸入。
[0036]控制器2進(jìn)一步包括圖像處理單元201、識別引擎202和判斷單元203。
[0037]圖像處理單元201對所掃描的字符和控制命令進(jìn)行圖像預(yù)處理，包括圖像增強(qiáng)，灰度處理以及二值化處理等。所述圖像增強(qiáng)是通過一定手段對原圖像附加一些信息或變換數(shù)據(jù)，有選擇地突出圖像中感興趣的特征或者抑制(掩蓋)圖像中某些不需要的特征，使圖像與視覺響應(yīng)特性相匹配。所述圖像二值化就是將圖像上的像素點的灰度值設(shè)置為O或1，也就是將整個圖像呈現(xiàn)出明顯的黑白效果。圖像的二值化有利于凸顯的進(jìn)一步處理，使圖像變得簡單，而且數(shù)據(jù)量減小，能凸顯出感興趣的目標(biāo)的輪廓。
[0038]識別引擎202對經(jīng)圖像處理單元201處理后的圖像進(jìn)行識別。識別引擎202進(jìn)一步包括OCR弓丨擎和分類器識別引擎。
[0039]如果掃描輸入裝置是按照上述第一種和第二種方式輸入字符和控制命令，則判斷單元203可直接根據(jù)多幀圖像位移和按鍵信號來判斷輸入的是字符還是控制命令，如果輸入的是字符，則調(diào)用OCR引擎識別，若是控制命令，則直接調(diào)用分類器識別。
[0040]如果掃描輸入裝置是按照上述第三種方式輸入字符和控制命令，則識別引擎202首先調(diào)用OCR引擎進(jìn)行識別，根據(jù)識別距離等識別信息判斷識別結(jié)果可信度，若識別結(jié)果不可信，則判斷單元203判斷輸入的為自定義的控制命令，該自定義的控制命令為用戶自定義的控制命令，如刪等，標(biāo)準(zhǔn)內(nèi)碼庫中沒有這些控制命令，需繼續(xù)進(jìn)行分類器識別，得到控制命令的識別結(jié)果。若OCR識別結(jié)果可信，則分為兩種情況，一為輸入的是字符，二為輸入的是在標(biāo)準(zhǔn)內(nèi)碼庫中可查找到的控制命令，如‘一’等，本發(fā)明對此種控制命令的含義預(yù)先進(jìn)行約定，如果識別為這樣的控制命令，則根據(jù)約定的含義執(zhí)行相應(yīng)的控制命令。
[0041]OCR引擎對二值圖像進(jìn)行識別，主要包括:字符提取，字符特征提取，特征比較，識別結(jié)果后處理。所述字符提取是指提取圖像中間字符所在區(qū)域，過濾掉該字符上下存在的其它黑像素、空白行與該字符左右的空白列。所述特征提取與特征比較是指計算上述字符的特征，與字庫中的特征模板進(jìn)行比較，得到特征最相近字符作為識別結(jié)果。所述識別結(jié)果后處理是指根據(jù)使用環(huán)境對上述識別結(jié)果進(jìn)行處理，修改不合理的結(jié)果。
[0042]分類器識別是指將控制命令圖像的特征作為分類依據(jù)，對應(yīng)不同的識別分類器，需要的圖像特征也不同，識別分類器利用現(xiàn)有技術(shù)比較此圖像特征與分類器識別引擎中預(yù)先保存的各控制命令標(biāo)準(zhǔn)模板的特征之間的距離，選擇特征與此圖像特征相距最近的標(biāo)準(zhǔn)模板對應(yīng)的控制命令作為此圖像的識別結(jié)果。
[0043]圖3為本發(fā)明掃描輸入方法的流程圖。參照圖3，該方法包括了以下各步驟:
[0044]步驟1，利用掃描輸入裝置獲取各種介質(zhì)或模擬鍵盤上的字符或控制命令的圖像。在該步驟，按照以下三種方式中的一種來輸入字符和控制命令:
[0045]第一種方式:當(dāng)需要輸入控制命令時，將掃描輸入裝置置于掃描介質(zhì)控制命令上，擠壓觸發(fā)裝置，掃描輸入裝置靜止不動，采集控制命令，當(dāng)需要輸入字符時，將掃描輸入裝置置于掃描介質(zhì)字符上，擠壓觸發(fā)裝置，移動掃描輸入裝置來采集輸入字符。
[0046]第二種方式:當(dāng)需要輸入控制命令時，通過擠壓觸發(fā)裝置，同時按住掃描輸入裝置的一按鍵來掃描輸入控制命令，而輸入字符時則不按所述按鍵。
[0047]第三種方式:當(dāng)需要輸入控制命令時，采集代表控制命令的特定圖像，需要輸入字符時，則采集不同于所述特定圖像的圖像，在這種方式中，控制命令和字符都是通過移動掃描輸入裝置的方式輸入，或者都是通過點擊的方式輸入。
[0048]所采集輸入的字符或控制命令通過圖像傳感器3送入控制器2的處理單元201。
[0049]步驟2，利用控制器2中的圖像處理單元201對所掃描的字符和控制命令進(jìn)行圖像預(yù)處理。所述圖像預(yù)處理包括圖像增強(qiáng)、灰度處理或二值化等。
[0050]所述圖像增強(qiáng)是通過一定手段對原圖像附加一些信息或變換數(shù)據(jù)，有選擇地突出圖像中感興趣的特征或者抑制(掩蓋)圖像中某些不需要的特征，使圖像與視覺響應(yīng)特性相匹配。
[0051]所述圖像灰度處理是對灰度圖像進(jìn)行分析和處理?；叶葓D像反映了整幅圖像的亮度等級的分布，每個像素點的變化范圍為0-255?；叶忍幚戆苫叶戎狈綀D、灰度修正、提取圖像特征、圖像銳化等處理。
[0052]所述圖像二值化就是將圖像上的像素點的灰度值設(shè)置為O或1，也就是將整個圖像呈現(xiàn)出明顯的黑白效果。圖像的二值化有利于凸顯的進(jìn)一步處理，使圖像變得簡單，而且數(shù)據(jù)量減小，能凸顯出感興趣的目標(biāo)的輪廓。
[0053]步驟3，利用控制器中的識別引擎202對上述處理后的圖像進(jìn)行識別。[0054]識別引擎202進(jìn)一步包括OCR引擎和分類器識別裝置。如果在步驟I選擇第一種和第二種方式來輸入字符和控制命令，則判斷單元203可直接根據(jù)多幀圖像位移和按鍵信號來判斷輸入的是字符還是控制命令，如果輸入的是字符，則調(diào)用OCR引擎識別，若是控制命令，則直接調(diào)用分類器識別。
[0055]但如果在步驟I中選擇第三種輸入方式進(jìn)行輸入字符和控制命令，則在該步驟3中，首先用OCR技術(shù)識別后，根據(jù)識別距離等識別信息判斷識別結(jié)果可信度，若識別結(jié)果不可信，則輸入的為自定義的控制命令，該自定義的控制命令為用戶自定義的控制命令，如刪等，標(biāo)準(zhǔn)內(nèi)碼庫中沒有這些控制命令，需繼續(xù)進(jìn)行分類器識別，得到控制命令的識別結(jié)果。若OCR識別結(jié)果可信，則分為兩種情況，一為輸入的是字符，二為輸入的是在標(biāo)準(zhǔn)內(nèi)碼庫中可查找到的控制命令，如‘一’等，本發(fā)明對此種控制命令的含義預(yù)先進(jìn)行約定，如果識別為這樣的控制命令，則根據(jù)約定的含義執(zhí)行相應(yīng)的控制命令。
[0056]OCR引擎對二值圖像進(jìn)行識別，主要包括:字符提取，字符特征提取，特征比較，識別結(jié)果后處理。所述字符提取是指提取圖像中間字符所在區(qū)域，過濾掉該字符上下存在的其它黑像素、空白行與該字符左右的空白列。所述特征提取與特征比較是指計算上述字符的特征，與字庫中的特征模板進(jìn)行比較，得到特征最相近字符作為識別結(jié)果。所述識別結(jié)果后處理是指根據(jù)使用環(huán)境對上述識別結(jié)果進(jìn)行處理，修改不合理的結(jié)果。
[0057]分類器識別是指將控制命令圖像的特征作為分類依據(jù)，對應(yīng)不同的識別分類器，需要的圖像特征也不同，識別分類器利用現(xiàn)有技術(shù)比較此圖像特征與識別引擎中預(yù)先保存的各控制命令標(biāo)準(zhǔn)模板的特征之間的距離，選擇特征與此圖像特征相距最近的標(biāo)準(zhǔn)模板對應(yīng)的控制命令作為此圖像的識別結(jié)果。
[0058]步驟4，根據(jù)步驟3中的識別結(jié)果執(zhí)行相應(yīng)的動作，若輸入的是控制命令則執(zhí)行該命令，否則保存字符信息。
[0059]下面通過舉例的方式來進(jìn)一步說明本發(fā)明利用模擬鍵盤進(jìn)行掃描輸入的方法，在下面的例子中，掃描輸入裝置以掃描筆為例來進(jìn)行說明。
[0060]〈例1>
[0061]在該例子中采用上述步驟I中的第一種方式進(jìn)行字符和控制命令的輸入。字符輸入時移動掃描筆；控制命令輸入時，掃描筆置于控制命令上方，筆靜止，采集圖像。控制器也由此判斷輸入的是字符還是控制命令。即如步驟I的第一種方式，掃描筆移動掃描時，輸入的為字符，掃描筆靜止采集圖像時，輸入的為控制命令。如果輸入的是控制命令，控制器調(diào)用分類器識別，如果輸入的是字符，則控制器調(diào)用OCR引擎。例如要查詢單詞BALL，則如圖4所示，執(zhí)行以下步驟:
[0062]步驟1，移動掃描筆掃描資料中單詞“BALL”。因為要輸入字符“BALL”，所以將掃描筆置于掃描資料上方，移動掃描筆，采集幀圖像序列，然后將圖像幀序列拼接成一幅全景圖像。
[0063]步驟2，對全景圖像進(jìn)行圖像處理及及識別。其中圖像處理包含圖像增強(qiáng)和圖像二值化處理。圖像增強(qiáng)采用中值濾波法來減弱噪聲。中值濾波法是一種非線性平滑技術(shù)，它將每一像素點的灰度值設(shè)置為該點某鄰域窗口內(nèi)的所有像素點灰度值的中值。圖像二值化采用OtSU方法，即最大類間方差法。此方法按圖像的灰度特性，將圖像分成背景和前景兩部分。背景和前景之間的類間方差越大，說明構(gòu)成圖像的兩部分的差別越大，當(dāng)部分前景錯分為背景或背景錯分為前景都會導(dǎo)致兩部分差別變小。因此，是類間方差最大的分割意味著錯分概率最小。
[0064]由于掃描筆是通過移動的方式來進(jìn)行掃描輸入的，因此控制器可根據(jù)幀圖像位移直接判斷出所輸入的是字符，因此調(diào)用OCR引擎對輸入的字符進(jìn)行識別，OCR技術(shù)識別處理過程為，首先進(jìn)行字符切分，得到每一個字符，然后對每一個字符進(jìn)行識別。字符識別過程，首先提取各字符中間字符所在區(qū)域，過濾到字符上下存在的背景像素，然后提取字符特征并與字符庫中模板特征進(jìn)行比較，找到字庫中特征最近的字符作為識別結(jié)果，最后根據(jù)使用環(huán)境對識別結(jié)果進(jìn)行調(diào)整。
[0065]假設(shè)掃描輸入裝置的識別結(jié)果為“BALI”，最后一個字符識別錯誤，可以執(zhí)行步驟3進(jìn)行修改，也可以執(zhí)行步驟4直接查詞，因為詞典會給出最相近的單詞列表，通過上下選擇得到正確結(jié)果。
[0066]步驟3，修改單詞最后一個字符，然后查詞，步驟如下:
[0067]步驟3.1，顯示屏中光標(biāo)此時位于字符“I”處，將掃描筆置于模擬鍵盤“⑩上方，筆靜止，采集圖像并進(jìn)行圖像處理及分類器識別處理?？刂破鳈z測到此次輸入為K W叩-令，執(zhí)行此輸入圖像代表的命令，即刪除字符“I”，在該步驟，由于掃描筆處于靜止?fàn)顟B(tài)采集圖像，因此判斷為控制命令，所以針對控制命令來調(diào)用分類器識別。
[0068]步驟3.2，將掃描筆置于模擬鍵盤“L”上方，移動掃描筆掃描圖像并進(jìn)行圖像處理及OCR識別處理?？刂破鳈z測到此次輸入為字符，保存識別結(jié)果“L”。此時單詞“BALL”拼寫正確。
[0069]步驟3.3，將掃描筆放在“ ? ”上方，筆靜止，采集圖像并進(jìn)行圖像處理及分類器識別處理。控制器檢測到此次輸入為控制命令，調(diào)用分類器識別，根據(jù)識別結(jié)果執(zhí)行此輸入圖像代表的命令，進(jìn)行查詞，查詞結(jié)果顯示在顯示屏上。
[0070]步驟4，掃描筆放在“ @ ”上方，筆靜止，采集圖像并進(jìn)行圖像處理及分類器識別處理?？刂破鳈z測到此次輸入為控制命令，執(zhí)行此輸入圖像代表的命令，進(jìn)行查詞，單詞“BALI”未查到，詞典給出最相近的單詞列表:BALL，BALT。
[0071]步驟5，將掃描筆放在“丨”上方，筆靜止，采集圖像并進(jìn)行圖像處理及分類器識別處理?？刂破鳈z測到此次輸入為控制命令，執(zhí)行此輸入圖像代表的命令，向下選擇單詞“BALL”，并給出翻譯結(jié)果顯示在顯示屏上。
[0072]< 例 2>
[0073]在該例子中采用步驟I中的第二種方式進(jìn)行字符和控制命令的輸入。
[0074]根據(jù)步驟I中的第二種方式輸入時，掃描筆移動同時檢測到按鍵按壓信號時，表示輸入的是控制命令；掃描筆移動但沒有按鍵按壓信號時，表示輸入的是字符。因此，控制命令的輸入方式為移動掃描筆的同時按住筆外殼上某按鍵，采集圖像；字符輸入時，只移動掃描筆，不按按鍵?？刂破?可根據(jù)按鍵信號直接判斷輸入的是控制命令還是字符，如果是控制命令，則調(diào)用分類器識別，如果輸入的是字符，則調(diào)用OCR引擎。例如要查詢單詞“l(fā)ovely” 及 “l(fā)ove”，步驟如下:
[0075]步驟1，移動掃描筆掃描資料中單詞“l(fā)ovely”，掃描筆外殼上設(shè)置的功能健沒有被按壓時，表示掃描輸入字符。掃描過程與〈例1>中的掃描過程相同。掃描筆外殼上設(shè)置的功能鍵可以判斷是否是輸入控制命令專用的按鍵，也可以是外殼上已有按鍵的復(fù)用。[0076]步驟2，對全景圖像進(jìn)行圖像處理及OCR技術(shù)識別處理。圖像預(yù)處理及字符識別處理同〈例1>中相同
[0077]，待識別完成后保存識別結(jié)果“l(fā)ovely”。
[0078]步驟3，掃描筆放在“g”上方，移動掃描筆同時拇指按住某按鍵，采集圖像并進(jìn)行圖像處理及分類器識別處理。控制器2檢測到此次輸入為控制命令，執(zhí)行此輸入圖像代表的命令，進(jìn)行查詞，查詢結(jié)果顯示在顯示屏上。
[0079]步驟5，顯示屏中光標(biāo)此時位于字符“y”處，將掃描筆置于模擬鍵盤“刪”上方，移動掃描筆同時拇指按住某按鍵，采集圖像并進(jìn)行圖像處理及分類器識別處理。控制器檢測到此次輸入為控制命令，執(zhí)行此輸入圖像代表的命令，刪除字符“y”。
[0080]步驟6，操作同步驟5，刪除字符“ I ”。
[0081 ] 步驟7，操作同步驟4，顯示屏上顯示“ love”查詞結(jié)果。
[0082]〈例3>
[0083]在該例子中采用步驟I中的第三種方式進(jìn)行字符和控制命令的輸入。
[0084]掃描筆移動掃描字符或控制命令，控制器首先用OCR技術(shù)識別后，根據(jù)識別距離等識別信息判斷識別結(jié)果可信度，若識別結(jié)果不可信，則輸入的為自定義的控制命令，需繼續(xù)進(jìn)行分類器識別，得到控制命令的識別結(jié)果。若OCR識別結(jié)果可信，則分為兩種情況，一為輸入的是字符，二為輸入的是在標(biāo)準(zhǔn)內(nèi)碼庫中可查找到的控制命令，如果識別為控制命令，則根據(jù)約定的含義執(zhí)行相應(yīng)的控制命令。
[0085]例如通過掃描筆來查詢詞組look at,具體步驟如下:
[0086]步驟I，將掃描筆置于模擬鍵盤中字母“ I ”上方，攝像頭采集字母“ I ”的圖像并通過圖像傳感器傳送到處理單元進(jìn)行圖像預(yù)處理，將圖像處理結(jié)果送到OCR識別裝置對此圖像進(jìn)行處理與識別，并將識別結(jié)果保存。
[0087]在該步驟，模擬鍵盤采用圖2a所示的鍵盤。圖像預(yù)處理包含圖像增強(qiáng)和圖像二值化處理，圖像二值化采用OtSU方法，即最大類間方差法。此方法按圖像的灰度特性，將圖像分成背景和前景兩部分。背景和前景之間的類間方差越大，說明構(gòu)成圖像的兩部分的差別越大，當(dāng)部分前景錯分為背景或背景錯分為前景都會導(dǎo)致兩部分差別變小。因此，是類間方差最大的分割意味著錯分概率最小。
[0088]圖像增強(qiáng)采用中值濾波法來減弱噪聲。中值濾波法是一種非線性平滑技術(shù)，它將每一像素點的灰度值設(shè)置為該點某鄰域窗口內(nèi)的所有像素點灰度值的中值。
[0089]步驟2，依照步驟I的方式分別采集并輸入“O” “O” “k”。
[0090]步驟3，輸入空格。預(yù)先約定輸入空白圖像時為空格，將掃描筆置于模擬鍵盤空白處，采集空白圖像，此字符作為空格保存。
[0091]步驟4，然后按照步驟I的方式采集相應(yīng)圖像輸入“a” “t”。
[0092]步驟5，輸入結(jié)束字符。約定“=”作為結(jié)束符，將掃描筆置于模擬鍵盤“=”字符上方，取字符并進(jìn)行圖像處理和光學(xué)字符識別處理，識別結(jié)果判定為結(jié)束符，則輸入結(jié)束。
[0093]步驟6，查詞并將翻譯結(jié)果顯示在顯示屏上。
[0094]其中結(jié)束字符不被保存，將已有的輸入字符組成一個完成的單詞或詞組，查找詞典進(jìn)行翻譯。從而得到詞組look at的解釋等信息，最后將詞組和解釋信息顯示在顯示屏上。[0095]若字符輸入錯誤，需要清除，可將掃描筆置于模擬鍵盤中“一”上方，輸入“一”字符，進(jìn)行字符刪除。
[0096]< 例 4>
[0097]本發(fā)明不僅可用于單詞查詢，還可實現(xiàn)計算器功能，如圖5的流程圖所示。
[0098]圖2c為印有數(shù)字與計算符號的模擬鍵盤。計算符號不限于模擬鍵盤上所印字符，也可包含其它復(fù)雜運算符號。例如需要計算(39+47)*62。將掃描輸入裝置依次置于模擬鍵盤中“(”“3” “9”“ + ”……等字符上方，采集其圖像并進(jìn)行處理與識別。作為算式，最后輸入結(jié)束標(biāo)記“ = ”，以確定輸入完成。最后進(jìn)行計算，其結(jié)果為5332，將結(jié)果顯示在顯示屏上。其中處理及識別方法與〈例1>中所用方法相同。
[0099]以上所述的具體實施例，對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明，所應(yīng)理解的是，以上所述僅為本發(fā)明的具體實施例而已，并不用于限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種掃描輸入裝置，包括: 圖像傳感器，用于對掃描介質(zhì)上的控制命令或字符聚焦成像，生成圖像，送入控制器進(jìn)行處理，所述掃描介質(zhì)上制作有控制命令和字符的至少一種，所述掃描介質(zhì)上的控制命令或字符由手寫或印刷形成；控制器，用于對所述圖像進(jìn)行處理，根據(jù)掃描方式或識別結(jié)果判斷所掃描的圖像是字符還是控制命令，若輸入的是控制命令則執(zhí)行該命令，否則保存字符。
2.根據(jù)權(quán)利要求1所述的裝置，其特征在于，該掃描輸入裝置進(jìn)一步包括觸發(fā)裝置、光路裝置和光學(xué)鏡頭，其中觸發(fā)裝置用于當(dāng)掃描輸入裝置接觸掃描介質(zhì)進(jìn)行掃描時，產(chǎn)生工作信號，來控制光路裝置形成光路，光路產(chǎn)生的光經(jīng)掃描介質(zhì)反射后，再經(jīng)光學(xué)鏡頭匯聚到圖像傳感器中用于圖像傳感器成像。
3.根據(jù)權(quán)利要求2所述的裝置，其特征在于，控制器進(jìn)一步包括: 圖像處理單元，用于對所述圖像進(jìn)行圖像預(yù)處理；識別引擎，對經(jīng)圖像處理單元處理后的圖像進(jìn)行識別，識別結(jié)果為輸入的字符或控制命令; 判斷單元，用于根據(jù)多幀圖像位移來判斷掃描輸入的是控制命令還是字符、或者通過按鍵信號判斷輸入的是控制命令還是字符、或者根據(jù)對掃描輸入圖像的識別結(jié)果判斷輸入的是控制命令還是字符，若判斷輸入的是控制命令，則執(zhí)行此圖像代表的命令，若輸入的是字符則保存識別結(jié)果。
4.根據(jù)權(quán)利要求3所述的裝置，其特征在于，所述字符包括數(shù)字、字母或文字，所述控制命令包括符號或圖案，并且不限于結(jié)束命令、刪除命令、拼音命令、查詞翻譯命令、返回命令、退出命令、左移命令、上移命令、下移命令和/或右移命令；所述掃描介質(zhì)上制作的控制命令和字符的至少一種形成鍵盤布局。
5.—種掃描輸入方法,該方法包括步驟: 步驟I，對掃描介質(zhì)上的控制命令或字符聚焦成像，生成圖像，送入控制器進(jìn)行處理，所述掃描介質(zhì)上制作有控制命令和字符的至少一種，所述掃描介質(zhì)上的控制命令或字符由手寫或印刷形成；步驟2，對所述圖像進(jìn)行處理，并根據(jù)掃描方式或識別結(jié)果判斷所掃描的圖像是字符還是控制命令，若輸入的是控制命令則執(zhí)行該命令，否則保存字符。
6.根據(jù)權(quán)利要求5所述的方法，其特征在于，步驟I進(jìn)一步包括按照以下三種方式中的一種來輸入字符和控制命令:第一種方式:當(dāng)需要輸入控制命令時，將掃描輸入裝置置于掃描介質(zhì)控制命令上，擠壓觸發(fā)裝置，掃描輸入裝置靜止不動，采集控制命令，當(dāng)需要輸入字符時，將掃描輸入裝置置于掃描介質(zhì)字符上，擠壓觸發(fā)裝置，移動掃描輸入裝置來采集輸入字符；第二種方式:當(dāng)需要輸入控制命令時，通過擠壓觸發(fā)裝置，同時按住掃描輸入裝置的一按鍵來掃描輸入控制命令，而輸入字符時則不按所述按鍵；第三種方式:當(dāng)需要輸入控制命令時，采集代表控制命令的特定圖像，需要輸入字符時，則采集不同于所述特定圖像的圖像；步驟2進(jìn)一步包括按照以下三種方式中的一種來判斷輸入的是字符還是控制命令:第一種方式:根據(jù)多幀圖像位移來判斷掃描輸入是控制命令還是字符；第二種方式:通過按鍵信號判斷輸入的是控制命令還是字符；第三種方式:根據(jù)對掃描輸入圖像的識別結(jié)果判斷輸入的是控制命令還是字符，若判斷輸入的是控制命令，則執(zhí)行此圖像代表的命令，若輸入的是字符則保存識別結(jié)果。
7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述字符包括數(shù)字、字母或文字，所述控制命令包括符號或圖案，并且不限于結(jié)束命令、刪除命令、拼音命令、查詞翻譯命令、返回命令、退出命令、左移命令、上移命令、下移命令和/或右移命令；所述掃描介質(zhì)上制作的控制命令和字符的至少一種形成鍵盤布局。
8.一種掃描輸入裝置，該裝置包括: 掃描單元，用于對掃描介質(zhì)上的控制命令或字符聚焦成像，生成圖像，送入控制器進(jìn)行處理，所述掃描介質(zhì)上制作有控制命令和字符的至少一種，所述掃描介質(zhì)上的控制命令或字符由手寫或印刷形成；圖像處理單元，對所述圖像進(jìn)行處理，并根據(jù)掃描方式或識別結(jié)果判斷所掃描的圖像是字符還是控制命令，若輸入的是控制命令則執(zhí)行該命令，否則保存字符信息。
9.根據(jù)權(quán)利要求8所述的裝置，其特征在于，所述掃描單元按照以下三種方式中的一種來輸入字符和控制命令:第一種方式:當(dāng)需要輸入控制命令時，將掃描輸入裝置置于掃描介質(zhì)控制命令上，擠壓觸發(fā)裝置，掃描輸入裝置靜止不動，采集控制命令，當(dāng)需要輸入字符時，將掃描輸入裝置置于掃描介質(zhì)字符上，擠壓觸發(fā)裝置，移動掃描輸入裝置來采集輸入字符；第二種方式:當(dāng)需要輸入控制命令時，通過擠壓觸發(fā)裝置，同時按住掃描輸入裝置的一按鍵來掃描輸入控制命令，而輸入字符時則不按所述按鍵；第三種方式:當(dāng)需要輸入控制命令時，采集代表控制命令的特定圖像，需要輸入字符時，則采集不同于所述特定圖像的圖像；所述圖像處理單元按照以下三種方式中的一種來判斷輸入的是字符還是控制命令:第一種方式:根據(jù)多幀圖像位移來判斷掃描輸入是控制命令還是字符；第二種方式:通過按鍵信號判斷輸入的是控制命令還是字符；第三種方式:根據(jù)對掃描輸入圖像的識別結(jié)果判斷輸入的是控制命令還是字符，若判斷輸入是控制命令，則執(zhí)行此圖像代表的命令，若輸入是字符則保存識別結(jié)果。
10.根據(jù)權(quán)利要求9所述的裝置，其特征在于，所述字符包括數(shù)字、字母或文字，所述控制命令包括符號或圖案，并且不限于結(jié)束命令、刪除命令、拼音命令、查詞翻譯命令、返回命令、退出命令、語言切換命令、左移命令、上移命令、下移命令和/或右移命令；所述掃描介質(zhì)上制作的控制命令和字符的至少一種形成鍵盤布局。
【文檔編號】G06K9/20GK103699890SQ201210365732
【公開日】2014年4月2日申請日期:2012年9月27日優(yōu)先權(quán)日:2012年9月27日
【發(fā)明者】劉迎建, 劉正珍, 張娜, 李玉梅, 萬鑫, 閆江震申請人:漢王科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉迎建;劉正珍;張娜;李玉梅;萬鑫;閆江震;
技術(shù)所有人：漢王科技股份有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

微型自動掃描滅火裝置相關(guān)技術(shù)

自動掃描射水滅火裝置相關(guān)技術(shù)

掃描裝置相關(guān)技術(shù)

無痛胃腸掃描相關(guān)技術(shù)

掃描隧道顯微鏡相關(guān)技術(shù)

掃描儀鎖定裝置關(guān)閉相關(guān)技術(shù)

掃描器鎖定裝置關(guān)閉相關(guān)技術(shù)

掃描儀固定裝置關(guān)閉相關(guān)技術(shù)

掃描裝置打開或卡紙相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種掃描輸入裝置及掃描輸入方法