專利名稱:一種圖像處理方法和一種圖像處理裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像處理方法和一種圖像處理裝置,尤其涉及一種通過(guò)它可識(shí)別和處理輸入圖案或者通過(guò)它可在識(shí)別處理之前進(jìn)行圖像預(yù)處理的圖像處理方法及其圖像處理裝置。
按照常規(guī),一種字符識(shí)別裝置,特別是在線手寫字符識(shí)別裝置要把箋薄上的手寫字符同機(jī)內(nèi)識(shí)別字典所保存的字符相比較,并按照識(shí)別處理的結(jié)果,輸出一個(gè)被定為最像輸入字符的字符代碼。
但是,使用當(dāng)前的字符識(shí)別技術(shù),對(duì)用戶輸入的字符并不能總是正確地辨認(rèn)出來(lái)。
因而,有一個(gè)建議是,不只使用預(yù)先儲(chǔ)存在識(shí)別裝置中的標(biāo)準(zhǔn)識(shí)別字典,補(bǔ)充存儲(chǔ)一個(gè)用戶的特殊字符數(shù)據(jù)和相應(yīng)的字符代碼,或者修改已有字符,以改善識(shí)別速率。
只要使用采取上述常規(guī)方法的字符識(shí)別裝置,就會(huì)發(fā)生下面的問(wèn)題。
使用這樣的字符補(bǔ)充和存儲(chǔ)功能,一個(gè)可能的情形是書(shū)寫者輸入的字符數(shù)據(jù)往往不轉(zhuǎn)換成目標(biāo)字符代碼,或者找出的字符數(shù)據(jù)不包括在所補(bǔ)充的識(shí)別字符類型里,換句話說(shuō),僅當(dāng)補(bǔ)充存儲(chǔ)對(duì)單個(gè)的字符型式突然進(jìn)行時(shí)才出現(xiàn)適當(dāng)?shù)那樾巍?br>
如果通常由書(shū)寫者輸入的字符形狀表示出個(gè)人的變體(右側(cè)提起、傾斜、等等),則同樣的變體將出現(xiàn)在所有的字符形式里面,在這一情形下,由于裝入字符識(shí)別裝置里的識(shí)別字典僅含有標(biāo)準(zhǔn)字符圖案,因而字符識(shí)別速度是低的,一個(gè)可用以避免此點(diǎn)的防范措施包括使用上述字符補(bǔ)充和存儲(chǔ)功能將各個(gè)字符補(bǔ)充儲(chǔ)存在識(shí)別字典中,但是,特別是對(duì)像日文這樣具有大量字符型式的語(yǔ)言來(lái)說(shuō),附加和存儲(chǔ)全部字符的工作需要巨大的工作量,即使對(duì)一個(gè)識(shí)別字典可完成這樣一項(xiàng)工作,最終的字典也將是相當(dāng)龐大的。
為解決上述常規(guī)方法的問(wèn)題,根據(jù)本發(fā)明的字符處理裝置的一個(gè)例子具有下面的結(jié)構(gòu)。輸出手寫字符的字符數(shù)據(jù)至下級(jí)字符識(shí)別處理的字符處理裝置,包括用于輸入一個(gè)預(yù)定樣本字符的輸入裝置;用于將所輸入的樣本字符的特征數(shù)據(jù)和與樣本字符相關(guān)的參考字符的特征數(shù)據(jù)相比較,并用于提取操作者固有的字符形狀數(shù)據(jù)的提取裝置;用于保存所提取的字符形狀數(shù)據(jù)的保存裝置;以及用于校正所輸入的手寫字符特征數(shù)據(jù)使之與保存裝置保存的字符形狀數(shù)據(jù)一致的校正裝置;作為結(jié)果,根據(jù)操作者輸入的字符的總特征,校正操作者輸入的字符的特征數(shù)據(jù),從而能夠得到提高識(shí)別速度。
此外,不需要儲(chǔ)存可能成為操作者的所有人的全部輸入字符的個(gè)人特征,并且能夠提供一種不限制操作者的數(shù)量并能識(shí)別字符的具有小存儲(chǔ)容量的裝置。
根據(jù)本發(fā)明的諸優(yōu)選實(shí)施例,最好輸入裝置包括用于顯示樣本字符以提示操作者輸入字符的顯示裝置,于是一個(gè)操作者被提示輸入特定的字符,因而避免了輸入那些不可能預(yù)處理的字符。
而且,最好是,提取裝置對(duì)輸入裝置輸入的樣本字符使用一個(gè)特征數(shù)值,以便提取樣本字符的旋轉(zhuǎn)角連續(xù)變化時(shí)所得的最大旋轉(zhuǎn)角作為識(shí)別結(jié)果數(shù)值充當(dāng)字符形狀數(shù)據(jù)、結(jié)果,在大多數(shù)情形下,變了形的字符都能解決。
希望的是,校正裝置旋轉(zhuǎn)所輸入字符的特征數(shù)據(jù),使之與保存裝置保存的充作字符形狀數(shù)據(jù)的旋轉(zhuǎn)角相一致,結(jié)果,適當(dāng)?shù)臄?shù)據(jù)就能傳送給下一級(jí)字符識(shí)別處理。
提取裝置可根據(jù)樣本字符的特征數(shù)值算出由輸入裝置輸入的樣本字符的傾斜度,于是,一個(gè)個(gè)人變體字符的第二特征也能解決了。
最好,校正裝置校正與所輸入字符的特征數(shù)據(jù)的傾斜度相關(guān)的數(shù)據(jù),使之與保存裝置所保存的作為字符形狀數(shù)據(jù)的傾斜數(shù)據(jù)一致,通過(guò)這一處理過(guò)程,適當(dāng)?shù)臄?shù)據(jù)也能輸送給下一級(jí)字符識(shí)別處理。
另外,最好是輸入裝置輸入多個(gè)樣本字符,并且提取裝置還包括用于計(jì)算各個(gè)樣本字符的字符形狀數(shù)據(jù)的平均形狀的裝置,從而,能夠提取更可靠的字符形狀數(shù)據(jù)。
此外,最好是,保存裝置以永久儲(chǔ)存裝置的形式提供。從而,有可能簡(jiǎn)單地通過(guò)提取字符形狀數(shù)據(jù),來(lái)執(zhí)行下一次會(huì)消失的提取過(guò)程。
圖1是一個(gè)原理方框圖,說(shuō)明根據(jù)本發(fā)明各實(shí)施例的字符識(shí)別裝置的結(jié)構(gòu);圖2是一個(gè)方框圖,說(shuō)明在第一和第三實(shí)施例中用于字符識(shí)別處理過(guò)程的功能結(jié)構(gòu);圖3是一個(gè)簡(jiǎn)圖,示出一個(gè)用于獲取用戶手寫數(shù)據(jù)的典型GUI屏幕,該數(shù)據(jù)存儲(chǔ)在變體信息存儲(chǔ)裝置201和901中;圖4是一個(gè)簡(jiǎn)圖,示出字符數(shù)據(jù)坐標(biāo)的平移變換;圖5是一個(gè)簡(jiǎn)圖,示出字符數(shù)據(jù)坐標(biāo)的旋轉(zhuǎn)變換;圖6是一個(gè)流程圖,示出第一實(shí)施例中計(jì)算最佳旋轉(zhuǎn)角θ的過(guò)程;圖7是一個(gè)用于第一實(shí)施例的識(shí)別過(guò)程的流程圖,其中使用了用戶的個(gè)人字符變體信息;圖8是一個(gè)簡(jiǎn)圖,示出圖6中在步驟S603產(chǎn)生的信息的儲(chǔ)存狀況;圖9是一個(gè)方框圖,說(shuō)明第一和第三實(shí)施例中字符識(shí)別過(guò)程的功能結(jié)構(gòu);圖10是一個(gè)用于第二實(shí)施例的識(shí)別過(guò)程的流程圖,其中使用了用戶的個(gè)人字符變體信息;圖11是一個(gè)流程圖,示出第三實(shí)施例中計(jì)算最佳旋圍角θ的過(guò)程;圖12是一個(gè)簡(jiǎn)圖,示出第四實(shí)施例中用于獲取用戶手寫數(shù)據(jù)的典型GUI屏幕;以及圖13是一個(gè)圖形,示出根據(jù)第四實(shí)施例中字符數(shù)據(jù)的字符傾斜度。
現(xiàn)在將同時(shí)參照附圖詳細(xì)敘述根據(jù)本發(fā)明的諸優(yōu)選實(shí)施例。
(第一實(shí)施例)圖1是一個(gè)原理方框圖,說(shuō)明根據(jù)本發(fā)明各優(yōu)選實(shí)施例的字符識(shí)別裝置的結(jié)構(gòu)。在圖1中,一個(gè)CPU100通過(guò)執(zhí)行儲(chǔ)存在ROM101中的控制程序(字符識(shí)別程序,等等)和數(shù)據(jù)控制整個(gè)裝置,用于后面將要敘述的流程圖的控制程序也儲(chǔ)存在ROM101中,一個(gè)RAM102×用來(lái)作CPU100的工作區(qū)和存儲(chǔ)輸入的字符圖案等等。KBD103是一個(gè)鍵盤,指針裝置104用來(lái)以坐標(biāo)數(shù)據(jù)的形式輸入顯示屏幕上的位置,鍵盤控制器(KBDC)105是一個(gè)用于控制KBD103和指針裝置104和鍵盤控制器。
坐標(biāo)輸入單元106例如說(shuō)是一個(gè)數(shù)字轉(zhuǎn)換器。用輸入筆107書(shū)寫在坐標(biāo)輸入單元106上的字符圖案的坐標(biāo)數(shù)據(jù)作為輸入數(shù)據(jù)輸入到裝置中。
顯示控制器108控制一個(gè)顯示器109。顯示器109是一個(gè)CRT監(jiān)視器或液晶顯示器、控制器(FDC)110控制一個(gè)軟盤或硬盤的接口。外存儲(chǔ)器裝置111是一個(gè)軟盤或硬盤。
坐標(biāo)輸入單元106中說(shuō)由一個(gè)透明電極構(gòu)成,并且用顯示器109覆蓋著,CPU100在輸入筆107輸入數(shù)據(jù)其間(筆按下期間)連續(xù)檢測(cè)坐標(biāo)位置并在顯示器109上顯示出對(duì)應(yīng)于所檢測(cè)到的各個(gè)坐標(biāo)位置的小圓點(diǎn),這樣一來(lái),效果就如同用一支筆在紙上寫的字符或畫(huà)的圖形。
字典113裝有字符的參考圖案,這些參考圖案在字符識(shí)別處理過(guò)程比較數(shù)據(jù)時(shí)使用,一個(gè)個(gè)人變體信息存儲(chǔ)器單元114用于存儲(chǔ)使用者固有的手寫變體信息、這個(gè)信息用來(lái)為字符識(shí)別處理過(guò)程回映使用者手寫體的變了形的形狀。上述數(shù)據(jù)儲(chǔ)存在外存儲(chǔ)器裝置111中,并根據(jù)需要讀入字典存儲(chǔ)器中然后參考、系統(tǒng)總線112用于連接上述各個(gè)部件。
圖2是一個(gè)概念性的簡(jiǎn)圖,用于根據(jù)本發(fā)明第一實(shí)施例的字符識(shí)別裝置的字符識(shí)別操作。
現(xiàn)在將說(shuō)圖2中的操作。
首先,通過(guò)字符輸入單元202(它相應(yīng)于CPU100、坐標(biāo)輸入單元106、輸入筆107以及顯示器109)輸入的信息儲(chǔ)存在一個(gè)字符圖案存儲(chǔ)器單元203(RAM102)中。
一個(gè)變體信息獲取器200(它相應(yīng)于CPU100、字符輸入單元202以及字典113)將用戶輸入的字符(具體地說(shuō)是輸入字符的特征信息)與參考字符(具體地說(shuō)是儲(chǔ)存在用于字符識(shí)別的字典中的特征信息)相比較,并求得一個(gè)使用者相對(duì)于參考字符的差(具體地說(shuō)是離開(kāi)參考字符的一個(gè)位移值)作為個(gè)人變體信息,此變體信息隨即儲(chǔ)存在一個(gè)變體信息存儲(chǔ)器單元201(它相應(yīng)于外存儲(chǔ)裝置111)中。
坐標(biāo)轉(zhuǎn)換器204(它相應(yīng)于CPU100和RAM102的一部分)從字符圖案存儲(chǔ)器單元203取出要識(shí)別字符的特征信息,還從變體信息存儲(chǔ)單元201中取出變體信息,坐標(biāo)轉(zhuǎn)換器204按照變體信息校正輸入字符的特征數(shù)值。
例如,當(dāng)一個(gè)使用者試圖書(shū)寫傾斜一個(gè)角度θ的字符時(shí),字符反轉(zhuǎn)一個(gè)等于θ的角度,以使它的位置與參考字符相同。
根據(jù)所得到的用于校正輸入字符的特征信息,一個(gè)識(shí)別器(它相應(yīng)于CPU100)使用識(shí)別字典206進(jìn)行字符識(shí)別,一等收到識(shí)別結(jié)果(一個(gè)字符代碼),一個(gè)識(shí)別結(jié)果輸出單元207(它相應(yīng)于RAM102和外存儲(chǔ)裝置111或顯示器109)例如說(shuō),就在屏幕上顯示一個(gè)相應(yīng)于所得到的作為識(shí)別處理過(guò)程結(jié)果的字符代碼的參考字型圖案。
現(xiàn)在將同時(shí)參照?qǐng)D3說(shuō)明求取一個(gè)使用者特有的變體信息的操作。圖3中示出為取得使用者的變體信息而提示使用者輸入預(yù)定的樣本字符的顯示器109的一個(gè)典型情況。
正如圖3所示,用于取得使用者的變體信息的操作是通過(guò)把一個(gè)使用者的手寫體置于為此而使用的GUI(圖形用戶接口)來(lái)完成的、更具體地說(shuō),樣本文字(圖3中三個(gè)字的圖案310)顯示于方格300中,并且使用者借助輸入筆107在手寫輸入?yún)^(qū)301書(shū)寫他或她的字符,圖3中示出使用者輸入他或她的三個(gè)字311-1至311-3的手寫形式后的即刻狀態(tài),如果使用者以筆107輕敲(或接觸)一下顯示在屏幕上的置入按鈕302,求取使使用者的變體信息的輸入工作即告完成、刪除按鈕303可用于擦除輸入的該使用者的變體信息。
輸入手寫輸入?yún)^(qū)301的每一字符的手寫信息(來(lái)自寫有文字的方格的信息以及來(lái)自手寫體的坐標(biāo)數(shù)據(jù)集合)均儲(chǔ)存在一個(gè)預(yù)定的緩沖存儲(chǔ)區(qū)。從這些字符中任選一個(gè)字符并用來(lái)分析該使用者的手寫信息。在本實(shí)施中,由三個(gè)字311-1至311-3中,選擇輸擇進(jìn)最左邊的方格301-1的文字用來(lái)分析手寫信息。
下面將同時(shí)參照附圖4和5以及圖6中的流程圖,說(shuō)明根據(jù)書(shū)寫在字符方格301-1中并儲(chǔ)存在緩存器中的字符的數(shù)據(jù)求取使用者的變體信息的一種方法。
首先,求出字符的中心,為做到這一點(diǎn),計(jì)算出字符數(shù)據(jù)的一個(gè)外接矩形并確定該矩形的中心,為使后面的計(jì)算容易些,把該中心當(dāng)作原點(diǎn)(O,O),并且平移字符的全部坐標(biāo)點(diǎn),寫有字符數(shù)據(jù)的字符方格的坐標(biāo)也被平移,通過(guò)這一操作方法,輸進(jìn)字符方格301-1的字符數(shù)據(jù)311-1便由存在于以原點(diǎn)(O,O)為中心的二維平面上的坐標(biāo)點(diǎn)的集合表示。
此后,如圖5所示,通過(guò)繞原點(diǎn)旋轉(zhuǎn)坐標(biāo)點(diǎn)來(lái)定出校正字符數(shù)據(jù)311-1的最佳數(shù)字、在步驟S600,旋轉(zhuǎn)角θ被初始化為0。
在步驟S601,進(jìn)行確定旋轉(zhuǎn)角θ是不是最后的360°即是不是對(duì)所有的角度均已做過(guò)處理的檢查,這里假定角度還不是360°以繼續(xù)進(jìn)行說(shuō)明。
在步驟S602,輸入的字符圖案被以原點(diǎn)為中心旋轉(zhuǎn)一個(gè)當(dāng)前角度θ,通過(guò)角度為θ的旋轉(zhuǎn)變換所得到的坐標(biāo)由下面的表達(dá)式表示,換句話說(shuō),假設(shè)旋轉(zhuǎn)前的坐標(biāo)為(x,y)和旋轉(zhuǎn)后的坐標(biāo)為(x’,y’),則眾所周知,x’和y’被表示為x’=Cosθ·X-Sinθ·X+Cosθ·y y’sinθ·X++Cosθ·y......(1)在步驟S603,執(zhí)行一次普通的字符識(shí)別過(guò)程。由該過(guò)程得到的字符代碼(最可能的字符代碼)和該字符的計(jì)算數(shù)值(即給定指出用以求得該字符代碼的可靠性的數(shù)值)以及當(dāng)時(shí)的角度θ的數(shù)值儲(chǔ)存在存儲(chǔ)區(qū)域(RAM102)的一個(gè)表格中,如圖8所示的表格樣目800至802。
在步驟S604、角度θ增加1°,并且程序控制器復(fù)到步驟S601。
若對(duì)所有的角度均已執(zhí)行過(guò)該過(guò)程,則角度θ達(dá)到最終值360°,隨后程序控制由步驟S601進(jìn)到步驟S605,由識(shí)別過(guò)程的結(jié)果即輸進(jìn)該對(duì)應(yīng)于字符311-1的備用表格的字符代碼中間找出最佳計(jì)算數(shù)值以及對(duì)應(yīng)于該數(shù)據(jù)的一個(gè)角度。結(jié)果,如圖5所示,可以看出,當(dāng)字符數(shù)據(jù)旋轉(zhuǎn)一個(gè)特定角度時(shí),得到目標(biāo)字符的最佳識(shí)別結(jié)果。
所得角度θ被作為使用者的變體信息儲(chǔ)存在外存儲(chǔ)裝置111中。
在上面的例子中,普通識(shí)別過(guò)程是在步驟S603進(jìn)行的。但是,由于預(yù)先確定了充作識(shí)別結(jié)果的所要字符是字符310-1,故可得到這個(gè)字符310-1的唯一計(jì)算數(shù)值。在這一情形,由于參考的是識(shí)別字典中僅有的特定信息,固而能提高計(jì)算速度。
由于角度θ在上面整個(gè)過(guò)程中是均勻確定的,使用者輸入的字符便用這一角度校正和識(shí)別,通過(guò)上述過(guò)程確定的角度在下文中稱之為最佳旋轉(zhuǎn)角θ。
現(xiàn)在,將參照?qǐng)D7的流程表同時(shí)敘述本實(shí)施例中一般進(jìn)行的字符識(shí)別過(guò)程。
首先,在步驟S700,使用者借助輸入筆107在字符輸入單元202輸入一個(gè)字符,在步驟S701,手寫信息作為字符坐標(biāo)數(shù)據(jù)(用于字符線段的筆劃信息)儲(chǔ)存到字符圖案存儲(chǔ)器單元203(它由RAM102的一個(gè)預(yù)定區(qū)域得到)。
在步驟S702,當(dāng)字符坐標(biāo)數(shù)據(jù)被識(shí)別時(shí),由變體信息存儲(chǔ)器單元201讀出坐標(biāo)點(diǎn)的最佳旋轉(zhuǎn)角θ,在步驟S703,輸入字符的坐標(biāo)數(shù)據(jù)被校正一個(gè)已旋轉(zhuǎn)了的最佳旋轉(zhuǎn)角θ。
隨后,在步驟S704,借助使用已變換過(guò)的坐標(biāo)數(shù)據(jù)進(jìn)行字符識(shí)別過(guò)程,并產(chǎn)生作為識(shí)別過(guò)程的結(jié)果的所得字符代碼,在步驟S705與字符代碼一致的字符圖案輸出到例如顯示器109。
(第二實(shí)施例)在上面的實(shí)施例(第一實(shí)施例)中,旋轉(zhuǎn)變換角度θ在進(jìn)行字符識(shí)別時(shí)由個(gè)人變體信息存儲(chǔ)器單元114讀出,并且旋轉(zhuǎn)變換操作是對(duì)輸入字符的坐標(biāo)數(shù)據(jù)進(jìn)行的。在第二實(shí)施例中,采用一種方法,其旋轉(zhuǎn)變換操作系對(duì)用作字符識(shí)別的識(shí)別字典中的參考圖案進(jìn)行,使參考圖案同輸入字符數(shù)據(jù)相適應(yīng)。第二實(shí)施例的原理結(jié)構(gòu)與第一實(shí)施例的一樣,將不給出對(duì)它的說(shuō)明。
圖9是一個(gè)用于第二實(shí)施例的功能方框圖。變體信息獲取器900和變體信息存儲(chǔ)器單元901是借檢查使用者輸進(jìn)的字符并隨即儲(chǔ)存所得數(shù)據(jù)來(lái)分析使用者手寫體的部件。分析手寫體的方法借助于和第一實(shí)施例中相同的手段執(zhí)行字符數(shù)據(jù)的旋轉(zhuǎn)變換過(guò)程來(lái)提供、置于圖3中屏幕的使用手寫體這時(shí)用作GUI。
假設(shè)該使用者的手寫體已被變體信息獲取器900分析完,并且最佳旋轉(zhuǎn)變換角θ已得出并儲(chǔ)存在變體信息存儲(chǔ)器單元901中。
當(dāng)已完成對(duì)他或她的手寫體設(shè)置的使用者輸進(jìn)用于進(jìn)行字符識(shí)別操作的手寫字時(shí),第二實(shí)施例的字符識(shí)別裝置便執(zhí)行下面的操作。
圖10是一個(gè)流程圖,示出第二實(shí)施例的處理過(guò)程。
若在步驟S1000,使用者在字符輸入單元902上輸入他或她的手寫體,則在步驟S1001,該手寫體被作為字符數(shù)據(jù)儲(chǔ)存在一個(gè)字符圖案存儲(chǔ)器單元903中,在步驟S1002,一個(gè)坐標(biāo)變換器904由變體信息存儲(chǔ)器單元901讀出最佳旋轉(zhuǎn)角θ,以便識(shí)別字符數(shù)據(jù),由于角度θ用來(lái)將使用者的字符圖形圖案適應(yīng)于儲(chǔ)存在識(shí)別字典906的參考圖案,故參考圖案必須旋轉(zhuǎn)(-θ)度或(360°-θ)度,以使得識(shí)別字典906中的參考圖案與使用者的字符圖形圖案相適應(yīng),因而,根據(jù)在步驟S1003讀得的旋轉(zhuǎn)角θ,儲(chǔ)存在識(shí)別字典906中的參考圖案的坐標(biāo)數(shù)據(jù)旋轉(zhuǎn)(-θ)度,這一旋轉(zhuǎn)變換由表示式(1)的操作執(zhí)行,而變體信息獲取器900則借助此操作算出最佳旋轉(zhuǎn)角θ,在步驟S1004,識(shí)別器905將已旋轉(zhuǎn)的參考圖案同輸入字符數(shù)據(jù)相比較。作為識(shí)別過(guò)程的最后結(jié)果,在步驟S1005,被確定為最相似的字符的字符代碼輸送到識(shí)別結(jié)果輸出單元907,后者轉(zhuǎn)而再將此結(jié)果輸出到一個(gè)顯示器等等。
(第三實(shí)施例)在第一實(shí)施例中,用一個(gè)字符的數(shù)據(jù)來(lái)計(jì)算最佳旋轉(zhuǎn)角,在第三實(shí)施例中,將給出一種方法的說(shuō)明,其中對(duì)書(shū)寫在手寫體輸入?yún)^(qū)301(見(jiàn)圖3)的每個(gè)字符均計(jì)算出一個(gè)最佳旋轉(zhuǎn)角θ、用平均值儲(chǔ)存在變體信息存儲(chǔ)器單元201中。第三實(shí)施例的原理結(jié)構(gòu)和功能方框圖與第一實(shí)施例的那些一樣(見(jiàn)圖1和2),將不給出其說(shuō)明。
當(dāng)一個(gè)使用者在圖3的使用者手寫體設(shè)置屏幕上輸進(jìn)他或她的三個(gè)手寫字符樣本(圖3中的字符311-1至311-3)并輕敲一下置入按地302時(shí),各個(gè)手寫字符的數(shù)據(jù)便作為字符數(shù)據(jù)儲(chǔ)存在裝置的緩存器中。
圖11是一個(gè)流程圖,示出第三實(shí)施例的字符形狀分析過(guò)程。
在步驟S1100,字符數(shù)據(jù)計(jì)數(shù)n(由RAM102中得到)初始化為1。在步驟S1102,由緩存器讀出第n個(gè)字符數(shù)據(jù)。在步驟S1103,對(duì)第n個(gè)字符數(shù)據(jù)執(zhí)行字符形狀分析過(guò)程。在此字符形狀分析過(guò)程中,通過(guò)利用圖6的流程中的過(guò)程執(zhí)行圖4和5的坐標(biāo)變換。因而,將不給出該過(guò)程的說(shuō)明。如果第n個(gè)目標(biāo)字符的旋轉(zhuǎn)角θ已被確定,就將該角度θ儲(chǔ)存在一個(gè)預(yù)定的緩存器中。
隨后,在步驟S1104,字符數(shù)據(jù)計(jì)數(shù)增加1,并且程序控制回復(fù)到步驟S1101。
用此,方法對(duì)第一個(gè)字符311-1、第二個(gè)字符311-2以及第三個(gè)字符311-3確定旋轉(zhuǎn)角θ。
當(dāng)?shù)贸鋈孔址男D(zhuǎn)角度θ時(shí),程序控制便進(jìn)到步驟S1105,儲(chǔ)存在緩存器中并讀出的旋轉(zhuǎn)角θ的數(shù)目等于被檢測(cè)的字符的計(jì)數(shù)數(shù)字。并在步驟S1106,計(jì)算出角度θ的平均數(shù)值。在步驟S1107,所得平均旋轉(zhuǎn)角被儲(chǔ)存在變體信息存儲(chǔ)單元114中作為使用者的手寫體信息。
雖然本實(shí)施例中字符數(shù)據(jù)集合的數(shù)目是三個(gè),但可對(duì)兩個(gè)字符或兩個(gè)以上字符的字符數(shù)據(jù)集合執(zhí)行同樣的過(guò)程。隨著字符數(shù)據(jù)集合數(shù)目的增加,手寫體信息會(huì)變得更可靠,但是,當(dāng)要輸入的字符數(shù)目增加時(shí),對(duì)一個(gè)使用者所需要的工作量也會(huì)變得更大,因而,正如在上述實(shí)施例中一樣,使用三個(gè)字符是合適的,作為一個(gè)替代系統(tǒng),也可提供多個(gè)手寫體輸入?yún)^(qū)域,以便使用者能選擇要輸入的字符數(shù)目。例如,當(dāng)使用者輕敲置入按鈕時(shí),與已輸入的字符數(shù)目一致地確定手寫信息。用這個(gè)方法,一個(gè)使用者就能輸入任意數(shù)目的字符,并且該輸入字符的數(shù)目可用來(lái)確定旋轉(zhuǎn)角。
(第四實(shí)施例)在各個(gè)實(shí)施例中,旋轉(zhuǎn)坐標(biāo)變換均用于校正使用者特有的圖形字符的變體,在第四實(shí)施例中,將敘述使用者的手寫體包含有平行四邊形變體時(shí)使用的校正裝置。
在第四實(shí)施例中,圖12所示的使用者手寫體設(shè)置窗口(它顯示在顯示器109上)用于得出一個(gè)使用者特有的形狀變體信息。
標(biāo)號(hào)1200代表一個(gè)樣本字型、手寫體輸入?yún)^(qū)1201用于供使用者輸入和樣本字型中一樣的那些字符,按鈕1202用于置入使用者的手寫字符形狀、輕敲按鈕1202,用于計(jì)算變體字符形狀信息的過(guò)程便在內(nèi)部開(kāi)始,按鈕1203用于刪除置于窗口的使用者手寫體、型式選擇無(wú)線按鈕1204用于由使用者指定他或她的手寫體型式,在本例中,使用者選擇平行四邊形的型式。
現(xiàn)在,通過(guò)使用型式選擇無(wú)線按鈕1204選擇了平行四邊形的型式,它符(手寫的)被輸進(jìn)手寫體輸入?yún)^(qū)1201,并已敲過(guò)置入按鈕1202,然后,來(lái)自寫著字符的手寫體輸入?yún)^(qū)域中的方格的信息以及作為字符數(shù)據(jù)的坐標(biāo)數(shù)據(jù)按各個(gè)字符儲(chǔ)存在裝置的緩存器中,參照緩存器中的數(shù)據(jù),第一個(gè)手寫字符311-1具有四個(gè)筆劃,并具第一筆劃和第四被用來(lái)計(jì)算使用者的變體字符形狀信息。正如由樣本字型所清楚看到的,一般第一筆劃被設(shè)計(jì)為一個(gè)垂直筆劃線段,最后的即第四筆劃則是一個(gè)水平筆劃線段,儲(chǔ)存在識(shí)別字典中的參考圖案以用一方法設(shè)計(jì)。
平行四邊形的型式由使用者使用型式選擇無(wú)線按鈕1204選為變體形狀的型式。使用者的字符形狀的變體便通過(guò)使用校正垂直線段和水平線段而受到校正。也就是說(shuō),變體形狀的垂直線段校正信息由第一筆劃得到。第一筆劃的始點(diǎn)坐標(biāo)定為A(x1,y1),終點(diǎn)坐標(biāo)定為B(x2,y2),第四筆劃的始點(diǎn)坐標(biāo)定為C(x3,y3),終點(diǎn)坐標(biāo)定為D(x4,y4)為簡(jiǎn)化下面的計(jì)算起見(jiàn),第一筆劃和第四筆劃的全部坐標(biāo)均作平移,使得始點(diǎn)坐標(biāo)A(x1,y1)和C(x3,y3)為原點(diǎn)(0,0),這一情況示于科13中,平移結(jié)束后的始點(diǎn)和終點(diǎn)的坐標(biāo)分別定為第一筆劃的A’(0,0)和B’(x’2,y’2)以及第四筆劃的C’(0,0)和D’(x’4,y’4),介于這些筆劃的始點(diǎn)和終點(diǎn)之間的直線表示式表示成如下形狀。
使用者的圖形字符圖案的垂直線段的表示式近似為y=ax(其中a=y(tǒng)’2/x’2) ……(2)同樣地,使用者的圖形字符圖案的水平線段的表示式近似為
y=bx(其中b=y(tǒng)’4/x’4)……(3)使用者的字符圖案P(x,y)通過(guò)使用這些表示式校正,由表示式(2)和(3),進(jìn)行校正后的字符圖案P’(x’,y’)的表示式為x’=x-y/ay’=y(tǒng)-bx ……(4)求出表示式(2)和(3)的操作被定為變體信息計(jì)算法,而a和b則字為使用者的字符變形信息,表示式(4)定為借助變體信息回映方法執(zhí)行的一個(gè)過(guò)程。
前面敘述的實(shí)施例可通過(guò)應(yīng)用上述信息和操作來(lái)實(shí)現(xiàn)。
坐標(biāo)變換法并不局限于在各實(shí)施例中使用過(guò)的這些,方法可以執(zhí)行其他的初等變換操作。總之,諸實(shí)施例的特性主要就是那些,使用者輸入字符的形狀型式可加諸到使用者輸入的所有字符上,并且對(duì)輸入字符的校正應(yīng)做到與能夠識(shí)別字符的字符形狀信息一致。
雖然在諸實(shí)施例中使用了一種字符識(shí)別裝置,但本發(fā)明并不局限于這種裝置,本發(fā)明能應(yīng)用于一種字符識(shí)別處理器-一種較字符識(shí)別器更高級(jí)的裝置,或者應(yīng)用于更高級(jí)的操作。
但是,如在第一實(shí)施例中一樣,當(dāng)字符識(shí)別操作根據(jù)角度θ執(zhí)行時(shí),必須參考用于字符識(shí)別的字典,或者必須為該操作單獨(dú)準(zhǔn)備一個(gè)字典,因而,字符識(shí)別功能應(yīng)裝入字符識(shí)別處理器中,或者作為一個(gè)裝置,以使裝置尺寸或操作規(guī)模的增加得以避免。
此外,雖然旋轉(zhuǎn)角或傾斜度被用為字符形狀信息,但其他的參考量也可如此應(yīng)用,雖然這兩個(gè)參考數(shù)據(jù)是用來(lái)確定所輸入的一般字符特征的主要因素,但是,最好的還是包含有所提取的兩個(gè)因素之一的字符形狀信息。
再者,雖然在上述實(shí)施例中,使用者用筆直接輸入手寫字符,但本發(fā)明并不局限于這一輸入方法,例如,手寫文件可用掃描器閱讀,或者可以使用通過(guò)一個(gè)網(wǎng)絡(luò)接收的字符圖像。
此外,可以不僅為一個(gè)使用者而且可以為多個(gè)使用者儲(chǔ)存字符形狀信息、在這一情形下,使用者在操作裝置之前,要輸入他或她的名字和ID,以便能夠執(zhí)行一個(gè)確定使用哪個(gè)字符形狀信息的識(shí)別過(guò)程。
最好,把字符形狀信息儲(chǔ)存在永久性存儲(chǔ)裝置中,因?yàn)橹灰僮鳑](méi)有變化,一旦提取出字符形狀信息,以后就不需要再執(zhí)行這個(gè)任務(wù)了。
本發(fā)明可應(yīng)用多個(gè)裝置組成的系統(tǒng)或者應(yīng)用單個(gè)裝置構(gòu)成的裝置上,本發(fā)明也能應(yīng)用于這樣一個(gè)情形,其中能通過(guò)向一個(gè)系統(tǒng)或一個(gè)裝置供應(yīng)一個(gè)程序而獲得目標(biāo)。
如上所述,根據(jù)本發(fā)明的諸實(shí)施例,當(dāng)一個(gè)特定的變體出現(xiàn)在使用者的手寫體中時(shí),該使用者的手寫體受到分析,對(duì)于下一個(gè)字符識(shí)別過(guò)程來(lái)說(shuō),通過(guò)分析得到的信息就被用來(lái)進(jìn)行字符數(shù)據(jù)的校正,以使字符識(shí)別性能得以提高。在這一情形下,不需要像常規(guī)的個(gè)人識(shí)別字典那樣要求那么多的數(shù)據(jù)來(lái)用于字符識(shí)別,由于對(duì)這樣的識(shí)別僅需要小量的數(shù)據(jù)。因而本發(fā)明是很經(jīng)濟(jì)的,并且由于本發(fā)明的字符識(shí)別裝置有一個(gè)GUI即使用者手寫體設(shè)置屏幕用于手寫體的分析,因而能很容易地得到使用者特有的變體信息。
此外,由于使用多個(gè)字符來(lái)檢查和分析使用者手寫的字符形狀,就能夠使用一個(gè)更準(zhǔn)確的數(shù)值來(lái)校正數(shù)據(jù)。
使用上述字符識(shí)別裝置,要求使用者置入信息的頻率較之使用個(gè)人信息的常規(guī)裝置所要求的頻率大為降低,因而提高了字符識(shí)別的速率。
在上述實(shí)施例中,手寫字符通過(guò)輸入筆在坐標(biāo)輸入單元輸入并受到處理,本發(fā)明并不局限于這樣的字符輸入,文件圖像可通過(guò)諸如掃描器這樣的光圖像輸入裝置輸入,并且包含在圖像之中的字符可以看作是要處理的字符。在如此情形下的字符可以是手寫的或者印刷的,更具體地說(shuō),印刷的字符有其本身依賴于字模型式和字型生成器的特征,根據(jù)本發(fā)明,由于印刷字符的特征受到補(bǔ)償之后,字符可以像手寫字符一樣容易識(shí)別,因而識(shí)別速率得以改善。
再者,用于靠輸入筆輸入手寫字符的坐標(biāo)輸入單元和諸如掃描器一類的光圖像輸入單元,兩者都作為字符輸入單元提供,利用這一安排,一個(gè)預(yù)定的樣本字符可在光圖像輸入單元輸入并且要識(shí)別的字符可在坐標(biāo)輸入單元輸入,或者,正如反過(guò)來(lái),預(yù)定的樣本字符可在坐標(biāo)輸入單元輸入,而要識(shí)別的字符可在光圖像輸入單元輸入,換句話說(shuō),本發(fā)明的特性這一是使用者的字符或文件中的字符特征是事先從預(yù)定的樣本字符中提取的,并且對(duì)被識(shí)別字符的校正要做到與所提取的特征相一致,用于輸入預(yù)定的校本字符的方法和被識(shí)別的字符不需要受到限制,輸入方法的差別只不過(guò)是隨操作條件而變的更好的環(huán)境上的差別而已。
權(quán)利要求
1.一種圖像處理裝置,包括用于輸入預(yù)定的樣本字符的輸入裝置;用于將所輸入的所述樣本字符的特征數(shù)據(jù)和與所述樣本字符相關(guān)的參考字符的特征數(shù)據(jù)相比較,并用于提取所述樣本字符固有的特征數(shù)據(jù)的提取裝置;用于保存提取的所述特征數(shù)據(jù)的保存裝置;以及用于校正輸入的字符使之與所述保存裝置保存的所述特征數(shù)據(jù)相一致的校正裝置。
2.根據(jù)權(quán)利要求1的圖像處理裝置,其中所述輸入裝置包括用于顯示樣本字符以提示操作者輸入字符的顯示裝置。
3.根據(jù)權(quán)利要求1的圖像處理裝置,其中所述提取裝置使用在所述輸入裝置輸入的所述樣本字符的特征數(shù)值,為的是提取連續(xù)改變每個(gè)所述樣本字符的旋轉(zhuǎn)角度時(shí)所得到的作為識(shí)別結(jié)果數(shù)值的最大旋轉(zhuǎn)角度充當(dāng)所述字符形狀數(shù)據(jù)。
4.根據(jù)權(quán)利要求3的圖像處理裝置,其中所述校正裝置旋轉(zhuǎn)輸入的所述字符,使之與所述保存裝置保存的充當(dāng)這特征數(shù)據(jù)的所述旋轉(zhuǎn)角度相一致。
5.根據(jù)權(quán)利要求1的圖像處理裝置,其中所述提取裝置根據(jù)所述樣本字符的特征數(shù)值計(jì)算在所述輸入裝置輸入的所述樣本字符的傾斜度。
6.根據(jù)權(quán)利要求5的圖像處理裝置,其中所述校正裝置校正輸入的所述字符的所述特征數(shù)據(jù)的傾斜度。使之與所述保存裝置保存的充當(dāng)所述特征數(shù)據(jù)的傾斜數(shù)據(jù)相一致。
7.根據(jù)權(quán)利要求1的圖像處理裝置,其中所述輸入裝置輸入多個(gè)樣本字符,并且其中所述提取裝置還包括用于計(jì)算各個(gè)所述樣本字符的所述特征數(shù)據(jù)的平均形狀的裝置。
8.根據(jù)權(quán)利要求1的圖像處理裝置,其中所述保存裝置以一種永久性存儲(chǔ)裝置的形式提供。
9.根據(jù)權(quán)利要求1的圖像處理裝置,其中所述校正裝置提取輸入字符的所述特征數(shù)據(jù),并對(duì)提取的所述特征數(shù)據(jù)執(zhí)行校正。
10.根據(jù)權(quán)利要求1的圖像處理裝置,其中所述輸入裝置是坐標(biāo)輸入裝置。
11.根據(jù)權(quán)利要求1的圖像處理裝置,其中所述輸入裝置是一個(gè)掃描器。
12.一種圖像處理方法,包括一個(gè)輸入預(yù)定樣本字符的輸入步驟;一個(gè)將輸入的所述樣本字符的特征數(shù)據(jù)和與所述樣本字符相關(guān)的參考字符的特征數(shù)據(jù)相比較,并提取所述樣本字符固有的特征數(shù)據(jù)的提取步驟;一個(gè)將提取的所述特征數(shù)據(jù)儲(chǔ)存在預(yù)定的保存裝置里的存儲(chǔ)步驟;以及一個(gè)校正輸入的字符在之與所述保存裝置保存的所述特征數(shù)據(jù)相一致的校正步驟。
13.根據(jù)權(quán)利要求12的圖像處理方法,其中所述輸入步驟包括一個(gè)顯示樣本字符以提示操作者輸入字符的顯示步驟。
14.根據(jù)權(quán)利要求12的圖像處理方法,其中在所述提取步驟,使用在所述輸入步驟輸入的所述樣本字符的特征數(shù)值,為的是提取連續(xù)改變每個(gè)所述樣本字符的旋轉(zhuǎn)角度時(shí)所得到的作為識(shí)別結(jié)果數(shù)值的最大旋轉(zhuǎn)角充當(dāng)所述字符形狀數(shù)據(jù)。
15.根據(jù)權(quán)利要求14的圖像處理方法,其中在所述校正步驟,旋轉(zhuǎn)輸入的所述字符,使之與所述保存裝置保存的充當(dāng)所述特征數(shù)據(jù)的所述旋轉(zhuǎn)角相一致。
16.根據(jù)權(quán)利要求12的圖像處理方法,其中在所述提取步驟,根據(jù)所述樣本字符的所述特征數(shù)值計(jì)算在所述輸入裝置輸入的所述樣本字符的傾斜度。
17.根據(jù)權(quán)利要求16的圖像處理方法,其中在所述校正步驟,校正輸入的所述字符的這特征數(shù)據(jù)的傾斜度,使之與所述保存裝置保存的充當(dāng)特征數(shù)據(jù)的傾斜數(shù)據(jù)相一致。
18.根據(jù)權(quán)利要求12的圖像處理方法,其中在所述輸出步驟輸入多個(gè)樣本字符,并且其中所述提取步驟還包括一個(gè)計(jì)算各所述樣本字符的所述特征數(shù)據(jù)的平均形狀的步驟。
19.根據(jù)權(quán)利要求12的圖像處理方法,其中所述保存裝置以永久存儲(chǔ)裝置的形式提供。
20.根據(jù)權(quán)利要求12的圖像處理方法,其中在所述校正步驟,提取輸入字符的所述特征數(shù)據(jù)。并對(duì)提取的所述特征數(shù)據(jù)執(zhí)行校正。
21.一種圖像處理裝置,包括用于輸入預(yù)定樣本字符的輸入裝置;用于將輸入的所述樣本字符的特征數(shù)據(jù)和與所述樣本字符相關(guān)的參考字符的特征數(shù)據(jù)相比較,并用于提取操作者所固有的字符形狀數(shù)據(jù)的提取裝置;用于保存提取的所述字符形狀數(shù)據(jù)的保存裝置;用于校正輸入的所述手寫字符的所述特征數(shù)據(jù)使之與所述保存裝置保存的所述字符形狀數(shù)據(jù)相一致的校正裝置;以及用于通過(guò)使用所述校正裝置執(zhí)行校正得到的所述手寫字符的特征信息來(lái)識(shí)別字符的字符識(shí)別裝置。
22.根據(jù)權(quán)利要求21的圖像處理裝置,其中所述輸入裝置包括用于顯示樣本字符以提示操作者輸入字符的顯示裝置。
23.根據(jù)權(quán)利要求21的圖像處理裝置,其中所述提取裝置使用在所述輸入裝置輸入的所述樣本字符的特征數(shù)值,為的是提取連續(xù)改變每個(gè)所述樣本字符的旋轉(zhuǎn)角時(shí)得到的作為識(shí)別結(jié)果數(shù)值的最大旋轉(zhuǎn)角充當(dāng)所述字符形狀數(shù)據(jù)。
24.根據(jù)權(quán)利要求23的圖像處理裝置,其中所述校正裝置旋轉(zhuǎn)輸入的所述字符的所述特征數(shù)據(jù),使之與所述保存裝置保存的充當(dāng)所述字符形狀數(shù)據(jù)的所述旋轉(zhuǎn)角度相一致。
25.根據(jù)權(quán)利要求21的圖像處理裝置,其中所述提取裝置根據(jù)所述樣本字符的所述特征數(shù)值計(jì)算在所述輸入裝置根據(jù)所述樣本字符的所述特征數(shù)值計(jì)算在所述輸入裝置輸入的所述樣本字符的傾斜度。
26.根據(jù)權(quán)利要求25的圖像處理裝置,其中所述校正裝置校正與輸入的所述字符的所述特征數(shù)據(jù)的傾斜度相關(guān)的數(shù)據(jù),使之與所述保存裝置保存的充當(dāng)所述字符形狀數(shù)據(jù)的傾斜數(shù)據(jù)相一致。
27.根據(jù)權(quán)利要求21的圖像處理裝置,其中所述輸入裝置輸入多個(gè)樣本字符,并且其中所述提取裝置還包括用于計(jì)算各個(gè)所述樣本字符的所述字符形狀數(shù)據(jù)的平均形狀的裝置。
28.根據(jù)權(quán)利要求21的圖像處理裝置,其中所述保存裝置以永久存儲(chǔ)裝置的形式提供。
29.根據(jù)權(quán)利要求21的圖像處理裝置,其中所述輸入裝置是坐標(biāo)輸入裝置。
30.根據(jù)權(quán)利要求21的圖像處理裝置,還包括用于顯示作為所述字符識(shí)別裝置執(zhí)行字符識(shí)別操作過(guò)程的結(jié)果而得到的字符圖案的顯示裝置。
全文摘要
根據(jù)本發(fā)明,操作者事先要輸入一個(gè)預(yù)定的字符,變體信息獲取器將操作者書(shū)寫的字符的特征信息同事先確定的字符的參考特征信息相比較,并得出操作者固有的變體信息,所得到的變體信息被儲(chǔ)存在一個(gè)變體信息存儲(chǔ)器單元里,當(dāng)執(zhí)行一般字符識(shí)別時(shí),根據(jù)儲(chǔ)存的變體信息校正輸入的字符,并且被校字符的特征信息受到辨認(rèn)。
文檔編號(hào)G06K9/46GK1137657SQ96102749
公開(kāi)日1996年12月11日 申請(qǐng)日期1996年3月8日 優(yōu)先權(quán)日1995年3月8日
發(fā)明者高須英司, 新井常一, 吉井裕人 申請(qǐng)人:佳能株式會(huì)社