專利名稱:用于識(shí)別字符的裝置和方法
目前,對(duì)外圍輸入設(shè)備的高級(jí)字符識(shí)別技術(shù)的要求很高。本發(fā)明涉及一種用于識(shí)別字符的裝置和方法,和一種用于存儲(chǔ)字符識(shí)別程序的存儲(chǔ)介質(zhì)。尤其是,本發(fā)明涉及一種用于識(shí)別字符的裝置和方法,和一種用于存儲(chǔ)字符識(shí)別程序的存儲(chǔ)介質(zhì),其中所涉及的裝置和方法區(qū)別文件中的打印字符和手寫(xiě)字符從而更準(zhǔn)確地識(shí)別字符。
在現(xiàn)有技術(shù)中,如果要識(shí)別一個(gè)包括有手寫(xiě)字符和打印字符的文件,則首先需要執(zhí)行兩個(gè)處理,即識(shí)別手寫(xiě)字符的處理和識(shí)別打印字符的處理。然后,對(duì)這兩個(gè)處理的結(jié)果進(jìn)行比較以獲得一個(gè)更可靠的識(shí)別結(jié)果,從而識(shí)別文件。
上述現(xiàn)有技術(shù)中通過(guò)執(zhí)行兩個(gè)處理(分別識(shí)別手寫(xiě)字符和打印字符)并對(duì)這兩個(gè)處理的識(shí)別結(jié)果進(jìn)行比較,從而獲得更可靠的識(shí)別結(jié)果。由于現(xiàn)有技術(shù)需要花費(fèi)很長(zhǎng)的時(shí)間來(lái)執(zhí)行識(shí)別處理,因此現(xiàn)有技術(shù)中的字符識(shí)別還存在不足。
本發(fā)明致力于解決現(xiàn)有技術(shù)中的上述問(wèn)題,其目的在于更準(zhǔn)確地識(shí)別手寫(xiě)字符和打印字符,并縮短執(zhí)行字符識(shí)別處理所需要的時(shí)間。
為了解決上述問(wèn)題,本發(fā)明對(duì)一個(gè)圖案的特征進(jìn)行識(shí)別,當(dāng)圖案的特征表示該圖案為手寫(xiě)字符時(shí),則執(zhí)行識(shí)別手寫(xiě)字符的處理,當(dāng)圖案的特征表示該圖案為打印字符時(shí),則執(zhí)行識(shí)別打印字符的處理。
因此,甚至當(dāng)文件包括手寫(xiě)字符和打印字符時(shí),也可通過(guò)只執(zhí)行手寫(xiě)字符識(shí)別處理和打印字符識(shí)別處理中的一種處理而獲得精確的識(shí)別結(jié)果,從而可以成功地縮短執(zhí)行字符識(shí)別處理所需要的時(shí)間,而不會(huì)降低字符識(shí)別的精確度。
根據(jù)本發(fā)明的一個(gè)方面,可根據(jù)圖案的格式或規(guī)律性來(lái)辨別手寫(xiě)字符或打印字符。
由于打印字符在圖案形狀和排列方面比手寫(xiě)字符更規(guī)律,因此可通過(guò)檢查圖案形狀和排列的規(guī)律性把手寫(xiě)字符與打印字符區(qū)別開(kāi)來(lái),從而縮短執(zhí)行子處理所需要的時(shí)間。
圖1為一個(gè)根據(jù)本發(fā)明的第一實(shí)施例的字符識(shí)別裝置的結(jié)構(gòu)框圖。
圖2為一個(gè)根據(jù)本發(fā)明的第二實(shí)施例的字符識(shí)別裝置的結(jié)構(gòu)框圖。
圖3表示本發(fā)明所應(yīng)用的一個(gè)系統(tǒng)的結(jié)構(gòu)的示例。
圖4為一個(gè)根據(jù)本發(fā)明的第三實(shí)施例的字符識(shí)別裝置的結(jié)構(gòu)框圖。
圖5表示根據(jù)本發(fā)明的一個(gè)實(shí)施例的手寫(xiě)/打印字符辨別單元的結(jié)構(gòu)。
圖6為由手寫(xiě)/打印字符辨別單元執(zhí)行的處理的流程圖。
圖7表示每個(gè)字符類型/集合和特征參數(shù)間的關(guān)系。
圖8表示用于辨別手寫(xiě)字符和打印字符的方法。
圖9表示明朝字體的線寬差異。
圖10為根據(jù)本發(fā)明的一個(gè)實(shí)施例的復(fù)雜性提取處理的流程圖。
圖11表示提取復(fù)雜性(線密度)的處理的概念。
圖12為根據(jù)本發(fā)明的一個(gè)實(shí)施例的線性提取處理的流程圖。
圖13表示線性提取處理的概念。
圖14為根據(jù)本發(fā)明的一個(gè)實(shí)施例的線寬差異提取處理的流程圖。
圖15表示線寬差異提取處理的概念。
圖16表示手寫(xiě)字符和打印字符的底線坐標(biāo)位置的差異,和差異提取處理;和圖17為一個(gè)字符位置差異的提取處理的流程圖。
下面將參看附圖來(lái)描述根據(jù)本發(fā)明的一個(gè)實(shí)施例的字符識(shí)別裝置。圖1為一個(gè)根據(jù)本發(fā)明的第一實(shí)施例的字符識(shí)別裝置的結(jié)構(gòu)框圖。圖1中,特征識(shí)別單元111用于識(shí)別從輸入圖象中所提取的圖案的特征。例如,特征識(shí)別單元111根據(jù)圖案的規(guī)律性來(lái)辨別圖案是手寫(xiě)字符還是打印字符。也即,由于打印字符比手寫(xiě)字符更有規(guī)律性,因此在圖案的規(guī)律性比較高時(shí),則特征識(shí)別單元111判定該圖案為一個(gè)打印字符,在圖案的規(guī)律性比較低時(shí)則判定該圖案為一個(gè)手寫(xiě)字符。
由特征識(shí)別單元111所識(shí)別的圖案的特征包括圖案的復(fù)雜性,圖案的線性,圖案的線寬差異,圖案排列位置的差異,圖案傾斜度的差異,圖案尺寸的差異等??筛鶕?jù)圖案的線密度,黑色象素的密度,歐拉數(shù),輪廓線長(zhǎng)度等來(lái)識(shí)別圖案的復(fù)雜性。可結(jié)合經(jīng)過(guò)辨別分析等處理后所得到的多個(gè)特征來(lái)識(shí)別圖案的特征。
手寫(xiě)字符識(shí)別單元113用于識(shí)別手寫(xiě)字符。打印字符識(shí)別單元114用于識(shí)別打印字符。打印字符可為印刷字符,打字機(jī)打印字符,由字處理人員所輸入的字符等。
字符識(shí)別選擇單元112根據(jù)特征識(shí)別單元111的辨別結(jié)果選擇手寫(xiě)字符識(shí)別單元113或打印字符識(shí)別單元114。也即,當(dāng)特征識(shí)別單元111判定將要識(shí)別的圖案為手寫(xiě)字符時(shí),則字符識(shí)別選擇單元112選擇手寫(xiě)字符識(shí)別單元113,并通知手寫(xiě)字符識(shí)別單元113對(duì)將要識(shí)別的圖案的字符進(jìn)行識(shí)別。當(dāng)特征識(shí)別單元111判定將要識(shí)別的圖案為打印字符時(shí),則字符識(shí)別選擇單元112選擇打印字符識(shí)別單元113,并通知打印字符識(shí)別單元113對(duì)將要識(shí)別的圖案的字符進(jìn)行識(shí)別。
因此,有可能使用手寫(xiě)字符識(shí)別單元113或打印字符識(shí)別單元114來(lái)實(shí)現(xiàn)字符識(shí)別處理,從而可縮短執(zhí)行字符識(shí)別處理所需要的時(shí)間,而不會(huì)降低識(shí)別的精確度,甚至在只使用手寫(xiě)字符識(shí)別單元113和打印字符識(shí)別單元114中的一個(gè)來(lái)執(zhí)行字符識(shí)別處理的情況下也是如此。
圖2為一個(gè)根據(jù)本發(fā)明的第二實(shí)施例的字符識(shí)別裝置的結(jié)構(gòu)框圖。如圖2所示,第二實(shí)施例解決了上述問(wèn)題。
字符圖案提取單元1從文件或列表的圖象中提取一個(gè)字符圖案。然后,復(fù)雜性提取單元2a和線性提取單元2b獲得第N個(gè)特征向量,其中特征向量中至少包括表示字符圖案的復(fù)雜性和線性的特征。接下來(lái),手寫(xiě)/打印字符辨別單元2f使用上述特征向量來(lái)辨別該字符圖案是手寫(xiě)字符還是打印字符。根據(jù)辨別結(jié)果,字符識(shí)別單元3執(zhí)行相應(yīng)的手寫(xiě)字符識(shí)別處理或打印字符識(shí)別處理。線密度可作為表示字符圖案的復(fù)雜性的特征。線寬差異提取單元2c從由字符圖案提取單元1所提取的字符圖案中提取表示線寬差異的特征量,其中線寬差異是通過(guò)移去一定的圖案后得到的,其中所移去的圖案為其與包括在字符圖案中的字符筆畫(huà)的結(jié)束點(diǎn),交點(diǎn)和角點(diǎn)相距預(yù)定距離的圖案。然后根據(jù)所提取的特征量辨別字符圖案是手寫(xiě)字符還是打印字符。根據(jù)辨別結(jié)果,相應(yīng)地執(zhí)行手寫(xiě)字符識(shí)別處理或打印字符識(shí)別處理。
由于打印字符可以明朝字體等字體的形式表示,因此線寬差異提取單元2c可獲得每個(gè)筆畫(huà)或每個(gè)筆畫(huà)方向上的線寬差異,其中明朝字體在每個(gè)筆畫(huà)方向上有不同的線寬。
字符位置差異提取單元2d用于獲得字符位置的差異。當(dāng)一個(gè)字符圖案表示字符位置差異很大時(shí),則手寫(xiě)/打印字符辨別單元2f判定該圖案為手寫(xiě)字符,并通知手寫(xiě)字符識(shí)別單元3a對(duì)該圖案的字符進(jìn)行識(shí)別。另一方面,當(dāng)一個(gè)字符圖案表示字符位置差異很小時(shí),則手寫(xiě)/打印字符辨別單元2f判定該圖案為打印字符,并通知打印字符識(shí)別單元3b對(duì)該圖案的字符進(jìn)行識(shí)別。
除了字符位置的差異,也可通過(guò)檢查字符的傾斜度的差異,尺寸的差異等來(lái)辨別字符圖案是手寫(xiě)字符還是打印字符。
在本實(shí)施例中,需獲得第N個(gè)特征向量以在手寫(xiě)字符和打印字符間進(jìn)行辨別,并識(shí)別字符是手寫(xiě)字符還是打印字符,其中特征向量中至少包括表示字符圖案的復(fù)雜性的特征和表示字符圖案的線性的特征。因此,可精確地辨別出手寫(xiě)字符和打印字符,并可在短時(shí)間內(nèi)執(zhí)行字符識(shí)別處理。而且,通過(guò)使用線密度作為一個(gè)表示字符圖案的復(fù)雜性的特征,可方便并快速地獲得特征量。
可通過(guò)使用表示線寬差異的特征量來(lái)辨別手寫(xiě)字符或打印字符從而獲得線寬差異,而不會(huì)受到因?qū)γ鞒煮w添加修飾符等所造成的影響,從而可準(zhǔn)確地辨別出手寫(xiě)字符或打印字符,其中線寬差異是通過(guò)移去一定的圖案后得到的,其中所移去的圖案為距包括在字符圖案中的字符筆畫(huà)的結(jié)束點(diǎn),交點(diǎn)和角點(diǎn)預(yù)定距離的圖案。
另外,通過(guò)獲取每個(gè)筆畫(huà)或每個(gè)筆畫(huà)方向上的線寬差異,可以獲得線寬差異而不會(huì)受到由于明朝字體的筆畫(huà)方向而造成的線寬的不同的影響,從而可以正確地辨別手寫(xiě)字符或打印字符。
圖3表示本發(fā)明所使用的一個(gè)系統(tǒng)的結(jié)構(gòu)的例子。
圖3中,11為同總線10相連的CPU,其中。同總線10相連的還有RAM 12,ROM 13,一個(gè)通信接口14,一個(gè)外部存儲(chǔ)設(shè)備15,一個(gè)存儲(chǔ)介質(zhì)讀取設(shè)備16,一個(gè)用于讀取圖象的掃描儀17,一個(gè)輸入/輸出設(shè)備18例如顯示器,鍵盤(pán)等。ROM 13中存儲(chǔ)了OS等,RAM 12中存儲(chǔ)了用于執(zhí)行根據(jù)本發(fā)明的處理的程序,數(shù)據(jù)等。
掃描儀17讀取一個(gè)圖象,其中所讀取的圖象中存儲(chǔ)了將被識(shí)別的字符等。輸入/輸出設(shè)備18包括一個(gè)輸入設(shè)備例如鍵盤(pán),鼠標(biāo)等,和一個(gè)輸出設(shè)備例如顯示檢測(cè)器,打印機(jī)等,輸入/輸出設(shè)備18輸入處理數(shù)據(jù)時(shí)所要用到的數(shù)據(jù),并輸出處理后的數(shù)據(jù)。
執(zhí)行字符識(shí)別處理時(shí)所用到的程序,數(shù)據(jù)等存儲(chǔ)在存儲(chǔ)設(shè)備15例如硬盤(pán)等中,或者存儲(chǔ)在存儲(chǔ)介質(zhì)例如CD-ROM,軟盤(pán)等中,或者存儲(chǔ)在RAM 12中,當(dāng)要處理數(shù)據(jù)時(shí)則由讀取設(shè)備17從存儲(chǔ)設(shè)備15中或存儲(chǔ)介質(zhì)中讀取處理中所要用到的程序,數(shù)據(jù),并由CPU 11執(zhí)行處理。通信接口14與總線10相連,并且通信接口可以通過(guò)通信線路傳送和接收數(shù)據(jù)和程序。
圖4為一個(gè)由根據(jù)本發(fā)明的第三實(shí)施例的字符識(shí)別裝置來(lái)執(zhí)行的功能的框圖。如圖4所示,根據(jù)本實(shí)施例的字符識(shí)別裝置包括一個(gè)用于對(duì)圖象數(shù)據(jù)進(jìn)行預(yù)處理的預(yù)處理單元21;一個(gè)字符提取單元22;一個(gè)手寫(xiě)/打印字符辨別單元23,和一個(gè)用于實(shí)現(xiàn)字符識(shí)別處理的字符識(shí)別單元24。預(yù)處理單元21,字符提取單元22,和字符識(shí)別單元24可由現(xiàn)有技術(shù)實(shí)現(xiàn)。
在圖4中,對(duì)由圖象輸入單元例如掃描儀17等從文件或列表中所讀取的圖象數(shù)據(jù)進(jìn)行預(yù)處理例如噪音去除處理,傾斜修正處理等,并把預(yù)處理后的數(shù)據(jù)傳送給字符提取單元22。字符提取單元22對(duì)預(yù)處理后的圖象數(shù)據(jù)的字符數(shù)據(jù)進(jìn)行分段。手寫(xiě)/打印字符辨別單元23辨別手寫(xiě)字符和打印字符間的分段字符數(shù)據(jù),并把數(shù)據(jù)劃分成手寫(xiě)字符和打印字符。
字符識(shí)別單元24根據(jù)字符數(shù)據(jù)是手寫(xiě)字符還是打印字符而執(zhí)行相應(yīng)的字符識(shí)別處理。也即,字符識(shí)別單元24包括用于識(shí)別手寫(xiě)字符的手寫(xiě)字符識(shí)別單元和用于識(shí)別打印字符的打印字符識(shí)別單元。當(dāng)手寫(xiě)/打印字符辨別單元23識(shí)別字符圖象數(shù)據(jù)為手寫(xiě)字符時(shí),則上述手寫(xiě)字符識(shí)別單元進(jìn)行字符識(shí)別。當(dāng)手寫(xiě)/打印字符辨別單元23識(shí)別字符圖象數(shù)據(jù)為打印字符時(shí),則上述打印字符識(shí)別單元進(jìn)行字符識(shí)別。因此,通過(guò)預(yù)先辨別出字符圖案是手寫(xiě)字符還是打印字符,并由字符識(shí)別單元24根據(jù)辨別結(jié)果執(zhí)行相應(yīng)的識(shí)別處理,可成功地縮短執(zhí)行字符識(shí)別所需的時(shí)間。
在上述字符提取處理和手寫(xiě)字符/打印字符辨別處理中,可對(duì)字符數(shù)據(jù)中的每個(gè)字符進(jìn)行分段,并且可對(duì)每個(gè)分段字符執(zhí)行手寫(xiě)字符/打印字符辨別處理。否則,可對(duì)多個(gè)字符進(jìn)行分段,以在手寫(xiě)字符/打印字符辨別處理中進(jìn)行集中地處理。
圖5表示手寫(xiě)/打印字符辨別單元23的結(jié)構(gòu)。圖6表示一個(gè)由手寫(xiě)/打印字符辨別單元23執(zhí)行的處理的流程圖。
如圖5所示,手寫(xiě)/打印字符辨別單元23包括一個(gè)用于規(guī)格化分段字符數(shù)據(jù)的規(guī)格化單元31;一個(gè)用于從分段字符數(shù)據(jù)中提取特征參數(shù)的特征參數(shù)提取單元32;和一個(gè)用于識(shí)別手寫(xiě)字符或打印字符的辨別單元33。
特征參數(shù)提取單元32包括一個(gè)復(fù)雜性提取單元34,一個(gè)線性提取單元35,一個(gè)線寬差異提取單元36,和一個(gè)字符位置差異提取單元37。
手寫(xiě)/打印字符辨別單元23執(zhí)行如下的手寫(xiě)字符/打印字符辨別處理。
首先,規(guī)格化單元31對(duì)圖象的大小進(jìn)行規(guī)格化(步驟S1)。
然后,特征參數(shù)提取單元32從規(guī)格化的字符數(shù)據(jù)中提取特征參數(shù),并獲得一個(gè)特征向量,其中所提取的特征參數(shù)表示例如字符的復(fù)雜性,字符數(shù)據(jù)的線性,字符的線寬差異,字符位置的差異等(步驟S2)。
接下來(lái),辨別單元33把特征向量分配給一個(gè)辨別函數(shù),識(shí)別手寫(xiě)字符或打印字符,并存儲(chǔ)識(shí)別結(jié)果(步驟S3)。
辨別單元33通過(guò)預(yù)先獲得一個(gè)用于識(shí)別手寫(xiě)字符和打印字符的界線,并根據(jù)從字符數(shù)據(jù)中所提取的特征參數(shù)判定特征向量位于界線的哪一邊來(lái)辨別字符,從而執(zhí)行識(shí)別手寫(xiě)字符和打印字符的處理,其中界線是通過(guò)在以特征參數(shù)為元素的向量空間里執(zhí)行辨別和分析處理后所得到的。
圖7表示每個(gè)字符類型/集合和特征參數(shù)間的關(guān)系。圖7中的單詞‘大’,‘中’,和‘小’表示特征參數(shù)由數(shù)值表示時(shí)字符類型/集合的相對(duì)值。
(1) 表示‘復(fù)雜性’的特征參數(shù)對(duì)于漢字(中文字符)是大,對(duì)于其它字符類型(字母字符,數(shù)字字符,平假名(日文字符),和片假名(日文字符))則是小,而不管是手寫(xiě)字符還是打印字符。
(2)表示‘線性’的特征參數(shù)對(duì)于手寫(xiě)字符是小,對(duì)于打印字符則是中或大。
(3)表示‘線寬差異’的特征參數(shù)對(duì)于手寫(xiě)字符一般是大,對(duì)于打印字符一般是小。在打印字符中,當(dāng)明朝字體包括一個(gè)結(jié)束點(diǎn)或一個(gè)角點(diǎn)時(shí)則該字符的線寬差異是大。然而,如后面所述,如圖7中所示,除了結(jié)束點(diǎn)或角點(diǎn)外,該字符的線寬差異是小。另外,由于各個(gè)方向上明朝字體的字符線寬是不同的,因此如果獲得各個(gè)方向上的線寬差異,則線寬差異可更小。
(4)表示‘字符位置差異’的特征參數(shù)對(duì)于手寫(xiě)字符一般是大,對(duì)于打印字符則一般是小。
如上所述,手寫(xiě)字符一般有較少的線性元素,而打印字符一般有較多的線性元素。尤其是,中文字符中包括有較多的線性元素,而其它字符集合例如字母字符,數(shù)字字符,平假名字符和片假名字符中則包含有較少的線性元素。
因此,根據(jù)字符的復(fù)雜性和字符的線性可準(zhǔn)確地辨別出手寫(xiě)字符和打印字符,其中字符的復(fù)雜性為一種可根據(jù)它可從其它字符類型中辨別出中文字符的特征量,其中字符的線性為打印字符的一種特征。
表示復(fù)雜性的參數(shù)可為筆畫(huà)的數(shù)目等,但是對(duì)于下面所描述的快速處理則需要使用字符圖案的線密度。
圖8表示上述辨別方法。圖8表示一個(gè)辨別函數(shù)的例子,該辨別函數(shù)用于選擇‘復(fù)雜性X1’和‘線性X2’作為特征參數(shù),并在二維坐標(biāo)中辨別手寫(xiě)字符和打印字符,其中二維坐標(biāo)以‘復(fù)雜性X1’為縱坐標(biāo)軸,以‘線性X2’為橫坐標(biāo)軸。
復(fù)雜性和線性是從各種手寫(xiě)字符和打印字符中獲得的。當(dāng)把結(jié)果繪制在上述二維坐標(biāo)中時(shí),則數(shù)字打印字符,字母打印字符,平假名打印字符,片假名打印字符和中文打印字符一般分布在圖8中所示的二維坐標(biāo)的左上部分41,42和43。另一方面,數(shù)字手寫(xiě)字符,字母手寫(xiě)字符,平假名手寫(xiě)字符,片假名手寫(xiě)字符和中文手寫(xiě)字符一般分布在二維坐標(biāo)的右下部分44,45和46。
因此,在這種情況下,通過(guò)如圖8中所示來(lái)定義辨別函數(shù)Z,可根據(jù)上述兩個(gè)特征參數(shù)從打印字符中辨別出手寫(xiě)字符。
假設(shè)G1表示一組打印字符,G2表示一組手寫(xiě)字符,則每組距離重心向量的中心的距離(Mahalanobis距離)可由下面的等式(1)和(2)獲得的,其中獲得Mahalanobis距離時(shí)考慮了每個(gè)改變量的差異和改變量間的關(guān)系。
G1的Mahalanobis距離為D12=(X-X1-)′Σ1-1(X-X1-)---(1)]]>G2的Mahalanobis距離為D22=(X-X2-)′Σ2-1(X-X2-)---(2)]]>Xk表示組K的重心向量的中值∑k表示組K的方差—均方差矩陣Z=D22-D12(3)對(duì)于未知向量,可獲得每組的Mahalanobis距離以辨別更接近的組。
因此,可通過(guò)求解上述等式(3)來(lái)獲得辨別函數(shù),并且可根據(jù)Z是正還是負(fù)來(lái)辨別組。例如,當(dāng)一個(gè)未知圖案的特征向量位于二維坐標(biāo)的P點(diǎn)時(shí),則需檢查P’點(diǎn)是正還是負(fù),其中P’是把P點(diǎn)投影到辨別函數(shù)上所獲得的點(diǎn)。如果點(diǎn)P’為正,則辨別該未知圖案為一個(gè)打印字符。如果點(diǎn)P’為負(fù),則辨別該未知圖案為一個(gè)手寫(xiě)字符。
在圖8中,如同上述參考二維坐標(biāo)來(lái)辨別字符圖案一樣,可使用參考了N維特征向量空間的辨別方法和分析方法來(lái)精確地識(shí)別出字符圖案為手寫(xiě)字符還是打印字符,其中二維坐標(biāo)使用了復(fù)雜性和線性兩個(gè)特征量。
也即,如上所述,復(fù)雜性,線性,線寬差異,字符位置的差異等的特征量取決于手寫(xiě)字符,打印字符,字符類型或字符集合。因此,通過(guò)對(duì)多個(gè)特征參數(shù)適當(dāng)?shù)剡M(jìn)行組合,可更精確地辨別出手寫(xiě)字符和打印字符。
如后面所描述的,通過(guò)獲得每個(gè)筆畫(huà)或筆畫(huà)的各個(gè)方向上復(fù)雜性,線性,線寬差異等的特征量,并使用這些特征量來(lái)辨別手寫(xiě)字符或打印字符,可更精確地識(shí)別字符。其它特征量也可與字符的傾斜度的特征量結(jié)合起來(lái)使用。
圖7中,表示線寬差異的特征量對(duì)于手寫(xiě)字符是大,對(duì)于打印字符是小。因此,可使用一個(gè)或多個(gè)在手寫(xiě)字符和打印字符間具有很大差異的特征量的特征參數(shù)來(lái)辨別手寫(xiě)字符或打印字符。
在明朝字體中,圖9A所示的字符的筆畫(huà)的結(jié)束點(diǎn)51和角點(diǎn)52處被添加了修飾符。因此,在計(jì)算線寬差異時(shí)如果把明朝字體中的結(jié)束點(diǎn)51和角點(diǎn)52也計(jì)算了進(jìn)去,則線寬差異會(huì)變大,從而會(huì)把打印字符錯(cuò)誤地識(shí)別為手寫(xiě)字符。
如下面所述,獲得一個(gè)筆畫(huà)的結(jié)束點(diǎn)51,交點(diǎn)52,和角點(diǎn)53,并從這些點(diǎn)中減去一個(gè)預(yù)定的長(zhǎng)度,從而可獲得筆畫(huà)的線寬差異。在明朝字體中,圖9B中所示的筆畫(huà)方向61和62間的線寬是不同的。相應(yīng)地,需獲得筆畫(huà)61和62的筆畫(huà)線寬差異或筆畫(huà)61和62方向上的筆畫(huà)線寬差異。
因此,可獲得表示線寬差異的特征量。根據(jù)所獲得的特征量,識(shí)別手寫(xiě)字符或打印字符,從而可更準(zhǔn)確地實(shí)現(xiàn)辨別處理。
下面將要描述提取上述各種特征參數(shù)的處理。
(1)提取復(fù)雜性(線密度)字符的復(fù)雜性是一個(gè)表示用于從上述其它的字符類型中辨別出中文字符的特征量的有效參數(shù)??蓮墓P畫(huà)的數(shù)目等中獲得字符的復(fù)雜性,但是對(duì)于更方便更快速的處理來(lái)講,則需要根據(jù)線密度來(lái)獲得字符的復(fù)雜性。下面將要描述根據(jù)線密度提取復(fù)雜性的處理。
圖10為根據(jù)本發(fā)明的一個(gè)實(shí)施例的復(fù)雜性提取處理的流程圖。圖11表示提取復(fù)雜性(線密度)的處理的概念。
為了從字符圖象數(shù)據(jù)中提取復(fù)雜性,如圖10和11(步驟S11)所示,需把字符數(shù)據(jù)的線密度投影到0度,45度和90度的方向上。然后,獲得并存儲(chǔ)根據(jù)0度,45度和90度方向上的投影所得到的線密度平均值(步驟S12)。
例如,為了獲得45度方向上的線密度,則需對(duì)字符圖象數(shù)據(jù)的象素進(jìn)行對(duì)角掃描以獲得象素的數(shù)目,其中象素中的白色象素被轉(zhuǎn)換成黑色象素。在圖11中所示的情況下,除去字符‘+’71的中央部分外,象素的數(shù)目為2,其中象素中的白色象素被轉(zhuǎn)換成黑色象素。由于該字符的中央部分為1,因此進(jìn)行如圖11所示的處理。
如上所述,獲得每個(gè)方向上的線密度,和一個(gè)密度值的平均值,從而可提取相應(yīng)于字符圖象數(shù)據(jù)的復(fù)雜性的特征參數(shù)。
(2)提取線性打印字符包括多個(gè)線性元素,并且在從手寫(xiě)字符中辨別打印字符時(shí),線性為一個(gè)有效參數(shù)。
圖12為一個(gè)表示根據(jù)本發(fā)明的實(shí)施例的線性提取處理的流程圖。圖13表示線性提取處理的概念。
為了從字符圖象數(shù)據(jù)中提取線性,首先需提取字符圖象數(shù)據(jù)的邊緣(步驟S21)。例如,在圖13中所示的字符圖象‘+’81的情況下,需提取邊緣圖象82,其中邊緣圖象82表示為用黑色框起的白色字符。
然后,計(jì)算水平游程的長(zhǎng)度,并且存儲(chǔ)比預(yù)定長(zhǎng)度長(zhǎng)的游程的數(shù)目(步驟S22)。在圖13所示的例子中,提取水平方向上比預(yù)定長(zhǎng)度長(zhǎng)的游程,并把這種游程的數(shù)目存儲(chǔ)起來(lái)。
相似地,計(jì)算垂直方向上連續(xù)游程的長(zhǎng)度,并且存儲(chǔ)比預(yù)定長(zhǎng)度長(zhǎng)的游程的數(shù)目(步驟S23)。在圖13所示的例子中,提取垂直方向上比預(yù)定長(zhǎng)度長(zhǎng)的游程,并把這種游程的數(shù)目存儲(chǔ)起來(lái)。
如上所示,提取在水平方向上和垂直方向上比預(yù)定長(zhǎng)度長(zhǎng)的游程,并且計(jì)算這種游程的數(shù)目,從而可提取相應(yīng)于每個(gè)方向的線性的特征參數(shù)。
(3)提取線寬差異筆畫(huà)的線寬差異是一個(gè)用于從打印字符中辨別手寫(xiě)字符的有效參數(shù)。如上所述,手寫(xiě)字符一般表示較大的線寬差異,然而打印字符一般表示較小的線寬差異。然而,在明朝字體中,修飾符被添加到筆畫(huà)的結(jié)束點(diǎn)和角點(diǎn)上。如果在線寬差異的計(jì)算中也對(duì)這些修飾符進(jìn)行了計(jì)算,則線寬差異將變大,打印字符就會(huì)被誤認(rèn)為是手寫(xiě)字符。另外,在明朝字體中,線寬取決于上述筆畫(huà)的方向。
根據(jù)本實(shí)施例,需獲得筆畫(huà)的一個(gè)結(jié)束點(diǎn),一個(gè)交點(diǎn),和一個(gè)角點(diǎn),并從這些點(diǎn)中移去預(yù)定長(zhǎng)度的部分,獲得筆畫(huà)的線寬差異,并獲得每個(gè)筆畫(huà)或每個(gè)筆畫(huà)方向上的線寬差異。
圖14表示一個(gè)根據(jù)本發(fā)明的實(shí)施例的線寬差異提取處理的流程圖。圖15表示線寬差異提取處理的概念。
為了從字符圖象數(shù)據(jù)中提取線寬差異,首先需對(duì)字符圖象的行進(jìn)行細(xì)化,以獲得一個(gè)細(xì)化行圖象(步驟S31)。例如,在圖15中所示的例子中,可通過(guò)對(duì)一個(gè)原始圖象91的行進(jìn)行細(xì)化來(lái)獲得一個(gè)細(xì)化行圖象92。
然后,從該細(xì)化行圖象92中獲得結(jié)束點(diǎn)93-96,交點(diǎn)97,和角點(diǎn)。通過(guò)從該細(xì)化行圖象92中移去結(jié)束點(diǎn)93-96,交點(diǎn)97,和角點(diǎn)的周圍的象素,可獲得一個(gè)細(xì)化行圖象98(步驟S32和S33)。
然后,獲得每個(gè)點(diǎn)的向量,其中點(diǎn)為留在步驟S33中所獲得的細(xì)化行圖象中的點(diǎn),并獲得垂直于向量方向上的線寬(步驟S34)。在圖15所示的例子中,獲得每個(gè)留在細(xì)化行圖象98中的點(diǎn)在水平方向上的線寬H和在垂直方向上的線寬V。
獲得向量在各個(gè)方向上的線寬H的差異和V的差異(標(biāo)準(zhǔn)偏差),并且存儲(chǔ)一個(gè)平均值(步驟S35)。
如上所述,根據(jù)所獲得的特征參數(shù),可辨別手寫(xiě)字符或打印字符,從而精確地識(shí)別出手寫(xiě)字符和打印字符。另外,在明朝字體中,可通過(guò)獲得從筆畫(huà)中移去筆畫(huà)的結(jié)束點(diǎn),交點(diǎn)和角點(diǎn)后所得到的線寬差異,并獲得上述每個(gè)向量方向上的線寬差異,從而更精確地從打印字符中識(shí)別出手寫(xiě)字符。
(4)提取字符位置差異每個(gè)字符的底線坐標(biāo)的位置差異對(duì)于圖16A中所示的打印字符來(lái)講是小,對(duì)于圖16B中所示的手寫(xiě)字符則是大。因此,位置差異是一個(gè)用于識(shí)別手寫(xiě)字符和打印字符的有效參數(shù)。尤其是,這一方法對(duì)于某個(gè)領(lǐng)域是高效的,例如對(duì)于將輸入數(shù)字字符的列表的數(shù)值列。
圖17表示根據(jù)本發(fā)明的一個(gè)實(shí)施例的提取字符位置差異的處理的流程圖。
為了從字符圖象數(shù)據(jù)中提取線寬差異,需獲得一個(gè)區(qū)域內(nèi)的連通黑色象素的封閉矩形(步驟S41)。例如,對(duì)于圖16B所示的連通元素,需獲得圖16C所示的封閉矩形101-106。
然后,(步驟S42)獲得并存儲(chǔ)封閉矩形101-106的底線坐標(biāo)Y1-Y6的差異(標(biāo)準(zhǔn)偏差)。
通過(guò)執(zhí)行上述處理,可獲得有關(guān)于字符位置差異的特征參數(shù)。通過(guò)使用這些特征參數(shù),可在某個(gè)領(lǐng)域中準(zhǔn)確地識(shí)別出手寫(xiě)字符和打印字符,例如在將輸入數(shù)字字符的列表的值列等中。
根據(jù)上述實(shí)施例,可獲得下述效果。
(1)由于可使用特征向量來(lái)識(shí)別手寫(xiě)字符和打印字符,因此可在短時(shí)間內(nèi)實(shí)現(xiàn)準(zhǔn)確的識(shí)別處理,其中特征向量中包括一個(gè)至少表示字符圖案的復(fù)雜性和線性的特征量。
(2)可通過(guò)把線密度作為表示復(fù)雜性的特征來(lái)快速,方便地獲得表示復(fù)雜性的特征。
(3)通過(guò)使用一個(gè)特征量來(lái)識(shí)別手寫(xiě)字符和打印字符,可更準(zhǔn)確地從打印字符中識(shí)別出手寫(xiě)字符,而不會(huì)受到由于對(duì)字體例如明朝字體添加修飾符等所造成的影響,其中所使用的特征量為線寬差異,其中線寬差異是通過(guò)從圖案中移去一定的圖案后得到的,所移去的圖案為距離包括在字符圖案中的字符筆畫(huà)的結(jié)束點(diǎn),交點(diǎn)和角點(diǎn)預(yù)定距離的圖案。
(4)通過(guò)獲得每個(gè)筆畫(huà)或每個(gè)筆畫(huà)方向上的線寬差異,可提取線寬差異,而不會(huì)受到由于明朝字體的筆畫(huà)方向所造成的線寬不同的影響,從而可更準(zhǔn)確地識(shí)別手寫(xiě)字符和打印字符。
權(quán)利要求
1.一種用于識(shí)別一個(gè)字符的方法,包括如下步驟從文件或列表的圖象中提取一個(gè)字符圖案;從該字符圖案中獲得N個(gè)特征向量,其中特征向量中包括一個(gè)至少表示該字符圖案的復(fù)雜性和線性的特征;和使用該特征向量來(lái)辨別手寫(xiě)字符和打印字符間的字符圖案,并根據(jù)辨別結(jié)果執(zhí)行字符識(shí)別處理。
2.根據(jù)權(quán)利要求1所述的方法,其中線密度用作一種表示復(fù)雜性的特征。
3.一種用于識(shí)別一個(gè)字符的方法,包括如下步驟從文件或列表的圖象中提取一個(gè)字符圖案;提取一個(gè)表示線寬差異的特征量,其中線寬差異是通過(guò)從字符圖案中移去一定圖案后得到的,其中所移去的圖案為距包括在字符圖案中的字符筆畫(huà)的結(jié)束點(diǎn),交點(diǎn)和角點(diǎn)預(yù)定距離的圖案;至少根據(jù)特征量從打印字符中辨別出手寫(xiě)字符;和根據(jù)辨別結(jié)果識(shí)別一個(gè)字符。
4.根據(jù)權(quán)利要求3所述的方法,其中獲得每個(gè)筆畫(huà)或筆畫(huà)方向上的所述線寬差異。
5.一種字符識(shí)別裝置,包括用于從文件或列表的圖象中提取字符圖案的裝置;用于在手寫(xiě)字符和打印字符間辨別字符圖案的手寫(xiě)/打印字符辨別裝置;和用于根據(jù)辨別結(jié)果識(shí)別字符的字符識(shí)別裝置,其中所述手寫(xiě)/打印字符辨別裝置包括復(fù)雜性提取裝置,用于從字符圖案中提取表示字符圖案的復(fù)雜性的特征;線性提取裝置,用于提取表示線性的特征;和辨別裝置,用于根據(jù)N個(gè)特征向量來(lái)辨別手寫(xiě)字符和打印字符間的字符圖案,其中特征向量中至少包括一個(gè)表示復(fù)雜性的特征和一個(gè)表示線性的特征。
6.根據(jù)權(quán)利要求5所述的裝置,其中所述復(fù)雜性提取裝置通過(guò)從字符圖案中獲得線密度來(lái)提取表示復(fù)雜性的特征。
7.一種字符識(shí)別裝置,包括用于從文件或列表的圖象中提取字符圖案的裝置;用于在手寫(xiě)字符和打印字符間辨別字符圖案的手寫(xiě)/打印字符辨別裝置;和用于根據(jù)辨別結(jié)果識(shí)別字符的字符識(shí)別裝置,其中所述手寫(xiě)/打印字符辨別裝置包括線寬差異提取裝置,用于提取一個(gè)表示線寬差異的特征量,其中線寬差異是通過(guò)從字符圖案中移去一定圖案后得到的,其中所移去的圖案為距包括在字符圖案中的字符筆畫(huà)的結(jié)束點(diǎn),交點(diǎn)和角點(diǎn)預(yù)定距離的圖案;和辨別裝置,用于至少根據(jù)一個(gè)表示線寬差異的特征量,在手寫(xiě)字符和打印字符間辨別字符圖案。
8.根據(jù)權(quán)利要求7所述的裝置,其中所述線寬差異提取裝置需獲得每個(gè)筆畫(huà)或筆畫(huà)方向上的線寬差異。
9.一種字符識(shí)別裝置包括特征識(shí)別裝置,用于識(shí)別從輸入圖象中所提取的圖案的特征;手寫(xiě)字符識(shí)別裝置,用于識(shí)別手寫(xiě)字符;打印字符識(shí)別裝置,用于識(shí)別打印字符;和字符識(shí)別選擇裝置,用于根據(jù)所述特征識(shí)別裝置的識(shí)別結(jié)果來(lái)選擇所述手寫(xiě)字符識(shí)別裝置或所述打印字符識(shí)別裝置。
10.根據(jù)權(quán)利要求9所述的裝置,其中所述特征識(shí)別裝置根據(jù)圖案的規(guī)律性來(lái)辨別手寫(xiě)字符和打印字符間的圖案。
11.根據(jù)權(quán)利要求9所述的裝置,其中圖案的特征至少包括復(fù)雜性,線性,線寬差異,排列位置差異,傾斜度差異,和圖案的大小差異中的一個(gè)。
12.根據(jù)權(quán)利要求11所述的裝置,其中所述復(fù)雜性至少包括線密度,黑色象素的密度,歐拉數(shù)目,和輪廓長(zhǎng)度中的一個(gè)。
13.根據(jù)權(quán)利要求11所述的裝置,其中所述線性是根據(jù)圖案中多個(gè)比預(yù)定長(zhǎng)度長(zhǎng)的行進(jìn)行計(jì)算的。
14.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有字符識(shí)別程序,其中所存儲(chǔ)的字符識(shí)別程序用于識(shí)別從文件或列表的圖象中所提取的字符圖案,其中所述字符識(shí)別程序指示計(jì)算機(jī)執(zhí)行如下步驟從該字符圖案中獲得N個(gè)特征向量,其中特征向量中包括一個(gè)至少表示該字符圖案的復(fù)雜性和線性的特征;和使用該特征向量在手寫(xiě)字符和打印字符間辨別字符圖案。
15.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有字符識(shí)別程序,其中所存儲(chǔ)的字符識(shí)別程序用于識(shí)別從文件或列表的圖象中所提取的字符圖案,其中所述字符識(shí)別程序指示計(jì)算機(jī)執(zhí)行如下步驟提取一個(gè)表示線寬差異的特征量,其中線寬線寬是通過(guò)從字符圖案中移去一定圖案后得到的,其中所移去的圖案為距包括在字符圖案中的字符筆畫(huà)的結(jié)束點(diǎn),交點(diǎn)和角點(diǎn)預(yù)定距離的圖案;和至少根據(jù)特征量從打印字符中辨別出手寫(xiě)字符。
全文摘要
一個(gè)字符圖案是從從文件,列表等中所讀取的圖象數(shù)據(jù)中提取的,并且由手寫(xiě)/打印字符辨別單元在手寫(xiě)字符和打印字符間進(jìn)行辨別。手寫(xiě)/打印字符辨別單元從字符圖案中獲得N個(gè)特征向量,其中特征向量中包括一個(gè)至少表示該字符圖案的復(fù)雜性和線性的特征;并使用所獲得的特征向量來(lái)識(shí)別手寫(xiě)字符和打印字符間的字符圖案。一個(gè)字符識(shí)別單元根據(jù)辨別結(jié)果,即為手寫(xiě)字符還是打印字符,執(zhí)行相應(yīng)的字符識(shí)別處理。
文檔編號(hào)G06K9/46GK1258894SQ99110710
公開(kāi)日2000年7月5日 申請(qǐng)日期1999年7月28日 優(yōu)先權(quán)日1998年12月16日
發(fā)明者柏岡潤(rùn)二, 直井聰 申請(qǐng)人:富士通株式會(huì)社