專利名稱:基于字典模式來識別輸入模式的模式識別設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種對輸入模式進(jìn)行識別的模式識別設(shè)備,具體涉及 一種確定輸入模式與多個不同字典模式中哪一個模式相匹配的模式識 別設(shè)備。
背景技術(shù):
傳統(tǒng)上,諸如光學(xué)字符讀取器(縮寫為OCR)的字符識別設(shè)備通 ?;谀J狡ヅ鋪慝@得字符識別。在模式匹配中,首先,從輸入字符 圖像中提取特征矢量。這里,從輸入字符圖像中提取的特征矢量被稱 作輸入特征矢量。然后,執(zhí)行用于將輸入特征矢量與預(yù)先注冊在字典 數(shù)據(jù)中、與每一個字符相一致的標(biāo)準(zhǔn)特征矢量(以下稱作字典特征矢 量)進(jìn)行對照的處理。提供由對照處理確定為在模式上最相似的、與 字典特征矢量相對應(yīng)的字符,作為識別結(jié)果和輸出。
這里,示出了與特征矢量關(guān)聯(lián)的網(wǎng)狀特征矢量。圖17示出了為了 提取特征矢量從輸入圖像中以矩形剪切出的字符圖像的示例。通過對 圖17中的字符圖像進(jìn)行網(wǎng)狀劃分,將字符圖像劃分成多個區(qū)域。基于 經(jīng)網(wǎng)狀劃分后的字符圖像的每一區(qū)域中像素數(shù)目,對每一區(qū)域中的像 素數(shù)目進(jìn)行諸如歸一化等處理。產(chǎn)生矢量,該矢量包括指示在處理中 所計算出的每一區(qū)域中的像素數(shù)目的值,作為分量。因此,所產(chǎn)生的 矢量被稱作網(wǎng)狀特征矢量。
圖18示出了將圖17中的矩形字符圖像網(wǎng)狀劃分成8X8的64個區(qū)
域的情況。圖19示出了與每一區(qū)域一致的、由圖18所示的網(wǎng)狀劃分圖 像產(chǎn)生的網(wǎng)狀特征矢量的每一個分量。圖19示出了具有64個分量(8 X8)的網(wǎng)狀特征矢量和由64個分量組成的特征矢量所限定的一個字 符。
下面將參照圖20,對模式識別中涉及的字典數(shù)據(jù)811進(jìn)行描述。
5圖20中的字典數(shù)據(jù)811包括多種類型的字典注冊字符CHi (i=l,2,3...,
和n)、和與字典注冊字符Chi相一致的字典特征矢量組VEi (i=l,2,3..., 和n)。字典特征矢量組VEi包括針對相應(yīng)的字典注冊字符CHi的m個字 典特征矢量VTj (j-l,2,3.,.,和m)。這里,字典注冊字符CHi指示標(biāo)識
該字符的字符碼。
特征矢量VTi是指,通過學(xué)習(xí)針對相應(yīng)的字典注冊字符CHi的多種 字體的字符而為各種字體(諸如mincho、粗黑體(gothic)等字體) 統(tǒng)計產(chǎn)生的特征矢量。特征矢量VTi還可以指,通過學(xué)習(xí)斜體字符、 褪色字符(faded character)、模糊字符(blurred charracter)等而統(tǒng)計
產(chǎn)生的特征矢量。
假設(shè)字典數(shù)據(jù)基本針對任一字典注冊字符CHi存儲m個特征矢量 VTj。特別是,學(xué)習(xí)所有的字體來產(chǎn)生第一特征矢量VTl至第m特征矢 量VTm。第一特征矢量VTl指示對所有學(xué)習(xí)矢量取平均的計算結(jié)果。 第二特征矢量VT2指示與第一特征矢量VT1正交的矢量的計算結(jié)果。 類似地執(zhí)行計算,直到特征矢量VTm為止,并且指示計算結(jié)果。
傳統(tǒng)上,在使用特征矢量VTj進(jìn)行模式匹配的運算中,利用城市 街區(qū)距離(city block distance)、歐幾里得距離、相似度等。上述度量 是通常用于模式識別的所有公知的度量。在模式識別中,假設(shè)未知矢 量和標(biāo)準(zhǔn)矢量,對標(biāo)準(zhǔn)矢量和未知矢量之間的距離或相似性進(jìn)行計算, 并輸出基于計算結(jié)果的、由最接近(最相似)字符碼CHi指示的字符 碼作為識別結(jié)果。
在一示例中,由通過網(wǎng)狀劃分成圖19所示的相等部分而產(chǎn)生的包 括64個分量的特征矢量分別限定用作匹配參考的輸入字符和字典注冊 字符,在該示例中,用于計算城市街區(qū)距離和相似度的等式分別如以 下等式(1)和(2)所示。
<formula>formula see original document page 6</formula> …等式(1)
<formula>formula see original document page 6</formula>…等式(2)
X (矢量X包括64個分量,X1,X2,.,.,和X64)表示輸入字符的特征矢量(下文中,被稱作輸入特征矢量),Y(矢量Y包括64個分量,Y1,Y2, ...和Y64)表示用作匹配參考的字典注冊字符CHi的特征矢量。根據(jù)等 式(1)來計算城市街區(qū)距離D,根據(jù)等式(2)來計算簡單相似度S。
如上所述,基于從輸入字符圖像中提取的輸入特征矢量和預(yù)先注 冊的字典特征矢量之間的匹配處理,來執(zhí)行模式匹配。由于該匹配處 理需要時間較長,傳統(tǒng)上,已經(jīng)提出了縮短該時間的方法。
專利文獻(xiàn)l (日本專利未審公開No.63-109592)公開了一種方法, 在針對每一種類型字符的閾值表中注冊用于確定是否執(zhí)行詳細(xì)匹配的 閾值,在字典k和輸入特征矢量之間的距離d超過閾值Thk的時刻停止 匹配。
此外,根據(jù)傳統(tǒng)技術(shù),在匹配處理中,首先,提取到字典中第一 特征矢量的匹配距離小的頭P個字符,并且為了進(jìn)一步詳細(xì)識別,針 對所提取的P個字符,執(zhí)行與第二特征矢量至第Z特征矢量關(guān)聯(lián)的匹 配。
傳統(tǒng)上,加速模式匹配的處理己在諸如OCR等字符識別設(shè)備中使 用,下面將參照圖21對這種加速模式匹配的處理進(jìn)行描述。在以下的 描述中,使用網(wǎng)狀特征矢量來執(zhí)行匹配。
首先,將描述匹配處理的概要。在圖21中,首先,計算輸入字符 和所有字典注冊字符之間的距離。即,計算從輸入字符圖像中提取的 輸入特征矢量和在字典中注冊的所有字符的字典特征矢量之間的距離 (例如,城市街區(qū)距離)。所計算的距離的較小值指示誤差小,并且 輸入字符模式類似于字典注冊字符模式。
在圖21的示例中,通過對輸入特征矢量的分量和字典特征矢量之 間的差值進(jìn)行累加,根據(jù)等式(1)所示的用于計算城市街區(qū)距離的等 式來計算上述距離。
當(dāng)針對所有字典注冊字符的相應(yīng)距離的計算結(jié)束時,提取字典注 冊字符序列中的頭P個字典注冊字符,所述字典注冊字符序列按照所 計算的相應(yīng)距離值的大小升序排列。此后,執(zhí)行針對所提取的P個字 典注冊字符的詳細(xì)匹配。在詳細(xì)匹配中,不僅對距字典的第一特征矢 量的距離執(zhí)行運算,而且對距從第二特征矢量到第Z特征矢量的所有字典特征矢量的距離執(zhí)行運算。
下面將根據(jù)圖21中的流程圖提供詳細(xì)描述。首先,OCR具有光學(xué) 讀取單元、識別單元、以及存儲單元。首先,光學(xué)讀取單元讀取寫在 一張紙上的字符,并且輸出代表讀取結(jié)果的圖像。識別單元接收從光 學(xué)讀取單元輸出的圖像輸入(步驟S101),并且從輸入圖像中剪切字
符圖像(步驟S102)。如專利文獻(xiàn)2 (日本專利未審公開No,63-216188) 所示,以從輸入圖像中提取黑色像素并基于該提取結(jié)果來提取字符行 的方式,來剪切字符圖像。此后,根據(jù)沿垂直于提取行的方向的直方 圖來剪切字符圖像。
對輸入字符圖像進(jìn)行網(wǎng)狀劃分,并且基于多個網(wǎng)狀劃分區(qū)域中的 每一區(qū)域中的像素數(shù)目,對輸入字符圖像進(jìn)行諸如歸一化的處理。基 于該處理結(jié)果,提取(產(chǎn)生)輸入特征矢量(步驟S103)。
然后,對指示匹配計數(shù)器的變量i的值進(jìn)行初始化,S卩,設(shè)置為i^ (步驟S104)。這里,假設(shè)預(yù)先存儲在OCR的存儲器單元中的注冊在 字典中的所有字符的數(shù)目為N。
然后,以如下方式來執(zhí)行將輸入字符(剪切字符)與注冊在字典 中的所有字符中的每一個字符進(jìn)行模式匹配的處理。模式匹配處理是 指,計算輸入字符的輸入特征矢量與注冊在字典中的字符的字典特征 矢量之間的距離。
首先,在輸入字符和注冊字符之間的模式匹配中,進(jìn)行結(jié)束確定 (步驟S105),即,確定對于預(yù)先注冊在字典中的所有字符的距離的 計算是否結(jié)束。這里,當(dāng)確定對所有字符的距離的計算并沒有結(jié)束時 時(i<N),計算輸入特征矢量和注冊在字典中的字符的第一特征矢量 之間的距離,并且將所計算的距離設(shè)置為變量Di (步驟S106)。這里, 變量Di也被稱作距離值Di。
當(dāng)針對一個字典注冊字符計算距離值Di時,變量i的值以l遞增(步 驟SllO)。變量i的遞增值指示到目前為止已結(jié)束距離計算的字典中的 字符的數(shù)目。然后,確定針對字典中所有字符的距離值Di的計算(即, 匹配)是否結(jié)束(步驟S105)。當(dāng)所有字符的匹配已經(jīng)結(jié)束時(不滿 足i〈N的關(guān)系),按照值的大小,將存儲距離計算結(jié)果的變量Di
8(i=0,l,2,3..,N)升序排序(步驟S107)。
執(zhí)行同與指示排序結(jié)果的序列中頭P個變量Di相對應(yīng)的字典注冊 字符的詳細(xì)匹配(步驟S108)。從字典中讀取基于詳細(xì)匹配結(jié)果確定 為在模式上接近輸入字符的字典注冊字符,并作為匹配結(jié)果(即,作 為候選字符)將其輸出(步驟S109)。然后處理結(jié)束。
為了實現(xiàn)與圖21中識別處理過程相比的加速,同樣,已經(jīng)提出了 在計算距離的運算中引入基于閾值的跳過處理的方法。
圖22示出了在基于閾值的跳過處理中涉及的閾值表6002。參照圖 22,結(jié)合注冊在字典數(shù)據(jù)6001中的每一個字符,將針對這樣注冊的字 符的閾值Ti (i^,2,3,…,和n)預(yù)先注冊在閾值表6002中。例如,閾值 Tn是與字典數(shù)據(jù)中的注冊字符CHn相對應(yīng)的閾值。閾值Ti是基于學(xué)習(xí) 數(shù)據(jù)統(tǒng)計計算的值,并且例如確保與字典數(shù)據(jù)6001中的注冊字符Chi 一致的注冊字典特征矢量和注冊字符CHi的任一輸入特征矢量之間的 距離一律在由閾值Ti限定的范圍內(nèi)。
通過對輸入特征矢量和字典特征矢量的分量之間的差值進(jìn)行累 加,來計算輸入字符和字典注冊字符之間的距離。由于針對字典中注 冊的每一個字符來設(shè)置距離的閾值Ti,因此可以執(zhí)行以下處理僅在 累加所計算的值指示該值不大于閾值Ti期間,繼續(xù)執(zhí)行直到下一個分 量的累加運算,當(dāng)累加所計算的值指示該值大于如上所設(shè)置的閾值時, 停止運算。
圖23是模式匹配的流程圖,其中,基于閾值Ti跳過計算距離的運 算。由于圖23中的步驟S201至S205在處理內(nèi)容上類似于圖21中的步驟 S101至步驟S105,將不提供描述。
在計算距離時,如圖21中的處理中的那樣,將輸入字符的輸入特 征矢量和注冊在字典中的字符的字典特征矢量的分量之間的差值進(jìn)行 累加運算。
如上所述,在圖23的處理中;當(dāng)累加所計算的距離值不大于為每 一個字典注冊字符設(shè)置的閾值Ti時,繼續(xù)執(zhí)行直到下一分量的累加運 算,反之,當(dāng)所計算的距離值大于閾值Ti時,停止累加運算,檢測針 對當(dāng)前處理字符的距離,并轉(zhuǎn)向針對下一字符的距離的計算(步驟
9S206至S208)。
在步驟S209中,確定由針對當(dāng)前處理字符的累加計算計算得到的 距離是否等于或小于存儲在閾值表6002中的確定閾值Ti。當(dāng)距離等于 或小于確定閾值Ti時(滿足Di〈Ti的關(guān)系),在該確定中,過程前進(jìn)至 步驟S210,其中,匹配分量計數(shù)器"i"遞增,繼續(xù)執(zhí)行計算距離的運 算。
當(dāng)距離大于確定閾值時(不滿足DKTi的關(guān)系),檢測針對當(dāng)前處 理字符的距離,在步驟S213中,將所計算的距離的最大值存儲在距離 變量Di中,在步驟S214中,匹配字典計數(shù)器"i"遞增,并且過程前進(jìn) 至針對下一字符的距離的計算。
由于后續(xù)處理(步驟S211至S213)在內(nèi)容上類似于圖21的處理, 因此,將不提供描述。上述是通過引入基于閾值的跳過處理來加速模 式匹配的方法的傳統(tǒng)示例。
如上所述,已通過在傳統(tǒng)字符識別設(shè)備中采用減少距離運算次數(shù) 的各種方法,實現(xiàn)了模式匹配的加速。
專利文獻(xiàn)l:日本專利未審公開No.63-109592
專利文獻(xiàn)2:日本專利未審公開No.63-216188
發(fā)明內(nèi)容
本發(fā)明所要解決的問題
在根據(jù)上述傳統(tǒng)技術(shù)使用距離的匹配方法中,未必要求對于特征 矢量的所有分量執(zhí)行用于計算距離的累加。然而,在使用相似度的匹 配中,產(chǎn)生計算相似度最高的字符作為匹配結(jié)果。因此,考慮到匹配 精確性,未選擇僅對特征矢量的部分單元執(zhí)行累加。
艮口,在使用上述距離的匹配處理中,可以應(yīng)用實現(xiàn)加速的方法, 例如,通過預(yù)先設(shè)置要對其執(zhí)行累加的特征矢量的分量數(shù)目,或者通 過設(shè)置閾值,來停止累加,然而,很難應(yīng)用對使用相似度的匹配處理 實現(xiàn)上述加速的方法。
因此,在使用相似度的傳統(tǒng)匹配中,在圖18中的網(wǎng)狀特征矢量的 示例中, 一個特征矢量具有64 (8X8)個分量,計算針對一個注冊字符的距離需要64次運算。
在具有許多字符的語言(例如,日語)中,注冊字符的數(shù)目是3000 個或更多,因此至少應(yīng)當(dāng)執(zhí)行192,000 (64X3000)次運算。此外,在 一個注冊字符的字典特征矢量包括多個特征矢量的示例中,在詳細(xì)匹 配中需要更多次的運算。此外,由于相似度運算是基于乘積-求和的, 因此一次運算所需的時間開銷高于僅通過加法執(zhí)行的距離運算所需的 時間開銷。
因此,在使用相似度的匹配處理中,期望采用快速確定不可能存 在正確結(jié)果的方法,即,在乘積-求和運算之前、不需要乘積-求和運 算的、快速確定字典注冊字符的粗分類方法。
本發(fā)明的目的是提供一種模式識別設(shè)備,能夠以基于相似度的模 式匹配和基于距離的模式匹配的高精確度,來更快速地執(zhí)行識別。
解決問題的技術(shù)方案
根據(jù)本發(fā)明一方面的模式識別設(shè)備包括存儲多個字典模式的字 典單元、字典對照矢量存儲單元、字典對照矢量產(chǎn)生單元、矢量匹配
得分確定單元、和對照單元。
字典對照矢量存儲單元按照與所述多個字典模式中的每一個字 典模式相一致的方式,存儲對照矢量。字典對照矢量由指示相應(yīng)字典 模式特征的指定數(shù)目的分量構(gòu)成,并且每一分量指示1或0。對照矢量 產(chǎn)生單元基于輸入模式,產(chǎn)生輸入對照矢量,所述輸入對照矢量由指
示輸入模式特征的指定數(shù)目的分量構(gòu)成,每一分量指示i或o。矢量匹
配得分確定單元基于從字典對照矢量存儲單元讀取的每一字典對照矢
量和輸入對照矢量的內(nèi)積,來計算匹配得分。對照單元將所述輸入對
照矢量與經(jīng)計算其匹配得分大于指定閾值的所述字典對照矢量進(jìn)行對
照。模式識別設(shè)備執(zhí)行輸入模式和唯一字典模式之間的模式匹配,所 述唯一字典模式與基于對照結(jié)果被確定為與輸入對照矢量相匹配的字
典對照矢量相對應(yīng)。
優(yōu)選地,針對每一字典對照矢量,將指定閾值預(yù)先存儲在字典對 照矢量存儲單元中。
11優(yōu)選地,匹配得分指示字典對照矢量和輸入對照矢量的內(nèi)積值 與輸入對照矢量的指示l的分量的總數(shù)的比值。
優(yōu)選地,匹配得分指示字典對照矢量和輸入對照矢量的內(nèi)積值 與字典對照矢量的指示l的分量的總數(shù)的比值。
優(yōu)選地,特征指示圖像的濃度。
優(yōu)選地,特征指示圖像的濃度,并且分量以1和0指示濃度,并且 當(dāng)輸入對照矢量的指示l的分量的總數(shù)大于預(yù)先設(shè)置的數(shù)值時,匹配得 分指示字典對照矢量和輸入對照矢量的內(nèi)積值與輸入對照矢量的指 示l的分量的總數(shù)的比值。
優(yōu)選地,特征指示圖像的濃度,并且分量以1和0指示濃度。當(dāng)輸 入對照矢量的指示l的分量的總數(shù)等于或小于預(yù)先設(shè)置的數(shù)值時,匹配 得分指示字典對照矢量和輸入對照矢量的內(nèi)積值與字典對照矢量的 指示l的分量的總數(shù)的比值。
根據(jù)本發(fā)明另一方面的模式識別方法是,使用計算機(jī)的模式識別 方法,所述計算機(jī)包括字典單元,存儲多個字典模式;以及字典對 照矢量存儲單元,按照與所述多個字典模式中的每一個字典模式相一 致的方式,存儲字典對照矢量,所述字典對照矢量由指示所述字典模
式特征的指定數(shù)目的分量構(gòu)成,每一分量指示i或o。
該模式識別方法包括以下步驟基于輸入模式,產(chǎn)生由指示輸入 模式特征的所述指定數(shù)目的分量構(gòu)成的輸入對照矢量,每一分量指示l 或O;基于從字典對照矢量存儲單元讀取的每一個字典對照矢量與輸入 對照矢量的內(nèi)積,計算匹配得分;將所述輸入對照矢量與經(jīng)計算其匹 配得分大于指定閾值的所述字典對照矢量進(jìn)行對照;以及執(zhí)行輸入模 式和唯一字典模式之間的模式匹配,所述唯一字典模式與基于前述對 照結(jié)果被確定為與輸入對照矢量相匹配的字典對照矢量相對應(yīng)。
根據(jù)本發(fā)明的又一方面,提供了一種使計算機(jī)執(zhí)行上述模式識別 方法的模式識別程序。
根據(jù)本發(fā)明的又一方面,提供了一種記錄著使計算機(jī)執(zhí)行上述模 式識別方法的程序的機(jī)器可讀記錄介質(zhì)。本發(fā)明的有益效果
根據(jù)本發(fā)明,基于輸入對照矢量和字典對照矢量之間的匹配得 分,來檢查輸入模式是否類似于字典模式,并且字典對照矢量包括由l 或0指示其值的分量。這里,由于匹配得分是基于輸入對照矢量和字典 對照矢量的內(nèi)積來計算的,因此可以迅速獲得匹配得分。此外,可以 快速地執(zhí)行對照。
因此,在模式識別中,減少了耗時的相似度運算的運算次數(shù),并 且可以更快速地識別輸入模式。
圖l是根據(jù)本實施例的字符識別設(shè)備的主要部分的功能配置圖。
圖2是計算機(jī)的配置圖,所述計算機(jī)上安裝了根據(jù)本實施例的字
符識別設(shè)備。
圖3是根據(jù)本實施例的整個處理的流程圖。
圖4是特征提取單元中的處理的流程圖。
圖5是示出了根據(jù)本實施例的網(wǎng)狀區(qū)域的圖。
圖6 (A)至(C)是示出了對照矢量提取單元中的處理的圖。
圖7是示出了輸入對照矢量累加緩沖器中的示例性內(nèi)容的圖。
圖8 (A)和(B)是示出了字典對照矢量累加緩沖器中的示例性
總體內(nèi)容的圖。
圖9是示出了字典對照矢量累加緩沖器中的示例性具體內(nèi)容的圖。
圖10 (A)至(H)是示意性地示出了對照矢量匹配得分確定單 元中的處理過程的圖。
圖ll (A)至(H)是示意性地示出了閾值產(chǎn)生單元中的處理過程 的圖。
圖12是用于產(chǎn)生值的處理的流程圖。
圖13是示出了對照矢量提取單元所使用的示例性表的圖。
圖14是示出了模式匹配單元中的處理過程的示例的圖。
圖15是示出了模式匹配單元中的處理過程的另一示例的圖。
13圖16是示出了濃度確定處理過程的圖。 圖17是示出了輸入字符圖像的示例的圖。
圖18是示出了對輸入字符圖像進(jìn)行網(wǎng)狀劃分的情況的圖。 圖19是示出了特征矢量的每一個分量的圖。
圖20是示出了應(yīng)用至傳統(tǒng)示例和本實施例的字典數(shù)據(jù)的圖。 圖21是示出了傳統(tǒng)處理過程的示例的圖。 圖22是示出了傳統(tǒng)閾值表的圖。 圖23是示出了傳統(tǒng)處理過程的另一示例的圖。
附圖標(biāo)記說明
1字符識別設(shè)備;805特征提取單元;811字典數(shù)據(jù);813字典 對照矢量累加緩沖器;821模式匹配單元;822濃度確定單元;823對 照矢量提取單元;824對照矢量匹配得分確定單元;825輸入對照矢 量累加緩沖器;826閾值產(chǎn)生單元;827第一矢量相似度計算單元; 以及828詳細(xì)相似度計算單元。
具體實施例方式
下文將根據(jù)附圖對本發(fā)明的實施例進(jìn)行描述。 (第一實施例) (功能配置)
圖l示出了根據(jù)本實施例的字符識別設(shè)備l的主要部分的功能配 置。圖2示出了根據(jù)本實施例的計算機(jī)的配置。
圖2是計算機(jī)的配置圖,所述計算機(jī)上安裝了根據(jù)本實施例的字 符識別設(shè)備l。參照圖2,計算機(jī)包括圖像輸入單元101;顯示器610, 由CRT (陰極射線管)或液晶實現(xiàn);CPU (中央處理單元)622,用于 以集中方式來管理和控制計算機(jī)本身;存儲器624,被配置成包括ROM (只讀存儲器)或RAM (隨機(jī)存取存儲器);硬盤626; FD 632可拆卸 地裝入其中的FD(軟盤)驅(qū)動器630,用于訪問裝入的FD 632; CD-ROM 642可拆卸地裝入其中的CD-ROM (緊致盤只讀存儲器)驅(qū)動器640, 用于訪問裝入的CD-ROM 642;通信接口680,用于建立通信網(wǎng)絡(luò)300和計算機(jī)之間的通信連接;打印機(jī)390;以及包含鍵盤650和鼠標(biāo)660 在內(nèi)的輸入單元700。為了通信可以通過總線連接這些單元。
圖像輸入單元101具有掃描儀,掃描儀可選地讀取寫在一張紙上 的字符并輸出圖像數(shù)據(jù)。可選地,圖像輸入單元101具有諸如攝像機(jī)等 攝像單元,該圖像采集單元拍攝寫在一張紙上的字符并輸出圖像數(shù)據(jù)。
為了訪問磁帶,計算機(jī)可以配備盒式磁帶可拆卸地裝入其中的磁 帶裝置。
參照圖l,字符識別設(shè)備1連接至與輸入單元700相對應(yīng)的輸入單 元800、與圖像輸入單元101相對應(yīng)的輸入單元801、與打印機(jī)690或顯 示器610相對應(yīng)的輸出單元802。字符識別設(shè)備l包含控制單元803, 與CPU622等相對應(yīng);剪切單元804,從所提供的圖像數(shù)據(jù)中提取(剪 切)字符部分的數(shù)據(jù);特征提取單元805,從由剪切字符圖像數(shù)據(jù)指示 的字符中提取特征;匹配單元820,執(zhí)行字典特征矢量和輸入特征矢量 之間的模式匹配;輸入對照矢量累加緩沖器825,用于存儲字典數(shù)據(jù)811
和用于對照輸入特征矢量的矢量;字典對照矢量累加緩沖器813,對用 于對照字典特征矢量的矢量進(jìn)行累加;和存儲器814。
存儲器814用作處理圖像數(shù)據(jù)、字符模式等的工作區(qū),并且存儲 器814是用于存儲在字符識別處理過程中獲得的中間數(shù)據(jù)等的區(qū)域。
匹配單元820包括模式匹配單元821,執(zhí)行字典特征矢量和輸入 特征矢量之間的模式匹配。模式匹配單元821包括濃度確定單元822, 確定輸入模式的濃度;對照矢量提取單元823,根據(jù)輸入特征矢量的分 量值來提取輸入對照矢量;對照矢量匹配得分確定單元824,確定輸入 特征單元是否類似于字典特征矢量;閾值產(chǎn)生單元826;第一矢量相似 度計算單元827;以及詳細(xì)相似度計算單元828。
圖20中的字典數(shù)據(jù)811、閾值緩沖器812、字典對照矢量累加緩沖 器813、存儲器814、以及輸入對照矢量累加緩沖器825與存儲器624、 硬盤626和CD-ROM 624相對應(yīng)。
可以通過執(zhí)行相應(yīng)的程序,來實現(xiàn)剪切單元804和特征提取單元 805以及匹配單元820中的每一個單元的功能。g卩,將程序預(yù)先存儲在 存儲器624、硬盤626、 FD 632、 CD-ROM 642等中,并通過由CPU622
15讀取和執(zhí)行該程序來實現(xiàn)相應(yīng)的功能。盡管這里假設(shè),每個單元的功 能可以由程序?qū)崿F(xiàn),然而所述功能還可以由全部或部分電路來實現(xiàn)。 (匹配處理)
圖20示出了根據(jù)本實施例的字典數(shù)據(jù)811的部分配置。
下面將參照圖3的流程圖對字符識別設(shè)備1中的匹配處理的概要 進(jìn)行描述。例如,流程圖被作為程序存儲在存儲器624中,并且匹配處 理因從存儲器624中讀取程序指令并由CPU 622執(zhí)行程序指令得以執(zhí) 行。
首先,用戶操作圖像輸入單元801可選地對寫上字符的一張紙面 (文檔)進(jìn)行掃描,或者對紙面攝像,使得圖像輸入單元801獲得圖像 數(shù)據(jù)輸入。圖像輸入單元801向字符識別設(shè)備1輸出所獲得的圖像數(shù)據(jù)。 字符識別設(shè)備1從圖像輸入單元801接收圖像數(shù)據(jù)輸出。將所接收的圖 像數(shù)據(jù)存儲在存儲器814中(步驟S (下文簡寫為S) 1)。從圖像輸入 單元801輸出的圖像數(shù)據(jù)指示二值化的圖像數(shù)據(jù),圖像的每一個像素具 有白或黑值,即,呈現(xiàn)濃度作為特征。
剪切單元804執(zhí)行讀取存儲在存儲器814中的圖像數(shù)據(jù),并對所讀 取圖像數(shù)據(jù)執(zhí)行剪切處理。即,剪切單元804從圖像數(shù)據(jù)中剪切與字符 相對應(yīng)的圖像數(shù)據(jù)作為字符模式(輸入模式)數(shù)據(jù)。剪切字符模式數(shù) 據(jù)指矩形模式數(shù)據(jù)(S2)。例如,根據(jù)日本專利未審公開No.63-216188 所示的過程,剪切字符模式數(shù)據(jù)(以下稱作字符模式)。即,從輸入圖 像數(shù)據(jù)中提取黑色像素,并且基于所提取的黑色像素來辨別輸入圖像 中的字符行。此后,根據(jù)沿垂直于所辨別的行的方向的黑色像素的直 方圖,來剪切字符模式。例如,這里假設(shè)已剪切出圖17中的字符模式。 圖17中的字符模式由包括黑色像素的字符區(qū)和包括白色像素的字符背 景區(qū)構(gòu)成。將剪切單元804剪切的字符模式存儲在存儲器814中。
特征提取單元805從存儲器814中讀取字符模式,并且從讀取的字 符模式中提取字符模式的特征。提取該特征作為輸入特征矢量(S3)。 此后,執(zhí)行模式匹配(S4)。圖4示出了提取輸入特征矢量的詳細(xì)過程。
參照圖4,特征提取單元805將從存儲器814中讀取的字符模式(例 如,圖17中的字符模式)的矩形區(qū)劃分成存儲器814工作區(qū)中的多個網(wǎng)狀區(qū)(S31)。這里,如圖12所示,將矩形字符模式劃分成相等的64個
或8X8個方形區(qū)域。在本實施例中,如圖5所示,從字符模式的矩形區(qū) 域的左上角到右下角,將被劃分成相等部分的64個區(qū)域順序地標(biāo)記為 el,e2,e3,…,和e64。
此外,特征提取單元805對指示包括在被劃分成相等部分的64個 區(qū)域中的每一個區(qū)域中的像素中的字符區(qū)(黑色像素)的像素數(shù)目進(jìn) 行計數(shù),繼而對其進(jìn)行歸一化,使得每一區(qū)域中的已計數(shù)的黑色像素 數(shù)目的平方和為常數(shù)(S33)。執(zhí)行歸一化,使得分量值的平方和恒定 地達(dá)到例如65536。
特征提取單元805輸出的輸入特征矢量具有64個歸一化分量。每 一分量指示經(jīng)歸一化的黑色像素的數(shù)目。將所提取的輸入特征矢量存 儲在存儲器814中(S35)。此后,處理前進(jìn)至圖3中的步驟S4。
這里,歸一化是指計算針對64個區(qū)域中的每一個區(qū)域進(jìn)行計數(shù) 的黑色像素數(shù)目的平方值;針對所有的64個區(qū)域,計算已算得的每一 個區(qū)域中的黑色像素數(shù)目的平方值的和;并且調(diào)整輸入特征矢量的每 一個分量,使和到達(dá)指定值。由于歸一化的緣故,如果輸入字符模式 是相同字體的"A",則32像素X32像素的字符模式的輸入特征矢量和 64像素X64像素的字符模式的輸入特征矢量均指示相同值的矢量。因 此,無論字符的大小如何,相同字體的相同字符與字典矢量相比具有 相同的輸入特征。
模式匹配單元821從存儲器814中讀取輸入特征矢量,并通過使用
讀取的輸入特征矢量和預(yù)先存儲在字典數(shù)據(jù)811中的字典特征矢量 VTj來執(zhí)行模式匹配處理(S4)。 g卩,模式匹配單元821通過使用輸入 特征矢量和從字典數(shù)據(jù)811中讀取的字典特征矢量VTj,來執(zhí)行輸入字 符和字典注冊字符之間的模式匹配處理。
下面將描述用于這樣的模式匹配處理的每個單元的功能。 (第一矢量相似度計算單元)
以下是第一矢量相似度計算單元827的相似度計算的具體過程。 具體地,針對輸入字符模式和字典注冊字符CHi的字符模式,第一矢 量相似度計算單元827,在圖5的64個網(wǎng)狀劃分的區(qū)域中,將區(qū)域ex"=1,2,3,...,和64)中的黑色像素的比率乘以相應(yīng)區(qū)域中的黑色像素
的比率。即,將組成輸入特征矢量的64個分量中的分量值乘以組成字 典特征矢量VTi的64個分量中的相應(yīng)分量的值。然后,對指示針對圖5 中el至e64的64個區(qū)域(64個分量)的乘積結(jié)果的所有值求和。該求和 結(jié)果指示相似度。
當(dāng)?shù)谝皇噶肯嗨贫扔嬎銌卧?27計算相似度時,模式匹配單元821 首先執(zhí)行關(guān)于每一字典特征矢量組VEi中的第一特征矢量VTl的粗匹 配。因此,獲得64個運算結(jié)果(乘積值)。然后,對于與乘積值大于指 定閾值的第一特征矢量VTl相對應(yīng)的每一個字典注冊字符CHi,執(zhí)行關(guān) 于相應(yīng)的第二特征矢量VT2至第m特征矢量VTm的運算?;谶\算結(jié) 果,輸出識別結(jié)果。
(對照矢量提取單元)
下面將參照圖6 (A)至(C)描述對照矢量提取單元823。例如, 對照矢量提取單元823根據(jù)圖6 (A)中的輸入特征矢量100產(chǎn)生圖6 (B) 中的輸入對照矢量IOI,此后,基于所產(chǎn)生的輸入對照矢量101來產(chǎn)生 圖6 (C)中的對照矢量表925。將所產(chǎn)生的輸入對照矢量表925存儲在 圖7中的輸入對照矢量累加緩沖器825中。
具體地,對照矢量提取單元823從存儲器814中讀取圖6 (A)中的 輸入特征矢量IOO。然后,將讀取的輸入特征矢量100的64個分量中每 一個分量的值與指定閾值(這里假設(shè)指定閾值為32)相比較?;诒?較的結(jié)果,來產(chǎn)生輸入對照矢量IOI。這里,指定閾值是指用于將特征 矢量的分量分類成具有較高值的分量和具有較低值的分量的閾值。如 前面結(jié)合歸一化描述的那樣,這里分量值的平方和是65536。因此,如 果假設(shè)所有分量指示相同的值,那么每一分量的值指示32。艮卩, 32x32x64 = 65536,因此,這里采用32作為指定閾值。因此,通過在 歸一化中獲得的求和值來確定指定閾值。因此,指定閾值不限于32。
首先,對照矢量提取單元823產(chǎn)生由64個分量組成的矢量(稱作 生成矢量)。這里,將生成矢量的每一分量的值設(shè)置為例如"O"。此后, 基于上述比較的結(jié)果,在圖6 (A)中輸入特征矢量100的64個分量中, 僅將分量值被確定為大于指定閾值(=32)的生成矢量的分量的值設(shè)置為"1"(與分量值被確定為不大于指定閾值的分量相對應(yīng)的生成矢 量的分量的值保持為"0")。因此,如圖6 (B)所示,生成矢量指示
具有64個被分配以值"1"或"0"的分量的輸入對照矢量101。僅將生 成的輸入對照矢量101在存儲器814中存儲一次。
此外,對照矢量提取單元823從存儲器814中讀取圖6 (B)中的輸 入對照矢量IOI,并順序地逐行提取所讀取的輸入對照矢量101的64個 分量的值作為比特行(如圖6 (B)的箭頭AR所示)。因此,提取總共 8個比特行。每個所提取的比特行具有8比特長度。此后,對照矢量提 取單元823產(chǎn)生圖6 (C)中的輸入對照矢量表925,輸入對照矢量表925 按從輸入對照矢量101中提取的順序來存儲8個比特行。將生成的輸入 對照矢量表925存儲在輸入對照矢量累加緩沖器825中。
輸入對照矢量表925按照從輸入對照矢量101中提取的順序,將8 個比特行存儲為記錄IRk (k-l,2,3,4,5,6,7和8)。此外,對照矢量提取 單元823對在生成的輸入對照矢量101的64個分量中分量值指示"1"的 分量進(jìn)行計數(shù),(即,在64個分量中,其值大于指定閾值的分量的總 數(shù)),并且將計數(shù)值存儲在輸入對照矢量累加緩沖器825中作為輸入計 數(shù)數(shù)據(jù)926。在圖6 (B)的示例中,輸入計數(shù)數(shù)據(jù)926指示"27"。 (字典對照矢量累加緩沖器)
圖8 (A)和(B)示出了字典對照矢量累加緩沖器813中的示例性 內(nèi)容。在本實施例中,如輸入特征矢量100的情況那樣,同樣針對字典 數(shù)據(jù)811中的每一個字典注冊字符CHi,為相應(yīng)的字典特征矢量VTj計 算與輸入對照矢量表926相對應(yīng)的字典對照矢量表Dlj和與輸入計數(shù)數(shù) 據(jù)926相對應(yīng)的字典計數(shù)數(shù)據(jù)D2j,并且將上述計算值彼此相關(guān)聯(lián)地存 儲在字典對照矢量累加緩沖器813中。
如圖8 (A)所示,字典對照矢量累加緩沖器813預(yù)先將與字典特 征矢量VTj相關(guān)聯(lián)的數(shù)據(jù)Dj存儲在字典數(shù)據(jù)811中,字典特征矢量VTj 與字典注冊字符CHi相對應(yīng)。參照圖8 (A),數(shù)據(jù)Dj具有針對相關(guān)聯(lián) 的字典特征矢量VTj計算的字典對照矢量表Dlj、字典計數(shù)數(shù)據(jù)D2j、 確定閾值(字典)數(shù)據(jù)D3j、以及確定閾值(輸入)數(shù)據(jù)D4j。稍后將 描述確定閾值(字典)數(shù)據(jù)D3j和確定閾值(輸入)數(shù)據(jù)D4j。圖8 (B)
19示出了示例性的字典對照矢量表Dlj。如同輸入對照矢量表925的情況
一樣,字典對照矢量表Dlj具有長度為8比特的8個記錄RRk(k-l,2,3,..., 和8)。
例如,當(dāng)開啟字符識別設(shè)備1并加載字典數(shù)據(jù)811時,可以基于所 加載的字典數(shù)據(jù)811來計算數(shù)據(jù)Dj,并將其存儲在字典對照矢量累加緩 沖器813中。
圖9示出了字典對照矢量累加緩沖器813中的示例性具體內(nèi)容。例 如,在圖9中的字典特征矢量VTj的情況下,對照矢量提取單元823計 算圖9中的字典對照矢量表Dlj和字典計數(shù)數(shù)據(jù)D2j,并繼而將其存儲。 此外,計算并存儲閾值(字典)數(shù)據(jù)D3j和閾值(輸入)數(shù)據(jù)D4j,閾 值(字典)數(shù)據(jù)D3j用于基于字典對照矢量表Dlj中值為"1"的分量的 數(shù)目來確定匹配得分,閾值(輸入)數(shù)據(jù)D4j用于基于輸入對照矢量101 的指示"1"的分量的數(shù)目來確定匹配得分。 (對照矢量匹配得分確定單元)
下面將描述對照矢量匹配得分確定單元824。圖IO (A)至(H) 示意性地示出了對照矢量匹配得分確定單元824中的處理過程。這里假 設(shè),對照矢量提取單元823分別根據(jù)圖10 (A)和(B)中的字典特征 矢量VTj和輸入特征矢量lOO,來計算圖IO (C)和(D)中的字典對照 矢量表D1J和輸入對照矢量表101,以及圖IO (F)和(G)中的字典計 數(shù)數(shù)據(jù)D2j和輸入計數(shù)數(shù)據(jù)926。
對照矢量匹配得分確定單元824產(chǎn)生要用于確定的數(shù)據(jù)。g卩,逐 比特地計算輸入對照矢量表101的記錄IRk的8比特數(shù)據(jù)和字典對照矢 量表Dlj的記錄RRk的8比特數(shù)據(jù)的邏輯積。計算記錄IRk的數(shù)據(jù)和記錄 RRk的數(shù)據(jù)的邏輯積,直到變量k的值順序地從l遞增至8為止。因此, 獲得圖IO (E)所示的邏輯積數(shù)據(jù)200,邏輯積數(shù)據(jù)200包括存儲著記 錄IRk和RRk的邏輯和(8比特數(shù)據(jù))的8個記錄R。將邏輯積數(shù)據(jù)200 臨時存儲在存儲器814中。
接著,對照矢量匹配得分確定單元824讀取存儲器814中的邏輯積 數(shù)據(jù)200的每一記錄R的數(shù)據(jù),并且對由讀取數(shù)據(jù)指示的8個比特中指 示"1"的比特的數(shù)目進(jìn)行計數(shù)。所獲得的總數(shù)指示字典對照矢量VTj和輸入對照矢量100的內(nèi)積值201 (見圖IO (H))。這里,內(nèi)積值201指 示"7"。將所計算的內(nèi)積值201存儲在存儲器814中。稍后將描述通過 對照矢量匹配得分確定單元824確定匹配得分的細(xì)節(jié)。
在將由字典矢量VTj (其中,每一分量的值為0或1)產(chǎn)生的字典 對照矢量表Dlj,和通過使用與字典對照矢量表Dlj (其中,每一分量 值為0或1)中相同的閾值由輸入特征矢量100產(chǎn)生的輸入對照矢量表 IOI比較時,如果兩個字符具有相同類型,則兩個表中值為"1"的分 量的位置匹配程度高,因此,內(nèi)積值201的值變得更大。因此,更大的 內(nèi)積值201指示輸入字符的模式和字典注冊字符CHi的模式之間匹配 程度更高。
(閾值產(chǎn)生單元)
下面將參照圖ll (A)至(H)描述通過閾值產(chǎn)生單元826產(chǎn)生用 于基于值為"l"的輸入對照矢量的分量的總數(shù)來確定匹配得分的閾值 的方法,和用于基于值為"1"的字典對照矢量的分量的總數(shù)來確定匹 配得分的閾值的方法。
以字符"A"作為示例給出描述。根據(jù)前述方法,指示"A"的 字典注冊字符CHi的字典特征矢量VTj (見圖ll (A))和字典對照矢量 表Dlj (見圖ll (C))預(yù)先存儲在字典對照矢量累加緩沖器813中。此 外,針對根據(jù)圖ll (B)所示的每一種不同類型字體的"A"的字符模 式產(chǎn)生的學(xué)習(xí)特征矢量,預(yù)先產(chǎn)生圖ll (D)中的學(xué)習(xí)對照矢量表103。 此后,針對每一個所創(chuàng)建的學(xué)習(xí)對照矢量表103,計算"A"的字典對 照矢量表Dlj的邏輯積203 (見圖ll (E)),并且針對每一邏輯積203來 計算圖ll (H)中的內(nèi)積值204。
此外,計算與每一學(xué)習(xí)對照矢量相對應(yīng)的內(nèi)積值202與指示"1" 的字典對照矢量的分量的總數(shù)104 (圖ll (F))的比值RL,和學(xué)習(xí)對 照矢量的內(nèi)積值204與指示"1"的學(xué)習(xí)對照矢量的分量的總數(shù)105的比 值。在圖ll (F)中,總數(shù)104為"22"。在圖ll (G)中,總數(shù)105為 "27"。在圖ll (H)中,內(nèi)積值204為"7"。因此,這里,經(jīng)計算, 比值RL為0.318,比值RD為0.259。
計算圖ll (B)中的所有學(xué)習(xí)特征矢量的比值RL和RD。將比值RL的最小值定義為閾值MinI,用于基于指示"1"的輸入對照矢量的 分量的總數(shù)來確定匹配得分,并且將比值RD的最小值定義為閾值 MinD,用于基于指示"1"的字典對照矢量的分量的總數(shù)來確定匹配 得分。將所計算的匹配得分確定閾值Minl和MinD存儲在圖8 (A)的 字典對照矢量累加緩沖器813中,作為與字典特征矢量VTj相對應(yīng)的確 定閾值數(shù)據(jù)D3J和D4j。
圖12是由閾值產(chǎn)生單元826執(zhí)行的用于為一個字典特征矢量VTj 產(chǎn)生兩個閾值的處理的流程圖,兩個閾值即閾值MinD(確定閾值數(shù) 據(jù)D3j),用于基于指示"l"的字典對照矢量的分量的總數(shù)來確定匹配 得分;和閾值MinI (確定閾值數(shù)據(jù)D4j),用于基于指示"l"的輸入對 照矢量的分量的總數(shù)來確定匹配得分。
起初,閾值產(chǎn)生單元826通過讀取字典特征矢量VTj來輸入字典特 征矢量VTj (S1301),針對字典特征矢量VTj,應(yīng)根據(jù)字典數(shù)據(jù)8U產(chǎn) 生閾值。將要檢測的閾值(MinD、 Mini)設(shè)置為最大值"l" (=100%) 作為初始值(S1302)。由輸入字典特征矢量VTj產(chǎn)生字典對照矢量表 Dlj (S1303)。此后,計算大于生成的字典對照矢量表Dlj中的閾值
(=32)的分量的總數(shù)Sd (S1304)。
此后,確定是否存在已學(xué)到但尚未用于產(chǎn)生閾值的特征矢量數(shù)據(jù)
(S1305)。當(dāng)存在這樣的特征矢量數(shù)據(jù)時,輸入一條學(xué)習(xí)特征矢量數(shù) 據(jù)(下文中被稱作學(xué)習(xí)特征矢量)(S1306)。這里,將通過學(xué)習(xí)獲得 的多個學(xué)習(xí)特征矢量預(yù)先存儲在存儲器814中。因此,作為從存儲器814
讀取的結(jié)果,輸入學(xué)習(xí)特征矢量。
此后,由輸入學(xué)習(xí)特征矢量產(chǎn)生學(xué)習(xí)對照矢量表103 (S1307), 并且計算大于所生成的學(xué)習(xí)對照矢量表103中的閾值(=32)的分量的 總數(shù)Si (S1308)。
此后,從字典對照矢量累加緩沖器813中讀取字典對照矢量表 Dlj,并計算指示所讀取的字典對照矢量表Dlj和所生成的學(xué)習(xí)對照矢 量表103的內(nèi)積值204的內(nèi)積值W (S1309)。
然后,將總數(shù)Sd和內(nèi)積值W的比值(W/Sd)與閾值MinD進(jìn)行比 較,并且基于比較結(jié)果,確定比值(W/Sd)是否小于閾值MinD(S1310)。當(dāng)確定不小于時,過程前進(jìn)至步驟S1312。相反,當(dāng)確定小于時,將
比值(W/Sd)設(shè)置為閾值MinD (S1311),并且過程前進(jìn)至步驟S1312。
在步驟S1312中,將總數(shù)Si和內(nèi)積值W的比值(W/Si)與閾值MinI 進(jìn)行比較,并且基于比較結(jié)果,確定比值(W/Si)是否小于閾值MinI。 當(dāng)確定不小于時,過程前進(jìn)至步驟S1305。相反,當(dāng)確定小于時,將 比值(W/Si)設(shè)置為閾值MinI (S1313),并且過程前進(jìn)至步驟S1305。
針對存儲在存儲器814中的所有學(xué)習(xí)特征矢量中的每一個,重復(fù) 執(zhí)行步驟S1306至S1313的處理。當(dāng)確定針對所有學(xué)習(xí)特征矢量的處理 已結(jié)束時(S1305中的"是,,),輸出該時刻的閾值MinD和MinI。艮卩, 將輸出閾值MinD和Minl存儲在字典對照矢量累加緩沖器813中,作為 與字典特征矢量VTj相對應(yīng)的確定閾值數(shù)據(jù)D3j和D4j (S1314)。如上 所述,產(chǎn)生匹配得分確定閾值的處理結(jié)束。
這里所使用的學(xué)習(xí)矢量是在字符類型上與字典特征矢量VTj—致 的大量數(shù)據(jù)。針對字典數(shù)據(jù)811中所有字典注冊字符Chi的所有字典特 征矢量數(shù)據(jù)VTj,來執(zhí)行圖12中的產(chǎn)生匹配得分確定閾值的處理。
這里,采用基于學(xué)習(xí)矢量計算得到的最小閾值MinD和MinI作為字 典注冊字符CHi的每一個特征矢量VTj的匹配得分確定閾值數(shù)據(jù)D3j和 D4j的原因如下。
艮P,如前所述,如果字符類型相同,則兩個矢量的分量值為"1" 的分量位置的字典特征矢量VTj和輸入特征矢量100之間的匹配程度 應(yīng)為高。例如,指示"1"的位置的字符"J"的字典對照矢量表Dlj 和字符"L"的輸入對照矢量表101之間的匹配程度應(yīng)當(dāng)為低。相反, 指示"1"的位置的"L"的字典對照矢量表Dlj和"L"的輸入對照矢 量表101之間的匹配程度應(yīng)當(dāng)為高。然而,程度根據(jù)數(shù)據(jù)而有所不同, 因此很難確定程度。因此,作為線索,在圖12中,根據(jù)學(xué)習(xí)數(shù)據(jù),來 計算匹配概率,即字典特征矢量和學(xué)習(xí)矢量之間的匹配概率。
因此,當(dāng)在圖12的處理中將匹配得分確定閾值數(shù)據(jù)D3j和D4j設(shè)置 為最小值時,可以覆蓋所有學(xué)習(xí)數(shù)據(jù)。關(guān)于學(xué)習(xí)數(shù)據(jù),將不會錯誤地 跳過圖14的稍后將進(jìn)行描述的模式匹配處理中的相似度計算(計算與
第一字典矢量的相似度)和詳細(xì)匹配(計算與第二字典矢量的相似度)(S1510和S1512)。因此,作為示例給出最小值。自然地,可以采用 最小值以外的值,然而,更大的值將導(dǎo)致較低的精確度,雖然模式匹 配處理更早進(jìn)行。
圖13示出了對照矢量提取單元823中的表,用于計算對照矢量表 (字典對照矢量表Dlj、輸入對照矢量表101等)中值為"1"的分量的 總數(shù)(字典計數(shù)數(shù)據(jù)D2j或輸入計數(shù)數(shù)據(jù)926)。圖13的表中存儲著與由 十進(jìn)制數(shù)表示的值(0至255)相一致的,由二進(jìn)制數(shù)表示的值和由二 進(jìn)制數(shù)表示的值為"1"的比特的數(shù)目。將該表預(yù)先存儲在存儲器814 中。
例如,當(dāng)對照矢量表中的記錄(記錄RRk或IRk)的分量的值指示 00000101 (十進(jìn)制數(shù)5)時,在圖13的表中搜索與十進(jìn)制數(shù)"5"相對 應(yīng)的比特數(shù),并得到"2"。根據(jù)這樣的過程,搜索圖13的表,從而可 以獲得超過對照矢量表中每一記錄的閾值的分量的數(shù)目(比特的數(shù) 目)。可以找到由此獲得的比特數(shù)目的和,即,可以僅通過執(zhí)行七次加 法,快速地獲得指示"1"的分量的總數(shù)。 (模式匹配處理)
圖14示出了模式匹配單元821中的處理過程。
例如,假設(shè),將由特征提取單元805產(chǎn)生的圖6 (A)中的輸入特 征矢量100輸入至匹配單元820的模式匹配單元821中(S1501)。對照 矢量提取單元823基于輸入特征矢量100來產(chǎn)生輸入對照矢量101 (S1502),并且計算(計數(shù))指示"1"的輸入對照矢量101的分量的 總數(shù)SI(S1503)。從而,將輸入對照矢量表925和與總數(shù)SI相對應(yīng)的輸 入計數(shù)數(shù)據(jù)926存儲在輸入對照矢量累加緩沖器825中。
模式匹配單元821將計數(shù)器i設(shè)置為l (S1504),計數(shù)器i用于對從 字典數(shù)據(jù)811中讀取并用于模式匹配的字典注冊字符CHi進(jìn)行計數(shù),并 且模式匹配單元821確定匹配的執(zhí)行次數(shù)是否與字典注冊字符的數(shù)目 一樣(S1505)。在圖20中,字典注冊字符CHi的總數(shù)為n。由于預(yù)先向 模式匹配單元821提供指示n的數(shù)據(jù),因此將計數(shù)器i所指示的值與所注 冊的字典字符的數(shù)目(n)進(jìn)行比較,并基于比較結(jié)果,確定"i〈n(注 冊字典字符的數(shù)目)"的條件是否滿足。從而,確定已執(zhí)行的匹配次數(shù)是否與字典注冊字符的數(shù)目相同。
當(dāng)滿足"i<n (注冊字典字符的數(shù)目)"的條件時,確定還沒有完
成針對所有字典注冊字符的匹配時(S1505中的"是"),準(zhǔn)許執(zhí)行關(guān) 于與字典注冊字符CHi相對應(yīng)的第一字典特征矢量VTl的稍后將進(jìn)行 描述的相似度計算(S1510)。然而,在處理之前,執(zhí)行使用對照矢量 匹配得分確定單元825的處理(S1506至S1509),用于確定第一字典特 征矢量VT1是否適于計算相似度(S1510)。
起初,對照矢量匹配得分確定單元825從對照矢量累加緩沖器813 中讀取與字典特征矢量VTl相對應(yīng)的字典對照矢量表Dll、與閾值 MinD和Minl相對應(yīng)的閾值數(shù)據(jù)D31和D41、以及與字典對照矢量表D11 中指示"l"的分量的總數(shù)Sd相對應(yīng)的字典計數(shù)數(shù)據(jù)D21 (S1506)。
此后,對照矢量匹配得分確定單元825計算從輸入對照矢量累加 緩沖器825中讀取的輸入對照矢量表925和字典對照矢量表D11的內(nèi)積 值W (S1507)。然后,根據(jù)輸入對照矢量表lOl和字典對照矢量表Dll 之間的匹配得分是否超過指定閾值(MinD、 Minl),確定是否選擇字 典注冊字符CHi作為輸入字符識別結(jié)果的候選字符。當(dāng)選擇字典注冊 字符CHi時,針對該字典注冊字符CHi來執(zhí)行步驟S1510中的相似度計 算。對照矢量匹配得分確定單元825具體地計算內(nèi)積值W與總數(shù)Sd的比 值W/Sd,并且將比值W/Sd與閾值數(shù)據(jù)D31 (與閾值MinD相對應(yīng))的 值進(jìn)行比較。當(dāng)基于比較結(jié)果確定滿足(W/Sd〉MinD)的條件時(S1508 中的"是"),過程前進(jìn)至下個確定處理(S1509)。相反,當(dāng)確定不滿 足條件時(S1508中的"否")時,確定輸入特征矢量100與該字典特 征矢量VT1完全不同。在這樣的情況下,不執(zhí)行由第一矢量相似度計 算單元827計算相似度(S1510),但計數(shù)器i的值加l。從而,指示下一 字典注冊字符Chi (S1508)。此后,過程返回至步驟S1505的處理,針 對下個所指示的字典注冊字符CHi,類似地執(zhí)行S1506和后續(xù)步驟的處 理。
相反,當(dāng)對照矢量匹配得分確定單元825確定滿足條件 (W/Sd>MinD)時(S1508中的"是"),計算內(nèi)積W與總數(shù)SI的比值 W/SI。然后,將比值W/SI與閾值數(shù)據(jù)D32 (與閾值MinI相對應(yīng))的值進(jìn)行比較。當(dāng)基于比較結(jié)果確定滿足條件(W/SI>MinI)時(S1509中 的"是"),計算相似度(S1510)。當(dāng)確定不滿足條件(W/SI>MinI) 時(S1509中的"否"),確定輸入特征矢量100與當(dāng)前字典特征矢量VT1 完全不相近似。在這樣的情況下,不執(zhí)行相似度計算(S1510),但計 數(shù)器i的值加l (S1508a),從而指示下個字典注冊字符CHi。此后,針 對相應(yīng)的特征矢量VT1,類似地執(zhí)行S1505和后續(xù)步驟的處理。
執(zhí)行上述處理,直到確定滿足S1505中的條件為止(S1505中的 "否")。即,針對字典數(shù)據(jù)811中的所有字典注冊字符CHi執(zhí)行處理。 因此,僅針對字典數(shù)據(jù)811中n個字典注冊字符Chi中的x個字典注冊字 符CHi來執(zhí)行相似度的計算(S1510),字典數(shù)據(jù)811中的所述x個字典 注冊字符CHi的字典特征矢量VTl滿足S1508和S1509中的條件。
第一矢量相似度計算單元827根據(jù)前述過程,計算輸入對照矢量 101和x個字典注冊字符CHi中的每一個的第一特征矢量VTl之間的相 似度。這里,通過使用指針等,將所計算的相似度存儲在存儲器814 中作為與字典數(shù)據(jù)811中相應(yīng)的字典注冊字符CHi相關(guān)聯(lián)的x個相似度 Rl,R2,R3,…,和Rx。
此后,模式匹配單元821將存儲器814中的x個相似度Rl,R2,R3,..., 和Rx進(jìn)行排序(S15U)。然后,基于排序結(jié)果,從字典數(shù)據(jù)814中讀 取與前P個高相似度相對應(yīng)的字典注冊字符CHi,并且詳細(xì)相似度計算 單元828執(zhí)行詳細(xì)匹配(S1512)?;谠敿?xì)匹配的結(jié)果,向輸出單元 802等輸出識別結(jié)果的候選字符(S1513)。
在本實施例中,例如,以如下方式執(zhí)行詳細(xì)匹配(S1512)。具體 地,詳細(xì)相似度計算單元828針對與上述前P個相似度相對應(yīng)的每一個 字典注冊字符CHi,執(zhí)行同第二字典特征矢量VT2至第m字典特征矢量 VTm的相似度運算。即,針對P個字典注冊字符CHi中的每一個,計算 與該字典注冊字符CHi相對應(yīng)的第二字典特征矢量VT2至第m字典特 征矢量VTm中的每一個字典特征矢量同輸入特征矢量101之間的相似 度。相似度計算是指,根據(jù)前述等式2計算相似度S。針對P個字典注 冊字符CHi,計算為相應(yīng)字典特征矢量計算的相似度的和。然后,從 相應(yīng)相似度的和的大小降序排列的P個字典注冊字符Chi中選擇字典注冊字符CHi,并從字典數(shù)據(jù)811中讀取所選的字典注冊字符CHi作為
指示識別結(jié)果的候選字符。將所讀取的字典注冊字符CHi提供至輸出 單元802。因此,在步驟S1513中,輸出單元802基于由作為識別結(jié)果 的候選字符輸入的字典注冊字符Chi所指示的字符碼,來顯示字符。
因此,詳細(xì)相似度計算單元828執(zhí)行輸入模式(輸入特征矢量IOI ) 和僅僅字典模式(第二字典特征矢量VT2至第m字典特征矢量VTm) 之間的模式匹配。該字典模式是指,與字典特征矢量VT1相對應(yīng)的字 典模式(第二字典特征矢量VT2至第m字典特征矢量VTm),基于由前 述第一矢量相似度計算單元827的對照結(jié)果,所述字典特征矢量VT1 被確定為與輸入特征矢量101匹配。
這里,對照矢量匹配得分確定單元824通過使用為每一字典注冊 字符CHi設(shè)置的兩條閾值數(shù)據(jù)D3j和D4j來進(jìn)行確定,然而,可以采用 諸如0.5的固定值。
在圖14的處理中,由于將根據(jù)學(xué)習(xí)數(shù)據(jù)計算的值中的最小值設(shè)置 為匹配得分確定閾值數(shù)據(jù)D3j和D4j,因此可以覆蓋期望作為字典注冊 字符Chi輸入的所有字符模式。因此,在圖14的模式匹配處理中,將不 會錯誤地跳過相似度計算(計算與第一字典矢量的相似度)和詳細(xì)匹 配(計算與第二字典矢量的相似度)(S1510和S1512)。因此,模式匹 配處理的結(jié)果可以是高度精確的。
當(dāng)沒有必要設(shè)置最小值時,例如,當(dāng)不需要高精確度時,可以調(diào) 整匹配得分確定閾值數(shù)據(jù)D3j和D4j,并且可以為其設(shè)置更大的值。例 如,當(dāng)優(yōu)先考慮更高速度時,不需要設(shè)置最小值。 (匹配處理的另一示例)
圖15示出了示例中的處理過程,在該示例中,將濃度確定單元822 中的處理(S1604、 S1609)添加至圖14中的匹配單元中的處理。由于 除了S1604和S1609以外,圖15的處理與結(jié)合圖14描述的處理是相同 的,因此將不再提供詳細(xì)描述。
為濃度確定單元822中的處理引入濃度標(biāo)記"F"。下面將參照圖 16描述用于設(shè)置濃度標(biāo)記"F"的過程。
如圖16所示,濃度確定單元822確定濃度。起初,輸入輸入對照矢量表101中指示"1"的分量的總數(shù)SI和濃度標(biāo)記"F"的值。這里,
將濃度標(biāo)記輸入為"0" (S1701)。此后,濃度確定單元822將預(yù)定閾 值T與總數(shù)SI的值進(jìn)行比較,并且基于比較結(jié)果確定是否滿足條件 (SI>T) (S1702)。當(dāng)確定滿足條件時,即,當(dāng)確定總數(shù)SI大于閾值T 時(S1702中的"是"),將濃度標(biāo)記"F"設(shè)置為"1" (S1703)。相反, 當(dāng)確定不滿足條件時(S1702中的"否"),濃度標(biāo)記"F"的值保持為 "0"。從而,濃度確定單元822中的處理結(jié)束。即,當(dāng)輸入字符模式中 存在許多黑色像素時,濃度確定單元822將濃度標(biāo)記"F"設(shè)置為l。
由于濃度確定應(yīng)當(dāng)產(chǎn)生從中可以導(dǎo)出所要處理的輸入特征矢量 的圖像是稍黑或稍白的確定結(jié)果,因此,優(yōu)選地采用大約相當(dāng)于矢量 分量總數(shù)(64)的三分之一或一半(20至30)的值作為閾值T。
應(yīng)當(dāng)注意的是,可以基于如圖16所示的輸入對照矢量表101中指 示"1"的分量的總數(shù)SI,或基于輸入特征矢量100的分量的值,來進(jìn) 行濃度確定。通過在不使用輸入對照矢量表101的情況下基于輸入特征 矢量來進(jìn)行濃度確定,可以基于與用于創(chuàng)建輸入對照矢量表的閾值不 同的閾值來進(jìn)行確定。
參照圖15,如圖14執(zhí)行步驟S1501至S1503中的處理。此后,濃度 確定單元822通過使用圖16所示的S1503中計算得到的總數(shù)SI,來設(shè)置 濃度標(biāo)記"F"的值(S1604)。此后,如圖14,執(zhí)行S1505至S1507中 的處理。
此后,確定濃度標(biāo)記"F"的值是否指示"1" (S1609)。當(dāng)確定 濃度標(biāo)記"F"指示"1"時(S1609中的"是"),基于匹配得分確定 閾值MinI進(jìn)行確定(S1509)。當(dāng)確定濃度標(biāo)記"F"指示"O"時(S1609 中的"否"),基于匹配得分確定閾值MinD進(jìn)行確定(S1508)。如圖14 執(zhí)行后續(xù)的處理。
按照圖15中的處理過程可以獲得以下優(yōu)勢。具體地,在圖14的過 程中,僅基于匹配得分確定閾值MinD和MinI兩個閾值,來確定是否要 執(zhí)行相似度計算(S1511)。因此,不管輸入模式中的內(nèi)容如何, 一律 執(zhí)行基于閾值MinD的比較處理(S1508)。相反,在如圖15采用濃度確 定單元822時,更有可能通過步驟S1509中的確定處理,從相似度計算
28(S1510)排除包括許多濃密像素在內(nèi)的輸入模式(字符區(qū)),即,具 有較大總數(shù)SI值的輸入模式。應(yīng)當(dāng)注意到以下事實在圖15的過程中,
基于濃度標(biāo)記"F"可以跳過步驟S1508中基于閾值MinD的確定處理, 并且可以僅執(zhí)行S1509中基于閾值Minl的確定處理。因此,可以比圖 14中的過程更快速地完成該處理。 (第二實施例) 下面,將對第二實施例進(jìn)行描述。
通過程序來實現(xiàn)具有在第一實施例中所描述的處理功能的系統(tǒng)。 在該第二實施例中,將所述程序存儲在計算機(jī)可讀記錄介質(zhì)中。
在該第二實施例中,所述記錄介質(zhì)可以是由圖2所示的計算機(jī) 中處理所需的存儲器來實現(xiàn)的程序介質(zhì)(例如,存儲器624本身)、或 者是因?qū)⒂米鞔鎯ζ鹘橘|(zhì)的磁帶或CD-ROM 642插在程序讀取器(例 如作為外部存儲設(shè)備提供的磁帶裝置和CD-ROM驅(qū)動器640)中而可以 讀取的程序介質(zhì)??傊鎯Φ某绦蚩杀慌渲贸捎蒀PU 622來訪問 和執(zhí)行。
這里,上述程序介質(zhì)是被配置成可從計算機(jī)主體中移除的記錄介 質(zhì),并且可以是諸如磁帶或盒式磁帶的磁帶類介質(zhì)、諸如包括FD 632 和硬盤626在內(nèi)的磁盤以及包括CD-ROM642/MO (磁光盤)/MD (迷 你盤)/DVD (數(shù)字通用盤)的盤式介質(zhì)、諸如IC卡(包括存儲卡)/ 光學(xué)卡等卡式介質(zhì)、或者以非易失方式攜帶程序的介質(zhì)(包括諸如掩 模ROM)、 EPROM (可擦寫可編程ROM)、 EEPROM(電EPROM)禾口閃 速ROM等半導(dǎo)體存儲器)。
此外,在本實施例中,由于計算機(jī)被配置為可以通過通信接口680 連接至包括互聯(lián)網(wǎng)在內(nèi)的通信網(wǎng)絡(luò)300,因此可以采用臨時承載通過這 些通信網(wǎng)絡(luò)下載的程序的介質(zhì)。
總體趨勢是,將各種程序模塊配備為計算機(jī)操作系統(tǒng)的一部分, 并且應(yīng)用程序在必要時以指定的順序調(diào)用這些模塊來執(zhí)行處理。在這 樣的情況下,用于實現(xiàn)模式識別設(shè)備的軟件本身不包括這樣的模塊, 而僅當(dāng)軟件與圖2的計算機(jī)中的操作系統(tǒng)協(xié)作時才實現(xiàn)模式識別設(shè)備。 然而,應(yīng)當(dāng)考慮到,只要采用通用平臺,就不需要分發(fā)包括這樣的模塊的軟件,相反,本身不包括模塊的軟件和記錄軟件(并且當(dāng)通過網(wǎng) 絡(luò)分發(fā)這樣軟件時記錄數(shù)字信號)的記錄介質(zhì)可以實現(xiàn)實施例。
應(yīng)當(dāng)理解的是,這里所公開的實施例在各個方面是例證性和非限 制性的。除了本發(fā)明的范圍由權(quán)利要求書的各項權(quán)利要求而不是上述 說明予以限定,并意在包括等價于權(quán)利要求書的各項權(quán)利要求的范圍 和意義內(nèi)的任何修改。
工業(yè)實用性
本發(fā)明適用于具有識別圖像模式的功能的各種設(shè)備。因此,不僅 可以在OCR識別字符中,而且可以在基于人臉圖像、指紋和印鑒的認(rèn) 證設(shè)備中,以及具有識別其他圖像模式的功能的所有設(shè)備中,使用本 發(fā)明。
權(quán)利要求
1、一種模式識別設(shè)備,包括字典單元,存儲多個字典模式;字典對照矢量存儲單元,按照與所述多個字典模式中的每一個字典模式相一致的方式,存儲字典對照矢量,所述字典對照矢量由指示所述字典模式特征的指定數(shù)目的分量構(gòu)成,每一分量指示1或0;對照矢量產(chǎn)生單元,基于輸入模式,產(chǎn)生由指示輸入模式特征的所述指定數(shù)目的分量構(gòu)成的輸入對照矢量,每一分量指示1或0;矢量匹配得分確定單元,基于從所述字典對照矢量存儲單元讀取的每一所述字典對照矢量和所述輸入對照矢量的內(nèi)積,計算匹配得分;以及對照單元,將所述輸入對照矢量與經(jīng)計算其匹配得分大于指定閾值的所述字典對照矢量進(jìn)行對照,并且所述模式識別設(shè)備執(zhí)行所述輸入模式和唯一的所述字典模式之間的模式匹配,所述唯一的所述字典模式與基于對照結(jié)果被確定為與所述輸入對照矢量相匹配的所述字典對照矢量相對應(yīng)。
2、 根據(jù)權(quán)利要求l所述的模式識別設(shè)備,其中針對每一所述字典對照矢量,將所述指定閾值預(yù)先存儲在所述字 典對照矢量存儲單元中。
3、 根據(jù)權(quán)利要求2所述的模式識別設(shè)備,其中所述特征指示圖像的濃度,并且所述分量以i和o指示濃度,并且當(dāng)所述輸入對照矢量的指示l的分量的總數(shù)等于或小于預(yù)先設(shè)置的數(shù)值時,所述匹配得分指示所述字典對照矢量和所述輸入對照矢 量的內(nèi)積的值與所述字典對照矢量的指示l的分量的總數(shù)的比值。
4、 根據(jù)權(quán)利要求l所述的模式識別設(shè)備,其中所述匹配得分指示所述字典對照矢量和所述輸入對照矢量的所 述內(nèi)積的值與所述輸入對照矢量的指示l的分量的總數(shù)的比值。
5、 根據(jù)權(quán)利要求l所述的模式識別設(shè)備,其中所述匹配得分指示所述字典對照矢量和所述輸入對照矢量的所述內(nèi)積的值與所述字典對照矢量的指示l的分量的總數(shù)的比值。
6、 根據(jù)權(quán)利要求l所述的模式識別設(shè)備,其中 所述特征指示圖像的濃度。
7、 根據(jù)權(quán)利要求l所述的模式識別設(shè)備,其中所述特征指示圖像的濃度,并且所述分量以1和0指示濃度,并且 當(dāng)所述輸入對照矢量的指示l的分量的總數(shù)大于預(yù)先設(shè)置的數(shù)值 時,所述匹配得分指示所述字典對照矢量和所述輸入對照矢量的所 述內(nèi)積的值與所述輸入對照矢量的指示l的分量的總數(shù)的比值。
8、 根據(jù)權(quán)利要求7所述的模式識別設(shè)備,其中所述特征指示圖像的濃度,并且所述分量以1和0指示濃度,并且 當(dāng)所述輸入對照矢量的指示l的分量的總數(shù)等于或小于預(yù)先設(shè)置 的數(shù)值時,所述匹配得分指示所述字典對照矢量和所述輸入對照矢 量的所述內(nèi)積的值與所述字典對照矢量的指示l的分量的總數(shù)的比值。
9、 根據(jù)權(quán)利要求l所述的模式識別設(shè)備,其中所述特征指示圖像的濃度,并且所述分量以1和0指示濃度,并且 當(dāng)所述輸入對照矢量的指示l的分量的總數(shù)等于或小于預(yù)先設(shè)置 的數(shù)值時,所述匹配得分指示所述字典對照矢量和所述輸入對照矢 量的所述內(nèi)積的值與所述字典對照矢量的指示l的分量的總數(shù)的比值。
10、 一種使用信息處理設(shè)備的模式識別方法,所述信息處理設(shè)備 包括字典單元,存儲多個字典模式;以及字典對照矢量存儲單元, 按照與所述多個字典模式中的每一個字典模式相一致的方式,存儲字 典對照矢量,所述字典對照矢量由指示所述字典模式特征的指定數(shù)目 的分量構(gòu)成,每一分量指示1或0,所述模式識別方法包括以下步驟基于輸入模式,產(chǎn)生由指示輸入模式特征的所述指定數(shù)目的分量 構(gòu)成的輸入對照矢量,每一分量指示1或0;基于從所述字典對照矢量存儲單元讀取的每一所述字典對照矢 量和所述輸入對照矢量的內(nèi)積,計算匹配得分;將所述輸入對照矢量與經(jīng)計算其匹配得分大于指定閾值的所述字典對照矢量進(jìn)行對照;以及執(zhí)行所述輸入模式和唯一的所述字典模式之間的模式匹配,所述唯一的所述字典模式與基于對照結(jié)果被確定為與所述輸入對照矢量相 匹配的所述字典對照矢量相對應(yīng)。
11、 一種用于使計算機(jī)執(zhí)行根據(jù)權(quán)利要求io所述的模式識別方法的模式識別程序產(chǎn)品。
12、 一種記錄著用于使計算機(jī)執(zhí)行根據(jù)權(quán)利要求10所述的模式識 別方法的程序的機(jī)器可讀記錄介質(zhì)。
全文摘要
一種模式識別設(shè)備(1)包括對照矢量提取單元(823),產(chǎn)生包括指示輸入模式特征的預(yù)定數(shù)目分量的輸入對照矢量,每一分量指示1或0;和對照矢量匹配得分確定單元(824),基于從字典對照矢量累加緩沖器(813)讀取的每一字典對照矢量和輸入對照矢量的內(nèi)積,來計算匹配得分。將輸入對照矢量與字典特征矢量進(jìn)行對照,為此,已計算大于預(yù)定閾值的匹配得分,并且從字典數(shù)據(jù)(811)中讀取字典模式并輸出,字典模式與基于對照結(jié)果確定為與輸入對照矢量進(jìn)行匹配的字典對照矢量相對應(yīng)。
文檔編號G06K9/62GK101553825SQ200780037979
公開日2009年10月7日 申請日期2007年7月20日 優(yōu)先權(quán)日2006年10月11日
發(fā)明者小山至幸, 桑田美奈子 申請人:夏普株式會社