采用筆劃近似直線的字符識別系統(tǒng)的制作方法

文檔序號：97306閱讀：363來源：國知局

專利名稱:采用筆劃近似直線的字符識別系統(tǒng)的制作方法
本發(fā)明屬于字符識別領域，它涉及一種不需要使字符圖象的大小規(guī)范化和細線化的獨特方法的抽取筆劃近似直線的字符識別系統(tǒng)。
通常的抽取字符或筆劃黑體部分的字符識別技術需要事先對字符圖象的大小規(guī)范化和細線化。
因而，通常的技術有如下問題(1)在字符圖象的大小被規(guī)范化時，可能會失去字符特征。
(2)在細線化處理時，可能會引起襯線、短缺、或者會使交義點分離。
(3)通常的抽取幾何特征的字符識別，可識別的字符數至多幾十個。
本發(fā)明的目的是解決(1)不需要對字符的大小進行規(guī)范化和細線化，就能充分獲得字符識別所必需的信息。
(2)增加讀出字符的準確性，減少錯誤識別率。
本發(fā)明獨特的抽取筆劃近似直線的方法是(a)當檢測出在預定數或預定數以上相互間成橫間連接的象素在對被識別的字符讀出-掃描、量化和存儲的存儲器進行掃描期間形成一個經過二個或二個以上掃描線的縱向連接群體時，所述群體連同以所述群體中最左面象素的X-Y座標為始點信息和最右面象素的X-Y座標為終點信息的橫向筆劃識別符號一起存儲進存儲器內;(b)當檢測出在預定數以下相互間成橫向連接的象素的縱向連接性形成一個縱向擴展群體時，所述群體連同以最上面掃描線內象素群中點的X-y座標為始點信息和最下面掃描線內象素群中點的X-Y座標為終點信息的縱向筆劃認別符號一起存儲進存儲器內;(c)當檢測出在預定數或預定數以下相互間成橫向連接的象素縱向連接性形成一個顯示向右或向左傾斜趨勢的群體時，所述群體連同以最上面掃描線內象素群中點的X-Y座標為始點信息和最下面掃描線內象素群中點的X-Y座標為終點信息的向右或向左傾斜的筆劃識別符號一起存儲進存儲器內;這些群體可與事先被存儲進去的被識別對象的基準字符的候選字符表進行比較。
根據本發(fā)明的字符識別系統(tǒng)是一種不需要對字符圖象的大小進行規(guī)范化和細線化，而是用一次掃描耒檢測四個方向性和注重字符線寬度的方法耒抽取近似筆劃和特征的新的系統(tǒng)，從而用較簡單的整理就能實現準確度高、錯誤識別率低的字符識別。
本發(fā)明的具體說明由以下的附圖及其實施例給出。
圖1(a)和(b)是根據掃描手寫體“0”和“5”后所存儲的象素和本發(fā)明的抽取出耒的筆劃近似直線圖。
11.……起始象素位置12.……終止象素位置13.……橫向筆劃14.……縱向筆劃15.……斜方向筆劃(向左斜)16.……斜方向筆劃(向右斜)
17.……起始點18.……終止點19.……中點圖2是使用本發(fā)明的字符識別系統(tǒng)的示意圖。
1.……筆劃抽取裝置2.……字符識別前處理裝置3.……字符識別裝置4.……候選表5.……存儲器20.……掃描裝置21.……量化裝置22.……圖象存貯器23.……字符讀出裝置24.……字符識別處理裝置25.……識別結果的輸出圖3(a)、(b)和(c)是抽取手寫體字符的橫向筆劃的例子。
26.……掃描線的方向圖4(a)-(e)是抽取手寫體字符的縱向筆劃的例子。
27.……中點右面的一個位置。
圖5(a)和(b)是抽取手寫字符的斜方向筆劃的例子。
圖6是處理擴散點的例子圖7是筆劃結合的例子圖8是顯示橫向筆劃區(qū)域的圖。
圖9是顯示縱向斜方向筆劃區(qū)域的圖。
圖10是顯示字符識別處理的圖。
28.……根據筆劃數的候選選取表29.……根據區(qū)域信息的候選選取表30.……識別邏輯31.……結果32.……不能識別(排斥)33.……無候選(排斥)F……根據筆劃數十區(qū)域信息的所有候選F……根據筆劃數十區(qū)域信息的所有候選(包括表2中的候選)F……根據筆劃數的所有候選圖11(a)和(b)是手寫片假名的象素和筆劃近似直線的例子。
圖12(a)和(b)是手寫字母的象素和筆劃近似直線的例子。
圖13(a)和(b)是手寫漢字的象素和筆劃近似直線的例子。
實施例圖2是根據本發(fā)明的字符識別系統(tǒng)的配置圖，它包括字符讀出裝置、字符識別處理裝置和識別結果利用裝置。字符識別處理裝置又是由筆劃抽取裝置1、字符識別前處理裝置2、字符識別裝置3、候選表4和存儲器5所組成。
(1)字符讀出裝置可以是任伺一種通常的字符讀出裝置。
字符/圖象讀出裝置對被識別的字符讀出一掃描，并量化為所需信息，以二進制象素數據存儲進圖象存儲器內。用一般的光學字符讀出裝置(OCR)就可充分滿足對字符圖象的質量要求。圖1(a)和(b)中的每個小圓圈分別表示在對手寫的0和5進行讀出掃描和量化后存儲進圖象存儲器內的一個象素。
(2)筆劃抽取裝置圖1(a)和(b)中直線表示根據本發(fā)明抽取出耒的筆劃(線段)近似直線，它們是用筆劃抽取裝置對字符讀出裝置(圖2情況中的存儲器)上接收到象素經處理后抽取出耒的。抽取處理的實施過程是從上部每根掃描線中取出字符圖象數據的象素，以及檢驗與剛在先的掃描線中象素的幾何位置的連接性。至少有四個象素被連接(四連接)時，才被認為存在連接性，從中找到群體筆劃和具有下列四個方向性的近似直線1.橫向(HORZ)2.縱向(VERT)3.向左傾斜(INC)4.向右傾斜(DEC)這四個方向性的檢測是以一次掃描并行進行，這也是本發(fā)明的一個特征。
(a)橫向(HORZ)筆劃的抽取當預定數(例如12個象素)或預定數以上的象素形成一個跨越二行或二行以上連續(xù)連接的群體時，通過把群體中最右象素和最左象素連接而成的筆劃近似直線就能獲得橫向(NORZ)筆劃，如圖3(a)和(b)所示。雖然抽取橫向筆劃不受縱向筆劃和斜方向筆劃(向右斜和向左斜)的影響，但還是要把握住它們之間的關系?！?2個或12個以上的象素”是指對手寫字符按預定數或預定數以上橫向排列象素的一個例子，而對于印刷(活字)字符而言，只要上述象素數目的一半以下就保證足夠了。
(b)縱向(VERT)筆劃的抽取當一個象素群體的縱向連接性滿足下列條件中的如何一條時，就可把它近似為縱向筆劃。
1.一種情況是最初顯示在每個掃描線上象素的位置(即起始象素位置)和剛剛在先的掃描線上象素的位置相同，如圖4(a)所示。
2.一種情況是最后顯示在每個掃描線上象素的位置(即終止象素位置)和剛剛在先的掃描線上象素的位置相同，如圖4(b)所示。
3.一種情況是在每個掃描線上的起始象素位置和終止象素位置和剛剛在先的掃描線上起始象素位置和終止象素相同，如圖4(c)所示。
4.一種情況是起始象素位置在剛剛在先的起始象素位置的左面起始，而終止象素位置在剛剛在先的終止象素位置的右面終止，如圖4(d)所示。
5.一種情況是起始象素位置在剛剛在先的起始象素位置的右面起始，而終止象素位置在剛剛在先的終止象素位置的左面終止，如圖4(e)所示。
(c)斜方向(INC/DEC)筆劃的抽取當象素的縱向連接性滿足下列條件中的任何一條時，就可把它近似為斜方向(INC/DEC)筆劃。
1.向左傾斜(INC)的筆劃一種情況是起始象素位置和剛剛在先的起始象素位置相同或在其左面，以及終止象素位置也和剛剛在先的起始象素位置相同或在其左面，始圖5(a)所示。
2.向右傾斜(DEC)的筆劃一種情況是上述對向左傾斜筆劃的說明中的“左”字用“右”字取代即可，如圖5(b)所示。
3.然后，如果起始和終止象素位置和剛剛在先的起始和終止象素位置相同，筆劃就在該掃描線上終止，如圖5(a)中心區(qū)所示。
(d)筆劃起始點的處理當一個象素出現在掃描線上，而不出現在剛剛在先的掃描線的相對應位置上時，即視為筆劃起始點。當一個掃描線上的象素按預定數(例如12個)或者預定數以上連續(xù)排列時，這些象素就作為橫向筆劃的候選。當象素的數目少于預定數(例如11或11以下)，出現的象素被存儲一會兒，并把它們繼續(xù)處理為縱向/斜方向筆劃的候選，如圖1(b)所示。
(e)方向性的決定對還沒有方向性的筆劃進行如下處理，如果這些筆劃不符合下列條件，方向性的決定就留到下一條線進行處理。
·成為橫向筆劃的條件一種情況是掃描線上象素按預定數(例如12)或預定數以上排列或連接性。但是，掃描線上的象素如果是由于筆劃交叉而達到預定數或預定數以上的，則不視為橫向筆劃。
·成為縱向筆劃的條件在每根掃描線上的起始象素位置相同，而終止象素位置在剛剛在先的象素位置的右面一行以內終止，或者終止象素位置相同，而起始象素位置在剛剛在先的象素位置的左面一行以內終止。
·成為向左(或向右)傾斜筆劃的條件起始和終止象素位置均在剛剛在先的掃描線上起始和終止象素位置的左面(或右面)(f)交叉點的處理如果在處理過程中二條或二條以上的筆劃相互交叉，則進行下列處理。
·一種情況是當其中一條是橫向筆劃時，處理橫向筆劃的過程中就不必考慮其它筆劃。對其它筆劃在保持它們的角度和方向性同時進行處理的過程是在識別對象上添加存在字符線的寬度(對筆劃成直角連接的象素數)。
·另一種情況是對每條筆劃在保持存在字符線的寬度、角度和方向性的同時連續(xù)處理成現有線中的象素。
(g)擴散點的處理對每條筆劃在保持存在字符線的寬業(yè)、角度和方向性的同時連續(xù)處理成現有線中的連續(xù)象素，在這種情況下，如果在筆劃二邊或任何一邊的象素的寬度比存在字符線象素的寬度要寬得多，則把它們作為新筆劃的始點開始進行處理，圖6所示是擴散點處理的例子。
(h)終止點的處理當不符合(2)-(b)和(2)-(c)所指的條件或在適當的位置上沒有象素時，應認為縱向或斜方向筆劃已達到它的終止點。當在掃描線適當位置上的象素少于預定數(包括不存在象素的情況)時，應認為橫向筆劃已達到它的終止點。
(i)關于筆劃近似直線的起始點和終止點對縱向或斜方向筆劃，在取出象素的群體內最上面掃描線上的象素群的中點視為起始點，同時把最下面掃描線上的象素群的中點視為終止點。當出現掃描線上象素數為偶數的情況時，采用中點右面或左面的象素。對橫向筆劃，在取出象素群體內的最右面和最左面位置分別視為起始點和終止點。
(g)噪聲處理噪聲通常是經前處理加以除去，但在本發(fā)明中，當在起始點處理期間在方向性可識別以前就檢測出終止點時(即連續(xù)象素的群體比較小)時，這樣的象素群體被視為可消除的噪聲。
用上述處理過程抽取出耒的筆劃如必要可作為指示方向性(HORZ，VERT，INC或DEC)的筆劃識別符號、起始點和終止點的X-Y座標值、以及連接性(交叉點位置)等信息一筆一筆地一次被存儲進存儲器中。
(3)字符識別的前處理裝置該裝置對筆劃抽取裝置取出并存儲在存儲器內的信息進行整理，以得到識別字符所必需的最終信息。
(a)字符的結合縱向或斜方向的方向性相同以及角度相近似的連續(xù)筆劃可結合成一條筆劃(對存儲在存儲器內的起始和終止點的X-Y座標值進行修正)，如圖7所示?？v向或斜方向的方向性相同而角度大不相同的連續(xù)筆劃被視為不同筆劃。
(b)每個方向上筆劃數的計算筆劃結合后，計算筆劃數并存儲進存儲器內，如有必要，也計算交叉點的數目并存儲進存儲器內。這些信息和下述的區(qū)域信息一起用于選取候選。
(c)區(qū)域信息的抽取區(qū)域分割有二種方法，即橫向分割和縱向/斜方向分割。
·橫向筆劃區(qū)域離圖象頂部1/4處和底部1/4處所劃的線把圖象分成三個區(qū)域(如圖8所示)。檢驗每個區(qū)域是否含有橫向筆劃。
·縱向/斜方向筆劃區(qū)域離圖象頂部和底部1/4處以及離圖象每邊1/4處所劃的線把圖象分成九個區(qū)域，圖9所示的六個區(qū)域是縱向/斜方向筆劃區(qū)域。同樣地，要檢驗每個區(qū)域是否含有縱向/斜方向筆劃。
(4)字符識別裝置該裝置根據每個方向上的筆劃數和交叉點數，以及區(qū)域信息從被識別字符群中選取候選(稱為“分類”)。
(a)根據筆劃數選取候選把“分類”內每個字符按每個方向上有多少筆劃的范圍整理在表中，并存儲進存儲器內(表1)。用此表選取指出被識別的字符圖象是什么字符的候選。
表1根據筆劃數的候選選取表(數字和符號)向左向右“分類” 總數橫向縱向傾斜傾斜
0 3-10 0-2 0-4 0-3 0-21 1-3 0-1 0-1 0-1 0-12 3-7 1-2 0-3 1-3 0-23 4-9 2-4 0-4 0-3 0-34 3-6 1-1 0-3 0-2 0-15 5-9 1-3 1-3 0-2 0-36 4-9 0-3 0-4 0-3 0-27 2-6 1-1 0-4 0-3 0-18 5-12 0-4 0-5 0-4 0-49 4-9 0-2 0-4 0-4 0-2
3-7 1-3 0-3 0-2 0-3- 1-3 1-1 0-1 0-1 0-1例子對字符“5”，表1指出筆劃總數在5-9范圍內，橫向筆劃在1-3范圍內，向左傾斜的筆劃在0-2范圍內，向右傾斜的筆劃在0-3范圍內。
(b)根據區(qū)域信息選取候選同樣，也可根據區(qū)域信息選取候選。在區(qū)域信息的情況下，由于表中指出了對每條筆劃在每個字符和每個區(qū)域內所規(guī)定的“無條件存在”或“不允許存在”，因而可用這些信息選取候選。
表2是關于數字和符號區(qū)域信息的例子。
表2 根據區(qū)域信息的候補選取表橫向縱向向左傾斜向右傾斜
“分類”(a)(b)(c) (d)(e) (f)(g) (h)(i)0 0 2 0 0 0 0 0 0 01 2 2 0 0 0 0 0 0 02 0 2 1 0 0 1 1 0 23 0 1 0 0 0 0 1 0 04 2 0 0 1 1 0 0 0 05 1 0 0 1 0 0 2 0 16 2 0 0 0 0 1 0 0 17 1 2 2 1 0 0 1 0 08 0 0 0 0 0 1 1 0 09 0 0 2 0 0 0 1 0 0
2 1 0 1 2 2 1 2 2- 0 0 0 2 2 2 2 2 21無條件存在2不允許存在0兩者都可以接受例子對字符“5”，表2指出橫向筆劃一定在字符圖象的上部，縱向/斜方向筆劃一定在左上部和右下部。此外，在字符圖象的右上部不存在縱向/斜方向筆劃。
(c)字符識別處理對根據筆劃數和區(qū)域信息所獲得的候選檢驗其是否符合必要和充分條件，當有任何筆劃留下耒(以及如果采用交叉點信息，在應該存的交叉點的地方不出現交叉點時)，這樣的候選被消除。在進行上述處理后，當找到唯一候選時，這就成了識別的結果。如果找到二個或二個以上候選時，它們被“排斥”(即“不能識別”)。
如果沒有留下候選，則進行上述處理，目的是從排除了區(qū)域信息和筆劃數的“無條件存在”的表中獲得候選。如果還沒有找到候選，則反復進行上述處理，目的是可只根據筆劃數獲得候選(如果按此法仍未找到候選，則該處理被“排斥”，即“不能獲得候選”)，如圖10所示。
(4)應用于片假名、字母和漢字通過對用于被識別字符群的根據筆劃數的候選表(列在表1)和根據區(qū)域信息的候選表(列在表2)進行擴展同樣可識別片假名、字母和漢字(分類)。圖11-13所示是從每個象素連接中抽取出耒的筆劃近似直線的例子。
權利要求
一種采用筆劃近似直線法的字符識別系統(tǒng)，其特征是包括一識別字符的讀出-掃描方法，一將上述掃描結果量化并將其作為二進制象素信息存儲進圖象存儲器的方法，一掃描上述圖象存儲器并從每個象素間連接性中抽取筆劃近似直線信息的方法，以及按照上述的抽取筆劃近似直線信息選取候選字符的方法。上述的抽取筆劃近似直線信息方法的特點是1、當檢測出在預定數或預定數以上相互間成橫向連接的象素在掃描圖象存儲器期間形成一個經過二個或二個以上掃描線的縱向連續(xù)群體時，所述群體連同以所述群體中最左面象素的X-Y座標為始點信息和最右面象素的X-Y座標為終點信息的橫向筆劃識別符號一起存儲進存儲器內；2、當檢測出在預定數以下相互間成橫向連接的象素的縱向連接性形成一個縱向擴展群體時，所述群體連同以最上面掃描線內象素群中點的X-Y座標(如果象素為偶數，取中點時應預定一個鄰右或鄰左的象素位置以下，相同)為始點信息和最下面掃描線內象素群中點的X-Y座標為終點信息的縱向筆劃識別符號一起存儲進存儲器內;3、當檢測出在預定數或預定數以下相互間成橫向連接的象素縱向連接性形成一個顯示向右或向左傾斜趨勢的群體時，所述群體連同以最上面掃描線內象素群中點的X-Y座標為始點信息和最下面掃描線內象素群中點的X-Y座標為終點信息的向右或向左傾斜的筆劃識別符號一起存儲進存儲器內。所述的選擇候選字符方法的特征是從存儲在存儲器內所述的筆劃近似直線信息中計算出每個方向上筆劃近似直線的數目及其總數目，再把計算所得和候選表內所列的原先已存儲進系統(tǒng)的被識別對象的標準字符的每個方向上筆劃近似直線的數目及其總數目進行比較，并且選取對應的候選字符。
專利摘要
本發(fā)明涉及一種采用不要對字符圖象的大小規(guī)范化和細線化的獨特方法來抽取筆劃近似直線的字符識別系統(tǒng)。
文檔編號G06K9/46GK86100641SQ86100641
公開日1986年10月1日申請日期1986年1月22日
發(fā)明者島隆紀申請人:國際商業(yè)機器公司(Ibm)導出引文BiBTeX, EndNote, RefMan

完整全部詳細技術資料下載