專(zhuān)利名稱(chēng):手寫(xiě)體文字處理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)文字信息處理領(lǐng)域。
隨著時(shí)代的發(fā)展,信息時(shí)代的到來(lái),人們對(duì)文字處理技術(shù)的要求越來(lái)越高。在中文信息處理領(lǐng)域,用計(jì)算機(jī)等辦公設(shè)備進(jìn)行文字處理在我國(guó)的今后會(huì)有更大的發(fā)展。在漢字信息的輸入及處理方面,近年來(lái)國(guó)內(nèi)外提出了許多方案及配套技術(shù)。據(jù)報(bào)道實(shí)際上機(jī)實(shí)用的已有幾十種。中國(guó)專(zhuān)利局已公布的有關(guān)這方面的專(zhuān)利文獻(xiàn)已有200多件。概括而論,目前眾多的方法可分為編碼法與非編碼法兩類(lèi)。前者不外乎利用“音”、“形”及音形結(jié)合,以數(shù)字或字母輸入。這對(duì)于專(zhuān)業(yè)打字員而言,實(shí)現(xiàn)了較高的輸入速度,已經(jīng)解決得相當(dāng)好了。然而,此類(lèi)方法須熟記編碼原則及字根,或熟悉注音或拼音,非社會(huì)上一般人所易學(xué)易用者。非編碼法,傳統(tǒng)上多采用大鍵盤(pán)輸入方式,更須經(jīng)專(zhuān)業(yè)化訓(xùn)練才能熟練。目前,漢字筆式輸入技術(shù)發(fā)展得很快,涌現(xiàn)了眾多的手寫(xiě)漢字輸入及識(shí)別方法。然而,由于中文漢字的復(fù)雜性,每個(gè)人的筆跡都有其自身的特點(diǎn),且存在難以解決的連筆漢字識(shí)別問(wèn)題,在實(shí)用時(shí)現(xiàn)有的筆輸入產(chǎn)品都對(duì)用戶(hù)提出了種種限制,離開(kāi)這些限制由用戶(hù)自由書(shū)寫(xiě)就無(wú)法實(shí)現(xiàn)令人滿(mǎn)意的識(shí)別率,而且現(xiàn)有的識(shí)別方法需要從眾多的候選字中挑選,這無(wú)疑于編碼方法中的一碼多字現(xiàn)象,不僅影響到書(shū)寫(xiě)速度,同時(shí)也不適合人們的寫(xiě)作習(xí)慣。有的方法中用到了把整頁(yè)文字墨跡作為一幅圖像處理,這樣做相對(duì)而言照顧到了人們的寫(xiě)作習(xí)慣,然而又使得文稿編輯工作無(wú)法進(jìn)行??偲饋?lái)講,一種適合于人們寫(xiě)作習(xí)慣的手寫(xiě)體處理系統(tǒng)是很需要的。
為了配合說(shuō)明本發(fā)明的原理及實(shí)現(xiàn)方法,附有如下之說(shuō)明書(shū)附圖
圖1手寫(xiě)體文字處理系統(tǒng)設(shè)備組成及關(guān)聯(lián)示意圖。
圖2手寫(xiě)體文字處理系統(tǒng)組成示意圖。
圖3書(shū)寫(xiě)板的布局形式。
圖4手寫(xiě)體文字的點(diǎn)陣處理方法示意圖。
圖5生成手寫(xiě)體顯示、打印字庫(kù)及手寫(xiě)體識(shí)別字典的程序結(jié)構(gòu)簡(jiǎn)圖。
圖6“字形變厚”算法處理結(jié)果示意圖。
圖7“字形變薄”算法處理結(jié)果示意圖。
圖8手寫(xiě)體“字形變厚變薄嵌套”識(shí)別方法程序結(jié)構(gòu)圖。
本發(fā)明的目的在于創(chuàng)造一種實(shí)用的手寫(xiě)體文字處理系統(tǒng)。該系統(tǒng)由筆輸入書(shū)寫(xiě)板、微型計(jì)算機(jī)、顯示器、打印機(jī)及掃描儀等各部分組成(如圖1所示)。這一個(gè)比較大的思路主要包括如下內(nèi)容(如圖2所示)。
1、手寫(xiě)體聯(lián)機(jī)實(shí)時(shí)輸入及處理系統(tǒng)。利用該系統(tǒng)建立特定人手寫(xiě)體顯示,打印字庫(kù),實(shí)現(xiàn)國(guó)標(biāo)漢字文件向手寫(xiě)體文件的轉(zhuǎn)化,實(shí)現(xiàn)國(guó)標(biāo)漢字與手寫(xiě)體文字的混合排版打印。如圖2-A所示。
2、一種新穎的文字識(shí)別方法-“字形變厚變薄嵌套”文字識(shí)別方法。應(yīng)用該方法實(shí)現(xiàn)特定人手寫(xiě)體聯(lián)機(jī)實(shí)時(shí)輸入識(shí)別,實(shí)現(xiàn)特定人手寫(xiě)體文件向國(guó)標(biāo)漢字文件的轉(zhuǎn)化,利用該方法脫機(jī)識(shí)別印刷體或手寫(xiě)體文字。如圖2-B所示。
手寫(xiě)體聯(lián)機(jī)實(shí)時(shí)輸入及處理系統(tǒng)由筆輸入書(shū)寫(xiě)板、微型計(jì)算機(jī)、顯示器和打印機(jī)各部分組成(如圖1所示)。用戶(hù)持筆在書(shū)寫(xiě)板上寫(xiě)字,筆運(yùn)動(dòng)的軌跡送入計(jì)算機(jī),由計(jì)算機(jī)處理,經(jīng)顯示器顯示,由打印機(jī)輸出。便攜式計(jì)算機(jī)可做成一本書(shū)大小。筆輸入書(shū)寫(xiě)板可采用平板型數(shù)字化儀,如電磁感應(yīng)型的,磁致伸縮型的,壓敏型的、靜電耦合型的或平面電阻型的等等。針對(duì)不同的書(shū)寫(xiě)板、筆又分有線型(即筆與書(shū)寫(xiě)板間有線相連)和無(wú)線型兩種。顯示器可采用液晶顯示器,也可以把顯示器和數(shù)字化板聯(lián)在一起。邊書(shū)寫(xiě),邊顯示。用筆在書(shū)寫(xiě)板上寫(xiě)字時(shí),書(shū)寫(xiě)板完成對(duì)筆相對(duì)書(shū)寫(xiě)板的坐標(biāo)位置的檢測(cè),并完成模數(shù)轉(zhuǎn)換。計(jì)算機(jī)接受書(shū)寫(xiě)板輸入的信號(hào),把每個(gè)字的手寫(xiě)體信號(hào)變換為一定規(guī)格的點(diǎn)陣信號(hào),例如16×16或者24×24的點(diǎn)陣信息等等。然后如同處理國(guó)標(biāo)漢字一樣,可以在顯示屏上顯示手寫(xiě)字體,編輯和排版打印手寫(xiě)體文字。
筆輸入書(shū)寫(xiě)板可以采用多種面板布局形式。如圖3-A所示的布局把書(shū)寫(xiě)板劃分為兩個(gè)區(qū)域。一個(gè)區(qū)域作為字符鍵盤(pán)代用區(qū),用來(lái)代替通常的鍵盤(pán),在其上可以完成鍵盤(pán)的所有工作;另一個(gè)區(qū)域則為一個(gè)或一組大小相同的方格,作為用戶(hù)書(shū)寫(xiě)使用。圖3-B所示的布局同樣把書(shū)寫(xiě)板分為兩個(gè)區(qū)域。一個(gè)區(qū)域作為功能鍵代用區(qū),該區(qū)由完成系統(tǒng)功能的各個(gè)功能鍵小區(qū)組成;另一個(gè)區(qū)域則為一組大小相同的書(shū)寫(xiě)方格。功能鍵區(qū)域較小,書(shū)寫(xiě)區(qū)域較大,書(shū)寫(xiě)板如同稿紙一樣。這種布局比較適合于作家、編輯和記者群體寫(xiě)作使用。
用筆在書(shū)寫(xiě)板上自由書(shū)寫(xiě)時(shí),書(shū)寫(xiě)板輸出一組相對(duì)于書(shū)寫(xiě)板坐標(biāo)系的坐標(biāo)點(diǎn)信號(hào),以集合{(XP,YP)︱0≤p≤q-1;p,q∈N*}表示。N為自然數(shù)的集合,N*為包括零及自然數(shù)的集合。計(jì)算機(jī)實(shí)時(shí)采集由書(shū)寫(xiě)板輸出的信號(hào),對(duì)其進(jìn)行規(guī)范化處理,將其轉(zhuǎn)換為一定規(guī)格的點(diǎn)陣信息。一般地,假設(shè)手寫(xiě)體點(diǎn)陣為m×n點(diǎn)陣(m,n∈N),并以m=n=16時(shí)作出圖示說(shuō)明。
把書(shū)寫(xiě)板上的書(shū)寫(xiě)方格劃分為m×n的等分網(wǎng)格(如圖4-A),共m×n個(gè)小網(wǎng)格。第i行與第j列交叉之網(wǎng)格記為W(i,j)。W(i,j)所對(duì)應(yīng)的值記為C(i,j),其中0≤i≤m-1;0≤j≤n-1;i,j∈N*。W(i,j)對(duì)應(yīng)的四個(gè)結(jié)點(diǎn)的坐標(biāo)分別記為(Xf,Yf),(Xf,Yf+1),(Xf+1,Yf)和(Xf+1,Yf+1),如圖4-A中對(duì)應(yīng)于陰影網(wǎng)絡(luò)W(4,5)的四個(gè)結(jié)點(diǎn)a、b、c、d的四個(gè)坐標(biāo)依次為(X4,Y4),(X4,Y5),(X5,Y4),(X5,Y5)。當(dāng)手寫(xiě)體的筆跡坐標(biāo)落入W(i,j)時(shí),W(i,j)中以點(diǎn)表示,其對(duì)應(yīng)值為1。以C(i,j)的集合{C(i,j)}表示手寫(xiě)體點(diǎn)陣信息。如圖4-B所示。
若存在p∈N*,0≤p≤q-1使得Xi≤Xp≤Xf+1且Yj≤Yp≤Yj+1
則C(i,j)=1否則C(i,j)=0其中i,j∈N*;0≤i≤m-1;0≤j≤n-1。
為了區(qū)分前一手寫(xiě)字與后一手寫(xiě)字,可以混和使用下述之三種方式。
1.結(jié)束碼方式。在書(shū)寫(xiě)板上設(shè)置結(jié)束碼區(qū),每寫(xiě)完一個(gè)字,就用筆點(diǎn)觸結(jié)束碼區(qū),計(jì)算機(jī)根據(jù)結(jié)束碼坐標(biāo)判別前一字之結(jié)束及后一字開(kāi)始。
2.等待時(shí)間方式。預(yù)先規(guī)定筆離開(kāi)書(shū)寫(xiě)板時(shí)的等待時(shí)間。當(dāng)筆離開(kāi)書(shū)寫(xiě)板的時(shí)間大于等于等待時(shí)間,就認(rèn)為一個(gè)字已寫(xiě)完。
3.字符格方式。書(shū)寫(xiě)板上標(biāo)出一組書(shū)寫(xiě)方格,一格中寫(xiě)一字。寫(xiě)完一字寫(xiě)下一字時(shí),筆觸及下一格的坐標(biāo),以此判別前一字結(jié)束。
該手寫(xiě)體文件編輯器采用功能菜單的人機(jī)對(duì)話方式。這種方式使用戶(hù)不需要專(zhuān)門(mén)記憶使用的方法,屏幕會(huì)不斷提示下一步該做的操作。用戶(hù)可以在書(shū)寫(xiě)板上用觸筆或用鍵盤(pán)移動(dòng)光標(biāo)選擇菜單項(xiàng),也可以在書(shū)寫(xiě)板上用筆點(diǎn)觸相應(yīng)的功能區(qū)或用鍵盤(pán)上相應(yīng)的功能鍵完成。在功能上可以包括手寫(xiě)體字符或字符串的刪除、插入、移動(dòng)、復(fù)制等;包括手寫(xiě)體字符或字符串的放縮、字體藝術(shù)化變換等;包括對(duì)手寫(xiě)體文件的塊操作功能包括多個(gè)手寫(xiě)體文件間的移動(dòng)、復(fù)制等功能。
對(duì)于手寫(xiě)體文件提供文件服務(wù)功能。包括手寫(xiě)體文件的非失真壓縮及復(fù)原處理、手寫(xiě)體文件的加密及解密、手寫(xiě)體文件與國(guó)標(biāo)漢字文件的相互轉(zhuǎn)化等功能。
通過(guò)該系統(tǒng)可以建立對(duì)應(yīng)于國(guó)標(biāo)字庫(kù)的個(gè)人手寫(xiě)體字庫(kù),包括顯示字庫(kù)和精度較高的打印字庫(kù)。其程序結(jié)構(gòu)簡(jiǎn)圖如圖5所示。通過(guò)該字庫(kù)可以實(shí)現(xiàn)國(guó)標(biāo)漢字文件向個(gè)人手寫(xiě)體文件的轉(zhuǎn)換,實(shí)現(xiàn)國(guó)標(biāo)漢字與個(gè)人手寫(xiě)體漢字的混和排版打印。
運(yùn)用如下所述的“字形變厚變薄嵌套”文字識(shí)別方法,可以將聯(lián)機(jī)輸入的手寫(xiě)體文件轉(zhuǎn)化為國(guó)標(biāo)漢字文件,對(duì)轉(zhuǎn)換后的文件提供編輯,修改及除錯(cuò)。
下面說(shuō)明對(duì)漢字點(diǎn)陣處理的“字形變厚”及“字形變薄”方法。
1.“字形變厚”算法假設(shè)手寫(xiě)體做成m×n點(diǎn)陣(m,n∈N),{C(i,j)}經(jīng)“字形變厚”算法處理后表示為{D(i,j)}。
首先置D(i,j)=0(0≤i≤m-1;0≤j≤n-1;i,j∈N*)若C(i,j)=1時(shí)置D(i±1,j)=D(i,j±1)=1(1)或者D(i±1,j±1)=1(2)其中1∈{1|0≤1≤r;1,r∈N*}0≤i,i±1≤m-10≤j,j±1≤n-1
r為一指定常數(shù),r∈N*。
當(dāng)取r=1,i=j(luò)=2,m=n=16時(shí),圖4-B所示點(diǎn)陣依(1)式計(jì)算時(shí),處理結(jié)果如圖6-A所示;依(2)式計(jì)算時(shí),處理結(jié)果如圖6-B所示。由圖示可以看出算法(2)比算法(1)使字形更加厚。同樣可以知道r越大,字形越厚。在實(shí)用時(shí)可依具體情況選擇采用(1)或(2)式及確定常數(shù)r的值。
2.“字形變薄”算法針對(duì)手寫(xiě)體點(diǎn)陣C(i,j)},分別進(jìn)行“橫向剔點(diǎn)”及“縱向剔點(diǎn)”,然后求“或”運(yùn)算得到變薄的字形點(diǎn)陣{E(i,j)}。
首先置E(i,j)=0(0≤i≤m-1;0≤j≤n-1;i,j∈N*}對(duì)手寫(xiě)體點(diǎn)陣“橫向剔點(diǎn)”若C(i,j)=……=C(i,j+s-1)=1且C(i,j-1)=C(i,j+s)=0且0≤i≤m-1且1≤j≤n-2且1≤s≤n-j-1且i,j,s∈N*時(shí)置E(i,〔j+s/2〕)=1若C(i,0)=1且C(i,1)=0時(shí)置E(i,0)=1(3)若C(i,n-1)=1且C(i,n-2)=0時(shí)置E(i,n-1)=1(4)同理對(duì)手寫(xiě)體點(diǎn)陳“縱向剔點(diǎn)”若C(i-1,j)=C(i+t,j)=0且C(i,j)=……=C(i+t-1,j)=1且0≤i≤m-2且1≤j≤n-1且1≤t≤m-i-1且i,j,t∈N*時(shí)置E([j+t/2],j)=1若C(0,j)=1且C(1,j)=0時(shí)置E(0,j)=1(5)若C(m-1,j)=1且C(m-2,j)=0時(shí)置E(m-1,j)=1(6)如圖6-B所示的原字形點(diǎn)陣經(jīng)“橫向剔點(diǎn)”成為如圖7-A所示的點(diǎn)陣;經(jīng)“縱向剔點(diǎn)”成為如圖7-B所示的點(diǎn)陣;兩者經(jīng)“或”運(yùn)算后成為如圖7-C所示的“變薄”的字形點(diǎn)陣。
采用如圖5所示的程序結(jié)構(gòu)簡(jiǎn)圖建立特定人手寫(xiě)體識(shí)別字典。如圖5中的虛線框所示,與建立特定人手寫(xiě)體顯示、打印字庫(kù)不同的是,識(shí)別字典需要記錄手寫(xiě)體的起筆坐標(biāo),需要對(duì)手寫(xiě)體點(diǎn)陣{C(i,j)}按照“字形變厚”或“字形變薄”方法變?yōu)槭謱?xiě)體識(shí)別點(diǎn)陣{S(i,j)}。
用筆在書(shū)寫(xiě)板上書(shū)寫(xiě)時(shí),計(jì)算機(jī)接受到的首先位置點(diǎn)為起筆點(diǎn)。如果起筆點(diǎn)落入W(i0,j0)小網(wǎng)格中,則以(i0,j0)作為該字的起筆坐標(biāo)。其中0≤i0≤m-1,0≤j0≤n-1。
針對(duì)同一個(gè)人寫(xiě)同一個(gè)字時(shí)的不同寫(xiě)法,在識(shí)別字典中對(duì)同一個(gè)字依次列出不同的起筆坐標(biāo)及其點(diǎn)陣信息。針對(duì)諸字的使用頻率不同,識(shí)別字典把漢字按其使用頻率高低分類(lèi)排列,將使用頻率高的漢字排在前面,以利于提高識(shí)別速度。
目前,專(zhuān)利及有關(guān)公開(kāi)文獻(xiàn)資料中所采用的漢字識(shí)別方法(包括聯(lián)機(jī)或脫機(jī)下的手寫(xiě)體、印刷體及手寫(xiě)印刷體漢字識(shí)別)大都采用把漢字分成一組筆劃,先識(shí)別筆劃,而后得到整字的方法。這些方法都忽略了漢字的另一個(gè)本質(zhì)特點(diǎn),即漢字的整體形態(tài)。無(wú)論是印刷體或是手寫(xiě)體,同一個(gè)字的字跡在整體上都具有相似的特征。手寫(xiě)體的起筆坐標(biāo)也是這樣。從這一思想出發(fā),本發(fā)明提出一種新穎的漢字識(shí)別方法,即“字形變厚變薄嵌套”方法。這種方法完全不采用漢字的筆劃特征,而是通過(guò)處理手寫(xiě)體點(diǎn)陣使其手跡線條或字形變厚、變薄,然后以厚字形嵌套薄字形,達(dá)成對(duì)其識(shí)別的目的。這樣因?yàn)榛乇芰藵h字的筆劃特征,從而解決了連筆手寫(xiě)體漢字識(shí)別這個(gè)長(zhǎng)期困感科技人員的難題。
手寫(xiě)體漢字識(shí)別可分為四個(gè)步驟,其程序結(jié)構(gòu)如圖8所示。
1.獲得手寫(xiě)體起筆坐標(biāo)(i0,j0)及其點(diǎn)陳{C(i,j)}。對(duì)手寫(xiě)體點(diǎn)陣預(yù)處理,將{C(i,j)}變?yōu)椋鸇(i,j)}或{E(i,j)}。
計(jì)算機(jī)接收書(shū)寫(xiě)板輸入的信息,按照建立手寫(xiě)體識(shí)別字典用到的方法取得手寫(xiě)文字的起筆坐標(biāo)(i0’,j0’)及其點(diǎn)陣{C(i,j)}。當(dāng)識(shí)別字典采用“字形變薄”方法時(shí),將{C(i,j)}經(jīng)“字形變厚”方法變換為字形點(diǎn)陣{D(i,j)};當(dāng)識(shí)別字典采用“字形變厚”方法時(shí),將{C(i,j)}經(jīng)“字形變薄”方法變換為{E(i,j)}。這兩條途徑都是可行的。具體應(yīng)用時(shí)原理和方法也是相同的。下面以識(shí)別字典采用“字形變薄”方法為例說(shuō)明。
值得注意的是,在使用“字形變厚”方法的時(shí)候,選擇(1)式或(2)式及確定r的值一定要考慮到“字形變厚”雖然能夠提高嵌套效果,但是字形太厚也容易加大誤識(shí)率。
2.計(jì)算起筆坐標(biāo)差異(Q),對(duì){D(i,j)}進(jìn)一步處理。
手寫(xiě)體起筆坐標(biāo)(i0’,j0’)與識(shí)別字典中的手寫(xiě)體起筆坐標(biāo)(i0,j0)的差異稱(chēng)為起筆坐標(biāo)差異,以Q表示。
Q=|i0’-i0|+|j0’-j0|特定人在一個(gè)特定大小的方格中書(shū)寫(xiě)某一特定字的時(shí)候,雖然一個(gè)字有不同的寫(xiě)法,然而針對(duì)某一種寫(xiě)法,它的起筆位置應(yīng)該是變化不大的。所以Q值大到一定程度Q>Q0(Q0為一設(shè)定值,Q0≥0,Q0∈N*)我們就可以認(rèn)為從識(shí)別字典中取出的字與手寫(xiě)字是不同的兩個(gè)字了。確定常數(shù)Q0時(shí),要考慮到所使用點(diǎn)陣的精度等多種因素。
當(dāng)Q≠0且Q≤Q0時(shí),需要對(duì)手寫(xiě)體點(diǎn)陣{D(i,j)}作平移變換,得到新點(diǎn)陣{D(i,j)}。新點(diǎn)陣的起筆坐標(biāo)與識(shí)別字點(diǎn)陣{S(i,j)}的相同,對(duì)應(yīng)的起筆坐標(biāo)差異等于0。
首先預(yù)置D’(i,j)=0其中0≤i≤m-1;0≤j≤n-1;i,j∈N*若(i,j)∈{(i,j)|0≤i+i0-i0’≤m-1且0≤j+j0-j0’≤n-1且0≤i≤m-1且0≤j≤n-1且 i,j∈N*}時(shí)置D(i,j)=D(i+i0-i0’,j+j0-j0’)當(dāng)Q=0時(shí),認(rèn)為D(i,j)=D(i,j)。
3.計(jì)算嵌套效果(K)K=Σi=0m-1Σj=0n-1D·(i,j)S(i,j)Σi=0m-1Σj=0n-1S(i,j)]]>K用來(lái)衡量薄字形被厚字形嵌套的程度,實(shí)際上是{D(i,j)}與{S(i,j)}相“與”的結(jié)果。當(dāng)K=1時(shí),薄字形被厚字形完全嵌套,認(rèn)為兩者是同一個(gè)字,識(shí)別工作也就完成了。當(dāng)K≠1時(shí),可以設(shè)定一個(gè)特定常數(shù)K0(0<K0<1),當(dāng)K<K0時(shí),說(shuō)明嵌套效果較差,將從識(shí)別字典中取出的對(duì)應(yīng)字略去,轉(zhuǎn)而繼續(xù)嵌套其它字。這樣可以提高識(shí)別效率。當(dāng)K≥K0時(shí),稱(chēng)其對(duì)應(yīng)字為手寫(xiě)體的候選字。所有候選字組成的集合稱(chēng)為手寫(xiě)體的候選字集。整變量V記錄得到的候選字?jǐn)?shù)。設(shè)置常數(shù)V0限制候選字的數(shù)量。
4.判斷選擇第三步的工作可以得到識(shí)別目標(biāo)的候選字集。按其對(duì)應(yīng)的嵌套效果(K)的大小排列,可以得到一個(gè)最優(yōu)的識(shí)別目標(biāo),即是我們的識(shí)別結(jié)果。在聯(lián)機(jī)實(shí)時(shí)識(shí)別時(shí),在把識(shí)別結(jié)果提供給用戶(hù)的同時(shí),可以將順序排列的候選字顯示出來(lái),供用戶(hù)用來(lái)替換不正確的優(yōu)選目標(biāo)。在脫機(jī)識(shí)別工作中,就以?xún)?yōu)選目標(biāo)作為待識(shí)字的識(shí)別結(jié)果。在具體運(yùn)用時(shí),可以采用多種方法提高識(shí)別速度。
以上說(shuō)明了手寫(xiě)體識(shí)別的“字形變厚變薄嵌套”方法。這種方法同樣可以使用于脫機(jī)手寫(xiě)體或印刷體文字的識(shí)別工作。這需要配備一臺(tái)掃描儀,計(jì)算機(jī)接受掃描儀對(duì)手寫(xiě)體文字處理后輸出的信號(hào),轉(zhuǎn)換為一定規(guī)格的手寫(xiě)體點(diǎn)陣。在文字識(shí)別處理過(guò)程中,略去手寫(xiě)體起筆坐標(biāo)信息及其處理過(guò)程。顯而易見(jiàn)的是,這種計(jì)算機(jī)文字信息處理方法可以應(yīng)用于包括中文、日文、英文、朝鮮文等多國(guó)多民族文字。
人們?cè)趯?xiě)作時(shí),從構(gòu)思、草稿、到出稿、然后打字印刷,需要對(duì)文稿反復(fù)修改、反復(fù)謄清。這一工作量是相當(dāng)大的,耗費(fèi)了人們大量心血。況且手工起草文稿的時(shí)候,一次只能寫(xiě)一份,需要多份時(shí)只好使用復(fù)寫(xiě)紙或復(fù)印機(jī),效果不好。采用本發(fā)明所述的手寫(xiě)體直接輸入和處理方法,人們?cè)跁?shū)寫(xiě)板上如同在稿紙上一樣自由書(shū)寫(xiě)。系統(tǒng)接收書(shū)寫(xiě)板輸入的手寫(xiě)信息,變?yōu)槭謱?xiě)體點(diǎn)陣,即把每個(gè)手寫(xiě)文字作為一幅小圖像處理,把手寫(xiě)文字不加識(shí)別地直接顯示,并且可以編輯、存儲(chǔ)和排版打印手寫(xiě)體文稿。采用本系統(tǒng)所述的文字識(shí)別方法,將依本系統(tǒng)寫(xiě)就的手寫(xiě)體文件識(shí)別處理為國(guó)標(biāo)漢字文件。也可以聯(lián)機(jī)實(shí)時(shí)輸入和識(shí)別手寫(xiě)體文字。因本發(fā)明所采用的“字形變厚變薄嵌套”文字識(shí)別方法回避了文字的筆劃特征,而以文字的起筆和字形信息為依據(jù)識(shí)別文字,從而解決了連筆字識(shí)別這個(gè)難題。用本發(fā)明所述的方法處理手寫(xiě)文字,極大地方便了人們的寫(xiě)作活動(dòng),大大減輕了人們寫(xiě)作的勞動(dòng)強(qiáng)度,具有較大的實(shí)用價(jià)值,尤其是對(duì)于作家、記者、編輯及機(jī)關(guān)辦公人員等經(jīng)常從事寫(xiě)作的人們。
權(quán)利要求
1.一種手寫(xiě)體文字處理系統(tǒng),其特征是由電腦主機(jī)、鍵盤(pán)、筆輸入書(shū)寫(xiě)板、顯示屏、打印機(jī)、掃描儀以及其它部件組成。計(jì)算機(jī)采集由書(shū)寫(xiě)板或掃描儀輸入的特定人手寫(xiě)體信號(hào)、轉(zhuǎn)換成指定規(guī)格的手寫(xiě)體點(diǎn)陣信息。系統(tǒng)完成對(duì)特定人手寫(xiě)體點(diǎn)陣的各種處理工作。
2.按照權(quán)利要求1所述的系統(tǒng),計(jì)算機(jī)接收筆輸入書(shū)寫(xiě)板輸入的手寫(xiě)體信號(hào),轉(zhuǎn)換為一定規(guī)格的手寫(xiě)體點(diǎn)陣,以手寫(xiě)體的形式直接顯示,編輯、存儲(chǔ)、排版打印手寫(xiě)體文件。
3.按照權(quán)利要求1所述的系統(tǒng),建立手寫(xiě)體顯示及打印字庫(kù),實(shí)現(xiàn)國(guó)標(biāo)漢字文件向手寫(xiě)體文件的轉(zhuǎn)換,實(shí)現(xiàn)國(guó)標(biāo)漢字與手寫(xiě)體漢字的混和排版打印。
4.按照權(quán)利要求1所述的系統(tǒng),記錄手寫(xiě)體起筆坐標(biāo),并通過(guò)“字形變厚”或者“字體變薄”算法,建立手寫(xiě)體識(shí)別字典。
5.按照權(quán)利要求1或權(quán)利要求4所述的系統(tǒng),采用“字形變厚變薄嵌套”文字識(shí)別方法。也可依此識(shí)別方法實(shí)現(xiàn)手寫(xiě)體文字向國(guó)標(biāo)漢字文件的轉(zhuǎn)化。
6.按照權(quán)利要求1和權(quán)利要求5所述的系統(tǒng),聯(lián)機(jī)實(shí)時(shí)識(shí)別手寫(xiě)體文字。
7.按照權(quán)利要求2或權(quán)利要求5所述的系統(tǒng),將聯(lián)機(jī)手寫(xiě)輸入的手寫(xiě)體文件識(shí)別為國(guó)標(biāo)漢字文件。
8.按照權(quán)利要求1或權(quán)利要求5所述的系統(tǒng),接受掃描儀處理手寫(xiě)體文字后輸出的信號(hào),轉(zhuǎn)換為一定規(guī)格的手寫(xiě)體點(diǎn)陣信息,按照“字形變厚變薄嵌套”文字識(shí)別方法,脫機(jī)識(shí)別手寫(xiě)體文件。
9.按照權(quán)利要求1-8所述的系統(tǒng)可以應(yīng)用于中文、英文、日文、朝鮮文等多國(guó)、多民族文字。
全文摘要
本發(fā)明所申請(qǐng)的手寫(xiě)體文字處理系統(tǒng)屬計(jì)算機(jī)文字信息處理領(lǐng)域。計(jì)算機(jī)采集由筆輸入書(shū)寫(xiě)板輸入的手寫(xiě)信號(hào),轉(zhuǎn)換成文字點(diǎn)陣,直接顯示、編輯、存儲(chǔ)及排版打印。人們可以自由書(shū)寫(xiě)、修改文稿。通過(guò)建立手寫(xiě)體顯示、打印字庫(kù)及識(shí)別字典,實(shí)現(xiàn)手寫(xiě)體與國(guó)標(biāo)字體的混和排版打印。按照一個(gè)新穎的文字識(shí)別方法,聯(lián)機(jī)實(shí)時(shí)識(shí)別或脫機(jī)識(shí)別手寫(xiě)體文字。該方法解決了連筆字識(shí)別問(wèn)題。本發(fā)明可以使用于中文、日文、英文、朝鮮文等多國(guó)多民族文字。
文檔編號(hào)G06F3/02GK1110801SQ94115228
公開(kāi)日1995年10月25日 申請(qǐng)日期1994年9月27日 優(yōu)先權(quán)日1994年9月27日
發(fā)明者張志國(guó) 申請(qǐng)人:張志國(guó)