亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種手寫字符識(shí)別方法及系統(tǒng)的制作方法

文檔序號(hào):6470678閱讀:212來源:國(guó)知局

專利名稱::一種手寫字符識(shí)別方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及手寫字符識(shí)別領(lǐng)域,尤其涉及一種手寫字符識(shí)別的方法及系統(tǒng)。
背景技術(shù)
:目前手寫輸入的識(shí)別技術(shù)被應(yīng)用到各種通信終端及信息處理終端;這種類型的終端產(chǎn)品通常具有一個(gè)用于書寫的觸摸手寫熒光屏,用戶能在上面用筆或手指寫字,然后經(jīng)過終端的識(shí)別處理,生成相應(yīng)的字符顯示在終端上,并進(jìn)行后續(xù)的相關(guān)操作,手寫輸入的識(shí)別技術(shù)提高了輸入的速度和靈活性,因此被普遍地應(yīng)用。現(xiàn)在的手寫輸入的識(shí)別過程大多分為信號(hào)采集、預(yù)處理、特征提取、特征匹配等步驟,現(xiàn)有技術(shù)因計(jì)算量大、處理時(shí)間長(zhǎng),使得識(shí)別速度還是較慢,且識(shí)別精度不高,還有待進(jìn)一步的改進(jìn)。
發(fā)明內(nèi)容基于現(xiàn)有技術(shù)的不足,本發(fā)明實(shí)施例要解決的技術(shù)問題在于提供一種手寫字符識(shí)別的方法及系統(tǒng),使得手寫字符輸入識(shí)別的特征提取速度更快,且更準(zhǔn)確。本發(fā)明的目的通過以下技術(shù)方案實(shí)現(xiàn)一種手寫字符識(shí)別方法,包括以下步驟A、建立由各個(gè)字符類的第一樣本中心構(gòu)成的粗分類模版,以及由各個(gè)字符類的第二樣本中心構(gòu)成的細(xì)分類模版,該細(xì)分類模版是利用特征變換矩陣對(duì)各個(gè)字符類的樣本進(jìn)行特征變換得來的;B、接收用戶手寫字符輸入的信號(hào)并采集輸入字符軌跡點(diǎn)的離散坐標(biāo)序列,進(jìn)行預(yù)處理之后得到該字符的規(guī)整坐標(biāo)序列;C、根據(jù)所述規(guī)整坐標(biāo)序列,進(jìn)行特征提取,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,計(jì)算手寫輸入字符的多維特征矢量;D、從所述手寫輸入字符的多維特征矢量中選取部分特征值,將所述手寫輸入字符分別與所述粗分類模版進(jìn)行匹配,從中選取相似度最大的若干個(gè)樣本中心,并將這若干個(gè)樣本中心對(duì)應(yīng)的字符類作為候選字符類;E、利用步驟A中所述的特征變換矩陣,對(duì)所述手寫輸入字符的多維特征矢量進(jìn)行特征變換,從所述細(xì)分類模版中選取步驟D中得到的所述候選字符類的樣本中心,分別與特征變換后的手寫輸入字符進(jìn)行匹配,從所述候選字符類中確定最相似的字符類,以供用戶選擇。本發(fā)明還提供一種手寫字符識(shí)別系統(tǒng),其包括存儲(chǔ)模塊,用于存儲(chǔ)各個(gè)字符類,以及所述各個(gè)字符類對(duì)應(yīng)的粗分類模版和細(xì)分類模版,還有根據(jù)Fisher準(zhǔn)則計(jì)算得到的特征變換矩陣;第一信號(hào)采集模塊,用于接收用戶手寫字符輸入的信號(hào)并采集手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;第一歸一化模塊,用于將所述第一信號(hào)采集模塊采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫字符的大小和形狀以及重心的坐標(biāo)值,得到該字符的規(guī)整坐標(biāo)序列;第一特征提取模塊,用于根據(jù)所述規(guī)整坐標(biāo)序列,將手寫字符的所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,計(jì)算手寫字符的多維特征矢量;粗分類模塊,用于從用戶手寫輸入字符的多維特征矢量中選取部分特征值,將所述手寫輸入字符分別與所述存儲(chǔ)模塊中的粗分類模版進(jìn)行匹配,從中選取相似度最大的若干個(gè)樣本中心,并將這若干個(gè)樣本中心對(duì)應(yīng)的字符類作為候選字符類;細(xì)分類模塊,用于對(duì)所述手寫輸入字符的多維特征矢量進(jìn)行特征變換,從所述細(xì)分類模版中選取所述候選字符類的樣本中心,分別與特征變換后的手寫輸入字符進(jìn)行匹配,從所述候選字符類中確定最相似的字符類,以供用戶選擇。顯示模塊,用于顯示所述細(xì)分類模塊輸出的最相似的字符類,以供用戶選擇。與現(xiàn)有技術(shù)相比較,本發(fā)明將筆劃軌跡線段直接分解到8個(gè)方向,避免了生成圖像所增加的計(jì)算量,而且得到的方向特征更準(zhǔn)確,從而使得字符識(shí)別的準(zhǔn)確度更高。本發(fā)明一種手寫字符識(shí)別方法的一種優(yōu)選實(shí)施方式是,所述步驟A具體包括以下步驟Al、采集各個(gè)字符類的手寫字符樣本,并計(jì)算所述手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列;A2、將手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列進(jìn)行預(yù)處理,得到該手寫字符樣本的規(guī)整坐標(biāo)序列;A3、根據(jù)所述的規(guī)整坐標(biāo)序列,進(jìn)行特征提取,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,得到該手寫字符樣本的多維特征矢量;A4、從全體字符類的樣本的多維特征矢量中選取部分特征值,計(jì)算各個(gè)字符類的第一樣本中心,得到由各個(gè)字符類的第一樣本中心構(gòu)成的粗分類模版;A5、根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對(duì)全體字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個(gè)字符類的第二樣本中心,得到由各個(gè)字符類的第二樣本中心構(gòu)成的細(xì)分類模版。本發(fā)明一種手寫字符識(shí)別方法的另一種優(yōu)選實(shí)施方式是,所述步驟A3和C具體包括以下步驟根據(jù)所述規(guī)整坐標(biāo)序列,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,每個(gè)標(biāo)準(zhǔn)方向上得到各個(gè)矢量線段的長(zhǎng)度值;對(duì)所述得到的各個(gè)矢量線段的長(zhǎng)度值進(jìn)行處理,計(jì)算大尺度特征值和小尺度特征值,得到由大尺度特征值和小尺度特征值構(gòu)成的多維特征矢量。本發(fā)明一種手寫字符識(shí)別方法的另一種優(yōu)選實(shí)施方式是,所述步驟A4具體包括以下步驟根據(jù)Fisher準(zhǔn)則,從預(yù)存的每一個(gè)字符類的樣本中,選取使得Fisher比最大的若干個(gè)特征值;根據(jù)由選取特征值構(gòu)成的樣本的特征矢量,計(jì)算該字符類的樣本中心的特征矢量,得到由全體字符類的樣本中心構(gòu)成的粗分類模版。本發(fā)明一種手寫字符識(shí)別的方法的另一種優(yōu)選實(shí)施方式是,所述步驟A5具體包括以下步驟利用根據(jù)Fisher準(zhǔn)則得到的特征變換矩陣,將所有字符類的樣本進(jìn)行特征變換,降低其多維特征矢量的維數(shù);重新計(jì)算特征變換后的所有字符類的樣本中心;對(duì)所述特征變換矩陣及所有字符類的樣本中心進(jìn)行迭代調(diào)整,重新計(jì)算特征變換矩陣和所有字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的細(xì)分類模版。本發(fā)明一種手寫字符識(shí)別方法的另一種優(yōu)選實(shí)施方式是,所述步驟D具體包括以下步驟根據(jù)Fisher準(zhǔn)則,從所述手寫輸入字符的多維特征矢量中選取部分特征值,所述手寫輸入字符具有與字符類的樣本相同維數(shù)的由選取特征值構(gòu)成的特征矢量;將所述手寫輸入字符分別與所述粗分類模版進(jìn)行匹配,從預(yù)存儲(chǔ)字符類中選取相似度最大的若干個(gè)候選字符類。本發(fā)明一種手寫字符識(shí)別的方法的另一種優(yōu)選實(shí)施方式是,所述步驟E具體包括以下步驟用迭代調(diào)整后的特征變換矩陣對(duì)手寫輸入字符進(jìn)行特征變換,得到其低維特征矢量;該手寫輸入字符的低維特征矢量分別與從所述細(xì)分類模版中選取的候選字符類的樣本中心進(jìn)行匹配,從候選字符類中確定相似度最大的字符類,以供用戶選擇。本發(fā)明一種手寫字符識(shí)別方法的另一種優(yōu)選實(shí)施方式是,所述步驟Al和B具體還包括以下步驟判斷一個(gè)手寫字符輸入是否結(jié)束,當(dāng)未接收到手寫字符輸入信號(hào)的時(shí)間超過設(shè)定的閾值,則結(jié)束該字符離散坐標(biāo)序列的采集。檢查采集到的手寫字符的軌跡點(diǎn)是否只有一個(gè),如果是則刪除該軌跡點(diǎn)重新采集;檢測(cè)采集到的手寫字符的軌跡點(diǎn)中相鄰點(diǎn)之間的坐標(biāo)距離,如果該距離小于設(shè)定的闊值,則刪除其中的一點(diǎn),使得相鄰點(diǎn)之間保持一定距離。本發(fā)明一種手寫字符識(shí)別方法的另一種優(yōu)選實(shí)施方式是,所述步驟A2、B中的預(yù)處理是將采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫輸入字符的大小和形狀以及重心的坐標(biāo)值,具體包括以下步驟將所有軌跡點(diǎn)的4黃坐標(biāo)值和縱坐標(biāo)值變換到介于0到100之間;分別計(jì)算所有軌跡點(diǎn)4黃坐標(biāo)和縱坐標(biāo)的重心坐標(biāo)值;將所有軌跡點(diǎn)坐標(biāo)值和重心坐標(biāo)值除以100,使所有軌跡點(diǎn)坐標(biāo)12值和重心坐標(biāo)值變?yōu)镺到l之間,利用使重心坐標(biāo)值的4黃坐標(biāo)和縱坐標(biāo)變?yōu)?.5的一個(gè)平滑連續(xù)函數(shù),將采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列;再將所有軌跡點(diǎn)坐標(biāo)值乘以64,得到輸入字符的規(guī)整坐標(biāo)序列。本發(fā)明一種手寫字符識(shí)別系統(tǒng)的一種優(yōu)選實(shí)施方式是,該系統(tǒng)還包括一個(gè)匹配模版獲得子系統(tǒng),該子系統(tǒng)包括第二信號(hào)采集模塊,用于接收手寫字符樣本的信號(hào)并采集手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;第二歸一化模塊,用于將所述第二信號(hào)采集模塊采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫字符的大小和形狀以及重心的坐標(biāo)值,得到該字符的規(guī)整坐標(biāo)序列;第二特征提取模塊,用于根據(jù)所述規(guī)整坐標(biāo)序列,將手寫字符的所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,計(jì)算手寫字符的多維特征矢量;粗分類模版計(jì)算模塊,用于從所述特征提取模塊得出的全偉字符類的樣本的多維特征矢量中,選取部分特征值,計(jì)算各個(gè)字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的粗分類模版,并將該粗分類模版存儲(chǔ)到所述存儲(chǔ)模塊;細(xì)分類模版計(jì)算模塊,用于根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對(duì)全體字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個(gè)字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的細(xì)分類模版,并將該細(xì)分類模版和所述特征變換矩陣存儲(chǔ)到所述存儲(chǔ)模塊。本發(fā)明一種手寫字符識(shí)別系統(tǒng)的另一種優(yōu)選實(shí)施方式是,所述第一信號(hào)采集模塊和第二信號(hào)采集模塊還包括采集單元,用于接收手寫字符的信號(hào)并采集手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;判斷單元,用于判斷一個(gè)手寫字符輸入是否結(jié)束,當(dāng)未接收到手寫字符輸入信號(hào)的時(shí)間超過設(shè)定的閾值,則結(jié)束該字符離散坐標(biāo)序列的采集;檢測(cè)單元,用于檢查采集到的手寫字符的軌跡點(diǎn)是否只有一個(gè),如果是則刪除該軌跡點(diǎn)重新采集;以及檢測(cè)采集到的手寫字符的軌跡點(diǎn)中相鄰點(diǎn)之間的坐標(biāo)距離,如果該距離小于設(shè)定的閾值,則刪除其中的一點(diǎn),使得相鄰點(diǎn)之間保持一定距離。圖1是本發(fā)明實(shí)施例一種手寫字符識(shí)別方法的流程圖。圖2是本發(fā)明實(shí)施例一種手寫字符識(shí)別方法的詳細(xì)流程圖。圖3是本發(fā)明實(shí)施例一種手寫字符識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。圖4是本發(fā)明實(shí)施例一種手寫字符識(shí)別系統(tǒng)的詳細(xì)結(jié)構(gòu)示意圖。圖5a是圖1中步驟S02中字符大小形狀調(diào)整前的示意圖。圖5b是圖1中步驟S02中字符大小形狀調(diào)整后的示意圖。圖6是圖1中步驟S02將調(diào)整后的字符放進(jìn)一個(gè)網(wǎng)格的示意圖。圖7是圖1中步驟S03中所述的8個(gè)標(biāo)準(zhǔn)方向圖。圖8是圖1中步驟S03中所述的將一個(gè)矢量線段分解到2個(gè)標(biāo)準(zhǔn)方向的示意圖。具體實(shí)施例方式為使本發(fā)明更加容易理解,結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步闡述,但附圖中的實(shí)施例不構(gòu)成對(duì)本發(fā)明的任何限制。本發(fā)明是對(duì)手寫輸入的字符經(jīng)過坐標(biāo)序列采集,預(yù)處理、特征矢量提取、粗分類、細(xì)分類等處理流程,從而最終識(shí)別該手寫字符。圖1示出了本發(fā)明實(shí)施例一種手寫字符識(shí)別方法的流程圖,其中獲得字符匹配模版的方法包括以下步驟步驟SOI,采集全體各個(gè)字符類的手寫字符樣本,并計(jì)算所述手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列;具體地用筆在觸摸屏上書寫,下筆時(shí)把筆尖的位置(x,y)坐標(biāo)序列記錄下來。一個(gè)輸入字符的完整書寫軌跡用一個(gè)(x,y)序列表示((xl,yl),(x2,y2),…,(xn,yn)}。步驟S02,將手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,進(jìn)行預(yù)處理得到該手寫字符樣本的規(guī)整坐標(biāo)序列;具體地,利用一個(gè)平滑連續(xù)函數(shù),將采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫字符的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符的規(guī)整坐標(biāo)序列;字符軌跡的歸一化有兩個(gè)目的大小標(biāo)準(zhǔn)化和形狀4交正。如圖5a-5b所示,圖5a中的字符經(jīng)過歸一化后變成了圖5b中的形狀,不僅邊界變成了規(guī)定的大小(所有字符經(jīng)歸一化后邊界變成相同大小),而且形狀也發(fā)生了變化,變得更規(guī)范,從而更容易識(shí)別。歸一化是通過兩個(gè)座標(biāo)變換函數(shù)x^和y^,實(shí)現(xiàn),4巴字符軌跡中每一點(diǎn)的座標(biāo)(x,y)用(x,,y,)代替后,就得到歸一化的字符軌跡。參數(shù)a和b的估計(jì)方法如下首先,找出座標(biāo)序列中x和y的最小值,把所有點(diǎn)的x和y坐標(biāo)分別減去x和y的最小值,從而使x和y的最小值都變成0。然后,所有的x和y值乘以100/u,其中u是所有點(diǎn)x和y的最大值,從而使x和y值介于0到100之間。第二步,求筆劃軌跡在水平方向和垂直方向上的投影。把字符筆劃軌跡放進(jìn)一個(gè)100x100的網(wǎng)格,如圖6所示(示意圖中為10x10的網(wǎng)格)。把每一縱列格子中的筆劃長(zhǎng)度相加,就得到水平方向的投影fx(i),i=l,2,...,100。同樣,把每一行格子中的筆劃長(zhǎng)度相加,就得到垂直方向的投影fy(i),i=l,2,...,100.由fx(i)計(jì)算水平方向的重心:100I>fx(i)同樣,由fy(i)計(jì)算垂直方向的重心yc。第三步,把所有點(diǎn)的坐標(biāo)及(xc,yc)除以100,變?yōu)?到l之間。log0.5aa=_2——函數(shù)尸=,和/=>>分別把xc和yc變?yōu)?.5,即&=0'5,logxc,同樣b_log0.5W=0'5,bgy。。經(jīng)過變換,使字符軌跡的重心移到(0.5,0.5)而邊界保持不變。第四步,4巴(x,,y,)乘以一個(gè)給定的倍tt,/人而^f吏字符的外框變?yōu)橐?guī)定的大小。這個(gè)倍數(shù)我們定為64。最后,歸一化字符軌跡中所有點(diǎn)的坐標(biāo)介于0到64之間。步驟S03,根據(jù)所述的規(guī)整坐標(biāo)序列,進(jìn)行特征提取,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,得到該手寫字符樣本的多維特征矢量;基本思想如下如圖7所示,把筆劃線段(每相鄰兩點(diǎn)之間連成一條矢量線,歐)分解到Dl至D8的8個(gè)標(biāo)準(zhǔn)方向,i己錄64x64網(wǎng)格中每個(gè)格子中各個(gè)方向的線段長(zhǎng)度值,然后計(jì)算兩個(gè)尺度的方向特征值。第一步,把筆劃線段分解到8個(gè)標(biāo)準(zhǔn)方向。坐標(biāo)點(diǎn)序列中每相鄰兩點(diǎn)之間連成一條線段,是一個(gè)有方向的矢量fi。該矢量f,的方向介于兩個(gè)標(biāo)準(zhǔn)方向D2與D3之間,4巴矢量f;分解成兩個(gè)標(biāo)準(zhǔn)方向D2與D3上的分量(如圖8所示),每個(gè)標(biāo)準(zhǔn)方向上的分量長(zhǎng)度計(jì)入所在格子中該方向的線段長(zhǎng)度值。這樣,在8個(gè)方向的每個(gè)方向上得到64x64個(gè)線段長(zhǎng)度值。第二步,計(jì)算大尺度特征。把每個(gè)方向上的64x64網(wǎng)格均勻分成4x4個(gè)方格,計(jì)算每個(gè)方格中各個(gè)方向上線段長(zhǎng)度值的和,得到8x4x4=128個(gè)特征值。第三步,計(jì)算小尺度特征。把每個(gè)方向上的64x64網(wǎng)格均勻分成8x8個(gè)方格,計(jì)算每個(gè)方格中各個(gè)方向上線段長(zhǎng)度值的和,得到8x8x8=512個(gè)特征^f直。大尺度特征和小尺度特征的總個(gè)數(shù)為128+512=640。步驟S04,從全體字符類的樣本的多維特征矢量中選取部分特征值,計(jì)算各個(gè)字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的粗分類模版;具體地,根據(jù)Fisher準(zhǔn)則,從每一個(gè)字符類的樣本的多維特征矢量中,選取使得Fisher比最大的若干個(gè)特征值,計(jì)算各個(gè)字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的粗分類模版。該步驟的目的是從預(yù)存儲(chǔ)字符類的樣本的特征矢量中獲得粗分類模版,為了提高粗分類的速度,要選擇一部分特征計(jì)算匹配距離,特征選擇和模版設(shè)計(jì)是在一個(gè)訓(xùn)練樣本集合上進(jìn)行的。訓(xùn)練樣本集包含每個(gè)字符類別的手寫樣本,每個(gè)樣本經(jīng)特征提取用640個(gè)特征值(640維的特征矢量x^Xp…,x柳]T)表示。設(shè)有C個(gè)類別的總共N個(gè)樣本,其中類別i有Ni個(gè)樣本。選4奪特征的準(zhǔn)則是Fisher準(zhǔn)則(沖莫式識(shí)別教材上有詳細(xì)說明)Fisher準(zhǔn)則函數(shù)的基本思想是,構(gòu)造評(píng)價(jià)函數(shù),使得當(dāng)評(píng)價(jià)函數(shù)最優(yōu)時(shí),被分類的類別之間的距離盡可能大,同時(shí)各類內(nèi)部樣本間距離盡可能小。將第i類的第j個(gè)樣本表示為特征矢量x)(由部分候選特征組成),則各個(gè)類別的樣本中心(均值)為<formula>formulaseeoriginaldocumentpage17</formula>(2)總的中心為<formula>formulaseeoriginaldocumentpage17</formula>類內(nèi)協(xié)方差矩陣和類間協(xié)方差矩陣分別計(jì)算為:sb=iz,'-,)w)TNtr(4)特征選擇的目標(biāo)是在選擇部分特征的基礎(chǔ)上,矩陣《Sb的跡t"S—w'Sb)(Fisher比)達(dá)到最大值。這里的x;候選特征在特征選擇過程中是變化的。尋找Fisher比最大的特征組合是一個(gè)組合優(yōu)化問題,可用順序前向搜索法近似求解先計(jì)算每一個(gè)特;f正的Fisher比,選擇Fisher比最大的特;f正。然后把余下特征中的每一個(gè)依次與已選特征組成特征矢量計(jì)算Fisher比,選才奪Fisher比最大的特^正加入已選特征。如此反復(fù),直到已選特4正達(dá)到規(guī)定的數(shù)目(定為100以下)為止。特征選擇的具體過程如下首先以640個(gè)特征中的每一個(gè)依次作為候選,計(jì)算Fisher比,以Fisher比最大的一個(gè)特征作為選出來的第一個(gè)特征。然后4巴剩下的639個(gè)特征中的每一個(gè)依次與第一次選出來的特征一起(此時(shí)候選特征有兩個(gè))評(píng)價(jià),選出Fisher比最大的含有2個(gè)特征值的組合。然后把剩下的638個(gè)特征中的每一個(gè)依次與前面選出來的含有2個(gè)特征值的組合一起(此時(shí)候選特征有3個(gè))評(píng)-階,選出Fisher比最大的含有3個(gè)特征值的組合。如此反復(fù),直到選出來的特征數(shù)達(dá)到指定的數(shù)目為止。特征選擇完成后,特征集也就固定了。經(jīng)過特征選擇后,各個(gè)類別的粗分類模版是一類樣本的中心(均值),用公式(2)計(jì)算。步驟S05,根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對(duì)全體字符類的樣本的多維棒征矢量進(jìn)行特征變換,重新計(jì)算各個(gè)字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的細(xì)分類模版;為了得到更高的識(shí)別精度,細(xì)分類特征采取特征變換,而不是特征選18擇,即把原來D=640維的特征矢量經(jīng)線性變換得到低維(d〈D)矢量,特征變換后的特征矢量維數(shù)一般定為IOO到150之間。利用公式y(tǒng)=Wx進(jìn)行特征變換,其中W為dxD的變換矩陣。求解變換矩陣使Fisher比地WSwWT)-YSbWT]最大,其結(jié)果,w的每一行是矩陣S—JSb對(duì)應(yīng)本征值最大的d個(gè)本征向量(這是標(biāo)準(zhǔn)的數(shù)學(xué)方法,不必贅述)。經(jīng)過降維后,各個(gè)類別的模版是一類樣本的中心(公式(2))。像上面這樣得到的特征變換矩陣和類別模版還不能得到很高的識(shí)別精度。為此,對(duì)變換矩陣和類別模版進(jìn)行迭代調(diào)整,使在訓(xùn)練樣本集合上的分類錯(cuò)誤(每個(gè)樣本分到距離最近的類別)逐步減少。首先,將所有訓(xùn)練樣本的權(quán)重設(shè)為1,用Fisher準(zhǔn)則得到的變換矩陣和類別中心模版對(duì)所有的訓(xùn)練樣本分類,每個(gè)錯(cuò)分的樣本權(quán)重加1。設(shè)樣本<(i類的第j個(gè)樣本)的權(quán)重表示為<,按下式重新計(jì)算類中心、類內(nèi)和類間協(xié)方差矩陣<formula>formulaseeoriginaldocumentpage19</formula>(8)在此基礎(chǔ)上通過使tr[(WSwWT"W、WT]最大化重新計(jì)算變換矩陣和特征變換后的類中心,重新對(duì)訓(xùn)練樣本分類,錯(cuò)分的樣本權(quán)重加1;如此反復(fù),直到訓(xùn)練樣本的分類錯(cuò)誤不再進(jìn)一步減少為止。手寫輸入字符識(shí)別的流程包括以下步驟步驟S06,接收用戶手寫字符輸入的信號(hào)并采集輸入字符軌跡點(diǎn)的離散坐標(biāo)序列,進(jìn)行預(yù)處理之后得到該字符的規(guī)整坐標(biāo)序列;該步驟的處理過程與上述的步驟SOI和S02類似,首先用筆在觸摸屏上書寫,下筆時(shí)把筆尖的位置(x,y)坐標(biāo)序列記錄下來。一個(gè)輸入字符的完整書寫軌跡用一個(gè)(x,y)序列表示((xl,yl),(x2,y2),…,(xn,yn)}。然后利用一個(gè)平滑連續(xù)函數(shù),將采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫字符的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符的規(guī)整坐標(biāo)序列;字符軌跡的歸一化有兩個(gè)目的大小標(biāo)準(zhǔn)化和形狀才交正。如圖5a-5b所示,圖5a中的字符經(jīng)過歸一化后變成了圖5b中的形狀,不僅邊界變成了規(guī)定的大小(所有字符經(jīng)歸一化后邊界變成相同大小),而且形狀也發(fā)生了變化,變得更規(guī)范,從而更容易識(shí)別。歸一化是通過兩個(gè)座標(biāo)變換函凄丈=和/=/實(shí)現(xiàn),把字符軌跡中每一點(diǎn)的座標(biāo)(x,y)用(x,,y,)代替后,就得到歸一化的字符軌跡。參數(shù)a和b的估計(jì)方法和步驟S02中所述的方法相同。步驟S07,根據(jù)所述規(guī)整坐標(biāo)序列,進(jìn)行特征提取計(jì)算手寫輸入字符的多維特征矢量;具體的特征提取過程與步驟S03中所述的過程相同,如圖7所示,把筆劃線段(每相鄰兩點(diǎn)之間連成一條矢量線段)分解到Dl至D8的8個(gè)標(biāo)準(zhǔn)方向,記錄64x64網(wǎng)格中每個(gè)格子中各個(gè)方向的線段長(zhǎng)度值,然后計(jì)算兩個(gè)尺度的方向特征值。第一步,把筆劃線段分解到8個(gè)標(biāo)準(zhǔn)方向。坐標(biāo)點(diǎn)序列中每相鄰兩點(diǎn)之間連成一條線段,是一個(gè)有方向的矢量f;。該矢量f,的方向介于兩個(gè)標(biāo)準(zhǔn)方向D2與D3之間,把矢量fj分解成兩個(gè)標(biāo)準(zhǔn)方向D2與D3上的分量(如圖8所示),每個(gè)標(biāo)準(zhǔn)方向上的分量長(zhǎng)度計(jì)入所在格子中該方向的線段長(zhǎng)度值。這樣,在8個(gè)方向的每個(gè)方向上得到64x64個(gè)20線段長(zhǎng)度值。第二步,計(jì)算大尺度特征。把每個(gè)方向上的64x64網(wǎng)格均勻分成4x4個(gè)方格,計(jì)算每個(gè)方格中各個(gè)方向上線段長(zhǎng)度值的和,得到8x4x4=128個(gè)特征值。第三步,計(jì)算小尺度特征。把每個(gè)方向上的64x64網(wǎng)格均勻分成8x8個(gè)方格,計(jì)算每個(gè)方格中各個(gè)方向上線段長(zhǎng)度值的和,得到8x8x8=512個(gè)特征值。大尺度特征和小尺度特征的總個(gè)數(shù)為128+512=640。步驟S08,從所述手寫輸入字符的多維特征矢量中選取部分特征值,將所述手寫輸入字符分別與所述粗分類模版進(jìn)行匹配,從中選取相似度最大的若干個(gè)樣本中心,并將這若干個(gè)樣本中心對(duì)應(yīng)的字符類作為候選字符類;根據(jù)Fisher準(zhǔn)則,從手寫輸入字符的多維特征矢量中,選取使得Fisher比最大的若干個(gè)特征值,選取的特征值個(gè)數(shù)與步驟S04中選取的特征值個(gè)it相同。模版匹配的距離計(jì)算如下設(shè)手寫輸入字符的多維特征矢量表示為矢量*=""''^]7,粗分類模版中一個(gè)類別的樣本中心表示為特征矢量y=",…,凡]t,則通過如下公式計(jì)算匹配距離d(x,y)=2k-乂l,、'=i(9)步驟S09,利用步驟S05中根據(jù)Fisher準(zhǔn)則計(jì)算得到的特征變換矩陣,對(duì)所述手寫輸入字符的多維特征矢量進(jìn)行特征變換,從所述細(xì)分類模版中選取所述候選字符類的樣本中心,分別與特征變換后的手寫輸入字符進(jìn)行匹配,從所述候選字符類中確定最相似的字符類,以供用戶選擇。然后返回步驟S06,進(jìn)行下一個(gè)手寫字符的輸入識(shí)別。該步驟的目的是進(jìn)行細(xì)分類,對(duì)一個(gè)輸入字符,步驟S08粗分類找出M個(gè)候選類別后,細(xì)分類采用比粗分類更多的特征,利用公式(9)重新計(jì)算輸入字符到M個(gè)候選類別模版的距離,取距離最近的類別作為最終識(shí)別結(jié)果。細(xì)分類給出匹配距離最小的多個(gè)(一般為10個(gè))類別作為最終候選。這些候選類別可以直接顯示出來供用戶選擇,或利用語言規(guī)則根據(jù)上下文自動(dòng)選擇。步驟S08的粗分類是把輸入字符(待識(shí)別字符)的特征矢量與模版數(shù)據(jù)庫中存儲(chǔ)的各個(gè)字符類別的模版進(jìn)行比較(匹配),找出距離最小(也就是相似度最大)的M(比如M=100)個(gè)類別作為候選,在步驟S09的細(xì)分類中再找出距離最小的候選類別作為最終識(shí)別結(jié)果。粗分類和細(xì)分類所比較的模版不同(特征也不一樣)粗分類模版簡(jiǎn)單(特征少),計(jì)算速度快,細(xì)分類模版復(fù)雜(特征較多),計(jì)算速度較慢。粗分類的目的是快速找出M個(gè)候選類別后,細(xì)分類中不必計(jì)算所有類別的距離(只計(jì)算M個(gè)候選類別的距離),從而提高總體識(shí)別速度。綜上所述,圖2示出了本發(fā)明實(shí)施例一種手寫字符識(shí)別方法的詳細(xì)流程步驟S05具體包括以下步驟步驟S051,利用根據(jù)Fisher準(zhǔn)則得到的特征變換矩陣,將所有字符類的樣本進(jìn)行特征變換,降低其多維特征矢量的維數(shù);步驟S052,重新計(jì)算特征變換后的所有字符類的樣本中心;步驟S053,對(duì)所述特征變換矩陣及所有字符類的樣本中心進(jìn)行迭代調(diào)整,重新計(jì)算特征變換矩陣和所有字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的細(xì)分類模版。所述步驟S06具體包括以下步驟步驟S061,接收手寫字符輸入的信號(hào)并采集輸入字符軌跡點(diǎn)的離散坐標(biāo)序列;步驟S062,判斷一個(gè)字符輸入是否結(jié)束,當(dāng)未接收到手寫字符輸入信號(hào)的時(shí)間超過設(shè)定的閾值,則結(jié)束該字符離散坐標(biāo)序列的采集;當(dāng)提筆時(shí)間超過一個(gè)閾值(如0.5秒)時(shí),視為一個(gè)字書寫結(jié)束;一個(gè)輸入字符的完整書寫軌跡用一個(gè)(x,y)序列表示((xl,yl),(x2,y2),…,(xn,yn)},其中,提筆用一個(gè)特殊的座標(biāo)(-l,O)表示。步驟S063,檢查釆集到的手寫字符的軌跡點(diǎn)是否只有一個(gè),如果是則刪除該軌跡點(diǎn)重新采集;步驟S064,檢測(cè)采集到的手寫字符的軌跡點(diǎn)中相鄰點(diǎn)之間的坐標(biāo)距離,如果該距離小于設(shè)定的閾值,即如果兩個(gè)相鄰點(diǎn)位置重合或離得非常緊,則刪除其中的一點(diǎn),使得相鄰點(diǎn)之間保持一定距離;步驟S065,利用一個(gè)平滑連續(xù)函數(shù),將采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫輸入字符的大小和形狀以及重心的坐標(biāo)值,得到該字符的規(guī)整坐標(biāo)序列。所述步驟S07具體包括以下步驟步驟S071,根據(jù)手寫字符的規(guī)整坐標(biāo)序列,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到8個(gè)標(biāo)準(zhǔn)方向(如圖7和8所示),每個(gè)標(biāo)準(zhǔn)方向上得到矢量線段長(zhǎng)度值;步驟S072,對(duì)所述得到的矢量線段長(zhǎng)度值進(jìn)行處理,得到大尺度特征值和小尺度特征值構(gòu)成的多維特征矢量。所述步驟S08具體包括以下步驟步驟S081,根據(jù)Fisher準(zhǔn)則,從所述手寫輸入字符的多維特征矢量中選取部分特征值,所述手寫輸入字符具有與字符類的樣本相同維數(shù)的由選取特征值構(gòu)成的特征矢量;步驟S082,將所述手寫輸入字符分別與所述粗分類模版進(jìn)行匹配,從預(yù)存儲(chǔ)字符類中選取相似度最大的若干個(gè)候選字符類。所述步驟S09具體包括以下步驟23步驟S091,用迭代調(diào)整后的特征變換矩陣對(duì)手寫輸入字符進(jìn)行特征變換,得到其低維特征矢量;步驟S092,該手寫輸入字符的低維特征矢量分別與從所述細(xì)分類模版中選取的候選字符類的樣本中心進(jìn)行匹配,從候選字符類中確定相似度最大的字符類,以供用戶選擇。圖3示出了本發(fā)明實(shí)施例一種手寫字符識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。該系統(tǒng)包4舌第一信號(hào)采集模塊1,用于接收手寫字符輸入的信號(hào)并采集該手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;第一歸一化模塊2,用于利用一個(gè)平滑連續(xù)函數(shù),將采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫字符的大小和形狀以及重心的坐標(biāo)值,得到該手寫字符的規(guī)整坐標(biāo)序列;第一特征提取模塊3,用于根據(jù)手寫字符的規(guī)整坐標(biāo)序列,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,得到手寫字符的多維特征矢量;存儲(chǔ)模塊4,用于存儲(chǔ)各個(gè)字符類,以及所述各個(gè)字符類對(duì)應(yīng)的粗分類模版和細(xì)分類模版,還有根據(jù)Fisher準(zhǔn)則計(jì)算得到的特征變換矩陣;粗分類模塊5,用于從手寫輸入字符的多維特征矢量中選取部分特征值,將所述手寫輸入字符分別與所述存儲(chǔ)模塊4中的粗分類模版進(jìn)行匹配,從預(yù)存儲(chǔ)字符類中選取相似度最大的若干個(gè)候選字符類;細(xì)分類模塊6,用于對(duì)手寫輸入字符的多維特征矢量進(jìn)行特征變換,將特征變換后的手寫輸入字符與從所述存儲(chǔ)模塊4中的細(xì)分類模版中選取的候選字符類的樣本中心進(jìn)行匹配,從中確定最相似的字符類,以供用戶選擇。24圖4示出了本發(fā)明實(shí)施例一種手寫字符識(shí)別系統(tǒng)的詳細(xì)結(jié)構(gòu)示意圖;其中匹配模版獲得子系統(tǒng)X1包括第二信號(hào)采集模塊11,用于接收手寫字符樣本的信號(hào)并采集手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;第二歸一化模塊21,用于將所述第二信號(hào)采集模塊11采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫字符的大小和形狀以及重心的坐標(biāo)值,得到該字符的規(guī)整坐標(biāo)序列;第二特征提取模塊31,用于根據(jù)所述規(guī)整坐標(biāo)序列,將手寫字符的所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,計(jì)算手寫字符的多維特征矢量;粗分類模版計(jì)算模塊51,用于從所述特征提取模塊得出的全體字符類的樣本的多維特征矢量中,選取部分特征值,計(jì)算各個(gè)字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的粗分類模版,并將該粗分類模版存儲(chǔ)到所述存儲(chǔ)模塊4;細(xì)分類模版計(jì)算模塊61,用于根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對(duì)全體字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個(gè)字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的細(xì)分類模版,并將該細(xì)分類模版和所述特征變換矩陣存儲(chǔ)到所述存儲(chǔ)模塊4。其中第一和第二信號(hào)采集模塊i和ii具體包括采集單元101,用于采集手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;判斷單元102,用于判斷一個(gè)手寫字符輸入是否結(jié)束,當(dāng)未接收到手寫字符輸入信號(hào)的時(shí)間超過設(shè)定的閾值,則結(jié)束該手寫字符離散坐標(biāo)序列的采集;檢測(cè)單元103,用于檢查采集到的手寫字符的軌跡點(diǎn)是否只有一25個(gè),如果是則刪除該軌跡點(diǎn)重新采集;以及檢測(cè)采集到的手寫字符的軌跡點(diǎn)中相鄰點(diǎn)之間的坐標(biāo)距離,如果該距離小于設(shè)定的閾值,則刪除其中的一點(diǎn),使得相鄰點(diǎn)之間保持一定距離。系統(tǒng)還包括一個(gè)顯示模塊7,用于顯示所述細(xì)分類模塊6輸出的最相似的字符類,以供用戶選擇。與現(xiàn)有方法相比,在歸一化、特征提取、粗分類、細(xì)分類中的技術(shù)有一些不同歸一化坐標(biāo)變換函數(shù)1'=^和少'=,是新提出的,這樣做的好處是坐標(biāo)變換的函數(shù)為平滑連續(xù)函數(shù),從而使變換后的字符形狀更為自然,同時(shí)保證字符軌跡的重心變換到外框的中心(0.5)。以前也有把字符重心映射到外框中心的做法,但是用的是分段線性函數(shù),變換后的字符形狀不自然,也影響后面的識(shí)別。特征提取將筆劃軌跡線段直接分解到8個(gè)方向?,F(xiàn)有的方法是先把軌跡變?yōu)橐环鶊D像,對(duì)圖像中的像素進(jìn)行方向分解,這樣做的計(jì)算量更大,而且生成的圖像會(huì)有失真。我們的方法避免了生成圖像所增加的計(jì)算量,而且得到的方向特征更準(zhǔn)確。粗分類現(xiàn)有方法一般是人工選取一部分特征(如直接使用大尺度特征)或者采用特征變換。而我們用Fisher準(zhǔn)則選才奪的特征比人工選擇特征有更好的識(shí)別精度,與特征變換相比減少了計(jì)算量(因?yàn)闆]有線性變換)。細(xì)分類特征變換矩陣和類別中心模版的迭代調(diào)整能明顯提高識(shí)別精度?,F(xiàn)有的方法是直接采用Fisher準(zhǔn)則得到的變換矩陣,然后在變換特征上采用學(xué)習(xí)矢量量化(LearningVectorQuantization,LVQ)算法調(diào)整類別中心模版。我們的方法通過同時(shí)調(diào)整變換矩陣與類別中心模版,能得到更高的識(shí)別精度。本方法可適用于中文、英文、數(shù)字、符號(hào)的識(shí)別。26一、輸入字符軌跡咬二、歸一4匕后的4九跡:啖三、粗分類選出的10個(gè)候選類別及其匹配距離(在60個(gè)選擇特征上計(jì)算距離)<table>tableseeoriginaldocumentpage27</column></row><table>四、細(xì)分類對(duì)10個(gè)候選類別的重新排序及其距離(在120個(gè)變換特征上計(jì)算距離)<table>tableseeoriginaldocumentpage27</column></row><table>五、最后的識(shí)別結(jié)果為"唉"。以上所述是本發(fā)明的優(yōu)選實(shí)施方式而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,應(yīng)當(dāng)指出,對(duì)于本
技術(shù)領(lǐng)域
的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和變動(dòng),這些改進(jìn)和變動(dòng)也視為本發(fā)明的保護(hù)范圍。權(quán)利要求1、一種手寫字符識(shí)別方法,其特征在于,包括以下步驟A、建立由各個(gè)字符類的第一樣本中心構(gòu)成的粗分類模版,以及由各個(gè)字符類的第二樣本中心構(gòu)成的細(xì)分類模版,該細(xì)分類模版是利用特征變換矩陣對(duì)各個(gè)字符類的樣本進(jìn)行特征變換得來的;B、接收用戶手寫字符輸入的信號(hào)并采集輸入字符軌跡點(diǎn)的離散坐標(biāo)序列,進(jìn)行預(yù)處理之后得到該字符的規(guī)整坐標(biāo)序列;C、根據(jù)所述規(guī)整坐標(biāo)序列,進(jìn)行特征提取,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,計(jì)算手寫輸入字符的多維特征矢量;D、從所述手寫輸入字符的多維特征矢量中選取部分特征值,將所述手寫輸入字符分別與所述粗分類模版進(jìn)行匹配,從所述粗分類模版中選取相似度最大的若干個(gè)樣本中心,并將這若干個(gè)樣本中心對(duì)應(yīng)的字符類作為候選字符類;E、利用步驟A中所述的特征變換矩陣,對(duì)所述手寫輸入字符的多維特征矢量進(jìn)行特征變換,從所述細(xì)分類模版中選取步驟D中得到的所述候選字符類的樣本中心,分別與特征變換后的手寫輸入字符進(jìn)行匹配,從所述候選字符類中確定最相似的字符類,以供用戶選擇。2、根據(jù)權(quán)利要求1所述的一種手寫字符識(shí)別方法,其特征在于,所述步驟A具體包括以下步驟Al、采集各個(gè)字符類的手寫字符樣本,并計(jì)算所述手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列;A2、將手寫字符樣本的軌跡點(diǎn)的離散坐標(biāo)序列進(jìn)行預(yù)處理,得到該手寫字符樣本的規(guī)整坐標(biāo)序列;A3、根據(jù)所述的規(guī)整坐標(biāo)序列,進(jìn)行特征提取,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,得到該手寫字符樣本的多維特征矢量;A4、從全體字符類的樣本的多維特征矢量中選取部分特征值,計(jì)算各個(gè)字符類的第一樣本中心,得到由各個(gè)字符類的第一樣本中心構(gòu)成的粗分類模版;A5、根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對(duì)全體字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個(gè)字符類的第二樣本中心,得到由各個(gè)字符類的第二樣本中心構(gòu)成的細(xì)分類模版。3、根據(jù)權(quán)利要求2所述的一種手寫字符識(shí)別方法,其特征在于,所述步驟A3和C具體包括以下步驟根據(jù)所述規(guī)整坐標(biāo)序列,將所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,每個(gè)標(biāo)準(zhǔn)方向上得到各個(gè)矢量線段的長(zhǎng)度值;對(duì)所述得到的各個(gè)矢量線段的長(zhǎng)度值進(jìn)行處理,計(jì)算大尺度特征值和小尺度特征值,得到由大尺度特征值和小尺度特征值構(gòu)成的多維特征矢量。4、根據(jù)權(quán)利要求2所述的一種手寫字符識(shí)別方法,其特征在于,所述步驟A4具體包括以下步驟根據(jù)Fisher準(zhǔn)則,從預(yù)存的每一個(gè)字符類的樣本中,選取使得Fisher比最大的若干個(gè)特征值;根據(jù)由選取特征值構(gòu)成的樣本的特征矢量,計(jì)算該字符類的樣本中心的特征矢量,得到由全體字符類的樣本中心構(gòu)成的粗分類模版。5、根據(jù)權(quán)利要求2所述的一種手寫字符識(shí)別方法,其特征在于,所述步驟A5具體包括以下步驟利用根據(jù)Fisher準(zhǔn)則得到的特征變換矩陣,將所有字符類的樣本進(jìn)行特征變換,降低其多維特征矢量的維數(shù);重新計(jì)算特征變換后的所有字符類的樣本中心;對(duì)所述特征變換矩陣及所有字符類的樣本中心進(jìn)行迭代調(diào)整,重新計(jì)算特征變換矩陣和所有字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的細(xì)分類模版。6、根據(jù)權(quán)利要求1所述的一種手寫字符識(shí)別方法,其特征在于,所述步驟D具體包括以下步驟根據(jù)Fisher準(zhǔn)則,從所述手寫輸入字符的多維特征矢量中選取部分特征值,所述手寫輸入字符具有與字符類的樣本相同維數(shù)的由選取特征值構(gòu)成的特征矢量;將所述手寫輸入字符分別與所述粗分類模版進(jìn)行匹配,從預(yù)存儲(chǔ)字符類中選取相似度最大的若干個(gè)候選字符類。7、根據(jù)權(quán)利要求6所述的一種手寫字符識(shí)別方法,其特征在于,所述步驟E具體包括以下步驟用迭代調(diào)整后的特征變換矩陣對(duì)手寫輸入字符進(jìn)行特征變換,得到其低維特征矢量;該手寫輸入字符的低維特征矢量分別與從所述細(xì)分類模版中選取的候選字符類的樣本中心進(jìn)行匹配,從候選字符類中確定相似度最大的字符類,以供用戶選擇。8、根據(jù)權(quán)利要求2所述的一種手寫字符識(shí)別方法,其特征在于,所述步驟Al和B具體還包括以下步驟判斷一個(gè)手寫字符輸入是否結(jié)束,當(dāng)未接收到手寫字符輸入信號(hào)的時(shí)間超過設(shè)定的閾值,則結(jié)束該字符離散坐標(biāo)序列的采集;檢查采集到的手寫字符的軌跡點(diǎn)是否只有一個(gè),如果是則刪除該軌跡點(diǎn)重新采集;檢測(cè)采集到的手寫字符的軌跡點(diǎn)中相鄰點(diǎn)之間的坐標(biāo)距離,如果該距離小于設(shè)定的閾值,則刪除其中的一點(diǎn),使得相鄰點(diǎn)之間保持一定距離。9、根據(jù)權(quán)利要求2所述的一種手寫字符識(shí)別方法,其特征在于,所述步驟A2、B中的預(yù)處理是將采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫輸入字符的大小和形狀以及重心的坐標(biāo)值,具體包括以下步驟將所有軌跡點(diǎn)的橫坐標(biāo)值和縱坐標(biāo)值變換到介于0到100之間;分別計(jì)算所有軌跡點(diǎn)橫坐標(biāo)和縱坐標(biāo)的重心坐標(biāo)值;將所有軌跡點(diǎn)坐標(biāo)值和重心坐標(biāo)值除以100,4吏所有軌跡點(diǎn)坐標(biāo)值和重心坐標(biāo)值變?yōu)?到l之間,利用^f吏重心坐標(biāo)值的才黃坐標(biāo)和縱坐標(biāo)變?yōu)?.5的一個(gè)平滑連續(xù)函數(shù),將采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列;再將所有軌跡點(diǎn)坐標(biāo)值乘以64,得到輸入字符的規(guī)整坐標(biāo)序列。10、一種手寫字符識(shí)別系統(tǒng),其特征在于,其包括存儲(chǔ)模塊,用于存儲(chǔ)各個(gè)字符類,以及所述各個(gè)字符類對(duì)應(yīng)的粗分類模版和細(xì)分類模版,還有根據(jù)Fisher準(zhǔn)則計(jì)算得到的特征變換矩陣;第一信號(hào)采集模塊,用于接收用戶手寫字符輸入的信號(hào)并采集手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;第一歸一化模塊,用于將所述第一信號(hào)采集模塊采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫字符的大小和形狀以及重心的坐標(biāo)值,得到該字符的規(guī)整坐標(biāo)序列;第一特征提取模塊,用于根據(jù)所述規(guī)整坐標(biāo)序列,將手寫字符的所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,計(jì)算手寫字符的多維特征矢量;粗分類模塊,用于從用戶手寫輸入字符的多維特征矢量中選取部分特征值,將所述手寫輸入字符分別與所述存儲(chǔ)模塊中的粗分類模版進(jìn)行匹配,從中選取相似度最大的若干個(gè)樣本中心,并將這若干個(gè)樣本中心對(duì)應(yīng)的字符類作為候選字符類;細(xì)分類模塊,用于對(duì)所述手寫輸入字符的多維特征矢量進(jìn)行特征變換,從所述細(xì)分類模版中選取所述候選字符類的樣本中心,分別與特征變換后的手寫輸入字符進(jìn)行匹配,從所述候選字符類中確定最相似的字符類,以供用戶選擇。顯示模塊,用于顯示所述細(xì)分類模塊輸出的最相似的字符類,以供用戶選擇。11、根據(jù)權(quán)利要求10所述的一種手寫字符識(shí)別系統(tǒng),該系統(tǒng)還包括一個(gè)匹配模版獲得子系統(tǒng),該子系統(tǒng)包括第二信號(hào)采集模塊,用于接收手寫字符樣本的信號(hào)并采集手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;第二歸一化模塊,用于將所述第二信號(hào)采集模塊采集到的手寫字符軌跡點(diǎn)的離散坐標(biāo)序列變換成為另一個(gè)離散坐標(biāo)序列,以調(diào)整手寫字符的大小和形狀以及重心的坐標(biāo)值,得到該字符的規(guī)整坐標(biāo)序列;第二特征提取模塊,用于根據(jù)所述規(guī)整坐標(biāo)序列,將手寫字符的所有相鄰軌跡點(diǎn)形成的矢量線段分解到八個(gè)標(biāo)準(zhǔn)方向,計(jì)算手寫字符的多維特征矢量;粗分類模版計(jì)算模塊,用于從所述特征提取模塊得出的全體字符類的樣本的多維特征矢量中,選取部分特征值,計(jì)算各個(gè)字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的粗分類模版,并將該粗分類模版存儲(chǔ)到所述存儲(chǔ)模塊;細(xì)分類模版計(jì)算模塊,用于根據(jù)Fisher準(zhǔn)則計(jì)算特征變換矩陣,利用該變換矩陣對(duì)全體字符類的樣本的多維特征矢量進(jìn)行特征變換,重新計(jì)算各個(gè)字符類的樣本中心,得到由全體字符類的樣本中心構(gòu)成的細(xì)分類模版,并將該細(xì)分類模版和所述特征變換矩陣存儲(chǔ)到所述存儲(chǔ)模塊。12、根據(jù)權(quán)利要求11所述的一種手寫字符識(shí)別系統(tǒng),所述第一信號(hào)采集模塊和第二信號(hào)采集模塊還包括采集單元,用于接收手寫字符的信號(hào)并采集手寫字符軌跡點(diǎn)的離散坐標(biāo)序列;判斷單元,用于判斷一個(gè)手寫字符輸入是否結(jié)束,當(dāng)未接收到手寫字符輸入信號(hào)的時(shí)間超過設(shè)定的閾值,則結(jié)束該字符離散坐標(biāo)序列的采集;檢測(cè)單元,用于檢查采集到的手寫字符的軌跡點(diǎn)是否只有一個(gè),如果是則刪除該軌跡點(diǎn)重新采集;以及檢測(cè)采集到的手寫字符的軌跡點(diǎn)中相鄰點(diǎn)之間的坐標(biāo)距離,如果該距離小于設(shè)定的閾值,則刪除其中的一點(diǎn),使得相鄰點(diǎn)之間保持一定距離。全文摘要本發(fā)明公開了一種手寫字符識(shí)別方法,其包括獲得粗分類模版和細(xì)分類模版;接收用戶手寫字符輸入的信號(hào)并采集其離散坐標(biāo)序列,進(jìn)行預(yù)處理;進(jìn)行特征提取計(jì)算手寫輸入字符的多維特征矢量;將所述手寫輸入字符分別與粗分類模版進(jìn)行匹配,選取相似度最大的若干個(gè)候選字符類;將特征變換后的手寫輸入字符與從細(xì)分類模版中選取的候選字符類的樣本中心進(jìn)行匹配,從中確定最相似的字符類。本發(fā)明還公開了一種手寫字符識(shí)別系統(tǒng)。本發(fā)明手寫字符輸入識(shí)別的速度更快,且識(shí)別精度更高。文檔編號(hào)G06K9/00GK101482920SQ20081022060公開日2009年7月15日申請(qǐng)日期2008年12月30日優(yōu)先權(quán)日2008年12月30日發(fā)明者劉志玭,吳政維,李景平,王志愛,王紅輝,胡安進(jìn),蔡沐宇,譚春桃,方郭,陸華興,陳炳輝,高精鍊,黃新春申請(qǐng)人:廣東國(guó)筆科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1