專利名稱:基于局部特征分析的計算機筆跡鑒別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機自動生物鑒別技術(shù)領(lǐng)域,特別是一種與書寫內(nèi)容相關(guān)的基于局部特征分析的計算機筆跡鑒別方法,目的是為了實現(xiàn)計算機自動筆跡鑒別,在筆跡圖像的歸一化方面、筆跡特征提取和描述方面做了有意義的探索,以推動筆跡鑒別技術(shù)的發(fā)展。筆跡鑒別通過書寫風(fēng)格進行身份鑒別,有廣泛的應(yīng)用前景,例如在法庭上根據(jù)遺囑鑒別撰寫人、在金融領(lǐng)域一些重要單據(jù)的簽名驗證、計算機終端登陸人的認(rèn)定、或者鑒別一份手稿誰進行了修改等。
背景技術(shù):
盡管人工筆跡鑒別達到了比較準(zhǔn)確的地步,但計算機自動筆跡鑒別卻是個難題。筆跡鑒別利用筆跡的不同書寫風(fēng)格進行身份鑒別,其關(guān)鍵在于筆跡特征的提取和比較。然而書寫風(fēng)格很難從少量的字符歸納,所以要么采用文本獨立方法,與書寫內(nèi)容無關(guān),從大量字符中提取反映書寫風(fēng)格的整體特征,要么采用文本依存方法,與書寫內(nèi)容相關(guān),從檢驗筆跡和參考筆跡中選擇相同或部分相同的字符即特征字進行比較。文本獨立方法人工干預(yù)少,但需要大量的字符,可靠性受到限制。而漢字的特點是結(jié)構(gòu)復(fù)雜,筆跡特征對字符類別敏感,文本依存方法可以提取更多的特征,只用少數(shù)字符即可實現(xiàn)可靠的鑒別。本發(fā)明就涉及一種與書寫內(nèi)容相關(guān)的即文本依存的筆跡鑒別方法。
從19世紀(jì)60年代開始,很多學(xué)者投入到這一研究領(lǐng)域,提出了一些方法??偟膩碚f,筆跡鑒別提取的特征主要有兩類,一是結(jié)構(gòu)特征,例如字的平均字高、字寬、傾斜度以及字符的可懂度等。這種方法得到特征字的外形特征,如果書寫方式變化較大,則特征提取不準(zhǔn)確;二是紋理特征;另外,還有將整篇、段、字符相結(jié)合的多級特征提取方法。但總體而言,以上方法大多提取文本塊或特征字的全局特征,計算復(fù)雜度高,一些方法不適于漢字,筆跡鑒別的總體水平還不高。目前筆跡鑒別存在的主要問題是筆跡特征分析和比較技術(shù)沒有有效的解決。本發(fā)明主要提出了一種新的有效的與書寫內(nèi)容相關(guān)的基于局部特征分析的筆跡特征提取方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種與書寫內(nèi)容相關(guān)的基于局部特征分析的計算機筆跡鑒別方法,主要解決了特征字的局部書寫特征的提取和描述問題。
針對文本依存的筆跡鑒別,本發(fā)明采用優(yōu)化的Gabor多通道濾波器和有效的特征字空間采樣間隔提取特征字的局部紋理特征,并利用基于以均值作為類代表點的最近鄰分類器進行比較和判別方法。
為實現(xiàn)上述目的,本發(fā)明主要有以下步驟特征字的獲取采用人機交互方式;特征字圖像的歸一化采用字符的線性歸一化方法—點陣撐滿法,將特征字圖像歸一化到64×64大小;然后根據(jù)筆劃方向、位置和粗細等特性,設(shè)計了一組優(yōu)化的2維Gabor濾波器,該濾波器含有8個Gabor小波,分別采用8個方向和一個頻率。接著,用優(yōu)化的Gabor濾波器提取特征字的局部紋理特征。具體方法是對歸一化后的64×64大小的樣本圖像進行空間采樣,采用8個像素的采樣間隔,這樣每個特征字有64個采樣點,以每個采樣點為中心,分別和8個Gabor小波進行卷積,得到采樣點周圍的筆劃方向和筆劃粗細信息作為特征字的局部特征,并取Gabor響應(yīng)的振幅做為筆跡特征,這樣得到512維特征向量。最后利用基于以均值作為類的代表點的最近鄰分類器進行筆跡特征的比較和識別。
2維Gabor濾波能表示圖像的局部頻譜信息,具有方向選擇性。本發(fā)明具有識別率高、計算復(fù)雜度低、物理意義明確等特點,對于減輕文檢人員的壓力,進行計算機筆跡鑒別有較高的實用價值。
發(fā)明的技術(shù)方案一種與書寫內(nèi)容相關(guān)的基于局部特征分析的計算機筆跡鑒別方法,其特征在于
特征字的獲取采用人機交互方式;特征字圖像的歸一化采用字符的線性歸一化方法;利用優(yōu)化的Gabor濾波和有效的空間采樣間隔,提取特征字的局部紋理特征;利用基于以均值作為類代表點的最近鄰分類器進行筆跡特征的比較和識別;
以下結(jié)合附圖及實施方式對本發(fā)明作進一步的詳細說明
圖1為本發(fā)明的三個不同書寫人的歸一化筆跡圖像示意圖,為進行特征字歸一化前后的圖像對比。
圖2為本發(fā)明的采樣點的選取和特征提取過程示意圖,包括8個Gabor濾波器實部在空域中的圖像表示、特征字空間采樣間隔的選取以及特征提取過程。
發(fā)明的
具體實施例方式1.特征字預(yù)處理在文本依存的筆跡鑒別中,計算機自動選字是個難題。以前主要采用專家參與挑選,手工分割特征字的方法。本發(fā)明對此進行了改進,采用人機交互方法。首先將書寫筆跡文件按300DPI掃描成數(shù)字圖像,進行二值化和行字分割,并去掉字符四周的空白,然后由人工挑選特征字,最后以單個特征字的形式存儲。
手寫漢字即使出自同一個書寫人,由于環(huán)境、心情、用筆和用紙的影響,其尺寸差別也較大,所以在特征提取之前需要對特征字進行歸一化處理,這是實現(xiàn)兩個字符最佳匹配的關(guān)鍵。在字符識別應(yīng)用中,歸一化主要包含尺度歸一化、傾斜校正以及筆劃厚度的歸一化。但在筆跡鑒別中,字符的傾斜和筆劃厚度體現(xiàn)了書寫特征,需要保留,所以我們僅對尺寸進行歸一化。
目前有許多字符歸一化方法,可分為線性歸一化和非線性歸一化。對于筆跡鑒別應(yīng)用,字符的方位、筆劃的位置和方向都是有用的特征,必須在歸一化過程中予以保留。綜合考慮后,我們采用線性歸一化——點陣撐滿方法,將原圖像中的像素點線性映射到歸一化圖像中,變換后的圖像中大部分像素點上的像素值采用線性映射方法得到,其余像素點上的像素值采用最近鄰插值方法得到。該算法實現(xiàn)簡單,而且保留了字符的書寫特征。假設(shè)原始樣本為W×H大小的圖像,(x,y)表示原始圖像上的像素點位置。歸一化圖像為N×N,映射公式如下 其中尺度因子 變換后的圖像中大部分像素點上的像素值采用以上映射方法得到,其余像素點上的像素值采用最近鄰插值方法得到。如圖1是三個不同書寫人寫的“數(shù)”字。圖1(a)是書寫人1寫的,左邊是按300DPI掃描的原始特征字圖像,右邊是歸一化后的64×64大小的圖像,可見筆劃的方向和分布在歸一化后有了較好的保留。圖1(b)和圖1(c)是另外兩個人書寫的歸一化后的“數(shù)”字,從圖像紋理來看,不同書寫人的特征字之間的類間差別大于同一書寫人的特征字之間的類內(nèi)差別,這正體現(xiàn)了筆跡鑒別的基礎(chǔ)和依據(jù)。
2.筆跡特征提取筆跡的特征主要由筆劃的位置、方向、粗細、分布的密度等因素決定。
其中所述的筆跡特征提取方法的新穎性在于,據(jù)歸一化后的特征字,統(tǒng)計出筆劃方向、位置和粗細等特性,由此設(shè)計了一組優(yōu)化的2維Gabor濾波器,該濾波器含有8個Gabor小波,分別采用8個方向和一個頻率信息,接著,用優(yōu)化的Gabor濾波器提取特征字的局部紋理特征,具體方法是對歸一化后的64×64大小的樣本圖像進行空間采樣,采用8個像素的采樣間隔,本發(fā)明還結(jié)合有效的特征字空間采樣間隔,采用8個像素的間隔,這樣每個特征字有64個采樣點,以每個采樣點為中心,分別和8個Gabor小波函數(shù)進行卷積,得到采樣點周圍的筆劃方向和筆劃粗細信息作為特征字的局部特征,并取Gabor響應(yīng)的振幅做為筆跡特征,這樣得到512維特征向量。該特征向量反映了特征字64個采樣點周圍的筆劃方向和筆劃粗細等局部紋理信息。
2.1 GaborGabor函數(shù)早在1946年由D.Gabor提出,是小波基中的一種,屬于一種窗口Fourier變換,其窗口是Gauss函數(shù)。Gabor函數(shù)克服了傅立葉變換只能反映信號整體特征的缺陷,能同時在時域和頻域中較好地兼顧對信號分析的分辨率要求。2維Gabor小波能表示簡單視覺細胞的感受野信息,80年代,J.G.Daugman將將2維Gabor小波表示用于計算機視覺領(lǐng)域,取得了較好的結(jié)果。到90年代中期,一些研究者將Gabor濾波用于字符識別的特征提取。但目前為止還沒有人將其用于文本依存的筆跡鑒別中,本發(fā)明在這方面做了突破。
2維Gabor函數(shù)(如公式1)是加窗的Fourier變換,其窗口是Guass函數(shù),能得到圖像的局部頻域特性。Gabor函數(shù)是時間定位和頻率調(diào)制得帶通濾波器,通過調(diào)節(jié)合適的參數(shù),可以構(gòu)造具有不同形狀、帶寬、中心頻率、方向的屬性的Gabor濾波器組,變換的結(jié)果是對信號進行多通道分解。
h(x,y)=k2σ2exp(-k2(x2+y2)2σ2)[exp(ik1x+ik2y)-exp(-σ22)]---(1)]]>其中 kv=2-v+22π,]]> 上式可以看作由兩部分組成第一部分為以原點為中心,標(biāo)準(zhǔn)差為σg=σ/kv的圓對稱的2維Gauss函數(shù),σg的值決定了窗口函數(shù)的寬度,對應(yīng)時域的信號分析尺度,尺度越大,分辨率越低(本發(fā)明取σ=2π]]>)。第二部分如果僅考慮exp(ik1x+ik2y)=cos(k1x+k2y)+isin(k1x+k2y),可以理解成2維的余弦、正弦波。其中,參數(shù)m為方向的個數(shù),如當(dāng)m=4時,4個方向角分別是0,45,90,135。參數(shù)V,u決定了波長和旋轉(zhuǎn)方向。例如虛部sin(k1x+k2y)是頻率為kv,相位為0的2維正弦波,其周期為2π/kv。選取不同參數(shù)m,v,u的值,可以得到一組Gabor濾波器,在空間域體現(xiàn)為具有一定方向、頻率和帶寬的一組光柵,可以從一個足夠小的區(qū)域得到類似邊緣的特征。而方向和邊緣特征在筆跡鑒別中非常重要。
如果不考慮最后一項exp(-σ2/2),Gabor函數(shù)在頻率中的表示如下H(λ1,λ2)=k22πσ2exp[-σ22k2((λ1-k1)+(λ2-k2))]---(2)]]>
函數(shù)H(λ1,λ2)為在頻率域中,為以點(k1,k2)為中心,標(biāo)準(zhǔn)差為kv/σ=1/σg的2維Gauss函數(shù),對應(yīng)頻域中的分辨率。可見Gabor函數(shù)在時域和頻率的分辨率成反比,兩者的聯(lián)合分辨率有限,這就是視覺中得不確定性。
2.2優(yōu)化的Gabor濾波設(shè)計根據(jù)圖2所示,2維Gabor函數(shù)在時間域中體現(xiàn)為不同大小、不同方向、不同寬度的光柵圖像。可以根據(jù)歸一化后特征字的筆劃寬度、筆劃方向等確定Gabor參數(shù)以及采樣點的選擇。根據(jù)我們采集到的筆跡樣本,歸一化后的64×64大小的圖像中,筆劃的方向大多分布在水平、垂直和帶方向的線上。為了提取到更多的筆跡特征,本發(fā)明取Gabor核函數(shù)為8個方向,m為8,即v=0,...,7。另外,筆劃的寬度大多在3到5個像素,對應(yīng)Gabor光柵的寬度。反映在Gabor函數(shù)上,就是正弦波波長的一半。由上一部分的分析得知,半個波長為π/kv=2v+22,]]>當(dāng)v=2時,半個波長為4個像素,符合歸一化為64×64大小后筆劃的平均寬度。這樣本發(fā)明采用8個Gabor濾波器,即具有8個方向,單個頻率(v=2)的一組優(yōu)化的Gabor濾波器組。這組濾波通道,使得圖像中的信息得以有效的保存。
為了減少計算量,同時為了提取特征字相應(yīng)空間位置上的Gabor特征,需要對歸一化圖像進行采樣,選取一些采樣點。為避免信息丟失,需要考慮有效的采樣間隔。當(dāng)v=2時,Gabor函數(shù)中2維高斯函數(shù)的標(biāo)準(zhǔn)差為σg=σ/kv=2v+32=8,]]>理論上Gauss核中心點周圍的能量保留的最多,其能量主要集中在帶寬為σg的部分,越往外能量越弱。所以本發(fā)明采用空間間隔為8個像素,間隔再大點,可能會有信息丟失。再小一點會增加特征向量的維數(shù)和計算復(fù)雜度。
根據(jù)以上討論,我們將64×64大小的特征字分成8×8個網(wǎng)格,取每個網(wǎng)格的中心點作為采樣點,如圖2得到64個采樣點。采樣間隔inter=8。在離散的空間卷積中,實部和虛部是分開計算的。
以采樣點(X,Y)為中心的Gabor特征如下g(X,Y)=|Σx=-X64-X-1Σy=-Y64-Y-1I(X+x,Y+y)h(x,y)|]]>I(x,y)表示64×64的二值圖像,h(x,y)表示Gabor濾波器,|a|表示a的模。Gabor特征可以看作在給定采樣點處,Gabor濾波的響應(yīng)。如圖3所示,對于每個采樣點,用8個Gabor濾波器進行卷積,得到8個Gabor特征。為了消除相位漂移,采樣點上的特征值由振幅表示。所以,每幅圖像可以得到512(64×8)個Gabor特征作為特征向量。
其中利用基于以均值作為類代表點的最近鄰分類器進行特征的比較和識別,將每類樣本特征向量的均值做為該類的代表點,待判別的樣本的特征向量和筆跡庫里所有的類求歐氏距離,并將距離按從大到小的順序排列,取排在前幾位的筆跡對應(yīng)的書寫者作為候選人。
最后,本發(fā)明采用歐氏距離函數(shù)D(f,g)=1nΣi=1n(fi-gi)2,]]>采用最近鄰分類器,對距離函數(shù)L(f)=argmink{Dk(f,g)},]]>進行排序,取排在前幾位對應(yīng)書寫者作為識別的候選者。
3.實驗結(jié)果為了驗證本發(fā)明提出的方法,我們設(shè)計了含有26個字的一句話,請17個人書寫,每人重復(fù)書寫15到20遍。然后采用300DPI的分辨率掃描到計算機中,進行行字分割,并從中選取分割的比較好的5個字“數(shù)、據(jù)、科、學(xué)、院”做為實驗樣本用。筆跡庫中有17個書寫人,每人有5個特征字。每個特征字有多幅歸一化后的樣本,其中5幅樣本用于訓(xùn)練,將訓(xùn)練樣本特征向量的均值作為該類的代表存入模式庫;將另外的每人3到8幅樣本用于識別。我們分別對5個單特征字進行了測試,取平均識別率作為單個特征字的識別率。為了提高識別的準(zhǔn)確率,還對多特征字融合的方法進行了實驗。筆跡鑒別中有許多紋理提取方法,為了和本發(fā)明提出的方法進行比較。我們根據(jù)自動化所劉成林的博士論文實現(xiàn)了簡化的Wigner方法。表1和表2分別給出了優(yōu)化的Gabor濾波器和Wigner方法在用1到5個特征字進行筆跡識別的識別結(jié)果。針對每種特征字組合,給出排在前5位的候選者。其中,在單個特征字時,Gabor方法比Wigner方法排在第一位的識別率高出近16個百分點。而且,優(yōu)化的Gabor方法僅用3個特征字,排在第二位的識別率就能達到100%,而Wigner方法需要4個特征字,排在第4位的識別率才能達到100%。當(dāng)然這和建立的筆跡庫有關(guān),但實驗結(jié)果說明本發(fā)明提出的算法比Wigner更有效。為了減少計算時間,本發(fā)明先將Gabor核函數(shù)計算出來,并存在內(nèi)存中,以后只要讀取相應(yīng)數(shù)據(jù),與特征字進行采樣點上的卷積操作即可,可大大的節(jié)省時間,提高效率。在PC機主頻P4 1.7GHZ,256兆內(nèi)存,40G硬盤條件下,用Gabor方法特征提取時間為每個特征字平均用16毫秒,而Wigner是48毫秒。表1.優(yōu)化的Gabor濾波方法的正確識別率(%) 表2.Wigner方法的正確識別率(%)Gabor方法,512維m=8,v=2,inter=8Wigner方法,256維
權(quán)利要求
1.一種基于局部特征分析的計算機筆跡鑒別方法,其特征在于特征字的獲取采用人機交互方式;特征字圖像的歸一化采用字符的線性歸一化方法;利用優(yōu)化的Gabor濾波和有效的空間采樣間隔,提取特征字的局部紋理特征;利用基于以均值作為類代表點的最近鄰分類器進行筆跡特征的比較和識別;
2.根據(jù)權(quán)利要求1的方法,其特征在于,其中特征字的獲取采用人機交互模式,首先將書寫筆跡文件按300DPI掃描成數(shù)字圖像,進行二值化和行字分割,并去掉字符四周的空白,然后由人工挑選特征字,最后以單個特征字的形式存儲。
3.根據(jù)權(quán)利要求1的方法,其特征在于,其中所述特征字圖像的歸一化方法為線性歸一化方法——點陣撐滿法,將原圖像中的像素點線性映射到歸一化圖像中,變換后的圖像中大部分像素點上的像素值采用線性映射方法得到,其余像素點上的像素值采用最近鄰插值方法得到。
4.根據(jù)權(quán)利要求1的方法,其特征在于,其中所述的筆跡特征提取方法在于,據(jù)歸一化后的特征字,統(tǒng)計出筆劃方向、位置和粗細特性,由此設(shè)計一組優(yōu)化的2維Gabor濾波器,該濾波器含有8個Gabor小波,分別采用8個方向和一個頻率信息,接著,用優(yōu)化的Gabor濾波器提取特征字的局部紋理特征,具體方法是對歸一化后的64×64大小的樣本圖像進行空間采樣,采用8個像素的采樣間隔,這樣每個特征字有64個采樣點,以每個采樣點為中心,分別和8個Gabor小波進行卷積,得到采樣點周圍的筆劃方向和筆劃粗細信息作為特征字的局部特征,并取Gabor響應(yīng)的振幅做為筆跡特征,這樣得到512維特征向量。
5.根據(jù)權(quán)利要求4的方法,其特征在于,其中利用基于以均值作為類代表點的最近鄰分類器進行特征的比較和識別,將每類樣本特征向量的均值做為該類的代表點,待判別的樣本的特征向量和筆跡庫里所有的類求歐氏距離,并將距離按從大到小的順序排列,取排在前幾位的筆跡對應(yīng)的書寫者作為候選人。
全文摘要
一種基于局部特征分析的計算機筆跡鑒別方法,主要解決了特征字的局部書寫特征的提取和描述問題。首先用線性歸一化方法將特征字圖像歸一化到64×64大??;然后根據(jù)筆劃方向、位置和粗細等特性,設(shè)計了一組優(yōu)化的2維Gabor濾波器,采用8個方向和一個頻率,共8個Gabor小波;接著,為了得到特征字的局部書寫特征,對特征字進行8像素間隔的空間采樣,并提取64個采樣點上的Gabor小波系數(shù),這樣得到512維特征向量;最后利用基于以均值作為類代表點的最近鄰分類器進行比較和判別。該發(fā)明具有識別率高、計算復(fù)雜度低、物理意義明確等特點。
文檔編號G06K9/00GK1540571SQ20031010446
公開日2004年10月27日 申請日期2003年10月29日 優(yōu)先權(quán)日2003年10月29日
發(fā)明者劉宏, 李錦濤, 崔國勤, 劉 宏 申請人:中國科學(xué)院計算技術(shù)研究所