1.一種漢字字形切割結(jié)果正確性的判別方法,依次包括基于字形重建的判別過(guò)程、基于部件分類的判別過(guò)程、基于字形屬性的判別過(guò)程和基于字形骨架的判別過(guò)程;具體包括:
1)基于字形重建的判別過(guò)程:
將每一個(gè)漢字字形切割得到部件,根據(jù)原位置進(jìn)行重新拼接,對(duì)得到的拼接字形和原字形進(jìn)行像素級(jí)別的比較,統(tǒng)計(jì)得到差異像素值;設(shè)定差異像素值閾值,再根據(jù)設(shè)定的差異像素值閾值進(jìn)行判別,將所述字形判別為錯(cuò)誤切割結(jié)果或正確切割結(jié)果;
2)基于部件分類的判別過(guò)程:
首先,構(gòu)建一個(gè)由正確部件組成的部件數(shù)據(jù)集,在所述部件數(shù)據(jù)集上訓(xùn)練一個(gè)部件分類器;然后,使用訓(xùn)練得到的部件分類器對(duì)待判別的字形切割結(jié)果進(jìn)行分類,得到分類的結(jié)果為正確部件或錯(cuò)誤部件;所述分類具體計(jì)算所述待判別的字形切割結(jié)果和應(yīng)屬于的部件類別的距離來(lái)判別;當(dāng)該分類結(jié)果與部件應(yīng)屬于的類別不同時(shí),判定為錯(cuò)誤部件;
3)基于字形屬性的判別過(guò)程:
設(shè)定正確部件相對(duì)應(yīng)的字形屬性,當(dāng)部件不符合相應(yīng)的字形屬性時(shí),判定該部件是字形切割錯(cuò)誤產(chǎn)生的結(jié)果;
4)基于字形骨架的判別過(guò)程:
將漢字字形中的每個(gè)筆畫(huà)的輪廓中段進(jìn)行平滑性的檢測(cè),當(dāng)在筆畫(huà)中段出現(xiàn)輪廓突變時(shí),判定該字形切割結(jié)果錯(cuò)誤。
2.如權(quán)利要求1所述漢字字形切割結(jié)果正確性的判別方法,其特征是,在所述基于字形重建的判別過(guò)程、基于部件分類的判別過(guò)程、基于字形屬性的判別過(guò)程和基于字形骨架的判別過(guò)程中,當(dāng)任一判別過(guò)程針對(duì)待判別的字形切割結(jié)果進(jìn)行判別得到的判定結(jié)果為錯(cuò)誤切割結(jié)果時(shí),將所述待判別的字形切割結(jié)果判定為字形切割錯(cuò)誤。
3.如權(quán)利要求1所述漢字字形切割結(jié)果正確性的判別方法,其特征是,所述基于字形重建的判別過(guò)程中,所述差異像素值閾值設(shè)為筆畫(huà)寬度的平方。
4.如權(quán)利要求1所述漢字字形切割結(jié)果正確性的判別方法,其特征是,所述基于字形重建的判別過(guò)程具體包括如下步驟:
11)根據(jù)原字形的尺寸,生成一個(gè)與原字形尺寸相等的差異值矩陣,該差異值矩陣的所有元素均初始化為0;
12)遍歷切割得到的每一個(gè)部件的結(jié)果,根據(jù)在原圖中的位置,將該部件圖像對(duì)應(yīng)到差異值矩陣的一個(gè)和部件圖像尺寸相等的區(qū)域,再將部件圖像和差異值矩陣的對(duì)應(yīng)區(qū)域進(jìn)行像素級(jí)別的累加;完成所有部件的累加,得到差異值矩陣;
13)分別生成與原字形尺寸相等的一個(gè)缺失區(qū)域矩陣和一個(gè)多余區(qū)域矩陣;所述兩個(gè)矩陣的所有元素均初始化為0,同時(shí)遍歷原字形的每個(gè)像素和所述差異值矩陣的對(duì)應(yīng)位置像素;分兩種情況設(shè)置原字形像素值;第一種情況是原字形像素值為0,另一種情況是原字形像素值為1;針對(duì)第一種情況,當(dāng)所述差異值矩陣對(duì)應(yīng)像素值為1時(shí),將所述多余區(qū)域矩陣對(duì)應(yīng)位置的值設(shè)為1,否則設(shè)為0;針對(duì)第二種情況,當(dāng)所述差異值矩陣對(duì)應(yīng)像素為0,將所述缺失區(qū)域矩陣對(duì)應(yīng)位置的值設(shè)為1,否則設(shè)為0;
14)分別對(duì)所述缺失區(qū)域矩陣和多余區(qū)域矩陣進(jìn)行連通區(qū)域檢測(cè),得到兩個(gè)矩陣所有的連通區(qū)域的像素個(gè)數(shù);設(shè)定連通區(qū)域像素閾值,當(dāng)任意一個(gè)連通區(qū)域的像素總數(shù)超過(guò)所述連通區(qū)域像素閾值時(shí),將該字形判別為錯(cuò)誤切割結(jié)果,否則判別為正確切割結(jié)果。
5.如權(quán)利要求1所述漢字字形切割結(jié)果正確性的判別方法,其特征是,所述基于部件分類的判別過(guò)程中,部件分類器的訓(xùn)練包括如下步驟:
21)圖像預(yù)處理,執(zhí)行如下操作:
采用非剛性縮放的方式對(duì)部件圖像進(jìn)行縮放,將每個(gè)部件圖像都?xì)w一化為一個(gè)正方形圖像,正方形的邊長(zhǎng)記為L(zhǎng);
22)選擇局部子圖像,對(duì)局部子圖像進(jìn)行局部特征的提取,得到多個(gè)局部特征向量,將局部特征向量的個(gè)數(shù)記為num_lf;
23)字典構(gòu)建:
在得到的局部特征向量中,隨機(jī)采樣得到其中多個(gè)局部特征作為總的特征集合;局部特征的個(gè)數(shù)取值范圍應(yīng)大于10000;最大可以設(shè)為全部的局部特征向量個(gè)數(shù)num_lf;采用K均值聚類算法得到num_k個(gè)聚類中心,作為稀疏字典;num_k的取值范圍是256到全部局部特征的個(gè)數(shù)num_lf;
24)稀疏表示:
根據(jù)上一步得到的稀疏字典,應(yīng)用稀疏編碼算法對(duì)一個(gè)部件所有的局部特征進(jìn)行編碼;隨后采用最大值池化算法將所有的局部特征進(jìn)行結(jié)合,得到一個(gè)維度為num_k的稀疏表示特征,維度的數(shù)量和聚類中心的數(shù)量相等;
25)分類器訓(xùn)練,使用線性支持向量機(jī)算法對(duì)所述稀疏表示特征進(jìn)行訓(xùn)練,得到部件分類器。
6.如權(quán)利要求1所述漢字字形切割結(jié)果正確性的判別方法,其特征是,所述基于部件分類的判別過(guò)程中,所述分類具體是:通過(guò)計(jì)算所述待判別的字形切割結(jié)果使用分類器得到的部件類別和應(yīng)屬于的部件類別是否相同來(lái)判別;當(dāng)該分類結(jié)果與部件應(yīng)屬于的類別不同時(shí),該字形判別為錯(cuò)誤切割結(jié)果,當(dāng)該分類結(jié)果與部件應(yīng)屬于的類別相同時(shí),該字形判別為正確切割結(jié)果。
7.如權(quán)利要求6所述漢字字形切割結(jié)果正確性的判別方法,其特征是,步驟22)所述局部特征提取,具體執(zhí)行如下操作:
22a.對(duì)局部子圖像進(jìn)行均勻網(wǎng)格切分,得到多個(gè)區(qū)域,設(shè)為n*n個(gè);設(shè)局部子圖像的邊長(zhǎng)為L(zhǎng)_sub,得到每個(gè)區(qū)域的邊長(zhǎng)為L(zhǎng)_sub除以n;所述n*n個(gè)區(qū)域?qū)⒕植孔訄D像均勻劃分,互相之間無(wú)交集,合并起來(lái)恰好構(gòu)成切分前的局部子圖像;在每個(gè)區(qū)域內(nèi)利用Sobel算子進(jìn)行卷積,得到幅度和相位的結(jié)果;
22b.將相位均勻分為n*n個(gè)區(qū)間,每個(gè)區(qū)間統(tǒng)計(jì)得到局部子圖像中相位落在該區(qū)間的像素點(diǎn)的幅度值的總和;得到一個(gè)n*n維的局部特征;
22c.將n*n區(qū)域的相應(yīng)維度的局部特征進(jìn)行拼接,得到多維的局部特征。
8.如權(quán)利要求1所述漢字字形切割結(jié)果正確性的判別方法,其特征是,所述基于字形屬性的判別過(guò)程中,所述字形屬性包括部件尺寸屬性和部件區(qū)域?qū)傩浴?/p>
9.如權(quán)利要求1所述漢字字形切割結(jié)果正確性的判別方法,其特征是,所述基于字形骨架的判別過(guò)程具體步驟如下:
41)設(shè)一個(gè)字形切割結(jié)果得到的一個(gè)部件中筆畫(huà)個(gè)數(shù)為N,對(duì)于每個(gè)部件輪廓上的點(diǎn),得到N個(gè)值,分別代表該輪廓點(diǎn)距離N個(gè)筆畫(huà)骨架的最近距離;
42)將一個(gè)輪廓點(diǎn)和所有筆畫(huà)骨架的最近距離取最小值,將取到最小值的筆畫(huà)骨架作為輪廓點(diǎn)應(yīng)屬于的筆畫(huà),將取到的最小值作為輪廓點(diǎn)和筆畫(huà)骨架的距離;
43)構(gòu)建輪廓點(diǎn)集合:設(shè)定N個(gè)輪廓點(diǎn)集合,初始化為空集,第i個(gè)集合代表第i個(gè)筆畫(huà)的輪廓;遍歷所有的輪廓點(diǎn),當(dāng)輪廓點(diǎn)屬于第i個(gè)筆畫(huà)時(shí),將這個(gè)輪廓點(diǎn)加入到第i個(gè)集合;完成集合的構(gòu)建之后,將每個(gè)集合中距離最近筆畫(huà)骨架點(diǎn)是筆畫(huà)的起始M%和末尾M%的輪廓點(diǎn)去除,剩下的輪廓點(diǎn)就是筆畫(huà)中段的輪廓點(diǎn);
44)求得每個(gè)集合的輪廓點(diǎn)到所屬的筆畫(huà)骨架距離的眾數(shù),作為該段筆畫(huà)的平均筆畫(huà)寬度;當(dāng)輪廓點(diǎn)到所屬的筆畫(huà)骨架距離超過(guò)了平均筆畫(huà)寬度的K倍時(shí),判定該輪廓點(diǎn)是突變輪廓;當(dāng)突變輪廓點(diǎn)的數(shù)量超過(guò)了預(yù)先設(shè)定的突變輪廓點(diǎn)數(shù)量閾值時(shí),將所述部件判別為錯(cuò)誤切割的部件。
10.如權(quán)利要求9所述漢字字形切割結(jié)果正確性的判別方法,其特征是,步驟41)所述輪廓點(diǎn)距離N個(gè)筆畫(huà)骨架的最近距離的具體計(jì)算方法是:對(duì)于一個(gè)輪廓點(diǎn),遍歷N個(gè)筆畫(huà)骨架,每個(gè)筆畫(huà)骨架遍歷所有的骨架點(diǎn)計(jì)算得到輪廓點(diǎn)和這些筆畫(huà)骨架點(diǎn)的距離,取距離的最小值作為該輪廓點(diǎn)距離當(dāng)前遍歷的筆畫(huà)骨架的最近距離;步驟43)所述M的取值范圍是0到50;步驟44)所述K的取值范圍是0.8到3;所述突變輪廓點(diǎn)數(shù)量閾值為平均筆畫(huà)寬度的X倍,X的取值范圍是0.7到3。