本發(fā)明涉及模式識別技術(shù)領(lǐng)域,尤其涉及一種手寫滿文字母識別方法及裝置。
背景技術(shù):
滿語作為一種古老的語言之一,是一種極具代表的少數(shù)民族文字,研究少數(shù)民族文字識別方法是保護(hù)和傳承少數(shù)民族文化遺產(chǎn)的重要技術(shù)手段,具有重要的社會價值和歷史意義。目前漢字的手寫識別已滿足實用化需求,英文和數(shù)字的脫機手寫識別產(chǎn)品也已經(jīng)很成熟,但圈點滿文的手寫文字識別仍是一塊空白的領(lǐng)域,尚待研究。
授權(quán)公告號CN 205451106 U的實用新型專利公開了一種手寫滿文字母采集系統(tǒng),即基于該專利,可以實現(xiàn)對手寫滿文字母采集工作,依此建立滿文字母庫,獲得滿文字母數(shù)據(jù)樣本,得到訓(xùn)練樣本。
傳統(tǒng)的文字識別方法提取的特征通常為單一特征,但對于滿文字母,因其文字的特殊性,僅提取單一特征不具備一定的噪聲抗干擾能力。因此,當(dāng)噪聲干擾較大時,會導(dǎo)致滿文字母的識別率較低。
技術(shù)實現(xiàn)要素:
為克服現(xiàn)有技術(shù)中存在的問題,本發(fā)明公開一種手寫滿文字母識別方法及裝置。
根據(jù)本公開實施例的第一方面,提供一種手寫滿文字母識別方法,包括:
對待識別的滿文字母圖像進(jìn)行預(yù)處理;
分別采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像提取特征,得到滿文字母特征值;
采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,得到降維后的滿文字母特征值;
采用K-近鄰方法對所述降維后的滿文字母特征值進(jìn)行分類處理,得到所述待識別的滿文字母圖像對應(yīng)的滿文字母。
在一實例例中,所述方法還包括:
利用滿文字母數(shù)據(jù)樣本進(jìn)行模型訓(xùn)練。
在一實施例中,所述利用滿文字母數(shù)據(jù)樣本進(jìn)行模型訓(xùn)練,包括:
LDA降維矩陣計算,得到線性空間中最佳投影向量;
設(shè)定不同的K值反復(fù)訓(xùn)練,調(diào)整K-近鄰的參數(shù)值。
在一實施例中,所述LDA降維矩陣計算,得到線性空間中最佳投影向量,包括:
對待識別的滿文字母圖像樣本進(jìn)行預(yù)處理;
分別采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對所述待識別的滿文字母圖像樣本提取特征,得到滿文字母特征值;
分配數(shù)據(jù)空間存儲滿文字母特征值和標(biāo)簽;
計算各類樣本期望以及總樣本期望;
計算類間協(xié)方差矩陣Sb及類內(nèi)協(xié)方差矩陣Sw;
求矩陣Sw-1Sb的特征向量,得到投影向量。
在一實施例中,所述設(shè)定不同的K值反復(fù)訓(xùn)練,調(diào)整K-近鄰的參數(shù)值,包括:
對待識別的滿文字母圖像樣本進(jìn)行預(yù)處理;
分別采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對所述待識別的滿文字母圖像樣本提取特征,得到滿文字母特征值;
采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,得到降維后的滿文字母特征值;
分配數(shù)據(jù)空間分別存儲訓(xùn)練數(shù)據(jù)和測試元組,預(yù)設(shè)參數(shù)K;
維護(hù)一個大小為k的按距離由大到小的優(yōu)先級隊列,用于存儲待識別元組。隨機從待識別元組中選取k個元組作為初始的最近鄰元組,分別計算測試元組到這k個元組的距離,將待識別元組標(biāo)號和距離存入優(yōu)先級隊列;
遍歷訓(xùn)練元組集,計算當(dāng)前待識別元組與測試元組的距離,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列;
遍歷完畢,計算優(yōu)先級隊列中k個元組的多數(shù)類,并將其作為測試元組的類別。
測試元組集測試完畢后計算誤差率,繼續(xù)設(shè)定不同的K值重新訓(xùn)練,最后取誤差率最小的K值。
在一實施例中,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列,包括:
當(dāng)所述所得距離L大于優(yōu)先級隊列中的最大距離Lmax時,則舍棄該元組,遍歷下一個元組。
當(dāng)所述所得距離L小于優(yōu)先級隊列中的最大距離Lmax時,則刪除優(yōu)先級隊列中最大距離的元組,將當(dāng)前訓(xùn)練元組存入優(yōu)先級隊列。
在一實施例中,所述對滿文字母圖像進(jìn)行預(yù)處理,包括:
對滿文字母圖像進(jìn)行字符大小的線性歸一化、加虛擬筆劃、字符的非線性歸一化、筆劃上的點的重采樣、筆劃上的點的平滑等等。
在一實施例中,分別采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像提取特征,得到滿文字母特征值,包括:
對待識別的滿文字母圖像進(jìn)行8方向特征提取,得到滿文字母的方向特征值;
對待識別的滿文字母圖像進(jìn)行粗網(wǎng)絡(luò)特征提取,得到滿文字母的網(wǎng)格特征值;
將滿文字母的方向特征值和網(wǎng)格特征值組合為一列,得到滿文字母特征值。
在一實施例中,采用K-近鄰方法對所述降維后的滿文字母特征值進(jìn)行分類處理,得到所述待識別的滿文字母圖像對應(yīng)的滿文字母,包括:
維護(hù)一個大小為k的按距離由大到小的優(yōu)先級隊列,用于存儲待識別元組。隨機從待識別元組中選取k個元組作為初始的最近鄰元組,分別計算測試元組到這k個元組的距離,將待識別元組標(biāo)號和距離存入優(yōu)先級隊列;
遍歷訓(xùn)練元組集,計算當(dāng)前待識別元組與測試元組的距離,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列;
遍歷完畢,計算優(yōu)先級隊列中k個元組的多數(shù)類,并將其作為測試元組的類別。
根據(jù)本公開實施例的第二方面,提供一種手寫滿文字母識別裝置,包括:
提取模塊,被配置為采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像提取特征,得到滿文字母特征值;
降維模塊,被配置為采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,得到降維后的滿文字母特征值;
分類模塊,被配置為采用K-近鄰方法對所述降維后的滿文字母特征值進(jìn)行分類處理,得到所述待識別的滿文字母圖像對應(yīng)的滿文字母。
在一實施例中,所述裝置還包括:
預(yù)處理模塊,被配置為對待識別的滿文字母圖像進(jìn)行預(yù)處理。
在一實施例中,所述裝置還包括:
訓(xùn)練模塊,被配置為利用滿文字母數(shù)據(jù)樣本進(jìn)行模型訓(xùn)練。
在一實施例中,所述訓(xùn)練模塊包括:
第一處理子模塊,被配置為LDA降維矩陣計算,得到線性空間中最佳投影向量;
第二處理子模塊,被配置為設(shè)定不同的K值反復(fù)訓(xùn)練,調(diào)整K-近鄰的參數(shù)值。
在一實施例中,所述第一處理子模塊包括:
預(yù)處理模塊,被配置為對所述待識別的滿文字母圖像樣本進(jìn)行預(yù)處理。
提取模塊,被配置為采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像樣本提取特征,得到滿文字母特征值;
LDA降維矩陣計算模塊,被配置為對LDA降維矩陣進(jìn)行計算,得到線性空間中最佳投影向量。
在一實施例中,所述第二處理子模塊包括:
預(yù)處理模塊,被配置為對所述待識別的滿文字母圖像樣本進(jìn)行預(yù)處理。
提取模塊,被配置為采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像樣本提取特征,得到滿文字母特征值;
降維模塊,被配置為采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,得到降維后的滿文字母特征值;
KNN訓(xùn)練模塊,被配置為設(shè)定不同的K值反復(fù)訓(xùn)練,調(diào)整K-近鄰的參數(shù)值。
在一實施例中,所述提取模塊包括:
方向特征提取子模塊,被配置為對待識別的滿文字母圖像進(jìn)行8方向特征提取,或者對待識別的滿文字母圖像樣本進(jìn)行8方向特征提取,得到滿文字母的方向特征值。
粗網(wǎng)絡(luò)特征提取子模塊,被配置為對待識別的滿文字母圖像進(jìn)行粗網(wǎng)絡(luò)特征提取,或者對待識別的滿文字母圖像樣本進(jìn)行粗網(wǎng)絡(luò)特征提取,得到滿文字母的網(wǎng)格特征值。
在一實施例中,所述分類模塊包括:
距離計算單元,被配置為計算當(dāng)前待識別元組與測試元組的距離。
比較選擇單元,被配置為比較所得距離與優(yōu)先級隊列中的最大距離,得到最終的優(yōu)先級隊列。等待遍歷結(jié)束后選擇優(yōu)先級隊列中K個元組的多數(shù)類,將其作為測試元組的類別。
根據(jù)本公開實施例的第三方面,提供一種手寫滿文字母識別裝置,包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,處理器被配置為:
對待識別的滿文字母圖像進(jìn)行預(yù)處理;
分別采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像提取特征,得到滿文字母特征值;
采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,得到降維后的滿文字母特征值;
采用K-近鄰方法對所述降維后的滿文字母特征值進(jìn)行分類處理,得到所述待識別的滿文字母圖像對應(yīng)的滿文字母。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:
采用方向特征提取和粗網(wǎng)絡(luò)特征提取相結(jié)合的方法對待識別的滿文字母圖像提取特征,使得得到的滿文字母特征值更精確,具有較好的噪聲抗干擾能力,從而使得后續(xù)降維后采用KNN分類器根據(jù)該滿文字母特征值識別出滿文字母準(zhǔn)確率較高。
通過對滿文字母特征值進(jìn)行LDA降維處理,從而減少了處理器的計算次數(shù),提高了處理效率。另外待識別的滿文字母特征數(shù)據(jù)在投影后具有最大的類間散度和最小的類內(nèi)散度,為后期采用K-近鄰方法進(jìn)行分類提供了條件。
由于KNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于像手寫滿文字母這種類域的交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合,能夠獲得較高的識別率。此外,采用K-近鄰方法易于編程,且不需要優(yōu)化,提高了識別的效率。
通過對K-近鄰分類器進(jìn)行訓(xùn)練,得到了合適的模型參數(shù),使得降維后的待識別的滿文字母圖像特征值進(jìn)入分類器后,具有精確的分類效果。
通過對待識別滿文字母圖像進(jìn)行預(yù)處理的操作,能夠很好地減少類內(nèi)變異對識別過程中的干擾,有利于提高滿文字母圖像的識別效率。
本發(fā)明實施例,采用方向特征和粗網(wǎng)絡(luò)特征相結(jié)合的方法對待識別的滿文字母圖像提取特征,使得得到的滿文字母特征值更精確;進(jìn)一步的,采用LDA線性判決分析方法對滿文字母特征值進(jìn)行降維,一方面減少了維數(shù)提高了分類計算效率,另一方面使得降維后的滿文字母特征值更加容易區(qū)分,具有較好的噪聲抗干擾能力,從而使得采用K-近鄰方法根據(jù)該降維后的滿文字母特征值識別出的滿文字母準(zhǔn)確率較高。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本發(fā)明的實施例,并與說明書一起用于解釋本發(fā)明的原理。
圖1A是根據(jù)一示例性實施例示出的一種手寫滿文字母識別方法的流程圖。
圖1B是根據(jù)一示例性實施例示出的一種獲得滿文字母特征值的方法流程圖。
圖1C是根據(jù)一示例性實施例示出的一種滿文字母特征值分類的方法流程圖。
圖2是根據(jù)一示例性實施例示出的另一種手寫滿文字母識別方法的流程圖。
圖2A是根據(jù)一示例性實施例示出的一種對滿文字母樣本進(jìn)行模型訓(xùn)練的方法流程圖。
圖3是根據(jù)一示例性實施例示出的一種獲得LDA降維矩陣的方法流程圖。
圖4是根據(jù)一示例性實施例示出的一種調(diào)整K-近鄰參數(shù)的方法流程圖。
圖5是根據(jù)一示例性實施例示出的一種手寫滿文字母識別裝置的框圖。
圖6是根據(jù)一示例性實施例示出的另一種手寫滿文字母識別裝置的框圖。
圖7是根據(jù)一示例性實施例示出的另一種手寫滿文字母識別裝置的框圖。
圖8A是根據(jù)一示例性實施例示出的另一種手寫滿文字母識別裝置的框圖。
圖8B是根據(jù)一示例性實施例示出的另一種手寫滿文字母識別裝置的框圖。
圖9是根據(jù)一示例性實施例示出的另一種手寫滿文字母識別裝置的框圖。
圖10是根據(jù)一示例性實施例示出的另一種手續(xù)誒滿文字母識別裝置的框圖。
圖11是根據(jù)一示例性實施例示出的另一種手寫滿文字母識別裝置的框圖。
圖12是根據(jù)一示例性實施例示出的一種適用于手寫滿文字母識別裝置的框圖。
具體實施方式
這里將詳細(xì)地對示例性實施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本發(fā)明相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
圖1A是根據(jù)一示例性實施例示出的一種手寫滿文字母識別方法的流程圖,如圖1A所示,該手寫滿文字母識別方法可用于各種終端設(shè)備上,該方法包括以下步驟:
在步驟S101中,分別采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像提取特征,得到滿文字母特征值。
方向特征提取是指把每個滿文字符圖像分成M×M的格子,再在每個方格中提取與空間位置相關(guān)的N(4、8)方向特征,這N(4、8)個方向分別可以定義為上、下、左、右或者上、下、左、右、左上、左下、右上、右下。這種特征提取方法使得手寫筆劃上的點的方向特征與空間相關(guān),而不是與時間相關(guān)。能夠很好的解決由于筆劃順序和筆劃數(shù)目變化帶來的識別率下降問題。同時這種方法能夠從每個滿文字母樣本中得到具有單一物理意義的固定維數(shù)的特征向量。
粗網(wǎng)絡(luò)特征是屬于統(tǒng)計特征中局部特征的一種,體現(xiàn)了滿文字母的整體形狀的分布。該方法把樣本字母分成M×M個網(wǎng)格,然后依次統(tǒng)計每個網(wǎng)格中的像素數(shù)量,在識別階段可以通過把每個網(wǎng)格統(tǒng)計的特征組合起來作為字符的統(tǒng)計特征并依次實現(xiàn)對字符的識別。該算法的每個網(wǎng)格中的像素都能反映字母的一部分特征,并且算法簡單,易于實現(xiàn)。
在實際特征提取時需要對滿文字母圖像分別進(jìn)行方向特征提取和粗網(wǎng)絡(luò)特征提取,故如圖1B所示,步驟S101包括如下步驟:
在步驟S1011中,對待識別的滿文字母圖像進(jìn)行8方向特征提取,得到滿文字母的方向特征值。
在該實施例中,所述對待識別的滿文字母圖像進(jìn)行8方向特征提取方法如下:在對滿文字母圖像進(jìn)行預(yù)處理后,得到了新的手寫滿文字母和滿文字母軌跡點在非線性變化前后的點的映射關(guān)系,之后把字母分成8×8的方格,取每個小方格的中心為采樣中心,得到8×8的采樣點,然后對這些采樣中心用Gabor包絡(luò)提取8-方向特征。
在步驟S1012中,對待識別的滿文字母圖像進(jìn)行粗網(wǎng)絡(luò)特征提取,得到滿文字母的網(wǎng)格特征值。
在該實施例中,所述對待識別的滿文字母圖像進(jìn)行粗網(wǎng)絡(luò)特征提取方法如下:求出經(jīng)過預(yù)處理后得到的最終滿文字母圖像的外邊框;然后將加框后的滿文字母圖像分割成8×8個網(wǎng)格;依次統(tǒng)計每一個網(wǎng)格內(nèi)的黑像素比例;最后把統(tǒng)計后的8×8黑像素排成一列形成64維的網(wǎng)格特征向量。
在步驟S1013中,將滿文字母的方向特征值和網(wǎng)格特征值組合為一列,得到滿文字母特征值。
方向特征提取方法使得手寫筆劃上的點的方向特征與空間相關(guān),體現(xiàn)的是方格中筆劃在方向上的不同,該方法抗干擾能力強,但實現(xiàn)過程復(fù)雜度較高,在應(yīng)用中較為復(fù)雜;粗網(wǎng)絡(luò)特征提取利用每個網(wǎng)格中的像素來反映字母的一部分特征,該方法實現(xiàn)簡單,區(qū)分相似字母的能力強,但是網(wǎng)格特征抗筆劃位置干擾能力較差。因此,由于滿文字母構(gòu)成的特殊性,不能采用傳統(tǒng)的單一特征提取,而采用所述兩種方法相結(jié)合的特征提取方法。
采用方向特征提取和粗網(wǎng)絡(luò)特征提取相結(jié)合的方法對待識別的滿文字母圖像提取特征,使得得到的滿文字母特征值更精確,具有較好的噪聲抗干擾能力,從而使得后續(xù)降維后采用KNN分類器根據(jù)該滿文字母特征值識別出滿文字母準(zhǔn)確率較高。
在步驟S102中,采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,得到降維后的滿文字母特征值。
線性判別式分析(LinearDiscriminantAnalysis,LDA),也叫做Fisher線性判別(FisherLinearDiscrininant,FLD),是模式識別的經(jīng)典算法。線性判別式分析的基本思想是將高維的模式樣本投影到最佳鑒別矢量空間,以達(dá)到抽取分類信息和壓縮特征空間維數(shù)的效果,投影后保證模式樣本在新的子空間(即投影后)具有最大的類間距離和最小的類內(nèi)距離,即樣本在該空間上有最佳的可分離性。LDA是一種有監(jiān)督的線性降維算法,與PCA保持?jǐn)?shù)據(jù)信息不同,LDA是為了使得降維后的數(shù)據(jù)點盡可能地容易被區(qū)分。所以這里采用LDA方法對滿文字母特征值進(jìn)行降維操作。
在該實施例中,采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,首先需要在訓(xùn)練過程中計算降維矩陣,得到線性空間中最佳投影向量,即新的子空間的基矩陣。然后在識別過程中將待識別的滿文字母特征向量投影到該子空間來實現(xiàn)對滿文字母特征值的降維。
在該實施例中,LDA線性判別式分析的目的是對滿文字母特征值進(jìn)行降維處理,以提高后續(xù)的處理效率;另外待識別的滿文字母特征數(shù)據(jù)在通過LDA之后,類內(nèi)離散度矩陣匯總的數(shù)值較小,類間離散度矩陣中的數(shù)值較大,使得所分得的類間耦合度較低,類內(nèi)的聚合度較高,為后期采用K-近鄰方法進(jìn)行分類提供了條件。
在步驟S103中,采用K-近鄰方法對所述降維后的滿文字母特征值進(jìn)行分類處理,得到所述待識別的滿文字母圖像對應(yīng)的滿文字母。
K近鄰(k-NearestNeighbor,KNN)分類算法,是一個理論上比較成熟的方法,也是最簡單的機器學(xué)習(xí)算法之一。該方法的思路是:如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。KNN算法中,所選擇的鄰居都是已經(jīng)正確分類的對象。該方法在分類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。
KNN算法本身簡單有效,它是一種lazy-learning算法。在該實施例中,算法使用的模型實際上對應(yīng)于對滿文字母特征空間的劃分。K值的選擇,距離度量和分類決策規(guī)則是所述該實施例中KNN算法的三個基本要素:
1.K值的選擇會對算法的結(jié)果產(chǎn)生重大影響。K值較小意味著只有與輸入實例較近的訓(xùn)練實例才會對預(yù)測結(jié)果起作用,但容易發(fā)生過擬合;如果K值較大,優(yōu)點是可以減少學(xué)習(xí)的估計誤差,但缺點是學(xué)習(xí)的近似誤差增大,這時與輸入實例較遠(yuǎn)的訓(xùn)練實例也會對預(yù)測起作用,導(dǎo)致預(yù)測發(fā)生錯誤。在該實施例應(yīng)用中,通過使用訓(xùn)練集進(jìn)行訓(xùn)練,調(diào)整參數(shù)K最終得到分類效果最為合適的K值,參數(shù)訓(xùn)練過程在后面進(jìn)行詳細(xì)介紹。
2.該算法中的分類決策規(guī)則是多數(shù)表決,即由輸入實例的K個最臨近的訓(xùn)練實例中的多數(shù)類決定輸入實例的類別。
3.距離度量采用Lp距離(p=2),即歐氏距離。由于在該實施例中進(jìn)行了預(yù)處理操作,使得在度量之前每個屬性的值都是規(guī)范化之后的,避免了具有較大初始值域的屬性和具有較小初始值域的屬性的權(quán)重不同問題。
在采用K-近鄰算法進(jìn)行分類時需要進(jìn)行計算和比較,故如圖1C所示,步驟S103包括如下步驟:
在步驟S1031中,維護(hù)一個大小為k的按距離由大到小的優(yōu)先級隊列,用于存儲待識別元組。隨機從待識別元組中選取k個元組作為初始的最近鄰元組,分別計算測試元組到這k個元組的距離,將待識別元組標(biāo)號和距離存入優(yōu)先級隊列。
在步驟S1032中,遍歷訓(xùn)練元組集,計算當(dāng)前待識別元組與測試元組的距離,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列。
在該實施例中,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列,包括:
當(dāng)所述所得距離L大于優(yōu)先級隊列中的最大距離Lmax時,則舍棄該元組,遍歷下一個元組。
當(dāng)所述所得距離L小于優(yōu)先級隊列中的最大距離Lmax時,則刪除優(yōu)先級隊列中最大距離的元組,將當(dāng)前訓(xùn)練元組存入優(yōu)先級隊列。
在步驟S1033中,遍歷完畢,計算優(yōu)先級隊列中k個元組的多數(shù)類,并將其作為測試元組的類別。
KNN方法雖然從原理上也依賴于極限定理,但在類別決策時,只與極少量的相鄰樣本有關(guān)。由于KNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于像手寫滿文字母這種類域的交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合。
在該實施例中,采用K-近鄰方法易于編程,且不需要優(yōu)化;
在該實施例中,待識別的手寫滿文字母樣本容量大,K值大小合適,K-近鄰分類誤差小,識別率較高。
另外,如圖1A所示,在步驟S101之前,還包括:
在步驟S100中,對待識別的滿文字母圖像進(jìn)行預(yù)處理操作。
預(yù)處理的主要目的是減少同一個滿文字母類內(nèi)不同樣本之間的變異,即增強類內(nèi)聚合度。
在該實施例中,對待識別的滿文字母圖像進(jìn)行預(yù)處理操作主要包括對待識別的滿文字母圖像進(jìn)行字符大小的線性歸一化、加虛擬筆劃、字符的非線性歸一化、筆劃上的點的重采樣、筆劃上的點的平滑等操作。
通過對待識別滿文字母圖像進(jìn)行預(yù)處理的操作,能夠很好地減少類內(nèi)變異對識別過程中的干擾,有利于提高滿文字母圖像的識別效率。
圖2是根據(jù)一示例性實施例示出的另一種手寫滿文字母識別方法的流程圖,如圖2示,在步驟S101之前,還可以包括如下步驟:
在步驟S104中,利用滿文字母數(shù)據(jù)樣本進(jìn)行模型訓(xùn)練。
在該實施例中,如圖2A所示,步驟S104包括如下步驟:
在步驟S1041中,進(jìn)行LDA降維矩陣計算,得到線性空間中最佳投影向量。
在該實施例中,進(jìn)行LDA降維矩陣計算的目的是:通過計算得到最佳投影向量,并使得投影后的樣本具有最大的類間散度和最小的類內(nèi)散度。
圖3是根據(jù)一示例性實施例示出的一種進(jìn)行LDA降維矩陣計算的方法流程圖,包括如下步驟:
在步驟S201中,對待識別的滿文字母圖像樣本進(jìn)行預(yù)處理;
在步驟S202中,分別采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對滿文字母樣本提取特征,得到滿文字母特征值;
在步驟S203中,分配數(shù)據(jù)空間存儲滿文字母特征值和標(biāo)簽;
在步驟S204中,計算各類樣本期望以及總樣本期望;
在步驟S205中,計算類間協(xié)方差矩陣Sb及類內(nèi)協(xié)方差矩陣Sw;
在該實施例中,步驟S205是將所有滿文字母特征值樣本中各個樣本根據(jù)自己所屬的滿文字母類計算出樣本與總體的協(xié)方差矩陣的總和,這從宏觀上描述了所有類和總體之間的離散冗余程度。然后計算每個滿文字母類內(nèi)各個樣本和所屬類之間的協(xié)方差矩陣之和,這個矩陣所刻畫的是從總體來看類內(nèi)各個樣本與該類之間的離散度,在該實施例中所刻畫的類特性是由類內(nèi)各個樣本的平均值矩陣構(gòu)成的。
在步驟S206中,求矩陣Sw-1Sb的特征向量,得到投影向量。
在該實施例中,步驟S206主要是利用Fisher準(zhǔn)則計算特征值和特征向量,F(xiàn)isher鑒別準(zhǔn)則函數(shù)將樣本在投影矢量上的類間散度和類內(nèi)散度結(jié)合在一起,為確定最優(yōu)投影方向提供了一個準(zhǔn)則。當(dāng)準(zhǔn)則函數(shù)達(dá)到最大的矢量時,所確定的投影方向就是最佳投影向量。具體方法為:在得到特征值和特征向量之后,保留d個最大的特征值,及這d個特征值所對應(yīng)的特征向量,并將這些特征向量正交標(biāo)準(zhǔn)化,從而構(gòu)成新的子空間的基矩陣,也就是投影向量。
在步驟S1042中,通過設(shè)定不同的K值反復(fù)訓(xùn)練,調(diào)整K-近鄰的參數(shù)值。
在該實施例中,對K-近鄰分類器進(jìn)行訓(xùn)練的目的是調(diào)整分類器的參數(shù)K,以使得降維后的待識別的滿文字母圖像特征值進(jìn)入分類器后,具有精確的分類效果。
圖4是根據(jù)一示例性實施例示出的一種對K-近鄰分類器進(jìn)行訓(xùn)練的方法流程圖,包括如下步驟:
在步驟S301中,對待識別的滿文字母圖像樣本進(jìn)行預(yù)處理;
在步驟S302中,分別采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對所述待識別的滿文字母圖像樣本提取特征,得到滿文字母特征值;
在步驟S303中,采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,得到降維后的滿文字母特征值;
在步驟S304中,分配數(shù)據(jù)空間分別存儲訓(xùn)練數(shù)據(jù)和測試元組,預(yù)設(shè)參數(shù)K;
在步驟S305中,維護(hù)一個大小為k的按距離由大到小的優(yōu)先級隊列,用于存儲待識別元組。隨機從待識別元組中選取k個元組作為初始的最近鄰元組,分別計算測試元組到這k個元組的距離,將待識別元組標(biāo)號和距離存入優(yōu)先級隊列;
在步驟S306中,遍歷訓(xùn)練元組集,計算當(dāng)前待識別元組與測試元組的距離,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列;
在一實施例中,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列,包括:
當(dāng)所述所得距離L大于優(yōu)先級隊列中的最大距離Lmax時,則舍棄該元組,遍歷下一個元組。
當(dāng)所述所得距離L小于優(yōu)先級隊列中的最大距離Lmax時,則刪除優(yōu)先級隊列中最大距離的元組,將當(dāng)前訓(xùn)練元組存入優(yōu)先級隊列。
在步驟S307中,遍歷完畢,計算優(yōu)先級隊列中k個元組的多數(shù)類,并將其作為測試元組的類別。
在步驟S308中,測試元組集測試完畢后計算誤差率,繼續(xù)設(shè)定不同的K值重新訓(xùn)練,最后取誤差率最小的K值。
由此可見,上述利用手寫滿文字母數(shù)據(jù)樣本進(jìn)行訓(xùn)練的方式簡單、有效、易于實現(xiàn)。
上述實施例,通過對樣本進(jìn)行模型訓(xùn)練,可以獲得較好的模型參數(shù),從而為識別提供條件。
與前述手寫滿文字母識別方法實施例相對應(yīng),本公開還提供了手寫滿文字母識別裝置實施例。
圖6是根據(jù)一示例性實施例示出的一種手寫滿文字母識別裝置的框圖,如圖6所示,手寫滿文字母識別裝置包括:提取模塊51、降維模塊52和分類模塊53。
提取模塊51,被配置為采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像提取特征,得到滿文字母特征值;
降維模塊52,被配置為采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,得到降維后的滿文字母特征值;
分類模塊53,被配置為采用K-近鄰方法對所述降維后的滿文字母特征值進(jìn)行分類處理,得到所述待識別的滿文字母圖像對應(yīng)的滿文字母。
在一實施例中,所述裝置還包括:
預(yù)處理模塊54,被配置為待識別的滿文字母圖像進(jìn)行預(yù)處理。
預(yù)處理的主要目的是減少同一個滿文字母類內(nèi)不同樣本之間的變異,即增強類內(nèi)聚合度。
在該實施例中,對待識別的滿文字母圖像進(jìn)行預(yù)處理操作主要包括對待識別的滿文字母圖像進(jìn)行字符大小的線性歸一化、加虛擬筆劃、字符的非線性歸一化、筆劃上的點的重采樣、筆劃上的點的平滑等操作。
在一實施例中,所述裝置還包括:
訓(xùn)練模塊50,被配置為利用滿文字母數(shù)據(jù)樣本進(jìn)行模型訓(xùn)練。
在一實施例中,所述訓(xùn)練模塊包括:
第一處理子模塊501,被配置為LDA降維矩陣計算,得到線性空間中最佳投影向量;
第二處理子模塊502,被配置為設(shè)定不同的K值反復(fù)訓(xùn)練,調(diào)整K-近鄰的參數(shù)值。
在一實施例中,所述第一處理子模塊501包括:
預(yù)處理模塊5011,被配置為對所述待識別的滿文字母圖像樣本進(jìn)行預(yù)處理。
提取模塊5012,被配置為采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像樣本提取特征,得到滿文字母特征值;
LDA降維矩陣計算模塊5013,被配置為對LDA降維矩陣進(jìn)行計算,得到線性空間中最佳投影向量。
在該實施例中,進(jìn)行LDA降維矩陣計算的目的是:通過計算得到最佳投影向量,并使得投影后的樣本具有最大的類間散度和最小的類內(nèi)散度。
在一實施例中,所述第二處理子模塊502包括:
預(yù)處理模塊5021,被配置為對所述待識別的滿文字母圖像樣本進(jìn)行預(yù)處理。
提取模塊5022,被配置為采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像樣本提取特征,得到滿文字母特征值;
降維模塊5023,被配置為采用LDA線性判決分析的方法對所述滿文字母特征值進(jìn)行降維,得到降維后的滿文字母特征值;
KNN訓(xùn)練模塊5024,被配置為設(shè)定不同的K值反復(fù)訓(xùn)練,調(diào)整K-近鄰的參數(shù)值。
在該實施例中,對K-近鄰分類器進(jìn)行訓(xùn)練的目的是調(diào)整分類器的參數(shù)K,以使得降維后的滿文字母圖像特征值進(jìn)入分類器后,具有精確的分類效果。
在一實施例中,所述提取模塊51被配置為采用方向特征提取方法和粗網(wǎng)絡(luò)特征提取方法對待識別的滿文字母圖像提取特征,得到滿文字母特征值。提取模塊51包括:
方向特征提取子模塊511,被配置為對待識別的滿文字母圖像進(jìn)行8方向特征提取,或者對待識別的滿文字母圖像樣本進(jìn)行8方向特征提取,得到滿文字母的方向特征值。
在該實施例中,所述對待識別的滿文字母圖像進(jìn)行8方向特征提取,或者對待識別的滿文字母圖像樣本進(jìn)行8方向特征提取方法如下:在對滿文字母圖像進(jìn)行預(yù)處理后,得到了新的手寫滿文字母和滿文字母軌跡點在非線性變化前后的點的映射關(guān)系,之后把字母分成8×8的方格,取每個小方格的中心為采樣中心,得到8×8的采樣點,然后對這些采樣中心用Gabor包絡(luò)提取8-方向特征。
粗網(wǎng)絡(luò)特征提取子模塊512,被配置為對待識別的滿文字母圖像進(jìn)行粗網(wǎng)絡(luò)特征提取,或者對待識別的滿文字母圖像樣本進(jìn)行粗網(wǎng)絡(luò)特征提取,得到滿文字母的網(wǎng)格特征值。
在該實施例中,所述對待識別的滿文字母圖像進(jìn)行粗網(wǎng)絡(luò)特征提取,或者對待識別的滿文字母圖像樣本進(jìn)行粗網(wǎng)絡(luò)特征提取方法如下:求出經(jīng)過預(yù)處理后得到的最終滿文字母圖像的外邊框;然后將加框后的滿文字母圖像分割成8×8個網(wǎng)格;依次統(tǒng)計每一個網(wǎng)格內(nèi)的黑像素比例;最后把統(tǒng)計后的8×8黑像素排成一列形成64維的網(wǎng)格特征向量。
在一實施例中,所述分類模塊53被配置為采用K-近鄰方法對所述降維后的滿文字母特征值進(jìn)行分類處理,得到所述待識別的滿文字母圖像對應(yīng)的滿文字母。K-近鄰方法的思路是:如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。KNN算法中,所選擇的鄰居都是已經(jīng)正確分類的對象。該方法在分類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。
在一實施例中,所述分類模塊53包括:
距離計算單元531,被配置為計算當(dāng)前待識別元組與測試元組的距離。
距離度量采用Lp距離(p=2),即歐氏距離。由于在該實施例中進(jìn)行了預(yù)處理操作,使得在度量之前每個屬性的值都是規(guī)范化之后的,避免了具有較大初始值域的屬性和具有較小初始值域的屬性的權(quán)重不同問題。
比較選擇單元532,被配置為比較所得距離與優(yōu)先級隊列中的最大距離,得到最終的優(yōu)先級隊列。等待遍歷結(jié)束后選擇優(yōu)先級隊列中K個元組的多數(shù)類,將其作為測試元組的類別。
在該實施例中,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列,包括:
當(dāng)所述所得距離L大于優(yōu)先級隊列中的最大距離Lmax時,則舍棄該元組,遍歷下一個元組。
當(dāng)所述所得距離L小于優(yōu)先級隊列中的最大距離Lmax時,則刪除優(yōu)先級隊列中最大距離的元組,將當(dāng)前訓(xùn)練元組存入優(yōu)先級隊列。
關(guān)于上述實施例中的裝置,其中各個模塊、子模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
圖12是根據(jù)一示例性實施例示出的一種適用于滿文字母識別裝置的框圖。例如,裝置1200可以是ARM,移動電話,消息收發(fā)設(shè)備,平板設(shè)備等嵌入式設(shè)備。
參照圖12,裝置1200可以包括以下一個或多個組件:處理組件1202,存儲器1204,電源組件1206,多媒體組件1208,音頻組件1210,輸入/輸出(I/O)的接口1212,以及通信組件1214。
處理組件1202通常控制裝置1200的整體操作,諸如與顯示,數(shù)據(jù)計算,數(shù)據(jù)通信和記錄操作相關(guān)聯(lián)的操作。處理元件1202可以包括一個或多個處理器1220來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件1202可以包括一個或多個模塊,便于處理組件1202和其他組件之間的交互。例如,處理組件1202可以包括多媒體模塊,以方便多媒體組件1208和處理組件1202之間的交互。
存儲器1204被配置為存儲各種類型的數(shù)據(jù)以支持在設(shè)備1200的操作。這些數(shù)據(jù)的示例包括用于在裝置1200上操作的任何應(yīng)用程序或方法的指令,文本數(shù)據(jù),消息,圖片,視頻等。存儲器1204可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器等。
電力組件1206為裝置1200的各種組件提供電力。電力組件1206可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置1200生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件1208包括在所述裝置1200和用戶之間的提供一個輸出接口的屏幕。該屏幕包括液晶顯示器(LCD)和觸摸面板(TP),以接收來自用戶的輸入信號。在一些實施例中,多媒體組件1208包括一個或多個攝像頭。當(dāng)設(shè)備1200處于操作模式,如拍照模式或錄像模式時,攝像頭可以接收外部的多媒體數(shù)據(jù)。
音頻組件1210被配置為輸出和/或輸入音頻信號。例如,音頻組件1210包括一個麥克風(fēng)(MIC),當(dāng)裝置1200處于操作模式,如錄音模式時,麥克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進(jìn)一步存儲在存儲器1204或經(jīng)由通信組件1214發(fā)送。在一些實施例中,音頻組件1210還包括一個揚聲器,用于輸出音頻信號。
I/O接口1212為處理組件1202和外圍接口模塊之間提供接口,上述外圍接口模塊可以是按鍵,觸摸按鍵等。這些按鍵可以包括但不限于:音量按鈕、復(fù)位按鈕。
通信組件1214被配置為便于裝置1200和其他設(shè)備之間有線或無線方式的通信。裝置1200可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個示例性實施例中,所述通信部件1214還包括串行通信模塊,以完成與上位機的通信。
在示例性實施例中,裝置1200可以被一個或多個應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)成可編程門陣列(FPGA)控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。
本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的公開后,將容易想到本公開的其他實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。