本發(fā)明屬于模式識別技術(shù)領(lǐng)域,具體涉及一種基于小波包分析和支持向量機的車牌字符識別方法。
背景技術(shù):
車牌識別系統(tǒng)是現(xiàn)代社會智能交通系統(tǒng)的重要組成部分,是圖像處理、計算機視覺、模式識別技術(shù)等研究的熱點,應(yīng)用越來越普遍。車牌識別系統(tǒng)的研究步驟分為圖像采集、圖象數(shù)字化處理、車牌定位和區(qū)域提取、字符分割和字符識別等,其中字符識別算法是車牌識別系統(tǒng)中的關(guān)鍵技術(shù)。
迄今為止,已提出的車牌識別方法有很多種,如模板匹配、特征匹配、人工神經(jīng)網(wǎng)絡(luò)、支持向量機等,其中支持向量機(Support Vector Machines,SVM)方法備受青睞。支持向量機有很多優(yōu)點,例如其具有簡單的模型結(jié)構(gòu)和較好的泛化能力,以及對解決小樣本、非線性及高維空間問題效果良好。但是,由于決策速度慢以及對復(fù)雜問題的分類精度不高等局限性,傳統(tǒng)支持向量機方法效率較低;隨著特征維數(shù)的增加,其實現(xiàn)的復(fù)雜度也難以接受。因此,研究者們在提高識別速度和準(zhǔn)確率方面做不斷地研究,來達(dá)到優(yōu)化識別效果的目的。但是這些方法建立在更復(fù)雜的數(shù)學(xué)模型或結(jié)構(gòu)模型基礎(chǔ)上,增加了復(fù)雜性。使用隱馬爾可夫概率模型可以進(jìn)行車牌識別,但是這種模型的使用在實現(xiàn)過程中復(fù)雜度較高,所需先驗知識較多;基于先驗知識的SVM決策樹模型主要針對使用某種字符比較多的識別情況,系統(tǒng)相對而言具有局限性,且在使用一對一策略的情況下,分類器太多導(dǎo)致系統(tǒng)的識別效率不理想。
技術(shù)實現(xiàn)要素:
本發(fā)明旨在提出一種基于小波包分析和支持向量機的車牌字符識別方法,通過對小波包分解和支持向量機的合理應(yīng)用,對識別過程進(jìn)行研究分析和合理配置,達(dá)到提高識別效率的目的。
本發(fā)明的技術(shù)方案如下:
一種基于小波包分析和支持向量機的車牌字符識別方法,其特征在于包括以下步驟:
(1)尋找最佳小波包基:基于一定的標(biāo)準(zhǔn),從小波包基集合中選擇最佳小波包基,將 最佳小波包基的小波包分解系數(shù)作為識別特征;
(2)K-L變換得到特征矢量:去除數(shù)據(jù)間的相關(guān)性,且在均方誤差準(zhǔn)則下失真最小,將數(shù)據(jù)從原來的R維空間降維投影到M維空間,R>M;
(3)采用LIBSVM完成字符識別。
上述步驟(1)進(jìn)一步包括:
(11)將車牌字符圖像歸一化為32×16大?。?/p>
(12)對字符圖像進(jìn)行三層小波包分解,并求每一節(jié)點的JF值;
(13)尋找最佳小波包基Z;
(14)對Z中的每個節(jié)點重復(fù)步驟(13)直至檢驗結(jié)束,即得到最佳小波包基,其分解系數(shù)作為字符特征。
上述步驟(3)所述采用LIBSVM完成字符識別,具體包括:
(31)字符經(jīng)過特征提取并降維處理后得到的3維特征矢量,將其轉(zhuǎn)化為要求的格式;
(32)使用交叉校驗的方法重復(fù)訓(xùn)練測試樣本,尋找最佳參數(shù);所謂交叉檢驗是將數(shù)據(jù)分為k個集合,每一個集合參加訓(xùn)練的同時其他k-1個集合參加測試,得到k組參數(shù),對結(jié)果進(jìn)行比較,選其中結(jié)果最好的一組參數(shù)作為最佳參數(shù);
(33)使用最佳參數(shù)和RBF核函數(shù)對訓(xùn)練集進(jìn)行訓(xùn)練獲取支持向量機模型;
(34)利用得到的模型進(jìn)行車牌字符識別。
本發(fā)明采用的特征提取的過程是通過待識別字符的小波包三層分解來提取最佳小波包基的小波包分解系數(shù)的過程。在提取過程中,不僅增加了高頻成分信息提高識別率,而且利用K-L變換降維提高識別速率,從而達(dá)到優(yōu)化識別效果的目的。
附圖說明
圖1是基于小波包分析和支持向量機的車牌字符識別方法的流程圖。
具體實施方式
如圖1所示為基于小波包分析和支持向量機的車牌字符識別方法的流程圖。方法中汽車圖像均為實際拍攝到的24位真彩圖像,其中車牌字符含有數(shù)字樣本10個,英文樣本24個,漢字樣本55個。在訓(xùn)練樣本中字母樣本120個,數(shù)字樣本32個,漢字字符166個。識別部分利用LIBSVM函數(shù)庫,采用C-SVC支持向量機模型,核函數(shù)選用RBF徑向基函數(shù),交叉校驗的分組數(shù)k設(shè)為5,懲罰參數(shù)C定為8。
字符的筆畫結(jié)構(gòu)在小波分解的四個小波空間的分布特征在很大程度上能夠反映漢字、數(shù) 字和字母的結(jié)構(gòu)特征,可以作為車牌字符識別的依據(jù)。傳統(tǒng)的正交小波分解只對信號的低頻部分作進(jìn)一步分解,對高頻信號并不做處理;另外采用全部小波分解系數(shù)作為特征,維數(shù)過大且靈活性低。小波包分解對信號高頻成分對應(yīng)的小波空間進(jìn)行如同樹狀的連續(xù)分解,從而提取更豐富的時頻域信息。為了克服小波變換的缺點,本方法選擇了具有更好時頻特性的小波包分解來進(jìn)行特征提?。欢覟榱私档吞卣魇噶烤S度,在采用小波包分解之后尋找最佳小波包基,將最佳小波包基的小波分解系數(shù)進(jìn)行K-L變換降維,得到特征矢量。
1、尋找最佳小波包基:
基于一定的標(biāo)準(zhǔn),從小波包基集合中選擇最佳小波包基,將最佳小波包基的小波包分解系數(shù)作為識別特征,其中重點是如何尋找最佳小波包基。
構(gòu)造以下基本判別準(zhǔn)則:設(shè)兩類ωi、ωj的均值向量為mi、mj,兩類的類內(nèi)離散度為sω,則有:
其中,定義JF為節(jié)點判據(jù)值,C為總情況值,[Tmin,Tmax]為的范圍。將字符進(jìn)行N層小波包分解,用表示第1層第k個節(jié)點,則的子節(jié)點為的子節(jié)點為設(shè)為與的JF值之比,若說明子節(jié)點比父節(jié)點更有利于分類,否則說明父節(jié)點更有利于分類;設(shè)為總JF增量值,若α>0且滿足的節(jié)點不少于兩個則說明該節(jié)點滿足分解條件。結(jié)合上述參數(shù)和條件,提出車牌字符特征提取步驟如下:
(1)將車牌字符圖像歸一化為32×16大小。
(2)對字符圖像進(jìn)行三層小波包分解,并求每一節(jié)點的JF值。
(3)尋找最佳小波包基Z:若節(jié)點不滿足分解條件,則檢驗子節(jié)點是否滿足分解條件:若也不滿足則將加入最佳小波包基Z中;若滿足分解條件且驗證滿足的節(jié)點個數(shù)不少于2個,則將加入Z中。若節(jié)點滿足分解條件,則將的全部子節(jié)點加入最佳小波包基Z中并從Z中刪除節(jié)點
(4)對Z中的每個節(jié)點重復(fù)步驟3直至檢驗結(jié)束,即得到最佳小波包基,其分解系數(shù) 作為字符特征。
2、K-L變換得到特征矢量
最佳小波包基的小波分解系數(shù)維數(shù)很大,這對提高識別率和識別速度是不利因素,所以需要對特征向量降維,來減少冗余信息優(yōu)化識別效果。K-L變換也稱主分量分析方法,是一種對信息的緊湊表示方法,其目的是去除數(shù)據(jù)間的相關(guān)性,且在均方誤差準(zhǔn)則下失真最小,將數(shù)據(jù)從原來的R維空間降維投影到M維空間(R>>M)。
設(shè)樣本集為X={x1,x2,…,xM},xi∈RN,M為訓(xùn)練樣本總數(shù),N為每個訓(xùn)練樣本的維數(shù),以訓(xùn)練樣本集X的總體散布矩陣為產(chǎn)生矩陣:
其中,以A為產(chǎn)生矩陣,構(gòu)造相關(guān)矩陣可表示R=AAT,求解R的特征值為λi(1≤i≤N)并進(jìn)行排序,有λ1≥λ2≥…≥λN,排序后對應(yīng)特征向量為vi(i=1,2,…N).取前m個最大特征值,則相對應(yīng)的m個特征向量構(gòu)成K-L變換矩陣U=(v1,v2,…vm).m通過最大特征值之和與總特征值之和的商即來確定,θ盡可能大,同時m盡可能小,這樣能夠在最大程度保存圖像信息的同時盡可能減小特征矢量的維數(shù)。根據(jù)仿真和試驗后得到當(dāng)m值為30左右時,低維空間的特征向量組成的特征空間已經(jīng)能夠很好地反應(yīng)原始高維空間的特征情況,故本方法選擇m值為30。
3、LIBSVM完成字符識別
支持向量機作為統(tǒng)計學(xué)理論中最年輕的部分,采用結(jié)構(gòu)風(fēng)險最小原則,在解決小樣本、非線性及高維空間識別問題中表現(xiàn)出獨特的優(yōu)勢和良好的應(yīng)用前景。對于線性問題,核函數(shù)是兩個向量做點積運算;對于非線性問題,SVM引入非線性映射,將相對低維的輸入向量映射到一個高維空間,然后在這個高維空間中構(gòu)造最優(yōu)分類面。最優(yōu)分類面要求分類面不但能將兩類正確分開,而且使分類間隔最大。使分類間隔最大是對泛化能力的控制,是SVM的核心思想之一。最優(yōu)分類面的構(gòu)造問題其實是在特定的約束條件下求解一個二次優(yōu)化問題,其最優(yōu)決策函數(shù)為式中,sgn(·)是符號函數(shù),L為訓(xùn)練樣本數(shù)目,ai≥0為Lagrange乘子,K(·)是核函數(shù)。
核函數(shù)一般形式定義為其中x和x′是低維空間里的向量,φ(x)和φ(x′)是變換后的高維空間里的向量??紤]到徑向基形式的核函數(shù)是局部性強的核函數(shù)且與人的視覺 特性類似,本方法選用徑向基核函數(shù)(也稱為RBF或高斯核函數(shù))來進(jìn)行訓(xùn)練。徑向基核函數(shù)表示為
LIBSVM是關(guān)于支持向量機在模式識別、回歸分析以及概率分布估計等各種領(lǐng)域里集成的軟件環(huán)境,主要包含svm-scale,svm-train,svm-predict等接口函數(shù)?;贚IBSVM的訓(xùn)練及識別過程包含以下步驟:
(1)字符經(jīng)過特征提取并降維處理后得到的30維特征矢量,將其轉(zhuǎn)化為svm-train和svm-predict要求的格式。為了計算方便以及防止某個特征過大或過小,可使用svm-scale將數(shù)據(jù)縮放到適當(dāng)范圍,一般范圍是[0,1]或[-1,1]。
(2)使用交叉校驗的方法重復(fù)訓(xùn)練測試樣本,尋找最佳參數(shù)。所謂交叉檢驗是將數(shù)據(jù)分為k個集合,每一個集合參加訓(xùn)練的同時其他k-1個集合參加測試,得到k組參數(shù)(C和ξ),對結(jié)果進(jìn)行比較,選其中結(jié)果最好的一組參數(shù)作為最佳參數(shù)。
(3)使用最佳參數(shù)和RBF核函數(shù)對訓(xùn)練集進(jìn)行訓(xùn)練獲取支持向量機模型。
(4)利用得到的模型進(jìn)行車牌字符識別。