本發(fā)明涉及一種模式識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于局部保持非負(fù)矩陣分解(LPNMF)的增量學(xué)習(xí)人臉識(shí)別方法。
背景技術(shù):近二十年來,人臉識(shí)別技術(shù)作為一種高效的生物特征識(shí)別技術(shù),日益受到學(xué)術(shù)界以及工業(yè)界的重視。人臉識(shí)別研究的關(guān)鍵是特征提取,有基于全局特征的提取,也有基于局部特征的提取。特征臉方法也稱為主元分析法(PCA),是一種基于全局特征提取的人臉識(shí)別方法。PCA將主成分提取出來,減少了樣本間的冗余信息,達(dá)到了降維的目的。然而,特征臉方法有幾個(gè)缺點(diǎn):a)如何選取主元仍然是個(gè)問題;b)當(dāng)訓(xùn)練樣本線性不可分時(shí),特征臉方法的識(shí)別率很低;c)基于全局特征的PCA無法提取到局部特征。非負(fù)矩陣分解(NMF)是在矩陣元素均為非負(fù)數(shù)的約束條件下的一種矩陣分解方法。NMF是一種局部特征提取方法,其將人臉表示成基圖像的線性組合,而基圖像代表了眼、鼻子、嘴等人臉的局部特征,符合人類思維局部構(gòu)成整體的概念。這種方法最早由Lee等人提出并成功應(yīng)用于基于物體局部特征的識(shí)別,之后研究人員對(duì)NMF方法進(jìn)行了更深入的研究。研究者們提出了幾種改進(jìn)算法如局部非負(fù)矩陣分解(LNMF)、Fisher非負(fù)矩陣分解(FNMF)、稀疏非負(fù)矩陣分解(SNMF)、加權(quán)非負(fù)矩陣分解(WNMF)等,這些方法能在一定程度上提高識(shí)別率,但在迭代得到基矩陣時(shí)需要更大的計(jì)算量。目前基于NMF的所有算法大多存在兩方面的缺點(diǎn),即分解速度慢以及對(duì)訓(xùn)練樣本或類別的增加都必須重復(fù)學(xué)習(xí),這大大限制了NMF在實(shí)際中的應(yīng)用。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于:為了克服已有技術(shù)的不足,提出了一種基于局部保持非負(fù)矩陣分解的增量學(xué)習(xí)人臉識(shí)別方法,該方法保持了樣本空間的局部結(jié)構(gòu),明顯提高了算法效率,更好地應(yīng)用于人臉識(shí)別的在線學(xué)習(xí)。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:一種基于局部保持非負(fù)矩陣分解的增量學(xué)習(xí)人臉識(shí)別方法,包括以下步驟:a)人臉圖像的預(yù)處理:將每張人臉圖像規(guī)范化成一個(gè)同一規(guī)格的樣本;b)初始樣本訓(xùn)練:運(yùn)用LPNMF算法計(jì)算初始樣本的基矩陣W和系數(shù)矩陣H;c)增量學(xué)習(xí):對(duì)新來樣本運(yùn)用增量的LPNMF算法更新基矩陣和系數(shù)矩陣d)人臉識(shí)別:采用最近鄰分類器進(jìn)行識(shí)別檢測。具體來講,在本發(fā)明的人臉識(shí)別方法中,所述增量學(xué)習(xí)過程具體包括下述步驟:a1對(duì)于新來的樣本已給出初始樣本訓(xùn)練矩陣V=[v1,v2,…,vn],確定更新樣本矩陣為a2初始化基矩陣和隨機(jī)初始化系數(shù)矩陣a3設(shè)定最大迭代次數(shù)t,相互迭代更新和使得a4步驟a3中的按如下迭代規(guī)則更新:其中α和β是權(quán)重系數(shù),α代表初始樣本的比重,β代表新來樣本的比重取β=1-α;a5步驟a3中的不更新前n個(gè)樣本所對(duì)應(yīng)的的系數(shù)矩陣H,只更新新來樣本所對(duì)應(yīng)的的更新迭代規(guī)則如下:其中和gt是第一個(gè)非負(fù)整數(shù)滿足如下公式:+12<H~t+1-H~t,▿2fW~(H~t)>≤0]]>其中0<σ<1和符號(hào)<.,.>代表兩個(gè)矩陣的點(diǎn)積;a6步驟a5中計(jì)算如下:上式中得采用塊優(yōu)化策略計(jì)算,初始化更新規(guī)則如下:其中i從1取到N。N代表樣本分塊的總數(shù),為第i塊的拉普拉斯算子。Si定義為:其中代表第i塊索引集。本發(fā)明的技術(shù)構(gòu)思:本發(fā)明是對(duì)最近由鄭建煒等提出的一種新的降維分析方法,稱為增量的局部保持非負(fù)矩陣分解(incrementallocalitypreservingnonnegativematrixfactorization,ILPNMF)進(jìn)行改進(jìn)的。LPNMF是在Lee等提出的非負(fù)矩陣分解(nonnegativematrixfactorization,NMF)的基礎(chǔ)上引入局部保持投影(localitypreservingprojections,LPP)算法進(jìn)行改進(jìn)。改進(jìn)算法有效地保持了樣本空間的局部結(jié)構(gòu),但應(yīng)對(duì)在線學(xué)習(xí)相關(guān)應(yīng)用存在計(jì)算冗余問題。本發(fā)明利用增量學(xué)習(xí)的思想提出一種基于局部保持非負(fù)矩陣分解的增量學(xué)習(xí)人臉識(shí)別方法,很好地克服了LPNMF的缺陷。本發(fā)明具有以下優(yōu)點(diǎn):1、有效地保持了樣本空間的局部結(jié)構(gòu),使算法具有較高的識(shí)別準(zhǔn)確率;2、實(shí)現(xiàn)了增量學(xué)習(xí),在識(shí)別過程中能夠充分利用已接觸的信息,對(duì)識(shí)別結(jié)果進(jìn)行改進(jìn);3、在進(jìn)行增量學(xué)習(xí)時(shí)能夠充分利用原有的計(jì)算結(jié)果,避免了重復(fù)計(jì)算,提高了時(shí)間效率;4、在進(jìn)行增量學(xué)習(xí)時(shí)大大節(jié)約了存儲(chǔ)空間。附圖說明圖1是本發(fā)明的ILPNMF和LPNMF在ORL人臉庫識(shí)別率比較圖;圖2是本發(fā)明的ILPNMF和LPNMF在ORL人臉庫訓(xùn)練時(shí)間比較圖;圖3是本發(fā)明的ILPNMF和LPNMF在COIL人臉庫識(shí)別率比較圖;圖4是本發(fā)明的ILPNMF和LPNMF在COIL人臉庫訓(xùn)練時(shí)間比較圖;圖5是本發(fā)明的流程圖。具體實(shí)施方式下面對(duì)本發(fā)明作進(jìn)一步描述。參照附圖:一種基于局部保持非負(fù)矩陣分解的增量學(xué)習(xí)人臉識(shí)別方法,包括以下步驟:a)人臉圖像的預(yù)處理:將每張人臉圖像規(guī)范化成一個(gè)同一規(guī)格的樣本;b)初始樣本訓(xùn)練:運(yùn)用LPNMF算法計(jì)算初始樣本的基矩陣W和系數(shù)矩陣H:1)將每個(gè)樣本vi構(gòu)造成初始樣本訓(xùn)練矩陣V=[v1,v2,…,vn];2)設(shè)定最大迭代次數(shù)t,相互迭代更新W和H,使得WH≈V;3)步驟2中W和H按如下規(guī)則更新:其中和gt是第一個(gè)非負(fù)整數(shù)滿足如下公式:+12<Ht+1-Ht,▿2fW(Ht)>≤0]]>其中0<σ<1和符號(hào)<.,.>代表兩個(gè)矩陣的點(diǎn)積,c)增量學(xué)習(xí):對(duì)新來樣本運(yùn)用增量的LPNMF算法更新基矩陣和系數(shù)矩陣1)對(duì)于新來的人臉圖像樣本已給出初始樣本訓(xùn)練矩陣V=[v1,v2,…,vn],確定更新樣本矩陣為2)初始化基矩陣和隨機(jī)初始化系數(shù)矩陣3)設(shè)定最大迭代次數(shù)t,相互迭代更新和使得4)步驟3中的按如下迭代規(guī)則更新:其中α和β是權(quán)重系數(shù),α代表初始樣本的比重,β代表新來樣本的比重,取β=1-α;5)步驟3中的不更新前n個(gè)樣本所對(duì)應(yīng)的的系數(shù)矩陣H,只更新新來樣本所對(duì)應(yīng)的的更新迭代規(guī)則如下:其中和gt是第一個(gè)非負(fù)整數(shù)滿足如下公式:+12<H~t+1-H~t,▿2fW~(H~t)>≤0]]>其中0<σ<1和符號(hào)<.,.>代表兩個(gè)矩陣的點(diǎn)積;6)步驟5中計(jì)算如下:上式中得采用塊優(yōu)化策略計(jì)算,初始化更新規(guī)則如下:其中i從1取到N。N代表樣本分塊的總數(shù),為第i塊的拉普拉斯算子。Si定義為:其中代表第i塊索引集;d)人臉識(shí)別:采用最近鄰分類器進(jìn)行識(shí)別檢測。采用ORL和COIL兩個(gè)經(jīng)典的人臉數(shù)據(jù)庫進(jìn)行識(shí)別率和效率上的檢測。首先選擇本發(fā)明的增量的LPNMF算法和普通的增量的NMF算法做性能上的比較。在ORL人臉數(shù)據(jù)庫上,我們隨機(jī)選擇每個(gè)人的5張圖像作為訓(xùn)練,剩下的用于測試。在COIL人臉數(shù)據(jù)庫上,我們隨機(jī)選擇每個(gè)對(duì)象的10個(gè)樣品作為訓(xùn)練,剩下的隨機(jī)10個(gè)樣品用于測試。表1和表2分別給出了不同降維維度和比重系數(shù)下兩種算法在ORL數(shù)據(jù)庫和COIL數(shù)據(jù)庫上的識(shí)別率比較,其中r表示降維維度和β表示比重系數(shù)。由表可知,增量的NMF和增量的LPNMF在ORL數(shù)據(jù)庫上的最佳識(shí)別率分別是87.03%和91.35%。同樣增量的NMF和增量的LPNMF在COIL數(shù)據(jù)庫上的最佳識(shí)別率分別是87.57%和92.67%。結(jié)果表明,本發(fā)明的增量的LPNMF算法比普通的增量的NMF有較高的識(shí)別率,更好地保持了空間的局部結(jié)構(gòu)。然后選擇本發(fā)明的增量的LPNMF算法和原先的LPNMF算法在識(shí)別率和時(shí)耗上做比較。在ORL數(shù)據(jù)庫上,先隨機(jī)選擇每個(gè)人的3張圖像運(yùn)用LPNMF算法做初始訓(xùn)練,然后每次每個(gè)人添加1張圖像作為增量學(xué)習(xí)。實(shí)驗(yàn)結(jié)果如圖1、圖2。結(jié)果表明,增量的LPNMF算法識(shí)別率與原先的LPNMF算法接近,而時(shí)耗上遠(yuǎn)低于LPNMF算法。在COIL數(shù)據(jù)庫上,最初隨機(jī)選擇每個(gè)對(duì)象的5個(gè)樣本進(jìn)行初始訓(xùn)練,然后每次每個(gè)對(duì)象插入5個(gè)樣本作為增量學(xué)習(xí)。實(shí)驗(yàn)結(jié)果如圖3、圖4。結(jié)果表明,增量的LPNMF算法在識(shí)別率上稍微低于LPNMF算法但計(jì)算量遠(yuǎn)小于LPNMF算法。LPNMF算法訓(xùn)練30個(gè)樣品需要5分鐘,而增量的LPNMF算法只需要19秒。因此,增量的LPNMF算法在效率上得到了很大的提高。表1不同降維維度和比重系數(shù)下INMF和ILPNMF在ORL數(shù)據(jù)庫上的識(shí)別率比較表2不同降維維度和比重系數(shù)下INMF和ILPNMF在COIL數(shù)據(jù)庫上的識(shí)別率比較