本發(fā)明涉及一種基于協(xié)作模糊均值鑒別分析的多姿態(tài)人臉識別方法,屬于圖像識別的技術(shù)領(lǐng)域。
背景技術(shù):
人臉識別是身份鑒別的一種重要方法,在檔案管理系統(tǒng)、安全驗證系統(tǒng)、信用卡驗證、公安系統(tǒng)的罪犯身份識別、銀行和海關(guān)的監(jiān)控、人機(jī)交互等領(lǐng)域有著廣泛的應(yīng)用前景。一般而言,人臉識別的步驟可以分為三個部分:一是從復(fù)雜的場景中檢測并分割出人臉;二是從找到的人臉圖像中提取出人臉特征;三是根據(jù)提取的人臉特征采用合適的算法匹配和識別出人臉。其中人臉圖像特征提取主要用于降低人臉圖像維數(shù),提取圖像中有效的鑒別信息,減少圖像中冗余信息、噪聲等對識別率的影響,從而提高識別精度與識別速度。
現(xiàn)有的人臉特征提取與識別方法有:(1)特征臉(eigenfaces),即基于主成分分析(pca)的人臉識別方法,記載于m.turk與a.pentland于1991年在journalofcognitiveneuroscience第3卷第1期71-86頁發(fā)表的《eigenfacesforrecognition》中,該方法旨在尋找一個投影方向,使得人臉樣本投影后總體散度最大,(2)費舍爾臉(fisherface),即基于線性鑒別分析(lda)的人臉識別方法,記載于p.n.belhumeur,j.p.hespanha,d.j.kriegman于1997年在ieeetransactionsonpatternanalysisandmachineintelligence第19卷第7期711-720頁發(fā)表的《eigenfacesvs.fisherfaces:recognitionusingclassspecificlinearprojection》,該方法利用樣本的類別信息,刻畫了樣本包含的鑒別結(jié)構(gòu),(3)拉普拉斯臉(laplacianface),即基于局部保持投影(lpp)的人臉識別方法,記載于x.he,s.yan,y.hu等人于2005年在ieeetransactionsonpatternanalysisandmachineintelligence第27卷第3期328-340頁發(fā)表的《facerecognitionusinglaplacianfaces》,該方法利用了樣本間的近鄰關(guān)系,旨在尋找一個投影方向,使得人臉樣本投影后局部結(jié)構(gòu)得到保持,(4)模糊費舍爾臉(fuzzyfisherface),該方法利用了樣本的類隸屬度關(guān)系,旨在尋找一個投影方向,使得樣本投影后模糊類內(nèi)散度最小同時模糊類間散度最大。fuzzyfisherface算法考慮了每個樣本對不同類的隸屬度,增強(qiáng)了算法在光照、遮擋、人臉姿態(tài)變化時的魯棒性。
以上特征提取算法中,pca沒有考慮樣本的鑒別結(jié)構(gòu),因此魯棒性較差,lda并沒有考慮樣本的類隸屬度,因此無法魯棒地處理多姿態(tài)問題,lpp盡管考慮了樣本的局部結(jié)構(gòu),但屬于無監(jiān)督方法,未考慮樣本的類別結(jié)構(gòu),fuzzyfisherface方法盡管考慮了樣本的類隸屬度,但在求解類隸屬度過程中,需預(yù)先設(shè)定近鄰參數(shù)k,并且基于歐氏距離度量選擇近鄰,因此受噪聲、野點影響較嚴(yán)重。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)的不足,提供一種基于協(xié)作模糊均值鑒別分析的多姿態(tài)人臉識別方法,解決現(xiàn)有方法無法同時考慮同類樣本的相似性及不同類樣本的差異性,當(dāng)樣本存在光照、姿態(tài)、表情多種變化時,無法對噪聲、野點的魯棒性進(jìn)行有效處理的問題,本發(fā)明基于協(xié)作表示的隸屬度計算方法,運(yùn)用獲得的每個樣本的隸屬度信息計算樣本的模糊類均值,滿足實際應(yīng)用中對多姿態(tài)人臉識別的高精度需求。
本發(fā)明具體采用以下技術(shù)方案解決上述技術(shù)問題:
基于協(xié)作模糊均值鑒別分析的多姿態(tài)人臉識別方法,包括如下步驟:
步驟1、獲取包括若干個不同類的多姿態(tài)人臉圖像訓(xùn)練樣本集,對訓(xùn)練樣本集中的每個訓(xùn)練樣本和待識別樣本均進(jìn)行歸一化并利用pca進(jìn)行降維;
步驟2、利用所得降維后訓(xùn)練樣本的協(xié)作表示系數(shù)計算每個訓(xùn)練樣本的類隸屬度;
步驟3、利用所得訓(xùn)練樣本的類隸屬度計算模糊類均值;
步驟4、根據(jù)訓(xùn)練樣本與模糊類均值之間的距離計算訓(xùn)練樣本的模糊類內(nèi)散度與模糊類間散度;
步驟5、通過最大化訓(xùn)練樣本的模糊類間散度與模糊類內(nèi)散度的比值求取投影矩陣,并利用投影矩陣提取訓(xùn)練樣本和待識別樣本的特征;
步驟6、根據(jù)最近鄰分類器判斷和確定待識別樣本的類標(biāo)。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述步驟2計算每個訓(xùn)練樣本的類隸屬度采用公式:
其中,uci表示訓(xùn)練樣本xi對于第c類的隸屬度,所述c=1,2,...,c,且c表示訓(xùn)練樣本集的類數(shù);li為訓(xùn)練樣本xi的類別標(biāo)簽,
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述步驟3計算模糊類均值采用公式:
其中,mfc表示第c類訓(xùn)練樣本的模糊類均值,所述c=1,2,...,c,且c表示訓(xùn)練樣本集的類數(shù);uci表示訓(xùn)練樣本xi對于第c類的隸屬度。
本發(fā)明采用上述技術(shù)方案,能產(chǎn)生如下技術(shù)效果:
本發(fā)明設(shè)計一種基于協(xié)作表示的隸屬度計算方法,運(yùn)用獲得的每個樣本的隸屬度信息計算樣本的模糊類均值,并構(gòu)造模糊類內(nèi)散度與類間散度,通過最大化模糊類間散度同時最小化模糊類內(nèi)散度獲得投影矩陣。運(yùn)用獲得的投影矩陣實現(xiàn)對待識別樣本的特征提取,并由分類準(zhǔn)則判斷待識別樣本的類標(biāo)。
因此,本發(fā)明充分利用了樣本的類別信息,考慮了同類樣本的相似性及不同類樣本的差異性,繼承了fuzzyfisherface方法的優(yōu)點,當(dāng)樣本存在光照、姿態(tài)、表情多種變化時,通過引入隸屬度信息增強(qiáng)了對噪聲、野點的魯棒性。但是相比于fuzzyfisherface及其他現(xiàn)有的方法,具有如下優(yōu)點:(1)避免預(yù)先設(shè)定近鄰參數(shù)k,(2)可以自適應(yīng)地獲得訓(xùn)練樣本的重構(gòu)系數(shù)以計算隸屬度,(3)協(xié)作表示系數(shù)本身就具備了對人臉光照、姿態(tài)、表情等變化的魯棒性,(4)受限于類間散布矩陣,fuzzyfisherface與模糊二維核主成分分析方法最多僅可獲取c-1個特征,而本發(fā)明所提方法可獲取特征數(shù)遠(yuǎn)遠(yuǎn)多于c-1個。因此,本發(fā)明可滿足實際應(yīng)用中對多姿態(tài)人臉識別的高精度需求。
附圖說明
圖1為本發(fā)明基于協(xié)作模糊均值鑒別分析的多姿態(tài)人臉識別方法的流程示意圖。
具體實施方式
下面結(jié)合說明書附圖對本發(fā)明的實施方式進(jìn)行描述。
如圖1所示,本發(fā)明設(shè)計了一種基于協(xié)作模糊均值鑒別分析的多姿態(tài)人臉識別方法,該方法具體包括如下步驟:
步驟1、獲取包括c個不同類的多姿態(tài)人臉圖像訓(xùn)練樣本集,對訓(xùn)練樣本集中的每個訓(xùn)練樣本和待識別樣本均進(jìn)行歸一化并利用pca進(jìn)行降維。
假設(shè)圖像的大小為w×h,訓(xùn)練樣本來自于訓(xùn)練樣本集的c個圖像類,將每幅人臉圖像進(jìn)行矩陣向量化操作,得到第i幅人臉圖像為xi∈rd,其中d=w×h。訓(xùn)練樣本集可表示為x=[x1,x2,...,xn],待識別樣本可表示為xtest,其中n表示人臉圖像訓(xùn)練樣本數(shù)。
對于訓(xùn)練樣本xi,進(jìn)行模為1的歸一化操作:
xi=xi/||xi||2,(i=1,2,...,n)
同樣,對于待識別樣本xtest,也需進(jìn)行歸一化操作:
xtest=xtest/||xtest||2
利用pca對歸一化后的樣本進(jìn)行預(yù)處理以降低數(shù)據(jù)維數(shù),為方便起見,仍用x=[x1,x2,...,xn]和xtest代表pca預(yù)處理后的訓(xùn)練樣本集和待識別樣本,則計算步驟為:
(1).令z=[x1-m,x2-m,…,xn-m],計算
(2).pca投影向量可表示為:
(3).令apca=[a1,a2,…,ad],則可得pca預(yù)處理后的數(shù)據(jù)為:
xi=apcatxi,其中,i=1,2,...,n;
xtest=apcatxtest
步驟2、利用所得降維后訓(xùn)練樣本的協(xié)作表示系數(shù)計算每個訓(xùn)練樣本的類隸屬度。
對于步驟1中獲得的每個訓(xùn)練樣本xi(i=1,2,...,n),可將其協(xié)作表示成訓(xùn)練集中其它樣本的線性組合,而組合系數(shù)可通過求解下列l(wèi)2范數(shù)問題獲得:
其中wi=[wi,1,...,wi,i-1,0,wi,i+1,...,wi,n]t∈rn表示xi的重構(gòu)系數(shù)向量,wij(i≠j)表示xj對重構(gòu)xi的貢獻(xiàn)度,wi可由下列計算式獲得:
其中xi=[x1,...,xi-1,0,xi+1,...,xn]t。
然后,由每個訓(xùn)練樣本的協(xié)作表示系數(shù)可得樣本的類隸屬度為:
其中uci表示訓(xùn)練樣本xi對于第c類的隸屬度,所述c=1,2,...,c,且c表示訓(xùn)練樣本集的類數(shù);li為訓(xùn)練樣本xi的類別標(biāo)簽,
步驟3、利用所得訓(xùn)練樣本的類隸屬度計算模糊類均值,采用如下公式:
其中,mfc表示第c類訓(xùn)練樣本的模糊類均值。
步驟4、根據(jù)訓(xùn)練樣本與模糊類均值之間的距離計算訓(xùn)練樣本的模糊類內(nèi)散度與模糊類間散度。
所述樣本的模糊類間散度計算為:
其中,
所述樣本的類內(nèi)模糊散度計算為:
其中,a是投影矩陣;
步驟5、通過最大化訓(xùn)練樣本的模糊類間散度與模糊類內(nèi)散度的比值求取投影矩陣,并利用投影矩陣提取訓(xùn)練樣本和待識別樣本的特征。
投影矩陣可通過求解以下最優(yōu)化問題獲得:
以上投影矩陣可通過求解以下特征方程d個最大特征值對應(yīng)的特征向量獲得:
sfba=λsfwa
其中λ是特征值,a是對應(yīng)的特征向量。
設(shè)a1,a2,...,ad是特征方程sfba=λsfwa的d個最大的特征值對應(yīng)的特征向量,則投影矩陣可表示為:a=[a1,a2,...,ad]。
利用投影矩陣可對訓(xùn)練樣本和待識別樣本進(jìn)行特征提取,如對于訓(xùn)練樣本集x=[x1,x2,...,xn],提取出的特征為:
y=[y1,y2,...,yn]=atx
對于某一待識別樣本xtest,提取出的特征為:
ytest=atxtest
步驟6、根據(jù)最近鄰分類器判斷和確定待識別樣本的類標(biāo)。
通過以下規(guī)則判別待識別樣本的類標(biāo):
如果||ytest-yk||=mini||ytest-yi||,則label(ytest)=label(yk)。
其中,ytest為待識別樣本,yk、yi分別表示第k個和第i個訓(xùn)練樣本所提取出的特征,即如根據(jù)第k個訓(xùn)練樣本離待識別樣本的距離,判斷待識別樣本類別應(yīng)和第k個訓(xùn)練樣本屬于同一類。
綜上,本發(fā)明的方法,充分利用了樣本的類別信息,考慮了同類樣本的相似性及不同類樣本的差異性,繼承了fuzzyfisherface方法的優(yōu)點,當(dāng)樣本存在光照、姿態(tài)、表情多種變化時,通過引入隸屬度信息增強(qiáng)了對噪聲、野點的魯棒性。
上面結(jié)合附圖對本發(fā)明的實施方式作了詳細(xì)說明,但是本發(fā)明并不限于上述實施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前提下做出各種變化。