本發(fā)明涉及模式識別領域,尤其涉及一種基于流形自適應核的人臉識別方法。
背景技術:
現(xiàn)有技術中通常采用基于全局特征或子空間的方法,將人臉區(qū)域看做一個整體,將人臉作為某種技術特征作為描述特征。中國專利《人臉識別方法及人臉識別系統(tǒng)》,公開號:CN101763507A,將人臉樣本圖像分為多個相互交疊且大小不一的子區(qū)域,所述人臉樣本圖像為經(jīng)過預處理的固定大小的人臉圖像;提取所述子區(qū)域的紋理特征;按照預置規(guī)則從所述紋理特征中選取有效的紋理特征,并獲取所述有效紋理特征的投影特征值;依據(jù)各子區(qū)域的投影特征值進行人臉識別。上述人臉識別過程中的數(shù)據(jù)處理算法,為非優(yōu)化方式,計算復雜度大,結果準確率不高。鑒于上述缺陷,本發(fā)明創(chuàng)作者經(jīng)過長時間的研究和實踐終于獲得了本創(chuàng)作。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種基于流形自適應核的人臉識別方法,用以克服上述技術缺陷。為實現(xiàn)上述目的,本發(fā)明提供一種基于流形自適應核的人臉識別方法,該具體過程為:步驟a,采用基于外形的表示方法將人臉圖像表示成向量形式,即X=[x1,x2,L,xn],其中xi表示第i幅人臉圖像;步驟b,計算圖拉普拉斯算子L;步驟c,計算非參數(shù)核矩陣K;步驟d,將上述所計算出的圖拉普拉斯算子L和非參數(shù)核矩陣K計算,即可得到與人臉數(shù)據(jù)緊密相關的流形自適應核函數(shù);步驟e,構建核NMF的優(yōu)化目標函數(shù),建立拉格朗日函數(shù),得到乘性更新規(guī)則;步驟f,用方法的低秩近似技術實現(xiàn)核NMF中的核矩陣計算過程;步驟g,計算出優(yōu)化的W和V,則對于一幅新的測試人臉圖像ztest,獲取經(jīng)過核NMF降維后的低維特征表示;步驟h,建立SVM的優(yōu)化目標函數(shù);計算出優(yōu)化解α,則SVM即可利用下式對人臉圖像進行分類和判決。進一步,在上述步驟b中,設G表示一個具有n個頂點的無向圖,其中i個頂點表示人臉圖像xi,對于每一個數(shù)據(jù)點xi,找到其p個最近鄰居點集N(xi);如果xi是xj的p-最近鄰居或者xj是xi的p-最近鄰居,則在他們之間構建一條邊,邊權重依據(jù)下式確定;則圖拉普拉斯算子L=D-W,其中D是一個對角矩陣,其值為Dii=∑jWij,Dii描述了數(shù)據(jù)點xi周圍的局部密度。進一步,在上述步驟c中,利用下式構建相似性矩陣E;于是,給定相似的成對約束集合S和不相似的成對約束集合D,構造一個相似性矩陣E來表示數(shù)據(jù)之間的成對約束,即:一個核項Ki,j應當盡可能地和邊信息Ei,j保持對齊,即:每個核項的對齊Ei,jKi,j應當最大化。進一步,在上述步驟c中,利用全局優(yōu)化算法對下式中的優(yōu)化問題進行求解來獲得優(yōu)化的非參數(shù)核矩陣K,其中,C是一個控制邊信息和正則化項之間折衷的正參數(shù),l(Ei,jKi,j)是一個經(jīng)驗損失函數(shù);是歸一化的圖拉普拉斯算子,其定義如下:一個非參數(shù)核矩陣K相對于n個數(shù)據(jù)可以表示為K=VTV>0,其中,V=[v1,L,vn]T是數(shù)據(jù)點X=[x1,L,xn]T的嵌入矩陣;因而,定義如下能夠描述嵌入vi和vj之間局部相關性的核矩陣正則化項:上述進行合并,獲取非參數(shù)核矩陣K。進一步,在上述步驟e中,將上述所計算出的圖拉普拉斯算子L和非參數(shù)核矩陣K代入下式,即可得到與人臉數(shù)據(jù)緊密相關的流形自適應核函數(shù);式中,K表示非參數(shù)核矩陣;步驟e,首先根據(jù)下式構建核NMF的優(yōu)化目標函數(shù),上式的約束條件是:W≥0,V≥0;式中,輸入數(shù)據(jù)矩陣X=[x1,L,xn]是一個m-維數(shù)據(jù)向量集合,則在非線性映射函數(shù)的作用下,在特征空間F中的影像數(shù)據(jù)相應地變成了進一步,在上述步驟e中,建立如下式所示的拉格朗日函數(shù),其中,α和β均為大于或等于零的拉格朗日系數(shù);令上式的偏導數(shù)分別為零,可得到如下式所示的乘性更新規(guī)則,其中的核函數(shù)是流形自適應核函數(shù);進一步,在上述步驟f中,令上述式中的乘性更新規(guī)則核矩陣K用下式來代替,利用方法的低秩近似技術實現(xiàn)核NMF中的核矩陣計算過程;K為正定核矩陣,Eij=k(xi,zj),Λk分別包含了W的特征向量和特征值且Wij=k(zi,zj)。進一步,在上述步驟g中,計算出優(yōu)化的W和V,則對于一幅新的測試人臉圖像ztest,其經(jīng)過核NMF降維后的低維特征表示是:其中,表示VT的偽逆矩陣。進一步,在上述步驟h中,根據(jù)下式建立SVM的優(yōu)化目標函數(shù);式中,是一個無需顯式知道具體形式的映射函數(shù),其計算方法可以通過核函數(shù)來實現(xiàn);〈w,x〉表示向量w和x之間的內(nèi)積,l(;)表示損失函數(shù)然后利用隨機梯度下降法來對SVM的優(yōu)化目標函數(shù)進行快速求解。進一步,在上述步驟h中,計算出優(yōu)化解α,則SVM即可利用下式對人臉圖像進行分類和判決:其中,k(xi,x)表示前面計算出的流形自適應核函數(shù)。與現(xiàn)有技術相比較本發(fā)明的有益效果在于:本發(fā)明流形自適應核NMF的人臉識別準確率優(yōu)于現(xiàn)有的算法,維數(shù)降維作為一種預處理算法,能夠有效地增強人臉識別算法的性能。NMF是一種基于部分的表示方法,而LDA和PCA都是基于全局的表示方法,因而NMF能夠很好地適應人臉是由眼睛、鼻子和嘴等部分構成的特點;作為一種非線性的維數(shù)降維算法,從而較好地克服了PCA、LDA和NMF作為線性算法無法有效地處理人臉圖像復雜非線性結構的不足。流形自適應核函數(shù)較好地利用了人臉圖像數(shù)據(jù)內(nèi)在的流形結構,流形自適應核函數(shù)取得了很好的識別性能;本發(fā)明用基于方法的低秩近似方法具有較小的時間復雜度;基于隨機梯度下降法的SVM運行時間少。具體實施方式以下,對本發(fā)明上述的和另外的技術特征和優(yōu)點作更詳細的說明。本發(fā)明基于流形自適應核的人臉識別方法的具體過程為:步驟a,采用基于外形的表示方法將人臉圖像表示成向量形式,即X=[x1,x2,L,xn],其中xi表示第i幅人臉圖像;步驟b,計算圖拉普拉斯算子L;設G表示一個具有n個頂點的無向圖,其中i個頂點表示人臉圖像xi,對于每一個數(shù)據(jù)點xi,找到其p個最近鄰居點集N(xi);如果xi是xj的p-最近鄰居或者xj是xi的p-最近鄰居,則在他們之間構建一條邊,邊權重依據(jù)式(1)確定;則圖拉普拉斯算子L=D-W,其中D是一個對角矩陣,其值為Dii=∑jWij,Dii描述了數(shù)據(jù)點xi周圍的局部密度。步驟c,計算非參數(shù)核矩陣K;步驟c1,利用式(2)構建相似性矩陣E;在人臉識別中,一些相似的成對約束集合S和一些不相似的成對約束集合D很容易獲得,這些信息通常又稱為“邊信息”。于是,給定集合S和D,構造一個相似性矩陣E來表示數(shù)據(jù)之間的成對約束,即:一個核項Ki,j應當盡可能地和邊信息Ei,j保持對齊,即:每個核項的對齊Ei,jKi,j應當最大化。步驟c2,利用全局優(yōu)化算法對式(3)中的優(yōu)化問題進行求解來獲得優(yōu)化的非參數(shù)核矩陣K。其中,C是一個控制邊信息和正則化項之間折衷的正參數(shù),l(Ei,jKi,j)是一個經(jīng)驗損失函數(shù);是歸一化的圖拉普拉斯算子,其定義如下:一個非參數(shù)核矩陣K相對于n個數(shù)據(jù)可以表示為K=VTV>0,其中,V=[v1,L,vn]T是數(shù)據(jù)點X=[x1,L,xn]T的嵌入矩陣;因而,定義如下能夠描述嵌入vi和vj之間局部相關性的核矩陣正則化項:步驟d,將上述所計算出的圖拉普拉斯算子L和非參數(shù)核矩陣K代入式(6),即可得到與人臉數(shù)據(jù)緊密相關的流形自適應核函數(shù);式中,K表示非參數(shù)核矩陣;步驟e,首先根據(jù)式(7)構建核NMF的優(yōu)化目標函數(shù),上式的約束條件是:W≥0,V≥0;式中,輸入數(shù)據(jù)矩陣X=[x1,L,xn]是一個m-維數(shù)據(jù)向量集合,則在非線性映射函數(shù)的作用下,在特征空間F中的影像數(shù)據(jù)相應地變成了建立如式(8)所示的拉格朗日函數(shù),其中,α和β均為大于或等于零的拉格朗日系數(shù)。令上式(8)的偏導數(shù)分別為零,可得到如(9)和(10)所示的乘性更新規(guī)則,其中的核函數(shù)是流形自適應核函數(shù)。步驟f,令上述式(9)和(10)中的核矩陣K用(11)來代替,以便利用方法的低秩近似技術來高效地實現(xiàn)核NMF中的核矩陣計算過程;K為正定核矩陣,Eij=k(xi,zj),Λk分別包含了W的特征向量和特征值且Wij=k(zi,zj)。步驟g,計算出優(yōu)化的W和V,則對于一幅新的測試人臉圖像ztest,其經(jīng)過核NMF降維后的低維特征表示是其中,表示VT的偽逆矩陣。步驟h,根據(jù)式(13)建立SVM的優(yōu)化目標函數(shù);式中,是一個無需顯式知道具體形式的映射函數(shù),其計算方法可以通過核函數(shù)來實現(xiàn);〈w,x〉表示向量w和x之間的內(nèi)積,l(;)表示損失函數(shù)然后利用隨機梯度下降法來對SVM的優(yōu)化目標函數(shù)進行快速求解;計算出優(yōu)化解α,則SVM即可利用下式對人臉圖像進行分類和判決:其中,k(xi,x)表示前面計算出的流形自適應核函數(shù)。上述算法的計算復雜度分析:假設原始人臉圖像的維數(shù)為h,則構造p-最近鄰居和計算圖拉普拉斯算子所需的時間復雜度為O((h+k)n2);利用內(nèi)點法求解非參數(shù)核矩陣K的計算復雜度為O(n6.5);計算流形自適應核函數(shù)的計算復雜度為O(n3);利用融合方法計算核矩陣的低秩近似所需要的計算復雜度為O(m2n),其中m表示核矩陣的秩;訓練SVM所需要的時間復雜度為O(d/λε)。因此本發(fā)明基于流形自適應核NMF的人臉識別算法總的時間復雜度為O((h+k)n2)+O(n6.5)+O(n3)+O(m2n)+O(d/λε)??梢娪嬎懔孔畲蟮牟糠衷谟谟嬎愠跏挤菂?shù)核函數(shù)K,為了避免他影響整個人臉識別算法的計算性能。該算法的優(yōu)點在于:為了獲得準確率ε所需要的迭代次數(shù)僅為O(1/λε),且所需要的總運算時間為O(d/λε),其中d是每個樣本數(shù)據(jù)中最大非零特征數(shù)。因此該算法的最大優(yōu)勢在于運行時間與樣本數(shù)據(jù)集的大小無關,所以特別適合于大規(guī)模數(shù)據(jù)集的求解。下面通過實驗對上述過程進行說明:實驗中采用了三個著名的人臉測試數(shù)據(jù)庫:Yale、ORL和CMUPIE。首先對人臉數(shù)據(jù)進行了如下預處理:首先對人臉圖像進行定位,然后根據(jù)人眼的位置對人臉圖像進行手工對齊、剪切,最后將人臉圖像統(tǒng)一縮放到分辨率為32×32,其中每個像素的灰度為256;于是每個人臉圖像可被表示成圖像空間中的1024維向量。人臉識別實驗過程如下:首先采用不同的維數(shù)降維算法來獲得人臉子空間;然后將人臉圖像投影到這些人臉子空間上;最后利用最近鄰分類算法來對待測試的人臉圖像進行分類判決,其中的距離度量采用的是歐氏距離。Yale人臉數(shù)據(jù)庫是由耶魯大學的計算機視覺和控制中心建立的人臉測試數(shù)據(jù)庫,該數(shù)據(jù)庫是由15個人的165幅灰度人臉圖像構成的,其中每個人由11幅人臉圖像組成。這些人臉圖像在光照條件、人臉表情(正常、高興、悲哀、睡覺、驚奇和眨眼)方面各不相同。在實驗中,隨機選擇每個人中的l(=2,3,4,5)幅人臉圖像來構成訓練集,而將每個人中剩余的其他圖像作為訓練集。0RL人臉數(shù)據(jù)庫是由40個人的400幅灰度人臉圖像構成的,其中每個人由10幅人臉圖像組成。這些人臉圖像是在不同的時間被拍照的,且在表情(睜開或閉上眼睛,微笑或者不微笑)和人臉細節(jié)(戴眼鏡或不戴眼鏡)方面各不相同。這些圖像在拍照時允許有最大20度的傾斜或旋轉。在實驗中,隨機選擇每個人中的l(=2,3,4,5)幅人臉圖像來構成訓練集,而將每個人中剩余的其他圖像作為訓練集。CMUPIE人臉數(shù)據(jù)庫包含了68個人的大約總共41368幅人臉圖像,這些人臉圖像是由13部同步照相機和21個閃光燈在不同的姿勢、不同的光照條件和不同的人臉表情條件下拍照的。在本次實驗中,選擇了5個前部姿勢(C05、C07、C09、C27、C29)并采用了在不同光照和表情下的所有人臉圖像,即:每個人中的170幅人臉圖像作為實際測試數(shù)據(jù)來源。圖在實驗中,我們隨機選擇每個人中的l(=5,10,20,30)幅人臉圖像來構成訓練集,而將每個人中剩余的其他圖像作為訓練集。表1在Yale人臉數(shù)據(jù)庫上的識別準確率及所對應的優(yōu)化維數(shù)算法2幅圖像3幅圖像4幅圖像5幅圖像NN45.3%50.1%53.1%54.6%PCA45.8%(29)50.2%(44)53.3%(58)54.8%(71)LDA46.5%(9)64.7%(13)72.9%(14)78.1%(14)NMF51.2%(30)66.5%(50)74.6%(70)80.4%(75)MAKNMF56.5%(20)71.4%(40)78.1%(50)82.6%(50)表2在ORL人臉數(shù)據(jù)庫上的識別準確率及所對應的優(yōu)化維數(shù)算法2幅圖像3幅圖像4幅圖像5幅圖像NN66.5%75.6%82.3%86.1%PCA66.7%(78)75.7%(119)82.5%(160)86.7%(180)LDA71.3%(22)75.9%(39)89.8%(39)92.5%(39)NMF77.2%(40)87.3%(42)91.6%(43)94.8%(45)MAKNMF80.3%(43)90.5%(45)94.8%(50)96.7%(60)表3在CMUPIE人臉數(shù)據(jù)庫上的識別準確率及所對應的優(yōu)化維數(shù)算法5幅圖像10幅圖像20幅圖像30幅圖像NN31.4%44.7%61.9%72.6%PCA31.6%(300)45.1%(600)70.8%(800)73.4%(900)LDA68.9%(67)77.8%(67)84.7%(67)92.4%(67)NMF70.1%(70)79.5%(75)85.8%(80)93.7%(90)MAKNMF79.3%(80)87.6%(90)90.2%(95)94.3%(100)在實際人臉識別測試中,對于一個給定l幅圖像,為了減少隨機偏差的影響,我們進行30次隨機劃分,并利用這30次運行的平均結果作為最終實驗結果。一般來說,所以維數(shù)降維算法的性能隨約簡后的維數(shù)變化。因此,在試驗中我們報告每個算法的最好識別準確率及所對應的降維后的維數(shù)。另外,對于基準測試算法,采用直接在原始的1024維人臉圖像空間利最近鄰用分類器(NN)進行識別,以此來說明維數(shù)降維算法的優(yōu)越性。表1給出了各種維數(shù)降維算法在Yale人臉數(shù)據(jù)庫上的識別準確率及所對應的優(yōu)化維數(shù);表2給出了各種維數(shù)降維算法在ORL人臉數(shù)據(jù)庫上的識別準確率及所對應的優(yōu)化維數(shù);表3給出了各種維數(shù)降維算法在CMUPIE人臉數(shù)據(jù)庫上的識別準確率及所對應的優(yōu)化維數(shù)。從上述實驗結果可以得出如下結論:1)本發(fā)明流形自適應核NMF(MAKNMF)的人臉識別準確率在所測試的三個人臉數(shù)據(jù)庫上均好于基準測試算法(NN)、PCA、LDA和NMF算法。2)LDA的識別準確率要優(yōu)于PCA,主要原因在于:PCA是一種無監(jiān)督的學習算法,他在維數(shù)降維的過程沒有利用寶貴的鑒別信息;而LDA是一種有監(jiān)督的學習算法,他能夠在維數(shù)降維的過程中利用鑒別信息將相同類別數(shù)據(jù)相互聚集在一起的同時將不同類別的數(shù)據(jù)相互分離開來。3)NMF算法的識別準確率要好于LDA和PCA,主要原因在于:NMF是一種基于部分的表示方法,而LDA和PCA都是基于全局的表示方法,因而NMF能夠很好地適應人臉是由眼晴、鼻子和嘴等部分構成的特點。另外NMF在維數(shù)降維的過程中通過施加非負性條件約束,從而使得分解后的子矩陣具有較好的稀疏性;而經(jīng)PCA和LDA降維后的矩陣無法確保其非負性,而負數(shù)在人臉圖像表示中是沒有明確可解釋的物理意義的。因而PCA和LDA取得了低于NMF的識別準確率。4)流形自適應核NMF(MAKNMF)的識別準確率優(yōu)于PCA、LDA和NMF的原因在于:MAKNMF作為一種非線性的維數(shù)降維算法,從而較好地克服了PCA、LDA和NMF作為線性算法無法有效地處理人臉圖像復雜非線性結構的不足。另外,PCA、LDA和NMF僅能發(fā)現(xiàn)全局的歐氏結構,而無法有效地發(fā)現(xiàn)隱藏在高維人臉圖像中的內(nèi)在流形結構,許多研究表明:流形結構的發(fā)現(xiàn)有助于增強算法的鑒別性能。MAKNMF通過采用流形自適應核函數(shù),他不僅能夠有效地發(fā)現(xiàn)高維人臉圖像中內(nèi)在的流形結構,而且能夠使所設計的核函數(shù)很好地與人臉圖像數(shù)據(jù)緊密相關,具有很好地數(shù)據(jù)自適應性,因而很好地增強了MAKNMF算法的鑒別性能。5)MAKNMF、NMF、LDA和PCA算法的識別準確率都優(yōu)于基準測試算法(NN)的識別準確率,這說明:維數(shù)降維作為一種預處理算法,能夠有效地增強人臉識別算法的性能。為了測試不同核函數(shù)對核NMF的識別性能影響,在三個人臉數(shù)據(jù)庫上對常用的高斯核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)及我們提出的流形自適應核函數(shù)對核NMF的性能影響進行了測試,其中高斯核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)中的參數(shù)利用十字交叉驗證法設置為最優(yōu)值。從實驗結果可以看出:流形自適應函數(shù)要明顯優(yōu)于常用的高斯核函數(shù)、多項式核函數(shù)和徑向基核函數(shù)。主要原因在于:這些常用的高斯核函數(shù)、多項式核函數(shù)和徑向基核函數(shù)都是通用的與具體數(shù)據(jù)無關的核函數(shù),因此他們無法和具體的人臉圖像數(shù)據(jù)保持一致性。流形自適應核函數(shù)較好地利用了人臉圖像數(shù)據(jù)內(nèi)在的流形結構,流形自適應核函數(shù)取得了很好的識別性能。為了測試基于方法的低秩近似方法能夠有效地提高核NMF的計算效率,表4給出了采用方法和直接在原始核矩陣上操作所耗費的時間比較。從中可以明顯看出:方法的運行時間要遠遠小于直接對原始矩陣操作的運行時間,即:采用基于方法的低秩近似方法具有較小的時間復雜度。表4采用方法和直接在原始核矩陣上操作所耗費的時間最后,對基于隨機梯度下降法是否能夠有效地提高SVM分類器的計算效率進行了測試。表5給出了常用的SVM訓練方法和隨機梯度下降法的運行時間比較。從中可以看出:基于隨機梯度下降法的SVM運行時間要明顯小于內(nèi)點法、分解法和割平面法。主要原因在于:隨機梯度下降法的運行時間與樣本數(shù)據(jù)集的大小無關,所以能夠在大規(guī)模數(shù)據(jù)人臉圖像數(shù)據(jù)集上能夠取得較小的運行時間。表5在三個人臉數(shù)據(jù)庫上的SVM訓練時間比較算法YaleORLCMUPIE內(nèi)點法158.7秒263.4秒2134.9秒分解法103.5秒147.2秒1158.4秒割平面法49.8秒71.6秒570.1秒隨機梯度下降法12.6秒19.3秒38.5秒以上所述僅為本發(fā)明的較佳實施例,對發(fā)明而言僅僅是說明性的,而非限制性的。本專業(yè)技術人員理解,在發(fā)明權利要求所限定的精神和范圍內(nèi)可對其進行許多改變,修改,甚至等效,但都將落入本發(fā)明的保護范圍內(nèi)。