本發(fā)明涉及一種基于核主成分分析的人臉識別方法,屬于生物識別領(lǐng)域。
背景技術(shù):
人臉識別是通過分析人類臉部視覺特征來達到身份鑒別目的的一種計算機技術(shù)。學術(shù)界對人臉識別給出了廣義和狹義兩方面的具體定義。廣義的人臉識別包括人臉檢測(facedetection)、人臉表征(facerepresentation)、人臉鑒別(faceidentification)、表情分析(faceexpressionanalysis)以及物理分類(physicalclassification)等一系列相關(guān)技術(shù);而狹義的人臉識別則被定義為一種技術(shù)或系統(tǒng),這一技術(shù)或系統(tǒng)能夠通過人臉的特征進行身份確認、身份比較和身份查找。
目前,由于人臉識別技術(shù)能夠通過生物體(一般特指人)本身的生物特征來區(qū)分個體,提高了生物體識別的精度,因此,該技術(shù)得到了廣泛關(guān)注和推崇,使該領(lǐng)域也成為了生物識別特征研究中的熱點。以人類為例,生物特征主要來自于以下方面:臉、視網(wǎng)膜、虹膜、手掌紋、指紋、語音、體形、習慣等,因而基于上述內(nèi)容,研究則被重點放在了識別人臉、視網(wǎng)膜、虹膜、手掌紋、指紋、語音、體形、鍵盤敲擊、簽字等相應(yīng)特征的計算機識別技術(shù)上,并取得了具有重要意義的成果。
人臉識別的優(yōu)勢在于其自然性和友好性的特點。所謂自然性,是指人類本身也是通過觀察和比較人類臉部特征來辨別和確認對方身份的,如語音識別、體形識別等也同樣具有自然性的特征,而人類或其他生物通常不通過指紋、虹膜等特征區(qū)別個體,因此上述特征識別就不具有自然性的特征。
所謂友好性,是指該識別方法不因特殊對待而增加被鑒別人的心理負擔,并且也因此而更容易獲取直接和真實的特征信息。指紋或者虹膜識別需要利用電子壓力傳感器或紅外線等特殊技術(shù)手段采集信息,上述特殊的采集技術(shù)易被人發(fā)現(xiàn),大大增加了被鑒別人躲避身份鑒別的可能性,降低了身份鑒別的效率。
然而,人臉識別卻可通過簡單的圖像或視頻技術(shù)直接獲取被鑒別人的人臉信息,這種信息采集方式不易于被人察覺,增加了信息的真實性和可靠性。
雖然人臉識別技術(shù)具有上述優(yōu)點,但該技術(shù)的實現(xiàn)卻并不容易。主要受人臉的生物特性所限制,具體表現(xiàn)在:
第一,由于同種類型的人臉的結(jié)構(gòu)都具有較高的相似性。該特點可以用于人臉定位,但是卻大大增加了利用人臉特征鑒別個體的難度。
第二,受年齡、情緒、溫度光照條件、遮蓋物等因素的限制,人臉的外形很不穩(wěn)定,甚至在不同觀察角度,人臉的圖像特征也存在顯著的差異,增加了人臉識別技術(shù)應(yīng)用的復雜性。
為使人臉識別技術(shù)更好的服務(wù)于所需領(lǐng)域,則需要對上述兩項限制進行研究尋求突破。
技術(shù)實現(xiàn)要素:
鑒于上述現(xiàn)有技術(shù)的不足之處,本發(fā)明的目的在于提供一種基于核主成分分析的人臉識別方法,包括:
步驟一、對給定的m個訓練集數(shù)據(jù)x[x1,x2,...,xm],計算核矩陣;
步驟二、構(gòu)造中心化矩陣h,求解特征方程;
步驟三、計算向量;
步驟四、提取主成分,形成特征子空間,并得到人臉數(shù)據(jù)主成分分析后保留的樣本數(shù)據(jù)集y;
步驟五、對于測試數(shù)據(jù)集x’,將其投影至訓練集的特征子空間中,得到特征提取后的測試數(shù)據(jù)集y’;
步驟六、通過最近鄰分類器,將樣本y’進行分類識別。
優(yōu)選的,上述步驟三計算向量kx=[k(x,x1),k(x,x2),...,k(x,xm)]t和
優(yōu)選的,上述步驟四為提取總貢獻率達到90%以上的前k個。
相比現(xiàn)有技術(shù),本發(fā)明提供的基于核主成分分析的人臉識別方法,能夠大幅縮短識別時間,通過運用核方法,巧妙的彌補了主成分分析法和線性判別分析法不能利用數(shù)據(jù)中非線性信息的缺憾。
具體實施方式
本發(fā)明提供一種基于核主成分分析的人臉識別方法,為使本發(fā)明的目的、技術(shù)方案及效果更加清楚、明確,以下舉實施例對本發(fā)明進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明提供的基于核主成分分析的人臉識別方法通過核方法,將樣本數(shù)據(jù)從低維空間映射到高維空間,使pca算法具有對于非線性數(shù)據(jù)的處理能力。
在主成分分析中,設(shè)xk∈rn,k=1,2,...,m,
后位于對角線上的元素。通常,沿對角線方向的前k個(較大的特征值)主成分包含了大部分具有信息價值的有用信息。主成分分析是對協(xié)方差矩陣c,求矩陣的特征值和特征向量:
其中特征值λ≠0,特征向量v∈rn\{0},
設(shè)原始空間rn中的數(shù)據(jù)xi通過非線性映射φ(x),在特征空間f中的像為(φxi),假設(shè)映射數(shù)據(jù)是零均值的,則特征空間f中數(shù)據(jù)矩陣φ(x)的協(xié)方差矩陣為:
由線性主成分分析理論可知,對映射數(shù)據(jù)矩陣φ(x)進行主成分分析等效于對其協(xié)方差矩陣c求解特征向量。令λ是c的特征值,矩陣v是特征向量矩陣,則
將每個映射樣本與式(4)做內(nèi)積,得
展開式(4),可得
結(jié)合以上分析,基于核主成分分析的人臉識別的方法具體如下:
(1)對給定的m個訓練集數(shù)據(jù)x[x1,x2,...,xm],計算核矩陣k,其中kij=(φ(xi)·φ(xj))。
(2)構(gòu)造中心化矩陣h,求解特征方程。
(3)計算向量kx=[k(x,x1),k(x,x2),...,k(x,xm)]t和
(4)提取總貢獻率達到90%以上的前k個主成分,形成特征子空間,并得到人臉數(shù)據(jù)主成分分析后保留的樣本數(shù)據(jù)集y。
(5)對于測試數(shù)據(jù)集x’,將其投影至訓練集的特征子空間中,得到特征提取后的測試數(shù)據(jù)集y’。
(6)通過最近鄰分類器,將樣本y’進行分類識別。
相比現(xiàn)有技術(shù),本發(fā)明提供的基于核主成分分析的人臉識別方法,能夠大幅縮短識別時間,通過運用核方法,巧妙的彌補了主成分分析法和線性判別分析法不能利用數(shù)據(jù)中非線性信息的缺憾。
可以理解的是,對本領(lǐng)域普通技術(shù)人員來說,可以根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,而所有這些改變或替換都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護范圍。