專利名稱:基于流形學(xué)習(xí)的人臉識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種圖像處理技術(shù)領(lǐng)域的方法,具體是一種基于流形學(xué)習(xí)的人臉識(shí)別方法。
背景技術(shù):
隨著信息時(shí)代的到來,數(shù)據(jù)集較以往有了顯著的變化,其主要特點(diǎn)可以歸納為高數(shù)據(jù)量、高維數(shù)、高數(shù)據(jù)增長(zhǎng)率、非結(jié)構(gòu)化以及不能被人的感知單獨(dú)處理,一方面可以獲取的知識(shí)量更大了;另一方面仍面臨著艱巨的問題,即不能從數(shù)據(jù)中合理、有效地找到所需要的知識(shí)。很多問題的表示方法,使得信息十分稀疏,如何將信息稠密化是一個(gè)困難的問題。
經(jīng)對(duì)現(xiàn)有技術(shù)的文獻(xiàn)檢索發(fā)現(xiàn),M.Turk等人在《Journal of CognitiveNeuroscience》Vol.3,No.1,1991,71-86(認(rèn)知神經(jīng)科學(xué),第3卷,第1期,1991年,71-86頁)上,闡述了主分量分析方法,并將其應(yīng)用在人臉數(shù)據(jù)的降維上。主分量分析通過最大化總的離散度矩陣來尋找高維數(shù)據(jù)的低維表達(dá)。其在重建的意義上是最優(yōu)的。近年來的研究發(fā)現(xiàn),人臉圖像的變化可以由一些連續(xù)的變量來參數(shù)化,這些變量可以為姿勢(shì),光照,和表情,也就是說,人臉圖像屬于本質(zhì)上低維的子流形。傳統(tǒng)的降維方法比如主分量分析方法等不能夠發(fā)現(xiàn)高維人臉數(shù)據(jù)的本質(zhì)結(jié)構(gòu)。主分量分析處理的是數(shù)據(jù)的全局結(jié)構(gòu),沒有很好的利用數(shù)據(jù)的局部幾何信息。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,提出一種基于流形學(xué)習(xí)的人臉識(shí)別方法,使其采用局部保存的降維的方法識(shí)別人臉,以實(shí)現(xiàn)更好的人臉流形學(xué)習(xí),提高識(shí)別率。
本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明從數(shù)據(jù)的局部結(jié)構(gòu)出發(fā),提出保存人臉數(shù)據(jù)的局部類別關(guān)系;然后利用排列技術(shù),將每個(gè)點(diǎn)的局部最優(yōu)轉(zhuǎn)化為全局最優(yōu);通過對(duì)排列矩陣與原始訓(xùn)練樣本及其轉(zhuǎn)置的乘積進(jìn)行特征分解,得到數(shù)據(jù)由高維到低維的投影矩陣;通過該投影矩陣,將待識(shí)別的人臉圖像投影到低維空間;最后,在低維空間用最近鄰法分類完成人臉識(shí)別。
本發(fā)明具體步驟如下(1)將原始的人臉圖像行堆疊為一個(gè)M維長(zhǎng)向量,從而所有的數(shù)據(jù)構(gòu)成一個(gè)矩陣X,作為訓(xùn)練樣本。
(2)對(duì)于每一個(gè)人臉數(shù)據(jù)點(diǎn)xi,尋找到它的k個(gè)同類點(diǎn),組成一個(gè)局部。對(duì)于該數(shù)據(jù)點(diǎn)xi和它的k個(gè)同類點(diǎn),使它們?cè)诘途S空間的點(diǎn)對(duì)距離最小,并得到相應(yīng)的局部最優(yōu)化的表達(dá)。
(3)對(duì)于所有的人臉數(shù)據(jù)點(diǎn),都有步驟(2)所述的優(yōu)化,從而將每一個(gè)局部的優(yōu)化用排列技術(shù)疊加起來,得到排列矩陣L,從而得到全局意義上的優(yōu)化。
(4)將原始數(shù)據(jù)集X乘以排列矩陣L,再乘以原始數(shù)據(jù)集的轉(zhuǎn)置XT,從而得到XLXT。這實(shí)際上實(shí)現(xiàn)了優(yōu)化矩陣的構(gòu)建。對(duì)XLXT進(jìn)行特征分解,假設(shè)所求低維空間為d維,將求得的特征值由小到大排列取前d個(gè),其所對(duì)應(yīng)的d個(gè)特征向量則組成M×d投影矩陣A。
(5)對(duì)于每一個(gè)待識(shí)別的人臉數(shù)據(jù)xi,用投影矩陣A的轉(zhuǎn)置AT乘以xi,便得到其低維表達(dá)yi=ATxt,在低維空間里,用最近鄰方法對(duì)人臉數(shù)據(jù)進(jìn)行分類則完成了人臉識(shí)別。
所述的對(duì)于該數(shù)據(jù)點(diǎn)xi和它的k個(gè)同類點(diǎn),使它們?cè)诘途S空間的點(diǎn)對(duì)距離最小,是指設(shè)xi表示為xi0,xi1,L,xik表示xi的同類點(diǎn),設(shè)Yi=[yi0,yi1,L,yik]]]>為它們?cè)诘途S空間所對(duì)應(yīng)的點(diǎn)。為了得到忠實(shí)的映射,本發(fā)明期望近鄰的點(diǎn)仍然保持近鄰,也就是說,點(diǎn)yi0仍然靠近于yi1,L,yik。于是有這樣的優(yōu)化minΣj=1k||yi0-yij||2,]]>該公式的含義是最小化鄰域的點(diǎn)對(duì)距離。為了給出更清晰的表達(dá),將這種局部意義上的優(yōu)化轉(zhuǎn)化成這種形式min tr(YiLiYiT),其中Li被為局部的排列矩陣,tr(g)表示矩陣的跡。這樣,就完成了局部最優(yōu)化的表達(dá)。
所述的排列技術(shù),是指一種由局部?jī)?yōu)化疊加為全局優(yōu)化的技術(shù),本發(fā)明用一個(gè)迭代函數(shù)來實(shí)現(xiàn)L(Ii,Ii)←L(Ii,Ii)+Li,i=1,L,N。式中的Ii是一個(gè)索引函數(shù),它指示了每一個(gè)數(shù)據(jù)點(diǎn)xi和它的同類點(diǎn)的標(biāo)號(hào),Li是局部?jī)?yōu)化的表達(dá),N表示有N個(gè)數(shù)據(jù)點(diǎn)。這樣就可以的到最終的全局排列矩陣L,它代表了全局意義上的優(yōu)化。
所述的對(duì)XLXT進(jìn)行特征分解,是指最終的優(yōu)化問題轉(zhuǎn)化為對(duì)一個(gè)特征值問題的求解XLXTf=λf,上式中,f代表特征向量,λ代表特征值。將特征值由小到大排列,取前d個(gè),投影矩陣A由其所對(duì)應(yīng)的特征向量組成。
所述的最近鄰方法,是指把某一個(gè)待識(shí)別的人臉圖像歸類到離它最近的訓(xùn)練樣本所屬的類中。
與現(xiàn)有技術(shù)相比,本發(fā)明能夠探測(cè)嵌入在高維人臉數(shù)據(jù)中的低維流形結(jié)構(gòu),由此而能夠得到比較高的人臉識(shí)別率。實(shí)驗(yàn)證明,本發(fā)明在ORL數(shù)據(jù)庫(kù)上進(jìn)行人臉識(shí)別,識(shí)別率對(duì)于5個(gè)訓(xùn)練樣本的情況能達(dá)到97.42%,明顯高于主分量分析方法得到的識(shí)別率88.15%。
具體實(shí)施例方式
下面對(duì)本發(fā)明的實(shí)施例作詳細(xì)說明本實(shí)施例在以本發(fā)明技術(shù)方案為前提下進(jìn)行實(shí)施,給出了詳細(xì)的實(shí)施方式和具體的操作過程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。
實(shí)施例采用了一個(gè)公用的人臉數(shù)據(jù)庫(kù)ORL數(shù)據(jù)庫(kù)。ORL數(shù)據(jù)庫(kù)包含40個(gè)人,每個(gè)人10張圖像。每張圖的大小為40×40。首先將人臉圖像將其行堆疊為1600維長(zhǎng)向量,然后所有的數(shù)據(jù)組成一個(gè)1600×400矩陣X=[x1,L,x400]。對(duì)于每一人,隨機(jī)選擇5個(gè)樣本進(jìn)行訓(xùn)練,余下的用于識(shí)別。對(duì)于每一個(gè)給定的訓(xùn)練樣本數(shù),產(chǎn)生20組隨機(jī)的訓(xùn)練——識(shí)別樣本集,在此基礎(chǔ)上計(jì)算出平均識(shí)別率。本發(fā)明首先找到每一個(gè)數(shù)據(jù)點(diǎn)的4個(gè)同類點(diǎn),記為Xi=[xi0,xi1,L,xi4]]]>,并用Ii={i0,i1,L,i4}作為對(duì)它們的索引的記錄。然后,對(duì)于每一個(gè)點(diǎn)和它的鄰域點(diǎn),有這樣的優(yōu)化minΣj=14||yi0-yij||2]]>,它的意圖是讓這些點(diǎn)在低維空間仍然保持近鄰關(guān)系。隨后,局部?jī)?yōu)化轉(zhuǎn)化為這種形式min tr(YiLiYiT),這樣,局部的排列矩陣,就可以提取出來。按照這種方法,本發(fā)明可以得到200個(gè)局部?jī)?yōu)化,相應(yīng)的有200個(gè)局部排列矩陣。然后,本發(fā)明根據(jù)排列技術(shù),將這200個(gè)局部?jī)?yōu)化轉(zhuǎn)化為全局意義上的最優(yōu),依據(jù)這樣的迭代公式L(Ii,Ii)←L(Ii,Ii)+Li,i=1,L,200,其中,Ii即為前面所提到的每一個(gè)數(shù)據(jù)點(diǎn)和它近鄰點(diǎn)的索引,注意,本專利將L的初始值設(shè)為0。這樣,就完成了對(duì)排列矩陣的構(gòu)建。最終,優(yōu)化問題轉(zhuǎn)化為對(duì)一個(gè)特征值問題的求解XLXTf=λf,其中,L為求得的排列矩陣。上式的含義實(shí)際上就是對(duì)XLXT進(jìn)行特征分解。設(shè)α1,α2Λ,αd為求得的特征向量,其對(duì)應(yīng)于特征值λ1<λ2<Λ<λd。那么,投影矩陣A為A=(α1,α2Λ,αd)。接下來,本發(fā)明運(yùn)用投影矩陣A將待識(shí)別的人臉圖像投影到低維空間,然后與低維的訓(xùn)練人臉圖像比對(duì),將待識(shí)別的人臉圖像歸類到離它最近的訓(xùn)練樣本所屬的類中,即用最近鄰法分類。至此,本發(fā)明完成了人臉識(shí)別的全過程。
本發(fā)明對(duì)于ORL數(shù)據(jù)庫(kù)5個(gè)訓(xùn)練樣本的情況,識(shí)別率能達(dá)到97.42%,明顯高于主分量分析方法得到的識(shí)別率88.15%。
權(quán)利要求
1.一種基于流形學(xué)習(xí)的人臉識(shí)別方法,其特征在于,具體步驟如下(1)將原始的人臉圖像行堆疊為一個(gè)M維長(zhǎng)向量,從而所有的數(shù)據(jù)構(gòu)成一個(gè)矩陣X,作為訓(xùn)練樣本;(2)對(duì)于每一個(gè)人臉數(shù)據(jù)點(diǎn)xi,尋找到它的k個(gè)同類點(diǎn),組成一個(gè)局部,對(duì)于該數(shù)據(jù)點(diǎn)xi和它的k個(gè)同類點(diǎn),使它們?cè)诘途S空間的點(diǎn)對(duì)距離最小,并得到相應(yīng)的局部最優(yōu)化的表達(dá);(3)對(duì)于所有的人臉數(shù)據(jù)點(diǎn),都經(jīng)步驟(2)所述的優(yōu)化,從而將每一個(gè)局部的優(yōu)化用排列技術(shù)疊加起來,得到排列矩陣L,從而得到全局意義上的優(yōu)化;(4)將原始數(shù)據(jù)集X乘以排列矩陣L,再乘以原始數(shù)據(jù)集的轉(zhuǎn)置XT,從而得到XLXT,實(shí)現(xiàn)了優(yōu)化矩陣的構(gòu)建;(5)對(duì)XLXT進(jìn)行特征分解,假設(shè)所求低維空間為d維,將求得的特征值由小到大排列取前d個(gè),其所對(duì)應(yīng)的d個(gè)特征向量則組成M×d投影矩陣A;(6)對(duì)于每一個(gè)待識(shí)別的人臉數(shù)據(jù)xt,用投影矩陣A的轉(zhuǎn)置AT乘以xt,便得到其低維表達(dá)yt=ATxt,在低維空間里,用最近鄰方法對(duì)人臉數(shù)據(jù)進(jìn)行分類則完成了人臉識(shí)別。
2.根據(jù)權(quán)利要求1所的基于流形學(xué)習(xí)的人臉識(shí)別方法,其特征是,所述的對(duì)于該數(shù)據(jù)點(diǎn)xi和它的k個(gè)同類點(diǎn),使它們?cè)诘途S空間的點(diǎn)對(duì)距離最小,是指設(shè)xi表示為xi0,xi1,L,xik表示xi的同類點(diǎn),設(shè)Yi=[yi0,yi1,L,yik]]]>為它們?cè)诘途S空間所對(duì)應(yīng)的點(diǎn),對(duì)其進(jìn)行優(yōu)化 該公式的含義是最小化鄰域的點(diǎn)對(duì)距離。
3.根據(jù)權(quán)利要求1所述的基于流形學(xué)習(xí)的人臉識(shí)別方法,其特征是,所述局部最優(yōu)化的表達(dá),是指將 轉(zhuǎn)化成min tr(YiLiYiT),其中Li為局部的排列矩陣,tr(g)表示矩陣的跡。
4.根據(jù)權(quán)利要求1所述的基于流形學(xué)習(xí)的人臉識(shí)別方法,其特征是,所述的排列技術(shù),是指一種由局部?jī)?yōu)化疊加為全局優(yōu)化的技術(shù),用一個(gè)迭代函數(shù)來實(shí)現(xiàn)L(Ii,Ii)←L(Ii,Ii)+Li,i=1,L,N,式中的Ii是一個(gè)索引函數(shù),它指示了每一個(gè)數(shù)據(jù)點(diǎn)xi和它的同類點(diǎn)的標(biāo)號(hào),Li是局部?jī)?yōu)化的表達(dá),N表示有N個(gè)數(shù)據(jù)點(diǎn),這樣就得到最終的全局排列矩陣L,它代表了全局意義上的優(yōu)化。
5.根據(jù)權(quán)利要求1所述的基于流形學(xué)習(xí)的人臉識(shí)別方法,其特征是,所述的對(duì)XLXT進(jìn)行特征分解,是指最終的優(yōu)化問題轉(zhuǎn)化為對(duì)一個(gè)特征值問題的求解XLXTf=λf,上式中,f代表特征向量,λ代表特征值,將特征值由小到大排列,取前d個(gè),投影矩陣A由其所對(duì)應(yīng)的特征向量組成。
全文摘要
本發(fā)明涉及一種基于流形學(xué)習(xí)的人臉識(shí)別方法,從數(shù)據(jù)的局部結(jié)構(gòu)出發(fā),提出保存人臉數(shù)據(jù)的局部類別關(guān)系;然后利用排列技術(shù),將每個(gè)點(diǎn)的局部最優(yōu)轉(zhuǎn)化為全局最優(yōu);通過對(duì)排列矩陣與原始訓(xùn)練樣本及其轉(zhuǎn)置的乘積進(jìn)行特征分解,得到數(shù)據(jù)由高維到低維的投影矩陣;通過該投影矩陣,將待識(shí)別的人臉圖像投影到低維空間;最后,在低維空間用最近鄰法分類。本發(fā)明能夠探測(cè)嵌入在高維人臉數(shù)據(jù)中的低維流形結(jié)構(gòu),由此而能夠得到比較高的人臉識(shí)別率。實(shí)驗(yàn)證明,用本發(fā)明所提出的方法進(jìn)行人臉識(shí)別,其識(shí)別率明顯高于主分量分析方法得到的識(shí)別率。
文檔編號(hào)G06K9/00GK101079105SQ20071004197
公開日2007年11月28日 申請(qǐng)日期2007年6月14日 優(yōu)先權(quán)日2007年6月14日
發(fā)明者張?zhí)镪? 楊杰, 杜春華, 袁泉, 吳證 申請(qǐng)人:上海交通大學(xué)