基于流形學(xué)習(xí)的人臉識(shí)別方法

文檔序號(hào)：6441593閱讀：984來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：基于流形學(xué)習(xí)的人臉識(shí)別方法
技術(shù)領(lǐng)域：
本發(fā)明涉及的是一種圖像處理技術(shù)領(lǐng)域的方法，具體是一種基于流形學(xué)習(xí)的人臉識(shí)別方法。
背景技術(shù)：
隨著信息時(shí)代的到來，數(shù)據(jù)集較以往有了顯著的變化，其主要特點(diǎn)可以歸納為高數(shù)據(jù)量、高維數(shù)、高數(shù)據(jù)增長(zhǎng)率、非結(jié)構(gòu)化以及不能被人的感知單獨(dú)處理，一方面可以獲取的知識(shí)量更大了；另一方面仍面臨著艱巨的問題，即不能從數(shù)據(jù)中合理、有效地找到所需要的知識(shí)。很多問題的表示方法，使得信息十分稀疏，如何將信息稠密化是一個(gè)困難的問題。
經(jīng)對(duì)現(xiàn)有技術(shù)的文獻(xiàn)檢索發(fā)現(xiàn)，M.Turk等人在《Journal of CognitiveNeuroscience》Vol.3，No.1，1991，71-86(認(rèn)知神經(jīng)科學(xué)，第3卷，第1期，1991年，71-86頁)上，闡述了主分量分析方法，并將其應(yīng)用在人臉數(shù)據(jù)的降維上。主分量分析通過最大化總的離散度矩陣來尋找高維數(shù)據(jù)的低維表達(dá)。其在重建的意義上是最優(yōu)的。近年來的研究發(fā)現(xiàn)，人臉圖像的變化可以由一些連續(xù)的變量來參數(shù)化，這些變量可以為姿勢(shì)，光照，和表情，也就是說，人臉圖像屬于本質(zhì)上低維的子流形。傳統(tǒng)的降維方法比如主分量分析方法等不能夠發(fā)現(xiàn)高維人臉數(shù)據(jù)的本質(zhì)結(jié)構(gòu)。主分量分析處理的是數(shù)據(jù)的全局結(jié)構(gòu)，沒有很好的利用數(shù)據(jù)的局部幾何信息。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足，提出一種基于流形學(xué)習(xí)的人臉識(shí)別方法，使其采用局部保存的降維的方法識(shí)別人臉，以實(shí)現(xiàn)更好的人臉流形學(xué)習(xí)，提高識(shí)別率。
本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的，本發(fā)明從數(shù)據(jù)的局部結(jié)構(gòu)出發(fā)，提出保存人臉數(shù)據(jù)的局部類別關(guān)系；然后利用排列技術(shù)，將每個(gè)點(diǎn)的局部最優(yōu)轉(zhuǎn)化為全局最優(yōu)；通過對(duì)排列矩陣與原始訓(xùn)練樣本及其轉(zhuǎn)置的乘積進(jìn)行特征分解，得到數(shù)據(jù)由高維到低維的投影矩陣；通過該投影矩陣，將待識(shí)別的人臉圖像投影到低維空間；最后，在低維空間用最近鄰法分類完成人臉識(shí)別。
本發(fā)明具體步驟如下(1)將原始的人臉圖像行堆疊為一個(gè)M維長(zhǎng)向量，從而所有的數(shù)據(jù)構(gòu)成一個(gè)矩陣X，作為訓(xùn)練樣本。
(2)對(duì)于每一個(gè)人臉數(shù)據(jù)點(diǎn)xi，尋找到它的k個(gè)同類點(diǎn)，組成一個(gè)局部。對(duì)于該數(shù)據(jù)點(diǎn)xi和它的k個(gè)同類點(diǎn)，使它們?cè)诘途S空間的點(diǎn)對(duì)距離最小，并得到相應(yīng)的局部最優(yōu)化的表達(dá)。
(3)對(duì)于所有的人臉數(shù)據(jù)點(diǎn)，都有步驟(2)所述的優(yōu)化，從而將每一個(gè)局部的優(yōu)化用排列技術(shù)疊加起來，得到排列矩陣L，從而得到全局意義上的優(yōu)化。
(4)將原始數(shù)據(jù)集X乘以排列矩陣L，再乘以原始數(shù)據(jù)集的轉(zhuǎn)置XT，從而得到XLXT。這實(shí)際上實(shí)現(xiàn)了優(yōu)化矩陣的構(gòu)建。對(duì)XLXT進(jìn)行特征分解，假設(shè)所求低維空間為d維，將求得的特征值由小到大排列取前d個(gè)，其所對(duì)應(yīng)的d個(gè)特征向量則組成M×d投影矩陣A。
(5)對(duì)于每一個(gè)待識(shí)別的人臉數(shù)據(jù)xi，用投影矩陣A的轉(zhuǎn)置AT乘以xi，便得到其低維表達(dá)yi＝ATxt，在低維空間里，用最近鄰方法對(duì)人臉數(shù)據(jù)進(jìn)行分類則完成了人臉識(shí)別。
所述的對(duì)于該數(shù)據(jù)點(diǎn)xi和它的k個(gè)同類點(diǎn)，使它們?cè)诘途S空間的點(diǎn)對(duì)距離最小，是指設(shè)xi表示為xi0，xi1，L，xik表示xi的同類點(diǎn)，設(shè)Yi=[yi0,yi1,L,yik]]]>為它們?cè)诘途S空間所對(duì)應(yīng)的點(diǎn)。為了得到忠實(shí)的映射，本發(fā)明期望近鄰的點(diǎn)仍然保持近鄰，也就是說，點(diǎn)yi0仍然靠近于yi1，L，yik。于是有這樣的優(yōu)化minΣj=1k||yi0-yij||2,]]>該公式的含義是最小化鄰域的點(diǎn)對(duì)距離。為了給出更清晰的表達(dá)，將這種局部意義上的優(yōu)化轉(zhuǎn)化成這種形式min tr(YiLiYiT)，其中Li被為局部的排列矩陣，tr(g)表示矩陣的跡。這樣，就完成了局部最優(yōu)化的表達(dá)。
所述的排列技術(shù)，是指一種由局部?jī)?yōu)化疊加為全局優(yōu)化的技術(shù)，本發(fā)明用一個(gè)迭代函數(shù)來實(shí)現(xiàn)L(Ii，Ii)←L(Ii，Ii)+Li，i＝1，L，N。式中的Ii是一個(gè)索引函數(shù)，它指示了每一個(gè)數(shù)據(jù)點(diǎn)xi和它的同類點(diǎn)的標(biāo)號(hào)，Li是局部?jī)?yōu)化的表達(dá)，N表示有N個(gè)數(shù)據(jù)點(diǎn)。這樣就可以的到最終的全局排列矩陣L，它代表了全局意義上的優(yōu)化。
所述的對(duì)XLXT進(jìn)行特征分解，是指最終的優(yōu)化問題轉(zhuǎn)化為對(duì)一個(gè)特征值問題的求解XLXTf＝λf，上式中，f代表特征向量，λ代表特征值。將特征值由小到大排列，取前d個(gè)，投影矩陣A由其所對(duì)應(yīng)的特征向量組成。
所述的最近鄰方法，是指把某一個(gè)待識(shí)別的人臉圖像歸類到離它最近的訓(xùn)練樣本所屬的類中。
與現(xiàn)有技術(shù)相比，本發(fā)明能夠探測(cè)嵌入在高維人臉數(shù)據(jù)中的低維流形結(jié)構(gòu)，由此而能夠得到比較高的人臉識(shí)別率。實(shí)驗(yàn)證明，本發(fā)明在ORL數(shù)據(jù)庫(kù)上進(jìn)行人臉識(shí)別，識(shí)別率對(duì)于5個(gè)訓(xùn)練樣本的情況能達(dá)到97.42％，明顯高于主分量分析方法得到的識(shí)別率88.15％。
具體實(shí)施例方式
下面對(duì)本發(fā)明的實(shí)施例作詳細(xì)說明本實(shí)施例在以本發(fā)明技術(shù)方案為前提下進(jìn)行實(shí)施，給出了詳細(xì)的實(shí)施方式和具體的操作過程，但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。
實(shí)施例采用了一個(gè)公用的人臉數(shù)據(jù)庫(kù)ORL數(shù)據(jù)庫(kù)。ORL數(shù)據(jù)庫(kù)包含40個(gè)人，每個(gè)人10張圖像。每張圖的大小為40×40。首先將人臉圖像將其行堆疊為1600維長(zhǎng)向量，然后所有的數(shù)據(jù)組成一個(gè)1600×400矩陣X＝[x1，L，x400]。對(duì)于每一人，隨機(jī)選擇5個(gè)樣本進(jìn)行訓(xùn)練，余下的用于識(shí)別。對(duì)于每一個(gè)給定的訓(xùn)練樣本數(shù)，產(chǎn)生20組隨機(jī)的訓(xùn)練——識(shí)別樣本集，在此基礎(chǔ)上計(jì)算出平均識(shí)別率。本發(fā)明首先找到每一個(gè)數(shù)據(jù)點(diǎn)的4個(gè)同類點(diǎn)，記為Xi=[xi0,xi1,L,xi4]]]>，并用Ii＝{i0，i1，L，i4}作為對(duì)它們的索引的記錄。然后，對(duì)于每一個(gè)點(diǎn)和它的鄰域點(diǎn)，有這樣的優(yōu)化minΣj=14||yi0-yij||2]]>，它的意圖是讓這些點(diǎn)在低維空間仍然保持近鄰關(guān)系。隨后，局部?jī)?yōu)化轉(zhuǎn)化為這種形式min tr(YiLiYiT)，這樣，局部的排列矩陣，就可以提取出來。按照這種方法，本發(fā)明可以得到200個(gè)局部?jī)?yōu)化，相應(yīng)的有200個(gè)局部排列矩陣。然后，本發(fā)明根據(jù)排列技術(shù)，將這200個(gè)局部?jī)?yōu)化轉(zhuǎn)化為全局意義上的最優(yōu)，依據(jù)這樣的迭代公式L(Ii，Ii)←L(Ii，Ii)+Li，i＝1，L，200，其中，Ii即為前面所提到的每一個(gè)數(shù)據(jù)點(diǎn)和它近鄰點(diǎn)的索引，注意，本專利將L的初始值設(shè)為0。這樣，就完成了對(duì)排列矩陣的構(gòu)建。最終，優(yōu)化問題轉(zhuǎn)化為對(duì)一個(gè)特征值問題的求解XLXTf＝λf，其中，L為求得的排列矩陣。上式的含義實(shí)際上就是對(duì)XLXT進(jìn)行特征分解。設(shè)α1，α2Λ，αd為求得的特征向量，其對(duì)應(yīng)于特征值λ1＜λ2＜Λ＜λd。那么，投影矩陣A為A＝(α1，α2Λ，αd)。接下來，本發(fā)明運(yùn)用投影矩陣A將待識(shí)別的人臉圖像投影到低維空間，然后與低維的訓(xùn)練人臉圖像比對(duì)，將待識(shí)別的人臉圖像歸類到離它最近的訓(xùn)練樣本所屬的類中，即用最近鄰法分類。至此，本發(fā)明完成了人臉識(shí)別的全過程。
本發(fā)明對(duì)于ORL數(shù)據(jù)庫(kù)5個(gè)訓(xùn)練樣本的情況，識(shí)別率能達(dá)到97.42％，明顯高于主分量分析方法得到的識(shí)別率88.15％。
權(quán)利要求
1.一種基于流形學(xué)習(xí)的人臉識(shí)別方法，其特征在于，具體步驟如下(1)將原始的人臉圖像行堆疊為一個(gè)M維長(zhǎng)向量，從而所有的數(shù)據(jù)構(gòu)成一個(gè)矩陣X，作為訓(xùn)練樣本；(2)對(duì)于每一個(gè)人臉數(shù)據(jù)點(diǎn)xi，尋找到它的k個(gè)同類點(diǎn)，組成一個(gè)局部，對(duì)于該數(shù)據(jù)點(diǎn)xi和它的k個(gè)同類點(diǎn)，使它們?cè)诘途S空間的點(diǎn)對(duì)距離最小，并得到相應(yīng)的局部最優(yōu)化的表達(dá)；(3)對(duì)于所有的人臉數(shù)據(jù)點(diǎn)，都經(jīng)步驟(2)所述的優(yōu)化，從而將每一個(gè)局部的優(yōu)化用排列技術(shù)疊加起來，得到排列矩陣L，從而得到全局意義上的優(yōu)化；(4)將原始數(shù)據(jù)集X乘以排列矩陣L，再乘以原始數(shù)據(jù)集的轉(zhuǎn)置XT，從而得到XLXT，實(shí)現(xiàn)了優(yōu)化矩陣的構(gòu)建；(5)對(duì)XLXT進(jìn)行特征分解，假設(shè)所求低維空間為d維，將求得的特征值由小到大排列取前d個(gè)，其所對(duì)應(yīng)的d個(gè)特征向量則組成M×d投影矩陣A；(6)對(duì)于每一個(gè)待識(shí)別的人臉數(shù)據(jù)xt，用投影矩陣A的轉(zhuǎn)置AT乘以xt，便得到其低維表達(dá)yt＝ATxt，在低維空間里，用最近鄰方法對(duì)人臉數(shù)據(jù)進(jìn)行分類則完成了人臉識(shí)別。
2.根據(jù)權(quán)利要求1所的基于流形學(xué)習(xí)的人臉識(shí)別方法，其特征是，所述的對(duì)于該數(shù)據(jù)點(diǎn)xi和它的k個(gè)同類點(diǎn)，使它們?cè)诘途S空間的點(diǎn)對(duì)距離最小，是指設(shè)xi表示為xi0，xi1，L，xik表示xi的同類點(diǎn)，設(shè)Yi=[yi0,yi1,L,yik]]]>為它們?cè)诘途S空間所對(duì)應(yīng)的點(diǎn)，對(duì)其進(jìn)行優(yōu)化該公式的含義是最小化鄰域的點(diǎn)對(duì)距離。
3.根據(jù)權(quán)利要求1所述的基于流形學(xué)習(xí)的人臉識(shí)別方法，其特征是，所述局部最優(yōu)化的表達(dá)，是指將轉(zhuǎn)化成min tr(YiLiYiT)，其中Li為局部的排列矩陣，tr(g)表示矩陣的跡。
4.根據(jù)權(quán)利要求1所述的基于流形學(xué)習(xí)的人臉識(shí)別方法，其特征是，所述的排列技術(shù)，是指一種由局部?jī)?yōu)化疊加為全局優(yōu)化的技術(shù)，用一個(gè)迭代函數(shù)來實(shí)現(xiàn)L(Ii，Ii)←L(Ii，Ii)+Li，i＝1，L，N，式中的Ii是一個(gè)索引函數(shù)，它指示了每一個(gè)數(shù)據(jù)點(diǎn)xi和它的同類點(diǎn)的標(biāo)號(hào)，Li是局部?jī)?yōu)化的表達(dá)，N表示有N個(gè)數(shù)據(jù)點(diǎn)，這樣就得到最終的全局排列矩陣L，它代表了全局意義上的優(yōu)化。
5.根據(jù)權(quán)利要求1所述的基于流形學(xué)習(xí)的人臉識(shí)別方法，其特征是，所述的對(duì)XLXT進(jìn)行特征分解，是指最終的優(yōu)化問題轉(zhuǎn)化為對(duì)一個(gè)特征值問題的求解XLXTf＝λf，上式中，f代表特征向量，λ代表特征值，將特征值由小到大排列，取前d個(gè)，投影矩陣A由其所對(duì)應(yīng)的特征向量組成。
全文摘要
本發(fā)明涉及一種基于流形學(xué)習(xí)的人臉識(shí)別方法，從數(shù)據(jù)的局部結(jié)構(gòu)出發(fā)，提出保存人臉數(shù)據(jù)的局部類別關(guān)系；然后利用排列技術(shù)，將每個(gè)點(diǎn)的局部最優(yōu)轉(zhuǎn)化為全局最優(yōu)；通過對(duì)排列矩陣與原始訓(xùn)練樣本及其轉(zhuǎn)置的乘積進(jìn)行特征分解，得到數(shù)據(jù)由高維到低維的投影矩陣；通過該投影矩陣，將待識(shí)別的人臉圖像投影到低維空間；最后，在低維空間用最近鄰法分類。本發(fā)明能夠探測(cè)嵌入在高維人臉數(shù)據(jù)中的低維流形結(jié)構(gòu)，由此而能夠得到比較高的人臉識(shí)別率。實(shí)驗(yàn)證明，用本發(fā)明所提出的方法進(jìn)行人臉識(shí)別，其識(shí)別率明顯高于主分量分析方法得到的識(shí)別率。
文檔編號(hào)G06K9/00GK101079105SQ20071004197
公開日2007年11月28日申請(qǐng)日期2007年6月14日優(yōu)先權(quán)日2007年6月14日
發(fā)明者張?zhí)镪? 楊杰, 杜春華, 袁泉, 吳證申請(qǐng)人:上海交通大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張?zhí)镪?楊杰;杜春華;袁泉;吳證
技術(shù)所有人：上海交通大學(xué)
我是此專利的發(fā)明人

上一篇：一種硬盤硬件故障的檢測(cè)方法
上一篇：基于切信息的人臉識(shí)別方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于流形學(xué)習(xí)的人臉識(shí)別方法