亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于深度稀疏表示的人臉年齡估計方法與流程

文檔序號:12887615閱讀:323來源:國知局
一種基于深度稀疏表示的人臉年齡估計方法與流程

本發(fā)明屬于圖像處理與模式識別技術(shù)領(lǐng)域,涉及一種基于深度稀疏表示的人臉年齡估計方法。



背景技術(shù):

在醫(yī)學界,人們主要通過分析膽固醇、高密度膽固醇、白蛋白等血檢指標來測定一個人的“生理年齡”并以此研究人體衰老的程度。但遺憾的是這套指標體系目前還很不完善,且使用不方便。如果能利用計算機和圖像處理技術(shù),通過分析人臉表觀圖像能精準預測一個人的“生理年齡”,將“生理年齡”與“實際年齡”對比,就可以知道你究竟是“青春常駐”還是“未老先衰”。那么將極大地提高研究效率和降低研究成本。通過看“臉”來估計年齡不僅可用于量化衰老,還可以應(yīng)用于智慧城市和平安城市建設(shè)中。如,基于年齡分析的強制、控制、商業(yè)分析,廣告投遞和人機交互等應(yīng)用。在日常的語言交談中,談話內(nèi)容與方式往往受對方性別和年齡等因素影響。例如,在面對年長者時,談話的語言顯然會正式些。更一般地,人類會通過對方人臉外觀迅速估計對方性別、年齡和身份等信息以便選擇不同社交方式。

相對人臉識別問題,年齡分析所受到的關(guān)注要少得多。然而,這并不表明年齡分析沒有人臉身份識別重要。人臉年齡分析最容易想到是在人臉識別、法醫(yī)學方面的應(yīng)用。近年來關(guān)于人臉年齡分析的研究吸引了更多心理學、美學,刑偵學、計算機圖形學、計算機視覺等領(lǐng)域的研究興趣??梢钥隙ǎ磥砟挲g自動分析的應(yīng)用并不亞于人臉識別,并將廣泛應(yīng)用于智能廣告投遞,生物鑒定學,生物統(tǒng)計學,電子客戶關(guān)系管理,人臉識別、美容,法律實施,安全控制、人口統(tǒng)計與普查、人機交互等領(lǐng)域。

在人臉年齡自動估計系統(tǒng)中,通常分為兩個階段,第一個階段是提取年齡特征,第二個階段是估計年齡,通常研究的重點是如何提取到最佳的年齡特征。目前人臉年齡特征提取方法大致可以分為經(jīng)典傳統(tǒng)和基于深度學習的兩大類方法。第一類方法理論成熟、實現(xiàn)簡單,但魯棒性不高。其中典型代表有主動表觀模型(aam),局部二元模式(lbp),gabor和仿生特征(bio-inspiredfeatures,bif)等。每種方法都有各自的特點和應(yīng)用場合。例如,aam特征綜合了人臉紋理和形狀信息具有全局性,適用于人臉年齡粗估計。lbp主要是提取人臉局部紋理特征,具有局部細節(jié)性,在區(qū)分相近的年齡比較有效,但由于缺乏全局信息容易出現(xiàn)大區(qū)域跨年齡段估計錯誤。bif特征考慮了人類分類識別物體的思維方式,所以取得了比較好的效果,但其人類物體識別思維方式并沒有充分利用。因此,如何有效地綜合利用以上特征并充分挖掘人類思維方式是年齡估計未來的重要研究方向。本發(fā)明朝此方向作有益的探討與研究,提出基于深度稀疏表達的人臉特征提取方法。該方法融合了aam、lbp和bif特征的各自特點。

最近,由于深度學習的研究與應(yīng)用不斷深入與發(fā)展,出現(xiàn)了不少基于深度學習的人臉年齡估計方法。如,文章“dongyi,zhenlei,stanz.li.ageestimationbymulti-scaleconvolutionalnetwork[c].inproceedingsof12thasianconferenceoncomputervision,singapore,2014.”和專利“一種人臉圖像的年齡估計方法(專利號:cnio5956571a)”等將深度卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于年齡估計。深度學習是目前研究的熱門,基于深度學習的年齡估計雖然取得了顯著的效果。但其應(yīng)用面臨著深度網(wǎng)絡(luò)的優(yōu)化設(shè)計和人臉圖像優(yōu)化處理技巧等問題;其次,現(xiàn)有的深度學習結(jié)構(gòu)當隱層數(shù)增多時參數(shù)急劇增加,對運算性能提出了較高的要求;最后,面臨海量年齡訓練樣本缺乏和工程應(yīng)用等問題。而本發(fā)明提出的深度稀疏表示人臉年齡估計方法具有計算復雜度低,不需要海理量訓練樣本和魯棒性高等優(yōu)點。



技術(shù)實現(xiàn)要素:

本發(fā)明的目的是針對現(xiàn)有的技術(shù)存在的上述問題,提供一種基于深度稀疏表示的人臉年齡估計方法,本發(fā)明所要解決的技術(shù)問題是如何通過人臉特征估計人的年齡。

本發(fā)明目的通過如下技術(shù)方案來實現(xiàn):一種基于深度稀疏表示的人臉年齡估計方法,其特征在于,本方法包括如下步驟:

a、構(gòu)建鑒別字典學習模型:

其中,r(ai,d,xi)為人臉重構(gòu)保真項,||x||1為稀疏約束項以保證求解系數(shù)的稀疏性,

f(x)為鑒別約束項,l(di)=||di||*為低秩(low-rank)正定化噪聲處理項,λ1,λ2,γ為平衡因子參數(shù)。式(1)字典學習模型的目標函數(shù)求解可以通過交替迭代的方法進行求解。

b、根據(jù)aam特征對年齡進行粗分類(第一層)

首先,利用步驟a介紹的字典學習方法求得的完備字典daam對測試人臉y進行稀疏表示求取稀疏表示系數(shù)xaam:

其中,γ為常量平衡因子。重寫稀疏表示系數(shù)其中,系數(shù)向量對應(yīng)于子字典

然后,根據(jù)定義每類的殘差:

其中,第一項為第i類的重構(gòu)誤差項,第二項為稀疏表示系數(shù)與第i類系數(shù)均值的距離,w為預設(shè)的平衡權(quán)值。對ei進行排序,選取前k個最小的ei(最相近的前一半)作為下層字典類別。

c、根據(jù)bif特征對年齡進行分類(第二層)

根據(jù)步驟a獲得完備字典dbif,使用步驟b得到的類別對其進行提煉得到精簡后的字典d′bif。對測試人臉y利用d′bif再次進行稀疏表示求取稀疏表示系數(shù)

然后,根據(jù)式(3)求取ei,并選取前k類別(最相近的前一半)確認下層字典類別。

d、根據(jù)gabor特征和lbp特征年齡進行分類(第三層)

根據(jù)步驟a獲得完備字典dgl,使用步驟c得到的類別對其進行提煉得到精簡后的字典d′gl。進一步對字典d′gl的類別進行聚類,去除奇異類別(邊緣類)。對測試人臉y利用去除奇異類后的d′gl第三次進行稀疏表示求取稀疏表示系數(shù)

優(yōu)選的,經(jīng)過步驟b和步驟c,留下來的類別都是與測試年齡相鄰的類別。此時,字典d′gl內(nèi)的年齡特征比較相近,而身份特征的干擾逐漸增強,加大了對年齡進一步細分的難度。因此,對于年齡的進一步細分問題,如果能去除身份信息的干擾,無疑是“雪中送炭”。本發(fā)明利用兩因子分析模型進行人臉年齡與身份分離,并利用加性模型進行身份因子去除,來提高特征的年齡細分能力。

e、提取最終人臉年齡特征(融合層)

將第一層求取的系數(shù)置0,并將第三層求取的系數(shù)代入其相應(yīng)的類別位置得到最終的人臉特征。

f、通過年齡估計模塊對年齡自動估計

年齡估計分為模型訓練和年齡估計兩個階段

模型訓練階段:將人臉年齡(0-80歲)以10歲為間隔分成8組,如圖2所示。每組利用支持向量回歸(svr)單獨訓練一個估計模型,總共得到8個不同的年齡估計器。

年齡估計階段:首先,根據(jù)深度稀疏表達模型對待估人臉進行分組;然后,根據(jù)第一步的分組情況,選擇相應(yīng)的svr模型進行年齡估計。

本方法還包括一個基于因子分析的人臉身份信息去除的步驟,方法如下:

其中,為進行人臉身份因子去除后的人臉年齡特征向量;ysc為原始的人臉特征向量;是只與人臉身份信息有關(guān)的身份因子向量。

綜上所述,本發(fā)明提出的一種基于深度稀疏表示的人臉年齡估計方法,具有如下優(yōu)點:

1)為了提取魯棒性人臉年齡特征,同時克服人臉年齡的相鄰相似性和次序性問題,本發(fā)明利用不同特征提取方法的優(yōu)缺點和分層稀疏表達的特點,提出深度稀疏表達的人臉年齡特征提取模型。在此深度模型中,根據(jù)年齡變化特點,在不同層次使用了不同特征的稀疏表達;層次間具有嚴格的遞進關(guān)系,使得提取的特征具有很強的位置信息。因此,深度稀疏表達特征不但具有很強鑒別性能,同時還具有年齡組信息,便于后期分層年齡估計模型的設(shè)計。

2)為了降低基于人臉圖像的年齡估計中人臉身份信息的干擾,本發(fā)明提出兩因子分析模型進行人臉年齡與身份因子分析。基于此模型,采用加性模型去除人臉身份因子的干擾以加強年齡細分的能力。

附圖說明

圖1是一種基于深度稀疏表示的人臉年齡特征提取方法流程圖。

圖2是基于分層支持向量回歸模型的人臉年齡估計方法流程圖。

具體實施方式

以下是本發(fā)明的具體實施例并結(jié)合附圖,對本發(fā)明的技術(shù)方案作進一步的描述,但本發(fā)明并不限于這些實施例。

本發(fā)明提出的一種基于深度稀疏表示的人臉年齡估計方法,主要包括:人臉年齡特征提取和人臉年齡估計兩大模塊:

s1人臉年齡特征提取模塊

此模塊為主要是提取具有鑒別性和魯棒性的人臉年齡特征。由于人臉年齡的特殊性,導致目前的人臉年齡特征提取算法各具特色。因此,如何利用一種結(jié)構(gòu)框架同時融合不同算法優(yōu)點提取高鑒別性的年齡特征是整個人臉年齡估計方法的關(guān)鍵。本發(fā)明從基礎(chǔ)理論和應(yīng)用設(shè)計兩方面著手研究信號稀疏表達的數(shù)學模型和字典優(yōu)化方法,并分析目前經(jīng)典主流的aam、lbp、gabor和bif等人臉特征提取的年齡特性。據(jù)此,提出一種深度稀疏表示的人臉年齡特征提取方法(deep_src),如圖1所示deep_src總共分為三層,每層采用不同特征和字典。其中,每層的原始超完備字典在后臺訓練得出;系數(shù)特征豎狀長方形中白色部分表示為全0項,灰色部分表示非0系數(shù)項。deep_src的實施步驟如下:

①鑒別字典學習

收集0-80歲的人臉樣本,每歲作為一類,每類包含500幅人臉圖像。據(jù)此,組成年齡人臉訓練集a=[a1,a2,l,a80],其中為第i類中第j個樣本的特征向量。一般的,可以直接使用上述訓練集作為人臉年齡完備字典。但這種方式構(gòu)建的字典并非最優(yōu),同時可能導致字典矩陣過大。假設(shè)訓練樣本集a由完備字典d線性組合表示,其稀疏表示系數(shù)矩陣為x。則x可以改寫為x=[x1,x2,l,x80],其中xi為子集ai的系數(shù)矩陣。為了使求取的完備字典d不但對樣本集a具有很好的稀疏重建能力,同時還具有很強的鑒別和噪聲處理能力,本發(fā)明構(gòu)建如下的字典學習模型:

其中,r(ai,d,xi)為人臉重構(gòu)保真項,||x||1為稀疏約束項以保證求解系數(shù)的稀疏性,

f(x)為鑒別約束項,l(di)=||di||*為低秩(low-rank)正定化噪聲處理項,λ1,λ2,γ為平衡因子參數(shù)。式(1)字典學習模型的目標函數(shù)求解可以通過交替迭代的方法進行求解。

②第一層設(shè)計

由于aam特征綜合了人臉紋理和形狀信息具有全局性,適用于人臉年齡粗估計。因此,第一層采用aam特征。首先,利用①介紹的字典學習方法求得的完備字典daam對測試人臉y進行稀疏表示求取稀疏表示系數(shù)xaam:

其中,γ為常量平衡因子。重寫稀疏表示系數(shù)其中,系數(shù)向量對應(yīng)于子字典

然后,根據(jù)定義每類的殘差:

其中,第一項為第i類的重構(gòu)誤差項,第二項為稀疏表示系數(shù)與第i類系數(shù)均值的距離,w為預設(shè)的平衡權(quán)值。對ei進行排序,選取前k個最小的ei(最相近的前一半)作為下層字典類別。

③第二層設(shè)計

由于bif特征考慮了人類識別物體的思維方式,取得了比較好的效果。因此,第二層采用bif特征。

首先,對完備字典dbif(利用①介紹的字典學習在后臺訓練得到),使用上層得到的類別對其進行提煉得到精簡后的字典d′bif。對測試人臉y利用d′bif再次進行稀疏表示求取稀疏表示系數(shù)

然后,根據(jù)式(3)求取ei,并選取前k類別(最相近的前一半)確認下層字典類別。

④第三層設(shè)計

由于gabor濾波器具有多尺度和方向性,同時lbp特征具有局部細節(jié)性。因此,第三層采用gabor+lbp特征。

對完備字典dgl(利用①介紹的字典學習在后臺訓練得到),使用上層得到的類別對其進行提煉得到精簡后的字典d′gl。進一步對字典d′gl的類別進行聚類,去除奇異類別(邊緣類)。對測試人臉y利用去除奇異類后的d′gl第三次進行稀疏表示求取稀疏表示系數(shù)

優(yōu)選的,經(jīng)過前兩層,留下來的類別都是與測試年齡相鄰的類別。此時,字典d′gl內(nèi)的年齡特征比較相近,而身份特征的干擾逐漸增強,加大了對年齡進一步細分的難度。因此,對于年齡的進一步細分問題,如果能去除身份信息的干擾,無疑是“雪中送炭”。本發(fā)明利用兩因子分析模型進行人臉年齡與身份分離,并利用加性模型進行身份因子去除,來提高特征的年齡細分能力。

⑤融合層設(shè)計

將第一層求取的系數(shù)置0,并將第三層求取的系數(shù)代入其相應(yīng)的類別位置得到最終的人臉特征。

s2人臉年齡估計模塊

此模塊利用上模塊提取的人臉年齡特征進行年齡估計器的訓練和學習?,F(xiàn)有的年齡估計算法中,研究人員對年齡估計這個問題只是單純的視作單一的分類問題或者回歸問題。將年齡視作回歸問題,就相當于建立特征與年齡的全局函數(shù),然而人的年齡老化過程存在一定的可變性,全局函數(shù)并不能確切的擬合年齡隨著特征的變化。考慮以上因素,為了獲得更佳的估計結(jié)果,本發(fā)明采用分層方案進行年齡估計,如圖2所示。人臉年齡估計分為模型訓練和年齡估計兩個階段。

模型訓練階段:將人臉年齡(0-80歲)以10歲為間隔分成8組,如圖2所示。每組利用支持向量回歸(svr)單獨訓練一個估計模型,總共得到8個不同的年齡估計器。

年齡估計階段:首先,根據(jù)深度稀疏表達模型對待估人臉進行分組;然后,根據(jù)第一步的分組情況,選擇相應(yīng)的svr模型進行年齡估計。

實施例1:

本發(fā)明提出的一種基于深度稀疏表示的人臉年齡估計方法主要包括字典訓練、深度稀疏表示模型構(gòu)建、特征提取和年齡估計四大步驟。

步驟1:字典訓練

本步驟可以在后臺離線完成。首先,收集0-80歲的人臉樣本,每歲作為一類,每類包含500幅人臉圖像。據(jù)此,組成年齡人臉訓練集a=[a1,a2,l,a80],其中為第i類中第j個樣本人臉。然后,對人臉訓練集a進行aam、bif和gabor+lbp特征提取。最后,利用鑒別字典學習方法訓練出基于aam、bif和gabor+lbp的完備字典daam,dbif,dgl。

步驟2:深度稀疏表示模型構(gòu)建

利用上步訓練得到的完備字典構(gòu)建深度稀疏表示模型,如圖1所示模型包含有四層。

第一層利用字典damm對測試人臉進行稀疏表示,求解稀疏表示系數(shù);然后,根據(jù)稀疏表示系數(shù)求解出重建誤差最小的k類(年齡類別)作為下一層稀疏表示類別。

第二層利用第一層得到的k類別對字典dbif進行精減得到d′bif,對測試人臉利用精減后的字典d′bif進行重新稀疏表示,求解稀疏表示系數(shù);然后,根據(jù)稀疏表示系數(shù)求解出重建誤差最小的k′類作為下一層稀疏表示類別。

第三層利用第二層得到的k′類別對字典dgl進行精減得到d′gl,對測試人臉利用精減后的字典d′gl進行重新稀疏表示,求解稀疏表示系數(shù)。

融合層將第一層求取的稀疏表示系數(shù)置0,并將第三層求取的系數(shù)代入其相應(yīng)的類別位置得到一組新的系數(shù)向量。

優(yōu)選的,為了提高模型對人臉年齡的細分能力,本發(fā)明在第三層進行稀疏表示之前,先進行人臉身份因子去除。年齡估計就是要從人臉樣本圖像中提取年齡信息。在年齡相差大于10歲情況下,年齡信息在人臉樣本中占主要地位。然而,在年齡相差小于10歲情況下,身份信息在人臉樣本中所占地位逐漸增強成為主導。因此,本發(fā)明將進行人臉年齡和身份因子分析,并利用加性模型去除人臉身份因子的干擾。

步驟3:人臉特征提取

對輸入的人臉圖像,進行amm、bif和gabor+lbp特征提取,并進行因子分析求解出人臉身份因子去除后的人臉。然后,將以上得到的人臉特征和處理后人臉代入深度稀疏表示模型提取人臉年齡特征。

步驟4:人臉年齡估計

根據(jù)步驟3得到的人臉年齡特征,確定輸入人臉所屬的年齡組。然后,將人臉年齡特征代入其相應(yīng)的年齡組svr模型進行年齡估計。

優(yōu)選的,本發(fā)明將年齡(0-80歲)按10歲為間隔分成8組,在后臺利用收集的人臉訓練樣本為每個分組訓練出一個最優(yōu)的基于svr的年齡估計模型。

實施例2:

一種基于深度稀疏表示的人臉年齡估計方法同實施例1,其中步驟1中的鑒別字典學習方法包括如下步驟:

(1a)收集0-80歲的人臉樣本,每歲作為一類,每類包含500幅人臉圖像。據(jù)此,組成年齡人臉訓練集a=[a1,a2,l,a80],其中為第i類中第j個樣本的特征向量。假設(shè)訓練樣本集a由完備字典d線性組合表示,其稀疏表示系數(shù)矩陣為x。則x可以改寫為x=[x1,x2,l,x80],其中xi為子集ai的系數(shù)矩陣。

(1b)為了使求取的完備字典d不但對樣本集a具有很好的稀疏重建能力,同時還具有很強的鑒別和噪聲處理能力,本發(fā)明構(gòu)建如下的字典學習模型:

其中,r(ai,d,xi)為人臉重構(gòu)保真項,其定義如下:

其中,為子集ai的系數(shù)矩陣中與第i類對應(yīng)的系數(shù)項,為子集ai的系數(shù)矩陣中與第j類對應(yīng)的系數(shù)項。

||x||1為稀疏約束項以保證求解系數(shù)的稀疏性。

f(x)為鑒別約束項,本文采用經(jīng)典fisher準則,并對其類間與類內(nèi)散布矩陣(sb,sw)加權(quán)改進以達到更佳效果,其定義如下:

l(di)=||di||*為低秩(low-rank)正定化噪聲處理項,||·||*代表核范數(shù),表示矩陣的奇異值之和。由于low-rank正定化能夠分離信息噪聲,因此它可使得學習得到的字典更純凈和緊湊;λ1,λ2,γ為平衡因子參數(shù)。

(1c)式(1)字典學習模型的目標函數(shù)求解可以通過交替迭代的方法分成兩個子問題求解:①固定字典d,優(yōu)化匹配得到系數(shù)矩陣x;②固定系數(shù)矩陣x,優(yōu)化匹配得到字典d。如此交替迭代直到收斂為止。

更新系數(shù)矩陣x:

假定d已知,則目標函數(shù)式(1)簡化為稀疏表示問題??梢酝ㄟ^逐個更新xi而固定所有的xj(j≠i)的方式求解最終的x,其求解目標函數(shù)為:

其求解可以通過迭代投影法進行求解。

更新字典d:

當x已知時,可以通過逐個更新di而固定所有的dj(j≠i)的方式求解最終的d,其求解目標函數(shù)為:

根據(jù)low-rank學習方法(5)式可以轉(zhuǎn)換成如下的優(yōu)化問題:

其中,ei為訓練子集ai誤差矩陣,||·||2,1為l2,1-norm范數(shù)被用于測量指定樣本的腐蝕和噪聲。(6)式可以通過不確定增廣拉格朗日乘子求解。

實施例3:

一種基于深度稀疏表示的人臉年齡估計方法同實施例1-2,其中步驟2中的深度稀疏表示模型構(gòu)建方法包括如下步驟:

(2a)第一層設(shè)計:由于aam特征綜合了人臉紋理和形狀信息具有全局性,適用于人臉年齡粗估計。因此,第一層采用aam特征。首先,利用步驟1介紹的字典學習方法求得的完備字典daam對測試人臉y進行稀疏表示求取稀疏表示系數(shù)xaam:

其中,γ為常量平衡因子。重寫稀疏表示系數(shù)其中,系數(shù)向量對應(yīng)于子字典

然后,根據(jù)定義每類的殘差:

其中,第一項為第i類的重構(gòu)誤差項,第二項為稀疏表示系數(shù)與第i類系數(shù)均值的距離,w為預設(shè)的平衡權(quán)值。對ei進行排序,選取前k個最小的ei(最相近的前一半)作為下層字典類別。

(2b)第二層設(shè)計:由于bif特征考慮了人類識別物體的思維方式,取得了比較好的效果。因此,第二層采用bif特征。

首先,對完備字典dbif(利用步驟1介紹的字典學習在后臺訓練得到),使用上層得到的類別對其進行提煉得到精簡后的字典d′bif。對測試人臉y利用d′bif再次進行稀疏表示求取稀疏表示系數(shù)

然后,根據(jù)式(2)求取ei,并選取前k類別(最相近的前一半)確認下層字典類別。

(2c)第三層設(shè)計:由于gabor濾波器具有多尺度和方向性,同時lbp特征具有局部細節(jié)性。因此,第三層采用gabor+lbp特征。

對完備字典dgl(利用步驟1介紹的字典學習在后臺訓練得到),使用上層得到的類別對其進行提煉得到精簡后的字典d′gl。進一步對字典d′gl的類別進行聚類,去除奇異類別(邊緣類)。對測試人臉y利用去除奇異類后的d′gl第三次進行稀疏表示求取稀疏表示系數(shù)

(2d)融合層設(shè)計:將第一層求取的系數(shù)置0,并將第三層求取的系數(shù)代入其相應(yīng)的類別位置得到最終的人臉特征。

實施例4:

一種基于深度稀疏表示的人臉年齡估計方法同實施例1-3,其中步驟2中的人臉身份因子去除方法包括如下步驟:

(2e)因子分析模型:把內(nèi)容和風格看作影響一個事物的兩個互相獨立的因素,它們決定了事物的觀測。比如:在人臉年齡分析中,人臉年齡信息是風格,而人臉的身份信息是內(nèi)容。人臉年齡估計的任務(wù)就是根據(jù)人臉風格信息估計出不同的年齡。

如果人臉內(nèi)容bj具有風格ai,那么人臉樣本的觀測可以表示成:

其中,k∈[1,k]表示人臉觀察向量中第k維特征,符號s和c分別標記風格和內(nèi)容,wijk表示內(nèi)容與風格的交互作用關(guān)系,這里的觀測可以看作原始圖像。為了使模型更具靈活性,假定交互作用項wijk隨著風格變化而變化,設(shè)則式(1)變?yōu)椋?/p>

ysc=asbc(2)

其中,是由所有的組成的矩陣,bc為全體內(nèi)容組成的矩陣。因此,可以將as看作指定風格的投影矩陣,負責將內(nèi)容空間投影到觀察空間。

(2f)模型匹配求解:模型匹配的目標是使用訓練集去擬合模型使平方誤差最小。因此,因子分析模型的目標函數(shù)為:

其中,hsc(t)表示指示器,當y(t)屬于風格s和內(nèi)容c時,其值為1,否則為0。收集0-80歲的訓練樣本,以相差20歲作為分水嶺,將年齡風格分為4類。當訓練集中每個人在每種風格下包含相同數(shù)量的人臉訓練樣本時,重寫式(1)為:

其中,是指定風格和內(nèi)容類別下的樣本均值;因此,式(4)可以通過奇異值分解(svd)的方法進行求解:

經(jīng)過svd變換,風格參數(shù)矩陣a為us的前j列(與前j個最大奇異值對應(yīng)),內(nèi)容參數(shù)矩陣b為vt的前j行。

(2j)基于加性模型的身份因子去除:因子分離的目的是要降低觀察樣本ysc中受內(nèi)容信息影響的部分,讓同一風格下的內(nèi)容差異對ysc差異影響最小。從deep_src模型可以看出當?shù)降谌龑訒r,已經(jīng)可以確定測試人臉的年齡分組情況,即因子分析模型中的風格類別as。根據(jù)式(1),已知ysc和as可以求出人臉內(nèi)容bc。設(shè)平均風格因子為其中,as是利用訓練樣本與svd求解的風格因子。那么可以定義只與人臉內(nèi)容相關(guān)的平均人臉:

從式(6)可以看出只與觀察樣本的內(nèi)容信息有關(guān),即隨著觀察樣本的身份變化而變化。因此,可以構(gòu)建如下的加性模型進行因子分離:

加性模型就是從原始特征向量ysc中去掉并獲得新的與內(nèi)容無關(guān)的向量表示的方法。

優(yōu)勢分析:兩因子分析方法由斯坦福大學的joshuab.tenenbaum最先提出,隨后的多因子分析、張量分解和非線性因子分析方法都是其變種。并已成功應(yīng)用于手寫筆跡、人臉、姿態(tài)和步態(tài)識別。在實際應(yīng)用中,一般只知道輸入對象的觀察,而并不知道其風格與內(nèi)容信息。往往通過采用最大期望算法(em)求解近似的風格和內(nèi)容信息,并進行相應(yīng)識別任務(wù)。然而,em算法有一定誤差,影響了后續(xù)的分類任務(wù)。由于在deep_src的第三層已經(jīng)知道了人臉的風格信息(人臉年齡段),因此本發(fā)明方法成功避免了em估計誤差問題。

本文提及的詞語均為本領(lǐng)域技術(shù)人員公知的術(shù)語,為便于理解,特對其進行簡單定義和解讀,如下:

aam:主動外觀模型(aam,activeappearancemodel)是廣泛應(yīng)用于模式識別領(lǐng)域的一種特征點提取方法?;赼am的人臉特征定位方法在建立人臉模型過程中,不但考慮局部特征信息,而且綜合考慮到全局形狀和紋理信息,通過對人臉形狀特征和紋理特征進行統(tǒng)計分析,建立人臉混合模型,即為最終對應(yīng)的aam模型。

bif:仿生特征(bio-inspiredfeatures,bif)是一種模仿人類觀察和判斷事物方式的一種紋理特征提取算法,同時它也是一種改進的gabor特征提取方法。

gabor:gabor特征是一種可以用來描述圖像紋理信息的特征,gabor濾波器的頻率和方向與人類的視覺系統(tǒng)類似,特別適合于紋理表示與判別。gabor特征主要依靠gabor核在頻率域上對信號進行加窗,從而能描述信號的局部頻率信息。

lbp:lbp指局部二值模式,英文全稱:localbinarypattern,是一種用來描述圖像局部特征的算子,lbp特征具有灰度不變性和旋轉(zhuǎn)不變性等顯著優(yōu)點。它是由t.ojala,m.和d.harwood在1994年提出,由于lbp特征計算簡單、效果較好,因此lbp特征在計算機視覺的許多領(lǐng)域都得到了廣泛的應(yīng)用。

svr:支持向量加歸(svr)的本質(zhì)是支持向量機(svm)原理,只不過svm主要用于分類問題,而svr是用于具體值的估計預測問題。

本發(fā)明中所描述的具體實施例僅僅是對本發(fā)明精神作舉例說明。本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員可以對所描述的具體實施例做各種各樣的修改或補充或采用類似的方式替代,但并不會偏離本發(fā)明的精神或者超越所附權(quán)利要求書所定義的范圍。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1