一種人臉識(shí)別方法
【專(zhuān)利摘要】本發(fā)明適用于人臉識(shí)別【技術(shù)領(lǐng)域】,提供了一種人臉識(shí)別方法,所述方法包括:對(duì)原始的測(cè)試人臉圖像進(jìn)行預(yù)處理;采用光柵掃描的方式,基于多尺度的局部二值模型LBP描述子,提取出所述測(cè)試人臉圖像的原始碼字;統(tǒng)計(jì)每個(gè)原始碼字的頻率分布,基于學(xué)習(xí)的LBP編碼對(duì)原始碼字進(jìn)行編碼得到一組新碼字,基于編碼后生成的新碼字,計(jì)算所述測(cè)試人臉圖像的LBP特征;根據(jù)所述測(cè)試人臉圖像的LBP特征對(duì)所述測(cè)試人臉圖像進(jìn)行識(shí)別。本發(fā)明可以使得編碼生成的新的碼字的概率分布更加均勻,因而最終的編碼空間更加緊湊,具有更高的信息熵,從而保留更多的原始信息,更具有辨識(shí)力。
【專(zhuān)利說(shuō)明】一種人臉識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于人臉識(shí)別【技術(shù)領(lǐng)域】,尤其涉及一種人臉識(shí)別方法。
【背景技術(shù)】
[0002]自動(dòng)人臉識(shí)別一直以來(lái)是一個(gè)非常重要并且極具挑戰(zhàn)性的研究課題。其困難的原因主要來(lái)源于以下兩個(gè)方面:(I)、人臉具有很強(qiáng)的結(jié)構(gòu)相似性。不同人的臉部構(gòu)成都是相似的(均是由眼睛、嘴巴、鼻子等部位構(gòu)成,而且這些部位都在比較固定的位置);(2)、同一個(gè)人的臉部圖像在不同年齡、不同表情、不同光線等情況下會(huì)有很大的變化。
[0003]在人臉識(shí)別中,通常稱不同個(gè)體之間的人臉差異為人臉類(lèi)間變化,而稱相同個(gè)體在不同情況下的人臉變化為人臉類(lèi)內(nèi)變化。一般而言,在人臉識(shí)別尤其在跨年齡階段人臉識(shí)別中,類(lèi)內(nèi)變化通常會(huì)大于類(lèi)間變化,這造成了人臉識(shí)別的巨大困難。
[0004]一般而言,在人臉類(lèi)內(nèi)變化中,基于年齡的人臉變化是最突出的變化之一。在實(shí)際生活中,這也是極為常見(jiàn)的一種變化。比如身份證照片是以前拍攝的,失蹤兒童的照片也是以前拍攝的。在互聯(lián)網(wǎng)上的數(shù)以億計(jì)的人臉照片均是以前拍攝的。它們都具有顯著的年齡變化。而且更重要的是人臉年齡的變化同時(shí)也蘊(yùn)含了其它各種類(lèi)型的變化(比如姿勢(shì)、光線、表情等的變化),因此近年來(lái)對(duì)人臉年齡變化的研究已成為國(guó)際上一個(gè)新的熱點(diǎn)和難點(diǎn)。
[0005]如何解決人臉年齡變化對(duì)人臉識(shí)別算法和系統(tǒng)的影響已成為人臉識(shí)別系統(tǒng)必須面對(duì)的一個(gè)關(guān)鍵問(wèn)題,因此迫切需要一種能有效解決跨年齡階段人臉識(shí)別問(wèn)題的算法和系統(tǒng)。
[0006]迄今為止,國(guó)際上對(duì)跨年齡階段的人臉識(shí)別的研究也不是很成熟。大部分的相關(guān)研究都是基于人臉年齡的估計(jì)和不同年齡階段的人臉的仿真。盡管這類(lèi)算法取得了一定的效果,但是它們具有如下局限性。首先,構(gòu)造這樣的生成型模型非常困難,而且在很多情況下年齡補(bǔ)償?shù)男Ч⒉缓?,反而引入了很多噪聲,?duì)后期的識(shí)別反倒起負(fù)作用。其次,人臉老化過(guò)程是非常復(fù)雜的,它涉及到人的生理、心理、遺傳、生活和工作習(xí)慣、人生經(jīng)歷等多方面的因素,難以用一個(gè)固定的生成型模型來(lái)精確表達(dá)。此外這類(lèi)算法需要一些格外的信息,比如人臉的年齡信息,但是在很多應(yīng)用場(chǎng)合我們往往缺乏這類(lèi)信息。因此這類(lèi)算法的有效性和實(shí)用性受到很大的限制。
[0007]近年來(lái)國(guó)際上開(kāi)始嘗試用判別型模型來(lái)解決跨年齡階段的人臉識(shí)別問(wèn)題。其中一個(gè)很經(jīng)典的方法是采用提取局部人臉特征,比如提取局部二值模式(Local BinaryPatterns, LBP)和尺度不變特征轉(zhuǎn)換(Scale-1nvariant featuretransform, SIFT))來(lái)做特征表達(dá),然后采用非級(jí)聯(lián)子空間模型的分類(lèi)方法來(lái)做特征分類(lèi)。這種方法不僅是跨年齡階段人臉識(shí)別研究的一個(gè)很前沿的結(jié)果,雖然取得了一定的成功,但是依舊存在一些局限性,比如:
[0008](I)采用了傳統(tǒng)的特征描述符(例如LBP和SIFT等)來(lái)提取通用的人臉局部特征,而傳統(tǒng)的LBP算法是基于經(jīng)驗(yàn)編碼的方式,如U2編碼來(lái)得到最終的特征表達(dá),而在跨年齡階段人臉識(shí)別中,采用基于經(jīng)驗(yàn)的編碼方式(例如U2編碼)并不是特別恰當(dāng),因?yàn)樵诳缒挲g階段的人臉數(shù)據(jù)中,有些實(shí)際出現(xiàn)頻率很高的編碼碼字并不包含在U2編碼內(nèi),因此如果簡(jiǎn)單采用U2編碼的話將會(huì)丟失這部分信息。
[0009]( 2 )在特征分類(lèi)部分,將所有的訓(xùn)練數(shù)據(jù)放在一起同時(shí)訓(xùn)練出一個(gè)子空間模型來(lái)進(jìn)行分類(lèi)。但是在大規(guī)模數(shù)據(jù)量的情況下,這種做法難以充分利用到訓(xùn)練集里的豐富信息,因而最終的識(shí)別性能將受到影響。
[0010]綜上所述,現(xiàn)有技術(shù)提供的人臉識(shí)別方法,對(duì)跨年齡階段人臉的識(shí)別能力比較差。
【發(fā)明內(nèi)容】
[0011]本發(fā)明實(shí)施例提供了 一種人臉識(shí)別方法,旨在解決現(xiàn)有技術(shù)對(duì)跨年齡階段人臉的識(shí)別能力比較差的問(wèn)題。
[0012]一方面,提供一種人臉識(shí)別方法,所述方法包括:
[0013]A、對(duì)原始的測(cè)試人臉圖像進(jìn)行預(yù)處理;
[0014]B、采用光柵掃描的方式,基于多尺度的局部二值模型LBP描述子,提取出所述測(cè)試人臉圖像的原始碼字;
[0015]C、統(tǒng)計(jì)每個(gè)原始碼字的頻率分布,基于學(xué)習(xí)的LBP編碼對(duì)所述原始碼字編碼得到一組新碼字,基于編碼后生成的新碼字,計(jì)算所述測(cè)試人臉圖像的LBP特征;
[0016]D、根據(jù)所述測(cè)試人臉圖像的LBP特征對(duì)所述測(cè)試人臉圖像進(jìn)行識(shí)別。
[0017]在本發(fā)明實(shí)施例,米用光柵掃描的方式,基于多尺度的局部二值模型LBP描述子,提取出待測(cè)試人臉圖像的原始碼字,對(duì)年齡的變化更具有魯棒性。另外,進(jìn)行編碼時(shí),首先統(tǒng)計(jì)每個(gè)原始碼字的頻率分布;然后基于學(xué)習(xí)的LBP編碼對(duì)原始碼字編碼以得到一組更優(yōu)的新碼字,和原始碼字相比,新碼字具有分布概率更平均、緊湊性更強(qiáng)等優(yōu)點(diǎn)?;诰幋a后生成的新碼字,可得到所述測(cè)試人臉圖像的LBP特征;基于這種LBP特征對(duì)待測(cè)試人臉圖像進(jìn)行識(shí)別。這種處理過(guò)程,可以使得編碼生成的新的碼字的概率分布更加均勻,因而最終的編碼空間更加緊湊,具有更高的信息熵,從而保留更多的原始信息,更具有辨識(shí)力。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0018]圖1是本發(fā)明實(shí)施例一提供的人臉識(shí)別方法的實(shí)現(xiàn)流程圖;
[0019]圖2是本發(fā)明實(shí)施例一提供的劃分為多個(gè)子窗口的人臉圖像示意圖;
[0020]圖3是本發(fā)明實(shí)施例二提供的人臉識(shí)別方法的實(shí)現(xiàn)流程圖;
[0021]圖4a是本發(fā)明實(shí)施例二提供的對(duì)訓(xùn)練子集Al,A2進(jìn)行處理后形成的m個(gè)子空間的過(guò)程示意圖;
[0022]圖4b是本發(fā)明實(shí)施例二提供的對(duì)訓(xùn)練子集B1,B2進(jìn)行處理后得到投影矩陣PB以及中心化向量VB的過(guò)程的示意圖;
[0023]圖4c是本發(fā)明實(shí)施例二提供的測(cè)試人臉圖像進(jìn)行子空間分析的過(guò)程的示意圖?!揪唧w實(shí)施方式】
[0024]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0025]在本發(fā)明實(shí)施例中,米用光柵掃描的方式,基于多尺度的局部二值模型LBP描述子,提取出待測(cè)試人臉圖像的原始碼字,對(duì)年齡的變化更具有魯棒性。另外,進(jìn)行編碼時(shí),首先統(tǒng)計(jì)每個(gè)原始碼字的頻率分布;然后采用基于學(xué)習(xí)的LBP編碼對(duì)原始碼字編碼以得到一組更優(yōu)的新碼字;最后基于編碼所得到的新碼字對(duì)待測(cè)試人臉圖像進(jìn)行識(shí)別。
[0026]以下結(jié)合具體實(shí)施例對(duì)本發(fā)明的實(shí)現(xiàn)進(jìn)行詳細(xì)描述:
[0027]實(shí)施例一
[0028]圖1示出了本發(fā)明實(shí)施例一提供的人臉識(shí)別方法的實(shí)現(xiàn)流程,詳述如下:
[0029]在步驟SlOl中,對(duì)原始的測(cè)試人臉圖像進(jìn)行預(yù)處理。
[0030]在本實(shí)施例中,對(duì)于原始的測(cè)試人臉圖像,先做以下預(yù)處理,具體預(yù)處理的步驟包括:
[0031]步驟1、對(duì)原始的測(cè)試人臉圖像進(jìn)行適當(dāng)?shù)男D(zhuǎn),以保證測(cè)試人臉圖像位于水平位置,具體做法是使兩眼的連線和水平線平行。
[0032]步驟2、對(duì)測(cè)試人臉圖像進(jìn)行適當(dāng)?shù)姆趴s,以保證測(cè)試人臉圖像中兩眼的距離是一個(gè)固定值。
[0033]步驟3、將測(cè)試人臉圖像中的非人臉部分(比如背景等部分)切除,只保留人臉部分,切割后的人臉圖像尺寸為200*150。
[0034]步驟4、對(duì)割好后的測(cè)試人臉圖像做直方圖均衡,以補(bǔ)償光線的變化。
[0035]需要說(shuō)明的是,對(duì)訓(xùn)練人臉圖像,在提取LBP特征之前,也需要進(jìn)行預(yù)處理,預(yù)處理的過(guò)程與測(cè)試人臉圖像的處理過(guò)程相同。
[0036]在步驟S102中,采用光柵掃描的方式,基于多尺度的局部二值模型LBP描述子,提取出所述測(cè)試人臉圖像的原始碼字。
[0037]和傳統(tǒng)的人臉圖像整體外觀特征描述方式相比,局部特征往往能夠更有效地在不同尺度和不同方向上描述人臉圖像特征,因而對(duì)人臉圖像的幾何變形和光線變化具有更強(qiáng)的魯棒性。
[0038]因此本發(fā)明實(shí)施例采用基于局部特性的LBP特征描述而不是傳統(tǒng)的整體LBP特征描述。但是和國(guó)際上常用的基于某些關(guān)鍵點(diǎn)來(lái)提取局部特征的做法不同,本實(shí)施例對(duì)整幅人臉圖像采用光柵掃描方式以提取更全面更完整的局部特征。我們稱這種做法為“整體中有局部,局部中又有整體”。
[0039]具體過(guò)程詳述如下:如圖2所示,先選定一個(gè)小窗口(尺寸為16*16),然后把該窗口放置于人臉圖像的左上角,按照光柵掃描的次序,從左到右、從上到下,均勻移動(dòng)該窗口來(lái)全覆蓋的掃描整幅人臉圖像,來(lái)提取我們所需的LBP特征。為了保證掃描連續(xù)性,每次窗口滑動(dòng)的距離為窗口尺寸的一半(8pixel)。每次我們基于該窗口內(nèi)的信息用一種合適的描述子來(lái)提取局部特征,然后再移動(dòng)該窗口來(lái)提取下一窗口內(nèi)的局部特征,一直到該窗口移動(dòng)到整幅人臉圖像的右下角為止。為了使得特征具有更好的魯棒性,我們采用多尺度LBP算子。實(shí)際的應(yīng)用中采用了半徑為1、3、5、7的多尺度LBP算子來(lái)提取各個(gè)窗口的LBP特征。最后把提取出的所有這些特征排成一個(gè)列向量,在本實(shí)施例中,該列向量的維度為97920,以方便后續(xù)處理,這些列向量中存儲(chǔ)的是整幅人臉圖像的原始碼字。這種做法的優(yōu)點(diǎn)在于既可以有效的提取局部的信息,又不會(huì)遺漏整體的信息。[0040]在步驟S103中,統(tǒng)計(jì)每個(gè)原始碼字的頻率分布,基于學(xué)習(xí)的LBP編碼對(duì)原始碼字進(jìn)行編碼得到一組新碼字,基于編碼后生成的新碼字,計(jì)算所述測(cè)試人臉圖像的LBP特征。[0041 ] 近年來(lái),在眾多的提取局部特征的圖像描述子中,LBP描述子由于其簡(jiǎn)單有效而得到人們?cè)絹?lái)越多的重視和應(yīng)用。LBP的基本原理在于:用I和O描述給定的中心點(diǎn)與其相鄰的8個(gè)像素點(diǎn)之間的大小關(guān)系,然后沿水平方向排序成一個(gè)8bit的二進(jìn)制數(shù)值(從O到255, —共有256種可能性),同時(shí)米用U2編碼把這256種分布的直方圖壓縮成一個(gè)59種分布的直方圖,然后從這個(gè)直方圖的統(tǒng)計(jì)特性得到最終的LBP特征表達(dá)。U2編碼是一種經(jīng)驗(yàn)式編碼,其編碼方法是通過(guò)觀察一般圖像U2編碼的碼字分布規(guī)律而總結(jié)出來(lái)的。經(jīng)驗(yàn)認(rèn)為,對(duì)大多數(shù)圖像而言,U2碼字具有很高的出現(xiàn)頻率,因而被廣泛使用。然而,在這個(gè)跨年齡段人臉識(shí)別問(wèn)題上,我們發(fā)現(xiàn)不少U2碼字的出現(xiàn)頻率并不高,而很多出現(xiàn)頻率高的碼字卻不是U2碼字。一方面,對(duì)出現(xiàn)頻率不高的U2碼字編碼會(huì)浪費(fèi)一些編碼空間;而另一方面,不對(duì)出現(xiàn)頻率高的非U2碼字編碼又會(huì)損失一部分特征信息。
[0042]為了克服這些問(wèn)題,基于模擬退火算法的思路我們?cè)O(shè)計(jì)了一種新的編碼方案,稱為基于學(xué)習(xí)的LBP編碼,通過(guò)基于學(xué)習(xí)的LBP編碼得到一組新碼字,和原始碼字相比,新碼字具有分布概率更平均、更緊湊等特點(diǎn)。詳述如下:
[0043]假定LBP特征的256種原始碼字為Ci,其中i=l,2,…,256。將碼字Ct在訓(xùn)練集合中出現(xiàn)的概率設(shè)為f(Ci)。我們的目標(biāo)是要設(shè)計(jì)一個(gè)基于模擬退火算法思想的算法來(lái)學(xué)習(xí)出一種更有效的編碼方式:Zj = R(Ci),以便將原始碼Ci編碼為Zj,使得目標(biāo)碼的概率分布達(dá)到最優(yōu)(新碼字的概率分布最均勻),這里假定目標(biāo)碼的數(shù)目為N。
[0044]步驟11、初始化:k=0,對(duì)每一個(gè)原始碼字Ci隨機(jī)分配一個(gè)目標(biāo)碼Zj (Zj = I, 2,…N),將這種編碼方式設(shè)為Rtl,將k時(shí)刻的溫度設(shè)為:
[0045]
【權(quán)利要求】
1.一種人臉識(shí)別方法,其特征在于,所述方法包括: A、對(duì)原始的測(cè)試人臉圖像進(jìn)行預(yù)處理; B、采用光柵掃描的方式,基于多尺度的局部二值模型LBP描述子,提取出所述測(cè)試人臉圖像的原始碼字; C、統(tǒng)計(jì)每個(gè)原始碼字的頻率分布,采用基于學(xué)習(xí)的LBP編碼對(duì)所述原始碼字進(jìn)行編碼得到一組新碼字,基于編碼后生成的新碼字,計(jì)算所述測(cè)試人臉圖像的LBP特征; D、根據(jù)所述測(cè)試人臉圖像的LBP特征對(duì)所述測(cè)試人臉圖像進(jìn)行識(shí)別。
2.如權(quán)利要求1所述的方法,其特征在于,采用基于學(xué)習(xí)的編碼方法對(duì)所述原始碼字進(jìn)行編碼得到一組新碼字具體包括: Al、初始化k=0,對(duì)每一個(gè)原始碼字Ci隨機(jī)分配一個(gè)目標(biāo)碼Zj (Zj = 1,2, “.Ν),將這種編碼方式設(shè)為Rtl,將k時(shí)刻的溫度設(shè)為:
3.如權(quán)利要求1所述的方法,其特征在于,在步驟C之后,還包括: 采用級(jí)聯(lián)子空間訓(xùn)練模型對(duì)所述測(cè)試人臉圖像的LBP特征進(jìn)行處理,得到與所述測(cè)試人臉圖像的LBP特征對(duì)應(yīng)的低維特征; 根據(jù)所述低維特征對(duì)所述測(cè)試人臉圖像進(jìn)行識(shí)別。
4.如權(quán)利要求3所述的方法,其特征在于,在所述采用級(jí)聯(lián)子空間訓(xùn)練模型對(duì)所述測(cè)試人臉圖像的LBP特征進(jìn)行處理,得到與所述測(cè)試人臉圖像的LBP特征對(duì)應(yīng)的低維特征之前或之后,還包括: 根據(jù)步驟A、B、C所述的方法獲得訓(xùn)練人臉圖像的LBP特征; 采用級(jí)聯(lián)子空間訓(xùn)練模型對(duì)所述訓(xùn)練人臉圖像的LBP特征進(jìn)行處理,得到與所述訓(xùn)練人臉圖像的LBP特征對(duì)應(yīng)的低維特征。
5.如權(quán)利要求3所述的方法,其特征在于,所述采用級(jí)聯(lián)子空間訓(xùn)練模型對(duì)所述訓(xùn)練人臉圖像的LBP特征進(jìn)行處理,得到與所述訓(xùn)練人臉圖像的LBP特征對(duì)應(yīng)的低維特征具體包括: 將訓(xùn)練人臉圖像的LBP特征劃分為兩個(gè)數(shù)量均等的訓(xùn)練子集; 將第一個(gè)訓(xùn)練子集的年輕人臉特征集合記為Al,對(duì)應(yīng)的年老人臉特征集合記為A2 ; 第二訓(xùn)練子集的年輕人臉特征集合記為BI,對(duì)應(yīng)的年老人臉特征集合記為B2 ; 將訓(xùn)練子集A1,A2的每個(gè)高維特征劃分為等長(zhǎng)的m段子特征,形成兩個(gè)m段的訓(xùn)練集,然后對(duì)m段訓(xùn)練集對(duì)應(yīng)的子特征進(jìn)行統(tǒng)一子空間分析,得到該訓(xùn)練集對(duì)應(yīng)的子空間投影矩陣PAi以及相應(yīng)的中心化向量VAi ; 將訓(xùn)練子集B1,B2的每個(gè)高維特征劃分為等長(zhǎng)的m段子特征,形成兩個(gè)m段的訓(xùn)練集,然后利用所述子空間投影矩陣PAi以及中心化矢量VAi分別對(duì)每段訓(xùn)練集進(jìn)行子空間投影,分別得到m段子特征的子空間表示,接著將BI,B2的m段子特征的子空間表示分別拼接成單個(gè)子空間表示,最后對(duì)這些拼接后的子空間表示進(jìn)行再一次的子空間分析,得到投影矩陣PB以及中心化向量VB。
6.如權(quán)利要求5所述的方法,其特征在于,所述采用級(jí)聯(lián)子空間訓(xùn)練模型對(duì)所述測(cè)試人臉圖像的LBP特征進(jìn)行處理,得到與所述測(cè)試人臉圖像的LBP特征對(duì)應(yīng)的低維特征具體包括: 將所述測(cè)試人臉圖像的LBP特征劃分為等長(zhǎng)的m段子特征; 利用所述子空間投影矩陣PAi以及中心化向量VAi分別對(duì)所述m段子特征進(jìn)行子空間投影,得到m段子特征的子 空間表示,并將該m段子空間表示拼接成單個(gè)子空間表示; 利用所述子空間投影矩陣PB以及中心化向量VB對(duì)拼接成的子空間表示進(jìn)行再一次的子空間投影。
【文檔編號(hào)】G06K9/00GK103902964SQ201210590165
【公開(kāi)日】2014年7月2日 申請(qǐng)日期:2012年12月31日 優(yōu)先權(quán)日:2012年12月31日
【發(fā)明者】李志鋒, 龔迪洪, 喬宇, 劉建莊, 湯曉鷗 申請(qǐng)人:深圳先進(jìn)技術(shù)研究院