專利名稱:基于特征層定序測(cè)量統(tǒng)計(jì)描述的人臉識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)視覺、數(shù)字圖像處理和模式識(shí)別等技術(shù)領(lǐng)域,特別涉及一種基于特征層定序測(cè)量統(tǒng)計(jì)描述的人臉識(shí)別方法。
背景技術(shù):
自從1973京都大學(xué)的TakeoKanade博士完成的第一篇關(guān)于計(jì)算機(jī)自動(dòng)進(jìn)行人臉識(shí)別的博士論文開始,人臉識(shí)別系統(tǒng)的開發(fā)便受到學(xué)術(shù)界和工業(yè)界的高度關(guān)注。一方面是由于人臉識(shí)別在國(guó)家安全、交通、公安、司法和社會(huì)公益等公共領(lǐng)域有重大的技術(shù)需求;另一方面在廣大民用領(lǐng)域,也有諸多應(yīng)用場(chǎng)合,如電子商務(wù)、人臉門禁、人臉考勤等等。人臉識(shí)別技術(shù)通過分析不同個(gè)體人臉之間的差異對(duì)人的身份進(jìn)行識(shí)別和認(rèn)證,具有直觀、非侵犯性等優(yōu)點(diǎn),不像指紋識(shí)別,使用時(shí)需要跟傳感器接觸,此外只有有經(jīng)驗(yàn)的技術(shù)人員來才能根據(jù)指紋圖像直接進(jìn)行身份認(rèn)證。同時(shí),可見光人臉圖像的采集設(shè)備只需要普通的攝像頭,在當(dāng)今的社會(huì)已經(jīng)非常普遍,因此利用簡(jiǎn)單的設(shè)備就能完成人臉圖像的采集。然而,人臉圖像會(huì)隨著年齡增長(zhǎng),表情變化、化妝、環(huán)境光照變化、面部遮擋(如墨鏡、圍巾),以及姿態(tài)的變化而發(fā)生一定的改變。因此如何設(shè)計(jì)一種高區(qū)分性和強(qiáng)魯棒性的人臉特征表示方法變得尤為重要?,F(xiàn)有的人臉特征表示方法為了在算法性能上得到保證往往在算法的時(shí)效性上得到妥協(xié)。因此如何設(shè)計(jì)一種比對(duì)快速同時(shí)又具有強(qiáng)區(qū)分性的人臉特征表示方法是改善現(xiàn)有人臉識(shí)別系統(tǒng)性能,推廣大規(guī)模應(yīng)用的一個(gè)重要研究課題。
發(fā)明內(nèi)容
本發(fā)明的目的是提出一種基于特征層定序測(cè)量統(tǒng)計(jì)描述的人臉識(shí)別方法,即在現(xiàn)有人臉特征描述方法之后采用定序測(cè)量統(tǒng)計(jì)描述的方法來表示人臉圖像,用于人臉識(shí)別。本發(fā)明提出的基于特征層定序測(cè)量統(tǒng)計(jì)描述的人臉識(shí)別方法包括步驟人臉圖像歸一化;基于Gabor幅值特征的定序測(cè)量編碼;對(duì)編碼后的圖像按特征抽取的方向順序進(jìn)行加權(quán)拼接;對(duì)拼接后的圖像進(jìn)行空間直方圖信息統(tǒng)計(jì);對(duì)每一個(gè)子區(qū)域的直方圖信息用子空間分析的方法進(jìn)行增強(qiáng);對(duì)每一個(gè)增強(qiáng)后的特征分別訓(xùn)練權(quán)重;用加權(quán)的區(qū)域增強(qiáng)描述子的余弦距離來度量?jī)煞四槇D像的相似性。本發(fā)明的人臉識(shí)別方法將傳統(tǒng)Gabor特征通過定序測(cè)量統(tǒng)計(jì)描述進(jìn)一步編碼壓縮獲取更緊湊更具有區(qū)分性的人臉表示,同時(shí)通過分塊直方圖統(tǒng)計(jì)和局部子空間分析使該描述得到進(jìn)一步增強(qiáng),最后在匹配時(shí)通過計(jì)算所有塊加權(quán)的余弦距離來度量?jī)煞四槇D像之間的相似性。該方法在人臉編碼時(shí)一方面繼承了原始Gabor的強(qiáng)判別能力,能區(qū)分不同個(gè)體的人臉圖像;另一方面又汲取了定序測(cè)量的魯棒性,抑制了相同個(gè)體的不同圖像的局部變化;最后通過直方圖統(tǒng)計(jì)描述和子空間分析的方法使總的特征維度得到進(jìn)一步壓縮,能容忍一定的噪聲干擾。本發(fā)明具有高精度、高魯棒性和匹配速度快的特點(diǎn)。本發(fā)明可用于大范圍人群的一對(duì)一的身份認(rèn)證系統(tǒng)或者一對(duì)多的身份識(shí)別系統(tǒng)。
圖I為本發(fā)明基于特征層定序測(cè)量統(tǒng)計(jì)描述的人臉識(shí)別方法的流程圖;圖2為人臉圖像歸一化示意圖,其中圖2a是攝像頭采集到的人臉圖像,圖2b為圖2a的歸一化結(jié)果;圖3為人臉特征提取過程示意圖;圖4為圖2b的5個(gè)尺度8個(gè)方向的Gabor濾波幅值響應(yīng)圖;圖5為I個(gè)尺度4個(gè)方向的二極子、三極子定序測(cè)量濾波器組;圖6為4張來自兩個(gè)不同個(gè)體的人臉圖像在尺度為I方向?yàn)镮的Gabor幅值響應(yīng)后采用圖4中第I個(gè)定序測(cè)量濾波器編碼的結(jié)果,其中圖6a是4幅歸一化后的人臉圖像,圖6b是4幅基于Gabor幅值定序測(cè)量編碼的結(jié)果;圖7為基于Gabor幅值定序測(cè)量編碼方向拼接的不意圖;圖8為人臉非重疊區(qū)域劃分示意圖;圖9為利用Fisher準(zhǔn)則計(jì)算的不同尺度下人臉每個(gè)區(qū)域權(quán)重示意圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對(duì)本發(fā)明進(jìn)一步詳細(xì)說明?,F(xiàn)有的人臉識(shí)別系統(tǒng)總體分為軟件和硬件兩大模塊即人臉圖像的獲取裝置和人臉識(shí)別算法。人臉識(shí)別算法包括人臉歸一化、特征提取和特征相似度度量三個(gè)步驟。本發(fā)明提出的方法是對(duì)人臉識(shí)別軟件模塊的改進(jìn)。本發(fā)明的人臉識(shí)別方法采用定序測(cè)量濾波器編碼人臉圖像在不同尺度不同方向的Gabor幅值響應(yīng);其后通過在同一尺度同一定序測(cè)量編碼結(jié)果按方向順序進(jìn)行拼接獲取更穩(wěn)定、更緊湊的人臉表示;同時(shí)利用空間直方圖統(tǒng)計(jì)和子空間分析的方法使人臉圖像的局部特征得到增強(qiáng)和空間結(jié)構(gòu)特征得到保持。本發(fā)明的方法充分描述了不同個(gè)體的不同人臉圖像在不同尺度和不同方向之間的差異,同時(shí)在某種程度上也抑制了同一個(gè)體在類內(nèi)發(fā)生的局部變化。由于采用了空間直方圖統(tǒng)計(jì)的策略,能克服一定的噪聲干擾。度量時(shí),采用余弦距離進(jìn)行匹配速度非???,適用于大范圍人群的一對(duì)多身份識(shí)別系統(tǒng),和其他需要安全性方法的諸多應(yīng)用系統(tǒng)中。本發(fā)明對(duì)硬件配置不高,僅需普通的個(gè)人電腦和攝像頭即可實(shí)現(xiàn),易于在實(shí)際應(yīng)用中快速搭建系統(tǒng)。在使用本發(fā)明的方法進(jìn)行人臉識(shí)別之前,用戶需要向系統(tǒng)注冊(cè)自己的人臉模板,然后才能進(jìn)行識(shí)別。該系統(tǒng)可以運(yùn)行于人臉識(shí)別系統(tǒng)常見的兩種模式1)驗(yàn)證模式又稱I對(duì)I的匹配模式。該模式要求用戶向系統(tǒng)提出身份認(rèn)證的申請(qǐng),同時(shí)向系統(tǒng)聲明自己的身份,系統(tǒng)通過對(duì)比即時(shí)從用戶身上提取的人臉特征和用戶聲稱的個(gè)體在注冊(cè)時(shí)存儲(chǔ)于數(shù)據(jù)庫(kù)中的人臉特征模板,若相似度大于一定的閾值,則系統(tǒng)判定為身份認(rèn)證通過,該模式廣泛應(yīng)用于需要進(jìn)行訪問控制的情形。2)識(shí)別模式S卩I對(duì)多的匹配模式。該模式用戶不需申明自己的身份信息,系統(tǒng)完全自動(dòng)識(shí)別給出用戶的身份,或者給出該用戶不在注冊(cè)名單之列的結(jié)論。因?yàn)樵谧R(shí)別模式中包含驗(yàn)證模式,因此識(shí)別模式是一種比驗(yàn)證模式更高級(jí)同時(shí)難度也越大的識(shí)別方式。該模式在國(guó)防、刑偵和司法鑒定的應(yīng)用較多。
圖I為本發(fā)明的基于特征層定序測(cè)量統(tǒng)計(jì)描述的人臉識(shí)別方法流程圖。參照?qǐng)D1,本發(fā)明的基于特征層定序測(cè)量統(tǒng)計(jì)描述的人臉識(shí)別方法主要包括以下五個(gè)步驟步驟一,進(jìn)行人臉圖像歸一化。首先采集人臉圖像,圖2a中以舉例的方式示出了采集的人臉圖像,然后將檢測(cè)到的人臉的雙眼坐標(biāo)中心平移到圖像中心并旋轉(zhuǎn),使兩眼的y坐標(biāo)相同。然后進(jìn)行圖像的縮放變化,使所有人臉的瞳距保持在設(shè)定值。以兩眼中心為坐標(biāo)原點(diǎn),按同一尺寸上下左右分割出歸一化后的人臉圖像,如圖2b所示。步驟二,提取人臉圖像特征。參照?qǐng)D3,該步驟進(jìn)一步包括Gabor幅值特征提??;基于Gabor幅值特征的定序測(cè)量編碼;對(duì)編碼后的圖像進(jìn)行方向拼接;對(duì)拼接后的圖像分塊并對(duì)每一塊統(tǒng)計(jì)直方圖信
肩、O
其中,Gabor幅值特征提取是將歸一化后的人臉圖像用方向?yàn)閡尺度為v的Gabor濾波器進(jìn)行濾波,并計(jì)算幅值,且u = 0,1,2,3,4,5,6,7同時(shí)v = 0,1,2,3,4時(shí)的Gabor幅值圖如圖4所示。方向?yàn)閡尺度為V的Gabor幅值特征計(jì)算公式可以表示為如下所示,其中I(x,y)是歸一化后的人臉圖像,Wu,v(z)是方向?yàn)閡尺度為V的Gabor濾波器組,Gu,v(x,y)為Gabor的濾波響應(yīng),Im(Gu,v(x, y))和Re (GUjV(x, y))分別為Gabor的虛部響應(yīng)和實(shí)部響應(yīng),Mu,v(x, y)表示Gabor的幅值響應(yīng)
_] Muy (x, y) = ^jlm(Guv (x, y)f + Re(GMV (x, y)fGu,v(x,y) = I(x,y)*Wu,v(z)
k 2 ( IM2H'「,XFwv(Z) = -^ee、v.z _el
,(7
(kc o s \ku v = , kv = Ji /2(v+2)/2, 4)u = u( 3i /8)
, {kv Sm (j)u Ju = 0,1,2, 3,4, 5,6, 7v = 0,1,2,3,4基于Gabor幅值特征的定序測(cè)量編碼需要先設(shè)計(jì)多極子定序測(cè)量濾波器(見圖5),然后用設(shè)計(jì)好定序測(cè)量濾波器對(duì)每個(gè)尺度每個(gè)方向的Gabor幅值特征進(jìn)行濾波編碼,得到二值的(方向?yàn)?尺度為0的Gabor幅值被圖5中第I行第一列的二極子定序測(cè)量濾波器濾波編碼后的圖如圖6所示)。其中,Mu,v(x,y)表示歸一化后的人臉圖像被方向?yàn)閡尺度為V的Gabor濾波器濾波后的幅值響應(yīng),N+和N-分別表示第t個(gè)多極子定序
測(cè)量濾波器的正負(fù)極子的個(gè)數(shù),表示第t多極子定序測(cè)量濾波器的第i個(gè)正極子,^表示第t多極子定序測(cè)量濾波器的第j個(gè)負(fù)極子,定序測(cè)量濾波器的每個(gè)極子均為高斯濾波器,*是卷積符號(hào),GOM:v(X,>0表示對(duì)方向?yàn)閡尺度為V的Gabor幅值響應(yīng)的第t個(gè)
多極子定序測(cè)量濾波器在位置(X,y)的濾波結(jié)果;得到GOMtO,>0之后,若其值大于0,那么將該點(diǎn)的Gabor幅值定序測(cè)量編碼為1,否則編碼為O。GOMtuv (x, y) = GOMt: (x, y) + GOMtJv (x, y)
權(quán)利要求
1.一種基于特征層定序測(cè)量統(tǒng)計(jì)描述的人臉識(shí)別方法,該方法包括步驟 人臉圖像預(yù)處理; 對(duì)預(yù)處理后的人臉圖像進(jìn)行基于Gabor幅值特征的定序測(cè)量編碼; 對(duì)編碼后的圖像按特征抽取的方向順序進(jìn)行加權(quán)拼接; 對(duì)拼接后的圖像進(jìn)行空間直方圖信息統(tǒng)計(jì); 對(duì)每一個(gè)子區(qū)域的直方圖信息用子空間分析的方法進(jìn)行增強(qiáng); 對(duì)每一個(gè)增強(qiáng)后的特征分別訓(xùn)練權(quán)重; 用加權(quán)的區(qū)域增強(qiáng)描述子的余弦距離來度量?jī)煞四槇D像的相似性。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述的基于Gabor幅值特征的定序測(cè)量編碼包括步驟 對(duì)歸一化后的人臉圖像進(jìn)行5個(gè)尺度8個(gè)方向的Gabor幅值特征提取; 設(shè)計(jì)多極子定序測(cè)量濾波器; 對(duì)每個(gè)尺度每個(gè)方向的Gabor幅值圖像分別進(jìn)行定序測(cè)量編碼。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述的多極子定序測(cè)量濾波器由多個(gè)高斯濾波器組成,每個(gè)高斯濾波器為一個(gè)極子,并按極子系數(shù)的正負(fù)分為正極子和負(fù)極子,同時(shí)要求所有極子的系數(shù)和為0,通過調(diào)節(jié)極子之間的距離,生成不同尺度的定序測(cè)量濾波器。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述的基于Gabor幅值的定序測(cè)量編碼計(jì)算公式如下
5.根據(jù)權(quán)利要求4所述的方法,其特征在,基于Gabor幅值的定序測(cè)量編碼后的圖像按特征抽取的方向順序進(jìn)行加權(quán)拼接,其計(jì)算公式表示為
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,對(duì)拼接后的圖像進(jìn)行空間直方圖信息統(tǒng)計(jì)可由如下公式表示
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,對(duì)每一個(gè)區(qū)域的直方圖信息用子空間分析的方法進(jìn)行增強(qiáng)包括步驟對(duì)每一個(gè)區(qū)域的直方圖特征采用子空間分析的方法來計(jì)算投影變換矩陣,將原始直方圖特征按投影方向投射到最具判別性的子空間,從而得到局部增強(qiáng)的人臉特征描述。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,對(duì)于人臉的不同區(qū)域穩(wěn)定性和區(qū)分能力不同,設(shè)置不同的權(quán)重,尺度為V并且用第t個(gè)定序測(cè)量編碼拼接結(jié)果的權(quán)重為W(t,v,k)。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,用加權(quán)的區(qū)域增強(qiáng)描述子的余弦距離來度量第P幅人臉圖像和第q幅人臉圖像的相似度,若相似度大于某一閾值,則識(shí)別為同一個(gè)人,否則認(rèn)為是不同的人。
10.根據(jù)權(quán)利要求1-9所述的方法,其特征在于,所述方法用于人臉識(shí)別模式或人臉驗(yàn)證模式。
全文摘要
本發(fā)明公開了一種基于特征層定序測(cè)量統(tǒng)計(jì)描述的人臉識(shí)別方法,包括人臉圖像預(yù)處理;對(duì)歸一化人臉圖像進(jìn)行多尺度多方向的特征抽取獲得特征圖;對(duì)每個(gè)特征圖進(jìn)行定序測(cè)量編碼;對(duì)編碼后的圖像按特征抽取的方向順序進(jìn)行加權(quán)拼接;對(duì)拼接后的圖像進(jìn)行空間直方圖信息統(tǒng)計(jì);對(duì)每個(gè)子區(qū)域的直方圖信息用子空間分析的方法逐個(gè)進(jìn)行增強(qiáng);對(duì)每個(gè)子區(qū)域的重要性用權(quán)值表示;兩幅人臉圖像的相似度度量。利用本發(fā)明,可以在多個(gè)尺度多個(gè)方向?qū)θ四槇D像進(jìn)行表示,能夠快速有效的對(duì)攝像頭采集到的人臉圖像進(jìn)行身份識(shí)別。本發(fā)明可廣泛用于使用人臉識(shí)別進(jìn)行身份認(rèn)證和公安刑偵對(duì)犯罪嫌疑人圖片篩選等諸多應(yīng)用系統(tǒng)中,尤其對(duì)有遮擋情況下的人臉識(shí)別非常有效。
文檔編號(hào)G06K9/00GK102629320SQ20121008439
公開日2012年8月8日 申請(qǐng)日期2012年3月27日 優(yōu)先權(quán)日2012年3月27日
發(fā)明者孫哲南, 柴振華, 譚鐵牛 申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所