一種基于韋伯法則的局部多值模式的人臉識(shí)別方法
【專利摘要】本發(fā)明公開(kāi)了一種基于韋伯法則的局部多值模式的人臉識(shí)別方法,分為訓(xùn)練階段和識(shí)別階段;訓(xùn)練階段,首先要提取訓(xùn)練樣本的特征,對(duì)樣本進(jìn)行三級(jí)編碼;然后將三級(jí)編碼都轉(zhuǎn)換為Uniform模式,然后對(duì)經(jīng)過(guò)三級(jí)編碼后的圖像分別進(jìn)行均勻的、無(wú)交疊的分塊處理,再對(duì)每個(gè)分塊提取特征直方圖,將每個(gè)塊每級(jí)的特征直方圖連接得到一幅人臉圖像的整體特征直方圖;識(shí)別階段,按照上述特征提取的方法提取待測(cè)樣本的特征直方圖作為待測(cè)特征,然后運(yùn)用χ2概率統(tǒng)計(jì)和最近鄰分類方法,對(duì)待測(cè)樣本進(jìn)行識(shí)別。本發(fā)明在人臉識(shí)別中對(duì)人臉的光照和姿態(tài)具有更佳的魯棒性,并提高了人臉的識(shí)別率。
【專利說(shuō)明】—種基于韋伯法則的局部多值模式的人臉識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及模式識(shí)別、圖像處理和計(jì)算機(jī)視覺(jué)等技術(shù),尤其涉及一種基于韋伯法則的局部多值模式(Weber-based Local Multiple Patterns, WLMP)的人臉識(shí)別方法。
【背景技術(shù)】
[0002]近年來(lái),人臉識(shí)別技術(shù)已廣泛用于政府、軍隊(duì)、銀行、社會(huì)福利保障、電子商務(wù)、安全防務(wù)等領(lǐng)域,與傳統(tǒng)的身份鑒定方式相比,人臉識(shí)別的最大的特點(diǎn)就是更安全、保密和方便性。人臉識(shí)別獨(dú)具的活性判別能力,保證他人無(wú)法以非活性照片乃至人頭欺騙識(shí)別系統(tǒng)。此外,人臉識(shí)別速度快,不易被察覺(jué)。與其他生物識(shí)別技術(shù)相比,人臉識(shí)別屬于一種自動(dòng)識(shí)別技術(shù),一秒時(shí)間內(nèi)可以識(shí)別好幾次。不被察覺(jué)的特點(diǎn)對(duì)于一種識(shí)別方法也很重要,這會(huì)使該識(shí)別方法不令人反感,并且因?yàn)椴蝗菀滓鹑说淖⒁舛蝗菀妆黄垓_。與其他生物識(shí)別技術(shù)相比,人臉識(shí)別在實(shí)用性方面具有獨(dú)到的技術(shù)優(yōu)勢(shì)。人臉識(shí)別是不需要使用者配合的生物識(shí)別方法,因而操作隱蔽性強(qiáng),特別適合于安全防范、罪犯監(jiān)控、罪犯抓捕。同時(shí),它采用非接觸式采集,沒(méi)有侵犯性,容易被接受。因而,人們對(duì)該技術(shù)寄予厚望,期望能夠滿足從國(guó)家公共安全、社會(huì)安全到金融安全以及人機(jī)交互等各類應(yīng)用的需要。開(kāi)發(fā)出高效的人臉識(shí)別系統(tǒng)具有重要的實(shí)際意義和研究?jī)r(jià)值。例如,目前正在推行的基于“人臉識(shí)別”的支付系統(tǒng)。隨著技術(shù)的進(jìn)一步成熟和社會(huì)認(rèn)同度的提高,人臉識(shí)別技術(shù)將應(yīng)用在更多的領(lǐng)域。
[0003]局部二值模式(Local Binary Pattern,LBP)是一種灰度范圍內(nèi)的紋理度量,最初是由Ojala等人提出的,并將其成功應(yīng)用于紋理分類(見(jiàn)參考文獻(xiàn)I)。原始LBP算子共有256種變換模式,使用Uniform后減為59種(見(jiàn)參考文獻(xiàn)2)。LBP是一種魯棒的描述紋理的算子,由于其紋理判別屬性及低計(jì)算代價(jià),后來(lái)被引用到人臉識(shí)別當(dāng)中,并取得了較好的效果,但是在光照變化和姿態(tài)變化的測(cè)試集上,LBP人臉識(shí)別結(jié)果仍不是很理想(見(jiàn)參考文獻(xiàn)3)。后來(lái)LBP被拓展到三值編碼情況,提出了局部三值模式(Local Ternary Patterns,LTP)(見(jiàn)參考文獻(xiàn)4),然而在LTP中選擇合適的閾值t是一件非常困難的事情,還需要進(jìn)一步的改進(jìn)。Yue Ming(見(jiàn)參考文獻(xiàn)5)等人用LBP進(jìn)行基于深度圖的3D人臉識(shí)別時(shí),發(fā)現(xiàn)僅對(duì)相鄰和中心樣本二值化分不能夠有效區(qū)分深度的差異,為此他們提出了 3DLBP,3DLBP算子對(duì)中心和相鄰像素的差值進(jìn)行再次編碼,但是3DLBP不能自動(dòng)確定上限量,上限量的選擇對(duì)識(shí)別結(jié)果有很大的影響。19世紀(jì)心理學(xué)家韋伯發(fā)現(xiàn),響應(yīng)與背景的差同背景之比是一常數(shù)(即 Weber 法則),J.Chen 等人根據(jù) Weber 法則提出了 Weber Local Descriptor (WLD)特征描述算子(見(jiàn)參考文獻(xiàn)6)。WLD算子用所有相鄰?fù)行南袼氐牟罘种低尘爸饶MWeber法則,然后取arctan函數(shù)值進(jìn)行角度和幅度值編碼。WLD的這個(gè)策略顯然有提高的空間。在LBP,LTP和WLD等特征描述子的基礎(chǔ)之上,我們有必要進(jìn)一步研究基于韋伯法則的局部多值模式描述子用于人臉識(shí)別。
[0004]參考文獻(xiàn)1:《帶有基于特征分布的分類的紋理措施對(duì)比研究》,載《國(guó)際模式識(shí)別期干丨J》(Ojala T., Matti P and David H.‘A comparative study of texture measureswith classification based on featured Distributions’.Pattern recognition,1996.29(1), pp51-59.)
[0005]參考文獻(xiàn)2:《基于多分辨率灰度和旋轉(zhuǎn)不變性的局部二元模式的紋理分類》,載《國(guó)際模式分析與機(jī)器智能期刊》,(Ojala, T., Pietikainen,M.‘MultiresolutionGray-Scale and Rotation Invariant Texture Classification with Local BinaryPatterns’.1EEE Transactions on Pattern Analysis and Machine Intelligence, 2002,24(7), pp.971-987.)
[0006]參考文獻(xiàn)3:《基于局部二值模式的人臉識(shí)別》,載《第八屆歐洲計(jì)算機(jī)視覺(jué)年會(huì)》(Ahonen, T.,Hadid, A.,Pietikainen, M..iFace recognition with local binarypatterns’.8th European Conference on Computer Vision, 2004, pp.469 - 481)
[0007]參考文獻(xiàn)4:《復(fù)雜光照條件下基于增強(qiáng)的局部特征紋理的人臉識(shí)別》,載《第三屆臉孔與手勢(shì)分析與建模國(guó)際會(huì)議論文集》(Tan X Y, Triggs B.‘Enhanced localtexture feature sets for face recognition under difficult lighting conditions’.In:Proceedings of the 3rd International Conference on Analysis and Modeling ofFaces and Gestures.Rio de Janeiro, Brazil: Springer, 2007.168-182)
[0008]參考文獻(xiàn)5:《使用學(xué)習(xí)相關(guān)的特征的魯棒的三維人臉識(shí)別》,載《第十屆國(guó)際信號(hào)處理會(huì)議》(Yue Ming, Qiuqi Ruan, Xueqiao Wang, Meiru Mu.‘Robust3D FaceRecognition using Learn Correlative Features’.1n:Proceeding of SignalProcessing(ICSP),2010IEEE10th International Conference on,2010,ppl382_1385)
[0009]參考文獻(xiàn)6:《WLD,一種魯棒的圖像局部描述子》,載《國(guó)際模式分析與機(jī)器智能期干lj》(Jie Chen, Shiguang Shan, Chu He, Guoying Zhao, MalliPictikaincn, Xilin Chen, WenGao, iWLDiA Robust Local Image Descriptor’.IEEE Transactions on Pattern Analysisand Machine Intelligence,2010,pp.1705-1720)
【發(fā)明內(nèi)容】
[0010]發(fā)明目的:為了克服現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種基于韋伯法則的局部多值模式的人臉識(shí)別方法,在人臉識(shí)別問(wèn)題上,將LBP算子和LTP算子與Weber法則結(jié)合,并借鑒3DLBP編碼方式來(lái)進(jìn)行編碼,得到特征直方圖,并利用最近鄰分類來(lái)進(jìn)行人臉識(shí)另O,該方法在人臉識(shí)別中對(duì)光照和姿態(tài)具有更佳的魯棒性,并提高了人臉的識(shí)別率。
[0011]技術(shù)方案:為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為:
[0012]一種基于韋伯法則的局部多值模式的人臉識(shí)別方法,分為訓(xùn)練階段和識(shí)別階段。
[0013]所述訓(xùn)練階段的方法為:首先將所有訓(xùn)練樣本的每張人臉圖像進(jìn)行三級(jí)編碼,三級(jí)編碼中的O級(jí)編碼為L(zhǎng)BP編碼,I級(jí)編碼和2級(jí)編碼為positive編碼和negative編碼,每一個(gè)訓(xùn)練樣本最終得到三幅編碼圖;然后將每一個(gè)訓(xùn)練樣本的三幅編碼圖分別轉(zhuǎn)換為三幅Uniform模式的編碼圖;再對(duì)每幅Uniform模式的編碼圖進(jìn)行均勻、無(wú)交疊的分塊處理,得到若干子塊;最后對(duì)每個(gè)子塊提取特征直方圖,對(duì)于同一個(gè)訓(xùn)練樣本,將三幅Uniform模式的編碼圖的所有子塊的特征直方圖進(jìn)行整合得到一幅人臉圖像的整體WLMP特征直方圖,構(gòu)成訓(xùn)練樣本集的特征集合。
[0014]所述識(shí)別階段的方法為:首先將所有待測(cè)樣本的每張人臉圖像進(jìn)行三級(jí)編碼,三級(jí)編碼中的O級(jí)編碼為L(zhǎng)BP編碼,I級(jí)編碼和2級(jí)編碼為positive編碼和negative編碼,每一個(gè)待測(cè)樣本最終得到三幅編碼圖;然后將每一個(gè)待測(cè)樣本的三幅編碼圖分別轉(zhuǎn)換為三幅Uniform模式的編碼圖;再對(duì)每幅Uniform模式的編碼圖進(jìn)行均勻、無(wú)交疊的分塊處理,得到若干子塊;最后對(duì)每個(gè)子塊提取特征直方圖,對(duì)于同一個(gè)待測(cè)樣本,將三幅Uniform模式的編碼圖的所有子塊的特征直方圖進(jìn)行整合得到一幅人臉圖像的整體WLMP特征直方圖,作為待測(cè)特征直方圖;檢索訓(xùn)練樣本集的特征集合,通過(guò)X 2概率統(tǒng)計(jì)和最近鄰分類識(shí)別方法預(yù)測(cè)待測(cè)特征直方圖所屬的對(duì)象。
[0015]所述三級(jí)編碼的方法如下:
[0016](I)對(duì)人臉圖像計(jì)算3X3鄰域像素同心像素的差Λ I ;
[0017](2)對(duì)Λ I進(jìn)行傳統(tǒng)的LBP編碼,即方向編碼,實(shí)現(xiàn)O級(jí)編碼;
[0018](3)對(duì)Λ I借鑒WLD的編碼策略進(jìn)行類似LTP的編碼:首先,將[0,π /2]范圍劃分為 0、1、2 和 3 四個(gè)區(qū)間段,分別為[0,Ji /8)、[ /8,Ji /4)、[ /4,3 /8)和[3 π /8,π /2);其次,對(duì)某像素點(diǎn)鄰域內(nèi)的八個(gè)像素點(diǎn)計(jì)算arctan(| | Λ 11 I/I),即幅度編碼,根據(jù)arctan ( | Δ I /I)的計(jì)算結(jié)果,將鄰域內(nèi)的每個(gè)像素點(diǎn)每劃分到四個(gè)區(qū)間段中的一個(gè),得到該像素點(diǎn)鄰域內(nèi)的八個(gè)像素點(diǎn)的arctan(| Δ?| |/1)值所屬區(qū)間的編號(hào),對(duì)該編號(hào)按照3DLBP的編碼方式得到兩組編碼,這兩組編碼分別為I級(jí)編碼和2級(jí)編碼;假設(shè)某像素點(diǎn)鄰域內(nèi)的八個(gè)像素點(diǎn)的arctan( | Δ?| |/1)值所屬區(qū)間編號(hào)依次為32120123,那么按照3DLBP的編碼方式得到兩組編碼11010011和10110101,則稱11010011和10110101分別為該像素點(diǎn)的I級(jí)編碼和2級(jí)編碼。
[0019]所述Uniform模式為,當(dāng)二進(jìn)制編碼被視為首尾連接的環(huán)形時(shí),當(dāng)該二進(jìn)制編碼至多存在兩處由O到I或由I到O的轉(zhuǎn)換時(shí),該二進(jìn)制編碼為Uniform模式,否則該二進(jìn)制
編碼為非Uniform模式;即對(duì)于二進(jìn)制編碼S1S2S3S4S5S6S7S8,若
【權(quán)利要求】
1.一種基于韋伯法則的局部多值模式的人臉識(shí)別方法,其特征在于:分為訓(xùn)練階段和識(shí)別階段: 所述訓(xùn)練階段的方法為:首先將所有訓(xùn)練樣本的每張人臉圖像進(jìn)行三級(jí)編碼,三級(jí)編碼中的O級(jí)編碼為L(zhǎng)BP編碼,I級(jí)編碼和2級(jí)編碼為positive編碼和negative編碼,每一個(gè)訓(xùn)練樣本最終得到三幅編碼圖;然后將每一個(gè)訓(xùn)練樣本的三幅編碼圖分別轉(zhuǎn)換為三幅Uniform模式的編碼圖;再對(duì)每幅Uniform模式的編碼圖進(jìn)行均勻、無(wú)交疊的分塊處理,得到若干子塊;最后對(duì)每個(gè)子塊提取特征直方圖,對(duì)于同一個(gè)訓(xùn)練樣本,將三幅Uniform模式的編碼圖的所有子塊的特征直方圖進(jìn)行整合得到一幅人臉圖像的整體WLMP特征直方圖,構(gòu)成訓(xùn)練樣本集的特征集合; 所述識(shí)別階段的方法為:首先將所有待測(cè)樣本的每張人臉圖像進(jìn)行三級(jí)編碼,三級(jí)編碼中的O級(jí)編碼為L(zhǎng)BP編碼,I級(jí)編碼和2級(jí)編碼為為positive編碼和negative編碼,每一個(gè)待測(cè)樣本最終得到三幅編碼圖;然后將每一個(gè)待測(cè)樣本的三幅編碼圖分別轉(zhuǎn)換為三幅Uniform模式的編碼圖;再對(duì)每幅Uniform模式的編碼圖進(jìn)行均勻、無(wú)交疊的分塊處理,得到若干子塊;最后對(duì)每個(gè)子塊提取特征直方圖,對(duì)于同一個(gè)待測(cè)樣本,將三幅Uniform模式的編碼圖的所有子塊的特征直方圖進(jìn)行整合得到一幅人臉圖像的整體WLMP特征直方圖,作為待測(cè)特征直方圖;檢索訓(xùn)練樣本集的特征集合,通過(guò)X 2概率統(tǒng)計(jì)和最近鄰分類識(shí)別方法預(yù)測(cè)待測(cè)特征直方圖所屬的對(duì)象。
2.根據(jù)權(quán)利要求1所述的基于韋伯法則的局部多值模式的人臉識(shí)別方法,其特征在于:所述三級(jí)編碼的方法如下: (1)對(duì)人臉圖像計(jì)算3X3鄰域像素同心像素的差ΛI(xiàn) ; (2)對(duì)ΛI(xiàn)進(jìn)行傳統(tǒng)的LBP編碼,即方向編碼,實(shí)現(xiàn)O級(jí)編碼; (3)對(duì)ΛI(xiàn)借鑒WLD的編碼策略進(jìn)行類似LTP的編碼:首先,將[0,π /2]范圍劃分為0、1、2 和 3 四個(gè)區(qū)間段,分別為[0,/8)、[31 /8,/4)、[ Ji /4,3 π /8)和[3 π /8,π /2);其次,對(duì)某像素點(diǎn)鄰域內(nèi)的八個(gè)像素點(diǎn)計(jì)算arctan(| | Λ 11 I/I),即幅度編碼,根據(jù)arctan ( | Δ I /I)的計(jì)算結(jié)果,將鄰域內(nèi)的每個(gè)像素點(diǎn)每劃分到四個(gè)區(qū)間段中的一個(gè),得到該像素點(diǎn)鄰域內(nèi)的八個(gè)像素點(diǎn)的arctan(| Δ?| |/1)值所屬區(qū)間的編號(hào),對(duì)該編號(hào)按照3DLBP的編碼方式得到兩組編碼,這兩組編碼分別為I級(jí)編碼和2級(jí)編碼。
3.根據(jù)權(quán)利要求1所述的基于韋伯法則的局部多值模式的人臉識(shí)別方法,其特征在于:所述Uniform模式為,當(dāng)二進(jìn)制編碼被視為首尾連接的環(huán)形時(shí),當(dāng)該二進(jìn)制編碼至多存在兩處由O到I或由I到O的轉(zhuǎn)換時(shí),該二進(jìn)制編碼為Uniform模式,否則該二進(jìn)制編碼為 非 Uniform 模式;即對(duì)于二進(jìn)制編碼 S1S2S3S4S5S6S7S8,若
4.根據(jù)權(quán)利要求1所述的基于韋伯法則的局部多值模式的人臉識(shí)別方法,其特征在于:所述對(duì)每幅Uniform模式的編碼圖進(jìn)行均勻、無(wú)交疊的分塊處理具體為:將每幅Uniform模式的編碼圖均勻分成5X5個(gè)子塊。
5.根據(jù)權(quán)利要求1所述的基于韋伯法則的局部多值模式的人臉識(shí)別方法,其特征在于:所述最近鄰分類識(shí)別方法中的距離使用卡方距離,設(shè)H1和H2是兩個(gè)η維的特征直方圖,巧和Hf分別是兩個(gè)特征直方圖中的第i個(gè)bin,則這兩個(gè)特征之間的距離dist為:
【文檔編號(hào)】G06K9/00GK103761507SQ201410001390
【公開(kāi)日】2014年4月30日 申請(qǐng)日期:2014年1月3日 優(yōu)先權(quán)日:2014年1月3日
【發(fā)明者】孫長(zhǎng)銀, 楊萬(wàn)扣, 黃榮, 吳津 申請(qǐng)人:東南大學(xué)