專利名稱:一種基于局部三值模式的人臉特征提取方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,主要涉及生物特征鑒別中的人臉識別技術(shù)。
背景技術(shù):
在當(dāng)今信息化時代,如何準(zhǔn)確鑒定一個人的身份,保護(hù)信息安全是一個必須解決的關(guān)鍵社會問題。為此,生物特征鑒別技術(shù)悄然新起,并成為目前世界信息安全管理領(lǐng)域的前沿研究課題。生物特征鑒別技術(shù)是指利用人體所固有的生理特征或行為特征來進(jìn)行個人身份鑒定。人臉識別技術(shù)是生物特征鑒別技術(shù)的一個分支,是計算機(jī)圖像處理技術(shù)和模式識別技術(shù)在個人身份識別領(lǐng)域的應(yīng)用。在不同的生物特征識別方法中,人臉識別 (Automatic Face Recognition)有其自身特殊的優(yōu)勢,因而在生物識別中有著重要的地位。與其它生物識別技術(shù)相比較,人臉識別具有(1)非侵?jǐn)_性。人臉識別無需干擾人們的正常行為就能較好地達(dá)到識別效果,無需擔(dān)心被識別者是否愿意將手放在指紋采集設(shè)備上,他們的眼睛是否能夠?qū)?zhǔn)虹膜掃描裝置等,而進(jìn)行人臉識別卻只要在攝像機(jī)前自然地停留片刻,用戶的身份就會被正確識別。( 采集設(shè)備簡單,使用快捷。一般來說,常見的攝像頭就可以用來進(jìn)行人臉圖像的采集,不需特別復(fù)雜的專用設(shè)備。采集一般可在數(shù)秒內(nèi)完成。( 通過人臉識別身份,與人類的習(xí)慣一致。也就是說,人和機(jī)器都可以使用人臉圖片進(jìn)行識別,這使得人和機(jī)器可以配合工作。人臉自動識別技術(shù),在居民小區(qū)、公司單位的門禁系統(tǒng)、銀行、公安、機(jī)場、網(wǎng)絡(luò)等方面應(yīng)用廣泛,具有巨大的經(jīng)濟(jì)價值和現(xiàn)實意義?,F(xiàn)在它已經(jīng)使用在邊境檢查、通觀認(rèn)證、銀行提款、信息管理和建筑物安全管理等,還可以使人們擺脫記憶信用卡號、銀行帳號、身份證號、網(wǎng)絡(luò)登錄號的繁瑣。在2008年北京奧運(yùn)會和2010 年上海世博會的現(xiàn)場都使用了人臉識別技術(shù)來對入場人員進(jìn)行安全檢測。在人臉識別技術(shù)中,主要有以下兩個步驟(1)從待檢測人臉圖像中進(jìn)行特征提?。? 將提取出的特征送到人臉判別式中進(jìn)行評估判斷。對整個人臉圖像特征的提取是人臉識別的第一步,它通過合適的算法,從待檢測的人臉圖像中提取最具有區(qū)分性的特征作為整幅圖像的描述。特征提取的好壞直接影響人臉檢測和定位系統(tǒng)的識別率。在實際中, 人臉區(qū)域常常受到頭發(fā)、眼鏡、胡子和一些飾物的遮擋,并且復(fù)雜的光照、人臉表情、姿勢的變化也將加大人臉特征提取的難度。排除外界的干擾,快速精確的提取適當(dāng)?shù)娜四樚卣?,并對其進(jìn)行數(shù)學(xué)模型的描述是我們研究的主要問題。現(xiàn)在通常使用的人臉識別的方法大致有以下兩種1.基于全局特征的人臉識別。全局的特征包括人的膚色,臉型,五官在整個臉部的分布情況等?;谌值娜四樧R別方法是將整個人臉整體看作是一個特征,不需要對人臉的局部特征點(diǎn)進(jìn)行檢測?;谔卣髂樀腜CA(主成分分析)方法就是其中的一種。2.基于混合特征的人臉識別?;旌咸卣骷劝ㄈ痔卣?,也包括局部特征。在人臉識別中,一種被普遍接受的說法是全局特征一般被用來進(jìn)行粗略的匹配,局部特征則提供更加精確的確認(rèn)。
發(fā)明內(nèi)容
本發(fā)明提供一種基于局部三值模式(Local Ternary Patterns, LTP)的人臉特征提取方法,該方法利用LTP特征的局部特性和各局部LTP特征所組成的直方圖的統(tǒng)計特性, 一定程度上實現(xiàn)了局部特征和全局特征的統(tǒng)一,相較于較常采用的LBP特征,LTP特征對噪聲具有更好的抑制效果。最后提取出的特征具有旋轉(zhuǎn)不變和灰度不變的特點(diǎn),在光照條件變化、人臉表情、姿態(tài)變化的影響下也能夠精確地提取到人臉特征,從而使得后續(xù)基于LTP 特征的人臉識別具有更高的準(zhǔn)確率。為了下面發(fā)明內(nèi)容的描述,現(xiàn)將一些將要用到的術(shù)語進(jìn)行解釋。定義1 :LBP。LBP是局部二值模式(Local Binary Patterns)的首字母縮寫,特征模型如圖1所示。對于某一像素點(diǎn)而言,其LBP特征向量為該像素點(diǎn)的八鄰域像素點(diǎn)的灰度值與中心點(diǎn)灰度值相比較的結(jié)果(其八鄰域像素點(diǎn)中,灰度值大于等于中心像素點(diǎn)灰度值的,相應(yīng)LBP編碼為1 ;灰度值小于中心像素點(diǎn)灰度值的,相應(yīng)LBP編碼為0),將任一中心像素點(diǎn)的所有LBP編碼按順序排列起來,就是該中心像素點(diǎn)的LBP特征向量。LBP特征向量的LBP編碼起始位置和順序可自行選擇,但是當(dāng)起始位置和順序選定過后,所有的LBP特征向量必須按照統(tǒng)一的起始位置和順序進(jìn)行計算。定義2:LTP。LTP是局部三值模式(Local Ternary Patterns)的首字母縮寫,特征模型如圖2所示。對于某一像素點(diǎn)而言,其LTP特征向量為該像素點(diǎn)的八鄰域像素點(diǎn)的灰度值與中心點(diǎn)灰度值相比較的結(jié)果(其八鄰域像素點(diǎn)中,若b > a+t,則相應(yīng)LTP編碼為 1 ;若b < a-t,則相應(yīng)LTP編碼為-1 ;若a-t≤b≤a+t,則相應(yīng)LTP編碼為0 ;其中b為鄰域像素點(diǎn)灰度值,a為中心像素點(diǎn)灰度值,t為設(shè)定的閾值)。將任一中心像素點(diǎn)的所有LTP 編碼按順序排列起來,就是該中心像素點(diǎn)的LTP特征向量。LTP特征向量的LTP編碼起始位置和順序可自行選擇,但是當(dāng)起始位置和順序選定過后,所有的LTP特征向量必須按照統(tǒng)一的起始位置和順序進(jìn)行計算定義3 下采樣。對于一個樣值序列間隔一定的值取樣,這樣得到新序列就是原序列的下采樣序列。定義4 高斯濾波器。利用高斯函數(shù)作為卷積核生成的尺度濾波器。定義5 :D0G (Difference of Gaussian 高斯差分)濾波器。高斯差分濾波器是高斯拉普拉斯(LOG)濾波器的逼近,它是兩個不同方差的高斯函數(shù)的差,是一個帶通濾波器。 利用不同方差的高斯低通濾波器可以方便的得到DOG濾波器,它能較好地反應(yīng)人們的視覺特性。定義6 =PCA0 PCA 是 Principal Component Analysis (主成份分析)的縮寫,其主要思想是利用一組為數(shù)不多的特征盡可能精確地表示模式樣本。本發(fā)明技術(shù)方案如下一種基于局部三值模式的人臉特征提取方法,如圖4所示,包括以下步驟步驟1 構(gòu)建人臉圖像金字塔。設(shè)原始人臉圖像為I (x,y),其中χ≤M,y≤N,M、N分別表示原始人臉圖像的行數(shù)和列數(shù);對原始人臉圖像為I (χ,y)進(jìn)行采樣因子為2的下采樣,形成人臉圖像金字塔,所述人臉圖像金字塔的底層圖像為原始人臉圖像為G0(x,y) = I(x,y),底層圖像的上一層為 G1 (x, y) = (2x,2y),則底層圖像上第 i 層圖像SGi(Ly) = Gi-1 (2x,2y)。
步驟2 計算步驟1所述人臉圖像金字塔中各層圖像所有像素點(diǎn)的LTP特征值。每一層圖像的LTP特征譜計算方式為首先以順序計算該層圖像中每一像素點(diǎn)的 LTP特征向量;然后將每一像素點(diǎn)的LTP特征向量改寫成正、負(fù)兩部分LTP子特征向量;再將每一像素點(diǎn)的正、負(fù)兩部分LTP子特征向量所對應(yīng)的二進(jìn)制數(shù)轉(zhuǎn)換成十進(jìn)制數(shù),得到對應(yīng)像素點(diǎn)的正、負(fù)兩部分LTP子特征值。其中,每個像素點(diǎn)的LTP特征向量的計算方式為將中心像素點(diǎn)的灰度值與其八鄰域像素點(diǎn)的灰度值進(jìn)行比較,若b>a+t,則相應(yīng)LTP編碼為1 ;若b<a-t,則相應(yīng)LTP編碼為-I ;若a-t ^ b ^ a+t,則相應(yīng)LTP編碼為0 ;其中b為鄰域像素點(diǎn)灰度值,a為中心像素點(diǎn)灰度值,t為設(shè)定的閾值;將中心像素點(diǎn)的八鄰域LTP編碼按順序排列起來,就是該中心像素點(diǎn)的LTP特征向量。LTP特征向量的LTP編碼起始位置和順序可自行選擇,但是當(dāng)起始位置和順序選定過后,所有的LTP特征向量必須按照統(tǒng)一的起始位置和順序進(jìn)行計算。其中,正LTP子特征向量由LTP特征向量改寫而成,改寫時將LTP特征向量中所有為“_1”的LTP編碼置為“0”,其余LTP編碼不變;負(fù)LTP子特征向量由LTP特征向量改寫而成,改寫時將LTP特征向量中所有為“_1”的LTP編碼置為“1”,所有為“1”的LTP編碼置為“0”,其余LTP編碼不變。步驟3 分別統(tǒng)計人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖。步驟4:將人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖分別寫成向量形式,并分別記為H+和H_,向量的維數(shù)由低向高的順序與LTP子特征值直方圖中的LTP子特征值相對應(yīng),向量中的元素為對應(yīng)LTP子特征值下的統(tǒng)計數(shù)。步驟5 將所有人臉圖像金字塔中各層圖像的向量H+和!1_按順序連接起來作為最終原始人臉圖像I(x,y)的特征。上述技術(shù)方案中1、步驟1在下采樣構(gòu)建人臉圖像金字塔過程中,最好先對底層圖像先進(jìn)行濾波處理再下采樣構(gòu)建上層圖像,以減小噪聲影響。濾波時所用的濾波器可采用高斯濾波器、DOG 濾波器或小波多尺度濾波器。2、步驟2計算LTP特征向量時,閾值t的取值范圍適當(dāng)時,能夠使得LTP編碼對于噪聲具有更好的抑制效果,其取值范圍為[2,10],尤其是當(dāng)t = 5時具有最佳的效果。3、步驟2在計算各層圖像的LTP特征譜時,為了減少計算量,可以只選取人臉圖像金字塔中的η層圖像來計算LTP特征譜,但是η層圖像的選取原則應(yīng)當(dāng)統(tǒng)一,且η的取值范圍為[4,6]為宜。4、步驟3分別統(tǒng)計人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖時,可將每層圖像劃分成互不重疊的多個區(qū)域,分別統(tǒng)計各區(qū)域的正、負(fù)LTP子特征值直方圖,然后再合成該層圖像統(tǒng)一的正、負(fù)LTP子特征值直方圖。這樣分塊處理的目的是能夠充分利用PC平臺的并行處理能力,以提高人臉特征的提取速度。5、步驟5中將有人臉圖像金字塔中各層圖像的向量Hi+和按順序連接起來作為最終原始人臉圖像I(x,y)的特征時,可以先將人臉圖像金字塔中各層圖像的正、負(fù)LTP 子特征值直方圖對應(yīng)的向量H+和H_分別組合成兩個矩陣H+和H_,然后采用主成分分析法 (PCA)對矩陣H+和H_進(jìn)行降維處理,最后將降維處理后的矩陣H+和H_中的所有行向量按順序連接起來作為最終原始人臉圖像I (X,y)的特征。
本發(fā)明的有益效果是本發(fā)明提供了一種基于局部三值模式的人臉特征提取方法,首先對原始人臉圖像進(jìn)行下采樣構(gòu)建人臉圖像金字塔,然后計算各層圖像中所有像素點(diǎn)的LTP特征,再將所有像素點(diǎn)的LTP特征分成正、負(fù)兩部分LTP子特征,分別統(tǒng)計人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖,最后將人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖所對應(yīng)的向量H+和!1_按順序連接起來作為最終原始人臉圖像I (x,y)的特征。本發(fā)明利用了 LTP特征的局部特性和各局部LTP特征所組成的直方圖的統(tǒng)計特性,一定程度上實現(xiàn)了局部特征和全局特征的統(tǒng)一,相較于較常采用的LBP特征,LTP特征對噪聲具有更好的抑制效果。最后提取出的特征具有旋轉(zhuǎn)不變和灰度不變的特點(diǎn),在光照條件變化、人臉表情、 姿態(tài)變化的影響下也能夠精確地提取到人臉特征,從而使得后續(xù)基于LTP特征的人臉識別具有更高的準(zhǔn)確率。
圖1是LBP算子示意圖。其中(a)是原始圖像局,(b)是中心像素點(diǎn)的LBP特征, (c)是中心像素點(diǎn)的LBP特征值。圖2是LTP算子示意圖。圖3是LTP算子分解為正負(fù)兩個LBP算子示意圖。圖4是本發(fā)明流程示意圖。具體實施方法本發(fā)明的方法在Matlab工具中進(jìn)行仿真,并且使用VS2008軟件進(jìn)行了 C++語言的實現(xiàn)。所采用的平臺是 Windows XP SP3+PC Intel Celeron 2. 53GHZ。下面以給出一個具體的本發(fā)明的實現(xiàn)例。需要說明的是下例中的參數(shù)并不影響本專利的一般性。針對大小的原始人臉圖像,采用DOG濾波器進(jìn)行濾波后進(jìn)行采樣因子為 2的下采樣分層,得到8層圖像金字塔,選取其中第3 8層采用ZTP81特征提取各層圖像的 LTP特征值,然后分別統(tǒng)計第3 8層人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖,再將人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖所對應(yīng)的向量H+和 H_分別組合成矩陣扎和H_,最后采用主成分分析法(PCA)對矩陣H+和H_進(jìn)行降維處理, 最后將降維處理后的矩陣H+和H_中的所有行向量按順序連接起來作為最終原始人臉圖像 I(x,y)的特征。
權(quán)利要求
1.一種基于局部三值模式的人臉特征提取方法,包括以下步驟 步驟1 構(gòu)建人臉圖像金字塔;設(shè)原始人臉圖像為I (x,y),其中X < M,y < N,M.N分別表示原始人臉圖像的行數(shù)和列數(shù);對原始人臉圖像為I (x,y)進(jìn)行采樣因子為2的下采樣,形成人臉圖像金字塔,所述人臉圖像金字塔的底層圖像為原始人臉圖像為h(x,y) = Κχ, y),底層圖像的上一層為G1U, y) = (U2x,2y),則底層圖像上第 i 層圖像SGi(Ly) =Gi^1 (2x,2y);步驟2 計算步驟1所述人臉圖像金字塔中各層圖像所有像素點(diǎn)的LTP特征值; 每一層圖像的LTP特征譜計算方式為首先以順序計算該層圖像中每一像素點(diǎn)的LTP 特征向量;然后將每一像素點(diǎn)的LTP特征向量改寫成正、負(fù)兩部分LTP子特征向量;再將每一像素點(diǎn)的正、負(fù)兩部分LTP子特征向量所對應(yīng)的二進(jìn)制數(shù)轉(zhuǎn)換成十進(jìn)制數(shù),得到對應(yīng)像素點(diǎn)的正、負(fù)兩部分LTP子特征值;其中,每個像素點(diǎn)的LTP特征向量的計算方式為將中心像素點(diǎn)的灰度值與其八鄰域像素點(diǎn)的灰度值進(jìn)行比較,Sb > a+t,則相應(yīng)LTP編碼為1 ;若13 < a-t,則相應(yīng)LTP編碼為-1 ;若a-t < b彡a+t,則相應(yīng)LTP編碼為0 ;其中b為鄰域像素點(diǎn)灰度值,a為中心像素點(diǎn)灰度值,t為設(shè)定的閾值;將中心像素點(diǎn)的八鄰域LTP編碼按順序排列起來,就是該中心像素點(diǎn)的LTP特征向量。LTP特征向量的LTP編碼起始位置和順序可自行選擇,但是當(dāng)起始位置和順序選定過后,所有的LTP特征向量必須按照統(tǒng)一的起始位置和順序進(jìn)行計算;其中,正LTP子特征向量由LTP特征向量改寫而成,改寫時將LTP特征向量中所有為 “_1”的LTP編碼置為“0”,其余LTP編碼不變;負(fù)LTP子特征向量由LTP特征向量改寫而成,改寫時將LTP特征向量中所有為“-1”的LTP編碼置為“ 1”,所有為“ 1”的LTP編碼置為 “0”,其余LTP編碼不變。步驟3 分別統(tǒng)計人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖; 步驟4:將人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖分別寫成向量形式,記為H+和H_,向量的維數(shù)由低向高的順序與LTP子特征值直方圖中的LTP子特征值相對應(yīng),向量中的元素為對應(yīng)LTP子特征值下的統(tǒng)計數(shù);步驟5 將所有人臉圖像金字塔中各層圖像的向量H+和H_按順序連接起來作為最終原始人臉圖像I(x,y)的特征。
2.根據(jù)權(quán)利要求1所述的基于局部三值模式的人臉特征提取方法,其特征在于,步驟1 在下采樣構(gòu)建人臉圖像金字塔過程中,先對底層圖像先進(jìn)行濾波處理再下采樣構(gòu)建上層圖像,以消除噪聲影響。
3.根據(jù)權(quán)利要求2所述的基于局部三值模式的人臉特征提取方法,其特征在于,濾波時所用的濾波器采用高斯濾波器、DOG濾波器或小波多尺度濾波器。
4.根據(jù)權(quán)利要求1所述的基于局部三值模式的人臉特征提取方法,其特征在于,步驟2 計算LTP特征向量時,閾值t的取值范圍為[2,10]。
5.根據(jù)權(quán)利要求4所述的基于局部三值模式的人臉特征提取方法,其特征在于,閾值t5。
6.根據(jù)權(quán)利要求1所述的基于局部三值模式的人臉特征提取方法,其特征在于,步驟2 在計算各層圖像的LTP特征譜時,只選取人臉圖像金字塔中的η層圖像來計算LTP特征譜, 但是η層圖像的選取原則應(yīng)當(dāng)統(tǒng)一,且η的取值范圍為[4,6]。
7.根據(jù)權(quán)利要求1所述的基于局部三值模式的人臉特征提取方法,其特征在于,步驟5 將所有人臉圖像金字塔中各層圖像的向量払和H_按順序連接起來作為最終原始人臉圖像 I(x, y)的特征時,先將人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖對應(yīng)的向量扎和H_分別組合成兩個矩陣H+和H_,然后采用主成分分析法對矩陣H+和H_進(jìn)行降維處理,最后將降維處理后的矩陣H+和H_中的所有行向量按順序連接起來作為最終原始人臉圖像I(x,y)的特征。
全文摘要
一種基于局部三值模式的人臉特征提取方法,屬于圖像處理技術(shù)領(lǐng)域。首先對原始人臉圖像進(jìn)行下采樣構(gòu)建人臉圖像金字塔,然后計算各層圖像中所有像素點(diǎn)的LTP特征,再將所有像素點(diǎn)的LTP特征分成正、負(fù)兩部分LTP子特征,分別統(tǒng)計人臉圖像金字塔中各層圖像的正、負(fù)LTP子特征值直方圖,最后將正、負(fù)LTP子特征值直方圖所對應(yīng)的向量H+和H-按順序連接起來作為最終原始人臉圖像I(x,y)的特征。本發(fā)明利用了LTP特征的局部特性和各局部LTP特征直方圖的統(tǒng)計特性,實現(xiàn)了局部特征和全局特征的統(tǒng)一,相較于較常采用的LBP特征,LTP特征對噪聲具有更好的抑制效果。所提取出的特征具有旋轉(zhuǎn)不變和灰度不變的特點(diǎn),在光照條件變化、人臉表情、姿態(tài)變化的影響下也能夠精確地提取到人臉特征。
文檔編號G06K9/00GK102163283SQ20111013680
公開日2011年8月24日 申請日期2011年5月25日 優(yōu)先權(quán)日2011年5月25日
發(fā)明者蔣思洋, 馬爭, 鮑琎 申請人:電子科技大學(xué)