本發(fā)明涉及一種聚類再分類的人臉識別方法,屬于視頻圖像處理的
技術(shù)領(lǐng)域:
。
背景技術(shù):
:人臉識別是現(xiàn)代生活中一種常見的技術(shù),是一種基于生物特征的識別方式,與同屬生物特征識別的指紋、虹膜識別相比,人臉識別因其不需要直接接觸、不需要特殊的外部設(shè)備具有簡單快捷的優(yōu)勢。所以人臉識別技術(shù)在諸多領(lǐng)域都有廣泛的應(yīng)用,而人臉識別技術(shù)中的人臉特征提取及模式識別是近年來基于生物特征研究的熱點之一。目前人臉識別技術(shù)已廣泛用于政府、銀行、電子商務(wù)、安全防務(wù)等領(lǐng)域。比如,銀行儲戶可以直接從加入人臉識別技術(shù)的取款機處存取款而無需攜帶銀行卡,也不用回憶密碼。此外,美國“9.11”事件后,反恐怖活動已成為各國政府的共識,加強機場、商場、火車站、汽車站等公共場所的安全防務(wù)十分重要。隨著人臉識別技術(shù)的進一步成熟和社會認同度的提高,人臉識別技術(shù)將應(yīng)用在更多的領(lǐng)域。比如企業(yè)、住宅安全和管理,如人臉識別門禁考勤系統(tǒng),人臉識別防盜門等。公安、司法和刑偵,安全部門可以利用人臉識別系統(tǒng)和網(wǎng)絡(luò),在全國范圍內(nèi)搜捕逃犯;信息安全,比如計算機登錄、電子政務(wù)和電子商務(wù),當前,交易或者審批的授權(quán)都是靠密碼來實現(xiàn),如果密碼被盜,就無法保證安全,但是使用人臉識別技術(shù),就可以做到當事人在網(wǎng)上的數(shù)字身份和真實身份統(tǒng)一,從而大大增加電子商務(wù)和電子政務(wù)系統(tǒng)的可靠性。因此,對于人臉識別技術(shù)的研究開發(fā)就變得極其重要,能否提供更好、更加穩(wěn)定的算法,然后在此基礎(chǔ)上進行產(chǎn)品和技術(shù)的革新也成為當今人臉識別技術(shù)市場的一個重要的任務(wù)。但是由于受光照、姿態(tài)、表情以及年齡等多方面條件的影響,導(dǎo)致人臉識別的結(jié)果不是很準確。其中,又以光照變化帶來的影響最為明顯,臉部特征在戶外環(huán)境或光照條件變化非可控的環(huán)境下,會產(chǎn)生非線性變化,使得人臉識別很困難。因此,現(xiàn)有技術(shù)的人臉識別方法中,存在采集到的人臉樣本存在著角度、表情等類內(nèi)差異而造成的計算人臉特征向量均值的局部信息丟失的問題。技術(shù)實現(xiàn)要素:本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)的不足,提供一種聚類再分類的人臉識別方法,解決現(xiàn)有技術(shù)的人臉識別方法中人臉圖像樣本存在著角度、表情等類內(nèi)差異而造成的計算人臉特征向量均值的局部信息丟失的問題。本發(fā)明具體采用以下技術(shù)方案解決上述技術(shù)問題:一種聚類再分類的人臉識別方法,包括:獲取訓(xùn)練樣本,所述訓(xùn)練樣本包括目標的若干個人臉圖像及每個圖像對應(yīng)目標的身份信息;對所述訓(xùn)練樣本中人臉圖像進行均值化處理;對所述均值化處理后的人臉圖像進行Gabor紋理特征提取,得到每張人臉圖像對應(yīng)的特征向量;利用PCA降維算法對所得每張人臉圖像提取的Gabor紋理特征進行降維獲得降維后的特征向量;對所有降維后的特征向量進行聚類運算,直至距離收斂以完成聚類;對聚類后的所有特征向量分類獲得若干子類,計算確定聚類后的每個子類的特征向量均值和聚類后所有特征向量的均值,及結(jié)合LDA分析算法計算獲得類內(nèi)距離和類間距離,求得使類間聚類和類內(nèi)距離比值最大的Fisher投影變換矩陣,并對聚類后的每個子類特征向量均值做Fisher投影變換,得到經(jīng)Fisher變換后的子類特征向量均值,訓(xùn)練完畢;對待識別目標的人臉圖像進行特征提取得到特征向量,及對所提取待識別目標的人臉圖像的特征向量處理獲得經(jīng)Fisher投影變換后的特征向量,并將其與每個子類經(jīng)Fisher投影變換后的特征向量均值依次計算距離,以獲得相似度;提取相似度所對應(yīng)的子類和該子類中特征向量所對應(yīng)的目標人臉圖像,并將提取得到的目標人臉圖像所對應(yīng)身份信息確定為待識別目標的身份信息。進一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述訓(xùn)練樣本采用人臉檢測方法獲得目標的人臉圖像。進一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述人臉檢測方法包括:檢測和鎖定目標人臉,及采集獲得目標人臉圖像;對目標人臉圖像做灰度化處理,并截取設(shè)定區(qū)域的人臉圖像后作為目標的人臉圖像輸出。進一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述訓(xùn)練樣本采用直接輸入的目標人臉圖像獲得。進一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述方法中對所有降維后的特征向量進行聚類運算,包括:從所有降維后的特征向量中隨機取點,作為每個子類的中心點;計算每個降維后的特征向量到所在子類中心點的距離;更新每個子類的中心點,及再次計算每個降維后的特征向量到更新后所在的子類中心點的距離,直至距離收斂以完成聚類。進一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述方法中提取獲得相似度最大的子類和該子類中特征向量所對應(yīng)的目標人臉圖像。本發(fā)明采用上述技術(shù)方案,能產(chǎn)生如下技術(shù)效果:(1)本發(fā)明所提出的一種聚類再分類的人臉識別方法,所述方法通過獲取訓(xùn)練樣本用的人臉圖片,將訓(xùn)練樣本中的目標人臉圖像預(yù)處理,提取圖像的Gabor紋理特征獲得特征向量并經(jīng)過降維處理后,加入K-means聚類使目標類特征向量進一步細化;聚類后的所有特征向量分類獲得若干子類,子類特征向量間的距離小于原目標類之間的距離,因此,特征向量處理時,先對采集到的訓(xùn)練樣本的特征向量進行聚類運算,進一步縮小訓(xùn)練樣本的類內(nèi)距離,減小樣本局部的信息丟失;子類特征向量可以更準確的反映采樣時由于表情、光照、姿態(tài)不同帶來的差異化。所屬方法有效地消除了特征向量均值化時的相互抵消,在增加一定計算量的基礎(chǔ)上大幅提高了人臉識別的準確率。(2)所述方法針對采集時由于人臉表情、光線變化造成的目標類訓(xùn)練樣本圖片差異較大的問題,通過聚類算法縮小類間距離以減小采集過程中的誤差,較大幅度的提高了人臉識別的準確率。附圖說明圖1為本發(fā)明的聚類再分類的人臉識別方法的流程示意圖。具體實施方式下面結(jié)合說明書附圖對本發(fā)明的實施方式進行描述。如圖1所示,本發(fā)明提出一種聚類再分類的人臉識別方法,該方法以多個目標,及每個目標提取10張人臉圖像為例,具體識別如下:步驟1、獲取訓(xùn)練樣本。所述訓(xùn)練樣本包括目標的若干個人臉圖像及每個圖像對應(yīng)目標的身份信息。以及所述訓(xùn)練樣本可采用人臉檢測方法獲得目標的人臉圖像,或采用直接輸入的目標人臉圖像獲得。其中,利用人臉檢測方法過程如下:通過圖像采集設(shè)備,對待添加目標進行人臉檢測,檢測和鎖定目標人臉,及采集獲得目標人臉圖像;設(shè)定截取區(qū)域,對該區(qū)域鎖定,對目標人臉圖像做灰度化處理,并截取設(shè)定區(qū)域的人臉圖像后作為目標的人臉圖像輸出,作為訓(xùn)練樣本,共10張,要求截取過程盡量放慢速度,以確保十張圖片的差異化,更多的體現(xiàn)出目標的信息,若訓(xùn)練樣本為直接輸入的目標人臉圖像,則無需此步驟。其中,對目標人臉圖像做灰度化處理具體如下:對設(shè)備讀取到的每一幀人臉圖像進行灰度化處理,并滑窗掃描圖片中具有人臉正臉Harr特征的區(qū)域,根據(jù)該區(qū)域坐標計算左右眼長寬,再滑窗掃描圖片中具有左右眼中心Harr特征的的區(qū)域,規(guī)定當左右眼中心位置的高度差小于一定值時,如定值設(shè)定為10個像素點值,滑窗得到的數(shù)據(jù)為有效位置。將有效位置的圖片做細微旋轉(zhuǎn)處理,以使左右眼中心位置處在同一高度,依據(jù)眼睛中心位置和眼睛的長寬確定左右眼區(qū)域坐標,通過上述坐標計算,可以縮小人臉框的范圍,得到比原先更能反映臉部特征的訓(xùn)練樣本。按人臉位置精確坐標截取圖片,截取不能太快,設(shè)置每成功鎖定10張,保存一張圖片,此方法可以確保訓(xùn)練樣本間的差異化,不會因速度過快而保存了近乎相同的訓(xùn)練樣本。步驟2、對所述訓(xùn)練樣本中人臉圖像預(yù)處理。首先,按照預(yù)先設(shè)置的規(guī)格,對灰度化的人臉圖像做均值化處理;對圖像做直方圖均值化處理,計算圖像對應(yīng)區(qū)域的直方圖H,將直方圖歸一化,計算直方圖積分,采用H′作為查詢表:dst(x,y)=H′(src(s,y))進行圖像變換,該方法將比較淡的圖像變換為比較深的圖像,增強了訓(xùn)練樣本的亮度和對比度。步驟3、所述均值化處理后的人臉圖像進行Gabor紋理特征提取,得到每張人臉圖像在提取特征后對應(yīng)的特征向量。即對所述均值化處理后的人臉圖像進行Gabor紋理特征提取,步驟1中得到的10張目標人臉圖像在提取特征后對應(yīng)十個特征向量。具體如下:首先,提取訓(xùn)練樣本的Gabor紋理特征,首先計算樣本人臉圖像的像素點數(shù)128*128,計算降采樣后的維度128*128/(4*4*4)=256,去Gabor濾波器的波長頻率V為5(V=0,1,2,3,4),核函數(shù)方向Mu為8(即K=8,Mu=0,1,2,3,4,5,6,7)共40個不同頻率不同方向的Gabor核函數(shù)。根據(jù)降采樣維度256、Gabor濾波器波長頻率V、核函數(shù)方向Mu,計算得到訓(xùn)練樣本中圖像的特征向量維度256*5*8=10240。根據(jù)Gabor濾波器波長頻率V、核函數(shù)方向Mu,計算不同頻率不同方向上的Gabor的小波基,將原圖與小波基函數(shù)卷積,求得卷積模值,卷積模值降采樣,并計算降采樣后的平均值偏離度,得到特征向量。Gabor濾波器核的通常形式為:G(k,x,y,θ)=k2σ2exp(-k2(x2+y2)2σ2)(cos(k(xcosθ+ysinθ))-exp(-σ22))]]>其中:kv=2-v+22π]]>公式中,k表示人臉圖像中的每一小塊,取值v、u、K而定,x表示像素點橫軸坐標,y表示像素點的縱軸坐標,v的取值決定了Gabor濾波的波長,u的取值表示Gabor核函數(shù)的方向,K表示總的方向數(shù)。參數(shù)σ/k決定了高斯窗口的大小,這里取程序中取4個頻率(v=0,1,...,3),8個方向(即K=8,u=0,1,...,7),共32個Gabor核函數(shù)。步驟4、利用PCA降維算法對所得每張人臉圖像提取的Gabor紋理特征進行降維獲得降維后的特征向量;及對所有降維后的特征向量進行聚類運算,直至距離收斂以完成聚類。具體如下:該過程包含降維和聚類。首先,利用現(xiàn)有的PCA主成分分析對提取的Gabor紋理特征做降維處理,求出PCA投影變換矩陣,在投影矩陣的作用下,原特征向量維度得到降低,減小了后續(xù)運算的計算量。具體而言,對步驟3提取的Gabor紋理特征做PCA降維處理,提取特征的本質(zhì),簡化計算。求出投影矩陣,投影矩陣的作用是將每張人臉對應(yīng)的特征向量映射到低維度空間,此處降維后的維度為80。特征向量由原先維度10240變換到80。其次,對PCA降維后的十個特征向量做聚類,目標子類數(shù)3個,隨機取點直到類間距離收斂。每個目標類對應(yīng)十個特征向量,以此作為父類,對該類特征向量做K-means聚類運算。在原先的十個特征向量中隨機取點作為每個子類的中心點,計算每個特征向量到每個子類的距離;更新每個子類的中心點,再次計算距離,直到距離收斂,聚類完成。最終將父類的十個特征向量劃分為3個子類,子類中的向量具有更近更相似的特征。步驟5、對聚類后的所有特征向量分類獲得若干子類,計算確定每個子類的特征向量均值和聚類后所有特征向量的均值,及結(jié)合LDA分析算法計算獲得類內(nèi)距離和類間距離。求得使類間聚類和類內(nèi)距離比值最大的Fisher投影變換矩陣,對聚類后的每個子類特征向量均值做Fisher投影變換,得到經(jīng)過Fisher變換后的子類特征向量均值,訓(xùn)練完畢。具體如下:聚類后的十個特征向量被分成3個子類,以子類特征向量均值代表子類特征,并計算步驟4所得聚類后所有特征向量的均值。將子類特征向量均值、所得聚類后所有特征向量的均值通過LDA分析算法,計算類內(nèi)距離和類間距離,為LDA投影向量構(gòu)造Fisher準則,使類內(nèi)距離盡可能有,類間距離盡可能大。其中,將聚類后的所有特征向量以子類為單位通過LDA分析算法,估計類內(nèi)距離和類間距離,為LDA投影向量構(gòu)造Fisher準則。通過計算每個子類的特征向量均值,表示出所有子類的類間距離,即每類中心相對于全樣本中心的散列度之和,是由每個子類包含的各個特征向量與子類特征向量均值的距離之和求得。和子類類內(nèi)距離即每個子類自己的散列度之和,是由每個子類特征向量均值與所有特征向量的均值的距離之和求得。并求解使每個子類中心相對于全樣本中心的散列度之和與子類散列度之和比值最大的投影變換矩陣w,最終構(gòu)造出由子類均值向量代表的不同子類的特征。公式如下:J(w)=|SB~||Sw~|=|wTSww||wTSww|]]>其中,w是基向量矩陣,是投影后的各個子類內(nèi)部散列度矩陣之和,是投影后各個類中心投影的散列度矩陣之和。步驟6、待識別目標的人臉圖像識別。首先,對待識別目標的人臉圖像進行特征提取得到未經(jīng)處理的特征向量,原始特征向量預(yù)處理過程包括:對待識別目標的人臉圖像經(jīng)PCA降維處理,得到PCA投影變換后的特征向量,并將降維后特征向量通過訓(xùn)練過程求得的Fisher投影變換矩陣作用,得到Fisher投影變換后的特征向量。將其與每個子類Fisher投影變換后的特征向量均值依次計算距離,以獲得相似度。具體如下:通過攝像頭采集或指定本地靜態(tài)圖片為待識別目標的正臉圖像,大致過程如步驟一至步驟五,不含聚類的過程,首先,確定人臉在圖像中的位置,截取圖片為待測樣本。若讀取靜態(tài)人臉圖像則無需確定人臉位置的過程,該圖片即為待測樣本,經(jīng)過圖像的預(yù)處理后,提取待測樣本特征,經(jīng)過降維、構(gòu)造Fisher準則,即獲取待識別目標的正臉圖片,做灰度化、直方圖均值化處理,提取Gabor特征,進行PCA、Fisher投影變換,得到經(jīng)投影變換后的特征向量。將所得投影變換后的特征向量與每個子類Fisher投影變換后的特征向量均值依次計算距離,以獲得相似度。提取相似度所對應(yīng)的子類和該子類中特征向量所對應(yīng)的目標人臉圖像,并將提取得到的目標人臉圖像所對應(yīng)身份信息確定為待識別目標的身份信息。優(yōu)選地,所述方法中按相似度從大到小的順序為每個子類排序,并提取獲得相似度最大的子類和該子類中特征向量所對應(yīng)的目標人臉圖像。取出相似度最大的子類對應(yīng)的身份信息,確定待測者身份。本發(fā)明為驗證本方法可以有效進行聚類下的人臉識別,給出一個實驗例,所述實驗例中訓(xùn)練樣本采用ORL人臉庫,表一中的測試數(shù)據(jù)由400張訓(xùn)練樣本和400張測試樣本得到。相似度為1表示兩個人完全相同,當人臉庫中目標數(shù)較少,如庫中只有10個人,且?guī)熘写嬖诖R別目標時,待識別目標與對應(yīng)子類的相似度近乎為1。而當庫中目標數(shù)增大后,待識別目標與庫中對應(yīng)子類的相似度呈下降的趨勢,改進后的算法使這一趨勢大幅度降低。相似度閾值改進前準確率改進后準確率0.9530.75%79%0.9069.50%95.5%0.8590%99.5%0.8095%99.75%0.7598%100%0.7099.5%100%0.65100%100%表1改進前后識別準確率對比其中,表1中相似度閾值:判定識別結(jié)果為某個人的相似度界限。改進前準確率:未加入聚類算法,指定閾值的識別率。改進后準確率:加入聚類算法,指定閾值的識別率。由表1可見,在相似度閾值設(shè)置為0.95、0.90、0.85時,識別結(jié)果準確率均有很大幅度的提升。而降低相似度閾值后,二者的準確率最終都提升為100%。這說明在目標數(shù)目不斷增大過程中,改進后的算法仍能在較高的相似度閾值上識別出人臉,而改進前的算法識別性能卻大幅度下降。訓(xùn)練目標數(shù)改進前訓(xùn)練時間改進后訓(xùn)練時間10(100張人臉圖片)62.14s65.11s20(200張人臉圖片)123.48s126.42s40(400張人臉圖片)268.42s272.73s表2改進前后訓(xùn)練時間對比由表2可見,改進后的算法在計算量上只有小幅提升,在改進性能的同時并不影響算法的運行速度。綜上,本發(fā)明所提出的一種聚類再分類的人臉識別方法,對采集到的訓(xùn)練樣本的特征向量進行聚類運算,進一步縮小訓(xùn)練樣本的類內(nèi)距離,減小樣本局部的信息丟失;子類特征向量可以更準確的反映采樣時由于表情、光照、姿態(tài)不同帶來的差異化。所屬方法有效地消除了特征向量均值化時的相互抵消,在增加一定計算量的基礎(chǔ)上大幅提高了人臉識別的準確率。可以通過聚類算法縮小類間距離以減小采集過程中的誤差,較大幅度的提高了人臉識別的準確率。上面結(jié)合附圖對本發(fā)明的實施方式作了詳細說明,但是本發(fā)明并不限于上述實施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前提下做出各種變化。當前第1頁1 2 3