本發(fā)明涉及生物特征識(shí)別領(lǐng)域,尤其涉及一種人臉確認(rèn)方法及安全認(rèn)證裝置。
背景技術(shù):
人臉識(shí)別因其在實(shí)際生活中的易用性得到了國(guó)內(nèi)外學(xué)者的廣泛關(guān)注,通常一個(gè)人臉確認(rèn)系統(tǒng)由人臉采集,特征提取,特征確認(rèn)等幾個(gè)步驟構(gòu)成。其中特征提取對(duì)于人臉確認(rèn)的正確率具有最重要的影響。提取出最具判別性的特征在進(jìn)行人臉確認(rèn)時(shí),通??梢垣@得更好的確認(rèn)率,反之則會(huì)大幅度降低人臉確認(rèn)系統(tǒng)的準(zhǔn)確度。而對(duì)人臉確認(rèn)的研究也主要集中特征提取的方法上,人臉的特征提取則大致可以分為局部特征提取和全局特征提取兩種。
近些年來,傳統(tǒng)、經(jīng)典的手工制作的特征(LBP、SIFT等)太過于單一,無法從中進(jìn)行較大的改進(jìn),從而限制了更好特征提取模型的發(fā)展。由于特征自學(xué)習(xí)方法改變了單一的特征提取方法,從而受到關(guān)注,其思想包括:從局部圖像中學(xué)習(xí)一個(gè)碼本或者學(xué)習(xí)一組濾波算子。Ahonenetal采用K-means方法形成一個(gè)局部的濾波響應(yīng)碼本。Cui Zetal提出了對(duì)局部特征通過字典學(xué)習(xí)進(jìn)行局部編碼。
基于上述自學(xué)習(xí)方法,提出了一個(gè)廣義的特征提取框架:基于局部描述算子的稀疏自編碼器(Sparse Auto-Encoder based Local Descriptor)簡(jiǎn)稱SAELD。通過自稀疏編碼器學(xué)習(xí)一組濾波算子進(jìn)行人臉特征的提取。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種用于提高人臉確認(rèn)精度的人臉確認(rèn)方法。
本發(fā)明第一個(gè)方面提供的一種人臉確認(rèn)方法,包括:
獲取訓(xùn)練集,所述訓(xùn)練集包含m個(gè)樣本,所述樣本為通過展開圖像塊的像素獲得的列向量,所述圖像塊為人臉圖像分塊后的多個(gè)圖像塊中的一個(gè);
根據(jù)所述訓(xùn)練集訓(xùn)練基于局部描述算子的稀疏自編碼器,以使所述稀疏自編碼器的輸出逼近輸入;所述稀疏自編碼器為基于單隱層神經(jīng)網(wǎng)絡(luò)的非監(jiān)督特征學(xué)習(xí)模型;
對(duì)所述稀疏自編碼器進(jìn)行優(yōu)化獲得權(quán)重矩陣W(1);
將所述W(1)作為濾波器對(duì)所述人臉圖像進(jìn)行特征提取,獲得人臉特征;所述根據(jù)所述提取的人臉特征訓(xùn)練相似度度量模型,獲得相似度度量矩陣;
根據(jù)所述相似度度量矩陣計(jì)算所述訓(xùn)練集的特征對(duì)的相似度得分,以獲得相似度的確認(rèn)閾值;
獲取測(cè)試集特征對(duì),根據(jù)所述相似度度量矩陣計(jì)算所述測(cè)試集特征對(duì)的相似度得分;
根據(jù)所述相似度得分與所述相似度的確認(rèn)閾值比較,獲得所述人臉確認(rèn)的結(jié)果。
較佳地,所述圖像塊的大小為n=p×p。
較佳地,所述獲取訓(xùn)練集包括:隨機(jī)采樣大量的人臉圖像塊,共選取m個(gè)圖塊組成所述訓(xùn)練集x1={x(1),x(2),L,x(m)}∈?n×m,其中表示第i個(gè)訓(xùn)練樣本。
較佳地,所述根據(jù)所述訓(xùn)練集訓(xùn)練基于局部描述算子的稀疏自編碼器中,所述稀疏自編碼器的輸出與輸出之間的重構(gòu)誤差項(xiàng)滿足如下公式:
其中,x(i)為第i個(gè)輸入樣本,y(x(i))為第i個(gè)輸入樣本的輸出,W,b表示輸入層到隱層,隱層到輸出層的權(quán)重矩陣與偏置項(xiàng)。
較佳地,所述單隱層神經(jīng)網(wǎng)絡(luò)中各個(gè)層神經(jīng)元個(gè)數(shù)分別為s1、s2、s3;逐次將所述單隱層神經(jīng)網(wǎng)絡(luò)前一層網(wǎng)絡(luò)的輸出值作為后面一層網(wǎng)絡(luò)的輸入值。
較佳地,所述稀疏自編碼器包括:編碼部分和解碼部分;
其中,所述編碼部分是所述輸入層到所述隱層的非線性映射,其定義如下:
h(x)=σ(W(1)x+b(1))
所述解碼部分是所述隱層到輸出一種非線性映射,其定義如下:
y(x)=σ(W(2)x+b(2))
其中,W(1)為所述輸入層到所述隱層的權(quán)重;W(2)為所述隱層到所述輸出層的權(quán)重,b(1)和b(2)分別為相對(duì)應(yīng)的偏置項(xiàng),σ(·)為所述隱層和所述輸出層神經(jīng)元的非線性映射關(guān)系,定義如下:
較佳地,所述稀疏自編碼器第j個(gè)隱層單元hj平均激活值定義如下:
其中,期望的平均激值用ρ表示;
并且采用KL距離來測(cè)量期望激活值與實(shí)際激活值,其定義如下:
較佳地,還包括:
在所述稀疏自編碼器模型中增加稀疏性約束,則所述目標(biāo)函數(shù)的公式為:
較佳地,所述對(duì)所述稀疏自編碼器進(jìn)行優(yōu)化獲得權(quán)重矩陣W(1),包括:
設(shè)置所述自稀疏編碼模型中權(quán)重矩陣W和偏置項(xiàng)b的初始值,利用反向傳播算法對(duì)所述目標(biāo)函數(shù)的公式進(jìn)行求解;
依次迭代更新權(quán)重矩陣W和偏置值b,直到網(wǎng)絡(luò)收斂或者達(dá)到最大迭代次數(shù);
獲得優(yōu)化的稀疏自編碼器的權(quán)重值W與偏置值b,從而獲得所述權(quán)重矩陣W(1)。
較佳地,所述將所述W(1)作為濾波器對(duì)所述人臉圖像進(jìn)行特征提取,獲得人臉特征,包括:
利用所述W(1)對(duì)所述人臉圖像進(jìn)行卷積操作,并采用Sigmoid函數(shù)對(duì)濾波后的人臉圖像進(jìn)行非線性映射,獲得卷積特征。
較佳地,在所述獲得卷積特征之后,還包括:
對(duì)所述卷積特征進(jìn)行最大值池化操作,獲得池化后的人臉特征;
對(duì)所述池化后的人臉特征進(jìn)行白化主成分分析處理,取排列在前面d個(gè)主成分;
所述訓(xùn)練集表達(dá)式為:x1={x(1),x(2),L,x(m)}∈?n×m;
所述訓(xùn)練集經(jīng)過特征提取后,則可以獲得成對(duì)的特征向量集x2={xi1,xi2},i=1,2,L N,其中屬于一對(duì)人臉圖像的SAELD特征向量。
較佳地,還包括:
對(duì)所述SAELD特征向量進(jìn)行加權(quán)子空間的投影。
較佳地,所述對(duì)所述SAELD特征向量進(jìn)行加權(quán)子空間的投影,包括:
對(duì)所述SAELD特征對(duì)向量集x2={xi1,xi2},i=1,2,L N引入類標(biāo)信息;
其中,(xi1,xi2)∈S表示兩個(gè)特征代表同一個(gè)人;(xi1,xi2)∈D則表示兩個(gè)特征分別代表不同的人;
定義類內(nèi)特征對(duì)的加權(quán)協(xié)方差矩陣表達(dá)式為:
其中,u=2,a=0.8;
將所述加權(quán)協(xié)方差矩陣進(jìn)行特征值分解,可得其特征值Λ={λ1,K,λd}及對(duì)應(yīng)的特征向量P=(v1,K,vd),則所述加權(quán)協(xié)方差矩陣轉(zhuǎn)化為:
當(dāng)時(shí),
則所述人臉圖像的人臉特征對(duì)在類內(nèi)子空間的投影過程定義如下:
則所述SAELD特征對(duì)向量集通過加權(quán)子空間的投影,獲得投影后的SAELD特征對(duì)向量集其中
較佳地,獲得投影后的SAELD特征對(duì)向量集作為所述訓(xùn)練集的特征對(duì)訓(xùn)練所述相似度度量模型。
較佳地,在所述獲取所述人臉特征之間的相似度,還包括:
結(jié)合余弦相似度與馬氏距離,所述相似度度量矩陣的目標(biāo)函數(shù)定義如下:
其中,表示余弦相似度度量函數(shù);
表示馬氏度量函數(shù);
在所述目標(biāo)函數(shù)中引入二值類標(biāo)yi;
其中,當(dāng)則這一對(duì)特征代表同一個(gè)人,類標(biāo)yi=1;
當(dāng)表示這一對(duì)特征代表不同的人,則類標(biāo)yi=-1;
優(yōu)化的度量矩陣(G,M)滿足以下條件:
所述相似度度量矩陣滿足如下公式:
其中,所述相似度度量矩陣的最優(yōu)解(G,M)為:
較佳地,所述獲取所述提取的人臉特征訓(xùn)練相似度度量模型,獲得相似度度量矩陣的最優(yōu)解,根據(jù)所述相似度矩陣獲得訓(xùn)練集的特征對(duì)的相似度的確認(rèn)閾值,包括:
根據(jù)所述相似度度量矩陣的最優(yōu)解計(jì)算所述訓(xùn)練集的特征對(duì)的相似度得分,獲得所述相似度的確認(rèn)閾值。
較佳地,所述獲取測(cè)試集特征對(duì),根據(jù)所述相似度度量矩陣計(jì)算所述測(cè)試集特征對(duì)的相似度得分,包括:
根據(jù)所述測(cè)試集特征對(duì)的相似度得分與所述相似度的確認(rèn)閾值比較,獲得所述人臉確認(rèn)的結(jié)果。
較佳地,所述根據(jù)所述相似度得分與所述相似度的確認(rèn)閾值比較,獲得所述人臉確認(rèn)的結(jié)果,包括:
當(dāng)所述相似度得分大于或等于所述相似度的確認(rèn)閾值時(shí),所述人臉確認(rèn)的結(jié)果為確認(rèn)成功;
當(dāng)所述相似度得分小于所述相似度的確認(rèn)閾值時(shí),所述人臉確認(rèn)的結(jié)果為確認(rèn)失敗。
本發(fā)明第二個(gè)方面提供一種安全認(rèn)證裝置,包括:圖像識(shí)別模塊、處理模塊,所述處理模塊包括:訓(xùn)練單元和確認(rèn)單元;
其中,所述訓(xùn)練單元,用于:
獲取訓(xùn)練集,所述訓(xùn)練集包含m個(gè)樣本,所述樣本為通過展開圖像塊的像素獲得的列向量,所述圖像塊為人臉圖像分塊后的多個(gè)圖像塊中的一個(gè);
根據(jù)所述訓(xùn)練集訓(xùn)練基于局部描述算子的稀疏自編碼器,以使所述稀疏自編碼器的輸出逼近輸入;所述稀疏自編碼器為基于單隱層神經(jīng)網(wǎng)絡(luò)的非監(jiān)督特征學(xué)習(xí)模型;
對(duì)所述稀疏自編碼器進(jìn)行優(yōu)化獲得輸入層到隱層的權(quán)重矩陣W(1);
將所述W(1)作為濾波器對(duì)所述人臉圖像進(jìn)行特征提取,獲得人臉特征;所述濾波器包含k個(gè)濾波算子;
根據(jù)所述人臉特征訓(xùn)練相似度度量模型,獲得相似度度量矩陣;
根據(jù)所述相似度度量矩陣計(jì)算所述訓(xùn)練集的特征對(duì)的相似度得分,以獲得相似度的確認(rèn)閾值;
所述確認(rèn)單元,用于:
獲取測(cè)試樣本的特征對(duì),根據(jù)所述相似度度量矩陣計(jì)算所述測(cè)試集特征對(duì)的相似度得分;
根據(jù)所述相似度得分與所述相似度的確認(rèn)閾值比較,獲得所述人臉確認(rèn)的結(jié)果。
優(yōu)選地,所述圖像識(shí)別模塊,用于:獲取人臉圖像;
所述處理模塊,還包括:圖像處理單元;
所述圖像處理單元,用于對(duì)所述人臉圖像進(jìn)行分割獲取圖像塊;根據(jù)所述圖像塊生成所述訓(xùn)練集。
本實(shí)施例提供的人臉確認(rèn)方法及安全認(rèn)證裝置,通過獲取訓(xùn)練集,再根據(jù)所述訓(xùn)練集訓(xùn)練基于局部描述算子的稀疏自編碼器,以使所述稀疏自編碼器的輸出逼近輸入;所述稀疏自編碼器為基于單隱層神經(jīng)網(wǎng)絡(luò)的非監(jiān)督特征學(xué)習(xí)模型;對(duì)所述稀疏自編碼器進(jìn)行優(yōu)化獲得權(quán)重矩陣W(1);將所述W(1)作為濾波器對(duì)所述人臉圖像進(jìn)行特征提取,獲得人臉特征;根據(jù)所述人臉特征訓(xùn)練相似度度量模型,獲得相似度度量矩陣,進(jìn)而根據(jù)所述相似度度量矩陣計(jì)算所述訓(xùn)練集的特征對(duì)的相似度得分,以獲得相似度的確認(rèn)閾值;然后獲取測(cè)試集特征對(duì),根據(jù)所述相似度度量矩陣計(jì)算所述測(cè)試集特征對(duì)的相似度得分;根據(jù)所述相似度得分與所述相似度的確認(rèn)閾值比較,獲得所述人臉確認(rèn)的結(jié)果,該方法具有較好的類內(nèi)魯棒性與類間判別性,有效提高人臉確認(rèn)的精度。
附圖說明
圖1為本發(fā)明實(shí)施例提供的一種人臉確認(rèn)方法的流程示意圖;
圖2為本發(fā)明實(shí)施例提供的一種人臉確認(rèn)方法的示意圖;
圖3為本發(fā)明實(shí)施例提供的一種稀疏自編碼器結(jié)構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例提供的一種權(quán)重矩陣示意圖;
圖5為本發(fā)明實(shí)施例提供的一種卷積與非線性映射流程示意圖;
圖6為本發(fā)明實(shí)施例提供的池化操作流程示意圖;
圖7為本發(fā)明實(shí)施例提供的人臉確認(rèn)方法與目前主流方法在公開LFW數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果對(duì)比示意圖;
圖8為本發(fā)明實(shí)施例提供的一種安全認(rèn)證裝置的結(jié)構(gòu)示意圖;
圖9為本發(fā)明實(shí)施例提供的另一種安全認(rèn)證裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
圖1為本發(fā)明實(shí)施例提供的一種人臉確認(rèn)方法的流程示意圖,該方法被終端設(shè)備執(zhí)行,該終端設(shè)備可以為:安全認(rèn)證裝置,例如機(jī)場(chǎng)的人臉識(shí)別設(shè)備等,或者,又例如手機(jī)、智能穿戴設(shè)備等。參照?qǐng)D1,該方法具體包括:
步驟100、獲取訓(xùn)練集,所述訓(xùn)練集包含m個(gè)樣本,所述樣本為通過展開圖像塊的像素獲得的列向量,所述圖像塊為人臉圖像分塊后的多個(gè)圖像塊中的一個(gè);
步驟101、根據(jù)所述訓(xùn)練集訓(xùn)練基于局部描述算子的稀疏自編碼器,以使所述稀疏自編碼器的輸出逼近輸入;所述稀疏自編碼器為基于單隱層神經(jīng)網(wǎng)絡(luò)的非監(jiān)督特征學(xué)習(xí)模型;
步驟102、對(duì)所述稀疏自編碼器進(jìn)行優(yōu)化獲得輸入層到隱層的權(quán)重矩陣W(1);
步驟103、將所述W(1)作為濾波器對(duì)所述人臉圖像進(jìn)行特征提取,獲得人臉特征;所述濾波器包含k個(gè)濾波算子;
步驟104、根據(jù)所述人臉特征訓(xùn)練相似度度量模型,獲得相似度度量矩陣;
步驟105、根據(jù)所述相似度度量矩陣計(jì)算所述訓(xùn)練集的特征對(duì)的相似度得分,以獲得相似度的確認(rèn)閾值;
步驟106、獲取測(cè)試集特征對(duì),根據(jù)所述相似度度量矩陣計(jì)算所述測(cè)試集特征對(duì)的相似度得分;
步驟107、根據(jù)所述相似度得分與所述相似度的確認(rèn)閾值比較,獲得所述人臉確認(rèn)的結(jié)果。
本實(shí)施例提供的人臉確認(rèn)方法,通過獲取訓(xùn)練集,再根據(jù)所述訓(xùn)練集訓(xùn)練基于局部描述算子的稀疏自編碼器,以使所述稀疏自編碼器的輸出逼近輸入;所述稀疏自編碼器為基于單隱層神經(jīng)網(wǎng)絡(luò)的非監(jiān)督特征學(xué)習(xí)模型;對(duì)所述稀疏自編碼器進(jìn)行優(yōu)化獲得權(quán)重矩陣W(1);將所述W(1)作為濾波器對(duì)所述人臉圖像進(jìn)行特征提取,獲得人臉特征;根據(jù)所述提取的人臉特征訓(xùn)練相似度度量模型,獲得相似度度量矩陣,進(jìn)而根據(jù)所述相似度度量矩陣計(jì)算所述訓(xùn)練集的特征對(duì)的相似度得分,以獲得相似度的確認(rèn)閾值;然后獲取測(cè)試集特征對(duì),根據(jù)所述相似度度量矩陣計(jì)算所述測(cè)試集特征對(duì)的相似度得分;根據(jù)所述相似度得分與所述相似度的確認(rèn)閾值比較,獲得所述人臉確認(rèn)的結(jié)果,該方法具有較好的類內(nèi)魯棒性與類間判別性,有效提高人臉確認(rèn)的精度。
圖2為本發(fā)明實(shí)施例提供的一種人臉確認(rèn)方法的示意圖,參照?qǐng)D2,可知,該確認(rèn)方法可以包括:
對(duì)人臉圖像進(jìn)行裁剪;
對(duì)裁剪后的圖像預(yù)處理獲得訓(xùn)練集和測(cè)試集;
其中,訓(xùn)練集用于隨機(jī)采樣獲得圖像塊;
進(jìn)一步將圖像塊訓(xùn)練上述稀疏自編碼器(Sparse Auto-Encoder,簡(jiǎn)稱:SAE),
具體的,該稀疏自編碼器為基于局部描述算子的稀疏自編碼器(Sparse Auto-Encoder based Local Descriptor,簡(jiǎn)稱:SAELD)。
之后在通過濾波器池進(jìn)行特征提??;
再將人臉特征與測(cè)試集的特征進(jìn)行卷積;
進(jìn)一步進(jìn)行池化與串聯(lián);
最后完成白化PCA,從而獲得SAELD特征。
可選地,在上述實(shí)施例執(zhí)行步驟100之前,還需要對(duì)圖片進(jìn)行預(yù)處理,具體的,該圖像預(yù)處理方式,包括:
對(duì)樣本圖像進(jìn)行裁剪、對(duì)齊,留下人臉圖像,其大小為a×b像素,本發(fā)明中a=150,b=80;
進(jìn)一步地,在完成圖像的預(yù)處理后,還需要將圖像劃分為多個(gè)圖像塊:每幅圖像分塊,圖像塊的大小為n=p×p;
可選的,所述獲取訓(xùn)練集包括:隨機(jī)采樣大量的人臉圖像塊,共選取m個(gè)圖塊組成所述訓(xùn)練集x1={x(1),x(2),L,x(m)}∈?n×m,其中表示第i個(gè)訓(xùn)練樣本。
可選地,圖3為本發(fā)明實(shí)施例提供的一種稀疏自編碼器結(jié)構(gòu)示意圖,參照?qǐng)D3,下面給出步驟101的一種可能的實(shí)現(xiàn)方式,其目的是通過權(quán)重W的訓(xùn)練使得模型輸出逼近輸入,即其中,所述稀疏自編碼器的輸出與輸出之間的重構(gòu)誤差項(xiàng)滿足如下公式:
其中,x(i)為第i個(gè)輸入樣本,y(x(i))為第i個(gè)輸入樣本的輸出,W,b表示輸入層到隱層,隱層到輸出層的權(quán)值矩陣與偏置項(xiàng)。
所述單隱層神經(jīng)網(wǎng)絡(luò)中各個(gè)層神經(jīng)元個(gè)數(shù)分別為s1、s2、s3;逐次將所述單隱層神經(jīng)網(wǎng)絡(luò)前一層網(wǎng)絡(luò)的輸出值作為后面一層網(wǎng)絡(luò)的輸入值。
可選地,所述稀疏自編碼器包括:編碼部分和解碼部分;
其中,所述編碼部分是所述輸入層到所述隱層的非線性映射,其定義如下:
h(x)=σ(W(1)x+b(1)) (2)
所述解碼部分是所述隱層到輸出一種非線性映射,其定義如下:
y(x)=σ(W(2)x+b(2)) (3)
其中,W(1)為所述輸入層到所述隱層的權(quán)重;W(2)為所述隱層到所述輸出層的權(quán)重,b(1)和b(2)分別為相對(duì)應(yīng)的偏置項(xiàng),σ(·)為所述隱層和所述輸出層神經(jīng)元的非線性映射關(guān)系,定義如下:
進(jìn)一步地,所述稀疏自編碼器第j個(gè)隱層單元hj平均激活值定義如下:
其中,期望的平均激值用ρ表示;
一般地,引入稀疏性約束條件保證用盡量少的隱藏單元來表示輸入層特征(即隱層中只有小部分神經(jīng)元處于激活狀態(tài),其余神經(jīng)元均處于未激活狀態(tài)),并且采用KL距離來測(cè)量期望激活值與實(shí)際激活值,其定義如下:
在所述稀疏自編碼器模型中增加稀疏性約束,則在上述稀疏自編碼器模型中增加稀疏性約束,則將公式(6)作為公式(1)的正則項(xiàng),因此,公式(1)可重新定義為:
其中表示稀疏懲罰項(xiàng),表示矩陣W的Frobenius范數(shù),其目的是為了防止模型過擬合。λ和β為設(shè)置的平衡參數(shù),用于調(diào)節(jié)各項(xiàng)之間的相對(duì)大小關(guān)系。ρ和分別表示期望的激活值和實(shí)際的激活值。
進(jìn)一步地,步驟102的一種可能的實(shí)現(xiàn)方式:設(shè)置所述自稀疏編碼模型中權(quán)重矩陣W和偏置項(xiàng)b的初始值,利用反向傳播算法對(duì)上述公式(7)進(jìn)行求解,依次迭代更新權(quán)重矩陣W和偏置值b,即獲得優(yōu)化的稀疏自編碼器的權(quán)重值W與偏置值b,直到網(wǎng)絡(luò)收斂或者達(dá)到最大迭代次數(shù),從而獲得所述權(quán)重矩陣W(1)。
最終,得到優(yōu)化的稀疏自編碼器的權(quán)重值W與偏置值b。圖4為本發(fā)明實(shí)施例提供的一種權(quán)重矩陣示意圖,參照?qǐng)D4,每一個(gè)方格代表學(xué)習(xí)的輸入層到隱層的權(quán)重矩陣
下面提供步驟103的一種可能的實(shí)現(xiàn)方式:
步驟103a、利用所述W(1)對(duì)所述人臉圖像進(jìn)行卷積操作,并采用Sigmoid函數(shù)對(duì)濾波后的人臉圖像進(jìn)行非線性映射,獲得卷積特征。
具體的,圖5為本發(fā)明實(shí)施例提供的一種卷積與非線性映射流程示意圖,參照?qǐng)D5,圖像大小為a×b,圖像塊大小為p×p,利用W(1)對(duì)每幅人臉圖像進(jìn)行卷積操作(濾波),并采用Sigmoid函數(shù)對(duì)濾波后的圖像進(jìn)行非線性映射。則每幅圖像可以得到k個(gè)卷積特征,其特征大小為(a-p+1)×(b-p+1)。因此,獲得的特征維數(shù)太高,冗余度很大;
在步驟103a的基礎(chǔ)上,為了進(jìn)一步降低特征維數(shù),給出了一種進(jìn)行池化操作的方案,具體的:
步驟103b、對(duì)所述卷積特征進(jìn)行最大值池化操作,獲得池化后的人臉特征x;
步驟103c、對(duì)所述池化后的人臉特征進(jìn)行白化主成分分析處理,取排列在前面d個(gè)主成分;所述訓(xùn)練集表達(dá)式為:x1={x(1),x(2),L,x(m)}∈?n×m;
步驟103d、所述訓(xùn)練集經(jīng)過特征提取后,則可以獲得成對(duì)的特征向量集x2={xi1,xi2},i=1,2,L N,其中屬于一對(duì)人臉圖像的SAELD特征向量。
具體的,圖6為本發(fā)明實(shí)施例提供的池化操作流程示意圖,參照?qǐng)D6,對(duì)提取的卷積特征進(jìn)行池化操作。池化可分為最大值池化與均值池化。首先對(duì)圖像分塊,對(duì)每個(gè)塊內(nèi)所有像素值取最大值或均值來表示這個(gè)圖塊特征。這種策略不僅能結(jié)合圖像的不同位置的特征信息,也可以有效降低特征維數(shù)。本專利采用最大值池化,圖像池化與采樣尺寸分別取9×9,則將所有特征串聯(lián)成一個(gè)列向量,列向量長(zhǎng)度為:k×(a-p+1)×(b-p+1)/9。
更進(jìn)一步地,步驟103b-103d進(jìn)一步降低特征維數(shù)與特征之間冗余性。
進(jìn)一步地,對(duì)所述SAELD特征向量進(jìn)行加權(quán)子空間的投影。
具體的,所述對(duì)所述SAELD特征向量進(jìn)行加權(quán)子空間的投影,包括:
對(duì)所述SAELD特征對(duì)向量集x2={xi1,xi2},i=1,2,L N引入類標(biāo)信息;
其中,(xi1,xi2)∈S表示兩個(gè)特征代表同一個(gè)人;(xi1,xi2)∈D則表示兩個(gè)特征分別代表不同的人;
定義類內(nèi)特征對(duì)的加權(quán)協(xié)方差矩陣表達(dá)式為:
其中,ωi表示類內(nèi)特征對(duì)(xi1,xi2)∈S的權(quán)值,其定義如下:
其中,u=2,a=0.8;
將所述加權(quán)協(xié)方差矩陣進(jìn)行特征值分解,可得其特征值Λ={λ1,K,λd}及對(duì)應(yīng)的特征向量P=(v1,K,vd),則所述加權(quán)協(xié)方差矩陣轉(zhuǎn)化為:
當(dāng)時(shí),
則所述人臉圖像的人臉特征對(duì)在類內(nèi)子空間的投影過程定義如下:
則所述SAELD特征對(duì)向量集通過加權(quán)子空間的投影,獲得投影后的SAELD特征對(duì)向量集其中
進(jìn)一步地,學(xué)習(xí)相似度度量矩陣:基于上述步驟得到投影后的SAELD特征對(duì)向量集將其作為訓(xùn)練集的特征對(duì),設(shè)計(jì)一種相似度度量學(xué)習(xí)模型,利用優(yōu)化的度量矩陣計(jì)算一對(duì)人臉的特征向量之間的相似度,具體步驟如下:
獲得投影后的SAELD特征對(duì)向量集作為所述訓(xùn)練集的特征對(duì)訓(xùn)練所述相似度度量模型。
具體的,結(jié)合余弦相似度與馬氏距離,所述相似度度量矩陣的目標(biāo)函數(shù)定義如下:
其中,表示余弦相似度度量函數(shù);
表示馬氏度量函數(shù),二者均可以測(cè)量一對(duì)人臉特征之間的相似性。sG值越大,則二者越相似;dM值越小則表示二者越相似。因此,式(14)值越大,代表二個(gè)特征相似程度越高。在所述目標(biāo)函數(shù)中引入二值類標(biāo)yi;
其中,當(dāng)則這一對(duì)特征代表同一個(gè)人,類標(biāo)yi=1;
當(dāng)表示這一對(duì)特征代表不同的人,則類標(biāo)yi=-1
優(yōu)化的度量矩陣(G,M)必需保證滿足以下條件:當(dāng)yi=1時(shí),式(14)值較大;反之,當(dāng)yi=-1,式(14)的值較小,基于這一規(guī)則,則優(yōu)化的度量矩陣(G,M)滿足以下條件:
為避免最小化式(15)的經(jīng)驗(yàn)誤差產(chǎn)生的過擬合現(xiàn)象,增加正則項(xiàng)約束,則相似度度量模型重新定義如下:
對(duì)式(16)引入松弛變量,得到所述相似度度量矩陣滿足如下公式:
進(jìn)一步利用拉格朗日函數(shù),式(17)可表示如下:
將式(18)分別對(duì)M,G,ζ進(jìn)行求導(dǎo):
分別令可得:
則式(20)代入式(18),則得到相應(yīng)的對(duì)偶函數(shù):
其中,所述相似度度量矩陣的最優(yōu)解(G*,M*)為:
進(jìn)一步地,人臉確認(rèn)的過程前,步驟104的一種可能的實(shí)現(xiàn)方式為:
根據(jù)所述相似度度量矩陣的最優(yōu)解(G*,M*)所述訓(xùn)練集的特征對(duì)計(jì)算相似度得分,獲得所述相似度的確認(rèn)閾值。
可選地,步驟106一種可能的實(shí)現(xiàn)方式為:
根據(jù)所述相似度度量矩陣的最優(yōu)解對(duì)所述訓(xùn)練集的特征對(duì)計(jì)算相似度得分,獲得所述相似度的確認(rèn)閾值。
具體的,得到相似度確認(rèn)閾值后,進(jìn)一步獲取測(cè)試集特征對(duì),用相似度度量矩陣的最優(yōu)解計(jì)算測(cè)試集特征對(duì)的相似度得分。
可選地,步驟107一種可能的實(shí)現(xiàn)方式為:
當(dāng)所述相似度得分大于或等于所述相似度的確認(rèn)閾值時(shí),所述人臉確認(rèn)的結(jié)果為確認(rèn)成功;
當(dāng)所述相似度得分小于所述相似度的確認(rèn)閾值時(shí),所述人臉確認(rèn)的結(jié)果為確認(rèn)失敗。
最后,圖7為本發(fā)明實(shí)施例提供的人臉確認(rèn)方法與目前主流方法在公開LFW數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果對(duì)比示意圖,參照?qǐng)D7,可知本專利提供方法可以取得較為精準(zhǔn)的人臉確認(rèn)精度。
下面給出用于執(zhí)行上述實(shí)施例各個(gè)步驟及實(shí)現(xiàn)相應(yīng)功能的一種安全認(rèn)證裝置,圖8為本發(fā)明實(shí)施例提供的一種安全認(rèn)證裝置的結(jié)構(gòu)示意圖,參照?qǐng)D8,該裝置包括:圖像識(shí)別模塊10、處理模塊11,進(jìn)一步地,所述處理模塊11包括:訓(xùn)練單元11-1和確認(rèn)單元11-2;
其中,所述訓(xùn)練單元11-1,用于:
獲取訓(xùn)練集,所述訓(xùn)練集包含m個(gè)樣本,所述樣本為通過展開圖像塊的像素獲得的列向量,所述圖像塊為人臉圖像分塊后的多個(gè)圖像塊中的一個(gè);
根據(jù)所述訓(xùn)練集訓(xùn)練基于局部描述算子的稀疏自編碼器,以使所述稀疏自編碼器的輸出逼近輸入;所述稀疏自編碼器為基于單隱層神經(jīng)網(wǎng)絡(luò)的非監(jiān)督特征學(xué)習(xí)模型;
對(duì)所述稀疏自編碼器進(jìn)行優(yōu)化獲得輸入層到隱層的權(quán)重矩陣W(1);
將所述W(1)作為濾波器對(duì)所述人臉圖像進(jìn)行特征提取,獲得人臉特征;所述濾波器包含k個(gè)濾波算子;
根據(jù)所述人臉特征訓(xùn)練相似度度量模型,獲得相似度度量矩陣;
根據(jù)所述相似度度量矩陣計(jì)算所述訓(xùn)練集的特征對(duì)的相似度得分,以獲得相似度的確認(rèn)閾值;
所述確認(rèn)單元11-2,用于:
獲取測(cè)試集特征對(duì),根據(jù)所述相似度度量矩陣計(jì)算所述測(cè)試樣本的特征對(duì)的相似度得分;
根據(jù)所述相似度得分與所述相似度的確認(rèn)閾值比較,獲得所述人臉確認(rèn)的結(jié)果。
本實(shí)施例提供的安全認(rèn)證裝置,通過訓(xùn)練單元獲取訓(xùn)練集,訓(xùn)練單元再根據(jù)所述訓(xùn)練集訓(xùn)練基于局部描述算子的稀疏自編碼器,以使所述稀疏自編碼器的輸出逼近輸入;所述稀疏自編碼器為基于單隱層神經(jīng)網(wǎng)絡(luò)的非監(jiān)督特征學(xué)習(xí)模型;訓(xùn)練單元對(duì)所述稀疏自編碼器進(jìn)行優(yōu)化獲得權(quán)重矩陣W(1);訓(xùn)練單元將所述W(1)作為濾波器對(duì)所述人臉圖像進(jìn)行特征提取,獲得人臉特征;根據(jù)所述提取的人臉特征訓(xùn)練相似度度量模型,獲得相似度度量矩陣,進(jìn)而訓(xùn)練單元根據(jù)所述相似度度量矩陣計(jì)算所述訓(xùn)練集的特征對(duì)的相似度得分,以獲得相似度的確認(rèn)閾值;然后確認(rèn)單元獲取測(cè)試集特征對(duì),根據(jù)所述相似度度量矩陣計(jì)算所述測(cè)試集特征對(duì)的相似度得分;確認(rèn)單元根據(jù)所述相似度得分與所述相似度的確認(rèn)閾值比較,獲得所述人臉確認(rèn)的結(jié)果,該方法具有較好的類內(nèi)魯棒性與類間判別性,有效提高人臉確認(rèn)的精度。
在圖8的基礎(chǔ)上,圖9為本發(fā)明實(shí)施例提供的另一種安全認(rèn)證裝置的結(jié)構(gòu)示意圖,參照?qǐng)D9,該處理模塊11,還包括:圖像處理單元11-3;
所述圖像識(shí)別模塊10,用于:獲取人臉圖像;
所述圖像處理單元11-3,用于對(duì)所述人臉圖像進(jìn)行分割獲取圖像塊;根據(jù)所述圖像塊生成所述訓(xùn)練集。
需要說明的是,上文中圖像識(shí)別模塊10和處理模塊11可以集成在同一個(gè)實(shí)體設(shè)備中,也可以通過網(wǎng)絡(luò)連接,分別設(shè)置于不同的實(shí)體設(shè)備中。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。