1.基于多區(qū)域特征與度量學(xué)習(xí)的人臉特征識別方法,其特征在于,包括如下步驟:
通過多尺度人臉區(qū)域訓(xùn)練得到相應(yīng)位置與尺度的卷積神經(jīng)網(wǎng)絡(luò)參數(shù),并根據(jù)所述卷積神經(jīng)網(wǎng)絡(luò)參數(shù)提取出人臉對應(yīng)區(qū)域的特征;
對上述特征進行篩選,得到高維人臉特征;
根據(jù)所述高維人臉特征進行度量學(xué)習(xí),將特征進行降維處理得到特征表達后定義損失函數(shù),通過所述損失函數(shù)訓(xùn)練得到度量學(xué)習(xí)的網(wǎng)絡(luò)模型;
將待識別的圖像輸入所述網(wǎng)絡(luò)模型后,將人臉特征進行降維后利用歐幾里得距離進行識別。
2.根據(jù)權(quán)利要求1所述的人臉特征識別方法,其特征在于,所述多尺度人臉區(qū)域訓(xùn)練進一步包括如下步驟:
對于每一張輸入的人臉圖片進行人臉檢測與關(guān)鍵點標注,得到人臉框R和N個人臉關(guān)鍵點位置{P1,P2,P3,...,PN};
基于人臉關(guān)鍵點選取不同位置與尺度的人臉區(qū)域進行訓(xùn)練,得到人臉框的不同尺度輸入和不同位置輸入,進而得到多位置、多尺度的人臉區(qū)域及其卷積神經(jīng)網(wǎng)絡(luò)參數(shù)。
3.根據(jù)權(quán)利要求1所述的人臉特征識別方法,其特征在于,根據(jù)所述卷積神經(jīng)網(wǎng)絡(luò)參數(shù)提取出人臉對應(yīng)區(qū)域的特征并進行選擇的方法具體為:
設(shè)人臉圖片測試集的大小為Ntest,對其中的任一張圖片IMGi,進行人臉檢測和關(guān)鍵點標注,根據(jù)訓(xùn)練過程中的多區(qū)域的人臉選擇,截取對應(yīng)的多個區(qū)域,并分別輸入到對應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)里計算;
對于每張人臉圖片得到多個區(qū)域?qū)?yīng)的特征,分別計算多個特征中的每一個特征對于圖片測試集上Ntest張圖片的識別性能并繪制出ROC曲線;
根據(jù)ROC曲線選擇出人臉對應(yīng)區(qū)域的特征,作為度量學(xué)習(xí)需要的特征,并保留對應(yīng)特征區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)參數(shù)用作特征提取。
4.根據(jù)權(quán)利要求3所述的人臉特征識別方法,其特征在于,根據(jù)所述高維人臉特征進行度量學(xué)習(xí)具體包括如下步驟:
設(shè)人臉圖片訓(xùn)練集的大小為Ntrain,對于其中的圖片進行人臉檢測和關(guān)鍵點標注,并根據(jù)上述的卷積神經(jīng)網(wǎng)絡(luò)參數(shù)計算提取特征,得到數(shù)據(jù)量為Ntrain的高維人臉特征訓(xùn)練集,
記上述特征訓(xùn)練集中樣本的所有類別標簽數(shù)量為L,則類別標簽的集合為T={t1,t2,...,tL},
在訓(xùn)練集中隨機選取m個樣本X1={x1,1,x1,2...x1,N},X2={x2,1,x2,2...x2,N},…,Xm={xm,1,xm,2...xm,N},
樣本對應(yīng)的類別標簽為:Ybatch{y1,y2,...,ym},yi∈T,i=1,2,...,m
將上述數(shù)據(jù)記為一個訓(xùn)練組,對訓(xùn)練組的m個數(shù)據(jù)加入網(wǎng)絡(luò)中訓(xùn)練記為一個訓(xùn)練輪,一個訓(xùn)練組訓(xùn)練完成記為一輪訓(xùn)練完成,且每一輪訓(xùn)練的m個樣本均是獨立隨機選??;
在所述的一訓(xùn)練組中定義集合P和N如下:
P={(i,j)|i≠j且yi=y(tǒng)j,i=1,2,...,m}
N={(i,j)|i≠j且yi≠yj,i=1,2,...,m}
其中,P為所有正樣本對的下標的集合,N為所有負樣本對的下標集合。
5.根據(jù)權(quán)利要求4所述的人臉特征識別方法,其特征在于,將人臉特征進行降維處理得到特征表達后定義損失函數(shù)對網(wǎng)絡(luò)進行訓(xùn)練的方法具體為:
設(shè)W1,W2分別為訓(xùn)練網(wǎng)絡(luò)第一層和第二層的權(quán)重,b1,b2分別為第一層和第二層的偏置項,激活函數(shù)為g(x)=max(0,x),
在訓(xùn)練批次中,所述訓(xùn)練網(wǎng)絡(luò)第一層的網(wǎng)絡(luò)輸出分別為:
所述訓(xùn)練網(wǎng)絡(luò)第二層的網(wǎng)絡(luò)輸出分別為:
記為所有類別標簽對應(yīng)的特征經(jīng)過第一層網(wǎng)絡(luò)后的輸出U的聚類中心,
每一輪訓(xùn)練前,更新k=1,2,...,L,
對于一個訓(xùn)練組的m個樣本,定義第一個度量學(xué)習(xí)的損失函數(shù):
對所述訓(xùn)練網(wǎng)絡(luò)第二層的網(wǎng)絡(luò),
定義
定義第二個度量學(xué)習(xí)的損失函數(shù):
其中:
式中γ為常量。
最終得到總的損失函數(shù)為:L=L1+θ·L2,其中θ為兩者的比例參數(shù),利用上述損失函數(shù),訓(xùn)練一設(shè)定輪數(shù)后保存模型中的參數(shù)W1,b1,作為度量學(xué)習(xí)的網(wǎng)絡(luò)模型。
6.一種基于如權(quán)利要求1-5任一項所述的人臉特征識別方法的識別系統(tǒng),其特征在于,對于輸入的第一測試圖片和第二測試圖片,所述識別系統(tǒng)被配置為:
S1對其進行人臉檢測和關(guān)鍵點識別,選出經(jīng)過選擇的人臉區(qū)域,并加入到卷積神經(jīng)網(wǎng)絡(luò)中計算并歸一化,得到第一測試圖片的高維特征X1和第二測試圖片的高維特征X2;
S2將兩個高維特征X1和X2輸入到度量學(xué)習(xí)算法得到的模型中,得到測試第一測試圖片的降維特征U1和第二測試圖片的降維特征U2;
S3計算U1和U2間的歐式距離為D,將D與判別閾值Th進行比較,
S4若D≤Th,則判定兩張人臉測試圖片屬于同一個人;
S5否則這兩個人臉測試圖片不屬于同一個人。
7.基于多區(qū)域特征與度量學(xué)習(xí)的人臉特征識別系統(tǒng),其特征在于,包括:神經(jīng)卷積訓(xùn)練單元、度量學(xué)習(xí)模型單元以及判別單元,
所述神經(jīng)卷積訓(xùn)練單元,用以通過多尺度人臉區(qū)域訓(xùn)練得到相應(yīng)位置與尺度的卷積神經(jīng)網(wǎng)絡(luò)參數(shù),并根據(jù)所述卷積神經(jīng)網(wǎng)絡(luò)參數(shù)提取出人臉對應(yīng)區(qū)域的特征;以及對上述特征進行篩選,得到高維人臉特征;
所述度量學(xué)習(xí)模型單元,用以根據(jù)所述高維人臉特征進行度量學(xué)習(xí),將特征進行降維處理得到特征表達后定義損失函數(shù),通過所述損失函數(shù)訓(xùn)練得到度量學(xué)習(xí)的網(wǎng)絡(luò)模型;
所述判別單元,用以將待識別的圖像輸入所述網(wǎng)絡(luò)模型后,將人臉特征進行降維后利用歐幾里得距離進行識別。
8.基于多區(qū)域特征與度量學(xué)習(xí)的人臉特征識別系統(tǒng),其特征在于,部署多個服務(wù)器端,
所述服務(wù)器端被配置為:通過多尺度人臉區(qū)域訓(xùn)練得到相應(yīng)位置與尺度的卷積神經(jīng)網(wǎng)絡(luò)參數(shù),并根據(jù)所述卷積神經(jīng)網(wǎng)絡(luò)參數(shù)提取出人臉對應(yīng)區(qū)域的特征;對上述特征進行篩選,得到高維人臉特征;根據(jù)所述高維人臉特征進行度量學(xué)習(xí),將特征進行降維處理得到特征表達后定義損失函數(shù),通過所述損失函數(shù)訓(xùn)練得到度量學(xué)習(xí)的網(wǎng)絡(luò)模型;將待識別的圖像輸入所述網(wǎng)絡(luò)模型后,將人臉特征進行降維后利用歐幾里得距離進行識別。