本發(fā)明涉及人臉圖像識別技術(shù)領(lǐng)域,特別是涉及基于深層卷積神經(jīng)網(wǎng)絡(luò)的人臉質(zhì)量評估方法和系統(tǒng)。
背景技術(shù):
在人臉識別系統(tǒng)中,往往對輸入圖像的質(zhì)量有著嚴(yán)格的要求。輸入圖像中人臉的角度、旋轉(zhuǎn)、尺度、光照、分辨率、噪聲、遮擋等因素都會對識別結(jié)果產(chǎn)生重大影響。因此,在進(jìn)行識別前先對輸入的人臉圖像質(zhì)量進(jìn)行評估,能夠有效地過濾低質(zhì)量的輸入樣本,提高識別的準(zhǔn)確度。這一質(zhì)量評估和過濾機(jī)制在視頻人臉識別中尤其有效。因?yàn)樵谝曨l中存在著大量屬于同一被識別人臉對象的圖像樣本,但這些樣本的質(zhì)量卻不相同,如何從中選出高質(zhì)量的樣本用于識別,對于后續(xù)識別工作的精度的提升起到關(guān)鍵作用。因此需要設(shè)計一種快速有效的人臉質(zhì)量評估機(jī)制對待識別的人臉圖像質(zhì)量進(jìn)行評估。
技術(shù)實(shí)現(xiàn)要素:
鑒于以上所述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的目的在于提供基于深層卷積神經(jīng)網(wǎng)絡(luò)的人臉質(zhì)量評估方法和系統(tǒng),解決現(xiàn)有技術(shù)的問題。
為實(shí)現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的人臉質(zhì)量評估方法,包括:標(biāo)注樣本人臉圖像數(shù)據(jù)以建立包含第一質(zhì)量評估分值的訓(xùn)練數(shù)據(jù)集,其中,所述第一質(zhì)量評估分值是根據(jù)預(yù)設(shè)圖像質(zhì)量參數(shù)對所述樣本人臉圖像數(shù)據(jù)進(jìn)行初步質(zhì)量評估得到的;通過所述訓(xùn)練數(shù)據(jù)集訓(xùn)練深層卷積神經(jīng)網(wǎng)絡(luò),以通過所述訓(xùn)練減小所述深層卷積神經(jīng)網(wǎng)絡(luò)對應(yīng)所輸入圖像而輸出的第二質(zhì)量評估分值和所述輸入圖像的第一質(zhì)量評估分值間的差異。
于本發(fā)明的一實(shí)施例中,所述標(biāo)注樣本人臉圖像數(shù)據(jù)以建立包含第一質(zhì)量評估分值的訓(xùn)練數(shù)據(jù)集,包括:從數(shù)據(jù)源獲取圖像素材數(shù)據(jù),其中,所述圖像素材數(shù)據(jù)包含:具有人臉的多個圖片;從每個所述圖片中分別截取出人臉?biāo)诘念A(yù)定尺寸大小的圖像區(qū)域數(shù)據(jù);對每個圖像區(qū)域數(shù)據(jù)進(jìn)行所述初步質(zhì)量評估以得到第一質(zhì)量評估分值,并與對應(yīng)的圖像區(qū)域數(shù)據(jù)關(guān)聯(lián)存儲。
于本發(fā)明的一實(shí)施例中,所述預(yù)設(shè)圖像質(zhì)量參數(shù)包括:人臉旋轉(zhuǎn)和/側(cè)轉(zhuǎn)角度、人臉尺度、人臉遮擋情況、圖像光照度、圖像分辨率、及圖像噪聲情況中任意一種或多種組合。
根據(jù)權(quán)利要求1所述的人臉質(zhì)量評估方法,所述深層卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括:相連的輸入層、一個或多個串聯(lián)的卷積池化單元、dropout層、全連接層、及回歸層;所述卷積池化單元包括:相連的卷積層、BatchNorm層、激活層及均值池化層。
于本發(fā)明的一實(shí)施例中,所述回歸層所包含的回歸損失函數(shù)為歐氏距離損失函數(shù),所述第一質(zhì)量評估分值輸入至所述回歸層。
為實(shí)現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的人臉質(zhì)量評估系統(tǒng),包括:標(biāo)注模塊,用于標(biāo)注樣本人臉圖像數(shù)據(jù)以建立包含第一質(zhì)量評估分值的訓(xùn)練數(shù)據(jù)集,其中,所述第一質(zhì)量評估分值是根據(jù)預(yù)設(shè)圖像質(zhì)量參數(shù)對所述樣本人臉圖像數(shù)據(jù)進(jìn)行初步質(zhì)量評估得到的;訓(xùn)練模塊,用于通過所述訓(xùn)練數(shù)據(jù)集訓(xùn)練深層卷積神經(jīng)網(wǎng)絡(luò),以通過所述訓(xùn)練減小所述深層卷積神經(jīng)網(wǎng)絡(luò)對應(yīng)所輸入圖像而輸出的第二質(zhì)量評估分值和所述輸入圖像的第一質(zhì)量評估分值間的差異。
于本發(fā)明的一實(shí)施例中,所述標(biāo)注樣本人臉圖像數(shù)據(jù)以建立包含第一質(zhì)量評估分值的訓(xùn)練數(shù)據(jù)集,包括:從數(shù)據(jù)源獲取圖像素材數(shù)據(jù),其中,所述圖像素材數(shù)據(jù)包含:具有人臉的多個圖片;從每個所述圖片中分別截取出人臉?biāo)诘念A(yù)定尺寸大小的圖像區(qū)域數(shù)據(jù);對每個圖像區(qū)域數(shù)據(jù)進(jìn)行所述初步質(zhì)量評估以得到第一質(zhì)量評估分值,并與對應(yīng)的圖像區(qū)域數(shù)據(jù)關(guān)聯(lián)存儲。
于本發(fā)明的一實(shí)施例中,所述預(yù)設(shè)圖像質(zhì)量參數(shù)包括:人臉旋轉(zhuǎn)和/側(cè)轉(zhuǎn)角度、人臉尺度、人臉遮擋情況、圖像光照度、圖像分辨率、及圖像噪聲情況中任意一種或多種組合。
于本發(fā)明的一實(shí)施例中,所述深層卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括:相連的輸入層、多個卷積池化單元、dropout層、全連接層、及回歸層;所述卷積池化單元包括:相連的卷積層、BatchNorm層、激活層及均值池化層。
于本發(fā)明的一實(shí)施例中,所述回歸層所包含的回歸損失函數(shù)為歐氏距離損失函數(shù),所述第一質(zhì)量評估分值輸入至所述回歸層。
綜上所述,本發(fā)明的基于深層卷積神經(jīng)網(wǎng)絡(luò)的人臉質(zhì)量評估方法和系統(tǒng),通過標(biāo)注樣本人臉圖像數(shù)據(jù)以建立包含第一質(zhì)量評估分值的訓(xùn)練數(shù)據(jù)集,其中,所述第一質(zhì)量評估分值是根據(jù)預(yù)設(shè)圖像質(zhì)量參數(shù)對所述樣本人臉圖像數(shù)據(jù)進(jìn)行初步質(zhì)量評估得到的;通過所述訓(xùn)練數(shù)據(jù)集訓(xùn)練深層卷積神經(jīng)網(wǎng)絡(luò),以通過所述訓(xùn)練減小所述深層卷積神經(jīng)網(wǎng)絡(luò)對應(yīng)所輸入圖像而輸出的第二質(zhì)量評估分值和所述輸入圖像的第一質(zhì)量評估分值間的差異;優(yōu)化質(zhì)量評估及過濾的效果,能大大提升人臉識別的準(zhǔn)確度。
附圖說明
圖1顯示為本發(fā)明于一實(shí)施例中人臉質(zhì)量評估方法的流程示意圖。
圖2顯示為圖1中步驟S101的子流程示意圖。
圖3顯示為本發(fā)明于一實(shí)施例中的深度卷積神經(jīng)網(wǎng)絡(luò)的模塊結(jié)構(gòu)示意圖。
圖4顯示為本發(fā)明于一實(shí)施例中人臉質(zhì)量評估系統(tǒng)的模塊結(jié)構(gòu)示意圖。
元件標(biāo)號說明
401 標(biāo)注模塊
402 訓(xùn)練模塊
301 輸入層
302 卷積池化單元
3021 卷積層
3022 BatchNorm層
3023 激活層
3024 均值池化層
303 dropout層
304 全連接層
S101~S102 步驟
S201~S203 步驟
具體實(shí)施方式
以下通過特定的具體實(shí)例說明本發(fā)明的實(shí)施方式,本領(lǐng)域技術(shù)人員可由本說明書所揭露的內(nèi)容輕易地了解本發(fā)明的其他優(yōu)點(diǎn)與功效。本發(fā)明還可以通過另外不同的具體實(shí)施方式加以實(shí)施或應(yīng)用,本說明書中的各項(xiàng)細(xì)節(jié)也可以基于不同觀點(diǎn)與應(yīng)用,在沒有背離本發(fā)明的精神下進(jìn)行各種修飾或改變。需說明的是,在不沖突的情況下,以下實(shí)施例及實(shí)施例中的特征可以相互組合。
需要說明的是,以下實(shí)施例中所提供的圖示僅以示意方式說明本發(fā)明的基本構(gòu)想,遂圖式中僅顯示與本發(fā)明中有關(guān)的組件而非按照實(shí)際實(shí)施時的組件數(shù)目、形狀及尺寸繪制,其實(shí)際實(shí)施時各組件的型態(tài)、數(shù)量及比例可為一種隨意的改變,且其組件布局型態(tài)也可能更為復(fù)雜。
本發(fā)明的技術(shù)方案應(yīng)用于人臉圖像識別技術(shù)領(lǐng)域,通過提供用于對待識別的包含人臉的圖片進(jìn)行質(zhì)量評估的方案,增強(qiáng)評估的準(zhǔn)確性,從而可提升人臉識別的準(zhǔn)確性。
如圖1所示,本發(fā)明提供一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的人臉質(zhì)量評估方法,包括:
步驟S101:標(biāo)注樣本人臉圖像數(shù)據(jù)以建立包含第一質(zhì)量評估分值的訓(xùn)練數(shù)據(jù)集,其中,所述第一質(zhì)量評估分值是根據(jù)預(yù)設(shè)圖像質(zhì)量參數(shù)對所述樣本人臉圖像數(shù)據(jù)進(jìn)行初步質(zhì)量評估得到的。
于本發(fā)明的一實(shí)施例中,所述預(yù)設(shè)圖像質(zhì)量參數(shù)包括:人臉旋轉(zhuǎn)和/側(cè)轉(zhuǎn)角度、人臉尺度、人臉遮擋情況、圖像光照度、圖像分辨率、及圖像噪聲情況中任意一種或多種組合;該些參數(shù)是關(guān)聯(lián)于人臉圖像質(zhì)量的,所述質(zhì)量評估的標(biāo)準(zhǔn)是是否利于人臉識別,例如人臉旋轉(zhuǎn)或側(cè)轉(zhuǎn)到圖像中無法看到整個正臉時,則該圖像質(zhì)量就較低;再例如圖像分辨率低,質(zhì)量亦較低。
所述第一質(zhì)量評估分值的大小可以是0~1之間;舉例來說,可以是由多個個體分別輸出個體質(zhì)量評估分值,然后從中去除最高分或最低分,計算剩余的各個體質(zhì)量評估分值的平均值作為所述第一質(zhì)量評估分值。
于本發(fā)明的一實(shí)施例中,如圖2所示,所述步驟S101可具體包含以下步驟:
步驟S201:從數(shù)據(jù)源獲取圖像素材數(shù)據(jù),其中,所述圖像素材數(shù)據(jù)包含:具有人臉的多個圖片。
于本發(fā)明的一實(shí)施例中,所述數(shù)據(jù)源可以是本地終端設(shè)備,也可以是互聯(lián)網(wǎng)。
步驟S202:從每個所述圖片中分別截取出人臉?biāo)诘念A(yù)定尺寸大小的圖像區(qū)域數(shù)據(jù)。
于本發(fā)明的一實(shí)施例中,可通過圖像識別技術(shù)對圖片中的人臉?biāo)谖恢眉捌溥吘夁M(jìn)行定位,從而從中提取人臉?biāo)谖恢玫念A(yù)定尺寸大小的圖像區(qū)域數(shù)據(jù)。
步驟S203:對每個圖像區(qū)域數(shù)據(jù)進(jìn)行所述初步質(zhì)量評估以得到第一質(zhì)量評估分值,并與對應(yīng)的圖像區(qū)域數(shù)據(jù)關(guān)聯(lián)存儲。
例如,每張圖片與其對應(yīng)的第一質(zhì)量評估分值關(guān)聯(lián)地存儲。
步驟S102:通過所述訓(xùn)練數(shù)據(jù)集訓(xùn)練深層卷積神經(jīng)網(wǎng)絡(luò),以通過所述訓(xùn)練減小所述深層卷積神經(jīng)網(wǎng)絡(luò)對應(yīng)所輸入圖像而輸出的第二質(zhì)量評估分值和所述輸入圖像的第一質(zhì)量評估分值間的差異。
具體的,所述訓(xùn)練的目的是讓深層卷積神經(jīng)網(wǎng)絡(luò)輸出的第二質(zhì)量評估分值與第一質(zhì)量評估分值的標(biāo)準(zhǔn)統(tǒng)一,即讓深層卷積神經(jīng)網(wǎng)絡(luò)逐步學(xué)會所述初步質(zhì)量評估的方法;所述個體可以是人,由人根據(jù)預(yù)設(shè)圖像質(zhì)量參數(shù)的客觀指標(biāo)進(jìn)行打分,也可以參考人的主觀感受進(jìn)行打分,則所述訓(xùn)練的目的是讓深層卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)人對圖像質(zhì)量評價的感受;當(dāng)然,所述個體也可以是計算機(jī)設(shè)備,尤其可以是經(jīng)過訓(xùn)練而具有人工智能的計算機(jī)設(shè)備。
舉例來講,對待識別圖像可截取其人臉?biāo)诘膱D像區(qū)域數(shù)據(jù),并獲取待識別圖像的第一質(zhì)量評估分值,進(jìn)而,將圖像區(qū)域數(shù)據(jù)及其第一質(zhì)量評估分值輸入深層卷積神經(jīng)網(wǎng)絡(luò)中,從而得到第二質(zhì)量評估分值。
如圖3所示,展示所述深層卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),所述深層卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括:相連的輸入層301、一個或多個串聯(lián)的卷積池化單元302、dropout層303、全連接層304、及回歸層305;所述卷積池化單元302包括:相連的卷積層3021、BatchNorm層3022、激活層3023及均值池化層3024。
所述卷積池化單元302在圖中顯示為有N個,于一實(shí)施例中,所述卷積池化單元302優(yōu)選可以有4個,但并非以此為限;于本發(fā)明的一實(shí)施例中,所述回歸層所包含的回歸損失函數(shù)為歐氏距離損失函數(shù),所述第一質(zhì)量評估分值輸入至所述回歸層,所述第一質(zhì)量評估分值與輸入圖像經(jīng)過深層卷積神經(jīng)網(wǎng)絡(luò)前述各層變換后的輸出比對,計算歐氏距離損失函數(shù),如此反復(fù),逐步優(yōu)化減小第二質(zhì)量評估分值和第一質(zhì)量評估分值間的差異,該訓(xùn)練過程即為通過梯度下降法優(yōu)化最小化歐氏距離損失函數(shù)的過程。
如圖4所示,本發(fā)明提供一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的人臉質(zhì)量評估系統(tǒng),其原理與上述方法實(shí)施例大致相同,兩個實(shí)施例間的技術(shù)特征均可相互通用,因此相同的技術(shù)細(xì)節(jié)不作重復(fù)贅述;
所述系統(tǒng)包括:
標(biāo)注模塊401,用于標(biāo)注樣本人臉圖像數(shù)據(jù)以建立包含第一質(zhì)量評估分值的訓(xùn)練數(shù)據(jù)集,其中,所述第一質(zhì)量評估分值是根據(jù)預(yù)設(shè)圖像質(zhì)量參數(shù)對所述樣本人臉圖像數(shù)據(jù)進(jìn)行初步質(zhì)量評估得到的;
訓(xùn)練模塊402,用于通過所述訓(xùn)練數(shù)據(jù)集訓(xùn)練深層卷積神經(jīng)網(wǎng)絡(luò),以通過所述訓(xùn)練減小所述深層卷積神經(jīng)網(wǎng)絡(luò)對應(yīng)所輸入圖像而輸出的第二質(zhì)量評估分值和所述輸入圖像的第一質(zhì)量評估分值間的差異。
于本發(fā)明的一實(shí)施例中,所述標(biāo)注樣本人臉圖像數(shù)據(jù)以建立包含第一質(zhì)量評估分值的訓(xùn)練數(shù)據(jù)集,包括:從數(shù)據(jù)源獲取圖像素材數(shù)據(jù),其中,所述圖像素材數(shù)據(jù)包含:具有人臉的多個圖片;從每個所述圖片中分別截取出人臉?biāo)诘念A(yù)定尺寸大小的圖像區(qū)域數(shù)據(jù);對每個圖像區(qū)域數(shù)據(jù)進(jìn)行所述初步質(zhì)量評估以得到第一質(zhì)量評估分值,并與對應(yīng)的圖像區(qū)域數(shù)據(jù)關(guān)聯(lián)存儲。
于本發(fā)明的一實(shí)施例中,所述預(yù)設(shè)圖像質(zhì)量參數(shù)包括:人臉旋轉(zhuǎn)和/側(cè)轉(zhuǎn)角度、人臉尺度、人臉遮擋情況、圖像光照度、圖像分辨率、及圖像噪聲情況中任意一種或多種組合。
于本發(fā)明的一實(shí)施例中,所述深層卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括:相連的輸入層、多個卷積池化單元、dropout層、全連接層、及回歸層;所述卷積池化單元包括:相連的卷積層、BatchNorm層、激活層及均值池化層。
于本發(fā)明的一實(shí)施例中,所述回歸層所包含的回歸損失函數(shù)為歐氏距離損失函數(shù),所述第一質(zhì)量評估分值輸入至所述回歸層。
綜上所述,本發(fā)明的基于深層卷積神經(jīng)網(wǎng)絡(luò)的人臉質(zhì)量評估方法和系統(tǒng),通過標(biāo)注樣本人臉圖像數(shù)據(jù)以建立包含第一質(zhì)量評估分值的訓(xùn)練數(shù)據(jù)集,其中,所述第一質(zhì)量評估分值是根據(jù)預(yù)設(shè)圖像質(zhì)量參數(shù)對所述樣本人臉圖像數(shù)據(jù)進(jìn)行初步質(zhì)量評估得到的;通過所述訓(xùn)練數(shù)據(jù)集訓(xùn)練深層卷積神經(jīng)網(wǎng)絡(luò),以通過所述訓(xùn)練減小所述深層卷積神經(jīng)網(wǎng)絡(luò)對應(yīng)所輸入圖像而輸出的第二質(zhì)量評估分值和所述輸入圖像的第一質(zhì)量評估分值間的差異;優(yōu)化質(zhì)量評估及過濾的效果,能大大提升人臉識別的準(zhǔn)確度。
上述實(shí)施例僅例示性說明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。任何熟悉此技術(shù)的人士皆可在不違背本發(fā)明的精神及范疇下,對上述實(shí)施例進(jìn)行修飾或改變。因此,舉凡所屬技術(shù)領(lǐng)域中具有通常知識者在未脫離本發(fā)明所揭示的精神與技術(shù)思想下所完成的一切等效修飾或改變,仍應(yīng)由本發(fā)明的權(quán)利要求所涵蓋。