亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

深度遷移學習在人群屬性的識別方法與流程

文檔序號:12365563閱讀:642來源:國知局
本發(fā)明涉及人臉識別領域,尤其涉及一種深度遷移學習在人群屬性的識別方法。
背景技術
:近年來,基于深度學習的視覺相關算法在圖像分類、目標檢測、物體分割等領域取得了非常大的進展。但是,深度學習的最大問題是需要非常巨大的樣本來進行模型的訓練,這使得其在某些樣本數量有限的任務上較之傳統(tǒng)算法很難取得較大突破;有研究表明深度學習學習到的特征和相應的任務是緊密相關的,很難直接將其應用到其他任務上。傳統(tǒng)的基于人造特征的識別算法,在精度上很難滿足現實場景中的需要。技術實現要素:為了解決現有技術中的問題,本發(fā)明提供了一種深度遷移學習在人群屬性的識別方法,解決現有技術中深度學習需要大量樣本進行模型訓練、學習到的特征不能直接遷移到其它領域的問題。本發(fā)明是通過以下技術方案實現的:設計、制造了一種深度遷移學習在人群屬性的識別方法,包括如下步驟:(A)構建人臉圖像數據庫以及人群屬性信息;(B)預訓練卷積神經網絡模型;(C)進行人臉識別任務微調;(D)使用已標注的人群屬性數據進行模型微調。作為本發(fā)明的進一步改進:所述步驟(A)中,人群屬性信息包括但不限于種族和族裔信息,若圖像中包括該項屬性則對應數值設置為1,否則設置為0;人臉圖像為自然場景中的圖像,其來源于公開的數據集或視頻截取。作為本發(fā)明的進一步改進:所述步驟(B)中,在圖片庫imageNet上預訓練卷積神經網絡模型,卷積神經網絡包含8個卷積層,4個下采樣層以及兩個全鏈接層,每個卷積層后連接一個激活函數ReLU,每個Batch的圖像數量為64,學習率從0.01~0.00001,共計訓練約為40輪。作為本發(fā)明的進一步改進:所述步驟(C)中,將步驟(B)中訓練好的模型進行人臉識別任務微調,微調時將最后一個全連接層的輸出為所使用的人臉數據庫包含的個人數量,本層學習率是其它層的10倍,學習率保持在0.00001,共計訓練約為20輪。作為本發(fā)明的進一步改進:所述步驟(D)中,將步驟(C)中訓練好的模型增加已標注的人群屬性數據進行模型微調。作為本發(fā)明的進一步改進:對模型進行微調時,需要先進行人臉檢測、人臉對齊以及人臉歸一化操作。作為本發(fā)明的進一步改進:人群屬性信息通過屬性分類器或者網絡直接輸出進行信息表達。本發(fā)明的有益效果是:將深度學習和遷移學習的思想結合在一起,將其應用在人群屬性識別(如種族識別)上,在樣本量非常有限的前提下,能夠取得非常好的效果。【附圖說明】圖1為本發(fā)明識別示意框圖?!揪唧w實施方式】下面結合附圖說明及具體實施方式對本發(fā)明進一步說明。一種深度遷移學習在人群屬性的識別方法,包括如下步驟:(A)構建人臉圖像數據庫以及人群屬性信息;(B)預訓練卷積神經網絡模型;(C)進行人臉識別任務微調;(D)使用已標注的人群屬性數據進行模型微調。所述步驟(A)中,人群屬性信息包括但不限于種族和族裔信息,若圖像中包括該項屬性則對應數值設置為1,否則設置為0;人臉圖像為自然場景中的圖像,其來源于公開的數據集或視頻截取。所述步驟(B)中,在圖片庫imageNet上預訓練卷積神經網絡模型,卷積神經網絡包含8個卷積層,4個下采樣層以及兩個全鏈接層,每個卷積層后連接一個激活函數ReLU,每個Batch的圖像數量為64,學習率從0.01~0.00001,共計訓練約為40輪。所述步驟(C)中,將步驟(B)中訓練好的模型進行人臉識別任務微調,微調時將最后一個全連接層的輸出為所使用的人臉數據庫包含的個人數量,本層學習率是其它層的10倍,學習率保持在0.00001,共計訓練約為20輪。所述步驟(D)中,將步驟(C)中訓練好的模型增加已標注的人群屬性數據進行模型微調。對模型進行微調時,需要先進行人臉檢測、人臉對齊以及人臉歸一化操作。人群屬性信息通過屬性分類器或者網絡直接輸出進行信息表達。在一實施例中,一種深度遷移學習在人群屬性的識別方法分為三個階段,第一,自然場景中的圖像是非常容易獲取的,而且有許多大規(guī)模公開的數據集,如ImageNet,利用ImageNet進行深度網絡的預訓練;第二,根據人臉圖像來進行屬性分類,由于模型沒有任何關于人臉特征的先驗知識,直接將ImageNet得到的特征應用在人臉圖像上,效果會比較差,所以將學習到的網絡在一定數量的人臉圖像上進行人臉識別任務的微調;第三,上個階段中學習到的特征已經能較好的進行人臉特征的表達,但是缺乏特定屬性,如種族相關的知識,所以使用少量已標注的特定屬性圖像進一步微調模型。神經網絡模型微調指的是在已訓練好的模型基礎上,通過一定的訓練策略對模型中學習到的參數進行局部微小調節(jié),進而使其能對不同的目標函數進行表達。尤其在樣本量非常有限的情況下,這種方法往往能取得非常滿意的效果。眾所周知神經網絡的初始化對網絡的訓練以及收斂是至關重要的,一般情況下在樣本量比較充足的條件下可以通過一些特定的初始化算法來保證模型的收斂,在樣本量非常有效的條件下直接進行訓練很可能會導致網絡陷入局部最小,但是通過預訓練學習到的參數再加上網絡微調在很大程度上是可以保證得到全局最優(yōu)的結果。經過上述幾個階段的預訓練和微調,得到的特征已經能比較好的對人群屬性進行分類。在一具體實施例中,如圖1所示,1~3中的訓練過程及具體參數如表1所示。1.在ImageNet上進行網絡預訓練,為網絡結構如表2所示,ImageNet包含1000類的自然場景圖像,圖像總量大于100萬,非常適合大規(guī)模的網絡訓練。本文中所使用的網絡共有10層(帶參數的層),其中包含8個卷積層,4個下采樣層,以及兩個全鏈接層,每個卷積層后連接一個ReLU激活函數,每個Batch的圖像數量為64,學習率從0.01~0.00001,共計訓練40輪。2.使用1中訓練好的模型,進行人臉識別任務微調,所使用的人臉數據庫包含500個人,每人大概40~100張圖像。微調時將最后一個全連接層的輸出改為500,本層學習率是其他層的10倍,學習率保持在0.00001,共計訓練20輪。3.在模型2的基礎上,使用已標注的人群屬性數據進行模型微調,所使用的人群屬性數據包含2類(具有該屬性的數據和不具有該屬性的數據),每類大概1000張圖像。微調過程與2類似。表1不同任務訓練過程Batch大小學習率訓練輪數ImageNet預訓練1281e-2~1e-540人臉識別微調641e-520屬性識別微調321e-510表2網絡結構為進一步完善,進行以下對比試驗,測試集合包含500個正樣例和500個負樣例,結果如表3所示:1.使用ImageNet進行圖像分類預訓練,提取Fc6層的特征進行屬性信息表達,使用SVM作為屬性分類器。2.使用ImageNet進行圖像分類預訓練,在人臉識別任務上進行網絡微調,提取Fc6層的特征進行屬性信息表達,使用SVM作為屬性分類器。3.使用ImageNet進行圖像分類預訓練,在人臉識別和屬性識別上進行網絡微調,直接使用網絡的輸出進行屬性分類。4.使用ImageNet進行圖像分類預訓練,在人臉識別和屬性識別上進行網絡微調,提取Fc6層的特征進行屬性信息表達,使用SVM作為屬性分類器。表3不同策略的分類結果ImageNet預訓練人臉識別模型微調人群屬性識別模型微調SVM分類器準確率YesNoNoYes94.54%YesYesNoYes96.30%YesYesYesNo98.32%YesYesYesYes98.75%經過上述幾個階段的預訓練和微調,得到的特征已經能比較好的對人群屬性進行分類。以上內容是結合具體的優(yōu)選實施方式對本發(fā)明所作的進一步詳細說明,不能認定本發(fā)明的具體實施只局限于這些說明。對于本發(fā)明所屬
技術領域
的普通技術人員來說,在不脫離本發(fā)明構思的前提下,還可以做出若干簡單推演或替換,都應當視為屬于本發(fā)明的保護范圍。當前第1頁1 2 3 
當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1