一種人臉圖像的年齡分類方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種人臉圖像的年齡分類方法,其通過收集樣本圖像和獲取待檢測圖像,并進行人工標注各個樣本圖像的年齡類型和預設標準人臉圖,然后比對樣本圖像或待檢測圖像的人臉特征關鍵點和標準人臉圖的人臉特征關鍵點,然后對樣本圖像或待檢測圖像進行關鍵點對齊和調整,再對調整后的樣本圖像或待檢測圖像進行輪廓提取得到樣本圖像或待檢測圖像的人臉輪廓圖,最后將待檢測圖像的人臉輪廓圖采用所述的分類模型進行年齡分類得到待檢測圖像的年齡類型;由此通過人工和機器配合的方式進行標注年齡類型,提高了卷積神經網絡的學習精度,并且利用關鍵點對齊和輪廓提取來進行樣本圖像的處理,使得到的訓練數據都是比較統(tǒng)一的圖像,從而提高訓練模型的精度,使得年齡分類更加準確。
【專利說明】-種人臉圖像的年齡分類方法和系統(tǒng)
【技術領域】
[0001] 本發(fā)明設及圖像分類方法,特別是一種人臉圖像的年齡分類方法和采用該方法的 系統(tǒng)。
【背景技術】
[0002] 圖像分類是根據各自在圖像信息中所反映的不同特征,把不同類別的目標區(qū)分開 來的圖像處理方法,它利用計算機對圖像進行定量分析,把圖像或圖像中的每個像元或區(qū) 域劃歸為若干個類別中的某一種,W代替人的視覺判讀。
[0003] 人臉圖像的年齡分類是人臉識別技術的一個相關技術。一個人從出生開始逐漸長 大成人的過程中,隨著臉部骨骼的生長,臉型不斷變長變大,相貌也在變化;而從青年不斷 衰老進入老年的過程中,皮膚逐漸衰老,皺紋不斷增多。因此,如果能夠根據人臉圖像進行 年齡分類從而準確地判別其所屬年齡段,將有助于對人的身份的正確鑒別。
[0004] 此外,年齡判別在人機交互領域有著很多應用,例如網頁瀏覽器可W根據用戶的 年齡來決定是否允許用戶查看某些網頁;自動售貨機可W拒絕向未成年人出售香煙和酒精 性飲料;公共場所可W根據不同年齡的需求提供相應的服務等;特別是,圖像處理過程中, 尤其是在美顏處理時,我們需要對圖像中的人臉估年齡,從而針對其進行合理的效果處理, 因此估計圖像上人臉年齡對于人像美容來說是個關鍵性的問題。
【發(fā)明內容】
[0005] 本發(fā)明為解決上述問題,提供了一種分類較準確的人臉圖像的年齡分類方法和系 統(tǒng)。
[0006] 為實現上述目的,本發(fā)明采用的技術方案為:
[0007] 一種人臉圖像的年齡分類方法,其特征在于,包括W下步驟:
[000引 10.收集樣本圖像并進行人工標注各個樣本圖像的年齡類型,并預設標準人臉 圖;
[0009] 20.比對樣本圖像的人臉特征關鍵點和標準人臉圖的人臉特征關鍵點,對樣本圖 像進行關鍵點對齊和調整,再對調整后的樣本圖像進行輪廓提取得到樣本圖像的人臉輪廓 圖,并將該樣本圖像的人臉輪廓圖進行歸一化處理并輸入卷積神經網絡系統(tǒng)進行分類模型 的訓練;
[0010] 30.獲取待檢測圖像,比對待檢測圖像的人臉特征關鍵點和標準人臉圖的人臉特 征關鍵點,對待檢測圖像進行關鍵點對齊和調整,再對調整后的待檢測圖像進行輪廓提取 得到待檢測圖像的人臉輪廓圖,并將待檢測圖像的人臉輪廓圖采用所述的分類模型進行年 齡分類,得到待檢測圖像的年齡類型。
[0011] 優(yōu)選的,在進行分類模型的訓練過程中,卷積神經網絡系統(tǒng)將分類錯誤的樣本圖 像收集起來并依次執(zhí)行步驟10及步驟20,直到超過預期結果時定為所述步驟20所訓練出 來的分類模型為最佳分類模型,并在所述的步驟30中采用該最佳分類模型對待檢測圖像 的人臉輪廓圖進行年齡分類,得到待檢測圖像的年齡類型。
[0012] 優(yōu)選的,所述的年齡類型包括;嬰幼兒、兒童、少年、青年、中年、老年。
[0013] 優(yōu)選的,所述的步驟20中比對樣本圖像的人臉特征關鍵點和標準人臉圖的人臉 特征關鍵點,對樣本圖像進行關鍵點對齊和調整,或者,所述的步驟30中比對待檢測圖像 的人臉特征關鍵點和標準人臉圖的人臉特征關鍵點,對待檢測圖像進行關鍵點對齊和調 整,主要是通過預設標準人臉圖及其對應的人臉特征關鍵點,并根據獲取的樣本圖像或待 檢測圖像的人臉區(qū)域及其對應的人臉特征關鍵點,利用仿射變換對樣本圖像或待檢測圖像 的人臉特征關鍵點進行對齊和調整,再對調整后的樣本圖像或待檢測圖像進行輪廓提取得 到調整后的人臉輪廓圖,并將該調整后的人臉輪廓圖作為所述樣本圖像或待檢測圖像的人 臉輪廓圖。
[0014] 優(yōu)選的,所述的人臉特征關鍵點主要包括眼睛輪廓、嘴部、眉毛、臉部輪廓線、額 頭。
[0015] 優(yōu)選的,所述的輪廓提取主要是對所述調整后的樣本圖像或待檢測圖像進行小波 變換,得到低頻分量的頻域圖像,即所述的人臉輪廓圖。
[0016] 優(yōu)選的,所述的步驟30中將待檢測圖像的人臉輪廓圖采用所述的分類模型進行 年齡分類得到待檢測圖像的年齡類型,主要是將所述的待檢測圖像的人臉輪廓圖放入卷積 神經網絡系統(tǒng)中進行計算待檢測圖像每一種年齡類型的概率,并選擇概率最大的年齡類型 作為待檢測圖像的年齡類型。
[0017] 另外,本發(fā)明還對應上述方法提供了一種人臉圖像的年齡分類系統(tǒng),其特征在 于:
[001引采樣單元,用于收集樣本圖像W供人工標注各個樣本圖像的年齡類型;
[0019] 編輯單元,其通過比對所述的樣本圖像或獲取的待檢測圖像的人臉特征關鍵點和 預設的標準人臉圖的人臉特征關鍵點,對樣本圖像或待檢測圖像進行關鍵點對齊和調整, 再對調整后的樣本圖像或待檢測圖像進行輪廓提取得到樣本圖像或待檢測圖像的人臉輪 廓圖;
[0020] 歸一化單元,將所述的樣本圖像或待檢測圖像的人臉輪廓圖進行歸一化處理;
[0021] 學習單元,將歸一化處理后的樣本圖像或待檢測圖像的人臉輪廓圖輸入卷積神經 網絡系統(tǒng)進行分類模型的訓練;
[0022] 判斷單元,將所述待檢測圖像的人臉輪廓圖采用所述的分類模型進行年齡分類, W判斷所述待檢測圖像的年齡類型。
[0023] 本發(fā)明的有益效果是:
[0024] 本發(fā)明的一種人臉圖像的年齡分類方法和系統(tǒng),其通過收集樣本圖像并進行人工 標注各個樣本圖像的年齡類型,并預設標準人臉圖,然后比對樣本圖像的人臉特征關鍵點 和標準人臉圖的人臉特征關鍵點,對樣本圖像進行關鍵點對齊和調整,再對調整后的樣本 圖像進行輪廓提取得到樣本圖像的人臉輪廓圖,并將該樣本圖像的人臉輪廓圖進行歸一化 處理并輸入卷積神經網絡系統(tǒng)進行分類模型的訓練,獲取待檢測圖像后,采用類似的方法 比對待檢測圖像的人臉特征關鍵點和標準人臉圖的人臉特征關鍵點,對待檢測圖像進行關 鍵點對齊和調整,再對調整后的待檢測圖像進行輪廓提取得到待檢測圖像的人臉輪廓圖, 最后將待檢測圖像的人臉輪廓圖采用所述的分類模型進行年齡分類得到待檢測圖像的年 齡類型;由此通過人工和機器配合的方式進行標注年齡類型,實現有監(jiān)督的學習,提高了卷 積神經網絡的學習精度,并且利用關鍵點對齊和輪廓提取來進行樣本圖像的處理,使得得 到的訓練數據都是比較統(tǒng)一的圖像,從而提高訓練模型的精度,使得年齡分類更加準確。
【專利附圖】
【附圖說明】
[0025] 此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本發(fā)明的一部分,本發(fā) 明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
[0026] 圖1為本發(fā)明一種人臉圖像的年齡分類方法的流程簡圖;
[0027] 圖2為本發(fā)明一種人臉圖像的年齡分類系統(tǒng)的結構示意圖。
【具體實施方式】
[002引為了使本發(fā)明所要解決的技術問題、技術方案及有益效果更加清楚、明白,W下結 合附圖及實施例對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用 W解釋本發(fā)明,并不用于限定本發(fā)明。
[0029] 如圖1所示,本發(fā)明的一種人臉圖像的年齡分類方法,其包括W下步驟:
[0030] 10.收集樣本圖像并進行人工標注各個樣本圖像的年齡類型,并預設標準人臉 圖;
[0031] 20.比對樣本圖像的人臉特征關鍵點和標準人臉圖的人臉特征關鍵點,對樣本圖 像進行關鍵點對齊和調整,再對調整后的樣本圖像進行輪廓提取得到樣本圖像的人臉輪廓 圖,并將該樣本圖像的人臉輪廓圖進行歸一化處理并輸入卷積神經網絡系統(tǒng)進行分類模型 的訓練;
[0032] 30.獲取待檢測圖像,比對待檢測圖像的人臉特征關鍵點和標準人臉圖的人臉特 征關鍵點,對待檢測圖像進行關鍵點對齊和調整,再對調整后的待檢測圖像進行輪廓提取 得到待檢測圖像的人臉輪廓圖,并將待檢測圖像的人臉輪廓圖采用所述的分類模型進行年 齡分類,得到待檢測圖像的年齡類型。
[0033] 作為優(yōu)選的實施例,在進行分類模型的訓練過程中,卷積神經網絡系統(tǒng)將分類錯 誤的樣本圖像收集起來并依次執(zhí)行步驟10及步驟20,直到超過預期結果時定為所述步驟 20所訓練出來的分類模型為最佳分類模型,并在所述的步驟30中采用該最佳分類模型對 待檢測圖像的人臉輪廓圖進行年齡分類,得到待檢測圖像的年齡類型。所述的步驟20中將 樣本圖像的人臉輪廓圖進行歸一化處理并輸入卷積神經網絡系統(tǒng)進行分類模型的訓練,主 要是將人工分類好的樣本圖像的人臉輪廓圖帶入卷積神經網絡系統(tǒng)進行學習;并且,將分 類錯誤的樣本圖像收集起來重新進行標注,即,對于系統(tǒng)自動分類的年齡類型與人工分類 的年齡類型不一致時,表示人工標注錯誤或者系統(tǒng)分類錯誤,需重新進行人工標注并調整 網絡結構,再將重新標注后的樣本圖像再次進行訓練學習,如此重復"訓練-〉調整網絡結 構-〉再訓練"的過程直到分類正確為止。
[0034] 本實施例中網格結構順序為輸入層-〉K個小組層-〉全連接層-〉SoftMax層,其中 K大于等于1 ;小組層包括卷積層、激活層、下采樣層、歸一化層;卷積層、激活層、下采樣層、 歸一化層中每個層的核大小W及輸出大小都是可W進行任意調節(jié)的,并且每個層都有一個 輸入且產生一個輸出,每一層的輸出作為下一層的輸入。
[0035] 其中,輸入層的輸入大小為化i曲t X Wei曲t X化annel,其中Wei曲t、化i曲t為 輸入層圖像的寬和高,化annel為輸入層圖像的顏色通道;由于本發(fā)明使用GPU硬件實現的 原因,Wei曲t = Hei曲t ;輸入圖像的channel只能為1或者3。
[0036] 卷積層;
[0037] 1)核的大小必須是奇數,且不大于該層輸入的寬或者高;
[003引 2)中間表示通過卷積層時不改變寬和高,通道數可變可不變;理論上可W為任意 正整數,由于本發(fā)明使用GPU硬件實現的原因,該里為16的倍數。
[00訓激活層:
[0040] 1)激活層不改變卷積層表示的寬、高或者通道數;
[0041] 2)激活層所使用的激活函數包括但不限于W下函數類型:
[0042] f(x) = l/a+e-x)
[0043] f (X) = a*tanh (b*x),a, b 為任意非零實數
[0044] f (X) = max (0, X)
[0045] f (X) = min (a, max (0, X))
[0046] f (x) = log (l+e〇
[0047] f(x) = |x
[0048] f(X)=又2
[00例 /(尤)二八
[0050] f (X) = ax+b
[0化1 ] 3)激活層跟在卷積層或者全連接之后。
[00巧下采樣層:
[0化3] 1)下采樣層不改變中間表示的通道數;
[0054]。下采樣層對圖像的縮小比即為核的大小;即核為m X n的下采樣層會造成中間 表示縮小為上一層的(l/m)x(l/n),理論上m和n可為任意自然數,由于本發(fā)明使用GPU硬 件實現的原因,m = n。例如,15x 15x 32通過3x 3的下采樣后,變成5x 5x 32;15x 15x 32通過5x 5的下采樣后,變成3x 3x 32;但是15x 15x 32不能進行2x 2的下采樣,因為 15不能被2整除;并不是說,輸入尺寸必須是2的次幕,即16、32、64等,輸入尺寸只要保證 能被所有下采樣層采樣即可。
[005引 歸一化層:
[0化6] 1)歸一化層不改變中間表示的任何尺寸;
[0057] 2)歸一化層不是必須的,可要可不要,添加歸一化層通常會提高精度并增加計算 量;是否添加歸一化層,要看添加后實際提升的精度和損失的速度。
[0化引一般的組合是:卷積-〉激活-〉下采樣-〉歸一化。
[0059] W下情況特殊:
[0060] 1)添加歸一化層對精度提升較小卻增大了很多運算量時,取消歸一化層,即采用 W下組合:卷積-〉激活-〉下采樣;
[0061] 2)歸一化層提前,效果基本相同,即采用W下組合:卷積-〉激活-〉歸一化-〉下 采樣。
[0062] 3)取消下采樣層:卷積-〉激活;或者卷積-〉激活-〉歸一化;下采樣本質是為了 增加魯椿性,同時順便有減少后續(xù)層的運算量的作用;一個網絡中通常會有幾層下采樣,但 并不是所有的"卷積-〉激活"后面都要跟下采樣。
[006引全連接層;
[0064] 1)通過全連接層后的中間表示會變成1維的,不再是3維的;
[0065] 2)全連接的輸出可W任意;
[0066] 3) -旦進過全連接,就無法進行卷積、下采樣或歸一化;
[0067] 4)全連接后面可W接激活層,或者繼續(xù)接全連接。
[0068] SoftMax 層;
[0069] 接在全連接層之后,作用是把全連接產生的實值變成[0, 1]之間的概率。
[0070] 本發(fā)明最后使用的網絡結構如表1所示。
[0071] 表1卷積神經網絡結構
[0072]
[0073]
【權利要求】
1. 一種人臉圖像的年齡分類方法,其特征在于,包括以下步驟:
10.收集樣本圖像并進行人工標注各個樣本圖像的年齡類型,并預設標準人臉圖;
20.比對樣本圖像的人臉特征關鍵點和標準人臉圖的人臉特征關鍵點,對樣本圖像進 行關鍵點對齊和調整,再對調整后的樣本圖像進行輪廓提取得到樣本圖像的人臉輪廓圖, 并將該樣本圖像的人臉輪廓圖進行歸一化處理并輸入卷積神經網絡系統(tǒng)進行分類模型的 訓練;
30.獲取待檢測圖像,比對待檢測圖像的人臉特征關鍵點和標準人臉圖的人臉特征關 鍵點,對待檢測圖像進行關鍵點對齊和調整,再對調整后的待檢測圖像進行輪廓提取得到 待檢測圖像的人臉輪廓圖,并將待檢測圖像的人臉輪廓圖采用所述的分類模型進行年齡分 類,得到待檢測圖像的年齡類型。
2. 根據權利要求1所述的一種人臉圖像的年齡分類方法,其特征在于:在進行分類模 型的訓練過程中,卷積神經網絡系統(tǒng)將分類錯誤的樣本圖像收集起來并依次執(zhí)行步驟10 及步驟20,直到超過預期結果時定為所述步驟20所訓練出來的分類模型為最佳分類模型, 并在所述的步驟30中采用該最佳分類模型對待檢測圖像的人臉輪廓圖進行年齡分類,得 到待檢測圖像的年齡類型。
3. 根據權利要求1所述的一種人臉圖像的年齡分類方法,其特征在于:所述的年齡類 型包括:嬰幼兒、兒童、少年、青年、中年、老年。
4. 根據權利要求1所述的一種人臉圖像的年齡分類方法,其特征在于:所述的步驟20 中比對樣本圖像的人臉特征關鍵點和標準人臉圖的人臉特征關鍵點,對樣本圖像進行關鍵 點對齊和調整,或者,所述的步驟30中比對待檢測圖像的人臉特征關鍵點和標準人臉圖的 人臉特征關鍵點,對待檢測圖像進行關鍵點對齊和調整,主要是通過預設標準人臉圖及其 對應的人臉特征關鍵點,并根據獲取的樣本圖像或待檢測圖像的人臉區(qū)域及其對應的人臉 特征關鍵點,利用仿射變換對樣本圖像或待檢測圖像的人臉特征關鍵點進行對齊和調整, 再對調整后的樣本圖像或待檢測圖像進行輪廓提取得到調整后的人臉輪廓圖,并將該調整 后的人臉輪廓圖作為所述樣本圖像或待檢測圖像的人臉輪廓圖。
5. 根據權利要求1或2或3或4所述的一種人臉圖像的年齡分類方法,其特征在于: 所述的人臉特征關鍵點主要包括眼睛輪廓、嘴部、眉毛、臉部輪廓線、額頭。
6. 根據權利要求1或2或3或4所述的一種人臉圖像的年齡分類方法,其特征在于: 所述的輪廓提取主要是對所述調整后的樣本圖像或待檢測圖像進行小波變換,得到低頻分 量的頻域圖像,即所述的人臉輪廓圖。
7. 根據權利要求1或2或3或4所述的一種人臉圖像的年齡分類方法,其特征在于: 所述的步驟30中將待檢測圖像的人臉輪廓圖采用所述的分類模型進行年齡分類得到待檢 測圖像的年齡類型,主要是將所述的待檢測圖像的人臉輪廓圖放入卷積神經網絡系統(tǒng)中進 行計算待檢測圖像每一種年齡類型的概率,并選擇概率最大的年齡類型作為待檢測圖像的 年齡類型。
8. -種人臉圖像的年齡分類系統(tǒng),其特征在于: 采樣單元,用于收集樣本圖像以供人工標注各個樣本圖像的年齡類型; 編輯單元,其通過比對所述的樣本圖像或獲取的待檢測圖像的人臉特征關鍵點和預 設的標準人臉圖的人臉特征關鍵點,對樣本圖像或待檢測圖像進行關鍵點對齊和調整,再 對調整后的樣本圖像或待檢測圖像進行輪廓提取得到樣本圖像或待檢測圖像的人臉輪廓 圖; 歸一化單元,將所述的樣本圖像或待檢測圖像的人臉輪廓圖進行歸一化處理; 學習單元,將歸一化處理后的樣本圖像或待檢測圖像的人臉輪廓圖輸入卷積神經網絡 系統(tǒng)進行分類模型的訓練; 判斷單元,將所述待檢測圖像的人臉輪廓圖采用所述的分類模型進行年齡分類,以判 斷所述待檢測圖像的年齡類型。
【文檔編號】G06K9/00GK104504376SQ201410803541
【公開日】2015年4月8日 申請日期:2014年12月22日 優(yōu)先權日:2014年12月22日
【發(fā)明者】張偉, 傅松林, 曾志勇, 李駢臻 申請人:廈門美圖之家科技有限公司