基于人種分類的多特征性別判斷方法
【專利摘要】基于人種分類的多特征性別判斷方法,它包括如下步驟:1)通過AdaBoost人臉檢測算法,得到人臉區(qū)域;2)通過雙眼位置剪裁人臉區(qū)域;3)構(gòu)建蒙古人、高加索人、尼格羅人的人臉人種分類器圖像訓(xùn)練集;4)對(duì)訓(xùn)練集圖像進(jìn)行特征提?。?)采用SVM方法訓(xùn)練人種分類器;6)將人臉與人眼的特征組合起來作為性別判斷特征;7)在提取特征向量后,在各個(gè)不同人種下,采用SVM訓(xùn)練各自的性別分類器;8)對(duì)一幅未知性別的人臉圖像,檢測人臉后通過預(yù)處理并提取特征后,首先判斷其所屬人種,在得到人種后,再用該人種對(duì)應(yīng)的分類器進(jìn)行性別的判斷;該方法解決不同人種性別存在的差異,極大提高人臉性別判斷準(zhǔn)確率。
【專利說明】基于人種分類的多特征性別判斷方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于人臉種族分類方法的性別判斷方法,特別是一種基于人臉部多種特征并采用機(jī)器學(xué)習(xí)技術(shù)的多人種的人臉性別的判斷方法,屬于圖像處理【技術(shù)領(lǐng)域】。
技術(shù)背景
[0002]隨著人員流動(dòng)增強(qiáng),安全監(jiān)控對(duì)城市的安全發(fā)展起著日益重要的作用,視頻監(jiān)控也被越來越多的應(yīng)用于公眾場合,以保障人們?nèi)粘I畹陌踩?。隨著應(yīng)用場合的增加,市場對(duì)智能視頻監(jiān)控的需求也越來越大。
[0003]人臉蘊(yùn)藏著豐富的生物信息,人類可通過人臉判別出該個(gè)體身份、性別、種族、年齡、表情等信息。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,人臉識(shí)別技術(shù)也逐漸得到推廣使用,隨著科技的發(fā)展與應(yīng)用,簡單的人臉身份的判別已不能滿足日趨多樣化日常應(yīng)用?,F(xiàn)實(shí)應(yīng)用,如智能安全監(jiān)控中還希望通過人臉判別更多的信息,如人臉性別,年齡,種族等信息,以記錄監(jiān)控人員更多信息,同時(shí)也實(shí)現(xiàn)不同類別的人員統(tǒng)計(jì)。同時(shí)判別出人臉屬性后,如性別,可以統(tǒng)計(jì)該屬性人員類別的不同習(xí)慣,用于提供更個(gè)性化的服務(wù)。
[0004]人臉分析已較廣泛的應(yīng)用與安全監(jiān)控領(lǐng)域,在一些公共場合,如車站,機(jī)場,地鐵,營業(yè)大廳內(nèi)等人員流動(dòng)較大的場所,都需要對(duì)出入人員進(jìn)行統(tǒng)計(jì),通過分析記錄人臉?biāo)N(yùn)含的信息,如性別,年齡,種族,能快速的搜索目標(biāo)人群,如根據(jù)人員某一特征,如所屬性別類別進(jìn)行目標(biāo)人物快速檢索,同時(shí)實(shí)現(xiàn)不同類別的人員統(tǒng)計(jì),采集更多的人員信息,用于后續(xù)分析,同時(shí)在鑒別出人臉?biāo)鶎傩詣e后,更利于人臉的年齡信息的判斷,同時(shí)為人臉識(shí)別提供更豐富的信息,提供人臉識(shí)別準(zhǔn)確率。
[0005]人臉性別判別,作為人臉分析的一個(gè)領(lǐng)域,又與人臉?biāo)鶎俜N族有著一定的聯(lián)系,不同種族人群的性別以不一樣的模式呈現(xiàn)。目前現(xiàn)有的人種大致可劃分為蒙古人(Mongolian)、高加索人(Caucasian)、尼格羅人(Negroid)三類,其中蒙古人種主要分布在中、東亞區(qū)域,高加索人種主要分布?xì)W洲,北美洲以及大洋洲,而尼格羅人主要分布在非洲、拉美、北美以及大洋洲、歐洲部分區(qū)域。隨著經(jīng)濟(jì)的全球一體化,交通的日益發(fā)達(dá),人員流動(dòng)日益增強(qiáng),各類種族分布并不是只局限于某一區(qū)域,幾乎在全球各個(gè)區(qū)域都有這三類種族人員的存在,同時(shí)在三類種族之間還存在不同種族混血的情況,對(duì)于混血的情況,其面部體現(xiàn)的特征仍會(huì)更傾向于某一種族,最終的判別標(biāo)準(zhǔn)以面部特征更傾向于的一方為準(zhǔn),而不同人種之間又性別差異又以不同的方式呈現(xiàn),如蒙古人種性別差異主要體現(xiàn)在眼睛區(qū)域,而高加索人種性別差異更明顯,而尼格羅人性別差異更需要五官各個(gè)細(xì)節(jié)的對(duì)比,所以如果單純的使用所有人種進(jìn)行性別判斷,某些人種性別判斷的準(zhǔn)確率將受影響。
【發(fā)明內(nèi)容】
[0006]為解決上述技術(shù)問題,解決不同人種性別存在的差異,提高人臉性別判斷準(zhǔn)確率,本發(fā)明的目的是提供一種基于人種分類的多特征性別判斷方法;該方法在進(jìn)行性別判斷前,先對(duì)人臉?biāo)鶎偃朔N做判斷,然后在所屬人種內(nèi)做性別的判斷。首先是提取全局的臉部特征,同時(shí)提取局部的人臉眼部特征,最后兩種特征融合作為性別判斷的特征向量。
[0007]為實(shí)現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:基于人種分類的多特征性別判斷方法,具體實(shí)施步驟如下:
[0008]步驟I)通過AdaBoost人臉檢測算法,檢測人臉圖像,得到人臉區(qū)域;
[0009]步驟2)對(duì)步驟I得到的人臉區(qū)域,采用眼睛定位法,通過雙眼位置剪裁人臉區(qū)域,使裁剪后的人臉區(qū)域恰好包含整個(gè)人臉圖像,并將人臉圖像歸一化處理;
[0010]步驟3)將提取出的人臉圖像按人種劃分為蒙古人、高加索人、尼格羅人三類,構(gòu)建人臉人種分類器圖像訓(xùn)練集;
[0011]步驟4)對(duì)訓(xùn)練集圖像進(jìn)行特征提取,對(duì)人臉圖像原始像素?cái)?shù)據(jù)進(jìn)行PCA變換后,采用LDA分析方法提取臉部特征;
[0012]步驟5)采用SVM方法訓(xùn)練人種分類器;
[0013]步驟6)針對(duì)各個(gè)不同人種訓(xùn)練集圖像下,又分別將圖像集劃分為男性,女性兩個(gè)類別,對(duì)每幅訓(xùn)練集圖像,采用LBP算子,提取人臉LBP直方圖特征,同時(shí)針對(duì)人眼部位,使用gabor濾波,然后再使用LBP統(tǒng)計(jì)其直方圖,最后獲得人眼的LBP gabor直方圖,最后將人臉與人眼的特征組合起來作為性別判斷特征;
[0014]步驟7)在提取特征向量后,在各個(gè)不同人種下,采用SVM訓(xùn)練各自的性別分類器;
[0015]步驟8)對(duì)一幅未知性別的人臉圖像,檢測人臉后,通過預(yù)處理,提取特征后,首先判斷其所屬人種,在得到人種后,再用該人種對(duì)應(yīng)的性別分類器進(jìn)行性別的判斷。
[0016]作為優(yōu)選,步驟2)所述的圖像尺寸歸一化處理的尺寸為32X32。
[0017]作為優(yōu)選,步驟2)所述的裁剪后的人臉區(qū)域?yàn)榉叫螀^(qū)域,裁剪后的臉部邊緣離眼睛的距離為0.25倍人臉寬度,眼睛離額頭的距離為0.25倍人臉寬度。
[0018]作為優(yōu)選,步驟6)所述歸一化處理后的圖像,以兩眼位置為中心,眼部上邊緣離人眼中心位置為7個(gè)像素,眼部下邊緣離人眼位置5像素,人眼部寬仍然采用圖像寬度,形成眼部區(qū)域?yàn)?2X12的矩形區(qū)域。
[0019]作為優(yōu)選,步驟6)所述的計(jì)算人臉LBP直方圖特征采用的方法為:由于正面人臉大致成對(duì)稱分布,故將人臉劃分為3X3的子塊,分別計(jì)算各子塊圖像的LBP直方圖,然后將這些直方圖組合為一行向量,作為特征向量。
[0020]本發(fā)明的有益效果是:本發(fā)明所述的方法在進(jìn)行性別判斷前,先對(duì)人臉?biāo)鶎偃朔N做判斷,然后在所屬人種內(nèi)做性別的判斷。首先是提取全局的臉部特征,同時(shí)提取局部的人臉眼部特征,最后兩種特征融合作為性別判斷的特征向量。解決了不同人種性別存在的差異,極大提高人臉性別判斷準(zhǔn)確率。
【專利附圖】
【附圖說明】
[0021]圖1為本發(fā)明的基于人種分類的性別判斷流程圖。
[0022]圖2為本發(fā)明的為人臉剪裁比例示意圖。
[0023]圖3為本發(fā)明的分類器訓(xùn)練示意圖。
[0024]圖4為本發(fā)明的LBP算子示意圖。
[0025]圖5為本發(fā)明的人臉子塊劃分示意圖?!揪唧w實(shí)施方式】
[0026]下面結(jié)合具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明:
[0027]如圖1和圖3所示,基于人種分類的多特征性別判斷方法,該方法首先對(duì)未知人臉圖像進(jìn)行預(yù)處理,然后進(jìn)行特征提取,再分別經(jīng)過蒙古人、高加索人和尼格羅人的人臉種族分類器后,在這三種人臉種族分類器后分別經(jīng)過性別分類器,得到結(jié)果后輸出。具體步驟如下:
[0028]步驟I使用人臉檢測算法獲得臉部區(qū)域。
[0029]步驟2對(duì)步驟I獲得的人臉圖像做預(yù)處理,轉(zhuǎn)換為灰度圖像,并利用直方圖均衡化做光照的歸一化處理。同時(shí)并檢測雙眼位置,判斷人臉是否有傾斜,若有傾斜則通過雙眼位置旋轉(zhuǎn)人臉,得到正面人臉圖像。同時(shí)因?yàn)槿四樔朔N以及性別的差異主要集中在五官區(qū)域,為了消除發(fā)型,背景等對(duì)分類的影響,可通過雙眼位置,對(duì)人臉按照一定比例進(jìn)行剪裁,并將人臉尺寸歸一化到32x32的尺寸。
[0030]步驟3將提取出的人臉按照人種分為蒙古人、高加索人、尼格羅人三類,構(gòu)建人臉人種訓(xùn)練集。
[0031]本發(fā)明訓(xùn)練集圖像包含了大量公開人臉圖像數(shù)據(jù)庫和互聯(lián)網(wǎng)采集的多人種男女性圖像,包括FERET、MIT、FDDB、KFDB等數(shù)據(jù)庫,高加索人、尼格羅人和蒙古人都有足夠的代表樣本,每類人種樣本超過12000張圖像。同時(shí)為了加強(qiáng)對(duì)混血人臉情況的處理,還搜集了混血的網(wǎng)絡(luò)圖像,在每一類種族樣本中都添加一定比例的混血圖像,使混血圖像占該類總樣本的1/4,并且選定的混血人臉面部體現(xiàn)的特征更傾向于其歸屬的人種類別。這樣通過SVM訓(xùn)練出來的分類器具有 較強(qiáng)的泛化能力。
[0032]步驟4對(duì)所有訓(xùn)練集圖像X提取人臉特征,對(duì)圖像原始像素?cái)?shù)據(jù)進(jìn)行PCA變換,PCA分析實(shí)施過程具體如下:
[0033]計(jì)算協(xié)方差矩陣:
[0034]5 =-w)(jf; ~?)Τ
[0035]其中:
I ?
[0036]U =一V X1
[0037]對(duì)協(xié)方差矩陣進(jìn)行特征值分解:
[0038]S= Φ Λ Φτ
[0039]選取前k個(gè)最大特征值對(duì)應(yīng)的特征向量,組成新的投影矩陣:
[0040]Wpca = ( Φ 1; Φ 2,...,Φ k},
[0041]經(jīng)過PCA變換后的低維數(shù)據(jù)為:
[0042]P = (X-U) Wpca
[0043]其中Wpc;a為PCA分析得到的投影矩陣。對(duì)于分類問題,LDA分析方法能提取更具判別的信息。LDA分析是尋求一個(gè)投影使原始數(shù)據(jù)投影到低維的空間中能線性可分假設(shè)將蒙古人、高加索人、尼格羅人三類類別分別以標(biāo)簽#1,#2, #3三個(gè)類別來表示。
[0044]LDA具體實(shí)施過程如下:
[0045]計(jì)算各類內(nèi)方差:
[0046]
【權(quán)利要求】
1.基于人種分類的多特征性別判斷方法,其特征在于它包括如下步驟: 步驟I)通過AdaBoost人臉檢測算法,檢測人臉圖像,得到人臉區(qū)域; 步驟2)對(duì)步驟I得到的人臉區(qū)域,采用眼睛定位法,通過雙眼位置剪裁人臉區(qū)域,使裁剪后的人臉區(qū)域恰好包含整個(gè)人臉圖像,并將人臉圖像歸一化處理; 步驟3)將提取出的人臉圖像按人種劃分為蒙古人、高加索人、尼格羅人三類,構(gòu)建人臉人種分類器圖像訓(xùn)練集; 步驟4)對(duì)訓(xùn)練集圖像進(jìn)行特征提取,對(duì)人臉圖像原始像素?cái)?shù)據(jù)進(jìn)行PCA變換后,采用LDA分析方法提取臉部特征; 步驟5)采用SVM方法訓(xùn)練人種分類器; 步驟6)針對(duì)各個(gè)不同人種訓(xùn)練集圖像下,又分別將圖像集劃分為男性,女性兩個(gè)類另O,對(duì)每幅訓(xùn)練集圖像,采用LBP算子,提取人臉LBP直方圖特征,同時(shí)針對(duì)人眼部位,使用gabor濾波,然后再使用LBP統(tǒng)計(jì)其直方圖,最后獲得人眼的LBP gabor直方圖,最后將人臉與人眼的特征組合起來作為性別判斷特征; 步驟7)在提取特征向量后,在各個(gè)不同人種下,采用SVM訓(xùn)練各自的性別分類器;步驟8)對(duì)一幅未知性別的人臉圖像,檢測人臉后,通過預(yù)處理,提取特征后,首先判斷其所屬人種,在得到人種后,再用該人種對(duì)應(yīng)的性別分類器進(jìn)行性別的判斷; 步驟9最后輸出判別結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于人種分類的多特征性別判斷方法,其特征在于步驟2)所述的圖像尺寸歸一化處理的尺寸為32X32。
3.根據(jù)權(quán)利要求1所述的基于人種分類的多特征性別判斷方法,其特征在于步驟2)所述的裁剪后的人臉區(qū)域?yàn)榉叫螀^(qū)域,裁剪后的臉部邊緣離眼睛的距離為0.25倍人臉寬度,眼睛離額頭的距離為0.25倍人臉寬度。
4.根據(jù)權(quán)利要求1所述的基于人種分類的多特征性別判斷方法,其特征在于步驟6)所述歸一化處理后的圖像,以兩眼位置為中心,眼部上邊緣離人眼中心位置為7個(gè)像素,人臉下邊緣離人眼位置5像素,人眼部寬仍然采用圖像寬度,形成眼部區(qū)域?yàn)?2X12的矩形區(qū)域。
5.根據(jù)權(quán)利要求1所述的基于人種分類的多特征性別判斷方法,其特征在于步驟6)所述的計(jì)算人臉LBP直方圖特征采用的方法為:由于正面人臉大致成對(duì)稱分布,故將人臉劃分為3X3的子塊,分別計(jì)算各子塊圖像的LBP直方圖,然后將這些直方圖組合為一行向量,作為特征向量。
【文檔編號(hào)】G06K9/62GK104036291SQ201410259178
【公開日】2014年9月10日 申請(qǐng)日期:2014年6月11日 優(yōu)先權(quán)日:2014年6月11日
【發(fā)明者】陳昌寶, 王軍, 陳浪 申請(qǐng)人:杭州巨峰科技有限公司