本發(fā)明屬于面向公共安全預(yù)警的視頻圖像處理領(lǐng)域,具體涉及一種人臉檢測(cè)方法。
背景技術(shù):
隨著視頻監(jiān)控系統(tǒng)的大規(guī)模應(yīng)用,在車站、機(jī)場(chǎng)、街道等重要場(chǎng)所安裝有大量監(jiān)控?cái)z像機(jī),可獲得充足的含有人員面部區(qū)域的視頻圖像,從而使得進(jìn)一步基于人臉特征進(jìn)行目標(biāo)搜索、人員管控成為可能,在公共安全管理等領(lǐng)域有重要應(yīng)用前景。人臉檢測(cè)是其中一個(gè)重要的處理環(huán)節(jié),相關(guān)算法的優(yōu)劣直接決定人臉識(shí)別、人臉?biāo)阉鞯忍幚淼男Ч退俣取?/p>
在人臉檢測(cè)領(lǐng)域,基于Haar-like(哈爾)或HOG(Histogram of Oriented Gradient,方向梯度直方圖)特征構(gòu)建人臉檢測(cè)分類器是一類比較便于實(shí)現(xiàn)的技術(shù)手段,但其檢測(cè)準(zhǔn)確性目前并不能滿足實(shí)際應(yīng)用的需求。專利201210042789.8結(jié)合基于Haar-like特征的人臉分類器和基于HOG特征的人體分類器檢測(cè)目標(biāo),利用頭肩區(qū)域檢測(cè)來降低人臉檢測(cè)的錯(cuò)誤率,該方法的缺陷是實(shí)際應(yīng)用中人體經(jīng)常存在遮擋,對(duì)此種情況不能準(zhǔn)確地檢測(cè)目標(biāo);專利201410553184.4采用多角度人臉分類器進(jìn)行人臉檢測(cè),理論上可以適應(yīng)人臉角度變化,但并未從實(shí)質(zhì)上改進(jìn)基于Haar-like特征的人臉檢測(cè)方法,反而可能在每個(gè)角度都引起錯(cuò)誤檢測(cè);專利201310377532.2基于HOG特征與SVM分類器進(jìn)行人臉檢測(cè),對(duì)表情具有較好適應(yīng)性,但基于灰度空間計(jì)算HOG特征的過程比較復(fù)雜,時(shí)間開銷較大,不利于實(shí)時(shí)處理。同時(shí)上述方法都是在灰度空間進(jìn)行處理,事實(shí)上實(shí)現(xiàn)與膚色無關(guān)的人臉檢測(cè)并不需要獲得人臉區(qū)域的具體灰度值,而是基于人臉區(qū)域五官結(jié)構(gòu)、人臉區(qū)域與背景的差異進(jìn)行檢測(cè),并且灰度圖像存在一定的數(shù)據(jù)冗余,既增加額外計(jì)算量,同時(shí)又可能對(duì)人臉目標(biāo)檢測(cè)造成不利影響。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明設(shè)計(jì)了一種基于HOG特征與DNN(Deep Neural Network,深度神經(jīng)網(wǎng)絡(luò))分類器的人臉檢測(cè)方法,該方法基于二值化人臉圖像提取HOG特征,結(jié)合DNN分類器進(jìn)行人臉檢測(cè)。在訓(xùn)練階段,該方法首先對(duì)人臉正負(fù)樣本進(jìn)行二值化,然后針對(duì)二值人臉圖像提取HOG特征,并基于該特征訓(xùn)練DNN分類器;在檢測(cè)階段,首先對(duì)待處理圖像進(jìn)行二值化,然后循環(huán)亞采樣,在不同尺度下滑動(dòng)提取塊HOG特征,基于訓(xùn)練好的DNN分類器進(jìn)行人臉檢測(cè)。該方法的優(yōu)勢(shì)在于去除了人臉局部區(qū)域灰度變化對(duì)檢測(cè)造成的影響,同時(shí)DNN分類器有利于從大量數(shù)據(jù)中提取抽象特征,提高分類器性能。
下面對(duì)本發(fā)明中的技術(shù)方案闡述如下:
1、基于二值化圖像提取HOG特征
Step1:原始圖像為I(x,y),二值化后為H(x,y),亮區(qū)為1,暗區(qū)為0。
Step2:對(duì)二值圖像,計(jì)算像素點(diǎn)(x,y)的水平和垂直梯度分別為
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
進(jìn)一步計(jì)算該點(diǎn)的梯度幅值和方向分別為:
Step3:將原圖按照常用的8×8像素劃分為若干細(xì)胞元Ck,k表示其序號(hào),計(jì)算每一個(gè)細(xì)胞元的加權(quán)梯度方向直方圖。
(1)按照多次實(shí)驗(yàn)得到的60度的合理間距,將0度到360度劃分為6等分,對(duì)每一個(gè)細(xì)胞元構(gòu)造對(duì)應(yīng)的直方圖累加器sk[i],i=0,1,2,3,4,5,并初始化為0;
(2)對(duì)Ck中的每一個(gè)像素點(diǎn),令i=α(x,y)%6,其中%為整除運(yùn)算,則對(duì)累加器進(jìn)行加權(quán)累加,計(jì)算該細(xì)胞元加權(quán)梯度方向直方圖為
sk[i]=sk[i]+G(x,y)
Step4:將相鄰10×10個(gè)細(xì)胞元(多次實(shí)驗(yàn)得到)組合成一個(gè)塊,則該塊的大小為80×80像素,在該塊內(nèi)按從左到右、從上到下的順序?qū)⒏骷?xì)胞元的加權(quán)梯度直方圖串聯(lián)起來,得到具有600個(gè)元素的一維向量,即為該塊的HOG特征。
2、基于訓(xùn)練好的DNN分類器進(jìn)行人臉檢測(cè)
在訓(xùn)練階段,對(duì)海量人臉圖像進(jìn)行訓(xùn)練,生成人臉分類器,用于人臉檢測(cè),可分為:
Step1:從各種視頻采集設(shè)備,以及互聯(lián)網(wǎng)等渠道,獲取海量具有人臉的圖像,且含有光照、角度、表情等各種常見外界變化因素;
Step2:人工裁剪人臉區(qū)域,并縮放至歸一化尺寸為80×80像素;
Step3:對(duì)尺寸歸一化圖像進(jìn)行二值化;
Step4:提取二值化圖像的HOG特征,作為正樣本;
Step5:采集同樣數(shù)量的不含人臉圖像,歸一化至相同尺寸,二值化,提取其HOG特征,作為負(fù)樣本;
Step6:將正負(fù)樣本圖像作為輸入,輸出為對(duì)應(yīng)的人臉或非人臉標(biāo)志,通過訓(xùn)練建立DNN網(wǎng)絡(luò);
Step7:將上述訓(xùn)練好的DNN網(wǎng)絡(luò)參數(shù)保存到文件,后續(xù)人臉檢測(cè)時(shí)使用。
在檢測(cè)階段,利用訓(xùn)練好的DNN網(wǎng)絡(luò),將待處理圖像按不同尺度計(jì)算其二值化后的HOG特征,循環(huán)亞采樣,在不同尺度下滑動(dòng)提取塊HOG特征向量,輸入到DNN網(wǎng)絡(luò),檢測(cè)是否有人臉。
Step1:載入保存的DNN網(wǎng)絡(luò)參數(shù),建立DNN人臉檢測(cè)網(wǎng)絡(luò);
Step2:將待處理圖像二值化,設(shè)其寬度為width,高度為height;
Step3:提取二值化圖像的細(xì)胞元加權(quán)梯度方向直方圖;
Step4:按從左到右,從上到下的順序,每次偏移2個(gè)像素(多次實(shí)驗(yàn)得到),從原圖中將10×10個(gè)細(xì)胞元組合成塊,提取該塊的HOG特征向量,作為輸入數(shù)據(jù)傳遞給分類器,如果分類器判斷為人臉,則輸出該塊的矩形區(qū)域頂點(diǎn)坐標(biāo),并將該塊內(nèi)所有原二值圖像素值設(shè)為1;
Step5:將原二值圖按步長(zhǎng)1.1向下亞采樣,重復(fù)step3~step5,直到width或height有一項(xiàng)小于等于最小人臉尺度80時(shí)停止。
本發(fā)明的優(yōu)點(diǎn)在于:
1、基于二值圖像計(jì)算HOG特征,減少數(shù)據(jù)冗余,降低局部無關(guān)灰度變化對(duì)檢測(cè)結(jié)果的影響;
2、人臉目標(biāo)的訓(xùn)練和檢測(cè)基于二值圖像的HOG特征進(jìn)行,可強(qiáng)化突出訓(xùn)練樣本和待檢測(cè)目標(biāo)的邊緣分布規(guī)律,獲得比單純灰度圖像更好的效果;
3、人臉目標(biāo)的訓(xùn)練和檢測(cè)基于DNN網(wǎng)絡(luò)進(jìn)行,相對(duì)于傳統(tǒng)的淺層網(wǎng)絡(luò),DNN更有利于提取抽象信息,實(shí)現(xiàn)更好的分類效果。
附圖說明
圖1是本發(fā)明實(shí)施例的整體示意圖;
圖2-圖4是二值化人臉區(qū)域示意圖;
圖5是像素點(diǎn)、細(xì)胞元、塊的結(jié)構(gòu)圖。
具體實(shí)施方式
下面結(jié)合圖示,對(duì)本發(fā)明的優(yōu)選實(shí)施例作詳細(xì)介紹。
本發(fā)明的人臉檢測(cè)工作流程如圖1所示,在訓(xùn)練階段,準(zhǔn)備人臉正負(fù)樣本并手動(dòng)裁剪、尺寸歸一化,在二值化之后提取其HOG特征用于訓(xùn)練DNN分類器;在檢測(cè)階段,對(duì)原始圖像進(jìn)行二值化,按一定步長(zhǎng)循環(huán)亞采樣和最小窗口提取HOG特征,輸入到DNN分類器進(jìn)行檢測(cè),輸出是否有人臉及人臉區(qū)域坐標(biāo)。該方法利用人臉區(qū)域的梯度差異信息,結(jié)合DNN網(wǎng)絡(luò)提取抽象特征的能力,能可靠地檢測(cè)視頻圖像中的人臉區(qū)域,并降低人臉區(qū)域具體灰度值對(duì)檢測(cè)的影響。
應(yīng)當(dāng)理解的是,對(duì)本領(lǐng)域普通技術(shù)人員來說,可以根據(jù)上述說明加以改進(jìn)或變換,比如更改應(yīng)用領(lǐng)域等,而所有這些改進(jìn)和變換都應(yīng)屬于本發(fā)明所附權(quán)利要求的保護(hù)范圍。
本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。