本發(fā)明涉及通信技術(shù)領(lǐng)域,具體涉及一種人臉檢測(cè)的訓(xùn)練方法、檢測(cè)方法和裝置。
背景技術(shù):
人臉檢測(cè)是一項(xiàng)涉及計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)的技術(shù),主要目的是在圖像和視頻中檢測(cè)出人臉的目標(biāo)實(shí)例,可應(yīng)用于人臉識(shí)別,人機(jī)交互等技術(shù)領(lǐng)域。
目前,人臉檢測(cè)的方法有很多,按照模型來區(qū)分,主流的方案有以下幾種:
1)支持向量機(jī)(Support Vector Machine,SVM),主要和梯度方向直方圖(Histogram of Oriented Gradient,HOG)特征一起應(yīng)用于行人檢測(cè)領(lǐng)域。該方案計(jì)算稠密的梯度方向特征,使用簡(jiǎn)單的線性SVM對(duì)高維的HOG描述子進(jìn)行分類就能取得很好的檢測(cè)效果。
2)基于部件的變形模型(Deformable Part-based Model,DPM),主要和HOG特征一起應(yīng)用于泛化目標(biāo)(Generalized Object)的檢測(cè)與識(shí)別,尤其適合對(duì)非剛性目標(biāo)的檢測(cè)和識(shí)別。該方法的核心要素,是將部件相對(duì)位置和整體位置視為隱變量,使用隱形SVM(Latent-SVM)完成半監(jiān)督學(xué)習(xí)。該方法也可以實(shí)現(xiàn)級(jí)聯(lián)檢測(cè),在不影響檢測(cè)質(zhì)量的前提下,可以實(shí)現(xiàn)一個(gè)數(shù)量級(jí)的速度提升。
3)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是近年大熱的方法,適用于泛化目標(biāo)的檢測(cè)與識(shí)別。通過對(duì)輸入圖像進(jìn)行多層的卷積、池化操作,再通過Softmax分類器進(jìn)行分類,即可完成檢測(cè)過程。
4)自提升級(jí)聯(lián)模型(AdaBoost Cascaded Model),主要和哈爾(Haar)特征一起應(yīng)用于人臉檢測(cè)(Face Detection)領(lǐng)域。該方案使用簡(jiǎn)單的哈爾特征學(xué)習(xí)許多簡(jiǎn)單的弱分類器(Weak Classifier),在實(shí)際檢測(cè)時(shí)采用級(jí)聯(lián)結(jié)構(gòu),每一層濾掉大部分非人臉候選,同時(shí)讓大部分人臉候選通過,從而加速檢測(cè)。
然而,上述人臉檢測(cè)方案均難以兼顧檢測(cè)速度及檢測(cè)效果。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例能夠解決在保證檢測(cè)效果的情況下,如何降低人臉檢測(cè)的復(fù)雜度及計(jì)算量,提高檢測(cè)效率。
為解決上述問題,本發(fā)明實(shí)施例提供了一種人臉檢測(cè)器的訓(xùn)練方法,所述人臉檢測(cè)器包括第一分類器及第二分類器,所述方法包括:
采集人臉和非人臉圖像作為訓(xùn)練樣本集;
提取所述訓(xùn)練樣本集中各個(gè)訓(xùn)練樣本的亮度比較特征;
根據(jù)所述亮度比較特征獲得對(duì)應(yīng)的蕨特征;
利用所述蕨特征及貝葉斯定理進(jìn)行訓(xùn)練,得到所述第一分類器;
利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則進(jìn)行P輪訓(xùn)練,得到P個(gè)決策樹分類器,P≥1,且P為整數(shù);
將所述P個(gè)決策樹分類器級(jí)聯(lián)形成所述第二分類器。
可選地,所述第一分類器分類方法如下:
其中,F(xiàn)j是所述訓(xùn)練樣本集中第k個(gè)訓(xùn)練樣本的第j個(gè)蕨特征;Cq是第q個(gè)類別,P(Fm|C=Cq)是第k個(gè)訓(xùn)練樣本的類別為Cq時(shí),第j個(gè)蕨特征的似然度,J為第k個(gè)訓(xùn)練樣本的蕨特征的總數(shù);為第一分類器對(duì)第k個(gè)訓(xùn)練樣本的分類結(jié)果;所述第k個(gè)訓(xùn)練樣本為所述訓(xùn)練樣本集中任一訓(xùn)練樣本。
可選地,所述決策樹為回歸樹。
可選地,所述利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則進(jìn)行P輪訓(xùn)練,得到P個(gè)決策樹分類器,包括:
對(duì)已獲得的p-1個(gè)決策樹分類器誤分類的訓(xùn)練樣本的權(quán)重進(jìn)行更新,1≤p≤P,并根據(jù)更新后的訓(xùn)練樣本的權(quán)重,進(jìn)行第p輪的訓(xùn)練,獲得第p個(gè)決策樹分類器,其中,采用如下步驟獲得第p個(gè)決策樹分類器:
從待劃分的訓(xùn)練樣本的亮度比較特征集合中選取部分亮度比較特征;
根據(jù)所選取的所述部分亮度比較特征對(duì)所述待劃分的訓(xùn)練樣本進(jìn)行分類;
根據(jù)更新后的所述訓(xùn)練樣本集中各訓(xùn)練樣本的權(quán)重,采用最小化加權(quán)均方差準(zhǔn)則訓(xùn)練所述第p個(gè)決策樹的劃分節(jié)點(diǎn),直至達(dá)到所述第p個(gè)決策樹的最大深度。
可選地,采用如下公式對(duì)第k個(gè)訓(xùn)練樣本的權(quán)重進(jìn)行更新:
wk’=wk·exp(-lkTp(Sk));
其中,Tp(Sk)是第p個(gè)決策樹分類器在所述第k個(gè)訓(xùn)練樣本的數(shù)據(jù)為Sk時(shí),對(duì)所述第k個(gè)訓(xùn)練樣本的輸出值;wk、lk分別是所述第k個(gè)訓(xùn)練樣本的權(quán)重、真實(shí)值;wk’為對(duì)所述第k個(gè)訓(xùn)練樣本的權(quán)重wk更新后的權(quán)重。
可選地,所述第二分類器的分類方法如下:
其中,Tp(S)是第p個(gè)決策樹分類器在訓(xùn)練樣本的數(shù)據(jù)為S時(shí),對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的輸出值;αp是第p個(gè)決策樹分類器的權(quán)重,H(S)為所述第二分類器對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的分類結(jié)果。
可選地,所述根據(jù)所述亮度比較特征獲得對(duì)應(yīng)的蕨特征,包括:
根據(jù)條件互信息準(zhǔn)則,從每個(gè)訓(xùn)練樣本的亮度比較特征中選取部分亮度比較特征,并將所選取的部分亮度比較特征作為第j個(gè)蕨特征,其中,j為正整數(shù)。
本發(fā)明實(shí)施例還提供了一種人臉檢測(cè)方法,所述方法包括:
遍歷待檢測(cè)圖像,獲得待檢測(cè)子圖像集,所述待檢測(cè)子圖像集中每一待檢測(cè)子圖像對(duì)應(yīng)一窗口;
將各所述待檢測(cè)子圖像依次帶入人臉檢測(cè)器的第一分類器及第二分類器中進(jìn)行人臉檢測(cè),將通過所述第一分類器及第二分類器的待檢測(cè)子圖像判定為所述待檢測(cè)圖像的人臉檢測(cè)結(jié)果;其中,通過采集人臉和非人臉圖像作為訓(xùn)練樣本集,提取所述訓(xùn)練樣本集中各個(gè)訓(xùn)練樣本的亮度比較特征,并根據(jù) 所述亮度比較特征獲得對(duì)應(yīng)的蕨特征,利用所述蕨特征及貝葉斯定理進(jìn)行訓(xùn)練得到所述第一分類器,并利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則進(jìn)行P輪訓(xùn)練,得到P個(gè)決策樹分類器,P≥1,且P為整數(shù),將所述P個(gè)決策樹分類器級(jí)聯(lián)形成所述第二分類器;
所述將所述判定為待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類,得到所述待檢測(cè)圖像的人臉圖像;
輸出所述待檢測(cè)圖像中所述人臉圖像的位置。
可選地,所述第一分類器分類方法如下:
其中,F(xiàn)j是所述訓(xùn)練樣本集中第k個(gè)訓(xùn)練樣本的第j個(gè)蕨特征;Cq是第q個(gè)類別,P(Fm|C=Cq)是第k個(gè)訓(xùn)練樣本的類別為Cq時(shí),第j個(gè)蕨特征的似然度,J為第k個(gè)訓(xùn)練樣本的蕨特征的總數(shù);為第一分類器對(duì)第k個(gè)訓(xùn)練樣本的分類結(jié)果;所述第k個(gè)訓(xùn)練樣本為所述訓(xùn)練樣本集中任一訓(xùn)練樣本。
可選地,所述決策樹為回歸樹。
可選地,所述利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則進(jìn)行P輪訓(xùn)練,得到P個(gè)決策樹分類器,包括:
對(duì)已獲得的p-1個(gè)決策樹分類器誤分類的訓(xùn)練樣本的權(quán)重進(jìn)行更新,1≤p≤P,并根據(jù)更新后的訓(xùn)練樣本的權(quán)重,進(jìn)行第p輪的訓(xùn)練,獲得第p個(gè)決策樹分類器,其中,采用如下步驟獲得第p個(gè)決策樹分類器:
從待劃分的訓(xùn)練樣本的亮度比較特征集合中選取部分亮度比較特征;
根據(jù)所選取的所述部分亮度比較特征對(duì)所述待劃分的訓(xùn)練樣本進(jìn)行分類;
根據(jù)更新后的所述訓(xùn)練樣本集中各訓(xùn)練樣本的權(quán)重,采用最小化加權(quán)均方差準(zhǔn)則訓(xùn)練所述第p個(gè)決策樹的劃分節(jié)點(diǎn),直至達(dá)到所述第p個(gè)決策樹的最大深度。
可選地,采用如下公式對(duì)第k個(gè)訓(xùn)練樣本的權(quán)重進(jìn)行更新:
wk’=wk·exp(-lkTp(Sk));
其中,Tp(Sk)是第p個(gè)決策樹分類器在所述第k個(gè)訓(xùn)練樣本的數(shù)據(jù)為Sk時(shí),對(duì)所述第k個(gè)訓(xùn)練樣本的輸出值;wk、lk分別是所述第k個(gè)訓(xùn)練樣本的權(quán)重、真實(shí)值;wk’為對(duì)所述第k個(gè)訓(xùn)練樣本的權(quán)重wk更新后的權(quán)重。
可選地,所述第二分類器的分類方法如下:
其中,Tp(S)是第p個(gè)決策樹分類器在訓(xùn)練樣本的數(shù)據(jù)為S時(shí),對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的分類結(jié)果;αp是第p個(gè)決策樹分類器的權(quán)重,H(S)為所述第二分類器對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的分類結(jié)果。
可選地,所述根據(jù)所述亮度比較特征獲得對(duì)應(yīng)的蕨特征,包括:
根據(jù)條件互信息準(zhǔn)則,從每個(gè)訓(xùn)練樣本的亮度比較特征中選取部分亮度比較特征,并將所選取的部分亮度比較特征作為第j個(gè)蕨特征,其中,j為正整數(shù)。
可選地,還包括:
對(duì)原始圖像進(jìn)行降采樣處理后獲得多個(gè)不同尺度的圖像,將所述多個(gè)不同尺度的圖像分別作為所述待檢測(cè)圖像;
分別將各待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行升采樣處理后再進(jìn)行聚類。
可選地,在所述將所述判定為待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類后,還包括:
分別對(duì)與所述待檢測(cè)圖像相鄰的預(yù)設(shè)幀數(shù)的圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類;
對(duì)每一幀圖像聚類后的結(jié)果進(jìn)行加權(quán)處理,并將加權(quán)處理后的結(jié)果作為所述待檢測(cè)圖像中的人臉圖像。
可選地,所述將所述判定為待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類,得到所述待檢測(cè)圖像的人臉圖像,包括:
在通過所述第一分類器及第二分類器的待檢測(cè)子圖像中,搜索所有相連接的待檢測(cè)子圖像,將相連接的待檢測(cè)子圖像作為一個(gè)聚類;
對(duì)每個(gè)聚類中的所有待檢測(cè)子圖像進(jìn)行平均操作,生成新的待檢測(cè)子圖像;
在所有所述新的待檢測(cè)子圖像中,剔除嵌入待檢測(cè)子圖像,將剩余的所述新的待檢測(cè)子圖像進(jìn)行合并,得到所述待檢測(cè)圖像的人臉圖像。
本發(fā)明實(shí)施例還提供了一種人臉檢測(cè)器的訓(xùn)練裝置,所述人臉檢測(cè)器包括第一分類器及第二分類器,所述裝置包括:
采集單元,適于采集人臉和非人臉圖像作為訓(xùn)練樣本集;
第一特征提取單元,適于提取所述訓(xùn)練樣本集中各個(gè)訓(xùn)練樣本的亮度比較特征;
第二特征提取單元,適于根據(jù)所述亮度比較特征獲得對(duì)應(yīng)的蕨特征;
第一訓(xùn)練單元,適于利用所述蕨特征及貝葉斯定理進(jìn)行訓(xùn)練,得到所述第一分類器;
第二訓(xùn)練單元,適于利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則進(jìn)行P輪訓(xùn)練,得到P個(gè)決策樹分類器,P≥1,且P為整數(shù);
級(jí)聯(lián)單元,適于將所述P個(gè)決策樹分類器級(jí)聯(lián)形成所述第二分類器。
可選地,所述第一訓(xùn)練單元訓(xùn)練得到所述第一分類器分類方法如下:
其中,F(xiàn)j是所述訓(xùn)練樣本集中第k個(gè)訓(xùn)練樣本的第j個(gè)蕨特征;Cq是第q個(gè)類別,P(Fm|C=Cq)是第k個(gè)訓(xùn)練樣本的類別為Cq時(shí),第j個(gè)蕨特征的似然度,J為第k個(gè)訓(xùn)練樣本的蕨特征的總數(shù);為第一分類器對(duì)第k個(gè)訓(xùn)練樣本的分類結(jié)果;所述第k個(gè)訓(xùn)練樣本為所述訓(xùn)練樣本集中任一訓(xùn)練樣本。
可選地,所述決策樹為回歸樹。
可選地,所述第二訓(xùn)練單元包括:更新子單元及訓(xùn)練子單元;其中:
所述更新子單元,適于對(duì)已獲得的p-1個(gè)決策樹分類器誤分類的訓(xùn)練樣本的權(quán)重進(jìn)行更新,1≤p≤P;
所述訓(xùn)練子單元,適于根據(jù)更新后的訓(xùn)練樣本的權(quán)重,進(jìn)行第p輪的訓(xùn)練,獲得第p個(gè)決策樹分類器,包括:提取模塊,分類模塊及訓(xùn)練模塊;
所述提取模塊,適于從待劃分的訓(xùn)練樣本的亮度比較特征集合中選取部分亮度比較特征;
所述分類模塊,適于根據(jù)所選取的所述部分亮度比較特征對(duì)所述待劃分的訓(xùn)練樣本進(jìn)行分類;
所述訓(xùn)練模塊,適于根據(jù)更新后的所述訓(xùn)練樣本集中各訓(xùn)練樣本的權(quán)重,采用最小化加權(quán)均方差準(zhǔn)則訓(xùn)練所述第p個(gè)決策樹的劃分節(jié)點(diǎn),直至達(dá)到所述第p個(gè)決策樹的最大深度。
可選地,所述更新子單元適于采用如下公式對(duì)第k個(gè)訓(xùn)練樣本的權(quán)重進(jìn)行更新:
wk’=wk·exp(-lkTp(Sk));
其中,Tp(Sk)是第p個(gè)決策樹分類器在所述第k個(gè)訓(xùn)練樣本的數(shù)據(jù)為Sk時(shí),對(duì)所述第k個(gè)訓(xùn)練樣本的輸出值;wk、lk分別是所述第k個(gè)訓(xùn)練樣本的權(quán)重、真實(shí)值;wk’為對(duì)所述第k個(gè)訓(xùn)練樣本的權(quán)重wk更新后的權(quán)重。
可選地,所述級(jí)聯(lián)單元得到所述第二分類器的方法如下:
其中,Tp(S)是第p個(gè)決策樹分類器在訓(xùn)練樣本的數(shù)據(jù)為S時(shí),對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的輸出值;αp是第p個(gè)決策樹分類器的權(quán)重,H(S)為所述第二分類器對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的分類結(jié)果。
可選地,所述第二特征提取單元適于根據(jù)條件互信息準(zhǔn)則,從每個(gè)訓(xùn)練樣本的亮度比較特征中選取部分亮度比較特征,并將所選取的部分亮度比較特征作為第j個(gè)蕨特征,其中,j為正整數(shù)。
本發(fā)明實(shí)施例還提供了一種人臉檢測(cè)裝置,所述裝置包括:
遍歷單元,適于遍歷待檢測(cè)圖像,獲得待檢測(cè)子圖像集,所述待檢測(cè)子圖像集中每一待檢測(cè)子圖像對(duì)應(yīng)一窗口;
檢測(cè)單元,適于將各所述待檢測(cè)子圖像依次帶入人臉檢測(cè)器的第一分類器及第二分類器中進(jìn)行人臉檢測(cè),將通過所述第一分類器及第二分類器的待檢測(cè)子圖像判定為所述待檢測(cè)圖像的人臉檢測(cè)結(jié)果;其中,所述第一分類器及第二分類器通過人臉檢測(cè)器的訓(xùn)練裝置得到,所述人臉檢測(cè)器的訓(xùn)練裝置包括:采集單元,適于采集人臉和非人臉圖像作為訓(xùn)練樣本集;第一特征提取單元,適于提取所述訓(xùn)練樣本集中各個(gè)訓(xùn)練樣本的亮度比較特征;第二特征提取單元,適于根據(jù)所述亮度比較特征獲得對(duì)應(yīng)的蕨特征;第一訓(xùn)練單元,適于利用所述蕨特征及貝葉斯定理進(jìn)行訓(xùn)練,得到所述第一分類器;第二訓(xùn)練單元,適于利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則進(jìn)行P輪訓(xùn)練,得到P個(gè)決策樹分類器,P≥1,且P為整數(shù);級(jí)聯(lián)單元,適于將所述P個(gè)決策樹分類器級(jí)聯(lián)形成所述第二分類器;
第一聚類處理單元,適于將所述判定為待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類,得到所述待檢測(cè)圖像的人臉圖像;
輸出單元,適于輸出所述待檢測(cè)圖像中所述人臉圖像的位置。
可選地,所述第一訓(xùn)練單元訓(xùn)練得到所述第一分類器分類方法如下:
其中,F(xiàn)j是所述訓(xùn)練樣本集中第k個(gè)訓(xùn)練樣本的第j個(gè)蕨特征;Cq是第q個(gè)類別,P(Fm|C=Cq)是第k個(gè)訓(xùn)練樣本的類別為Cq時(shí),第j個(gè)蕨特征的似然度,J為第k個(gè)訓(xùn)練樣本的蕨特征的總數(shù);為第一分類器對(duì)第k個(gè)訓(xùn)練樣本的分類結(jié)果;所述第k個(gè)訓(xùn)練樣本為所述訓(xùn)練樣本集中任一訓(xùn)練樣本。
可選地,所述決策樹為回歸樹。
可選地,所述第二訓(xùn)練單元包括:更新子單元及訓(xùn)練子單元;其中:
所述更新子單元,適于對(duì)已獲得的p-1個(gè)決策樹分類器誤分類的訓(xùn)練樣本的權(quán)重進(jìn)行更新,1≤p≤P;
所述訓(xùn)練子單元,適于根據(jù)更新后的訓(xùn)練樣本的權(quán)重,進(jìn)行第p輪的訓(xùn) 練,獲得第p個(gè)決策樹分類器,包括:提取模塊,分類模塊及訓(xùn)練模塊;
所述提取模塊,適于從待劃分的訓(xùn)練樣本的亮度比較特征集合中選取部分亮度比較特征;
所述分類模塊,適于根據(jù)所選取的所述部分亮度比較特征對(duì)所述待劃分的訓(xùn)練樣本進(jìn)行分類;
所述訓(xùn)練模塊,適于根據(jù)更新后的所述訓(xùn)練樣本集中各訓(xùn)練樣本的權(quán)重,采用最小化加權(quán)均方差準(zhǔn)則訓(xùn)練所述第p個(gè)決策樹的劃分節(jié)點(diǎn),直至達(dá)到所述第p個(gè)決策樹的最大深度。
可選地,所述更新子單元適于采用如下公式對(duì)第k個(gè)訓(xùn)練樣本的權(quán)重進(jìn)行更新:
wk’=wk·exp(-lkTp(Sk));
其中,Tp(Sk)是第p個(gè)決策樹分類器在所述第k個(gè)訓(xùn)練樣本的數(shù)據(jù)為Sk時(shí),對(duì)所述第k個(gè)訓(xùn)練樣本的輸出值;wk、lk分別是所述第k個(gè)訓(xùn)練樣本的權(quán)重、真實(shí)值;wk’為對(duì)所述第k個(gè)訓(xùn)練樣本的權(quán)重wk更新后的權(quán)重。
可選地,所述級(jí)聯(lián)單元得到所述第二分類器的方法如下:
其中,Tp(S)是第p個(gè)決策樹分類器在訓(xùn)練樣本的數(shù)據(jù)為S時(shí),對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的輸出值;αp是第p個(gè)決策樹分類器的權(quán)重,H(S)為所述第二分類器對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的分類結(jié)果。
可選地,所述第二特征提取單元適于根據(jù)條件互信息準(zhǔn)則,從每個(gè)訓(xùn)練樣本的亮度比較特征中選取部分亮度比較特征,并將所選取的部分亮度比較特征作為第j個(gè)蕨特征,其中,j為正整數(shù)。
可選地,所述裝置還包括:
降采樣處理單元,適于對(duì)原始圖像進(jìn)行降采樣處理后獲得多個(gè)不同尺度的圖像,將所述多個(gè)不同尺度的圖像分別作為所述待檢測(cè)圖像;
升采樣處理單元,適于分別將各待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行升采樣 處理后再進(jìn)行聚類。
可選地,所述裝置還包括:
第二聚類處理單元,適于在將所述判定為待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類后,分別對(duì)與所述待檢測(cè)圖像相鄰的預(yù)設(shè)幀數(shù)的圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類;
加權(quán)處理單元,適于對(duì)每一幀圖像聚類后的結(jié)果進(jìn)行加權(quán)處理,并將加權(quán)處理后的結(jié)果作為所述待檢測(cè)圖像中的人臉圖像。
可選地,所述第一聚類處理單元包括:
搜索子單元,適于在通過所述第一分類器及第二分類器的待檢測(cè)子圖像中,搜索所有相連接的待檢測(cè)子圖像,將相連接的待檢測(cè)子圖像作為一個(gè)聚類;
生成子單元,適于對(duì)每個(gè)聚類中的所有待檢測(cè)子圖像進(jìn)行平均操作,生成新的待檢測(cè)子圖像;
處理子單元,適于在所有所述新的待檢測(cè)子圖像中,剔除嵌入待檢測(cè)子圖像,將剩余的所述新的待檢測(cè)子圖像進(jìn)行合并,得到所述待檢測(cè)圖像的人臉圖像。
與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)方案至少具有以下優(yōu)點(diǎn):
通過提取訓(xùn)練樣本的亮度比較特征,進(jìn)而可以根據(jù)所述亮度比較特征獲得對(duì)應(yīng)的蕨特征,并利用所述蕨特征及貝葉斯定理得到第一分類器,利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則得到P個(gè)決策樹分類器,最后將所述P個(gè)決策樹分類器級(jí)聯(lián)形成所述第二分類器。相對(duì)于HOG特征,所述亮度比較特征的復(fù)雜度較低,因此通過提取所述亮度比較特征來獲得的人臉檢測(cè)器可以提高檢測(cè)速度。相對(duì)于哈爾特征,所述亮度比較特征是隨機(jī)提取的特征,因此通過提取所述亮度比較特征來獲得的人臉檢測(cè)器對(duì)非受限的人臉圖像可以獲得較好的檢測(cè)效果。另外,采用利用所述蕨特征及貝葉斯定理得到的第一分類器進(jìn)行檢測(cè)時(shí),可以同時(shí)對(duì)多個(gè)窗口進(jìn)行檢測(cè),因此可以快速排除非目標(biāo)窗口,進(jìn)一步提高檢測(cè)速度。
進(jìn)一步地,通過采用條件互信息準(zhǔn)則構(gòu)建蕨特征,相比于隨機(jī)選擇亮度比較特征來構(gòu)建蕨特征,能夠選擇出鑒別性更好的特征組合,從而可以進(jìn)一步提高人臉檢測(cè)器的檢測(cè)速度。
進(jìn)一步地,通過對(duì)原始圖像的多個(gè)不同尺度的圖像分別進(jìn)行人臉檢測(cè),能夠獲取多個(gè)尺度的候選窗口,一起進(jìn)行后處理,可以進(jìn)一步提高人臉檢測(cè)的檢測(cè)效果。
進(jìn)一步地,通過對(duì)與所述待檢測(cè)圖像相鄰的預(yù)設(shè)幀數(shù)的圖像進(jìn)行檢測(cè),并根據(jù)對(duì)所述待檢測(cè)圖像相鄰的預(yù)設(shè)幀數(shù)的圖像的人臉檢測(cè)結(jié)果來獲得最終的人臉檢測(cè)結(jié)果,對(duì)當(dāng)前幀和相鄰數(shù)幀的檢測(cè)結(jié)果進(jìn)行加權(quán)平均,等價(jià)于對(duì)檢測(cè)結(jié)果進(jìn)行平滑濾波,能夠消除檢測(cè)結(jié)果抖動(dòng)的情況,可以進(jìn)一步提高人臉檢測(cè)的檢測(cè)效果。
附圖說明
圖1是本發(fā)明實(shí)施例中一種人臉檢測(cè)器的訓(xùn)練方法流程圖;
圖2是本發(fā)明實(shí)施例中一種人臉檢測(cè)方法流程圖;
圖3是本發(fā)明實(shí)施例中一種剔除嵌入第一檢測(cè)圖像的示意圖;
圖4為應(yīng)用本發(fā)明實(shí)施例中人臉檢測(cè)方法進(jìn)行人臉檢測(cè)的效果圖;
圖5為應(yīng)用本發(fā)明實(shí)施例中一種人臉檢測(cè)器的訓(xùn)練裝置的結(jié)構(gòu)示意圖;
圖6為應(yīng)用本發(fā)明實(shí)施例中一種人臉檢測(cè)裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
目前,基于SVM和HOG特征的人臉檢測(cè)器,沒有針對(duì)變形和多視角的處理機(jī)制,因此,對(duì)變形或是側(cè)面視角的人臉目標(biāo)的處理是它的弊端。此外HOG特征的復(fù)雜度較高,導(dǎo)致整個(gè)人臉檢測(cè)速度較低,難以應(yīng)用于低功耗的嵌入式設(shè)備。
基于DPM和HOG特征的人臉檢測(cè)器,雖然適用于變形和多視角的目標(biāo),但同樣由于HOG特征的復(fù)雜度較高,導(dǎo)致整個(gè)人臉檢測(cè)速度較低,難以應(yīng)用于低功耗的嵌入式設(shè)備。
基于CNN和Softmax分類器的目標(biāo)檢測(cè)器,雖然在現(xiàn)有的標(biāo)準(zhǔn)數(shù)據(jù)集(如:Visual Object Classes Challenge,ImageNet)上的檢測(cè)結(jié)果好于其他方法,但該方案的操作近似“黑盒”,針對(duì)特定目標(biāo)的檢測(cè),調(diào)整參數(shù)也需要耗費(fèi)極大的人力,降低人臉檢測(cè)速度。
基于自提升級(jí)聯(lián)模型和哈爾特征的人臉檢測(cè)器,雖然檢測(cè)速度較高,但由于哈爾特征主要提取紋理信息,而非邊緣輪廓信息,并且所檢測(cè)的人臉特征的形式十分局限,因此該方案對(duì)非受限的人臉圖像(如側(cè)臉,復(fù)雜光照,模糊,遮擋等情況),檢測(cè)效果一般。
由上述內(nèi)容可知,上述檢測(cè)方案均難以兼顧檢測(cè)速度及檢測(cè)效果。
針對(duì)上述問題,本發(fā)明的實(shí)施例提供了一種人臉檢測(cè)器的訓(xùn)練方法,所述方法通過提取訓(xùn)練樣本的亮度比較特征,進(jìn)而可以根據(jù)所述亮度比較特征獲得對(duì)應(yīng)的蕨特征,并利用所述蕨特征及貝葉斯定理得到第一分類器,利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則得到P個(gè)決策樹分類器,最后將所述P個(gè)決策樹分類器級(jí)聯(lián)形成所述第二分類器。通過提取所述亮度比較特征來獲得的人臉檢測(cè)器不僅可以提高檢測(cè)速度,而且可以獲得較好的檢測(cè)效果,更適合應(yīng)用于手機(jī)的用戶終端。并且,采用利用所述蕨特征及貝葉斯定理得到的第一分類器進(jìn)行檢測(cè)時(shí),可以同時(shí)對(duì)多個(gè)窗口進(jìn)行檢測(cè),因此可以快速排除非目標(biāo)窗口,進(jìn)一步提高檢測(cè)速度。
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更為明顯易懂,下面結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施例作詳細(xì)的說明。
如圖1所示,本發(fā)明實(shí)施例提供了一種人臉檢測(cè)器的訓(xùn)練方法。其中,所述人臉檢測(cè)器包括第一分類器及第二分類器。
具體地,所述方法如下步驟:
步驟11,采集人臉和非人臉圖像作為訓(xùn)練樣本集。
在具體實(shí)施中,所述訓(xùn)練樣本集中既有包括人臉的圖像,也有不包括人臉的圖像。將所述包括人臉的圖像樣本稱之為正樣本,對(duì)應(yīng)的類別標(biāo)簽q的值可以設(shè)置為“0”,將所述不包括人臉的圖像樣本稱之為負(fù)樣本,對(duì)應(yīng)的類別標(biāo)簽q的值可以設(shè)置為“1”。當(dāng)然,也可以將正樣本對(duì)應(yīng)的類別標(biāo)簽q的 值設(shè)置為“1”,將負(fù)樣本對(duì)應(yīng)的類別標(biāo)簽q的值設(shè)置為“0”,只要能通過數(shù)值將正樣本及負(fù)樣本進(jìn)行標(biāo)識(shí)即可。
在具體實(shí)施中,可以通過多種方式采集訓(xùn)練樣本,所采集到的每一圖像為一訓(xùn)練樣本。其中,比如,可以直接從公開的人臉數(shù)據(jù)集中獲取K個(gè)圖像,也可以通過照相機(jī)等圖像采集設(shè)備實(shí)時(shí)采集K個(gè)圖像,具體采集方式不作限定??梢岳斫獾氖?,所采集到的圖像中,所述包括人臉的圖像與不包括人臉的圖像的數(shù)量可以由本領(lǐng)域人員根據(jù)實(shí)際情況設(shè)置,所述包括人臉的圖像應(yīng)盡可能具有多種不同的姿態(tài),以提高根據(jù)所述訓(xùn)練樣本獲得的人臉檢測(cè)器泛化能力。
步驟12,提取所述訓(xùn)練樣本集中各個(gè)訓(xùn)練樣本的亮度比較特征。
在具體實(shí)施中,以所述訓(xùn)練樣本集中一訓(xùn)練樣本為I為例,通過公式(1),可以從訓(xùn)練樣本I中提取亮度比較特征:
其中,p1及p2分別為從訓(xùn)練樣本I上隨機(jī)選擇的兩像素點(diǎn);I(p1)及I(p2)分別像素點(diǎn)p1,p2的像素值,f(I;p1,p2)為根據(jù)像素點(diǎn)p1及p2所獲得的亮度比較特征。
通過公式(1)可以看出,亮度比較特征是在圖像上隨機(jī)選擇兩像素點(diǎn)進(jìn)行比較,屬于弱特征,不僅容易提取,而且與人臉圖像具體情況無關(guān),也就是與人臉圖像是否為具有正臉、側(cè)臉、復(fù)雜光照,模糊,遮擋等情況的圖像無關(guān)。
步驟13,根據(jù)所述亮度比較特征獲得對(duì)應(yīng)的蕨特征。
在具體實(shí)施中,可以采用自助法在從訓(xùn)練樣本I中提取的所有亮度比較特征中一次選取n個(gè)亮度比較特征。在構(gòu)建第j個(gè)蕨特征時(shí),可以采用條件互信息準(zhǔn)則進(jìn)行構(gòu)建。具體地,若所述第j個(gè)蕨特征由M個(gè)亮度比較特征組成,可以先通過公式(2)從訓(xùn)練樣本I中提取的n個(gè)亮度比較特征中,選取一亮度比較特征f1,再通過公式(3)從剩余的亮度比較特征中選取所述第j個(gè)蕨 特征的其他亮度比較特征fm:
f1=arg maxn(H(q)-H(q|fn)) (2)
其中,H(q)是類別標(biāo)簽q的熵;fl及fn分別為通過構(gòu)建所述第j個(gè)蕨特征時(shí),第l次及第n次選取的特征;H(q|fn)是亮度比較特征fn已知時(shí)的條件熵;H(q;fn|fl)是fl已知時(shí)類別標(biāo)簽q和亮度比較特征fn的條件互信息。
在具體實(shí)施中,H(q;fn|fl)可以通過公式(4)計(jì)算獲得:
H(q;fn|fl)=H(q|fl)-H(q|fn,fl) (4)
其中,q是亮度比較特征fl及fn對(duì)應(yīng)的樣本的類別標(biāo)簽;H(q|fl)是fl已知時(shí)的條件熵,H(q|fn,fl)是fl及fn均已知時(shí)的條件熵。
步驟14,利用所述蕨特征及貝葉斯定理進(jìn)行訓(xùn)練,得到所述第一分類器。
在具體實(shí)施中,設(shè)所述蕨特征之間相互獨(dú)立,根據(jù)貝葉斯定理可以推導(dǎo)出公式(5),即根據(jù)貝葉斯定理構(gòu)建第一分類器:
其中,F(xiàn)j是所述訓(xùn)練樣本集中第k個(gè)訓(xùn)練樣本的第j個(gè)蕨特征,Cq是第q個(gè)類別,P(Fm|C=Cq)是第k個(gè)訓(xùn)練樣本的類別為Cq時(shí),第j個(gè)蕨特征的似然度,J為第k個(gè)訓(xùn)練樣本的蕨特征的總數(shù),為第一分類器對(duì)第k個(gè)訓(xùn)練樣本的分類結(jié)果。k為正整數(shù)。所述第k個(gè)訓(xùn)練樣本為所述訓(xùn)練樣本集中任一訓(xùn)練樣本。
通過所述第一分類器,可以同時(shí)對(duì)訓(xùn)練樣本集中的各個(gè)訓(xùn)練樣本屬于正樣本還是負(fù)樣本進(jìn)行分類,進(jìn)而再由所述第二分類器對(duì)正樣本中的人臉圖像進(jìn)行檢測(cè)。
步驟15,利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則進(jìn)行P輪訓(xùn)練,得到P個(gè)決策樹分類器,P≥1,且P為整數(shù)。
本發(fā)明的實(shí)施例中,以所述決策樹為回歸樹為例,通常采用遞歸的方式來選擇亮度比較特征,并利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則構(gòu)建樹結(jié)構(gòu)。
具體地,先對(duì)已獲得的p-1個(gè)決策樹分類器誤分類的訓(xùn)練樣本的權(quán)重進(jìn)行更新,1≤p≤P,并根據(jù)更新后的訓(xùn)練樣本的權(quán)重,進(jìn)行第p輪的訓(xùn)練,獲得第p個(gè)決策樹分類器。
其中,在構(gòu)建第p個(gè)決策樹分類器時(shí),先從待劃分的訓(xùn)練樣本的亮度比較特征集合中有放回的選取若干的亮度比較特征,進(jìn)而根據(jù)所選取的部分亮度比較特征對(duì)所述待劃分的訓(xùn)練樣本進(jìn)行分類,從而根據(jù)更新后的各訓(xùn)練樣本的權(quán)重,按照公式(6)計(jì)算對(duì)所述訓(xùn)練樣本集中各訓(xùn)練樣本進(jìn)行分類時(shí)的加權(quán)均方差WMSE,選擇WMSE最小對(duì)應(yīng)的亮度比較特征作為所述第p個(gè)決策樹的劃分節(jié)點(diǎn),將所述待劃分的訓(xùn)練樣本劃分到左子樹(Left Sub-tree)或右子樹(Right Sub-tree)。
以上步驟將遞歸進(jìn)行,即不斷選擇各子樹中新的亮度比較特征作為劃分節(jié)點(diǎn),對(duì)劃分進(jìn)左子樹和右子樹的樣本繼續(xù)劃分,直至達(dá)到?jīng)Q策樹的最大深度D為止。當(dāng)達(dá)到?jīng)Q策樹的最大深度D時(shí),所述訓(xùn)練樣本集中各個(gè)訓(xùn)練樣本被劃分到對(duì)應(yīng)的葉子節(jié)點(diǎn)。其中,當(dāng)所述劃分節(jié)點(diǎn)為根節(jié)點(diǎn)時(shí),所述待劃分的訓(xùn)練樣本可以為訓(xùn)練樣本集中的全部訓(xùn)練樣本,當(dāng)所述劃分節(jié)點(diǎn)為其他節(jié)點(diǎn)時(shí),所述待劃分的訓(xùn)練樣本可以為訓(xùn)練樣本集中的部分訓(xùn)練樣本。
其中,BCq指選擇某一亮度比較特征對(duì)待劃分的訓(xùn)練樣本進(jìn)行二值分類(Binary Classification)后,被分類為類別標(biāo)簽q的訓(xùn)練樣本;Sk,lk,wk分別是第k個(gè)訓(xùn)練樣本的數(shù)據(jù)、加權(quán)真實(shí)值、權(quán)重;是所述訓(xùn)練樣本集中類別標(biāo)簽為q的所有訓(xùn)練樣本的加權(quán)真實(shí)值。
在具體實(shí)施中,可以通過公式(7)計(jì)算
第p個(gè)決策樹構(gòu)建完成后,各個(gè)訓(xùn)練樣本均會(huì)被劃分到對(duì)應(yīng)的葉子節(jié)點(diǎn)(Leaf Node,LN)中,對(duì)應(yīng)葉子節(jié)點(diǎn)的數(shù)值即為所述第p個(gè)決策樹分類器對(duì)該訓(xùn)練樣本的輸出值。以所述第p個(gè)決策樹包括X個(gè)葉子節(jié)點(diǎn),所述第k個(gè)訓(xùn)練樣本被劃分為第p個(gè)決策樹的第x個(gè)葉子節(jié)點(diǎn)LNx為例,x∈[0,X]可以通過公式(8)獲得所述第p個(gè)決策樹分類器對(duì)第k個(gè)訓(xùn)練樣本的輸出值,即第x個(gè)葉子節(jié)點(diǎn)的數(shù)值LNSx:
在具體實(shí)施中,可以采用公式(9)對(duì)第k個(gè)訓(xùn)練樣本的權(quán)重wk進(jìn)行更新:
wk’=wk·exp(-lkTp(Sk)) (9)
其中,Tp(Sk)是第p個(gè)決策樹分類器在所述第k個(gè)訓(xùn)練樣本的數(shù)據(jù)為Sk時(shí),對(duì)所述第k個(gè)訓(xùn)練樣本的輸出值;wk、lk分別是所述第k個(gè)訓(xùn)練樣本的權(quán)重、真實(shí)值;wk’為對(duì)所述第k個(gè)訓(xùn)練樣本的權(quán)重wk更新后的權(quán)重。Tp(Sk)的數(shù)值符號(hào)代表所述第p個(gè)決策樹分類器對(duì)該樣本的分類結(jié)果,Tp(Sk)的絕對(duì)值代表置信度。
步驟16,將所述P個(gè)決策樹分類器級(jí)聯(lián)形成所述第二分類器。
在具體實(shí)施中,可以按照公式(7)將所述P個(gè)決策樹分類器進(jìn)行級(jí)聯(lián),得到所述第二分類器:
其中,Tp(S)是第p個(gè)決策樹分類器在訓(xùn)練樣本的數(shù)據(jù)為S時(shí),對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的輸出值;αp是第p個(gè)決策樹分類器的權(quán)重,H(S)為所述第二分類器對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的分類結(jié)果。
步驟17,將包含所述第一分類器及第二分類器的檢測(cè)器作為所述人臉檢測(cè)器。
由上述內(nèi)容可知,通過提取亮度比較特征,進(jìn)而可以根據(jù)所提取的亮度比較特征生成蕨特征,從而可以根據(jù)所述亮度比較特征生成第一分類器,根據(jù)所述蕨特征生成第二分類器,通過所述第一分類器及第二分類器對(duì)人臉進(jìn) 行檢測(cè),不僅可以提高檢測(cè)速度,而且可以獲得較好的檢測(cè)效果。
如圖2所示,本發(fā)明實(shí)施例還提供了一種人臉檢測(cè)方法,所述方法應(yīng)用上述人臉檢測(cè)器訓(xùn)練方法獲得的人臉檢測(cè)器進(jìn)行人臉檢測(cè)。具體地,所述人臉檢測(cè)方法可以包括如下步驟:
步驟21,遍歷待檢測(cè)圖像,獲得待檢測(cè)子圖像集,所述待檢測(cè)子圖像集中每一待檢測(cè)子圖像對(duì)應(yīng)一窗口。
在具體實(shí)施中,可以采用滑動(dòng)窗口的方式遍歷所述待檢測(cè)圖像,每一待檢測(cè)子圖像即為一窗口。其中,窗口的大小可以由本領(lǐng)域人員根據(jù)實(shí)際情況進(jìn)行設(shè)置。
步驟22,將各所述待檢測(cè)子圖像依次帶入所述第一分類器及第二分類器中進(jìn)行人臉檢測(cè),將通過所述第一分類器及第二分類器的待檢測(cè)子圖像判定為所述待檢測(cè)圖像的人臉檢測(cè)結(jié)果。
在具體實(shí)施中,所述第一分類器及第二分類器的原理可以參照上述對(duì)人臉檢測(cè)器訓(xùn)練方法的描述。將各待檢測(cè)子圖像先帶入所述第一分類器,由所述第一分類器進(jìn)行初步檢測(cè)后,再將通過第一分類器的待檢測(cè)子圖像帶入所述第二分類器進(jìn)行檢測(cè),通過所述第二分類器檢測(cè)的待檢測(cè)子圖像為所述人臉檢測(cè)的檢測(cè)結(jié)果。
其中,所述第一分類器在檢測(cè)所述待檢測(cè)子圖像時(shí),可以同時(shí)對(duì)多個(gè)待檢測(cè)子圖像進(jìn)行檢測(cè)。對(duì)于每個(gè)待檢測(cè)子圖像,所述第一分類器可以提取對(duì)應(yīng)的蕨特征,再分別計(jì)算出各蕨特征在不同類別時(shí)的似然度,并將每一蕨特征的最大似然度對(duì)應(yīng)的類別標(biāo)簽值作為該蕨特征的類別標(biāo)簽。由此可以獲得各蕨特征的類別標(biāo)簽,最終確定各待檢測(cè)子圖像的類別,區(qū)分所述待檢測(cè)子圖像為人臉圖像還是非人臉圖像。
所述第二分類器在檢測(cè)相應(yīng)的待檢測(cè)子圖像時(shí),先將各待檢測(cè)子圖像依次分別輸入至P個(gè)決策樹分類器,獲得各決策樹分類器對(duì)該待檢測(cè)子圖像的輸出值,從而可以計(jì)算出對(duì)所述待檢測(cè)子圖像的各決策樹分類器的輸出值級(jí)聯(lián)后的值,獲得所述第二分類器對(duì)該待檢測(cè)子圖像的分類結(jié)果。
步驟23,將所述判定為待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類,得到所述 待檢測(cè)圖像的人臉圖像。
在具體實(shí)施中,將通過所述第一分類器及第二分類器的待檢測(cè)子圖像作為第一待檢測(cè)子圖像,所述第一待檢測(cè)子圖像的數(shù)量為多個(gè)。得到所述第一待檢測(cè)子圖像后,按照公式(11),使用深度優(yōu)先搜索的方法,在所有第一待檢測(cè)子圖像中搜索所有相連接的第一待檢測(cè)子圖像,也就是搜索所有相連接的窗口。
以W1、W2為任意兩個(gè)第一待檢測(cè)子圖像為例,當(dāng)W1、W2滿足公式(11)時(shí),W1、W2為相互連接的第一待檢測(cè)子圖像:
其中,R1為預(yù)設(shè)的第一重疊率閾值,可以由本領(lǐng)域人員設(shè)定。
此時(shí),可能存在多個(gè)聚類,每個(gè)聚類中的所述第一待檢測(cè)子圖像均相互連接。之后,對(duì)每個(gè)聚類中的所有第一待檢測(cè)子圖像進(jìn)行平均操作,生成一新的第一待檢測(cè)子圖像。新生成的第一待檢測(cè)子圖像與各聚類一一對(duì)應(yīng)。也就是說,新生成的第一待檢測(cè)子圖像的數(shù)量與聚類的數(shù)量相同。每個(gè)聚類均生成新的第一待檢測(cè)子圖像后,在所有所述新的第一待檢測(cè)子圖像中,剔除嵌入第一待檢測(cè)子圖像,將剩余的所述新的第一待檢測(cè)子圖像進(jìn)行合并,也就是在所有新的窗口中,剔除嵌入窗口,將剩余的新的窗口進(jìn)行合并,得到所述待檢測(cè)圖像的人臉圖像。
如圖3所示,第一待檢測(cè)子圖像31,32及33均為所述新的第一待檢測(cè)子圖像,其中,第一待檢測(cè)子圖像31被完全包含在第一待檢測(cè)子圖像33中,第一待檢測(cè)子圖像32被部分包含在第一待檢測(cè)子圖像33中。第一待檢測(cè)子圖像31及32均為嵌入第一待檢測(cè)子圖像,應(yīng)剔除。
在具體實(shí)施中,以W1、W2為任意兩個(gè)所述新的第一待檢測(cè)子圖像為例,當(dāng)W1、W2滿足公式(11)時(shí),W2為嵌入W1的第一待檢測(cè)子圖像,當(dāng)W1、W2滿足公式(12)時(shí),W1為嵌入W2的第一待檢測(cè)子圖像:
其中,R2預(yù)設(shè)的第二重疊率閾值,可以由本領(lǐng)域人員設(shè)定。
步驟24,輸出所述待檢測(cè)圖像中所述人臉圖像的位置。
即使用矩形框等標(biāo)注方式在所述待檢測(cè)圖像中標(biāo)注所得到的人臉圖像的位置。
在具體實(shí)施中,為了獲得更好的檢測(cè)效果,可以先對(duì)原始圖像進(jìn)行降采樣處理,獲得多個(gè)不同尺度的圖像,再將所述多個(gè)不同尺度的圖像分別作為所述待檢測(cè)圖像,分別對(duì)每個(gè)待檢測(cè)圖像執(zhí)行步驟21及22,獲得各待檢測(cè)圖像的人臉檢測(cè)結(jié)果。之后,分別將所述各待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行升采樣處理后再進(jìn)行聚類,得到所述待檢測(cè)圖像的人臉圖像。
在具體實(shí)施中,為了獲得穩(wěn)定的待檢測(cè)的視頻流,以達(dá)到更好的檢測(cè)效果,可以分別對(duì)所述待檢測(cè)圖像,以及與所述待檢測(cè)圖像相鄰的預(yù)設(shè)幀數(shù)的圖像進(jìn)行步驟21-23的人臉檢測(cè)。在將所述判定為待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類后,再分別對(duì)與所述待檢測(cè)圖像相鄰的預(yù)設(shè)幀數(shù)的圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類,按照公式(14)對(duì)每一幀圖像聚類后的結(jié)果進(jìn)行加權(quán)處理,并將加權(quán)處理后的結(jié)果作為所述待檢測(cè)圖像中的人臉圖像。其中,所述預(yù)設(shè)幀數(shù)可以由本領(lǐng)域人員設(shè)定。
其中,DRt是第t幀圖像的檢測(cè)結(jié)果,αt是第t幀圖像對(duì)應(yīng)的權(quán)重,T是參與人臉檢測(cè)的圖像的幀數(shù)。
圖4(a)-(g)為應(yīng)用本發(fā)明實(shí)施例中所述人臉檢測(cè)方法獲得的檢測(cè)效果圖。其中,圖4(a)-(g)中矩形框內(nèi)的圖像即為應(yīng)用所述人臉檢測(cè)方法所檢測(cè)到的人臉圖像。從圖4(a)-(g)的人臉檢測(cè)效果圖可以看出,本發(fā)明實(shí)施例中的人臉檢測(cè)方法可以檢測(cè)受限的人臉圖像,也可以檢測(cè)非受限的人臉圖像。也就是說,本發(fā)明實(shí)施例中的人臉檢測(cè)方法可以檢測(cè)正向人臉圖像,也可以檢測(cè)側(cè)臉,復(fù)雜光照,模糊,遮擋等情況的人臉圖像。
為了使本領(lǐng)域技術(shù)人員更好地理解和實(shí)現(xiàn)本發(fā)明,以下分別對(duì)上述方法 對(duì)應(yīng)的裝置進(jìn)行詳細(xì)描述。
如圖5所示,本發(fā)明實(shí)施例提供一種人臉檢測(cè)器的訓(xùn)練裝置,所述人臉檢測(cè)器包括第一分類器及第二分類器。所述裝置可以包括:采集單元51,第一特征提取單元52,第二特征提取單元53,第一訓(xùn)練單元54,第二訓(xùn)練單元55以及級(jí)聯(lián)單元56。其中:
所述采集單元51,適于采集人臉和非人臉圖像作為訓(xùn)練樣本集。所述第一特征提取單元52,適于提取所述訓(xùn)練樣本集中各個(gè)訓(xùn)練樣本的亮度比較特征。所述第二特征提取單元53,適于根據(jù)所述亮度比較特征獲得對(duì)應(yīng)的蕨特征。所述第一訓(xùn)練單元54,適于利用所述蕨特征及貝葉斯定理進(jìn)行訓(xùn)練,得到所述第一分類器。所述第二訓(xùn)練單元55,適于利用所述亮度比較特征及最小化加權(quán)均方差準(zhǔn)則進(jìn)行P輪訓(xùn)練,得到P個(gè)決策樹分類器,P≥1,且P為整數(shù)。所述級(jí)聯(lián)單元56,適于將所述P個(gè)決策樹分類器級(jí)聯(lián)形成所述第二分類器。
在具體實(shí)施中,所述第一訓(xùn)練單元54訓(xùn)練得到所述第一分類器分類方法如下:
其中,F(xiàn)j是所述訓(xùn)練樣本集中第k個(gè)訓(xùn)練樣本的第j個(gè)蕨特征;Cq是第q個(gè)類別,P(Fm|C=Cq)是第k個(gè)訓(xùn)練樣本的類別為Cq時(shí),第j個(gè)蕨特征的似然度,J為第k個(gè)訓(xùn)練樣本的蕨特征的總數(shù);為第一分類器對(duì)第k個(gè)訓(xùn)練樣本的分類結(jié)果;所述第k個(gè)訓(xùn)練樣本為所述訓(xùn)練樣本集中任一訓(xùn)練樣本。
在具體實(shí)施中,所述決策樹為回歸樹。相應(yīng)地,所述第二訓(xùn)練單元55包括:更新子單元551及訓(xùn)練子單元552。其中:所述更新子單元551,適于對(duì)已獲得的p-1個(gè)決策樹分類器誤分類的訓(xùn)練樣本的權(quán)重進(jìn)行更新,1≤p≤P。所述訓(xùn)練子單元552,適于根據(jù)更新后的訓(xùn)練樣本的權(quán)重,進(jìn)行第p輪的訓(xùn)練,獲得第p個(gè)決策樹分類器。
進(jìn)一步地,所述訓(xùn)練子單元552包括:提取模塊5521,分類模塊5522及訓(xùn)練模塊5523。所述提取模塊5521,適于從待劃分的訓(xùn)練樣本的亮度比較特 征集合中選取部分亮度比較特征。所述分類模塊5522,適于根據(jù)所選取的所述部分亮度比較特征對(duì)所述待劃分的訓(xùn)練樣本進(jìn)行分類。所述訓(xùn)練模塊5523,適于根據(jù)更新后的所述訓(xùn)練樣本集中各訓(xùn)練樣本的權(quán)重,采用最小化加權(quán)均方差準(zhǔn)則訓(xùn)練所述第p個(gè)決策樹的劃分節(jié)點(diǎn),直至達(dá)到所述第p個(gè)決策樹的最大深度。
在具體實(shí)施中,所述更新子單元551適于采用如下公式對(duì)第k個(gè)訓(xùn)練樣本的權(quán)重進(jìn)行更新:
wk’=wk·exp(-lkTp(Sk))
其中,Tp(Sk)是第p個(gè)決策樹分類器在所述第k個(gè)訓(xùn)練樣本的數(shù)據(jù)為Sk時(shí),對(duì)所述第k個(gè)訓(xùn)練樣本的輸出值;wk、lk分別是所述第k個(gè)訓(xùn)練樣本的權(quán)重、真實(shí)值;wk’為對(duì)所述第k個(gè)訓(xùn)練樣本的權(quán)重wk更新后的權(quán)重。
在具體實(shí)施中,所述級(jí)聯(lián)單元56得到所述第二分類器的方法如下:
其中,Tp(S)是第p個(gè)決策樹分類器在訓(xùn)練樣本的數(shù)據(jù)為S時(shí),對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的輸出值;αp是第p個(gè)決策樹分類器的權(quán)重,H(S)為所述第二分類器對(duì)所述訓(xùn)練樣本的數(shù)據(jù)為S的訓(xùn)練樣本的分類結(jié)果。
在具體實(shí)施中,所述第二特征提取單元53適于根據(jù)條件互信息準(zhǔn)則,從每個(gè)訓(xùn)練樣本的亮度比較特征中選取部分亮度比較特征,并將所選取的部分亮度比較特征作為第j個(gè)蕨特征,其中,j為正整數(shù)。
如圖6所示,本發(fā)明實(shí)施例還提供了一種人臉檢測(cè)裝置,所述裝置包括:遍歷單元61,檢測(cè)單元62,第一聚類處理單元63以及輸出單元64。其中:
所述遍歷單元61,適于遍歷待檢測(cè)圖像,獲得待檢測(cè)子圖像集,所述待檢測(cè)子圖像集中每一待檢測(cè)子圖像對(duì)應(yīng)一窗口。所述檢測(cè)單元62,適于采用上述人臉檢測(cè)器訓(xùn)練裝置訓(xùn)練得到的人臉檢測(cè)器,對(duì)所述待檢測(cè)子圖像進(jìn)行檢測(cè),得到所述待檢測(cè)圖像的人臉圖像。所述輸出單元64,適于輸出所述待檢測(cè)圖像中所述人臉圖像的位置。
在具體實(shí)施中,所述裝置還包括:降采樣處理單元(未示出)以及升采樣處理單元(未示出)。其中,所述降采樣處理單元,適于對(duì)原始圖像進(jìn)行降采樣處理后獲得多個(gè)不同尺度的圖像,將所述多個(gè)不同尺度的圖像分別作為所述待檢測(cè)圖像。所述升采樣處理單元,適于分別將各待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行升采樣處理后再進(jìn)行聚類。
在具體實(shí)施中,所述裝置還包括:第二聚類處理單元(未示出)及加權(quán)處理單元(未示出)。其中,所述第二聚類處理單元,適于在將所述判定為待檢測(cè)圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類后,分別對(duì)與所述待檢測(cè)圖像相鄰的預(yù)設(shè)幀數(shù)的圖像的人臉檢測(cè)結(jié)果進(jìn)行聚類。所述加權(quán)處理單元,適于對(duì)每一幀圖像聚類后的結(jié)果進(jìn)行加權(quán)處理,并將加權(quán)處理后的結(jié)果作為所述待檢測(cè)圖像中的人臉圖像。
在具體實(shí)施中,所述第一聚類處理單元63可以包括:搜索子單元631,生成子單元632,以及處理子單元633。其中,
所述搜索子單元631,適于在通過所述第一分類器及第二分類器的待檢測(cè)子圖像中,搜索所有相連接的待檢測(cè)子圖像,將相連接的待檢測(cè)子圖像作為一個(gè)聚類。所述生成子單元632,適于對(duì)每個(gè)聚類中的所有待檢測(cè)子圖像進(jìn)行平均操作,生成新的待檢測(cè)子圖像。所述處理子單元633,適于在所有所述新的待檢測(cè)子圖像中,剔除嵌入待檢測(cè)子圖像,將剩余的所述新的待檢測(cè)子圖像進(jìn)行合并,得到所述待檢測(cè)圖像的人臉圖像。
本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:ROM、RAM、磁盤或光盤等。
雖然本發(fā)明披露如上,但本發(fā)明并非限定于此。任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),均可作各種更動(dòng)與修改,因此本發(fā)明的保護(hù)范圍應(yīng)當(dāng)以權(quán)利要求所限定的范圍為準(zhǔn)。