亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種針對(duì)多姿態(tài)人臉的人臉檢測(cè)系統(tǒng)及方法

文檔序號(hào):9929806閱讀:475來源:國知局
一種針對(duì)多姿態(tài)人臉的人臉檢測(cè)系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)視覺領(lǐng)域,尤其涉及人臉檢測(cè)技術(shù)。
【背景技術(shù)】
[0002]人臉檢測(cè)任務(wù)的目標(biāo)是對(duì)任意給定的一幅圖像或一組圖像序列,使用機(jī)器自動(dòng)判定該圖像或該序列中是否存在人臉,且在存在人臉的情況下,找出其位置和大小。人臉檢測(cè)問題通常被抽象為一個(gè)二分類問題,即區(qū)分人臉與非人臉。經(jīng)典的人臉檢測(cè)方法主要通過基于人臉與非人臉的圖像樣本學(xué)習(xí)分類器,然后在輸入的圖像上通過滑動(dòng)窗口的方式使用訓(xùn)練好的數(shù)據(jù)學(xué)習(xí)分類器對(duì)每個(gè)圖像窗口進(jìn)行分類。
[0003]人臉圖像會(huì)因?yàn)椴煌瑐€(gè)體在年齡、性別、種族、體重,以及不同的頭部姿態(tài)等內(nèi)在因素方面的不同而在其表觀與形狀上呈現(xiàn)出巨大的差異,而光照、遮擋、角度、距離、采集設(shè)備等外在因素的影響又進(jìn)一步豐富了人臉圖像的變化模式、增加了人臉檢測(cè)的難度。在所有可能影響人臉圖像的表觀與形狀的因素中,人臉的姿態(tài)是對(duì)人臉圖像的表觀影響最大的因素之一,而姿態(tài)的變化是一種高度非線性的變換,不同姿態(tài)的人臉圖像在表觀上存在著顯著的差異,采用單個(gè)模型難以統(tǒng)一地對(duì)所有的姿態(tài)進(jìn)行建模,因此通常將多姿態(tài)人臉檢測(cè)問題劃分為多個(gè)更為簡單的子姿態(tài)人臉檢測(cè)問題來加以解決,即針對(duì)不同姿態(tài)分別訓(xùn)練分類器,每個(gè)分類器處理對(duì)應(yīng)姿態(tài)下的人臉。在現(xiàn)有技術(shù)中,多個(gè)分類器的組織結(jié)構(gòu)主要有:并列式、金字塔式以及樹形。
[0004]然而,現(xiàn)有技術(shù)中對(duì)多個(gè)分類器的組織方法仍存在不同程度的不足。并列式分類器結(jié)構(gòu)針對(duì)每個(gè)姿態(tài)訓(xùn)練一個(gè)人臉檢測(cè)器,對(duì)絕大部分候選圖像窗口都需要執(zhí)行所有姿態(tài)的人臉檢測(cè)器,因而其具有較低的檢測(cè)效率,同時(shí)整個(gè)檢測(cè)器的誤檢率隨著并列檢測(cè)器的增多而增長;金字塔式分類器結(jié)構(gòu)在形式上可以看成是共享高層節(jié)點(diǎn)的并列式結(jié)構(gòu),除了第一層之外,每一層都是采用多個(gè)模型并列的形式,因而其在時(shí)間效率和誤檢率上具有和并列式結(jié)構(gòu)相同的問題,不同之處只是在于高層通過共享節(jié)點(diǎn)的方式減少了部分計(jì)算上的開銷,而用單模型來建模多姿態(tài)人臉勢(shì)必在召回率和非人臉窗口過濾能力之間存在矛盾,進(jìn)而造成檢測(cè)精度的下降或者計(jì)算開銷的增大,或者兩者兼有;樹形分類器結(jié)構(gòu)的每一層上的分類器并聯(lián)以由粗到細(xì)地對(duì)姿態(tài)進(jìn)行分支,由于其頂層節(jié)點(diǎn)往往需要更多的特征,并且在分支時(shí)需要顯式地或隱式地對(duì)姿態(tài)進(jìn)行估計(jì),其檢測(cè)精度嚴(yán)重依賴于對(duì)姿態(tài)的估計(jì)的準(zhǔn)確程度,不準(zhǔn)確或者錯(cuò)誤的姿態(tài)估計(jì)都很容易造成漏檢從而降低檢測(cè)器的召回率。有的樹形檢測(cè)器設(shè)計(jì)了多重分支的機(jī)制來降低對(duì)姿態(tài)估計(jì)準(zhǔn)確性的依賴,但是這并沒有從根本上解決問題,而多重分支的機(jī)制本身又是一個(gè)難點(diǎn)。
[0005]綜上所述,對(duì)于多姿態(tài)情況下的人臉圖像,模型復(fù)雜度低的分類器缺乏足夠的建模能力,模型復(fù)雜度高的分類器則具有高昂的計(jì)算開銷,目前采用多個(gè)分類器的方法也難以兼顧較強(qiáng)的建模能力和較小的計(jì)算開銷,難以同時(shí)在精度和速度上取得好的表現(xiàn)。

【發(fā)明內(nèi)容】

[0006]本發(fā)明的目的是提供一種能夠克服上述技術(shù)問題的解決方案。
[0007]本發(fā)明提供了一種針對(duì)多姿態(tài)人臉的人臉檢測(cè)系統(tǒng),包括:前端檢測(cè)器和后端檢測(cè)器,其中,所述前端檢測(cè)器包括至少一層分類器,所述每一層包含至少兩個(gè)并列的針對(duì)不同姿態(tài)人臉的第一類分類器,用于對(duì)候選的人臉與非人臉窗口進(jìn)行區(qū)分;所述后端檢測(cè)器包括采用深度神經(jīng)網(wǎng)絡(luò)的第二類分類器,用于進(jìn)一步區(qū)分所述前端檢測(cè)器的檢測(cè)結(jié)果中的人臉和非人臉。
[0008]優(yōu)選地,所述前端檢測(cè)器包括至少兩層分類器,所述每一層包含至少兩個(gè)并列的針對(duì)不同姿態(tài)人臉的第一類分類器,其中,較低層上的所述第一類分類器的數(shù)目不多于較高層上的所述第一類分類器的數(shù)目。
[0009]優(yōu)選地,所述第一類分類器包括采用能快速計(jì)算的特征的分類器,和/或采用能夠快速計(jì)算的算法的分類器。
[0010]優(yōu)選地,所述能快速計(jì)算的特征包括LAB、Haar、加速的SIFT特征,和/或SURF特征。
[0011]優(yōu)選地,所述第一類分類器包括級(jí)聯(lián)分類器、基于部件模型的分類器,和/或基于神經(jīng)網(wǎng)絡(luò)模型的分類器。
[0012]優(yōu)選地,所述不同人臉姿態(tài)包括根據(jù)人臉頭部平面外左右旋轉(zhuǎn)的角度、平面外上下旋轉(zhuǎn)的角度,和/或平面內(nèi)旋轉(zhuǎn)的角度劃分的不同角度范圍。
[0013]優(yōu)選地,所述第二類分類器包括由至少兩個(gè)深度神經(jīng)網(wǎng)絡(luò)級(jí)聯(lián)構(gòu)成的分類器。
[0014]本發(fā)明還相應(yīng)地提供了一種用于前述人臉檢測(cè)系統(tǒng)的人臉檢測(cè)方法,包括:步驟I,輸入待檢測(cè)窗口 ;步驟2,通過所述前端檢測(cè)器分別判定所述待檢測(cè)窗口是否為特定姿態(tài)的人臉;步驟3,通過所述后端檢測(cè)器統(tǒng)一判定所述步驟2中所有被確定為特定姿態(tài)的人臉的待檢測(cè)窗口是否為人臉;步驟4,將所述步驟3中所有被確定為人臉的待檢測(cè)窗口標(biāo)記為人臉窗口。
[0015]優(yōu)選地,其中,所述步驟2還包括:濾除所有被確定為非特定姿態(tài)的人臉的窗口;和/或,所述步驟3還包括:濾除所有被確定為非人臉的窗口。
[0016]優(yōu)選地,其中,所述步驟4還包括:將所述步驟3中所有被確定為人臉的待檢測(cè)窗口進(jìn)行窗口合并,并將合并后的窗口標(biāo)記為人臉窗口。
[0017]與現(xiàn)有技術(shù)相比,本發(fā)明提出的技術(shù)方案能夠快速濾除絕大部分的非人臉圖像窗口,同時(shí)保證對(duì)人臉有足夠高的召回率,并對(duì)通過的人臉窗口進(jìn)行進(jìn)一步的精確區(qū)分,有效減少誤檢;在提升檢測(cè)精度的同時(shí),有效降低檢測(cè)過程的計(jì)算開銷,有效提高檢測(cè)速度。
【附圖說明】
[0018]為了更清楚地說明本發(fā)明的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖并不構(gòu)成對(duì)于本發(fā)明的技術(shù)方案的限制。
[0019]圖1是根據(jù)本發(fā)明的實(shí)施例的人臉檢測(cè)系統(tǒng)的結(jié)構(gòu)示意圖;
[0020]圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例的人臉檢測(cè)系統(tǒng)的示意圖;
[0021]圖3是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的人臉檢測(cè)系統(tǒng)的示意圖;
[0022]圖4是根據(jù)本發(fā)明的再一個(gè)實(shí)施例的人臉檢測(cè)系統(tǒng)的示意圖;
[0023]圖5是根據(jù)本發(fā)明的實(shí)施例的人臉檢測(cè)方法的流程圖。
【具體實(shí)施方式】
[0024]圖1示出了根據(jù)本發(fā)明的實(shí)施例的人臉檢測(cè)系統(tǒng)的結(jié)構(gòu)示意圖。如圖1所示,本發(fā)明的人臉檢測(cè)系統(tǒng)包括前端的姿態(tài)特定的檢測(cè)器Cl以及后端的全姿態(tài)檢測(cè)器C2。其中,前端檢測(cè)器Cl用于快速濾除輸入圖像上的絕大部分非人臉窗口,以確定用于后端檢測(cè)的候選人臉窗口;后端全姿態(tài)檢測(cè)器C2用于針對(duì)人臉的所有姿態(tài)進(jìn)行統(tǒng)一的檢測(cè),以確定并輸出人臉檢測(cè)結(jié)果。
[0025]前端檢測(cè)器Cl
[0026]如圖2所示,根據(jù)本發(fā)明的一個(gè)實(shí)施例,前端檢測(cè)器Cl一共分為兩層,第一層上共有5個(gè)并列的米用LAB(Locally Assembled Binary Feature)特征的AdaBoost分類器,分別對(duì)應(yīng)于不同的人臉姿態(tài)樣本進(jìn)行訓(xùn)練。其中,將人臉樣本根據(jù)人臉在頭部平面外水平方向的旋轉(zhuǎn)角度劃分的5個(gè)不同的姿態(tài),S卩:將平面外水平旋轉(zhuǎn)的角度范圍[一90°,90°],劃分為5個(gè)小范圍:左全側(cè)面人臉[一90°,一50° ]、左半側(cè)面人臉[一50°,一25° ]、右全側(cè)面人臉[50°,90°]、右半側(cè)面人臉[25°,50°]、和準(zhǔn)正面人臉[一25°,25°]。為了能夠盡量多的濾除非人臉窗口,同時(shí)保證人臉窗口的召回率(即,被正確檢測(cè)到的人臉數(shù)目與原圖像內(nèi)包含的人臉數(shù)目的比值),優(yōu)選地,需要使用100?150個(gè)LAB特征。
[0027]前端檢測(cè)器Cl的第二層上采用2個(gè)小型的卷積神經(jīng)網(wǎng)絡(luò),一個(gè)網(wǎng)絡(luò)處理通過第一層的左半側(cè)面、準(zhǔn)正面和右半側(cè)面人臉,另一個(gè)網(wǎng)絡(luò)處理通過第一層的左全側(cè)面和右全側(cè)面人臉。優(yōu)選地,前端第二層上的每個(gè)卷積神經(jīng)網(wǎng)絡(luò)都只包含一個(gè)卷積層和兩個(gè)全連接層,其原因在于,雖然第一層的LAB Adaboost分類器已經(jīng)濾除掉了大部分的窗口,但是由于卷積本身計(jì)算開銷比較大,故若采用過大的網(wǎng)絡(luò)會(huì)極大地降低檢測(cè)速度。網(wǎng)絡(luò)以20X20的RGB三通道圖像作為輸入,卷積層采用6個(gè)5X5的卷積核,全連接層分別采用20和2個(gè)節(jié)點(diǎn),在卷積層之后和全連接層之前還包含有一個(gè)Max-pooling層以2為步長對(duì)2 X 2的區(qū)域進(jìn)行處理。卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練采用反向傳播算法。
[0028]如圖2所示,前端檢測(cè)器Cl的第一層和第二層形成了漏斗形的結(jié)構(gòu)(S卩,高層的分類器數(shù)目不少于低層的分類器數(shù)目;本文中所述的高層至低層或以由小到大的編號(hào)順序,即由前端檢測(cè)器Cl的輸入端至輸出端的順序,亦即從輸入端到輸出端,分類器的數(shù)目是
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1