專利名稱:圖像處理方法以及裝置與程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像處理,具體地說是一種檢測出面部照片圖像中所攝制的面部的寬度的圖像處理方法與裝置以及用于它的程序。
背景技術(shù):
在護(hù)照以及駕駛執(zhí)照的批準(zhǔn)申請,或簡歷的制作中,很多要求提交攝制有本人面部的預(yù)定輸出規(guī)格的照片(以下稱作證件照片)。證件照片的輸出規(guī)格,幾乎都是在上下方向?qū)ν瓿傻膱D像全體的長度以及面部(或面部的一部分)的長度進(jìn)行了規(guī)定,與此相對,在左右方向上對完成了的圖像全體的長度(寬度)進(jìn)行了規(guī)定,另外,對面部的寬度沒有規(guī)定。
為了得到像這樣的證件照片,提出了各種方法。例如專利文獻(xiàn)1中所述,提出了一種在將證件照片的制作中所使用的面部照片圖像(攝制有面部的圖像)顯示在監(jiān)視器等顯示裝置中的狀態(tài)下,如果指示所顯示的面部照片圖像中的頭頂部位置與下巴的前端位置(以下稱作下巴的位置),便根據(jù)計(jì)算機(jī)所指示的兩個位置,求出面部的位置以及大小(長度),并根據(jù)證件照片的輸出規(guī)格,求出面部的縮放率并對圖像進(jìn)行縮放,同時,對縮放了的面部照片圖像進(jìn)行剪裁,將縮放了的圖像中的面部配置在證件照片中的給定位置上,從而形成證件照片圖像的方法。通過該方法,用戶能夠請DPE店等制作證件照片,同時,還能夠通過將手頭的照片中的、拍攝的較好的那樣的記錄有中意的照片的照片膠卷或存儲媒體,帶到DPE店,從而根據(jù)中意的照片來制作證件照片。
另外,如專利文獻(xiàn)2以及專利文獻(xiàn)3所述,提出了一種代替通過操作者的手動所進(jìn)行的指示,由計(jì)算機(jī)檢測出眼睛、嘴巴等部分,根據(jù)所檢測出的部分的位置,推定頭頂部位置、下巴位置等,進(jìn)行剪裁處理,形成證件照片圖像的方法。
但是,近年來,在對安全性的要求變得嚴(yán)格的背景下,作為證件照片的規(guī)格,不但對證件照片中的面部長度進(jìn)行規(guī)定,還具有對面部寬度進(jìn)行規(guī)定的傾向,因此,需要在把握了面部照片圖像中所攝制的面部寬度的基礎(chǔ)上,進(jìn)行裁剪處理。另外,上述現(xiàn)有方法中,由于將重心放在面部的長度上來進(jìn)行裁剪處理,因此無法滿足這樣的規(guī)格。
另外,除了證件照片的領(lǐng)域以外,也有對面部照片圖像的面部寬度有要求的情況。例如,在制作畢業(yè)相冊等的情況下,希望完成的相冊中的各個照片圖像中的面部大小大致相同。為了統(tǒng)一面部大小,不僅僅是面部長度,還需要取得面部的寬度,讓各面部的面積大致相同。
像這樣,為了制作對完成了圖像中的面部的寬度也進(jìn)行了規(guī)定的照片,需要把握原來的面部照片圖像中的面部寬度,但以前沒有檢測出面部照片圖像中所攝制的面部寬度的方法。
專利文獻(xiàn)1特開平11-341272號公報專利文獻(xiàn)2特開2004-5384號公報專利文獻(xiàn)3特開2004-96486號公報。
發(fā)明內(nèi)容
本發(fā)明正是用于解決上述問題,其目的在于提供一種為了用來滿足嚴(yán)格的證件照片規(guī)格的裁剪處理,以及用來統(tǒng)一多個照片圖像中的面部大小的處理等,而從面部照片圖像中檢測出面部的寬度的圖像處理方法與裝置,以及用于它的程序。
本發(fā)明的圖像處理方法,是檢測出面部照片圖像中所攝制的面部的寬度的圖像處理方法,其特征在于檢測出上述面部中的膚色區(qū)域;取得所檢測出的上述膚色區(qū)域的、沿著從上述面部的頭頂部向下巴的方向的每一個位置的左右寬度;將上述左右寬度不連續(xù)增加的位置設(shè)為第1位置,將比上述第1位置接近下巴且上述左右寬度不連續(xù)減少的位置的1個距離下巴較遠(yuǎn)的位置設(shè)為第2位置,將上述第1位置到上述第2位置之間的范圍內(nèi)的給定位置中的上述左右寬度,決定為上述面部的寬度。
本發(fā)明的圖像處理方法,最好將上述第1位置到上述第2位置之間的范圍內(nèi)的各位置中的上述左右寬度中,最大的上述左右寬度,決定為上述面部的寬度。
本發(fā)明的圖像處理方法,也可以將上述第1位置中的上述左右寬度,與上述第2位置中的上述左右寬度中的較大一方的上述左右寬度,決定為上述面部的寬度。
本發(fā)明的圖像處理方法,最好將推定為膚色的區(qū)域作為基準(zhǔn)區(qū)域?qū)ι鲜雒娌吭O(shè)定;從上述面部檢測出具有與所設(shè)定的該基準(zhǔn)區(qū)域的顏色相近似的顏色的像素;將所檢測出的上述像素所構(gòu)成的區(qū)域,檢測為上述膚色區(qū)域。
另外,設(shè)定上述基準(zhǔn)區(qū)域時,最好將上述面部中的眼睛與鼻尖之間的區(qū)域設(shè)為上述基準(zhǔn)區(qū)域。
本發(fā)明的圖像處理裝置,是一種檢測出面部照片圖像中所攝制的面部的寬度的圖像處理裝置,其特征在于,具有膚色區(qū)域檢測機(jī)構(gòu),其檢測出上述面部中的膚色區(qū)域;每個位置寬度取得機(jī)構(gòu),其取得所檢測出的上述膚色區(qū)域的、沿著從上述面部的頭頂部向下巴部的方向的每一個位置的左右寬度;以及面部寬度決定機(jī)構(gòu),其將上述左右寬度不連續(xù)增加的位置設(shè)為第1位置,將比上述第1位置接近下巴且上述左右寬度不連續(xù)減少的位置的1個距離下巴較遠(yuǎn)的位置設(shè)為第2位置,將上述第1位置到上述第2位置之間的范圍內(nèi)的給定位置中的上述左右寬度,決定為上述面部的寬度。
這里,最好讓上述面部寬度決定機(jī)構(gòu),將上述第1位置到上述第2位置之間的范圍內(nèi)的各位置中的上述左右寬度中,最大的上述左右寬度,決定為上述面部的寬度。
另外,上述面部寬度決定機(jī)構(gòu),也可以將上述第1位置中的上述左右寬度,與上述第2位置中的上述左右寬度中的較大一方的上述左右寬度,決定為上述面部的寬度。
最好讓上述膚色區(qū)域檢測機(jī)構(gòu),具有基準(zhǔn)區(qū)域設(shè)定機(jī)構(gòu),其將推定為膚色的區(qū)域作為基準(zhǔn)區(qū)域?qū)ι鲜雒娌吭O(shè)定;以及膚色像素檢測機(jī)構(gòu),其從上述面部檢測出具有與所設(shè)定的該基準(zhǔn)區(qū)域的顏色相近似的顏色的像素,將所檢測出的上述像素所構(gòu)成的區(qū)域,檢測為上述膚色區(qū)域。
上述基準(zhǔn)區(qū)域設(shè)定機(jī)構(gòu),最好將上述面部中的眼睛與鼻尖之間的區(qū)域設(shè)為上述基準(zhǔn)區(qū)域。
另外,本發(fā)明的圖像處理方法,也可以作為用于使計(jì)算機(jī)執(zhí)行的程序來提供。
本發(fā)明的圖像處理方法以及裝置,利用人的面部因耳朵的存在,在上耳根中的寬度急劇增加,以及在下耳根部分寬度急劇減小,首先從面部照片圖像中檢測出膚色區(qū)域,將該膚色區(qū)域的左右寬度不連續(xù)增加的位置設(shè)為第1位置(也即上耳根的位置),同時,將比該第1位置接近下巴,且比左右寬度不連續(xù)減少的位置遠(yuǎn)離下巴的1個位置,取得為第2位置(也即下耳根的位置)。之后,著眼于人的面部在上耳根到下耳根之間的范圍內(nèi)的各個位置中的寬度間的差較小這一點(diǎn),取得該范圍內(nèi)的給定位置中的寬度作為面部的寬度。通過該方法,能夠可靠地取得面部的寬度。
另外,雖然也可以將所檢測出的上述范圍內(nèi)的任一個位置中的寬度決定為面部的寬度,但如果將該范圍內(nèi)的各個位置中的寬度中的最大的寬度,設(shè)為面部的寬度,則能夠更加精確地得到面部的寬度。
另外,根據(jù)統(tǒng)計(jì)可以發(fā)現(xiàn),人的面部在上耳根位置中的寬度與下耳根位置中的寬度的任一個,通常表現(xiàn)出面部的各個位置中的寬度的最大值,因此,如果將上耳根位置中的寬度與下耳根位置中的寬度中較大一方的寬度,決定為面部的寬度,就能夠迅速得到面部的寬度。
另外,為了檢測出面部各個位置中的寬度,需要檢測出面部中的膚色區(qū)域。但是,因人種、日曬程度不同等原因,人的膚色也各不相同。本發(fā)明的圖像處理方法以及裝置,將推定為膚色的區(qū)域作為基準(zhǔn)區(qū)域?qū)γ娌吭O(shè)定,通過檢測出具有與該基準(zhǔn)區(qū)域的顏色相近似的顏色的像素,來取得膚色區(qū)域,因此不會受到膚色的個人差別的影響,能夠可靠地檢測出膚色,從而能夠準(zhǔn)確檢測出面部的寬度。
圖1為表示本發(fā)明的實(shí)施方式的圖像處理系統(tǒng)的構(gòu)成的框圖。
圖2為表示面部檢測部20的構(gòu)成的框圖。
圖3為表示眼睛檢測部30的構(gòu)成的框圖。
圖4為說明眼睛中心位置的圖。
圖5(a)為表示水平方向的邊緣檢測濾波器的圖,(b)為表示垂直方向的邊緣檢測濾波器的圖。
圖6為說明梯度矢量計(jì)算的圖。
圖7(a)為表示人物的面部的圖,(b)為表示(a)中所示的人物面部的眼睛以及嘴巴附近的梯度矢量的圖。
圖8(a)為表示歸一化前的梯度矢量的大小的直方圖的圖,(b)為表示歸一化后的梯度矢量的大小的直方圖的圖,(c)為表示5值化了的梯度矢量的大小的直方圖的圖,(d)為表示歸一化后的5值化了的梯度矢量的大小的直方圖的圖。
圖9為說明已知作為第1參照數(shù)據(jù)的學(xué)習(xí)中所使用的面部的樣品圖像的例子的圖。
圖10為說明已知作為第2參照數(shù)據(jù)的學(xué)習(xí)中所使用的面部的樣品圖像的例子的圖。
圖11為說明面部的旋轉(zhuǎn)的圖。
圖12為表示參照數(shù)據(jù)的學(xué)習(xí)方法的流程圖。
圖13為表示識別器的導(dǎo)出方法的圖。
圖14為說明識別對象圖像的階段變形的圖。
圖15為說明基準(zhǔn)區(qū)域的設(shè)定的圖。
圖16為表示膚色區(qū)域抽出部70的構(gòu)成的框圖。
圖17為表示面部區(qū)域遮蔽框(mask)圖像生成部80的構(gòu)成的框圖。
圖18為說明面部區(qū)域遮蔽框圖像生成部80的處理的圖。
圖19為表示面部寬度取得部90的構(gòu)成的框圖。
圖20為說明圖1中所示的實(shí)施方式的圖像處理系統(tǒng)的處理的流程圖。
圖中10-圖像輸入部,20-面部檢測部,22-第1特征量計(jì)算部,24-面部檢測執(zhí)行部,30-眼睛檢測部,32-第2特征量計(jì)算部,34-眼睛檢測執(zhí)行部,40-數(shù)據(jù)庫,50-平滑處理部,60-基準(zhǔn)區(qū)域設(shè)定部,70-膚色區(qū)域抽出部,72-基準(zhǔn)區(qū)域特征量計(jì)算部,74-膚色像素抽出部,80-面部區(qū)域遮蔽框圖像生成部,82-2值圖像生成部,84-去噪部,86-橫向不連續(xù)區(qū)域去除部,90-面部寬度取得部,92-掃描部,94-面部寬度決定部,S0-面部照片圖像,S1-面部圖像,S2-平滑面部圖像,S5-面部區(qū)域遮蔽框圖像,α-基準(zhǔn)區(qū)域的平均色調(diào)角度,E1、E2-參照數(shù)據(jù)。
具體實(shí)施例方式
下面對照附圖,對本發(fā)明的實(shí)施方式進(jìn)行說明.
圖1為表示作為本發(fā)明的實(shí)施方式的圖像處理系統(tǒng)的結(jié)構(gòu)的框圖。本發(fā)明的圖像處理系統(tǒng),是從面部照片圖像(以下簡稱作照片圖像)S0中,檢測出該照片圖像S0中的面部的寬度的系統(tǒng),該檢測出寬度的處理,通過在計(jì)算機(jī)(例如個人計(jì)算機(jī)等)中執(zhí)行讀取到輔助存儲裝置中的處理程序來實(shí)現(xiàn)。另外,該處理程序,存儲在CD-ROM等信息存儲媒體中,或經(jīng)互聯(lián)網(wǎng)等網(wǎng)絡(luò)進(jìn)行發(fā)布,安裝在計(jì)算機(jī)中。
如圖所示,本實(shí)施方式的圖像處理系統(tǒng)具有輸入照片圖像S0的圖像輸入部10;檢測出由圖像輸入部10所輸入的照片圖像S0中的面部的大致位置以及大小,得到面部部分圖像(以下稱作面部圖像)S1的面部檢測部20;從面部圖像S1中分別檢測出雙眼的位置的眼睛檢測部30;存儲面部檢測部20以及眼睛檢測部30中所使用的后述的參照數(shù)據(jù)E1、E2的數(shù)據(jù)庫40;對面部檢測部20所得到的面部圖像S1實(shí)施平滑化處理,從而得到平滑面部圖像S2的平滑處理部50;根據(jù)面部檢測部30的檢測結(jié)果可靠地將膚色區(qū)域設(shè)為基準(zhǔn)區(qū)域的基準(zhǔn)區(qū)域設(shè)定部60;根據(jù)通過基準(zhǔn)區(qū)域設(shè)定部60所設(shè)定的基準(zhǔn)區(qū)域的顏色,從平滑面部圖像S2中抽出膚色區(qū)域的膚色區(qū)域抽出部70;實(shí)施去噪處理等處理,根據(jù)由膚色區(qū)域抽出部70所抽出的膚色區(qū)域的圖像,生成面部區(qū)域遮蔽框圖像S5的面部區(qū)域遮蔽框圖像生成部80;以及使用面部區(qū)域遮蔽框圖像S5取得面部度W的面部寬度取得部90。
圖像輸入部10,給本實(shí)施方式的圖像處理系統(tǒng)輸入處理對象的照片圖像S0,可以是例如接收經(jīng)網(wǎng)絡(luò)所發(fā)送的照片圖像S0的接收部、從CD-ROM等存儲媒體讀出照片圖像S0的讀取部、通過光電變換從紙或打印用紙等印刷介質(zhì)讀取印刷(包括打印)在印刷介質(zhì)上的圖像從而得到照片圖像S0的掃描儀等。
圖2為表示圖1中所示的圖像處理系統(tǒng)中的面部檢測部20的構(gòu)成的框圖。面部檢測部20,檢測出照片圖像S0中的面部的大概位置以及大小,從照片圖像S0中抽出通過該位置以及大小所表示的區(qū)域的圖像,得到面部圖像S1,如圖2所示,具有根據(jù)照片圖像S0計(jì)算出特征量C0的第1特征量計(jì)算部22,以及使用特征量C0以及存儲在數(shù)據(jù)庫40中的參照數(shù)據(jù)E1執(zhí)行面部檢測的面部檢測執(zhí)行部24。這里,對數(shù)據(jù)庫40中所保存的參照數(shù)據(jù)E1以及面部檢測部20的各個構(gòu)成進(jìn)行詳細(xì)說明。
面部檢測部20的第1特征量計(jì)算部22,根據(jù)照片圖像S0計(jì)算出面部的識別中所使用的特征量C0。具體地說,將梯度矢量(也即照片圖像S0上的各個像素中的濃度變化方向以及變化的大小),作為特征量C0計(jì)算出來。以下,對梯度矢量的計(jì)算進(jìn)行說明。首先,第1特征量計(jì)算部22,對照片圖像S0實(shí)施由圖5(a)所示的水平方向的邊緣檢測濾波器所進(jìn)行的濾波處理,檢測出照片圖像S0中的水平方向的邊緣。另外,第1特征量計(jì)算部22,對照片圖像S0實(shí)施由圖5(b)所示的垂直方向的邊緣檢測濾波器所進(jìn)行的濾波處理,檢測出照片圖像S0中的垂直方向的邊緣。之后,根據(jù)照片圖像S0上的各個像素中的水平方向的邊緣大小H以及垂直方向的邊緣大小V,如圖6所示,計(jì)算出各個像素中的梯度矢量K。
另外,在這樣所計(jì)算出的梯度矢量K為如圖7(a)所示的人物面部的情況下,如圖7(b)所示,在眼睛與嘴巴這樣的較暗的部分,指向眼睛以及嘴巴的中央,在鼻子這樣的較亮的部分中,從鼻子的位置指向外側(cè)。另外,由于眼睛比嘴巴的濃度變化大,因此眼睛的梯度矢量K比嘴巴的大。
另外,設(shè)該梯度矢量K的方向以及大小為特征量C0。另外,梯度矢量K的方向是以梯度矢量K的給定方向(例如圖6中的x方向)為基準(zhǔn)的0到359度。
這里,對梯度矢量K的大小進(jìn)行歸一化。該歸一化,通過求出照片圖像S0的所有像素中的梯度矢量K的大小的直方圖,將該直方圖平滑化并修正梯度矢量K的大小,使得其大小分布在照片圖像S0的各個像素所取得的值(如果是8位則是0~255)中均勻分布來進(jìn)行。例如,在梯度矢量K的大小較小,如圖8(a)所示,直方圖分布偏向梯度矢量K的大小較小一側(cè)的情況下,對梯度矢量K的大小進(jìn)行歸一化,使其大小遍布0~255全區(qū)域,得到如圖8(b)所示的直方圖分布。另外,為了降低運(yùn)算量,最好如圖8(c)所示,將梯度矢量K的直方圖中的分布范圍例如分成5份,進(jìn)行歸一化,讓分割成5份的頻度分布如圖8(d)所示,遍布在將0~255的值分割成5份的范圍內(nèi)。
數(shù)據(jù)庫40中所保存的參照數(shù)據(jù)E1,對從后述的樣品圖像中所選擇出的多個像素的組合所構(gòu)成的多種像素群的每一個,分別規(guī)定對構(gòu)成各個像素群的各個像素中的特征量C0的組合的識別條件。
參照數(shù)據(jù)E1中的構(gòu)成各個像素群的各個像素中的特征量C0的組合以及識別條件,通過由已知是面部的多個樣品圖像與已知不是面部的多個樣品圖像所構(gòu)成的樣品圖像群的學(xué)習(xí),來預(yù)先決定。
另外,本實(shí)施方式中,在生成參照數(shù)據(jù)E1時,已知是面部的樣品圖像,使用具有30×30像素大小,如圖9所示,一個面部的圖像中的雙眼中心間的距離為10像素、9像素以及11像素,在雙眼的中心間距離中,在平面上的±15度的范圍內(nèi)以3度為單位階段旋轉(zhuǎn)直立的面部(也即旋轉(zhuǎn)角度為-15度、-12度、-9度、-6度、-3度、0度、3度、6度、9度、12度、15度)所得到的樣品圖像。所以,對每一個面部圖像準(zhǔn)備3×11=33套。另外,圖9中只顯示了-15度、0度以及+15度旋轉(zhuǎn)的樣品圖像。另外,旋轉(zhuǎn)中心為樣品圖像的對角線的交點(diǎn)。這里,如果是雙眼中心間的距離為10像素的樣品圖像,則眼睛的中心位置都相同。設(shè)該眼睛的中心位置在以抽樣圖像的左上角為原點(diǎn)的坐標(biāo)上為(x1,y1)、(x2,y2)。另外,圖中的上下方向中的眼睛位置(也即y1、y2)在所有的樣品圖像中均相同。
另外,已知不是面部的樣品圖像,使用具有30×30圖像尺寸的任意圖像。
這里,在已知是面部的樣品圖像,只使用雙眼的中心間距離為10像素且平面上的旋轉(zhuǎn)角度為0度(也即面部垂直的狀態(tài))的圖像進(jìn)行學(xué)習(xí)的情況下,參照參照數(shù)據(jù)E1識別出是面部的,只有雙眼的中心間距離為10像素且完全沒有旋轉(zhuǎn)的面部。由于照片圖像S0中所有可能含有的面部尺寸不一定,因此,在識別是否含有面部時,如后所述,縮放照片圖像S0,使其能夠識別出適于樣品圖像尺寸的大小的面部位置。但是,如果為了讓雙眼的中心間距離準(zhǔn)確為10像素,需要將照片圖像S0的大小以放大率例如1.1單位階段縮放,進(jìn)行識別,因此運(yùn)算量龐大。
另外,照片圖像S0中有可能包含的面部,如圖11(a)所示,不僅僅是平面上的旋轉(zhuǎn)角度為0度的,還有如圖11(b)、(c)所示進(jìn)行了旋轉(zhuǎn)的情況。但是,如果在只使用雙眼中心間距為10像素,面部的旋轉(zhuǎn)角度為0度的樣品圖像進(jìn)行學(xué)習(xí)的情況下,盡管是面部,但對于如圖11(b)、(c)所示進(jìn)行了旋轉(zhuǎn)的面部,也無法進(jìn)行識別。
因此,本實(shí)施方式中,已知是面部的樣品圖像,使用如圖9所示,雙眼中心間的距離為9、10、11像素,在各個距離中,在平面上的±15度的范圍內(nèi)以3度為單位階段旋轉(zhuǎn)面部所得到的樣品圖像,讓參照數(shù)據(jù)E1的學(xué)習(xí)具有容許度。通過這樣,在后述的面部檢測執(zhí)行部24中進(jìn)行識別時,照片圖像S0的放大率只要以11/9單位階段性縮放就可以了,因此與放大率例如以1.1為單位階段性縮放照片圖像S0的大小的情況相比,能夠降低運(yùn)算時間。另外,如圖11(b)、(c)所示,旋轉(zhuǎn)了的面部也能夠識別出來。
以下對照圖12的流程圖,對樣品圖像群的學(xué)習(xí)方法之一例進(jìn)行說明。
對照圖13對識別器的生成進(jìn)行說明。如圖13左側(cè)的樣品圖像所示,構(gòu)成用來生成該識別器的像素群的各個像素,已知是面部的多個樣品圖像,位于右眼中心的像素為P1,位于右側(cè)臉頰部分的像素為P2,位于額部的像素為P3,位于左側(cè)臉頰部分的像素為P4。這樣,對于已知是面部的所有樣品圖像求出所有像素P1~P4中的特征量C0的組合,生成其直方圖。這里,特征量C0表示梯度矢量K的方向以及大小,梯度矢量K的方向?yàn)?~359共360個,梯度矢量K的大小為0~255共256個,如果原樣進(jìn)行使用,組合數(shù)是每一個像素為360×256個的4個像素量,也即(360×256)4個,為了進(jìn)行學(xué)習(xí)以及檢測,需要很多樣品數(shù)、時間以及內(nèi)存。因此,本實(shí)施方式中,將梯度矢量的方向在0~359中4值化為0~44與315~359(右向,值0)、45~134(上方,值1)、135~224(左向,值2)、225~314(下方,值3),將梯度矢量的大小3值化(值0~2)。之后,使用下面的公式計(jì)算出組合值。
組合值=0(梯度矢量的大?。?的情況)組合值=((梯度矢量的方向+1)×梯度矢量的大小(梯度矢量的大小>0)的情況)通過這樣,組合數(shù)為94個,因此能夠降低特征量C0的數(shù)據(jù)數(shù)目。
同樣,對于已知不是面部的多個樣品圖像,生成直方圖。另外,對于已知不是面部的樣品圖像,使用與已知是面部的樣品圖像上的上述像素P1~P4的位置相對應(yīng)的像素。取這兩個直方圖所示的頻度值的比的對數(shù)值并通過直方圖來表示的圖是圖13的最右側(cè)所顯示的用作識別器的直方圖。以下將該識別器的直方圖所示的各個縱軸的值,稱作識別點(diǎn)數(shù)。根據(jù)該識別器,顯示出對應(yīng)于正識別點(diǎn)數(shù)的特征量C0的分布的圖像為面部圖像的可能性較高,可以說識別點(diǎn)數(shù)的絕對值越大,其可能性就越高。反之,顯示出對應(yīng)于負(fù)識別點(diǎn)數(shù)的特征量C0的分布的圖像不是面部圖像的可能性較高,也是識別點(diǎn)數(shù)的絕對值越大,其可能性就越高。步驟S2中,對構(gòu)成識別中所使用的多種像素群的各個像素中的特征量C0的組合,生成上述直方圖形式的多個識別器。
接下來,在步驟S2所生成的多個識別器中,選擇識別圖像是否是面部的最有效的識別器。最有效的識別器的選擇,考慮各個樣品圖像的加權(quán)來進(jìn)行。本例中,對各個識別器的帶有加權(quán)的正確率進(jìn)行比較,選擇顯示出最高的帶有加權(quán)的正確率的識別器(S3)。也即,最初的步驟S3中,由于各個樣品圖像的加權(quán)相等均為1,因此單純將通過該識別器準(zhǔn)確識別出圖像是否是面部的樣品圖像數(shù)目最多的,選擇為最有效的識別器。另外,在后述的步驟S5中,各個樣品圖像的加權(quán)更新了之后的第2次的步驟S3中,加權(quán)為1的樣品圖像、加權(quán)大于1的樣品圖像以及加權(quán)小于1的樣品圖像混在一起,加權(quán)大于1的樣品圖像,在正確率評價中,比加權(quán)為1的樣品圖像要多統(tǒng)計(jì)加權(quán)大出來的部分。通過這樣,在2次以后的步驟S3中,與加權(quán)較小的樣品圖像相比,將重點(diǎn)放在準(zhǔn)確識別加權(quán)較大的樣品圖像上。
接下來,對至此所選擇的識別器的組合的正確率,也即將至此所選擇的識別器組合起來使用,識別各個樣品圖像是否是面部圖像的結(jié)果,與實(shí)際是否是面部圖像的答案相一致的概率,是否超過了給定閾值進(jìn)行確認(rèn)(S4)。這里所使用的是組合的正確率的評價,但也可以使用目前的帶有加權(quán)的樣品圖像群中,加權(quán)相等的樣品圖像群。在超過了給定閾值的情況下,如果使用至此所選擇的識別器,就能夠以足夠高的準(zhǔn)確率識別圖像是否是面部,因此結(jié)束學(xué)習(xí)。在為給定閾值以下的情況下,為了選擇與至此所選擇的識別器組合起來使用的追加識別器,而進(jìn)入步驟S6。
步驟S6中,為了不再次選擇在最近一次的步驟S3中所選擇的識別器,而將該識別器除外。
接下來,將最近一次的步驟S3所選擇的識別器沒有能夠準(zhǔn)確識別出是否是面部的樣品圖像的加權(quán)加大,將能夠準(zhǔn)確識別出圖像是否是面部的樣品圖像的加權(quán)減小(S5)。這樣的增減加權(quán)的理由是,為了在下一個識別器的選擇中,重視已選擇的識別器所無法準(zhǔn)確識別的圖像,選擇出能夠準(zhǔn)確識別出這些圖像是否是面部的識別器,從而提高識別器的組合的效果。
接下來,回到步驟S3,以上述帶有加權(quán)的正確率為基準(zhǔn),選擇下一個有效的識別器。
重復(fù)上述步驟S3至S6,選擇出與構(gòu)成特定像素群的各個像素中的特征量C0的組合相對應(yīng)的識別器,作為適于識別是否包含有面部的識別器,如果步驟S4所確認(rèn)的正確率超過閾值,便確定用于識別是否包含有面部的識別器的種類與識別條件(S7),通過這樣結(jié)束參照數(shù)據(jù)E1的學(xué)習(xí)。
另外,在采用上述學(xué)習(xí)方法的情況下,識別器只要能夠使用構(gòu)成特定像素群的各個像素中的特征量C0的組合,提供識別是面部圖像與不是面部圖像的基準(zhǔn),不管是不是上述直方圖形式都可以,例如可以是2值數(shù)據(jù)、閾值或函數(shù)等。另外,即使是相同的直方圖形式,也可以使用顯示出如圖13的中央所示的兩個直方圖的差分值的分布的直方圖等。
另外,學(xué)習(xí)方法并不僅限于上述方法,還可以使用神經(jīng)網(wǎng)絡(luò)等其他機(jī)器學(xué)習(xí)的方法。
面部檢測執(zhí)行部24,對構(gòu)成多種像素群的各個像素中的特征量C0的全部組合,參照參照數(shù)據(jù)E1所學(xué)習(xí)的識別條件,對構(gòu)成各個像素群的各個像素中的特征量C0的組合求出識別點(diǎn),綜合所有的識別點(diǎn)檢測出面部。此時,作為特征量C0的梯度矢量K的方向被4值化,大小被3值化。本實(shí)施方式中,將所有的識別點(diǎn)相加,通過該相加值的正負(fù)以及大小檢測出面部。例如,在識別點(diǎn)的總和為正值的情況下,判斷是面部,在為負(fù)值的情況下,判斷不是面部。
這里,與照片圖像S0的大小為30×30像素的樣品圖像不同,有可能是具有各種大小的圖像。另外,在包含有面部的情況下,不一定是平面上的面部的旋轉(zhuǎn)角度為0度。因此,面部檢測執(zhí)行部24如圖14所示,將照片圖像30階段縮放直到縱或橫尺寸為30像素,同時在平面上階段性旋轉(zhuǎn)360度(圖14中顯示了縮小狀態(tài)),在各個階段縮放了的照片圖像S0上,設(shè)定30×30像素大小的遮蔽框(mask)M,在被縮放了的照片圖像S0上遮蔽框M一個一個移動像素,進(jìn)行遮蔽框內(nèi)的圖像是否是面部圖像(也即對遮蔽框內(nèi)的圖像所得到的識別點(diǎn)的相加值是正還是負(fù))的識別。這樣,該識別對縮放以及旋轉(zhuǎn)的所有階段的照片圖像S0進(jìn)行,從識別點(diǎn)的相加值得到了最高正值的階段的大小以及旋轉(zhuǎn)角度的照片圖像S0,將對應(yīng)于所識別的遮蔽框M的位置的30×30像素的區(qū)域檢測為面部區(qū)域,同時,將該區(qū)域的圖像作為面部圖像S1從照片圖像S0抽出。
另外,作為參照數(shù)據(jù)E1的生成時所學(xué)習(xí)的樣品圖像,使用雙眼中心位置的像素?cái)?shù)為9、10、11像素的圖像,因此在縮放照片圖像S0時,可以將放大率設(shè)為11/9。另外,作為參照數(shù)據(jù)E1的生成時所學(xué)習(xí)的樣品圖像,使用面部在平面上在±15度的范圍內(nèi)旋轉(zhuǎn)的圖像,因此照片圖像S0可以以30度為單位進(jìn)行360度旋轉(zhuǎn)。
另外,第1特征量計(jì)算部22,在照片圖像S0的放大縮小以及旋轉(zhuǎn)等變形的各個階段,計(jì)算出特征量C0。
面部檢測部20,從這樣的照片圖像S0中檢測出大概的面部位置以及大小,得到面部圖像S1。
圖3為表示眼睛檢測部30的構(gòu)成的框圖。眼睛檢測部30,從通過面部檢測部20所得到的面部圖像S1中檢測出雙眼的位置,如圖所示,具有根據(jù)面部圖像S1計(jì)算出特征量C0的第2特征量計(jì)算部32,以及根據(jù)特征量C0以及數(shù)據(jù)庫40中所存儲的參照數(shù)據(jù)E2執(zhí)行眼睛位置的檢測的眼睛檢測執(zhí)行部34。
本實(shí)施方式中,通過眼睛檢測執(zhí)行部34所識別的眼睛位置是指,從面部中的外眼角到內(nèi)眼角間的中心位置(圖4中通過×表示),如圖4(a)所示,在為面對正面的眼睛的情況下,與瞳孔的中心位置相同,但在如圖4(b)所示為向右看的眼睛的情況下,不是瞳孔的中心位置,而是位于偏離瞳孔中心的位置或白眼珠部分上。
第2特征量計(jì)算部32,除了不是根據(jù)照片圖像S0而是面部圖像S1計(jì)算出特征量C0這一點(diǎn)之外,均與圖2中所示的面部檢測部20中的第1特征量計(jì)算部22相同,因此這里省略詳細(xì)說明。
數(shù)據(jù)庫40中所保存的第2參照數(shù)據(jù)E2,與第1參照數(shù)據(jù)相同,對從后述的樣品圖像中所選擇出的多個像素的組合所構(gòu)成的多種像素群的每一個,規(guī)定對構(gòu)成各個像素群的各個像素中的特征量C0的組合的識別條件。
這里,第2參照數(shù)據(jù)E2的學(xué)習(xí)中,如圖10所示,雙眼的中心間距為9.7、10、10.3像素,使用在各個距離中在平面上的±3度的范圍內(nèi)以1度為單位階段性讓面部旋轉(zhuǎn)所得到的樣品圖像。因此,與第1參照數(shù)據(jù)E1相比,學(xué)習(xí)的容許度較小,能夠精確檢測出眼睛的位置。另外,用來得到第2參照數(shù)據(jù)E2的學(xué)習(xí),除了所使用的樣品圖像群不同這一點(diǎn)之外,均與用來得到第1參照數(shù)據(jù)E1的學(xué)習(xí)相同,因此這里省略詳細(xì)說明。
眼睛檢測執(zhí)行部34,在通過面部檢測部20所得到的面部圖像S1中,對構(gòu)成多種像素群的各個像素中的特征量C0的所有組合,都參照第2參照數(shù)據(jù)E2所學(xué)習(xí)的識別條件,對構(gòu)成各個像素群的各個像素中的特征量C0的組合求出識別點(diǎn),將所有的識別點(diǎn)綜合起來,識別出面部所含有的眼睛位置。此時,作為特征量C0的梯度矢量K的方向被4值化,大小被3值化。
這里,眼睛檢測執(zhí)行部34,將通過面部檢測部20所得到的面部圖像S1的大小階段性縮放,同時在平面上階段性旋轉(zhuǎn)360度,在各個階段縮放了的面部圖像上,設(shè)定30×30像素大小的遮蔽框M,在被縮放了的面部中遮蔽框M一個個移動像素,進(jìn)行遮蔽框內(nèi)的圖像中的眼睛位置的檢測。
另外,作為第2參照數(shù)據(jù)E2的生成時所學(xué)習(xí)的樣品圖像,使用雙眼中心位置的像素?cái)?shù)為9.07、10、10.3像素的圖像,因此在縮放面部圖像S1時,可以將放大率設(shè)為10.3/9.7。另外,作為第2參照數(shù)據(jù)E2的生成時所學(xué)習(xí)的樣品圖像,使用面部在平面上在±3度的范圍內(nèi)旋轉(zhuǎn)的圖像,因此面部圖像可以以6度為單位進(jìn)行360度旋轉(zhuǎn)。
另外,第2特征量計(jì)算部32,在面部圖像S1的放大縮小以及旋轉(zhuǎn)等變形的各個階段,計(jì)算出特征量C0。
這樣,本實(shí)施方式中,在面部圖像S1的變形的所有階段將所有的識別點(diǎn)相加,在相加值最大的變形階段中的30×30像素的遮蔽框M內(nèi)的圖像中,設(shè)定以左上角為原點(diǎn)的坐標(biāo),求出對應(yīng)于樣品圖像中的眼睛位置的坐標(biāo)(x1,y1)、(x2,y2)的位置,將變形前的面部圖像S1中的與該位置相對應(yīng)的位置作為眼睛位置檢測出來。
眼睛檢測部30,像這樣從面部檢測部20所得到的面部圖像S1,分別檢測出雙眼的位置。
平滑處理部50,為了讓后述的膚色區(qū)域的抽出容易進(jìn)行,而對面部圖像S1實(shí)施平滑化處理,本實(shí)施方式的圖像處理系統(tǒng)中,例如將高斯濾波器作為平滑化處理濾波器適用于面部圖像S1,從而得到平滑面部圖像S2。另外,這里平滑處理部50對面部圖像S1在R、G、B通道(channel)的每一個中都實(shí)施平滑化處理。
基準(zhǔn)區(qū)域設(shè)定部60,在面部圖像S1中,將可靠地為膚色的區(qū)域設(shè)為膚色基準(zhǔn)區(qū)域,這里,在從眼睛附近位置中的比眼睛下邊緣靠下的位置,到鼻尖附近的位置中的、比鼻尖靠上的位置之間的范圍內(nèi),設(shè)定基準(zhǔn)區(qū)域。具體地說,基準(zhǔn)區(qū)域設(shè)定部60,首先根據(jù)眼睛檢測部30所得到的雙眼各自位置(圖15中所示的點(diǎn)A1以及點(diǎn)A2),計(jì)算出面部圖像S1中的雙眼間距D。這樣,由于人的面部中的各個部分間的距離因人而異,因此利用雙眼間的距離與連接雙眼的線(圖15中所示的虛線L1)到嘴巴之間的垂直距離大致相同這一點(diǎn),推定嘴巴的高度位置(圖15中所示的虛線L3)。最后,根據(jù)鼻尖位于嘴巴與眼睛之間的靠近嘴巴的高度處這一點(diǎn),將雙眼與嘴巴之間的中心位置,推定為鼻尖附近的比鼻尖靠上的高度位置(圖15中所示的虛線L4)。
另外,基準(zhǔn)區(qū)域設(shè)定部60,將在下方距離眼睛的中心點(diǎn)為D/10的位置(圖15中所示的虛線L1),推定為眼睛附近的比眼睛的下邊緣更靠下的高度位置。
基準(zhǔn)區(qū)域設(shè)定部60,在這樣所得到的線L1與線L4之間的區(qū)域內(nèi)設(shè)定基準(zhǔn)區(qū)域。由于線L1位于眼睛的下邊緣的下方,線L4位于鼻尖上方,因此線L1與線L4之間可以排除睫毛、瞳孔、嘴巴四周的胡須等,因此如果位于該區(qū)域內(nèi),則任一個部位都可以可靠地說是膚色,但本實(shí)施方式中,為了避免臉頰外側(cè)有胡須的情況的影響,而在線L1與線L4之間的區(qū)域中,將具有與雙眼間距D相同寬度,位于左右方向的中心的部位(圖15中所示的虛線部分),設(shè)為基準(zhǔn)區(qū)域。
基準(zhǔn)區(qū)域設(shè)定部60,將表示這樣所設(shè)定的基準(zhǔn)區(qū)域的位置的信息,輸出給膚色區(qū)域抽出部70。
膚色區(qū)域抽出部70用來從平滑面部圖像S2中抽出膚色區(qū)域,圖16為表示其構(gòu)成的圖。如圖所示,膚色區(qū)域抽出部70具有基準(zhǔn)區(qū)域特征量計(jì)算部72與膚色像素抽出部74。
基準(zhǔn)區(qū)域特征量計(jì)算部72,將平滑面部圖像S2中的基準(zhǔn)區(qū)域內(nèi)的圖像的平均色調(diào)角度α作為基準(zhǔn)區(qū)域的特征量計(jì)算出來。
膚色像素抽出部74,如下所述,在平滑面部圖像S2中,抽出具有基準(zhǔn)區(qū)域顏色的近似色的所有像素。具體地說,抽出滿足以下所有條件的像素。
1.R≥G≥K×B(R、G、BR值、G值、B值,K系數(shù))系數(shù)K為0.9~1.0范圍內(nèi)的值,這里是0.95。
2.色調(diào)角度與基準(zhǔn)區(qū)域的平均色調(diào)角度α之間的差為給定的Hue-range閾值(例如20)以下。
膚色區(qū)域抽出部70,將由膚色像素抽出部74所抽出的各個像素所構(gòu)成的區(qū)域作為膚色區(qū)域,將表示該膚色區(qū)域的位置的信息輸出給面部區(qū)域遮蔽框圖像生成部80。
面部區(qū)域遮蔽框圖像生成部80,為了讓面部寬度的檢測較容易進(jìn)行而根據(jù)平滑面部圖像S2生成面部區(qū)域遮蔽框圖像S5,圖17為表示其構(gòu)成的框圖。如圖所示,面部區(qū)域遮蔽框圖像生成部80,具有2值化圖像生成部82、去噪部84、橫向不連續(xù)區(qū)域去除部86,這里對其各個構(gòu)成進(jìn)行詳細(xì)說明。
2值化圖像生成部82,根據(jù)表示膚色區(qū)域抽出部70所抽出的膚色區(qū)域的位置的信息,對平滑面部圖像S2,將位于膚色區(qū)域中的像素變換成白色(也即將該像素的像素值變換成動態(tài)范圍內(nèi)的最大值例如255),將位于非膚色區(qū)域(也即膚色區(qū)域以外的區(qū)域)的像素變換成黑色(也即將該像素的像素值設(shè)為0),得到如圖18(a)所示的2值化圖像S3。
去噪部84,為了讓面部寬度的檢測較容易進(jìn)行,而對圖18(a)所例示的2值化圖像S3進(jìn)行去噪,得到去噪完成圖像S4。這里,作為去噪部84的去除對象的噪聲,不但包括通常意味的噪聲,還包括給面部寬度檢測帶來困難,或有可能導(dǎo)致不正確檢測結(jié)果的噪聲。本實(shí)施方式的圖像處理系統(tǒng)中,去噪部84,如下進(jìn)行去噪。
1.孤立小區(qū)域的去除這里,孤立小區(qū)域是指,被膚色區(qū)域所包圍的、與其他非膚色區(qū)域孤立的給定閾值以下大小的區(qū)域,例如可以列舉出面部中的眼睛(瞳孔)、鼻孔等。另外,圖18(a)所示的例子中,額部的黑色點(diǎn)狀噪聲也是孤立區(qū)域。
去噪部84,對2值化圖像S3,通過將這樣的孤立小區(qū)域的像素變成白色來進(jìn)行去除。
2.細(xì)長區(qū)域的去除這里,細(xì)長區(qū)域是指在橫向上延長的細(xì)長的黑色區(qū)域。去噪部84,對2值化圖像S3進(jìn)行將面部的縱向與橫向分別作為主掃描方向與副掃描方向的掃描,檢測出這樣的細(xì)長區(qū)域,同時,將所檢測出的區(qū)域的像素變成白色,通過這樣來進(jìn)行去除。
這樣一來,能夠?qū)⒀坨R框、眉毛、覆蓋面部的胡須等都去除。
圖18(b)中顯示了通過去噪部84所得到的去噪完成圖像S4的例子。
橫向不連續(xù)區(qū)域去除部86,進(jìn)行對去噪部84所得到的去噪完成了的圖像S4,在橫向上去除不連續(xù)的膚色區(qū)域的處理,得到面部區(qū)域遮蔽框圖像S5。具體地說,對去噪完成圖像S4,進(jìn)行將面部的縱向與橫向分別作為主掃描方向與副掃描方向的掃描,檢測出膚色區(qū)域(也即白色區(qū)域)在橫向上不連續(xù)的位置,同時,將所檢測出的位置的左右兩側(cè)中的距離膚色區(qū)域的中心部較遠(yuǎn)一側(cè)的膚色區(qū)域的像素變成黑色,通過這樣來進(jìn)行去除。
圖18(c)顯示了對圖18(b)所示的例子中的去噪完成圖像S4進(jìn)行了橫向不連續(xù)區(qū)域的去除所得到的面部區(qū)域遮蔽框圖像S5。如圖所示,在面部區(qū)域遮蔽框圖像S5中,將上耳根上方的耳朵部分,與下耳根下方的耳朵部分的像素變成黑色。
面部寬度取得部90,使用面部區(qū)域遮蔽框圖像S5取得面部的寬度W,圖19為說明其構(gòu)成的框圖。如圖所示,面部寬度取得部90具有掃描部92與面部寬度決定部94。掃描部92,對如圖18(c)所示的面部區(qū)域遮蔽框圖像S5,進(jìn)行將面部的橫向與縱向分別作為主掃描方向與副掃描方向的掃描,檢測出各個副掃描位置(也即面部縱向的位置)中的白色區(qū)域的寬度W1、W2、…。面部寬度決定部94,首先根據(jù)這些寬度W1、W2、…沿著縱向變化的狀態(tài),將寬度不連續(xù)增加的副掃描位置(也即上耳根的縱向位置)設(shè)為第1位置,同時,將比第1位置靠下的,位于寬度不連續(xù)減少的副掃描位置(也即下耳根的縱向位置)的上一個副掃描位置,作為第2位置進(jìn)行檢測。之后,面部寬度決定部94,將第1位置到第2位置的范圍內(nèi)的各個副掃描位置的寬度中,最大的寬度決定為面部的寬度W。
圖20為說明圖1中所示的實(shí)施方式的圖像處理系統(tǒng)中所進(jìn)行的處理的流程圖。如圖所示,本實(shí)施方式的圖像處理系統(tǒng)中,對圖像輸入部10所輸入的面部照片圖像S0,首先,由面部檢測部20進(jìn)行用來檢測出面部的大致位置以及大小的面部檢測(S10、S15)。對面部檢測部20所得到的面部圖像S1,進(jìn)一步由眼睛檢測部30檢測出雙眼的位置(S30)。之后,由基準(zhǔn)區(qū)域設(shè)定部60,根據(jù)雙眼的位置,設(shè)定用來抽出膚色區(qū)域的基準(zhǔn)區(qū)域(S35)。與眼睛檢測部30和基準(zhǔn)區(qū)域設(shè)定部60的處理并行,通過平滑處理部50進(jìn)行面部圖像S1的平滑化處理,得到平滑面部圖像S2(S20)。膚色區(qū)域抽出部70計(jì)算出由基準(zhǔn)區(qū)域設(shè)定部60所設(shè)定的基準(zhǔn)區(qū)域的平均色調(diào)角度α,從面部圖像S1抽出色調(diào)角度與該平均色調(diào)角度α之間的差在給定閾值以下的像素作為膚色像素,得到由這些膚色像素所構(gòu)成的膚色區(qū)域(S40)。面部區(qū)域遮蔽框圖像生成部80,對面部圖像S1進(jìn)行去噪以及不連續(xù)區(qū)域的去除等處理,得到面部區(qū)域遮蔽框圖像S5(S45)。面部寬度取得部90,首先對面部區(qū)域遮蔽框圖像S5,進(jìn)行分別以面部的橫向與縱向?yàn)橹鲯呙璺较蚺c副掃描方向的掃描,檢測出各個副掃描位置中的白色區(qū)域的寬度W1、W2、…,同時,根據(jù)這些寬度W1、W2、…沿著縱向變化的狀態(tài),將寬度不連續(xù)增加的副掃描位置檢測為第1掃描位置,將位于第1位置下的比寬度不連續(xù)減少的副掃描位置高一個的副掃描位置,檢測為第2掃描位置。之后,將從第1位置到第2位置的范圍內(nèi)的各個副掃描位置的寬度中,最大的寬度決定為面部的寬度W(S50)。
這樣,本實(shí)施方式的圖像處理系統(tǒng),著眼于人的面部中,位于從上耳根到下耳根之間的范圍內(nèi)的各個縱向上的寬度,比面部的其他部分的寬度大這一點(diǎn),檢測出該范圍,同時取得該范圍內(nèi)的各個位置中的寬度中的最大的寬度,作為面部的寬度。通過這樣,能夠可靠且準(zhǔn)確地取得面部的寬度,從而能夠進(jìn)行需要面部寬度的處理,例如用來制作對面部寬度進(jìn)行了規(guī)定的規(guī)格的證件照片的裁剪處理、用來制作需要將多個面部照片圖像中的各個面部的大小統(tǒng)一起來的畢業(yè)相冊的裁剪處理等。
另外,本實(shí)施方式的圖像處理系統(tǒng)中,在檢測出攝制在面部照片圖像中的面部的膚色區(qū)域時,將該面部照片圖像中的面部的可靠地是膚色的區(qū)域設(shè)為基準(zhǔn)區(qū)域,將具有與該基準(zhǔn)區(qū)域的顏色相近的顏色的像素的區(qū)域,作為膚色區(qū)域檢測出來,因此盡管因人種或日曬長度等而存在膚色的個人差別,也能夠可靠地檢測出膚色區(qū)域,從而能夠準(zhǔn)確檢測出面部的寬度。
以上對本發(fā)明的圖像處理方法與裝置以及用于此的程序的最佳實(shí)施方式進(jìn)行了說明,但本發(fā)明的圖像處理方法與裝置以及程序,并不僅限于上述實(shí)施方式,在不脫離本發(fā)明的要點(diǎn)的范圍內(nèi),可以進(jìn)行各種增減、變更。
例如,膚色區(qū)域的檢測方法,除了通過上述實(shí)施方式的圖像處理系統(tǒng)中的膚色區(qū)域抽出部70所進(jìn)行的方法之外,還可以使用其他方法。具體地說,例如可以將R值、G值、B值分別設(shè)為R、G、B,在將通過‘r=R(R+G+B),g=G/(R+G+B)’所表示的r、g作為兩個坐標(biāo)軸的二維平面中,將具有包括在根據(jù)基準(zhǔn)區(qū)域的各個像素的像素值所設(shè)定的膚色范圍內(nèi)的顏色的像素,作為膚色像素檢測出來。膚色范圍,例如可以通過求出基準(zhǔn)區(qū)域的平均r值、平均g值,將以該平均r值為中心的給定范圍,與以平均g值為中心的給定范圍合起來的范圍,設(shè)定為膚色范圍。
另外,在決定面部寬度時,也可以將上耳根位置中的寬度,與下耳根位置中的寬度中的較大一方的寬度,決定為面部的寬度。
另外,在圖1所示的實(shí)施方式的圖像處理系統(tǒng)中,自動檢測出面部位置、眼睛位置,但也可以通過用戶的手動來進(jìn)行指定。
另外,在設(shè)定基準(zhǔn)區(qū)域時,并不僅限于圖1中所示的實(shí)施方式的圖像處理系統(tǒng)的方法,例如還可以由用戶指定“是膚色的區(qū)域”,將所指定的區(qū)域設(shè)為基準(zhǔn)區(qū)域。
權(quán)利要求
1.一種圖像處理方法,是檢測出面部照片圖像中所攝制的面部的寬度的圖像處理方法,其特征在于檢測出所述面部中的膚色區(qū)域;取得所檢測出的所述膚色區(qū)域的、沿著從所述面部的頭頂部向下巴的方向的每一個位置的左右寬度;將所述左右寬度不連續(xù)增加的位置設(shè)為第1位置,將比所述第1位置接近下巴且所述左右寬度不連續(xù)減少的位置的1個距離下巴較遠(yuǎn)的位置設(shè)為第2位置,將所述第1位置到所述第2位置之間的范圍內(nèi)的給定位置中的所述左右寬度,決定為所述面部的寬度。
2.如權(quán)利要求1所述的圖像處理方法,其特征在于將所述第1位置到所述第2位置之間的范圍內(nèi)的各位置中的所述左右寬度中、最大的所述左右寬度,決定為所述面部的寬度。
3.如權(quán)利要求1所述的圖像處理方法,其特征在于將所述第1位置中的所述左右寬度,與所述第2位置中的所述左右寬度中的較大一方的所述左右寬度,決定為所述面部的寬度。
4.如權(quán)利要求1~3中任一項(xiàng)所述的圖像處理方法,其特征在于將推定為膚色的區(qū)域作為基準(zhǔn)區(qū)域?qū)λ雒娌吭O(shè)定;從所述面部檢測出具有與所設(shè)定的該基準(zhǔn)區(qū)域的顏色相近似的顏色的像素;將所檢測出的所述像素所構(gòu)成的區(qū)域,檢測為所述膚色區(qū)域。
5.如權(quán)利要求4所述的圖像處理方法,其特征在于將所述面部中的眼睛與鼻尖之間的區(qū)域設(shè)為所述基準(zhǔn)區(qū)域。
6.一種圖像處理裝置,是檢測出面部照片圖像中所攝制的面部的寬度的圖像處理裝置,其特征在于,具有膚色區(qū)域檢測機(jī)構(gòu),其檢測出所述面部中的膚色區(qū)域;每個位置寬度取得機(jī)構(gòu),其取得所檢測出的所述膚色區(qū)域的、沿著從所述面部的頭頂部向下巴的方向的每一個位置的左右寬度;以及面部寬度決定機(jī)構(gòu),其將所述左右寬度不連續(xù)增加的位置設(shè)為第1位置,將比所述第1位置接近下巴且所述左右寬度不連續(xù)減少的位置的1個距離下巴較遠(yuǎn)的位置設(shè)為第2位置,將所述第1位置到所述第2位置之間的范圍內(nèi)的給定位置中的所述左右寬度,決定為所述面部的寬度。
7.如權(quán)利要求6所述的圖像處理裝置,其特征在于所述面部寬度決定機(jī)構(gòu),將所述第1位置到所述第2位置之間的范圍內(nèi)的各位置中的所述左右寬度中、最大的所述左右寬度,決定為所述面部的寬度。
8.如權(quán)利要求6所述的圖像處理裝置,其特征在于所述面部寬度決定機(jī)構(gòu),將所述第1位置中的所述左右寬度,與所述第2位置中的所述左右寬度中的較大一方的所述左右寬度,決定為所述面部的寬度。
9.如權(quán)利要求6~8中任一項(xiàng)所述的圖像處理裝置,其特征在于所述膚色區(qū)域檢測機(jī)構(gòu),具有基準(zhǔn)區(qū)域設(shè)定機(jī)構(gòu),其將推定為膚色的區(qū)域作為基準(zhǔn)區(qū)域?qū)λ雒娌吭O(shè)定;以及膚色像素檢測機(jī)構(gòu),其從所述面部檢測出具有與所設(shè)定的該基準(zhǔn)區(qū)域的顏色相近似的顏色的像素,將所檢測出的所述像素所構(gòu)成的區(qū)域,檢測為所述膚色區(qū)域。
10.如權(quán)利要求9所述的圖像處理裝置,其特征在于所述基準(zhǔn)區(qū)域設(shè)定機(jī)構(gòu),將所述面部中的眼睛與鼻尖之間的區(qū)域設(shè)為所述基準(zhǔn)區(qū)域。
11.一種程序,是一種使計(jì)算機(jī)執(zhí)行檢測出面部照片圖像中所攝制的面部的寬度的面部寬度檢測處理的程序,其特征在于,所述面部寬度檢測處理,包括檢測出所述面部中的膚色區(qū)域的膚色區(qū)域檢測處理;取得所檢測出的所述膚色區(qū)域的、沿著從所述面部的頭頂部向下巴的方向的每一個位置的左右寬度的處理;以及將所述左右寬度不連續(xù)增加的位置設(shè)為第1位置,將比所述第1位置接近下巴且所述左右寬度不連續(xù)減少的位置的1個距離下巴較遠(yuǎn)的位置設(shè)為第2位置,將所述第1位置到所述第2位置之間的范圍內(nèi)的給定位置中的所述左右寬度,決定為所述面部的寬度的處理。
12.如權(quán)利要求11所述的程序,其特征在于所述膚色區(qū)域檢測處理,具有將推定為膚色的區(qū)域作為基準(zhǔn)區(qū)域?qū)λ雒娌吭O(shè)定的處理;以及從所述面部檢測出具有與所設(shè)定的該基準(zhǔn)區(qū)域的顏色相近似的顏色的像素,將由所檢測出的所述像素所構(gòu)成的區(qū)域,檢測為所述膚色區(qū)域的處理。
全文摘要
本發(fā)明提供一種圖像處理方法與裝置以及程序。膚色區(qū)域抽出部(70),從面部照片圖像(S0)中所切出的面部圖像(S1)中抽出膚色區(qū)域。面部寬度取得部(90)對該膚色區(qū)域的圖像,進(jìn)行分別以面部的橫向(連接雙眼的線的延伸方向)與縱向(垂直于橫向的方向)為主掃描方向與副掃描方向的掃描,檢測出各個副掃描位置中的區(qū)域的寬度,同時,根據(jù)該寬度沿著縱向變化的方式,將寬度不連續(xù)增加的副掃描位置檢測為第1位置,將位于比第1位置下的寬度不連續(xù)減少的副掃描位置靠上一個的副掃描位置檢測為第2位置。之后,將第1位置到第2位置之間的范圍內(nèi)的各個副掃描位置的寬度中的最大的寬度,決定為面部的寬度W。從而可檢測出面部照片圖像中所攝制的面部寬度。
文檔編號G06T7/00GK1798237SQ200510022858
公開日2006年7月5日 申請日期2005年12月12日 優(yōu)先權(quán)日2004年12月10日
發(fā)明者陳濤 申請人:富士膠片株式會社