專利名稱:用于處理圖像的方法、裝置和存儲介質(zhì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理,尤其涉及在其中檢測紅眼的圖像處理方法、裝置和存儲介質(zhì)。
背景技術(shù):
紅眼是人的瞳孔周圍不自然紅色調(diào)現(xiàn)象。其通常是由血管反射閃光造成的。目前,有很多識別紅眼的方法。
在識別紅眼的現(xiàn)存方法中,首先在數(shù)字圖像中識別候選紅眼區(qū)域,然后再進行進一步檢測或計算以確定候選紅眼區(qū)域是否是紅眼。通常,用顏色而不是依據(jù)形狀來檢測紅眼。有時候,在圖像中會有一些類似紅眼的區(qū)域,因此僅基于顏色的檢測方法將產(chǎn)生很多假紅眼。在這種情況下,基于顏色的檢測方法的精確度不高。
發(fā)明內(nèi)容
本發(fā)明的目的是提供在其中用形狀檢測紅眼的圖像處理方法、裝置和存儲介質(zhì)。
為了達到以上目的,本發(fā)明提供一種處理圖像的方法,其特征在于包括步驟在所述圖像中識別人臉區(qū)域;在所述人臉區(qū)域中識別候選紅眼區(qū)域;選擇一個至少部分地覆蓋所述候選紅眼區(qū)域并具有與所述人臉區(qū)域相同取向的幾何圖形;計算所述幾何圖形的至少一個特征值;基于所述至少一個特征值,對所述候選紅眼區(qū)域進行分類。
本發(fā)明還提供一種用于處理圖像的裝置,其特征在于包括
人臉區(qū)域識別電路,用于在所述圖像中識別人臉區(qū)域;候選區(qū)識別電路,用于在所述人臉區(qū)域中識別候選紅眼區(qū)域;幾何圖形選擇器,用于選擇至少部分地覆蓋所述紅眼區(qū)域并具有與所述人臉區(qū)域相同取向的幾何圖形;計算器,用于計算所述幾何圖形的至少一個特征值;分類器,用于基于所述至少一個特征值,對所述候選紅眼區(qū)域進行分類。
本發(fā)明還提供一種編有用于處理圖像的機器可讀計算機程序代碼的存儲介質(zhì),該存儲介質(zhì)包括使處理器實現(xiàn)根據(jù)本發(fā)明方法的指令。
根據(jù)本發(fā)明的方法、裝置和存儲介質(zhì),基于至少部分地覆蓋所述紅眼區(qū)域并具有與所述人臉區(qū)域相同取向的幾何圖形的形狀,檢測紅眼。并且僅在已經(jīng)在圖像中檢測到的人臉區(qū)域中檢測紅眼,而不是在整個圖像中檢測紅眼。既提高了檢測紅眼的速度又提高了精確度。
另外,本發(fā)明的方法能夠容易地與各種識別候選紅眼區(qū)域的常規(guī)方法結(jié)合起來以適應(yīng)不同的情況。
結(jié)合附圖,本發(fā)明的其他特點和優(yōu)點,可從下面通過舉例來對本發(fā)明的原理進行解釋的優(yōu)選實施例的說明中變得更為清楚。
圖1是根據(jù)本發(fā)明實施例的圖像處理方法的流程圖;圖2示意性地說明實施例的基本原理;圖3是根據(jù)本發(fā)明另一個實施例的處理圖像的裝置的框圖;圖4A、圖4B和圖4C示出候選紅眼區(qū)域的例子;圖5A、圖5B和圖5C示出候選紅眼區(qū)域的另一個例子;圖6示意性地示出一種可在其中實現(xiàn)圖1所示方法的圖像處理系統(tǒng);圖7示出在圖像中識別眼區(qū)的一個示例方法;
圖8示出在圖像中識別人臉矩形的一個示例方法;圖9示出在圖像中識別候選紅眼區(qū)域的一個示例方法。
具體實施例方式
在下面的說明中,關(guān)于如何識別候選人臉區(qū)域,如何在人臉中識別眼區(qū),可參考中國專利申請第00127067.2號(由同一申請人于2000年9月15日提出申請)、中國專利申請第01132807.X號(由同一申請人于2001年9月6日提出申請)、中國專利申請第02155468.4號(由同一申請人于2002年12月13日提出申請)、中國專利申請第02160016.3號(由同一申請人于2002年12月30日提出申請)、中國專利申請第03137345.3號(由同一申請人于2003年6月18日提出申請)等等。這些申請在此用于參考。然而,這些申請中公開的識別候選人臉區(qū)域的方法、識別眼區(qū)的方法并不對本發(fā)明構(gòu)成限制。任何在圖像中識別候選人臉區(qū)域或識別眼區(qū)的常規(guī)方法都可以在本發(fā)明中使用。
圖7示出在圖像中識別眼區(qū)的一個示例方法。該方法開始于步驟701。然后,在步驟702,將圖像的每一列分割為多個間隔段。
在步驟703中,將鄰近列中的谷區(qū)列合以便生成候選眼區(qū)。然后,在步驟704,確定每個候選眼區(qū)是真眼區(qū)還是假眼區(qū)。
圖8示出在圖像中識別人臉矩形的一個示例方法。該方法開始于步驟801。然后,在步驟802,在圖像中識別兩個眼區(qū),并且基于兩個眼區(qū),識別一個候選人臉矩形。
在步驟803,設(shè)置一個圍繞候選人臉矩形的環(huán)形區(qū)域。在步驟804,計算環(huán)形區(qū)域每個像素的灰度梯度。在步驟805,計算環(huán)形區(qū)域每個像素的參考梯度。在步驟806,計算環(huán)形區(qū)域全部像素的灰度梯度和相應(yīng)的參考梯度的角度平均值。在步驟807,判斷平均角度是否小于第二閾值。如果步驟807的判斷為“否”,則處理轉(zhuǎn)到步驟810;否則,轉(zhuǎn)到步驟808。
在步驟808,判斷加權(quán)平均角度是否小于第三閾值。如果步驟808的判斷為“否”,則處理轉(zhuǎn)到步驟810;否則轉(zhuǎn)到步驟809。
在步驟809,將候選人臉矩形分類為人臉矩形(即,真人臉)。在步驟810,將候選人臉矩形分類為假人臉矩形(即,假人臉)。
處理結(jié)束于步驟811。
對圖7、圖8中所示方法的更多說明,可以參考中國專利申請第01132807.X號。
圖9示出在圖像中識別候選紅眼區(qū)域的一個示例方法。該方法開始于步驟901。然后在步驟902,識別圖像中的一個眼區(qū)。
在步驟903,在該眼區(qū)識別第一數(shù)目的候選紅眼區(qū)域。為了在眼區(qū)中識別候選紅眼區(qū)域,考慮眼區(qū)中像素的特征值。例如,在步驟903,考慮眼區(qū)中像素的顏色變化,或紋理,或顏色變化和紋理的組合。
在步驟904,使第一數(shù)目候選紅眼區(qū)域縮小。結(jié)果,得到第二數(shù)目的候選紅眼區(qū)域。
根據(jù)縮小處理,估算在每一個第一數(shù)目候選紅眼區(qū)域中的每一個像素的至少一個特征值。如果估算的特征值不滿足為紅眼像素設(shè)定的標(biāo)準(zhǔn),則從相應(yīng)的候選紅眼區(qū)域中刪除被估算的像素。這樣,使第一數(shù)目候選紅眼區(qū)域中大多數(shù)的面積縮小。如果一個候選紅眼區(qū)域中的所有像素都已刪除,則該候選紅眼區(qū)域就不復(fù)存在并不再被考慮。
這樣,第二數(shù)目,即步驟904執(zhí)行之后候選紅眼區(qū)域的總數(shù)目,可能小于第一數(shù)目,即步驟904執(zhí)行之前候選紅眼區(qū)域的總數(shù)目。
在步驟905,使第二數(shù)目的候選紅眼區(qū)域擴大。結(jié)果,獲得第三數(shù)目的候選紅眼區(qū)域。
在該步驟中,考慮每個第二數(shù)目的候選紅眼區(qū)域的邊界像素?!斑吔缦袼亍敝肝挥诤蜻x紅眼區(qū)域邊界的像素。如果邊界像素鄰近區(qū)域中的像素符合為紅眼像素設(shè)定的標(biāo)準(zhǔn),則將這些像素包括到相關(guān)的候選紅眼區(qū)域中。這樣,使第二數(shù)目候選紅眼區(qū)域中大多數(shù)的面積增加,并且一些候選紅眼區(qū)域可能不可避免地相互合并起來。這引入了步驟905的另一項功能。
步驟905的另一功能是選擇性地刪除合并的候選紅眼區(qū)域,選擇性地結(jié)合合并的候選紅眼區(qū)域,或選擇性地保持合并的候選紅眼區(qū)域中的一個而刪除其他區(qū)域。
不再考慮刪除的候選紅眼區(qū)域。
這樣,第三數(shù)目,即步驟905執(zhí)行之后候選紅眼區(qū)域的總數(shù)目,可能小于第二數(shù)目,即步驟905執(zhí)行之前候選紅眼區(qū)域的總數(shù)。
在步驟906,選擇不多于一個的候選紅眼區(qū)域作為在眼區(qū)中檢測到的紅眼區(qū)域。
在步驟906,估算第三數(shù)目候選紅眼區(qū)域中像素的多個特征值?;诠浪愕慕Y(jié)果,刪除大部分第三數(shù)目候選紅眼區(qū)域。然后給左邊候選紅眼區(qū)域打分,并且只進一步考慮具有最高分的候選紅眼區(qū)域。如果唯一的具有最高分的候選紅眼區(qū)域滿足標(biāo)準(zhǔn),則將其選擇作為當(dāng)前眼區(qū)中檢測到的紅眼區(qū)域。否則,在當(dāng)前眼區(qū)中未檢測到紅眼區(qū)域。
在步驟907,該處理結(jié)束。
對圖9中示出的方法的更多說明,可以參考中國專利申請第200310116034.9號。
圖1是根據(jù)本發(fā)明實施例的圖像處理方法的流程圖。
如圖1所示,處理開始于步驟101。然后,在步驟102,在將被處理的圖像中識別人臉區(qū)域。然后,在步驟103,在人臉區(qū)域中識別候選紅眼區(qū)域。在圖像中識別人臉區(qū)域的不同方法和在人臉區(qū)域中識別候選紅眼區(qū)域的不同方法對本發(fā)明不構(gòu)成限制。
然后,在步驟104,為候選紅眼區(qū)域選擇一個外接矩形。由于候選紅眼區(qū)域的形狀是不確定的,因此理論上可以有無限多個候選紅眼區(qū)域的外接矩形。在步驟104,在這些無限的外接矩形中,只選擇一個。所選擇的外接矩形的四邊中的一邊與人臉區(qū)域四邊中的一邊平行。
在步驟105,為所選擇的外接矩形計算至少一個特征值。例如,該至少一個特征值包括任何一個或多個以下值。
(1)外接矩形的寬度(W1);(2)外接矩形的高度(H1);(3)外接矩形的寬高比,將其定義為AR=W1/H1;(4)外接矩形的面積,將其定義為A1=W1*H1;(5)外接矩形的面積比,將其定義為F1=(候選紅眼區(qū)域的面積)/A1。
以上特征值僅是例子。除了以上特征值外,在本發(fā)明中也可考慮其他的值。被選擇的外接矩形的不同種類特征值、所選擇的外接矩形的不同取向和人臉區(qū)域的不同形狀對本發(fā)明不夠成限制。
然后,在步驟106,判斷外接矩形的寬高比(即,AR)是否在第一范圍中。例如,第一范圍為(1/3,3)。如果步驟106的結(jié)果為“否”,則處理轉(zhuǎn)到步驟111;否則轉(zhuǎn)到步驟107。
在步驟107,判斷外接矩形的面積比(即,F(xiàn)1)是否大于第一預(yù)定值。例如,第一預(yù)定值為0.5。如果步驟107的結(jié)果為“否”,則處理轉(zhuǎn)到步驟111,否則轉(zhuǎn)到步驟108。
在步驟108,判斷外接矩形的寬度(即,W1)和高度(即,H1)是否小于瞳孔的寬度。例如,可將瞳孔的寬度定義為人臉區(qū)域?qū)挾鹊?/5。在此,可將人臉區(qū)域的寬度定義為人臉區(qū)域的寬度和人臉區(qū)域高度的最小值。如果步驟108的結(jié)果為“否”,則處理轉(zhuǎn)到步驟111;否則處理轉(zhuǎn)到步驟109。
在步驟109,判斷外接矩形的面積(即,A1)是否小于瞳孔面積乘以第二預(yù)定值。例如,第二預(yù)定值為0.35,并且可將瞳孔的面積定義為瞳孔寬度的平方。如果步驟109的結(jié)果為“否”,則處理轉(zhuǎn)到步驟111;否則轉(zhuǎn)到步驟110。
包括在圖1中的虛線框中的判斷框106、107、108和109的組合僅是一個例子。在圖1中,可使用框106、107、108和109的任何組合,并且甚至也可使用在框106、107、108和109中的單個框。因此,如圖1所示的框106、107、108和109的組合對本發(fā)明不構(gòu)成限制。此外,圖1中的虛線框中也可包括有關(guān)其他值的判斷框。
在步驟111,將候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
在步驟110,將候選紅眼區(qū)域分類為真紅眼,或很可能是真紅眼的候選區(qū)。
步驟111和110之后是步驟112。
在步驟112,處理結(jié)束。
除了候選紅眼區(qū)域的外接矩形以外,還可在步驟105選擇其他至少部分地覆蓋紅眼區(qū)域并具有與所述人臉區(qū)域相同取向的幾何圖形,并且可在步驟105計算這些其他幾何圖形相應(yīng)的特征值。
例如,這種其他幾何圖形之一可以是候選紅眼區(qū)域的外接矩形的內(nèi)接橢圓。為了識別這種內(nèi)接橢圓,可以采取以下步驟。
首先,在人臉區(qū)域的坐標(biāo)系中,獲得包括在候選紅眼區(qū)域中所有像素的最大X坐標(biāo)(max_x)、最小X坐標(biāo)(min_x)、最大Y坐標(biāo)(max_y)、和最小Y坐標(biāo)(min_y)。
其次,令橢圓中心為[(max_x+min_x)/2,(max_y+min_y)/2];令橢圓的長軸為(max_x-min_x+1)/2;以及令橢圓的短軸為(max_y-min_y+1)/2。
然后構(gòu)造橢圓。
橢圓特征值可包括橢圓的長軸與短軸的比。如果長軸和短軸的比在第一范圍1/3到3之外,則將候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
橢圓的特征值也可以包括橢圓的面積比。如果面積比小于第一預(yù)定值,則將候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。面積比是既包括在候選紅眼區(qū)域又包括橢圓中的像素個數(shù)與橢圓面積的比。第一預(yù)定值為0.5。
橢圓的特征值也可包括橢圓的長軸和橢圓的短軸。如果橢圓的長軸大于瞳孔的寬度,則將候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。并且,如果橢圓的短軸大于瞳孔的寬度,則將候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。瞳孔的寬度為人臉區(qū)域?qū)挾群腿四槄^(qū)域高度最小值的五分之一。
橢圓的特征值也可以包括橢圓的面積。如果橢圓的面積小于瞳孔的面積乘以第二預(yù)定值,則將候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。第二預(yù)定值為0.3。瞳孔的面積為瞳孔寬度的平方。瞳孔寬度為人臉區(qū)域?qū)挾群腿四槄^(qū)域高度最小值的五分之一。
圖2示意性地示出本實施例的基本原理。
如圖2所示,參考標(biāo)號201表示人臉區(qū)域,參考標(biāo)號202表示候選紅眼區(qū)域,參考標(biāo)號203表示候選紅眼區(qū)域202的外接矩形,參考標(biāo)號204表示候選紅眼區(qū)域的另一個外接矩形。
以下參考圖1和圖2描述本實施例的基本原理。
最初,在將被處理的圖像中識別人臉區(qū)域201。
然后,例如,在人臉區(qū)域201中識別候選紅眼區(qū)域202??梢杂卸鄠€可能在人臉區(qū)域201中識別的候選紅眼區(qū)域202。圖2示出的只是一個例子。
候選紅眼區(qū)域202有多個外接矩形,包括外接矩形203和204。在這些外接矩形中,只有一個特定外接矩形與人臉區(qū)域201取向相同。也就是說,如果人臉區(qū)域201是矩形,那么只有一個一邊與人臉區(qū)域201一邊平行的特定外接矩形。圖2中,此特定外接矩形表示為203。本發(fā)明中選擇此特定外接矩形以便進一步處理。
如圖2所示,將人臉區(qū)域201的寬度表示為W。將人臉區(qū)域201的高度表示為H。為簡單起見,當(dāng)然可將人臉區(qū)域201的寬度定義為W和H的最小值。
將外接矩形203的寬度表示為W1。將外接矩形203的高度表示為H1。將外接矩形203的寬高比定義為W1/H1。將外接矩形203的面積定義為W1×H1。將外接矩形203的面積比定義為候選紅眼區(qū)域202的面積在外接矩形203中的百分比,即(候選紅眼區(qū)域202的面積)/(W1×H1)。
根據(jù)本發(fā)明計算外接矩形203的以上特征值和任何其他的特征值。
基于外接矩形203的一個或多個計算出的特征值,將候選紅眼區(qū)域202分類為假紅眼,或很可能是假紅眼的候選區(qū),真紅眼,或很可能是真紅眼的候選區(qū)。
圖3是根據(jù)本發(fā)明另一個實施例的圖像處理裝置的框圖。
在圖3中,參考標(biāo)號301表示人臉區(qū)域識別電路,參考標(biāo)號302表示候選區(qū)識別電路,參考標(biāo)號303表示幾何圖形選擇器,參考標(biāo)號304表示特征值計算器,參考標(biāo)號305表示分類器。
人臉區(qū)域識別電路301,接收將被處理的圖像,并且在接收到的圖像中識別人臉區(qū)域。候選區(qū)識別電路302在人臉區(qū)域識別電路301所輸出的人臉區(qū)域中識別候選紅眼區(qū)域。幾何圖形選擇器303選擇一個至少部分地覆蓋所述紅眼區(qū)域并具有與人臉區(qū)域相同取向的幾何圖形。
特征值計算器304為幾何圖形選擇器303選擇的幾何圖形計算至少一個特征值。這里,至少一個特征值具有與參考圖1和參考圖2的描述相同的含義。
如果幾何圖形是候選紅眼區(qū)域的外接矩形,則特征值計算器304計算任何一個或多個以下值(1)外接矩形的寬度(W1);(2)外接矩形的高度(H1);(3)外接矩形的寬高比,將其定義為AR=W1/H1;(4)外接矩形的面積,將其定義為A1=W1*H1;(5)外接矩形的面積比,將其定義為F1=(候選紅眼區(qū)域的面積)/A1。
如果幾何圖形是候選紅眼區(qū)域的外接矩形的內(nèi)接橢圓,則特征值計算器304計算任何一個或多個以下值(1)內(nèi)接橢圓的長軸(Xaxis);(2)內(nèi)接橢圓的短軸(Yaxis);
(3)內(nèi)接橢圓的長軸與短軸的比,將其定義為Xaxis/Yaxis;(4)內(nèi)接橢圓的面積(EllipseArea);(5)內(nèi)接橢圓的面積比(EllipseAreaRatio),其定義為(既包括在候選紅眼區(qū)域又包括在橢圓中的像素個數(shù))/EllipseArea。
以上特征值僅是例子。除了以上特征值以外,特征值計算器304也可計算其他值。為所選擇外接矩形計算的不同種類特征值對本發(fā)明不構(gòu)成限制。
基于由特征值計算器304輸出的至少一個特征值,分類器305將候選區(qū)識別電路302輸出的候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū),真紅眼,或很可能是真紅眼的候選區(qū)。
候選紅眼區(qū)域的分類條件與相對于圖1的說明相同。
雖然圖3示出,將候選區(qū)識別電路302已經(jīng)識別的候選紅眼區(qū)域輸入到分類器305,但是在實踐中不是必須的。這里重要的是,當(dāng)分類器305從特征值計算器304接收輸出(即,候選紅眼區(qū)域的所選擇的幾何圖形的特征值)時,分類器305知道將被分類的候選紅眼區(qū)域。
分類器305的分類結(jié)果可用于進一步處理圖像。
應(yīng)該注意,特征值計算器304可以為候選紅眼區(qū)域所選擇的幾何圖形計算任何特征值,特征值計算器304輸出的特征值只要足以使分類器305將候選紅眼區(qū)域分類為假紅眼、很可能是假紅眼的候選區(qū)、真紅眼、或很可能是真紅眼的候選區(qū)。
圖4A、圖4B和圖4C示出候選紅眼區(qū)域的一個例子。
圖4A示出原始圖像。圖4B示出在圖4A中示出的圖像中識別的候選紅眼區(qū)域。在圖4B中,計算以下值W1=35(或Xaxis=35);H1=32(或Yaxis=32);A1=W1×H1=1120;W=307;
H=379;瞳孔寬度=1/5×最小值(W,H)=61.4;候選紅眼區(qū)域面積=167;AR=W1/H1=1.09(或Xaxis/Yaxis=1.09);F1=(候選紅眼區(qū)域的面積)/A1=0.15;0.35×square(瞳孔寬度)=1319;EllipseArea=879;EllipseAreaRatio=128/879=0.15;0.3×square(瞳孔寬度)=1130。
由以上顯然可知,F(xiàn)1小于0.5。因此,根據(jù)本實施例將候選紅眼區(qū)域401分類為假紅眼。另外,由于EllipseAreaRatio小于0.5,所以根據(jù)本實施例將候選紅眼區(qū)域401分類為假紅眼。
也就是說,基于現(xiàn)有技術(shù),將圖4B中的候選紅眼區(qū)域401分類為紅眼。然而,如圖4C所示,根據(jù)本發(fā)明沒有將候選紅眼區(qū)域401分類為紅眼。
圖5A、圖5B和圖5C示出候選紅眼區(qū)域的另一個例子。
圖5A示出原始圖像。圖5B示出在圖5A中示出的圖像中識別的候選紅眼區(qū)域501。在圖5B中,計算以下值W1=47(或Xaxis=47);H1=42(或Yaxis=42);A1=W1×H1=1974;W=331;H=411;瞳孔寬度=1/5×最小值(W,H)=66.2;候選紅眼區(qū)域的面積=1111;AR=W1/H1=1.12(或Xaxis/Yaxis=1.12);F1=(候選紅眼區(qū)域的面積)/A1=0.56;0.35×square(瞳孔寬度)=1533;EllipseArea=1550;
EllipseAreaRatio=1028/1550=0.66;0.3×square(瞳孔寬度)=1341。
由以上顯然得知,A1大于0.35×square(瞳孔寬度)。因此根據(jù)本實施例將候選紅眼區(qū)域501分類為假紅眼。另外,由于EllipseArea大于0.3×square(瞳孔寬度),因此根據(jù)本實施例將候選紅眼區(qū)域501分類為假紅眼。
也就是說,基于現(xiàn)有技術(shù),將圖5B中的候選紅眼區(qū)域501分類為紅眼。然而,如圖5C所示,根據(jù)本實施例,沒有將候選紅眼區(qū)域501分類為紅眼。
圖6示意性地示出一種在其中實現(xiàn)圖1方法的圖像處理系統(tǒng)。圖6中的圖像處理系統(tǒng)包括CPU(中央處理器)601、RAM(隨機存取存儲器)602、ROM(只讀存儲器)603、系統(tǒng)總線604、HD(硬盤)控制器605、鍵盤控制器606、串行接口控制器607、并行接口控制器608、顯示控制器609、硬盤610、鍵盤611、照相機612、打印機613和顯示器614。在這些部件中,與系統(tǒng)總線604相連的有CPU 601、RAM 602、ROM 603、HD控制器605、鍵盤控制器606、串行接口控制器607、并行接口控制器608和顯示控制器609。硬盤610與HD控制器605相連,并且鍵盤611與鍵盤控制器606相連,照相機612與串行端口控制器607相連,打印機613與并行接口控制器608相連,以及顯示器614與顯示器控制器609相連。
圖6中每個部件的功能在本技術(shù)領(lǐng)域內(nèi)都是眾所周知的,并且圖6所示的體系結(jié)構(gòu)也是常規(guī)的。這種體系結(jié)構(gòu)不僅適用于個人計算機,而且適用于手持設(shè)備,諸如Palm PC、PDA(個人數(shù)據(jù)助理)、數(shù)碼相機等等。在不同的應(yīng)用中,可省略圖6中所示的某些部件。例如,如果整個系統(tǒng)是數(shù)碼相機,則可省略并行接口控制器608和打印機613,并且該系統(tǒng)可由單片機實現(xiàn)。如果應(yīng)用軟件存儲在EPROM或其他非易失性存儲器中,則可省略HD控制器605和硬盤610。
圖6中所示的整個系統(tǒng)由通常作為軟件存儲在硬盤610中(或如上所述,在EPROM或其他非易失性存儲器中)的計算機可讀指令控制。軟件也可從網(wǎng)絡(luò)(圖中未示出)下載。能夠?qū)⒋鎯υ谟脖P610的或從網(wǎng)絡(luò)下載的軟件加載到RAM 602中,并由CPU 601執(zhí)行,以便實現(xiàn)由軟件限定的功能。
在圖1所示的流程圖基礎(chǔ)上,本技術(shù)領(lǐng)域的技術(shù)人員無需創(chuàng)造性工作即可開發(fā)出一個或更多的軟件。這樣開發(fā)出的軟件將執(zhí)行圖1所示的處理圖像的方法。
在某種意義上,圖6所示的圖像處理系統(tǒng),如果得到根據(jù)圖1所示流程圖開發(fā)出的軟件的支持,則可實現(xiàn)與圖3所示圖像處理裝置相同的功能。
本發(fā)明還提供一種編有用于處理圖像的機器可讀計算機程序的存儲介質(zhì),該存儲介質(zhì)包括使處理器實現(xiàn)根據(jù)本發(fā)明方法的指令。存儲介質(zhì)可為任何有形媒介,例如軟盤、CD-ROM、硬盤驅(qū)動器(例如,圖6中的硬盤610)。
雖然前面參照了本發(fā)明的特定實施方式,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,這些僅是舉例說明,可對這些實施方式作許多改變而不脫離本發(fā)明的原理,本發(fā)明的范圍由所附權(quán)利要求限定。
權(quán)利要求
1.一種處理圖像的方法,其特征在于包括以下步驟在所述圖像中識別人臉區(qū)域;在所述人臉區(qū)域中識別候選紅眼區(qū)域;選擇一個至少部分地覆蓋所述紅眼區(qū)域并具有與所述人臉區(qū)域相同取向的幾何圖形;計算所述幾何圖形的至少一個特征值;基于所述至少一個特征值對所述候選紅眼區(qū)域進行分類。
2.根據(jù)權(quán)利要求1的處理圖像的方法,其特征在于所述幾何圖形是所述候選紅眼區(qū)域的外接矩形。
3.根據(jù)權(quán)利要求2的處理圖像的方法,其特征在于所述至少一個特征值包括所述外接矩形的寬高比,并且如果所述寬高比在第一范圍之外,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
4.根據(jù)權(quán)利要求2的處理圖像的方法,其特征在于所述至少一個特征值包括所述外接矩形的面積比,并且如果所述面積比小于第一預(yù)定值,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
5.根據(jù)權(quán)利要求2的處理圖像的方法,其特征在于所述至少一個特征值包括所述外接矩形的寬度和所述外接矩形的高度,如果所述外接矩形的所述寬度大于瞳孔寬度,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū),并且如果所述外接矩形的所述高度大于所述瞳孔的所述寬度,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
6.根據(jù)權(quán)利要求5的處理圖像的方法,其特征在于所述瞳孔的所述寬度為所述人臉區(qū)域的寬度和所述人臉區(qū)域的高度中的最小值的五分之一。
7.根據(jù)權(quán)利要求2的處理圖像的方法,其特征在于所述至少一個特征值包括所述外接矩形的面積,并且如果所述外接矩形的所述面積小于第二預(yù)定值乘以瞳孔的面積,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
8.根據(jù)權(quán)利要求1的處理圖像的方法,其特征在于所述幾何圖形是所述候選紅眼區(qū)域外接矩形的內(nèi)接橢圓。
9.根據(jù)權(quán)利要求8的處理圖像的方法,其特征在于所述至少一個特征值包括所述內(nèi)接橢圓的長軸和短軸的比,并且如果長軸和短軸的所述比在第一范圍之外,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
10.根據(jù)權(quán)利要求8的處理圖像的方法,其特征在于所述至少一個特征值包括所述內(nèi)接橢圓的面積比,并且如果所述面積比小于第一預(yù)定值,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
11.根據(jù)權(quán)利要求8的處理圖像的方法,其特征在于所述至少一個特征值包括所述內(nèi)接橢圓的長軸和所述內(nèi)接橢圓的短軸,并且如果所述內(nèi)接橢圓的所述長軸大于瞳孔的寬度,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū),并且如果所述內(nèi)接橢圓的所述短軸大于所述瞳孔的所述寬度,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
12.根據(jù)權(quán)利要求11的處理圖像的方法,其特征在于所述瞳孔的所述寬度是所述人臉區(qū)域的寬度和所述人臉區(qū)域的高度中的最小值的五分之一。
13.根據(jù)權(quán)利要求8的處理圖像的方法,其特征在于所述至少一個特征值包括所述內(nèi)接橢圓的面積,并且如果所述內(nèi)接橢圓的所述面積小于瞳孔的面積乘以第二預(yù)定值,則將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
14.一種處理圖像的裝置,其特征在于包括人臉區(qū)域識別電路,用于在所述圖像中識別人臉區(qū)域;候選區(qū)識別電路,用于在所述人臉區(qū)域中識別候選紅眼區(qū)域;幾何圖形選擇器,用于選擇一個至少部分地覆蓋所述紅眼區(qū)域并具有與所述人臉區(qū)域相同取向的幾何圖形;計算器,用于計算所述幾何圖形的至少一個特征值;分類器,用于基于所述至少一個特征值對所述候選紅眼區(qū)域進行分類。
15.根據(jù)權(quán)利要求14的處理圖像的裝置,其特征在于所述幾何圖形是所述候選紅眼區(qū)域的外接矩形。
16.根據(jù)權(quán)利要求15的處理圖像的裝置,其特征在于所述計算器計算所述外接矩形的寬高比,并且如果所述寬高比在第一范圍之外,則所述分類器將所述候選紅眼區(qū)域分類為假紅眼,或很可能是假紅眼的候選區(qū)。
17.根據(jù)權(quán)利要求14的處理圖像的裝置,其特征在于所述幾何圖形是所述候選紅眼區(qū)域的外接矩形的內(nèi)接橢圓。
18.一種編有處理圖像的機器可讀計算機程序代碼的存儲介質(zhì),該存儲介質(zhì)包括用于使處理器實現(xiàn)根據(jù)權(quán)利要求1到13中任何一項的方法的指令。
全文摘要
本發(fā)明提供一種處理圖像的方法,其特征在于包括步驟在所述圖像中識別人臉區(qū)域;在所述人臉區(qū)域中識別候選紅眼區(qū)域;選擇一個至少部分覆蓋所述紅眼區(qū)域并具有與所述人臉區(qū)域相同取向的幾何圖形;為所述幾何圖形計算至少一個特征值;基于所述至少一個特征值對所述候選紅眼區(qū)域進行分類。僅在臉部圖像中基于形狀對紅眼進行檢測。提高了檢測的速度和精度。
文檔編號G06K9/34GK1734465SQ200410055168
公開日2006年2月15日 申請日期2004年8月9日 優(yōu)先權(quán)日2004年8月9日
發(fā)明者張鉞 申請人:佳能株式會社