專利名稱:圖像壓縮域上的人體膚色區(qū)域檢測方法
技術領域:
本發(fā)明涉及一種圖像中人體膚色區(qū)域檢測的方法,特別涉及一種JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法。
背景技術:
圖像中一類重要的信息是人的信息,人類的皮膚是人類的重要生理特征。快速而準確地檢測圖像中的人體膚色區(qū)域在人臉檢測和敏感圖像過濾等應用中有重要的理論和實用價值。
JPEG(Joint Photographic Experts Group)是國際標準化組織(ISO)下的靜態(tài)圖像壓縮標準制定委員會所制定的國際靜態(tài)圖像壓縮標準。由于JPEG對圖像靜態(tài)壓縮的優(yōu)良品質(zhì),使得它獲得了極大的成功。目前網(wǎng)站上百分之八十的圖像都是采用JPEG的壓縮標準。
由于JPEG的廣泛適用性,在對人體膚色進行檢測時,不可避免地要求對采用JPEG標準壓縮的圖像進行膚色區(qū)域檢測。在現(xiàn)有的膚色區(qū)域檢測方法中,對于采用JPEG標準壓縮的圖像,膚色檢測的主要步驟為1)對待檢測的JPEG圖像進行哈夫曼解碼,得到每個圖像塊DCT系數(shù);2)對每個圖像塊再進行反DCT解碼,把圖像解壓到像素域,實現(xiàn)對圖像的完全解壓縮;3)對完全解壓縮后的圖像逐像素地進行膚色檢測,判別。
以上只是對現(xiàn)有的膚色區(qū)域檢測方法做簡要的描述,關于膚色區(qū)域檢測方法的詳細信息可參見參考文獻11999年在Computer Vision and Pattern Recognition會議上,Jones等人的論文“Statistical Color Models with application to skindetection”。
現(xiàn)有的檢測方法需要先把圖像完全解壓縮到像素域才能進行膚色檢測,在完全解壓縮的過程中,對每個圖像塊在進行反DCT解碼時運算復雜度高,而且檢測過程是逐像素地進行,只考慮了顏色信息,沒有考慮紋理信息,這就導致膚色檢測需要很大的計算量并且檢測精度不高。
如果對現(xiàn)有的人體區(qū)域膚色檢測方法的操作步驟加以簡化,并充分考慮紋理信息,就能夠降低膚色檢測的計算量,并提高檢測的精度。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法,克服現(xiàn)有檢測方法中操作步驟復雜、計算量大的缺陷,實現(xiàn)對人體膚色區(qū)域的快速檢測。
本發(fā)明的又一個目的是提供一種JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法,克服現(xiàn)有檢測方法中膚色區(qū)域檢測精度不高的缺陷,實現(xiàn)對人體膚色區(qū)域的精確檢測。
為實現(xiàn)上述目的,本發(fā)明提供了一種JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法,該方法包括以下步驟a)初始化系統(tǒng)參數(shù),系統(tǒng)參數(shù)包括紋理特征閾值,膚色概率閾值,圖像塊大小,人體膚色分布模型;b)對待檢測的JPEG圖像進行哈夫曼解碼和反量化,并將待檢測的JPEG圖像分解為圖像塊,得到Y(jié),Cb,Cr顏色分量上各個圖像塊對應的DCT系數(shù);c)利用步驟b)得到的DCT系數(shù)計算每個圖像塊的顏色特征和紋理特征;d)利用步驟c)得到的顏色特征與步驟a)中設定的人體膚色分布模型,計算每個圖像塊的膚色概率;e)根據(jù)膚色概率和紋理特征判斷每個圖像塊是否是人體膚色區(qū)域。
上述技術方案中,在步驟a)中,所述的圖像塊大小的取值為下列三者之一8×8,4×4,2×2。
上述技術方案中,在步驟c)中,所述的圖像塊的顏色特征在Y,Cb,Cr三個顏色分量上的值分別是該圖像塊在對應的顏色分量上的DCT系數(shù)中的DC系數(shù)除以圖像塊的像素塊中的像素個數(shù)的平方根。
上述技術方案中,在步驟c)中,所述的圖像塊的紋理特征的值是該像素塊Y顏色分量上DCT系數(shù)中非零AC系數(shù)的平方和除以像素塊中的像素個數(shù)。
上述技術方案中,在步驟e)中,判斷圖像塊為人體膚色區(qū)域的標準是該圖像塊的膚色概率在設定的膚色概率閾值的范圍之內(nèi)并且紋理特征在設定的紋理特征閾值的范圍之內(nèi)。
本發(fā)明方法的優(yōu)點在于1、本發(fā)明方法不需要把圖像完全解壓縮,直接在壓縮碼流上操作,簡化了操作步驟,提高了人體膚色區(qū)域檢測的速度。
2、在檢測過程中充分考慮了檢測圖像的紋理信息,提高了人體膚色區(qū)域檢測的精度。
圖1為本發(fā)明方法的流程2為一個4×4大小的圖像塊的DCT系數(shù)示意圖具體實施方式
下面參照附圖和具體實施方式
對本發(fā)明所述方法進行詳細描述。
如圖1所示,本發(fā)明的JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法主要包括以下步驟在步驟100中,初始化系統(tǒng)參數(shù)。這些參數(shù)包括紋理特征閾值,膚色概率閥值,圖像塊大小,人體膚色分布模型。紋理特征閾值和顏色特征閾值是由實驗得到的固定值。所述的圖像塊大小是指在做人體膚色區(qū)域檢測時的圖像基本塊的大小,圖像塊大小應該為2的整次冪,且必須是下列三者之一8×8,4×4,2×2;人體膚色分布模型刻畫了各種顏色屬于人體膚色的可能性。各種已有的或?qū)沓霈F(xiàn)的人體膚色分布模型均適用于本發(fā)明方法,如統(tǒng)計膚色模型,單高斯模型。
在步驟200中,對待檢測的JPEG圖像進行哈夫曼解碼和反量化,并將待檢測的JPEG圖像分解為圖像塊,得到Y(jié),Cb,Cr顏色分量上各個圖像塊對應的DCT系數(shù)。
由于彩色JPEG圖像中,每個顏色一般用三個顏色分量來表示,即Y,Cb,Cr.因此每個N×N大小的圖像塊分別對應三個顏色分量上的圖像塊。每個N×N大小圖像塊每個顏色分量上的數(shù)值經(jīng)過離散余弦變換(DCT)后得到對應的離散余弦變換(DCT)系數(shù),該系數(shù)是一個N×N大小的矩陣。該矩陣的第一個系數(shù)是直流(DC)系數(shù),其他系數(shù)稱為交流(AC)系數(shù)。如圖2所示,該圖是一個4×4大小的DCT系數(shù),其中矩陣中的第一個系數(shù)(0,0)為直流(DC)系數(shù),該矩陣中的其他系數(shù)為交流(AC)系數(shù)。
參照JPEG圖像壓縮標準,通過哈夫曼解碼可以得到每個8×8圖像塊對應的DCT系數(shù);在步驟100中可知,圖像塊的大小有三種可能,若步驟100中設定的圖像塊大小是4×4,需要把每個8×8圖像塊分解為4個4×4;若步驟100中設定的圖像塊大小是2×2,需要把每個8×8圖像塊分解為16個2×2圖像塊。將8×8圖像塊分解的過程是在DCT上操作實現(xiàn)的,也就是要根據(jù)原來8×8圖像塊的DCT系數(shù),運算得到每個4×4或2×2的圖像子塊的DCT系數(shù)。
以一個8×8圖像塊為例,對該圖像塊的分解進行說明。
記8×8塊塊對應的DCT系數(shù)為D88;對應的四個4×4塊的DCT系數(shù)為D441,D442,D443,D444;對應的16個2×2塊的DCT系數(shù)為D221,D222,D223,D224,D225,D226,D227,D228,D229,D2210,D2211,D2212,D2213,D2214,D2215,D2216。D88是8×8的矩陣,D441~D444都是4×4的矩陣,D221~D2216都是2×2矩陣。
8×8塊分解為4個4×4塊的方法如下D441D442D443D444=2×D84×D88×D84T]]>其中D84是轉(zhuǎn)換矩陣,D84T是其轉(zhuǎn)置矩陣。D84是一個固定值,它的值為0.50.45310-0.159100.10630-0.090100.20790.50.39550-0.176200.13890-0.037300.25660.50.38410-0.187700.0110-0.048800.24520.50.43290.5-0.453100.15910-0.106300.090100.2079-0.50.39550-0.176200.138900.03730-0.25660.50.384100.187700.01140-0.048800.2452-0.50.4329]]>4×4塊分解為2×2塊的方法如下D221D222D223D222=2×D42×D441×D42T]]>D225D226D227D228=2×D42×D442×D42T]]>D229D2210D2211D2212=2×D42×D443×D42T]]>D2213D2214D2215D2216=2×D42×D444×D42T]]>其中D42是轉(zhuǎn)換矩陣,D42T是其轉(zhuǎn)置矩陣。
D42是一個固定值,它的值為
0.50.46190-0.191300.19130.50.46190.5-0.461900.191300.1913-0.50.4619.]]>從8×8塊分解為16個2×2塊,可以先把8×8塊分解為4個4×4塊,再把每個4×4塊分解為4個2×2塊。
在步驟300中,計算每個圖像塊的顏色特征和紋理特征。
圖像塊的顏色特征用YCbCr顏色空間表示,其在Y,Cb,Cr三個顏色分量上的值分別是該圖像塊在對應的顏色分量上的DCT系數(shù)中DC系數(shù)除以圖像塊的像素塊中的像素個數(shù)的平方根,用公式表示為y=1NCy(0,0),]]>cb=1NCcb(0,0),]]>cr=1NCcr(0,0).]]>該圖像塊的紋理特征是該像素塊Y顏色分量上DCT系數(shù)中非零AC系數(shù)的平方和除以像素塊中的像素個數(shù),即texture=1N2Σi=0N-1Σj=0N-1(Cy(i,j))2,(i,j)≠(0,0),]]>在以上公式中,y,cb,cr分別是圖像塊的顏色特征在Y,Cb,Cr三個顏色分量上的值,texture是該圖像塊的紋理特征。Cy,Ccb,Ccr分別是該圖像塊在Y,Cb,Cr分量上的DCT系數(shù),每個圖像塊大小為N×N,即有N2個像素。
在步驟400中,計算每個圖像塊的膚色可能性。由步驟300得到圖像塊的顏色特征的值,由步驟100中的膚色分布模型可知各顏色值的膚色概率,將圖像塊的顏色特征的值與膚色分布模型中各顏色值做對比,得到該圖像塊的膚色概率。
在步驟500中,根據(jù)膚色概率和紋理特征對每個圖像塊進行判斷,判斷其是否是人體膚色區(qū)域。判斷圖像塊為人體膚色圖像塊的標準是該圖像塊的膚色概率在設定的膚色概率閾值的范圍之內(nèi)并且紋理特征在設定的紋理特征閾值的范圍之內(nèi)。
權利要求
1.一種JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法,該方法包括以下步驟a)初始化系統(tǒng)參數(shù),系統(tǒng)參數(shù)包括紋理特征閾值,膚色概率閾值,圖像塊大小,人體膚色分布模型;b)對待檢測的JPEG圖像進行哈夫曼解碼和反量化,并將待檢測的JPEG圖像分解為圖像塊,得到Y(jié),Cb,Cr顏色分量上各個圖像塊對應的DCT系數(shù);c)利用步驟b)得到的DCT系數(shù)計算每個圖像塊的顏色特征和紋理特征;d)利用步驟c)得到的顏色特征與步驟a)中設定的人體膚色分布模型,計算每個圖像塊的膚色概率;e)根據(jù)膚色概率和紋理特征判斷每個圖像塊是否是人體膚色區(qū)域。
2.根據(jù)權利要求1所述的JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法,其特征在于,在所述的步驟a)中,所述的圖像塊大小的取值為下列三者之一8×8,4×4,2×2。
3.根據(jù)權利要求1所述的JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法,其特征在于,在步驟c)中,所述的圖像塊的顏色特征在Y,Cb,Cr三個顏色分量上的值分別是該圖像塊在對應的顏色分量上的DCT系數(shù)中的DC系數(shù)除以圖像塊的像素塊中的像素個數(shù)的平方根。
4.根據(jù)權利要求1所述的JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法,其特征在于,在步驟c)中,所述的圖像塊的紋理特征的值是該像素塊Y顏色分量上DCT系數(shù)中非零AC系數(shù)的平方和除以像素塊中的像素個數(shù)。
5.根據(jù)權利要求1所述的JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法,其特征在于,在所述的步驟e)中,判斷圖像塊為人體膚色區(qū)域的標準是該圖像塊的膚色概率在設定的膚色概率閾值的范圍之內(nèi)并且紋理特征在設定的紋理特征閾值的范圍之內(nèi)。
全文摘要
本發(fā)明公開了一種JPEG圖像壓縮域上的人體膚色區(qū)域檢測方法,該方法包括以下步驟初始化系統(tǒng)參數(shù);對待檢測的JPEG圖像進行哈夫曼解碼和反量化,得到Y(jié),Cb,Cr顏色分量上各個圖像塊對應的DCT系數(shù);計算每個圖像塊的顏色特征和紋理特征;計算每個圖像塊的膚色概率;根據(jù)膚色概率和紋理特征判斷每個圖像塊是否是人體膚色區(qū)域。本發(fā)明的優(yōu)點在于本發(fā)明方法不需要把圖像完全解壓縮,直接在壓縮碼流上操作,提高了人體膚色區(qū)域檢測的速度;提高了人體膚色區(qū)域檢測的精度。
文檔編號G06T7/00GK1797471SQ200410101599
公開日2006年7月5日 申請日期2004年12月24日 優(yōu)先權日2004年12月24日
發(fā)明者鄭清芳, 高文, 王耀威, 黃慶明 申請人:中國科學院計算技術研究所