專利名稱:高斯框架下近似最優(yōu)膚色檢測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于多高斯模型的膚色檢測的方法,屬于圖像處理領(lǐng)域。
背景技術(shù):
在圖像處理與計(jì)算機(jī)視覺領(lǐng)域中,膚色檢測在人臉檢測、人臉識別以及不良圖像的過濾等應(yīng)用領(lǐng)域中具有重要的意義。在過去的幾年中,一些基于像素的膚色檢測方法已涌現(xiàn)。這些方法可分為兩類 第一類是非參數(shù)模型,例如膚色空間的直接閾值法和直方圖方法;第二類是參數(shù)化模型,例如單高斯模型、橢圓邊界模型等。與非參數(shù)模型相比,參數(shù)化模型需要較少的訓(xùn)練數(shù)據(jù)和較低的存儲要求,更易于推廣。Menser和Wien利用多維的單高斯模型(Single Gaussian Models,簡稱SGMs)來表征RGB空間中的膚色分布。由于膚色分布并不嚴(yán)格正態(tài)分布,而是有一定程度的傾斜,故單高斯模型并不能準(zhǔn)確地描述該分布。Lee和Yoo提出了橢圓邊界模型,該模型本質(zhì)上等價(jià)于單高斯模型,但是在均值向量的估計(jì)稍有區(qū)別。為了更加準(zhǔn)確地表示膚色分布,很多研究者采用了混合高斯模型(GaussianMixture Models,簡稱GMMs)。此夕卜,其它方法如多層感知器分類法(MLP)也已被提出。由于SGMs、橢圓邊界模型、GMMs等基于高斯模型方法具有簡單性和良好的推廣性等優(yōu)點(diǎn),這些方法已被廣泛應(yīng)用。但是,它們局限性在于僅當(dāng)FPRs在某個(gè)較小的特定范圍內(nèi)時(shí)方法表現(xiàn)良好。一般地,SGMs在FPR較小的時(shí)候表現(xiàn)好于橢圓邊界模型法,在FRP大于0. 09時(shí)橢圓邊界法表現(xiàn)優(yōu)于SGMs。此外,在實(shí)驗(yàn)中我們發(fā)現(xiàn)GMMs在FPR大過0. 40時(shí)表現(xiàn)優(yōu)于上述兩種方法。通常地,單個(gè)模型僅在特定FPRs范圍內(nèi)表現(xiàn)得較好。因此,提出一種在大范圍甚至整個(gè)FPRs區(qū)間內(nèi)表現(xiàn)良好的膚色檢測方法是非常必要的。
發(fā)明內(nèi)容
本發(fā)明的主要內(nèi)容,提出一種新的基于像素的膚色檢測方法,名為MGMs模型,并導(dǎo)出其離散和連續(xù)的形式,用以解決目前高斯框架下絕大多數(shù)方法只能在某個(gè)特定FPRs 小區(qū)間上得到較好性能的問題。MGMs模型是基于多個(gè)最優(yōu)高斯模型而建立的,每個(gè)高斯模型對應(yīng)一個(gè)事先給定的 FPR0每個(gè)最優(yōu)模型在對應(yīng)的FI5R值條件下能夠取得最高的膚色檢測IPR值,可以通過搜索的優(yōu)化算法來解決。因此,對于所有給定的FPRs值,MGMs模型能夠在高斯框架下實(shí)現(xiàn)近似最優(yōu)性能。并且,MGMs模型與SGMs有相同的計(jì)算代價(jià)。本發(fā)明采用了如下技術(shù)手段來實(shí)現(xiàn)的首先將RGB空間歸一化;1)建立最優(yōu)單高斯模型從單高斯概率密度函數(shù)出發(fā),通過判斷概率密度函數(shù)值與事先定義的閾值之間的關(guān)系來對膚色空間中的樣本點(diǎn)進(jìn)行分類;最優(yōu)單高斯模型通過求解優(yōu)化問題來獲得假定膚色檢測的FI^R值為rF = C,最大化膚色檢測的檢測率TPR,通過該優(yōu)化問題可以獲得最優(yōu)單高斯模型的均值向量和協(xié)方差矩陣參數(shù);該最優(yōu)化問題的求解通過搜索算法來,按如下步驟進(jìn)行①.最優(yōu)高斯模型的協(xié)方差矩陣通過對訓(xùn)練集中的膚色樣本點(diǎn)采用最大似然估計(jì)方法獲得,假設(shè)該矩陣在搜索算法執(zhí)行過程中不變;②.采用Fisher線性判別和主成分分析方法得到兩個(gè)方向,對此進(jìn)行線性組合來初始化搜索算法中的高斯模型均值向量μ ini,即為0時(shí)刻的均值向量μ ^ ;③.在搜索算法中的t時(shí)刻,沿著方向θ e Θ對均值向量^進(jìn)行移動,其中 Θ為預(yù)定義的8個(gè)方向,步長為δ個(gè)像素,從中選擇一個(gè)方向^使得在該方向上向量
Fi =- (rF t,rT t)T在ROC曲線rF = C處法線方向上投影向量處在該ROC曲線的
上方,并且范數(shù)最大,則^即為t時(shí)刻均值向量的更新方向,轉(zhuǎn)至④;否則,中止搜索算法,輸出最終的均值向量;④.在t+Ι時(shí)刻,通過調(diào)整閾值的大小使得FPR的值重新為rF,w = C。t — t+1, 轉(zhuǎn)至③。最終可以通過以上搜索算法獲得對應(yīng)于rF = C的最優(yōu)單高斯模型。若有k個(gè)給定的FI^R值C1, C2,…,Ck,則通過以上算法可以得到K個(gè)對應(yīng)的最優(yōu)單高斯模型{<N(yk, Σ ),Ck>|k= 1,2,...,K},其中μ k為第k個(gè)最優(yōu)高斯模型均值向量,Ck為第k個(gè)最優(yōu)高斯模型的FI^R值。2)融合多個(gè)最優(yōu)高斯模型使N(yk,E )作用于區(qū)間F e [ak,bk)而不僅僅是Ck,其中 <Ck<bk。每個(gè)模型的ROC曲線可以用函數(shù)& = fk(rF),rF e
表示。^t和bk的值由下式?jīng)Q定ak =min {rF | fk(rF)彡 fx (rF),1 乒 k}和 bk = max {rF | fk(rF)彡 fx (rF),1 乒 k},其中 fk(rF)和 fx(rF)分別為對應(yīng)模型N(yk,E )禾ΠΝ(μ1;Σ )的ROC曲線。在W,l]區(qū)間內(nèi)對誤檢率 FI3R進(jìn)行采樣,在此基礎(chǔ)上通過實(shí)驗(yàn)方法得到fk(·),最后通過比較fk(rF)和其它ROC曲線來計(jì)算%,bk,其中k = 1,2,. . .,K ;最終得到融合后的多高斯模離散形式可以表示為如下二元組的集合{<N(yk,E ),[ak,bk)>|k= 1,2,···,Κ}。對多個(gè)最優(yōu)高斯模型中的參數(shù)采用線性擬合的方法,得到一個(gè)μ ,和Ck的線性關(guān)系,可以得到的多高斯模型MGMs的連續(xù)形式。本發(fā)明的有益效果是提出了一種在大范圍FPRs區(qū)間上都能取得近似最優(yōu)性能的膚色檢測方法,并且計(jì)算復(fù)雜度低,對海量的網(wǎng)絡(luò)可視媒體的處理具有重要的意義。
具體實(shí)施例方式下面對本發(fā)明的具體實(shí)施例加以說明步驟1,在標(biāo)準(zhǔn)化的RGB顏色空間上對膚色進(jìn)行建模。本專利中的圖像像素是在歸一化的RGB顏色空間(也成為rgb顏色空間)上進(jìn)行表示的。在忽略背景光的條件下,歸一化RGB空間具有相對于光源不隨表面方向變化的不變性。此外,RGB到歸一化RGB的變換由如下公式可得
RGhBn.r = -~,g = -~,b=-~(1)
^RGB^RGB^RGB其中Sio = R+G+B,r+g+b = 1。第三個(gè)分量b不獨(dú)立于r和g,故僅使用分量r和g來表示圖像,在實(shí)驗(yàn)中可以線性變換至范圍W,255]。步驟2,基于一個(gè)特定的FI^R值rF = Ce W,1],求解最優(yōu)單個(gè)高斯模型。為了建立一種基于混合高斯模型的膚色檢測方法,本專利首先需要建立基于一個(gè)特定FPR下最優(yōu)的單個(gè)高斯模型Λ/" (μ,Σ ),其概率密度函數(shù)表示如下
權(quán)利要求
1.一種高斯框架下近似最優(yōu)的膚色檢測方法,其特征在于,包括如下步驟1)首先將RGB空間歸一化至rgb空間;2)建立最優(yōu)單高斯模型從單高斯概率密度函數(shù)出發(fā),通過判斷概率密度函數(shù)值與事先定義的閾值之間的關(guān)系來對膚色空間中的樣本點(diǎn)進(jìn)行分類;最優(yōu)單高斯模型通過求解優(yōu)化問題來獲得假定膚色檢測的FI^R值為rF = C,最大化膚色檢測的檢測率TPR,通過該優(yōu)化問題可以獲得最優(yōu)單高斯模型的均值向量和協(xié)方差矩陣參數(shù);該最優(yōu)化問題的求解通過搜索算法來,按如下步驟進(jìn)行①.最優(yōu)高斯模型的協(xié)方差矩陣通過對訓(xùn)練集中的膚色樣本點(diǎn)采用最大似然估計(jì)方法獲得,假設(shè)該矩陣在搜索算法執(zhí)行過程中不變;②.采用Fisher線性判別和主成分分析方法得到兩個(gè)方向,對此進(jìn)行線性組合來初始化搜索算法中的高斯模型均值向量μ ini,即為0時(shí)刻的均值向量μ ^ ;③.在搜索算法中的t時(shí)刻,沿著方向θe Θ對均值向量^進(jìn)行移動,其中Θ為預(yù)定義的8個(gè)方向,步長為δ個(gè)像素,從中選擇一個(gè)方向^使得在該方向上t時(shí)刻向量Fi = (4% - rF,t,4d)+l - 在ROC曲線rF = C處法線方向上的投影向量處在該ROC曲線的上方,并且范數(shù)最大,則^即為t時(shí)刻均值向量的更新方向,轉(zhuǎn)至④,其中rF,dnrT,t分別是模型在t時(shí)刻的誤檢率和檢測率,rfidnrgh*別是該模型沿著方向Θ對均值向量y t進(jìn)行移動后新模型的誤檢率和檢測率;否則,中止搜索算法,輸出最終的均值向量;④.在t+Ι時(shí)刻,通過調(diào)整閾值的大小使得FPR的值重新為rF,t+1 = C ;t — t+1,轉(zhuǎn)至③;最終可以通過以上搜索算法獲得對應(yīng)于rF = C的最優(yōu)單高斯模型;若有k個(gè)給定的 FI^R值C1, C2,…,Ck,則通過以上算法可以得到K個(gè)對應(yīng)的最優(yōu)單高斯模型{<N(yk,E ), Ck> I k = 1,2,. . .,K},其中μ k為第k個(gè)最優(yōu)高斯模型均值向量,Ck為第k個(gè)最優(yōu)高斯模型的FPR值;3)融合多個(gè)最優(yōu)高斯模型使N(yk,Σ )作用于區(qū)間F e [ak, bk)而不僅僅是Ck,其中 < Ck<bk;第k個(gè)模型的ROC曲線可以用函數(shù)& = fk(rF),rF e
表示。 和bk的值由下式?jīng)Q定ak = min{rF|fk(rF)彡 fx (rF),1 乒 k}和 bk = max {rF|fk(rF)彡 fx (rF),1 乒 k},其中 fk(rF)禾口 fx(rF)分別為對應(yīng)模型N( μ k,Σ )和Ν( μ Σ )的ROC曲線;在W,l]區(qū)間內(nèi)對誤檢率FI^R進(jìn)行采樣,在此基礎(chǔ)上通過實(shí)驗(yàn)方法得到fk(·),最后通過比較fk(rF)和其它ROC曲線來計(jì)算ak, bk,其中k = 1,2,. . .,K ;最終得到融合后的多高斯模離散形式,表示為如下二元組的集合KN(yk,E ),[ak, bk)>|k= 1,2,···,Κ}。
2.根據(jù)權(quán)利要求1所述的檢測方法,其特征在于,對多個(gè)最優(yōu)高斯模型中的參數(shù)采用線性擬合的方法,得到一個(gè)P1^P Ck的線性關(guān)系,最終得到的多高斯模型連續(xù)形式。
全文摘要
為了解決目前高斯框架下的方法只能在某個(gè)特定的誤檢率(FalsePositive Rates,簡稱FPRs)區(qū)間內(nèi)性能較好的問題,本發(fā)明提出一種高斯框架下近似最優(yōu)的膚色檢測方法,稱為多高斯模型(Multiple GaussianModels,簡稱MGMs),并推導(dǎo)出其離散和連續(xù)的形式。該方法對于整個(gè)FPR區(qū)間內(nèi)都具有很好的性能。首先將RGB顏色空間歸一化得到rgb空間,然后建立多個(gè)最優(yōu)單高斯模型,最后將多個(gè)最優(yōu)模型融合。MGMs模型包含多個(gè)最優(yōu)單高斯模型,每個(gè)高斯模型對應(yīng)于一個(gè)事先定義的FPR值。在每個(gè)FPR情況下,對應(yīng)的最優(yōu)模型會得到最高的膚色檢測率(True Positive Rates,簡稱TPRs),該模型采用基于搜索算法的優(yōu)化問題求解來獲得。因此,對于所有的FPR值,MGMs模型能夠在高斯框架下獲得近似最優(yōu)的膚色檢測性能。此外,MGMs模型與單高斯模型(Single Gaussian Models,簡稱SGMs)在測試環(huán)節(jié)具有相同的計(jì)算復(fù)雜度。
文檔編號G06K9/62GK102521607SQ20111038935
公開日2012年6月27日 申請日期2011年11月30日 優(yōu)先權(quán)日2011年11月30日
發(fā)明者李謙, 杜友田, 蔡忠閩 申請人:西安交通大學(xué)