數(shù)字摳像處理中的基于svm的透明度估計方法
【專利摘要】本發(fā)明公開了一種數(shù)字摳像處理中的基于SVM的透明度估計方法。1)把圖像前景物體的邊緣手工分割成幾個有少量重疊區(qū)域的子區(qū)域,剩余部分為確定的前景和背景區(qū)域并指明;2)在分割出的圖像子區(qū)域中標識出部分確定的前景和背景像素點;3)對圖像子區(qū)域中的其他像素點進行基于SVM的前景背景分類概率估計,得到所有像素點屬于前景區(qū)域的概率值和屬于背景區(qū)域的概率值,其中,則每個像素點的概率值就是該像素點的透明度值;4)合并每個子區(qū)域以及確定的前景和背景區(qū)域,即可得到整張圖像的透明度值。本發(fā)明具有速度快,自動化程度較高的特點,具有很好的實用價值。
【專利說明】數(shù)字摳像處理中的基于SVM的透明度估計方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種數(shù)字摳像處理中基于SVM的透明度估計方法。
【背景技術(shù)】
[0002]摳像就是把一張圖像中的前景和背景分隔開來的技術(shù)。摳像問題可以定義為:對給定圖像上任一點C,求c點的顏色I所含的前景色F和alpha值α。摳像方程如下所示:
[0003]I= a F+(l-a )B (I)
[0004]摳像問題的困難在于對圖像上的任一點I,它的F和α的解并不是唯一的,我們要從無數(shù)對的解中找出最合理的解。
[0005]摳像一般可以分為兩個主要步驟:
[0006]I)區(qū)域劃分。一般情況下以手工劃分為主。由于具體圖像的情況復(fù)雜多變,圖像中前景和背景區(qū)域的顏色在顏色空間中的分布如果重合,那么稱該圖像前景背景非簡單可分,否則簡單可分。非簡單可分的圖像,其前景背景區(qū)域的劃分靠現(xiàn)有技術(shù)自動實現(xiàn)幾乎是不可能的。由于區(qū)域劃分的精確程度對摳圖效果有很大的影響,因此在做摳像處理的區(qū)域劃分時,一定量的人工交互是必不可少的。
[0007]2)透明度估計。目前,摳像技術(shù)可以分成三大類:第一類是基于采樣的摳像技術(shù)。這類技術(shù)在得到三分圖后,通過采集待處理區(qū)域中的像素點P的周邊確定的前景點和背景點,估算出P點的前景顏色F和背景顏色B,然后利用摳像方程估算出透明度值α。比如Knockout方法、Hillman方法、Mishima方法和Bayesian方法等。此類摳像技術(shù)首先需要通過采集合適的前景點和背景點來估算F和B,然后利用F和B來估算α。如果圖像顏色變化比較劇烈,F(xiàn)和B往往出現(xiàn)估算不連續(xù)的情況,這樣直接導(dǎo)致?lián)赶窠Y(jié)果很差。第二類是基于相似性假設(shè)的摳像技術(shù)。它假設(shè)待處理圖像在小范圍內(nèi)前景和背景顏色平滑,通過對列出的未知像素點誤差方程求最小值,可以求得最優(yōu)的α。比如泊松摳像的最優(yōu)方程但對于圖像顏色變化劇烈,前景背景復(fù)雜的情況,該假設(shè)就不成立,其摳像效果也較差。比如泊松摳像、隨機行走方法和測地線方法等;第三類是采樣與相似性結(jié)合的摳像技術(shù)。此類方法需要計算每個待處理像素點的數(shù)據(jù)能量Ed以及待處理像素點之間的相似能量Es,并通過最小化兩者的和來求得所有待處理像素的α值,如魯棒摳像、快捷摳像等,但理論上Ed強調(diào)單個像素自己的特性,而Es則強調(diào)相鄰像素點之間的平滑性,他們分別在不同條件下取得最優(yōu)值,所以該類摳像方法一般需要根據(jù)不同圖像給Ed和Es不同的權(quán)值才能比較有效地計算出α值。
[0008]在上述三類摳像算法中,基于采樣的摳像技術(shù)需要先估計像素點的前景色F和背景色B,然后再利用F和B估計α,其結(jié)果需要圖像的前景物體邊緣區(qū)域顏色變化平滑,其優(yōu)點是算法簡單,處理速度快。基于相似性假設(shè)的摳像技術(shù)需假定圖像在小范圍內(nèi)前景和背景顏色比較平滑,這在復(fù)雜背景和前景的情況下效果較差。第三類采樣與相似性結(jié)合的摳像技術(shù),該技術(shù)從理論上看也存在較大的弊端,由于數(shù)據(jù)能量Ed和相似能量Es分別在不同條件下取得最小值,當求其總和最小時,不可避免地需要人工交互,一定程度上影響了算法的魯棒性。
【發(fā)明內(nèi)容】
[0009]透明度估計是摳像處理中的重要一環(huán),我們需要減少對圖像中前景和背景顏色做出過多的假設(shè),并尋求在理論上構(gòu)建更完美的摳像模型,減少出現(xiàn)錯誤的可能,以增強摳像算法的魯棒性。本發(fā)明提供了一種數(shù)字摳像處理中的基于SVM的透明度估計方法,該方法在所處理的圖像子區(qū)域內(nèi)不需要對顏色做過多假設(shè),可以在較短的時間內(nèi),通過計算每個未知像素點屬于前景和背景的概率?1和&,而a =Pl,從而得到較為準確的像素點透明度值。
[0010]數(shù)字摳像處理中的基于SVM (Support Vector Machine)的透明度估計方法,在數(shù)字摳像處理中,在每個前景物體邊緣的子區(qū)域中,標識出部分確定的前景和背景區(qū)域,使用SVM透明度估計方法得到各子區(qū)域內(nèi)各像素的透明度值并合并,然后得到整個圖像區(qū)域各像素的透明度值,步驟為:
[0011]I)載入圖像;
[0012]2)把圖像沿前景物體的邊緣區(qū)域劃分為K個有部分重疊區(qū)域的子區(qū)域,K為自然數(shù),并在剩余的區(qū)域中標識確定的前景區(qū)域各像素點透明度為1,和確定的背景區(qū)域透明度為0 ;對子區(qū)域進行透明度估計處理,標識出子區(qū)域中確定的前景和背景像素點,應(yīng)使這兩類像素點的個數(shù)保持均衡;
[0013]3)對子區(qū)域中的其他未確定的像素點進行基于SVM的前景背景二元分類概率估計,得到屬于前景區(qū)域的概率值P1和屬于背景區(qū)域的概率值Pom+Po = 1,基于SVM的透明度估計方法將概率值P1作為該像素點的透明度值a ;
[0014]4)相鄰子區(qū)域的重疊區(qū)域內(nèi)像素點的透明度值a為在兩個子區(qū)域內(nèi)分別估計出來的透明度值的平均值,把處理好的每個子區(qū)域合并為一個完整的透明度圖像。
[0015]所述的步驟2)中,把圖像沿前景物體的邊緣區(qū)域劃分為k個有部分重疊區(qū)域的子區(qū)域Q1, Q2,...,Qk,劃分完子區(qū)域后,指明剩余的區(qū)域里為確定的各像素點透明度為I的前景區(qū)域和透明度為0的背景區(qū)域;子區(qū)域Q1, Q2,..., Qk內(nèi)的像素點進行透明度估計處理。
[0016]所述的步驟2)中,應(yīng)使這兩類像素點的個數(shù)保持均衡,對于二維圖像來說,直觀上表現(xiàn)為所標識的前景和背景區(qū)域面積大致相等;如果不能平衡,則應(yīng)賦予它們不同的權(quán)重C1和Ctl,若確定前景像素點個數(shù)為N1,確定背景像素點個數(shù)為Ntl,則C1 = Ctl = N0:N1; N0> N1為自然數(shù),以使它們在計算分類概率中的影響力能保持平衡。
[0017]所述的步驟2)中,子區(qū)域中確定的前景和背景像素點為像素點樣本,表示為六維向量{R,G, B,R/G, G/B, B/R},其中R,G,B為該像素點的RGB顏色分量值,其余3個分量為RGB顏色分量的比值;根據(jù)SVM分類過程,把已知向量標準化并訓練出一個分類模型,然后把未確定像素點按照該模型進行分類。
[0018]所述的步驟4)中,把做完透明度估計的每個子區(qū)域合并為一個完整的透明度圖像,相鄰的兩個子區(qū)域Qi和Q i+1的重疊區(qū)域內(nèi)像素點的透明度值a為在兩個子區(qū)域內(nèi)分別估計出來的透明度值a i和a i+1的平均值,以使得相鄰子區(qū)域之間的透明度值能夠自然過渡。[0019]假設(shè)像素點樣本數(shù)目為1,其中前景樣本點為P個,背景樣本點為q個,1= p+q,SVM摳像分類超平面方程為f(x) = wx+b, w為超平面的法向量,X為像素點,b為一待求實數(shù)(在直線方程中,b是截距),對于前景樣本點Xi,有f (Xi) = wx,+b≥1,對于背景樣本點Xj有f(Xj) = wxj+b≤-1,如果對前景樣本和背景樣本分別引入松弛變量ζi和ζj于是摳像分類問題就是以下的優(yōu)化問題:
[0020]
【權(quán)利要求】
1.一種數(shù)字摳像處理中的基于SVM的透明度估計方法,其特征是,在數(shù)字摳像處理中,在每個前景物體邊緣的子區(qū)域中,標識出部分確定的前景和背景區(qū)域,使用SVM透明度估計方法得到各子區(qū)域內(nèi)各像素的透明度值并合并,然后得到整個圖像區(qū)域各像素的透明度值,步驟為: 1)載入圖像; 2)把圖像沿前景物體的邊緣區(qū)域劃分為K個有部分重疊區(qū)域的子區(qū)域,K為自然數(shù),并在剩余的區(qū)域中標識確定的前景區(qū)域各像素點透明度為1,和確定的背景區(qū)域透明度為O ;對子區(qū)域進行透明度估計處理,標識出子區(qū)域中確定的前景和背景像素點,應(yīng)使這兩類像素點的個數(shù)保持均衡; 3)對子區(qū)域中的其他未確定的像素點進行基于SVM的前景背景二元分類概率估計,得到屬于前景區(qū)域的概率值P1和屬于背景區(qū)域的概率值Po,Pi+Po = 1,基于SVM的透明度估計方法將概率值P1作為該像素點的透明度值a ; 4)相鄰子區(qū)域的重疊區(qū)域內(nèi)像素點的透明度值a為在兩個子區(qū)域內(nèi)分別估計出來的透明度值的平均值,把處理好的每個子區(qū)域合并為一個完整的透明度圖像。
2.根據(jù)權(quán)利要求1所述的方法,其特征是,所述的步驟2)中,把圖像沿前景物體的邊緣區(qū)域劃分為k個有部分重疊區(qū)域的子區(qū)域Q1, Q2,...,Q k,劃分完子區(qū)域后,指明剩余的區(qū)域里為確定的各像素點透明度為I的前景區(qū)域和透明度為0的背景區(qū)域;子區(qū)域^1, Q2,..., Qk內(nèi)的像素點進行透明度估計處理。
3.根據(jù)權(quán)利要求1所述的方法,其特征是,所述的步驟2)中,應(yīng)使這兩類像素點的個數(shù)保持均衡,對于二維圖像來說,直觀上表現(xiàn)為所標識的前景和背景區(qū)域面積大致相等;如果不能平衡,則應(yīng)賦予它們不同的權(quán)重C1和Ctl,若確定前景像素點個數(shù)為N1,確定背景像素點個數(shù)為N。,則C1:CQ = N0INijN0^N1為自然數(shù),以使它們在計算分類概率中的影響力能保持平衡。
4.根據(jù)權(quán)利要求1所述的方法,其特征是,所述的步驟2)中,子區(qū)域中確定的前景和背景像素點為像素點樣本,表示為六維向量{R,G, B,R/G, G/B, B/R},其中R,G, B為該像素點的RGB顏色分量值,其余3個分量為RGB顏色分量的比值;根據(jù)SVM分類過程,把已知向量標準化并訓練出一個分類模型,然后把未確定像素點按照該模型進行分類。
5.根據(jù)權(quán)利要求1所述的方法,其特征是,所述的步驟4)中,把做完透明度估計的每個子區(qū)域合并為一個完整的透明度圖像,相鄰的兩個子區(qū)域A和Qi+1的重疊區(qū)域內(nèi)像素點的透明度值a為在兩個子區(qū)域內(nèi)分別估計出來的透明度值a ,和a i+1的平均值,以使得相鄰子區(qū)域之間的透明度值能夠自然過渡。
6.根據(jù)權(quán)利要求4所述的方法,其特征是,假設(shè)像素點樣本數(shù)目為1,其中前景樣本點為P個,背景樣本點為q個,I = P+q,SVM摳像分類超平面方程為f (X) = wx+b, w為超平面的法向量,X為像素點,b為一待求實數(shù)(問了多人,不知有何具體名稱),對于前景樣本點Xi,有If(Xi) = wx^b≥1,對于背景樣本點Xj,有f(Xj) = wxj+b ( -1,如果對前景樣本和背景樣本分別引入松弛變量h和(j,于是摳像分類問題就是以下的優(yōu)化問題:
【文檔編號】G06K9/62GK103714540SQ201310714556
【公開日】2014年4月9日 申請日期:2013年12月21日 優(yōu)先權(quán)日:2013年12月21日
【發(fā)明者】林生佑 申請人:浙江傳媒學院