專利名稱:屏幕中字幕運動的檢測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及屏幕中字幕運動的檢測方法,具體的講是在去隔行技術(shù)中對字幕運動的檢測方法。
背景技術(shù):
由于受到傳輸帶寬的限制,電視臺發(fā)送的電視信號都不是完整的圖像,而是按照先傳奇數(shù)行再傳偶數(shù)行的規(guī)律發(fā)送,這樣的信號就是隔行視頻信號。但是隨著數(shù)字信號處理技術(shù)的不斷發(fā)展和寬屏幕平板電視的出現(xiàn),人們對電視顯示質(zhì)量的要求越來越高,電視臺發(fā)送的隔行信號存在的屏閃、鋸齒等嚴重問題已經(jīng)不能讓觀眾滿意。因此去隔行技術(shù)正是為了解決落后的隔行視頻信號和消費者日益提高的視覺要求而產(chǎn)生的。
去隔行技術(shù)根據(jù)所用濾波器的種類不同分為線性算法、非線性算法、運動補償算法和運動自適應(yīng)算法。其中運動自適應(yīng)算法根據(jù)運動檢測得到的運動參數(shù)來選擇場內(nèi)插值或場間復(fù)制,是目前大多消費產(chǎn)品選擇的去隔行方案。但是運動自適應(yīng)的檢測方式的其精度受多方面影響,比如視頻圖像中的噪聲水平,圖像的明暗程度等。一般的圖像內(nèi)容中當(dāng)運動檢測出錯時,去隔行采用場內(nèi)插值也可以基本滿足觀眾的視覺要求。但是很多的視頻序列中還有字幕,比如即時新聞,人物對話等,如果字幕的運動狀態(tài)檢測錯誤,把本應(yīng)該靜止的字幕檢測為運動,那么字幕的邊緣就會出現(xiàn)閃爍。相反,如果把本來為運動的字幕點檢測為靜止,通過場間復(fù)制的方式進行去隔行,最后會使字幕出現(xiàn)斷點或其他結(jié)構(gòu)性損失,讓字體看起來不完整,影響觀看質(zhì)量。
傳統(tǒng)的運動檢測方法沒有特別區(qū)分字幕區(qū)域和背景區(qū)域,把字幕當(dāng)成普通的圖像內(nèi)容進行運動檢測,沒有考慮字幕本身的特性,所以去隔行后常常出現(xiàn)字幕抖動和字體不完整的現(xiàn)象。發(fā)明內(nèi)容
針對上述的問題,本發(fā)明提供了一種屏幕中字幕運動的檢測方法,能夠?qū)D像畫面中的字幕運動狀態(tài)進行準確的判斷,消除去隔行后出現(xiàn)的字幕抖動和字體不完整現(xiàn)象。
本發(fā)明的屏幕中字幕運動的檢測方法是基于字幕與圖像背景在亮度上存在的明顯差異,并且在相鄰連續(xù)的視頻畫面中字幕與背景之間的相對關(guān)系變化不大的原理。包括步驟
a.遍歷整幅圖像,獲得當(dāng)前遍歷的去隔行像素點的坐標,通過輸入的連續(xù)四場隔行信號判斷當(dāng)前像素是否為字幕點,如果為字幕點向下執(zhí)行,否則按普通運動檢測執(zhí)行;所述的連續(xù)四場隔行信號分別為當(dāng)前場Fn,當(dāng)前場的前兩場Fn_2,當(dāng)前場的前一場Flri和當(dāng)前場的后一場Fn+1 ;
b.判斷相鄰的奇場或偶場中,同極性場的對應(yīng)點在3X3像素塊中的灰度分布在 3X3的像素塊中計算當(dāng)前像素點與每個鄰域像素點的差值,根據(jù)每個所述差值的不同范圍分布,對每個鄰域點賦一個標識數(shù)值,將所述的各標識數(shù)值與所述連續(xù)四場中同極性場的對應(yīng)點的數(shù)值標識相減得到相鄰像素點的序列差,將所述序列差進行絕對和計算,所述絕對和值與對應(yīng)像素點靜止的可能性成正比;
c.判斷像素灰度變化趨勢根據(jù)兩個3X3像素塊對應(yīng)像素的灰度差和設(shè)置的閾值,得到灰度變化趨勢的度量值,該量度值的大小與相鄰兩場的當(dāng)前像素點的變化成正比;
d.判斷字幕點的運動狀態(tài)設(shè)置兩個門限值,將步驟b中的到的絕對和值與步驟C 中得到的量度值分別與所述兩個門限值比較,如果所述絕對和值和量度值都比兩個門限值小,則當(dāng)前像素點為靜止像素;絕對和值和量度值之一比所述任一門限值大,則當(dāng)前像素點為運動像素。
具體的,在步驟a中當(dāng)滿足以下條件之一時,判斷當(dāng)前像素為字幕
al. Fn(i,j)_Fn_2(i,j) | < capsamethl,且
Fn(i,j+2)_Fn_2(i,j+2) I < capsamethl,且
|Fn(i,j)_Fn_2(i,j+2) I > capdiffthl ;
a2. Fn+1(i, j)-Flri (i,j) | < capsamethl,且
|Fn+1(i,j+2)-Fn_1(i, j+2) I < capsamethl,且
Fji,j)-Flri (i,j+2) I > capdiffthl ;
a3. Fn (i,j)_Fn_2(i,j) | < capsameth2,且
|Fn+1(i,j)-Flri (i,j) I < capsameth2,且
Fn(i,j)-Flri (i,j) I > capdiffth2 ;
其中(i,j)為當(dāng)前像素點的坐標,capdiffthl、capdiffth2、capsamethl 和 capsameth2為設(shè)定的門限值。其中可選的,門限capdiffthl范圍是0 32,門限 capdiffth2范圍是0 32,門限capsamethl范圍是0 256,門限capsameth2范圍是 0 邪6。
進一步的,用步驟b中得到的絕對和替代步驟b中所述同極性場中對應(yīng)像素點的值。
可選的,步驟c中所述的閾值范圍是10 30。步驟d中所述的兩個門限值都可以為1 3的整數(shù)值。
本發(fā)明的一種屏幕中字幕運動的檢測方法,能夠?qū)D像畫面中的字幕運動狀態(tài)進行準確的判斷,消除去隔行后出現(xiàn)的字幕抖動和字體不完整現(xiàn)象,明顯的提高了圖像中字幕的清晰度,提高了視覺體驗。
以下結(jié)合由附圖所示實施例的具體實施方式
,對本發(fā)明的上述內(nèi)容再作進一步的詳細說明。但不應(yīng)將此理解為本發(fā)明上述主題的范圍僅限于以下的實例。在不脫離本發(fā)明上述技術(shù)思想情況下,根據(jù)本領(lǐng)域普通技術(shù)知識和慣用手段做出的各種替換或變更,均應(yīng)包括在本發(fā)明的范圍內(nèi)。
圖1是本發(fā)明屏幕中字幕運動的檢測方法的流程圖。
具體實施方式
如圖1所示本發(fā)明屏幕中字幕運動的檢測方法,包括步驟
a.遍歷整幅圖像,獲得當(dāng)前遍歷的去隔行像素點的坐標(i,j),通過輸入的連續(xù)四場隔行信號判斷當(dāng)前像素是否為字幕點,如果為字幕點向下執(zhí)行,否則按普通運動檢測執(zhí)行;所述的連續(xù)四場隔行信號分別為當(dāng)前場Fn,當(dāng)前場的前兩場Fn_2,當(dāng)前場的前一場 Flri和當(dāng)前場的后一場Fn+1,也可以取其它位置關(guān)系的連續(xù)相鄰場,其后步驟可根據(jù)本實施例采用本領(lǐng)域技術(shù)人員可理解的相關(guān)方法執(zhí)行;判斷當(dāng)前像素是否為字幕點的方法為,當(dāng)滿足以下條件之一時,判斷當(dāng)前像素為字幕
al. Fn(i,j)_Fn_2(i,j) | < capsamethl,且
Fn(i,j+2)_Fn_2(i,j+2) I < capsamethl,且
|Fn(i,j)_Fn_2(i,j+2) I > capdiffthl ;
a2. Fn+1(i, j)-Flri (i,j) | < capsamethl,且
|Fn+1(i,j+2)-Fn_1(i, j+2) | < capsamethl,且
I Flri (i,j) -Flri (i,j+2) I > capdiffthl ;
a3. Fn (i,j)_Fn_2(i,j) | < capsameth2,且
I Fn+1 (i,j) -Flri (i,j) I < capsameth2,且
Fn(i,j)-Flri (i,j) I > capdiffth2 ;
其中capdiffthl、capdiffth2、capsamethl 和 capsameth2 為設(shè)定的門限值,分別為:capdiffthl 范圍是0 32,capdiffth2 范圍是0 32,capsamethl 范圍是0 256, capsameth2 范圍是0 256。
在字幕判斷的基礎(chǔ)上,結(jié)合字幕本身的特性,再通過像素灰度分布趨勢判斷和像素灰度變化趨勢判斷步驟來判斷字幕的運動情況。
b.從相鄰的同極性(奇場或偶場)的兩個隔行場中取出的含字幕的3X3的采樣塊,塊中的數(shù)值表示字幕像素點和背景像素點的灰度。判斷相鄰的奇場或偶場中,同極性場的對應(yīng)點在3X3像素塊中的灰度分布首先根據(jù)去隔行的當(dāng)前點與鄰域的8個像素點的灰度值的關(guān)系產(chǎn)生一個8位的序列,計算在3X3的像素塊中當(dāng)前像素點與每個鄰域像素點的差值
Diff [1]=frame[2]iXwidth+j]-frame [2] [(i_l) Xwidth+j-1]
Diff[2]=frame[2]iXwidth+j]-frame[2][(i_l)X width+j]
Diff[3]=frame[2]iXwidth+j]-frame [2] [(i_l) Xwidth+j+1]
Diff[4]=frame[2]iXwidth+j]-frame [2] [i Xwidth+j-1]
Diff[5]=frame[2]iXwidth+j]-frame [2] [i Xwidth+j+1]
Diff[6]=frame[2]iXwidth+j]-frame[2] [(i+1) Xwidth+j-1]
Diff[7]=frame[2]iXwidth+j]-frame[2][(i+1)X width+j]
Diff[8]=frame[2]iXwidth+j]-frame[2] [(i+1) Xwidth+j+1]
其中Diff表示計算的差值,frame表示輸入的圖像,width表示輸入圖像的寬度。
根據(jù)每個所述差值的不同范圍分布,對每個鄰域點賦一個標識數(shù)值Grad,如果差值Diff的絕對值< 門限thl,標識數(shù)值Grad[n] = 0,否則標識數(shù)值Grad[η] =1,其中!!為領(lǐng)域像素點的標號1 8,門限thl的范圍是10 30。
將得到的各標識值Grad與所述連續(xù)四場中同極性場的對應(yīng)點的數(shù)值標識相減得到相鄰像素點的序列差d0 d7,將所述序列差d0 d7進行絕對和計算
d_sum = fabs(d0)+fabs(dl)+fabs(d2)+fabs(d3)+fabs(d4)+fabs(d5)+fabs(d6 )+fabs(d7);
標記dh為相鄰?fù)瑯O性場對應(yīng)點的標識值Grad的差,dh的計算根據(jù)當(dāng)前場的極性選擇與之對應(yīng)的odd或even所存的標識數(shù)值序列進行減法
dh = odd_Grads[iXwidth+j] [h]-Grad[h];
或者dh = even_Grads[iXwidth+j] [h]-Grad[h] ;h = 1、2、· · . 8
fabs為求絕對值,odd_Grads表示奇場,even_Grads表示偶場。
當(dāng)絕對和d_sum計算完成后,用求得的絕對和d_sum代替原來奇場odd_GradS或偶場even_GradS中相應(yīng)位置的值。
絕對和d_sum的值越小,說明當(dāng)前像素點與前面同極性場對應(yīng)像素點的差異越小,像素點靜止的可能性就越大;反之,像素點運動的可能性越大;
c.判斷像素灰度變化趨勢首先計算步驟b中兩個3X3像素塊對應(yīng)像素灰度的差
t0 = frame[2][iXwidth+j]-frame
[iXwidth+j];
tl = frame[2] [(i_l) Xwidth+j-1]-frame
[(i_l) Xwidth+j-1];
t2 = frame[2][(i_l)Xwidth+j]-frame
[(i_l)Xwidth+j];
t3 = frame [2] [(i_l) Xwidth+j+1]-frame
[(i_l) Xwidth+j+1];
t4 = frame [2] [i Xwidth+j-1]-frame
[i Xwidth+j-1];
t5 = frame [2] [i Xwidth+j+1]-frame
[i Xwidth+j+1];
t6 = frame[2] [(i+1) Xwidth+j-1]-frame
[(i+1) Xwidth+j-1];
t7 = frame[2][(i+1)Xwidth+j]-frame
[(i+1)Xwidth+j];
t8 = frame[2] [(i+1) Xwidth+j+1]-frame
[(1+1) Xwidth+j+1];
然后計算灰度差tl 偽與灰度差t0的差的絕對值,并分別將所述差的絕對值與門限th2的大小進行比較,門限th2的范圍是10 30。設(shè)置灰度差tl 偽中與灰度差 t0差的絕對值大于門限th2的個數(shù)t_sum變量,如果比較的當(dāng)前差的絕對值大于門限th2, 那么變量t_sum+l,否則變量t_sum保持不變。最后得到的變量t_sum值就為灰度變化趨勢的一個度量,其值越大說明相鄰兩場的當(dāng)前像素點的變化也越大,其值越小說明相鄰兩場的當(dāng)前像素點的變化也越??;
d.判斷字幕點的運動狀態(tài)設(shè)置兩個門限值,兩個門限值都可以為1 3的整數(shù)值。將步驟b中的到的絕對和d_sum的值與步驟c中得到的變量t_sum的值分別與所述兩個門限值比較,如果所述絕對和d_sum的值和變量t_sum的值都比兩個門限值小,則當(dāng)前像素點為靜止像素;絕對和d_sum的值和變量t_sum的值之一比所述任一門限值大,則當(dāng)前像素點為運動像素。
權(quán)利要求
1.屏幕中字幕運動的檢測方法,其特征為包括步驟a.遍歷整幅圖像,獲得當(dāng)前遍歷的去隔行像素點的坐標,通過輸入的連續(xù)四場隔行信號判斷當(dāng)前像素是否為字幕點,如果為字幕點向下執(zhí)行,否則按普通運動檢測執(zhí)行;所述的連續(xù)四場隔行信號分別為當(dāng)前場Fn,當(dāng)前場的前兩場Fn_2,當(dāng)前場的前一場Flri和當(dāng)前場的后一場Fn+1 ;b.判斷相鄰的奇場或偶場中,同極性場的對應(yīng)點在3X3像素塊中的灰度分布在3X3 的像素塊中計算當(dāng)前像素點與每個鄰域像素點的差值,根據(jù)每個所述差值的不同范圍分布,對每個鄰域點賦一個標識數(shù)值,將所述的各標識數(shù)值與所述連續(xù)四場中同極性場的對應(yīng)點的數(shù)值標識相減得到相鄰像素點的序列差,將所述序列差進行絕對和計算,所述絕對和值與對應(yīng)像素點靜止的可能性成正比;c.判斷像素灰度變化趨勢根據(jù)兩個3X3像素塊對應(yīng)像素的灰度差和設(shè)置的閾值,得到灰度變化趨勢的度量值,該量度值的大小與相鄰兩場的當(dāng)前像素點的變化成正比;d.判斷字幕點的運動狀態(tài)設(shè)置兩個門限值,將步驟b中的到的絕對和值與步驟c中得到的量度值分別與所述兩個門限值比較,如果所述絕對和值和量度值都比兩個門限值小,則當(dāng)前像素點為靜止像素;絕對和值和量度值之一比所述任一門限值大,則當(dāng)前像素點為運動像素。
2.如權(quán)利要求1所述的屏幕中字幕運動的檢測方法,其特征為在步驟a中當(dāng)滿足以下條件之一時,判斷當(dāng)前像素為字幕al. |Fn(i, j)_Fn_2(i, j) | < capsamethl,且 Fn(i, j+2)-Fn_2(i, j+2) I < capsamethl,且 Fn(i,j)_Fn_2(i,j+2) I > capdiffthl ;I 1 n+1 (i,j)_F n-i (i‘ j) I < capsamethl,且 Fn+1 (i, j+2)-Flri (i, j+2) I < capsamethl,且 Flri (i,j)-Flri (i,j+2) I > capdiffthl ;a3. |Fn(i, j)_Fn_2(i, j) | < capsameth2,且 1 n+l (i,j)_F n—i(i,j) I < capsameth2,且 Fn(i, j)-Flri (i,j) I > capdiffth2 ;其中(i,j)為當(dāng)前像素點的坐標,capdiffthl、capdiffth2、capsamethl*capsameth2 為設(shè)定的門限值。
3.如權(quán)利要求2所述的屏幕中字幕運動的檢測方法,其特征為門限capdiffthl范圍是0 32,門限capdiffth2范圍是0 32,門限capsamethl范圍是0 256,門限 capsameth2 范圍是0 256。
4.如權(quán)利要求1所述的屏幕中字幕運動的檢測方法,其特征為用步驟b中得到的絕對和替代步驟b中所述同極性場中對應(yīng)像素點的值。
5.如權(quán)利要求1至4之一所述的屏幕中字幕運動的檢測方法,其特征為步驟c中所述的閾值范圍是10 30。
6.如權(quán)利要求1至4之一所述的屏幕中字幕運動的檢測方法,其特征為步驟d中所述的兩個門限值都可以為1 3的整數(shù)值。
全文摘要
本發(fā)明涉及屏幕中字幕運動的檢測方法。包括步驟a.通過輸入的連續(xù)四場隔行信號判斷當(dāng)前像素是否為字幕點;b.計算相鄰像素點的序列差的絕對和,所述絕對和值與對應(yīng)像素點靜止的可能性成正比,由此判斷相鄰的奇場或偶場中同極性場的對應(yīng)點的灰度分布;c.根據(jù)兩個像素塊對應(yīng)像素的灰度差和設(shè)置的閾值,得到灰度變化趨勢的度量值,該量度值的大小與相鄰兩場的當(dāng)前像素點的變化成正比;d.將絕對和值與量度值分別與所述兩個門限值比較判斷字幕點的運動狀態(tài)。本發(fā)明的方法能夠?qū)D像畫面中的字幕運動狀態(tài)進行準確的判斷,消除去隔行后出現(xiàn)的字幕抖動和字體不完整現(xiàn)象,明顯的提高了圖像中字幕的清晰度,提高了視覺體驗。
文檔編號H04N5/14GK102497492SQ20111039735
公開日2012年6月13日 申請日期2011年12月5日 優(yōu)先權(quán)日2011年12月5日
發(fā)明者劉強, 劉成強 申請人:四川虹微技術(shù)有限公司