一種視頻檢測及處理方法、裝置的制造方法

文檔序號：8266497閱讀：447來源：國知局

一種視頻檢測及處理方法、裝置的制造方法
【技術領域】
[0001] 本發(fā)明涉及視頻模式檢測領域，尤其涉及一種視頻檢測及處理方法、裝置。
【背景技術】
[0002] 電影通常是按逐行方式以每秒24幀拍攝的。為了在電視機上流暢地播放電影節(jié) 目，需要將電影幀拆分為電視場信號進行廣播傳送，這一技術稱為下拉變換過程，常見的包括用于NTSC制式廣播中的3:2下拉變換和用于PAL制式廣播中的2:2下拉變換技術。以 3:2下拉變換為例，若電影幀序列以A、B、C、D……表示，如圖1所示，首先將每幀拆成兩場，如A t和Ab，其中下標t和b分別表示頂場和底場，經過3:2下拉變換處理后獲得的電視場信號為A t、Ab、At、Bb、Bt、C t、Cb、Ct、Dt、Db、D t……，其場率為每秒60場。2:2下拉變換技術同理。
[0003] 電影模式檢測為后續(xù)的去隔行處理提供了必要的信息。如果已知當前待處理的場 Ft是電影視頻，且亦知與該場來自同一電影幀的另外一場是前場F η還是后場F t+1，那么只需簡單將這兩場交織在一起即可還原出原始的電影幀，該過程稱為反下拉變換過程。與普通電視視頻常用的去隔行技術（如場內插值或運動自適應去隔行等）不同，反下拉變換過程能最大程度地保持圖像細節(jié)。但是，對與非電影場做反下拉變換處理則會引起梳齒偽像。一般認為，電影模式出現誤檢導致的結果（即將非電影視頻檢測為電影）要比漏檢（即將電影視頻檢測為非電影）嚴重。
[0004] 根據上述下拉變換的基本原理，來自同一電影幀的相鄰兩場圖像的內容往往具有較強的相關性（同一時刻記錄的兩場，如圖1中的A t和Ab)，而來自不同電影幀的相鄰兩場相關性較?。ú煌瑫r刻記錄的兩場，如圖1的A t和Bb)，同時這些強相關性和弱相關性在連續(xù)的電影序列中表現出一定的周期性。若用1表示當前場與緊鄰的后場相關性較強，用〇表示當前場與緊鄰的后場相關性較弱，則分析圖1所示電視場可發(fā)現，3:2下拉變換電影序列具有如下相關性規(guī)律：
[0005] 11010 11010 11010 11010 ......
[0006] 分別以第一個At場，A b，第二個At場，Bb場和B t場作為起始場，則3:2下拉變換電影序列有五種可能的相關性規(guī)律：11〇1〇, 1〇1〇1，〇1〇11，1〇11〇,〇11〇1，定義這五種模式為緊鄰場相關性參考模式?？梢?，若輸入的視頻信號是3:2下拉變換電影序列，則每連續(xù)的五場圖像必會滿足以上五種緊鄰場相關性參考模式中的一種，且之后的每連續(xù)五場圖像都具有與之相同的相關性規(guī)律。
[0007] 此外，由于3:2下拉變換電影序列中每連續(xù)五場中總會有一場內容（如At場）重復出現，所以通過連續(xù)統計當前場的前場和后場之間的相關性，也能找到一定的周期性規(guī) 律。仍以圖1所示為例，若用1表示當前場的前場與后場之間具有較強相關性，而用〇表示當前場的前場與后場之間具有較弱相關性，分別以第一個A t場，A b，第二個At場，B b場和B t 場作為起始場，可發(fā)現五種可能的相關性規(guī)律：〇1〇〇〇, 10000,00001，00010,00100,定義這五種匹配規(guī)律為間隔場相關性參考模式?？梢姡糨斎氲囊曨l信號是3:2下拉變換電影序列，則每連續(xù)的五場圖像必會滿足以上五種間隔場相關性參考模式中的一種，且之后的每連續(xù)五場圖像都具有與之相同的相關性規(guī)律。
[0008] 現有大多電影模式檢測技術也正是通過計算相鄰場圖像的整體相關性來判斷當前場是否為電影場。圖2給出了目前常用的電影模式檢測和去隔行流程，其中電影模式檢測模塊需要三場數據輸入如Ft，F w和F t_2以計算相鄰場之間的相關性，模塊的輸出是對場 Fw的檢測結果，包括它是否為電影場以及與Ft還是Ft_2來自同一電影幀。去隔行模塊也需要三場數據輸入如F t_i，Ft_2和F t_3以進行運動自適應去隔行處理，其輸出F t_2*表示Ft_2場的插值結果幀，此時需要從電影模式檢測模塊獲得F t_2場對應的電影模式信息（以Mt_2表示），如果F t_2場是電影場，就采用反下拉變換方法獲得逐行幀，否則就采用運動自適應方法計算出插值幀?？梢姡F有技術方案中，去隔行模塊的處理結果總比電影模式檢測模塊的處理結果有一場的延遲，這需要更多的場緩存和DDR帶寬。
[0009] 另一方面，實際傳輸的電影畫面中往往包含后期編輯添加的隔行信息，例如字幕、滾動條、手語窗甚至轉動的臺標等?，F有技術只給出了整場的檢測結果，這使得去隔行模塊誤將這些混合視頻中的隔行區(qū)域也作為電影模式來處理，從而出現梳齒偽像（如圖11)。

【發(fā)明內容】

[0010] 鑒于現有技術中的問題，在第一方面，本發(fā)明實施例提供一種視頻檢測及處理方法，通過計算相鄰場圖像的整體相關性來判斷當前場是否為電影場，判斷為電影場時，將當前場與相鄰場合并成幀，然后在該合成幀中逐像素檢測梳齒偽像，如果無梳齒偽像，則確定當前局部區(qū)域是電影模式，將所述的合成幀作為還原的視頻幀；如果有梳齒偽像，則判定當前局部區(qū)域是非電影模式，此時采用運動自適應方法或者空域插值方法計算出插值幀，作為還原的視頻幀，所述的當前局部區(qū)域包括所述的當前場和相鄰場。
[0011] 優(yōu)選地，所述在該合成幀中逐像素檢測梳齒偽像的方法包括：獲取合并幀中當前像素 NxN鄰域內的像素特征值；計算當前像素的第一方向三鄰域像素的像素特征值中值，計算在第一方向上與當前像素最相鄰的兩個像素各自的第一方向三鄰域像素的像素特征值中值；分別計算各中值與各中心像素的像素特征值的差的絕對值；將這三個絕對值與閾值進行比較，若它們中任一個大于閾值，認為第一方向檢測到了梳齒，即有梳齒偽像，否則認為該方向沒有檢測到梳齒，即無梳齒偽像，所述N是正整數，所述NxN表示一個以當前像素為中心點的矩形區(qū)域。
[0012] 要說明的是，這里的所謂像素特征值指的是圖像中每個像素的屬性值，例如每個像素可以用Y、Cb、Cr三個分量值，或者R、G、B三個分量值（一般可以由采集設備或前端視頻解碼器提供）表示，且這三個分量（或稱為通道）之間是相互獨立的關系。本發(fā)明此處既可單獨選擇Y或Cb或Cr或R或G或B通道作為像素特征值進行處理，也可以將其中幾個通道組合成新的像素特征值來進行處理。即，優(yōu)選地，所述的像素特征值是YCbCr值或 RGB值。若以P表示所述的像素特征值，本發(fā)明實施例中可以單獨選YCbCr或RGB的某個分量作為像素特征值，例如P = Y ;也可以將其中幾個分量組合成新的像素特征值，例如P = (R+G+B) /3，在此不做特別限制。
[0013] 優(yōu)選地，所述的第一方向是垂直方向、水平方向或者其他方向。
[0014] 在第二方面，本發(fā)明還提供一種視頻檢測及處理裝置，包括電影模式檢測模塊、電影模式優(yōu)化模塊和去隔行模塊，所述電影模式優(yōu)化模塊包括生成合并幀模塊和梳齒檢測模塊，所述電影模式檢測模塊，用于通過計算相鄰場圖像的整體相關性來檢測當前場是電影場時，將檢測結果發(fā)送給所述電影模式優(yōu)化模塊中的生成合并幀模塊；所述生成合并幀模塊，用于在收到電影場檢測結果時，將當前場與其相鄰場合并成幀，并將合并生成的幀發(fā)送給所述的梳齒檢測模塊；所述梳齒檢測模塊，用于對收到的合成幀逐像素檢測梳齒偽像，如果有梳齒偽像，則確定當前局部區(qū)域是非電影模式，并將確定結果通知所述的去隔行模塊；所述的去隔行模塊，用于收到確定結果為非電影模式時，采用運動自適應方法或者空域插值方法計算出插值幀，作為還原的視頻幀，所述的當前局部區(qū)域包括所述的當前場和相鄰場。
[0015] 優(yōu)選地，所述梳齒檢測模塊對合成幀進行逐像素檢測梳齒偽像的步驟包括：獲取合并幀中當前像素 NxN鄰域內的像素特征值；計算當前像素的第一方向三鄰域像素的像素特征值中值，計算在第一方向上與當前像素最相鄰的兩個像素各自的第一方向三鄰域像素的像素特征值中值；分別計算各中值與各中心像素的像素特征值的差的絕對值；將這三個絕對值與閾值進行比較，若它們中任一個大于閾值，認為第一方向檢測到了梳齒，即有梳齒偽像，否則認為該方向沒有檢測到梳齒，即無梳齒偽像，所述N是正整數，所述NxN表示一個以當前像素為中心點的矩形區(qū)域。
[0016] 在第三方面，本發(fā)明還提供一種視頻檢測及處理裝置，包括電影模式檢測模塊、電影模式優(yōu)化模塊和去隔行模塊，所述電影模式優(yōu)化模塊包括電影模式預測模塊，生成合并幀模塊和梳齒檢測模塊，所述電影模式檢測模塊，用于通過計算相鄰場圖像的整體相關性來檢測當前場是電影場時，將檢測結果發(fā)送給所述電影模式優(yōu)化模塊中的電影模式預測模塊；所述電影模式預測模塊，用于基于相鄰場之間的電影模式信息存在的周期性，根據前述電影場檢測結果預測出下一場是電影模式，并將該預測結果發(fā)送給生成合并幀模塊；所述生成合并幀模塊，用于在收到電影場預測結果時，將所述的下一場與其相鄰場合并成幀，并將合并生成的幀發(fā)送給所述的梳齒檢測模塊；所述梳齒檢

完整全部詳細技術資料下載

當前第1頁1 2 3