亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

視頻尺度轉換及從mpeg-2到mpeg-4的編碼轉換的制作方法

文檔序號:6469333閱讀:287來源:國知局
專利名稱:視頻尺度轉換及從mpeg-2到mpeg-4的編碼轉換的制作方法
技術領域
本發(fā)明涉及多媒體數(shù)據(jù)壓縮,尤其涉及一種視頻編碼轉換器,以允許通用的MPEG-4解碼器將MPEG-2比特流解碼。還提供了時間與空間尺度變換(縮小化)。
背景技術
本文采用以下列縮寫字與術語CBP-編碼塊圖案DCT-離散余弦變換DTV-數(shù)字電視DVD-數(shù)字視頻光盤HDTV-高清晰度電視FLC-固定長度編碼IP-因特網(wǎng)協(xié)議MB-宏塊ME-運動估計ML-主要級別(Main Level)MP-主輪廓(Main profile)MPS-MPEG-2節(jié)目流MTS-MPEG-2傳輸流MV-運動向量QP-量化參數(shù)PMV-預測運動向量RTP-實時傳輸協(xié)議(RFC 1889)SDTV-標準清晰度電視SIF-標準中間格式SVCD-超級視頻壓縮光盤
VLC-可變長度編碼VLD-可變長度解碼VOP-視頻對象平面多媒體編碼標準MPEG-4可提供多種功能,以支持包括因特網(wǎng)應用在內(nèi)的各種不同應用,例如流媒體、廣告、交互式游戲、虛擬旅行等。預期在因特網(wǎng)最流行的因特網(wǎng)視頻流(多點廣播)也適用于視覺MPEG-4視覺標準(ISO/IEC 14496-2國際標準最終草案(MPEG-4)“Information Technology-Generic coding of audiovisualobjects,Part2visual”,1998年12月)。
MPEG-4視覺可同時處理合成視頻與自然視頻,而且適用于多個視覺對象類型,例如視頻、臉部、與網(wǎng)狀物體。MPEG-4視覺亦允許對任意形狀物體進行編碼,所以多重物體可根據(jù)用戶的需要而顯示或加以處理。而且,MPEG-4視覺從編碼與顯示結構的觀點來看,非常具有靈活性,因為它包括了增強的特性,例如多重輔助(阿爾法)平面、可變幀率及幾何變換(子畫面)。
然而,預期作為視頻流目標的大多數(shù)視頻材料(例如,電影、運動、音樂會等)可通過MPEG-2系統(tǒng)壓縮,并且儲存在例如DVD、計算機內(nèi)存(例如,服務器硬盤)等存儲介質中。MPEG-2系統(tǒng)規(guī)格(ISO/IEC 13818-2國際標準(MPEG-2)名為“Information Technology-Generic coding of Moving Pictures and Associated AudioPart2-Video”,1995)定義了兩種系統(tǒng)流格式MPEG-2傳輸流(MTS)與MPEG-2節(jié)目流(MPS)。MTS可調整而用于通信或儲存一個或多個MPEG-2壓縮數(shù)據(jù)節(jié)目,或用于其他處于相對容易出錯環(huán)境中的數(shù)據(jù)。MTS的典型應用是DTV。MPS的調整可用于相對不容易出錯環(huán)境。這種流行的應用包括DVD和SVCD。
有關這一問題的處理至今仍不能令人滿意。例如,MPEG-4節(jié)目輪廓(1999年10月由O.Sunchara和Y.Yagasaki發(fā)表的名稱“The draftof MPEG-4 Studio Profile Amendment Working Draft 2.0,”ISO/IECJTC1/SC29/WG11 MPEG99/5135)已建議一種MPEG-2到MPEG-4編碼轉換器,但是該處理不能應用于另一MPEG-4版本1輪廓,其包括自然視覺輪廓(Simple、Simple Scaleable、Core、Main、N-Bit)、合成視覺輪廓(Scaleable Texture、Simple Face Animation)、及合成/自然混合視覺(Hybrid、Basic Animated Texture)。因為它修改了語法,所以節(jié)目輪廓不能應用在MPEG-4版本1的主輪廓,而且解碼器處理不能與其余MPEG-4版本1輪廓兼容。
MPEG標準采用二維分級排序來指定幾組限定參數(shù)。其中的一個維稱為“輪廓”系列,它指定了所支持的編碼特征。另一維,稱為“級別”,指定可適用的圖像的分辨率、比特率等等。
對于MPEG-2而言,在主要級別的主輪廓,或MP@ML可支持4∶2∶0彩色子采樣率以及I、P、和B圖像。簡單輪廓類似于主輪廓,但是沒有B圖像。主要級別是為ITU-R601視頻而定義,而簡單級別是為SIF視頻而定義的。
同樣地,對于MPEG-4而言,簡單輪廓包含SIF處理視頻(而且沒有B-VOP或交織視頻)。主輪廓允許B-VOP與交織視頻。
因此,想要通過使用MPEG-2視頻到MPEG-4視頻編碼轉換及/或MPEG-4視頻到MPEG-2視頻編碼轉換而在不同類型終端系統(tǒng)之中實現(xiàn)可相互操作性。不同類型終端系統(tǒng)可包括傳輸交互工作單元(TIU)通過使用一個本地RTP為基礎的系統(tǒng)層(例如一以IP為基礎的交互工作)從一個本地MTS(或MPS)系統(tǒng)接收MPEG-2視頻及編碼轉換成MPEG-4視頻,并且在打包網(wǎng)絡上分配。示例中包括一實時編碼器、一連接到因特網(wǎng)的MTS衛(wèi)星以及具有MPS編碼的來源材料的一視頻服務器。
接收交互工作單元(RIU)從一以RTP為基礎的網(wǎng)絡實時接收MPEG-4視頻,然后(如可能)編碼轉換成MPEG-2視頻,并且轉送給一本地MTS(或MPS)環(huán)境。示例包括一以因特網(wǎng)為基礎的視頻服務器到以MTS為基礎的電纜分布設備。
傳輸因特網(wǎng)終端系統(tǒng)(TIES)傳輸MPEG-2或MPEG-4視頻可產(chǎn)生或儲存在因特網(wǎng)終端系統(tǒng)本身內(nèi),或從以因特網(wǎng)為基礎的計算機網(wǎng)絡接收。示例中包括一視頻服務器。
接收因特網(wǎng)終端系統(tǒng)(RIES)在以RTP為基礎的因特網(wǎng)上接收MPEG-2或MPEG-4視頻,供在因特網(wǎng)終端系統(tǒng)使用,或轉送給傳統(tǒng)計算機網(wǎng)絡。示例中包括可檢視一連串視頻的桌上型個人計算機或工作站。
希望能夠確定在MPEG-2與MPEG-4系統(tǒng)之間的相似點與不同點,并且提供可產(chǎn)生一種復雜度較低且誤差小的編碼轉換器結構。
編碼轉換器結構可用于使用B幀(例如,主輪廓)的系統(tǒng),也可用于當B幀不使用(簡單輪廓)時的一種簡化結構中。
應該提供格式(MPEG-2到MPEG-4)及/或尺度編碼轉換。
而且希望提供從MPEG-2到MPEG-4語法的有效映射,其包括標頭的映射。
系統(tǒng)應該包括尺度編碼轉換,其包括空間與時間編碼轉換。
系統(tǒng)應該允許在編碼轉換器的輸入比特流或輸出比特流上的尺度轉換。
尺度編碼轉換器應該可將使用MPEG-2 MP@ML的ITU-R 601交織視頻編碼的比特流轉換成簡單輪廓MPEG-4比特流,其包含例如適用于視頻流應用的SIF處理視頻。
系統(tǒng)應該提供可適用于視頻流應用(例如,少于1Mbps)實際頻寬的輸出比特流。
本發(fā)明可提供具有上述及其他優(yōu)點的一種系統(tǒng)。

發(fā)明內(nèi)容
本發(fā)明有關于格式編碼轉換(MPEG-2到MPEG-4)與尺度(空間與時間)編碼轉換。
一種建議的編碼轉換器中可包括一尺度轉換,雖然這些參數(shù)可在輸入比特流或輸出比特流上編碼轉換。然而,因為編碼轉換器彼此共享處理組件(例如一比特流讀取器),所以在編碼轉換器的產(chǎn)品中包括各種編碼轉換器能夠更為有效地減少復雜度。
本發(fā)明研究編碼轉換器的最關鍵需求,例如,系統(tǒng)的復雜度及處理所產(chǎn)生的損失。
在一實施例中,所建議的編碼轉換器結構可減少復雜度,因為不需要執(zhí)行運動補償。
在一特定實施例中,編碼轉換器能使用可變的5位QP表示,而且可免除AC/DC預測與非線性DC定標器。
本發(fā)明可選擇性用于比率控制與改變尺度。
在一種特殊方法中,其用來將以第一視頻編碼格式提供的預壓縮輸入比特流進行編碼轉換,包括下列步驟恢復該輸入比特流的標頭信息;提供第二不同視頻編碼格式的對應標頭信息;部分解壓縮該輸入比特流,以部分提供解壓縮的數(shù)據(jù);及根據(jù)該第二格式的標頭信息而將部分解壓縮的數(shù)據(jù)重新壓縮,以提供該輸出比特流。
在視頻數(shù)據(jù)上執(zhí)行2∶1縮小化的一種方法中,包括下列步驟通過組合4個N/2×N/2場模式DCT塊而從視頻數(shù)據(jù)形成N×N(例如,N=16)離散余弦變換(DCT)系數(shù)的其中至少一輸入矩陣;執(zhí)行該輸入矩陣的垂直下采樣及解交織,以獲得兩N/2×N/2幀模式DCT塊;從兩幀模式DCT塊形成一N×N/2輸入矩陣;并且對該N×N/2矩陣的水平下采樣,以獲得一N/2×N/2幀模式DCT塊。
較好情況下,垂直與水平下采樣可使用相對的稀疏矩陣。特別是,可使用0.5[I8I8]的一垂直下采樣矩陣,其中I8是一8×8恒等矩陣。實質上是垂直像素平均??墒褂糜善鏀?shù)“O”與偶數(shù)“E”組成的水平下采樣矩陣。
本發(fā)明還提供了相應的裝置。


圖1顯示一個MPEG-2視頻解碼器。
圖2顯示沒有任何可縮放特征的MPEG-4視頻解碼器。
圖3顯示根據(jù)本發(fā)明而描述的從MPEG-2到MPEG-4的一低復雜編碼轉換器(B幀無效)。
圖4顯示根據(jù)本發(fā)明而描述的減少漂移誤差(具致能B幀)之一編碼轉換器結構。
圖5顯示根據(jù)本發(fā)明而描述的尺度編碼轉換器。
圖6顯示根據(jù)本發(fā)明而描述的4個場模式DCT塊到一幀模式DCT塊的下采樣。
具體實施例方式
本發(fā)明有關于格式編碼轉換(MPEG-2到MPEG-4)與尺度(空間和時間)編碼轉換。
本發(fā)明可提供比特率編碼轉換,以便以一不同的比特率將一預壓縮比特流轉換成另一壓縮的比特流。比特率編碼轉換很重要,例如對于視頻流應用,因為網(wǎng)絡頻寬不固定,而且有時視頻服務器需要減少比特率以處理網(wǎng)絡路由要求?;诩壜?lián)方式的編碼轉換器可重復使用來自輸入流的MV,并且因而可免除運動估計(ME),它屬于最有效率的比特率編碼轉換器之一?;诩壜?lián)方式的編碼轉換器可對輸入的比特流解碼,以獲得MV,并且形成參考幀。然后可使用一比特率控制機構而將此信息編碼,以便以想要的比特率產(chǎn)生一輸出比特流。
空間分辨率編碼轉換對于將來HDTV與SDTV的共存來說是個重要課題。因為因特網(wǎng)頻寬大小可能無法適用于廣播質量圖像,所以該編碼轉換對于視頻流應用是非常有益的。因此,將廣播質量比特流下采樣成可處理分辨率比特流是人們所希望的。因為它明顯減少了系統(tǒng)的復雜度,所以空間分辨率編碼轉換通??稍趬嚎s(DCT)領域執(zhí)行。在壓縮域的下采樣處理中包括對兩個參數(shù)的處理,即是DCT系數(shù)與MV。一種下采樣過濾器及其快速算法可建議用來執(zhí)行DCT系數(shù)下采樣。MV再采樣可在實際的產(chǎn)品中用來找到下采樣視頻的MV,以避免漂移,其余的運動補償應該重新轉換,以便從輸入比特流取代近似DCT系數(shù)。
1.高級別比較結構MPEG-2與MPEG-4可采用類似視頻壓縮算法?;旧希瑑蓸藴适遣捎眠\動預測,以便在DCT域中利用時間相關性與量化,以便在一幀內(nèi)使用時間相關性。此部分在高級別上描述MPEC-2與MPEG-4解碼器的結構,然后描述在兩標準之間的不同。
1.1MPEG-2圖1顯示MPEG-2的簡化視頻解碼處理。在解碼器100中,編碼的視頻數(shù)據(jù)可提供給一可變長度解碼功能110,以便提供一維空間數(shù)據(jù)QFS[n],其中n是在0-63范圍內(nèi)的系數(shù)索引。在逆向掃描功能120中,QFS[n]可轉換成由QF[v][u]表示的系數(shù)二維空間數(shù)組,其中數(shù)組索引u和v是在0到7的范圍內(nèi)。反量化功能130可應用適當?shù)姆戳炕阈g,以便提供最后重建的頻域DCT系數(shù)F[v][u]。逆向DCT功能140可產(chǎn)生像素(空間)域值f[y][x]。運動補償功能150可響應幀存儲160,及用以產(chǎn)生解碼像素d[y][x]的值f[y][x],其中y和x是像素域中的笛卡爾坐標。
MPEG-2可在宏塊級別上進行運動補償,在塊級別上進行DCT變換,在系數(shù)級別上進行行程和無損編碼。而且,MPEG-2允許采用三類型的圖像,即I-、P-、和B-圖像。所允許的運動預測模式(向前、向后、雙向)可指定為P-和B-圖像。MPEG-2采用交織編碼工具,以便更有效地處理交織視頻源。
1.2MPEG-4圖2顯示沒有任何可縮放特征的MPEG-4視頻解碼處理。
在解碼器200上,來自一信道的數(shù)據(jù)可從解復用210輸出。形狀數(shù)據(jù)的編碼比特流可連同MPEG-4項video_object_layer_shape(其表示例如目前的圖像是否為矩形、僅為二進制或灰度圖像)而提供給開關215。如果video_object_layer_shape是等于“00”,那么不需要二進制形狀解碼。否則,要進行二進制形狀解碼。
如果執(zhí)行二進制形狀解碼,形狀解碼功能220可接收先前重建的VOP230(其可儲存在存儲器),并且將形狀解碼的輸出提供給運動補償功能240。運動補償功能240可接收來自運動解碼功能235的輸出,其隨后可從解復用210接收運動編碼比特流。運動補償功能240亦可接收先前重建的VOP230,以便將輸出提供給VOP重建功能245。
除了來自形狀解碼功能220的輸出之外,VOP重建功能245亦可從結構解碼功能250接收數(shù)據(jù),接著可從解復用210接受紋理編碼流。結構解碼功能250包括可變長度解碼功能255、逆向掃描功能260、逆向DC與AC預測功能270、反量化功能280、及逆向DCT(IDCT)功能290。
相比MPEG-2,在MPEG-4中可使用幾個新工具,以增加特征及相互影響,例如,子畫面編碼、形狀編碼、靜態(tài)紋理編碼、可縮放性、與錯誤彈性。而且,在類似MPEG-2的MPEG-4中的運動補償與紋理編碼工具可被修改,以改善編碼工具的編碼效率,例如直接模式運動補償、無限制運動補償、及高級預測。
特別是,直接模式運動補償可用于B-VOP。明確地說,它可通過采用I-或P-VOP宏塊MV以及將他們定標以取得在B-VOP中宏塊的順向及逆向MV的雙向運動補償。每個宏塊只允許一個ΔMV。實際的MV可從Δ向量計算,而且定標的MV可從共同的宏塊計算。
無限制運動補償允許每個宏塊有1或4個MV。4個MV模式只可在直接模式的B-VOP中使用。注意,色度宏塊的MV是來自它相關亮度宏塊的4個MV的平均。此外,無限制運動補償允許MV指出該參考幀(外部結構從邊緣像素填補)。
高級預測為MV與DCT系數(shù)規(guī)定了預測方法。MV預測器是根據(jù)其三個相鄰MV的中間值而設定。內(nèi)部DCT系數(shù)的預測遵循內(nèi)部AC/DC預測程序(Graham規(guī)則)。
2.編碼轉換器結構圖3根據(jù)本發(fā)明,且具有失效B幀的低復雜度的從MPEG-2到MPEG-4編碼轉換器。
在MPEG-2與MPEG-4結構之間的類似允許實現(xiàn)低復雜度的(從MPEG-2到MPEG-4)編碼轉換器。MPEG-2到MPEG-4編碼轉換器300使用DCT系數(shù)與MV來產(chǎn)生MPEG-4比特流,而無需實際執(zhí)行運動估計處理過程,而不是將MPEG-2比特流整個解碼成空間(像素)域級別。不利因素是此結構會造成重建幀的漂移,而且不允許比特率控制。但是,因為在MPEG-2與MPEG-4解碼器之間的大部分不同是在無損失編碼部分,所以漂移問題很小。
編碼轉換器300中包含一個級聯(lián)MPEG-2比特流讀取器(解碼器)(310-330)以及一個MPEG-4標頭與紋理編碼器(340-370),并具有一標頭解碼功能304、一查找表308、及一通信路徑312。編碼轉換器300可讀取一輸入MPEG-2比特流,其可在DCT系數(shù)與剩余MV上的功能310中執(zhí)行可變長度解碼(VLD),然后遵循MPEG-2邏輯以找出在幀中每一塊的DCT系數(shù)及/或MV。
標頭解碼功能304可解碼MEPG-2標頭,并且將它們提供給查找表(或類似功能)308,其可使用下列詳述的表格以獲得相應MPEG-4標頭。
通過標頭、DCT系數(shù)及/或MV的信息,編碼轉換器300可將此信息編碼成MPEG-4格式。注意,參考幀在此結構中不需要。
編碼轉換器300可從輸入比特流讀取MPEG-4標頭,并且在一輸出比特流的固定位置寫入相應MPEG-4標頭。
在VLD310處理之后,可將數(shù)據(jù)提供給逆向掃描功能320、及一反量化功能330。其次,隨著經(jīng)由路徑312提供的MPEG-4標頭信息,解碼的DCT系數(shù)數(shù)據(jù)可在MPEG-4標頭及包括一量化功能340的紋理編碼器、及用以將量化DCT系數(shù)不同編碼的AC/DC預測功能350上進行處理。特別是,AC/DC預測處理可通過減去DC系數(shù)及AC系數(shù)的第一列或第一行而在一個內(nèi)部MB中產(chǎn)生一剩余DC與ACDCT系數(shù)。預測器可適當選取。注意,AC/DC預測功能350不需要MPEG-4標頭信息。
隨后,一個掃描/游程長度編碼功能360及一可變長度編碼功能370可提供MPEG-4比特流。
圖4顯示一種編碼轉換器結構,它根據(jù)本發(fā)明,并使能B幀,而將漂移誤差最小化。
相同編號的組件于對應的圖中是表示類似組件。
為了解決在重建幀中的漂移,及缺乏比特率控制的問題,可采用像編碼轉換器400那樣更為復雜的結構,它是圖3中編碼轉換器300一個擴展。此結構實際可計算紋理/剩余數(shù)據(jù)的DCT系數(shù),因此需要運動補償。因為此編碼轉換器的編碼器中包括一解碼處理,所以可減少漂移誤差。
而且,因為MPEG-4不允許B幀的內(nèi)部模式,所以編碼轉換器400可使用B幀將比特流編碼轉換。編碼轉換器400可在內(nèi)部模式中處理B幀(在MPEG-2)中的一個塊,當作在中間模式(在MPEC-4)中具有一個零MV的塊。因為MV是與PMV相反的預測編碼,所以它可以是一個零剩余MV(PMV)或零MV(其可產(chǎn)生一非零MV碼)。
特別是,編碼轉換器400中包括一可變長度解碼功能405,其可將MV殘留數(shù)據(jù)提供給MV解碼器425,而且可將DCT系數(shù)數(shù)據(jù)提供給逆向掃描功能320。DCT數(shù)據(jù)可通過反量化功能330及逆向DCT功能420處理,以獲得像素域數(shù)據(jù)。內(nèi)部編碼像素數(shù)據(jù)可經(jīng)由路徑422而提供給緩沖器,而內(nèi)部編碼像素數(shù)據(jù)可經(jīng)由路徑424而提供給加法器435。
在路徑424上的像素(不同)路徑448可從運動補償功能430(響應MV解碼器425)而加入?yún)⒖枷袼財?shù)據(jù),以便經(jīng)由路徑448將中間編碼數(shù)據(jù)提供給緩沖器450。
對于例如MPEG-4格式的重新編碼而言,緩沖器450可將內(nèi)部像素數(shù)據(jù)直接輸出給DCT功能455,或將內(nèi)部像素數(shù)據(jù)輸出給減法器445,其中與有關來自運動補償功能440(響應MV解碼器425)輸出不同的數(shù)據(jù)可提供給DCT功能455。
DCT系數(shù)從DCT功能455提供給量化功能340,而且然后將量化后的DCT數(shù)據(jù)提供給AC/DC(DCT系數(shù))預測功能350,其中數(shù)據(jù)流MB的AC與DC剩余可產(chǎn)生。DCT系數(shù)的這些剩余可被熵編碼。輸出數(shù)據(jù)可提供給掃描/游程長度編碼功能360,而且其輸出可提供給該可變長度編碼功能370,以獲得與MPEG-4兼容的比特流。
量化DCT系數(shù)亦可從量化功能340輸出給反量化功能495,其輸出可提供給逆向DCT功能490,其輸出是在加法器485與運動補償功能440的輸出的和。加法器485的輸出可提供給緩沖器480,而且隨后提供給運動補償功能440。
標頭解碼功能304與查找表308及路徑312可如圖3的討論而操作,以便在功能340-370上控制MPEG-4格式的重新編碼。
3.格式編碼轉換器的實現(xiàn)此部分是描述例如上述圖3和4及稍后在圖5實現(xiàn)的格式編碼轉換。未明確討論的實現(xiàn)細節(jié)(例如,時間記錄與類似使用的系統(tǒng)相關細節(jié))對于本領域中的技術人員來說應該是不言自明的。
在一特別實施例中,本發(fā)明的編碼轉換器可用來將主輪廓、主要級別(MP@ML)MPEG-2比特流轉換成主輪廓MPEG-4比特流。假設MPEG-2比特流是在幀圖像結構中使用B視頻編碼法(沒有雙重主要預測)編碼。通常,使用在MPEG-2編碼的相同編碼模式應該保持。此模式在MPEG-4可能是最適宜的,因此可避免模式?jīng)Q定處理的復雜度。在MPEG-4的透明圖案始終是1(在一個VOP中具有與VOP相同大小的一矩形物體)。也就是說,MPEG-4允許通過一非零透明圖案所定義的一個任意形狀物體。此特征在MPEG-2中并不存在,所以可安全地假設編碼轉換物體的所有透明圖案是1。
3.1MPEG-2比特流讀取器根據(jù)本發(fā)明的一編碼轉換器可從MPEG-2比特流獲得比特流標頭、DCT系數(shù)與MV。此信息可與比特流混合在一起。MPEG-2與MPEG-4比特流皆采用由數(shù)層所組成的一種等級結構。每層以標頭開始,隨后是其多個子層。在如表1所示的這種實現(xiàn)中,除了未使用在MPEG-4而在MPEG-2的子層之外,MPEG-2層可直接轉換成MPEG-4層。MPEG-4的DC系數(shù)與預測MV是在該子層開始的塊上重新設定。
然而,一些MPEG-4標頭是不同于MPEG-2標頭,反之亦然。幸運地,MPEG-2的限制與MPEG-2標頭信息足夠指定MPEG-4標頭。表2至6是列出MPEG-4標頭及其有關一MPEG-2標頭、或每層的限制。表1.在MPEG-2與MPEG-4層之間的關系

表2.MPEG-4標頭及其衍生(VOS和VO)


表3.MPEG-4標頭及其衍生(VOL)




表4.MPEG-4標頭及其衍生(VOP)


表5.MPEG-4標頭及其衍生(宏塊與MV)


表6.MPEG-4標頭及其衍生(塊及交織信息)


表7.MPEG-2的frame_rate_code映射到MPEG-4的vop_time_increment_resolution和fixed_vop_time_increment。

MV數(shù)據(jù)儲存在宏塊層。具有多達4個MV可用于每個宏塊。而且,一個MV可以是場類型或幀類型,而且具有整個像素或半像素分辨率。MPEG-2MV解碼處理過程可用來確定motion_code(VLC)與motion_residual(FLC)以及Δ。結合對MV的組合的預測,Δ可提供場/幀MV。跳越宏塊的MV可設定成零。
DCT數(shù)據(jù)儲存在塊層。它先從比特流(VLC)解碼,使用曲折或交互掃描模式而逆向掃描,然后反量化。內(nèi)部DC系數(shù)可從dct_dc_differential和預測器(預測器可根據(jù)MPEG-2規(guī)格而重新設定)決定。在跳越宏塊中的DCT系數(shù)設定成零。
3.2紋理編碼根據(jù)本發(fā)明的一編碼轉換器可重復使用DCT系數(shù)(有關中間幀)。要采用如下準則1.將q_scale_type(線性比例)用于MPEG-2量化中。
2.MPEG量化方法只可(非H.263)在MPEG-4量化中使用,以減少在重建幀MPEG-2與MPEG-4之間的不匹配。
3.MPEG-2QP的差值可決定在MPEG-4的dquant。每當差別值大于±2時,dquant便可設定成±2。dquant是一個2位碼,它指定在量化器、quant有關I-和P-VOP的變化。
4.量化矩陣應該隨著MPEG-2比特流的矩陣變化而改變。
5.編碼轉換器在VOL級別上允許一種交替垂直掃描方法(用于交織序列),從而具有靈活性。
6.內(nèi)部AC/DC預測(當目前塊的QP不同于預測塊時便包括定標)應該在一宏塊級別上關閉,以減少在AC量化的復雜度與不匹配。
7.可使用intra_dc_vlc_thr獲得較高效率,以選取用以編碼內(nèi)部DC系數(shù)的適當VLC表(AC/DC),例如,當作量化參數(shù)的一功能(除了當intra_dc_vlc_thr是0或7之外,這些臨界值將強迫使用內(nèi)部DC或AC表,而不管QP)。
8.跳過的宏塊編碼為not_coded宏塊(所有DCT系數(shù)是零)。
9.cbpy和cbpc(CBP)根據(jù)code_block_pattern_420(CBP_420)設定。注意,在MPEG-4的CBP與一內(nèi)部宏塊MPEG-2的CBP_420之間有微小的非一致性。明確地說,當CBP_420設定時,它表示在該塊中至少有一個DCT系數(shù)不為零。CBP包含類似的信息,除了它不對應在一個內(nèi)部宏塊(亦因intra_dc_vlc_thr而定)的DC系數(shù)之外。因此,當CBP_420在內(nèi)部宏塊(此情況會在I-VOP和P-VOP發(fā)生,但是不會在B-VOP發(fā)生)為零時,CBP可能會不是零。
在紋理編碼中有3個損失來源,它們是QP編碼、DC預測、與DC量化的非線性定標器。MPEG-4使用不同編碼來將QP編碼。MPEG-2在5位的使用上允許所有可能32個QP值。然而,不同值可采用多達±2(以QP值單元),因此,大于±2的一差值會損失。此損失能通過MPEG-2率控制算法限制在宏塊中的QP變動而減少。所有內(nèi)部宏塊可執(zhí)行適合的DC預測,其可采用不同于先前宏塊(MPEG-2DC預測)的預測,從而造成量化的不同DC剩余。因為非線性定標器,所以在MPEG-4中所有內(nèi)部宏塊的DC系數(shù)也要以不同于MPEG-2的方式量化。因此,MPEG-2與MPEG-4編碼的量化DC系數(shù)可能不同于一內(nèi)部宏塊。
3.3MV編碼編碼轉換器可將MV編碼成MPEG-4格式。然而,因為MV編碼是無損處理,所以從MPEG-2到MPEG-4的MV編碼轉換沒有誤差。下列限制將施加在MPEG-4編碼器中1.無限制運動補償模式無效,其表示在幀邊界外是沒有MV指標。
2.可采用高級預測模式。在MPEG-4比特流中使用了不同的預測器(一中間值),但用于8×8像素塊的MV是相同的。也就是說,高級預測模式允許8×8MV與非線性(中央濾波器)預測器。在我們的格式編碼轉換器中只采用了一種非線性預測器(我們?nèi)匀槐3?6×16MV)。
3.直接模式是不允許用于MPEG-4比特流,這表示只有有關B-VOP的4個MV類型,亦即,16×16正向與反向向量及16×8正向與反向場向量。
4.每當使用16×8場向量(維持模式)時,便可應用場運動補償。
5.跳過的宏塊可編碼為not_coded宏塊(具有零MV的運動補償)。
6.單一f_code允許在MPEG-4使用。因此,在MPEG-2的兩方向(垂直、水平)之間的較大f_code可根據(jù)f_code(MPEG-4)=f_code(MPEG-2)-1關系式而轉換成在MPEG-4的f_code。
7.因為整個參考幀的紋理是已知的,所以不使用填補處理。
8.每當兩個主要算法啟動時,可使用場運動補償。向量(參考場與預測幀場)可保留。場MV可根據(jù)以MPEG-2比特流編碼的向量
[10]而產(chǎn)生。當相同核對的預測使用(例如,頂端場到頂端場、或底部場到底部場)時,兩場MV都是向量
[10]。當奇數(shù)核對的預測使用(例如,頂端場到底部場、或底部場到頂端場)時,頂端場MV可使用向量[2]
[10],而且底部場MV可使用向量[3]
[10]。r=2,3的向量[r]
可依下式計算(a)Vector[r]
[01=(vector
×m[parity_ref][parity_pred]//2)+dmvector

(b)Vector[r]
[1](vector
[1]×m[parity_ref][parity_pred]//2)+e[parity_ref][parity_pred]+dmvector[1]。
注意,(m[parity_ref][parity_pred]和e[parity_ref][parity_pred]是分別在MPEG-2規(guī)格(ISO/IEC 13818-2)的表7-11和7-12中定義。
而且,“r”表示MV的順序,例如,第一、第二、及其他等。r=0表示MV的第一組,而且r=1表示MV的第二組。雙主要預測使用r=2和r=3以識別兩額外組的MV。
“//”表示整數(shù)除法四舍五入到近似整數(shù)值。
3.4B-VOP的內(nèi)部MB編碼當編碼在MPEG-2比特流(例如,如圖4顯示)的B幀中的一內(nèi)部MB進行時,必需要額外轉換。對于B-VOP,MPEG-4可用直接模式取代內(nèi)部模式,從而在B幀中的一內(nèi)部MB必須在MPEG-4語法中不同編碼。此問題有兩實際解決方法。
第一個解決方法采用類似圖3(整個參考幀沒有緩沖器)的MPEG-2到MPEG-4編碼轉換器的結構。在此MB非常接近它參考MB(它的未壓縮版本)的假設下,MC在相同VOP中的執(zhí)行可不同于先前的MB,而無需使用一MB大小的額外內(nèi)存補償剩余結構。內(nèi)部MB的MV等于偏移它MB距離之先前MB的MV。
第二解決方法采使用類似在圖4中所顯示的結構。它可保存所有I-及P-VOP的參考幀。注意,MC在此解決方法中必須在所有P-VOP上執(zhí)行。內(nèi)部MB的MV是與預測的MV(它3個相鄰的中位數(shù))相同,而且MC的執(zhí)行與所取得的MV所指出的參考MB相反。
4.壓縮域的視頻縮小化通常,視頻縮小化與尺度編碼轉換具有相同的意義。下采樣表示使用一個抗混疊(低通)濾波器的子采樣,但是子采樣與下采樣在此可交互使用。
當尺度編碼轉換的輸入與輸出是在壓縮域時,尺度編碼轉換便需要密集計算。在壓縮域中限制操作(而且,可有效避免解碼及編碼處理)的視頻縮小化處理可大大降低復雜度。然而,在壓縮域的縮小化中出現(xiàn)兩個新問題,亦即,DCT系數(shù)與MV數(shù)據(jù)的下采樣。
最近,在壓縮域的視頻縮小化算法已得到討論,但是討論中并未說明在MPEG-2與MPEG-4之間的整個編碼轉換,包括場到幀去隔行問題。本發(fā)明將解決這個問題。
第4.1和4.2節(jié)可將解決方法運用于下采樣處理的上述兩新問題。根據(jù)本發(fā)明的建議,尺度編碼轉換器實施是在圖5和6的第6節(jié)中描述。
4.1DCT塊的子采樣在以幀為基礎的視頻縮小化中,需要將4個8×8DCT塊合并成一個新的8×8DCT塊(包括一個場塊的具體細節(jié)將在稍后描述)。而且,輸出塊應該是輸入塊的一個低通版本。此處理可通過將輸入矩陣乘以一子采樣矩陣(最好使用一低通濾波器)而在空間域中實施。在空間域中乘以子采樣矩陣相當于在DCT領域中乘以一矩陣的DCT系數(shù),因為正交變換的分布特性。然而,在一些下采樣濾波器的DCT領域中的下采樣處理的運算(計算)次數(shù)可以是在空間域相對運算的總數(shù)。此問題的解決方法是采用稀疏下采樣矩陣(例如,一個只有小部分元素為非零值的矩陣,例如,大約30%或更低)。
稀疏下采樣矩陣基于在DCT基向量與DCT基向量對稱結構之間的正交屬性。在R.Dugad和N.Ahuja的“A Fast Scheme ForDownsampling And Upsampling In The DCT Domain,”InternationalConference on Image Processing(ICIP)99中討論了一個方法,在此僅列出供參考,該方法來自4個處理塊的較低4×4DCT系數(shù),將4×4IDCT應用到每個DCT子塊,形成一新的8×8像素塊,并且應用在一8×8DCT中,以獲得一個輸出塊。因為下采樣是固定,所以下采樣矩陣可預先計算。通過將8×8DCT矩陣分成左與右半部,下采樣矩陣的值大約一半是零,因為在4×4IDCT矩陣的欄與兩左與右8×4DCT矩陣的列之間是正交的。這種運算(一維空間)可依下列算術表示B=Tb=Tb1…b2=[TL...TR]T4tB1…T4tB2=TLT4tB1+TRT4tB2]]>
其中b是8×1空間輸入向量,B是它相對的8×1DCT向量,b1和b2是子子采樣的4×1向量,B1和B2是較低的4×1DCT向量,T是8×8DCT變換矩陣,T4是4×4DCT矩陣,TL和TR是T的左與右半部。上標“t”表示一矩陣轉置。Dugad的算法亦采用以DCT基向量的對稱屬性,以減少下采樣處理的復雜度。因為T的奇數(shù)列是非對稱的,而T的偶數(shù)列是對稱的,所以 和 的大小是相同(TLT4t(i,j)=(-1)i+jTRT4t(i,j),0≤i≤7,0≤j≤3).]]>“i”是一矩陣行索引,而且“j”是一矩陣列索引。因此, 和 可根據(jù)相同的組件計算,亦即,一對稱部分E(i+j是偶數(shù)的索引)、及一非對稱部分O(i+j是奇數(shù)的索引)(TLT4t=E+O]]>及TRT4t=E-O]]>)。當下采樣處理完成時,此配置便可有效減少2個因子的乘算數(shù)值B=TLT4tB1+TRT4tB2=(E+O)B1+(E-O)B2=E(B1+B2)+O(B1-B2)]]>將4個場塊轉換成一幀塊的Dugad方法實施上不簡單。此情況(一維空間)中,下采樣處理的擴展可如下所示B=T(STT4tBT+SBT4tBB)]]>其中BT和BB是較低的4×1場向量,ST和SB是分別對應它頂端ST及底端SB的一個8×4解交織矩陣DCT值?;蛘?,如果(j=2i,0≤i≤3)及SB(i,j)=0,ST的組件ST(i,j)=1?;蛘?,如果(j=2i+1,O≤j≤3)及SB(i,j)=0,SB的組件SB(i,j)=1。
為此,根據(jù)本發(fā)明用以下采樣及解交織的Dugad算法修改。
因為S和T不是彼此正交,所以縮小化與解交織處理的操作會更復雜,因此,下采樣矩陣不是稀疏矩陣。在此僅列出供參考的于1999年8月于IEEE Trans.Circ.and Syst.For Video Technol.,第9冊,第696-700頁,由C.Yim和M.A.Isnardi發(fā)表的名稱“An EfficientMethod For DCT_Domain Image Resizing With Mixed Field/Frame-ModeMacroblocks”中建議一個場塊下采樣的有效方法。一個低通濾波器(其下采樣矩陣(S=0.5[I8I8])是稀疏的)整合在解交織矩陣中。
I8表示一8×8恒等矩陣,而且[I8I8]表示包含連結成兩恒等矩陣的一16×8矩陣。當然,恒等矩陣在對角線全部是1,而其他全是零。
該方法是使用4個8×8IDCT場塊開始,然后應用下采樣矩陣S,并且執(zhí)行8×8DCT,以獲得輸出塊。注意,8×8IDCT是使用在此方法,以取代4×4IDCT。此運算是如下式(在一維空間)所示D=TSTt00Tt=12T[I8...I8]Tt00Tt=12[I8...I8]]]>4.2MV數(shù)據(jù)的子采樣ME是整個視頻編碼處理的瓶頸。因此,可通過使用4個最初MB的MV而估計改變尺度MD的MV,而無需實際執(zhí)行ME(假設所有MB是以中間模式編碼)。注意,假設有一MPEG-2比特流,因為每個MB具有一輸入(只有一MPEG-4比特流對于每個塊可具有一MV),所以MV數(shù)據(jù)的子采樣可采用4個MB的MV。最簡單解決是將4個MV一起平均,以獲得新的MV,但是當這些4個MV是不同時,便會出現(xiàn)不佳的估計。在1999年9月于IEEE Trans.Circ.and ForVideo Technol.,第9冊,第929-936頁,由B.Shen,I.K.Sethi和B.Vasudev發(fā)表名為“Adaptive Motion-Vector Resampling For CompressedVideo Downscaling”的文章中顯示一較好結果,其中可通過將更多加權提供給最壞預測MV而獲得。對每個MV的一個匹配精確A可通過在該MB的非零AC系數(shù)的數(shù)量表示。通過使用Shen等人的技術,下采樣MB的新MV可依下式計算MV′=12Σi=14MViAiΣi=14Ai]]>M.R.Hashemi、L.Winger、和S.Panchanathan發(fā)表的名為“Compressed Domain Motion Vector Resampling For Downscaling OfMPEG Video,”ICIP 99中建議一種非線性方法,可用來估計改變尺度MB的MV。類似Shen等人的算法,Hashemi的技術采用處理MB的空間運動而估計新的MV。在Hashemi方法中使用了稱為最大平均相關性(MAC)的一種啟發(fā)式測量,以在輸出MV的該等4個最初MV中識別出其中一個。通過使用MAC,縮小化MB的新MV可依下列計算MV=maxΣi=14Aiρdi]]>其中ρ是空間相關性,并且設定成0.85,而且di是在第i輸入MV(MVi)與輸出MV之間的歐氏距離。
5.尺度編碼轉換器的實施圖5是根據(jù)本發(fā)明而描述的尺度編碼轉換器。B幀可出現(xiàn)在輸入比特流中,但是可通過編碼轉換器被丟棄,因此不會出現(xiàn)在輸出比特流中。
在編碼轉換器500中,可加入MV定標功能510、DCT定標功能520、及空間定標功能540。開關530和535可協(xié)調運作,所以在第一設定中,DCT功能455的輸出可導入量化功能340,而且開關535可關閉,以允許空間定標功能540的一輸出可輸入加法器445。在開關530和535的第二設定中,DCT定標功能520的輸出可導入量化功能340,而且開關535可打開。
編碼轉換器500可將MPEG-2比特流轉換成對應較小尺度視頻圖像的MPEG-4比特流內(nèi),例如,從ITU-R601(720×480)到SIF(352×240)。
若要實現(xiàn)MPEG-4比特流的頻寬需求,編碼轉換器500可在水平與垂直方向(在空間定標功能540)對兩視頻子采樣,并且跳過所有B幀(在時間定標功能545和546),藉此減少時間分辨率。注意,時間定標功能546可在DCT定標功能520之后選擇性提供。在執(zhí)行縮小化之前的B幀跳越可減少復雜度。
而且,在子采樣之前的低通濾波器(可在空間定標功能540)將可改善視頻質量。
可略加修改,使本發(fā)明擴充,包括其他下采樣因子與B-VOPs。明確地說,可實現(xiàn)MV縮小化變化與模式?jīng)Q定。B-VOP的MV縮小化是包括逆向MV的一直接擴展。B-VOP的模式?jīng)Q定能以P-VOP(例如,通過將單向MV轉換成雙向MV,同樣可在一P-VOP將內(nèi)部MB轉換成中間MB)的類似方式處理。
下面,我們討論有關尺度編碼轉換器500的6個問題。同樣假設輸入影像是704×480像素分辨率,而且使用MP@ML MPEG-2編碼器編碼,而且希望輸出是包含SIF處理影像(使用N的一幀率減少)的簡單輪廓MPEG-4比特流。然而,本發(fā)明可擴展到其他輸入與輸出格式、及分辨率。
5.1逐行掃描視頻MV縮小化處理(亮度)當所有4個MB以中間模式編碼、及使用幀預測時,此問題便會出現(xiàn)。在這些MES的每個MV是在每個方向(水平與垂直)以2縮小,以決定4個塊MPEG-4(MPEG-4允許每個8×8塊有一MV塊)的MV。定標的MV然后可通過使用正常MPEG-4程序而預測性編碼(使用一中央濾波器)。
注意,每個MB(包含4個塊)必須在MPEG-2與MPEG-4中以相同模式編碼。隨著視頻縮小化,輸出MB(4個塊)對應4個輸入MB。
5.2隔行掃描視頻MV下采樣(亮度)當所有4個MB以中間模式編碼并使用場預測時,此問題便會存在。需要在每個MB中將兩個場MV組合,以符合改變塊的一幀MV。建議的編碼轉換器可根據(jù)它相鄰的MV而取得新的MV,以取代根據(jù)空間運動而設定新的MV。所有8個周圍MB的MV可用來找到一預測器(場MV可在MB具場預測的情況而平均)。來自這些8個MV的中間值可變成一預測器,而且從歐氏距離接近的目前MB的場MV在水平方向是以2定標,以變成新的MV。
5.3MV下采樣(色度)當所有4個MB以中間模式編碼、及使用幀或場預測(MPEG-4能以相同方式處理有關一色度塊的兩預測模式)時,此問題便會發(fā)生。該處理遵循MPEG-4方法,以便從亮度MV獲得一色度MV,亦即,一色度MV是4個對應8×8亮度MV平均的縮小版。
5.4DCT下采樣(亮度逐行掃描、色度)當所有4個亮度MB內(nèi)部或相互間模式編碼、使用幀MD結構、及它們的8個色度塊(4個用于Cr,而且4個用于Cb)使用幀或場結構時,此問題便會發(fā)生。Dugad的方法可通過在每一方向的2因子而用來縮小化亮度與色度DCT塊。
5.5交織DCT下采樣(亮度)此問題會以兩方法之中任一個出現(xiàn)。首先,相關MB使用場預測,其次,它的相關MD使用幀預測。在任何情況下,希望將4個8x8場DCT塊(2個用于頂端場,而且2個用于底部場)縮小成一8×8幀DCT塊。第一種情況的解決方法是要使用相同場DCT塊,當作MC的選取之一。第二種情況包括解交織,而且建議將上述的Dugad和Yim方法組合。
明確地說,編碼轉換器可根據(jù)Yim算法而在垂直方向(而且同時執(zhí)行解交織)先將4個場塊縮小,以獲得兩幀塊。編碼轉換器然后可在水平方向將這些兩幀塊縮小,以便通過使用Dugad算法而獲得輸出塊。
在圖6中,4個8×8系數(shù)場模式DCT塊是在600顯示,兩個8×8幀模式DCT塊是在610顯示,而且1個8×8幀模式DCT塊是在620顯示。
根據(jù)本發(fā)明的DCT縮小化程序可概述如下1.通過如在600的顯示將4個場塊組合而形成16×16系數(shù)輸入矩陣。
2.對于垂直縮小化與濾波而言,根據(jù)Yim的算法而將一低通(LP)濾波器D應用到輸入矩陣的每一列。LP輸入矩陣如610的顯示目前是16×8像素。
3.從LP矩陣([B1B2])可形成B1和B2 8×8矩陣。
4.根據(jù)Dugad的算法執(zhí)行B1和B2的每一欄的水平縮小化運算,以獲得輸出矩陣(8×8)。(620)可依下列計算B=B1(TLT4t)t+B2(TRT4t)t=(B1+B2)E+(B1-B2)O]]>其中E和O表示如上述的偶數(shù)與奇數(shù)列。
特別是,由如下示的奇數(shù)“O”與偶數(shù)“E”矩陣組成的一水平下采樣矩陣可使用(忽略定標因素)E=[ e(0) 0 0 0,0e(1) 0 e(2),00 0 0,0e(3) 0 e(4),
0 0 e(5) 0,0 e(6) 0 e(7),0 0 0 0,0 e(8) 0 e(9)].
O=[0 0 0 0,o(0) 0 o(1) 0,0 o(2) 0 0,o(3) 0 o(4) 0,0 0 0 0,o(5) 0 o(6) 0,0 0 0 o(7),o(8) 0 o(9) 0].
下列系數(shù)可使用e(0)=4 o(0)=2.56915448e(1)=0.831469612 o(1)=-0.149315668e(2)=0.045774654 o(2)=2e(3)=1.582130167 o(3)=-0.899976223e(4)=-0.195090322o(4)=1.026559934e(5)=2 o(5)=0.601344887e(6)=-0.704885901o(6)=1.536355513e(7)=0.980785280 o(7)=2e(8)=0.906127446 o(8)=-0.509795579e(9)=1.731445835 o(9)=-0.750660555.
本質上,一DCT稀疏矩陣的乘積是當作下采樣矩陣使用。
該技術通??蓴U充用于一N×N塊的2∶1縮小,其包括4個N/2×N/2系數(shù)場模式塊。其他縮小比率亦可適用。
5.6特殊情況當所有4個MB不是以相同模式(不落下在任何一五個先前情況)編碼時,特殊情況便會發(fā)生。我們始終假設在其他內(nèi)部MB之中任何內(nèi)部或跳過MB是在具零MV的中間模式。場MV可根據(jù)第5.2節(jié)而合并,以獲得幀MV,然后應用第5.1節(jié)的技術。MC建議決定內(nèi)部方塊的結構,其可通過編碼轉換器而當作具有一零MV的內(nèi)部塊處理。
6.結論可以理解,本發(fā)明可提供一種編碼轉換器結構,它具有較小誤差且具有最低可能復雜度。此誤差會在MPEG-4紋理編碼處理(QP編碼、DC預測、非線性DC定標器)產(chǎn)生。這些處理過程應該在未來的MPEG-4中移除,以建立一近似無損的編碼轉換系統(tǒng)。
本發(fā)明亦可提供一尺度編碼轉換器的整個細節(jié),以便將由MPEG-2 MP@ML編碼的ITU-R 601交織視頻編碼比特流轉換成簡單輪廓MPEG-4比特流,其包含適用于一種視頻流應用的SIF處理視頻。
對于場模式DCT塊的空間縮小化而言,建議以一種新的方式中將垂直與水平縮小化技術組合,以使稀疏下采樣矩陣可用于垂直與水平方向,藉此減少編碼轉換器的交換。
而且,對于MV縮小化而言,建議使用來自它8個相鄰MV的中間值。因為所預測的MV可與全局的MV使用,所以此建議比4.2節(jié)的算法較好。它亦能與只具有兩MV的一交織MB,而不是每個ME的4個MV。
雖然本發(fā)明已描述各種不同的較佳具體實施例,但可以理解,在本發(fā)明所附的權利要求范圍內(nèi),可作各種不同修訂與改編。
權利要求
1.一種對預壓縮的輸入比特流進行編碼轉換的方法,該輸入比特流為第一視頻編碼格式,該方法包含下列步驟恢復該輸入比特流的標頭信息;以第二不同視頻編碼格式提供相應的標頭信息;部分解壓縮該輸入比特流,以提供部分解壓縮的數(shù)據(jù);及根據(jù)第二格式的標頭信息而將部分解壓縮的數(shù)據(jù)重新壓縮,以提供一輸出比特流。
2.如權利要求1所述方法,其中該第一及第二視頻編碼格式分別包含一MPEG-2格式及一MPEG-4格式。
3.如權利要求1所述方法,其中該第一視頻編碼格式中包括MPEG-2主要級別的主輪廓;及該第二視頻編碼格式包括具標準中間格式(SIF)逐行掃描視頻的簡單輪廓MPEG-4比特流。
4.如權利要求1所述方法,其中該部分解壓縮的數(shù)據(jù)中包含運動向量及離散余弦變換(DCT)系數(shù);及該第二格式中包含一新模式?jīng)Q定、AC/DC預測、與運動補償三者中至少之一。
5.如權利要求1所述方法,其中至少有一查找表可用來提供該第二視頻編碼格式的對應標頭信息。
6.如權利要求1所述方法,其中縮小化是通過下采樣DCT系數(shù)與運動向量數(shù)據(jù)而在部分解壓縮的數(shù)據(jù)上執(zhí)行。
7.如權利要求1所述方法,其中通過執(zhí)行垂直下采樣及解交織而,在部分解壓縮數(shù)據(jù)的4個場模式離散余弦變換(DCT)塊的至少一組中,進行2∶1縮小化,以獲得一個兩幀模式DCT塊的對應組,及執(zhí)行兩幀模式DCT塊的水平下采樣,以獲得一幀模式DCT塊。
8.如權利要求7所述方法,其中該垂直下采樣亦可實現(xiàn)4個場模式DCT塊的低通濾波。
9.如權利要求7所述方法,其中該垂直與水平下采樣采用各自的稀疏矩陣。
10.如權利要求1所述方法,其中在重新壓縮步驟中,用于指定量化器變化的一個編碼(DQUANT)可根據(jù)部分解壓縮數(shù)據(jù)的量化參數(shù)的差值而設定。
11.如權利要求1所述方法,其中對于重新壓縮內(nèi)部編碼宏塊而言,編碼塊圖案(CBP)可根據(jù)該部分解壓縮數(shù)據(jù)的相應值而設定。
12.如權利要求1所述方法,其中對于重新壓縮非內(nèi)部編碼宏塊而言,該部分解壓縮數(shù)據(jù)中的被跳過的宏塊被編碼為not_coded(未編碼)宏塊,其中所有離散余弦變換(DCT)系數(shù)具有一零值。
13.如權利要求1所述方法,其中在重新壓縮步驟中,該部分解壓縮數(shù)據(jù)中被預測的運動向量可根據(jù)該第二格式而重新設定。
14.如權利要求1所述方法,其中在重新壓縮步驟中,該部分解壓縮數(shù)據(jù)的雙主要模式宏塊可轉換成場編碼宏塊。
15.一種用以在視頻數(shù)據(jù)上執(zhí)行2∶1縮小化的方法,其包含下列步驟通過組合4個N/2×N/2場模式DCT塊,而從該視頻數(shù)據(jù)形成N×N離散余弦變換(DCT)系數(shù)輸入矩陣中的至少一個;執(zhí)行該輸入矩陣的垂直下采樣及解交織,以獲得兩N/2×N/2幀模式DCT塊;可由兩幀模式DCT塊形成一N×N/2輸入矩陣;及執(zhí)行該N×N/2矩陣的水平下采樣,以獲得一N/2×N/2幀模式DCT塊。
16.如權利要求15所述方法,其中N=16。
17.如權利要求15所述方法,其中該垂直下采樣亦可實現(xiàn)該N×N輸入矩陣的低通濾波。
18.如權利要求15所述方法,其中該垂直下采樣使用一稀疏下采樣矩陣。
19.如權利要求18所述方法,其中該稀疏下采樣矩陣=0.5[I8I8],其中I8是8×8恒等矩陣。
20.如權利要求15所述的方法,其中該水平下采樣使用奇數(shù)“O”與偶數(shù)“E”所組成的一稀疏下采樣矩陣。
21.如權利要求20所述的方法,其中該偶數(shù)矩陣具有下列格式E=[e(0) 0 0 0,0 e(1)0 e(2),0 0 0 0,0 e(3)0 e(4),0 0 e(5)0,0 e(6)0 e(7),0 0 0 0,0 e(8)0 e(9)]其中e(1)至e(9)是非零系數(shù);及該奇數(shù)矩陣具有下列格式O=[ 0 0 0 0,o(0) 0 o(1)0,0 o(2) 0 0,o(3) 0 o(4)0,0 0 0 0,o(5) 0 o(6)0,0 0 0 o(7),o(8) 0 o(9)0]其中o(1)至o(9)是非零系數(shù)。
22.一種用于對預壓縮輸入比特流編碼轉換的裝置,該輸入比特流為第一視頻編碼格式,該裝置包括用以恢復該輸入比特流的標頭信息的裝置;以第二種不同視頻編碼格式提供相應標頭信息的裝置;用以部分解壓縮該輸入比特流,以提供部分解壓縮的數(shù)據(jù)的裝置;及用來根據(jù)第二格式的標頭信息而將部分解壓縮的數(shù)據(jù)重新壓縮,以提供一輸出比特流的裝置。
23.一種用以在視頻數(shù)據(jù)上執(zhí)行2∶1縮小化的裝置,其包括一種裝置,該裝置通過組合4個N/2×N/2場模式DCT塊,而從該視頻數(shù)據(jù)形成N×N離散余弦變換(DCT)系數(shù)輸入矩陣中的至少一個;用來執(zhí)行該輸入矩陣的垂直下采樣及解交織,以獲得兩N/2×N/2幀模式DCT塊的裝置;用來可由兩幀模式DCT塊形成一N×N/2輸入矩陣的裝置;及用來執(zhí)行該N×N/2矩陣的水平下采樣,以獲得一N/2×N/2幀模式DCT塊的裝置。
全文摘要
一種編碼轉換器結構,其具有最低可能的復雜度及較小誤差,例如可用來將MPEG-2比特流轉換成MPEG-4比特流。該編碼轉換器可從一輸入比特流讀取標頭信息,并且以新格式提供輸出比特流的一個相應標頭。在一具體實施例中(圖3),具有低復雜度的MPEG-2到MPEG-4編碼轉換器(具無效B幀)可避免需要運動補償處理過程。在另一具體實施例中(圖4),提供一種減少漂移誤差(具致能B幀)的編碼轉換器結構。在另一具體實施例中(圖5),例如,提供一尺度編碼轉換器(B幀有效)以便將使用MPEG-2 MP  ML編碼的ITU-R601隔行掃描視頻編碼轉換成一簡單輪廓的MPEG-4比特流,該MPEG-4比特流中包含SIF逐行掃描視頻,適用于流視頻應用。對于場模式DCT塊的空間縮小化,可結合垂直的和水平的縮小化技術,使用稀疏矩陣來減少計算量。
文檔編號G06T9/00GK1435056SQ01810849
公開日2003年8月6日 申請日期2001年5月25日 優(yōu)先權日2000年6月9日
發(fā)明者K·帕努索蓬, 陳學敏 申請人:通用儀器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1