專利名稱:一種視頻編碼比特率控制方法
技術(shù)領(lǐng)域:
本發(fā)明屬于數(shù)字視頻通信領(lǐng)域中的視頻信息的傳輸與處理領(lǐng)域,具體涉及一種視頻編碼比特率控制方法。
在限定失真信源編碼理論中,率失真(R-D)函數(shù)R(D)定義為給定信源消息概率分布{P(xi)}及平均失真函數(shù)允許失真D的前提下,編碼傳輸這些信源消息,并使其失真程度在允許范圍內(nèi)時,所需要的信息編碼傳輸編碼比特率的極小值?;赗(D)函數(shù)的定義,可以得到以下結(jié)論在允許一定失真的條件下,編碼比特率可以減小,同時所需要的信道容量也可以相應(yīng)地減小。并且允許的失真度越大,則編碼比特率可被壓縮的程度也越大。另一方面,從信源本身來看,若允許的失真度越大,則信源的發(fā)生率(即信源的時間熵)可被壓縮的程度也越大。這便引出了限定失真的信源編碼問題,也是數(shù)字信號編碼方法中率失真優(yōu)化的理論根據(jù)。
在數(shù)字視頻編碼系統(tǒng)中,編碼器的編碼比特率和圖像失真都與量化參數(shù)有關(guān),為了便于分析,一般采用編碼比特率-量化函數(shù)R(q)描述編碼比特率與量化參數(shù)的關(guān)系,同樣采用編碼失真-量化函數(shù)D(q)描述圖像失真與量化參數(shù)之間的關(guān)系。通過對這兩個函數(shù)的分析,進行數(shù)字信號編碼的率失真優(yōu)化,從而實現(xiàn)編碼比特率控制。然而,這種基于量化參數(shù)的編碼比特率函數(shù)和失真函數(shù)都具有很強的非線性特征,并且與信源的相關(guān)性很強。采用這種數(shù)學模型為編碼系統(tǒng)實現(xiàn)準確地編碼比特率-失真分析,必須建立非常復(fù)雜的編碼比特率函數(shù)和失真函數(shù)。如美國專利No.6,366,704,No.6,356,668,No.6,212,302,No.6,037,987,No.6,072,831和No.6,167,162中,在解決編碼比特率控制問題時,都采用了基于量化參數(shù)的編碼比特率-失真模型,這些模型要么比較簡單,采用量化參數(shù)的二階多項式近似描述非線性編碼比特率函數(shù),使其準確性受到一定限制;要么非常復(fù)雜,采用高階多項式描述非線性編碼比特率函數(shù),使其準確性得到改善,但計算復(fù)雜度又很高,難以應(yīng)用于實際的編碼系統(tǒng)中。
為實現(xiàn)上述發(fā)明目的,一種視頻編碼比特率控制方法,其特征在于包含以下幾個步驟①建立量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表;②根據(jù)編碼緩沖區(qū)的大小確定當前圖像的目標編碼比特數(shù);③利用給定變換比參數(shù)與量化后的變換系數(shù)的平均信息熵之間的比值,確定達到目標編碼比特數(shù)相應(yīng)的變換比參數(shù)的大小;④根據(jù)量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表,確定當前圖像編碼的量化參數(shù);⑤根據(jù)當前宏塊的失真度調(diào)整下一個宏塊的變換比參數(shù);⑥根據(jù)量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表,確定下一個宏塊編碼的量化參數(shù);重復(fù)步驟⑤,直至一幀所有宏塊編碼結(jié)束;
⑦根據(jù)編碼緩沖區(qū)的大小確定下一幀圖像的目標編碼比特數(shù);⑧根據(jù)當前圖像編碼所采用的變換比參數(shù)值與實際編碼比特數(shù)之間的比值,確定下一幀圖像編碼的變換比參數(shù)的大??;⑨根據(jù)量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表,確定下一幀圖像編碼的量化參數(shù);⑩重復(fù)步驟⑤-⑨,直到編碼結(jié)束。
本發(fā)明用于數(shù)字視頻編碼系統(tǒng)中,在傳統(tǒng)的基于量化參數(shù)的視頻編碼的編碼比特率控制方法所采用的率失真模型的基礎(chǔ)上,采用變換比參數(shù)重新構(gòu)造了新的率失真模型,并通過量化參數(shù)與變換比參數(shù)的對應(yīng)關(guān)系,實現(xiàn)快速、準確地編碼比特率控制。本發(fā)明具有如下主要優(yōu)點其一.變換比參數(shù)與編碼比特數(shù)之間具有良好的線性關(guān)系,有利于實現(xiàn)快速、準確地編碼比特率預(yù)測。
其二.變換比參數(shù)與編碼失真度之間具有良好的信源弱相關(guān)性,有利于實現(xiàn)快速、準確地編碼比特分配優(yōu)化。
其三.變換比參數(shù)與量化參數(shù)之間存在對應(yīng)關(guān)系,根據(jù)這種對應(yīng)關(guān)系,可以通過查找表的方式,快速實現(xiàn)編碼比特率的控制。
第一步建立量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表。
變換比參數(shù)p是原始圖像經(jīng)過離散余弦變換后,有編碼實際意義的系數(shù)(不被量化為零的系數(shù))的數(shù)目NT與原始像素數(shù)目N0的比值,即p=NT/N0。量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系通過公式p=1-1MΣ|x|<2qD0(x)-1MΣ|x|<2.5qD1(x)]]>得到。其中,D0(x)和D1(x)分別為幀內(nèi)編碼和幀間編碼宏塊的離散余弦變換系數(shù)分布,X為量化后的變換系數(shù)的取值,q為量化參數(shù),p為相應(yīng)的變換比參數(shù),M為當前圖像的像素數(shù)。
第二步根據(jù)編碼緩沖區(qū)的大小確定當前圖像的目標編碼比特數(shù)。
采用公式RT=CF-(B-0.2×BT)-RMV-RH]]>得到當前圖像的目標編碼比特數(shù)。其中,B為編碼已用緩沖區(qū)大小,C為信道帶寬,F(xiàn)為幀率,BT為緩沖器大小,RMV和RH分別為運動矢量和頭信息的編碼比特數(shù)。也可采用公式RT=CF×2.4×BT-B2×BT+B-RMV-RH]]>得到當前圖像的目標編碼比特數(shù)。其目的是根據(jù)緩沖區(qū)空滿狀態(tài)調(diào)整當前圖像預(yù)分配編碼比特數(shù)。本步驟一方面可有效控制信道傳輸延遲,另一方面可結(jié)合信道實際速率狀態(tài),調(diào)整每一幀預(yù)分配編碼比特數(shù),能夠有效利用信道當前帶寬。當B=0.2×BT,即編碼緩沖區(qū)充盈度為總緩沖區(qū)大小的20%時,當前幀預(yù)分配比特數(shù)RT等于平均編碼比特數(shù)CF-RMV-RH;]]>B>0.2×BT時,前幀預(yù)分配比特數(shù)RT小于平均編碼比特數(shù)CF-RMV-RH]]>,以防止編碼緩沖區(qū)上溢,可有效控制編碼傳輸延遲;B<0.2×BT時,前幀預(yù)分配比特數(shù)RT大于平均編碼比特數(shù)CF-RMV-RH]]>,以防止編碼緩沖區(qū)下溢,可有效利用當前傳輸帶寬;第三步利用給定變換比參數(shù)與量化后的變換系數(shù)的平均信息熵之間的比值,確定達到目標編碼比特數(shù)相應(yīng)的變換比參數(shù)的大小。
通過公式pT=RTH0·p0]]>確定目標編碼比特數(shù)所對應(yīng)的變換比參數(shù)的大小,其中pT為目標編碼比特數(shù)所對應(yīng)的變換比參數(shù)的大小,RT為目標編碼比特數(shù),p0為量化參數(shù)設(shè)為16時所對應(yīng)的變換比參數(shù)的大小,H0為量化參數(shù)設(shè)為16時經(jīng)過量化后的變換系數(shù)的平均信息熵。
第四步根據(jù)量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表,確定當前圖像編碼的量化參數(shù)。
第五步根據(jù)當前宏塊的失真度調(diào)整下一個宏塊的變換比參數(shù)。
對于當前編碼圖像的第一個宏塊,采用當前圖像的變換比參數(shù)進行編碼。對于下一個編碼宏塊的變換比參數(shù),由公式pi=1ai[lnaiσi2θi+1Σi=1Lθi(RT-Σi=1Lθiai·lnaiσi2θi)]]]>得到。其中,θi=Ri/pi,Ri為當前宏塊的實際編碼比特數(shù),pi為當前宏塊的變換比參數(shù),ai=1pilnσiDi]]>,σi為當前宏塊的標準差,Di為當前宏塊的失真度,RT是目標編碼比特數(shù),L為已編碼的宏塊數(shù)。
第六步根據(jù)量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表,確定下一個宏塊編碼的量化參數(shù)。
第七步根據(jù)編碼緩沖區(qū)的大小確定下一幀圖像的目標編碼比特數(shù)。具體實施方法與第二步相同。
第八步根據(jù)當前圖像編碼所采用的變換比參數(shù)值與實際編碼比特數(shù)之間的比值,確定下一幀圖像編碼的變換比參數(shù)的大小。
通過公式pn+1=RTRn·pn]]>確定下一幀圖像編碼的變換比參數(shù),其中pn+1為下一幀圖像編碼的變換比參數(shù),RT為目標編碼比特數(shù),pn為當前圖像編碼所采用的變換比參數(shù),Rn為當前圖像編碼的實際比特數(shù)。
第九步根據(jù)量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表,確定下一幀圖像編碼的量化參數(shù);第十步重復(fù)第五步到第九步,直到編碼結(jié)束。
可以看到,以上方法的運算量主要集中在獲得變換系數(shù)的分布過程中,其它環(huán)節(jié)中的計算只有加法和乘法運算。相對于整個編碼處理過程,計算復(fù)雜度很低。
本專利提出的比特率控制方法可以用于不同標準的視頻編碼系統(tǒng)中。這里以MPEG-2 TM5編碼系統(tǒng)為例,說明這種視頻編碼比特率控制方法的效果。在MPEG-2 TM5編碼系統(tǒng)中,采用本專利提出的視頻編碼比特率控制方法替代原有的方法,對測試序列“Foreman”、“Salesman”、“Tabletennis”和“Coastguard”分別進行編碼。
為了描述編碼比特率控制的執(zhí)行效率,定義相應(yīng)的控制誤差為;Erc=R-RTRT×100%]]>其中R和RT分別表示每幀圖像的實際和目標編碼比特數(shù)。表1中分別列出了實驗結(jié)果??梢钥闯觯緦@岢龅囊曨l編碼比特率控制方法在給定目標編碼比特率的條件下,有效實現(xiàn)了編碼比特率的控制,控制誤差與原始的MPEG-2TM5系統(tǒng)相比有明顯降低,大約低于2%。同時,圖像質(zhì)量也有顯著改善。平均PSNR提高了0.87dB。
表1將本方法用于MPEG-2 TM5中的編碼比特率控制結(jié)果
權(quán)利要求
1.一種視頻編碼比特率控制方法,其特征在于包含以下幾個步驟①建立量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表;②根據(jù)編碼緩沖區(qū)的大小確定當前圖像的目標編碼比特數(shù);③利用給定變換比參數(shù)與量化后的變換系數(shù)的平均信息熵之間的比值,確定達到目標編碼比特數(shù)相應(yīng)的變換比參數(shù)的大??;④根據(jù)量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表,確定當前圖像編碼的量化參數(shù);⑤根據(jù)當前宏塊的失真度調(diào)整下一個宏塊的變換比參數(shù);⑥根據(jù)量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表,確定下一個宏塊編碼的量化參數(shù);重復(fù)步驟⑤,直至一幀所有宏塊編碼結(jié)束;⑦根據(jù)編碼緩沖區(qū)的大小確定下一幀圖像的目標編碼比特數(shù);⑧根據(jù)當前圖像編碼所采用的變換比參數(shù)值與實際編碼比特數(shù)之間的比值,確定下一幀圖像編碼的變換比參數(shù)的大?。虎岣鶕?jù)量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系表,確定下一幀圖像編碼的量化參數(shù);⑩重復(fù)步驟⑤-⑨,直到編碼結(jié)束。
2.根據(jù)權(quán)利要求1所述的視頻編碼比特率控制方法,其特征在于,所述的步驟①中,量化參數(shù)與變換比參數(shù)之間的對應(yīng)關(guān)系通過公式p=1-1MΣ|x|<2qD0(x)-1MΣ|x|<2.5qD1(x)]]>得到;其中,D0(x)和D1(x)分別為幀內(nèi)編碼和幀間編碼宏塊的離散余弦變換系數(shù)分布,x為量化后的變換系數(shù)的取值,q為量化參數(shù),p為相應(yīng)的變換比參數(shù),M為當前圖像的像素數(shù)。
3.根據(jù)權(quán)利要求1或2所述的視頻編碼比特率控制方法,其特征在于,所述的步驟②和步驟⑦中,采用公式RT=CF-(B-0.2×BT)-RMV-RH]]>得到當前圖像的目標編碼比特數(shù);其中,B為編碼已用緩沖區(qū)大小,C為信道帶寬,F(xiàn)為幀率,BT為緩沖器大小,RMV和RH分別為運動矢量和頭信息的編碼比特數(shù)。也可采用公式RT=CF×2.4×BT-B2×BT+B-RMV-RH]]>得到當前圖像的目標編碼比特數(shù)。
4.根據(jù)權(quán)利要求1或2所述的視頻編碼比特率控制方法,其特征在于,所述的步驟③中,通過公式pT=RTH0·p0]]>確定目標編碼比特數(shù)所對應(yīng)的變換比參數(shù)的大小,其中pT為目標編碼比特數(shù)所對應(yīng)的變換比參數(shù)的大小,RT為目標編碼比特數(shù),p0為量化參數(shù)設(shè)為16時所對應(yīng)的變換比參數(shù)的大小,H0為量化參數(shù)設(shè)為16時經(jīng)過量化后的變換系數(shù)的平均信息熵。
5.根據(jù)權(quán)利要求3所述的視頻編碼比特率控制方法,其特征在于,所述的步驟③中,通過公式pT=RTH0·p0]]>確定目標編碼比特數(shù)所對應(yīng)的變換比參數(shù)的大小,其中pT為目標編碼比特數(shù)所對應(yīng)的變換比參數(shù)的大小,RT為目標編碼比特數(shù),p0為量化參數(shù)設(shè)為16時所對應(yīng)的變換比參數(shù)的大小,H0為量化參數(shù)設(shè)為16時經(jīng)過量化后的變換系數(shù)的平均信息熵。
6.根據(jù)權(quán)利要求1或2所述的視頻編碼比特率控制方法,其特征在于,所述的步驟⑤中,對于當前編碼圖像的第一個宏塊,采用當前圖像的變換比參數(shù)進行編碼;對于下一個編碼宏塊的變換比參數(shù),由公式pi=1ai[lnaiσi2θi+1Σi=1Lθi(RT-Σi=1Lθiai·lnaiσi2θi)]]]>得到;其中,RT是目標編碼比特數(shù),L為已編碼的宏塊數(shù),θi=Ri/pi,Ri為當前宏塊的實際編碼比特數(shù),pi為當前宏塊的變換比參數(shù),ai=1pilnσiDi]]>,σi為當前宏塊的標準差,Di為當前宏塊的失真度。
7.根據(jù)權(quán)利要求5所述的視頻編碼比特率控制方法,其特征在于,所述的步驟⑤中,對于當前編碼圖像的第一個宏塊,采用當前圖像的變換比參數(shù)進行編碼;對于下一個編碼宏塊的變換比參數(shù),由公式pi=1ai[lnaiσi2θi+1Σi=1Lθi(RT-Σi=1Lθiai·lnaiσi2θi)]]]>得到;其中,RT是目標編碼比特數(shù),L為已編碼的宏塊數(shù),θi=Ri/pi,Ri為當前宏塊的實際編碼比特數(shù),pi為當前宏塊的變換比參數(shù),ai=1pilnσiDi]]>,σi為當前宏塊的標準差,Di為當前宏塊的失真度。
8.根據(jù)權(quán)利要求1或2所述的視頻編碼比特率控制方法,其特征在于,所述的步驟⑧中,通過公式pn+1=RTRn·pn]]>確定下一幀圖像編碼的變換比參數(shù),其中pn+1為下一幀圖像編碼的變換比參數(shù),RT為目標編碼比特數(shù),pn為當前圖像編碼所采用的變換比參數(shù),Rn為當前圖像編碼的實際比特數(shù)。
9.根據(jù)權(quán)利要求7所述的視頻編碼比特率控制方法,其特征在于,所述的步驟⑧中,通過公式pn+1=RTRn·pn]]>確定下一幀圖像編碼的變換比參數(shù),其中pn+1為下一幀圖像編碼的變換比參數(shù),Rr為目標編碼比特數(shù),pn為當前圖像編碼所采用的變換比參數(shù),Rn為當前圖像編碼的實際比特數(shù)。
全文摘要
本發(fā)明公開了一種視頻編碼比特率控制方法,利用編碼比特數(shù)與變換比參數(shù)之間存在良好的線性關(guān)系,同時,編碼失真度與變換比參數(shù)之間存在良好的信源弱相關(guān)性,通過變換比參數(shù)實現(xiàn)編碼比特率的快速、準確地估計預(yù)測;根據(jù)預(yù)測結(jié)果與編碼緩沖區(qū)大小確定目標編碼比特數(shù);再通過變換比參數(shù)和量化參數(shù)之間的關(guān)系,調(diào)整編碼量化參數(shù),實現(xiàn)編碼比特率的控制;并根據(jù)編碼宏塊的失真度對編碼參數(shù)進行調(diào)整。本發(fā)明可實現(xiàn)快速、準確地編碼比特率預(yù)測、實現(xiàn)快速、準確地編碼比特分配優(yōu)化以及快速實現(xiàn)編碼比特率的控制。
文檔編號G06T9/00GK1434638SQ03118748
公開日2003年8月6日 申請日期2003年3月8日 優(yōu)先權(quán)日2003年3月8日
發(fā)明者張江山, 朱光喜 申請人:華中科技大學