專利名稱:基于人眼感知模型的碼率控制方法
技術領域:
本發(fā)明涉及數(shù)字視頻編碼技術,特別是涉及一種基于人眼感知模型的碼率控制方法。
背景技術:
碼率控制是視頻編碼的關鍵技術之一,是編碼器基于對網(wǎng)絡可用帶寬的估計決定要發(fā)送到信道上的視頻比特流速率的過程??刂频年P鍵在于在碼率大小和視頻壓縮質(zhì)量間找到一個平衡。因此碼率控制算法的好壞直接影響了編碼器的性能和效率。在現(xiàn)有的幾個壓縮標準中,如H.264/AVC和AVS,其碼率控制方法僅根據(jù)視頻內(nèi)容的復雜程度進行碼率分配,即,給紋理復雜的部分分配更多的比特數(shù)。但是,視頻的最終接收者是人類,人對于視頻的關注情況會由人腦對視頻的感知特性和對視頻內(nèi)容的理解來決定。在許多科學工作者的努力下,我們已經(jīng)發(fā)覺人眼對于視頻中的運動物體以及物體的邊緣輪廓會投入更多的關注度。因此,如果想更加有效的為不同幀、不同宏塊分配目標比特數(shù),就必須把人眼視覺特征考慮到碼率控制中去。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于人眼感知模型的碼率控制方法,所述方法根據(jù)視頻圖像的動態(tài)特征和靜態(tài)特征,建立人類視覺的靜態(tài)注意力模型和動態(tài)注意力模型,并通過這兩種模型提取出視頻圖像中的人眼重點關注的區(qū)域,以區(qū)分非重點關注的區(qū)域,實現(xiàn)針對圖像中重要程度不同的區(qū)域進行分類量化編碼,進而實現(xiàn)基于人眼感知的碼率控制方法。
本發(fā)明的目的是這樣實現(xiàn)的一種基于人眼感知模型的碼率控制方法,所述碼率控制方法分別進行幀級和宏塊級碼率控制,以確定比特數(shù)的分配,其中,宏塊的大小為h*h,h為自然數(shù),所述的碼率控制方法通過以下步驟實現(xiàn) 步驟1、提取視頻圖像的靜態(tài)特征,并建立靜態(tài)特征模型; 步驟2、提取視頻圖像的動態(tài)特征,并建立動態(tài)特征模型; 步驟3、取靜態(tài)特征模型和動態(tài)特征模型的交集,得到該視頻的運動圖像部分及其輪廓,即動靜態(tài)綜合特征模型; 步驟4、在幀級碼率控制算法中,利用提取的動態(tài)特征模型,計算出每一幀中運動對象塊所占全部宏塊數(shù)的比率,并用該比率修正當前編碼幀中各宏塊和編碼對應參考幀中對應宏塊像素點的平均絕對差MAD的原線性預測模型MAD(n)=k1*MAD(n-1)+k2,在預分配比特數(shù)時,根據(jù)運動對象塊的多少,來反映當前幀的運動復雜度,從而決定分配比特數(shù)的多少來實現(xiàn)碼率控制,其中k1為該模型的線性比例系數(shù),k2為該模型的常系數(shù),n為圖像幀序號; 步驟5、在宏塊級碼率控制中,首先根據(jù)動靜態(tài)綜合特征模型,計算出動靜態(tài)綜合特征模型內(nèi)的像素所占宏塊內(nèi)總像素的比率,并通過該比率獲得一個調(diào)節(jié)參數(shù),在碼率控制中用調(diào)節(jié)參數(shù)修改原有的目標比特數(shù)平均分配公式Bit(n,I,J)=frb(n,I,J)/Nub,實現(xiàn)人眼感知下的最佳碼率控制效果,其中,n為圖像幀序號,(I,J)表示宏塊的坐標,Bit(n,I,J)為目標比特數(shù),frb(n,I,J)為待分配的總的比特數(shù),Nub是待分配的宏塊數(shù)量。
所述步驟1中的靜態(tài)特征的提取和靜態(tài)特征模型的建立進一步通過以下步驟實現(xiàn) 步驟1.1、將當前視頻的每個像素點從YUV格式轉(zhuǎn)換成RGB格式;提取紅R、綠G、藍B和黃色Y四基色,并獲得四基色的色度特征圖分別為R(r,g,b)、G(r,g,b)、B(r,g,b)和Y(r,g,b);提取紅/綠、藍/黃兩組對抗色,并獲得紅/綠特征圖RG(i,j)=|(R(i,j)-G(i,j))|以及藍/黃特征圖BY(i,j)=|(B(i,j)-Y(i,j))|,其中(i,j)表示像素點的坐標; 步驟1.2、計算每個像素點及其周圍八個點的紅/綠、藍/黃特征值的平均值和 步驟1.3、計算每個像素點的靜態(tài)特征圖將靜態(tài)特征圖的最大值記為StaticMapmax,最小值記為StaticMapmin,設判斷像素點是否符合靜態(tài)特征模型的靜態(tài)特征圖閾值為T,則T=(StaticMapmax+StaticMapmin)/2,當像素點的靜態(tài)特征圖StaticMap(i,j)大于T時,該像素點即被包括在靜態(tài)特征模型中,否則不包括在靜態(tài)特征模型中。
所述步驟2中的動態(tài)特征的提取和動態(tài)特征模型的建立進一步通過以下步驟實現(xiàn) 步驟2.1、設第n幀第(I,J)宏塊的運動矢量記為PV(I,J)=(xn,I,J,yn,I,J),將該宏塊的運動矢量默認為該宏塊每一個像素點的運動矢量,該矢量的運動方向表示為θn,i,i=arctan(yn,i,j/xn,i,j); 步驟2.2、計算當前像素點及其周圍八個點的運動矢量值的概率直方圖分布函數(shù)其中SH()為由當前像素點及其周圍八個點的運動矢量的方向值θn,i,i所組成的直方圖,m為直方圖空間大小,w表示N*N的搜索窗口尺寸;依據(jù)所得的概率分布情況計算每一個像素點的運動矢量值的空間相關性熵值其中,Cs()表示運動矢量的空間信息熵,Ps是直方圖SH()的相應概率分布函數(shù); 步驟2.3、計算當前像素點的運動矢量值及其前后三幀的相同位置上的像素點的運動矢量值的概率直方圖分布函數(shù)其中TH()為由當前像素點及其前后三幀相應位置像素點的運動矢量方向表示值θn,i,i所組成的直方圖,Pt是直方圖TH()的相應概率分布函數(shù),m為直方圖空間大小,L表示時間軸上的相關幀數(shù);由此計算每一個像素點的運動矢量值的時間相關性熵值Ct()表示運動矢量的時間信息熵; 步驟2.4、綜合時間和空間信息,得到最終的時空信息熵值C(i,j)=a1*Ct(i,j)+a2*Cs(i,j),其中a1+a2=1; 步驟2.5、在一幀圖像中,令最小的時空信息熵值為Min[C(i,j)],用信息等級0來表示,令最大時空信息熵值為Max[C(i,j)],用信息等級l-1表示,R={0,1...,l-1}表示信息等級的集合;定義Np(p∈R)為信息等級為p時的像素點數(shù)量,即具有相同信息熵值的像素點數(shù)目;對于閾值t∈R,需要在0等級到l-1等級內(nèi)找出其中某一級所對應的時空信息熵值作為閾值t,并根據(jù)閾值t進行自適應劃分,即低于閾值的信息熵為高于閾值的信息熵為其中閾值即當像素點的時空信息熵值大于閾值t時,即該像素點處在運動區(qū)域,否則處在非運動區(qū)域。
所述步驟4中的每一幀中運動對象塊所占全部宏塊數(shù)的比率為Rmb(n)=Nmotion(n)/Nall,修正后的平均絕對差MAD的線性預測模型為MAD(n)=k1*Rmb(n)*MAD(n-1)+k2,其中Nmotion(n)為當前第n幀中運動對象所占宏塊的數(shù)目,Nall為每一幀所包含的宏塊總數(shù)。
所述步驟5中的動靜態(tài)綜合特征模型中的像素所占宏塊內(nèi)總像素的比率為Rpixel(n,I,J)=N(n,I,J)/Nall,其中N(n,I,J)為當前編碼幀第n幀中第(I,J)塊上被提取的靜態(tài)特征的像素點的個數(shù);Nall為每一宏塊總像素點個數(shù)。
所述步驟5中的調(diào)節(jié)參數(shù)為α(n,I,J)=Rpixel(n,I,J)+b,經(jīng)調(diào)節(jié)后的目標比特數(shù)平均分配公式為其中b為防止比特數(shù)分配為0而設置的基數(shù);
為當前幀中從第(I,J)宏塊開始所有未編碼宏塊的調(diào)節(jié)參數(shù)的和,c表示每一幀圖像中每行所包含的宏塊個數(shù),d表示每一幀圖像中每列所包含的宏塊個數(shù)。
步驟1.1中,認為所述宏塊中每相鄰h個像素點具有相同的YUV值。所述的像素點從YUV格式轉(zhuǎn)換成RGB格式的轉(zhuǎn)換關系如下R=Y(jié)+1.402(V-128);G=Y(jié)-0.34414(U-128)-0.71414(V-128);B=Y(jié)+1.772(U-128)。所述的R、G、B和Y與三個顏色分量r、g和b的關系如下R=r-(g+b)/2;G=g-(r+b)/2;B=b-(r+g)/2;Y=r+g-2(|r-g|+b)。
步驟2.1中還包括對運動矢量作進一步的平均值濾波處理。
本發(fā)明由于采用了上述的技術方案,與現(xiàn)有技術相比,不僅使解碼后的視頻具有更好的視覺效果;而且在有限比特數(shù)的情況下,能夠更加高效的實現(xiàn)目標比特的分配。
本發(fā)明的基于人眼感知模型的碼率控制方法由以下的實施例及附圖詳細給出。
圖1為本發(fā)明實施例基于人眼感知模型的碼率控制方法的實現(xiàn)過程示意圖; 圖2為本發(fā)明實施例的視頻中某一幀圖像; 圖3為本發(fā)明實施例中根據(jù)色度對比原理提取到的視頻靜態(tài)特征信息圖; 圖4為本發(fā)明實施例中自適應閾值劃分前的視頻動態(tài)特征圖; 圖5為本發(fā)明實施例中自適應閾值劃分后的視頻動態(tài)特征圖; 圖6為本發(fā)明實施例中視頻動靜態(tài)特征綜合圖。
具體實施例方式 以下將對本發(fā)明的基于人眼感知模型的碼率控制方法作進一步的詳細描述。
附圖1簡單呈現(xiàn)了本實施例基于人眼感知模型的碼率控制方法的實現(xiàn)過程,在對如圖2所示的視頻圖像進行編碼時,所述碼率控制方法分別進行幀級和宏塊級碼率控制,宏塊的大小為4*4,所述的碼率控制方法通過以下步驟實現(xiàn) 步驟1、提取視頻圖像的靜態(tài)特征,并建立靜態(tài)特征模型,如圖3所示,具體包括下列步驟 步驟1.1、將當前視頻圖像的每個像素點從YUV格式轉(zhuǎn)換成RGB格式,即R=Y(jié)+1.402(V-128);G=Y(jié)-0.34414(U-128)-0.71414(V-128);B=Y(jié)+1.772(U-128);為了處理方便,本實施例中,宏塊中每相鄰4個像素點可以認為具有相同的YUV值,即把第一個像素點的YUV值賦給其他3個像素的YUV值;接著提取紅R、綠G、藍B和黃色Y四基色,并獲得四基色的色度特征圖分別為R(r,g,b)、G(r,g,b)、B(r,g,b)和Y(r,g,b),用顏色三分量r、g和b表示如下R=r-(g+b)/2,G=g-(r+b)/2,B=b-(r+g)/2,Y=r+g-2(|r-g|+b);提取紅/綠、藍/黃兩組對抗色,并獲得紅/綠特征圖RG(i,j)=|(R(i,j)-G(i,j))|以及藍/黃特征圖BY(i,j)=|(B(i,j)-Y(i,j))|,其中(i,j)表示像素點的坐標; 步驟1.2、計算每個像素點及其周圍八個點的紅/綠、藍/黃特征值的平均值和 步驟1.3、計算每個像素點的靜態(tài)特征圖StaticMap(i,j),其中將靜態(tài)特征圖的最大值記為StaticMapmax,最小值記為StaticMapmin,設判斷像素點是否符合靜態(tài)特征模型的靜態(tài)特征圖閾值為T,則T=(StaticMapmax+StaticMapmin)/2;也就是說,當像素點的靜態(tài)特征圖StaticMap(i,j)大于T時,該像素點即被包括在靜態(tài)特征模型中,否則不包括在靜態(tài)特征模型中,為非人眼重點關注的視頻信息。
步驟2、提取視頻圖像的動態(tài)特征,并建立動態(tài)特征模型,如圖4所示,具體包括下列步驟 步驟2.1、設第n幀第(I,J)宏塊的運動矢量記為PV(I,J)=(xn,I,J,yn,I,J),將該宏塊的運動矢量默認為該宏塊每一個像素點的運動矢量,該矢量的運動方向可表示為θn,i,i=arctan(yn,i,j/xn,i,j),為了取得較好效果,進一步對運動矢量作平均值濾波處理; 步驟2.2、計算當前像素點及其周圍八個點的運動矢量值的概率直方圖分布函數(shù)其中SH()為由當前像素點及其周圍八個點的運動矢量的方向值θn,i,i所組成的直方圖;依據(jù)所得的概率分布情況計算每一個像素點的運動矢量值的空間相關性熵值其中,Cs()表示運動矢量的空間信息熵,Ps是直方圖SH()的相應概率分布函數(shù),m為直方圖空間大小,是概率直方圖函數(shù)中的計算量,是由統(tǒng)計計算值得到的;w表示N*N的搜索窗口尺寸,本實施例采用3*3窗口,即w為9。
步驟2.3、當前像素點的運動矢量值及其前后三幀的相同位置上的像素點的運動矢量值的概率直方圖分布函數(shù)為由此計算每一個像素點的運動矢量值的時間相關性熵值其中TH()為由當前像素點及其前后三幀相應位置像素點的運動矢量方向表示值θn,i,i所組成的直方圖;Ct()表示運動矢量的時間信息熵,Pt是直方圖TH()的相應概率分布函數(shù),m為直方圖空間大小,L表示時間軸上相關幀數(shù),在本實施例中取7; 步驟2.4、綜合時間和空間信息,得到最終的時空信息熵值C(i,j)=a1*Ct(i,j)+a2*Cs(i,j),其中a1+a2=1,本實施例中a1=0.7;a2=0.3; 步驟2.5、在一幀圖像中,令最小的時空信息熵值為Min[C(i,j)],用信息等級0來表示,令最大時空信息熵值為Max[C(i,j)],用信息等級l-1表示。R={0,1...,l-1}表示信息等級的集合;定義Np(p∈R)為信息等級為p時的像素點數(shù)量,即具有相同信息熵值的像素點數(shù)目;對于閾值t∈R,需要在0等級到1-1等級內(nèi)找出其中某一級所對應的時空信息熵值作為閾值t,并根據(jù)閾值t進行自適應劃分,即低于閾值的信息熵為高于閾值的信息熵為其中閾值即當像素點的時空信息熵值大于閾值t時,即該像素點處在運動區(qū)域,否則處在非運動區(qū)域,劃分前的視頻動態(tài)特征圖如圖4所示,劃分后的視頻動態(tài)特征圖如圖5所示; 步驟3、取靜態(tài)特征模型和動態(tài)特征模型的交集,得到該視頻的運動圖像部分及其輪廓,即動靜態(tài)綜合特征模型,如圖6所示; 步驟4、在幀級碼率控制算法中,利用提取的動態(tài)特征模型,計算出每一幀中運動對象塊,即運動模型中包含的宏塊數(shù),所占全部宏塊數(shù)的比率Rmb(n)=Nmotion(n)/Nall,并用該比率修正平均絕對差MAD的原線性預測模型MAD(n)=k1*MAD(n-1)+k2,修正后的MAD模型為MAD′(n)=k1*Rmb(n)*MAD′(n-1)+k2,在預分配比特數(shù)時,根據(jù)運動對象所占的宏塊數(shù)多少,來反映當前幀的運動復雜度,從而決定分配比特數(shù)的多少來實現(xiàn)碼率控制,其中k1為該模型的線性比例系數(shù),k2為該模型的常系數(shù),Nmotion(n)為當前第n幀中運動對象所占宏塊的數(shù)目,Nall為每一幀所包含的宏塊總數(shù); 步驟5、在宏塊級碼率控制中,首先根據(jù)動靜態(tài)綜合特征模型,計算出動靜態(tài)綜合特征模型內(nèi)的像素,也就是人眼重點關注的像素,所占宏塊內(nèi)總像素的比率Rpixel(n,I,J)=N(n,I,J)/Nall,并通過該比率獲得一個調(diào)節(jié)參數(shù)α(n,I,J)=Rpixel(n,I,J)+b,在碼率控制中用調(diào)節(jié)參數(shù)修改原有的目標比特數(shù)平均分配公式Bit(n,I,J)=frb(n,I,J)/Nub,經(jīng)調(diào)節(jié)后的目標比特數(shù)平均分配公式為其中b為防止比特數(shù)分配為0而設置的基數(shù),此處取1;
為當前幀中從第(I,J)宏塊開始所有未編碼宏塊的調(diào)節(jié)參數(shù)的和,c表示每一幀圖像中每行所包含的宏塊個數(shù),d表示每一幀圖像中每列所包含的宏塊個數(shù),從而實現(xiàn)人眼感知下的最佳碼率控制效果。
通過本發(fā)明的基于人眼感知模型的碼率控制方法,不僅使解碼后的視頻具有更好的視覺效果;而且在有限比特數(shù)的情況下,能夠更加高效的實現(xiàn)目標比特的分配。
權利要求
1、一種基于人眼感知模型的碼率控制方法,所述碼率控制方法分別進行幀級和宏塊級碼率控制,以確定目標比特數(shù)的分配,其中,宏塊的大小為h*h,h為自然數(shù),其特征在于,所述的碼率控制方法通過以下步驟實現(xiàn)
步驟1、提取視頻圖像的靜態(tài)特征,并建立靜態(tài)特征模型;
步驟2、提取視頻圖像的動態(tài)特征,并建立動態(tài)特征模型;
步驟3、取靜態(tài)特征模型和動態(tài)特征模型的交集,得到該視頻的運動圖像部分及其輪廓,即動靜態(tài)綜合特征模型;
步驟4、在幀級碼率控制算法中,利用提取的動態(tài)特征模型,計算出每一幀中運動對象塊所占全部宏塊數(shù)的比率,并用該比率修正當前編碼幀中各宏塊和編碼對應參考幀中對應宏塊像素點的平均絕對差MAD的原線性預測模型MAD(n)=k1*MAD(n-1)+k2,在預分配比特數(shù)時,根據(jù)運動對象塊的多少,來反映當前幀的運動復雜度,從而決定分配比特數(shù)的多少來實現(xiàn)碼率控制,其中k1為該模型的線性比例系數(shù),k2為該模型的常系數(shù),n為圖像幀序號;
步驟5、在宏塊級碼率控制中,首先根據(jù)動靜態(tài)綜合特征模型,計算出動靜態(tài)綜合特征模型內(nèi)的像素所占宏塊內(nèi)總像素的比率,并通過該比率獲得一個調(diào)節(jié)參數(shù),在碼率控制中用調(diào)節(jié)參數(shù)修改原有的目標比特數(shù)平均分配公式Bit(n,I,J)=frb(n,I,J)/Nub,實現(xiàn)人眼感知下的最佳碼率控制效果,其中,n為圖像幀序號,(I,J)表示宏塊的坐標,Bit(n,I,J)為目標比特數(shù),frb(n,I,J)是待分配的總的比特數(shù),Nub是待分配的宏塊數(shù)量。
2、如權利要求1所述的基于人眼感知模型的碼率控制方法,其特征在于,所述步驟1中的靜態(tài)特征的提取和靜態(tài)特征模型的建立進一步通過以下步驟實現(xiàn)
步驟1.1、將當前視頻的每個像素點從YUV格式轉(zhuǎn)換成RGB格式;提取紅R、綠G、藍B和黃色Y四基色,并獲得四基色的色度特征圖分別為R(r,g,b)、G(r,g,b)、B(r,g,b)和Y(r,g,b);提取紅/綠、藍/黃兩組對抗色,并獲得紅/綠特征圖RG(i,j)=|(R(i,j)-G(i,j))|以及藍/黃特征圖BY(i,j)=|(B(i,j)-Y(i,j))|,其中(i,j)表示像素點的坐標;
步驟1.2、計算每個像素點及其周圍八個點的紅/綠、藍/黃特征值的平均值和
步驟1.3、計算每個像素點的靜態(tài)特征圖將靜態(tài)特征圖的最大值記為StaticMapmax,最小值記為StaticMapmin,設判斷像素點是否符合靜態(tài)特征模型的靜態(tài)特征圖閾值為T,則T=(StaticMapmax+StaticMapmin)/2,當像素點的靜態(tài)特征圖StaticMap(i,j)大于T時,該像素點即被包括在靜態(tài)特征模型中,否則不包括在靜態(tài)特征模型中。
3、如權利要求1所述的基于人眼感知模型的碼率控制方法,其特征在于,所述步驟2中的動態(tài)特征的提取和動態(tài)特征模型的建立進一步通過以下步驟實現(xiàn)
步驟2.1、設第n幀第(I,J)宏塊的運動矢量記為PV(I,J)=(xn,I,J,yn,I,J),將該宏塊的運動矢量默認為該宏塊每一個像素點的運動矢量,該矢量的運動方向表示為θn,i,j=arctan(yn,i,j/xn,i,j);
步驟2.2、計算當前像素點及其周圍八個點的運動矢量值的概率直方圖分布函數(shù)其中SH()為由當前像素點及其周圍八個點的運動矢量的方向值θn,i,i所組成的直方圖,m為直方圖空間大小,w表示N*N的搜索窗口尺寸;依據(jù)所得的概率分布情況計算每一個像素點的運動矢量值的空間相關性熵值其中,Cs()表示運動矢量的空間信息熵,Ps是直方圖SH()的相應概率分布函數(shù);
步驟2.3、計算當前像素點的運動矢量值及其前后三幀的相同位置上的像素點的運動矢量值的概率直方圖分布函數(shù)其中TH()為由當前像素點及其前后三幀相應位置像素點的運動矢量方向表示值θn,i,i所組成的直方圖,Pt是直方圖TH()的相應概率分布函數(shù),m為直方圖空間大小,L表示時間軸上的相關幀數(shù);由此計算每一個像素點的運動矢量值的時間相關性熵值Ct()表示運動矢量的時間信息熵;
步驟2.4、綜合時間和空間信息,得到最終的時空信息熵值C(i,j)=a1*Ct(i,j)+a2*Cs(i,j),其中a1+a2=1;
步驟2.5、在一幀圖像中,令最小的時空信息熵值為Min[C(i,j)],用信息等級0來表示,令最大時空信息熵值為Max[C(i,j)],用信息等級l-1表示,R={0,1...,l-1}表示信息等級的集合;定義Np(p∈R)為信息等級為p時的像素點數(shù)量,即具有相同信息熵值的像素點數(shù)目;對于閾值t∈R,需要在0等級到l-1等級內(nèi)找出其中某一級所對應的時空信息熵值作為閾值t,并根據(jù)閾值t進行自適應劃分,即低于閾值的信息熵為高于閾值的信息熵為其中閾值t=arg max(EA+EB);即當像素點的時空信息熵值大于閾值t時,即該像素點處在運動區(qū)域,否則處在非運動區(qū)域。
4、如權利要求1所述的基于人眼感知模型的碼率控制方法,其特征在于,所述步驟4中的每一幀中運動對象塊所占全部宏塊數(shù)的比率為Rmb(n)=Nmotion(n)/Nall,修正后的平均絕對差MAD的線性預測模型為MAD′(n)=k1*Rmb(n)*MAD′(n-1)+k2,其中Nmotion(n)為當前第n幀中運動對象所占宏塊的數(shù)目,Nall為每一幀所包含的宏塊總數(shù)。
5、如權利要求1所述的基于人眼感知模型的碼率控制方法,其特征在于,所述步驟5中的動靜態(tài)綜合特征模型中的像素所占宏塊內(nèi)總像素的比率為Rpixel(n,I,J)=N(n,I,J)/Nall,其中N(n,I,J)為當前編碼幀第n幀中第(I,J)塊上被提取的靜態(tài)特征的像素點的個數(shù);Nall為每一宏塊總像素點個數(shù)。
6、如權利要求5所述的基于人眼感知模型的碼率控制方法,其特征在于,所述步驟5中的調(diào)節(jié)參數(shù)為α(n,I,J)=Rpixel(n,I,J)+b,經(jīng)調(diào)節(jié)后的目標比特數(shù)平均分配公式為其中b為防止比特數(shù)分配為0而設置的基數(shù);
為當前幀中從第(I,J)宏塊開始所有未編碼宏塊的調(diào)節(jié)參數(shù)的和,c表示每一幀圖像中每行所包含的宏塊個數(shù),d表示每一幀圖像中每列所包含的宏塊個數(shù)。
7、如權利要求2所述的基于人眼感知模型的碼率控制方法,其特征在于,步驟1.1中,所述宏塊中每相鄰h個像素點被認為具有相同的YUV值。
8、如權利要求2所述的基于人眼感知模型的碼率控制方法,其特征在于,步驟1.1中,所述的像素點從YUV格式轉(zhuǎn)換成RGB格式的轉(zhuǎn)換關系如下R=Y(jié)+1.402(V-128);G=Y(jié)-0.34414(U-128)-0.71414(V-128);B=Y(jié)+1.772(U-128)。
9、如權利要求2所述的基于人眼感知模型的碼率控制方法,其特征在于,步驟1.1中,所述的R、G、B和Y與三個顏色分量r、g和b的關系如下R=r-(g+b)/2;G=g-(r+b)/2;B=b-(r+g)/2;Y=r+g-2(|r-g|+b)。
10、如權利要求3所述的基于人眼感知模型的碼率控制方法,其特征在于步驟2.1中還包括對運動矢量作進一步的平均值濾波處理。
全文摘要
本發(fā)明提供了一種基于人眼感知模型的碼率控制方法,所述碼率控制方法通過提取視頻圖像的靜態(tài)特征和動態(tài)特征,分別建立靜態(tài)特征模型和動態(tài)特征模型,進一步建立動靜態(tài)綜合特征模型,并利用動態(tài)特征模型對幀級碼率進行控制,利用動靜態(tài)綜合特征模型對宏塊級的碼率進行控制。所述碼率控制方法不僅使解碼后的視頻具有更好的視覺效果,而且在有限比特數(shù)的情況下,能夠更加高效的實現(xiàn)目標比特的分配。
文檔編號H04N7/26GK101534432SQ20091004904
公開日2009年9月16日 申請日期2009年4月9日 優(yōu)先權日2009年4月9日
發(fā)明者鳳 郭, 潘琤雯, 滕國偉, 郁志明, 石旭利 申請人:上海廣電(集團)有限公司中央研究院