一種質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法
【專利摘要】本發(fā)明公開(kāi)了一種質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法,首先利用動(dòng)態(tài)紋理合成方法,由已編碼圖像的重建幀來(lái)構(gòu)建待編碼幀的虛擬重建幀,然后以結(jié)構(gòu)相似性(SSIM)作為指標(biāo),設(shè)置一個(gè)閾值來(lái)確定該虛擬重建幀中的低質(zhì)量宏塊,最后調(diào)節(jié)這些低質(zhì)量宏塊的編碼參數(shù),在編碼時(shí)對(duì)這些宏塊采取更精細(xì)的編碼,從而更好的處理復(fù)雜紋理及邊緣區(qū)域宏塊,提升整幅圖像的用戶體驗(yàn)質(zhì)量。
【專利說(shuō)明】一種質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于數(shù)字視頻【技術(shù)領(lǐng)域】,涉及一種視頻編碼方法,具體涉及一種質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法。
【背景技術(shù)】
[0002]隨著3G網(wǎng)絡(luò)的普及和4G網(wǎng)絡(luò)的高速發(fā)展,移動(dòng)多媒體業(yè)務(wù)也有了急劇增長(zhǎng),如實(shí)時(shí)視頻通話、網(wǎng)絡(luò)視頻點(diǎn)播、移動(dòng)電視等,這些場(chǎng)景對(duì)視頻的用戶體驗(yàn)質(zhì)量(Quality-of-Experience, QoE)有很高的要求。同時(shí),移動(dòng)網(wǎng)絡(luò)帶寬的限制和應(yīng)用環(huán)境的復(fù)雜性也對(duì)視頻流的碼率和實(shí)時(shí)性提出了極高的要求。H.264/AVC是目前最廣泛使用的國(guó)際通用視頻編碼標(biāo)準(zhǔn)之一,相比舊標(biāo)準(zhǔn),它能在更低的碼率下提供優(yōu)質(zhì)視頻。然而,在處理具有復(fù)雜紋理或邊緣信息豐富的宏塊時(shí),傳統(tǒng)的H.264內(nèi)容自適應(yīng)方法并不能彌補(bǔ)復(fù)雜內(nèi)容帶來(lái)的影響,導(dǎo)致宏塊編碼質(zhì)量相對(duì)偏低。同時(shí),根據(jù)人類視覺(jué)感知特性,圖像紋理和邊緣信息是人眼較為敏感的區(qū)域,這些宏塊的失真往往影響到人眼對(duì)整幅圖像在視覺(jué)上的感官質(zhì)量。因此,如何自適應(yīng)的調(diào)整視頻編碼參數(shù),提高視頻質(zhì)量成為亟待解決的問(wèn)題。
[0003]目前關(guān)于移動(dòng)視頻QoE的大部分研究都集中在網(wǎng)絡(luò)性能的提升方向,而較少關(guān)注基于視頻內(nèi)容的自適應(yīng)編碼方法改進(jìn)。
【發(fā)明內(nèi)容】
[0004]為了解決上述的技術(shù)問(wèn)題,本發(fā)明的目的在于提供一種質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法。該方法可以自適應(yīng)的調(diào)整視頻中低質(zhì)量宏塊的編碼參數(shù),提升用戶體驗(yàn)質(zhì)量。
[0005]采用的技術(shù)方案是:一種質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法,其特征在于,包括以下步驟:
[0006]步驟1:獲取已編碼圖像的重建幀Pi?Pn(l彡i彡η);
[0007]步驟2:利用已編碼圖像的重建幀合成第η+1幀圖像的虛擬重建幀P n+1 ;
[0008]步驟3:計(jì)算虛擬重建幀中每個(gè)采樣窗口的SSM值;
[0009]步驟4:使用最大熵方法計(jì)算采樣窗口中宏塊的質(zhì)量等級(jí)閾值T';
[0010]步驟5:獲取第n+1幀圖像;
[0011]步驟6:判定各編碼宏塊與SSIM值與低于T'的采樣塊之間是否有重合,重合位置的宏塊判為低質(zhì)量宏塊;
[0012]步驟7:調(diào)整低質(zhì)量宏塊的量化參數(shù)(Quantizat1n Parameter, QP)值;
[0013]步驟8:對(duì)第n+1巾貞圖像進(jìn)行編碼;
[0014]步驟9:重復(fù)步驟I?步驟8,直至視頻序列編碼完畢。
[0015]作為優(yōu)選,步驟2中所述的合成第n+1幀圖像的虛擬重建幀P n+1,是利用動(dòng)態(tài)紋理模型合成虛擬重建幀。
[0016]作為優(yōu)選,步驟3中所述的計(jì)算虛擬重建幀中每個(gè)采樣窗口的SSIM值,是采用16x16像素的采樣窗口,以4像素步進(jìn),統(tǒng)計(jì)每個(gè)采樣窗口的SSM值。
[0017]作為優(yōu)選,步驟4中所述的使用最大熵方法計(jì)算采樣窗口中宏塊的質(zhì)量等級(jí)閾值T',其具體實(shí)現(xiàn)是利用算式
[0018]T' = arg max (E1 (t) +Em (t)};
[0019]其中E1U)和Em⑴分別表示SS頂值低于設(shè)定閾值T和高于設(shè)定閾值T的概率的米樣窗口的熵定義,且:
[0020]E!(t) = -Σ[=οp! (O1gPiXt),
[0021]Em(t) =
[0022]其中Pp Pm分別為SSM值低于T和高于T的概率。
[0023]作為優(yōu)選,步驟7所述的調(diào)整低質(zhì)量宏塊的量化參數(shù)(Quantizat1nParameter, QP)值,其調(diào)整計(jì)算公式為:
[0024]QP = QP- δ ( δ > O);
[0025]其中,δ為根據(jù)當(dāng)前宏塊具體SS頂值設(shè)定的經(jīng)驗(yàn)值,根據(jù)閾值Τ’與當(dāng)前宏塊SSM評(píng)分的差值大小取值。
[0026]本發(fā)明針對(duì)移動(dòng)視頻的應(yīng)用場(chǎng)景,提出了一種質(zhì)量自適應(yīng)的視頻編碼框架。首先根據(jù)已編碼的重建幀來(lái)構(gòu)建待編碼幀的虛擬重建幀,然后以結(jié)構(gòu)相似性(Structuralsimilarity, SSIM)作為指標(biāo),設(shè)置一個(gè)閾值來(lái)確定該虛擬重建巾貞中的低質(zhì)量宏塊,最后調(diào)節(jié)這些低質(zhì)量宏塊的編碼參數(shù),在編碼時(shí)對(duì)這些宏塊采取更精細(xì)的編碼;本發(fā)明具有以下優(yōu)點(diǎn)和積極效果:
[0027]I)本發(fā)明方法相對(duì)于傳統(tǒng)的H.264編碼,可以更好的處理復(fù)雜紋理及邊緣區(qū)域宏塊,提升用戶體驗(yàn)質(zhì)量。
[0028]2)本發(fā)明方法根對(duì)整體編碼效果較差的碼流,可以有效改善編碼質(zhì)量。
【專利附圖】
【附圖說(shuō)明】
[0029]圖1:本發(fā)明的方法流程圖。
【具體實(shí)施方式】
[0030]為了便于本領(lǐng)域普通技術(shù)人員理解和實(shí)施本發(fā)明,下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述,應(yīng)當(dāng)理解,此處所描述的實(shí)施示例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0031]請(qǐng)見(jiàn)圖1,本發(fā)明所采用的技術(shù)方案是:一種質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法,包括以下步驟:
[0032]步驟1:獲取已編碼圖像的重建幀Pi?Pn(l彡i彡η);
[0033]步驟2:利用動(dòng)態(tài)紋理模型,通過(guò)已編碼圖像的重建幀Pi?Pn合成第n+1幀圖像的虛擬重建幀P n+1 ;
[0034]步驟3:采用16x16像素的采樣窗口,以4像素步進(jìn),計(jì)算虛擬重建幀中每個(gè)采樣窗口的SSIM值,直到每個(gè)采樣窗口的SSIM值都計(jì)算完畢;
[0035]步驟4:使用最大熵方法計(jì)算采樣窗口中宏塊的質(zhì)量等級(jí)閾值T';其具體實(shí)現(xiàn)是利用算式
[0036]T' = arg max (E1 (t) +Em (t)};
[0037]其中E1U)和Em(t)分別表示SS頂值低于設(shè)定閾值T和高于設(shè)定閾值T的概率的米樣窗口的熵定義,且:
[0038]E1 (O = - ELo P! (OlogPi (O,
[0039]‘⑴=-Efi7'+!.4(印叫Pm(t);
[0040]其中Pp Pm分別為SSM值低于T和高于T的概率;
[0041]步驟5:獲取第n+1幀圖像;
[0042]步驟6:判定各編碼宏塊與SSIM值與低于T'的采樣塊之間是否有重合,重合位置的宏塊判為低質(zhì)量宏塊;
[0043]步驟7:調(diào)整低質(zhì)量宏塊的量化參數(shù)(Quantizat1n Parameter, QP)值;其調(diào)整計(jì)算公式為:
[0044]QP = QP- δ ( δ > O);
[0045]其中,δ為根據(jù)當(dāng)前宏塊具體SS頂值設(shè)定的經(jīng)驗(yàn)值;
[0046]步驟8:對(duì)第n+1巾貞圖像進(jìn)行編碼。
[0047]步驟9:重復(fù)步驟I?步驟8,直至視頻序列編碼完畢。
[0048]本發(fā)明的方法可以自適應(yīng)的調(diào)整視頻中低質(zhì)量宏塊的編碼參數(shù),在編碼時(shí)對(duì)這些宏塊采取更精細(xì)的編碼,從而更好的處理復(fù)雜紋理及邊緣區(qū)域宏塊,提升整幅圖像的用戶體驗(yàn)質(zhì)量。
[0049]應(yīng)當(dāng)理解的是,本說(shuō)明書(shū)未詳細(xì)闡述的部分均屬于現(xiàn)有技術(shù)。
[0050]應(yīng)當(dāng)理解的是,上述針對(duì)較佳實(shí)施例的描述較為詳細(xì),并不能因此而認(rèn)為是對(duì)本發(fā)明專利保護(hù)范圍的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的啟示下,在不脫離本發(fā)明權(quán)利要求所保護(hù)的范圍情況下,還可以做出替換或變形,均落入本發(fā)明的保護(hù)范圍之內(nèi),本發(fā)明的請(qǐng)求保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
【權(quán)利要求】
1.一種質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法,其特征在于,包括以下步驟: 步驟1:獲取已編碼圖像的重建幀Pi?Pn(l < i < η); 步驟2:利用已編碼圖像的重建幀合成第η+1幀圖像的虛擬重建幀P n+1 ; 步驟3:計(jì)算虛擬重建幀中每個(gè)采樣窗口的SSM值; 步驟4:使用最大熵方法計(jì)算采樣窗口中宏塊的質(zhì)量等級(jí)閾值T,; 步驟5:獲取第n+1幀圖像; 步驟6:判定各編碼宏塊與SSIM值低于Ti的采樣塊之間是否有重合,重合部分的宏塊判為低質(zhì)量宏塊; 步驟7:調(diào)整低質(zhì)量宏塊的量化參數(shù)(Quantizat1n Parameter, QP)值; 步驟8:對(duì)第n+1幀圖像進(jìn)行編碼; 步驟9:重復(fù)步驟I?步驟8,直至視頻序列編碼完畢。
2.根據(jù)權(quán)利要求1所述的質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法,其特征在于:步驟2中所述的合成第n+1幀圖像的虛擬重建幀P n+1,是利用動(dòng)態(tài)紋理模型合成虛擬重建幀。
3.根據(jù)權(quán)利要求1所述的質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法,其特征在于:步驟3中所述的計(jì)算虛擬重建幀中每個(gè)采樣窗口的SSIM值,是采用16x16像素的采樣窗口,以4像素步進(jìn),統(tǒng)計(jì)每個(gè)采樣窗口的SSM值。
4.根據(jù)權(quán)利要求1所述的質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法,其特征在于:步驟4中所述的使用最大熵方法計(jì)算采樣窗口中宏塊的質(zhì)量等級(jí)閾值T,,其具體實(shí)現(xiàn)是利用算式
T' = argmax (E1 (t) +Em (t)}; 其中E1U) 和Em(t)分別表示SSIM值低于設(shè)定閾值T和高于設(shè)定閾值T的概率的采樣窗口的熵定義,且:
= —Σ--=ηΡ!⑴ logPi(0,
= -Σ--τ+? PrrXOlogΡηι(0.其中Pp Pm分別為SSIM值低于T和高于T的概率。
5.據(jù)權(quán)利要求1所述的質(zhì)量自適應(yīng)的無(wú)線視頻編碼方法,其特征在于:步驟7所述的調(diào)整低質(zhì)量宏塊的量化參數(shù)(Quantizat1n Parameter, QP)值,其調(diào)整計(jì)算公式為: QP = QP- δ (δ >0);其中,δ為根據(jù)當(dāng)前宏塊具體SSM值設(shè)定的經(jīng)驗(yàn)值。
【文檔編號(hào)】H04N19/124GK104270634SQ201410536019
【公開(kāi)日】2015年1月7日 申請(qǐng)日期:2014年10月11日 優(yōu)先權(quán)日:2014年10月11日
【發(fā)明者】王中元, 朱婧雅, 胡孟凌 申請(qǐng)人:武漢大學(xué)