一種低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法

文檔序號(hào)：7869442閱讀：318來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：一種低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及視頻編碼領(lǐng)域，具體涉及一種低碼率下基于H.264的視覺(jué)關(guān)注區(qū)域的視頻編碼方法。
背景技術(shù)：
在碼率充足的情況下，視頻各幀各個(gè)部分的質(zhì)量都能夠得以保證；然而，在碼率非常有限的情況下，如手機(jī)視頻通信等，編碼時(shí)如果仍依照?qǐng)D像內(nèi)容進(jìn)行統(tǒng)計(jì)并平等對(duì)待，視頻整體的質(zhì)量會(huì)因碼率低而急劇下降。生理和心理研究表明:人類(lèi)總是主動(dòng)地特別關(guān)注于某些特定的、能夠產(chǎn)生新異刺激的區(qū)域。因此，在這種情況下有必要對(duì)人眼視覺(jué)重點(diǎn)關(guān)注區(qū)域分配相對(duì)多的碼率，保證該區(qū)域的質(zhì)量，從而提高人對(duì)視頻的主觀(guān)評(píng)價(jià)。1998年Itti等提出了自底向上的視覺(jué)顯著性注意檢測(cè)模型。該模型首先通過(guò)線(xiàn)性濾波將輸入圖像分解成多個(gè)多尺度的低級(jí)視覺(jué)特征(灰度、顏色、方向)通道；對(duì)于每個(gè)特征空間通道，利用中央刺激-周?chē)种撇呗?中心-周?chē)叨炔罘?計(jì)算視覺(jué)感受野，并應(yīng)用一種非線(xiàn)性空間競(jìng)爭(zhēng)機(jī)制將不同尺度信息進(jìn)行合并得到特征顯著圖；接著，通過(guò)使用預(yù)設(shè)的權(quán)值對(duì)各特征顯著圖進(jìn)行線(xiàn)性合并得到一張顯著圖；最后，神經(jīng)網(wǎng)絡(luò)的贏者全勝和抑制返回機(jī)制相互作用，并按照顯著級(jí)別從高到低產(chǎn)生人們的注意焦點(diǎn)。其后，該模型進(jìn)一步得到完善，中國(guó)專(zhuān)利第CN102164281A號(hào)提出一種基于Itti視覺(jué)顯著度模型的視頻編碼碼率控制方法，考慮了運(yùn)動(dòng)特征在視頻內(nèi)容感知中的重要作用。然而，該模型是基于像素點(diǎn)顯著值的統(tǒng)計(jì)，實(shí)現(xiàn)視覺(jué)關(guān)注區(qū)域的檢測(cè)過(guò)程異常復(fù)雜，無(wú)法實(shí)際應(yīng)用到實(shí)時(shí)的編碼環(huán)境中。在碼率有限的情況下，如何在特定的碼率和失真度之間進(jìn)行取舍，有賴(lài)于率失真優(yōu)化(RDO)技術(shù)的應(yīng)用。在H.264標(biāo)準(zhǔn)中，RDO大大提高了編碼的壓縮效率。而RDO中失真的衡量是使用絕對(duì)誤差和(SAD)、頻域絕對(duì)誤差和(SATD)或平方誤差和(SSD)等函數(shù)，這些測(cè)度由來(lái)已久并成為了傳統(tǒng)，但由于只對(duì)圖像塊中單個(gè)像素進(jìn)行統(tǒng)計(jì)而忽略了像素間的聯(lián)系，不能很好地適應(yīng)人眼視覺(jué)系統(tǒng)的特點(diǎn)。結(jié)構(gòu)相似度(SSIM)準(zhǔn)則是基于人眼在觀(guān)察圖像時(shí)對(duì)結(jié)構(gòu)信息的變化更敏感的視覺(jué)特點(diǎn)而提出的一種圖像質(zhì)量評(píng)價(jià)方法，與其它準(zhǔn)則相t匕，它更加符合人眼的視覺(jué)特點(diǎn)，并已引入至H.264各開(kāi)源編碼器中作為評(píng)價(jià)編碼視頻質(zhì)量的標(biāo)準(zhǔn)。已經(jīng)有學(xué)者開(kāi)展了基于SSIM的感知率失真優(yōu)化編碼的研究，研究結(jié)果顯示在RDO中采用SSIM代替原有的失真度量函數(shù)能實(shí)現(xiàn)更有效的視頻壓縮。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，該方法在低碼率下能檢測(cè)出視頻內(nèi)容中的視覺(jué)關(guān)注區(qū)域并保證其視覺(jué)質(zhì)量，可以實(shí)現(xiàn)快速的、準(zhǔn)確的碼率分配優(yōu)化，解決了現(xiàn)有技術(shù)實(shí)現(xiàn)視覺(jué)關(guān)注區(qū)域的檢測(cè)過(guò)程異常復(fù)雜，無(wú)法實(shí)際應(yīng)用到實(shí)時(shí)的編碼環(huán)境中的問(wèn)題。為實(shí)現(xiàn)上述發(fā)明目的，本發(fā)明采用如下技術(shù)方案:一種低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，包含以下幾個(gè)步驟:
S1、讀取當(dāng)前編碼幀，判斷當(dāng)前編碼幀類(lèi)別，確定當(dāng)前編碼幀視覺(jué)關(guān)注區(qū)域；S2、確定當(dāng)前編碼幀所有宏塊的量化參數(shù)調(diào)整等級(jí)；S3、確定當(dāng)前編碼幀所有宏塊的視覺(jué)關(guān)注度權(quán)值；S4、采用結(jié)構(gòu)相似度SSIM作為宏塊預(yù)測(cè)模式選擇時(shí)RDO失真衡量標(biāo)準(zhǔn)；S5、根據(jù)視覺(jué)關(guān)注度權(quán)值確定新的RDO代價(jià)計(jì)算公式；S6、確定新的RDO代價(jià)計(jì)算公式中的經(jīng)驗(yàn)值；S7、根據(jù)新的RDO代價(jià)計(jì)算公式計(jì)算每種預(yù)測(cè)模式下的RDO代價(jià)；S8、根據(jù)宏塊等級(jí)重新分配每個(gè)宏塊的編碼量化參數(shù)；S9、根據(jù)重新分配的量化參數(shù)編碼當(dāng)前編碼幀的每個(gè)宏塊；重復(fù)步驟SI到S9，直到編碼結(jié)束。優(yōu)選的，所述的步驟SI中，如果當(dāng)前編碼幀是I幀，則通過(guò)Canny邊緣檢測(cè)算法檢測(cè)視覺(jué)關(guān)注區(qū)域，并統(tǒng)計(jì)該幀的邊緣點(diǎn)總數(shù)；如果當(dāng)前編碼幀是P幀或B幀，則根據(jù)運(yùn)動(dòng)矢量特征分布得到視覺(jué)關(guān)注區(qū)域，對(duì)所有宏塊進(jìn)行運(yùn)動(dòng)估計(jì)，得到宏塊運(yùn)動(dòng)矢量，如果宏塊運(yùn)動(dòng)矢量為(X，I),則其強(qiáng)度為再計(jì)算宏塊運(yùn)動(dòng)矢量強(qiáng)度均值以及方差，并統(tǒng)計(jì)該幀所有運(yùn)動(dòng)矢量強(qiáng)度方差之和。優(yōu)選的，所述的步驟S2中，如果當(dāng)前編碼幀是I幀，根據(jù)宏塊包含的邊緣像素點(diǎn)個(gè)數(shù)對(duì)宏塊進(jìn)行分級(jí)；如果當(dāng)前編碼幀是P幀或B幀，根據(jù)宏塊運(yùn)動(dòng)矢量強(qiáng)度與所在幀運(yùn)動(dòng)矢量強(qiáng)度均值的關(guān)系判定該宏塊的量化參數(shù)等級(jí)。優(yōu)選的，所述的步驟S3中，對(duì)于I幀中的宏塊，視覺(jué)關(guān)注度權(quán)值等于該宏塊包含邊緣像素點(diǎn)占整幀邊緣像素點(diǎn)的比例；對(duì)于P幀和B幀的宏塊，視覺(jué)關(guān)注度權(quán)值等于該宏塊運(yùn)動(dòng)矢量強(qiáng)度方差和該幀所有宏塊的運(yùn)動(dòng)矢量強(qiáng)度方差總和之比。優(yōu)選的，所述的步驟S4中，在采用結(jié)構(gòu)相似度SSIM作為失真準(zhǔn)則進(jìn)行宏塊預(yù)測(cè)模式選擇時(shí)，假設(shè)原圖像為X，重建圖像為y，則X和I的結(jié)構(gòu)相似度SSIM可表示為:SSIM(x，y) = I (X，y).c (X, y).s (X, y)其中 I (x, y)、c (x, y)、s (x, y)分別表示兩圖像的亮度相關(guān)性、對(duì)比度相關(guān)性以及結(jié)構(gòu)相關(guān)性。優(yōu)選的，所述的步驟S5中，新的RDO代價(jià)計(jì)算公式為:Jcmsst =K.Dssim.( a +w) + λ SSIM.Rmb ;其中Rmb為碼率大?。沪?SSIM為率失真平衡參數(shù)，取值與x264原有SSD失真標(biāo)準(zhǔn)下的相同；DSSIM為失真度，取值范圍為
；w為視覺(jué)關(guān)注度權(quán)值；1(和α為經(jīng)驗(yàn)值;w的大小直接影響失真度在RDO代價(jià)中所占的比重，從而對(duì)視覺(jué)關(guān)注區(qū)域的宏塊在率失真優(yōu)化階段優(yōu)先考慮視覺(jué)失真度，保證宏塊的視覺(jué)質(zhì)量。優(yōu)選的，所述的步驟S6中，確定經(jīng)驗(yàn)值α為0.01，并確定經(jīng)驗(yàn)值K為:1幀中非精細(xì)化RDO以及16x16分塊下精細(xì)化RDO的K值為300000，4x4分塊下精細(xì)化RDO的K值為5000 ;對(duì)于P幀和B幀非精細(xì)化RD0，統(tǒng)計(jì)幀中運(yùn)動(dòng)矢量強(qiáng)度不為O的宏塊數(shù)占幀宏塊總數(shù)的比例，若比例大于60%則K值設(shè)為300000，否則K值設(shè)為100000 ;精細(xì)化RDO下K值設(shè)為30000。優(yōu)選的，所述的步驟S8中，量化參數(shù)的調(diào)整根據(jù)宏塊級(jí)別得到，重新分配的量化參數(shù)隨著宏塊等級(jí)的遞增而線(xiàn)性遞減，對(duì)I幀宏塊降低其量化參數(shù)，而對(duì)P幀或B幀宏塊則提高其量化參數(shù)，以使視頻序列的碼率分配趨于均衡。本發(fā)明的原理為:對(duì)于視頻的內(nèi)容，在空域上，物體邊緣對(duì)人眼的視覺(jué)感知起著重要的作用，而在時(shí)域上，一個(gè)區(qū)域的運(yùn)動(dòng)屬性相對(duì)于其周?chē)鷧^(qū)域運(yùn)動(dòng)具有顯著變化會(huì)能引起人眼的重點(diǎn)關(guān)注。因此，在使用H.264標(biāo)準(zhǔn)進(jìn)行視頻編碼時(shí)，可利用其本身基于宏塊的分析機(jī)制實(shí)現(xiàn)快速的人眼視覺(jué)關(guān)注區(qū)域的檢測(cè)。本發(fā)明提出通過(guò)邊緣檢測(cè)算法識(shí)別視頻I幀中的視覺(jué)關(guān)注區(qū)域，邊緣檢測(cè)的目的是提取圖像中亮度變化明顯的區(qū)域。實(shí)現(xiàn)邊緣檢測(cè)的方法有許多種，目前最常用的是Canny邊緣檢測(cè)算法，該算法可以很好地降低圖像中的噪聲，同時(shí)較為準(zhǔn)確地確定圖像邊緣的位置；而對(duì)于視頻時(shí)域的運(yùn)動(dòng)顯著特征捕捉，目前已存在多種相關(guān)的視頻圖像運(yùn)動(dòng)檢測(cè)算法包括幀間差分法、背景差分法、光流法等，以上運(yùn)動(dòng)檢測(cè)方式均在實(shí)際應(yīng)用中取得過(guò)一定效果，但卻都是基于像素的分析，復(fù)雜度較高。本發(fā)明中將利用H.264中原有的幀間編碼運(yùn)動(dòng)矢量分析機(jī)制，提出一種運(yùn)動(dòng)顯著特征模型檢測(cè)P/B幀中的視覺(jué)關(guān)注區(qū)域，對(duì)視覺(jué)關(guān)注區(qū)域重點(diǎn)編碼；為保證視覺(jué)關(guān)注區(qū)域失真度衡量?jī)?yōu)先，本發(fā)明將建立基于視覺(jué)關(guān)注度權(quán)值與SSIM的RDO代價(jià)函數(shù)，可以進(jìn)一步提高視覺(jué)關(guān)注區(qū)域的圖像質(zhì)量。本發(fā)明以實(shí)際應(yīng)用為出發(fā)點(diǎn)，針對(duì)低帶寬網(wǎng)絡(luò)環(huán)境下的移動(dòng)視頻應(yīng)用而提出，并在x264 (版本為0.76.X)編碼器上驗(yàn)證了本方法的有效性。本發(fā)明應(yīng)用于低碼率情況下的視頻編碼系統(tǒng)中。區(qū)別于傳統(tǒng)的編碼方法，本發(fā)明能夠在碼率非常有限的情況下，智能地識(shí)別出人視覺(jué)關(guān)注的區(qū)域并調(diào)整宏塊的碼率分配，進(jìn)而結(jié)合結(jié)構(gòu)相似度重新構(gòu)造了與視覺(jué)關(guān)注區(qū)域權(quán)重相關(guān)的率失真模型，實(shí)現(xiàn)快速的、更符合人眼視覺(jué)特征的視頻編碼。與現(xiàn)有技術(shù)相比，本發(fā)明具有如下有益效果及主要優(yōu)點(diǎn):1、邊緣檢測(cè)技術(shù)的應(yīng)用有利于幀內(nèi)編碼實(shí)現(xiàn)符合人眼視覺(jué)特征的碼率分配。2、基于塊的運(yùn)動(dòng)矢量特征檢測(cè)模型的建立有利于幀間編碼實(shí)現(xiàn)符合人眼視覺(jué)特征的碼率分配。3、基于塊的運(yùn)動(dòng)矢量特征檢測(cè)模型嵌入在編碼過(guò)程，不需要任何離線(xiàn)操作，能夠?qū)σ曨l序列進(jìn)行實(shí)時(shí)運(yùn)動(dòng)檢測(cè)。4、能夠應(yīng)用于各種基于H.264標(biāo)準(zhǔn)的視頻編碼系統(tǒng)中，可移植性強(qiáng)。

圖1是基于H.264的視覺(jué)關(guān)注區(qū)域編碼方法框圖；圖2是基于視覺(jué)關(guān)注區(qū)域的編碼方法流程圖；圖3是基于視覺(jué)關(guān)注度權(quán)值和SSM的RDO流程圖。
具體實(shí)施例方式下面結(jié)合實(shí)施例及附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)的描述，但本發(fā)明的實(shí)施方式不限于此。實(shí)施例根據(jù)H.264編碼流程，基于本發(fā)明的編碼方法流程圖如圖1所示。該方法利用Canny邊緣檢測(cè)技術(shù)檢測(cè)出I幀中包含重要邊緣信息的宏塊,依據(jù)各宏塊包含邊緣信息的多少調(diào)整編碼量化參數(shù)，實(shí)現(xiàn)幀內(nèi)編碼比特率的合理分配；對(duì)于P幀和B幀，建立了基于宏塊級(jí)的運(yùn)動(dòng)特征檢測(cè)模型，該模型根據(jù)宏塊的運(yùn)動(dòng)矢量與所在幀的平均運(yùn)動(dòng)矢量的方差分布調(diào)整編碼量化參數(shù)，實(shí)現(xiàn)幀間編碼比特率的合理分配；并在率失真優(yōu)化技術(shù)的基礎(chǔ)上，建立基于結(jié)構(gòu)相似度的與視覺(jué)關(guān)注區(qū)域權(quán)重相關(guān)的率失真優(yōu)化函數(shù)。
本發(fā)明提供的編碼方法主要應(yīng)用于解決低碼率下基于H.264的視頻編碼系統(tǒng)中的碼率分配的快速優(yōu)化，實(shí)現(xiàn)在碼率有限情況下人眼對(duì)視頻視覺(jué)感知的更佳效果。如圖1、2及3所示，具體實(shí)施方法按以下三方面的具體步驟完成:一、基于邊緣檢測(cè)算法的I幀視覺(jué)關(guān)注區(qū)域檢測(cè)在本發(fā)明中，由于I幀采用幀內(nèi)模式編碼，對(duì)視頻圖像的細(xì)節(jié)如紋理、邊緣能更好地保存，因而邊緣檢測(cè)算法將主要應(yīng)用于I幀，包含較多邊緣點(diǎn)的宏塊可以認(rèn)為是I幀的視覺(jué)關(guān)注區(qū)域，再根據(jù)宏塊包含的邊緣點(diǎn)所占幀邊緣點(diǎn)比例大小分配I幀率失真優(yōu)化權(quán)值以及量化參數(shù)調(diào)整等級(jí)，進(jìn)而達(dá)到動(dòng)態(tài)調(diào)整每個(gè)宏塊碼率大小的目的。其主要流程原理如下:①在編碼I幀之前，應(yīng)用Canny邊緣檢測(cè)算法檢測(cè)視覺(jué)關(guān)注區(qū)域，并統(tǒng)計(jì)該幀的邊緣點(diǎn)總數(shù)；②對(duì)于每個(gè)16x16宏塊，根據(jù)宏塊包含的邊緣像素點(diǎn)個(gè)數(shù)對(duì)宏塊進(jìn)行分級(jí)，邊緣像素點(diǎn)越多，宏塊級(jí)別越高，在稍后的編碼中將會(huì)分配更低的量化參數(shù)以提高宏塊編碼質(zhì)量;③根據(jù)宏塊包含邊緣像素點(diǎn)占整幀邊緣像素點(diǎn)的比例計(jì)算出每個(gè)宏塊用于率失真優(yōu)化的視覺(jué)關(guān)注度權(quán)值w ;④根據(jù)宏塊等級(jí)重新分配量化參數(shù)，重新分配的量化參數(shù)隨著宏塊等級(jí)的遞增而線(xiàn)性遞減；⑤根據(jù)重新分配的量化參數(shù)編碼I幀的每個(gè)宏塊。本實(shí)施例中，采用邊緣檢測(cè)算法對(duì)I幀視覺(jué)關(guān)注區(qū)域進(jìn)行檢測(cè)時(shí)，具體步驟如下:①初始化結(jié)構(gòu)空間和變量；②讀取一巾貞為當(dāng)前巾貞curFrame,判斷當(dāng)前巾貞curFrame是否是I巾貞,如果是I巾貞，將I幀Y分量數(shù)據(jù)拷貝進(jìn)臨時(shí)結(jié)構(gòu)空間；③對(duì)I幀Y分量進(jìn)行Canny邊緣檢測(cè)算法檢測(cè)邊緣；④對(duì)于每個(gè)16x16宏塊,根據(jù)邊緣像素點(diǎn)的個(gè)數(shù)m分配量化參數(shù)等級(jí)level:a)若m為0，則level為O ;否貝丨J，轉(zhuǎn)b)；b)若m小于8,則level為I ;否則,轉(zhuǎn)c)；c)若m小于24,則level為2 ;否則,轉(zhuǎn)d)；d)若m小于56，則level為3 ;否則，轉(zhuǎn)e)；e)若m大于或等于56,貝丨J level為4 ;結(jié)束level賦值。⑤統(tǒng)計(jì)該巾貞所有邊緣像素點(diǎn)的個(gè)數(shù)s,對(duì)于每個(gè)16x16宏塊,根據(jù)邊緣像素點(diǎn)占該幀幀邊緣像素點(diǎn)的比例，確定該宏塊用于率失真優(yōu)化的視覺(jué)關(guān)注度權(quán)值w=m/s ；⑥對(duì)當(dāng)前幀curFrame進(jìn)行編碼，在編碼宏塊過(guò)程中，根據(jù)宏塊的量化參數(shù)等級(jí)level，對(duì)該宏塊進(jìn)行編碼量化參數(shù)調(diào)整，具體如下:如果level為O級(jí)，則量化參數(shù)qp減少O ;如果level為I級(jí)，則量化參數(shù)qp減少I(mǎi) ;如果level為2級(jí)，則量化參數(shù)qp減少2 ；如果level為3級(jí)，則量化參數(shù)qp減少3 ；如果level為4級(jí)，則量化參數(shù)qp減少4 ；
⑦使用調(diào)整后的量化參數(shù)對(duì)當(dāng)前巾貞curFrame進(jìn)行編碼,直至當(dāng)前巾貞curFrame所有宏塊編碼完成；⑧若當(dāng)前巾貞curFrame不是最后一巾貞,跳至第②步；否則編碼結(jié)束。二、基于運(yùn)動(dòng)矢量特征的P幀和B幀視覺(jué)關(guān)注區(qū)域檢測(cè)在視頻序列中，物體的運(yùn)動(dòng)特征越突出越容易吸引人眼的關(guān)注。P幀和B幀中運(yùn)動(dòng)物體所占據(jù)的宏塊一般具備較大的運(yùn)動(dòng)矢量強(qiáng)度，通過(guò)分析宏塊的矢量強(qiáng)度與幀整體的運(yùn)動(dòng)趨勢(shì)之間的關(guān)系，就可判定宏塊的運(yùn)動(dòng)特征是否突出，將運(yùn)動(dòng)特征突出的宏塊作為視覺(jué)關(guān)注區(qū)域進(jìn)行重點(diǎn)編碼，其他宏塊則相對(duì)降低編碼質(zhì)量，以達(dá)到P幀和B幀碼率均衡分配的效果。對(duì)于在P幀和B幀中檢測(cè)到的視覺(jué)關(guān)注區(qū)域，將根據(jù)其運(yùn)動(dòng)矢量強(qiáng)度方差分配率失真優(yōu)化權(quán)值，并根據(jù)運(yùn)動(dòng)矢量強(qiáng)度均值分配量化參數(shù)調(diào)整等級(jí)，以此達(dá)到動(dòng)態(tài)調(diào)整宏塊碼率分配的目的。其主要流程原理如下:①對(duì)于P幀或B幀中采用幀間編碼模式的宏塊，本發(fā)明先對(duì)所有宏塊進(jìn)行運(yùn)動(dòng)估計(jì)，得到所有宏塊的運(yùn)動(dòng)矢量，再計(jì)算其強(qiáng)度；②計(jì)算整幀所有宏塊的運(yùn)動(dòng)矢量強(qiáng)度均值以及每個(gè)宏塊的運(yùn)動(dòng)矢量強(qiáng)度的方差;③根據(jù)運(yùn)動(dòng)矢量強(qiáng)度方差和該幀所有宏塊的運(yùn)動(dòng)矢量強(qiáng)度方差總和之比確定每個(gè)宏塊用于率失真優(yōu)化的視覺(jué)關(guān)注度權(quán)值w ；④根據(jù)宏塊運(yùn)動(dòng)矢量強(qiáng)度與所在幀運(yùn)動(dòng)矢量強(qiáng)度均值的關(guān)系對(duì)宏塊進(jìn)行分級(jí)，運(yùn)動(dòng)矢量強(qiáng)度越大等級(jí)越高；⑤根據(jù)宏塊等級(jí)重新分配量化參數(shù)，重新分配的量化參數(shù)隨著宏塊等級(jí)的遞增而線(xiàn)性遞減；⑥根據(jù)重新分配的量化參數(shù)編碼P幀或B幀的每個(gè)宏塊。在本實(shí)施例中，基于運(yùn)動(dòng)矢量特征對(duì)P幀和B幀視覺(jué)關(guān)注區(qū)域檢測(cè)，具體包括以下步驟:①初始化用于運(yùn)動(dòng)矢量強(qiáng)度計(jì)算結(jié)構(gòu)體和變量；②如果當(dāng)前巾貞curFrame是P巾貞,遍歷巾貞中所有宏塊進(jìn)行運(yùn)動(dòng)估計(jì)后提取運(yùn)動(dòng)矢量(X，y)，將運(yùn)動(dòng)矢量轉(zhuǎn)化為強(qiáng)度，強(qiáng)度intensity=sqrt (x*x+y*y)；③為所有宏塊運(yùn)動(dòng)矢量強(qiáng)度求和，計(jì)算強(qiáng)度平均值avg_intenSity，再根據(jù)均值確定每個(gè)宏塊運(yùn)動(dòng)矢量強(qiáng)度的方差Oi，并統(tǒng)計(jì)所有宏塊強(qiáng)度方差的總和Σ oi；④確定每個(gè)宏塊用于率失真優(yōu)化的視覺(jué)關(guān)注度權(quán)值Wi= σ y Σ Qi⑤根據(jù)強(qiáng)度均值avg_intensity確定每個(gè)宏塊量化參數(shù)等級(jí)level:a)如果宏塊運(yùn)動(dòng)矢量強(qiáng)度為0，則level為O ;否則，轉(zhuǎn)b)；b)如果宏塊運(yùn)動(dòng)矢量強(qiáng)度小于或等于avg_intensity*0.5,則level為I ;否則，轉(zhuǎn)c)；c)如果宏塊運(yùn)動(dòng)矢量強(qiáng)度小于或等于avg_intensity,則level為2 ;否則,轉(zhuǎn)d)；d)如果宏塊運(yùn)動(dòng)矢量強(qiáng)度小于或等于avg_intensity*2,則level為3 ;否則,轉(zhuǎn)e)；e)如果宏塊運(yùn)動(dòng)矢量強(qiáng)度大于avg_intensity*2,則level為4 ;level賦值結(jié)束。⑥對(duì)宏塊進(jìn)行編碼時(shí)，根據(jù)宏塊的量化參數(shù)等級(jí)level對(duì)該宏塊的量化參數(shù)進(jìn)行調(diào)整，具體如下:如果level為O級(jí)，則量化參數(shù)qp增加4 ;如果level為I級(jí)，則量化參數(shù)qp增加3 ;如果level為2級(jí)，則量化參數(shù)qp增加2 ;如果level為3級(jí)，則量化參數(shù)qp增加I ;如果level為4級(jí)，則量化參數(shù)qp增加O ;⑦使用調(diào)整后的量化參數(shù)對(duì)當(dāng)前巾貞curFrame進(jìn)行編碼,直至當(dāng)前巾貞curFrame所有宏塊編碼完成；⑧若當(dāng)前巾貞curFrame不是最后一巾貞,跳至第②步；否則編碼結(jié)束。三、基于視覺(jué)關(guān)注度權(quán)值以及SSM的RDO改進(jìn)實(shí)施方案本發(fā)明中采用了結(jié)構(gòu)相似度(SSIM)作為了 RDO失真衡量標(biāo)準(zhǔn)，取代原x264編碼器中使用的SSD標(biāo)準(zhǔn)，以使編碼模式的選擇更為準(zhǔn)確，同時(shí)結(jié)合前述I和2中提到的視覺(jué)關(guān)注度權(quán)值w的計(jì)算，得到本發(fā)明使用的率失真優(yōu)化公式:Jcost — K.Dssim.( ct +w) + λ SSIM.Rmb (I)(I)式中Rmb為碼率大??；Xssim為率失真平衡參數(shù)，本發(fā)明中它的取值與χ264原有SSD失真標(biāo)準(zhǔn)下的相同；DSSIM為失真度，這里表示為1-SSM，SSM取值范圍是
。假設(shè)原圖像為X，重建圖像為y，則X和I的結(jié)構(gòu)相似度SSIM可表示為:SSIM (X, y) = I (x, y).c(x, y).s (x, y) (2)(2)式中，I(x, y)、c(x, y)、s(x, y)分別表示兩圖像的亮度相關(guān)性、對(duì)比度相關(guān)性以及結(jié)構(gòu)相關(guān)性。(具體見(jiàn)Wang Zhou, Bovik AC等人著的A universal image qualityindex 一文)。(I)式中K和α是經(jīng)驗(yàn)值，通過(guò)大量的實(shí)驗(yàn)表明，給I幀和P幀、B幀分配不同的K值可以得到較好的率失真優(yōu)化效果。本發(fā)明中設(shè)置α為0.01，對(duì)于K的設(shè)置如下:①I(mǎi)幀中非精細(xì)化RDO以及16x16分塊下精細(xì)化RDO的K值為300000,4x4分塊下精細(xì)化RDO的K值為5000 ；②對(duì)于P幀和B幀非精細(xì)化RD0，統(tǒng)計(jì)幀中運(yùn)動(dòng)矢量強(qiáng)度不為O的宏塊數(shù)占幀宏塊總數(shù)的比例，若比例大于60%則K值設(shè)為300000，否則K值設(shè)為100000 ;精細(xì)化RDO下K值設(shè)為30000。在本實(shí)施例中，改進(jìn)后的χ264基于視覺(jué)關(guān)注度權(quán)值和SSM的RDO可分為以下步驟:①使用SSM計(jì)算函數(shù)替換χ264編碼器Ι、Ρ、Β通用RDO函數(shù)x264_rd_cost_mb、I中貞4x4分塊下精細(xì)化RDO函數(shù)264_rd_cost_i4x4以及P巾貞精細(xì)化RDO函數(shù)x264_rd_cost_part>x264_rd_cost_subpart中原有的SSD計(jì)算函數(shù)，I巾貞8x8分塊下精細(xì)化RDO函數(shù)由于未啟用而不替換，SSIM的計(jì)算由公式(2)得到；②在第一輪RDO中，確定宏塊的最佳分塊模式，此階段的RDO函數(shù)是1、P、B幀通用RDO函數(shù)。根據(jù)公式(I )，如果當(dāng)前編碼幀是I幀，則經(jīng)驗(yàn)值K設(shè)為300000，如果是P或B幀，則根據(jù)當(dāng)前編碼幀中運(yùn)動(dòng)矢量不為O的比例分配K值，如果該比例大于60%，則設(shè)置K值為300000，否則設(shè)為100000 ；③在精細(xì)化RDO中，對(duì)最佳分塊模式下各種預(yù)測(cè)模式進(jìn)行率失真代價(jià)計(jì)算，以確定最佳預(yù)測(cè)模式。此階段I幀16x16分塊下精細(xì)化RDO函數(shù)的K值設(shè)為300000,4x4分塊下精細(xì)化RDO函數(shù)K值設(shè)為5000，P幀和B幀精細(xì)化RDO函數(shù)K值設(shè)為30000 ；④根據(jù)公式(1)，在1、P、B幀通用RDO函數(shù)以及各精細(xì)化RDO函數(shù)中加入每個(gè)宏塊的視覺(jué)關(guān)注度權(quán)值的影響，即K* (1-SSIM) * ( a +w)，經(jīng)驗(yàn)值α設(shè)為0.01，w為每個(gè)宏塊視覺(jué)關(guān)注度權(quán)值；⑤公式(I)中λ SSIM.Rmb的計(jì)算按照x264原有計(jì)算完成，接著各RDO函數(shù)返回公式(I)計(jì)算的結(jié)果，即RDO代價(jià)Jkbt用于幀內(nèi)預(yù)測(cè)或幀間預(yù)測(cè)模式的選擇。表I本方法定義的主要數(shù)據(jù)結(jié)構(gòu)和變量
權(quán)利要求
1.一種低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，其特征在于，包含以下幾個(gè)步驟: 51、讀取當(dāng)前編碼幀，判斷當(dāng)前編碼幀類(lèi)別，確定當(dāng)前編碼幀視覺(jué)關(guān)注區(qū)域； 52、確定當(dāng)前編碼幀所有宏塊的量化參數(shù)調(diào)整等級(jí)； 53、確定當(dāng)前編碼幀所有宏塊的視覺(jué)關(guān)注度權(quán)值； 54、采用結(jié)構(gòu)相似度SSIM作為宏塊預(yù)測(cè)模式選擇時(shí)RDO失真衡量標(biāo)準(zhǔn)； 55、根據(jù)視覺(jué)關(guān)注度權(quán)值確定新的RDO代價(jià)計(jì)算公式； 56、確定新的RDO代價(jià)計(jì)算公式中的經(jīng)驗(yàn)值； 57、根據(jù)新的RDO代價(jià)計(jì)算公式計(jì)算每種預(yù)測(cè)模式下的RDO代價(jià)； 58、根據(jù)宏塊等級(jí)重新分配每個(gè)宏塊的編碼量化參數(shù)； 59、根據(jù)重新分配的量化參數(shù)編碼當(dāng)前編碼幀的每個(gè)宏塊；重復(fù)步驟SI到S9，直到編碼結(jié)束。
2.根據(jù)權(quán)利要求1所述的低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，其特征在于，所述的步驟SI中，如果當(dāng)前編碼幀是I幀，則通過(guò)Canny邊緣檢測(cè)算法檢測(cè)視覺(jué)關(guān)注區(qū)域，并統(tǒng)計(jì)該幀的邊緣點(diǎn)總數(shù)；如果當(dāng)前編碼幀是P幀或B幀，則根據(jù)運(yùn)動(dòng)矢量特征分布得到視覺(jué)關(guān)注區(qū)域，對(duì)所有宏塊進(jìn)行運(yùn)動(dòng)估計(jì)，得到宏塊運(yùn)動(dòng)矢量，如果宏塊運(yùn)動(dòng)矢量為(x，y)，則其強(qiáng)度為再計(jì)算宏塊運(yùn)動(dòng)矢量強(qiáng)度均值以及方差，并統(tǒng)計(jì)該幀所有運(yùn)動(dòng)矢量強(qiáng)度方差之和。
3.根據(jù)權(quán)利要求1所述的低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，其特征在于，所述的步驟S2中，如果當(dāng)前編碼幀是I幀，根據(jù)宏塊包含的邊緣像素點(diǎn)個(gè)數(shù)對(duì)宏塊進(jìn)行分級(jí)；如果當(dāng)前編碼幀是P幀或B幀，根據(jù)宏塊運(yùn)動(dòng)矢量強(qiáng)度與所在幀運(yùn)動(dòng)矢量強(qiáng)度均值的關(guān)系判定該宏塊的量化參數(shù)等級(jí)。
4.根據(jù)權(quán)利要求1所述的低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，其特征在于，所述的步驟S3中，對(duì)于I幀中的宏塊,視覺(jué)關(guān)注度權(quán)值等于該宏塊包含邊緣像素點(diǎn)占整幀邊緣像素點(diǎn)的比例；對(duì)于P幀和B幀的宏塊，視覺(jué)關(guān)注度權(quán)值等于該宏塊運(yùn)動(dòng)矢量強(qiáng)度方差和該幀所有宏塊的運(yùn)動(dòng)矢量強(qiáng)度方差總和之比。
5.根據(jù)權(quán)利要求1所述的低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，其特征在于，所述的步驟S4中，在采用結(jié)構(gòu)相似度SSIM作為失真準(zhǔn)則進(jìn)行宏塊預(yù)測(cè)模式選擇時(shí)，假設(shè)原圖像為X，重建圖像為y，則X和y的結(jié)構(gòu)相似度SSIM可表示為:SSIM(x,y) = I (x, y).c(x,y) *s(x,y),其中I (x, y)、c(x, y)、s(x, y)分別表示兩圖像的亮度相關(guān)性、對(duì)比度相關(guān)性以及結(jié)構(gòu)相關(guān)性。
6.根據(jù)權(quán)利要求1或5所述的低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，其特征在于，所述的步驟S5中，新的RDO代價(jià)計(jì)算公式為-Jcost = K.Dssim.( a +w) + λ SSIM.Rmb ;其中Rmb為碼率大小；λ ssiM為率失真平衡參數(shù)，取值與x264原有SSD失真標(biāo)準(zhǔn)下的相同；Dssim為失真度，取值范圍為
;w為視覺(jué)關(guān)注度權(quán)值；K和α為經(jīng)驗(yàn)值。
7.根據(jù)權(quán)利要求6所述的低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，其特征在于，所述的步驟S6中，確定經(jīng)驗(yàn)值α為0.01，并確定經(jīng)驗(yàn)值K為:1幀中非精細(xì)化RDO以及16x16分塊下精細(xì)化RDO的K值為300000,4x4分塊下精細(xì)化RDO的K值為5000 ;對(duì)于P幀和B幀非精細(xì)化RD0，統(tǒng)計(jì)幀中運(yùn)動(dòng)矢量強(qiáng)度不為O的宏塊數(shù)占幀宏塊總數(shù)的比例，若比例大于60%則K值設(shè)為300000，否則K值設(shè)為100000 ;精細(xì)化RDO下K值設(shè)為30000。
8.根據(jù)權(quán)利要求6所述的低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法，其特征在于，所述的步驟S8中，量化參數(shù)的調(diào)整根據(jù)宏塊級(jí)別得到，重新分配的量化參數(shù)隨著宏塊等級(jí)的遞增而線(xiàn)性遞減，對(duì) I幀宏塊降低其量化參數(shù)，而對(duì)P幀或B幀宏塊則提高其量化參數(shù)。
全文摘要
本發(fā)明為一種低碼率下基于H.264的視覺(jué)關(guān)注區(qū)域的視頻編碼方法，包括步驟判斷當(dāng)前編碼幀類(lèi)別，確定視覺(jué)關(guān)注區(qū)域、當(dāng)前編碼幀所有宏塊的量化參數(shù)調(diào)整等級(jí)、當(dāng)前編碼幀所有宏塊的視覺(jué)關(guān)注度權(quán)值；采用結(jié)構(gòu)相似度SSIM作為失真準(zhǔn)則進(jìn)行宏塊預(yù)測(cè)模式選擇時(shí)RDO失真衡量標(biāo)準(zhǔn)；根據(jù)視覺(jué)關(guān)注度權(quán)值確定新的RDO代價(jià)計(jì)算公式；確定新的RDO代價(jià)計(jì)算公式中的經(jīng)驗(yàn)值；根據(jù)新的RDO代價(jià)計(jì)算公式計(jì)算每種預(yù)測(cè)模式下的RDO代價(jià)；根據(jù)宏塊等級(jí)重新分配每個(gè)宏塊的編碼量化參數(shù)；根據(jù)重新分配的量化參數(shù)編碼當(dāng)前編碼幀的每個(gè)宏塊；重復(fù)上述步驟直到編碼結(jié)束。本發(fā)明可在碼率非常有限的情況下優(yōu)化碼率分配，實(shí)現(xiàn)更符合人眼視覺(jué)特征的視頻編碼。
文檔編號(hào)H04N7/26GK103079063SQ20121055741
公開(kāi)日2013年5月1日申請(qǐng)日期2012年12月19日優(yōu)先權(quán)日2012年12月19日
發(fā)明者張星明, 林育蓓, 張吉, 陳銘洙申請(qǐng)人:華南理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張星明;林育蓓;張吉;陳銘洙
技術(shù)所有人：華南理工大學(xué)
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

碼率高好還是低好相關(guān)技術(shù)

低碼率高畫(huà)質(zhì)相關(guān)技術(shù)

壓制低碼率高畫(huà)質(zhì)視頻相關(guān)技術(shù)

低碼率相關(guān)技術(shù)

如何降低視頻碼率相關(guān)技術(shù)

降低視頻碼率相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種低碼率下視覺(jué)關(guān)注區(qū)域的視頻編碼方法