專利名稱:一種將時域與紋理相結(jié)合的快速幀間預測模式選擇算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種將時域與紋理相結(jié)合的快速幀間預測模式選擇算法,屬于視頻編
碼中的模式選擇技術(shù)領(lǐng)域。
背景技術(shù):
進入21世紀以來,國內(nèi)外的多媒體視頻技術(shù)取得了迅速的發(fā)展,其對于視覺信息 本身的確切性、直觀性、高效性、多種業(yè)務的適應性都體現(xiàn)出了巨大的優(yōu)勢。但是,視頻信息 在數(shù)據(jù)量上的處理難度也受到了很大的限制,現(xiàn)有的通信和儲存設(shè)備一般不足以承受幾十 甚至上百兆的碼率。因此,如何壓縮視頻數(shù)據(jù)量成為多媒體技術(shù)發(fā)展的關(guān)鍵問題。隨著視 頻壓縮技術(shù)成為一個重要的課題,由此產(chǎn)生的各種視頻壓縮標準為視頻數(shù)據(jù)的傳輸和儲存 提供了解決方案。 AVS標準是"Audio and Video Coding Standard"的簡稱,是我國具備自主知識 產(chǎn)權(quán)的第二代信源編碼標準,包括系統(tǒng),視頻,音頻的三個主要標準和一致性測試等支撐標 準,這是基于我國創(chuàng)新技術(shù)和公開技術(shù)制定的開放標準,旨在為中國日漸強大的音視頻產(chǎn) 業(yè)提供完整的信源編碼技術(shù)方案。AVS對我國數(shù)字化音視頻產(chǎn)業(yè)的發(fā)展具有重大意義,大力 發(fā)展音視頻編解碼技術(shù)并將其標準化,不僅標志著我國在多媒體處理等領(lǐng)域的研究處于國 際領(lǐng)先地位,還將創(chuàng)造可觀的經(jīng)濟效益和社會效益。目前,國外最為通用的視頻編碼標準時 H. 264標準,它H. 264是由ITU-T的VCEG(視頻編碼專家組)和IS0/IEC的MPEG(活動圖像 編碼專家組)聯(lián)合組建的聯(lián)合視頻組(JVT:joint video team)提出的一個新的數(shù)字視頻 編碼標準。AVS與H. 264相比,主要具有以下優(yōu)點性能高,與H. 264的編碼效率處于同一 水平;復雜度低,算法復雜度比H. 264明顯簡約,而且軟硬件實現(xiàn)的成本都要低于H. 264 ;我 國自主掌握主要只是產(chǎn)權(quán),授權(quán)模式簡單,費用低廉。 幀間預測技術(shù)是AVS標準中的關(guān)鍵算法。幀間預測用于降低圖像的時域相關(guān)性, 通過采用多參考幀和更小運動預測區(qū)域等方法,對下一幀進行精準預測,從而減少需要傳 輸?shù)臄?shù)據(jù)量,提高壓縮效率。幀間運動補償編碼技術(shù)是混合編碼框架中最重要的部分之一。 AVS采用多模式的幀問預測,目的是為了更好的刻畫物體的運動,提高運動搜索的準確性。 AVS幀間預測中的核心技術(shù)主要包括多參考幀預測、變塊大小運動補償和高效的B幀編碼 模式。 近年來,國內(nèi)外針對采用多種預測模式的快速模式選擇算法展開了大量的研究。 宏塊模式預劃分算法根據(jù)一些信息,包括宏塊自身特性,相鄰宏塊間的相關(guān)性,模式本身的 特性等,對所有的候選模式進行分析,預先判斷出各模式被選中的概率高低,先判斷概率高 的模式,再判斷概率低的模式。在遍歷過程中,采用早期中止機制來減少不必要的計算。簡 化率失真模型算法尋找一種最接近率失真優(yōu)化模型的簡化模型,通過簡化率失真代價的計 算過程來減少模式選擇的時間。但是,這種算法在實際應用中很難找出速度和質(zhì)量的令人 滿意的結(jié)合點。跳過宏塊提前判定算法通過全零塊預判或者根據(jù)其他一些信息提前判定某 個宏塊為跳過宏塊,無需在遍歷其他候選模式,從而節(jié)約編碼的時間。然而,此種算法某種程度上忽視了跳過模式之外的其他模式,在質(zhì)量上難以達到預期的效果。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有快速幀間模式選擇算法存在的不足,提供一種編碼速度和質(zhì)量效
果都更好的將時域與紋理相結(jié)合的快速幀間預測模式選擇算法。 本發(fā)明的將時域與紋理相結(jié)合的快速幀間預測模式選擇算法是 在進入快速幀間模式選擇模塊時,判斷當前宏塊是否屬于一幀圖像中的宏塊,如
果屬于,直接選擇幀內(nèi)模式作為最佳預測模式,如果不屬于,則計算當前宏塊在跳過模式下
的率失真代價,如果此率失真代價小于最低門限值,選擇跳過模式作為最佳模式;如果此率
失真代價大于最高門限值,選擇幀內(nèi)模式作為最佳模式,如果此率失真代價處于最低門限
值和最高門限值之間,則根據(jù)前一幀的相應宏塊的最佳模式進行散轉(zhuǎn),并且用各自的模式
選擇流程,以前一幀相應宏塊在最佳模式下的率失真代價作為參考量,尋找最佳預測模式,
得到最佳預測模式后,記錄相應的最佳模式和在此模式下的最小率失真代價,作為下一幀
相應宏塊模式預測時的參考量。 由于視頻序列中兩個相鄰圖像之間存在很強的相關(guān)性,特別是對于運動不太劇烈 的序列,當前宏塊最佳編碼模式必然與其在前一相鄰圖像上對應位置宏塊,即對應宏塊的 最佳編碼模式有很大的關(guān)系。利用時域相關(guān)性作為模式選擇的依據(jù),將前一幀相應宏塊的 最佳模式和相應率失真代價記錄下來并且用作后一幀相應宏塊模式判斷的依據(jù),如果當前 宏塊在其相應宏塊的最佳模式下所得到的最小率失真代價小于相應宏塊在最佳此模式下 的率失真代價,說明此宏塊隨著時間的變化運動趨緩;反之,如果當前宏塊在其相應宏塊的 最佳模式下所得到的最效率失真代價大于相應宏塊在最佳模式下的率失真代價,說明次宏 塊隨著時間的變化運動加劇。而這種變化趨勢,將會影響相應的模式選擇算法。
根據(jù)宏塊模式劃分的原理,對于一個大小為16*16的宏塊而言,如果待編碼宏塊 水平方向和垂直方向紋理都比較平滑,則適合用模式16*16編碼;反之,如果水平方向和垂 直方向紋理都比較復雜,則適用8*8模式編碼。同樣的道理,如果宏塊水平方向紋理平滑, 而垂直方向紋理比較復雜,則使用模式16*8編碼更為合理,反之,如果待編碼宏塊的水平 方向紋理比較復雜,而垂直方向上紋理比較平滑,則宜使用模式8*16編碼。因此,可以通過 分析宏塊的紋理信息來對候選模式進行預判。而用來描述水平或者垂直方向紋理復雜度的 算法成為問題的關(guān)鍵。本發(fā)明采用宏塊水平和垂直方向的平均絕對差值來分別反映宏塊水 平和垂直方向的紋理復雜度。 進一步的實驗表明,圖像宏塊的運動劇烈程度與宏塊的率失真代價是緊密相關(guān) 的,跳過模式適用于運動程度相對較劇烈的宏塊,而幀內(nèi)模式適用于運動程度相對較緩慢 的宏塊,這種相關(guān)性可以作為模式選擇算法的依據(jù)之一。本發(fā)明用率失真代價來描述運動 的劇烈程度,率先判斷出適合用跳過模式或者幀內(nèi)模式的宏塊。如果在跳過模式下所計算 得到的宏塊的率失真代價小于一個最低門限,那么,認為當前的宏塊運動非常緩慢。此時, 選擇跳過模式作為最佳的預測模式,相應的對于當前宏塊的模式選擇過程結(jié)束并開始下一 個宏塊的模式選擇。實際上,這是快速終止算法的一種實現(xiàn)。另一方面,如果在跳過模式 下,所計算出的率失真代價大于一個最高門限,說明當前宏塊的運動非常的劇烈,甚至可能 是場景的切換。因此,本發(fā)明選擇幀內(nèi)模式作為最佳的預測模式。其中,最低門限和最高門
4限都是與量化參數(shù)有關(guān)的參量。 本發(fā)明將紋理趨勢與時域相關(guān)性進行融合,取長補短,利用了各自的優(yōu)勢。用常 用的視頻序列進行試驗,在峰值信噪比和碼率可以接受的情況下,運算時間大約節(jié)約了 20% -30%。
圖1是本發(fā)明將時域與紋理相結(jié)合的快速幀間預測模式選擇算法總體框圖。
圖2是以跳過模式和16*16模式為例的流程圖。
具體實施例方式
下面結(jié)合附圖和我國音視頻編解碼技術(shù)標準AVS對本發(fā)明的方法進行說明,如圖 1中所示 步驟1 :在進入快速幀間模式選擇模塊時,判斷當前宏塊是否屬于I幀圖像中的宏 塊,如果屬于,直接選擇幀內(nèi)模式作為最佳預測模式;如果不屬于,進行下一步運算;
步驟2 :計算當前宏塊在跳過模式下的率失真代價。如果此率失真代價小于最低 門限值TLOW,選擇跳過模式作為最佳模式;如果此率失真代價大于最高門限值THIGH,選擇 幀內(nèi)模式作為最佳模式;如果此率失真代價處于最低門限值TLOW和最高門限值THIGH之 間,進行下一步運算; 步驟3 :根據(jù)前一幀的相應宏塊的最佳模式進行散轉(zhuǎn),并且用各自的模式選擇流 程,以前一幀相應宏塊在最佳模式下的率失真代價作為參考量,尋找最佳預測模式;
步驟4:得到最佳預測模式后,記錄相應的最佳模式和在此模式下的最小率失真 代價。作為下一幀相應宏塊模式預測時的參考量。 以跳過模式和16*16模式為例介紹具體模式下的模式選擇算法流程,如圖2所 示 步驟1 :通過之前的判斷,進入到跳過模式或者16*16模式流程分支中。并且求 16*16模式下的率失真代價。如果率失真代價小于或者等于相應宏塊的此模式下的率失真 代價,選擇16*16模式作為最佳預測模式;如果率失真代價大于相應宏塊的此模式下的率 失真代價,進行下一步運算; 步驟2 :計算宏塊的紋理信息。其中MADH和MADV分別是水平和垂直方向的平均 絕對差值,可分別表示水平和垂直方向上的紋理復雜度。如果宏塊水平方向和垂直方向的 紋理復雜度都很高,而且相差不大,即MADH > T2&&MADV > T2&& | MADH-MADV | < T3 (T2與T3 是相應閾值),直接采用8*8作為最佳預測模式;否則,進行下一步運算;
步驟3 :如果垂直方向的復雜度遠遠大于水平方向的復雜度,MADV-MADH > T2,選 擇16*8作為最佳預測模式;如果垂直方向的復雜度大于水平方向復雜度,并且兩者之差處 于界值(T4, T2)之間,計算16*8和8*8兩種模式下的率失真代價,并且選擇率失真代價較 小的那種模式作為最佳模式; 步驟4 :如果水平方向的復雜度遠遠大于垂直方向的復雜度,MADH-MADV > T2,選 擇8*16作為最佳預測模式;如果水平方向的復雜度大于垂直方向復雜度,并且兩者之差處 于界值(T4, T2)之間,計算8*16和8*8兩種模式下的率失真代價,并且選擇率失真代價較小的那種模式作為最佳模式; 步驟5 :如果水平方向的復雜度與垂直方向的復雜度相差不多,S卩l(xiāng)MADH-MADV < T4,計算8*16, 16*8, 8*8三種模式下的率失真代價,并且選擇率失真代價較小的那種模 式作為最佳模式。 將該發(fā)明應用于編碼各種視頻序列的實驗結(jié)果表明,對于運動程度不同的各種視 頻序列,編碼時間較先前大約節(jié)約了 20% -30%,比特率基本保持不變,峰值信噪比僅僅下 降0. 01-0. 04db。本發(fā)明可應用到很多的硬件平臺,都可以顯著降低編碼運算復雜度,節(jié)約 編碼時間,提高編碼性能。
權(quán)利要求
一種將時域與紋理相結(jié)合的快速幀間預測模式選擇算法,其特征是在進入快速幀間模式選擇模塊時,判斷當前宏塊是否屬于一幀圖像中的宏塊,如果屬于,直接選擇幀內(nèi)模式作為最佳預測模式,如果不屬于,則計算當前宏塊在跳過模式下的率失真代價,如果此率失真代價小于最低門限值,選擇跳過模式作為最佳模式;如果此率失真代價大于最高門限值,選擇幀內(nèi)模式作為最佳模式,如果此率失真代價處于最低門限值和最高門限值之間,則根據(jù)前一幀的相應宏塊的最佳模式進行散轉(zhuǎn),并且用各自的模式選擇流程,以前一幀相應宏塊在最佳模式下的率失真代價作為參考量,尋找最佳預測模式,得到最佳預測模式后,記錄相應的最佳模式和在此模式下的最小率失真代價,作為下一幀相應宏塊模式預測時的參考量。
全文摘要
本發(fā)明提供了一種將時域與紋理相結(jié)合的快速幀間預測模式選擇算法,是判斷當前宏塊是否屬于一幀圖像中的宏塊,如果屬于直接選擇幀內(nèi)模式作為最佳預測模式,如果不屬于則計算當前宏塊在跳過模式下的率失真代價,如果此率失真代價小于最低門限值,選擇跳過模式作為最佳模式,如果大于最高門限值,選擇幀內(nèi)模式作為最佳模式,如果處于最低門限值和最高門限值之間,則根據(jù)前一幀的相應宏塊的最佳模式進行散轉(zhuǎn),并且用各自的模式選擇流程,以前一幀相應宏塊在最佳模式下的率失真代價作為參考量,尋找最佳預測模式,記錄相應的最佳模式和在此模式下的最小率失真代價,作為下一幀相應宏塊模式預測時的參考量。本發(fā)明的運算時間大約節(jié)約了20%-30%。
文檔編號H04N7/26GK101710996SQ20091023149
公開日2010年5月19日 申請日期2009年12月15日 優(yōu)先權(quán)日2009年12月15日
發(fā)明者張衛(wèi)寧, 陳棟, 魏磊 申請人:山東大學