亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于視頻編碼器中的快速幾何模式判定的方法和設(shè)備的制作方法

文檔序號:7938440閱讀:310來源:國知局
專利名稱:用于視頻編碼器中的快速幾何模式判定的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本原理一般涉及視頻編碼,更具體地,涉及用于視頻編碼器中的快速幾何模式判 定(fast geometric mode decision)的方法禾口設(shè)備。
背景技術(shù)
在國際標(biāo)準化組織/國際電工委員會(IS0/IEC)運動圖像專家組-4 (MPEG-4)第 10部分高級視頻編碼(AVC)標(biāo)準/國際電信聯(lián)盟電信標(biāo)準化部(ITU-T) H. 264建議書(下 文中稱作"MPEG-4 AVC標(biāo)準")中,幀間編碼(inter-coded)的16 X 16像素宏塊可被拆分 為大小為16X8、8X16或8X8的宏塊分區(qū)(partition) 。 8X8像素的宏塊分區(qū)也已知為 子宏塊。子宏塊可被進一步拆分為大小為8X4、4X8和4X4的子宏塊分區(qū)。編碼器可以 基于特定宏塊的特性來選擇如何將宏塊劃分為分區(qū)和子宏塊分區(qū),以便最大化壓縮效率和 主體(subjective)質(zhì)量。 而且,MPEG-4 AVC標(biāo)準也支持INTRA(幀內(nèi))模式、SKIP(跳躍)模式和DIRECT(直 接)模式。幀內(nèi)模式允許三種類型INTRA4X4、 INTRA16X16和INTRA8X8,該INTRA8X8 僅是保真度范圍擴展(fidelity rangeextension)模式。INTRA4X4和INTRA8X8支持9 種預(yù)測模式垂直預(yù)測;水平預(yù)測;DC預(yù)測,對角向下/向左預(yù)測;對焦向下/向右預(yù)測;垂 直_向左預(yù)測;水平_向下預(yù)測;垂直_向右預(yù)測;和水平向上預(yù)測。INTRA16X 16支持4 種預(yù)測模式垂直預(yù)測;水平預(yù)測;DC預(yù)測;和平面預(yù)測。 對于模式判定,幀內(nèi)畫面應(yīng)當(dāng)支持幀內(nèi)模式,而幀間畫面應(yīng)當(dāng)支持幀間模式和幀 內(nèi)模式。幀內(nèi)模式包括INTRA4X4和INTRA16X16。對于P畫面,幀間模式包括SKIP以及 16X16、16X8、8X16和子宏lfe8X8分區(qū)。8X8進一步支持8X8、8X4、4X8和4X4分區(qū)。 對于B畫面,考慮列表0和列表1兩者,并且對于宏塊和子宏塊兩者也考慮DIRECT (直接) 模式。 現(xiàn)有技術(shù)中,率失真優(yōu)化(RD0,rate-distortion optimization)架構(gòu)被用于模式 判定,g卩,RDcost J = D+AR被用來測量編碼成本,其中D表示失真,并且R表示比率。對 于幀間模式,從模式判定中單獨地考慮運動估計。首先對于幀間模式的所有塊類型執(zhí)行運 動估計,然后通過比較每個幀間模式和幀內(nèi)模式的成本來進行模式判定。選擇具有最小成 本的模式作為最佳模式。 下面概述對P-畫面或B-畫面中的一個宏塊s進行編碼的傳統(tǒng)過程(下文中稱作 "傳統(tǒng)宏塊編碼過程")。 在傳統(tǒng)宏塊編碼過程的第一步驟中,給定最后編碼的畫面,我們判定拉格朗日乘 數(shù)入M咖、A M。TI。N、以及宏塊量化器QP。
在傳統(tǒng)宏塊編碼過程的第二步驟中,對于每個參考畫面和可能宏塊模式的運動矢 量,通過最小化 J (REF, m (REF) | A MTI。N) = SA (T) D (s , c (REF, m (REF))) A M。TI。N+ (R (m (REF) -p (REF)) +R(REF)) 來執(zhí)行運動估計和參考畫面選擇。在前面的公式中,J表示率失真成本,REF表示 參考畫面,m表示正考慮的當(dāng)前運動矢量,Am肌。w表示拉格朗日乘數(shù),c(REF, m(REF))表示 使用具有運動矢量m的參考REF的補償操作,p表示在運動矢量編碼期間用于預(yù)測的運動 矢量,R(m-p)表示用于對運動矢量進行編碼的比特,以及R(REF)表示用于對參考畫面進行 編碼的比特。SAD表示原始信號與通過運動矢量預(yù)測的參考信號之間的絕對差之和。
在傳統(tǒng)宏塊編碼過程的第三步驟中,當(dāng)改變M0DE(模式)時,給定QP和A m,,通 過最小化J(s, c, M0DElQP,入腳e) = SSD(s, c, M0DE|QP) + AM0DE R(s, c, MODElQP),
來選擇宏塊預(yù)測模式。SSD表示原始信號與重構(gòu)信號之間的平方差的和。R(s,c, MODE)表示與選擇MODE(模式)相關(guān)聯(lián)的比特的數(shù)目,包括用于宏塊標(biāo)首、運動和所有DCT 系數(shù)的比特。MODE(模式)指明來自潛在宏塊模式集合的模式,具體如下 <formula>formula see original document page 4</formula>卩人 ll 6;cl 6,16;t8, &d6' 8x8, 8;c4,4;c8, 4jc4 J
fWD 16;tl 6, iW£> 16x8, _W£) 8:r 16, F即8*8, FffZ> 8x4, 尸^Z 4沐,"4*4, A4JH6:c16, A4《16;c8, A4AT8:c16, A40:c8, A4A:8jc4, A4AT4;c8, A4AT4;c4
INTRA4X4包括模式 <formula>formula see original document page 4</formula>

f垂直,水平,對角-向下/向左,對角-向下/向右,] L垂直-向左,水平-向下,垂直-向右,水平-向上 J INTRA16 X 16/INTRA8 X 8包括模式
MODE G {垂直,水平,DC,平面} 幀分區(qū)是有效視頻編碼中很重要的一個處理。諸如MPEG-4 AVC標(biāo)準之類的最新 視頻壓縮技術(shù)使用基于樹的幀分區(qū)。這種技術(shù)似乎比簡單的均勻塊分區(qū)更有效,該均勻塊 分區(qū)通常用于較老的視頻編碼標(biāo)準以及諸如國際標(biāo)準化組織/國際電工委員會(IS0/IEC) 運動圖像專家組-2(MPEG-2)標(biāo)準和國際電信聯(lián)盟電信部門(ITU-T)H. 263建議書(下文中 稱作' .263建議書")之類的標(biāo)準。然而,基于樹的幀分區(qū)仍舊無法盡可能有效地編碼視 頻信息,因為它不能有效地捕獲二維(2D)數(shù)據(jù)的幾何結(jié)構(gòu)。 使用幾何區(qū)域分區(qū)的幀間和幀內(nèi)預(yù)測在提高視頻編碼效率方面已經(jīng)被認為是很 有前途的研究方向。先前,對于(例如根據(jù)MPEG-4 AVC標(biāo)準執(zhí)行的)高級視頻編碼,已經(jīng)建 議對于幀間和幀內(nèi)預(yù)測引入幾何分區(qū),以便提高視頻編碼效率。為了得到最佳性能,對于編 碼器來說發(fā)現(xiàn)最佳的幾何分區(qū)是至關(guān)重要的。在這些建議中使用了強大的全面搜索策略, 但是復(fù)雜度非常高。然而,對于模式/分區(qū)選擇可期望擁有某些快速算法,從而用于幾何分 區(qū)的增加的計算復(fù)雜度不會變成實際系統(tǒng)的阻礙。
以前的建議是基于邊緣檢測開發(fā)的快速算法,以便為幀間幾何模式預(yù)先選擇候選 分區(qū)線。這種快速算法基于以下假設(shè)對于沿著對象邊界散落的塊,期望用于運動補償?shù)?幾何分區(qū)更好地工作。達到某種程度,合理地假設(shè)基于圖像邊緣的預(yù)選擇分區(qū)可以實現(xiàn)令 人滿意的結(jié)果。這種方式的主要缺點在于它是通過非常簡單的統(tǒng)計和專設(shè)(ad hoc)建模 來完全驅(qū)動的。這導(dǎo)致實際上僅考慮其中幾何分區(qū)是有用的一部分可能情形,因此在復(fù)雜 度節(jié)省和壓縮節(jié)省方面實現(xiàn)次佳結(jié)果。實際上,這種快速算法的發(fā)起人假設(shè)分區(qū)僅與顯性 (e鄧licit)圖像邊緣相關(guān)。然而,這不一定為真。例如,對于幀間預(yù)測情況,分區(qū)反映運動 邊界而不是圖像邊緣。在一些情況下,圖像邊緣可以與運動邊界一致,但不是在所有情況 中。因此,與完全搜索算法相比,這種快速算法在編碼效率上可能導(dǎo)致重大降低。

發(fā)明內(nèi)容
本原理解決了現(xiàn)有技術(shù)的這些和其它缺陷和不足,本原理致力于用于視頻編碼器 中的快速幾何模式判定的方法和設(shè)備。 根據(jù)本原理的一方面,提供了一種設(shè)備。該設(shè)備包括編碼器,用于使用基于幾何模 型的分區(qū)模式來執(zhí)行非窮盡性幾何模式判定。根據(jù)基于幾何模型的分區(qū)模式與非幾何分區(qū) 模式之間的相關(guān)性和依賴性中的至少一個,所述編碼器跳過基于幾何模型的分區(qū)模式的測 試。 根據(jù)本原理的另一方面,提供了一種方法。所述方法包括使用基于幾何模型的分 區(qū)模式來執(zhí)行非窮盡性幾何模式判定。所述執(zhí)行步驟包括根據(jù)基于幾何模型的分區(qū)模式 與非幾何分區(qū)模式之間的相關(guān)性和依賴性中的至少一個,跳過基于幾何模型的分區(qū)模式的 領(lǐng)lj試。 根據(jù)本原理的再一方面,提供了一種設(shè)備。所述設(shè)備包括編碼器,用于使用基于幾 何模型的分區(qū)模式來執(zhí)行非窮盡性幾何參數(shù)選擇。所述編碼器通過應(yīng)用預(yù)測性搜索和分級 搜索中的至少一個來執(zhí)行非窮盡性幾何參數(shù)選擇。所述預(yù)測性搜索包括初始預(yù)測因子選 擇、自適應(yīng)早期終止和預(yù)測因子精化(refinement)中的至少一個。 根據(jù)本原理的又一方面,提供了一種方法。所述方法包括使用基于幾何模型的分 區(qū)模式來執(zhí)行非窮盡性幾何參數(shù)選擇。所述執(zhí)行步驟包括應(yīng)用預(yù)測性搜索和分級搜索中的 至少一個。所述預(yù)測性搜索包括初始預(yù)測因子選擇、自適應(yīng)早期終止和預(yù)測因子精化中的 至少一個。 根據(jù)本原理的再一方面,提供了一種方法。所述方法包括使用基于幾何模型的分 區(qū)模式對圖像的視頻信號數(shù)據(jù)進行編碼。所述編碼步驟使用圖像的至少一部分的幾何分區(qū) 參數(shù)和預(yù)測數(shù)據(jù)的替換優(yōu)化來編碼所述視頻信號數(shù)據(jù)。 根據(jù)結(jié)合附圖要閱讀的示例性實施例的下列詳細描述,本原理的這些和其它方 面、特征和優(yōu)點將變得明顯。


根據(jù)下列示例性附圖,可以更好地理解本原理,其中 圖1是根據(jù)本原理實施例的、能夠根據(jù)被擴展用于本原理的MPEG-4 AVC標(biāo)準來執(zhí) 行視頻編碼的視頻編碼器的框 圖2是根據(jù)本原理實施例的、兩個分區(qū)之間的示例性幾何邊界的圖; 圖3A和圖3B是根據(jù)本原理實施例的、基于MPEG-4 AVC標(biāo)準模式信息的快速幾何
模式判定的示例性方法的流程圖; 圖4是根據(jù)本原理實施例的、基于相鄰信息的快速幾何模式判定的示例性方法的 流程圖; 圖5A是根據(jù)本原理實施例的、用于16X 16幾何模式的模式判定的示例性方法的 流程圖; 圖5B是根據(jù)本原理實施例的、用于8X8幾何模式的模式判定的示例性方法的流 程圖; 圖6A是根據(jù)本原理實施例的、用于16X 16幾何模式的模式判定的示例性方法的 流程圖; 圖6B是根據(jù)本原理實施例的、用于8X8幾何模式的模式判定的示例性方法的流 程圖; 圖7是根據(jù)本原理實施例的、基于殘余信息的快速幾何模式判定的示例性方法的 流程圖; 圖8是根據(jù)本原理實施例的、基于運動矢量信息的快速模式判定的示例性方法的 流程圖; 圖9是根據(jù)本原理實施例的、用于快速預(yù)測性幾何分區(qū)選擇的示例性方法的流程 圖; 圖10是根據(jù)本原理實施例的、用于使用分級搜索的快速幾何分區(qū)選擇的示例性 方法的流程圖; 圖11是根據(jù)本原理實施例的、用于快速幾何模式和分區(qū)選擇的示例性方法的流 程圖;和 圖12是根據(jù)本原理實施例的、用于快速替換預(yù)測/分區(qū)參數(shù)優(yōu)化的示例性方法的 流程圖。
具體實施例方式
本發(fā)明致力于用于視頻編碼器中的快速幾何模式判定的方法和設(shè)備。 本說明書圖解說明了本原理。因此將會理解到,本領(lǐng)域的技術(shù)人員將能夠設(shè)計出
體現(xiàn)本原理并且被包含在其精神和范疇之內(nèi)的各種安排,盡管各種安排未在此處明確地描
述或示出)。 此處敘述的所有示例和條件性語言是為了教學(xué)目的,以輔助讀者理解發(fā)明人對現(xiàn) 有技術(shù)進一步貢獻的本原理和構(gòu)思,并且應(yīng)當(dāng)被理解為不限于如此具體敘述的示例和條 件。 而且,此處敘述原理、方面和本原理的實施例的所有陳述、以及其特定示例意欲涵
蓋其結(jié)構(gòu)性和功能性的等同物。另外,意欲所述等同物包括當(dāng)前已知的等同物以及將來研
發(fā)的等同物,即,被開發(fā)用于執(zhí)行相同功能的任何元件,而不管結(jié)構(gòu)如何。 因此,例如,本領(lǐng)域的普通技術(shù)人員將會理解,這里展現(xiàn)的框圖代表體現(xiàn)本原理的
圖解性電路的概念圖。類似地,將會理解,任何流程圖、流向圖、狀態(tài)轉(zhuǎn)換圖、偽代碼等代表可以基本在計算機可讀媒體上表現(xiàn)并且因此由計算機或處理器執(zhí)行的各種處理,無論是否 明確地地示出了這樣的計算機或處理器。 附圖中示出的各種元件的功能可以通過使用專用硬件和能夠與適當(dāng)?shù)能浖?lián)合 執(zhí)行軟件的硬件來提供。當(dāng)功能被處理器提供時,可以通過單個專用處理器、單個共享處理 器或者多個單獨的處理器(可以共享其中的一些處理器)來提供所述功能。而且,術(shù)語"處 理器"或"控制器"的明確使用不應(yīng)當(dāng)被曲解為排他地指能夠執(zhí)行軟件的硬件,而是可以隱 性地包括(而非限制性地)數(shù)字信號處理器("DSP")硬件、用于存儲軟件的只讀存儲器 ("R0M")、隨機存取存儲器("RAM")和非易失性存儲器。 還可以包括其它硬件,常規(guī)的硬件和/或定制的硬件。類似地,附圖中所示的任意 開關(guān)僅僅是概念性的。它們的功能可以通過程序邏輯的操作、通過專用邏輯、通過編程控制 和專用邏輯的交互作用、或者甚至手動來執(zhí)行,從上下文中可以更具體地理解,實施者可以 選擇特定的技術(shù)。 在于此的權(quán)利要求書中,被表述為用于執(zhí)行具體功能的部件的任意元件意欲涵蓋 執(zhí)行該功能的任意方式,包括例如,a)執(zhí)行該功能的電路元件的組合,或者b)任意形式的 軟件,因此包括固件、微代碼等,它們被與用于執(zhí)行該軟件的適當(dāng)電路相結(jié)合以執(zhí)行該功 能。由所述權(quán)利要求限定的本原理蘊含的事實是各種所記載的手段提供的功能性被組合 并且以權(quán)利要求請求的方式結(jié)合在一起。因此,認為是,可以提供那些功能性的任意手段等 同于此處所示的那些手段。 說明書中對本原理的"一個實施例"或者"實施例"的引用是指在本原理的至少一 個實施例中包含了結(jié)合該實施例描述的特別特征、結(jié)構(gòu)、特性等等。因此,在貫穿說明書的 各個位置出現(xiàn)的短語"在一個實施例中"或者"在實施例中"不必都是指向相同的實施例。
將會理解,術(shù)語"和/或"的使用(例如,在"A和/或B"的情況下)意欲涵蓋第 一所列選項的選擇(A)、第二所列選項的選擇(B)、或者兩個選項的選擇(A和B)。作為另一 個示例,在"A、 B和/或C"的情況下,這樣的措辭意欲涵蓋第一所列選項的選擇(A)、第二 所列選項的選擇(B)、第三所列選項的選擇(C)、第一和第二所列選項的選擇(A和B)、第一 和第三所列選項的選擇(A和C)、第二和第三所列選項的選擇(B和C)、或者所有三個選項 的選擇(A、B和C)。如本領(lǐng)域和相關(guān)領(lǐng)域中的普通技術(shù)人員容易明白的是,對于許多所列 的項來說,這可以進行擴展。 而且,將會理解,盡管此處參考MPEG-4 AVC標(biāo)準描述了本原理的一個或多個實施 例,但是本原理并不單單限于該標(biāo)準,因此本原理可以結(jié)合其它視頻編碼標(biāo)準、建議書及其 擴展來利用,包括MPEG-4 AVC標(biāo)準的擴展,同時維持本原理的精神。 而且,如此處所使用的,短語"楔形分區(qū)(wedge partition)"和"楔形分區(qū)(wedge
partitioning)"是指圖像塊被分區(qū)為兩個區(qū)域,這兩個區(qū)域被任意線或曲線分離。而且,詞
語"楔形"是指給定邊界線或曲線的特定設(shè)置和/或選擇的分區(qū)形狀。 而且,如此處所使用的,例如,關(guān)于搜索,術(shù)語"快速"是指能夠找到最佳解決方案
或接近最佳的解決方案、但是比密集的(intensive)完全搜索算法具有較低計算復(fù)雜度的
有效算法。 轉(zhuǎn)向圖1,能夠根據(jù)(被擴展用于本原理的)MPEG-4 AVC標(biāo)準執(zhí)行視頻編碼的視頻 編碼器一般用附圖標(biāo)記100來表示。
視頻編碼器100包括幀排序緩沖器110,其具有與組合器185的非反相輸入進行信號通信的輸出。組合器185的輸出與具有幾何擴展的變換器和量化器125的第一輸入進行信號通信連接。具有幾何擴展的變換器和量化器125的輸出與具有幾何擴展的熵編碼器145的第一輸入以及具有幾何擴展的逆變換器和逆量化器150的第一輸入進行信號通信連接。具有幾何擴展的熵編碼器145的輸出與組合器190的第一非反相輸入進行信號通信連接。組合器190的輸出與輸出緩沖器135的第一輸入進行信號通信連接。
具有幾何擴展的編碼器控制器105的第一輸出與幀排序緩沖器110的第二輸入、具有幾何擴展的逆變換器和逆量化器150的第二輸入、畫面類型判定模塊115的輸入、具有幾何擴展的宏塊類型(MB類型)判定模塊120的輸入、具有幾何擴展的幀內(nèi)預(yù)測模塊160的第二輸入、具有幾何擴展的解塊濾波器165的第二輸入、具有幾何擴展的運動補償器170的第一輸入、具有幾何擴展的快速運動估計器175的第一輸入、和參考畫面緩沖器180的第二輸入進行信號通信連接。 具有幾何擴展的編碼器控制器105的第二輸出與補充增強信息(SEI)插入器130的第一輸入、具有幾何擴展的變換器和量化器125的第二輸入、具有幾何擴展的熵編碼器145的第二輸入、輸出緩沖器135的第二輸入、以及序列參數(shù)集(SPS)和畫面參數(shù)集(PPS)插入器140的輸入進行信號通信連接。 畫面類型判定模塊115的第一輸出與幀排序緩沖器110的第三輸入進行信號通信連接。畫面類型判定模塊115的第二輸出與具有幾何擴展的宏塊類型判定模塊120的第二輸入進行信號通信連接。 序列參數(shù)集(SPS)和畫面參數(shù)集(PPS)插入器140的輸出與組合器190的第三非反相輸入進行信號通信連接。 具有幾何擴展的逆量化和逆變換器150的輸出與組合器127的第一非反相輸入進行信號通信連接。組合器127的輸出與具有幾何擴展的幀內(nèi)預(yù)測模塊160的第一輸入和具有幾何擴展的解塊濾波器165的第一輸入進行信號通信連接。具有幾何擴展的解塊濾波器165的輸出與參考畫面緩沖器180的第一輸入進行信號通信連接。參考畫面緩沖器180的輸出與具有幾何擴展175的快速運動估計器的第二輸入進行信號通信連接。具有幾何擴展的快速運動估計器175的第一輸出與具有幾何擴展的運動補償器170的第二輸出進行信號通信連接。具有幾何擴展的快速運動估計器175的第二輸出與具有幾何擴展的熵編碼器145的第三輸出進行信號通信連接。 具有幾何擴展的運動補償器170的輸出與開關(guān)197的第一輸入進行信號通信連接。具有幾何擴展的幀內(nèi)預(yù)測模塊160的輸出與開關(guān)197的第二輸入進行信號通信連接。具有幾何擴展的宏塊類型判定模塊120的輸出與開關(guān)197的第三輸入進行信號通信連接。開關(guān)197的輸出與組合器127的第二非反相輸入進行信號通信連接。 幀排序緩沖器110和具有幾何擴展的編碼器控制器105的輸入可用作編碼器100的輸入,用于接收輸入畫面101。而且,補充增強信息(SEI)插入器130的輸入可用作編碼器100的輸入,用于接收元數(shù)據(jù)。輸出緩沖器135的輸出可用作編碼器100的輸出,用于輸出比特流。 使用幾何區(qū)域分區(qū)的幀間預(yù)測和幀內(nèi)預(yù)測已經(jīng)被認為是在提高視頻編碼效率方面具有前途的研究方向。以前,對于(例如根據(jù)MPEG-4 AVC標(biāo)準執(zhí)行的)高級視頻編碼,已經(jīng)建議引入針對幀間和幀內(nèi)預(yù)測的幾何分區(qū),以便提高視頻編碼效率。為了獲得最佳性能,對于編碼器來說發(fā)現(xiàn)最佳的幾何分區(qū)是至關(guān)重要的。在這些建議中使用了強大的全面搜索策略,但是復(fù)雜度非常高。然而,對于模式/分區(qū)選擇可期望擁有某些快速算法,從而增加的幾何分區(qū)的計算復(fù)雜度不會變成實際系統(tǒng)的阻礙。因此,根據(jù)本原理,我們已經(jīng)構(gòu)思快速幾何算法來節(jié)省編碼器處的計算性資源。在本原理的一個實施例中,使用基于幾何模型的分區(qū)模式,對視頻編碼器使能快速幾何模式判定,其中基于標(biāo)準預(yù)測模式與幾何分區(qū)模式之間的相關(guān)性和依賴性中的至少一個來跳過測試幾何模式。在本原理的另一個實施例中,使用基于幾何模型的分區(qū)模式使能對于視頻編碼器的快速幾何參數(shù)選擇,其中預(yù)測性快速搜索算法被應(yīng)用,包括初始預(yù)測因子選擇、自適應(yīng)早期終止和預(yù)測因子精化中的至少一個。在本原理的又一個實施例中,使用基于幾何模型的分區(qū)模式使能對于視頻編碼器的快速幾何參數(shù)選擇,其中使用分級搜索。在本原理的又一個實施例中,使能使用基于幾何模型的分區(qū)模式的視頻編碼器,其中使用了幾何分區(qū)和預(yù)測數(shù)據(jù)的交替優(yōu)化。 如上注意的,最新的視頻壓縮技術(shù)使用幀分區(qū),它比老的視頻編碼標(biāo)準中通常使用的簡單的均勻塊分區(qū)更有效,所述老的視頻編碼標(biāo)準諸如國際標(biāo)準化組織/國際電工委員會(IS0/IEC)運動圖像專家組-2(MPEG-2)標(biāo)準。然而,MPEG-4 AVC標(biāo)準中使用的基于樹的幀分區(qū)仍舊不能對視頻信息足夠有效地編碼,因為它不能捕獲二維(2D)數(shù)據(jù)的幾何結(jié)構(gòu)。為了解決這樣的局限,展示了一種通過考慮2D視頻數(shù)據(jù)的2D幾何來更好地表示和編碼2D視頻數(shù)據(jù)的方法和設(shè)備。在一個實施例中,關(guān)于針對幀間(INTER16X16GE0、INTER8X8GE0)和幀內(nèi)預(yù)測(INTRA16 X 16GE0、 INTRA8X8GE0)兩者的新模式集合,我們使用楔形分區(qū)(即,將一個塊分區(qū)為兩個區(qū)域,該兩個區(qū)域由任意線或曲線分離)。
在一個實施例中,可以使用MPEG-4 AVC標(biāo)準作為基礎(chǔ)來合并幾何分區(qū)模式。塊內(nèi)的幾何分區(qū)通過線的隱式公式來建模。因此,在一實施例中,分區(qū)被定義如下(如圖2中所示) f (x, y) = xcos 9 +ysin 9 _p , 其中,P 、 9分別表示以下在邊界線f (x,y)的正交方向上從原點到邊界線f (x,y)的距離;和f (x, y)的正交方向與水平坐標(biāo)軸x的角度。 轉(zhuǎn)向圖2,圖像的示例性幾何分區(qū)一般用附圖標(biāo)記200指明。圖像塊一般用附圖標(biāo)記220指明。 從它的公式中直接得出也考慮了具有更高階幾何參數(shù)的針對f(x, y)的更相關(guān)的模型。
每個塊像素(x, y)被分類,從而
如果/(x,y)>0則分區(qū)0如果/(x,y)=0則線邊界如果/(x,y)<0則分區(qū)l 對于編碼目的,先驗定義了可能分區(qū)(或者幾何模式)的字典庫(dictioanry)這可用公式定義如下 p : p e
以及
「如果p-0,則0e
其中,A p和a e是所選擇的量化(參數(shù)分辨率)步輻。e和P的量化的索引是所傳送的用于對邊緣進行編碼的信息。然而,如果在編碼過程中使用模式16X8和8X16,則對于p = 0的情況,可以從可能邊緣的集合中去除角度0和90。 在幾何自適應(yīng)運動補償模式中,執(zhí)行對每個分區(qū)的p、 9和運動矢量的搜索,以
便發(fā)現(xiàn)最佳配置。對于每對p和e ,在兩個階段中進行完全搜索策略,其中搜索最佳運動矢量。在幾何自適應(yīng)幀內(nèi)預(yù)測模式內(nèi),執(zhí)行對于每個分區(qū)的p、 e和最佳預(yù)測因子(方向性預(yù)測或統(tǒng)計,等等)的搜索,以便發(fā)現(xiàn)最佳配置。 在編碼器方,如果使用完全搜索,則幾何模式的計算性復(fù)雜度可能非常高。因此,
開發(fā)快速算法來減少實際應(yīng)用中的編碼器復(fù)雜度是相當(dāng)重要的。 在一實施例中,我們使用MPEG-4 AVC標(biāo)準和P畫面的幀間幾何分區(qū)的架構(gòu)。然而,將會理解,給出此處提供的本原理的示教,本領(lǐng)域和相關(guān)領(lǐng)域中的普通技術(shù)人員可容易地將本原理的其它實施例應(yīng)用于幀內(nèi)幾何分區(qū)、其它類型的畫面和其它視頻編碼標(biāo)準和建議書、及其擴展,同時維持本原理的精神。本原理可以與快速運動估計和/或MPEG-4 AVC快速模式判定聯(lián)合地應(yīng)用。對于編碼成本測量,我們使用RDcost作為一個示例。然而,將會理解,本原理不僅僅限于在前類型的編碼成本測量,因此可以應(yīng)用其它的編碼成本測量,
包括但不限于僅失真測量(例如均方差等)等等,同時維持本原理的精神。
為了圖示和清楚目的,本原理被分類為以下三個類別(l)基于原始MPEG-4 AVC標(biāo)準幀間預(yù)測模式與幾何分區(qū)模式之間的相關(guān)性的快速模式判定;(2)幾何分區(qū)模式內(nèi)的快速幾何分區(qū)選擇;(3)通過幾何分區(qū)和預(yù)測日期的交替優(yōu)化的快速幾何分區(qū)選擇。將會理解,可以聯(lián)合地或者獨立地應(yīng)用這些類別。 1.基于原始MPEG-4 AVC標(biāo)準幀間預(yù)測模式與幾何分區(qū)模式之間的相關(guān)性的快速模式判定。 在這個類別中,執(zhí)行快速算法以便判定我們是否能夠完整地跳過測試幾何模式。我們將假設(shè)MPEG-4 AVC標(biāo)準幀間預(yù)測模式在幾何分區(qū)模式之前被編碼器測試。我們將進一步把第一類別下的我們的算法分類為下列5個子類別(1)MPEG-4 AVC標(biāo)準模式判定;(2)早期停止判定;(3)相鄰判定;(4)殘余判定;和(5)運動矢量判定。可以聯(lián)合地或者獨立地應(yīng)用這些子類別。 1. 1 MPEG-4 AVC標(biāo)準模式判定 在這個子類別中,我們基于由編碼器選擇的最佳和/或次佳(如果可得到)的MPEG-4 AVC標(biāo)準模型來判定是否跳過測試幾何模式的壓縮性能。在一實施例中,這一類別的判定是基于以下假設(shè)例如,如果編碼器選擇幾何模式作為宏塊的最佳模式,則最佳MPEG-4 AVC標(biāo)準幀間預(yù)測模式不可能是SKIP、 16X 16或者幀內(nèi)模式。同時,在子8X8級別處,如果最佳子宏塊模式是8 X 8幾何模式,則人們可以假設(shè)最佳MPEG-4 AVC標(biāo)準子宏塊模式不可能是8X8(或者,如果考慮幀間-B預(yù)測,則不可能是Direct 8X8)。在宏塊大小級別,這是因為SKIP和/或16X 16意味著宏塊很可能在相同對象或運動區(qū)域內(nèi),并且?guī)瑑?nèi)意味著宏塊很可能是被阻塞的(occluded)對象。這同樣應(yīng)用于子宏塊。在一個實施例中,我們首先檢查最佳MPEG-4 AVC標(biāo)準模式是否是SKIP模式。如果是這種情況,則編碼器跳過測 試幾何模式,從而避免了邊緣和運動搜索。如果SKIP不是由編碼器選擇的最佳模式,則編 碼器檢查最佳MPEG-4 AVC標(biāo)準模式是否是幀內(nèi)模式。如果是這種情況,則跳過幾何模式。 否則,編碼器檢查最佳MPEG-4 AVC標(biāo)準模式是否是16X16。如果是這種情況,則編碼器檢 查次佳MPEG-4 AVC標(biāo)準模式。如果它是SKIP模式,則我們進一步跳過測試幾何模式。否 則,我們測試幾何模式。類似地,對于子宏塊,如果最佳MPEG-4 AVC標(biāo)準子宏塊模式是8X8 分區(qū)大小,則編碼器跳過測試幾何子宏塊模式。 轉(zhuǎn)向圖5A,用于16 X 16幾何模式的模式判定的示例性方法一般用附圖標(biāo)記500來 指明。 方法500包括開始塊505,在開始塊505,將控制傳遞到判定塊510。判定塊510確 定是否J最佳w模式〈T最佳w模式。如果是,則將控制傳遞到功能塊515。否則,將控制傳 遞到功能塊520。 功能塊515跳躍到下一宏塊,并且將控制傳遞到結(jié)束塊549。
功能塊520計算J16X16eE。,并且將控制傳遞到結(jié)束塊549。 轉(zhuǎn)向圖5B,用于8 X 8幾何模式的模式判定的示例性方法一般用附圖標(biāo)記550來指 明。 方法550包括開始塊555,在開始塊555將控制傳遞到判定塊560。判定塊560確
定是否J最佳8X8模式〈T最佳8X8模式,其中T代表閾值。如果是,則將控制傳遞到功能塊565。否
則,將控制傳遞到功能塊570。 功能塊516跳躍到下一宏塊,并且將控制傳遞到結(jié)束塊599。
功能塊570計算J8X8eE。,并且將控制傳遞到結(jié)束塊599。 將會理解,給出此處提供的本原理的示教,此處提供的示例易于被本領(lǐng)域和相關(guān) 領(lǐng)域中的普通技術(shù)人員擴展到最佳模式的其它組合。而且,將會理解,考慮用來預(yù)測的最大 數(shù)目的條目不限于MPEG-4 AVC標(biāo)準預(yù)測模式當(dāng)中的最佳和次佳被選的模式,并且因此,也 可以利用其它數(shù)目的最佳被選的模式,同時維持本原理的精神。
1.2早期停止判定 在這個子類別中,我們建議使用早期停止準則來達到快速模式判定。這些停止準 則都基于自適應(yīng)閾值機制。該閾值可以是量化參數(shù)、空間/時間相鄰率失真成本(RDcost) 等等的函數(shù)。基本方案是在測試所有可能的MPEG-4AVC標(biāo)準宏塊/子宏塊分區(qū)模式之后應(yīng) 用閾值,以便判定是否跳過測試16 X 16和/或8 X 8幾何分區(qū)模式。在一個實施例中,我們 在應(yīng)用16 X 16/8 X 8幾何分區(qū)判定之前僅測試最佳MPEG-4 AVC標(biāo)準模式。如果最佳MPEG-4 AVC標(biāo)準模式的RDcost小于某一閾值,則我們跳過測試幾何模式。否則,我們測試幾何模 式。 可以基于一些安全保護或從RDcost收集的統(tǒng)計來選擇快速幾何模式判定閾值。
轉(zhuǎn)向圖3A和圖3B,基于MPEG-4 AVC標(biāo)準模式信息的快速幾何模式判定的示例性 方法通常分別用附圖標(biāo)記300和350來指明。 方法300包括開始塊305,在開始塊305將控制傳遞到功能塊310。功能塊310檢 查最佳MPEG-4 AVC標(biāo)準模式,并且將控制傳遞到判定塊315。判定塊315確定最佳MPEG-4 AVC標(biāo)準模式是否是SKIP(跳過)或幀內(nèi)。如果是,則將控制傳遞到判定塊320。否則,將控制傳遞到功能塊335。 判定塊320確定最佳MPEG-4 AVC標(biāo)準模式是否是16 X 16。如果是,則將控制傳遞 到判定塊325。否則,將控制傳遞到功能塊330。判定塊325確定次佳MPEG-4 AVC標(biāo)準模式是否是SKIP (跳過)。如果是,則將控
制傳遞到功能塊335。否則,將控制傳遞到功能塊330。 功能塊330檢查幾何模式,并且將控制傳遞到功能塊335。 功能塊335選擇最佳模式,并且將控制傳遞到結(jié)束塊349。 方法350包括開始塊355,在開始塊355將控制傳遞到功能塊360。功能塊360檢 查最佳MPEG-4 AVC標(biāo)準子宏塊模式,并且將控制傳遞到判定塊365。判定塊365確定最佳 MPEG-4 AVC標(biāo)準模式是否為8X8。如果是,則將控制傳遞到功能塊375。否則,將控制傳遞 到功能塊370。 功能塊370檢查子宏塊幾何模式,并且將控制傳遞到功能塊375。 功能塊375選擇最佳子宏塊模塊,并且將控制傳遞到結(jié)束塊399。 在另一實施例中,在16X 16/8X8幾何分區(qū)判定之前,我們使用來自最佳和次佳
MPEG-4 AVC標(biāo)準模式的統(tǒng)計數(shù)字(如果可得到)。如果最佳MPEG-4 AVC標(biāo)準模式的RDcost
小于某一閾值,并且次佳MPEG-4 AVC標(biāo)準模式的RDcost小于另一閾值,則我們跳過測試幾
何模式。否則,我們測試幾何模式。 轉(zhuǎn)向圖4,基于相鄰信息的快速幾何模式判定的示例性方法一般用附圖標(biāo)記400 來指明。 方法400包括開始塊405,開始塊405將控制傳遞到功能塊410。功能塊410檢查 上部和左部宏塊模式判定,并且將控制傳遞到判定塊415。判定塊415確定模式判定是否為 SKIP(跳過)或者16X16。如果是,則將控制傳遞到功能塊425。否則,將控制傳遞到功能 塊420。 功能塊420檢查幾何模式,并且將控制傳遞到功能塊425。 如果幾何模式被檢查,則功能塊425選擇幾何模式和來自MPEG-4 AVC標(biāo)準的最佳 模式之間的最佳模式,否則,功能塊425選擇來自MPEG-4 AVC標(biāo)準的最佳模式,并且將控制 傳遞到結(jié)束塊499。 在另一個實施例中,可以考慮第一類別的第一和第二子類別的途徑之間的組合, 其中使用關(guān)于閾值成本準則和最佳被選的模式準則的組合。另一個可能的途徑是使用最佳 模式和次佳模式作為閾值適應(yīng)的條件性環(huán)境。根據(jù)最佳和次佳MPEG-4 AVC標(biāo)準模式的組 合,可以設(shè)置用于跳過或者不測試幾何模式的判定閾值。 [cms] 1.3相鄰判定 MPEG-4 AVC標(biāo)準使用塊編碼結(jié)構(gòu)。通常,對象趨向于穿過塊邊界。在這個子類別 中,我們將使用相鄰信息來使得模式判定更快速。 如果空間和/或時間相鄰宏塊都不包括對給定的一個或多個宏塊(例如16X8, 8X16,8X8,8X4)(或者子塊)進行分區(qū)的模式,則當(dāng)前宏塊(或者子塊)的最佳模式成為 幾何模式的可能性較低。在一個實施例中,編碼器檢查左部和上部相鄰宏塊,如果它們都是 SKIP(跳過)或16X16,則編碼器跳過測試當(dāng)前宏塊中的幾何模式。否則,測試幾何模式。 在另一個實施例中,考慮相鄰物和當(dāng)前最佳MPEG-4 AVC標(biāo)準模式的組合判定規(guī)則被考慮。
轉(zhuǎn)向圖6A,用于16X16幾何模式的模式判定的示例性方法一般用附圖標(biāo)記600來 指明。 方法600包括開始塊605,在開始塊605將控制傳遞到判定塊610。判定塊610確
J最佳,次佳16X16模式^ T最佳,次佳16X16模式,
其中T是閾值。如果是,則將控制傳遞到功能塊
615。否則,將控制傳遞到功能塊620。 功能塊615跳躍到下一宏塊,并且將控制傳遞到結(jié)束塊649。
功能塊620計算J16X16eE。,并且將控制傳遞到結(jié)束塊649。 轉(zhuǎn)向圖6B,用于8 X 8幾何模式的模式判定的示例性方法通常用附圖標(biāo)記650來指 明。 方法650包括開始塊655,在開始塊655將控制傳遞到判定塊660。判定塊660確
J最佳,次佳8X8模式〈T最佳,次佳16><16模式, 其中T是閾值。如果是,則將控制傳遞到功能塊
665。否則,將控制傳遞到功能塊670。 功能塊665跳躍到下一宏塊,并且將控制傳遞到結(jié)束塊699。
功能塊670計算J8X8eE。,并且將控制傳遞到結(jié)束塊699。
1.4.殘余判定 殘余的能量可以是給定宏塊的預(yù)測質(zhì)量的指示符。如果當(dāng)前宏塊的最佳MPEG-4 AVC標(biāo)準模式的殘余的能量足夠低,則編碼器可以跳過測試幾何模式。類似地,如果當(dāng)前子 宏塊的最佳MPEG-4 AVC標(biāo)準子宏塊模式的殘余的能量低,則我們可以跳過測試子宏塊幾何 模式。在一個實施例中,我們可以使用殘余離散余弦變換(DCT)系數(shù)的絕對和來計算殘余 的能量。 轉(zhuǎn)向圖7,用于基于殘余信息的快速幾何模式判定的示例性方法一般用附圖標(biāo)記 700來指明。 方法700包括開始塊705,在開始塊705將控制傳遞到功能塊710。功能塊710檢 查最佳MPEG-4 AVC標(biāo)準模式的殘余,并且將控制傳遞到判定塊715。判定塊715確定殘余 的能量是否小于閾值T。如果是,則將控制傳遞到功能塊725。否則,將控制傳遞到功能塊 720。 功能塊720檢查幾何模式,并且將控制傳遞到功能塊725。 如果幾何模式被檢查,則功能塊725選擇幾何模式和來自MPEG-4 AVC標(biāo)準的最佳 模式之間的最佳模式,否則選擇來自MPEG-4 AVC標(biāo)準的最佳模式,并且將控制傳遞到結(jié)束 塊799。 1. 5.運動矢量判定 統(tǒng)計上地,由于當(dāng)存在運動邊緣時幾何模式最有幫助的事實(即,背景傾向于更 靜止和/或具有全局運動),因此前景(foreground)傾向于比背景使用更多的幾何模式。 通過使用空間和/或時間相鄰宏塊來分析最佳MPEG-4AVC標(biāo)準模式的運動字段,編碼器可 以判定我們是否可以跳過測試幾何模式。在一個實施例中,編碼器計算最佳MPEG-4 AVC標(biāo) 準運動矢量和相鄰運動矢量的差異。如果所述差異小于閾值,則編碼器跳過測試幾何模式。 否則測試幾何模式。 轉(zhuǎn)向圖8,用于基于運動矢量信息的快速模式判定的示例性方法通常用附圖標(biāo)記 800來指明。
方法800包括開始塊805,在開始塊805將控制傳遞到功能塊810。功能塊810計 算來自那些最佳MPEG-4 AVC標(biāo)準模式和相鄰宏塊的運動的差異,并且將控制傳遞到判定塊 815。判定塊815確定該差異是否小于閾值T。如果是,則將控制傳遞到功能塊825。否則, 將控制傳遞到功能塊820。 功能塊820檢查幾何模式,并且將控制傳遞到功能塊825。 功能塊825選擇幾何模式與來自MPEG-4 AVC標(biāo)準的最佳模式之間的最佳模式,否 則選擇來自MPEG-4 AVC標(biāo)準的最佳模式,并且將控制傳遞到結(jié)束塊899。
2.幾何分區(qū)模式內(nèi)的快速楔形選擇 在這個分類中,一個目標(biāo)是減少我們必需用來搜索幾何分區(qū)模式的可能分區(qū)的數(shù) 目。目標(biāo)是減少搜索空間、并且最小化最佳編碼模式和/或幾何分區(qū)的優(yōu)化算法和恢復(fù)陷 入局部最小值的機會。在該第二類別下的途徑可被分離為下列兩個子分類(l)基于預(yù)測 性的算法;和(2)分級搜索。
2. 1.預(yù)測性算法 預(yù)測性算法可被考慮為主要包括下列三個步驟(1)初始預(yù)測因子選擇從一組潛 在可能的楔形中選擇最佳楔形;(2)如果滿足一些規(guī)則,則自適應(yīng)早期終止允許終止在給 定階段的搜索;和(3)預(yù)測精化利用最佳楔形預(yù)測因子周圍的精化圖案,以便改善最終預(yù) 測??梢元毩⒒蛘呗?lián)合地執(zhí)行先前的三個步驟。
2. 1. 1預(yù)測因子選擇 其目標(biāo)是利用預(yù)先計算的信息來發(fā)現(xiàn)最可能的楔形。我們可以將我們的預(yù)測因子 劃分為下列三組(l)基于空間和/或時間相關(guān)性的預(yù)測因子;(2)基于最佳MPEG-4 AVC標(biāo) 準幀間模式的預(yù)測因子(如果可得到);和(3)固定的預(yù)測因子網(wǎng)格(predictor grid)。
關(guān)于第一組,即基于空間和/或時間相關(guān)性的預(yù)測因子,我們可以從空間相鄰楔 形和/或時間相鄰楔形擴展楔形分區(qū)(或楔形)、和/或那些楔形的一些功能,并且使用它 們作為預(yù)測因子。 關(guān)于第二組,即基于最佳MPEG-4 AVC標(biāo)準幀間模式的預(yù)測因子(如果可得到),觀 察到在優(yōu)化幾何模式和最佳MPEG-4 AVC標(biāo)準幀間模式之間存在強烈的關(guān)聯(lián)性(例如,如果 具有重要的水平方向的任意幾何分區(qū)實際上是最可能的分區(qū)模式,則16X8模式很可能是 次佳模式)。 關(guān)于第三組,即固定的預(yù)測因子網(wǎng)格,為了避免其中優(yōu)化陷入局部最小值的情形, 我們也可以測試附加的預(yù)測因子。更具體地,我們可以設(shè)計一組在預(yù)測中心周圍相等地或 者更密集地隔開的預(yù)測因子。在一個實施例中,我們可以使用AP' 二2Ap和A9'= 4A e來設(shè)置固定的搜索預(yù)測因子。我們應(yīng)當(dāng)注意所有的上述預(yù)測因子在所有情況下并不 是必需的。我們可以根據(jù)是否滿足特定條件來自適應(yīng)地禁用/使能一些預(yù)測因子。
2. 1.2自適應(yīng)早期終止 從仿真中我們注意到相鄰塊的編碼成本趨向于高度相關(guān)?;诖?,可以設(shè)置閾值, 因此如果當(dāng)前塊的編碼成本跨過那個閾值,則搜索算法可以更早地停止。這明顯地減低了 計算復(fù)雜度。我們可以設(shè)計兩種類型的閾值。 一種類型的閾值可被用來從所述預(yù)測因子集 合中選擇最佳或次佳楔形。另一種類型的閾值可被用來判定幾何模式是否將被最終選擇為 最佳模式。所述閾值可以使用空間/時間相鄰宏塊的RDcost、和/或最佳MPEG-4 AVC標(biāo)準模式的RDcost來設(shè)計(如果可得到)。 —個實施例可以實現(xiàn)如下。在測試所有空間/時間/MPEG-4 AVC標(biāo)準預(yù)測因子之 后,我們可以檢查RDcost是否少于某一閾值T。。如果是,則我們停止并選擇最佳預(yù)測因子 作為幾何模式的最佳楔形。否則,我們測試固定的預(yù)測因子。如果RDcost(和/或編碼成 本)少于1\,則我們將停止并且選擇最佳預(yù)測因子作為幾何模式的最終楔形。否則,我們測 試RDcost是否大于T2。如果是,則我們將停止并且設(shè)置MPEG-4 AVC標(biāo)準測試模式作為宏 塊的最佳模式。否則,我們將精化我們的最佳楔形候選。
2. 1.3預(yù)測精化 使用被定位在最佳預(yù)測因子處的迭代性搜索圖案可以進一步精化楔形搜索。我們 可以應(yīng)用來自快速運動估計的所有搜索圖案想法。在一個實施例中,例如,我們可以將搜索
圖案定義為類似于菱形搜索。假設(shè)最佳預(yù)測因子是(p。, e。)。 步驟1 :測試在搜索空間內(nèi)利用P = P 。± A p禾p e = e 。± A e配對的所有楔形。 步驟2 :如果具有最小RDcost的楔形是(P 。, 9 。),則我們停止。否則,通過將(p 。,
e 。)設(shè)置為具有最小RDcost的楔形而轉(zhuǎn)到步驟l。 我們還可以在第二或第三最佳預(yù)測因子處應(yīng)用預(yù)測精化,以便避免陷入局部最小 值。而且,六角形搜索可被應(yīng)用于更密集和更好覆蓋范圍的參數(shù)空間。當(dāng)然,本原理不僅限 于菱形和六角形搜索,因此可以使用其它類型的搜索,同時維持本原理的精神。
轉(zhuǎn)向圖9,用于快速預(yù)測性楔形選擇的示例性方法一般用附圖標(biāo)記900來指明。
方法900包括開始塊905,在開始塊905將控制傳遞到功能塊910。功能塊910選 擇一組楔形預(yù)測因子,并且將控制傳遞到功能塊915。功能塊915從空間/時間預(yù)測因子 和MPEG-4 AVC標(biāo)準幀間模式預(yù)測因子中選擇最佳楔形,并且將控制傳遞到判定塊920。判 定塊920確定最佳預(yù)測因子的RDcost是否小于閾值T0。如果是,則將控制傳遞到功能塊 950。否則,將控制傳遞到功能塊925。 功能塊925測試固定的預(yù)測因子網(wǎng)格,并且將控制傳遞到判定塊930。判定塊930 確定最佳預(yù)測因子的RDcost是否小于閾值Tl。如果是,則將控制傳遞到功能塊950。否則, 將控制傳遞到判定塊935。 判定塊935確定最佳預(yù)測因子的RDcost是否大于閾值T2。如果是,則將控制傳遞 到功能塊940。否則,將控制傳遞到功能塊945。 功能塊945執(zhí)行預(yù)測因子精化,并且將控制傳遞到功能塊950。 功能塊950設(shè)置幾何模式中的最佳楔形,并且將控制傳遞到功能塊955。 功能塊955選擇幾何模式和MPEG-4 AVC模式之間的最佳模式,并且將控制傳遞到
結(jié)束塊999。 2. 2分級搜索 在一實施例中,我們可以應(yīng)用分級楔形搜索。分級楔形搜索涉及建立楔形參數(shù)的 分級金字塔(pyramid)。首先在較高級別的金字塔處使用最小圖像分辨率執(zhí)行在2. 1. 3(預(yù) 測精化)中的完全搜索或快速搜索圖案,以便發(fā)現(xiàn)最佳楔形。然后精化該楔形,直到最低級 別的金字塔達到原始圖像分辨率。在另一實施例中,對分區(qū)參數(shù)的金字塔式搜索也可應(yīng)用 于原始分辨率圖像。這意味著通過在每一級算法處改善(加倍)分區(qū)參數(shù)的分辨率以分級的方式反復(fù)地精化定義分區(qū)的參數(shù)。 轉(zhuǎn)向圖IO,使用分級搜索的快速楔形選擇的示例性方法通常用附圖標(biāo)記1000來 指明。 方法1000包括開始塊1005,該開始塊將控制傳遞到功能塊1010。功能塊1010建 立參數(shù)的分級金字塔,并且將控制傳遞到功能塊1015。功能塊1015對該金字塔的最高級別 中的最佳楔形執(zhí)行完全/快速搜索,并且將控制傳遞到功能塊1020。功能塊1020從該金字 塔的最高級別到最低級別中精化楔形,并且將控制傳遞到功能塊1025。功能塊1025選擇幾 何模式的最佳楔形,并且將控制傳遞到功能塊1030。功能塊1030選擇幾何模式與MPEG-4 AVC標(biāo)準模式之間的最佳模式,并且將控制傳遞到結(jié)束塊1099。 轉(zhuǎn)向圖ll,快速幾何模式和楔形選擇的示例性方法通常用附圖標(biāo)記1100來指明。
方法1100包括開始塊1105,該開始塊將控制傳遞到功能塊1110。功能塊1110測 試MPEG-4 AVC標(biāo)準模式,并且將控制傳遞到判定塊1115。判定塊1115確定是否應(yīng)用快速模 式判定以便檢查我們是否能夠跳過檢查幾何模式。如果能夠,則將控制傳遞到功能塊1120。 否則,將控制傳遞到功能塊1125。 功能塊1120選擇MPEG-4 AVC標(biāo)準模式作為最佳模式,并且將控制傳遞到結(jié)束塊 1199。 功能塊1125應(yīng)用快速楔形選擇以便在幾何模式中發(fā)現(xiàn)最佳楔形,并且將控制傳 遞到功能塊1130。功能塊1130選擇幾何模式與MPEG-4 AVC標(biāo)準模式之間的最佳模式,并 且將控制傳遞到結(jié)束塊1199。 3.通過幾何分區(qū)和預(yù)測數(shù)據(jù)的交替優(yōu)化進行的快速楔形選擇
用于快速聯(lián)合預(yù)測分區(qū)參數(shù)恢復(fù)的另一種途徑是使用交替的優(yōu)化策略。在與交替 優(yōu)化的使用相關(guān)的實施例中,編碼器對于具有固定的楔形分區(qū)參數(shù)的分區(qū)交替地搜索最佳 預(yù)測,并且在隨后的步驟,編碼器對于那個點為止恢復(fù)的分區(qū)來固定最佳預(yù)測因子,并且優(yōu) 化該楔形分區(qū)參數(shù),從而在每個步驟,最小化了測量的失真和/或編碼成本。根據(jù)預(yù)先固定 (prefixed)的值以及對利用迭代次數(shù)進行的優(yōu)化改進的測量中的至少一個,執(zhí)行這一處理 給定次數(shù)。將會理解,用于第一迭代的初始設(shè)置可以明顯地影響這種途徑的最終結(jié)果。在 另一實施例中,測試用于幾何分區(qū)和預(yù)測數(shù)據(jù)的交替優(yōu)化的若干初始條件。該初始條件被 應(yīng)用于幾何分區(qū)參數(shù)和/或預(yù)測數(shù)據(jù)參數(shù)。該初始條件可以包括但是不限于下列中的一個 或多個對用于楔形分區(qū)的參數(shù)空間的預(yù)先固定的取樣;基于周圍相鄰物的可用數(shù)據(jù)的楔 形分區(qū)參數(shù)的預(yù)測;用于幀間預(yù)測的快速運動搜索;和運動預(yù)測因子。 轉(zhuǎn)向圖12,快速替換性預(yù)測/分區(qū)參數(shù)優(yōu)化的示例性方法通常用附圖標(biāo)記1200來 指明。將會理解,圖12的方法1200可以結(jié)合一種或多種先前描述的途徑來實現(xiàn),同時維持 本原理的精神。 方法1200包括開始塊1205,該開始塊將控制傳遞到功能塊1210。功能塊1210為 幾何參數(shù)和分區(qū)預(yù)測設(shè)置初始猜測,并且將控制傳遞到循環(huán)限制塊1215。循環(huán)限制塊1215 設(shè)置N次迭代的循環(huán),并且將控制傳遞到功能塊1220。功能塊1220保持分區(qū)預(yù)測參數(shù),并 且將控制傳遞到功能塊1225。功能塊1225發(fā)現(xiàn)在所有可能性(或者其樣本)上循環(huán)的最 佳幾何參數(shù),并且將控制傳遞到功能塊1230。功能塊1230設(shè)置新的幾何分區(qū)參數(shù),并且將 控制傳遞到功能塊1235。功能塊1235保持幾何分區(qū)參數(shù),并且將控制傳遞到功能塊1240。功能塊1240發(fā)現(xiàn)在所有可能性(或者其樣本)上循環(huán)的最佳分區(qū)預(yù)測參數(shù),并且將控制傳 遞到功能塊1245。功能塊1245設(shè)置新的分區(qū)預(yù)測參數(shù),并且將控制傳遞到判定塊1250。 判定塊1250確定是否已經(jīng)達到穩(wěn)定的狀態(tài)優(yōu)化。如果達到,則將控制傳遞到功能塊1260。 否則,將控制傳遞到循環(huán)限制塊1255。 循環(huán)限制塊1255結(jié)束N個迭代上的循環(huán),并且將控制傳遞到功能塊1260。 功能塊1260保存最佳分區(qū)邊緣和分區(qū)參數(shù),并且將控制傳遞到結(jié)束塊1299。 現(xiàn)在將給出本發(fā)明的許多伴隨優(yōu)點/特征中的一些的描述,上面已經(jīng)提到了一些
優(yōu)點/特征。例如,一個優(yōu)點/特征是一種方法,其包括使用基于幾何模型的分區(qū)模式來執(zhí)
行非窮盡性幾何模式判定。所述執(zhí)行步驟包括基于在基于幾何模型的分區(qū)模式與非幾何
分區(qū)模式之間的相關(guān)性和依賴性中的至少一個,跳過基于幾何模型的分區(qū)模式的測試。 另一個優(yōu)點/特征是如上所述的方法,其中所述非窮盡性幾何模式判定使用非幾
何模式信息、早期停止閾值、相鄰信息、殘余信息和運動矢量信息中的至少一個。 又一個其它優(yōu)點/特征是如上所述的方法,其中早期停止閾值對應(yīng)于量化參數(shù)、
空間相鄰率失真成本和時間相鄰率失真成本中的至少一個。 而且,另一個優(yōu)點/特征是一種方法,其包括使用基于幾何模型的分區(qū)模式來執(zhí)
行非窮盡性幾何參數(shù)選擇。所述執(zhí)行步驟包括應(yīng)用預(yù)測性搜索和分級搜索中的至少一個。
所述預(yù)測性搜索包括初始預(yù)測因子選擇、自適應(yīng)早期終止和預(yù)測因子精化中的至少一個。 而且,另一個優(yōu)點/特征是如上所述的方法,其中初始預(yù)測因子選擇選擇性地使
能基于空間相關(guān)性的預(yù)測因子、基于時間相關(guān)性的預(yù)測因子、基于給定編碼標(biāo)準或者給定
編碼推薦的最佳幀間模式的預(yù)測因子、和固定的預(yù)測因子網(wǎng)格中的至少一個。 而且,另一個優(yōu)點/特征是一種方法,包括使用基于幾何模型的分區(qū)模式來對圖
像的視頻信號數(shù)據(jù)進行編碼。所述編碼步驟使用用于圖像的至少一部分的幾何分區(qū)參數(shù)和
預(yù)測數(shù)據(jù)的交替優(yōu)化來編碼視頻信號數(shù)據(jù)。 基于此處的示教,相關(guān)領(lǐng)域內(nèi)的普通技術(shù)人員可以容易地確定本原理的這些和其 它特征和優(yōu)點。將會理解,本原理的示教能夠以硬件、軟件、固件、專用處理器、或者它們的 組合的各種形式來實現(xiàn)。 更優(yōu)選地,本原理的示教被實現(xiàn)為硬件和軟件的組合。而且,所述軟件可被實現(xiàn)為 程序存儲單元上有形地具化的應(yīng)用程序。所述應(yīng)用程序可被上傳到包括任意合適架構(gòu)的機 器、并由其執(zhí)行。優(yōu)選地,所述機器被實現(xiàn)于計算機平臺上,該計算機平臺具有諸如一個或 多個中央處理單元("CPU")、隨機存取存儲器("RAM")、和輸入/輸出("I/O")接口之 類的硬件。所述計算機平臺也可以包括操作系統(tǒng)和微指令代碼。此處描述的各種各樣的處 理和功能可以是微指令代碼的一部分或者應(yīng)用程序的一部分,或者它們的任意組合,它們 可以通過CPU來執(zhí)行。另外,各種其它外圍單元可以連接到計算機平臺,例如附加的數(shù)據(jù)存 儲單元和打印單元。 進一步理解,因為附圖中描繪的一些構(gòu)成的系統(tǒng)組件和方法優(yōu)選地以軟件來實 現(xiàn),因此系統(tǒng)組件之間的實際連接或者處理功能塊可以根據(jù)本原理被編程的方式而有所不 同。給出此處的示教,相關(guān)領(lǐng)域內(nèi)的普通技術(shù)人員將能夠預(yù)料本原理的這些和類似實現(xiàn)方 式或配置。 盡管此處已經(jīng)參考附圖描述了說明性的實施例,但是將會理解,本原理不限于這些精確的實施例,并且相關(guān)領(lǐng)域內(nèi)的普通技術(shù)人員可以在其中實現(xiàn)各種變化和修改,而不 背離本原理的范疇或精神。所有這些變化和修改意欲包含在如所附權(quán)利要求中闡述的本原 理的范疇之內(nèi)。
權(quán)利要求
一種設(shè)備,包括編碼器(100),用于使用基于幾何模型的分區(qū)模式來執(zhí)行非窮盡性幾何模式判定,其中所述編碼器根據(jù)在基于幾何模型的分區(qū)模式與非幾何分區(qū)模式之間的相關(guān)性和依賴性中的至少一個來跳過基于幾何模型的分區(qū)模式的測試。
2. 如權(quán)利要求1所述的設(shè)備,其中所述非窮盡性幾何模式判定使用非幾何模式信息、 早期停止閾值、相鄰信息、殘余信息和運動矢量信息中的至少一個。
3. 如權(quán)利要求2所述的設(shè)備,其中所述早期停止閾值對應(yīng)于量化參數(shù)、空間相鄰率失 真成本和時間相鄰率失真成本中的至少一個。
4. 一種方法,包括使用基于幾何模型的分區(qū)模式來執(zhí)行非窮盡性幾何模式判定(300, 350, 500, 550, 600, 650, 700, 800, 1100),其中所述執(zhí)行步驟包括根據(jù)在基于幾何模型的分區(qū)模式與非幾何分 區(qū)模式之間的相關(guān)性和依賴性中的至少一個,跳過(320, 365, 515, 565, 615, 665, 815, 1120) 基于幾何模型的分區(qū)模式的測試。
5. 如權(quán)利要求4所述的方法,其中所述非窮盡性幾何模式判定使用非幾何模式信息 (315,320,325)、早期停止閾值(920)、相鄰信息(415)、殘余信息(715)和運動矢量信息 (815)中的至少一個。
6. 如權(quán)利要求5所述的方法,其中所述早期停止閾值對應(yīng)于量化參數(shù)、空間相鄰率失 真成本和時間相鄰率失真成本中的至少一個。
7. —種設(shè)備,包括編碼器(100),用于使用基于幾何模型的分區(qū)模式來執(zhí)行非窮盡性幾何參數(shù)選擇,其中 所述編碼器通過應(yīng)用預(yù)測性搜索和分級搜索中的至少一個來執(zhí)行非窮盡性幾何參數(shù)選擇, 所述預(yù)測性搜索包括初始預(yù)測因子選擇、自適應(yīng)早期終止和預(yù)測因子精化中的至少一個。
8. 如權(quán)利要求7所述的設(shè)備,其中所述初始預(yù)測因子選擇選擇性地使能下列預(yù)測因子 中的至少一個基于空間相關(guān)性的預(yù)測因子、基于時間相關(guān)性的預(yù)測因子、基于給定編碼標(biāo)準或者給定編碼建議書的最佳幀間模式的預(yù)測因子、和固定的預(yù)測因子網(wǎng)格。
9. 一種方法,包括使用基于幾何模型的分區(qū)模式來執(zhí)行非窮盡性幾何參數(shù)選擇,其中所述執(zhí)行步驟包括 應(yīng)用預(yù)測性搜索和分級搜索(1000)中的至少一個,所述預(yù)測性搜索包括初始預(yù)測因子選 擇、自適應(yīng)早期終止和預(yù)測因子精化中的至少一個(900)。
10. 如權(quán)利要求9所述的方法,其中初始預(yù)測因子選擇選擇性地使能下列預(yù)測因子中 的至少一個基于空間相關(guān)性的預(yù)測因子、基于時間相關(guān)性的預(yù)測因子、基于給定編碼標(biāo)準或者給定編碼建議書的最佳幀間模式的預(yù)測因子(915)、和固定的預(yù)測因子網(wǎng)格(925)。
11. 一種方法,包括使用基于幾何模型的分區(qū)模式,對圖像的視頻信號數(shù)據(jù)進行編碼,其中所述編碼步驟 使用用于圖像的至少一部分的幾何分區(qū)參數(shù)和預(yù)測數(shù)據(jù)的替換優(yōu)化來編碼所述視頻信號 數(shù)據(jù)(體)。
全文摘要
提供了用于視頻編碼器中的快速幾何模式判定的方法和設(shè)備。設(shè)備包括編碼器(100),用于使用基于幾何模型的分區(qū)模式來執(zhí)行非窮盡性幾何模式判定。該編碼器(100)根據(jù)在基于幾何模型的分區(qū)模式與非幾何分區(qū)模式之間的相關(guān)性和依賴性中的至少一個來跳過基于幾何模型的分區(qū)模式的測試。
文檔編號H04N7/50GK101731012SQ200880019948
公開日2010年6月9日 申請日期2008年4月3日 優(yōu)先權(quán)日2007年4月12日
發(fā)明者奧斯卡·迪沃拉埃斯科達, 尹澎, 簡·羅, 陸曉安 申請人:湯姆森特許公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1