專(zhuān)利名稱(chēng):二進(jìn)制形狀編碼中的模式編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種模式編碼方法;而且,更具體地,涉及一種二進(jìn)制形狀編碼中的模式編碼方法。
在諸如電視電話和電話會(huì)議系統(tǒng)的數(shù)字視頻系統(tǒng)中,由于該視頻幀信號(hào)包括一序列被稱(chēng)作象素值的數(shù)字?jǐn)?shù)據(jù),需要大量的數(shù)字?jǐn)?shù)據(jù)來(lái)定義每一視頻幀信號(hào)。
然而,由于傳統(tǒng)傳輸信道的可用頻率帶寬是有限的,為了通過(guò)其傳輸大量的數(shù)字?jǐn)?shù)據(jù),有必要通過(guò)使用各種數(shù)據(jù)壓縮技術(shù)來(lái)壓縮或減少數(shù)據(jù)量,尤其是如電視電話和電話會(huì)議系統(tǒng)的低比特率視頻信號(hào)編碼器的情況下。
此種用于低比特率編碼系統(tǒng)的編碼視頻信號(hào)的技術(shù)中之一是面向目標(biāo)的分析-合成編碼技術(shù),其中一輸入視頻圖象被分成多個(gè)目標(biāo);且通過(guò)不同的編碼信道處理用于定義每一目標(biāo)的運(yùn)動(dòng)、輪廓和象素?cái)?shù)據(jù)的三組參數(shù)。
此種面向目標(biāo)的編碼方法的一例是所謂的MPEG(運(yùn)動(dòng)圖象專(zhuān)家組)階段A(MPEG-4),設(shè)計(jì)其是為了提供一種音頻-視頻編碼標(biāo)準(zhǔn)用于在諸如低比特率通信、交互多媒體(例如游戲、交互電視等)和地區(qū)監(jiān)視的應(yīng)用中允許基于內(nèi)容的交互作用、改進(jìn)編碼效率和/或通用可接近性。
根據(jù)MPEG-4,一輸入視頻圖象被分成多個(gè)對(duì)應(yīng)于一用戶(hù)能接入和控制的位流中的實(shí)體的視頻目標(biāo)平面(VOP)。一VOP可被稱(chēng)作一個(gè)目標(biāo),并可由其寬度和高度可以是圍繞每一目標(biāo)的16個(gè)象素(一宏塊大小)的最小倍數(shù)的邊界矩形來(lái)表示使得編碼器可以逐VOP即逐目標(biāo)地處理輸入視頻圖象。
MPEG-4中所述的一VOP包括形狀信息和由亮度和色度數(shù)據(jù)組成的顏色信息,其中該形狀信息由例如二進(jìn)制掩碼表示并相關(guān)于亮度數(shù)據(jù)。在二進(jìn)制掩碼中,用一個(gè)二進(jìn)制值(例如0)來(lái)指定位于該VOP中的目標(biāo)以外的一象素(例如一背景象素),而用其它二進(jìn)制值(例如1)表示該目標(biāo)內(nèi)部的一象素(例如一目標(biāo)象素)。
表示該目標(biāo)的位置和形狀的二進(jìn)制形狀信號(hào)能被表示為一幀或一VOP內(nèi)的一個(gè)二進(jìn)制α塊(binary alpha block)(BAB),例如一塊16×16的二進(jìn)制象素,其中每一個(gè)二進(jìn)制象素有一個(gè)表示一目標(biāo)象素或一背景象素的二進(jìn)制值(例如0或1)。
可通過(guò)利用傳統(tǒng)的基于位圖的形狀編碼方法給一BAB編碼,該方法諸如基于上下文的算術(shù)編碼(CAE)方法(見(jiàn)MPEG-4 Video VerificationModel Version 7.0,國(guó)際標(biāo)準(zhǔn)化組織,移動(dòng)和相關(guān)音頻信息的編碼,ISO/IEC JTC1/SC29/WG11 MPEG97/N1642,Bristol,1997年4月)。
例如,在一內(nèi)部模式中,通過(guò)使用傳統(tǒng)CAE方法給BAB編碼以由此產(chǎn)生已編碼的BAB。而在一交互模式中,通過(guò)運(yùn)動(dòng)估計(jì)和補(bǔ)償找到代表當(dāng)前幀(或VOP)內(nèi)的BAB和先前幀(或VOP)內(nèi)的與其最相似的BAB之間位移的運(yùn)動(dòng)矢量、以及表示其間位移的誤差數(shù)據(jù)。通過(guò)利用傳統(tǒng)的CAE方法來(lái)編碼該誤差數(shù)據(jù)以由此產(chǎn)生已編碼誤差數(shù)據(jù)。且然后,將該已編碼誤差數(shù)據(jù)和該運(yùn)動(dòng)矢量組合以由此產(chǎn)生已編碼BAB。
然而,如上述獲得的已編碼BAB被在一解碼器解碼成只有預(yù)設(shè)分辨率的重建圖象。因此,如果希望較高分辨率的BAB的圖象,則利用其中實(shí)現(xiàn)的可量測(cè)性來(lái)利用傳統(tǒng)的方法給BAB編碼,它將逐漸提高BAB解碼圖象的分辨率。這就是,編碼代表具有較低分辨率的BAB的圖象一基底層;并根據(jù)該基底層,加入另外的信息以產(chǎn)生隨后被編碼的BAB的一加強(qiáng)層。
同時(shí),根據(jù)傳統(tǒng)二進(jìn)制形狀編碼方法,例如CAE方法,來(lái)加強(qiáng)其編碼效率,編碼相應(yīng)BAB的各種模式信號(hào)以由此提供待在逐B(yǎng)AB的基礎(chǔ)上經(jīng)一發(fā)送器被發(fā)送至一解碼器的各自的相應(yīng)已編碼模式信號(hào),而代替編碼該BAB內(nèi)的所有二進(jìn)制象素值并發(fā)送相應(yīng)的已編碼二進(jìn)制象素值。
詳細(xì)地說(shuō),例如,如果在一幀(或一VOP)內(nèi)有160×160二進(jìn)制象素的-圖象平面,則存在100個(gè)16×16二進(jìn)制象素的BAB,并且每一個(gè)BAB其中包括256個(gè)二進(jìn)制象素。因此,每一個(gè)BAB需要256個(gè)數(shù)據(jù)位用以傳送代表一BAB內(nèi)的每一個(gè)二進(jìn)制象素是否是一目標(biāo)象素或一背景象素的二進(jìn)制形狀信息而在其中無(wú)數(shù)據(jù)丟失??紤]到編碼效率這是非常低效的。因而,有必要通過(guò)利用該BAB內(nèi)的二進(jìn)制象素之間的時(shí)間和/或空間相關(guān)性來(lái)加強(qiáng)BAB的編碼效率。
然而,由于通過(guò)利用該BAB內(nèi)的二進(jìn)制象素之間的時(shí)間和/或空間相關(guān)性來(lái)改進(jìn)或加強(qiáng)BAB內(nèi)的編碼二進(jìn)制象素中的編碼效率是有限的,就希望通過(guò)對(duì)代表或表征該BAB的相應(yīng)編碼狀況的一模式信號(hào)編碼來(lái)改進(jìn)編碼效率以由此產(chǎn)生并隨之發(fā)送一相應(yīng)的已編碼模式信號(hào)。
例如,假如一BAB內(nèi)的所有二進(jìn)制象素都是目標(biāo)象素,則不對(duì)所有此些二進(jìn)制象素值編碼以產(chǎn)生待發(fā)送的已編碼二進(jìn)制象素值,而對(duì)說(shuō)明或代表該BAB內(nèi)的所有二進(jìn)制象素都是目標(biāo)象素的一模式信號(hào)進(jìn)行編碼以由此產(chǎn)生待發(fā)送的一相應(yīng)的已編碼模式信號(hào)。通過(guò)利用上述的方法,有可能通過(guò)發(fā)送作為該BAB內(nèi)256個(gè)二進(jìn)制象素代表的BAB的二進(jìn)制形狀信息的相應(yīng)的已編碼模式信號(hào)而提高編碼效率。在這方面,以下描述傳統(tǒng)的模式編碼方法。
根據(jù)傳統(tǒng)的模式編碼方法,在編碼一BAB中,將以下說(shuō)明的7個(gè)模式信號(hào)中的一個(gè)模式信號(hào)編碼成待傳送的一相應(yīng)的已編碼模式信號(hào)。以下描述這7個(gè)模式信號(hào)。
即存在第一模式信號(hào),代表在一交互模式中一運(yùn)動(dòng)矢量是0且已執(zhí)行了一次編碼;第二模式信號(hào),代表在一交互模式中,該運(yùn)動(dòng)矢量不是0且已執(zhí)行了一次編碼;第三模式信號(hào),代表在-交互模式中,該運(yùn)動(dòng)矢量是0且還沒(méi)有執(zhí)行該編碼;第四模式信號(hào),代表在一交互模式中,該運(yùn)動(dòng)矢量不是0且還沒(méi)有執(zhí)行該編碼;第五模式信號(hào),代表在一內(nèi)部模式中,已執(zhí)行了該編碼;第六個(gè)模式信號(hào),代表該BAB內(nèi)的所有二進(jìn)制象素都分別是目標(biāo)象素;以及第七模式信號(hào),代表該BAB內(nèi)的所有二進(jìn)制象素都分別是背景象素(見(jiàn)MPEG-4 VideoVerification Model Version 7.0,國(guó)際標(biāo)準(zhǔn)化組織,對(duì)移動(dòng)和相關(guān)音頻信息的編碼,ISO/IEC JTC1/SC29/WG11 MPEG97/N1642,Bristol,1997年4月,第20~21頁(yè))。
參考
圖1,示出了用于在描述二進(jìn)制形狀編碼中的傳統(tǒng)模式編碼方法的內(nèi)部編碼VOP和交互編碼VOP。在圖1中,顯示了一內(nèi)部編碼VOP100和預(yù)測(cè)編碼VOP 110及120。VOP 110包括BAB 111、112和113;而VOP 120包括BAB 121、122和123,其中在每一VOP之內(nèi)的一陰影區(qū)和一非陰影區(qū)分別代表一目標(biāo)和一背景。
由于VOP 100是一內(nèi)部編碼VOP,第5模式信號(hào)被分配或被提供給VOP 100之內(nèi)的每一BAB。由于BAB 111和BAB 113內(nèi)分別只包括目標(biāo)象素和只包括背景象素,第7和第6模式信號(hào)被分配給VOP 110內(nèi)的BAB 111和BAB 113。
如果代表VOP 110內(nèi)的BAB 112和最相似于作為VOP 110的一前一VOP的VOP 100內(nèi)的BAB 112的一個(gè)BAB(下面作為第一預(yù)測(cè)BAB說(shuō)明其)之間的位移的相應(yīng)運(yùn)動(dòng)矢量是0,且如果在BAB 112的二進(jìn)制象素值和該第一預(yù)測(cè)BAB的相應(yīng)二進(jìn)制象素值之間有誤差并因此對(duì)此誤差編碼,則第一模式信號(hào)被分配給BAB 112。
如果代表VOP 120內(nèi)的BAB 121和最相似于作為VOP 120的一前一VOP的VOP 110內(nèi)的BAB 121的一個(gè)BAB(下面作為第二預(yù)測(cè)BAB說(shuō)明其)之間的位移的相應(yīng)運(yùn)動(dòng)矢量不是0,且如果在BAB 121中的二進(jìn)制象素值和該第二預(yù)測(cè)BAB的相應(yīng)二進(jìn)制象素值之間有誤差并因此對(duì)此誤差編碼,則第二模式信號(hào)被分配給BAB 121。
如果代表VOP 120內(nèi)的BAB 122和最相似于VOP 110內(nèi)的BAB 122的一個(gè)BAB(下面作為第三預(yù)測(cè)BAB說(shuō)明其)之間的位移的相應(yīng)運(yùn)動(dòng)矢量是0,且如果在BAB 122中的二進(jìn)制象素值和該第三預(yù)測(cè)BAB的相應(yīng)二進(jìn)制象素值之間有誤差并因此沒(méi)有對(duì)此誤差編碼,則第三模式信號(hào)被分配給BAB 121。
又,如果代表VOP 120內(nèi)的BAB 123和最相似于VOP 110內(nèi)的BAB 123的一個(gè)BAB(下面作為第四預(yù)測(cè)BAB說(shuō)明其)之間的位移的相應(yīng)運(yùn)動(dòng)矢量不是0,且如果在BAB 123中的二進(jìn)制象素值和該第四預(yù)測(cè)BAB的相應(yīng)二進(jìn)制象素值之間有誤差并因此對(duì)此誤差編碼,則第四模式信號(hào)被分配給BAB 121。
然而,即使將上述的傳統(tǒng)模式編碼方法用于基底層編碼時(shí)該方法可實(shí)現(xiàn)極大的性能加強(qiáng),但當(dāng)將之用于加強(qiáng)層編碼時(shí),由于該方法不能反映加強(qiáng)層編碼之中的特性,在改進(jìn)編碼效率上它也是有限的。
因此,本發(fā)明的一個(gè)主要目的是提供一種二進(jìn)制形狀編碼中的模式編碼方法,該方法能夠進(jìn)一步提高編碼效率。
根據(jù)本發(fā)明,提供了一種基于包括多個(gè)BAB的當(dāng)前幀和先前幀、對(duì)當(dāng)前幀內(nèi)的M×N個(gè)二進(jìn)制象素的一個(gè)二進(jìn)制α塊(BAB)進(jìn)行編碼的模式編碼方法,M和N分別是正整數(shù),其中每一個(gè)二進(jìn)制象素有一代表一目標(biāo)象素或一背景象素的二進(jìn)制值,該方法包括以下步驟(a)根據(jù)一個(gè)預(yù)定的亞抽樣規(guī)則對(duì)當(dāng)前幀內(nèi)的BAB進(jìn)行亞抽樣,以由此產(chǎn)生當(dāng)前幀內(nèi)的(M/K)×(N/K)二進(jìn)制象素的一抽樣塊,其中M和N分別是K的倍數(shù),K是一預(yù)定正整數(shù);(b)基于該當(dāng)前幀內(nèi)的該抽樣塊,根據(jù)一預(yù)定的重建規(guī)則,產(chǎn)生M×N個(gè)二進(jìn)制象素的一重建的BAB;(c)估測(cè)該重建BAB和當(dāng)前幀內(nèi)的BAB之間的差別,如果其間沒(méi)有差別,則產(chǎn)生第一模式信號(hào)用以說(shuō)明其間沒(méi)有差別且因此沒(méi)有對(duì)此差別編碼;而如果其間有差別,則產(chǎn)生表明其間有差別的第二模式信號(hào)并同時(shí)產(chǎn)生表示該差別的M×N個(gè)二進(jìn)制象素的第二誤差數(shù)據(jù)塊,以被編碼成編碼第二誤差數(shù)據(jù)塊;(d)在交互模式中,根據(jù)預(yù)定的亞抽樣原則對(duì)先前幀內(nèi)的BAB進(jìn)行亞抽樣以由此產(chǎn)生先前幀內(nèi)的(M/K)×(N/K)二進(jìn)制象素的多個(gè)相應(yīng)抽樣塊;(e)在交互模式中,將當(dāng)前幀內(nèi)的抽樣塊和先前幀內(nèi)的相應(yīng)抽樣塊進(jìn)行比較,并隨之檢測(cè)出在先前幀內(nèi)相應(yīng)抽樣塊中最相似于當(dāng)前幀內(nèi)的抽樣塊的相應(yīng)第二抽樣塊作為預(yù)測(cè)抽樣塊,以由此產(chǎn)生具有代表當(dāng)前幀內(nèi)的抽樣塊的相應(yīng)第二抽樣塊作為預(yù)測(cè)抽樣塊,以由此產(chǎn)生具有代表當(dāng)前幀內(nèi)的抽樣塊和該預(yù)測(cè)抽樣塊之間的位移的垂直和水平分量的一運(yùn)動(dòng)矢量;(f)在交互模式中,根據(jù)該運(yùn)動(dòng)矢量,在先前幀內(nèi)的BAB中檢測(cè)最相似于當(dāng)前幀的BAB的一BAB作為預(yù)測(cè)BAB,估測(cè)當(dāng)前幀內(nèi)的BAB和該預(yù)測(cè)的BAB之間的差別,如果其間沒(méi)有差別,產(chǎn)生第三模式信號(hào)用以說(shuō)明其間沒(méi)有差別,亦因此不對(duì)該差別編碼;而如果其間有差別,則產(chǎn)生第四模式信號(hào)用以說(shuō)明其間有差別并同時(shí)產(chǎn)生代表該差別的M×N個(gè)二進(jìn)制象素的第四誤差數(shù)據(jù)塊以被編碼為編碼第四誤差數(shù)據(jù)塊;及(g)如果當(dāng)前幀內(nèi)的BAB是在內(nèi)部模式被編碼的,由于第一和第二模式信號(hào)之一是在步驟(c)中產(chǎn)生的,則將在步驟(c)中產(chǎn)生的該模式信號(hào)提供作被選的模式信號(hào),而如果當(dāng)前幀內(nèi)的BAB是在交互模式被編碼的,如果第一至第四模式信號(hào)中的一個(gè)模式信號(hào)是產(chǎn)生在步驟(c)和(f)中的,則提供在步驟(c)和(f)中產(chǎn)生的該模式信號(hào)作為被選的模式信號(hào),而如果第一至第四模式信號(hào)中的兩個(gè)模式信號(hào)是同時(shí)產(chǎn)生在步驟(c)和(f)中的,則根據(jù)第一預(yù)定選擇規(guī)則選擇并提供在步驟(c)和(f)中產(chǎn)生的這兩個(gè)模式信號(hào)之一作為被選的模式信號(hào)。
本發(fā)明的以上和其它目的和特點(diǎn)將在以下對(duì)隨附圖給出的優(yōu)選實(shí)施例的描述中變得顯而易見(jiàn),其中圖1顯示了用于說(shuō)明二進(jìn)制形狀編碼中的傳統(tǒng)模式編碼方法的內(nèi)部編碼圖象平面和交互編碼圖象平面;圖2說(shuō)明了用于解釋根據(jù)本發(fā)明的二進(jìn)制形狀編碼中的模式編碼方法的其中包括多個(gè)二進(jìn)制α塊的一當(dāng)前幀;圖3A至3I表示塊和組成塊的行集合,用于描述根據(jù)本發(fā)明的用以產(chǎn)生BAB的一基底層的亞抽樣過(guò)程、用以基于該基底層而產(chǎn)生一重建BAB的重建過(guò)程、以及一模式編碼過(guò)程;圖4說(shuō)明用于描述根據(jù)本發(fā)明的二進(jìn)制形狀編碼中的模式編碼方法的內(nèi)部編碼幀和交互編碼幀。
根據(jù)本發(fā)明,提供了一種二進(jìn)制形狀編碼中的模式編碼方法。圖2顯示了一當(dāng)前幀200,其中包括多個(gè)二進(jìn)制α塊(BAB)1至16,用于解釋根據(jù)本發(fā)明的二進(jìn)制形狀編碼中的模式編碼方法,其中,其中的陰影和非陰影區(qū)分別代表一目標(biāo)和一背景。簡(jiǎn)而言之,通過(guò)在對(duì)一個(gè)二進(jìn)制形狀信號(hào)(例如包括BAB1至16的當(dāng)前幀)的編碼中執(zhí)行模式編碼,將一模式信號(hào)(或通過(guò)對(duì)該模式信號(hào)編碼而產(chǎn)生的每個(gè)已編碼模式信號(hào))分配或提供給BAB1至16的每一相應(yīng)的BAB。
圖3A至3H表示塊和組成塊的行集合,用于描述用以產(chǎn)生BAB的基底層的亞抽樣過(guò)程和用以基于該基底層產(chǎn)生一重建BAB的重建過(guò)程,其中黑色部分表示目標(biāo)象素,白色部分表示背景象素。圖3I顯示了一誤差數(shù)據(jù)塊380,用于描述根據(jù)本發(fā)明的模式編碼方法。又,在圖4中,描繪了內(nèi)部編碼幀和交互編碼幀,用于描述根據(jù)本發(fā)明的二進(jìn)制形狀編碼中的模式編碼方法。參考圖2、圖3A至3I和圖4,以下將描述根據(jù)本發(fā)明的優(yōu)選實(shí)施例的二進(jìn)制形狀編碼中的模式編碼方法。
根據(jù)本發(fā)明,提供了一種根據(jù)當(dāng)前幀和包括多個(gè)BAB的先前幀而給當(dāng)前幀內(nèi)的M×N個(gè)二進(jìn)制象素的BAB編碼中的模式編碼方法,M和N分別是正整數(shù),其中每一個(gè)二進(jìn)制象素具有表示一目標(biāo)象素成一背景象素的一個(gè)二進(jìn)制值。在此應(yīng)注意到該當(dāng)前和先前幀可分別被當(dāng)前視頻目標(biāo)平面(VOP)和先前VOP所代替。為簡(jiǎn)單起見(jiàn),在此將只描述給當(dāng)前幀內(nèi)的一BAB編碼中的模式編碼方法。
首先,根據(jù)一預(yù)定的亞抽樣規(guī)則為當(dāng)前幀內(nèi)的BAB執(zhí)行亞抽樣,以由此產(chǎn)生(M/K)×(N/K)個(gè)二進(jìn)制象素的一抽樣塊作為當(dāng)前幀內(nèi)的一基底層,其中M和N分別是K的倍數(shù),K是一預(yù)定的正整數(shù)??傊?,(1/K)被稱(chēng)為轉(zhuǎn)換率。例如,如果圖3A顯示的當(dāng)前幀內(nèi)的BAB 300的高(M)和寬(N)分別是16,對(duì)該BAB 300用轉(zhuǎn)換率(1/2)進(jìn)行亞抽樣或向下抽樣(down-sampled),則如圖3B中所示,產(chǎn)生一抽樣塊310,其高(M)和寬(N)分別是8。
然后,基于當(dāng)前幀內(nèi)的該抽樣塊,根據(jù)預(yù)定的重建或向上抽樣(up-sampling)規(guī)則產(chǎn)生當(dāng)前幀內(nèi)的M×N個(gè)二進(jìn)制象素的一重建的BAB。例如,基于當(dāng)前幀內(nèi)的抽樣塊310根據(jù)一預(yù)定重建規(guī)則產(chǎn)生圖3H中所示的16×16個(gè)二進(jìn)制象素的重建的BAB 370。
可以使用各種亞抽樣方法作為預(yù)定的亞抽樣方法,例如其轉(zhuǎn)換率為1/2的向下抽樣方法。至于重建方法,也有若干種公知的方法,包括利用基于上下文的算術(shù)編碼(CAE)方法的掃描交替方法。參考圖3A至3H,以下描述根據(jù)本發(fā)明的優(yōu)選實(shí)施例的亞抽樣方法和重建方法。首先,執(zhí)行水平亞抽樣步驟。即從該BAB的第一或第二水平行開(kāi)始,對(duì)當(dāng)前幀內(nèi)的BAB(例如BAB 300)的每隔一水平行進(jìn)行抽樣,以產(chǎn)生(M/2)×N個(gè)二進(jìn)制象素的第一塊,其中M和N分別是正偶數(shù),而第一水平行是該BAB的最上面的水平行。
然后,執(zhí)行一垂直亞抽樣步驟。即從第一塊的第一或第二垂直行開(kāi)始對(duì)此第一塊每隔一垂直行抽樣,以由上產(chǎn)生作為一基底層(M/2)×(N/2)個(gè)二進(jìn)制象素的一抽樣塊,例如如圖3B所示的8×8個(gè)二進(jìn)制象素的抽樣塊310,其中,第一垂直行是第一塊的最左邊的垂直行。
然后,在將該抽樣塊的(N/2)個(gè)垂直行放置于在該垂直抽樣步驟中抽樣的垂直行的位置處的條件下,可通過(guò)將(N/2)個(gè)被重建的垂直行順序地插在在垂直亞抽樣步驟中沒(méi)有被抽樣的垂直行的位置處而產(chǎn)生(M/2)×N個(gè)二進(jìn)制象素的被重建的第一塊,其中被重建的垂直行是基于該抽樣塊的垂直行根據(jù)一預(yù)定內(nèi)插規(guī)則產(chǎn)生的。
然后,在將此被重建的第一塊的(M/2)個(gè)水平行放置于在水平亞抽樣步驟中抽樣的水平行的位置處的條件下,可通過(guò)將(M/2)個(gè)被重建的水平行順序地插在水平亞抽樣步驟中沒(méi)有被抽樣的水平行的位置處而產(chǎn)生M×N個(gè)二進(jìn)制象素的被重建的第一BAB,其中被重建的水平行是基于該被重建的第一塊的水平行根據(jù)一預(yù)定內(nèi)插規(guī)則產(chǎn)生的。
參考圖3C至3H,示出了塊和組成塊的行集合,用于描述用以基于作為BAB300的基底層的抽樣塊310根據(jù)一預(yù)定內(nèi)插規(guī)則而產(chǎn)生被重建的BAB370的重建過(guò)程。圖3C顯示了一垂直行集合320,包括抽樣塊310的8個(gè)垂直行作為8個(gè)偶數(shù)垂直行V2、V4、…、V16。圖3D說(shuō)明了一垂直行集合330,包括基于垂直行集合320的根據(jù)預(yù)定內(nèi)插規(guī)則重建的8個(gè)奇數(shù)垂直行V1、V3、…V15。
又,圖3E描繪了8×16個(gè)二進(jìn)制象素的被重建的第一塊340,其產(chǎn)生是在將該垂直行集合320的8個(gè)垂直行根據(jù)如圖3C所示的分配予其的索引被順序地放置于偶數(shù)垂直行的位置處的條件下,將該垂直行集合330的8個(gè)垂直行根據(jù)如圖3D所示的分配予其的索引被順序地插在奇數(shù)垂直行的位置處進(jìn)行的。
圖3F顯示了一水平行集合350,包括被重建的第一塊340的8個(gè)水平行作為8個(gè)偶數(shù)水平行H2、H4、…、H16。圖3G說(shuō)明了一水平行集合360,包括基于水平行集合350根據(jù)預(yù)定內(nèi)插規(guī)則被重建的8個(gè)奇數(shù)水平行H1、H3、…、H15。
圖3H描繪16×16個(gè)二進(jìn)制象素的被重建的BAB 370,其產(chǎn)生是在將該水平行集合350的8個(gè)水平行根據(jù)如圖3F所示的分配予其的索引被順序地放置于偶數(shù)水平行的位置處的條件下,將該水平行集合360的8個(gè)水平行根據(jù)如圖3G所示的分配予其的索引被順序地插在奇數(shù)水平行的位置處進(jìn)行的。
然后,估測(cè)被重建的BAB和當(dāng)前幀內(nèi)的BAB之間的差別。并隨之,如果其間無(wú)差別,則產(chǎn)生第一模式信號(hào),其中該第一模式信號(hào)說(shuō)明其間無(wú)差別、并因此不對(duì)此差別編碼。如果其間有差別,則產(chǎn)生第二模式信號(hào),其中該第二模式信號(hào)說(shuō)明其間有差別。并且同時(shí)產(chǎn)生代表該差別的M×N個(gè)二進(jìn)制象素的第二誤差數(shù)據(jù)塊、且又將該第二誤差數(shù)據(jù)塊編碼成編碼第二誤差數(shù)據(jù)塊。
詳細(xì)地說(shuō),參考圖3I,示出了第二誤差數(shù)據(jù)塊380,它說(shuō)明當(dāng)前幀內(nèi)的BAB 370之間的差別。在圖3I中,黑色部分代表二進(jìn)制象素值,例如1,說(shuō)明在BAB 300中的象素和分別在被重建的BAB 370之間的相同位置處有相應(yīng)象素之間的差別,而白色部分表示二進(jìn)制象素值,例如0,說(shuō)明在BAB中的象素和在被重建的BAB 370中的相同位置處的相應(yīng)象素之間沒(méi)有差別。
同時(shí),在交互模式中,為了完成根據(jù)本發(fā)明的優(yōu)選實(shí)施例的二進(jìn)制形狀編碼中的模式編碼,還要緊跟著進(jìn)行以下描述的一個(gè)過(guò)程。首先,根據(jù)一預(yù)定亞抽樣規(guī)則對(duì)先前幀內(nèi)的BAB執(zhí)行亞抽樣,以由此產(chǎn)生先前幀內(nèi)的(M/K)/(N/K)個(gè)二進(jìn)制象素的多個(gè)相應(yīng)抽樣塊。
然后,將當(dāng)前幀內(nèi)的抽樣塊和先前幀內(nèi)的相應(yīng)抽樣塊進(jìn)行比較,并隨之將先前幀內(nèi)相應(yīng)抽樣塊中最與當(dāng)前幀內(nèi)的抽樣塊相似的相應(yīng)抽樣塊檢測(cè)為一預(yù)測(cè)抽樣塊,以由此產(chǎn)生具有代表當(dāng)前幀內(nèi)抽樣塊和預(yù)測(cè)抽樣塊之間的位移的垂直和水平分量的一運(yùn)動(dòng)矢量。
在交互模式中,根據(jù)該運(yùn)動(dòng)矢量,在先前幀內(nèi)的BAB中檢測(cè)出最與當(dāng)前幀內(nèi)的BAB相似的BAB作為預(yù)測(cè)BAB,然后估測(cè)當(dāng)前幀內(nèi)的BAB和此預(yù)測(cè)的BAB之間的誤差。根據(jù)本發(fā)明的優(yōu)選實(shí)施例,當(dāng)前幀內(nèi)的BAB和產(chǎn)生的預(yù)測(cè)BAB之間的水平和垂直位移分別是運(yùn)動(dòng)矢量的水平和垂直分量的2倍。
然后,如果其間沒(méi)有差別,則產(chǎn)生第三模式信號(hào),其中該第三模式信號(hào)說(shuō)明其間沒(méi)有差別亦因此不對(duì)該差別編碼。如果其間有差別,則產(chǎn)生第四模式信號(hào),其中該第四模式信號(hào)說(shuō)明二者之前有差別。同時(shí)產(chǎn)生表示該差別的第四誤差數(shù)據(jù)塊,且又將此第四誤差數(shù)據(jù)塊編碼為編碼第四誤差數(shù)據(jù)塊。
在模式編碼中,如果當(dāng)前幀內(nèi)的BAB是在內(nèi)部模式中被編碼的,由于產(chǎn)生了第一和第二模式信號(hào)之一,則將此產(chǎn)生的模式信號(hào)提供作選擇模式信號(hào)。而如果當(dāng)前幀內(nèi)的BAB是在交互模式中被編碼的,如果產(chǎn)生了第一至第四模式信號(hào)之一的模式信號(hào),則該產(chǎn)生的模式信號(hào)被提供作選擇模式信號(hào);而如果在第一至第四模式信號(hào)中同時(shí)產(chǎn)生了二個(gè)模式信號(hào),則根據(jù)第一預(yù)定選擇規(guī)則選擇二個(gè)產(chǎn)生的模式信號(hào)之一提供作選擇模式信號(hào)。
以下描述根據(jù)本發(fā)明的優(yōu)選實(shí)施例的第一預(yù)定選擇規(guī)則。如果同時(shí)產(chǎn)生了第一和第三模式信號(hào),則根據(jù)第二預(yù)定選擇規(guī)則(例如選擇第三模式信號(hào)的規(guī)則)選擇第一和第三模式信號(hào)之一作為選擇模式信號(hào)。如果產(chǎn)生了第一模式信號(hào)而沒(méi)有產(chǎn)生第三模式信號(hào),則即使同時(shí)產(chǎn)生了第四模式信號(hào)也將第一模式信號(hào)選作選擇模式信號(hào)。
而如果產(chǎn)生了第三模式信號(hào)而沒(méi)有產(chǎn)生第一模式信號(hào),則即使同時(shí)產(chǎn)生了第二模式信號(hào)也將第三模式信號(hào)選作選擇模式信號(hào)。如果同時(shí)產(chǎn)生了第二和第四模式信號(hào),則根據(jù)第三預(yù)定選擇規(guī)則,選擇第二和第四模式信號(hào)之一作為選擇模式信號(hào)。
第三預(yù)定選擇規(guī)則如下。首先,將第二和第四模式信號(hào)編碼以由此分別產(chǎn)生編碼第二和編碼第四模式信號(hào),并且將第二和第四誤差數(shù)據(jù)塊編碼以由此分別產(chǎn)生編碼第二和編碼第四誤差數(shù)據(jù)塊。并將編碼第二和編碼第四模式信號(hào)與編碼第二和編碼第四誤差數(shù)據(jù)塊組合以由此分別產(chǎn)生編碼第二和編碼第四加強(qiáng)層數(shù)據(jù)。
然后,分別計(jì)算編碼第二和編碼第四加強(qiáng)層數(shù)據(jù)的第二和第四數(shù)據(jù)位數(shù)目;隨之,比較第二數(shù)據(jù)位數(shù)目和第四數(shù)據(jù)位數(shù)目,以便如果第二數(shù)據(jù)位數(shù)目等于或小于第四數(shù)據(jù)位數(shù)目則將第二模式信號(hào)選作選擇模式信號(hào),如果第二數(shù)據(jù)位數(shù)目大于第四數(shù)據(jù)位數(shù)目則將第四模式信號(hào)選作選擇模式信號(hào)。
根據(jù)本發(fā)明的優(yōu)選實(shí)施例的模式編碼方法,例如,將每一選擇模式信號(hào)(或通過(guò)對(duì)相應(yīng)選擇模式信號(hào)編碼獲得的每一編碼選擇模式信號(hào))提供或分配給如圖2所示的當(dāng)前幀內(nèi)的BAB1至16中的每一相應(yīng)的BAB。
之后,如果分別選擇第一和第三模式信號(hào)作為選擇模式信號(hào),則將該第一和該第三模式信號(hào)分別編碼為編碼第一和編碼第三模式信號(hào),然后將此編碼第一和該編碼第三模式信號(hào)分別提供為編碼第一和編碼第三加強(qiáng)層。而如果分別選擇第二和第四模式信號(hào)作為選擇模式信號(hào),則將編碼第二和編碼第四加強(qiáng)層數(shù)據(jù)分別提供作編碼加強(qiáng)層。
上面描述了根據(jù)本發(fā)明的優(yōu)選實(shí)施例的模式編碼方法。在此應(yīng)注意到該模式編碼方法能被應(yīng)用于二進(jìn)制形狀編碼,即加強(qiáng)層編碼,而不管該方法的種類(lèi)如何,例如二進(jìn)制形狀編碼的亞抽樣方法和重建方法。
圖4描繪了用于說(shuō)明根據(jù)本發(fā)明的優(yōu)選實(shí)施例的模式編碼方法的內(nèi)部編碼幀和交互編碼幀。參考圖4,以下描述應(yīng)用于其的模式編碼方法。在圖4中,I代表一作為基底層的內(nèi)部編碼幀;P1代表一作為加強(qiáng)層的內(nèi)部編碼幀;P2和P3分別代表作為基底層的內(nèi)部編碼幀;而B(niǎo)1和B2分別代表作為加強(qiáng)層的交互編碼幀。在圖4中,幀I是幀P1的基底層;幀P2和P3分別是幀B1和B2的基底層。
根據(jù)本發(fā)明的優(yōu)選實(shí)施例的模式編碼方法與對(duì)幀P1、B1和B2內(nèi)的BAB編碼有關(guān)。因此,下面將描述分別將什么模式信號(hào)分配給幀P1、B1和B2的BAB。在此應(yīng)注意到可以將編碼模式信號(hào)代替該模式信號(hào)分配給幀P1、B1和B2內(nèi)的BAB。為了簡(jiǎn)單起見(jiàn),以下只描述將模式信號(hào)分配至其的情形。
在內(nèi)部模式中,由于幀P1是基于幀I被重建的(參考圖4所示的路徑1),第1模式信號(hào)或第3模式信號(hào)被產(chǎn)生。因而,在其編碼模式中第1模式信號(hào)或第3模式信號(hào)被分配至幀P1內(nèi)的每一個(gè)BAB。將第1至第4模式信號(hào)中分配至幀B1內(nèi)的每一個(gè)BAB的一模式信號(hào)選作選擇模式信號(hào),這是由于幀B1可以基于幀P2(參考圖4所示的路徑3)或作為幀B1的先前幀的幀P1(參考圖4所示的路徑2)被重建。
又,在其模式編碼中將第1至第4模式信號(hào)之一分配給幀B2內(nèi)的每一BAB,這是由于幀B2能夠基于幀P3(參考圖4所示的路徑5)或作為幀B2的先前幀的幀B1(參考圖4所示的路徑4)被重建。
如上所述,在對(duì)一幀(或一VOP)內(nèi)的二進(jìn)制形狀信號(hào)(例如一BAB)編碼中,尤其是二進(jìn)制形狀信號(hào)的加強(qiáng)層編碼中,根據(jù)本發(fā)明的模式編碼方法能夠有效地提高其編碼效率。
雖然對(duì)本發(fā)明的描述只參考了某些優(yōu)選實(shí)施例,在不背離以下權(quán)利要求中提出的本發(fā)明的精神和范圍的前提下,可作其它變化和修改。
權(quán)利要求
1.一種基于包括多個(gè)BAB的當(dāng)前幀和先前幀、對(duì)當(dāng)前幀內(nèi)的M×N個(gè)二進(jìn)制象素的一個(gè)二進(jìn)制α塊(BAB)進(jìn)行編碼的模式編碼方法,M和N分別是正整數(shù),其中每一個(gè)二進(jìn)制象素有一代表一目標(biāo)象素或一背景象素的二進(jìn)制值,該方法包括以下步驟(a)根據(jù)一個(gè)預(yù)定的亞抽樣規(guī)則對(duì)當(dāng)前幀內(nèi)的BAB進(jìn)行亞抽樣,以由此產(chǎn)生當(dāng)前幀內(nèi)的(M/K)×(N/K)二進(jìn)制象素的一抽樣塊,其中M和N分別是K的倍數(shù),K是一預(yù)定正整數(shù);(b)基于該當(dāng)前幀內(nèi)的該抽樣塊,根據(jù)一預(yù)定的重建規(guī)則,產(chǎn)生M×N個(gè)二進(jìn)制象素的一重建的BAB;(c)估測(cè)該重建BAB和當(dāng)前幀內(nèi)的BAB之間的差別,如果其間沒(méi)有差別,則產(chǎn)生第一模式信號(hào)用以說(shuō)明其間沒(méi)有差別且因此沒(méi)有對(duì)此差別編碼;而如果其間有差別,則產(chǎn)生表明其間有差別的第二模式信號(hào)并同時(shí)產(chǎn)生表示該差別的M×N個(gè)二進(jìn)制象素的第二誤差數(shù)據(jù)塊,以被編碼成編碼第二誤差數(shù)據(jù)塊;(d)在交互模式中,根據(jù)預(yù)定的亞抽樣原則對(duì)先前幀內(nèi)的BAB進(jìn)行亞抽樣以由此產(chǎn)生先前幀內(nèi)的(M/K)×(N/K)二進(jìn)制象素的多個(gè)相應(yīng)抽樣塊;(e)在交互模式中,將當(dāng)前幀內(nèi)的抽樣塊和先前幀內(nèi)的相應(yīng)抽樣塊進(jìn)行比較,并隨之檢測(cè)出在先前幀內(nèi)相應(yīng)抽樣塊中最相似于當(dāng)前幀內(nèi)的抽樣塊的相應(yīng)第二抽樣塊作為預(yù)測(cè)抽樣塊,以由此產(chǎn)生具有代表當(dāng)前幀內(nèi)的抽樣塊的相應(yīng)第二抽樣塊作為預(yù)測(cè)抽樣塊,以由此產(chǎn)生具有代表當(dāng)前幀內(nèi)的抽樣塊和該預(yù)測(cè)抽樣塊之間的位移的垂直和水平分量的一運(yùn)動(dòng)矢量;(f)在交互模式中,根據(jù)該運(yùn)動(dòng)矢量,在先前幀內(nèi)的BAB中檢測(cè)最相似于當(dāng)前幀的BAB的一BAB作為預(yù)測(cè)BAB,估測(cè)當(dāng)前幀內(nèi)的BAB和該預(yù)測(cè)的BAB之間的差別,如果其間沒(méi)有差別,產(chǎn)生第三模式信號(hào)用以說(shuō)明其間沒(méi)有差別,亦因此不對(duì)該差別編碼;而如果其間有差別,則產(chǎn)生第四模式信號(hào)用以說(shuō)明其間有差別并同時(shí)產(chǎn)生代表該差別的M×N個(gè)二進(jìn)制象素的第四誤差數(shù)據(jù)塊以被編碼為編碼第四誤差數(shù)據(jù)塊;及(g)如果當(dāng)前幀內(nèi)的BAB是在內(nèi)部模式被編碼的,由于第一和第二模式信號(hào)之一是在步驟(c)中產(chǎn)生的,則將在步驟(c)中產(chǎn)生的該模式信號(hào)提供作被選的模式信號(hào),而如果當(dāng)前幀內(nèi)的BAB是在交互模式被編碼的,如果第一至第四模式信號(hào)中的一個(gè)模式信號(hào)是產(chǎn)生在步驟(c)和(f)中的,則提供在步驟(c)和(f)中產(chǎn)生的該模式信號(hào)作為被選的模式信號(hào),而如果第一至第四模式信號(hào)中的兩個(gè)模式信號(hào)是同時(shí)產(chǎn)生在步驟(c)和(f)中的,則根據(jù)第一預(yù)定選擇規(guī)則選擇并提供在步驟(c)和(f)中產(chǎn)生的這兩個(gè)模式信號(hào)之一作為被選的模式信號(hào)。
2.根據(jù)權(quán)利要求1的方法,其中該當(dāng)前和先前幀分別由一當(dāng)前視頻目標(biāo)平面(VOP)和一先前VOP所代替。
3.根據(jù)權(quán)利要求1的方法,其中該第1預(yù)定選擇規(guī)則如下如果同時(shí)產(chǎn)生了第一和第三模式信號(hào),則根據(jù)第二預(yù)定選擇規(guī)則選擇第一和第三模式信號(hào)之一作為選擇模式信號(hào)。如果產(chǎn)生了第一模式信號(hào)而沒(méi)有產(chǎn)生第三模式信號(hào),則即使同時(shí)產(chǎn)生了第四模式信號(hào)也將第一模式信號(hào)選作選擇模式信號(hào),而如果產(chǎn)生了第三模式信號(hào)而沒(méi)有產(chǎn)生第一模式信號(hào),則即使同時(shí)產(chǎn)生了第二模式信號(hào)也將第三模式信號(hào)選作選擇模式信號(hào)。如果同時(shí)產(chǎn)生了第二和第四模式信號(hào),則根據(jù)第三預(yù)定選擇規(guī)則,選擇第二和第四模式信號(hào)之一作為選擇模式信號(hào)。
4.根據(jù)權(quán)利要求3的方法,其中該第3預(yù)定選擇規(guī)則如下將第二和第四模式信號(hào)編碼以由此分別產(chǎn)生編碼第二和編碼第四模式信號(hào),并且將第二和第四誤差數(shù)據(jù)塊編碼以由此分別產(chǎn)生編碼第二和編碼第四誤差數(shù)據(jù)塊。并將編碼第二和編碼第四模式信號(hào)與編碼第二和編碼第四誤差數(shù)據(jù)塊組合以由此分別產(chǎn)生編碼第二和編碼第四加強(qiáng)層數(shù)據(jù),然后,分別計(jì)算編碼第二和編碼第四加強(qiáng)層數(shù)據(jù)的第二和第四數(shù)據(jù)位數(shù)目;隨之,比較第二數(shù)據(jù)位數(shù)目和第四數(shù)據(jù)位數(shù)目,以便如果第二數(shù)據(jù)位數(shù)目等于或小于第四數(shù)據(jù)位數(shù)目則將第二模式信號(hào)選作選擇模式信號(hào),如果第二數(shù)據(jù)位數(shù)目大于第四數(shù)據(jù)位數(shù)目則將第四模式信號(hào)選作選擇模式信號(hào)。
5.根據(jù)權(quán)利要求4的方法,其中第2預(yù)定選擇規(guī)則是如果第1和第3模式信號(hào)同時(shí)被產(chǎn)生,則選擇第3模式信號(hào)作為被選模式信號(hào)。
6.根據(jù)權(quán)利要求5的方法,其中如果分別選擇第一和第三模式信號(hào)作為選擇模式信號(hào),則將該第一和該第三模式信號(hào)分別編碼為編碼第一和編碼第三模式信號(hào),然后將此編碼第一和該編碼第三模式信號(hào)分別提供為編碼第一和編碼第三加強(qiáng)層。而如果分別選擇第二和第四模式信號(hào)作為選擇模式信號(hào),則將編碼第二和編碼第四加強(qiáng)層數(shù)據(jù)分別提供作編碼加強(qiáng)層。
7.根據(jù)權(quán)利要求6的方法,其中步驟(a)包括下列步驟(a1)從該BAB的第1或第2水平行開(kāi)始對(duì)BAB的每隔一個(gè)水平行抽樣,以產(chǎn)生(M/2)×N個(gè)二進(jìn)制象素的一第1塊,其中該第1水平行是該BAB的最上面的水平行;且(a2)從該第1塊的第1或第2垂直行開(kāi)始,對(duì)該第1塊的每隔一垂直行抽樣,以產(chǎn)生(M/2)×(N/2)個(gè)二進(jìn)制象素的抽樣塊作為一基底層,其中該第1垂直行是該第1塊的最左邊的垂直行。
8.根據(jù)權(quán)利要求7的方法,其中步驟(b)包括以下步驟(b1)在將該抽樣塊的(N/2)個(gè)垂直行放置于在步驟(a2)抽樣的垂直行的位置處的條件下,可通過(guò)將(N/2)個(gè)被重建的垂直行順序地插在步驟(a2)沒(méi)有被抽樣的垂直行的位置處而產(chǎn)生(M/2)×N個(gè)二進(jìn)制象素的被重建的第一塊,其中被重建的垂直行是基于該抽樣塊的垂直行根據(jù)一預(yù)定內(nèi)插規(guī)則產(chǎn)生的;(b2)在將此被重建的第一塊的(M/2)個(gè)水平行放置于步驟(a1)抽樣的水平行的位置處的條件下,可通過(guò)將(M/2)個(gè)被重建的水平行順序地插步驟(a1)沒(méi)有被抽樣的水平行的位置處而產(chǎn)生M×N個(gè)二進(jìn)制象素的被重建的第一BAB,其中被重建的水平行是基于該被重建的第一塊的水平行根據(jù)一預(yù)定內(nèi)插規(guī)則產(chǎn)生的。
9.根據(jù)權(quán)利要求8的方法,其中在當(dāng)前幀內(nèi)BAB和在步驟(f)中產(chǎn)生的預(yù)測(cè)BAB之間的水平和垂直距離分別是該運(yùn)動(dòng)矢量的水平和垂直分量的2倍。
10.根據(jù)權(quán)利要求9的方法,其中步驟(a1)是對(duì)該BAB的偶數(shù)水平行抽樣以產(chǎn)生該第一塊的步驟,而步驟(a2)是對(duì)該第一塊的偶數(shù)垂直行抽樣以產(chǎn)生該抽樣塊的步驟。
11.根據(jù)權(quán)利要求10的方法,其中M等于N。
12.根據(jù)權(quán)利要求11的方法,其中M和N各為16。
全文摘要
基于含多個(gè)BAB的當(dāng)前幀和先前幀對(duì)當(dāng)前幀內(nèi)二進(jìn)制α塊(BAB)編碼中,對(duì)當(dāng)前幀內(nèi)的BAB亞抽樣產(chǎn)生抽樣塊,基于該抽樣塊重建一重建BAB,內(nèi)部模式中,估測(cè)重建BAB和BAB的差別,若無(wú)差別產(chǎn)生第1模式信號(hào)否則產(chǎn)生第2模式信號(hào)及誤差數(shù)據(jù)塊,交互模式中,還把先前幀內(nèi)BAB中最相似于當(dāng)前幀內(nèi)BAB的檢測(cè)為預(yù)測(cè)BAB,并估測(cè)BAB和預(yù)測(cè)BAB的差別,若無(wú)差別產(chǎn)生第3模式信號(hào)否則產(chǎn)生第四模式信號(hào)及誤差數(shù)據(jù)塊。
文檔編號(hào)H03M7/30GK1214597SQ9712161
公開(kāi)日1999年4月21日 申請(qǐng)日期1997年11月7日 優(yōu)先權(quán)日1997年10月14日
發(fā)明者韓錫源 申請(qǐng)人:大宇電子株式會(huì)社