專利名稱:對(duì)視頻信號(hào)進(jìn)行編碼的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種對(duì)輸入的視頻信號(hào)進(jìn)行編碼的方法,包括一個(gè)對(duì)提供至少一個(gè)視頻目標(biāo)(object)的所述輸入的視頻信號(hào)的分割的步驟,所述視頻目標(biāo)包括至少一個(gè)視頻目標(biāo)平面。
這種編碼方法可用于例如MPEG-4設(shè)備。
背景技術(shù):
從MPEG-4視覺(Visual)標(biāo)準(zhǔn),ISO/IEC14496-2,可知道一種被稱為MPEG-4視頻版1的方法。
MPEG-4采用視頻目標(biāo),它們是處于使用者可訪問和操作的場(chǎng)景中的整體。在一個(gè)給定時(shí)間的視頻目標(biāo)的例子被稱為視頻目標(biāo)平面,以下簡(jiǎn)稱為VOP。一個(gè)VOP的編碼的表示包括其形狀、其移動(dòng)和其結(jié)構(gòu)的表示。
幀內(nèi)編碼的VOP,以下稱為I-VOP,是不參考其它畫面而被編碼的。它們?yōu)榫幋a的序列提供在該處開始解碼的訪問點(diǎn),但僅以適度壓縮的方式被編碼。預(yù)編碼VOP,以下稱為P-VOP,則更有效地利用來(lái)自一個(gè)過去的幀內(nèi)或預(yù)編碼VOP的移動(dòng)補(bǔ)償?shù)念A(yù)報(bào)而被編碼,并且通常用作下一個(gè)預(yù)報(bào)的參考。雙向預(yù)編碼VOP,以下稱為B-VOP,提供最高程度的壓縮但需要用于移動(dòng)補(bǔ)償?shù)倪^去和將來(lái)參考兩者。移動(dòng)矢量被定義為對(duì)依需要而定的一個(gè)VOP的按16線區(qū)域(以下稱為一個(gè)宏塊)的各16-取樣,或者一個(gè)VOP的按8線區(qū)域(以下稱為一個(gè)塊)的各8-取樣。
在一個(gè)視頻序列期間,一個(gè)視頻目標(biāo)可被另一個(gè)目標(biāo)所隱藏、走出畫面窗外、或者變得太小以致難以看見,并且因此從視覺場(chǎng)景中消失達(dá)一個(gè)給定的時(shí)間。同樣重要的是,此非可見的視頻目標(biāo)仍是場(chǎng)景的一部分,其消失如同其出現(xiàn)一樣,必須在壓縮的視頻數(shù)據(jù)信號(hào)中成為信號(hào)。
由于VOP頭中的編碼指示器,MPEG-4視頻(Video)標(biāo)準(zhǔn)可達(dá)到此結(jié)果。被稱為vop_coded的編碼指示器指示VOP是確實(shí)被編碼(vop_coded=1)還是對(duì)VOP來(lái)說(shuō)不存在序列的數(shù)據(jù)(vop_coded=0)。非可見的VOP不能被用作用于移動(dòng)補(bǔ)償?shù)膮⒖?。接著,根?jù)圖1a和圖1b定義過去和將來(lái)參考。圖1a示出一個(gè)按一個(gè)編碼次序的VOP序列,其中P(n)是一個(gè)非可見VOP,圖1b示出按一個(gè)顯示次序的同樣的VOP序列。
一個(gè)過去參考VOP被定義為過去最近的解碼的I或P-VOP,其vop_coded=1。如圖1b中畫出的箭頭所圖解的,正是P(n-3)用于標(biāo)靶(target)VOP B(n-2)、B(n-1),也用于VOP B(n+1)、B(n+2)和B(n+3)。
一個(gè)將來(lái)參考VOP被定義為將來(lái)最近的解碼的I或P-VOP,并不理會(huì)其vop_coded值。正是VOP P(n+3)用于標(biāo)靶VOP B(n+1)和B(n+2)。于是,一個(gè)B-VOP可稱為-過去和/或?qū)?lái)參考VOP,如果對(duì)于過去參考VOP來(lái)說(shuō)vop_coded=1,-僅是過去參考VOP,如果對(duì)于將來(lái)參考VOP來(lái)說(shuō)vop_coded=0。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)目的是獲得對(duì)輸入的視頻信號(hào)進(jìn)行更有效的編碼。本發(fā)明考慮到以下幾個(gè)方面。
根據(jù)現(xiàn)有技術(shù)的編碼方法僅采用過去參考VOP對(duì)一個(gè)B-VOP進(jìn)行編碼,如果對(duì)于將來(lái)參考來(lái)說(shuō)vop_coded=0。這種方法并不是很有效,因?yàn)閷?duì)這樣一個(gè)B-VOP的編碼是類似于對(duì)P-VOP的編碼。與對(duì)P-VOP的編碼相比較,對(duì)這樣一個(gè)B-VOP的編碼甚至效率更低。因?yàn)樗捎么鷥r(jià)更大的編碼句法。而且,對(duì)于該方法在一個(gè)編碼器中的實(shí)施來(lái)說(shuō),B-VOP的處理進(jìn)行得更復(fù)雜,因?yàn)楸仨殞⒉痪哂锌捎玫膶?lái)參考的B-VOP的情形與正常的情形相區(qū)別。
根據(jù)現(xiàn)有技術(shù)的編碼方法也對(duì)包括在一個(gè)顯示次序中的一個(gè)非可見VOP之后的一個(gè)I或P-VOP和B-VOP(s)的組進(jìn)行編碼,方法是通過采用能夠遠(yuǎn)離它們的一個(gè)過去參考在圖1b的例子中P(n-3)是用于B(n+1)、B(n+2)和P(n+3)的過去參考。它使得編碼效率甚至更差。
根據(jù)本發(fā)明的編碼方法的特征在于,它包括-一個(gè)非可見VOP的檢測(cè)步驟,-一個(gè)校正步驟,用于在一個(gè)顯示次序中將由所述檢測(cè)步驟已檢測(cè)到的一個(gè)非可見幀內(nèi)或預(yù)編碼VOP之前的一個(gè)雙向預(yù)編碼VOP轉(zhuǎn)換成一個(gè)幀內(nèi)或預(yù)編碼VOP以被編碼。
這種編碼方法允許利用過去和將來(lái)參考兩者對(duì)在一個(gè)編碼次序中的一個(gè)非可見VOP之后的一個(gè)B-VOP進(jìn)行編碼,繼而改善編碼效率。而且,在一個(gè)顯示次序中的在一個(gè)非可見VOP之后的包括一個(gè)I或P-VOP和B-VOP(s)的組可以一個(gè)較近的P-VOP為參考被編碼,這進(jìn)一步改善了編碼效率。
本發(fā)明也應(yīng)用于實(shí)施這樣一種編碼方法的視頻編碼器。
本發(fā)明的這些和其它方面將從以下的參照實(shí)施例的描述而變得清晰。
現(xiàn)以舉例方式參照附圖對(duì)本發(fā)明進(jìn)行描述,附圖中圖1a表示根據(jù)現(xiàn)有技術(shù)的一種編碼次序的一個(gè)VOP序列,圖1b表示根據(jù)現(xiàn)有技術(shù)的過去和將來(lái)參考,用于按一個(gè)顯示次序的一個(gè)VOP序列,圖2是根據(jù)本發(fā)明的編碼方法的一個(gè)方框圖,圖3a表示按根據(jù)本發(fā)明的一個(gè)編碼次序的一個(gè)VOP序列,圖3b表示根據(jù)本發(fā)明的過去和將來(lái)參考,用于按一個(gè)顯示次序的一個(gè)VOP序列。
實(shí)施例說(shuō)明根據(jù)本發(fā)明的編碼方法的原理由圖2的方框解。
本方法接收一個(gè)輸入的視頻信號(hào)(IS),用于提供一個(gè)壓縮的視頻數(shù)據(jù)信號(hào)(CS)。所述方法包括以下步驟-所述輸入視頻信號(hào)的分割(SEG),用于提取包含在所述視頻場(chǎng)景中的視頻目標(biāo),所述視頻目標(biāo)包括至少一個(gè)VOP,-一個(gè)非可見VOP的檢測(cè)(DET),-校正(COR),用于在一個(gè)顯示次序中將由所述檢測(cè)步驟已檢測(cè)到(Y)的一個(gè)非可見I或P-VOP之前的一個(gè)B-VOP轉(zhuǎn)換成一個(gè)I-或P-VOP,-如果由所述檢測(cè)步驟已檢測(cè)到的一個(gè)非可見VOP,或者在相反的情形(N)中的正常的VOP,對(duì)轉(zhuǎn)換的VOP進(jìn)行編碼(ENC),得到壓縮的視頻數(shù)據(jù)信號(hào)。
檢測(cè)步驟是基于一個(gè)VOP的形狀的分析。當(dāng)形成一個(gè)任意形狀的VOP時(shí),如果不存在包含形狀數(shù)據(jù)的宏塊時(shí),就意味著此VOP是一個(gè)非可見VOP,并且此VOP的大小被設(shè)置為零;編碼指示器vop_coded等于0。檢測(cè)步驟的結(jié)果是Y并且應(yīng)用校正步驟。
作為接下來(lái)的校正步驟,過去和將來(lái)參考根據(jù)圖3a和圖3b被定義。圖3a示出一個(gè)按一個(gè)編碼次序的VOP序列,其中P(n)是一個(gè)非可見VOP,圖3b示出按一個(gè)顯示序列的同樣的VOP序列。VOP P(n)由一個(gè)虛線表示。在校正步驟之后并且根據(jù)圖3a,非可見VOP P(n)之后的VOP是B(n-2)和P(n-1)。
一個(gè)過去參考VOP被定義為過去最近的解碼的I或P-VOP,其vop_coded=1。總是P(n-3)用于標(biāo)靶VOP B(n-2),但現(xiàn)在VOP P(n-1)用于VOP B(n+1)、B(n+2)和B(n+3)的組。對(duì)于上述的3個(gè)VOP的組來(lái)說(shuō),VOP P(n-1)是一個(gè)較現(xiàn)有技術(shù)中的VOP P(n-3)更接近的參考,這改善了編碼效率。
一個(gè)將來(lái)參考VOP被定義為將來(lái)最近的解碼的I或P-VOP,并不理會(huì)其vop_coded值。正是VOP P(n+3)用于標(biāo)靶VOP B(n+1)和B(n+2),但現(xiàn)在是VOP P(n-1)用于VOP B(n-2)。然后,VOP P(n-2)被編碼為一個(gè)真實(shí)的B-VOP,而不是僅利用過去參考被編碼為一個(gè)B-VOP,因此是利用雙向預(yù)報(bào)的整體編碼效率,并且VOP P(n-1)被編碼為一個(gè)P-VOP,而不是僅利用過去參考被編碼為一個(gè)B-VOP,因此較現(xiàn)有技術(shù)中的編碼句法的代價(jià)較低。于是,本編碼方法導(dǎo)致改善的編碼效率。
一個(gè)非編碼的VOP是被正常處理的,除非在已寫VOP頭之后停止編碼。如果在顯示次序中的之前的VOP尚未被編碼,即vop_coded=0,為了避免對(duì)非編碼VOP進(jìn)行編碼,將該VOP從編碼鏈中去掉。
這樣一種編碼方法節(jié)省比特,并且對(duì)于整個(gè)不出現(xiàn)的周期來(lái)說(shuō),對(duì)一個(gè)非可見VOP僅編碼一次,而不是以一個(gè)周期的速率對(duì)它進(jìn)行編碼,并且當(dāng)該VOP再次可見時(shí)恢復(fù)編碼。
根據(jù)本發(fā)明的一種編碼方法可在例如一種集成電路中得到實(shí)施,例如可將它集成在一個(gè)視頻編碼器中。
相應(yīng)的視頻編碼器是為了提供輸出的壓縮視頻數(shù)據(jù)信號(hào),并且包括-分割裝置,用于從所述輸入視頻信號(hào)中提取至少一個(gè)視頻目標(biāo),所述視頻目標(biāo)包括至少一個(gè)VOP,-一個(gè)檢測(cè)器,用于檢測(cè)非可見VOP,-校正裝置,用于在一個(gè)顯示次序中將由所述檢測(cè)器已檢測(cè)到的一個(gè)非可見幀內(nèi)或預(yù)編碼VOP之前的一個(gè)雙向預(yù)編碼VOP轉(zhuǎn)換成一個(gè)幀內(nèi)或預(yù)編碼VOP以被編碼,-一個(gè)數(shù)據(jù)壓縮器,用于如果由所述檢測(cè)器已檢測(cè)到的一個(gè)非可見VOP,或者在相反的情形中的正常的VOP,對(duì)轉(zhuǎn)換的VOP進(jìn)行編碼,得到壓縮的視頻數(shù)據(jù)信號(hào)。
可利用適合于編程的一個(gè)集成電路來(lái)實(shí)施本編碼方法。包含在例如一個(gè)計(jì)算機(jī)編程存儲(chǔ)器中的一組指令可使該集成電路執(zhí)行本編碼方法的不同的步驟。該指令組可通過由例如磁盤的一個(gè)數(shù)據(jù)載體讀取而被裝載進(jìn)編程存儲(chǔ)器中。該指令組也可由一個(gè)服務(wù)器經(jīng)例如互連網(wǎng)的一個(gè)通信網(wǎng)絡(luò)而變得可用。
權(quán)利要求中的任何參考標(biāo)記并不構(gòu)成對(duì)該權(quán)利要求的限制。需要注意的是,動(dòng)詞“包括”及其變化形式并不排除除了在任何權(quán)利要求中列出的那些之外的其它的步驟或元件。一個(gè)元件或步驟之前的詞“一個(gè)”并不排除多個(gè)所述元件或步驟的存在。
權(quán)利要求
1.一種對(duì)輸入的視頻信號(hào)進(jìn)行編碼的方法,包括一個(gè)對(duì)提供至少一個(gè)視頻目標(biāo)的所述輸入的視頻信號(hào)的分割的步驟,所述視頻目標(biāo)包括至少一個(gè)視頻目標(biāo)平面,以下稱為VOP,其特征在于,所述編碼方法還包括-一個(gè)非可見VOP的檢測(cè)步驟,-一個(gè)校正步驟,用于在一個(gè)顯示次序中將由所述檢測(cè)步驟已檢測(cè)到的一個(gè)非可見幀內(nèi)或預(yù)編碼VOP之前的一個(gè)雙向預(yù)編碼VOP轉(zhuǎn)換成一個(gè)幀內(nèi)或預(yù)編碼VOP以被編碼。
2.根據(jù)權(quán)利要求1所述的編碼方法,其特征在于,還包括-一個(gè)從一個(gè)編碼鏈中將一個(gè)不可見達(dá)一個(gè)第二后續(xù)時(shí)間的VOP去掉的步驟,-一個(gè)當(dāng)所述VOP再次可見時(shí)恢復(fù)編碼的步驟。
3.一種用于接收輸入的視頻信號(hào)的視頻編碼器,包括用于從所述輸入的視頻信號(hào)提取至少一個(gè)視頻目標(biāo)的分割裝置,所述視頻目標(biāo)包括至少一個(gè)視頻目標(biāo)平面,以下稱為VOP,其特征在于,所述編碼器包括-一個(gè)非可見VOP的檢測(cè)器,-校正裝置,用于在一個(gè)顯示次序中將由所述檢測(cè)器已檢測(cè)到的一個(gè)非可見幀內(nèi)或預(yù)編碼VOP之前的一個(gè)雙向預(yù)編碼VOP轉(zhuǎn)換成一個(gè)幀內(nèi)或預(yù)編碼VOP以被編碼。
4.一種計(jì)算機(jī)程序產(chǎn)品,用于包括一組指令的視頻編碼器,該產(chǎn)品當(dāng)被裝載進(jìn)所述編碼器時(shí)使所述編碼器執(zhí)行根據(jù)權(quán)利要求1或2所述的方法。
全文摘要
本方法涉及一種編碼方法,它接收一個(gè)輸入的視頻信號(hào)(IS),用于提供一個(gè)壓縮的視頻數(shù)據(jù)信號(hào)(CS)。所述方法包括以下步驟:所述輸入視頻信號(hào)的分割(SEG),用于提取包含在視頻場(chǎng)景中的視頻目標(biāo)平面,以下稱為VOP;一個(gè)非可見VOP的檢測(cè)(DET);校正(COR),用于在一個(gè)顯示次序中將由所述檢測(cè)步驟已檢測(cè)到(Y)的一個(gè)非可見幀內(nèi)或預(yù)編碼VOP之前的一個(gè)雙向預(yù)編碼VOP轉(zhuǎn)換成一個(gè)幀內(nèi)或預(yù)編碼VOP;如果由所述檢測(cè)步驟已檢測(cè)到的一個(gè)非可見VOP,或者在相反的情形(N)中的正常的VOP,對(duì)轉(zhuǎn)換的VOP進(jìn)行編碼(ENC),得到壓縮的視頻數(shù)據(jù)信號(hào)。
文檔編號(hào)G06T9/00GK1364383SQ01800436
公開日2002年8月14日 申請(qǐng)日期2001年2月21日 優(yōu)先權(quán)日2000年3月7日
發(fā)明者Y·拉曼津 申請(qǐng)人:皇家菲利浦電子有限公司