專利名稱:用于對視頻目標(biāo)平面的目標(biāo)信息進(jìn)行編碼的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于對視頻目標(biāo)平面的目標(biāo)信息進(jìn)行編碼的方法及裝置;且更具體地,涉及一種用于以提高的編碼效率對視頻目標(biāo)平面的目標(biāo)信息進(jìn)行編碼的方法及裝置。
在例如電視電話、電話會議及高清晰度電視系統(tǒng)的數(shù)字電視系統(tǒng)中,由于視頻幀信號中的視頻行信號包括一序列稱之為象素值的數(shù)字?jǐn)?shù)據(jù),需要大量的數(shù)字?jǐn)?shù)據(jù)來定義各視頻幀信號。然而,由于常規(guī)傳輸信道的可用頻帶寬是有限的,為了通過其發(fā)送大量的數(shù)字?jǐn)?shù)據(jù),不可避免地要通過使用各種數(shù)據(jù)壓縮技術(shù)來壓縮或減少數(shù)據(jù)量,特別是在例如電視電話及電話會議系統(tǒng)的低比特率視頻信號編碼器的情況下。
用于低比特率編碼系統(tǒng)的視頻信號編碼技術(shù)之一為所謂的面對目標(biāo)的分析-合成編碼技術(shù)(見,例如MPEG-4視頻驗(yàn)證模型版本7.0,國際標(biāo)準(zhǔn)化組織,運(yùn)動圖象及相關(guān)音頻信息的編碼,ISO/IEC JTC1/SC29/WG11 MPEG97/N1642,布里斯托爾,1997年4月)。根據(jù)該面對目標(biāo)的分析-合成編碼技術(shù),一輸入視頻圖象被劃分成若干個目標(biāo),即若干個視頻目標(biāo)平面(VOP),其中這些VOP對應(yīng)于使用者可訪問及操縱的一比特流中的實(shí)體;并且通過不同的編碼信道對用于定義各目標(biāo)的運(yùn)動、形狀及紋理信息的三組參數(shù)進(jìn)行處理。
一個VOP可被稱之為一個目標(biāo)并由環(huán)繞各目標(biāo)的其寬度和高度可為16象素(一宏塊尺寸)的最小倍數(shù)的一劃界矩形表示,以使編碼器可在逐VOP的基礎(chǔ)上,即逐目標(biāo)的基礎(chǔ)上處理輸入視頻圖象。一個VOP包括表示該VOP的亮度和色度的紋理信息及表示該目標(biāo)的形狀和位置的形狀信息。
在紋理信息中,一象素由例如1到255范圍中的一值表示;而在形狀信息中,一二進(jìn)制值,例如O被用于指示位于該VOP中該目標(biāo)外部的一象素,即一背景象素及另一二進(jìn)制值,例如255被用于指示位于該目標(biāo)內(nèi)部的一象素,即一目標(biāo)象素。
參見
圖1,說明一用于對-VOP的紋理信息進(jìn)行編碼的常規(guī)的編碼裝置100。在轉(zhuǎn)換器105,該VOP的形狀信息的目標(biāo)象素值被從255變至1,從而將一轉(zhuǎn)換后的形狀信息提供給一乘法器110和一塊選擇單元125,其中該轉(zhuǎn)換后的形狀信息包括具有1的目標(biāo)象素和具有零值的背景象素。在乘法器110,該VOP的紋理信息被乘以該轉(zhuǎn)換后的形狀信息,從而產(chǎn)生轉(zhuǎn)換后的紋理信息給一填充單元120。在該轉(zhuǎn)換后的紋理信息中,這些目標(biāo)象素保持它們的原始值而位于該目標(biāo)外部的象素具有零值。該填充單元120通過使用一常規(guī)的重復(fù)填充技術(shù)對該轉(zhuǎn)換后的紋理信息中的背景象素執(zhí)行填充處理以提高數(shù)據(jù)壓縮效率,其中在該重復(fù)填充技術(shù)中,這些背景象素通過根據(jù)該目標(biāo)的邊界象素值所獲得的新值而被填充。
參見圖2,說明一由被填充的紋理信息所表示的示例性VOP10,其中該VOP10包括由劃了陰影線部分表示的一目標(biāo)15和由未劃陰影線部分表示的一背景20。塊選擇單元25響應(yīng)于該轉(zhuǎn)換后的形狀信息及填充后的紋理信息,檢測VOP10中的目標(biāo)15和背景20;并將該VOP10劃分成多個例如8×8象素的DCT(離散余弦變換)塊,例如塊1至12。然后,塊選擇單元125選擇覆蓋目標(biāo)15的DCT塊并將它們作為處理塊提供給-DCT單元130。在圖2所示的例子中,該DCT塊1沒有覆蓋目標(biāo)15;且因此,DCT塊2-12被選擇作為處理塊。在DCT單元130,各處理塊被轉(zhuǎn)換成一組DCT系數(shù)并且該組DCT系數(shù)然后被提供給一量化單元140。在量化單元140,該組DCT系數(shù)被量化并被傳送給一發(fā)射機(jī)(未示出)進(jìn)行發(fā)送。
另一方面,除了該目標(biāo)的運(yùn)動、形狀和紋理信息外,例如表示該目標(biāo)的一索引、題目、制作者、使用者可編輯性等的目標(biāo)信息需要被編碼并被發(fā)送作為該目標(biāo)的編碼序列的頭部,在這種情況下,如果有多個目標(biāo)被發(fā)送,目標(biāo)信息量變大,從而導(dǎo)致編碼效率降低。
因此,本發(fā)明的主要目的在于提供一種對視頻目標(biāo)平面(VOP)的目標(biāo)信息進(jìn)行有效編碼的方法和裝置。
根據(jù)本發(fā)明的一個方面,提供有一種對視頻信號進(jìn)行編碼的方法,該視頻信號包括一視頻目標(biāo)平面(VOP)及其目標(biāo)信息,該VOP在其中具有一目標(biāo),該方法包括有步驟(a)將該VOP劃分成多個塊并檢測邊界塊和目標(biāo)塊,其中各邊界塊中包括有背景象素和目標(biāo)象素,而各目標(biāo)塊中只包括有目標(biāo)象素,這些背景象素和目標(biāo)象素分別表示駐留于該目標(biāo)的外部及內(nèi)部的象素;(b)將該目標(biāo)信息轉(zhuǎn)換成一組目標(biāo)符號;(c)將各目標(biāo)符號加至包括在一邊界塊中的一背景象素,從而產(chǎn)生處理塊,這些處理塊包括有這些目標(biāo)塊和一個或多個其中具有這些目標(biāo)符號的處理后的邊界塊及其余未被處理的邊界塊,及(d)對這些處理塊進(jìn)行編碼,從而產(chǎn)生一編碼后的視頻信號。
根據(jù)本發(fā)明的另一方面,提供有一種對視頻信號進(jìn)行編碼的裝置,該視頻信號包括一其中具有一目標(biāo)的視頻圖象和一目標(biāo)信息,該視頻圖象由若干目標(biāo)象素和背景象素組成,這些目標(biāo)象素駐留于目標(biāo)內(nèi)部而背景象素駐留于目標(biāo)外部,該裝置包括用于將該視頻圖象劃分成多個塊并將各塊分類成背景塊、邊界塊和目標(biāo)塊中的一個的裝置,其中該背景塊中只包括有背景象素,該邊界塊中包括有目標(biāo)和背景象素及該目標(biāo)塊只包括有目標(biāo)象素;用于產(chǎn)生表示該目標(biāo)信息的一組二進(jìn)制數(shù)的目標(biāo)符號的裝置;用于通過將這些目標(biāo)符號加到這些目標(biāo)塊及邊界塊中而產(chǎn)生處理塊的裝置;及用于對這些處理塊進(jìn)行編碼,從而產(chǎn)生一編碼后的視頻信號的裝置。
通過結(jié)合附圖對優(yōu)選實(shí)施例的描述,本發(fā)明的上述及其它目的和特征將變得顯然,附圖中圖1為用于對VOP的信息進(jìn)行編碼的常規(guī)編碼裝置的概略性方框圖;圖2為一被劃分成多個DCT塊的擴(kuò)展的VOP的示意圖;圖3為根據(jù)本發(fā)明的一優(yōu)選案施例的用于對目信息進(jìn)行編碼的創(chuàng)造性裝置的概略性方框圖;及圖4為圖3中的目標(biāo)信息插入單元的詳細(xì)方框圖。
參見圖3,示出了根據(jù)本發(fā)明的一優(yōu)選實(shí)施例的用于對目標(biāo)信息進(jìn)行編碼的創(chuàng)造性裝置的概略性方框圖。轉(zhuǎn)換器305、乘法器310和填充單元320的功能及特征與圖1中所示的相似元件105、110和120一樣,因此為簡便起見,省去對它們的描述。來自填充單元320的填充后的紋理信息及來自轉(zhuǎn)換器305的轉(zhuǎn)換后的形狀信息被提供給一目標(biāo)信息插入單元330,該目標(biāo)信息插入單元330也接收目標(biāo)信息。下面將參照圖2和4描述在目標(biāo)信息插入單元330中對目標(biāo)信息進(jìn)行編碼的詳細(xì)過程,其中圖4為該目標(biāo)信息插入單元330的詳細(xì)方框圖。
以與圖1中所示的填充單元120中相似的方式,一塊檢測單元332檢測覆蓋目標(biāo)15的DCT塊。在VOP的這些DCT塊中,不覆蓋目標(biāo)15且僅由背景象素組成的DCT塊1被設(shè)定為一背景DCT塊,DCT塊7為一只包括有目標(biāo)象素的目標(biāo)DCT塊,而其余的DCT塊2-6和8-12為其中包括有目標(biāo)及背景象素兩者的邊界DCT塊。一旦檢測到目標(biāo)和背景DCT塊,該塊檢測單元332給各背景象素附加一識別標(biāo)志,該識別標(biāo)志表示一被附加有標(biāo)志的象素屬于背景20;并將這些目標(biāo)和邊界DCT塊作為處理DCT塊提供給處理塊生成單元338。
同時,該目標(biāo)信息被輸入給一轉(zhuǎn)換單元334。在轉(zhuǎn)換單元334,表示該目標(biāo)信息的各字符、數(shù)字、符號等被轉(zhuǎn)換成由例如8比特的二進(jìn)制數(shù)表示的二進(jìn)制符號。由該轉(zhuǎn)換單元334生成的一組二進(jìn)制符號被提供給一隨機(jī)目標(biāo)數(shù)據(jù)生成單元336。該組二進(jìn)制符號可產(chǎn)生一與這些目標(biāo)象素的圖形完全不同的某一圖形,因此,隨后變換過程例如DCT的編碼效率可被降低。為此,該隨機(jī)目標(biāo)數(shù)據(jù)生成單元336通過將各二進(jìn)制符號乘以一隨機(jī)數(shù)而產(chǎn)生一組隨機(jī)目標(biāo)符號。
該隨機(jī)數(shù)是以一預(yù)定方式從一組預(yù)定的隨機(jī)數(shù)中選擇出來的。該隨機(jī)數(shù)應(yīng)是非常大足夠使該目標(biāo)信息在后來的量化過程中不被損壞。來自隨機(jī)目標(biāo)數(shù)據(jù)生成單元336的該組隨機(jī)目標(biāo)符號被饋送給處理塊生成單元338。該處理塊生成單元338根據(jù)附加給背景象素的識別標(biāo)志,對包括在該處理DCT塊中包括的背景象素進(jìn)行檢測。
按照常規(guī),這些塊以從左至右和從上至下的光柵掃描次序被處理。因此,圖2中所示的處理DCT塊以DCT塊2到塊12的次序被處理。處理塊生成單元338找出第一處理DCT塊,即塊2,并逐個地將隨機(jī)的目標(biāo)符號加至以光柵掃描次序在DCT塊2中選擇的填充后的背景象素。如果有剩余的隨機(jī)目標(biāo)符號未被附加,這些隨機(jī)的目標(biāo)符號以與上述相同的方式被附加給隨后的邊界DCT塊中的背景象素直至所有的目標(biāo)符號被處理。一旦處理這些隨機(jī)的目標(biāo)符號,一個或多個處理后的邊界DCT塊包括該隨機(jī)的目標(biāo)符號信息而其余未被處理的邊界DCT塊和每個目標(biāo)DCT塊保持原封不動。所有這些塊作為處理塊被提供給一變換單元340。
返回參照圖3,變換單元340通過使用例如一常規(guī)的離散余弦變換(DCT)技術(shù)將各處理塊轉(zhuǎn)換成一組變換系數(shù),并將該組變換系數(shù)提供給一量化單元350,其中該組變換系數(shù)被量化以生成一組量化后的變換系數(shù),并被提供給一模數(shù)(modulus)單元360。
在模數(shù)單元360,根據(jù)常規(guī)的模數(shù)技術(shù)對超出一預(yù)定最大值的象素進(jìn)行模數(shù)處理。通過從一量化后的變換系數(shù)中減去一預(yù)定最大值的整數(shù)倍,即模數(shù)而將該量化后的變換系數(shù)值的范圍限定在該預(yù)定最大值內(nèi),其中該模數(shù)為例如255。例如,如果例如根據(jù)VLC(可變長度編碼)技術(shù)可在隨后的統(tǒng)計編碼處理中被處理的該最大值為255且一對應(yīng)于其中包括有一隨機(jī)目標(biāo)符號的背景象素的量化后的變換系數(shù)具有520的值,則該量化后的變換系數(shù)的值被減至10(=520-255×2)并且模信息被附加至其,其中該模信息表示模處理數(shù)。在該情況下模信息具有2的值。另一方面,如果與其中包括有一隨機(jī)的目標(biāo)符號的背景象素相對應(yīng)的量化的變換系數(shù)具有值270,該量化的變換系數(shù)的值被減至5(=270-255×1)且模信息具有值1。該模處理后的數(shù)據(jù)被提供給VLC單元370。在VLC單元370,該模處理后的數(shù)據(jù)被VLC編碼并被發(fā)送至-發(fā)射機(jī)(未示出)用于發(fā)射。
在接收端的解碼器,該發(fā)送的VLC編碼后的數(shù)據(jù)通過-序列可變長度解碼、反模數(shù)、逆量化和逆變換處理被重構(gòu)成處理塊,然后,根據(jù)自發(fā)射機(jī)發(fā)送的該目標(biāo)的形狀信息和該重構(gòu)的處理塊,獲得該目標(biāo)的紋理信息。然后,根據(jù)該目標(biāo)的該重構(gòu)的紋理信息的邊界象素執(zhí)行逆填充處理,且背景象素的填充的象素值被去除。此時的邊界象素的其余值被除以預(yù)存在該解碼器的預(yù)定組隨機(jī)數(shù),從而產(chǎn)生對應(yīng)于該目標(biāo)信息的二進(jìn)制符號。然后該些二進(jìn)制符號被轉(zhuǎn)換成目標(biāo)信息。
盡管只相對于某一優(yōu)選實(shí)施例對本發(fā)明進(jìn)行了描述。但在不脫離由所附權(quán)利要求定義的精神及范圍的前提下,可作出其它改型和變化。
權(quán)利要求
1.一種對包括有一視頻目標(biāo)平面(VOP)及其目標(biāo)信息的視頻信號進(jìn)行編碼的方法,該VOP中包括有一目標(biāo),該方法包括有步驟(a)將該VOP劃分成多個塊并檢測邊界塊和目標(biāo)塊,其中各邊界塊中包括有背景象素和目標(biāo)象素而各目標(biāo)塊中只包括有目標(biāo)象素,這些背景及目標(biāo)象素分別表示駐留于該目標(biāo)外部及內(nèi)部的象素;(b)將該目標(biāo)信息轉(zhuǎn)換成一組目標(biāo)符號;(c)將各目標(biāo)符號加至包括在一邊界塊中的一背景象素上,從而產(chǎn)生處理塊,這些處理塊包括有目標(biāo)塊和一個或多個其中具有目標(biāo)符號的處理后的邊界塊及其中不具有目標(biāo)符號的其余未被處理的邊界塊;及(d)對這些處理塊進(jìn)行編碼,從而生成一編碼后的視頻信號。
2.根據(jù)權(quán)利要求1的方法,其中各目標(biāo)符號由二進(jìn)制數(shù)表示。
3.根據(jù)權(quán)利要求2的方法,其中轉(zhuǎn)換步驟(b)包括有步驟(b1)將該目標(biāo)信息轉(zhuǎn)換成一組二進(jìn)制數(shù),其中各二進(jìn)制數(shù)由P比特的二進(jìn)制數(shù)表示,P為一正整數(shù);及(b2)將各二進(jìn)制符號乘以在一預(yù)定組隨機(jī)數(shù)中選擇的一隨機(jī)數(shù),從而提供該組目標(biāo)符號。
4.根據(jù)權(quán)利要求3的方法,其中這些背景象素具有通過根據(jù)這些目標(biāo)象素執(zhí)行一填充技術(shù)而獲得的值。
5.根據(jù)權(quán)利要求4的方法,其中該填充技術(shù)為一重復(fù)填充技術(shù)。
6.根據(jù)權(quán)利要求5的方法,其中編碼步驟(d)包括有步驟(d1)變換各處理塊以提供一組變換系數(shù);(d2)量化該組變換系數(shù)以產(chǎn)生一組量化后的系數(shù);及(d3)根據(jù)統(tǒng)計編碼技術(shù)對該組量化后的系數(shù)進(jìn)行編碼以產(chǎn)生該編碼后的視頻信號。
7.根據(jù)權(quán)利要求6的方法,其中編碼步驟(d)還包括在量化步驟(d2)后,(d21)步驟根據(jù)一模數(shù)技術(shù)限定這些量化后的系數(shù)的值。
8.根據(jù)權(quán)利要求7的方法,其中附加步驟(c)包括有步驟(c1)檢測一個或多個二進(jìn)制塊以在其中插入這些目標(biāo)符號;及(c2)將各目標(biāo)符號加至在被檢測的二進(jìn)制塊中所包括的一背景象素,從而生成該些處理后的邊界塊。
9.根據(jù)權(quán)利要求8的方法,其中劃分步驟(a)包括有步驟(a1)生成識別標(biāo)志給在這些邊界塊中所包括的背景象素,附加給一象素的一識別標(biāo)志表示該象素對應(yīng)于一背景象素。
10.根據(jù)權(quán)利要求9的方法,其中一個或多個邊界塊通過使用這些識別標(biāo)志而被檢測到。
11.一種用于對包括有一視頻圖象和目標(biāo)信息的視頻信號進(jìn)行編碼的裝置,該視頻圖象中具有一目標(biāo)且由目標(biāo)象素和背景象素組成,目標(biāo)象素駐留于該目標(biāo)內(nèi)部而背景象素駐留于該目標(biāo)外部,該裝置包括有用于將該視頻圖象劃分成多個塊并將各塊分類成背景塊、邊界塊和目標(biāo)塊中的一個的裝置,其中該背景塊中只包括有背景象素,邊界塊中包括有目標(biāo)象素和背景象素而目標(biāo)塊中只包括有目標(biāo)象素;用于產(chǎn)生一組表示該目標(biāo)信息的二進(jìn)制數(shù)的目標(biāo)符號的裝置;用于通過將這些目標(biāo)符號插入到這些目標(biāo)塊和邊界塊中而產(chǎn)生處理塊的裝置;及用于對這些處理塊進(jìn)行編碼,從而生成一編碼后的視頻信號的裝置。
12.根據(jù)權(quán)利要求11的裝置,其中生成裝置包括用于將該目標(biāo)信息轉(zhuǎn)換成一組二進(jìn)制符號的裝置,各二進(jìn)制符號由多個預(yù)定的二進(jìn)制數(shù)表示;及用于將各二進(jìn)制符號乘以在一預(yù)定組隨機(jī)數(shù)中以預(yù)定方式選擇的一隨機(jī)數(shù)而獲得該組目標(biāo)符號的裝置。
13.根據(jù)權(quán)利要求12的裝置,其中這些處理塊包括這些目標(biāo)塊和一個或多個其中具有目標(biāo)符號的處理后的邊界塊及其余不具有目標(biāo)符號的邊界塊。
14.根據(jù)權(quán)利要求13的裝置,其中用于產(chǎn)生處理塊的裝置包括用于找出一個或多個邊界塊以在其中插入這些目標(biāo)符號的裝置,及用于將各目標(biāo)符號加至找出的該些邊界塊中包括的一背景象素,從而產(chǎn)生這些處理后的邊界塊的裝置。
15.根據(jù)權(quán)利要求14的裝置,其中該視頻圖象劃分裝置包括有用于將識別標(biāo)志附加至這些邊界塊中所包括的背景象素的裝置,其中附加到一象素的一識別標(biāo)志指示該象素為一背景象素。
16.根據(jù)權(quán)利要求15的裝置,其中根據(jù)這些識別標(biāo)志檢測該一個或多個邊界塊及各目標(biāo)符號被加至的背景象素。
17.根據(jù)權(quán)利要求16的裝置,其中根據(jù)光柵掃描次序找出該一個或多個邊界塊。
18.根據(jù)權(quán)利要求17的裝置,其中該編碼裝置包括用于變換各處理塊以提供一組變換系數(shù)的裝置;用于量化該組變換系數(shù)以生成一組量化后的系數(shù)的裝置;及用于對該組量化后的系數(shù)進(jìn)行編碼以生成該編碼后的視頻信號的裝置。
19.根據(jù)權(quán)利要求18的裝置,其中該編碼裝置包括用于限定該組中的各量化后的系數(shù)的值,從而產(chǎn)生一組限定后的量化后的系數(shù)的裝置;及用于對該組限定及量化后的系數(shù)進(jìn)行統(tǒng)計編碼以生成該編碼后的視頻信號的裝置。
20.根據(jù)權(quán)利要求19的裝置,其中限定各量化后的系數(shù)的值是根據(jù)一模數(shù)而被實(shí)現(xiàn)的。
全文摘要
一種對包括有一視頻目標(biāo)平面(VOP)及其目標(biāo)信息的視頻信號進(jìn)行編碼的方法,包括有步驟:將該VOP劃分成多個塊并檢測邊界塊和目標(biāo)塊,其中各邊界塊中包括有背景象素和目標(biāo)象素而各目標(biāo)塊中只包括有目標(biāo)象素;將該目標(biāo)信息轉(zhuǎn)換成一組目標(biāo)符號;將各目標(biāo)符號加至包括在一邊界塊中的一背景象素上,從而產(chǎn)生處理塊;及對這些處理塊進(jìn)行編碼,從而生成一編碼后的視頻信號。
文檔編號H04N7/30GK1219824SQ9712171
公開日1999年6月16日 申請日期1997年12月12日 優(yōu)先權(quán)日1997年12月2日
發(fā)明者韓錫源 申請人:大宇電子株式會社