專利名稱:用于編碼輪廓圖象的基于基線的形狀編碼方法和裝置的制作方法
技術領域:
本發(fā)明涉及一種用于編碼視頻信號的方法和裝置,更具體地,涉及一種能夠通過利用基于基線的形狀編碼技術來編碼含在視頻信號中的目標的輪廓的改進的方法和裝置。
在諸如可視電話、電話會議和高清晰度電視系統(tǒng)的數(shù)字電視系統(tǒng)中,由于視頻幀信號中的視頻行信號包含一序列稱為象素值的數(shù)字數(shù)據(jù),所以需要大量的數(shù)字數(shù)據(jù)來定義每一視頻幀信號。但是,因為傳統(tǒng)傳輸信道的可用頻帶有限,為了通過其發(fā)送大量的數(shù)字數(shù)據(jù),不可避免要通過使用各種數(shù)據(jù)壓縮技術來壓縮或減少數(shù)據(jù)量,尤其是在諸如可視電話、電話會議系統(tǒng)的低比特速率信號編碼器的情況下。
用于為低比特速率編碼系統(tǒng)編碼視頻信號的這樣的技術之一是面向目標的分析綜合編碼技術,在該技術中,輸入視頻信號被分為多個目標,并通過不同的編碼信道處理用于定義每個目標的運動、輪廓和象素數(shù)據(jù)的三組參數(shù)。
在目標輪廓的處理中,輪廓信息對于目標的形狀的分析和綜合是重要的。用于表示輪廓信息的傳統(tǒng)方法是一種鏈式編碼方法。但是,鏈式編碼方法為了表示輪廓信息需要大量的比特,雖然不丟失輪廓信息。
因此,為了克服這一缺點,已經(jīng)提出了若干種方法來編碼輪廓信息。在這些編碼方法中,有一種使用多邊形近似的方法。但是,多邊形近似由于多邊形近似的特點,具有諸如在輪廓表示中粗糙和相鄰近似數(shù)據(jù)之間的相關性弱的一些缺點。
為改善這些問題而引入的技術之一是基于基線的形狀編碼技術。該技術是由Lee等人在“Core-experiment Results on Compari son of Shape Coding Techniques(S4)”(國際標準化組織,運動圖象及相關音頻信息的編碼,ISO/IEC JTC1/SC29/WG11MPEG96/0907,1996年1月)中公開的。這個技術首先選擇一個基線并確定一采樣間隔以在該基線上取N個采樣點,N為一正整數(shù)。然后,對于所有采樣點提取2N個輪廓采樣值并變換為一個一維(1D)采樣表。該1D采樣表被用于制成一經(jīng)處理的形狀。然后,產(chǎn)生原始形狀和經(jīng)處理的形狀之間的形狀差,并進行采樣以提取該輪廓的誤差采樣表。最后,1D采樣表和誤差采樣表被編碼以用于發(fā)送。因此,通過上述的基于基線的形狀編碼技術,有可能補救由利用多邊形近似產(chǎn)生的問題。
但是,仍然希望提高由于1D采樣表中的相鄰輪廓采樣值之間的較大差值而受到損害的編碼效率,該較大差值可能是由原始的和經(jīng)處理的輪廓形狀之間的形狀差引起的。
因此,本發(fā)明的主要目的是提供一種用于編碼視頻信號中的目標的輪廓的方法和裝置,該方法和裝置能夠通過補償輪廓的采樣數(shù)據(jù)之間的較大差值來提高對輪廓進行編碼的效率。
按照本發(fā)明,提供一種用于編碼表示在視頻信號中的目標的輪廓的方法,該方法包括以下步驟(a)根據(jù)表示輪廓的輪廓圖象數(shù)據(jù)確定一個基線以由此提供一個基線信息;(b)根據(jù)基線信息對該輪廓采樣以由此產(chǎn)生一個一維采樣表,其中該一維采樣表具有多個采樣值;(c)通過利用該一維采樣表產(chǎn)生一個重建的輪廓;(d)提取重建的輪廓和原始輪廓之間的差,并根據(jù)該基線對其采樣以由此產(chǎn)生一個誤差采樣表;(e)通過利用該誤差采樣表補償一維采樣表中的相鄰采樣值之間的差;和(f)編碼經(jīng)補償?shù)囊痪S采樣表、誤差采樣表和基線信息。
本發(fā)明的上述和其它目的和特點在下面的結合各附圖對各優(yōu)選實施例的描述中將變得顯而易見,其中
圖1表示本發(fā)明的用于編碼一個目標的輪廓的裝置的示意性方塊圖;圖2表示圖1中的誤差檢測塊400的詳細方塊圖;圖3表示一個目標輪廓的示例性采樣過程;圖4A和4B分別表示對應于圖3中的輪廓的1D采樣表和誤差采樣表;圖5提供用于補償圖4A中1D采樣表中的各相鄰采樣值之間的較大差值的過程。
參照圖1,其中示出按照本發(fā)明的優(yōu)選實施例的用于編碼表示在視頻信號中的一個目標的輪廓的本發(fā)明的裝置的示意方塊圖。
視頻信號中的目標的輪廓圖象數(shù)據(jù)被輸入到基線確定塊100、采樣塊200和誤差檢測塊400。
基線確定塊100產(chǎn)生一個緊緊包圍該輪廓的邊界矩形以確定一個合適的基線。該基線是由輪廓的寬和高之間的比確定的。即,輪廓的邊界矩形的水平和垂直邊中的較長者被選擇為基線。一旦確定了基線,表示基線位置的基線信息通過線路L50和熵編碼器600被傳送到下面的處理塊,即,采樣塊200、誤差檢測塊400。
采樣塊200根據(jù)來自基線確定塊100和輸入到其中的輪廓圖象數(shù)據(jù)產(chǎn)生該輪廓的1D采樣表。
參照圖3,采樣塊200首先根據(jù)基線信息指定對應于含有凹入部分C1和C2的輪廓10的基線20;在基線20上取N個采樣點并編號,例如,0到14,其中N個采樣點在基線20上距離相等,N是一個正整數(shù);在每個采樣點處畫一條與基線20垂直的線,該垂線與輪廓10相交;并為每個采樣點選擇每個采樣點的采樣值中的一對;每個采樣值表示從每個采樣點至每個采樣點處的垂線與輪廓10之間的每個交點的距離。如上所述,如果采樣點處的基線的垂線與輪廓10在多于兩個輪廓象素處相交,該采樣點的最高和最低采樣值被選擇為該采樣點的一對采樣值。另一方面,如果采樣點處的基線的垂線與輪廓10相交于輪廓10上的一個輪廓象素,在該輪廓象素處的采樣值被選擇兩次,從而為該采樣點提供一對采樣值。
也就是說,如圖3所示,雖然采樣點4與輪廓10在四個輪廓象素處相交,且因此具有四個采樣值L4、LL4、HH4和H4,但僅兩個采樣值L4(最低的)和H4(最高的)被選為采樣點4的一對采樣值。在另外一邊,如采樣點0,僅存在一個交點而在該交點處的采樣值被用作表示采樣點0的一對采樣值的H0和L0兩個采樣值。
一旦作為上述處理的結果得到在基線20上的所有采樣點0到14的15對采樣值,采樣塊200確定一起始點用于掃描輪廓10的15對采樣值,從而從15對采樣值中提取1D采樣表。在兩個端點,例如基線20上的第一個和最后一個采樣點0和14中,其高采樣值與低采樣值,即采樣點的一對采樣值中的采樣值之間的差值大于另一采樣點的該差值的一采樣點被選擇為該起始點。因此,圖3中的最后一個采樣點14被選擇為起始點。在掃描過程中,采樣塊200從起始點即最后一個采樣點14的低(或高)采樣值開始掃描,經(jīng)過另一端點,即第一采樣點0的低(或高)采樣值和高(或低)采樣值,最后達到起始點14的高(或低)采樣值。通過掃描過程得到的1D表,如圖4A所示,經(jīng)線路L10被提供到采樣補償塊300和誤差檢測塊400。
參照圖2,提供一個包含重建部分410、誤差提取部分420、誤差采樣部分430、和補償幅度確定部分440的誤差檢測塊400的詳細方塊圖。
重建部分410根據(jù)線路L10上的來自采樣塊200的1D采樣表產(chǎn)生一個重建的輪廓(未示出)并將其提供到誤差提取部分420。
誤差提取部分420從由經(jīng)線路L20輸入的輪廓圖象數(shù)據(jù)表示的原始輪廓中減去重建的輪廓,從而檢測到一個原始輪廓和重建輪廓之間的差,作為重建的輪廓的誤差分量,其中原始輪廓和圖3中的輪廓10相同。因此,如從圖3可看出的那樣,從相減得到的誤差分量對應于凹入部分C1和C2,因為垂線與凹入部分C1和C2的相交點處的采樣值,既不是最低,也不是最高,不包括在1D采樣表中。
誤差采樣部分430,如圖4B所示,通過根據(jù)線路L50上的基線信息,以與用于圖1的采樣塊200的相同的方式,對重建的輪廓的誤差分量采樣來為輪廓10的每個凹入部分C1和C2產(chǎn)生一誤差采樣表。因此,再參照圖3,因為當采樣塊200產(chǎn)生輪廓10的采樣表時跳過了位于采樣點7兩邊的凹入部分C1和C2,所以為凹入部分C1和C2提取出的誤差采樣表由相應于凹入部分C1和C2的采樣值,即(LL4,LL5,LL6,HH6,HH5,HH4)和(LL10,LL9,LL8,HH8,HH9,HH10)構成。每個凹入部分的誤差采樣表經(jīng)線路L40被傳送到補償幅度確定部分440和圖象信號編碼器500。
補償幅度確定部分440根據(jù)每個凹入部分的誤差采樣表計算補償幅度,以利用它們減小由凹入部分C1和C2引起的,包含在1D采樣表中的兩個相鄰采樣值,例如L11和L10或L4和L3之間的較大差值,因為兩個相鄰采樣值之間的較大差值降低了要在圖1的圖象信號編碼器500中進行的1D采樣表的編碼處理的效率。因此,通過分別計算每個凹入部分的誤差采樣表中的第一個和最后一個采樣值,例如LL4與HH4和LL10與HH10之間的絕對差值來確定分別與凹入部分C1和C2有關的幅度M1和M2并通過線路L30將其耦合到采樣補償塊300。
再參照圖1,采樣補償塊300利用線路L30上的補償幅度M1和M2補償從采樣塊200提供的1D采樣表中的相鄰采樣值之間的較大差值。如圖4A所示,因為采樣值L11和L10之間的差值較大,所以利用來自補償幅度確定部分440的相應幅度M2來補償采樣值L11和L10之間的差值,對于編碼1D采樣表是有利的。上面,采樣點11處的垂線穿過凹入部分C2的外側,而采樣點10則穿過凹入部分C2的內(nèi)側。由于同樣的原因,因為采樣值L3和L4之間的差值也較大,所以需要利用從部分440產(chǎn)生的相應的幅度M1補償采樣值L3和L4之間的差值。也就是說,與L11和L10的差值是由凹入部分C2引入的一樣,L3和L4的差值是凹入部分的C1引入的。
參照圖5,提供一種用于補償1D采樣表中的相鄰采樣值間的較大差值的過程。采樣補償塊300首先將與凹入部分C2有關的幅度M2加到采樣表中接在采樣值L11之后的采樣值L10至L0上,以減小采樣值L11和L10之間的的差值。因此,圖5中的采樣值序列改變?yōu)長14、L13、L12、L11、L10+M2、L9+M2、L8+M2、L7+M2、L6+M2、L5+M2、L4+M2、L3+M2、L2+M2、L1+M2和L0+M2。然后,采樣補償塊300從由上面的加法處理中得到的增加的采樣值L3+M2到L0+M2中減去對應于凹入部分C1的幅度M1,以減小仍然存在于增加的采樣值L4+M2和L3+M2之間的差值。因此,采樣值序列又被變?yōu)長14、L13、L12、L11、L10+M2、L9+M2、L8+M2、L7+M2、L6+M2、L5+M2、L4+M2、L3+M2-M1、L2+M2-M1、L1+M2-M1和L0+M2-M1。因此,如果凹入部分C1和C2是對稱的且從而幅度M1和M2是相等的,采樣值序列最后變?yōu)長14、L13、L12、L11、L10+M2、L9+M2、L8+M2、L7+M2、L6+M2、L5+M2、L4+M2、L3、L2、L1和L0。作為上述處理的結果,可獲得與由虛線表示的原始數(shù)據(jù)圖形25相比較的改進的數(shù)據(jù)圖形15。也就是說,1D采樣表具有圖形15,其相鄰采樣值之間的差值小于圖形25相鄰采樣值之間的差值。
如上所述,數(shù)據(jù)補償處理是通過根據(jù)從包括在該輪廓的誤差采樣表中的采樣值產(chǎn)生的補償幅度來補償由于輪廓中的凹入部分的存在而引起的1D采樣表中的兩個相鄰采樣值之間的較大差值來完成的。即,在1D采樣表中,如果具有較大差值的兩個相鄰采樣值中的前一個采樣值大于后面的采樣值,則相應于凹入部分的幅度被加到后面的采樣值上。另一方面,如果在1D采樣表中前面的采樣值小于后面的采樣值,則在1D采樣表中相應凹入部分的幅度被從后面的采樣值中減去。通過上述加和減處理的經(jīng)補償?shù)?D采樣表被提供到圖象信號編碼器500。
圖象信號編碼器500通過利用諸如一維DCT(離散余弦變換)和任何公知的量化方法將來自采樣補償塊300的經(jīng)補償?shù)牟蓸颖砗途€路L40上的來自誤差檢測塊400的誤差采樣表分別變換為各組量化變換系系數(shù)。然后將這些量化變換系數(shù)組從這里發(fā)送到熵編碼器600。
熵編碼器600中,來自圖象信號編碼器500的量化變換系數(shù)組和來自基線確定塊100的基線信息通過利用例如公知的可變長度編碼技術被編碼在一起,并被傳送到一個發(fā)送機(未示出),用于將其發(fā)送。
雖然已經(jīng)結合特定的實施例對本發(fā)明進行了描述,但是對于本專業(yè)的技術人員來說,在不脫離由后面所附的權利要求書所限定的本發(fā)明的精神和范圍的情況下,可作出各種變動和修改是顯而易見的。
權利要求
1.一種用于對表示在視頻信號中的目標的輪廓進行編碼的方法,該方法包括以下步驟(a)根據(jù)表示該輪廓的輪廓圖象數(shù)據(jù)確定一基線以由此提供基線信息;(b)根據(jù)該基線信息對該輪廓采樣以由此產(chǎn)生一個一維采樣表,該一維采樣表具有多個采樣值;(c)通過利用該一維采樣表產(chǎn)生一個重建的輪廓;(d)提取重建輪廓和原始輪廓之間的差并根據(jù)基線信息對其采樣,從而產(chǎn)生一個誤差采樣表;(e)通過利用誤差采樣表補償一維采樣表中的相鄰采樣值之間的差;以及(f)對該經(jīng)補償?shù)囊痪S采樣表、誤差采樣表和基線信息進行編碼。
2.根據(jù)權利要求1的方法,其中所述步驟(a)包括(a11)產(chǎn)生緊緊包圍該輪廓的一邊界矩形;及(a12)在該邊界矩形的水平和垂直邊之中選擇較長的作為基線,從而產(chǎn)生基線信息。
3.根據(jù)權利要求1的方法,其中所述步驟(b)包括(b11)根據(jù)基線信息和輪廓圖象數(shù)據(jù)將基線和輪廓結合在一起;(b12)在基線上取N個采樣點并編號,其中該N個采樣點在基線上是等距的,N是一個正整數(shù);(b13)在每個采樣點處作基線的垂線;(b14)為每個采樣點選擇采樣值中的一對,一個采樣值代表從一個采樣點到該采樣點處的基線的垂線與輪廓的交點的距離;及(b15)對所有采樣點掃描各對采樣值,從而產(chǎn)生一維采樣表。
4.根據(jù)權利要求3的方法,其中,如果在一個采樣點處的基線的垂線與輪廓的交點多于兩個,相應于該采樣點的最高和最低采樣值被選擇為該采樣點的一對采樣值。
5.根據(jù)權利要求3的方法,其中,如果在一個采樣點處的基線的垂線與輪廓相交于一點,該點處的采樣值則作為該采樣點的一對采樣值。
6.根據(jù)權利要求3的方法,其中所述步驟(b15)包括(b151)選擇一起始點以用于在第一個和最后一個采樣點之間進行掃描;及(b152)從該起始點處的一對采樣值中的一個采樣值開始,經(jīng)過包含在所有采樣點處的各對采樣值中的所有采樣值順序進行掃描,從而產(chǎn)生一維采樣表。
7.根據(jù)權利要求6的方法,其中,在第一個和最后一個采樣點中,其一對采樣值之間的差值大于另一個采樣點的該差值的采樣點被確定為起始點。
8.根據(jù)權利要求1的方法,其中所述步驟(e)包括(e1)通過計算誤差采樣表中的采樣值之間的差值確定一補償幅度;和(e2)根據(jù)該補償幅度補償一維采樣表中的相鄰采樣值之間的差。
9.根據(jù)權利要求8的方法,其中該補償幅度被確定為誤差采樣表中第一個和最后一個采樣值之間的絕對差值。
10.一種用于對表示在視頻信號中的目標的輪廓進行編碼的裝置,該裝置包括用于根據(jù)表示該輪廓的輪廓圖象數(shù)據(jù)確定一個基線以由此提供基線信息的裝置;用于根據(jù)基線信息對該輪廓進行采樣以由此產(chǎn)生一個一維采樣表的裝置,該一維采樣表具有多個采樣值;用于通過利用一維采樣表產(chǎn)生重建輪廓的裝置;用于提取重建輪廓和原始輪廓之間的差并根據(jù)基線信息對其進行采樣以由此產(chǎn)生一個誤差采樣表的裝置;用于通過利用誤差采樣表補償一維采樣表中的相鄰采樣值之間的差的裝置;和用于對經(jīng)補償?shù)囊痪S采樣表、誤差采樣表和基線信息進行編碼的裝置。
11.根據(jù)權利要求10的裝置,其中該基線信息確定裝置包括用于產(chǎn)生緊緊包圍該輪廓的邊界矩形的裝置;用于將該邊界矩形的水平和垂直邊中的較長者選為基線的裝置。
12.根據(jù)權利要求10的裝置,其中,該采樣裝置包括用于根據(jù)基線信息和輪廓圖象數(shù)據(jù)將基線和輪廓結合在一起的裝置;用于在基線上取N個采樣點并編號的裝置,其中該N個采樣點在基線上是等距的,N是一個正整數(shù);用于在每個采樣點處作基線的垂線的裝置;用于為每個采樣點選擇采樣值中的一對的裝置,一個采樣值代表從一個采樣點到該采樣點處的基線的垂線與輪廓之間的交點的距離;及用于對所有采樣點掃描各對采樣值以由此產(chǎn)生一維采樣表的裝置。
13.根據(jù)權利要求12的裝置,其中,如果一個采樣點處的基線的垂線與輪廓的交點多于兩個,對應于該采樣點的最高和最低采樣值被選擇為該采樣點的一對采樣值。
14.根據(jù)權利要求12的裝置,其中,如果一個采樣點處的基線的垂線與輪廓相交于一點,該點處的采樣值則作為該采樣點的一對采樣值。
15.根據(jù)權利要求12的裝置,其中該掃描裝置包括用于選擇一起始點以用于在第一個和最后一個采樣點之間進行掃描的裝置;和用于從該起始點處的一對采樣值中的一個采樣值開始,經(jīng)過包含在所有采樣點處的各對采樣值中的所有采樣值順序進行掃描,從而產(chǎn)生一維采樣表的裝置。
16.根據(jù)權利要求15的裝置,其中,在第一個和最后一個采樣點中,其一對采樣值之間的差值大于另一個采樣點的該差值的采樣點被確定為起始點。
17.根據(jù)權利要求10的裝置,其中,該補償裝置包括用于通過計算誤差采樣表中的采樣值之間的差值來確定補償幅度的裝置;和用于根據(jù)該補償幅度補償一維采樣表中的相鄰采樣值之間的差的裝置。
18.根據(jù)權利要求17的裝置,其中該補償幅度被確定為誤差采樣表中第一個和最后一個采樣值之間的絕對差值。
19.一種使用用于對表示在數(shù)字視頻信號中的一個目標的輪廓進行編碼的裝置的視頻編碼器,該裝置包括用于根據(jù)表示該輪廓的輪廓圖象數(shù)據(jù)確定一基線以由此提供基線信息的裝置;用于根據(jù)基線信息對該輪廓進行采樣以提供一個具有一系列采樣值的一維采樣表的裝置;用于通過利用該一維采樣表產(chǎn)生重建輪廓的裝置;用于提取重建輪廓和原始輪廓之間的差并根據(jù)基線信息對其進行采樣以由此產(chǎn)生一個誤差采樣表的裝置;用于通過利用誤差采樣表補償一維采樣表中的相鄰采樣值之間的差的裝置;用于對經(jīng)補償?shù)囊痪S采樣表和誤差采樣表進行編碼以由此產(chǎn)生一編碼采樣表的裝置;和用于對該編碼采樣表和基線信息進行熵編碼的裝置。
20.根據(jù)權利要求19的視頻編碼器,其中該補償裝置包括用于將誤差采樣表中的第一個和最后一個采樣值之間的絕對差值確定為補償幅度的裝置;和用于通過加上或減去該補償幅度來補償一維采樣表中的相鄰采樣值之間的差的裝置。
全文摘要
一種通過利用基于基線的形狀編碼技術對視頻信號中的一個目標的輪廓進行編碼的裝置,首先根據(jù)輪廓圖象數(shù)據(jù)確定一基線并根據(jù)該基線產(chǎn)生該輪廓的一個一維采樣表。然后,該裝置根據(jù)該一維采樣表產(chǎn)生一個重建輪廓并提取重建輪廓與原始輪廓之間的差。對檢測出的差進行采樣以產(chǎn)生一個誤差采樣表,且最后根據(jù)該誤差采樣表對該一維采樣表進行補償。
文檔編號G06T7/60GK1177252SQ9612084
公開日1998年3月25日 申請日期1996年11月22日 優(yōu)先權日1996年9月19日
發(fā)明者金鎮(zhèn)憲 申請人:大宇電子株式會社