專利名稱:改進(jìn)的用于表示目標(biāo)輪廓的輪廓近似方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于視頻信號(hào)編碼器中的輪廓近似方法,更具體地,涉及一種改進(jìn)的用于精確重建目標(biāo)輪廓的輪廓近似方法。
在數(shù)字視頻系統(tǒng)、如電視電話、電視會(huì)議及高清晰度電視系統(tǒng)中,為了確定每個(gè)視頻幀信號(hào)需要大量數(shù)字?jǐn)?shù)據(jù),因?yàn)樵谝曨l幀信號(hào)中的視頻行信號(hào)內(nèi)包括一系列的被稱為象素值的數(shù)字?jǐn)?shù)據(jù)。但是,由于在傳統(tǒng)的傳輸信道中可獲得的頻帶寬度是有限的,為了通過這種傳輸信道傳輸大量的數(shù)字?jǐn)?shù)據(jù),不可避免地要通過使用各種數(shù)據(jù)壓縮技術(shù)來壓縮或減少數(shù)據(jù)量,尤其是在如電視電話及電視會(huì)議系統(tǒng)這樣的低比特率視頻信號(hào)編碼器的情況下。
這些用于低比特率編碼系統(tǒng)對視頻信號(hào)進(jìn)行編碼的方法中的一種是所謂的面向目標(biāo)的分析綜合編碼技術(shù)(見Michael Hotter寫的“基于運(yùn)動(dòng)兩維目標(biāo)的面向目標(biāo)的分析綜合編碼“Signal ProcessingImage Comunication,第二卷4期第409至428頁(1990年12月))。
根據(jù)該面向目標(biāo)的分析綜合編碼技術(shù),輸入視頻圖象視分成目標(biāo)及用于確定其運(yùn)動(dòng)的三組參數(shù),每個(gè)目標(biāo)的輪廓及象素?cái)?shù)據(jù)通過不同的編碼信道被處理。
尤其是,在處理目標(biāo)輪廓圖象時(shí),輪廓信息對于物體形狀的分析及綜合是很重要的。用于表示輪廓信息的傳統(tǒng)編碼方法是一種鏈?zhǔn)骄幋a技術(shù)。但是,鏈?zhǔn)骄幋a方法需要大量的比特,盡管在輪廓信息中未損失掉比特。
在這方面,對輪廓近似的多種方法已被建議出來,例如多邊形近似及B-樣條函數(shù)近似法。在多邊形近似法中其缺點(diǎn)之一是輪廓圖象表示粗糙。B-樣條函數(shù)近似法正相反,能更精確地表示輪廓圖象,但它需要高階多項(xiàng)式來減小近似誤差,由此增加了視頻編碼器的整體計(jì)算復(fù)雜性。
為了改善整體計(jì)算復(fù)雜性問題而導(dǎo)入的一種技術(shù)是采用多邊形近似及離散正弦變換(DST)的輪廓近似法。該技術(shù)被描述在與此同一持有人的待審查美國專利申請,系列號(hào)NO.08/423604中,其名稱為“用于表示目標(biāo)輪廓的輪廓近似裝置”,申請日為1995年4月17日。但是,在處理復(fù)雜的輪廓圖象時(shí),上述采用多邊形近似及DST的技術(shù)可能得出與原始輪廓圖象很不相同的重建圖象。
因此,本發(fā)明的主要目的是提供一種在視頻信號(hào)編碼器中使用的改進(jìn)的輪廓近似方法,它能夠降低在編碼的輪廓信息中的近似誤差。
根據(jù)本發(fā)明,提供了一種用于視頻信號(hào)編碼器中的用于表示目標(biāo)輪廓圖象的輪廓近似方法,其包括(a)確定輪廓圖象上的一些頂點(diǎn);(b)利用多個(gè)直線段來適配該輪廓圖象,以提供輪廓圖象的多邊形近似,每個(gè)直線段連接兩個(gè)相鄰的頂點(diǎn);(c)提供一直線段兩頂點(diǎn)的位置作為線段數(shù)據(jù);(d)對于一直線段確定一些抽樣點(diǎn)并提供代表該抽樣點(diǎn)位置的抽樣點(diǎn)信息,所述抽樣點(diǎn)將每條直線分成等長的小線段;(e)計(jì)算在直線段的每個(gè)抽樣點(diǎn)及頂點(diǎn)上的第一次誤差,該第一次誤差表示連接兩頂點(diǎn)的直線段及這兩頂點(diǎn)間輪廓線之間的距離;(f)將抽樣點(diǎn)及頂點(diǎn)上的第一次誤差變換成一組離散正弦變換系數(shù);(g)將每組離散正弦變換系數(shù)轉(zhuǎn)換成一組量化的變換系數(shù);(h)將該組量化的變換系數(shù)轉(zhuǎn)換成一組重建的第一次誤差;(i)基于每個(gè)直線段的線段數(shù)據(jù)、抽樣點(diǎn)信息及該組第一次誤差提供一重建的輪廓線;(j)計(jì)算第二次誤差,它是重建的輪廓線及其相應(yīng)的輪廓線之間的失配象素?cái)?shù)目;(k)將第二次誤差與一預(yù)定閾值相比較;(l)如果第二次誤差小于所述閾值,則對輪廓線的該組量化的變換系數(shù)及線段數(shù)據(jù)進(jìn)行編碼;或如果第二次誤差等于或大于所述閾值,則通過在該輪廓線上增加一個(gè)附加頂點(diǎn)使該輪廓線再分成一對新的分段輪廓線,并對相對于每個(gè)新分段的輪廓線的直線段重復(fù)步驟(c)至(l);及(m)對在步驟(a)中確定的頂點(diǎn)形成的所有直線段重復(fù)步驟(c)至(l)。
從以下結(jié)合附圖對優(yōu)選實(shí)施例的描述中,本發(fā)明的上述及其它目的和特征將變得更加明顯,附圖為
圖1表示本發(fā)明的用于表示輪廓圖象的輪廓近似裝置的方框圖;圖2A至2C表示一個(gè)示例的輪廓圖象的多邊形近似處理過程;圖3A及3B為示例圖,其中每個(gè)圖表示出連接兩個(gè)頂點(diǎn)的直線段及其相應(yīng)輪廓圖象之間的誤差;圖4A至4C例舉表示根據(jù)本發(fā)明的附加頂點(diǎn)增設(shè)操作;及圖5表示根據(jù)本發(fā)明的曲率計(jì)算圖。
參見圖1,它表示本發(fā)明的用于表示以視頻信號(hào)表達(dá)的目標(biāo)輪廓圖象的輪廓近似裝置。
代表目標(biāo)輪廓的輪廓圖象數(shù)據(jù)被傳送到一個(gè)多邊形近似單元100,第一及第二次誤差檢測單元120及150以及曲率計(jì)算單元160。在多邊形近似單元100上,利用多邊形近似技術(shù)對輪廓圖象進(jìn)行近似。該輪廓圖象的多邊形近似是通過利用線段適配輪廓圖象的傳統(tǒng)近似算法來獲得的。
參見圖2A至2C,它表示根據(jù)多邊形近似技術(shù)對一例舉的輪廓圖象10的分段處理過程。
首先,選擇兩個(gè)起始頂點(diǎn)。如果輪廓圖象是開環(huán)形的,則選擇兩個(gè)端點(diǎn),例如圖2A中所示的A及B作為起始頂點(diǎn)。另一方面,如果輪廓圖象是閉環(huán)形式的,則選擇輪廓上兩個(gè)最遠(yuǎn)的點(diǎn)作為起始頂點(diǎn)。然后,確定出輪廓上的距線段AB的最遠(yuǎn)點(diǎn),如果線段AB及該最遠(yuǎn)點(diǎn)、例如C點(diǎn)之間的距離Dmax大于一預(yù)定閾值時(shí),該點(diǎn)C就成為一個(gè)頂點(diǎn)。這個(gè)過程重復(fù)進(jìn)行,如圖2C中所示,直到對于每個(gè)線段的Dmax小于預(yù)定閾值TH1時(shí)為止。
對于一個(gè)給定輪廓,其頂點(diǎn)的數(shù)目取決于預(yù)定閾值TH1。如從圖2C中可看到的,利用較小的閾值,由線段來表示輪廓圖象可變得更精確,其代價(jià)是降低了編碼效率。
再參照圖1,代表輪廓圖象10的確定出的頂點(diǎn)如A、B、C、D及E的位置的頂點(diǎn)信息,如圖2C所示,由多邊形近似單元100提供給緩沖器110。
緩沖器110接收來自多邊形近似單元100的頂點(diǎn)信息并作為頂點(diǎn)數(shù)據(jù)存儲(chǔ)該信息。在多邊形近似單元100上確定出的所有頂點(diǎn)的頂點(diǎn)信息均存儲(chǔ)在緩沖器110中后,就開始了本發(fā)明處理的輪廓近似,例如利用一個(gè)過程控制器(未示出)從例如圖2C中所示的線段AD開始。這就是,響應(yīng)于來自過程控制器的起始信號(hào),該緩沖器110將代表該線段例如AD的兩個(gè)頂點(diǎn)位置的線段數(shù)據(jù)提供給抽樣電路115。
抽樣電路115為每個(gè)直線段確定預(yù)定數(shù)量,例如為4個(gè)的抽樣點(diǎn),其中這些抽樣點(diǎn)將線段分成等長度的分線段,并將代表確定的抽樣點(diǎn)位置的抽樣點(diǎn)信息及線段數(shù)據(jù)通過導(dǎo)線L11提供給第一次誤差檢測單元120及輪廓重建單元145。
基于來自于抽樣電路115的線段數(shù)據(jù)及抽樣點(diǎn)信息及導(dǎo)線L10上的輪廓圖象數(shù)據(jù),第一次誤差檢測單元120計(jì)算每個(gè)抽樣點(diǎn)及線段頂點(diǎn)上的第一次誤差。第一次誤差代表連接頂點(diǎn)的直線段及兩頂點(diǎn)間的輪廓線之間的距離。
圖3A及3B示出了代表直線段及相應(yīng)輪廓線之間的第一次誤差的示例圖,其中圖3A描繪出直線段AD及其相應(yīng)的輪廓線之間的第一次誤差,及圖3B表示出直線段DC及其相應(yīng)輪廓線之間的第一次誤差。每個(gè)誤差d1至d4或d1’至d4’代表直線段AD上的每個(gè)抽樣點(diǎn)S1至S4或直線段DC上的每個(gè)抽樣點(diǎn)S1’至S4’與相應(yīng)輪廓線之間的距離。如從圖3A及3B中可看到的,對于頂點(diǎn)的近似誤差均為“零”。因?yàn)樗械捻旤c(diǎn)都位于輪廓上。
由第一次誤差檢測單元120計(jì)算的第一次誤差被提供給離散正弦變換(DST)單元125。該DST單元125對線段的一組第一次誤差執(zhí)行一維DST操作,以產(chǎn)生一組DST系數(shù)。該組DST系數(shù)提供給量化(Q)單元130。量化單元130使該組DST系數(shù)量化,以通過導(dǎo)線L12將對應(yīng)于直線段的一組量化DST系數(shù)提供給逆向量化(IQ)單元135及方式選擇單元155,用于進(jìn)一步的處理。
在逆向量化單元135,該組量化的DST系數(shù)被變換回一組重建的DST系數(shù)。然后在逆向DST單元140上,該組重建的DST系數(shù)被逆變換成一組重建的第一次誤差。此后,將這組重建的第一次誤差提供給輪廓重建單元145。
基于來自于IDST單元140的該組重建的第一次誤差及來自抽些電路115的線段數(shù)據(jù)和抽樣點(diǎn)信息,輪廓重建單元145產(chǎn)生出一條重建的輪廓線,并將該重建的輪廓線數(shù)據(jù)提供給第二次誤差檢測單元150。
第二次誤差檢測單元150計(jì)算第二次誤差,它是位于來自輪廓重建單元145的重建的輪廓線與自導(dǎo)線L10上的輪廓圖象數(shù)據(jù)提供的與其對應(yīng)的原始輪廓線之間的失配象素的數(shù)目,并提供在導(dǎo)線L13上的第二次誤差及提供在導(dǎo)線14上的線段數(shù)據(jù)、即重建的輪廓線兩頂點(diǎn)的位置數(shù)據(jù)。參照圖4A,它表示對于線段AD的原始輪廓線100及示例的重建輪廓線200。在此情況下,第二次誤差相當(dāng)于在被輪廓線100及200所包圍的區(qū)域300中所包含的象素?cái)?shù)目。
在方式選擇單元155,將第二次誤差與預(yù)設(shè)閾值TH2相比較。如果第二次誤差小于預(yù)設(shè)閾值TH2,則該方式選擇單元155將來自量化單元130的量化的DST系數(shù)及來自于第二次誤差檢測單元150的相應(yīng)輪廓線的線段數(shù)據(jù)分別通過導(dǎo)線L16及L17提供給輪廓編碼器165;并提供第一許可信號(hào)給緩沖器110。在此情況下,由緩沖器110將用于待處理的下一線段的一對頂點(diǎn)例如D及C的線段數(shù)據(jù)提供給抽樣電路115;并重復(fù)上述處理過程直到輪廓圖象的所有線段均被處理為止,一要是線段的第二次誤差小于預(yù)設(shè)閾值TH2的話。
另一方面,如果對于重建的輪廓線的第二次誤差等于或大于閾值TH2,則根據(jù)本發(fā)明通過在原始輪廓線上再增加一個(gè)附加頂點(diǎn)使相應(yīng)于每個(gè)重建的輪廓線的原始輪廓線進(jìn)一步被分段。這就是,如果對于重建的輪廓線的第二次誤差等于或大于閾值TH2時(shí),方式選擇單元155就將用于線段頂點(diǎn)的線段數(shù)據(jù)及第二許可信號(hào)分別提供給曲率計(jì)算單元160及緩沖器110。在曲率計(jì)算單元160,對應(yīng)來自方式選擇單元155的線段數(shù)據(jù),計(jì)算原始輪廓線上每個(gè)被選擇的象素的曲率。
參見圖5,它表示根據(jù)本發(fā)明的在曲率計(jì)算單元160上進(jìn)行的曲率計(jì)算過程聽的明用圖。首先,如圖5所示,輪廓線上每第N個(gè)、例如第六個(gè)象素被選擇作為目標(biāo)象素,例如T1、T2或T3。然后通過每對相鄰的兩個(gè)目標(biāo)象素、如T1及T2劃一條直線。通過某一目標(biāo)象素的兩條直線形成的角度變化被規(guī)定為這個(gè)目標(biāo)象素的曲率。然后,曲率計(jì)算單元160將代表每個(gè)目標(biāo)象素位置及曲率的目標(biāo)象素信息提供給附加頂點(diǎn)選擇單元170。
附加頂點(diǎn)選擇單元170將來自曲率計(jì)算單元160的目標(biāo)象素的各曲率作出比較,并從它們中選擇出具有最大曲率的一個(gè)目標(biāo)象素、例如圖4A中所示的F,作為附加頂點(diǎn),并將代表該附加頂點(diǎn)位置的附加頂點(diǎn)信息提供給緩沖器110。該附加頂點(diǎn)信息被作為頂點(diǎn)數(shù)據(jù)存儲(chǔ)在緩沖器110中。因此,通過在兩個(gè)頂點(diǎn)、例如A及D之間增加例如一個(gè)附加頂點(diǎn)F,可將具有大的失配的一個(gè)復(fù)雜輪廓線,例如圖4A中所示的輪廓線100分成兩個(gè)不太復(fù)雜的輪廓線,如圖4B及圖4所示,它們可以通過DST被更精確地近似。
然后,響應(yīng)于第二許可信號(hào),緩沖器110將用于頂點(diǎn)A及F的線段數(shù)據(jù)提供給抽樣電路115;并對線段AF重復(fù)進(jìn)行上述的輪廓近似處理。
與此同時(shí),在輪廓編碼器165,通過使用例如JPEG(Joint Photographic Experts Group)的二進(jìn)制算術(shù)碼對導(dǎo)線L16上的每組量化的DST系數(shù)進(jìn)行編碼,而對導(dǎo)線L17上的線段數(shù)據(jù)通過使用例如固定長度碼無壓縮地進(jìn)行編碼,因?yàn)檫@些頂點(diǎn)很少相關(guān)。包括被編碼量化的DST系數(shù)及線段數(shù)據(jù)的編碼數(shù)字信號(hào)被傳輸?shù)揭粋€(gè)發(fā)送器,用于將其發(fā)送出去。
雖然本發(fā)明是相對特定的實(shí)施例作出描述的,但顯然對于熟悉本領(lǐng)域的技術(shù)人員而言,在不偏離以下權(quán)利要求書中所限定的本發(fā)明精神和范圍的情況下,可以作出各種變化及改型。
權(quán)利要求
1.一種用于視頻信號(hào)編碼器中的用于表示目標(biāo)輪廓圖象的輪廓近似方法,包括(a)確定輪廓圖象上的一些頂點(diǎn);(b)用多個(gè)直線段來適配該輪廓圖象,以提供輪廓圖象的多邊形近似,每個(gè)直線段連接兩個(gè)相鄰的頂點(diǎn);(c)提供一直線段兩頂點(diǎn)的位置作為線段數(shù)據(jù);(d)對于一直線段確定一些抽樣點(diǎn)并提供代表抽樣點(diǎn)位置的抽樣點(diǎn)信息,所述抽樣點(diǎn)將每條直線分成等長的小線段;(e)計(jì)算在直線段的每個(gè)抽樣點(diǎn)及頂點(diǎn)上的第一次誤差,該第一次誤差表示連接兩頂點(diǎn)的直線段與這兩頂點(diǎn)間輪廓線之間的距離;(f)將抽樣點(diǎn)及頂點(diǎn)上的第一次誤差變換成一組離散正弦變換系數(shù);(g)將每組離散正弦變換系數(shù)轉(zhuǎn)換成一組量化的變換系數(shù);(h)將該組量化的變換系數(shù)轉(zhuǎn)換成一組重建的第一次誤差;(i)基于每個(gè)直線段的線段數(shù)據(jù)、抽樣點(diǎn)信息及該組第一次誤差提供一重建的輪廓線;(j)計(jì)算第二次誤差,它是重建的輪廓線及其相應(yīng)的原始輪廓線之間的失配象素?cái)?shù)目;(k)將第二次誤差與一預(yù)定閾值相比較;(l)如果第二次誤差小于所述閾值,則對輪廓線的該組量化的變換系數(shù)及線段數(shù)據(jù)編碼;或如果第二次誤差等于大于所述閾值,則通過在該輪廓線上增加一個(gè)附加頂點(diǎn)使該輪廓線再分成一對新的分段輪廓線,并對相應(yīng)于每個(gè)新分段輪廓線的直線段重復(fù)步驟(c)至(l);及(m)對在步驟(a)中確定的頂點(diǎn)形成的所有直線段重復(fù)步驟(c)至(l)。
全文摘要
一種輪廓近似方法,基于輪廓圖像上像素的曲率,通過在復(fù)雜的輪廓線上增加附加的頂點(diǎn)來精確地重建目標(biāo)輪廓。將具有最大曲率的目標(biāo)像素選擇為附加頂點(diǎn)。
文檔編號(hào)G06T9/20GK1131875SQ9511645
公開日1996年9月25日 申請日期1995年9月7日 優(yōu)先權(quán)日1995年3月20日
發(fā)明者金鎮(zhèn)憲 申請人:大宇電子株式會(huì)社