專利名稱:利用基于特征點的運動估算編碼視頻信號的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于對視頻信號進行編碼的方法和裝置;更具體地,涉及一種用于利用基于改進的特征點的運動估算對數(shù)字視頻信號進行編碼的方法和裝置,由此有效地減少該數(shù)字視頻信號的傳送率并確保圖象質(zhì)量完好。
眾所周知,數(shù)字化的視頻信號的傳送能夠獲得比模擬信號的傳送更高質(zhì)量的視頻圖象。當包含一序列圖象“幀”的圖象信號被以數(shù)字形式表示時,就會產(chǎn)生大量的待傳輸?shù)臄?shù)據(jù),尤其是在高分辯率電視系統(tǒng)的情況下。然而,由于傳統(tǒng)發(fā)送信道的可用頻率帶寬有限,為了由此傳送大量的數(shù)字數(shù)據(jù),不可避免地要壓縮或減少傳輸?shù)臄?shù)據(jù)量。在各種視頻壓縮技術(shù)中,已知的最有效的是所謂的混合編碼技術(shù),該技術(shù)將時間和空間壓縮技術(shù)與統(tǒng)計編碼技術(shù)結(jié)合在一起。
大多數(shù)混合編碼技術(shù)使用一運動補償DPCM(差分脈沖編碼調(diào)制)、二維DCT(離散余弦變換)、DCT系數(shù)量化,和VLC(可變長編碼)。運動補償DPCM是一個估算一目標在當前幀和先前幀或?qū)韼?即參考幀)之間的運動、并根據(jù)該目標的運動流預測此當前幀以產(chǎn)生一代表當前幀與其預測值之間的差的差分信號的過程。此方法被描述在例如,Staffan Ericsson的“Fixed and Adaptive Predictors for Hybrid Predictive/Transform Coding”,IEEE Transactions on Communications,COM-33,第12期(1985年12月);與Ninomiya和Ohtsuka的“A Motion-Compensated Interframe Coding Scheme for TelvisionPictures”,IEEE Transactions on Communications,COM-30,第1期(1982年1月)。
減少或利用圖象數(shù)據(jù)間的空間冗余的二維DCT將一塊數(shù)字圖象數(shù)據(jù),例如一8×8象素的塊,轉(zhuǎn)換成一組變換系數(shù)數(shù)據(jù)。此技術(shù)被描述在Chen和Pratt的“Scene Adaptive Coder”,IEEE Transactions on Communications,COM-32,第3期(1984年3月)。通過用量化器、折線掃描器和VLC處理此變換系數(shù)數(shù)據(jù),被傳送的數(shù)據(jù)量可被有效地壓縮。
具體地,在運動補償DPCM中,根據(jù)估算當前和參考幀之間的運動從相應的參考幀數(shù)據(jù)預測當前幀數(shù)據(jù)。這種估算的運動可根據(jù)代表參考和當前幀之間象素的位移的二維運動矢量來描述。
有兩種基本方法來估算一目標的象素的位移一種是逐塊估算,而另一種是逐象素的方法。
在逐塊運動估算中,當前幀中的一塊和其參考幀中的塊進行比較直到確定了最佳匹配。由此,可以為被傳送的當前幀預計整個塊的幀間位移矢量(該矢量表示該塊象素在幀間移動了多少)。
此種塊匹配技術(shù)可被用在預測包含在視頻序列中的P和B幀,如公開于ITU Telecommunication StandardizationSector Study Group 15,Working Party 15/1 Expert′s Group on Very Low Bit Rate Visual Telephony的“Video Codec Test Model,TMN4 Rev1″,(1994年10月25日),其中P或預測幀表示從其先前幀(作為參考幀)預測的一幀,而B或雙向預測幀是從其先前和將來幀(作為參考幀)預測的。具體地,在對所謂的B幀編碼中,利用雙向運動估算技術(shù)以便向前和向后導出位移矢量,其中前向位移矢量是通過估算-目標在B幀和其先前內(nèi)部幀(I)或預測幀(P)(作為參考幀)之間的運動來獲得,而后向位移矢量是基于B幀和其將來幀I或P幀(作為參考幀)導出的。
然而,在逐塊運動估算中,在一塊的邊界處的分塊效應可能發(fā)生在一運動補償過程中;并且如果該塊中所有的象素不以同樣方式運動的話可能導致失真的估算,由此減低了整體圖象質(zhì)量。
另一方面,使用逐象素的方法,為每一個象素確定一位移。此技術(shù)可使更精確地估算該象素值,并且能夠輕易地處理尺寸變化(例如,變焦,垂直于圖象平面的運動)。然而,在逐象素方法中,因為在每一個象素處確定一運動矢量,實際上不可能向接收機傳送所有的運動矢量。
為消除處理由逐象素方法導致的多余或過多的傳送數(shù)據(jù)的問題而引入的技術(shù)之一是基于特征點的運動估算方法。
在基于特征點的運動估算技術(shù)中,一組被選擇的象素,即特征點的運動矢量被傳送至一接收器,其中每一個特征點被定義為能夠代表其相鄰象素的象素以便非特征點的運動矢量能夠在該接收機從這些特征點被恢復或逼近。在一共有未決的申請即美國序列號08/367,520(題為“Method and Apparatus for Encoding a Video Signal Using Pixel-by-Pixel Motion Estimation”)中公開的采用該基于特征點的運動估算的一編碼器中,首先從所有包含在先前幀中的象素選擇多個特征點。然后,確定被選的特征點的運動矢量,其中每一運動矢量代表先前幀中的一特征點和當前幀中的一相應匹配點,即一最相似象素之間的空間位移。具體地,通過使用一已知的塊匹配算法在當前幀內(nèi)的一搜索區(qū)中搜索每一特征點的匹配點,其中一特征點塊被定義為圍繞該被選擇的特征點的一塊;而搜索區(qū)被定義為圍繞相應特征點的位置的一預定區(qū)內(nèi)的一區(qū)域。
在這種情況下,最希望或方便的是在與被選的特征點相應的全部搜索區(qū)中找到唯一的最佳匹配特征點塊。然而,有時,在特征點匹配中可能有多個相同的最佳匹配特征點塊。結(jié)果,難于正確檢測具有此特征點塊和相應搜索區(qū)之間相關(guān)性的特征點的運動矢量。而且,如果不根據(jù)參考幀中的特征點和相應的匹配點,即當前幀中的一最相似點之間的空間位移確定搜索區(qū),可能引起失真的估算,由此減低了整體圖象質(zhì)量。
因此,本發(fā)明的一個月的是提供一種方法,用于有效地估算特征點的運動矢量,由此有效地減少具有良好圖象質(zhì)量的數(shù)字視頻信號的傳送率。
本發(fā)明的另一個目的是提供一種裝置,使用在視頻信號編碼系統(tǒng)中,用于利用基于一特征點的運動估算有效地估算運動矢量,由此有效地減少具有良好圖象質(zhì)量的數(shù)字視頻信號的傳送率。
本發(fā)明的另一目的是提供一種有選擇地利用基于特征點的運動估算和基于塊的運動估算的視頻信號編碼系統(tǒng),以由此改進整體圖象質(zhì)量。
根據(jù)本發(fā)明的一個方面,提供了一種方法,用于通過利用基于特征點的運動估算方法來檢測視頻信號的當前幀和參考幀之間的一組運動矢量,其中該參考幀包括一重建的參考幀和一初始的參考幀,該方法包括以下步驟(a)從包含在重建參考幀中的象素中選擇一組特征點,其中該組特征點形成一具有多個重疊多邊形的多邊網(wǎng);(b)基于該組特征點在當前幀上確定一組準特征點;(c)為該組準特征點分配一組初始運動矢量,其中每一初始運動矢量被置為(0,0);(d)指定一準特征點作為主準特征點,其中該主準特征點具有N個形成由連接該主準特征點和所述N個相鄰準特征點的線段定義的一主當前多邊形的相鄰準特征點,N為正整數(shù);(e)順序地將該主準特征點的初始運動矢量加至M個候選運動矢量以產(chǎn)生M個更新初始運動矢量,M是一正整數(shù),其中所述M個候選運動矢量覆蓋該主當前多邊形中的一預定區(qū)域,而所述相鄰特征點的初始運動矢量是固定的;(f)根據(jù)M個該主準特征點的已更新的初始運動矢量和所述N個該相鄰特征點的初始運動矢量中的每一個為包含在該主當前多邊形中的每一象素在初始參考幀上確定一預測的位置;(g)根據(jù)初始參考幀中的該預測位置為所述每一象素提供一預測象素值以形成M個預測的主當前多邊形;(h)計算當前多邊形和每一預測主當前多邊形之間的差以產(chǎn)生M個峰值信噪比(PSNR);(i)選擇一個已更新運動矢量作為一被選擇已更新運動矢量,該矢量使一預測主當前多邊形具有最大PSNR以用該被選擇的已更新運動矢量更新該主準特征點的初始運動矢量;(j)重復步驟(d)到(i)直到所有的初始運動矢量都被更新;(k)重復步驟(j)直到所述重復被執(zhí)行了預定次;及(n)將該組初始矢量設置為該組運動矢量,以由此確定該組運動矢量。
根據(jù)本發(fā)明的另一方面,提供了一種裝置,使用在一視頻編碼系統(tǒng)中,用于通過利用基于特征點的運動估算來檢測一組視頻信號的當前幀和參考幀之間的運動矢量,其中該參考幀包括一重建參考幀和一初始參考幀中,該裝置包括第一選擇裝置,用于從該重建參考幀中選擇一組象素作為一組特征點,其中該組特征點形成具有多個重疊多邊形的一多邊形網(wǎng);裝置,用于確定一組相應于該組特征點的當前幀上的準特征點;存儲裝置,用于存儲一組該組準特征點的初始運動矢量,其中每一初始運動矢量被置為(0,0);第二選擇裝置,用于從該組準特征點中選擇L個主準特征點,其中每一主準特征點具有N個相鄰準特征點,此N個相鄰準特征點形成了由連接該主準特征點和所述N個相鄰準特征點的線段定義的一非重疊的主當前多邊形,所述L和N是正整數(shù);加法器裝置,用于將每一主準特征點的初始運動矢量加至M個候選運動矢量以形成每一主準特征矢量的M個更新后的初始運動矢量,M是一正整數(shù),其中所述M個候選運動矢量覆蓋了每一非重疊主多邊形中的一預定區(qū)域,而每一主準特征點的相鄰特征點的初始運動矢量是固定的;裝置,用于根據(jù)每一更新的初始運動矢量和相應的相鄰準特征點的初始運動矢量為包含在每一非重疊主當前多邊形中的每一象素在初始參考幀上確定一預測位置;裝置,用于根據(jù)此預測的位置從初始參考幀中獲得一預測的象素值以由此為每一非重疊主當前多邊形形成M個預測的主當前多邊形;裝置,用于計算每一非重疊主當前多邊形和相應的M個預測主當前多邊形之間的差以為每一非重疊主當前多邊形產(chǎn)生M個峰值信噪比;第三選擇裝置,用于為每一主準特征點選擇一更新的初始矢量作為被選擇的已更新的初始運動矢量,其使該預測的主當前多邊形具有最大的PSNR,以產(chǎn)生L個被選擇的已更新初始運動矢量;裝置,用于以相應的被選擇的更新的初始運動矢量為存儲在存儲器裝置中的每一主準特征點更新該初始運動矢量;及裝置,用于當更新了所有初始運動矢量預定次數(shù)時,從該存儲器裝置中取出該組初始運動矢量作為該組運動矢量。
根據(jù)本發(fā)明的另一方面,提供了一種裝置,用于對一數(shù)字視頻信號編碼以減少該數(shù)字視頻信號的傳送率,所述數(shù)字視頻信號具有包括一當前幀和一參考幀的多個幀,該裝置包括第一存儲器裝置,用于存儲該數(shù)字視頻信號的一重建的參考幀;第二存儲器裝置,用于存儲該數(shù)字視頻信號的一初始參考幀;第一運動補償裝置,用于通過利用基于塊的運動估算來檢測當前幀和重建的參考幀之間的多個運動矢量,并用于根據(jù)運動矢量數(shù)和重建的參考幀產(chǎn)生第一預測當前幀;第二運動補償裝置,用于從該重建的參考幀中選擇一組特征點以通過利用基于特征點的運動補償檢測當前幀和初始參考幀之間相應于該組特征點的一組運動矢量,并用于根據(jù)該組運動矢量和重建的參考幀產(chǎn)生一第二預測幀;裝置,用于有選擇性地將運動矢量數(shù)和第一預測當前幀或該組運動矢量和第二預測當前幀提供作為被選運動矢量和預測當前幀;
裝置,用于變換編碼(transform-coding)代表預測當前幀和當前幀之間的差的一誤差信號以產(chǎn)生一變換編碼誤差信號;及裝置,用于統(tǒng)計地編碼該變換編碼誤差信號和被選擇的運動矢量以產(chǎn)生一被發(fā)送的已編碼視頻信號。
本發(fā)明的以上和其它目的和特征將通過對下述參考附圖的優(yōu)選實施例的描述中變得顯而易見,其中
圖1是一具有根據(jù)本發(fā)明的基于特征點的運動補償裝置的圖象信號編碼裝置;圖2A和2b是說明二幀序列的原理圖。
圖3是描述了圖1所示的運動補償裝置的詳細方框圖;圖4描述了圖3所示的運動矢量搜索塊的示例性方框圖;圖5A和5B提供了當前幀和重建的先前幀的示例性圖;圖6A至6E說明用于顯示根據(jù)本發(fā)明的特征點選擇操作的示意圖;及圖7A和7B說明了用于顯示根據(jù)本發(fā)明的運動矢量搜索過程的示意圖。
參考圖1,其示出了根據(jù)本發(fā)明的圖象編碼系統(tǒng)的方框圖。該圖象編碼系統(tǒng)包括幀重組電路101、減法器102、圖象信號編碼器105、圖象信號解碼器113、加法器115、第一存儲器裝置120、第二存儲器裝置130、平均信息量編碼器107和運動補償裝置150。
一輸入數(shù)字視頻信號包括如圖2A和2B所示的二幀(或圖象)序列第一幀序列具有一內(nèi)部(I)幀(I1)、3個雙向預測幀(B1,B2。B3)和3個預測幀(P1,P2,P3);而第二幀序列有一內(nèi)部(I)幀(I1)、3個前向預測幀(F1,F(xiàn)2,F(xiàn)3)和3個預測幀(P1,P2,P3)。因此,該圖象編碼系統(tǒng)包括二序列編碼方式第一序列編碼方式和第二序列編碼方式。在第一序列編碼方式中,線路L17通過第一切換器103與線路11耦合,而包括了I1、B1、P1、B2、P2、B3、P3的第一幀序列經(jīng)第一切換器103施于幀重組電路101,該幀重組電路101用于將其重組成例如I1、P1、B1、P2、B2、P3、B3的重組數(shù)字視頻信號,以便雙向?qū)С鯞幀的預測幀信號。被重組的數(shù)字視頻信號隨后經(jīng)線路L18、L12、L11分別被提供給第二切換器104a、第一存儲器裝置120和運動補償裝置150。在第二序列編碼方式中,線路L17經(jīng)第一切換器103與線路L10耦合,而第二幀序列I1、F1、P1、F2、P2、F3、P3經(jīng)第一切換器103被耦合至分別在線路L12、L1、L18上的第一存儲器裝置120、運動補償裝置150和第二切換器104a。第一切換器103由來自例如是一微處理器(未示出)的傳統(tǒng)系統(tǒng)控制器的序列方式控制信號CS1激發(fā)。如由上述可看到的,由于在第一序列編碼方式中有重組延時,第二序列編碼方式可被有利地用作如電視電路和電路會議裝置之類的應用中的低延時方式。
如圖1所示,圖象編碼系統(tǒng)包括第二切換器104a和第三切換器104b,它們用于有選擇地執(zhí)行二幀編碼方式內(nèi)部幀編碼方式和幀間編碼方式。如本專業(yè)內(nèi)熟知的,由來自系統(tǒng)控制器的幀方式控制信號CS2同時激發(fā)第二和第三切換器104a和104b。
在內(nèi)部幀編碼方式中,經(jīng)線路L14,內(nèi)部幀I1作為當前幀信號直接與圖象信號編碼器105耦合,其中例如通過利用離散余弦變換(DCT)和任何公知的量化方法將當前幀信號編碼成該組量化變換系數(shù)。內(nèi)部幀I1也作為一初始參考幀存儲在第一存儲器裝置120的幀存儲器121中,其中第一存儲器裝置120包括分別通過線路L2、L3和L4連至運動補償裝置150的3個幀存儲器121、122和123。然后,量化變換系數(shù)被發(fā)送至平均信息量編碼器107和圖象信號解碼器113。在平均信息量編碼器107,通過利用例如可變長編碼技術(shù),來自圖象信號編碼器105的量化變換系數(shù)被一起編碼并發(fā)送至一發(fā)送器(未示出)用于從其發(fā)送。
另一方面,通過利用反量化和反離散余弦變換,圖象信號解碼器113將來自圖象信號解碼器105的量化變換系數(shù)轉(zhuǎn)換回重建的內(nèi)部幀信號。來自圖象信號解碼器113的該重建的內(nèi)部幀信號作為一重建的參考幀隨后被存在第二存儲器裝置130的幀存儲器131,其中第二存儲器裝置130包括分別經(jīng)線路L它能用于直接觀看或投影。該顯示系統(tǒng)包括一顯示平板,該顯示平板具有一顯示表面,該表面由數(shù)據(jù)存貯或顯示元件的陣列構(gòu)成,這些顯示元件遍布觀察區(qū)域。每個顯示元件包括集中體積的離化氣體混合物,它具有減少的衰減時間,象氦和碳的混合物,還包括光電材料,象絲狀液晶,它們共同作用調(diào)制外界產(chǎn)生的光,該光穿過顯示元件定位位置的電光材料區(qū)域。
第二個實施例包括用作存儲器件尋址結(jié)構(gòu),模擬信息可以分別電子寫入或電子讀出到或從存儲器中。該存儲器件包括數(shù)據(jù)存貯或存儲元件的陣列,每一個元件包括具有減少衰減時間的離化氣體混合物的集中體積,象氦和碳,以及一種介電材料,象玻璃、塑料或光電導體。離化氣體混合物和介電材料共同作用提供一種對存儲元件的尋址方法,從而讀出已生成在存儲元件中的信號,不考慮獲得該信號的方式。
對兩個實施例,存貯元件被存置成行列。在第一實施例中,行代表視頻信息或數(shù)據(jù)的一線,而在第二實施例中,行代表一套離散量的模擬信息或數(shù)據(jù)。(在二實施例中所尋址的信息在此之后稱為“數(shù)據(jù)”)列接收數(shù)據(jù),并且數(shù)據(jù)選通電路一行一行地以行掃描方式對列尋址。
第一實施例的顯示平板或第二實施例的存儲器件包括第一和第二相互間隔的襯底,它們面對面相互對置。許多不交迭的電導體沿第一方向伸延,沿著第一襯底的內(nèi)表面,這些導體形成用來把數(shù)據(jù)驅(qū)動信號施加到它們上面的列電極。許多不交迭的溝道刻入第二襯底的內(nèi)表面,以和第一方向正交的方向沿內(nèi)表面伸延。第一和第二方向最好是分別與垂直和水平方向?qū)R?;鶞孰娢浑姌O和行編碼器105的量化變換系數(shù)和經(jīng)線路L20來自運動補償裝置150的運動矢量一起編碼,并傳送至一發(fā)送器(未示出)用于從其發(fā)送。
另一方面,圖象信號解碼器113通過利用反量化和反離散余弦變換將來自圖象信號解碼器105的量化變換系數(shù)轉(zhuǎn)換回重建誤差信號。
來自圖象信號解碼器113和重建誤差信號和線路L16上的來自運動補償裝置150的預測的當前幀信號經(jīng)切換器104b在加法器115被加在一起以由此經(jīng)線路L′1提供一重建參考幀信號被作為先前幀存儲在第二幀存儲器130中。幀存儲器裝置130包括,例如,如圖1所示串聯(lián)的3個幀存儲器131、132和133。那就是,來自加法器115的重建的幀信號被首先存儲在例如幀存儲器131,然后經(jīng)線路L′2被提供至運動補償裝置150,并且如果來自加法器115的下一重建幀信號被輸入至第一幀存儲器131,則就被在逐幀的基礎(chǔ)上變換到第二幀存儲器132。只要執(zhí)行圖象編碼工作就順序地重復此過程。
參考圖2A和2B,其中提供了說明上述第一和第二幀序列的示意圖。如圖所示,當當前幀是預測幀P1時,通過將重建的內(nèi)部幀I1用作自第二幀存儲器130恢復的參考幀就在逐塊地基礎(chǔ)上獲得了一組運動矢量SMV1。以同樣的方式,利用參考幀P1和P2獲得當前幀P2和P3的那組運動矢量SMV2和SMV3。
當當前幀是雙向預測幀B1時,通過利用自第二幀存儲器130恢復的重建的參考幀I1和自第一存儲器120恢復的初始參考幀I1從特征點獲得一組前向運動矢量FMV1。以同樣的方式,通過利用初始參考幀P1和重建參考幀P1獲得當前幀B1的那組后向運動矢量BMV1。之后,圖象編碼系統(tǒng)在該組前向運動矢量FMV1和該組后向運動矢量BMV1之間選擇并傳送相應的運動矢量。
當當前幀是前向預測幀F(xiàn)1時,通過利用自第一存儲器裝置120恢復的初始參考幀I1和自第二存儲器130恢復的重建參考幀F(xiàn)1從特征點獲得一組前向運動矢量FMV2。
如上可看到的,對于運動估算和補償,包含在第一和第二幀序列中的幀被如表I和表II所示地安排在第一和第二幀裝置120和130。
表中○表示用于前向運動估算的一幀,而△表示用于后向運動估算的一幀。
如上可看到的,使用基于塊的運動估算,通過利用基于DCT的預測編碼(所謂的TMN4)重建了預測幀P1、P2和P3;根據(jù)本發(fā)明通過利用基于改進的特征點的運動補償-離散余弦變換(MC-DCT)重建了插入幀,即雙向預測幀B1、B2、B3或前向預測幀F(xiàn)1、F2、F3。
參考圖3,其說明了圖1所示的運動補償裝置150的細節(jié)。如圖3所示,運動補償裝置150包括輸入選擇器154、155和156,基于塊的運動補償電路151,基于第一特征點的運動補償電路152,基于第二特征點運動補償電路153和輸出選擇器157和158。
利用一傳統(tǒng)塊匹配算法的基于塊的運動補償電路151用于為每一預測幀P1、P2、P3檢測一組運動矢量,并為相應的預測幀產(chǎn)生一預測當前幀。因此,當預測幀P1如表I和II所說的被作為當前幀施于基于塊的運動補償路151時,選擇器154用于將線路L′2上的重建內(nèi)部幀I1作為參考幀耦合到基于塊的運動補償電路151。在基于塊的運動補償電路151,經(jīng)過其估算一組運動矢量并重建一預測當前幀信號。之后,該組運動矢量和該預測的當前幀信號分別經(jīng)輸出選擇器157和158被耦合在線路L20和L30上。
利用下述的仿射變換的基于第一特征點的運動補償電路152用于為每一雙向預測幀B1、B2、B3或前向預測幀F(xiàn)1、F2和F3檢測一組前向估算運動矢量,并用于為相應的雙向或前向預測幀產(chǎn)生一預測當前幀。因此,當線路L1上的雙向預測幀B1作為當前幀被施于基于特征點的運動補償電路152時,如表I所示,選擇器155用于將線路L2上的初始內(nèi)部幀I1作為初始參考幀耦合到基于特征點的運動補償電路152。選擇器156用于將線路L′2上的重建內(nèi)部幀I1作為重建參考幀耦合至基于特征點的運動補償電路152以產(chǎn)生預測幀。在基于第一特征點的運動補償電路152,通過利用該重建的和該初始的參考幀估算一組前向估算運動矢量,又通過利用該重建的參考幀重建一預測當前幀信號。之后,該組前向估算運動矢量和預測當前幀信號被分別經(jīng)輸出選擇器157和158耦合至線路L20和L30上,其中通過來自系統(tǒng)控制器(未示出)的控制信號CS5和CS6控制輸出選擇器157和158。
利用下述的仿射變換的基于第二特征點的運動補償電路153用于為每一雙向預測幀B1、B2、B3檢測那組后向估算運動矢量并用于為相應的雙向預測幀產(chǎn)生一預測當前幀。因此,當雙向預測幀B1被作為當前幀施于基于第二特征點的運動補償電路153時,線路L1上的初始預測幀P1被作為初始參考幀耦合至基于特征點的運動補償電路153,而線路L′2上的重建的預測幀P1被作為重建的參考幀耦合至基于第二特征點的運動補償電路153。在基于第二特征點的運動補償電路153,通過利用此重建的和初始的參考幀獲得一組后向估算運動矢量,又通過利用此重建的參考幀建立一預測的當前幀信號。之后,該組后向估算運動矢量和預測當前幀信號被分別經(jīng)輸出選擇器157和158耦合到線路L20和L30上。
參考圖4,其示出圖3所示的基于特征點的運動補償電路的細節(jié)。來自第二幀存儲器130的線路L′2上的一重建的參考幀信號被輸入至用于產(chǎn)生一組特征點的特征點選擇塊210和運動補償塊240。該組特征點然后被耦合至運動矢量搜索塊230和運動補償塊240。運動矢量搜索塊230接收該初始參考幀和當前幀并用于為該組特征點產(chǎn)生一組運動矢量。該組運動矢量被耦合至用于根據(jù)該組運動矢量和該組特征點產(chǎn)生一預測當前幀的運動補償塊240。
在特征點選擇塊210,該組特征點被從包含在被重建的參考幀中的多個象素中選出,每一特征點根據(jù)一象素的位置被定義。圖5A和5B示出了一示例當前幀和一重建參考幀。
參考圖6A至6E,示出了說明根據(jù)本發(fā)明的特征點選擇過程的解釋圖。如圖6A所示,通過利用公知的索伯邊緣檢測器(Sobel edge detector)(見A.K.Jain的“Fundamentals of Digital Image Processing”,1989,Pretice-Hall International),在圖5B所示的重建參考幀
中檢測出邊緣。從索伯(Sobel)操作器來的輸出
與一預定閾值Te比較。根據(jù)本發(fā)明該預定閾值Te最好選為6。如果自索伯操作器的輸出值
(x,y)|小于該預定閾值Te,則輸出值
被置為0。否則,輸出值
可不改變。因此,圖6A中所示的一邊緣圖象信號eg(x,y)被定義如下
在本發(fā)明的一優(yōu)選實施例中,如圖6B所示通過使用利用具有多個重疊六邊形的一六邊形網(wǎng)格的網(wǎng)格技術(shù)來確定特征點。如圖6C所示,由連接7個網(wǎng)點611至617的線段定義一六邊形610。包含一六邊形610中的網(wǎng)點617包圍著比四邊形更多的相鄰網(wǎng)點611至616,由此使該特征點更有效地組構(gòu)起來。六邊形610包括6個非重疊三角形621至626,而網(wǎng)點611至617是三角形621至626的頂點。六邊形610的分辨率由線HH和HV定義,在本發(fā)明中HH和HV最為分別被置成13和10。
參考圖6D,對于每一網(wǎng)點,例如G1至G4,設置非重疊搜索范圍,例如SR1至SR4。如果圍繞設邊緣點(例如E7)的8個象素的總和值最大,位于搜索范圍SR1中的一邊緣點(例如E7)變成了網(wǎng)格(例如G1)的一特征因此,特征點Di可被表示如下Di={(x,y)|MaxΣk=-11Σl=-11EG(x+k,y+l)}Eq,2]]>其中EG(x,y)是包含在搜索區(qū)SRi中的邊緣點的值,而i是一正整數(shù)。
通過利用等式2確定此組特征點,其中該組特征點包括覆蓋在一邊緣點上的一網(wǎng)點,位于非覆蓋搜索區(qū)SRi并具有其圍繞的象素點的最大和值的一邊緣點,而所述的網(wǎng)點沒有包含在其非覆蓋搜索區(qū)中的邊緣點。
如果多于一個邊緣點具有相同最大和值,那么將最靠近該網(wǎng)點的邊緣點選作特征點。
當確定了該組特征點時,圖6B所示的六邊形網(wǎng)格就被形成為圖6E所示的一六邊形特征點網(wǎng)。確定了該六邊形特征點網(wǎng)之后,該組特征點就與用于檢測它的一組運動矢量的圖4所示的運動矢量搜索塊230相耦合。根據(jù)本發(fā)明,利用仿射變換的一收斂過程被用于搜索該組運動矢量。
參考圖7A和7B,示出一說明根據(jù)本發(fā)明的運動矢量搜索過程的示例性圖。通過利用該組特征點在當前幀中確定一組準特征點,其中在重建的參考幀中的每一特征點都與當前幀中的相應準特征點相匹配。對于每一準特征點,例如D1至D30,初始運動矢量被置為(0,0)。
當準特征點(例如D7)隨之被分配或設置為被用于估算其運動矢量的處理的一主準特征點時,一主當前多邊形700被用于此收斂處理。主當前多邊形700被連接主準特征點D7和圍繞該主準特征點D7的其相鄰的準特征點(例如D1至D6)的線段所定義。當前多邊形700包括六個非重疊三角形701至706,其中該主準特征點位于該三角形的公共頂點上。
然后預定數(shù)目的候選運動矢量被順序地加至準特征點D7的初始運動矢量上,其中該預定數(shù)目的候選運動矢量最好水平地或垂直地從0至±7的范圍內(nèi)選擇,而候選運動矢量D7Y1是不允許的,圖為三角形701是反的。候選運動矢量D7X1被加至主準特征點D7的初始矢量而不改變其相鄰的特征點D1至D6的初始運動矢量,以便產(chǎn)生一更新的初始運動矢量D7D’7。因此,更新后的初始運動矢量D7D’7代表主準特征點D7和候選準特征點D’7之間的位移。
通過利用該更新的初始運動矢量和相鄰準特征點的初始矢量在初始參考幀上確定包含在主當前多邊形700中的每一象素的一預定位置。然后,包含在從屬當前多邊形700中的每一象素位置在相應于該預測位置的初始參考幀上被用一象素值插值以形成一預測主當前多邊形。根據(jù)本發(fā)明的優(yōu)選實施例,在具有3個特征點(例如D1,D2,D7)作其頂點的每一三角形(例如701)處用公知的仿射變換執(zhí)行該過程。仿射變換如下定義x′y′=abcd·xy+efEq,3]]>其中,(x,y)代表在該預測的主當前多邊形內(nèi)的一象素的x和y座標;(x’,y’)表示在初始參考幀上的一預測位置的座標;而a至f是仿射變換系數(shù)。
利用三個準特征點(例如D1、D2、D7)的運動矢量唯一地確定6個映射參數(shù)a,b,c,d,e,f。一旦知道了仿射變換系數(shù),三角形701中的每一剩余象素就能映射到初始參考幀中的一個位置上。因為在多數(shù)情況下獲得的初始參考幀的預測位置(x’,y’)不是一組整數(shù),所以用公知的雙線性(bilinear)插值技術(shù)來計算預測位置(x’,y’)處的插值灰度級。仿射映射過程獨立地用于三角形701至706。然后獲得候選運動矢量的預測主當前多邊形。
然后將預測主當前六邊形和當前六邊形700比較,并檢查是否預測的從屬當前六邊形和當前六邊形的峰值信噪比增加了。如果增加了,就用更新的初始運動矢量D7D’7更新主準特征點D7的初始運動矢量(0,0)。
對于剩余候選運動矢量,重復此過程。在一次遞歸中,在包含在所述當前幀中的所有準特征點也執(zhí)行上述過程。
參考圖7B,假設完成了一次遞歸,準特征點D7被設置為一主準特征點;而相鄰準特征點D1至D6的更新的初始運動矢量是D1D’2,D2D’2,D3D’3,D4D’4,D5D’5,和D6D’6;并且,以類似的方式,預定候選運動矢量被順序地加至主準特征點D7D’7的初始矢量。例如,候選運動矢量D’7X2被加至主準特征點D7D’7的初始矢量,而不改變其6個相鄰特征點的初始運動矢量D1D’1,D2D’2,D3D’3,D4D’4,D5D’5,D6D’6。因此,更新的初始運動矢量變成D7X2。如上所述,預定數(shù)目的候選運動矢量最好被水平地或垂直地在0至±7的范圍內(nèi)選出,而候選運動矢量D7Y2是不允許的,因為三角形701是反的。
包含在主當前多邊形700的中的每一象素的一預測位置通過利用更新的運動矢量D7X2和相鄰準特征點的初始矢量(D1D’1,D2D’2,D3D’3,D4D’4,D5D’5,D6D’6)被在初始參考幀上確定。之后,包含在主當前多邊形700中的每一象素位置被用一相應于預測位置的初始參考幀上的象素值插值,以形成預測主當前多邊形700’(由圖7B所示的一虛線代表)。
然后,將預測主當前六邊形700’和當前六邊形比較,且檢查是否預測主當前六邊形和當前六邊形的PSNR增加了。如果增加了,則用更新的初始運動矢量D7X2更新主準特征點的初始運動矢量D7D’7。
對于剩余的候選運動矢量,重復此過程。在第二次遞歸中,在包含在所述當前幀中的所有準特征點也執(zhí)行上述過程。
此過程也相對于所有準特征點執(zhí)行幾次直到達到了收斂。最好是,此過程的遞歸設為5次,因為在大多數(shù)情況下,在第5次遞歸之前該運動矢量收斂。
如從上述可看到的,在收斂過程中,每一特征點的位移被給予其運動矢量,而利用它們的頂點特征點的位移獨立地仿射變換每一六邊形的6個三角形。如果該位移提供了更好的PSNR,則順序地更新此主特征點的運動矢量。因此,在匹配過程中,收斂過程非常有效地確定盡可能地接近于具有變焦、旋轉(zhuǎn)或縮放目標的初始圖象的預測圖象。
根據(jù)本發(fā)明的優(yōu)選實施例,對于硬件實現(xiàn),本過程可用三個步驟完成。形成非重疊主當前多邊形的、圖7A所示的表示為D1、D3和D5的準特征點被首先用6個相鄰特征點(D2,D7,D6,D10,D11,D17),(D2,D4,D7,D12,D13,D19),(D4,D6,D7,D8,D9,D15)中的每一個處理。下一步對點D2、D4和D6重復同樣的過程。在最后一步,最后處理剩余的點D7、D8和D9。
回過來參考圖4,然后將所獲得的所有準特征點的運動矢量作為所有特征點的那組運動矢量耦合至用作通過利用重建的參考幀來產(chǎn)生一預測的當前幀信號的運動補償塊240。那就是說,通過仿射變換利用重建的先前幀和所獲得的運動矢量獲得了預測的當前幀信號。從上面可看出,這是利用用于運動矢量搜索過程的仿射變換的相同映射,除了使用重建的參考幀而不是初始參考幀,因為一解碼器系統(tǒng)(未示出)只有一個重建的參考幀。另一方面,因為使用此基于特征點的運動補償?shù)木幋a系統(tǒng)產(chǎn)生只具有運動矢量的相當好的圖象,當前幀和預測的當前幀之間的差或誤差信號可以不發(fā)送。
如從以上看到的,容易理解利用基于特征點的運動補償?shù)谋景l(fā)明的編碼系統(tǒng)能夠獲得可靠的一組運動矢量,由此改進編碼效率。
基于特征點的運動補償算法是基于圖象特征的,且仿射變換被用于補償目標的旋轉(zhuǎn)和變焦。在大多數(shù)情況下,該運動補償圖象具有較高的PSNR和好的主觀質(zhì)量。如果在大范圍運動中此運動預測失效,則誤差圖象能利用具有大量化步長的DCT被編碼和發(fā)射。具體地,通過利用本發(fā)明的24Kbps的編碼系統(tǒng)獲得好的主觀質(zhì)量。另外,由于特征點的位置逐幀改變,本發(fā)明的編碼器系統(tǒng)將既在編碼器又在解碼器中存在的重建的先前幀作為參考幀使用,以便不必發(fā)送特征點的位置信息。進一步地,用于編碼系統(tǒng)中的象素方向的運動補償產(chǎn)生比基于塊的運動補償更好的主觀質(zhì)量,因為它可以通過利用只具有運動矢量的仿射變換來補償目標的變焦、旋轉(zhuǎn)和縮放。
雖然參考了具體實施例對本發(fā)明顯示和描述,但對本專業(yè)人士顯而易見的是在不背離所附權(quán)利要求中所定義的本發(fā)明的精神和范圍的前提下可作許多更改和變化。
表I
表II
權(quán)利要求
1.一種方法,用于通過利用基于特征點的運動估算方法來檢測視頻信號的當前幀和參考幀之間的一組運動矢量,其中該參考幀包括一重建的參考幀和一初始的參考幀,該方法包括以下步驟(a)從包含在重建參考幀中的象素中選擇一組特征點,其中該組特征點形成一具有多個重疊多邊形的多邊網(wǎng);(b)基于該組特征點在當前幀上確定一組準特征點;(c)為該組準特征點分配一組初始運動矢量,其中每一初始運動矢量被置為(0,0);(d)指定一準特征點作為主準特征點,其中該主準特征點具有N個形成由連接該主準特征點和所述N個相鄰準特征點的線段定義的一主當前多邊形的相鄰準特征點,N為正整數(shù);(e)順序地將該主準特征點的初始運動矢量加至M個候選運動矢量以產(chǎn)生M個更新初始運動矢量,M是一正整數(shù),其中所述M個候選運動矢量覆蓋該主當前多邊形中的一預定區(qū)域,而所述相鄰特征點的初始運動矢量是固定的;(f)根據(jù)M個該主準特征點的已更新的初始運動矢量和所述N個該相鄰特征點的初始運動矢量中的每一個為包含在該主當前多邊形中的每一象索在原始參考幀上確定一預測的位置;(g)根據(jù)初始參考幀中的該預測位置為所述每一象素提供一預測象素值以形成M個預測的主當前多邊形;(h)計算當前多邊形和每一預測主當前多邊形之間的差以產(chǎn)生M個峰值信噪比(PSNR);(i)選擇一個已更新運動矢量作為一被選擇的已更新運動矢量,該矢量使一預測主當前多邊形具有最大PSNR以用該被選擇的已更新運動矢量更新該主準特征點的初始運動矢量;(j)重復步驟(d)到(i)直到所有的初始運動矢量都被更新;(k)重復步驟(j)直到所述重復被執(zhí)行了預定次;及(n)將該組初始矢量設置為該組運動矢量,以由此確定該組運動矢量。
2.如權(quán)利要求1所述的方法,其中步驟(a)包括下列步驟(a1)檢測重建的參考幀的邊緣圖象,其中邊緣圖象eg(x,y)被定義如下
其中
代表參考幀,
表示自公知的索伯運算器的一輸出;而Te是一預定閾值;(a2)在邊緣圖象上建立多邊形網(wǎng)格,其中該多邊形網(wǎng)格包括多個網(wǎng)點以形成多個重疊的多邊形;(a3)為每一網(wǎng)點分配一非重疊搜索區(qū);及(a4)確定一組特征點,其中該組特征點包括重疊一邊緣點的一網(wǎng)點,所述邊緣點位于非重疊搜索區(qū)并具有其圍繞象素點的最大和值,且所述網(wǎng)點沒有包含在其非重疊搜索區(qū)中的邊緣點。
3.如權(quán)利要求2所述的方法,其中當在搜索區(qū)中有多于一個邊緣點具有相同的最大和值時,該組特征點包括離該多邊形網(wǎng)最近的一邊緣點。
4.如權(quán)利要求3所述的方法,其中該多邊形是一個六邊形,而N是6。
5.如權(quán)利要求4所述的方法,其中該主當前六邊形包括由連接該主準特征點和其相鄰準特征點的線段定義的6個三角形;而步驟(f)和(g)是通過利用公知的仿射變換執(zhí)行的。
6.如權(quán)利要求5所述的方法,其中圍繞象素的點數(shù)是8;預定重復次數(shù)是5;而預定閾值是6。
7.如權(quán)利要求6所述的方法,其中該預定區(qū)域的范圍是水平方向上和垂直方向上0至±7。
8.如權(quán)利要求7所述的方法,其中特征點Di被定義如下Di={(x,y)|MaxΣk=-11Σl=-11EG(x+k,y+1)}]]>其中EG(x,y)是包含在該搜索區(qū)中的邊緣點的值,而i是一正整數(shù)。
9.一種裝置,使用在一視頻編碼系統(tǒng)中,用于通過利用基于特征點的運動估算來檢測一組視頻信號的當前幀和參考幀之間的運動矢量,其中該參考幀包括一重建參考幀和一初始參考幀中,該裝置包括第一選擇裝置,用于從該重建參考幀中選擇一組象素作為一組特征點,其中該組特征點形成具有多個重疊多邊形的一多邊形網(wǎng);裝置,用于確定一組相應于該組特征點的當前幀上的準特征點;存儲裝置,用于存儲一組該組準特征點的初始運動矢量,其中每一初始運動矢量被置為(0,0);第二選擇裝置,用于從該組準特征點中選擇L個主準特征點,其中每一主準特征點具有N個相鄰準特征點,此N個相鄰準特征點形成了由連接該主準特征點和所述N個相鄰準特征點的線段定義的一非重疊的主當前多邊形,所述L和N是正整數(shù);加法器裝置,用于將每一主準特征點的初始運動矢量加至M個候選運動矢量以形成每一主準特征矢量的M個更新后的初始運動矢量,M是一正整數(shù),其中所述M個候選運動矢量覆蓋了每一非重疊主多邊形中的一預定區(qū)域,而每一主準特征點的相鄰特征點的初始運動矢量是固定的;裝置,用于根據(jù)每一更新的初始運動矢量和相應的相鄰準特征點的初始運動矢量為包含在每一非重疊主當前多邊形中的每一象素在初始參考幀上確定一預測位置;裝置,用于根據(jù)此預測的位置從初始參考幀中獲得一預測的象素值以由此為每一非重疊主當前多邊形形成M個預定的主當前多邊形;裝置,用于計算每一非重疊主當前多邊形和相應的M個預測主當前多邊形之間的差以為每一非重疊主當前多邊形產(chǎn)生M個峰值信噪比(PSNR);第三選擇裝置,用于為每一主準特征點選擇一更新的初始矢量作為被選擇的已更新的初始運動矢量,其使該預測的主當前多邊形具有最大的PSNR,以產(chǎn)生L個被選擇的已更新初始運動矢量;裝置,用于以相應的被選擇的更新的初始運動矢量為存儲在存儲器裝置中的每一主準特征點更新該初始運動矢量;及裝置,用于當更新了所有初始運動矢量預定次數(shù)時,從該存儲器裝置中取出該組初始運動矢量作為該組運動矢量。
10.如權(quán)利要求9所述的裝置,其中第一選擇裝置包括裝置,用于檢測重建的參考幀的邊緣圖象,其中邊緣圖象eg(x,y)被定義如下
其中
代表參考幀,
表示自公知的索伯運算器(Sobel operator)的一輸出;而Te是一預定閾值;裝置,用于在邊緣圖象上建立多邊形網(wǎng)格,其中該多邊形網(wǎng)格包括多個網(wǎng)點以形成多個重疊的多邊形;裝置,用于為每一網(wǎng)點建立一非重疊搜索區(qū);及裝置,用于確定一組特征點,其中該組特征點包括重疊一邊緣點的一網(wǎng)點,所述邊緣點位于非重疊搜索區(qū)中并具有其圍繞象素點的最大和值,且所述網(wǎng)點沒有包含在其非重疊搜索區(qū)中的邊緣點。
11.如權(quán)利要求10所述的裝置,其中當在搜索區(qū)中有多于一個邊緣點具有相同的最大和值時,該組特征點包括離該多邊形網(wǎng)最近的一邊緣點。
12.如權(quán)利要求11所述的裝置,其中該多邊形是一個六邊形,而N是6。
13.如權(quán)利要求12所述的裝置,其中該主當前六邊形包括由連接該主準特征點和其相鄰準特征點的線段定義的6個三角形;且用于確定預測位置的裝置包括一公知的仿射變換器。
14.如權(quán)利要求13所述的裝置,其中圍繞象素的點數(shù)是8;預定重復次數(shù)是5;而預定閾值是6。
15.如權(quán)利要求14所述的裝置,其中該預定區(qū)域的范圍是水平方向上和垂直方向上0至±7。
16.一種裝置,用于對一數(shù)字視頻信號編碼以減少該數(shù)字視頻信號的傳送率,所述數(shù)字視頻信號具有包括一當前幀和一參考幀的多個幀,該裝置包括第一存儲器裝置,用于存儲該數(shù)字視頻信號的一重建的參考幀;第二存儲器裝置,用于存儲該數(shù)字視頻信號的一初始參考幀;第一運動補償裝置,用于通過利用基于塊的運動估算來檢測當前幀和重建的參考幀之間的多個運動矢量,并用于根據(jù)運動矢量數(shù)和重建的參考幀產(chǎn)生第一預測當前幀;第二運動補償裝置,用于從該重建的參考幀中選擇一組特征點以通過利用基于特征點的運動補償檢測當前幀和初始參考幀之間相應于該組特征點的一組運動矢量,并用于根據(jù)該組運動矢量和重建的參考幀產(chǎn)生一第二預測幀;裝置,用于有選擇性地將運動矢量數(shù)和第一預測當前幀或該組運動矢量和第二預測當前幀提供作為被選運動矢量和預測當前幀;裝置,用于變換編碼代表預測當前幀和當前幀之間的差的一誤差信號以產(chǎn)生一變換編碼誤差信號;及裝置,用于統(tǒng)計地編碼該變換編碼誤差信號和被選擇的運動矢量以產(chǎn)生一被發(fā)送的已編碼視頻信號。
17.如權(quán)利要求16所述的裝置,其中第二運動補償裝置包括第一選擇裝置,用于從該重建參考幀中選擇一組象素作為一組特征點,其中該組特征點形成具有多個重疊多邊形的一多邊形網(wǎng);裝置,用于確定一組相應于該組特征點的當前幀上的準特征點;存儲裝置,用于存儲一組該組準特征點的初始運動矢量,其中每一初始運動矢量被置為(0,0);第二選擇裝置,用于從該組準特征點中選擇L個主準特征點,其中每一主準特征點具有N個相鄰準特征點,此N個相鄰準特征點形成了由連接該主準特征點和所述N個相鄰準特征點的線段定義的一非重疊的主當前多邊形,所述L和N是正整數(shù);加法器裝置,用于將每一主準特征點的初始運動矢量加至M個候選運動矢量以形成每一主準特征矢量的M個更新后的初始運動矢量,M是一正整數(shù),其中所述M個候選運動矢量覆蓋了每一非重疊主多邊形中的一預定區(qū)域,而每一主準特征點的相鄰特征點的初始運動矢量是固定的;裝置,用于根據(jù)每一更新的初始運動矢量和相應的相鄰準特征點的初始運動矢量為包含在每一非重疊主當前多邊形中的每一象素在初始參考幀上確定一預測位置;裝置,用于根據(jù)此預測的位置從初始參考幀中獲得一預測的象素值以由此為每一非重疊主當前多邊形形成M個預定的主當前多邊形;裝置,用于計算每一非重疊主當前多邊形和相應的M個預測主當前多邊形之間的差以為每一非重疊主當前多邊形產(chǎn)生M個峰值信噪比(PSNR′S);第三選擇裝置,用于為每一主準特征點選擇一更新的初始矢量作為被選擇的已更新的初始運動矢量,其使該預測的主當前多邊形具有最大的PSNR,以產(chǎn)生L個被選擇的已更新初始運動矢量;裝置,用于以相應的被選擇的更新的初始運動矢量為存儲在存儲器裝置中的的每一主準特征點更新該初始運動矢量;及裝置,用于當更新了所有初始運動矢量預定次數(shù)時,從該存儲器裝置中取出該組初始運動矢量作為該組運動矢量。
18.如權(quán)利要求17所述的裝置,其中第一選擇裝置包括裝置,用于檢測重建的參考幀的邊緣圖象,其中邊緣圖象eg(x,y)被定義如下
其中
代表參考幀,
表示自公知的索伯運算器(Sobel operator)的一輸出;而Te是一預定閾值;裝置,用于在邊緣圖象上建立多邊形網(wǎng)格,其中該多邊形網(wǎng)格包括多個網(wǎng)點以形成多個重疊的多邊形;裝置,用于為每一網(wǎng)點建立一非重疊搜索區(qū);及裝置,用于確定一組特征點,其中該組特征點包括重疊一邊緣點的一網(wǎng)點,所述邊緣點位于非重疊搜索區(qū)中并具有其圍繞象素點的最大和值,且所述網(wǎng)點沒有包含在其非重疊搜索區(qū)中的邊緣點。
19.如權(quán)利要求18所述的裝置,其中該多邊形是六邊形,N是6,該主當前六邊形包括由連接該主準特征點和其相鄰準特征點的線段定義的6個三角形;且用于確定預測位置的裝置包括一公知的仿射變換器。
20.如權(quán)利要求19所述的裝置,其中圍繞象素的點數(shù)是8;預定重復次數(shù)是5;而預定閾值是6。
21.如權(quán)利要求20所述的裝置,其中該預定區(qū)域的范圍是水平方向上和垂直方向上0至±7。
全文摘要
一種裝置,用于對一數(shù)字視頻信號(217)編碼以減少該數(shù)字視頻信號的傳送率,該裝置包括基于特征點的運動補償電路(150),用于從重建的參考幀中選擇一組特征點以通過利用基于特征點的運動估算來檢測當前幀和初始參考幀之間與該組特征點相應的一組運動矢量,并用于基于該組運動矢量和重建的參考幀來產(chǎn)生一第二預測幀。該基于特征點的運動估算利用了一收斂過程,其中每一特征點的位移被給予它的運動矢量,而每一個六邊形的6個三角形被利用其頂點特征點的位移獨立地進行了仿射變換。如果該位移提供了更好的峰值信噪比,則該主特征點的運動矢量被順序地更新。因此本發(fā)明的收斂過程在匹配處理中非常有效地確定盡可能接近于具有目標的變焦、旋轉(zhuǎn)或縮放的初始圖象的預測圖象。
文檔編號H04N7/32GK1178057SQ95197782
公開日1998年4月1日 申請日期1995年5月6日 優(yōu)先權(quán)日1995年3月18日
發(fā)明者丁海默, 李敏燮 申請人:大宇電子株式會社