視頻編碼器的運(yùn)動估計(jì)方法及系統(tǒng)的制作方法

文檔序號：7653234閱讀：272來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：視頻編碼器的運(yùn)動估計(jì)方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及視頻編碼系統(tǒng)。具體地說，涉及利用運(yùn)動補(bǔ)償預(yù)計(jì)來壓縮視頻序列的系統(tǒng)。

圖1和圖2是利用運(yùn)動補(bǔ)償預(yù)計(jì)的系統(tǒng)的原理圖。圖1說明具有運(yùn)動估計(jì)塊的編碼器10，圖2說明對應(yīng)的解碼器30。以下概述在這種系統(tǒng)中的運(yùn)動補(bǔ)償預(yù)計(jì)。
在一般的視頻序列中，連續(xù)幀內(nèi)容的更改在很大程度上是場景運(yùn)動的結(jié)果。此運(yùn)動可以是因攝像機(jī)運(yùn)動或因場景中呈現(xiàn)對象的運(yùn)動所造成的。因此，通常的視頻序列具有相當(dāng)大的時(shí)間相關(guān)性特征，這種相關(guān)性沿運(yùn)動軌道最強(qiáng)。視頻序列的高效壓縮需要開發(fā)此特性。
視頻補(bǔ)償(MC)預(yù)計(jì)是一項(xiàng)廣為認(rèn)可的壓縮技術(shù)。它利用了這樣一個(gè)事實(shí)在典型的視頻序列中，特定幀的像素(pel)值可以使用其他某幅已經(jīng)編碼并傳送的幀的像素值來預(yù)計(jì)(給定了這兩幀之間的運(yùn)動軌道)。
以下參照圖1和2來描述運(yùn)動補(bǔ)償系統(tǒng)。運(yùn)動補(bǔ)償視頻編碼器的工作原理是將預(yù)計(jì)錯(cuò)誤En(x，y)、也就是稱為當(dāng)前幀的已編碼幀In(x，y)與預(yù)計(jì)幀Pn(x，y)之間的差最小化En(x，y)＝In(x，y)-Pn(x，y) (1)預(yù)計(jì)幀Pn(x，y)使用表示為Rn(x.y)的參考幀像素值和當(dāng)前幀與參考幀之間像素的運(yùn)動矢量、使用以下等式來構(gòu)建Pn(x，y)＝Rn[x+Δx(x，y)，y+Δy(x，y)](2)參考幀Rn(x，y)的幀信息先前已被編碼并傳送，以便可以在解碼器中重新構(gòu)建它。因而，它可以是正被用于編碼幀之前的一幀，它同時(shí)存在編碼器10和解碼器30的幀存儲器中。所述一對值[Δx(x，y)，Δy(x，y)]表示當(dāng)前幀中位置(x，y)處像素的運(yùn)動矢量。Δx(x，y)和Δy(x，y)分別是該像素水平和垂直位移值。運(yùn)動矢量由編碼器10中運(yùn)動域估計(jì)塊12計(jì)算，如圖1所示。當(dāng)前幀所有像素的運(yùn)動矢量集[Δx(.)，Δy(.)]被稱為運(yùn)動矢量域，它在運(yùn)動補(bǔ)償預(yù)計(jì)塊16中被用來計(jì)算預(yù)計(jì)幀Pn(x，y)之前、在運(yùn)動域編碼塊14中計(jì)算出來。運(yùn)動矢量域也被傳送至解碼器30。
再來看圖1，減法器18根據(jù)等式1來確定預(yù)計(jì)幀和已編碼幀In(x，y)之間的預(yù)計(jì)誤差En(x，y)。一旦計(jì)算出來，預(yù)計(jì)誤差En(x，y)被在預(yù)計(jì)誤差編碼塊20中壓縮，產(chǎn)生壓縮的預(yù)計(jì)誤差，表示為，開將它發(fā)送至解碼器30。壓縮過程通常會產(chǎn)生一些信息丟失。因此，壓縮的預(yù)計(jì)誤差在預(yù)計(jì)誤差解碼塊22中被解碼，以便在編碼器10中使用它來產(chǎn)生參考幀Rn(x，y)，它對應(yīng)于在解碼器30中產(chǎn)生的參考幀Rn(x，y)。在編碼器10中，這是通過在加法器24中將解碼的預(yù)計(jì)誤差En(x，y)和預(yù)計(jì)幀Pn(x，y)組合以便產(chǎn)生參考幀Rn(x，y)來完成的。參考幀Rn(x，y)存儲于編碼器10的幀存儲器26中。
來自運(yùn)動域編碼塊14的運(yùn)動信息和來自預(yù)計(jì)誤差編碼塊20的預(yù)計(jì)誤差信息在多路復(fù)用塊28中被組合在一起。
圖3顯示解碼器30。多路分解器32將預(yù)計(jì)誤差信息和運(yùn)動信息分離。預(yù)計(jì)誤差信息提供給預(yù)計(jì)誤差解碼塊34，運(yùn)動信息提供給運(yùn)動補(bǔ)償預(yù)計(jì)塊36。運(yùn)動補(bǔ)償預(yù)計(jì)塊36使用運(yùn)動信息和存儲在解碼器30幀存儲器38中的參考幀Rn(x，y)來重新構(gòu)建預(yù)計(jì)幀Pn(x，y)。然后通過在加法器40中將預(yù)計(jì)幀加到接收的預(yù)計(jì)誤差來重構(gòu)編碼的當(dāng)前幀的像素，即I~n(x,y)=Rn[x+Δx(x.y),y+Δy(x,y)]+E~n(x,y)---(3)]]>
由于幀中的像素?cái)?shù)量非常大，為每幀傳送單獨(dú)的運(yùn)動矢量效率很差。作為替代，在大多數(shù)視頻編碼方案中，當(dāng)前幀被劃分成較大的圖像區(qū)段，因而區(qū)段的所有運(yùn)動矢量可以由較少系數(shù)描述。取決于當(dāng)前幀劃分成區(qū)段的方法，可區(qū)分為兩類運(yùn)動補(bǔ)償編碼器1.基于區(qū)塊的編碼器，其當(dāng)前幀被劃分成固定和預(yù)知的區(qū)塊(參見圖3a)，例如按照國際標(biāo)準(zhǔn)ISO/IEC MPEG-1或ITU-T H.261，在編解碼器中分為16×16像素區(qū)塊；以及2.基于區(qū)段(基于區(qū)域)的編碼器，其當(dāng)前幀被劃分為任意形狀的區(qū)段(參見圖3b)，例如由分段算法所獲得。例如，參考Centrede Morphologie Mathematique(CMM)，“多標(biāo)準(zhǔn)區(qū)域結(jié)合的分段算法”，文檔SIM(95)19，COST 211ter Project Meeting，1995年5月，及P.Cicconi和H.Nicolas的“圖像序列編碼的高效基于區(qū)域運(yùn)動估計(jì)及面向?qū)ΨQ的分段”，IEEE Transaction on Circuits and Systems forVideo Technology，卷4，第三號，1994年6月，第357-364頁。
實(shí)際上，區(qū)段至少包括幾十個(gè)像素。為緊湊地表示這些像素的運(yùn)動矢量，較好的方法是用帶有幾個(gè)系數(shù)的函數(shù)來描述它們的值。這樣的函數(shù)稱為運(yùn)動矢量域模型。
幾乎所有通常使用的運(yùn)動矢量域模型都是加法運(yùn)動模型。運(yùn)動補(bǔ)償視頻編碼方案可根據(jù)以下一般等式定義圖像區(qū)段的運(yùn)動矢量Δx(x,y)=Σi=0N-1aifi(x,y)---(4)]]>Δy(x,y)=Σi=0M-1bigi(x,y)---(5)]]>其中系數(shù)ai和bi稱為運(yùn)動系數(shù)，它們被傳送至解碼器。函數(shù)fi和gi稱為運(yùn)動域基本函數(shù)，它們?yōu)榫幋a器和解碼器所共知。
為了將發(fā)送運(yùn)動系數(shù)至解碼器所需的信息量最小化，并不傳送所有區(qū)段的所有運(yùn)動系數(shù)。例如，這可以是在可忽略某些運(yùn)動系數(shù)而不會導(dǎo)致重大誤差的情況。代之以，某些區(qū)段的某些運(yùn)動系數(shù)被傳送，而不傳送其他系數(shù)。
多項(xiàng)式運(yùn)動模型是廣為使用的運(yùn)動模型族。(參見，例如在90年P(guān)roc.Picture Coding Symposium中H.Nguyen和E.Dubois的“圖像編碼的運(yùn)動信息表示”，馬薩諸塞州劍橋，1990年5月26-18，第841-845頁，以及Centre de Morphoiogie Mathematique(CMM)的“多標(biāo)準(zhǔn)區(qū)域結(jié)合的分段算法”，文檔SIM(95)19，COST 21 lter ProjectMeeting，1995年5月)。
運(yùn)動矢量的值通過函數(shù)來描述，它是二維多項(xiàng)式函數(shù)的線性組合。平移運(yùn)動模型是最簡單的模型，僅需兩個(gè)系數(shù)來描述每個(gè)區(qū)段的運(yùn)動矢量。運(yùn)動矢量的值由以下等式給出Δx(x，y)＝a0Δy(x，y)＝b0(6)此模型應(yīng)用于國際標(biāo)準(zhǔn)(ISO MPEG-1、MPEG-2、MPEG-4、ITU-T推薦H.261和H.263)，以描述8×8和16×16區(qū)塊的運(yùn)動。兩個(gè)其他廣泛使用的模型是由以下等式給出的仿射運(yùn)動模型Δx(x，y)＝a0+a1x+a2yΔy(x，y)＝b0+b1x+b2y(7)以及由下面等式給出的二次運(yùn)動模型Δx(x，y)＝a0+a1x+a2y+a3xy+a4x2+a5y2Δy(x，y)＝b0+b1x+b2y+b3xy+b4x2+b5y2(8)仿射運(yùn)動模型給出了運(yùn)動系數(shù)個(gè)數(shù)和預(yù)計(jì)效能之間非常簡便的平衡。它僅用幾個(gè)系數(shù)就能表示出一些通?，F(xiàn)實(shí)生活的運(yùn)動類型，如平移、旋轉(zhuǎn)、變焦及剪切。
二次運(yùn)動模型提供很好的預(yù)計(jì)效能，但在編碼中它沒有仿射模型通用，因?yàn)樗褂幂^多運(yùn)動系數(shù)，而預(yù)計(jì)效能并不太好。此外，使用二次模型比使用仿射模型估計(jì)運(yùn)動在計(jì)算上代價(jià)更高。
運(yùn)動估計(jì)塊計(jì)算給定區(qū)段Sk的像素運(yùn)動矢量[Δx(x，y)，Δy(x，y)]，這可以將區(qū)段中一定量的預(yù)計(jì)誤差最小化。一個(gè)有意義的加法預(yù)計(jì)誤差計(jì)算形式如下Σ(xi,yi)&Element;Skpih(|In(x,y)-Rn(x+Δx(x,y),y+Δy(x,y))|)---(9)]]>其中Pi的值是標(biāo)量常數(shù)，|.|表示絕對值，h是個(gè)非遞減函數(shù)。一個(gè)非常通用的計(jì)量是平方預(yù)計(jì)誤差，在這種情況下Pi＝1，h(.)＝(.)2Σ(xi,yi)&Element;Sk(In(x,y)-Rn(x+Δx(x,y),y+Δy(x,y)))2---(10)]]>等式(9)是個(gè)帶有許多變元的高度非線性函數(shù)，因而沒有實(shí)踐裝置可以在可接受的時(shí)間內(nèi)總是找到等式(9)的絕對最小值。因此，運(yùn)動估計(jì)技術(shù)的區(qū)分點(diǎn)在于使所選預(yù)計(jì)誤差計(jì)量最小化的算法。等式(10)一般用作運(yùn)動估計(jì)中的代價(jià)函數(shù)。
以下討論先前所知的運(yùn)動估計(jì)技術(shù)。
一種技術(shù)是完全搜索。在此技術(shù)中，代價(jià)函數(shù)的值被計(jì)算為所有可能的允許運(yùn)動系數(shù)值的組合(受限于可以表示運(yùn)動系數(shù)的范圍和精度)。選擇使代價(jià)函數(shù)最小化的那些運(yùn)動系數(shù)值來表示運(yùn)動矢量域。
因計(jì)算的負(fù)擔(dān)，完全搜索技術(shù)通常僅用來估計(jì)平移運(yùn)動模型的運(yùn)動系數(shù)，不能直接一般化用于其他運(yùn)動模型。在直接一般化中，算法的計(jì)算復(fù)雜性隨用以表示運(yùn)動矢量域的運(yùn)動系數(shù)個(gè)數(shù)而指數(shù)地增加。
作為可供選擇的方法，可以使用高斯-牛頓迭代(或差別優(yōu)化方案)運(yùn)動估計(jì)。這些方案概括在93年P(guān)roc.Picture Coding Symposium中H.Sanson的“數(shù)字電視序列編碼的基于區(qū)域運(yùn)動估計(jì)和補(bǔ)償”，瑞士洛桑，1993年3月17-19，以及C.A.Papadoupoulos和T.G.Clarkson的“使用二次幾何變換的運(yùn)動補(bǔ)償”，IEEE Transaction onCircuits and Systems for Video Technology，卷5，第四號，1995年8月，第319-331頁。這些技術(shù)使用著名的高斯-牛頓函數(shù)最小化算法來將代價(jià)函數(shù)(9)最小化，它是作為運(yùn)動系數(shù)函數(shù)選擇的預(yù)計(jì)誤差計(jì)量。
此算法假設(shè)要最小化的函數(shù)可以由自變量的二次函數(shù)來局部估計(jì)。則第n次迭代步驟包括1.使用第n-1次步驟生成的運(yùn)動系數(shù)，用實(shí)際函數(shù)的第一和第二導(dǎo)數(shù)計(jì)算適當(dāng)?shù)亩魏瘮?shù)，2.計(jì)算最小化近似函數(shù)的系數(shù)向量，并將結(jié)果分配給n次步驟的運(yùn)動系數(shù)。
與高斯-牛頓算法相關(guān)的主要問題是它僅覆蓋局部最小值，除非初始運(yùn)動系數(shù)位于全局最小值的吸引域中。因此，必須為高斯-牛頓算法提供足夠好的實(shí)際最優(yōu)初始估計(jì)。通常使用兩種不同技術(shù)來改善高斯-牛頓算法的收劍。
1.使用多解析度圖像金字塔的運(yùn)動估計(jì)，2.使用運(yùn)動模型的層次性提高級別的運(yùn)動估計(jì)。
使用多解析度圖像金字塔的運(yùn)動估計(jì)技術(shù)是基于這樣的假設(shè)對當(dāng)前幀和參考幀進(jìn)行低通濾波將消除局部極小值，并有助于算法收劍為全局最小值。運(yùn)動估計(jì)首先在參考幀和當(dāng)前幀的低通濾波(平滑)版上進(jìn)行，其結(jié)果以輸入信號的形式、使用較不平滑的圖像饋送到運(yùn)動估計(jì)階段。最終估計(jì)在非平滑圖像上進(jìn)行。此類的某些變量附加減少了低通濾波圖像的采樣，以減少計(jì)算的數(shù)量。有關(guān)此技術(shù)的示例，參見93年P(guān)roc.Picture Coding Symposium中H.Sanson的“數(shù)字電視序列編碼的基于區(qū)域運(yùn)動估計(jì)和補(bǔ)償”，瑞士洛桑，1993年3月17-19，以及P.J.Burt的“作為高效計(jì)算結(jié)構(gòu)的金字塔”，它發(fā)表在“多解析度圖像處理與分析”，ed.Rosenfeld，Springer Verlag，1984，第6-35頁。
但是，低通濾波圖像并不一定要消除局部最小值。此外，這可能轉(zhuǎn)移全局最小值的位置。
比較起來，使用層次性提高運(yùn)動模型級別的運(yùn)動估計(jì)技術(shù)使用了以下假設(shè)1.復(fù)雜的運(yùn)動模型可以用較低次的運(yùn)動模型粗估。
2.此粗估是對更復(fù)雜運(yùn)動模型系數(shù)的迭代搜索的較好初始推測。
最通常的層次開始于平移模型(兩個(gè)系數(shù))，然后繼續(xù)以簡化線性模型(對應(yīng)于平移、旋轉(zhuǎn)及變焦物理運(yùn)動，有4個(gè)系數(shù))，最后結(jié)束于完全線性模型(6個(gè)系數(shù))。這樣的層次可見于P.Cicconi和H.Nicolas的“圖像序列編碼的高效基于區(qū)域運(yùn)動估計(jì)及面向?qū)ΨQ的分段”，IEEE Transaction on Circuits and Systems for VideoTechnology，卷4，第三號，1994年6月，第357-364頁，以及Proc.1994 International Conference on Acoustics，Speech and SignalProcessing中H.Nicolas和C.Labit的“圖像序列編碼的使用確定性松弛方案的基于區(qū)域運(yùn)動估計(jì)”，第III265-268頁。
這些假設(shè)在某些條件下可以運(yùn)用得非常好。但是，收劍為局部最小值常常是一個(gè)問題，尤其是當(dāng)粗估表現(xiàn)得非常差的情況下。
現(xiàn)有的系統(tǒng)，如以上概述的那些，受限于計(jì)算復(fù)雜性和視頻壓縮效能之間關(guān)系所帶來的不利。也就是，在一方面，編碼器將要求運(yùn)動估計(jì)塊具有很高的計(jì)算復(fù)雜性，以確定將所選預(yù)計(jì)誤差量度(9)最小化因而取得適當(dāng)?shù)囊曨l壓縮效能的運(yùn)動系數(shù)。通常，因達(dá)成此解決方案所需的計(jì)算量巨大，這種情況下這樣的運(yùn)動估計(jì)塊起到了整體編碼器計(jì)算復(fù)雜性的瓶頸的作用。
在另一方面，若計(jì)算復(fù)雜性得到減少，這將導(dǎo)致預(yù)計(jì)效能、從而視頻壓縮效能的降低。因?yàn)檫\(yùn)動估計(jì)的預(yù)計(jì)效能嚴(yán)重影響編碼器的總體壓縮效能，對于運(yùn)動估計(jì)算法來說，具有高預(yù)計(jì)效能(也就是低預(yù)計(jì)誤差)、而復(fù)雜性又相對較低是關(guān)鍵。
要保持低復(fù)雜性，運(yùn)動估計(jì)算法將對圖像數(shù)據(jù)、運(yùn)動及預(yù)計(jì)誤差作出假設(shè)。這些假設(shè)統(tǒng)計(jì)上設(shè)得越多、并且假設(shè)越是健壯，算法就越好。不同的假設(shè)集通常引出不同的最小化技術(shù)。
根據(jù)本發(fā)明的第一方面，提供一種用于對視頻幀序列進(jìn)行運(yùn)動補(bǔ)償編碼的編碼器，它包括用于存儲參考幀的存儲器裝置；以及用于至少使用參考幀估計(jì)當(dāng)前幀中像素的運(yùn)動的運(yùn)動域估計(jì)裝置，其中，運(yùn)動域估計(jì)裝置使用先前對當(dāng)前幀的至少一個(gè)像素估計(jì)得到的預(yù)計(jì)運(yùn)動系數(shù)來估計(jì)當(dāng)前幀中至少一個(gè)其他像素的運(yùn)動系數(shù)。
本發(fā)明利用了當(dāng)進(jìn)入運(yùn)動估計(jì)階段時(shí)已經(jīng)具有的運(yùn)動信息。此附加運(yùn)動信息可以從相鄰區(qū)段預(yù)計(jì)，或從對與要估計(jì)其運(yùn)動的像素重疊的主片段的較早的運(yùn)動估計(jì)繼承。
運(yùn)動域估計(jì)裝置最好通過使用先前對至少一個(gè)相鄰像素估計(jì)的預(yù)計(jì)運(yùn)動系數(shù)集來對至少一個(gè)像素計(jì)算運(yùn)動系數(shù)。這可以使用多個(gè)相鄰像素。在這種情況下，它可以使用預(yù)計(jì)運(yùn)動系數(shù)的平均集，該平均集從先前對多個(gè)相鄰像素估計(jì)的運(yùn)動信息中平均得到。
當(dāng)應(yīng)用于像素時(shí)，術(shù)語“相鄰”指鄰近的像素，其中一個(gè)像素的至少一個(gè)像素直接與另一個(gè)像素的至少一個(gè)像素靠近或重疊。
編碼器最好包括分段裝置，用以將接收的幀分為多個(gè)像素。分段裝置可以為主像素導(dǎo)出初始運(yùn)動系數(shù)。
所述像素最好是區(qū)段。
在一個(gè)實(shí)施例中，編碼器包括兩個(gè)單獨(dú)的運(yùn)動估計(jì)器，一個(gè)運(yùn)動估計(jì)器用以基于預(yù)計(jì)的運(yùn)動系數(shù)來估計(jì)運(yùn)動系數(shù)，另一個(gè)運(yùn)動估計(jì)器用以基于初始運(yùn)動系數(shù)估計(jì)運(yùn)動系數(shù)。若預(yù)計(jì)運(yùn)動系數(shù)和初始運(yùn)動系數(shù)同時(shí)可用，則兩個(gè)運(yùn)動估計(jì)器可同時(shí)估計(jì)運(yùn)動系數(shù)。在這種情況下，編碼器中的選擇裝置可以選擇來自這兩個(gè)運(yùn)動估計(jì)器中任一個(gè)的運(yùn)動系數(shù)用于對當(dāng)前幀進(jìn)行編碼。然而，若僅有一個(gè)運(yùn)動系數(shù)集可用，而另一個(gè)運(yùn)動估計(jì)器的系數(shù)集卻不可用，則一個(gè)運(yùn)動估計(jì)器估計(jì)運(yùn)動系數(shù)。
本發(fā)明能夠使用各種具有比較簡單的運(yùn)動估計(jì)方法的運(yùn)動估計(jì)器的組合，它們依賴不同假設(shè)，而非一個(gè)高度復(fù)雜的方法依賴一個(gè)假設(shè)。
編碼器最好確定與當(dāng)前選擇的運(yùn)動估計(jì)方法所估計(jì)的運(yùn)動系數(shù)相關(guān)的預(yù)計(jì)誤差是否超過預(yù)定閾值，并且如果超過，它順序地選擇后續(xù)的運(yùn)動估計(jì)方法。
編碼器最好包括具有各不相同的復(fù)雜性的一系列運(yùn)動估計(jì)方法。該系列可以包括含有零運(yùn)動模型、平移運(yùn)動模型及仿射運(yùn)動模型在內(nèi)的各個(gè)層次。
編碼器最好包括一系列最小化器，包括區(qū)段匹配最小化器、高斯-牛頓最小化器及準(zhǔn)牛頓最小化器。
本發(fā)明最好能夠在健壯性各異的統(tǒng)計(jì)上有效假設(shè)之間動態(tài)切換。這樣，它能夠以相對較小的復(fù)雜性取得統(tǒng)計(jì)上的低誤差。
編碼器最好包括用于對當(dāng)前幀進(jìn)行二次抽樣、以產(chǎn)生二次抽樣后的幀并且用于將二次抽樣后的幀轉(zhuǎn)發(fā)給運(yùn)動模型系列的裝置。二次抽樣的裝置可以包括一系列二次抽樣器，其二次抽樣因子各異。
編碼器還可以包括控制裝置，若與當(dāng)前選擇的運(yùn)動估計(jì)器單元所估計(jì)的運(yùn)動矢量域相關(guān)的預(yù)計(jì)誤差超過預(yù)定閾值，它可以用來選擇并使用該系列中后續(xù)的運(yùn)動模型?？刂蒲b置可以被用來在最小化期間根據(jù)預(yù)計(jì)誤差的改變選擇二次抽樣的量。
編碼器最好包括接收裝置，用以接收要被運(yùn)動編碼的當(dāng)前幀。
根據(jù)第二方面，本發(fā)明提供一種編解碼器，它包括根據(jù)本發(fā)明第一方面的編碼器以及解碼器。
根據(jù)第三方面，本發(fā)明提供一種移動終端，它包括根據(jù)本發(fā)明第一方面的編碼器。
根據(jù)第四方面，本發(fā)明提供一種數(shù)據(jù)通信網(wǎng)絡(luò)，它包括根據(jù)本發(fā)明第一方面的編碼器。
根據(jù)第五方面，本發(fā)明提供一種用于對視頻幀序列進(jìn)行運(yùn)動補(bǔ)償編碼的方法，它包括以下步驟存儲參考幀；至少使用所述參考幀估計(jì)當(dāng)前幀中像素的運(yùn)動；以及把先前對當(dāng)前幀的至少一個(gè)像素估計(jì)得到的預(yù)計(jì)運(yùn)動系數(shù)集用于估計(jì)當(dāng)前幀中至少一個(gè)其他像素的運(yùn)動系數(shù)集。
以下僅以示例方式參考附圖描述本發(fā)明的實(shí)施例，附圖中圖1顯示用于視頻幀運(yùn)動補(bǔ)償編碼的編碼器；圖2顯示用于視頻幀運(yùn)動補(bǔ)償編碼的解碼器；圖3(a)顯示用于基于區(qū)塊的運(yùn)動補(bǔ)償?shù)漠?dāng)前幀的分割；圖3(b)顯示用于基于區(qū)段的運(yùn)動補(bǔ)償?shù)漠?dāng)前幀的分割；圖4顯示根據(jù)本發(fā)明的用于視頻幀運(yùn)動補(bǔ)償編碼的編碼器；圖5顯示根據(jù)本發(fā)明實(shí)施例的運(yùn)動估計(jì)系統(tǒng)；圖6顯示圖5運(yùn)動估計(jì)系統(tǒng)中出現(xiàn)的運(yùn)動估計(jì)塊；圖7顯示圖6運(yùn)動估計(jì)塊中出現(xiàn)的二次抽樣塊；圖8是圖6運(yùn)動估計(jì)塊中出現(xiàn)的運(yùn)動模型選擇器框圖；圖9是圖6運(yùn)動估計(jì)塊中出現(xiàn)的代價(jià)函數(shù)最小化器框圖；圖10是全動感估計(jì)塊的結(jié)果驗(yàn)證塊的最佳實(shí)現(xiàn)方案流程圖；以及圖11是精細(xì)運(yùn)動估計(jì)塊的結(jié)果驗(yàn)證塊的最佳實(shí)現(xiàn)方案流程圖。
根據(jù)本發(fā)明的編碼器10顯示于圖4中。此圖與圖1相似，并且適用前面的描述。圖4的編碼器與對應(yīng)于圖2的解碼器結(jié)合工作。以下將描述圖4。
在本發(fā)明實(shí)施例中使用了運(yùn)動域編碼塊14中的基于區(qū)塊的分段，以下將說明它。最終分段由16×16像素的宏區(qū)塊和8×8像素的子區(qū)塊所組成。在估計(jì)了宏區(qū)塊的運(yùn)動之后，預(yù)計(jì)誤差將在運(yùn)動域估計(jì)塊12中分析，并在運(yùn)動域估計(jì)塊12中作出決定是否將宏區(qū)塊分割成四塊8×8的子區(qū)塊。若發(fā)生分割，宏區(qū)塊的運(yùn)動系數(shù)保留在運(yùn)動域估計(jì)塊12的運(yùn)動系數(shù)存儲器中，并用作8×8運(yùn)動估計(jì)中的初始運(yùn)動系數(shù)。這將在以下說明。不管分割是否發(fā)生，宏區(qū)塊的最終運(yùn)動系數(shù)被輸出到運(yùn)動域編碼塊14。運(yùn)動域編碼塊14最終決定要傳送的運(yùn)動模型，是否使用單個(gè)16×16區(qū)塊或四個(gè)8×8區(qū)塊來描述此(16×16)宏區(qū)塊及運(yùn)動系數(shù)的編碼。在此實(shí)施例中使用了相同的運(yùn)動估計(jì)系統(tǒng)，而與被估計(jì)運(yùn)動區(qū)塊的大小無關(guān)。
圖1和圖4之間的主要差別是運(yùn)動域編碼塊14所產(chǎn)生的運(yùn)動信息被回饋到運(yùn)動域估計(jì)塊12。此運(yùn)動信息同時(shí)包括初始運(yùn)動系數(shù)和與相對于參考幀中區(qū)段的當(dāng)前幀中區(qū)段的運(yùn)動相關(guān)的預(yù)計(jì)運(yùn)動系數(shù)。此反饋由數(shù)字30表示。以下將說明運(yùn)動域估計(jì)塊如何使用運(yùn)動信息。
運(yùn)動域估計(jì)塊在圖5中顯示。所述塊包括兩個(gè)運(yùn)動估計(jì)塊、即全動感估計(jì)塊41和精細(xì)運(yùn)動估計(jì)塊42以及運(yùn)動系數(shù)存儲器43。為獲得對上述16×16宏區(qū)塊運(yùn)動估計(jì)的良好起點(diǎn)，首先將在全動感估計(jì)塊41中估計(jì)32×32像素區(qū)塊的運(yùn)動。作為結(jié)果的運(yùn)動系數(shù)被保存于運(yùn)動系數(shù)存儲器43中，并被取出和用作分割先前估計(jì)區(qū)塊所創(chuàng)建區(qū)段(16×16宏區(qū)塊或8×8子區(qū)塊)的初始運(yùn)動系數(shù)。全動感估計(jì)塊41根據(jù)當(dāng)前幀和較早的參考幀之間的差別來計(jì)算運(yùn)動系數(shù)。但是，若有初始運(yùn)動系數(shù)可用，則全動感估計(jì)塊41可包括它們以作為計(jì)算當(dāng)前幀區(qū)段運(yùn)動系數(shù)的基礎(chǔ)。精細(xì)運(yùn)動估計(jì)塊42根據(jù)對先前已經(jīng)計(jì)算的當(dāng)前幀區(qū)段所預(yù)計(jì)的運(yùn)動系數(shù)來計(jì)算當(dāng)前幀的一個(gè)區(qū)段的運(yùn)動系數(shù)。
若運(yùn)動域編碼塊14沒有先前預(yù)計(jì)的運(yùn)動系數(shù)可供運(yùn)動域估計(jì)塊12用作預(yù)計(jì)運(yùn)動系數(shù)的基礎(chǔ)，則僅使用全動感估計(jì)塊41(若可用，則使用初始運(yùn)動系數(shù))。
若運(yùn)動域編碼塊14有先前預(yù)計(jì)的運(yùn)動系數(shù)可供運(yùn)動域估計(jì)塊12用作預(yù)計(jì)運(yùn)動系數(shù)的基礎(chǔ)，則使用全動感估計(jì)塊41和精細(xì)運(yùn)動估計(jì)塊42。運(yùn)動估計(jì)塊41和42的操作將在稍后參照圖10和11作較詳細(xì)的描述。
全動感估計(jì)塊41和精細(xì)運(yùn)動估計(jì)塊42具有通用的運(yùn)動估計(jì)塊結(jié)構(gòu)，這在圖6中顯示。現(xiàn)參考圖6，兩個(gè)運(yùn)動估計(jì)塊都包含四個(gè)主要塊，即二次抽樣塊51、運(yùn)動模型選擇塊52、代價(jià)函數(shù)最小化器塊53及結(jié)果驗(yàn)證塊54。以下將描述每個(gè)塊。
全動感估計(jì)塊41和精細(xì)運(yùn)動估計(jì)塊42按步驟操作。在每個(gè)步驟決定運(yùn)動模型，即用于將代價(jià)函數(shù)值和二次抽樣因子最小化的最小化方法。這些決定在圖6的相應(yīng)的運(yùn)動估計(jì)塊的結(jié)果驗(yàn)證塊54中做出。
圖7顯示二次抽樣塊51的框圖。所述塊的輸入有來自編碼器10的幀存儲器26的參考幀Rn(x，y)、當(dāng)前幀In(x，y)、來自運(yùn)動域編碼塊14的分段信息，以及有關(guān)二次抽樣所需級別的信息。這是由二次抽樣開關(guān)信號55所提供的，它在下面描述。
二次抽樣塊51由二次抽樣器61(1)至61(k)的存儲體(bank)61和多路復(fù)用器形式的二次抽樣選擇器62組成。在存儲體61中的每個(gè)二次抽樣器61(1)至61(k)(表示為“按m×m二次抽樣”)通過取得每個(gè)水平方向上第m個(gè)和垂直方向上第m個(gè)像素來對參考圖像和當(dāng)前圖像二者進(jìn)行二次抽樣，其中m是2的整數(shù)乘冪。
二次抽樣選擇器62的輸入有參考幀Rn(x，y)和當(dāng)前幀In(x，y)、分段信息及其各個(gè)級別的二次抽樣版，即未取樣版和由每個(gè)二次抽樣器61(1)至61(k)二次抽樣所得版。二次抽樣選擇器使用二次抽樣開關(guān)信號55選擇圖像對及要輸出的適當(dāng)分段。結(jié)果驗(yàn)證塊54(圖6)負(fù)責(zé)產(chǎn)生一致的開關(guān)信號。
圖8顯示優(yōu)選的運(yùn)動模型選擇塊52。運(yùn)動模型選擇塊52包括運(yùn)動模型多路復(fù)用器71和運(yùn)動模型存儲體72。運(yùn)動模型選擇決52從結(jié)果驗(yàn)證塊54接收運(yùn)動模型開關(guān)信號73。
運(yùn)動模型選擇塊52是個(gè)多路復(fù)用器，它依據(jù)運(yùn)動模型開關(guān)信號73來在運(yùn)動模型72a至72c的存儲體72中做出選擇。存儲體72中的運(yùn)動模型按復(fù)雜性的增加依次有“無運(yùn)動”72a、“平移模型”72b及“仿射模型”72c。復(fù)雜性程度指用于表示運(yùn)動的基本函數(shù)的個(gè)數(shù)。在運(yùn)動模型的復(fù)雜性程度和計(jì)算復(fù)雜性之間有密切的關(guān)系隨著運(yùn)動模型復(fù)雜性程度的增加，模型系數(shù)估計(jì)的計(jì)算復(fù)雜性也增加。作為特例，“無運(yùn)動”模型72a的所有運(yùn)動系數(shù)都設(shè)為零。也可以使用其他運(yùn)動模型，例如二次運(yùn)動模型。此模型或者可以作為附加使用的模型。
存儲體72中的運(yùn)動模型72a至72c具有層次“無運(yùn)動”模型72a可以在平移模型和仿射模型中通過設(shè)置所有運(yùn)動系數(shù)為零來表示。同樣地，“平移模型”72b可以在仿射模型中通過設(shè)置等式(7)中a1＝a2＝b1＝b2＝0來完全表示。
圖9顯示代價(jià)函數(shù)最小化器塊53的框圖。代價(jià)函數(shù)的最小化在所述塊中執(zhí)行。它包括最小化方法選擇器81、最小化方法存儲體82及最小化塊83，后者計(jì)算運(yùn)動系數(shù)向量及其相關(guān)的最小化代價(jià)函數(shù)向量。最小化方法包括“無最小化”82a、“區(qū)段匹配”82b以及“高斯-牛頓步驟”82c。以下將進(jìn)一步說明這些最小化方法。
代價(jià)函數(shù)最小化器塊53的輸入有來自二次抽樣塊51的參考幀Rn(x，y)和當(dāng)前幀In(x，y)及分段信息(它們?nèi)慷伎赡鼙欢纬闃?；來自運(yùn)動模型選擇器52的所選運(yùn)動模型；以及當(dāng)前運(yùn)動系數(shù)，來自結(jié)果驗(yàn)證塊54的當(dāng)前代價(jià)函數(shù)值及最小化方法開關(guān)信號80。
此代價(jià)函數(shù)最小化器塊53由其存儲體82中的方法之一執(zhí)行最小化。方法的選擇由結(jié)果驗(yàn)證塊54所提供的最小化方法開關(guān)信號80來決定。
“無最小化”82a可對于任何運(yùn)動模型選擇。在這種情況下，代價(jià)函數(shù)最小化塊53不執(zhí)行任何代價(jià)函數(shù)優(yōu)化，而僅返回輸入了運(yùn)動系數(shù)的代價(jià)函數(shù)值。此方法在存在初始運(yùn)動參數(shù)的情況下用來評估代價(jià)函數(shù)值。
“區(qū)段匹配”82b僅可對平移運(yùn)動模型選擇。對所選運(yùn)動系數(shù)a0和b0的值的集合，計(jì)算代價(jià)函數(shù)的值。產(chǎn)生(6)中預(yù)計(jì)誤差最小值的值a0和b0被選為解。搜索在量化網(wǎng)格上進(jìn)行，也就是說，僅使用標(biāo)量化的值a0和b0。搜索通過評估網(wǎng)格上某些或所有候選對來進(jìn)行，并選擇產(chǎn)生最小代價(jià)函數(shù)值的對。
除了“無運(yùn)動”外，“高斯-牛頓步驟”82c可被用于任何運(yùn)動模型。它使用單個(gè)高斯-牛頓迭代步驟來減少代價(jià)函數(shù)。R.Fletcher的“優(yōu)化的實(shí)踐方法”，第二版，John Wiley 8 Sons，1987，第3章和第6章給出了高斯-牛頓最小化的概述。
高斯-牛頓方法是牛頓方法的具體形式，當(dāng)要最小化的代價(jià)函數(shù)是平方和時(shí)通用。
牛頓的方法在下面概述。使e(a)為參數(shù)向量a函數(shù)的代價(jià)函數(shù)。使ac為當(dāng)前參數(shù)向量，作為最小化迭代的輸入。則此代價(jià)函數(shù)可以圍繞ac被二次地粗估如下e(a)≈e(ac)+gT(a-ac)+12(a-ac)TG(a-ac)---(11)]]>其中g(shù)表示在點(diǎn)a＝ac處關(guān)于a的e梯度；并且G是在點(diǎn)a＝ac處關(guān)于a的e的第二導(dǎo)出矩陣粗估。
然后，根據(jù)牛頓方法的最小化步驟輸出參數(shù)向量ao由以下等式計(jì)算
ao＝-G-1g+ac(12)這是圍繞ac的的代價(jià)函數(shù)二次粗估成為最小的點(diǎn)。若e(a)具有以下形式e(a)=Σi=1m(di(a))2=dTd---(13)]]>則高斯-牛頓方法通過以下等式來粗估第二導(dǎo)出矩陣G≈2(d)(d)T(14)其中d表示雅可比矩陣，其列是d組件的第一導(dǎo)出向量di。考慮通過以下等式給出第一導(dǎo)出向量gg＝2(d)d (15)高斯-牛頓方法的迭代步驟采用以下形式ao＝-[(d)(d)T]-1((d)d)+ac(16)在預(yù)計(jì)誤差最小化的上下文中，等式(10)向量d的項(xiàng)di由以給出di＝In(xi，yi)-Rn(xi+Δx(xi，yi)，yi+Δy(xi，yi)) (17)高斯-牛頓方法的計(jì)算代價(jià)并不太高，因?yàn)樗鼉H執(zhí)行一次迭代步驟。代價(jià)函數(shù)最小化器53輸出最小化的代價(jià)函數(shù)值及運(yùn)動系數(shù)向量。
圖6顯示圖5的全動感估計(jì)41和精細(xì)運(yùn)動估計(jì)42塊的細(xì)節(jié)。驗(yàn)證塊54提供開關(guān)信號。開關(guān)信號包括二次抽樣開關(guān)信號55、運(yùn)動模型開關(guān)信號73以及最小化方法開關(guān)信號80，它們分別選擇二次抽樣因子、運(yùn)動模型及最小化模型，以便用于當(dāng)前迭代中。由結(jié)果驗(yàn)證塊54所產(chǎn)生的任何開關(guān)信號組合都具有基本的假設(shè)集。結(jié)果驗(yàn)證塊54的目的是優(yōu)化這些假設(shè)。一旦確定了假設(shè)集，將產(chǎn)生新的開關(guān)信號集及引出新的運(yùn)動系數(shù)和新的代價(jià)函數(shù)值。通過將這些與先前的進(jìn)行比較，結(jié)果驗(yàn)證塊54將確定1)是否接受(驗(yàn)證通過)新的系數(shù)；2)代價(jià)函數(shù)是否達(dá)到可接受的低值(終止決定)；以及3)假如迭代繼續(xù)，下一個(gè)開關(guān)信號將是什么。
這些開關(guān)信號控制系統(tǒng)中的其他塊。因此，開關(guān)信號的確定將決定要用于下輪迭代中的運(yùn)動模型、最小化方法以及二次抽樣因子。
結(jié)果驗(yàn)證塊54保留“當(dāng)前運(yùn)動系數(shù)”，它是目前為止產(chǎn)生代價(jià)函數(shù)最小值的運(yùn)動系數(shù)，以及“當(dāng)前代價(jià)函數(shù)值”，它是目前為止的代價(jià)函數(shù)最小值。若迭代繼續(xù)，則當(dāng)前運(yùn)動系數(shù)和當(dāng)前代價(jià)函數(shù)值被饋送至代價(jià)函數(shù)最小化器53。
當(dāng)代價(jià)函數(shù)收劍時(shí)，也就是說，當(dāng)代價(jià)函數(shù)落至幾個(gè)預(yù)定義閾值之一以下時(shí)，結(jié)果驗(yàn)證塊54設(shè)置收斂標(biāo)記信號56，然后把收斂標(biāo)記信號56與當(dāng)前運(yùn)動系數(shù)一起作為“最終運(yùn)動系數(shù)”57并且把當(dāng)前代價(jià)函數(shù)值作為“最終代價(jià)函數(shù)值”58輸出。這些輸出被發(fā)送至運(yùn)動域編碼塊14。
結(jié)果驗(yàn)證塊54是一個(gè)使系統(tǒng)的計(jì)算復(fù)雜性保持最小的強(qiáng)大工具。通過在假設(shè)集之間上下文相關(guān)切換，也就是在特定運(yùn)動模型集、最小化方法和二次抽樣程度之間，所述塊允許高效能的運(yùn)動估計(jì)，僅當(dāng)需要時(shí)才涉及計(jì)算上復(fù)雜的技術(shù)。該系統(tǒng)可以對以下情況找到區(qū)段的運(yùn)動系數(shù)任何任意形狀的區(qū)段；區(qū)段中任何期望的運(yùn)動域模型；以及任何有意義地選擇的估計(jì)誤差(均方誤差、中間絕對誤差、拉格朗日比率失真，等等)代價(jià)函數(shù)。
該系統(tǒng)可以用多種方法實(shí)現(xiàn)例如，以下特性可以改變
在等式(4)和(5)中可以使用不同的基本函數(shù)；作為量度預(yù)計(jì)誤差可以選擇不同的代價(jià)函數(shù)；對于區(qū)段匹配可以使用不同方法；可以使用各種不同的牛頓方法；對于結(jié)果驗(yàn)證和方法切換可以使用不同策略；以及對于圖像的子像素評估和梯度計(jì)算可以使用不同方法。
以下將描述本發(fā)明的最佳實(shí)施例。
在最佳實(shí)施例中，在二次抽樣塊51中僅配備一個(gè)二次抽樣器61。此二次抽樣器將使信號以2×2來二次抽樣。二次抽樣開關(guān)信號55要么選擇此二次抽樣器，或完全沒有二次抽樣。
在本發(fā)明的最佳實(shí)施例中，在運(yùn)動模型選擇器存儲體72中有三個(gè)運(yùn)動模型“無運(yùn)動”模型72a、“平移模型”72b以及“仿射模型”72c。
在此最佳實(shí)施例的代價(jià)函數(shù)最小化器53中，所執(zhí)行的區(qū)段匹配82a是“具有完全搜索的完全像素區(qū)段匹配”。該操作需要在特定范圍中測試所有整數(shù)值的運(yùn)動系數(shù)對，以找到最小化代價(jià)函數(shù)的那對。
對于高斯-牛頓最小化82c，等式(16)可以重新設(shè)置如下Gδ＝g (18)其中δ＝ao-ac，G＝(d)(d)T，g＝-(d)d。
等式(18)由Cholesky分解所解答(W.H.Press、S.A.Teukolsky、W.T.Vetterling及B.P.Flannery所著“用C語言編程的數(shù)字處方”，第二版，劍橋大學(xué)出版社，1992年，第96-98頁)，輸出運(yùn)動系數(shù)向量ao由ao＝ac+δ計(jì)算。在最佳實(shí)現(xiàn)模式中，僅當(dāng)運(yùn)動模型是仿射時(shí)才使用高斯-牛頓步驟。在此例中，G是具有以下項(xiàng)的6×6正半確定對稱矩陣(m,n)=Σ(xi,yi)&Element;Skcm(i)cn(i)---(19)]]>其中c(i)＝[dxiyidxixidxidyiyidyixidyi]T；dxi表示在第i個(gè)像素處的水平圖像導(dǎo)數(shù)，dyi表示在第i個(gè)像素處的垂直圖像導(dǎo)數(shù)。同樣地，g是具有以下項(xiàng)的大小為6的向量g(n)=Σ(xi,yi)&Element;Skdicn(i)---(20)]]>其中di如等式(17)中所定義。
立方卷積插值法被用于子像素評估。圖像導(dǎo)數(shù)也使用立體卷積計(jì)算計(jì)算由立方卷積插值法所得到的連續(xù)函數(shù)的導(dǎo)數(shù)，它們被解釋作圖像導(dǎo)數(shù)。
在全動感估計(jì)塊41和精細(xì)運(yùn)動估計(jì)塊42的結(jié)果驗(yàn)證塊54中新開關(guān)信號的產(chǎn)生可以用許多方法來完成。以下說明兩個(gè)運(yùn)動估計(jì)塊產(chǎn)生開關(guān)信號的優(yōu)選的方法。
圖10顯示根據(jù)本發(fā)明最佳實(shí)施例，在全動感估計(jì)塊41的結(jié)果驗(yàn)證塊54中所執(zhí)行操作的流程圖。第一套假設(shè)“無運(yùn)動”(91)被通過將二次抽樣級別切換至“無”來設(shè)置，最小化方法設(shè)置為“無最小化”，運(yùn)動模型為“無運(yùn)動”。若作為結(jié)果的代價(jià)函數(shù)低于預(yù)定義閾值(92)(在圖10中表示為″Th1″)，則搜索結(jié)束(913)，不產(chǎn)生運(yùn)動系數(shù)。
若代價(jià)函數(shù)值大于或等于Th1，下一套假設(shè)(93)是“平移模型可以粗估實(shí)際運(yùn)動域”以及“二次抽樣不會根本地轉(zhuǎn)移全局最小值”。遵循這些假設(shè)，二次抽樣開關(guān)信號55被設(shè)為“按2×2二次抽樣”，模型切換至“平移模型”，代價(jià)函數(shù)最小化方法被設(shè)為“區(qū)段匹配”(93)(執(zhí)行二次抽樣以減少操作復(fù)雜性)。若此步驟導(dǎo)致的代價(jià)函數(shù)低于對應(yīng)于零運(yùn)動的代價(jià)函數(shù)，則至目前為止最佳的系數(shù)通過將等式7中的值a0和b0設(shè)置為區(qū)段匹配所計(jì)算的值，并設(shè)置其他系數(shù)為零來更新(94)。
若初始運(yùn)動系數(shù)可用，例如來自主區(qū)段(并存儲于運(yùn)動系數(shù)存儲器塊43中)，則下一個(gè)假設(shè)是“具有初始運(yùn)動系數(shù)的仿射模型可以粗估實(shí)際運(yùn)動”(95)?，F(xiàn)在，運(yùn)動模型被設(shè)為“仿射”，“無最小化”被選為最小化方法，并且二次抽樣開關(guān)信號55設(shè)為“無”。再次使用等式(10)來評估所述代價(jià)，并且若代價(jià)小于先前階段(96)的最小代價(jià)，則作為目前最佳值來存儲初始運(yùn)動系數(shù)。若沒有初始運(yùn)動系數(shù)可用，則步驟95和96不發(fā)生，并且步驟97跟隨步驟94。
下一套假設(shè)是“仿射運(yùn)動模型滿意地粗估了運(yùn)動域”，并且“高斯-牛頓步驟減少了代價(jià)函數(shù)”。因而，運(yùn)動模型開關(guān)信號73被設(shè)為“仿射”、二次抽樣開關(guān)信號55為“無”，以及最小化方法開關(guān)信號80為“高斯-牛頓”。用這些設(shè)置，執(zhí)行迭代98、99、910、911及952，直到發(fā)生以下條件之一在最后迭代中代價(jià)函數(shù)值的減少低于預(yù)定閾值Th2(910)；或者達(dá)到一定個(gè)數(shù)的迭代計(jì)數(shù)Maxlter1(912)。
再次地，在每次迭代之后，與迭代結(jié)果相關(guān)的代價(jià)函數(shù)與到目前為止得到的最佳代價(jià)函數(shù)進(jìn)行比較(99)。若作為結(jié)果的代價(jià)函數(shù)小于到目前為止最佳的代價(jià)函數(shù)，則迭代的結(jié)果將用來更新運(yùn)動系數(shù)和到目前為止最佳的代價(jià)函數(shù)值。
圖11顯示在根據(jù)本發(fā)明的較好方法實(shí)施例中，在精細(xì)運(yùn)動估計(jì)塊42的結(jié)果驗(yàn)證塊54中所執(zhí)行操作的流程圖。可以看出操作與圖10中所執(zhí)行的那些相似。第一個(gè)假設(shè)是“無運(yùn)動”，并且如果與此假設(shè)相關(guān)的結(jié)果代價(jià)函數(shù)值低于預(yù)定義閾值Th1(與圖10相同)，則搜索結(jié)束(913)，不產(chǎn)生運(yùn)動系數(shù)。第二個(gè)假設(shè)是“進(jìn)來的預(yù)計(jì)運(yùn)動系數(shù)集已經(jīng)相當(dāng)好地粗估了最終運(yùn)動系數(shù)52”(101)。初始代價(jià)被評估并與預(yù)定義閾值Th3(102)進(jìn)行比較。若代價(jià)低于閾值，則輸入運(yùn)動系數(shù)如(109)輸出，并發(fā)送至運(yùn)動域編碼塊14。否則作出新的假設(shè)，“高斯-牛頓的牛頓步驟減少了代價(jià)函數(shù)”。運(yùn)動模型開關(guān)信號被設(shè)為“仿射”、二次抽樣開關(guān)信號被設(shè)為“無”，并且最小化方法為“高斯-牛頓”(104)。如全動感估計(jì)塊41的結(jié)果驗(yàn)證塊54中那樣，在每個(gè)步驟之后評估代價(jià)函數(shù)，并且如果代價(jià)減少了，作為結(jié)果的運(yùn)動系數(shù)與代價(jià)一起存儲(105)。再次有兩個(gè)結(jié)束迭代的條件在最后迭代中代價(jià)函數(shù)值的減少低于預(yù)定閾值Th4(106)；或者達(dá)到一定個(gè)數(shù)的迭代計(jì)數(shù)Maxlter2(108)。
若全動感估計(jì)塊41和精細(xì)運(yùn)動估計(jì)塊42都可工作(也就是說若初始運(yùn)動系數(shù)和預(yù)計(jì)的運(yùn)動系數(shù)都可用)，則在接收到這些決的輸出時(shí)，運(yùn)動域編碼塊14將比較“最終代價(jià)函數(shù)值”以選擇要使用的一套運(yùn)動系數(shù)。比較這些運(yùn)動系數(shù)的合適方法在與此有關(guān)的題為“適應(yīng)性運(yùn)動矢量域編碼”的美國專利申請中描述，發(fā)明人為JaniLainerna和Marta Karczewicz，于2000年1月21日提交。
預(yù)定義的閾值在最小化的不同階段和/或?qū)τ诓煌Ｐ秃?或?qū)τ诓煌凰俾士赡懿煌?br> 如以上所概括的，根據(jù)本發(fā)明的運(yùn)動估計(jì)系統(tǒng)在取得運(yùn)動估計(jì)上比先前的解決方案極大地減少了預(yù)計(jì)誤差，同時(shí)使計(jì)算復(fù)雜性保持在統(tǒng)計(jì)上的低級別。這是通過在每個(gè)迭代進(jìn)行假設(shè)驗(yàn)證，在健壯性各異的統(tǒng)計(jì)有效假設(shè)之間提供動態(tài)切換來達(dá)到的。
進(jìn)一步地，本發(fā)明使用多項(xiàng)式運(yùn)動矢量域模型特別為圖像區(qū)段的運(yùn)動估計(jì)提供改進(jìn)的系統(tǒng)。運(yùn)動估計(jì)是使用運(yùn)動補(bǔ)償預(yù)計(jì)的視頻編碼要素。本系統(tǒng)找到了比先有技術(shù)解決方案能產(chǎn)生較低預(yù)計(jì)誤差的運(yùn)動系數(shù)，同時(shí)讓計(jì)算復(fù)雜性保持在低級別。此低預(yù)計(jì)誤差使得在視頻壓縮方面有較好的效能。此低預(yù)計(jì)誤差是通過將圖像數(shù)據(jù)和運(yùn)動的一般特性整合入眾所周知的函數(shù)最小化技術(shù)組合中而達(dá)到的。
前面的描述對于本專業(yè)的技術(shù)人員來說很容易明白一點(diǎn)在權(quán)利要求書的范圍內(nèi)可以做各種修改。
權(quán)利要求
1.一種用于對具有像素的視頻幀序列執(zhí)行運(yùn)動補(bǔ)償編碼的編碼器(10)，所述編碼器包括用于存儲參考幀的存儲器裝置(26)；以及用于至少使用所述參考幀估計(jì)當(dāng)前幀中的像素運(yùn)動的運(yùn)動域估計(jì)裝置(12)，其中，所述運(yùn)動域估計(jì)裝置把先前對所述當(dāng)前幀的至少一個(gè)第一像素的估計(jì)得到的預(yù)計(jì)運(yùn)動系數(shù)用于估計(jì)所述當(dāng)前幀中至少一個(gè)第二像素的運(yùn)動系數(shù)。
2.如權(quán)利要求1所述的編碼器(10)，其特征在于所述運(yùn)動域估計(jì)裝置(12)利用先前對至少一個(gè)相鄰像素估計(jì)的預(yù)計(jì)運(yùn)動系數(shù)集來對至少一個(gè)第二像素計(jì)算運(yùn)動系數(shù)。
3.如權(quán)利要求1或權(quán)利要求2所述的編碼器(10)，其特征在于所述運(yùn)動域估計(jì)裝置(12)利用先前對多于一個(gè)相鄰像素估計(jì)的預(yù)計(jì)運(yùn)動系數(shù)集來對至少一個(gè)第二像素計(jì)算運(yùn)動系數(shù)。
4.如上述權(quán)利要求中任何一個(gè)所述的編碼器(10)，其特征在于所述運(yùn)動域估計(jì)裝置(12)使用對先前對多于一個(gè)相鄰像素估計(jì)的預(yù)計(jì)運(yùn)動信息求平均得來的平均預(yù)計(jì)運(yùn)動系數(shù)集。
5.如上述權(quán)利要求中任何一個(gè)所述的編碼器(10)，其特征在于為將接收到的幀分段為多個(gè)像素而設(shè)置分段裝置。
6.如權(quán)利要求5所述的編碼器(10)，其特征在于所述分段裝置為主像素導(dǎo)出初始運(yùn)動系數(shù)。
7.如上述權(quán)利要求中任何一個(gè)所述的編碼器(10)，其特征在于所述運(yùn)動域估計(jì)裝置(12)包括用于根據(jù)所述預(yù)計(jì)的運(yùn)動系數(shù)估計(jì)第一運(yùn)動系數(shù)的第一運(yùn)動估計(jì)器(41，42)；以及用于根據(jù)初始運(yùn)動系數(shù)估計(jì)第二運(yùn)動系數(shù)的第二運(yùn)動估計(jì)器(41，42)。
8.如權(quán)利要求7所述的編碼器(10)，其特征在于如果所述預(yù)計(jì)運(yùn)動系數(shù)和所述初始運(yùn)動系數(shù)可用，則所述第一運(yùn)動估計(jì)器(41，42)和所述第二運(yùn)動估計(jì)器(41，42)將估計(jì)運(yùn)動系數(shù)。
9.如權(quán)利要求7或權(quán)利要求8所述的編碼器(10)，其特征在于如果一個(gè)運(yùn)動估計(jì)器(41，42)的對應(yīng)運(yùn)動系數(shù)可用，而另一個(gè)運(yùn)動估計(jì)器(41，42)的那些系數(shù)不可用，則僅一個(gè)運(yùn)動估計(jì)器(41，42)估計(jì)運(yùn)動系數(shù)。
10.如上述權(quán)利要求中任何一個(gè)所述的編碼器(10)，其特征在于所述運(yùn)動域估計(jì)裝置(12)包括選擇裝置，用以從第一運(yùn)動系數(shù)或第二運(yùn)動系數(shù)選擇運(yùn)動系數(shù)。
11.如上述權(quán)利要求中任何一個(gè)所述的編碼器(10)，其特征在于所述運(yùn)動域估計(jì)裝置(12)包括一系列運(yùn)動模型(52)。
12.如權(quán)利要求11所述的編碼器(10)，其特征在于所述運(yùn)動模型系列(52)包括有層次，所述層次包括零運(yùn)動模型(72a)、平移運(yùn)動模型(72b)及仿射運(yùn)動模型(72c)。
13.如權(quán)利要求11或權(quán)利要求12所述的編碼器(10)，其特征在于包括控制裝置(71)，若與當(dāng)前選擇的運(yùn)動估計(jì)器單元所估計(jì)的運(yùn)動矢量域相關(guān)的預(yù)計(jì)誤差超過預(yù)定閾值，則它可以用來選擇并使用所述系列中后續(xù)的運(yùn)動模型。
14.如權(quán)利要求11至13中任一個(gè)所述的編碼器(10)，其特征在于包括用于對當(dāng)前幀進(jìn)行二次抽樣(51)、以便產(chǎn)生二次抽樣后的幀并且將所述二次抽樣后的幀轉(zhuǎn)發(fā)給所述運(yùn)動模型系列的裝置。
15.如權(quán)利要求14所述的編碼器(10)，其特征在于包括在最小化期間根據(jù)預(yù)計(jì)誤差的變化選擇二次抽樣量的控制裝置(62)。
16.如權(quán)利要求15或權(quán)利要求16所述的編碼器(10)，其特征在于所述二次抽樣裝置(51)包括一系列二次抽樣器(61(1)，…61(k))，其二次抽樣因子各不相同。
17.如上述權(quán)利要求中任何一個(gè)所述的編碼器(10)，其特征在于所述運(yùn)動估計(jì)裝置包括一系列最小化器(82)，后者包括區(qū)段匹配最小化器(82a)、高斯-牛頓最小化器(82b)以及準(zhǔn)牛頓最小化器(82c)。
18.一種包括如上述權(quán)利要求中任何一個(gè)所述的編碼器(10)和解碼器(30)的編解碼器。
19.一種包括如上述權(quán)利要求中任何一個(gè)所述的編碼器(10)的移動終端。
20.一種包括如權(quán)利要求1至17中任何一個(gè)所述的編碼器(10)的數(shù)據(jù)通信網(wǎng)絡(luò)。
21.一種用于對具有像素的視頻幀序列執(zhí)行運(yùn)動補(bǔ)償編碼的方法，所述方法包括以下步驟存儲參考幀；至少使用所述參考幀估計(jì)當(dāng)前幀中像素的運(yùn)動；以及把先前對所述當(dāng)前幀的至少一個(gè)第一像素的估計(jì)得到的預(yù)計(jì)運(yùn)動系數(shù)集用于估計(jì)所述當(dāng)前幀中至少一個(gè)第二像素的運(yùn)動系數(shù)集。
全文摘要
公開一種用于視頻編碼器運(yùn)動估計(jì)方法和系統(tǒng)。所述系統(tǒng)包括待編碼的視頻圖像的輸入。它還包括一個(gè)層次系列的具有各不相同的復(fù)雜性的運(yùn)動估計(jì)器，用以估計(jì)接收到的圖像和參考圖像之間的運(yùn)動矢量域。若由當(dāng)前選擇的運(yùn)動估計(jì)器所估計(jì)的與運(yùn)動矢量域相關(guān)的預(yù)計(jì)誤差超過預(yù)定閾值，則由控制裝置選擇系列中隨后的運(yùn)動估計(jì)器。當(dāng)繼承和預(yù)計(jì)的運(yùn)動信息可用時(shí)，則使用它們來改進(jìn)預(yù)計(jì)質(zhì)量。
文檔編號H04N7/26GK1418437SQ01806741
公開日2003年5月14日申請日期2001年1月19日優(yōu)先權(quán)日2000年1月21日
發(fā)明者M·卡爾澤維克, J·瀨內(nèi)馬申請人:諾基亞有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：M.卡爾澤維克;J.瀨內(nèi)馬
技術(shù)所有人：諾基亞有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時(shí)頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

煙感編碼器使用方法相關(guān)技術(shù)

消防編碼器使用方法相關(guān)技術(shù)

海灣編碼器使用方法相關(guān)技術(shù)

編碼器使用方法相關(guān)技術(shù)

編碼器安裝方法相關(guān)技術(shù)

編碼器的使用方法相關(guān)技術(shù)

編碼器的編碼方法相關(guān)技術(shù)

旋轉(zhuǎn)編碼器使用方法相關(guān)技術(shù)

松江編碼器使用方法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

視頻編碼器的運(yùn)動估計(jì)方法及系統(tǒng)的制作方法