專利名稱:攝像機運動參數(shù)估計方法
技術(shù)領(lǐng)域:
本發(fā)明涉及攝像機運動參數(shù)估計方法,所說的參數(shù)要成為MPEG-7中的用于作為圖像索引框中的描述符。
過去的十年已經(jīng)看到了可由許多人訪問的大信息數(shù)據(jù)庫的發(fā)展。這些數(shù)據(jù)庫包括例如文本、圖像、聲音等幾個介質(zhì)類型。這種信息的表征、顯示、索引、存儲、傳輸及檢索構(gòu)成了該技術(shù)的有用的重要內(nèi)容(issue)。不管能夠考慮進行圖像索引的分集的等級如何,每一信息分集都能夠根據(jù)若干判據(jù),例如根據(jù)語義信息內(nèi)容、場景屬性、攝像機運動參數(shù)等被隨后索引。稱為“多媒體內(nèi)容描述接口”并且旨在根據(jù)信息內(nèi)容的檢索問題的MPEG-7將把描述這種多媒體內(nèi)容的類屬方法標準化,其使用與多媒體資料相關(guān)的描述符和描述方案,以便根據(jù)例如文本、色彩、組構(gòu)、運動和語義內(nèi)容的各種類型而實現(xiàn)快速和有效率的檢索。該標準將實現(xiàn)能夠被儲存(聯(lián)機或脫機)或成為數(shù)據(jù)串流(例如在互聯(lián)網(wǎng)絡(luò)中的廣播或圖像)的應(yīng)用,并且能夠以實時和非實時環(huán)境操作。
圖1示出并且提供用于處理任何多媒體內(nèi)容的一個可能的MPEG-7處理鏈路的方框示意圖包括一個在編碼一側(cè)的對所說的內(nèi)容進行操作的特征提取子部件11;建立基準子部件12,包括用于得出MPEG-7定義語言的模塊121和定義MPEG-7描述符及描述方案的模塊122;標準描述子部件13;以及編碼子部件14。MPEG-7標準的范圍是子部件12,并且本發(fā)明定位在子部件12和13中。圖1還示出解碼一側(cè),包括解碼子部件16(剛好在編碼數(shù)據(jù)的傳輸之后,即儲存編碼數(shù)據(jù)的一個讀操作),和一個搜索引擎17,應(yīng)答用戶控制的功能進行操作。
在MPEG-7結(jié)構(gòu)中,必須生成用于許多主題的有效工具,像用于場景分析即運動分析,尤其用于攝像機運動特征提取的方法。針對運動表示,能夠建議兩個解決方案作為可能的用于總的運動描述符提取的基礎(chǔ)透視模式,以及數(shù)據(jù)塊匹配方法。前者很好地適合于攝像機全局運動,但是不能表示三維的變換,致使不得不分別地描述每次全局運動的可能的三維變換。
數(shù)據(jù)塊匹配運動補償被用作預(yù)測編碼處理的一部分,該預(yù)測編碼處理廣泛地使用在圖像傳輸中,用于降低編碼一個圖像程序所需要的信息量。的確,從一幀到下一幀的一個圖像的僅一小部分的變化,實現(xiàn)從所說的在先幀的直接預(yù)測。更確切地說,每一幀(i+1)被分成固定數(shù)目的數(shù)據(jù)塊(通常正方形)。對于每一數(shù)據(jù)塊(通常8×8像素)來說,在一個預(yù)定的區(qū)域上執(zhí)行與一個在先基準幀(i)中的最相似的數(shù)據(jù)塊的搜索。搜索準則通常是,最佳匹配數(shù)據(jù)塊的搜索給出最小的預(yù)測誤差,通常計算為平均絕對值差(其比例如均方差更容易計算)。對于以(x,y)定位的每一數(shù)據(jù)塊(在本例中是8×8像素),則根據(jù)關(guān)系(1)從圖像(i)計算預(yù)測的圖像(i+1)B(i+1)[x,y]=B(i)[x-dx,y-dy] (1)利用(dx,dy)=v=運動矢量,從圖像(i)中的B(i)導引到圖像(i+1)中的B(i+1)。
當從數(shù)據(jù)塊匹配運動矢量開始估算攝像機運動時,主要的問題是,矢量的估計器的效率僅是從一個編碼準則的角度測量的。運動矢量未必是對應(yīng)于場景的真實運動。例如,在場景中的均勻組構(gòu)的一個區(qū)域中,估計器能夠選擇該組構(gòu)內(nèi)部的任何數(shù)據(jù)塊,即便該運動矢量不表示該全局運動。但是,雖然數(shù)據(jù)塊匹配表示一個不總是一致的運動,但是該方法將是最好的,因為有可能變換必須每次區(qū)別地描述,并且該透視模式不能夠做這件事。從如此確定的運動矢量出發(fā),隨后定義某些攝像機參數(shù)。在描述相應(yīng)的定義方法之前,首先提出使用在當前描述中的攝像機模式。
考慮移動通過一個靜態(tài)環(huán)境的單眼攝像機。如能夠在圖2中看到,假設(shè)O是攝像機的光學中心,OXYZ是相對于這臺攝像機固定的一個外部坐標系,OZ是光軸。假設(shè)Tx,Ty、Tz是OXYZ相對于場景的平移速度,而Rx、Ry、Rz是其角速度。如果(X,Y,Z)是點P在三維的場景中的瞬時坐標,則P的速度分量將是X=-Tx-Ry.z+Rz.Y (2)Y=-Ty-Rz.X+Rx.Z (3)Z=-Tz-Rx.Y+Ry.X (4)P的圖像位置,即p通過關(guān)系(5)在圖像平面中給出 (其中f是攝像機的焦距),并且以一個引入速度移動通過該圖像平面(ux,uy)=(x,y) (6)在計算和替換之后,獲得下面關(guān)系ux=f.X-Z-f.X.Z-Z2]]>ux=fZ(-Tx-Ry.Z+Rz.Y)-f.XZ2(-Tz-Rx.Y+Ry.X)(8)]]>和uy=f.Y-Z-f.Y.Z-Z2]]>uy=fZ(-Ty-Rz.X+Rx.Z)-f.YZ2(-Tz-Rx.Y+Ry.X)(10)]]>還可以被寫入成ux(x,y)=-fZ.(Tx-x.Tz)+x.yf.Rx-f(1+x2f2)Ry+y.Rz(11)]]>uy(x,y)=-fZ.(Ty-y.Tz)-x.yf.Ry+f(1+y2f2)Rx-x.Rz(12)]]>而且,為了在這臺攝像機模式中包括變焦距,假定一個變焦能夠通過單一角度域中的放大率近似。如果在該場景中的最近的目標的距離比用于產(chǎn)生該變焦的焦距的變化大,則這樣一個假設(shè)是成立的,通常是這種情況。
圖3考慮了一個純變焦。給出在時間t在的圖像平面中定位的一個點(x,y)和在下一個時間t’的定位(x’,y’),由變焦沿x引入的圖像速度ux=x’-x能夠被表示為如下所示的Rzoom的一個函數(shù)(Rzoom由圖3顯示的關(guān)系(θ’-θ)/θ定義)。
可以確定tan(θ’)=x’/f和tan(θ)=x/f,其導致ux= x′- x=[tan(θ′)-tan(θ)].f (13)tan(θ’)的表示式可以寫成tan(θ′)=tan[(θ′-θ)+θ]=tan(θ′-θ)+tan(θ)1-tan(θ).tan(θ′-θ)(14)]]>隨后假設(shè)角度差(θ’-θ)是小值,即tan(θ’-θ)可以由(θ’-θ)近似,并且(θ’-θ).tanθ<<1,則獲得ux=x′-x=f.[(θ′-θ)+tan(θ)1-(θ′-θ).tanθ-tanθ](15)]]>ux=f.(θ′-θ).(1+tan2(θ)1-(θ′-θ).tanθ(16)]]>ux=f.θ.RZOOM.1+tan2(θ)1-(θ′-θ).tanθ(17)]]>其實際等于ux=x′-x=f.θ.Rzoom.(1+tan2θ)(18)]]>該結(jié)果能夠被重新寫成ux=f.tan-1(xf).Rzoom.(1+x2f2)(19)]]>并且,類似地,uy由下式給出uy=f.tan-1(yf).Rzoom.(1+y2f2)(20)]]>速度u=(ux,uy)對應(yīng)于在圖像平面中由單一變焦引入的運動。因此能邏輯地定義考慮了旋轉(zhuǎn)、移動(沿著X和Y軸)和變焦全部因素的總模式。
總模式能夠被寫為表示轉(zhuǎn)動和變焦運動的轉(zhuǎn)動速度與表示X和Y移動的平移速度的一個和(即分別地跟蹤和急變)。 利用 方程式中僅平移項取決于目標距離Z。
M.V.Srinivasan和al.的文章“從圖像序列估計攝像機運動參數(shù)的質(zhì)量”(模式識別,卷30,第4期,1997年,593-605頁)描述了使用攝像機方程式(21)到(23)從圖像的一個序列提取攝像機運動參數(shù)的技術(shù)。更具體地說,在所說文章的部分3(595-597頁)中解釋了該技術(shù)的基本原理。通過在從原始的光學流場相減時尋找產(chǎn)生一個流場的Rx、Ry、Rz和Rzoom的最佳值、隨后產(chǎn)生其中的全部矢量是平行矢量的一個剩余流場執(zhí)行的該技術(shù)利用基于優(yōu)勢扇區(qū)的準則而使用一個對來自該剩余流矢量的平行性的漂移進行最小化的迭代法。
在迭代法的每一步驟,由于當前攝像機運動參數(shù)引起的光流被根據(jù)兩個不同攝像機模式之一計算。第一模式假定,該視野(或焦距f)的角度大小是公知的這意味著方程式(23)中的比例x/f和y/f可以針對圖像中的每一點計算,所說的方程式隨后實現(xiàn)該光流的精確計算。
第二模式假定不知道該攝像機的視野。在執(zhí)行方程式(23)之前需要小場近似(x/f和y/f比1小),這將導致方程式(24)和(25)urotx□-f.Ry+y.Rz+x.Rzoom(24)uroty□-f.Rx-x.Rz+y.Rzoom(25)當攝像機的視野大且已知時,考慮了全景拍攝或傾斜失真的第一模式似乎產(chǎn)生更準確的結(jié)果。遺憾的是通常不知道焦距,當視野被猜想是大視野時,將導致僅在圖像的有限范圍上使用第二模式。但是,因為第二模式不可能區(qū)別全景拍攝和跟蹤,所以該模式不是一個滿意的解決方案。
雖然水平和垂直的跟蹤產(chǎn)生的流場中全部的矢量是真正平行的,但是利用搖攝全景和傾斜產(chǎn)生的流場不是這樣,除非攝像機的視野是小視野,例如20°×20°(大視野導致源于焦面的平面的幾何的速度場中的失真)。由變焦產(chǎn)生的流場也失真(遠離中心,運動矢量不再是放射狀地取向)。如果是大視野,則產(chǎn)生失真可用于把平移運動從搖攝全景和傾斜中唯一地區(qū)別開。
因此,本發(fā)明的一個目的是改進用于從運動矢量中估計攝像機運動特征的方案,通過建議一個攝像機運動參數(shù)估計方法,當在大視野時,即便在視野未知的情況下,每次在物理構(gòu)成上有可能實現(xiàn)在跟蹤和全景拍攝之間的區(qū)別以及不同地執(zhí)行,但當小視野時不做這種區(qū)別。
為此目的,本發(fā)明涉及一種估計方法,提供用于考慮被細分為數(shù)據(jù)塊的連續(xù)圖像幀的一個序列并且處理該序列,其中所說的處理操作包括對應(yīng)的連續(xù)步驟-從所說的圖像序列提取對應(yīng)于兩個連續(xù)的幀之間的運動的矢量,所說的運動矢量形成該攝像機速度場;-預(yù)處理該攝像機速度場,以便降低數(shù)據(jù)量和所說提取的運動矢量的多相性;-從所說的預(yù)處理場估計用于每一個幀對的在兩個考慮幀之間的攝像機特征;-根據(jù)所說的估計實施一個長項運動分析,以便獲得對應(yīng)于該估算攝像機運動參數(shù)的運動描述符。
該主要構(gòu)思是,在大多數(shù)情況下,如果大視野產(chǎn)生在速度場中的失真,則相同的失真應(yīng)該還是可用的。換句話說,如果焦距(或視野,其是與圖像規(guī)模標度因數(shù)相同的信息)被包括在使用上述第一模式的最小化處理中,當視野不太小時以及當實際上存在變焦、搖攝全景、傾斜或滾動分量之一時(表示真實情況的一個重要的部分;如果視野太小或如果僅存在一個跟蹤運動的話,則該焦距估計將不再有意義),該焦距應(yīng)該被正確地估算。
將以實例的方式,參照附圖描述本發(fā)明,其中圖1是一個有可能的MPEG-7處理鏈的一個示意方框圖;圖2示出與攝像機一起移動的一個攝像機外部的坐標系OXYZ,并且示出針對焦距f的在三維場景中的一個對應(yīng)點P的視網(wǎng)膜的坐標(x,y);圖3示出包括在攝像機模式中的一個變焦模式;圖4給出執(zhí)行根據(jù)本發(fā)明的估計方法的一個完整攝像機運動分析系統(tǒng)的總圖;圖5示出使用在根據(jù)本發(fā)明的系統(tǒng)中的濾波技術(shù);圖6示出當執(zhí)行下傾(downhill)單形法時的構(gòu)造一個新的單形的方式;圖7示出一個流程圖,說明用于該平行價值函數(shù)的向下單純形算法。
實施根據(jù)本發(fā)明的估計方法的一個完整方案在圖4中示出。可以指出,因為MPEG-7將是一個多媒體內(nèi)容描述標準,所以來指定一個具體編碼類型。因此,描述符格式的一個處理必須對所有的編碼數(shù)據(jù)的類型(壓縮或未壓縮的)都有效。然而,由于從輸入幀獲得的大部分視頻數(shù)據(jù)通常是MPEG格式(因此存在壓縮),直接地使用由MPEG運動補償提供的運動矢量是有益的。如果該視頻數(shù)據(jù)是以未壓縮域得到的,則在一個運動矢量產(chǎn)生裝置41中執(zhí)行一個數(shù)據(jù)塊匹配方法。
不管是那種情況,一旦已經(jīng)讀出或從圖像序列(在兩個連續(xù)幀之間)提取了運動矢量,則都提供一個下采樣和濾波裝置42。濾波該速度場的目標是降低該數(shù)據(jù)量和運動矢量的多相性。該操作之后是裝置43中的攝像機特征的瞬時估計。該估計是根據(jù)預(yù)先描述的方法改進的,以便使用運動矢量并且在最小化處理中包括該焦距,并且實現(xiàn)用于每一對幀的一個特征向量。在整個所考慮的序列中的特征矢量組則最終由一個長期運動分析裝置44接收,該裝置44輸出運動描述符,可用于在以內(nèi)容為基礎(chǔ)的檢索組織結(jié)構(gòu)中索引攝象機運動的序列,特別是按照MPEG-7圖像索引結(jié)構(gòu)索引該序列。
裝置42中的預(yù)處理步驟要解決兩個主要問題運動矢量的多相性,首先是該圖像的低頻部分中的或在非常均勻組構(gòu)場合中的運動矢量的多相性,以及該數(shù)據(jù)塊的尺寸太小。根據(jù)全局信息,通過下采樣該原始場并且同時抑制不一致的矢量,下采樣和濾波處理被提供用于降低該矢量的總數(shù)。使用針對每一矢量計算出的一個置信掩碼根據(jù)每一運動矢量的置信等級在0和1之間的變化的判別標準,并且決定該矢量是否被考慮。置信掩碼的一個實例可以被認為,針對任何理論的攝像機運動,是一個不能變化太多的運動矢量具有接近值的相近矢量。因此能根據(jù)每一矢量到其鄰近矢量的距離測量一個置信度,能夠由例如其平均值表示,最好由中值表示(因為中值對大隔離誤差敏感更小)。因此該置信掩碼Cij由方程式(26)定義Ci,j=e-‖vi,j-vmedian‖2(26)圖5示出濾波技術(shù)濾波場(右側(cè))包括原始場(左側(cè))四倍分之一的數(shù)據(jù)塊數(shù)目。根據(jù)四個原始數(shù)據(jù)塊的運動矢量計算表示新數(shù)據(jù)塊的運動的矢量,并且根據(jù)顯示的鄰近數(shù)據(jù)塊計算其置信度。用于新的數(shù)據(jù)塊的運動矢量是原較小數(shù)據(jù)塊的加權(quán)平均值v-m,n(filt)=Σi=2(m-1)+12(m-1)+2Σj=2(n-1)+12(n-1)+2Ci,j-vi,j-Σi=2(m-1)+12(m-1)+2Σj=2(n-1)+12(n-1)+2(27)]]>裝置43被提供用于針對幀的每一對,從濾波的運動矢量場計算一個特征矢量、包括兩個被考慮幀之間的攝像機運動信息,現(xiàn)在詳細說明該裝置43執(zhí)行的一個估計算法。
首先從方程式(26)計算置信掩碼。隨后開始并行化(parallelisation)處理。在產(chǎn)生的矢量的價值函數(shù)的計算中每次考慮一個運動矢量,由其置信掩碼加權(quán)。隨后下面方程式實現(xiàn)給出一個其中的全部矢量是平行的剩余(residual)場的Rx、Ry、Rz、Rzoom和焦距f的最佳值的計算R-estim=[R^x,R^y,R^z,Rzoom,f^]=argmin{P(R^)}(28)]]>whereP(R-)=ΣiΣj||v-i,jresidual(R-)||2·θi,j·Ci,j(29)]]>具有v-i,jresidual(R→)=v-i,j-[uyrot(R→)uxrot(R→)](30)]]>andθi,j=angle(v-i,jresidual,v-residual),]]>v-residual=ΣiΣjv-i,jresidual.Ci,jΣiΣjCi,j(31)]]>在大視野中的非移動運動的情況下,該剩余矢量將不是平行的,但是應(yīng)該理想地接近于零。該見解導致由給出的方程式(32)計算β比例β=||Σv→i,jresidual(R→estim)||Σ||v→i,jresidual(R→estim)||(32)]]>其指示該剩余場的平行性。該是剩余流矢量的生成幅值對剩余流矢量的幅值和的比例β=1意味著該剩余矢量被完全校準,而β=0意味著該剩余矢量彼此相互隨機取向。而且,為了檢測攝像機運動中重要跟蹤分量的出現(xiàn),通過計算下面由方程式(33)給出的比例α,該剩余流場的強度與原始流場的強度比較a=mean(*)(||v→i,jresidual(R→estim)||)mean(*)(||v→i,j||)(33)]]>該"mean(*)"算子表示根據(jù)該置信掩碼的參數(shù)的加權(quán)平均值。這兩個比例使得能夠如下所示地檢測跟蹤分量的存在以及總量A)如果β~0,沒有跟蹤運動;B)如果β~1如果α~0,可忽略的跟蹤運動;如果α~1,重要的跟蹤運動;T^x=-Vxresidual]]>T^y=-Vyresidual]]>這些比例還給出結(jié)果相關(guān)的一個概念。
必須指出,平移運動的估算分量,即 x和 y不表示該第一模式的確切成份,而是表示在f.Tx/z和f.Ty/z的整個圖像之內(nèi)的一個加權(quán)平均值,因為不知道每一數(shù)據(jù)塊的深度。但是,它們是該成像中的明顯的跟蹤運動的良好的表示。
對于該平行性價值函數(shù)來說,已經(jīng)選擇了下傾單形最小化算法,因為其不包含導數(shù)的計算,由于該原始場是該價值函數(shù)的一部分,所以該導數(shù)的計算將是不可能的。下傾單形法是僅需要函數(shù)求值的一個多維的方法,不象許多其他方法,例如基于全梯度方法那樣。該下傾單形法沒有變形。在這里它是一個本性點,因為沒有該價值函數(shù)的解析形式。一個單形是幾何圖形,包括在N維中的N+1點(即頂點)以及所有它們的互連線段、多角形面等…兩維中單形是一個三角形,三維中單形是一個四面體等等。通常,僅考慮非退化的單形(即有限的N維體積的封閉體)。如果一個單形的任何點被取作原點,則其它N個點定義跨該N矢量空間的矢量方向。在一維最小化中,有可能標界一個最小值(兩分法),以保證隔離成功。
即便在多維空間中沒有模擬程序,該下傾單形法也是一個最適合這概念的一個單形法。該算法以獨立變量的N個矢量開始,作為首先嘗試點,然后假定構(gòu)成其自己的方式下傾通過該空間,直到其相遇將要封閉的至少一個局部的最小值為止。這種方法必須不只是以單一點開始,而是以定義一個初始的單形的N+1個點開始。隨后在每一步驟構(gòu)造一個新的單形。如圖6所示(左部分),主要步驟把函數(shù)是最大值(“最高最”)的該單形的脊點(tile point)移動通過該單形的對面而到一個較低點(反射)。這些種類的步驟節(jié)約了該單形的體積。對于擴展和收縮的過程使該單形法能夠加速沿著一個改進的成功軌跡并且在最佳條件上到最終位置(home)。當獲得要求的目標時,實際是當函數(shù)值中的減小量是小于某些容差ε的部分時,停止該算法。
使用的整個算法在圖7的流程圖給出。在初始化(開始操作)和借助函數(shù)值順序排列(步驟62)之后,執(zhí)行測試(f(.)<f(.)?)63、64、65、66、67、681)f(R)<f(W’)?a)如果“是”(Y),f(R)<f(B’)?ⅰ)如果“是”(Y),f(E)<f(B’)?-如果“是”(Y),由E替換W(輸出71)-如果“否”(N),由R替換W(輸出72)ⅱ)如果“否”(N),由R替換W;b)如果“否”(N),f(R)<f(W)?ⅰ)如果“是”(Y),由R替換W;ⅱ)如果“否”(N),由表達式(34)定義C(計算C)C=arg min[f(x)]pour×ε{C(+),C(-)}(34)并且執(zhí)行進一步的測試2)f(C)<f(W)?(a)如果“是”(Y),由C替換W(輸出73)(b)如果“否”(N),構(gòu)成多倍收縮(輸出74);3)在輸出71到74之后,f(W)-f(B)<ε?-如果“否”(N),反饋連接朝向步驟62;-如果“是”(Y),結(jié)束該算法(停止)。
利用下面的符號表示-f=RN→R,最小化函數(shù)(這里是一個平行性函數(shù));-W,C(-),C(+),R,E,N維點(C(-)=負收縮,C(+)=正收縮,R=反射,E=擴展,如圖6中右邊部分示出)-W’,B,B’f的次最差、最佳、和次最佳值的前提(則f(B)<f(B’)<…<f(W’)<f(W));有可能終點的計算由下式給出 由于對于最佳性能的影響難于控制,所以該系數(shù)被設(shè)置為最簡單的值,即γ=2,β(+)=β(-)=0,5。
權(quán)利要求
1.一種攝像機運動參數(shù)估計方法,提供用于考慮被細分為數(shù)據(jù)塊的連續(xù)圖像幀的一個序列并且處理該序列,其中所說的處理操作包括對應(yīng)的連續(xù)步驟-從所說的圖像序列提取對應(yīng)于兩個連續(xù)的幀之間的運動的矢量,所說的運動矢量形成該攝像機速度場;-預(yù)處理該攝像機速度場,以便降低數(shù)據(jù)量和所說提取的運動矢量的多相性;-從所說的預(yù)處理場估計用于每一個幀對的在兩個考慮幀之間的攝像機特征;-根據(jù)所說的估計實施一個長項運動分析,以便獲得對應(yīng)于該估算攝像機運動參數(shù)的運動描述符。
2.根據(jù)權(quán)利要求1的方法,為了降低矢量的總量,其中所說的預(yù)處理步驟包括子步驟-下采樣所說的運動矢量的原始速度場;-同時根據(jù)全局信息抑制不一致的矢量。
3.根據(jù)權(quán)利要求2的方法,其中所說的預(yù)處理子步驟包括根據(jù)四個原始數(shù)據(jù)塊的運動矢量以及一個相關(guān)的置信度對表示一個新數(shù)據(jù)塊的運動的一個矢量的計算操作。
4.根據(jù)權(quán)利要求3的方法,其中所說的置信度是通過從每一矢量到其鄰近值的距離給出的。
5.根據(jù)權(quán)利要求4的方法,其中所說的鄰近值由例如平均值或中值的一個值v(m)表示,把置信掩碼導引到具有以下類型表示的值CijCij=e-‖vi,j-v(m)‖2其中(i,j)定義該原始數(shù)據(jù)塊,并且vi,j定義其原始運動矢量。
全文摘要
本發(fā)明涉及攝像機運動參數(shù)的估計方法。被用于細分為數(shù)據(jù)塊的連續(xù)圖像幀的序列,并且包括下面步驟:從所說的圖像序列提取對應(yīng)于兩個連續(xù)的幀之間的運動的矢量,所說的運動矢量形成該攝像機速度場,預(yù)處理如此獲得的該攝像機速度場,以便降低數(shù)據(jù)量和該提取的運動矢量的多相性,從所說的預(yù)處理場估計用于每一個幀對的在兩個考慮幀之間的攝像機特征,并且根據(jù)所說的估計實施一個長項運動分析,以便獲得對應(yīng)于該估算攝像機運動參數(shù)的運動描述符。應(yīng)用于MIPEG-7之內(nèi)描述符的實施方案。
文檔編號H04N5/14GK1300503SQ99806129
公開日2001年6月20日 申請日期1999年12月24日 優(yōu)先權(quán)日1999年1月12日
發(fā)明者B·莫賴 申請人:皇家菲利浦電子有限公司