專利名稱::數(shù)字視頻信號(hào)的場景變化檢測器的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種用于檢測數(shù)字圖象幀(例如圖象)序列中場景變化的裝置和方法。特別是利用圖象幀中不同塊的亮度相對(duì)于前一幀中相應(yīng)塊的亮度的變化來提供可靠的場景變化指示。近來,用于給用戶家庭提供電視及其它音頻、視頻和/或數(shù)據(jù)服務(wù)的數(shù)字視頻傳輸格式越來越流行。這類節(jié)目可通過直播衛(wèi)星鏈路,或通過有線電視網(wǎng)傳輸?shù)接脩艏彝?。除提供新的和擴(kuò)大的節(jié)目源外,數(shù)字視頻可比傳統(tǒng)的模擬電視廣播提供更高的圖象質(zhì)量。為在可利用的帶寬內(nèi)傳輸數(shù)字視頻信號(hào),需使用數(shù)據(jù)壓縮技術(shù)。特別是,空間壓縮技術(shù)利用一幀中相鄰象素或象素塊之間的相關(guān)性,而時(shí)間技術(shù)則利用連續(xù)圖象幀中象素或象素塊之間的相關(guān)性。此外,運(yùn)動(dòng)補(bǔ)償技術(shù)可提供更大的時(shí)間壓縮。然而,為提供最佳的視頻幀序列的壓縮,需要有檢測該序列中場景變化的能力。場景變化通??啥x為幀的組成部分的任何顯著變化。例如,在電影的視頻序列中,當(dāng)攝相機(jī)的角度改變時(shí),或當(dāng)在特寫和全景之間進(jìn)行切換時(shí),會(huì)發(fā)生場景變化。此外,場景變化常常是通過連續(xù)視頻幀之間亮度級(jí)的明顯改變表現(xiàn)出來的。例如,當(dāng)在暗室中打開亮的燈時(shí),會(huì)發(fā)生場景變化。一旦檢測到場景變化,就可以相應(yīng)地修改視頻序列的編碼。例如,當(dāng)檢測到場景變化時(shí),由于新的場景的第一幀和前一場景最后一幀之間時(shí)間相關(guān)的可能性降低,可暫時(shí)中止運(yùn)動(dòng)補(bǔ)償。另外,可根據(jù)場景變化信息選擇圖象的具體類型(如I,P,或B圖象)。I,P,或B圖象是根據(jù)如下面將更詳細(xì)討論的MPEG-2標(biāo)準(zhǔn)來定義的。各種現(xiàn)有的場景檢測系統(tǒng)試圖提供可靠的場景變化檢測。例如,一種系統(tǒng)使用在當(dāng)前幀和前一幀之間相應(yīng)象素值之差的絕對(duì)值的和數(shù),并將此和數(shù)與預(yù)定的常數(shù)閾值比較以確定是否有場景變化。然而,如果在連續(xù)幀中發(fā)生快速運(yùn)動(dòng),該系統(tǒng)可能不能給出可靠的結(jié)果。另外,當(dāng)存在不同水平的運(yùn)動(dòng)(例如中速,快速,高速)時(shí),這種系統(tǒng)也并非始終都是可靠的。另一種系統(tǒng)確定當(dāng)前幀和前一幀之間相應(yīng)象素值之差的絕對(duì)值。然后確定當(dāng)前幀和下一幀之間相應(yīng)象素值之差的絕對(duì)值。最后得到上述兩差值的差值和數(shù),并將其與預(yù)定的常數(shù)閾值比較以確定是否有場景變化。然而,這一系統(tǒng)當(dāng)場景從沒有運(yùn)動(dòng)轉(zhuǎn)變?yōu)榭焖龠\(yùn)動(dòng)時(shí),可能不能提供可靠的結(jié)果。因此,需要提供一種用于數(shù)字視頻的場景檢測系統(tǒng),當(dāng)存在不同水平的運(yùn)動(dòng)時(shí),以及當(dāng)場景從沒有運(yùn)動(dòng)轉(zhuǎn)變?yōu)榭焖龠\(yùn)動(dòng)時(shí),該系統(tǒng)能夠可靠地檢測場景變化。而且,該系統(tǒng)應(yīng)與現(xiàn)有的包括運(yùn)動(dòng)圖象專家組(MPEG)標(biāo)準(zhǔn)的數(shù)字視頻編碼標(biāo)準(zhǔn)兼容,該標(biāo)準(zhǔn)的詳細(xì)情況可見這里作為參考資料編入的文件ISO/IECJTC1/SC29/WG11N0702,標(biāo)題為“信息技術(shù)-運(yùn)動(dòng)圖象及有關(guān)音頻的遺傳編碼,建議H.262,”March25,1994。MPEG系統(tǒng)包括三種類型的視頻圖象;它們分別是幀內(nèi)編碼圖象(I-圖象),預(yù)測編碼圖象(P-圖象)及雙向預(yù)測編碼圖象(B-圖象)。而且,幀或場結(jié)構(gòu)視頻序列都是適和的。I-圖象完整地描述單個(gè)視頻圖象,而不參考任何其它圖象。為了提高隱錯(cuò)能力,在I-圖象中可包括運(yùn)動(dòng)矢量。由于在底層(baselayer)中P-圖象和B-圖象都是從I-圖象預(yù)測的,因此I-圖象中的錯(cuò)誤有對(duì)所顯示的圖象產(chǎn)生更大影響的可能性。P圖象是根據(jù)前一I或P圖象預(yù)測的。參考是從前面的I或P圖象到將來的P-圖象,稱為前向預(yù)測。B-圖象是從最接近的后面的I或P圖象及最接近的后面的I或P圖象預(yù)測的。一個(gè)好的場景檢測系統(tǒng)還提供速率控制的自動(dòng)控制和視頻壓縮編碼器的自適應(yīng)量化處理,該編碼器使用各種標(biāo)準(zhǔn),包括MPEG-1,MPEG-2,ISO/IECH.261(視頻會(huì)議)及ISO/IECH.263。此外,該系統(tǒng)還應(yīng)與各種彩色電視廣播標(biāo)準(zhǔn)兼容,如在北美使用的國家電視標(biāo)準(zhǔn)委員會(huì)(NTSC)標(biāo)準(zhǔn),在歐洲使用的逐行倒相(PAL)標(biāo)準(zhǔn),并且該系統(tǒng)還應(yīng)和幀和場模式的視頻兼容。本發(fā)明提供具有上述和其它優(yōu)點(diǎn)的系統(tǒng)。根據(jù)本發(fā)明,提供一種檢測視頻圖象序列中前一圖象和當(dāng)前圖象之間場景變化的方法和裝置。在檢測前一視頻圖象和當(dāng)前視頻圖象之間場景變化的方法中,確定前一和當(dāng)前視頻圖象塊對(duì)的平均亮度值。塊對(duì)的塊最好在以前和當(dāng)前圖象中分別位于同一相對(duì)位置上。之后,用平均亮度值之間的差值來確定增量視覺檢測值。如果增量視覺檢測值超過塊對(duì)比閾值水平,則表示有場景變化。塊對(duì)比閾值水平可約為在本文中定義的韋伯(Weber)分?jǐn)?shù)常數(shù)的十五到二十五倍。特別是,確定當(dāng)前和前一圖象塊的平均亮度值的最小值,其中,如果這一最小值超過暗場景閾值,則用(a)平均亮度值之間差值的絕對(duì)值,和(b)當(dāng)前和前一圖象塊的平均亮度值的最小值之比來確定增量視覺檢測值。否則,用(a)差值的絕對(duì)值,和(b)暗場景閾值之比來確定增量視覺檢測值。暗場景閾值可約為最大灰度級(jí)的10%。此外,可確定前一和當(dāng)前視頻圖象多個(gè)塊對(duì)的平均亮度值之間的差值。最好用圖象中的每個(gè)塊對(duì)來確定總的圖象場景變化。用差值來確定每個(gè)塊對(duì)的增量視覺檢測值,其中,如果增量視覺檢測值超過塊對(duì)比閾值水平當(dāng)前和前一視頻圖象的塊對(duì)的閾值比例,則表示有場景變化。這一閾值比例可約為80%到90%。另外,通過確定塊對(duì)的塊之間的運(yùn)動(dòng)相對(duì)量,并根據(jù)該運(yùn)動(dòng)相對(duì)量來調(diào)節(jié)塊的大小,該方法可自適應(yīng)地優(yōu)化。特別是,當(dāng)運(yùn)動(dòng)相對(duì)量增加時(shí),增加塊的大小。此外,運(yùn)動(dòng)相對(duì)量可通過確定水平運(yùn)動(dòng)矢量的絕對(duì)值和垂直運(yùn)動(dòng)矢量的絕對(duì)值的和數(shù)來獲得,其中,水平和垂直運(yùn)動(dòng)矢量分別表示當(dāng)前圖象塊的視頻圖象相對(duì)于前一圖象塊的視頻圖象的水平和垂直運(yùn)動(dòng)。然后確定該和數(shù)是否超過了運(yùn)動(dòng)閾值。運(yùn)動(dòng)閾值可根據(jù)當(dāng)前圖象的圖象類型(例如,當(dāng)前圖象是否是I,P或B圖象)來調(diào)節(jié)。本發(fā)明還提供了相應(yīng)的裝置。圖1示出根據(jù)本發(fā)明兩相繼視頻幀的塊之間的比較。圖2是根據(jù)本發(fā)明的場景變化檢測器的方框圖。本發(fā)明提供一種檢測數(shù)字視頻幀序列中場景變化的方法和裝置。場景的輝度級(jí)由包括該場景的各象素的平均亮度和各象素亮度值的動(dòng)態(tài)范圍決定。此外,人眼對(duì)輝度的視覺檢測通常被認(rèn)為是圖象亮度的自然對(duì)數(shù)的函數(shù)。在場景變化的幀和/或場中,對(duì)輝度的視覺檢測隨前一幀或前一相應(yīng)場而明顯改變。而且,由于人對(duì)亮度的對(duì)比比對(duì)絕對(duì)亮度值本身更敏感,因此兩場景之間的增量視覺檢測δC是場景變化的一個(gè)好的標(biāo)志。δC定義為在兩幀和/或場中,具有同一相對(duì)位置的區(qū)域(例如塊)的平均輝度之差值。特別是,根據(jù)韋伯定理,如果一物體的亮度b0與周圍區(qū)域的亮度bs之間的差別正好是可察覺的,則可定義下面被稱為韋伯分?jǐn)?shù)的比值在高的背景亮度級(jí),例如大于0.5mL(毫流明)時(shí),韋伯分?jǐn)?shù)基本保持為常數(shù)。已發(fā)現(xiàn)該常數(shù)C的值為0.02,這意味著在0到1的刻度上,對(duì)于人可察覺的級(jí)之間的對(duì)比,至少需要五十個(gè)不同的亮度級(jí)。令b0=b,則有bs=b+δb,其中δb是最小可察覺的亮度變化。這樣,這顯示是與輝度增量視覺檢測值成比例的。圖1示出根據(jù)本發(fā)明兩相繼視頻幀的塊之間的比較。當(dāng)前幀,即幀(i),在100上示出,它包括塊110。前一幀,即幀(i-1),在150上示出,它包括塊160,該塊在幀150中位于與幀100中的塊110同一相對(duì)位置上。例如,對(duì)于NTSC格式,幀100和150可各包括三十片(slice),每一片有四十四個(gè)宏塊。這樣,整個(gè)NTSC幀包括1,320個(gè)宏塊。而且,宏塊一般包括一個(gè)16×16的象素塊,在MPEG-2標(biāo)準(zhǔn)中,該塊例如是由四個(gè)8×8的象素塊構(gòu)成的。從而,一個(gè)NTSC幀可能包括在寬度上為44×16=704個(gè)象素,在高度上為30×16=480個(gè)象素,總數(shù)為337,920個(gè)象素。此外,本發(fā)明與PAL格式是兼容的,該格式包括在36片中的1,584個(gè)宏塊,每片有44個(gè)模塊,每個(gè)宏塊有16×16個(gè)象素。塊110和160用坐標(biāo)組(k,l)表示,其中k是塊的水平索引,l是垂直索引。此外,每個(gè)塊110和160的大小可為例如在高度上為16個(gè)象素而寬度上為32個(gè)象素。在這種情況下,k的范圍從1到704/32=22,l的范圍從1到480/16=30。下面各項(xiàng)定義為h幀高度(象素)w幀寬度(象素)m塊高度(象素)n塊寬度(象素)i幀索引k水平塊索引(k=1,...,h/m)l垂直塊索引(l=1,...,w/n)Xi,k,l,第i個(gè)幀,第k個(gè)水平塊,第l個(gè)垂直塊的象素密度這樣,我們有了由象素組定義的兩個(gè)相繼幀和/或兩個(gè)頂(top)(或底(bottom))場。特別是,第(i)幀,即幀100由象素組Xi,k,l來定義,第(i-1)幀,即幀150由象素組Xi-1,k,l來定義。為有效地分辨場景變化,將每幀劃分為一組k×l的分開的塊,每塊有m×n個(gè)象素。注意塊的大小可設(shè)計(jì)為根據(jù)當(dāng)前運(yùn)動(dòng)信息自適應(yīng)地改變。特別是運(yùn)動(dòng)越快,則塊大小m×n應(yīng)越大。根據(jù)運(yùn)動(dòng)量對(duì)于每一幀調(diào)節(jié)塊大小的一種方法是執(zhí)行下列步驟。首先,對(duì)于每個(gè)16×16的宏塊,計(jì)算索引v[x][y],其中x=1,2,....,[w/16],y=1,2,...,[h/16]。如果全象素前向運(yùn)動(dòng)矢量,即vector[x][y][z]滿足下列不等式|vector[x][y]|+|vector[x][y][1]|>T3,則表示兩塊之間有快速運(yùn)動(dòng)。vector[x][y]和vector[x][y][1]分別為當(dāng)前幀塊(例如塊(x,y))相對(duì)于前一幀塊的水平和垂直運(yùn)動(dòng)矢量。這樣,如果不等式成立,則令索引v[x][y]=1;否則令v[x][y]=0。注意運(yùn)動(dòng)矢量vector[x][y][z]是從具有同樣圖象類型的最近的可利用的圖象獲得的。例如,如果當(dāng)前圖象類型是P-圖象,則運(yùn)動(dòng)矢量vector[x][y][z]是以前的預(yù)測P-圖象的運(yùn)動(dòng)矢量。由于對(duì)于每個(gè)圖象的場景變化檢測發(fā)生在圖象的運(yùn)動(dòng)估值之前,因此這是正確的。閾值T3是根據(jù)視頻幀序列中出現(xiàn)的不同圖象類型來選擇的。例如,如果比特流中沒有B-圖象,例如序列I,P,P,...則T3=16是合適的選擇。如果出現(xiàn)一個(gè)B-圖象,例如序列P,B,P,B,...,則在當(dāng)前圖象是B-圖象時(shí),T3=16是合適的選擇,在當(dāng)前圖象是P-圖象時(shí),T3=32是合適的選擇,如此等等。其次,相應(yīng)地調(diào)節(jié)塊大小。可使用初始(缺省)的16×16的塊大小。然后,可根據(jù)v[x][y]調(diào)節(jié)塊大小。例如,如果v[x][y]=1,則可增加塊大小,例如增至16×32或32×32。類似地,如果v[x][y]=0,則可減小塊大小,例如減至8×16。但注意塊大小的增加不能使得塊超過宏塊的右和/或底邊界。通常,當(dāng)運(yùn)動(dòng)越快時(shí),塊大小應(yīng)越大。而且,在某些應(yīng)用中,最大允許的塊大小可能被限制在32×48個(gè)象素。接下來,確定在幀(或頂場)中每塊的平均亮度。對(duì)于第(i)幀,塊(k,l),平均亮度為Bi,k,l=1mnΣc1=0m-1Σc2=0n-1Xi,kh+c1,lw+c2]]>k=1,...h/m,l=1,...,w/n。c1和c2為虛設(shè)的計(jì)數(shù)索引。之后,第(i)和第(i-1)幀(或頂場)之間的塊亮度增量δBi,k,l由下式確定δBi,k,l=δBi,k,l-δBi-1,k,l此外,對(duì)于第(i)幀,塊(k,l),可定義相對(duì)塊增量對(duì)比δCi,k,l如下T0是表示場景被認(rèn)為是暗場景的閾值。通常,可使用T0=25.5,該值是最大灰度級(jí)255的10%。對(duì)于場景變化,將塊亮度對(duì)比的相對(duì)變化的有效閾值T1設(shè)置為T1=15-25C。現(xiàn)在,考慮索引陣列,對(duì)于k=1,...,h/m,l=1,...,w/n,index[k][l]定義為那么,如果一幀中塊的約80%-90%具有比有效閾值大的相對(duì)塊增量對(duì)比,即其中T2=80%-90%則根據(jù)本發(fā)明,這表示有場景變化。80%-90%的范圍是根據(jù)大范圍的測試確定的,但實(shí)際的最佳值可隨具體的場景而改變。注意數(shù)學(xué)表示式代表將非整數(shù)x舍入成下一個(gè)最小的整數(shù)。圖2是根據(jù)本發(fā)明的場景變化檢測器的方框圖。檢測器,在200上示出,包括輸入端205和210。在輸入端205,接收來自當(dāng)前幀的象素?cái)?shù)據(jù)xi,k,l,并將其提供給塊平均函數(shù)215以為第i幀中的每一塊產(chǎn)生平均亮度值Bi,k,l。類似地,在輸入端210,接收來自前一幀的象素?cái)?shù)據(jù)xi-1,k,l,并將其提供給塊平均函數(shù)220以為第(i-1)幀中的每一塊產(chǎn)生平均亮度值Bi-1,k,l。最小化單元擬(MIN)225確定min{Bi,k,l,Bi-1,k,l}并將該項(xiàng)輸出到除法器(divisor)函數(shù)230中。同時(shí),減法器235確定δBi,k,l=Bi,k,l-Bi-1,k,l。絕對(duì)值函數(shù)240確定|δBi,k,l|,并將該項(xiàng)提供給除法器230。除法器230根據(jù)是否min{Bi,k,l,Bi-1,k,l)>T0。為第(i)幀,塊(k,l)確定相對(duì)塊增量對(duì)比δCi,k,l。然后將δCi,k,l提供給閾值函數(shù)235,該函數(shù)235確定塊(k,l)是否表示有場景變化(例如是否δCi,k,l>T1)。如果是,可相應(yīng)地設(shè)定index[k][l]。累加器240累加每塊的場景變化結(jié)果,并對(duì)整個(gè)幀或其一部分的結(jié)果求和。最后,閾值函數(shù)25O接收來自累加器240的相加的結(jié)果,并用閾值T2確定是否表示整個(gè)幀有場景變化。用不同的視頻序列對(duì)本發(fā)明的場景變化檢測系統(tǒng)進(jìn)行了大范圍的測試。特別是對(duì)在測試模式編輯委員會(huì)“TestModel5”,ISO/IECJTC1/SC29/WG11MPEG93/457,April1993中描述的“Football”,“MobileCalendar”,“FlowerGarden”及“Tabletennis”視頻序列以及在關(guān)于MPEG-4視頻VM編輯的特設(shè)組,“MPEG-4視頻確認(rèn)模型版本3.0”,ISO/IECJTC1/SC29/WG11N1277,Tampere,F(xiàn)inland,July1996中描述的“Destruct”,“StreetOrgan”,“Silent”及“FunFair”視頻序列進(jìn)行了分析。本發(fā)明場景檢測系統(tǒng)的樣本測試結(jié)果示于下面的表1中。閾值選擇為T1=0.3和T2=0.85,塊大小為m=16,n=32。具體的視頻序列在第一欄中給出。所涉及的幀序列示于第二欄中。例如,表示分析了0到50幀的場景變化。第三欄表示是否檢測到場景變化,且如果是,是在哪一幀。例如,第三幀中的場景變化意味著在第二和第三幀之間檢測到場景變化。第四欄,如果可使用,提供有關(guān)視頻序列特性的額外信息。表1</tables>此外,對(duì)于在上面視頻序列中檢測到場景變化的幀,使用MPEG-2WG-11方案檢查編碼效率。通過確定由達(dá)到所給圖象質(zhì)量的編碼方法產(chǎn)生的比特?cái)?shù)來確定編碼效率。特別地,對(duì)于一恒定的質(zhì)量水平,較少的編碼比特表示較高的編碼效率。如果有根據(jù)本發(fā)明檢測的場景變化的幀被編碼為P-圖象類型,則多于46%的宏塊被編碼為I-圖象。于是,發(fā)現(xiàn)本發(fā)明的場景檢測系統(tǒng)如所預(yù)期的那樣工作,因?yàn)樗晒Φ貙⒂妙A(yù)測編碼技術(shù)難于有效地編碼的幀定位。由于編碼器的速率控制工具給I-圖象分配更多的比特,這樣的幀可被方便地編碼為I-圖象,從而也改善了圖象質(zhì)量。通常,在典型的編碼器中,如使用TestModel5標(biāo)準(zhǔn)的MPEG-2編碼器,對(duì)于P-圖象或B-圖象的每一宏塊有一個(gè)選擇宏塊編碼類型的過程。這一過程將決定是應(yīng)將宏塊編碼為幀內(nèi)編碼塊(I-編碼)還是非幀內(nèi)編碼塊(P-或B-編碼),這要基于哪種編碼類型可提供更好的質(zhì)量或使用更少的數(shù)據(jù)比特。對(duì)于P-圖象或B-圖象,如果預(yù)測是有效的,則圖象中只有小比例的宏塊將為I-編碼(例如少于百分之五)。這是必要的,因?yàn)镮-編碼塊由于沒有時(shí)間壓縮而要使用相對(duì)來說大量的數(shù)據(jù)比特。如果圖象中I-編碼的宏塊比例大于例如百分之三十或四十,圖象質(zhì)量就會(huì)不好。在這種情況下,在場景變化處,如所與預(yù)期的一樣,預(yù)測編碼對(duì)于該圖象是無效的。這樣,當(dāng)發(fā)生場景變化時(shí),通常需要新場景的第一幀不被編碼為P-圖象。雖然結(jié)合各個(gè)特定的實(shí)施例來描述了本發(fā)明,但本領(lǐng)域技術(shù)人員懂得對(duì)其可做多種修改和變化而不脫離如在權(quán)利要求中提出的本發(fā)明的實(shí)質(zhì)和范圍。例如,在此提出的各閾值水平可根據(jù)所分析的具體場景或視頻序列來調(diào)節(jié)。即,有些類型的視頻序列,如動(dòng)作電影,其特點(diǎn)可能是有更頻繁和顯著的場景變化活動(dòng)。而且,特定的照明情況可能與具體的視頻序列有關(guān),例如恐怖電影,其中相對(duì)來說低的照明水平可能貫穿于整個(gè)序列中。在這種情況下,可相應(yīng)調(diào)節(jié)場景變化檢測閾值。此外,可能需要僅對(duì)視頻圖象的一部分進(jìn)行分析以確定場景變化,或者可用不同的閾值分析不同的部分。例如,在具有在圖象底部的相對(duì)來說暗的地面及圖象頂部的相對(duì)來說亮的天空的風(fēng)景場景的視頻序列中,對(duì)于圖象的底部,可使用更靈敏的場景變化閾值。類似地,在圖象的不同區(qū)域可使用不同大小的塊。例如,當(dāng)向圖象中部的運(yùn)動(dòng)比向圖象邊緣的運(yùn)動(dòng)更普遍時(shí),可在圖象的中部使用更大的塊。權(quán)利要求1.一種檢測前一視頻圖象和當(dāng)前視頻圖象之間場景變化的方法,包括下列步驟確定所述前一和當(dāng)前視頻圖象的塊對(duì)的平均亮度值;以及用所述平均亮度值之間的差值來確定增量視覺檢測值;其中如果所述增量視覺檢測值超過塊對(duì)比閾值水平,則表示有場景變化。2.如權(quán)利要求1的方法,其中所述塊對(duì)比閾值水平為韋伯分?jǐn)?shù)常數(shù)的約十五到二十五倍。3.如權(quán)利要求1或2的方法,其中所述塊對(duì)的所述塊在所述前一和當(dāng)前圖象中分別位于同一相對(duì)位置。4.如前面權(quán)利要求之一的方法,還包括下列步驟確定所述當(dāng)前和前一圖象塊的所述平均亮度值的最小值,其中如果所述最小值超過暗場景閾值,則用(a)所述差值的絕對(duì)值,和(b)所述最小值之比來確定所述增量視覺檢測值;否則,用(a)所述差值的絕對(duì)值,和(b)所述暗場景閾值之比來確定所述增量視覺檢測值。5.如權(quán)利要求4的方法,其中所述暗場景閾值約為最大灰度級(jí)的10%。6.如前面權(quán)利要求之一的方法,其中確定所述前一和當(dāng)前視頻圖象的多個(gè)塊對(duì)的平均亮度值之間的所述差值;以及用所述差值來確定每個(gè)所述塊對(duì)的所述增量視覺檢測值;其中如果所述增量視覺檢測值超過塊對(duì)比閾值水平所述當(dāng)前和前一視頻圖象中塊對(duì)的閾值比較,則表示有場景變化。7.如權(quán)利要求6的方法,其中所述閾值比例為約80%到90%。8.如前面權(quán)利要求之一的方法,還包括下列步驟確定所述塊對(duì)的所述塊之間的運(yùn)動(dòng)的相對(duì)量;以及根據(jù)所述運(yùn)動(dòng)相對(duì)量來調(diào)節(jié)所述塊的大小。9.如權(quán)利要求8的方法,其中當(dāng)所述運(yùn)動(dòng)相對(duì)量增加時(shí),增加所述塊的大小。10.如權(quán)利要求8的方法,其中所述確定運(yùn)動(dòng)相對(duì)量的步驟還包括下列步驟確定水平運(yùn)動(dòng)矢量的絕對(duì)值與垂直運(yùn)動(dòng)矢量的絕對(duì)值的和數(shù);其中所述水平與垂直運(yùn)動(dòng)矢量分別表示所述當(dāng)前圖象塊的視頻圖象相對(duì)于所述前一圖象塊的視頻圖象的水平和垂直運(yùn)動(dòng);以及確定所述和數(shù)是否超過運(yùn)動(dòng)閾值。11.如權(quán)利要求10的方法,其中根據(jù)所述當(dāng)前圖象的圖象類型來調(diào)節(jié)所述運(yùn)動(dòng)閾值。12.一種檢測前一視頻圖象和當(dāng)前視頻圖象之間場景變化的裝置,包括用于確定所述前一和當(dāng)前視頻圖象塊對(duì)的平均亮度值的設(shè)備;以及用來用所述平均亮度值之間的差值來確定增量視覺檢測值的設(shè)備;其中如果所述增量視覺檢測值超過塊對(duì)比閾值水平,則表示有場景變化。13.如權(quán)利要求12的裝置,其中所述塊對(duì)比閾值水平為韋伯分?jǐn)?shù)常數(shù)的約十五到二十五倍。14.如權(quán)利要求12或13的裝置,還包括用于確定所述當(dāng)前和前一圖象塊的所述平均亮度值的最小值的設(shè)備,其中如果所述最小值超過暗場景閾值,則用(a)所述差值的絕對(duì)值,和(b)所述最小值之比來確定所述增量視覺檢測值;否則,用(a)所述差值的絕對(duì)值,和(b)所述暗場景閾值之比來確定所述增量視覺檢測值。15.如權(quán)利要求12至14的裝置,還包括用于確定所述前一和當(dāng)前視頻圖象的多個(gè)塊對(duì)的平均亮度值之間的所述差值的設(shè)備;以及用所述差值來確定每個(gè)所述塊對(duì)的所述增量視覺檢測值的設(shè)備;其中如果所述增量視覺檢測值超過塊對(duì)比閾值水平所述當(dāng)前和前一視頻圖象中塊對(duì)的閾值比例,則表示有場景變化。16.如權(quán)利要求15的裝置,其中所述閾值比例為約80%到90%。17.如權(quán)利要求12至16的裝置,還包括用于確定所述塊對(duì)的所述塊之間運(yùn)動(dòng)相對(duì)量的設(shè)備;以及用于根據(jù)所述運(yùn)動(dòng)相對(duì)量來調(diào)節(jié)所述塊的大小的設(shè)備。18.如權(quán)利要求17的裝置,還包括用于當(dāng)所述運(yùn)動(dòng)相對(duì)量增加時(shí),增加所述塊的大小的設(shè)備。19.如權(quán)利要求17的裝置,其中于所述確定運(yùn)動(dòng)相對(duì)量的設(shè)備還包括用于確定水平運(yùn)動(dòng)矢量的絕對(duì)值與垂直運(yùn)動(dòng)矢量的絕對(duì)值的和數(shù)的設(shè)備;其中所述水平和垂直運(yùn)動(dòng)矢量分別表示所述當(dāng)前圖象塊的視頻圖象相對(duì)于所述前一圖象塊的視頻圖象的水平和垂直運(yùn)動(dòng);以及用于確定所述和數(shù)是否超過運(yùn)動(dòng)閾值的設(shè)備。20.如權(quán)利要求19的裝置,還包括用于根據(jù)所述當(dāng)前圖象的圖象類型來調(diào)節(jié)所述運(yùn)動(dòng)閾值的設(shè)備。全文摘要檢測圖象序列的前一視頻圖象和當(dāng)前視頻圖象間場景變化的方法。確定前一和當(dāng)前視頻圖象塊對(duì)的平均亮度值。用平均亮度值的差值確定增量視覺檢測值。若增量視覺檢測值超過塊對(duì)比閾值水平表示有場景變化。若當(dāng)前和前一圖象塊平均亮度值的最小值超過暗場景閾值,則用平均亮度值差值的絕對(duì)值和當(dāng)前和前一圖象塊的平均亮度值的最小值之比確定增量視覺檢測值。否則,用差值的絕對(duì)值和暗場景閾值之比確定增量視覺檢測值。文檔編號(hào)H04N7/26GK1180276SQ9711891公開日1998年4月29日申請(qǐng)日期1997年9月26日優(yōu)先權(quán)日1996年9月27日發(fā)明者陳學(xué)敏,劉承德申請(qǐng)人:次級(jí)系統(tǒng)有限公司