專利名稱:使用場(chǎng)景變化檢測(cè)的處理方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種允許自動(dòng)檢測(cè)H.264/AVC視頻流中的平緩場(chǎng)景轉(zhuǎn)變的方法。該方法基于使用H.264引入的新的編碼參數(shù),能夠獲得非常有效的和節(jié)省成本的檢測(cè)。
背景技術(shù):
在最近幾年,國(guó)際視頻編碼標(biāo)準(zhǔn)已經(jīng)在促進(jìn)數(shù)字視頻在各種專業(yè)和用戶應(yīng)用中采用扮演了關(guān)鍵的角色。大多數(shù)有影響的標(biāo)準(zhǔn)由兩個(gè)組織發(fā)展ITU-T和ISO/IEC MPEG,有時(shí)由兩個(gè)組織聯(lián)合發(fā)展(例如MPEG-2/H.262)。最新的聯(lián)合標(biāo)準(zhǔn)是H.264/AVC,其被期待在2003年作為推薦H.264/AVC被ITU-T正式批準(zhǔn),并且作為國(guó)際標(biāo)準(zhǔn)14496-10(MPEG-4第10部分)改進(jìn)的視頻編碼(AVC)被ISO/IEC正式批準(zhǔn)。H.264/AVC標(biāo)準(zhǔn)化的主要目的是獲得壓縮性能中的顯著成果并且提供“網(wǎng)絡(luò)友好的”視頻表示尋址“會(huì)話式的”(電話)和“非會(huì)話式的”(存儲(chǔ),廣播,流傳送)應(yīng)用。目前,H.264/AVC被廣泛承認(rèn)相對(duì)于現(xiàn)存的標(biāo)準(zhǔn)能夠提供顯著改進(jìn)的速度失真效率(rate-distortion efficiency),并且在其它的標(biāo)準(zhǔn)化實(shí)體諸如DVB-和DVD-論壇中也考慮基于H.264/AVC的解決方法。H.264/AVC編碼器/解碼器的實(shí)施已經(jīng)是可得到的,例如參見(jiàn)“新興H.264標(biāo)準(zhǔn)概述和TMS320C64x數(shù)字媒體平臺(tái)實(shí)施-白皮書(shū)(Emerging H.264 standardoverview and TMS320c64xDigital Media Platform Implementation-white paper)”,網(wǎng)址http///www.ubvideo.com/public.在互聯(lián)網(wǎng)上還存在不斷增長(zhǎng)的站點(diǎn),提供關(guān)于H.264/AVC的信息,其中ITU-T/MPEG JVT[聯(lián)合視頻組]的官方數(shù)據(jù)庫(kù)(官方H.264文獻(xiàn)和JVT的軟件在ftp//ftp.imtc-files.org/jvt-experts/)提供對(duì)于反映H.264/AVC的發(fā)展和狀態(tài)(包括草圖更新)的文獻(xiàn)的自由訪問(wèn)。
這里可以回憶H.264/AVC句法和編碼工具。首先,H.264/AVC采用基于塊的運(yùn)動(dòng)補(bǔ)償轉(zhuǎn)換編碼的相同原理,其從現(xiàn)有的標(biāo)準(zhǔn)諸如MPEG-2中可得知。因此,H.264句法被組織為通常的分層結(jié)構(gòu),包括標(biāo)題(諸如圖像-、片段-和宏塊標(biāo)題)和數(shù)據(jù)(諸如運(yùn)動(dòng)矢量,塊轉(zhuǎn)換系數(shù),量化尺度等等)。雖然保留了與數(shù)據(jù)結(jié)構(gòu)有關(guān)的大部分已知概念(例如,I,P,或B圖像,內(nèi)部和中間宏塊),但是在標(biāo)題和數(shù)據(jù)層中也引入了一些新概念。H.264/AVC主要分離視頻編碼層(VCL)和網(wǎng)絡(luò)抽象層(NAL),視頻編碼層被限定為有效地表示視頻數(shù)據(jù)的內(nèi)容,網(wǎng)絡(luò)抽象層格式化數(shù)據(jù)并且以適合于由更高級(jí)(傳送)系統(tǒng)傳送的方式提供標(biāo)題信息。
H.264/AVC在數(shù)據(jù)級(jí)的一個(gè)主要特性同樣是使用更精細(xì)的分割和操作的16×16宏塊(一個(gè)宏塊MB包括一個(gè)16×16亮度塊和相應(yīng)的8×8色度塊,但是許多操作,例如運(yùn)動(dòng)估計(jì),實(shí)際上只需用亮度并且將結(jié)果投射在色度上)。因此,使用準(zhǔn)確度高達(dá)四分之一采樣?xùn)鸥竦倪\(yùn)動(dòng)矢量,運(yùn)動(dòng)補(bǔ)償處理可以形成小至4×4尺寸的MB的分割。同樣,用于采樣塊的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)的選擇處理可以包含多個(gè)存儲(chǔ)的先前解碼的圖像,而不是只有鄰近的一個(gè)。即使使用內(nèi)部編碼,使用先前從相鄰塊解碼的采樣現(xiàn)在也可能形成一個(gè)塊的預(yù)測(cè)(用于基于空間的預(yù)測(cè)的原理通過(guò)所謂的內(nèi)部預(yù)測(cè)模式來(lái)描述)。在運(yùn)動(dòng)補(bǔ)償或基于空間的預(yù)測(cè)之后,得到的預(yù)測(cè)誤差通常基于4×4的塊尺寸被變換和量化,而不使用傳統(tǒng)的8×8尺寸。這方面與在下文中限定的本發(fā)明尤其相關(guān),并且在下文中突出描述。H.264/AVC還使用其它的具體實(shí)現(xiàn)(例如熵編碼),它們中的大多數(shù)是固定的或者可以在圖像級(jí)或在圖像級(jí)之上改變。
關(guān)于運(yùn)動(dòng)補(bǔ)償,H.264/AVC的一般概念和特性同樣被調(diào)用,大部分現(xiàn)有的視頻編碼標(biāo)準(zhǔn),諸如MPEG-2,固有地使用基于塊的運(yùn)動(dòng)補(bǔ)償作為利用視頻中連續(xù)圖像之間的相關(guān)性的有用方法。該方法通過(guò)在鄰近的、以前解碼的參考幀中它的“最佳匹配”來(lái)設(shè)法預(yù)測(cè)給定圖像中的每個(gè)宏塊。如果宏塊和它的預(yù)測(cè)之間的逐像素的差值足夠小,對(duì)這個(gè)差值(或殘差)進(jìn)行編碼,而不是編碼宏塊本身。相對(duì)于實(shí)際MB的柵格位置的預(yù)測(cè)塊的相對(duì)位移以運(yùn)動(dòng)矢量表示,其被獨(dú)立編碼。圖1示出雙向預(yù)測(cè)的例子,其中使用兩個(gè)參考圖像Pi和Pi+1,一個(gè)在過(guò)去并且一個(gè)在將來(lái)(以顯示順序)。以這種方式預(yù)測(cè)的圖像(諸如圖1中的Bi)叫做B圖像。否則,僅僅參考過(guò)去的圖像而被預(yù)測(cè)的圖像叫做P圖像。
使用H.264/AVC,這些基本概念被進(jìn)一步詳細(xì)描述。首先,H.264/AVC中的運(yùn)動(dòng)補(bǔ)償是基于多個(gè)參考圖像預(yù)測(cè)的在更遠(yuǎn)的過(guò)去或?qū)?lái)的圖像中觀測(cè)用于給定塊的匹配,而不是僅僅在相鄰圖像中。其次,H.264/AVC允許將MB分割為更小的塊,并且分別預(yù)測(cè)這些塊中的每一個(gè)塊。這意味著用于給定MB的預(yù)測(cè)可以原則上由不同的塊組成,其是用不同的運(yùn)動(dòng)矢量并且從不同的參考圖像重新得到的。預(yù)測(cè)塊的數(shù)量、尺寸和方向由中間模式的選擇唯一確定。限定了幾個(gè)這樣的模式,允許塊尺寸16×8、8×8等等直到4×4。
H.264/AVC中的另一個(gè)改進(jìn)允許運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)信號(hào)被加權(quán)并且偏移由編碼器指定的量。這意味著在與從先前幀P(i-n)和P(i-1)和后面的幀P(i+j)和P(i+m)預(yù)測(cè)的幀B(i)有關(guān)的雙向預(yù)測(cè)的情況中,編碼器可以選擇不同的量,來(lái)自過(guò)去的預(yù)測(cè)塊和來(lái)自將來(lái)的預(yù)測(cè)塊按照所述量而貢獻(xiàn)于總的預(yù)測(cè)中。這個(gè)特性允許顯著地改進(jìn)包含圖像衰減的場(chǎng)景的編碼效率。
但是問(wèn)題在于接下來(lái)的這個(gè)。最近在計(jì)算、通信和數(shù)字?jǐn)?shù)據(jù)存儲(chǔ)中的進(jìn)展已經(jīng)導(dǎo)致大的數(shù)字檔案的極大的增長(zhǎng),其特征在于不斷增長(zhǎng)的容量和內(nèi)容種類。因此找到迅速恢復(fù)感興趣的存儲(chǔ)信息的有效方法是很重要的。由于手動(dòng)搜索無(wú)組織存儲(chǔ)的千兆字節(jié)的數(shù)據(jù)是乏味的和耗費(fèi)時(shí)間的,因此存在傳遞信息搜索和恢復(fù)任務(wù)到自動(dòng)系統(tǒng)的日益增長(zhǎng)的需要。通常在已經(jīng)使用內(nèi)容分析技術(shù)對(duì)內(nèi)容進(jìn)行索引之后,才在未結(jié)構(gòu)化的視頻內(nèi)容的大的檔案中執(zhí)行搜索和恢復(fù)。這些技術(shù)是基于諸如圖像處理、模式識(shí)別和人工智能的算法,其目的在于考慮到所述視頻內(nèi)容的描述來(lái)自動(dòng)建立視頻素材的注釋(這樣的注釋包含從諸如色彩和紋理等特性的低級(jí)信號(hào)到諸如臉的出現(xiàn)和位置的高級(jí)信息)。
最重要的內(nèi)容描述符之一是鏡頭邊界指示符,例如參見(jiàn)國(guó)際專利申請(qǐng)WO01/03429(PHF99593)。一個(gè)鏡頭是使用單個(gè)攝像機(jī)連續(xù)拍攝的視頻片段,并且鏡頭通常被認(rèn)為是組成視頻的基本單元。檢測(cè)鏡頭邊界從而意味著恢復(fù)這些基本視頻單元,其依次又提供用于幾乎所有現(xiàn)存的視頻抽象和高級(jí)視頻分段算法的背景(參見(jiàn)例如文獻(xiàn)“視頻提取(video abstracting)”,作者R.Lienhart等,ACM通信,40(12),1997,第55至62頁(yè))。
在視頻編輯期間,使用鏡頭過(guò)渡連接鏡頭,可以分為至少兩類過(guò)渡突然的過(guò)渡和平緩的過(guò)渡。突然的過(guò)渡,也叫做硬切換并且對(duì)于兩個(gè)鏡頭沒(méi)有任何修改而獲得,是相當(dāng)容易檢測(cè)的,并且在所有種類的視頻產(chǎn)品中它們構(gòu)成了大多數(shù)。平緩的過(guò)渡,諸如衰減、逐漸消隱和劃變(wipe)是通過(guò)對(duì)所涉及的兩個(gè)鏡頭施加一些變換而獲得的。在視頻產(chǎn)生期間,仔細(xì)選擇每個(gè)過(guò)渡類型以便支持視頻序列的內(nèi)容和前后關(guān)系。因此,自動(dòng)地恢復(fù)所有它們的位置和種類可以幫助機(jī)器減少高級(jí)語(yǔ)義。例如,在故事片中,通常使用逐漸消隱來(lái)表示時(shí)間過(guò)渡。而且,與新聞廣播、運(yùn)動(dòng)、喜劇和展覽相比,逐漸消隱更經(jīng)常出現(xiàn)在放映電影、記錄片、傳記體的和舞臺(tái)的視頻素材中。而對(duì)于劃變情形正好。因此,過(guò)渡和它們的種類的自動(dòng)檢測(cè)可以用于視頻種類的自動(dòng)識(shí)別。
因?yàn)閷?duì)于即將到來(lái)的H.264/AVC標(biāo)準(zhǔn)的大的應(yīng)用范圍,對(duì)于H.264/AVC視頻內(nèi)容分析的有效解決方法存在著日益增長(zhǎng)的需要。最近幾年,幾個(gè)有效的內(nèi)容分析算法和方法已經(jīng)在MPEG-2視頻中得到了論證,其幾乎專門在壓縮中操作。由于H.264/AVC限定了MPEG-2語(yǔ)法超集,所以多數(shù)這種方法能夠擴(kuò)展到H.264/AVC,如上所述。但是,由于MPEG-2的限制,這些現(xiàn)存的方法不能給出足夠的或可靠的性能,這是一種缺陷,典型地通過(guò)包括額外的和通常成本高的操作在像素或音頻域的方法來(lái)解決。
發(fā)明內(nèi)容
因此本發(fā)明的目的是提供一種能夠避免在以下情況中的所有缺陷的方法,其中以要被預(yù)測(cè)的幀的過(guò)去和將來(lái)的不同預(yù)測(cè)量來(lái)進(jìn)行幀的加權(quán)預(yù)測(cè)。
為此目的,本發(fā)明涉及一種處理可以視頻流的形式獲得的數(shù)字編碼視頻數(shù)據(jù)的方法,所述視頻流由分割為宏塊的連續(xù)幀組成,所述幀包括至少獨(dú)立編碼的I幀、時(shí)間上位于所述I幀之間并且從至少一個(gè)先前I或P幀預(yù)測(cè)的P幀、以及B幀,B幀在時(shí)間上位于I幀和P幀之間或者兩個(gè)P幀之間并且從它被放置于其間的至少這兩個(gè)幀雙向預(yù)測(cè)得到,通過(guò)一個(gè)對(duì)來(lái)自過(guò)去和將來(lái)的預(yù)測(cè)具有不相同的量的加權(quán)預(yù)測(cè)來(lái)執(zhí)行所述預(yù)測(cè),所述處理方法包括步驟-對(duì)于當(dāng)前幀的每個(gè)連續(xù)宏塊確定表征所述加權(quán)預(yù)測(cè)(如果有的話)的相關(guān)的編碼參數(shù);-對(duì)于當(dāng)前幀的所有連續(xù)宏塊收集所述參數(shù),以傳送涉及所述參數(shù)的統(tǒng)計(jì)量;-分析所述統(tǒng)計(jì)量,以確定預(yù)測(cè)方向的優(yōu)先變化;-每當(dāng)優(yōu)先變化被確定時(shí)就檢測(cè)幀序列中平緩場(chǎng)景變化的出現(xiàn)。
更準(zhǔn)確地,根據(jù)本發(fā)明,分析步驟被提供用于將具有相同方向優(yōu)先選擇和相似加權(quán)的宏塊的數(shù)量與針對(duì)當(dāng)前幀中的宏塊總數(shù)量而導(dǎo)出的預(yù)定閾值相比較。優(yōu)選地,產(chǎn)生與每個(gè)場(chǎng)景變化的位置和持續(xù)時(shí)間有關(guān)的信息并將其存儲(chǔ)在一個(gè)文件中。
本發(fā)明的另一目的是提供一種能夠執(zhí)行上述方法的處理設(shè)備。
為此目的,本發(fā)明涉及一種用于處理可以視頻流形式獲得的數(shù)字編碼視頻數(shù)據(jù)的設(shè)備,所述視頻流由分割為宏塊的連續(xù)幀組成,所述幀包括至少獨(dú)立編碼的I幀、時(shí)間上位于所述I幀之間并且從至少一個(gè)先前I或P幀預(yù)測(cè)的P幀、以及B幀,B幀在時(shí)間上位于I幀和P幀之間或者兩個(gè)P幀之間并且從它被放置于其間的至少這兩個(gè)幀雙向預(yù)測(cè)得到,通過(guò)一個(gè)對(duì)來(lái)自過(guò)去和將來(lái)的預(yù)測(cè)具有不相同的量的加權(quán)預(yù)測(cè)來(lái)執(zhí)行所述預(yù)測(cè),所述設(shè)備包括下列裝置-確定裝置,用于對(duì)于當(dāng)前幀的每個(gè)連續(xù)宏塊確定表征所述加權(quán)預(yù)測(cè)(如果有的話)的相關(guān)的編碼參數(shù);-收集裝置,用于對(duì)當(dāng)前幀的所有連續(xù)宏塊收集所述參數(shù),以傳送涉及所述參數(shù)的統(tǒng)計(jì)量;-分析裝置,用于分析所述統(tǒng)計(jì)量,以確定預(yù)測(cè)方向的優(yōu)先變化;-檢測(cè)裝置,用于每當(dāng)優(yōu)先變化被確定時(shí)就檢測(cè)幀序列中平緩場(chǎng)景變化的出現(xiàn)。
現(xiàn)在參照附圖,通過(guò)示例描述本發(fā)明,其中圖1示出雙向預(yù)測(cè)的傳統(tǒng)示例;圖2示出在H.264/AVC標(biāo)準(zhǔn)的情況下B幀的加權(quán)預(yù)測(cè)的基本原理;圖3是根據(jù)本發(fā)明的處理方法的實(shí)施的框圖。
具體實(shí)施例方式
如上所述,回想關(guān)于運(yùn)動(dòng)預(yù)測(cè)的H.264/AVC的一般概念和特性,運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)信號(hào)可以被加權(quán)一個(gè)由編碼器指定的量。加權(quán)預(yù)測(cè)可以用于實(shí)現(xiàn)雙向預(yù)測(cè)(B圖像),其中來(lái)自過(guò)去和將來(lái)的預(yù)測(cè)塊按照不同的量出現(xiàn)在總預(yù)測(cè)中(對(duì)于MPEG-2,限于由因數(shù)加權(quán)兩個(gè)預(yù)測(cè)信號(hào)的一種可能性)。
本發(fā)明的原理在于由于這種不相等,平緩的鏡頭過(guò)渡的出現(xiàn)可以由從一個(gè)方向到另一個(gè)方向的預(yù)測(cè)的優(yōu)先選擇中的逐漸變化表示。這樣的預(yù)測(cè)方向的優(yōu)先選擇的變化可以通過(guò)分析表征加權(quán)預(yù)測(cè)的有關(guān)編碼參數(shù)的統(tǒng)計(jì)量來(lái)檢測(cè)。例如,該分析可以包括將具有相同方向優(yōu)先選擇和相似加權(quán)的宏塊的數(shù)量與一個(gè)給定閾值相比較,該給定閾值是針對(duì)圖像中宏塊的總數(shù)量而被導(dǎo)出的。此外,這樣的宏塊分布的(局部)均勻性可以被檢查以便確保預(yù)測(cè)的方向優(yōu)先選擇中的變化實(shí)際上是平緩場(chǎng)景過(guò)渡的結(jié)果。一些另外的分析也可以被執(zhí)行以便考慮子宏塊運(yùn)動(dòng)預(yù)測(cè)的可能使用,并且在加權(quán)預(yù)測(cè)中,例如在H.264/AVC中同樣是被允許的。
圖2中示出例如在H.264/AVC中雙向預(yù)測(cè)的例子,示出從先前和后面的圖像Pi-n、Pi-1、Pi+j、Pi+m的圖像Bi的預(yù)測(cè)。用于宏塊MB的預(yù)測(cè)叫做MBPred并等于B1“+”B2“+”B3,由三個(gè)預(yù)測(cè)塊組成,以致宏塊MBPred的下半部分由兩個(gè)8×8塊B2和B3預(yù)測(cè),并且上半部分由一個(gè)8×16塊B1預(yù)測(cè),其中B1=alpha1.b1+alpha2.b2(其中alpha 1和alpha 2是系數(shù))。這些預(yù)測(cè)塊的每一個(gè)都涉及不同的參考圖像并且具有各別的運(yùn)動(dòng)矢量MV,如H.264中允許的。不像B2和B3,塊B1是使用加權(quán)預(yù)測(cè)獲得的,也就是通過(guò)執(zhí)行兩個(gè)塊b1和b2的總和來(lái)獲得,在該總和中按照由相應(yīng)加權(quán)參數(shù)alpha 1和alpha 2控制的不等量來(lái)提供塊b1和b2。對(duì)于所有的宏塊收集這些加權(quán)參數(shù)的統(tǒng)計(jì)量(絕對(duì)值和符號(hào)),并且分析在多個(gè)宏塊上的統(tǒng)計(jì)量分布來(lái)實(shí)現(xiàn)平緩場(chǎng)景過(guò)渡的檢測(cè)。
根據(jù)本發(fā)明的處理方法的實(shí)施例示出在圖3的框圖中,其示出例如在H.264/AVC比特流的情況下先前解釋的概念,然而所述實(shí)施例不限制本發(fā)明的范圍。在示出的解碼設(shè)備中,解多路復(fù)用器21接收傳送流TS并且產(chǎn)生解多路復(fù)用的音頻和視頻流AS和VS。視頻流由H.264/AVC解碼器22接收,用于照常傳送解碼的視頻流DVS。所述解碼器22主要包括逆量化電路221(Q-1)、逆變換電路222(T-1)(在本例中是一個(gè)逆DCT電路)以及一個(gè)運(yùn)動(dòng)補(bǔ)償電路223。它還包括一個(gè)所謂的網(wǎng)絡(luò)抽象層單元(NALU)224,用于收集所接收的編碼參數(shù),這些編碼參數(shù)表征所執(zhí)行的加權(quán)預(yù)測(cè)(例如,一些相關(guān)的編碼參數(shù)可以是“l(fā)uma_weight”、“l(fā)uma_offset”、“l(fā)uma_log2_weight_denom”等等,其被用在表征預(yù)測(cè)采樣的加權(quán)和偏移的等式中)。所述單元224的輸出信號(hào)是加權(quán)的預(yù)測(cè)參數(shù)統(tǒng)計(jì)量WPPS,其被分析電路23接收用于合適的處理。接著在電路23中執(zhí)行的處理操作產(chǎn)生關(guān)于原始接收的流中的平緩場(chǎng)景變化的位置和持續(xù)時(shí)間的信息,并且該信息然后存儲(chǔ)在文件24中,其形式例如是通常使用的CPI(特征點(diǎn)信息)表?,F(xiàn)在該輸出信息對(duì)于諸如視頻概括、自動(dòng)章節(jié)等應(yīng)用是可獲得的。
附加的,借助于硬件或軟件或兩者可以有多種方式來(lái)實(shí)施功能(本發(fā)明的方法可以通過(guò)用語(yǔ)處理單元的、包括一組指令的計(jì)算機(jī)程序產(chǎn)品實(shí)現(xiàn),當(dāng)該計(jì)算機(jī)程序產(chǎn)品裝載到所述處理單元中時(shí)使該處理單元執(zhí)行上述的方法)。在這方面,附圖是非常概略的并且僅示出本發(fā)明的一個(gè)可能的實(shí)施例。因此,雖然附圖(在本例中是圖3)將不同功能視為不同塊,決不排除單個(gè)硬件或軟件項(xiàng)執(zhí)行幾個(gè)功能的情形。也不排除多件硬件或軟件或兩者的集成執(zhí)行一個(gè)功能。這些注釋意圖調(diào)用詳細(xì)的描述,參照附圖,示例而不是限制本發(fā)明,并且在所附權(quán)利要求范圍內(nèi)有多種可選擇的備選方式。詞語(yǔ)“包括”不排除存在未在權(quán)利要求中列出的其它元件或步驟。一個(gè)元件或步驟之前的詞語(yǔ)“一個(gè)”不排除存在多個(gè)這樣的元件或步驟。
權(quán)利要求
1.一種處理可以視頻流的形式獲得的數(shù)字編碼視頻數(shù)據(jù)的方法,所述視頻流由分割為宏塊的連續(xù)幀組成,所述幀包括至少獨(dú)立編碼的I幀、時(shí)間上位于所述I幀之間并且從至少一個(gè)先前I或P幀預(yù)測(cè)的P幀、以及B幀,B幀在時(shí)間上位于I幀和P幀之間或者兩個(gè)P幀之間并且從至少它放置于其間的這兩個(gè)幀雙向預(yù)測(cè)得到,通過(guò)一個(gè)對(duì)來(lái)自過(guò)去和將來(lái)的預(yù)測(cè)具有不相同的量的加權(quán)預(yù)測(cè)來(lái)執(zhí)行所述P和B幀的預(yù)測(cè),所述處理方法包括步驟-對(duì)于當(dāng)前幀的每個(gè)連續(xù)宏塊確定表征所述加權(quán)預(yù)測(cè),如果有的話,的相關(guān)編碼參數(shù);-對(duì)于當(dāng)前幀的所有連續(xù)宏塊收集所述參數(shù),以傳送涉及所述參數(shù)的統(tǒng)計(jì)量;-分析所述統(tǒng)計(jì)量,以確定預(yù)測(cè)方向的優(yōu)先變化;-每當(dāng)優(yōu)先變化被確定時(shí)就檢測(cè)幀序列中平緩場(chǎng)景變化的出現(xiàn)。
2.根據(jù)權(quán)利要求1的處理方法,其中分析步驟被提供用于將具有相同方向優(yōu)先選擇和相似加權(quán)的宏塊的數(shù)量與針對(duì)當(dāng)前幀中宏塊總數(shù)量而導(dǎo)出的預(yù)定閾值相比較。
3.根據(jù)權(quán)利要求2的處理方法,其中產(chǎn)生關(guān)于每個(gè)場(chǎng)景變化的位置和持續(xù)時(shí)間的信息并將其存儲(chǔ)在一個(gè)文件中。
4.根據(jù)權(quán)利要求1至3中任何一個(gè)的處理方法,其中所處理的視頻流的語(yǔ)法和語(yǔ)義是H.264/AVC標(biāo)準(zhǔn)的語(yǔ)法和語(yǔ)義。
5.一種用于處理可以視頻流的形式獲得的數(shù)字編碼視頻數(shù)據(jù)的設(shè)備,所述視頻流由分割為宏塊的連續(xù)幀組成,所述幀包括至少獨(dú)立編碼的I幀、時(shí)間上位于所述I幀之間并且從至少一個(gè)先前I或P幀預(yù)測(cè)的P幀、以及B幀,B幀在時(shí)間上位于I幀和P幀之間或者兩個(gè)P幀之間并且從它所放置于其間的至少這兩個(gè)幀雙向預(yù)測(cè)得到,通過(guò)一個(gè)對(duì)來(lái)自過(guò)去和將來(lái)預(yù)測(cè)具有不相同的量的加權(quán)預(yù)測(cè)來(lái)執(zhí)行所述P和B幀的預(yù)測(cè),所述設(shè)備包括下列裝置-確定裝置,用于對(duì)于當(dāng)前幀的每個(gè)連續(xù)宏塊確定表征所述加權(quán)預(yù)測(cè),如果有的話,的相關(guān)編碼參數(shù);-收集裝置,用于對(duì)于當(dāng)前幀的所有連續(xù)宏塊收集所述參數(shù),以傳送涉及所述參數(shù)的統(tǒng)計(jì)量;-分析裝置,用于分析所述統(tǒng)計(jì)量,以確定預(yù)測(cè)方向的優(yōu)先變化;-檢測(cè)裝置,用于每當(dāng)優(yōu)先變化被確定時(shí)就檢測(cè)幀序列中平緩場(chǎng)景變化的出現(xiàn)。
6.一種用于數(shù)字視頻數(shù)據(jù)解碼設(shè)備的計(jì)算機(jī)程序產(chǎn)品,其包括一組指令,當(dāng)裝載到所述解碼設(shè)備中時(shí),其使所述解碼設(shè)備執(zhí)行根據(jù)權(quán)利要求1至4中任何一個(gè)的處理方法的步驟。
全文摘要
本發(fā)明涉及一種處理以連續(xù)幀組成的視頻流形式可獲得的數(shù)字編碼視頻數(shù)據(jù)的方法。這些幀被分為宏塊,包括至少I幀(內(nèi)部)和P幀(預(yù)測(cè)的)、以及B幀,B幀在時(shí)間上位于I幀和P幀之間或者兩個(gè)P幀之間并且從它所放置于其間的至少這兩個(gè)幀雙向預(yù)測(cè)得到。通過(guò)用從過(guò)去和將來(lái)的不相同的量的加權(quán)預(yù)測(cè)來(lái)執(zhí)行所述預(yù)測(cè)。根據(jù)本發(fā)明,該處理方法包括步驟對(duì)于當(dāng)前幀的每個(gè)連續(xù)宏塊確定表征所述加權(quán)預(yù)測(cè)(如果有的話)的相關(guān)編碼參數(shù);對(duì)于當(dāng)前幀的所有連續(xù)宏塊收集所述參數(shù),以傳送涉及所述參數(shù)的統(tǒng)計(jì)量;分析所述統(tǒng)計(jì)量,以確定預(yù)測(cè)方向的優(yōu)先變化;每當(dāng)優(yōu)先變化被確定時(shí)就檢測(cè)幀序列中平緩場(chǎng)景變化的出現(xiàn)。
文檔編號(hào)H04N5/14GK1902938SQ200480039816
公開(kāi)日2007年1月24日 申請(qǐng)日期2004年12月28日 優(yōu)先權(quán)日2004年1月5日
發(fā)明者D·布拉澤羅維, M·巴比里 申請(qǐng)人:皇家飛利浦電子股份有限公司