專利名稱:視頻編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種視頻編碼設(shè)備及其視頻編碼方法,并且特別涉及用于視頻編碼的視頻編碼參數(shù)的選擇。
背景技術(shù):
近年來,數(shù)字存儲器的使用和視頻信號的分發(fā)已經(jīng)變得越來越普遍。為了減少發(fā)送數(shù)字視頻信號所需的帶寬,眾所周知,使用包括視頻數(shù)據(jù)壓縮的有效的數(shù)字視頻編碼,從而可以顯著地減少數(shù)字視頻信號的數(shù)據(jù)率。
為了確?;ビ眯?interoperability),在促進(jìn)很多專業(yè)的和消費(fèi)者的應(yīng)用中,視頻編碼標(biāo)準(zhǔn)已經(jīng)在視頻信號的采用中扮演了關(guān)鍵的角色。大多數(shù)有影響的標(biāo)準(zhǔn)傳統(tǒng)上由國際電信聯(lián)盟(ITU-T)或者ISO/IEC(國際標(biāo)準(zhǔn)化組織/國際電工委員會)的MPEG(運(yùn)動(dòng)圖像專家組)委員會開發(fā)。ITU-T標(biāo)準(zhǔn)(通稱建議)典型地針對實(shí)時(shí)通信(例如,視頻會議),而大多數(shù)MPEG標(biāo)準(zhǔn)最適合用于存儲器(例如,用于數(shù)字通用盤(DVD))和廣播(例如,用于數(shù)字視頻廣播(DVB)標(biāo)準(zhǔn))。
當(dāng)前,最廣泛被使用的視頻壓縮技術(shù)之一通稱MPEG-2(運(yùn)動(dòng)圖像專家組)標(biāo)準(zhǔn)。MPEG-2是一個(gè)基于數(shù)據(jù)塊的壓縮方案,其中一個(gè)幀被分成每個(gè)包括八個(gè)垂直和八個(gè)水平像素的多個(gè)數(shù)據(jù)塊。為了亮度數(shù)據(jù)的壓縮,每個(gè)數(shù)據(jù)塊使用離散余弦變換(DCT)被單獨(dú)地壓縮,后面跟隨著將大量被變換的數(shù)據(jù)值減少到零的量化。為了色度數(shù)據(jù)的壓縮,通常,色度數(shù)據(jù)的總量首先通過下采樣被減少,從而對于每四個(gè)亮度數(shù)據(jù)塊,有兩個(gè)色度數(shù)據(jù)塊被獲得(4:2:0格式),它們同樣地通過使用DCT被壓縮并且量化。只基于幀內(nèi)壓縮的幀通稱內(nèi)幀(I-幀)。
除了幀內(nèi)壓縮以外,MPEG-2使用幀間壓縮以便進(jìn)一步減少所述數(shù)據(jù)率。幀間壓縮包括根據(jù)先前I-幀產(chǎn)生預(yù)測幀(P-幀)。此外,I和P幀典型地通過雙向預(yù)測幀(B-幀)被插入,其中,僅僅通過發(fā)送B-幀和周圍的I-和P-幀之間的差值來完成壓縮。此外,MPEG-2使用運(yùn)動(dòng)估計(jì),其中,在不同的位置的后來的幀中發(fā)現(xiàn)的一個(gè)幀的宏數(shù)據(jù)塊的圖像簡單地通過使用運(yùn)動(dòng)矢量被傳送。
作為這些壓縮技術(shù)的結(jié)果,標(biāo)準(zhǔn)TV播音室廣播質(zhì)量等級的視頻信號能夠在大約2-4Mbps的數(shù)據(jù)率上被發(fā)送。
最近,一個(gè)新的ITU-T標(biāo)準(zhǔn)(通稱H.26L)已經(jīng)出現(xiàn)。由于具有與諸如MPEG-2的現(xiàn)有的標(biāo)準(zhǔn)相比的優(yōu)良編碼效率,H.26L被廣泛地承認(rèn)。盡管H.26L的增益通常依照圖像的大小而成比例地減少,但是,在廣闊的應(yīng)用范圍中使用它的潛能是毫無疑問的。這種潛能通過形成聯(lián)合電視組(JVT)論壇已經(jīng)被承認(rèn),該論壇負(fù)責(zé)最終形成作為新的聯(lián)合ITU-T/MPEG標(biāo)準(zhǔn)的H.26L。所述新的標(biāo)準(zhǔn)通稱H.264或MPEG-4AVC(高級視頻編碼)。而且,基于H.264的解決方案在諸如DVB和DVD論壇的其它標(biāo)準(zhǔn)化團(tuán)體中正被考慮。
所述H.264標(biāo)準(zhǔn)使用從諸如MPEG-2的已建立的標(biāo)準(zhǔn)得知的基于數(shù)據(jù)塊的運(yùn)動(dòng)補(bǔ)償混合變換編碼的相同的原理。因此,所述H.264語法被組織作為諸如圖像-、片-和宏-數(shù)據(jù)塊標(biāo)題的標(biāo)題以及諸如運(yùn)動(dòng)矢量、數(shù)據(jù)塊變換系數(shù)、量化器定標(biāo)度等等的數(shù)據(jù)的通常層次。然而,H.264標(biāo)準(zhǔn)分隔代表視頻數(shù)據(jù)內(nèi)容的視頻編碼層(VCL)和對數(shù)據(jù)進(jìn)行格式化并且提供標(biāo)題信息的網(wǎng)絡(luò)適配層(NAL)。
而且,H264為編碼參數(shù)提供更為增多的選擇。例如,它提供16×16宏數(shù)據(jù)塊的更精細(xì)的劃分和操作,借此,例如運(yùn)動(dòng)補(bǔ)償過程能夠在小到4×4大小宏數(shù)據(jù)塊的分段上被執(zhí)行。而且,對于樣本數(shù)據(jù)塊的運(yùn)動(dòng)補(bǔ)償預(yù)測的選擇過程可以涉及多個(gè)被存儲的先前被解碼的圖像,而不只是相鄰的圖像。即使利用一個(gè)單獨(dú)幀的幀內(nèi)編碼,使用來自所述相同的幀的先前被解碼的樣本來構(gòu)成對數(shù)據(jù)塊的預(yù)測是可能的。在運(yùn)動(dòng)補(bǔ)償之后導(dǎo)致的預(yù)測誤差可以根據(jù)4×4大小的數(shù)據(jù)塊而不是傳統(tǒng)的8×8大小的數(shù)據(jù)塊被變換和量化。
所述H.264標(biāo)準(zhǔn)可以被認(rèn)為是MPEG-2視頻編碼語法的超集,這是因?yàn)樗褂靡曨l數(shù)據(jù)的相同的全局結(jié)構(gòu),同時(shí)擴(kuò)展可能的編碼決定和參數(shù)的數(shù)量。具有多種編碼決定的一種結(jié)果是可以達(dá)到比特率和圖像質(zhì)量之間一種良好的折衷。然而,盡管通常認(rèn)識到H.264標(biāo)準(zhǔn)可以充分地減少典型的基于數(shù)據(jù)塊編碼的人工產(chǎn)物,但是它也能夠增強(qiáng)其它的人工產(chǎn)物。
H.264提供各種編碼參數(shù)的可能值的增加的數(shù)量,因此,導(dǎo)致增加用于改進(jìn)所述編碼過程的潛能,但是也導(dǎo)致增加對于視頻編碼參數(shù)選擇的敏感性。類似于其它標(biāo)準(zhǔn),H.264不規(guī)定一種標(biāo)準(zhǔn)化的用于選擇視頻編碼參數(shù)的過程,而是通過一種參考實(shí)現(xiàn)來描述多個(gè)可以被用于選擇諸如達(dá)到一種在編碼效率、視頻質(zhì)量和實(shí)現(xiàn)的實(shí)用性之間的適當(dāng)?shù)恼壑缘囊曨l編碼參數(shù)的標(biāo)準(zhǔn)。
然而,被描述的標(biāo)準(zhǔn)不可能總是導(dǎo)致一種最佳或適當(dāng)?shù)木幋a參數(shù)的選擇。例如,所述標(biāo)準(zhǔn)可能不導(dǎo)致選擇對于所述視頻信號特征最佳的或希望的視頻編碼參數(shù),或者所述標(biāo)準(zhǔn)可能以獲得不適合于當(dāng)前應(yīng)用的編碼的信號的特征為基礎(chǔ)。
因此,一種改進(jìn)的視頻編碼系統(tǒng)將是有利的,并且特別地,一種利用諸如H.264的新興標(biāo)準(zhǔn)的可能性以便改進(jìn)視頻編碼的、改進(jìn)的視頻編碼系統(tǒng)是有利的。特別地,一種提供改進(jìn)的編碼參數(shù)選擇的視頻編碼系統(tǒng)是所希望的。
發(fā)明概述因此,本發(fā)明尋求單獨(dú)地或者以任何組合方式來緩和、減輕或消除上面被提及的一個(gè)或多個(gè)缺點(diǎn)。
根據(jù)本發(fā)明的第一個(gè)方面,提供了一種視頻編碼設(shè)備,包括一種視頻分析處理器,它包括接收用于編碼的圖像的裝置,用于將所述圖像劃分成多個(gè)圖像區(qū)域的裝置;用于為所述多個(gè)圖像區(qū)域中的至少一個(gè)圖像區(qū)域確定圖像特征的裝置,以及響應(yīng)于所述圖像特征用于為所述至少一個(gè)圖像區(qū)域選擇一個(gè)視頻編碼參數(shù)的裝置;和一種視頻編碼器,它包括接收用于編碼的圖像的裝置,用于從所述視頻分析處理器接收視頻編碼參數(shù)的裝置,以及允許使用所述至少一個(gè)圖像區(qū)域的所述視頻編碼參數(shù)來編碼所述圖像的裝置。
本發(fā)明允許根據(jù)一個(gè)外部圖像和視頻分析來選擇用于視頻編碼器的一個(gè)或多個(gè)視頻編碼參數(shù)。所述被選擇的視頻編碼參數(shù)可以被用于一個(gè)或多個(gè)圖像。所述外部分析允許根據(jù)任何適當(dāng)?shù)臉?biāo)準(zhǔn)或算法把所述圖像分成不同的圖像區(qū)域,并且可以獨(dú)立于在所述視頻編碼器中被執(zhí)行的任何過程。這提供一種有效的資源使用和處理劃分,并且使得能夠響應(yīng)于不僅僅是局部空間像素分析的其它參數(shù)來確定所述視頻編碼參數(shù)。這提供對所述視頻編碼參數(shù)的選擇的改進(jìn),并且因此提供一種降低的編碼數(shù)據(jù)率和/或改進(jìn)的被編碼的視頻質(zhì)量。
而且,本發(fā)明提供由所述視頻分析處理器來執(zhí)行的所述外部視頻分析,以便為不同的區(qū)域中的視頻編碼參數(shù)選擇而使用不同的標(biāo)準(zhǔn)。用于在所述至少一個(gè)圖像區(qū)域中的視頻編碼參數(shù)選擇的標(biāo)準(zhǔn)可以根據(jù)該區(qū)域的特征而被選擇。這提供了在例如根據(jù)單獨(dú)的區(qū)域特征而被使用的比特率和視頻質(zhì)量之間不同的折衷。例如,用于一個(gè)移動(dòng)物體的視頻編碼參數(shù)可以根據(jù)給定質(zhì)量與數(shù)據(jù)率的折衷而被選擇,而不同質(zhì)量與數(shù)據(jù)率的折衷可以被用于背景物體。因此,本發(fā)明提供在不同區(qū)域中不同的有關(guān)的視頻質(zhì)量級別。這對于其中不同的物體有關(guān)的被感覺的重要性可以改變的不同的應(yīng)用是有用的。所述圖像本身可以是一個(gè)被編碼的信號。
本發(fā)明提供改進(jìn)的視頻編碼,并且特別可以提供減小的編碼數(shù)據(jù)率,改進(jìn)的視頻質(zhì)量和/或在所述被編碼的視頻信號特征之間的改進(jìn)的、可變的和/或靈活的折衷。本發(fā)明提供一種適合于實(shí)現(xiàn)的低復(fù)雜性和/或靈活的視頻編碼設(shè)備。
根據(jù)本發(fā)明的一個(gè)特征,用于劃分所述圖像的裝置可用于通過所述圖像的分段來確定多個(gè)圖像區(qū)域。這提供了一種適當(dāng)?shù)姆椒ㄒ杂糜趯⒁粋€(gè)圖像分成多個(gè)圖像區(qū)域,在每個(gè)圖像區(qū)域中,相同的視頻編碼參數(shù)可以被有利地使用。所述圖像可以根據(jù)任何適當(dāng)?shù)乃惴ɑ驑?biāo)準(zhǔn)被分段到不同的區(qū)域中。根據(jù)能夠從像素?cái)?shù)值和/或從根據(jù)這些數(shù)值的數(shù)學(xué)計(jì)算而導(dǎo)出的特征的相似性,所述圖像分段可以通過遞歸地分裂整個(gè)圖像或者通過在所述圖像中合并像素組而被執(zhí)行。這使得隔離具有某種顏色、光譜特征等等的區(qū)域成為可能。在圖像的一個(gè)序列中,使用例如諸如被用于運(yùn)動(dòng)補(bǔ)償?shù)娜魏纹ヅ涞臉?biāo)準(zhǔn)或算法,單獨(dú)地執(zhí)行每個(gè)圖像的分段或者將一個(gè)圖像的分段結(jié)果設(shè)計(jì)和精制成連續(xù)的圖像是可能的。
根據(jù)本發(fā)明的一個(gè)不同的特征,所述圖像的分段包括跟蹤在一個(gè)視頻信號的幀之間的一個(gè)對象。這可以促進(jìn)劃分成圖像區(qū)域和/或增加圖像之間的一致性和相關(guān)性。例如,相同的視頻編碼參數(shù)可以被用于在連續(xù)的圖像中相同的對象,從而,提供在該對象的視頻編碼中的一致性并且從而減少所述被編碼圖像的噪聲。
根據(jù)本發(fā)明的一個(gè)不同的特征,用于劃分所述圖像的裝置可用來響應(yīng)于未被包括在所述圖像特征中的圖像性質(zhì)而劃分多個(gè)圖像區(qū)域。因此,獨(dú)立于用于選擇所述視頻編碼參數(shù)的標(biāo)準(zhǔn),可以進(jìn)行靈活的區(qū)域選擇。這提供一種改進(jìn)的視頻編碼并且特別提供一種改進(jìn)的視頻質(zhì)量和/或減小的編碼信號的數(shù)據(jù)率。例如,響應(yīng)于不同對象的移動(dòng)特征,所述圖像可以被分成多個(gè)區(qū)域,從而例如使得多個(gè)運(yùn)動(dòng)對象和背景對象被確定。然而,每個(gè)區(qū)域或?qū)ο蟮囊曨l編碼參數(shù)可以響應(yīng)于所述區(qū)域或數(shù)據(jù)塊的其它特征被選擇,并且所述選擇標(biāo)準(zhǔn)對于不同的數(shù)據(jù)塊可以是不同的。例如,所述視頻編碼參數(shù)可以被加以選擇以便達(dá)到用于運(yùn)動(dòng)對象的第一個(gè)質(zhì)量級別和用于背景對象的第二個(gè)更高的質(zhì)量級別,并且所述特定的編碼參數(shù)可以被加以選擇以便達(dá)到用于各個(gè)單獨(dú)的對象的給定的圖像特征(諸如高頻內(nèi)容的級別)的適當(dāng)?shù)馁|(zhì)量級別。
根據(jù)本發(fā)明的一個(gè)不同的特征,用于劃分所述圖像的裝置可用來將所述至少一個(gè)圖像區(qū)域確定為具有導(dǎo)致對于視頻編碼參數(shù)的高敏感性的圖像特征的圖像區(qū)域。這允許根據(jù)任何適當(dāng)?shù)臉?biāo)準(zhǔn)或算法來確定敏感區(qū)域,并且提供一種相對較高質(zhì)量的需求被用于為這些圖像選擇視頻編碼參數(shù)。這提供所述被編碼的視頻信號的改進(jìn)的視頻質(zhì)量。
根據(jù)本發(fā)明的一個(gè)不同的特征,用于劃分所述圖像的裝置可用來響應(yīng)于一個(gè)分段標(biāo)準(zhǔn)而將所述圖像分成多個(gè)段并且通過分組多個(gè)段來確定至少第一個(gè)圖像區(qū)域。這提供一種通過分組各個(gè)段來確定圖像區(qū)域的有效的和低復(fù)雜性的方法。一個(gè)圖像區(qū)域可以包括所述圖像中的多個(gè)分開的區(qū)域。
根據(jù)本發(fā)明的一個(gè)不同的特征,響應(yīng)于一個(gè)分段標(biāo)準(zhǔn)而劃分成多個(gè)段,并且響應(yīng)于所述多個(gè)段的視頻編碼特征而進(jìn)行分組。所述分段標(biāo)準(zhǔn)可以特別地適合于確定可以有利地用相同的視頻編碼參數(shù)來編碼的區(qū)域。例如,一個(gè)圖像區(qū)域可以通過分組對應(yīng)于圖像中運(yùn)動(dòng)對象的全部段而被構(gòu)成。這提供一種有效的并且低復(fù)雜性的方法來為圖像區(qū)域選擇視頻編碼參數(shù),并且提供在所述視頻編碼器和所述視頻分析處理器之間的一種有效的接口。所述分段標(biāo)準(zhǔn)例如可以與諸如顏色特征、紋理特征和/或平直度或均勻性特征的圖像特征相聯(lián)系。
根據(jù)本發(fā)明的一個(gè)不同的特征,所述圖像特征包括一種紋理特征。這允許所述視頻編碼參數(shù)被選擇以便為所給定的紋理特征提供一種適當(dāng)?shù)木幋a。特別地,它允許所述視頻編碼參數(shù)適配于高度均勻性的區(qū)域的紋理特征,借此,典型地在諸如H.264或MPEG-4AVC視頻編碼器的已知的編碼器中遇到的紋理或“增塑”的部分拖尾效應(yīng)可以被減少。
根據(jù)本發(fā)明的一個(gè)不同的特征,所述視頻編碼設(shè)備還包括用于將來自所述視頻編碼器的被編碼的圖像耦合到所述視頻分析處理器的裝置,并且所述視頻分析處理器可用來響應(yīng)于所述被編碼的圖像而產(chǎn)生所述圖像特征。這提供改進(jìn)的所述視頻編碼參數(shù)的選擇并且因此提供改進(jìn)的視頻質(zhì)量和/或減小的所述視頻編碼的數(shù)據(jù)率。所述圖像特征可以響應(yīng)于所述被編碼圖像的特征并且特別響應(yīng)于與所述視頻編碼相聯(lián)系的特征而被確定。例如,在確定所述圖像特征的過程中,視頻編碼人工產(chǎn)物和/或誤差可以被確定并且被使用。例如,所述圖像特征可以與在一個(gè)區(qū)域中被編碼信號的質(zhì)量級別相聯(lián)系,并且可以導(dǎo)致修改所述視頻編碼參數(shù)以便更接近地獲得希望的質(zhì)量級別。因此,一種迭代視頻編碼和所述視頻編碼參數(shù)的選擇可以被實(shí)現(xiàn)。例如,所述迭代可以被重復(fù)一次或多次直到達(dá)到一種給定的被編碼的視頻質(zhì)量級別。
根據(jù)本發(fā)明的一個(gè)不同的特征,所述視頻編碼設(shè)備可用來通過迭代地選擇一個(gè)用于所述至少一個(gè)圖像的視頻編碼參數(shù)而編碼所述圖像,并且使用用于所述至少一個(gè)圖像區(qū)域的視頻編碼參數(shù)來編碼所述圖像。這提供通過所述視頻編碼而達(dá)到的改進(jìn)的視頻質(zhì)量和/或減小的數(shù)據(jù)率。一種迭代視頻編碼和所述視頻編碼參數(shù)的選擇可以被實(shí)現(xiàn)。例如,所述迭代可以被重復(fù)一次或多次直到達(dá)到一種給定的被編碼的視頻質(zhì)量。
根據(jù)本發(fā)明的一個(gè)不同的特征,所述視頻編碼參數(shù)包括一個(gè)量化參數(shù)、一個(gè)編碼數(shù)據(jù)塊類型參數(shù)、一個(gè)幀間預(yù)測模式參數(shù)、一個(gè)參考圖像選擇參數(shù)和/或一個(gè)解除組塊(de-blocking)濾波參數(shù)。這些參數(shù)特別適合于使所述視頻編碼適應(yīng)所述圖像區(qū)域的特征。
根據(jù)本發(fā)明的一個(gè)不同的特征,所述視頻編碼器可用來根據(jù)所述H.264(或H.26L或MPEG-4AVC)標(biāo)準(zhǔn)而編碼所述視頻信號。因此,本發(fā)明啟用一種改進(jìn)的H.264(或H.26L或MPEG-4AVC)視頻編碼器設(shè)備。
根據(jù)本發(fā)明的第二個(gè)方面,為一種具有視頻分析處理器和視頻編碼器的視頻編碼設(shè)備提供了一種視頻編碼方法,包括步驟在所述視頻分析處理器中接收一個(gè)用于編碼的圖像,將所述圖像分成多個(gè)圖像區(qū)域;為多個(gè)圖像區(qū)域的至少一個(gè)圖像區(qū)域確定一個(gè)圖像特征;響應(yīng)于所述圖像區(qū)域的圖像特征而為所述圖像區(qū)域選擇一個(gè)視頻編碼參數(shù),以及將所述視頻編碼參數(shù)供應(yīng)給所述視頻編碼器;在所述視頻編碼器中接收所述用于編碼的圖像,從所述視頻分析處理器接收所述視頻編碼參數(shù),并且使用用于每個(gè)圖像區(qū)域的視頻編碼參數(shù)來編碼所述圖像。
根據(jù)本發(fā)明的一個(gè)特征,所述方法還包括步驟在所述視頻分析處理器中從所述視頻編碼器接收所述被編碼的圖像,將所述被編碼的圖像分成多個(gè)被編碼的圖像區(qū)域;為多個(gè)被編碼圖像區(qū)域中的至少一個(gè)被編碼的圖像區(qū)域確定一個(gè)被編碼的圖像特征;響應(yīng)于所述編碼的圖像區(qū)域的編碼的圖像特征為所述編碼的圖像區(qū)域而選擇一個(gè)第二視頻編碼參數(shù),并且將所述第二視頻編碼參數(shù)供應(yīng)給所述視頻編碼器;在所述視頻編碼器中從所述視頻分析處理器接收所述第二視頻編碼參數(shù),并且使用用于每個(gè)圖像區(qū)域的第二視頻編碼參數(shù)來編碼所述圖像。
這就提供了通過編碼所述圖像而達(dá)到的改進(jìn)的視頻質(zhì)量和/或減小的數(shù)據(jù)率。一種迭代視頻編碼和所述視頻編碼參數(shù)的選擇可以被實(shí)現(xiàn)。例如,所述迭代可以被重復(fù)一次或多次直到一種給定的編碼的視頻質(zhì)量級別被達(dá)到。
參考以下被描述的實(shí)施方案,本發(fā)明的這些和其它方面、特征以及優(yōu)點(diǎn)將顯而易見并且被闡明。
附圖簡述本發(fā)明的一個(gè)實(shí)施方案將通過參考附圖的實(shí)例來進(jìn)行描述,其中
圖1是一個(gè)根據(jù)本發(fā)明的一個(gè)實(shí)施方案的視頻編碼設(shè)備的框圖;以及圖2是一個(gè)根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施方案的視頻編碼方法。
優(yōu)選實(shí)施方案說明下列說明集中在可應(yīng)用于根據(jù)H.26L、H.264或MPEG-4AVC視頻編碼標(biāo)準(zhǔn)的視頻編碼的本發(fā)明的一個(gè)實(shí)施方案。然而,應(yīng)該理解,本發(fā)明未被限于這種應(yīng)用,它可以應(yīng)用于很多其它的視頻編碼算法、規(guī)范或標(biāo)準(zhǔn)。
圖1是一個(gè)根據(jù)本發(fā)明的一個(gè)實(shí)施方案的視頻編碼設(shè)備100的框圖。
所述視頻編碼設(shè)備100包括一個(gè)視頻分析處理器101和一個(gè)視頻編碼器103。所述視頻分析處理器101和視頻編碼器103被耦合到一個(gè)外部視頻源105,一個(gè)要被編碼的視頻信號被從該外部視頻源接收。所述視頻分析處理器101包括一個(gè)被耦合到所述視頻源105的處理器接收機(jī)107。所述處理器接收機(jī)107接收要被編碼的視頻信號。所述視頻信號包括要被編碼的多個(gè)圖像。在所述優(yōu)選實(shí)施方案中,所述處理器接收機(jī)107包括一個(gè)在所述圖像的視頻分析期間存儲圖像的緩沖器。所述接收機(jī)被耦合到一個(gè)可操作來將所述圖像分成多個(gè)圖像區(qū)域的分段處理器109。響應(yīng)于任何適當(dāng)?shù)乃惴ɑ驑?biāo)準(zhǔn),所述圖像可以被分成兩個(gè)或多個(gè)圖像區(qū)域,并且特別地,通過選擇一個(gè)滿足給定的標(biāo)準(zhǔn)的單一的圖像區(qū)域,所述圖像可以被分成兩個(gè)圖像區(qū)域。
所述分段處理器109被耦合到一個(gè)圖像特征處理器111。所述圖像特征處理器111被供給以與被所述分段處理器109確定的圖像區(qū)域中的一個(gè)、多個(gè)或全部有關(guān)的數(shù)據(jù)。作為響應(yīng),所述圖像特征處理器111為所述多個(gè)圖像區(qū)域中的至少一個(gè)圖像區(qū)域確定一個(gè)圖像特征。在所述優(yōu)選實(shí)施方案中,所述圖像特征指示所述圖像區(qū)域的一個(gè)性質(zhì),該性質(zhì)可以影響所述圖像區(qū)域的視頻編碼性能。例如,所述圖像特征可以是一個(gè)被包括在所述圖像區(qū)域中的圖像的空間頻率特征的指示。特別地,所述圖像特征可以指示是否所述圖像區(qū)域包括一個(gè)具有相對低的高頻內(nèi)容的均勻的圖像或者包括一個(gè)具有相對高的高頻分量的內(nèi)容的圖像。
所述圖像特征處理器111被耦合到視頻編碼選擇器113,它可操作來響應(yīng)于所述圖像特征而為所述至少一個(gè)圖像區(qū)域選擇一個(gè)視頻編碼參數(shù)。所述視頻編碼選擇器113優(yōu)選地選擇一個(gè)視頻編碼參數(shù),它特別適合于對一個(gè)具有為所述圖像區(qū)域而確定的特征的圖像進(jìn)行編碼。在一些實(shí)施方案中,所述視頻編碼參數(shù)可以包括一組不同的視頻編碼參數(shù)和/或可以包括所述視頻編碼參數(shù)的允許值列表。因此,在一些實(shí)例中,一個(gè)特定的參數(shù)值可以被選擇用于一個(gè)或多個(gè)視頻編碼參數(shù),而在其它實(shí)施方案中,具有一個(gè)允許值范圍的視頻參數(shù)可以被選擇。因此,所述視頻編碼參數(shù)對于用于作為其結(jié)果的視頻編碼的編碼參數(shù)的選擇提供了一種約束或限制。因此,在所述優(yōu)選實(shí)施方案中,所述視頻編碼選擇器113控制或影響所述視頻編碼器103的操作。
所述視頻編碼器103包括一個(gè)用于從所述視頻分析處理器101接收視頻編碼參數(shù)的接口115。所述接口115因此被耦合到所述視頻編碼選擇器113。用于在所述視頻分析處理器101和所述視頻編碼器103之間信息交換的協(xié)議和接口取決于所述應(yīng)用,并且可以被本領(lǐng)域的技術(shù)人員選擇以便適合特定的實(shí)施方案。
所述視頻編碼器103還包括一個(gè)被耦合到視頻源105并且可操作來從那里接收用于編碼的圖像的編碼器接收機(jī)117。所述編碼器接收機(jī)117和接口115被耦合到視頻編碼處理器119,它可操作來使用用于所述至少一個(gè)圖像區(qū)域的編碼參數(shù)而編碼所述圖像。因此,所述視頻編碼處理器119使用被所述視頻分析處理器101確定的視頻編碼參數(shù)來編碼從所述視頻源被接收的圖像。因此,根據(jù)所述視頻分析處理器101的外部分析,所述視頻編碼可以被最優(yōu)化,它可以獨(dú)立于所述視頻編碼器的處理。在所述優(yōu)選實(shí)施方案中,所述視頻編碼處理器119是一個(gè)H.264視頻編碼器。
在所述優(yōu)選實(shí)施方案中,來自所述視頻編碼處理器119的編碼的視頻信號被耦合返回到視頻分析處理器101。特別地,如在圖1中所示,所述視頻編碼處理器119的輸出可以被耦合到處理器接收機(jī)107。這種反饋耦合允許視頻分析處理器101基于所述編碼的信號確定所述圖像特征以及視頻編碼參數(shù)。選擇一個(gè)視頻編碼參數(shù)和編碼所述圖像的過程因此可以被迭代。這提供一種改進(jìn)的視頻編碼質(zhì)量和/或效率。在不同的迭代中,所述圖像特征和視頻編碼參數(shù)可以不同。
因此,根據(jù)所述優(yōu)選實(shí)施方案,H.264編碼參數(shù)的適應(yīng)性不被限于空間局部像素分析,而是還可以涉及諸如分段的圖像和視頻分析的外部方法。因此,一種較高級的數(shù)據(jù)分類可以被使用,并且特別地,所述較高級的分類和迭代方法可以促進(jìn)對其中編碼的人工產(chǎn)物可能出現(xiàn)或者成為顯著的干擾的圖像區(qū)域的識別。另外或者可替代地,它可以促進(jìn)編碼參數(shù)適應(yīng)性以便減少這些人工產(chǎn)物。
圖2是一個(gè)根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施方案的視頻編碼方法。所述方法可應(yīng)用于圖1的視頻編碼設(shè)備并且將參考圖1的視頻編碼設(shè)備而被描述。在所描述的實(shí)施方案中,步驟201到209在視頻分析處理器101中被執(zhí)行,步驟211到219在視頻編碼器103中被執(zhí)行。
在步驟201中,處理器接收機(jī)107從外部視頻源105接收一個(gè)圖像以用于編碼。
步驟201后面是步驟203,其中,所述圖像被供給分段處理器109,并且所述圖像被分成多個(gè)圖像區(qū)域。在一個(gè)簡單的實(shí)施方案中,一個(gè)單獨(dú)的圖像區(qū)域可以根據(jù)一個(gè)標(biāo)準(zhǔn)被選擇并且所述圖像正好被分成兩個(gè)圖像區(qū)域,即所述被選擇的圖像區(qū)域和一個(gè)包括所述圖像的剩余部分的圖像區(qū)域。然而,在所述優(yōu)選實(shí)施方案中,所述圖像被分成幾個(gè)圖像區(qū)域。
在所述優(yōu)選實(shí)施方案中,所述圖像通過所述圖像的分段被分成圖像區(qū)域。在所述優(yōu)選實(shí)施方案中,所述圖像分段包括根據(jù)共同性質(zhì)(例如,顏色)的像素空間分組的過程。存在幾種圖像和視頻分段方法,每種的有效性通常將取決于應(yīng)用。應(yīng)該理解,在不會有損于本發(fā)明的情況下,任何已知的用于圖像分段的方法或算法都可以被使用??梢栽贓.Steinbach,P.Eisert,B.Girod,“使用3-D場景模型的圖像序列的基于運(yùn)動(dòng)的分析和分段,”(Motion-based Analysis and Segmentation ofImage Sequence using 3-D Scene Models,)信號處理專刊用于基于內(nèi)容的處理和操作的視頻順序分段,1998年,第66卷,第2期,233-248頁中找到對圖像或視頻分段的介紹。
根據(jù)能夠從像素值和/或從根據(jù)這些值的數(shù)學(xué)計(jì)算被導(dǎo)出的特征的相似性,所述圖像分段可以通過遞歸地分解全部圖像或者通過合并所述圖像中的像素組而被執(zhí)行。這使得隔離具有某種顏色、光譜特征等等的區(qū)域成為可能。在圖像序列中,使用例如諸如被用于運(yùn)動(dòng)補(bǔ)償?shù)娜魏纹ヅ涞臉?biāo)準(zhǔn)或算法,單獨(dú)地執(zhí)行每個(gè)圖像的分段,或者將一個(gè)圖像的分段結(jié)果設(shè)計(jì)并且精制成連續(xù)的圖像是可能的。
以這種方式被獲得的圖像分段通常可以包括任意數(shù)量的像素,這意味著所述分段邊界可以具有任意的幾何形狀。然而,為了適配基于數(shù)據(jù)塊(H.264)的編碼參數(shù)和決定,每個(gè)分段最終將包括多個(gè)像素?cái)?shù)據(jù)塊或者多個(gè)圖像片段之一。既然這樣,根據(jù)任何適當(dāng)?shù)乃惴ɑ驑?biāo)準(zhǔn),能夠通過在相鄰的段中再分配像素來完成對不規(guī)則段邊界的必要的再整形。例如,大部分標(biāo)準(zhǔn)可以被使用,意味著如果某個(gè)段的區(qū)域與最初的段的重疊超過50%,則某個(gè)數(shù)據(jù)塊將被包括在某個(gè)段中??商娲?,分段過程本身可以被限制,這樣以便從開始就使用數(shù)據(jù)塊成形像素組來操作。
在所述優(yōu)選實(shí)施方案中,所述分段包括響應(yīng)于諸如顏色或均勻性(或平直度)級別的一個(gè)共同特征來檢測一個(gè)對象,并且從一個(gè)圖像到下一個(gè)圖像連續(xù)跟蹤這個(gè)對象。這提供了簡化的分段并且促進(jìn)被用相同的視頻編碼參數(shù)來編碼的適當(dāng)?shù)膮^(qū)域的識別。而且,在一些實(shí)施方案中,在不同于用于確定所述區(qū)域的視頻編碼參數(shù)的圖像特征的參數(shù)可以被用于所述分段。例如,所述分段可以將具有類似的顏色內(nèi)容的圖像區(qū)域集合在一起。因此,例如,如果所述視頻信號是一場足球比賽,則所述分段可以包括識別綠色為主的區(qū)域并且將它們集合在一起。然而,用于合成的圖像區(qū)域的視頻編碼參數(shù)將不基于綠色的優(yōu)勢,而是可以響應(yīng)于這些區(qū)域的紋理或細(xì)節(jié)級別被選擇。這允許主要與草地一致的圖像區(qū)域被識別并且使用適合于有效地編碼高紋理區(qū)域的參數(shù)而被編碼。而且,例如,運(yùn)動(dòng)員的足球衫可以在一個(gè)圖像中被識別并且在隨后的圖像中通過運(yùn)動(dòng)估計(jì)被跟蹤。舉一個(gè)例子,一個(gè)最初的圖像可以分段并且被獲得的分段跟蹤后來的圖像,直到一個(gè)新的圖像再次被獨(dú)立地分段,等等。所述分段跟蹤優(yōu)選地通過使用已知的運(yùn)動(dòng)估計(jì)技術(shù)被執(zhí)行。
在所述優(yōu)選實(shí)施方案中,所述圖像區(qū)域可以包括多個(gè)適合于類似的視頻編碼參數(shù)選擇的圖像區(qū)域。因此,一個(gè)圖像區(qū)域可以通過分組多個(gè)段被構(gòu)成。例如,如果所述視頻信號對應(yīng)于一場足球比賽,則具有綠色為主的全部區(qū)域可以被集合成為一個(gè)圖像區(qū)域。舉另一個(gè)例子,具有對應(yīng)于球隊(duì)之一的襯衫顏色的主要顏色的全部段可以被集合成為一個(gè)圖像區(qū)域。
所述圖像段不必對應(yīng)于物理對象。例如,兩個(gè)相鄰的段可以代表不同的對象但是兩者可以高度地具有紋理。既然這樣,兩個(gè)段可以適合于相同的視頻編碼參數(shù)的選擇。而且,如果一種迭代的方法被實(shí)現(xiàn),則所述分段可以包括或者排他地基于從所述H.264視頻編碼可得到的編碼統(tǒng)計(jì)。例如,在兩個(gè)不同的段中的運(yùn)動(dòng)數(shù)據(jù)的相似性可以是對于將這兩個(gè)段群集成一個(gè)較大的段的推動(dòng)力。
在一些實(shí)施方案中,所述圖像被加以劃分,以使得對于視頻編碼參數(shù)選擇特別敏感的一個(gè)或多個(gè)區(qū)域被確定。例如,通??隙?,H.264能夠顯著地減少M(fèi)PER-2視頻編碼的一些典型的人工產(chǎn)物,同時(shí)它也能導(dǎo)致其它一些人工產(chǎn)物。一種這樣的人工產(chǎn)物是對紋理的部分消除,導(dǎo)致一些圖像區(qū)域的類似塑料(plastic)的外觀。這對于諸如高清晰度電視的較大的圖像格式是特別顯著的。
對于具有突出的高頻性質(zhì)的紋理消除的一種可能的解釋是,在H.264中,一個(gè)16×16宏數(shù)據(jù)塊可以使用一個(gè)4×4數(shù)據(jù)塊變換而被變換。相反,MPEG-2使用一個(gè)8×8DCT變換用于相同的目的。因此,通過使用較小的變換數(shù)據(jù)塊,H.264將信號能量壓縮到較大數(shù)量的低頻系數(shù)中,留下在連續(xù)的視頻編碼期間更易被抑制(例如,由于系數(shù)加權(quán)或量化)的較少數(shù)量的高頻系數(shù)。因此,在一個(gè)實(shí)施方案中,所述圖像分段可以使得具有較高的紋理級別的區(qū)域被識別并且被集合成為一個(gè)圖像區(qū)域。所述視頻編碼參數(shù)隨后可以被選擇以便確保對于高紋理圖像的高質(zhì)量的編碼。特別地,所述視頻編碼參數(shù)可以被選擇以便對應(yīng)于MPEG-2視頻編碼參數(shù),這是因?yàn)橐阎揗PEG-2視頻編碼參數(shù)導(dǎo)致顯著較少的紋理信息丟失。
步驟203后面是步驟205,其中,所述多個(gè)圖像區(qū)域的至少一個(gè)圖像區(qū)域的圖像特征被確定。在無損于本發(fā)明的情況下,任何適當(dāng)?shù)膱D像特征都可以被使用。優(yōu)選地,所述圖像特征包括與所述圖像區(qū)域的視頻編碼性能有關(guān)的一個(gè)或多個(gè)特征。例如,所述圖像特征可以是一個(gè)對于所述圖像區(qū)域的空間頻率分布的指示。特別地,均勻性或平直度級別可以被確定,并且優(yōu)選地,所述圖像特征包括一個(gè)紋理特征。所述紋理特征可以根據(jù)在所述圖像區(qū)域中的數(shù)據(jù)塊上被執(zhí)行的離散余弦變換(DCT)被確定。較高頻率系數(shù)中的能量越集中,則認(rèn)為紋理級別越高。另一個(gè)圖像特征可以是一個(gè)運(yùn)動(dòng)估計(jì)參數(shù),它可以指示與所述圖像區(qū)域相聯(lián)系的對象的圖像內(nèi)的有關(guān)速度的指示。
步驟205后面是步驟207,其中,所述視頻編碼選擇器113響應(yīng)于所述圖像區(qū)域的圖像特征而為所述圖像區(qū)域選擇一個(gè)視頻編碼參數(shù)。在所述優(yōu)選實(shí)施方案中,響應(yīng)于所述紋理特征,一種編碼數(shù)據(jù)塊類型參數(shù)被選擇。因此,如果所述紋理特征指示一種高級紋理,則一種大數(shù)據(jù)塊尺寸被選擇,如果一種較低的紋理級別被指示,則一種較小的數(shù)據(jù)塊尺寸可以被選擇。這提供了減少的紋理信息的丟失,并且因此減少增塑或者紋理拖尾效應(yīng)作用。
所述視頻編碼參數(shù)附加地或者可替代地可以包括其它參數(shù),其中包括下列參數(shù)一個(gè)量化參數(shù)一個(gè)量化參數(shù)可以通過視頻編碼選擇器113被設(shè)置。例如,可以設(shè)置一個(gè)量化閾值,在該閾值以下,所有遵循編碼DCT的系數(shù)被設(shè)置為零。一個(gè)較低的閾值可以導(dǎo)致減小的比特率,但是也可以導(dǎo)致降低的圖像質(zhì)量。因?yàn)榕c靜止物體的視頻質(zhì)量級別相比,運(yùn)動(dòng)物體的視頻質(zhì)量級別對于人的感覺具有較低的關(guān)鍵性,所以,對于所述圖像特征增加的移動(dòng)指示,所述量子化閾值可以被減少。
一個(gè)幀間預(yù)測模式參數(shù)例如,一個(gè)視頻編碼參數(shù)可以被設(shè)置成在幀內(nèi)或幀間預(yù)測之間作選擇,和/或一個(gè)預(yù)測數(shù)據(jù)塊大小可以響應(yīng)于所述圖像特征而被設(shè)置。
一個(gè)參考圖像選擇參數(shù)例如,插值或運(yùn)動(dòng)估計(jì)的一個(gè)或多個(gè)圖像用戶可以響應(yīng)于所述圖像特征而被選擇??商娲鼗蚋郊拥兀谒鰣D像上可以被用作當(dāng)前圖像編碼的參考的界限可以被選擇。
一個(gè)解除組塊濾波參數(shù)例如,解除組塊濾波器的激活和/或所述濾波的強(qiáng)度可以通過視頻編碼選擇器113被設(shè)置。
作為一個(gè)具體的例子,一種用于指示在一個(gè)給定的閾值之上的紋理級別的圖像特征可以導(dǎo)致選擇出一個(gè)包括與在MPEG-2視頻編碼中被使用的參數(shù)緊密聯(lián)系的參數(shù)值的視頻編碼參數(shù)。因此,所述視頻編碼參數(shù)可以包括與可用于MPEG-2編碼的參數(shù)值相對應(yīng)的參數(shù)值。例如,幀間預(yù)測可以被限制用于H.264編碼,從而使它只使用8×8數(shù)據(jù)塊。所述視頻編碼參數(shù)也可以將預(yù)測限制為只基于最近被解碼的圖像。附加地自適應(yīng)數(shù)據(jù)塊變換(ABT)濾波可以被啟動(dòng),以便確保所述變換尺寸匹配所述預(yù)測數(shù)據(jù)塊尺寸[8]。
這將帶來對于MPEG-2編碼的一個(gè)良好的近似,因?yàn)椋琈PEG-2只使用最近被解碼的圖像和一個(gè)8×8變換(DCT),而它根據(jù)16×16數(shù)據(jù)塊執(zhí)行幀間預(yù)測。通過對與MPEG-2兼容的參數(shù)的選擇,能夠?yàn)樗鎏厥獾膱D像區(qū)域獲得和MPEG-2相同的視頻編碼性能。因此,一個(gè)圖像區(qū)域可以被加以確定,MPEG-2被預(yù)期為該區(qū)域提供一種與傳統(tǒng)的H.264編碼相比優(yōu)選的性能。對于所述特殊的圖像區(qū)域,所述H.264編碼器的性能可以被控制以便使用與MPEG-2類似或者同樣的編碼參數(shù)。這樣,所述MPEG-2編碼的優(yōu)選性能可以從所述H.264編碼器獲得。
步驟207后面是步驟209,其中,所述視頻編碼參數(shù)被供給視頻編碼器103并且特別被供給接口115。
步驟211到219在視頻編碼器103中被執(zhí)行。在步驟211中,編碼器接收機(jī)117從外部視頻源105接收要被編碼的圖像。圖2表示步驟211跟隨著步驟209,但是典型地,步驟201和211被同時(shí)執(zhí)行。特別地,編碼器接收機(jī)117可以包括一個(gè)緩沖器,它存儲所述圖像直到視頻分析處理器101已經(jīng)確定視頻編碼參數(shù)。
在步驟213中,接口115從視頻編碼選擇器113接收視頻編碼參數(shù)。典型地,步驟209和213是同時(shí)的。
在步驟215中,視頻編碼處理器119使用用于每個(gè)圖像區(qū)域的視頻編碼參數(shù)來編碼所述圖像。在所述優(yōu)選實(shí)施方案中,所述視頻編碼是依據(jù)H.264標(biāo)準(zhǔn),并且所述視頻編碼器是一個(gè)H.264視頻編碼器。然而,所述編碼過程由被接收的視頻編碼參數(shù)控制,并且因此由視頻分析處理器101控制。特別地,所述視頻編碼參數(shù)可以包括視頻編碼處理器119在執(zhí)行所述編碼時(shí)能夠選擇的多種可能的參數(shù)選擇。
在所述優(yōu)選實(shí)施方案中,所述被編碼的視頻信號被反饋回處理器接收機(jī)107,所述視頻分析處理器101根據(jù)所述被編碼的視頻信號執(zhí)行另一種分析。因此,在步驟217中,視頻編碼器103確定所述迭代過程是否已經(jīng)完成。如果是,則所述被編碼的圖像在步驟219中被輸出。
如果所述迭代過程未完成,則所述方法返回到步驟201,并且步驟201到209被重復(fù),但是這次根據(jù)所述被編碼的圖像而不是從所述外部圖像源被接收的原始圖像。因此,在第二次迭代中,在步驟201中,處理器接收機(jī)107從所述視頻編碼器接收所述被編碼的圖像,在步驟203中,所述分段處理器109將所述被編碼的圖像分成多個(gè)被編碼的圖像區(qū)域,在步驟205中,圖像特征處理器111為所述多個(gè)被編碼的圖像區(qū)域中的至少一個(gè)被編碼的圖像區(qū)域確定一個(gè)被編碼的圖像特征,在步驟207中,視頻編碼選擇器113響應(yīng)于所述被編碼圖像區(qū)域的被編碼圖像特征,為所述被編碼的圖像區(qū)域選擇第二個(gè)視頻編碼參數(shù),并且在步驟209中將所述第二個(gè)視頻編碼參數(shù)供給所述視頻編碼器。
在所述第二次迭代中,對所述圖像特征以及因此所述視頻編碼參數(shù)的選擇可以基于所述被編碼的信號的特征并且特別地可以響應(yīng)于所述視頻編碼特征、統(tǒng)計(jì)或錯(cuò)誤而被確定。在很多實(shí)例中,這能夠促進(jìn)所述過程。例如,紋理級別直接可以根據(jù)對給定的圖像區(qū)域中宏數(shù)據(jù)塊進(jìn)行編碼的DCT系數(shù)的系數(shù)數(shù)值而被確定。因此所述迭代提供改進(jìn)的視頻編碼并且允許視頻編碼參數(shù)被細(xì)微調(diào)整以便達(dá)到想要的視頻編碼性能。
所述第二個(gè)視頻編碼參數(shù)隨后被供給視頻編碼器103,并且使用所述第二個(gè)視頻編碼參數(shù)來再編碼所述圖像。
通過將所述再編碼的視頻信號供給處理器接收機(jī)107,所述過程可以被進(jìn)一步迭代并且重復(fù)被描述的步驟。所述過程可以被迭代所期望的次數(shù)。例如,所述過程可以被迭代直到給定的質(zhì)量級別被達(dá)到或者給定的計(jì)算資源或時(shí)間已經(jīng)被使用。
被提議的迭代編碼概念特別適合于脫機(jī)多通道編碼。在這個(gè)應(yīng)用中,一個(gè)輸入視頻信號在多次迭代中被編碼,其中,在每次迭代后被獲得的編碼統(tǒng)計(jì)被用于調(diào)整所述編碼參數(shù)以用于下一次迭代。
本發(fā)明可以在包括硬件、軟件、固件或它們的任何組合的任何適當(dāng)?shù)男问街斜粚?shí)現(xiàn)。然而,優(yōu)選地,本發(fā)明作為在一個(gè)或多個(gè)數(shù)據(jù)處理器和/或數(shù)字信號處理器上運(yùn)行的計(jì)算機(jī)軟件被實(shí)現(xiàn)。本發(fā)明的實(shí)施方案的單元和部件可以以任何適當(dāng)?shù)姆绞皆谖锢砩稀⒐δ苌虾瓦壿嬌媳粚?shí)現(xiàn)。
盡管已經(jīng)結(jié)合優(yōu)選實(shí)施方案描述了本發(fā)明,但是它并非用于將本發(fā)明限制于在此闡明的特定的形式。更確切地,本發(fā)明的范圍只被所附的權(quán)利要求限制。在權(quán)利要求書中,詞語“包括”并不排除其它單元或步驟的存在。而且,雖然是單獨(dú)地進(jìn)行列舉,但是也可以例如通過單個(gè)單元或處理器來實(shí)現(xiàn)多個(gè)裝置、單元或方法步驟。而且,盡管在不同的權(quán)利要求中包括了各個(gè)單獨(dú)的特征,但是這些特征也可以被有利地組合,在不同的權(quán)利要求中被包括的這些特征并不意味著這些特征的組合是不可行和/或不是有利的。另外,單個(gè)附圖標(biāo)記并不排除多個(gè)相應(yīng)附圖標(biāo)記的存在。因此,“一個(gè)”、“第一”、“第二”等詞語并不排除多個(gè)相應(yīng)的特征的存在。
權(quán)利要求
1.一種視頻編碼設(shè)備(100),包括-一個(gè)視頻分析處理器(101),它包括-用于接收一個(gè)用于編碼的圖像的裝置(107),-用于將所述圖像劃分成多個(gè)圖像區(qū)域的裝置(109),-用于為所述多個(gè)圖像區(qū)域中的至少一個(gè)圖像區(qū)域確定一個(gè)圖像特征的裝置(111),以及-響應(yīng)于所述圖像特征用于為所述至少一個(gè)圖像區(qū)域來選擇一個(gè)視頻編碼參數(shù)的裝置(113);和-一個(gè)視頻編碼器(103),它包括-用于接收用于編碼的圖像的裝置(117)-用于從所述視頻分析處理器接收所述視頻編碼參數(shù)的裝置(115),以及-使用用于所述至少一個(gè)圖像區(qū)域的視頻編碼參數(shù)來編碼所述圖像的裝置(119)。
2.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述用于劃分所述圖像的裝置(109)可用來通過所述圖像的分段而確定多個(gè)圖像區(qū)域。
3.如權(quán)利要求2中所述的視頻編碼設(shè)備(100),其中,所述圖像的分段包括在視頻信號的圖像之間跟蹤一個(gè)對象。
4.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述用于劃分所述圖像的裝置(109)可用來響應(yīng)于未被包括在所述圖像特征中的圖像性質(zhì)而劃分所述多個(gè)圖像區(qū)域。
5.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述用于劃分所述圖像的裝置(109)可用來將所述至少一個(gè)圖像區(qū)域確定為一個(gè)具有導(dǎo)致對于視頻編碼參數(shù)的高敏感性的圖像特征的圖像區(qū)域。
6.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述用于劃分所述圖像的裝置(109)可用來響應(yīng)于一個(gè)分段標(biāo)準(zhǔn)而將所述圖像劃分成多個(gè)段,并且通過分組多個(gè)段來確定所述至少第一個(gè)圖像區(qū)域。
7.如權(quán)利要求6中所述的視頻編碼設(shè)備(100),其中,所述劃分成多個(gè)段是響應(yīng)于一個(gè)分段標(biāo)準(zhǔn),并且所述分組是響應(yīng)于所述多個(gè)段的視頻編碼特征。
8.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述圖像特征包括一個(gè)紋理特征。
9.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),還包括用于將來自所述視頻編碼器的被編碼的圖像耦合到視頻分析處理器(101)的裝置,并且視頻分析處理器(101)可用于響應(yīng)于所述被編碼的圖像而產(chǎn)生所述圖像特征。
10.如權(quán)利要求9中所述的視頻編碼設(shè)備(100),其中,視頻編碼設(shè)備(100)可用于通過迭代地選擇一個(gè)用于所述至少一個(gè)圖像的視頻編碼參數(shù)而編碼所述圖像,并且使用用于所述至少一個(gè)圖像區(qū)域的視頻編碼參數(shù)來編碼所述圖像。
11.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述視頻編碼參數(shù)包括一個(gè)量化參數(shù)。
12.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述視頻編碼參數(shù)包括一個(gè)編碼數(shù)據(jù)塊類型參數(shù)。
13.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述視頻編碼參數(shù)包括一個(gè)幀間預(yù)測模式參數(shù)。
14.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述視頻編碼參數(shù)包括一個(gè)參考圖像選擇參數(shù)。
15.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述視頻編碼參數(shù)包括一個(gè)解除組塊濾波參數(shù)。
16.如權(quán)利要求1中所述的視頻編碼設(shè)備(100),其中,所述視頻編碼器(119)可用于根據(jù)H.26L標(biāo)準(zhǔn)來編碼所述視頻信號。
17.一種用于具有一個(gè)視頻分析處理器(101)和一個(gè)視頻編碼器(103)的視頻編碼設(shè)備(100)的視頻編碼的方法(200),包括步驟-在所述視頻分析處理器(101)中-接收(201)一個(gè)用于編碼的圖像,-將所述圖像分成(203)多個(gè)圖像區(qū)域;-為所述多個(gè)圖像區(qū)域的至少一個(gè)圖像區(qū)域確定(205)一個(gè)圖像特征;-響應(yīng)于所述圖像區(qū)域的圖像特征而為所述圖像區(qū)域選擇(207)一個(gè)視頻編碼參數(shù),以及-將所述視頻編碼參數(shù)供給(209)所述視頻編碼器;-以及在視頻編碼器(103)中-接收(211)用于編碼的圖像;-從所述視頻分析處理器接收(213)所述視頻編碼參數(shù),以及-使用用于每個(gè)圖像區(qū)域的視頻編碼參數(shù)來編碼(215)所述圖像。
18.如權(quán)利要求17中所述的視頻編碼方法,還包括步驟-在所述視頻分析處理器中-從所述視頻編碼器接收所述被編碼的圖像,-將所述被編碼的圖像分成多個(gè)被編碼的圖像區(qū)域;-為所述多個(gè)被編碼的圖像區(qū)域中的至少一個(gè)被編碼的圖像區(qū)域確定一個(gè)被編碼的圖像特征;-響應(yīng)于所述被編碼的圖像區(qū)域的被編碼的圖像特征而為所述被編碼的圖像區(qū)域選擇第二個(gè)視頻編碼參數(shù),以及-將所述第二個(gè)視頻編碼參數(shù)供給所述視頻編碼器;-在所述視頻編碼器中-從所述視頻分析處理器接收所述第二個(gè)視頻編碼參數(shù),以及-使用用于每個(gè)圖像區(qū)域的第二個(gè)視頻編碼參數(shù)來編碼所述圖像。
19.一種允許執(zhí)行根據(jù)權(quán)利要求18的方法的計(jì)算機(jī)程序。
20.一種包括如權(quán)利要求19中所述的計(jì)算機(jī)程序的記錄載體。
全文摘要
本發(fā)明涉及一種包括視頻分析處理器(101)和視頻編碼器(103)的視頻編碼設(shè)備(100)。視頻分析處理器(101)包括將一個(gè)圖像分成多個(gè)圖像區(qū)域的分段處理器(109)。圖像特征處理器(111)為所述區(qū)域之一確定諸如紋理級別的圖像特征,并且響應(yīng)于視頻編碼選擇器(113)為所述區(qū)域選擇一個(gè)視頻編碼參數(shù)。所述視頻編碼參數(shù)被供給視頻編碼器(103),其中,視頻編碼處理器(119)使用通過視頻分析處理器(101)的外部分析而被確定的視頻編碼參數(shù)來編碼所述圖像。所述被編碼的圖像被反饋給視頻分析處理器(101),并且所述過程被迭代直到想要的編碼性能被達(dá)到。所述設(shè)備特別適合于H.264編碼,并且提供來自基于外部分析的編碼參數(shù)的選擇的改進(jìn)的性能。
文檔編號H04N7/50GK1757240SQ200480005851
公開日2006年4月5日 申請日期2004年2月25日 優(yōu)先權(quán)日2003年3月3日
發(fā)明者D·布拉澤羅維 申請人:皇家飛利浦電子股份有限公司