精細(xì)顆?？缮炜s性視頻編碼技術(shù)中增強(qiáng)層的改進(jìn)預(yù)測(cè)結(jié)構(gòu)的制作方法

文檔序號(hào)：6350105閱讀：159來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：精細(xì)顆粒可伸縮性視頻編碼技術(shù)中增強(qiáng)層的改進(jìn)預(yù)測(cè)結(jié)構(gòu)的制作方法
背景技術(shù)：
總的來(lái)說(shuō)，本發(fā)明涉及視頻壓縮技術(shù)，具體而言，本發(fā)明涉及采用多個(gè)基層幀(base layer frames)來(lái)產(chǎn)生每一個(gè)增強(qiáng)層幀的一種伸縮結(jié)構(gòu)。
可伸縮視頻編碼技術(shù)是許多多媒體應(yīng)用和業(yè)務(wù)所需要的一種功能。例如，視頻伸縮性被用于采用具有大范圍處理能力的譯碼器的系統(tǒng)中。在這種情況下，計(jì)算能力低的處理器只對(duì)可伸縮視頻流的一個(gè)子集進(jìn)行譯碼。
可伸縮視頻技術(shù)的另一種應(yīng)用是可變傳輸帶寬環(huán)境。在這種情況下，帶寬較窄的接收機(jī)只對(duì)可伸縮視頻流的一個(gè)子集進(jìn)行接收和譯碼，其中這個(gè)可伸縮視頻流的這個(gè)子集的大小正比于可以獲得的帶寬。
MPEG-2和MPEG-4這樣的主流視頻壓縮標(biāo)準(zhǔn)采用了幾種視頻可伸縮性方法。在這些標(biāo)準(zhǔn)中規(guī)定了時(shí)間、空間和質(zhì)量(SNR)可伸縮性類型。所有這些方法都包括一個(gè)基層(BL)和一個(gè)增強(qiáng)層(EL)?？偟膩?lái)說(shuō)，可伸縮視頻流的基層部分代表對(duì)視頻類進(jìn)行譯碼所需要的最少的數(shù)據(jù)。視頻流的增強(qiáng)層部分是接收器譯碼的時(shí)候用來(lái)增強(qiáng)視頻信號(hào)的額外信息。
用于對(duì)靜止圖像進(jìn)行編碼的另外一類可伸縮性是精細(xì)顆?？缮炜s性(FGS)。用這種可伸縮性技術(shù)編碼的圖像被逐步譯碼。換句話說(shuō)，譯碼器在接收完對(duì)這一圖像進(jìn)行編碼的所有數(shù)據(jù)之前就開(kāi)始對(duì)這個(gè)圖像進(jìn)行譯碼和顯示。隨著收到的數(shù)據(jù)越來(lái)越多，譯碼后圖像的質(zhì)量逐漸提高，直到用于對(duì)這個(gè)圖像進(jìn)行編碼的所有數(shù)據(jù)被收到、譯碼和顯示。
在MPEG-4中正在對(duì)視頻信號(hào)精細(xì)顆?？缮炜s性進(jìn)行標(biāo)準(zhǔn)化，MPEG-4就是下一代多媒體國(guó)際標(biāo)準(zhǔn)。在這種可伸縮性結(jié)構(gòu)里，在基層中象其它普通視頻可伸縮性方法中一樣使用運(yùn)動(dòng)預(yù)測(cè)編碼技術(shù)。對(duì)于每一編碼基層幀，隨后利用精細(xì)顆?？缮炜s性方法對(duì)一個(gè)剩余圖像進(jìn)行計(jì)算和編碼，產(chǎn)生一個(gè)增強(qiáng)層幀。這種結(jié)構(gòu)消除了增強(qiáng)層幀之間的依賴性，因而具有精細(xì)顆?？缮炜s性，同時(shí)充分利用了基層中進(jìn)行預(yù)測(cè)的優(yōu)點(diǎn)，因而能夠提高編碼效率。

圖1畫出了FGS結(jié)構(gòu)的一個(gè)實(shí)例。如圖所示，這個(gè)結(jié)構(gòu)還包括一個(gè)基層和一個(gè)增強(qiáng)層。此外，每一個(gè)增強(qiáng)幀都是從同一時(shí)刻的原始基層幀產(chǎn)生的。這一點(diǎn)由從每個(gè)基層幀向上指向?qū)?yīng)的增強(qiáng)層幀的箭頭反映出來(lái)。
圖2畫出了FGS編碼系統(tǒng)的一個(gè)實(shí)例。這個(gè)系統(tǒng)包括一個(gè)網(wǎng)絡(luò)6，它的帶寬在(Bmin＝Rmin，Bmax＝Rmax)這個(gè)范圍內(nèi)可變。還畫出了一個(gè)計(jì)算功能框4，這個(gè)功能框用于估計(jì)或者測(cè)量當(dāng)前可用帶寬(R)。
此外，基層(BL)視頻編碼器8利用(Rmin，R)范圍內(nèi)的比特率(RBL)對(duì)視頻源2出來(lái)的信號(hào)進(jìn)行壓縮。在典型情況下，基層編碼器8利用最小比特率(Rmin)對(duì)信號(hào)進(jìn)行壓縮。當(dāng)基層在發(fā)送視頻信號(hào)之前就以離線形式進(jìn)行基層編碼的情況下尤其如此?？梢钥闯?，圖中的單元10用于計(jì)算剩余圖像12。
增強(qiáng)層(EL)編碼器14以比特率RBL對(duì)剩余信號(hào)12進(jìn)行壓縮，這個(gè)比特率可以在RBL到Rmax-RBL的范圍之內(nèi)。注意到視頻信號(hào)(增強(qiáng)層和基層)的編碼既可以實(shí)時(shí)進(jìn)行(如同圖中所暗示的一樣)，又可以在傳送圖像之前以離線方式進(jìn)行，這一點(diǎn)是非常重要的。在后一種情形中，如圖所示，視頻信號(hào)可以儲(chǔ)存起來(lái)，然后晚些時(shí)候在一個(gè)實(shí)時(shí)速率控制器16的控制下發(fā)送(或者傳送)。實(shí)施控制器16將當(dāng)前(實(shí)時(shí))可用帶寬R考慮在內(nèi)，選擇最佳的質(zhì)量增強(qiáng)層信號(hào)。因此，速率控制器16輸出的增強(qiáng)層信號(hào)的比特率等于R-RBL。
發(fā)明簡(jiǎn)述本發(fā)明的目的是對(duì)輸入的視頻數(shù)據(jù)進(jìn)行靈活同時(shí)高效編碼的一種技術(shù)。該方法要對(duì)叫做基層幀和增強(qiáng)層幀的一部分視頻數(shù)據(jù)進(jìn)行編碼。用MPEG-4或者M(jìn)PEG-2這種運(yùn)動(dòng)補(bǔ)償DCT編碼技術(shù)中的任意一種對(duì)基層幀進(jìn)行編碼。
剩余圖像是通過(guò)從輸入的視頻數(shù)據(jù)中減去預(yù)測(cè)信號(hào)產(chǎn)生的。根據(jù)本發(fā)明，預(yù)測(cè)是從有或者沒(méi)有運(yùn)動(dòng)補(bǔ)償?shù)亩鄠€(gè)譯碼基層幀形成的，在這里的編碼流中包括了模式選擇判決。由于這種預(yù)測(cè)非常有效，剩余圖像數(shù)據(jù)相對(duì)較少。然后用精細(xì)顆粒可伸縮性(比如DCT變換編碼或者小波編碼)對(duì)叫做增強(qiáng)層幀的剩余圖像進(jìn)行編碼。這樣就能夠?qū)崿F(xiàn)對(duì)視頻數(shù)據(jù)的靈活而且高效的編碼。
本發(fā)明還提供一種方法，它翻轉(zhuǎn)前面對(duì)視頻數(shù)據(jù)的編碼過(guò)程，產(chǎn)生譯碼后的幀。編碼后的數(shù)據(jù)包括兩部分，基層和增強(qiáng)層。該方法包括基層，它的譯碼方法取決于編碼方法(編碼器那里選擇的MPEG-2或者M(jìn)PEG-4)，從而產(chǎn)生譯碼后的基層視頻幀。還有，要譯碼的增強(qiáng)層取決于精細(xì)顆粒可伸縮性(比如編碼器那里選擇的離散余弦變換編碼或者小波編碼)，以此來(lái)產(chǎn)生增強(qiáng)層幀。對(duì)于編碼流中的模式判決信息，從多個(gè)譯碼后基層視頻幀中選擇出來(lái)的幀被用來(lái)產(chǎn)生預(yù)測(cè)信號(hào)，而不管有還是沒(méi)有運(yùn)動(dòng)補(bǔ)償。然后在譯碼基層視頻幀中增加預(yù)測(cè)來(lái)產(chǎn)生譯碼輸出視頻數(shù)據(jù)。
由于相鄰圖片具有很強(qiáng)的時(shí)間相關(guān)性，除了對(duì)應(yīng)的基層編碼幀以外，與某個(gè)原始圖像有關(guān)的信息還駐留在其它幀內(nèi)，注意到這一點(diǎn)是非常重要的。例如，前面的基層幀的壓縮質(zhì)量可能比當(dāng)前幀高，并且這兩個(gè)原始圖片之間的時(shí)間相關(guān)性非常強(qiáng)。在這種情況下，有可能是前面的基層幀比當(dāng)前基層幀攜帶了更多的當(dāng)前原始圖片信息。因此，最好是利用前面一個(gè)基層幀來(lái)計(jì)算這個(gè)圖片的增強(qiáng)層信號(hào)。
如同前面參考圖1所作的討論一樣，當(dāng)前FGS結(jié)構(gòu)從對(duì)應(yīng)的當(dāng)前基層幀產(chǎn)生每一個(gè)增強(qiáng)層幀。雖然不是那么復(fù)雜，這種結(jié)構(gòu)無(wú)法充分利用基層幀附近更大范圍內(nèi)能夠獲得的信息，而它能夠產(chǎn)生更好的增強(qiáng)信號(hào)。因此，根據(jù)本發(fā)明，與當(dāng)前基層幀相比，利用基層圖片周圍的信息可以為任意圖片產(chǎn)生增強(qiáng)層幀。
通過(guò)下面的數(shù)學(xué)公式來(lái)說(shuō)明當(dāng)前可伸縮結(jié)構(gòu)和新的可伸縮結(jié)構(gòu)之間的差別。當(dāng)前的增強(qiáng)結(jié)構(gòu)用以下公式表示E(t)＝O(t)-B(t)， (1)其中E(t)是增強(qiáng)層信號(hào)，O(t)是原始圖片，B(t)是時(shí)刻“t”的基層編碼圖片。本發(fā)明的新的增強(qiáng)結(jié)構(gòu)用以下表達(dá)式說(shuō)明E(t)＝O(t)-sum{a(t-i)*M(B(t-i))} (2)i＝L1，-L1+1，...，0，1，...，L2-1，L2其中L1和L2是“局部性，”參數(shù)，而a(t-i)則是給每個(gè)基層圖片的加權(quán)參數(shù)。權(quán)值a(t-i)受到如下約束0＜＝a(t-i)＜+1 (3)Sum{a(t-i)}＝1i＝-L1，-L1+1，...，0，1，...，L2-1，L2此外，選擇等式(2)的加權(quán)參數(shù)a(t-i)的時(shí)候最好是使得增強(qiáng)層信號(hào)E(t)的尺寸最小。這一計(jì)算是在增強(qiáng)層剩余計(jì)算單元中進(jìn)行的。但是，如果無(wú)法獲得進(jìn)行這一計(jì)算所需要的計(jì)算能力，那么這個(gè)權(quán)參數(shù)a(t-i)就可以在0和1之間切換，或者平均成a(t+1)＝0.5或者a(t-1)＝0.5。
公式(2)中的M運(yùn)算符表示運(yùn)動(dòng)估計(jì)運(yùn)算，因?yàn)橄噜張D片或者幀內(nèi)的對(duì)應(yīng)部分通常都因?yàn)橐曨l圖像的運(yùn)動(dòng)而不在同一個(gè)位置。這樣，在相鄰基層圖片或者幀上進(jìn)行運(yùn)動(dòng)估計(jì)運(yùn)算，為等式2中定義的增強(qiáng)層信號(hào)產(chǎn)生運(yùn)動(dòng)補(bǔ)償(MC)信息。一般情況下，MC信息包括運(yùn)動(dòng)矢量和相鄰圖片之間的所有差別信息。
根據(jù)本發(fā)明，計(jì)算方法有幾種，為按照公式(2)產(chǎn)生的增強(qiáng)層信號(hào)使用，和發(fā)送運(yùn)動(dòng)補(bǔ)償(MC)信息。例如，用于M運(yùn)算符的運(yùn)動(dòng)補(bǔ)償信息可以與基層計(jì)算出來(lái)的運(yùn)動(dòng)補(bǔ)償信息(例如運(yùn)動(dòng)矢量)相同。但是，會(huì)出現(xiàn)基層沒(méi)有所需運(yùn)動(dòng)補(bǔ)償信息的情況。
例如，采用后向預(yù)測(cè)的時(shí)候，如果沒(méi)有作為基層的一部分計(jì)算并且發(fā)送出去(例如如果基層只包括I和P圖片而不包括B圖片)，就必須計(jì)算并且發(fā)送后向運(yùn)動(dòng)補(bǔ)償信息。在基層需要的以外需要計(jì)算和發(fā)送的運(yùn)動(dòng)信息的信息量的基礎(chǔ)之上，有三種可能。
在一種可能中，只是為增強(qiáng)層預(yù)測(cè)計(jì)算另外一組運(yùn)動(dòng)矢量所增加的復(fù)雜性無(wú)關(guān)緊要。從理論上講，這一選擇應(yīng)該給隨后的壓縮提供最好的增強(qiáng)層信號(hào)。
在第二種可能中，增強(qiáng)層預(yù)測(cè)只利用基層中已經(jīng)計(jì)算出來(lái)的運(yùn)動(dòng)矢量。某個(gè)圖片的增強(qiáng)層預(yù)測(cè)的源圖片(預(yù)測(cè)是從這些圖片進(jìn)行的)必定是同一圖片基層中使用的那些的一個(gè)子集。例如，如果基層是一幅內(nèi)圖片，那么它的增強(qiáng)層只能從同一個(gè)內(nèi)基圖片預(yù)測(cè)。如果這個(gè)基層是一個(gè)P圖片，那么它的增強(qiáng)圖片必須從用作基層運(yùn)動(dòng)預(yù)測(cè)的同樣的參考圖片預(yù)測(cè)，B圖片也是這樣。
上面描述的第二種情況可能限制增強(qiáng)層能夠使用的預(yù)測(cè)的類型。但是，它不要求傳送額外的運(yùn)動(dòng)矢量，也不需要計(jì)算任何額外的運(yùn)動(dòng)矢量。因此，這樣就能夠降低編碼器的復(fù)雜性，而只略微犧牲質(zhì)量。
第三種可能介于前兩種可能之間。在這種可能中，對(duì)增強(qiáng)層可以使用的預(yù)測(cè)的類型沒(méi)有多少或者根本沒(méi)有限制。對(duì)于剛好擁有所需增強(qiáng)預(yù)測(cè)類型所需要的基層運(yùn)動(dòng)矢量的圖片，重復(fù)使用基運(yùn)動(dòng)矢量。對(duì)于其它圖片，單獨(dú)為增強(qiáng)預(yù)測(cè)計(jì)算運(yùn)動(dòng)矢量。
上述公式為增強(qiáng)層信號(hào)的計(jì)算提供了通用框架。但是，在這里值得注意通用框架中的幾個(gè)特別之處。例如，如果在公式(2)中L1＝L2＝O，新的FGS增強(qiáng)預(yù)測(cè)結(jié)構(gòu)就縮減為圖1所示的當(dāng)前FGS增強(qiáng)預(yù)測(cè)結(jié)構(gòu)。應(yīng)該指出，這種新結(jié)構(gòu)提供的功能一點(diǎn)也不會(huì)被這里建議的改進(jìn)所削弱，因?yàn)樵鰪?qiáng)層圖片之間的關(guān)系沒(méi)有改變，因?yàn)樵鰪?qiáng)層圖片不是互相導(dǎo)出的。
除此以外，如果在公式(2)中L1＝0并且L2＝1，那么這個(gè)通用框架縮減為圖3所示的可收縮性結(jié)構(gòu)。在本發(fā)明可收縮性結(jié)構(gòu)的這個(gè)實(shí)例里，當(dāng)前基層幀和后一個(gè)基層幀被用來(lái)產(chǎn)生每一個(gè)增強(qiáng)層幀。因此，公式(2)中的M運(yùn)算符將進(jìn)行前向預(yù)測(cè)。
類似地，如果公式(2)中L1＝1并且L2＝0，那么這個(gè)通用框架縮減為圖4所示的可伸縮結(jié)構(gòu)。在本發(fā)明可伸縮結(jié)構(gòu)的這個(gè)實(shí)例中，當(dāng)前的基層幀和前一個(gè)基層幀被用于產(chǎn)生每一個(gè)增強(qiáng)層幀。因此，公式(2)中的M運(yùn)算符將進(jìn)行后向預(yù)測(cè)。
除此以外，如果公式(2)中L1＝L2＝1，那么這個(gè)通用框架就縮減為圖5所示的可伸縮結(jié)構(gòu)。在本發(fā)明可伸縮結(jié)構(gòu)的這個(gè)實(shí)例中，當(dāng)前的、后面的和前面的基層幀被用于產(chǎn)生每一個(gè)增強(qiáng)層幀。因此，公式(2)中的M運(yùn)算符將進(jìn)行雙向預(yù)測(cè)。
在圖6中說(shuō)明本發(fā)明的一個(gè)編碼器實(shí)例。可以看出，這個(gè)編碼器包括一個(gè)基層編碼器18和一個(gè)增強(qiáng)層譯碼器36。這個(gè)基層編碼器18對(duì)輸入視頻O(t)的一部分進(jìn)行編碼，以便產(chǎn)生基層信號(hào)。此外，增強(qiáng)層編碼器36對(duì)輸入視頻O(t)的其余部分進(jìn)行編碼，產(chǎn)生增強(qiáng)層信號(hào)。
可以看出，基層編碼器18包括一個(gè)運(yùn)動(dòng)估計(jì)/補(bǔ)償預(yù)測(cè)功能塊20，一個(gè)離散余弦變換(DCT)功能塊22，一個(gè)量化功能塊24，一個(gè)可變長(zhǎng)度編碼(VLC)功能塊26和一個(gè)基層緩沖器28。在工作的過(guò)程中，這個(gè)運(yùn)動(dòng)估計(jì)/補(bǔ)償預(yù)測(cè)功能塊20對(duì)輸入的視頻信號(hào)O(t)進(jìn)行運(yùn)動(dòng)估計(jì)，產(chǎn)生運(yùn)動(dòng)矢量，以及關(guān)于如何對(duì)數(shù)據(jù)進(jìn)行編碼產(chǎn)生模式判決，傳遞給VLC功能塊26。此外，運(yùn)動(dòng)估計(jì)/補(bǔ)償預(yù)測(cè)功能塊20還將輸入視頻信號(hào)O(t)的另一部分不加改變地傳送給DCT功能塊22。這一部分對(duì)應(yīng)于輸入的視頻信號(hào)O(t)，它們將被編碼成I幀和沒(méi)有編碼進(jìn)運(yùn)動(dòng)矢量的部分B和P幀。
離散余弦變換功能塊22對(duì)從運(yùn)動(dòng)估計(jì)/補(bǔ)償預(yù)測(cè)功能塊20收到的輸入視頻信號(hào)進(jìn)行離散余弦變換。此外，量化功能塊24對(duì)離散余弦變換功能塊22的輸出進(jìn)行量化。可變長(zhǎng)度編碼功能塊26對(duì)運(yùn)動(dòng)估計(jì)/補(bǔ)償預(yù)測(cè)功能塊20和量化功能塊24的輸出進(jìn)行可變長(zhǎng)度編碼，產(chǎn)生基層幀。輸出進(jìn)行實(shí)時(shí)傳送或者長(zhǎng)時(shí)間儲(chǔ)存之前，這些基層幀暫時(shí)儲(chǔ)存在基層比特緩沖器28中。
還可以看到，一個(gè)逆量化功能塊34和一個(gè)逆離散余弦變換功能塊32串聯(lián)在量化功能塊24的輸出端。在工作的時(shí)候，這些功能塊32和34提供前面的編碼幀的譯碼后版本，儲(chǔ)存在一個(gè)幀存儲(chǔ)器30中。譯碼后的這一幀被運(yùn)動(dòng)估計(jì)/補(bǔ)償預(yù)測(cè)功能塊20用來(lái)為當(dāng)前幀產(chǎn)生運(yùn)動(dòng)矢量。利用前一幀的譯碼后版本就能夠使譯碼器一側(cè)的運(yùn)動(dòng)補(bǔ)償更加精確，因?yàn)樵谧g碼器一側(cè)它與收到的相同。
從圖6還可以看出，增強(qiáng)層編碼器36包括一個(gè)增強(qiáng)預(yù)測(cè)和剩余計(jì)算功能塊38，一個(gè)增強(qiáng)層FGS編碼功能塊40和一個(gè)增強(qiáng)層緩沖器42。在工作的時(shí)候，增強(qiáng)預(yù)測(cè)和剩余計(jì)算功能塊38通過(guò)從輸入視頻信號(hào)O(t)中減去預(yù)測(cè)信號(hào)來(lái)產(chǎn)生剩余圖像信號(hào)。
根據(jù)本發(fā)明，按照公式(2)從多個(gè)基層幀B(t)，B(t-1)形成預(yù)測(cè)信號(hào)。如前所述，B(t)代表當(dāng)前基層幀，B(t-i)代表一個(gè)或者多個(gè)相鄰基層幀，比如前一幀，后一幀或者這兩者。因此，利用多個(gè)基層幀形成每一個(gè)剩余圖像。
此外，增強(qiáng)層FGS編碼功能塊40被用于對(duì)增強(qiáng)預(yù)測(cè)和剩余計(jì)算功能塊38產(chǎn)生的剩余圖像進(jìn)行編碼，產(chǎn)生增強(qiáng)層幀。增強(qiáng)層編碼功能塊40使用的編碼技術(shù)可以是任意精細(xì)顆?？缮炜s編碼技術(shù)，比如離散余弦變換或者小波圖像編碼。輸出進(jìn)行實(shí)時(shí)傳輸或者長(zhǎng)時(shí)間儲(chǔ)存之前，增強(qiáng)層幀暫時(shí)儲(chǔ)存在增強(qiáng)層比特緩沖器42中。
圖7說(shuō)明本發(fā)明一個(gè)譯碼器實(shí)例?？梢钥闯?，譯碼器包括一個(gè)基層譯碼器44和一個(gè)增強(qiáng)層譯碼器56?；鶎幼g碼器44對(duì)進(jìn)來(lái)的基層幀進(jìn)行譯碼，產(chǎn)生基層視頻信號(hào)B’(t)。此外，增強(qiáng)層譯碼器56對(duì)進(jìn)來(lái)的增強(qiáng)層幀進(jìn)行譯碼，將這些幀與適當(dāng)?shù)淖g碼后基層幀進(jìn)行組合，產(chǎn)生增強(qiáng)輸出視頻信號(hào)O’(t)。
可以看出，基層譯碼器44包括可變長(zhǎng)度譯碼(VLD)功能塊46，逆量化功能塊48和逆離散傅里葉變換功能塊50。在工作的過(guò)程中，這些功能塊46、48、50對(duì)進(jìn)來(lái)的基層幀分別進(jìn)行可變長(zhǎng)度譯碼、逆量化和逆離散余弦變換，產(chǎn)生譯碼運(yùn)動(dòng)矢量、I幀、部分B和P幀。
基層譯碼器44還包括運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)功能塊52，用于對(duì)逆離散余弦變換功能塊50的輸出進(jìn)行運(yùn)動(dòng)補(bǔ)償，產(chǎn)生基層視頻信號(hào)。此外，還有一個(gè)幀存儲(chǔ)器54，用來(lái)儲(chǔ)存以前譯碼的基層幀B’(t-i)。于是就能夠在儲(chǔ)存在幀存儲(chǔ)器54中的譯碼后運(yùn)動(dòng)矢量和基層幀B’(t-i)的基礎(chǔ)之上對(duì)部分B或者P幀進(jìn)行運(yùn)動(dòng)補(bǔ)償。
可以看出，增強(qiáng)層譯碼器56包括一個(gè)增強(qiáng)層FGS譯碼功能塊58和一個(gè)增強(qiáng)預(yù)測(cè)和剩余組合功能塊60。在工作的時(shí)候，增強(qiáng)層FGS譯碼塊58對(duì)進(jìn)來(lái)的增強(qiáng)層幀進(jìn)行譯碼。這種譯碼是編碼器一側(cè)所進(jìn)行的操作的逆操作，它可能包括任何精細(xì)顆?？缮炜s性技術(shù)，比如離散余弦變換或者小波圖像譯碼。
此外，增強(qiáng)預(yù)測(cè)和剩余合并功能塊60將譯碼后的增強(qiáng)層幀E’(t)與基層視頻信號(hào)B’(t)、B’(t-i)進(jìn)行合并，以便產(chǎn)生增強(qiáng)視頻信號(hào)O’(t)。具體而言，每個(gè)譯碼后的增強(qiáng)層幀E’(t)都與預(yù)測(cè)信號(hào)合并。根據(jù)本發(fā)明，從當(dāng)前的基層幀B’(t)和儲(chǔ)存在幀存儲(chǔ)器54中的至少一個(gè)其它基層幀B’(t-i)形成預(yù)測(cè)信號(hào)。根據(jù)本發(fā)明，另一個(gè)基層幀可以是一個(gè)相鄰幀，比如前一幀，后一幀或者這兩者。這些幀按照以下公式合并O’(t)＝E’(t)+sum{a(t-i)*M(B’(t-i))}(4)i＝-L1，-L1+1，...，0，1，...，L2-1，L2，其中M運(yùn)算符是運(yùn)動(dòng)位移或者補(bǔ)償運(yùn)算符，a(t-i)是一個(gè)加權(quán)參數(shù)。公式(4)中進(jìn)行的運(yùn)算是公式(2)所示譯碼器一側(cè)進(jìn)行的運(yùn)算的逆運(yùn)算?？梢钥闯觯@些運(yùn)算包括將每一個(gè)譯碼后的增強(qiáng)層幀E’(t)加到運(yùn)動(dòng)補(bǔ)償后的基層視頻幀的加權(quán)和上去。
在圖8中給出能夠采用本發(fā)明的一個(gè)系統(tǒng)實(shí)例。作為一個(gè)實(shí)例，系統(tǒng)66可以表示電視機(jī)、機(jī)頂盒、臺(tái)式計(jì)算機(jī)、膝上型或者掌上型計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、盒式磁帶錄像機(jī)(VCR)、數(shù)字錄像機(jī)(DVR)、TiVO裝置等等這樣的視頻/圖像存儲(chǔ)器以及這些裝置和其它裝置的部分或者組合。系統(tǒng)66包括一個(gè)或者多個(gè)視頻源68，一個(gè)或者多個(gè)輸入/輸出裝置76，一個(gè)處理器70和一個(gè)存儲(chǔ)器72。
視頻/圖像源68可以代表，例如電視接收機(jī)，VCR或者其它視頻/圖像存儲(chǔ)器。源68也可以代表一個(gè)或者多個(gè)網(wǎng)絡(luò)連接，用于從服務(wù)器或者因特網(wǎng)、廣域網(wǎng)、城際網(wǎng)、局域網(wǎng)、陸地廣播系統(tǒng)、有線網(wǎng)、衛(wèi)星網(wǎng)、無(wú)線網(wǎng)或者電話網(wǎng)這樣的全球計(jì)算機(jī)通信網(wǎng)或者這些網(wǎng)絡(luò)和其它網(wǎng)絡(luò)的一部分或者組合上的服務(wù)器接收視頻信號(hào)。
輸入/輸出裝置76、處理器70和存儲(chǔ)器72通過(guò)通信媒介78進(jìn)行通信。通信媒介78可以代表例如總線、通信網(wǎng)、一個(gè)或者多個(gè)內(nèi)部電路連接、電路卡或者其它裝置，以及這些通信媒介和其它通信媒介的一部分和它們的組合。從源68輸入的視頻數(shù)據(jù)按照存儲(chǔ)器72中儲(chǔ)存，處理器70執(zhí)行的一個(gè)或者多個(gè)軟件程序來(lái)進(jìn)行處理，從而產(chǎn)生視頻/圖像，在顯示器74上顯示出來(lái)。
在一個(gè)實(shí)施方案中，采用本發(fā)明的新的可伸縮性結(jié)構(gòu)的編碼和譯碼技術(shù)是利用計(jì)算機(jī)能夠讀，這個(gè)系統(tǒng)能夠執(zhí)行的代碼來(lái)實(shí)現(xiàn)的。這些代碼可以儲(chǔ)存在存儲(chǔ)器72中，或者從CD-ROM或者軟盤這樣的存儲(chǔ)媒介讀出/下載。在其它實(shí)施方案中，可以用硬件電路來(lái)代替軟件指令，或者與它們結(jié)合，來(lái)實(shí)現(xiàn)本發(fā)明。例如，圖6～7所示的部件也可以作為離散的硬件實(shí)現(xiàn)。
雖然前面用具體實(shí)例描述了本發(fā)明，但是應(yīng)該明白，本發(fā)明不是只限于這里公開(kāi)的實(shí)例。例如，本發(fā)明不限于任何具體的編碼幀類型和概率分布。相反，本發(fā)明包括包括在權(quán)利要求的實(shí)質(zhì)和范圍之內(nèi)的各種結(jié)構(gòu)和改進(jìn)。
權(quán)利要求
1.對(duì)視頻數(shù)據(jù)進(jìn)行編碼的一種方法，包括以下步驟對(duì)一部分視頻數(shù)據(jù)進(jìn)行編碼，產(chǎn)生基層幀；對(duì)于每個(gè)剩余圖像利用多個(gè)基層幀從視頻數(shù)據(jù)和基層幀產(chǎn)生剩余圖像；和用精細(xì)顆?？缮炜s性技術(shù)對(duì)剩余圖像進(jìn)行編碼，產(chǎn)生增強(qiáng)層幀。
2.權(quán)利要求1的方法，其中的多個(gè)基層幀包括當(dāng)前的基層幀和至少一個(gè)相鄰基層幀。
3.權(quán)利要求1的方法，其中的每個(gè)剩余圖像都是通過(guò)從視頻數(shù)據(jù)中減去預(yù)測(cè)信號(hào)產(chǎn)生的，其中的預(yù)測(cè)信號(hào)是由多個(gè)基層幀形成的。
4.權(quán)利要求3的方法，其中的預(yù)測(cè)信號(hào)是利用以下步驟產(chǎn)生的對(duì)每個(gè)基層幀進(jìn)行運(yùn)動(dòng)估計(jì)；對(duì)每個(gè)基層幀進(jìn)行加權(quán)；和將多個(gè)基層幀加起來(lái)。
5.用于對(duì)包括一個(gè)基層和一個(gè)增強(qiáng)層的視頻信號(hào)進(jìn)行譯碼的一種方法，包括以下步驟對(duì)基層進(jìn)行譯碼以產(chǎn)生基層視頻幀；用精細(xì)顆?？缮炜s性技術(shù)對(duì)增強(qiáng)層進(jìn)行譯碼，產(chǎn)生增強(qiáng)層視頻幀；和將每個(gè)增強(qiáng)層視頻幀和多個(gè)基層視頻幀結(jié)合產(chǎn)生輸出視頻信號(hào)。
6.權(quán)利要求5的方法，其中的多個(gè)基層視頻幀包括當(dāng)前基層視頻幀和至少一個(gè)相鄰的基層視頻幀。
7.權(quán)利要求5的方法，其中的結(jié)合步驟是通過(guò)將每個(gè)增強(qiáng)層增加到預(yù)測(cè)信號(hào)中去形成的，其中的預(yù)測(cè)信號(hào)是由多個(gè)基層視頻幀形成的。
8.權(quán)利要求7的方法，其中的預(yù)測(cè)信號(hào)是按照以下步驟產(chǎn)生的對(duì)每個(gè)基層視頻幀進(jìn)行運(yùn)動(dòng)補(bǔ)償；對(duì)每個(gè)基層視頻幀進(jìn)行加權(quán)；和將多個(gè)基層視頻幀加起來(lái)。
9.對(duì)視頻數(shù)據(jù)進(jìn)行編碼的一種裝置，包括對(duì)一部分視頻數(shù)據(jù)進(jìn)行編碼產(chǎn)生基層幀的第一個(gè)編碼器；對(duì)于每個(gè)剩余幀利用多個(gè)基層幀從視頻數(shù)據(jù)和基層幀產(chǎn)生剩余圖像的增強(qiáng)預(yù)測(cè)和剩余計(jì)算功能塊；和用精細(xì)顆?？缮炜s性技術(shù)對(duì)剩余幀進(jìn)行編碼產(chǎn)生增強(qiáng)層幀的第二個(gè)編碼器。
10.對(duì)視頻信號(hào)進(jìn)行譯碼的一種裝置，包括一個(gè)基層和一個(gè)增強(qiáng)層，包括以下步驟對(duì)基層進(jìn)行譯碼產(chǎn)生基層視頻幀的第一個(gè)譯碼器；利用精細(xì)顆?？缮炜s技術(shù)對(duì)增強(qiáng)層進(jìn)行譯碼產(chǎn)生增強(qiáng)層視頻幀的第二個(gè)譯碼器；和將多個(gè)基層視頻幀和每個(gè)增強(qiáng)層視頻幀結(jié)合起來(lái)的一個(gè)增強(qiáng)預(yù)測(cè)和剩余結(jié)合功能塊。
11.包括代碼用來(lái)對(duì)視頻數(shù)據(jù)進(jìn)行編碼的一種存儲(chǔ)媒介，這些代碼包括對(duì)一部分視頻數(shù)據(jù)進(jìn)行編碼產(chǎn)生基層幀的代碼；對(duì)于每個(gè)剩余圖像利用多個(gè)基層幀從視頻數(shù)據(jù)和基層幀產(chǎn)生剩余圖像的代碼；和利用精細(xì)顆?？缮炜s性技術(shù)對(duì)剩余圖像進(jìn)行編碼產(chǎn)生增強(qiáng)層幀的代碼。
12.包括代碼對(duì)包括基層和增強(qiáng)層的視頻信號(hào)進(jìn)行譯碼的一種存儲(chǔ)媒介，這些代碼包括對(duì)基層進(jìn)行譯碼產(chǎn)生基層視頻幀的代碼；利用精細(xì)顆?？缮炜s性技術(shù)對(duì)增強(qiáng)層進(jìn)行譯碼產(chǎn)生增強(qiáng)層視頻幀的代碼；和將每一個(gè)增強(qiáng)層視頻幀與多個(gè)基層視頻幀結(jié)合產(chǎn)生輸出視頻的代碼。
全文摘要
本發(fā)明的目的是提供一種技術(shù)，用來(lái)靈活、有效地對(duì)視頻數(shù)據(jù)進(jìn)行編碼。這種技術(shù)要對(duì)叫做基層幀的一部分視頻數(shù)據(jù)進(jìn)行編碼，以及對(duì)視頻數(shù)據(jù)和預(yù)測(cè)信號(hào)產(chǎn)生的剩余圖像進(jìn)行編碼。每個(gè)視頻幀的預(yù)測(cè)是利用多個(gè)譯碼后的基層幀產(chǎn)生的，可以利用運(yùn)動(dòng)補(bǔ)償。這些剩余圖像叫做增強(qiáng)層幀，隨后被編碼。在這一技術(shù)的基礎(chǔ)之上，由于采用了周圍的一些基層幀，因此能夠獲得更好的預(yù)測(cè)。由于增強(qiáng)層幀中得到的剩余數(shù)據(jù)很少，因此能夠?qū)λ鼈冞M(jìn)行有效的編碼。對(duì)于增強(qiáng)層幀的編碼，可以采用精細(xì)顆?？缮炜s性技術(shù)(比如離散余弦變換編碼或者小波編碼)。譯碼過(guò)程是編碼過(guò)程的相反過(guò)程。因此，能夠靈活同時(shí)有效地對(duì)視頻數(shù)據(jù)進(jìn)行編碼和譯碼。
文檔編號(hào)G06T9/00GK1457605SQ02800425
公開(kāi)日2003年11月19日申請(qǐng)日期2002年2月14日優(yōu)先權(quán)日2001年2月26日
發(fā)明者A·普里, Y·陳, H·拉哈申請(qǐng)人:皇家菲利浦電子有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：A.普里;Y.陳;H.拉哈
技術(shù)所有人：皇家菲利浦電子有限公司
我是此專利的發(fā)明人

上一篇：通過(guò)模型集合體的對(duì)象分類的制作方法
上一篇：經(jīng)由多次測(cè)試的拷貝保護(hù)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>