專利名稱:空間可縮放的壓縮的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻編碼器/解碼器。
背景技術(shù):
由于數(shù)字視頻中固有的巨量數(shù)據(jù),全運(yùn)動(dòng)(full motion)、高清晰度數(shù)字視頻信號(hào)的傳送是高清晰度電視的開(kāi)發(fā)中的一個(gè)重大問(wèn)題。更具體來(lái)說(shuō)每個(gè)數(shù)字圖象幀都是由一個(gè)按照特定系統(tǒng)的顯示分辨率的像素陣列構(gòu)成的靜止圖象。結(jié)果,包含在高分辨率視頻序列中的原始數(shù)字信息的量是巨大的。為了減少必須發(fā)送的數(shù)據(jù)的量,就要采用壓縮方案來(lái)壓縮數(shù)據(jù)。已經(jīng)建立了各種視頻壓縮標(biāo)準(zhǔn)和過(guò)程,包括MPEG-2、MPEG-4、H.263和H26L。
許多應(yīng)用允許在一個(gè)流中可得到各種分辨率和/或質(zhì)量的視頻(video)。實(shí)現(xiàn)這一點(diǎn)的方法被籠統(tǒng)地稱作可伸縮性(scalability)技術(shù)。有三個(gè)可以在其上運(yùn)用可伸縮性的軸。第一個(gè)是時(shí)間軸上的可伸縮性,經(jīng)常被稱作時(shí)間可伸縮性。第二,有質(zhì)量軸(量化)上的可伸縮性,經(jīng)常被稱作信噪比(SNR)可伸縮性或精細(xì)粒度(fine-grain)可伸縮性。第三個(gè)軸是分辨率軸(圖象中的像素?cái)?shù)),經(jīng)常被稱作空間可伸縮性。在分層的編碼中,位流被劃分成兩個(gè)或更多的位流或?qū)?。各個(gè)層能被組合起來(lái)形成單一的高質(zhì)量信號(hào)。例如,基層(base layer)可提供較低質(zhì)量視頻信號(hào),而增強(qiáng)層(enhancement layer)則提供能增強(qiáng)基層圖象的附加信息。
特別地,空間可伸縮性可提供不同視頻標(biāo)準(zhǔn)或解碼器功能之間的兼容性。由于空間可伸縮性,基層視頻可以有比輸入視頻序列更低的分辨率,在這種情況下,增強(qiáng)層攜帶能把基層的分辨率恢復(fù)到輸入序列水平的信息。
圖1表示一個(gè)已知空間可縮放的視頻編碼器100。所示的編碼系統(tǒng)100完成層壓縮(layer compression),由此,通道(channel)的一部分被用于提供一個(gè)低分辨率層,其余部分被用于傳送增強(qiáng)信息,由此這兩個(gè)信號(hào)可以被重新組合起來(lái),把系統(tǒng)提升到高分辨率。高分辨率視頻輸入Hi-Res被分離器102分離,由此,數(shù)據(jù)被發(fā)送到低通濾波器104和減法電路106。低通濾波器104降低視頻數(shù)據(jù)的分辨率,視頻數(shù)據(jù)然后被輸送到基編碼器(base encoder)108。一般而言,低通濾波器和編碼器是所屬領(lǐng)域中周知的,因此為了簡(jiǎn)明起見(jiàn)不在這里作詳細(xì)說(shuō)明。編碼器108生成一個(gè)較低分辨率的基流,它能被廣播、接收并通過(guò)解碼器原封不動(dòng)地顯示,盡管該基流并不提供被認(rèn)為是高清晰度的分辨率。
編碼器108的輸出也被輸送到系統(tǒng)100內(nèi)的解碼器112。從這里,解碼的信號(hào)被輸送到內(nèi)插和上取樣電路114。一般而言,內(nèi)插和上取樣電路114根據(jù)解碼的視頻流重構(gòu)被過(guò)濾出的分辨率,并提供一個(gè)具有與高分辨率的輸入相同分辨率的視頻數(shù)據(jù)流。然而,由于因編碼和解碼而產(chǎn)生的過(guò)濾和損耗,在重構(gòu)的流中會(huì)出現(xiàn)信息的損失。通過(guò)在減法電路106中從原始未改變的高分辨率流中減去重構(gòu)的高分辨率流而確定該損失。減法電路106的輸出被輸送到增強(qiáng)編碼器116,后者輸出一個(gè)合理質(zhì)量增強(qiáng)流。
發(fā)明內(nèi)容
盡管能使已知的分層壓縮方案相當(dāng)好地工作,這些方案仍然有問(wèn)題,因?yàn)樵鰪?qiáng)層需要高的比特率。通常,增強(qiáng)層的比特率等于或高于基層的比特率。然而,對(duì)存儲(chǔ)或播送高清晰度視頻信號(hào)的需要,要求比特率比按普通壓縮標(biāo)準(zhǔn)能正常傳遞的比特率更低。這會(huì)對(duì)在現(xiàn)有標(biāo)準(zhǔn)清晰度系統(tǒng)上引入高清晰度造成困難,因?yàn)殇浿?播放時(shí)間變得太小或者所要求的帶寬變得太大。因此,需要一種更高效的、降低增強(qiáng)層的比特率的空間可縮放的壓縮方案。本發(fā)明通過(guò)在基編碼器和增強(qiáng)編碼器中采用不同的編碼標(biāo)準(zhǔn)而克服其它已知分層壓縮方案的至少部分缺陷。
按照本發(fā)明一個(gè)實(shí)施例,公開(kāi)一種用于對(duì)在多個(gè)幀中捕獲的視頻信息進(jìn)行空間可縮放的壓縮的裝置和方法。一個(gè)基層編碼器用一個(gè)第一編碼標(biāo)準(zhǔn)編碼一個(gè)位流。一個(gè)增強(qiáng)層編碼器用一個(gè)第二編碼標(biāo)準(zhǔn)編碼一個(gè)殘留信號(hào),其中該殘留信號(hào)是原始幀與基層中按比例擴(kuò)大的(upscaled)幀之差。向增強(qiáng)編碼器的輸入最好被改變成一個(gè)具有正常視頻輸入信號(hào)的信號(hào)水平范圍的信號(hào)。
這樣一個(gè)改變可通過(guò)增加一個(gè)DC偏置(offset)而進(jìn)行,最好使得增強(qiáng)編碼器輸入的像素值被偏移(shift)到一個(gè)預(yù)定輸入范圍的中間。
按照本發(fā)明另一個(gè)實(shí)施例,公開(kāi)一種提供對(duì)視頻流的空間可縮放的壓縮的方法和裝置。該視頻流被下取樣,以降低視頻流的分辨率。下取樣的視頻流用一個(gè)第一編碼標(biāo)準(zhǔn)編碼,以生成一個(gè)基流。該基流被解碼和上轉(zhuǎn)換(upconverted),以生成一個(gè)殘留流。該殘留流用一個(gè)第二編碼標(biāo)準(zhǔn)編碼,以生成一個(gè)增強(qiáng)流。
按照本發(fā)明另一個(gè)實(shí)施例,公開(kāi)一種用于對(duì)在一個(gè)基流和一個(gè)增強(qiáng)流中接收的壓縮視頻信息進(jìn)行解碼的方法和裝置?;饔靡粋€(gè)第一編碼標(biāo)準(zhǔn)解碼。被解碼的基流被上轉(zhuǎn)換,以增加被解碼基流的分辨率。增強(qiáng)流用一個(gè)第二編碼標(biāo)準(zhǔn)解碼。將上轉(zhuǎn)換的解碼的基流與解碼的增強(qiáng)流組合,以生成一個(gè)視頻輸出。
本發(fā)明的這些和其它方面將在后面對(duì)實(shí)施例的說(shuō)明中得到清楚的闡釋。
現(xiàn)在將參照以下附圖舉例說(shuō)明本發(fā)明圖1是一個(gè)代表已知的分層的視頻編碼器的框圖;圖2是一個(gè)按照本發(fā)明一個(gè)實(shí)施例的分層的視頻編碼器的框圖;圖3是一個(gè)按照本發(fā)明一個(gè)實(shí)施例的分層的視頻解碼器的框圖;以及圖4是一個(gè)按照本發(fā)明一個(gè)實(shí)施例的編碼器的一部分的框圖。
本發(fā)明的詳細(xì)說(shuō)明按照本發(fā)明一個(gè)實(shí)施例,在一個(gè)分層編碼器中通過(guò)對(duì)基層應(yīng)用一個(gè)第一編碼標(biāo)準(zhǔn)和對(duì)增強(qiáng)層應(yīng)用一個(gè)第二編碼標(biāo)準(zhǔn)實(shí)現(xiàn)而實(shí)現(xiàn)空間可縮放的壓縮。圖2表示一個(gè)可被用來(lái)實(shí)現(xiàn)本發(fā)明的分層編碼器200。所屬技術(shù)領(lǐng)域的熟練人員將會(huì)明白,其它分層編碼器也可以被用來(lái)實(shí)現(xiàn)本發(fā)明,因此本發(fā)明并不僅限于此。
所示的編碼系統(tǒng)200完成層壓縮,由此,通道的一部分被用于提供一個(gè)低分辨率基層,其余部分被用于傳送輪廓增強(qiáng)(edgeenhancement)信息,由此這兩個(gè)信號(hào)可以被重新組合起來(lái),以把系統(tǒng)提升到高分辨率。高分辨率視頻輸入Hi-RES被分離器202分離,由此,數(shù)據(jù)被發(fā)送到一個(gè)低通濾波器204和一個(gè)減法電路206。低通濾波器204降低視頻數(shù)據(jù)的分辨率,視頻數(shù)據(jù)然后被輸送到基編碼器208。一般而言,低通濾波器和編碼器是所屬領(lǐng)域中周知的,因此為了簡(jiǎn)明起見(jiàn)不在這里作詳細(xì)說(shuō)明。編碼器208用一個(gè)第一編碼標(biāo)準(zhǔn)生成一個(gè)較低分辨率的基流BS,它能被廣播、接收并通過(guò)解碼器原封不動(dòng)地顯示,盡管基流并不提供被視為高清晰度的分辨率。第一編碼標(biāo)準(zhǔn)可以是諸如MPEG-2、MPEG-4、H.263和H26L的任何視頻編碼方案,但是本發(fā)明并不僅限于此。
編碼器208的輸出也被輸送到系統(tǒng)200內(nèi)的一個(gè)解碼器212。從這里,解碼的信號(hào)被輸送到一個(gè)內(nèi)插和上取樣電路214。一般而言,內(nèi)插和上取樣電路114重構(gòu)解碼的視頻流中被過(guò)濾掉的分辨率,提供一個(gè)具有與高分辨率的輸入相同分辨率的視頻數(shù)據(jù)流。然而,由于因編碼和解碼而產(chǎn)生的過(guò)濾和損耗,在重構(gòu)的流中出現(xiàn)信息的損失。該損失在一個(gè)減法電路206中通過(guò)從原始未更改的高分辨率流減去重構(gòu)的高分辨率流以生成一個(gè)殘留信號(hào)而確定。減法電路206的輸出被輸送到一個(gè)增強(qiáng)編碼器216,增強(qiáng)編碼器216用一個(gè)與第一編碼標(biāo)準(zhǔn)不同的第二編碼標(biāo)準(zhǔn)來(lái)編碼該殘留信號(hào),并輸出一個(gè)合理的質(zhì)量增強(qiáng)流ES。第二編碼標(biāo)準(zhǔn)可以是諸如MPEG-1、MPEG-2、MPEG-4、H263、H26L、H264、專有視頻編碼方法等的任何視頻編碼方案,而本發(fā)明并不僅限于此。這個(gè)實(shí)施例提出提供一個(gè)與一個(gè)第一編碼標(biāo)準(zhǔn)兼容的基流和一個(gè)與一個(gè)第二編碼標(biāo)準(zhǔn)兼容的增強(qiáng)流,例如一個(gè)有利的新標(biāo)準(zhǔn)。在將MPEG編碼器用于基流、將H26L編碼器用于增強(qiáng)流的特定例子中,至少能獲得2倍的增強(qiáng)流比特率。
圖3表示一個(gè)用于對(duì)由分層編碼器200生成的編碼信號(hào)進(jìn)行解碼的解碼器300?;髟诮獯a器302中被用第一編碼標(biāo)準(zhǔn)解碼。解碼器302的輸出是一個(gè)SDTV輸出。增強(qiáng)流在解碼器304中用第二編碼標(biāo)準(zhǔn)解碼。在加法單元308中將該解碼器的輸出與已經(jīng)在上轉(zhuǎn)換單元306中被上轉(zhuǎn)換的解碼的基流組合。加法單元308的輸出是一個(gè)HDTV。
按照本發(fā)明另一個(gè)實(shí)施例,也可以在基編碼器和增強(qiáng)編碼器中使用不同的量化方案。圖4表示一個(gè)既能在基編碼器中又能在增強(qiáng)編碼器中使用的編碼器400的一部分。編碼器400除了其它部件外,還包含DCT電路402、量化器404和可變長(zhǎng)編碼器406。DCT電路402對(duì)輸入信號(hào)進(jìn)行DCT處理,以獲得一個(gè)被提供到量化器404的DCT系數(shù)。量化器404按照作為反饋而接收的一個(gè)緩沖器(未予示出)中的數(shù)據(jù)存儲(chǔ)量來(lái)設(shè)置一個(gè)量化階梯(quantization step)(量化標(biāo)度(quantization scale)),并用該量化階梯把來(lái)自DCT電路402的DCT系數(shù)量化。被量化的DCT系數(shù)與所設(shè)置的量化階梯一起被提供到VLC單元406。按照本發(fā)明的一個(gè)實(shí)施例,由基編碼器中的量化器使用一個(gè)第一量化方案,而由增強(qiáng)編碼器中的量化器使用一個(gè)與第一量化方案不同的第二量化方案。例如,將一個(gè)自適應(yīng)的(在幀的宏塊內(nèi)不一致性的)量化方案用于(采用MPEG-2編碼的)基編碼器,將一個(gè)(在一個(gè)幀的宏塊內(nèi)的)一致性的(uniform)量化方案用于(采用H26L編碼的)增強(qiáng)編碼器。
可以將本發(fā)明的上述實(shí)施例應(yīng)用到雙層DVDs,其中第一層是SD基層,而第一加第二層構(gòu)成HD序列。該方法也可被用來(lái)逐漸在歐洲和中國(guó)引進(jìn)HD廣播,其中用增強(qiáng)層來(lái)擴(kuò)展SD-DVB信號(hào)。該方法也可被應(yīng)用于在用于彈性存儲(chǔ)(elastic storage)的盤上存儲(chǔ)分層的程序。
要明白,本發(fā)明的不同實(shí)施例不受限于上述步驟的嚴(yán)格順序,因?yàn)橛行┎襟E的時(shí)機(jī)可以互換而不影響本發(fā)明的總體操作。此外,術(shù)語(yǔ)“包含”并不排斥其它元素或步驟,術(shù)語(yǔ)“一個(gè)”并不排除多個(gè)和單一的處理器或其它單元可以實(shí)現(xiàn)在權(quán)利要求書中所述的若干個(gè)單元或電路的功能。
權(quán)利要求
1.一種用于對(duì)在多個(gè)幀中捕獲的視頻信息進(jìn)行空間可縮放的壓縮的裝置,包含用第一編碼標(biāo)準(zhǔn)編碼一個(gè)位流的基層編碼器;用第二編碼標(biāo)準(zhǔn)編碼一個(gè)殘留信號(hào)的增強(qiáng)層編碼器,其中該殘留信號(hào)是原始幀與基層中按比例擴(kuò)大的幀之差。
2.按照權(quán)利要求1的用于進(jìn)行空間可縮放的壓縮的裝置,其中,第一和第二編碼標(biāo)準(zhǔn)是視頻壓縮標(biāo)準(zhǔn)。
3.按照權(quán)利要求1的用于進(jìn)行空間可縮放的壓縮的裝置,其中,第一和第二編碼標(biāo)準(zhǔn)是從包含MPEG-1、2MPEG-2、MPEG-4、H.263、H26L、H.264和視頻編碼方法的組中選擇的。
4.按照權(quán)利要求1的用于進(jìn)行空間可縮放的壓縮的裝置,其中,在基編碼器中使用第一量化方案,在增強(qiáng)編碼器中使用第二量化方案。
5.按照權(quán)利要求4的用于進(jìn)行空間可縮放的壓縮的裝置,其中,第一量化方案是自適應(yīng)量化。
6.按照權(quán)利要求5的用于進(jìn)行空間可縮放的壓縮的裝置,其中,第二量化方案是一致的量化。
7.一種用于編碼一個(gè)視頻流的分層編碼器,包含下取樣單元,用于降低視頻流的分辨率;基編碼器,用于用第一編碼標(biāo)準(zhǔn)編碼一個(gè)較低分辨率的基流;上轉(zhuǎn)換單元,用于解碼基流并增加基流的分辨率,以生成一個(gè)重構(gòu)的視頻流;減法單元,用于從原始視頻流中減去重構(gòu)的視頻流,以生成一個(gè)殘留信號(hào);增強(qiáng)編碼器,用于用第二編碼標(biāo)準(zhǔn)編碼來(lái)自減法單元的殘留信號(hào)并輸出一個(gè)增強(qiáng)流。
8.按照權(quán)利要求7的分層編碼器,其中,第一和第二編碼標(biāo)準(zhǔn)是視頻壓縮標(biāo)準(zhǔn)。
9.按照權(quán)利要求7的分層編碼器,其中,第一和第二編碼標(biāo)準(zhǔn)是從包含MPEG-1、2MPEG-2、MPEG-4、H.263、H26L、H.264和視頻編碼方法的組中選擇的。
10.按照權(quán)利要求7的分層編碼器,其中,在基編碼器中使用第一量化方案,在增強(qiáng)編碼器中使用第二量化方案。
11.按照權(quán)利要求10的分層編碼器,其中,第一量化方案是自適應(yīng)量化。
12.按照權(quán)利要求11的分層編碼器,其中,第二量化方案是一致的量化。
13.一種用于解碼被壓縮的視頻信息的解碼器,包含基流解碼器,用于用第一編碼標(biāo)準(zhǔn)解碼一個(gè)收到的基流;上轉(zhuǎn)換單元,用于增加解碼后的基流的分辨率;增強(qiáng)流解碼器,用于用第二編碼標(biāo)準(zhǔn)解碼一個(gè)收到的增強(qiáng)流;加法單元,用于組合該上轉(zhuǎn)換的解碼后的基流和該解碼后的增強(qiáng)流,以生成一個(gè)視頻輸出。
14.一種用于提供對(duì)視頻流的空間可縮放的壓縮的方法,包含以下步驟下取樣該視頻流,以降低該視頻流的分辨率;用第一編碼標(biāo)準(zhǔn)編碼該下取樣的視頻流,以生成一個(gè)基流;解碼和上轉(zhuǎn)換該基流,以生成一個(gè)重構(gòu)的視頻流;從該視頻流中減去該重構(gòu)的視頻流,以生成一個(gè)殘留信號(hào);和用第二編碼標(biāo)準(zhǔn)編碼該殘留信號(hào)并輸出一個(gè)增強(qiáng)流。
15.一種用于對(duì)在一個(gè)基流和一個(gè)增強(qiáng)流中接收的壓縮后的視頻信息進(jìn)行解碼的方法,包含用第一編碼標(biāo)準(zhǔn)解碼該基流;上轉(zhuǎn)換該解碼的基流,以增加該解碼的基流的分辨率;用第二編碼標(biāo)準(zhǔn)解碼該增強(qiáng)流;和組合該經(jīng)上轉(zhuǎn)換的解碼后的基流與該解碼后的增強(qiáng)流,以生成一個(gè)視頻輸出。
全文摘要
公開(kāi)一種用于對(duì)在多個(gè)幀中捕獲的視頻信息進(jìn)行空間可縮放的壓縮的裝置和方法。一個(gè)基層編碼器用一個(gè)第一編碼標(biāo)準(zhǔn)編碼一個(gè)位流。一個(gè)增強(qiáng)層編碼器用一個(gè)第二編碼標(biāo)準(zhǔn)編碼一個(gè)殘留信號(hào),其中該殘留信號(hào)是原始幀與基層中按比例擴(kuò)大的幀之差。
文檔編號(hào)H04N7/50GK1575606SQ02821065
公開(kāi)日2005年2月2日 申請(qǐng)日期2002年10月21日 優(yōu)先權(quán)日2001年10月26日
發(fā)明者W·H·A·布魯斯 申請(qǐng)人:皇家飛利浦電子股份有限公司