專利名稱:用于在視頻壓縮中進(jìn)行有效系數(shù)編碼的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的系統(tǒng)及方法一般來說涉及視頻處理。更具體來說,本發(fā)明的系統(tǒng)及方法 涉及對(duì)與視頻壓縮技術(shù)有關(guān)的信息進(jìn)行編碼及解碼。
背景技術(shù):
視頻壓縮是指數(shù)字視頻數(shù)據(jù)的壓縮。視頻壓縮用于有效地對(duì)視頻文件格式及串流 和廣播視頻格式的視頻數(shù)據(jù)進(jìn)行編碼。壓縮是將數(shù)據(jù)轉(zhuǎn)換成具有較少位的格式,此種 格式可更有效地存儲(chǔ)或傳輸。壓縮的逆過程是解壓縮,解壓縮產(chǎn)生原始數(shù)據(jù)的副本(或 精確近似)。
當(dāng)今,某些視頻壓縮方法應(yīng)用某一類型的離散變換(例如,離散余弦變換(DCT)) 來減少預(yù)測(cè)殘余中由使用時(shí)間或空間預(yù)測(cè)技術(shù)產(chǎn)生的剩余空間冗余。某些視頻壓縮技 術(shù)還涉及量化。量化可以是標(biāo)量量化或向量量化。在量化后,可對(duì)量化系數(shù)進(jìn)行熵編 碼并將其放置在經(jīng)壓縮視頻位流內(nèi)。然后,將所述經(jīng)壓縮位流發(fā)送到解碼器,所述解
碼器將解壓縮所述位流并精確近似地恢復(fù)所述原始視頻數(shù)據(jù)。
視頻壓縮技術(shù)可有益于各種媒體形式的消費(fèi)者。舉例來說,在廣播工程中,可通 過視頻壓縮來使數(shù)字電視變得實(shí)際可行。電視(TV)臺(tái)可在同一物理信道上廣播高清 晰度電視(HDTV)及多個(gè)虛擬信道。數(shù)字視頻廣播可使用動(dòng)態(tài)圖像專家組(MPEG) 標(biāo)準(zhǔn)(例如,MPEG-2標(biāo)準(zhǔn)視頻壓縮格式)。然而,H.264/MPEG-4及VC-1作為新的 視頻壓縮標(biāo)準(zhǔn)正開始出現(xiàn)。
遺憾地,己知的在視頻壓縮中用于對(duì)信息進(jìn)行編碼的系統(tǒng)及方法可能會(huì)受到各種 缺點(diǎn)的困擾。因此,通過在視頻壓縮中對(duì)信息進(jìn)行編碼的改進(jìn)型系統(tǒng)及方法可實(shí)現(xiàn)諸 多裨益
發(fā)明內(nèi)容
圖1是圖解說明可縮放視頻編碼位流的一種配置的框圖2是圖解說明跨越網(wǎng)絡(luò)從編碼器發(fā)送至解碼器的一基礎(chǔ)層及多個(gè)增強(qiáng)層的一種 配置的框圖3是圖解說明用于對(duì)信息進(jìn)行編碼的方法的一種配置的流程圖; 圖4是圖解說明用以對(duì)經(jīng)編碼視頻序列進(jìn)行解碼的方法的一種配置的流程圖; 圖5圖解說明被劃分成多個(gè)宏塊的圖像幀的一種配置; 圖6圖解說明對(duì)有效及精細(xì)系數(shù)進(jìn)行分類的一種配置; 圖7圖解說明代碼字及代碼長(zhǎng)度表格的一種配置 圖8圖解說明用于代碼簿0(—元代碼)的編碼及解碼的偽代碼; 圖9圖解說明用于代碼簿1的編碼及解碼的偽代碼; 圖10圖解說明用于代碼簿2的編碼及解碼的偽代碼;
圖11圖解說明用于對(duì)代碼簿選擇表格條目進(jìn)行編碼的可變長(zhǎng)度編碼(VLC)表 格的一種配置;
圖12是矩形代碼簿選擇表格的一種配置; 圖13是三角形代碼簿選擇表格的一種配置;
圖14圖解說明用于對(duì)經(jīng)修剪的代碼簿選擇表格進(jìn)行編碼的偽代碼;及
圖15是圖解說明通常用于處理數(shù)字圖像及/或數(shù)字視頻的主要硬件組件的框圖。
具體實(shí)施例方式
本發(fā)明揭示一種用于對(duì)視頻序列中的有效系數(shù)進(jìn)行編碼的方法。接收視頻序列。 用所述視頻序列構(gòu)建對(duì)當(dāng)前幀中原始視頻信號(hào)的預(yù)測(cè)。通過從所述當(dāng)前幀中的原始視 頻信號(hào)中減去對(duì)所述原始視頻信號(hào)的預(yù)測(cè)來形成殘余信號(hào)。對(duì)所述殘余信號(hào)應(yīng)用變換。 量化多個(gè)變換系數(shù)。從多個(gè)代碼簿選擇一代碼簿以對(duì)有效游程及塊結(jié)束中的至少一者 進(jìn)行編碼。使用選定代碼簿對(duì)有效游程及塊結(jié)束中的至少一者進(jìn)行編碼。
本發(fā)明還揭示一種電子裝置。所述電子裝置包括處理器及與所述處理器電子連通 的存儲(chǔ)器。指令存儲(chǔ)于所述存儲(chǔ)器中。接收視頻序列。用所述視頻序列構(gòu)建對(duì)當(dāng)前幀 中原始視頻信號(hào)的預(yù)測(cè)。通過從所述當(dāng)前幀中的原始視頻信號(hào)中減去對(duì)所述原始視頻 信號(hào)的預(yù)測(cè)來形成殘余信號(hào)。對(duì)所述殘余信號(hào)應(yīng)用變換。量化多個(gè)變換系數(shù)。從多個(gè) 代碼簿選擇一代碼簿以對(duì)有效游程及塊結(jié)束中的至少一者進(jìn)行編碼。使用選定代碼簿 對(duì)有效游程及塊結(jié)束中的至少一者進(jìn)行編碼。
本發(fā)明闡述一種用于對(duì)經(jīng)編碼視頻序列中的有效系數(shù)進(jìn)行解碼的方法。接收經(jīng)編 碼視頻位流。從所述位流中檢索代碼簿表格信息。使用所述檢索的代碼簿表格信息對(duì) 有效符號(hào)進(jìn)行解碼。使用所述有效符號(hào)對(duì)有效系數(shù)進(jìn)行解碼。解量化多個(gè)變換系數(shù)。 對(duì)殘余信號(hào)應(yīng)用逆變換。構(gòu)建視頻序列。
6可使用選定代碼簿對(duì)塊結(jié)束進(jìn)行編碼。可在視頻切片中對(duì)代碼簿表格信息進(jìn)行編 碼。所述代碼簿表格信息可包括代碼簿選擇表格。所述代碼簿選擇表格可包括對(duì)應(yīng)于 每對(duì)編碼循環(huán)數(shù)及LEBL (基礎(chǔ)層中最后編碼的系數(shù))位置的每一條目。在一種配置
中,所述代碼簿選擇表格包括僅對(duì)應(yīng)于編碼循環(huán)數(shù)的每一條目??蓪⑺龃a簿選擇 表格編碼為一維代碼簿選擇符陣列。使用可變長(zhǎng)度代碼對(duì)所述代碼簿選擇符進(jìn)行編碼。
所述代碼簿表格信息可包括表格形狀及表格尺寸。在一個(gè)方面中,所述表格形狀 為矩形。在另一方面中,所述表格形狀為三角形。
可根據(jù)統(tǒng)計(jì)學(xué)估計(jì)動(dòng)態(tài)地確定所述代碼簿選擇表格。在一種配置中,可根據(jù)鄰近 相關(guān)性動(dòng)態(tài)地確定所述代碼簿選擇表格。所述代碼簿可為另一代碼簿的變換版本。
可修剪代碼簿選擇表格以提供經(jīng)修剪的代碼簿選擇表格??捎靡曨l切片對(duì)所述經(jīng) 修剪的代碼簿選擇表格進(jìn)行編碼。
本發(fā)明還揭示一種電子裝置。所述電子裝置包括處理器及與所述處理器電子連通 的存儲(chǔ)器。指令存儲(chǔ)于所述存儲(chǔ)器中。接收經(jīng)編碼視頻位流。從所述位流中檢索代碼 簿表格信息。使用所述檢索的代碼簿表格信息對(duì)有效符號(hào)進(jìn)行解碼。使用所述有效符 號(hào)對(duì)有效系數(shù)進(jìn)行解碼。解量化多個(gè)變換系數(shù)。對(duì)殘余信號(hào)應(yīng)用逆變換。構(gòu)建視頻序 列。
在一種配置中,可從切片中解碼所述代碼簿表格信息。所述代碼簿表格信息可包
括代碼簿選擇表格。所述代碼簿表格信息可包括代碼簿選擇表格映射循環(huán)數(shù)及LEBL (基礎(chǔ)層中最后編碼的系數(shù))位置。所述代碼簿表格信息可包括代碼簿選擇表格映射 循環(huán)數(shù)。
所述代碼簿表格信息可包括表格形狀及表格尺寸。在一種配置中,所述表格形狀 可為矩形。在另一種配置中,所述表格形狀為三角形。
可根據(jù)統(tǒng)計(jì)學(xué)估計(jì)動(dòng)態(tài)地確定所述代碼簿選擇表格。在一種配置中,可根據(jù)鄰近 相關(guān)性動(dòng)態(tài)地確定所述代碼簿選擇表格。
本發(fā)明還揭示一種經(jīng)配置以對(duì)視頻序列中的有效系數(shù)進(jìn)行編碼的電子裝置。所述 電子裝置包括處理裝置及用于接收視頻序列的裝置。本發(fā)明揭示用于用所述視頻序列 構(gòu)建對(duì)當(dāng)前幀中原始視頻序列的預(yù)測(cè)的裝置及用于通過從當(dāng)前幀中的原始視頻信號(hào)中 減去對(duì)原始視頻信號(hào)的預(yù)測(cè)來形成殘余幀的裝置。本發(fā)明揭示用于對(duì)所述殘余信號(hào)應(yīng) 用變換的裝置及用于量化多個(gè)變換系數(shù)的裝置。本發(fā)明揭示用于從多個(gè)代碼簿選擇一 代碼簿以對(duì)有效游程及塊結(jié)束的至少一者進(jìn)行編碼的裝置及用于使用選定代碼簿對(duì)有 效游程及塊結(jié)束的至少一者進(jìn)行編碼的裝置。
現(xiàn)在參照?qǐng)D式闡述本發(fā)明系統(tǒng)及方法的各種配置,其中相同參考編號(hào)指示相同或 功能類似的元件??梢愿鞣N不同的配置布置及設(shè)計(jì)本文中一般性闡述及圖解說明的本 發(fā)明系統(tǒng)及方法的特征。因此,下文的詳細(xì)傳輸并非旨在限制所主張的本發(fā)明系統(tǒng)及 方法的范圍,相反其僅代表本發(fā)明系統(tǒng)及方法的配置。
本文中所揭示配置的諸多特征可實(shí)施為計(jì)算機(jī)軟件、電子硬件或兩者的組合。為清楚地圖解說明硬件與軟件的此可互換性, 一般將在其功能性方面對(duì)各種組件進(jìn)行闡 述。此功能性實(shí)施為硬件還是軟件取決于特定應(yīng)用及施加于整體系統(tǒng)上的設(shè)計(jì)約束。 所屬領(lǐng)域的技術(shù)人員可針對(duì)每一特定應(yīng)用采用不同方式來實(shí)施所述功能性,但不應(yīng)將 所述實(shí)施決策視為導(dǎo)致背離本發(fā)明系統(tǒng)及方法的范圍。
在所述功能性實(shí)施為計(jì)算機(jī)軟件的情況下,所述軟件可包括位于存儲(chǔ)器裝置內(nèi)及 /或作為電子信號(hào)在系統(tǒng)總線或網(wǎng)絡(luò)上傳輸?shù)娜我活愋偷挠?jì)算機(jī)指令或計(jì)算機(jī)/機(jī)器可 執(zhí)行代碼。實(shí)施與本文中所述組件相關(guān)連的功能性的軟件可包括單個(gè)指令或諸多指令, 且可分布在數(shù)個(gè)不同的代碼段上,可分布在不同程序之間,且可分布在數(shù)個(gè)存儲(chǔ)器裝 置上。
如本文中所使用,"配置"、"所述配置"、"一個(gè)或多個(gè)配置"、"某些配置"、 "特定配置"、"一種配置"、"另一種配置"及類似術(shù)語意指"所揭示系統(tǒng)及方法 的一個(gè)或多個(gè)(但未必全部)配置",除非另外明確地規(guī)定。
術(shù)語"確定"(及其語法變型)的使用具有極其廣泛的意義。術(shù)語"確定"包括各 種各樣的動(dòng)作且因此"確定"可包括計(jì)算、運(yùn)算、處理、推導(dǎo)、研究、查詢(例如,在 表格、數(shù)據(jù)庫或另一數(shù)據(jù)結(jié)構(gòu)中査詢)、斷定及類似動(dòng)作。同樣,"確定"還可包括接 收(例如,接收信息)、存取(例如,存取存儲(chǔ)器中的數(shù)據(jù))及類似動(dòng)作。同樣,"確定" 還可包括解決、選擇、選定、建立及類似動(dòng)作。
短語"基于"并不意味著"僅基于",除非另外明確予以規(guī)定。換句話說,短語 "基于"既闡述"僅基于"又闡述"至少基于"。
當(dāng)前視頻壓縮系統(tǒng)中所執(zhí)行的某些步驟已為人們所知曉。在某些視頻壓縮步驟 (預(yù)測(cè)、變換及量化)之后,下一步驟是對(duì)語法元素及經(jīng)量化系數(shù)執(zhí)行熵編碼以形成 位流。在視頻解碼器中,執(zhí)行逆過程。從所述位流中解碼語法元素及量化系數(shù)。然后, 執(zhí)行逆量化及逆變換步驟。最后,將重構(gòu)殘余添加至預(yù)測(cè)以重構(gòu)視頻信號(hào)。
目前,由來自ISO/IEC MPEG及ITU-T VCEG的視頻編碼專家組成的聯(lián)合視頻組 (JVT)正致力于對(duì)H.264/高級(jí)視頻編碼(AVC)的可縮放視頻編碼(SVC)擴(kuò)展。 稱為聯(lián)合可縮放視頻模型(JSVM)的共用軟件正由參與人員使用。JSVM可支持各種 可縮放性特征。SVC位流可具有細(xì)粒度可縮放性、空間可縮放性、時(shí)間可縮放性或所 述三者的任一組合。
細(xì)粒度可縮放性(下文稱為FGS)是用于視頻編碼的一種重要且非常期望的特征。 此特征允許幾乎任意地對(duì)所述經(jīng)壓縮視頻位流進(jìn)行截?cái)?,而同時(shí)為最終用戶提供經(jīng)解 碼視頻質(zhì)量的適度降格。在細(xì)粒度可縮放性中,可任意地截?cái)嘣鰪?qiáng)層位流。隨著所述 視頻解碼器接收并對(duì)所述層中更多的位進(jìn)行解碼,其將產(chǎn)生更好的視頻質(zhì)量。此外, JSVM中的FGS是以將視頻質(zhì)量改良均勻散布于整個(gè)視頻幀上的方式進(jìn)行設(shè)計(jì)的,此 與視頻質(zhì)量改良僅集中在幀的某一空間區(qū)域內(nèi)相反,因?yàn)楹笠磺樾螌⑹棺罱K觀看者在 視覺上反感。
FGS使用位平面編碼來實(shí)現(xiàn)視頻質(zhì)量的適度改良。如果使用量化參數(shù)QP來量化基礎(chǔ)或先前層視頻幀,則然后可使用通常大約QP-6的量化參數(shù)來量化當(dāng)前的增強(qiáng)層 視頻,此可有效地將量化步驟大小減小一半。作為減小量化步驟大小的結(jié)果,更多的 變換系數(shù)將在增強(qiáng)層中變?yōu)榉橇???蓪⑺鲈鰪?qiáng)層中的非零系數(shù)分類為三個(gè)類型非 有效系數(shù)、有效系數(shù)及精細(xì)系數(shù)。非有效系數(shù)是指在基礎(chǔ)或先前層中為零且在當(dāng)前增 強(qiáng)層中保持為零的系數(shù)。有效系數(shù)是指在基礎(chǔ)或先前層中為零但在當(dāng)前增強(qiáng)層中變?yōu)?非零系數(shù)的系數(shù)。精細(xì)系數(shù)是指在基礎(chǔ)或先前層中已經(jīng)為非零(即,有效)的系數(shù)。 所述系數(shù)的值將在當(dāng)前增強(qiáng)層中得到精細(xì)化。
因?yàn)榫?xì)系數(shù)具有與其它系數(shù)不同的統(tǒng)計(jì)數(shù)據(jù),故在FGS層中對(duì)其單獨(dú)進(jìn)行編 碼。類似于H.264/AVC, SVC中可存在兩種熵編碼模式基于上下文的自適應(yīng)二進(jìn)制 算術(shù)編碼(CABAC)模式及基于上下文的自適應(yīng)可變長(zhǎng)度編碼(CAVLC)模式。下 文提供關(guān)于可產(chǎn)生更高編碼性能的改良型有效系數(shù)編碼系統(tǒng)的細(xì)節(jié)。
圖1是圖解說明通常稱為細(xì)粒度可縮放性(FGS)的可縮放視頻編碼位流結(jié)構(gòu)的 一種配置100的框圖。在FGS中,將視頻序列壓縮成具有至少兩個(gè)層(基礎(chǔ)層106及 增強(qiáng)層104)的單個(gè)視頻流。如所圖解說明,.FGS可進(jìn)一步包括N-1個(gè)增強(qiáng)層102。
在一種配置中,基礎(chǔ)層106為所述視頻序列的非可縮放編碼且通常具有視頻序列 的最低質(zhì)量。增強(qiáng)層104及N-l個(gè)增強(qiáng)層102具有高于基礎(chǔ)層106的質(zhì)量等級(jí)的不同 質(zhì)量等級(jí)。對(duì)在基礎(chǔ)層106之后編碼的每一額外增強(qiáng)層進(jìn)行解碼可使視頻序列的質(zhì)量 提高。另外,F(xiàn)GS位流具有一個(gè)明顯優(yōu)點(diǎn)在編碼期間或之后,可實(shí)時(shí)地截?cái)鄬儆谠?強(qiáng)層104及N-1增強(qiáng)層102的位(從而減小位速率及因此提高經(jīng)解碼圖像質(zhì)量)。此 提供對(duì)傳輸位速率的靈活控制且允許調(diào)整增強(qiáng)層104及N-1個(gè)增強(qiáng)層102以匹配可用 傳輸位速率。
圖2為網(wǎng)絡(luò)框圖200,其圖解說明跨越網(wǎng)絡(luò)210從編碼器208發(fā)送至解碼器212 的基礎(chǔ)層202及N個(gè)增強(qiáng)層204。解碼器212可解碼及使用基礎(chǔ)層202及一個(gè)或多個(gè) 增強(qiáng)層204的全部或部分。解碼器212構(gòu)建對(duì)原始視頻序列206的最佳近似214。在 一種配置中,將最佳近似214顯示在顯示器216 (例如,計(jì)算機(jī)監(jiān)視器、電視、個(gè)人 數(shù)字助理(PDA)、投影儀等)上。將視頻序列206編碼為一基礎(chǔ)層202及一個(gè)或多 個(gè)增強(qiáng)層204。較低質(zhì)量基礎(chǔ)層202代表最低質(zhì)量標(biāo)準(zhǔn),而增強(qiáng)層204的每一者是對(duì) 基礎(chǔ)層202圖像質(zhì)量的改良。
在一種配置中,使用如圖1中所解釋的FGS視頻編碼格式對(duì)視頻序列206進(jìn)行編 碼。所述FGS編碼格式對(duì)于其中可能事先不知曉可用傳輸帶寬的視頻流式及廣播應(yīng)用 尤其有用。在編碼期間或之后,可任意截?cái)嘣鰪?qiáng)層204以匹配可用傳輸位速率。隨著 所述可用位速率的改變,可相應(yīng)地實(shí)時(shí)截?cái)嘣鰪?qiáng)層204以相對(duì)于當(dāng)前帶寬提供最佳質(zhì) 量的經(jīng)解碼視頻序列。舉例來說,網(wǎng)絡(luò)200可截?cái)嘣鰪?qiáng)層204且然后以不同的位速率 將位流發(fā)送至不同的目的地。
圖3是圖解說明用于對(duì)信息進(jìn)行編碼的方法300的流程圖。在一種配置中,待編 碼的信息包括視頻序列??稍谝曨l編碼器中實(shí)施方法300,且可由視頻解碼器來執(zhí)行
9方法300的逆過程。編碼器是用于將信號(hào)或數(shù)據(jù)變成代碼的裝置。然后,解碼器可從 所述代碼中產(chǎn)生原始信號(hào)或?qū)λ鲈夹盘?hào)的近似。所述編碼器及解碼器可統(tǒng)稱為視 頻編碼解碼器,其將源圖像或視頻序列編碼成壓縮形式并對(duì)所述壓縮形式進(jìn)行解碼以
產(chǎn)生所述源序列的拷貝或近似。
方法300開始(302)于所述編碼器接收(304)視頻序列。在一種配置中,所述 視頻序列是未經(jīng)壓縮視頻信號(hào)。所述編碼器通過利用鄰近視頻幀之間的相似性開始?jí)?縮所述視頻序列并構(gòu)建(306)對(duì)當(dāng)前/原始視頻信號(hào)的預(yù)測(cè)。從一個(gè)或多個(gè)先前或未 來幀中形成所述預(yù)測(cè)并通過補(bǔ)償所述幀之間的差別來改良所述預(yù)測(cè)。然后,從實(shí)際的 當(dāng)前/原始幀中減去所述預(yù)測(cè)幀來形成(308)殘余信號(hào)。所述編碼器利用所述預(yù)測(cè)殘 余的鄰近樣本之間的相似性來減少空間冗余。
方法300繼續(xù)進(jìn)行對(duì)所述殘余信號(hào)應(yīng)用(310)變換以減少剩余空間冗余。所述變 換將所述預(yù)測(cè)殘余信號(hào)轉(zhuǎn)換至另一域內(nèi),其中所述預(yù)測(cè)殘余樣本由變換系數(shù)來表示。 量化(312)所述系數(shù)以移除非有效值,從而留下少量提供所述殘余樣本的更緊縮的表示 的有效系數(shù)。在一種配置中,使用方法300進(jìn)行編碼的預(yù)測(cè)殘余可在增強(qiáng)層中。如果 曾使用量化參數(shù)QP量化(312)視頻幀的先前層或所述視頻幀的基礎(chǔ)層,則可使用通 常大約QP-6的量化參數(shù)來量化當(dāng)前增強(qiáng)層,其中QP示在所述基礎(chǔ)層中使用的量化參 數(shù)。此有效地將所述量化步驟減小一半。作為減小量化步驟大小的結(jié)果,更多數(shù)量的 變換系數(shù)將在當(dāng)前幀中變?yōu)榉橇恪?br>
在一種配置中,可將所述增強(qiáng)層中的非零經(jīng)量化系數(shù)分類為非有效、有效、及 精細(xì)系數(shù)
如將于本文中所論述,選擇一 VLC (可變長(zhǎng)度編碼)代碼簿以對(duì)有效游程及EOB (塊結(jié)束)中的至少一者進(jìn)行編碼。因此,在可對(duì)有效游程及EOB進(jìn)行編碼之前,選 擇(314)代碼簿。在一種配置中,如下文中將論述,使用代碼簿選擇表格選擇(314) 所述代碼簿。在一種配置中,可將代碼簿表格信息編碼(316)成視頻切片的一部分。 在另一種配置中,可將代碼簿表格信息存儲(chǔ)于所述編碼器及解碼器處作為內(nèi)部狀態(tài)。 所述代碼簿表格信息可包括代碼簿選擇表格及表格的尺寸及形狀。然后,使用選定代 碼簿對(duì)有效游程及EOB進(jìn)行編碼(318)。
圖4是圖解說明用以對(duì)經(jīng)編碼視頻序列進(jìn)行解碼的方法400的一種配置的流程 圖。解碼方法400可為圖3的編碼方法300的逆過程。解碼方法400開始(402)于解 碼器接收(404)所述經(jīng)編碼視頻序列。所述經(jīng)編碼視頻序列還可稱為位流。解碼器對(duì) 代碼簿表格信息進(jìn)行解碼(406)。在一種配置中,所述代碼簿表格信息可包括是所述 切片的一部分的代碼簿選擇表格。所述解碼器使用選定代碼簿對(duì)所述有效符號(hào)進(jìn)行解 碼(407)。
方法400繼續(xù)且所述解碼器使用最近解碼的有效符號(hào)對(duì)所述有效系數(shù)進(jìn)行解碼 (408)。然后,所述解碼器繼續(xù)解量化410所述經(jīng)解碼的有效系數(shù)。方法400繼續(xù) 對(duì)所述解量化的系數(shù)應(yīng)用(412)逆變換。在一種配置中,所述逆變換可包括逆離散余弦變換。在所述解碼器對(duì)所述系數(shù)應(yīng)用(412)逆變換之后,所述解碼器按照所述原始視 頻序列在圖3的編碼方法300之前曾存在的狀況構(gòu)建(414)所述原始視頻序列的近似。 圖5圖解說明被劃分成多個(gè)宏塊的一視頻幀500的一種配置。宏塊是解碼過程中 基本的數(shù)據(jù)單元。如所圖解說明,可將視頻幀500分割成多個(gè)固定大小的宏塊,所述 宏塊各自包括視頻幀500的一樣本。在一種配置中,每一宏塊均包括一由16xl6像素 構(gòu)成的樣本。在另一方面中,每一宏塊均包括一亮度(luma)組分及兩個(gè)色度(charoma) 組分。所述亮度組分有關(guān)特定樣本的亮度,而所述色度組分有關(guān)所述樣本的色彩特性。 在一種配置中,進(jìn)一步將視頻幀500分割成多個(gè)切片,切片A502、切片B504、及切 片C506。切片是宏塊序列,所述宏塊按照某一編碼次序連續(xù)地進(jìn)行處理。舉例來說, 可在切片B 504及切片C 506之前對(duì)切片A 502及包含于切片A 502內(nèi)的宏塊進(jìn)行編 碼并將其發(fā)送至解碼器。作為一額外特征,對(duì)不同切片502、 504及506進(jìn)行編碼并將 其發(fā)送至解碼器的次序可以是任意的。舉例來說,可在其它切片之前對(duì)切片B 504進(jìn) 行編碼并將其發(fā)送至解碼器。類似地,可在其它兩個(gè)切片之前對(duì)切片C 506進(jìn)行編碼 并將其發(fā)送至解碼器。第N個(gè)增強(qiáng)層內(nèi)的每一宏塊均對(duì)應(yīng)于N-1個(gè)增強(qiáng)層及基礎(chǔ)層的 每一者內(nèi)的一宏塊。
圖6圖解說明如何對(duì)系數(shù)進(jìn)行分類的實(shí)例。提供基礎(chǔ)層系數(shù)塊602及增強(qiáng)層系數(shù) 塊604?;A(chǔ)層602及增強(qiáng)層604中的空白表示零系數(shù)。這些系數(shù)被稱為非有效系數(shù)。 剩余的空間606、 608、 608a及608b各自表示一可具有非零值的系數(shù)。在一種配置中, 所述基礎(chǔ)層系數(shù)塊602是在使用FGS視頻編碼格式的先前增強(qiáng)層中。如先前所解釋, 在圖3的編碼方法300期間,量化變換系數(shù)。在量化之后,將在基礎(chǔ)層系數(shù)塊602中 具有等于零的對(duì)應(yīng)系數(shù)的增強(qiáng)層系數(shù)塊604中的非零系數(shù)稱為有效系數(shù)606。在基礎(chǔ) 層中其對(duì)應(yīng)系數(shù)為非零的系數(shù)稱為精細(xì)系數(shù)608。由于有效系數(shù)606及精細(xì)系數(shù)608 具有不同的統(tǒng)計(jì)數(shù)據(jù),故在增強(qiáng)層604中遵循FGS編碼格式分開對(duì)其進(jìn)行編碼。
在一種配置中,有效系數(shù)606c、 606d是基礎(chǔ)或先前層中其對(duì)應(yīng)系數(shù)606a及606b (所述系數(shù)代表同一子頻帶)為零的系數(shù)。精細(xì)系數(shù)608是基礎(chǔ)層或先前層中其對(duì)應(yīng) 系數(shù)608a及608b為非零的系數(shù)。
在SVC FGS層中,將所述有效系數(shù)編碼為游程值。所述編碼器以Z字形掃描次 序遍歷增強(qiáng)層系數(shù)塊604直至其找到有效系數(shù)。然后,所述編碼器對(duì)所述游程值進(jìn)行 編碼。在掃描過程期間,所遇到的精細(xì)系數(shù)對(duì)有效游程沒有任何幫助。舉例來說,圖 6中的第一有效系數(shù)606c是以游程-1而非游程=3進(jìn)行編碼的,而不計(jì)入兩個(gè)精細(xì)系 數(shù)608。在SVCJD5中的CAVLC模式中,使用啟動(dòng)-步級(jí)-結(jié)束碼或S3碼對(duì)所述有效 游程進(jìn)行編碼。參見托馬斯威甘德、加里沙利文、朱利恩雷切爾、??耸┩叽?和馬賽厄斯威恩所著"聯(lián)合草稿5:可縮放視頻編碼(JointDraft5: Scalable Video Coding) " ,JVT-R 201, 2006年1月,曼谷,泰國(guó)。然后,將此系數(shù)的符號(hào)編碼成1-位 旗標(biāo),其中0指示正值而1指示負(fù)值。然后,編碼器繼續(xù)進(jìn)行至下一塊直至已覆蓋切 片中的所有塊。此結(jié)束第一有效編碼循環(huán)。當(dāng)下一個(gè)有效編碼循環(huán)開始時(shí),所述編碼器回到第一塊并掃描所述塊中的下一個(gè) 有效系數(shù)。在圖6中的實(shí)例中,將針對(duì)第二有效系數(shù)606(1發(fā)送游程=3。然后,發(fā)送位 0以指示此為正值。然后,所述編碼器繼續(xù)進(jìn)行至下一塊直至第二循環(huán)中的所有塊均 被發(fā)送。
在第三循環(huán)中,針對(duì)圖6中所示的塊發(fā)送EOB (塊結(jié)束)符號(hào)以指示所述先前經(jīng) 編碼的有效系數(shù)是所述塊中的最后一個(gè);在隨后的編碼循環(huán)中,將不針對(duì)所述塊發(fā)送 進(jìn)一步的信息。在CAVLC模式中,將EOB符號(hào)與所有其它游程值組合在一起以形 成符號(hào)集。將所述符號(hào)集中的EOB的索引指配為"IE0B"。游程值"R"的索引為"IR"。 可從"R"及"IE0B"推導(dǎo)出"IR",因?yàn)槿绻鸕〈lK)B,則lR-R,否則I「R+1。可 使用S3模式對(duì)所述符號(hào)集中每一符號(hào)的索引進(jìn)行編碼。對(duì)較小索引進(jìn)行編碼所占用的 位數(shù)目小于或等于對(duì)較大索引進(jìn)行編碼所占用的位數(shù)目。因?yàn)镋OB符號(hào)的概率與編碼 循環(huán)數(shù)具有某一相關(guān)性(EOB在稍后的循環(huán)中變得更為可能),故將規(guī)定EOB符號(hào) 在每一循環(huán)中偏移的陣列編碼成所述切片的一部分以允許所述符號(hào)集中EOB的索引
"IE0B "從一個(gè)編碼循環(huán)改變至另一編碼循環(huán)。此陣列作為循環(huán)數(shù)的函數(shù)被限制為單 調(diào)地不增加。舉例來說,陣列{4 100…)指示將EOB的索引在第一循環(huán)中編碼為4, 在第二循環(huán)中編碼為l,而在所有后續(xù)循環(huán)中編碼為O (最可能的符號(hào))。
在有效編碼中使用的S3代碼具有參數(shù)截止閾值m。如果符號(hào)^:=附,則使用一
-(附■+ :i) _^ .
及一后綴"00" 、 "01"或"10"來對(duì)其進(jìn)行編碼。舉例來說,圖7中所示的表格給 出對(duì)應(yīng)于m = 0的S3代碼字及代碼長(zhǎng)度。用于每一循環(huán)數(shù)(O, 1 ... 15)及基礎(chǔ)層(LEBL) 中最后編碼的系數(shù)的每一位置(O, 1 .... 15)的包含256個(gè)截止閾值m的上下文表格作為 切片的一部分發(fā)送。
所述S3碼可能最適合于對(duì)其概率分布偏置于小符號(hào)而對(duì)較大符號(hào)變得較平坦的 符號(hào)進(jìn)行編碼。然而,有效游程的實(shí)際概率分布與所述假設(shè)經(jīng)常不一致。因此,使用 其它VLC碼可改善編碼性能。
在本文的系統(tǒng)及方法中,從五種類型的VLC代碼簿中選擇一種類型的代碼簿來 對(duì)所述有效游程及EOB進(jìn)行編碼。所述五個(gè)代碼簿在本文中被稱作代碼簿O、代碼簿 1、代碼簿2、代碼簿3及代碼簿4。下文將對(duì)所述代碼簿的每一者加以解釋。在某些 配置中可使用少于五個(gè)代碼簿。另外,可在其它配置中使用五個(gè)以上代碼簿。本文中 使用五個(gè)代碼簿僅為說明而非意欲具有限制性。
圖8圖解說明用于代碼簿0的偽代碼。代碼簿0使用一元代碼。所述一元代碼用 (")個(gè)"1"及然后一個(gè)"0"來對(duì)符號(hào)s進(jìn)行編碼。所述代碼簿具有代碼長(zhǎng)度{1, 2, 3,…)。 其適合于具有極偏置的概率分布的輸入符號(hào)。圖8中的偽代碼顯示使用一元代碼的編 碼802及解碼804。
圖9圖解說明用于代碼簿1的偽代碼。代碼簿1用一前綴W2個(gè)"1"及然后一2 位后綴對(duì)輸入符號(hào)s進(jìn)行編碼以對(duì)剩余modCy,2)進(jìn)行編碼,其中mod()代表模塊操作。
元代碼對(duì)s進(jìn)行編碼。如果符號(hào)s > m,則使用一前綴
m+l個(gè)一 ("1")
12所述代碼簿具有代碼長(zhǎng)度{2,2,3,3,4,4,…)。其適合于具有相比于一元代碼更均勻的 分布的輸入符號(hào)。圖9中的偽代碼顯示使用代碼簿1的編碼902及解碼904。
圖10圖解說明用于代碼簿2的偽代碼。代碼簿2用一前綴(^3)*2個(gè)"1"及然后 一2位后綴對(duì)輸入符號(hào)s進(jìn)行編碼以代表剩余mod G,3)。此代碼簿具有代碼長(zhǎng)度{2, 2, 2, 4, 4, 4, 6, 6, 6."},其適于相比于代碼簿1更均勻分布的輸入符號(hào)。圖10中的偽代 碼顯示使用所述代碼簿的編碼1002及解碼1004。
代碼簿3使用具有附=0、代碼長(zhǎng)度為U,3, 3,3,5,5,5...)的S3代碼(圖7)。應(yīng)注 意,此代碼簿是代碼簿2的變換版本。其用位0對(duì)輸入符號(hào)^0進(jìn)行編碼。對(duì)于所有 其它符號(hào)^,其使用具有輸入符號(hào)(wl)的代碼簿2。
代碼簿4是代碼簿1的變換版本(顯示于圖9中)。其用位0對(duì)輸入符號(hào)^0進(jìn) 行編碼。對(duì)于所有其它符號(hào)s,其使用輸入符號(hào)被設(shè)定為(付l)的代碼簿l。
代碼簿0到4全部是結(jié)構(gòu)化代碼簿。對(duì)于特定實(shí)施方案,可能不必像霍夫曼代 碼通常所需的那樣在編碼器和解碼器處存儲(chǔ)查詢表格。
再次值得注意的是,盡管本文中顯示并論述了總共五個(gè)代碼簿,但代碼簿3及4 分別僅是代碼簿2及1的變換版本。此是可用來大大簡(jiǎn)化解碼器實(shí)施方案的重要特征。
最佳代碼簿"c"取決于由有效游程及EOB符號(hào)形成的符號(hào)集的概率分布,其不 僅在各序列之間而且還在一既定序列中的各幀之間變動(dòng)。
在一種配置中,將代碼簿選擇表格顯式編碼為切片的一部分。所述表格中的每一 條目是用于在特定條件下對(duì)下一個(gè)有效游程或EOB進(jìn)行解碼的代碼簿的索引。所述代 碼簿選擇表格可每一編碼循環(huán)數(shù)"CCN"包含一條目而不取決于其它參數(shù)。在一不同 實(shí)施方案中,所述代碼簿選擇表格可每對(duì)編碼循環(huán)數(shù)"CCN"及LEBL位置包含一條 目。對(duì)于4x4塊的編碼,"CCN"及LEBL位置包括
的范圍內(nèi)。在任一情形中, 所述編碼器決定所述表格中的每一條目值以優(yōu)化編碼性能。在另一方面中,不將對(duì)用 于對(duì)下一個(gè)有效游程或EOB進(jìn)行編碼的最佳代碼簿的選擇顯式編碼為切片的一部分。 基于運(yùn)行時(shí)間期間所估計(jì)的概率分布及鄰近相關(guān)性來選擇所述最佳代碼簿。
當(dāng)用于FGS層的位預(yù)算有限且所述代碼簿選擇表格被顯式編碼在切片中時(shí),有效 地對(duì)所述代碼簿選擇表格自身進(jìn)行編碼以最小化位開銷是至關(guān)重要的。對(duì)代碼簿選擇 表格的低效率編碼還會(huì)延遲FGS層的速率失真(峰值信號(hào)-噪聲比:位速率)曲線的上 升斜率??梢雰煞N方案來實(shí)現(xiàn)對(duì)代碼簿選擇表格的有效編碼。
盡管有總共五個(gè)代碼簿可供選擇,但據(jù)觀察所述代碼簿的"受歡迎程度"是不同 的。可使用圖11中的VLC表格1102來對(duì)所述代碼簿條目進(jìn)行編碼以減少對(duì)所述表格 條目進(jìn)行編碼所占用的平均位。
在一種配置中,對(duì)最佳代碼簿的選擇僅取決于編碼循環(huán)數(shù)"CCN",其中每一編 碼循環(huán)數(shù)對(duì)應(yīng)于Z字形掃描次序中的掃描位置的索引。所述表格條目被編碼如下。首 先,對(duì)變量"num_sig—vie—selectors"進(jìn)行編碼以指示所述位流中所編碼的代碼簿選擇 符的數(shù)量,繼而對(duì)"num_sig—vlc_selectors"代碼簿選擇符進(jìn)行編碼。使用VLC表格1102中所界定的可變長(zhǎng)度代碼來對(duì)每一代碼簿選擇符進(jìn)行編碼。每一編碼循環(huán)數(shù)均具 有一個(gè)代碼簿選擇符。解碼過程是所述編碼過程的逆過程。未編碼在切片中的代碼簿
選擇符具有默認(rèn)值o。舉例來說,對(duì)于編碼4x4塊,需要16個(gè)代碼簿選擇符。如果 "num—sig—vlc_selectors"是5,其意指對(duì)前五個(gè)代碼簿選擇符進(jìn)行顯式編碼。剩余11 個(gè)代碼簿選擇符為零。
在另一方面中,所述代碼簿選擇表格可每對(duì)編碼循環(huán)數(shù)"CCN"及LEBL位置包 含一條目。對(duì)于大的循環(huán)數(shù)及LEBL位置,代碼簿0 (—元代碼)被選中的概率一般 變得非常高。因此,針對(duì)這些上下文發(fā)送代碼簿可能變得沒有必要。為減小表格尺寸, 可添加表格形狀及表格尺寸作為新語法元素并將其在切片中發(fā)送。下文中界定兩種表 格形狀矩形(參見圖12)及三角形(參見圖13)。針對(duì)矩形表格發(fā)送兩個(gè)尺寸參數(shù) 寬度及高度;而針對(duì)三角形表格發(fā)送一個(gè)額外參數(shù),稱為深度。在表格形狀及尺寸被 決定的情形下,使用圖11中的VLC代碼僅發(fā)送屬于修剪表格1202、 1302的表格條目。 所有其它表格條目1204、 1304 (不屬于修剪表格的表格條目)均不發(fā)送并假設(shè)為0。
為獲得表格形狀及尺寸,以速率失真優(yōu)化方式來修剪16x16代碼簿選擇表格。所 述修剪首先沿列方向發(fā)生,繼而沿排方向發(fā)生,繼而沿對(duì)角線方向發(fā)生(然而,注意 所述編碼器可選擇任何修剪次序)。以列作為實(shí)例。將修剪一個(gè)列的表格條目的成本 C界定為在有效編碼期間由于用代碼簿0替代最佳代碼簿而將發(fā)生的位補(bǔ)償(例如, 如果此列內(nèi)的所有條目已選擇代碼簿O,則C為0)。然后,在圖11中,將修剪此列 的表格條目的位節(jié)省S界定為由于不每一 VLC表格均發(fā)送這些表格條目而產(chǎn)生的位節(jié) 省(例如,如果此列內(nèi)的所有條目均選擇代碼簿O,則S-16個(gè)位)。如果S〉C ,則 修剪此列的表格條目。否則,保留此列,沿列方向的修剪終止,而沿排方向的修剪開 始。此修剪過程經(jīng)證實(shí)在適應(yīng)目標(biāo)位速率方面極為有效。在極低的位速率下,當(dāng)幾乎 不存在有效系數(shù)時(shí),發(fā)送表格條目所需的位并不證明因使用最佳代碼簿而節(jié)省極少的 位是合算的。當(dāng)情況如此時(shí),所述修剪過程可能甚至修剪掉整個(gè)表格。在較高位速率 下,由于相反的原因,所述修剪表格往往具有較大的尺寸。此表格修剪過程的復(fù)雜性 極低,因?yàn)榭稍谛纬伤龃a簿選擇表格的同時(shí)預(yù)先存儲(chǔ)修剪每一表格條目的位補(bǔ)償。 圖14中的偽代碼1402總結(jié)了如何發(fā)送經(jīng)修剪的表格。
圖15圖解說明經(jīng)配置以處理數(shù)字圖像及/或數(shù)字視頻的裝置1600。裝置1600可 代表或?qū)嵤┯跀?shù)字電視、數(shù)字直接廣播系統(tǒng)、無線通信裝置、PDA、膝上型計(jì)算機(jī)、 臺(tái)式計(jì)算機(jī)、數(shù)碼相機(jī)、數(shù)字記錄裝置、網(wǎng)絡(luò)啟用數(shù)字電視、蜂窩式或衛(wèi)星無線電電 話、或任一具有視頻電話(VT)能力的電信裝置中。
裝置1600可處理、編碼、解碼、傳輸及/或接收?qǐng)D像及/或視頻數(shù)據(jù)。所述視頻數(shù) 據(jù)可由攝像機(jī)(例如,視頻捕獲單元(或圖像傳感器))1612捕獲,從視頻文件存儲(chǔ)器中 檢索,或以其它方式獲得。裝置1600中的視頻編碼單元1610可使用視頻編碼標(biāo)準(zhǔn), 例如MPEG-4、 ITU-T H.263、 ITU-T H.264或任一其它視頻編碼標(biāo)準(zhǔn)。視頻編碼單元 1610可支持幀間編碼技術(shù)(例如,運(yùn)動(dòng)估計(jì)及運(yùn)動(dòng)補(bǔ)償)及幀內(nèi)編碼技術(shù)(例如,空間估計(jì)及幀內(nèi)預(yù)測(cè)編碼技術(shù))。
裝置1600可包括圖像/視頻捕獲裝置1612 (例如,相機(jī)或攝像機(jī))以捕獲圖像或 視頻序列并將所捕獲的圖像或序列存儲(chǔ)在存儲(chǔ)器1614中。圖像/視頻處理單元1602可 處理圖像及/或視頻序列。存儲(chǔ)器1604可在此種處理之前及之后存儲(chǔ)所述圖像及/或視 頻序列。
收發(fā)器1616可接收及/或?qū)⒔?jīng)編碼視頻序列傳輸至另一裝置。收發(fā)器1616可使用 無線通信標(biāo)準(zhǔn),例如碼分多址(CDMA)。 CDMA標(biāo)準(zhǔn)的實(shí)例包括CDMA lxEV-DO、寬 帶碼分多址(WCDMA)等。
裝置1600的一個(gè)或多個(gè)元件可經(jīng)由通信總線1618以通信方式耦接。除或替代圖 16中所示的元件,裝置1600中還可包括其它元件。圖16中所圖解說明的架構(gòu)僅是一 實(shí)例??赏ㄟ^各種其它架構(gòu)來實(shí)施本文所述的技術(shù)。
存儲(chǔ)器1614可具有相對(duì)大的存儲(chǔ)器空間。存儲(chǔ)器1614可包括動(dòng)態(tài)隨機(jī)存取存儲(chǔ) 器(DRAM)或快閃存儲(chǔ)器。存儲(chǔ)器1614可包括"NOR"或"NAND"門存儲(chǔ)器技術(shù)或 任一其它數(shù)據(jù)存儲(chǔ)技術(shù)。在其它實(shí)例中,存儲(chǔ)器1614可包括非揮發(fā)性存儲(chǔ)器或任一其 它類型的數(shù)據(jù)存儲(chǔ)單元。
圖像/視頻處理單元1602可包括用于移動(dòng)無線電電話的芯片組,其可包括硬件、 軟件、固件及/或一個(gè)或多個(gè)微處理器、數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、 現(xiàn)場(chǎng)可編程門陣列(FPGA)或其各種組合。處理單元1602可包括耦接至前端圖像/視頻 處理器單元1608的本地存儲(chǔ)器1604及圖像/視頻編碼單元1610。編碼單元1610可包 括用于對(duì)數(shù)字視頻數(shù)據(jù)進(jìn)行編碼(或壓縮)及解碼(或解壓縮)的編碼器/解碼器 (CODEC)。
本地存儲(chǔ)器1604可包括相對(duì)于存儲(chǔ)器1614更小且更快的存儲(chǔ)器空間。舉例來說, 本地存儲(chǔ)器1604可包括同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(SDRAM)。本地存儲(chǔ)器1604可包 括與處理單元1602的其它組件集成在一起的"芯片上"存儲(chǔ)器以在處理器密集的編碼過 程期間提供對(duì)數(shù)據(jù)的存快速取。然而,可將存儲(chǔ)器1614及1604組合成一個(gè)存儲(chǔ)器, 或可以諸多其它配置來實(shí)施。存儲(chǔ)器控制器1606可控制對(duì)本地存儲(chǔ)器1604的存取及 回寫。
前端圖像/視頻處理單元1608可對(duì)視頻序列的幀執(zhí)行一種或多種圖像處理技術(shù)以 改善圖像質(zhì)量,且由此改善視頻序列的質(zhì)量。舉例來說,前端圖像/視頻處理單元1608 可執(zhí)行諸如以下技術(shù)去馬賽克、透鏡滑離修正、按比例縮放、色彩修正、色彩轉(zhuǎn)換 及空間過濾。前端圖像/視頻處理單元1608還可執(zhí)行其它技術(shù)。 一般來說,單元1608 所執(zhí)行的技術(shù)被稱為"前端"圖像處理技術(shù),因?yàn)樗黾夹g(shù)是在圖像/視頻編碼單元1610 實(shí)施的編碼之前。
圖像/視頻捕獲單元1612可包括圖像傳感器,所述圖像傳感器包含布置在所述傳 感器的表面上的色彩過濾片陣列(CFA)。單元1608所執(zhí)行的前端圖像處理可改善捕獲 單元1612所捕獲的視頻序列的質(zhì)量。舉例來說,前端處理單元1608及/或編碼單元1610可包括DSP,所述DSP經(jīng)編程以處理捕獲單元1612所捕獲的圖像。存儲(chǔ)器1604 (或 存儲(chǔ)器1614)的同一區(qū)域既可用于前端圖像處理目的也可用于其它存儲(chǔ)目的。
圖像/視頻編碼單元1610可執(zhí)行圖像及/或視頻編碼,所述圖像及/或視頻編碼可包 括一種或多種視頻壓縮技術(shù),例如,幀間壓縮及/或幀內(nèi)壓縮。舉例來說,編碼單元1610 可實(shí)施運(yùn)動(dòng)估計(jì)及運(yùn)動(dòng)補(bǔ)償技術(shù)以利用時(shí)間或幀間數(shù)據(jù)相關(guān)性來提供幀間壓縮。作為 另一選擇或另外,編碼單元1610可執(zhí)行空間估計(jì)及幀內(nèi)預(yù)測(cè)技術(shù)以利用空間或幀內(nèi)數(shù) 據(jù)相關(guān)性來提供幀內(nèi)壓縮。運(yùn)動(dòng)補(bǔ)償(或幀內(nèi)預(yù)測(cè))的輸出被稱為"殘余"且可包括數(shù) 據(jù)塊,所述數(shù)據(jù)塊指示待編碼的當(dāng)前視頻塊與運(yùn)動(dòng)估計(jì)或空間估計(jì)所識(shí)別的預(yù)測(cè)塊之 間的差異。
在編碼單元1610執(zhí)行運(yùn)動(dòng)補(bǔ)償(或幀內(nèi)預(yù)測(cè))以形成所述殘余之后,可執(zhí)行一系列 額外步驟來進(jìn)一步對(duì)所述殘余進(jìn)行編碼并進(jìn)一步壓縮所述數(shù)據(jù)。所述額外步驟可取決 于正使用的編碼標(biāo)準(zhǔn),但一般被稱為"殘余編碼"。編碼單元1610可執(zhí)行所述視頻壓 縮技術(shù)中的一種或多種以減少經(jīng)由收發(fā)器1616將視頻序列傳送至另一裝置所需的數(shù) 據(jù)量。
可使用各種不同技術(shù)及技法的任一種來表示信息及信號(hào)。舉例來說,上文通篇可 能提及的數(shù)據(jù)、指令、命令、信息、信號(hào)、位、符號(hào)、及碼片均可由電壓、電流、電 磁波、磁場(chǎng)或磁粒子、光場(chǎng)或光粒子或其任一組合表示。
結(jié)合本文揭示的配置所闡述的各種說明性邏輯塊、模塊、電路及算法步驟可實(shí)施 為電子硬件、計(jì)算機(jī)軟件或兩者的組合。為清楚地圖解說明硬件及軟件的此種可互換 性,上文已就其功能性對(duì)各種闡釋性組件、塊、模塊、電路及步驟進(jìn)行了一般性闡述。 此功能性是實(shí)施為硬件還是軟件取決于特定應(yīng)用及施加于總體系統(tǒng)上的設(shè)計(jì)約束。所 屬領(lǐng)域的技術(shù)人員可針對(duì)每一特定應(yīng)用采用不同的方式來實(shí)施所述功能性,但不應(yīng)將 所述實(shí)施決策視為導(dǎo)致背離本發(fā)明系統(tǒng)及方法的范圍。
結(jié)合本文揭示的配置所闡述的各種說明性邏輯塊、模塊、及電路可通過下列裝置 來實(shí)施或執(zhí)行通用處理器、數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn) 場(chǎng)可編程門陣列信號(hào)(FPGA)或其它可編程邏輯裝置、離散門或晶體管邏輯、離散硬 件組件、或其經(jīng)設(shè)計(jì)以執(zhí)行本文中所述功能的任一組合。通用處理器可為微處理器, 但另一選擇為,處理器可為任一常規(guī)處理器、控制器、微控制器或狀態(tài)機(jī)。處理器還 可實(shí)施為計(jì)算裝置的組合,例如,DSP與微處理器的組合、多個(gè)微處理器、 一個(gè)或 多個(gè)微處理器與一 DSP核心的結(jié)合,或任一其它此類配置。
結(jié)合本文所揭示配置所闡述的方法或算法的步驟可直接實(shí)施于硬件中、實(shí)施于由
處理器執(zhí)行的軟件模塊中、或?qū)嵤┯诙叩慕M合中。軟件模塊可駐存于隨機(jī)存取存儲(chǔ) 器(RAM)、快閃存儲(chǔ)器、只讀存儲(chǔ)器(ROM)、可擦除可編程式只讀存儲(chǔ)器(EPROM)、 電可擦除可編程式只讀存儲(chǔ)器(EEPROM)、寄存器、硬磁盤、可拆卸式磁盤、光盤 只讀存儲(chǔ)器(CD-ROM)或此項(xiàng)技術(shù)中己知的任一其它形式的存儲(chǔ)媒體中。存儲(chǔ)媒體 耦接至處理器,以便所述處理器可從所述存儲(chǔ)媒體中讀取信息并向所述存儲(chǔ)媒體中寫
16入信息。另一選擇為,存儲(chǔ)媒體可以是處理器的組成部分。處理器和存儲(chǔ)媒體可駐存
于ASIC中,而ASIC可駐存于用戶終端中。另一選擇為,處理器及存儲(chǔ)媒體可作為離 散組件駐存于用戶終端中。
本文所揭示的方法包括用于實(shí)現(xiàn)所述方法的一個(gè)或多個(gè)步驟或動(dòng)作。所述方法步 驟及/動(dòng)作可彼此互換,此并不違背本發(fā)明系統(tǒng)及方法的范圍。換句話說,除非配置的 正確操作需要特定的步驟或動(dòng)作次序,否則可在不背離本發(fā)明系統(tǒng)及方法范圍的前提 下修改特定步驟及/或動(dòng)作的次序及/或用途。
盡管已圖解說明并闡述了本發(fā)明系統(tǒng)及方法的特定配置及應(yīng)用,但應(yīng)理解本發(fā)明 的系統(tǒng)及方法并非局限于本文中所揭示的具體配置及組件??蓪?duì)本文所揭示方法及系 統(tǒng)的布置、操作及細(xì)節(jié)做出對(duì)于所屬領(lǐng)域的技術(shù)人員將是顯而易見的各種修改、改變 及變化,此并不違背本發(fā)明系統(tǒng)及方法的范圍及精神。
權(quán)利要求
1、一種用于對(duì)視頻序列中的有效系數(shù)進(jìn)行編碼的方法,其包括接收視頻序列;用所述視頻序列構(gòu)建對(duì)當(dāng)前幀中原始視頻信號(hào)的預(yù)測(cè);通過從所述當(dāng)前幀中的所述原始視頻信號(hào)中減去對(duì)所述原始視頻信號(hào)的所述預(yù)測(cè)來形成殘余信號(hào);對(duì)所述殘余信號(hào)應(yīng)用變換;量化多個(gè)變換系數(shù);從多個(gè)代碼簿中選擇一代碼簿以對(duì)有效游程和塊結(jié)束中的至少一者進(jìn)行編碼;及使用所述選定代碼簿對(duì)有效游程與塊結(jié)束中的所述至少一者進(jìn)行編碼。
2、 如權(quán)利要求1所述的方法,其進(jìn)一步包括使用所述選定代碼簿對(duì)塊結(jié)束進(jìn)行 編碼。
3、 如權(quán)利要求1所述的方法,其進(jìn)一步包括用視頻切片對(duì)代碼簿表格信息進(jìn)行 編碼。
4、 如權(quán)利要求3所述的方法,其中所述代碼簿表格信息包括代碼簿選擇表格。
5、 如權(quán)利要求3所述的方法,其中所述代碼簿表格信息包括代碼簿選擇表格, 其中每一條目均對(duì)應(yīng)于每對(duì)編碼循環(huán)數(shù)及LEBL (基礎(chǔ)層中最后編碼的系數(shù))位置。
6、 如權(quán)利要求3所述的方法,其中所述代碼簿表格信息包括代碼簿選擇表格, 其中每一條目?jī)H對(duì)應(yīng)于所述編碼循環(huán)數(shù)。
7、 如權(quán)利要求6所述的方法,其進(jìn)一步包括將所述代碼簿選擇表格編碼為一維 代碼簿選擇陣列。
8、 如權(quán)利要求7所述的方法,其進(jìn)一步包括對(duì)指定經(jīng)顯式編碼的代碼簿選擇表 格條目數(shù)的變量進(jìn)行編碼,其中所述變量后跟代碼簿選擇符,其中每一代碼簿選擇符 均使用可變長(zhǎng)度代碼來編碼。
9、 如權(quán)利要求3所述的方法,其中所述代碼簿表格信息包括表格形狀及表格尺寸。
10、 如權(quán)利要求9所述的方法,其中所述表格形狀為矩形。
11、 如權(quán)利要求9所述的方法,其中所述表格形狀為三角形。
12、 如權(quán)利要求1所述的方法,其中根據(jù)統(tǒng)計(jì)學(xué)估計(jì)動(dòng)態(tài)地確定代碼簿選擇表格。
13、 如權(quán)利要求1所述的方法,其中根據(jù)鄰近相關(guān)性動(dòng)態(tài)地確定代碼簿選擇表格。
14、 如權(quán)利要求l所述的方法,其中在所述多個(gè)代碼簿中, 一個(gè)代碼簿是另一代 碼簿的變換版本。
15、 如權(quán)利要求l所述的方法,其進(jìn)一步包括修剪代碼簿選擇表格以提供經(jīng)修剪的代碼簿選擇表格;及用視頻切片對(duì)所述經(jīng)修剪的代碼簿選擇表格進(jìn)行編碼。
16、 一種電子裝置,其包括 處理器;存儲(chǔ)器,其與所述處理器電子連通; 存儲(chǔ)于所述存儲(chǔ)器中的指令,所述指令可執(zhí)行以 接收視頻序列;用所述視頻序列構(gòu)建對(duì)當(dāng)前幀中原始視頻信號(hào)的預(yù)測(cè);通過從所述當(dāng)前幀中的所述原始視頻信號(hào)中減去對(duì)所述原始視頻信號(hào)的所述 預(yù)測(cè)來形成殘余幀;對(duì)所述殘余信號(hào)應(yīng)用變換; 量化多個(gè)變換系數(shù);從多個(gè)代碼簿中選擇一代碼簿以對(duì)有效游程及塊結(jié)束中的至少一者進(jìn)行編碼;且使用所述選定代碼簿對(duì)有效游程與塊結(jié)束中的所述至少一者進(jìn)行編碼。
17、 如權(quán)利要求16所述的電子裝置,其中所述指令可進(jìn)一步執(zhí)行以用視頻切片 對(duì)代碼簿表格信息進(jìn)行編碼。
18、 如權(quán)利要求17所述的電子裝置,其中所述代碼簿表格信息包括代碼簿選擇 表格。
19、 如權(quán)利要求17所述的電子裝置,其中所述代碼簿表格信息包括表格形狀及 尺寸。
20、 如權(quán)利要求17所述的電子裝置,其中所述指令可進(jìn)一步執(zhí)行以 修剪代碼簿選擇表格以提供經(jīng)修剪的代碼簿選擇表格;及 用視頻切片對(duì)所述經(jīng)修剪的代碼簿選擇表格進(jìn)行編碼。
21、 一種用于對(duì)經(jīng)編碼的視頻序列中的有效系數(shù)進(jìn)行解碼的方法,其包括 接收經(jīng)編碼的視頻位流; 從所述位流中檢索代碼簿表格信息; 使用所述檢索的代碼簿表格信息對(duì)有效符號(hào)進(jìn)行解碼; 使用所述有效符號(hào)對(duì)有效系數(shù)進(jìn)行解碼;解量化多個(gè)變換系數(shù); 對(duì)殘余信號(hào)應(yīng)用逆變換;及 構(gòu)建視頻序列。
22、 如權(quán)利要求21所述的方法,其進(jìn)一步包括從切片中解碼代碼簿表格信息。
23、 如權(quán)利要求22所述的方法,其中所述代碼簿表格信息包括代碼簿選擇表格。
24、 如權(quán)利要求22所述的方法,其中所述代碼簿表格信息包括代碼簿選擇表格 映射循環(huán)數(shù)及LEBL (基礎(chǔ)層中最后編碼的系數(shù))位置。
25、 如權(quán)利要求22所述的方法,其中所述代碼簿表格信息包括代碼簿選擇表格 映射循環(huán)數(shù)。
26、 如權(quán)利要求22所述的方法,其中所述代碼簿表格信息包括表格形狀及表格 尺寸。
27、 如權(quán)利要求26所述的方法,其中所述表格形狀為矩形。
28、 如權(quán)利要求26所述的方法,其中所述表格形狀為三角形。
29、 如權(quán)利要求21所述的方法,其中根據(jù)統(tǒng)計(jì)學(xué)估計(jì)動(dòng)態(tài)地確定代碼簿選擇表格。
30、 如權(quán)利要求21所述的方法,其中根據(jù)鄰近相關(guān)性動(dòng)態(tài)地確定代碼簿選擇表格。
31、 一種電子裝置,其包括 處理器;存儲(chǔ)器,其與所述處理器電子連通;存儲(chǔ)于所述存儲(chǔ)器中的指令,所述指令可執(zhí)行以接收經(jīng)編碼的視頻位流;從所述位流中檢索代碼簿表格信息;使用所述檢索的代碼簿表格信息對(duì)有效符號(hào)進(jìn)行解碼;使用所述有效符號(hào)對(duì)有效系數(shù)進(jìn)行解碼;解量化多個(gè)變換系數(shù);對(duì)殘余信號(hào)應(yīng)用逆變換;及構(gòu)建視頻序列。
32、 一種經(jīng)配置以對(duì)視頻序列中的有效系數(shù)進(jìn)行編碼的電子裝置,所述電子裝置 包括用于處理的裝置; 用于接收視頻序列的裝置;用于用所述視頻序列構(gòu)建對(duì)當(dāng)前幀中原始視頻序列的預(yù)測(cè)的裝置; 用于通過從所述當(dāng)前幀中的所述原始視頻信號(hào)中減去對(duì)所述原始視頻信號(hào)的所 述預(yù)測(cè)來形成殘余幀的裝置;用于對(duì)所述殘余信號(hào)應(yīng)用變換的裝置; 用于量化多個(gè)變換系數(shù)的裝置;用于從多個(gè)代碼簿中選擇一代碼簿以對(duì)有效游程與塊結(jié)束中的至少一者進(jìn)行編 碼的裝置;用于使用所述選定代碼簿對(duì)有效游程與塊結(jié)束的所述至少一者進(jìn)行編碼的裝置。
全文摘要
本發(fā)明闡述一種用于對(duì)經(jīng)編碼視頻序列中的有效系數(shù)進(jìn)行解碼的方法。接收經(jīng)編碼視頻位流。從所述位流中檢索代碼簿表格信息。使用所述檢索的代碼簿表格信息對(duì)有效符號(hào)進(jìn)行解碼。使用所述有效符號(hào)對(duì)有效系數(shù)進(jìn)行解碼。解量化多個(gè)變換系數(shù)。對(duì)殘余信號(hào)應(yīng)用逆變換。構(gòu)建視頻序列。本發(fā)明還闡述一種用于使用多個(gè)表格對(duì)視頻序列中的有效系數(shù)進(jìn)行編碼的方法。
文檔編號(hào)H04N7/30GK101427584SQ200780010862
公開日2009年5月6日 申請(qǐng)日期2007年3月26日 優(yōu)先權(quán)日2006年3月27日
發(fā)明者琰 葉, 鮑易亮 申請(qǐng)人:高通股份有限公司