專利名稱:使用壓縮感測(cè)的視頻編解碼的制作方法
技術(shù)領(lǐng)域:
本原理總地涉及視頻編碼和解碼,并且更具體地涉及用于使用壓縮感測(cè)的視頻編碼器和解碼器的方法和裝置。
背景技術(shù):
壓縮感測(cè)(compressive sensing)(也稱為壓縮采樣和壓縮傳感(compressed sensing))是考慮到信號(hào)稀疏或可壓縮的現(xiàn)有知識(shí)獲取和重構(gòu)信號(hào)的一種技術(shù)。當(dāng)使用壓縮感測(cè)的理論時(shí),可以以比奈奎斯特(Nyquist)采樣低得多的速率采樣信號(hào)。壓縮感測(cè)用在包括數(shù)據(jù)壓縮、磁共振成像(MRI)等的各種應(yīng)用中。在文獻(xiàn)中,將壓縮感測(cè)合并到視頻壓縮框架中來(lái)改進(jìn)殘差編解碼。由于殘差往往并不是非常稀疏的,所以改進(jìn)是有限的。壓縮感測(cè)(CS)框架的概沭假設(shè)X是長(zhǎng)度為N的信號(hào),如果在如下的某種線性變換Ψ (例如,離散余弦變換 (DCT)或離散小波變換(DWT))下可以使用K << N系數(shù)很好地近似X,則認(rèn)為X是K稀疏的(或可壓縮的)X = Ψ α ,(I)其中Ψ是稀疏化變換,α是變換系數(shù)矢量,并且在α中只有K系數(shù)是非零的。轉(zhuǎn)到圖I,用標(biāo)號(hào)100總體指示稀疏信號(hào)的表示。表示100涉及長(zhǎng)度為N的信號(hào)X、稀疏化變換Ψ、和變換系數(shù)矢量α。按照壓縮感測(cè)理論,這樣的信號(hào)可以通過(guò)如下的不相干線性投影來(lái)獲取y = Φχ,(2)其中y是具有M項(xiàng)的度量矢量,并且Φ代表MXN不相干感測(cè)矩陣,其中M<<N。 轉(zhuǎn)到圖2,用標(biāo)號(hào)200總體指示壓縮感測(cè)中的度量獲取方法。方法200涉及長(zhǎng)度為N的信號(hào) X、具有M項(xiàng)的度量矢量y、和MXN不相干感測(cè)矩陣Φ。壓縮感測(cè)框架斷言,通過(guò)求解如下優(yōu)化問(wèn)題,可以只從M彡cK IogN (c是小常數(shù)) 個(gè)度量中忠實(shí)地恢復(fù)X :α * = arg min α 1 以便}τ=Φχ=ΦΨα,(3)其中輸入信號(hào)可以用ΑΨα*近似。在方程(3)中,度量矢量y、感測(cè)矩陣Φ、和稀疏化矩陣ψ是已知的。但是,信號(hào)X和它的變換系數(shù)矢量α是未知的(要尋找的)。在這樣的情況下,α是優(yōu)化變量。注意,由于Μ〈〈Ν,所以方程(2)是未定型的,S卩,存在許多都滿足方程(2)的候選信號(hào)X。因此,應(yīng)用最小二乘解的傳統(tǒng)途徑,即,X' = ΦΤ(ΦΦΤ)5不能提供X的忠實(shí)近似。 壓縮感測(cè)理論提出了通過(guò)求解方程(3)識(shí)別正確解信號(hào)X的替代途徑。直觀地,方程(3)中的優(yōu)化問(wèn)題試圖在變換域Ψ中找出具有最少非零項(xiàng)的候選者X。文獻(xiàn)中的最流行不相干感測(cè)矩陣Φ之一是隨機(jī)投影或隨機(jī)矩陣,其中每項(xiàng)包括獨(dú)立、相同分布隨機(jī)變量(例如,每項(xiàng)具有高斯(Gaussian)或貝努利(Bernoulli )分布)??梢允境?,這樣的隨機(jī)矩陣最佳地與稀疏化Ψ不相干,因此導(dǎo)致最佳性能。請(qǐng)注意,方程(3)中的目標(biāo)函數(shù)可以用其它稀疏度量取代。例如,對(duì)于像圖像(或圖像塊)那樣的2維信號(hào),將總變差(Total Variation,TV)用作稀疏度量是常見的??傋儾钍窍嗬^像素之間的差值的函數(shù)。總變差(TV)的一個(gè)示例如下
權(quán)利要求
1.一種裝置,其包含 視頻編碼器(500),用于通過(guò)生成圖像塊的度量矢量,編碼度量矢量,以及通過(guò)最小化響應(yīng)于編碼度量矢量的圖像塊的信號(hào)稀疏度重構(gòu)圖像塊,來(lái)編碼畫面中的圖像塊,該度量矢量包括與圖像塊有關(guān)的變換系數(shù)。
2.如權(quán)利要求I所述的裝置,其中響應(yīng)為圖像塊確定的殘差確定度量矢量,該殘差代表圖像塊的原始版本與圖像塊的預(yù)測(cè)量之間的差值。
3.如權(quán)利要求2所述的裝置,其中度量矢量包括殘差的變換系數(shù)的子集。
4.如權(quán)利要求I所述的裝置,其中度量矢量使用量化和熵編解碼來(lái)編碼。
5.如權(quán)利要求I所述的裝置,其中信號(hào)稀疏度在圖像域中確定。
6.如權(quán)利要求5所述的裝置,其中信號(hào)稀疏度通過(guò)總變差來(lái)量度,該總變差是圖像塊中的相繼像素之間的差值的函數(shù)。
7.如權(quán)利要求I所述的裝置,其中使用公式化成信號(hào)稀疏度和度量誤差的加權(quán)和的最小化函數(shù)使圖像塊的信號(hào)稀疏度最小化,該度量誤差代表圖像塊的重構(gòu)度量與估計(jì)度量之間的差值。
8.—種用在視頻編碼器中的方法,其包含 通過(guò)生成圖像塊的度量矢量,編碼度量矢量,以及通過(guò)最小化響應(yīng)于編碼度量矢量的圖像塊的信號(hào)稀疏度重構(gòu)圖像塊,來(lái)編碼畫面中的圖像塊,該度量矢量包括與圖像塊有關(guān)的變換系數(shù)(900)。
9.如權(quán)利要求8所述的方法,其中響應(yīng)為圖像塊確定的殘差確定度量矢量,該殘差代表圖像塊的原始版本與圖像塊的預(yù)測(cè)量之間的差值(730)。
10.如權(quán)利要求9所述的方法,其中度量矢量包括殘差的變換系數(shù)的子集(730)。
11.如權(quán)利要求8所述的方法,其中度量矢量使用量化和熵編解碼來(lái)編碼(930,935)。
12.如權(quán)利要求8所述的方法,其中信號(hào)稀疏度在圖像域中確定(815)。
13.如權(quán)利要求12所述的方法,其中信號(hào)稀疏度通過(guò)總變差來(lái)量度,該總變差是圖像塊中的相繼像素之間的差值的函數(shù)(950 )。
14.如權(quán)利要求8所述的方法,其中使用公式化成信號(hào)稀疏度和度量誤差的加權(quán)和的最小化函數(shù)使圖像塊的信號(hào)稀疏度最小化,該度量誤差代表圖像塊的重構(gòu)度量與估計(jì)度量之間的差值(815)。
15.如權(quán)利要求8所述的方法,其中將所述方法實(shí)現(xiàn)成編解碼模式,以及使用標(biāo)志傳信是否選擇該編解碼模式(992 )。
16.如權(quán)利要求15所述的方法,其中該編解碼模式選擇基于率失真(990)。
17.一種裝置,其包含 視頻解碼器(600),用于通過(guò)接收?qǐng)D像塊的度量矢量,解碼度量矢量,以及通過(guò)最小化響應(yīng)于解碼度量矢量的圖像塊的信號(hào)稀疏度重構(gòu)圖像塊,來(lái)解碼畫面的圖像塊,其中,該度量矢量包括與圖像塊有關(guān)的變換系數(shù)。
18.如權(quán)利要求17所述的裝置,其中響應(yīng)為圖像塊確定的殘差確定度量矢量,該殘差代表圖像塊的原始版本與圖像塊的預(yù)測(cè)量之間的差值。
19.如權(quán)利要求18所述的裝置,其中度量矢量包括殘差的變換系數(shù)的子集。
20.如權(quán)利要求17所述的裝置,其中度量矢量使用量化和熵編解碼來(lái)解碼。
21.如權(quán)利要求17所述的裝置,其中信號(hào)稀疏度在圖像域中確定。
22.如權(quán)利要求17所述的裝置,其中使用公式化成信號(hào)稀疏度和度量誤差的加權(quán)和的最小化函數(shù)使圖像塊的信號(hào)稀疏度最小化,該度量誤差代表圖像塊的重構(gòu)度量與估計(jì)度量之間的差值。
23.一種用在視頻解碼器中的方法,其包含 通過(guò)接收?qǐng)D像塊的度量矢量,解碼度量矢量,以及通過(guò)最小化響應(yīng)于解碼度量矢量的圖像塊的信號(hào)稀疏度重構(gòu)圖像塊,來(lái)解碼畫面的圖像塊,其中,該度量矢量包括與圖像塊有關(guān)的變換系數(shù)(1000)。
24.如權(quán)利要求23所述的方法,其中響應(yīng)為圖像塊確定的殘差確定度量矢量,該殘差代表圖像塊的原始版本與圖像塊的預(yù)測(cè)量之間的差值(730)。
25.如權(quán)利要求24所述的方法,其中度量矢量包括殘差的變換系數(shù)的子集(730)。
26.如權(quán)利要求23所述的方法,其中度量矢量使用量化和熵編解碼來(lái)解碼(930,935)。
27.如權(quán)利要求23所述的方法,其中信號(hào)稀疏度在圖像域中確定(815)。
28.如權(quán)利要求23所述的方法,其中使用公式化成信號(hào)稀疏度和度量誤差的加權(quán)和的最小化函數(shù)使圖像塊的信號(hào)稀疏度最小化,該度量誤差代表圖像塊的重構(gòu)度量與估計(jì)度量之間的差值(815)。
29.一種含有編碼在上面的視頻信號(hào)數(shù)據(jù)的計(jì)算機(jī)可讀存儲(chǔ)媒體,其包含 通過(guò)生成圖像塊的度量矢量,編碼度量矢量,以及通過(guò)最小化響應(yīng)于編碼度量矢量的圖像塊的信號(hào)稀疏度重構(gòu)圖像塊,來(lái)編碼的畫面中的圖像塊,該度量矢量包括與圖像塊有關(guān)的變換系數(shù)。
全文摘要
本發(fā)明提供了用于使用壓縮感測(cè)的視頻編碼器和解碼器的方法和裝置。編碼方法通過(guò)生成圖像塊的度量矢量,編碼度量矢量,以及通過(guò)最小化響應(yīng)于編碼度量矢量的圖像塊的信號(hào)稀疏度重構(gòu)圖像塊,來(lái)編碼畫面中的圖像塊,該度量矢量包括與圖像塊有關(guān)的變換系數(shù)(900)。相應(yīng)解碼方法通過(guò)接收?qǐng)D像塊的度量矢量,解碼度量矢量,以及通過(guò)最小化響應(yīng)于解碼度量矢量的圖像塊的信號(hào)稀疏度重構(gòu)圖像塊,來(lái)解碼畫面的圖像塊,其中該度量矢量包括與圖像塊有關(guān)的變換系數(shù)。
文檔編號(hào)H04N7/50GK102714730SQ201180006149
公開日2012年10月3日 申請(qǐng)日期2011年1月14日 優(yōu)先權(quán)日2010年1月15日
發(fā)明者J.索爾, T.多, 呂小安 申請(qǐng)人:湯姆森特許公司