專利名稱:用于壓縮圖像信號的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本申請要求于2007年10月24日提交到韓國知識產(chǎn)權(quán)局的第10-2007-0107442 號韓國專利申請的優(yōu)先權(quán),該申請的公開通過引用全部包含于此。本發(fā)明涉及壓縮圖像信號,更具體地講,涉及一種用于壓縮圖像信號的方法和設(shè) 備,以通過修改變換矩陣來提高壓縮率。
背景技術(shù):
離散余弦變換(DCT)是用于視頻、圖像或音頻壓縮的公知技術(shù)。近年來,進(jìn)行了多 種嘗試以開發(fā)更有效的編碼方法,為此,在音頻編碼中,參數(shù)編碼已經(jīng)顯示出比DCT更好的 結(jié)果。對于二維(2D)數(shù)據(jù),Karhimen Loeve變換(KLT)系數(shù)具有最小比特間隔,然而開銷 信息(overhead information)量顯著增力口。發(fā)明的公開技術(shù)方案本發(fā)明的示例性實(shí)施例克服上面的缺點(diǎn)以及上面沒有描述的其他缺點(diǎn)。此外,本 發(fā)明不需要克服上述缺點(diǎn),本發(fā)明的示例性實(shí)施例可不克服上述任何問題。本發(fā)明提供一種壓縮圖像信號的方法,從而在具有最小量的開銷信息的同時提供 比離散余弦(DCT)更有效的壓縮。關(guān)于本發(fā)明的表示DCT矩陣的行和列之間的部分互換的程度(extend)的參數(shù),通 過使用幾個值來執(zhí)行DCT矩陣的行和列之間的部分互換。在本發(fā)明中所述參數(shù)被稱為角度 參數(shù)。通過DCT矩陣的這種修改,可產(chǎn)生更有效的壓縮系數(shù)矩陣。當(dāng)使用的角度參數(shù)的值按該值原樣被存儲或發(fā)送時,顯著增加開銷。然而,在本發(fā) 明中,對產(chǎn)生角度參數(shù)的隨機(jī)序列、針對產(chǎn)生的隨機(jī)序列的每個角度參數(shù)產(chǎn)生壓縮系數(shù)矩 陣以及計(jì)算壓縮率的處理進(jìn)行重復(fù),以獲取具有最高壓縮率的角度參數(shù)。此外,不存儲或發(fā) 送具有最高壓縮率的角度參數(shù),而是獲取相應(yīng)的角度參數(shù)的隨機(jī)序列中的編號,并進(jìn)行存 儲或發(fā)送。有益效果根據(jù)用于壓縮圖像信號的方法和設(shè)備,在提高圖像信號的壓縮率的同時,可通過 使用用于修改變換矩陣的壓縮參數(shù)的方法來減小開銷。因此,減少需要存儲或發(fā)送到解碼 器的數(shù)據(jù)量。
通過下面結(jié)合附圖對本發(fā)明的示例性實(shí)施例進(jìn)行的詳細(xì)描述,本發(fā)明的上述和其 它特點(diǎn)和優(yōu)點(diǎn)將會變得更加清楚,其中圖1和圖2是用于描述離散余弦變換(DCT)矩陣的行和列之間的互換的示圖;圖3是示出歐拉角的示圖;圖4示出用于在蒙特卡羅方法中比較均勻的網(wǎng)格點(diǎn)和偽隨機(jī)點(diǎn)的示圖5是示出根據(jù)本發(fā)明的示例性實(shí)施例的用于壓縮圖像信號的設(shè)備的框圖;圖6是示出根據(jù)本發(fā)明的示例性實(shí)施例的壓縮圖像信號的方法的流程圖;圖7和圖8是示出根據(jù)本發(fā)明的示例性實(shí)施例的壓縮率的增加的曲線圖。最佳實(shí)施方式根據(jù)本發(fā)明的一方面,提供一種壓縮圖像信號的方法,所述方法包括執(zhí)行變換矩 陣的行和列之間的部分互換;通過使用已經(jīng)執(zhí)行部分互換的變換矩陣來變換將被壓縮的圖 像信號;壓縮變換的圖像信號;通過將多個值應(yīng)用到表示變換矩陣的行和列之間的部分互 換的程度的角度參數(shù),通過重復(fù)執(zhí)行部分互換、圖像信息的變換和變換的圖像信號的壓縮 來選擇與最高壓縮率相應(yīng)的角度參數(shù)。所述變換可以是離散余弦變換(DCT)。角度參數(shù)可以是歐拉角。執(zhí)行部分互換的步驟可包括將與行之間的部分互換相應(yīng)的矩陣左乘變換矩陣, 將與列之間的部分互換相應(yīng)的矩陣右乘變換矩陣。與行之間的部分互換相應(yīng)的矩陣可以為 "A B C 0 “
DEFO
GHIO 0 0 0 1 _其中,A = cos α cos γ -sin α cos β sin γ ,B = -sin α cos γ -cos α cos β sin γ ,C= sin β sin γ,D = cos α sin γ +sin α cos β cos γ ,E = -sin α sin γ +cos α cos β cos γ ,F =-sin β cos γ,G = sin α sin β ,H =Cos α sin β,I = cos β,α、β和γ是歐拉角。選擇與最高壓縮率相應(yīng)的角度參數(shù)的步驟可包括針對角度參數(shù)產(chǎn)生隨機(jī)序列; 通過針對隨機(jī)序列的每個值執(zhí)行行和列之間部分互換、圖像信號的變換和變換的圖像信號 的壓縮,來獲取圖像信號的壓縮率;從獲取的隨機(jī)序列的每個值的壓縮率中獲取最高壓縮 率;選擇與最高壓縮率相應(yīng)的角度參數(shù)的值。所述方法還包括獲取隨機(jī)序列中的與最高壓縮率相應(yīng)的角度參數(shù)的值的編號; 存儲以最高壓縮率壓縮的圖像信號和隨機(jī)序列中相應(yīng)的編號,或者將以最高壓縮率壓縮的 圖像信號和隨機(jī)序列中相應(yīng)的編號發(fā)送到解碼器。產(chǎn)生的隨機(jī)序列可以是Lemer偽隨機(jī)數(shù)。選擇與最高壓縮率相應(yīng)的角度參數(shù)的步驟可包括通過使用蒙特卡羅方法重復(fù)執(zhí) 行部分互換、變換圖像信號和壓縮變換的圖像信號。
歐拉角可具有接近0°或接近180°的值。根據(jù)本發(fā)明的另一面,提供一種壓縮圖像信號的設(shè)備,所述設(shè)備包括行和列互換 器,執(zhí)行變換矩陣的行和列之間的部分互換;變換器,通過使用已經(jīng)執(zhí)行部分互換的變換矩 陣來變換將被壓縮的圖像信號;圖像壓縮器,壓縮變換的圖像信號;控制器,通過將多個值 應(yīng)用到表示變換矩陣的行和列之間的部分互換的程度的角度參數(shù),通過重復(fù)執(zhí)行行和列互 換器、變換器和圖像壓縮器的操作來選擇與最高壓縮率相應(yīng)的角度參數(shù)。
所述變換可以是離散余弦變換(DCT)。角度參數(shù)可以是歐拉角。行和列互換器可將與行之間的部分互換相應(yīng)的矩陣左乘變換矩陣,將與列之間的 部分互換相應(yīng)的矩陣右乘變換矩陣。控制器可針對角度參數(shù)產(chǎn)生隨機(jī)序列;通過針對隨機(jī)序列的每個值操作行和列互 換器、變換器和圖像壓縮器,來獲取圖像信號的壓縮率;從獲取的隨機(jī)序列的每個值的壓縮 率中獲取最高壓縮率;選擇與最高壓縮率相應(yīng)的角度參數(shù)的值??刂破骺色@取隨機(jī)序列中的與最高壓縮率相應(yīng)的角度參數(shù)的值的編號;存儲以最 高壓縮率壓縮的圖像信號和隨機(jī)序列中相應(yīng)的編號,或者將以最高壓縮率壓縮的圖像信號 和隨機(jī)序列中相應(yīng)的編號發(fā)送到解碼器??赏ㄟ^使用蒙特卡羅方法重復(fù)行和列互換器、變換器和圖像壓縮器的操作,來選 擇與最高壓縮率相應(yīng)的角度參數(shù)。發(fā)明的實(shí)施方式以下,將參照附圖更充分地描述本發(fā)明,其中,本發(fā)明的示例性實(shí)施例在附圖中示
出ο〈矩陣的行和列之間的互換(exchange)〉在本發(fā)明的示例性實(shí)施例中,執(zhí)行離散余弦變換(DCT)矩陣的行和列之間的部分 互換。通過DCT矩陣的這種修改,可產(chǎn)生更有效的壓縮系數(shù)矩陣。圖1和圖2是描述DCT矩陣的行和列之間的互換的示圖。在本發(fā)明的示例性實(shí)施例中,行之間的部分互換是指根據(jù)參數(shù)的值對行進(jìn)行部分 地互換,而非對全部行進(jìn)行互換。根據(jù)參數(shù)的值對行A和行B進(jìn)行互換,如下面的等式1所示。[等式1]row A (新值)=cos ( α ) *row A (原來的值)+sin ( α ) *row B (原來的值)row B (新值)=sin ( α ) *row A (原來的值)+cos ( α ) *row B (原來的值)參照等式1,參數(shù)“ α ”作為角度。因此,示出DCT矩陣的行和列之間的部分互換的 程度(extend)的參數(shù)被稱為角度參數(shù)。當(dāng)參數(shù)“α”的值為0°時,不執(zhí)行互換。此夕卜,當(dāng)參數(shù)“α ”的值為90°時,對全
部行進(jìn)行互換。此外,當(dāng)參數(shù)“α ”的值大于90°并小于180°時,對行進(jìn)行互換并改變元素的符 號。當(dāng)參數(shù)“α ”的值為180°時,不對行進(jìn)行互換,但是包括在每行中的元素的符號改變。以與行之間的部分互換相同的方式來定義列之間的部分互換。圖1示出4X4DCT矩陣的情況。參照圖1,在互換行時使用3個參數(shù)α ^ α 2和α 3。在互換列時使用3個參數(shù)α 4、α 5和α 6。此外,圖2示出8X8DCT矩陣的情況。參照圖2,在互換行時使用6個參數(shù)α ρ α 2、 α 3、α 4、α 5禾口 α 6。在互換列時使用6個參數(shù)α 7、α 8、α 9、α 10、α η禾口 α 12。在圖1中,互換行的結(jié)果基于應(yīng)用參數(shù)α ρ α 2和α 3的順序是不同的。換句話說, 參數(shù)αι、α2* α 3彼此之間不是獨(dú)立的。當(dāng)首先應(yīng)用參數(shù)h然后應(yīng)用參數(shù)02時的矩陣 值與首先應(yīng)用參數(shù)α 2然后應(yīng)用參數(shù)α!時的矩陣值是不同的。可見,行和列的互換類似于以三維(3D)的方式旋轉(zhuǎn)坐標(biāo)軸。換句話說,三個列分 別對應(yīng)于3D坐標(biāo)中的X、Y和Z軸。即使在3D的坐標(biāo)軸的旋轉(zhuǎn)中,結(jié)果也是基于哪個軸首先被旋轉(zhuǎn)而不同。因此,已 經(jīng)開發(fā)了示出3D的坐標(biāo)軸的旋轉(zhuǎn)的幾種方法,典型的方法是歐拉角。圖3是示出歐拉角的示圖。參照圖3,三個角α、β和Y是歐拉角。在圖3中,X軸、Y軸和Z軸表示旋轉(zhuǎn)前的坐標(biāo)軸,X’軸、Y’軸和Ζ’軸表示旋轉(zhuǎn)后 的坐標(biāo)軸。N軸是XY面和X’ Y’面的交線。N軸被稱為節(jié)點(diǎn)的線。角α是以Z軸為旋轉(zhuǎn)軸的X軸和N軸之間的角。角β是以N軸為旋轉(zhuǎn)軸的Z軸 和Ζ’軸之間的角。角γ是以Ζ’軸為旋轉(zhuǎn)軸的N軸和X’軸之間的角。當(dāng)以矩陣形式示出應(yīng)用歐拉角的坐標(biāo)軸的旋轉(zhuǎn)時,如下面的等式2所示。[等式2]
cosy siny 0 1 0 0 cos a sin α 0-siny cosy 0 0 cos/ sin/ -sina cos α 0 0 0 1」|_。-sin/ cons/ J [θ 0 1_第一矩陣表示圍繞V軸的旋轉(zhuǎn),第二矩陣表示圍繞N軸的旋轉(zhuǎn),第三矩陣表示圍 繞Z軸的旋轉(zhuǎn)。在本發(fā)明的示例性實(shí)施例中,可以以使用歐拉角的坐標(biāo)軸的旋轉(zhuǎn)來示出行和列之 間的互換。對有效執(zhí)行壓縮的最優(yōu)變換矩陣的查找存在對參數(shù)具有強(qiáng)的不平滑的依賴性的 典型多參數(shù)問題。蒙特卡羅(Monte Carlo)方法用于解決該問題。在蒙特卡羅方法中,Lemer 序列號可用于產(chǎn)生隨機(jī)點(diǎn)。通過使用Lemer序列號,僅一個整數(shù)被存儲或發(fā)送,而不存儲或 發(fā)送用作參數(shù)的角度參數(shù)。因此,可減少用于通知解碼器關(guān)于使用的參數(shù)的值所需的開銷。換句話說,在示例性實(shí)施例中使用下面的項(xiàng)。1.DCT矩陣的可逆變換2.更有效編碼的能量的重新配置3.通過使用Lemer數(shù)最小化添加的信息的數(shù)量返回參照圖1和圖2,通過旋轉(zhuǎn)修改的部分為黑色塊,沒有修改的部分是空白的。 在圖1中,通過重新配置行和列之間的能量6個角度參數(shù)修改了 15個元素。在圖2中,12 個角度參數(shù)修改了 60個元素。參照圖1,需要3個角度參數(shù)來互換行,需要3個角度參數(shù)來互換列。因此,在4X 4 塊中需要6個角度參數(shù)。參照圖2,需要6個角度參數(shù)來互換行,需要6個角度參數(shù)來互換列。因此,在8 X 8塊中需要12個角度參數(shù)。
現(xiàn)在將描述本發(fā)明的示例性實(shí)施例的步驟。步驟1 正交變換家族(family)參數(shù)化步驟2:蒙特卡羅方法步驟3 Lemer偽隨機(jī)數(shù)
步驟4 最優(yōu)角度參數(shù)的范圍(diapason)的定位步驟5 擬最優(yōu)基底(basis)當(dāng)被添加用于提高視頻信號的壓縮率的參數(shù)的數(shù)量太多時,最好不壓縮地發(fā)送視 頻信號。例如,當(dāng)需要16個額外的參數(shù)時,即使圖像信號以4X4塊被壓縮從而大小接近0, 也不需要壓縮視頻數(shù)據(jù),因?yàn)檫@與將16個像素值作為參數(shù)發(fā)送到解碼器相同。因此,在最小化添加的開銷時優(yōu)選地壓縮圖像信號。在本發(fā)明的示例性實(shí)施例中,通過使用最少量的信息來優(yōu)化用于壓縮視頻序列的變換?!床襟E1正交變換家族參數(shù)化>為了最優(yōu)化當(dāng)前的數(shù)據(jù)變換,需要確定本質(zhì)地描述基底的參數(shù)組?;淄ㄟ^變換 矩陣表示,因此,通過修改變換矩陣來修改基底。主要通過旋轉(zhuǎn)基底來修改基底。在本發(fā)明的示例性實(shí)施例中,通過使用角度參數(shù) 來旋轉(zhuǎn)基底。在最優(yōu)化圖像變換中使用角度參數(shù)來旋轉(zhuǎn)基底是一種新的技術(shù)。角度參數(shù)可 以是歐拉角。然而,角度參數(shù)不限于歐拉角,角度參數(shù)可以是任何參數(shù),只要該參數(shù)表示矩 陣的行和列之間的部分互換的程度。以下的示例性實(shí)施例使用歐拉角。在變換最優(yōu)化的情況下,通過使用DCT矩陣D的左乘(Rh。riz。ntal)和右乘(Rvertical) 將歐拉角的旋轉(zhuǎn)定義為下面的等式3。[等式3]D,=Rh。riz。ntalXDXR
vertical這里,D’表示通過旋轉(zhuǎn)修改的DCT矩陣。矩陣Rtoiz。ntal執(zhí)行DCT矩陣D的行之間的互換。矩陣RVCTti。al執(zhí)行DCT矩陣D的列 之間的互換。在4X4塊中,矩陣Rh iz。ntal的示例是下面的等式4。[等式4]
"A B C 0 “
D _ D E F 0Khorizontal= τ A
Cj rl 1 U
0 0 0 1^A = cos α cos γ -sin α cos β sin γB = -sin α cos γ -cos α cos β sin γC = sin β sin γD = cos α sin γ +sin α cos β cos γE = -sin α sin γ +cos α cos β cos γF = -sin β cos γG = sin α sin β
H =COS α sin βI = cos^這里,α、β和γ是歐拉角。因此,在4X4塊的情況下,根據(jù)6個參數(shù)αι、α2、α3、α4、α5* α 6的組,歐拉角 修改15個DCT系數(shù)。在8X8塊的情況下,12個歐拉角α ^ α 2、. . . .、α 12修改60個DCT 系數(shù)。這樣,減少了用于修改DCT矩陣的參數(shù)的數(shù)量?!床襟E2:蒙特卡羅方法〉在自由度被減少到6個角度參數(shù)(在8X8塊的情況下,12個角度參數(shù))之后,應(yīng) 在節(jié)省字節(jié)方面來最優(yōu)化數(shù)據(jù)變換。換句話說,應(yīng)最優(yōu)化對角度參數(shù)的組進(jìn)行選擇的方法。此時,使用參數(shù)的高維域(6或12個角度參數(shù)),圖像的壓縮不平滑地取決于使用 的參數(shù)。通過使用蒙特卡羅方法來解決這些問題。蒙特卡羅方法的核心是執(zhí)行多個嘗試。換句話說,通過使用幾個點(diǎn)來測量函數(shù)值 (本發(fā)明的示例性實(shí)施例中的壓縮率),并選擇最優(yōu)點(diǎn)。在蒙特卡羅方法中,高維域中的隨 機(jī)點(diǎn)的質(zhì)量很重要,該重要性隨著維數(shù)的增加而特別地增加。作為公知的,此時,偽隨機(jī)點(diǎn) 比均勻的網(wǎng)格點(diǎn)更好。現(xiàn)在將參照圖4來描述在2D中使用蒙特卡羅方法的情況。圖4示出根據(jù)本發(fā)明的示例性實(shí)施例的在蒙特卡羅方法中均勻的網(wǎng)格點(diǎn)和偽隨 機(jī)點(diǎn)的比較。圖4的左側(cè)圖示出均勻的網(wǎng)格點(diǎn),圖4的右側(cè)圖示出根據(jù)偽隨機(jī)序列的第一 16個點(diǎn)。當(dāng)使用均勻的網(wǎng)格點(diǎn)時,不考慮蒙特卡羅方法的16個嘗試,對于第一參數(shù)(和第 二參數(shù))僅檢查4個其他的值。然而,當(dāng)使用偽隨機(jī)序列時,通過16個嘗試來對第一參數(shù) (和第二參數(shù))檢查16個不同的值。換句話說,當(dāng)使用偽隨機(jī)點(diǎn)時,可關(guān)于16個值來充分 地檢查第一參數(shù)和第二參數(shù)的不同值。特別是隨著參數(shù)的數(shù)量的增加,在蒙特卡羅方法中 使用偽隨機(jī)序列比均勻的網(wǎng)格點(diǎn)更有利。使用蒙特卡羅方法以有效地解決最優(yōu)化數(shù)據(jù)變換時出現(xiàn)的問題?!床襟E3 Lemer偽隨機(jī)數(shù)>存在多種產(chǎn)生偽隨機(jī)序列的方法,最有效的方法之一通過使用Lemer數(shù)來執(zhí)行。 Lemer偽隨機(jī)序列是人為產(chǎn)生的序列,具有最接近不均勻分布的真隨機(jī)數(shù)的特性。產(chǎn)生 Lemer序列的算法是公知的,因此這里將省略對其的詳細(xì)描述。在本發(fā)明的示例性實(shí)施例 中,需要提供至少IO13個不重復(fù)點(diǎn)。由于Lemer序列是人為的序列,并且其產(chǎn)生算法是公知 的,因此解碼器可容易地重新計(jì)算Lemer序列。通過使用Lemer序列,可通過使用一條信息(即,隨機(jī)序列中的編號)來對參數(shù) (即,角度參數(shù))的組進(jìn)行編碼。從每個6維(6D)或12維(12D)參數(shù)域產(chǎn)生一個隨機(jī)點(diǎn),并在通過使用產(chǎn)生的隨 機(jī)點(diǎn)執(zhí)行壓縮來測量壓縮率之后,選擇最優(yōu)點(diǎn)??纱鎯虬l(fā)送與Lemer序列中產(chǎn)生最優(yōu)點(diǎn) 的位置對應(yīng)的編號,而不存儲或發(fā)送最優(yōu)參數(shù)的組。如果在蒙特卡羅方法中檢查2Ρ個點(diǎn),則ρ比特的信息被認(rèn)為是開銷。<步驟4 最優(yōu)角度參數(shù)的范圍的定位>已經(jīng)發(fā)現(xiàn)最優(yōu)旋轉(zhuǎn)角具有接近0°或180° (弧度π)的值。這表明DCT基底已 經(jīng)差不多被最優(yōu)化。
因此,本發(fā)明的示例性實(shí)施例的角度參數(shù)僅執(zhí)行行和列之間的部分互換(在歐拉 角的情況下,接近0°的角),或執(zhí)行部分互換和基底元素的符號的修改(在歐拉角的情況 下,接近180°的角)。換句話說,使用的參數(shù)的范圍被限制為域的特定區(qū)域,這被稱為定位。通過執(zhí)行對參數(shù)的范圍的定位,可減少開銷比特的數(shù)量。假設(shè)將被檢查的點(diǎn)被限 制在圖4中的特定區(qū)域,可以看到將被檢查的區(qū)域減小。當(dāng)每單位區(qū)域?qū)⒈粰z查的點(diǎn)的數(shù) 量增加時,壓縮率增加。然而,當(dāng)應(yīng)用所述定位時,可以看到將被檢查的點(diǎn)的數(shù)量減少,從而 提高了相同的壓縮率。此外,當(dāng)固定將被檢查的點(diǎn)的數(shù)量時(即,當(dāng)作為開銷使用的比特的數(shù)量固定 時),由于通過應(yīng)用所述定位每單位區(qū)域更多的點(diǎn)被檢查,因此壓縮率增加得更多?!床襟E5:擬最優(yōu)基底〉
通過執(zhí)行步驟1至步驟4,可為所有的塊(4X4塊或8X8塊)選擇最優(yōu)基底。在 高比特率時,每個塊可添加8字節(jié)或10字節(jié)的開銷。在低比特率時,可選擇擬最優(yōu)基底。擬最優(yōu)基底表示相同的旋轉(zhuǎn)被應(yīng)用到包括在一個宏塊(macroblock)或一幀中的 全部塊或部分塊。當(dāng)最優(yōu)旋轉(zhuǎn)被應(yīng)用到每個塊時,圖像的壓縮率可增加,但是開銷也增加。通過各種實(shí)驗(yàn)可以確定相同的旋轉(zhuǎn)是否被應(yīng)用到至少一個塊、塊的組、一個宏塊 或一幀。在低比特率時,在旋轉(zhuǎn)之后的大部分塊中,量化系數(shù)的值為0。因此,不需要發(fā)送關(guān) 于這些塊的旋轉(zhuǎn)角度值的額外信息。圖5是示出根據(jù)本發(fā)明的示例性實(shí)施例的用于壓縮圖像信號的設(shè)備100的框圖。 參照圖5,設(shè)備100包括行和列互換器110、DCT變換器120、圖像壓縮器130和控制器140。行和列互換器110執(zhí)行DCT矩陣的行和列之間的部分互換。如等式3所示,行和 列互換器Iio將與行之間的部分互換相應(yīng)的矩陣Rtoiz。ntal左乘DCT矩陣,并將與列之間的 部分互換相應(yīng)的矩陣RVCTti。al右乘DCT矩陣,然而,行和列互換器110的操作不限于此,因此, 行和列互換器110可通過其他方式執(zhí)行部分互換。DCT變換器120通過使用已經(jīng)執(zhí)行部分互換的DCT矩陣來對將被壓縮的圖像信號 進(jìn)行DCT變換。該操作被定義為下面的等式5。[等式5]Y = D' XS,XD,τ在等式5中,D’表示修改的DCT矩陣,S表示將被壓縮的圖像信號的矩陣,Y表示 DCT變換的圖像信號。圖像壓縮器130壓縮DCT變換的圖像信號。控制器140通過將多個值應(yīng)用到角度參數(shù)重復(fù)行和列互換器110、DCT變換器120 和圖像壓縮器130的操作(以下,稱為“重復(fù)操作”),來選擇與最高壓縮率相應(yīng)的角度參數(shù)??刂破?40通過使用蒙特卡羅方法來針對多個角度參數(shù)執(zhí)行所述重復(fù)操作,并選 擇與最高壓縮率相應(yīng)的角度參數(shù)。因此,控制器140針對角度參數(shù)產(chǎn)生隨機(jī)序列,通過對隨機(jī)序列的每個值執(zhí)行所 述重復(fù)操作來獲取圖像信號的壓縮率,并選擇具有最高壓縮率的角度參數(shù)的值。
此外,為了減小開銷,控制器140獲得與最高壓縮率相應(yīng)的角度參數(shù)的值的隨機(jī) 序列中的編號(即,位置),并存儲相應(yīng)的壓縮圖像信號和隨機(jī)序列中的編號或?qū)⑾鄳?yīng)的壓 縮圖像信號和隨機(jī)序列中的編號發(fā)送到解碼器,而不直接存儲或發(fā)送角度參數(shù)的值。如上所述,隨機(jī)序列可以是Lemer偽隨機(jī)數(shù)。
圖6是示出根據(jù)本發(fā)明的示例性實(shí)施例的壓縮圖像信號的方法的流程圖。首先,在操作S200,產(chǎn)生Lemer偽隨機(jī)數(shù)。假設(shè)將被檢查的點(diǎn)的數(shù)量為n,其中,η 為自然數(shù)。通過將1至η代入變量i來重復(fù)下面的操作。首先,在操作S205,將1代入i。在操作S210,從Lemer偽隨機(jī)序列選擇第i角度參數(shù)。在操作S220,如參照上面 的等式3所述,通過使用選擇的第i角度參數(shù)執(zhí)行DCT矩陣的行和列之間的部分互換。在操作S230,參照上面的等式5所述,通過使用修改的DCT矩陣D’,對圖像信號S 進(jìn)行DCT變換。在操作S240,壓縮DCT變換的圖像Y,以產(chǎn)生壓縮圖像CIi,在操作S250,獲取壓縮。然后,在操作S260,確定第i角度參數(shù)是否是第η點(diǎn)。在操作S260,如果沒有檢查 全部的η個點(diǎn),則在操作S270,通過將i加1來制定Lemer隨機(jī)序列中的下一位置,然后重 復(fù)操作S210至S260。否則,在操作S260,如果獲得全部η個點(diǎn)的壓縮率,則在操作S280,獲取具有最高 壓縮率Xp的P,在操作S290,存儲CIp和P,或者將CIp和P發(fā)送到解碼器。<示例性實(shí)施例可提供下面的優(yōu)點(diǎn)中的一個或多個>1.本發(fā)明的示例性實(shí)施例基于強(qiáng)的數(shù)學(xué)基礎(chǔ)。2.根據(jù)本發(fā)明的當(dāng)前示例性實(shí)施例的方法,平均增加6%的增益,并且在低比特 率時,增益最大增加16%。參照圖7和圖8,針對不同的QP和測試視頻序列,在8 X 8塊的 情況下,壓縮率平均增加6%,在4X4塊的情況下,壓縮率平均增加5. 25%。3.當(dāng)應(yīng)用本發(fā)明時,峰值信噪比(PSNR)的值非常高,其可能達(dá)到lOOdbs。因此, 可實(shí)現(xiàn)無損視頻編碼。4.可顯著減小量化誤差。<可選擇的示例性實(shí)施例>在本發(fā)明上面的示例性實(shí)施例中,在正交變換中使用歐拉角作為參數(shù)。然而,如上 所述,該參數(shù)不限于歐拉角。此外,通過一個整數(shù)來表示參數(shù)的組的技術(shù)不僅被應(yīng)用到基底的旋轉(zhuǎn),而且可以 被應(yīng)用到需要轉(zhuǎn)換額外信息的其他方法。排除開銷,可通過旋轉(zhuǎn)基底獲得的壓縮率的最高增加為大約20%。然而,由于開銷 的增加,壓縮率增加大約6%。因此,通過減小開銷,可將壓縮率增加大約20%。本發(fā)明還可被實(shí)施為計(jì)算機(jī)(包括具有信息處理功能的所有設(shè)備)可讀記錄介質(zhì) 上的計(jì)算機(jī)可讀代碼。所述計(jì)算機(jī)可讀記錄介質(zhì)可以是任何可存儲其后可以被計(jì)算機(jī)系統(tǒng) 讀取的數(shù)據(jù)的數(shù)據(jù)存儲設(shè)備。所述計(jì)算機(jī)可讀記錄介質(zhì)的示例包括只讀存儲器(ROM)、隨 機(jī)存取存儲器(RAM)、CD-ROM、磁帶、軟盤、光學(xué)數(shù)據(jù)存儲設(shè)備。
盡管已經(jīng)參照其示例性實(shí)施例具體顯示和描述了本發(fā)明,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,在不脫離權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下,可以對其進(jìn)行形式 和細(xì)節(jié)上的各種改變。示例性實(shí)施例應(yīng)僅被理解為描述性的而非限制性目的。因此,本發(fā) 明的范圍不是由本發(fā)明的詳細(xì)描述限定,而是由權(quán)利要求限定,該范圍內(nèi)的所有不同應(yīng)被 解釋為包括在本發(fā)明中。
權(quán)利要求
一種壓縮圖像信號的方法,所述方法包括執(zhí)行變換矩陣的行和列之間的部分互換;通過使用已經(jīng)執(zhí)行部分互換的變換矩陣來變換將被壓縮的圖像信號;壓縮變換的圖像信號;通過將多個值應(yīng)用到表示變換矩陣的行和列之間的部分互換的程度的角度參數(shù),通過重復(fù)執(zhí)行所述部分互換、對圖像信息進(jìn)行變換和壓縮變換的圖像信號來選擇與最高壓縮率相應(yīng)的角度參數(shù)。
2.如權(quán)利要求1所述的方法,其中,角度參數(shù)是歐拉角。
3.如權(quán)利要求1所述的方法,其中,執(zhí)行部分互換的步驟包括將與行之間的部分互換 相應(yīng)的矩陣左乘變換矩陣,將與列之間的部分互換相應(yīng)的矩陣右乘變換矩陣。
4.如權(quán)利要求3所述的方法,其中,與行之間的部分互換相應(yīng)的矩陣為 <formula>formula see original document page 2</formula>其中,A = cos α cos y -sin α cos β sin γ , B = -sin α cos γ -cos α cos β sin γ , C = sin β sin γ ,D = cos α sin γ +sin α cos β cos γ , E = -sin α sin γ +cos α cos β cos γ , F = -sin β cos γ , G = sin α sin β , H = cos α sin β , I = cos β,α、β和γ是歐拉角。
5.如權(quán)利要求1所述的方法,其中,選擇與最高壓縮率相應(yīng)的角度參數(shù)的步驟包括 針對角度參數(shù)產(chǎn)生隨機(jī)序列;通過針對隨機(jī)序列的每個值執(zhí)行行和列之間部分互換、圖像信號的變換和變換的圖像 信號的壓縮,來獲取圖像信號的壓縮率;從獲取的隨機(jī)序列的每個值的壓縮率中獲取最高壓縮率; 選擇與最高壓縮率相應(yīng)的角度參數(shù)的值。
6.如權(quán)利要求5所述的方法,還包括獲取隨機(jī)序列中的與最高壓縮率相應(yīng)的角度參數(shù)的值的編號; 存儲以最高壓縮率壓縮的圖像信號和隨機(jī)序列中相應(yīng)的編號,或者將以最高壓縮率壓 縮的圖像信號和隨機(jī)序列中相應(yīng)的編號發(fā)送到解碼器。
7.如權(quán)利要求5所述的方法,其中,產(chǎn)生的隨機(jī)序列是Lemer偽隨機(jī)數(shù)。
8.如權(quán)利要求1所述的方法,其中,選擇與最高壓縮率相應(yīng)的角度參數(shù)的步驟包括通 過使用蒙特卡羅方法重復(fù)執(zhí)行所述部分互換、變換圖像信號和壓縮變換的圖像信號。
9.如權(quán)利要求2所述的方法,其中,歐拉角具有接近0°或接近180°的值。
10.一種壓縮圖像信號的設(shè)備,所述設(shè)備包括 行和列互換器,執(zhí)行變換矩陣的行和列之間的部分互換;變換器,通過使用已經(jīng)執(zhí)行部分互換的變換矩陣來變換將被壓縮的圖像信號; 圖像壓縮器,壓縮變換的圖像信號;控制器,通過將多個值應(yīng)用到表示變換矩陣的行和列之間的部分互換的程度的角度參 數(shù),通過重復(fù)執(zhí)行行和列互換器、變換器和圖像壓縮器的操作來選擇與最高壓縮率相應(yīng)的 角度參數(shù)。
11.如權(quán)利要求10所述的設(shè)備,其中,角度參數(shù)是歐拉角。
12.如權(quán)利要求10所述的設(shè)備,其中,行和列互換器將與行之間的部分互換相應(yīng)的矩 陣左乘變換矩陣,將與列之間的部分互換相應(yīng)的矩陣右乘變換矩陣。
13.如權(quán)利要求12所述的設(shè)備,其中,與行之間的部分互換相應(yīng)的矩陣為 "A B C 0 “DEFO GHIO 0 0 0 1其中,A = cos α cos y -sin α cos β sin γ , B = -sin α cos γ -cos α cos β sin γ , C = sin β sin γ ,D = cos α sin γ +sin α cos β cos γ , E = -sin α sin γ +cos α cos β cos γ , F = -sin β cos γ , G = sin α sin β , H = cos α sin β , I = cos β,α、β和γ是歐拉角。
14.如權(quán)利要求10所述的設(shè)備,其中,控制器針對角度參數(shù)產(chǎn)生隨機(jī)序列;通過針對隨 機(jī)序列的每個值操作行和列互換器、變換器和圖像壓縮器,來獲取圖像信號的壓縮率;從獲 取的隨機(jī)序列的每個值的壓縮率中獲取最高壓縮率;選擇與最高壓縮率相應(yīng)的角度參數(shù)的值。
15.如權(quán)利要求14所述的設(shè)備,其中,控制器獲取隨機(jī)序列中的與最高壓縮率相應(yīng)的 角度參數(shù)的值的編號;存儲以最高壓縮率壓縮的圖像信號和隨機(jī)序列中相應(yīng)的編號,或者 將以最高壓縮率壓縮的圖像信號和隨機(jī)序列中相應(yīng)的編號發(fā)送到解碼器。
16.如權(quán)利要求14所述的設(shè)備,其中,產(chǎn)生的隨機(jī)序列是Lemer偽隨機(jī)數(shù)。
17.如權(quán)利要求10所述的設(shè)備,其中,通過使用蒙特卡羅方法重復(fù)行和列互換器、變換 器和圖像壓縮器的操作,來選擇與最高壓縮率相應(yīng)的角度參數(shù)。
18.如權(quán)利要求11所述的設(shè)備,其中,歐拉角具有接近0°或接近180°的值。
19.一種記錄有用于執(zhí)行壓縮圖像信號的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì),所述方法包括執(zhí)行變換矩陣的行和列之間的部分互換; 通過使用已經(jīng)執(zhí)行部分互換的變換矩陣來變換將被壓縮的圖像信號; 壓縮變換的圖像信號;通過將多個值應(yīng)用到表示變換矩陣的行和列之間的部分互換的程度的角度參數(shù),通過 重復(fù)執(zhí)行所述部分互換、對圖像信息進(jìn)行變換和壓縮變換的圖像信號來選擇與最高壓縮率 相應(yīng)的角度參數(shù)。
全文摘要
提供一種壓縮圖像信號的方法,以在具有最小量的開銷信息的同時提供比離散余弦(DCT)更有效的壓縮。通過將幾個值應(yīng)用到表示DCT矩陣的行和列之間的部分互換的程度的參數(shù),執(zhí)行DCT矩陣的行和列之間的部分互換。當(dāng)使用的角度參數(shù)的值按該值原樣被存儲或發(fā)送時,開銷增加。對產(chǎn)生角度參數(shù)的隨機(jī)序列、針對產(chǎn)生的隨機(jī)序列的每個角度參數(shù)產(chǎn)生壓縮系數(shù)矩陣以及計(jì)算壓縮率的處理進(jìn)行重復(fù),以獲取具有最高壓縮率的角度參數(shù)。不存儲或發(fā)送具有最高壓縮率的角度參數(shù),而是獲取相應(yīng)的角度參數(shù)的隨機(jī)序列中的編號,并進(jìn)行存儲或發(fā)送。
文檔編號H04N1/41GK101836430SQ200880112658
公開日2010年9月15日 申請日期2008年6月30日 優(yōu)先權(quán)日2007年10月24日
發(fā)明者亞歷山大·阿爾辛, 伊卡特利娜·內(nèi)斯特羅瓦, 埃琳娜·阿爾辛娜, 范迪姆·謝廖金, 馬克西姆·高羅替夫 申請人:三星電子株式會社