專利名稱:通過使用旋轉(zhuǎn)變換對圖像編碼和解碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
與示例性實(shí)施例一致的設(shè)備和方法涉及一種對圖像編碼和解碼的方法和設(shè)備,更具體地講,涉及一種對通過將圖像從像素域變換到頻域而產(chǎn)生的系數(shù)編碼和解碼的方法和設(shè)備。
背景技術(shù):
在大多數(shù)對圖像編碼和解碼的方法和設(shè)備中,像素域的圖像被變換到頻域,然后被編碼以壓縮圖像。離散余弦變換(DCT)是用于壓縮音頻/視頻(AV)數(shù)據(jù)的公知技術(shù)。近年來,已經(jīng)進(jìn)行了許多尋找更有效的編碼方法的嘗試。在音頻編碼中,參數(shù)編碼比DCT執(zhí)行的更好,并且在二維OD)數(shù)據(jù)中,Karhunen Loeve變換(KLT)具有最小比特大小但具有大的開銷大小。
發(fā)明內(nèi)容
技術(shù)方案示例性實(shí)施例解決至少以上問題和/或缺點(diǎn)以及以上未提及的其他缺點(diǎn)。此夕卜, 示例性實(shí)施例不需要克服上述缺點(diǎn),并且示例性實(shí)施例可以不克服上述任何問題。示例性實(shí)施例提供一種對圖像編碼和解碼的方法和設(shè)備以及一種記錄有用于執(zhí)行所述方法的計(jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介質(zhì)。有益效果根據(jù)本發(fā)明,可以以高壓縮率對預(yù)定塊的頻率系數(shù)矩陣編碼。
通過參照附圖對特定示例性實(shí)施例進(jìn)行描述,示例性實(shí)施例的以上和/或其他方面將變得更清楚,在附圖中圖1是根據(jù)示例性實(shí)施例的對圖像編碼的設(shè)備的框圖;圖2是根據(jù)示例性實(shí)施例的對圖像解碼的設(shè)備的框圖;圖3示出根據(jù)示例性實(shí)施例的分層編碼單元;圖4是根據(jù)示例性實(shí)施例的基于編碼單元的圖像編碼器的框圖;圖5是根據(jù)示例性實(shí)施例的基于編碼單元的圖像解碼器的框圖;圖6示出根據(jù)示例性實(shí)施例的最大編碼單元、子編碼單元和預(yù)測單元;圖7示出根據(jù)示例性實(shí)施例的編碼單元和變換單元;圖8A、圖8B、圖8C和圖8D示出根據(jù)示例性實(shí)施例的編碼單元、預(yù)測單元和變換單元的劃分形狀;圖9是根據(jù)另一示例性實(shí)施例的對圖像編碼的設(shè)備的框圖;圖10是根據(jù)示例性實(shí)施例的圖9中示出的第二變換器的框圖;圖11A、圖IlB和圖IlC是描述根據(jù)示例性實(shí)施例的旋轉(zhuǎn)變換(ROT)的示圖12示出根據(jù)示例性實(shí)施例的歐拉角;圖13示出根據(jù)示例性實(shí)施例的偽隨機(jī)點(diǎn);圖14是根據(jù)示例性實(shí)施例的對圖像解碼的設(shè)備的框圖;圖15是根據(jù)示例性實(shí)施例的圖14中示出的解碼器的框圖;圖16是根據(jù)示例性實(shí)施例的對圖像編碼的方法的流程圖;圖17是根據(jù)示例性實(shí)施例的對圖像解碼的方法的流程圖。最佳模式根據(jù)示例性實(shí)施例的一方面,提供了一種對圖像編碼的方法,所述方法包括通過將預(yù)定塊變換到頻域來產(chǎn)生第一頻率系數(shù)矩陣;確定第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù);基于確定結(jié)果,通過根據(jù)角度參數(shù)選擇性地、部分地交換第一頻率系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)來產(chǎn)生第二頻率系數(shù)矩陣;基于確定結(jié)果,選擇性地對第二頻率系數(shù)矩陣編碼,其中,角度參數(shù)指示在行中的至少一個(gè)之間的部分交換的程度或列中的至少一個(gè)之間的部分交換的程度。確定的步驟可包括確定第一頻率系數(shù)矩陣是否包括非零系數(shù)。確定的步驟還可包括確定所述預(yù)定塊是否是雙向預(yù)測的像條(B像條)的塊。確定的步驟還可包括確定所述預(yù)定塊是否是通過執(zhí)行幀內(nèi)預(yù)測而預(yù)測的塊。選擇性地編碼的步驟可包括如果第一頻率系數(shù)矩陣包括非零系數(shù),則量化第二頻率系數(shù)矩陣;對量化的第二頻率系數(shù)矩陣以及關(guān)于角度參數(shù)的信息進(jìn)行熵編碼。根據(jù)示例性實(shí)施例的另一方面,提供一種對圖像解碼的方法,所述方法包括對指示預(yù)定塊的第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)的信息解碼;基于解碼的信息,選擇性地對第二頻率系數(shù)矩陣的數(shù)據(jù)解碼;基于解碼的信息,通過根據(jù)角度參數(shù)選擇性地、部分地交換第二頻率系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)來恢復(fù)第一頻率系數(shù)矩陣;通過將第一頻率系數(shù)矩陣變換到像素域來恢復(fù)所述預(yù)定塊,其中,角度參數(shù)指示在行中的至少一個(gè)之間的部分交換的程度或列中的至少一個(gè)之間的部分交換的程度。根據(jù)示例性實(shí)施例的另一方面,提供一種對圖像編碼的設(shè)備,所述設(shè)備包括第一變換器,通過將預(yù)定塊變換到頻域來產(chǎn)生第一頻率系數(shù)矩陣;第二變換器,確定第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù),并基于確定結(jié)果,通過根據(jù)角度參數(shù)選擇性地、 部分地交換第一頻率系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)來產(chǎn)生第二頻率系數(shù)矩陣;編碼器,基于確定結(jié)果,選擇性地對第二頻率系數(shù)矩陣編碼,其中,角度參數(shù)指示在行中的至少一個(gè)之間的部分交換的程度或列中的至少一個(gè)之間的部分交換的程度。根據(jù)示例性實(shí)施例的另一方面,提供一種對圖像解碼的設(shè)備,所述設(shè)備包括解碼器,對指示預(yù)定塊的第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)的信息解碼,并基于解碼的信息,選擇性地對第二頻率系數(shù)矩陣的數(shù)據(jù)解碼;第一逆變換器,基于解碼的信息,通過根據(jù)角度參數(shù)選擇性地、部分地交換第二頻率系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)來恢復(fù)第一頻率系數(shù)矩陣;第二逆變換器,通過將第一頻率系數(shù)矩陣變換到像素域來恢復(fù)所述預(yù)定塊,其中,角度參數(shù)指示在行中的至少一個(gè)之間的部分交換的程度或列中的至少一個(gè)之間的部分交換的程度。根據(jù)示例性實(shí)施例的另一方面,提供一種記錄有用于執(zhí)行圖像編碼方法和/或圖像解碼方法的計(jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介質(zhì)。
具體實(shí)施例方式以下參照附圖更詳細(xì)地描述特定示例性實(shí)施例。當(dāng)在元素的列表之前時(shí),諸如 "...中的至少一個(gè)”的描述修飾整個(gè)元素的列表,而非修飾列表的各個(gè)元素。在本說明書中,“圖像”可表示視頻的靜止圖像或者運(yùn)動(dòng)圖像(即,視頻本身)。在以下描述中,即使在不同的附圖中,相同的附圖標(biāo)號也用于相同的元件。提供在描述中定義的內(nèi)容(諸如詳細(xì)結(jié)構(gòu)和元件)以幫助全面地理解示例性實(shí)施例。然而,可以在沒有那些具體定義的內(nèi)容的情況下實(shí)施示例性實(shí)施例。圖1是根據(jù)示例性實(shí)施例的對圖像編碼的圖像編碼設(shè)備100的框圖。圖像編碼設(shè)備100可實(shí)現(xiàn)為硬件設(shè)備,例如,計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的處理器。圖像編碼設(shè)備100還可實(shí)現(xiàn)為駐存在計(jì)算機(jī)系統(tǒng)上的軟件模塊。參照圖1,圖像編碼設(shè)備100包括最大編碼單元?jiǎng)澐制?10、編碼深度確定器120、 圖像數(shù)據(jù)編碼器130和編碼信息編碼器140,其中,最大編碼單元?jiǎng)澐制?10、編碼深度確定器120、圖像數(shù)據(jù)編碼器130和編碼信息編碼器140可實(shí)現(xiàn)為例如與圖像編碼設(shè)備100集成的硬件或軟件模塊或者與圖像編碼設(shè)備100分離的硬件或軟件模塊。最大編碼單元?jiǎng)澐制?10可基于作為最大大小的編碼單元的最大編碼單元對當(dāng)前幀或像條(slice)進(jìn)行劃分。即,最大編碼單元?jiǎng)澐制?10可將當(dāng)前幀或像條劃分為至少一個(gè)最大編碼單元。根據(jù)示例性實(shí)施例,編碼單元可使用最大編碼單元和深度來表征。如上所述,最大編碼單元指示在當(dāng)前幀的編碼單元中具有最大大小的編碼單元,深度指示分層地減小編碼單元的程度。隨著深度增大,編碼單元可從最大編碼單元減小到最小編碼單元,其中,最大編碼單元的深度被定義為最小深度,最小編碼單元的深度被定義為最大深度。因?yàn)榫幋a單元的大小隨著深度的增大從最大編碼單元開始減小,所以第k深度的子編碼單元可包括第 (k+n)深度的多個(gè)子編碼單元(k和η是大于或等于1的整數(shù))。根據(jù)將被編碼的幀的大小的增加,以更大的編碼單元對圖像編碼可引起更高的圖像壓縮率。然而,如果更大的編碼單元被固定,則不可通過反映不斷改變的圖像特征來有效地對圖像編碼。例如,當(dāng)對諸如海面或天空的平滑區(qū)域編碼時(shí),編碼單元越大,壓縮率可增加的越多。然而,當(dāng)對諸如人或建筑物的復(fù)雜區(qū)域編碼時(shí),編碼單元越小,壓縮率可增加的越多。因此,在示例性實(shí)施例中,針對每個(gè)幀或像條設(shè)置不同的最大圖像編碼單元以及不同的最大深度。因?yàn)樽畲笊疃缺硎揪幋a單元可減小的最大次數(shù),所以包括在最大圖像編碼單元中的每個(gè)最小編碼單元的大小可根據(jù)最大深度被可變地設(shè)置??舍槍γ總€(gè)幀或像條,或者針對每個(gè)最大編碼單元,不同地確定最大深度。編碼深度確定器120確定最大編碼單元的劃分形狀。可基于率失真(RD)代價(jià)的計(jì)算來確定劃分形狀。最大編碼單元的確定的劃分形狀被提供給編碼信息編碼器140,根據(jù)最大編碼單元的圖像數(shù)據(jù)被提供給圖像數(shù)據(jù)編碼器130。最大編碼單元可根據(jù)不同深度被劃分為具有不同大小的子編碼單元,包括在最大編碼單元中的具有不同大小的子編碼單元可基于具有不同大小的處理單元被預(yù)測或被頻率變換。換句話說,圖像編碼設(shè)備100可基于具有各種大小和各種形狀的處理單元執(zhí)行多個(gè)用于圖像編碼的處理操作。為了對圖像數(shù)據(jù)編碼,執(zhí)行諸如預(yù)測、變換和熵編碼的處理操作,其中,可針對每個(gè)操作使用具有相同大小或不同大小的處理單元。例如,圖像編碼設(shè)備100可選擇與編碼單元不同的處理單元來預(yù)測編碼單元。當(dāng)編碼單元的大小是2NX2N(其中,N是正整數(shù))時(shí),用于預(yù)測的處理單元可以是 2NX2N、2NXN、NX2N和NXN。換句話說,可基于具有這樣的形狀的處理單元來執(zhí)行運(yùn)動(dòng)預(yù)測編碼單元的高度和寬度中的至少一個(gè)被二等分。以下,作為預(yù)測基礎(chǔ)的處理單元被定義為預(yù)測單元。預(yù)測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個(gè),并且可僅對具有特定大小或特定形狀的預(yù)測單元執(zhí)行特定的預(yù)測模式。例如,可僅對具有2NX2N和NXN 的大小的預(yù)測單元(其具有正方形形狀)執(zhí)行幀內(nèi)模式。此外,可僅對具有2NX2N的大小的預(yù)測單元執(zhí)行跳躍模式。如果在編碼單元中存在多個(gè)預(yù)測單元,則在對每個(gè)預(yù)測單元執(zhí)行預(yù)測之后,可選擇具有最小預(yù)測誤差的預(yù)測模式??蛇x擇地,圖像編碼設(shè)備100可基于具有與編碼單元不同大小的處理單元對圖像數(shù)據(jù)執(zhí)行頻率變換。對于編碼單元中的頻率變換,可基于具有等于或小于編碼單元的大小的大小的處理單元來執(zhí)行頻率變換。以下,作為頻率變換基礎(chǔ)的處理單元被定義為變換單元。頻率變換可以是離散余弦變換(DCT)或Karhunen Loeve變換(KLT)。編碼深度確定器120可通過使用基于拉格朗日乘數(shù)的RD最優(yōu)化來確定包括在最大編碼單元中的子編碼單元。換句話說,編碼深度確定器120可確定從最大編碼單元?jiǎng)澐值亩鄠€(gè)子編碼單元具有哪種形狀,其中,所述多個(gè)子編碼單元根據(jù)子編碼單元的深度而具有不同大小。圖像數(shù)據(jù)編碼器130通過基于編碼深度確定器120確定的劃分形狀對最大編碼單元編碼來輸出比特流。編碼信息編碼器140對關(guān)于由編碼深度確定器120確定的最大編碼單元的編碼模式的信息編碼。換句話說,編碼信息編碼器140通過對關(guān)于最大編碼單元的劃分形狀的信息、關(guān)于最大深度的信息以及關(guān)于每個(gè)深度的子編碼單元的編碼模式的信息編碼來輸出比特流。關(guān)于子編碼單元的編碼模式的信息可包括關(guān)于子編碼單元的預(yù)測單元的信息、關(guān)于每個(gè)預(yù)測單元的預(yù)測模式的信息以及關(guān)于子編碼單元的變換單元的信息。關(guān)于最大編碼單元的劃分形狀的信息可以是指示每個(gè)編碼單元是否被劃分的標(biāo)志信息。例如,當(dāng)最大編碼單元被劃分和編碼時(shí),指示最大編碼單元是否被劃分的信息被編碼。此外,當(dāng)從最大編碼單元?jiǎng)澐值淖泳幋a單元被劃分和編碼時(shí),指示子編碼單元是否被劃分的信息被編碼。因?yàn)閷τ诿總€(gè)最大編碼單元存在具有不同大小的子編碼單元,并且針對每個(gè)子編碼單元確定關(guān)于編碼模式的信息,所以針對一個(gè)最大編碼單元可確定關(guān)于至少一個(gè)編碼模式的信息。圖像編碼設(shè)備100可通過根據(jù)深度的增加將最大編碼單元的高度和寬度二等分來產(chǎn)生子編碼單元。即,當(dāng)?shù)趉深度的編碼單元的大小是2NX2N時(shí),第(k+Ι)深度的編碼單元的大小是NXN。因此,圖像編碼設(shè)備100可考慮圖像特征,基于最大編碼單元的大小和最大深度, 確定每個(gè)最大編碼單元的最佳劃分形狀。通過考慮圖像特征來可變地調(diào)整最大編碼單元的大小并通過將最大編碼單元?jiǎng)澐譃椴煌疃鹊淖泳幋a單元來對圖像編碼,具有各種分辨率
7的圖像可以被更有效地編碼。圖2是根據(jù)示例性實(shí)施例的對圖像解碼的圖像解碼設(shè)備200的框圖。圖像解碼設(shè)備200可實(shí)現(xiàn)為硬件設(shè)備,例如,計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的處理器。圖像解碼設(shè)備200還可實(shí)現(xiàn)為駐存在計(jì)算機(jī)系統(tǒng)上的軟件模塊。參照圖2,圖像解碼設(shè)備200包括圖像數(shù)據(jù)獲取單元210、編碼信息提取器220和圖像數(shù)據(jù)解碼器230,圖像數(shù)據(jù)獲取單元210、編碼信息提取器220和圖像數(shù)據(jù)解碼器230 可實(shí)現(xiàn)為例如與圖像解碼設(shè)備200集成的硬件或軟件模塊或與圖像解碼設(shè)備200分離的硬件或軟件模塊。圖像數(shù)據(jù)獲取單元210通過解析由圖像解碼設(shè)備200接收的比特流獲取根據(jù)最大編碼單元的圖像數(shù)據(jù),并將圖像數(shù)據(jù)輸出到圖像數(shù)據(jù)解碼器230。圖像數(shù)據(jù)獲取單元210可從當(dāng)前幀或像條的頭提取關(guān)于當(dāng)前幀或像條的最大編碼單元的信息。換句話說,圖像數(shù)據(jù)獲取單元210按照最大編碼單元?jiǎng)澐直忍亓?,從而圖像數(shù)據(jù)解碼器230可根據(jù)最大編碼單元來對圖像數(shù)據(jù)解碼。編碼信息提取器220通過解析由圖像解碼設(shè)備200接收的比特流,從當(dāng)前幀的頭提取關(guān)于最大編碼單元、最大深度、最大編碼單元的劃分形狀、子編碼單元的編碼模式的信息。關(guān)于劃分形狀的信息和關(guān)于編碼模式的信息被提供給圖像數(shù)據(jù)解碼器230。關(guān)于最大編碼單元的劃分形狀的信息可包括關(guān)于根據(jù)深度具有不同大小并且被包括在最大編碼單元中的子編碼單元的信息,并且可以是指示每個(gè)編碼單元是否被劃分的標(biāo)志信息。關(guān)于編碼模式的信息可包括關(guān)于根據(jù)子編碼單元的預(yù)測單元的信息、關(guān)于預(yù)測模式的信息以及關(guān)于變換單元的信息。圖像數(shù)據(jù)解碼器230通過基于由編碼信息提取器220提取的信息對每個(gè)最大編碼單元的圖像數(shù)據(jù)解碼來恢復(fù)當(dāng)前幀。圖像數(shù)據(jù)解碼器230可基于關(guān)于最大編碼單元的劃分形狀的信息對包括在最大編碼單元中的子編碼單元解碼。解碼處理可包括預(yù)測處理(包括幀內(nèi)預(yù)測和運(yùn)動(dòng)補(bǔ)償)以及逆變換處理。圖像數(shù)據(jù)解碼器230可基于關(guān)于預(yù)測單元的信息和關(guān)于對預(yù)測單元進(jìn)行預(yù)測的預(yù)測模式的信息執(zhí)行幀內(nèi)預(yù)測或幀間預(yù)測。圖像數(shù)據(jù)解碼器230還可基于關(guān)于子編碼單元的變換單元的信息對每個(gè)子編碼單元執(zhí)行逆變換。圖3示出根據(jù)示例性實(shí)施例的分層編碼單元。參照圖3,分層編碼單元可包括寬度和高度為64X64、32X32、16X16、8X8和 4X4的編碼單元。除了具有完全正方形形狀的這些編碼單元以外,還可存在寬度和高度為 64X32、32X64、32X16、16X32、16X8、8X16、8X4 和 4X8 的編碼單元。參照圖3,對于分辨率為1920 X 1080的圖像數(shù)據(jù)組310,最大編碼單元的大小被設(shè)置為64X64,最大深度被設(shè)置為2。對于分辨率為1920X1080的圖像數(shù)據(jù)組320,最大編碼單元的大小被設(shè)置為 64X64,最大深度被設(shè)置為3。對于分辨率為352X288的圖像數(shù)據(jù)組330,最大編碼單元的大小被設(shè)置為16 X 16,最大深度被設(shè)置為1。當(dāng)分辨率高或者數(shù)據(jù)量大時(shí),編碼單元的最大大小可以被設(shè)置為相對大,以增加壓縮率并更精確地反映圖像特征。因此,對于具有比圖像數(shù)據(jù)組330更高的分辨率的圖像數(shù)據(jù)組310和320,64X64可被選為最大編碼單元的大小。最大深度指示分層編碼單元中層的總數(shù)。因?yàn)閳D像數(shù)據(jù)組310的最大深度為2,所以圖像數(shù)據(jù)組310的編碼單元315根據(jù)深度的增加可包括較長的軸大小為64的最大編碼單元以及較長的軸大小為32和16的子編碼單元。另一方面,因?yàn)閳D像數(shù)據(jù)組330的最大深度為1,所以圖像數(shù)據(jù)組330的編碼單元 335根據(jù)深度的增加可包括較長的軸大小為16的最大編碼單元以及較長的軸大小為8的子
編碼單元。然而,因?yàn)閳D像數(shù)據(jù)組320的最大深度為3,所以圖像數(shù)據(jù)組320的編碼單元325 根據(jù)深度的增加可包括較長的軸大小為64的最大編碼單元以及較長的軸大小為32、16、8 和4的子編碼單元。因?yàn)殡S著深度增加基于更小的子編碼單元來對圖像編碼,所以示例性實(shí)施例適合于對包括更小場景的圖像編碼。圖4是根據(jù)示例性實(shí)施例的基于編碼單元的圖像編碼器400的框圖。圖像編碼器 400可實(shí)現(xiàn)為硬件設(shè)備(例如,計(jì)算機(jī)的處理器)或?qū)崿F(xiàn)為駐存在計(jì)算機(jī)系統(tǒng)上的軟件模塊。幀內(nèi)預(yù)測單元410對當(dāng)前幀405中的幀內(nèi)模式的預(yù)測單元執(zhí)行幀內(nèi)預(yù)測,運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425通過使用當(dāng)前幀405以及參考幀495對幀間模式的預(yù)測單元執(zhí)行幀間估計(jì)和運(yùn)動(dòng)補(bǔ)償。幀內(nèi)預(yù)測單元410、運(yùn)動(dòng)估計(jì)器420、運(yùn)動(dòng)補(bǔ)償器425和參考幀495 可實(shí)現(xiàn)為例如集成在圖像編碼器400內(nèi)的硬件或軟件模塊或與圖像編碼器400分離的硬件或軟件模塊?;趶膸瑑?nèi)預(yù)測單元410、運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425輸出的預(yù)測單元產(chǎn)生殘差值。產(chǎn)生的殘差值經(jīng)由變換器430和量化器440被輸出為量化的變換系數(shù)。通過逆量化器460和逆變換器470將量化的變換系數(shù)恢復(fù)為殘差值,恢復(fù)的殘差值通過去塊單元480和環(huán)路濾波器490被后處理并作為參考幀495被輸出。可通過熵編碼器450將量化的變換系數(shù)輸出為比特流455。為了執(zhí)行根據(jù)示例性實(shí)施例的基于編碼方法的編碼,圖像編碼器400的幀內(nèi)預(yù)測單元410、運(yùn)動(dòng)估計(jì)器420、運(yùn)動(dòng)補(bǔ)償器425、變換器430、量化器440、熵編碼器450、逆量化器460、逆變換器470、去塊單元480和環(huán)路濾波器490基于最大編碼單元、根據(jù)深度的子編碼單元、預(yù)測單元和變換單元執(zhí)行圖像編碼處理。圖5是根據(jù)示例性實(shí)施例的基于編碼單元的圖像解碼器500的框圖。圖像解碼器 500可實(shí)現(xiàn)為硬件設(shè)備(例如,計(jì)算機(jī)的處理器)或?qū)崿F(xiàn)為駐存在計(jì)算機(jī)系統(tǒng)上的軟件模塊。比特流505經(jīng)過解析器510,從而解碼所需的編碼信息和將被解碼的編碼圖像數(shù)據(jù)被解析。編碼圖像數(shù)據(jù)經(jīng)由熵解碼器520和逆量化器530被輸出為逆量化的數(shù)據(jù),并通過逆變換器540被恢復(fù)為殘差值。殘差值與幀內(nèi)預(yù)測器550的幀內(nèi)預(yù)測結(jié)果或運(yùn)動(dòng)補(bǔ)償器 560的運(yùn)動(dòng)補(bǔ)償結(jié)果相加,從而根據(jù)編碼單元來恢復(fù)殘差值?;謴?fù)的編碼單元經(jīng)過去塊單元570和環(huán)路濾波器580被用于預(yù)測下一編碼單元或下一幀。解析器510、熵解碼器520、 逆量化器530、逆變換器M0、幀內(nèi)預(yù)測器550、補(bǔ)償器560、解塊單元570和環(huán)路濾波器580 可實(shí)現(xiàn)為例如集成在圖像解碼器500內(nèi)的硬件或軟件模塊或與圖像解碼器500分離的硬件或軟件模塊。為了執(zhí)行基于根據(jù)示例性實(shí)施例的解碼方法的解碼,圖像解碼器500的解析器 510、熵解碼器520、逆量化器530、逆變換器M0、幀內(nèi)預(yù)測單元550、運(yùn)動(dòng)補(bǔ)償器560、去塊單元570和環(huán)路濾波器580基于最大編碼單元、根據(jù)深度的子編碼單元、預(yù)測單元和變換單元執(zhí)行圖像解碼處理。具體地講,幀內(nèi)預(yù)測單元550和運(yùn)動(dòng)補(bǔ)償器560通過考慮最大編碼單元和深度來確定子編碼單元中的預(yù)測單元和預(yù)測模式,并且逆變換器540通過考慮變換單元的大小來執(zhí)行逆變換。圖6示出根據(jù)示例性實(shí)施例的最大編碼單元、子編碼單元和預(yù)測單元。圖1中示出的圖像編碼設(shè)備100和圖2中示出的圖像解碼設(shè)備200考慮到圖像特征,使用分層編碼單元來執(zhí)行編碼和解碼??筛鶕?jù)圖像特征自適應(yīng)地設(shè)置最大編碼單元和最大深度,或者可根據(jù)用戶的需求不同地設(shè)置最大編碼單元和最大深度。在圖6中,分層編碼單元結(jié)構(gòu)600具有最大編碼單元610并且最大深度為4,其中, 最大編碼單元610是高度和寬度為64的最大編碼單元。深度沿著分層編碼單元結(jié)構(gòu)600 的縱軸增加,并且隨著深度增加,子編碼單元620到650的高度和寬度減小。最大編碼單元 610和子編碼單元620到650的預(yù)測單元沿著分層編碼單元結(jié)構(gòu)600的橫軸被示出。最大編碼單元610具有深度0以及編碼單元的大小(或高度和寬度)64X 64。深度沿著縱軸增加,并且存在大小為32X32且深度為1的第一子編碼單元620、大小為16X16 且深度為2的第二子編碼單元630、大小為8X8且深度為3的第三子編碼單元640以及大小為4X4且深度為4的最小編碼單元650。大小為4X4且深度為4的最小編碼單元650 是最小編碼單元,并且最小編碼單元可被劃分為預(yù)測單元,每個(gè)預(yù)測單元小于最小編碼單兀。參照圖6,根據(jù)每個(gè)深度沿著橫軸示出預(yù)測單元的示例。S卩,深度為0的最大編碼單元610的預(yù)測單元可以是大小等于最大編碼單元的大小64X64的預(yù)測單元,或者大小為 64X32的預(yù)測單元612、大小為32X64的預(yù)測單元614或大小為32X32的預(yù)測單元616, 其中,預(yù)測單元612、614、616的大小小于最大編碼單元的大小(即,64X 64)。大小為32X32且深度為1的第一子編碼單元620的預(yù)測單元可以是大小等于第一子編碼單元的大小32X32的預(yù)測單元,或者大小為32X16的預(yù)測單元622、大小為 16X32的預(yù)測單元擬4或大小為16X16的預(yù)測單元626,其中,預(yù)測單元622、624、626的大小小于第一子編碼單元620的大小(即,32 X 32)。大小為16X16且深度為2的第二子編碼單元630的預(yù)測單元可以是大小等于第二子編碼單元630的大小16X16的預(yù)測單元,或者大小為16X8的預(yù)測單元632、大小為 8X16的預(yù)測單元634或大小為8X8的預(yù)測單元636,其中,預(yù)測單元632、634、636的大小小于第二子編碼單元630的大小(S卩,16 X 16)。大小為8X8且深度為3的第三子編碼單元640的預(yù)測單元可以是大小等于第三子編碼單元640的大小8 X 8的預(yù)測單元,或者大小為8 X 4的預(yù)測單元642、大小為4 X 8的預(yù)測單元644或大小為4X4的預(yù)測單元646,其中,預(yù)測單元642、644、646的大小小于第三子編碼單元630的大小(即,8X8)。大小為4X4且深度為4的最小編碼單元650是最小編碼單元和最大深度的編碼單元。最小編碼單元650的預(yù)測單元可以是大小為4X4的預(yù)測單元650、大小為4X2的預(yù)測單元652、大小為2X4的預(yù)測單元6M或大小為2X2的預(yù)測單元656。圖7示出根據(jù)示例性實(shí)施例的編碼單元和變換單元。圖1中示出的圖像編碼設(shè)備100和圖2中示出的圖像解碼設(shè)備200使用最大編碼單元自身來執(zhí)行編碼和解碼,或者使用從最大編碼單元?jiǎng)澐值牡扔诨蛐∮谧畲缶幋a單元的子編碼單元來執(zhí)行編碼和解碼。在編碼和解碼處理中,用于頻率變換的變換單元的大小被選擇為不大于相應(yīng)的編碼單元的大小。例如,如果當(dāng)前編碼單元710具有大小64X64,則可使用具有大小32X32的變換單元來執(zhí)行頻率變換。圖8A、圖8B、圖8C和圖8D示出根據(jù)示例性實(shí)施例的編碼單元、預(yù)測單元和變換單元的劃分形狀。圖8A和圖8B示出根據(jù)示例性實(shí)施例的編碼單元和預(yù)測單元。圖8A示出圖1中示出的圖像編碼設(shè)備100選擇的用于對最大編碼單元810編碼的劃分形狀。圖像編碼設(shè)備100將最大編碼單元810劃分為各種形狀,執(zhí)行編碼,并通過基于RD代價(jià)對各種劃分形狀的編碼結(jié)果進(jìn)行相互比較來選擇最佳劃分形狀。當(dāng)將被編碼的最大編碼單元810就是最佳時(shí),可對最大編碼單元810編碼,而無需如圖8A至圖8D所示來劃分最大編碼單元810。參照圖8A,通過將深度為0的最大編碼單元810劃分為深度等于或大于1的子編碼單元來對最大編碼單元810編碼。即,最大編碼單元810被劃分為四個(gè)深度為1的子編碼單元,所有或部分深度為1的子編碼單元被劃分為深度為2的子編碼單元814、816、818、 828,850 和 852。在深度為1的子編碼單元中位于右上方的子編碼單元和位于左下方的子編碼單元被劃分為深度等于或大于2的子編碼單元。部分深度等于或大于2的子編碼單元可被劃分為深度等于或大于3的子編碼單元820、822、824、826、830、832、840、842、844、846和848。圖8B示出最大編碼單元810的預(yù)測單元的劃分形狀。參照圖8B,最大編碼單元810的預(yù)測單元860可以與最大編碼單元810不同地被劃分。換句話說,每個(gè)子編碼單元的預(yù)測單元可小于相應(yīng)的子編碼單元。例如,在深度為1的子編碼單元812、邪4中位于右下方的子編碼單元854的預(yù)測單元可小于子編碼單元854。此外,深度為2的子編碼單元814、816、818、828、850和852中的子編碼單元814、816、850和852的預(yù)測單元可分別小于子編碼單元814、816、850和852。此外,深度為3的子編碼單元822、832和848的預(yù)測單元可分別小于子編碼單元 822、832和848。預(yù)測單元可具有這樣的形狀各個(gè)子編碼單元沿著高度或?qū)挾鹊姆较虮欢确郑蛘哳A(yù)測單元可具有這樣的形狀各個(gè)子編碼單元沿著高度和寬度的方向被四等分。圖8C和圖8D示出根據(jù)示例性實(shí)施例的預(yù)測單元和變換單元。圖8C示出圖8B中示出的最大編碼單元810的預(yù)測單元的劃分形狀,圖8D示出最大編碼單元810的變換單元的劃分形狀。參照圖8D,變換單元870的劃分形狀可與預(yù)測單元860不同地被設(shè)置。例如,即使深度為1的子編碼單元邪4的預(yù)測單元被選擇為這樣的形狀子編碼單元854的高度被二等分,變換單元也可被選擇為子編碼單元854的原始大小。同樣地,即使深度為2的子編碼單元814和850的預(yù)測單元被選擇為這樣的形狀子編碼單元814和850中的每個(gè)的高度被二等分,變換單元也可被選擇為與子編碼單元814和850中的每個(gè)的原始大小相同的大小。變換單元可以被選擇為比預(yù)測單元更小的大小。例如,當(dāng)深度為2的子編碼單元 852的預(yù)測單元被選擇為這樣的形狀子編碼單元852的寬度被二等分時(shí),變換單元可被選擇為這樣的形狀子編碼單元852沿著高度和寬度的方向被四等分,從而具有比預(yù)測單元的形狀更小的大小。圖9是根據(jù)另一示例性實(shí)施例的對圖像編碼的圖像編碼設(shè)備900的框圖。圖9中示出的圖像編碼設(shè)備900可以是包括在圖1中示出的圖像編碼設(shè)備100或圖4中示出的圖像編碼器400中的模塊,用于執(zhí)行以下圖像編碼處理。參照圖9,圖像編碼設(shè)備900包括第一變換器910、第二變換器920和編碼器930。第一變換器910通過接收預(yù)定塊并將預(yù)定塊變換到頻域來產(chǎn)生第一頻率系數(shù)矩陣。到頻域的變換可以是DCT,并且接收的預(yù)定塊可以是殘差塊。此外,被輸入的用于編碼的塊可以是如上關(guān)于圖7或圖8D描述的變換單元。作為變換的結(jié)果,接收的像素域的塊被變換為頻域的系數(shù)。通過對像素域的塊執(zhí)行DCT來產(chǎn)生DCT系數(shù)矩陣。第二變換器920執(zhí)行后處理,以根據(jù)頻域的系數(shù)是否大于預(yù)定的絕對值來部分地交換DCT系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)。以下參照圖10、圖IlA至圖IlC 詳細(xì)描述第二變換器920的操作。圖10是根據(jù)示例性實(shí)施例的圖9中示出的第二變換器920的框圖。參照圖10,第二變換器920包括確定器1010和旋轉(zhuǎn)變換(ROT)執(zhí)行器1020。確定器1010確定由第一變換器910產(chǎn)生的第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)。確定器1010可確定第一頻率系數(shù)矩陣是否包括絕對值大于0的系數(shù)。換句話說,確定器1010確定第一頻率系數(shù)矩陣是否包括非零系數(shù)。如果第一頻率系數(shù)矩陣僅包括系數(shù)0,則不執(zhí)行用于部分地交換第一頻率系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)的ROT。因此,確定器1010確定第一頻率系數(shù)矩陣是否包括非零系數(shù)。如果預(yù)測被準(zhǔn)確地執(zhí)行并且因此殘差塊的所有像素值都是0,則第一頻率系數(shù)矩陣僅包括系數(shù)0。確定器1010還可確定第一頻率系數(shù)矩陣是否是雙向預(yù)測的像條(B像條)的塊的矩陣。實(shí)驗(yàn)證明,即使在執(zhí)行ROT之后,B像條的塊的第一頻率系數(shù)矩陣在壓縮率方面也不會(huì)明顯改善。因此,確定器1010可確定第一頻率系數(shù)矩陣是否是B像條的塊的矩陣,從而僅在輸入到圖像編碼設(shè)備900的用于編碼的預(yù)定塊不是B像條的塊時(shí)才執(zhí)行ROT。確定器1010還可確定第一頻率系數(shù)矩陣是否是幀內(nèi)預(yù)測的塊的矩陣。實(shí)驗(yàn)證明, 即使在執(zhí)行ROT之后,幀間預(yù)測的塊的第一頻率系數(shù)矩陣在壓縮率方面也不會(huì)明顯改善。 因此,確定器1010可確定第一頻率系數(shù)矩陣是否是幀內(nèi)預(yù)測的塊的矩陣,從而僅在輸入到圖像編碼設(shè)備900的用于編碼的預(yù)定塊是幀內(nèi)預(yù)測的塊時(shí)才執(zhí)行ROT。確定第一頻率系數(shù)矩陣是否包括絕對值大于0的系數(shù)、確定輸入的用于編碼的預(yù)定塊是否是B像條的塊、以及確定輸入的用于編碼的預(yù)定塊是否是幀內(nèi)預(yù)測的塊的執(zhí)行順序不受限制,而可以任意排列。此外,確定器1010可執(zhí)行以上確定中的一個(gè)或兩個(gè),以確定是否執(zhí)行ROT。ROT執(zhí)行器1020通過基于確定器1010的確定結(jié)果選擇性地執(zhí)行ROT來產(chǎn)生第二頻率系數(shù)矩陣。ROT可以是用于部分地交換行中的至少一個(gè)或列中的至少一個(gè)的變換。以下參照圖IlA至圖IlC詳細(xì)地描述ROT。可僅在第一頻率系數(shù)矩陣包括絕對值大于預(yù)定值或零時(shí)才執(zhí)行ROT。否則,不執(zhí)行R0T,并且對第一頻率系數(shù)矩陣本身編碼??蛇x擇地,如上所述,可基于確定輸入的用于編碼的塊是否是B像條的塊和/或確定塊是否是幀內(nèi)預(yù)測的塊,選擇性地對第一頻率系數(shù)矩陣執(zhí)行ROT。圖IlA至圖IlC是描述根據(jù)示例性實(shí)施例的ROT的示圖。圖10中示出的ROT執(zhí)行器1020基于確定器1010的確定結(jié)果,選擇性地、部分地交換第一頻率系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)。參照圖IlA至圖IlC描述第一頻率系數(shù)矩陣的行或列的交換。在示例性實(shí)施例中,行或列的部分交換涉及通過使用諸如正弦函數(shù)的函數(shù)部分地交換兩行或兩列的值,而不是無條件地、一一對應(yīng)地交換兩行或兩列的值。例如,可如等式1所示根據(jù)參數(shù)α的值來定義兩行A和B的交換。[等式1]行A(新)=cos(a) X 行 A(舊)-sin(a) X 行 B(舊)行B(新)=sin(a) X 行A(舊)+cos(a) X 行 B(舊)參照等式1,參數(shù)α用作角度。因此,在示例性實(shí)施例中,指示DCT矩陣的行之間的部分交換的程度或列之間的部分交換的程度的參數(shù)被定義為角度參數(shù)。如果參數(shù)α的值是0°,則不執(zhí)行能量交換。如果參數(shù)α的值是90°,則在行之間發(fā)生全部能量交換。此外,如果參數(shù)α的值大于90°且小于180°,則在行之間發(fā)生能量交換并且元素值的符號改變。如果參數(shù)α的值是180°,則在行之間不發(fā)生能量交換,而包括在行中的元素的符號改變。在示例性實(shí)施例中,以與行之間的部分交換相同的方式來執(zhí)行列之間的部分交換。圖1IA示出對4X 4頻率系數(shù)矩陣執(zhí)行ROT的情況。參照圖11A,在頻率系數(shù)矩陣的行之間的部分交換中使用三個(gè)參數(shù)α ρ α 2、a 3,在列之間的部分交換中使用三個(gè)參數(shù)α 4、
a5、a60圖IlB示出對8X8頻率系數(shù)矩陣執(zhí)行ROT的情況。在圖IlB的情況下,在行之間的部分交換中使用αι、α2、α3、α4、α5、α 6,在列之間的部分交換中使用α 7、α 8、α 9、
QQQ
10、 11、 12°圖IlC示出對具有等于或大于16X 16的大小的頻率系數(shù)矩陣執(zhí)行ROT的情況。如上所述,關(guān)于圖IlA和圖11B,隨著頻率系數(shù)矩陣的大小的增加,角度參數(shù)的數(shù)量增加。為了對圖IlA的4X4頻率系數(shù)矩陣執(zhí)行R0T,使用六個(gè)角度參數(shù),為了對圖IlB的 8X8頻率系數(shù)矩陣執(zhí)行R0T,使用十二個(gè)角度參數(shù)。雖然以這樣的方式來提高壓縮率通過對頻率系數(shù)矩陣執(zhí)行ROT而產(chǎn)生調(diào)整的頻率系數(shù)矩陣,然后對調(diào)整的頻率系數(shù)矩陣執(zhí)行量化和熵編碼的方式,但是如果角度參數(shù)的數(shù)量增加使得開銷增加,則總的數(shù)據(jù)量沒有減少。因此,當(dāng)對具有等于或大于16X16的大小的頻率系數(shù)矩陣執(zhí)行ROT時(shí),使用用于系數(shù)采樣的預(yù)定大小的矩陣。換句話說,如圖IlC所示,ROT執(zhí)行器1020選擇僅包括頻率系數(shù)矩陣1110的部分系數(shù)的采樣的頻率系數(shù)矩陣1120,然后對選擇的頻率系數(shù)矩陣1120執(zhí)行ROT。對頻率系數(shù)
13矩陣1110的剩余的、未選擇的部分1130不執(zhí)行ROT。為了對具有大的大小的頻率系數(shù)矩陣達(dá)到足夠的ROT效果,包括在頻率系數(shù)矩陣 1120中的系數(shù)應(yīng)該對圖像數(shù)據(jù)的壓縮具有影響。因此,ROT執(zhí)行器1020僅選擇具有低頻分量并且可具有除了 0以外的值的系數(shù),并對所述系數(shù)執(zhí)行ROT。通常,作為變換的結(jié)果產(chǎn)生的頻率系數(shù)矩陣在頻率系數(shù)矩陣的左上角包括關(guān)于低頻分量的系數(shù)。因此,如圖IlC所示,ROT執(zhí)行器1020僅選擇位于頻率系數(shù)矩陣1110的左上角的系數(shù),然后執(zhí)行ROT。在圖IlC的示例中,ROT執(zhí)行器1020以與關(guān)于圖IlB的ROT相同的方式對具有8X8大小的頻率系數(shù)矩陣1120執(zhí)行ROT。參照對于圖IlA的4X4頻率系數(shù)矩陣的R0T,根據(jù)三個(gè)角度系數(shù)α ^ α 2、α 3的應(yīng)用順序獲得不同結(jié)果。即,三個(gè)角度參數(shù)不是彼此獨(dú)立的。作為對首先應(yīng)用角度參數(shù)Q1 然后應(yīng)用角度參數(shù)α 2的情況執(zhí)行ROT的結(jié)果產(chǎn)生的調(diào)整的頻率系數(shù)矩陣不同于對首先應(yīng)用角度參數(shù)α 2然后應(yīng)用角度參數(shù)α工的情況執(zhí)行ROT的結(jié)果產(chǎn)生的調(diào)整的頻率系數(shù)矩陣。 以下將參照圖12對此進(jìn)行詳細(xì)描述。圖12是示出根據(jù)另一示例性實(shí)施例的歐拉角的示圖。參照圖12,矩陣的行之間的交換或列之間的交換與三維(3D)空間中的坐標(biāo)軸的旋轉(zhuǎn)相似。即,三行或三列分別對應(yīng)于3D坐標(biāo)的X軸、Y軸、Z軸。針對3D空間中的坐標(biāo)軸的旋轉(zhuǎn),根據(jù)哪個(gè)軸首先旋轉(zhuǎn)而獲得不同的結(jié)果。在圖12中,α、β、Y角指示歐拉角,X軸、Y軸、Z軸指示旋轉(zhuǎn)之前的坐標(biāo)軸,X’ 軸、Y’軸、Ζ’軸指示旋轉(zhuǎn)之后的坐標(biāo)軸。N軸是X-Y平面和X’-Y’平面之間的交叉。這里, N軸被稱為交點(diǎn)線。角α指示X軸和圍繞Z軸旋轉(zhuǎn)的N軸之間的角。角β指示Z軸和圍繞N軸旋轉(zhuǎn)的Ζ’軸之間的角。角Y指示N軸和圍繞Ζ’軸旋轉(zhuǎn)的X’軸之間的角。通過等式2給出根據(jù)歐拉角的坐標(biāo)軸的旋轉(zhuǎn)。[等式2]
COS
I
I第一個(gè)矩陣指示圍繞Ζ’軸的旋轉(zhuǎn)。第二個(gè)矩陣指示圍繞N軸的旋轉(zhuǎn)。第三個(gè)矩陣指示圍繞Z軸的旋轉(zhuǎn)。在一個(gè)或多個(gè)示例性實(shí)施例中,矩陣的行之間的交換或列之間的交換可通過使用歐拉角被表示為坐標(biāo)軸的旋轉(zhuǎn)。返回參照圖9和圖10,第二變換器920的ROT執(zhí)行器1020對第一頻率系數(shù)矩陣執(zhí)行ROT時(shí)產(chǎn)生的第二頻率系數(shù)矩陣被輸入到編碼器930。編碼器930對通過基于確定器1010的確定結(jié)果選擇性地執(zhí)行ROT而產(chǎn)生的第二
頻率系數(shù)矩陣編碼。如果通過基于確定器1010的確定結(jié)果對第一頻率系數(shù)矩陣執(zhí)行ROT而產(chǎn)生第二頻率系數(shù)矩陣,則包括在第二頻率系數(shù)矩陣中的系數(shù)根據(jù)預(yù)定的量化步驟被量化,并且量化的第二頻率系數(shù)矩陣被熵編碼。根據(jù)上下文自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC)方法或上下文自適應(yīng)可變長度編碼(CAVLC)方法來執(zhí)行熵編碼。如果第一頻率系數(shù)矩陣具有大的大小,從而對僅包括部分采樣的系數(shù)的選擇的矩陣1120執(zhí)行R0T,則包括被執(zhí)行ROT的選擇的矩陣1120以及未被執(zhí)行ROT的剩余的部分1130的整個(gè)第一頻率系數(shù)矩陣可被量化和熵編碼。編碼器930可對指示第一頻率系數(shù)矩陣包括絕對值大于預(yù)定值的系數(shù)的信息編碼。例如,編碼器930可對指示第一頻率系數(shù)矩陣包括非零系數(shù)的標(biāo)志信息編碼。此外,編碼器930還對當(dāng)?shù)诙儞Q器920執(zhí)行ROT時(shí)使用的角度參數(shù)進(jìn)行熵編碼。 如下所述,圖像編碼設(shè)備900確定用于執(zhí)行ROT的最優(yōu)角度參數(shù)。為了有效地執(zhí)行壓縮,需要確定最優(yōu)角度參數(shù)。然而,這是一個(gè)具有依賴參數(shù)的強(qiáng)非平滑的多參數(shù)問題。為了解決這個(gè)問題,使用蒙特卡洛(Monte Carlo)方法。這里, Lehmer的隨機(jī)序列數(shù)可用于在蒙特卡洛方法中產(chǎn)生隨機(jī)點(diǎn)??蓛H存儲(chǔ)或發(fā)送指示序列數(shù)的一個(gè)整數(shù),而不存儲(chǔ)或發(fā)送用作參數(shù)的角度參數(shù)。因此,可減小向解碼器通知在ROT中使用的角度參數(shù)所需的開銷。S卩,確定最優(yōu)角度參數(shù)的組合而將被考慮的內(nèi)容是變換矩陣的可逆變換;多個(gè)有效編碼的能量的重新排列;以及通過使用Lehmer的隨機(jī)序列數(shù)添加的信息的最小化。返回參照圖IlA至圖11C,通過頻率系數(shù)矩陣的旋轉(zhuǎn)被修改的矩陣部分是黑色,沒有被修改的矩陣部分是白色。在圖IlA的4X4頻率系數(shù)矩陣中,在根據(jù)行之間的交換和列之間的交換的十五個(gè)系數(shù)的修改中涉及六個(gè)角度參數(shù)。在圖IlB的8X8頻率系數(shù)矩陣中, 在六十個(gè)系數(shù)的修改中涉及十二個(gè)角度參數(shù)。參照圖11A,對于行之間的交換,使用三個(gè)角度參數(shù),對于列之間的交換,另外使用三個(gè)角度參數(shù)。因此,對于4X4塊,使用六個(gè)角度參數(shù)。參照圖11B,對于行之間的交換,使用六個(gè)角度參數(shù),對于列之間的交換,另外使用六個(gè)角度參數(shù)。因此,對于8X8塊,使用十二個(gè)角度參數(shù)。圖像編碼設(shè)備900可根據(jù)以下步驟來執(zhí)行ROT 步驟1 正交變換族參數(shù)化;步驟2:蒙特卡洛方法;步驟3 =Lehmer的偽隨機(jī)數(shù);步驟4 最優(yōu)角度參數(shù)的范圍的定位;步驟5:準(zhǔn)最優(yōu)基。雖然通過使用ROT提高了圖像的壓縮率,但是如果添加了太多的參數(shù),則視頻信號的傳輸與壓縮相比,可實(shí)現(xiàn)更好的結(jié)果。換句話說,壓縮率和附加參數(shù)的開銷之間存在著權(quán)衡。例如,雖然4X4頻率系數(shù)矩陣中的圖像信號被壓縮到接近0的大小,但是如果壓縮需要十六個(gè)附加參數(shù),則執(zhí)行ROT可能不是最優(yōu)的。在這一點(diǎn)上,將十六個(gè)像素值發(fā)送到解碼器可能更高效。因此,圖像信號的壓縮和增加的開銷的最小化二者將被考慮。因此,ROT執(zhí)行器1020根據(jù)以下步驟,在將開銷最小化的同時(shí)搜索最優(yōu)角度參數(shù)。步驟1 正交變換族參數(shù)化。為了選擇用于當(dāng)前數(shù)據(jù)的最優(yōu)變換,搜索基調(diào)整?;男D(zhuǎn)被選擇為基修改,從而旋轉(zhuǎn)角的集合唯一地描述了基修改。引入的旋轉(zhuǎn)角以與歐拉角描述3D空間中立方體的旋轉(zhuǎn)相似的方式來描述基修改。為了修改基,選擇基的旋轉(zhuǎn)。在一個(gè)或多個(gè)示例性實(shí)施例中,通過使用角度參數(shù)來執(zhí)行基的旋轉(zhuǎn)。這里,采用通過使用角度參數(shù)執(zhí)行的基的旋轉(zhuǎn)。角度參數(shù)可以是歐拉角。然而,角度參數(shù)不限于歐拉角,因此可包括可指示矩陣的行之間和列之間的一個(gè)或多個(gè)值的部分交換的等級的其他形式。以下,描述涉及使用歐拉角的示例。通過使用頻率系數(shù)矩陣D的左乘Rh iz。ntal和右乘RVCTti。al的等式3來定義旋轉(zhuǎn)。[等式3]D,= RhoriZontalXDX RverticalD’指示旋轉(zhuǎn)變換的調(diào)整的頻率系數(shù)矩陣。矩陣Rtoizmtal執(zhí)行頻率系數(shù)矩陣D的行之間的交換。RVCTti。al執(zhí)行頻率系數(shù)矩陣D 的列之間的交換。通過等式4給出4X4塊的矩陣Rh iz。ntal的示例。[等式4]
H
r'-c·、A = cos α cos γ -sin α cos β sin γB = -sin α cos y -cos α cos β sin γC = sin^ sin γD = cos α sin y +sin α cos β cos γE = -sin α sin y +cos α cos β cos γF = -sin^ cos γG = sin α sin βH =cos α sin βI = cos^在等式4中,α、β、Y指示歐拉角。因此,關(guān)于4X4頻率系數(shù)矩陣,歐拉角通過一組六個(gè)參數(shù)αι、Ci2.....Ci6描述
十五個(gè)頻率系數(shù)的調(diào)整。關(guān)于8X8頻率系數(shù)矩陣,十二個(gè)歐拉角αι、Ci2.....Ci12描述
六十個(gè)頻率系數(shù)的修改。步驟2:蒙特卡洛方法在自由程度被減少到六個(gè)角度參數(shù)(在8X8頻率系數(shù)矩陣的情況下是十二個(gè)角度參數(shù))后,考慮到節(jié)省比特來檢查優(yōu)化情況。即,以下討論選擇一組角度參數(shù)的方法被優(yōu)化。優(yōu)化在高維域的參數(shù)(六個(gè)或十二個(gè)角度參數(shù))被使用方面存在困難,并且圖像的壓縮是依賴于使用的參數(shù)的非平滑形式。通常,通過使用蒙特卡洛方法來解決這個(gè)困難。蒙特卡洛方法的核心是執(zhí)行多個(gè)嘗試。即,從若干個(gè)點(diǎn)測量壓縮率,然后選擇最優(yōu)點(diǎn)。在蒙特卡洛方法中,多維域中的隨機(jī)點(diǎn)的質(zhì)量非常重要(特別地,質(zhì)量根據(jù)維的估計(jì)而更重要)。本申請的均勻網(wǎng)格點(diǎn)上的偽隨機(jī)點(diǎn)的優(yōu)選方式是公知的。將參照2D情況在圖 13中對此進(jìn)行描述。圖13示出根據(jù)另一示例性實(shí)施例的偽隨機(jī)點(diǎn)。圖13的左側(cè)視圖示出第一的十六個(gè)均勻網(wǎng)格點(diǎn),圖13的右側(cè)視圖示出第一的十六個(gè)偽隨機(jī)點(diǎn)。在使用均勻網(wǎng)格點(diǎn)的情況下,不管蒙特卡洛方法的十六個(gè)點(diǎn),針對第一參數(shù)(和第二參數(shù))僅檢查四個(gè)不同的值。另一方面,在使用偽隨機(jī)點(diǎn)的情況下,針對第一參數(shù)(和第二參數(shù))根據(jù)十六個(gè)點(diǎn)來檢查十六個(gè)不同的值。即,當(dāng)使用偽隨機(jī)點(diǎn)時(shí),針對十六個(gè)點(diǎn)充分地檢查第一參數(shù)和第二參數(shù)的各個(gè)值。具體地講,關(guān)于蒙特卡洛方法,根據(jù)參數(shù)數(shù)量的增加,偽隨機(jī)點(diǎn)的使用比均勻網(wǎng)格點(diǎn)的使用更有利。步驟3 =Lehmer的偽隨機(jī)數(shù)可通過使用各種方法來產(chǎn)生偽隨機(jī)序列。最高效的方法之一是使用Lehmer數(shù)。這是人工產(chǎn)生的序列,其具有非常接近于均勻分布的隨機(jī)數(shù)的特性。用于產(chǎn)生Lehmer序列的算法是公知的,因此這里省略其詳細(xì)描述。根據(jù)示例性實(shí)施例,提供至少1013個(gè)不重復(fù)的點(diǎn)。Lehmer序列是人工產(chǎn)生的序列,用于產(chǎn)生Lehmer序列的算法是公知的,從而解碼器可容易地重新計(jì)算Lehmer序列。通過使用Lehmer序列,可通過使用一個(gè)整數(shù)(即,隨機(jī)序列中的一個(gè)數(shù))來對角度參數(shù)的組合編碼。在六維(在4X4頻率系數(shù)矩陣的情況下)或十二維(在8X8頻率系數(shù)矩陣的情況下)參數(shù)域中,產(chǎn)生與角度參數(shù)的組合相應(yīng)的隨機(jī)點(diǎn),在通過使用隨機(jī)點(diǎn)執(zhí)行壓縮之后測量壓縮率,然后選擇最優(yōu)參數(shù)點(diǎn)。存儲(chǔ)或發(fā)送與最優(yōu)參數(shù)點(diǎn)相應(yīng)的Lehmer序列的索引號,而不存儲(chǔ)或發(fā)送角度參數(shù)的組合。如果在蒙特卡洛方法中檢查2p個(gè)點(diǎn),則僅包括ρ比特的信息作為開銷。步驟4 最優(yōu)角度參數(shù)的范圍的定位根據(jù)一個(gè)或多個(gè)示例性實(shí)施例,最優(yōu)旋轉(zhuǎn)角度具有接近0度或180度的值(π弧度)。這意味著用于變換到頻域的基(例如DCT基或KLT基)實(shí)質(zhì)上是最優(yōu)的。因此,根據(jù)一個(gè)或多個(gè)示例性實(shí)施例的角度參數(shù)僅用于執(zhí)行行之間或列之間的一個(gè)或多個(gè)值的部分交換(在歐拉角的情況下接近于0度的角),或者用于執(zhí)行部分交換以及基元素的符號的改變(在歐拉角的情況下接近于180度的角)。即,在一個(gè)或多個(gè)示例性實(shí)施例中使用的參數(shù)的范圍可惜被限制到域的特定部分,并且該限制被稱為定位。通過執(zhí)行參數(shù)的范圍的定位,關(guān)于開銷的比特?cái)?shù)減少。如果假設(shè)將被檢查的點(diǎn)限制到圖13的特定部分,則將被檢查以搜索角度參數(shù)的最優(yōu)組合的點(diǎn)的數(shù)量減小。此外,如果將被檢查的點(diǎn)的數(shù)量固定(即,在用作開銷的比特?cái)?shù)被固定的情況下),并且應(yīng)用了定位,則可檢查更小角度中的更多的點(diǎn),從而可增加壓縮率。步驟5 準(zhǔn)最優(yōu)基
通過執(zhí)行上述步驟1至步驟4,可針對所有塊(具有等于或大于4 X 4和8 X 8的大小的塊)選擇最優(yōu)基。當(dāng)比特率降低時(shí),優(yōu)選地選擇準(zhǔn)最優(yōu)基。準(zhǔn)最優(yōu)基表示相同的旋轉(zhuǎn)被應(yīng)用于包括在像條或畫面中的所有變換單元的組或部分變換單元。如果最優(yōu)旋轉(zhuǎn)被應(yīng)用到每個(gè)塊,則針對圖像的壓縮率增加,而開銷也增加。為了確定變換單元、一組變換單元、像條和畫面中的哪個(gè)單元被應(yīng)用相同的旋轉(zhuǎn), 可執(zhí)行各種實(shí)驗(yàn)。在以低比特率變換到頻域之后,頻率系數(shù)矩陣的多個(gè)部分的量化系數(shù)值變?yōu)?。因此,針對頻率系數(shù)矩陣的所述多個(gè)部分,不需要執(zhí)行ROT和發(fā)送關(guān)于旋轉(zhuǎn)角度值的附加信肩、ο圖像編碼設(shè)備900通過使用蒙特卡洛方法對多個(gè)角度參數(shù)的組合執(zhí)行R0T,并重復(fù)執(zhí)行量化和熵編碼,從而確定角度參數(shù)的最優(yōu)組合。此外,圖像編碼設(shè)備900不對角度參數(shù)編碼,而是將Lehmer的偽隨機(jī)序列數(shù)編碼為關(guān)于確定的角度參數(shù)的最優(yōu)組合的信息。這里,通過使用定位和準(zhǔn)優(yōu)化基,可以以更高的效率來對關(guān)于角度參數(shù)的信息編碼。返回參照圖9和圖10,如果第二變換器920基于確定器1010的確定結(jié)果,不通過對第一頻率系數(shù)矩陣執(zhí)行ROT來產(chǎn)生第二頻率系數(shù)矩陣,則編碼器930對未執(zhí)行ROT的第一頻率系數(shù)矩陣本身編碼。此外,如果第一頻率系數(shù)矩陣僅包括系數(shù)0,則第一頻率系數(shù)矩陣不需要被編碼, 并且僅對指示輸入的預(yù)定塊的第一頻率系數(shù)矩陣僅包括系數(shù)0的信息(例如,標(biāo)志信息) 編碼。圖14是根據(jù)另一示例性實(shí)施例的對圖像解碼的圖像解碼設(shè)備1400的框圖。圖14中示出的圖像解碼設(shè)備1400可以是包括在圖2中示出的圖像解碼設(shè)備200 或圖5中示出的圖像解碼器500中的用于執(zhí)行圖像解碼處理的模塊。參照圖14,圖像解碼設(shè)備1400包括解碼器1410、第一逆變換器1420和第二逆變換器1430。解碼器1410接收比特流,并對指示通過將預(yù)定塊變換到頻域而產(chǎn)生的第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)的信息解碼。例如,解碼器1410可對指示第一頻率系數(shù)矩陣是否包括非零系數(shù)的標(biāo)志信息解碼。其后,解碼器1410基于解碼的信息選擇性地對第二頻率系數(shù)矩陣的數(shù)據(jù)解碼。第二頻率系數(shù)矩陣是通過對第一頻率系數(shù)矩陣執(zhí)行ROT而產(chǎn)生的矩陣。參照圖15詳細(xì)描述解碼器1410的操作。圖15是根據(jù)示例性實(shí)施例的圖14中示出的解碼器1410的框圖。參照圖15,解碼器1410包括確定器1510和熵解碼器1520。確定器1510基于解碼的信息(例如,指示第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)的信息),確定是否對第二頻率系數(shù)矩陣解碼。確定器1510基于指示第一頻率系數(shù)矩陣是否包括非零系數(shù)的標(biāo)志信息,確定是否對第二頻率系數(shù)矩陣解碼。如上關(guān)于圖10所述,如果第一頻率系數(shù)矩陣僅包括頻域系數(shù)0,則在編碼處理中不對第一頻率系數(shù)矩陣執(zhí)行ROT。因此,第二頻率系數(shù)矩陣的數(shù)據(jù)不包括在比特流中。在這種情況下,解碼器1410不需要對第二頻率系數(shù)矩陣的數(shù)據(jù)解碼。然而,如果第一頻率系數(shù)矩陣包括大于0的系數(shù),則通過對第一頻率系數(shù)矩陣執(zhí)行ROT而產(chǎn)生的第二頻率系數(shù)矩陣的數(shù)據(jù)包括在比特流中,因此解碼器1410必須對第二頻率系數(shù)矩陣的數(shù)據(jù)解碼。熵解碼器1520基于確定器1510的確定結(jié)果選擇性地對第二頻率系數(shù)矩陣的數(shù)據(jù)進(jìn)行熵解碼。如果第一頻率系數(shù)矩陣包括絕對值大于預(yù)定值的系數(shù),因此對第一頻率系數(shù)矩陣執(zhí)行R0T,則第二頻率系數(shù)矩陣的數(shù)據(jù)包括在比特流中。熵解碼器1520對包括在比特流中的第二頻率系數(shù)矩陣的數(shù)據(jù)進(jìn)行熵解碼。與熵編碼相同,可根據(jù)CABAC方法或CAVLC 方法來執(zhí)行熵解碼。此外,為了執(zhí)行逆R0T,熵解碼器1520可對關(guān)于用于執(zhí)行ROT的角度參數(shù)的信息解碼。由熵解碼器1520進(jìn)行熵解碼的第二頻率系數(shù)矩陣根據(jù)在編碼處理中執(zhí)行的預(yù)定的量化步驟被逆量化。返回參照圖14,第一逆變換器1420通過對由解碼器1410進(jìn)行逆量化的第二頻率系數(shù)矩陣執(zhí)行逆ROT來產(chǎn)生第一頻率系數(shù)矩陣。如果第一頻率系數(shù)矩陣包括非零系數(shù),并因此解碼器1410對第二頻率系數(shù)矩陣的數(shù)據(jù)解碼,則第一逆變換器1420通過對第二頻率系數(shù)矩陣執(zhí)行逆ROT來產(chǎn)生第一頻率系數(shù)矩陣。此外,如上關(guān)于圖10所述,僅當(dāng)?shù)谝活l率系數(shù)矩陣不是B像條的塊的矩陣,或者第一頻率系數(shù)矩陣是幀內(nèi)預(yù)測的塊的矩陣時(shí),第一逆變換器1420才通過對第二頻率系數(shù)矩陣執(zhí)行逆ROT來產(chǎn)生第一頻率系數(shù)矩陣。第一逆變換器1420通過逆向執(zhí)行以上關(guān)于圖IlA至圖11C、圖12和圖13描述的 R0T,對逆量化的第二頻率系數(shù)矩陣執(zhí)行逆ROT。在這種情況下,可參照由解碼器1410進(jìn)行熵解碼的關(guān)于角度參數(shù)的信息來執(zhí)行逆ROT。根據(jù)關(guān)于角度參數(shù)的信息通過部分地交換第二頻率系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)來產(chǎn)生第一頻率系數(shù)矩陣。如果在編碼處理中對僅包括第一頻率系數(shù)矩陣的部分采樣的系數(shù)的矩陣執(zhí)行 ROT,則通過對僅包括部分采樣的系數(shù)的矩陣執(zhí)行逆ROT來產(chǎn)生第一頻率系數(shù)矩陣。第二逆變換器1430從第一逆變換器1420接收第一頻率系數(shù)矩陣,并對接收的第一頻率系數(shù)矩陣執(zhí)行逆頻率變換。可通過逆向執(zhí)行DCT來對第一頻率系數(shù)矩陣執(zhí)行逆頻率變換。作為逆頻率變換的結(jié)果,像素域的預(yù)定塊被恢復(fù)。圖16是根據(jù)示例性實(shí)施例的對圖像編碼的方法的流程圖。參照圖16,在操作1610中,圖像編碼設(shè)備通過將預(yù)定塊變換到頻域來產(chǎn)生第一頻率系數(shù)矩陣。圖像編碼設(shè)備接收預(yù)定塊,執(zhí)行DCT,從而產(chǎn)生包括DCT系數(shù)的第一頻率系數(shù)矩陣。在操作1620中,圖像編碼設(shè)備確定在操作1610中產(chǎn)生的第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)。圖像編碼設(shè)備可確定第一頻率系數(shù)矩陣是否包括絕對值大于0的系數(shù)。此外,圖像編碼設(shè)備還可確定輸入的用于編碼的塊是否是B像條的塊,并確定輸入的用于編碼的塊是否是幀內(nèi)預(yù)測的塊。在操作1630中,圖像編碼設(shè)備基于操作1620的確定結(jié)果,通過選擇性地、部分地交換第一頻率系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)來產(chǎn)生第二頻率系數(shù)矩陣。通過如上關(guān)于圖IlA至圖11C、圖12和圖13所述對第一頻率系數(shù)矩陣執(zhí)行ROT來產(chǎn)生第二頻率系數(shù)矩陣。如果第一頻率系數(shù)矩陣具有大的大小,例如,大小等于或大于16X16,則可選擇僅包括第一頻率系數(shù)矩陣的部分采樣的系數(shù)的矩陣,并可僅對選擇的矩陣執(zhí)行ROT。當(dāng)選擇僅包括部分采樣的系數(shù)的矩陣時(shí),可選擇僅包括低頻分量的系數(shù)的矩陣。在操作1640中,圖像編碼設(shè)備基于操作1620的確定結(jié)果,選擇性地對第二頻率系數(shù)矩陣編碼。如果在操作1630中,基于操作1620的確定結(jié)果通過執(zhí)行ROT來產(chǎn)生第二頻率系數(shù)矩陣,則圖像編碼設(shè)備對產(chǎn)生的第二頻率系數(shù)矩陣編碼。圖像編碼設(shè)備根據(jù)預(yù)定的量化步驟量化第二頻率系數(shù)矩陣,并對量化的第二頻率系數(shù)矩陣進(jìn)行熵編碼。根據(jù)CABAC方法或CAVLC方法來執(zhí)行熵編碼。在操作1640中,圖像編碼設(shè)備還對關(guān)于用于在操作1630中部分地交換行中的至少一個(gè)或列中的至少一個(gè)的角度參數(shù)的信息編碼。角度參數(shù)是指示在行中的至少一個(gè)之間的部分交換的程度或列中的至少一個(gè)之間的部分交換的程度的參數(shù)。此外,圖像編碼設(shè)備還可對指示第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)的信息編碼。例如,圖像編碼設(shè)備可對指示第一頻率系數(shù)矩陣是否包括非零系數(shù)的標(biāo)志信息編碼。圖像編碼設(shè)備還可重復(fù)地執(zhí)行操作1630和1640,以組合多個(gè)角度參數(shù),從而確定最優(yōu)角度參數(shù)。圖像編碼設(shè)備對多個(gè)角度參數(shù)的組合重復(fù)地編碼,以選擇具有最佳壓縮率的角度參數(shù)。可通過使用上述的蒙特卡洛方法來選擇多個(gè)角度參數(shù)的組合,并且所述多個(gè)角度參數(shù)的組合可對應(yīng)于Lehmer的偽隨機(jī)數(shù)。當(dāng)使多個(gè)角度參數(shù)的組合對應(yīng)于Lehmer的偽隨機(jī)數(shù)時(shí),在操作1640中被編碼的關(guān)于角度參數(shù)的信息可以是與確定的最優(yōu)角度參數(shù)相應(yīng)的Lehmer的偽隨機(jī)序列的數(shù)。圖17是根據(jù)示例性實(shí)施例的對圖像解碼的方法的流程圖。參照圖17,在操作1710中,圖像解碼設(shè)備接收預(yù)定塊的比特流,并對指示預(yù)定塊的第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)的信息解碼。圖像解碼設(shè)備可對指示第一頻率系數(shù)矩陣是否包括大于0的系數(shù)的標(biāo)志信息解碼。如上關(guān)于圖16所述,在編碼處理時(shí),僅當(dāng)?shù)谝活l率系數(shù)矩陣包括非零參數(shù)時(shí),才通過對第一頻率系數(shù)矩陣執(zhí)行ROT產(chǎn)生第二頻率系數(shù)矩陣,并且隨后對第二頻率系數(shù)矩陣進(jìn)行熵編碼。因此,為了確定是否對第二頻率系數(shù)矩陣的數(shù)據(jù)進(jìn)行熵編碼,首先對指示第一頻率系數(shù)矩陣是否包括絕對值大于0的系數(shù)的信息解碼。通過對第一頻率系數(shù)矩陣執(zhí)行 ROT來產(chǎn)生第二頻率系數(shù)矩陣。在操作1720中,圖像解碼設(shè)備基于在操作1710中解碼的信息對第二頻率系數(shù)矩陣解碼。基于在操作1710中解碼的信息,僅當(dāng)?shù)谝活l率系數(shù)矩陣包括絕對值大于預(yù)定值的系數(shù)時(shí),圖像解碼設(shè)備才對第二頻率系數(shù)矩陣的數(shù)據(jù)進(jìn)行熵解碼,并對熵解碼的第二頻率系數(shù)矩陣的系數(shù)進(jìn)行逆量化。根據(jù)在圖像編碼處理中使用的量化步驟來對第二頻率系數(shù)矩陣的系數(shù)進(jìn)行逆量化。在操作1730中,圖像解碼設(shè)備通過部分地交換在操作1720中解碼的第二頻率系數(shù)矩陣的行中的至少一個(gè)或列中的至少一個(gè)來產(chǎn)生第一頻率系數(shù)矩陣。圖像解碼設(shè)備通過參照在操作1710中熵解碼的關(guān)于角度參數(shù)的信息,逆向執(zhí)行以上關(guān)于圖IlA至圖11C、圖 12和圖13描述的ROT來產(chǎn)生第一頻率系數(shù)矩陣。如上關(guān)于圖14所述,如果在編碼處理中對僅包括第一頻率系數(shù)矩陣的部分采樣的系數(shù)的矩陣執(zhí)行R0T,則通過對僅包括部分采樣的系數(shù)的矩陣執(zhí)行逆ROT來產(chǎn)生第一頻率系數(shù)矩陣。在操作1740中,圖像解碼設(shè)備對在操作1730中產(chǎn)生的第一頻率系數(shù)矩陣執(zhí)行逆頻率變換。圖像解碼設(shè)備通過對第一頻率系數(shù)矩陣執(zhí)行逆DCT來恢復(fù)像素域的塊。如上所述,根據(jù)示例性實(shí)施例,可以以高壓縮率基于數(shù)學(xué)方法來對頻率系數(shù)矩陣編碼,從而總的圖像壓縮率可顯著提高。盡管已經(jīng)參照附圖具體示出和描述了示例性實(shí)施例,但是示例性實(shí)施例可實(shí)現(xiàn)為計(jì)算機(jī)可讀記錄介質(zhì)上的計(jì)算機(jī)可讀代碼。例如,在圖1、圖2、圖4、圖5、圖9、圖10、圖14或圖15中示出的圖像編碼設(shè)備或圖像解碼設(shè)備或者圖像編碼器或圖像解碼器可包括連接到設(shè)備或編碼器的每個(gè)單元的總線、連接到該總線并用于執(zhí)行命令的至少一個(gè)處理器、以及連接到該總線以存儲(chǔ)命令、接收的消息和產(chǎn)生的消息的存儲(chǔ)器。計(jì)算機(jī)可讀記錄介質(zhì)是可存儲(chǔ)其后能夠由計(jì)算機(jī)系統(tǒng)讀取的數(shù)據(jù)的任何數(shù)據(jù)存儲(chǔ)裝置。計(jì)算機(jī)可讀記錄介質(zhì)的示例包括只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、 ⑶-ROM、磁帶、軟盤和光學(xué)數(shù)據(jù)存儲(chǔ)裝置。計(jì)算機(jī)可讀記錄介質(zhì)還可分布在聯(lián)網(wǎng)的計(jì)算機(jī)系統(tǒng)上,從而以分布方式存儲(chǔ)和執(zhí)行計(jì)算機(jī)可讀代碼。上述示例性實(shí)施例和優(yōu)點(diǎn)僅是示例性的,并不被解釋為限制性的。本教導(dǎo)可容易地應(yīng)用于其他類型的設(shè)備。此外,示例性實(shí)施例的描述旨在說明性目的,而非限制權(quán)利要求的范圍,許多替換方式、修改和變型對于本領(lǐng)域技術(shù)人員來說將是明顯的。
權(quán)利要求
1.一種對圖像編碼的方法,所述方法包括通過將預(yù)定塊變換到頻域來產(chǎn)生第一頻率系數(shù)矩陣; 確定第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù);基于確定結(jié)果,通過根據(jù)角度參數(shù)選擇性地、部分地交換第一頻率系數(shù)矩陣的行中的至少一個(gè)和列中的至少一個(gè)來產(chǎn)生第二頻率系數(shù)矩陣; 基于確定結(jié)果,選擇性地對第二頻率系數(shù)矩陣編碼,其中,角度參數(shù)指示在行中的至少一個(gè)之間的部分交換的程度和列中的至少一個(gè)之間的部分交換的程度。
2.如權(quán)利要求1所述的方法,其中,確定的步驟包括確定第一頻率系數(shù)矩陣是否包括非零系數(shù)。
3.如權(quán)利要求2所述的方法,其中,確定的步驟還包括確定所述預(yù)定塊是否是雙向預(yù)測的像條的塊。
4.如權(quán)利要求2所述的方法,其中,確定的步驟還包括確定所述預(yù)定塊是否是通過執(zhí)行幀內(nèi)預(yù)測而預(yù)測的塊。
5.如權(quán)利要求2所述的方法,其中,選擇性地編碼的步驟包括 如果第一頻率系數(shù)矩陣包括非零系數(shù),則量化第二頻率系數(shù)矩陣; 對量化的第二頻率系數(shù)矩陣以及關(guān)于角度參數(shù)的信息進(jìn)行熵編碼。
6.一種對圖像解碼的方法,所述方法包括對指示預(yù)定塊的第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)的信息解碼; 基于解碼的信息,選擇性地對第二頻率系數(shù)矩陣的數(shù)據(jù)解碼; 基于解碼的信息,通過根據(jù)角度參數(shù)選擇性地、部分地交換第二頻率系數(shù)矩陣的行中的至少一個(gè)和列中的至少一個(gè)來恢復(fù)第一頻率系數(shù)矩陣;通過將第一頻率系數(shù)矩陣變換到像素域來恢復(fù)所述預(yù)定塊,其中,角度參數(shù)指示在行中的至少一個(gè)之間的部分交換的程度和列中的至少一個(gè)之間的部分交換的程度。
7.如權(quán)利要求6所述的方法,其中,解碼的信息指示第一頻率系數(shù)矩陣是否包括非零系數(shù)。
8.如權(quán)利要求7所述的方法,其中,所述預(yù)定塊不是雙向預(yù)測的像條(B像條)的塊。
9.如權(quán)利要求7所述的方法,其中,預(yù)定塊是通過執(zhí)行幀內(nèi)預(yù)測而預(yù)測的塊。
10.如權(quán)利要求7所述的方法,其中,對第二頻率系數(shù)矩陣的數(shù)據(jù)解碼的步驟包括如果解碼的信息指示第一頻率系數(shù)矩陣包括非零系數(shù),則對第二頻率系數(shù)矩陣的數(shù)據(jù)以及關(guān)于角度參數(shù)的信息進(jìn)行熵解碼;對解碼的第二頻率系數(shù)矩陣進(jìn)行逆量化。
11.一種對圖像編碼的設(shè)備,所述設(shè)備包括第一變換器,通過將預(yù)定塊變換到頻域來產(chǎn)生第一頻率系數(shù)矩陣; 第二變換器,確定第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù),并基于確定結(jié)果,通過根據(jù)角度參數(shù)選擇性地、部分地交換第一頻率系數(shù)矩陣的行中的至少一個(gè)和列中的至少一個(gè)來產(chǎn)生第二頻率系數(shù)矩陣;編碼器,基于第二變換器的確定結(jié)果,選擇性地對第二頻率系數(shù)矩陣編碼,其中,角度參數(shù)指示在行中的至少一個(gè)之間的部分交換的程度和列中的至少一個(gè)之間的部分交換的程度。
12.如權(quán)利要求11所述的設(shè)備,其中,第二變換器確定第一頻率系數(shù)矩陣是否包括非零系數(shù)。
13.一種對圖像解碼的設(shè)備,所述設(shè)備包括解碼器,對指示預(yù)定塊的第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù)的信息解碼,并基于解碼的信息,選擇性地對第二頻率系數(shù)矩陣的數(shù)據(jù)解碼;第一逆變換器,基于解碼的信息,通過根據(jù)角度參數(shù)選擇性地、部分地交換第二頻率系數(shù)矩陣的行中的至少一個(gè)和列中的至少一個(gè)來恢復(fù)第一頻率系數(shù)矩陣;第二逆變換器,通過將第一頻率系數(shù)矩陣變換到像素域來恢復(fù)所述預(yù)定塊,其中,角度參數(shù)指示在行中的至少一個(gè)之間的部分交換的程度和列中的至少一個(gè)之間的部分交換的程度。
14.如權(quán)利要求13所述的設(shè)備,其中,解碼的信息指示第一頻率系數(shù)矩陣是否包括非零系數(shù)。
15.一種記錄有用于執(zhí)行權(quán)利要求1至10中的一項(xiàng)所述的方法的計(jì)算機(jī)程序的非瞬態(tài)計(jì)算機(jī)可讀記錄介質(zhì)。
全文摘要
一種圖像編碼方法包括通過將預(yù)定塊變換到頻域來產(chǎn)生第一頻率系數(shù)矩陣;確定第一頻率系數(shù)矩陣是否包括絕對值大于預(yù)定值的系數(shù);基于確定結(jié)果,通過根據(jù)角度參數(shù)選擇性地、部分地交換第一頻率系數(shù)矩陣的行的至少一個(gè)和列中的至少一個(gè)來產(chǎn)生第二頻率系數(shù)矩陣;基于確定結(jié)果,選擇性地對第二頻率系數(shù)矩陣編碼。
文檔編號H04N7/50GK102598663SQ201080049221
公開日2012年7月18日 申請日期2010年10月28日 優(yōu)先權(quán)日2009年10月28日
發(fā)明者亞歷山大·阿爾辛, 艾琳娜·阿爾辛娜, 范迪姆·謝廖金 申請人:三星電子株式會(huì)社