用于通過使用旋轉(zhuǎn)變換對圖像編碼和解碼的方法和設(shè)備的制作方法

文檔序號：7912960閱讀：311來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：用于通過使用旋轉(zhuǎn)變換對圖像編碼和解碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域：
與示例性實施例一致的方法和設(shè)備涉及一種用于對圖像編碼和解碼的方法和設(shè)備，更具體地說，涉及一種用于對頻域的系數(shù)編碼和解碼的方法和設(shè)備。
背景技術(shù)：
為了執(zhí)行圖像壓縮，大多數(shù)圖像編碼和解碼方法和設(shè)備通過將像素域的圖像變換為頻域的系數(shù)來對圖像編碼。離散余弦變換(DCT)是廣泛用于圖像或聲音壓縮的頻率變換技術(shù)。近年來，已經(jīng)進(jìn)行了研究以搜索更有效的編碼方法。針對音頻編碼，參數(shù)編碼獲得比 DCT更好的結(jié)果。針對二維QD)數(shù)據(jù)，盡管Karhunen Loeve變換(KLT)系數(shù)具有最小的比特大小，但是系統(tǒng)開銷(overhead)信息的大小顯著增加。

發(fā)明內(nèi)容
解決方案示例性實施例提供一種對圖像編碼和解碼的方法和設(shè)備。示例性實施例還提供一種記錄有用于執(zhí)行該方法的程序的計算機(jī)可讀記錄介質(zhì)。有益效果如上所描述的，根據(jù)示例性實施例的用于對圖像編碼和解碼的方法和設(shè)備可基于固態(tài)(solid)數(shù)學(xué)基礎(chǔ)以較高壓縮率對頻率系數(shù)矩陣編碼，從而可顯著地提高整體圖像編碼操作的壓縮率。

通過參照附圖詳細(xì)描述本發(fā)明的示例性實施例，以上和其它特點(diǎn)將變得更明顯，附圖中圖1是根據(jù)示例性實施例的圖像編碼設(shè)備的示圖；圖2是根據(jù)另一示例性實施例的圖像解碼設(shè)備的示圖；圖3是根據(jù)另一示例性實施例的分級編碼單位的示圖；圖4是根據(jù)另一示例性實施例的基于編碼單位的圖像編碼器的框圖；圖5是根據(jù)另一示例性實施例的基于編碼單位的圖像解碼器的框圖；圖6示出根據(jù)另一示例性實施例的最大編碼單位、子編碼單位和預(yù)測單位；圖7是根據(jù)另一示例性實施例的編碼單位和變換單位的示圖；圖8A和圖8B示出根據(jù)另一示例性實施例的最大編碼單位、預(yù)測單位和變換單元的劃分形式；圖9是根據(jù)另一示例性實施例的圖像編碼設(shè)備的框圖；圖10是根據(jù)另一示例性實施例的變換器的示圖；圖IlA到圖IlC示出根據(jù)另一示例性實施例的旋轉(zhuǎn)變換(ROT)；圖12是根據(jù)另一示例性實施例的歐拉角的示圖13示出根據(jù)另一示例性實施例的偽隨機(jī)點(diǎn)；圖14是根據(jù)另一示例性實施例的圖像解碼設(shè)備的框圖；圖15是根據(jù)另一示例性實施例的逆變換器的示圖；圖16是根據(jù)示例性實施例的對圖像編碼的方法的流程圖；圖17是根據(jù)另一示例性實施例的對圖像解碼的方法的流程圖。最佳實施方式根據(jù)示例性實施例的一方面，提供了一種對圖像編碼的方法，所述方法包括通過將預(yù)定塊變換到頻域來產(chǎn)生第一頻率系數(shù)矩陣；通過基于角參數(shù)執(zhí)行第一頻率系數(shù)矩陣的行之間或列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣；對第二頻率系數(shù)矩陣進(jìn)行量化；對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵編碼，其中，角參數(shù)是指示行之間和列之間的一個或多個值的部分交換的水平的參數(shù)。根據(jù)示例性實施例的另一方面，提供了一種圖像編碼設(shè)備，包括變換器，通過將預(yù)定塊變換到頻域來產(chǎn)生第一頻率系數(shù)矩陣，通過基于角參數(shù)執(zhí)行第一頻率系數(shù)矩陣的行之間或列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣；量化單元，對第二頻率系數(shù)矩陣進(jìn)行量化；熵編碼器，對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵編碼，其中，角參數(shù)是指示行之間和列之間的一個或多個值的部分交換的水平的參數(shù)。根據(jù)示例性實施例的另一方面，提供了一種對圖像解碼的方法，所述方法包括對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵解碼；對第二頻率系數(shù)矩陣進(jìn)行逆量化；通過基于角參數(shù)執(zhí)行第二頻率系數(shù)矩陣的行之間或列之間的一個或多個值的部分交換來產(chǎn)生第一頻率系數(shù)矩陣；將第一頻率系數(shù)矩陣逆變換到像素域，并重構(gòu)預(yù)定塊，其中，角參數(shù)是指示行之間和列之間的一個或多個值的部分交換的水平的參數(shù)。根據(jù)示例性實施例的另一方面，提供了一種圖像解碼設(shè)備，包括熵解碼器，對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵解碼；逆量化單元，對第二頻率系數(shù)矩陣進(jìn)行逆量化；逆變換器，通過基于角參數(shù)執(zhí)行第二頻率系數(shù)矩陣的行之間或列之間的一個或多個值的部分交換來產(chǎn)生第一頻率系數(shù)矩陣；將第一頻率系數(shù)矩陣逆變換到像素域，并重構(gòu)預(yù)定塊，其中，角參數(shù)是指示行之間和列之間的一個或多個值的部分交換的水平的參數(shù)。根據(jù)示例性實施例的另一方面，提供了一種計算機(jī)可讀記錄介質(zhì)，所述記錄介質(zhì)存儲用于執(zhí)行對圖像編碼和對圖像解碼的方法的計算機(jī)可讀程序。
具體實施例方式在下文，將參照附圖詳細(xì)描述示例性實施例。在本說明書中，“圖像”可表示用于視頻的靜止圖像或運(yùn)動圖像(即，視頻本身)。圖1是根據(jù)示例性實施例的用于對圖像編碼的設(shè)備100的框圖。參照圖1，設(shè)備100包括最大編碼單位劃分器110、編碼深度確定單元120、圖像數(shù)據(jù)編碼器130和編碼信息編碼器140。最大編碼單位劃分器110可基于最大編碼單位(其為最大大小的編碼單位)來劃分當(dāng)前畫面或像條(slice)。即，最大編碼單位劃分器110可劃分當(dāng)前畫面或像條，以獲得至少一個最大編碼單位。根據(jù)示例性實施例，可通過使用最大編碼單位和深度來表示編碼單位。如上所述，
6最大編碼單位表示當(dāng)前畫面的編碼單位中具有最大大小的編碼單位，深度表示通過分級地減小編碼單位獲得的子編碼單位的大小。隨著深度增加，編碼單位的大小從最大編碼單位減小到最小編碼單位，其中，最大編碼單位的深度被定義為最小深度，最小編碼單位的深度被定義為最大深度。由于編碼單位的大小隨著深度增加而從最大編碼單位減小，所以第k 深度的子編碼單位可包括第(k+n)深度的多個子編碼單位(k和η為等于或大于1的整數(shù))。根據(jù)將被編碼的畫面的大小的增加，以較大的編碼單位對圖像編碼可引起較高的圖像壓縮比。然而，如果較大的編碼單位被固定，則考慮到連續(xù)改變的圖像特性，無法對圖像進(jìn)行有效編碼。例如，當(dāng)對諸如大?；蛱炜盏钠交瑓^(qū)域編碼時，編碼單位越大，可增加越多的壓縮比。然而，當(dāng)對諸如人或建筑的復(fù)雜區(qū)域編碼時，編碼單位越小，壓縮比可增加的越多。因此，根據(jù)示例性實施例，針對每個畫面或像條設(shè)置不同的最大圖像編碼單位和不同的最大深度。由于最大深度表示編碼單位可減小的最大倍數(shù)，最大圖像編碼單位中包括的每個最小編碼單位的大小可根據(jù)最大深度被變化地設(shè)置。編碼深度確定單元120確定最大深度?？苫诼适д?R-D)代價的計算來確定最大深度?？舍槍γ總€畫面或像條或者針對每個最大編碼單位來不同地確定最大深度。確定的最大深度被提供給編碼信息編碼器140，根據(jù)最大編碼單位的圖像數(shù)據(jù)被提供給圖像數(shù)據(jù)編碼器130。最大深度表示具有可被包括在最大編碼單位中的最小大小的編碼單位，S卩，最小編碼單位。換句話講，可根據(jù)不同深度將最大編碼劃分成具有不同大小的子編碼單位。稍后將參照圖8Α和圖8Β對此進(jìn)行詳細(xì)描述。另外，可基于具有不同大小的處理單位來預(yù)測或變換最大編碼單位中包括的具有不同大小的子編碼單位。換句話講，設(shè)備100可基于具有各種大小和各種形狀的處理單位來對圖像執(zhí)行多個處理操作。為了對圖像數(shù)據(jù)編碼，可執(zhí)行諸如預(yù)測、變換和熵編碼的處理操作，其中，可對每個操作使用具有相同大小的處理單位，或者可對每個操作使用具有不同大小的處理單位。例如，設(shè)備100可選擇與編碼單位不同的處理單位，以預(yù)測編碼單位。當(dāng)編碼單位的大小是2ΝΧ2Ν(其中，N為正整數(shù))時，用于預(yù)測的處理單位可以是 2ΝΧ2Ν、2ΝΧΝ、ΝΧ2Ν、ΝΧΝ。換句話講，可基于具有由此編碼單位的高度和寬度中的至少一個被均除以2的形狀的處理單位來執(zhí)行運(yùn)動預(yù)測。以下，作為預(yù)測基礎(chǔ)的處理單位被定義為“預(yù)測單位”。預(yù)測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個?？蓛H對具有特定大小或形狀的預(yù)測單位執(zhí)行特定預(yù)測模式。例如，可僅對形狀是正方形的大小為2ΝΧ2Ν和 NXN的預(yù)測單位執(zhí)行幀內(nèi)模式。此外，可僅對大小為2ΝΧ2Ν的預(yù)測單位執(zhí)行跳過模式。如果在編碼單位中存在多個預(yù)測單位，則在對每個預(yù)測單位執(zhí)行了預(yù)測之后，可選擇具有最少編碼誤差的預(yù)測模式?？蛇x擇地，設(shè)備100可基于大小與編碼單位不同的處理單位來對圖像數(shù)據(jù)執(zhí)行到頻率的變換。針對編碼單位中的頻率變換，可基于大小等于或小于編碼單位的大小的處理單位來執(zhí)行頻率變換。以下，作為頻率變換基礎(chǔ)的處理單位被定義為“變換單位”。頻率變換可以是任何變換例如，離散余弦變換(DCT)或Karhunen Loeve變換(KLT)。編碼深度確定單元120可基于拉格朗日乘法器通過使用RD優(yōu)化來確定最大編碼
7單位中包括的子編碼單位。換句話講，編碼深度確定單元120可確定從最大編碼單位劃分的多個子編碼單位的形狀，其中，所述多個子編碼單位根據(jù)其深度具有不同的大小。圖像數(shù)據(jù)編碼器130基于由編碼深度確定單元120確定的劃分形狀通過對最大編碼單位編碼來輸出比特流。編碼信息編碼器140對關(guān)于由編碼深度確定單元120確定的最大編碼單位的編碼模式的信息進(jìn)行編碼。換句話講，編碼信息編碼器140通過對關(guān)于最大編碼單位的劃分形狀的信息、關(guān)于最大深度的信息、關(guān)于針對每個深度的子編碼單位的編碼模式的信息進(jìn)行編碼來輸出比特流。關(guān)于子編碼單位的編碼模式的信息可包括關(guān)于子編碼單位的預(yù)測單位的信息、關(guān)于針對每個預(yù)測單位的預(yù)測模式的信息、關(guān)于子編碼單位的變換單位的信息。由于針對每個最大編碼單位存在具有不同大小的子編碼單位，并且針對每個子編碼單位必須確定關(guān)于編碼模式的信息，所以可針對一個最大編碼單位確定關(guān)于至少一個編碼模式的信息。設(shè)備100可根據(jù)深度的增加將最大編碼單位的高度和寬度均除以2來產(chǎn)生子編碼單位。即，當(dāng)?shù)趉深度的編碼單位的大小是2NX2N時，第(k+Ι)深度的編碼單位的大小是 NXN。因此，根據(jù)示例性實施例的設(shè)備100可考慮圖像特性基于最大深度和最大編碼單位的大小來確定每個最大編碼單位的最優(yōu)劃分形狀。通過考慮圖像特性變化地調(diào)整最大編碼單位的大小，并通過將最大編碼單位劃分成不同深度的子編碼單位對圖像編碼，可更有效地對具有各種分辨率的圖像進(jìn)行編碼。圖2是根據(jù)示例性實施例的用于對圖像解碼的設(shè)備200的框圖。參照圖2，設(shè)備200包括圖像數(shù)據(jù)獲取單元210、編碼信息提取單元220和圖像數(shù)據(jù)解碼器230。圖像數(shù)據(jù)獲取單元210通過解析由設(shè)備200接收的比特流根據(jù)最大編碼單位來獲取圖像數(shù)據(jù)，并將所述圖像數(shù)據(jù)輸出到圖像數(shù)據(jù)解碼器230。圖像數(shù)據(jù)獲取單元210可從當(dāng)前畫面或像條的頭中提取關(guān)于當(dāng)前畫面或像條的最大編碼單位的信息。換句話講，圖像數(shù)據(jù)獲取單元210按最大編碼單位劃分比特流，從而圖像數(shù)據(jù)解碼器230可根據(jù)最大編碼單位對圖像數(shù)據(jù)解碼。編碼信息提取單元220通過解析由設(shè)備200接收的比特流從當(dāng)前畫面的頭中提取關(guān)于最大編碼單位、最大深度、最大編碼單位的劃分形狀、子編碼單位的編碼模式的信息。關(guān)于劃分形狀的信息和關(guān)于編碼模式的信息被提供給圖像數(shù)據(jù)解碼器230。關(guān)于最大編碼單位的劃分形狀的信息可包括與根據(jù)最大編碼單位中包括的深度具有不同大小的子編碼單位有關(guān)的信息，關(guān)于編碼模式的信息可包括與根據(jù)子編碼單位的預(yù)測單位有關(guān)的信息、關(guān)于預(yù)測模式的信息和關(guān)于變換單位的信息。圖像數(shù)據(jù)解碼器230通過基于由編碼信息提取單元220提取的信息對每個最大編碼單位的圖像數(shù)據(jù)解碼來恢復(fù)當(dāng)前畫面。編碼信息解碼器230可基于關(guān)于最大編碼單位的劃分形狀的信息來對最大編碼單位中包括的子編碼單位解碼。解碼處理可包括具有幀內(nèi)預(yù)測和運(yùn)動補(bǔ)償?shù)念A(yù)測處理、逆變換處理。圖像數(shù)據(jù)解碼器230可基于關(guān)于預(yù)測單位的信息和關(guān)于預(yù)測模式的信息來執(zhí)行幀內(nèi)預(yù)測或幀間預(yù)測，以對預(yù)測單位進(jìn)行預(yù)測。圖像數(shù)據(jù)解碼器230還可基于關(guān)于子編碼單位的變換單位的信息來對每個子編碼單位執(zhí)行逆變換。圖3示出根據(jù)示例性實施例的分級編碼單位。參照圖3，根據(jù)示例性實施例的分級編碼單位可包括尺寸為64X64、32X32、 16X16,8X8,4X4的編碼單位。除了這些具有完全正方形的編碼單位之外，還可存在尺寸為 64X32、32X64、32X16、16X32、16X8、8X16、8X4、4X8 的編碼單位。參照圖3，針對分辨率為1920 X 1080的圖像數(shù)據(jù)310，最大編碼單位的大小被設(shè)置為64X64，最大深度被設(shè)置為2。針對分辨率為1920X1080的圖像數(shù)據(jù)320，最大編碼單位的大小被設(shè)置為 64X64，最大深度被設(shè)置為3。針對分辨率為352X^8的圖像數(shù)據(jù)330，最大編碼單位的大小被設(shè)置為16 X 16，最大深度被設(shè)置為1。當(dāng)分辨率為高或者數(shù)據(jù)量大時，優(yōu)選地，編碼單位的最大大小相對大，以增加壓縮比并準(zhǔn)確地反映圖像特性。因此，針對分辨率高于圖像數(shù)據(jù)330的圖像數(shù)據(jù)310和320，可選擇64X64作為最大編碼單位的大小。最大深度表示在分級編碼單位中層的總數(shù)量。由于圖像數(shù)據(jù)310的最大深度是2，因此，根據(jù)深度的增加，圖像數(shù)據(jù)310的編碼單位315可包括長軸大小為64的最大編碼單位以及長軸大小為32和16的子編碼單位。另一方面，由于圖像數(shù)據(jù)330的最大深度為1，因此，根據(jù)深度的增加，圖像數(shù)據(jù) 330的編碼單位335可包括長軸大小為16的最大編碼單位以及長軸大小為8的編碼單位。然而，由于圖像數(shù)據(jù)320的最大深度為3，所以，根據(jù)深度的增加，圖像數(shù)據(jù)320的編碼單位325可包括長軸大小為64的最大編碼單位以及長軸大小為32、16、8和4的子編碼單位。由于隨著深度的增加基于較小的子編碼單位對圖像進(jìn)行編碼，所以示例性實施例適用于對包括更微小場景的圖像進(jìn)行編碼。圖4是根據(jù)示例性實施例的基于編碼單位的圖像編碼器400的框圖。幀內(nèi)預(yù)測器410對當(dāng)前幀405中的幀內(nèi)模式的預(yù)測單位執(zhí)行幀內(nèi)預(yù)測，運(yùn)動估計單元420和運(yùn)動補(bǔ)償單元425通過使用當(dāng)前幀405和參考幀495對幀間模式的預(yù)測單位執(zhí)行幀間預(yù)測和運(yùn)動補(bǔ)償。基于從幀內(nèi)預(yù)測單位410、運(yùn)動估計單元420、運(yùn)動補(bǔ)償單元425輸出的預(yù)測單位來產(chǎn)生殘差值，并且產(chǎn)生的殘差值通過變換器430和量化單元440被輸出為量化的變換系數(shù)。量化的變換系數(shù)通過逆量化單元460和頻率逆變換器470被恢復(fù)成殘差值，恢復(fù)的殘差值通過去塊單元480和環(huán)路濾波單元490被進(jìn)行后處理，并被輸出為參考幀495。量化的變換系數(shù)可通過熵編碼器450被輸出為比特流455。為了基于根據(jù)示例性實施例的編碼方法執(zhí)行編碼，圖像編碼器400的部件(即，幀內(nèi)預(yù)測器410、運(yùn)動估計單元420、運(yùn)動補(bǔ)償單元425、變換器430、量化單元440、熵編碼器 450、逆量化單元460、頻率逆變換器470、去塊單元480和環(huán)路濾波單元490)基于最大編碼單位、根據(jù)深度的子編碼單位、預(yù)測單位和變換單位執(zhí)行圖像編碼。圖5是根據(jù)示例性實施例的基于編碼單位的圖像解碼器500的框圖。比特流505通過解析器510，從而將被解碼的編碼圖像數(shù)據(jù)和解碼所必需的編碼信息被解析。編碼圖像數(shù)據(jù)通過熵解碼器520和逆量化器530被輸出為逆量化數(shù)據(jù)，并通過頻率逆變換器540被恢復(fù)為殘差值。殘差值通過被加上幀內(nèi)預(yù)測器550的幀內(nèi)預(yù)測結(jié)果或者運(yùn)動補(bǔ)償單元560的運(yùn)動補(bǔ)償結(jié)果根據(jù)編碼單位被恢復(fù)。恢復(fù)的編碼單位通過去塊單元570和環(huán)路濾波單元580被用于隨后的編碼單位或下一畫面的預(yù)測。為了基于根據(jù)示例性實施例的解碼方法執(zhí)行解碼，圖像解碼器500的部件(即，解析單元510、熵解碼器520、逆量化單元530、頻率逆變換器M0、幀內(nèi)預(yù)測器550、運(yùn)動補(bǔ)償單元560、去塊單元570和環(huán)路濾波單元580)基于最大編碼單位、根據(jù)深度的子編碼單位、預(yù)測單位和變換單位執(zhí)行圖像解碼處理。具體地講，幀內(nèi)預(yù)測器550和運(yùn)動補(bǔ)償單元560通過考慮最大編碼單位和深度確定子編碼單位中的預(yù)測模式和預(yù)測單位，頻率逆變換器540通過考慮變換單位的大小執(zhí)行逆變換。圖6示出根據(jù)示例性實施例的最大編碼單位、子編碼單位和預(yù)測單位。根據(jù)示例性實施例的設(shè)備100和設(shè)備200考慮圖像特性使用分級編碼單位執(zhí)行編碼和解碼。最大編碼單位和最大深度可根據(jù)圖像特性被自適應(yīng)地設(shè)置，或者根據(jù)用戶需求被不同地設(shè)置。根據(jù)示例性實施例的分級編碼單位結(jié)構(gòu)600示出高和寬為64以及最大深度為4 的最大編碼單位610。深度沿著分級編碼單位結(jié)構(gòu)600的縱軸增加，隨著深度增加，子編碼單位620至650的高度和寬度減小。沿著分級編碼結(jié)構(gòu)600的橫軸示出了最大編碼單位 610以及子編碼單位620至650的預(yù)測單位。最大編碼單位610深度為0，編碼單位的大小(S卩，高和寬)為64X64。深度沿著縱軸增加，存在大小為32X32并且深度為1的子編碼單位620、大小為16X16并且深度為 2的子編碼單位630、大小為8X8并且深度為3的子編碼單位640、大小為4X4并且深度為 4的子編碼單位650。大小為4X4并且深度為4的子編碼單位650是最小編碼單位，最小編碼單位可被劃分成多個預(yù)測單位，所述多個預(yù)測單位中的每一個小于最小編碼單位。參照圖6，根據(jù)每個深度沿橫軸示出了預(yù)測單位的示例。S卩，深度為0的最大編碼單位610的預(yù)測單位可以是大小等于編碼單位610的大小(即，64X64)的預(yù)測單位，或者深度為0的最大編碼單位610的預(yù)測單位可以是大小為64X32的預(yù)測單位612、大小為 32 X 64的預(yù)測單位614或者大小為32 X 32的預(yù)測單位616，其中，預(yù)測單位612、614或616 的大小小于大小為64X64的編碼單位610的大小。深度為1并且大小為32X32的編碼單位620的預(yù)測單位可以是大小等于編碼單位620的大小(即，32X32)的預(yù)測單位，或者編碼單位620的預(yù)測單位可以是大小為 32X16的預(yù)測單位622、大小為16X32的預(yù)測單位624或者大小為16X 16的預(yù)測單位626，其中，預(yù)測單位622、6M或者626的大小小于大小為32X32的編碼單位620的大小。深度為2并且大小為16 X 16的編碼單位630的預(yù)測單位可以是大小等于編碼單位630的大小(S卩，16X16)的預(yù)測單位，或者編碼單位620的預(yù)測單位可以是大小為16X8 的預(yù)測單位632、大小為8X 16的預(yù)測單位634或者大小為8X8的預(yù)測單位636，其中，預(yù)測單位632、634或者636的大小小于大小為16 X 16的編碼單位630的大小。深度為3并且大小為8X8的編碼單位640的預(yù)測單位可以是大小等于編碼單位 640的大小(即，8X8)的預(yù)測單位，或者編碼單位640的預(yù)測單位可以是大小為8X4的預(yù)測單位642、大小為4X8的預(yù)測單位644或者大小為4X4的預(yù)測單位646，其中，預(yù)測單位642,644或者646的大小小于大小為8X8的編碼單位640的大小。最后，深度為4并且大小為4X4的編碼單位650是最小編碼單位和最大深度的編碼單位，編碼單位650的預(yù)測單位可以是大小為4X4的預(yù)測單位650、大小為4X2的預(yù)測單位652、大小為2X4的預(yù)測單元6M或者大小為2X2的預(yù)測單位656。圖7示出根據(jù)示例性實施例的編碼單位和變換單位。根據(jù)示例性實施例的設(shè)備100和設(shè)備200使用最大編碼單位自身或者使用從最大編碼單位劃分的等于或小于最大編碼單位的子編碼單位執(zhí)行編碼。在編碼處理中，選擇用于頻率變換的變換單位的大小以不大于相應(yīng)編碼單位的大小。例如，在當(dāng)前編碼單位710大小為64X64時，可通過使用大小為32X32的變換單位 720來執(zhí)行頻率變換。圖8A和圖8B示出根據(jù)示例性實施例的編碼單位、預(yù)測單位和頻率變換單位的劃分形狀。圖8A示出根據(jù)示例性實施例的編碼單位和預(yù)測單位。圖8A的左側(cè)示出根據(jù)示例性實施例的由設(shè)備100選擇的劃分形狀，以對最大編碼單位810編碼。設(shè)備100將最大編碼單位810劃分成不同形狀，執(zhí)行編碼，并通過基于R-D 代價對各劃分形狀的編碼結(jié)果進(jìn)行相互比較來選擇最優(yōu)劃分形狀。當(dāng)保持原樣對最大編碼單位810編碼為最優(yōu)時，可在不劃分最大編碼單位810的情況下對最大編碼單位810編碼，如圖8A和圖8B所示。參照圖8A的左側(cè)，通過將深度為0的最大編碼單位810劃分成深度等于或大于1 的子編碼單位來對最大編碼單位810編碼。S卩，最大編碼單位810被劃分成深度為1的四個子編碼單位，深度為1的所有或一些子編碼單位被劃分成深度為2的子編碼單位。深度為1的子編碼單位中位于右上側(cè)的子編碼單位和位于左下側(cè)的子編碼單位被劃分成深度等于或大于2的子編碼單位。深度等于或大于2的子編碼單位中的一些可被劃分成深度等于或大于3的子編碼單位。圖8A的右側(cè)示出最大編碼單位810的預(yù)測單位的劃分形狀。參照圖8A的右側(cè)，可與最大編碼單位810不同地來劃分最大編碼單位810的預(yù)測單位860。換句話講，每個子編碼單位的預(yù)測單位可小于相應(yīng)的子編碼單位。例如，深度為1的子編碼單位中位于右下側(cè)的子編碼單位854的預(yù)測單位可小于子編碼單位854。另外，深度為2的子編碼單位814、816、850和852中的一些子編碼單位 (814、816、850和852)的預(yù)測單位可分別小于子編碼單位814、816、850和852。另外，深度為3的子編碼單位822、832和848的預(yù)測單位可分別小于子編碼單位822、832和848。預(yù)測單位可具有由此各子編碼單位在高度或?qū)挾确较虮痪?的形狀，或者可具有由此各子編碼單位在高度和寬度方向被均除以4的形狀。圖8B示出根據(jù)示例性實施例的預(yù)測單位和變換單位。圖8B的左側(cè)示出在圖8的右側(cè)示出的最大編碼單位810的預(yù)測單位的劃分形狀，圖8B的右側(cè)示出最大編碼單位810的變換單位的劃分形狀。參照圖8B的右側(cè)，可從預(yù)測單位860不同地設(shè)置變換單位870的劃分形狀。例如，即使深度為1的編碼單位854的預(yù)測單位被選擇具有由此編碼單位854的高度被均除以2的形狀，變換單位可被選擇具有與編碼單位854的大小相同的大小。同樣
11地，即使深度為2的編碼單位814和850的預(yù)測單位被選擇具有由此編碼單位814和850 中的每一個的高度被均除以2的形狀，變換單位可被選擇具有與編碼單位814和850中的每一個的原始大小相同的大小。變換單位可被選擇具有比預(yù)測單位小的大小。例如，當(dāng)深度為2的編碼單位852 的預(yù)測單位被選擇具有由此編碼單位852的寬度被均除以2的形狀時，變換單位可被選擇具有由此編碼單位852沿著高度和寬度的方向被均除以4的形狀，該形狀具有比預(yù)測單位的形狀小的大小。圖9是根據(jù)另一示例性實施例的圖像編碼設(shè)備900的框圖。圖9的圖像編碼設(shè)備900可以是包括在圖1的圖像編碼設(shè)備100中的模塊或包括在圖4的圖像編碼器400中的模塊，所述模塊執(zhí)行稍后將描述的圖像編碼過程。參照圖9，根據(jù)本示例性實施例的圖像編碼設(shè)備900包括變換器910、量化單元920和熵編碼器930。變換器910接收預(yù)定塊并將預(yù)定快變換到頻域。預(yù)定塊根據(jù)預(yù)定變換算法被變換，然后產(chǎn)生頻域的系數(shù)。變換器910可使用包括將像素域的塊變換到頻域的系數(shù)的多種算法之一。例如，可通過使用離散余弦變換(DCT)或Karhunen Loeve變換(KLT)將預(yù)定塊變換到頻域。預(yù)定塊可以是殘差塊。此外，預(yù)定塊可以是關(guān)于圖7或圖8B描述的變換單位的塊。此外，變換器910執(zhí)行包括在矩陣的行之間和矩陣的列之間交換一個或多個值的后處理，其中，所述矩陣包括產(chǎn)生為變換的結(jié)果的頻域的系數(shù)，將參照圖10、圖IlA到圖IlC 詳細(xì)描述后處理。圖10是根據(jù)示例性實施例的變換器910的示圖。參照圖10，變換器910包括變換執(zhí)行單元1010、旋轉(zhuǎn)變換(ROT)執(zhí)行單元1020。變換執(zhí)行單元1010接收預(yù)定塊，將預(yù)定塊變換到頻域，并產(chǎn)生頻率系數(shù)矩陣。例如，如上所述，通過執(zhí)行DCT或KLT，可產(chǎn)生包括頻域的系數(shù)的頻率系數(shù)矩陣。ROT執(zhí)行單元1020接收由變換執(zhí)行單元1010產(chǎn)生的頻率系數(shù)矩陣，執(zhí)行R0T，然后產(chǎn)生調(diào)整后的頻率系數(shù)矩陣。ROT可與這樣的變換對應(yīng)通過所述變換來對行之間和列之間的一個或多個值進(jìn)行交換。將參照圖IlA到圖IlC詳細(xì)描述ROT。圖IlA到圖IlC示出根據(jù)示例性實施例的ROT。ROT執(zhí)行單元1020對頻率系數(shù)矩陣的行之間和列之間的一個或多個值進(jìn)行部分地交換?，F(xiàn)在將參照圖IlA到圖IlC描述頻率系數(shù)矩陣的行之間和列之間的交換。根據(jù)一個或多個示例性實施例，行之間或列之間的部分交換不指示特定行或特定列的值按一到一對應(yīng)被無條件交換，而是指示通過使用包括正弦函數(shù)的特定函數(shù)對兩行之間或兩列之間的值進(jìn)行部分地交換。例如，根據(jù)參數(shù)a的值，兩行A和B之間的交換可由等式1定義。等式1行A(新)=cos (a) X 行 A(舊)-sin(a) X 行 B(舊)行B(新)=sin (a) X 行 A(舊)+cos(a) X 行 B(舊)參照等式1，參數(shù)“a”用作角。因此，在本發(fā)明的一個或多個實施例中，指示DCT變換矩陣的行之間和列之間的部分交換的水平的參數(shù)“a”被定義為角參數(shù)。在參數(shù)“a”的值為0度的情況下，該情況意味著交換未發(fā)生。此外，在參數(shù)“a”的值為90度的情況下，在行之間發(fā)生整體交換。在參數(shù)“a”的值具有大于90度小于180度的值的情況下，該情況意味著在行之間發(fā)生交換，并且元素值的符號被改變。在參數(shù)“a”的值為180度的情況下，在行之間沒有發(fā)生交換，但是包括在每行中的所有元素的符號被改變。在一個或多個示例性實施例中，列之間的部分交換以與行之間的部分交換同樣的方式被定義。圖IlA示出對4X4頻率系數(shù)矩陣執(zhí)行ROT的情況。參照圖11A，三個參數(shù)α ^ α2 和α 3用于頻率系數(shù)矩陣的行之間的部分交換，三個參數(shù)α4、α5* α 6用于頻率系數(shù)矩陣的列之間的部分交換。圖IlB示出對8X8頻率系數(shù)矩陣執(zhí)行ROT的情況。在圖IlB的情況下，α ^ α 2、 α 3、α 4、α 5禾口 α 6被用于亍之間的部分交換，α 7、α 8、α 9、α 10、α η禾口 α 12被用于列之間的部分交換。圖IlC示出對大小等于或大于16Χ 16的頻率系數(shù)矩陣執(zhí)行ROT的情況。如以上關(guān)于圖IlA和圖IlB的描述，隨著頻率系數(shù)矩陣的大小增加，角參數(shù)的數(shù)量增加。為了對圖IlA的4X4頻率系數(shù)矩陣執(zhí)行R0T，需要六個角參數(shù)，為了對圖IlB的8X8 頻率系數(shù)矩陣執(zhí)行R0T，需要12個角參數(shù)。雖然以通過對頻率系數(shù)矩陣執(zhí)行ROT來產(chǎn)生調(diào)整后的頻率系數(shù)矩陣的方式提高了壓縮率，然后對調(diào)整后的頻率系數(shù)矩陣執(zhí)行量化和熵編碼，但是如果角參數(shù)的數(shù)量增加使得系統(tǒng)開銷增加，則數(shù)據(jù)的總量不減少。因此，預(yù)定大小，例如，當(dāng)對大小等于或大于 16Χ 16的頻率系數(shù)矩陣執(zhí)行ROT時，使用系數(shù)采樣。換句話說，如圖IlC中所示，ROT執(zhí)行單元1020選擇僅包括頻率系數(shù)矩陣1010的一些系數(shù)的采樣的頻率系數(shù)矩陣1120，然后對選擇的頻率系數(shù)矩陣1120執(zhí)行ROT。不對頻率系數(shù)矩陣1110的剩余部分1130執(zhí)行ROT。為了使對具有大的大小的頻率系數(shù)矩陣的ROT達(dá)到足夠效果，包括在頻率系數(shù)矩陣1120中的系數(shù)需要具有圖像數(shù)據(jù)的壓縮效果。因此，ROT執(zhí)行單元1020只選擇具有低頻分量并且具有除0之外的值的系數(shù)，并對這些系數(shù)執(zhí)行ROT。一般地，作為變換結(jié)果的產(chǎn)生的頻率系數(shù)矩陣包括關(guān)于在頻率系數(shù)矩陣的左上角的低頻分量的系數(shù)。因此，如圖lie中所示，ROT執(zhí)行單元1020僅選擇位于頻率系數(shù)矩陣 1110的左上角的系數(shù)，然后執(zhí)行ROT。在圖IlC的示例中，ROT執(zhí)行單元1020以與關(guān)于圖 IlB的ROT相同的方式對大小為8X8的頻率系數(shù)矩陣1120執(zhí)行ROT。參照圖IlA的對4X4頻率系數(shù)矩陣的R0T，根據(jù)三個角參數(shù)Q^a2* α 3的應(yīng)用順序獲得不同結(jié)果。即，三個角參數(shù)彼此不獨(dú)立。作為在首先應(yīng)用角參數(shù)Q1然后應(yīng)用角參數(shù)α 2的情況下執(zhí)行ROT的結(jié)果而產(chǎn)生的調(diào)整后的頻率系數(shù)矩陣不同于作為在首先應(yīng)用角參數(shù)α 2然后應(yīng)用角參數(shù)Ci1的情況下執(zhí)行ROT的結(jié)果而產(chǎn)生的調(diào)整后的頻率系數(shù)矩陣。這將參照圖12進(jìn)行詳細(xì)描述。圖12是根據(jù)另一示例性實施例的歐拉(Euler)角的示圖。參照圖12，可理解矩陣的行之間或列之間的交換與三維(3D)空間中的坐標(biāo)軸的旋轉(zhuǎn)相似。即，三行或三列分別與3D坐標(biāo)的X軸、Y軸和Z軸對應(yīng)。針對3D空間中的坐標(biāo)軸的旋轉(zhuǎn)，根據(jù)哪個軸首先旋轉(zhuǎn)獲得不同結(jié)果。因此，已經(jīng)嘗試顯示3D空間中的坐標(biāo)軸的旋轉(zhuǎn)，在所述嘗試中的代表性嘗試就是歐拉角。
在圖12中，α、β、Y角指示歐拉角。圖12中，X軸、Y軸和Z軸指示旋轉(zhuǎn)之前的坐標(biāo)軸，X’軸、Y’軸、ζ’軸指示旋轉(zhuǎn)之后的坐標(biāo)軸。N軸是X-Y平面和X’ -Y’平面的相交線。這里，N軸被稱為“節(jié)點(diǎn)的線”。角α指示繞Z軸旋轉(zhuǎn)的X軸和N軸之間的角。角β指示繞N軸旋轉(zhuǎn)的Z軸和Ζ’ 軸之間的角。角Y指示繞Ζ’軸旋轉(zhuǎn)的N軸和X’軸之間的角。等式2給出根據(jù)歐拉角的坐標(biāo)軸的旋轉(zhuǎn)。等式2
,cos/ sinf 0V10 0 V cos α sin α 0、-sin ^ cos 廠 0 0 cos β sin β -sin α cos α 0 、0 0 1 J[o -sin； cosfjL 0 0 Iy第一矩陣指示圍繞Ζ’軸的旋轉(zhuǎn)。第二矩陣指示圍繞N軸的旋轉(zhuǎn)。第三矩陣指示圍繞Z軸的旋轉(zhuǎn)。在一個或多個示例性實施例中，在矩陣的行之間或列之間的交換可被指示為使用歐拉角的坐標(biāo)軸的旋轉(zhuǎn)。返回參照圖9和圖10，變換器910的ROT執(zhí)行單元1020對頻率系數(shù)矩陣執(zhí)行R0T，從而產(chǎn)生調(diào)整后的頻率系數(shù)矩陣。調(diào)整后的頻率系數(shù)矩陣被輸入到量化單元920。量化單元920根據(jù)預(yù)定量化步長對包括在調(diào)整后的頻率系數(shù)矩陣中的系數(shù)進(jìn)行量化，熵編碼器930對量化的調(diào)整后的頻率系數(shù)矩陣執(zhí)行熵編碼?？赏ㄟ^使用上下文自適應(yīng)變量算術(shù)編碼(CABAC)或上下文自適應(yīng)變長編碼(CAVLC)來執(zhí)行熵編碼。在由于頻率系數(shù)矩陣1110的大的大小而僅對只包括一些系數(shù)的頻率系數(shù)矩陣1120執(zhí)行ROT的情況下，對包括頻率系數(shù)矩陣1120和剩余部分1130的頻率系數(shù)矩陣1110執(zhí)行量化然后執(zhí)行熵編碼，其中，頻率系數(shù)矩陣1120包括旋轉(zhuǎn)變換的一些系數(shù)。熵編碼器930對在由變換器910執(zhí)行的ROT中使用的角參數(shù)執(zhí)行熵編碼，圖像編碼設(shè)備900根據(jù)以下過程確定用于ROT的最佳角參數(shù)。為了有效地執(zhí)行壓縮，為了最佳角參數(shù)需要搜索最佳角參數(shù)。然而，這是對參數(shù)具有強(qiáng)烈非平滑度依賴性的多參數(shù)問題。為了解決該問題，使用蒙特卡羅(Monte Carlo)方法。這里，在蒙特卡羅方法中可使用萊默(Lehmer)隨機(jī)序列數(shù)以產(chǎn)生隨機(jī)點(diǎn)。僅可存儲或發(fā)送指示序列數(shù)的一個整數(shù)，而不是存儲或發(fā)送用作參數(shù)的角參數(shù)。因此，可減少通知解碼器在ROT中使用的角參數(shù)所必需的系統(tǒng)開銷。S卩，將被考慮以確定最佳角參數(shù)的組合的內(nèi)容被陳述如下。1、變換矩陣的可逆變換2、用于更有效編碼的能量的重排列3、通過使用萊默隨機(jī)序列數(shù)而增加的信息的最小化返回參照圖IlA到圖11C，通過頻率系數(shù)矩陣的旋轉(zhuǎn)被修正的部分被涂為黑色，未被修正的部分被涂為白色。在圖IlA的4X4頻率系數(shù)矩陣中，在根據(jù)行之間和列之間的交換對十五個系數(shù)的修正中涉及六個角參數(shù)。在圖IlB的8X8頻率系數(shù)矩陣中，在六十個系數(shù)的修正中涉及十二個角參數(shù)。參照圖11A，對于行之間的交換，三個見參數(shù)是必須的，對于列之間的交換，三個角參數(shù)也是必須的。因此，針對4X4塊，六個角參數(shù)是必須的。
參照圖11B，對于行之間的交換，六個見參數(shù)是必須的，對于列之間的交換，六個角參數(shù)也是必須的。因此，針對8X8塊，十二個角參數(shù)是必須的。圖像編碼設(shè)備900可根據(jù)以下步驟執(zhí)行ROT。步驟1-正交變換家族參數(shù)化步驟2-蒙特卡羅方法步驟3-萊默偽隨機(jī)數(shù)步驟4-用于最佳角參數(shù)的音域(diapason)的定位步驟5-準(zhǔn)最佳要素(basis)雖然通過使用ROT提高了圖像的壓縮率，但是如果添加太多的參數(shù)，則視頻信號的發(fā)送可達(dá)到比壓縮更好的結(jié)果。換句話說，存在在壓縮率和附加參數(shù)的系統(tǒng)開銷之間的交替使用。例如，雖然4X4頻率系數(shù)矩陣中的圖像信號被壓縮到接近0的大小，但是如果壓縮需要十六個附加參數(shù)，則可不需要執(zhí)行ROT。在這方面，可更有效地將十六個像素值發(fā)送到解碼器。因此，圖像信號的壓縮和附加系統(tǒng)開銷的最小化兩者是重要的。為此，在根據(jù)以下步驟最小化系統(tǒng)開銷的同時，ROT執(zhí)行單元1020搜索最佳角參數(shù)。<步驟1-正交變換家族參數(shù)化>為了選擇用于當(dāng)前數(shù)據(jù)的最佳變換，需要要素調(diào)整。要素的旋轉(zhuǎn)被選擇作為要素修改。從而旋轉(zhuǎn)角的集合唯一地描述要素修改。介紹過的旋轉(zhuǎn)角以與歐拉角描述3D空間中的固態(tài)體的旋轉(zhuǎn)相同的方式來描述要素修改。該相似性解釋該算法的名稱。為了修正要素，可主要選擇要素的旋轉(zhuǎn)。在一個或多個示例性實施例中，通過使用角參數(shù)執(zhí)行要素的選擇。這里，使用通過利用角參數(shù)執(zhí)行的要素的旋轉(zhuǎn)。角參數(shù)可以是歐拉角。然而，角參數(shù)不限于歐拉角，因此可包括可指示矩陣的行之間和列之間的一個或多個值的部分交換的水平的其它。以下，現(xiàn)在將描述涉及使用歐拉角的示例。旋轉(zhuǎn)由等式3通過使用頻率系數(shù)矩陣D的左乘法Rh iz。ntal和右乘法RVCTti。al定義。等式3D，= RhoriZontalXDX Rvertical(D’指示被旋轉(zhuǎn)變換的調(diào)整后的頻率系數(shù)矩陣。)矩陣Rtoizmtal執(zhí)行頻率系數(shù)矩陣D的行之間的交換。RVCTti。al執(zhí)行頻率系數(shù)矩陣D 的列之間的交換。4X4±夬中的矩陣Rtoiz。ntal的示例由等式4給出。等式4
B C O^ DEFO
GHIO ,0 0 0 IyA = cos α cos γ -sin α cos β sin yB = -sin α cos y -cos α cos β sin yC = sin^ sin y
15
D = cos α sin γ +sin α cos β cos γE = -sin α sin γ +cos α cos β cos γF = -sin β cos γG = sin α sin βH =cos α sin βI = Cos^在等式4中，α、β、Υ指示歐拉角。因此，對于4X4頻率系數(shù)矩陣，歐拉角通過六個參數(shù)αι、α2、... α 6的組描述十二個頻率系數(shù)的修正。對于8X8頻率系數(shù)矩陣，十二個歐拉角α-ρ α 2、... Ci12描述六十個頻率系數(shù)的修正。<步驟2-蒙特卡羅方法>在自由度減小到六個角參數(shù)(8X8頻率系數(shù)矩陣情況下的十二個角參數(shù))之后，需要考慮到節(jié)省比特檢查優(yōu)化問題。即，需要對選擇角參數(shù)的組的方法進(jìn)行優(yōu)化。對使用高維域的參數(shù)(六個或十二個角參數(shù))的優(yōu)化是困難的，并且圖像的壓縮對于使用的參數(shù)具有非平滑依賴性。一般地，通過使用蒙特卡羅方法來解決該困難。蒙特卡羅方法的核心在于執(zhí)行多個嘗試。即，從幾個點(diǎn)測量壓縮率，然后選擇最佳點(diǎn)。在蒙特卡羅方法中，多維域中的隨機(jī)點(diǎn)的質(zhì)量是很重要的(具體地，根據(jù)維數(shù)的升高質(zhì)量更加重要)。偽隨機(jī)點(diǎn)優(yōu)選為均衡柵格點(diǎn)。這將參照二維OD)情況在圖13中描述。圖13示出根據(jù)另一示例性實施例的偽隨機(jī)點(diǎn)。圖13的左示圖示出均衡柵格點(diǎn)，圖13的右示圖示出根據(jù)偽隨機(jī)處理的第一十六個占
I ；^ O在使用均衡柵格點(diǎn)的情況下，不管蒙特卡羅方法的十六個點(diǎn)，僅針對第一參數(shù) (和第二參數(shù))檢查四個不同值。另一方面，在使用偽隨機(jī)的情況下，通過十六個點(diǎn)針對第一參數(shù)(和第二參數(shù))檢查十六個不同值。即，當(dāng)使用偽隨機(jī)點(diǎn)時，針對十六個點(diǎn)充分檢查第一參數(shù)和第二參數(shù)的各個值。具體地說，針對蒙特卡羅方法，根據(jù)參數(shù)的數(shù)量的增加，偽隨機(jī)點(diǎn)的使用比均衡柵格點(diǎn)的使用更有益。<步驟3-萊默偽隨機(jī)數(shù)>可通過使用各種方法產(chǎn)生偽隨機(jī)序列。最有效的方法之一是使用萊默數(shù)。這是人工產(chǎn)生的序列，并接近于被均衡地分布的真實隨機(jī)數(shù)。用于產(chǎn)生萊默序列的算法是公知的，因此這里省略對其的詳細(xì)描述。根據(jù)示例性實施例，提供至少IO13個不重復(fù)點(diǎn)。萊默序列是人造序列，并且用于產(chǎn)生萊默序列的算法是公知的，因此解碼器可容易地對其進(jìn)行再計算。通過使用萊默序列，可通過使用一個信息(即，隨機(jī)序列中的數(shù)量)來對角參數(shù)的組合編碼。在六維(在4X4頻率系數(shù)矩陣的情況下)或十二維(在8X8頻率系數(shù)矩陣的情況下)參數(shù)域中，產(chǎn)生與角參數(shù)的組合對應(yīng)的隨機(jī)點(diǎn)，在通過使用隨機(jī)點(diǎn)執(zhí)行壓縮之后測量壓縮率，然后選擇最佳參數(shù)點(diǎn)。與最佳參數(shù)點(diǎn)對應(yīng)的萊默序列的數(shù)量被存儲或發(fā)送，而不是存儲或發(fā)送角參數(shù)的組合。如果對2Ρ個點(diǎn)(即，蒙特卡羅方法中的角參數(shù)的組合)執(zhí)行R0T，則只有ρ比特的信息被包括作為系統(tǒng)開銷。<步驟4-用于最佳角參數(shù)的音域的定位>
16
根據(jù)一個或多個示例性實施例，最佳旋轉(zhuǎn)角具有接近0度或180度(π弧度)的值。這意味著用于轉(zhuǎn)換到頻域的要素(例如，DCT要素或KLT要素)幾乎被優(yōu)化。因此，根據(jù)一個或多個示例性實施例的角參數(shù)僅用于執(zhí)行行之間和列之間的一個或多個值的部分交換(對在歐拉角的情況下的接近0度的角)，或執(zhí)行所述部分交換和要素元素的符號的改變(在歐拉角的情況下接近180度的角)。即，用于一個或多個示例性實施例的參數(shù)的音域被限制為域的特定部分，該限制被稱為定位。通過對參數(shù)的音域執(zhí)行定位，關(guān)于系統(tǒng)開銷的比特的數(shù)量減小。如果假設(shè)圖13 中的將被檢查的點(diǎn)被限制為特定部分，則將被檢查以搜索角參數(shù)的最佳組合的點(diǎn)的數(shù)量減少。此外，如果將被檢查的點(diǎn)的數(shù)量是固定的(即，在用作系統(tǒng)開銷的比特的數(shù)量是固定的情況下)，并且應(yīng)用定位，則可檢查在較小角中的更多點(diǎn)，從而可增加壓縮率?！床襟E5-準(zhǔn)最佳要素〉通過執(zhí)行上述步驟1至步驟4，可關(guān)于所有塊(大小等于或大于4X4和8X8的塊)選擇最佳要素。可以以高比特率將具有8或10字節(jié)的系統(tǒng)開銷添加到每個塊。當(dāng)比特率減小時，優(yōu)選選擇準(zhǔn)最佳要素。準(zhǔn)最佳要素意味著相同的旋轉(zhuǎn)應(yīng)用于包括在像條或畫面中的所有變換單位的組或變換單位的一些。如果最佳選擇應(yīng)用于每個塊，則關(guān)于圖像的壓縮率增加，而系統(tǒng)開銷也增加。為了確定變換單位、變換單位的組合、像條和畫面中的哪個單位應(yīng)用了相同旋轉(zhuǎn)，可執(zhí)行各種試驗。在以低比特率變換到頻域之后，頻率系數(shù)矩陣的許多部分中的量化系數(shù)值變?yōu)?。因此，針對頻率系數(shù)矩陣的部分，不必須執(zhí)行ROT和發(fā)送關(guān)于旋轉(zhuǎn)角度值的附加信息。圖像編碼設(shè)備900通過使用蒙特卡羅方法對多個角參數(shù)的組合執(zhí)行R0T，并重復(fù)地執(zhí)行量化和熵編碼，從而確定角參數(shù)的最佳組合。此外，圖像編碼設(shè)備900不對角參數(shù)編碼，而將萊默偽隨機(jī)序列數(shù)編碼為關(guān)于確定的角參數(shù)的最佳組合的信息。這里，通過使用定位和準(zhǔn)最佳要素，關(guān)于角參數(shù)的信息可以以更高的效率被編碼。圖14是根據(jù)另一示例性實施例的圖像解碼設(shè)備1400的框圖。圖14的圖像解碼設(shè)備1400可以是包括在圖2的圖像解碼設(shè)備200中的模塊或包括在圖5的圖像解碼器500 中的模塊，并且圖像解碼設(shè)備1400執(zhí)行稍后描述的圖像解碼過程。參照圖14，圖像解碼設(shè)備1400包括熵解碼器1410、逆量化器1420和逆變換器1430。熵解碼器1410接收比特流，并對預(yù)定塊的調(diào)整后的頻率系數(shù)矩陣執(zhí)行熵解碼。調(diào)整后的頻率系數(shù)矩陣以如下方式產(chǎn)生通過將預(yù)定塊變換到頻域來產(chǎn)生頻率系數(shù)矩陣，并且對頻率系數(shù)矩陣執(zhí)行ROT。此外，對于逆R0T，熵解碼器1410可對關(guān)于在ROT中使用的角參數(shù)的信息解碼。與熵編碼器930類似，熵解碼器1410通過使用CABAC或CAVLC執(zhí)行熵解碼。逆量化器1420對由熵解碼器1410熵解碼的調(diào)整后的頻率系數(shù)矩陣逆量化。根據(jù)編碼操作的量化步驟執(zhí)行逆量化。逆變換器1430通過對調(diào)整后的頻率系數(shù)矩陣執(zhí)行逆ROT來產(chǎn)生頻率系數(shù)矩陣，并將頻率系數(shù)矩陣逆變換到像素域。這將參照圖15進(jìn)行詳細(xì)描述。
圖15是根據(jù)另一示例性實施例的逆變換器1430的示圖。參照圖15，逆變換器1430包括逆ROT執(zhí)行單元1510和逆變換執(zhí)行單元1520。逆ROT執(zhí)行單元1510對從逆量化單元1420接收的逆量化的調(diào)整后的頻率系數(shù)矩陣執(zhí)行逆ROT。逆ROT執(zhí)行單元1510逆執(zhí)行關(guān)于圖IlA到圖11C、圖12和圖13描述的 ROT。這里，逆ROT執(zhí)行單元1510可通過參考關(guān)于由熵解碼器1410熵解碼的角參數(shù)的信息來執(zhí)行逆ROT。根據(jù)關(guān)于角參數(shù)的信息，調(diào)整后的頻率系數(shù)矩陣的行之間和列之間的一個或多個值被部分交換，從而產(chǎn)生頻率系數(shù)矩陣。在對僅包括頻率系數(shù)矩陣1110的一些系數(shù)的頻率系數(shù)矩陣1120執(zhí)行ROT的情況下，對僅包括所述一些系數(shù)的頻率系數(shù)矩陣1120執(zhí)行逆R0T，從而產(chǎn)生頻率系數(shù)矩陣1110。逆變換執(zhí)行單元1520從逆ROT執(zhí)行單元1510接收頻率系數(shù)矩陣，并將頻率系數(shù)矩陣變換到像素域。通過逆執(zhí)行DCT或KLT，逆變換執(zhí)行單元1520可對頻率系數(shù)矩陣逆變換。作為逆變換的結(jié)果，重構(gòu)像素域的預(yù)定塊。圖16是根據(jù)示例性實施例的對圖像編碼的方法的流程圖。參照圖16，在操作1610，圖像編碼設(shè)備通過將預(yù)定塊變換到頻域來產(chǎn)生頻率系數(shù)矩陣。圖像編碼設(shè)備接收預(yù)定塊，對預(yù)定塊執(zhí)行DCL或KLT，然后產(chǎn)生包括頻域的系數(shù)的頻率系數(shù)矩陣。在操作1620，圖像編碼設(shè)備通過執(zhí)行在操作1610中產(chǎn)生的頻率系數(shù)矩陣的行之間和列之間的一個或多個值的部分交換來產(chǎn)生調(diào)整后的頻率系數(shù)矩陣。圖像編碼設(shè)備通過對頻率系數(shù)矩陣執(zhí)行參照圖IlA到11C、圖12和圖13描述的ROT來產(chǎn)生調(diào)整后的頻率系數(shù)矩陣。當(dāng)頻率系數(shù)矩陣的大小是大的(例如，等于或大于16X16的大小)時，可選擇僅包括頻率系數(shù)矩陣的一些系數(shù)的矩陣，然后可對僅包括所述一些系數(shù)的矩陣執(zhí)行ROT。在僅包括一些系數(shù)的矩陣的選擇中，可選擇僅包括關(guān)于低頻分量的系數(shù)的矩陣。在操作1630，圖像編碼設(shè)備對在操作1620產(chǎn)生的調(diào)整后的頻率系數(shù)矩陣進(jìn)行量化。根據(jù)預(yù)定量化步長對調(diào)整后的頻率系數(shù)矩陣進(jìn)行量化。在操作1640，圖像編碼設(shè)備對在操作1630量化的調(diào)整后的頻率系數(shù)矩陣執(zhí)行熵編碼。通過使用CABAC或CAVLC執(zhí)行熵編碼。在操作1640，圖像編碼設(shè)備還對關(guān)于在操作 1620在行之間和列之間的一個或多個值的部分交換中使用的角參數(shù)的信息執(zhí)行熵編碼。所述角參數(shù)是指示行之間和列之間的一個或多個值的部分交換的水平的參數(shù)。圖像編碼設(shè)備可對多個角參數(shù)的組合重復(fù)地執(zhí)行操作1620至操作1640，從而可確定最佳角參數(shù)。通過對多個角參數(shù)的組合重復(fù)地執(zhí)行編碼，可選擇指示最佳壓縮率的角參數(shù)?？赏ㄟ^使用蒙特卡羅方法選擇多個角參數(shù)的組合，并且多個角參數(shù)的組合可與萊默偽隨機(jī)數(shù)對應(yīng)。在多個角參數(shù)的組合與萊默偽隨機(jī)數(shù)對應(yīng)的情況下，在操作1640被編碼的關(guān)于角參數(shù)的信息可以是與確定的最佳角參數(shù)對應(yīng)的萊默偽隨機(jī)序列數(shù)。圖17是根據(jù)另一示例性實施例的對圖像解碼的方法的流程圖。參照圖17，在操作1710，圖像解碼設(shè)備接收關(guān)于預(yù)定塊的比特流，并對關(guān)于角參數(shù)的信息和調(diào)整后的頻率系數(shù)矩陣執(zhí)行熵解碼。調(diào)整后的頻率系數(shù)矩陣是通過對所有的頻率系數(shù)矩陣或一些頻率系數(shù)矩陣執(zhí)行ROT形成的矩陣。
在操作1720，圖像解碼設(shè)備對在操作1710被熵解碼的調(diào)整后的頻率系數(shù)矩陣進(jìn)行逆量化。圖像解碼設(shè)備根據(jù)在圖像解碼中使用的量化步長對調(diào)整后的頻率系數(shù)矩陣的系數(shù)進(jìn)行逆量化。在操作1730，圖像解碼設(shè)備通過執(zhí)行在操作1720被逆量化的調(diào)整后的頻率系數(shù)矩陣的行之間和列之間的一個或多個值的部分交換來產(chǎn)生頻率系數(shù)矩陣。圖像解碼設(shè)備通過逆執(zhí)行參照圖IlA到圖11C、圖12和圖13描述的ROT來產(chǎn)生評論系數(shù)矩陣，其中，通過參考關(guān)于在操作1710中被熵解碼的角參數(shù)的信息來逆執(zhí)行ROT。如上所述，在僅包括頻率系數(shù)矩陣的一些系數(shù)的矩陣在編碼過程中被旋轉(zhuǎn)地變換的情況下，對僅包括一些系數(shù)的矩陣執(zhí)行逆R0T，從而產(chǎn)生頻率系數(shù)矩陣。在操作1740，圖像解碼設(shè)備對在操作1730產(chǎn)生的頻率系數(shù)矩陣進(jìn)行逆變換。通過對頻率系數(shù)矩陣執(zhí)行DCT或KLT，重構(gòu)頻域的塊。如上所述，根據(jù)示例性實施例的對圖像編碼和解碼的方法和設(shè)備可基于固態(tài)數(shù)學(xué)基礎(chǔ)以更高的壓縮率對頻率系數(shù)矩陣編碼，從而可顯著地提高整體圖像編碼操作的壓縮率。示例性實施例還可被實施為計算機(jī)可讀記錄介質(zhì)上的計算機(jī)可讀代碼。計算機(jī)可讀記錄介質(zhì)是可存儲數(shù)據(jù)的任何數(shù)據(jù)存儲裝置，所述數(shù)據(jù)可由計算機(jī)系統(tǒng)讀取。計算機(jī)可讀記錄介質(zhì)的示例包括只讀存儲器(ROM)、隨機(jī)存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光學(xué)數(shù)據(jù)存儲裝置。計算機(jī)可讀記錄介質(zhì)還可被分布到聯(lián)網(wǎng)的計算機(jī)系統(tǒng)從而計算機(jī)可讀代碼以分布方式被存儲和執(zhí)行。例如，根據(jù)一個或多個示例性實施例的圖像編碼設(shè)備、圖像解碼設(shè)備、圖像編碼器和圖像解碼器中的每個可包括連接到如圖1-2、圖4-5、圖9-10和圖14-15中示出的設(shè)備中的每個單元的總線，并且包括連接到總線的至少一個處理器。此外，根據(jù)一個或多個示例性實施例的圖像編碼設(shè)備、圖像解碼設(shè)備、圖像編碼器和圖像解碼器中的每個可包括連接到至少一個處理器的存儲器從而存儲命令、接收的消息或產(chǎn)生的消息，并執(zhí)行命令，其中，所述至少一個處理器連接到總線。雖然具體地示出了示例性實施例，但是本領(lǐng)域普通技術(shù)人員將理解，在不脫離由權(quán)利要求限定的本發(fā)明的精神和范圍的情況下，可以對其進(jìn)行形式和細(xì)節(jié)的各種改變。應(yīng)僅以說明意義考慮示例性實施例，而不是為了限制的目的。因此，本發(fā)明的范圍不是由示例性實施例的詳細(xì)描述限定的，而是由權(quán)利要求限定的。
權(quán)利要求
1.一種對圖像編碼的方法，所述方法包括產(chǎn)生第一頻率系數(shù)矩陣；通過基于角參數(shù)執(zhí)行第一頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣；對第二頻率系數(shù)矩陣進(jìn)行量化；對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵編碼，其中，角參數(shù)是這樣的參數(shù)，所述參數(shù)指示第一頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換的水平。
2.如權(quán)利要求1所述的方法，其中，角參數(shù)是關(guān)于歐拉角的參數(shù)。
3.如權(quán)利要求1所述的方法，其中，第二頻率系數(shù)矩陣的產(chǎn)生步驟包括將用于執(zhí)行第一頻率系數(shù)矩陣的至少兩行之間的部分交換的矩陣乘以第一頻率系數(shù)矩陣的左側(cè)，將用于執(zhí)行第一頻率系數(shù)矩陣的至少兩列之間的部分交換的矩陣乘以第一頻率系數(shù)矩陣的右側(cè)。
4.如權(quán)利要求3所述的方法，其中，用于執(zhí)行第一頻率系數(shù)矩陣的至少兩行之間的部分交換的矩陣為
5.如權(quán)利要求1所述的方法，還包括針對不同的角參數(shù)重復(fù)地執(zhí)行以下操作通過執(zhí)行第一頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣，對第二頻率系數(shù)矩陣進(jìn)行量化，對第二頻率系數(shù)矩陣進(jìn)行熵編碼；從不同角參數(shù)中選擇與最高壓縮率對應(yīng)的角參數(shù)。
6.如權(quán)利要求5所述的方法，其中，從不同角參數(shù)中選擇角參數(shù)的步驟包括針對不同角參數(shù)并通過使用蒙特卡羅方法重復(fù)地執(zhí)行以下操作通過執(zhí)行第一頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣，對第二頻率系數(shù)矩陣進(jìn)行量化，對第二頻率系數(shù)矩陣進(jìn)行熵編碼；從不同角參數(shù)中選擇與最高壓縮率對應(yīng)的角參數(shù)。
7.如權(quán)利要求5所述的方法，其中，選擇角參數(shù)的步驟包括將不同角參數(shù)與隨機(jī)序列對應(yīng)；針對不同角參數(shù)重復(fù)地執(zhí)行以下操作通過執(zhí)行第一頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣，對第二頻率系數(shù)矩陣進(jìn)行量化，對第二頻率系數(shù)矩陣進(jìn)行熵編碼；從不同角參數(shù)中選擇與最高壓縮率對應(yīng)的角參數(shù)，其中，對關(guān)于角參數(shù)的信息進(jìn)行熵編碼的步驟包括將與選擇的角參數(shù)對應(yīng)的隨機(jī)序列的數(shù)量編碼為關(guān)于角參數(shù)的信息。
8.如權(quán)利要求1所述的方法，其中，產(chǎn)生第二頻率系數(shù)矩陣的方法包括選擇僅包括第一頻率系數(shù)矩陣的一些系數(shù)的矩陣；通過基于角參數(shù)執(zhí)行包括所選擇的系數(shù)的矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣。
9.一種圖像編碼設(shè)備，包括變換器，產(chǎn)生第一頻率系數(shù)矩陣，通過基于角參數(shù)執(zhí)行第一頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣；量化單元，對第二頻率系數(shù)矩陣進(jìn)行量化；熵編碼器，對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵編碼，其中，角參數(shù)是這樣的參數(shù)，所述參數(shù)指示第一頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換的水平。
10.一種對圖像解碼的方法，所述方法包括對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵解碼；對第二頻率系數(shù)矩陣進(jìn)行逆量化；通過基于角參數(shù)執(zhí)行第二頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第一頻率系數(shù)矩陣；將第一頻率系數(shù)矩陣逆變換為像素域，并重構(gòu)預(yù)定塊，其中，角參數(shù)是這樣的參數(shù)，所述參數(shù)指示第二頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換的水平。
11.如權(quán)利要求10所述的方法，其中，角參數(shù)是關(guān)于歐拉角的參數(shù)。
12.如權(quán)利要求10所述的方法，其中，第一頻率系數(shù)矩陣的產(chǎn)生步驟包括將用于執(zhí)行第二頻率系數(shù)矩陣的至少兩行之間的部分交換的矩陣乘以第二頻率系數(shù)矩陣的左側(cè)，將用于執(zhí)行第二頻率系數(shù)矩陣的至少兩列之間的部分交換的矩陣乘以第二頻率系數(shù)矩陣的右側(cè)。
13.一種圖像解碼設(shè)備，包括熵解碼器，對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵解碼；逆量化單元，對第二頻率系數(shù)矩陣進(jìn)行逆量化；逆變換器，通過基于角參數(shù)執(zhí)行第二頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第一頻率系數(shù)矩陣；將第一頻率系數(shù)矩陣逆變換到像素域，并重構(gòu)預(yù)定塊，其中，角參數(shù)是這樣的參數(shù)，所述參數(shù)指示第二頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換的水平。
14.一種記錄有當(dāng)被計算機(jī)執(zhí)行時執(zhí)行對圖像編碼的方法的程序的計算機(jī)可讀記錄介質(zhì)，所述方法包括產(chǎn)生第一頻率系數(shù)矩陣；通過基于角參數(shù)執(zhí)行第一頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣；對第二頻率系數(shù)矩陣進(jìn)行量化；對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵編碼，其中，角參數(shù)是這樣的參數(shù)，所述參數(shù)指示第一頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換的水平。
15.一種記錄有當(dāng)被計算機(jī)執(zhí)行時執(zhí)行對圖像解碼的方法的程序的計算機(jī)可讀記錄介質(zhì)，所述方法包括對第二頻率系數(shù)矩陣和關(guān)于角參數(shù)的信息進(jìn)行熵解碼；對第二頻率系數(shù)矩陣進(jìn)行逆量化；通過基于角參數(shù)執(zhí)行第二頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換來產(chǎn)生第一頻率系數(shù)矩陣；將第一頻率系數(shù)矩陣逆變換到像素域，并重構(gòu)預(yù)定塊，其中，角參數(shù)是這樣的參數(shù)，所述參數(shù)指示第二頻率系數(shù)矩陣的至少兩行之間或至少兩列之間的一個或多個值的部分交換的水平。
全文摘要
提供了一種對圖像編碼的方法和設(shè)備。所述方法和設(shè)備包括對第二頻率系數(shù)矩陣進(jìn)行量化和熵編碼，其中，通過執(zhí)行第一頻率系數(shù)矩陣的行之間和列之間的一個或多個值的部分交換來產(chǎn)生第二頻率系數(shù)矩陣。還提供了一種用于對通過使用用于對圖像編碼的方法和設(shè)備編碼的圖像數(shù)據(jù)解碼的方法和設(shè)備。
文檔編號H04N7/26GK102484702SQ201080036019
公開日2012年5月30日申請日期2010年8月13日優(yōu)先權(quán)日2009年8月13日
發(fā)明者亞歷山大·阿爾辛, 艾琳娜·阿爾辛娜, 范迪姆·謝廖金申請人:三星電子株式會社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：艾琳娜·阿爾辛娜;亞歷山大·阿爾辛;范迪姆·謝廖金
技術(shù)所有人：三星電子株式會社
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

圖像編解碼相關(guān)技術(shù)

jpeg的圖像編解碼相關(guān)技術(shù)

圖像編解碼哈夫曼編碼相關(guān)技術(shù)

關(guān)于jpeg的圖像編解碼相關(guān)技術(shù)

jpeg圖像編解碼相關(guān)技術(shù)

bmp圖像huffman編解碼相關(guān)技術(shù)

dsc圖像編解碼相關(guān)技術(shù)

變換編碼解碼后的誤差相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于通過使用旋轉(zhuǎn)變換對圖像編碼和解碼的方法和設(shè)備的制作方法