專利名稱:將信號編碼成可調(diào)節(jié)比特流和解碼這種比特流的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于使用位平面編碼(bit-plane coding)把信號編碼成可調(diào)節(jié)比特流的方法和設(shè)備。本發(fā)明還涉及用于解碼這種可調(diào)節(jié)比特流的相應(yīng)方法和設(shè)備。本發(fā)明更具體而言涉及可調(diào)節(jié)基于DCT的圖像壓縮中DCT系數(shù)的位平面壓縮(bit-plane compression)。
背景技術(shù):
在國際專利申請W02005/112467中公開了可調(diào)節(jié)基于DCT的圖像壓縮的現(xiàn)有技術(shù)方法。該方法被構(gòu)想用于在也稱作無線HD的高清電視信號的無線傳輸中使用,特別是用于把墻壁裝配的HDTV純平監(jiān)視器以不可見方式連接到外界HDTV信號源的目的。在無線HD方面的現(xiàn)有技術(shù)壓縮方法的實驗評估中,發(fā)明人發(fā)現(xiàn),對于一定的計算機圖形內(nèi)容期望壓縮性能的改進。對于無線HD,應(yīng)當支持自然圖像內(nèi)容和圖形內(nèi)容這二者, 但是現(xiàn)有技術(shù)方法被設(shè)計成用于自然圖像內(nèi)容的壓縮以及并未專門地對于圖形內(nèi)容優(yōu)化。發(fā)明的目的和內(nèi)容
本發(fā)明旨在改進現(xiàn)有技術(shù)可調(diào)節(jié)壓縮方法的性能,以使得可以對于自然和圖形內(nèi)容這二者使用單個壓縮方法。這將會顯著簡化設(shè)計和降低無線HD實施的復(fù)雜性。在第一方面中,本發(fā)明定義了一種編碼包括值區(qū)塊(block of values)的信號以獲得可調(diào)節(jié)比特流的方法。每個區(qū)塊被表示成位平面(bit plane)的序列,其中,所述值的最顯著位形成最顯著的位平面,以及所述值的各個較低顯著位形成各個較低顯著 (significant)位平面。對于每個位平面,以選定分區(qū)包圍所有置位(set bit)的這種方式,根據(jù)多個方法之中的選定方法創(chuàng)建分區(qū)(partition)。向比特流傳輸?shù)氖亲R別選定方法的標識和表示分區(qū)的位的數(shù)據(jù)。優(yōu)選地,該方法應(yīng)用于變換系數(shù)的區(qū)塊。通過本發(fā)明取得的是,可以對于每個單個位平面選擇最優(yōu)的分區(qū)策略。分區(qū)的實例是,
-通過它的最高行號和最高列號定義的矩形分區(qū), -通過它的最低行號和最低列號定義的矩形分區(qū), -通過它的最高次序號定義的一維掃描, -通過它的最低次序號定義的一維掃描, -已經(jīng)對其在先前位平面中發(fā)送了位的位置的模式。由于無需把分區(qū)的進一步屬性諸如尺寸或地點添加到比特流,所以后者的實例特別有益。在本發(fā)明的進一步實施例中,該方法包括步驟連同實際分區(qū)一起傳輸新值的符號位,對于該新值,尚未在先前位平面中發(fā)送比特。在第二方面中,本發(fā)明定義了解碼這種編碼信號的相應(yīng)方法。以可能截短比特流的形式接收信號,以使得一個或更多個較低顯著位平面可能丟失。對于每個接收的位平面, 基于表示分區(qū)中位平面的位的數(shù)據(jù)和標識重建位平面的分區(qū)。
本發(fā)明進一步定義了相應(yīng)編碼和解碼裝置、以及表示編碼信號的(可能截短)比特流。
圖1示出了值區(qū)塊的位層結(jié)構(gòu)。圖2和3示出了可以在根據(jù)本發(fā)明的編碼方法中使用的分區(qū)方案的實例。圖4示出了用以說明按照本發(fā)明的壓縮的通常流程的流程圖。圖5示出了說明解碼器對比特流的解壓縮的流程圖。
具體實施例方式圖1說明了值區(qū)塊的位層結(jié)構(gòu),例如,圖像區(qū)塊的DCT系數(shù)。位層結(jié)構(gòu)包括符號平面BPskn和從最顯著位平面BPmsb至最低顯著位平面BP,Wi個位平面。在此實例中,DCT 系數(shù)的范圍可以從一 2047至2047。每個位平面包括具有特定顯著性的位。在下文中把位平面中的一(或非零)位稱作“置”位。顯然,可以反轉(zhuǎn)一和零的含義。圖1中的給定層較之顯著性較低的所有層一起而言包含更多能量。為了首先提取最重要信息,以最重要位平面BPmsb開始,逐位平面地處理信息區(qū)塊。此規(guī)則的例外可以是, 首先整體發(fā)送通常最重要的DC系數(shù)。此所得比特流在可以在任何位置處截短它的意義上可調(diào)節(jié)。比特流越遲截短,重建圖像時的殘差(residual error)越小。在每個位平面中,選擇包圍位平面所有置位的位平面區(qū)域。在現(xiàn)有技術(shù)方法中, 按照預(yù)定分區(qū)方案選擇所述區(qū)域(進一步稱作區(qū)段(zone)或分區(qū))。圖2和3示出了取自 W02005/112467的分區(qū)方案的實例。圖2說明了包圍位平面所有置位的二維矩形區(qū)段(zone)。通過最高行號Rmax和最高列號Cmax定義分區(qū)。圖2中示出的分區(qū)因而通過Rmax = 3、CMAX = 4定義,以及包括20個位,其中六個是置位(set)。圖3說明了一維分區(qū)(partition)。此分區(qū)遵照位平面上的預(yù)定鋸齒形路徑。在此情形中,通過具有置位的最高次序號Smax定義分區(qū)。圖3中,其中環(huán)繞了置位的位置(對比圖2),通過Smax= 18定義分區(qū)。區(qū)段包括19個位置,其中六個為置位的。應(yīng)當注意,說明的位置次序雖然優(yōu)選但只是實例。其它位置次序是可行的。圖2和3中示出的分區(qū)構(gòu)建連續(xù)位平面區(qū)域。也可以使用不連續(xù)分區(qū)。在現(xiàn)有技術(shù)方法中,發(fā)送預(yù)定分區(qū)的參數(shù)(二維矩形區(qū)段的參數(shù)1^ 、Cmax,一維分區(qū)的參數(shù)Smax)和分區(qū)中所有系數(shù)的位值。進一步地,如果存在則發(fā)送“新”系數(shù)的符號位。 新系數(shù)是尚未在先前位平面中處理的分區(qū)中的那些系數(shù),即,它們在先前傳輸?shù)奈黄矫娣謪^(qū)外部的位置。顯然,BPmsb分區(qū)中的所有系數(shù)是新的。之后,方法前往接下來的位平面,直到處理了所有位平面為止。位平面編碼中的挑戰(zhàn)是,找到把位平面內(nèi)容傳輸給解碼器的最高效方式。對于自然圖像內(nèi)容,證明了上述(Rmx,Cmax)或Smax區(qū)段提供良好解決方案。然而,通過分析各種計算機圖形圖像,發(fā)明人發(fā)現(xiàn),已知矩形或線性區(qū)段模式并非總是高效壓縮這種內(nèi)容的DCT 系數(shù)位平面。因此,提出了添加與圖形內(nèi)容的位平面模式較好匹配的位平面編碼的額外模式。并非使用用于編碼所有位平面的單個固定方法(或單個模式),編碼器現(xiàn)在選擇數(shù)個替選方法/模式中的一個,以及向解碼器傳輸標識用以表明選擇了哪個方法(例如,矩形或一維分區(qū)),如果存在則加上選定方法/模式的參數(shù)(如,分別地,Rmx、Cmax或CMX),隨之是使用選定方法壓縮的位平面信息。把此方法稱作SMART (多個替選方案的選擇)。在圖4中說明了按照本發(fā)明的壓縮的通常流程。對于DCT系數(shù)區(qū)塊的每個位平面 (步驟101、102)發(fā)送以下數(shù)據(jù)
-在步驟1中,選擇了用以識別分區(qū)的哪個分區(qū)模式和/或編碼方法的標識。注意, 模式/編碼方法可以對于同樣DCT區(qū)塊的不同位平面不同。
-在步驟2中,使用選定壓縮模式/方法的,每個系數(shù)的當前位平面中的大小位 (magnitude bits)。
-在步驟3中,在當前位平面中變得顯著的每個系數(shù)的符號位。如果它在該位平面中第一次具有置位,則系統(tǒng)在位平面中變得顯著。顯然,這需要編碼器跟蹤這些系數(shù)的位置。有益地,單獨對待DC系數(shù),所以不使用以上方法發(fā)送而是單獨發(fā)送DC系數(shù)的大小位(magnitude bit)。步驟2的替選方案將會是不發(fā)送當前分區(qū)_系數(shù)的大小位,而是只有在早前位平面中變得顯著的系數(shù)和在當前位平面中變得顯著(在此位平面中第一次具有置位)的系數(shù)的大小位。步驟3的替選方案將會是如在現(xiàn)有技術(shù)壓縮方法中進行的一樣發(fā)送分區(qū)中所有系數(shù)的符號位(和使得它們顯著)。在此情形中,在位平面中具有非零大小位并非系數(shù)變得顯著的條件?,F(xiàn)在一旦系數(shù)第一次在分區(qū)中出現(xiàn)就發(fā)送系數(shù)的符號位。它引起有些較簡單的實施(因為較少數(shù)據(jù)相關(guān)性),但是在區(qū)段/模式未良好地與數(shù)據(jù)匹配(發(fā)現(xiàn)了是使用現(xiàn)有技術(shù)方法的一定圖形內(nèi)容的情形)時會低效。在有益的實施例中,檢查當前位平面是否包括新系數(shù)。如果不存在新顯著系數(shù),則只對于此前顯著系數(shù)發(fā)送細化位。在此實施例中,選定分區(qū)事實上是此前顯著系數(shù)(即,在先前位平面中已經(jīng)發(fā)送符號位的系數(shù))的位置模式。這在步驟1中如此識別。無需傳輸關(guān)于分區(qū)形式或它的參數(shù)的進一步數(shù)據(jù)。顯然,這需要編碼器以及解碼器跟蹤顯著系數(shù)的位置。如果在當前位平面中存在新顯著系數(shù),則如前所述找到和傳輸包含所有非零位的最小區(qū)段(例如,R AX、Cmx區(qū)段模式),隨之是該區(qū)段內(nèi)部每個系數(shù)(可能除了 DC系數(shù)以外,如以上所解釋的)的大小位。關(guān)于步驟1,已經(jīng)提到的矩形(RMAX,CMAX)模式和線性SMAX模式的替選或額外壓縮區(qū)段/模式是
1.包含當前已知顯著系數(shù)的一定距離(例如,曼哈頓或歐式)內(nèi)所有系數(shù)的數(shù)據(jù)自適應(yīng)模式。此模式的動機是接近已經(jīng)已知顯著系數(shù)的系數(shù)常常變得顯著。這是以上提到的有益實施例的概括,其只使用自當前顯著系數(shù)起距離零的系數(shù)。
2.與1一樣,但是現(xiàn)在限于一定距離。例如,只考慮豎直方向上的“鄰近者”。(或者只在水平或?qū)蔷€方向上)。
3.與1和2—樣,但是排除某些系數(shù)。特別是例如包含只在“偶數(shù)”距離(0、2、4、···) 的鄰近者,所以排除在奇數(shù)距離(1、3、…)的鄰近者。
4.使用交替掃描次序的SMAX區(qū)段)。
65.從最高頻率(而非從DC)開始的RMIN、CMIN (或SMIN)區(qū)段模式。
6.替選已知位平面編碼方法,如例如國際專利申請W02003/045067或MPEG4-FGS標準或公共文獻中描述的(RUN,Ε0Ρ)方法。當然,壓縮方法的選取越大,用于識別選定方法的開銷將會越高。然而,通常使用較好擬合區(qū)段/模式的增益比用以識別方法的開銷更加高。此外,可以應(yīng)用額外熵編碼(例如,算術(shù)編碼)以進一步減少標識信息開銷。顯然,解碼器進行逆運算以重建信號或在截短接收比特流的情況下,值的原始區(qū)塊的最重要部分。圖5示出了說明解碼器進行的運算的流程圖。對于每個位平面(步驟21、 22),執(zhí)行以下步驟。在步驟23中,接收識別選定分區(qū)模式和/或編碼制式的標識,以及(如果存在)這種區(qū)段的參數(shù)⑶口,矩形區(qū)段的Rmx、Cmax, Rmin, Cmin,線性區(qū)段的Smajo ^ )。在步驟M中,根據(jù)它的標識和參數(shù)重建當前分區(qū)。注意,標識可能已經(jīng)表明在當前位平面中不存在新系數(shù)和分區(qū)通過此前顯著系數(shù)的位置定義。在該情形中,解碼器根據(jù)此前顯著系數(shù)(對于該系數(shù),解碼器在步驟沈中作了記錄,見下面)的位置重建分區(qū)。獲知分區(qū),解碼器現(xiàn)在獲知比特流中的多少后續(xù)位是大小位。在步驟25中,解碼器從比特流讀取它們和相應(yīng)地細化各個系數(shù)。已經(jīng)跟蹤之前已經(jīng)處理的系數(shù),解碼器現(xiàn)在還獲知對于多少和哪些系數(shù)真正首次剛剛接收了大小位。如果存在則對于這些新系數(shù),隨后在步驟沈中接收符號位。在此步驟中,把符號位分配給各個系數(shù),以及把它們的各個位置標記成顯著。總之,本發(fā)明涉及信號(例如,DCT變換域中的圖像或視頻信號)的位平面編碼方法。按顯著性的次序逐位平面地傳輸DCT區(qū)塊的位平面。由于每個平面較之較低顯著層一起而言包含更多信號能量,所得比特流在可以在任何位置處截短它的意義上可調(diào)節(jié)。比特流越遲截短,重建圖像時的殘差越小。對于每個位平面,創(chuàng)建含有該位平面中DCT系數(shù)的所有非零位的位平面的區(qū)段或分區(qū)。按照依賴實際位平面和/或總體信號的內(nèi)容從多個選項中選擇的策略創(chuàng)建分區(qū)??梢暂^之對于圖形內(nèi)容而言對于自然圖像使用不同區(qū)段(zoning)策略,以及策略可以隨著位平面而變化。每個分區(qū)的形式以及諸如尺寸的其它屬性可以因而理想地適用于內(nèi)容。可以在圖像內(nèi)或甚至在DCT區(qū)塊內(nèi)混合二維矩形區(qū)段和一維鋸齒掃描區(qū)段。把選定區(qū)段創(chuàng)建策略連同實際分區(qū)中的DCT系數(shù)位一起,嵌入在比特流中。
權(quán)利要求
1.一種編碼包括值區(qū)塊的信號以獲得比特流的方法,該方法包括步驟-把區(qū)塊表示成位平面的序列,其中,所述值的最顯著位形成最顯著位平面,以及所述值的各個較低顯著位形成各個較低顯著位平面;-對于每個位平面以選定分區(qū)包圍所有置位的這種方式,根據(jù)用以創(chuàng)建這種分區(qū)的多個方法之中的選定方法創(chuàng)建所述位平面的分區(qū),-向所述比特流傳輸識別被選定以創(chuàng)建分區(qū)的方法的標識,以及表示所述分區(qū)的位的數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其中,所述值區(qū)塊包括表示所述信號的變換系數(shù)。
3.如權(quán)利要求1或2所述的方法,其中,所述多個創(chuàng)建分區(qū)的方法包括創(chuàng)建由它的最高行號(Rmax)和最高列號(Cmax)定義的矩形分區(qū)。
4.如權(quán)利要求1或2所述的方法,其中,所述多個創(chuàng)建分區(qū)的方法包括創(chuàng)建由它的最低行號(Rmin)和最低列號(Cmin)定義的矩形分區(qū)。
5.如權(quán)利要求1或2所述的方法,其中,所述多個創(chuàng)建分區(qū)的方法包括創(chuàng)建由具有置位的位置的最高次序號(Smax)定義的和與位平面的一維掃描對應(yīng)的分區(qū)。
6.如權(quán)利要求1或2所述的方法,其中,所述多個創(chuàng)建分區(qū)的方法包括創(chuàng)建具有置位的位置的最低次序號(Smin)定義的和與位平面的一維掃描對應(yīng)的分區(qū)。
7.如權(quán)利要求1一 6中任一項所述的方法,進一步包括步驟連同實際分區(qū)一起,傳輸至少在當前位平面中第一次具有置位的值的符號位。
8.如權(quán)利要求7所述的方法,其中,所述多個創(chuàng)建分區(qū)的方法包括把在先前位平面中已經(jīng)發(fā)送其符號位的值的位置模式識別成當前位平面的分區(qū)。
9.一種解碼以可能截短比特流的形式接收的編碼信號的方法,信號包括值區(qū)塊,該方法包括步驟-把要重建的值區(qū)塊表示成位平面的序列,其中,所述值的最顯著位形成最顯著位平面,以及所述值的各個較低顯著位形成各個較低顯著位平面;-對于連續(xù)位平面,接收識別用以創(chuàng)建位平面的分區(qū)的多個方法之中選定方法的標識,以及表示所述分區(qū)中位平面的位的數(shù)據(jù);-根據(jù)各個方法和數(shù)據(jù)重建位平面的所述分區(qū)。
10.如權(quán)利要求9所述的方法,進一步包括步驟連同實際分區(qū)一起,接收至少在當前位平面中第一次具有置位的值的符號位。
11.如權(quán)利要求10所述的方法,其中,響應(yīng)于預(yù)定標識重建分區(qū)的所述步驟包括將所述分區(qū)重建為在先前位平面中已經(jīng)接收其符號位的值的位置模式。
12.一種用于編碼信號的裝置,該裝置被布置成執(zhí)行如權(quán)利要求1所述的方法。
13.一種用于解碼信號的裝置,該裝置被布置成執(zhí)行如權(quán)利要求9所述的方法。
14.一種用于表示編碼信號的可能截短比特流,包括-值區(qū)塊,其中,每個區(qū)塊表示成位平面的序列,所述值的最顯著位形成最顯著位平面,以及所述值的各個較低顯著位形成各個較低顯著位平面;-對于連續(xù)位平面,識別用以創(chuàng)建位平面的分區(qū)的多個方法之中選定方法的標識, 以及表示所述分區(qū)中位平面的位的數(shù)據(jù)。
15.如權(quán)利要求14所述的可能截短比特流,進一步包括連同實際分區(qū)一起,至少在當前位平面中第一次具有置位的值的符號位。
16.如權(quán)利要求15所述的可能截短比特流,包括把在先前位平面中已經(jīng)發(fā)送其符號位的值的位置模式識別成當前位平面的分區(qū)的標識。
全文摘要
本發(fā)明涉及信號(例如,DCT變換域中的圖像或視頻信號)的位平面編碼方法。按顯著性的次序逐位平面地傳輸DCT區(qū)塊的位平面。由于每個平面較之較低顯著層一起而言包含更多信號能量,所得比特流在可以在任何位置處截短它的意義上可調(diào)節(jié)。比特流越遲截短,重建圖像時的殘差越小。對于每個位平面,創(chuàng)建含有該位平面中DCT系數(shù)的所有非零位的位平面的區(qū)段或分區(qū)。按照依賴實際位平面和/或總體信號的內(nèi)容從多個選項中選擇的策略創(chuàng)建分區(qū)。可以較之對于圖形內(nèi)容而言對于自然圖像使用不同區(qū)段策略,策略可以隨著位平面而變化。每個分區(qū)的形式以及諸如尺寸的其它屬性可以因而理想地適用于內(nèi)容??梢栽趫D像內(nèi)或甚至在DCT區(qū)塊內(nèi)混合二維矩形區(qū)段和一維鋸齒掃描區(qū)段。把選定區(qū)段創(chuàng)建策略連同實際分區(qū)中的DCT系數(shù)位一起,內(nèi)置在比特流中。
文檔編號H04N7/26GK102461170SQ201080026986
公開日2012年5月16日 申請日期2010年6月8日 優(yōu)先權(quán)日2009年6月16日
發(fā)明者德里森 B., J. 范德夫魯滕 R. 申請人:皇家飛利浦電子股份有限公司