專利名稱:用于進行圖像壓縮和解壓縮的方法與裝置的制作方法
背景技術(shù):
發(fā)明領(lǐng)域現(xiàn)代計算機和現(xiàn)代計算機網(wǎng)絡(luò)實現(xiàn)了在計算機之間和在計算機和存儲裝置之間的重大信息量的傳送。當(dāng)計算機存取本機存儲裝置時,例如存取本機硬盤驅(qū)動器或本機軟驅(qū)時,可以很快地接入巨大的信息量。然而,當(dāng)經(jīng)過寬域網(wǎng)(WAN)、互聯(lián)網(wǎng)或無線通信信道(蜂窩電話網(wǎng)絡(luò)等)從遠端的存儲單元查找存取數(shù)據(jù)時,數(shù)據(jù)傳送速率明顯要慢。因此傳送大文件要花費大量時間。另外,文件的存儲要使用寶貴的和有限的存儲空間。攝影圖像和類似的圖形圖像通常被認為是大文件,因為一個圖像通常需要有與該圖像中的每個圖象元素或像素有關(guān)的信息。因此照片以及類似的圖形圖像通常需要超過兆字節(jié)以上的存儲空間,因此需要經(jīng)過慢速的網(wǎng)絡(luò)通信發(fā)送許多次。因此,最近幾年制定了用于壓縮攝影圖像的很多的協(xié)議及標準,以便降低存儲該攝影圖像所需要的存儲空間量,并且降低傳送和提交的次數(shù)。這種壓縮方法實際上創(chuàng)建了該原始圖像的數(shù)學(xué)或統(tǒng)計的近似。
壓縮方法可以大致地被成兩個獨立的類別有損壓縮方法,其中一定量的圖像保真度被損耗;換言之,再生圖像的最終檢驗將表現(xiàn)該圖像逼真度的損耗。無損壓縮方法,其中該原始圖像在解碼之后被精確地重建。本發(fā)明旨在一種有效率的圖像壓縮方法和裝置,根據(jù)最初編碼或壓縮該圖像的用戶或系統(tǒng)、或根據(jù)通過與編碼一側(cè)交互而接收和解碼該圖像數(shù)據(jù)的用戶或系統(tǒng)的感興趣區(qū)域的選擇,其中圖像的一部分或幾部分能夠以比該圖像的其它部分更高的重建圖像保真度的標準而被進行壓縮。
相關(guān)技術(shù)的描述當(dāng)前用于壓縮圖像的流行標準被稱之為JPEG或″J-peg″標準。該標準是由聯(lián)合攝影專家組制定,并且被一般用于壓縮靜止圖象,用于存儲或網(wǎng)絡(luò)發(fā)送。最近由Said和Pearlman所作的論文討論了根據(jù)分級樹形組合分段的新圖像編碼和解碼方法(SPIHT)。見Said和Pearlman的“根據(jù)分級樹形組合分段的圖像編解碼器”一文,IEEE學(xué)報,用于視頻技術(shù)的電路和,卷6.3,1996年6月、以及見Said和Pearlman的“圖像多清晰度顯示”一文,IEEE學(xué)報,圖象處理,卷5.9,1996年9月。這些論文的內(nèi)容因此被結(jié)合作為參考。這些參考文獻公開了計算機軟件,當(dāng)裝在一個通用計算機上以及并且運行時,執(zhí)行一方法并且產(chǎn)生一種裝置,其使用整數(shù)子波變換提供比特精確度的有損壓縮和在同一個嵌入比特數(shù)據(jù)流中的無損壓縮或產(chǎn)生一種裝置,其使用非整數(shù)子波變換提供在單一嵌入比特數(shù)據(jù)流中的比特精度的有損壓縮。最初被存儲為一個表示多個單獨像素的二維陣列的一個圖像,根據(jù)用于圖像逐級傳輸?shù)囊粋€變換系數(shù),劃分比特的優(yōu)先級。使用子集分段相對于一個給定的閾值,通過確定重要的或不重要的單元而選擇最重要的信息。由Said和Pearlman公開的逐級發(fā)送方案,首先根據(jù)每個變換系數(shù)的幅值選擇將要發(fā)送的最重要的信息;如果該變換是歸一的,則幅值越大,則從均方誤差(MSE,Dmse())的意義上講,此系數(shù)傳送的信息就越多;Dmse(p-p)=‖P-P‖2N=1NΣiΣj(Pi,j-Pi,j)2]]>其中(i,j)是像素P坐標,因此表示一個象素值。二維陣列c根據(jù)c=Ω(p)編碼,以Ω(·)表示用于一個歸一的分級子帶變換。Said和Pearlman提出假設(shè),根據(jù)具有相對小的比特數(shù)的一個定點二進制格式表示每個像素坐標和像素值,其實現(xiàn)把該單元作為一個整數(shù)處理,用于編碼的目的。通過把一個重建矢量C^]]>設(shè)置到0執(zhí)行重建圖像,并且把該圖像計算為P=Ω-1(C^)]]>N是圖像象素的數(shù)量,因此能夠?qū)崿F(xiàn)上述用于均方差失真的計算。使用數(shù)學(xué)假設(shè),得知該均方差失真測量以‖ci,j‖2/N減小。該事實使象素值能夠根據(jù)其二進制表示排列,首先發(fā)送最高有效位(MSB),并且由于較大信息內(nèi)容的原因,還實現(xiàn)具有較大幅值的像素系數(shù)被首先發(fā)送。該編碼器使用一個算法發(fā)送針對一具體像素坐標的表示最大象素值的一個值、通過子波變換系數(shù)值分類像素坐標,然后輸出各系數(shù)的最高有效位,使用若干分類傳送和改進傳送,以便使用發(fā)送像素坐標的一小部分提供高質(zhì)量的重建圖像。用戶能夠通過設(shè)置比特的數(shù)量在分類傳送和細化傳送中的付出,而設(shè)置一個期望的速率或失真。
發(fā)明概述本發(fā)明是用于對發(fā)送或存儲的圖象進行編碼的方法和裝置,其中一個所使感興趣的區(qū)域(ROI)或該圖像的一個確定區(qū)域被加重,并且用于在發(fā)送之后或從存儲器取出之后對該編碼圖象的解碼。該編碼方法包括,在數(shù)字圖像數(shù)據(jù)中選擇所感興趣的一個區(qū)域或幾個區(qū)域,并且為每個區(qū)域指定優(yōu)先級。執(zhí)行對整個圖像的象素值的子波變換,以便獲得該子波的變換系數(shù),以及標識對應(yīng)于每個感興趣區(qū)域的變換系數(shù)。通過按比例增加這些變換系數(shù)而加重針對所感興趣的每個區(qū)域的變換系數(shù),該方式是把更多的比特分配到這些變換系數(shù),或改進這些系數(shù)的編碼排序。在按比例增加用于每一個感興趣區(qū)域的變換系數(shù)之后,對于整個圖像的變換系數(shù)執(zhí)行量化,以便獲得量化指數(shù)。在另一個選擇中,對應(yīng)于每個感興趣區(qū)域的量化變換系數(shù)的量化指數(shù)將根據(jù)指定到每個感興趣區(qū)域的優(yōu)先級按比例增加。在整個圖像量化之后,執(zhí)行針對每一感興趣區(qū)域的按比例增加。根據(jù)例如編碼排序或比特分配的編碼策略,對于該變換系數(shù)的量化指數(shù)作熵編碼,該策略是通過針對每個感興趣區(qū)域的按比例增加而確定的,以便形成一個數(shù)據(jù)比特數(shù)據(jù)流。形成一個比特數(shù)據(jù)流標題,并且把數(shù)據(jù)比特數(shù)據(jù)流附加到該比特數(shù)據(jù)流標題。對該變換系數(shù)的量化指數(shù)的二進制表示該每一比特字段執(zhí)行熵編碼。使用例如一個二進制算術(shù)編碼技術(shù)的比特平面編碼技術(shù)、或例如SPIHT編碼的一個零-樹形編碼技術(shù)。解碼方法包括從該數(shù)據(jù)比特數(shù)據(jù)流分離該比特數(shù)據(jù)流標題、從該比特數(shù)據(jù)流標題中解碼該比特數(shù)據(jù)流的描述,例如感興趣的一個區(qū)域或幾個區(qū)域的坐標、每個區(qū)域的優(yōu)先級、圖像的尺寸以及子波分解級別的數(shù)量。對應(yīng)于由感興趣的一個或幾個區(qū)域的描述所指定的一個或幾個感性趣的區(qū)域的子波變換系數(shù)被標識,并且通過隨后的解碼排序?qū)υ摂?shù)據(jù)流熵解碼,該解碼排序是由對應(yīng)于每個感興趣區(qū)域的變換系數(shù)的標識結(jié)果和指定到每個感興趣區(qū)域的優(yōu)先級確定的。這形成了包括該變換系數(shù)的量化指數(shù)的一組子帶。或是該解量化變換系數(shù)、或是對應(yīng)于每個感興趣區(qū)域變換系數(shù)的量化指數(shù)被按比例降低。如果在編碼器以此排序執(zhí)行按比例增加和量化,則以此排序執(zhí)行用于整個圖像的變換系數(shù)的解量化以及用于每個感興趣區(qū)域的該量化變換系數(shù)的按比例降低;如果在編碼器以此排序執(zhí)行量化和按比例增加,則以此排序執(zhí)行每一感興趣區(qū)域的量化指數(shù)的按比例降低以及用于整個圖像的量化指數(shù)的解量化。以任一情況中,都執(zhí)行對于量化指數(shù)的解量化,以便獲得量化變換系數(shù)。對于解量化的變換系數(shù)執(zhí)行反相子波變換,以便形成關(guān)于整個圖像的象素值。本發(fā)明中的數(shù)字圖象不僅可以是二維數(shù)字數(shù)據(jù),而且可以是一維數(shù)字數(shù)據(jù),例如話音數(shù)據(jù)、心電圖數(shù)據(jù)、震波數(shù)據(jù)。當(dāng)數(shù)據(jù)是一維時,基于應(yīng)用到該二維數(shù)據(jù)的每一維的子波變換、子帶、ROI系數(shù)識別或反相子波變換的步驟和裝置僅沿著該數(shù)據(jù)的單一維執(zhí)行。
附圖的簡要描述為了本發(fā)明實施例的清晰理解,將參考附圖做描述,其中
圖1示出一個壓縮一個圖像方法,其中通過把更多的比特分配到感興趣的區(qū)域而對選擇的感興趣區(qū)域上的加重;圖2示出解壓縮一個圖像的方法,該圖像利用在一個選擇ROI上的加重而被編碼;圖3A-3F示出ROI系數(shù)定標的一個方法;圖4A和4B示出一個ROI系數(shù)定標方法,其中以不同優(yōu)先級對多個感興趣區(qū)域加重;圖5A-5C示出一個ROI系數(shù)定標方法,該方法使用在用于一個ROI的量化指數(shù)中的某些比特單元,以便加重該ROI;圖6A-6C示出一個ROI系數(shù)定標方法,其中多個感興趣的區(qū)域以不同優(yōu)先級在不同編碼階段加重;圖7A-7D示出在由該ROI系數(shù)定標確定的編碼策略之下,基于一個比特平面的編碼器的量化指數(shù)的熵編碼。
圖8A-8C示出在每個子帶中執(zhí)行比特平面編碼的情況,其中ROI系數(shù)定標僅被使用在某些比特有效級別的比特字段上;圖9示出一個識別過程,僅對于感興趣區(qū)域的邊界像素以及對于屬于定位在感興趣區(qū)域邊界之內(nèi)的一個像素的幾個像素執(zhí)行;圖10A和10B示出由濾波系數(shù)是gA(k)的一個低通濾波器和濾波系數(shù)是fA(k)的一個高通濾波器以及一個間隔地放棄像素或變換系數(shù)的降低取樣器實現(xiàn)的子波變換;圖11示出一個編碼方法,用于以包括變換系數(shù)的一組子帶表示該輸入圖像;圖12示出一個解壓縮一個圖像的方法,該圖像由圖11的編碼方法編碼,具有在一個選擇的感興趣區(qū)域上的加重;圖13示出當(dāng)以逐個塊為基礎(chǔ)進行編碼和解碼時的ROI編碼;圖14是根據(jù)本發(fā)明的編碼的數(shù)據(jù)的另一方法的流程圖;圖15示出一個方法,從而確定用于編碼表示該圖像的數(shù)字數(shù)據(jù)比特總數(shù);
圖16示出本發(fā)明編碼裝置的一種實施例的方框圖;圖17示出本發(fā)明解碼裝置的一種實施例的方框圖;以及圖18示出一個實施例,其中該裝置包括一個編碼該圖像的發(fā)送側(cè),并且把該編碼的數(shù)據(jù)發(fā)送到接收和顯示該圖像的接收方。
最佳實施例的詳細描述本發(fā)明旨在執(zhí)行圖像壓縮的一種方法和裝置,其中由用戶指定的感興趣區(qū)域被加重,以使其以比圖像其余部分更高的逼真度編碼。該加重可以出現(xiàn)在該編碼過程的開始,或從編碼過程的中間開始。如果出現(xiàn)在該編碼過程的中間,則該加重可以在進行編碼的同時由接收編碼比特數(shù)據(jù)流部分的接收方的使用所驅(qū)動。感興趣區(qū)域的加重在變換系數(shù)域中實行,以便不引起圍繞重建圖像上的感興趣區(qū)域的失真邊界。在量化之后在變換系數(shù)上實行加重的一個實施例中,對應(yīng)于感興趣區(qū)域的量化指數(shù)的信息排序被修改,以使感興趣的區(qū)域能夠在逐級重建的較早階段被重建;因此,以低比特率的更高的逼真度重建感興趣的區(qū)域。由于對感興趣區(qū)域的加重只修改該量化指數(shù)的比特字段被編碼所使用的排序,所以該加重不引起任何信息損失。而且該信息排序的修改不僅可適用每個系數(shù)標準,而且可適用該系數(shù)的每個比特字段標準,這不僅改進了圖像的特定部分的質(zhì)量,而且靈便地修改重建每個圖像部分所利用的編碼排序。本發(fā)明的另一實施例是在量化之前加重該變換系數(shù)。本實施例不提供象其它模式那樣的靈活功能,但是有可能以最小的計算復(fù)雜性的增加、在任何比特率以比圖像的其它部分更高的逼真度重建感興趣的區(qū)域。
圖1示出一個用于壓縮圖像的方法,通過把更多的比特分配到感興趣的區(qū)域加重在一個圖像中選擇的感興趣區(qū)域,或在比該感興趣區(qū)域之外的區(qū)域更早編碼過程的階段編碼該感興趣的區(qū)域而壓縮一個圖像。編碼方法100包括步驟101,執(zhí)行對于輸入數(shù)字圖象的象素值的子波變換,以便由包括該變換系數(shù)的一組子帶表示該輸入的圖像。步驟101后面跟著比特分配步驟102和量化步驟103。在步驟102,每一系數(shù)一比特(即系數(shù)的顯示精確度)被指定到每個子帶中的變換系數(shù),以便用數(shù)字化值表示該變換系數(shù),該數(shù)字化值的確定方式是,具有較大變化或較高變換系數(shù)能量的子帶的每一系數(shù)將被分配一個較大的比特數(shù),這等效于被分配一個較小的量化步長。然而,在用于每一子帶或用于全部子帶的每一系數(shù)的比特被預(yù)定的情況中,不執(zhí)行步驟102。每一系數(shù)分配的比特在步驟103中使用。在步驟103,在每個子帶中執(zhí)行對于該變換系數(shù)的量化,以便用量化指數(shù)表示每個子帶的變換系數(shù),其量化指數(shù)代表由每一系數(shù)的分配比特或由用于每個子帶的量化步長指定的精確度。通過步驟103,獲得以一個降低的或相同的變換系數(shù)的顯示精確度表示變換系數(shù)的量化指數(shù)。獲得的量化指數(shù)被輸入到ROI系數(shù)定標步驟107。
在步驟101、102和103的之前、之后或同時,執(zhí)行感興趣區(qū)域選擇步驟104、ROI系數(shù)識別步驟105和ROI坐標描述步驟106。在步驟104,在輸入的圖像上選擇感興趣的區(qū)域,并且選擇的感興趣區(qū)域的坐標輸入到步驟105和106。在步驟105,在每一子帶中的對應(yīng)于選擇的感興趣區(qū)域的子波變換系數(shù),即ROI系數(shù)被標識,以便通過加重在包括子波變換系數(shù)的每一子帶中的ROI系數(shù)加重在該圖像中的所選擇的感興趣的區(qū)域。ROI系數(shù)(即系數(shù)的類別)的識別結(jié)果被輸入到步驟107,該ROI系數(shù)描述該變換系數(shù)是否對應(yīng)于感興趣的區(qū)域或該感興趣區(qū)域的外部區(qū)域。在ROI坐標描述步驟106,選擇的感興趣區(qū)域的坐標被編碼,以便實際發(fā)送或存儲該ROI坐標信息,從而解碼器能夠斷定在該重建圖像中將要加重的感興趣的區(qū)域。在發(fā)送步驟109中,該ROI描述信息被加到比特數(shù)據(jù)流中的標題比特。
在ROI系數(shù)定標步驟107,在從103輸入的量化指數(shù)當(dāng)中,僅用于對應(yīng)于感興趣區(qū)域的變換系數(shù)的量化指數(shù)被加重,其加重方式是使得用于該ROI系數(shù)的量化指數(shù)通過左位移由指定到感興趣區(qū)域的一個優(yōu)先級指示值(S)而被按比例增加,以使用于該ROI系數(shù)的指數(shù)被編碼,好像具有比其實際值更大的指數(shù)。因此,它們被用一個較大的比特數(shù)以一個給定比特率編碼,或在如下熵編碼步驟108的編碼過程的較早編碼階段編碼。其中某些量化指數(shù)被按比例增加的量化指數(shù)連同該系數(shù)的類別、在步驟105形成的ROI系數(shù)的識別結(jié)果以及用于這按比例增加的優(yōu)先級(左邊位移值S)一起輸入到步驟108。
在熵編碼步驟109,對量化指數(shù)的二進制表示的每一比特單元執(zhí)行熵編碼,以便形成一個編碼的數(shù)據(jù)流,在該比特數(shù)據(jù)流中,其中以量化指數(shù)的較高比特有效級別(bit significance level)從該比特字段產(chǎn)生的編碼比特,被放置于比以較低比特有效級別由比特字段產(chǎn)生的其它編碼比特更早的部分。換言之,對于該量化指數(shù)的二進制表示的每個比特字段執(zhí)行的熵編碼的排序是,在最高比特有效級別的比特字段(最高有效位)被首先編碼,并且在比特有效級別減少的比特字段按照比特有效級別的降低排序編碼。該熵編碼步驟能夠以任何比特率終止或暫停當(dāng)用于編碼比特數(shù)據(jù)流的比特預(yù)算被用盡時、當(dāng)編碼比特數(shù)據(jù)流的接收方或存儲方不需要任何進一步比特時、當(dāng)編碼方用戶或系統(tǒng)要終止或暫停該步驟時、或當(dāng)在接收方的用戶或系統(tǒng)要終止或暫停該步驟時。
編碼器避免對用于ROI系數(shù)的量化指數(shù)中的最小比特有效級別的底部S的比特字段的編碼,因為這些在ROI系數(shù)S左位移之前不存在的比特字段不輸送任何信息。另外,為了降低計算的成本以便避免編碼這些底部S比特字段,一律用0值填充的這些字段可以與量化指數(shù)的底部S比特字段一起編碼,該底部S比特字段用于感興趣區(qū)域之外的區(qū)域,代價是增加編碼比特率。用于ROI系數(shù)的量化指數(shù)的最高S比特字段被專門編碼,不編碼用于在相同子帶中的感興趣區(qū)域之外區(qū)域的量化指數(shù)的任何比特字段。另外,為了降低計算成本以有選擇地編碼用于感興趣區(qū)域的最高S比特字段,這些比特字段可以與用于感興趣區(qū)域之外的區(qū)域的比特字段一起編碼,該比特字段值一律用0填充,代價是增加編碼比特率。
步驟108的優(yōu)選編碼技術(shù)或者是例如一個二進制算術(shù)編碼技術(shù)的一個比特平面編碼,或例如SPIHT編碼技術(shù)的零樹形編碼。利用一個比特平面編碼技術(shù),在每個子帶中的一個確定比特有效級別的全部比特字段被在同一個編碼階段編碼。在這些比特字段被編碼之后,在另外比特有效級別中的比特字段被編碼。在大多數(shù)情況下,較高比特有效級別的比特字段被編碼比同一個子帶中的較低比特有效級別的比特字段的編碼要早。在這種情況下,較高比特有效級別的比特字段的編碼結(jié)果可以被用于編碼在較低比特有效級別中的比特字段。利用零樹形編碼技術(shù),在每一量化指數(shù)中的較高比特有效級別的比特字段的編碼總是早于在每一量化指數(shù)中的較低比特有效級別的比特字段,但是在同一個量化指數(shù)中的較低比特重要性標準的某些比特字段的編碼早于在其它量化指數(shù)中的較高比特重要性標準的比特字段。在步驟108形成的解碼數(shù)據(jù)被發(fā)送到發(fā)送步驟109,其中數(shù)據(jù)比特和標題比特被附加到將要發(fā)送或存儲的到一個比特數(shù)據(jù)流。
在每一系數(shù)分配比特小于該變換系數(shù)的顯示精確度的一個子帶中,每一變換系數(shù)由一個量化指數(shù)表示,其量化指數(shù)的表示精度小于該量化變換系數(shù)的值被表示精度。在每一系數(shù)的分配比特與該變換系數(shù)的值的顯示精確度相同的一個子帶中,每一變換系數(shù)不能被量化,并且每個系數(shù)值本身可以被當(dāng)作將要被給到ROI系數(shù)定標步驟107的一個量化指數(shù)。本發(fā)明適于其中較大變換系數(shù)用較大量化指數(shù)表示的任何種類的量化方案。本發(fā)明最佳的量化是標量量化或一個網(wǎng)格(trellis)編碼量化。利用一個標量量化,根據(jù)相對于一組門限值的系數(shù)幅值,變換系數(shù)被量化成指數(shù)。利用一個網(wǎng)格編碼量化,不僅根據(jù)它自己的幅值而且根據(jù)量化器的狀態(tài),變換系數(shù)被量化成指數(shù)。
在圖3A-3F中,示出ROI系數(shù)定標步驟107。對于變換系數(shù)的量化指數(shù)執(zhí)行的ROI系數(shù)定標或在每一子帶中執(zhí)行、或在整個子帶執(zhí)行、或同時在幾個子帶組中執(zhí)行。在每一子帶中執(zhí)行定標的環(huán)境中,每一子帶可以被指定一個不同優(yōu)先級,不包括對于針對感興趣區(qū)域的量化指數(shù)的優(yōu)先級(左位移值S)。在僅從某些子帶重建的一個圖像中感興趣的選擇區(qū)域需要加重的情形中,ROI系數(shù)定標僅需要在選擇的子帶中執(zhí)行(例如當(dāng)重建該圖像的較低空間分辨率形式時,在不需要重建該目標空間分辨率的子帶中的系數(shù)將不按比例增加)。此后,每一子帶中的ROI系數(shù)定標被公開,其能夠被一般化為一個將被在全部子帶或同時在幾個子帶組中執(zhí)行一個ROI系數(shù)定標,例如通過把相同的優(yōu)先級值指定到用于在全部子帶或幾個子帶組中的感興趣區(qū)域的量化指數(shù)。
為了說明此概念,把一子帶(子帶[K])中的變換系數(shù)表示為Y(j),其中的j(0<=j<J)表示在該子帶[K]中的該變換系數(shù)和對應(yīng)于量化指數(shù)的一個坐標,Y(j)的量化指數(shù)表示為Z(j),在步驟102的每一系數(shù)分配比特表示為N,量化指數(shù)Z(j)的二進制表示的比特字段是bN-1(j),bN-2(j),…,以及b0(j),(bk(j),0<=k<N,是0或1;bN-1(j)是該Z(j)的最高比特有效級別中的比特字段)。該量化指數(shù)Z(j)的二進制表示如下Z(j)=2N-1×bN-1(j)+2N-2×bN-2(j)+……+21×b1(j)+20×b0(j)。(在執(zhí)行ROI系數(shù)定標之前,bn(j)表示在2n比特重要性中的一個比特值)當(dāng)被表示為對應(yīng)于感性趣區(qū)域的變換系數(shù)(即ROI系數(shù))時,Y(j)(其中j=js,j=js+1,…和je)、量化指數(shù)Z(j)(其中j=js,…,和je)是子帶[k]中的ROI系數(shù),其在步驟107中按比例增加。當(dāng)指定到所選的感興趣區(qū)域的優(yōu)先級是一個左位移值S時,量化指數(shù)Z(js),…,和Z(je)按比例增加到Z(js),…,和Z(je)Z(js)=2S×Z(js)=2N+S-1×bN-1(js)+……+2S+1×b1(js)+2S×b0(js),Zs(js+1)=2S×Z(js+1)=2N+S-1×bN-1(js+1)+……+2S+1×b1(js+1)+2S×b0(js+1),
Zs(je)=2S×Z(je)=2N+S-1×bN-1(je)+……+2S+1×b1(je)+2S×b0(je)作為通過左位移S定標的結(jié)果a1)對應(yīng)于指數(shù)的幅值已經(jīng)變成大出2S倍。換句話說,a2)每個比特字段的比特重要性標準(s_level)已經(jīng)變成大出S倍(s_level=N-1-->s_level=N+S-1-->s_level=N-2-->s_level=N+S-2,…,s_level=0-->s_level=S)。如果每一比特字段按照比特有效級別降低排序編碼,則每一按比例增加指數(shù)的前S比特字段的編碼比在同一子帶中的任何其它比特字段都早。換言之,在該按比例增加指數(shù)中的較大數(shù)量的比特字段將在編碼過程的較早階段編碼。a3),在使用比特平面編碼的情形中,對包括同一個比特有效級別的比特字段的每個比特平面實行編碼。在每一子帶中,每一比特平面最好以比特重要性標準的降低排序或任何其它排序編碼。覆蓋整個子帶的每一比特平面的編碼排序,可以通過在每一子帶中跟隨該編碼排序而被任意地指定。下面是在同一個子帶中每個比特平面的編碼排序的一個實例第0平面{bN-1(js),bN-1(js+1),…,bN-1(je)}第1平面{bN-2(js),bN-2(js+1),…,bN-2(je)}第S-1平面{bN-S(js),bN-S(js+1),…,bN-S(je)}第S平面{bN-1(0),…,bN-1(js-1),bN-S-1(js),…,bN-S-1(je),bN-1(je+1),…,bN-1(J-1)}第S+1平面{bN-2(0),…,bN-2(js-1),bN-S-2(js),…,bN-S-2(je),bN-2(je+1),…,bN-2(J-1)}第N-1平面{bS(0),…,bS(js-1),b0(js),…,b0(je),bS(je+1),…,bS(J-1)}第N平面{bS-1(0),…,bS-1(js-1),bS-1(je+1),…,bS-1(J-1)}第N+S-1平面{b0(0),…,b0(js-1),b0(je+1),…,b0(J-1)}
實現(xiàn)最大左位移值Smax的確定是通過指定到該子帶的每一系數(shù)的比特、通過在指定到全部子帶的比特中的每一系數(shù)的最大比特、通過該子帶中的重要比特的最大等級或通過整個子帶中的重要比特的最高等級。如果指定比Smax更大的一個左位移值,則其能夠被調(diào)整到Smax。在此情況中,左位移的值S總是在下面范圍內(nèi)0<=S<=Smax(Smax=N,0沒有感興趣的區(qū)域的優(yōu)先級。)。即使Smax不是上邊界,本發(fā)明也以一個小的編碼比特率增加或小的計算成本的增加而實現(xiàn)其操作。
如果選擇最大左位移或大于該最大左位移的值,則對應(yīng)于感興趣區(qū)域的量化指數(shù)的全部比特字段都將具有不同于同一子帶中感興趣區(qū)域之外的區(qū)域的量化指數(shù)的全部比特字段的比特有效級別。因此,感興趣區(qū)域的全部比特字段和感興趣區(qū)域之外的區(qū)域的全部比特字段將被分別地編碼。換言之,感興趣區(qū)域的量化指數(shù)和感興趣區(qū)域之外的區(qū)域的量化指數(shù)將被熵編碼器分別地編碼。
如果左位移值小于該最大值而大于0,則對應(yīng)于感興趣區(qū)域的量化指數(shù)的最高S比特字段的編碼將獨立于針對同一個子帶中感興趣區(qū)域之外的區(qū)域的量化指數(shù)的任何比特字段的編碼,對應(yīng)于感興趣區(qū)域的量化指數(shù)的其它N-S比特字段的編碼將與同一個子帶中的其它指數(shù)的最高N-S比特字段的編碼處在同一個編碼階段,而對應(yīng)于感興趣區(qū)域外部的區(qū)域的指數(shù)中的其余S比特字段的編碼將獨立于用于感興趣區(qū)域的任何比特字段的編碼。換言之,當(dāng)左比特位移是小于該最大值而大于0時,感興趣區(qū)域的量化指數(shù)和感興趣區(qū)域之外的區(qū)域的量化指數(shù)將被熵編碼器部分獨立地編碼。
ROI系數(shù)定標的最好方法是e1)按比例增加對應(yīng)于感興趣區(qū)域的量化指數(shù)的值,e2)按比例增加與感興趣區(qū)域相關(guān)的比特字段的比特有效級別,e3)再指定編碼排序。e1)、e2)和e3分別對應(yīng)于先前討論的a1)、a2)和a3)。步驟107的e1)、e2)或e3)的ROI系數(shù)按比例增加的任一結(jié)果與選定的感興趣區(qū)域的優(yōu)先級以及對應(yīng)于感興趣區(qū)域的系數(shù)識別結(jié)果一起在步驟108使用,以便控制要在步驟108執(zhí)行的熵編碼。
圖4A和4B示出一個ROI系數(shù)定標方法,其中示出以不同優(yōu)先級加重多個感興趣區(qū)域。當(dāng)每一選擇區(qū)域以同一個加重標準加重時,對應(yīng)于每個感興趣區(qū)域的量化指數(shù)以相同的左位移值按比例增加。在此情況中,對于與任何感興趣區(qū)域?qū)?yīng)的量化指數(shù)用同一個方法,如圖3A-3F示出,執(zhí)行相同的ROI系數(shù)定標。當(dāng)每一選擇區(qū)域以其各自的優(yōu)先級加重時,圖3A-3F中示出的按比例增加需要針對每個感興趣的區(qū)域執(zhí)行。在此情況中,對應(yīng)于在區(qū)域選擇器步驟104選擇的每個感興趣區(qū)域的變換系數(shù)必須被標識,并且在ROI系數(shù)識別步驟105中分類成各自的類別。在此分類中,對應(yīng)于幾個感興趣區(qū)域的變換系數(shù)被認為是對應(yīng)于一個感興趣區(qū)域的系數(shù),該感興趣區(qū)域被指定了在全部選擇的感興趣區(qū)域中的最高的優(yōu)先級。根據(jù)指定到每個感興趣區(qū)域的類別和優(yōu)先級,針對每個感興趣的區(qū)域執(zhí)行ROI系數(shù)定標,如圖3A-3F所示。
在圖5A-5C中,示出從編碼的中間開始的ROI系數(shù)定標。雖然圖3A-3F、4A和4B示出ROI系數(shù)定標方法的實施例或是按比例增加該量化指數(shù)值、按比例增加量化指數(shù)的每個比特字段的比特有效級別、或是再指定量化指數(shù)的每個比特字段的編碼排序,但是圖5A-5C中公開的ROI定標方法的實施例或是按比例增加用于感興趣區(qū)域的量化指數(shù)的部分值(該值包括量化指數(shù)中的某些比特字段)、按比例增加量化指數(shù)中的比特字段的某些比特有效級別、或是再指定該量化指數(shù)的某些比特字段的編碼排序。換句話說,雖然圖3A-3F、4A和4B的ROI系數(shù)定標方法使用了在用于感興趣區(qū)域的該變換系數(shù)的量化指數(shù)中的全部比特字段,以便加重感興趣的區(qū)域,但是圖5A-5C的ROI系數(shù)定標方法使用在用于感興趣區(qū)域的量化指數(shù)中的某些比特字段,以便加重該感興趣的區(qū)域。除其使用比特有效級別或在編碼階段使用ROI系數(shù)定標之外,此后公開的ROI系數(shù)定標使用的方法與圖3A-3F、4A和4B中的ROI系數(shù)定標方法相同。
在圖5A-5C的ROI系數(shù)定標方法中,用于變換系數(shù)的全部量化指數(shù)的某些比特字段不被按比例增加。這些比特字段可以是某些最高比特字段、某些底部比特字段或某些中間比特字段。在此情況中,從未使用ROI系數(shù)定標的比特字段產(chǎn)生的編碼比特數(shù)據(jù)流,可以用不涉及感興趣區(qū)域的一個解碼方法解碼。如果在編碼過程期間并且在編碼器從該接收機接收反饋信號期間,編碼比特數(shù)據(jù)流被發(fā)送到接收方,當(dāng)在每個子帶中的某些最高比特字段被編碼而不使用該ROI定標時,感興趣區(qū)域的選擇和其優(yōu)先級的選擇能夠由接收方指定接收方的用戶在由來自該編碼器的輸入編碼比特數(shù)據(jù)流而部分重建的圖像上,指定感興趣的區(qū)域和優(yōu)先級,并且把感興趣區(qū)域的坐標信息以及優(yōu)先級反饋到編碼器;然后,編碼器在編碼過程中間開始ROI定標。為了解釋圖5A-5C的主題內(nèi)容,我們使用與圖3A-3F中公開該ROI系數(shù)定標使用的相同術(shù)語。在一個子帶(子帶[K])中的變換系數(shù)Y(j),其中j(0<=j<J)表示在子帶[K]中變換系數(shù)的一個坐標;Y(j)的量化指數(shù)Z(j);在步驟102分配的每一系數(shù)比特表示為N。量化指數(shù)Z(j)的二進制表示的比特字段是bN-1(j)、bN-2(j),…,和b0(j),(bK(j)其中0<=k<N-1是0或1;左位移定標值由S表示;其中未使用系數(shù)定標的比特有效級別的數(shù)量由P表示)。在最高P比特位面不使用ROI系數(shù)定標而被編碼的情形中,Z(j)的二進制表示描述如下Z(j)=2N-1×bN-1(j)+2N-2×bN-2(j)+……+21×b1(j)+20×b0(j).Z(j)被表示為Z1(j)和Z2(j)的組合Z1(j)是Z(j)事實上的一個部分;Z2(J)是將要按比例增加的一部分。
Z(j)=Z1(j)+Z2(j)或表示為Z(j)={Z1(j),Z2(j)}其中Z1(j)=2N-1×bN-1(j)+2N-2×bN-2(j)+……+2N-P×bN-P(j),Z2(j)=2N-P-1×bN-P-1(j)+2N-P-2×bN-P-2(j)+……+20×b0(j),假設(shè)變換系數(shù)標識對應(yīng)于步驟105中感興趣的區(qū)域是Y(j),其中j=js,js+1…,和je,以及對應(yīng)于將要在步驟107在按比例增加的量化指數(shù)是Z(j),其中j=js…,和je,Z2(),量化指數(shù)Z(js),…,Z(je)的可調(diào)節(jié)部分,比例增加為Z2s(js),…,Z2s(je)Z2s(js)=2S×Z2(js)=2N+S-P-1×bN-P-1(js)+2N+S-P-2×bN-P-2(js)+……+2S×b0(js),Z2s(js+1)=2S×Z2(js+1)=2N+S-P-1×bN-P-1(js+1)+2N+S-P-2×bN-P-2(js+1)+……+2S×b0(js+1),Z2s(je)=2S×Z2(je)=2N+S-P-1×bN-P-1(je)+2N+S-P-2×bN-P-2(je)+……+2S×b0(je)。
由于從編碼中間進行ROI系數(shù)定標,Z(js),…,和Z(je)是從Z(js)={Z1(js),Z2(js)},…,和Z(je)={Z1(js),Z2(je)}變換到Zs(js)={Z1(js),Z2s(js)},…,和Zs(je)={Z1(je),Z2s(je)}。在圖5A-5C示出的ROI系數(shù)定標方法中,Z2(j)而不是Z(j)被以與圖3A-3F、4A和4B中的相同的定標方法按比例增加。
該最大左位移定標值Smax是通過指定到該子帶的每一系數(shù)的比特N以及在每個量化指數(shù)中的比特字段數(shù)P確定的,該量化指數(shù)的編碼將不使用ROI系數(shù)定標。在此情況中,左位移的值S是在下面范圍內(nèi)0<=S<=Smax(Smax=N-P,0沒有到感興趣的區(qū)域的優(yōu)先級。)。
如果選擇最大左位移Smax=N-P,對應(yīng)于感興趣區(qū)域的量化指數(shù)的底部N-P比特字段,與對應(yīng)于同一子帶中感興趣區(qū)域之外的區(qū)域的量化指數(shù)的底部N-P比特字段分離。因此,感興趣區(qū)域的底部N-P比特字段和感興趣區(qū)域之外的區(qū)域的N-P比特字段將被分別地編碼。
如果左位移值小于該最大值而大于0,則用于感興趣區(qū)域的(P+1)st至(P+S)th最高的比特有效級別的量化指數(shù)的S個比特字段,被與用于該感興趣區(qū)域之外的區(qū)域的任何比特字段分離開(在此實例中,第一最高比特有效級別MSB,第N最高比特有效級別LSB)。對應(yīng)于感興趣區(qū)域的量化指數(shù)該其它N-P-S個比特字段將與用于感興趣區(qū)域之外的區(qū)域的N-P-S個比特字段一起以各個比特有效級別編碼。其余S個比特字段,在用于感興趣區(qū)域之外的區(qū)域的量化指數(shù)中的S個底部比特字段,被從用于感興趣區(qū)域的任何比特字段分離。
圖6A-6C示出一個ROI系數(shù)定標方法,其中多個感興趣的區(qū)域以不同優(yōu)先級在不同編碼階段加重。這項技術(shù)與反復(fù)地應(yīng)用圖5A-5C討論的從編碼的中間實施ROI定標方法相等效,以便在編碼過程中加重另外感興趣的區(qū)域,其中某些量化指數(shù)已經(jīng)通過圖3A-3F、4A-4F、或5A-5C示出的方法從編碼過程的開始或在某階段被按比例增加。該方法使得有可能在編碼過程中附加不同的感興趣區(qū)域或擴展已經(jīng)選擇的感興趣區(qū)域的范圍,或通過把該區(qū)域劃分成幾個部分并且把不同優(yōu)先級指定到每一部分而從該編碼過程的不同階段一部分一部分地重建選定的感興趣區(qū)域。而且在此情況中,如果在接收方該編碼過程和解碼過程交互實行,另外感興趣區(qū)域的選擇和其優(yōu)先級的選擇可以由該接收方完成。
圖7A-7D中,示出當(dāng)使用一個基于比特平面的編碼器時通過ROI系數(shù)定標步驟107的該量化指數(shù)的熵編碼步驟108。本發(fā)明的一個特性是修改一組量化指數(shù),該組量化指數(shù)是以各個比特有效級別輸入到一個比特平面編碼器的量化指數(shù),或通過使用ROI系數(shù)定標步驟107的結(jié)果,修改每一量化指數(shù)中的比特字段的一個編碼排序。利用一個比特平面編碼器和每個平面的編碼排序,ROI系數(shù)定標的結(jié)果定義將要被編碼的每個比特平面。基于每個比特平面的比特有效級別確定編碼排序是最簡單的方法。針對與每一系數(shù)類別對應(yīng)的每個比特平面而確定分別的編碼排序是另一方法。例如,用于包括對應(yīng)于感興趣區(qū)域的系數(shù)的比特平面的編碼排序的確定,可以獨立于用于包括對應(yīng)于感興趣區(qū)域之外的區(qū)域的系數(shù)的比特平面的編碼排序。如果各自的編碼排序被用于系數(shù)的每一類別,則覆蓋每個類別的編碼排序能夠任意地選擇,并且用于整個的圖像的編碼排序能夠更靈便地指定。當(dāng)編碼每一比特平面的比特平面編碼器不使用其它比特平面的任何編碼結(jié)果或信息時,每個比特平面的編碼排序可以是任意的。使用在本實施例中的比特平面編碼器可以是任何二進制熵編碼器,例如一個二進制算術(shù)編碼器。比特平面編碼能夠在每個子帶中定義的每個比特平面上執(zhí)行,或在子帶的每個組中定義的每一比特平面上執(zhí)行,或者在全部子帶中定義的每一比特平面上執(zhí)行。
圖7A-7D示出一種情況,在每個子帶中執(zhí)行比特平面編碼,其中ROI系數(shù)定標被使用在圖3A-3F、4A和4B示出的每個比特字段上。ROI編碼從該編碼的始端開始。在圖7A-7D的熵編碼中,用于變換系數(shù)的量化指數(shù)的具有同一個比特有效級別的每一比特字段被分組在一起并且形成一個比特平面,其中該變換系數(shù)具有由步驟107中的ROI系數(shù)定標確定的同一個比特有效級別。可選擇地,在步驟107中被指定相同編碼或信息排序的每一比特字段,被分組成同一個比特平面。當(dāng)每一系數(shù)的比特(即代表該指數(shù)的精確度)是N,并且對所選的一個或幾個感性趣的區(qū)域的優(yōu)先級是S(0<=S<=N)時,比特平面的數(shù)量變成N+S。由以S最高比特有效級別的比特字段組成的S比特平面與用于感興趣區(qū)域的系數(shù)相關(guān)。由在相鄰N-S比特有效級別中的比特字段組成的相鄰的N-S比特平面與用于整個圖像的系數(shù)相關(guān)。由以最低S比特有效級別的比特字段組成的最后的S比特平面與用于感興趣區(qū)域之外的區(qū)域的系數(shù)相關(guān)。每一比特平面由比特平面編碼器逐個編碼。在編碼過程中,在較高比特有效級別中的比特平面的編碼比在比較低比特有效級別中的比特平面早。每一比特平面的編碼比特數(shù)據(jù)流被附加到一個編碼標記,其標記用于標識該編碼比特數(shù)據(jù)流的產(chǎn)生部分表示的比特有效級別。連同該優(yōu)先級一起,即連同對于該選擇的感興趣區(qū)域的左位移值一起,該標記表示那比特部分是否僅表示感興趣的區(qū)域、整個圖像、或感興趣區(qū)域之外的區(qū)域。當(dāng)對于感興趣區(qū)域的優(yōu)先級是最大值N時,從每個比特平面產(chǎn)生的每個比特部分組成該感興趣的區(qū)域或組成感興趣區(qū)域之外的區(qū)域。當(dāng)該優(yōu)先級是最大值時,用于感興趣區(qū)域的比特平面和那些其它區(qū)域的比特平面被分別編碼。而且,在感興趣的區(qū)域和其余區(qū)域之間的編碼排序,和編碼比特數(shù)據(jù)流的比特部分的排序可以是任意的。
通過計數(shù)在每個比特平面的編碼中付出的比特數(shù),并且通過在用于該感興趣區(qū)域、感興趣區(qū)域之外的區(qū)域的比特數(shù)或用于這兩個區(qū)域的比特數(shù)超過預(yù)算時終止該編碼過程,分配到感興趣區(qū)域和感興趣區(qū)域之外的區(qū)域的比特數(shù)量被更精確地控制。如果對該感興趣區(qū)域的優(yōu)先級是最大值時,用于感興趣區(qū)域以及用于其它區(qū)域的分配的比特數(shù)量可以被分別控制。
當(dāng)對于僅包括對應(yīng)于感興趣區(qū)域的比特字段的一個比特平面或僅包括對應(yīng)于感興趣區(qū)域之外的區(qū)域的比特字段的一個比特平面進行編碼時,通過使用針對一維信號的組織模型,把每個比特平面中的比特字段或被安排成一個將要被熵編碼的一維信號,或者通過使用針對二維信號的組織模型,把每個比特平面中的比特字段保持為一個將要被編碼的二維信號。當(dāng)每個比特字段被作為二維信號編碼時,在感興趣區(qū)域之外的區(qū)域坐標上的比特字段或在感興趣區(qū)域之內(nèi)的坐標上的比特字段在某些比特有效級別中的比特平面中不存在。為了不增加編碼比特率,這些坐標在編碼過程中被跳過??蛇x擇地,為了降低跳過這種坐標的計算復(fù)雜性,編碼不被跳過的這些坐標,但它們被編碼的方式好像它們具有0值的比特字段。在解碼過程過程中丟棄這些0值。代替0,1也能被使用作為該假定值。
可以在熵編碼步驟過程中修改感興趣區(qū)域的優(yōu)先級。一個實例是在熵編碼步驟過程中降低感興趣區(qū)域的優(yōu)先級如果用于感興趣區(qū)域的比特數(shù)或比特率達到一預(yù)先確定值,則降低優(yōu)先級,以便不在編碼過程的其余部分加重該感興趣區(qū)域。另外,如果在該子波域中的感興趣區(qū)域的估計的MSE或峰值信噪比(PSNR)值達到一預(yù)定值,則可以降低優(yōu)先級值。如果根據(jù)來自解碼方的反饋控制優(yōu)先級,則不僅該估計MSE或PSNR,而且根據(jù)部分重建圖像計算出的MSE或PSNR都能被使用。根據(jù)比特速度、MSE或PSNR、或與感興趣區(qū)域的壓縮壓縮性能(例如比特速度與MSE的關(guān)系)相關(guān)的任何其它測量值的感興趣區(qū)域的優(yōu)先級控制,使得該編碼或解碼系統(tǒng)有可能確定最適當(dāng)?shù)腞OI編碼策略。而且,在編碼或解碼方的用戶可以決定該策略。該ROI編碼策略確定何時以及執(zhí)行多少該ROI系數(shù)定標,確定分配多大的比特率用于將要由熵編碼器編碼的感興趣區(qū)域以及用于圖像的其余部分,確定該感興趣區(qū)域的編碼過程何時終止,以及確定用于編碼或解碼感興趣區(qū)域的任何其它信息。
在圖8A-8C中公開了在每個子帶中執(zhí)行比特平面編碼的情況,其中僅對于在圖5A-5C以及6A-6C示出的某些底部比特有效級別的比特字段使用ROI系數(shù)定標(ROI編碼從編碼的中間開始)。在其中指定到一子帶(即代表該指數(shù)的精確度)的每一系數(shù)的比特是N的情形中,ROI系數(shù)定標在量化指數(shù)的最高P比特平面之后使用,以及對所選一個或幾個感性趣的區(qū)域的優(yōu)先級是S(0<S<=N-P),在該子帶中的比特平面的數(shù)量是P+N-P+S=N+S。最高P比特平面包括在每個量化指數(shù)中的最高P比特單元。因此,該最高P比特平面表示整個圖像。從每一量化指數(shù)中的底部N-P比特字段,用圖6A-6C中相同的方法形成N-P+S比特平面(在按比例增加步驟107之后,集合在同一個比特有效級別中的比特單元)在N-P+S比特平面當(dāng)中的最高S比特平面表示所選的一個或幾個感性趣的區(qū)域,隨后的N-P-S比特平面表示整個圖像,并且最后的S比特平面表示感興趣區(qū)域之外區(qū)域。其中未使用ROI系數(shù)定標的P比特平面不必須是每個子帶中的最高P比特平面。它們可以是底部P比特位面或中間P比特平面。當(dāng)它們是底部P比特位面時,對于在每個量化指數(shù)中的最高N-P比特位面執(zhí)行圖3A-7F的ROI系數(shù)定標以及圖7A-7D中的熵編碼。
如圖7A-7D那樣,用于每個比特平面或用于每個比特平面的一個編碼比特部分的一個編碼比特數(shù)據(jù)流被附加到一個標記,并且連接形成一個該子帶的編碼的比特數(shù)據(jù)流。而且,通過計數(shù)在每個比特面中使用的比特數(shù)量,或通過計數(shù)在表示整個圖像的最高P比特平面中、在表示感興趣區(qū)域的隨后最高S比特平面中、在表示整個圖像的隨后N-P-S比特平面中以及在表示感興趣區(qū)域之外的區(qū)域的其余S比特平面中使用的比特數(shù)量,能夠更精確地控制針對感興趣區(qū)域以及其余區(qū)域使用的比特數(shù)量。
出現(xiàn)該ROI系數(shù)的比特有效級別,可以在該熵編碼過程中通過該比特速度、在子波域估算的MSE或PSNR以及對于感興趣區(qū)域的優(yōu)先級而指定。如果用于編碼不使用該ROI系數(shù)定標技術(shù)的某些比特平面而使用的比特速率達到一確定值,則該定標技術(shù)將以較高優(yōu)先等級從緊鄰當(dāng)前編碼的比特平面之后的將要編碼的該比特平面開始使用。如果用于編碼表示該感興趣區(qū)域的比特平面的比特率付出達到另一確定的值,則對該感興趣區(qū)域的優(yōu)先級被降低,以便在該編碼過程的其余部分不加重該感興趣區(qū)域。不是該比特率,而是在用于整個圖像或用于感興趣區(qū)域的子波域中的MSE估算值,可用于確定使用ROI系數(shù)定標的比特平面以及確定對感興趣區(qū)域的優(yōu)先級被降低的比特平面。
在比特分配步驟102,確定被指定到每一子帶的每一系數(shù)的比特數(shù),以便盡可能以用于整個圖像的一個給定比特率降低整個重建圖像的失真。每一系數(shù)的比特數(shù)或在每個子帶中的用于每個系數(shù)的比特率的確定方式是,具有較多變化或較高能量的變換系數(shù)的子帶中的每一系數(shù)將被分配較大比特數(shù)。加到量化步驟103的該比特分配結(jié)果,可以是每個子帶中的每一系數(shù)的比特數(shù)、量化步長、或在步驟103選擇量化方案的一個參數(shù)。當(dāng)每一系數(shù)的比特、量化步長或量化方案在每個子帶中預(yù)定時,例如當(dāng)無損編碼實現(xiàn)時,將不執(zhí)行比特分配。
在區(qū)域選擇器步驟104,由用戶在一個顯示器上的圖像顯示上選擇一個或幾個感性趣的區(qū)域。該顯示圖像或是一個將要被編碼的全空間分辨率圖像,或是一個較低清晰度的圖像形式。如果該區(qū)域選擇出現(xiàn)在該圖像的較低的清晰度形式上,對應(yīng)于在要被編碼的全清晰度圖像中的一個或幾個感性趣的區(qū)域的坐標被計算出,用于標識對應(yīng)于在該全清晰度圖像中的感興趣區(qū)域的變換系數(shù)。還可以通過一個方法執(zhí)行區(qū)域選擇,其中一個自動目標識別系統(tǒng)根據(jù)一組判據(jù)定義一個或幾個感性趣的區(qū)域。該自動目標識別系統(tǒng)可以使用多種方法以便標識感興趣的區(qū)域。例如,模式識別軟件可以用于標識圖像中感興趣的目標。
在ROI坐標描述步驟106,描述每個感興趣區(qū)域的坐標被編碼,以便作為編碼的圖像比特數(shù)據(jù)流的開銷信息被有效率地發(fā)送或存儲。當(dāng)選擇的感興趣區(qū)域是矩形區(qū)域時,該矩形的一對角線的兩個邊緣的坐標將描述該區(qū)域。當(dāng)選擇的感興趣區(qū)域是圓形區(qū)域時,該圓形的中心坐標以及半徑的長度將描述該區(qū)域。當(dāng)選擇的一個或幾個區(qū)域是幾個長方形或圓的連接時,該長方形或圓形的每一個以上述討論的方法描述。如果選擇的感興趣的區(qū)域是任意的形狀,則該區(qū)域的邊界由任何形狀編碼方法所編碼,例如鏈狀編碼方法或目標編碼方法。
在發(fā)射機步驟109,在熵編碼步驟108產(chǎn)生的編碼比特數(shù)據(jù)流的一些部分可以安排成任何排序。如果該解碼的數(shù)據(jù)將要被發(fā)送到一個頻繁重建較低清晰度形式的圖像顯示環(huán)境,則與空間分辨率相關(guān)的編碼比特數(shù)據(jù)流的若干部分在該整體編碼比特數(shù)據(jù)流的安排比與較高空間分辨率相關(guān)的編碼比特數(shù)據(jù)流要早。如果在熵編碼步驟產(chǎn)生比特部分的編碼排序和該比特部分的發(fā)送排序不同,則該比特數(shù)據(jù)流的若干部分進行的排序?qū)⒅匦屡帕性摫忍夭糠值呐判颉?br>
在ROI系數(shù)識別步驟105,對應(yīng)于圖像域中所選的感興趣區(qū)域的變換系數(shù)被標識,或者通過跟蹤(tracing)從圖像域到變換域的反相子波變換,或者通過跟蹤該反相子波變換裝置,以便標識通過對于變換系數(shù)的執(zhí)行的濾波和上取樣,每一象素值是從哪個變換系數(shù)重建的。在此識別過程中,濾波器系數(shù)不起任何作用。相反,濾波器長度或濾波器支持區(qū)域起作用。濾波器支持越大,對應(yīng)于圖像中的像素變換系數(shù)的數(shù)量越大。此識別過程通過反相子波變換的每一等級實現(xiàn)。而且,該識別沿著該圖像或子帶的每一維(垂直方向或水平方向)執(zhí)行。另外,通過包括濾波和下取樣的每一子波變換等級,該識別能夠通過跟蹤從圖像域到變換域的正向子波變換執(zhí)行。
把圖像表示為X(k0),其中0<=k0<K,第一等級分解的低通子帶表示為L1(kL1),并且高通子帶表示為H1(kH1),其中0<=kL1,kH1<K/2,第二等級分解的低通子帶表示為L2(kL2),并且一個高通子帶表示為H2(kH2),其中0<=kL2,kH2<K/22……,第n個等級分解的低通子帶表示為LN(KLN),并且一個高通子帶表示為HN(kHN),其中0<=kLN,kHN<K/2N。因此,一個錘狀類型子波分解或二進制的子波分解的子波變換是通過1等級反相子波變換從L1和H1重建X;從L2和H2重建L1;…;因此,從H1、H2、…HN、LN重建X;L1、L2…和LN-1是子帶,借助該子帶執(zhí)行每一等級的子波變換和反相子波變換。
當(dāng)k0=k0_R(k0_Rs<=k0_R<=k0_Re)是在所選感興趣區(qū)域中的一個像素時(k0_R感興趣區(qū)域的像素坐標;k0_Rs和k0_Re感興趣區(qū)域邊界上的像素坐標k0_R可以是感興趣區(qū)域內(nèi)一個像素(即k0_R=k0_Rs=k0_Re);在下面解釋中,圖像和感興趣的區(qū)域被假設(shè)是一維信號,因此在感興趣區(qū)域中,k0_Rs是最小坐標而k0_Re是最大坐標),對應(yīng)于X(k0_R)的變換系數(shù)以L1()和H1()標識,使得-在L1()中的ROI系數(shù)kL1_Rs<=kL1<=kL1Re,-在H1()中的ROI系數(shù)kH1_Rs<=kH1<=kH1_Re。
然后,假設(shè)第一等級分解低通信號L1(kL1)是一個圖像而kL1_Rs<=kL1<=kL1_Re是感興趣區(qū)域,變換系數(shù)對應(yīng)于L1(kL1),其中kL1_Rs<=kL1<=kL1_Re在L2()和H2()中被標識。
-在L2()中的ROI系數(shù)kL2_Rs<=kL2<=kL2_Re,-在H2()中的ROI系數(shù)kH2_Rs<=kH2<=kH2_Re。
重復(fù)此過程,直到子帶LN和HN,以便完成用于在圖像X()中的像素k0_R的ROI系數(shù)標識。
如上述所示出,ROI系數(shù)標識的執(zhí)行能夠獨立地用于在所選感興趣區(qū)域中的每個像素。因此,ROI系數(shù)標識與感興趣區(qū)域的形狀無關(guān)。然而,此標識過程不必針對每個感興趣的區(qū)域中的每個像素執(zhí)行。相反,該識別過程僅在感興趣區(qū)域的邊界像素上以及在圖9所示的屬于是被定位感興趣區(qū)域邊界之內(nèi)一個像素的像素上執(zhí)行。由于對應(yīng)于每個像素的變換系數(shù)的數(shù)量可能由于上取樣(在每個第一等級反相子波變換中執(zhí)行濾波之前在每個系數(shù)之間插入0)或下取樣(在每個第一等級子波變換中執(zhí)行濾波之后間隔地刪除系數(shù))的原因而根據(jù)像素的位置而變化,所以對應(yīng)于邊界上像素的變換系數(shù)可能不在對應(yīng)于每個子帶中該ROI系數(shù)組成的區(qū)域的邊界上。相反,對應(yīng)于定位在感興趣區(qū)域邊界之內(nèi)一個像素的變換系數(shù),可能在每一子帶中的對應(yīng)于區(qū)域的邊界上。邊界上的像素以及邊界之內(nèi)的一個像素是需要的并且足以標識該變換系數(shù),該變換系數(shù)形成每一子帶中的對應(yīng)區(qū)域的邊界。另外,如果低通濾波器和高通濾波器都具有偶數(shù)的濾波器長度,則只有在邊界上的像素被用于標識形成每一子帶中對應(yīng)區(qū)域邊界的系數(shù)。
根據(jù)用于該邊界和該邊界內(nèi)部一像素的標識結(jié)果,通過在每一子帶中的對應(yīng)于區(qū)域的邊界內(nèi)選擇每個系數(shù),標識其余的變換系數(shù)。
假設(shè)X(k0)(k0_Rs=<k0=<k0_Re)是所選感興趣區(qū)域中的像素(k0_Rs和k0_Re用于在感興趣區(qū)域的邊界上的像素的坐標;即感興趣區(qū)域中的最小坐標;k0_Re用于在感興趣區(qū)域的其它邊界上的一個像素的坐標;在下面解釋中,圖像和感興趣的區(qū)域被認為是一維信號,因此k0_Rs是感興趣區(qū)域中的最小的坐標,而k0_Re是是感興趣區(qū)域中的最大的坐標)。
對應(yīng)區(qū)域的左邊界被標識如下對應(yīng)于X(k0_Rs)的變換系數(shù)以L1()和H1()標識,使得-在L1()中的ROI系數(shù)ksL1_Rs<=kL1<=ksL1_Re,-在H1()中的ROI系數(shù)ksH1_Rs<=kH1<=ksH1_Re。
而且,對應(yīng)于X(k0_Rs-1)的變換系數(shù)被標識,使得-在L1()中的ROI系數(shù)ksL1_R’s<=kL1<=ksL1_R’e,
-在H1()中的ROI系數(shù)ksH1_R’s<=kH1<=ksH1_R’e。
ksL1_Rs和ksL1_R’s的較小的一個在L()中的對應(yīng)區(qū)域的左邊界上,以及ksH1_Rs和ksH1_R’s的較小的一個在H()中的對應(yīng)區(qū)域的左邊界上。
對應(yīng)區(qū)域的右邊界被標識如下對應(yīng)于X(k0_Re)的變換系數(shù)以L1()和H1()標識,使得-在L1()中的ROI系數(shù)keL1_Rs<=kL1<=keL1_Re,-在H1()中的ROI系數(shù)keH1_Rs<=kH1<=keH1_Re。
而且,對應(yīng)于X(k0_Re-1)的變換系數(shù)被標識,使得-在L1()中的ROI系數(shù)keL1_R’s<=kL1<=keL1_R’e,-在H1()中的ROI系數(shù)keH1_R’s<=kH1<=keH1_R’e。
keL1_Re和keL1_R’e的較大的一個在L()中的對應(yīng)區(qū)域的右邊界上,以及keH1_Re和keH1_R’e的較大的一個在H()中的對應(yīng)區(qū)域的右邊界上。
另外,ROI系數(shù)標識在感興趣區(qū)域中的每一像素上執(zhí)行。通過跟蹤在像素上執(zhí)行的一組子波變換或通過跟蹤一組重建該象素值的反相子波變換,對應(yīng)于感興趣區(qū)域中的每一像素的一組變換系數(shù)被標識。對應(yīng)于在感興趣區(qū)域中的每個像素的每個子帶中的已標識的系數(shù)組,被分類成一個屬于對應(yīng)感興趣區(qū)域的系數(shù)類別的子類別,以使該識別結(jié)果可用于按比例增減或重建整體感興趣區(qū)域,以及按比例增減或重建感興趣區(qū)域的任意部分。由于使用在該子波或反相子波變換中的低通濾波器或高通濾波器的重疊,所以某些標識系數(shù)屬于多個子類別。根據(jù)每一標識系數(shù)所對應(yīng)的像素的數(shù)量,每個子類別可以被分成子子類別。最終,每個標識系數(shù)可以具有一個屬性,描述在感興趣區(qū)域之內(nèi)系數(shù)對應(yīng)哪些像素以及對應(yīng)多少像素。該屬性還可以描述,除了在感興趣區(qū)域之內(nèi),在感興趣區(qū)域之外有多少像素對應(yīng)于該系數(shù)。
如圖10A和10B示出,由濾波系數(shù)是gAA(k)的一個低通濾波器和濾波系數(shù)是fA(k)的一個高通濾波器以及一個間隔地放棄像素或變換系數(shù)的降低取樣器實現(xiàn)的子波變換。一個用于一維信號的單級子波分解,把信號X分解成一個低通子帶L和一個高通子帶H。通過對信號X執(zhí)行低通濾波并且下取樣該低通濾波器信號而獲得低通子帶L。通過對信號X執(zhí)行高通濾波并且下取樣該高通濾波器信號而獲得高通子帶H。
如果該信號是例如一個圖像的二維信號,則對于X執(zhí)行水平或垂直方向的一維信號的單級分解,以便獲得L并且H信號。然后以另一方向?qū)τ贚和H執(zhí)行一維信號的相同的分解,以便分別獲得LL1和LH1,以及HL1和HH1。如果對于LL1執(zhí)行相同的分解,則獲得LL2、LH2、HL2、HH2,并且X被分解成LL2、LH2、HL2、HH2、LH1、HL1和HH1。
通過僅對于LL子帶執(zhí)行單級分解而實現(xiàn)全部分解的一個子帶分解,被稱之為一個錘型子波分解,或只被稱之為子波分解。其中對于每個子帶重復(fù)同樣的單級分解的子帶分解被稱之為寬域(spacl)子波分解。其中對于每個子帶任意地重復(fù)一個單級分解的子帶分解被稱之子波數(shù)據(jù)包分解。
反相子波變換是通過在每一像素或系數(shù)之間插入0的一個上取樣器和濾波器系數(shù)是gS(k)的低通濾波器以及濾波器系數(shù)是fSs(k)的高通濾波器實現(xiàn)的。用于一維信號的一個單級子波合成把L和H組合成X。在該單級合成中,L通過2被上取樣并且被低通濾波,H通過2被上取樣并且低通濾波,然后相加上抽樣和濾波的L和H,組成X。在每個分解的子帶上執(zhí)行該單級合成,以便執(zhí)行任何標準和任何類型的反相子波變換。
圖2示出一種解壓縮一個圖像的方法,其圖像是以圖1中的所選感興趣區(qū)域上的加重編碼的。圖2中,解碼方法200包括一接收機步驟201,用于接收包括標題比特并且數(shù)據(jù)比特的一個編碼比特數(shù)據(jù)流。步驟201后面是區(qū)域坐標解碼步驟202和熵解碼步驟204。在步驟202,解碼區(qū)域坐標的編碼數(shù)據(jù),以便獲得感興趣區(qū)域(ROI)的坐標,該感興趣區(qū)域?qū)⒃谥亟▓D像中加重重建。解碼的ROI坐標傳給ROI系數(shù)標識步驟203,在此步驟標識對應(yīng)于感興趣區(qū)域的子波變換系數(shù)。該ROI系數(shù)標識結(jié)果在解碼步驟204和ROI系數(shù)解定標步驟205中使用。
在熵解碼步驟204,對于具有在接收機步驟201接收的數(shù)據(jù)比特的輸入比特數(shù)據(jù)流執(zhí)行熵解碼。針對每一變換系數(shù)的量化指數(shù)的二進制表示每一比特字段,獲得解碼比特。在每一量化指數(shù)之內(nèi),較高比特有效級別的比特字段被解碼比較低比特有效級別的比特字段的解碼要早。換言之,執(zhí)行熵解碼是為了獲得在一個量化指數(shù)中以比特重要性的降低排序的每一比特字段。為了知道哪個量化指數(shù)作為對應(yīng)于感興趣區(qū)域的系數(shù)被按比例增加、以及知道它們被按比例增加的程度,該熵解碼過程在步驟203查詢該ROI系數(shù)標識結(jié)果,并且從接收機步驟201接收的標題比特取出指定到感興趣區(qū)域的優(yōu)先級值。使用在步驟204中的熵解碼器是比特平面解碼技術(shù)或SPIHT解碼技術(shù)如果熵編碼是以一個比特平面編碼技術(shù)實現(xiàn),則解碼必須是以一個相應(yīng)的比特平面解碼技術(shù)實現(xiàn)。如果熵編碼是以一個SPIHT編碼技術(shù)實現(xiàn),則解碼必須是以一個SPIHT解碼技術(shù)實現(xiàn)。熵解碼比特被組織成為量化指數(shù)的二進制表示的比特字段值,并且被傳給ROI系數(shù)解定標步驟205作為量化指數(shù)。
在步驟205,對應(yīng)于感興趣區(qū)域的量化指數(shù)被按比例降低,以便在步206執(zhí)行對于量化指數(shù)的解量化。由于在編碼過程中的量化指數(shù)按比例增加,將通過與使用在編碼過程中的相同的位移值量而被按比例降低,所以不產(chǎn)生由于按比例降低而引起的信息丟失。哪個量化指數(shù)被按比例降低是由在步驟203的ROI系數(shù)標識結(jié)果給定的,并且該指數(shù)被按比例降低的程度是從步驟201接收的標題比特取出的。
在解量化步驟206,對于量化指數(shù)執(zhí)行解量化,以便獲得在每個子帶中的解量化變換系數(shù)。解量化方案由量化步長、每一系數(shù)的比特或量化表格指定,其任一個是從標題比特取出的。
在反相子波變換步驟207,對于在每個子帶中的解量化變換系數(shù)執(zhí)行一個反相子波變換,以便獲得一重建圖像。子波分解等級的數(shù)量以及子波分解的類型,是由從步驟201的編碼的比特數(shù)據(jù)流取出的標題比特提供。該數(shù)量和該類型必須與使用在編碼器中的數(shù)量和類型相同。
在區(qū)域坐標解碼步驟202,關(guān)于在編碼方法100中的ROI坐標描述步驟106形成的感興趣區(qū)域的坐標的編碼數(shù)據(jù)被解碼,并且獲得ROI坐標。通過以一個逆序執(zhí)行步驟106ROI的坐標描述,執(zhí)行該步驟。換句話說,步驟202是以這樣的方式執(zhí)行步驟106,即步驟106的輸出是到步驟202的輸入,而步驟106的輸入是步驟202的輸出。在編碼比特數(shù)據(jù)流中多個感興趣區(qū)域被加重的情況下,步驟202解碼用于每個感興趣區(qū)域的坐標。
在ROI系數(shù)標識步驟203,執(zhí)行與編碼方法100中的步驟105相同的處理。在該解碼方重復(fù)的相同處理的原因是,指定在編碼的比特數(shù)據(jù)流之內(nèi)的該所選感興趣區(qū)域的信息,可以被發(fā)送或以一個描述的形式保存在被提供作為步驟202的輸入的圖像域中,比通過步驟203獲得的子波域中的一個描述形式更有效。在編碼比特數(shù)據(jù)流中存在多個感興趣區(qū)域的情況下,對應(yīng)于每一感興趣區(qū)域的ROI系數(shù)被標識并且分類到每一類別中。
在熵解碼步驟204,編碼方法100中的熵編碼步驟108產(chǎn)生的編碼比特數(shù)據(jù)流被解碼。當(dāng)在步驟108使用一個比特平面編碼器時,相應(yīng)的比特平面解碼器被使用在步驟204。步驟204執(zhí)行的熵解碼是編碼方法100中的熵編碼步驟108的逆序。解碼器能夠處理從具有不同優(yōu)先級的編碼的不同階段開始的多個感興趣的區(qū)域、從編碼的始端開始的ROI編碼、以及從編碼的中間開始的ROI編碼。
在步驟204,通過查找用于每個子帶的編碼標記,該編碼的數(shù)據(jù)比特數(shù)據(jù)流被分開成用于每個子帶的一組比特數(shù)據(jù)流。然后,通過查找用于每個比特平面的編碼標記,用于每一子帶的每一比特數(shù)據(jù)流被分開成用于每個比特平面的一組比特數(shù)據(jù)流。通過一個比特平面解碼器對用于每一比特平面的每一比特數(shù)據(jù)流熵解碼。該比特平面解碼被以降低比特有效級別的排序?qū)崿F(xiàn)的。通過求和用于每個子帶的每一系數(shù)的比特以及指定到感興趣區(qū)域的優(yōu)先級(左位移值),給定在每個子帶中的比特平面的數(shù)量。通過步驟203獲得的ROI系數(shù)標識結(jié)果和比特平面的數(shù)量以及對感興趣區(qū)域的優(yōu)先級,確定每一解碼比特被指定到哪個比特字段。
能夠在步驟204控制用于每一子帶的比特率。最簡單的方法是,以期望的比特率或以期望的比特數(shù)截斷用于每個子帶的比特數(shù)據(jù)流。依靠對感興趣區(qū)域的優(yōu)先級控制以及指定在編碼方的感興趣區(qū)域的加重起動階段,連同針對每個子帶的數(shù)據(jù)流的截短一起,以一個給定比特率針對感興趣區(qū)域以及圖像其余區(qū)域的比特分配能夠被總體上控制。然而,如果用于表示感興趣區(qū)域的一組比特平面的數(shù)據(jù)流的比特率是以一個單速率控制器控制(1),用于表示感興趣區(qū)域以及圖像的其余區(qū)域的一組比特平面的數(shù)據(jù)流的比特率是以一個單速率控制器控制(2)、以及用于表示感興趣區(qū)域之外的區(qū)域的一組比特平面的數(shù)據(jù)流的比特率是以另一個速率控制器控制(3),則分配到該感興趣區(qū)域以及分配到圖像的其它區(qū)域的比特率被以用于整個圖像的一個給定比特率更精確地控制。如果到感興趣區(qū)域的優(yōu)先級是最大值,則所有比特平面表示感興趣的區(qū)域或者表示圖像的其余區(qū)域。因此,提供用于(1)和(3)的速率控制器使得有可能用比特精度控制用于感興趣區(qū)域的比特率以及用于其他圖像區(qū)域的比特率。
在ROI系數(shù)解定標步驟205,對應(yīng)于感興趣區(qū)域的量化指數(shù)的值或?qū)?yīng)于感興趣區(qū)域的量化指數(shù)的比特有效級別被按比例降低。
除了步驟107的輸入是步驟205的輸出、步驟107的輸出是步驟205的輸入、按比例增加步驟107對應(yīng)于按比例降低步驟205之外,該步驟的細節(jié)與編碼方法100中的ROI系數(shù)定標步驟107的細節(jié)完全相同。而且,步驟107的編碼排序?qū)?yīng)于步驟205的解碼排序。
在解量化步驟206,使用的解量化方案恢復(fù)由編碼方法100中的步驟103使用量化方案所量化的變換系數(shù)。如果量化是通過以編碼器進行的一個標量量化實現(xiàn),則解量化必須以一個標量解量化實現(xiàn)。如果量化是通過網(wǎng)格編碼的量化實現(xiàn),則解量化必須以一個網(wǎng)格編碼的解量化實現(xiàn)。解量化器的表示級別可以是量化器中的判定級別的中點或可以是該判定級別的矩心,該中點或矩心是通過假設(shè)用于每個子帶的量化指數(shù)值的分配計算的。即使不在編碼器執(zhí)行量化,除了使用整數(shù)子波變換以及編碼和解碼都是無損耗地實現(xiàn)之外,也在該解碼器執(zhí)行解量化。當(dāng)編碼是無損耗實現(xiàn)而解碼是以有損耗實現(xiàn)時,量化不在該編碼處理中實行,但是在解碼過程以執(zhí)行解量化。
在反相子波變換步驟207,使用一個反相子波變換,重建在編碼方法100中步驟101使用的子波變換所分解的圖像。
圖11示出一方法,通過分配到感興趣區(qū)域的比特比分配到該感興趣區(qū)域之外的區(qū)域的比特更多,而對選擇的感興趣區(qū)域加重來壓縮圖像。該編碼方法與圖1的方法之間的主要差別是,在該方法中對于變換系數(shù)執(zhí)行量化之前,執(zhí)行ROI系數(shù)定標。不同于圖1中的步驟是用于ROI系數(shù)定標的步驟和用于熵編碼的步驟。其余步驟是相同的。
圖11中,編碼方法1100包括子波變換步驟1101,執(zhí)行對于輸入數(shù)字圖象的象素值的子波變換,以便由包括該變換系數(shù)的一組子帶表示該輸入的圖像。步驟1011之后是分配步驟1102和ROI系數(shù)定標步驟1003。在步驟1102,指定到每個子帶中的變換系數(shù)每一系數(shù)的比特(即表示該系數(shù)的精確度)被確定。相當(dāng)于確定用于每一子帶的量化步長。在每一系數(shù)的分配比特或用于每一子帶的量化步長被預(yù)定的情況下,不執(zhí)行步驟1102。在量化級1107使用每一系數(shù)分配的比特。根據(jù)由步驟1101提供的變換系數(shù)執(zhí)行步驟1102的比特分配的一個可選方案,是根據(jù)步驟1103按比例增加的變換系數(shù)執(zhí)行比特分配。
在步驟1101和1102的之前、之后或同時,執(zhí)行感興趣區(qū)域選擇步驟1104、ROI系數(shù)識別步驟1105和ROI坐標描述步驟1106。在步驟1104,在輸入的圖像上選擇感興趣的區(qū)域,并且把選擇的感興趣區(qū)域的坐標輸入到步驟1105和1106。在步驟1105,在每一子帶中的對應(yīng)于選擇的感興趣區(qū)域的子波變換系數(shù),即ROI系數(shù)被標識,以便通過加重在包括子波變換系數(shù)的每一子帶中的ROI系數(shù)加重在該圖像中的所選擇的感興趣的區(qū)域。ROI系數(shù)(即系數(shù)的類別)的識別結(jié)果被輸入到步驟1103,該ROI系數(shù)描述該變換系數(shù)是否對應(yīng)于感興趣的區(qū)域或該感興趣區(qū)域的外部區(qū)域。在ROI坐標描述步驟1106,選擇的感興趣區(qū)域的坐標被編碼,以便有效地發(fā)送或存儲ROI坐標信息。
在ROI系數(shù)定標步驟1103,從步驟1103提供的變換系數(shù)中的僅對應(yīng)于感興趣區(qū)域的變換系數(shù)倍乘分配給該選擇的感興趣區(qū)域的一個定標值而被加重。根據(jù)該定標,對應(yīng)于感興趣區(qū)域的變換系數(shù)在量化步驟1107以較大的比特數(shù)量化并且被表示得比其它變換系數(shù)更精確。當(dāng)左位移值被用作一個定標值時,通過左位移該系數(shù)值而加重相應(yīng)的變換系數(shù)。在步驟1105形成的ROI系數(shù)的識別結(jié)果,用于選擇哪個系數(shù)將要被按比例增加。包括在步驟1103按比例增加的全部變換系數(shù)被提供到量化步驟1107,以便被量化。下列步驟與哪個系數(shù)被按比例增加無關(guān)。如果使用均勻量化器并且該感興趣區(qū)域的定標值是量化步長或整數(shù)倍的量化步長,則ROI系數(shù)定標可以在量化步驟之后進行。在此情形中,編碼方法1100與圖1中的編碼方法相同。
在步驟1107,執(zhí)行對于在每個子帶中的變換系數(shù)的量化,以便用量化指數(shù)表示每個子帶的變換系數(shù),其量化指數(shù)代表由每一系數(shù)的分配比特或由用于每個子帶的量化步長確定的精確度。通過步驟1107,獲得以一個降低的或相同的變換系數(shù)值的顯示精確度表示變換系數(shù)的量化指數(shù)。獲得的量化指數(shù)被傳給步驟1108進行熵編碼。
在熵編碼步驟1108,對量化指數(shù)的二進制表示的每一比特單元執(zhí)行熵編碼,以便形成一個編碼的數(shù)據(jù)流,在該比特數(shù)據(jù)流中,其中由量化指數(shù)的較高比特有效級別的比特字段產(chǎn)生的編碼比特,與由較低比特有效級別的比特字段產(chǎn)生的其它編碼比特相比,被放置于更早的部分。在每一子帶中的變換系數(shù)的每一比特字段的編碼排序由編碼技術(shù)決定。步驟1108的最佳編碼技術(shù)或者是例如一個二進制算術(shù)編碼技術(shù)的一個比特平面編碼,或例如SPIHT編碼技術(shù)的零樹形編碼。
在發(fā)射機步驟1109,標題比特,例如圖像大小、子波分解級別數(shù)、用于每個子帶的每一系數(shù)的比特或量化步長、ROI描述信息、指定到感興趣區(qū)域的優(yōu)先級或左位移值,被附加到由熵編碼器形成的數(shù)據(jù)比特。附加數(shù)據(jù)被作為一個編碼比特數(shù)據(jù)流發(fā)送或存儲。
當(dāng)多個感興趣的區(qū)域?qū)⒁患又貢r,在步驟1104標識多個感興趣的區(qū)域,對應(yīng)于每一感興趣區(qū)域的ROI系數(shù)在步驟1105被標識并且分類成不同類別,用于每個感興趣區(qū)域的或用于全部感興趣區(qū)域的坐標在步驟1106編碼。用于多個感興趣區(qū)域的步驟1104、1105和1106與用于多個感興趣區(qū)域的編碼方法100(圖1)的步驟104、105、和106相同。在步驟1103,每個類別中的變換系數(shù)的值可以以自己的定標值按比例增加(由指定到每個感興趣區(qū)域的一個定標值倍乘)。結(jié)果,每個感興趣的區(qū)域可以用不同的加重編碼,并且每個感興趣區(qū)域的圖像質(zhì)量能夠被獨立地控制。
圖12示出一種解壓縮一個圖像的方法,其圖像是以圖11中的所選感興趣區(qū)域上的加重編碼的。圖12中的解碼方法和圖2中的解碼方法之間的重要的差別是,圖12中的解碼方法的解量化在執(zhí)行ROI系數(shù)解定標之前執(zhí)行,而圖2中的解碼方法的解量化在執(zhí)行ROI系數(shù)解定標之后執(zhí)行。與圖2中不同的步驟是對于熵解碼的步驟和用于ROI系數(shù)解定標的步驟。其余步驟是相同的。
圖12中,解碼方法1200包括一接收機步驟1201,用于接收包括標題比特和數(shù)據(jù)比特的編碼比特數(shù)據(jù)流。步驟1201后面是區(qū)域坐標解碼步驟1202和熵解碼步驟1204。在步驟1202,解碼區(qū)域坐標的編碼數(shù)據(jù),以便獲得感興趣區(qū)域的坐標(ROI),其將在重建圖像中以一個加重重建。解碼的ROI坐標傳給ROI系數(shù)標識步驟1203,其中標識對應(yīng)于感興趣區(qū)域的子波變換系數(shù)。該ROI系數(shù)標識結(jié)果在ROI系數(shù)解定標步驟1206中使用。
在熵解碼步驟1204,對于具有在接收機步驟1201接收的數(shù)據(jù)比特的輸入比特數(shù)據(jù)流執(zhí)行熵解碼。針對每一變換系數(shù)的量化指數(shù)的二進制表示每一比特字段獲得解碼比特。在每一量化指數(shù)中,較高比特有效級別的比特字段被解碼,比較低比特有效級別的比特字段的解碼要早。使用在步驟1204中的熵解碼器使用比特平面解碼技術(shù)或SPIHT解碼技術(shù)如果熵編碼是以一個比特平面編碼技術(shù)實現(xiàn),則解碼必須是以一個相應(yīng)的比特平面解碼技術(shù)實現(xiàn);如果熵編碼是以一個SPIHT編碼技術(shù)實現(xiàn),則解碼必須是以一個SPIHT解碼技術(shù)實現(xiàn)。熵解碼比特被組織成為量化指數(shù)的二進制表示的比特字段值,并且被傳給解量化步驟1205。
在解量化步驟1205,對于量化指數(shù)執(zhí)行解量化,以便獲得在每個子帶中變換系數(shù)的解量化值。解量化方案由量化步長、每一系數(shù)的比特或量化表格確定,其任一個都是從標題比特取出的。
在步驟1206,對應(yīng)于將要在重建圖像上被加重的一個感興趣區(qū)域的變換系數(shù)的值被按比例降低。通過用從接收機步驟1201接收的標題比特取出的一個定標值除相應(yīng)的變換系數(shù),該值執(zhí)行按比例降低。當(dāng)通過一個左位移值指定該定標值時,該按比例降低是通過對于該系數(shù)值執(zhí)行的右位移該定標值實現(xiàn)的。
在反相子波變換步驟1207,對于在每個子帶中的變換系數(shù)執(zhí)行一個反相子波變換,以便獲得一重建圖像。子波分解等級以及子波分解的類型是由從步驟1201的編碼的比特數(shù)據(jù)流取出的標題比特提供。該數(shù)目和該類型必須與使用在編碼器中的數(shù)目和類型相同。
當(dāng)多個感興趣的區(qū)域?qū)⒁患又貢r,根據(jù)從接收機步驟1201接收的標題比特,對應(yīng)于每一感興趣區(qū)域的ROI系數(shù)在步驟1203被標識。根據(jù)該ROI系數(shù)標識結(jié)果和由標題比特提供的、指定到每個感興趣區(qū)域的一個優(yōu)先級或定標值,對應(yīng)于每一感興趣區(qū)域的變換系數(shù)被根據(jù)對于每個感興趣區(qū)域的優(yōu)先級而按比例降低。
圖13示出其中以逐個塊為基礎(chǔ)進行編碼和解碼的感興趣的區(qū)域。以此編碼和解碼方案中,一個圖像被分成一組塊(圖像的小部分)其形狀是矩形、正方形、條線或長方形、正方形和條線的某些或全部的組合,并且每一塊的處理作為到編碼器的單獨輸入或用于解碼器的單獨的輸出。感興趣區(qū)域之外的每一塊由圖1或圖11中的編碼方法編碼,不使用ROI功能,(不標識ROI系數(shù),不執(zhí)行按比例增加)。把一個塊標識為感興趣區(qū)域之外的一個塊的一個編碼標記,被加到用于感興趣區(qū)域之外的一個塊的編碼比特數(shù)據(jù)流。感興趣區(qū)域的內(nèi)部的每一塊也不使用ROI功能編碼,或做為選擇,該感興趣區(qū)域內(nèi)部的塊可以使用ROI功能,例如ROI系數(shù)定標功能,編碼。把一個塊標識為感興趣區(qū)域內(nèi)部一個塊的一個編碼標記,被加到用于感興趣區(qū)域內(nèi)部一個塊的編碼比特數(shù)據(jù)流。重疊感興趣區(qū)域邊界的每一塊通過使用ROI功能的圖1或圖11中的一個編碼方法編碼。標識感興趣區(qū)域邊界的一個編碼標記,被加到用于重疊該感興趣區(qū)域邊界的一個塊的編碼比特數(shù)據(jù)流。用于每一塊的比特率的分配方式是,在感興趣區(qū)域之內(nèi)的塊被分配最高的比特率,重疊該感興趣區(qū)域的塊被分配次最高的比特率,而感興趣區(qū)域之外的塊被分配最低的比特率。做為選擇,為了要降低編碼方和解碼方的計算復(fù)雜性,根據(jù)在感興趣區(qū)域之內(nèi)的像素的數(shù)量、在該感興趣區(qū)域之內(nèi)的像素百分數(shù)或任何其它判據(jù),重疊感興趣區(qū)域邊界的塊被視為感興趣區(qū)域內(nèi)部的塊或感興趣區(qū)域之外的塊。
用于每個塊的每個比特數(shù)據(jù)流,可以以每個塊編碼的順序排隊成一個用于整個圖像的編碼比特數(shù)據(jù)流,或用于感興趣區(qū)域內(nèi)部的塊的比特流可以首先排隊,用于重疊感興趣區(qū)域的邊界的塊的比特數(shù)據(jù)流可以其次排隊,并且用于感興趣區(qū)域之外的塊的比特數(shù)據(jù)流可以最后排隊。在后者情況中,用于每個塊的編碼標記必須具有指定在該圖像之內(nèi)的一個位置的位置信息。
根據(jù)指定到用于每個塊的比特部分的編碼標記,用圖2中的解碼方法實現(xiàn)解碼(如果圖1中的編碼方法被使用),或用圖12中的解碼方法實現(xiàn)解碼(如果圖11中的編碼方法被使用)。以表示在感興趣區(qū)域之內(nèi)或之外的一標記為前導(dǎo)的比特部分的解碼的執(zhí)行不使用ROI功能。如果感興趣區(qū)域的內(nèi)部的塊的編碼是通過使用ROI功能,例如ROI系數(shù)定標實現(xiàn)的,則感興趣區(qū)域之內(nèi)的塊的解碼需要用ROI功能實現(xiàn)。以表示重疊該感興趣區(qū)域的一標記為前導(dǎo)的比特部分的解碼的執(zhí)行使用ROI功能。
默認時,在感興趣區(qū)域之內(nèi)的塊被分配最高的比特率,重疊該感興趣區(qū)域的塊被分配次最高的比特率,而感興趣區(qū)域之外的塊被以一個給定比特率分配最低的比特率。然而,每一塊的比特率可以被獨立地控制。如果解碼方想要以較高逼真度重建未被指定為感興趣區(qū)域的區(qū)域,則在重新定義的區(qū)域之內(nèi)的部分被指定一更高的比特率。
當(dāng)子帶分類使用在圖1或圖11那樣的編碼器中時,每個子帶被劃分成包括變換系數(shù)的幾個序列。不是在每一子帶中執(zhí)行ROI系數(shù)定標,ROI系數(shù)定標是對于量化指數(shù)或?qū)τ诿恳恍蛄兄械淖儞Q系數(shù)執(zhí)行的。還對每個序列的按比例增加結(jié)果執(zhí)行熵編碼。如果每個序列被認為是在圖1或圖11中的編碼方法的每個子帶,編碼方法可以是圖1或圖11中的一個編碼方法。在從子帶產(chǎn)生每個序列之后,通過把每一序列作為每一子帶處置,基于序列的技術(shù)以圖1和圖11的編碼方法利用每種ROI系數(shù)定標技術(shù)操作。
當(dāng)通過使用一個子帶分類技術(shù)的編碼方法產(chǎn)生圖像的編碼比特數(shù)據(jù)流時,實行熵解碼和ROI系數(shù)解定標,以便獲得包括系數(shù)的每一個序列。然后,從相同的子帶起源的幾個序列被解劃分成每個子帶,以便能夠執(zhí)行反相子波變換。如果用于每個序列的每個比特部分被認為是用于每個子帶的一個比特部分,則以根據(jù)圖2或12的一種解碼方法實行解碼。象該編碼方法一樣,為了執(zhí)行反相子波變換,通過把每一序列作為在每個步驟中的子帶處置,直到形成子帶的序列為止,圖2或12中描述的解碼方法與子帶分類技術(shù)一起操作。
當(dāng)對于圖1或11的編碼方法中的每個子帶或每個序列中的每個系數(shù)的塊實行熵編碼時,對于每一系數(shù)數(shù)據(jù)塊執(zhí)行根據(jù)圖3A-6C的ROI系數(shù)定標方法以及根據(jù)圖7A-8C的熵編碼方法。為了對于系數(shù)的每一數(shù)據(jù)塊執(zhí)行熵編碼,每一子帶或系數(shù)的每個序列被分成系數(shù)數(shù)據(jù)塊。每個子帶或序列可以被分成相同形狀或不同形狀的塊。該塊可以是矩形、正方形或條線形,或可以是矩形、正方形或條線形的某些或全部的組合。為了降低用于處理每一塊的計算復(fù)雜性,全部子帶可以具有相同的形狀的相等的塊數(shù)或,也可以具有相同的形狀的相等的塊大小。每個塊被獨立地編碼。不對應(yīng)于感興趣區(qū)域的塊的編碼不使用ROI系數(shù)定標方法。示出感興趣區(qū)域之外的塊的編碼標記被附加到塊的編碼比特數(shù)據(jù)流。對應(yīng)于感興趣區(qū)域的塊的編碼使用ROI系數(shù)定標方法。示出對應(yīng)于感興趣區(qū)域的塊的編碼標記被附加到該塊的編碼比特數(shù)據(jù)流。該編碼標記可以說明塊中的全部系數(shù)對應(yīng)于感興趣區(qū)域或塊中的某些系數(shù)對應(yīng)于感興趣區(qū)域。當(dāng)塊中的全部系數(shù)對應(yīng)于感興趣的區(qū)域時,編碼可以實行而不使用ROI系數(shù)定標方法。
做為選擇,具有對應(yīng)于感興趣區(qū)域的系數(shù)的塊以及對應(yīng)于感興趣區(qū)域之外區(qū)域的系數(shù)的塊,能夠被分類為其系數(shù)完全屬于該感興趣區(qū)域的塊或其系數(shù)完全屬于該感興趣區(qū)域之外的區(qū)域的塊。該分類是根據(jù)對應(yīng)于感興趣區(qū)域的系數(shù)的數(shù)量、對應(yīng)于感興趣區(qū)域的系數(shù)的數(shù)量與每個塊中的系數(shù)的數(shù)量的比例或任何其它判據(jù)。用于全部塊的編碼的實行不使用該ROI系數(shù)定標方法。相反,把每一塊的編碼比特數(shù)據(jù)流區(qū)別為一個用于感興趣區(qū)域的數(shù)據(jù)流或一個用于感興趣區(qū)域之外區(qū)域的數(shù)據(jù)流的編碼標記,被加到每個塊的編碼比特數(shù)據(jù)流,以便該解碼器能夠指定哪個比特部分對應(yīng)于感興趣的區(qū)域。
當(dāng)對于每一子帶或序列之內(nèi)的系數(shù)的每個塊實行熵編碼時,對應(yīng)于編碼方使用的熵編碼方法和ROI系數(shù)定標方法的熵解碼和ROI系數(shù)解定標方法,如圖2或12使用的那樣,被在每個塊上執(zhí)行。在此解碼環(huán)境中,在編碼方未指定的感興趣的區(qū)域或完全地由解碼方指定的感興趣的區(qū)域能夠以比該圖像的其余區(qū)域更高的逼真度重建,或可以被有選擇地重建。根據(jù)新近指定的感興趣區(qū)域,根據(jù)圖9中的方法,對應(yīng)于感興趣區(qū)域的變換系數(shù)被指定。包括對應(yīng)于新近定義的感興趣區(qū)域的系數(shù)的系數(shù)塊被以比該子帶中其它塊更高的比特率重建。僅包括對應(yīng)于感興趣區(qū)域的系數(shù)的系數(shù)塊將被分配最高的比特率。包括對應(yīng)于感興趣區(qū)域和對應(yīng)于感興趣區(qū)域之外的區(qū)域的系數(shù)的系數(shù)塊將被分配相同的比特率、較低的比特率、或最低的比特率。不包括對應(yīng)于感興趣區(qū)域的系數(shù)的系數(shù)塊將被分配最低的比特率。如果0比特被分配到一個塊,則該塊將不被用于重建圖像。
對每個塊的比特分配,可以根據(jù)對應(yīng)于每個塊中的感興趣區(qū)域的系數(shù)的數(shù)量更多精確地執(zhí)行。在一塊中的對應(yīng)于感興趣區(qū)域的系數(shù)的數(shù)量越大,將被分配的重建該圖像的比特率數(shù)越大。比特分配可以根據(jù)任何判據(jù)完成,其判據(jù)反映在感興趣的區(qū)域或整個圖像的重建中每個系數(shù)的重要程度。例如,能夠根據(jù)該系數(shù)是否對應(yīng)于感興趣的區(qū)域、該系數(shù)表示在感興趣的區(qū)域中多少像素、由該系數(shù)表示的像素的何種百分數(shù)屬于感興趣的區(qū)域來定義每個系數(shù)的重要程度。全部或某些判據(jù)被使用,連同對應(yīng)于每一塊中感興趣區(qū)域的系數(shù)的數(shù)量,以便確定被分配到系數(shù)塊的比特速率數(shù)。
不是通過使用用于每個塊的判據(jù)分配比特或比特速率,系數(shù)塊的編碼或解碼排序能夠以這樣的方式確定,即將要分配較高比特率的塊被給定一個較早的編碼或解碼排序??梢愿鶕?jù)針對每一塊的判據(jù)定義任何其它排序。
圖14是根據(jù)本發(fā)明的解碼數(shù)據(jù)的另一方法的流程圖。本方法首先假定步驟130提供對應(yīng)于一個圖像的數(shù)字數(shù)據(jù)。然后通過用戶在步驟132中選擇感興趣的圖像區(qū)域。然而,本發(fā)明還包括通過一個方法,其中一個自動目標識別系統(tǒng)根據(jù)一組判據(jù)定義一個或幾個感性趣的區(qū)域。該自動目標識別系統(tǒng)可以使用多種方法以便標識感興趣的區(qū)域。例如,模式識別軟件可以用于標識圖像中感興趣的目標。在該圖像中選擇了感興趣區(qū)域之后,對于該數(shù)字圖像數(shù)據(jù)執(zhí)行子波變換,以便獲得包括系數(shù)的一組子帶134。如上討論,若干不同的子波變換類型,例如錘(mallet)類型變換、寬域(spacl)子波變換、分組(packet)類型變換等等,可以使用獲得該系數(shù)。對應(yīng)于所選感興趣區(qū)域的系數(shù)在步驟136被標識。然后在步驟138排序該系數(shù),以便至少一個對應(yīng)于數(shù)字圖像數(shù)據(jù)的系數(shù)的類別表示感興趣的區(qū)域。然后在步驟140根據(jù)該系數(shù)安排在其中的該類別把該系數(shù)熵編碼。通過把系數(shù)排序成對應(yīng)于感興趣區(qū)域的類別,使得有可能獨立地處理和壓縮該圖像的不同區(qū)域。在圖像的大部分組成相對無特色的背景的環(huán)境中,這是很寶貴的。
有幾種不同方法確定感興趣區(qū)域?qū)⒈粔嚎s的程度。一種方法是讓用戶選擇壓縮的程度。另一在圖15中示出的方法是,在步驟142確定用于編碼表示圖像的數(shù)字數(shù)據(jù)的數(shù)字比特的總數(shù)。在步驟144確定用于圖像的不同區(qū)域的優(yōu)先級。根據(jù)區(qū)域的優(yōu)先級,從比特的總數(shù)來的比特隨后在步驟146和148被分配用于編碼該圖像的各種區(qū)域,使得高優(yōu)先級區(qū)域能夠被比低優(yōu)先級區(qū)域更精確地重建。通常,發(fā)送裝置具有發(fā)送比特數(shù)據(jù)流的一個設(shè)置的比特率。根據(jù)本發(fā)明,將要傳送的比特數(shù)據(jù)流的一部分在步驟150被分配用于發(fā)送該圖像的高優(yōu)先級區(qū)域。例如,如果該比特數(shù)據(jù)流被以1000比特/秒的一個速率發(fā)送,則800比特/秒可以分配用于發(fā)送表示高優(yōu)先級的圖像區(qū)域的編碼數(shù)據(jù),而200比特/秒可以分配用于發(fā)送表示低優(yōu)先級的圖像區(qū)域的編碼數(shù)據(jù)。一旦該比特數(shù)據(jù)流的部分被在步驟150分配用于高優(yōu)先級編碼數(shù)據(jù)的發(fā)送,則在步驟152把該比特數(shù)據(jù)流發(fā)送到一個遠端的位置。一旦對應(yīng)于圖像高優(yōu)先級區(qū)域的全部編碼數(shù)據(jù)已經(jīng)被發(fā)送,則在步驟154把整個比特數(shù)據(jù)流分配到對表示該圖像的較低優(yōu)先級區(qū)域的編碼數(shù)據(jù)的發(fā)送。
圖16示出本發(fā)明編碼裝置的一種實施例的方框圖。圖像數(shù)據(jù)600被提供到一個子波轉(zhuǎn)換器602。子波轉(zhuǎn)換器602執(zhí)行該圖像數(shù)據(jù)600的一個子波變換以便獲得包括系數(shù)的子帶。感興趣區(qū)域系數(shù)標識器604接收感興趣區(qū)域的坐標以及來自子波轉(zhuǎn)換器602包括系數(shù)的子帶,并且標識對應(yīng)于該感興趣區(qū)域的系數(shù)。
如上討論,從對應(yīng)于感興趣區(qū)域的子波變換獲得的系數(shù)的標識,是通過跟蹤從圖像域到子波域的反相的子波變換實現(xiàn)的。以此方式,用于重建每個像素的一組子波變換系數(shù)能夠被獨立地標識。因此,感興趣區(qū)域的系數(shù)的標識與感興趣區(qū)域的形狀無關(guān),并且感興趣區(qū)域能夠包括不連接的區(qū)域。子帶分類器608分類該系數(shù)并且產(chǎn)生一個分類圖610。分類系數(shù)被發(fā)送到一個量化器612和一速率分配裝置618。該速率分配裝置618把一個量化步長分配到系數(shù)的每一類,并且提供這速率到量化器612。速率分配裝置618還產(chǎn)生一個量化表,其包括與分配到每個子帶種類的量化步長相關(guān)的信息。該量化器612量化該系數(shù)并且提供量化的系數(shù)到一個熵編碼器614。熵編碼器614根據(jù)提供到熵編碼器614的與感興趣區(qū)域相關(guān)的已收優(yōu)先級信息616編碼該量化系數(shù)。熵編碼器614的輸出是一個編碼比特數(shù)據(jù)流622。
圖17示出本發(fā)明解碼裝置的一種實施例的方框圖。一個編碼的比特數(shù)據(jù)流622和感興趣區(qū)域的優(yōu)先級信息616被熵解碼器624接收。熵解碼器624產(chǎn)生一個提供到反相量化器626的量化輸出。反相量化器626還根據(jù)一個量化表620從一個速率解分配器628接收量化信息。該反相量化器626產(chǎn)生發(fā)送到一個子帶解分類器630的系數(shù)。該子帶解分類器630根據(jù)一個接收的分類圖解分類該系數(shù),以便產(chǎn)生一組被提供到一反相子波轉(zhuǎn)換器630的子帶。反相子波轉(zhuǎn)換器630對于該子帶執(zhí)行一個反相子波變換,以便獲得可用于重建一個圖像的圖像數(shù)據(jù)632。圖18示出一個實施例,其中該裝置包括一個發(fā)送方800,發(fā)送方800編碼該圖像并且把該解碼的數(shù)據(jù)發(fā)送到接收和顯示該圖像的接收方802。發(fā)送方800具有一個利用感興趣區(qū)域功能的編碼器804。最初,編碼器804編碼一個低分辨率、低逼真度或低比特率的圖像版本,并且發(fā)送該編碼的版本到發(fā)送裝置806。發(fā)送裝置806發(fā)送該編碼的信號到定位在接收方802的接收裝置808。發(fā)送可以通過有線的傳輸信道或無線傳輸信道實現(xiàn)。接收方802的接收裝置808接收該編碼的信號,并且提供該信號到一個利用感興趣區(qū)域功能的解碼器810。解碼器810解碼該圖像并且發(fā)送該解碼圖像到一個顯示器812,其中該圖像被顯示到一個用戶。接收方802具有一個感興趣區(qū)域選擇器814,其允許用戶選擇在該顯示圖像中的一個感興趣區(qū)域。接收方802還具有一個感興趣區(qū)域優(yōu)先級選擇器816,其允許用戶選擇優(yōu)先級,利用該優(yōu)先級編碼感興趣的區(qū)域。例如,可以選擇優(yōu)先級以使感興趣的區(qū)域?qū)⒈粺o失真重建。一旦一個感興趣的區(qū)域和一個優(yōu)先級已經(jīng)被選擇,感興趣的區(qū)域814和優(yōu)先級816選擇器把關(guān)于該選擇的信息提供到解碼器810以及一個發(fā)送裝置818。發(fā)送裝置把該信息反饋到發(fā)送方800的接收裝置820。接收裝置820接收該信息并且提供該信息到編碼器804。如先前討論的那樣,編碼器804隨后根據(jù)該信息優(yōu)先編碼該選擇的感興趣區(qū)域,然后把該編碼的感興趣區(qū)域信息發(fā)回到接收方802。該過程可以被重復(fù),以使該用戶能夠根據(jù)在先的感興趣區(qū)域的檢驗而改進感興趣的區(qū)域。因此,上述討論的實施例允許接收方的用戶交互地確定感興趣區(qū)域的編碼。
本發(fā)明的另一應(yīng)用包括把上述的感興趣區(qū)域的構(gòu)思集成到一個數(shù)字照相機。在這樣一個應(yīng)用中,感性趣區(qū)域以及用于編碼該區(qū)域的判據(jù),是通過該數(shù)字照相機的用戶在照相機的視圖尋像器或顯示器上選擇的。該照相機隨后根據(jù)該判據(jù)記錄在感性趣區(qū)域中的信息。通過以高清晰度或保真度僅記錄一個選擇的感性趣區(qū)域,需要存儲該數(shù)字圖象的存儲空間的需求可以被降低。因為大多數(shù)的數(shù)字照相機中的存儲空間是非常有限的,所以這樣一個應(yīng)用特別有益。
還理解到,上述討論的編碼方法與裝置還可以被應(yīng)用到數(shù)字再生的運動圖像。例如,正被發(fā)送的一個比特數(shù)據(jù)流的所選部分允許實時再生一種圖像,該圖像能夠?qū)S糜诎l(fā)送生成運動圖像中的一個感性趣區(qū)域。而且,該感性趣區(qū)域的尺寸以及位置能夠隨著運動圖像的發(fā)展被不斷地改變。
上述的本發(fā)明的描述僅用于說明的目的。應(yīng)該理解,根據(jù)本發(fā)明的一個感性趣區(qū)域的選擇以及重建可以由其它類型的壓縮方法使用,上述公開的各種裝置具有很多的等同物,這將在本專業(yè)技術(shù)人員的知識范圍之內(nèi)。本發(fā)明的界定以所附的權(quán)利要求書定義。
權(quán)利要求
1.一種圖像壓縮方法,所說的方法包括步驟提供包括與用于多個像素的數(shù)值和坐標有關(guān)的數(shù)據(jù)的數(shù)字圖像數(shù)據(jù);選擇由所說的數(shù)字圖像數(shù)據(jù)表示的一個圖像的一個感性趣區(qū)域;根據(jù)至少兩個優(yōu)先級類別分類和劃分所說數(shù)字圖像數(shù)據(jù)的優(yōu)先級,以對應(yīng)于感性趣區(qū)域的數(shù)字圖像數(shù)據(jù)具有一個比對應(yīng)于該感性趣區(qū)域之外的區(qū)域的數(shù)字圖像數(shù)據(jù)更高的優(yōu)先級;和把所說的分類和優(yōu)先級劃分的數(shù)字圖像數(shù)據(jù)發(fā)送到一個遠端位置,以對應(yīng)于感性趣區(qū)域的該數(shù)字信息數(shù)據(jù)的發(fā)送的具有比該感性趣區(qū)域之外的區(qū)域更高的優(yōu)先級。
2.根據(jù)權(quán)利要求1的方法,其中所說數(shù)字圖像數(shù)據(jù)的分類和優(yōu)先級劃分進一步包括步驟在數(shù)字圖像數(shù)據(jù)中執(zhí)行全部象素值的子波變換,以便獲得變換系數(shù);標識對應(yīng)于該感性趣區(qū)域的變換系數(shù);通過按比例增加對應(yīng)于感性趣區(qū)域的變換系數(shù),加重對應(yīng)于該感性趣區(qū)域的變換系數(shù);對包括該按比例增加的變換系數(shù)的變換系數(shù)排序;和對該變換系數(shù)進行熵編碼,以便形式一個比特數(shù)據(jù)流。
3.如權(quán)利要求1的一種圖像壓縮方法,其中所說的把分類和優(yōu)先級劃分的數(shù)字圖像數(shù)據(jù)發(fā)送到遠端的位置的步驟包括以一個更高的速率發(fā)送對應(yīng)于感性趣區(qū)域的分類的和優(yōu)先級劃分的數(shù)字圖像數(shù)據(jù)使得該感性趣區(qū)域能夠以一個比感性趣區(qū)域之外的區(qū)域更高逼真度重建,所說的更高逼真度是由對應(yīng)該感性趣區(qū)域而進行的所說的數(shù)字圖像數(shù)據(jù)的分類和優(yōu)先級劃分提供的。
4.一種用于編碼和解碼一個圖像的方法,所說的方法包括步驟以一種計算機可讀格式提供數(shù)字圖像數(shù)據(jù),所說數(shù)字圖像數(shù)據(jù)包括與用于多個像素的數(shù)值和坐標有關(guān)的數(shù)字圖像數(shù)據(jù);根據(jù)用于該整個圖像的一個分類協(xié)議分類所說數(shù)字圖像數(shù)據(jù),根據(jù)一種預(yù)定的優(yōu)先級化公式,所說的數(shù)字圖像數(shù)據(jù)被分類和劃分優(yōu)先級;把所說的分類數(shù)據(jù)發(fā)送到一個接收機,并且重復(fù)所說的分類和發(fā)送,直到在接收機的一個顯示器上出現(xiàn)一個部分重建圖像;根據(jù)所說的部分重建圖像選擇一個感性趣區(qū)域;把標識該所選感性趣區(qū)域的發(fā)送數(shù)據(jù)從所說的接收機發(fā)送到一個計算機;根據(jù)所選感性趣區(qū)域修改所說數(shù)字圖像數(shù)據(jù)的分類,其中對應(yīng)于該感性趣區(qū)域的數(shù)字圖像數(shù)據(jù)被分類和優(yōu)先級劃分,以便一個具有比對應(yīng)于該感性趣區(qū)域之外區(qū)域的數(shù)字圖像數(shù)據(jù)更高的優(yōu)先級;以及把所說的修改的分類和優(yōu)先級劃分的數(shù)字圖像數(shù)據(jù)發(fā)送到該接收機,以對應(yīng)于感性趣區(qū)域的該數(shù)字信息數(shù)據(jù)的發(fā)送的具有比該感性趣區(qū)域之外的區(qū)域更高的優(yōu)先級。
5.如權(quán)利要求4一種用于編碼和解碼一個圖像的方法,其中所說的發(fā)送所說的分類數(shù)據(jù)的步驟包括把所說的分類數(shù)據(jù)發(fā)送到一個網(wǎng)絡(luò),其中所說接收機是一臺在所說網(wǎng)絡(luò)上的接收計算機,并且其中所說的選擇的該感性趣區(qū)域的步驟是以所說的接收計算機執(zhí)行的。
6.一種編碼表示一個圖像的數(shù)字數(shù)據(jù)的方法,該方法包括步驟以一種計算機可讀格式提供數(shù)字圖像數(shù)據(jù),該數(shù)字圖像數(shù)據(jù)包括與用于至少一個圖像的數(shù)值和坐標有關(guān)的數(shù)字圖像數(shù)據(jù);選擇由該數(shù)字圖像數(shù)據(jù)表示的一個圖像的至少一個感性趣區(qū)域;對于該數(shù)字圖像數(shù)據(jù)執(zhí)行一個子波變換,該子波變換是從包括一個錘狀類型子波變換、寬域類型子波變換、和一個分組類型子波變換中選擇的,以便獲得包括變換系數(shù)的子帶;標識對應(yīng)于至少一個所選感性趣區(qū)域的變換系數(shù);指定對于每個感性趣區(qū)域的一個優(yōu)先級;把在每個子帶中的變換系數(shù)分成至少一個序列;把一個比特速率分配到變換系數(shù)的每一序列;通過一個根據(jù)該分配的速率選擇的一個量化方案,量化在每一序列中的變換系數(shù)根據(jù)針對每一感性趣區(qū)域指定的優(yōu)先級,按比例增加包括對應(yīng)于每個感性趣區(qū)域的量化變換系數(shù)的比特平面的比特有效級別;根據(jù)變換系數(shù)的按比例增加的比特有效級別,修改包括量化變換系數(shù)的比特平面的一個編碼排序;以及根據(jù)該修改的編碼排序,對該量化變換系數(shù)的比特平面熵編碼,以便產(chǎn)生數(shù)字圖像數(shù)據(jù)的一個編碼的比特數(shù)據(jù)流。
7.如權(quán)利要求6的方法,進一步包括步驟標識對于編碼該感性趣區(qū)域需要并且足夠的系數(shù),以便在一個目標空間分辨率圖像中以一個最高的保真度重建所說感性趣區(qū)域。
8.如權(quán)利要求6的方法,其中標識對應(yīng)于該感性趣區(qū)域的系數(shù)的步驟進一步包括步驟標識在該感性趣區(qū)域的邊界上的像素;如果執(zhí)行子波變換和反相子波變換的低通和高通濾波器的至少之一具有一個奇數(shù)的濾波器長度,則沿著該圖像的垂直和水平方向之一標識感性趣區(qū)域之內(nèi)一個像素的像素;把該子波變換和反相子波變換之一的輸入-輸出關(guān)系從一個圖像域跟蹤到每個子帶域,以便標識對應(yīng)于在先步驟中標識的該像素的變換系數(shù);根據(jù)在先步驟中標識的系數(shù)形成每個子帶域中的一個相應(yīng)的感性趣區(qū)域的邊界;和把每個子帶中由該邊界環(huán)繞的系數(shù)標識為對應(yīng)于該感性趣區(qū)域的系數(shù)。
9.如權(quán)利要求6的方法,其中標識對應(yīng)于該感性趣區(qū)域的系數(shù)的步驟進一步包括步驟通過跟蹤在像素上執(zhí)行的一組子波變換和一組重建一個象素值的反相子波變換之一的輸入-輸出關(guān)系,標識對應(yīng)于感興趣區(qū)域中的每一像素的一組變換系數(shù)。和形成一個系數(shù)標識結(jié)果,使得能夠標識對應(yīng)于每個像素的一組變換系數(shù)。
10.如權(quán)利要求6的方法,其中對該比特平面進行熵編碼的步驟產(chǎn)生若干比特形式的編碼信息,并且該方法進一步包括步驟分別地對比特的數(shù)量進行分配,用于表示僅包括對應(yīng)于在每個變換系數(shù)序列中的感性趣區(qū)域的變換系數(shù)的比特平面、用于表示包括同一序列中的所有變換系數(shù)的比特平面、和用于表示包括對應(yīng)于在同一序列中的感性趣區(qū)域之外的區(qū)域的變換系數(shù)的比特平面,使得重建該感性趣區(qū)域的比特的數(shù)量和重建該感性趣區(qū)域之外的區(qū)域的比特的數(shù)量將被分別地控制;和排隊該比特平面的編碼比特部分,使得表示該感性趣區(qū)域的比特部分的一個確定系列將被在比表示感性趣區(qū)域之外的區(qū)域的比特部分更早的發(fā)送階段發(fā)送。
11.根據(jù)權(quán)利要求6的方法,其中選擇的感性趣區(qū)域的步驟進一步包括步驟在該圖像中選擇多個感性趣區(qū)域,并且指定每個區(qū)域一個優(yōu)先級;并且其中把每個子帶中的變換系數(shù)分類成至少一個序列的步驟進一步包括步驟分級該變換系數(shù),使得至少一個序列對應(yīng)于多個感性趣區(qū)域的每一個。
12.如權(quán)利要求6的方法,其中對于一個數(shù)字圖象執(zhí)行子波變換的步驟進一步包括步驟把該圖像劃分成像素的矩形塊,使得某些塊只包括感性趣區(qū)域內(nèi)部的像素,某些塊只包括感性趣區(qū)域之外的像素,并且某些塊包括該感性趣區(qū)域內(nèi)部的某些像素以及該感性趣區(qū)域之外的某些像素,并且對于每個矩形像素塊執(zhí)行子波變換,以及該方法進一步包括步驟通過選擇像素的全部矩形塊被包括在感性趣區(qū)域中以及通過單獨地選擇其中有在感性趣區(qū)域和該感性趣區(qū)域的外部區(qū)域之間的邊界的矩形塊中的像素被包括在該感性趣區(qū)域中,而定義該感性趣區(qū)域;根據(jù)指定到該感性趣區(qū)域的優(yōu)先級,按比例增加對應(yīng)于完全在該感性趣區(qū)域中的矩形像素塊的全部變換系數(shù)的比特有效級別,以及按比例增加對應(yīng)于在重疊該感性趣區(qū)域邊界的塊中的、屬于感性趣區(qū)域的像素的變換系數(shù)的比特有效級別;根據(jù)對該感性趣區(qū)域內(nèi)部的變換系數(shù)的比特有效級別進行的按比例增加,修改在重疊該感性趣區(qū)域邊界的塊中的量化變換系數(shù)的比特平面的一個預(yù)定的編碼排序;根據(jù)該預(yù)定的編碼排序?qū)Σ恢丿B該感性趣區(qū)域邊界的塊中的量化變換系數(shù)的比特平面進行熵編碼,并且根據(jù)該修改的編碼排序?qū)υ谥丿B該感性趣區(qū)域邊界的塊中的量化變換系數(shù)的比特平面進行編碼;和通過指定到該感性趣區(qū)域的一個優(yōu)先級,調(diào)節(jié)全部塊的比特平面的編碼比特序列的排序,使得在感性趣區(qū)域內(nèi)部塊中的比特平面的比特序列的排序被給定較高優(yōu)先等級,以及在感性趣區(qū)域之外的塊和重疊該感性趣區(qū)域的塊中的比特平面的比特序列的排序與該相應(yīng)的塊的編碼排序相同,以便產(chǎn)生編碼的數(shù)字數(shù)據(jù)比特數(shù)據(jù)流。
13.如權(quán)利要求6的方法,其中的熵編碼步驟進一步包括對于該系數(shù)執(zhí)行數(shù)據(jù)壓縮,使得關(guān)于感性趣區(qū)域之外的區(qū)域的信息丟失多于感性趣區(qū)域的信息丟失。
14.一種解碼表示一個圖像的信息的方法,該方法包括步驟接收一個計算機可讀格式的信息,該接收信息包括表示一個圖像的數(shù)字數(shù)據(jù)以及關(guān)于在該圖像中的至少一個感性趣區(qū)域的數(shù)字數(shù)據(jù);根據(jù)關(guān)于該至少一個感性趣區(qū)域的信息,從該編碼比特數(shù)據(jù)流定位在該將要被重建的圖像中的至少一個感性趣區(qū)域;標識對應(yīng)于指定感性趣區(qū)域的數(shù)字數(shù)據(jù);根據(jù)指定到每個感性趣區(qū)域的優(yōu)先級修改該編碼比特數(shù)據(jù)流的一個解碼排序;根據(jù)該修改的解碼排序,對該編碼比特數(shù)據(jù)流進行熵解碼,以便獲得對應(yīng)于具有相同比特有效級別的量化變換系數(shù)的比特平面;按比例降低包括對應(yīng)于每個感性趣區(qū)域的量化變換系數(shù)的比特平面的比特有效級別,以便獲得該量化變換系數(shù)的原始的比特有效級別;根據(jù)一個解量化方案解量化該量化變換系數(shù),以便獲得變換系數(shù)的序列;把變換系數(shù)的序列解分類成一組子帶;以及對于該子帶執(zhí)行一個從錘類型變換、寬域類型變換以及分組類型變換中選擇的反相子波變換,以便重建該數(shù)字圖像數(shù)據(jù)。
15.如權(quán)利要求14的方法,進一步包括步驟分別地標識在熵解碼該編碼的比特數(shù)據(jù)流的一部分中使用的比特數(shù),以便獲得僅包括對應(yīng)于該感性趣區(qū)域的比特平面、用于獲得包括同一序列中的所有變換系數(shù)的比特平面、和用于獲得包括在同一序列中的感性趣區(qū)域之外的變換系數(shù)的其余的比特平面,使得用于重建該感性趣區(qū)域的比特的數(shù)量和用于重建該感性趣區(qū)域之外的區(qū)域的比特的數(shù)量將被分別地控制;以及排列接收的編碼比特數(shù)據(jù)流部分,使得表示該感性趣區(qū)域的該比特部分的一個確定的系列,在該感性趣區(qū)域的重建中的較早階段被解碼。
16.如權(quán)利要求14的方法,其中接收該信息的步驟進一步包括步驟接收該信息,使得對應(yīng)于感性趣區(qū)域的信息接收的速率高于對應(yīng)于該感性趣區(qū)域之外的圖像區(qū)域的信息的接收速率。
17.如權(quán)利要求14的方法,其中標識對應(yīng)于該感性趣區(qū)域的數(shù)字數(shù)據(jù)的步驟進一步包括步驟標識對應(yīng)于由該信息表示的圖像中的多個感性趣區(qū)域的數(shù)字數(shù)據(jù);確定對應(yīng)于多個感性趣區(qū)域的每一個的優(yōu)先級;以及以根據(jù)每一個區(qū)域的確定優(yōu)先級方式,通過重建多個感性趣區(qū)域而重建該圖像。
18.如權(quán)利要求14的方法,其中該數(shù)字圖像數(shù)據(jù)的編碼比特數(shù)據(jù)流包括表示在該圖像中的像素矩形的塊的編碼比特平面組,該方法進一步包括步驟根據(jù)指定到該感性趣區(qū)域的優(yōu)先級值修改用于與該感性趣區(qū)域的邊界重疊的矩形塊的編碼比特平面的一個解碼排序;根據(jù)一個解碼排序?qū)τ糜诓慌c該感性趣區(qū)域的邊界重疊的矩形塊的編碼比特平面進行熵解碼,并且根據(jù)修改的解碼排序?qū)τ糜谂c該感性趣區(qū)域的邊界重疊的矩形塊的編碼比特平面進行熵解碼,以便獲得包括在每個序列中的量化變換系數(shù)的相同比特有效級別的比特平面;根據(jù)指定到該感性趣區(qū)域的優(yōu)先級值,按比例降低該比特平面的比特有效級別,該比特平面僅包括對應(yīng)于在重疊該感性趣區(qū)域邊界的塊中的感性趣區(qū)域的量化變換系數(shù),以便獲得該比特平面的原始比特有效級別;和對于包括量化變換系數(shù)的每個子帶組執(zhí)行一個反相子波變換,以便重建該數(shù)字圖象中的每個矩形塊。
19.用于編碼表示一個圖像的信息的一個編碼裝置,該裝置包括接收裝置,用于接收包括與用于多個像素的數(shù)值和坐標有關(guān)的數(shù)據(jù)的信息;選擇裝置,用于選擇中由該信息表示的圖像中的至少一個感性趣區(qū)域;基于子波的比特平面編碼器裝置,用于對該信息執(zhí)行一個子波變換,該子波變換是從包括一個錘狀類型子波變換、寬域類型子波變換、和一個分組類型子波變換中選擇的,以便獲得包括系數(shù)的子帶;標識裝置,用于標識對應(yīng)于至少一個感性趣區(qū)域的系數(shù);排序裝置,用于根據(jù)多個類別而排序該系數(shù),其中至少一個類別對應(yīng)于表示該感性趣區(qū)域的系數(shù)并且至少一個類別對應(yīng)于表示該感性趣區(qū)域之外的區(qū)域的系數(shù);熵編碼裝置,用于根據(jù)該類別編碼該系數(shù),系數(shù)被放置到該類別中,以便獲得表示該編碼系數(shù)的若干比特;和發(fā)送裝置,用于把一個比特數(shù)據(jù)流中的比特發(fā)送到一個遠端位置,使得其中的比特被發(fā)送的方式取決于該比特對應(yīng)的系數(shù)類別。
20.如權(quán)利要求19的編碼裝置,進一步包括比特分配裝置,用于分配表示每個系數(shù)類別的使用的比特的一個預(yù)定數(shù)量,其中被分配以表示對應(yīng)于圖像感性趣區(qū)的系數(shù)類別的比特數(shù)量,要使得該圖像的感性趣區(qū)域能夠以高于該感性趣區(qū)域之外的圖像區(qū)域的保真度重建;和比特數(shù)據(jù)流分配裝置,用于分配每單位時間發(fā)送的該比特數(shù)據(jù)流的比特的一個固定的部分,用于發(fā)送對應(yīng)于該感性趣區(qū)域的系數(shù)類別對應(yīng)的比特。
21.如權(quán)利要求19的編碼裝置,其中選擇的多個感性趣區(qū)域的選擇裝置進一步包括步驟優(yōu)先級指定裝置,用于指定對應(yīng)于多個感性趣區(qū)域的每一個的優(yōu)先級;并且其中的熵編碼裝置進一步包括優(yōu)先級編碼裝置,用于編碼系數(shù)的類別,其方式是根據(jù)指定到系數(shù)類別對應(yīng)的圖像中的多個感性趣區(qū)域的優(yōu)先級。
22.如權(quán)利要求19的編碼裝置,其中排序裝置進一步包括塊排序裝置,用于根據(jù)類別而排序該系數(shù),使得某些系數(shù)類別包括對應(yīng)于圖像中的矩形像素塊的信息,其中在相應(yīng)的塊中的全部像素在該感性趣區(qū)域的內(nèi)部或該感性趣區(qū)域的外部,并且某些系數(shù)的類別包括對應(yīng)于圖像中的像素矩形塊的信息,其中該相應(yīng)塊中的某些像素在感性趣區(qū)域的內(nèi)部,而某些像素在感性趣區(qū)域的外部。
23.用于接收并且解碼表示一個圖像的信息的一個解碼裝置,該裝置包括接收裝置,用于接收包括與用于多個像素的數(shù)值和坐標有關(guān)的數(shù)據(jù)的信息;標識裝置,用于從該接收裝置接收信息,并且標識對應(yīng)于該圖像的區(qū)域的至少兩個類別的信息,使得至少一個類別對應(yīng)于表示該圖像中的一個感性趣區(qū)域的信息,而至少一個類別對應(yīng)于表示該感性趣區(qū)域外部的圖像中的一個區(qū)域的信息;熵解碼裝置,用于根據(jù)該信息的類別解碼該信息;重建裝置,用于從該熵解碼的信息重建該圖像,其方式使得該圖像的區(qū)域的重建是根據(jù)表示該區(qū)域的信息的類別。
24.如權(quán)利要求23的解碼裝置,其中該接收信息是一個比特數(shù)據(jù)流的形式,而在每單位時間接收的比特數(shù)據(jù)流中的比特的固定部分對應(yīng)于該感性趣區(qū)域,并且其中該重建裝置重建該感性趣區(qū)域快于該感性趣區(qū)域之外的圖像區(qū)域,并且該感性趣區(qū)域保真度高于該感性趣區(qū)域之外的區(qū)域。
25.如權(quán)利要求23的解碼裝置,其中該接收裝置在接收對應(yīng)于該感性趣區(qū)域之外的圖像區(qū)域的信息之前接收對應(yīng)于該感性趣區(qū)域的信息。
26.如權(quán)利要求23的解碼裝置,其中該標識裝置進一步包括多個感性趣區(qū)域標識裝置,用于標識多個對應(yīng)于在由該信息表示的圖像中的多個感性趣區(qū)域的多個類別;和優(yōu)先級確定裝置,用于確定對應(yīng)于多個感性趣區(qū)域每一個的優(yōu)先級;和其中該重建裝置以根據(jù)每一個區(qū)域的優(yōu)先級的方式重建該多個感性趣區(qū)域。
27.如權(quán)利要求23的解碼裝置,其中該標識裝置進一步包括矩形塊標識裝置,用于標識包括對應(yīng)于該圖像中的矩形像素塊的信息的信息類別,其中在每個相應(yīng)塊中的所有的像素在該感性趣區(qū)域的內(nèi)部或感性趣區(qū)域的外部;并且用于標識包括對應(yīng)于該圖像中的矩形像素塊的信息的信息類別,其中在每個相應(yīng)的塊中的某些像素在該感性趣區(qū)域的內(nèi)部,而某些像素在該感性趣區(qū)域的外部。
28.一種編碼表示一個圖像的數(shù)字圖像數(shù)據(jù)的方法,所說的方法包括步驟在由所說的數(shù)字圖像數(shù)據(jù)表示的一個圖像中選擇至少一個感性趣區(qū)域;對于該數(shù)字圖像數(shù)據(jù)執(zhí)行執(zhí)行一個子波變換,以便獲得變換系數(shù);標識對應(yīng)于該感性趣區(qū)域的變換系數(shù);和把一個優(yōu)先級指定到該至少一個感性趣區(qū)域。
29.根據(jù)權(quán)利要求28的方法,還包括步驟由按比例增加對應(yīng)于感性趣區(qū)域的變換系數(shù),加重對應(yīng)于該感性趣區(qū)域的變換系數(shù);對包括該按比例增加變換系數(shù)的變換系數(shù)排序;對包括該按比例增加變換系數(shù)的變換系數(shù)進行量化;和對該變換系數(shù)進行熵編碼,以便形式一個比特數(shù)據(jù)流。
30.根據(jù)權(quán)利要求28的方法,還包括步驟量化該變換系數(shù),以便獲得量化指數(shù);通過按比例增加對應(yīng)于感性趣區(qū)域的量化指數(shù),加重對應(yīng)于該感性趣區(qū)域的量化指數(shù);排序包括該按比例增加量化指數(shù)的量化指數(shù);和對該量化指數(shù)進行熵編碼,以便形式一個比特數(shù)據(jù)流。
31.用于產(chǎn)生表示一個圖像的數(shù)字圖像數(shù)據(jù)的數(shù)字照相機,該數(shù)字照相機包括數(shù)字圖像數(shù)據(jù)產(chǎn)生裝置,用于產(chǎn)生表示一個圖像的數(shù)字圖像數(shù)據(jù);選擇裝置,用于選擇中由該數(shù)字圖像數(shù)據(jù)表示的圖像中的一個感性趣區(qū)域;子波變換裝置,對于該數(shù)字圖像數(shù)據(jù)執(zhí)行一個子波變換,以便獲得變換系數(shù);標識裝置,用于標識對應(yīng)于至少一個感性趣區(qū)域的變換系數(shù);排序裝置,用于根據(jù)多個類別排序該變換系數(shù),其中至少一個類別對應(yīng)于表示感性趣區(qū)域的系數(shù),而至少一個類別對應(yīng)于表示該感性趣區(qū)域之外區(qū)域的系數(shù);編碼裝置,用于編碼該變換系數(shù),以使對應(yīng)于該感性趣區(qū)域的變換系數(shù)被編碼,其編碼方式是使得在該圖像中的感性趣區(qū)域比該感性趣區(qū)域之外的圖像區(qū)域被更精確地重建;和存儲裝置,用于存儲該編碼的變換系數(shù)。
全文摘要
本發(fā)明涉及一種用于編碼數(shù)字圖像數(shù)據(jù)的方法和裝置(622),其中一感性趣區(qū)域(606)可以在編碼處理開始之前或在該編碼過程中被指定,使得編碼器輸出的優(yōu)先級(616)被修改,以便對該感性趣區(qū)域做更多的加重,因此增加重建的感性趣區(qū)域的速率和/或保真度。因此,該系統(tǒng)實現(xiàn)經(jīng)過通信線路的數(shù)字圖象的更有效的重建。
文檔編號H04N1/41GK1291314SQ98813905
公開日2001年4月11日 申請日期1998年9月15日 優(yōu)先權(quán)日1998年3月20日
發(fā)明者E·渥美英二, N·法瓦丁 申請人:馬里蘭大學(xué), 三菱電機株式會社