專利名稱:用于局部調(diào)整量化階的方法
技術(shù)領域:
本發(fā)明涉及一種使用對圖像序列進行預分析的步驟來對圖像序 列中的量化階進行局部調(diào)整的方法。
背景技術(shù):
本發(fā)明應用于視頻壓縮領域,具體為選擇性壓縮。對具有感興趣 區(qū)域的圖像進行選擇性壓縮的任何方法都包括兩種機制先驗選擇機 制和先驗壓縮機制-對信息的選擇是視覺注意機制,該機制定義了圖像中所包含的 感興趣事件的位置以及這些事件相互間的相對重要性;-先驗壓縮機制表征了圖像的特性和編碼以及針對編碼資源(即, 比特率或質(zhì)量)的分配準則。任何壓縮方法都包括用于對要編碼的數(shù)據(jù)進行量化的量化方法。 更具體地,本發(fā)明涉及對圖像中的每個區(qū)域的量化階的局部調(diào)整。根 據(jù)傳統(tǒng)方法,針對每個宏塊(或針對每個像素塊),根據(jù)其在圖像內(nèi)的 心理視覺重要性來執(zhí)行量化階的局部調(diào)整。這些方法具體用于加強對 較不重要的宏塊的量化,以及相反地,通過減少關聯(lián)的量化階來保護 重要的宏塊(即吸引注意的宏塊)。然而,通過使用這些方法,重要宏 塊的重構(gòu)質(zhì)量(即解碼之后的質(zhì)量)可以在從一個圖像到下一個圖像 之間劇烈變化,這對于觀察者而言是一個問題。此外,重構(gòu)質(zhì)量還會 在感興趣區(qū)域內(nèi)變化。發(fā)明內(nèi)容本發(fā)明的目的是解決現(xiàn)有技術(shù)中的至少一個缺點。本發(fā)明涉及一
種用于相對于設定點(setpoint)量化階(quantization step) (QP*)來 對n個圖像的序列中的圖像的量化階進行局部調(diào)整的方法。每個圖像 都包括至少一個感興趣區(qū)域和一個潛在的掩蔽(masking)區(qū)域,每個 區(qū)域都可能包括多個不相交的像素組。當以設定點量化階來對感興趣 區(qū)域和潛在的掩蔽區(qū)域進行量化時,分別以第一和第二比特數(shù)來對該 感興趣區(qū)域和潛在的掩蔽區(qū)域進行編碼。根據(jù)本發(fā)明,該方法包括以 下步驟-針對序列中的每個圖像,計算第二比特數(shù)和用于對以大于或等 于設定點量化階(QP*)的第一量化階(QP—POT—MAXj)所量化的潛 在的掩蔽區(qū)域進行編碼的比特數(shù)之間的第一比特差,以及用于對以小 于或等于設定點量化階(QP*)的第二量化階(QP_ROI—MINj)所量 化的感興趣區(qū)域進行編碼的比特數(shù)和第一比特數(shù)之間的第二比特差; 以及-在序列的每個圖像中,將第一量化階分配給潛在的掩蔽區(qū)域, 以及,對于序列中的n個圖像,如果n個第一比特差之和(GP0T)大 于n個第二比特差之和(DR0I),則將第二量化階分配給感興趣區(qū)域, 否則給該感興趣區(qū)域分配大于或等于第二量化階的第三量化階,以便 根據(jù)針對每個圖像所計算的重構(gòu)質(zhì)量準則,將n個第一比特差之和分 布在序列的圖像的感興趣區(qū)域之間。根據(jù)特定實施例,確定第一量化階(QP—POT_MAXj),以便在將第一量化階用于對潛在的掩蓋區(qū)域進行編碼時保證該潛在的掩蓋區(qū)域 的第一預定重構(gòu)質(zhì)量(PSNlTinpoT)。確定第二量化階(QP—ROI—MINj),以便在將第二量化階(QP_ROI_MINj)用于對感興趣區(qū)域進行編碼時 保證該感興趣區(qū)域的第二預定重構(gòu)質(zhì)量(PSNRmaxR0I)。優(yōu)選地,對于序列中的n個圖像,在將設定點量化階(QP*)用 于對感興趣區(qū)域進行編碼時,如果n個第一比特差之和(GP0T)小于 n個第二比特差之和(DR0I),則與第二預定重構(gòu)質(zhì)量(PSNRmaxR0I) 和該感興趣區(qū)域的重構(gòu)質(zhì)量之差成比例地,將該n個第一比特差之和 (GPOT)分布在序列中的n個圖像的感興趣區(qū)域之間。根據(jù)另一個實施例,該圖像還包括可能包括不相交的像素組的中
性(neutral)區(qū)域,將設定點量化階(QP*)分配給該中性區(qū)域。本發(fā)明還涉及一種用于對n個圖像的序列進行編碼的方法,該方 法包括用于以一組系數(shù)對n個圖像進行變換的步驟、按照量化階對 每個系數(shù)進行量化的步驟、以及對量化后的系數(shù)進行編碼的步驟,其 中根據(jù)上述方法對該量化階進行局部調(diào)整。本發(fā)明還涉及一種用于對n個圖像的序列進行編碼的編碼設備, 該圖像包括至少一個感興趣區(qū)域和一個潛在的掩蔽區(qū)域。該設備包括: -裝置,用于以一組系數(shù)對n個圖像中的每一個圖像進行變換; -量化裝置,用于以量化階來對該系數(shù)進行量化,在序列的每個 圖像中,相對于設定點量化階(QP*)來對該量化階進行局部調(diào)整, 當以設定點量化階(QP*)來對感興趣區(qū)域和潛在的掩蔽區(qū)域進行量 化時,以第一和第二比特數(shù)來對該感興趣區(qū)域和潛在的掩蔽區(qū)域進行 編碼;以及-編碼裝置,用于對量化后的系數(shù)進行編碼。 根據(jù)本發(fā)明,該量化裝置包括-裝置,針對序列中的每個圖像,計算第二比特數(shù)和用于對以大 于或等于設定點量化階(QP*)的第一量化階(QP—POT一MAXj)所量 化的潛在的掩蔽區(qū)域進行編碼的比特數(shù)之間的第一比特差,以及用于 對以小于或等于設定點量化階(QP*)的第二量化階(QP_ROI_MINj) 所量化的感興趣區(qū)域進行編碼的比特數(shù)和第一比特數(shù)之間的第二比特 差;以及-裝置,在序列的每個圖像中,將第一量化階分配給潛在的掩蔽 區(qū)域,以及,對于序列中的n個圖像,如果n個第一比特差之和(GpoT) 大于n個第二比特差之和(D肪》,則將第二量化階分配給感興趣區(qū)域, 否則給該感興趣區(qū)域分配大于或等于第二量化階的第三量化階,以便 根據(jù)針對每個圖像所計算的重構(gòu)質(zhì)量準則,將n個第一比特差之和分 布在序列的圖像的感興趣區(qū)域之間。有利地,該編碼設備還包括用于給量化裝置提供設定點量化階 (QP*)的速率控制裝置。
參考附圖,示例性實施例和有利實施方式非限制性地例證了本發(fā) 明,并且本發(fā)明可被更好地理解,在附圖中-圖1示出了待編碼的序列中的每個圖像的感興趣區(qū)域的PSNR 趨勢;-圖2描述了根據(jù)本發(fā)明的編碼設備。
具體實施方式
本發(fā)明涉及一種用于相對于設定點量化階(QP*)來對圖像的每 個感興趣區(qū)域(即吸引更多注意的區(qū)域)的量化階進行局部調(diào)整的方 法。作為多個圖像的序列中的一部分的圖像由像素塊組成。在對量化 階進行局部改變的方法中,通過以圖像中的其他區(qū)域為代價,以有利 于空間感興趣區(qū)域,提高了針對給定的總比特率所涉及的區(qū)域的視覺 質(zhì)量?;趯D像中的感興趣區(qū)域的選擇,根據(jù)對這些區(qū)域的興趣來 局部調(diào)整量化階。以這樣的方式來執(zhí)行該調(diào)整,以便加強對較不重要 的區(qū)域的壓縮,并沿著該序列將可能尚未使用的編碼資源(即比特數(shù)) 重新分配給感興趣區(qū)域。這種將比特從一個圖像重新分配給另一個圖 像的重新分配使得可以獲得對于感興趣區(qū)域更加穩(wěn)定的重構(gòu)質(zhì)量(即 解碼后的質(zhì)量)。根據(jù)本發(fā)明的方法使用圖像序列預分析步驟,具體用 于表征(characterize)整個序列中的感興趣區(qū)域在比特數(shù)方面的需求, 從而在整個序列上平滑感興趣區(qū)域的重構(gòu)質(zhì)量。更具體地,根據(jù)本發(fā)明的方法可以用于將比特率從非感興趣區(qū)域 轉(zhuǎn)移到感興趣區(qū)域。為此,所提出的解決方案對于圖像中的每個區(qū)域 的量化階QP使用變化或者使用量化階的局部調(diào)整。該調(diào)整是相對于 表示為QPf的量化階的值的初始設定點(例如,從針對每個圖像的比 特率調(diào)整中導出的)而進行的,QP^-與設定點比特率D4相對應。在序 列中,該量化階可以(如果必要的話)在不同圖像之間變化。更具體 地,根據(jù)本發(fā)明,根據(jù)視覺感興趣區(qū)域來修改圖像中的每個區(qū)域的量 化階。量化階的正變差(positive variation)提供了更強的壓縮,即以 損失質(zhì)量為代價的比特率增益。負變差(negative variation)提供了更 精細的壓縮,即以增加編碼成本為代價來提高重構(gòu)質(zhì)量。因此,本發(fā)明需要關于內(nèi)容的先驗信息的知識。由根據(jù)本發(fā)明的 方法所使用的先驗信息分成兩類。關于內(nèi)容的第一類先驗信息涉及吸 引更多注意的區(qū)域(所謂感興趣區(qū)域)在序列的每個圖像中的位置。 該區(qū)域可以由不相交的像素塊的組構(gòu)成;然而,將該區(qū)域定義為同一 區(qū)域。該信息可以由二進制興趣映射(map) I給出,對于圖像中的每 個塊bi,I指示出人類視覺系統(tǒng)的感興趣等級:針對感興趣塊bi,7(6^1, 針對不感興趣塊bi, "W-0。例如,這個映射可以通過對顯著性映射 (saliencymap)取閾值而獲得。顯著性映射是對于圖像中的每個像素 指示出感知興趣的映射。可以通過考慮多種信息(例如運動信息)來 構(gòu)造該映射。與像素相關聯(lián)的值越大,該像素越引人注意。為了獲得 每個塊的顯著性值,針對給定塊,可以對與屬于該塊的像素相關聯(lián)的 值進行平均,或者取顯著性值的中間值。 一般地說,本發(fā)明可以應用 于非二進制感興趣映射的情況,其針對每個塊bi表征了其感興趣等級。 關于內(nèi)容的第二類先驗知識涉及對視覺假象(artifact)具有很強的掩 蔽能力的圖像區(qū)域在序列的每個圖像中的位置。該區(qū)域可以由不相交 的像素塊的組構(gòu)成。用于數(shù)字視頻系統(tǒng)中的有損壓縮方法產(chǎn)生假象, 該假象的可見度很大程度上取決于所處理的圖像的內(nèi)容。對比度掩蔽 效果將信號可見度的這種修改轉(zhuǎn)化為另一個信號的存在。這種修改可 以在可見度閾值減少的方向(促進)上,或者甚至在可見度閾值增加 的方向(掩蔽)上進行。為了限制作為非感興趣區(qū)域的一部分的塊中 的新偽像的出現(xiàn),也由二進制映射P給出關于內(nèi)容的先驗知識,二進 制映射P對于每個塊bi,指示出視覺掩蔽能力針對具有較強掩蔽能 力的塊,^6')=1;針對具有較弱掩蔽能力的塊,P^)=0 。例如,這 個映射可以通過對活動映射(activitymap)取閾值而獲得?;顒佑成?是指示給定塊的活動等級的映射。例如,該等級可以通過測量該塊的 變化量(variance)來計算。在本文的其余部分,將具有較強掩蔽能力 的圖像中的非感興趣塊bi的集合稱為"潛在的掩蔽區(qū)域"。將不屬于 潛在的掩蔽區(qū)域的非感興趣塊bi的集合稱為"中性區(qū)域"。將分別涉 及感興趣區(qū)域的位置和具有較強掩蔽能力的區(qū)域的位置的兩個二進制 映射相結(jié)合,以獲得用于對量化階進行局部調(diào)整以及與圖像中的每個 塊bi相關聯(lián)的單個映射Ifi^, Ifi^具有值0、 l或2,如下所示-1^31是傳送給編碼器的新映射,指示了將比特轉(zhuǎn)移應用于其中的感興趣區(qū)域以及潛在的掩蔽區(qū)域;-P是定義了潛在的掩蔽區(qū)域的二進制映射;以及 -1是定義了感興趣和非感興趣區(qū)域的二進制映射。 該方法還利用特定的并且與序列的每個圖像中的每個感興趣區(qū) 域和潛在的掩蔽區(qū)域相關聯(lián)的PSNR (QP)曲線(作為量化階的函數(shù) 來表示最大信躁比的曲線)禾BNbBit (QP)曲線(作為量化階的函數(shù) 來表示比特數(shù)的曲線)。PSNR是用于表征圖像質(zhì)量的準則。在這種情 況下,將PSNR用于表征對圖像、圖像中的塊或區(qū)域進行解碼后的重 構(gòu)質(zhì)量。然后,對PSNR進行如下定義其中,SSE是均方誤差之和。SSE是針對塊,對與源圖像中的像 素相關聯(lián)的值和與重構(gòu)圖像(即解碼圖像)中的相應像素相關聯(lián)的值 之間的逐像素之差求和所定義的。根據(jù)本發(fā)明,可以使用其他質(zhì)量準則。在將比特從圖像的某些區(qū) 域重新分配到其他區(qū)域之前,針對序列中的每個圖像j都需要學習步 驟,以便在值QPf周圍構(gòu)造上面所定義的曲線的部分。曲線的這些部 分還可以由外部裝置來提供,例如通過數(shù)據(jù)文件來提供。本發(fā)明在于 通過使用三個不同的量化階QP*-L、 QPf+K和QP、對屬于圖像j 的感興趣區(qū)域或潛在的掩蔽區(qū)域的每個像素塊(例如,大小為16X16 個像素的宏塊)進行編碼。在對屬于感興趣區(qū)域的編碼塊的重構(gòu)(即 解碼)之后,針對給定量化階值(QP*-L、 QP*+K和QP*),對與這 些塊相關的數(shù)據(jù)(PSNR和NbBit)進行平均,以獲得針對圖像j中的'2如果/(6,) = 1:感興趣區(qū)域 O) = ■ 1如果尸O) = 1并且- 0:潛在的掩蓋區(qū)域 0否則中性區(qū)域其中: 感興趣區(qū)域以及針對三個量化階值中的每個值的PSNR值(PSNRJRCM) 和比特數(shù)值(NbBitjR0I)。類似地,對與屬于潛在掩蔽區(qū)域的塊相關的 數(shù)據(jù)進行平均,以獲得針對圖像j中的潛在掩蔽區(qū)域以及針對三個量 化階值中的每個值的PSNR值(PSNRjR0I)和比特數(shù)值(NbBitjR0I)。 然后通過三個值QP*-L、QP*+K和QP+之間的線性內(nèi)插,對曲線PSNRJ (QP)和NbBitJ (QP)進行內(nèi)插,以便針對圖像j獲得針對感興趣 區(qū)域,獲得曲線PSNRJRo! (QP)和曲線NbBitVo! (QP),以及針對潛 在的掩蔽區(qū)域,獲得曲線PSNRJpoT (QP)和曲線NbBitJpoT (QP)。比特的轉(zhuǎn)移或重新分配的原理在于加強(與基于設定點量化階 QP申的初始編碼相比)對屬于潛在的掩蔽區(qū)域的塊的壓縮,并使用未 用于對潛在的掩蔽區(qū)域進行編碼的比特來對感興趣區(qū)域進行編碼(與 NbBitjP0T (QP*)相比)。假設考慮了與潛在的掩蔽區(qū)域相關聯(lián)的重構(gòu)質(zhì)量的最小預定值PSNRmiV)T (例如20犯),根據(jù)該方法,可以使用更強的量化階來對潛在的掩蔽區(qū)域的塊進行量化。類似地,針對感興趣區(qū)域來設置重構(gòu)質(zhì)量的最大預定值PSNR,!UM (例如35dB)。這些 值可以自動或手動設置(例如,由操作者設置)。根據(jù)本發(fā)明的方法在于在小心保持以使序列的總比特率與設定點比特率0*大體相似的同時,通過將比特從潛在的掩蔽區(qū)域轉(zhuǎn)移到感興趣區(qū)域來對量化階進行 局部調(diào)整。根據(jù)本發(fā)明的方法使用第一序列預分析步驟。在這個步驟 中,計算可以通過增大分配給潛在的掩蔽區(qū)域的量化階而在整個序列 上恢復或節(jié)省的比特數(shù),以及同樣地計算用于以較低量化階對感興趣 區(qū)域進行編碼而在整個序列上需要的附加比特數(shù)。為此,針對選擇性 壓縮系統(tǒng)中所包括的每個區(qū)域(即感興趣區(qū)域和潛在的掩蔽區(qū)域),并 針對序列中的每個圖像j,定義針對量化階的一組所謂的有效值。根據(jù)PSNR (QP)曲線(針對每個區(qū)域并針對每個圖像而建模)來確定 這些值,以便考慮滿足PSNR需求的重構(gòu)質(zhì)量,即在潛在的掩蔽區(qū)域 和感興趣區(qū)域中分別為最小值和最大值。針對圖像j中的潛在的掩蔽 區(qū)域,可以分配給潛在的掩蔽區(qū)域的量化階的值在設定點值(表示為 QP*)和可以保證最小重構(gòu)質(zhì)量PSNRmaxR0I的最大值(表示為 QP—POT_MAXj)之間變化。相同的原理應用于感興趣區(qū)域??梢苑?配給圖像j的感興趣區(qū)域的量化階的值在可以實現(xiàn)目標重構(gòu)質(zhì)量PSNRmaxR0I的量化階的最小值(表示為QP—ROI—MINj)和設定點值 (^^之間變化。根據(jù)本發(fā)明,預分析步驟在于,首先針對序列中的每個圖像,收 集在感興趣區(qū)域的比特數(shù)和潛在的掩蔽區(qū)域可以提供的比特數(shù)方面的 需求。其次,比特轉(zhuǎn)移將基于由整個序列上的潛在的掩蔽區(qū)域所提供 的可能性??梢钥紤]兩種可能潛在的掩蔽區(qū)域可以滿足要求,或者 不能滿足。在后一種情況下,與相對于基于PSNR質(zhì)量的設定點的感 興趣區(qū)域的PSNR不足(deficit)成比例地,執(zhí)行對比特的重新分配。在預分析中,針對序列中的每個圖像j,根據(jù)與潛在的掩蔽區(qū)域 相關聯(lián)的曲線NbBitJpoT(QP)來確定可以基于在用QP—POT—MAXj對所 述區(qū)域進行編碼時所節(jié)省的比特數(shù)。還對感興趣區(qū)域在用于實現(xiàn)目標 重構(gòu)質(zhì)量PSNRmaxR0I的附加比特方面的需求進行估計。如果將項 g"/ (QP—POT—MAXj )用于表示為了以提供最小重構(gòu)質(zhì)量的最大量化階來進行編碼而從圖像j的潛在的掩蔽區(qū)域中所節(jié)省的比特數(shù),則 ga/") (QP—POT—MAX j) = NbBitj P0T (QP*) - NbBit jP0T (QP—POT—MAX j)其中-NbBitVOT(QP)是與圖像j的潛在的掩蔽區(qū)域相關聯(lián)的曲線。 -QP—POT—MAXj是可用于提供潛在的掩蔽區(qū)域的最小重構(gòu)質(zhì)量 的量化階的值。如果將項requirementj^-RQI-M^j)用于表示圖像j的感興趣區(qū)域需要用以滿足目標重構(gòu)質(zhì)量的比特數(shù),貝U requiremertj(QP—ROI一MINj):NbBitVoi(QP一ROI一MlNj) —NbBitjROi(QP*)其中-NbBitjR0I(QP)是與圖像j的感興趣區(qū)域相關聯(lián)的曲線 NbBit(QP);以及-QP_ROI_MINj是可以用于保證逼近目標重構(gòu)質(zhì)量的感興趣區(qū) 域的重構(gòu)質(zhì)量的量化階的值。在該圖像分析中,在整個序列上,將在潛在的掩蔽區(qū)域上所節(jié)省
的比特數(shù)(表示為GP0T)以及感興趣區(qū)域所需要的比特數(shù)(表示為 Droi)合計。<formula>formula see original document page 13</formula>其中,N是待編碼的圖像數(shù)。此外,如圖1所示,針對序列中的每個圖像j,計算以設定點的階所量化的感興趣區(qū)域的重構(gòu)質(zhì)量和目標重構(gòu)質(zhì)量PSNRma^cH之間的質(zhì)量差(在本方案中,由PSNR進行估計,但這是并非限制性的)。假 設AFSM w^是整個序列上的這些質(zhì)量差的總值,因此<formula>formula see original document page 13</formula>其中-一 5PSA^ OT =M4X(0,PSNRmaxROI-PSNRJr。,(QP'))是圖像j的感興趣區(qū)域的質(zhì)量差;-N是待編碼的序列中的圖像數(shù);以及_ PSNRJ咖(QP')是圖像j中的感興趣區(qū)域中的PSNR的值。在此預分析結(jié)尾處,已知以下值-在圖像等級-感興趣區(qū)域到目標重構(gòu)質(zhì)量的質(zhì)量距離;以及 -分別應用于潛在的掩蔽區(qū)域和感興趣區(qū)域以便分別實現(xiàn)最小 重構(gòu)質(zhì)量PSNRminP0T和目標重構(gòu)質(zhì)量PSNRmaxR0I的量化階 QP一POT—MAXj禾tl QP_ROI—MINj 。-在序列等級-與目標重構(gòu)質(zhì)量相比的感興趣區(qū)域的質(zhì)量差的總值-在潛在的掩蔽區(qū)域上所節(jié)省的總比特數(shù)GP0T;以及 -感興趣區(qū)域需要用以實現(xiàn)目標重構(gòu)質(zhì)量的總比特數(shù)DR0I。 本發(fā)明方法的第二步驟的目的是通過將在整個序列上所節(jié)省的
比特數(shù)GpoT進行重新分配,以便對序列的每個圖像中的每個區(qū)域的量化階進行分配,比特數(shù)GpoT是以量化階QP一POT一MAXj對潛在的掩蔽 區(qū)域進行編碼而得到的,以便在適當?shù)那闆r下滿足感興趣區(qū)域的目標重構(gòu)質(zhì)量。GpoT是在預分析步驟中計算的。實際上,此分配是根據(jù)由潛在的掩蔽區(qū)域所提供的能力而進行的潛在的掩蔽區(qū)域可以滿足需 求(情況l)或不能滿足(情況2)。情況1: Gpot》DR0I在整個序列上所節(jié)省的總比特數(shù)大于或等于感興趣區(qū)域需要用 以實現(xiàn)目標重構(gòu)質(zhì)量的總比特數(shù)??梢栽谡麄€序列上將從潛在的掩蔽 區(qū)域所節(jié)省的比特重新分配到感興趣區(qū)域。在這種情況下可以降低總 比特率。基于各自值QP一ROI一MINj和QP_POT_MAXj,針對每個圖像j,直接執(zhí)行對感興趣區(qū)域和潛在的掩蔽區(qū)域的量化階的局部調(diào)整,艮P, 將QP_ROI—MINj分配給潛在的掩蔽區(qū)域,并且將QP一POT一MAXj分配給感興趣區(qū)域。情況2: Gpot<Droi在整個序列上所節(jié)省的總比特率不能完全滿足感興趣區(qū)域的需求。為了在對量化階進行局部調(diào)整之后保持與設定點比特率(由設定 點量化階獲得)大體相似的總比特率,針對每個圖像j,必須估計大于當前值QP_ROI—MINj的感興趣區(qū)域的新量化階值QP—ROIj。然后, 相對于基于PSNR的質(zhì)量設定點,與感興趣區(qū)域的PSNR不足成比例 地,對比特進行重新分配。針對每個圖像j,根據(jù)從潛在的掩蔽區(qū)域 中所獲得的總比特數(shù)GpoT,與當前質(zhì)量差S^,V成比例地,計算用 于對當前感興趣區(qū)域進行編碼所增加的附加比特數(shù)^^^^""^'^"。/,如下所示根據(jù)曲線NbBitjROI(QP),估計出可用于逼近新的目標比特數(shù) M^/廣柳(2") + iVM必!'"o""/所"7/^的感興趣區(qū)域的量化階QP—ROIj的值?;诟髯缘闹礠P一ROIj和QP_POT_MAXj,針對每個圖像j,執(zhí) 行對感興趣區(qū)域和潛在的掩蔽區(qū)域的量化階的局部調(diào)整。至于中性區(qū) 域中的塊,認為它們相對于選擇性編碼策略是中性的,即分配給這些 塊的量化階與設定點量化階QP4目對應,即不對量化階進行局部適配。本發(fā)明還涉及一種用于實現(xiàn)根據(jù)本發(fā)明的量化方法的編碼方法, 該編碼方法用于對n個圖像的序列進行編碼。因此,該編碼方法包括 用于以一組系數(shù)(例如使用DCT)來對序列中的n個圖像進行變換的 步驟;用于按照量化階對所述系數(shù)進行量化的步驟,其中根據(jù)上述方 法,在序列的n個圖像內(nèi)對該量化階進行局部調(diào)整;以及用于對所述 量化后的系數(shù)進行編碼的過程(例如使用熵編碼處理)。本發(fā)明還涉及一種如圖2所示的編碼設備10,用于對圖像序列進 行編碼。在圖2中只描述了重要的模塊,并在下文中對其進行描述。 該編碼設備包括模塊IIO,用于以一組系數(shù)(例如DCT系數(shù))對該編 碼設備的輸入端處的源圖像進行變換。例如,模塊110實現(xiàn)DCT變換。 然后,由量化模塊120對該系數(shù)進行量化,以獲得量化后的系數(shù)。量 化模塊120適配用于實現(xiàn)根據(jù)本發(fā)明的對量化階進行局部調(diào)整的方 法。更具體地,量化模塊120給序列中的每個圖像中的感興趣區(qū)域分配量化階,以便在所節(jié)省的比特數(shù)GPOT充足的情況下保證目標重構(gòu)質(zhì)量,或者與目標重構(gòu)質(zhì)量和設定點重構(gòu)(即以QP4對所述感興趣區(qū)域進行量化時所得到的質(zhì)量)之差成比例地,將所節(jié)省的比特GpoT分布在整個序列中的感興趣區(qū)域之間。然后,通過本領域技術(shù)人員所知的 編碼模塊130 (例如熵編碼器),對量化后的系數(shù)進行編碼。根據(jù)特定 實施例,編碼設備IO包括速率控制模塊140。模塊140能夠給量化模 塊120提供設定點量化階QP*。當然,本發(fā)明并不局限于上面所提到的實施例。具體地,本領域 的技術(shù)人員可以對所公開的實施例進行任何變化,并使其結(jié)合以便產(chǎn) 生各種有益效果??梢詫鹘y(tǒng)PSNR之外的準則用于表征圖像、像素 的塊或圖像中的區(qū)域的重構(gòu)質(zhì)量,例如根據(jù)變化量加權(quán)的PSNR、基 于心理學視覺建模的準則。類似地,曲線PSNR (QP)和NbBit (QP)
可以由所描述的裝置以外的裝置獲得。因此,可以使用多于三個的量 化階來對曲線進行內(nèi)插。類似地,可以使用另一類型內(nèi)插,例如多項 式內(nèi)插。興趣映射可以是表征了圖像中每個塊的較高或較低興趣等級的 非二進制映射。可以將這些映射用于在圖像中定義多個感興趣區(qū)域, 根據(jù)其感興趣等級給每個區(qū)域重新分配比特。權(quán)利要求
1.一種用于相對于設定點量化階(QP*)來對n個圖像的序列中的圖像的量化階進行局部調(diào)整的方法,所述圖像包括至少一個感興趣區(qū)域和一個潛在的掩蔽區(qū)域,所述區(qū)域中的每個都可能包括多個不相交的像素組,當以所述設定點量化階(QP*)對所述感興趣區(qū)域和潛在的掩蔽區(qū)域進行量化時,分別以第一和第二比特數(shù)來對所述感興趣區(qū)域和潛在的掩蔽區(qū)域進行編碼,所述方法的特征在于包括以下步驟-針對序列中的每個圖像,計算所述第二比特數(shù)和用于對以大于或等于設定點量化階(QP*)的第一量化階(QP_POT_MAXj)所量化的所述潛在的掩蔽區(qū)域進行編碼的比特數(shù)之間的第一比特差,以及用于對以小于或等于設定點量化階(QP*)的第二量化階(QP_ROI_MINj)所量化的所述感興趣區(qū)域進行編碼的比特數(shù)和所述第一比特數(shù)之間的第二比特差;以及-在序列的每個圖像中,將所述第一量化階分配給潛在的掩蔽區(qū)域,以及,對于序列中的所述n個圖像,如果n個第一比特差之和(GPOT)大于n個第二比特差之和(DROI),則將所述第二量化階分配給所述感興趣區(qū)域,否則給所述感興趣區(qū)域分配大于或等于所述第二量化階的第三量化階,以便根據(jù)針對每個圖像所計算的重構(gòu)質(zhì)量準則,將所述n個第一比特差之和分布在序列的圖像的感興趣區(qū)域之間。
2. 如權(quán)利要求1所述的方法,其中,確定所述第一量化階 (QP—POT_MAXj),以便在將所述第一量化階用于對所述潛在的掩蓋區(qū)域進行編碼時保證所述潛在的掩蓋區(qū)域的第一預定重構(gòu)質(zhì)量 (PSNRminP0T)。
3. 如權(quán)利要求1或2所述的方法,其中,確定所述第二量化階 (QP—ROI—MINj),以便在將所述第二量化階(QP—ROI—MINj)用于對所述感興趣區(qū)域進行編碼時保證所述感興趣區(qū)域的第二預定重構(gòu)質(zhì) 量(PSNRmaxR0I)。
4. 如權(quán)利要求3所述的方法,其中,在將所述設定點量化階(QPO用于對所述感興趣區(qū)域進行編碼時,對于序列中的所述n個圖像,如 果所述n個第一比特差之和(GpoT)小于所述n個第二比特差之和 (DR0I),則與所述第二預定重構(gòu)質(zhì)量(PSNRmaxR0I)和所述感興趣區(qū) 域的重構(gòu)質(zhì)量之差成比例地,將所述n個第一比特差之和(GPOT)分 布在序列中的所述n個圖像的感興趣區(qū)域之間。
5. 如權(quán)利要求1到4所述的方法,其中,所述圖像還包括中性區(qū) 域,所述中性區(qū)域可能包括不相交的像素組,將設定點量化階(QP*) 分配給所述中性區(qū)域。
6. —種用于對n個圖像的序列進行編碼的方法,包括用于以一 組系數(shù)對所述n個圖像進行變換的步驟、按照量化階對所述系數(shù)中的 每個進行量化的步驟、以及對所述量化后的系數(shù)進行編碼的步驟,其 中根據(jù)權(quán)利要求1或5來對所述量化階進行局部調(diào)整。
7. —種用于對n個圖像的序列進行編碼的編碼設備(10),所述圖 像包括至少一個感興趣區(qū)域和一個潛在的掩蔽區(qū)域,所述區(qū)域中的每 個可能包括多個不相交的像素組,所述設備(10)包括-裝置(110),用于以一組系數(shù)對所述n個圖像中的每個進行變換;-量化裝置(120),用于以量化階對所述系數(shù)進行量化,在所述 序列的每個圖像中,相對于設定點量化階(QP*)來對所述量化階進 行局部調(diào)整,當以所述設定點量化階(QP*)來對所述感興趣區(qū)域和 潛在的掩蔽區(qū)域進行量化時,分別以第一和第二比特數(shù)來對所述感興 趣區(qū)域和潛在的掩蔽區(qū)域進行編碼;-編碼裝置(130),用于對所述量化后的系數(shù)進行編碼。 所述編碼設備(10)的特征在于,所述量化裝置(120)包括-裝置,用于針對序列中的每個圖像,計算所述第二比特數(shù) 和用于對以大于或等于設定點量化階(QP*)的第一量化階 (QP一POT—MAXj)所量化的所述潛在的掩蔽區(qū)域進行編碼的比 特數(shù)之間的第一比特差,以及用于對以小于或等于設定點量化階 (QP*)的第二量化階(QP—ROI—MINj)所量化的所述感興趣區(qū) 域進行編碼的比特數(shù)和所述第一比特數(shù)之間的第二比特差;以及-裝置,用于在序列的每個圖像中,將所述第一量化階分配給潛在的掩蔽區(qū)域,以及,對于序列中的所述n個圖像,如果n 個第一比特差之和(GpoT)大于n個第二比特差之和(DR0I),則 將所述第二量化階分配給所述感興趣區(qū)域,否則給所述感興趣區(qū) 域分配大于或等于所述第二量化階的第三量化階,以便根據(jù)針對 每個圖像所計算的重構(gòu)質(zhì)量準則,將所述n個第一比特差之和分 布在序列的圖像的感興趣區(qū)域之間。
8.如權(quán)利要求5所述的編碼設備,還包括速率控制裝置(140), 所述速率控制裝置(140)給所述量化裝置(120)提供所述設定點量 化階(QP*)。
全文摘要
本發(fā)明涉及一種用于對n個圖像的序列中的圖像的每個區(qū)域的量化階進行局部調(diào)整的方法。所述方法包括以下步驟針對序列中的每個圖像,計算在以第一量化階對潛在的掩蔽區(qū)域進行量化時在該潛在的掩蔽區(qū)域上所節(jié)省的第一比特差和在以第二量化階對感興趣區(qū)域進行量化時該感興趣區(qū)域所需要的第二比特差;以及在序列的每個圖像中,將第一量化階分配給潛在的掩蔽區(qū)域,并且如果n個第一比特差之和(G<sub>POT</sub>)大于n個第二比特差之和(D<sub>ROI</sub>),則將所述第二量化階分配給所述感興趣區(qū)域,否則將第三量化階分配給所述感興趣區(qū)域,以便根據(jù)重構(gòu)質(zhì)量準則,將所述n個第一比特差之和分布在感興趣區(qū)域之間。
文檔編號H04N7/30GK101156453SQ200680011215
公開日2008年4月2日 申請日期2006年3月16日 優(yōu)先權(quán)日2005年4月5日
發(fā)明者多米尼克·索羅, 萊拉·于格內(nèi)爾, 菲利浦·吉約泰爾 申請人:湯姆森許可貿(mào)易公司