亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于視頻編碼處理的差值量化方法及其裝置的制作方法

文檔序號(hào):7626187閱讀:126來源:國知局
專利名稱:用于視頻編碼處理的差值量化方法及其裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明總的來說涉及視頻編碼和壓縮領(lǐng)域,更具體地說涉及視頻編碼處理中使用的差值量化方法及其裝置。
背景技術(shù)
現(xiàn)有的視頻編碼實(shí)現(xiàn)多基于頻域的算法,例如那些在頻域中運(yùn)用余弦變換的編碼器算法。但這些編碼器算法存在一些缺陷。例如,實(shí)時(shí)頻域編碼器的半導(dǎo)體實(shí)現(xiàn),通常需要超過8百萬的晶體管。頻域編碼器使用量子化的頻率分量以減少編碼信息量。這可能導(dǎo)致某些高頻分量的丟失,從而降低視頻的清晰度和解析度。VICOMP(視頻編碼與壓縮系統(tǒng)和裝置)是一個(gè)基于高質(zhì)量、實(shí)時(shí)、高效率的視頻編碼(高壓縮率)的需求下的數(shù)字視頻編碼方案。它運(yùn)用基于時(shí)域而非頻域的算法。與上述的頻域編碼器相比,VICOMP為實(shí)現(xiàn)少于70萬個(gè)晶體管的實(shí)時(shí)編碼器提供了可能。同時(shí),與頻域編碼器相比,VICOMP可以提供同樣或更好的視頻質(zhì)量和出眾的總體壓縮率。VICOMP在邏輯和復(fù)雜性上的簡(jiǎn)化,與頻域編碼相比,同樣也使視頻編碼系統(tǒng)的軟件實(shí)現(xiàn)更加有效。
例如,MPEG解碼器都是基于使用離散余弦變換(DCT)算法的頻域信息,DCT用于將時(shí)域信息轉(zhuǎn)換到頻域。VICOMP是一種時(shí)域編碼器,因此將信息從時(shí)域轉(zhuǎn)換到頻域的步驟是不必要的。省卻該步驟提供了顯著的益處,因?yàn)樵撟儞Q步驟需要大量的非常高速的計(jì)算。
例如,為了將8×8的像素塊從時(shí)域轉(zhuǎn)換到頻域,需要使用DCT算法進(jìn)行64×64=4096次相乘。在實(shí)在時(shí)視頻編碼中,分配給4096次相乘的時(shí)間量小于5微秒。于是,單個(gè)的乘法器將必須以高于800MHz的頻率操作,或者8個(gè)乘法器將每一個(gè)必須同時(shí)以高于100MHz的頻率操作,以便實(shí)時(shí)地執(zhí)行該轉(zhuǎn)換步驟。
而且,VICOMP解碼器可利用2X像素速率的時(shí)鐘頻率來操作,該時(shí)鐘典型地是27MHz,與之相比,DCT編碼器在100MHz的時(shí)鐘頻率下操作。這種時(shí)鐘頻率的差別導(dǎo)致半導(dǎo)體解碼器較少的功耗。
如上述的VICOMP有效編碼方案是基于冗余概念的一個(gè)方案。任何一個(gè)編碼方案的目的都是找到并刻畫冗余元素,然后生成一個(gè)有效的信號(hào)組對(duì)非冗余信號(hào)進(jìn)行編碼。如果在信息中沒有冗余元素,也就沒有機(jī)會(huì)進(jìn)行壓縮。數(shù)字視頻信號(hào)的冗余產(chǎn)生于以下幾個(gè)方面。
1.對(duì)低頻率分量的過采樣——在采樣數(shù)字視頻信號(hào)中,經(jīng)常會(huì)因?yàn)椴蓸釉斐纱罅咳哂?。部分這樣的采樣冗余的發(fā)生是因?yàn)闉榱吮WC充分的解析度和數(shù)字采樣的高頻率響應(yīng)而不得不以在模擬視頻信號(hào)的最高工作頻率2倍的頻率進(jìn)行視頻信號(hào)采樣。但是因?yàn)檎鎸?shí)視頻信號(hào)中含有占主要數(shù)量的低頻成分,2倍的采樣頻率會(huì)造成對(duì)低頻分量的過采樣。因此,在采樣信號(hào)中會(huì)存在相當(dāng)可觀數(shù)量的冗余。
2.對(duì)位分辨率的過采樣——冗余也會(huì)產(chǎn)生于對(duì)每個(gè)樣本的分辨率(位數(shù))的過采樣。比如,如果每個(gè)像素被數(shù)字化為8位分辨率乘以3個(gè)顏色坐標(biāo)(如YUV)也就是每個(gè)像素24位的采樣分辨率。24位也就是說這里有足夠的分辨率來表示1670萬種可能的顏色。對(duì)于視頻的每個(gè)單獨(dú)的幀中以640H×480V的像素分辨率采樣,會(huì)產(chǎn)生307,200個(gè)像素(樣本)。即使可以將在幀中所有的307,200個(gè)像素作為不同的顏色,也只需要19位來表示所有的307,200個(gè)顏色。因?yàn)閳D片是用相對(duì)連續(xù)顏色的物體組成,所以實(shí)際上在一個(gè)視頻幀中遠(yuǎn)遠(yuǎn)少于307,200種顏色,因此也就需要少于19位的信息來表示在幀中所有的顏色。進(jìn)一步說,因?yàn)閳D像傳感器有限的動(dòng)態(tài)范圍,24位/樣本提供了比通常的應(yīng)用在視頻相機(jī)中的圖像傳感器的動(dòng)態(tài)范圍(9位)54分貝要高的多的動(dòng)態(tài)范圍(144分貝)。
3.幀間冗余——運(yùn)動(dòng)視頻中的另一種冗余就是幀間重復(fù)。比較一系列的視頻幀圖像,我們可以發(fā)現(xiàn)通常幀間的區(qū)別在很小的范圍內(nèi)。不是在視頻中的所有元素都隨著幀的變化而變化。很多元素移動(dòng)得很小。對(duì)于連續(xù)幀的靜止圖像,排除隨機(jī)噪音的因素,會(huì)有100%的冗余。雖然幀間冗余一般是可以預(yù)計(jì)的,但是它一般決定于實(shí)際視頻情況,同時(shí)幀間冗余范圍可以從0到100%。
4.噪音過濾——因?yàn)橐曨l圖像傳感器有限的動(dòng)態(tài)范圍,視頻中包含有很大數(shù)量的白噪音。這種白噪音是完全隨機(jī)的,也就是說它減少了冗余也減少了壓縮率。VICOMP使用用來提高信噪比的高級(jí)濾波器,以來提高冗余并提高壓縮率。
5.線間冗余——在視頻中每一條給定的水平線存在很多與上一條或下一條中完全一樣或幾乎一樣的元素??赏ㄟ^利用特定的算法找到那些與相鄰線上不同的元素并為其編碼。
6.出現(xiàn)頻率冗余——一些視頻元素可以被預(yù)期比其他元素具有更高的出現(xiàn)頻率??墒褂每勺兾婚L代碼為各種元素編碼。為那些出現(xiàn)比較頻繁的元素分配最少的位數(shù)。通過使用可變位長代碼,編碼需要的數(shù)據(jù)位總數(shù)減少了。
找到、刻畫并編碼以上6種元素,可以使信息不丟失或少丟失。除了以上列出的冗余,在數(shù)字視頻中依然存在不必要的信息。也就是說那些對(duì)視頻的質(zhì)量和主要數(shù)據(jù)沒有貢獻(xiàn)的信息。為了提高壓縮率,需要消除或減少這些不必要信息。

發(fā)明內(nèi)容
本發(fā)明的VICOMP中一個(gè)減少非必要信息編碼的重要環(huán)節(jié)是非線性差值量化器。當(dāng)相鄰兩個(gè)元素間(在顏色和/或亮度)存在小差值時(shí),保持這些小差值的精確性是非常必要的。然而,當(dāng)這些相鄰元素間的差值很大,保留這些差值的精確是不重要的。這是事實(shí),因?yàn)槿祟愐曈X反應(yīng)系統(tǒng)的非線性。如人類肉眼感知的,相鄰的小差別對(duì)于區(qū)別視覺圖像的紋理是非常重要的部分。相鄰大的差值的絕對(duì)幅度不是一個(gè)視覺圖像中的重要因素。為了利用人類視覺反應(yīng)系統(tǒng)的非線性,VICOMP運(yùn)用非線性差值量化器。
本發(fā)明的VICOMP使用基于幅值尺度的量化信息,使用獨(dú)一無二的非線性量化器,制造出與人類視覺反應(yīng)系統(tǒng)相吻合的非線性。VICOMP保持了所有的高頻率成分,因此也保持了與輸入視頻信號(hào)同樣的清晰度和解析度。由于非線性量化器造成的信息減少是不被肉眼感知的。本發(fā)明的VICOMP使用其算法利用對(duì)于低頻信號(hào)的過采樣。
更一般地說,本發(fā)明提供一種用于視頻編碼系統(tǒng)的非線性差值量化器,包括第一差值量化單元,其包括量化子單元,用于將輸入視頻信息中相鄰的像素輸入值的每個(gè)差量轉(zhuǎn)化為多個(gè)離散步長,所述離散步長被合適地定標(biāo)以對(duì)應(yīng)于像素輸入幅度值的全尺寸;溢出檢驗(yàn)子單元,用于基于像素輸入幅度值的全尺寸來檢查和校正上下溢出。
本發(fā)明還提供一種用在視頻編碼系統(tǒng)中的非線性差值量化方法,包括步驟將輸入視頻信息中相鄰的像素輸入值的每個(gè)差量轉(zhuǎn)化為多個(gè)離散步長,所述離散步長被合適地定標(biāo)以對(duì)應(yīng)于像素輸入幅度值的全尺寸;基于像素輸入幅度值的全尺寸來檢查和校正上下溢出。


通過結(jié)合本附圖對(duì)本發(fā)明的視頻編碼濾波方法及其裝置的具體實(shí)施方式
的詳細(xì)描述,本發(fā)明的目的、特征和益處將更清楚。在圖中圖1是本發(fā)明的VICOMP編碼器的典型實(shí)現(xiàn)的示意框圖;圖2是示出本發(fā)明的小差值3像素組差量量化和組合的示意邏輯流程圖;圖3A-3B是顯示本發(fā)明的非線性差值量化編碼的示意邏輯流程圖;圖4是顯示本用于實(shí)現(xiàn)本發(fā)明的非線性差值量化編碼的非線性差值量化器的示意框圖。
具體實(shí)施例方式
為了便于理解本發(fā)明的具體技術(shù)方案,首先對(duì)所涉及的具體技術(shù)概念進(jìn)行定義。
定義量子化——將信息轉(zhuǎn)換成與最初形式不同的離散形式。比如0、1、2、3、4、5、6可以用以下算法被量子化成為2、4、6。
If(input value)<4 then(output value)=2:GoTo EndIf(input value)>3 AND(input value)<6 then(output value)=4 Else(output value)=6End量化器——一種形成量子化(離散形式)信息的儀器或者算法。
差量——兩個(gè)數(shù)值的差或相減的結(jié)果。
比如,A=(B-C)表示A是B和C的差量。如果B大于C,那么差量值為正數(shù)。如果C大于B,差量值為負(fù)。
相關(guān)性——通過閾值或偏移量對(duì)兩個(gè)數(shù)值的比較。如果兩個(gè)數(shù)值通過增加或減少一定的閾值而相一致,它們可以被稱為相關(guān)。
相關(guān)系數(shù)——用于在相關(guān)性中進(jìn)行比較的閾值或偏差值。
冗余值——在一組表示為特定數(shù)值的信息中的某個(gè)數(shù)據(jù)被稱為冗余,如果它不斷在這組數(shù)據(jù)中重復(fù)出現(xiàn)。
比如,信息組={1,2,3,0,0,0,0,0,0,0,2}數(shù)值0是一個(gè)高度冗余值,而2是一個(gè)有輕微冗余。這個(gè)冗余信息可以被按下列原則壓縮

為了使用二進(jìn)制代碼記錄信息組需要使用2×11=22位。
可變代碼將為(1×7)+(2×2)+(2×3)=17位。因?yàn)槿哂嘣卦谛畔⒔M中的存在,壓縮成為可能。
YUV-Y為亮度,UV為顏色分量。YUV也可以通過Y、Cr、Cb三個(gè)變量表示。
YUV顏色坐標(biāo)——(也被稱為Y、Cr、Cb)VICOMP使用YUV顏色坐標(biāo),以便通過相對(duì)于Y樣本對(duì)U和V樣本進(jìn)行二次采樣來利用顏色分量(U&V)固有的低頻率。人類肉眼對(duì)Y(亮度)和UV(顏色)分量的敏感度也有不同。
頻域——大多數(shù)信息,包括視頻信息,是在時(shí)域中,也就是說信息的幅值是根據(jù)時(shí)間變化而變化的。頻率是時(shí)間的倒數(shù)F=1/T,T=1/F。信息可以通過傅立葉變換(FFT)從時(shí)域轉(zhuǎn)化到頻域??焖俑盗⑷~變換在視頻編碼中被運(yùn)用,比如MPEG技術(shù)就是離散余弦變換(DCT)。在時(shí)域中,給定一組信息(在一定時(shí)間內(nèi)),可以獲得一定數(shù)量的幅值。在頻域中,給定一組信息(在特定的頻域帶寬內(nèi)),可以獲得一定數(shù)量的頻率。因?yàn)橐恍┮曨l信號(hào)多含有大量的低頻分量,所以可以知道信息在頻域中有大量的冗余。
圖1為VICOMP編碼器的典型實(shí)現(xiàn)框圖。圖1的下部分示出了普通的邏輯和存儲(chǔ)部件(普通邏輯),它們是在視頻編碼和解碼中通常和按慣例所采用的部件。對(duì)這些通常和按慣例所采用的部件,諸如存儲(chǔ)器、緩存器(另一種形式的存儲(chǔ)器)、計(jì)數(shù)器、寄存器和接口不再進(jìn)行描述。這些普通邏輯部件的構(gòu)造和功能對(duì)邏輯設(shè)計(jì)領(lǐng)域的普通技術(shù)人員是公知的。
該普通邏輯的一個(gè)稍微不同尋常的部件是“位包裝器(BitPacker)。一個(gè)位包裝器是用于將可變化位長度編碼組合到一個(gè)毗鄰的位流中的裝置。通常計(jì)算機(jī)數(shù)據(jù)包括固定位長度成分,字節(jié)(8位),字(16位)和雙字(32位)。由于可變位長度編碼產(chǎn)生各種長度的輸出,所以這些編碼必須被“包裝”到毗鄰的流中。執(zhí)行這一功能的裝置“位包裝器”不作為本發(fā)明的部分在此描述。
該方框圖的上(主要)部分(算法描述)示出了通過組成該視頻編碼系統(tǒng)的各種處理的視頻信息流。這些部件是本發(fā)明的一部分并且在本文中進(jìn)行了詳細(xì)描述。這些詳細(xì)描述包括文字,邏輯流圖和邏輯語句。VICOMP的算法可利用適當(dāng)?shù)挠?jì)算機(jī)由軟件實(shí)現(xiàn),該計(jì)算機(jī)具有在輸入側(cè)與數(shù)字化視頻的接口和在輸出側(cè)至適當(dāng)?shù)娘@示裝置。該VICOMP的算法也可以特定的硬件邏輯塊來實(shí)現(xiàn),例如將被使用在專用集成電路(ASIC)半導(dǎo)體中的那樣。
Y和UV濾波器的目的在于減少噪音和改善信噪比。對(duì)信噪比的任何改善都將導(dǎo)致更好的編碼結(jié)果(更為壓縮),因?yàn)榘谝曨l中的噪聲相對(duì)于視頻是非同步的(隨機(jī)的),于是包含在視頻中的噪聲不能被有效地壓縮。
下面結(jié)合附圖描述本發(fā)明的具體實(shí)施方式
。
非線性差值量化器每個(gè)像素的相鄰像素Y(亮度)微分值按照3個(gè)像素為一組進(jìn)行量化。同時(shí),它們也以3個(gè)像素為一組編碼。因此在一行像素總數(shù)以3為模。也就是說,一行中像素總數(shù)要可以被3整除。比如,9、12、639、720、1023全都可以作為一行像素的有效數(shù)量。如果視頻數(shù)字轉(zhuǎn)換器輸出的像素?cái)?shù)量不以3為模,比如,640,那么編碼器會(huì)忽略在一行中最后的像素。這樣每行減少1到2個(gè)像素是不合理的。
為進(jìn)行說明,可以假設(shè)Y值(幅度)為7位,這表示從0到127的值。對(duì)于7位數(shù)值(+/-127的全尺寸微分(full scaledifferential)),量化器的輸出可以是+1、+5、+13、+26、+42、+59、+76、-1、-5、-13、-26、-42、-59和-76的14個(gè)數(shù)值中的任何一個(gè)。這里沒有數(shù)值0。同樣的原理可以應(yīng)用在其他各種長度的位數(shù),比如5位、6位、8位等,但是在本說明中使用的數(shù)值根據(jù)Y值位數(shù)的數(shù)量,要被合適地定標(biāo)以對(duì)應(yīng)于一個(gè)不同的全尺寸。例如,用于8位Y微分的量化器值(0到255最大定標(biāo)值)將為+/-2、10、26、54、84、118和152。
小數(shù)值差量在普通視頻中,可以預(yù)期將有大量的個(gè)別差量值小于+/-2的3像素組,因?yàn)樵谝曨l圖像中物體占用的空間通常要遠(yuǎn)遠(yuǎn)超過3個(gè)像素。也可用另外一種方法來表述這一事實(shí),即,在普通視頻中存在相當(dāng)數(shù)量的低頻分量。通過合并低幅值差量,在不損害高頻分量或視頻質(zhì)量的任何其他方面的情況下,可得到相當(dāng)?shù)牡谝患?jí)壓縮。
如果原來的Y值小于+/-2,即-1、0或+1,量化器的輸出會(huì)是-1或+1。在普通視頻顯示中,肉眼是無法分辨那些和相鄰差別很小的像素的。如果來自量化器的3個(gè)相鄰像素都是+/-1中的值,并且如果3者的和是-1,那么該3個(gè)數(shù)值被轉(zhuǎn)換成-1、+1、-1,而不論它們之前的數(shù)值為何。同時(shí),如果來自量化器的3個(gè)相鄰像素都是+/-1中的值,并且它們的和是+1,則該3個(gè)數(shù)值可以被轉(zhuǎn)化為+1、-1、+1,無論它們之前的數(shù)值為何。于是,3像素組的和就被保存起來。以下的表1顯示了量化器如何處理都小于+/-2的3相鄰像素。
對(duì)于來自量化器的3個(gè)相鄰像素的和是+3和-3的情況,不對(duì)這些值進(jìn)行改變,而是保持其原始值。這一點(diǎn)在這些小的差量值的串聯(lián)中很重要。如果改變連續(xù)的+3或-3,將導(dǎo)致視頻中低頻分量的可視扭曲。
表I--初始值小于+/-2的所有3像素組

如上表1所示,對(duì)于所有初始差量小于+/-2的3像素組,存在27種類型。這需要使用5位來表示這27種同時(shí)至少用額外的一位來識(shí)別它們的組。于是得到6位/3像素=2位/像素。在經(jīng)過量化器之后,只會(huì)有8種類型。需要使用3位來表示所有的8個(gè)類型同時(shí)需要一個(gè)額外位來進(jìn)行組識(shí)別。于是得到4位/3像素=1.33位/像素。但是在最終值中,只有4個(gè)類型,這需要2位來表示不同類型外加一位識(shí)別組,于是得到3位/3像素=1位/像素。與原來的7位/像素相比較,這表示對(duì)于所有數(shù)值小于+/-2的3像素組壓縮率為7∶1。
參見表1,需要注意的是,存在8類“A”輸出,6類“B”輸出,12類“C”輸出,以及只有1類“D”輸出。由于這些小的+/-1相鄰像素差量通常由視頻中的白噪音所致,所以量化和組合這些小差量實(shí)際上表現(xiàn)為一種噪聲濾波器,同時(shí)減少了不同類型信息的數(shù)量,因此提高了壓縮率。
這個(gè)+/-1,3相鄰像素差量通過使用基于概率或出現(xiàn)頻率的變量位長編碼可以進(jìn)一步減少。如下的表2給出了一個(gè)例子表II+/-1 3像素組的變量位長代碼

加入1位進(jìn)行類型識(shí)別,位/像素的平均值將為(1+1.813)/3=0.937位/像素。比較原來的7位/像素,這表示對(duì)于所有值小于+/-2的3像素組壓縮率為7.47∶1。這個(gè)特性表明顯著的幀內(nèi)總體壓縮率,因?yàn)樵谌魏蔚湫鸵曨l幀中,將可以找到大量的3像素組。
圖2示出小差值3像素組差量量化和組合的邏輯流程圖。
差值量化器如下表III、IV、V示出本發(fā)明的非線性差值量化器。在該例子中,假設(shè)輸入信息的最大標(biāo)度值為7位表示數(shù)值0到127。差值量化器將每個(gè)相鄰的Y、U和V值輸入的差量轉(zhuǎn)化為12個(gè)離散步長(+或-)1、5、13、26、52和76。它同時(shí)檢查和校正上下溢出——也就是說它不允許量化差量的組合生成一個(gè)大于+127或小于-127的最大標(biāo)度范圍。
本發(fā)明的差值量化器不允許數(shù)值0。如果連續(xù)輸入值是常數(shù),在量化器的輸入端將產(chǎn)生連續(xù)的0差量。然而,對(duì)于這樣的輸入值,量化器輸出將在+1或-1之間交替,在交替的像素上產(chǎn)生1的誤差。這個(gè)1/2的平均誤差會(huì)成為量化器噪聲的一部分。
本發(fā)明的差值量化器也作為帶通濾波器,它的3分貝截止頻率是像素采樣頻率的1/2。因?yàn)樾盘?hào)的帶寬是有限的,所以上升時(shí)間有限,它們不能在一個(gè)采樣周期內(nèi)從0到最大標(biāo)度值。最大量化器差量76是基于帶寬被限定為采樣頻率的1/2的信號(hào)的理論最大快速定向率(slewing rate)來選擇的。由于采樣頻率必須至少為信號(hào)的最高頻率分量的兩倍,所以差值量化器不會(huì)限定該算法的結(jié)果的快速定向率。
如下表III、IV、V顯示了相鄰Y像素值的量化差量的一些例子

表III說明量化器對(duì)于輸入從10到90的六步變化的響應(yīng)

表IV說明量化器對(duì)于輸入從10到90的一步變化響應(yīng)

表V說明量化器對(duì)于實(shí)際視頻采樣的響應(yīng)下列圖3A-3C顯示本發(fā)明的非線性差值量化器的邏輯流程圖。在圖中,量化器具有dY和Pv輸入以及QdY輸出,其中,dY=鄰近像素差量,Pv=前一像素值,QdY=量化器結(jié)果。
圖4示出了完成上述差值量化的本發(fā)明的非線性差值量化器的示意性方框圖。注意,雖然該方框圖是以像素的Y分量為例示出的,但是其中原理和結(jié)構(gòu)同樣適用于UV分量的非線性差值量化器。如圖所示,帶有dY和Pv輸入的非線性差值量化器20包括第一差值量化單元10和第二差值量化單元14。其中,第一差值量化單元10包括量化子單元11,用于將輸入視頻信息中相鄰的像素輸入值的每個(gè)差量轉(zhuǎn)化為多個(gè)離散步長,即,分配一個(gè)對(duì)應(yīng)于各差量的量化輸出值(對(duì)應(yīng)于圖3A中的步驟S11-S12),如上所述,這些離散步長被合適地定標(biāo)以對(duì)應(yīng)于像素輸入幅度值的全尺寸;上溢出檢驗(yàn)子單元12和下溢出檢驗(yàn)子單元13用于基于像素輸入幅度值的全尺寸來檢查和校正上下溢出。如果上溢出檢驗(yàn)子單元12檢查到上溢出,則將下一個(gè)較小的步長值分配為新的量化輸出值并繼續(xù)進(jìn)行溢出檢查(對(duì)應(yīng)于圖3A中的步驟S13,S15-S16),否則,輸出所述分配的量化輸出值作為第一差值量化單元10的第一量化輸出(對(duì)應(yīng)于圖3B中的步驟S17)。如果下溢出檢驗(yàn)子單元13檢測(cè)到下溢出,則將下一個(gè)較小的步長值分配為新的量化輸出值并繼續(xù)進(jìn)行溢出檢查(對(duì)應(yīng)于圖3A中的步驟S14,S16),否則,則輸出所述分配的量化輸出值作為第一差值量化單元10的第一量化輸出(對(duì)應(yīng)于圖3B中的步驟S17)。此外,將所述第一量化輸出輸入到第二差值量化單元14,在連續(xù)3個(gè)相鄰像素的第一量化輸出值都小于+/-2的情況下,如果該3個(gè)第一量化輸出值之和為-1時(shí),第二差值量化單元14將輸出對(duì)應(yīng)于所述3個(gè)相鄰像素的第二量化輸出-1,+1,-1作為非線性量化器20最終的量化輸出,而不論它們之前的數(shù)值為何(對(duì)應(yīng)于圖2中步驟S52);并且當(dāng)該3個(gè)第一量化輸出值之和為+1時(shí),第二差值量化單元14將輸出對(duì)應(yīng)于所述3個(gè)相鄰像素的第二量化輸+1,-1,+1作為非線性量化器20最終的量化輸出,無論它們之前的數(shù)值為何(對(duì)應(yīng)于圖2中步驟S53)。如果相鄰像素的第一量化輸出不滿足上述條件,則將相應(yīng)的第一量化輸出作為非線性量化器20最終的量化輸出(對(duì)應(yīng)于圖2中步驟S53)。
從以上描述中可知,為了增加冗余以改善壓縮,本發(fā)明的VICOMP視頻編碼器使用非線性量化器,該量化器對(duì)相鄰視頻信息的差量進(jìn)行量化。在亮度Y分量的情況下,該量化器使用相鄰像素的差量,在顏色UV分量的情況下,其使用相鄰的2×3像素塊。上述針對(duì)Y分量的非線性量化原理同樣也可適用于UV分量。在此不再贅述。本發(fā)明的該非線性量化器造成幅度尺寸中的某些損失,但是這種損失產(chǎn)生的方式是與人眼的非線性相一致的。該量化器的非線性被設(shè)計(jì)為匹配人眼響應(yīng)系統(tǒng)的非線性。因此,最終在幅度信息中的損失對(duì)于觀察者來說是覺察不到的。
相反,在DCT(離散余弦變換)編碼系統(tǒng)中使用的量化器量化頻率大小,導(dǎo)致高頻信息的損失。這種損失的量取決于量化器的實(shí)現(xiàn)。但是,缺少某些損失,壓縮并不是良好的。高頻信息的相應(yīng)損失已證明對(duì)銳度和小細(xì)節(jié)造成影響。這種高頻信息的損失對(duì)于觀察者來說是可覺察到的,并且會(huì)劣化視頻質(zhì)量。
已經(jīng)結(jié)合具體實(shí)施方式
對(duì)本發(fā)明進(jìn)行了詳細(xì)描述,但是,本領(lǐng)域技術(shù)人員了解,本發(fā)明的保護(hù)范圍并不局限于上述實(shí)施方式中的細(xì)節(jié),在不背離本發(fā)明的原理和精神的前提下,還存在各種變形和改變。因此,本發(fā)明的保護(hù)范圍由以下權(quán)利要求來限定。
權(quán)利要求
1)一種用于視頻編碼系統(tǒng)的非線性差值量化器,包括第一差值量化單元,其包括量化子單元,用于將輸入視頻信息中相鄰的像素輸入值的每個(gè)差量轉(zhuǎn)化為多個(gè)離散步長,所述離散步長被合適地定標(biāo)以對(duì)應(yīng)于像素輸入幅度值的全尺寸;溢出檢驗(yàn)子單元,用于基于像素輸入幅度值的全尺寸來檢查和校正上和/或下溢出。
2)如權(quán)利要求1所述的非線性差值量化器,其中,所述像素輸入值是每個(gè)像素的亮度Y分量和顏色UV分量的值,所述量化子單元被配置成根據(jù)相鄰的像素輸入值的差量分配一個(gè)量化輸出值,以及其中,所述溢出檢驗(yàn)子單元包括上溢出檢驗(yàn)子單元和下溢出檢驗(yàn)子單元,其被配置成當(dāng)相鄰像素輸入值的差量為正時(shí),所述上溢出檢驗(yàn)子單元判斷所述量化輸出值與相鄰像素中前一像素輸入值之和是否大于所述像素輸入幅度值的全尺寸,如果大于,則所述上溢出檢驗(yàn)子單元指示所述量化子單元將下一個(gè)較小的步長值分配為新的量化輸出值以繼續(xù)進(jìn)行所述溢出檢驗(yàn),否則,則輸出所述量化輸出值作為第一差值量化單元的第一量化輸出;當(dāng)相鄰像素輸入值的差量為負(fù)時(shí),所述下溢出檢驗(yàn)子單元判斷所述量化輸出值與相鄰像素中前一像素輸入值之和是否為負(fù),如果為負(fù),則下溢出檢驗(yàn)子單元指示所述量化子單元將下一個(gè)較小的步長值分配為新的量化輸出值以繼續(xù)進(jìn)行所述溢出檢驗(yàn),如果不為負(fù),則輸出所述量化輸出值作為第一差值量化單元的第一量化輸出。
3)如權(quán)利要求2所述的非線性差值量化器,其中,如果相鄰像素的連續(xù)輸入Y分量和UV分量值是常數(shù),則在所述第一差值量化單元的輸入端將產(chǎn)生連續(xù)的0差量,所述第一量化輸出在+1或-1之間交替,在交替的像素上產(chǎn)生1的誤差。
4)如權(quán)利要求1-3中任一項(xiàng)所述的非線性差值量化器,還包括第二差值量化單元,其被配置成接收所述第一量化輸出,并且當(dāng)對(duì)應(yīng)于一個(gè)以上的相鄰像素的所述第一量化輸出的絕對(duì)值都為1時(shí),則按照預(yù)定規(guī)則分配對(duì)應(yīng)于各個(gè)像素的第二量化輸出作為最終的量化器輸出,否則,將所述第一量化輸出作為最終的量化器輸出。
5)如權(quán)利要求4所述的非線性差值量化器,其中,所述一個(gè)以上的相鄰像素為3個(gè)相鄰像素,以及其中,所述第二差值量化單元被配置成當(dāng)該3個(gè)相鄰像素的第一量化輸出值之和為-1時(shí),將對(duì)應(yīng)于所述3個(gè)相鄰像素的第二量化輸出轉(zhuǎn)換為-1,+1,-1,而不論它們之前的數(shù)值為何;并且當(dāng)該3個(gè)相鄰像素的第一量化輸出值之和為+1時(shí),將對(duì)應(yīng)于所述3個(gè)相鄰像素的第二量化輸出轉(zhuǎn)換為+1,-1,+1,無論它們之前的數(shù)值為何。
6)一種用在視頻編碼系統(tǒng)中的非線性差值量化方法,包括步驟將輸入視頻信息中相鄰的像素輸入值的每個(gè)差值轉(zhuǎn)化為多個(gè)離散步長,所述離散步長被合適地定標(biāo)以對(duì)應(yīng)于像素輸入幅度值的全尺寸;基于像素輸入幅度值的全尺寸來檢查和校正上下溢出。
7)如權(quán)利要求6所述的非線性差值量化方法,其中,所述像素輸入值是每個(gè)像素的亮度Y分量和顏色UV分量的值,所述差量轉(zhuǎn)化步驟根據(jù)相鄰的像素輸入值的差量分配一個(gè)量化輸出值,以及其中,所述溢出檢驗(yàn)步驟包括子步驟當(dāng)相鄰像素輸入值的差量為正時(shí),判斷所述量化輸出值與相鄰像素中前一像素輸入值之和是否大于所述像素輸入幅度值的全尺寸,如果大于,則將下一個(gè)較小的步長值分配為新的量化輸出值以繼續(xù)進(jìn)行所述溢出檢驗(yàn),否則,則輸出所述量化輸出值作為第一量化輸出;當(dāng)相鄰像素輸入值的差量為負(fù)時(shí),判斷所述量化輸出值與相鄰像素中前一像素輸入值之和是否為負(fù),如果為負(fù),則將下一個(gè)較小的步長值分配為新的量化輸出值以繼續(xù)進(jìn)行所述溢出檢驗(yàn),如果不為負(fù),則輸出所述量化輸出值作為第一量化輸出。
8)如權(quán)利要求7所述的非線性差值量化方法,其中,如果相鄰像素的連續(xù)輸入Y分量和UV分量值是常數(shù),則將產(chǎn)生連續(xù)的0差量,所述第一量化輸出在+1或-1之間交替,在交替的像素上產(chǎn)生1的誤差。
9)如權(quán)利要求6-8中任一項(xiàng)所述的非線性差值量化方法,還包括步驟接收所述第一量化輸出,并且當(dāng)對(duì)應(yīng)于一個(gè)以上的相鄰像素的所述第一量化輸出的絕對(duì)值都為1時(shí),則按照預(yù)定規(guī)則分配對(duì)應(yīng)于各個(gè)像素的第二量化輸出作為最終的量化輸出,否則,將所述第一量化輸出作為最終的量化輸出。
10)如權(quán)利要求9所述的非線性差值量化方法,其中,所述一個(gè)以上的相鄰像素為3個(gè)相鄰像素,以及其中,當(dāng)該3個(gè)相鄰像素的第一量化輸出值之和為-1時(shí),將對(duì)應(yīng)于所述3個(gè)相鄰像素的第二量化輸出轉(zhuǎn)換為-1,+1,-1,而不論它們之前的數(shù)值為何;并且當(dāng)該3個(gè)相鄰像素的第一量化輸出值之和為+1時(shí),將對(duì)應(yīng)于所述3個(gè)相鄰像素的第二量化輸出轉(zhuǎn)換為+1,-1,+1,無論它們之前的數(shù)值為何。
全文摘要
本發(fā)明提供一種用于視頻編碼系統(tǒng)的非線性差值量化器,包括第一差值量化單元,其包括量化子單元,用于將輸入視頻信息中相鄰的像素輸入值的每個(gè)差量轉(zhuǎn)化為多個(gè)離散步長,所述離散步長被合適地定標(biāo)以對(duì)應(yīng)于像素輸入幅度值的全尺寸;溢出檢驗(yàn)子單元,用于基于像素輸入幅度值的全尺寸來檢查和校正上和/或下溢出。本發(fā)明還提供一種用在視頻編碼系統(tǒng)中的非線性差值量化方法。該方法可實(shí)現(xiàn)上述本發(fā)明的非線性差值量化器的功能。使用上述方法和裝置可制造出與人類視覺反應(yīng)系統(tǒng)相吻合的非線性,在編碼過程中保持了所有的高頻率成分,因此也保持了與輸入視頻信號(hào)同樣的清晰度和解析度。因?yàn)榉蔷€性量化器造成的信息減少是不被肉眼感知的。
文檔編號(hào)H04N7/26GK1964486SQ20051011480
公開日2007年5月16日 申請(qǐng)日期2005年11月11日 優(yōu)先權(quán)日2005年11月11日
發(fā)明者李將, 畢景江, 熊杰 申請(qǐng)人:北京微視訊通數(shù)字技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1