專利名稱:無失真音頻壓縮/解壓縮熵壓縮編碼之裝置及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種音頻壓縮/解壓縮之裝置及其方法,且特別涉及一種通過熵壓縮編碼之無失真音頻壓縮/解壓縮之裝置及其方法。
背景技術(shù):
寬帶傳輸環(huán)境如寬帶網(wǎng)絡(luò)及無線通訊的發(fā)展將使得傳輸高質(zhì)量的影音信息成為必然的趨勢(shì),第三代移動(dòng)通訊與目前的GSM移動(dòng)通訊系統(tǒng)最大的差別之一正是其影音數(shù)據(jù)傳輸?shù)哪芰?,由于技術(shù)的進(jìn)步,因此高質(zhì)量甚至無失真的音頻信號(hào)傳輸已成為可能的趨勢(shì)之一,其主要的應(yīng)用層面在于無失真的音頻信號(hào)給予使用者完整的編輯空間,可以隨應(yīng)用的場合不同傳送不同位率的音頻信號(hào),對(duì)于音樂或歌曲,使用者一般而言有比較高的質(zhì)量要求,無失真的音頻信號(hào)給予使用者完全的編輯使用空間,以欣賞音樂的角度而言比較需要無失真的音頻。
而且制定國際影音壓縮規(guī)格的國際標(biāo)準(zhǔn)組織ISO/IEC MPEG在第59次會(huì)議當(dāng)中開始討論是否需要制定新的無失真音頻壓縮標(biāo)準(zhǔn)(AudioLossless Coding,ALS),會(huì)中有熱烈的討論并有足夠的證據(jù)顯示已有制定新規(guī)格的產(chǎn)業(yè)需求且技術(shù)也已經(jīng)達(dá)到可以規(guī)格化的地步了,目前的新規(guī)格制定已經(jīng)到了最后的階段,預(yù)計(jì)將會(huì)在2005年底整個(gè)規(guī)格制定的工作會(huì)告一個(gè)段落,同時(shí)MPEG也將進(jìn)行無失真語音壓縮標(biāo)準(zhǔn)(Speech LosslessCoding)的制定工作。另一方面,國際上也有許多非國際標(biāo)準(zhǔn)的無失真音頻壓縮系統(tǒng)如Monkey,F(xiàn)LAC(free lossless audio codec)及微軟的WMA(window medium audio)。觀察大部分的無失真音頻壓縮系統(tǒng)都由時(shí)域預(yù)測(time-domain prediction)及預(yù)測誤差熵壓縮編碼(entropy coding)兩個(gè)部分所組成,時(shí)域預(yù)測有兩種典型的方法,前饋預(yù)測(Forward prediction)及反饋預(yù)測(Backward prediction),所謂前饋預(yù)測是指由前面的數(shù)據(jù)值經(jīng)過一個(gè)預(yù)測濾波器來產(chǎn)生目前數(shù)據(jù)的預(yù)測值,與后者最大的差異在于前饋預(yù)測的濾波器系數(shù)是事先選定的,所以必須將濾波器系數(shù)予以儲(chǔ)存到壓縮數(shù)據(jù)中,如此解碼端才能完整地把當(dāng)初編碼的數(shù)據(jù)正確地解碼,另一方面反饋預(yù)測則是由一個(gè)適應(yīng)性算法在預(yù)測過程中及時(shí)地更新預(yù)測濾波器的系數(shù),因此不需要產(chǎn)生多余的信息到編碼數(shù)據(jù)中,只要在解碼端采用跟編碼端一樣的預(yù)測濾波器系數(shù)更新的算法就可以保證數(shù)據(jù)可以還原回來。
在此所稱熵壓縮編碼(entropy coding)乃是一個(gè)廣泛名詞,且其最主要的目的就是利用預(yù)測誤差大小值較小的特性用編碼方法作進(jìn)一步的壓縮,常用的方法可有可變長度編碼(Variable-Length Coding,VLC),Huffman編碼及算術(shù)編碼(Arithmetic coding)等。
音頻的數(shù)字化是通過取樣(Sampling)的方式將連續(xù)的模擬信號(hào)用固定數(shù)據(jù)分辨率(resolution)來儲(chǔ)存,然而如果對(duì)于原始音頻數(shù)據(jù)不加以處理的話其數(shù)據(jù)量會(huì)非常的龐大,由于相鄰取樣值之間有相當(dāng)高的時(shí)域相關(guān)性,我們可以利用此相關(guān)性將數(shù)據(jù)作適當(dāng)?shù)念A(yù)測編碼以減低數(shù)據(jù)量,壓縮的技巧有的會(huì)造成數(shù)據(jù)的損失,此種方式我們稱之為有損失壓縮(Lossycompression),這意味著解碼端還原回來的數(shù)據(jù)將會(huì)有所差異,而這樣的差異通常不會(huì)為人耳所分辨出來,所得到的好處就是可以大大地降低數(shù)據(jù)量,相對(duì)于有損失的壓縮則是無失真音頻壓縮法,如此的壓縮系統(tǒng)還原回來的數(shù)據(jù)則跟當(dāng)初壓縮前的數(shù)據(jù)一致。
公知無失真音頻壓縮法有下列幾種。其中在美國專利號(hào)第6,675,148號(hào)中亦揭示一無失真音頻壓縮系統(tǒng),且該系統(tǒng)將輸入的音頻信號(hào)切割成音頻畫面(Audio frames),接著對(duì)音頻畫面的數(shù)據(jù)做預(yù)測同時(shí)將預(yù)測器的系數(shù)量化并加以儲(chǔ)存成為數(shù)據(jù)的一部分,經(jīng)過預(yù)測編碼后的音頻畫面可以更進(jìn)一步地切割成為更小的子方塊并做熵壓縮編碼。
另一美國專利號(hào)第5,884,269號(hào)提出一種數(shù)字音頻之無失真壓縮/解壓縮裝置。該數(shù)字音頻之無失真壓縮/解壓縮裝置之編碼方框圖則如圖1所示,首先輸入未壓縮的音頻,再經(jīng)過一個(gè)預(yù)測濾波器(或稱預(yù)測器)加以處理并產(chǎn)生預(yù)測誤差信號(hào),接著該預(yù)測誤差信號(hào)會(huì)經(jīng)最佳表選擇器以使其從預(yù)先選定好表格之緊密Huffman總匯編及緊密Huffman加權(quán)表二者中選出一組最佳化的表格。通過該組最佳化的表格進(jìn)行熵編碼;意即進(jìn)行Huffman編碼及畫面編碼。此時(shí),熵編碼能針對(duì)每一個(gè)音頻畫面(Audio frame)的誤差信號(hào)所選定的Huffman表來對(duì)每一個(gè)音頻畫面(Audio frame)的誤差信號(hào)作最有效的編碼產(chǎn)生最短的編碼數(shù)據(jù)以提高壓縮比。之后,己熵編碼之音頻則輸出并儲(chǔ)存。
再請(qǐng)參照?qǐng)D2,圖2是該數(shù)字音頻之無失真壓縮/解壓縮裝置之解碼方框圖?;旧?,其是依與圖1之相反方向進(jìn)行解碼。即己熵編碼之音頻被輸入至畫面解碼區(qū),該畫面解碼區(qū)可從該己熵編碼之音頻的文件頭信息讀出所使用之Huffman表的信息且通過該信息從Huffman總匯編中選出對(duì)應(yīng)之Huffman表。如此可將己熵編碼之音頻進(jìn)行下一個(gè)操作;即Huffman解碼,而還原出預(yù)測誤差信號(hào)。然后該預(yù)測誤差信號(hào)再輸入反向預(yù)測器,以使該預(yù)測誤差信號(hào)被加上該對(duì)應(yīng)的預(yù)測值而恢復(fù)該音頻之原本值(即恢復(fù)壓縮前之原始音頻)。
然而,上述之公知技術(shù)不論是使用Huffman表編碼或算術(shù)編碼(Arithmetic coding)皆需要很大運(yùn)算量,不適于作及時(shí)壓縮。因此,有必要提供一種運(yùn)算量不大且適用于各種時(shí)域預(yù)測的熵壓縮編碼之方法及裝置。
發(fā)明內(nèi)容
本發(fā)明之主要目的是提供一種高效率,高壓縮比且無過多運(yùn)算之適用于各種時(shí)域預(yù)測的音頻熵壓縮編碼方法及裝置。該裝置包括緩沖器,時(shí)間軸預(yù)測器及位分配之熵編/解碼器,其中該時(shí)間軸預(yù)測器會(huì)將此時(shí)點(diǎn)輸入信號(hào)值與該值的預(yù)測值作減法運(yùn)算而產(chǎn)生音頻壓縮后之預(yù)測誤差信號(hào)。然后,該預(yù)測誤差信號(hào)再輸入運(yùn)用本發(fā)明編碼準(zhǔn)則的該位分配之熵解碼器,而加以編碼。又本發(fā)明之熵壓縮編碼后之區(qū)間數(shù)據(jù)封包結(jié)構(gòu)包括32位的文件頭(header)信息,文件頭之后為真正的數(shù)據(jù),但該數(shù)據(jù)實(shí)質(zhì)上為該數(shù)據(jù)之原本值與區(qū)間最小值的差。通過上述方法可達(dá)到減少公知之復(fù)雜運(yùn)算量即可得到高效率的熵壓縮編碼之音頻。其中該時(shí)間軸預(yù)測器包括遞歸最小二乘(recursive least square,RLS)及最小均方(least mean square,LMS)。
本發(fā)明之更進(jìn)一目的是提供一種適用于各種時(shí)域預(yù)測的音頻熵壓縮編碼方法及裝置之編碼準(zhǔn)則。該編碼準(zhǔn)則是用來根據(jù)所需的數(shù)據(jù)精度將預(yù)測誤差信號(hào)做分析并切割出不同的區(qū)間。且區(qū)間切割其實(shí)是由四個(gè)主要的條件所共同決定的,當(dāng)以下的四個(gè)條件任一成立時(shí),編碼器就會(huì)利用該編碼準(zhǔn)則產(chǎn)生一個(gè)新的編碼區(qū)間,并且對(duì)區(qū)間文件頭跟數(shù)據(jù)作寫出操作。此四個(gè)條件為(a)目前要編碼的誤差數(shù)據(jù)的數(shù)據(jù)精度大于前一個(gè)誤差數(shù)據(jù)且因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(b)目前的區(qū)間已有50條數(shù)據(jù)且編碼目前數(shù)據(jù)點(diǎn)所需要的位數(shù)大于后來50點(diǎn)每點(diǎn)所需的數(shù)據(jù)量精度或(c)目前的誤差數(shù)據(jù)跟前一時(shí)點(diǎn)誤差數(shù)據(jù)間的差值大于預(yù)定值且因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(d)目前區(qū)間中的點(diǎn)數(shù)已經(jīng)有4096點(diǎn)。
為讓本發(fā)明之上述和其它目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合附圖,作詳細(xì)說明如下。
圖1是揭示公知數(shù)字音頻之無失真壓縮/解壓縮裝置之編碼方框圖。
圖2是揭示公知數(shù)字音頻之無失真壓縮/解壓縮裝置之解碼方框圖。
圖3是揭示本發(fā)明較佳實(shí)施例之適用于各種時(shí)域預(yù)測的音頻熵壓縮編碼裝置。
圖4是揭示預(yù)測誤差信號(hào)值與對(duì)應(yīng)原本數(shù)值之關(guān)系圖。
圖5為本發(fā)明較佳實(shí)施例之一個(gè)熵壓縮編碼的區(qū)間示意圖。
圖6是揭示本發(fā)明較佳實(shí)施例之適用于各種時(shí)域預(yù)測的音頻熵壓縮解碼裝置。
具體實(shí)施例方式
請(qǐng)參照?qǐng)D3,其揭示本發(fā)明較佳實(shí)施例之適用于各種時(shí)域預(yù)測的音頻熵壓縮編碼裝置,其包括緩沖器,時(shí)間軸預(yù)測器及位分配之熵解碼器。該緩沖器用以將輸入的原始未壓縮的音頻分割成多個(gè)音頻畫面(audioframe)且該音頻畫面為含有依次排列的固定音頻點(diǎn)數(shù)的一維音頻值數(shù)據(jù);該時(shí)間軸預(yù)測器是用以將輸入該音頻畫面中之時(shí)間點(diǎn)音頻值與該點(diǎn)的預(yù)測值作減法運(yùn)算而產(chǎn)生壓縮音頻之預(yù)測誤差信號(hào)(其實(shí)質(zhì)上為數(shù)值,或亦可稱預(yù)測誤差信號(hào)值)。其中在作開始進(jìn)行減法運(yùn)算時(shí)之初始值被設(shè)定為零,意即最先輸入該時(shí)間軸預(yù)測器者為原始未壓縮的音頻且其數(shù)值大小被儲(chǔ)存在該時(shí)間軸預(yù)測器內(nèi)以作為后續(xù)輸入音頻之比較基礎(chǔ)。然后,該預(yù)測誤差信號(hào)再輸入運(yùn)用本發(fā)明編碼準(zhǔn)則的該位分配之熵編/解碼器,而加以編碼切割成為長度不固定的數(shù)據(jù)區(qū)間且該數(shù)據(jù)區(qū)間包括文件頭信息及該區(qū)間內(nèi)每一音頻點(diǎn)之預(yù)測誤差信號(hào)。其中該時(shí)間軸預(yù)測器由RLS預(yù)測器及LMS預(yù)測器兩個(gè)部分所構(gòu)成。
本發(fā)明之適用于各種時(shí)域預(yù)測的音頻熵壓縮編碼方法包括將原始未壓縮的音頻信號(hào)輸入緩沖器中以被分割成為固定長度的一維數(shù)據(jù)稱為音頻畫面(audio frame);接著,每張音頻畫面都會(huì)通過時(shí)域RLS-LMS預(yù)測器,由于該RLS預(yù)測器的收斂速度(即預(yù)測誤差收斂趨近于零的速度)比較快所以被放在整個(gè)預(yù)測器的第一個(gè)部分,故該未壓縮的音頻信號(hào)先通過該RLS預(yù)測器,其產(chǎn)生的預(yù)測誤差再送到該LMS預(yù)測器做進(jìn)一步的預(yù)測編碼,最后產(chǎn)生預(yù)測誤差值;最后,該預(yù)測誤差值輸入位分配之熵編/解碼器,其根據(jù)本發(fā)明之編碼準(zhǔn)則及根據(jù)所需的數(shù)據(jù)精度將預(yù)測誤差信號(hào)做分析編碼成不同區(qū)間的編碼音頻數(shù)據(jù)。
由于整個(gè)預(yù)測編碼的過程都是由該預(yù)測器做適應(yīng)性的預(yù)測計(jì)算,所以預(yù)測器的系數(shù)不需要傳送到解碼端,如此可以節(jié)省一些數(shù)據(jù)空間。在解碼時(shí),只要解碼端也使用相同的濾波器算法就可以將原始數(shù)據(jù)毫無遺失地還原回來。
一般而言預(yù)測器如能適當(dāng)?shù)貙⒁纛l信號(hào)做預(yù)測編碼,其預(yù)測誤差值將會(huì)遠(yuǎn)小于原本的信號(hào)值以達(dá)到數(shù)據(jù)壓縮的目的,典型的無失真音頻壓縮在預(yù)測編碼器之后會(huì)有一個(gè)熵壓縮編碼器利用誤差值較原始值小的特性做進(jìn)一步的數(shù)據(jù)壓縮。本發(fā)明所提出之跨音頻畫面的熵壓縮編碼法,是將預(yù)測誤差信號(hào),如圖4所示,依據(jù)本發(fā)明之多個(gè)準(zhǔn)則把誤差切割成好幾個(gè)子區(qū)間,圖4所示為一段預(yù)測誤差信號(hào)值,其數(shù)值變化頗為劇烈,有的部分占去5-bit(位)左右,有的則需要十幾個(gè)位才能表示誤差值,如果整個(gè)區(qū)間都用13-bit來表示數(shù)據(jù),雖然比原本的精度16-bit相比已有減低數(shù)據(jù)量,但整體而言還有很大的數(shù)據(jù)壓縮空間,所以本發(fā)明提出一個(gè)方法將預(yù)測誤差信號(hào)做分析并根據(jù)所需的數(shù)據(jù)精度切割出不同的區(qū)間,區(qū)間內(nèi)的每條數(shù)據(jù)都用相同的精度來表示信息,所儲(chǔ)存的信息不是原本的數(shù)據(jù)值而是每點(diǎn)數(shù)值與該區(qū)間最小值的差。另外,我們必須保留32-bit的數(shù)據(jù)空間給每個(gè)記錄區(qū)間內(nèi)的數(shù)據(jù)排放方式。
請(qǐng)參照?qǐng)D5所示為一個(gè)熵壓縮編碼的區(qū)間示意圖,在真正的數(shù)據(jù)之前是長度固定為32-bit的文件頭信息(Header)。其中包含三個(gè)字段的信息,首先用4-bit來表示區(qū)間里面所有數(shù)據(jù)的數(shù)據(jù)精度,接著用16-bit來表示前述的最小值(請(qǐng)注意該最小值是指該區(qū)間之最小預(yù)測誤差值而非音頻之原本值),最后的12-bit用來表示該區(qū)間的點(diǎn)數(shù),所以每個(gè)區(qū)間最多可以存放4096條數(shù)據(jù),緊接在文件頭之后的就是真正的數(shù)據(jù)(D1,D2,D3...DN-1,DN),如前所述我們存放的不是原本的值而是每個(gè)數(shù)據(jù)點(diǎn)與該區(qū)間最小值的差。
前面提到的區(qū)間切割編碼是依據(jù)四個(gè)主要的條件所共同決定的。當(dāng)以下的四個(gè)條件任一成立時(shí),編碼器就會(huì)產(chǎn)生一個(gè)新的編碼區(qū)間,并且對(duì)區(qū)間文件頭跟數(shù)據(jù)作寫出操作。此四個(gè)條件分別為(a)目前要編碼的誤差數(shù)據(jù)的數(shù)據(jù)精度大于前一個(gè)誤差數(shù)據(jù)且因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(b)目前的區(qū)間已有50條數(shù)據(jù)且編碼目前數(shù)據(jù)點(diǎn)所需要的位數(shù)大于后來50點(diǎn)每點(diǎn)所需的數(shù)據(jù)量精度或(c)目前的誤差數(shù)據(jù)跟前一條誤差數(shù)據(jù)間的差值大于一個(gè)預(yù)先選定好的固定值且因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(d)目前區(qū)間中的點(diǎn)數(shù)已經(jīng)有4096點(diǎn)。
請(qǐng)參照表一,其是比較本發(fā)明,F(xiàn)LAC,Wavpack及WMA四種不同音頻壓縮格式在以大致相同壓縮比(比如1.508,1.405等)條件下來壓縮三種不同歌曲之運(yùn)算減少百分比。
(表一)由表一明顯地示出,本發(fā)明之音頻壓縮和其它三種不同音頻壓縮格式相比所需運(yùn)算量大為減少。
請(qǐng)?jiān)賲⒄請(qǐng)D6,其揭示本發(fā)明較佳實(shí)施例之適用于各種時(shí)域預(yù)測的音頻熵壓縮解碼裝置。該解碼裝置所包括位分配之熵解碼器,緩沖區(qū)及包含LMS-RMS之反向預(yù)測解碼器,在此解碼裝置中解碼的過程主要包括以下幾個(gè)步驟欲解碼的輸入信號(hào)(即編碼壓縮之音頻)會(huì)先送到該位分配之熵解碼器以還原成壓縮音頻數(shù)據(jù)之音頻畫面,接著把該音頻畫面輸入該緩沖區(qū)以還原成具有預(yù)測誤差值之每一壓縮音頻數(shù)據(jù)點(diǎn)。該每一壓縮音頻數(shù)據(jù)點(diǎn)再送到反向預(yù)測解碼器做預(yù)測解碼的操作,預(yù)測解碼出來的就是原始的未壓縮音頻數(shù)據(jù)。
綜上所述,本發(fā)明之一種適用于各種時(shí)域預(yù)測的音頻熵壓縮編碼方法及裝置和公知技術(shù)相比具有下列優(yōu)點(diǎn)1.本發(fā)明所需之音頻編碼/解碼的運(yùn)算量顯著地減少,故本發(fā)明適合于實(shí)時(shí)壓縮且進(jìn)而大大地縮短音頻編碼/解碼所需的時(shí)間。
2.由于本發(fā)明之適用于各種時(shí)域預(yù)測的音頻熵壓縮編碼裝置并需要如公知之緊密Huffman總匯編及緊密Huffman加權(quán)表,因此,本發(fā)明之音頻壓縮/解壓縮編碼裝置和公知技術(shù)相比大為簡化,故可因而大大地減少制造成本。
雖然本發(fā)明已以較佳實(shí)施例披露如上,然其并非用以限定本發(fā)明,任何所屬技術(shù)領(lǐng)域的技術(shù)人員,在不脫離本發(fā)明之精神和范圍內(nèi),當(dāng)可作些許之更動(dòng)與改進(jìn),因此本發(fā)明之保護(hù)范圍當(dāng)視權(quán)利要求所界定者為準(zhǔn)。
權(quán)利要求
1.一種音頻編碼壓縮裝置,其特征是包括緩沖器,其用以將輸入之原始未壓縮的音頻信號(hào)分割成為多個(gè)音頻畫面且該音頻畫面為含有依時(shí)序排列的固定音頻點(diǎn)數(shù)的一維音頻值數(shù)據(jù);時(shí)間軸預(yù)測編碼器,其用以將輸入該音頻畫面中之時(shí)間點(diǎn)音頻值與該音頻值之預(yù)測值作減法運(yùn)算而產(chǎn)生壓縮音頻之預(yù)測誤差信號(hào);及熵壓縮編碼器,其用以將該預(yù)測誤差信號(hào)根據(jù)編碼準(zhǔn)則,而加以編碼切割成為長度不固定的數(shù)據(jù)區(qū)間以供讀出該編碼壓縮音頻數(shù)據(jù)區(qū)間。
2.根據(jù)權(quán)利要求1所述之音頻編碼壓縮裝置,其特征是該時(shí)間軸預(yù)測編碼器由RLS預(yù)測器及LMS預(yù)測器兩個(gè)部分所構(gòu)成且該音頻畫面先輸入該RLS預(yù)測器再輸入該LMS預(yù)測器。
3.根據(jù)權(quán)利要求1所述之音頻編碼壓縮裝置,其特征是該緩沖區(qū)為一段存儲(chǔ)器,其具有足夠長度可以存放整個(gè)音頻信號(hào)的數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述之音頻編碼壓縮裝置,其特征是該編碼準(zhǔn)則為以下四個(gè)條件之一成立即可,該四個(gè)條件分別為(a)目前要編碼的誤差數(shù)據(jù)的數(shù)據(jù)精度大于前一個(gè)誤差數(shù)據(jù)且因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(b)目前的區(qū)間已有50條數(shù)據(jù)且編碼目前數(shù)據(jù)點(diǎn)所需要的位數(shù)大于后來50點(diǎn)每點(diǎn)所需的數(shù)據(jù)量精度或(c)目前的誤差數(shù)據(jù)跟前一時(shí)點(diǎn)誤差數(shù)據(jù)間的差值大于一個(gè)預(yù)先選定好的固定值因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(d)目前區(qū)間中的點(diǎn)數(shù)已經(jīng)有4096點(diǎn)。
5.根據(jù)權(quán)利要求1所述之音頻編碼壓縮裝置,其特征是該數(shù)據(jù)區(qū)間包括文件頭信息及該區(qū)間內(nèi)每一音頻點(diǎn)之預(yù)測誤差信號(hào)。
6.一種音頻編碼壓縮方法,其特征是包括將原始未壓縮的音頻信號(hào)輸入緩沖器中以被分割成為多個(gè)音頻畫面且該音頻畫面為含有依時(shí)序排列的固定音頻點(diǎn)數(shù)的一維音頻值數(shù)據(jù);每張音頻畫面輸入時(shí)間軸預(yù)測編碼器,以將輸入該音頻畫面中之時(shí)間點(diǎn)音頻值與該點(diǎn)音頻值的預(yù)測值作減法運(yùn)算而產(chǎn)生壓縮音頻之預(yù)測誤差信號(hào);將該預(yù)測誤差信號(hào)輸入熵壓縮編碼器,以將該預(yù)測誤差信號(hào)根據(jù)編碼準(zhǔn)則,而加以編碼切割成為長度不固定的數(shù)據(jù)區(qū)間以供讀出該編碼壓縮音頻數(shù)據(jù)區(qū)間。
7.根據(jù)權(quán)利要求6所述之音頻編碼壓縮方法,其特征是該每張音頻畫面輸入時(shí)間軸預(yù)測編碼器之步驟中,該未壓縮的音頻信號(hào)先通過該時(shí)間軸預(yù)測編碼器之RLS預(yù)測器,其產(chǎn)生的預(yù)測誤差再送到該時(shí)間軸預(yù)測編碼器之LMS預(yù)測器做進(jìn)一步的預(yù)測編碼,最后產(chǎn)生預(yù)測誤差信號(hào)。
8.根據(jù)權(quán)利要求6所述之音頻編碼壓縮方法,其特征是讀出該編碼壓縮音頻數(shù)據(jù)區(qū)間之步驟,包括作包括讀出該編碼壓縮音頻數(shù)據(jù)區(qū)間之文件頭及緊接在文件頭后的數(shù)據(jù)。
9.根據(jù)權(quán)利要求6所述之音頻編碼壓縮方法,其特征是在由熵壓縮編碼器根據(jù)編碼準(zhǔn)則該預(yù)測誤差信號(hào)加以編碼切割成為長度不固定的數(shù)據(jù)區(qū)間之步驟中,該編碼準(zhǔn)則為依據(jù)以下四個(gè)條件之一成立即可,該四個(gè)條件分別為(a)目前要編碼的誤差數(shù)據(jù)的數(shù)據(jù)精度大于前一個(gè)誤差數(shù)據(jù)且因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(b)目前的區(qū)間已有50條數(shù)據(jù)且編碼目前數(shù)據(jù)點(diǎn)所需要的位數(shù)大于后來50點(diǎn)每點(diǎn)所需的數(shù)據(jù)量精度或(c)目前的誤差數(shù)據(jù)跟前一時(shí)點(diǎn)誤差數(shù)據(jù)間的差值大于一個(gè)預(yù)先選定好的固定值因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(d)目前區(qū)間中的點(diǎn)數(shù)已經(jīng)有4096點(diǎn)。
10.一種音頻編碼解壓縮裝置,其特征是包括熵壓縮解碼器,其用以將編碼壓縮音頻數(shù)據(jù)區(qū)間根據(jù)編碼準(zhǔn)則,還原成為依時(shí)序排列之預(yù)測誤差信號(hào);緩沖器,其用以將該輸入之依時(shí)序排列之預(yù)測誤差信號(hào)還原成為多個(gè)音頻畫面且該音頻畫面為含有依時(shí)序排列的固定音頻點(diǎn)數(shù)的預(yù)測誤差信號(hào);及時(shí)間軸預(yù)測解碼器,其用以將各固定音頻點(diǎn)數(shù)的預(yù)測誤差信號(hào)加上該音頻未壓縮前之原本值而被解碼出原本之音頻。
11.根據(jù)權(quán)利要求10所述之音頻編碼解壓縮裝置,其特征是該時(shí)間軸預(yù)測編碼器由LMS預(yù)測器及RLS預(yù)測器兩個(gè)部分所構(gòu)成且各固定音頻點(diǎn)數(shù)的預(yù)測誤差信號(hào)先輸入該LMS預(yù)測器再輸入該RLS預(yù)測器以完成預(yù)測解碼操作。
12.根據(jù)權(quán)利要求10所述之音頻編碼解壓縮裝置,其特征是該編碼準(zhǔn)則為以下四個(gè)條件之一成立即可,該四個(gè)條件分別為(a)目前要編碼的誤差數(shù)據(jù)的數(shù)據(jù)精度大于前一個(gè)誤差數(shù)據(jù)且因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(b)目前的區(qū)間已有50條數(shù)據(jù)且編碼目前數(shù)據(jù)點(diǎn)所需要的位數(shù)大于后來50點(diǎn)每點(diǎn)所需的數(shù)據(jù)量精度或(c)目前的誤差數(shù)據(jù)跟前一時(shí)點(diǎn)誤差數(shù)據(jù)間的差值大于一個(gè)預(yù)先選定好的固定值因?yàn)榫幋a此信號(hào)整個(gè)區(qū)間要多付出的數(shù)據(jù)量大于32-bit或(d)目前區(qū)間中的點(diǎn)數(shù)已經(jīng)有4096點(diǎn)。
13.根據(jù)權(quán)利要求10所述之音頻編碼解壓縮裝置,其特征是該緩沖區(qū)為一段存儲(chǔ)器,其具有足夠長度可以存放依時(shí)序排列的固定音頻點(diǎn)數(shù)的預(yù)測誤差信號(hào)。
14.根據(jù)權(quán)利要求10所述之音頻編碼解壓縮裝置,其特征是該編碼壓縮音頻數(shù)據(jù)區(qū)間包括文件頭信息及該區(qū)間內(nèi)每一音頻點(diǎn)之預(yù)測誤差信號(hào)。
全文摘要
本發(fā)明提供一種無失真音頻壓縮/解壓縮熵壓縮編碼之裝置及其方法。該裝置包括緩沖器,時(shí)間軸預(yù)測器及位分配之熵編解碼器,其中該時(shí)間軸預(yù)測器會(huì)將此時(shí)點(diǎn)輸入信號(hào)值之預(yù)測值與此時(shí)點(diǎn)的原輸入信號(hào)值作減法運(yùn)算而產(chǎn)生預(yù)測誤差信號(hào)。然后,該預(yù)測誤差信號(hào)再輸入根據(jù)編碼準(zhǔn)則的該位分配之熵解碼器,而編碼成不同長度之?dāng)?shù)據(jù)區(qū)間。又熵壓縮編碼后之?dāng)?shù)據(jù)區(qū)間結(jié)構(gòu)包括32位的文件頭(header)信息,文件頭之后為真正的數(shù)據(jù),但該數(shù)據(jù)實(shí)質(zhì)上為該數(shù)據(jù)之原本值與區(qū)間最小值的差。
文檔編號(hào)H03M7/30GK1991978SQ20051013541
公開日2007年7月4日 申請(qǐng)日期2005年12月28日 優(yōu)先權(quán)日2005年12月28日
發(fā)明者陳信豪, 吳國瑞, 朱朝居, 黃得瑞 申請(qǐng)人:財(cái)團(tuán)法人工業(yè)技術(shù)研究院