專利名稱:一種基于整形小波變換的音頻無損壓縮編碼、解碼方法
技術(shù)領(lǐng)域:
本發(fā)明屬于信源編、解碼領(lǐng)域,具體涉及一種音頻無損壓縮編碼、解碼方法。
背景技術(shù):
隨著數(shù)字時代的到來,音頻信號的數(shù)字化給人們帶來諸多方便的同時生成了海量 的音頻數(shù)據(jù),這給音頻信號的存儲和傳輸帶來了很大的挑戰(zhàn),成為了阻礙人們獲得和使用 多媒體信息的瓶頸問題之一。為了解決這個問題,就必須對音頻數(shù)據(jù)進(jìn)行壓縮,以壓縮編碼 的方式對數(shù)據(jù)進(jìn)行存儲和傳輸。事實證明,對多媒體的數(shù)據(jù)進(jìn)行壓縮是必要和可行的,因為 聲音和圖像等多媒體數(shù)據(jù)信息中有較強(qiáng)的冗余信息,即數(shù)據(jù)之間有較強(qiáng)的相關(guān)性,可通過 去掉冗余信息(即去除數(shù)據(jù)間的相關(guān)性)、保留有用的音頻信息來實現(xiàn)壓縮。因此,研究和 開發(fā)高效的音頻編碼方法,以壓縮的形式存儲和傳輸音頻信息是必然的選擇。而且隨著人 們對音頻質(zhì)量要求的提高,如何在保留全部音頻信息的條件下,以盡可能大的壓縮比壓縮 音頻數(shù)據(jù),從而給人們提供真正透明的音質(zhì),成為當(dāng)前音頻壓縮編碼所面臨的主要課題。早在20世紀(jì)70年代,英國、日本等廣播部門就開始研究數(shù)字音頻有損壓縮編碼, 目前的有損音頻壓縮編碼標(biāo)準(zhǔn)經(jīng)過四十年的發(fā)展,出現(xiàn)了很多優(yōu)秀的編碼標(biāo)準(zhǔn),其中有代 表性的有MP3、AAC、WMA等,這些編碼格式在很多情況下都可以達(dá)到較好的主觀音質(zhì)和很高 的壓縮比,但是當(dāng)它們遇到頻率動態(tài)范圍較大的音樂,例如大型交響樂等,這些有損音頻編 碼后的音質(zhì)表現(xiàn)就顯得差強(qiáng)人意。另外在音頻編輯領(lǐng)域中,對有損壓縮編碼的音頻數(shù)據(jù)做 二次編碼(即兩種有損編碼格式之間的轉(zhuǎn)換)會丟失更多的信息,從而引入更大的失真。為 了解決上述的問題,滿足一些對音質(zhì)要求比較高的需要,就必然要使用無損壓縮編碼。目前針對音頻信號進(jìn)行無損壓縮編碼的研究與應(yīng)用相比較有損壓縮編碼而言卻 并不多見。無損壓縮未能得到足夠關(guān)注的原因是其壓縮比很難超過3 1,而有損算法壓縮 比能達(dá)到12 1甚至更高。但是對有損壓縮算法來說,壓縮比越高,最終獲得的音頻質(zhì)量 越差,一旦確定最低可能的數(shù)據(jù)率,有損壓縮算法是唯一選擇。然而,音樂愛好者想從網(wǎng)上 下載高保真立體聲音頻信號以便獲得最佳的音樂效果,因此,網(wǎng)上音樂推廣將提供更高壓 縮比的音頻信號,以便于不同消費(fèi)者瀏覽和選擇,而酷愛CD級音頻質(zhì)量的音樂愛好者希望 獲得原始音頻信號的無損壓縮拷貝——該備份不因壓縮算法的差異而有任何信號損失。除 了可供網(wǎng)上音頻信號下載外,無損音頻壓縮編碼還可應(yīng)用于專業(yè)環(huán)境下高保真音頻數(shù)據(jù)的 歸檔、混音、演播室、節(jié)目制作等。在這種情況下,無損壓縮避免了使用有損壓縮編碼情況下 因多次編輯而引起的信號損失。從信息論觀點(diǎn)來看,音頻信號作為一個信源,描述信源的數(shù)據(jù)是信息量(信息熵) 和信息冗余量之和。幾乎所有的無損音頻壓縮都基于相似的思想,首先從信號中去除冗 余,去除的只是數(shù)據(jù)中的冗余量,而沒有減少信源中的信息量。然后用有效的數(shù)據(jù)編碼方 案進(jìn)行編碼。音頻信號中的存在著多種冗余,主要有信號幅度分布的非均勻性,相鄰樣值之 間的相關(guān)性,周期之間的相關(guān)性等。所以無損壓縮編碼算法的主要思想就是如何有效的去 處音頻信號中的冗余。目前比較知名的音頻無損編碼算法的格式有FLAC(Free Lossless
3Audio Codec)、WavPack、TAK (Tom ' s Audio Kompre s sor)、APE (Monkey ' s Audio)、 OFR(OptimFROG) > ALAC (Apple Lossless Audio Codec) > WMAL (Windows Media Audio Lossless)、Shorten、LA (LosslessAudio)、TTA (Ture Audio)、LPAC (Lossless Predictive Audio Coder)、RAL (RealAudioLossless)、MPEG-ALS等。這些算法主要利用兩種方法來進(jìn) 行去相關(guān)從而進(jìn)一步進(jìn)行無損壓縮編碼一種是基于時域線性預(yù)測編碼(LPC)的技術(shù),另 一種是基于變換域的技術(shù)例如 IntMDCTdnteger Modified Discrete Cosnie Transform, 整數(shù)改進(jìn)型離散余弦變換)。無損壓縮的目標(biāo)是除去數(shù)據(jù)中的冗余(redundancy),完美重 構(gòu)原始音頻信號。線性預(yù)測編碼可以進(jìn)一步減少冗余,對于那些具有平穩(wěn)特性的信號特別 有效。一般來講,平穩(wěn)的聲音信號信息冗余較大,而一個不協(xié)調(diào)(類似噪音)的信號信息冗 余較小。一個特定取樣值的大小與其鄰近的取樣值有關(guān),一般而言,當(dāng)前取樣值與其上一個 取樣值較為接近。對低頻信號,更是如此。目前對于主流的線性預(yù)測編碼方法主要思想都是體現(xiàn)在去相關(guān)部分,使得交給熵 編碼模塊的數(shù)據(jù)更適合利用熵編碼的方法壓縮,使得熵編碼能夠?qū)τ诖幋a的數(shù)據(jù)有更加 出色的壓縮性能。線性預(yù)測編碼器的基本原理是利用聲音信號的相關(guān)性,用過去的樣值 x[n-l],x[n-2]...來預(yù)測當(dāng)前的樣值χ [η],利用過去的樣值越多則預(yù)測精度越高。再把當(dāng) 前的樣值與預(yù)測值相減取其差(預(yù)測誤差)進(jìn)行編碼。由于預(yù)測誤差的動態(tài)范圍要遠(yuǎn)小于 原始信號的動態(tài)范圍,這時即使仍采用原信號量化時采用的量化級,也可降低碼位進(jìn)行編 碼,進(jìn)而實現(xiàn)比特率壓縮。例如幅度起伏平緩的聲音,預(yù)測誤差會在零和很小值之間變化, e[n]的均值將比x[n]小很多,并且預(yù)測誤差e [η]相鄰樣值之間基本上是不相關(guān)的,有平坦 的頻譜。所以,只需較少的數(shù)據(jù)位就可以表示其實際值。而常用的熵編碼為RICE碼,其編 解碼過程簡單,而且編碼時不需要知道信號的先驗分布,所以在音頻無損壓縮中應(yīng)用廣泛。 經(jīng)過RICE編碼后,能夠獲得較大壓縮率的數(shù)據(jù)一般具有以下特點(diǎn)一是幅值較小,因為編 碼最后都需要量化的過程,而較小的幅值意味著可以用較少的比特數(shù)來表示;二是數(shù)據(jù)間 相關(guān)性小,三是數(shù)據(jù)分布盡量接近幾何分布。使用線性預(yù)測編碼進(jìn)行去相關(guān)時沒有對原始 音頻信號的冗余去除干凈,即去相關(guān)不徹底.。即輸入到熵編碼模塊的預(yù)測誤差數(shù)據(jù)還帶有 冗余信息,誤差信號的相鄰樣值之間還存在一定的相關(guān)性,可以進(jìn)一步處理。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種音頻無損壓縮編碼、解碼方法,該方法基于相關(guān)系數(shù)的 分幀策略根據(jù)信號前后幀的相關(guān)情況自適應(yīng)對信號進(jìn)行分幀,使得一幀內(nèi)的信號具有很強(qiáng) 相關(guān)性,分幀后的一幀信號是信號特性相近的信號組合,使得編碼器能獲得到更好的壓縮 效率,為后面的整型小波變換和線性預(yù)測編碼帶來好處。為了使得殘差幅值盡可能小,要求 線性預(yù)測盡可能準(zhǔn)確,而線性預(yù)測編碼對于相關(guān)性強(qiáng)的信號具有很好的預(yù)測能力,所以考 慮利用小波變換來對信號進(jìn)行分帶處理,因為窄帶內(nèi)的信號相關(guān)性會好于全頻帶的信號的 相關(guān)性,因此信號經(jīng)過小波變換后更有利于去除樣值點(diǎn)的相關(guān)性;對于無損壓縮編碼來說, 應(yīng)該對于信號可以完全的重構(gòu),所以要采用整型提升小波變換來保證信號的完全可重構(gòu)特 性。我們在引入了基于相關(guān)的自適應(yīng)分幀模塊和基于整型提升小波的去相關(guān)模塊后,原始 信號中的冗余信息可以被更好的去相關(guān),生成的壓縮數(shù)據(jù)中所含有的冗余信息更少,所以 我們可以用很小的計算復(fù)雜度代價換來了較大的壓縮比提高。
本發(fā)明包括基于相關(guān)的自適應(yīng)分幀技術(shù),基于提升的整型小波變換的去相關(guān)技術(shù) 以及編、解碼中涉及到的其他相關(guān)技術(shù)。它能夠提供比單獨(dú)使用線性預(yù)測技術(shù)去相關(guān)的音 頻無損編碼、解碼系統(tǒng)提供更高的壓縮比。根據(jù)本發(fā)明方法的音頻無損編解碼器系統(tǒng)可以分為編碼器子系統(tǒng)和解碼器子系 統(tǒng)兩部分編碼器子系統(tǒng)包括分幀模塊用于對輸入的音頻信號進(jìn)行自適應(yīng)的分幀;整型小波變換模塊用于對分幀后的一段音頻信號進(jìn)行分帶處理;線性預(yù)測編碼模塊用于對每一個子帶內(nèi)的信號進(jìn)行線性預(yù)測去除相鄰樣點(diǎn)之間 的相關(guān)性;熵編碼模塊用于對線性預(yù)測編碼模塊輸出的殘差信號進(jìn)行無損的信源編碼比特流形成模塊用于把上述模塊中形成的熵編碼流、幀長信息、小波分級信息、 LPC參數(shù)、碼本信息按一定的格式形成比特流并寫成文件;解碼器子系統(tǒng)包括比特流分離模塊用于把壓縮后的音頻文件中的比特流按照規(guī)定格式進(jìn)行分離, 分別生成熵編碼流、幀長信息、小波分級信息、LPC參數(shù)、碼本信息等不同的數(shù)據(jù);熵解碼模塊用于把熵編碼流通過解碼重新完整的生成殘差信號LPC重構(gòu)模塊用于把邊信息中的LPC參數(shù)和殘差信號重構(gòu)成小波變換后的分帶信號。整型提升小波重構(gòu)模塊用于把小波分解后的分帶信號重新合成為一個完整的音 頻信號幀。合并幀模塊把重構(gòu)后的每一幀音頻信號合并成一個音頻的PCM文件,并寫入 WAVE文件的文件頭,生成解壓后的WAVE文件。根據(jù)本發(fā)明的音頻信號無損編/解碼方法的具體實現(xiàn)如下音頻信號的無損編碼流程是音頻文件先按照分幀策略分成若干幀,分幀信息(即 幀長信息)納入邊信息傳輸;每幀單獨(dú)處理,即先通過小波變換得到近似信號和細(xì)節(jié)信號, 小波分解級數(shù)(即小波分級信息)按自適應(yīng)規(guī)則獲得,分解級數(shù)同樣納入邊信息;近似信 號和細(xì)節(jié)信號通過線性預(yù)測模塊得到殘差信號和LPC參數(shù),在線性預(yù)測模塊中得到的殘差 信號經(jīng)過熵編碼得到熵編碼流,LPC參數(shù)和熵編碼的碼本信息納入邊信息,最后將各路碼流 (即邊信息和熵編碼流)復(fù)用形成最終的壓縮碼流。音頻信號的無損解碼流程實際上就是編碼流程的逆過程,通過先解碼出邊信息, 從邊信息中分離出熵編碼的碼本、LPC參數(shù)、分級信息和幀長信息,熵編碼模塊根據(jù)碼本信 息進(jìn)行熵解碼,從熵編碼流中解得LPC預(yù)測后殘差信號,LPC重構(gòu)模塊利用LPC參數(shù)從殘差 信號中解得小波分解的近似信號和細(xì)節(jié)信號,整型提升小波重構(gòu)模塊再根據(jù)小波分級信息 對近似信號和細(xì)節(jié)信號進(jìn)行重構(gòu),得到每幀信號,最后根據(jù)分幀信息將各幀順次連接起來, 無損的得到原始音頻文件。根據(jù)本發(fā)明方法的音頻無損編/解碼器系統(tǒng)其中包括編碼器子系統(tǒng)和解碼器子 系統(tǒng)兩部分。整個系統(tǒng)中采用的主要關(guān)鍵技術(shù)有基于相關(guān)的自適應(yīng)分幀技術(shù)、整型提升小 波變換技術(shù)、自適應(yīng)的線性預(yù)測編碼技術(shù)、針對幾何分布的數(shù)據(jù)的萊斯碼熵編碼技術(shù)。下面將分別介紹各個技術(shù)內(nèi)容1、基于相關(guān)的自適應(yīng)分幀技術(shù)幀一詞來自圖像,其意是將一個連續(xù)活動圖像劃為一幅幅畫面,連環(huán)畫就是一個 很好例子。在數(shù)字音頻中借用“幀”,其意是模擬信號變換為數(shù)字信號,將其數(shù)字信號分成許 多的小片段,稱這小片段為1幀。由于音頻信號中存在相當(dāng)多的突變信號,如果采用固定幀 長進(jìn)行分幀,得到的各幀內(nèi)的信號間的相關(guān)性會受到較大影響,進(jìn)而使得壓縮率降低。本發(fā)明根據(jù)相鄰幀的相關(guān)系數(shù),將相關(guān)性大的信號合并到一幀內(nèi),這樣,小波變換 和線性預(yù)測的緊致性都會提高,可以得到較高的壓縮效率。首先以最小幀長為單位,計算 當(dāng)前幀與前一幀的相關(guān)系數(shù),如果此系數(shù)小于閾值,則標(biāo)記該幀與前一幀為不相關(guān)幀,單獨(dú) 成一幀,如果此系數(shù)大于閾值,則認(rèn)為當(dāng)前幀與前一幀相關(guān)幀,將相鄰的相關(guān)幀依次合并, 但最大幀長不超過設(shè)定的最大幀長允許值,當(dāng)合并幀的長度超過設(shè)定的最大幀長時重起一 幀。采取以上的分幀策略,可以使特性一致的信號能夠在一幀內(nèi)進(jìn)行處理。2、整型小波變換技術(shù)整型小波變換是將整數(shù)映射到整數(shù)的小波變換,即輸入信號為整數(shù),變換后的小 波系數(shù)也為整數(shù),且原信號可以由逆變換精確的恢復(fù)。傳統(tǒng)小波變換以后產(chǎn)生的系數(shù)是浮 點(diǎn)數(shù),不僅計算量非常大,而且無法實現(xiàn)數(shù)據(jù)的無損壓縮。采用提升方案計算小波變換,在 提升過程中加入量化運(yùn)算就能實現(xiàn)由整數(shù)到整數(shù)的小波變換。整型小波變換在圖像壓縮領(lǐng) 域有很多的應(yīng)用,可以實現(xiàn)從有損到無損的低復(fù)雜度嵌入式編碼,然而在音頻信號的無損 壓縮還沒有很好的應(yīng)用。傳統(tǒng)的變換方法,無論是快速傅里葉變換還是小波變換,輸入信號為整數(shù),得到的 變換后的系數(shù)是浮點(diǎn)數(shù),計算機(jī)在處理時存在舍入誤差,不能實現(xiàn)數(shù)據(jù)的無損壓縮。考慮在 提升步驟中加入量化運(yùn)算,如果輸入向量X為整數(shù),則輸出y也為整數(shù),并且由y可精確地 恢復(fù)出X,需要注意的是,此處量化的作用不同于數(shù)據(jù)壓縮中的量化,該量化并不帶來信息 損失,而只是為了得到整數(shù)輸出。由于包含了量化運(yùn)算,因此整型小波變換是一種非線性變 換,這使得對整型小波變換的分析變得較為復(fù)雜。在實際應(yīng)用中,適當(dāng)?shù)剡x取量化運(yùn)算的形 式,可將整型小波變換近似的看作線性變換,以簡化分析。用多分辨率分析或者是帶通濾波器的觀點(diǎn)來看,小波分解并不限于上述的一級分 解,還可以對一級分解之后的近似信號繼續(xù)做小波分解,進(jìn)一步去除其相關(guān)性,但由于不同 信號在頻率上分布不同,采用不同的分解級數(shù)對壓縮的結(jié)果會有影響,本發(fā)明的方法根據(jù) 信號分解后的壓縮效果,自適應(yīng)的選擇級數(shù),使壓縮結(jié)果達(dá)到最佳,并將最佳的分解級數(shù)信 息記錄到邊信息中。3、自適應(yīng)的線性預(yù)測編碼技術(shù)無損音頻編碼器預(yù)測精度越高,編碼效率則越高。大多數(shù)算法通過一些改進(jìn)的線 性預(yù)測器去除冗余,這些算法將線性預(yù)測器應(yīng)用于每一幀數(shù)據(jù),產(chǎn)生預(yù)測誤差序列。預(yù)測器 的參數(shù),代表著從信號中移去的冗余,無損編碼預(yù)測器的參數(shù)和預(yù)測誤差一起代表每一幀 信號。線性預(yù)測器的基本原理是利用聲音信號的相關(guān)性,用過去的樣值x[n-l]、
x[n-2].......等來預(yù)測當(dāng)前的樣值x[n],利用過去的樣值越多則預(yù)測精度越高。再把當(dāng)
前的樣值與預(yù)測值相減取其之差(預(yù)測誤差)進(jìn)行編碼。由于預(yù)測誤差的動態(tài)范圍要遠(yuǎn)小
6于原始信號的動態(tài)范圍,這時即使仍采用原信號量化時采用的量化級,也可降低碼位進(jìn)行 編碼,進(jìn)而實現(xiàn)比特率壓縮。這種方法對于那些具有平穩(wěn)特性的聲音信號特別有效。例如 幅度起伏平緩的聲音,預(yù)測誤差會在零至很小值之間變化。如預(yù)測器運(yùn)行良好,預(yù)測誤差 e[n]是不相關(guān)的,有平坦的頻譜。同樣,e[n]的均值將比x[n]小,只要較少的數(shù)據(jù)位就可 以表示其實際值。線性預(yù)測器被廣泛地應(yīng)用于語音和音頻信號處理,大多數(shù)情況下,使用FIR濾波 器,預(yù)測濾波器A(Z)的系數(shù)決定于均方預(yù)測誤差的最小化。若不考慮量化器,F(xiàn)IR預(yù)測系 數(shù)可通過求解一組線性方程式獲得。若在無損音頻壓縮中使用FIR濾波器,則系數(shù)可通過 確定的步驟求得然后進(jìn)行量化,在解碼端中利用同樣的系數(shù)由e [η]重建χ[η]。由于必須完 全無損的重構(gòu)原始信號,所以,預(yù)測系數(shù)(即LPC參數(shù))必須進(jìn)行量化并編碼,以作為無損 音頻編碼的一部分。通常,為了使預(yù)測器適應(yīng)信號的變化,分幀后的每一幀須確定一組新的 預(yù)測系數(shù)。4、針對幾何分布的數(shù)據(jù)的萊斯碼熵編碼技術(shù)數(shù)據(jù)壓縮技術(shù)的理論基礎(chǔ)就是信息論。信息論中的信源編碼理論解決的主要問 題(1)數(shù)據(jù)壓縮的理論極限(2)數(shù)據(jù)壓縮的基本途徑。根據(jù)信息論的原理,可以找到最 佳數(shù)據(jù)壓縮編碼的方法,數(shù)據(jù)壓縮的理論極限是信息熵。信息熵為信源的平均信息量(不 確定性的度量)。如果要求編碼過程中不丟失信息量,即要求保存信息熵,這種信息保持編 碼叫熵編碼,熵編碼(entropy encoding)是一類利用數(shù)據(jù)的統(tǒng)計信息進(jìn)行壓縮的無語義 數(shù)據(jù)流的無損編碼它是根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的,在這個過程中,可以移去 誤差信號中的冗余。而沒有信息丟失。經(jīng)常使用的熵編碼方式有行程編碼(RLE)、香農(nóng) (Shannon)編碼、哈夫曼(Huffman)編碼和算術(shù)編碼(arithmetic coding)。熵編碼是一種 無損的信源編碼,熵編碼的作用是移去預(yù)測誤差信號中的冗余信息,在這個過程中,沒有數(shù) 據(jù)信息的丟失。由于殘差信號的信源服從幾何分布,所以采用Rice編碼來對殘差信號進(jìn)行 編碼。Rice編碼是一個信源為Laplace分布的哈夫曼編碼,只有一個參數(shù)k,事實上,聲 道內(nèi)去相關(guān)操作中的預(yù)測誤差信號都近似于Laplace概率密度分布。Rice編碼由三部分組 成①符號位,②k位低階碼;③保留的高階位。碼字的第一部分表示e[n]的符號;第二部 分包含|e[n] I的二進(jìn)制碼的低k個有效位,第三部分由N個連零構(gòu)成,這里N是|e[n] |剩 余有效位的二進(jìn)制代表值,N個連零后插入1作為分隔符。假定對整數(shù)η進(jìn)行Rice,則編碼步驟為(1)符號位(1代表正,0代表負(fù))(2)n/(2k)個連零(3)分隔位 1(4) η的后k位有效位我們做了兩組實驗來比較本文所描述的無損壓縮編碼算法與MPEG ALS(RM22)以 及FLAC兩種無損編碼格式進(jìn)行了比較。第一組實驗我們選擇了十三種不同的音樂風(fēng)格來進(jìn)行無損音頻壓縮,已證明該編 碼器對于不同音質(zhì)的音頻信號都可以取得較好的壓縮性能。不同風(fēng)格的音頻文件壓縮結(jié)果比較
權(quán)利要求
一種基于整形小波變換的音頻無損壓縮編碼方法,其步驟為1)分幀模塊對輸入的音頻信號進(jìn)行分幀處理,將分幀信息納入邊信息;2)整型小波變換模塊對分幀后的每一幀進(jìn)行小波變換得到近似信號、細(xì)節(jié)信號和分級信息,并將分級信息納入邊信息;3)線性預(yù)測編碼模塊對近似信號和細(xì)節(jié)信號進(jìn)行線性預(yù)測,得到殘差信號和LPC參數(shù),并將LPC參數(shù)納入邊信息;4)熵編碼模塊對殘差信號進(jìn)行熵編碼得到熵編碼流,同時將熵編碼的碼本信息納入邊信息;5)比特流形成模塊將邊信息和熵編碼流復(fù)用形成最終的壓縮碼流。
2.如權(quán)利要求1所述的方法,其特征在于所述整型小波變換模塊為整型提升小波變換 模塊。
3.如權(quán)利要求2所述的方法,其特征在于所述整型提升小波變換模塊為四次提升變換 的整型小波變換模塊。
4.如權(quán)利要求1或2所述的方法,其特征在于采用自適應(yīng)級數(shù)選擇方法確定所述分級fn息ο
5.如權(quán)利要求ι所述的方法,其特征在于所述分幀模塊根據(jù)相鄰幀的相關(guān)系數(shù),將相 關(guān)性大的信號合并到一幀內(nèi),進(jìn)行分幀處理。
6.如權(quán)利要求5所述的方法,其特征在于所述分幀模塊首先以最小幀長為單位,計算 當(dāng)前幀與前一幀的相關(guān)系數(shù);如果此系數(shù)小于設(shè)定閾值,則將當(dāng)前幀單獨(dú)分為一幀;否則 將當(dāng)前幀與前一幀標(biāo)記為相關(guān)幀,然后將相鄰的相關(guān)幀依次合并構(gòu)成一幀。
7.如權(quán)利要求6所述的方法,其特征在于設(shè)定一最大幀長閾值,當(dāng)合并幀的幀長達(dá)到 設(shè)定的最大幀長閾值時重起一幀進(jìn)行分幀。
8.如權(quán)利要求1所述的方法,其特征在于所述熵編碼模塊采用萊斯碼編碼方法對殘差 信號進(jìn)行熵編碼。
9.一種基于整形小波變換的音頻無損壓縮解碼方法,其步驟為1)比特流分離模塊從壓縮碼流中解碼出邊信息,并從邊信息中分離出熵編碼的碼本、 LPC參數(shù)、分級信息和分幀信息;2)熵解碼模塊根據(jù)熵編碼的碼本信息對壓縮碼流進(jìn)行熵解碼,得到殘差信號;3)LPC重構(gòu)模塊利用LPC參數(shù)從殘差信號中解得小波分解的近似信號和細(xì)節(jié)信號;4)整型小波重構(gòu)模塊根據(jù)分級信息對近似信號和細(xì)節(jié)信號進(jìn)行重構(gòu),得到每幀信號;5)合并幀模塊根據(jù)分幀信息將各幀順次連接起來,得到原始音頻信號。
10.如權(quán)利要求9所述的方法,其特征在于所述整型小波重構(gòu)模塊為整型提升小波重 構(gòu)模塊。
全文摘要
本發(fā)明公開了一種音頻無損壓縮編碼、解碼方法,屬于信源編、解碼領(lǐng)域。本方法根據(jù)信號前后幀的相關(guān)情況自適應(yīng)對信號進(jìn)行分幀,分幀后的一幀信號是信號特性相近的信號組合,使得編碼器能獲得到更好的壓縮效率,為后面的整型小波變換和線性預(yù)測編碼帶來好處。對于無損壓縮編碼來說,應(yīng)該對于信號可以完全的重構(gòu),所以采用整型提升小波變換來保證信號的完全可重構(gòu)特性。與現(xiàn)有技術(shù)相比,本發(fā)明在引入了基于相關(guān)的自適應(yīng)分幀模塊和基于整型提升小波的去相關(guān)模塊后,原始信號中的冗余信息可以被更好的去相關(guān),生成的壓縮數(shù)據(jù)中所含有的冗余信息更少,所以本發(fā)明可以用很小的計算復(fù)雜度代價換來了較大的壓縮比提高。
文檔編號G10L19/04GK101944362SQ20101028103
公開日2011年1月12日 申請日期2010年9月14日 優(yōu)先權(quán)日2010年9月14日
發(fā)明者何文欣, 吳璽宏, 張搏, 曲天書, 遲惠生, 高懿 申請人:北京大學(xué)