基于IntMDCT的無損音頻編碼方法、解碼方法
【專利摘要】本發(fā)明提供一種基于IntMDCT的無損音頻編碼方法、解碼方法,該編碼方法包括以下步驟:(1)將音頻時域信號x(k)進行分幀,讀取得到單幀時域信號x(k),k=0,...,N-1,N為幀長;(2)對時域信號進行IntMDCT變換,得到頻域信號X(m),m=0,...,N-1;(3)對頻域信號進行Rice編碼得到編碼碼流;該解碼方法是編碼方法的逆過程,首先對輸入的碼流文件進行Rice解碼,得到頻域信號X(m),m=0,...,N-1,然后再進行IntMDCT的逆變換恢復出時域信號x(k),k=0,...,N-1。本發(fā)明不需要碼表即能自適應得到編碼參數,且壓縮率值比塊自適應Rice更低,適用范圍更廣。
【專利說明】基于IntMDCT的無損音頻編碼方法、解碼方法
【技術領域】
[0001] 本發(fā)明涉及無損音頻編、解碼領域,尤其是涉及一種基于IntMDCT的無損音頻編 碼方法、解碼方法。
【背景技術】
[0002] 無損音頻編碼是指對音頻信號進行編碼來降低數據量并獲得低比特率,不考慮任 何信息損失的情況,接收端能夠毫無差錯的解碼出來。
[0003] 國際上通常使用的無損音頻編碼框架主要包含兩個步驟:預測/變換和熵編碼。 預測/變換實質上是去除音頻信號的時間和空間上的相關性;而熵編碼是去除音頻信號間 的統(tǒng)計相關性。
[0004]目前兩種主流的去相關技術主要有預測和變換。其中,預測是比較常用的方法。預 測技術對于音頻編碼具有一定不足。許多音頻片段會周期性出現同樣的音調,這種情況下, 低階預測器不能有效進行預測,然而使用高階預測器也不能完全解決這一問題,因為僅使 用一幀音頻信號通常不足以得到最佳的預測系數,并且音頻信號常常同時伴有多個音調, 即使使用針對語音信號性能比較好的預測器也不會有所改善。在頻域編碼方面,提出了子 帶編碼和變換編碼等技術。變換技術用于無損音頻編碼相對較晚,也得到比較優(yōu)異的壓縮 率,但是大多數無損音頻編碼器仍使用線性預測技術較多,目前僅有LTAC、MPEG-4SLS以及 一些無損音頻編碼對變換編碼技術進行研究。
[0005] 數字音頻編碼技術一般使用的熵編碼方法有:游程編碼(RLC,RunLength Coding,也稱行程編碼),霍夫曼Huffman編碼,算術編碼以及由Huffman演變而來的 Golomb/Rice編碼,其中Huffman應用范圍最廣。Rice編碼算法是由RobertF.Rice于 1979年提出的熵編碼算法,它針對Golomb編碼的一種特殊情況即m= 2k,(k= 0, 1,...) 提出了比較方便且性能較好的編碼方法。Rice編碼對于Laplacian拉普拉斯分布及幾何 的概率參數P已知的情況下確實是一種最優(yōu)碼,但事實上,Rice編碼仍存在問題:概率參 數P必須已知,最優(yōu)碼的編碼參數s才能確定,但是實際上并不能對整個信源進行充分估 計得到最適合的P,進而得到最優(yōu)Rice編碼參數s,因此P的確定直接影響著Rice編碼 的效果。目前Rice編碼主要有兩種自適應編碼方法:前向自適應和后向自適應。把前向 自適應編碼定義為:編碼器在編碼前先考察數據并測量統(tǒng)計編碼參數(通常是平均值),然 后將參數值放入首部以供解碼器使用,最后再使用該參數對數據編碼并寫入比特流文件。 通常,并不是要同時編碼所有數據,因為其帶來的延時和復雜度是實時應用中不能承受的。 一般使用的方法是"塊自適應"編碼,即將數據分成小部分,即塊,并制定一些塊選擇規(guī)則, 比如在SHORTEN、MPEG-4ALS中,對于每個塊,首先計算輸入數據的平均值iin,并使用式 .V=[jog2iuM +C」(其中常數C^ 0. 97)來估算Rice編碼參數s,然后使用參數s對塊內數 據值編碼,即對于與緩沖區(qū)內容相匹配的數據部分統(tǒng)計得到參數,并將編碼器調整到該參 數。但是前向自適應在實際應用中存在一定問題,歸結為以下兩點:
[0006] (1)編碼器需要兩次通過每個數據,這在一些應用中會減慢編碼過程或增加隨機 存取存儲器的開銷,比如數碼相機中的圖像編碼;
[0007] (2)選取合適的塊長度尺寸比較困難,如果塊尺寸太大,則統(tǒng)計量在塊內會劇烈變 化,而如果太小,則必須告知解碼器哪個參數用于編碼使得額外開銷變得難以承擔。
[0008] 另外,有研究分析并總結后向自適應編碼方法為,在編碼之后使用一定自適應機 制對參數進行調整,然后直接用調整后的參數對下一數據進行編碼。后向自適應編碼方法 雖然能避免以上前向自適應存在的問題,但是后向自適應編碼效果帶有一些不確定性,這 是由于編碼后的參數調整機制不可能適合所有信源變化情況;后向自適應編碼只適用于快 速衰減的分布,而對于重尾分布并不是最優(yōu)碼。
[0009] 可見,國際上常用的無損音頻編、解碼方法都存在缺陷,因而有必要對其進行進一 步研究。
【發(fā)明內容】
[0010] 本發(fā)明的目的在于:針對現有技術存在的問題,提供一種基于壓縮性能更好的 IntMDCT的無損音頻編碼方法、解碼方法。
[0011] 本發(fā)明的發(fā)明目的通過以下技術方案來實現:
[0012] 一種基于IntMDCT的無損音頻編碼方法,其特征在于,該編碼方法包括以下步 驟:
[0013] (1)將音頻時域信號X(k)進行分巾貞,讀取得到單幀時域信號x(k),k= 0,...,N-1,N為幀長;
[0014]⑵對時域信號進行IntMDCT變換,得到頻域信號X(m),m= 0,…,N-I;
[0015] (3)對頻域信號進行Rice編碼得到編碼碼流。
[0016] 優(yōu)選的,所述對時域信號進行IntMDCT變換的方法包括步驟:
[0017] (21)對時域信號進行窗運算/時域混疊消除;
[0018] (22)對前步驟處理后的數據進行DCT-IV變換。
[0019] 優(yōu)選的,步驟(21)中窗運算使用的窗函數為正弦窗,則對時域信號進行窗運算的 公式為
【權利要求】
1. 一種基于IntMDCT的無損音頻編碼方法,其特征在于,該編碼方法包括以下步驟: (1) 將音頻時域信號X(k)進行分幀,讀取得到單幀時域信號X(k),k= 0, ...,N-I,N為 中貞長; (2) 對時域信號進行IntMDCT變換,得到頻域信號X(m),m= 0, ...,N-I; (3) 對頻域信號進行Rice編碼得到編碼碼流。
2. 根據權利要求1所述的無損音頻編碼方法,其特征在于,所述對時域信號進行 IntMDCT變換的方法包括步驟: (21) 對時域信號進行窗運算/時域混疊消除; (22) 對前步驟處理后的數據進行DCT-IV變換。
3. 根據權利要求2所述的無損音頻編碼方法,其特征在于,步驟(21)中窗運算使用的 窗函數為正弦窗,則對時域信號進行窗運算的公式為:
利用該公式進行相鄰兩次窗運算,前一次窗運算的輸出序列為X'(〇),...,X'(N-I),當前幀窗運算的輸出序列為X'(N),...,x'(2N-1),則組合前一次窗運算的后半段輸出序 列和當前次窗運算的前半段輸出序列,然后將此組合的N點序列乘以-1并反序,得到新序 列:―+ #-1),-.M+#-2),…,-ι(Λα-x(/V-1),….r(f),然后再對此新序列進行 2 Z 2 DCT-IV變換;同時,當前窗運算輸出的后半段需要存儲起來供下次DCT-IV變換使用。
4. 根據權利要求3所述的無損音頻編碼方法,其特征在于,將半塊N/2個"0"值樣點 和第一塊的前半塊N/2個樣點組合成N點,將最后一塊的后半塊N/2個樣點和半塊N/2個 "〇"值樣點組合成N點。
5. 根據權利要求2所述的無損音頻編碼方法,其特征在于,DCT-IV變換的公式為: x(m)= X(k) V4N
6. 根據權利要求5所述的無損音頻編碼方法,其特征在于,在IntMDCT中,所有 運算都首先被分解為Givens旋轉,然后對Givens旋轉進行一系列的提升,且每次 提升后都有一次取整操作以保證變換的可逆性,其中,DCT-IV變換的提升公式為: Χ= 〇'.Χ,式中,X=IxGOlkmpX= ?〇1〇}1^〇,1,...|1,€4¥為00'-1¥變換核 ; ?v(Isa 0Yiv2H2YIv2 〇 -Y-D、,zK2Ylsi2Ο) =Iνι-->2 2 vz2 -、2Pn ,該式中, 、^h1IxlAoIxiAh,+κ,Iv2AoLv2人κ,IwJ 乂八卞, = ,K2=C^zVi,K,:拉5.0、.,2 + 1站其中 Cf/2代表變換長度為N/2的DCT-IV矩陣,B
J
7. 根據權利要求1所述的無損音頻編碼方法,其特征在于,對頻域信號進行Rice編碼 時,采用帶閾值的點自適應Rice編碼方法,包括步驟: (31) 對輸入的數據X,編碼參數為s,令商q和余數r分別為:f= $ ,r=x-q*2s; Ag (32) 寫符號位:若x彡0,則為"0",反之,則為" 1";對r編碼:用s位進行二進制表示; 對q編碼:采用TH-Rice對q進行閾值處理,若q>TH,經過TH-Rice后得到的高階比特位 MSBs=TH+2 · 0,若q彡TH,經過TH-Rice后得到的高階比特位MSBs=q+Ι,其中TH為一 個事先設定好的常量; (33) 對r編碼得到的比特位數定為低階比特位LSBs,且LSBs=s;然后將符號位、低 階比特位LSBs、高階比特位MSBs組合在一起,即完成數據X的編碼。
8. 根據權利要求7所沭的無損咅頻編碼方法,其特征在于,編碼參數為s的計算公式:
.其中,BN(Xi)代表Xi的二進制位數,HI 為一個事先設定好的常量。
9. 根據權利要求8所述的無損音頻編碼方法,其特征在于,所述HI= 19,所述TH= 3。
10. -種基于IntMDCT的無損音頻解碼方法,其特征在于,該解碼方法是編碼方法的逆 過程,首先對輸入的碼流文件進行Rice解碼,得到頻域信號X(m),m= 0, ...,N-I,然后再進 行IntMDCT的逆變換恢復出時域信號X(k),k= 0, · · ·,N-I。
【文檔編號】G10L19/02GK104318926SQ201410514084
【公開日】2015年1月28日 申請日期:2014年9月29日 優(yōu)先權日:2014年9月29日
【發(fā)明者】宋玉齡 申請人:四川九洲電器集團有限責任公司