基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼系統(tǒng)及方法
【專利摘要】本發(fā)明提供一種基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼系統(tǒng)及方法,包括基于能量、頻率和空間信息綜合計(jì)算各子帶的子帶重要性測(cè)度并排序,根據(jù)綜合測(cè)度的排序結(jié)果進(jìn)行比特分配、殘差量化編碼,對(duì)子帶排序編號(hào)的編碼結(jié)果和殘差量化編碼都加入碼流。本發(fā)明根據(jù)能量、頻率和空間信息作為子帶優(yōu)先級(jí)分配策略,相比單純利用能量或頻率作為感知測(cè)度具有更明顯的指導(dǎo)意義。
【專利說(shuō)明】基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻編碼【技術(shù)領(lǐng)域】,尤其涉及一種基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼系統(tǒng)及方法。
【背景技術(shù)】
[0002]現(xiàn)有的可分級(jí)編碼方法中主要根據(jù)高能量和低頻率成分優(yōu)先的準(zhǔn)則作為可分級(jí)子帶重要性測(cè)度劃分的依據(jù)。然而,簡(jiǎn)單通過(guò)能量或頻率成分的高低并不能確定最重要的聲音對(duì)象所在的子帶。在頻域子帶中,能量高的子帶或低頻子帶并不一定對(duì)應(yīng)著最重要的聲音對(duì)象所在的子 帶。除了能量和頻率以外,空間位置信息也可用于確定重點(diǎn)的聲音對(duì)象。點(diǎn)聲源或類似點(diǎn)聲源通常具有明確的空間位置信息,往往是需要重點(diǎn)關(guān)注的聲音對(duì)象,而環(huán)境聲或噪聲等聲源,往往不具備明確的空間位置信息,在分級(jí)編碼中可以分配更少的優(yōu)先級(jí)?,F(xiàn)有的雙聲道可分級(jí)編碼方法,在確定下混聲道子帶重要性測(cè)度時(shí),單純以下混聲道的子帶能量或頻率成分來(lái)確定子帶分級(jí)編碼的優(yōu)先級(jí),由于下混聲道中缺失聲道間的相關(guān)性以及聲源的空間位置信息等,如果僅僅根據(jù)下混聲道的能量或頻率的高低來(lái)確定最重要聲源對(duì)應(yīng)的子帶,這樣或多或少會(huì)導(dǎo)致編碼一些重要的具有高關(guān)注的或具有明確位置信息的聲源時(shí)帶來(lái)質(zhì)量的損失。因此,若能提供一種分級(jí)音頻編碼方法結(jié)合聲源的空間位置信息來(lái)確定頻域子帶的重要性,重點(diǎn)關(guān)注聲音信號(hào)中需要重點(diǎn)編碼的聲音對(duì)象,從而提高具有明確位置的、具有高關(guān)注的重要聲音的編碼質(zhì)量,對(duì)音頻編碼領(lǐng)域具有重要實(shí)際意義。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是提供一種基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼系統(tǒng)及方法,使得頻率子帶重要性測(cè)度更加反映雙聲道信號(hào)中需要重點(diǎn)關(guān)注和編碼的聲音對(duì)象。
[0004]為達(dá)到上述目的,本發(fā)明提供一種基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼系統(tǒng),包括以下模塊:
[0005]預(yù)處理模塊,用于對(duì)雙聲道輸入信號(hào)進(jìn)行預(yù)處理,得到兩個(gè)聲道的當(dāng)前幀的音頻信號(hào)S1和S1^并做三路輸出,一路輸出給核心編碼器模塊,一路輸出給殘差提取模塊,一路輸出給時(shí)頻變換模塊;
[0006]核心編碼器模塊,用于對(duì)從預(yù)處理模塊輸入的音頻信號(hào)S1和&進(jìn)行編碼,編碼結(jié)果分作兩路,其中一路作為碼流的一部分輸出給解碼端;一路解碼得到兩個(gè)聲道的重構(gòu)信號(hào)和I輸出給殘差提取模塊;
[0007]殘差提取模塊,用于根據(jù)從預(yù)處理模塊輸入的音頻信號(hào)81和&和從核心編碼器模塊輸入的重構(gòu)信號(hào)八和^,得到兩個(gè)聲道的殘差信號(hào)O1和,er =Sr-Sr,對(duì)殘差信號(hào)ei和^進(jìn)行時(shí)頻變換得到兩個(gè)聲道的殘差頻譜系數(shù)efl和e&,下混為和聲道sum
和差聲道diff, sim=-(efl +e/r) cliff =孑-efr)對(duì)sum和diff進(jìn)行頻譜子帶劃分,將所得
_ ? — ,和聲道和差聲道各個(gè)子帶的頻譜系數(shù)sum(i)和diff(i)分兩路輸出,一路輸出給殘差量化編碼模塊,一路輸出給比特分配模塊,i取值1,2,…,N,子帶數(shù)N > I ;
[0008]時(shí)頻變換模塊,用于對(duì)從預(yù)處理模塊輸入的音頻信號(hào)S1和\進(jìn)行時(shí)頻變換,得到頻譜系數(shù)X1和輸出給子帶劃分模塊;
[0009]子帶劃分模塊,用于對(duì)時(shí)頻變換模塊輸入的頻譜系數(shù)X1和&進(jìn)行子帶劃分,得到兩個(gè)聲道的子帶頻譜系數(shù)X1 (i)和\(i),輸出給基于空間關(guān)注的子帶重要性測(cè)度模塊;
[0010]基于空間關(guān)注的子帶重要性測(cè)度模塊,用于根據(jù)從子帶劃分模塊輸入的兩個(gè)聲道的子帶頻譜系數(shù)X1 (i)和\(i),基于能量、頻率和空間信息綜合計(jì)算各子帶的子帶重要性測(cè)度nPi,按照子帶重要性從高到低對(duì)N個(gè)子帶進(jìn)行排序,記子帶i的排序所得編號(hào)為pSi,得到最后的子帶排序編號(hào)Psi = {psl, P52,..., Psm, pSN}并做兩路輸出,一路輸出給子帶測(cè)度編碼模塊,一路輸出給比特分配模塊;
[0011]子帶測(cè)度編碼模塊,用于對(duì)從基于空間關(guān)注的子帶重要性測(cè)度模塊輸入的子帶排序編號(hào)Pgi = iPsi? Ps2>...) Ps(N-D) Psn^進(jìn)7TT摘編碼,將編碼結(jié)果作為碼流的一部分輸出給解碼端;
[0012]比特分配模塊,用于根據(jù)從殘差提取模塊輸入的頻譜系數(shù)sum⑴和diff (i),按照從基于空間關(guān)注的子帶重要性測(cè)度模塊輸入的排序后的子帶編號(hào)P ={Pl, P2,, p(n-d,pn}對(duì)每個(gè)子帶進(jìn)行比特?cái)?shù)的分配,將分配的比特?cái)?shù)輸出給殘差量化編碼模塊;
[0013]殘差量化編碼模塊,用于按照從基于空間關(guān)注的子帶重要性測(cè)度模塊輸入的排序后的子帶編號(hào)P = {Pl, P2,, p(n-d,pJ,以子帶重要性測(cè)度由大到小的順序依次取一個(gè)子帶,對(duì)從殘差提取模塊輸入的該子帶的頻譜系數(shù)sum(i)和diff(i),按比特分配模塊所得該子帶分配的比特?cái)?shù)進(jìn)行球型矢量量化編碼,直到編碼器給定傳輸碼率下可用的所有編碼比特?cái)?shù)用完,將編碼結(jié)果作為碼流的一部分輸出給解碼端。
[0014]而且,所述基于空間關(guān)注的子帶重要性測(cè)度模塊包括方位感知測(cè)度模塊、距離感知測(cè)度模塊、能量感知測(cè)度模塊、頻率感知測(cè)度模塊和子帶空間關(guān)注模塊,
[0015]方位感知測(cè)度模塊,用于根據(jù)子帶劃分模塊所得兩個(gè)聲道的各個(gè)子帶的頻譜系數(shù)
X1(I)和\(i),計(jì)算出各個(gè)子帶的聲道間強(qiáng)度差
【權(quán)利要求】
1.一種基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼系統(tǒng),其特征在于,包括以下模塊: 預(yù)處理模塊,用于對(duì)雙聲道輸入信號(hào)進(jìn)行預(yù)處理,得到兩個(gè)聲道的當(dāng)前幀的音頻信號(hào)S1和S1^并做三路輸出,一路輸出給核心編碼器模塊,一路輸出給殘差提取模塊,一路輸出給時(shí)頻變換模塊; 核心編碼器模塊,用于對(duì)從預(yù)處理模塊輸入的音頻信號(hào)S1和&進(jìn)行編碼,編碼結(jié)果分作兩路,其中一路作為碼流的一部分輸出給解碼端;一路解碼得到兩個(gè)聲道的重構(gòu)信號(hào)^和I輸出給殘差提取模塊; 殘差提取模塊,用于根據(jù)從預(yù)處理模塊輸入的音頻信號(hào)81和\和從核心編碼器模塊輸入的重構(gòu)信號(hào)$;和L ?得到兩個(gè)聲道的殘差信號(hào)eJP ey ^ I =S1-Sl , er =Sr-Sr,對(duì)殘差信號(hào)ei和^進(jìn)行時(shí)頻變換得到兩個(gè)聲道的殘差頻譜系數(shù)efl和e&,下混為和聲道sum和差 I1:聲道diff, mn^-(etl+efr) diff=^ej^efr)對(duì)sum和diff進(jìn)行頻譜子帶劃分,將所得和聲
5,道和差聲道各個(gè)子帶的頻譜系數(shù)sum(i)和diff(i)分兩路輸出,一路輸出給殘差量化編碼模塊,一路輸出給比特分配模塊,i取值1,2,…,N,子帶數(shù)N > I ; 時(shí)頻變換模塊,用于對(duì)從預(yù)處理模塊輸入的音頻信號(hào)S1和\進(jìn)行時(shí)頻變換,得到頻譜系數(shù)X1和輸出給子帶劃分模塊; 子帶劃分模塊,用于對(duì)時(shí)頻變換模塊輸入的頻譜系數(shù)X1和&進(jìn)行子帶劃分,得到兩個(gè)聲道的子帶頻譜系數(shù)X1 (i)和\(i),輸出給基于空間關(guān)注的子帶重要性測(cè)度模塊; 基于空間關(guān)注的子帶重要性測(cè)度模塊,用于根據(jù)從子帶劃分模塊輸入的兩個(gè)聲道的子帶頻譜系數(shù)X1 (i)和\(i),基于能量、頻率和空間信息綜合計(jì)算各子帶的子帶重要性測(cè)度nPi,按照子帶重要性從高到低對(duì)N個(gè)子帶進(jìn)行排序,記子帶i的排序所得編號(hào)為Psi,得到最后的子帶排序編號(hào)Psi = {Psi, Ps2....,Ps(N-1).PsnI并做兩路輸出,一路輸出給子帶測(cè)度編碼模塊,一路輸出給比特分配模塊; 子帶測(cè)度編碼模塊,用于對(duì)從基于空間關(guān)注的子帶重要性測(cè)度模塊輸入的子帶排序編號(hào)Pgi = iPsi) Ps2>...) Ps(N-D) Psn^進(jìn)7TT摘編碼,將編碼結(jié)果作為碼流的一部分輸出給解碼端; 比特分配模塊,用于根據(jù)從殘差提取模塊輸入的頻譜系數(shù)sum(i)和diff (i),按照從基于空間關(guān)注的子帶重要性測(cè)度模塊輸入的排序后的子帶編號(hào)P = {Pl, P2,, Pori), PnI對(duì)每個(gè)子帶進(jìn)行比特?cái)?shù)的分配,將分配的比特?cái)?shù)輸出給殘差量化編碼模塊; 殘差量化編碼模塊,用于按照從基于空間關(guān)注的子帶重要性測(cè)度模塊輸入的排序后的子帶編號(hào)P = {Pl, P2,, p(n-d,pJ,以子帶重要性測(cè)度由大到小的順序依次取一個(gè)子帶,對(duì)從殘差提取模塊輸入的該子帶的頻譜系數(shù)sum(i)和diff(i),按比特分配模塊所得該子帶分配的比特?cái)?shù)進(jìn)行球型矢量量化編碼,直到編碼器給定傳輸碼率下可用的所有編碼比特?cái)?shù)用完,將編碼結(jié)果作為碼流的一部分輸出給解碼端。
2.根據(jù)權(quán)利要求1所述基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼系統(tǒng),其特征在于:所述基于空間關(guān)注的子帶重要性測(cè)度模塊包括方位感知測(cè)度模塊、距離感知測(cè)度模塊、能量感知測(cè)度模塊、頻率感知測(cè)度模塊和子帶空間關(guān)注模塊,方位感知測(cè)度模塊,用于根據(jù)子帶劃分模塊所得兩個(gè)聲道的各個(gè)子帶的頻譜系數(shù)X1(I)和\(i),計(jì)算出各個(gè)子帶的聲道間強(qiáng)度差
3.一種基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼方法,其特征在于,包括以下步驟:步驟1,對(duì)雙聲道輸入信號(hào)進(jìn)行預(yù)處理,得到兩個(gè)聲道的當(dāng)前幀的音頻信號(hào)S1和& ;步驟2,對(duì)步驟I所得音頻信號(hào)S1和&進(jìn)行編碼,編碼結(jié)果分作兩路,其中一路作為碼流的一部分輸出給解碼端,一路解碼得到兩個(gè)聲道的重構(gòu)信號(hào)夂和I I 步驟3,根據(jù)步驟I所得音頻信號(hào)S1和&和步驟2所得重構(gòu)信號(hào)和夂,得到兩個(gè)聲道的殘差信號(hào)O1和er, e; =S1-Λ% ? er =.v, - Sr,對(duì)殘差信號(hào)O1和進(jìn)行時(shí)頻變換得到兩個(gè)聲道的殘差頻譜系數(shù)efl和,下混為和聲道sum和差聲道diff,
4.根據(jù)權(quán)利要求3述基于子帶空間關(guān)注測(cè)度的可分級(jí)音頻編碼方法,其特征在于:步驟6進(jìn)一步包括以下子步驟, 步驟6.1,根據(jù)步驟5所得兩個(gè)聲道的各個(gè)子帶的頻譜系數(shù)&(1)和\(i),計(jì)算出各個(gè)子帶的聲道間強(qiáng)度差
【文檔編號(hào)】G10L19/002GK103928030SQ201410181636
【公開(kāi)日】2014年7月16日 申請(qǐng)日期:2014年4月30日 優(yōu)先權(quán)日:2014年4月30日
【發(fā)明者】胡瑞敏, 高麗, 楊玉紅, 王曉晨, 涂衛(wèi)平, 高戈, 董石, 王松, 李登實(shí), 張茂勝, 楊乘, 姜林 申請(qǐng)人:武漢大學(xué)