專利名稱:對多聲道信號的聲道延遲參數(shù)進行修正的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種對多聲道信號的聲道延遲參數(shù) 進行修正的方法和裝置。
背景4支術(shù)
多聲道信號有著廣泛的應(yīng)用場景,如電話會議,游戲等,多聲道信號的
編解碼也越來越受到重視?;诓ㄐ尉幋a的傳統(tǒng)的編碼器,如MPEG (Moving Pictures Experts Group,動態(tài)圖4象專家組)-LII, mp3 (Moving Picture Experts Group Audio Layer III,動態(tài)影像專家壓縮標準音頻層面3) 和AAC (Advanced Audio Coding,高級音頻編碼),在對多聲道信號進行編 碼時,都是對每一個聲道進行獨立編碼。這種編碼方法雖然能較好的恢復(fù)出 多聲道信號,但是需要的帶寬、編碼碼率是單聲道信號的數(shù)倍。
立體聲或多聲道編碼技術(shù)是參數(shù)立體聲編碼,其利用很少的帶寬就可以 重建出聽覺感受完全和原始信號相同的多聲道信號。參數(shù)立體聲編碼的基本 思路是在編碼端,將多聲道信號下混成一個單聲道信號,并對該單聲道信 號進行獨立編碼,同時提取各聲道間的聲道參數(shù),再對這些聲道參數(shù)進行編 碼。在解碼端,首先解碼出下混后的單聲道信號,然后解碼出各個聲道間的 聲道參數(shù),最后利用這些聲道參數(shù)與下混后的單聲道信號一起合成出多聲道 信號。
在參數(shù)立體聲編碼中,通常用來描述各聲道間相互關(guān)系的聲道參數(shù)有聲 道間時間差參數(shù)(即聲道延遲參數(shù))、聲道間幅度差參數(shù)及聲道間相關(guān)性參數(shù)等。上述聲道延遲參數(shù)代表了聲道間的延時關(guān)系,對說話人的位置定位有 著重要的作用。
以立體聲信號為例,現(xiàn)有技術(shù)中的一種傳輸多聲道信號的方案為利用
立體聲的左右聲道信號的相關(guān)性來提取左右聲道之間的聲道延遲參數(shù),利用 該聲道延遲參數(shù),在編碼端對需要傳輸?shù)牧Ⅲw聲信號的左/右聲道信號進行延 時調(diào)整,消除兩個聲道之間的延時差別。然后,對延時調(diào)整后的左/右聲道信
號在時域相加得到下混后的M信號(和信號),對延時調(diào)整后的左/右聲道信 號在時域相減得到下混后的S信號(邊信號)。
然后,根據(jù)上述M信號和S信號,提取其它聲道參數(shù),如左右聲道之間的 能量比率或者聲道間幅度差參數(shù)等,在編碼端,對上述聲道參數(shù)進行編碼傳 輸,并對M信號按照單聲道方式進行編碼傳輸。在解碼端首先重構(gòu)出M信號, 然后根據(jù)接收到的上述聲道延遲參數(shù),對M信號的各聲道進行和編碼端相逆 的延時操作,重構(gòu)出上述傳輸?shù)牧Ⅲw聲信號。從而實現(xiàn)在傳輸單聲道信號的 基礎(chǔ)上,只需要少量的碼率資源傳輸聲道參數(shù),就可以在解碼端重構(gòu)出立體 聲信號。
在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題現(xiàn)有 技術(shù)中下混處理后得到的處理信號(包括M信號、S信號)可能出現(xiàn)梳狀濾 波效應(yīng),即M信號和S信號中至少一個信號的某些特定頻帶內(nèi)的信號頻域幅值 會被很大地衰減,某些特定頻帶內(nèi)的信號頻域幅值會被加強。上述梳狀濾波 效應(yīng)將使得處理信號的質(zhì)量下降,進而影響到重構(gòu)的多聲道信號的質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明的實施例提供了 一種對多聲道信號的聲道延遲參數(shù)進行修正的方 法和裝置,以減弱由于梳狀濾波效應(yīng)導(dǎo)致的處理信號的質(zhì)量不好的現(xiàn)象。
本發(fā)明實施例提出了一種對多聲道信號的聲道延遲參數(shù)進行修正的方 法,包括對多聲道信號進行下混處理獲得處理信號; 計算所述處理信號的能量分布;
根據(jù)所述處理信號的能量分布,判斷所述處理信號是否出現(xiàn)了梳狀濾波 效應(yīng),如果是,則對所述多聲道信號的聲道延遲參數(shù)進行修正。
本發(fā)明實施例提出了一種對多聲道信號的聲道延遲參數(shù)進行修正的裝 置,包括
下混處理模塊,用于對多聲道信號進行下混處理獲得處理信號; 能量分布獲取模塊,用于計算所述處理信號的能量分布; 判斷模塊,用于根據(jù)所述處理信號的能量分布,判斷所述處理信號是否 出現(xiàn)了^f危狀濾波效應(yīng);
聲道延遲參數(shù)修正模塊,用于當所述判斷模塊判定所述處理信號出現(xiàn)了 梳狀濾波效應(yīng)時,對所述多聲道信號的聲道延遲參數(shù)進行修正。
由上述本發(fā)明的實施例提供的技術(shù)方案可以看出,本發(fā)明實施例根據(jù)多 聲道信號下混處理后獲得的處理信號的能量分布,判斷是否出現(xiàn)了梳狀濾波 效應(yīng),當確定出現(xiàn)了梳狀濾波效應(yīng)后,則對所述多聲道信號的聲道延遲參數(shù) 進行修正,從而可以減弱梳狀濾波效應(yīng),進而提高重構(gòu)的多聲道信號的聲像 質(zhì)量和清晰度。
為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例描述中所 需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā) 明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的 前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例一提供的一種對多聲道信號的聲道延遲參數(shù)進行修正 的方法的處理流程圖;圖2為本發(fā)明實施例一提供的另 一種對多聲道信號的聲道延遲參數(shù)進行修
正的方法的處理流程圖3為本發(fā)明實施例一提供的一種對多聲道信號的聲道延遲參數(shù)進行修正 的裝置的具體實現(xiàn)結(jié)構(gòu)圖。
具體實施例方式
為便于對本發(fā)明實施例的理解,下面將結(jié)合附圖以幾個具體實施例為例 做進一步的解釋說明,且各個實施例并不構(gòu)成對本發(fā)明實施例的限定。
本發(fā)明實施例提供了 一種對多聲道信號的聲道延遲參數(shù)進行修正的方 法,如圖1所示,所述方法包括
步驟101:對多聲道信號進行下混處理獲得處理信號;
步驟102:計算所述處理信號的能量分布;
步驟103:根據(jù)所述處理信號的能量分布,判斷所述處理信號是否出現(xiàn)了 梳狀濾波效應(yīng),如果是,則對所述多聲道信號的聲道延遲參數(shù)進行修正。
在本發(fā)明實施例具體實施時,對多聲道信號進行下混處理獲得處理信 號,所述處理信號包括M信號、S信號。本領(lǐng)域技術(shù)人員可以理解的是,處理 信號出現(xiàn)梳狀濾波效應(yīng)包括以下任意一種M信號出現(xiàn)梳狀濾波效應(yīng);S信號 出現(xiàn)梳狀濾波效應(yīng);M信號和S信號都出現(xiàn)梳狀濾波效應(yīng)。
本發(fā)明實施例根據(jù)多聲道信號下混處理后獲得的處理信號的能量分布, 判斷是否出現(xiàn)了梳狀濾波效應(yīng),當確定出現(xiàn)了梳狀濾波效應(yīng)后,則對所述多 聲道信號的聲道延遲參數(shù)進行修正,從而可以減弱梳狀濾波效應(yīng),進而提高 重構(gòu)的多聲道信號的聲像質(zhì)量和清晰度。需要說明的是,具體實施本發(fā)明 時,在一般的情況下,采用本發(fā)明的方案可以消除梳狀濾波效應(yīng)。
下面以具體的應(yīng)用場景實施例進行說明,為了方^更描述,下面統(tǒng)一用立 體聲(左右兩個聲道)來描述本發(fā)明實施例,但需要明確的是本發(fā)明實施例并不局限于立體聲,也同樣適應(yīng)于其他多聲道。
當輸入信號不是只有左右兩個聲道的立體聲信號時,而是包含多于兩個 聲道的多聲道信號時,可以將該多聲道信號轉(zhuǎn)換為立體聲信號,具體轉(zhuǎn)換公 式如下
上述~、 ^、 c、 "、 ^為5.1聲道信號,、G為經(jīng)過轉(zhuǎn)換后的立體聲信
該實施例提供的 一 種對多聲道信號的聲道延遲參數(shù)進行修正的方法的處
理流程如圖2所示,包括如下處理步驟
在該實施例中,輸入信號是立體聲的左聲道時域信號A仏A,…W和右聲 道時域信號其中k表示第k幀,N表示一幀信號有N個采樣點。
步驟201、根據(jù)立體聲的左右聲道信號之間的相關(guān)性,計算出當前幀對應(yīng) 的左右聲道之間的聲道延遲參凄史channel—delay 。
步驟202、根據(jù)上述聲道延遲參數(shù)channeLdelay對上述左右聲道信號L、 R的當前幀信號進行下混,得到處理信號(M、 S信號),進而分別計算出第 一S/M比率ratio—1、第二S/M比率ratio—2、第三S/M比率ratio—3、第四S/M比 率ratio—4和長時平滑互相關(guān)系數(shù)long—corr。
根據(jù)上述聲道延遲參數(shù)channeLdelay,通過下述公式1對上述左右聲道 信號L、 R的每幀信號進行下混,得到下混后的M、 S信號,具體計算方法如 下
實施例<formula>formula see original document page 14</formula>
上述公式1中的必砂-channel—delay, k表示第k巾貞。
由于上述當前幀的M、 S信號中包括各個采樣點,因此,上述Mw和S"可
在獲取了上述M、 S信號后,本發(fā)明實施例需要獲取上述M、 S信號之間 的能量分布特性,根據(jù)該能量分布特性來判斷下混處理得到的處理信號是否 出現(xiàn)了梳狀濾波效應(yīng)。需要說明的是,發(fā)明人在實施本發(fā)明過程中發(fā)現(xiàn),梳 狀濾波效應(yīng)可能出現(xiàn)在M信號或S信號,也可能在M信號和S信號上同時出現(xiàn)。
在實際應(yīng)用中,上述M、 S信號之間的能量分布特性可以通過M、 S信號 之間的能量參數(shù)比值來表示。于是,根據(jù)上述M("和S(w,計算得到第一S/M
比率ratio一1 (第一能量參數(shù)比值),具體計算方法如下
上述|>,2表示所述S信號中的每個采樣點的能量參數(shù)的疊加值,Sm,2表
示所述M信號中的每個采樣點的能量參數(shù)的疊加值,計算出的ratio一1表示了 S 信號和M信號之間的能量參數(shù)比值。
對上述ratio_1進行長時平滑,得到長時平滑后的第一 S/M比率 long_ratio_1,具體計算方法如下
上述7>式右邊的ra"'?!猯'表示上一幀只十應(yīng)的long—ratio_1,上述wa/ei 的數(shù)值在0到1之間,即o^c"M",若""^ = 0則表示不對這些參數(shù)進行平
"表示為似Jmi,w2'…附w〉 ,
<formula>formula see original document page 14</formula>滑,本實施例中取值為0.5 。
然后,令delay = 0 ,根據(jù)上述公式1計算得到 一 組處理信號
M; {附、,附'2 ,…附'w }即第二和信號,& W ,A ,…。即第二邊信號。
根據(jù)上述M:和&',計算得到第二S/M比率ratio—2 (第二能量參數(shù)比 值),具體計算方法如下
ra//o — 2 = ^^f / S附'
對上述ratio_2進行長時平滑,得到長時平滑后的第二 S/M比率 long_ratio—2,具體計算方法如下
/owg _ — 2 = /cwg — ra"o — 2 x sca/el + _ 2 x (1 — sca/el)
上述乂>式右邊的/朋g _ ra"'o—2'表示上 一 幀3十應(yīng)的long—ratio—2 。
之后,根據(jù)上述longjatioJ和longjatio—2,計算出第三S/M比率ratio—3
(第三能量參數(shù)比值),具體計算方法如下 rato _ 3 = fo/ g—— 1//cwg—raf/o—2
在實際應(yīng)用中,還可以直接根據(jù)ratio—1和ratic^2計算出ratio_3,具體計
算方法如下
raf/o _ 3 = ra//o — 1 /rato _ 2 。
計算ratio一3的基底參數(shù)ratio一floor,具體計算方法如下
rario — yfoor = Z — 3(/), C = < ra o—3 < = /7/r 2}
上述^l和^2是比較門限,其中^l的取值范圍為o到3之間,其中*2的 取值范圍為0到10之間,若*1=1, *2=1則表示不對ratio—3去除基底(因為 這時rato — y/ow的值永遠為1),本實施例中*1=0 , //^2=1 。對上述ratio—3進行去除基底的處理,得到信號能量分布特性更突出的能 量比率參數(shù)ratio—4 (第四能量參^t比值),具體計算方法如下
ra"o — 4 = ra"o — 3/ra"o _ y7oor
對ratio一4進行長時平滑,得到長時平滑后的第四S/M比率long—ratio一4,
具體計算方法如下
/owg _ _ 4 = /cwg _ rario _ 4' x sca/el + ra,z'o — 4 x (1 — sca/el)
上述乂i^式右邊的/o"g—ra,/o—4'表示上一幀^f應(yīng)的longj-atio—4。
步驟203、根據(jù)上述獲取的各個S/M比率值和預(yù)先設(shè)定的門限值,判斷是 否出現(xiàn)了梳狀濾波效應(yīng),如果是,則對聲道延遲參數(shù)channeLdelay進行修正。
計算出在delay二0時的左右聲道之間的長時平滑互相關(guān)系數(shù)long一corr,具
體計算方法如下
/owg _ co廳=/o"g _ co r' x sca/e2 + # (0) x (1 - scfl/e2)
上述公式右邊的""g -COTT'為上 一 幀對應(yīng)的long_ _corr, W為左右聲道之 間的殘差互相關(guān)系數(shù),具體計算方法如下
戶0 / 乂=0 _/=0
上述公式中的MAX—OFFSET為常量,為預(yù)先設(shè)定的最大可能的聲道延遲 參數(shù), 一般的,MAX_OFFSET=48; T表示一幀殘差信號有T個采樣點。式中 為左聲道殘差時域信號丄,(r,,尸2,…/,) , K,為右聲道殘差時域信號
對上述cc/還可以進行歸一化處理,得到歸一化互相關(guān)系數(shù)"o削-cc,,具 體計算方法如下<formula>formula see original document page 17</formula>
w"/e2的數(shù)值在0到1之間,本實施例中其取值為0.8。
沖艮才居上述獲取的ratio—1 、 long—ratio—1 、 ratio_3 、 long—ratio—4禾口 long_corr,以及預(yù)先設(shè)定的各個判決門限值thr3 (第一門限值)、thr4 (第二 門限值)、thr5 (第三門限值)、thr6 (第四門限值)和thr7 (第五門限
值),判斷是否出現(xiàn)了梳狀濾波效應(yīng),具體的判斷條件包括如下的4種
條件1 、 ratio—1> thr3或long—ratio_1>thr4,
條件2、 ratio—3> thr5或long—ratio—4>thr6
條件3、 (ratio—1> thr3或long—ratio_1>thr4)&&( long_corr>thr7)
條件4、 (ratio_3>討5或10門9_^0_4>討6)&&( long_corr>thr7)
上述4個條件中thr3、 thr4、 thr5、 thr6和thr7分別是判決門限,取值范圍 各不相同,其中thr3和thr4的取值范圍在1到100之間,比如,取值5; thr5和 thr6的取值范圍在1到100之間,比如,取值10; thr7的取值范圍在0到1之 間,比如,取<直0.35。
如果滿足以上4個條件中的任意一個,均可認為檢測到了梳狀濾波效應(yīng)。 在本實施例中,當出現(xiàn)了梳狀濾波效應(yīng)時,便認為下混M信號會比正常情況 下偏小,而S信號相對會偏大,或者左右聲道在沒有聲道延時的情況下相關(guān)性 比較大。于是,需要對聲道延遲參數(shù)channeLdelay進行修正,令延時修正指
示標志_ c/wwge—yZag = 1, 否貝ij tfe— 一 c/zawge — = 0
若延時修正指示標志為1,即y^g = i,貝寸
可以通過以下4種修正方法來間接修正聲道延遲參數(shù)。該修正方法主要是 通過對歸一化互相關(guān)系數(shù)"o^—cc/在delay:0處的函數(shù)值(即"。^-Cc/(0))進行增大,使其大于或盡可能大于所有delay-O處的函數(shù)值。由于搜索"°^-", 中的最大值,該值對應(yīng)的延時i即為聲道延遲channel—delay , 即
cfe/(^y = arg(max("ora cc/(/))) "n、
' — 。因此,增大"o削—"/(o)時,可使channel delay修
正為O。
修正方法1、 —cc/(0) = "Ora_CC/(0) + M,其中M為一常量,M的取值范
圍在0到10之間,比如,取值為3。
4奮正方法2、"o"n_cc/(0) = "WT _cc/(0)xe ,其中Q為一常量,Q的取值范
圍在1到10000之間,比如,取值為1000。
修正方法3 、 — cc/(0)=朋r附—cc/(0) x gl(/o"g _ _ 4), 其中放大因子
4)是|0叩—ratio—4的一個正比例函數(shù),long—ratio—4越大函數(shù)值
也越大。
上述函數(shù)2i(fe"g—w》-4)的表達式為
gl(/o"g _ ra"o — 4)=《1 x /cwg — rato _ 4 + cl
變量^的取值范圍為1到1000之間,比如,取值為100。 cl的取值范圍在
0到10之間,比如,取值為o。
修正方法4 、 "orw — cc/(0) = "orw _ cc/(0) x 02(/owg — ra".o — 1), 其中》文大因子
22(/。"g _rato—l)是iong—ratioj的 一 個正比例函數(shù),|ong_ratio_1越大函數(shù)值
也越大。
函數(shù)02(/o"g — ra"o —1)的表達式為 g2(/cwg _ ra/i'c _ 1)=《2 x /cwg _ _ 1 + c2
其中變量^的取值范圍為1到1000之間,比如,取值為100。"的取值范 圍在0到10之間,比如,取值為o。上述修正方法1、 2、 3和4中的等式兩端norm—ccf(0)代表相同意思,是對
該數(shù)值的更新。
需要說明的是,優(yōu)選地,可以釆用對歸一化互相關(guān)系數(shù)"^"-c"進行上 述處理,達到間接修正聲道延遲參數(shù)的目的,同樣,也可以通過對互相關(guān)系 數(shù)cc/進行同樣處理,達到間接修正聲道延遲參數(shù)的目的,具體處理方式與對 歸一化互相關(guān)系數(shù)"。,-Cc/的處理方式相同,在此不在贅述。
在實際應(yīng)用中,還可以在上述延時修正指示標志為1 ,即 _ y^g = l時,直接對聲道延遲參數(shù)進行修正,直接將聲延遲參數(shù)置
零,即令channel delay:0。 ^"delay參凄t進4亍直4妄》務(wù) 夂會景》響到禾口delay參凄史 相關(guān)的一些參數(shù),從而對編碼端其他部分性能產(chǎn)生影響。對delay參數(shù)進行間 接修改不會產(chǎn)生上述影響,效果比直接修改好。
該實施例可以判斷出當前幀的下混后的處理信號是否出現(xiàn)了梳狀濾波效 應(yīng)時,并在出現(xiàn)了梳狀濾波效應(yīng)時,可以及時對聲道延遲參數(shù)channel—delay 進行相應(yīng)的修正,從而消除梳狀濾波效應(yīng),保證重構(gòu)的立體聲信號等多聲道 信號的聲像質(zhì)量及清晰度。
實施例二
該實施例與實施例一的不同在于計算下混M信號和S信號時所采用的輸入 信號為原始左右聲道信號經(jīng)過簡單抽取之后的信號。
在該實施例中,對原始輸入的立體聲的左右聲道時域信號A仏,^…W和 A化,&…W進行簡單的抽取處理,即進行下采樣處理,得到下采樣信號 丄'a/'p/'2,…/'J, i ' '2,...,M},其中M為抽取之后一幀信號采樣點數(shù),k表 示第k幀。上述下采樣處理的方法如下然后,利用下采樣信號"Wi"'2,…^),化 '2,■ ;},按照上述實施例 一提供的處理流程,判斷是否出現(xiàn)了梳狀濾波效應(yīng)時,并對聲道延遲參數(shù) channel—delayii^f亍相應(yīng)的》務(wù)正。
該實施例通過對原始輸入的立體聲的左右聲道時域信號進行下采樣,使 樣本信號的數(shù)量減少,計算量減少,從而可以提高上述第一S/M比率 ratio—1、第二S/M比率ratio—2、第三S/M比率ratio—3、第四S/M比率ratio—4和 長時平滑互相關(guān)系數(shù)longjorr的計算速度。
實施例三
在本實施例中,若檢測到需要對聲道延遲參數(shù)進行修正,即在該幀檢測 到&—-C/^^_yfeg = i,則設(shè)置拖尾范圍,令該幀之后的拖尾范圍的幀都進行
聲道延遲參數(shù)修正,而不管這些幀是否真正滿足出現(xiàn)梳狀濾波效應(yīng)的條件, 即強制這些幀的延時修正指示標志為1。然后,按照上述實施例一中的四種間 接修正方法或直接修正方法,對這些幀聲道延遲參數(shù)進行修正。
上述拖尾范圍的幀可以根據(jù)實際情況來設(shè)定,比如,設(shè)置該幀之后的100 幀都進行聲道延遲參數(shù)修正。
由于當前幀出現(xiàn)了梳狀濾波效應(yīng)后,后續(xù)幀繼續(xù)出現(xiàn)梳狀濾波效應(yīng)的可 能性也很大。該實施例相當于設(shè)置了一個聲道延遲參數(shù)的修正拖尾,設(shè)置修 正拖尾的好處是盡量地保證這種延時修正的有效性及持續(xù)性,可以避免后續(xù) 幀繼續(xù)出現(xiàn)梳狀濾波效應(yīng)。
本發(fā)明實施例還提供了 一種對多聲道信號的聲道延遲參數(shù)進行修正的裝 置,其具體實現(xiàn)結(jié)構(gòu)如圖3所示,所述裝置包括
下混處理;漠塊301,用于對多聲道信號進行下混處理獲得處理信號;能量分布獲取模塊302,用于計算所述處理信號的能量分布;
判斷模塊303,用于根據(jù)所述處理信號的能量分布,判斷所述處理信號是 否出現(xiàn)了梳狀濾波效應(yīng);
聲道延遲參數(shù)修正模塊304,用于當所述判斷模塊判定所述處理信號出現(xiàn) 了梳狀濾波效應(yīng)時,對所述多聲道信號的聲道延遲參數(shù)進行修正。
進一步的,所述下混處理模塊301具體用于對所述多聲道信號的當前幀信 號進行下混處理獲得和信號和邊信號;
或者,
所述下混處理模塊301具體用于對所述多聲道信號的當前幀信號進行下采 樣,對下采樣后的下采樣信號進行下混處理獲得和信號和邊信號。
更進一步的,所述下混處理模塊301具體用于獲取所述多聲道信號的當前 幀的聲道延遲參數(shù),根據(jù)該當前幀的聲道延時參數(shù)對所述多聲道信號進行下 混,得到下混后的和信號和邊信號;
所述能量分布獲取模塊302具體用于將所述邊信號中的每個采樣點的能量 參數(shù)的疊加值除以所述和信號中的每個采樣點的能量參數(shù)的疊加值,得到第 一能量參數(shù)比值。
所述判斷模塊303具體用于當所述第 一能量參數(shù)比值大于預(yù)定的第 一 門限 值時,則判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng);或者,
所述判斷模塊303具體用于當長時平滑處理后的第一能量參數(shù)比值大于預(yù) 定的第二門限值時,則判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
更進一步的,所述所述所述能量分布獲取模塊302還用于計算所述多聲道 信號的零延時對應(yīng)的互相關(guān)系數(shù),并進行長時平滑處理,得到長時平滑處理 后的互相關(guān)系數(shù);
所述判斷模塊303具體用于當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定 的第五門限值,并且,所述第一能量參數(shù)比值大于預(yù)定的第一門限值,則判 定所述處理信號出現(xiàn)了梳狀濾波效應(yīng);或,所述判斷模塊具體用于當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定的第五門限值,并且,長時平滑處理后 的所述第 一能量參數(shù)比值大于預(yù)定的第二門限值,則判定所述處理信號出現(xiàn)
了沖JM犬濾波歲支應(yīng)。
更進一步的,所述下混處理模塊301還用于根據(jù)為零值的聲道延遲參數(shù)對 所述多聲道信號進行下混,得到下混后的第二和信號和第二邊信號;
能量分布獲取模塊302還用于將所述第二邊信號中的每個采樣點的能量參 數(shù)的疊加值除以所述第二和信號中的每個采樣點的能量參數(shù)的疊加值,得到 第二能量參數(shù)比值,將所述第一能量參數(shù)比值除以所述第二能量參數(shù)比值, 得到第三能量參數(shù)比值;或者,對所述第一能量參數(shù)比值、第二能量參數(shù)比 值分別進行長時平滑處理,將長時平滑處理后的第一能量參數(shù)比值除以長時 平滑處理后的第二能量參數(shù)比值,得到第三能量參數(shù)比值。
所述判斷模塊303具體用于當所述第三能量參數(shù)比值大于預(yù)定的第三門限 值時,則判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
更進一步的,所述能量分布獲取模塊302還用于對所述第三能量參數(shù)比值 進行去除基底處理后,得到第四能量參數(shù)比值,對所述第四能量參數(shù)比值進 行長時平滑處理,得到長時平滑處理后的第四能量參數(shù)比值。
所述判斷模塊303具體用于當長時平滑處理后的第四能量參數(shù)比值大于預(yù) 定的第四門限值時,則判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
更進一步的,所述能量分布獲取模塊302還用于計算所述多聲道信號的零 延時對應(yīng)的互相關(guān)系數(shù),并進行長時平滑處理,得到長時平滑處理后的互相 關(guān)系數(shù);
所述判斷模塊303具體用于當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定 的第五門限值,并且,所述第三能量參數(shù)比值大于預(yù)定的第三門限值,則判 定所述處理信號出現(xiàn)了梳狀濾波效應(yīng);
所述判斷模塊303具體用于當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定 的第五門限值,并且,所述長時平滑處理后的第四能量參數(shù)比值大于預(yù)定的第四門限值時,則判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
具體的,所述聲道延遲參數(shù)修正模塊304具體用于將所述多聲道信號的當
前幀的聲道延遲參數(shù)置為零值;或,所述聲道延遲參數(shù)修正;f莫塊304具體用于 計算出所述多聲道信號的零延時對應(yīng)的互相關(guān)系數(shù),增大所述零延時對應(yīng)的 互相關(guān)系數(shù);或,所述聲道延遲參數(shù)修正模塊304具體用于計算出所述多聲道 信號的零延時對應(yīng)的歸一化互相關(guān)系數(shù),增大所述零延時對應(yīng)的歸一化互相 關(guān)系數(shù)。
進一步的,所述聲道延遲參數(shù)修正模塊304還用于在將所述多聲道信號的 當前幀信號的聲道延遲參數(shù)進行修正后,修正所述當前幀之后拖尾范圍內(nèi)的 幀的聲道延遲參數(shù)。
綜上所述,本發(fā)明實施例根據(jù)下混處理得到的處理信號的能量分布,判 斷是否出現(xiàn)了梳狀濾波效應(yīng),上述能量分布可以通過S信號和M信號的之間的 能量參數(shù)比值來表示。如果出現(xiàn)了梳狀濾波效應(yīng),則通過直接及間接等多種 途徑對多聲道信號的聲道延遲參數(shù)進行修正,從而消除梳狀濾波效應(yīng),保證 重構(gòu)的立體聲信號等多聲道信號的聲像質(zhì)量及清晰度。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流 程,是可以通過計算機程序來指令相關(guān)的硬件來完成,所述的程序可存儲于 一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施 例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或F逭才幾存l諸i己'I"乙體(Random Access Memory, RAM )等。
以上所述,僅為本發(fā)明較佳的具體實施方式
,但本發(fā)明的保護范圍并不 局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可 輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明 的保護范圍應(yīng)該以權(quán)利要求的保護范圍為準。
權(quán)利要求
1、一種對多聲道信號的聲道延遲參數(shù)進行修正的方法,其特征在于,包括對多聲道信號進行下混處理獲得處理信號;計算所述處理信號的能量分布;根據(jù)所述處理信號的能量分布,判斷所述處理信號是否出現(xiàn)了梳狀濾波效應(yīng),如果是,則對所述多聲道信號的聲道延遲參數(shù)進行修正。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述處理信號包括和信 號、邊信號。
3、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對多聲道信號進行下 混處理獲得處理信號包括對所述多聲道信號的當前幀信號進行下混處理獲得和信號和邊信號; 或者,對所述多聲道信號的當前幀信號進行下采樣,對下采樣后的下采樣信號 進^f亍下混處理獲得和信號和邊信號。
4、 根據(jù)權(quán)利要求1-3任一所述的方法,其特征在于, 所述對多聲道信號進行下混處理獲得處理信號包括 獲取所述多聲道信號的當前幀的聲道延遲參數(shù),根據(jù)該當前幀的聲道延時參凄t對所述多聲道信號進行下混,得到下混后的和信號和邊信號; 所述計算所述處理信號的能量分布包括將所述邊信號中的每個采樣點的能量參數(shù)的疊加值除以所述和信號中的 每個采樣點的能量參數(shù)的疊加值,得到第一能量參數(shù)比值。
5、 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述處理信號的 能量分布,判斷所述處理信號是否出現(xiàn)了梳狀濾波效應(yīng)包括當所述第 一能量參數(shù)比值大于預(yù)定的第 一 門限值時,則判定所述處理信 號出現(xiàn)了梳狀濾波效應(yīng);或者,當長時平滑處理后的第一能量參數(shù)比值大于預(yù)定的第二門限值時,則判 定所述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
6、 如權(quán)要求4所述的方法,其特征在于, 所述計算所述處理信號的能量分布還包括計算所述多聲道信號的零延時對應(yīng)的互相關(guān)系數(shù),并進行長時平滑處 理,得到長時平滑處理后的互相關(guān)系數(shù);所述根據(jù)所述處理信號的能量分布,判斷所述處理信號是否出現(xiàn)了梳狀 濾波效應(yīng)包4舌當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定的第五門限值,并且,所 述第一能量參數(shù)比值大于預(yù)定的第 一 門限值,則判定所述處理信號出現(xiàn)了梳 狀濾波效應(yīng);或,當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定的第五門限值,并且,長 時平滑處理后的所述第一能量參數(shù)比值大于預(yù)定的第二門限值,則判定所述 處理信號出現(xiàn)了梳狀濾波效應(yīng)。
7、 根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述對多聲道信號進行下混處理獲得處理信號還包括 根據(jù)為零值的聲道延遲參數(shù)對所述多聲道信號進行下混,得到下混后的第二和信號和第二邊信號;所述計算所述處理信號的能量分布還包括將所述第二邊信號中的每個采樣點的能量參數(shù)的疊加值除以所述第二和 信號中的每個采樣點的能量參數(shù)的疊加值,得到第二能量參數(shù)比值;將所述第一能量參數(shù)比值除以所述第二能量參數(shù)比值,得到第三能量參 數(shù)比值;或者,對所述第一能量參數(shù)比值、第二能量參數(shù)比值分別進行長時平滑處理,將長時平滑處理后的第一能量參數(shù)比值除以長時平滑處理后的第 二能量參數(shù)比值,得到第三能量參數(shù)比值。
8、 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)所述處理信號的能量分布,判斷所述處理信號是否出現(xiàn)了梳狀濾波效應(yīng)包括當所述第三能量參數(shù)比值大于預(yù)定的第三門限值時,則判定所述處理信 號出現(xiàn)了梳狀濾波效應(yīng)。
9、 根據(jù)權(quán)利要求7所述的方法,其特征在于, 所述計算所述處理信號的能量分布還包括對所述第三能量參數(shù)比值進行去除基底處理后,得到第四能量參數(shù)比 值,對所述第四能量參數(shù)比值進行長時平滑處理,得到長時平滑處理后的第 四能量參數(shù)比值。
10、 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述根據(jù)所述處理信號的 能量分布,判斷所述處理信號是否出現(xiàn)了梳狀濾波效應(yīng)包括當長時平滑處理后的第四能量參數(shù)比值大于預(yù)定的第四門限值時,則判 定所述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
11、 根據(jù)權(quán)利要求7所述的方法,其特征在于, 所述計算所述處理信號的能量分布還包括計算所述多聲道信號的零延時對應(yīng)的互相關(guān)系數(shù),并進行長時平滑處 理,得到長時平滑處理后的互相關(guān)系數(shù);所述根據(jù)所述處理信號的能量分布,判斷所述處理信號是否出現(xiàn)了梳狀 濾波效應(yīng)包4舌當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定的第五門限值,并且,所 述第三能量參數(shù)比值大于預(yù)定的第三門限值,則判定所述處理信號出現(xiàn)了梳 狀濾波效應(yīng)。
12、 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述計算所述處理信號的能量分布還包括計算所述多聲道信號的零延時對應(yīng)的互相關(guān)系數(shù),并進行長時平滑處理,得到長時平滑處理后的互相關(guān)系數(shù);所述根據(jù)所述處理信號的能量分布,判斷所述處理信號是否出現(xiàn)了梳狀 濾波步文應(yīng)包4舌當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定的第五門限值,并且,所 述長時平滑處理后的第四能量參數(shù)比值大于預(yù)定的第四門限值時,則判定所 述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
13、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述多聲道信號的 聲道延遲參數(shù)進行修正,具體包括將所述多聲道信號的當前幀的聲道延遲參數(shù)置為零值;或, 計算出所述多聲道信號的零延時對應(yīng)的互相關(guān)系數(shù),增大所述零延時對應(yīng)的互相關(guān)系it;或,計算出所述多聲道信號的零延時對應(yīng)的歸一化互相關(guān)系數(shù),增大所述零延時對應(yīng)的歸 一化互相關(guān)系凄t。
14、 根據(jù)權(quán)利要求13所述的方法,其特征在于,所述增大所述零延時對 應(yīng)的互相關(guān)系數(shù),具體包括將所述零延時對應(yīng)的互相關(guān)系數(shù)加上一個常量;或者,將所述零延時對 應(yīng)的互相關(guān)系數(shù)乘以一個常量;或者,將所述零延時對應(yīng)的互相關(guān)系數(shù)乘以一個放大因子,該放大因子根據(jù)所述處理信號的能量分布得到。
15、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括 在將所述多聲道信號的當前幀信號的聲道延遲參數(shù)進行修正后,修正所述當前幀之后拖尾范圍內(nèi)的幀的聲道延遲參數(shù)。
16、 一種對多聲道信號的聲道延遲參數(shù)進行修正的裝置,其特征在于,包括:下混處理^^莫塊,用于對多聲道信號進行下混處理獲得處理信號;能量分布獲取模塊,用于計算所述處理信號的能量分布;判斷模塊,用于根據(jù)所述處理信號的能量分布,判斷所述處理信號是否出現(xiàn)了梳狀濾波效應(yīng);聲道延遲參數(shù)修正模塊,用于當所述判斷模塊判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng)時,對所述多聲道信號的聲道延遲參數(shù)進行修正。
17、 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述下混處理模塊具體用于對所述多聲道信號的當前幀信號進行下混處 理獲得和信號和邊信號; 或者,所述下混處理模塊具體用于對所述多聲道信號的當前幀信號進行下采 樣,對下采樣后的下采樣信號進行下混處理獲得和信號和邊信號。
18、 根據(jù)權(quán)利要求16或17所述的裝置,其特征在于, 所述下混處理模塊具體用于獲取所述多聲道信號的當前幀的聲道延遲參數(shù),根據(jù)該當前幀的聲道延時參數(shù)對所述多聲道信號進行下混,得到下混后 的和信號和邊信號;所述能量分布獲取模塊具體用于將所述邊信號中的每個采樣點的能量參 數(shù)的疊加值除以所述和信號中的每個采樣點的能量參數(shù)的疊加值,得到第一 能量參數(shù)比值。
19、 根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述判斷模塊具體用于當所述第一能量參數(shù)比值大于預(yù)定的第一門限值 時,則判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng);或者,所述判斷模塊具體用于當長時平滑處理后的第一能量參數(shù)比值大于預(yù)定 的第二門限值時,則判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
20、 根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述能量分布獲取模塊還用于計算所述多聲道信號的零延時對應(yīng)的互相關(guān)系數(shù),并進行長時平滑處 理,得到長時平滑處理后的互相關(guān)系數(shù);所述判斷模塊具體用于當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定的 第五門限值,并且,所述第一能量參數(shù)比值大于預(yù)定的第一門限值,則判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng);或,所述判斷模塊具體用于當所述長時 平滑處理后的互相關(guān)系數(shù)大于預(yù)定的第五門限值,并且,長時平滑處理后的 所述第一能量參數(shù)比值大于預(yù)定的第二門限值,則判定所述處理信號出現(xiàn)了 才危狀濾波效應(yīng)。
21、 根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述下混處理模塊還用于根據(jù)為零值的聲道延遲參數(shù)對所述多聲道信號 進行下混,得到下混后的第二和信號和第二邊信號;所述能量分布獲取模塊還用于將所述第二邊信號中的每個采樣點的能量 參數(shù)的疊加值除以所述第二和信號中的每個采樣點的能量參數(shù)的疊加值,得 到第二能量參數(shù)比值,將所述第一能量參數(shù)比值除以所述第二能量參數(shù)比 值,得到第三能量參數(shù)比值;或者,對所述第一能量參數(shù)比值、第二能量參 數(shù)比值分別進行長時平滑處理,將長時平滑處理后的第一能量參數(shù)比值除以 長時平滑處理后的第二能量參數(shù)比值,得到第三能量參數(shù)比值。
22、 根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述判斷模塊具體用于 當所述第三能量參數(shù)比值大于預(yù)定的第三門限值時,則判定所述處理信號出現(xiàn)了橋u狀濾波效應(yīng)。
23、 根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述能量分布獲取模塊 還用于對所述第三能量參數(shù)比值進行去除基底處理后,得到第四能量參數(shù)比 值,對所述第四能量參數(shù)比值進行長時平滑處理,得到長時平滑處理后的第 四能量參數(shù)比值。
24、 根據(jù)權(quán)利要求23所述的裝置,其特征在于,所述判斷模塊具體用于當長時平滑處理后的第四能量參數(shù)比值大于預(yù)定的第四門限值時,則判定所 述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
25、 根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述能量分布獲取模塊還用于計算所述多聲道信號的零延時對應(yīng)的互相關(guān)系數(shù),并進行長時平滑處理,得到長時平滑處理后的互相關(guān)系數(shù);所述判斷模塊具體用于當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定的 第五門限值,并且,所述第三能量參數(shù)比值大于預(yù)定的第三門限值,則判定 所述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
26、 根據(jù)權(quán)利要求23所述的裝置,其特征在于,所述能量分布獲取模塊 還用于計算所述多聲道信號的零延時對應(yīng)的互相關(guān)系數(shù),并進行長時平滑處理,得到長時平滑處理后的互相關(guān)系數(shù);所述判斷模塊具體用于當所述長時平滑處理后的互相關(guān)系數(shù)大于預(yù)定的 第五門限值,并且,所述長時平滑處理后的第四能量參數(shù)比值大于預(yù)定的第 四門限值時,則判定所述處理信號出現(xiàn)了梳狀濾波效應(yīng)。
27、 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述聲道延遲參數(shù)修正 模塊具體用于將所述多聲道信號的當前幀的聲道延遲參數(shù)置為零值;或,所 述聲道延遲參數(shù)修正模塊具體用于計算出所述多聲道信號的零延時對應(yīng)的互 相關(guān)系數(shù),增大所述零延時對應(yīng)的互相關(guān)系數(shù);或,所述聲道延遲參數(shù)修正 模塊具體用于計算出所述多聲道信號的零延時對應(yīng)的歸一化互相關(guān)系數(shù),增 大所述零延時對應(yīng)的歸 一化互相關(guān)系數(shù)。
28、 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述聲道延遲參數(shù)修正 模塊還用于在將所述多聲道信號的當前幀信號的聲道延遲參數(shù)進行修正后, 修正所述當前幀之后拖尾范圍內(nèi)的幀的聲道延遲參數(shù)。
全文摘要
本發(fā)明實施例提供了一種對多聲道信號的聲道延遲參數(shù)進行修正的方法和裝置。該方法主要包括對多聲道信號進行下混處理獲得處理信號;計算所述處理信號的能量分布;根據(jù)所述處理信號的能量分布,判斷所述處理信號是否出現(xiàn)了梳狀濾波效應(yīng),如果是,則對所述多聲道信號的聲道延遲參數(shù)進行修正。本發(fā)明根據(jù)對多聲道信號進行下混處理后獲得的處理信號的能量分布,判斷是否出現(xiàn)了梳狀濾波效應(yīng),從而判斷是否需要對聲道延遲參數(shù)進行修正,以消除梳狀濾波效應(yīng),進而提供較好的重構(gòu)立體聲等多聲道信號的聲像及清晰度。
文檔編號G10L19/00GK101533641SQ200910082270
公開日2009年9月16日 申請日期2009年4月20日 優(yōu)先權(quán)日2009年4月20日
發(fā)明者琦 張, 張立斌 申請人:華為技術(shù)有限公司