專(zhuān)利名稱(chēng)::基于分?jǐn)?shù)傅里葉變換的二維維納濾波的取證語(yǔ)音增強(qiáng)方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種語(yǔ)音增強(qiáng)方法,特別涉及一種基于分?jǐn)?shù)傅里葉變換的二維維納濾波的取證語(yǔ)音增強(qiáng)方法。音頻取證是指對(duì)錄音信號(hào)進(jìn)行獲取、分析和評(píng)價(jià)以作為法庭或其他行政部門(mén)認(rèn)可的證據(jù)。音頻證據(jù)可作為民事或刑事強(qiáng)制調(diào)查、行政調(diào)查或其他民事事件的一部分。音頻取證技術(shù)融合了音頻數(shù)字信號(hào)處理領(lǐng)域內(nèi)的諸多技術(shù)如語(yǔ)音識(shí)別、說(shuō)話(huà)人識(shí)別和語(yǔ)音增強(qiáng)等技術(shù)。從上個(gè)世紀(jì)六十年代開(kāi)始,特別是1974年的水門(mén)事件以后,音頻取證技術(shù)開(kāi)始在法庭取證中得到了應(yīng)用,但是由于當(dāng)初語(yǔ)音信號(hào)處理理論和技術(shù)還處于起步發(fā)展階段,音頻取證技術(shù)的研究一度處于停頓狀態(tài),近年來(lái)隨著語(yǔ)音信號(hào)處理技術(shù)的日益發(fā)展成熟和犯罪手段的不斷高技術(shù)化,最近幾年對(duì)音頻取證技術(shù)的研究得到了語(yǔ)音信號(hào)處理人員的廣泛關(guān)注。由于取證所用的音頻信號(hào)經(jīng)常受到來(lái)自噪聲、其他聲音、紊亂和其他妨礙正常音頻取證分析的信號(hào)處理手段的影響。而且絕大部分音頻信號(hào)都來(lái)自于采用隱藏的麥克風(fēng)進(jìn)行的私下錄音,因此信號(hào)通常也受到風(fēng)和其他環(huán)境聲音的干擾。因此,在分析之前應(yīng)當(dāng)采用語(yǔ)音增強(qiáng)技術(shù)以提高感知信噪比。通常的語(yǔ)音增強(qiáng)算法大多基于平穩(wěn)隨機(jī)噪聲理論,不能有效地降低非平穩(wěn)噪聲的影響,分?jǐn)?shù)階傅里葉變換的旋轉(zhuǎn)特性顯示,通過(guò)選擇合適的分?jǐn)?shù)階因子a,可以在分?jǐn)?shù)傅里葉變換域上實(shí)現(xiàn)語(yǔ)音與噪聲的最大分離,也可以通過(guò)多次旋轉(zhuǎn)以進(jìn)一步分離消除噪聲。
發(fā)明內(nèi)容本發(fā)明目的是針對(duì)現(xiàn)有技術(shù)存在的缺陷提供一種基于分?jǐn)?shù)傅里葉變換的二維維納濾波的取證語(yǔ)音增強(qiáng)方法。本發(fā)明為實(shí)現(xiàn)上述目的,采用如下技術(shù)方案本發(fā)明基于分?jǐn)?shù)傅里葉變換的二維維納濾波的取證語(yǔ)音增強(qiáng)方法,其特征在于包括以下步驟(1)分?jǐn)?shù)傅里葉變換域輸入語(yǔ)音序列s(η)的階分?jǐn)?shù)傅里葉變換算法如下Sa/(u)=Fa'(s(n))
背景技術(shù):
:-jCOtai2πexpjs{n)Cti=2mnat=(2m土l);r式中,〒,0<IPI<2,i=1,2,...,16,m為整數(shù),j為虛數(shù)單位;⑵取模Re⑷)為\⑷的實(shí)部,⑷)為\(M)的虛部,那么Sa,⑷的模如下Sai(")|=7(Re(5aj(W)))2+(Im(5fl((M)))2;(3)二維漢明窗二維漢明窗h(l,k)權(quán)利要求一種基于分?jǐn)?shù)傅里葉變換的二維維納濾波的取證語(yǔ)音增強(qiáng)方法,其特征在于包括以下步驟(1)分?jǐn)?shù)傅里葉變換域輸入語(yǔ)音序列s(n)的ai階分?jǐn)?shù)傅里葉變換算法如下<mrow><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><msub><mi>a</mi><mi>i</mi></msub></msup><mrow><mo>(</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mo>=</mo><mfencedopen='{'close=''><mtable><mtr><mtd><msqrt><mfrac><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>π</mi></mrow></mfrac></msqrt><munderover><mo>∫</mo><mrow><mo>-</mo><mo>∞</mo></mrow><mrow><mo>+</mo><mo>∞</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup></mrow><mn>2</mn></mfrac><mi>cot</mi><mi>a</mi><mo>-</mo><mfrac><mi>jun</mi><mrow><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>≠</mo><mi>mπ</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mn>2</mn><mi>mπ</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mo>-</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mrow><mo>(</mo><mn>2</mn><mi>m</mi><mo>±</mo><mn>1</mn><mo>)</mo></mrow><mi>π</mi></mtd></mtr></mtable></mfenced></mrow>式中,O<|p|<2,i=l,2,...,16,m為整數(shù),j為虛數(shù)單位;(2)取模為的實(shí)部,為的虛部,的模如下<mrow><mo>|</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><msqrt><msup><mrow><mo>(</mo><mi>Re</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mi>Im</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>;</mo></mrow>(3)二維漢明窗二維漢明窗h(l,k)<mrow><mi>h</mi><mrow><mo>(</mo><mi>l</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>πl</mi></mrow><mn>255</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>πk</mi></mrow><mn>15</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>上式中l(wèi)∈,k∈;(4)二維維納濾波<mrow><msup><mrow><mo>|</mo><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>其中為目標(biāo)信號(hào)譜的估計(jì)幅度,|X(i,j)|為濾波前的目標(biāo)信號(hào)譜的幅度,噪聲信號(hào)譜的估計(jì)幅度;則可得二維維納濾波如下<mrow><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mi>H</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>,</mo></mrow><mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><msqrt><mi>max</mi><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><mn>1</mn><mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mi>β</mi><mo>)</mo></mrow></msqrt><mo>,</mo></mrow>上式中β≥0,以保證傳輸函數(shù)H(u,v)>0,<mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>,</mo></mrow>上式中<mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>,</mo></mrow><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>N</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>;</mo></mrow>(5)分?jǐn)?shù)傅里葉逆變換為ai階分?jǐn)?shù)傅里葉變換域上的估計(jì)語(yǔ)音=Si(u)exp(jΔθi(u)),上式中分別為ai階分?jǐn)?shù)傅里葉變換域上含噪語(yǔ)音、純凈語(yǔ)音的相位譜,Δθi(u)為相位誤差;Δθi(u)=εiu/sinai,εi為均值較小的隨機(jī)變量,則有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><mrow><mo>-</mo><msub><mi>a</mi><mi>i</mi></msub></mrow></msup><mo>[</mo><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><msub><mi>ϵ</mi><mi>i</mi></msub><mi>u</mi><mo>)</mo></mrow><mo>]</mo></mrow><mrow><mo>=</mo><msqrt><mfrac><mrow><mn>1</mn><mo>+</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>π</mi></mrow></mfrac></msqrt><munderover><mo>∫</mo><mrow><mo>-</mo><mo>∞</mo></mrow><mrow><mo>+</mo><mo>∞</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><mrow><mo>(</mo><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup><mo>)</mo></mrow><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub><mo>-</mo><mn>2</mn><mi>u</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mo>-</mo><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>du</mi><mo>,</mo></mrow>為的時(shí)域形式;(6)線性合并令n′=nεi,代入上式并化簡(jiǎn)整理可得<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>RES</mi><mrow><mo>(</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><mfrac><mrow><msup><msub><mi>ϵ</mi><mi>i</mi></msub><mn>2</mn></msup><msup><mi>cos</mi><mn>2</mn></msup><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><mn>2</mn><msub><mi>ϵ</mi><mi>i</mi></msub><mi>t</mi><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>由于εi為均值較小的隨機(jī)變量,則有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>≈</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>那么線性合并后可得<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>當(dāng)信號(hào)路數(shù)M→∞時(shí),則有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>E</mi><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>由于語(yǔ)音信號(hào)為短時(shí)平穩(wěn)隨機(jī)過(guò)程,則有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>τ</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow>式中τ0為時(shí)延常數(shù)。FSA00000239174200013.tif,FSA00000239174200014.tif,FSA00000239174200015.tif,FSA00000239174200016.tif,FSA00000239174200017.tif,FSA00000239174200018.tif,FSA000002391742000112.tif,FSA000002391742000113.tif,FSA00000239174200025.tif,FSA00000239174200026.tif,FSA00000239174200027.tif,FSA00000239174200028.tif,FSA00000239174200029.tif,FSA000002391742000212.tif,FSA000002391742000213.tif全文摘要本發(fā)明公布了一種基于分?jǐn)?shù)傅里葉變換的二維維納濾波的取證語(yǔ)音增強(qiáng)方法,包括以下步驟(1)分?jǐn)?shù)傅里葉變換域;(2)取模;(3)加二維漢明窗;(4)二維維納濾波;(5)分?jǐn)?shù)傅里葉逆變換;(6)線性合并。本發(fā)明在取證語(yǔ)音增強(qiáng)領(lǐng)域具有較高的應(yīng)用價(jià)值和廣闊的應(yīng)用前景。文檔編號(hào)G10L21/02GK101950563SQ201010259828公開(kāi)日2011年1月19日申請(qǐng)日期2010年8月20日優(yōu)先權(quán)日2010年8月20日發(fā)明者包永強(qiáng),唐加能,奚吉,王開(kāi),趙力,鄒采榮,魏昕申請(qǐng)人:東南大學(xué)