帶噪語音信號處理方法、裝置及服務(wù)器的制造方法
【專利摘要】本發(fā)明公開了一種帶噪語音信號處理方法、裝置及服務(wù)器,屬于通信【技術(shù)領(lǐng)域】。所述方法包括:根據(jù)帶噪語音信號的靜默段,獲取該帶噪語音信號中噪聲信號;對于語音信號中的每一幀,根據(jù)該噪聲信號和該帶噪語音信號,獲取該語音信號的每一幀的功率譜迭代因子;根據(jù)該帶噪語音信號、該噪聲信號的每一幀和上一幀的功率譜迭代因子,計算語音信號每一幀的中間功率譜;根據(jù)該語音信號每一幀的中間功率譜和噪聲信號,計算該帶噪語音信號中每一幀的信噪比;根據(jù)該帶噪語音信號中每一幀的信噪比、該帶噪語音信號和該噪聲信號的每一幀,獲取時域的處理后帶噪語音信號。本發(fā)明通過功率譜迭代因子對帶噪語音信號進(jìn)行處理,提高了用戶的聽覺質(zhì)量。
【專利說明】帶噪語音信號處理方法、裝置及服務(wù)器
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,特別涉及一種帶噪語音信號處理方法、裝置及服務(wù)器。【背景技術(shù)】
[0002]現(xiàn)實生活中的語音不可避免地要受到周圍環(huán)境噪聲的影響,為了改善聽覺質(zhì)量,需要對語音信號進(jìn)行去噪處理。
[0003]在進(jìn)行去噪處理時,通常采用基于短時幅度譜估計的算法,即在頻域內(nèi),利用原始語音信號的功率譜和噪聲信號的功率譜得到語音信號的功率譜,并根據(jù)語音信號的功率譜計算得到語音信號的幅度譜,通過傅里葉反變換得到時域的語音信號。
[0004]在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
[0005]對于信號的功率譜估計,通常的做法是采用固定迭代因子的迭代算法,該算法往往對于白噪聲有效,不能及時跟蹤語音或者噪聲的變化,因此遇到有色噪聲時性能急劇下降。
【發(fā)明內(nèi)容】
[0006]為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種帶噪語音信號處理方法、裝置及服務(wù)器。所述技術(shù)方案如下:
[0007]第一方面,提供了一種帶噪語音信號處理方法,所述方法包括:
[0008]根據(jù)帶噪語音信號的靜默段,獲取所述帶噪語音信號中噪聲信號,所述帶噪語音信號包括語音信號和噪聲信號,所述帶噪語音信號為頻域信號;
[0009]對于所述語音信號中的每一幀,根據(jù)所述噪聲信號和所述帶噪語音信號,獲取所述語音信號的每一幀的功率譜迭代因子;
[0010]對于所述語音信號中的每一幀,根據(jù)所述帶噪語音信號、所述噪聲信號的每一幀和上一幀的功率譜迭代因子,計算語音信號每一幀的中間功率譜;
[0011]根據(jù)所述語音信號每一幀的中間功率譜和噪聲信號,計算所述帶噪語音信號中每一中貞的信噪比;
[0012]根據(jù)所述帶噪語音信號中每一幀的信噪比、所述帶噪語音信號和所述噪聲信號的每一幀,獲取時域的處理后帶噪語音信號。
[0013]第二方面,提供了一種帶噪語音信號處理裝置,所述裝置包括:
[0014]噪聲信號獲取模塊,用于根據(jù)帶噪語音信號的靜默段,獲取所述帶噪語音信號中噪聲信號,所述帶噪語音信號包括語音信號和噪聲信號,所述帶噪語音信號為頻域信號;
[0015]功率譜迭代因子獲取模塊,用于對于所述語音信號中的每一幀,根據(jù)所述噪聲信號和所述帶噪語音信號,獲取所述語音信號的每一幀的功率譜迭代因子;
[0016]語音信號中間功率譜獲取模塊,用于對于所述語音信號中的每一幀,根據(jù)所述帶噪語音信號、所述噪聲信號的每一幀和上一幀的功率譜迭代因子,計算語音信號每一幀的中間功率譜;[0017]信噪比獲取模塊,用于根據(jù)所述語音信號每一幀的中間功率譜和噪聲信號,計算所述帶噪語音信號中每一幀的信噪比;
[0018]帶噪語音信號處理模塊,用于根據(jù)所述帶噪語音信號中每一幀的信噪比、所述帶噪語音信號和所述噪聲信號的每一幀,獲取時域的處理后帶噪語音信號。
[0019]第三方面,提供了一種服務(wù)器,所述服務(wù)器包括:處理器和存儲器,所述處理器與所述存儲器相連接,
[0020]所述處理器,用于根據(jù)帶噪語音信號的靜默段,獲取所述帶噪語音信號中噪聲信號,所述帶噪語音信號包括語音信號和噪聲信號,所述帶噪語音信號為頻域信號;
[0021]所述處理器還用于對于所述語音信號中的每一幀,根據(jù)所述噪聲信號和所述帶噪語音信號,獲取所述語音信號的每一幀的功率譜迭代因子;
[0022]所述處理器還用于對于所述語音信號中的每一幀,根據(jù)所述帶噪語音信號、所述噪聲信號的每一幀和上一幀的功率譜迭代因子,計算語音信號每一幀的中間功率譜;
[0023]所述處理器還用于根據(jù)所述語音信號每一幀的中間功率譜和噪聲信號,計算所述帶噪語音信號中每一幀的信噪比;
[0024]所述處理器還用于根據(jù)所述帶噪語音信號中每一幀的信噪比、所述帶噪語音信號和所述噪聲信號的每一幀,獲取時域的處理后帶噪語音信號。
[0025]本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:
[0026]通過帶噪語音信號和噪聲信號確定功率譜迭代因子,基于功率譜迭代因子得到語音信號的中間功率譜,服務(wù)器能夠通過功率譜迭代因子對帶噪語音信號進(jìn)行跟蹤,使得每一幀帶噪語音信號在相減前后頻譜誤差減小,從而提高增強(qiáng)后的語音信號信噪比,大大減少了語音信號中夾雜的噪聲,提高了用戶的聽覺質(zhì)量。
【專利附圖】
【附圖說明】
[0027]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0028]圖1是本發(fā)明實施例提供的一種帶噪語音信號處理方法流程圖;
[0029]圖2是本發(fā)明實施例提供的一種帶噪語音信號處理方法流程圖;
[0030]圖3是本發(fā)明實施例提供的一種語音信號流轉(zhuǎn)示意圖;
[0031]圖4是本發(fā)明實施例提供的一種帶噪語音信號處理裝置結(jié)構(gòu)示意圖;
[0032]圖5是本發(fā)明實施例提供的一種服務(wù)器結(jié)構(gòu)示意圖。
【具體實施方式】
[0033]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進(jìn)一步地詳細(xì)描述。
[0034]圖1是本發(fā)明實施例提供的一種帶噪語音信號處理方法流程圖。參見圖1,該實施例的執(zhí)行主體為服務(wù)器,該方法包括:
[0035]101、根據(jù)帶噪語音信號的靜默段,獲取該帶噪語音信號中噪聲信號,該帶噪語音信號包括語音信號和噪聲信號,該帶噪語音信號為頻域信號。
[0036]102、對于該語音信號中的每一幀,根據(jù)該噪聲信號和該帶噪語音信號,獲取該語音信號的每一幀的功率譜迭代因子。
[0037]103、對于該語音信號中的每一幀,根據(jù)該帶噪語音信號、該噪聲信號的每一幀和上一幀的功率譜迭代因子,計算語音信號每一幀的中間功率譜。
[0038]104、根據(jù)該語音信號每一幀的中間功率譜和噪聲信號,計算該帶噪語音信號中每一中貞的信噪比。
[0039]105、根據(jù)該帶噪語音信號中每一幀的信噪比、該帶噪語音信號和該噪聲信號的每一幀,獲取時域的處理后帶噪語音信號。
[0040]本發(fā)明實施例提供的方法,通過帶噪語音信號和噪聲信號確定功率譜迭代因子,基于功率譜迭代因子得到語音信號的中間功率譜,服務(wù)器能夠通過功率譜迭代因子對帶噪語音信號進(jìn)行跟蹤,使得每一幀帶噪語音信號在相減前后頻譜誤差減小,從而提高增強(qiáng)后的語音信號信噪比,大大減少了語音信號中夾雜的噪聲,提高了用戶的聽覺質(zhì)量。
[0041]圖2是本發(fā)明實施例提供的一種帶噪語音信號處理方法流程圖。參見圖2,該實施例的執(zhí)行主體為服務(wù)器,該方法流程包括:
[0042]201、服務(wù)器根據(jù)帶噪語音信號的靜默段,獲取該帶噪語音信號中噪聲信號,該帶噪語音信號包括語音信號和噪聲信號,該帶噪語音信號為頻域信號。
[0043]在現(xiàn)實生活中,語音不可避免的會受到周圍環(huán)境噪聲的影響,因此原始語音信號中不僅包括語音信號,還包括了噪聲信號,該原始語音信號為時域信號。該原始語音信號可以表示為 y (m, n) =x (m, n) +d(m, η),其中,m 為中貞號,且 m=l, 2, 3,..., n=0, I, 2,..., N_l, N 為幀長,x(m,n)為時域的語音信號,d(m,η)為時域的噪聲信號。該服務(wù)器將該原始語音信號進(jìn)行傅里葉變換,將該原始語音信號變換為頻域信號,得到帶噪語音信號,該帶噪語音信號可以表示為¥(111,10=乂(111,10+0(111,10,其中,m為幀號,k為離散頻率,X(m,k)為頻域的語音信號,D(m,k)為頻域的噪聲信號。
[0044]該服務(wù)器用于對語音信號進(jìn)行去噪處理,該服務(wù)器可以為即時通信應(yīng)用的服務(wù)器、會議服務(wù)器等。
[0045]由于帶噪語音信號中帶有噪聲信號,為了降低噪聲信號對語音信號的影響,需要對帶噪語音信號中噪聲信號進(jìn)行檢測。步驟201具體為:服務(wù)器根據(jù)預(yù)設(shè)檢測算法對帶噪語音信號的靜默段進(jìn)行檢測,得到帶噪語音信號的靜默段,服務(wù)器得到帶噪語音信號的靜默段之后,可以將該帶噪語音信號靜默段對應(yīng)的幀確定噪聲信號。其中,靜默段是指帶噪語音信號中語音信號有停頓的時間段。
[0046]其中,預(yù)設(shè)檢測算法可以由技術(shù)人員在開發(fā)時設(shè)置,也可以由用戶在使用的過程中調(diào)整,本發(fā)明實施例對此不做限定。該預(yù)設(shè)檢測算法具體可以為語音活動檢測算法等。
[0047]202、對于該語音信號中的第m幀,服務(wù)器根據(jù)該噪聲信號和該帶噪語音信號的第
m_l幀,計算該語首/[目號的第m-Ι幀的方差of ?
[0048]具體地,對于該語音信號中的第m幀,服務(wù)器將該噪聲信號的第m-Ι幀D (m_l,k)的期望E{|D(m-l,k) I2}和該帶噪語音信號的第m-Ι幀Y(m-l,k)的期望E{| Y(m_l,k) |2},
代入公式大
【權(quán)利要求】
1.一種帶噪語音信號處理方法,其特征在于,所述方法包括: 根據(jù)帶噪語音信號的靜默段,獲取所述帶噪語音信號中噪聲信號,所述帶噪語音信號包括語音信號和噪聲信號,所述帶噪語音信號為頻域信號; 對于所述語音信號中的每一幀,根據(jù)所述噪聲信號和所述帶噪語音信號,獲取所述語音信號的每一幀的功率譜迭代因子; 對于所述語音信號中的每一幀,根據(jù)所述帶噪語音信號、所述噪聲信號的每一幀和上一幀的功率譜迭代因子,計算語音信號每一幀的中間功率譜; 根據(jù)所述語音信號每一幀的中間功率譜和噪聲信號,計算所述帶噪語音信號中每一幀的信噪比; 根據(jù)所述帶噪語音信號中每一幀的信噪比、所述帶噪語音信號和所述噪聲信號的每一幀,獲取時域的處理后帶噪語音信號。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,對于所述語音信號中的每一幀,根據(jù)所述噪聲信號和所述帶噪語音信號,獲取所述語音信號的每一幀的功率譜迭代因子包括: 對于所述語音信號中的第m幀,根據(jù)所述噪聲信號和所述帶噪語音信號的第m-Ι幀,計算所述語音信號的第m-1幀的方差Crs2,所述語音信號的第m-1幀的方差
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,對于所述語音信號中的每一幀,根據(jù)所述帶噪語音信號、所述噪聲信號的每一幀和上一幀的功率譜迭代因子,計算語音信號每一幀的中間功率譜包括: 根據(jù)所述帶噪語音信號、所述噪聲信號的第m-Ι幀和所述語音信號的第m幀的功率譜迭代因子,利用公式
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述帶噪語音信號中每一幀的信噪t匕、所述帶噪語音信號和所述噪聲信號的每一幀,獲取時域的處理后帶噪語音信號包括: 根據(jù)所述帶噪語音信號的第m幀的信噪比、所述帶噪語音信號和所述噪聲信號的第m幀以及所述噪聲信號的第m幀的掩蔽閾值,計算所述帶噪語音信號的第m幀的修正因子;根據(jù)所述帶噪語音信號的第m幀的信噪比和所述帶噪語音信號的第m幀的修正因子,計算所述帶噪語音信號的第m幀的傳遞函數(shù); 根據(jù)所述帶噪語音信號的第m幀的傳遞函數(shù)、所述帶噪語音信號的第m幀的幅度譜,計算處理后帶噪語音信號的第m幀的幅度譜; 以所述帶噪語音信號的相位作為處理后帶噪語音信號的相位,基于處理后帶噪語音信號的第m幀的幅度譜進(jìn)行傅里葉反變換,得到時域的處理后帶噪語音信號的第m幀。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)所述帶噪語音信號的第m幀的信噪t匕、所述帶噪語音信號和所述噪聲信號的第m幀以及所述噪聲信號的第m幀的掩蔽閾值,計算所述帶噪語音信號的第m幀的修正因子包括: 根據(jù)所述帶噪語音信號和所述噪聲信號的第m幀,計算所述噪聲信號的第m幀的掩蔽閾值;根據(jù)所述帶噪語音信號的第m幀的信噪比、所述帶噪語音信號和所述噪聲信號的第m幀以及所述噪聲信號的第m幀的掩蔽閾值,利用不等式
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)所述帶噪語音信號的第m幀的信噪比和所述帶噪語音信號的第m幀的修正因子,計算所述帶噪語音信號的第m幀的傳遞函數(shù)包括: 根據(jù)所述帶噪語音信號的第m幀的信噪比和所述帶噪語音信號的第m幀的修正因子,利用公式
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述語音信號每一幀的中間功率譜和噪聲信號,計算所述帶噪語音信號中每一幀的信噪比之后,所述方法還包括:對于所述語音信號的第m幀,根據(jù)所述帶噪語音信號的第m幀的信噪比和所述帶噪語音信號的第m幀,計算所述語音信號的第m幀的功率譜; 基于所述語音信號的第m幀的功率譜,計算所述語音信號的第m+1幀的功率譜迭代因子。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述語音信號每一幀的中間功率譜和噪聲信號,計算所述帶噪語音信號中每一幀的信噪比包括: 根據(jù)所述噪聲信號的第m-Ι幀和所述語音信號的第m幀的中間功率譜,利用公式
9.一種帶噪語音信號處理裝置,其特征在于,所述裝置包括: 噪聲信號獲取模塊,用于根據(jù)帶噪語音信號的靜默段,獲取所述帶噪語音信號中噪聲信號,所述帶噪語音信號包括語音信號和噪聲信號,所述帶噪語音信號為頻域信號; 功率譜迭代因子獲取模塊,用于對于所述語音信號中的每一幀,根據(jù)所述噪聲信號和所述帶噪語音信號,獲取所述語音信號的每一幀的功率譜迭代因子; 語音信號中間功率譜獲取模塊,用于對于所述語音信號中的每一幀,根據(jù)所述帶噪語音信號、所述噪聲信號的每一幀和上一幀的功率譜迭代因子,計算語音信號每一幀的中間功率譜; 信噪比獲取模塊,用于根據(jù)所述語音信號每一幀的中間功率譜和噪聲信號,計算所述帶噪語音信號中每一幀的信噪比; 帶噪語音信號處理模塊,用于根據(jù)所述帶噪語音信號中每一幀的信噪比、所述帶噪語音信號和所述噪聲信號的每一幀,獲取時域的處理后帶噪語音信號。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述功率譜迭代因子獲取模塊還用于對于所述語音信號中的第m幀,根據(jù)所述噪聲信號和所述帶噪語音信號的第m-Ι幀,計算所述語音信號的第m-Ι幀的方差 <,所述語音信號的第m-Ι幀的方差
11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述語音信號中間功率譜獲取模塊還用于根據(jù)所述帶噪語音信號、所述噪聲信號的第m-Ι幀和所述語音信號的第m幀的功率譜迭代因子,利用公式
12.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述帶噪語音信號處理模塊包括:修正因子獲取單元,用于根據(jù)所述帶噪語音信號的第m幀的信噪比、所述帶噪語音信號和所述噪聲信號的第m幀以及所述噪聲信號的第m幀的掩蔽閾值,計算所述帶噪語音信號的第m幀的修正因子; 傳遞函數(shù)獲取單元,用于根據(jù)所述帶噪語音信號的第m幀的信噪比和所述帶噪語音信號的第m幀的修正因子,計算所述帶噪語音信號的第m幀的傳遞函數(shù); 幅度譜獲取單元,用于根據(jù)所述帶噪語音信號的第m幀的傳遞函數(shù)、所述帶噪語音信號的第m幀的幅度譜,計算處理后帶噪語音信號的第m幀的幅度譜; 帶噪語音信號處理單元,用于以所述帶噪語音信號的相位作為處理后帶噪語音信號的相位,基于處理后帶噪語音信號的第m幀的幅度譜進(jìn)行傅里葉反變換,得到時域的處理后帶噪語音信號的第m幀。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述修正因子獲取單元還用于根據(jù)所述帶噪語音信號和所述噪聲信號的第m幀,計算所述噪聲信號的第m幀的掩蔽閾值;根據(jù)所述帶噪語音信號的第m幀的信噪比、所述帶噪語音信號和所述噪聲信號的第m幀以及所述噪聲信號的第m幀的掩蔽閾值,利用不等式
14.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述傳遞函數(shù)獲取單元還用于根據(jù)所述帶噪語音信號的第m幀的信噪比和所述帶噪語音信號的第m幀的修正因子,利用公式
15.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括: 語音信號功率譜獲取模塊,用于對于所述語音信號的第m幀,根據(jù)所述帶噪語音信號的第m幀的信噪比和所述帶噪語音信號的第m幀,計算所述語音信號的第m幀的功率譜;所述功率譜迭代因子獲取單元還用于基于所述語音信號的第m幀的功率譜,計算所述語音信號的第m+1幀的功率譜迭代因子。
16.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述信噪比獲取模塊還用于根據(jù)所述噪聲信號的第m-ι幀和所述語音信號的第m幀的中間功率譜,利用公式
17.一種服務(wù)器,其特征在于,所述服務(wù)器包括:處理器和存儲器,所述處理器與所述存儲器相連接, 所述處理器,用于根據(jù)帶噪語音信號的靜默段,獲取所述帶噪語音信號中噪聲信號,所述帶噪語音信號包括語音信號和噪聲信號,所述帶噪語音信號為頻域信號; 所述處理器還用于對于所述語音信號中的每一幀,根據(jù)所述噪聲信號和所述帶噪語音信號,獲取所述語音信號的每一幀的功率譜迭代因子; 所述處理器還用于對于所述語音信號中的每一幀,根據(jù)所述帶噪語音信號、所述噪聲信號的每一幀和上一幀的功率譜迭代因子,計算語音信號每一幀的中間功率譜;所述處理器還用于根據(jù)所述語音信號每一幀的中間功率譜和噪聲信號,計算所述帶噪語音信號中每一幀的信噪比; 所述處理器還用于根據(jù)所述帶噪語音信號中每一幀的信噪比、所述帶噪語音信號和所述噪聲信號的每一幀,獲取時域的處理后帶噪語音信號。
【文檔編號】G10L21/0232GK103632677SQ201310616654
【公開日】2014年3月12日 申請日期:2013年11月27日 優(yōu)先權(quán)日:2013年11月27日
【發(fā)明者】陳國明, 彭遠(yuǎn)疆, 莫賢志 申請人:騰訊科技(成都)有限公司