亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種語音信號處理方法及裝置的制作方法

文檔序號:2832074閱讀:307來源:國知局

專利名稱::一種語音信號處理方法及裝置的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及語音識別
技術(shù)領(lǐng)域
,特別是涉及一種語音信號處理方法及裝置。
背景技術(shù)
:語音識別技術(shù)經(jīng)過全球半個(gè)多世紀(jì)的研究,目前已經(jīng)開始逐步進(jìn)入實(shí)用階段。近年來語音芯片應(yīng)用越來越廣泛,主要包括電話通信中的語音撥號,語音身份認(rèn)證,語音輸入,汽車的語音控制,工業(yè)控制及醫(yī)療領(lǐng)域,個(gè)人數(shù)字助理(PersonalDigitalAssistant,PDA)的語音交互界面,智能玩具,家電遙控,等等。語音識別過程主要包括語音信號的預(yù)處理、語音識別特征提取、根據(jù)提取出的語音識別特征進(jìn)行模式匹配幾個(gè)部分。其中,語音信號識別最重要的一環(huán)就是語音識別特征的提取,提取的特征參數(shù)必須滿足以下要求(l)提取的特征參數(shù)能有效地代表語音特征,具有很好的區(qū)分性;(2)各階參數(shù)之間有良好的獨(dú)立性;(3)特征參數(shù)要計(jì)算方便,最好有高效的算法,以保證語音識別的實(shí)時(shí)實(shí)現(xiàn)。但是,在目前的語音識別系統(tǒng)中,由于傳輸語音信號的傳輸信道的影響,導(dǎo)致語音信號的特性發(fā)生了一定的變化,導(dǎo)致識別性能的下降。并且,這種問題對于不同的傳輸信道有不同程度的體現(xiàn)。因此,為了抑制或者抵消傳輸信道引入的信號畸變,需要采取措施消除信道干擾。
發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種語音信號處理方法及裝置,以解決語音信號的信道干擾問題。為了解決上述問題,本發(fā)明公開了一種語音信號處理方法,包括在對數(shù)倒譜域上,對當(dāng)前觀測到的語音信號進(jìn)行倒譜系數(shù)提取,得到觀測語音的對數(shù)倒譜;根據(jù)未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對數(shù)倒譜的估計(jì)值;將所述觀測語音的對數(shù)倒譜減去所述傳輸信道對數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜;所述未經(jīng)信道的語音信號對數(shù)倒譜即為語音信號與信道干擾的分離結(jié)果。其中,所述根據(jù)未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對數(shù)倒譜的估計(jì)值,具體包括計(jì)算E[Tc(K);hE[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對數(shù)倒譜,Sc(K)表示觀測語音的對數(shù)倒譜;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值;當(dāng)傳輸信道上存在語音信號時(shí),對上述公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranC印(K)j二TranC印(K)w(1-q)+(Sc(K)-RefC印(K))q;其中,TranCep(K)表示傳輸信道對數(shù)倒譜的估計(jì)值,j為幀序號,^為平滑因子。優(yōu)選的,所述方法還包括當(dāng)傳輸信道上不存在語音信號時(shí),對上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranCep(K)j二TranC6p(K)H(l-《)+Sc(K)《;其中,^與"2的取值不同。優(yōu)選的,所述方法還包括利用觀測到的語音信號的信噪比,將利用A和"2計(jì)算TranCep(K)的兩個(gè)公式綜合如下TranC印(K)j4ranC印00^(1—%)+(Sc(K)-RefC印(K))^+Sc(K)爲(wèi);其中,A+A="3,A和A根據(jù)所述信噪比確定。優(yōu)選的,所述方法還包括根據(jù)公式1^106(^+1=1^忙6(^(1-力+^<《)^利用當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜Xc(K),更新未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中^為一個(gè)小量,且/<"。本發(fā)明還4是供了一種語音信號處理裝置,包括倒譜系數(shù)提取單元,用于在對數(shù)倒譜域上,對當(dāng)前觀測到的語音信號進(jìn)行倒譜系數(shù)提取,得到觀測語音的對數(shù)倒譜;信道對數(shù)倒譜估算單元,用于根據(jù)未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對數(shù)倒譜的估計(jì)值;干擾分離單元,用于將所述觀測語音的對數(shù)倒譜減去所述傳輸信道對數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜;所述未經(jīng)信道的語音信號對凄t倒譜即為語音信號與信道干擾的分離結(jié)果。其中,所述信道對數(shù)倒譜估算單元包括均值計(jì)算子單元,用于計(jì)算E[Tc(K)]-E[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對數(shù)倒譜,Sc(K)表示觀測語音的對數(shù)倒譜;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值;第一估算子單元,用于當(dāng)傳輸信道上存在語音信號時(shí),對上述公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranC印(K),TranC印(K)」—i)+(Sc(K)-RefC印(K))《;其中,TranCep(K)表示傳輸信道對數(shù)倒鐠的估計(jì)值,j為幀序號,cd為平滑因子。優(yōu)選的,所述信道對數(shù)倒譜估算單元還包括第二估算子單元,用于當(dāng)傳輸信道上不存在語音信號時(shí),對上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranCep(K)j二TranCepOOH(1-c^)+Sc(K)《;其中,",與"2的取值不同。優(yōu)選的,所述信道對數(shù)倒譜估算單元還包括綜合估算子單元,用于利用觀測到的語音信號的信噪比,將利用%和"2計(jì)算TranC印(K)的兩個(gè)公式綜合如下TranC印(K),TranC印00^(1—^)+(Sc(K)—RefC印(K))^+Sc(K)爲(wèi);其中,A+A=or3,A和A根據(jù)所述信噪比確定。優(yōu)選的,所述裝置還包括更新單元,用于根據(jù)公式RefCep(K)j+廣RefCep(K)j(l-力+Zc(幻y,利用當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜Xc(K),更新未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中7為一個(gè)小量,且^<"。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)首先,本發(fā)明在提取語音識別特征的過程中,將M^測到的語音信號轉(zhuǎn)換為對數(shù)倒譜,并通過未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,來估算傳輸信道的對數(shù)倒鐠;然后,將所述觀測語音的對數(shù)倒譜減去傳輸信道對數(shù)倒譜的估計(jì)值,從而在倒譜域,將語音信號與傳輸信道的干擾分離開來,提取出未經(jīng)信道的語音信號對數(shù)倒譜。這種方法可以消除傳輸信道對語音信號的干擾,提高語音識別特征提取過程中抗傳輸信道干擾的能力,從而提高識別率。而且,在估算傳輸信道的對數(shù)倒譜的過程中,采用低通濾波的方法,利用當(dāng)前幀以及前幾幀的信號就能計(jì)算出近似的均值,因此能夠滿足語音識別特征實(shí)時(shí)提取的需求。其次,本發(fā)明提供的傳輸信道對數(shù)倒譜的估算方法,能夠?qū)φZ音段(即傳輸信道上存在語音信號的情況)和非語音段(即傳輸信道上不存在語音信號的情況)進(jìn)行不同處理,即分別采用不同的估算公式,從而更精確地估算出非語音段的傳輸信道對數(shù)倒譜,進(jìn)一步提高抗信道干擾的能力。再次,本發(fā)明根據(jù)實(shí)際說話人的特點(diǎn),每幀語音信號的計(jì)算過程中都利用當(dāng)前計(jì)算得出的未經(jīng)信道的語音信號對數(shù)倒譜,來更新未經(jīng)信道的語音信號對數(shù)倒語的統(tǒng)計(jì)均值(初始值是一個(gè)常量),從而使所述統(tǒng)計(jì)均值更接近說話人的個(gè)性特征。圖1是本發(fā)明實(shí)施例一所述一種語音信號處理方法流程圖2是本發(fā)明實(shí)施例所述語音識別特征4是取的流程圖3是本發(fā)明裝置實(shí)施例所述一種語音信號處理裝置結(jié)構(gòu)圖4是本發(fā)明圖3中信道對數(shù)倒譜估算單元U32的結(jié)構(gòu)圖5是本發(fā)明圖3中信道對數(shù)倒譜估算單元U32的另一結(jié)構(gòu)圖6是本發(fā)明另一裝置實(shí)施例所述一種語音信號處理裝置結(jié)構(gòu)圖。具體實(shí)施例方式為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。本發(fā)明提供了一種語音信號處理方法,該方法適用于一般的信道傳輸情況,一般的信道滿足信道屬于巻積信道;信道特性比較穩(wěn)定,變化緩慢;語音信號的倒鐠特征從長期統(tǒng)計(jì)來看,趨于常量。因此,對于一般的信道傳輸,有如下關(guān)系假設(shè)未經(jīng)信道的語音信號(即理想情況下的均衡信道的語音信號)為x(n):傳輸信道為t(n),則根據(jù)巻積信道的性質(zhì),觀測到的語音信號s(n)為s(n)=x(n)*t(n)(中間符號為巻積)(1.1)上述公式(1.1)在頻域有S(i),T(i)上述公式(1.1)在對數(shù)倒譜域有Sc(K)=Xc(K)+Tc(K)(1.2)即在對數(shù)倒譜域,觀測語音的對數(shù)倒譜Sc(K)等于未經(jīng)信道的語音信號對數(shù)倒譜Xc(K)加上傳輸信道的對數(shù)倒譜Tc(K)。其中,K是倒譜參數(shù)。本發(fā)明正是利用公式(1.2),在倒譜域上,通過對觀測到的語音信號進(jìn)行處理,將語音信號與傳輸信道的千擾分離開來,從而消除傳輸信道對語音信號的干擾,提取出未經(jīng)信道的語音信號對數(shù)倒語,即提取出語音信號的均衡倒譜特征。本發(fā)明所述消除信道干擾的實(shí)現(xiàn)原理如下根據(jù)公式(1.2),得到未經(jīng)信道的語音信號或者均衡的語音信號在對數(shù)倒譜域?yàn)閄c(K)=Sc(K)-Tc(K)(1.3)其中,Sc(K)可以根據(jù)觀測信號計(jì)算得出。因此,提取Xc(K)的關(guān)鍵是估計(jì)傳輸信道的對數(shù)倒譜Tc(K)。下面將通過實(shí)施例詳細(xì)說明消除信道干擾的方法。實(shí)施例一參照圖1,是實(shí)施例所述一種語音信號處理方法流程圖。S101,在對數(shù)倒i普域上,對當(dāng)前觀測到的語音信號進(jìn)行倒譜系數(shù)提取,得到觀測語音的對數(shù)倒譜Sc(K);倒語系數(shù)提取是語音識別處理過程中的一個(gè)常用步驟,而梅爾倒頻譜系數(shù)(Mel-scaleFrequencyCepstralCoefficients,簡稱MFCC)在語音識別中是常用的特征參數(shù)之一。MFCC模擬了人耳的聽覺特性,能夠反映人對語音的感知特性,從說話人的語音信號中提取出說話人的個(gè)性特征,在語音識別實(shí)際應(yīng)用中取得了較高的識別率。本實(shí)施例可采用標(biāo)準(zhǔn)的MFCC系數(shù)提取算法,該算法首先用FFT(FastFourierTransform,快速傅里葉變換)將時(shí)域信號轉(zhuǎn)化成頻域,之后對其對數(shù)能量譜用依照Mel刻度分布的三角濾波器組進(jìn)行巻積,最后對各個(gè)濾波器的輸出構(gòu)成的向量進(jìn)行離散余弦變換(DCT變換),取前N個(gè)系數(shù)。由于該算法屬于公知內(nèi)容,因此在此不再詳述。S102,根據(jù)未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對數(shù)倒語的估計(jì)值;本步驟即估算傳輸信道的對數(shù)倒譜Tc(K),本實(shí)施例釆用的估算方法如下第一步,利用公式(1.3)計(jì)算傳輸信道對數(shù)倒譜Tc(K)的統(tǒng)計(jì)均值E[Tc(K)],具體為用E[X]表示計(jì)算X的統(tǒng)計(jì)均值,X可以表示公式中的Xc(K)、Sc(K)、Tc(K);根據(jù)公式(1.3),有E[Xc(K)]=E[Sc(K)]-E[Tc(K)]即E[Tc(K)]=E[Sc(K)]-E[Xc(K)]=E[Sc(K)]-RefCep(K)=E[Sc(K)-RefCep(K)](1.4)其中,RefCep(K)表示未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,即E[Xc(K)]=RefCep(K)。所述RefCep(K)是預(yù)先根據(jù)在均衡-信道下(理想情況)的語音信號對數(shù)倒譜特征矢量經(jīng)過長期統(tǒng)計(jì)得到,K-l一N,N—般取12。由于RefCep(K)為一常量,所以對RefCep(K)取均值仍為一常量,即E[RefCep(K)]=RefCep(K)。第二步,釆用^^通濾波的方法來近似所述均值E[Tc(K)],得到傳輸信道對數(shù)倒語的估計(jì)值;在公式(1.4)中,由于E[Sc(K)-RefCep(K)]需要長期數(shù)據(jù)統(tǒng)計(jì)得到,才能進(jìn)一步得出E[Tc(K)],所以本實(shí)施例通過求近似值的方法來估計(jì)E[Tc(K)]的值。為了滿足實(shí)時(shí)的需求,針對公式(1.4),本實(shí)施例采用低通濾波的方法來近似E[X]。所述低通濾波是指容許低頻信號通過,但減弱(或減少)頻率高于截止頻率的信號的通過,即去掉高頻干擾,從而降低采樣頻率,避免頻率混淆。低通濾波的方法有多種,在此不作限定。本實(shí)施例采用的是一階IIR(無限長沖激響應(yīng))低通濾波,得到TranC印(K)j二TranC印(K)w(1-q)+(Sc(K)-RefC印(K))q(1.5)其中,TranCep(K)表示傳輸信道對數(shù)倒譜的估計(jì)值,j為幀序號,%為平滑因子。上述公式(1.5)的物理含義是濾出MFCC系數(shù)變化緩慢的部分,逼近均值,因此可以利用公式(1,5)的計(jì)算結(jié)果TranC印(K)來近似均值E[Tc(K)]。由公式(1.5)可知,本實(shí)施例利用當(dāng)前幀以及前一幀的信號,就能計(jì)算出近似的傳輸信道對數(shù)倒譜的均值,并將該近似均值作為Tc(K)的估計(jì)值,因此能夠滿足語音識別特征實(shí)時(shí)提取的需求。S103,將所述觀測語音的對數(shù)倒語Sc(K)減去所述傳輸信道對數(shù)倒譜的估計(jì)值TmnCep(K),得到當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜Xc(K);所述未經(jīng)信道的語音信號對數(shù)倒譜Xc(K)即為語音信號與信道干擾的分離結(jié)果。上述SIOI計(jì)算出了Sc(K),S102計(jì)算出了Tc(K)的估計(jì)值,根據(jù)公式(1.3),即可得到Xc(K)。當(dāng)語音信號經(jīng)過信道傳輸時(shí),消除信道干擾后的語音信號對數(shù)倒i普即為Xc(K)。綜上所迷,^是取未經(jīng)信道的語音信號對數(shù)倒譜Xc(K)的計(jì)算方法總結(jié)如下Xc(K)=Sc(K)-TranC印(K)(1.6)TraiC印0Oj二TranC印0Owa—c^+(Sc00—RefC印(K))《(1,5)其中,TranCep(K)初值為0,RefCep(K)通過預(yù)先統(tǒng)計(jì)得出。上述方法可以消除傳輸信道對語音信號的干擾,提高語音識別特征提取過程中抗傳輸信道干擾的能力,從而提高識別率。實(shí)施例二上述實(shí)施例一的方法只考慮了傳輸信道上存在語音信號的情況(即語音段),但對于傳輸信道上不存在語音信號的情況(即非語音段),則傳輸信道對數(shù)倒譜的估算方法不能采用公式(1.5),而應(yīng)該采用下述公式TranCep(K)j;TranCep(K)H(H^)+Sc(K)%(1.7)其中,TranC印(K)表示傳輸信道對數(shù)倒譜的估計(jì)值,j為幀序號,"2也為平滑因子,但與A的取值不同。在現(xiàn)有技術(shù)中,很多去信道干擾的方法都沒有考慮非語音段的處理,例如頻域基于LMS(LeastMeanSquare,最小均方)的盲均衡方法和倒譜域基于LMS的盲均衡方法,這兩種方法都是一種盲均衡方法,通過LMS算法,最小化觀測語音特征與參考語音特征的誤差,從而得到收斂的均衡語音特征參數(shù)。所述第一種方法在頻譜域,第二種方法在倒譜域,而在倒譜域做基于LMS的盲均衡可以使得計(jì)算量更小,收斂效果更好。但是在非語音段,盲均衡算法可能會帶來錯(cuò)誤的收斂,從而影響語音識別特征的提取。針對此問題,本實(shí)施例能夠?qū)φZ音段和非語音段進(jìn)行不同處理,即分別采用不同的傳輸信道對數(shù)倒譜的估算公式,從而更精確地估算出非語音段的傳輸信道對數(shù)倒i普,進(jìn)一步提高抗信道干擾的能力。優(yōu)選的,本實(shí)施例還可以利用觀測到的語音信號的信噪比(SNR),將利用^和"2計(jì)算TranCep(K)的兩個(gè)公式(1.5)和(1.7)綜合如下<formula>formulaseeoriginaldocumentpage12</formula>其中,"3也為平滑因子,A與A、"2的關(guān)系是在語音段,"3即為"1;在非語音段,"3即為"2。A+A="3,A和A根據(jù)信噪比確定。信噪比指信號中原有部分和由于設(shè)備自身、環(huán)境干擾等原因造成的噪聲的比例,通常以"SNR,,或"S/N"表示,一般用分貝(dB)為單位,信噪比越高越好。A和A滿足當(dāng)SNR高時(shí),A〉>A;當(dāng)SNR低時(shí),AA,詳見下表:<table>tableseeoriginaldocumentpage13</column></row><table>表1綜上所述,未經(jīng)信道的語音信號對數(shù)倒譜Xc(K)的計(jì)算方法為Xc(K)=Sc(K)-TranCep(K)(1.6)TranC印(K)^TranC印(K)j—,(1-+(Sc(K)-RefC印(K))^+Sc(K)"2(1.8)根據(jù)表1,如果SNR>=0dB,則"3=%,否則"3="2。即SNR為OdB是語音段和非語音段的臨界點(diǎn)。實(shí)施例三在上述計(jì)算過程中,未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K),是通過預(yù)先統(tǒng)計(jì)得出的一個(gè)常量,僅表示一個(gè)普遍適用的均值。本實(shí)施例為了使該值更接近每個(gè)說話人的個(gè)性特征,根據(jù)實(shí)際說話人的特點(diǎn),在每幀語音信號的計(jì)算過程中都利用當(dāng)前計(jì)算得出的未經(jīng)信道的語音信號對數(shù)倒譜Xc(K)來更新RefCep(K),具體如下'.RefCep(K)j^RefCep(K)j(l-;r)+Xc,(1.9)其中^為一個(gè)小量,且"<"。即針對每個(gè)說話人的語音信號,RefCep(K)初始值為統(tǒng)計(jì)得出的常量,在計(jì)算完當(dāng)前幀的Xc(K)后,根據(jù)公式(1.9)利用該Xc(K)更新RefCep(K),所述更新后的RefCep(K)用于下一幀的計(jì)算。這樣,i兌話人不同,更新得到的RefCep(K)也不同,RefCep(K)更接近說話人的個(gè)性特征,可以提高語音識別率。在實(shí)際應(yīng)用中,為了達(dá)到更好的效果,可以在傳輸信道對數(shù)倒i普的估計(jì)值TranCep(K)收斂的時(shí)候,并且信噪比SNR較高的情況下進(jìn)行更新?;谏鲜鋈齻€(gè)實(shí)施例的說明,利用本發(fā)明提取語音識別特征的方法如圖2所示。5201,對觀測到的語音信號s(n)進(jìn)行語音增強(qiáng)處理,得到增強(qiáng)后的語音信號s,(n);本步驟是預(yù)處理步驟。語音增強(qiáng)的目的是從有噪聲的語音信號中提取盡可能純凈的原始語音,目前常用的增強(qiáng)算法^f艮多,如減i普法或維納濾波算法等,本實(shí)施例不作詳細(xì)說明。5202,對增強(qiáng)后的語音信號s,(n)進(jìn)行MFCC系數(shù)提取,得到觀測語音的對數(shù)倒語Sc(K);S203,利用長期語音對數(shù)倒譜特征均值RefCep(K)以及觀測信號的信噪比,消除信道干擾,得到語音均衡倒譜特征。所述RefCep(K)即指上文的未經(jīng)信道的語音信號對lt倒譜的統(tǒng)計(jì)均值,所述語音均衡倒語特征即為提取出的語音識別特征,該語音識別特征用于后續(xù)的模式匹配識別過程?;谝陨蟽?nèi)容,為了說明本發(fā)明所述消除信道干擾方法的性能,下面通過測試?yán)舆M(jìn)行對比說明。該測試?yán)捎肏TK工具包作為語音識別的工具,采用標(biāo)準(zhǔn)的MFCC系數(shù)及其一階二階導(dǎo)數(shù)作為特征參數(shù)。測試序列分為三組A、B、C,每組50個(gè)數(shù)字串,每個(gè)數(shù)字串包含8個(gè)數(shù)字,即每組測試序列包含400個(gè)數(shù)字。A為與訓(xùn)練數(shù)據(jù)相同信道下采集的一組數(shù)據(jù),B為與訓(xùn)練數(shù)據(jù)不同信道信噪比較高下采集的一組數(shù)據(jù),C為與訓(xùn)練數(shù)據(jù)不同信道信噪比較低下采集的一組數(shù)據(jù)。測試的情況為以下5種1、不應(yīng)用去信道干擾方法;2、采用現(xiàn)有的LMS盲均衡算法;3、采用本發(fā)明的(1.5)、(1.6)式構(gòu)成的實(shí)例;4、采用本發(fā)明的(1.6)、(1.8)式構(gòu)成的實(shí)例;5、采用本發(fā)明的(1.9)式構(gòu)成的實(shí)例;才艮據(jù)上面的5種情況,分別進(jìn)行A、B、C三組序列的語音識別測試。識別結(jié)果如下表所示(注錯(cuò)誤率減小是相對測試1為基準(zhǔn))<table>tableseeoriginaldocumentpage15</column></row><table>表2從表中數(shù)據(jù)可見,本發(fā)明提供的去信道干擾方法,對與訓(xùn)練數(shù)據(jù)不同信道下采集的測試序列有較好的改進(jìn)作用。并且,本發(fā)明所述的方法與現(xiàn)有方法相比,錯(cuò)誤率進(jìn)一步減小。針對上述實(shí)施例的說明,本發(fā)明還提供了相應(yīng)的裝置實(shí)施例。參照圖3,是實(shí)施例所述一種語音信號處理裝置結(jié)構(gòu)圖。所述裝置主要包括倒語系數(shù)提取單元U31,用于在對數(shù)倒譜域上,對當(dāng)前觀測到的語音信號進(jìn)行倒i普系數(shù)提取,得到觀測語音的對數(shù)倒譜;信道對凄t倒譜估算單元U32,用于根據(jù)未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對數(shù)倒譜的估計(jì)值;干擾分離單元U33,用于將所述觀測語音的對數(shù)倒譜減去所述傳輸信道對數(shù)倒鐠的估計(jì)值,得到當(dāng)前未經(jīng)信道的語音信號對數(shù)倒語;所述未經(jīng)信道的語音信號對數(shù)倒譜即為語音信號與信道干擾的分離結(jié)果。其中,參照圖4,所述信道對數(shù)倒譜估算單元U32可以進(jìn)一步包括均值計(jì)算子單元U321,用于計(jì)算E[Tc(K)]=E[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對數(shù)倒譜,Sc(K)表示觀測語音的對數(shù)倒i普;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值;第一估算子單元U322,用于當(dāng)傳輸信道上存在語音信號時(shí),對上述公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranC印(K)^TranC印(K)h"-^)+(Sc(K)-RefC印(K))《;其中,TranCep(K)表示傳輸信道對數(shù)倒譜的估計(jì)值,j為幀序號,cd為平滑因子。優(yōu)選的,參照圖5,所述信道對數(shù)倒譜估算單元U32還可以包括第二估算子單元U323,用于當(dāng)傳輸信道上不存在語音信號時(shí),對上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranCepOOj二TranC6p(K)j—認(rèn)l一《)+Sc(K)《;其中,"!與"2的取值不同。優(yōu)選的,所述信道對數(shù)倒譜估算單元U32還可以包括綜合估算子單元,用于利用觀測到的語音信號的信噪比,將利用%和"2計(jì)算TranCep(K)的兩個(gè)公式綜合如下TranC印(K)j二TranC印00^^-^)+(Sc(K)-RefC印(K)+Sc(K)/2;其中,A+A="3,^和A根據(jù)所述信噪比確定。優(yōu)選的,參照圖6,所述裝置還可以包括更新單元U34,用于根據(jù)公式RefCep(K)j+嚴(yán)RefC:ep(K)j(l-力+Xc(iQ^利用當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜Xc(K),更新未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中7為一個(gè)小量,且"<"。本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。對于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較筒單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上對本發(fā)明所提供的一種消除傳輸信道對語音信號影響的方法及裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。權(quán)利要求1、一種語音信號處理方法,其特征在于,包括在對數(shù)倒譜域上,對當(dāng)前觀測到的語音信號進(jìn)行倒譜系數(shù)提取,得到觀測語音的對數(shù)倒譜;根據(jù)未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對數(shù)倒譜的估計(jì)值;將所述觀測語音的對數(shù)倒譜減去所述傳輸信道對數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜;所述未經(jīng)信道的語音信號對數(shù)倒譜即為語音信號與信道干擾的分離結(jié)果。2、根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對數(shù)倒譜的估計(jì)值,具體包括計(jì)算E[Tc(K)]=E[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對數(shù)倒譜,Sc(K)表示觀測語音的對數(shù)倒譜;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值;當(dāng)傳輸信道上存在語音信號時(shí),對上述公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranC印(K)j二TranC印00^(1-^)+(Sc(K)-RefC印(K))《;其中,TranCep(K)表示傳輸信道對數(shù)倒譜的估計(jì)值,j為幀序號,%為平滑因子。3、根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括當(dāng)傳輸信道上不存在語音信號時(shí),對上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranCep(K)j二TranCep(K)H(1-《)+Sc(K)《;其中,A與"2的取值不同。4、根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括利用觀測到的語音信號的信噪比,將利用%和"2計(jì)算TranCep(K)的兩個(gè)公式綜合如下TranC印(K)」TranC印(K)」—i(卜%)+(Sc(K)-RefC印(K))^+Sc(K)/2;其中,A+A="3,A和A根據(jù)所述信噪比確定。5、根據(jù)權(quán)利要求2至4任一所述的方法,其特征在于,還包括根據(jù)公式RefCep(K)j,RefCep(K)j(l-力+^(iO^利用當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜Xc(K),更新未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中Z為一個(gè)小量,且^<"。6、一種語音信號處理裝置,其特征在于,包括倒譜系數(shù)提取單元,用于在對數(shù)倒譜域上,對當(dāng)前觀測到的語音信號進(jìn)行倒譜系數(shù)提取,得到觀測語音的對數(shù)倒譜;信道對數(shù)倒譜估算單元,用于根據(jù)未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對數(shù)倒語的估計(jì)值;干擾分離單元,用于將所述觀測語音的對數(shù)倒譜減去所述傳輸信道對數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語音信號對數(shù)倒鐠;所述未經(jīng)信道的語音信號對數(shù)倒譜即為語音信號與信道干擾的分離結(jié)果。7、根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述信道對數(shù)倒譜估算單元包括均值計(jì)算子單元,用于計(jì)算E[Tc(K)]=E[Sc(K)-RefCep(K)];其中,Tc(K)表示傳輸信道的對數(shù)倒i普,Sc(K)表示觀測語音的對數(shù)倒譜;E[X]表示計(jì)算X的統(tǒng)計(jì)均值;RefCep(K)表示未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值;第一估算子單元,用于當(dāng)傳輸信道上存在語音信號時(shí),對上述公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranC印(K)^TranCep(K)卜"1-q)+(Sc(K)-RefCep(K))《;其中,TranCep(K)表示傳輸信道對數(shù)倒譜的估計(jì)值,j為幀序號,cd為平滑因子。8、根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述信道對數(shù)倒譜估算單元還包括第二估算子單元,用于當(dāng)傳輸信道上不存在語音信號時(shí),對上述計(jì)算E[Tc(K)]的公式進(jìn)行低通濾波來近似E[Tc(K)],得到TranCep(lOj=TrariCep(K)H(l—《)+Sc(K)%;其中,<^與"2的取值不同。9、根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述信道對數(shù)倒譜估算單元還包括綜合估算子單元,用于利用觀測到的語音信號的信噪比,將利用%和"2計(jì)算TranCep(K)的兩個(gè)公式綜合如下TranC印(K)」二T週C印(K)」—}(1,)+(Sc(K)-RefC印(K))+Sc(K)々2;其中,A+A="3,A和A根據(jù)所述信噪比確定。10、根據(jù)權(quán)利要求7至9任一所述的裝置,其特征在于,所述裝置還包括更新單元,用于根據(jù)公式RefCep(K)j+嚴(yán)RefCep(K)j(l-力+Zc(iq;K,利用當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜Xc(K),更新未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值RefCep(K);其中^為一個(gè)小量,且7<"。全文摘要本發(fā)明提供了一種語音信號處理方法及裝置,以解決語音信號的信道干擾問題。所述方法包括在對數(shù)倒譜域上,對當(dāng)前觀測到的語音信號進(jìn)行倒譜系數(shù)提取,得到觀測語音的對數(shù)倒譜;根據(jù)未經(jīng)信道的語音信號對數(shù)倒譜的統(tǒng)計(jì)均值,估算得到傳輸信道對數(shù)倒譜的估計(jì)值;將所述觀測語音的對數(shù)倒譜減去所述傳輸信道對數(shù)倒譜的估計(jì)值,得到當(dāng)前未經(jīng)信道的語音信號對數(shù)倒譜;所述未經(jīng)信道的語音信號對數(shù)倒譜即為語音信號與信道干擾的分離結(jié)果。本發(fā)明可以消除語音信號的信道干擾,提高語音識別特征提取過程中抗傳輸信道干擾的能力,從而提高識別率。文檔編號G10L21/02GK101533642SQ20091007833公開日2009年9月16日申請日期2009年2月25日優(yōu)先權(quán)日2009年2月25日發(fā)明者馮宇紅,晨張申請人:北京中星微電子有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1