專利名稱:語音增強(qiáng)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音增強(qiáng)(speech enhancement)技術(shù)。
背景技術(shù):
語音增強(qiáng)技術(shù)是一種將接收到的語音信號(hào)予以濾除不必要的噪音干擾以增強(qiáng)該 語音內(nèi)容的方法。其可使用于語音通訊、語音人機(jī)界面(user voice interface)、語音輸入 (voice input)及其它各種應(yīng)用。近年來,隨著各種移動(dòng)裝置、車用電子和機(jī)器人的快速發(fā) 展,在具有噪音干擾的環(huán)境中進(jìn)行語音通訊、語音輸入或語音人機(jī)互動(dòng)的機(jī)率日漸提高,如 何濾除噪聲以增強(qiáng)語音內(nèi)容,提高語音通訊或語音人機(jī)互動(dòng)的質(zhì)量,成為此領(lǐng)域的重要課 題。
一般而言,通過麥克風(fēng)所擷取到的語音信號(hào),均包含了目標(biāo)音源和干擾音源。該干 擾音源會(huì)造成語音通訊或語音人機(jī)互動(dòng)的困難度升高。為提升語音通訊或語音人機(jī)互動(dòng)的 質(zhì)量,勢(shì)必需要降低干擾音源對(duì)整體聲音信號(hào)所造成的干擾。先前許多語音增強(qiáng)技術(shù)使用 了濾波器、適應(yīng)性濾波器、統(tǒng)計(jì)模型等方法,結(jié)合單一麥克風(fēng)來進(jìn)行語音增強(qiáng),然其效能均 有其限制。近年來,使用多麥克風(fēng)進(jìn)行語音增強(qiáng)的技術(shù)因其效能普遍來說,較使用單一麥克 風(fēng)較佳,因此開始受到重視。然而,該類技術(shù)所需運(yùn)算量較大,通常無法使用在運(yùn)算資源受 到限制的移動(dòng)裝置上。因此,一搭配麥克風(fēng)陣列且運(yùn)算相對(duì)簡(jiǎn)單的語音增強(qiáng)方法,而仍能達(dá) 成有效降低干擾音源的目的,將會(huì)成為極具價(jià)值的發(fā)明。本發(fā)明即提供該語音增強(qiáng)方法。發(fā)明內(nèi)容
本發(fā)明的目的在于揭示一種語音增強(qiáng)方法,搭配麥克風(fēng)陣列且運(yùn)算相對(duì)簡(jiǎn)單的語 音增強(qiáng)方法,能達(dá)成有效降低干擾音源的目的。
為了達(dá)到上述目的,本發(fā)明揭示一種語音增強(qiáng)方法,包含下列步驟利用一麥克風(fēng) 陣列接收多個(gè)音框的聲音信號(hào);計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該多個(gè)麥克風(fēng)中的至 少一雙麥克風(fēng)組合的兩耳時(shí)間差(inter-aural time difference);根據(jù)該計(jì)算結(jié)果統(tǒng)計(jì) 各音框的聲音信號(hào)的兩耳時(shí)間差的累積直方圖(cumulative histogram);根據(jù)該些累積直 方圖計(jì)算一第一兩耳時(shí)間差門坎值;以及根據(jù)該第一兩耳時(shí)間差門坎值過濾該些音框的聲 音信號(hào)。
本發(fā)明還揭不一種語音增強(qiáng)系統(tǒng),包含一麥克風(fēng)陣列、一累積直方圖模塊、一第一 兩耳時(shí)間差門坎值計(jì)算模塊以及一聲音信號(hào)過濾模塊。該兩耳時(shí)間差計(jì)算模塊用以計(jì)算各 音框的聲音信號(hào)于各頻段對(duì)應(yīng)該多個(gè)麥克風(fēng)中的至少一雙麥克風(fēng)組合的兩耳時(shí)間差。該累 積直方圖模塊用以計(jì)算各音框兩耳時(shí)間差的累積直方圖。該第一兩耳時(shí)間差門坎值計(jì)算模 塊用以計(jì)算基于累積直方圖的第一兩耳時(shí)間差門坎值。該聲音信號(hào)過濾模塊用以過濾基于 第一兩耳時(shí)間差門坎值的聲音信號(hào)。
本發(fā)明還揭示一種語音增強(qiáng)方法,包含下列步驟利用一麥克風(fēng)陣列接收多個(gè)音 框的聲音信號(hào);計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該多個(gè)麥克風(fēng)中的至少一雙麥克風(fēng)組合的兩耳時(shí)間差;根據(jù)該計(jì)算結(jié)果統(tǒng)計(jì)各音框的聲音信號(hào)的兩耳時(shí)間差的直方圖和累積直 方圖;根據(jù)該些累積直方圖計(jì)算一第一兩耳時(shí)間差門坎值;根據(jù)該些直方圖和該第一兩耳 時(shí)間差門坎值計(jì)算一第二兩耳時(shí)間差門坎值;以及根據(jù)該第一兩耳時(shí)間差門坎值和該第二 兩耳時(shí)間差門坎值過濾該些音框的聲音信號(hào)。其中,該第二兩耳時(shí)間差門坎值大于該第一 兩耳時(shí)間差門坎值。
本發(fā)明還揭示語音增強(qiáng)系統(tǒng),包含一麥克風(fēng)陣列、一累積直方圖模塊、一第一兩耳 時(shí)間差門坎值計(jì)算模塊、一第二兩耳時(shí)間差門坎值計(jì)算模塊以及一聲音信號(hào)過濾模塊。該 兩耳時(shí)間差計(jì)算模塊用以計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該多個(gè)麥克風(fēng)中的至少一 雙麥克風(fēng)組合的兩耳時(shí)間差。該累積直方圖模塊用以計(jì)算各音框兩耳時(shí)間差的累積直方 圖。該第一兩耳時(shí)間差門坎值計(jì)算模塊用以計(jì)算基于累積直方圖的第一兩耳時(shí)間差門坎 值。該第二兩耳時(shí)間差門坎值計(jì)算模塊用以計(jì)算基于直方圖和該第一兩耳時(shí)間差門坎值的 第二兩耳時(shí)間差門坎值。該聲音信號(hào)過濾模塊用以過濾基于第一兩耳時(shí)間差門坎值和該第 二兩耳時(shí)間差門坎值的聲音信號(hào)。
也以下結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述,但不作為對(duì)本發(fā)明的限定。
圖1顯示本發(fā)明的一實(shí)施例的語音增強(qiáng)系統(tǒng)的示意圖2顯示本發(fā)明的一實(shí)施例的語音增強(qiáng)方法的流程圖3顯不本發(fā)明的一實(shí)施例的聲音信號(hào)的時(shí)域和頻域圖4顯示本發(fā)明的一實(shí)施例所計(jì)算的兩耳時(shí)間差的累積直方圖5顯示本發(fā)明的另一實(shí)施例所計(jì)算的兩耳時(shí)間差的累積直方圖6顯示本發(fā)明的另一實(shí)施例的語音增強(qiáng)方法的流程圖7顯示本發(fā)明的一實(shí)施例所計(jì)算的兩耳時(shí)間差的直方圖;以及
圖8顯示本發(fā)明的另一實(shí)施例所計(jì)算的兩耳時(shí)間差的直方圖;以及
圖9顯示本發(fā)明的一實(shí)施例的語音增強(qiáng)系統(tǒng)的示意圖。
其中,附圖標(biāo)記
100語音增強(qiáng)系統(tǒng)
102麥克風(fēng)陣列
150目標(biāo)音源
160干擾音源
201 205 步驟
601 606 步驟具體實(shí)施方式
本發(fā)明在此所探討的方向?yàn)橐环N語音增強(qiáng)方法。為了能徹底地了解本發(fā)明,將在 下列的描述中提出詳盡的步驟。顯然地,本發(fā)明的實(shí)施并未限定于本發(fā)明技術(shù)領(lǐng)域的技術(shù) 人員所熟悉的特殊細(xì)節(jié)。另一方面,眾所周知的步驟并未描述于細(xì)節(jié)中,以避免造成本發(fā)明 不必要的限制。本發(fā)明的較佳實(shí)施例會(huì)詳細(xì)描述如下,然而除了這些詳細(xì)描述之外,本發(fā)明還可以廣泛地施行在其它的實(shí)施例中且本發(fā)明的范圍不受限定,其以之后的權(quán)利要求范圍為準(zhǔn)。
圖1顯示本發(fā)明的一實(shí)施例的語音增強(qiáng)系統(tǒng)的示意圖。如圖1所示,該語音增強(qiáng)系統(tǒng)100是用以接收一正向面對(duì)的目標(biāo)音源150的聲音信號(hào),并包含一雙麥克風(fēng)式 (doule-microphone)的麥克風(fēng)陣列102。然而,該麥克風(fēng)陣列102也會(huì)同時(shí)接收另一干擾音源160所發(fā)出的聲音信號(hào)。由于該語音辨識(shí)系統(tǒng)100是正向面對(duì)該目標(biāo)音源150,其聲音信號(hào)傳遞至該雙麥克風(fēng)式的麥克風(fēng)陣列102的左右兩麥克風(fēng)的時(shí)間相同。反之,由于該語音辨識(shí)系統(tǒng)100和該干擾音源160具有一角度,該干擾音源160所發(fā)出的聲音信號(hào)到達(dá)該雙麥克風(fēng)式的麥克風(fēng)陣列102的左右兩麥克風(fēng)的時(shí)間不同,而此時(shí)間差即定義為兩耳時(shí)間差。本發(fā)明的語音辨識(shí)方法即通過兩耳時(shí)間差的計(jì)算以排除該干擾音源160所發(fā)出的聲音信號(hào)。
圖2顯示本發(fā)明的一實(shí)施例的語音辨識(shí)方法的流程圖。在步驟201,利用一雙麥克風(fēng)式的麥克風(fēng)陣列接收多個(gè)音框的聲音信號(hào),并進(jìn)入步驟202。在步驟202,計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該雙麥克風(fēng)式的麥克風(fēng)陣列的兩耳時(shí)間差,并進(jìn)入步驟203。在步驟 203,根據(jù)該計(jì)算結(jié)果統(tǒng)計(jì)各音框的聲音信號(hào)的兩耳時(shí)間差的累積直方圖,并進(jìn)入步驟204。 在步驟204,根據(jù)該些累積直方圖計(jì)算一第一兩耳時(shí)間差門坎值,并進(jìn)入步驟205。在步驟 205,根據(jù)該第一兩耳時(shí)間差門坎值過濾該些音框的聲音信號(hào)。
復(fù)參圖1,本發(fā)明的另一實(shí)施例的語音增強(qiáng)系統(tǒng),對(duì)應(yīng)至圖2的方法,除該雙麥克風(fēng)式的麥克風(fēng)陣列102及其收音模塊外,另包含一兩耳時(shí)間差計(jì)算模塊、一累積直方圖模塊、一第一兩耳時(shí)間差門坎值計(jì)算模塊以及一聲音信號(hào)過濾模塊。該兩耳時(shí)間差計(jì)算模塊, 如步驟202,用以計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該雙麥克風(fēng)式的麥克風(fēng)陣列的兩耳時(shí)間差。該累積直方圖模塊,如步驟203,用以計(jì)算各音框兩耳時(shí)間差的累積直方圖。該第一兩耳時(shí)間差門坎值計(jì)算模塊,如步驟204,用以計(jì)算基于累積直方圖的第一兩耳時(shí)間差門坎值。該聲音信號(hào)過濾模塊,如步驟205,用以過濾 基于第一兩耳時(shí)間差門坎值的聲音信號(hào)。
以下例示應(yīng)用圖1的語音增強(qiáng)系統(tǒng)和圖2的語音增強(qiáng)方法。在步驟201,該雙麥克風(fēng)式的麥克風(fēng)陣列102接收多個(gè)音框的聲音信號(hào),其包含該目標(biāo)音源150和該干擾音源 160所發(fā)出的聲音信號(hào)。在步驟202,計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該雙麥克風(fēng)式的麥克風(fēng)陣列的兩耳時(shí)間差。圖3顯示該雙麥克風(fēng)式的麥克風(fēng)陣列102的其中一麥克風(fēng)于某一音框所接收的聲音信號(hào)及其經(jīng)由離散傅立業(yè)轉(zhuǎn)換后所得到的頻域的聲音信號(hào)。若該雙麥克風(fēng)式的麥克風(fēng)陣列102于第Hi0個(gè)音框的第1 個(gè)頻段(第1 個(gè)點(diǎn))所接收的頻域的聲音信號(hào)分別為Xjkci ;m0)和Xjktl ;m0),則該雙麥克風(fēng)式的麥克風(fēng)陣列102于第1 個(gè)音框的第 k0個(gè)頻段的兩耳時(shí)間差|d(kQ,mQ) I可表示為
l^(^o>Mo)1 ~IR(k0,m0)-ZXL(kQ,ηι0)-2πτ\,其中 z Xe(k0, m0)和\ωκZXE(k0,m0)分別代表Xk(kQ ;m0)和XL(k0 ;m0)的相位值;2 π r則為一補(bǔ)償項(xiàng),可使得ZXK(k0, m0) ^PZ Xe(k0, m0)的相位差落于0-2 π之間;ωΜ則為角速度。
在步驟203,根據(jù)該計(jì)算結(jié)果統(tǒng)計(jì)各音框的聲音信號(hào)的兩耳時(shí)間差的累積直方圖。 圖4顯示兩不同音框所計(jì)算的兩耳時(shí)間差的累積直方圖。其中,虛線的累積直方圖所對(duì)應(yīng)的音框僅有該干擾音源160所發(fā)出的聲音信號(hào),而實(shí)線的累積直方圖所對(duì)應(yīng)的音框同時(shí)包含該目標(biāo)音源150和該干擾音源160所發(fā)出的聲音信號(hào)。如圖4所示,由于該虛線的累積直方圖所對(duì)應(yīng)的音框未包含該目標(biāo)音源150所發(fā)出的聲音信號(hào),其于兩耳時(shí)間差為零的成分較低。反之,由于該實(shí)線的累積直方圖所對(duì)應(yīng)的音框包含該目標(biāo)音源150所發(fā)出的聲音信號(hào),其于兩耳時(shí)間差為零的成分較高。
在步驟204,根據(jù)該些累積直方圖計(jì)算一第一兩耳時(shí)間差門坎值。圖5顯示根據(jù)多個(gè)音框所計(jì)算的兩耳時(shí)間差的累積直方圖。本發(fā)明的部分實(shí)施例即分別針對(duì)該些音框的累積直方圖于不同兩耳時(shí)間差計(jì)算其變異數(shù),并根據(jù)該些變異數(shù)的最大值決定一第一兩耳時(shí)間差門坎值。如圖5所示,該些累積直方圖是于箭頭所示處具有最大的變異數(shù),故其對(duì)應(yīng)的兩耳時(shí)間差即為該第一兩耳時(shí)間差門坎值。
在步驟205,根據(jù)該第一兩耳時(shí)間差門坎值過濾該些音框的聲音信號(hào)。本發(fā)明的部分實(shí)施例是先尋找該雙麥克風(fēng)式的麥克風(fēng)陣列102所接收的該些音框的聲音信號(hào)于各頻段的兩耳時(shí)間差高于該第一兩耳時(shí)間差門坎值的過濾頻段,并濾除該些音框的聲音信號(hào)于該些過濾頻段的成分。
在本發(fā)明的部分實(shí)施例中,步驟205可由下列式子表示
權(quán)利要求
1.一種語音增強(qiáng)方法,其特征在于,包含下列步驟 利用一雙麥克風(fēng)式的麥克風(fēng)陣列接收多個(gè)音框的聲音信號(hào); 計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該雙麥克風(fēng)式的麥克風(fēng)陣列的兩耳時(shí)間差; 根據(jù)該計(jì)算結(jié)果統(tǒng)計(jì)各音框的聲音信號(hào)的兩耳時(shí)間差的累積直方圖; 根據(jù)該些累積直方圖計(jì)算一第一兩耳時(shí)間差門坎值;以及 根據(jù)該第一兩耳時(shí)間差門坎值過濾該些音框的聲音信號(hào)。
2.根據(jù)權(quán)利要求1所述的語音增強(qiáng)方法,其特征在于,該計(jì)算第一兩耳時(shí)間差門坎值的步驟包含下列次步驟 計(jì)算該些累積直方圖于各兩耳時(shí)間差的變異數(shù);以及 決定該些變異數(shù)的最大值所對(duì)應(yīng)的兩耳時(shí)間差為該第一兩耳時(shí)間差門坎值。
3.根據(jù)權(quán)利要求1所述的語音增強(qiáng)方法,其特征在于,該變異數(shù)的計(jì)算根據(jù)一先前計(jì)算 的變異數(shù)以遞歸方式計(jì)算出一更新的變異數(shù)。
4.根據(jù)權(quán)利要求1所述的語音增強(qiáng)方法,其特征在于,該過濾聲音信號(hào)的步驟包含下列次步驟 尋找該些音框的聲音信號(hào)于各頻段的兩耳時(shí)間差高于該第一兩耳時(shí)間差門坎值的過濾頻段,并濾除該些音框的聲音信號(hào)于該些過濾頻段的成分。
5.根據(jù)權(quán)利要求4所述的語音增強(qiáng)方法,其特征在于,該濾除聲音信號(hào)的步驟可由下列式子表示 〔I, if /(k0,m0) = ]m ^>T Y (kQ,mQ)代表第mQ個(gè)音框于第kQ個(gè)頻段的過濾值,d(k2,m0)代表第Hitl個(gè)音框于第1 個(gè)頻段的兩耳時(shí)間差,h代表該第一兩耳時(shí)間差門坎值,η為一最小單元變量。
6.根據(jù)權(quán)利要求5所述的語音增強(qiáng)方法,其特征在于,η等于O.01。
7.根據(jù)權(quán)利要求4所述的語音增強(qiáng)方法,其特征在于,該濾除聲音信號(hào)的步驟可由下列式子表示 I r(k0,m0) = i + eMd(k0,m0)-T,) Y (k0, m0)代表第mQ個(gè)首框于第kQ個(gè)頻段的過濾值,d(k0,m0)代表第Hitl個(gè)音框于第1 個(gè)頻段的兩耳時(shí)間差,h代表該第一兩耳時(shí)間差門坎值,β為一控制過濾程度的變量。
8.一種語音增強(qiáng)方法,其特征在于,包含下列步驟 利用一雙麥克風(fēng)式的麥克風(fēng)陣列接收多個(gè)音框的聲音信號(hào); 計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該雙麥克風(fēng)式的麥克風(fēng)陣列的兩耳時(shí)間差; 根據(jù)該計(jì)算結(jié)果統(tǒng)計(jì)各音框的聲音信號(hào)的兩耳時(shí)間差的直方圖和累積直方圖; 根據(jù)該些累積直方圖計(jì)算一第一兩耳時(shí)間差門坎值; 根據(jù)該些直方圖和該第一兩耳時(shí)間差門坎值計(jì)算一第二兩耳時(shí)間差門坎值;以及 根據(jù)該第一兩耳時(shí)間差門坎值和該第二兩耳時(shí)間差門坎值過濾該些音框的聲音信號(hào); 其中該第二兩耳時(shí)間差門坎值大于該第一兩耳時(shí)間差門坎值。
9.根據(jù)權(quán)利要求8所述的語音增強(qiáng)方法,其特征在于,該計(jì)算第一兩耳時(shí)間差門坎值的步驟包含下列次步驟計(jì)算該些累積直方圖于各兩耳時(shí)間差的變異數(shù);以及決定該些變異數(shù)的最大值所對(duì)應(yīng)的兩耳時(shí)間差為該第一兩耳時(shí)間差門坎值。
10.根據(jù)權(quán)利要求9所述的語音增強(qiáng)方法,其特征在于,該變異數(shù)的計(jì)算根據(jù)一先前計(jì)算的變異數(shù)以遞歸方式計(jì)算出一更新的變異數(shù)。
11.根據(jù)權(quán)利要求8所述的語音增強(qiáng)方法,其特征在于,該計(jì)算第二兩耳時(shí)間差門坎值的步驟包含下列次步驟根據(jù)該些直方圖計(jì)算目標(biāo)音源和干擾音源的訊雜比;以及根據(jù)該目標(biāo)音源和干擾音源的訊雜比、該干擾音源所對(duì)應(yīng)的兩耳時(shí)間差和該第一兩耳時(shí)間差門坎值決定該第二兩耳時(shí)間差門坎值。
12.根據(jù)權(quán)利要求11所述的語音增強(qiáng)方法,其特征在于,該訊雜比為該些直方圖所決定的目標(biāo)音源和干擾音源對(duì)應(yīng)的數(shù)值的比例。
13.根據(jù)權(quán)利要求11所述的語音增強(qiáng)方法,其特征在于,該第二兩耳時(shí)間差門坎值可由下列式子表示τ 2 = τ 1+ δ +RX SNR, τ i代表該第一兩耳時(shí)間差門坎值,τ 2代表該第二兩耳時(shí)間差門坎值,R為該干擾音源所對(duì)應(yīng)的兩耳時(shí)間差和該第一兩耳時(shí)間差門坎值的差值,SNR代表該目標(biāo)音源和干擾音源的訊雜比,S為一最小角度單元變量。
14.根據(jù)權(quán)利要求13所述的語音增強(qiáng)方法,其特征在于,δ等于O.1。
15.根據(jù)權(quán)利要求11所述的語音增強(qiáng)方法,其特征在于,該第二兩耳時(shí)間差門坎值可由下列式子表示T2=Tx+5 + Kx^ + e}p{SNR_x) T1代表該第一兩耳時(shí)間差門坎值,、代表該第二兩耳時(shí)間差門坎值,R為該干擾音源所對(duì)應(yīng)的兩耳時(shí)間差和該第一兩耳時(shí)間差門坎值的差值, SNR代表該目標(biāo)音源和干擾音源的訊雜比,β為一控制過濾程度的變量,δ為一最小角度單元變量。
16.根據(jù)權(quán)利要求15所述的語音增強(qiáng)方法,其特征在于,δ等于O.1。
17.根據(jù)權(quán)利要求8所述的語音增強(qiáng)方法,其特征在于,該過濾聲音信號(hào)的步驟包含下列次步驟尋找該些音框的聲音信號(hào)于各頻段的兩耳時(shí)間差高于該第二兩耳時(shí)間差門坎值的過濾頻段,并濾除該些音框的聲音信號(hào)于該些過濾頻段的成分;以及尋找該些音框的聲音信號(hào)于各頻段的兩耳時(shí)間差介于該第二兩耳時(shí)間差門坎值和該第一兩耳時(shí)間差門坎值的減弱頻段,并減弱該些音框的聲音信號(hào)于該些減弱頻段的成分。
18.根據(jù)權(quán)利要求17所述的語音增強(qiáng)方法,其特征在于,該濾除和減弱聲音信號(hào)的步驟可由下列式子表示.1,if \d{k0,mQ)\<Txr(k0,m0) = < a, if |c/(A:0,m0)| > T1 and|J(A:0,w0)| < r2 y (k0,m0)代表第 m。個(gè)音框于第 k0 77, otherwise個(gè)頻段的過濾值,d(k0, m0)代表第Hitl個(gè)音框于第1 個(gè)頻段的兩耳時(shí)間差,τ i代表該第一兩耳時(shí)間差門坎值,τ2代表該第二兩耳時(shí)間差門坎值,α為一介于O和I之間的控制過濾程度的變量,H為一最小單元變量。
19.根據(jù)權(quán)利要求18所述的語音增強(qiáng)方法,其特征在于,η等于O.01。
20.根據(jù)權(quán)利要求18所述的語音增強(qiáng)方法,其特征在于,α正比于目標(biāo)音源和干擾音源的訊雜比。
21.根據(jù)權(quán)利要求20所述的語音增強(qiáng)方法,其特征在于,該訊雜比為該些直方圖所決定的目標(biāo)音源和干擾音源對(duì)應(yīng)的數(shù)值的比例。
22.根據(jù)權(quán)利要求20所述的語音增強(qiáng)方法,其特征在于,α可由下列式子決定a = -l + e-](sNR-x) SNR代表目標(biāo)音源和干擾音源的訊雜比,β為一控制過濾程度的變量。
23.一種語音增強(qiáng)系統(tǒng),其特征在于,包含一麥克風(fēng)陣列收音模塊,該麥克風(fēng)陣列收音模塊為雙麥克風(fēng)式的麥克風(fēng)陣列;一兩耳時(shí)間差計(jì)算模塊,用以計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該雙麥克風(fēng)式的麥克風(fēng)陣列的兩耳時(shí)間差;一累積直方圖模塊,用以計(jì)算各音框兩耳時(shí)間差的累積直方圖;一第一兩耳時(shí)間差門坎值計(jì)算模塊,用以計(jì)算基于累積直方圖的第一兩耳時(shí)間差門坎值;以及一聲音信號(hào)過濾模塊,用以過濾基于第一兩耳時(shí)間差門坎值的聲音信號(hào)。
24.一種語音增強(qiáng)系統(tǒng),其特征在于,包含一麥克風(fēng)陣列收音模塊,該麥克風(fēng)陣列收音模塊為雙麥克風(fēng)式的麥克風(fēng)陣列;一兩耳時(shí)間差計(jì)算模塊,用以計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該雙麥克風(fēng)式的麥克風(fēng)陣列的兩耳時(shí)間差;一累積直方圖模塊,用以計(jì)算各音框兩耳時(shí)間差的直方圖和累積直方圖;一第一兩耳時(shí)間差門坎值計(jì)算模塊,用以計(jì)算基于累積直方圖的第一兩耳時(shí)間差門坎值;一第二兩耳時(shí)間差門坎值計(jì)算模塊,用以計(jì)算基于直方圖和該第一兩耳時(shí)間差門坎值的第二兩耳時(shí)間差門坎值計(jì)算模塊;以及一聲音信號(hào)過濾模塊,用以過濾基于第一兩耳時(shí)間差門坎值和該第二兩耳時(shí)間差門坎值的聲音信號(hào)。
25.一種語音增強(qiáng)方法,其特征在于,包含下列步驟利用一麥克風(fēng)陣列接收多個(gè)音框的聲音信號(hào),該麥克風(fēng)陣列包含多個(gè)麥克風(fēng);計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該多個(gè)麥克風(fēng)的至少一雙麥克風(fēng)組合的兩耳時(shí)間差;根據(jù)該計(jì)算結(jié)果統(tǒng)計(jì)各音框的聲音信號(hào)的兩耳時(shí)間差的直方圖和累積直方圖;根據(jù)該些累積直方圖計(jì)算一第一兩耳時(shí)間差門坎值;根據(jù)該些直方圖和該第一兩耳時(shí)間差門坎值計(jì)算一第二兩耳時(shí)間差門坎值;根據(jù)該第一兩耳時(shí)間差門坎值和該第二兩耳時(shí)間差門坎值過濾該些音框的聲音信號(hào), 而得到至少一增強(qiáng)語音信號(hào),其中該第二兩耳時(shí)間差門坎值大于該第一兩耳時(shí)間差門坎值;以及 加權(quán)該至少一增強(qiáng)語音信號(hào)而得到一加權(quán)后的增強(qiáng)語音信號(hào)。
26. 一種語音增強(qiáng)系統(tǒng),其特征在于,包含 一麥克風(fēng)陣列收音模塊,該麥克風(fēng)陣列收音模塊包含多個(gè)麥克風(fēng); 一兩耳時(shí)間差計(jì)算模塊,用以計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)該多個(gè)麥克風(fēng)的至少一雙麥克風(fēng)組合的兩耳時(shí)間差; 一累積直方圖模塊,用以計(jì)算各音框兩耳時(shí)間差的直方圖和累積直方圖; 一第一兩耳時(shí)間差門坎值計(jì)算模塊,用以計(jì)算基于累積直方圖的第一兩耳時(shí)間差門坎值; 一第二兩耳時(shí)間差門坎值計(jì)算模塊,用以計(jì)算基于直方圖和該第一兩耳時(shí)間差門坎值的第二兩耳時(shí)間差門坎值計(jì)算模塊; 一聲音信號(hào)過濾模塊,用以過濾基于第一兩耳時(shí)間差門坎值和該第二兩耳時(shí)間差門坎值的聲音信號(hào)而產(chǎn)生至少一增強(qiáng)語音信號(hào);以及 一權(quán)重模塊,預(yù)設(shè)至少一權(quán)重并加權(quán)該至少一增強(qiáng)語音信號(hào)而得到一加權(quán)后的增強(qiáng)語音信號(hào)。
全文摘要
本發(fā)明的一種語音增強(qiáng)方法,包含下列步驟利用麥克風(fēng)陣列接收多個(gè)音框的聲音信號(hào);計(jì)算各音框的聲音信號(hào)于各頻段對(duì)應(yīng)的至少一雙麥克風(fēng)組合的兩耳時(shí)間差;根據(jù)該計(jì)算結(jié)果統(tǒng)計(jì)各音框的聲音信號(hào)的兩耳時(shí)間差的累積直方圖;根據(jù)該些累積直方圖計(jì)算一第一兩耳時(shí)間差門坎值;以及根據(jù)該第一兩耳時(shí)間差過濾該些音框的聲音信號(hào)。
文檔編號(hào)G10L21/02GK103000183SQ201210008319
公開日2013年3月27日 申請(qǐng)日期2012年1月9日 優(yōu)先權(quán)日2011年9月14日
發(fā)明者廖憲正 申請(qǐng)人:財(cái)團(tuán)法人工業(yè)技術(shù)研究院