專利名稱:加權(quán)頻譜距離計算器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及頻譜距離計算器(spectral distance calculator),而且更具體地涉及一種頻譜距離計算器,這種頻譜距離計算器包括用于執(zhí)行頻譜距離計算的裝置,該計算用于存在噪聲情況下的輸入頻譜與參考頻譜相比較。
AVA功能的一個實例是通過采用話音而不是手動啟動,接受或者拒絕呼入的可能性,例如手動啟動要通過敲擊移動電話上的按鍵來完成。此功能適用于例如正在駕車的移動電話用戶。當移動電話用戶正在駕車且移動電話通過一個鈴音信號顯示有一個呼入時,用戶可以發(fā)出語音命令來控制移動電話。
與AVA功能伴隨而來的問題是,由移動電話發(fā)出的鈴音信號與特定的AVA命令發(fā)生強烈的干擾。
一些現(xiàn)有技術(shù)的移動電話被裝備一種基于能量檢測器的簡單類型的AVA功能。當語音具有比預設(shè)定的閾值高的能量時,移動電話具有響應性而且檢測AVA命令。結(jié)果是,僅可以提供一種應答功能,通常是“拒絕呼入”被選擇。
由申請者提供的現(xiàn)有領(lǐng)先技術(shù)水平的移動電話,愛立信T18,被裝備有一種自動話音拔號功能。
基于能量檢測器的AVA功能被局限于僅能接受如上所述的一種命令。當AVA功能是基于能量檢測器時,提供幾種命令是不便利的,因為很可能移動電話的AVA功能將對移動電話周圍類似鈴音信號等聲音做出響應。
另一方面,基于語音識別的AVA功能對具有與語音相似頻譜特征的來自其它聲音的干擾很敏感。造成這點的一個原因是,在語音識別器中所采用的不相似性度量主要是基于這樣的差異,即所察覺出的聲音或者語音與預先訓練的語音參考或模板二者在短時間內(nèi)頻譜特征之間的差異。
另一解決方案是基于傳聲器信號的低通濾波,它增加了AVA命令的識別率。然而,這個解決方案的缺點在于,即使鈴音信號不包含高于截止頻率的所有頻率,但是具有高于濾波器截止頻率的所有語音信息不能被語音識別器所采用。
在另一種解決此問題的方法中,移動電話可以被裝備有一種自適應濾波器,濾波器位于傳聲器和語音識別器之間,以便于濾掉不同的鈴音信號。
該自適應濾波器可以被解釋為一種自適應陷波濾波器,其中缺口的位置要被連續(xù)地修正,以使干擾頻率被衰減。結(jié)果是通過采用這種方法獲得了較高的識別率。但是,這種自適應算法需要大量計算。此外,它們不是瞬時適應,而且必須進行適應穩(wěn)定性與收斂時間的折衷。
GB-A-2 137 791公開了頻譜距離處理器,它用于對從存在需要估計的背景噪聲下的語音中獲取的頻譜進行比較。為了準備用于比較的輸入頻譜和模板頻譜,處理器包括對關(guān)于輸入噪聲頻譜估計的輸入頻譜進行掩蔽(masking)的裝置;對關(guān)于模板噪聲頻譜估計的模板頻譜進行掩蔽的裝置;取決于每個采樣是由噪聲或者語音造成的,對每個被掩蔽頻譜采樣進行標記的裝置。
在掩蔽操作中,噪聲標記分別與掩蔽的輸入頻譜和模板頻譜相關(guān),即是否該值起源于噪聲或者語音并且是否在頻譜的距離計算中被考慮進去。
在所掩蔽的頻譜采樣中的較大者被標記為由噪聲所造成的之處,缺省噪聲距離被賦值在這兩個掩蔽頻譜之間的距離的地方。
因此,由于根據(jù)GB-A-2 137 791的頻譜距離處理器被用于在波動的或者高的噪聲等級條件下操作,這便是復雜設(shè)計的起因。
但是,移動電話有了語音識別,即如上所述用戶可以發(fā)出語音命令來控制移動電話后,在GB-A-2137791中所說明的一種復雜的頻譜距離處理器便不再必要,因為現(xiàn)有的噪聲并不波動而且沒有那么高的噪聲等級。
發(fā)明概述因此,本發(fā)明的目的是提供一種改進的頻譜距離計算器,它可在任何采用頻譜差異作為不相似性度量的語音識別中使用,尤其是在低的噪聲等級條件下適用。
根據(jù)本發(fā)明的一個方面,頻譜距離計算器包括用于執(zhí)行頻譜距離計算的頻譜距離計算裝置,所述計算是用于在噪聲信號存在情況下將來源于一個輸入信號的輸入頻譜和參考頻譜相比較;用于預先存儲來源于噪聲信號的噪聲頻譜的存儲器裝置;以及,掩蔽輸入頻譜和關(guān)于預先存儲的噪聲頻譜的參考頻譜之間的距離的裝置。
根據(jù)本發(fā)明的另一方面,噪聲具有比輸入頻譜低的等級。
本發(fā)明的另一目的是提供一種包括如上所述的頻譜距離計算器的語音識別系統(tǒng),該語音識別系統(tǒng)用于比較輸入頻譜和參考頻譜,其中識別系統(tǒng)包括選擇裝置,該選擇裝置用于選擇使輸入頻譜和參考頻譜之同的全部頻譜距離最小化的參考頻譜。
本發(fā)明的另一目的是提供一種包括如上所述的語音識別系統(tǒng)的移動電話。
本發(fā)明的一項優(yōu)點是,具有被裝備有根據(jù)本發(fā)明的頻譜距離計算器的語音識別系統(tǒng)的移動電話的自動話音應答功能(AVA)在移動電話周圍存在鈴音信號時,對不同的AVA命令的響應是可靠的。
本發(fā)明的詳細說明根據(jù)本發(fā)明的頻譜距離計算器的一種實施方案,包括用于執(zhí)行頻譜距離計算的頻譜距離計算裝置,以便于比較由噪聲造成的輸入頻譜與參考頻譜。為了處理干擾噪聲,距離計算器進一步包括掩蔽裝置,以使掩蔽輸入頻譜和關(guān)于存儲在存儲器中已知的或者預設(shè)定的噪聲的參考頻譜之間的頻譜距離。
在實施方案中的距離計算器是基于城市(city)距離和語音的離散頻譜表示。但是,這種解決方推廣到本發(fā)明范圍內(nèi)語音的其它頻譜表示。
此外,根據(jù)本發(fā)明的頻譜距離計算器可以被應用到任何語音識別系統(tǒng),在此語音識別系統(tǒng)中采用頻譜距離作為不相似性或者距離度量,例如在由語音命令控制的移動電話中。
語音識別系統(tǒng)的用戶對著傳聲器說話,其中,每個聲音被分解為其各種頻率。所接收聲音的每個頻率被數(shù)字化,這樣它們能夠被語音識別系統(tǒng)操縱。傳聲器信號由S(n)表示且其相應的頻譜表示由Sn(f)表示,其中n是各個采樣的時間且f是當前的頻率。
數(shù)字化型式的聲音與一組預先存儲在系統(tǒng)存儲中的模板或者參考信號相比較。模板或者參考信號由r(n)表示且模板信號相應的頻譜表示由Rn(f)表示。輸入中已知的噪聲信號由X(n)表示且相應的頻譜表示由Xn(f)表示。
在語音識別器中采用的不相似性度量或距離度量,例如由下面的表達式給出Dn=Σi|Rn(fi)-Sn(fi)|]]>因此,輸入信號頻譜Sn(f)與電子存儲內(nèi)存儲的參考信號中以相同形式形成的參考信號Rn(f)相比較。通過選擇參考信號,比較程序被執(zhí)行,該程序?qū)⑷康念l譜距離最小化,即將下面的表達式最小化ΣnDn]]>但是,這個選擇程序并沒有將任何有關(guān)干擾噪聲信號的信息考慮進去。
在裝備有語音識別功能或特別地被通常稱為自動話音應答(AVA)功能的移動電話中,由移動電話發(fā)出的鈴音信號同特定的AVA命令產(chǎn)生強烈的干擾。
鈴音信號是已知的“噪聲”信號而且,因此,代表鈴音信號的頻譜可以被預先存儲在與頻譜距離計算器相聯(lián)系的存儲器裝置中。
例如鈴音信號是一個蜂鳴器或者是一個個人的鈴音信號,例如一個由用戶選擇或編程的簡單旋律。但是,當鈴音信號被選擇或被編程時,它被移動電話所“知道”而且代表當前鈴音信號的頻譜可以被存儲在用于預存儲噪聲頻譜的存儲器裝置中。在另一選擇的實施方案中,來自不同鈴音信號的多個頻譜可以被預先存儲且當前所選擇的鈴音信號被用存儲器中的比特集合所標記。于是,頻譜距離計算器能夠識別并選擇出根據(jù)本發(fā)明的掩蔽程序所采用當前的頻譜。
根據(jù)
圖1,用于比較的輸入信號被暴露在頻譜處于兩個頻率fa和fb之間的已知噪聲中。用于與輸入信號作比較的相應參考信號Rn(f)不被認為是由任何噪聲引起的。因而,為了獲得輸入信號與參考信號或其頻譜之同的一個全面比較,輸入信號必須以任何方式被掩蔽,以便于補償已知的噪聲。根據(jù)本發(fā)明,頻譜距離計算或不相似性度量由根據(jù)下面表達式的加權(quán)Ai來修正Dn=ΣiAi|Rn(fi)-Sn(fi)|.]]>在這個表達式中,如果輸入信號頻率fi是由任何已知的噪聲引起,則Ai等于零,且如果在當前頻率fi處不存在噪聲,則Ai是1(unity)。
圖2是根據(jù)本發(fā)明的噪聲補償示意圖,其中,輸入頻譜Sn(fi)和參考頻譜Rn(fi)之間的頻譜距離在兩個頻率fa和fb之間被賦與零值。
在根據(jù)本發(fā)明的頻譜距離計算器的一個實施方案中,它被包括在一個用于比較輸入頻譜和參考頻譜的語音識別系統(tǒng)中,包括選擇裝置,由于選擇使輸入頻譜和參考頻譜之同的頻譜距離最小化的參考頻譜。
此外,語音識別系統(tǒng)被包括在裝備有AVA功能的移動電話中,例如如果移動電話用戶想要應答電話呼入,則“接受電話呼入”,或者如果他不想應答電話呼入,則“拒絕電話呼入”,或者如果電話呼入應該被連接到話音信箱或另一電話號碼,則“呼叫轉(zhuǎn)移”。
雖然本發(fā)明已經(jīng)通過其中的具體實施方案的方式加以說明,應該意識到本發(fā)明提供了一種加權(quán)頻譜距離計算器,該加權(quán)頻譜距離計算器完全滿足了上述的目的和優(yōu)點,而且可供選擇的辦法、修改和變化對本領(lǐng)域的技術(shù)人員是顯然的。
例如,在發(fā)明的另一實施方案中,計算器被裝備有自適應陷波濾波器,該濾波器不僅能濾去輸入信號,而且能濾去參考信號。這個解決方案受益于這樣的效果,即可獲得一種更可靠的參考信號選擇,因為如果一個已經(jīng)濾波的輸入信號與已經(jīng)濾波的參考信號相比較,則計算將更加精確。此外,這個解決方案不需要任何自適應算法且沒有額外的計算負荷,它瞬時性工作且不出現(xiàn)穩(wěn)定性問題。然而,自動話音應答裝置要連續(xù)性地需要干擾頻率的信息(knowledge)。
在第二實施方案的另一選擇實施方案中,通過采用真實賦值的Ai,提供更復雜的加權(quán),根據(jù)具體頻率fi被干擾的量的大小,充許不同水平的抑制。
權(quán)利要求
1.一種頻譜距離計算器,包括用于執(zhí)行頻譜距離計算的裝置,該計算是用于將來自存在噪聲信號的輸入信號的輸入頻譜與參考頻譜相比較;其特征在于存儲器裝置,其用于預先存儲來自噪聲信號的噪聲頻譜;以及對輸入頻譜和關(guān)于預先存儲的噪聲頻譜的參考頻譜之間頻譜距離進行掩蔽的裝置。
2.如權(quán)利要求1所述的頻譜距離計算器,其特征在于裝置,對于由噪聲引起的輸入頻譜的每個頻率,該裝置將輸入頻譜和參考頻譜之間的頻譜距離賦給零值。
3.如權(quán)利要求1或2所述的頻譜距離計算器,其特征在于所述噪聲具有比輸入頻譜小的等級。
4.用于比較輸入頻譜和參考頻譜的語音識別系統(tǒng),它包括1-3任何權(quán)利要求所述的頻譜距離計算器,其特征在于選擇裝置,用于選擇將輸入頻譜和參考頻譜之間的全部頻譜距離最小化的一個參考頻譜。
5.如權(quán)利要求4所述的語音識別系統(tǒng),其特征在于,所述全部頻譜距離是將參考頻譜彼此辨別出的采樣的數(shù)量的頻譜距離計算的和。
6.包括如權(quán)利要求4或5所述的語音識別系統(tǒng)的移動電話,其特征在于可操作性地連接到所述語音識別系統(tǒng)的呼入應答裝置,其中所述應答裝置響應于語音應答命令。
7.如權(quán)利要求6所述的移動電話,其特征在于所述應答裝置響應于接受呼入命令以接受一個呼入。
8.如權(quán)利要求6或7所述的移動電話,其特征在于所述應答裝置響應于拒絕呼入命令以拒絕一個呼入。
9.如6-8任何權(quán)利要求所述的移動電話,其特征在于所述應答裝置響應于呼入轉(zhuǎn)移命令以轉(zhuǎn)移一個呼入。
全文摘要
一種頻譜距離計算器,包括用于執(zhí)行頻譜距離計算的裝置,所述計算用于將來源于噪聲信號存在下的輸入信號的輸入頻譜與參考頻譜相比較;存儲器裝置,用于預先存儲該噪聲信號的噪聲頻譜;以及用于對輸入頻譜和關(guān)于預先存儲的噪聲頻譜的參考頻譜之間頻譜距離進行掩蔽的裝置。
文檔編號G10L15/00GK1354871SQ0080860
公開日2002年6月19日 申請日期2000年5月31日 優(yōu)先權(quán)日1999年6月7日
發(fā)明者A·吉梅尼茨菲爾特斯特倫, J·拉斯穆松 申請人:艾利森電話股份有限公司