專利名稱:通過語音信號控制設備尤其是汽車中的設備的方法
技術領域:
本發(fā)明涉及一種利用語音信號來控制汽車的控制單元或控制安裝在汽車內的裝置的方法。本發(fā)明還涉及實施該方法的硬件配置。
背景技術:
基本上,按照本發(fā)明的該方法允許用于任何語音控制的裝置,其中應用于該裝置的噪聲信號部分取決于各裝置的操作狀態(tài)和/或操作環(huán)境。
當汽車的控制單元(例如,擋風玻璃雨刮馬達)和安裝在汽車中的裝置(例如,無線電控制,導航系統(tǒng)或移動電話)利用由語音識別系統(tǒng)識別的語音信號控制,取決于該汽車操作狀態(tài)和/或操作環(huán)境的噪聲信號將要被分別考慮以避免對該功能單元或裝置的錯誤控制。
從JP57-30913(A)可知汽車的速度和齒輪的變速二者可以利用傳感器檢測。噪聲信號的參考電壓由傳感器信號產生,該參考電壓指示該汽車內部的電流噪聲水平(噪聲信號水平)。該噪聲信號參考電壓與該語音輸入單元的輸出電壓相比較。當語音控制信號生效時,該語音輸入單元接收包含噪聲信號部分和語音信號部分的聲音信號,這反映在語音輸入單元的輸出電壓中。該語音輸入單元的輸出電壓與噪聲信號參考電壓相比較。如果該語音輸入單元的輸出電壓高于噪聲信號的參考電壓,則啟動一個語音識別系統(tǒng)。如果該語音輸入單元的輸出電壓下降到低于噪聲信號的參考電壓,則該語音識別系統(tǒng)不啟動。
從JP6-83387(A)可知在汽車中提供一個振動傳感器以便確定作為噪聲源的該汽車的振動。此外,第一麥克風安裝在該汽車內部以便檢測發(fā)生在該汽車內部的噪聲信號。在該汽車內部的第二麥克風用于檢測語音信號,該語音信號由一個語音識別系統(tǒng)識別。第二麥克風接收聲音信號,然而,它除包含語音信號部分之外還包含噪聲信號部分。借助于在振動傳感器的信號和第一個麥克風的麥克風信號和二個自適應濾波器,由第二麥克風產生的該麥克風信號中的噪聲信號電平降低了;因此具有降低了的噪聲信號部分的產生信號加于語音識別系統(tǒng)。
本發(fā)明的目的是通過在開頭段落所定義的方法有效地抵消噪聲信號的影響。
發(fā)明內容
該目的應用到汽車上來實現,即發(fā)生在該汽車中的聲音信號應用于語音識別系統(tǒng),該聲音信號包含噪聲信號部分和視情況而定的語音信號部分,其中噪聲信號部分取決于汽車的操作狀態(tài)和/或汽車的操作環(huán)境,和語音識別系統(tǒng)應用聲音參考,該聲音參考依靠操作狀態(tài)和/或操作環(huán)境的檢測數據選擇和/或適配。
按照本發(fā)明的方法是優(yōu)越的,即基于操作狀態(tài)或操作環(huán)境的數據,該數據每一個都容易確定,語音自動識別的設置適合于適配使用的聲音參考。在汽車中,關于操作狀態(tài)或操作環(huán)境的數據例如可以從一個機載計算機讀出,它連接到一個或多個檢測器來確定汽車的操作狀態(tài)或操作環(huán)境。分別從確定的操作狀態(tài)或操作環(huán)境開始,間接地估計噪聲信號部分。因此從饋送到語音識別系統(tǒng)的聲音信號的噪聲信號的提取就成為多余的了。因此可以進行該噪聲信號部分的估計,預先確定的聲音參考依靠檢測到的操作狀態(tài)和/或操作環(huán)境來選擇,以便模擬語音暫停,語音暫停中的聲音信號僅有噪聲信號部分。一致地,語音信號部分的存在也可以檢測到,當沒有語音暫停的時候就是這種情況;以這種方法,當可以避免噪聲信號部分的變化時,將錯誤地檢測語音信號部分的存在。按照本發(fā)明的措施增強了應用整個系統(tǒng)的可靠性和安全性。
同樣,代表語音信號部分的聲音參考可以通過操作狀態(tài)或操作環(huán)境的檢測數據來適配,因此這些疊加的噪音信號部分由聲音參考表示。
適合于實施根據本發(fā)明方法的裝置在權利要求8中陳述。
對于可選擇的語音控制設備,該目的按照定義在權利要求8(方法)和9(裝置)的技術特征來實現。
本發(fā)明的這些和其他方面從下面所述的實施例中更清楚了,并將參考實施例描述。
附圖簡述在附圖中
圖1表示在汽車中實現本發(fā)明的方法的基本部件;
圖2表示產生語音暫停部分的聲音參考的第一種可能性;和圖3表示產生語音暫停部分的聲音參考的第二種可能性。
發(fā)明的實施方式圖1中所示的框圖描述了對汽車中的設備或功能單元的控制。在此描述設備/功能單元,例如,通過方框1a和1b??刂仆ㄟ^語音信號來進行,該語音信號通過麥克風2饋送到一個自動語音識別系統(tǒng)3,它的識別結果通過功能單元4來估計,該功能單元進行電控信號轉換,該電控信號提供給設備/功能單元1a和1b。
功能單元5描述由麥克風2提供的麥克風信號特性的提取,單獨的連續(xù)信號部分的特征通常組合到特征向量。對于特性分析,例如,一個聲音信號被提取、量化,最后進行倒譜(cepstral)分析。然后聲音信號細分成連續(xù)的幀,這些幀部分重疊;每一幀都形成一個特征向量。特征向量分量由確定的倒譜值形成。功能模塊6描述比較的慣用過程,該過程中特征向量通過慣用的查找過程和聲音模型7進行比較,這將產生提供給功能單元4的語音識別結果。比較模塊6和聲音模塊7是基于所謂的隱馬爾科夫(HIdden Markov)模塊。聲音模塊7包括聲音參考8和詞典9。各個聲音參考分配給一個或多個音素的單詞子單元。詞典9按照包含在詞典中的單詞定義一系列相關的單詞子單元的相關順序。
語音識別系統(tǒng)3包括一個接口10,該接口建立與機載計算機11的連接。該機載計算機11又由聯(lián)接線12a連接到至少一個檢測器,該檢測器檢測操作狀態(tài)數據和/或操作環(huán)境數據,并將其提供給機載計算機11,該計算機存儲這些數據。操作狀態(tài)和/或操作環(huán)境的數據提供給接口10,該接口一步傳輸這些數據到功能單元12,使他們適于分別檢測的操作狀態(tài)或檢測操作環(huán)境,以適應聲音參考8?;旧希涌?0也可以不通過機載計算機的中間電路(連接線12a)耦合到檢測器13。例如,檢測到的操作狀態(tài)可能是鼓風機的操作狀態(tài)或者也可能是汽車的各個速度。例如,操作環(huán)境數據可以指示下雨的天氣或者指示汽車行駛的實際的路況。
更適宜地,所述系統(tǒng)可以產生帶有合適聲音參考8的語音暫停模型。對于語音暫停,從麥克風2接收到的聲音信號只包括噪音信號部分,而沒有語音信號部分,該設備/功能單元1a或1b是由語音信號部分控制的。
取決于檢測到的操作狀態(tài)或檢測到的操作環(huán)境,本發(fā)明的一個實施例包括限制語音識別系統(tǒng)3的詞匯量,通過詞典9組合到一個單詞的子集,該單詞子集用作有效語音控制信號(功能模塊13)。按照這種安排,用于功能模塊6的比較過程所必需的計算操作減少了。
圖2表示從該集的聲音參考8中產生一個聲音參考8a一個例子。通過功能模塊12這個基礎參考從一子集預先給出的和預先定義的基礎參考20-1,20-2到20-n中選出用于語音暫停部分,該參考在語音識別系統(tǒng)3操作之前就已經分配給操作狀態(tài)或操作環(huán)境,并且分別與實際檢測到的操作狀態(tài)或操作環(huán)境很一致?;A參考的選擇象征性地由開關21來表示。功能模塊22組合一個所選擇的基礎參考的可選擇的適配,以便分別達到檢測到的操作狀態(tài)或操作環(huán)境的更精確的模型,因此形成用于相應的語音暫停部分的聲音參考8a。例如,在模塊22中的適應期間,如果一個聲音基礎參考對應于噪音信號部分,該噪音信號部分從雨聲噪音導出,對檢測雨的強度進行自適應,其中雨的強度對應于汽車中相應的干擾/噪音信號電平。
圖3表明產生用于語音暫停部分的聲音參考8a的另一種變形。就像圖2那樣,一個預先定義的基礎參考已經提供用于形成聲音參考8a的語音暫停部分(模塊30-1,30-2到30-n)。然而在圖3所示的實施例中,不止選擇一個基礎參考。相反,所有的基礎參考提供給功能單元31,在這其中,首先加權,當然也有可能是基礎參考的自適應取決于分別檢測到的操作狀態(tài)或操作環(huán)境來執(zhí)行(模塊32-1,32-2到32-n)。以這種方式的基礎參考加權/適配最終組合成在單元33中的單個的聲音參考,它是所考慮的用于語音暫停部分的聲音參考8a。
本發(fā)明不僅限于語音暫停模制。基本上,單詞次分單元也可以以與檢測的汽車的操作狀態(tài)或操作環(huán)境相似的方式適應于相應的聲音參考8。聲音參考8a將形成代表單詞子部分的聲音參考8的自適應的基礎,模擬由麥克風2捕獲的聲音信號的噪音信號部分。
另外,描述的本發(fā)明并不僅限于在汽車中使用。本發(fā)明主要可應用到所有語音控制的設備,其中的噪音信號疊加到語音控制信號上,噪音信號可以間接地由這種設備的操作狀態(tài)或操作環(huán)境的檢測確定。
權利要求
1.一種利用語音信號控制汽車的功能單元或控制安裝在汽車中的設備(1a,1b)的方法,其中產生在汽車內部的聲音信號包括噪音信號部分和視情況而定的語音信號部分提供給語音識別系統(tǒng)(3),其中的噪音信號取決于汽車的操作狀態(tài)和/或操作環(huán)境,語音識別系統(tǒng)(3)使用聲音參考(8),該聲音參考取決于所檢測到的操作狀態(tài)和/或操作環(huán)境的數據選擇和/或適配。
2.如權利要求1所述的方法,其特征在于聲音基礎參考(20-1,…,20-n,30-1,…,30-n)取決于汽車的操作狀態(tài)和/或操作環(huán)境選擇用于語音暫停模式。
3.如權利要求2所述的方法,其特征在于根據汽車的操作狀態(tài)和/或操作環(huán)境提供所選擇的聲音基礎參考的適配。
4.如權利要求1所述的方法,其特征在于,對于語音暫停模式,聲音基礎參考根據汽車的操作狀態(tài)和/或操作環(huán)境來組合。
5.如權利要求1-4之一的方法,其特征在于汽車的操作狀態(tài)和/或操作環(huán)境從汽車的機載計算機中讀出和/或通過安裝在汽車中的一個或多個檢測器讀出。
6.如權利要求1-5之一的方法,其特征在于根據檢測到的汽車的操作狀態(tài)和/或操作環(huán)境的數據確定(13)語音識別系統(tǒng)(3)的詞匯表(9)的這些部分,這表現了語音控制信號對汽車的功能單元的控制或安裝在汽車中的設備的控制有影響。
7.一種利用語音信號控制汽車的功能單元或安裝在汽車中的設備(1a,1b)的裝置,包括至少一個麥克風(2),用于轉換在汽車中產生的聲音信號,其中聲音信號包括噪音信號部分和視情況而定的語音信號部分,噪音信號部分取決于汽車的操作狀態(tài)和/或操作環(huán)境,和語音識別系統(tǒng)(3)耦合到麥克風(2),用于識別聲音信號的語音信號部分,而由語音識別系統(tǒng)(3)所使用的聲音參考根據檢測到的操作狀態(tài)和/或操作環(huán)境的數據選擇和/或適配。
8.通過語音信號控制設備的方法,其中包括噪音信號部分和視情況而定的語音信號部分的聲音信號提供給語音識別系統(tǒng),其中的噪音信號取決于設備的操作狀態(tài)和/或操作環(huán)境,和語音識別系統(tǒng)使用聲音參考,該聲音參考取決于檢測到的設備的操作狀態(tài)和/或操作環(huán)境的數據選擇和/或適配。
9.一種裝置,它包括通過語音信號可以控制的設備,其中聲音信號提供給語音識別系統(tǒng),該聲音信號包括噪音信號部分和視情況而定的語音信號部分,噪音信號部分取決于設備的操作狀態(tài)和/或操作環(huán)境,和語音識別系統(tǒng)使用聲音參考,該聲音參考取決于檢測到的設備的操作狀態(tài)和/或操作環(huán)境的數據選擇和/或適配。
全文摘要
本發(fā)明涉及通過語音信號控制汽車的功能單元或安裝在汽車中的設備(1a,1b)的方法,其中產生在汽車中的包括噪音信號部分和視情況而定的語音信號部分的聲音信號提供給語音信號識別系統(tǒng)(3),其中的噪音信號依賴于汽車的操作狀態(tài)和/或操作環(huán)境,和語音信號識別系統(tǒng)(3)使用聲音參考(8),該聲音參考取決于檢測到的設備的操作狀態(tài)和/或操作環(huán)境的數據選擇和/或適配。本發(fā)明并不限于汽車領域的語音控制。
文檔編號G10L15/00GK1339774SQ0113313
公開日2002年3月13日 申請日期2001年8月19日 優(yōu)先權日2000年8月23日
發(fā)明者A·凱爾納, A·菲舍 申請人:皇家菲利浦電子有限公司