專(zhuān)利名稱(chēng):使用聲音相關(guān)的車(chē)輛信息以增強(qiáng)語(yǔ)音識(shí)別的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及使用例如與聲音相關(guān)的車(chē)輛信息,信號(hào)處理,以及其他操作或信息的組合增強(qiáng)車(chē)輛語(yǔ)音識(shí)別。
背景技術(shù):
許多車(chē)輛裝備有語(yǔ)音對(duì)話,語(yǔ)音致動(dòng),或語(yǔ)音控制的車(chē)輛系統(tǒng)。語(yǔ)音對(duì)話系統(tǒng)可以基于言語(yǔ)命令執(zhí)行功能,提供信息,和/或提供響應(yīng)。語(yǔ)音對(duì)話系統(tǒng)可以將來(lái)自麥克風(fēng)的聲音(例如,由車(chē)輛乘客發(fā)出的言語(yǔ))處理或轉(zhuǎn)換為音頻信號(hào)。語(yǔ)音識(shí)別可以應(yīng)用到音頻信號(hào),并且識(shí)別的言語(yǔ)可以由語(yǔ)義解釋器處理?;谘哉Z(yǔ)命令的解釋?zhuān)T如對(duì)話控制系統(tǒng)的系統(tǒng)可以執(zhí)行動(dòng)作,產(chǎn)生響應(yīng),或執(zhí)行其他功能。響應(yīng)可以是例如視頻信號(hào),音頻信號(hào),文本至語(yǔ)音信號(hào),由車(chē)輛系統(tǒng)進(jìn)行的動(dòng)作,或?qū)?chē)輛乘客的其他通知的形式。聲音命令的清楚和辨識(shí)能力可以影響語(yǔ)音激活車(chē)輛系統(tǒng)的功能。然而麥克風(fēng)在減小聲音命令的清晰度的情況下會(huì)經(jīng)常接收與言語(yǔ)和非言語(yǔ)相關(guān)的聲音的信號(hào)。與非言語(yǔ)相關(guān)的聲音可以包括車(chē)輛相關(guān)的噪音(例如,發(fā)動(dòng)機(jī)噪音,冷卻系統(tǒng)噪音等),非車(chē)輛相關(guān)的噪音(例如,車(chē)輛外部的噪音),音頻系統(tǒng)聲音(例如,音樂(lè),廣播相關(guān)聲音),以及其他聲音。非言語(yǔ)相關(guān)的聲音可能經(jīng)常大于言語(yǔ)命令,勝過(guò)和/或曲解言語(yǔ)命令。因此,如果非言語(yǔ)相關(guān)的聲音曲解言語(yǔ)命令,則語(yǔ)音識(shí)別系統(tǒng)或方法可能不能正確地運(yùn)作。類(lèi)似地,系統(tǒng),例如對(duì)話控制系統(tǒng)的精確度在對(duì)言語(yǔ)命令產(chǎn)生響應(yīng)時(shí)可以被非言語(yǔ)相關(guān)的聲音減小。非言語(yǔ)相關(guān)的聲音,例如,可以曲解或勝過(guò)文本至通話響應(yīng),音頻,以及從語(yǔ)音對(duì)話系統(tǒng)和/或其他系統(tǒng)輸出的其他信號(hào)。因此,需要基于與聲音或聲學(xué)相關(guān)的車(chē)輛信息以增強(qiáng)語(yǔ)音識(shí)別,對(duì)話控制,和/或言語(yǔ)提示系統(tǒng)的系統(tǒng)或方法。
發(fā)明內(nèi)容
在與車(chē)輛相關(guān)的處理器中可以接收音頻信號(hào)。表不一個(gè)或多個(gè)聲音的聲音相關(guān)車(chē)輛信息可以由處理器接收。聲音相關(guān)車(chē)輛信息可以或可以不包括音頻信號(hào)?;诼曇粝嚓P(guān)車(chē)輛信息可以修改語(yǔ)音識(shí)別處理或系統(tǒng)。本發(fā)明還提供了以下方案:
1.一種方法,包括:
在與車(chē)輛相關(guān)聯(lián)的處理器中接收音頻信號(hào);
在處理器中接收表不一個(gè)或多個(gè)聲音的聲音相關(guān)的車(chē)輛信息,聲音相關(guān)的車(chē)輛信息不包括音頻信號(hào);以及
基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理。2.如方案I所述的方法,包括基于聲音相關(guān)的車(chē)輛信息確定干擾曲線記錄。3.如方案2所述的方法,其中基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理包括: 基于干擾曲線記錄確定濾波器和濾波器參數(shù);以及
應(yīng)用濾波器至音頻信號(hào)。
4.如方案2所述的方法,其中基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理包括: 基于干擾曲線記錄選擇聲學(xué)模型;以及
使用聲學(xué)模型解碼言語(yǔ)。5.如方案2所述的方法,其中基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理包括: 基于干擾曲線記錄確定自動(dòng)語(yǔ)音識(shí)別模塊前端中的濾波器和濾波器參數(shù);以及 將濾波器應(yīng)用至自動(dòng)語(yǔ)音識(shí)別模塊前端中的音頻信號(hào)。6.如方案2所述的方法,其中基于聲音相關(guān)的車(chē)輛信息確定干擾曲線記錄包括基于多種類(lèi)型的聲音相關(guān)的車(chē)輛信息使用邏輯操作確定干擾曲線記錄。7.如方案I所述的方法,包括:
在增強(qiáng)語(yǔ)音識(shí)別功能中基于聲音相關(guān)的車(chē)輛信息測(cè)量語(yǔ)音識(shí)別修改的成功;以及 基于測(cè)量的成功適用語(yǔ)音識(shí)別修改。8.如方案I所述的方法,包括:
對(duì)音頻信號(hào)中的言語(yǔ)命令產(chǎn)生響應(yīng);以及 對(duì)車(chē)輛乘員輸出響應(yīng)。9.一種系統(tǒng),包括:
存儲(chǔ)器;
與車(chē)輛相關(guān)聯(lián)的處理器,其用于:
接收音頻信號(hào);
接收表不一個(gè)或多個(gè)聲音的聲音相關(guān)的車(chē)輛信息,聲音相關(guān)的車(chē)輛信息不包括音頻信號(hào);以及
基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理。10.如方案9所述的系統(tǒng),其中處理器用于基于聲音相關(guān)的車(chē)輛信息確定干擾曲線記錄。11.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理,該處理器用于:
基于干擾曲線記錄確定濾波器和濾波器參數(shù);以及 應(yīng)用濾波器至音頻信號(hào)。12.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理,該處理器用于:
基于干擾曲線記錄選擇聲學(xué)模型;以及 使用聲學(xué)模型解碼言語(yǔ)。13.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理,該處理器用于:
基于干擾曲線記錄確定自動(dòng)語(yǔ)音識(shí)別模塊前端中的濾波器和濾波器參數(shù);以及 將濾波器應(yīng)用至自動(dòng)語(yǔ)音識(shí)別模塊前端中的音頻信號(hào)。14.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車(chē)輛信息確定干擾曲線記錄,該處理器用于通過(guò)量化聲音相關(guān)的車(chē)輛信息確定干擾曲線記錄。15.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車(chē)輛信息確定干擾曲線記錄,該處理器用于使用表格確定干擾曲線記錄。
16.如方案9所述的系統(tǒng),其中處理器用于:
在增強(qiáng)語(yǔ)音識(shí)別功能中基于聲音相關(guān)的車(chē)輛信息測(cè)量語(yǔ)音識(shí)別修改的成功;以及 基于測(cè)量的成功適用語(yǔ)音識(shí)別修改。17 —種方法,包括:
使用一個(gè)或多個(gè)與車(chē)輛相關(guān)聯(lián)的麥克風(fēng)測(cè)量聲音;
將表示聲音的信號(hào)傳送至自動(dòng)語(yǔ)音識(shí)別系統(tǒng);
在控制器接收與引起聲音的車(chē)輛系統(tǒng)的操作相關(guān)的信息;
基于信息計(jì)算干擾曲線記錄,干擾曲線記錄表示噪音類(lèi)型和噪音水平;以及 基于干擾曲線記錄改變語(yǔ)音識(shí)別。18.如方案17所述的方法,其中基于干擾曲線記錄改變語(yǔ)音識(shí)別包括:
基于干擾曲線記錄選擇濾波器和濾波器設(shè)置;以及
應(yīng)用濾波器至信號(hào)。19.如方案17所述的方法,其中基于干擾曲線記錄改變語(yǔ)音識(shí)別包括:
基于干擾曲線記錄確定聲學(xué)模型;以及
使用聲學(xué)模型解碼信號(hào)中的言語(yǔ)。20.如方案17所述的方法,其中基于干擾曲線記錄改變語(yǔ)音識(shí)別包括: 基于干擾曲線記錄選擇自動(dòng)語(yǔ)音識(shí)別系統(tǒng)前端中的濾波器;以及
使用自動(dòng)語(yǔ)音識(shí)別系統(tǒng)前端中的濾波器濾波信號(hào)。
在說(shuō)明書(shū)的總結(jié)部分中尤其指出并且清楚地要求保護(hù)的是看作本發(fā)明的主題。然而,當(dāng)結(jié)合附圖閱讀時(shí),通過(guò)參照以下詳細(xì)描述可以最佳地理解本發(fā)明的組成以及操作方法,以及其目標(biāo),特征,和優(yōu)點(diǎn)。圖1是根據(jù)本發(fā)明的實(shí)施例的具有自動(dòng)語(yǔ)音識(shí)別系統(tǒng)的車(chē)輛的示意 圖2是根據(jù)本發(fā)明的實(shí)施例的自動(dòng)語(yǔ)音識(shí)別系統(tǒng)的示意 圖3是根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音對(duì)話系統(tǒng)的方框 圖4是根據(jù)本發(fā)明的實(shí)施例的自動(dòng)語(yǔ)音識(shí)別系統(tǒng)的方框 圖5是根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音對(duì)話促使系統(tǒng)的方框 圖6是根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音對(duì)話系統(tǒng)的方框圖;以及 圖7是根據(jù)本發(fā)明的實(shí)施例的方法的流程圖。將要理解,為簡(jiǎn)單和清楚地示出,附圖中所示的元件不必須按比例繪制。例如,為了清楚,一些元件的尺寸可以相對(duì)于其他元件放大。此外,認(rèn)為合適的話,在附圖中附圖標(biāo)記可以重復(fù)以表示對(duì)應(yīng)或類(lèi)似的元件。
具體實(shí)施例方式在以下的詳細(xì)描述中,為了提供本發(fā)明的實(shí)施例的徹底理解,闡述了許多的細(xì)節(jié)。然而,本領(lǐng)域技術(shù)人員將要理解的是,在沒(méi)有這些具體細(xì)節(jié)的情況下可以實(shí)施本發(fā)明的實(shí)施例。在其他示例中,公知的方法,過(guò)程,部件,以及電路沒(méi)有具體描述,以免使本發(fā)明不清
/E.0
除非以其他方式具體地指出,否則從以下討論中清楚的是,整個(gè)說(shuō)明書(shū)討論中適用的諸如“處理”,“計(jì)算”,“存儲(chǔ)”,“確定”等術(shù)語(yǔ),表示計(jì)算機(jī)或計(jì)算系統(tǒng),或類(lèi)似的電子計(jì)算裝置的動(dòng)作和/或處理,其將對(duì)表示為計(jì)算系統(tǒng)的寄存器和/或存儲(chǔ)器內(nèi)的物理(諸如電子)量的數(shù)據(jù)進(jìn)行操作和/或轉(zhuǎn)換為類(lèi)似表示為計(jì)算系統(tǒng)的存儲(chǔ)器,寄存器或其他這樣的信息存儲(chǔ),傳輸或顯示裝置內(nèi)的物理量的其他數(shù)據(jù)。本發(fā)明的實(shí)施例可以使用聲音相關(guān)的車(chē)輛信息(例如,車(chē)輛系統(tǒng)上的信息,其涉及車(chē)輛中的聲音,但本身不包括聲音信號(hào)或記錄或音頻信號(hào)或記錄),涉及產(chǎn)生或引起聲音的車(chē)輛系統(tǒng)操作的信號(hào)或信息,聲學(xué)相關(guān)的車(chē)輛信息,或干擾聲音信息(例如,表示窗戶位置,發(fā)動(dòng)機(jī)每分鐘轉(zhuǎn)數(shù)(RPM),車(chē)輛速度,加熱通風(fēng)與制冷(HVAC)系統(tǒng)風(fēng)扇設(shè)置,音頻水平,或其他參數(shù)的數(shù)據(jù));外部聲音測(cè)量;以及其他信息以增強(qiáng)語(yǔ)音識(shí)別,促進(jìn)使用,例如語(yǔ)音對(duì)話,對(duì)話控制,和/或其他的語(yǔ)音對(duì)話系統(tǒng)或方法。提示例如可以是從語(yǔ)音對(duì)話系統(tǒng)輸出到使用者的信息,言語(yǔ),或其他的音頻信號(hào)。聲音或聲學(xué)相關(guān)的車(chē)輛信息本身可以不包括聲音信號(hào)。例如,聲音或聲學(xué)相關(guān)的信息可以表不發(fā)動(dòng)機(jī)RPM (例如包括其上的信息),但不是表不發(fā)動(dòng)機(jī)產(chǎn)生的聲音的信號(hào)。聲音或聲學(xué)相關(guān)的信息可以表不窗戶打開(kāi)(或打開(kāi)一定量)的事實(shí)(例如包括其上的信息),而不是表示風(fēng)通過(guò)打開(kāi)的窗戶所產(chǎn)生的聲音。聲音相關(guān)的車(chē)輛信息可以表示或包括描述車(chē)輛或車(chē)輛系統(tǒng)的狀態(tài)的車(chē)輛參數(shù)。產(chǎn)生或引起聲音的與車(chē)輛系統(tǒng)操作相關(guān)的聲音相關(guān)的車(chē)輛信息或信號(hào)或信息可以用來(lái)產(chǎn)生干擾曲線記錄(IPR)。干擾曲線記錄例如可以包括噪音或聲音類(lèi)型參數(shù),噪音水平或聲音強(qiáng)度參數(shù),及其他信息。(在一些實(shí)施例中,聲音相關(guān)的車(chē)輛信息可以包括噪聲類(lèi)型參數(shù)和/或噪聲水平參數(shù)。)噪聲類(lèi)型參數(shù)例如可以表示或基于一種聲音相關(guān)的車(chē)輛信息(例如,發(fā)動(dòng)機(jī)RPM,HVAC風(fēng)扇設(shè)置,窗戶位置,音頻重放水平,車(chē)輛速度,或其他信息)或聲音相關(guān)車(chē)輛信息的類(lèi)型的組合。例如,噪聲類(lèi)型參數(shù)可以包括窗戶是否打開(kāi)或打開(kāi)多少的指示(但不包括表示風(fēng)聲的信號(hào))。噪聲水平參數(shù)可以表示聲音強(qiáng)度水平相關(guān)的車(chē)輛信息(例如,HVAC風(fēng)扇設(shè)置聞,中,低,或關(guān)閉;首頻重放水平聞,中,低,或關(guān)閉;或其他聲首相關(guān)的車(chē)輛信息)或聲音相關(guān)的車(chē)輛信息的組合(例如,打開(kāi)窗戶和閾值速度以上的速度可以表示為風(fēng)的噪聲類(lèi)型參數(shù)和高的噪音水平參數(shù))。例如,噪聲水平參數(shù)可以包括風(fēng)扇是否運(yùn)行或運(yùn)行多少的指示(但不包括表示風(fēng)扇的聲音的信號(hào))。在一些實(shí)施例中,干擾曲線記錄可以是或可以包括整數(shù)(例如,8位整數(shù)或其他類(lèi)型的整數(shù)),百分比,一個(gè)范圍的值,或其他數(shù)據(jù)或信息。在一些實(shí)施例中,干擾曲線記錄(例如,噪聲類(lèi)型參數(shù),噪聲水平參數(shù)和/或其他參數(shù))可以用來(lái)增強(qiáng)語(yǔ)音識(shí)別。干擾曲線記錄例如可以由語(yǔ)音識(shí)別系統(tǒng)或處理(例如,包括信號(hào)處理器,自動(dòng)語(yǔ)音識(shí)別(ASR)系統(tǒng),或其他系統(tǒng)或方法)使用從而修改或改變聲音信號(hào)以提高語(yǔ)音識(shí)別系統(tǒng)或處理解碼。在一個(gè)示例中,信號(hào)處理器,ASR,或其他系統(tǒng)可以基于干擾曲線記錄(例如,噪聲類(lèi)型參數(shù)和噪聲水平參數(shù)),應(yīng)用預(yù)訓(xùn)練的濾波器(例如,Weiner濾波器,梳狀濾波器,或其他電子信號(hào)濾波器)從而修改或改變輸入信號(hào)以限制或除去噪音并且提高語(yǔ)音識(shí)別。例如,基于噪聲類(lèi)型參數(shù)可以應(yīng)用一種類(lèi)型的預(yù)訓(xùn)練濾波器,并且基于噪聲水平參數(shù)濾波器設(shè)置或參數(shù)可以確定和/或應(yīng)用。濾波器設(shè)置或參數(shù)例如可以控制或表示濾波器的量或水平或?yàn)V波,濾波的頻率,或?yàn)V波器的其他屬性。濾波的水平(例如,濾波的量),濾波的頻率,以及濾波器的其他屬性例如可以基于可以表示窗戶位置(例如,窗戶打開(kāi)了多少的百分比)的噪聲水平參數(shù),發(fā)動(dòng)機(jī)每分鐘轉(zhuǎn)數(shù)(RPM),車(chē)輛速度,環(huán)境控制風(fēng)扇設(shè)置,音頻重放水平,或其他車(chē)輛參數(shù)。例如,如果噪聲水平參數(shù)表示高水平的噪音而不是低水平的噪音,濾波的更高水平或量而不是低水平可以應(yīng)用到輸入信號(hào)中。當(dāng)然可以使用濾波器水平和噪聲水平參數(shù)的不同組合??梢允褂闷渌盘?hào)處理方法和/或模塊。在一個(gè)示例中,基于干擾曲線記錄(例如,噪聲類(lèi)型參數(shù)和噪聲水平參數(shù)),ASR或其他系統(tǒng)可以應(yīng)用預(yù)訓(xùn)練聲學(xué)模型以改進(jìn)語(yǔ)音識(shí)別。基于干擾曲線記錄(例如,噪聲類(lèi)型參數(shù),噪聲水平參數(shù),和/或其他參數(shù))可以選擇一種預(yù)訓(xùn)練聲學(xué)模型(例如,在多個(gè)聲學(xué)模型中)。在一些實(shí)施例中,一種聲學(xué)模型可以對(duì)應(yīng)于一個(gè)或多個(gè)干擾曲線記錄。例如,基于聲音相關(guān)的車(chē)輛信息如果產(chǎn)生了預(yù)定的干擾曲線記錄,則可以使用預(yù)定聲學(xué)模型。根據(jù)一些實(shí)施例,基于干擾曲線記錄可以適用語(yǔ)音識(shí)別處理的變型。在適用操作中,監(jiān)督的學(xué)習(xí)可以用來(lái)適用或改變信號(hào)修改參數(shù)(例如,濾波器參數(shù)或其他參數(shù)),適用或訓(xùn)練聲學(xué)模型變換矩陣,適用或改變使用哪個(gè)預(yù)訓(xùn)練的聲學(xué)模型,或適用語(yǔ)音對(duì)話系統(tǒng)的其他特征。在適用操作中,信號(hào)修改參數(shù)的效果例如可以通過(guò)確定在識(shí)別言語(yǔ)中(例如,字,句,以及言語(yǔ)的其他部分)的語(yǔ)音識(shí)別系統(tǒng)的ASR或其他部件的成功或有效性進(jìn)行監(jiān)控或測(cè)量。基于該測(cè)量,信號(hào)修改參數(shù)例如可以適用或改變以改進(jìn)語(yǔ)音識(shí)別和語(yǔ)音對(duì)話系統(tǒng)的功能或成功。在一個(gè)示例中,基于給定組的噪音類(lèi)型參數(shù)和噪音水平參數(shù)可以應(yīng)用以給定組濾波器參數(shù)操作的預(yù)定濾波器(例如,Weiner濾波器,梳狀濾波器,或其他的濾波器)?;谠胍纛?lèi)型參數(shù)和噪音水平參數(shù),適用模塊例如可以測(cè)量以給定組參數(shù)操作的濾波器在增強(qiáng)或改進(jìn)語(yǔ)音識(shí)別中是如何有效或成功的?;谠摐y(cè)量,濾波器參數(shù)可以適用或改變以改進(jìn)或增強(qiáng)語(yǔ)音識(shí)別??梢赃m用其他的信號(hào)修改參數(shù)。在一些實(shí)施例中,干擾曲線記錄(例如,噪音類(lèi)型參數(shù),噪音水平參數(shù),和/或其他的參數(shù))可以由文本至言語(yǔ),音頻處理,或其他模塊或方法進(jìn)行使用以增強(qiáng)言語(yǔ)提示或語(yǔ)音對(duì)話,音頻輸出,或典型地至乘客的其他的音頻信號(hào)輸出。基于噪音類(lèi)型參數(shù),噪音水平參數(shù),和/或其他的參數(shù),音頻處理模塊或其他的系統(tǒng)例如可以增加或減小提示水平,成形或重新成形提示頻譜,修改提示程度,或以其他方式改變提示。音頻處理模塊例如可以增加音頻輸出音量水平,成形或重新成形音頻頻譜(例如,音頻重放頻譜),修改音頻重放程度,和/或以其他方式改變音頻或聲音。基于噪音類(lèi)型參數(shù),噪音水平參數(shù),和/或其他參數(shù),文本至言語(yǔ)模塊或其他系統(tǒng)例如可以修改或改變言語(yǔ)速率,音節(jié)持續(xù)時(shí)間,或其他的言語(yǔ)相關(guān)的參數(shù)。根據(jù)一些實(shí)施例,可以適用基于干擾曲線記錄的言語(yǔ)提示,音頻輸出,或其他音頻信號(hào)輸出的修改。在適用操作中,監(jiān)督的學(xué)習(xí)可以用來(lái)適用或改變與增加或降低提示水平相關(guān)的參數(shù),用于成形或重新成形提示頻譜的參數(shù),用來(lái)修改提示程度的參數(shù),和/或其他參數(shù)。在適用操作中,可以測(cè)量用來(lái)增加或降低提示水平的參數(shù),用來(lái)重新成形提示頻譜的參數(shù),用來(lái)修改提示程度的參數(shù),和/或其他參數(shù)的效果。言語(yǔ)或音頻提示的實(shí)質(zhì)或內(nèi)容可以改變?;跍y(cè)量,可以適用或改變用來(lái)增加或降低提示水平的參數(shù),用來(lái)重新成形提示頻譜的參數(shù),用來(lái)修改提示程度的參數(shù),和/或其他參數(shù)以改進(jìn)或增強(qiáng)提示或音頻輸出功能。在一些實(shí)施例中,干擾曲線記錄(例如,噪音類(lèi)型參數(shù),噪音水平參數(shù),和/或其他參數(shù))例如可以通過(guò)對(duì)話控制模塊或其他系統(tǒng)或方法使用以增強(qiáng)車(chē)輛乘員與語(yǔ)音對(duì)話系統(tǒng)的互動(dòng)。語(yǔ)音對(duì)話控制模塊或其他系統(tǒng)例如可以基于噪音類(lèi)型參數(shù),噪音水平參數(shù),和/或其他參數(shù)修改對(duì)話控制,介紹提示(例如,介紹性的提示),修改音頻提示,修改輸出言語(yǔ)的實(shí)質(zhì)或內(nèi)容,修改對(duì)話類(lèi)型,收聽(tīng)并且響應(yīng)使用者混淆,修改多種形式對(duì)話,修改后端應(yīng)用功能,和/或執(zhí)行其他操作。根據(jù)一些實(shí)施例,可以適用基于干擾曲線記錄的語(yǔ)音對(duì)話控制的修改。在適用操作中,監(jiān)督的學(xué)習(xí)可以用來(lái)適用或改變?cè)趯?duì)話控制中使用的參數(shù),提示介紹,提示修改,對(duì)話類(lèi)型修改,使用者混淆響應(yīng),多種形式對(duì)話修改,后端應(yīng)用功能修改,和/或其他的操作。在適用操作中,可以測(cè)量在對(duì)話控制中使用的參數(shù),提示介紹,提示修改,對(duì)話類(lèi)型修改,使用者混淆響應(yīng),多種形式對(duì)話修改,后端應(yīng)用功能修改,和/或其他的操作的效果?;跍y(cè)量,可以適用或改變?cè)趯?duì)話控制中使用的參數(shù),提示介紹,提示修改,對(duì)話類(lèi)型修改,使用者混淆響應(yīng),多種形式對(duì)話修改,后端應(yīng)用功能修改,和/或其他的操作以改進(jìn)或增強(qiáng)語(yǔ)音對(duì)話系統(tǒng)功能。根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音對(duì)話系統(tǒng)或方法通過(guò)基于精確定時(shí)的或?qū)崟r(shí)的車(chē)輛聲音相關(guān)的信息,噪聲特性的預(yù)先理解,以及其他信息,修改或改變自動(dòng)語(yǔ)音識(shí)別,音頻提示,對(duì)話控制和/或其他操作,可以是尤其有用的。附加地,用來(lái)修改或改變自動(dòng)語(yǔ)音識(shí)別,提示,對(duì)話控制和/或其他操作的參數(shù)可以適用或改變以在語(yǔ)音對(duì)話系統(tǒng)的整個(gè)壽命中改進(jìn)語(yǔ)音對(duì)話系統(tǒng)的功能。通過(guò)本發(fā)明的實(shí)施例可以實(shí)現(xiàn)其他的和不同的優(yōu)點(diǎn)。圖1是根據(jù)本發(fā)明的實(shí)施例的具有自動(dòng)語(yǔ)音識(shí)別系統(tǒng)的車(chē)輛的示意圖。車(chē)輛10(例如汽車(chē),貨車(chē),或其他車(chē)輛)可以包括或連接到語(yǔ)音對(duì)話系統(tǒng)100。一個(gè)或多個(gè)麥克風(fēng)20可以與系統(tǒng)100相關(guān)聯(lián),并且麥克風(fēng)20可以接收或記錄對(duì)話,環(huán)境噪聲,車(chē)輛噪聲,音頻信號(hào)及其他聲音。麥克風(fēng)20可以位于車(chē)艙22內(nèi)部,車(chē)艙22外部,或在其他位置。例如,一個(gè)麥克風(fēng)20可以位于車(chē)艙22內(nèi)部并且可以接收或記錄言語(yǔ),非言語(yǔ)相關(guān)的聲音,噪音,和/或車(chē)艙22內(nèi)部的聲音。非言語(yǔ)相關(guān)的聲音可以包括例如車(chē)輛10相關(guān)的噪音(例如,發(fā)動(dòng)機(jī)噪音,加熱通風(fēng)與制冷(HVAC)系統(tǒng)噪聲等),非車(chē)輛相關(guān)的噪音(例如,車(chē)輛外部的噪音),音頻系統(tǒng)聲音(例如,音樂(lè),廣播相關(guān)聲音),以及其他聲音。一個(gè)或多個(gè)外部麥克風(fēng)24例如可以位于車(chē)艙22的外部(例如,在車(chē)身,保險(xiǎn)杠,車(chē)尾行李箱,擋風(fēng)玻璃或其他位置上)。一個(gè)或多個(gè)傳感器可以附著于車(chē)輛10或與車(chē)輛10相關(guān)聯(lián)。窗戶位置傳感器60,發(fā)動(dòng)機(jī)每分鐘轉(zhuǎn)速(RPM)傳感器26,車(chē)速傳感器28 (例如,車(chē)速表),HVAC傳感器30 (例如,HVAC風(fēng)扇設(shè)置傳感器),音頻水平傳感器32(例如,音頻系統(tǒng)音量水平),外部麥克風(fēng)24,以及諸如風(fēng)擋刮水器傳感器的其他或不同的傳感器可以測(cè)量聲音相關(guān)的車(chē)輛信息,車(chē)輛參數(shù),車(chē)輛狀態(tài),車(chē)輛外部的噪音,或車(chē)輛相關(guān)信息。聲音相關(guān)的車(chē)輛信息或干擾聲音信息可以例如經(jīng)由有線鏈接50 (例如,數(shù)據(jù)總線,控制器區(qū)域網(wǎng)(CAN)總線,F(xiàn)lexray,以太網(wǎng))或無(wú)線鏈接傳輸至系統(tǒng)100。可以由系統(tǒng)100或其他系統(tǒng)使用聲音相關(guān)的車(chē)輛信息以確定表不聲音相關(guān)的車(chē)輛信息的干擾曲線記錄(例如,噪聲曲線記錄)或其他數(shù)據(jù)??梢允褂闷渌虿煌膫鞲衅骰蛐畔ⅰT诒景l(fā)明的一個(gè)實(shí)施例中,語(yǔ)音對(duì)話系統(tǒng)100可以是或可以包括安裝在儀表板上或車(chē)輛的控制臺(tái)中,客艙22中,或車(chē)尾行李箱中的計(jì)算裝置。在替換的實(shí)施例中,語(yǔ)音對(duì)話系統(tǒng)100可以位于車(chē)輛的其他部分中,可以位于車(chē)輛的多個(gè)部分中,或可以具有遠(yuǎn)程定位的全部或部分其功能(例如,在遠(yuǎn)程服務(wù)器中或諸如移動(dòng)電話的便攜式計(jì)算裝置中)。語(yǔ)音對(duì)話系統(tǒng)100例如可以執(zhí)行一個(gè)或多個(gè)輸出語(yǔ)音對(duì)話或音頻提示至車(chē)輛乘客并且輸入表示來(lái)自車(chē)輛乘客的言語(yǔ)的音頻信息。根據(jù)一些實(shí)施例,揚(yáng)聲器,麥克風(fēng),電聲換能器,耳機(jī),或其他裝置40可以響應(yīng)于聲音命令,語(yǔ)音響應(yīng),音頻命令,音頻警告,信息請(qǐng)求,或其他音頻信號(hào)輸出,廣播,或傳輸音頻提示或語(yǔ)音對(duì)話。至聲音命令的音頻提示和/或響應(yīng)例如可以響應(yīng)于來(lái)自車(chē)輛乘客的言語(yǔ)命令,請(qǐng)求,或應(yīng)答輸出。提示例如可以包括關(guān)于系統(tǒng)100功能,車(chē)輛功能的信息,來(lái)自使用者(例如,車(chē)輛乘客)的問(wèn)題請(qǐng)求信息,由使用者請(qǐng)求的信息,或其他信息。在一些實(shí)施例中,提示和語(yǔ)音輸入可以以其他方式在車(chē)輛中使用。在一些實(shí)施例中,顯示器,屏幕,或其他圖像或視頻輸出裝置42可以輸出信息,警告,視頻,圖像或其他數(shù)據(jù)至車(chē)輛10中的乘客。顯示器42上顯示的信息例如可以響應(yīng)于來(lái)自車(chē)輛10中的駕駛員或其他乘客的信息請(qǐng)求而顯示。在一些實(shí)施例中,車(chē)輛10可以包括與麥克風(fēng)20分開(kāi)或相關(guān)聯(lián)的輸入裝置或區(qū)域44。輸入裝置或觸覺(jué)裝置44例如可以是觸摸屏,鍵盤(pán),指針裝置,轉(zhuǎn)向信號(hào)或其他裝置。輸入裝置44例如可以用來(lái)使能,停用,或調(diào)整語(yǔ)音對(duì)話系統(tǒng)100的設(shè)置。盡管論述了各種傳感器和輸入,在某些實(shí)施例中可以僅使用傳感器或輸入的子集(例如,一個(gè)或其他數(shù)目)。圖2是根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音對(duì)話系統(tǒng)的示意圖。語(yǔ)音對(duì)話系統(tǒng)100可以包括一個(gè)或多個(gè)處理器或控制器110,存儲(chǔ)器120,長(zhǎng)期存儲(chǔ)器130,輸入裝置或區(qū)域44,以及輸出裝置或區(qū)域42。輸入裝置或區(qū)域140與輸出裝置或區(qū)域150例如可以組合成可以是系統(tǒng)100的一部分的觸屏顯示器和輸入。系統(tǒng)100可以包括一個(gè)或多個(gè)數(shù)據(jù)庫(kù)150,其可以包括例如聲音或聲學(xué)相關(guān)的車(chē)輛信息160 (例如,干擾聲音信息),干擾曲線記錄(IPR)180,語(yǔ)音對(duì)話系統(tǒng)實(shí)體170,以及其他信息。聲音相關(guān)的車(chē)輛信息160例如可以包括車(chē)輛參數(shù),記錄的聲音,和/或其他信息。數(shù)據(jù)庫(kù)150例如可以包括干擾曲線記錄180 (例如,噪聲類(lèi)型參數(shù)、噪聲水平參數(shù),和/或其他信息),噪聲曲線,噪聲曲線記錄,和/或表示車(chē)輛參數(shù)和/或其他信息的其他數(shù)據(jù)。數(shù)據(jù)庫(kù)150可以全部或部分地存儲(chǔ)在存儲(chǔ)器120,長(zhǎng)期存儲(chǔ)器130的一個(gè)或兩者中,或其他裝置中。處理器或控制器110例如可以是中央處理器(CPU),芯片,或任意適當(dāng)?shù)挠?jì)算或計(jì)算機(jī)裝置。處理器或控制器110可以包括多個(gè)處理器,并且可以包括通用處理器和/或諸如圖形處理芯片的專(zhuān)用處理器。處理器Iio可以執(zhí)行例如存儲(chǔ)在存儲(chǔ)器120或長(zhǎng)期存儲(chǔ)器130中的代碼或指令以實(shí)施本發(fā)明的實(shí)施例。存儲(chǔ)器120可以是或可以包括,例如,隨機(jī)存取存儲(chǔ)器(RAM),只讀存儲(chǔ)器(R0M),動(dòng)態(tài)RAM (DRAM),同步DRAM (SD-RAM),雙數(shù)據(jù)率(DDR)存儲(chǔ)芯片,閃速存儲(chǔ)器,易失性存儲(chǔ)器,非易失性存儲(chǔ)器,超高速緩沖存儲(chǔ)器,緩沖器,短期存儲(chǔ)器單元,長(zhǎng)期存儲(chǔ)器單元,或其他適當(dāng)?shù)拇鎯?chǔ)器單元或存儲(chǔ)單元。存儲(chǔ)器120可以是或可以包括多個(gè)存儲(chǔ)器單元。長(zhǎng)期存儲(chǔ)器130可以是或可以包括,例如,硬盤(pán)驅(qū)動(dòng)器,軟盤(pán)驅(qū)動(dòng)器,光盤(pán)(⑶)驅(qū)動(dòng)器,可錄式光盤(pán)(⑶-R)驅(qū)動(dòng)器,通用串行總線(USB)裝置或其他適當(dāng)?shù)目梢苿?dòng)的和/或固定的存儲(chǔ)單元,并且可以包括多個(gè)這樣的單元或這樣的單元的組合。圖3是根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音對(duì)話系統(tǒng)的方框圖。圖3的系統(tǒng)例如可以是圖2的系統(tǒng)的一部分,或其他系統(tǒng)的一部分,并且可以將其功能由圖2的系統(tǒng),或由其他系統(tǒng)執(zhí)行。圖3的系統(tǒng)的部件例如可以是專(zhuān)用硬件部分,或可以是由處理器110執(zhí)行的全部或部分代碼。麥克風(fēng)20或其他輸入裝置可以接收,記錄或測(cè)量車(chē)輛中聲音,噪音,和/或言語(yǔ)。聲音可以包括言語(yǔ),言語(yǔ)命令,語(yǔ)音命令或來(lái)自車(chē)輛10中的乘客的其他表示。麥克風(fēng)20可以將包括言語(yǔ)命令的表不輸入聲音的音頻信號(hào)或信號(hào)200傳輸或發(fā)送至系統(tǒng)100,語(yǔ)音識(shí)別系統(tǒng)或處理201,或其他模塊或系統(tǒng)。語(yǔ)音識(shí)別系統(tǒng)或處理201例如可以包括信號(hào)處理器202(例如,語(yǔ)音識(shí)別前端),語(yǔ)音識(shí)別模件204,以及其他系統(tǒng)或模塊。包括言語(yǔ)命令的表不輸入聲音的音頻信號(hào)200可以輸出到與系統(tǒng)100相關(guān)聯(lián)的自動(dòng)語(yǔ)音識(shí)別系統(tǒng)201,信號(hào)處理器或信號(hào)處理或增強(qiáng)裝置,適用模塊,或其他裝置。信號(hào)處理器202例如可以接收音頻信號(hào)。信號(hào)處理器202例如可以濾波,放大數(shù)字化,或以其他方式轉(zhuǎn)換信號(hào)200。信號(hào)處理器202可以傳輸信號(hào)200至語(yǔ)音識(shí)別模件或裝置204。自動(dòng)語(yǔ)音識(shí)別(ASR)模塊或語(yǔ)音識(shí)別模件204可以摘錄,識(shí)別,或確定來(lái)自信號(hào)200的字,句,語(yǔ)言,語(yǔ)音,或聲音模式。字可以通過(guò)例如將音頻信號(hào)與聲學(xué)模型,列表,或公知的字,語(yǔ)音和/或句的數(shù)據(jù)庫(kù)進(jìn)行比較而摘錄?;诒容^,基于最高的相似性和/或匹配的可能性,可能識(shí)別的字或句可以排序。ASR模塊204可以將表示識(shí)別的字或句的信號(hào)200輸出或傳輸至語(yǔ)義解釋器206。根據(jù)一些實(shí)施例,車(chē)輛乘客可以輸入命令或信息至輸入裝置44。輸入裝置44可以傳輸或輸出表不命令或信息的信號(hào)至觸覺(jué)輸入識(shí)別模塊208。觸覺(jué)輸入識(shí)別模塊208可以識(shí)別,解碼,摘錄,或確定信號(hào)中或來(lái)自信號(hào)的字,句,語(yǔ)言,或語(yǔ)音。觸覺(jué)輸入識(shí)別模塊208例如可以通過(guò)將來(lái)自輸入44的信號(hào)與字,句,語(yǔ)言,或語(yǔ)音的統(tǒng)計(jì)的模型,數(shù)據(jù)庫(kù),詞典或目錄相比較以識(shí)別信號(hào)中的字,句,語(yǔ)言,或語(yǔ)音。觸覺(jué)輸入識(shí)別模塊208可以將表示識(shí)別的字或句的信號(hào)輸出或傳輸至語(yǔ)義解釋器206。觸覺(jué)信號(hào)例如可以與來(lái)自語(yǔ)義解釋器206中的ASR模塊204的信號(hào)合并或進(jìn)行比較。根據(jù)一些實(shí)施例,語(yǔ)義解釋器206可以確定來(lái)自ASR模塊204,觸覺(jué)輸入識(shí)別模塊208和/或其他裝置或模塊的信號(hào)輸出中的字,句,語(yǔ)言或語(yǔ)音的含義。語(yǔ)義解釋器206例如可以是分析程序(例如,語(yǔ)義分析程序)。語(yǔ)義解釋器206例如可以將識(shí)別的字串與可以表示含義的對(duì)話動(dòng)作進(jìn)行映射。對(duì)話動(dòng)作例如可以參看應(yīng)用的實(shí)體(例如,應(yīng)用實(shí)體的部件)。例如,使用者可以提供言語(yǔ)命令或字串(例如“為我尋找酒店”)并且語(yǔ)義解釋器206可以分析或映射字串至對(duì)話動(dòng)作(例如,信息(類(lèi)型=酒店))。語(yǔ)義解釋器206例如可以使用一種模型,其涉及字至應(yīng)用實(shí)體(例如,應(yīng)用實(shí)體中的對(duì)話動(dòng)作)。模型例如可以被歸入語(yǔ)音識(shí)別語(yǔ)法(例如,數(shù)據(jù)庫(kù)150,存儲(chǔ)器120,或其他位置中)和/或其他位置。語(yǔ)音識(shí)別模塊204可以識(shí)別聲明中的字并且傳輸表示字的信號(hào)至語(yǔ)義解釋器206。對(duì)話動(dòng)作,表示言語(yǔ)命令的信息,和/或其他信息或信號(hào)可以輸出到對(duì)話控制模塊210。在一些實(shí)施例中,對(duì)話控制模塊210可以產(chǎn)生,計(jì)算或確定至對(duì)話動(dòng)作的響應(yīng)。例如,如果對(duì)話動(dòng)作是信息請(qǐng)求(例如,信息(類(lèi)型=酒店)),對(duì)話控制模塊210可以確定至提供信息的請(qǐng)求的響應(yīng)(例如,酒店的位置),請(qǐng)求進(jìn)一步信息的響應(yīng)(例如,“你的價(jià)格范圍是多少? ”),或其他響應(yīng)。對(duì)話控制模塊210可以結(jié)合或關(guān)聯(lián)后端應(yīng)用212運(yùn)作。后端應(yīng)用212例如可以是數(shù)據(jù)搜索(例如,搜索發(fā)動(dòng)機(jī)),導(dǎo)航,立體聲或廣播控制,音樂(lè)檢索,或其他類(lèi)型的應(yīng)用。根據(jù)一些實(shí)施例,反應(yīng)發(fā)生器或響應(yīng)生成模塊214例如可以接收來(lái)自對(duì)話控制模塊210的響應(yīng)信息。響應(yīng)生成模塊214例如可以公式化或產(chǎn)生文本,短語(yǔ),或字(例如,公式化句子),用于輸出到車(chē)輛乘客的響應(yīng)??梢暿疽饽K216可以通過(guò)響應(yīng)生成模塊214產(chǎn)生顯示文本響應(yīng)輸出的圖像,系列圖像,或視頻??梢暿疽饽K216可以輸出圖像,系列圖像,或視頻至顯示器44或其他裝置。文本至言語(yǔ)模塊218可以轉(zhuǎn)換來(lái)自響應(yīng)生成模塊214的文本至言語(yǔ),音頻信號(hào)輸出,或可聽(tīng)信號(hào)輸出。語(yǔ)音信號(hào)可以從文本至言語(yǔ)模塊218輸出至音頻信號(hào)處理器220。音頻信號(hào)處理器220可以從數(shù)字至音頻轉(zhuǎn)換信號(hào),放大信號(hào),解壓縮信號(hào),和/或其他修改或轉(zhuǎn)變信號(hào)。音頻信號(hào)可以輸出到揚(yáng)聲器40。揚(yáng)聲器40可以廣播響應(yīng)至車(chē)輛乘客。干擾曲線模塊222可以接收聲音相關(guān)的車(chē)輛信息160,車(chē)輛參數(shù),接收的聲音信號(hào),和/或來(lái)自數(shù)據(jù)總線50或其他源的表示一個(gè)或多個(gè)聲音的其他信息。在一些實(shí)施例中,數(shù)據(jù)總線50可以傳輸或轉(zhuǎn)換聲音相關(guān)的車(chē)輛信息160至與語(yǔ)音對(duì)話系統(tǒng)100相關(guān)聯(lián)的干擾曲線模塊222或與系統(tǒng)100相關(guān)聯(lián)的其他模塊或裝置。干擾曲線記錄(IPR)ISO可以基于聲音相關(guān)的車(chē)輛信息160通過(guò)干擾曲線模塊222產(chǎn)生,確定或計(jì)算。干擾曲線記錄180可以包括噪聲水平參數(shù)(例如,聲音強(qiáng)度參數(shù)),噪聲或聲音類(lèi)型參數(shù),和/或其他信息?;诼曇粝嚓P(guān)的車(chē)輛信息160,接收的聲音,和/或表示聲音或噪音的其他信息,可以確定噪聲水平參數(shù),噪聲類(lèi)型參數(shù)、和/或其他參數(shù)。例如,聲音相關(guān)的車(chē)輛信息160可以表示或表明加熱,通風(fēng),和空調(diào)(HVAC)系統(tǒng)風(fēng)扇打開(kāi)并且以高設(shè)置在操作。例如可以產(chǎn)生包括風(fēng)扇的噪聲類(lèi)型參數(shù)(例如,噪聲類(lèi)型=風(fēng)扇)以及高噪聲水平參數(shù)(例如,噪聲水平=高)的IPR 180以表示指示HVAC風(fēng)扇在高設(shè)置的聲音相關(guān)的車(chē)輛信息160??梢援a(chǎn)生包括噪聲類(lèi)型參數(shù),噪聲水平參數(shù),以及其他參數(shù)的其他參數(shù)的其他IPR 180。噪聲水平參數(shù)和噪聲類(lèi)型參數(shù)可以表示車(chē)輛中的噪音或聲音或車(chē)輛中類(lèi)似存在的噪音或聲音,但典型地不包括實(shí)際噪音或聲音的音頻信號(hào)或記錄。根據(jù)一些實(shí)施例,基于噪聲水平參數(shù),噪聲類(lèi)型參數(shù),和/或其他參數(shù),修改模塊或步驟224可以改變或修改音頻信號(hào)200,濾波器噪音,和/或以其他方式修改自動(dòng)語(yǔ)音識(shí)別。在一些實(shí)施例中,通過(guò)應(yīng)用濾波器至音頻信號(hào)200,確定在語(yǔ)音識(shí)別中使用的聲學(xué)模型,和/或以其他方式增強(qiáng)信號(hào)處理202,語(yǔ)音識(shí)別204,或語(yǔ)音識(shí)別步驟或處理,修改模塊224可以修改音頻信號(hào)200。根據(jù)一些實(shí)施例,干擾曲線記錄例如可以通過(guò)文本至對(duì)話218,音頻處理220,或其他模塊或方法進(jìn)行使用以增強(qiáng)從系統(tǒng)100輸出的音頻言語(yǔ)提示,聲頻輸出,或其他聲音或廣播。文本至對(duì)話218參數(shù)或輸出可以通過(guò)增加或降低言語(yǔ)速度,增加或降低音節(jié)持續(xù)時(shí)間,和/或以其他方式修改從系統(tǒng)100的言語(yǔ)輸出(例如,經(jīng)由揚(yáng)聲器40)可以進(jìn)行修改?;诟蓴_曲線記錄(例如,噪聲類(lèi)型參數(shù),噪聲水平參數(shù),及其他參數(shù))可以修改與音頻處理220相關(guān)的參數(shù)(例如,提示水平,提示頻譜,音頻重放,或其他參數(shù))。來(lái)自系統(tǒng)的音頻輸出例如可以通過(guò)增加提示水平(例如,音量),改變提示音高,成形或重新成形提示頻譜(例如,以增加信號(hào)噪音比),增強(qiáng)音頻重放(例如,立體聲重放),和/或以其他方式增強(qiáng)或改變來(lái)自系統(tǒng)100的聲頻輸出(例如,經(jīng)由揚(yáng)聲器40)而修改??梢允褂梦谋局裂哉Z(yǔ)218,音頻處理220,和/或其他類(lèi)型言語(yǔ)提示或聲頻輸出修改224的組合。例如,可以使用Lombard類(lèi)型或其他類(lèi)型的言語(yǔ)修改。Lombard類(lèi)型修改例如可以以人在喧吵環(huán)境下,具有背景噪聲的環(huán)境下,或在溝通很困難的設(shè)置中的對(duì)話為模型。Lombard類(lèi)型修改例如可以使用音頻處理220,文本至言語(yǔ)218,或其他模塊和/或操作修改音頻頻譜,音高,言語(yǔ)速度,音節(jié)持續(xù)時(shí)間及其他音頻特性。根據(jù)一些實(shí)施例,基于噪聲水平參數(shù),噪聲類(lèi)型參數(shù),和/或其他參數(shù),可以修改和/或改變對(duì)話控制210或與言語(yǔ)對(duì)話系統(tǒng)100相關(guān)聯(lián)的其他系統(tǒng)或處理。例如通過(guò)實(shí)施或利用澄清動(dòng)作(例如,詢問(wèn)使用者輸入的清楚的確認(rèn),以重復(fù)輸入,或其他澄清),確定并且輸出介紹的音頻提示(例如,在窗戶下降,高發(fā)動(dòng)機(jī)RPM,或基于其他車(chē)輛參數(shù)時(shí)聲音識(shí)別可能困難,提示使用者使用輸出言語(yǔ)),修改提示(例如,控制提示的速度或定時(shí)),修改對(duì)話類(lèi)型(例如,提示使用者單一的軌跡或簡(jiǎn)單的信息而不是復(fù)雜信息,強(qiáng)制使用精確的短語(yǔ),避免混合的主動(dòng)以及其他修改),監(jiān)控并且響應(yīng)使用者混淆,和/或以其他方式修改對(duì)話控制210,對(duì)話控制210可以修改或改變(例如,通過(guò)修改模塊224)。在一些實(shí)施例中,多種形式對(duì)話(例如,結(jié)合觸覺(jué),視覺(jué)或其他對(duì)話的語(yǔ)音對(duì)話)例如可以修改(例如,通過(guò)修改模塊224)。例如,通過(guò)在言語(yǔ)提示上恢復(fù)成,評(píng)價(jià),或證實(shí)可見(jiàn)顯示,通過(guò)還原為系統(tǒng)假設(shè)的可見(jiàn)顯示(例如,對(duì)于信息以及其他提示的問(wèn)題,請(qǐng)求),提示或請(qǐng)求來(lái)自使用者的觸覺(jué)確認(rèn)(例如,提示使用者從顯示在觸摸屏或其他輸出裝置上的響應(yīng)的清單中選擇響應(yīng)),鼓勵(lì)使用者觸覺(jué)形式(例如,減少與語(yǔ)義解釋器206相關(guān)聯(lián)的信任水平),基于應(yīng)用功能的子集的其他形式從言語(yǔ)切換(例如通過(guò)觸覺(jué)裝置的簡(jiǎn)單命令和控制),或其他修改,多種形式對(duì)話可以修改?;诟蓴_曲線記錄可以修改后端應(yīng)用功能(例如,通過(guò)修改模塊224)。例如,后端應(yīng)用服務(wù)或特征的功能可以鎖定,減少,或以其他方式修改(例如,鎖定語(yǔ)音搜索,允許廣播控制,以及其他服務(wù))。圖4是根據(jù)本發(fā)明的實(shí)施例的自動(dòng)語(yǔ)音識(shí)別系統(tǒng)的方框圖。根據(jù)一些實(shí)施例,干擾曲線模塊222可以接收聲音相關(guān)的車(chē)輛信息160,例如包括或表示來(lái)自數(shù)據(jù)總線50的車(chē)輛參數(shù)以及其他信息。車(chē)輛參數(shù)例如可以包括窗戶位置(例如,打開(kāi)或關(guān)閉,打開(kāi)一定量等),發(fā)動(dòng)機(jī)設(shè)置(例如發(fā)動(dòng)機(jī)每分鐘轉(zhuǎn)數(shù)(RPM)),車(chē)輛速度,HVAC風(fēng)扇設(shè)置(例如,關(guān)閉,低,中,高),音頻重放水平,或其他車(chē)輛相關(guān)參數(shù)。根據(jù)一些實(shí)施例,干擾曲線模塊222可以接收來(lái)自麥克風(fēng)的聲音相關(guān)的車(chē)輛信息160 (例如,外部麥克風(fēng)24,內(nèi)部麥克風(fēng)20,或其他麥克風(fēng))。在一些實(shí)施例中,來(lái)自麥克風(fēng)的聲音相關(guān)的車(chē)輛信息160可以包括非言語(yǔ)相關(guān)的聲音,車(chē)輛相關(guān)的聲音,非車(chē)輛相關(guān)的聲音,基礎(chǔ)結(jié)構(gòu)聲音,風(fēng)噪音,路面噪音,來(lái)自車(chē)艙外的人的言語(yǔ),環(huán)境聲音。干擾模塊222例如可以基于聲音相關(guān)的車(chē)輛信息160產(chǎn)生干擾曲線記錄(IPR) 180。干擾曲線記錄180例如可以是表格,數(shù)據(jù)集,數(shù)據(jù)庫(kù),或其他組信息。每個(gè)IPR 180例如可以是聲音相關(guān)的車(chē)輛信息160 (例如,車(chē)輛參數(shù)以及其他聲音或信息)的表現(xiàn)。例如IPR 180可以包括噪音水平參數(shù)304 (例如,聲音強(qiáng)度參數(shù)),噪音類(lèi)型參數(shù)306 (例如,聲音類(lèi)型參數(shù)或噪音分類(lèi)參數(shù)),以及表示聲音相關(guān)的車(chē)輛信息160的其他參數(shù)。在一些實(shí)施例中,噪音水平參數(shù)304,噪音類(lèi)型參數(shù)306,以及其他參數(shù)可以表示聲音相關(guān)的車(chē)輛信息160的種類(lèi)的組合(例如,車(chē)輛參數(shù),接收的聲音,和/或其他聲音或信息)。包括噪音水平參數(shù)304,噪音類(lèi)型參數(shù)306,和/或其他參數(shù)的IPR 180例如可以表示實(shí)時(shí)的,連續(xù)的,或在預(yù)定時(shí)間段的車(chē)輛參數(shù)(例如,發(fā)動(dòng)機(jī)RPM,HVAC風(fēng)扇設(shè)置,窗戶位置等)或車(chē)輛相關(guān)的聲音。當(dāng)語(yǔ)音對(duì)話系統(tǒng)100啟動(dòng),車(chē)輛在任何時(shí)間通電,或在其他時(shí)間,干擾曲線記錄180例如可以連續(xù),實(shí)時(shí)產(chǎn)生。
噪音類(lèi)型參數(shù)306例如可以是表示或源自包括車(chē)輛參數(shù)(例如,發(fā)動(dòng)機(jī)RPM,窗戶位置,HVAC風(fēng)扇設(shè)置,車(chē)輛速度,音頻重放水平,以及其他參數(shù))的聲音相關(guān)的車(chē)輛信息160和/或其他信息的分類(lèi),歸類(lèi),標(biāo)簽,標(biāo)記,或信息。基于接收自CAN總線50的信號(hào)(例如,聲音相關(guān)的車(chē)輛信息160),噪音或聲音類(lèi)型參數(shù)306例如可以確定,產(chǎn)生,或分配。接收自CAN總線50的信號(hào)例如可以表示或包括聲音相關(guān)的車(chē)輛信息160,其可以表示車(chē)輛參數(shù)(例如,車(chē)輛窗戶位置,發(fā)動(dòng)機(jī)RPM,車(chē)輛速度,HVAC風(fēng)扇設(shè)置,音頻重放水平,以及其他參數(shù))和/或其他信息。噪音類(lèi)型參數(shù)306例如可以表示車(chē)輛參數(shù),預(yù)先限定的車(chē)輛參數(shù)的組合,或接收自CAN總線50的其他信息。例如,如果信號(hào)接收自CAN總線50顯示發(fā)動(dòng)機(jī)RPM高于閾值RPM值,發(fā)動(dòng)機(jī)的噪音類(lèi)型參數(shù)306 (例如,噪音_類(lèi)型=發(fā)動(dòng)機(jī))可以產(chǎn)生或分配。例如,經(jīng)由CAN總線50接收的顯示HVAC系統(tǒng)在某設(shè)置的信號(hào)可以導(dǎo)致風(fēng)扇的噪音或聲音類(lèi)型參數(shù)306的產(chǎn)生或分配(例如,噪音_類(lèi)型=風(fēng)扇)。例如,顯示窗戶打開(kāi)的聲音相關(guān)的車(chē)輛信息160可以導(dǎo)致窗戶的噪音類(lèi)型參數(shù)306的分配(例如,噪音_類(lèi)型=窗戶)。可以使用其他的噪音類(lèi)型參數(shù)306確定,分配,以及分類(lèi)。噪音水平參數(shù)304例如可以源自于車(chē)輛參數(shù)(例如,包括風(fēng)扇刻度或輸入設(shè)置,HVAC系統(tǒng)設(shè)置,發(fā)動(dòng)機(jī)RPM,車(chē)輛速度,音頻重放水平,和/或其他的車(chē)輛參數(shù))。噪音水平參數(shù)304例如可以是聲音水平(例如,聲音分貝水平(dB))的表示或聲音水平或特征的其他測(cè)量。噪音水平參數(shù)304例如可以是低,中,高或其他參數(shù)并且可以表示或定量聲音強(qiáng)度的范圍。在一些實(shí)施例中,干擾曲線記錄180 (例如,噪音水平參數(shù)304以及噪音類(lèi)型參數(shù)306)可以使用邏輯(例如,使用度量或閾值),數(shù)學(xué)方法,表格(例如查找表),或其他操作確定,產(chǎn)生,或計(jì)算。例如,如果聲音相關(guān)的車(chē)輛信息160顯示發(fā)動(dòng)機(jī)RPM高于預(yù)定閾值,可以確定或產(chǎn)生發(fā)動(dòng)機(jī)的噪音類(lèi)型參數(shù)306 (例如,噪音_類(lèi)型=發(fā)動(dòng)機(jī))以及高的噪音水平參數(shù)304 (例如,噪音_類(lèi)型=高)。例如,如果來(lái)自數(shù)據(jù)總線的車(chē)輛參數(shù)顯示HVAC風(fēng)扇在高設(shè)置,可以分配等于風(fēng)扇的噪音類(lèi)型參數(shù)306 (例如,噪音_類(lèi)型=風(fēng)扇),高的噪音水平參數(shù)304(噪音_水平=高),和/或其他的參數(shù)??梢允褂闷渌牟僮鳌5湫偷?,噪音類(lèi)型參數(shù)是從清單,例如,發(fā)動(dòng)機(jī),窗戶打開(kāi),風(fēng)扇,風(fēng),音頻,音頻等中選出來(lái)的離散參數(shù)。然而,可以使用其他的噪音類(lèi)型參數(shù)。噪音類(lèi)型參數(shù)和噪音水平參數(shù)典型地不包括關(guān)于產(chǎn)生的實(shí)際噪音的錄音或其他的直接信息。在一些實(shí)施例中,多種類(lèi)型的聲音相關(guān)的車(chē)輛信息160的組合(例如,車(chē)輛參數(shù),測(cè)量的聲音,以及其他聲音或信息)在一些實(shí)施例中可以以邏輯操作和/或其他的數(shù)學(xué)操作使用以確定或計(jì)算干擾曲線記錄180 (例如,噪音水平參數(shù)304和噪音類(lèi)型參數(shù)306)。例如,如果來(lái)自數(shù)據(jù)總線的聲音相關(guān)的車(chē)輛信息160顯示車(chē)輛速度大于閾值速度(例如,70英里/小時(shí)(mph)或其他速度)以及窗戶位置超過(guò)閾值(例如,超過(guò)25%打開(kāi)或其他閾值),可以確定,分配,或產(chǎn)生高的噪音水平參數(shù)304 (例如,噪音_水平=高)和等于風(fēng)的噪音類(lèi)型參數(shù)306 (例如,噪音_類(lèi)型=風(fēng))??梢允褂闷渌拈撝岛蛥?shù)。在一些實(shí)施例中,干擾曲線記錄180可以使用量化或其他操作確定,產(chǎn)生,或計(jì)算。聲音相關(guān)的車(chē)輛信息160,車(chē)輛參數(shù),測(cè)量的聲音,或其他信息例如可以量化以確定噪音水平參數(shù)304值和噪音類(lèi)型參數(shù)306值。例如,發(fā)動(dòng)機(jī)RPM值可以量化為8位或其他大小的整數(shù)噪音水平參數(shù)304值。噪音水平參數(shù)304 (例如,8位整數(shù)表示發(fā)動(dòng)機(jī)噪聲)例如可以包括與發(fā)動(dòng)機(jī)特征相關(guān)的信息(例如,發(fā)動(dòng)機(jī)基本的頻率和諧波)。音頻重放水平,例如可以量化為8位或其他大小的整數(shù)。每個(gè)8位整數(shù)例如可以表示干擾曲線記錄180(例如,噪音水平參數(shù)304)??梢允褂闷渌牧炕襟E。根據(jù)一些實(shí)施例,修改模塊或處理224可以基于干擾曲線記錄180修改音頻信號(hào)200,濾波器信號(hào),以及改進(jìn)語(yǔ)音對(duì)話系統(tǒng)100功能。在一些實(shí)施例中,修改模塊或處理224可以修改音頻信號(hào)200,濾波器噪音,音頻信號(hào)200的修改特征,和/或以其他方式獨(dú)立于語(yǔ)音識(shí)別裝置300 (例如,在語(yǔ)音識(shí)別204之前),依賴(lài)于語(yǔ)音識(shí)別302 (例如,在語(yǔ)音識(shí)別204期間,使用例如ASR前端314),或在其他步驟或處理期間,改變聲音信號(hào)200。在一些實(shí)施例中,音頻信號(hào)200 (例如,來(lái)自麥克風(fēng)20的輸出)可以獨(dú)立于語(yǔ)音識(shí)別模塊204或在語(yǔ)音識(shí)別模塊204中接收之前進(jìn)行修改,濾波或改變。例如,系統(tǒng)100可以包括多個(gè)濾波器312 (例如,Weiner濾波器,梳狀濾波器,模擬,數(shù)字,被動(dòng),主動(dòng),離散時(shí)間,連續(xù)時(shí)間,以及其他類(lèi)型的濾波器)并且每個(gè)濾波器312可以包括濾波器參數(shù)320。濾波器312例如可以存儲(chǔ)在存儲(chǔ)器120,數(shù)據(jù)庫(kù)150,長(zhǎng)期存儲(chǔ)器130,或類(lèi)似的存儲(chǔ)裝置中。每個(gè)濾波器312和濾波器參數(shù)320例如,可以最佳地用于濾波某些噪音水平參數(shù)304和噪音類(lèi)型參數(shù)306。音頻信號(hào)200例如可以在信號(hào)處理202期間修改和/或改變。音頻信號(hào)200可以基于干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304)在信號(hào)處理202期間修改?;谠胍纛?lèi)型參數(shù)306,修改模塊310例如可以確定濾波器312 (例如,Weiner濾波器,梳狀濾波器,低通濾波器,高通濾波器,帶通濾波器,或其他類(lèi)型的濾波器)或其他模塊或裝置以濾波,限制,或減少干擾噪音。濾波器參數(shù)322 (例如,頻率,振幅,諧波,調(diào)音,或其他參數(shù))例如可以基于噪音水平參數(shù)304確定。濾波器312可以應(yīng)用到信號(hào)處理器202或在其他模塊或步驟中的輸入信號(hào),音頻信號(hào)200,或其他類(lèi)型的信號(hào)中。根據(jù)一些實(shí)施例,如果IPR 180顯示風(fēng)噪音(例如,噪音_類(lèi)型=風(fēng))可能存在,可以通過(guò)信號(hào)處理器202應(yīng)用濾波器312 (例如,Weiner濾波器)以濾波或減少音頻信號(hào)200中的風(fēng)噪音。在一些實(shí)施例中,Weiner濾波器參數(shù)320可以基于噪音水平參數(shù)304 (例如,噪音_水平=高,中,低,或關(guān)閉),噪音類(lèi)型參數(shù)306,以及其他參數(shù)而確定。例如,修改模塊224可以包括預(yù)定的Weiner濾波器參數(shù)320以基于給定的噪音水平參數(shù)304在信號(hào)處理202期間應(yīng)用。濾波器312 (例如,Weiner濾波器)應(yīng)用后,信號(hào)中減少或限制了風(fēng)噪音的音頻信號(hào)200例如可以輸出到自動(dòng)語(yǔ)音識(shí)別(ASR)模塊204。根據(jù)一些實(shí)施例,如果IPR 180顯示可能存在發(fā)動(dòng)機(jī)噪音(噪音_類(lèi)型=發(fā)動(dòng)機(jī)),在信號(hào)處理202期間可以應(yīng)用時(shí)間改變的梳狀濾波器312以濾出發(fā)動(dòng)機(jī)噪聲。隨時(shí)間變化的梳狀濾波器312參數(shù)例如可以基于噪音水平參數(shù)304 (例如,表示發(fā)動(dòng)機(jī)噪音的8位整數(shù))而確定。噪音水平參數(shù)304 (例如,8位整數(shù)表示發(fā)動(dòng)機(jī)噪聲)例如可以包括與發(fā)動(dòng)機(jī)特征相關(guān)的信息(例如,發(fā)動(dòng)機(jī)基本的頻率和諧波)?;谠胍羲絽?shù)304,隨時(shí)間變化的梳狀濾波器312參數(shù)例如可以確定。隨時(shí)間變化的梳狀濾波器參數(shù)322例如可以確定從而梳狀濾波器與音頻信號(hào)200的發(fā)動(dòng)機(jī)噪聲部分中的基本的頻率和諧波對(duì)齊。具有與音頻信號(hào)200的發(fā)動(dòng)機(jī)噪音部分中的基本的頻率和諧波對(duì)齊的參數(shù)322的隨時(shí)間變化的梳狀濾波器參數(shù)322可以在聲音信號(hào)200轉(zhuǎn)換(例如,信號(hào)傅里葉變換)中衰減或減少發(fā)動(dòng)機(jī)基本的頻率和諧波的強(qiáng)度。具有衰減或減少的基本的發(fā)動(dòng)機(jī)頻率和振幅的信號(hào)200例如可以輸出到自動(dòng)語(yǔ)音識(shí)別解碼器316中。自動(dòng)語(yǔ)音識(shí)別解碼器316可以解釋音頻信號(hào)200中的言語(yǔ),命令,或其他息。根據(jù)一些實(shí)施例,可以測(cè)量在增加的語(yǔ)音識(shí)別功能中基于噪音類(lèi)型參數(shù)和噪音水平參數(shù)的語(yǔ)音識(shí)別修改的成功。基于該測(cè)量,可以適用成功的語(yǔ)音識(shí)別修改(例如,在學(xué)習(xí)或監(jiān)督的學(xué)習(xí)操作期間)。根據(jù)一些實(shí)施例,使用給定干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304)的濾波器參數(shù)322 (例如,Weiner濾波器,梳狀濾波器等)可以在制造期間,在適用處理320期間(例如,學(xué)習(xí)或監(jiān)督的學(xué)習(xí)操作),或其他時(shí)間中限定。濾波器參數(shù)322例如,可以確定從而濾波器312在除去來(lái)自音頻信號(hào)200的噪音時(shí)最有效。在適用處理320期間,與信號(hào)200相關(guān)的信號(hào)200和IPR 180可以在系統(tǒng)100接收(例如,在適用模塊320處)。例如,信號(hào)200可以包括言語(yǔ),噪音,以及可能的其他聲音。與信號(hào)200相關(guān)的干擾曲線記錄180例如可以在同時(shí)或大致同時(shí)接收信號(hào)200時(shí)并行地從數(shù)據(jù)總線50輸出。適用模塊320例如可以通過(guò)將信號(hào)200與(例如,用預(yù)定濾波器參數(shù)320操作的)來(lái)自濾波器312的信號(hào)輸出進(jìn)行比較或使用其他方法測(cè)量在從信號(hào)200除去噪音時(shí)濾波器參數(shù)322如何有效(例如,基于IPR 180得出或確定)。在改進(jìn)語(yǔ)音識(shí)別中成功或?yàn)V波器參數(shù)322可以使用其他的方法和/或度量進(jìn)行測(cè)量。適用模塊320可以基于測(cè)量變化或適用濾波器參數(shù)322以更有效地從與給定IPR 180相關(guān)的信號(hào)200中除去噪音(例如,給定噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304)。適用步驟320例如可以是當(dāng)車(chē)輛由駕駛員駕駛時(shí)或在其他時(shí)間并且濾波器參數(shù)322可以基于監(jiān)督的學(xué)習(xí)或其他的方法適用時(shí)而執(zhí)行。例如,在適用處理320期間,車(chē)輛可以在窗戶打開(kāi)時(shí)以超過(guò)預(yù)定閾值速度駕駛并且高的噪音水平參數(shù)304和風(fēng)的噪音類(lèi)型參數(shù)306 (例如,噪音_類(lèi)型=風(fēng))可以產(chǎn)生。在適用操作320期間,包括言語(yǔ)以及其他噪音(例如,車(chē)輛相關(guān)的噪音)的信號(hào)200可以在系統(tǒng)100處接收(例如,來(lái)自麥克風(fēng)20)。適用模塊320例如可以測(cè)量在從信號(hào)200中除去噪音時(shí)濾波器參數(shù)322如何有效(例如,基于噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304)。在一些實(shí)施例中,通過(guò)將信號(hào)200與來(lái)自濾波器312的信號(hào)輸出進(jìn)行比較(例如,用預(yù)先確定的濾波器參數(shù)320操作)或使用其他的方法,可以測(cè)量在從信號(hào)200中除去噪音時(shí)濾波器參數(shù)322如何有效。與噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304相關(guān)的濾波器參數(shù)322例如可以適用或改變?yōu)楦行У臑V波器或從信號(hào)200中除去噪音。在一些實(shí)施例中,如果在從信號(hào)中除去噪音時(shí)測(cè)量的濾波器參數(shù)322是有效的或成功的,與噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304相關(guān)的濾波器參數(shù)322可以不改變或適用。濾波器參數(shù)322的成功或有效例如可以通過(guò)估計(jì)給定濾波器參數(shù)322的語(yǔ)音識(shí)別204的性能或功能而確定??梢允褂闷渌姆椒ê投攘?。根據(jù)一些實(shí)施例,修改模塊310可以修改語(yǔ)音識(shí)別模塊204中的模塊和/或裝置內(nèi)的音頻信號(hào)200。音頻信號(hào)200,例如可以從麥克風(fēng)20或類(lèi)似裝置接收并且可以包括來(lái)自車(chē)輛乘員(例如,乘客,駕駛員等)的言語(yǔ)以及其他聲音(例如,背景噪音,車(chē)輛相關(guān)的聲音,以及其他聲音)。語(yǔ)音識(shí)別模塊204例如可以包括自動(dòng)語(yǔ)音識(shí)別(ASR)前端314?;贗PR180,信號(hào)可以在ASR前端314修改以濾波出噪音(例如,風(fēng)噪音,發(fā)動(dòng)機(jī)噪音或其他類(lèi)型的噪音)或以其他方式修改音頻信號(hào)200。濾波器312 (例如,Weiner濾波器)例如可以用于ASR前端314中的信號(hào)200以從音頻信號(hào)200中濾波出風(fēng)噪音。該類(lèi)型的濾波器312和濾波器參數(shù)322可以基于噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304確定。例如,車(chē)輛10可以在窗戶打開(kāi)時(shí)以超過(guò)閾值速度的速度移動(dòng)并且可以產(chǎn)生風(fēng)的噪音類(lèi)型參數(shù)306和高的噪音水平參數(shù)304。基于風(fēng)的噪音類(lèi)型參數(shù)306和高的噪音水平參數(shù)304,具有預(yù)定濾波器參數(shù)322的濾波器312 (例如,Weiner濾波器)可以應(yīng)用到ASR前端314中的信號(hào)200中。根據(jù)一些實(shí)施例,自動(dòng)語(yǔ)音識(shí)別模塊204可以包括聲學(xué)模型318。在聲音分析以解碼言語(yǔ)期間可以選擇在多個(gè)聲學(xué)模型318中的具體的以前產(chǎn)生的聲學(xué)模型,模型的選擇例如取決于干擾曲線記錄180 (例如,噪音水平參數(shù)304和/或噪音類(lèi)型參數(shù)306)。聲學(xué)模型318可以是或可以包括表示音素,聲音,字,句或言語(yǔ)的其他元素以及它們相關(guān)的或典型的波形之間關(guān)系的統(tǒng)計(jì)模型(例如,Hidden Markov Model (HMM)統(tǒng)計(jì)模型或其他統(tǒng)計(jì)模型)。根據(jù)一些實(shí)施例,IPR 180 (例如,噪音水平參數(shù)304,噪音類(lèi)型參數(shù)306,或其他參數(shù))可以用來(lái)確定,選擇或挑選在語(yǔ)音識(shí)別操作中使用哪個(gè)聲學(xué)模型318。例如,IPR 180(例如,高的噪音水平參數(shù)304和窗戶的噪音類(lèi)型參數(shù)306)可以顯示信號(hào)中高的窗戶噪音。修改模塊310可以基于顯不高的窗戶噪音的IPR 180,在一些聲學(xué)模型318中選擇或確定最適于解碼具有高的窗戶噪音的信號(hào)中的言語(yǔ)的聲學(xué)模型318。在適用操作320,制造,試驗(yàn),或其他時(shí)間期間,可以從言語(yǔ)采樣中適用,訓(xùn)練或產(chǎn)生聲學(xué)模型318?;谠胍羲絽?shù)304和噪音類(lèi)型參數(shù)306在適用操作320期間(例如,監(jiān)督的學(xué)習(xí)操作)例如可以適用聲學(xué)模型318。適用模塊320例如可以測(cè)量聲學(xué)模型322(例如,基于IPR 180確定的)在從信號(hào)200中解碼言語(yǔ)時(shí)如何有效??梢詼y(cè)量在改進(jìn)語(yǔ)音識(shí)別時(shí)聲學(xué)模型322 (例如,包括預(yù)定聲學(xué)模型變換矩陣)的成功以及基于測(cè)量可以適用聲學(xué)模型322。例如可以使用最大似然線性回歸或其他的數(shù)學(xué)方法適用聲學(xué)模型322以適用或者訓(xùn)練結(jié)合預(yù)定噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304使用的聲學(xué)模型變換矩陣。例如,在適用或訓(xùn)練操作期間,車(chē)輛10可以在窗戶打開(kāi)的情況下以超過(guò)閾值速度駕駛。高的噪音水平參數(shù)304和風(fēng)的噪音類(lèi)型參數(shù)306 (例如噪音_類(lèi)型=風(fēng))可以產(chǎn)生并且輸出至適用模塊320。言語(yǔ)以及其他噪音可以記錄(例如,由麥克風(fēng)20)并且包括言語(yǔ)的信號(hào)200可以輸出到適用模塊320。可以測(cè)量基于風(fēng)的噪音類(lèi)型參數(shù)306 (例如,噪音_類(lèi)型=風(fēng))和高的噪音水平參數(shù)304 (例如,噪音_水平=高)的解碼言語(yǔ)中的聲學(xué)模型318的成功。基于測(cè)量,使用最大似然線性回歸技術(shù)或其他的數(shù)學(xué)或統(tǒng)計(jì)方法可以產(chǎn)生或適用聲學(xué)模型變換矩陣。當(dāng)產(chǎn)生顯示高的風(fēng)噪音(例如,風(fēng)的噪音類(lèi)型參數(shù)306和高的噪音水平參數(shù)304)的干擾曲線記錄180時(shí),具有適用的聲學(xué)模型變換矩陣的聲學(xué)模型318例如可以在隨后的系統(tǒng)100操作中使用。當(dāng)車(chē)輛10由駕駛員駕駛的同時(shí)例如可以執(zhí)行適用320 (例如,包括監(jiān)督的學(xué)習(xí)),并且聲學(xué)模型318可以基于監(jiān)督的學(xué)習(xí)改變或修改。最適合于在具有高的窗戶噪音的信號(hào)中解碼言語(yǔ)的聲學(xué)模型318例如可以在具有高的風(fēng)噪音的監(jiān)督的學(xué)習(xí)操作期間已經(jīng)訓(xùn)練或限定。圖5是根據(jù)本發(fā)明的實(shí)施例的增強(qiáng)語(yǔ)音對(duì)話音頻提示的方框圖。根據(jù)一些實(shí)施例,干擾曲線記錄180 (例如,包括噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304)可以用來(lái)修改音頻信號(hào)400 (例如,從系統(tǒng)100輸出)。干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304)可以由文本至言語(yǔ)218,音頻處理220,或其他模塊或方法使用以提高言語(yǔ)提示,聲音輸出,或從系統(tǒng)100的廣播輸出。
根據(jù)一些實(shí)施例,修改模塊224可以基于干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,以及其他參數(shù))修改與音頻處理220相關(guān)的參數(shù)(例如,提示水平,提示頻譜,提示程度,聲音型譜,音頻水平,或其他參數(shù))。修改模塊224例如可以增加提示水平(例如,音量),改變提示頻譜,成形和/或重新成形提示頻譜(例如,增加信號(hào)噪音比),增強(qiáng)音頻重放(例如,立體重放),和/或以其他方式增強(qiáng)或改變從系統(tǒng)100的聲音輸出(例如,經(jīng)由揚(yáng)聲器40)。例如,如果噪音水平參數(shù)304顯示信號(hào)400中的噪音超過(guò)閾值水平(例如,dB水平),可以增加提示水平(例如,來(lái)自揚(yáng)聲器40的輸出)音頻水平407。在一些實(shí)施例中,提示頻譜402例如可以修改,成形,或重新成形。提示可以是來(lái)自系統(tǒng)100的音頻或聲音輸出,例如,包括對(duì)車(chē)輛乘員的言語(yǔ)并且提示頻譜402例如可以是音頻頻譜,包括一定范圍的頻率,強(qiáng)度,聲音壓力,聲音能量,和/或其他聲音相關(guān)的參數(shù)。提示頻譜402例如可以修改,成形,或重新成形以增加車(chē)輛10中的信號(hào)噪音比(例如,在車(chē)輛內(nèi)部中或在車(chē)輛乘員的附近)。提示頻譜402例如可以修改以增強(qiáng)或放大對(duì)應(yīng)于來(lái)自車(chē)輛相關(guān)的聲音中高噪音能量(例如,發(fā)動(dòng)機(jī)噪音,風(fēng)噪音,風(fēng)扇噪音,以及其他聲音)的頻譜部分中的提示頻譜402 (例如,頻率頻譜,能量頻譜,或其他類(lèi)型的聲音相關(guān)的頻譜)。提示頻譜402例如可以放大具有高的噪音能量的頻譜的一部分以增加信號(hào)噪音比,其可以表示提示聲音水平(例如,從系統(tǒng)100的提示輸出)與車(chē)輛內(nèi)部中的噪音水平(例如,發(fā)動(dòng)機(jī)噪音,風(fēng)噪音,HVAC風(fēng)扇噪音,以及其他噪音)的比率。提示頻譜402例如可以使用音頻處理器模塊220,文本至言語(yǔ)模塊218,或其他系統(tǒng)或模塊進(jìn)行修改。在一個(gè)實(shí)施例中,噪音類(lèi)型參數(shù)306可以顯示發(fā)動(dòng)機(jī)噪音(例如,噪音_類(lèi)型參數(shù)=發(fā)動(dòng)機(jī))以及噪音水平參數(shù)304可以表示發(fā)動(dòng)機(jī)噪音的水平。噪音水平參數(shù)304例如可以是發(fā)動(dòng)機(jī)RPM的量化表現(xiàn)(例如,8位整數(shù)或表示發(fā)動(dòng)機(jī)RPM的其他整數(shù))?;谠胍羲絽?shù)304 (例如,發(fā)動(dòng)機(jī)RPM的量化表示),修改模塊224可以放大或加強(qiáng)提示頻譜402的預(yù)定部分。例如,噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304可以對(duì)應(yīng)于聲音頻譜的低頻率部分(例如,低于1000赫茲(Hz)或其他頻率)中的高噪音能量和頻譜的高頻率部分(例如,高于1000赫茲(Hz)或其他頻率)中的低噪聲能量。提示頻率頻譜402的低頻率部分(例如,低于1000赫茲或其他頻率)可以放大或加強(qiáng)以增加低頻率的提示與發(fā)動(dòng)機(jī)噪音的比率。在一些實(shí)施例中,音頻頻譜404 (例如,來(lái)自立體聲,收音機(jī)或其他裝置)例如可以修改或重新成形。音頻頻譜404例如可以修改或重新成形以增加車(chē)輛中的音頻信號(hào)與噪音的比率。音頻頻譜404例如可以使用音頻處理模塊220和/或其他裝置或模塊進(jìn)行修改。音頻信號(hào)404例如可以修改以加強(qiáng)或放大對(duì)應(yīng)于來(lái)自車(chē)輛相關(guān)的聲音中高噪音能量(例如,發(fā)動(dòng)機(jī)噪音,風(fēng)噪音,風(fēng)扇噪音,以及其他聲音)的音頻頻譜404的部分中的音頻頻譜404(例如,音頻頻率頻譜,音頻能量頻譜,或其他類(lèi)型的聲音相關(guān)的頻譜)。音頻頻譜404例如可以放大具有高噪音能量的頻譜的一部分以增加信號(hào)噪音比,其可以表示車(chē)輛內(nèi)部中的音頻(例如,來(lái)自揚(yáng)聲器40的音頻輸出)與噪音的比率。根據(jù)一些實(shí)施例,音頻提示或音頻程度406可以基于干擾曲線記錄180修改或改變。提示或音頻程度406例如可以基于噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304修改以增加提示或音頻(例如,來(lái)自揚(yáng)聲器40的輸出)的清晰度和/或可理解性。例如,噪音類(lèi)型參數(shù)306可以顯示車(chē)輛10中風(fēng)噪音的存在并且噪音水平參數(shù)304可以表示風(fēng)噪音的水平(例如,風(fēng)噪音的音量)。基于噪音水平參數(shù)304 (例如,低,中,高,或其他參數(shù)),可以改變(例如,使得更高或更低)提示或音頻程度406 (例如,與頻率相關(guān))。提示或音頻程度406的改變例如可以取決于噪音水平參數(shù)306的比率或以其他方式與噪音水平參數(shù)306相關(guān)的。例如,在比柔軟的車(chē)輛噪音更大的車(chē)輛噪音存在時(shí),提示或音頻程度406可以進(jìn)一步改變(例如,與如果噪音水平參數(shù)304中或低相比,如果噪音水平參數(shù)304高,可以更高的改變)。在一些實(shí)施例中,基于噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304,提示或音頻程度306可以更低地減少或改變。根據(jù)一些實(shí)施例,修改模塊224通過(guò)增加或減少言語(yǔ)速率410,增加或減少音節(jié)持續(xù)時(shí)間412,和/或以其他方式修改從系統(tǒng)100的言語(yǔ)輸出(例如,經(jīng)由揚(yáng)聲器40)例如可以修改文本至言語(yǔ)218輸出。言語(yǔ)速率410例如可以基于噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,和/或其他信息修改。言語(yǔ)速率410例如可以修改以減少高噪音條件中提示的言語(yǔ)速率410 (例如,如果噪音水平參數(shù)306更高或其他值)。降低言語(yǔ)速率410例如可以增加在大聲或高噪音環(huán)境(例如,在具有大聲的車(chē)輛相關(guān)的聲音的車(chē)輛中)中語(yǔ)音對(duì)話的可理解性。在一些實(shí)施例中,言語(yǔ)速率410可以基于噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304增加以增加來(lái)自系統(tǒng)100的語(yǔ)音對(duì)語(yǔ)話頻提示的可理解性。根據(jù)一些實(shí)施例,提示音節(jié)持續(xù)時(shí)間412例如可以基于噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,和/或其他信息修改。提示音節(jié)持續(xù)時(shí)間412例如可以包括輔音,元音,和/或與人言語(yǔ)相關(guān)的其他音節(jié)的發(fā)音的持續(xù)時(shí)間。音節(jié)持續(xù)時(shí)間412例如可以取決于或相對(duì)于噪音水平參數(shù)304按比例增加。例如,音節(jié)持續(xù)時(shí)間412相對(duì)于由噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304表不的車(chē)輛相關(guān)的聲音(例如,發(fā)動(dòng)機(jī)噪音,HVAC系統(tǒng)噪音,風(fēng)噪音以及其他聲音)增加而增加(例如,音節(jié)發(fā)音的持續(xù)時(shí)間可以更長(zhǎng))。在一些實(shí)施例中,可以修改文本至言語(yǔ)218,音頻處理220,和/或其他類(lèi)型的言語(yǔ)提示或聲頻輸出。修改模塊224例如可以使用Lombard類(lèi)型或其他的言語(yǔ)修改。Lombard類(lèi)型修改可以模擬人言語(yǔ)修改或在高聲環(huán)境,具有高背景噪音的環(huán)境,或其他高噪音水平環(huán)境中補(bǔ)償。Lombard類(lèi)型修改例如可以包括從包括修改提示信號(hào)頻譜402,修改提示信號(hào)程度406,修改提示信號(hào)言語(yǔ)速率410,和修改提示信號(hào)音節(jié)持續(xù)時(shí)間412的組中選擇出的信號(hào)400修改的任何組合。Lombard類(lèi)型修改例如可以取決于噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,以及其他信息。例如,顯示高的風(fēng)噪音可能存在時(shí),風(fēng)的噪音類(lèi)型參數(shù)306(例如,噪音_類(lèi)型=風(fēng))和高的噪音水平參數(shù)304可以產(chǎn)生?;谠胍纛?lèi)型參數(shù)306和噪音水平參數(shù)304,可以修改提示頻譜402,提示程度406,提示言語(yǔ)速率410,提示音節(jié)持續(xù)時(shí)間412,和/或其他提示參數(shù)的預(yù)定組合以增加提示的可理解性。在制造,試驗(yàn),適用320,或其他處理期間例如可以確定噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304的應(yīng)用預(yù)定組合的給定組合。預(yù)定組合例如可以是最佳地增加言語(yǔ)提示的可理解性,可懂性或清晰度的組合。根據(jù)一些實(shí)施例,可以適用320提示修改以改進(jìn)提示的清晰度和/或可理解性。與預(yù)定噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,以及其他參數(shù)相關(guān)的提示修改224的有效性或影響進(jìn)行測(cè)量和適用或可以基于測(cè)量進(jìn)行改變。提示修改的有效性例如可以通過(guò)監(jiān)控使用者或乘員對(duì)修改提示的響應(yīng)進(jìn)行測(cè)量。例如,提示可以基于噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,和/或其他參數(shù)進(jìn)行修改并且乘員對(duì)提示的響應(yīng)可以測(cè)量。例如,提示可以引起或請(qǐng)求來(lái)自乘員的響應(yīng)。如果乘員對(duì)提示不作出響應(yīng),以不可預(yù)知的方式對(duì)提示作出響應(yīng)(例如,提供了混淆的響應(yīng)),或執(zhí)行其他動(dòng)作,可以確定可以適用提示修改224以改進(jìn)提示的清晰度。在一個(gè)示例中,提示修改224例如可以通過(guò)使得提示修改224停用而適用。例如,如果確定提示修改224不改進(jìn)言語(yǔ)提示的清晰度或可理解性,可以停止或停用提示修改224(例如,提示修改模塊)。在一個(gè)示例中,提示修改224通過(guò)改變提示修改參數(shù)(例如,頻譜,程度,言語(yǔ)速率,音節(jié)持續(xù)時(shí)間,和/或其他提示修改參數(shù))可以修改。例如,提示頻譜402修改參數(shù)可以適用或改變以改進(jìn)言語(yǔ)提示的清晰度。提示頻譜402修改參數(shù)例如可以適合于加強(qiáng)或提高提示頻譜402的不同部分中的提示信號(hào)400??梢允褂闷渌倪m用方法。圖6是根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音對(duì)話控制系統(tǒng)的方框圖。根據(jù)一些實(shí)施例,對(duì)話控制210或與語(yǔ)音對(duì)話系統(tǒng)100的其他系統(tǒng)或處理可以基于噪音類(lèi)型參數(shù)304,噪音水平參數(shù)306,和/或其他參數(shù)進(jìn)行修改或改變224。對(duì)話控制動(dòng)作500可以基于干擾曲線記錄180(例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,和/或其他參數(shù))進(jìn)行修改224。對(duì)話控制作用500例如可以通過(guò)對(duì)話控制210模塊操作而執(zhí)行并且可以包括提示輸出到使用者,與輸入或輸出確定相關(guān)的動(dòng)作,或其他操作。對(duì)話控制作用500例如可以包括解釋動(dòng)作502,減少語(yǔ)義解釋器信任水平504,以及其他處理或操作。對(duì)話控制動(dòng)作500例如可以基于干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,和/或其他參數(shù))通過(guò)實(shí)施解釋動(dòng)作502進(jìn)行修改。如果噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示在車(chē)輛10附近(例如,在車(chē)艙)可能存在高噪音,解釋動(dòng)作502例如可以實(shí)施或利用。根據(jù)一些實(shí)施例,解釋動(dòng)作502可以包括使用者輸入的清楚的確認(rèn),音頻提示或詢問(wèn)使用者重復(fù)輸入,或以其他方式提示使用者解釋輸入。請(qǐng)求使用者輸入的清楚確認(rèn)的音頻提示508例如可以是輸出(例如,使用揚(yáng)聲器40)。例如,使用者可以詢問(wèn)(例如,輸入言語(yǔ)至語(yǔ)音對(duì)話系統(tǒng)請(qǐng)求信息)語(yǔ)音對(duì)話以尋找餐廳(例如,“最近的餐廳在哪里? ”)。如果噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示存在高水平或噪音(例如,車(chē)輛相關(guān)的噪音或聲音的高水平),語(yǔ)音對(duì)話模塊210例如可以輸出使用者語(yǔ)句的提示請(qǐng)求確認(rèn)。音頻提示508例如可以輸出,詢問(wèn)使用者證實(shí)使用者正在尋找餐廳(例如,“你是否在說(shuō)‘最近的餐廳在哪里? ’ ”)。如果噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示可能存在背景噪音,當(dāng)使用者輸入難以理解,或在其他時(shí)間時(shí),每次使用者提供輸入時(shí)提示508可以輸出請(qǐng)求使用者輸入的清楚的確認(rèn)??梢允褂闷渌慕忉寗?dòng)作或提示。根據(jù)一些實(shí)施例,解釋動(dòng)作502可以包括詢問(wèn)或請(qǐng)求使用者重復(fù)輸入。對(duì)話控制模塊210例如可以輸出提示,請(qǐng)求使用者重復(fù)它們的輸入。例如,如果使用者詢問(wèn)語(yǔ)音對(duì)話系統(tǒng)100去尋找最近的酒店(例如,“最近的酒店在哪里”)并且噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304顯示可能發(fā)生高噪音水平(例如,噪音_水平=高),提示可以輸出,請(qǐng)求使用者重復(fù)它們的輸入。提示508例如可以輸出,詢問(wèn)使用者重復(fù)他們的語(yǔ)句(例如,“請(qǐng)重復(fù)”,“我沒(méi)有聽(tīng)清楚,請(qǐng)重復(fù)”,或其他重復(fù)的請(qǐng)求)。如果噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示可能存在背景噪音,當(dāng)使用者輸入難以理解,或在其他時(shí)間時(shí),每次使用者提供輸入時(shí)提示508可以輸出請(qǐng)求使用者重復(fù)他們的輸入。可以使用其他的解釋動(dòng)作502。根據(jù)一些實(shí)施例,可以鼓勵(lì)解釋動(dòng)作502和/或通過(guò)改變語(yǔ)義解釋器信任水平504(例如,通過(guò)減少信任水平504或以其他方式改變信任水平504)可以增加解釋動(dòng)作502的可能性。信任水平504可以基于噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304進(jìn)行改變或修改。信任水平504例如可以表示來(lái)自使用者的字串,短語(yǔ),或其他言語(yǔ)輸入(例如,“為我找酒店”)與語(yǔ)音對(duì)話系統(tǒng)實(shí)體170中的對(duì)話動(dòng)作相匹配或相對(duì)應(yīng)(例如,通知(類(lèi)型=酒店))的可能性或確定性。信任水平504例如可以是表示字串與語(yǔ)音對(duì)話系統(tǒng)實(shí)體170中的對(duì)話動(dòng)作匹配的信任度,可能性,或概率的百分比,數(shù)值,或其他參數(shù)。信任水平504例如可以與由語(yǔ)義解釋器206產(chǎn)生的對(duì)話動(dòng)作相關(guān)聯(lián)。對(duì)話動(dòng)作和相關(guān)的信任水平504例如可以從語(yǔ)義解釋器206輸出到對(duì)話控制模塊210。對(duì)話控制模塊210例如可以基于對(duì)話動(dòng)作和相關(guān)的信任水平504產(chǎn)生輸出到使用者的響應(yīng)。例如,如果信任水平504低于閾值信任水平506,對(duì)話控制模塊504可以執(zhí)行解釋動(dòng)作502 (例如,請(qǐng)求使用者輸入的清楚的確認(rèn),請(qǐng)求使用者重復(fù)輸入,以及其他解釋動(dòng)作)。如果與對(duì)話動(dòng)作相關(guān)的信任水平504高于閾值信任水平506,對(duì)話動(dòng)作可以視為使用者的輸入的正確解釋(例如,使用者的語(yǔ)音對(duì)話轉(zhuǎn)換為字串)并且對(duì)話控制模塊210例如可以產(chǎn)生響應(yīng),執(zhí)行動(dòng)作,或以其他方式響應(yīng)于對(duì)話動(dòng)作。根據(jù)一些實(shí)施例,從語(yǔ)義解釋器206輸出的信任水平504例如可以基于噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,和/或其他信息進(jìn)行修改或減少。例如,如果噪音水平參數(shù)304顯示可能存在車(chē)輛相關(guān)的噪音超過(guò)預(yù)定閾值(例如,噪音_水平=中,噪音_水平=高,或其他噪音_水平值),可以減少來(lái)自語(yǔ)義解釋器的信任水平504輸入。在一些實(shí)施例中,如果噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304顯示對(duì)高的噪音水平的緩和在車(chē)輛10中可能發(fā)生(例如,車(chē)輛客艙中),信任水平504例如可以從百分之九十(例如,90%)減少至例如百分之八十(例如,80%)或其他值??梢允褂闷渌男湃嗡?04。信任水平504中的減少例如可以是非線性的。無(wú)論噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304顯示背景噪音是否可能存在,超過(guò)預(yù)定邊界信任水平的信任水平504例如可以不減少或改變。例如,當(dāng)?shù)陀谶吔玳撝?例如,百分之九十五或其他值)的信任水平504可能減少的同時(shí),超過(guò)邊界閾值(例如,百分之九十五或其他值)信任水平504 (例如,與對(duì)話動(dòng)作相關(guān)的)可以不改變或減少。可以使用其他的邊界閾值。根據(jù)一些實(shí)施例,可以適用320給定干擾曲線記錄(例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,以及其他信息)的對(duì)話控制動(dòng)作500的修改。例如,通過(guò)測(cè)量噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304與對(duì)話控制210成功或功能之間的相互關(guān)系,可以適用對(duì)話控制動(dòng)作500 (例如,執(zhí)行解釋動(dòng)作502,減少信任水平504,以及其他修改)的修改。在適用處理320中例如可以確定給定干擾曲線記錄180的對(duì)話控制210的最佳修改。用于給定干擾曲線記錄180的對(duì)話控制的最佳修改可以是對(duì)使用者最少麻煩的和/或最佳改進(jìn)系統(tǒng)100功能的修改。例如,噪音類(lèi)型參數(shù)306與噪音水平參數(shù)304可以顯示高的風(fēng)噪音可能存在并且語(yǔ)義解釋器信任水平504可以基于噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304修改224??梢詼y(cè)量具有修改的信任水平504的對(duì)話控制210功能(例如,對(duì)話控制210的成功或?qū)υ捒刂?10成功)。基于對(duì)話控制210是否輸出對(duì)使用者輸入的適當(dāng)?shù)捻憫?yīng),例如可以測(cè)量對(duì)話控制210功能或成功。例如,如果使用者輸入對(duì)最近加油站的位置的請(qǐng)求(例如,“最近的加油站在哪里? ”),對(duì)話控制210響應(yīng)列出的加油站將被認(rèn)為是對(duì)話成功而來(lái)自對(duì)話控制210的無(wú)關(guān)主題音頻提示508 (例如,“最近的餐廳是餐廳A和餐廳B”)輸出將不會(huì)認(rèn)為成功??梢允褂闷渌某晒y(cè)量方法。基于對(duì)話控制210功能或成功的測(cè)量,給定干擾曲線記錄180的對(duì)話控制動(dòng)作500可以適用以改進(jìn)對(duì)話控制210系統(tǒng)的功能。例如,當(dāng)噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示高的風(fēng)噪音可能存在時(shí),適用320可以確定解釋動(dòng)作502 (例如,使用者輸入的清楚的確認(rèn),要求使用者重復(fù)輸入)比減少語(yǔ)義解釋器信任水平504更有效。例如,當(dāng)噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示高的發(fā)動(dòng)機(jī)噪音可能存在時(shí),適用320可以確定減少信任水平504 (例如,通過(guò)預(yù)定信任水平減少參數(shù)或量)對(duì)使用者是最有效和最少麻煩的。例如,對(duì)話控制動(dòng)作500的修改224 (例如,實(shí)施解釋動(dòng)作502,減少信任水平504,以及其他修改)例如可以適于使用給定組的噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304的最有效和最少麻煩的對(duì)話控制動(dòng)作500。根據(jù)一些實(shí)施例,基于干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,以及其他信息)可以導(dǎo)入和/或修改音頻提示508。提示例如可以包括來(lái)自系統(tǒng)100的信息輸出并且可以響應(yīng)于使用者輸入通過(guò)對(duì)話控制模塊210產(chǎn)生。提示508可以響應(yīng)于使用者輸入從系統(tǒng)100典型地輸出以提供信息至使用者,或用于其他功能。在一些實(shí)施例中,提示508可以通知使用者由于高的背景噪音語(yǔ)音對(duì)話系統(tǒng)100功能和/或性能可能減少或改變。例如提示508可以基于噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304產(chǎn)生。提示508例如可以設(shè)置語(yǔ)音對(duì)話系統(tǒng)100性能的使用者的期望(例如,系統(tǒng)100性能可能減少),為使用者準(zhǔn)備不同的交互作用類(lèi)型(例如,通知使用者系統(tǒng)100可以請(qǐng)求使用者解釋語(yǔ)句,重復(fù)語(yǔ)句,并且執(zhí)行其他的功能),或以其他方式通知使用者在背景噪音存在時(shí)系統(tǒng)100性能可能改變。噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304例如可以顯示高的風(fēng)噪音。基于顯示高的風(fēng)噪音的噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304,通過(guò)對(duì)話控制模塊210可以產(chǎn)生提示508并且輸出至使用者(例如,使用揚(yáng)聲器40)。提示508例如可以設(shè)置具有高的風(fēng)噪音的系統(tǒng)100性能的使用者期望。例如,提示可以是“請(qǐng)注意在高速時(shí)窗戶打開(kāi)時(shí)聲音識(shí)別是困難的”或其他的提示508?;谔崾?08,使用者可以考慮關(guān)閉車(chē)輛窗戶以改進(jìn)系統(tǒng)100性能。在一些實(shí)施例中,提示508可以基于為使用者準(zhǔn)備的不同的語(yǔ)音對(duì)話交互作用類(lèi)型的噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304。提示508例如可以是“聲音識(shí)別很困難,我可以請(qǐng)求進(jìn)一步解釋?zhuān)?qǐng)?jiān)?,你想去哪里?”或其他提示?;谔崾?08,使用者的期望可以管理并且使用者例如可以準(zhǔn)備或預(yù)先警告系統(tǒng)100可能輸出進(jìn)一步解釋動(dòng)作502 (例如,請(qǐng)求解釋?zhuān)貜?fù),以及其他解釋)和/或系統(tǒng)100功能可能修改(例如,補(bǔ)償背景噪音的高水平)。根據(jù)一些實(shí)施例,基于干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,以及其他信息)可以修改或控制提示508的速度和/或定時(shí)。提示508輸出的定時(shí)例如可以修改或推遲以在當(dāng)?shù)捅尘霸胍?例如,車(chē)輛相關(guān)的聲音)可能存在于車(chē)輛10中時(shí)輸出提示508。例如,噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304可以顯示高的發(fā)動(dòng)機(jī)噪音可能存在于車(chē)輛中(例如,噪音_類(lèi)型=發(fā)動(dòng)機(jī)并且噪音_水平=高)。高的發(fā)動(dòng)機(jī)噪音的噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304例如可以顯示發(fā)動(dòng)機(jī)RPM可能高(例如,駕駛員可能加速車(chē)輛10)。基于顯示高的發(fā)動(dòng)機(jī)噪音的噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304,對(duì)話控制210可能延遲提示508輸出。對(duì)話控制210例如可以延遲提示508輸出,直到噪音水平參數(shù)304顯示發(fā)動(dòng)機(jī)噪音可能減少為止。在一些實(shí)施例中,對(duì)話控制210可能在預(yù)定一段時(shí)間延遲提示508輸出。例如可以是車(chē)輛加速的典型的或平均時(shí)間量的預(yù)定一段時(shí)間可以基于典型的駕駛員特性(例如,典型的加速時(shí)間),或可能是其他時(shí)間段。典型的或平均加速時(shí)間例如可以在車(chē)輛試驗(yàn),制造期間,或在語(yǔ)音對(duì)話適用處理320期間確定。根據(jù)一些實(shí)施例,對(duì)話類(lèi)型514可以修改以改變或減少語(yǔ)法困惑510或基于干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,和/或其他信息)。語(yǔ)法困惑510例如可以是在給定時(shí)間由語(yǔ)音識(shí)別模塊或裝置204使用的語(yǔ)音識(shí)別語(yǔ)法的復(fù)雜度。對(duì)話控制模塊210例如可以基于干擾曲線記錄180確定語(yǔ)法困惑。語(yǔ)法困惑510例如可以通過(guò)執(zhí)行單個(gè)口識(shí)別,強(qiáng)制使用精確的措辭,避免混合的創(chuàng)造,和/或使用其他的技術(shù)或方法進(jìn)行減少或修改。語(yǔ)法困惑510例如可以基于噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304減少或改變。例如,噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304可以顯示高的風(fēng)噪音(例如噪音_類(lèi)型=風(fēng),噪音_水平=高)可能存在?;陲@示高的風(fēng)噪音的噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304,對(duì)話控制210可以通過(guò)執(zhí)行單個(gè)口識(shí)別,強(qiáng)制使用精確的措辭,避免混合的創(chuàng)造,和/或執(zhí)行其他的動(dòng)作減少語(yǔ)法困惑510。單個(gè)口識(shí)別例如可以通過(guò)減少或修改復(fù)雜的提示而減少語(yǔ)法困惑510,該減少或修改復(fù)雜的提示請(qǐng)求多個(gè)口或類(lèi)型的信息為請(qǐng)求減少數(shù)目或單個(gè)口的信息的多個(gè)較簡(jiǎn)單的音頻提示。例如,“你喜歡聽(tīng)什么音樂(lè)”的復(fù)雜的提示可以修改或簡(jiǎn)化為多個(gè)單個(gè)口提示“請(qǐng)輸入音樂(lè)名稱(chēng)”,后面跟隨“請(qǐng)輸入藝術(shù)家”和/或其他的提示。當(dāng)然可以使用與其他主題相關(guān)的其他提不。在一些實(shí)施例中,通過(guò)強(qiáng)制使用來(lái)自使用者(例如,車(chē)輛乘員)的精確的措辭,可以修改對(duì)話類(lèi)型514以減少語(yǔ)法困惑510。來(lái)自使用者的精確的措辭可以通過(guò)提示使用者提供精確的響應(yīng)而不是一般的響應(yīng)而強(qiáng)制使用。例如,其可能引起來(lái)自使用者的許多不同的響應(yīng)的提示508 “你想要哪個(gè)服務(wù)”,可以修改為可以引出來(lái)自使用者的具體的或精確的措辭的“請(qǐng)說(shuō)出一個(gè):a.音樂(lè),b.方向,c.氣候控制”的提示。如果噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304顯示車(chē)輛中可能存在高的噪音水平(例如,風(fēng),發(fā)動(dòng)機(jī),HVAC系統(tǒng),音頻重放或其他噪音)對(duì)話控制模塊210可以強(qiáng)制使用來(lái)自使用者的精確的措辭。當(dāng)然可以使用與其他追相關(guān)的其他提示。在一些實(shí)施例中,對(duì)話類(lèi)型514可以通過(guò)減少混合的初始對(duì)話類(lèi)型514進(jìn)行修改以減少語(yǔ)法困惑510?;旌系某跏紝?duì)話類(lèi)型514例如可以允許使用者響應(yīng)他們沒(méi)有問(wèn)的問(wèn)題。如果噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304顯示可能存在超過(guò)閾值的噪音水平,混合的創(chuàng)造例如可以停止或停用以減少語(yǔ)法困惑510。例如,對(duì)話控制210可以輸出請(qǐng)求一種信息的提示(例如,“你想尋找什么類(lèi)型的酒店”),并且混合的創(chuàng)造可以允許使用者提供無(wú)關(guān)的主題響應(yīng)(例如,“最近的餐廳在哪里? ”)??梢允褂门c其他主題相關(guān)的其他提示508。停止混合的創(chuàng)造例如可以需要使用者響應(yīng)所問(wèn)的問(wèn)題,而不允許使用者改變?cè)掝}主題。如果使用者提供與問(wèn)題無(wú)關(guān)的主題響應(yīng),對(duì)話控制模塊210可以請(qǐng)求使用者響應(yīng)所問(wèn)的問(wèn)題。根據(jù)一些實(shí)施例,可以適用320給定干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,以及其他參數(shù)或信息)的對(duì)話類(lèi)型514的修改。對(duì)話類(lèi)型514修改224(例如,改變語(yǔ)法困惑510或其他的對(duì)話類(lèi)型修改)例如可以通過(guò)測(cè)量基于干擾曲線記錄180(例如,噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304)的對(duì)話類(lèi)型514的修改與對(duì)話控制210成功或功能之間的相互關(guān)系而適用??梢源_定用于給定干擾曲線記錄180的對(duì)話類(lèi)型514或語(yǔ)法困惑510減少方法的最佳修改(例如,單個(gè)口識(shí)別,強(qiáng)制使用精確措辭,避免混合的創(chuàng)造,或其他語(yǔ)法困惑減少方法)。用于給定干擾曲線記錄180的對(duì)話類(lèi)型514的最佳修改可以是對(duì)使用者最少麻煩,最改進(jìn)系統(tǒng)100功能,和/或引起對(duì)話成功的修改。對(duì)話類(lèi)型514的最佳修改例如可以通過(guò)測(cè)量在有和沒(méi)有對(duì)話類(lèi)型514或語(yǔ)法困惑510的修改的情況下對(duì)話控制210成功而確定??梢员容^與對(duì)話類(lèi)型514或語(yǔ)法困惑510的不同類(lèi)型的修改相關(guān)的測(cè)量的對(duì)話控制成功以確定最改進(jìn)對(duì)話控制成功的對(duì)話類(lèi)型514或語(yǔ)法困惑510的修改。例如,干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304)可以顯示高HVAC相關(guān)的噪音可能存在并且語(yǔ)法困惑510可能基于干擾曲線記錄180減少或修改224。語(yǔ)法困惑510例如可以通過(guò)修改對(duì)話類(lèi)型514以強(qiáng)制使用精確措辭而減少(例如,提示使用者從選項(xiàng)列表中選擇(例如,“請(qǐng)說(shuō)一個(gè):a.音樂(lè),b.方向,或c.油”代替“你想要那種服務(wù)? ”))??梢詼y(cè)量具有精確措辭的強(qiáng)制使用(例如,減少的語(yǔ)法困惑510)的對(duì)話控制210成功(例如,對(duì)話控制系統(tǒng)210的成功)。對(duì)話控制210功能或成功例如可以基于使用者是否正確地完成對(duì)話動(dòng)作(例如,響應(yīng)于提示),使用者是否獲得正確的對(duì)話結(jié)果(例如,使用者發(fā)現(xiàn)他們尋找的東西),或基于其他的度量或參數(shù)而測(cè)量。具有精確措辭的強(qiáng)制使用(例如,減少的語(yǔ)法困惑510)的對(duì)話控制210成功(例如,對(duì)話控制系統(tǒng)210的成功)可以與沒(méi)有精確措辭的對(duì)話控制210成功或具有對(duì)話類(lèi)型514或語(yǔ)法困惑510的其他類(lèi)型的修改的對(duì)話控制成功210進(jìn)行比較。例如,其確定基于某一干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304)的一種對(duì)話類(lèi)型514修改以減少語(yǔ)法困惑510 (例如,單個(gè)口識(shí)別)可以引起減少的對(duì)話控制成功或比另一種對(duì)話類(lèi)型514修改和/或沒(méi)有修改以減少語(yǔ)法困惑510的更少成功?;谠摯_定,給定某一干擾曲線記錄180的一種對(duì)話類(lèi)型514可能在增加對(duì)話成功中較少成功或不成功,該類(lèi)型的對(duì)話類(lèi)型514修改例如可以停止,適用,和/或由不同類(lèi)型的對(duì)話類(lèi)型514修改替代。例如,適用320可以確定當(dāng)噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示可能存在高的HVAC噪音或其他車(chē)輛相關(guān)的噪音時(shí)通過(guò)強(qiáng)制使用精確措辭減少語(yǔ)法困惑510可能比避免混合的創(chuàng)造更有效。例如,適用320可以確定當(dāng)噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示可能存在高的HVAC噪音時(shí)通過(guò)強(qiáng)制使用精確措辭減少語(yǔ)法困惑510可能對(duì)使用者最有效和最少麻煩。根據(jù)一些實(shí)施例,基于干擾曲線記錄180 (例如,噪音水平參數(shù)304,噪音類(lèi)型參數(shù)306,以及其他信息)對(duì)話控制210可以監(jiān)控(例如,收聽(tīng))并且響應(yīng)使用者混淆516。如果噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示在車(chē)輛10中或圍繞車(chē)輛10可能存在高的噪音水平,對(duì)話控制210例如可以修改以監(jiān)控或收聽(tīng)并且響應(yīng)使用者的混淆516。為了監(jiān)控并且響應(yīng)使用者混淆516,對(duì)話控制210例如可以修改以識(shí)別來(lái)自使用者的解釋請(qǐng)求輸入。解釋請(qǐng)求(例如,由使用者說(shuō)出)例如可以包括措辭,諸如“重復(fù)”,“我聽(tīng)不見(jiàn)你”,“重復(fù)該提示”,“不清楚”,“什么? ”,或其他措辭。來(lái)自使用者的解釋請(qǐng)求例如可以由對(duì)話控制210響應(yīng)。對(duì)話控制210例如可以通過(guò)重復(fù)最后的提示輸出,改述最后提示,或執(zhí)行其他動(dòng)作來(lái)響應(yīng)來(lái)自使用者的解釋請(qǐng)求。提示508 (例如,“最近的餐廳是ABC飯館”或其他提示)例如可以通過(guò)改變提示508中措辭的順序而改述(例如,“ABC是最近的餐廳”)??梢允褂闷渌奶崾尽8鶕?jù)一些實(shí)施例,基于干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,和/或其他信息)可以修改多種形式,多功能,或其他類(lèi)型的對(duì)話。多種形式對(duì)話512例如可以包括結(jié)合觸覺(jué),視覺(jué)的語(yǔ)音對(duì)話,或其他對(duì)話。多種形式對(duì)話512例如可以包括請(qǐng)求使用者輸入信息至觸覺(jué)裝置(例如,輸入裝置44或其他裝置)的語(yǔ)音對(duì)話音頻提示??梢允褂闷渌?lèi)型的多種形式對(duì)話512。在一些實(shí)施例中,如果噪音類(lèi)型參數(shù)306和噪音水平參數(shù)304顯示在車(chē)輛10中或圍繞車(chē)輛10可能存在高水平的噪音,多種形式的對(duì)話512例如可以通過(guò)恢復(fù)成或證實(shí)為在言語(yǔ)提示上的可見(jiàn)顯示,通過(guò)恢復(fù)成或切換為系統(tǒng)假設(shè)的可見(jiàn)顯示(例如,問(wèn)題,請(qǐng)求信息,或其他提示),提示或請(qǐng)求來(lái)自使用者的觸覺(jué)確認(rèn)(例如,從顯示在觸摸屏或其他輸出裝置上的響應(yīng)列表中選擇響應(yīng)),鼓勵(lì)觸覺(jué)形式的使用(例如,減少語(yǔ)義解釋器的信任),從言語(yǔ)切換到應(yīng)用功能的子集的其他形式(例如,通過(guò)觸覺(jué)裝置的簡(jiǎn)單命令和控制),或其他修改進(jìn)行修改?;谠胍纛?lèi)型參數(shù)306和噪音水平參數(shù)304,對(duì)話控制模塊210例如可以通過(guò)顯示問(wèn)題,詢問(wèn)信息,以及輸出裝置42 (例如顯示屏)上其他類(lèi)型的提示轉(zhuǎn)換成系統(tǒng)假設(shè)的可見(jiàn)顯示。例如使用者可以要求觸覺(jué)確認(rèn)。對(duì)話控制210例如可以要求使用者使用觸覺(jué)裝置,輸入裝置44 (例如,鍵盤(pán),觸摸屏,或其他輸入裝置)和/或其他裝置確認(rèn)對(duì)話提示508 (例如,語(yǔ)音對(duì)話提示)或來(lái)自系統(tǒng)100的其他信息輸出進(jìn)行響應(yīng)。系統(tǒng)100例如可以使用揚(yáng)聲器40,輸出裝置42,或其他裝置輸出語(yǔ)句“請(qǐng)通過(guò)輸入是確認(rèn)你說(shuō)過(guò)酒店”,并且使用者可以通過(guò)輸入響應(yīng)(例如,按下按鈕,輸入“是”或其他的響應(yīng))至輸入裝置44或其他裝置提供觸覺(jué)確認(rèn)。在一些實(shí)施例中,對(duì)話控制模塊210可以要求使用者從選項(xiàng)列表中選擇響應(yīng)。例如,系統(tǒng)100可以提示使用者使用觸覺(jué)裝置,輸入裝置44 (例如,鍵盤(pán),觸摸屏,或其他輸入裝置),和/或其他裝置從一列選項(xiàng)中選擇選項(xiàng)。系統(tǒng)100例如可以輸出提示“請(qǐng)?jiān)谟|摸屏上選擇類(lèi)別:酒店,餐廳,或加油站”并且使用者可以通過(guò)在觸覺(jué)裝置,輸入裝置44,和/或其他裝置上輸入選擇的選項(xiàng)(例如,酒店,餐廳,或加油站)而響應(yīng)提示。根據(jù)一些實(shí)施例,修改模塊224例如可以通過(guò)改變語(yǔ)義解釋器信任水平504而鼓勵(lì)或增加觸覺(jué)對(duì)話的使用。例如如果信任水平504低于閾值信任水平506,對(duì)話控制模塊504可以請(qǐng)求觸覺(jué)確認(rèn),觸覺(jué)選擇,或來(lái)自使用者的其他類(lèi)型的輸入。如果與對(duì)話動(dòng)作相關(guān)的信任水平504高于閾值信任水平506,對(duì)話動(dòng)作可以視為使用者輸入的正確解釋?zhuān)⑶蚁到y(tǒng)100可以基于對(duì)話控制使用言語(yǔ)(例如,系統(tǒng)100可以不請(qǐng)求觸覺(jué)確認(rèn),觸覺(jué)選擇,或來(lái)自使用者的其他類(lèi)型的輸入)。信任水平504例如可以基于干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,或其他信息)而減少。例如,如果干擾曲線記錄180 (例如,噪音水平參數(shù)304)顯示可能存在車(chē)輛噪音相關(guān)的噪音超過(guò)預(yù)定閾值(例如,噪音_水平=中,噪音_水平=高,或其他噪音_水平值),可以減少來(lái)自語(yǔ)義解釋器的信任水平504輸入。信任水平504例如可以是與語(yǔ)音識(shí)別中的確定性相關(guān)或取決于語(yǔ)音識(shí)別中的確定性的連續(xù)的值(例如,在0%與100%之間或其他數(shù)值范圍)?;诟蓴_曲線記錄180,信任水平504例如可以從第一信任水平值改變(例如,減小或增加)至第二信任水平值(例如,信任水平值小于第一信任水平值)。信任水平504例如可以根據(jù)函數(shù)(例如,連續(xù)函數(shù))改變(例如,減少或增加)。如果噪音水平參數(shù)304顯示零或低背景噪音(例如,噪音水平參數(shù)=低),信任水平504例如可以是百分之九十五(例如,95%)或任意其他值。如果干擾曲線記錄180顯示降低至高噪音水平在車(chē)輛10中可能存在,信任水平504例如可以從第一值(例如,百分之九十五或其他值)例如減少至第二值(例如,百分之八十或其他值),其例如小于第一值。如果干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304)顯示高的背景噪音,減少信任水平504可以增加對(duì)話控制210可請(qǐng)求觸覺(jué)確認(rèn),來(lái)自使用者的選擇或其他觸覺(jué)輸入的可能性。根據(jù)一些實(shí)施例,多種形式對(duì)話可以通過(guò)從言語(yǔ)至系統(tǒng)100功能(例如,預(yù)定后端應(yīng)用212功能)的子集的其他形式(例如,觸覺(jué)輸入,視覺(jué)輸出,和/或其他形式)切換而修改。基于噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,和/或其他信息,一個(gè)或多個(gè)后端應(yīng)用212可以從基于言語(yǔ)的形式至非言語(yǔ)的言語(yǔ)形式(例如,觸覺(jué)或其他形式)進(jìn)行切換。其他后端應(yīng)用212例如可以不切換至非言語(yǔ)形式(例如,控制和/或命令可以保持基于言語(yǔ))。例如,如果噪音類(lèi)型參數(shù)306與噪音水平參數(shù)304顯示高的發(fā)動(dòng)機(jī)噪音(例如,噪音_類(lèi)型=發(fā)動(dòng)機(jī),噪音_水平=高),當(dāng)其他后端應(yīng)用212可不從言語(yǔ)切換至基于觸覺(jué)的控制的同時(shí),預(yù)定后端應(yīng)用212 (例如,收音機(jī),地圖,語(yǔ)音搜索,或其他后端應(yīng)用)功能(例如,控制和命令)可以從基于言語(yǔ)至基于觸覺(jué)的控制(例如,使用輸入裝置44)進(jìn)行切換。例如,如果聲音類(lèi)型參數(shù)306和/或聲音水平參數(shù)304顯示背景噪音,語(yǔ)音搜索和/或其他的后臺(tái)應(yīng)用212可停止(例如,鎖定),并且基于言語(yǔ)的收音機(jī)控制和/或其他的后臺(tái)應(yīng)用212可以不停止(例如,可保持工作)。如果在車(chē)輛試驗(yàn),制造期間,或適用320期間,聲音類(lèi)型參數(shù)306和/或聲音水平參數(shù)304顯示背景噪音,例如可以確定哪個(gè)后端應(yīng)用212切換至其他形式(例如,觸覺(jué)輸入或其他輸入模式)或停止。根據(jù)一些實(shí)施例,可以適用320給定干擾曲線記錄180 (例如,噪音類(lèi)型參數(shù)306,噪音水平參數(shù)304,以及其他信息)的多種形式對(duì)話512的修改。通過(guò)測(cè)量噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304與對(duì)話控制210成功或功能之間的相關(guān)性,例如可以適用320多種形式對(duì)話512的修改224 (例如,恢復(fù)成可見(jiàn)顯示,請(qǐng)求觸覺(jué)確認(rèn),鼓勵(lì)觸覺(jué)形式的使用,從言語(yǔ)至應(yīng)用功能子集的其他形式的切換,和/或其他修改)。適用320例如可以確定用于給定干擾曲線記錄180的多種形式對(duì)話512的最佳修改(例如,恢復(fù)成可見(jiàn)顯示,請(qǐng)求觸覺(jué)確認(rèn),鼓勵(lì)觸覺(jué)形式的使用,從言語(yǔ)至應(yīng)用功能子集的其他形式的切換和/或其他修改)。用于給定干擾曲線記錄180的對(duì)話類(lèi)型514的最佳修改可以是對(duì)使用者最少麻煩和/或最佳改進(jìn)系統(tǒng)100功能的修改。多種形式對(duì)話512修改策略或方法的適用320可以類(lèi)似于對(duì)話類(lèi)型514修改策略的適用,對(duì)話控制動(dòng)作500的適用,以及其他適用320處理或方法。在一些實(shí)施例中,可以適用基于噪音類(lèi)型曲線306和噪音水平曲線304的對(duì)話控制210操作的全部類(lèi)型的修改224。如在此討論的,修改224的類(lèi)型,可以包括對(duì)話控制動(dòng)作500的修改,音頻提示508的導(dǎo)入,提示508的修改,對(duì)話類(lèi)型514的修改(例如,以減少語(yǔ)法困惑510),監(jiān)控并且響應(yīng)使用者混淆516,多種形式對(duì)話512的修改,后端應(yīng)用212功能的修改,和/或其他類(lèi)型的修改224??梢詼y(cè)量,估計(jì),或計(jì)算基于噪音類(lèi)型參數(shù)306和/或噪音水平參數(shù)304的對(duì)話成功與對(duì)話控制的修改之間的相關(guān)性。一種類(lèi)型的對(duì)話控制210修改224的成功例如可以通過(guò)確定使用者是否對(duì)對(duì)話控制提示508提供了可預(yù)測(cè)的響應(yīng)(例如,使用者是否響應(yīng)了有關(guān)或無(wú)關(guān)主題),使用者是否提供了對(duì)提示508的任何響應(yīng),或使用其他方法進(jìn)行測(cè)量或估計(jì)。基于測(cè)量的對(duì)話控制成功,通過(guò)停止,停用,改變或切換對(duì)話控制修改224的類(lèi)型,或以其他方式改變對(duì)話控制修改224,可以適用對(duì)話控制210處理與操作的修改。對(duì)話控制修改224操作例如可以通過(guò)變化與給定噪音類(lèi)型參數(shù)306與噪音水平參數(shù)304相關(guān)的參數(shù)而改變。例如,可以改變語(yǔ)義解釋器信任水平504,可以改變與提示的速度和定時(shí)相關(guān)的參數(shù),可以改變或適用其他參數(shù)以改進(jìn)對(duì)話控制210成功??梢赃m用或改變其他參數(shù)和操作。圖7是根據(jù)本發(fā)明的實(shí)施例的方法的流程圖。在操作600中,音頻信號(hào)(圖3的音頻信號(hào))可以接收在與車(chē)輛(例如,圖3的車(chē)輛10)相關(guān)聯(lián)的處理器中(例如圖2的處理器110或圖3的信號(hào)處理器202)。信號(hào)處理器202例如可以由處理器110全部或部分地實(shí)施。
操作610中,表示或?qū)?yīng)于一個(gè)或多個(gè)聲音的聲音相關(guān)的車(chē)輛信息(例如,圖2的聲音相關(guān)的車(chē)輛信息160,或與產(chǎn)生或引起聲音的車(chē)輛系統(tǒng)的操作相關(guān)的信號(hào)或信息)可以接收在處理器中(例如,圖3的干擾曲線模塊222)。在一些實(shí)施例中聲音相關(guān)的車(chē)輛信息不包括音頻信號(hào)。干擾曲線模塊222例如可以由處理器110全部或部分地實(shí)施。操作620中,干擾曲線記錄(例如,圖2的干擾曲線記錄180)可以基于聲音相關(guān)的車(chē)輛信息確定。干擾曲線記錄例如可以包括噪音類(lèi)型參數(shù)(例如,圖4的噪音類(lèi)型參數(shù)306),噪音水平參數(shù)(例如,圖4的噪音水平參數(shù)304),和/或其他參數(shù)。干擾曲線記錄例如可以基于多種類(lèi)型的與聲音相關(guān)的車(chē)輛信息使用邏輯操作或其他數(shù)學(xué)操作確定。在一些實(shí)施例中,干擾曲線記錄可以通過(guò)量化聲音相關(guān)的車(chē)輛信息(例如,車(chē)輛發(fā)動(dòng)機(jī)RPM信息)確定。操作630中,語(yǔ)音識(shí)別處理或系統(tǒng)(例如,在圖3的語(yǔ)音識(shí)別模塊204和/或信號(hào)處理器202中)基于聲音相關(guān)的車(chē)輛信息和/或干擾曲線記錄可以修改。語(yǔ)音識(shí)別例如可以基于干擾曲線記錄通過(guò)選擇或確定信號(hào)處理器(例如,信號(hào)處理器212),自動(dòng)語(yǔ)音識(shí)別系統(tǒng)前端(例如,圖4的ASR前端314),或其他裝置中的濾波器(例如,圖4的濾波器312)以及濾波器參數(shù)(例如,圖4的濾波器參數(shù)322)進(jìn)行修改。濾波器例如可以應(yīng)用于音頻信號(hào)??梢援a(chǎn)生音頻信號(hào)中的響應(yīng)至對(duì)話命令(例如,由圖3的對(duì)話控制模塊210和/或響應(yīng)產(chǎn)生器214)并且響應(yīng)可以輸出(例如,經(jīng)由圖2的顯示42或揚(yáng)聲器40)至車(chē)輛乘員??梢允褂闷渌虿煌盗械牟僮鳌1景l(fā)明的實(shí)施例可以包括用于執(zhí)行在此處描述的操作的裝置。這樣的裝置可以為所需目的特別地構(gòu)造,或可以包括通過(guò)存儲(chǔ)在計(jì)算機(jī)中的計(jì)算機(jī)程序有選擇地啟動(dòng)或重新配置的計(jì)算機(jī)或處理器。這樣的計(jì)算機(jī)程序可以存儲(chǔ)在計(jì)算機(jī)可讀或處理器可讀的非臨時(shí)存儲(chǔ)介質(zhì),包括軟盤(pán),光盤(pán),CD-ROM,磁性光盤(pán)的任意類(lèi)型的盤(pán),只讀存儲(chǔ)器(R0M),隨機(jī)存取存儲(chǔ)器(RAM),電可編程只讀存儲(chǔ)器(EPR0M),電可擦除和可編程只讀存儲(chǔ)器(EEPR0M),磁或光學(xué)卡,或適于存儲(chǔ)電指令的任意其他類(lèi)型的介質(zhì)。將要理解,各種編程語(yǔ)言可以用來(lái)實(shí)施在此處描述的本發(fā)明的教導(dǎo)。本發(fā)明的實(shí)施例可以包括物品,諸如非臨時(shí)的計(jì)算機(jī)或處理器可讀非臨時(shí)的存儲(chǔ)介質(zhì),例如存儲(chǔ)器,盤(pán)驅(qū)動(dòng)器,或USB閃速存儲(chǔ)器編碼,包括或存儲(chǔ)指令,例如計(jì)算機(jī)可執(zhí)行指令,當(dāng)由處理器或控制器執(zhí)行時(shí)使得處理器或控制器執(zhí)行在此公開(kāi)的方法。指令可以使得處理器或控制器執(zhí)行實(shí)現(xiàn)在此公開(kāi)的方法的處理。在此公開(kāi)了不同的實(shí)施例。某些實(shí)施例的特征可結(jié)合其他實(shí)施例的特征;因此某些實(shí)施例可結(jié)合多個(gè)實(shí)施例的特征。為了示出和描述的目的,已經(jīng)展現(xiàn)了本發(fā)明的實(shí)施例的上述描述。不旨在是排他的或?qū)⒈景l(fā)明限制為公開(kāi)的精確形式。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,在上述教導(dǎo)下可做出許多修改,變化,替換,改變,以及等同形式。因此應(yīng)當(dāng)理解所附的權(quán)利要求旨在覆蓋落入本發(fā)明的真實(shí)精神內(nèi)的全部這樣的修改和變化。
權(quán)利要求
1.一種方法,包括: 在與車(chē)輛相關(guān)聯(lián)的處理器中接收音頻信號(hào); 在處理器中接收表不一個(gè)或多個(gè)聲音的聲音相關(guān)的車(chē)輛信息,聲音相關(guān)的車(chē)輛信息不包括音頻信號(hào);以及 基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理。
2.如權(quán)利要求1所述的方法,包括基于聲音相關(guān)的車(chē)輛信息確定干擾曲線記錄。
3.如權(quán)利要求2所述的方法,其中基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理包括: 基于干擾曲線記錄確定濾波器和濾波器參數(shù);以及 應(yīng)用濾波器至音頻信號(hào)。
4.如權(quán)利要求2所述的方法,其中基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理包括: 基于干擾曲線記錄選擇聲學(xué)模型;以及 使用聲學(xué)模型解碼言語(yǔ)。
5.如權(quán)利要求2所述的方法,其中基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理包括: 基于干擾曲線記錄確定自動(dòng)語(yǔ)音識(shí)別模塊前端中的濾波器和濾波器參數(shù);以及 將濾波器應(yīng)用至自動(dòng)語(yǔ)音識(shí)別模塊前端中的音頻信號(hào)。
6.如權(quán)利要求2所述的方法,其中基于聲音相關(guān)的車(chē)輛信息確定干擾曲線記錄包括基于多種類(lèi)型的聲音相關(guān)的車(chē)輛信息使用邏輯操作確定干擾曲線記錄。
7.如權(quán)利要求1所述的方法,包括: 在增強(qiáng)語(yǔ)音識(shí)別功能中基于聲音相關(guān)的車(chē)輛信息測(cè)量語(yǔ)音識(shí)別修改的成功;以及 基于測(cè)量的成功適用語(yǔ)音識(shí)別修改。
8.如權(quán)利要求1所述的方法,包括: 對(duì)音頻信號(hào)中的言語(yǔ)命令產(chǎn)生響應(yīng);以及 對(duì)車(chē)輛乘員輸出響應(yīng)。
9.一種系統(tǒng),包括: 存儲(chǔ)器; 與車(chē)輛相關(guān)聯(lián)的處理器,其用于: 接收音頻信號(hào); 接收表不一個(gè)或多個(gè)聲音的聲音相關(guān)的車(chē)輛信息,聲音相關(guān)的車(chē)輛信息不包括音頻信號(hào);以及 基于聲音相關(guān)的車(chē)輛信息修改語(yǔ)音識(shí)別處理。
10.一種方法,包括: 使用一個(gè)或多個(gè)與車(chē)輛相關(guān)聯(lián)的麥克風(fēng)測(cè)量聲音; 將表示聲音的信號(hào)傳送至自動(dòng)語(yǔ)音識(shí)別系統(tǒng); 在控制器接收與引起聲音的車(chē)輛系統(tǒng)的操作相關(guān)的信息; 基于信息計(jì)算干擾曲線記錄,干擾曲線記錄表示噪音類(lèi)型和噪音水平;以及 基于干擾曲線記錄改變語(yǔ)音識(shí)別。
全文摘要
本發(fā)明涉及使用聲音相關(guān)的車(chē)輛信息以增強(qiáng)語(yǔ)音識(shí)別的方法和系統(tǒng)。具體地,在與車(chē)輛相關(guān)聯(lián)的處理器中可以接收音頻信號(hào)??梢杂商幚砥鹘邮毡硎疽粋€(gè)或多個(gè)聲音的聲音相關(guān)的車(chē)輛信息。聲音相關(guān)的車(chē)輛信息可以或可以不包括音頻信號(hào)?;诼曇粝嚓P(guān)的車(chē)輛信息可以修改語(yǔ)音識(shí)別處理或系統(tǒng)。
文檔編號(hào)G10L15/20GK103208284SQ201310019218
公開(kāi)日2013年7月17日 申請(qǐng)日期2013年1月17日 優(yōu)先權(quán)日2012年1月17日
發(fā)明者E.茨爾克爾-漢科克, O.尖霍尼 申請(qǐng)人:通用汽車(chē)環(huán)球科技運(yùn)作有限責(zé)任公司