多遍車輛語音識別系統(tǒng)和方法
【專利說明】多遍車輛語音識別系統(tǒng)和方法
[0001]相關申請的交叉引用
[0002]本申請要求享有于2012年6月22日遞交的、標題為“Mult1-pass Vehicle VoiceRecognit1n Systems and Methods) ”的美國臨時專利申請?zhí)?1/663,423的權益和優(yōu)先權,其公開內(nèi)容通過引用全部并入本文。
【背景技術】
[0003]本發(fā)明總體上涉及基于車輛的語音識別系統(tǒng)和方法的領域。
[0004]—些語音識別系統(tǒng)嘗試來識別大量的詞語、短語或名稱。開發(fā)為用戶提供高精確度以及快速響應時間的感覺的語音識別系統(tǒng)是具有挑戰(zhàn)性的并且是困難的。使用大量的詞匯導致更慢的語音識別的響應時間。傳統(tǒng)的語音識別系統(tǒng)嘗試通過給用戶提示命令或任務的離散片段(例如,“哪個州? ”,“哪個城市? ”等)來加快所感知的響應時間。
【發(fā)明內(nèi)容】
[0005]本公開的一個實施例涉及用于車輛的語音識別系統(tǒng)。該語音識別系統(tǒng)包括用于接收來自用戶的話語的麥克風。該語音識別系統(tǒng)還包括存儲器,所述存儲器包括用于語音識別的命令或名稱的部分集合,以及用于語音識的命令或名稱的較大集合。該語音識別系統(tǒng)還包括與所述麥克風和所述存儲器通信的處理電子器件。處理電子器件可以被配置為處理所接收到的話語以獲得話語數(shù)據(jù)。處理電子器件進一步被配置為使用所獲得的話語數(shù)據(jù)進行至少兩遍語音識別。在第一遍中,將話語數(shù)據(jù)與所述部分集合進行比較。在第二遍中,將話語數(shù)據(jù)與所述較大集合進行比較。
[0006]本公開的另一實施例涉及用于由用于車輛的語音識別系統(tǒng)所使用的計算機化的方法。該方法包括在麥克風處接收來自用戶的話語。該方法進一步包括從存儲器加載命令或名稱的部分集合。該方法進一步包括通過將所述接收到的話語的表示與所加載的命令或名稱的部分集合進行比較來進行第一遍語音識別。該方法還包括當獲得滿足或超過第一置信度水平的匹配時做出語音識別決定。該方法還包括,當在所述第一遍語音識別中沒有獲得匹配時,通過將所接收到的話語的表示與命令或名稱的完整集合進行比較來進行第二遍語音識別,完整集合大于部分集合。該方法進一步包括以下中的至少一個:輸出來自第一遍語音識別的匹配的指示或來自第二遍語音識別的匹配的指示以供用戶確認,以及基于來自第一遍語音識別的匹配或來自第二遍語音識別的匹配來執(zhí)行車輛功能。
【附圖說明】
[0007]根據(jù)以下結(jié)合附圖的詳細描述將更充分地理解本公開,在附圖中類似的附圖標記指代類似的元件,其中:
[0008]圖1A是根據(jù)示例性實施例的具有語音識別系統(tǒng)的車輛透視圖;
[0009]圖1B是根據(jù)示例性實施例的圖1A中的語音識別系統(tǒng)的框圖;
[0010]圖2是根據(jù)示例性實施例的用于進行多遍語音識別的過程的流程圖;
[0011]圖3A是根據(jù)示例性實施例的諸如圖1B中所示的用戶便攜式設備的框圖;以及
[0012]圖3B是根據(jù)示例性實施例的諸如圖1B中所示的用戶便攜式設備的框圖,其中所述設備被配置為還與遠程服務器通信。根據(jù)各個示例性實施例,圖1B中的車輛語音識別系統(tǒng),圖1B、圖3A和圖3B所示的用戶便攜式設備以及圖3B中的遠程服務器可以組合以形成一個系統(tǒng)。
【具體實施方式】
[0013]大體上參照附圖,示出根據(jù)示例性實施例的用于車輛的語音識別系統(tǒng)。該語音識別系統(tǒng)能通過在第一遍語音識別中將所接收到的話語(例如,表示話語的數(shù)據(jù))與語法的所選定的小集合(例如,語音命令、名稱、語音標簽、收藏的地點,收藏的聯(lián)系人等)進行比較以提供更快的話語識別。如果第一遍成功,則該系統(tǒng)的感知速度是非??斓摹H绻谝槐椴怀晒?,則系統(tǒng)將使用可能語法的較大集合(或完整集合)(例如,完整的地址簿、完整的電話簿、完整的命令列表等)來進行第二遍。
[0014]在示例性實施例中,用于車輛的語音識別系統(tǒng)包括用于接收來自用戶的話語的麥克風。該系統(tǒng)還包括存儲器,所述存儲器具有用于語音識別的命令或名稱的部分集合。該存儲器還包括用于語音識的命令或名稱的較大集合。該系統(tǒng)還包括與所述麥克風和所述存儲器通信的處理電子器件。處理電子器件被配置為處理所接收到的話語以獲得話語數(shù)據(jù)。處理電子器件進一步被配置為使用所獲得的話語數(shù)據(jù)進行至少兩遍語音識別。在第一遍中,話語數(shù)據(jù)與部分集合進行比較。在第二遍中,話語數(shù)據(jù)與較大集合進行比較。
[0015]存儲器相對于處理電子器件可以是在本地的(例如,是處理電子器件一部分或本地地耦合到處理電子器件)。當確定在第一遍中是否存在匹配時處理電子器件可以要求第一置信度水平,而當確定在第二遍中是否存在匹配時處理電子器件可以要求第二置信度水平。當在第一遍中滿足或超過所要求的第一置信度水平時處理電子器件可被配置為跳過第二遍。處理電子器件可被配置為基于在麥克風處所接收到的或在用戶輸入設備處所接收的用戶反饋來適應性地更新所述第一置信度水平。對于第一遍的不同置信度水平和不同的命令或名稱的部分集合可與車輛的不同用戶或不同的用戶設備相關聯(lián)。用于語音識別的命令或名稱的部分集合可包括以下中的至少一個:(a)命令的部分集合、(b)語音標簽的部分集合、和(C)用戶特定的收藏聯(lián)系人或用戶特定的收藏電話簿名稱的集合。在其它實施例中,用于語音識別的命令或名稱的部分集合可包括以下中的至少一個:(a)最常用命令的集合、(b)最常用語音標簽的集合、和(C)最常用聯(lián)系人或電話簿名稱的集合。處理電子器件可進一步被配置為隨著命令或名稱的使用頻率發(fā)生變化而更新第一遍中的用于語音識別的命令或名稱的部分集合。
[0016]本發(fā)明的另一實施例涉及用于由用于車輛的語音識別系統(tǒng)所使用的計算機化的方法。該方法包括在麥克風處接收來自用戶的話語。該方法進一步包括從存儲器加載命令或名稱的部分集合并且通過將所述接收到的話語的表示與所加載的命令或名稱的部分集合進行比較來進行第一遍語音識別。接著,該方法包括當獲得滿足或超過第一置信度水平的匹配時做出語音識別的決定。當在所述第一遍語音識別中沒有獲得匹配時,通過將所接收到的話語的表示與命令或名稱的完整集合進行比較來進行第二遍語音識別。完整集合大于部分集合。該方法進一步包括以下中的至少一個:(a)輸出來自第一遍語音識別的匹配的指示或來自第二遍語音識別的匹配的指示以供用戶確認,以及(b)基于來自第一遍語音識別的匹配或來自第二遍語音識別的匹配來執(zhí)行車輛功能。
[0017]在一個優(yōu)選的實施例中,在沒有來自遠程系統(tǒng)的輔助的情況下進行第一遍和第二遍,并且從對于語音識別系統(tǒng)在本地的存儲器來加載部分集合和完整集合。在其它實施例中,可從本地存儲器加載部分集合,而從另一設備(例如,移動電話,平板計算機等)接收更完整的集合。
[0018]在示例性實施例中,第二置信度水平用于將所接收到的話語的表示與命令或名稱的完整集合進行比較。第一置信度水平和第二置信度水平可以是不同的。第一置信度水平可高于所述第二置信度水平。該方法可包括基于在所述麥克風處所接收到的或在用戶輸入設備處所接收到的用戶反饋來適應地更新第一置信度水平。適應性地更新可包括響應于指示第一遍結(jié)果不正確的用戶反饋來提高第一置信度水平。適應性地更新可進一步包括響應于指示第一遍的結(jié)果正確的用戶反饋來降低第一置信度水平。該方法可進一步包括針對語音識別系統(tǒng)的多個不同的用戶或用戶設備中的每一個保持不同的命令或名稱的部分集合。用于語音識別的命令或名稱的部分集合包括以下中的至少一個:(a)最常用命令的集合、(b)最常用語音標簽的集合、和(C)最常用聯(lián)系人或電話簿名稱的集合。該方法可進一步包括隨著命令或名稱的使用頻率發(fā)生變化而更新第一遍中的用于語音識別的命令或名稱的部分集合。
[0019]參照圖1A和圖1B,本發(fā)明的實施例涉及用于車輛100的語音識別系統(tǒng)102。語音識別系統(tǒng)102被示出為車輛100的一部分。語音識別系統(tǒng)102包括麥克風128。語音識別系統(tǒng)102或耦合的車輛系統(tǒng)還可包括被耦合到語音識別系統(tǒng)102的收發(fā)器130。語音識別系統(tǒng)102可包括或被耦合到任意數(shù)量的顯示器(例如,IXD顯示器、觸摸屏顯示器等)或任意數(shù)量的用戶界面元件(例如,按鈕、開關、用于選擇的觸摸屏元件、撥號盤、操縱桿、安裝在方向盤上的控制器件等)。車輛100的車輛電子系統(tǒng)(語音識別系統(tǒng)102為其組件)可包括通信功能(例如,藍牙電話連接,車庫門通信系統(tǒng),例如由Johnson Controls出售的H0MELINK等),用戶的舒適和便利功能,安全功能,諸如無線電的娛樂功能,或其它用戶界面功能。
[0020]在不同的實施例中,語音識別系統(tǒng)102可以是各種車輛系統(tǒng)的一部分或跨各種車輛系統(tǒng)分布。例如,語音識別系統(tǒng)102可以是車輛導航系統(tǒng)的一部分或獨立設備的一部分,所述獨立設備可將輸入和輸出提供到車輛子系統(tǒng),例如車輛導航系統(tǒng)、車輛HVAC系統(tǒng)、車輛無線電系統(tǒng)等。所有這樣的架構以及它們的組合都在本公開的范圍之內(nèi)。權利要求書可呈現(xiàn)于該申請或隨后的申請中以將本發(fā)明縮窄到任何一個實施例或一組實施例。
[0021]語音識別系統(tǒng)包括處理電子器件104。處理電子器件104被示出為包括處理器106和存儲器108。處理器106可被實現(xiàn)為通用處理器、專用集成電路(ASIC)、一個或多個現(xiàn)場可編程門陣列(FPGA)、一組處理組件或其它合適的電子處理組件。處理電子器件104可包括