無線載波系統(tǒng)14之外或者替代無線載波系統(tǒng)14,可以采用該衛(wèi)星電話。
[0038]陸地網(wǎng)絡(luò)16可以是傳統(tǒng)的路基遠程通信網(wǎng)絡(luò),其連接至一個或多個固定電話并且將無線載波系統(tǒng)14連接至呼叫中心20。例如,陸地網(wǎng)絡(luò)16可以包括公用交換電話網(wǎng)絡(luò)(PSTN),例如用于提供硬連線電話、數(shù)據(jù)包交換通信和互聯(lián)網(wǎng)基礎(chǔ)設(shè)施。可以通過使用標準的有線網(wǎng)絡(luò)、光纖或其他光學(xué)網(wǎng)絡(luò)、電纜網(wǎng)絡(luò)、電力線、其他無線網(wǎng)絡(luò)諸如無線局域網(wǎng)(WLAN)、或提供寬帶無線接入(BWA)的網(wǎng)絡(luò)或其任意組合,來實施陸地網(wǎng)絡(luò)16的一個或多個區(qū)段。此外,呼叫中心20無需經(jīng)由陸地網(wǎng)絡(luò)16連接,而是可以包括無線電話設(shè)備以使其能夠與無線網(wǎng)絡(luò)諸如無線載波系統(tǒng)14直接通信。
[0039]計算機18可以是經(jīng)由諸如互聯(lián)網(wǎng)等專用或公用網(wǎng)絡(luò)可訪問的大量計算機中的一個。每個這種計算機18可以用于一個或多個目的,諸如可由車輛經(jīng)由遠程信息處理單元30和無線載波14訪問的網(wǎng)頁服務(wù)器。計算機18示出為操作遠程定位的自動語音識別(ASR)系統(tǒng)74。以下將更詳細地討論遠程定位ASR系統(tǒng)74的部件和功能。其他這些可訪問的計算機18可以例如是:服務(wù)中心計算機,其中診斷信息和其他車輛數(shù)據(jù)可以從車輛經(jīng)由遠程信息處理單元30上傳;客戶端計算機,由車輛擁有者或其他訂戶使用以用于訪問或接收車輛數(shù)據(jù)或者設(shè)置或配置訂戶偏好或控制車輛功能等目的;或者第三方資料庫,向其或從其提供車輛數(shù)據(jù)或其他信息,不論通過與車輛12還是呼叫中心20或兩者通信。計算機18也可以用于提供諸如DNS服務(wù)等互聯(lián)網(wǎng)連接性,或者作為使用DHCP或其他適當(dāng)協(xié)議來向車輛12分配IP地址的網(wǎng)絡(luò)地址服務(wù)器使用。
[0040]呼叫中心20設(shè)計為向車輛電子部件28提供大量不同的系統(tǒng)后端功能,并且根據(jù)在此所示的示例性實施例,通常包括一個或多個交換器80、服務(wù)器82、數(shù)據(jù)庫84、現(xiàn)場顧問86、以及自動語音應(yīng)答系統(tǒng)(VRS)88,所有這些是本領(lǐng)域已知的。這些各種呼叫中心部件優(yōu)選地經(jīng)由有線或無線局域網(wǎng)90相互聯(lián)接。交換器80可以是專用分支交換(PBX)交換器,傳送輸入信號以使得語音傳輸通常由常規(guī)電話發(fā)送至現(xiàn)場顧問86或者使用VoIP發(fā)送至自動語音應(yīng)答系統(tǒng)88。現(xiàn)場顧問電話也可以使用VoIP,如圖1中虛線所示。VoIP和通過交換器80的其他數(shù)據(jù)通信經(jīng)由連接在交換器80和網(wǎng)絡(luò)90之間的調(diào)制解調(diào)器(未示出)實施。數(shù)據(jù)傳輸經(jīng)由調(diào)制解調(diào)器傳遞至服務(wù)器82和/或數(shù)據(jù)庫84。數(shù)據(jù)庫84可以存儲賬號信息,諸如訂戶認證信息、車輛標識符、概貌記錄、行為模式和其他相關(guān)訂戶信息。數(shù)據(jù)傳輸也可以由諸如802.llx、GPRS等無線系統(tǒng)進行。盡管圖示實施例已經(jīng)描述為將結(jié)合使用現(xiàn)場顧問86的人工呼叫中心20使用,但是將意識到呼叫中心可以替代地采用VRS88作為自動顧問,或者可以使用VRS 88與現(xiàn)場顧問86的組合。
[0041]現(xiàn)在轉(zhuǎn)向圖2,示出了對可以用于啟用當(dāng)前公開方法的自動語音識別(ASR)系統(tǒng)210的例示性架構(gòu)。一般而言,車輛乘員與ASR系統(tǒng)聲音互動以用于一個或多個以下基本目的:訓(xùn)練系統(tǒng)理解車輛乘員的特定語音;存儲離散的語音,諸如口語名簽或口語控制詞語,像數(shù)字或關(guān)鍵詞;或者為了任何適當(dāng)?shù)哪康亩R別車輛乘員的語音,諸如語音撥號、菜單導(dǎo)航、轉(zhuǎn)錄、服務(wù)請求、車輛裝置或裝置功能控制等等。
[0042]ASR系統(tǒng)210示出在車輛12中。然而,ASR系統(tǒng)210中包括的元件以及關(guān)于ASR系統(tǒng)210討論的概念也可以在位于計算機18處的遠程定位ASR系統(tǒng)74中找到,其中存在一些差異。例如,當(dāng)與ASR系統(tǒng)210相比時,遠程定位ASR系統(tǒng)74可以包括多種復(fù)雜處理能力和語言模型以及更多的最新語言模型。當(dāng)使用遠程定位ASR系統(tǒng)74時,車輛12可以對在車輛12處經(jīng)由話筒32接收到的語音分包,并且通過無線載波系統(tǒng)14將語音無線地發(fā)送至遠程定位ASR系統(tǒng)74。在輸出結(jié)果之后,遠程定位ASR系統(tǒng)74可以對語音識別結(jié)果分包并且將其無線地發(fā)送至車輛12。盡管遠程定位ASR系統(tǒng)74示出為在計算機18中,但是其也可以位于系統(tǒng)74的其他地方,諸如在呼叫中心20的服務(wù)器82和數(shù)據(jù)庫84中。在如何執(zhí)行遠程定位ASR系統(tǒng)的一個示例中,Google?提供了可以與由Droid?無線移動裝置使用的Android?軟件一起使用的應(yīng)用程序設(shè)計接口(API)。如關(guān)于通信系統(tǒng)10所示,遠程定位ASR系統(tǒng)74可以在計算機18、呼叫中心的服務(wù)器82/數(shù)據(jù)庫84、或者位于遠離車輛12的位置的其他基于計算機的服務(wù)器設(shè)施處實施。
[0043]通常,ASR從人類語音提取聲音數(shù)據(jù),將聲音數(shù)據(jù)與所存儲的子字數(shù)據(jù)比較和對比,選擇可以與其他所選子字連接的適當(dāng)?shù)淖幼?,并且將連接的子字或詞語輸出以用于后處理,諸如口述或轉(zhuǎn)錄、地址簿撥號、存儲至存儲器、訓(xùn)練ASR模型或改寫參數(shù)等等。
[0044]ASR系統(tǒng)對本領(lǐng)域人員而言是大體已知的,并且圖2僅示出了一個特定的例示性ASR系統(tǒng)210。系統(tǒng)210包括諸如遠程信息處理話筒32等用于接收語音的裝置、以及聲音接口33,聲音接口 33諸如是具有模數(shù)轉(zhuǎn)換器以將語音數(shù)字化為聲音數(shù)據(jù)的遠程信息處理單元30的聲卡。系統(tǒng)210還包括諸如遠程信息處理存儲器54等用于存儲聲音數(shù)據(jù)并存儲語音識別軟件和數(shù)據(jù)庫的存儲器、以及諸如遠程信息處理器52等用于處理聲音數(shù)據(jù)的處理器。處理器與存儲器一起并且結(jié)合以下模塊工作:用于將語音的聲音數(shù)據(jù)流語法分析為諸如聲音特征等參數(shù)表示的一個或多個前端處理器或預(yù)處理器軟件模塊212;用于將聲音特征解碼以產(chǎn)生對應(yīng)于輸入語音話語的數(shù)字子字或字輸出數(shù)據(jù)的一個或多個解碼器軟件模塊214;以及用于使用來自解碼器模塊214的輸出數(shù)據(jù)用于任何適當(dāng)目的的一個或多個后處理器軟件模塊216。
[0045]系統(tǒng)210也可以從任何其他適當(dāng)?shù)囊纛l源31接收語音,其可以與采用以實線示出的預(yù)處理軟件模塊212直接通信,或者經(jīng)由聲音接口 33而與其間接通信。音頻源31可以包括例如諸如語音郵件系統(tǒng)等音頻電話源、或者任何種類的其他電話服務(wù)。
[0046]—個或多個模塊可以用作對解碼器模塊214的輸入。首先,語法和/或詞典模型218可以提供規(guī)則,其管理哪個字詞可以邏輯地跟在其他字詞之后以形成有效的句子。廣義地來講,語法能夠在任何給定時刻在任何給定ASR模式下限定系統(tǒng)210所預(yù)期的詞匯的全域。例如,如果系統(tǒng)210處于用于訓(xùn)練命令的訓(xùn)練模式,則語法模塊218可以包括系統(tǒng)210所已知并且由其使用的所有命令。在另一示例中,如果系統(tǒng)210處于主菜單模式,則有效的語法模型218可以包括由系統(tǒng)210預(yù)期的所有主菜單命令,諸如呼叫、撥號、退出、刪除、目錄等等。其次,聲音模型220輔助選擇對應(yīng)于來自預(yù)處理器模塊212的輸入的最可能的子字或字詞。第三,字詞模型222和語句/語言模型224在將所選擇的子字或字詞放入到字詞或語句的上下文中提供了規(guī)則、句式和/或語義。此外,語句/語言模型224可以在任何給定時刻在任何給定ASR模式下限定系統(tǒng)210所預(yù)期的語句全域和/或可以提供規(guī)則等,該規(guī)則管理哪些句子可以邏輯地跟在其他語句之后以形成有效的擴展語音。
[0047]首先,從人類語音提取聲音數(shù)據(jù),其中車輛乘員向話筒32說話,話筒將話語轉(zhuǎn)換為電信號并且將這些信號傳達至聲音接口 33。話筒32中的聲音響應(yīng)元件將乘員的語音話語作為空氣壓力的變化捕捉,并且將話語轉(zhuǎn)換為諸如直流電流或電壓等模擬電信號的對應(yīng)變化。聲音接口 33接收模擬電信號,首先對其取樣以使得在離散的時刻捕捉模擬信號的值,并且然后將其量化以使得在每個取樣時刻將模擬信號的幅度轉(zhuǎn)換為數(shù)字語音數(shù)據(jù)的連續(xù)流。換言之,聲音接口 33將模擬電信號轉(zhuǎn)換為數(shù)字電信號。數(shù)字數(shù)據(jù)是二進制位,其在遠程信息處理存儲器54中緩沖并且然后由遠程信息處理器52處理,或者當(dāng)它們最初由處理器52接收時可以實時地被處理。
[0048]其次,預(yù)處理器模塊212將數(shù)字語音數(shù)據(jù)的連續(xù)流變換為聲音參數(shù)的離散序列。更具體地,處理器52執(zhí)行預(yù)處理器模塊212以將數(shù)字語音數(shù)據(jù)分段為例如10 — 30ms時長的重疊語音或聲音幀。幀對應(yīng)于聲音子字,諸如音節(jié)、半音節(jié)、音素、雙音素、音位等等。預(yù)處理器模塊212還執(zhí)行語音分析以從每個幀內(nèi)從諸如隨時間變化的特征向量等乘員語音提取聲音參數(shù)。乘員語音內(nèi)的話語可以表示為這些特征向量的序列。例如并且如本領(lǐng)域技術(shù)人員已知的那樣,特征向量可以被提取并且可以包括例如音高、能量曲線、頻譜屬性和/或倒譜系數(shù),其可以通過執(zhí)行幀的傅立葉變換并且使用余弦變換而去關(guān)聯(lián)聲音頻譜而獲得。將覆蓋了語音特定時長的聲音幀和對應(yīng)參數(shù)連接為待解碼的語音的未知測試圖形。
[0049]預(yù)處理模塊212還可以存儲可以由基于規(guī)則的分類器或基于統(tǒng)計的分類器實施的上下文分類器。上下文分類器可以應(yīng)用于從車輛乘員的接收到的語音識別的文本,并且用于識別該語音的會話上下文。通常而言,上下文分類器不涉及理解接收到的語音的精確內(nèi)容而是理解語音上下文。例如,基于規(guī)則的分類器可以訪問每個與字詞列表相關(guān)聯(lián)的多個存儲的上下文。這些上下文和它們相關(guān)聯(lián)的字詞可以存儲在語法模塊218或者可由ASR 210訪問的任何其他存儲器位置中。當(dāng)使用基于規(guī)則的分類器時,ASR系統(tǒng)210可以識別接收到的語音中的匹配與上下文相關(guān)聯(lián)的一個或多個字詞的一個或多個字詞。當(dāng)ASR系統(tǒng)2