專利名稱:具有遠(yuǎn)程服務(wù)接口的移動語音平臺架構(gòu)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音接ロ,其具有無線地從蜂窩電話或者其他移動設(shè)備獲取的基于計算機(jī)的服務(wù),以及涉及在諸如客車的車輛中實施的這種接ロ。
背景技術(shù):
針對車輛功能以及蜂窩電話功能和應(yīng)用的、基于語音的人機(jī)交互(Human-MachineInterface, HMI)通常涉及特定于應(yīng)用或者特定于功能的有限命令集合,該集合需要從句法上被約束的用戶和HMI之間的交互。在這些系統(tǒng)中,輸入的語音可以轉(zhuǎn)換成特定應(yīng)用的特定命令,然而,通常只有有限的能力來識別和執(zhí)行涉及不同應(yīng)用或服務(wù)提供者的不同服務(wù)。在車輛內(nèi)使用的蜂窩電話的領(lǐng)域中,已經(jīng)建議創(chuàng)建若干系統(tǒng)并且一些系統(tǒng)已被實施,這些系統(tǒng)能夠通過提供免提電話體驗來幫助減少駕駛員分神,以及幫助執(zhí)行ー些基本的車輛控制任務(wù),例如選擇和控制車輛上的無線電和其他信息娛樂服務(wù)。在一些系統(tǒng)中,這可以使用嵌入式蜂窩電話來完成,該蜂窩電話具有與至少一部分車輛電子設(shè)備的接入口,從而允許通過語音用戶接ロ來控制和報告。在其他車輛中,駕駛員或者其他乘員的個人移動設(shè)備(例如,蜂窩電話)可用于此目的,而車輛提供基本聲音接ロ,該基本聲音接ロ包括麥克風(fēng)和一個或多個揚(yáng)聲器,以及與移動設(shè)備相連的藍(lán)牙或者其他無線連接。這允許在聲音接口和移動設(shè)備之間沿任一方向發(fā)送語音和其他聲音。然而,這些系統(tǒng)通常僅限于啟用ー些基本的移動設(shè)備功能,例如呼叫以及控制音樂選擇和回放。它們沒有提供與很多其他內(nèi)置的以及用戶添加的、如今通??捎玫膽?yīng)用和功能的接入口。例如,現(xiàn)在移動設(shè)備-比如智能電話被廣泛應(yīng)用和運(yùn)用,其允許用戶下載和安裝相對小型的軟件應(yīng)用程序(app)。無論是通過諸如Android OS的操作系統(tǒng)(OS),還是通過諸如iPhone4STM上可用的Siri 內(nèi)置app,一些這樣的智能電話具有了內(nèi)置的語音支持。例如參見2011年7月21日公開的W02011088053。在提供更高級別的集成的同時,這些可商購的系統(tǒng)并沒有配置成可提供移動設(shè)備的完全免提體驗,因為它們在語音會話中仍然嚴(yán)重地依賴屏幕來與用戶交互。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的ー個方面,提供ー種使用移動設(shè)備給基于計算機(jī)的服務(wù)提供用戶語音接ロ的移動語音平臺,該移動設(shè)備具有處理器、提供到基于計算機(jī)服務(wù)的接入的通信電路、操作系統(tǒng)、和使用該操作系統(tǒng)運(yùn)行并通過通信電路使用一個或多個基于計算機(jī)的服務(wù)的一個或多個應(yīng)用程序,該移動語音平臺包括:至少ー個非瞬態(tài)數(shù)字存儲媒介,其存儲具有計算機(jī)指令的程序模塊,在被處理器執(zhí)行時,所述計算機(jī)指令接收代表已經(jīng)使用自動語音識別處理過的用戶語音的語音識別結(jié)果、基于語音識別結(jié)果來確定所需的基于計算機(jī)的服務(wù)、訪問與所需服務(wù)關(guān)聯(lián)的遠(yuǎn)程存儲的服務(wù)接ロ、使用服務(wù)接ロ啟動所需服務(wù)、從所需服務(wù)接收服務(wù)結(jié)果、以及提供轉(zhuǎn)換為將提供給用戶的語音響應(yīng)的基于文本的服務(wù)響應(yīng)。根據(jù)本發(fā)明的另ー個方面,提供一種用于在移動設(shè)備和一個或多個云服務(wù)之間通信的通信系統(tǒng)。該通信系統(tǒng)包括:蜂窩或無線通信系統(tǒng),其在一個或多個基于計算機(jī)的服務(wù)和移動設(shè)備之間執(zhí)行無線通信,其中移動設(shè)備包括處理器、提供到基于計算機(jī)的服務(wù)的接入的通信電路、操作系統(tǒng)、使用該操作系統(tǒng)運(yùn)行并通過通信電路和蜂窩或無線通信系統(tǒng)使用一個或多個基于計算機(jī)的服務(wù)的ー個或多個應(yīng)用程序、以及使用設(shè)備給基于計算機(jī)的服務(wù)提供用戶語音接ロ的移動語音平臺,其中該移動語音平臺包括:至少ー個非瞬態(tài)數(shù)字存儲媒介,其存儲具有計算機(jī)指令的程序模塊,在被處理器執(zhí)行時,所述計算機(jī)指令接收代表已經(jīng)使用自動語音識別處理過的用戶語音的語音識別結(jié)果、基于語音識別結(jié)果確定所需的基于計算機(jī)的服務(wù)、訪問與所需服務(wù)關(guān)聯(lián)的遠(yuǎn)程存儲的服務(wù)接ロ、使用服務(wù)接ロ啟動所需的服務(wù)、從所需服務(wù)接收服務(wù)結(jié)果、以及提供轉(zhuǎn)換為將提供給用戶的語音響應(yīng)的基于文本的服務(wù)響應(yīng)。
在此將聯(lián)系附圖來描述本發(fā)明一個或多個實施例,其中相同的附圖標(biāo)記代表相同的元件,其中:圖1圖示地描繪了根據(jù)本發(fā)明的實施例的用于提供語音用戶接ロ的部分硬件和方法;圖2是一幅框圖,描繪了能夠利用圖1的語音用戶接ロ以及在此公開的方法的通信系統(tǒng)的實施例;圖3是圖1和2中描繪的移動設(shè)備的一些硬件和軟件組件的框圖;圖4描繪了在圖1-3的移動設(shè)備上使用的操作系統(tǒng)和移動語音平臺的分層軟件結(jié)構(gòu)和程序模塊交互;圖5描繪了有關(guān)圖4的應(yīng)用接ロ組中使用的服務(wù)接ロ結(jié)構(gòu)的進(jìn)ー步細(xì)節(jié);圖6是方法的流程圖,該方法可與圖1和2的語音用戶接ロ結(jié)合使用,以向用戶提供完整的免提語音會話;圖7是程序表,顯示了示例語音會話的消息流;圖8包括圖8A和SB,并且是另ー個程序表,顯示了另ー個示例語音會話的消息流;圖9描繪了圖4中示出的分層軟件結(jié)構(gòu)和程序模塊交互的一個替代實施例;以及圖10描繪了圖9的實施例的改進(jìn)實施型式。
具體實施例方式下面描述的系統(tǒng)和方法提供了一種移動語音平臺,其(I)無需與移動電話物理交互就能在車輛乘員和乘員的蜂窩電話或其他移動設(shè)備之間實現(xiàn)免提通信,以及(2)按照ー種方式完成(I),該方式通過移動設(shè)備實現(xiàn)對用戶可用的ー些或所有基于網(wǎng)絡(luò)和其他基于計算機(jī)的服務(wù)的廣泛支持。如此處使用的,“服務(wù)”通常包括給移動設(shè)備用戶提供信息、控制、和/或通信輔助。此外,如此處使用的,被移動設(shè)備使用或者經(jīng)由其接入的服務(wù)包括通過安裝在移動設(shè)備上的應(yīng)用程序提供的服務(wù),以及僅通過與遠(yuǎn)程服務(wù)器通信才可用的基于計算機(jī)的服務(wù)。后者這些基于計算機(jī)的服務(wù)也可以被看作是“云服務(wù)”,并且可以被任何服務(wù)提供者供應(yīng),該服務(wù)提供者擁有在專用或公用網(wǎng)絡(luò)-例如內(nèi)部網(wǎng)或因特網(wǎng)上可用的接入服務(wù)器。圖1描繪了ー個基于語音的用戶接ロ 10的實施例,其可用于以免提方式通過移動設(shè)備向車輛駕駛員提供服務(wù)。如此處使用的,“免堤”指的是,用戶無需與設(shè)備的物理交互或者控制就能使用移動設(shè)備執(zhí)行或者已經(jīng)執(zhí)行了一些或者所有完整的基于語音的會話?!巴耆獾獭敝傅氖怯脩魺o需與設(shè)備的物理交互或者控制就可以使用移動設(shè)備執(zhí)行或者已經(jīng)執(zhí)行了所有完整的基于語音的會話。一些實施例能夠被實現(xiàn)為提供可能需要一些與移動設(shè)備的交互的免提體驗,例如將其置于收聽模式,而其他實施例能夠執(zhí)行成完全免提的,例如當(dāng)移動設(shè)備在用戶的ロ袋、錢包或者公務(wù)包中,而無需與設(shè)備的身體接觸。在所示的實施例中,車輛12的駕駛員與車上已安裝的聲音用戶接ロ 14進(jìn)行語音交互,該接ロ經(jīng)由短程無線連接與駕駛員移動設(shè)備16通信,本例中移動設(shè)備16為ー個蜂窩電話。移動設(shè)備16可以是任何可攜帯的設(shè)備,其能夠使用無論是微處理器還是ー些更簡單或更復(fù)雜的電路來進(jìn)行無線通信和數(shù)字處理。因此,移動設(shè)備包括蜂窩電話、PDA、膝上電腦、筆記本、上網(wǎng)本以及其他個人電子設(shè)備。圖1描繪的蜂窩電話16通常指的是智能電話,假設(shè)它允許用戶向智能電話增加軟件應(yīng)用程序(app),以實現(xiàn)電話之外的功能。電話16包括觸摸屏接ロ、ー個或多個人工按鍵、麥克風(fēng)、揚(yáng)聲器、以及包括微處理器以及儲存了軟件和數(shù)據(jù)的存儲器在內(nèi)的內(nèi)部電路(硬件),以及通信電路,該電路包括至少諸如藍(lán)牙(Bluetooth)和/或WiFi的短程無線通信技術(shù)、然而還有諸如CDMA、GSM的蜂窩芯片的蜂窩通信技術(shù)、或者其他標(biāo)準(zhǔn)化技木。如果期望,移動設(shè)備16的這些不同組件可以是傳統(tǒng)的,因而此處不再單獨(dú)示出或者描述。除了移動設(shè)備硬件之タト,蜂窩電話16還包括移動語音平臺(MobileVoicePlatform, MVP) 18,其包含運(yùn)行在移動設(shè)備上的軟件。如下文將描述的,MVP18包括語音平臺內(nèi)核(Speech Platform Kernel, SPK)20 和應(yīng)用接ロ組(ApplicationlnterfaceSuite, AIS) 22,上述兩者都是程序模塊,包含了計算機(jī)指令,在被設(shè)備的處理器執(zhí)行時,該指令執(zhí)行各自的模塊功能。與在移動設(shè)備本身上提供自動語音處理(Automated SpeechProcessing, ASR)不同,此處使用了遠(yuǎn)程定位(云)語音服務(wù)24,盡管在一些實施例中,在接入或者不接入遠(yuǎn)程定位語音模塊、語法和計算設(shè)施的情況下,ASR可以在移動設(shè)備16上執(zhí)行。移動設(shè)備16還包括操作系統(tǒng)(OS) 26,其提供根一級的功能,包括例如應(yīng)用程序之間的通信機(jī)制以及設(shè)備硬件和運(yùn)行在設(shè)備16上的軟件模塊及應(yīng)用程序之間的輸入/輸出(Input/Output, 10)接ロ連接。在OS的這些硬件接ロ功能中,包括了由設(shè)備使用的通信協(xié)議,以經(jīng)由因特網(wǎng)或其他網(wǎng)絡(luò)與語音服務(wù)24以及其他可用的云服務(wù)28來通信。任何基于計算機(jī)的服務(wù)可以被包括在云服務(wù)28的列表中,然而在圖1中顯示的是對于蜂窩電話的用戶來說最有用的那些服務(wù)中的ー些,例如社會媒體、位置服務(wù)(比如導(dǎo)航)、交通、天氣、新聞、日歷、餐飲和電影。也存在著很多其他服務(wù)??傮w上,使用移動語音平臺18的免提接入服務(wù)將涉及通過移動設(shè)備16執(zhí)行完整的語音會話,而無需與移動設(shè)備有任何實體交互。這廣泛地包括接收來自用戶的語音輸入、從響應(yīng)于語音輸入內(nèi)容的云服務(wù)獲取服務(wù)結(jié)果、以及作為呈現(xiàn)給用戶的語音響應(yīng)而提供服務(wù)結(jié)果。使用圖1的車輛12,駕駛員(用戶)可以與移動設(shè)備交互,以通過聲音接ロ 14執(zhí)行語音會話。這可以包括在車內(nèi)聲音接ロ 14和移動設(shè)備16之間建立短程無線連接,該連接隨后允許聲音接ロ的麥克風(fēng)和揚(yáng)聲器被分別用于從駕駛員或其他乘員接收和向其呈現(xiàn)語音。語音輸入可以在這種短程無線連接上通過諸如Bluetooth或WiFi的數(shù)字通信協(xié)議、作為數(shù)字化語音被發(fā)送。然后數(shù)字化語音輸入可以經(jīng)由蜂窩或者其他無線通信系統(tǒng)從移動設(shè)備16發(fā)送至語音服務(wù)24,以執(zhí)行涉及自動語音識別的語音至文本(Speech-to-Text,STT)服務(wù),或者文本至語音(Text-to-Speech,TTS)服務(wù),該文本至語音服務(wù)提供被合成或者被記錄的語音或部分語音(例如,phenomes),用于生成聲音消息,并且響應(yīng)于語音輸入而提供適當(dāng)?shù)恼Z音。然后,語音識別結(jié)果(例如返回的文本)被SPK20處理,以最終確定合適的(期望的)服務(wù),用于執(zhí)行用戶的請求。如下文將要更詳細(xì)討論的,一旦期望的服務(wù)被確定,則使用由特定服務(wù)所支持的命令和參數(shù)形成服務(wù)請求,該特定服務(wù)使用來自應(yīng)用接ロ組(AIS) 22的一個或多個服務(wù)接ロ而選定。服務(wù)請求被發(fā)送至期望的服務(wù)(已安裝的app,和/或云服務(wù)),并且服務(wù)結(jié)果被接收回來。隨后,服務(wù)結(jié)果被用于生成自然語言語音響應(yīng),即,使用熟知的以及上下文相關(guān)的交談?wù)Z言和句子/分句結(jié)構(gòu)。如下文將要更詳細(xì)討論的,語音響應(yīng)可以是聲音消息,該消息最初作為來自服務(wù)結(jié)果中的信息以及諸如會話變量和上下文相關(guān)內(nèi)容的其他可用信息的文本響應(yīng)而建立。一旦形成文本響應(yīng),其被轉(zhuǎn)換成聲音語音響應(yīng)(例如,聲音消息),并且這可以在移動設(shè)備16本身上或者使用TTS服務(wù)24來完成。然后,聲音消息可以經(jīng)由短程無線連接從移動設(shè)備發(fā)送至聲音用戶接ロ 14,以便通過車輛揚(yáng)聲器呈現(xiàn)給車輛乘員?,F(xiàn)在轉(zhuǎn)至圖2,該圖顯示了操作環(huán)境,該環(huán)境包括移動車輛通信系統(tǒng)100,該系統(tǒng)集成了基于語音的用戶接ロ(Speech-based User Interface, SUI) 10,以及可用于實施此處公開的方法。通信系統(tǒng)100總體上包括車輛12以及它的聲音用戶接ロ 14、移動設(shè)備16、語音服務(wù)24、云服務(wù)28、以及圖1中未示出的一些系統(tǒng)基礎(chǔ)設(shè)施,包括ー個或多個無線載波系統(tǒng)34和陸地通信網(wǎng)絡(luò)36。其他可選的設(shè)備、設(shè)施和系統(tǒng)也可以被包括,例如計算機(jī)37、呼叫中心38、住所或其他固定的局域網(wǎng)絡(luò)設(shè)施39、具有固定天線54和一個或多個衛(wèi)星56的衛(wèi)星通信系統(tǒng)、以及用于導(dǎo)航的GPS衛(wèi)星星座58。應(yīng)當(dāng)理解的是,可以通過任何數(shù)量的不同系統(tǒng)來使用已公開的方法,并且所公開的方法不特別地局限于此處示出的操作環(huán)境。而且,此處未被描述的系統(tǒng)100的組件的架構(gòu)、構(gòu)造、設(shè)置以及操作在現(xiàn)有技術(shù)中通常是已知的。因此,下面的段落僅提供了一個這種通信系統(tǒng)10的簡短概述,然而,此處未示出的其他系統(tǒng)也可以利用所公開的方法。在示出的實施例中,車輛12被描述成運(yùn)動型多用途汽車(SportsUtilityVehicle, SUV),但是應(yīng)當(dāng)理解的是,任何其他包括客車、卡車、摩托車、旅行車(Recreational Vehicle, RV)、海洋船舶、飛機(jī)等的交通工具都可以被使用。圖2—般性地示出了 一些車輛電子設(shè)備29,其包括遠(yuǎn)程信息處理或者電話單元30,該單元通過天線32以及本領(lǐng)域技術(shù)人員知曉的其他電路與載波系統(tǒng)34無線地通信。車輛電子設(shè)備29還包括聲音用戶接ロ 14,其包括用于短程無線通信的天線40、麥克風(fēng)42、一個或多個按鍵或其他控制輸入44、以及ー個或多個揚(yáng)聲器46。其他用戶接ロ組件也可以包括在車輛12中,或者作為聲音用戶接ロ 14的一部分,例如圖像顯示器(未示出)。聲音用戶接ロ 14可以是僅通過天線40通信的基本獨(dú)立的組件集合,或者可以被硬連線或以其他方式連接至車輛電子系統(tǒng)的其他模塊或者其他部分,例如連接至電話單元30和/或車輛總線。這可以允許例如車輛12能夠被編程,從而通過例如降低氣候控制風(fēng)扇速度或保持車輛無線電靜音等來減少語音會話過程中的周圍噪聲。如此處使用的,術(shù)語“聲音用戶接ロ”廣泛地包括適當(dāng)安裝在車輛12中的任意麥克風(fēng)和揚(yáng)聲器,包括硬件和任何軟件組件,它們使車輛用戶能夠與車輛12或者與車輛12中的其他設(shè)備ロ頭地通信,例如移動設(shè)備16。麥克風(fēng)42提供聲音輸入,該輸入可以使用天線40通過短程無線連接被發(fā)送。一個或多個按鍵44允許向聲音用戶接ロ中的人工用戶輸入以開始動作,諸如開始語音會話,在會話中麥克風(fēng)42和揚(yáng)聲器46被用于在車輛中向用戶提供免提服務(wù),從而執(zhí)行無線電話呼叫或接入數(shù)據(jù)、提供遙控或者提供消息和通信服務(wù)。按鍵可以處在對于駕駛員來說便利的位置,例如在方向盤的轂或輻條上。揚(yáng)聲器46可以是專用于聲音用戶接ロ 14的單個揚(yáng)聲器,或者可以與其他組件或系統(tǒng)相集成,例如無線電系統(tǒng)揚(yáng)聲器。在示出的實施例中,電話單元30是不用于執(zhí)行語音用戶接ロ(Sn) 10的操作的可選組件,然而在其他實施例中,其可以被包括以及作為單個功能模塊與聲音用戶接ロ 14集成。電話單元30可以是OEM安裝的(嵌入的)或者安裝在車輛中的配件市場設(shè)備,其通過無線載波系統(tǒng)34并且經(jīng)由無線網(wǎng)絡(luò)實現(xiàn)無線語音和/或數(shù)據(jù)通信。這使得車輛可以與呼叫中心38、其他啟用遠(yuǎn)程信息處理的車輛、或者一些其他實體或設(shè)備來通信。電話單元優(yōu)選地使用無線電傳輸,以便與無線載波系統(tǒng)34建立通信信道(語音信道和/或數(shù)據(jù)信道),從而語音和/或數(shù)據(jù)傳輸能夠通過該信道發(fā)送和接收。通過同時提供語音和數(shù)據(jù)通信,電話単元30使得車輛能夠提供許多不同服務(wù),包括那些有關(guān)導(dǎo)航、電話、緊急求助、診斷、信息娛樂等的。數(shù)據(jù)可以通過數(shù)據(jù)連接被發(fā)送,例如通過在數(shù)據(jù)信道上進(jìn)行的打包數(shù)據(jù)傳輸,或者經(jīng)由語音通道使用現(xiàn)有技術(shù)中已知的技術(shù)傳輸。對于同時涉及語音通信(例如使用呼叫中心38處的實時顧問或語音響應(yīng)單元)和數(shù)據(jù)通信(例如向呼叫中心38提供GPS位置數(shù)據(jù)或車輛診斷數(shù)據(jù))的組合服務(wù),系統(tǒng)可以通過語音信道來使用單個呼叫,并且可以通過語音信道根據(jù)需要在語音和數(shù)據(jù)傳輸之間切換,并且這可以使用本領(lǐng)域技術(shù)人員已知的技術(shù)來完成。對于位置服務(wù),電話単元可擁有自己的GPS電路,或者可以利用其他可用的GPS設(shè)備,例如作為車輛導(dǎo)航系統(tǒng)一部分而安裝在車輛上的GPS設(shè)備,或者使用移動設(shè)備16的GPS設(shè)備。無線載波系統(tǒng)34優(yōu)選地是蜂窩電話系統(tǒng),其包括多個單元發(fā)射塔50 (僅示出一個)、ー個或多個移動交換中心(Mobile Switching Center,MSC) 52、以及將無線載波系統(tǒng)34與陸地網(wǎng)絡(luò)36相連所需的任何其他網(wǎng)絡(luò)組件。每個單元發(fā)射塔50包括發(fā)送和接收天線以及基站,來自不同單元發(fā)射塔的基站直接地或者經(jīng)由諸如基站控制器的中間設(shè)備與MSC52相連。蜂窩系統(tǒng)34可以實施任何適當(dāng)?shù)耐ㄐ偶夹g(shù),包括例如,諸如AMPS的模擬技術(shù)、或者諸如CDMA(例如CDMA2000)或GSM/GPRS的較新的數(shù)字技術(shù)。本領(lǐng)域技術(shù)人員將會理解,各種單元發(fā)射塔/基站/MSC的布置都是可能的,并且可以與無線系統(tǒng)34結(jié)合使用。例如,基站和單元發(fā)射塔可以被共同定位在同一地點(diǎn),或者它們可以相互間在遠(yuǎn)處定位,每個基站可以負(fù)責(zé)單個單元發(fā)射塔,或者單個基站可以服務(wù)各個單元發(fā)射塔,并且各個基站可耦合到單個MSC,所提及的是ー些可能的安排。除了使用無線載波系統(tǒng)34,衛(wèi)星通信形式的不同的無線載波系統(tǒng)可用于提供與車輛的單向或者雙向通信。這可以使用ー個或多個通信衛(wèi)星56和上行連接傳輸站54來完成。單向通信可以是例如衛(wèi)星無線電服務(wù),其中節(jié)目內(nèi)容(新聞、音樂等)通過傳輸站54被接收,為了上載而打包,井隨后發(fā)送至衛(wèi)星52,衛(wèi)星將該節(jié)目廣播至訂戶。雙向通信可以是例如使用衛(wèi)星56的衛(wèi)星電話服務(wù),以在車輛12和站54之間中繼電話通信。如果已經(jīng)使用,則衛(wèi)星電話可作為無線載波系統(tǒng)34的補(bǔ)充或者替代而被使用。陸地網(wǎng)絡(luò)36可以是傳統(tǒng)的陸基電信網(wǎng)絡(luò),其被連接至ー個或多個陸上線路電話,并且將無線載波系統(tǒng)34連接至諸如語音服務(wù)24、云服務(wù)28以及其他計算機(jī)或者服務(wù)器37的事物上,例如位于住所39或其他設(shè)施中的個人計算機(jī)。例如,陸地網(wǎng)絡(luò)36可包括公共交換電話網(wǎng)絡(luò)(Public Switched Telephone Network, PSTN),從而被用于提供硬連線電話、分組交換數(shù)據(jù)通信、以及因特網(wǎng)基礎(chǔ)設(shè)施。陸地網(wǎng)絡(luò)36的ー個或多個部分可以通過使用標(biāo)準(zhǔn)連線網(wǎng)絡(luò)、光纖或者其他光網(wǎng)絡(luò)、有線網(wǎng)絡(luò)、電カ線、諸如無線局域網(wǎng)(Wireless LocalArea Network, WLAN)的其他無線網(wǎng)絡(luò)、或者提供寬帶無線接入(Broadband WirelessAccess,BffA)的網(wǎng)絡(luò)、或者上述網(wǎng)絡(luò)的任意組合來實施。而且,圖2所示的各種語音和云服務(wù)無需通過陸地網(wǎng)絡(luò)36連接,但是可以包括無線電話設(shè)備,從而其可以直接與無線網(wǎng)絡(luò)通信,例如無線載波系統(tǒng)34。計算機(jī)37可以是能夠通過諸如因特網(wǎng)的專用或公用網(wǎng)絡(luò)接入的多種計算機(jī)之一。每個這樣的計算機(jī)37可用于ー個或多個目的,例如一臺網(wǎng)絡(luò)服務(wù)器,其能夠通過聲音用戶接ロ 14/移動設(shè)備16和/或通過電話単元30在無線載波34上被車輛接入。其他這樣可接入的計算機(jī)37可以是例如:服務(wù)中心計算機(jī),其中診斷信息或者其他車輛信息可以通過電話単元30從車輛上載;客戶計算機(jī),其被車輛擁有者或其他遠(yuǎn)程信息處理服務(wù)訂戶使用,用于存取或接收車輛數(shù)據(jù),或者設(shè)置或配置訂戶喜好或控制車輛功能;或者第三方資料檔案庫,可以提供至其或從其提供車輛數(shù)據(jù)或其他信息。計算機(jī)37還可用于提供因特網(wǎng)連接,例如DNS服務(wù),或者作為網(wǎng)絡(luò)地址服務(wù)器,其使用DHCP或其他適當(dāng)?shù)膮f(xié)議來向車輛12和/或移動設(shè)備16分配IP地址。當(dāng)被車輛擁有者作為客戶計算機(jī)37使用時,例如處于住所39內(nèi),則可以使用任何適當(dāng)?shù)亩坛虩o線通信技術(shù)-例如Bluetooth或任何802.11協(xié)議來提供移動設(shè)備16和計算機(jī)37之間的無線連接。如圖2所示,作為ー個云服務(wù)的是呼叫中心38,其可用于向車輛操作者和/或車輛電子設(shè)備29提供多種不同的與車輛相關(guān)的服務(wù)和系統(tǒng)后端功能。這些包括諸如路旁或緊急援助、診斷和維護(hù)支持、娛樂服務(wù)、信息和導(dǎo)航輔助等現(xiàn)有技術(shù)中已知的事物。可以提供這些呼叫中心服務(wù)以通過語音用戶接ロ 10補(bǔ)充對于車輛操作者來說能夠接入的那些服務(wù),或者在操作者使用語音用戶接ロ有困難的情況下作為ー個備選方案。雖然在圖1和2中僅作為示意圖顯示在車輛外面,然而作為語音用戶接ロ 10—部分的移動設(shè)備16的典型使用將涉及移動設(shè)備位于車內(nèi)的情形,例如當(dāng)駕駛員在路面上操作車輛吋。圖3中描繪了移動設(shè)備16的ー些基本功能硬件或者軟件組件。根據(jù)所示的實施例,移動設(shè)備16是一臺智能電話,其依據(jù)GSM和/或CDMA標(biāo)準(zhǔn)來使用蜂窩通信,并因此包括用于語音和數(shù)據(jù)通信的標(biāo)準(zhǔn)蜂窩芯片61和天線62、天線63和64、以及它們各自的與Bluetooth和WiFi無線鏈接相關(guān)的電路、電子處理設(shè)備65、ー個或多個數(shù)字存儲器設(shè)備66以及GPS接收機(jī)67。處理器65可以是能夠處理電子指令的任意一種設(shè)備,包括微處理器、微控制器、主處理器、控制器、車輛通信處理器、以及專用集成電路(ApplicationSpecificIntegrated Circuit, ASIC)。處理器65執(zhí)行各種類型的數(shù)字存儲指令,例如儲存在存儲器66中的軟件或者固件程序。這包括設(shè)備0S26、移動車輛平臺18、以及任何已安裝的app68、所有這些都可以儲存在存儲器66中。GPS模塊67從GPS衛(wèi)星的星座58接收無線電信號。模塊67可以通過這些信號確定移動設(shè)備的位置,該位置用于提供導(dǎo)航和其他位置相關(guān)的服務(wù)。導(dǎo)航信息可以呈現(xiàn)在設(shè)備的顯示器69上,或者通過設(shè)備自身的揚(yáng)聲器(未示出)或通過聲音用戶接ロ 14被ロ頭地呈現(xiàn),例如可以通過提供交互式(turn-by-turn)導(dǎo)航來實現(xiàn)。通常,可以使用在設(shè)備0S26上運(yùn)行的、并與已安裝的app 68接ロ的移動語音平臺18、云服務(wù)28、或者以上兩者來部分地實現(xiàn)語音用戶接ロ 10,以基于它們的語音輸入來執(zhí)行用戶的服務(wù)。圖4和5示出了移動語音平臺以及它與移動設(shè)備16其他組件之間的交互的進(jìn)ー步細(xì)節(jié)。圖4示出了不同的程序模塊,每個模塊都提供計算機(jī)指令,在被處理器65執(zhí)行吋,該指令使用設(shè)備0S26執(zhí)行它們已編程的功能,以與設(shè)備16的不同硬件部分進(jìn)行交互。移動語音平臺18包括語音平臺內(nèi)核(Speech Platform Kernel, SPK) 20以及app接ロ組(AppInterface Suite, AIS) 22。SPK20包括用于啟動服務(wù)呼叫的app啟動程序模塊21,該服務(wù)呼叫從SPK20到設(shè)備上的服務(wù)(例如app 68的其中之一)或者到云(例如云服務(wù)28的其中之一)中的服務(wù)。AIS22包括多個獨(dú)立的應(yīng)用服務(wù)接ロ 23,它們每個都與對移動語音平臺18而言可用的ー個不同服務(wù)相關(guān)聯(lián)。下文是由不同層執(zhí)行的獨(dú)立功能:設(shè)備0S26: 提供與Bluetooth的下層通信以及設(shè)備連接控制 提供移動設(shè)備媒 體播放器功能,用于使聲音文件通過揚(yáng)聲器來播放 提供麥克風(fēng)驅(qū)動的語音識別系統(tǒng),用于將ロ頭語音轉(zhuǎn)換成文本等同物 提供應(yīng)用程序之間的通信機(jī)制語音平臺內(nèi)核20: 管理與車輛12的所有高層Bluetooth集成 提供一致的詞匯表和機(jī)制,用于處理普通的語音交互,例如失敗、重復(fù)(并沒有很理解您)、以及退出 將轉(zhuǎn)換后的語音至文本處理為由app使用的命令結(jié)構(gòu)籲維護(hù)與Bluetooth設(shè)備相關(guān)的高層app偏好,請求管理 提供日志和安全管理 維護(hù)對聲音和麥克風(fēng)信道的控制,包括適當(dāng)時間的聲音焦點(diǎn)和增益水平服務(wù)接ロ 23: 使用標(biāo)準(zhǔn)化的命令/參數(shù)/1/0協(xié)議來與SPK交互籲定義其支持的用于初始化的語法 當(dāng)app激活時定義其支持的語法 處理由SPK20提供的進(jìn)入的語音至文本命令結(jié)構(gòu),以及將它們轉(zhuǎn)換成期望的動作 與云服務(wù)連接,以便發(fā)送和接收處理請求所需的信息
提供任意期望的設(shè)備顯示器69用戶接ロ如圖4所示和上面所指出的,SPK20運(yùn)行在操作系統(tǒng)26的頂端,并且操縱整體控制和路由用于移動語音平臺的消息。根據(jù)上文聯(lián)系圖1討論的以及在圖6-8中示出的方法,SPK20控制語音會話的基本處理流程。在語音會話期間,其中接收來自用戶的輸入(例如請求或者命令),SPK20操縱語音識別結(jié)果的語音處理,該結(jié)果由基于云的自動語音識別(ASR)服務(wù)所返回。這可以使用ASR之后的、使用詞匯表專門設(shè)計的識別語法服務(wù)來完成,該詞匯表為了從語音識別結(jié)果中標(biāo)識出期望的服務(wù)和會話上下文。內(nèi)置在這個功能內(nèi)的是錯誤的處理,以及自然語言響應(yīng)的建立,用于將語音響應(yīng)返回給用戶。會話上下文(例如,導(dǎo)航V.消息V.餐飲預(yù)定)也可在SPK20處使用該第一語法來確定,并且該會話上下文可用于進(jìn)一歩限制SPK20所選的服務(wù)選項,或者輔助語音識別結(jié)果的ASR之后的處理。每ー個語音會話具有至少ー個上下文,即,與用戶語音輸入相關(guān)的至少ー個主題領(lǐng)域。圖1和2所示的不同云服務(wù)指示可以被識別和區(qū)分的不同的會話上下文中的ー些。對于任意語音會話,可以具有ー個主會話上下文和ー個或多個副服務(wù)上下文。例如,餐飲預(yù)定可能激活餐飲會話上下文,其中查找的主消息內(nèi)容包括餐館的標(biāo)識、宴會上的人數(shù)、預(yù)定時間等。但是,它也會激活導(dǎo)航上下文,其中去往餐館的方向被期望提供?;蛘呦⑸舷挛?,其中預(yù)定的通知被分享給其他人。如果合適的話,SPK20不僅確定主會話上下文,而且還確定ー個或多個副會話上下文,并且對于每個上下文都標(biāo)識ー個合適的云或者已安裝服務(wù)。在圖1和2中標(biāo)識的語音服務(wù)可以各種方式來實施,并且在一些實施例中可以被唯一地設(shè)計或者包含設(shè)計為用于支持語音用戶接ロ 10的特定語法或者模型。在其他實施例中,使用了已普及的云ASR服務(wù),即,在其中的ー個中,雖然允許對于語音識別引擎的特定語言模型和其他常規(guī)配置進(jìn)行參數(shù)規(guī)定,然而其卻并不使用為用戶語音會話所期望的會話上下文而定制的語法。來自Google可用的Android語音功能就是已普及的云ASR服務(wù)的ー個例子。一旦SPK20已經(jīng)識別或者已經(jīng)以其他方式確定了期望的服務(wù),它就通過與該服務(wù)相關(guān)聯(lián)的服務(wù)接ロ 23來使用APP Init 21啟動所選服務(wù)。如圖4所示,一些服務(wù)接ロ 23僅僅與云服務(wù)相交互,或者 僅僅與云服務(wù)和設(shè)備用戶接ロ(例如,顯示器69)相交互,然而其它接ロ與已安裝的app (例如app4)交互,這些app本身可以使用操作系統(tǒng)對云服務(wù)的接ロ來接入云服務(wù)。這允許每個服務(wù)接ロ根據(jù)期望執(zhí)行所選的服務(wù),使得例如如果特定的服務(wù)期望使用移動設(shè)備的顯示器69,則服務(wù)接ロ可以定義將被顯示的特定用戶接ロ?,F(xiàn)在轉(zhuǎn)至圖5,該圖示出了服務(wù)接ロ 23的進(jìn)ー步細(xì)節(jié)。每個服務(wù)接ロ 23包括SPK消息結(jié)構(gòu)接ロ,該接ロ遵循由SPK20使用的標(biāo)準(zhǔn)化I/O協(xié)議,用于向服務(wù)接ロ發(fā)送消息。這為與移動語音平臺的交互提供了共同的框架,使得在向SPK20識別呼叫和接收服務(wù)結(jié)果所需的命令和參數(shù)的同時,可以通過創(chuàng)建服務(wù)接ロ來接入新的服務(wù),該新的服務(wù)接ロ符合SPK20 I/O的規(guī)定。服務(wù)接ロ包括命令處理,該命令處理使用特定于服務(wù)的語法來構(gòu)建服務(wù)請求,井隨后通過0S26向云服務(wù)或者已安裝的app發(fā)送該服務(wù)請求。服務(wù)請求通常將包括來自服務(wù)接ロ的任何所需的命令,加上至少一部分已識別的語音結(jié)果(例如,特定的餐館名稱)或相關(guān)數(shù)據(jù)(例如,GPS坐標(biāo))。特定于服務(wù)的語法包括用于初始化和命令服務(wù)的詞匯表,并且對每ー個不同的基于計算機(jī)的服務(wù)通常將是不同的。SPK20的App Init模塊21可以通過與服務(wù)接ロ相同的結(jié)構(gòu)來實現(xiàn),除了它是ー個特殊用途的接ロ,其被SPK20用于聯(lián)系已選定的服務(wù)接ロ來啟動服務(wù)以及傳遞服務(wù)所使用的必需命令和參數(shù)。圖6示出了ー個完整語音會話的流程圖,其可用于提供車輛中駕駛員對于移動設(shè)備的免提或者甚至是完全免提操作。圖7和8提供了完整語音會話的更多的詳細(xì)例子,其中示出了各種模塊間和設(shè)備間的呼叫和順序,以便請求服務(wù)、獲取結(jié)果、以及將其提供給車輛駕駛員,所有這些都通過聲音用戶接ロ 14進(jìn)行。圖9示出了軟件架構(gòu)設(shè)計的ー個替代實施例,其中相同的附圖標(biāo)記代表與圖4中相同的元件。移動語音平臺的這個實施例118類似于圖4,因為其包括第一程序模塊(SPK120)以及第二程序模塊(AIS 122),然而卻使用了単獨(dú)的服務(wù)接ロ 123來定義與服務(wù)接ロ相關(guān)的特定服務(wù)所需的語音流。這使用腳本來完成,該腳本定義了語音識別結(jié)果的處理、向云(基于計算機(jī)的)服務(wù)的呼叫、以及對額外最少必需的信息或者其他期望信息的處理。例如,請求在下午6:00在特定餐館的一個餐飲預(yù)定遺漏了被認(rèn)為是最少必需的信息;即,宴會的人數(shù)。與被請求的餐飲預(yù)定服務(wù)相關(guān)聯(lián)的服務(wù)接ロ 123可包括編程,以確定遺漏的信息以及提供由SPK120所提供的響應(yīng)消息(例如,“您的宴會上有多少人”),用于通過0S26轉(zhuǎn)換成語音并呈現(xiàn)給用戶。服務(wù)接ロ 123的操作可以通過app執(zhí)行引擎125的方式進(jìn)行,該引擎可以為服務(wù)接ロ提供運(yùn)行時的執(zhí)行環(huán)境。SDK(軟件開發(fā)商組件,SDK)-定義的協(xié)議127提供一組標(biāo)準(zhǔn)的或者共同的輸入/輸出標(biāo)簽,或者在SPK120和服務(wù)接ロ 123之間傳遞的數(shù)據(jù)和命令的其他標(biāo)識。這可以例如使用VXML來完成,其中SPK120使用SDK協(xié)議127加標(biāo)簽于已接收的語音識別結(jié)果的単獨(dú)部分,并且在一些實施例中可以將它們轉(zhuǎn)換成更小的詞匯表,該詞匯表至少部分地在服務(wù)接ロ之間分享。例如,“區(qū)域內(nèi)的餐館”作為語音輸入可以分解成被標(biāo)記為期望的服務(wù)或者會話上下文的“餐館”以及被轉(zhuǎn)換(正如這樣的其他普通的位置術(shù)語-“在周國”、“我附近”等)成單個術(shù)語“附近”的“在區(qū)域中”,該術(shù)語被所有的服務(wù)接ロ所支持,對于這些服務(wù)接ロ,位置被用于執(zhí)行服務(wù)。服務(wù)接ロ 123中的一個可以是語音會話聲音流(Speech Session Voice Flow,SSVF) 121,其可以執(zhí)行與圖4的App Init 21相同或相似的功能。因此,當(dāng)開始ー個語音會話時(例如通過用戶直接對移動設(shè)備16的輸入,或者通過車輛中按鍵的按下,其用于經(jīng)由移動設(shè)備16的短程無線通信電路63向移動設(shè)備16發(fā)送信號),SPK120最初可以激活SSVF腳本,該腳本定義了與用戶的語音會話通信的語音流程。例如,它可規(guī)定使用“請說出ー個命令”的聲明來提示用戶,并且隨后可以定義一直基于響應(yīng)所采取的動作,直到標(biāo)識出期望的服務(wù)并且激活了相關(guān)的服務(wù)接ロ。附圖中示出的各種程序模塊可以作為計算機(jī)指令被儲存在移動設(shè)備16上的ー個或多個非瞬態(tài)存儲器66中(例如閃存),在被處理器65執(zhí)行時,該指令執(zhí)行上述功能。在其他實施例中,至少ー些程序模塊可以被遠(yuǎn)程儲存,例如存儲在遠(yuǎn)程服務(wù)器或其他計算機(jī)上并且在需要的時候被訪問。例如,如圖10所示,app接ロ組(AIS) 122可以被儲存在遠(yuǎn)程位置,例如呼叫中心38,或者在一些其他遠(yuǎn)程設(shè)施或計算機(jī)上。然后,當(dāng)SPK120需要任何服務(wù)接ロ時,例如在開始語音會話處的SSVF121,它可以通過蜂窩載波系統(tǒng)34遠(yuǎn)程地訪問服務(wù)接ロ、下載它、并使用app執(zhí)行引擎125在移動設(shè)備16處本地運(yùn)行它。類似地,一旦標(biāo)識出期望的服務(wù),相關(guān)服務(wù)接ロ 123可以被遠(yuǎn)程地訪問,下載至移動設(shè)備,并且再次運(yùn)行以執(zhí)行期望的服務(wù),包括生成用干與特定遠(yuǎn)程的基于計算機(jī)的服務(wù)(例如,通過服務(wù)API)交互所需的服務(wù)請求。服務(wù)接ロ的這種遠(yuǎn)程儲存的優(yōu)點(diǎn)是,它們可以按照期望來被維護(hù)和更新,然而如果它們被正常地儲存在移動設(shè)備上,它們將需要被周期地更新,而這對于ー些移動設(shè)備平臺來說可能毎次需要獲取用戶的同意。通過遠(yuǎn)程儲存,如果對于服務(wù)接ロ做出一個改變(例如因為改善了相關(guān)的服務(wù)),則僅需要更新呼叫中心或者其他遠(yuǎn)程位置處的單個版本,并且在毎次使用該服務(wù)來提供語音命令或者請求的時候,用戶都將接收到最新的版本。這也允許由服務(wù)接ロ定義的語音交互可以按照期望被更新,使得比如如果期望將SSVF121從說出“請說ー個命令”改變至“今天我能幫您做什么? ”,那么這將返回至呼叫中心來完成,再次無需用戶毎次在他們的移動設(shè)備上進(jìn)行軟件更新。應(yīng)該理解的是,前面的內(nèi)容是對本發(fā)明的一個或多個實施例的描述。本發(fā)明并不限于此處公開的特定實施例,而是僅僅由下面的權(quán)利要求限定。此外,前面的描述中所包含的聲明涉及的是特定實施例,并且不應(yīng)解釋為對本發(fā)明的范圍的限制,或者對權(quán)利要求所使用的術(shù)語的定義的限制,除了術(shù)語或者短語在上面被明確地定義。各種其他實施例和對所公開的實施例的各種改變或變更對于本領(lǐng)域技術(shù)人員來說是顯而易見的。所有這些其他實施例、改變和變更將落入所附加權(quán)利要求的范圍之內(nèi)。如在本說明書和權(quán)利要求書中所使用的,術(shù)語“例如”、“比如”、“舉例”、“諸如”以及“像”,以及動詞“包含”、“具有”、“包括”以及它們的其他動詞形式,當(dāng)其與一系列單個或多個組件或其他零件結(jié)合起來使用時,每個都將被解釋成開放式的,意指該列舉不被認(rèn)為是排除了其它的、附加的組件或者零件。其他術(shù)語也應(yīng)被解釋成使用它們最廣泛的合理含義,除非它們用在需要不同解釋的上下文中。
權(quán)利要求
1.一種使用移動設(shè)備給基于計算機(jī)的服務(wù)提供用戶語音接口的移動語音平臺,該移動設(shè)備具有處理器、提供到基于計算機(jī)服務(wù)的接入的通信電路、操作系統(tǒng)、和使用該操作系統(tǒng)運(yùn)行并通過通信電路使用一個或多個基于計算機(jī)的服務(wù)的一個或多個應(yīng)用程序,該移動語音平臺包括: 至少一個非瞬態(tài)數(shù)字存儲媒介,其存儲具有計算機(jī)指令的程序模塊,在被處理器執(zhí)行時,所述計算機(jī)指令接收代表已經(jīng)使用自動語音識別處理過的用戶語音的語音識別結(jié)果、基于語音識別結(jié)果來確定所需的基于計算機(jī)的服務(wù)、訪問與所需服務(wù)關(guān)聯(lián)的遠(yuǎn)程存儲的服務(wù)接口、使用服務(wù)接口啟動所需服務(wù)、從所需服務(wù)接收服務(wù)結(jié)果、以及提供轉(zhuǎn)換為將提供給用戶的語音響應(yīng)的基于文本的服務(wù)響應(yīng)。
2.按權(quán)利要求1所述的移動語音平臺,其中所述程序模塊包括用于通過程序模塊訪問的服務(wù)接口的應(yīng)用程序執(zhí)行引擎。
3.按權(quán)利要求1所述的移動語音平臺,其中所述移動設(shè)備包括具有短程無線通信電路和蜂窩無線通信電路的移動電話,并且其中所述程序模塊通過短程無線通信電路基于發(fā)送到移動設(shè)備的語音來接收語音識別結(jié)果、通過蜂窩無線通信電路訪問服務(wù)接口、以及在通過短程無線通信電路發(fā)送語音響應(yīng)之前發(fā)送轉(zhuǎn)換為語音的基于文本的服務(wù)響應(yīng)。
4.按權(quán)利要求1所述的移動語音平臺 ,其中所述程序模塊用以使用服務(wù)接口、通過與所需的基于計算機(jī)的服務(wù)關(guān)聯(lián)的應(yīng)用程序接口來發(fā)送服務(wù)請求到所需的基于計算機(jī)的服務(wù)。
5.按權(quán)利要求1所述的移動語音平臺,進(jìn)一步包括用于從用戶接收語音的聲音用戶接□。
6.一種用于在移動設(shè)備和一個或多個云服務(wù)之間通信的通信系統(tǒng),包括: 蜂窩或無線通信系統(tǒng),其在一個或多個基于計算機(jī)的服務(wù)和移動設(shè)備之間執(zhí)行無線通信,其中移動設(shè)備包括處理器、提供到基于計算機(jī)的服務(wù)的接入的通信電路、操作系統(tǒng)、使用該操作系統(tǒng)運(yùn)行并通過通信電路和蜂窩或無線通信系統(tǒng)使用一個或多個基于計算機(jī)的服務(wù)的一個或多個應(yīng)用程序、以及使用設(shè)備給基于計算機(jī)的服務(wù)提供用戶語音接口的移動語音平臺,其中該移動語音平臺包括: 至少一個非瞬態(tài)數(shù)字存儲媒介,其存儲具有計算機(jī)指令的程序模塊,在被處理器執(zhí)行時,所述計算機(jī)指令接收代表已經(jīng)使用自動語音識別處理過的用戶語音的語音識別結(jié)果、基于語音識別結(jié)果確定所需的基于計算機(jī)的服務(wù)、訪問與所需服務(wù)關(guān)聯(lián)的遠(yuǎn)程存儲的服務(wù)接口、使用服務(wù)接口啟動所需的服務(wù)、從所需服務(wù)接收服務(wù)結(jié)果、以及提供轉(zhuǎn)換為將提供給用戶的語音響應(yīng)的基于文本的服務(wù)響應(yīng)。
7.按權(quán)利要求6所述的通信系統(tǒng),進(jìn)一步包括用于接收來自用戶的語音的聲音用戶接□。
8.按權(quán)利要求6所述的通信系統(tǒng),其中所述移動語音平臺的程序模塊包括用于通過該程序模塊訪問的服務(wù)接口的應(yīng)用程序執(zhí)行引擎。
9.按權(quán)利要求6所述的通信系統(tǒng),其中所述移動設(shè)備包括具有短程無線通信電路和蜂窩無線通信電路的移動電話,并且其中所述程序模塊通過短程無線通信電路基于發(fā)送到移動設(shè)備的語音來接收語音識別結(jié)果、通過蜂窩無線通信電路訪問服務(wù)接口、以及在通過短程無線通信電路發(fā)送語音響應(yīng)之前發(fā)送轉(zhuǎn)換為語音的基于文本的服務(wù)響應(yīng)。
10.按權(quán)利要求5所述的通信系統(tǒng),其中所述程序模塊用以使用服務(wù)接口、通過與所需的基于計算機(jī)的服務(wù) 關(guān)聯(lián)的應(yīng)用程序接口來發(fā)送服務(wù)請求到所需的基于計算機(jī)的服務(wù)。
全文摘要
一種給基于計算機(jī)的服務(wù)提供用戶語音接口的移動語音平臺包括移動設(shè)備,該移動設(shè)備具有處理器、提供到基于計算機(jī)服務(wù)的接入的通信電路、操作系統(tǒng)、和使用該操作系統(tǒng)運(yùn)行并通過通信電路使用一個或多個基于計算機(jī)的服務(wù)的一個或多個應(yīng)用程序。該移動語音平臺包括至少一個非瞬態(tài)數(shù)字存儲媒介,其存儲具有計算機(jī)指令的程序模塊,在被處理器執(zhí)行時,所述計算機(jī)指令接收代表已經(jīng)使用自動語音識別處理過的用戶語音的語音識別結(jié)果、基于語音識別結(jié)果來確定所需的基于計算機(jī)的服務(wù)、訪問與所需服務(wù)關(guān)聯(lián)的遠(yuǎn)程存儲的服務(wù)接口、使用服務(wù)接口啟動所需服務(wù)、從所需服務(wù)接收服務(wù)結(jié)果、以及提供轉(zhuǎn)換為將提供給用戶的語音響應(yīng)的基于文本的服務(wù)響應(yīng)。
文檔編號H04L29/08GK103095325SQ20121055844
公開日2013年5月8日 申請日期2012年10月19日 優(yōu)先權(quán)日2011年10月21日
發(fā)明者D·R·伯克, D·古羅維奇, D·E·魯曼, K·A·弗里, S·M·麥卡欽, M·T·卡內(nèi)維爾, M·古普塔 申請人:通用汽車環(huán)球科技運(yùn)作有限責(zé)任公司