專利名稱:聲音啟動的網(wǎng)絡(luò)操作的制作方法
聲音啟動的網(wǎng)絡(luò)操作
祖旦 冃眾
便攜式電子設(shè)備諸如膝上型計算機、無線電話、個人數(shù)字助理、無線設(shè)備、 游戲系統(tǒng)和音頻播放機已經(jīng)變得日益普及。用戶可使用一或多個這些設(shè)備進行 各種活動,諸如通過使用電子郵件、即時消息收發(fā)等相互通信。而且,用戶可 使用一或多個這些設(shè)備通過網(wǎng)絡(luò)訪問各種各樣的內(nèi)容。然而,便攜式電子設(shè)備 的緊湊尺寸會妨礙用戶活動。
例如,緊湊的便攜式電子設(shè)備不太適于文本輸入。另外,當(dāng)"忙碌"時, 諸如在駕駛或旅行時,將信息輸入到便攜式電子設(shè)備中是困難的、不安全的和 /或不方便的。
概述
描述操作的聲音啟動,它可用于協(xié)助用戶在諸如其它輸入機制不合乎需 要、不方便或者不能用的時候執(zhí)行操作。用戶向客戶機設(shè)備提供語音。語音被 轉(zhuǎn)換成文本。文本用于執(zhí)行操作和獲得結(jié)果。形成響應(yīng)以將操作的結(jié)果傳輸至 客戶機設(shè)備??捎酶鞣N方法格式化響應(yīng),諸如包括文本以及非文本部分(例如 圖形、音頻等等)。例如,用戶語音可啟動由搜索引擎執(zhí)行的搜索操作。將搜 索結(jié)果提供給用戶。用戶隨后使用該搜索結(jié)果通過附加的語音來啟動進一步的 操作。
提供本概述以簡化形式介紹下面在詳細(xì)描述中進一步描述的一些概念。本 概述不是要標(biāo)識要求保護主題的關(guān)鍵特征或本質(zhì)特征,也不應(yīng)當(dāng)用于幫助確定 要求保護主題的范圍。
附圖簡述
圖1是在示例性實現(xiàn)中可用于使用聲音啟動的操作的技術(shù)的環(huán)境的示圖。
圖2是在示例性實現(xiàn)中更詳細(xì)地示出圖1的示例性客戶機和服務(wù)的系統(tǒng)的示圖。
圖3是描繪在示例性實現(xiàn)中執(zhí)行聲音啟動的操作并且生成響應(yīng)的過程的 流程圖。
圖4是描繪在示例性實現(xiàn)中由語音啟動web搜索的過程的流程圖。 圖5是描繪在另一示例性實現(xiàn)中執(zhí)行聲音啟動的操作并生成響應(yīng)的過程 的流程圖。
圖6是描繪在示例性實現(xiàn)中使用無線一鍵通(PoC)會話用于聲音啟動的 操作的過程的流程圖。
圖7是描繪在示例性實現(xiàn)中利用聲音啟動的搜索的結(jié)果用于其他聲音啟 動的操作的過程的流程圖。
在討論中,在實例中使用相同的標(biāo)號來引用相同的結(jié)構(gòu)與組件。
詳細(xì)描述 概觀
在一些情形中,對計算設(shè)備、手持或移動設(shè)備進行人工輸入(例如用手) 是不方便的、不安全的或者是不可能的。在各種實現(xiàn)中,描述了可用于通過語 音諸如口頭命令或詞語來啟動操作的技術(shù)。
例如,用戶可向客戶機設(shè)備諸如移動電話、計算設(shè)備、便攜式數(shù)字助理 (PDA)等提供語音。隨后將語音轉(zhuǎn)換成文本。轉(zhuǎn)換得到的文本隨后可由服務(wù) 使用來基于轉(zhuǎn)換得到的文本執(zhí)行一或多個操作。構(gòu)想了各種各樣的操作。
例如,可將文本用作搜索項提供給因特網(wǎng)搜索引擎以執(zhí)行搜索。獲得這些 操作的結(jié)果。形成包含這些結(jié)果的響應(yīng),隨后將它提供給用戶的客戶機設(shè)備。 可用各種方法提供響應(yīng),諸如通過電子郵件、超文本標(biāo)記語言(HTML)、即 時消息、聲音等等來提供。例如,響應(yīng)于對最近的餐廳的口頭請求,可向用戶 提供具有地圖和餐廳列表的HTML文檔。在一實現(xiàn)中,可按照客戶機設(shè)備的 位置自動提煉操作。因而,對餐廳的搜索可基于客戶機設(shè)備的位置自動返回五 個最近的餐廳。
在下面的討論中,首先描述了可用于使用各種技術(shù)來提供語音啟動的操作 的示例性環(huán)境,然后描述可用于示例性環(huán)境中以提供語音啟動的操作技術(shù)以及
其它環(huán)境中的示例性過程和用戶界面。 示例性環(huán)境
圖1是在示例性實現(xiàn)中可用于使用聲音啟動的操作技術(shù)的環(huán)境100的示
圖。環(huán)境100例示為包括多個以通信方式耦合至網(wǎng)絡(luò)104的客戶機102(1)、 102(2)、 102(3)...102(N)。在下面討論中的多個客戶機102(1)至102(N)也可被稱 為客戶機102(n)(其中"n"可以是從一到"N"的任何整數(shù))。這多個客戶機 102(n)可用各種方式來配置。例如, 一或多個客戶機102(n)可配置為能夠通過 網(wǎng)絡(luò)104通信的計算機,諸如臺式計算機、移動站、游戲控制臺、娛樂裝置、 以通信方式耦合至顯示設(shè)備的機頂盒、無線電話等等??蛻魴C102(n)也可以是 便攜式電子設(shè)備,諸如膝上型計算機、移動電話102(2)、個人數(shù)字助理(PDA) 102(3)、音頻播放器等等??蛻魴C102(n)可配置為通過無線連接、有線連接等 訪問網(wǎng)絡(luò)104??蛻魴C102(n)的范圍從具有大量存儲器和處理器資源的完全資 源設(shè)備(例如,個人計算機、配有硬盤的電視錄像機、游戲控制臺)到具有有 限存儲器和/或處理資源的低資源設(shè)備(例如,傳統(tǒng)的機頂盒)。在下面的討論 中,客戶機102(n)還可與操作該客戶機的人和/或?qū)嶓w相關(guān)。換言之,客戶機 102(n)可描述包括用戶/機器的邏輯客戶機。
另外,盡管網(wǎng)絡(luò)104被例示為因特網(wǎng),但網(wǎng)絡(luò)可采取多種多樣的配置。例 如,網(wǎng)絡(luò)104可包括廣域網(wǎng)(WAN)、局域網(wǎng)(LAN)、無線網(wǎng)絡(luò)、公共電 話網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)等等。而且,盡管示出單個網(wǎng)絡(luò)104,但網(wǎng)絡(luò)104可配置為包 括多個網(wǎng)絡(luò)。例如,多個客戶機102(n)可通過無線網(wǎng)絡(luò)耦合以相互通信。這些 客戶機中的每一個也可通過因特網(wǎng)以通信方式耦合至圖1所示的多個服務(wù) 106(s)中的一或多個(其中"s"可以是從一至"S"的任何整數(shù))。也構(gòu)想了 各種其它示例。
如圖1所示,客戶機102(n)能夠通過網(wǎng)絡(luò)104訪問多個服務(wù)106(s)。服務(wù) 106(s)可用各種方式來配置。服務(wù)106(s)通常通過網(wǎng)絡(luò)104向客戶機102(n)提供 資源(例如,服務(wù)和內(nèi)容)。資源可配置為各種內(nèi)容,諸如網(wǎng)頁、音樂、視頻、 圖象、用戶論壇、模板、插件、網(wǎng)絡(luò)日志(博客)等等。而且,服務(wù)106(s)可 提供作為諸如即時消息收發(fā)服務(wù)、電子郵件服務(wù)、搜索服務(wù)、在線購物、金融 服務(wù)等服務(wù)的資源??蛻魴C可訪問服務(wù)106(s)以啟動各種活動,諸如通信、搜
索、帳戶訪問、文件管理、消費者活動等等。
多個客戶機102(n)中的每一個例示為包括多個通信模塊108(n)中的相應(yīng)之 一。在例示的實現(xiàn)中,多個通信模塊108(n)中的每一個能在多個客戶機102(n) 中的相應(yīng)之一上執(zhí)行以提供多個客戶機102(n)之間、客戶機102與一或多個服 務(wù)106(s)之間以及諸如此類的通信模式。因而,通信模塊108(n)表示提供給客 戶機102(n)用于通過網(wǎng)絡(luò)104發(fā)送與接收信息、聲音數(shù)據(jù)、消息等等的功能。
例如, 一或多個通信模塊108(n)可配置為發(fā)送與接收電子郵件。電子郵件 使用用于尋址與路由的標(biāo)準(zhǔn)與約定,使得電子郵件可跨網(wǎng)絡(luò)104使用多個設(shè)備 諸如路由器、其它計算設(shè)備(例如電子郵件服務(wù)器)等來傳遞。如此,電子郵 件可在公司內(nèi)通過內(nèi)聯(lián)網(wǎng)傳送,使用因特網(wǎng)在全世界傳送,等等。例如,電子 郵件可包括首部和用戶指定的有效載荷諸如文本與附件,例如文檔、計算機可 執(zhí)行文件等等。首部包含有關(guān)源的技術(shù)信息并且經(jīng)常描述消息從發(fā)送方到接收 方所采取的路線。
通信模塊108(n)也可配置為提供蜂窩網(wǎng)絡(luò)或無線聲音服務(wù)。無線聲音服務(wù) 提供在多個客戶機102(n)和/或客戶機102(n)與服務(wù)106(s)之間傳輸聲音數(shù)據(jù)的 機制。例如,客戶機102(n)可實時或接近實時地將聲音數(shù)據(jù)傳輸至另一客戶機。 因而,多個客戶機102(n)可通過無線網(wǎng)絡(luò)參與對話??蛻魴C102(n)也可將聲音 數(shù)據(jù)傳輸至一或多個服務(wù)106(s)。
而且,通信模塊108(n)可配置為提供無線一鍵通(PoC) (PoC)功能。 PoC是允許在一或多個客戶機102(n)和/或服務(wù)106之間進行接近立即的通信的 雙向通信形式。通信模塊108(n)可提供PoC聯(lián)系人或組的列表,從中選擇以啟 動PoC會話??蛻魴C102(n)可配備有PoC按鈕,在PoC會話期間可壓下該按 鈕以進行交談。在整個PoC會話中,進行接收的聯(lián)系人或組可聽到發(fā)送者的聲 音而無需其做任何動作。因而,PoC與使用"步話機"或內(nèi)部通話設(shè)備相似。 PoC可通過無線聲音網(wǎng)絡(luò)、對等網(wǎng)絡(luò)、因特網(wǎng)等來實現(xiàn)。盡管PoC的名字表示 "蜂窩網(wǎng)絡(luò)(cellular)",但PoC可在以各種方式配置的客戶機102(n)上使用, 包括移動電話、膝上型計算機、手持設(shè)備、臺式計算設(shè)備等等。例如,PoC會 話可通過因特網(wǎng)在臺式計算設(shè)備與服務(wù)106(n)之間建立。
在另一示例中, 一或多個通信模塊108(n)可配置為發(fā)送與接收即時消息。
即時消息收發(fā)提供這樣一種機制在參加即時消息收發(fā)會話時,每一客戶機 102(n)可相互發(fā)送文本消息。即時消息收發(fā)也可提供聲音即時消息收發(fā)功能, 使得聲音數(shù)據(jù)可通過即時消息收發(fā)會話來交換。即時消息一般是實時通信的,
盡管也可使用延遲的傳遞,諸如通過在客戶機102(n)之一不可用例如離線時將 文本消息記入日志。因而,即時消息收發(fā)可視為電子郵件與因特網(wǎng)聊天的組合, 因為即時消息收發(fā)支持消息交換并且被設(shè)計為用于雙向?qū)崨r聊天。因此,即時 消息收發(fā)可用于同步通信。例如,像聲音電話呼叫一樣,即時消息收發(fā)會話可 實時執(zhí)行,使得每一用戶可在收到即時消息時向每一其他用戶響應(yīng)。
盡管描述了PoC、無線聲音服務(wù)、即時消息和電子郵件,但通信模式可采 取各種其它配置而不脫離其本質(zhì)與范圍。而且,單獨的客戶機102(n)(更具體 地是客戶機102(n)的通信模塊)可配置為提供通信模式的各種不同組合,諸如 提供即時消息收發(fā)與無線聲音兩者。
通信模塊108(n)還可提供接收口頭命令和與服務(wù)106(s)通信的功能。圖1 描繪代表使用多個客戶機102(n)中的一或多個的各個用戶的用戶110。用戶110 被示為向客戶機102(1)提供語音112。語音112表示用戶說出的詞語,諸如用 戶IIO可指定要由服務(wù)106(s)執(zhí)行的操作。語音112由客戶機102(1)接收,并 且可由通信模塊108(1)通過網(wǎng)絡(luò)104傳輸至服務(wù)106(s)。如在下面詳細(xì)描述的, 可將語音112作為聲音數(shù)據(jù)或者作為經(jīng)過轉(zhuǎn)換的聲音數(shù)據(jù)(例如文本)傳輸至 服務(wù)106。
每一服務(wù)106(s)各自包括一或多個操作模塊114(s)。操作模塊114(s)表示 可用于執(zhí)行由用戶110的語音112指定的一或多個操作的功能。因而,語音112 可用于啟動由操作模塊114(s)執(zhí)行的操作。操作模塊114(s)還表示格式化響應(yīng) 116(p)的功能,響應(yīng)116(p)包含語音112指定的操作的結(jié)果。操作模塊114(s) 可配置為提供各種操作。可由操作模塊114(s)執(zhí)行的操作包括但不限于搜索、 購買物品、預(yù)訂服務(wù)(例如,餐廳、沙龍、汽車保養(yǎng)等等)、預(yù)訂旅程、訪問 帳戶、訪問內(nèi)容、檢索存儲的內(nèi)容、下載項目等等。
在一實現(xiàn)中,操作模塊114(s)可配置為向客戶機102(n)提供響應(yīng)116(p), 它包括操作模塊114(s)執(zhí)行的操作的結(jié)果。響應(yīng)116(p)可用各種方式配置,諸 如包括各種文本和/或非文本部分(例如,圖形消息、音頻消息等等)。在有關(guān)
圖2的說明中可找到對各種響應(yīng)116(p)的進一步討論。
在一實現(xiàn)中,服務(wù)106(s)可接收語音112作為聲音數(shù)據(jù)。然而,在一些實 例中,操作模塊114(s)可能不理解聲音數(shù)據(jù)以執(zhí)行指定操作。因此,可執(zhí)行轉(zhuǎn) 化。例如,每一服務(wù)106(s)被示為具有相應(yīng)的轉(zhuǎn)化模塊118(s)。轉(zhuǎn)化模塊118(s) 表示在聲音數(shù)據(jù)與文本命令之間進行轉(zhuǎn)化以便由配置為執(zhí)行所需操作的模塊 (諸如服務(wù)106(s)的操作模塊114(s))理解的功能。例如,作為聲音數(shù)據(jù)接收 的語音112可由轉(zhuǎn)化模塊118(s)轉(zhuǎn)換成操作模塊114(s)能理解的文本。操作模 塊114(s)隨后使用經(jīng)過轉(zhuǎn)換的語音(例如文本)來執(zhí)行由語音112指定的操作。 在一實現(xiàn)中,轉(zhuǎn)化模塊118(s)也可配置為將響應(yīng)116(p)轉(zhuǎn)換成聲音數(shù)據(jù)以便傳 輸至客戶機102(n)。
盡管描述了服務(wù)106(s)上轉(zhuǎn)化模塊118(s)的執(zhí)行,但客戶機102(n)也可使 用相似的功能。例如,圖1將每一客戶機102(1)-102(N)示為具有相應(yīng)的轉(zhuǎn)化模 塊118(1)-118(N)。在一實現(xiàn)中,由客戶機102(n)接收的語音112可在客戶機處 轉(zhuǎn)化成文本。服務(wù)106(s),具體是操作模塊114(s),隨后接收操作模塊114(s) 能理解的文本,它指定要執(zhí)行的操作。而且,提供給客戶機102(n)的非聽得見 的響應(yīng)116(p)或其部分可由客戶機102(n)轉(zhuǎn)化成語音。在有關(guān)圖2的說明中可 找到通過轉(zhuǎn)化模塊118進行的聲音數(shù)據(jù)轉(zhuǎn)化的進一步討論。
在一實現(xiàn)中,單個服務(wù)106(s)可執(zhí)行眾多操作。例如,用戶110可提供語 音112,它使得服務(wù)106(s)執(zhí)行對可用內(nèi)容諸如網(wǎng)頁、視頻、音頻等的搜索。 用戶110可能在先前己經(jīng)訂閱或購買了該內(nèi)容,或者可能希望購買該內(nèi)容。內(nèi) 容也可以是由用戶維護的項目,諸如保存在客戶機102(n)可通過網(wǎng)絡(luò)104訪問 的存儲中。搜索生成被提供給客戶機102(n)的列出可用內(nèi)容的搜索結(jié)果。用戶 110隨后可査看可用內(nèi)容并且提供附加的語音112以啟動附加的操作,諸如將 包含在搜索結(jié)果中的內(nèi)容項目通過流傳送至客戶機、下載內(nèi)容、購買內(nèi)容等等。
或者,可組合地使用多個服務(wù)106(s)來執(zhí)行眾多操作。因而,可由相同的 服務(wù)106或另一服務(wù)106(s)來執(zhí)行附加的操作。在另一示例中,用戶UO可使 用語音112來啟動使用多個服務(wù)106(s)之一對旅行選項諸如可用航班的搜索。 然后,在收到搜索結(jié)果之后,用戶110可使用附加的語音來通過多個服務(wù)106(s) 中的另一個服務(wù)啟動預(yù)定搜索結(jié)果中指示的一個特定航班的操作。在關(guān)于圖
3-7的說明中可找到響應(yīng)于語音的操作執(zhí)行的進一步討論。
一般而言,在此描述的任何功能可使用軟件、固件(例如,固化的邏輯電 路)、人工處理或這些實現(xiàn)的組合來實現(xiàn)。本文使用的術(shù)語"模塊"和"邏輯" 一般表示軟件、固件或軟固件的組合。在軟件實現(xiàn)的情形中,模塊、功能或邏
輯表示程序代碼,它在處理器(一或多個CPU)上執(zhí)行時完成指定的任務(wù)。程 序代碼可被存儲在一或多個計算機可讀存儲器設(shè)備中,在關(guān)于圖2的說明中可 找到有關(guān)其的進一步的描述。下面描述的語音技術(shù)的特征是平臺無關(guān)的,意味 著這些技術(shù)可以在具有各種處理器的各種商用計算平臺上實現(xiàn)。
圖2是在示例性實現(xiàn)中更詳細(xì)示出圖1的示例性客戶機102(n)與服務(wù) 106(s)的系統(tǒng)200的示圖。服務(wù)106(s)被例示為由多個服務(wù)器202(a)(其中"a" 可以是從一至"A"的任何整數(shù))實現(xiàn),而客戶機102(n)被例示為客戶機設(shè)備。 服務(wù)器202(a)和客戶機102(n)各自被例示為具有相應(yīng)的處理器204(a)、 206(n) 和相應(yīng)的存儲器208(a)、 210(n)。
處理器不受限于形成它們的材料或者其中使用的處理機制。例如,處理器 可由半導(dǎo)體和/或晶體管(例如,電子集成電路(IC))組成。在這樣一種上下 文中,處理器可執(zhí)行指令可以是能以電子方式執(zhí)行的指令?;蛘?,處理器或用 于處理器的機制,以及計算設(shè)備或用于計算設(shè)備的機制,可包括但不限于,量 子計算、光計算、機械計算(例如使用納米技術(shù))等等。另外,盡管分別為服 務(wù)器202(a)和客戶機102(n)示出單個存儲器208(a)、 210(n),但可使用多種多 樣的存儲器類型和組合,諸如隨機存取存儲器(RAM)、硬盤存儲器、可移動 介質(zhì)存儲器等等。
操作模塊114(a)和轉(zhuǎn)化模塊118(a)被示為在服務(wù)器202(a)的處理器204(a) 上執(zhí)行。自然地,操作模塊114(a)和轉(zhuǎn)化模塊118(a)也可在同一服務(wù)106(s)內(nèi) 的不同的相應(yīng)服務(wù)器202上提供,或者在圖1所示的多個服務(wù)106中的不同服 務(wù)內(nèi)提供。注意,關(guān)聯(lián)于在此描述的各種模塊的功能可進一步組合或劃分而不 脫離其精神與范圍。例如,盡管操作模塊114(a)和轉(zhuǎn)化模塊118(a)被示為分開 的,但其各自的功能可在單個模塊中提供。
轉(zhuǎn)化模塊118(a)還示為具有語音轉(zhuǎn)文本模塊212和文本轉(zhuǎn)語音模塊214。 語音轉(zhuǎn)文本模塊212表示將由客戶機102(2M乍為語音數(shù)據(jù)提供的語音112轉(zhuǎn)化
成操作模塊114(a)可使用以執(zhí)行操作的文本的功能。文本轉(zhuǎn)語音模塊214表示 將操作的結(jié)果(例如響應(yīng)116(p)或其部分)轉(zhuǎn)化成聲音數(shù)據(jù)(例如可聽見的聲 音)的功能。文本轉(zhuǎn)語音模塊214可配置為將實時可聽見的結(jié)果傳輸至客戶機 102(n)?;蛘?,文本轉(zhuǎn)語音模塊214可生成要保存為能讓客戶機102(n)訪問的 音頻記錄諸如聲音郵件、音頻文件等的可聽見的結(jié)果。
在一實現(xiàn)中, 一或多個服務(wù)102(s)可提供聲音啟動的搜索操作。圖2所示 的操作模塊114(a)配置為提供搜索操作。搜索引擎216被示為在操作模塊114(a) 內(nèi)的處理器204(a)上執(zhí)行,并且可存儲在存儲器208(a)中。搜索引擎216可用 于執(zhí)行各種搜索。這些包括但不限于一般的web或因特網(wǎng)、個人桌面、視頻、 音頻、企業(yè)、照片和/或本地搜索。這些搜索可基于作為用戶IIO提供給客戶機 102(n)的語音的關(guān)鍵詞。或者,用戶110的語音112可標(biāo)識向搜索引擎216提 供搜索項的已存儲的搜索。自然地,搜索操作可與單個操作模塊114(a)內(nèi)的其 它操作組合。換言之,配置為提供搜索的操作模塊114(a)不限于提供搜索。
在一實現(xiàn)中,操作模塊114(a)包括響應(yīng)模塊218。響應(yīng)模塊218表示形成 包含由服務(wù)106(s)執(zhí)行的操作的結(jié)果的響應(yīng)116(p)的功能。響應(yīng)116(p)配置為 通過網(wǎng)絡(luò)104被傳輸至客戶機102(n)。或者,可遠程存儲結(jié)果并且可由客戶機 102(n)訪問,或者用戶IIO可通過客戶機102(n)或其它設(shè)備訪問。當(dāng)然,響應(yīng) 116(p)中的結(jié)果可以來自單個操作模塊114(a)、單個服務(wù)106(s)的多個操作、 由多個服務(wù)106(s)組合執(zhí)行的眾多操作的聚合等等。
響應(yīng)116(p)可用各種方式配置。各種響應(yīng)116(p)被示為在服務(wù)器202(a)的 存儲器208(a)內(nèi)的存儲220中。響應(yīng)116(p)可以是組合文本與圖形的圖形響應(yīng)。 因而,響應(yīng)于可聽見的輸入(例如語音112),用戶IIO經(jīng)由客戶機102(n)可 接收其它格式的響應(yīng)116(p),例如非可聽見的響應(yīng)?;蛘?,用戶110可接收組 合了可聽見部分和文本與圖形部分的響應(yīng)。因而,響應(yīng)116(p)可包括文本、圖 形、視頻、音頻等的組合。
例如,如圖2所示,可將響應(yīng)116(p)配置為電子郵件116(1),以及HTML 文檔116(2)、即時消息116(3)、視頻響應(yīng)116(4)、計算機可讀文件116(5)等等。 而且,各種響應(yīng)116(p)可單獨使用,或者相互組合使用。例如,電子郵件和即 時消息116(3)可被同時返回給客戶機102(2)。而且,可形成具有附連的文字處理文件或其它計算機可讀文件116(5)的即時消息116(3)。也構(gòu)想了各種其它組 合。
同樣,可聽見的響應(yīng)116(6)也在圖2中示出,它可單獨使用,或者結(jié)合其 它響應(yīng)116(p)使用??陕犚姷捻憫?yīng)116(6)表示將被提供給客戶機102(n)的要由 客戶機"收聽"的響應(yīng)或部分響應(yīng),例如語音。例如,可響應(yīng)于由語音112啟 動的搜索生成HTML文檔116(2)。 HTML響應(yīng)116(2)被發(fā)送至客戶機102(n)。 另外,文本轉(zhuǎn)語音模塊214可將HTML 116(2)或其部分轉(zhuǎn)換成可聽見的語音并 且返回可聽見的響應(yīng)116(6)。可實時或接近實時地返回可聽見的響應(yīng),例如在 文本轉(zhuǎn)語音模塊214轉(zhuǎn)換HTML文檔的時候。因而,響應(yīng)于可聽見的輸入(例 如語音112),用戶IIO通過客戶機102(n)可接收全部或部分是可聽見的響應(yīng) 116(6)的響應(yīng)116(p)。注意,轉(zhuǎn)化或者可在客戶機102(n)處進行。因而,客戶 機102(n)示為具有相應(yīng)的轉(zhuǎn)化模塊118(n),它可被配置為執(zhí)行文本轉(zhuǎn)語音與語 音轉(zhuǎn)文本轉(zhuǎn)換兩者。
在由搜索引擎216執(zhí)行搜索的情形中,響應(yīng)116可包括搜索結(jié)果222。多 個搜索結(jié)果222(m)被示為在服務(wù)器202(a)的存儲器208(a)內(nèi)的存儲224中。搜 索結(jié)果222(m)可通過搜索引擎216的執(zhí)行來獲得。
操作模塊114(a)可配置為以各種方式提煉搜索結(jié)果222(m)。操作模塊 114(a)可使用有關(guān)客戶機102(n)或用戶110的信息來自動提煉搜索。信息可包 括客戶機102(n)的位置、用戶IIO的概況、關(guān)聯(lián)于用戶IIO的搜索歷史、用戶 IIO的偏好或愛好等等。信息可由客戶機設(shè)備102(n)提供給操作模塊。或者, 服務(wù)106(s)可維護該信息或者諸如從客戶機102(n)、從服務(wù)106(s)的多個服務(wù) 器202(a)之一或從其它服務(wù)檢索該信息。
例如,搜索結(jié)果222(m)可基于進行請求的客戶機102(n)的位置進行過濾。 相應(yīng)地,操作模塊114(a)可配置為確定請求搜索的客戶機102(n)的位置。例如, 客戶機位置可由客戶機102(n)與服務(wù)106(s)之間的通信中提供的標(biāo)識符來確 定。標(biāo)識符可以是關(guān)聯(lián)于客戶機設(shè)備102(n)的標(biāo)識符,與路由該通信的設(shè)備相 關(guān)聯(lián)的標(biāo)識符,等等。在一示例中,操作模塊114(a)可使用標(biāo)識符來確定客戶 機102(n)位于"芝加哥"。因而,響應(yīng)于對餐廳、旅館、方向等的搜索的搜索 結(jié)果222(m)可自動限制于"芝加哥"。也可使用用于確定位置的各種其它技術(shù)。
示例性過程
下面的討論描述可使用先前描述的系統(tǒng)和設(shè)備來實現(xiàn)的聲音啟動的操作。 每一過程的各方面可用硬件、固件或軟件或其組合來實現(xiàn)。這些過程被示為一 組框,這些框指定由一或多個設(shè)備執(zhí)行的操作,并且不必受限于所示的執(zhí)行相 應(yīng)框的操作的順序。在下面討論的各部分中,將參考圖1的環(huán)境100和圖2的
系統(tǒng)200。
圖3描繪其中服務(wù)基于來自客戶機的語音數(shù)據(jù)執(zhí)行操作并且生成響應(yīng)的 過程300。服務(wù)通過網(wǎng)絡(luò)從客戶機接收語音數(shù)據(jù)(框302)。例如,圖l所示 的服務(wù)106(s)可接收作為語音112輸入至客戶機102(1)的聲音數(shù)據(jù)??蛻魴C 102(1)可被配置為連接到網(wǎng)絡(luò)104的移動計算設(shè)備,諸如啟用無線的膝上型計 算機??蓤?zhí)行客戶機102(2)的相應(yīng)通信模塊108(1)以提供客戶機102(2)與服務(wù) 106(1)之間的聲音即時消息收發(fā)會話。因而,語音112可由客戶機102(2)通過 網(wǎng)絡(luò)104經(jīng)由聲音即時消息收發(fā)會話來發(fā)送,而服務(wù)106(s)可接收(例如,"收 聽")語音112。
執(zhí)行轉(zhuǎn)化模塊118(s)以將語音數(shù)據(jù)轉(zhuǎn)化成文本串(框304)。例如,在上 例中收到的語音112可被轉(zhuǎn)化成文本306??蓤?zhí)行圖1所示的轉(zhuǎn)化模塊118(s) 以轉(zhuǎn)換語音112。語音112可指定簡單的命令諸如"1"、"食物"、"運行"、 "買"等等,或者語音112可以是短語或語句,例如"找意大利餐廳"。因而, 轉(zhuǎn)化模塊118(s)將語音112轉(zhuǎn)化成指令、命令、項等形式的文本306,它可由 服務(wù)106(s)用于啟動一或多個操作。
文本被提供給操作模塊,后者使用該文本來執(zhí)行操作并獲得結(jié)果(框 308)。繼續(xù)該示例,現(xiàn)在假設(shè)文本306是命令,例如"買項目2"。圖1的操 作模塊114(s)接收文本306。操作模塊114(s)可配置為使用文本306來執(zhí)行購 買操作。例如,服務(wù)106(s)可能先前已經(jīng)在聲音即時消息收發(fā)會話期間、通過 電子郵件、因特網(wǎng)等向用戶IIO提供了銷售項目的列表。用戶IIO在審閱列表 之后決定買列表中的項目2。用戶IIO通過客戶機102(1)(例如無線膝上型計 算機)將短語"買項目2"作為語音提供給客戶機102(1)以啟動對所需項目的 購買。
操作模塊114(s)接收作為文本306的經(jīng)過轉(zhuǎn)化的命令并且啟動購買操作。
獲得操作310的結(jié)果。例如,此例的結(jié)果可以是完成的交易、收據(jù)、購買信息 的提示等等。應(yīng)當(dāng)注意,操作模塊可啟動由服務(wù)106(S)或圖1所示的任何一或
多個服務(wù)106(s)執(zhí)行的購買序列。因而,服務(wù)106(s)可配置為處理整個操作, 或配置為啟動可遠程(例如不在特定的服務(wù)106(s)內(nèi))執(zhí)行的操作并獲得結(jié)果。 自然地,可響應(yīng)于語音U2執(zhí)行如前所述的各種操作。
操作模塊生成用于傳輸至客戶機的包含結(jié)果的響應(yīng)(框312)。在上面的 示例中,操作模塊114(s)形成響應(yīng)116(p),它包含購買操作的命令例如"買項 目2"的結(jié)果310。結(jié)果310例如可以是購買確認(rèn)。可形成包含確認(rèn)的文本即 時消息。包含確認(rèn)的即時消息可通過客戶機102(1)與服務(wù)106(s)之間的即時消 息收發(fā)會話來傳輸。因而,響應(yīng)于聲音購買命令,用戶IIO接收確認(rèn)購買所需 項目的文本即時消息響應(yīng)。具有不同的輸入與響應(yīng)模式的能力在這樣一些的情 形中是合乎需要的難以在某些客戶機設(shè)備上形成文本或圖形請求,或者在一 些時候要閱讀文本或圖形響應(yīng)。因而,通過口頭輸入請求并以不同或多種模式 (例如,文本、圖形、音頻等)來接收響應(yīng)的能力在某些情形中對于某些用戶 是有利的。
在另一示例中,操作模塊可形成可聽見的響應(yīng)。例如,帶有購買確認(rèn)的文 本即時消息可通過轉(zhuǎn)化模塊118(s)從文本轉(zhuǎn)換成語音。可實時傳輸經(jīng)過轉(zhuǎn)化的 確認(rèn),例如通過聲音即時消息收發(fā)會話,使得向用戶IIO提供對購買的可聽見 的確認(rèn)。經(jīng)過轉(zhuǎn)化的響應(yīng)可以是合成的語音、錄制的語音等等。可在其它響應(yīng) 之外或代替其它響應(yīng)提供該可聽見的響應(yīng)。如前所述,在某些時候,可聽見的 響應(yīng)對于用戶而言可能更方便或更安全,諸如在"忙碌"、駕駛等同時。
在另一情形中,可連同簡單的可聽見的響應(yīng)一起提供圖形響應(yīng),諸如帶有 購買確認(rèn)的文本即時消息。例如,可提供簡短的可聽見的響應(yīng),諸如"已完成"、 "成功"、"結(jié)果已發(fā)送"或"再試"。轉(zhuǎn)化模塊118(s)可配置為形成簡短的 可聽見的響應(yīng)。在此情形中,向用戶IIO提供對所需購買的可聽見確認(rèn)與文本 確認(rèn)兩者。也構(gòu)想了響應(yīng)模式的各種其它組合,包括電子郵件、即時消息、圖 像、視頻、音頻、文件、HTML文檔等中的一或多個。
圖4描繪其中使用語音在服務(wù)處啟動搜索的示例性過程400。作為語音接 收的搜索項被傳輸至服務(wù)以啟動web搜索(框402)。例如,圖2所示的用戶
110可通過配置為移動電話的客戶機設(shè)備102(n)啟動搜索。相應(yīng)地,通信模塊 108(n)可配置為通過網(wǎng)絡(luò)104提供無線聲音服務(wù),且因而客戶機102(n)可將聲 音數(shù)據(jù)傳輸至一或多個服務(wù)106(s)。在此例中,配置為移動電話的客戶機設(shè)備 102(n)的用戶IIO正在伊利諾伊州芝加哥市旅行,并且想要吃意大利菜。用戶 110可使用移動電話呼叫圖2的服務(wù)106(s),例如該服務(wù)被配置為提供搜索服 務(wù)。用戶IIO啟動與該服務(wù)的交互,諸如通過撥打號碼、從聯(lián)系人列表選擇服 務(wù)106(s)等等(例如聲音激活的撥號)。
因而在服務(wù)106(s)與客戶機設(shè)備102(n)之間啟動無線聲音呼叫。用戶110 向客戶機設(shè)備102(n)(移動電話)提供語音112以啟動搜索。語音112可包括 搜索項諸如"意大利餐廳芝加哥"??蛻魴C設(shè)備102(n)將搜索項(例如語音112) 傳輸至服務(wù)106(s)??蓪⒄Z音112轉(zhuǎn)化成文本。服務(wù)106(s)隨后可將文本項提 供給搜索引擎216以啟動web搜索。
從服務(wù)接收包含web搜索的結(jié)果的響應(yīng)(框404)。在上一示例中,例如, 服務(wù)106(s)可獲得作為由口頭項"意大利餐廳芝加哥"啟動的web搜索的結(jié)果 的意大利餐廳的列表。服務(wù)106(s),更具體的是響應(yīng)模塊218形成響應(yīng)116(p), 它包括意大利餐廳列表。響應(yīng)可以是一個簡單列表,諸如餐廳的電子郵件列表。 響應(yīng)也可具有文本與圖形的組合(例如圖形響應(yīng)),諸如具有餐廳列表、芝加 哥地圖以及所列餐廳在地圖上所在位置指示的HTML文檔。客戶機102(2)從服 務(wù)106(s)接收隨后可由用戶IIO使用的響應(yīng)。也構(gòu)想了組合文本、圖形、音頻 等的各種其它響應(yīng)116(p)。
在一實現(xiàn)中,服務(wù)106(s)可配置為以各種方式提煉搜索或搜索結(jié)果。上例 中的服務(wù)106(s)可使用由服務(wù)106(s)確定的客戶機102(n)的位置來自動提煉搜 索。例如,服務(wù)106(s)可確定無線聲音呼叫源自芝加哥,或者客戶機設(shè)備102(n) 當(dāng)前在芝加哥。在此情形中,可簡化用于啟動搜索的語音112。用戶110不用 說"意大利餐廳芝加哥",而是說"意大利餐廳"?;谟煞?wù)106(s)確定的 客戶機位置,自動提煉該搜索。因而,響應(yīng)于作為語音輸入至客戶機設(shè)備102(n) 的搜索項"意大利餐廳",用戶可接收在其當(dāng)前位置或靠近該位置(在此例中 為芝加哥)的意大利餐廳的搜索結(jié)果。
圖5描繪形成包含由聲音啟動的操作的結(jié)果的響應(yīng)的示例性過程500。執(zhí)
行由在客戶機處作為語音接收的聲音數(shù)據(jù)指定的操作(框502)。現(xiàn)在假設(shè)圖
1所示的用戶UO想要使用手持計算設(shè)備諸如圖1所示的個人數(shù)字助理(PDA) 102(3)來傳送文件。文件可以是任何計算機可讀文件,諸如演示、文本文檔、 音頻記錄等等。在此情形中,用戶想要與一或多個伙伴共享文件"file.txt"。 該文件可實際位于PDA102(3)上,或在用戶IIO能通過網(wǎng)絡(luò)104、對等網(wǎng)絡(luò)等 訪問的遠程存儲中。在此例中,用戶110可使用聲音來啟動從PDA102(3)或從 遠程位置至另一位置,諸如至該一或多個伙伴能訪問的網(wǎng)絡(luò)存儲的文件傳送。 用戶110使用PDA 102(3)通過網(wǎng)絡(luò)104將語音112傳輸至服務(wù)106(s)。例如, 用戶IIO可說出命令或者短語諸如"傳送,file.txt",這由PDA作為語音112 接收。語音112指定的操作被傳輸至服務(wù)106(s)。在一實現(xiàn)中,語音112是作 為聲音數(shù)據(jù)來傳輸?shù)?。語音112可被轉(zhuǎn)化成操作模塊114(s)能理解的指令,后 者隨后執(zhí)行指定的操作。例如,轉(zhuǎn)化模塊118(s)可將語音112從語音轉(zhuǎn)化成文 本指令。或者,客戶機102諸如PDA102(3)可配置為將聲音數(shù)據(jù)轉(zhuǎn)換成文本以 便傳輸至服務(wù)106(s)。包括在PDA 102(3)上的轉(zhuǎn)化模塊U8(n)執(zhí)行將語音112 從語音至文本的轉(zhuǎn)化,且隨后將文本指令發(fā)送至服務(wù)106(s)。
服務(wù)106(s)執(zhí)行由語音112指定的操作。例如,可執(zhí)行操作模塊114(s)以 在PDA102(3)與網(wǎng)絡(luò)存儲位置之間傳送文件"file.txt"。如此,用戶110可將 文件移動至其他人(例如, 一或多個伙伴)可訪問該文件的位置。當(dāng)然,也可 按另一方向傳送文件,例如,從服務(wù)102(s)或其它網(wǎng)絡(luò)存儲至PDA 102(3)。
形成響應(yīng)以便至客戶機,響應(yīng)包括操作的結(jié)果(框504)。在上例中,結(jié) 果可指示文件傳送是否成功。例如,可形成可聽見的響應(yīng)116(p),它說"已完 成"。響應(yīng)116(p)也可以是文本消息、HTML消息等,它提供傳送位置中的文 件的列表。也可形成響應(yīng)116(p)的組合,諸如確認(rèn)該傳送的即時消息連同諸如 "成功"的可聽見的響應(yīng)??蓤?zhí)行轉(zhuǎn)化模塊118(s)以向PDA 102(3)提供實時語 音響應(yīng)。
自然地,可使用該過程來執(zhí)行各種其它操作,諸如檢索文件、發(fā)送消息、 訪問帳戶、購買項目、將文件通過電子郵件發(fā)送至一或多個接收者、在遠程計 算設(shè)備上啟動可執(zhí)行指令等等。
圖6描繪其中使用無線一鍵通(PoC)來執(zhí)行聲音啟動的操作的示例性過
程600。建立無線一鍵通(PoC)會話(框602)。例如,圖2所示的客戶機設(shè) 備102(n)可配置為啟用PoC的移動電話。移動電話客戶機102(n)可維護PoC 聯(lián)系人的列表。 一或多個服務(wù)106(s)可以是PoC聯(lián)系人。假設(shè)用戶IIO想要來 自服務(wù)106(s)的內(nèi)容。服務(wù)106(s)可配置為通過網(wǎng)絡(luò)104提供各種內(nèi)容,諸如 音頻、視頻、網(wǎng)頁等等。在此情形中,用戶110從服務(wù)106(s)搜尋音頻內(nèi)容。 用戶選擇PoC聯(lián)系人并啟動PoC會話。例如,用戶可從聯(lián)系人中選擇服務(wù)106(s) 并且擊打PoC按鈕以啟動會話。在移動電話客戶機102(n)與服務(wù)106(s)之間建 立PoC會話。服務(wù)106(s)可通過PoC會話立即"收聽"到來自移動電話客戶機 102(n)的語音。
通過PoC會話從客戶機接收語音數(shù)據(jù)(框604)。例如,圖2的用戶110 向移動電話客戶機102(n)提供語音112,它通過PoC會話在服務(wù)106(s)處可被 即時(或接近即時)聽到。語音112可以是對所需音頻內(nèi)容的請求。例如,用 戶語音112可包括歌曲標(biāo)題、藝術(shù)家、播放列表、位置等。
將語音數(shù)據(jù)轉(zhuǎn)換成文本(框606)。繼續(xù)上例,對所需音頻內(nèi)容的請求可 能不能直接被服務(wù)106(s)理解,具體是不能被將啟動所需操作的操作模塊114(a) 理解。因此,可將請求從語音轉(zhuǎn)換成文本,例如,轉(zhuǎn)換成操作模塊114(a)能理 解的指令。如圖2所示,轉(zhuǎn)化模塊118(a)可在服務(wù)106(s)的處理器204(a)上執(zhí) 行以將收到的語音112轉(zhuǎn)換成文本。在此例中,可生成提供用于啟動檢索語音 112中指定的音頻內(nèi)容的指令的文本。
使用該文本執(zhí)行操作(框608)。例如,可將由轉(zhuǎn)化模塊118(a)生成的文 本(例如,指令)提供給操作模塊114(a),后者使用該文本來執(zhí)行操作,在此 情形中為檢索音頻內(nèi)容??蓮母鞣N位置檢索所需的音頻內(nèi)容,包括從服務(wù)器 202(a)、從服務(wù)106(s)的多個服務(wù)器202之一或者從另一服務(wù)106或能通過網(wǎng) 絡(luò)104訪問的遠程位置來檢索所需的音頻內(nèi)容。
形成包含操作的結(jié)果的響應(yīng)以便傳輸至客戶機(框610)。例如,可形成 配置為HTML文檔的響應(yīng)116(p),它提供至所選音頻內(nèi)容的超鏈接。在收到響 應(yīng)116(p)時,用戶IIO可使用該超鏈接來訪問內(nèi)容??赏ㄟ^流傳送或非流傳送 的方式提供內(nèi)容。響應(yīng)116(p)也可包括返回所需內(nèi)容本身。例如,響應(yīng)116(p) 可用非流傳送方式將音頻文件單獨地或者連同諸如即時消息收發(fā)、電子郵件等
的圖形響應(yīng)一起提供給移動電話客戶機102(n)。
在一實現(xiàn)中,可使用已建立的PoC會話將可聽見的響應(yīng)傳輸至客戶機。
例如,可聽見的響應(yīng)可指示所需內(nèi)容可用或不可用、指示發(fā)送了圖形響應(yīng)、內(nèi)
容可用的位置等等。因而,圖2的響應(yīng)模塊218可用于形成響應(yīng)116(p)。響應(yīng) 可通過轉(zhuǎn)化模塊118(a)從文本轉(zhuǎn)化成語音。轉(zhuǎn)化的結(jié)果可通過PoC會話實時發(fā) 送至移動電話客戶機102(n)。在另一實現(xiàn)中,可通過該PoC會話或另一 PoC 會話將所需音頻內(nèi)容流傳送至客戶機。通過PoC的可聽見的響應(yīng)可以是除其它 響應(yīng)模式之外,或者代替其它響應(yīng)模式的響應(yīng)。例如,可用如前所述的各種組 合形成即時消息、HTML、文本、電子郵件和可聽見的響應(yīng)。
圖7描繪其中利用聲音啟動的搜索的結(jié)果來執(zhí)行附加的聲音啟動的操作 的過程700。使用在客戶機處作為語音輸入的項來執(zhí)行搜索(框702)。例如, 用戶110可能希望進行預(yù)定,諸如預(yù)定航班。用戶110可使用圖l所示的客戶 機設(shè)備102(n)之一通過網(wǎng)絡(luò)104與配置為提供預(yù)定的服務(wù)106(s)通信。用戶110 可提供語音U2以啟動對可用航班的搜索。例如,如果用戶希望找出四月1日 在俄勒岡州波特蘭市與伊利諾伊州芝加哥市之間的航班,則用戶iio可提供具 有搜索項諸如"航班,PDX至ORD,四月1日"的語音112??稍诜?wù)106(s) 上執(zhí)行搜索引擎216以執(zhí)行由語音112指定的搜索。可向搜索引擎216提供由 轉(zhuǎn)化模塊118(a)從對語音112的轉(zhuǎn)化所生成的文本搜索項。盡管轉(zhuǎn)化模塊118(a) 被示為在與搜索引擎216相同的服務(wù)器上,但轉(zhuǎn)化也可在不同的服務(wù)器202上 執(zhí)行、由客戶機102的轉(zhuǎn)化模塊118執(zhí)行等等。
將搜索的結(jié)果傳輸至客戶機(框704)。響應(yīng)于上面的航班搜索示例,用 戶110可接收響應(yīng)116(p),它包括四月l在俄勒岡州波特蘭市與伊利諾伊州芝 加哥市之間的五個航班的列表。響應(yīng)可用先前描述的任何各種方法來格式化, 諸如HTML文檔、即時消息、電子郵件等等。
基于與搜索結(jié)果和作為語音對客戶機的輸入相關(guān)聯(lián)的指令執(zhí)行附加的操 作(框706)。上例的用戶IIO接收并查看搜索的結(jié)果,其中例如包括五個可 能的航班。用戶IIO現(xiàn)在可能希望預(yù)定這些航班之一。因而,用戶可提供與搜 索結(jié)果相關(guān)的附加的語音112。例如,附加的用戶語音112可指示"預(yù)定航班 99",它對應(yīng)于在搜索結(jié)果中列出的航班中的一個。在一實現(xiàn)中,還可向用戶 提示如何使用搜索結(jié)果來啟動進一步的操作。例如,在搜索結(jié)果中的項目l可 指示"要預(yù)定該航班就說預(yù)定1"。由附加的語音112指定的操作被傳輸至 服務(wù)102(S)。該服務(wù)可以是與執(zhí)行搜索相同的服務(wù)102(S),或者是不同的服務(wù)
102。服務(wù)隨后執(zhí)行與先前提供的搜索結(jié)果相關(guān)的附加操作。
因而,可利用由語音啟動的搜索的結(jié)果來執(zhí)行由語音啟動的附加操作。自 然地,可使用利用語音啟動的搜索結(jié)果來執(zhí)行各種操作,諸如文件傳送、文件 檢索、購買交易、行程預(yù)定、旅館和餐廳預(yù)定等等。附加操作也可以是進一步 的搜索或者對搜索結(jié)果的提煉。
總結(jié)
盡管已經(jīng)用專用于結(jié)構(gòu)特征和/或方法動作的語言描述了本發(fā)明,但要理 解,所附權(quán)利要求書定義的本發(fā)明不必受限于所述的這些特定特征或動作。相 反,這些特定特征和動作是作為實現(xiàn)要求保護的本發(fā)明的示例性形式而被公開 的。
權(quán)利要求
1.一種方法,包括轉(zhuǎn)化通過網(wǎng)絡(luò)接收的聲音命令;執(zhí)行所述經(jīng)過轉(zhuǎn)化的命令以形成圖形響應(yīng);以及形成包含所述圖形響應(yīng)的通信以便通過所述網(wǎng)絡(luò)傳輸至所述聲音命令的發(fā)送者。
2. 如權(quán)利要求1所述的方法,其特征在于,所述圖形響應(yīng)是電子郵件。
3. 如權(quán)利要求1所述的方法,其特征在于,所述圖形響應(yīng)是超文本標(biāo)記語 言(HTML)文檔。
4. 如權(quán)利要求1所述的方法,其特征在于,所述圖形響應(yīng)是即時消息。
5. 如權(quán)利要求1所述的方法,其特征在于,所述聲音命令是通過無線一鍵 通(PoC)會話接收的。
6. 如權(quán)利要求1所述的方法,其特征在于,所述聲音命令是從手持客戶機 設(shè)備接收的。
7. 如權(quán)利要求1所述的方法,其特征在于,所述聲音命令是通過聲音即時 消息收發(fā)會話接收的。
8. 如權(quán)利要求1所述的方法,其特征在于,所述聲音命令指定要執(zhí)行的選 自以下的至少一個操作搜索;金融交易;購買交易;文件傳送;預(yù)定;以及下載。
9. 一種方法,包括執(zhí)行由在客戶機處作為語音接收的聲音數(shù)據(jù)指定的搜索;以及 形成包括搜索結(jié)果的響應(yīng),以便通過網(wǎng)絡(luò)傳輸至發(fā)起所述聲音數(shù)據(jù)的客戶機。
10. 如權(quán)利要求9所述的方法,其特征在于,還包括將所述聲音數(shù)據(jù)轉(zhuǎn)換 成文本搜索項。
11. 如權(quán)利要求9所述的方法,其特征在于,所述經(jīng)過轉(zhuǎn)換的聲音數(shù)據(jù)是執(zhí)行所述搜索的模塊能理解的,而所述聲音數(shù)據(jù)是所述模塊不能理解的。
12. 如權(quán)利要求9所述的方法,其特征在于,所述響應(yīng)包含選自以下的一 或多項電子郵件;文本;html文檔;即時消息;圖像;以及可聽見的聲音。
13. 如權(quán)利要求9所述的方法,其特征在于,基于所述客戶機的位置自動 提煉所述搜索結(jié)果。
14. 如權(quán)利要求9所述的方法,其特征在于,還包括將所述搜索結(jié)果從文 本轉(zhuǎn)換成可聽見的響應(yīng)。
15. 如權(quán)利要求9所述的方法,其特征在于,所述響應(yīng)是實時可聽見的響應(yīng)。
16. 如權(quán)利要求9所述的方法,其特征在于,還包括基于與所述搜索結(jié)果 和作為語音對客戶機的輸入相關(guān)聯(lián)的附加聲音數(shù)據(jù)執(zhí)行操作。
17. —或多個包括計算機可執(zhí)行指令的計算機可讀介質(zhì),在計算機上執(zhí)行 所述計算機可執(zhí)行指令時,指示所述計算機將通過移動設(shè)備輸入的聲音數(shù)據(jù)轉(zhuǎn) 換成文本搜索串以輸入到因特網(wǎng)搜索引擎。
18. 如權(quán)利要求17所述的一或多個介質(zhì),其特征在于,所述聲音數(shù)據(jù)是通 過無線一鍵通(PoC)會話傳輸至所述因特網(wǎng)搜索引擎的。
19. 如權(quán)利要求17所述的一或多個介質(zhì),其特征在于,還包括向所述聲音 數(shù)據(jù)的發(fā)送者提供搜索結(jié)果的指令。
20. 如權(quán)利要求18所述的一或多個介質(zhì),其特征在于,提供給所述發(fā)送者 的所述搜索結(jié)果是不可聽見的。
全文摘要
本文提供聲音啟動的網(wǎng)絡(luò)操作的實施例。
文檔編號G06F17/00GK101341482SQ200680048127
公開日2009年1月7日 申請日期2006年11月17日 優(yōu)先權(quán)日2005年12月22日
發(fā)明者A·拉瑪克里什納, J·J·奧斯特倫德, Q·米勒 申請人:微軟公司