亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

對話創(chuàng)作和執(zhí)行架構(gòu)的制作方法

文檔序號:6569254閱讀:177來源:國知局
專利名稱:對話創(chuàng)作和執(zhí)行架構(gòu)的制作方法
對話創(chuàng)作和執(zhí)行架構(gòu)
扭旦 H足
僅為了一般的背景信息而提供以下討論,它并非旨在用于協(xié)助確定所要求 保護的主題的范圍。
可以在計算機網(wǎng)絡(luò)上使用來自各種各樣行業(yè)的遠程應(yīng)用。例如,應(yīng)用包括
諸如呼叫路由和顧客帳戶/個人信息訪問等聯(lián)絡(luò)中心自助服務(wù)應(yīng)用。有可能有其 它聯(lián)絡(luò)中心應(yīng)用,包括旅行預(yù)定、金融和證券應(yīng)用程序以及顧客關(guān)系管理。此 外,信息技術(shù)組能夠受益于在例如銷售和現(xiàn)場服務(wù)自動化、電子商務(wù)、自動話 務(wù)員、幫助臺口令重置應(yīng)用以及啟用語音的網(wǎng)絡(luò)管理的領(lǐng)域中的應(yīng)用。
傳統(tǒng)的顧客服務(wù)通常是通過接聽電話和回答顧客詢問的若干個人工代理 操縱的呼叫中心處理的。目前,這些呼叫中心中的許多通過采用雙音多頻
(DTMF)和自動語音識別(ASR)技術(shù)的組合的基于電話的交互式語音響應(yīng) (IVR)系統(tǒng)來自動操作。此外,從以往的基于電話的系統(tǒng)將顧客服務(wù)擴展到 基于即時消息傳遞(IM)和電子郵件的系統(tǒng)。這些不同的通道向最終顧客提供 了額外的選擇,由此增加了總體的顧客滿意度。由于為每一個通道使用不同的 工具,在這些各個通道上顧客服務(wù)的自動化目前是困難的。
概述
提供本概述以便用簡化的形式介紹將在以下詳細描述中進一步描述的一 些概念。本概述并不旨在確定所要求保護的主題的關(guān)鍵或必要特征,也不旨在 用于幫助確定所要求保護的主題的范圍。
在通信體系結(jié)構(gòu)中使用一種用于創(chuàng)作和執(zhí)行對話應(yīng)用程序的架構(gòu)。該應(yīng)用 程序可以與多個不同模式的通信一起使用。由對話應(yīng)用程序處理的消息被用于 確定對話狀態(tài)并提供相關(guān)聯(lián)的響應(yīng)。
附圖簡述

圖1是示例性移動設(shè)備的正視圖。 圖2是圖1的移動設(shè)備的功能組件的框圖。
圖3是示例性電話的正視圖。
圖4是一般計算環(huán)境的框圖。
圖5是用于處理通信消息的通信體系結(jié)構(gòu)的框圖。
圖6是多個對話狀態(tài)的圖示。
圖7是用戶界面中各個組件的框圖。
圖8是用于處理通信消息的方法的流程圖。
詳細描述
在描述用于處理通信消息的代理及其實現(xiàn)方法之前,一般地描述可以在通 信體系結(jié)構(gòu)中運行的計算設(shè)備會是有用的。可以在各個計算設(shè)置中使用這些設(shè) 備以便在計算機網(wǎng)絡(luò)上使用代理。例如,設(shè)備可以使用包括文本和語音的不同 形式的自然語言輸入來與代理交互。以下討論的設(shè)備僅是示例性的,并不旨在 限制此處所描述的主題。
在圖1中示出了數(shù)據(jù)管理移動設(shè)備30的示例性形式。移動設(shè)備30包括外 殼32并具有包括顯示器34的用戶界面,所述顯示器34結(jié)合指示筆33使用觸 敏顯示屏幕。指示筆33用于在指定的坐標處按下或接觸顯示器34來選擇區(qū)域、 選擇性地移動光標的開始位置、或者諸如通過手勢或手寫等其他方式提供命令 信息?;蛘呋虼送?,可以在設(shè)備30上包括用于導(dǎo)航的一個或多個按鈕35。此 外,也可以提供諸如可旋轉(zhuǎn)滾輪、滾筒或類似的其他輸入機制。另一種輸入形 式可以包括諸如通過計算機顯示的視覺輸入。
現(xiàn)在參考圖2,框圖示出了包括移動設(shè)備30的功能組件。中央處理器 (CPU) 50實現(xiàn)軟件控制功能。CPU 50耦合到顯示器34使得依照控制軟件生 成的文本和圖形圖標出現(xiàn)在顯示器34上。揚聲器43可以耦合到CPU 50,該 CPU 50通常帶有數(shù)模轉(zhuǎn)換器59用于提供聽覺輸出。
下載或由用戶輸入到移動設(shè)備30的數(shù)據(jù)存儲在非易失性讀/寫隨機存取存 儲器存儲54中,該存儲雙向地耦合到CPU 50上。隨機存取存儲器(RAM) 54提供對由CPU50執(zhí)行的指令的易失性存儲,以及對諸如寄存器值等臨時數(shù)據(jù)的存儲。配置選項和其他變量的默認值存儲在只讀存儲器(ROM) 58中。 ROM 58也可用于存儲設(shè)備的操作系統(tǒng)軟件,操作系統(tǒng)軟件用于控制移動設(shè)備 30的基本功能以及其他操作系統(tǒng)內(nèi)核功能(例如將軟件組件載入到RAM 54 中)。
RAM 54以類似于用PC上于存儲應(yīng)用程序的硬盤驅(qū)動器的功能的方式用 作代碼的存儲。應(yīng)該注意雖然非易失性存儲器用于存儲代碼,但是替換地它可 以存儲在并非用于代碼執(zhí)行的易失性存儲器中。
無線信號可以由移動設(shè)備通過耦合到CPU 50的無線收發(fā)機52來發(fā)送/接 收,所述無線收發(fā)機52耦合到CPU 50上。也可以提供可選的通信接口 60, 它用于按需從計算機(例如臺式計算機)或從有線網(wǎng)絡(luò)直接下載數(shù)據(jù)。相應(yīng)地, 接口 60可以包括各種形式的通信設(shè)備,例如紅外線鏈接、調(diào)制解調(diào)器、網(wǎng)卡 等。
移動設(shè)備30包括話筒29、模數(shù)(A/D)轉(zhuǎn)換器37以及存儲在存儲54中 的可選的識別程序(語音、DTMF、手寫、手勢或計算機顯示)。作為示例, 響應(yīng)來自設(shè)備30的用戶的聽覺信息、指令或命令,話筒29提供語音信號,它 由A/D轉(zhuǎn)換器37數(shù)字化。語音識別程序可以對經(jīng)數(shù)字化的語音信號執(zhí)行標準 化和/或特征提取功能,用于獲取中間的語音識別結(jié)果。
使用無線收發(fā)機52或通信接口 60,語音數(shù)據(jù)或其他數(shù)據(jù)可以被遠程地發(fā) 送,例如發(fā)送給代理。當(dāng)發(fā)送語音數(shù)據(jù)時,可以使用遠程語音服務(wù)器??梢詫?識別結(jié)果返回給移動設(shè)備30,用于在其上呈現(xiàn)(例如視覺和/或聽覺),并最 終傳送給代理,其中代理和移動設(shè)備30基于通信消息交互。
類似的處理可用于其他形式的輸入。例如,手寫輸入可以用在設(shè)備30上 的預(yù)處理來數(shù)字化或可無需設(shè)備30上的預(yù)處理即可數(shù)字化。如同語音數(shù)據(jù), 這種形式的輸入可以發(fā)送給服務(wù)器以供識別,其中識別結(jié)果被返回給設(shè)備30 和/或遠程代理中的至少一個。同樣地,DTMF數(shù)據(jù)、手勢數(shù)據(jù)和視覺數(shù)據(jù)可 以作類似的處理。取決于輸入的形式,設(shè)備30 (以及以下討論的其他形式的客 戶機)將包括諸如照相機等必要的硬件用于視覺輸入。
圖3是便攜式電話80的示例性實施例的平面圖。電話80包括顯示器82 和鍵區(qū)84。 一般地,圖2的框圖適用于圖3的電話,雖然可能需要執(zhí)行其他功能所必需的附加電路。例如,對于圖2的實施例將需要作為電話運作所必需的 收發(fā)器;然而,這種電路與本發(fā)明是無關(guān)的。
代理也可用于許多其他通用或?qū)S糜嬎阆到y(tǒng)、環(huán)境或配置。適用于本發(fā)明 的公知的計算系統(tǒng)、環(huán)境和/或配置的示例包括,但不局限于,常規(guī)電話(沒有 任何屏幕)、個人計算機、服務(wù)器計算機、手持式或膝上型設(shè)備、多處理器系 統(tǒng)、基于微處理器的系統(tǒng)、機頂盒、可編程消費電子設(shè)備、射頻標識(RFID) 設(shè)備、網(wǎng)絡(luò)PC、小型機、大型機、包括任何上述系統(tǒng)或設(shè)備的分布式計算環(huán) 境等。
以下是對圖4所示的通用計算機120的簡要描述。然而,計算機120也僅 是合適的計算環(huán)境的一個示例,并非旨在對本發(fā)明的使用范圍和功能提出任何 限制。計算機120也不應(yīng)被解釋為對其中所示的組件的任何一個或組合具有任 何依賴或要求。
可以在由計算機執(zhí)行的諸如程序模塊的計算機可執(zhí)行指令的一般語境中 描述本發(fā)明。 一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型 的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等。本發(fā)明也可以在分布式計算環(huán)境中 實現(xiàn),其中由通過通信網(wǎng)絡(luò)鏈接的遠程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán) 境中,程序模塊可以同時位于包括存儲器存儲設(shè)備的本地和遠程計算機存儲介 質(zhì)中。借助附圖,以下描述了程序和模塊執(zhí)行的任務(wù)。本領(lǐng)域的技術(shù)人員可以 將描述和附圖實現(xiàn)為處理器可執(zhí)行指令,所述指令可以編寫在任何形式的計算 機可讀介質(zhì)上。
參照圖4,計算機120的組件可包括,但不局限于,處理單元140、系統(tǒng) 存儲器150以及將包括系統(tǒng)存儲器在內(nèi)的各種系統(tǒng)組件耦合到處理單元140的 系統(tǒng)總線141。系統(tǒng)總線141可能是若干類型的總線結(jié)構(gòu)中的任何一種,包括 存儲器總線或存儲器控制器、外圍總線、以及使用多種總線體系結(jié)構(gòu)的任一種 的局部總線。作為示例,而非限制,這些體系結(jié)構(gòu)包括工業(yè)標準體系結(jié)構(gòu)(ISA) 總線、通用串行總線(USB)、微信道體系結(jié)構(gòu)(MCA)總線、增強型ISA(EISA) 總線、視頻電子標準協(xié)會(VESA)局部總線和外圍部件互連(PCI)總線(也 稱為Mezzanine總線)。計算機120通常包括各種計算機可讀介質(zhì)。計算機可 讀介質(zhì)可以是能被計算機120訪問的任何可用介質(zhì),并包括易失性和非易失性介質(zhì)、可移動和不可移動介質(zhì)。作為示例,而非限制,計算機可讀介質(zhì)可包括 計算機存儲介質(zhì)和通信介質(zhì)。計算機存儲介質(zhì)包括以任何方法或技術(shù)實現(xiàn)、用 于存儲諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)等信息的易失性 和非易失性介質(zhì)、可移動和不可移動介質(zhì)。計算機存儲介質(zhì)包括但不局限于
RAM、 ROM、 EEPROM、閃存或其它存儲器技術(shù)、CD-ROM、數(shù)字多功能盤 (DVD)或其它光盤存儲器、磁盒、磁帶、磁盤存儲器或其它磁性存儲設(shè)備、 或任何其它可用于存儲所需信息并可由計算機120訪問的介質(zhì)。
通信介質(zhì)通常在諸如載波或其它傳輸機制的己調(diào)制數(shù)據(jù)信號中體現(xiàn)為計 算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊、或其它數(shù)據(jù),且包括任何信息輸送介質(zhì)。 術(shù)語"已調(diào)制數(shù)據(jù)信號"意指以在信號中編碼信息的方式設(shè)置或改變其一個或 多個特征的信號。作為示例,而非限制,通信介質(zhì)包括諸如有線網(wǎng)絡(luò)或直線連 接的有線介質(zhì),和諸如聲學(xué)、射頻(RF)、紅外線和其它無線介質(zhì)的無線介質(zhì)。 以上任何介質(zhì)的組合也應(yīng)包括在計算機可讀介質(zhì)的范圍中。
系統(tǒng)存儲器150包括諸如只讀存儲器(ROM) 151和隨機存取存儲器 (RAM) 152的易失性和/或非易失性存儲器形式的計算機存儲介質(zhì)。包含有 助于如啟動時在計算機120內(nèi)元件間傳送信息的基本例程的基本輸入/輸出系 統(tǒng)(BIOS) 153通常存儲在ROM 151中。RAM 152通常包含處理單元140可 立即訪問和/或當(dāng)時正在操作的數(shù)據(jù)和/或程序模塊。作為示例,而非限制,圖 4示出了操作系統(tǒng)154、應(yīng)用程序155、其它程序模塊156、和程序數(shù)據(jù)157。
計算機120還可包括其它可移動/不可移動、易失性/非易失性計算機存儲 介質(zhì)。僅作為示例,圖4示出了讀取和寫入不可移動、非易失性磁性介質(zhì)的硬 盤驅(qū)動器161,讀取和寫入可移動、非易失性磁盤172的磁盤驅(qū)動器171,讀 取和寫入可移動、非易失性光盤176,諸如CD-ROM或其它光學(xué)介質(zhì)的光盤驅(qū) 動器175。其它也在示例性操作環(huán)境中使用的可移動/不可移動、易失性/非易 失性計算機存儲介質(zhì)包括,但不局限于磁帶盒、閃存卡、數(shù)字化多功能光盤、 數(shù)字化錄像帶、固態(tài)RAM、固態(tài)ROM等等。硬盤驅(qū)動器161通常通過諸如 接口 160的不可移動存儲器接口連接至系統(tǒng)總線141,而磁盤驅(qū)動器171和光 盤驅(qū)動器175通常通過諸如接口 170的可移動存儲器接口連接至系統(tǒng)總線141 。
如上所述并如圖4所示的驅(qū)動器及其相關(guān)聯(lián)的計算機存儲介質(zhì)為計算機120提供了對計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊、和其它數(shù)據(jù)的存儲。在 圖4中,例如,硬盤驅(qū)動器161被示為存儲操作系統(tǒng)164、應(yīng)用程序165、其 它程序模塊166、和程序數(shù)據(jù)167。注意這些組件可以與操作系統(tǒng)154、應(yīng)用程 序155、其它程序模塊156、和程序數(shù)據(jù)157相同或不同。在此給予操作系統(tǒng) 164、應(yīng)用程序165、其它程序模塊166、和程序數(shù)據(jù)167的不同編號說明至少 它們是不同的副本。
用戶可通過諸如鍵盤182、話筒183、以及諸如鼠標、跟蹤球或觸摸板等 的定點設(shè)備181的輸入設(shè)備向計算機120輸入命令和信息。其它輸入裝置(未 示出)可包括操縱桿、游戲手柄、圓盤式衛(wèi)星天線、掃描儀等等。這些和其它 輸入設(shè)備常常通過耦合至系統(tǒng)總線的用戶輸入接口 180連接至處理單元140相 連,但也可通過諸如并行端口、游戲端口或通用串行總線(USB)的其它接口 和總線結(jié)構(gòu)連接。監(jiān)視器184或其它類型的顯示設(shè)備也可通過諸如視頻接口 185的接口連接至系統(tǒng)總線141。除監(jiān)視器以外,計算機還可包括諸如話筒187 和打印機186的其它外圍輸出設(shè)備,它們通過輸出外圍接口 188連接。
計算機120可以在使用與一臺或多臺遠程計算機,諸如遠程計算機194 的邏輯連接的網(wǎng)絡(luò)化環(huán)境中運行。遠程計算機194可以是個人計算機、手持式 設(shè)備、服務(wù)器、路由器、網(wǎng)絡(luò)PC、對等設(shè)備或其它公共網(wǎng)絡(luò)節(jié)點,而且通常 包括以上相對于個人計算機120描述的許多或全部組件。圖4中所描繪的邏輯 連接包括局域網(wǎng)(LAN) 191和廣域網(wǎng)(WAN) 193,但也可包括其它網(wǎng)絡(luò)。這樣 的網(wǎng)絡(luò)化環(huán)境在辦公室、企業(yè)范圍計算機網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)和因特網(wǎng)上是常見的。
當(dāng)用于LAN網(wǎng)絡(luò)化環(huán)境中時,計算機120通過網(wǎng)絡(luò)接口或適配器l卯連 接至LAN191。當(dāng)用于WAN網(wǎng)絡(luò)化環(huán)境中時,計算機120通常包括調(diào)制解調(diào) 器192或其它用于在諸如因特網(wǎng)的廣域網(wǎng)193中建立通信的裝置??梢允莾?nèi)置 式或外置式的調(diào)制解調(diào)器192可通過用戶輸入接口 180或其它適當(dāng)機制連接至 系統(tǒng)總線141。在網(wǎng)絡(luò)化環(huán)境中,相對于計算機120描述的程序模塊或其一部 分可存儲在遠程存儲器存儲設(shè)備中。作為示例,而非限制,圖4示出了駐留于 遠程計算機194中的遠程應(yīng)用程序195。應(yīng)當(dāng)理解,所示網(wǎng)絡(luò)連接是示例性的, 且也可以使用其它用于在計算機間建立通信鏈接的手段。
通常,應(yīng)用程序155可以通過用戶輸入接口 180來經(jīng)由命令行或圖形用戶界面(GUI)與用戶交互。然而,為了簡化和擴展計算機系統(tǒng)的使用,開發(fā)了 能夠接收來自用戶的自然語言輸入的輸入。相比自然語言或語音,圖形用戶界 面是精確的。設(shè)計良好的圖形用戶界面通常不會產(chǎn)生不明確的引用或需要底層 應(yīng)用程序確認通過界面180接收到的輸入的特定解釋。例如,由于界面是精確 的,因此通常無需就輸入進一步詢問用戶,例如"你是否點擊了'OK'按鈕?"。 通常,為圖形用戶界面設(shè)計的對象模型在其實現(xiàn)上是非常機械化且嚴格的。
相比來自圖形用戶界面的輸入,自然語言查詢或命令經(jīng)常被翻譯成對輸入 對象模型的一系列而非僅一個函數(shù)調(diào)用。相對于傳統(tǒng)的行輸入或圖形用戶界面 的嚴格的、機械化的限制,自然語言是其中人類對話者依靠彼此的智能、通常 在無意中解決歧義性的通信手段。實際上,自然語言被視為"自然",正是因 為它不是機械的。人類對話者可以基于上下文信息和有關(guān)話語周圍的多個范圍 的提示來解決歧義性。對于人類對話者,句子"Forward the minutes to those in the review meeting on Friday (將會議記錄轉(zhuǎn)發(fā)給參加周五評審會議的人)"是無 需任何進一步的解釋可以完全理解的句子。然而,從機器的機械化角度看,必 須指定諸如確切地是指哪個文檔和哪個會議以及確切地應(yīng)該將文檔發(fā)送給哪 些人的特定細節(jié)。
圖5示出了具有代理202的示例性通信體系結(jié)構(gòu)200。代理202從發(fā)起者 接收通信請求和/或消息,并基于請求和/或消息執(zhí)行任務(wù)。消息可以被路由到 目的地。發(fā)起者可以包括連接到代理202的個人、設(shè)備、電話、遠程個人信息 管理器等。來自發(fā)起者的消息可以采用包括實時語音(例如來自簡單電話或通 過因特網(wǎng)voip源)、實時文本(諸如即時消息傳遞)、非實時語音(例如語音 郵件消息)以及非實時文本(例如通過短消息服務(wù)(SMS)或電子郵件)的許 多形式。任務(wù)可以由代理202例如響應(yīng)于由發(fā)起者發(fā)送的顧客服務(wù)查詢自動地 執(zhí)行。
在一個實施例中,代理202可以在諸如上述計算機120等通用計算機上實 現(xiàn)。代理202表示用戶對話應(yīng)用程序的單個聯(lián)絡(luò)點。由此,如果希望與對話應(yīng) 用程序交互,那么通信請求和消息是通過代理202處理的。這樣,無需使用特 定的設(shè)備來聯(lián)系代理202。僅需要通過任何期望的設(shè)備聯(lián)系代理202,所述期 望設(shè)備處理和路由傳入的通信請求和消息。通信請求或消息的發(fā)起者可以通過多種不同的通信模式聯(lián)系代理202。 一 般地,可以通過以下途徑訪問代理202:通過諸如移動設(shè)備30 (此處也表示具 有基于輸入形式所要求的顯示屏、話筒、照相機、觸敏面板等其他形式的計算 設(shè)備)等客戶機,或通過其中使通信可被聽見的電話80,或通過響應(yīng)于按下按 鍵而由電話80生成的音調(diào)且其中可以將來自代理202的信息聽覺地提供回用 戶。
然而更重要的是,代理202是統(tǒng)一的,無論信息是通過設(shè)備30還是電話 80獲取的,代理202均可支持任一種操作模式。代理202可以在操作上耦合到 多個接口以便接收通信消息。由此,代理202可以基于設(shè)備的通信模式將響應(yīng) 提供給不同類型的設(shè)備。
IP接口 204使用分組交換技術(shù),例如使用TCP/IP (傳輸控制協(xié)議/因特網(wǎng) 協(xié)議)來接收和發(fā)送信息。使用因特網(wǎng)協(xié)議的計算機設(shè)備通信由此可以與IP 接口 204連接。
POTS (簡易老式電話系統(tǒng),也稱為簡易老式電話服務(wù))接口 206可以與 任何類型的線路交換系統(tǒng)連接,包括公用交換電話網(wǎng)(PSTN)、專用網(wǎng)絡(luò)(例 如公司專用交換機(PBX))和/或其組合。由此,POTS接口 206可以包括FXO 接口 (外部交換局)接口和FXS (外部交換站)接口,用于使用線路交換技術(shù) 接收信息。
IP接口 204和POTS接口 206可以體現(xiàn)在諸如模擬電話適配器(ATA) 等單個設(shè)備中。可以使用可以在計算機和POTS之間連接并傳輸音頻數(shù)據(jù)的其 他設(shè)備,諸如使用電話應(yīng)用程序接口 (TAPI)將POTS連接到計算機的"語音 調(diào)制解調(diào)器"。
如圖5中所示,設(shè)備30和代理202通過網(wǎng)絡(luò)208被共同連接到此處諸如 因特網(wǎng)等廣域網(wǎng),并且可分別尋址。因此客戶機30和代理202不必在物理上 位于鄰近彼此的位置??蛻魴C30可以使用特定的協(xié)議將數(shù)據(jù),例如語音、文 本和視頻數(shù)據(jù)發(fā)送給IP接口 204。在一個實施例中,客戶機30和IP接口204 之間的通信使用標準化的協(xié)議,例如帶有RTP的SIP (帶有實時傳輸協(xié)議的會 話發(fā)起者協(xié)議)、兩個因特網(wǎng)工程工作小組(IETF)標準。
通過電話80訪問代理202包括將電話80連接到有線或無線電話網(wǎng)絡(luò)210,所述有線或無線電話網(wǎng)絡(luò)210又通過FXO接口將電話80連接到代理202。或 者,電話80可以通過FXS接口直接連接到代理202,所述FXS接口是POTS 接口 206的一部分。
IP接口 204和POTS接口 206都通過通信應(yīng)用程序編程接口 (API) 212 連接到代理202。通信API 212的一種實現(xiàn)是由華盛頓州雷德蒙市的微軟公司 開發(fā)的微軟實時通信(RTC)客戶機API。通信API212的另一實現(xiàn)是計算機 支持的電信體系結(jié)構(gòu)(ECMA-269/ISO 18051)艮卩CSTA (—種ISO/ECMA標 準)。通信API212可以有助于多模式通信應(yīng)用,包括用于在兩臺計算機、兩 個電話以及一個電話和一個計算機之間的通信的應(yīng)用。通信API 212也可以支 持音頻和視頻呼叫、基于文本的消息傳遞以及應(yīng)用程序共享。由此,代理202 能夠發(fā)起到客戶機30和/或電話80的通信。
代理202也包括對話執(zhí)行模塊214、自然語言處理單元216、對話狀態(tài)218 和提示220。對話執(zhí)行模塊214包括處理來自通信API 212的通信請求和消息 的邏輯并基于對話狀態(tài)218來執(zhí)行任務(wù)。這些任務(wù)可以包括發(fā)送來自提示220 的一提示。
對話執(zhí)行模塊214使用自然語言處理單元216來執(zhí)行各種自然語言處理任 務(wù)。自然語言處理單元216包括用于標識用戶輸入中的特征的識別引擎。語音 的識別特征通常是口語中的單詞,而手寫的識別特征通常對應(yīng)于用戶筆跡中的 筆劃。在一個特定的示例中,諸如文法等語言模型可用于識別語音話語中的文 本。如所知的,也可以為視覺輸入提供識別。
對話執(zhí)行模塊214可以使用由自然語言處理單元216識別出的對象來從對 話狀態(tài)218確定期望的對話狀態(tài)。對話執(zhí)行模塊214也訪問提示220,以便基 于用戶輸入給人提供輸出。對話狀態(tài)218可以作為要由對話執(zhí)行模塊214訪問 的一個或多個文件來存儲。提示220可以被集成到對話狀態(tài)218中或與對話狀 態(tài)218分開存儲和訪問。提示也可以作為文本、音頻和/或視頻數(shù)據(jù)來存儲,其 基于來自用戶的請求經(jīng)由通信API212發(fā)送給用戶,例如,初始提示可以包括 "歡迎來到Acme公司幫助中心,請問我有什么可以幫您的?"基于用戶通信 的模式來發(fā)送提示。如果用戶使用電話連接到代理202,則可以通過電話聽覺 地播放提示。如果用戶發(fā)送電子郵件消息,那么代理202可以使用電子郵件消息來響應(yīng)。
在運作中,對話執(zhí)行模塊214翻譯從用戶處接收到的通信消息,以便遍歷 過包括多個對話狀態(tài),例如對話狀態(tài)218的對話。在一個實施例中,對話可以 被配置成具有用于回答來自用戶的問題的提示的幫助中心。對話狀態(tài)218可以 被存儲為要由對話執(zhí)行模塊214訪問的文件??梢元毩⒂谟脩粲脕碓L問代理 202的特定通信模塊來創(chuàng)作對話。由此,對話執(zhí)行模塊214可以包括用于訪問 對話狀態(tài)218的應(yīng)用程序編程接口 (API)。
圖6是包括多個對話狀態(tài)的示例性對話300的圖示。每個狀態(tài)由圓圈表示, 箭頭表示兩個狀態(tài)之間的轉(zhuǎn)移。對話300包括初始狀態(tài)302和結(jié)束狀態(tài)304。 在由代理202接收到通信消息之后,對話300被啟動并且從狀態(tài)302開始。狀 態(tài)302可以包括要執(zhí)行的一個或多個進程或任務(wù)。例如對話狀態(tài)302可以包括 要播放和/或發(fā)送給用戶的歡迎提示。在初始狀態(tài)302之后,可以接收進一步的 通信消息?;诮邮盏降耐ㄐ畔?,對話300移動到下一狀態(tài)。例如,對話300 可以轉(zhuǎn)移到狀態(tài)306、狀態(tài)308等。這些對話的每一個可以包括與用戶進行對 話的相關(guān)聯(lián)的任務(wù)和提示。這些狀態(tài)也包括到對話300中其他狀態(tài)的轉(zhuǎn)移。最 終,遍歷對話300直至達到結(jié)束狀態(tài)304。
圖7是允許人們創(chuàng)作對話,例如對話300的用戶接口的組件的框圖。接口 使人能創(chuàng)建基于狀態(tài)的對話。在一個實施例中,接口允許使用流程圖編制工具 來創(chuàng)建對話。工具使人能創(chuàng)建對話狀態(tài)以及與對話狀態(tài)相關(guān)聯(lián)的各種屬性。例 如,人們可以指定任務(wù)320、提示322、文法324以及對話狀態(tài)302的下一對 話狀態(tài)326。
任務(wù)320包括為對話狀態(tài)302運行的一個或多個進程。提示322包括可以 經(jīng)由通信API212發(fā)送的文本、音頻和/或視頻數(shù)據(jù)。文法324使得創(chuàng)作者能表 達將驅(qū)使自對話狀態(tài)302的狀態(tài)改變的自然語言輸入。例如,文法324可以是 上下文無關(guān)的文法、n元文法、混合或其他。也可以指定跟隨對話狀態(tài)302的 下一對話狀態(tài)326,在該例中為對話狀態(tài)306和308。對話狀態(tài)306和308可 以包括它們自己指定的任務(wù)、提示、文法和下一對話狀態(tài)。
圖8是由對話執(zhí)行模塊214執(zhí)行的方法350的流程圖。在步驟352處,接 收到通信消息。接著,在步驟354處,基于接收到的消息確定通信模式。例如,模式可以是電子郵件消息、即時消息或經(jīng)由電話系統(tǒng)的連接。在步驟356處, 分析通信消息以便確定對話的下一對話狀態(tài)。該步驟可以包括對話執(zhí)行模塊
214訪問自然語言處理單元216的標識消息中的語義信息。語義信息可以與文 法一起使用以確定下一對話狀態(tài)。在步驟358處,執(zhí)行與對話狀態(tài)相關(guān)聯(lián)的任 務(wù)。接著在步驟360處基于對話狀態(tài)和通信模式來發(fā)送通信消息。例如,消息 可以包括與對話狀態(tài)相關(guān)聯(lián)的一個或多個提示。在步驟362處,確定對話是否 處于結(jié)束狀態(tài)。如果對話不處于結(jié)束狀態(tài),那么方法350會進入步驟352,以 便等待進一步的通信消息。如果到達了結(jié)束狀態(tài),那么方法350在步驟364處 結(jié)束。
由此可以實現(xiàn)跨通道獨立于通信模式創(chuàng)作對話的架構(gòu)。對話執(zhí)行模塊可以 通過各種通信通道與用戶通信。對話可以由對話執(zhí)行模塊訪問,使得對話執(zhí)行 模塊可以發(fā)起和進行對話,而不管用戶期望的通信模式為何。
雖然使用結(jié)構(gòu)化特征和/或方法動作專用的語言描述了本主題,但是應(yīng)該 理解在所附權(quán)利要求書中定義的本主題不必限于上述特定特征和動作。相反 地,上述特定特征和動作是作為實現(xiàn)權(quán)利要求的示例形式來公開的。
權(quán)利要求
1.一種在通信體系結(jié)構(gòu)(200)中處理通信消息的方法(350),包括從源接收(352)第一通信消息;標識(354)與所述第一通信消息相關(guān)聯(lián)的通信模式;基于所述第一通信消息確定(356)對話狀態(tài);基于所述對話狀態(tài),使用所述通信模式將第二通信消息發(fā)送(360)給所述源。
2. 如權(quán)利要求1所述的方法,其特征在于,還包括訪問包含多個指定的 對話狀態(tài)的對話文件(218)。
3. 如權(quán)利要求2所述的方法,其特征在于,所述對話狀態(tài)的每一個包括 相關(guān)聯(lián)的屬性,所述屬性包括任務(wù)(320)、提示(322)和相關(guān)的對話狀態(tài)(326) 中的至少一個。
4. 如權(quán)利要求1所述的方法,其特征在于,還包括基于所述對話狀態(tài)執(zhí) 行任務(wù)。
5. 如權(quán)利要求1所述的方法,其特征在于,還包括分析所述第一通信消 息來確定其中包含的語義信息,且其中基于所述語義信息確定所述對話狀態(tài)。
6. 如權(quán)利要求1所述的方法,其特征在于,所述通信模式是電子郵件、 即使消息傳遞和電話中的一個。
7. 如權(quán)利要求1所述的方法,其特征在于,所述第一通信消息包括語音 數(shù)據(jù)和文本數(shù)據(jù)中的一個。
8. —種適用于處理來自具有一通信模式的源的通信消息的計算機可讀介 質(zhì),包括一對話執(zhí)行模塊(214),適用于訪問多個對話狀態(tài)(218),以便基于所 述通信消息確定對話狀態(tài);以及一通信接口 (212),耦合到所述對話執(zhí)行模塊,并且適用于基于所述對 話狀態(tài)和所述通信模式將響應(yīng)發(fā)送給所述源。
9. 如權(quán)利要求8所述的計算機可讀介質(zhì),其特征在于,所述的對話執(zhí)行 模塊還適用于分析所述通信消息,以便確定其中包含的語義信息。
10. 如權(quán)利要求9所述的計算機可讀介質(zhì),其特征在于,基于所述語義信 息確定所述下一對話狀態(tài)。
11. 如權(quán)利要求IO所述的計算機可讀介質(zhì),其特征在于,所述對話執(zhí)行 模塊適用于訪問語言模型,以便基于所述語義信息確定所述對話狀態(tài)。
12. 如權(quán)利要求8所述的計算機可讀介質(zhì),其特征在于,所述通信接口適 用于將所述響應(yīng)發(fā)送給因特網(wǎng)協(xié)議源和POTS源。
13. 如權(quán)利要求8所述的計算機可讀介質(zhì),其特征在于,所述對話執(zhí)行模 塊適用于訪問提示(220),以便確定所述響應(yīng)。
14. 一種系統(tǒng)(200),包括一通信接口 (212),適用于從多個不同的通信模式接收通信消息,并基 于所述多個不同的通信模式來發(fā)送通信消息;一對話文件(218),包括多個對話狀態(tài),每個對話狀態(tài)具有相關(guān)聯(lián)的屬 性;以及一對話執(zhí)行模塊(214),耦合到所述通信模塊以從中接收通信消息,適 用于訪問所述對話文件以便基于特定的通信消息確定對話狀態(tài),并且將與所述 對話狀態(tài)相關(guān)聯(lián)的響應(yīng)提供給所述通信接口。
15. 如權(quán)利要求14所述的系統(tǒng),其特征在于,所述相關(guān)聯(lián)的屬性包括提 示、語言模型和相關(guān)聯(lián)的對話狀態(tài)。
16. 如權(quán)利要求14所述的系統(tǒng),其特征在于,還包括耦合到所述對話執(zhí) 行模塊的自然語言處理單元(216),用于標識所述通信消息內(nèi)的語義信息。
17. 如權(quán)利要求14所述的系統(tǒng),其特征在于,還包括耦合到所述通信接 口的因特網(wǎng)協(xié)議接口 (204)和POTS接口 (206)。
18. 如權(quán)利要求14所述的系統(tǒng),其特征在于,所述對話執(zhí)行模塊包括用 于訪問所述對話文件的應(yīng)用程序編程接口。
19. 如權(quán)利要求14所述的系統(tǒng),其特征在于,所述通信消息包括至少一 個語音數(shù)據(jù)和文本數(shù)據(jù)。
20. 如權(quán)利要求14所述的系統(tǒng),其特征在于,所述通信接口適于發(fā)送電 子郵件消息和音頻消息中的至少一個。
全文摘要
在通信體系結(jié)構(gòu)中使用一種用于創(chuàng)作和執(zhí)行對話應(yīng)用程序的架構(gòu)。該應(yīng)用程序可以與多個不同模式的通信一起使用。由對話應(yīng)用程序處理的消息被用于確定對話狀態(tài)并提供相關(guān)聯(lián)的響應(yīng)。
文檔編號G06Q10/00GK101292256SQ200680038585
公開日2008年10月22日 申請日期2006年10月3日 優(yōu)先權(quán)日2005年10月18日
發(fā)明者A·拉瑪克里什納 申請人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1