專利名稱:在網(wǎng)絡中處理音頻數(shù)據(jù)的方法,以及實現(xiàn)該方法的設備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于在網(wǎng)絡中處理音頻數(shù)據(jù)的方法和程序,并涉及實現(xiàn)該方法的設備。
本發(fā)明更特別地涉及一種處理包括音頻數(shù)據(jù)的數(shù)據(jù)流的方法,音頻數(shù)據(jù)在服務器和至少一個電話終端之間的網(wǎng)絡中交換,該數(shù)據(jù)流對應于來自終端的一次電話呼叫,在該電話呼叫期間用戶至少產(chǎn)生一個事件。該方法包括步驟a),該步驟是從對應于每次電話呼叫的數(shù)據(jù)流中提取對應于每個事件的音頻數(shù)據(jù);步驟b),該步驟是執(zhí)行與所提取的音頻數(shù)據(jù)有關(guān)并可被軟件應用程序執(zhí)行的至少一個任務。
背景技術(shù):
這些已有技術(shù)方法使得電話終端和服務器通過交換電話網(wǎng)絡通信,交換電話網(wǎng)絡可以是公共的或私人的,固定的或移動的。舉個例子,其相當于按首字母縮寫為IVR(interactive voice response,交互式語音應答)的眾所周知的方法。
例如,這些方法使得信息以語音形式傳達給用戶,或者使得用戶可以以語音數(shù)據(jù)方式給出的指令遠程控制一些操作,比如當用戶在電話終端的鍵盤上按壓按鍵時產(chǎn)生的語音命令或聲音(一種按首字母縮寫為DTMF,dual tone multi-frequency,雙音多頻的方法)。
通過這類方法,用戶可以查詢例如銀行收支或股票價格,也可以在語音信箱查詢或留下訊息等等。
在該電話呼叫期間,數(shù)據(jù)流由電話終端產(chǎn)生。該數(shù)據(jù)流包括例如識別用戶的標識(ID)數(shù)據(jù),以及由電話終端的話筒采集對應于由用戶發(fā)出的聲音的數(shù)據(jù),或由按壓終端的按鍵產(chǎn)生聲音的數(shù)據(jù)。在這些聲音中,有一些對應于特定事件的語音數(shù)據(jù)特征。
當音頻數(shù)據(jù)被相配的服務器識別,程序執(zhí)行相應的任務。例如,當用戶發(fā)出詞“刪除”時,在給定場景中該詞對應于一預定事件,運行對應于刪除在語音信箱中訊息的任務。
在已有技術(shù)方法,特別是在文件EP 1 175 074中描述的方法中,對應于IVR應用程序的計算機程序采用專用語言,例如TCL(tool command language,裝置命令語言)進行開發(fā),或要求采用解釋器,例如VXML(voice extensible markuplanguage,語音擴展標識語言)等等。這些程序都僅專用于語音應用,其只用一種這樣的語言寫成,且與這些程序兼容的數(shù)據(jù)庫專用于這些語音應用。
發(fā)明內(nèi)容
本發(fā)明的一個目的是使IVR類型的音頻數(shù)據(jù)通信方法應用于更多的源。
這一目的通過一種方法實現(xiàn),除了上述的特性,該方法的特征還是,軟件應用程序被設計用來采用非專用于音頻的數(shù)據(jù)傳輸協(xié)議與網(wǎng)絡進行交互,且該方法包括步驟c),該步驟包括通過專用于語音并經(jīng)由插入子模塊加到軟件應用程序中的程序單元,將與所提取的音頻數(shù)據(jù)有關(guān)并適于激活步驟b)的至少一條指令,插入所述軟件應用程序。
除已有的語音應用程序外,這些處理使得使用應用程序和與已開發(fā)的這些應用程序兼容的數(shù)據(jù)庫成為可能,該已開發(fā)的應用程序用于實現(xiàn)服務器和不是只用音頻數(shù)據(jù)通信的用戶之間交互。這樣,可能采用已開發(fā)的應用程序或數(shù)據(jù)庫,例如用于因特網(wǎng),從而提供對已存在的多種服務和信息源的訪問。
該方法還有一個優(yōu)點,即已用解釋語言寫成的所有應用程序,例如,用于因特網(wǎng),都可立即適用于語音領(lǐng)域,而不需要完全重新開發(fā)。
該方法也使將任何新的IVR應用程序立即在以信息包模式運行的遠程通信網(wǎng)絡中成為一體變得可能。
在本發(fā)明的較佳實施例中,也可任選地采取如下的一個或多個處理軟件應用程序采用一種語言寫成,而加到該軟件應用程序的專用于語音的程序單元也采用相同的語言寫成;事件由用戶按壓電話終端的至少一個鍵產(chǎn)生;事件由用戶發(fā)出語音命令產(chǎn)生,且步驟a)包括通過語音識別單元識別發(fā)出的語音命令的步驟;軟件應用程序適于在因特網(wǎng)或內(nèi)部網(wǎng)或電話網(wǎng)絡上執(zhí)行等同于給用戶提供服務的任務。
該方法包括步驟a’),步驟a’)是在從數(shù)據(jù)流所提取的非語音數(shù)據(jù)的基礎上管理電話呼叫中的變化;且該步驟包括步驟d),步d)是采用用于在網(wǎng)絡中傳輸音頻數(shù)據(jù)的協(xié)議,來響應用戶產(chǎn)生的至少一個事件在網(wǎng)絡中傳輸輸出音頻數(shù)據(jù)。
另一方面,本發(fā)明提供一種用于處理包括音頻數(shù)據(jù)的數(shù)據(jù)流的系統(tǒng),音頻數(shù)據(jù)在網(wǎng)絡中服務器和至少一個電話終端之間交換,該數(shù)據(jù)流對應于來自所述終端的一次電話呼叫,在該電話呼叫期間用戶產(chǎn)生至少一個事件,該系統(tǒng)包括提取裝置,用于從對應于每次電話呼叫的數(shù)據(jù)流中提取對應于每個事件的音頻數(shù)據(jù);執(zhí)行裝置,執(zhí)行與所提取的音頻數(shù)據(jù)(INTS2)有關(guān)并可被軟件應用程序執(zhí)行的至少一個任務;該系統(tǒng)的特性是,軟件應用程序被設計用來采用一并非專用于音頻的數(shù)據(jù)傳輸協(xié)議與網(wǎng)絡進行交互,且該系統(tǒng)包括插入裝置,用于將與所提取的音頻數(shù)據(jù)有關(guān)并適于被執(zhí)行裝置讀和執(zhí)行的至少一條指令,插入所述的軟件應用程序中,引入裝置包括專用于語音并加到軟件應用程序中的程序單元。
救助可任選如下的一個或多個的處理所述的提取裝置,執(zhí)行裝置和引入裝置集成在服務器中,且服務器包括至少一臺計算機;該服務器包括取自如下表中的數(shù)字處理器裝置語音識別單元,用于識別由至少一個用戶發(fā)出的語音命令;呼叫控制單元,用于從對應于各電話呼叫的數(shù)據(jù)流中提取對應于各電話呼叫的非音頻數(shù)據(jù);聲音發(fā)送器單元,用于利用一用于音頻數(shù)據(jù)傳輸?shù)木W(wǎng)絡協(xié)議,在網(wǎng)絡上輸出對應于至少一個事件的音頻數(shù)據(jù);呼叫傳輸單元,用于為至少一個用戶管理呼叫傳輸;讀單元,用于讀出與所提取的音頻數(shù)據(jù)有關(guān)的至少一條指令;
呼叫傳輸指令單元,用于實現(xiàn)呼叫傳輸;和會議建立指令單元,用于利用對應于各電話呼叫的非音頻數(shù)據(jù),建立至少有兩個電話呼叫的會議;和音頻數(shù)據(jù)庫。
另一方面,本發(fā)明提供一種計算機程序,用于處理包含音頻數(shù)據(jù)的數(shù)據(jù)流,該音頻數(shù)據(jù)在網(wǎng)絡中服務器與至少一個電話終端之間的交換,該數(shù)據(jù)流對應于來自所述的終端上的電話呼叫,在該電話呼叫期間用戶產(chǎn)生至少一個事件,該計算機程序包括程序代碼部分,用于在所述的程序被計算機執(zhí)行時,執(zhí)行這種方法的步驟。
另一方面,本發(fā)明提供一種為執(zhí)行至少一個任務而準備計算機程序的方法,這種任務涉及從包括音頻數(shù)據(jù)的數(shù)據(jù)流中提取的音頻數(shù)據(jù),該音頻數(shù)據(jù)在網(wǎng)絡中服務器和至少一個電話終端之間交換,該數(shù)據(jù)流對應于來自所述終端上的電話呼叫,在該電話呼叫期間用于產(chǎn)生至少一個事件,音頻數(shù)據(jù)對應于所述的事件;該方法的特征在于,所述計算機程序由軟件應用程序執(zhí)行,該軟件應用程序用于利用非專用的音頻協(xié)議的數(shù)據(jù)傳輸協(xié)議與網(wǎng)絡交互,;且該方法包括將插入子模塊加到軟件應用程序中的步驟,子模塊包括專用于語音并適于將指令引入軟件應用程序的程序單元,該指令與所提取的音頻數(shù)據(jù)有關(guān),并適于激活所述的任務執(zhí)行。
本發(fā)明的其他方面、目的和優(yōu)點將出現(xiàn)在閱讀以下多個作為非限制例子的實施例的描述的過程中。
借助于附圖,可以更好地理解本發(fā)明,其中圖1是根據(jù)本發(fā)明實現(xiàn)的IVR應用程序的總框圖;圖2是示出本發(fā)明的應用程序系統(tǒng)的操作的圖;圖3是示出本發(fā)明的應用程序系統(tǒng)的第二實施例的操作;而圖4示出一例操作中的本發(fā)明;在不同圖中,采用相同的標記表示相同或相似的元件。
具體實施例方式
圖1是示出一例根據(jù)本發(fā)明實現(xiàn)的交互語音服務器的框圖。
一用戶UTI,或者一組用戶,可以通過例如電話或計算機訪問電路交換電話網(wǎng)絡RESC。
這樣,在該電話呼叫期間,用戶UTI產(chǎn)生聲音。這些聲音對應于例如用戶的語音或和在電話終端上按鍵關(guān)聯(lián)的特定聲音信號。這些聲音構(gòu)成音頻數(shù)據(jù)。在該音頻數(shù)據(jù)中,某些數(shù)據(jù)代表特定的由用戶為激活一個服務而產(chǎn)生的事件。舉個例子,這樣的事件包括發(fā)出用于識別的特定詞,或是按壓使用中的終端的特定按鍵。
該語音數(shù)據(jù)從電話終端出發(fā),和其他通信數(shù)據(jù)(比如識別該呼叫的數(shù)據(jù))一起傳輸,從而形成數(shù)據(jù)流,數(shù)據(jù)流被電話網(wǎng)絡RESC傳至媒體網(wǎng)關(guān)MED,用于將電路交換電話網(wǎng)絡連接到分組交換電話網(wǎng)絡RESP,反之亦然。對于本領(lǐng)域熟悉人員,這類媒體網(wǎng)關(guān)是眾所周知的(例如參見文件EP 1 175 074)。數(shù)據(jù)流接著由分組交換電話網(wǎng)絡利用在這類網(wǎng)絡上的傳輸或呼叫建立協(xié)議傳送至應用程序系統(tǒng)SYST。例如,其可以是會話發(fā)起協(xié)議(SIP),該協(xié)議是因特網(wǎng)工程任務組語音協(xié)議。
應用程序系統(tǒng)SYST由服務提供者管理。提供的服務相當于查詢數(shù)據(jù)庫(目錄、天氣數(shù)據(jù)、股票價格等等)和/或執(zhí)行操作(為移動電話下載鈴聲或標志等等)。
數(shù)據(jù)流相當于經(jīng)由應用程序系統(tǒng)SYST到達服務提供者的信息。該信息同時涉及由服務的一個或多個用戶建立的呼叫,并涉及由所述的用戶產(chǎn)生的一組事件。這些事件可以是任意類型,例如按壓電話終端的給定鍵,或點擊顯示在計算機或其他屏幕上的網(wǎng)頁上的給定鏈接,以通過菜單瀏覽,用來獲得信息或執(zhí)行給定的操作。
該應用程序系統(tǒng)包括從數(shù)據(jù)流中分離出的第一模塊MOD1,屬于由各用戶UTI建立的各呼叫的信息INST1,以及對應于事件的有用的音頻數(shù)據(jù),這些數(shù)據(jù)適用于激活一個或多個經(jīng)由服務器訪問的服務。第一模塊MOD1處理與呼叫有關(guān)的信息,并為給定用戶UTI翻譯與音頻數(shù)據(jù)有關(guān)的指令I(lǐng)NST2′并將其送至第二模塊MOD2。第二模塊MOD2處理和用戶UTI的交互并輸出即將提供給用戶UTI的描述信息的指令I(lǐng)NST2′,作為其接收到的解釋過的指令I(lǐng)NST2′的功能。舉個例子,該信息可涉及關(guān)于操作的結(jié)果的成功/失敗信息,或涉及由用戶申請的信息。
第一模塊MOD1接著接收這些由第二模塊MOD2輸出的輸出指令I(lǐng)NST2,并利用SIP網(wǎng)絡協(xié)議傳輸一組聲音,這些聲音構(gòu)成對用戶UTI產(chǎn)生的事件的響應。這樣用戶UTI和服務提供者之間的對話建立了,結(jié)果,不僅多個事件可以由用戶UTI傳輸,以接收由服務提供者提供的合適的響應,而且呼叫的特性可以隨事件改變。第一模塊MOD1用于處理呼叫的特性變化,而第二模塊用于處理由用戶UTI或一組用戶提出的多個請求的響應。
舉個例子,服務可以是與數(shù)據(jù)庫DATA交換數(shù)據(jù)。
分組交換電話網(wǎng)絡和第一模塊MOD1之間,以及第一和第二模塊MOD1和MOD2之間的通信利用比如SIP協(xié)議發(fā)生。在第二模塊MOD2中的交互,舉個例子,以一種以超文本預處理(PHP)的語言,或以java腳本語言等等,得到處理。
參見圖2,描述了一例本發(fā)明的應用程序系統(tǒng)SYST。在該應用程序系統(tǒng)中,舉個例子,事件對應于通過按壓電話終端的按鍵產(chǎn)生的聲音。來自分組交換電話網(wǎng)絡的數(shù)據(jù)流到達第一模塊MOD1。第一模塊MOD1基本上包括呼叫控制器CONT和指令產(chǎn)生器GEN。
更特別地,在第一模塊MOD1中,數(shù)據(jù)流被送至呼叫控制器CONT中。該呼叫控制器控制在分組交換電話網(wǎng)絡和第一模塊MOD1之間利用SIP協(xié)議交換的輸入和輸出數(shù)據(jù)。它處理建立和監(jiān)控語音呼叫的操作,管理在應用程序系統(tǒng)中的呼叫的唯一ID,以及SIP協(xié)議的所有功能。對于給定的用戶,它將與事件有關(guān)的指令I(lǐng)NST傳輸?shù)街噶畎l(fā)生器GEN。指令發(fā)生器GEN檢測到線另一端的用戶UTI已產(chǎn)生一給定的事件,比如按壓電話的“*”鍵,然后將這一對應于指令I(lǐng)NST2的信息解釋成指令I(lǐng)NST2′,把指令I(lǐng)NST2′送至第二模塊MOD2。
第二模塊MOD2主要包括采用可以編譯或解釋的高級語言寫成的軟件應用程序AL。該軟件應用程序AL可能已被開發(fā)以通過因特網(wǎng)提供服務而不需要專門修改以接收語音指令。軟件應用程序一般被設計成通過利用非專用于音頻目的的數(shù)據(jù)傳輸協(xié)議,例如因特網(wǎng)協(xié)議(IP)來與網(wǎng)絡RESP進行交互。這就是為什么第二模塊MOD2還包括插入子模塊SM。該插入子模塊在需要的地方可起到將附加的指令I(lǐng)NSTA加到指令I(lǐng)NST2′上的作用,使得專用于語音領(lǐng)域的指令I(lǐng)NST2′可在高級語言的代碼中使用。
通過插入子模塊SM,軟件應用程序的指令閱讀程序單元LINST能夠理解指令產(chǎn)生器GEN發(fā)出的指令I(lǐng)NST2′,從而能激活以為非專用語音應用程序而開發(fā)的高級語言編程的任務。
更特別地,插入子模塊SM疊放在軟件應用程序AL之上并對此加上非專用于語音,且以高級語言代碼寫成的程序單元,從而能夠例如通過在類型<VOCAL>和</VOCAL>的分隔符之間延伸的命令行,來解碼由事件發(fā)生器GEN解釋的指令I(lǐng)NST2′。該程序單元也可再分成分布在軟件應用系統(tǒng)中的多個計算機中的多個部分,或者實現(xiàn)系統(tǒng)功能,以代替部分該系統(tǒng)。
這樣,在本發(fā)明的一例操作中,軟件應用程序AL已經(jīng)采用例如PHP語言得到編程。該程序的語言被重新編譯,使利用專用于語音的程序單元,例如命令at_prompt(),成為可能。這種命令使接收DTMF信號成為可能。
例如,在一給定的情況下,預先存在的軟件應用程序促使菜單顯示在遠程用戶計算機的屏幕上,允許用戶通過在鍵盤上打字符來選擇軟件應用程序的多個功能中的一個。在預先存在的軟件應用程序的基礎上,開發(fā)者可以將如下程序單元加到軟件應用程序命令$key=at_prompt()。變量″key″(指令I(lǐng)NST2′)取用戶按壓鍵的值。軟件應用程序的相應功能取決于變量″key″的值得到訪問,如同以前通過用戶按壓鍵盤上的相應鍵來訪問。由于可以采用預先存在的軟件應用程序中的功能,這樣就不需要重新開發(fā)專用于IVR的上述功能。
另外,系統(tǒng)可以檢測用戶是否通過電話正在訪問軟件應用程序,在這種情況下變量取由鍵盤提供的值(該程序單元已存是軟件應用程序中),或取由電話提供的值(該程序單元正被加到子模塊SM中)。
這樣,軟件應用程序Al可以處理指令I(lǐng)NST2′并對由用戶UTI產(chǎn)生的事件提供響應。
以高級語言形式的軟件應用程序AL不一定已經(jīng)開發(fā),以提供專用于語音領(lǐng)域的信息,故可能必需通過插入子模塊SM返回,以通過EINST單元提供指令I(lǐng)NSTS′,用于發(fā)送聲音傳輸指令,該指令I(lǐng)NSTS′接著被送至第一模塊MOD1中的聲音發(fā)送器單元EMI上??扇芜x地將附加的指令I(lǐng)NSTA′加到指令I(lǐng)NSTS′上。聲音發(fā)送器單元EMI可以通過搜索數(shù)據(jù)庫(未顯示)中的聲音元素并對其編碼來響應指令I(lǐng)NSTS′,從而將適合在電話網(wǎng)絡上傳輸?shù)木幋a過的聲音元素送至呼叫控制器CONT。呼叫控制器CONT復原編碼過的聲音元素,且作為用戶UTI識別的功能,將與最初由用戶產(chǎn)生的事件有關(guān)的信息INSTS傳送給所述的用戶。
這樣,在一個例子中,預先存在的軟件應用程序過去常使“您的信息已注冊”之類的確認信息顯示在遠程用戶的計算機屏幕上。編程語言已被重新編譯使開發(fā)者能夠?qū)⒅T如命令at_play(sound_file.al)的專用于語音的程序單元加到軟件應用程序上。這種命令起到使傳統(tǒng)類型的聲音文件被讀的作用。在預先存在的軟件應用程序的基礎上,開發(fā)者可以對其在合適位置上加上包含命令at_play(confirmation.al)的程序單元,在那兒聲音文件confirmation.al回播“您的信息已注冊”。
在本發(fā)明的背景下,可以在軟件應用程序上加上許多其他命令。特別地,可以做好準備以在數(shù)據(jù)庫中更新與特定用戶有關(guān)的數(shù)據(jù)文件,無論遠程用戶在什么情況下掛斷電話。
使用可執(zhí)行程序,比如以C++開發(fā)的程序,修改開發(fā)軟件應用程序的編程語言,使得編程語言可以包括附加的命令,例如命令at_play(file.al)或命令at_prompt()等。從預先存在的軟件應用程序開始,通過添加子模塊SM,可很容易地構(gòu)建IVR應用程序,其中,子模塊包括添加的專用于語音的程序代碼單元。
圖2示出本發(fā)明的應用系統(tǒng)SYST的簡單例,使得可一個或多個聲音響應由用戶UTI產(chǎn)生的事件,返回給一或多個用戶UTI。
本發(fā)明的應用系統(tǒng)可實現(xiàn)以批其他功能,例如圖3示出的那些功能。
如圖3所示,除了應用系統(tǒng)SYST的上述構(gòu)件,應用系統(tǒng)SYST被完全改編以允許用戶UTI產(chǎn)生不再只通過按壓電話鍵而產(chǎn)生的事件。它也可以處理與顯示在計算機屏幕上使用鼠標在以HTML(hypertext markup language,超文本標記語言)形式格式化的文件的一頁上所做的選擇相對應的數(shù)據(jù),或者由用戶UTI發(fā)出的純語音聲音。
舉個例子,通過語音指示,聲音被用戶UTI的電話終端采集,然后在電話網(wǎng)絡上傳送至集成在第一模塊MOD1上的聲音接收器單元URS。例如,由用戶UTI產(chǎn)生的聲音是用戶發(fā)出的詞。接著,聲音接收器單元URS可以例如,包括語音識別單元REC,語音識別單元REC能夠識別由用戶UTI發(fā)出的詞,并且作為這種識別結(jié)果的功能,能夠?qū)⒅噶領(lǐng)NST2′送至記錄指令單元RINST。指令I(lǐng)NST2′可以任選地與由插入子模塊SM產(chǎn)生的附加指令I(lǐng)NSTA相關(guān)聯(lián),使得記錄指令單元RINST能夠通過其插入子模塊讀指令I(lǐng)NST2′。
在類似的方式下,此應用系統(tǒng)SYST也可通過呼叫傳輸單元TRA和傳輸指令單元TINST來處理諸如呼叫傳輸?shù)墓δ?。這些功能通過采用與上述的指令I(lǐng)NST2′和INSTA類似的指令來實現(xiàn)。這是一種使信息能夠被送至呼叫控制器CONT的選擇,呼叫控制器使呼叫傳輸能夠被網(wǎng)絡的語音協(xié)議,例如SIP,處理和支持。
在此描述的例子中的應用系統(tǒng)也可以以相同的方式,根據(jù)用戶UTI的請求,使用會議建立單元CONF和會議指令單元CINST,使來自多個用戶UTI的呼叫進入會議。
以下結(jié)合圖4描述本發(fā)明的一例操作的可選方案。一個或一組用戶UTI尋求訪問服務,比如上面提到的服務,和如由服務提供者在網(wǎng)絡RESC上提供的服務。能夠響應這種服務的軟件應用程序AL位于遠程服務器上,例如一個基于由Intel制造的處理器的服務器。該服務器在諸如,Windows,Unix或Linux操作系統(tǒng)下運行,且除了上述的應用系統(tǒng)SYST,還包括控制該服務器SERV其他功能的系統(tǒng)SYST2。用戶UTI尋求訪問的服務可以以非語音方式提供,例如通過以PHP語言形式的軟件應用程序AL。
由用戶UTI產(chǎn)生的事件,比如來自手持電話,如上面的解釋,通過電路交換電話網(wǎng)絡RESC送至媒體網(wǎng)關(guān)MED,并通過分組交換網(wǎng)絡RESP送至裝有應該程序的服務器SERV。在本例中,分組交換網(wǎng)絡RESP是比如因特網(wǎng)。服務器SERV通過傳統(tǒng)以太網(wǎng)接口IR和網(wǎng)絡RESP連接。
如上面的解釋,輸入數(shù)據(jù)流通過第一模塊MOD1處理,第一模塊管理與呼叫有關(guān)的所有方面,并將與由用戶產(chǎn)生的事件有關(guān)的指令I(lǐng)NST2′送至第二模塊MOD2,在第二模塊中,它們由軟件應用程序AL通過子模塊SM接收,子模塊采用以C++形式的可執(zhí)行軟件將指令I(lǐng)NST2′轉(zhuǎn)換成如同重新編譯的PHP4.2.2語言,從而使其能夠集成到軟件應用程序AL中,而軟件應用程序AL本身采用PHP語言。軟件應用程序AL通過執(zhí)行適當?shù)娜蝿諄眄憫噶領(lǐng)NST2′。特別地,可以從儲存在數(shù)據(jù)庫DATA中的數(shù)據(jù)中重新構(gòu)成語言響應。軟件應用程序AL也可以例如特別通過與其他遠程的,可在因特網(wǎng)上訪問的服務器SERV2和/或數(shù)據(jù)庫DATA2交互,來產(chǎn)生其他功能。
第二模塊MOD2能夠?qū)⑤敵鲋噶領(lǐng)NSTS′返回到第一模塊MOD1。第一模塊利用網(wǎng)絡語音協(xié)議SIP直接在分組交換網(wǎng)絡RESP上傳輸,提供與由用戶UTI以語音形式產(chǎn)生事件有關(guān)的信息。
另外,取決于由用戶UTI產(chǎn)生的數(shù)據(jù)流,系統(tǒng)SYST2可以例如將專用于該用戶的數(shù)據(jù)經(jīng)由分組交換網(wǎng)絡RESP傳輸至遠程數(shù)據(jù)庫DATA2。
權(quán)利要求
1.一種處理包括音頻數(shù)據(jù)(INST2)的數(shù)據(jù)流的方法,音頻數(shù)據(jù)(INST2)在服務器(SERV)和至少一個電話終端之間的網(wǎng)絡中交換,該數(shù)據(jù)流對應于來自終端的一次電話呼叫,在該電話呼叫期間用戶(UTI)至少產(chǎn)生一個事件,該方法包括步驟a),該步驟是從對應于每次電話呼叫的數(shù)據(jù)流中提取對應于每個事件的音頻數(shù)據(jù)(INST2);和步驟b),該步驟是執(zhí)行與該提取的音頻數(shù)據(jù)(INTS2)有關(guān)并可被軟件應用程序(AL)執(zhí)行的至少一個任務;該系統(tǒng)的特征在于,軟件應用程序(AL)被設計用來使用非專用于音頻的數(shù)據(jù)傳輸協(xié)議與網(wǎng)絡進行交互,且該方法包括步驟c),該步驟包括通過專用于語音并通過插入子模塊加到軟件應用程序中的程序單元,將與所提取的音頻數(shù)據(jù)(INST2)有關(guān)并適于激活步驟b)的至少一條指令(INST2′),插入所述軟件應用程序。
2.如權(quán)利要求1所述的一種方法,其特征在于,軟件應用程序(AL)采用一種語言寫成,而加到該軟件應用程序的專用于語音的程序單元也采用相同的語言寫成。
3.如權(quán)利要求1或2所述的一種方法,其特征在于,事件由用戶(UTI)按壓電話終端的至少一個鍵產(chǎn)生。
4.如上述任一權(quán)利要求的一種方法,其特征在于,事件由用戶(UTI)發(fā)出語音命令產(chǎn)生,且步驟a)包括通過語音識別單元(REC)識別發(fā)出的語音命令的步驟。
5.如上述任一權(quán)利要求的一種方法,其特征在于,軟件應用程序適于在因特網(wǎng)或內(nèi)聯(lián)網(wǎng)(RESP)或電話網(wǎng)絡(RESC)上執(zhí)行任務,該任務等同于給用戶(UTI)的服務。
6.如上述任一權(quán)利要求的一種方法,還包括步驟a′),步驟a′)是在從數(shù)據(jù)流所提取的非語音數(shù)據(jù)的基礎上管理呼叫中的改變。
7.如上述任一權(quán)利要求的一種方法,還包括步驟d),步驟d)是利用用于在網(wǎng)絡中傳輸音頻數(shù)據(jù)的協(xié)議,在響應用戶(UTI)產(chǎn)生的至少一個事件傳遞時在網(wǎng)絡上傳輸輸出音頻數(shù)據(jù)(INSTS)。
8.一種系統(tǒng),用于處理包括音頻數(shù)據(jù)(INST2)的數(shù)據(jù)流,該音頻數(shù)據(jù)(INST2)在服務器(SERV)和至少一個終端之間的網(wǎng)絡中交換,該數(shù)據(jù)流對應于來自所述終端的一次電話呼叫,在該電話呼叫期間用戶(UTI)產(chǎn)生至少一個事件,該系統(tǒng)包括提取裝置(MOD1),用于從對應于每次電話呼叫的數(shù)據(jù)流中提取對應于每個事件的音頻數(shù)據(jù)(INST2);和執(zhí)行裝置(MOD2),用于執(zhí)行與該提取的音頻數(shù)據(jù)(INTS2)有關(guān)并可被軟件應用程序(AL)執(zhí)行的至少一個任務;該系統(tǒng)的特征在于,軟件應用程序(AL)被設計用來利用非專用于音頻的數(shù)據(jù)傳輸協(xié)議與網(wǎng)絡進行交互,且該系統(tǒng)包括插入裝置(SM),用于將與所提取的音頻數(shù)據(jù)有關(guān)并適于被執(zhí)行裝置讀和執(zhí)行的至少一條指令,插入所述的軟件應用程序(AL)中,該引入裝置(SM)包括專用于語音并加到軟件應用程序中的程序單元。
9.如權(quán)利要求8的一種系統(tǒng),其特征在于,所述的提取裝置(MOD1)、提取裝置(MOD2)和引入裝置(SM)集成在服務器(SERV)中,且該服務器(SERV)包括至少一臺計算機。
10.如權(quán)利要求8或9的一種系統(tǒng),其特征在于,服務器包括從以下列表中獲得的數(shù)字處理器裝置語音識別單元(REC),用于識別至少一個用戶(UTI)發(fā)出的語音命令;呼叫控制單元(CONT),用于從對應于各電話呼叫的數(shù)據(jù)流中提取對應于各電話呼叫的非音頻數(shù)據(jù);聲音發(fā)送器單元(EMI),用于利用用于音頻數(shù)據(jù)傳輸?shù)木W(wǎng)絡協(xié)議,來在網(wǎng)絡上輸出對應于至少一個事件的音頻數(shù)據(jù)(INSTS);呼叫傳輸單元(TRA),用于為至少一個用戶管理呼叫傳輸;讀單元(LINST),用于讀出與所提取的音頻數(shù)據(jù)(INST2’)的至少一條指令;呼叫傳輸指令單元(TINST),用于實現(xiàn)呼叫傳輸;和會議建立指令單元(CINST),用于利用對應于各電話呼叫的非音頻數(shù)據(jù),建立至少有兩個電話呼叫的會議。
11.如權(quán)利要求8-10的一種系統(tǒng),還包括一音頻數(shù)據(jù)庫(DATA)。
12一種計算機程序,用于處理包含音頻數(shù)據(jù)的數(shù)據(jù)流,該音頻數(shù)據(jù)在服務器(SERV)與至少一個電話終端之間的網(wǎng)絡上交換,該數(shù)據(jù)流對應于來自所述的終端上的電話呼叫,在該電話呼叫期間用戶產(chǎn)生至少一個事件,該計算機程序包括程序代碼部分,用于在所述的程序被計算機執(zhí)行時,執(zhí)行如權(quán)利要求1-7的任一權(quán)利要求的方法的步驟。
13.一種為執(zhí)行至少一個任務準備計算機程序的方法,該任務與從包括音頻數(shù)據(jù)(INST2)的數(shù)據(jù)流所提取的音頻數(shù)據(jù)(INST2)有關(guān),該音頻數(shù)據(jù)(INST2)在服務器(SERV)和至少一個電話終端之間的網(wǎng)絡上交換,該數(shù)據(jù)流對應于來自所述終端上的電話呼叫,在該電話呼叫期間用戶(UTI)產(chǎn)生至少一個事件,該音頻數(shù)據(jù)(INST2)對應于所述的事件;所述方法的特征在于所述計算機程序由軟件應用程序(AL)執(zhí)行,該應用程序用于利用非專用的音頻協(xié)議的數(shù)據(jù)傳輸協(xié)議來與網(wǎng)絡交互;且該方法包括將插入子模塊(SM)加到軟件應用程序(AL)中的步驟,所述子模塊包括專用于語音并適于將指令(INST2′)引入軟件應用程序(AL)的程序單元,該指令與所提取的音頻數(shù)據(jù)(INST2)有關(guān),并適于激活所述的任務執(zhí)行。
全文摘要
一種處理包括音頻數(shù)據(jù)的數(shù)據(jù)流的方法,音頻數(shù)據(jù)在服務器(SERV)和至少一個電話終端之間的網(wǎng)絡上交換,該數(shù)據(jù)流對應于來自所述終端的一次電話呼叫,在該電話呼叫期間用戶至少產(chǎn)生一個事件。該方法包括步驟a),該步驟是從數(shù)據(jù)流中提取對應于每個事件的音頻數(shù)據(jù)(INST2),和步驟b),該步驟是執(zhí)行至少一個與該提取的音頻數(shù)據(jù)(INTS2)有關(guān)并可被軟件應用程序執(zhí)行的任務,該軟件應用程序被設計用來通過利用非專用于音頻的數(shù)據(jù)傳輸協(xié)議與網(wǎng)絡進行交互。該方法還包括步驟c),該步驟將與所提取的音頻數(shù)據(jù)(INST2)有關(guān),并適于激活步驟b)的至少一條指令(INST2’),引入所述的軟件應用程序(AL)。
文檔編號H04M3/493GK1736088SQ200380108193
公開日2006年2月15日 申請日期2003年11月24日 優(yōu)先權(quán)日2002年11月29日
發(fā)明者L·F·蓋西斯, P·巴格林, T·布頓, Z·納達亞 申請人:流寬公司