專利名稱:一種在彩鈴系統(tǒng)中實現(xiàn)語音識別的系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音識別和彩鈴技術(shù),特別是涉及一種在彩鈴系統(tǒng)中實現(xiàn)語音 識別的系統(tǒng)及方法。
背景技術(shù):
隨著語音技術(shù)的不斷發(fā)展,語音識別技術(shù)在計算^L領(lǐng)域獲得了廣泛的應(yīng)用, 所涉及到范圍也越來越廣泛,例如,語音錄入、各種聲控終端等等。雖然語音 識別技術(shù)本身已日漸成熟,.但在通訊領(lǐng)域的應(yīng)用還遠(yuǎn)未普及,目前的應(yīng)用大多
限于在應(yīng)用程序接口 (API)接口的開發(fā)。
另一方面,在彩鈴業(yè)務(wù)的日益發(fā)展過程中,語音技術(shù)如交互式語音應(yīng)答 (IVR)流程也逐漸被應(yīng)用于彩鈴系統(tǒng)中。但是,由于彩鈴業(yè)務(wù)本身的特點, 其個性化的需求特別多,存在大量用戶可以自己定制的功能,而現(xiàn)有的IVR流 程只能接收用戶一些筒單的按鍵信息,對于彩鈴業(yè)務(wù)用戶定制功能中, 一些需 要用戶輸入文本信息的應(yīng)用,如按歌曲名稱搜索等,還無法利用IVR流程實現(xiàn)。
這里,所述彩鈴業(yè)務(wù)是一種智能多媒體業(yè)務(wù),在由端局、業(yè)務(wù)控制點(SCP)、 業(yè)務(wù)交換點(SSP)、語音平臺組成的移動智能平臺上實現(xiàn),通常,用戶終端通 過撥打特定的業(yè)務(wù)接入碼,接入移動智能平臺的SSP,觸發(fā)彩鈴業(yè)務(wù)的業(yè)務(wù)邏 輯,完成彩鈴業(yè)務(wù)的實現(xiàn)。
現(xiàn)有技術(shù)中,對于彩鈴業(yè)務(wù)中需要用戶輸入文本信息的應(yīng)用,大多只能通 過web方式來實現(xiàn)。雖然,web方式的使用在交互信息上具有很大的優(yōu)勢,但 其使用還是受到使用環(huán)境、使用人群的限制,比如需要提供支持web運行的 環(huán)境,需要用戶掌握如何使用web方式等等。而對于IVR流程,則沒有這些使 用環(huán)境的要求,只要通過通信終端觸發(fā)IVR業(yè)務(wù)邏輯即可;并且,IVR業(yè)務(wù)具有使用方便、操作簡單的優(yōu)勢,那么,如何在彩鈴系統(tǒng)中利用IVR流程實現(xiàn)更 多的用戶定制功能,目前亟待解決的是IVR流程中的信息交互問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于提供一種在彩鈴系統(tǒng)中實現(xiàn)語音識別的 系統(tǒng)及方法,能解決IVR流程中的信息交互問題,完成彩鈴IVR流程中語音的 識別。
為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的
本發(fā)明提供了一種在彩鈴系統(tǒng)中實現(xiàn)語音識別的系統(tǒng),包括業(yè)務(wù)控制點、 交互式語音應(yīng)答IVR業(yè)務(wù)邏輯、媒體服務(wù)器和語音識別引擎;其中,
所述業(yè)務(wù)控制點,用于解析扭i行業(yè)務(wù)指令,并由IVR業(yè)務(wù)邏輯控制完成與 媒體服務(wù)器之間的信息交互;
所述IVR業(yè)務(wù)邏輯,用于控制對用戶的放音、收號、用戶錄入信息的處理, 并根據(jù)用戶的選擇和業(yè)務(wù)邏輯設(shè)定完成業(yè)務(wù)功能;
所述々某體服務(wù)器,用于根據(jù)業(yè)務(wù)控制點的指示操作,并根據(jù)指示與語音識 別引擎進(jìn)行信息交互,將語音識別結(jié)果通知IVR業(yè)務(wù)邏輯;
所述語音識別引擎,用于在業(yè)務(wù)控制點的控制下,對用戶錄入的語音進(jìn)行 識別,并上才艮"i吾音識別結(jié)果。
其中,該系統(tǒng)還包括x換機,用于接收用戶撥打的接入碼,并向業(yè)務(wù)控制 點發(fā)起邀請;所述業(yè)務(wù)控制點,還進(jìn)一步由IVR業(yè)務(wù)邏輯控制完成與交換機之 間的信息交互。
上述方案中,所述業(yè)務(wù)控制點與纟某體服務(wù)器通過擴展的Parlay的SENDUI 接口交互信息。所述媒體服務(wù)器與語音識別引擎進(jìn)行信息交互包括通知語音 識別引擎開始語音識別、接收語音識別引擎返回的語音識別結(jié)果。
本發(fā)明還提供了 一種在彩鈴系統(tǒng)中實現(xiàn)語音識別的方法,先觸發(fā)IVR業(yè)務(wù) 邏輯;該方法還包括
媒體服務(wù)器根據(jù)IVR業(yè)務(wù)邏輯指示準(zhǔn)備放音,并通知用戶準(zhǔn)備錄入語音;媒體服務(wù)器連接語音識別引擎,語音識別引擎識別用戶錄入的語音,并將
語音識別結(jié)果通知IVR業(yè)務(wù)邏輯,IVR業(yè)務(wù)邏輯處理語音識別結(jié)果。
其中,所述觸發(fā)IVR業(yè)務(wù)邏輯為用戶撥打彩鈴IVR流程的接入碼觸發(fā)IVR 業(yè)務(wù)邏輯。
上述方案中,所述媒體服務(wù)器根據(jù)IVR業(yè)務(wù)邏輯指示準(zhǔn)備放音具體包括 IVR業(yè)務(wù)邏輯向業(yè)務(wù)控制點發(fā)送生成UI消息,指示業(yè)務(wù)控制點呼叫力某體服務(wù) 器;業(yè)務(wù)控制點向媒體服務(wù)器發(fā)送邀請INVITE請求,呼叫媒體服務(wù)器;
媒體服務(wù)器收到邀請請求后,分配語音資源準(zhǔn)備^t音,完成后向業(yè)務(wù)控制 點返回200 OK消息;業(yè)務(wù)控制點收到200 OK后向i某體服務(wù)器返回ACK消息;
業(yè)務(wù)控制點向交換機返回200 OK消息,指示交換機連接到媒體服務(wù)器分 配的語音資源上;交換機連接成功后向業(yè)務(wù)控制點返回ACK消息;
業(yè)務(wù)控制點通知IVR業(yè)務(wù)邏輯放音設(shè)備已經(jīng)準(zhǔn)備就緒,IVR業(yè)務(wù)邏輯通知 媒體服務(wù)器放音。
上述方案中,所述通知用戶準(zhǔn)備錄入語音包括
IVR業(yè)務(wù)邏輯向業(yè)務(wù)控制點發(fā)送SendUI消息,通知媒體服務(wù)器放音; 業(yè)務(wù)控制點將SendUI消息轉(zhuǎn)換成INFO消息通知媒體服務(wù)器,媒體服務(wù)器
開始向用戶播放通知音;
媒體服務(wù)器通知業(yè)務(wù)控制點放音成功;業(yè)務(wù)控制點通知IVR業(yè)務(wù)邏輯放音
已經(jīng)成功。
上述方案中,所述》某體^^務(wù)器連接語音識別引擎之前,該方法還包括
IVR業(yè)務(wù)邏輯向業(yè)務(wù)控制點發(fā)送SendUI消息,該消息中包括語音識別引擎 的地址、語音識別4吏用的語法關(guān)見則;
業(yè)務(wù)控制點將SendUI消息轉(zhuǎn)換成INFO消息,并將相關(guān)的語音識別信息封 裝在INFO消息中,發(fā)送給媒體服務(wù)器;
所述媒體服務(wù)器根據(jù)INFO消息中的語音識別引擎地址、語法規(guī)則,連接 語音識別引擎。
上述方案中,所述將語音識別結(jié)果通知IVR業(yè)務(wù)邏輯具體為語音識別引擎將語音識別結(jié)果報告給媒體服務(wù)器,媒體服務(wù)器向業(yè)務(wù)控制
點報告語音識別結(jié)果,業(yè)務(wù)控制點向IVR業(yè)務(wù)邏輯上報語音識別結(jié)果。
本發(fā)明所提供的在彩#系統(tǒng)中實現(xiàn)語音識別的系統(tǒng)及方法,用戶通過撥打
接入碼,觸發(fā)IVR業(yè)務(wù)邏輯,由IVR業(yè)務(wù)邏輯控制語音識別引擎識別用戶錄入 的語音,并將語音識別結(jié)果返回IVR業(yè)務(wù)邏輯。如此,可使用戶將需要輸入的 信息通過語音錄入,并通過語音識別引擎進(jìn)行識別,之后將語音識別結(jié)果送至 IVR業(yè)務(wù)邏輯,提供給彩鈴業(yè)務(wù)在需要時使用。
本發(fā)明通過將業(yè)務(wù)控制點、媒體服務(wù)器和語音識別引擎結(jié)合使用,由IVR 業(yè)務(wù)邏輯控制用戶語音的錄入和識別,只需對Parlay的SENDUI接口進(jìn)行擴展, 使其能攜帶語音識別所需的參數(shù)信息,不僅解決了彩鈴業(yè)務(wù)IVR流程中的信息 交互問題,而且,操作簡單、方便、靈活、易于實現(xiàn)。
圖1為本發(fā)明在彩鈴系統(tǒng)中實現(xiàn)語音識別的系統(tǒng)組成結(jié)構(gòu)示意圖2為本發(fā)明在彩鈴系統(tǒng)中實現(xiàn)語音識別的方法流程示意圖3為本發(fā)明在彩鈴系統(tǒng)中實現(xiàn)語音識別的網(wǎng)元交互流程示意圖。
具體實施例方式
本發(fā)明的基本思想用戶通過撥打彩鈴IVR流程接入碼,觸發(fā)IVR業(yè)務(wù)邏 輯,由IVR業(yè)務(wù)邏輯控制語音識別引擎識別用戶錄入的語音,并將語音識別結(jié) 果返回IVR業(yè)務(wù)邏輯。
本發(fā)明關(guān)鍵在于擴展Parlay的SENDUI接口 ,使之能夠攜帶語音識別所需 要的參數(shù),包括語音識別引擎地址、識別使用的語法規(guī)則等信息;IVR業(yè)務(wù)邏 輯將語音識別所需參數(shù)信息發(fā)送給業(yè)務(wù)控制點,業(yè)務(wù)控制點對該擴展SENDUI 接口信息進(jìn)行處理,將SENDUI接口所攜帶的信息轉(zhuǎn)換成INFO消息,發(fā)送到 媒體服務(wù)器上,使媒體服務(wù)器可以依照這些參數(shù),完成與語音識別引擎之間的 交互,進(jìn)而4吏語音識別引擎完成對用戶錄入語音的識別。這里,所述擴展Parlay的SENDUI接口具體就是在SENDUI接口中增加 一個UIASRCriteria字段,通過該字段攜帶語音識別所需的參數(shù)。由于INFO消 息是媒體服務(wù)器能夠識別的標(biāo)準(zhǔn)消息,所述將SENDUI接口所攜帶的信息轉(zhuǎn)換 成INFO消息實際就是將Parlay協(xié)議下的消息轉(zhuǎn)化成SIP協(xié)議下的消息。
本發(fā)明在彩鈴系統(tǒng)中實現(xiàn)語音識別的系統(tǒng),如圖1所示,該系統(tǒng)包括交 換機、業(yè)務(wù)控制點(SCP)、 IVR業(yè)務(wù)邏輯、媒體服務(wù)器(MS)和語音識別引 擎(ASR);其中,
所述交換機,用于接收用戶撥打的接入碼,向業(yè)務(wù)控制點發(fā)起邀請,觸發(fā) 智能業(yè)務(wù);
所述業(yè)務(wù)控制點,是IVR業(yè)務(wù)的執(zhí)行環(huán)境,負(fù)責(zé)解析執(zhí)行業(yè)務(wù)指令,并由 IVR業(yè)務(wù)邏輯控制完成與交換機、媒體服務(wù)器之間的信息交互;
所述IVR業(yè)務(wù)邏輯,是根據(jù)彩鈴業(yè)務(wù)要求,使用業(yè)務(wù)生成環(huán)境(SCE)開 發(fā)的業(yè)務(wù)邏輯;用于控制對用戶的放音、收號、用戶錄入信息的處理,并根據(jù) 用戶的選擇和業(yè)務(wù)邏輯設(shè)定,完成業(yè)務(wù)功能的實現(xiàn)。
所述媒體服務(wù)器,用于根據(jù)業(yè)務(wù)控制點的指示,進(jìn)行放音、收號等操作, 并根據(jù)指示與語音識別引擎進(jìn)^M言息交互,將語音識別結(jié)果透傳給業(yè)務(wù)控制點, 經(jīng)由業(yè)務(wù)控制點通知IVR業(yè)務(wù)邏輯;
這里,所述媒體服務(wù)器通過擴展的Parlay的SENDUI接口與業(yè)務(wù)控制點交 互信息;所述與語音識別引擎進(jìn)行信息交互至少包括通知語音識別引擎開始 語音識別、接收語音識別引擎返回的語音識別結(jié)果。
所述語音識別引擎,在業(yè)務(wù)控制點的控制下,對用戶錄入的語音進(jìn)行識別, 并上報語音識別結(jié)果。
基于圖l所示系統(tǒng)架構(gòu),IVR業(yè)務(wù)邏輯處于一個核心控制的位置,IVR業(yè) 務(wù)邏輯通過業(yè)務(wù)控制點控制媒體服務(wù)器的放音、以及與語音識別引擎的交互, 并對語音識別結(jié)果進(jìn)行處理。本發(fā)明在彩鈴系統(tǒng)中實現(xiàn)語音識別的方法,如圖 2所示,包括以下步驟
步驟201,用戶撥打彩鈴IVR流程的接入碼,觸發(fā)IVR業(yè)務(wù)邏輯;這里,所述彩鈴IVR流程的接入碼是之前設(shè)定好的特定業(yè)務(wù)接入碼,撥打 此接入碼就表示要觸發(fā)彩鈴IVR流程。具體的,該接入碼在交換機上觸發(fā)智能 業(yè)務(wù)中的IVR業(yè)務(wù)邏輯,進(jìn)入彩鈴業(yè)務(wù)的IVR流程。
步驟.202,指示媒體服務(wù)器準(zhǔn)備放音;
具體的,IVR業(yè)務(wù)邏輯通過業(yè)務(wù)控制點指示4某體服務(wù)器分配好放音資源準(zhǔn) 備放音,并指示交換機連接到媒體服務(wù)器上。
步驟203,指示媒體服務(wù)器播放通知音,通知用戶準(zhǔn)備錄入語音;
這里,IVR業(yè)務(wù)邏輯通過業(yè)務(wù)控制點指示媒體服務(wù)器。
步驟204,指示媒體服務(wù)器連接語音識別引擎;
這里,IVR業(yè)務(wù)邏輯通過業(yè)務(wù)控制點指示々某體服務(wù)器。
步驟205,用戶開始錄入語音,語音識別引擎開始識別用戶錄入的語音;
步驟206,語音識別引擎將語音識別結(jié)果通知IVR業(yè)務(wù)邏輯,IVR業(yè)務(wù)邏 輯處理語音識別結(jié)果。
這里,語音識別引擎先將語音識別結(jié)果發(fā)送給媒體服務(wù)器,由媒體服務(wù)器 通過業(yè)務(wù)控制點通知IVR業(yè)務(wù)邏輯。IVR業(yè)務(wù)邏輯對語音識別結(jié)果進(jìn)行處理, 以便后續(xù)業(yè)務(wù)需要時使用語音識別結(jié)果。
圖3為本發(fā)明在彩鈴系統(tǒng)中實現(xiàn)語音識別過程中,業(yè)務(wù)控制點、IVR業(yè)務(wù) 邏輯、媒體服務(wù)器、語音識'別引擎等網(wǎng)元之間的交互流程示意圖,如圖3所示, 本發(fā)明在彩鈴系統(tǒng)中實現(xiàn)語音識別的交換流程包括以下步驟
步驟301,用戶撥打IVR接入碼,在交換機上觸發(fā)智能業(yè)務(wù)中的IVR業(yè)務(wù) 邏輯,交換機發(fā)送邀請INVITE請求到業(yè)務(wù)控制點,將后續(xù)業(yè)務(wù)處理流程的控 制交給業(yè)務(wù)控制點負(fù)責(zé);
這里,所述INVITE請求中攜帶有業(yè)務(wù)鍵信息,所述業(yè)務(wù)鍵信息是一個業(yè) 務(wù)的標(biāo)識,表示本次需要觸發(fā)的是彩鈴業(yè)務(wù)還是其他某種業(yè)務(wù),業(yè)務(wù)鍵信息的 內(nèi)容就是一個數(shù)字,比如彩鈴業(yè)務(wù)采用59表示。
步驟302,業(yè)務(wù)控制點根據(jù)INVITE消息中的業(yè)務(wù)鍵信息,通過Parlay SENDUI接口的地址事件通知報告消息AddressEventNotifyReport,觸發(fā)彩鈴業(yè)務(wù)中的IVR業(yè)務(wù)邏輯;
步驟303, IVR業(yè)務(wù)邏輯在完成對用戶的合法性、權(quán)限等信息認(rèn)證后,向 業(yè)務(wù)控制點發(fā)送生成UI消息CreateUI,指示業(yè)務(wù)控制點呼叫媒體服務(wù)器;
步驟304,業(yè)務(wù)控制點向媒體服務(wù)器發(fā)送邀請INVITE請求,呼叫媒體服務(wù)
器;
步驟305,々某體服務(wù)器收到邀請請求后,開始分配語音資源準(zhǔn)備;^文音,完 成后向業(yè)務(wù)控制點返回確iU肖息200 OK;
步驟306,業(yè)務(wù)控制點收到200 OK后向媒體服務(wù)器返回應(yīng)答消息ACK;
步驟307,業(yè)務(wù)控制點向交換機返回200 0K消息,指示交換機連接到媒體 服務(wù)器分配的語音資源上;'
這里,業(yè)務(wù)控制點收到媒體服務(wù)器的200 OK確認(rèn)信息后,知道媒體服務(wù) 器已經(jīng)做好放音準(zhǔn)備,所以向交換機返回200 OK消息,通知交換機可以連接 媒體服務(wù)器。
步驟308,交換機連接到媒體服務(wù)器的語音資源上,連接成功后向業(yè)務(wù)控 制點返回ACK消息;
步驟309,業(yè)務(wù)控制點收到交換機返回的ACK后,向IVR業(yè)務(wù)邏輯返回 CreateUI響應(yīng),通知IVR業(yè)務(wù)邏輯放音設(shè)備已經(jīng)準(zhǔn)備就緒;
步驟310, IVR業(yè)務(wù)邏輯收到后向業(yè)務(wù)控制點發(fā)送SendUI消息,通知媒體 服務(wù)器放音;
步驟311,業(yè)務(wù)控制點將SendUI消息轉(zhuǎn)換成INFO消息通知士某體服務(wù)器, 媒體服務(wù)器開始向用戶播放通知音;
步驟312,媒體服務(wù)器向業(yè)務(wù)控制點返回200OK,通知業(yè)務(wù)控制點放音成
功;
步驟313,業(yè)務(wù)控制點向IVR業(yè)務(wù)邏輯發(fā)送SendUI響應(yīng),通知IVR業(yè)務(wù) 邏輯放音已經(jīng)成功;
步驟314, IVR業(yè)務(wù)邏輯再次向業(yè)務(wù)控制點發(fā)送SendUI消息;
其中,該SendUI消息中包括語音識別引擎的地址、語音識別使用的語法規(guī)則等信息;
步驟315,業(yè)務(wù)控制點將SendUI消息轉(zhuǎn)換成INFO消息,并將相關(guān)的語音 識別信息封裝在INFO消息中,發(fā)送給媒體服務(wù)器;
這里,所述相關(guān)的語音識別信息包括語音識別引擎的地址、語音識別使用 的語法規(guī)則等信息;
步驟316,媒體服務(wù)器根據(jù)INFO消息中的語音識別引擎地址、語法規(guī)則, 連接語音識別引擎,通知語音識別引擎開始語音識別;
步驟317,媒體服務(wù)器發(fā)送200OK消息,表示與語音識別引擎已經(jīng)連接完 畢;之后,用戶開始錄入語音,語音識別引擎根據(jù)指定的語法規(guī)則進(jìn)行識別;
這里,所述的語法規(guī)則為已有技術(shù),是現(xiàn)有語音識別系統(tǒng)已經(jīng)使用的技術(shù), 主要用于對準(zhǔn)備識別的語音進(jìn)行規(guī)則定義,比如對"你的號碼為13911112222" 這句話進(jìn)行識別,對應(yīng)的語法規(guī)則就是"文本+數(shù)字";相應(yīng)的,具體語音識別 引擎如何對用戶錄入語音進(jìn)行識別為已有技術(shù),在此不再詳述。
步驟318,語音錄入完畢,語音識別引擎將語音識別結(jié)果報告給媒體服務(wù)
器;
步驟319,々某體服務(wù)器向業(yè)務(wù)控制點發(fā)送INFO消息,向業(yè)務(wù)控制點報告語 音識別結(jié)果;
步驟320,業(yè)務(wù)控制點向IVR業(yè)務(wù)邏輯發(fā)送SendUI響應(yīng),上才艮語音識別結(jié)
杲;
步驟321,業(yè)務(wù)控制點收到后,向媒體服務(wù)器發(fā)送200OK消息,表示語音 識別結(jié)束;
步驟322,媒體服務(wù)器斷開與語音識別引擎的連接,釋放語音資源;
步驟323, IVR業(yè)務(wù)邏輯根據(jù)用戶錄入的語音內(nèi)容,進(jìn)行后續(xù)處理,以提
供給彩鈴業(yè)務(wù)^吏用。
以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護(hù)范
圍,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)
包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種在彩鈴系統(tǒng)中實現(xiàn)語音識別的系統(tǒng),其特征在于,該系統(tǒng)包括業(yè)務(wù)控制點、交互式語音應(yīng)答IVR業(yè)務(wù)邏輯、媒體服務(wù)器和語音識別引擎;其中,所述業(yè)務(wù)控制點,用于解析執(zhí)行業(yè)務(wù)指令,并由IVR業(yè)務(wù)邏輯控制完成與媒體服務(wù)器之間的信息交互;所述IVR業(yè)務(wù)邏輯,用于控制對用戶的放音、收號、用戶錄入信息的處理,并根據(jù)用戶的選擇和業(yè)務(wù)邏輯設(shè)定完成業(yè)務(wù)功能;所述媒體服務(wù)器,用于根據(jù)業(yè)務(wù)控制點的指示操作,并根據(jù)指示與語音識別引擎進(jìn)行信息交互,將語音識別結(jié)果通知IVR業(yè)務(wù)邏輯;所述語音識別引擎,用于在業(yè)務(wù)控制點的控制下,對用戶錄入的語音進(jìn)行識別,并上報語音識別結(jié)果。
2、 根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,該系統(tǒng)還包括交換機,用于 接收用戶撥打的接入碼,并向業(yè)務(wù)控制點發(fā)起邀請;所述業(yè)務(wù)控制點,還進(jìn)一步由IVR業(yè)務(wù)邏輯控制完成與交換機之間的信息 交互。
3、 根據(jù)權(quán)利要求1或2所述的系統(tǒng),其特征在于,所述業(yè)務(wù)控制點與媒體 服務(wù)器通過擴展的Parlay的SENDUI接口交互信息。
4、 根據(jù)權(quán)利要求1或2所述的系統(tǒng),其特征在于,所述々某體服務(wù)器與語音 識別引擎進(jìn)行信息交互包括通知語音識別引擎開始語音識別、接收語音識別 引擎返回的語音識別結(jié)果。
5、 一種在彩鈴系統(tǒng)中實現(xiàn)語音識別的方法,其特征在于,觸發(fā)IVR業(yè)務(wù) 邏輯;該方法還包括媒體服務(wù)器根據(jù)IVR業(yè)務(wù)邏輯指示準(zhǔn)備放音,并通知用戶準(zhǔn)備錄入語音; 媒體服務(wù)器連接語音識別引擎,語音識別引擎識別用戶錄入的語音,并將 語音識別結(jié)果通知IVR業(yè)務(wù)邏輯,IVR業(yè)務(wù)邏輯處理語音識別結(jié)果。
6、 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述觸發(fā)IVR業(yè)務(wù)邏輯為用戶撥打彩鈴IVR流程的接入碼觸發(fā)IVR業(yè)務(wù)邏輯。
7、 根據(jù)權(quán)利要求5或6所述的方法,其特征在于,所述媒體服務(wù)器根據(jù)IVR 業(yè)務(wù)邏輯指示準(zhǔn)備;^文音具體包括IVR業(yè)務(wù)邏輯向業(yè)務(wù)控制點發(fā)送生成UI消息,指示業(yè)務(wù)控制點呼叫媒體服 務(wù)器;業(yè)務(wù)控制點向媒體服務(wù)器發(fā)送邀請INVITE請求,呼叫媒體服務(wù)器;媒體服務(wù)器收到邀請請求后,分配語音資源準(zhǔn)備放音,完成后向業(yè)務(wù)控制 點返回200 OK消息;業(yè)務(wù)控制點收到200 OK后向媒體服務(wù)器返回ACK消息;業(yè)務(wù)控制點向交換機返回200 OK消息,指示交換機連接到媒體服務(wù)器分 配的語音資源上;交換才幾連接成功后向業(yè)務(wù)控制點返回ACK消息;業(yè)務(wù)控制點通知IVR業(yè)務(wù)邏輯放音設(shè)備已經(jīng)準(zhǔn)備就緒,IVR業(yè)務(wù)邏輯通知 媒體服務(wù)器放音。
8、 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述通知用戶準(zhǔn)備錄入語音 包括IVR業(yè)務(wù)邏輯向業(yè)務(wù)控制點發(fā)送SendUI消息,通知媒體服務(wù)器放音; 業(yè)務(wù)控制點將SendUI消息轉(zhuǎn)換成INFO消息通知媒體服務(wù)器,媒體服務(wù)器開始向用戶播J丈通知音;媒體服務(wù)器通知業(yè)務(wù)控制點放音成功;業(yè)務(wù)控制點通知IVR業(yè)務(wù)邏輯放音已經(jīng)成功。
9、 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述纟某體服務(wù)器連接語音識 別引擎之前,該方法還包括IVR業(yè)務(wù)邏輯向業(yè)務(wù)控制點發(fā)送SendUI消息,該消息中包括語音識別弓1擎 的地址、語音識別使用的語法規(guī)則;業(yè)務(wù)控制點將SendUI消息轉(zhuǎn)換成INFO消息,并將相關(guān)的語音識別信息封 裝在INFO消息中,發(fā)送給媒體服務(wù)器;所述媒體服務(wù)器根據(jù)INFO消息中的語音識別引擎地址、語法規(guī)則,連接 語音識別引擎。
10、 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述將語音識別結(jié)果通知IVR業(yè)務(wù)邏輯具體為語音識別引擎將語音識別結(jié)果報告給媒體服務(wù)器,i某體服務(wù)器向業(yè)務(wù)控制點報告語音識別結(jié)果,業(yè)務(wù)控制點向IVR業(yè)務(wù)邏輯上報語音識別結(jié)果。
全文摘要
本發(fā)明公開了一種在彩鈴系統(tǒng)中實現(xiàn)語音識別的系統(tǒng),包括業(yè)務(wù)控制點,用于解析執(zhí)行業(yè)務(wù)指令,并由IVR業(yè)務(wù)邏輯控制完成與媒體服務(wù)器之間的信息交互;IVR業(yè)務(wù)邏輯,用于控制對用戶的放音、收號、用戶錄入信息的處理,并根據(jù)用戶的選擇和業(yè)務(wù)邏輯設(shè)定完成業(yè)務(wù)功能;媒體服務(wù)器,用于根據(jù)業(yè)務(wù)控制點的指示操作,并根據(jù)指示與語音識別引擎進(jìn)行信息交互,將語音識別結(jié)果通知IVR業(yè)務(wù)邏輯;語音識別引擎,用于在業(yè)務(wù)控制點的控制下,對用戶錄入的語音進(jìn)行識別,并上報語音識別結(jié)果。本發(fā)明還同時公開了一種在彩鈴系統(tǒng)中實現(xiàn)語音識別的方法,采用本發(fā)明能解決IVR流程中的信息交互問題,完成彩鈴IVR流程中的語音識別。
文檔編號H04Q3/00GK101621712SQ200910089749
公開日2010年1月6日 申請日期2009年7月22日 優(yōu)先權(quán)日2009年7月22日
發(fā)明者春 關(guān), 飚 潘 申請人:中興通訊股份有限公司