專利名稱:一種利用智能網(wǎng)實現(xiàn)語音撥號的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及智能網(wǎng)領(lǐng)域,具體涉及的是,一種利用智能網(wǎng)實現(xiàn)語音撥號的系統(tǒng)和方法。
背景技術(shù):
語音撥號改變了普通話機通過按鍵的撥號模式,采用語音識別方式可進行更輕松撥號,現(xiàn)有語音撥號裝置是安裝在話機終端,如圖1所示,基本原理如下普通話機安裝語音識別裝置后,裝置內(nèi)置一電子名片簿,將多個聯(lián)系人的信息記錄在內(nèi);用戶通過該話機呼叫聯(lián)系人姓名時,用戶接入裝置將聽筒輸入的語音信號送到語音識別模塊進行語音識別,用戶呼出裝置分析識別結(jié)果,并進行自動撥號,從而實現(xiàn)語音識別撥號的功能。比如中國專利號為zl03247910.7,公開號為CN2626149的“語音識別控制撥號的電話機”,中國專利號為zl03219193.6,公開號為CN2593487的“盲人電話撥號器”等。
從上述現(xiàn)有技術(shù)的實現(xiàn)原理來看,現(xiàn)有的語音撥號方法存在以下不足1、需要含有語音識別裝置的終端;2、電話簿保存在話機終端,用戶只能在自己的話機上使用該電話簿;3、語音撥號的交互界面不靈活,識別準(zhǔn)確率不高。
發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種利用智能網(wǎng)實現(xiàn)語音撥號的系統(tǒng)和方法,用戶通過普通固定電話、小靈通、手機等任意話機,可直接說出預(yù)先存儲在電信端的電話簿中聯(lián)系人姓名,即可實現(xiàn)自動快速查找和接通聯(lián)系人的語音撥號。
本發(fā)明的技術(shù)方案如下一種利用智能網(wǎng)實現(xiàn)語音撥號的系統(tǒng),其中,所述系統(tǒng)包括語音識別模塊和電話簿,并且設(shè)置在電信端,由一語音識別服務(wù)器進行語音識別,由智能網(wǎng)實現(xiàn)語音撥號功能。
所述的系統(tǒng),其中,所述系統(tǒng)包括業(yè)務(wù)處理流程模塊、語音識別模塊和電話簿數(shù)據(jù)庫;所述業(yè)務(wù)處理流程模塊用于語音撥號業(yè)務(wù)流程的分析處理;向用戶提供友好的語音交互界面,引導(dǎo)用戶按一定邏輯流程使用語音撥號業(yè)務(wù);所述語音識別模塊用于編譯和加載語法包,進行語音識別,使得語音撥號系統(tǒng)能夠“聽寫”出不同人所說出的連續(xù)語音;所述電話簿數(shù)據(jù)庫用于保存所有注冊用戶的電話簿。
所述的方法,其中,所述業(yè)務(wù)處理流程模塊還包括業(yè)務(wù)流程單元、語音交互單元、數(shù)據(jù)維護單元;所述業(yè)務(wù)流程單元用于用戶語音撥號的操作界面,負(fù)責(zé)引導(dǎo)用戶按一定邏輯流程使用語音撥號業(yè)務(wù),并支持用戶錯誤或系統(tǒng)錯誤的恢復(fù);所述業(yè)務(wù)流程單元通過所述語音交互單元向語音識別模塊發(fā)送語音加載指令,并將語音識別結(jié)果返回給業(yè)務(wù)流程單元;所述數(shù)據(jù)維護單元負(fù)責(zé)接收業(yè)務(wù)流程單元對電話簿數(shù)據(jù)庫的訪問操作指令,并將電話簿數(shù)據(jù)庫操作的執(zhí)行結(jié)果返回給業(yè)務(wù)流程單元。
所述的系統(tǒng),其中,所述語音識別模塊還包括語法加載單元、語音識別單元、語法編譯單元;所述語法加載單元用于將根據(jù)業(yè)務(wù)處理模塊的加載指令,加載相應(yīng)的已編譯好的語法包到內(nèi)存,送交語音識別單元進行語音識別,并向業(yè)務(wù)處理模塊傳遞語音識別結(jié)果;所述語音識別單元用于從加載在內(nèi)存的動態(tài)語法包中實時識別出用戶說出的語音信息;所述語法編譯單元負(fù)責(zé)編譯電話簿語法包,并將語法包保存到電話簿數(shù)據(jù)庫。
一種利用智能網(wǎng)實現(xiàn)語音撥號的方法,其包括步驟a用戶向系統(tǒng)提供自己的電話簿數(shù)據(jù),并存儲于所述電話簿數(shù)據(jù)庫;b用戶通過終端,撥打語音撥號業(yè)務(wù)的接入碼,進入業(yè)務(wù);c業(yè)務(wù)處理模塊解析用戶的主叫號碼,查詢電話簿數(shù)據(jù)庫,獲得該主叫用戶的電話簿信息;d語音識別模塊對用戶的語音信息進行識別;e業(yè)務(wù)處理模塊分析識別結(jié)果,利用智能網(wǎng)平臺實現(xiàn)相應(yīng)的操作。
本發(fā)明所提供的一種利用智能網(wǎng)實現(xiàn)語音撥號的系統(tǒng)和方法,與現(xiàn)有技術(shù)相比,其達到了用戶使用方便,電話簿永久保存,語音識別性能高的效果,提高了語音撥號在家庭和辦公中的普及應(yīng)用。具體效果包括1、該系統(tǒng)使用非常方便,用戶可以通過任何話機在任何時候訪問電話簿;2、該系統(tǒng)將用戶的電話簿永久安全地保存在電信服務(wù)端;3、該系統(tǒng)提供多樣靈活的人性化語音交互界面,提高語音識別準(zhǔn)確度;4、該系統(tǒng)可擴展性好;可以充分利用成熟的智能網(wǎng)語音消息平臺進行擴展其他服務(wù)內(nèi)容,包括群組發(fā)送短信,改號通知,漏話語音短信通知等功能。
圖1所示為目前語音撥號系統(tǒng)的示意圖;圖2為本發(fā)明語音撥號系統(tǒng)的結(jié)構(gòu)示意圖;圖3為本發(fā)明系統(tǒng)和方法的一較佳實施例的示意圖;圖4為本發(fā)明系統(tǒng)和方法的另一較佳實施例的流程示意圖;圖5為本發(fā)明系統(tǒng)和方法的語音撥號查詢聯(lián)系人流程圖;圖6為本發(fā)明系統(tǒng)和方法的語音撥號接通聯(lián)系人流程圖。
具體實施例方式
下面結(jié)合附圖,將對技術(shù)方案的實施作進一步的詳細描述本發(fā)明的利用智能網(wǎng)實現(xiàn)語音撥號的系統(tǒng)和方法的核心思想是將語音識別裝置和電話簿放在電信端,由企業(yè)級的語音識別服務(wù)器來進行語音識別,利用智能網(wǎng)實現(xiàn)語音撥號功能。
本發(fā)明所述的系統(tǒng)主要由三個模塊組成業(yè)務(wù)處理流程模塊、語音識別模塊和電話簿數(shù)據(jù)庫,如附圖2所示。所述業(yè)務(wù)處理流程模塊主要負(fù)責(zé)語音撥號業(yè)務(wù)流程的分析處理;向用戶提供友好的語音交互界面,引導(dǎo)用戶按一定邏輯流程使用語音撥號業(yè)務(wù)。語音識別模塊主要負(fù)責(zé)編譯和加載語法包,進行語音識別,使得語音撥號系統(tǒng)能夠“聽寫”出不同人所說出的連續(xù)語音。電話簿數(shù)據(jù)庫主要負(fù)責(zé)保存所有注冊用戶的電話簿信息。
所述業(yè)務(wù)處理模塊主要負(fù)責(zé)語音撥號業(yè)務(wù)流程的分析處理,用于接收用戶的操作請求并向用戶播放提示音報告操作結(jié)果,向用戶提供友好的語音交互界面,引導(dǎo)用戶按一定邏輯流程使用語音撥號業(yè)務(wù);分析進入業(yè)務(wù)的主叫號碼和被叫號碼,查找業(yè)務(wù)數(shù)據(jù)庫獲得電話簿主人相應(yīng)的信息;向語音識別模塊發(fā)送語法加載指令,并分析語音識別結(jié)果字符串,然后利用智能網(wǎng)平臺實現(xiàn)用戶想要的快速查詢或接通聯(lián)系人的操作。
所述業(yè)務(wù)處理模塊中的業(yè)務(wù)流程單元是用戶語音撥號的操作界面,負(fù)責(zé)引導(dǎo)用戶按一定邏輯流程使用語音撥號業(yè)務(wù),并支持用戶錯誤或系統(tǒng)錯誤的恢復(fù)。業(yè)務(wù)流程單元通過語音交互單元向語音識別模塊發(fā)送語音加載指令,并將語音識別結(jié)果返回給業(yè)務(wù)流程單元。數(shù)據(jù)維護單元負(fù)責(zé)接收業(yè)務(wù)流程單元對電話簿數(shù)據(jù)庫的訪問操作指令,并將電話簿數(shù)據(jù)庫操作的執(zhí)行結(jié)果返回給業(yè)務(wù)流程單元。從以上過程來看,業(yè)務(wù)處理模塊的工作性質(zhì)單一,主要負(fù)責(zé)向用戶提供友好的語音撥號的交互界面,與語音識別模塊分離,所以可以向用戶提供更靈活更友好的語音撥號交互界面,如圖5和圖6所示。
所述語音識別模塊主要負(fù)責(zé)對電話簿語法包進行動態(tài)語法編譯;執(zhí)行業(yè)務(wù)處理模塊發(fā)送過來的語法加載指令,把編譯好的語法包加載到內(nèi)存進行語音識別,并將語音識別結(jié)果返回給業(yè)務(wù)處理模塊。其中的語法加載單元負(fù)責(zé)將根據(jù)業(yè)務(wù)處理模塊的加載指令,加載相應(yīng)的已編譯好的語法包到內(nèi)存,送交語音識別單元進行語音識別,并向業(yè)務(wù)處理模塊傳遞語音識別結(jié)果。語音識別單元負(fù)責(zé)從加載在內(nèi)存的動態(tài)語法包中實時識別出用戶說出的語音信息。語法編譯單元負(fù)責(zé)編譯電話簿語法包,并將語法包保存到電話簿數(shù)據(jù)庫。為了使語音識別的系統(tǒng)容量和識別性能進行平滑地擴容,所以本發(fā)明的語音識別模塊可作為獨立模塊放在單獨的服務(wù)器上運行。如圖3所示。
所述電話簿數(shù)據(jù)庫負(fù)責(zé)保存用戶的電話簿,并保證數(shù)據(jù)安全。數(shù)據(jù)庫由專門的企業(yè)級的數(shù)據(jù)庫管理系統(tǒng)來維護,比如Oracle、SQL Server等。本發(fā)明的電話簿數(shù)據(jù)庫模塊可作為獨立模塊放在單獨的服務(wù)器上運行,也可以節(jié)約系統(tǒng)成本與業(yè)務(wù)處理模塊放在同一臺服務(wù)器上運行。
本發(fā)明所述的方法,主要由下面幾個步驟第1步用戶向系統(tǒng)提供自己的電話簿數(shù)據(jù);第2步用戶通過終端,撥打語音撥號業(yè)務(wù)的接入碼,進入業(yè)務(wù);第3步業(yè)務(wù)處理模塊解析用戶的主叫號碼,查詢電話簿數(shù)據(jù)庫,獲得該主叫用戶的電話簿信息;第4步語音識別模塊對用戶的語音信息進行識別;第5步業(yè)務(wù)處理模塊分析識別結(jié)果,利用智能網(wǎng)平臺實現(xiàn)相應(yīng)的操作。
下面結(jié)合圖3和圖4,對本發(fā)明的語音撥號方法進行具體舉例說明第1步用戶通過Internet遠程登陸該網(wǎng)站,在web界面上編輯自己的電話簿,電信局的web服務(wù)器接收用戶編輯好的電話簿,將電話簿數(shù)據(jù)保存在電信局的電話簿數(shù)據(jù)庫。
第2步用戶在開戶的話機(固定電話、小靈通或手機)上,摘機后撥打語音撥號業(yè)務(wù)的接入碼,比如96065。電信局的業(yè)務(wù)接入裝置收到用戶的96065撥號號碼后,觸發(fā)智能網(wǎng)平臺的語音撥號業(yè)務(wù)。
第3步業(yè)務(wù)處理模塊根據(jù)進入業(yè)務(wù)的主叫號碼,查詢數(shù)據(jù)庫獲得電話簿的主人相關(guān)信息,并判斷是否已登記該項業(yè)務(wù),如已登記,則向語音識別模塊發(fā)送指令,加載該電話簿主人的動態(tài)語法包。業(yè)務(wù)處理模塊同時向用戶播放系統(tǒng)提示音“請說出你要找的聯(lián)系人姓名”。如未登記,則提示輸入開戶電話號碼,在用戶輸入開戶電話號碼后提示輸入用戶密碼;用戶輸入密碼后對賬號和密碼進行驗證,如果成功則進行下一步,否則退出。
第4步用戶聽到提示音后,說“接通張三的手機”。該條語音通過PSTN或GSM傳到電信局的語音識別模塊。語音識別模塊根據(jù)加載到內(nèi)存的聯(lián)系人語法包,進行語音識別,然后將識別結(jié)果字符串返回給業(yè)務(wù)處理模塊。
第5步業(yè)務(wù)處理模塊分析該字符串,得到用戶想要的操作是“接通張三的手機”。業(yè)務(wù)處理模塊訪問電話簿數(shù)據(jù)庫,查詢得到張三的手機號碼,然后利用智能網(wǎng)平臺呼叫張三的手機。如未查詢到張三的手機號,則向用戶廣播提示音,提示該用戶沒有填寫手機號碼。
如圖6所示的,本發(fā)明方法步驟中,系統(tǒng)可以設(shè)置根據(jù)用戶語音要求的不同系統(tǒng)自動識別并完成相應(yīng)的操作,如在系統(tǒng)提示請說出你要找的聯(lián)系人姓名時,用戶可以只說“張三”或“接通張三”,系統(tǒng)將自動依預(yù)定的順序呼叫張三的手機號碼、辦公室電話和家庭電話,而用戶有選擇的說“接通張三的手機”時,系統(tǒng)將只呼叫張三的手機。
如圖5所示的,本發(fā)明方法還可以實現(xiàn)更多的功能,如對電話本的語音查詢功能,當(dāng)系統(tǒng)提示用戶要找的聯(lián)系人姓名時,用戶如果說“查詢張三”,則系統(tǒng)會對電話簿中的張三記錄信息進行提示,查詢的是其手機號、辦公電話、家庭號碼或是電子郵箱還是通訊地址等記錄項,用戶可相應(yīng)語音回答,如果回答是電話號碼查詢,如用戶回答“手機號碼”,則系統(tǒng)查詢到后用語音提示用戶,并隨即詢問是否接通,如用戶回答“是”,將立即進行相應(yīng)號碼的呼叫;此過程在用戶從一開始即回答“查詢張三的手機”的結(jié)果是相同的,即系統(tǒng)同樣會查詢該號碼,并詢問是否接通。如果用戶回答查詢的不是號碼,例如是電子郵件或通訊地址,系統(tǒng)將從電話簿數(shù)據(jù)庫中讀取對應(yīng)數(shù)據(jù)并進行語音提示回答。因此,本發(fā)明方法非常容易進行功能的擴展。
從上述步驟可以看出,本發(fā)明方法的主要特征在于將語音識別裝置和電話簿放在電信端,利用智能網(wǎng)實現(xiàn)語音撥號功能,并通過Internet來維護電話簿。與本文背景技術(shù)介紹的其它方法相比較,本專利方法具備用戶使用方便,電話簿永久保存,語音識別性能高的特點。
采用本發(fā)明所述系統(tǒng)和方法,與現(xiàn)有技術(shù)相比,達到了用戶使用方便,電話簿永久保存,語音識別性能高的效果,提高了語音撥號在家庭和辦公中的普及應(yīng)用等等。本發(fā)明系統(tǒng)使用非常方便,用戶可以通過任何話機在任何時候訪問電話簿;將用戶的電話簿永久安全地保存在電信服務(wù)端,并能提供多樣靈活的人性化語音交互界面,提高語音識別準(zhǔn)確度;本發(fā)明系統(tǒng)可擴展性好,可以充分利用成熟的智能網(wǎng)語音消息平臺進行擴展其他服務(wù)內(nèi)容,包括群組發(fā)送短信,改號通知,漏話語音短信通知等功能。
應(yīng)當(dāng)理解的是,本發(fā)明上述針對具體實施例的描述較為具體,并不能因此而理解為對本發(fā)明的專利保護范圍的限制,本發(fā)明的專利保護范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
1.一種利用智能網(wǎng)實現(xiàn)語音撥號的系統(tǒng),其特征在于,所述系統(tǒng)包括語音識別模塊和電話簿,并且設(shè)置在電信端,由一語音識別服務(wù)器進行語音識別,由智能網(wǎng)實現(xiàn)語音撥號功能。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述系統(tǒng)包括業(yè)務(wù)處理流程模塊、語音識別模塊和電話簿數(shù)據(jù)庫;所述業(yè)務(wù)處理流程模塊用于語音撥號業(yè)務(wù)流程的分析處理;向用戶提供友好的語音交互界面,引導(dǎo)用戶按一定邏輯流程使用語音撥號業(yè)務(wù);所述語音識別模塊用于編譯和加載語法包,進行語音識別,使得語音撥號系統(tǒng)能夠“聽寫”出不同人所說出的連續(xù)語音;所述電話簿數(shù)據(jù)庫用于保存所有注冊用戶的電話簿。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述業(yè)務(wù)處理流程模塊還包括業(yè)務(wù)流程單元、語音交互單元、數(shù)據(jù)維護單元;所述業(yè)務(wù)流程單元用于用戶語音撥號的操作界面,負(fù)責(zé)引導(dǎo)用戶按一定邏輯流程使用語音撥號業(yè)務(wù),并支持用戶錯誤或系統(tǒng)錯誤的恢復(fù);所述業(yè)務(wù)流程單元通過所述語音交互單元向語音識別模塊發(fā)送語音加載指令,并將語音識別結(jié)果返回給業(yè)務(wù)流程單元;所述數(shù)據(jù)維護單元負(fù)責(zé)接收業(yè)務(wù)流程單元對電話簿數(shù)據(jù)庫的訪問操作指令,并將電話簿數(shù)據(jù)庫操作的執(zhí)行結(jié)果返回給業(yè)務(wù)流程單元。
4.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于,所述語音識別模塊還包括語法加載單元、語音識別單元、語法編譯單元;所述語法加載單元用于將根據(jù)業(yè)務(wù)處理模塊的加載指令,加載相應(yīng)的已編譯好的語法包到內(nèi)存,送交語音識別單元進行語音識別,并向業(yè)務(wù)處理模塊傳遞語音識別結(jié)果;所述語音識別單元用于從加載在內(nèi)存的動態(tài)語法包中實時識別出用戶說出的語音信息;所述語法編譯單元負(fù)責(zé)編譯電話簿語法包,并將語法包保存到電話簿數(shù)據(jù)庫。
5.一種利用智能網(wǎng)實現(xiàn)語音撥號的方法,其包括步驟a用戶向系統(tǒng)提供自己的電話簿數(shù)據(jù),并存儲于所述電話簿數(shù)據(jù)庫;b用戶通過終端,撥打語音撥號業(yè)務(wù)的接入碼,進入業(yè)務(wù);c業(yè)務(wù)處理模塊解析用戶的主叫號碼,查詢電話簿數(shù)據(jù)庫,獲得該主叫用戶的電話簿信息;d語音識別模塊對用戶的語音信息進行識別;e業(yè)務(wù)處理模塊分析識別結(jié)果,利用智能網(wǎng)平臺實現(xiàn)相應(yīng)的操作。
全文摘要
本發(fā)明的一種利用智能網(wǎng)實現(xiàn)語音撥號的系統(tǒng)和方法,所述系統(tǒng)包括語音識別模塊和電話簿,并且設(shè)置在電信端,由一語音識別服務(wù)器進行語音識別,由智能網(wǎng)實現(xiàn)語音撥號功能。本發(fā)明系統(tǒng)和方法,與現(xiàn)有技術(shù)相比,其達到了用戶使用方便,電話簿永久保存,語音識別性能高的效果,提高了語音撥號在家庭和辦公中的普及應(yīng)用。
文檔編號H04Q3/00GK1893482SQ20051008038
公開日2007年1月10日 申請日期2005年7月4日 優(yōu)先權(quán)日2005年7月4日
發(fā)明者李滿海, 胡志堯, 王祺, 曾林 申請人:中興通訊股份有限公司