專利名稱:電話語音交互的信息服務(wù)系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電話信息服務(wù)技術(shù),特別是一種電話語音交互的信息服務(wù)系統(tǒng)及方法。
現(xiàn)有的電話信息服務(wù)技術(shù),如
圖1所示,其為以自動信息服務(wù)臺168為代表的聲信服務(wù)系統(tǒng)的示意圖。其典型特征是使用信息查詢的代碼檢索和信息內(nèi)容的錄音存儲。該類系統(tǒng)一般由用戶電話、電話網(wǎng)、城市節(jié)點三部分組成。城市節(jié)點主要包括接入與交換模塊、業(yè)務(wù)管理模塊、語音文件庫模塊及數(shù)據(jù)庫模塊;用戶查詢信息時,以用戶電話的數(shù)字鍵輸入固定的信息代碼,信息代碼通過電話網(wǎng)傳送至城市節(jié)點,城市節(jié)點的接入與交換模塊接收到信息代碼,檢索出與該信息代碼對應(yīng)的錄音文件,并通過語音卡播放該錄音文件,語音信號通過電話網(wǎng)傳送到用戶電話,用戶聽到信息內(nèi)容。該類系統(tǒng)具有如下特征以用戶電話為信息查詢終端,以按電話機上的數(shù)字鍵的方式提出查詢要求;用戶提出查詢要求時,通過電話網(wǎng)由用戶電話端向城市節(jié)點傳送的是表示0-9的雙音多頻(DTMF)信號;信息的存儲是以錄音方式,存儲的內(nèi)容是錄音文件;各個城市的聲信系統(tǒng)各自孤立運行,系統(tǒng)之間不互聯(lián),數(shù)據(jù)不共享。
自動信息服務(wù)臺168為代表的傳統(tǒng)聲信服務(wù)系統(tǒng)存在如下不足信息查詢要求以數(shù)字代碼方式提出,要求用戶記憶信息代碼或隨身攜帶代碼本。但是,聲信服務(wù)的內(nèi)容龐雜,每條內(nèi)容對應(yīng)一個數(shù)字代碼,要求用戶記憶代碼幾乎不可能。同時,由于用戶使用聲信服務(wù)的隨機性很大,隨身攜帶代碼本的可能性也很小。缺乏一個響應(yīng)用戶查詢要求的便捷方法是阻礙傳統(tǒng)聲信系統(tǒng)迅速發(fā)展的主要瓶頸之一;
信息存儲以錄音方式,信息內(nèi)容的任何更新都得經(jīng)過錄音、編輯、替換等過程,信息內(nèi)容無法具備實時性,這是阻礙傳統(tǒng)聲信系統(tǒng)迅速發(fā)展的主要瓶頸之二;城市節(jié)點需要存儲巨量的錄音文件,要求城市節(jié)點存儲量巨大。巨量的語音數(shù)據(jù)同時需要由復雜的大型數(shù)據(jù)庫進行管理,造成系統(tǒng)投資居高不下。一個中等城市傳統(tǒng)聲信服務(wù)系統(tǒng)的投資一般都在近千萬元人民幣。同時,隨著每條信息的更新都必須進行錄音、替換,系統(tǒng)維護成本也居高不下。
各自孤立的系統(tǒng)造成大量的重復投資。同時,各自孤立的系統(tǒng)更制約了信息源的迅速豐富,這是阻礙傳統(tǒng)聲信系統(tǒng)迅速發(fā)展的主要瓶頸之三。
本發(fā)明的目的在于提供一種可使用電話語音交互的信息服務(wù)系統(tǒng),稱之為“電話因特”。
本發(fā)明的另一目的在于提供一種可使用電話語音交互的信息服務(wù)方法。
利用本發(fā)明的系統(tǒng)及方法可使人們能夠利用電話機(包括手機)或傳真機等簡易終端,通過語音(輔以少量按鍵)實現(xiàn)信息的獲取與發(fā)送的信息服務(wù)。
為達到上述目的,本發(fā)明采取如下措施本發(fā)明的一種電話語音交互的信息服務(wù)系統(tǒng),包括城市節(jié)點,城市節(jié)點包括業(yè)務(wù)控制模塊、業(yè)務(wù)數(shù)據(jù)模塊、接入與交換模塊、業(yè)務(wù)管理模塊;各個模塊通過一計算機網(wǎng)絡(luò)相連接;其特征在于城市節(jié)點還包括與計算機網(wǎng)絡(luò)連接的遠程通信模塊。
其中所述城市節(jié)點還包括與計算機網(wǎng)絡(luò)連接的語音識別服務(wù)模塊;語音識別服務(wù)模塊對電話語音信號進行自動增益控制處理、自適應(yīng)噪聲濾除及聲學模式識別處理。
其中所述城市節(jié)點還包括與計算機網(wǎng)絡(luò)連接的語音合成服務(wù)模塊;語音合成模塊提供從文本到語音的轉(zhuǎn)換,經(jīng)語法分析詞匯分割、基音選擇與拼接,以及口腔發(fā)音模擬,合成語音信號。
其中所述城市節(jié)點還包括與計算機網(wǎng)絡(luò)連接的語音合成服務(wù)模塊;語音合成模塊提供從文本到語音的轉(zhuǎn)換,經(jīng)語法分析詞匯分割、基音選擇與拼接,以及口腔發(fā)音模擬,合成語音信號。
本發(fā)明的另一種電話語音交互的信息服務(wù)系統(tǒng),包括城市節(jié)點,城市節(jié)點包括業(yè)務(wù)控制模塊、業(yè)務(wù)數(shù)據(jù)模塊、接入與交換模塊、業(yè)務(wù)管理模塊;各個模塊通過一局域網(wǎng)相連接;其特征在于還包括各城市節(jié)點間的網(wǎng)絡(luò)連接。
其中所述城市節(jié)點還包括與所述局域網(wǎng)連接的遠程通信模塊。
其中所述城市節(jié)點還包括與局域網(wǎng)連接的www服務(wù)模塊。
其中所述城市節(jié)點還包括與局域網(wǎng)相連接的語音識別服務(wù)模塊。
其中所述城市節(jié)點還包括與局域網(wǎng)相連接的語音合成服務(wù)模塊。
其中所述各城市節(jié)點間的網(wǎng)絡(luò)連接符合TCP/IP協(xié)議。
其中所述各城市節(jié)點間的網(wǎng)絡(luò)連接為IP網(wǎng)絡(luò)。
本發(fā)明的一種電話語音交互的信息服務(wù)方法,包括如下步驟a、用戶通過終端設(shè)備,撥特服號,通過電話網(wǎng)與接入中繼接入城市節(jié)點;b、用戶口述業(yè)務(wù)名稱的語音信號經(jīng)接入與交換模塊接收,并經(jīng)語音識別服務(wù)模塊識別業(yè)務(wù)類別,確定業(yè)務(wù)類別及其所在地;若不在本地;c、經(jīng)遠程通信模塊及廣域網(wǎng)轉(zhuǎn)發(fā)至目的城市節(jié)點;d、目的城市的城市節(jié)點,經(jīng)語音識別服務(wù)模塊識別出業(yè)務(wù)名稱后,經(jīng)業(yè)務(wù)控制模塊進入該項業(yè)務(wù)的業(yè)務(wù)流程;e、用戶進一步與系統(tǒng)交互。
其中所述步驟b中,經(jīng)語音識別服務(wù)模塊識別出業(yè)務(wù)類別在本地;進行如下步驟經(jīng)業(yè)務(wù)控制模塊進入相應(yīng)業(yè)務(wù)的業(yè)務(wù)流程,用戶進一步與系統(tǒng)交互。
其中如果查詢結(jié)果(包括接收的Email)為文本格式,則進行以下步驟語音合成服務(wù)模塊將文本內(nèi)容轉(zhuǎn)換成語音信號,最后通過接入與交換模塊輸出語音信號。
其中所述步驟b中,系統(tǒng)可以錄取用戶通過電話話筒口述的郵件內(nèi)容,并存為某種語音格式,作為電子郵件的內(nèi)容發(fā)送出去。
結(jié)合附圖及實施例對本發(fā)明的具體結(jié)構(gòu)特征及方法特征詳細說明如下附圖簡要說明圖1現(xiàn)有的自動信息服務(wù)臺系統(tǒng)中城市節(jié)點的電路方框圖;圖2本發(fā)明中的城市節(jié)點的電路方框圖;圖3本發(fā)明的聯(lián)網(wǎng)示意圖;圖4本發(fā)明城市節(jié)點中的電話語音識別的流程圖;圖5本發(fā)明城市節(jié)點中的電話語音合成的流程圖。
圖6本發(fā)明方法的流程示意圖。
本發(fā)明的電話語音交互的信息服務(wù)系統(tǒng)包括兩大部分各城市節(jié)點(見圖2)和聯(lián)網(wǎng)方案(見圖3);如圖2所示,城市節(jié)點主要由業(yè)務(wù)控制模塊1、業(yè)務(wù)數(shù)據(jù)模塊2、接入與交換模塊3、語音識別服務(wù)模塊4、語音合成服務(wù)模塊5、業(yè)務(wù)管理模塊6、www服務(wù)模塊7、遠程通信模塊8組成;在邏輯上,各個模塊各司其職、協(xié)同工作;從結(jié)構(gòu)上,各個模塊可以一并運行在一臺機器上,也可以運行在兩臺或多臺機器上,這些機器通過局域網(wǎng)9相連接。為了便于完整體現(xiàn)城市節(jié)點的工作過程,圖2中還包括了用戶電話(或手機)10、用戶傳真機11、外部自動臺12、外部人工臺13、電話網(wǎng)14和接入中繼15。
不同的業(yè)務(wù)有不同的業(yè)務(wù)流程,如企業(yè)信息查詢業(yè)務(wù)與語音Email業(yè)務(wù)的業(yè)務(wù)流程就相差甚遠,業(yè)務(wù)控制模塊1上加載著所有業(yè)務(wù)的業(yè)務(wù)流程,業(yè)務(wù)流程通常會有分支,業(yè)務(wù)控制模塊1根據(jù)接入與交換模塊3上報的事件(如用戶發(fā)了某條語音命令,或按了某號鍵),決定下一步的動作,例如是播放提示音,還是接輸入用戶的輸入信號,還是查詢數(shù)據(jù)庫等。業(yè)務(wù)控制模塊1支持業(yè)務(wù)的動態(tài)加載、卸載,而不影響其他業(yè)務(wù)的運行。
業(yè)務(wù)數(shù)據(jù)模塊2存放著城市節(jié)點的各種數(shù)據(jù),包括業(yè)務(wù)數(shù)據(jù)、用戶數(shù)據(jù)和計費數(shù)據(jù)等,業(yè)務(wù)數(shù)據(jù)模塊2支持大規(guī)模并發(fā)訪問,并且具有實時備份機制。
接入與交換模塊3可以看成是計算機與語音/傳真卡組合而成的功能強大的交換機,主要功能如下通過語音/傳真卡連接中繼線,具有信令處理能力。
能識別主叫號碼、識別用戶按鍵、調(diào)用語音識別服務(wù)模塊4識別用戶語音命令、檢測呼叫事件,并上報給業(yè)務(wù)控制模塊1。
能夠按照業(yè)務(wù)控制模塊1的指令,控制呼叫進程。
能夠主動呼出或者轉(zhuǎn)移呼叫到外部自動臺12或外部人工臺13等。
語音識別服務(wù)模塊4能夠根據(jù)電話語音從一系列候選命令列表中識別用戶發(fā)出的是哪一個語音命令,實現(xiàn)了電話用戶輸入方式從按鍵到語音輸入的革命。其流程示意圖見圖4,首先,電話語音信號經(jīng)自動增益控制處理后,再經(jīng)自適應(yīng)噪聲濾除,最后利用聲學模式識別。
語音合成模塊5提供從文本到語音的轉(zhuǎn)換,突破了信息預錄音的限制,使實時動態(tài)以及海量信息的查詢成為可能,語音合成模塊在智能網(wǎng)中屬于智能外設(shè)的范疇。其流程示意圖如圖5所示,文本經(jīng)語法分析詞匯分割,再經(jīng)基音選擇與拼接,最后,經(jīng)口腔發(fā)音模擬,合成語音。
業(yè)務(wù)管理模塊6用以創(chuàng)建、加載、卸載業(yè)務(wù),監(jiān)測業(yè)務(wù)運行情況,管理統(tǒng)計各種業(yè)務(wù)數(shù)據(jù)、用戶數(shù)據(jù)和計費數(shù)據(jù)。
WWW服務(wù)模塊7使用戶也可以通過Web瀏覽器查詢城市節(jié)點業(yè)務(wù)數(shù)據(jù)模塊2中的信息,同時也使業(yè)務(wù)數(shù)據(jù)模塊2中的信息可以被其他城市節(jié)點在業(yè)務(wù)流程中查詢。
遠程通信模塊8是城市節(jié)點通往外部信息源(包括Internet上的站點)以及其他城市節(jié)點的橋梁,同時包含了防火墻、路由器等功能。
城市節(jié)點之間、城市節(jié)點與信息源均通過TCP/IP協(xié)議互聯(lián),從物理上,可以通過ChinaNet、ChinaGBN等公網(wǎng)連接,也可以通過專線連接。這樣,所有的信息以分布式存放在各城市節(jié)點和信息源,但又充分共享,共同組成一個龐大的分布式信息庫。對于一些常用的信息可以在各城市節(jié)點作一鏡像拷貝,以一定的冗余存儲換取訪問速度的提高。
如圖6所示,總工作流程包括如下步驟步驟601用戶通過電話機(或手機)10、傳真機11等終端設(shè)備,撥特服號(全國統(tǒng)一號碼,如17999)通過電話網(wǎng)14與接入中繼15接入系統(tǒng);再進行步驟602系統(tǒng)通過語音卡播放歡迎詞;進行步驟603用戶口述業(yè)務(wù)名稱(如“股票行情”);進行步驟604經(jīng)語音識別服務(wù)模塊4識別出業(yè)務(wù)名稱;進行步驟605業(yè)務(wù)控制模塊1判斷業(yè)務(wù)所在地,如該業(yè)務(wù)所在地不是本地;進行步驟606轉(zhuǎn)接到業(yè)務(wù)所在城市節(jié)點,同時傳遞了統(tǒng)一業(yè)務(wù)編號;進行步驟607按業(yè)務(wù)流程繼續(xù)與用戶交互,如提示用戶口述企業(yè)名稱語音識別服務(wù)模塊識別出用戶口述的企業(yè)名稱后,提取企業(yè)信息,經(jīng)語音合成服務(wù)模塊5合成,并播放給用戶;如該業(yè)務(wù)所在地是本地,也進行步驟607。
在步驟607,利用本系統(tǒng),用戶可以進一步通過語音命令或者按鍵與系統(tǒng)交互,針對不同的業(yè)務(wù)或者根據(jù)用戶的輸入查詢本節(jié)點業(yè)務(wù)數(shù)據(jù)模塊2,或者通過遠程通信模塊8查詢甚至修改遠程信息源,或者發(fā)送信息(如Email)給遠程對象。對于查詢信息的情況,如果查詢結(jié)果為文本格式,語音合成服務(wù)模塊5能將結(jié)果文本轉(zhuǎn)換成清晰自然的語音,最后通過接入與交換模塊3播放給用戶聽;如果用戶終端為傳真機11,系統(tǒng)也能夠?qū)⑽谋竞蛨D形傳真給用戶。一些業(yè)務(wù)會將用戶的呼叫通過接入與交換模塊3轉(zhuǎn)移到外部自動臺12(如民航的電話查詢系統(tǒng))或外部人工臺13(如電話門診熱線),以充分利用現(xiàn)有資源和拓展服務(wù)范圍。
目前可開通的服務(wù)包括實時股票行情、個人通信本、語音郵件、全國工商企業(yè)查詢、航班查詢、部分商品行情等。
以下結(jié)合實施例說明本發(fā)明各服務(wù)項目的具體工作流程1、用戶查詢實時股票行情用戶通過電話機10,撥特服號,通過電話網(wǎng)14與接入中繼15接入系統(tǒng),用戶口述業(yè)務(wù)名稱“股票行情”,語音識別服務(wù)模塊4識別出業(yè)務(wù)名稱“股票行情”后,經(jīng)業(yè)務(wù)控制模塊1進入該項業(yè)務(wù)的業(yè)務(wù)流程,這時,用戶可以口述股票名稱,語音識別服務(wù)模塊4識別出股票名稱后,經(jīng)業(yè)務(wù)數(shù)據(jù)模塊得到最新行情,經(jīng)語音合成服務(wù)模塊將最新行情數(shù)據(jù)合成為語音,經(jīng)接入與交換模塊播放給用戶。
2、個人通信本用戶通過電話機10,撥通系統(tǒng)特服號,通過電話網(wǎng)14與接入中繼15接入系統(tǒng),口述“通信本”,語音識別服務(wù)模塊4識別出業(yè)務(wù)名稱“通信本“,系統(tǒng)提示“請輸入帳號”,用戶輸入賬號后,系統(tǒng)調(diào)出其個人通信本,提示“請問您找誰”,用戶答“某某某”,語音識別服務(wù)模塊4識別出聯(lián)系人姓名后,經(jīng)業(yè)務(wù)數(shù)據(jù)模塊得到其電話號碼,經(jīng)語音合成服務(wù)模塊合成為語音,經(jīng)接入與交換模塊播放“某某某,電話號碼******,請問接通還是重選?”,如用戶口述“接通”,接入與交換模塊替用戶轉(zhuǎn)接到該號碼。
3、發(fā)送語音郵件用戶撥通系統(tǒng)特服號,通過電話網(wǎng)14與接入中繼15接入系統(tǒng),說“發(fā)郵件”,語音識別服務(wù)模塊4識別出業(yè)務(wù)名稱之后,系統(tǒng)問“發(fā)送給誰?”,用戶答“某某某”,系統(tǒng)提示“請口述郵件內(nèi)容”,用戶即可開始口述郵件內(nèi)容,口述完畢按一個鍵,系統(tǒng)錄下用戶口述的郵件內(nèi)容,并存為某種語音格式(如ADPCM格式),作為Email的內(nèi)容發(fā)送出去。
4、接收語音郵件用戶撥通系統(tǒng)特服號,通過電話網(wǎng)14與接入中繼15接入系統(tǒng),說“收郵件”,語音識別服務(wù)模塊4識別出業(yè)務(wù)名稱之后,系統(tǒng)從用戶設(shè)定的郵件服務(wù)器上接收郵件,如郵件內(nèi)容為文本,則通過語音合成服務(wù)模塊合成為語音播放給用戶聽,如郵件內(nèi)容為某種格式的語音,則轉(zhuǎn)換為語音卡可以播放的格式后播放給用戶。
與現(xiàn)有技術(shù)相比,本發(fā)明具有如下效果由于本發(fā)明在各城市節(jié)點中設(shè)置了語音識別服務(wù)模塊及語音合成服務(wù)模塊,本發(fā)明可完全實現(xiàn)人和系統(tǒng)通過自然語言交流,實現(xiàn)遠程信息檢索。
不同年齡、不同性別的用戶在不同地方、使用不同的話機撥通同一個特服號碼(如17999)均可用自然語言實現(xiàn)與系統(tǒng)的對話;一般使用條件下,系統(tǒng)的一次識別率可在90%以上,二次識別率達98%用戶發(fā)出檢索要求到聽到檢索結(jié)果的時間為1~3秒;語音合成的自然度、清晰度為4分(5分為播音員水平);綜上所述,本發(fā)明創(chuàng)造了一種人與系統(tǒng)通過自然語言交流實現(xiàn)信息查詢的方法,本系統(tǒng)實現(xiàn)了以下突破1、用戶以自然語言取代數(shù)字代碼提出查詢需求,突破了傳統(tǒng)技術(shù)使用不便的制約瓶頸;2、信息以文本形式存儲,以語音合成技術(shù)實現(xiàn)文本到語音的實時轉(zhuǎn)換,實現(xiàn)了信息更新的實時響應(yīng);3、以文本形式存儲的信息文件占用硬盤資源不到錄音文件的1%。同時,語音合成技術(shù)自動實現(xiàn)了信息由文本到語音的轉(zhuǎn)換,省去了龐雜的錄音、剪輯、替換過程,大幅降低了系統(tǒng)的維護成本。
4、以TCP/IP協(xié)議實現(xiàn)各城市節(jié)點的全國聯(lián)網(wǎng),以分布式信息庫形式實現(xiàn)各信息源的共享。該結(jié)構(gòu)保證了大量優(yōu)質(zhì)的信息源可以以外掛形式由全國的系統(tǒng)共享。聲信領(lǐng)域?qū)儆谛畔⒎?wù)領(lǐng)域,信息服務(wù)領(lǐng)域成功的關(guān)鍵是信息源的豐富和實用,全國聯(lián)網(wǎng)、信息源外掛并由各自專業(yè)的信息源供應(yīng)商負責維護還保障了信息源的準確和實時。
權(quán)利要求
1.一種電話語音交互的信息服務(wù)系統(tǒng),包括城市節(jié)點,城市節(jié)點包括業(yè)務(wù)控制模塊、業(yè)務(wù)數(shù)據(jù)模塊、接入與交換模塊、業(yè)務(wù)管理模塊;各個模塊通過一計算機網(wǎng)絡(luò)相連接;其特征在于城市節(jié)點還包括與計算機網(wǎng)絡(luò)連接的遠程通信模塊。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于所述城市節(jié)點還包括與計算機網(wǎng)絡(luò)連接的語音識別服務(wù)模塊;語音識別服務(wù)模塊對電話語音信號進行自動增益控制處理、自適應(yīng)噪聲濾除及聲學模式識別處理。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于所述城市節(jié)點還包括與計算機網(wǎng)絡(luò)連接的語音合成服務(wù)模塊語音合成模塊提供從文本到語音的轉(zhuǎn)換,經(jīng)語法分析詞匯分割、基音選擇與拼接,以及口腔發(fā)音模擬,合成語音信號。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于所述城市節(jié)點還包括與計算機網(wǎng)絡(luò)連接的語音合成服務(wù)模塊;語音合成模塊提供從文本到語音的轉(zhuǎn)換,經(jīng)語法分析詞匯分割、基音選擇與拼接,以及口腔發(fā)音模擬,合成語音信號。
5.一種電話語音交互的信息服務(wù)系統(tǒng),包括城市節(jié)點,城市節(jié)點包括業(yè)務(wù)控制模塊、業(yè)務(wù)數(shù)據(jù)模塊、接入與交換模塊、業(yè)務(wù)管理模塊;各個模塊通過一局域網(wǎng)相連接;其特征在于還包括各城市節(jié)點間的網(wǎng)絡(luò)連接。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于所述城市節(jié)點還包括與所述局域網(wǎng)連接的遠程通信模塊。
7.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于所述城市節(jié)點還包括與局域網(wǎng)連接的www服務(wù)模塊。
8.根據(jù)權(quán)利要求5~7所述的系統(tǒng),其特征在于所述城市節(jié)點還包括與局域網(wǎng)相連接的語音識別服務(wù)模塊;語音識別服務(wù)模塊對電話語音信號進行自動增益控制處理、自適應(yīng)噪聲濾除及聲學模式識別處理。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于所述城市節(jié)點還包括與局域網(wǎng)相連接的語音合成服務(wù)模塊;語音合成模塊提供從文本到語音的轉(zhuǎn)換,經(jīng)語法分析詞匯分割、基音選擇與拼接,以及口腔發(fā)音模擬,合成語音信號。
10.根據(jù)權(quán)利要求5或6所述的系統(tǒng),其特征在于所述城市節(jié)點還包括與局域網(wǎng)相連接的語音合成服務(wù)模塊;語音合成模塊提供從文本到語音的轉(zhuǎn)換,經(jīng)語法分析詞匯分割、基音選擇與拼接,以及口腔發(fā)音模擬,合成語音信號。
11.根據(jù)權(quán)利要求5~10中任一項所述的系統(tǒng),其特征在于所述各城市節(jié)點間的網(wǎng)絡(luò)連接符合TCP/IP協(xié)議。
12.根據(jù)權(quán)利要求5~10中任一項所述的系統(tǒng),其特征在于所述各城市節(jié)點間的網(wǎng)絡(luò)連接為IP網(wǎng)絡(luò)。
13.一種電話語音交互的信息服務(wù)系統(tǒng),包括城市節(jié)點,城市節(jié)點包括業(yè)務(wù)控制模塊、業(yè)務(wù)數(shù)據(jù)模塊、接入與交換模塊、業(yè)務(wù)管理模塊;各個模塊通過一局域網(wǎng)相連接;其特征在于所述城市節(jié)點還包括與局域網(wǎng)相連接的語音識別服務(wù)模塊;語音識別服務(wù)模塊對電話語音信號進行自動增益控制處理、自適應(yīng)噪聲濾除及聲學模式識別處理。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于所述城市節(jié)點還包括與局域網(wǎng)相連接的語音合成服務(wù)模塊;語音合成模塊提供從文本到語音的轉(zhuǎn)換,經(jīng)語法分析詞匯分割、基音選擇與拼接,以及口腔發(fā)音模擬,合成語音信號。
15.一種電話語音交互的信息服務(wù)系統(tǒng),包括城市節(jié)點,城市節(jié)點包括業(yè)務(wù)控制模塊、業(yè)務(wù)數(shù)據(jù)模塊、接入與交換模塊、業(yè)務(wù)管理模塊;各個模塊通過一局域網(wǎng)相連接;其特征在于所述城市節(jié)點還包括與局域網(wǎng)相連接的語音合成服務(wù)模塊;語音合成模塊提供從文本到語音的轉(zhuǎn)換,經(jīng)語法分析詞匯分割、基音選擇與拼接,以及口腔發(fā)音模擬,合成語音信號。
16.一種電話語音交互的信息服務(wù)方法,包括如下步驟a、用戶通過終端設(shè)備,撥特服號,通過電話網(wǎng)與接入中繼接入城市節(jié)點;b、用戶口述業(yè)務(wù)名稱的語音信號經(jīng)接入與交換模塊接收,并經(jīng)語音識別服務(wù)模塊識別業(yè)務(wù)類別,確定業(yè)務(wù)類別及其所在地;若不在本地;c、經(jīng)遠程通信模塊及廣域網(wǎng)轉(zhuǎn)發(fā)至目的城市節(jié)點;d、目的城市的城市節(jié)點,經(jīng)語音識別服務(wù)模塊識別出業(yè)務(wù)名稱后,經(jīng)業(yè)務(wù)控制模塊進入該項業(yè)務(wù)的業(yè)務(wù)流程;e、用戶進一步與系統(tǒng)交互。
17.根據(jù)權(quán)利要求16所述的方法,其特征在于所述步驟b中,經(jīng)語音識別服務(wù)模塊識別出業(yè)務(wù)類別在本地;進行如下步驟經(jīng)業(yè)務(wù)控制模塊進入相應(yīng)業(yè)務(wù)的業(yè)務(wù)流程,用戶進一步與系統(tǒng)交互。
18.根據(jù)權(quán)利要求16或17所述的方法,其特征在于如果查詢結(jié)果(包括接收的Email)為文本格式,則進行以下步驟語音合成服務(wù)模塊將文本內(nèi)容轉(zhuǎn)換成語音信號,最后通過接入與交換模塊輸出語音信號。
19.根據(jù)權(quán)利要求16~18所述的方法,其特征在于所述步驟b中,系統(tǒng)可以錄取用戶通過電話話筒口述的郵件內(nèi)容,并存為某種語音格式,作為電子郵件的內(nèi)容發(fā)送出去。
全文摘要
一種電話語音交互的信息服務(wù)系統(tǒng)及方法,包括城市節(jié)點,城市節(jié)點包括:業(yè)務(wù)控制、業(yè)務(wù)數(shù)據(jù)、接入與交換、業(yè)務(wù)管理、遠程通信、語音識別服務(wù)及語音合成服務(wù)等模塊;各模塊通過計算機網(wǎng)絡(luò)連接;本方法步驟為:用戶通過電話網(wǎng)接入服務(wù)器端;用戶的語音信號經(jīng)接入與交換模塊接收,并經(jīng)語音識別服務(wù)模塊識別業(yè)務(wù)類別及所在地;目的城市節(jié)點的服務(wù)器端,經(jīng)業(yè)務(wù)控制模塊進入業(yè)務(wù)的流程,用戶可與系統(tǒng)交互。本發(fā)明可完全實現(xiàn)用戶和系統(tǒng)通過語言交流的遠程信息服務(wù)。
文檔編號H04L12/28GK1298240SQ99125249
公開日2001年6月6日 申請日期1999年11月30日 優(yōu)先權(quán)日1999年11月30日
發(fā)明者廖杰遠 申請人:福州數(shù)通信息技術(shù)有限公司