亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

線上語音互動系統(tǒng)及其實施方法

文檔序號:2829605閱讀:557來源:國知局
專利名稱:線上語音互動系統(tǒng)及其實施方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語音互動系統(tǒng),尤其涉及一種利用網(wǎng)際網(wǎng)絡(luò)資源提供連線的用戶系統(tǒng)進行語音對話的線上語音互動系統(tǒng)。
在傳統(tǒng)的語言教材的學習系統(tǒng)中,學員是孤軍奮斗的,學員的學習效果安全是決定于其自身的努力程度。學習這些語言教材的方式,不外乎聽力訓練、朗誦訓練、播放影片等,當學員遇到學習上的問題時,也就只能自己解決或者寫郵件到軟件公司詢問,即使可以這樣,其前提也是軟件公司有提供問與答(Q&A)的服務(wù),即便如此,信件的往返時間也使學員的學習效率大打折扣。
現(xiàn)有的語言學習教材,為提供多樣、大量的學習資料,所以一般將教材資料庫燒錄于光碟片中,學員必須先購買語言教學光碟片,再安裝到個人電腦中,如

圖1所示,通過電腦10的多媒體元件,如揚聲器101或麥克風102等來使語言教材提供更多樣化的互動學習環(huán)境。
這類語言教材的執(zhí)行需原版光碟1,而且使用方式屬于單機版光碟式學習;因此,學員走到那里原版光碟片1需帶到那里,其次,光碟片的安裝僅將執(zhí)行程序或應(yīng)用軟件安裝(setup)到個人電腦,教材課程內(nèi)容資料庫是燒錄于光碟片中;因此,在學習過程中,學員所學的課程僅局限于光碟中的資料庫提供的課程內(nèi)容,無法改變;而且過于偏重于聽力及字匯的訓練,沉重而單調(diào)的教學方式再加上一成不變的課程內(nèi)容往往讓學員很快就失去了興趣,倘若學員需要不同的訓練教材時,則需再購買課程資料庫的光碟,增加費用上的負擔。所以,這種語言教材的學習因這樣固定內(nèi)容的資料庫而不具有足夠彈性,讓學員有選擇學習課程。
現(xiàn)在主要語音辯識引擎(Speech Recognition Engine,SRE)有IBM語音辯識版本、Microsoft語音辯識版本、L&H語音辯識版本等。所以,語音辯識技術(shù)已實現(xiàn)產(chǎn)品化,且成為一成熟技術(shù)。在在現(xiàn)有的學習方式中,結(jié)合語音辯識功能的語言教材雖有提供互動式對話模式的學習環(huán)境,但教材使用的方式仍停留在單機版光碟式學習,無法提升為利用網(wǎng)際網(wǎng)絡(luò)資源(InternetResource)的線上互動式學習(On-Line Interacting Learning)。隨著信號網(wǎng)絡(luò)時代的來臨,網(wǎng)絡(luò)的應(yīng)用更是無窮無盡,但這一現(xiàn)有技術(shù)所需克服的瓶頸將是如何在即時(Real-time)環(huán)境中于網(wǎng)際網(wǎng)絡(luò)上來大量傳輸學員的語音資料到遠端的服務(wù)系統(tǒng),完成語音辯識的互動對話方式。
本發(fā)明的目的是提供一線上語音互動系統(tǒng)及其實施方法,其具有可利用網(wǎng)際網(wǎng)絡(luò)資源使學員在線上擷取學習內(nèi)容,在沒有時間與空間障礙的情況下進行線上語音互動學習;可支持線上語音辯識處理技術(shù),實施線上語音互動交談;可利用網(wǎng)際網(wǎng)絡(luò)資源,而由遠端服務(wù)系統(tǒng)提供線上資料庫,配合實施語音練習/對話的語音互動環(huán)境平臺。
為實現(xiàn)上述目的,本發(fā)明提供的技術(shù)方案為1、一種線上語音互動系統(tǒng),其中該線上語音互動系統(tǒng)利用網(wǎng)際網(wǎng)絡(luò)實施語音互動模式,該線上語音互動系統(tǒng)包含一遠端服務(wù)系統(tǒng)和一用戶系統(tǒng),所述遠端服務(wù)系統(tǒng)安裝一服務(wù)引擎,該遠端服務(wù)系統(tǒng)具有一資料庫,該服務(wù)引擎處理網(wǎng)際網(wǎng)絡(luò)上提供的網(wǎng)頁資料與所述資料庫的內(nèi)容;所述用戶系統(tǒng)設(shè)有語音界面設(shè)備,并在該語音界面設(shè)備作業(yè)環(huán)境安裝一信號擷取界面、一客戶端引擎和一語音辯識引擎,該語音辯識引擎處理該語音界面設(shè)備接收的語音;所述語音互動模式為遠端服務(wù)系統(tǒng)與用戶系統(tǒng)的間的語音互動模式,由所述信號擷取界面顯示所述資料庫的內(nèi)容并指示發(fā)音項目,而所述客戶端引擎接收發(fā)音項目并傳給所述語音辯識引擎,該語音辯識引擎接收到語音與發(fā)音項目后進行語音對比辯識,該語音辯識引擎將對比辯識結(jié)果回傳給客戶端引擎,其結(jié)果由該信號擷取界面顯示,該信號擷取界面并將該對比辯識結(jié)果信號回傳給服務(wù)引擎,該服務(wù)引擎接收并記錄該對比辯識結(jié)果信號,完成該語音互動模式。
所述用戶系統(tǒng)為個人電腦、PDA、WAP手機或其他類似具有連線上網(wǎng)的作業(yè)環(huán)境的系統(tǒng)。
所述作業(yè)環(huán)境可為Windows或Unix或Mac或可實施網(wǎng)際網(wǎng)絡(luò)的信號擷取界面的作業(yè)系統(tǒng)。
所述信號擷取界面為瀏覽器。
所述發(fā)音項目為一個句子或一個單字。
所述語音辯識引擎包含將所述發(fā)音項目轉(zhuǎn)換為與所述接收的語音可辯識對比的資料。
所述客戶端引擎為通過HTML或DHTML或XML或Java Script或JavaApplet或VB Script或Virtual C++或Virtual B或ActiveX或類似的程序語言實現(xiàn)。
所述客戶端引擎包含一流程引擎和一轉(zhuǎn)換界面,所述流程引擎控制所述語音互動模式的進行;所述轉(zhuǎn)換界面轉(zhuǎn)換該發(fā)音項目,使該發(fā)音項目轉(zhuǎn)換為該語音辯識引擎可接收的資料格式。
所述轉(zhuǎn)換界面由Java Applet程序語言來實現(xiàn)。
所述轉(zhuǎn)換界面還包含一語音辯識界面。
所述轉(zhuǎn)換界面包含第一界面和第二界面,該第一界面處理所述信號擷取界面上網(wǎng)站應(yīng)用的資料;該第二界面處理工作平臺的資料。
所述語音辯識引擎可實施中文或英文語音辯識,或者其他語言的語音辯識。
所述流程引擎通過所述轉(zhuǎn)換界面接收到語音與轉(zhuǎn)換發(fā)音項目以及正確語音的辯識結(jié)果,該流程引擎根據(jù)該辯識結(jié)果控制所述語音互動模式的進行,并將所述語音互動模式的記錄回傳給所述服務(wù)引擎,該服務(wù)引擎將該語音互動模式的記錄儲存于所述資料庫中。
所述網(wǎng)際網(wǎng)絡(luò)包括有線通訊網(wǎng)絡(luò)或無線通訊網(wǎng)絡(luò)或包含有線與無線通訊資源所組成的網(wǎng)絡(luò)。
2、一種實現(xiàn)上述線上語音互動系統(tǒng)的實施方法,該線上語音互動系統(tǒng)的實施方法控制在網(wǎng)際網(wǎng)絡(luò)上實施語音互動系統(tǒng)的流程,該線上語音互動系統(tǒng)的實施方法包含在一遠端服務(wù)系統(tǒng)中提供一服務(wù)引擎,該服務(wù)引擎提供網(wǎng)頁資料與發(fā)音項目的內(nèi)容;在一用戶系統(tǒng)的多媒體作業(yè)環(huán)境中提供一執(zhí)行程序,該執(zhí)行程序包含信號擷取界面,該信號擷取界面從網(wǎng)際網(wǎng)絡(luò)上擷取網(wǎng)頁信號與所述發(fā)音項目的內(nèi)容;語音辯識界面,該語音辯識界面辯識有關(guān)所述發(fā)音項目的資料,與多媒體的輸入語音;以及客戶端程序,該客戶端程序提供有關(guān)所述發(fā)音項目的資料給所述語音辯識程序,并根據(jù)所述語音辯識程序的辯識結(jié)果控制所述線上語音互動系統(tǒng)流程的進行,且將所述線上語音互動系統(tǒng)流程的辯識記錄回傳所述遠端服務(wù)系統(tǒng)的服務(wù)引擎。
所述客戶端程序包含將所述發(fā)音項目轉(zhuǎn)換為所述語音辯識程序所需的資料。
所述客戶端程序包含控制所述線上語音互動系統(tǒng)流程進行的所述發(fā)音項目的內(nèi)容。
所述在用戶系統(tǒng)的多媒體作業(yè)環(huán)境中的執(zhí)行程序還包含設(shè)定一辯識率,所述客戶端程序根據(jù)該辯識率判斷辯識結(jié)果是否滿足該設(shè)定的辯識率,并根據(jù)該辯識結(jié)果控制該線上語音互動系統(tǒng)流程的進行。
所述在用戶系統(tǒng)的多媒體作業(yè)環(huán)境中執(zhí)行的程序還包含設(shè)定所述線上語音互動系統(tǒng)流程的角色扮演,所述客戶端程序根據(jù)該角色扮演決定該語音辯識程序所要提供的辯識發(fā)音項目。
本發(fā)明提供的線上語音互動系統(tǒng)與實施方法可使連接在網(wǎng)際網(wǎng)絡(luò)上的用戶系統(tǒng)(Client system)從一遠端服務(wù)系統(tǒng)的線上資料庫中選擇實施線上語音互動對話模式,該用戶系統(tǒng)安裝有信號擷取界面(InformationAccesslnterface)且提供多媒體環(huán)境,并在用戶系統(tǒng)的作業(yè)環(huán)境中進一步安裝包含流程引擎與轉(zhuǎn)換界面兩部分內(nèi)容的客戶端引擎和語音辯識引擎SRE,使得上網(wǎng)的學員通過該用戶系統(tǒng)從遠端服務(wù)系統(tǒng)所提供的網(wǎng)頁(Web Page)上選擇課程內(nèi)容、角度扮演等選項(Item),進而在本發(fā)明的線上語音互動系統(tǒng)的運行模式與線上責料庫連結(jié)機制下,讓該學員能在網(wǎng)際網(wǎng)絡(luò)線上擷取學習內(nèi)容就能進行即時語音辯識的互動對話。遠端服務(wù)系統(tǒng)安裝一服務(wù)引擎(ServerEngine,SE)可接收用戶系統(tǒng)通過網(wǎng)際網(wǎng)絡(luò)所提出的需求(Request),所需信號的網(wǎng)頁,以及其線上資料庫的課程內(nèi)容,并且與該用戶系統(tǒng)配合實施線上語音互動系統(tǒng)的運行模式,回應(yīng)學員的語音即時辯識,并做出對應(yīng)的記錄程序。
下面結(jié)合附圖和實施例對本發(fā)明作進一步詳細的描述圖1為習知技術(shù)以教材資料庫的光碟片安裝在單機個人電腦上實施語言學習統(tǒng)的示意圖;圖2為本發(fā)明提供的線上語音互動系統(tǒng)的系統(tǒng)方塊圖;圖3為本發(fā)明提供的線上語音互動系統(tǒng)的運作示意圖;圖4是本發(fā)明提供的線上語音互動系統(tǒng)模式架構(gòu)圖;圖5為本發(fā)明提供的線上語音互動系統(tǒng)一種實施例的模式架構(gòu)圖;圖6為圖5所示的模式架構(gòu)圖的實施互動模式的流程圖。
下面將參閱本發(fā)明提供的附圖和實施例對本發(fā)明進行充份地描述,但在具體描述之前,先對與本發(fā)明有關(guān)的背景技術(shù)進行一下延伸描述。這些內(nèi)容對有嫻熟經(jīng)驗及知識的技術(shù)人員來說可以跳過、瀏覽甚至不讀,但這些內(nèi)容對掌握本發(fā)明的的技術(shù)確有很大裨益,建議應(yīng)加以詳讀。
①、網(wǎng)際網(wǎng)絡(luò)資源大量的電腦與電腦網(wǎng)絡(luò)通過通訊聯(lián)結(jié)的機制互相聯(lián)系組成了網(wǎng)際網(wǎng)絡(luò)(Internet),電腦間的通訊可包含無線通訊網(wǎng)絡(luò)或有線通訊網(wǎng)絡(luò),而彼此間可利用各種工具來交換信號,例如電子郵件、Gopher、WWW(World Wide Web)。WWW允許服務(wù)系統(tǒng)(網(wǎng)絡(luò)服務(wù)器或網(wǎng)站)傳遞文字、圖形、網(wǎng)頁等信號到終端用戶電腦系統(tǒng)(用戶端,例如個人電腦、PDA、或WAP手機),網(wǎng)際網(wǎng)絡(luò)上的每一端(例如電腦、網(wǎng)頁)都有一唯一的對應(yīng)地址(Uniform ResourceLocator,URL),用戶端電腦系統(tǒng)可以通過在其作業(yè)系統(tǒng)中安裝一信號擷取界面來擷取網(wǎng)際網(wǎng)絡(luò)上所傳遞的信號,該信號擷取界面可指定網(wǎng)頁地址(URL)來瀏覽網(wǎng)頁信號。當所指定的網(wǎng)站接收到用戶端的指令時,即將該網(wǎng)頁傳送到用戶端電腦系統(tǒng)中的信號擷取界面,當用戶端接受到該網(wǎng)頁后,便可在該信號擷取界面上進行瀏覽。信號擷取界面一般是指瀏覽器軟件,是一種應(yīng)用程序,用以回應(yīng)網(wǎng)頁要求和顯示網(wǎng)頁,例如Microsoft Internet Explorer或Netscape Communicator。
按一般的定義,網(wǎng)頁必需是HTML(HyperText Markup Language)制作的。HTML提供一個網(wǎng)頁顯示的標準格式。當用戶端指示瀏覽器顯示網(wǎng)頁時,瀏覽器會傳遞指令到服務(wù)端,服務(wù)端即會傳送HTML格式的文件到用戶端。當用戶端系統(tǒng)接收到HTML文件時,瀏覽器會按照HTML格式顯示網(wǎng)頁。HTML文件可包含文字、圖或是其它組成信號。當然HTML文件也可能包含其它服務(wù)器的地址。
WWW特別有助于電子商務(wù)的實現(xiàn),產(chǎn)品可以通過WWW廣告進行銷售。網(wǎng)絡(luò)上的產(chǎn)品包括通過電子形式傳送方式傳送到銷費者手中的產(chǎn)品(例如,音樂),或通過傳統(tǒng)通路(例如,一般的貨運),傳送到銷費者手上的產(chǎn)品(例如,書)。在網(wǎng)際網(wǎng)絡(luò)中,服務(wù)端可以提供電子形式,提供目錄供使用者(銷費者)在瀏覽器上瀏覽選購,當使用者選購完商品后,服務(wù)端電腦會提示使用者的訂購信號。使用者的訂購信號包括了銷費者姓名、銷費者信用卡卡號及商品寄送地點等。接著服務(wù)電腦會通過傳送一確認網(wǎng)頁到用戶端來確認訂購的商品及寄送的時間。
②物件程序語言Java/Java Applet根據(jù)Sun Microsystems的說法Java是一種簡單、穩(wěn)定、物件導向、跨平臺、多執(zhí)行線、功能強大、用途廣泛的程序開發(fā)環(huán)境,也就是說,Java可用于開發(fā)應(yīng)用在網(wǎng)際網(wǎng)絡(luò)、企業(yè)網(wǎng)絡(luò)(Internet)及其他復雜的分散性網(wǎng)絡(luò)上的執(zhí)行軟件或applet。
JavaScriptJavaScript是由Netscape與Sun Microsystems合作開發(fā)的,用于HTML文件,JavaScript是一種容易使用、開發(fā)、并且跨平臺的直述式程序語言。其最大功能在于降低網(wǎng)絡(luò)流量,使很多工作都能盡量在用戶端的電腦執(zhí)行,讓服務(wù)端的服務(wù)器降低工作負荷。
以下將進一步詳細描述說明本發(fā)明提供的線上語音互動系統(tǒng)。
如圖1和圖2所示,利用有線通訊或無線通訊組成網(wǎng)際網(wǎng)絡(luò)資源4,學員通過一連線上網(wǎng)的用戶系統(tǒng)10實施線上語言練習/對話的平臺,該用戶系統(tǒng)10具有多媒體環(huán)境,安裝一信號擷取界面11,使用戶系統(tǒng)10可接收及顯示網(wǎng)際網(wǎng)絡(luò)上所擷取的信號,如網(wǎng)頁信號等,而多媒體環(huán)境是指用戶系統(tǒng)10所配備的周邊設(shè)備需要包含有語音界面設(shè)備,例如包含揚聲器101或耳機以及麥克風102等,并且其信號處理的計算能力應(yīng)該支援語音處理的運算。在用戶系統(tǒng)10的作業(yè)環(huán)境中需要進一步安裝一客戶端引擎13以及一語音辯識引擎SRE12,以便實施線上語音互動系統(tǒng)的運行模式,處理語音即時辯識。在本發(fā)明提供的線上語音互動系統(tǒng)的實施例中,用戶系統(tǒng)10可為個人電腦、PDA、WAP手機或其他類似的可連線上網(wǎng)的作業(yè)系統(tǒng),其作業(yè)環(huán)境可為windows、Unix、Mac或可實施網(wǎng)際網(wǎng)絡(luò)的信號擷取界面的作業(yè)系統(tǒng)(OperatlonSystem)。
遠端服務(wù)系統(tǒng)20包含一服務(wù)引擎SE22、各種網(wǎng)頁21以及一線上資料庫23,該服務(wù)引擎SE22可接收用戶系統(tǒng)10經(jīng)網(wǎng)際網(wǎng)絡(luò)4所提出的要求(Request),例如以HTTP方式所執(zhí)行的要求,該HTTP要求取得由URL所指定的網(wǎng)頁21,而服務(wù)引擎SE22將該指定的網(wǎng)頁21提供給用戶系統(tǒng)10。該線上資料庫23則儲存有關(guān)各網(wǎng)頁21所提供的資料以線上語言學習的各種課程內(nèi)容。
在本發(fā)明提供的線上語音互動系統(tǒng)的實施例中,其運行模式為服務(wù)引擎SE22在線上資料庫23中取出含有學員所選擇的課程資料的網(wǎng)頁放在課程網(wǎng)頁21中,該課程網(wǎng)頁21由用戶系統(tǒng)10的信號擷取界面11取得,再通過該信號擷取界面11的程序與客戶端引擎13以及與語音辯識引摯SRE12互動聯(lián)系,使學員在用戶系統(tǒng)10的多媒體環(huán)境中,按照網(wǎng)頁所顯示的課程內(nèi)容中的句子或詞匯進行語音練習,客戶端引擎13將學員所念的句子或單字傳送到語音辯識引擎SRE12,該語音辯識引擎SRE12會將輸入的句子或單字轉(zhuǎn)換并做為語音辯識的對比標的,與從語音界面設(shè)備轉(zhuǎn)換并存儲的語音作辯識對比,將其辯識結(jié)果回傳給客戶端引擎13。客戶端引擎13控制線上語音互動系統(tǒng)的運行模式的流程,必要時再將包含辯識結(jié)果的信號通過網(wǎng)際網(wǎng)絡(luò)4傳送出去,使遠端服務(wù)系統(tǒng)20的服務(wù)引擎SE22得知互動結(jié)果,并在線上提供對應(yīng)的訊息,例如,通過課程網(wǎng)頁21回應(yīng)信息給學員,讓學員知道自己發(fā)音的正確程度,辨別自己發(fā)音是否正確,如果其辯識結(jié)果低于設(shè)定的辯識率,用戶系統(tǒng)10將通過多媒體環(huán)境自動插放正確的發(fā)音。
在本發(fā)明提供的線上語音互動系統(tǒng)中實施線上語音互動系統(tǒng)的實施方法,該線上語音互動系統(tǒng)的實施方法可控制該線上語音互動系統(tǒng)在網(wǎng)際網(wǎng)絡(luò)上的互動流程,該線上語音互動系統(tǒng)的實施方法包含在一遠端服務(wù)系統(tǒng)中提供一服務(wù)引擎,該服務(wù)引擎提供網(wǎng)頁資料與發(fā)音項目的內(nèi)容;在一用戶系統(tǒng)的多媒體作業(yè)環(huán)境中提供一執(zhí)行程序,該執(zhí)行程序包含信號擷取界面,該信號擷取界面從網(wǎng)際網(wǎng)絡(luò)上擷取網(wǎng)頁信號與所述發(fā)音項目的內(nèi)容;語音辯識界面,該語音辯識界面辯識有關(guān)所述發(fā)音項目的資料,與多媒體的輸入語音;以及客戶端程序,該客戶端程序提供有關(guān)所述發(fā)音項目的資料給所述語音辯識程序,并根據(jù)所述語音辯識程序的辯識結(jié)果控制所述線上語音互動系統(tǒng)流程的進行,且將所述線上語音互動系統(tǒng)流程的辯識記錄回傳所述遠端服務(wù)系統(tǒng)的服務(wù)引擎。
如圖2和圖3所示在本發(fā)明提供的線上語音互動系統(tǒng)的實施方法的實施例中,以個人電腦實施用戶系統(tǒng)10,用瀏覽器實施信號擷取界面11,當學員在具有多媒體環(huán)境的用戶系統(tǒng)10的瀏覽器11上指定遠端服務(wù)系統(tǒng)20的課程網(wǎng)頁21的地址時,瀏覽器11會將學員所提出的要求傳送到網(wǎng)際網(wǎng)絡(luò)4上,當該指定的遠端服務(wù)系統(tǒng)20的服務(wù)引擎SE22接收到該學員的要求時,即回傳該指定課程網(wǎng)頁21的首頁(其中的信號包括加入會員、學習精靈、談天室、新手上路、會員登入、電子郵件及課程種類等)到用戶系統(tǒng)10瀏覽器11上。學員通過瀏覽器11可看到課程網(wǎng)頁21的首頁,并在該首頁所提供的選項上,學員可點選遠端服務(wù)系統(tǒng)20所提供的各項課程種類(例如,英語課程、日語課程等),每一課程種類選項下,都包含多項課程(例如英語課程種類下有每日一句、發(fā)音課程、英文小技巧、開口說、實用對話等),學員可按照個人的喜好點選課程,則遠端服務(wù)系統(tǒng)20便從線上資料庫23提取對應(yīng)的課程內(nèi)容。
假設(shè)學員點選英語課程中的“實用對話”這個選項來作線上語音互動課程,用戶系統(tǒng)10將該要求傳送到遠端服務(wù)系統(tǒng)20,遠端服務(wù)系統(tǒng)20的服務(wù)引擎SE22接收到該要求后,即回傳所對應(yīng)的學習網(wǎng)頁21以及課程內(nèi)容到用戶系統(tǒng)10,學員在瀏覽器11上可看到“實用對話”項下所包含的課程內(nèi)容(例如,商用英文、觀光英文、娛樂英交、留學生英文、緊急情況用英文等),而這些課程內(nèi)容將可由線上資料庫23來提供。
例如當學員點選“商用英文”為線上互動學習的課程后,該要求傳出,對應(yīng)網(wǎng)頁21執(zhí)行并回傳后,學員可在瀏覽器11上看到該課程的詳細選項,詳細選項共分為三級,初級課程、中級課程及高級課程;每一等級課程分別包含多項課程,每一課程都包含一課程代碼。當學員點選其中任一課程后,用戶系統(tǒng)10將該課程代碼回傳到遠端服務(wù)系統(tǒng)20,該遠端服務(wù)系統(tǒng)20的服務(wù)引擎SE22即按照該代碼到線上資料庫23上找出所對應(yīng)的課程內(nèi)容,并回傳到用戶系統(tǒng)10。
在本發(fā)明提供的線上語音互動系統(tǒng)的實施方法的實施例中,對話課程教學是以角色扮演的方式來執(zhí)行線上互動對話機制,學員首先選取所想扮演的角色,以便和虛擬老師進行對話,其中所謂的虛擬老師是指利用用戶系統(tǒng)10的多媒體環(huán)境配合該用戶系統(tǒng)10中的語音辯識引擎SER12,模擬與學員對話;接著學員再選擇所要求的辯識率(辯識率越高,辯識程度越嚴格)。待所要扮演的角色和辯識率都選擇完成后,便可開始角色扮演的課程了。角色扮演的方式是學員按照步驟和次序通過麥克風102念出課程內(nèi)容的句子,而虛擬老師的聲音則是通過揚聲器或耳機101傳到學員耳中。待學員念完一段句子后,客戶端引擎13將對應(yīng)的句子送入語音辯識引擎SER12,該語音辯識引擎SER12將轉(zhuǎn)換句子正確存儲語音與接收到的學員語音作線上語音辯識對比,如果對比辯識結(jié)果達到學員所設(shè)定的辯識率,客戶端引擎13就會繼續(xù)進行下一句對話。如果辯識率沒有達到學員所設(shè)定的辯識率,或者學員的聲音輸入不太清楚(如有雜音等),客戶端引擎13會要求學員再念一遍,學員一共有三次機會可以修正發(fā)音,超過三次辯識不過以后,客戶端引擎13會自動播放該句子的正確發(fā)音,供學員參考。通過如此不斷的發(fā)音及辯識糾正,學員可以收到發(fā)音練習的功效。
在本發(fā)明提供的語音互動系統(tǒng)的實施方法的實施例中,學員也可以會員登入的方式進入系統(tǒng),當學員以會員登入方式進入系統(tǒng)后,系統(tǒng)會按照據(jù)學員的登入名稱記錄每次上課的內(nèi)容,并存儲在線上資料庫23中,待下次學員再次登入該系統(tǒng)時,系統(tǒng)會根據(jù)線上資料庫23的記錄自動回傳顯示學員最后一次上課的課程,如此,學員可免去記憶上次上課的課程位置的困擾。
如圖4所示線上語音互動系統(tǒng)的核心為用戶系統(tǒng)10中的客戶端引擎13和語音辯識引擎SRE12??蛻舳艘?3包含一流程引擎131與一轉(zhuǎn)換界面132,其中流程引擎131控制線上語音互動系統(tǒng)的進行,該線上語音互動系統(tǒng)通過信號擷取界面11可獲得學員語音輸入的發(fā)音項目內(nèi)容,即句子或單字,并經(jīng)過轉(zhuǎn)換界面132轉(zhuǎn)換成語音辯識引擎SRE12可接收的資料格式,傳送到語音辯識引擎SRE12。該語音辯識引擎SRE12將接收的資料轉(zhuǎn)換并存儲,做為該輸入語音的對比標的,再與從語音界面設(shè)備所輸入的語音作辯識對比,將其辯識結(jié)果回傳給流程引擎131。流程引擎131根據(jù)該辯識結(jié)果控制學員進行語音互動的對話程序,若學員輸入的語音信號符合該輸入語音的正確發(fā)音信號,則繼續(xù)對話程序;若學員數(shù)次發(fā)音都未達該輸入語音的正確發(fā)音信號的標準,即語音辯識引擎SRE12的辯識結(jié)果都低于要求的辯識率,流程引擎131便呼叫語音辯識引擎SRE12從語音界面設(shè)備播放該輸入語音的正確發(fā)音信號。其次,該流程引擎131可將學員進行語音互動的對話狀況進一步回傳到服務(wù)引擎22,以記錄在線上資料庫23中,例如,學員所下載的學習課程內(nèi)容有哪些與互動對話中辯識率的結(jié)果等,提供一標準,使學員得知自己的進步程度。
在本發(fā)明提供的線上語音互動系統(tǒng)的實施方法的實施例中,客戶端引擎13可應(yīng)用不同的程序語言來實施,這些程序語言包括HTML、DHTML、XML、Javascript、Java Applet、VB Script、Virtual C++、Virtual B、ActiveX或類似的程序語言等,使用戶系統(tǒng)10的作業(yè)環(huán)境能夠執(zhí)行流程引擎131的程序與轉(zhuǎn)換界面132的程序。
在本發(fā)明的線上語音互動系統(tǒng)的實施方法的實施例中,以瀏覽器實施信號擷取界面11為例,并以HTML、Java等程序語言來實現(xiàn)客戶端引擎13,對于熟習Java等程序應(yīng)用的人士來說,將很容易理解本發(fā)明提供的該種實施方式的運作。如圖5所示在本發(fā)明提供實施例中,瀏覽器11’回應(yīng)網(wǎng)頁要求并將信號顯示在網(wǎng)頁上,用戶網(wǎng)站應(yīng)用(Client web AP)111為一組應(yīng)用程序集合,可從瀏覽器11’上取得網(wǎng)頁的信號,例如從服務(wù)引擎22上下載互動對話課程內(nèi)容的句子或單字,或使用者在網(wǎng)頁所輸入的信號。在用戶系統(tǒng)10的作業(yè)環(huán)境中,客戶端引擎13的流程引擎131的程序由程序語言來執(zhí)行,其接收學員語音輸入的發(fā)音項目內(nèi)容并將該項內(nèi)容交給由Java Applet物件程序所實現(xiàn)的轉(zhuǎn)換界面132進行處理,其結(jié)果與語音辯識引擎SRE12相對比,辯識結(jié)果通過用戶網(wǎng)站應(yīng)用111的顯示瀏覽器11’進行顯示,并將學員進行語音互動對話的狀況回傳到服務(wù)引擎22,記錄在線上資料庫23中。
利用Java Applet物件程序?qū)崿F(xiàn)的Java AP界面132’包含網(wǎng)站應(yīng)用界面(Web AP Interface)1321與跨平臺界面(Cross Platform Interface)1322,分別做為網(wǎng)站應(yīng)用的資料處理界面與工作平臺的資料處理界面,由于利用Java程序語言來實現(xiàn)轉(zhuǎn)換界面,所以客戶端引擎13可進一步實現(xiàn)一原生碼(Native Code)1323,以配合跨平臺界面1322組原生碼界面(Native Codelnterface)。在該實施例中,客戶端引擎13的轉(zhuǎn)換界面132還包含語音辯識界面1324,該語音辯識界面1324將資料轉(zhuǎn)換成語音辯識引擎SRE12可接收的資料格式。而在其他實施方式中,若用Microsoft所提供的ActiveX程序語言來實現(xiàn)轉(zhuǎn)換界面132,則語音辯識界面1324將可被整合在一起。
在本發(fā)明提供的該種線上語音互動系統(tǒng)的實施方法的實施例中,以Java等程序語言來實現(xiàn)客戶端引擎13所執(zhí)行的程序,可獲得跨越工作平臺(任何技術(shù)與平臺都可使用)運行,以及網(wǎng)絡(luò)安全性較高的優(yōu)點,而且使本發(fā)明的線上語音互動系統(tǒng)的運行模式在不同作業(yè)環(huán)境中實現(xiàn),使該線上語音互動系統(tǒng)降低開發(fā)成本和操作難度。
語音辯識引擘12可由先前所述的IBM語音辯識版本、L&H語音辯識版本等技術(shù)實施;當學員開始進入線上語音互動系統(tǒng)的運行模式后,學員可通過麥克風102念出網(wǎng)頁中課程內(nèi)容的句子或單字,流程引擎131通過轉(zhuǎn)換界面132將對應(yīng)的句子或單字送入語音辯識引擎12,經(jīng)過語音辯識引擎12轉(zhuǎn)換成語音辯識的對比標的,與學員語音輸入進行辯識對比處理。其中,語音辯識引擎12可根據(jù)所應(yīng)用的語言是中文、英文或其他語言而選擇線上語音互動系統(tǒng)的運行模式,分別實施中文、英文或其他語言的語音辯識。
語音辯識引擎12通過Java Applet實現(xiàn)的轉(zhuǎn)換界面13將辯識結(jié)果回傳給流程引擎131,并由該流程引擎131控制學員在線上語音互動系統(tǒng)的對話程序。倘若辯識結(jié)果的辯識率未超過先前設(shè)定的辯識率,則流程引擎131會呼叫語音辯識引擎12再通過媒體環(huán)境播放正確的發(fā)音,供學員比較學習本發(fā)明提供的該種線上語音互動系統(tǒng)的實施方法的實施例中,學員可從課程網(wǎng)頁21上得知語音互動對話的結(jié)果,其中該線上語音互動系統(tǒng)的運行模式在用戶系統(tǒng)10中完成語音辯識的處理且回傳學員,并將語音互動對話的的結(jié)果記錄到服務(wù)引擎22上,使得遠端服務(wù)系統(tǒng)20與用戶系統(tǒng)10之間大幅減少傳遞有關(guān)語音互動的資料,并使遠端服務(wù)系統(tǒng)20的線上資料庫23能夠完整地記錄學員的學習過程。
如圖5和圖6所示圖6為圖5所示的模式架構(gòu)圖的實施互動模式的流程圖。在本發(fā)明提供的該種線上語音互動系統(tǒng)的實施方法的實施例中,首先程序30中,學員先通過課程網(wǎng)頁21完成課程內(nèi)容選擇、角色扮演以及辯識率等設(shè)置后,再完成線上語音互動系統(tǒng)的運行模式的設(shè)定,學員便可以開始進行線上音互動練習;程序31是在課程網(wǎng)頁21上指示第一次對話練習的句子或單字;在緊接著程序32到37中,在客戶端引擎13所實施的連結(jié)機制中,流程引擎131將發(fā)音項目所對應(yīng)的句子或單字傳給語音辯識引擎12,該語音辯識引擎12是由Java Applet物件程序所實現(xiàn)的,Java AP界面132’與語音辯識面1324,獲得辯識結(jié)果,通過流程引擎131決定是否再過用戶網(wǎng)站應(yīng)用111在課程網(wǎng)頁21在線上回應(yīng)學員再發(fā)音練習或進行下一句子或單字的對話練習;倘若在預設(shè)的對話次數(shù)中,學員發(fā)音的辯識結(jié)果都未超過選擇的辯識率,則程序38中流程引擎131會呼叫語音辯識引擎12通過多媒體環(huán)境播放正確的發(fā)音;而在程序39中決定對話練習是否結(jié)束;當決定為“是”時,則程序41進行到一下個課文句子或單字的第一次對話練習;當決定為“否”時,則由程序40結(jié)束角色扮演的語音互動模式。
在詳細說明本發(fā)明的較佳實施例后,熟悉該項技術(shù)人士能夠清楚的了解到如果對該發(fā)明提供的技術(shù)方案進行各種變化與改變,也可實施上述技術(shù)內(nèi)容,例如以不同的程序語言來實現(xiàn)客戶端引擎13,一樣能夠達到本發(fā)明的功能(Function)與功效(Result)。本發(fā)明雖己揭了本技術(shù)方案的實施方式,但并非用以限定本發(fā)明,任何熟悉該項技術(shù)的人員,在不脫離本發(fā)明的精神和范圍內(nèi),如若對本發(fā)明作各種更動或修飾,仍屬本發(fā)明的保護范圍。
權(quán)利要求
1.一種線上語音互動系統(tǒng),其特征在于該線上語音互動系統(tǒng)利用網(wǎng)際網(wǎng)絡(luò)實施語音互動模式,該線上語音互動系統(tǒng)包含一遠端服務(wù)系統(tǒng)和一用戶系統(tǒng),所述遠端服務(wù)系統(tǒng)安裝一服務(wù)引擎,該遠端服務(wù)系統(tǒng)具有一資料庫,該服務(wù)引擎處理網(wǎng)際網(wǎng)絡(luò)上提供的網(wǎng)頁資料與所述資料庫的內(nèi)容;所述用戶系統(tǒng)設(shè)有語音界面設(shè)備,并在該語音界面設(shè)備作業(yè)環(huán)境安裝一信號擷取界面、一客戶端引擎和一語音辯識引擎,該語音辯識引擎處理該語音界面設(shè)備接收的語音;所述語音互動模式為遠端服務(wù)系統(tǒng)與用戶系統(tǒng)的間的語音互動模式,由所述信號擷取界面顯示所述資料庫的內(nèi)容并指示發(fā)音項目,而所述客戶端引擎接收發(fā)音項目并傳給所述語音辯識引擎,該語音辯識引擎接收到語音與發(fā)音項目后進行語音對比辯識,該語音辯識引擎將對比辯識結(jié)果回傳給客戶端引擎,其結(jié)果由該信號擷取界面顯示,該信號擷取界面并將該對比辯識結(jié)果信號回傳給服務(wù)引擎,該服務(wù)引擎接收并記錄該對比辯識結(jié)果信號,完成該語音互動模式。
2.如權(quán)利要求1所述的線上語音互動系統(tǒng),其特征在于所述用戶系統(tǒng)為個人電腦、PDA、WAP手機或其他類似具有連線上網(wǎng)的作業(yè)環(huán)境的系統(tǒng)。
3.如權(quán)利要求2所述的線上語音互動系統(tǒng),其特征在于所述作業(yè)環(huán)境可為Windows或Unix或Mac或可實施網(wǎng)際網(wǎng)絡(luò)的信號擷取界面的作業(yè)系統(tǒng)。
4.如權(quán)利要求1所述的線上語音互動系統(tǒng),其特征在于所述信號擷取界面為瀏覽器。
5.如權(quán)利要求1所述的線上語音互動系統(tǒng),其特征在于所述發(fā)音項目為一個句子或一個單字。
6.如權(quán)利要求1所述的線上語音互動系統(tǒng),其特征在于所述語音辯識引擎包含將所述發(fā)音項目轉(zhuǎn)換為與所述接收的語音可辯識對比的資料。
7.如權(quán)利要求1所述的線上語音互動系統(tǒng),其特征在于所述客戶端引擎為通過HTML或DHTML或XML或Java Script或Java Applet或VB Script或Virtual C++或Virtual B或ActiveX或類似的程序語言實現(xiàn)。
8.如權(quán)利要求1所述的線上語音互動系統(tǒng),其特征在于所述客戶端引擎包含一流程引擎和一轉(zhuǎn)換界面,所述流程引擎控制所述語音互動模式的進行;所述轉(zhuǎn)換界面轉(zhuǎn)換該發(fā)音項目,使該發(fā)音項目轉(zhuǎn)換為該語音辯識引擎可接收的資料格式。
9.如權(quán)利要求8所述的線上語音互動系統(tǒng),其特征在于所述轉(zhuǎn)換界面由Java Applet程序語言來實現(xiàn)。
10.如權(quán)利要求8所述的線上語音互動系統(tǒng),其特征在于所述轉(zhuǎn)換界面還包含一語音辯識界面。
11.如權(quán)利要求8所述的線上語音互動系統(tǒng),其特征在于所述轉(zhuǎn)換界面包含第一界面和第二界面,該第一界面處理所述信號擷取界面上網(wǎng)站應(yīng)用的資料;該第二界面處理工作平臺的資料。
12.如權(quán)利要求1所述的線上語音互動系統(tǒng),其特征在于所述語音辯識引擎可實施中文或英文語音辯識,或者其他語言的語音辯識。
13.如權(quán)利要求8所述的線上語音互動系統(tǒng),其特征在于所述流程引擎通過所述轉(zhuǎn)換界面接收到語音與轉(zhuǎn)換發(fā)音項目以及正確語音的辯識結(jié)果,該流程引擎根據(jù)該辯識結(jié)果控制所述語音互動模式的進行,并將所述語音互動模式的記錄回傳給所述服務(wù)引擎,該服務(wù)引擎將該語音互動模式的記錄儲存于所述資料庫中。
14.如權(quán)利要求1所述的線上語音互動系統(tǒng),其特征在于所述網(wǎng)際網(wǎng)絡(luò)包括有線通訊網(wǎng)絡(luò)或無線通訊網(wǎng)絡(luò)或包含有線與無線通訊資源所組成的網(wǎng)絡(luò)。
15.一種實現(xiàn)上述線上語音互動系統(tǒng)的實施方法,其特征在于該線上語音互動系統(tǒng)的實施方法控制在網(wǎng)際網(wǎng)絡(luò)上實施語音互動系統(tǒng)的流程,該線上語音互動系統(tǒng)的實施方法包含在一遠端服務(wù)系統(tǒng)中提供一服務(wù)引擎,該遠端服務(wù)引擎提供網(wǎng)頁資料與發(fā)音項目的內(nèi)容;在一用戶系統(tǒng)的多媒體作業(yè)環(huán)境中提供一執(zhí)行程序,該執(zhí)行程序包含信號擷取界面,該信號擷取界面從網(wǎng)際網(wǎng)絡(luò)上擷取網(wǎng)頁信號與所述發(fā)音項目的內(nèi)容;語音辯識界面,該語音辯識界面辯識有關(guān)所述發(fā)音項目的資料,與多媒體的輸入語音;以及客戶端程序,該客戶端程序提供有關(guān)所述發(fā)音項目的資料給所述語音辯識程序,并根據(jù)所述語音辯識程序的辯識結(jié)果控制所述線上語音互動系統(tǒng)流程的進行,且將所述線上語音互動系統(tǒng)流程的辯識記錄回傳所述遠端服務(wù)系統(tǒng)的服務(wù)引擎。
16.如權(quán)利要求15所述的線上語音互動系統(tǒng),其特征在于所述客戶端程序包含將所述發(fā)音項目轉(zhuǎn)換為所述語音辯識程序所需的資料。
17.如權(quán)利要求15所述的線上語音互動系統(tǒng),其特征在于所述客戶端程序包含控制所述線上語音互動系統(tǒng)流程運行的發(fā)音項目的程序內(nèi)容。
18.如權(quán)利要求15所述的線上語音互動系統(tǒng),其特征在于所述在用戶系統(tǒng)的多媒體作業(yè)環(huán)境中的執(zhí)行程序還包含設(shè)定一辯識率,所述客戶端程序根據(jù)該辯識率判斷辯識結(jié)果是否滿足該辯識率,并根據(jù)該辯識結(jié)果控制該線上語音互動系統(tǒng)流程的進行。
19.如權(quán)利要求15所述的線上語音互動系統(tǒng),其特征在于所述在用戶系統(tǒng)的多媒體作業(yè)環(huán)境中執(zhí)行的程序還包含設(shè)定所述線上語音互動系統(tǒng)流程的角色扮演,所述客戶端程序根據(jù)該角色扮演決定該語音辯識程序所要提供的辯識發(fā)音項目。
全文摘要
本發(fā)明公開了一種線上語音互動系統(tǒng)及其實施方法,該線上語音互動系統(tǒng)利用網(wǎng)際網(wǎng)絡(luò)實施語音互動模式,該線上語音互動系統(tǒng)包含:一遠端服務(wù)系統(tǒng)和一用戶系統(tǒng),所述遠端服務(wù)系統(tǒng)安裝一服務(wù)引擎,所述用戶系統(tǒng)設(shè)有語音界面設(shè)備,實現(xiàn)用戶與服務(wù)系統(tǒng)之間的語音互動模式,該線上語音互動系統(tǒng)的實施方法可實現(xiàn)上述線上語音互動系統(tǒng)的運作。該線上語音互動系統(tǒng)及其實施方法具有利用網(wǎng)際網(wǎng)絡(luò)資源使學員在線上進行語音互動學習。
文檔編號G10L15/06GK1362703SQ01100608
公開日2002年8月7日 申請日期2001年1月5日 優(yōu)先權(quán)日2001年1月5日
發(fā)明者郭子逢, 陳燦煜 申請人:甦活全球網(wǎng)路股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1