專利名稱:基于代理技術(shù)的遠(yuǎn)程教育環(huán)境中語音答疑系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一個計(jì)算機(jī)應(yīng)用領(lǐng)域的系統(tǒng),具體是一種基于代理技術(shù)的遠(yuǎn) 程教育環(huán)境中語音答疑系統(tǒng)。
技術(shù)背景在遠(yuǎn)程教育環(huán)境中,答疑系統(tǒng)有著比在傳統(tǒng)教育環(huán)境中更加重要的作用。 由于缺乏課堂上的實(shí)時交流,答疑系統(tǒng)就成為了促進(jìn)師生交流和提高教學(xué)質(zhì)量的 一個重要途徑。然而目前的答疑系統(tǒng)大多是基于文本方式的,使得在學(xué)生與網(wǎng)絡(luò) 教育環(huán)境之間的交互不夠友好,在這種情況下,很多學(xué)者和專家都提出了一些利 用多媒體技術(shù)進(jìn)行構(gòu)建答疑系統(tǒng)的方法。經(jīng)對現(xiàn)有技術(shù)的文獻(xiàn)檢索發(fā)現(xiàn),Jeffrey Holmes等在《Computer and Education》(計(jì)算機(jī)與教育)(48(2007), 523-547)上發(fā)表的(Designing agents to support learning by explaining)(設(shè)計(jì)一個通過角軍釋進(jìn)行輔助交易的代 理),該文中提出一個基于軟件代理的教學(xué)輔助系統(tǒng),該系統(tǒng)是一個3D模型的助 教系統(tǒng),在學(xué)生學(xué)習(xí)的時候提供答疑功能,并且會有一些擬人化的方式來構(gòu)建一 個輕松的學(xué)習(xí)氛圍。實(shí)驗(yàn)結(jié)果顯示,軟件代理技術(shù)確實(shí)在遠(yuǎn)程教育環(huán)境中能夠起 到積極的作用。但該系統(tǒng)存在如下不足(1)只能提供文本方式的交流,并沒 有語音識別和文本-語音轉(zhuǎn)換的能力。(2)該系統(tǒng)在擬人化方面做的不足,使得 交流的氣氛不夠活躍。 發(fā)明內(nèi)容本發(fā)明針對上述現(xiàn)有技術(shù)中的不足,提供了一種基于代理技術(shù)的遠(yuǎn)程教育環(huán) 境中語音答疑系統(tǒng),使其能夠用語音方式進(jìn)行人機(jī)交互,給用戶提供良好交流氛 圍的答疑系統(tǒng),從而幫助用戶解決在遠(yuǎn)程教育環(huán)境中的答疑問題。本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明包括語音識別引擎模塊、后臺分詞匹配代理模塊、答疑數(shù)據(jù)庫模塊、文本語音轉(zhuǎn)換引擎(TTS)模塊、界面模 塊,所述語音識別引擎模塊接收用戶由麥克風(fēng)以語音的形式輸入的問題,語音識
別引擎模塊識別出語音內(nèi)容并將語音轉(zhuǎn)化為文字,然后傳遞給后臺分詞匹配代理 模塊;所述后臺分詞匹配代理模塊將接受的文字通過分詞和匹配技術(shù),從后臺的 答疑數(shù)據(jù)庫模塊中檢索出答案,并將此答案遞交給界面模塊;所述答疑數(shù)據(jù)庫模 塊,是保存問題和答案的數(shù)據(jù)庫;所述界面模塊在計(jì)算機(jī)屏幕上顯示相應(yīng)的文本, 并調(diào)用文本語音轉(zhuǎn)換引擎模塊;所述文本語音轉(zhuǎn)換引擎模塊將文本方式的答案轉(zhuǎn) 換為語音輸出。
所述后臺分詞匹配代理模塊,是進(jìn)行檢索詞匹配的模塊,首先將用戶輸入的 檢索詞切分成幾個原子檢索詞,原子檢索詞就是不能再進(jìn)一步拆分的檢索詞,然 后根據(jù)原子檢索詞來對答疑數(shù)據(jù)庫模塊進(jìn)行檢索,找到相應(yīng)的答案,并將答案傳 遞給界面模塊。
所述答疑數(shù)據(jù)庫模塊,是保存用戶經(jīng)常問的問題和對應(yīng)的答案的數(shù)據(jù)庫,并 且將問題和答案之間建立起對應(yīng)關(guān)系。
所述界面模塊,是人機(jī)交互的模塊, 一方面,界面模塊提供文字的交互界面, 還在界面上提供了一些人物或者動物的活動精靈的圖標(biāo),這些圖標(biāo)在和用戶交互 的時候,會有各種各樣的姿勢,比如微笑、點(diǎn)頭,用來活躍和用戶交互的氣氛。
本發(fā)明工作時,用戶在答疑系統(tǒng)界面上通過麥克風(fēng)說出自己的問題,語音識 別弓I擎模塊將這段語音內(nèi)容進(jìn)行識別,語音識別弓I擎模塊將識別出來的內(nèi)容轉(zhuǎn)化 為文本方式,并將其交給后臺分詞檢索代理模塊,后臺分詞匹配代理模塊將語音 識別引擎模塊傳過來的內(nèi)容進(jìn)行切分和整理,變成相應(yīng)的檢索關(guān)鍵詞,并用檢索 關(guān)鍵詞對答疑數(shù)據(jù)庫模塊進(jìn)行檢索,找到一些與此相關(guān)的答案,后臺分詞匹配代 理模塊將這些答案進(jìn)行過濾,得到與檢索關(guān)鍵詞最匹配的答案,并將答案傳送給 界面模塊,界面模塊將后臺分詞匹配代理模塊傳過來的答案傳送到文本語音轉(zhuǎn)換 引擎模塊,文本語音轉(zhuǎn)換引擎模塊將文本轉(zhuǎn)化為語音輸出,界面模塊根據(jù)語音輸 出的情況,在屏幕上顯示出對應(yīng)的文本,界面模塊同時還做出不同的姿勢和表情 來進(jìn)一步讓用戶交互過程變得更加活潑。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果(1)提供了自然語言的交互方 式自然語言是人類最基本的交流方式,很多人對于鍵盤為主的交流方式感到 困難,本發(fā)明中通過自然語言的方法進(jìn)行遠(yuǎn)程教育環(huán)境中的答疑,這體現(xiàn)在兩個 方面第一是學(xué)生的提問用的是自然語言,這個提問的語言會轉(zhuǎn)換成文字傳給系
統(tǒng);第二是系統(tǒng)給出的文本答案,通過轉(zhuǎn)換也變成自然語言的方式表達(dá)給用戶, 這樣學(xué)生會感到答疑的過程很輕松;(2)提供了更加活躍的交互氛圍傳統(tǒng)的文本交互給用戶的感覺是冷冰冰的,本發(fā)明中提供的界面則以一種擬人化的方式和 用戶交流,它不但會用自然語言的方式和用戶對話,還可以有各種各樣的表情和 動作,比如微笑,點(diǎn)頭,從而在屏幕上建立了一種非常友好和融洽的交流氛圍。
圖l本發(fā)明系統(tǒng)框圖; 圖2是本發(fā)明系統(tǒng)工作流程示意圖。
具體實(shí)施方式
下面結(jié)合附圖對本發(fā)明的實(shí)施例作詳細(xì)說明本實(shí)施例在以本發(fā)明技術(shù)方案 為前提下進(jìn)行實(shí)施,給出了詳細(xì)的實(shí)施方式和過程,但本發(fā)明的保護(hù)范圍不限于 下述的實(shí)施例。如圖1所示,本實(shí)施例包括語音識別引擎模塊、后臺分詞匹配代理模塊、 答疑數(shù)據(jù)庫模塊、文本語音轉(zhuǎn)換引擎(TTS)模塊、界面模塊,所述語音識別引 擎模塊接收用戶由麥克風(fēng)以語音的形式輸入的問題,語音識別引擎模塊識別出語 音內(nèi)容并將語音轉(zhuǎn)化為文字,然后傳遞給后臺分詞匹配代理模塊;所述后臺分詞 匹配代理模塊將接受的文字通過分詞和匹配技術(shù),從后臺的答疑數(shù)據(jù)庫模塊中檢 索出答案,并將此答案遞交給界面模塊;所述答疑數(shù)據(jù)庫模塊,是保存問題和答 案的數(shù)據(jù)庫;所述界面模塊在計(jì)算機(jī)屏幕上顯示相應(yīng)的文本,并調(diào)用文本語音轉(zhuǎn) 換引擎模塊;所述文本語音轉(zhuǎn)換引擎模塊將文本方式的答案轉(zhuǎn)換為語音輸出。所述后臺分詞匹配代理模塊,負(fù)責(zé)進(jìn)行檢索詞的匹配,首先是將用戶輸入的 檢索詞切分成幾個原子的關(guān)鍵詞,原子的關(guān)鍵詞就是不能再進(jìn)一步拆分的檢索 詞,然后根據(jù)原子檢索詞來對答疑數(shù)據(jù)庫進(jìn)行檢索,找到相應(yīng)的答案,并將答案 傳遞給界面模塊。所述答疑數(shù)據(jù)庫模塊,是保存用戶經(jīng)常問的問題和對應(yīng)的答案的數(shù)據(jù)庫,并 且將問題和答案之間建立起對應(yīng)關(guān)系。所述界面模塊,是人機(jī)交互的模塊, 一方面,界面模塊提供文字的交互界面, 還在界面上提供了一些人物或者動物的活動精靈的圖標(biāo),這些圖標(biāo)在和用戶交互 的時候,會有各種各樣的姿勢,比如微笑、點(diǎn)頭,用來活躍和用戶交互的氣氛。
所述界面模塊是采用微軟代理開發(fā)工具進(jìn)行編程,除了微軟代理自帶的一些 角色之外,還可以使用其他的第三方廠商開發(fā)的角色。所述語音識別引擎模塊和文本語音轉(zhuǎn)換引擎模塊,都采用微軟提供的兩個開 發(fā)包,開發(fā)包在visual stadio.net中己經(jīng)集成,直接調(diào)用即可。如圖2所示,本實(shí)施例工作時,包含問題輸入、答案檢索、答案返回三個過程,首先為問題輸入過程,具體如下a.用戶在答疑系統(tǒng)界面上通過麥克風(fēng)說 出自己的問題;b.語音識別引擎模塊將這段語音內(nèi)容進(jìn)行識別;C.語音識別引 擎模塊將識別出來的內(nèi)容轉(zhuǎn)化為文本方式,并將其交給后臺分詞檢索代理模塊;其次為答案檢索過程,具體如下a.后臺分詞匹配代理模塊將語音識別引 擎模塊傳過來的內(nèi)容進(jìn)行切分和整理,變成相應(yīng)的檢索關(guān)鍵詞;b.后臺分詞匹 配代理模塊用檢索關(guān)鍵詞對答疑數(shù)據(jù)庫模塊進(jìn)行檢索,找到一些與此相關(guān)的答 案;C.后臺分詞匹配代理模塊將這些答案進(jìn)行過濾,得到與檢索關(guān)鍵詞最匹配 的答案,并將答案傳送給界面模塊。最后為答案返回過程,具體如下a.該界面模塊將后臺分詞匹配代理模塊 傳過來的答案傳送到文本語音轉(zhuǎn)換引擎模塊;b.文本語音轉(zhuǎn)換引擎模塊將文本 轉(zhuǎn)化為語音輸出;C.界面模塊根據(jù)語音輸出的情況,在屏幕上顯示出對應(yīng)的文 本;d.界面模塊同時還做出不同的姿勢和表情來進(jìn)一步讓用戶交互過程變得更 加活潑。下面以有關(guān)計(jì)算機(jī)數(shù)據(jù)結(jié)構(gòu)課程的"線性表有幾種實(shí)現(xiàn)方式?"這個問題來 說明本實(shí)施例系統(tǒng)的工作流過程如下學(xué)生打開本實(shí)施例系統(tǒng)的屏幕,對著麥克風(fēng)說出自己的問題"線性表有幾 種實(shí)現(xiàn)方式?",這個語音問題通過麥克風(fēng)輸入到計(jì)算機(jī)系統(tǒng)中,然后語音識別 引擎模塊獲取該語音輸入,識別出其中的內(nèi)容并轉(zhuǎn)化為文字內(nèi)容,此時語音識別 的階段完成;后臺分詞匹配代理模塊獲取語音識別引擎模塊傳遞來的文本形式的 問題,將內(nèi)容切分為'線性表''實(shí)現(xiàn)方式'兩個關(guān)鍵詞,并用這兩個關(guān)鍵詞在 答疑數(shù)據(jù)庫模塊中進(jìn)行檢索,獲得初步的答案;后臺分詞匹配代理模塊將檢索到 的答案進(jìn)行篩選后找出最恰當(dāng)?shù)拇鸢?,?nèi)容為"線性表共有順序表和鏈表兩種實(shí) 現(xiàn)方式,其主要原理為XXXXX",然后將該答案傳遞給界面模塊。界面模塊將 答案發(fā)送給語音文本轉(zhuǎn)換引擎模塊,語音文本轉(zhuǎn)換引擎模塊將答案的內(nèi)容轉(zhuǎn)化為 語音方式反饋給用戶,同時界面模塊在朗讀答案的時候也做出各種動作和姿勢, 比如微笑、點(diǎn)頭等,來活躍交流的氣氛。本實(shí)施例提供了用語音方式來和用戶進(jìn)行答疑的操作,學(xué)員直接用自己最熟 悉的自然語言和遠(yuǎn)程教育系統(tǒng)進(jìn)行交互,無需鍵盤輸入,不僅僅提高了速度,更 增加的人機(jī)交互的友好型,融洽了遠(yuǎn)程教育的學(xué)習(xí)氣氛。
權(quán)利要求
1、 一種基于代理技術(shù)的遠(yuǎn)程教育環(huán)境中語音答疑系統(tǒng),包括答疑數(shù)據(jù)庫模塊、 后臺分詞匹配代理模塊,其特征在于,還包括語音識別引擎模塊、文本語音轉(zhuǎn)換 引擎模塊、界面模塊,所述語音識別引擎模塊接收用戶由麥克風(fēng)以語音的形式輸入 的問題,語音識別引擎模塊識別出語音內(nèi)容并將語音轉(zhuǎn)化為文字,并將文字傳遞給 后臺分詞匹配代理模塊;所述后臺分詞匹配代理模塊將接受的文字通過分詞和匹配 技術(shù),從答疑數(shù)據(jù)庫模塊中檢索出答案,并將此答案遞交給界面模塊;所述答疑數(shù) 據(jù)庫模塊是保存問題和答案的數(shù)據(jù)庫,為后臺分詞匹配代理模塊提供檢索所需的答 案;所述界面模塊在計(jì)算機(jī)屏幕上顯示相應(yīng)的文本,并調(diào)用文本語音轉(zhuǎn)換引擎模塊 將答案進(jìn)行語音轉(zhuǎn)換;所述文本語音轉(zhuǎn)換引擎模塊將文本方式的答案轉(zhuǎn)換為語音輸 出。
2、 根據(jù)權(quán)利要求1所述的基于代理技術(shù)的遠(yuǎn)程教育環(huán)境中語音答疑系統(tǒng),其特 征是,所述后臺分詞匹配代理模塊,負(fù)責(zé)進(jìn)行檢索詞的匹配,首先是將用戶輸入的 檢索詞切分成若干個原子檢索詞,原子檢索詞就是不能再進(jìn)一步拆分的檢索詞,然 后根據(jù)原子檢索詞來對答疑數(shù)據(jù)庫進(jìn)行檢索,找到相應(yīng)的答案,并將答案傳遞給界 面模塊。
3、 根據(jù)權(quán)利要求1所述的基于代理技術(shù)的遠(yuǎn)程教育環(huán)境中語音答疑系統(tǒng),其特 征是,所述答疑數(shù)據(jù)庫模塊,是保存用戶經(jīng)常問的問題和對應(yīng)答案的數(shù)據(jù)庫,并且 將問題和答案之間建立起對應(yīng)關(guān)系。
4、 根據(jù)權(quán)利要求1所述的基于代理技術(shù)的遠(yuǎn)程教育環(huán)境中語音答疑系統(tǒng),其特 征是,所述界面模塊,是人機(jī)交互的模塊,界面模塊不僅提供文字的交互界面,還 在界面上提供了一些人物或者動物的活動精靈的圖標(biāo),這些圖標(biāo)在和用戶交互的時 候,會有各種各樣的姿勢,用來活躍和用戶交互的氣氛。
全文摘要
一種計(jì)算機(jī)應(yīng)用領(lǐng)域的基于代理技術(shù)的遠(yuǎn)程教育環(huán)境中語音答疑系統(tǒng),包括語音識別引擎模塊、后臺分詞匹配代理模塊、答疑數(shù)據(jù)庫模塊、文本語音轉(zhuǎn)換引擎模塊、界面模塊,語音識別引擎模塊、后臺分詞匹配代理模塊、答疑數(shù)據(jù)庫模塊、文本語音轉(zhuǎn)換引擎模塊、界面模塊,所述語音識別引擎模塊將語音轉(zhuǎn)化為文字,傳遞給后臺分詞匹配代理;所述后臺分詞匹配代理模塊將文字通過分詞和匹配技術(shù),從答疑數(shù)據(jù)庫檢索出答案,遞交給界面模塊;所述答疑數(shù)據(jù)庫模塊,負(fù)責(zé)保存問題和答案;所述界面模塊顯示文本,并調(diào)用文本語音轉(zhuǎn)換引擎;所述文本語音轉(zhuǎn)換引擎將文本轉(zhuǎn)換為語音輸出。本發(fā)明提供用語音方式進(jìn)行答疑,增加人機(jī)交互的友好型,融洽學(xué)習(xí)氣氛。
文檔編號G09B7/02GK101145289SQ200710045898
公開日2008年3月19日 申請日期2007年9月13日 優(yōu)先權(quán)日2007年9月13日
發(fā)明者鵬 丁, 檀曉紅, 申瑞民, 恒 羅, 剛 陳 申請人:上海交通大學(xué)