交互式語(yǔ)言學(xué)習(xí)系統(tǒng)及交互式語(yǔ)言學(xué)習(xí)方法

文檔序號(hào)：2569415閱讀：189來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>辦公文教;裝訂;廣告設(shè)備的制造及其產(chǎn)品制作工藝

專利名稱：交互式語(yǔ)言學(xué)習(xí)系統(tǒng)及交互式語(yǔ)言學(xué)習(xí)方法
交互式語(yǔ)言學(xué)習(xí)系統(tǒng)及交互式語(yǔ)言學(xué)習(xí)方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種交互式語(yǔ)言學(xué)習(xí)系統(tǒng)及交互式語(yǔ)言學(xué)習(xí)方法。
背景技術(shù)：
語(yǔ)言學(xué)習(xí)是人們所學(xué)知識(shí)中非常重要的部分之一。也有越來(lái)越多的人依靠語(yǔ)言學(xué) 習(xí)輔助工具來(lái)提高語(yǔ)言學(xué)習(xí)的速度和效率。豐富的學(xué)習(xí)內(nèi)容、互動(dòng)的交互方式、個(gè)性化的課程、便于操作等方面已經(jīng)是語(yǔ)言學(xué)習(xí)系統(tǒng)的發(fā)展的必然趨勢(shì)。字典實(shí)質(zhì)是一種學(xué)習(xí)輔助系統(tǒng)，但是它僅僅以文字為媒介，雖然在閱讀和寫作上有幫助，但是對(duì)于聽(tīng)和說(shuō)并不能起到直接的幫助作用。隨著計(jì)算機(jī)、多媒體、語(yǔ)音等技術(shù)的不斷發(fā)展，能夠?qū)β?tīng)說(shuō)讀寫等方面有一定程度或部分支持的輔助學(xué)習(xí)系統(tǒng)不斷涌現(xiàn)。從電子辭典的出現(xiàn)，到后來(lái)的跟讀機(jī)、點(diǎn)讀機(jī)，以及一些學(xué)習(xí)軟件比如聽(tīng)力、寫作軟件等的出現(xiàn)，使學(xué)習(xí)輔助系統(tǒng)的形式和功能逐漸豐富起來(lái)。但是，這些系統(tǒng)的不足之處是只實(shí)現(xiàn)了對(duì)聽(tīng)說(shuō)讀寫的部分支持，沒(méi)有把語(yǔ)言學(xué)習(xí) 的各個(gè)環(huán)節(jié)有機(jī)的結(jié)合起來(lái)，缺乏實(shí)時(shí)的錯(cuò)誤判斷和反饋，學(xué)習(xí)者只是在被動(dòng)地接受。其中存在對(duì)發(fā)音質(zhì)量評(píng)測(cè)的系統(tǒng)，但其最終給學(xué)習(xí)者的只是一個(gè)分?jǐn)?shù)或者級(jí)別，并且這個(gè)分?jǐn)?shù) 難具準(zhǔn)確性和權(quán)威性。更重要的是，學(xué)習(xí)者關(guān)心的是自己發(fā)音的具體錯(cuò)誤、哪個(gè)地方有誤，但是這種發(fā)音評(píng)測(cè)系統(tǒng)難以給出學(xué)習(xí)者想要的結(jié)果，并且沒(méi)有告訴學(xué)習(xí)者如何糾正錯(cuò)誤。
因此，現(xiàn)有技術(shù)存在缺陷，需要改進(jìn)。

發(fā)明內(nèi)容
有鑒于此，有必要針對(duì)上述問(wèn)題，提供一種能實(shí)時(shí)反饋學(xué)習(xí)錯(cuò)誤情況以及具有交互式練習(xí)和交互式記憶的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)及交互式語(yǔ)言學(xué)習(xí)方法。
—種交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，包括語(yǔ)音采集模塊，用于采集學(xué)習(xí)者的語(yǔ)音數(shù)據(jù)；發(fā)
音及韻律檢測(cè)模塊，用于從語(yǔ)音數(shù)據(jù)中提取用于發(fā)音和韻律錯(cuò)誤檢測(cè)的特征參數(shù)，并對(duì)錯(cuò)
誤進(jìn)行進(jìn)一步判斷以及控制錯(cuò)誤顯示的程度，得到最終的音素錯(cuò)誤和韻律錯(cuò)誤；數(shù)據(jù)存儲(chǔ)
及統(tǒng)計(jì)模塊，用于記錄所述音素錯(cuò)誤和韻律錯(cuò)誤，并結(jié)合這些錯(cuò)誤對(duì)學(xué)習(xí)者的發(fā)音狀況給
予總體評(píng)價(jià)，將評(píng)價(jià)結(jié)果反饋給交互模塊；交互模塊，包括顯示界面，所述顯示界面用于顯
示音素錯(cuò)誤和韻律錯(cuò)誤，學(xué)習(xí)者發(fā)音狀況的總體評(píng)價(jià)以及幫助選項(xiàng)，并提供發(fā)音提示。優(yōu)選的，所述發(fā)音及韻律檢測(cè)模塊包括特征提取模塊，用于從所述語(yǔ)音數(shù)據(jù)中提
取用于發(fā)音和韻律錯(cuò)誤檢測(cè)的特征參數(shù)；語(yǔ)音識(shí)別模塊，基于聲學(xué)模型結(jié)合語(yǔ)言模型或詞
網(wǎng)絡(luò)，對(duì)所述特征參數(shù)進(jìn)行識(shí)別，分別得到單詞序列、音素序列、相應(yīng)的時(shí)間邊界、似然概率
值；發(fā)音評(píng)價(jià)模塊，用于將識(shí)別得到的音素序列和系統(tǒng)的參考音素進(jìn)行比較對(duì)齊，得到音素
錯(cuò)誤及幫助選項(xiàng)；韻律檢測(cè)模塊，用于結(jié)合特征參數(shù)、音素序列、時(shí)間邊界信息，采用統(tǒng)計(jì)模
型得到單詞重讀模式、整句語(yǔ)調(diào)和時(shí)間節(jié)奏；韻律評(píng)價(jià)模塊，用于將單詞重讀模式、整句語(yǔ)
調(diào)和時(shí)間節(jié)奏同參考發(fā)音進(jìn)行比較，得到韻律錯(cuò)誤及幫助選項(xiàng)。優(yōu)選的，所述語(yǔ)音采集模塊采集的語(yǔ)音數(shù)據(jù)包括對(duì)系統(tǒng)提供的發(fā)音提示進(jìn)行跟讀以及按照發(fā)音情景說(shuō)話得到的語(yǔ)音數(shù)據(jù)。優(yōu)選的，所述發(fā)音評(píng)價(jià)模塊首先使用統(tǒng)計(jì)的方法結(jié)合所述單詞序列、音素序列、時(shí)
間邊界和似然概率值進(jìn)行單詞級(jí)別內(nèi)容的判別，如果內(nèi)容不一致，系統(tǒng)記錄內(nèi)容錯(cuò)誤，并在
所述交互模塊中提示整句內(nèi)容不符合要求，請(qǐng)求學(xué)習(xí)者重新輸入語(yǔ)音；否則對(duì)音素進(jìn)行檢測(cè)，得到音素錯(cuò)誤，包括單詞中音素的插入、刪除、替換錯(cuò)誤。優(yōu)選的，所述單詞重讀模式是以音節(jié)為單位進(jìn)行判斷的，包括單詞中主重讀音節(jié) 的位置和次重讀音節(jié)的位置；所述整句語(yǔ)調(diào)是整句話的句重音，即這個(gè)句子中重讀音節(jié)的位置，其基于音節(jié)和語(yǔ)調(diào)，反映整句的基頻變化趨勢(shì)；所述時(shí)間節(jié)奏是對(duì)說(shuō)話的快慢和時(shí)長(zhǎng) 的判斷。優(yōu)選的，所述交互模塊的發(fā)音提示采用發(fā)音文本，該發(fā)音文本是學(xué)習(xí)者的目標(biāo)學(xué)
習(xí)內(nèi)容；或采用參考發(fā)音，該參考發(fā)音是目標(biāo)語(yǔ)言國(guó)家的人所發(fā)的標(biāo)準(zhǔn)語(yǔ)音；又或采用發(fā)
音情景，該發(fā)音情景是系統(tǒng)給出的情景，要求學(xué)習(xí)者按照該發(fā)音情景說(shuō)話。優(yōu)選的，所述交互模塊還包括輸入界面，所述輸入界面用于選擇記憶模式、學(xué)習(xí)內(nèi)
容或退出系統(tǒng)；所述顯示界面還用于顯示系統(tǒng)反饋的信息，包括音頻和拼寫提示信息和所
述數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊反饋的信息；所述交互模塊選擇語(yǔ)言學(xué)習(xí)材料，通過(guò)音頻或者文本
方式對(duì)學(xué)習(xí)者進(jìn)行提示，音頻提示是系統(tǒng)給出需要記憶的發(fā)音，要求學(xué)習(xí)者進(jìn)行拼寫和跟
讀，拼寫提示是系統(tǒng)給出需要記憶的拼寫內(nèi)容的文本提示，要求學(xué)習(xí)者進(jìn)行拼寫，得到拼寫
內(nèi)容；所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)還包括文本采集模塊和文本拼寫檢測(cè)模塊，所述文本采集
模塊用于采集所述拼寫內(nèi)容，得到輸入文本；所述文本拼寫檢測(cè)模塊用于檢查輸入文本，通
過(guò)計(jì)算輸入文本和標(biāo)準(zhǔn)答案文本的相似度編輯距離，得到拼寫錯(cuò)誤；所述數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)
模塊還用于記錄所述拼寫錯(cuò)誤；所述數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊還包擴(kuò)一個(gè)數(shù)據(jù)庫(kù)，具體的錯(cuò)誤
統(tǒng)計(jì)情況將被及時(shí)地寫入該數(shù)據(jù)庫(kù)，該數(shù)據(jù)庫(kù)不僅存儲(chǔ)學(xué)習(xí)記錄，而且還存儲(chǔ)了學(xué)習(xí)內(nèi)容；
系統(tǒng)根據(jù)當(dāng)前的錯(cuò)誤記錄、選擇的記憶模式以及數(shù)據(jù)庫(kù)中存儲(chǔ)的學(xué)習(xí)內(nèi)容，選擇并產(chǎn)生新
的學(xué)習(xí)內(nèi)容以及音頻和拼寫提示，反饋給所述交互模塊，從而進(jìn)入下一輪的交互式學(xué)習(xí)，或
者根據(jù)當(dāng)前的學(xué)習(xí)進(jìn)度重新選擇學(xué)習(xí)內(nèi)容，又或者退出系統(tǒng)。優(yōu)選的，所述拼寫錯(cuò)誤包括替代、插入和刪除錯(cuò)誤。優(yōu)選的，所述交互模塊還用于展示一組任務(wù)形式的對(duì)話場(chǎng)景，通過(guò)該交互模塊選定某個(gè)對(duì)話場(chǎng)景后，將會(huì)出現(xiàn)子任務(wù)，學(xué)習(xí)者要根據(jù)該交互模塊提供的信息，進(jìn)行交互操作并進(jìn)行發(fā)音和拼寫來(lái)完成任務(wù)；所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)還包括用戶接口、操作判別模塊；所述用戶接口用于采集所述交互操作；所述操作判別模塊用于判斷所述交互操作是否符合任務(wù)要求，得到操作錯(cuò)誤；所述數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊還用于記錄所述操作錯(cuò)誤，所述數(shù)據(jù)庫(kù) 還存儲(chǔ)了與對(duì)話相關(guān)的信息；所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)還包括對(duì)話場(chǎng)景模塊，根據(jù)所述數(shù) 據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊輸出的錯(cuò)誤統(tǒng)計(jì)和與對(duì)話相關(guān)的信息，動(dòng)態(tài)生成新的對(duì)話場(chǎng)景，并通過(guò) 所述交互模塊進(jìn)行顯示；學(xué)習(xí)者可以通過(guò)所述交互模塊選擇進(jìn)入新一輪學(xué)習(xí)，或者退出學(xué) 習(xí)。優(yōu)選的，所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)的實(shí)現(xiàn)方式是客戶端/服務(wù)器方式、瀏覽器/服務(wù)器方式、基于嵌入式系統(tǒng)的單機(jī)模式中的一種。 —種交互式語(yǔ)言學(xué)習(xí)方法，包括采集學(xué)習(xí)者按程序要求進(jìn)行發(fā)音得到的語(yǔ)音數(shù) 據(jù)；從語(yǔ)音數(shù)據(jù)中提取用于發(fā)音和韻律錯(cuò)誤檢測(cè)的特征參數(shù)；基于聲學(xué)模型，結(jié)合語(yǔ)言模型或詞網(wǎng)絡(luò)，對(duì)特征參數(shù)進(jìn)行識(shí)別，分別得到單詞序列、音素序列、相應(yīng)的時(shí)間邊界、似然概率值；將音素序列和系統(tǒng)的參考音素進(jìn)行比較對(duì)齊，得到音素錯(cuò)誤及幫助選項(xiàng)；結(jié)合特征參數(shù)、音素序列、時(shí)間邊界信息，采用統(tǒng)計(jì)模型得到單詞重讀模式、整句語(yǔ)調(diào)和時(shí)間節(jié)奏；將單詞重讀模式、整句語(yǔ)調(diào)和時(shí)間節(jié)奏同參考發(fā)音進(jìn)行比較，得到韻律錯(cuò)誤及幫助選項(xiàng)；顯示音素、韻律錯(cuò)誤，發(fā)音狀況的總體評(píng)價(jià)以及幫助選項(xiàng)，并提供發(fā)音提示。優(yōu)選的，還包括以下步驟在采集語(yǔ)音數(shù)據(jù)前，輸出音頻或文本方式的記憶材料，要求學(xué)習(xí)者進(jìn)行發(fā)音和拼寫；采集需要記憶的拼寫內(nèi)容，得到輸入文本；檢查輸入文本，得到拼寫錯(cuò)誤；根據(jù)得到的音素、韻律和拼寫錯(cuò)誤進(jìn)行錯(cuò)誤統(tǒng)計(jì)，記錄具體音素錯(cuò)誤、韻律錯(cuò) 誤以及拼寫錯(cuò)誤情況，并給出評(píng)價(jià)得分和反饋信息；顯示評(píng)價(jià)得分和反饋信息；接收選擇記憶模式、學(xué)習(xí)內(nèi)容或退出程序的指令。優(yōu)選的，還包括以下步驟展示對(duì)話場(chǎng)景，學(xué)習(xí)者按對(duì)話場(chǎng)景要求進(jìn)行發(fā)音、拼寫及交互操作；采集交互操作；判斷交互操作是否符合任務(wù)要求，得到操作錯(cuò)誤；根據(jù)得到的音素、韻律、拼寫和操作錯(cuò)誤進(jìn)行錯(cuò)誤統(tǒng)計(jì)，記錄具體音素發(fā)音、韻律、拼寫以及操作錯(cuò)誤情況，并給出評(píng)價(jià)得分和反饋；動(dòng)態(tài)生成新的對(duì)話場(chǎng)景，并進(jìn)行顯示。上述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)能實(shí)時(shí)的將學(xué)習(xí)者的語(yǔ)音輸入進(jìn)行判斷和反饋，對(duì)學(xué)習(xí) 者的輸入音頻進(jìn)行音素級(jí)別的發(fā)音檢測(cè)和單詞級(jí)別的韻律檢測(cè)，使學(xué)習(xí)者能夠精確把握自己發(fā)音的具體錯(cuò)誤之處，并結(jié)合反饋結(jié)果和記憶曲線動(dòng)態(tài)提供記憶內(nèi)容，使學(xué)習(xí)者能夠循序漸進(jìn)的提高語(yǔ)言水平，形成一種交互式的學(xué)習(xí)方式。

圖1是交互式語(yǔ)言學(xué)習(xí)系統(tǒng)第一實(shí)施方式的示意圖。
圖2是發(fā)音及韻律檢測(cè)模塊的示意圖。
圖3是交互式語(yǔ)言學(xué)習(xí)系統(tǒng)第二實(shí)施方式的示意圖。
圖4是交互式語(yǔ)言學(xué)習(xí)系統(tǒng)第三實(shí)施方式的示意圖。
具體實(shí)施方式

下面結(jié)合附圖，通過(guò)對(duì)本發(fā)明的具體實(shí)施方式
的詳細(xì)描述，將使本發(fā)明的技術(shù)方案及其他有益效果顯而易見(jiàn)。圖1是交互式語(yǔ)言學(xué)習(xí)系統(tǒng)第一實(shí)施方式的示意圖。交互式語(yǔ)言學(xué)習(xí)系統(tǒng)包括兩大部分，即面向用戶的用戶端11和進(jìn)行后臺(tái)處理的數(shù)據(jù)處理端12。用戶端11提供采集學(xué) 習(xí)者行為的設(shè)備和顯示界面，包括語(yǔ)音采集模塊112、交互模塊111 ;數(shù)據(jù)處理端12負(fù)責(zé)對(duì) 用戶端11采集的數(shù)據(jù)進(jìn)行處理并生成顯示信息，包括發(fā)音及韻律檢測(cè)模塊121、數(shù)據(jù)存儲(chǔ) 及統(tǒng)計(jì)模塊122。語(yǔ)音采集模塊112用于采集學(xué)習(xí)者的語(yǔ)音數(shù)據(jù)。對(duì)于采集到的語(yǔ)音首先需要進(jìn)行靜音檢測(cè)，其通過(guò)計(jì)算音頻特征，例如能量(Energy)、過(guò)零率(ZeroCrossing Rate)等判斷是否有語(yǔ)音輸入或者輸入的是否是靜音等，如果判別沒(méi)有語(yǔ)音輸入或者是靜音，將會(huì)要求重新采集語(yǔ)音。發(fā)音及韻律檢測(cè)模塊121用于從語(yǔ)音數(shù)據(jù)中提取用于發(fā)音和韻律錯(cuò)誤檢測(cè)的特征參數(shù)，并對(duì)錯(cuò)誤進(jìn)行進(jìn)一步判斷以及控制錯(cuò)誤顯示的程度，得到最終的音素錯(cuò)誤和韻律
7錯(cuò)誤。數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122記錄內(nèi)容錯(cuò)誤、音素錯(cuò)誤以及韻律錯(cuò)誤，并結(jié)合這些錯(cuò)
誤對(duì)學(xué)習(xí)者的發(fā)音狀況給予總體評(píng)價(jià)，將評(píng)價(jià)結(jié)果反饋給交互模塊lll。交互模塊111用于將該內(nèi)容、音素、韻律錯(cuò)誤，發(fā)音狀況的總體評(píng)價(jià)以及幫助選項(xiàng)
顯示給學(xué)習(xí)者，并提供包括發(fā)音文本、參考發(fā)音或發(fā)音情景的發(fā)音提示。該發(fā)音文本是學(xué)
習(xí)者的目標(biāo)學(xué)習(xí)內(nèi)容，如單詞、短語(yǔ)或句子；該參考發(fā)音是目標(biāo)語(yǔ)言國(guó)家的人所發(fā)的標(biāo)準(zhǔn)語(yǔ)
音；該發(fā)音情景是系統(tǒng)給出的一個(gè)情景，例如在路上遇到朋友向其打招呼，要求學(xué)習(xí)者按照
該情景說(shuō)話。圖2是發(fā)音及韻律檢測(cè)模塊的示意圖。發(fā)音及韻律檢測(cè)模塊121包括特征提取模塊202、語(yǔ)音識(shí)別模塊203、發(fā)音評(píng)價(jià)模塊204、韻律檢測(cè)模塊205、韻律評(píng)價(jià)模塊206。
特征提取模塊202對(duì)語(yǔ)音數(shù)據(jù)提取用于發(fā)音和韻律錯(cuò)誤檢測(cè)的特征參數(shù)，例如感知線性預(yù)測(cè)參數(shù)PLP(Perc印tual Li固r Prediction coefficients) ， Mel倒譜系數(shù) MFCC (Mel—frequency c印stral coefficients)，巾貞平均會(huì)g量(Energy)、艮卩元音所跨越的所有幀的能量，幀平均基頻(Pitch)、即元音所跨越的所有幀的基頻和被其跨越幀數(shù)平均，以及它們前后向差分參數(shù)，包括前向幀平均能量差、后向幀平均能量差、前向輔音幀平均能量差、前向幀平均基頻差、后向幀平均基頻差、前向時(shí)長(zhǎng)差、后向時(shí)長(zhǎng)差等。
語(yǔ)音識(shí)別模塊203基于聲學(xué)模型，并結(jié)合語(yǔ)言模型或者詞網(wǎng)絡(luò)，對(duì)特征參數(shù)進(jìn) 行識(shí)別，分別得到單詞級(jí)別和音素級(jí)別的序列、對(duì)應(yīng)的時(shí)間邊界以及相應(yīng)的似然概率值 (likelihood)?？梢允褂没陔[式馬爾可夫模型(HMM， HiddenMarkov Model)的聲學(xué)模型和一個(gè)發(fā)音詞典。其聲學(xué)模型是使用收集了目標(biāo)語(yǔ)言國(guó)家的人們(Native Speakers)覆蓋所有音素的語(yǔ)音而訓(xùn)練得到的；發(fā)音詞典不僅包含了正確的發(fā)音，同時(shí)也包含了可能的錯(cuò) 誤發(fā)音。其語(yǔ)言模型或詞網(wǎng)絡(luò)是在單詞級(jí)別發(fā)生概率的統(tǒng)計(jì)模型。對(duì)于學(xué)習(xí)者跟讀輸入的語(yǔ)音數(shù)據(jù)，語(yǔ)音識(shí)別模塊203可以使用強(qiáng)制對(duì)齊方法，結(jié)合發(fā)音文本進(jìn)行識(shí)別，得到單詞序列和音素序列，以及時(shí)間邊界和似然概率值；對(duì)于學(xué)習(xí)者按照情景要求說(shuō)話輸入的語(yǔ)音數(shù) 據(jù)，語(yǔ)音識(shí)別模塊可以結(jié)合詞網(wǎng)絡(luò)或語(yǔ)言模型進(jìn)行解碼，得到單詞序列和音素序列，以及時(shí) 間邊界。發(fā)音評(píng)價(jià)模塊204首先使用統(tǒng)計(jì)的方法結(jié)合語(yǔ)音識(shí)別模塊203的輸入進(jìn)行單詞級(jí)別內(nèi)容的判別。如果判定按發(fā)音提示跟讀得到的語(yǔ)音數(shù)據(jù)和參考發(fā)音的單詞序列不同，或者按發(fā)音情景說(shuō)話得到的語(yǔ)音數(shù)據(jù)和標(biāo)準(zhǔn)答案內(nèi)容不同，將不會(huì)進(jìn)行音素級(jí)別的判斷，而直接進(jìn)入數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122，記錄內(nèi)容錯(cuò)誤，并在交互模塊111中提示整句內(nèi)容不符合要求，請(qǐng)求用戶重新輸入語(yǔ)音；否則使用字符串對(duì)齊算法，例如動(dòng)態(tài)規(guī)劃算法(Dynamic Programming Algorithm)，通過(guò)對(duì)音素序列和系統(tǒng)提供的參考音素進(jìn)行比較對(duì)齊并依據(jù)設(shè) 定的反饋錯(cuò)誤精度來(lái)進(jìn)行發(fā)音評(píng)價(jià)，得到音素錯(cuò)誤，包括單詞中音素的插入(Insertion), 刪除(Deletion)和替換(Substitution)三類錯(cuò)誤，以及幫助選項(xiàng)。韻律檢測(cè)模塊205包括單詞級(jí)別的單詞重音模式(Lexical stress)檢測(cè)、韻律 (Prosody)檢測(cè)，其結(jié)合語(yǔ)音識(shí)別模塊203的結(jié)果、即音素序列、對(duì)應(yīng)的時(shí)間邊界信息、似然概率值，和特征提取模塊202得到的幀平均能量、幀平均基頻信息，根據(jù)系統(tǒng)提供的統(tǒng)計(jì)模型來(lái)得到語(yǔ)音數(shù)據(jù)句子中的單詞重讀模式、整句語(yǔ)調(diào)和時(shí)間節(jié)奏情況。該統(tǒng)計(jì)模型可以是通過(guò)訓(xùn)練得到的支持向量機(jī)模型(SVM， Su卯ort Vector Machine)，或者神經(jīng)網(wǎng)絡(luò)(NeuralNetwork)，或者隱式馬爾可夫模型(HMM，Hidden Markov Model)等；該單詞重讀模式是以音節(jié)為單位進(jìn)行判斷的，包括單詞中主重讀音節(jié)的位置和次重讀音節(jié)的位置；該整句語(yǔ)調(diào)是整句話的句重音，即這個(gè)句子中重讀音節(jié)的位置，是基于音節(jié)和語(yǔ)調(diào)的整句的基頻變化趨勢(shì)；該時(shí)間節(jié)奏是說(shuō)話的快慢和時(shí)長(zhǎng)方面的判斷。韻律評(píng)價(jià)模塊206將該單詞重讀模式、整句語(yǔ)調(diào)和時(shí)間節(jié)奏同參考發(fā)音進(jìn)行比較，并依據(jù)設(shè)定的反饋錯(cuò)誤精度需求得到單詞重讀模式的錯(cuò)誤情況和糾正幫助，以及整句重讀音節(jié)、整句音調(diào)和節(jié)奏等韻律錯(cuò)誤情況以及幫助選項(xiàng)。圖3是交互式語(yǔ)言學(xué)習(xí)系統(tǒng)第二實(shí)施方式的示意圖。其與第一實(shí)施方式的區(qū)別在于增加了屬于用戶端11的文本采集模塊113和屬于數(shù)據(jù)處理端12的文本拼寫檢測(cè)模塊123，并且將與這兩個(gè)模塊直接連接的交互模塊111和數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122的功能做了相應(yīng)拓展。交互模塊lll包括一顯示界面和一輸入界面。顯示界面用于顯示系統(tǒng)反饋給學(xué)習(xí)者的信息，包括音頻和拼寫提示信息，數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122反饋的信息等。輸入界面用于選擇記憶模式、學(xué)習(xí)內(nèi)容或退出系統(tǒng)等。交互模塊111根據(jù)學(xué)習(xí)者選擇或者系統(tǒng)自動(dòng)選擇的語(yǔ)言學(xué)習(xí)材料，比如單詞、短語(yǔ)或者一個(gè)文本段，針對(duì)語(yǔ)言記憶的目的，通過(guò)文本或者音頻方式提供給學(xué)習(xí)者。音頻提示是系統(tǒng)給出需要記憶的發(fā)音，而要求學(xué)習(xí)者進(jìn)行拼寫和跟讀；拼寫提示是系統(tǒng)給出需要記憶的拼寫內(nèi)容，比如一個(gè)單詞的部分字母，或者一個(gè)句子的部分單詞。學(xué)習(xí)者根據(jù)提示拼寫、同時(shí)讀出需要記憶的內(nèi)容，從而在發(fā)音和拼寫上同時(shí)進(jìn)行記憶。文本采集模塊113用于采集學(xué)習(xí)者拼寫的需要記憶的內(nèi)容，得到輸入文本。
文本拼寫檢測(cè)模塊123用于檢查輸入文本，通過(guò)計(jì)算輸入文本和標(biāo)準(zhǔn)答案文本的相似度編輯距離(Levenshtein distance)，得到具體的替代(Substitution)、插入(Insertion)、刪除(Deletion)等拼寫錯(cuò)誤。數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122根據(jù)得到的語(yǔ)音錯(cuò)誤和拼寫錯(cuò)誤進(jìn)行錯(cuò)誤統(tǒng)計(jì)，記錄學(xué)習(xí)者的具體音素發(fā)音錯(cuò)誤、韻律錯(cuò)誤以及拼寫錯(cuò)誤情況，并給出評(píng)價(jià)得分和反饋，通過(guò)交互模塊111進(jìn)行顯示。數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122包含一個(gè)數(shù)據(jù)庫(kù)，具體的錯(cuò)誤統(tǒng)計(jì)情況將被及時(shí)地寫入該數(shù)據(jù)庫(kù)；該數(shù)據(jù)庫(kù)不僅存儲(chǔ)了學(xué)習(xí)者的學(xué)習(xí)記錄，而且還存儲(chǔ)了學(xué)習(xí)內(nèi)容，包括對(duì)應(yīng)的多媒體信息和標(biāo)準(zhǔn)答案等；系統(tǒng)根據(jù)當(dāng)前用戶的錯(cuò)誤、選擇的記憶模式以及數(shù)據(jù)庫(kù)中存儲(chǔ)的學(xué)習(xí)內(nèi)容，選擇并產(chǎn)生新的學(xué)習(xí)內(nèi)容以及音頻和拼寫提示，從而進(jìn)入下一輪的交互式記憶。學(xué)習(xí)者也可以根據(jù)當(dāng)前的學(xué)習(xí)進(jìn)度重新選擇學(xué)習(xí)內(nèi)容，或者退出此子系統(tǒng)。
圖4是交互式語(yǔ)言學(xué)習(xí)系統(tǒng)第三實(shí)施方式的示意圖。其與第二實(shí)施方式的主要區(qū)別在于增加了屬于用戶端11的用戶接口 114和屬于數(shù)據(jù)處理端12的操作判別模塊124、對(duì)話場(chǎng)景模塊125，并且將與這三個(gè)模塊直接連接的交互模塊111和數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122的功能做了相應(yīng)拓展。交互式語(yǔ)言學(xué)習(xí)系統(tǒng)的第三實(shí)施方式將語(yǔ)言記憶和對(duì)話(Dialogue)相結(jié)合，充分練習(xí)語(yǔ)言學(xué)習(xí)中聽(tīng)說(shuō)讀寫四要素，并與特定的場(chǎng)景結(jié)合，通過(guò)對(duì)話的方式學(xué)習(xí)在特定場(chǎng)合中語(yǔ)言的運(yùn)用。交互模塊111是面向?qū)W習(xí)者的一個(gè)界面設(shè)備，用于給學(xué)習(xí)者展示一組任務(wù)形式的對(duì)話場(chǎng)景，比如在問(wèn)路、買菜、旅游等各種使用語(yǔ)言的場(chǎng)景完成系統(tǒng)指定的任務(wù)；當(dāng)學(xué)習(xí)者通過(guò)該模塊選定某個(gè)對(duì)話場(chǎng)景后，將會(huì)先后出現(xiàn)對(duì)話、拼寫、跟讀、選擇等子任務(wù)，學(xué)習(xí)者根據(jù)對(duì)話場(chǎng)景提供的信息，進(jìn)行交互操作、輸入語(yǔ)音和文本信息來(lái)完成任務(wù)。用戶接口 114用于采集學(xué)習(xí)者與系統(tǒng)的交互操作，例如用鍵盤來(lái)控制方向、或者
使用鼠標(biāo)進(jìn)行選擇，得到具體的學(xué)習(xí)者對(duì)內(nèi)容或者答案的選擇。操作判別模塊124用于判斷學(xué)習(xí)者的交互操作是否符合任務(wù)要求，得到操作錯(cuò)誤。數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122根據(jù)得到的語(yǔ)音錯(cuò)誤、拼寫錯(cuò)誤和操作錯(cuò)誤進(jìn)行錯(cuò)誤統(tǒng)計(jì)，記錄學(xué)習(xí)者的具體音素發(fā)音錯(cuò)誤、韻律錯(cuò)誤、拼寫錯(cuò)誤以及操作錯(cuò)誤情況，并給出評(píng)價(jià)得分，通過(guò)交互模塊111進(jìn)行顯示。數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122包含一個(gè)數(shù)據(jù)庫(kù)，具體的錯(cuò)誤統(tǒng)計(jì)情況將被及時(shí)地寫入該數(shù)據(jù)庫(kù)；該數(shù)據(jù)庫(kù)不僅存儲(chǔ)了學(xué)習(xí)者的學(xué)習(xí)記錄，還存儲(chǔ)了學(xué)習(xí)內(nèi)容，包括對(duì)應(yīng)的多媒體信息和標(biāo)準(zhǔn)答案等，并存儲(chǔ)了與對(duì)話相關(guān)的信息，比如對(duì)話場(chǎng)景信息、任務(wù)信息等。對(duì)話場(chǎng)景模塊125根據(jù)數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊122輸出的錯(cuò)誤統(tǒng)計(jì)情況和對(duì)話場(chǎng)景、任務(wù)信息，動(dòng)態(tài)生成新的對(duì)話場(chǎng)景，并通過(guò)交互模塊111顯示給學(xué)習(xí)者，學(xué)習(xí)者可以通過(guò)交互模塊111選擇進(jìn)入新一輪對(duì)話場(chǎng)景的學(xué)習(xí)，或者選擇退出學(xué)習(xí)。上述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)有多種實(shí)現(xiàn)方式，例如基于網(wǎng)絡(luò)的客戶端/服務(wù)器(Client/Server)方式、基于網(wǎng)絡(luò)的瀏覽器/服務(wù)器(Browser/Server)方式、基于嵌入式系統(tǒng)的單機(jī)模式等等。基于網(wǎng)絡(luò)的客戶端、服務(wù)器方式其客戶端是學(xué)習(xí)者訪問(wèn)終端，提供語(yǔ)音輸入、文本輸入、音頻播放以及鼠標(biāo)鍵盤操作，并且對(duì)輸入音頻完成靜音檢測(cè)、特征提取以及網(wǎng)絡(luò)傳輸、對(duì)話場(chǎng)景生成等功能，其服務(wù)器端完成對(duì)輸入語(yǔ)音的錯(cuò)誤發(fā)音檢測(cè)、單詞重音模式檢測(cè)、韻律檢測(cè)、拼寫檢查、錯(cuò)誤反饋、幫助選項(xiàng)反饋、對(duì)話場(chǎng)景內(nèi)容生成、數(shù)據(jù)庫(kù)操作、學(xué)習(xí)信息統(tǒng)計(jì)、網(wǎng)絡(luò)傳輸?shù)裙δ堋?基于網(wǎng)絡(luò)的瀏覽器、服務(wù)器方式其瀏覽器是學(xué)習(xí)者訪問(wèn)終端，提供語(yǔ)音輸入、文本輸入、音頻播放、鼠標(biāo)鍵盤操作、網(wǎng)絡(luò)傳輸、對(duì)話場(chǎng)景，并通過(guò)插件(Plug-in)完成對(duì)輸入音頻完成靜音檢測(cè)以及特征提取等操作，其服務(wù)器包括數(shù)據(jù)處理服務(wù)器和Web服務(wù)器，其中數(shù)據(jù)服務(wù)器端完成對(duì)輸入語(yǔ)音的錯(cuò)誤發(fā)音檢測(cè)、單詞重音模式檢測(cè)、韻律檢測(cè)、拼寫檢查、錯(cuò)誤反饋、幫助選項(xiàng)反饋、對(duì)話內(nèi)容生成、數(shù)據(jù)庫(kù)操作、學(xué)習(xí)信息統(tǒng)計(jì)、網(wǎng)絡(luò)傳輸?shù)裙δ?，其中Web服務(wù)器是瀏覽器的訪問(wèn)服務(wù)器，瀏覽器與數(shù)據(jù)處理服務(wù)器之間進(jìn)行直接的數(shù)據(jù)傳輸。基于嵌入式系統(tǒng)的單機(jī)方式在一個(gè)程序框架內(nèi)完成語(yǔ)音輸入、文本輸入、音頻播放、音頻靜音檢測(cè)、音頻特征提取、輸入語(yǔ)音的錯(cuò)誤發(fā)音檢測(cè)及單詞重讀模式檢測(cè)、韻律檢測(cè)、拼寫檢查、錯(cuò)誤反饋、對(duì)話內(nèi)容生成、數(shù)據(jù)庫(kù)操作、學(xué)習(xí)信息統(tǒng)計(jì)等。上述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)構(gòu)建了一種交互式語(yǔ)言學(xué)習(xí)平臺(tái)，使學(xué)習(xí)者充分練習(xí)語(yǔ)言學(xué)習(xí)中的聽(tīng)說(shuō)讀寫四要素，把語(yǔ)言學(xué)習(xí)的各個(gè)環(huán)節(jié)有機(jī)的結(jié)合起來(lái)，提供自由度極高的場(chǎng)景對(duì)話學(xué)習(xí)形式以提高學(xué)習(xí)者的興趣，調(diào)動(dòng)學(xué)習(xí)者的積極性使其主動(dòng)參與到學(xué)習(xí)當(dāng)中，并給出實(shí)時(shí)的錯(cuò)誤判斷和反饋。上述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)對(duì)學(xué)習(xí)者的輸入音頻進(jìn)行實(shí)時(shí)的音素級(jí)別(Phone-level)的錯(cuò)誤發(fā)音(Mispronunciation)檢測(cè)和韻律(Prosody)檢測(cè)，韻律檢測(cè)包括單詞級(jí)別的單詞重音模式(Lexical stress)檢測(cè)及糾正幫助、韻律(Prosody)檢測(cè)及模仿幫助；其中音素級(jí)別的錯(cuò)誤發(fā)音檢測(cè)對(duì)輸入語(yǔ)音進(jìn)行音素級(jí)別的語(yǔ)音識(shí)別，并指出其發(fā)生錯(cuò)誤的具體音素；其中單詞級(jí)別的單詞重音模式檢測(cè)及糾正幫助根據(jù)音素級(jí)別的檢測(cè)獲得的音素序列進(jìn)行單詞級(jí)別的識(shí)別，識(shí)別出單詞的重音模式以及給出與正確重音模式相對(duì)比的錯(cuò)誤種類；其中韻律檢測(cè)及模仿幫助包括對(duì)發(fā)音語(yǔ)句的句重讀(Sentence Stress)，節(jié)奏(Rhythm)，語(yǔ)調(diào)(Intonation)等方面的檢測(cè)分析和標(biāo)準(zhǔn)發(fā)音的語(yǔ)句的韻律對(duì)比判別，并給出在韻律上的評(píng)價(jià)以及和模仿標(biāo)準(zhǔn)發(fā)音語(yǔ)句的幫助選項(xiàng)。使學(xué)習(xí)者能夠精確把握自己發(fā)音的具體錯(cuò)誤之處。并結(jié)合反饋結(jié)果和記憶曲線動(dòng)態(tài)提供記憶內(nèi)容，使學(xué)習(xí)者能夠循序漸進(jìn)的提高語(yǔ)言水平。以上所述實(shí)施方式僅表達(dá)了本發(fā)明的幾種實(shí)施方式，其描述較為具體和詳細(xì)，但并不能因此而理解為對(duì)本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是，對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)，在不脫離本發(fā)明構(gòu)思的前提下，還可以做出若干變形和改進(jìn)，這些都屬于本發(fā)明的保護(hù)范圍。因此，本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
一種交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于，包括語(yǔ)音采集模塊，用于采集學(xué)習(xí)者的語(yǔ)音數(shù)據(jù)；發(fā)音及韻律檢測(cè)模塊，用于從語(yǔ)音數(shù)據(jù)中提取用于發(fā)音和韻律錯(cuò)誤檢測(cè)的特征參數(shù)，并對(duì)錯(cuò)誤進(jìn)行進(jìn)一步判斷以及控制錯(cuò)誤顯示的程度，得到最終的音素錯(cuò)誤和韻律錯(cuò)誤；數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊，用于記錄所述音素錯(cuò)誤和韻律錯(cuò)誤，并結(jié)合這些錯(cuò)誤對(duì)學(xué)習(xí)者的發(fā)音狀況給予總體評(píng)價(jià)，將評(píng)價(jià)結(jié)果反饋給交互模塊；交互模塊，包括顯示界面，所述顯示界面用于顯示音素錯(cuò)誤和韻律錯(cuò)誤，學(xué)習(xí)者發(fā)音狀況的總體評(píng)價(jià)以及幫助選項(xiàng)，并提供發(fā)音提示。
2. 根據(jù)權(quán)利要求1所述的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于，所述發(fā)音及韻律檢測(cè)模塊包括特征提取模塊，用于從所述語(yǔ)音數(shù)據(jù)中提取用于發(fā)音和韻律錯(cuò)誤檢測(cè)的特征參數(shù)；語(yǔ)音識(shí)別模塊，基于聲學(xué)模型結(jié)合語(yǔ)言模型或詞網(wǎng)絡(luò)，對(duì)所述特征參數(shù)進(jìn)行識(shí)別，分別得到單詞序列、音素序列、相應(yīng)的時(shí)間邊界、似然概率值；發(fā)音評(píng)價(jià)模塊，用于將識(shí)別得到的音素序列和系統(tǒng)的參考音素進(jìn)行比較對(duì)齊，得到音素錯(cuò)誤及幫助選項(xiàng)；韻律檢測(cè)模塊，用于結(jié)合特征參數(shù)、音素序列、時(shí)間邊界信息，采用統(tǒng)計(jì)模型得到單詞重讀模式、整句語(yǔ)調(diào)和時(shí)間節(jié)奏；韻律評(píng)價(jià)模塊，用于將單詞重讀模式、整句語(yǔ)調(diào)和時(shí)間節(jié)奏同參考發(fā)音進(jìn)行比較，得到韻律錯(cuò)誤及幫助選項(xiàng)。
3. 根據(jù)權(quán)利要求2所述的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于所述語(yǔ)音采集模塊采集的語(yǔ)音數(shù)據(jù)包括對(duì)系統(tǒng)提供的發(fā)音提示進(jìn)行跟讀以及按照發(fā)音情景說(shuō)話得到的語(yǔ)音數(shù)據(jù)。
4. 根據(jù)權(quán)利要求2所述的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于所述發(fā)音評(píng)價(jià)模塊首先使用統(tǒng)計(jì)的方法結(jié)合所述單詞序列、音素序列、時(shí)間邊界和似然概率值進(jìn)行單詞級(jí)別內(nèi)容的判別，如果內(nèi)容不一致，系統(tǒng)記錄內(nèi)容錯(cuò)誤，并在所述交互模塊中提示整句內(nèi)容不符合要求，請(qǐng)求學(xué)習(xí)者重新輸入語(yǔ)音；否則對(duì)音素進(jìn)行檢測(cè)，得到音素錯(cuò)誤，包括單詞中音素的插入、刪除、替換錯(cuò)誤。
5. 根據(jù)權(quán)利要求2所述的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于所述單詞重讀模式是以音節(jié)為單位進(jìn)行判斷的，包括單詞中主重讀音節(jié)的位置和次重讀音節(jié)的位置；所述整句語(yǔ) 調(diào)是整句話的句重音，即這個(gè)句子中重讀音節(jié)的位置，其基于音節(jié)和語(yǔ)調(diào)，反映整句的基頻變化趨勢(shì)；所述時(shí)間節(jié)奏是對(duì)說(shuō)話的快慢和時(shí)長(zhǎng)的判斷。
6. 根據(jù)權(quán)利要求1所述的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于所述交互模塊的發(fā)音提示采用發(fā)音文本，該發(fā)音文本是學(xué)習(xí)者的目標(biāo)學(xué)習(xí)內(nèi)容；或采用參考發(fā)音，該參考發(fā)音是目標(biāo)語(yǔ)言國(guó)家的人所發(fā)的標(biāo)準(zhǔn)語(yǔ)音；又或采用發(fā)音情景，該發(fā)音情景是系統(tǒng)給出的情景，要求學(xué)習(xí)者按照該發(fā)音情景說(shuō)話。
7. 根據(jù)權(quán)利要求1所述的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于所述交互模塊還包括輸入界面，所述輸入界面用于選擇記憶模式、學(xué)習(xí)內(nèi)容或退出系統(tǒng)；所述顯示界面還用于顯示系統(tǒng)反饋的信息，包括音頻和拼寫提示信息和所述數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊反饋的信息；所述交互模塊選擇語(yǔ)言學(xué)習(xí)材料，通過(guò)音頻或者文本方式對(duì)學(xué)習(xí)者進(jìn)行提示，音頻提示是系統(tǒng) 給出需要記憶的發(fā)音，要求學(xué)習(xí)者進(jìn)行拼寫和跟讀，拼寫提示是系統(tǒng)給出需要記憶的拼寫內(nèi)容的文本提示，要求學(xué)習(xí)者進(jìn)行拼寫，得到拼寫內(nèi)容；所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)還包括文本采集模塊和文本拼寫檢測(cè)模塊，所述文本采集模塊用于采集所述拼寫內(nèi)容，得到輸入文本；所述文本拼寫檢測(cè)模塊用于檢查輸入文本，通過(guò) 計(jì)算輸入文本和標(biāo)準(zhǔn)答案文本的相似度編輯距離，得到拼寫錯(cuò)誤；所述數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊還用于記錄所述拼寫錯(cuò)誤；所述數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊還包擴(kuò) 一個(gè)數(shù)據(jù)庫(kù)，具體的錯(cuò)誤統(tǒng)計(jì)情況將被及時(shí)地寫入該數(shù)據(jù)庫(kù)，該數(shù)據(jù)庫(kù)不僅存儲(chǔ)學(xué)習(xí)記錄，而且還存儲(chǔ)了學(xué)習(xí)內(nèi)容；系統(tǒng)根據(jù)當(dāng)前的錯(cuò)誤記錄、選擇的記憶模式以及數(shù)據(jù)庫(kù)中存儲(chǔ)的學(xué)習(xí)內(nèi)容，選擇并產(chǎn)生新的學(xué)習(xí)內(nèi)容以及音頻和拼寫提示，反饋給所述交互模塊，從而進(jìn)入下一輪的交互式學(xué)習(xí)，或者根據(jù)當(dāng)前的學(xué)習(xí)進(jìn)度重新選擇學(xué)習(xí)內(nèi)容，又或者退出系統(tǒng)。
8. 根據(jù)權(quán)利要求7所述的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于所述拼寫錯(cuò)誤包括替代、插入和刪除錯(cuò)誤。
9. 根據(jù)權(quán)利要求8所述的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于所述交互模塊還用于展示一組任務(wù)形式的對(duì)話場(chǎng)景，通過(guò)該交互模塊選定某個(gè)對(duì)話場(chǎng)景后，將會(huì)出現(xiàn)子任務(wù)，學(xué)習(xí) 者要根據(jù)該交互模塊提供的信息，進(jìn)行交互操作并進(jìn)行發(fā)音和拼寫來(lái)完成任務(wù)；所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)還包括用戶接口、操作判別模塊；所述用戶接口用于采集所述交互操作；所述操作判別模塊用于判斷所述交互操作是否符合任務(wù)要求，得到操作錯(cuò) 誤；所述數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊還用于記錄所述操作錯(cuò)誤，所述數(shù)據(jù)庫(kù)還存儲(chǔ)了與對(duì)話相關(guān) 的信息；所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)還包括對(duì)話場(chǎng)景模塊，根據(jù)所述數(shù)據(jù)存儲(chǔ)及統(tǒng)計(jì)模塊輸出的錯(cuò)誤統(tǒng)計(jì)和與對(duì)話相關(guān)的信息，動(dòng)態(tài)生成新的對(duì)話場(chǎng)景，并通過(guò)所述交互模塊進(jìn)行顯示；學(xué) 習(xí)者可以通過(guò)所述交互模塊選擇進(jìn)入新一輪學(xué)習(xí)，或者退出學(xué)習(xí)。
10. 根據(jù)權(quán)利要求l所述的交互式語(yǔ)言學(xué)習(xí)系統(tǒng)，其特征在于所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)的實(shí)現(xiàn)方式是客戶端/服務(wù)器方式、瀏覽器/服務(wù)器方式、基于嵌入式系統(tǒng)的單機(jī)模式中的一種。
11. 一種交互式語(yǔ)言學(xué)習(xí)方法，包括采集學(xué)習(xí)者按程序要求進(jìn)行發(fā)音得到的語(yǔ)音數(shù)據(jù)；從語(yǔ)音數(shù)據(jù)中提取用于發(fā)音和韻律錯(cuò)誤檢測(cè)的特征參數(shù)；基于聲學(xué)模型，結(jié)合語(yǔ)言模型或詞網(wǎng)絡(luò)，對(duì)特征參數(shù)進(jìn)行識(shí)別，分別得到單詞序列、音素序列、相應(yīng)的時(shí)間邊界、似然概率值；將音素序列和系統(tǒng)的參考音素進(jìn)行比較對(duì)齊，得到音素錯(cuò)誤及幫助選項(xiàng)；結(jié)合特征參數(shù)、音素序列、時(shí)間邊界信息，采用統(tǒng)計(jì)模型得到單詞重讀模式、整句語(yǔ)調(diào)和時(shí)間節(jié)奏；將單詞重讀模式、整句語(yǔ)調(diào)和時(shí)間節(jié)奏同參考發(fā)音進(jìn)行比較，得到韻律錯(cuò)誤及幫助選項(xiàng)；顯示音素、韻律錯(cuò)誤，發(fā)音狀況的總體評(píng)價(jià)以及幫助選項(xiàng)，并提供發(fā)音提示。
12. 根據(jù)權(quán)利要求11所述的交互式語(yǔ)言學(xué)習(xí)方法，其特征在于，還包括以下步驟在采集語(yǔ)音數(shù)據(jù)前，輸出音頻或文本方式的記憶材料，要求學(xué)習(xí)者進(jìn)行發(fā)音和拼寫；采集需要記憶的拼寫內(nèi)容，得到輸入文本；檢查輸入文本，得到拼寫錯(cuò)誤；根據(jù)得到的音素、韻律和拼寫錯(cuò)誤進(jìn)行錯(cuò)誤統(tǒng)計(jì)，記錄具體音素錯(cuò)誤、韻律錯(cuò)誤以及拼寫錯(cuò)誤情況，并給出評(píng)價(jià)得分和反饋信息；顯示評(píng)價(jià)得分和反饋信息；接收選擇記憶模式、學(xué)習(xí)內(nèi)容或退出程序的指令。
13.根據(jù)權(quán)利要求12所述的交互式語(yǔ)言學(xué)習(xí)方法，其特征在于，還包括以下步驟展示對(duì)話場(chǎng)景，學(xué)習(xí)者按對(duì)話場(chǎng)景要求進(jìn)行發(fā)音、拼寫及交互操作；采集交互操作；判斷交互操作是否符合任務(wù)要求，得到操作錯(cuò)誤；根據(jù)得到的音素、韻律、拼寫和操作錯(cuò)誤進(jìn)行錯(cuò)誤統(tǒng)計(jì)，記錄具體音素發(fā)音、韻律、拼寫以及操作錯(cuò)誤情況，并給出評(píng)價(jià)得分和反饋；動(dòng)態(tài)生成新的對(duì)話場(chǎng)景，并進(jìn)行顯示。
全文摘要
本發(fā)明涉及一種交互式語(yǔ)言學(xué)習(xí)系統(tǒng)及交互式語(yǔ)言學(xué)習(xí)方法，所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)的核心模塊包括特征提取模塊、語(yǔ)音識(shí)別模塊、發(fā)音評(píng)價(jià)模塊、韻律檢測(cè)模塊、韻律評(píng)價(jià)模塊，它們一起組成發(fā)音及韻律檢測(cè)模塊。所述交互式語(yǔ)言學(xué)習(xí)系統(tǒng)能實(shí)時(shí)的將學(xué)習(xí)者的語(yǔ)音輸入進(jìn)行判斷和反饋，使學(xué)習(xí)者能夠精確把握自己發(fā)音的具體錯(cuò)誤之處，并結(jié)合反饋結(jié)果和記憶曲線動(dòng)態(tài)提供記憶內(nèi)容，使學(xué)習(xí)者能夠循序漸進(jìn)的提高語(yǔ)言水平，形成一種交互式的學(xué)習(xí)方式。
文檔編號(hào)G09B19/06GK101739870SQ20091018870
公開(kāi)日2010年6月16日申請(qǐng)日期2009年12月3日優(yōu)先權(quán)日2009年12月3日
發(fā)明者李崇國(guó), 王嵐, 蒙美玲, 陳金玉申請(qǐng)人:深圳先進(jìn)技術(shù)研究院

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王嵐;李崇國(guó);陳金玉;蒙美玲
技術(shù)所有人：深圳先進(jìn)技術(shù)研究院
我是此專利的發(fā)明人

上一篇：帶標(biāo)簽的扎線帶的制作方法
上一篇：一種促進(jìn)胎兒大腦發(fā)育的電子裝置及其方法

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

交互式語(yǔ)言學(xué)習(xí)系統(tǒng)及交互式語(yǔ)言學(xué)習(xí)方法