專利名稱:一種用于口語學(xué)習(xí)的元數(shù)據(jù)處理方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種口語學(xué)習(xí)和元數(shù)據(jù)分析領(lǐng)域,尤其是涉及一種用于口語學(xué)習(xí)的元數(shù)據(jù)處理方法及系統(tǒng)。
背景技術(shù):
在傳統(tǒng)的計(jì)算機(jī)輔助的口語語言學(xué)習(xí)系統(tǒng)中,學(xué)習(xí)者根據(jù)系統(tǒng)提示題目和要求進(jìn)行口語練習(xí),然后系統(tǒng)對(duì)學(xué)習(xí)者的發(fā)音做出分析和評(píng)價(jià),并反饋有針對(duì)性的指導(dǎo)信息,最后學(xué)習(xí)者根據(jù)反饋信息來調(diào)整自己的口語發(fā)音。這里的計(jì)算機(jī)輔助的口語語言學(xué)習(xí)是指學(xué)習(xí)者利用計(jì)算機(jī)來學(xué)習(xí)口語,包括發(fā)音準(zhǔn)確性、流利度、韻律和語法等幾個(gè)方面的學(xué)習(xí)??谡Z練習(xí)是指學(xué)習(xí)者按照要求進(jìn)行發(fā)音練習(xí),練習(xí)可以是音素、音節(jié)、詞、句子和段落等不同層次的。系統(tǒng)評(píng)價(jià)是指對(duì)學(xué)習(xí)者的發(fā)音進(jìn)行聲學(xué)和語言學(xué)上的分析,并以標(biāo)準(zhǔn)發(fā)音為參照計(jì)算用戶發(fā)音的標(biāo)準(zhǔn)程度,從而給出表示發(fā)音水平的評(píng)分。這個(gè)評(píng)分可分為準(zhǔn)確性評(píng)分、流利度評(píng)分、韻律評(píng)分以及語法評(píng)分等。系統(tǒng)反饋不僅包括對(duì)用戶發(fā)音給出不同粒度和方面的評(píng)分,還包括指出發(fā)音錯(cuò)誤位置和類型,提示用戶改進(jìn)發(fā)音的方法。傳統(tǒng)的口語語言學(xué)習(xí)系統(tǒng)只向?qū)W習(xí)者反饋對(duì)當(dāng)前發(fā)音或者本次練習(xí)的評(píng)價(jià),指出練習(xí)中的特定錯(cuò)誤并給出指導(dǎo)信息?,F(xiàn)有系統(tǒng)記錄和分析用戶學(xué)習(xí)歷史情況的功能不夠系統(tǒng),數(shù)據(jù)格式也不夠規(guī)范,無法對(duì)用戶學(xué)習(xí)情況進(jìn)行有效的分析總結(jié)?,F(xiàn)有系統(tǒng)的評(píng)價(jià)指標(biāo)與用戶練習(xí)語音以及參考文本脫節(jié),不利于進(jìn)一步匯總分析,數(shù)據(jù)的一致性不能得到保證。 而學(xué)習(xí)者希望看到自己的學(xué)習(xí)進(jìn)展情況,了解自己口語中的主要不足和發(fā)音的難點(diǎn),進(jìn)行更有針對(duì)性的練習(xí)。此外,學(xué)習(xí)者可能還希望就特定練習(xí)中的一個(gè)特定發(fā)音單元,去體驗(yàn)自己發(fā)音和標(biāo)準(zhǔn)音的差異。元數(shù)據(jù)是表示原始數(shù)據(jù)的數(shù)據(jù)。據(jù)我們所知,目前在口語語言學(xué)習(xí)系統(tǒng)中還沒有采用元數(shù)據(jù)來表示學(xué)習(xí)情況并進(jìn)行匯總分析后表示學(xué)習(xí)難點(diǎn)和重點(diǎn)的技術(shù)。在其他一些領(lǐng)域,元數(shù)據(jù)已有使用。在專利US 2011016120A1中,元數(shù)據(jù)被用來表示用戶鍛煉過程中和一段音頻或視頻相關(guān)聯(lián)的用戶運(yùn)動(dòng)性能情況。運(yùn)動(dòng)性能包括用戶運(yùn)動(dòng)頻率以及和用戶相關(guān)的一組生理測(cè)度。一組用戶的鍛煉性能可以生成新的元數(shù)據(jù),表示和這段媒體相關(guān)的平均運(yùn)動(dòng)性能。在專利CN1771492A,CN1592404A和CN15681947A中,元數(shù)據(jù)被用來表示電視或廣播節(jié)目片斷,通過分析用戶歷史元數(shù)據(jù)得到用戶偏好,用于向用戶推薦相應(yīng)的節(jié)目或列表。 在專利[CN1716257A]中,元數(shù)據(jù)用于表示頁面語言、長(zhǎng)度、場(chǎng)所、文檔格式、所屬類別和其他屬性信息的數(shù)據(jù)。通過元數(shù)據(jù)跟蹤機(jī)制跟蹤特定的域,以及頁面屬性和用戶滿意度之間的顯著相關(guān)性。把用戶滿意度高的元數(shù)據(jù)存儲(chǔ)為用戶偏好元數(shù)據(jù),并調(diào)整分級(jí)機(jī)制來增加用戶偏好的權(quán)重。
發(fā)明內(nèi)容
為了解決上述問題,本技術(shù)提供了一種用于口語學(xué)習(xí)的元數(shù)據(jù)處理方法及系統(tǒng)。本發(fā)明采用如下的技術(shù)方案
一種用于口語學(xué)習(xí)的元數(shù)據(jù)處理方法,包括以下步驟步驟一、監(jiān)控用戶練習(xí)過程,獲取用戶練習(xí)語音;步驟二、利用語音分析技術(shù)對(duì)用戶語音進(jìn)行分析和評(píng)估;步驟三、解析評(píng)估結(jié)果,獲得對(duì)用戶語音的不同粒度和層面的客觀評(píng)分信息;步驟四、解析分析結(jié)果,獲得用戶發(fā)音的細(xì)節(jié)信息;步驟五、將用戶信息、練習(xí)內(nèi)容信息、評(píng)分信息和發(fā)音細(xì)節(jié)信息以及時(shí)間信息組合起來,和用戶語音進(jìn)行關(guān)聯(lián),生成記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù);步驟六、匯總大量記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù),得到相同用戶/所有用戶在相同練習(xí)內(nèi)容上的所有歷史學(xué)習(xí)狀況,和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),從而生成匯聚元數(shù)據(jù)。以及一種用于口語學(xué)習(xí)系統(tǒng)的元數(shù)據(jù)處理系統(tǒng),包括元數(shù)據(jù)抽取模塊,用于監(jiān)測(cè)用戶練習(xí)過程,獲取用戶練習(xí)語音,利用語音分析技術(shù)對(duì)用戶語音進(jìn)行分析和評(píng)估,解析評(píng)估結(jié)果,獲得對(duì)用戶語音的不同粒度和層面的客觀評(píng)分信息,解析分析結(jié)果,獲得用戶發(fā)音的細(xì)節(jié)信息,并將用戶信息、練習(xí)內(nèi)容信息、評(píng)分信息和發(fā)音細(xì)節(jié)信息以及時(shí)間信息組合起來,和用戶語音進(jìn)行關(guān)聯(lián),生成記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù);第一元數(shù)據(jù)庫,用于用來存放記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù);元數(shù)據(jù)匯總分析模塊,用于匯總大量記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù),得到相同用戶/所有用戶在相同練習(xí)內(nèi)容上的所有歷史學(xué)習(xí)狀況,和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),從而生成匯聚元數(shù)據(jù);第二元數(shù)據(jù)庫,用于存放匯聚元數(shù)據(jù)。本發(fā)明在用戶練習(xí)發(fā)音過程中通過元數(shù)據(jù)抽取模塊獲得用戶個(gè)人信息、練習(xí)內(nèi)容信息、系統(tǒng)評(píng)價(jià)信息和用戶發(fā)音細(xì)節(jié)信息以及相關(guān)時(shí)間信息和抽取模塊信息等,然后與用戶語音進(jìn)行關(guān)聯(lián),生成單個(gè)用戶單次練習(xí)的元數(shù)據(jù)。我們稱該元數(shù)據(jù)為用戶練習(xí)的基礎(chǔ)元數(shù)據(jù)。該基礎(chǔ)元數(shù)據(jù)至少包括如下信息1)用戶信息,包括用戶名稱、用戶年齡、用戶國籍、用戶語言水平等信息。2)練習(xí)內(nèi)容信息,包括參考文本、標(biāo)準(zhǔn)語音、標(biāo)準(zhǔn)語音上基本評(píng)分單元的文本和邊界等。3)評(píng)估信息,包括音素、音節(jié)、詞和句子等不同評(píng)分單元的發(fā)音評(píng)分,發(fā)音評(píng)分可包括多個(gè)指標(biāo),比如發(fā)音準(zhǔn)確性,流利度,語調(diào)、重音和聲調(diào)(針對(duì)帶調(diào)語言)等。評(píng)分可以根據(jù)具體應(yīng)用采用不同的分值體系,比如五分制、十分制或者百分制等。4)時(shí)間信息,包括用戶語音的長(zhǎng)度,用戶發(fā)音練習(xí)的具體時(shí)間等。5)發(fā)音細(xì)節(jié)信息,記錄每個(gè)評(píng)分單元對(duì)應(yīng)的用戶發(fā)音詳細(xì)情況,包括用戶錯(cuò)發(fā)成的音素、音節(jié)或單詞,用戶語音上每個(gè)評(píng)分單元的時(shí)間邊界等。6)元數(shù)據(jù)抽取模塊信息,記錄生成元數(shù)據(jù)基本信息的算法和資源版本等,至少包括算法模塊名,算法版本號(hào),資源版本號(hào),評(píng)分等級(jí)等。生成的基礎(chǔ)元數(shù)據(jù)將被存儲(chǔ)在元數(shù)據(jù)庫1中。本發(fā)明基于大量用戶學(xué)習(xí)的基礎(chǔ)元數(shù)據(jù),通過匯總分析,并與對(duì)應(yīng)的標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),生成新的用戶練習(xí)的元數(shù)據(jù),比如表示用戶練習(xí)歷史狀況的元數(shù)據(jù),表示用戶練習(xí)的難點(diǎn)內(nèi)容和重點(diǎn)內(nèi)容的元數(shù)據(jù)。典型的匯總分析的信息和方法至少包括
1)最基本的,本發(fā)明把對(duì)應(yīng)相同標(biāo)準(zhǔn)語音的所有用戶練習(xí)的基礎(chǔ)元數(shù)據(jù)匯總在一起,生成一種新的元數(shù)據(jù),稱之為匯聚元數(shù)據(jù)。該匯聚元數(shù)據(jù)攜帶了練習(xí)該標(biāo)準(zhǔn)語音的所有用戶的練習(xí)狀況歷史信息。2)進(jìn)一步,本發(fā)明把對(duì)應(yīng)相同標(biāo)準(zhǔn)語音的同一用戶練習(xí)的所有基礎(chǔ)元數(shù)據(jù)匯總在一起,生成一種新的元數(shù)據(jù),稱之為特定用戶的匯聚元數(shù)據(jù)。該匯聚元數(shù)據(jù)攜帶了練習(xí)該標(biāo)準(zhǔn)語音的特定用戶的所有練習(xí)狀況歷史信息。3)本發(fā)明把對(duì)應(yīng)相同標(biāo)準(zhǔn)語音的同一用戶練習(xí)的所有基礎(chǔ)元數(shù)據(jù)匯總在一起,統(tǒng)計(jì)練習(xí)的頻次,計(jì)算所有評(píng)分單元(比如每個(gè)音素、音節(jié)、詞等)上各項(xiàng)指標(biāo)(比如發(fā)音準(zhǔn)確性、聲調(diào)準(zhǔn)確性等)的平均評(píng)分。把這些平均評(píng)分、用戶信息、練習(xí)時(shí)間、用戶語音長(zhǎng)度、 練習(xí)內(nèi)容信息、練習(xí)頻次等和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),生成一組新的元數(shù)據(jù)。該元數(shù)據(jù)中平均評(píng)分較低的發(fā)音單元表示了該用戶練習(xí)中的難點(diǎn)內(nèi)容,練習(xí)頻次最多的發(fā)音單元表示了該用戶練習(xí)的重點(diǎn)內(nèi)容,稱該元數(shù)據(jù)為特定用戶的學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)。4)本發(fā)明把對(duì)應(yīng)相同標(biāo)準(zhǔn)語音的所有用戶練習(xí)的基礎(chǔ)元數(shù)據(jù)匯總在一起,統(tǒng)計(jì)聯(lián)練習(xí)的頻次,計(jì)算所有評(píng)分單元(比如每個(gè)音素、音節(jié)、詞等)上各項(xiàng)指標(biāo)(比如發(fā)音準(zhǔn)確性、聲調(diào)準(zhǔn)確性等)的平均評(píng)分。把這些平均評(píng)分、練習(xí)時(shí)間、用戶語音長(zhǎng)度、練習(xí)內(nèi)容信息、練習(xí)頻次等和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),生成一組新的元數(shù)據(jù)。該元數(shù)據(jù)中平均評(píng)分較低的發(fā)音單元表示了該發(fā)音是所有用戶練習(xí)中的有代表性的難點(diǎn)內(nèi)容,練習(xí)頻次最多的發(fā)音單元表示了該發(fā)音是所有用戶練習(xí)的重點(diǎn)內(nèi)容,稱該元數(shù)據(jù)為通用的學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)。上述生成的學(xué)習(xí)重點(diǎn)/難點(diǎn)元數(shù)據(jù)將被存儲(chǔ)在元數(shù)據(jù)庫2中。上述生成的匯聚元數(shù)據(jù)將被存儲(chǔ)在元數(shù)據(jù)庫3中。除了進(jìn)行學(xué)習(xí)重點(diǎn)/難點(diǎn)內(nèi)容的發(fā)現(xiàn)之外,本發(fā)明通過分析大量的基礎(chǔ)元數(shù)據(jù)還生成其它多種有價(jià)值的統(tǒng)計(jì)信息,稱為統(tǒng)計(jì)增值信息,至少包括通過如下方法獲得如下信息1)本發(fā)明把對(duì)應(yīng)相同標(biāo)準(zhǔn)語音的同一用戶練習(xí)的所有基礎(chǔ)元數(shù)據(jù)匯總在一起, 發(fā)現(xiàn)那些平均評(píng)分低于給定閾值的評(píng)分單元,獲得該評(píng)分單元對(duì)應(yīng)的用戶發(fā)音和標(biāo)準(zhǔn)發(fā)音對(duì),即那些常見發(fā)音錯(cuò)誤模式,比如哪些音素用戶容易讀錯(cuò),通常錯(cuò)讀為哪個(gè)音素或者哪些單詞重音位置不準(zhǔn)確等。2)本發(fā)明通過統(tǒng)計(jì)不同時(shí)間段上特定用戶在特定練習(xí)內(nèi)容上的平均評(píng)分,可以生成特定用戶練習(xí)特定內(nèi)容的評(píng)分變化趨勢(shì),反映了用戶在特定學(xué)習(xí)內(nèi)容上發(fā)音水平的變化情況。3)本發(fā)明通過統(tǒng)計(jì)不同時(shí)間段上特定用戶在所有練習(xí)內(nèi)容上的平均評(píng)分,可以生成特定用戶總體練習(xí)評(píng)分的變化趨勢(shì),反映了用戶總體發(fā)音水平的變化情況。4)本發(fā)明通過統(tǒng)計(jì)不同時(shí)間段上特定用戶在特定練習(xí)內(nèi)容上的基礎(chǔ)元數(shù)據(jù)的數(shù)目/語音長(zhǎng)度,獲得特定用戶在不同時(shí)間段上特定練習(xí)內(nèi)容的練習(xí)次數(shù)/時(shí)間的分布變化趨勢(shì)。5)本發(fā)明通過統(tǒng)計(jì)不同時(shí)間段上特定用戶的基礎(chǔ)元數(shù)據(jù)的數(shù)目/語音長(zhǎng)度,獲得特定用戶在不同時(shí)間段上練習(xí)次數(shù)/時(shí)間的分布變化趨勢(shì)。6)本發(fā)明通過統(tǒng)計(jì)在不同練習(xí)內(nèi)容上所有用戶的練習(xí)頻次,并進(jìn)行排序,獲得練習(xí)內(nèi)容的受歡迎程度/重要性的排序統(tǒng)計(jì)。
7)本發(fā)明通過統(tǒng)計(jì)在所有練習(xí)內(nèi)容上不同用戶的平均評(píng)分,并進(jìn)行排序,獲得體現(xiàn)不同用戶的相對(duì)語言水平的相對(duì)指標(biāo)。8)本發(fā)明通過統(tǒng)計(jì)在所有練習(xí)內(nèi)容上不同用戶練習(xí)的總頻次/時(shí)間,并進(jìn)行排序,獲得體現(xiàn)不同用戶的學(xué)習(xí)勤奮程度的指標(biāo)。9)本發(fā)明通過分析特定用戶在特定練習(xí)內(nèi)容上的基礎(chǔ)元數(shù)據(jù),可以獲得每個(gè)基本學(xué)習(xí)單元對(duì)應(yīng)的用戶語音段和標(biāo)準(zhǔn)語音段。
下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步的說明。圖1示出了了系統(tǒng)模塊和處理流程的示意圖;圖2示出了基礎(chǔ)元數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖2. 1示出了用戶信息域的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖2. 2示出了評(píng)估信息域(以準(zhǔn)確度平分為例)的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖2. 3示出了練習(xí)內(nèi)容域的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖2. 4示出了發(fā)音細(xì)節(jié)域的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖2. 5示出了時(shí)間信息域的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖2. 6示出了抽取模塊信息域的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖3示出了學(xué)習(xí)重點(diǎn)/難點(diǎn)信息的元數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖3. 1示出了評(píng)估信息域(以準(zhǔn)確度平分為例)的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖3. 2示出了錯(cuò)誤實(shí)例域的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖3. 3示出了時(shí)間信息域的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖4示出了基礎(chǔ)元數(shù)據(jù)抽取流程圖;圖5示出了帶有學(xué)習(xí)難點(diǎn)信息的元數(shù)據(jù)的生成流程圖;圖6示出了特定用戶/所有用戶的匯聚元數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的示意圖;圖6. 1示出了基礎(chǔ)元數(shù)據(jù)1的數(shù)據(jù)結(jié)構(gòu)的示意圖。
具體實(shí)施例方式下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步的詳細(xì)描述圖1給出了本發(fā)明的實(shí)施例的模塊組成關(guān)系示意圖。參照?qǐng)D1,本發(fā)明主要包括元數(shù)據(jù)抽取模塊101,元數(shù)據(jù)庫102,元數(shù)據(jù)匯總分析模塊103,元數(shù)據(jù)庫104和元數(shù)據(jù)庫105。元數(shù)據(jù)抽取模塊101監(jiān)控用戶的學(xué)習(xí)過程,利用語音分析技術(shù)對(duì)用戶練習(xí)語音進(jìn)行分析和評(píng)估,得到用戶語音的發(fā)音細(xì)節(jié)和各個(gè)發(fā)音單元的客觀評(píng)分。把用戶信息、練習(xí)內(nèi)容信息、評(píng)分信息和發(fā)音細(xì)節(jié)信息以及時(shí)間信息組合起來,和用戶的練習(xí)語音進(jìn)行關(guān)聯(lián),生成用戶學(xué)習(xí)的基礎(chǔ)元數(shù)據(jù)。其中語音分析技術(shù)可以采用現(xiàn)有的技術(shù),比如專利 CN101551947A提供的技術(shù)?;A(chǔ)元數(shù)據(jù)抽取流程如圖5所示步驟1、監(jiān)測(cè)用戶練習(xí)過程,獲取用戶練習(xí)語音;步驟2、利用語音分析技術(shù)對(duì)用戶語音進(jìn)行分析和評(píng)估;步驟3、解析評(píng)估結(jié)果,獲得對(duì)用戶語音的不同粒度和層面的客觀評(píng)分信息,例如每個(gè)音素的發(fā)音評(píng)分,詞的整體評(píng)分等;步驟4、解析分析結(jié)果,獲得用戶發(fā)音的細(xì)節(jié)信息,例如用戶實(shí)際發(fā)音中的音素、 音節(jié)、單詞或句子,用戶語音中不同發(fā)音單元的時(shí)間邊界等;步驟5、用戶信息、練習(xí)內(nèi)容信息、評(píng)分信息和發(fā)音細(xì)節(jié)信息以及時(shí)間信息組合起來,和用戶語音進(jìn)行關(guān)聯(lián),生成記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù)。典型地,步驟2中對(duì)用戶語音進(jìn)行分析是指通過抽取語音的聲學(xué)特征和語言學(xué)特征,利用練習(xí)內(nèi)容的參考文本,對(duì)用戶語音進(jìn)行限定語法的識(shí)別,其識(shí)別結(jié)果包含了大量用戶發(fā)音的細(xì)節(jié)信息,如用戶實(shí)際發(fā)音的內(nèi)容,每個(gè)發(fā)音單元在用戶語音中的具體位置等。此外,用戶發(fā)音的細(xì)節(jié)信息還可以包括語調(diào)類型、重讀位置等。典型地,步驟2中對(duì)用戶語音進(jìn)行評(píng)估是指利用語音的聲學(xué)特征、語言學(xué)特征和練習(xí)內(nèi)容的參考文本,計(jì)算用戶語音和標(biāo)準(zhǔn)語音的相似度,得到對(duì)不同發(fā)音單元的客觀評(píng)分。典型地,對(duì)用戶語音進(jìn)行評(píng)估是指發(fā)音準(zhǔn)確性評(píng)估,評(píng)分是指發(fā)音的準(zhǔn)確性評(píng)分。典型地,對(duì)用戶語音進(jìn)行評(píng)估還包括發(fā)音流利度評(píng)估,評(píng)分是指發(fā)音的流利度評(píng)分。典型地,對(duì)于帶調(diào)語言來說,用戶語音進(jìn)行評(píng)估還包括聲調(diào)發(fā)音評(píng)估,評(píng)分是指聲調(diào)發(fā)音的評(píng)分。典型地,除上述評(píng)估指標(biāo)外,本發(fā)明所述基礎(chǔ)元數(shù)據(jù)還支持其他類型的發(fā)音評(píng)估指標(biāo)。更詳細(xì)地說,步驟3中解析評(píng)估結(jié)果,是指對(duì)評(píng)估的結(jié)果進(jìn)行分析,抽取不同粒度的有意義的評(píng)分和不同方面的評(píng)分。比如在單詞” condition”的發(fā)音練習(xí)中,評(píng)分信息包括1)詞的整體評(píng)分,它綜合考慮了單個(gè)音素發(fā)音和音素之間的連貫性和協(xié)同發(fā)音,2)每個(gè)音素的發(fā)音評(píng)分,它只考慮單個(gè)音素發(fā)音的準(zhǔn)確程度等。更詳細(xì)地說,步驟4中解析分析結(jié)果,是指從分析結(jié)果中抽取不同發(fā)音單元的內(nèi)容標(biāo)識(shí)以及在用戶語音中的詳細(xì)位置信息。比如在單詞” condition”的發(fā)音練習(xí)中,用戶語音中音素級(jí)發(fā)音單元的標(biāo)識(shí)為k-o -n-cl-ι / -a -η,其中音素k在用戶語音中的位置為 0.25s-0.36s。更詳細(xì)地說,步驟5中把用戶信息、練習(xí)內(nèi)容信息、評(píng)分信息和發(fā)音細(xì)節(jié)信息以及時(shí)間信息組合起來,和用戶語音進(jìn)行關(guān)聯(lián)是指把上述信息作為用戶語音文件的特定數(shù)據(jù)存儲(chǔ)在特定的位置,從而構(gòu)成記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù)。元數(shù)據(jù)庫102用來存放記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù)?;A(chǔ)元數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)如圖2所示。每條基礎(chǔ)元數(shù)據(jù)是一個(gè)包含用戶練習(xí)狀況信息和用戶練習(xí)語音的媒體數(shù)據(jù)。詳細(xì)地,除了用戶語音數(shù)據(jù)域外,一條基礎(chǔ)元數(shù)據(jù)至少包括如下數(shù)據(jù)域用戶信息域,學(xué)習(xí)內(nèi)容域,評(píng)分信息域,發(fā)音細(xì)節(jié)域和時(shí)間信息域以及抽取模塊信息域,其他部分存放用戶語音數(shù)據(jù)本身。更詳細(xì)地,用戶信息域至少包括如下信息用戶名,用戶年齡,用戶國籍,用戶語言水平等信息,其組織形式如圖2. 1所示,特定數(shù)據(jù)類型如下[用戶名string][用戶年齡int]
[用戶國籍string][用戶語言水平int]更詳細(xì)地,學(xué)習(xí)內(nèi)容域至少包含如下信息標(biāo)準(zhǔn)發(fā)音,參考文本,每個(gè)發(fā)音單元的時(shí)間邊界等。其組織形式如圖2. 3所示,特定數(shù)據(jù)類型如下[標(biāo)準(zhǔn)發(fā)音int vector][參考文本string][詞發(fā)音邊界[詞 1[起始時(shí)間float][結(jié)束時(shí)間float]][詞 2[起始時(shí)間float][結(jié)束時(shí)間float]]…][音素發(fā)音邊界[音素 1[起始時(shí)間float][結(jié)束時(shí)間float]][音素 2[起始時(shí)間float][結(jié)束時(shí)間float]]…]更詳細(xì)地,評(píng)分信息域至少包含如下信息句子級(jí)發(fā)音評(píng)分,詞級(jí)發(fā)音評(píng)分,音節(jié)級(jí)發(fā)音評(píng)分,音素級(jí)發(fā)音評(píng)分,其組織形式如圖2. 2所示,特定數(shù)據(jù)類型如下[句子評(píng)分int][詞級(jí)評(píng)分[詞 l:int][詞 2:int]…][音節(jié)評(píng)分[音節(jié) 1: int][音節(jié) 2: int]…][音素評(píng)分[音素 1: int]
[音素 2:int]…]典型地,上述給出的評(píng)分是發(fā)音準(zhǔn)確性評(píng)分,如果某些發(fā)音單元沒有評(píng)分,則對(duì)應(yīng)的域值設(shè)為null,比如圖2. 2中的音節(jié)評(píng)分域。典型地,上述的評(píng)分信息域可以進(jìn)一步擴(kuò)展,以包括其他類型的評(píng)分,比如發(fā)音流
利度、聲調(diào)準(zhǔn)確度等。更詳細(xì)地,發(fā)音細(xì)節(jié)域至少包括如下信息發(fā)音內(nèi)容信息和發(fā)音單元邊界信息。其中發(fā)音內(nèi)容信息包括用戶語音中不同發(fā)音單元對(duì)應(yīng)的內(nèi)容,發(fā)音單元邊界信息包括用戶語音中不同發(fā)音單元的起始時(shí)間和結(jié)束時(shí)間。發(fā)音細(xì)節(jié)域的組織形式如圖2. 4所示,特定數(shù)據(jù)類型如下[句級(jí)內(nèi)容string][詞級(jí)內(nèi)容[ M 1 string][ M 2 string]…][音素級(jí)內(nèi)容[音素 1: string][音素 2:string]…][詞級(jí)邊界[詞 1[起始時(shí)間float][結(jié)束時(shí)間float]][詞 2[起始時(shí)間float][結(jié)束時(shí)間float]]…][音素級(jí)邊界[音素 1[起始時(shí)間float][結(jié)束時(shí)間float]][音素 2[起始時(shí)間float][結(jié)束時(shí)間float]]…
]典型地,上述發(fā)音細(xì)節(jié)域中列舉了用戶發(fā)音中句子、詞和音素單元對(duì)應(yīng)的發(fā)音內(nèi)容。進(jìn)一步,該域還可以擴(kuò)展包括其他層次發(fā)音單元的發(fā)音內(nèi)容。典型地,上述發(fā)音細(xì)節(jié)域中列舉了詞和音素單元在用戶發(fā)音中對(duì)應(yīng)的時(shí)間邊界。 進(jìn)一步,該域還可以擴(kuò)展包括其他層次發(fā)音單元的時(shí)間邊界。更詳細(xì)地,時(shí)間信息域至少包括如下信息用戶語音長(zhǎng)度,練習(xí)日期和練習(xí)時(shí)間, 其組織形式如圖2. 5所示,特定數(shù)據(jù)類型如下[語音長(zhǎng)度float][練習(xí)日期date][練習(xí)時(shí)間time]更詳細(xì)地,抽取模塊信息域至少包括如下信息抽取算法名,抽取算法版本號(hào),資源版本號(hào),評(píng)分分級(jí)類型等信息。其組織形式如圖2. 6所示,特定數(shù)據(jù)類型如下[抽取算法名string][抽取算法版本號(hào)string][資源版本號(hào)string][評(píng)分分級(jí)類型int]詳細(xì)地,抽取算法名表示元數(shù)據(jù)抽取模塊中采用的核心算法類型。詳細(xì)地,抽取算法版本號(hào)表示數(shù)據(jù)抽取模塊中采用的核心算法的版本。詳細(xì)地,資源版本號(hào)表示數(shù)據(jù)抽取模塊中核心算法所采用的資源版本,比如聲學(xué)模型、語言模型等。詳細(xì)地,評(píng)分分級(jí)類型存放了對(duì)用戶發(fā)音進(jìn)行評(píng)分的分值體系,可以包括兩分制、五分制、十分制和百分制等。元數(shù)據(jù)匯總分析模塊103匯總大量用戶學(xué)習(xí)的基礎(chǔ)元數(shù)據(jù),得到相同用戶/所有用戶在相同練習(xí)內(nèi)容上的所有歷史學(xué)習(xí)狀況,和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),從而生成匯聚元數(shù)據(jù)。元數(shù)據(jù)庫105用來存放匯聚元數(shù)據(jù)。一條匯聚元數(shù)據(jù)由特定內(nèi)容對(duì)應(yīng)的所有的用戶練習(xí)狀況歷史信息和特定內(nèi)容對(duì)應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)構(gòu)成。典型地,特定用戶/所有用戶的匯聚元數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)如圖6所示。詳細(xì)地,除了標(biāo)準(zhǔn)語音數(shù)據(jù)外,每條匯聚元數(shù)據(jù)至少包括如下信息練習(xí)內(nèi)容域, 基礎(chǔ)元數(shù)據(jù)列表域和時(shí)間信息域以及練習(xí)頻次。其中練習(xí)內(nèi)容域和時(shí)間信息域和基礎(chǔ)元數(shù)據(jù)中的結(jié)構(gòu)類似,此處不再贅述。詳細(xì)地,所述的基礎(chǔ)元數(shù)據(jù)列表域用來存放練習(xí)該內(nèi)容的所有基礎(chǔ)元數(shù)據(jù)信息, 其組織結(jié)構(gòu)如圖6. 1所示。每個(gè)基礎(chǔ)元數(shù)據(jù)包括用戶信息域,評(píng)分信息域,發(fā)音細(xì)節(jié)域和時(shí)間信息域,其中每個(gè)信息域的結(jié)構(gòu)和之前基礎(chǔ)元數(shù)據(jù)中定義的結(jié)構(gòu)類似。優(yōu)選地,元數(shù)據(jù)匯總分析模塊103對(duì)大量用戶學(xué)習(xí)的基礎(chǔ)元數(shù)據(jù)進(jìn)行匯總分析, 發(fā)現(xiàn)在特定用戶/所有用戶基礎(chǔ)元數(shù)據(jù)上具有共性的信息,總結(jié)出用戶學(xué)習(xí)中的重點(diǎn)和難點(diǎn)學(xué)習(xí)內(nèi)容,和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),生成學(xué)習(xí)難點(diǎn)/重點(diǎn)內(nèi)容元數(shù)據(jù)。優(yōu)選地,給出學(xué)習(xí)難點(diǎn)/重點(diǎn)內(nèi)容元數(shù)據(jù)的生成流程如圖5所示。具體流程如下步驟1獲取特定用戶/所有用戶的相同練習(xí)內(nèi)容的基礎(chǔ)元數(shù)據(jù)步驟2如果基礎(chǔ)元數(shù)據(jù)數(shù)目小于給定閾值,則結(jié)束;否則根據(jù)下式依次計(jì)算所有練習(xí)單元的平均評(píng)分=其中N為基礎(chǔ)元數(shù)據(jù)數(shù)目,<(X)為第η個(gè)基礎(chǔ)元數(shù)據(jù)上基本學(xué)習(xí)單元χ的評(píng)估指標(biāo)i的系統(tǒng)評(píng)分。步驟3、以不同練習(xí)單元對(duì)齊用戶發(fā)音的內(nèi)容和標(biāo)準(zhǔn)發(fā)音的內(nèi)容,然后根據(jù)下式計(jì)算所有練習(xí)單元上用戶發(fā)音內(nèi)容和標(biāo)準(zhǔn)發(fā)音不一致的情況所占的比例= yJ-τΣ ,Σ ,^'^)
Zun=) n
Γθ if X, == Vi^(Χ,,χ) = ^/'
L1 otherwise其中Xi表示用戶發(fā)音中第i個(gè)發(fā)音單元的發(fā)音內(nèi)容為X,Yi表示標(biāo)準(zhǔn)發(fā)音中第i 個(gè)發(fā)音單元的發(fā)音內(nèi)容為y,Xi和yi是分別用戶發(fā)音和標(biāo)準(zhǔn)發(fā)音中對(duì)應(yīng)的發(fā)音單元內(nèi)容, N為基礎(chǔ)元數(shù)據(jù)數(shù)目,In為第η個(gè)基礎(chǔ)元數(shù)據(jù)中標(biāo)準(zhǔn)發(fā)音的發(fā)音單元數(shù)。步驟4、把用戶信息、練習(xí)內(nèi)容信息、評(píng)估信息、錯(cuò)誤實(shí)例信息、時(shí)間信息以及頻次等進(jìn)行組合,并與標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),共同構(gòu)成學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)。元數(shù)據(jù)庫104用來存放大量基礎(chǔ)元數(shù)據(jù)匯總分析得到的學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)。 每條學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)是一個(gè)包含用戶練習(xí)平均狀況信息和標(biāo)準(zhǔn)語音的媒體數(shù)據(jù)。優(yōu)選地,學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)至少包含如下信息用戶信息域、評(píng)估信息域、練習(xí)內(nèi)容域、錯(cuò)誤實(shí)例域、時(shí)間信息域和頻次,其組織結(jié)構(gòu)如圖3所示。其中用戶信息域、練習(xí)內(nèi)容域的數(shù)據(jù)結(jié)構(gòu)和基礎(chǔ)元數(shù)據(jù)中定義的結(jié)構(gòu)類似。更詳細(xì)地,評(píng)估信息域存放每個(gè)發(fā)音單元上的平均評(píng)分,其組織結(jié)構(gòu)如圖3. 1所示。特定數(shù)據(jù)類型如下[句子平均評(píng)分int][詞級(jí)平均評(píng)分[詞 l:int][詞 2:int]…][音節(jié)級(jí)平均評(píng)分[音節(jié) 1: int][音節(jié) 2: int]…][音素級(jí)平均評(píng)分[音素 1: int][音素 2: int]…]
典型地,上述平均評(píng)分是發(fā)音準(zhǔn)確性的平均評(píng)分,如果某些發(fā)音單元沒有評(píng)分,則對(duì)應(yīng)的域值設(shè)為null,比如圖3. 1中的音節(jié)平均評(píng)分域。典型地,上述的平均評(píng)分信息域可以進(jìn)一步擴(kuò)展,以包括其他類型的平均評(píng)分,比如發(fā)音流利度、聲調(diào)準(zhǔn)確度等。更詳細(xì)地,錯(cuò)誤實(shí)例域存放在大量基礎(chǔ)元數(shù)據(jù)上用戶發(fā)音練習(xí)中最容易犯的錯(cuò)誤類型。典型地,該錯(cuò)誤實(shí)例域可以存放不同發(fā)音單元的錯(cuò)誤實(shí)例及其在發(fā)音中所占比例。錯(cuò)誤實(shí)例域的組織結(jié)構(gòu)如圖3. 2所示,其中特定數(shù)據(jù)類型如下[句子級(jí)實(shí)例string][詞級(jí)實(shí)例[ M 1 string][ M 2 string]…][音素級(jí)實(shí)例[音素 1: string][音素 2:string]…][詞級(jí)錯(cuò)誤比例[詞 1 float][詞 2:float]…][音素級(jí)錯(cuò)誤比例[音素 1 :float][音素 2 :float]…]優(yōu)選地,學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)中的頻次存放練習(xí)特定內(nèi)容的基礎(chǔ)元數(shù)據(jù)數(shù)目,
反映了練習(xí)內(nèi)容的重要性和受歡迎程度。頻次越高,說明該內(nèi)容越重要,越受歡迎。優(yōu)選地,學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)中的平均評(píng)分反映了練習(xí)內(nèi)容的難度。評(píng)分越低, 說明該發(fā)音內(nèi)容難度越高。優(yōu)選地,學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)中的平均評(píng)分也反映了用戶在該發(fā)音上的發(fā)音水平。評(píng)分越低,說明該用戶對(duì)該發(fā)音掌握地越不好,越需要更多練習(xí)和改進(jìn)。優(yōu)選地,學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)中,評(píng)分越低且練習(xí)次數(shù)越多的發(fā)音單元,通常就是用戶學(xué)習(xí)的難點(diǎn)內(nèi)容。優(yōu)選地,學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)中的錯(cuò)誤實(shí)例反映了發(fā)音練習(xí)中最容易犯的錯(cuò)誤??梢钥偨Y(jié)出來反饋給學(xué)習(xí)者,促進(jìn)改進(jìn)發(fā)音水平,或者反饋給研究人員,輔助改進(jìn)發(fā)音內(nèi)容的設(shè)計(jì)和指導(dǎo)反饋信息的設(shè)計(jì)。
更詳細(xì)地,時(shí)間信息域用來存放形成重點(diǎn)/難點(diǎn)元數(shù)據(jù)的原始語音數(shù)據(jù)的基本信息,至少包含如下信息用戶語音總長(zhǎng)度,練習(xí)起始日期和時(shí)間,練習(xí)結(jié)束日期和時(shí)間。其組織結(jié)構(gòu)如圖3. 3所示,其中特定數(shù)據(jù)結(jié)構(gòu)如下[語音長(zhǎng)度float][起始日期date][起始時(shí)間time][結(jié)束日期date][結(jié)束時(shí)間time]…典型地,對(duì)于非特定用戶的學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù),其用戶信息域可設(shè)為null。優(yōu)選地,如圖3及其子圖所示,在句子"how are you ? ”的發(fā)音練習(xí)中,用戶練習(xí)了 520次,其中第2個(gè)音素”a”的發(fā)音平均評(píng)分只有15分。對(duì)應(yīng)的,在錯(cuò)誤實(shí)例中顯示,該音
素經(jīng)常被發(fā)成“O ”,并且該錯(cuò)誤在所有發(fā)音中占10%的比例。因此,可以判定單詞”how”
中的音素” a”的發(fā)音是用戶發(fā)音的難點(diǎn)。除了進(jìn)行重點(diǎn)/難點(diǎn)學(xué)習(xí)內(nèi)容的發(fā)現(xiàn)之外,本發(fā)明通過分析大量的基礎(chǔ)元數(shù)據(jù)還生成其它多種有價(jià)值的統(tǒng)計(jì)信息,稱為統(tǒng)計(jì)增值信息,至少包括通過如下方法獲得如下信息1)本發(fā)明把對(duì)應(yīng)相同標(biāo)準(zhǔn)語音的同一用戶練習(xí)的所有基礎(chǔ)元數(shù)據(jù)匯總在一起, 發(fā)現(xiàn)那些平均評(píng)分低于給定閾值的評(píng)分單元,獲得該評(píng)分單元對(duì)應(yīng)的用戶發(fā)音和標(biāo)準(zhǔn)發(fā)音對(duì),即那些常見發(fā)音錯(cuò)誤模式,比如哪些音素用戶容易讀錯(cuò),通常錯(cuò)讀為哪個(gè)音素或者哪些單詞重音位置不準(zhǔn)確等。2)本發(fā)明通過統(tǒng)計(jì)不同時(shí)間段上特定用戶在特定練習(xí)內(nèi)容上的平均評(píng)分,可以生成特定用戶練習(xí)特定內(nèi)容的評(píng)分變化趨勢(shì),反映了用戶在特定學(xué)習(xí)內(nèi)容上發(fā)音水平的變化情況。3)本發(fā)明通過統(tǒng)計(jì)不同時(shí)間段上特定用戶在所有練習(xí)內(nèi)容上的平均評(píng)分,可以生成特定用戶總體練習(xí)評(píng)分的變化趨勢(shì),反映了用戶總體發(fā)音水平的變化情況。4)本發(fā)明通過統(tǒng)計(jì)不同時(shí)間段上特定用戶在特定練習(xí)內(nèi)容上的基礎(chǔ)元數(shù)據(jù)的數(shù)目/語音長(zhǎng)度,獲得特定用戶在不同時(shí)間段上特定練習(xí)內(nèi)容的練習(xí)次數(shù)/時(shí)間的分布變化趨勢(shì)。5)本發(fā)明通過統(tǒng)計(jì)不同時(shí)間段上特定用戶的基礎(chǔ)元數(shù)據(jù)的數(shù)目/語音長(zhǎng)度,獲得特定用戶在不同時(shí)間段上練習(xí)次數(shù)/時(shí)間的分布變化趨勢(shì)。6)本發(fā)明通過統(tǒng)計(jì)在不同練習(xí)內(nèi)容上所有用戶的練習(xí)頻次,并進(jìn)行排序,獲得練習(xí)內(nèi)容的受歡迎程度/重要性的排序統(tǒng)計(jì)。7)本發(fā)明通過統(tǒng)計(jì)在所有練習(xí)內(nèi)容上不同用戶的平均評(píng)分,并進(jìn)行排序,獲得體現(xiàn)不同用戶的相對(duì)語言水平的相對(duì)指標(biāo)。8)本發(fā)明通過統(tǒng)計(jì)在所有練習(xí)內(nèi)容上不同用戶練習(xí)的總頻次/時(shí)間,并進(jìn)行排序,獲得體現(xiàn)不同用戶的學(xué)習(xí)勤奮程度的指標(biāo)。9)本發(fā)明通過分析特定用戶在特定練習(xí)內(nèi)容上的基礎(chǔ)元數(shù)據(jù),可以獲得每個(gè)基本學(xué)習(xí)單元對(duì)應(yīng)的用戶語音段和標(biāo)準(zhǔn)語音段。
優(yōu)選地,所述的基礎(chǔ)元數(shù)據(jù)匯總分析模塊可對(duì)來自不同學(xué)習(xí)系統(tǒng)的基礎(chǔ)元數(shù)據(jù)進(jìn)行匯總分析處理。比如可對(duì)來自兩個(gè)學(xué)習(xí)系統(tǒng)AIChinese[注蘇州思必馳信息科技有限公司的網(wǎng)絡(luò)學(xué)習(xí)產(chǎn)品,http://www. aispeech. com]和Newp印per [注蘇州思必馳信息科技有限公司的單機(jī)版學(xué)習(xí)產(chǎn)品]的基礎(chǔ)元數(shù)據(jù)進(jìn)行匯總分析。當(dāng)然,本發(fā)明還可有其他多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但是這些相信的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1.一種用于口語學(xué)習(xí)的元數(shù)據(jù)處理方法,包括以下步驟步驟一、監(jiān)控用戶練習(xí)過程,獲取用戶練習(xí)語音;步驟二、利用語音分析技術(shù)對(duì)用戶語音進(jìn)行分析和評(píng)估;步驟三、解析評(píng)估結(jié)果,獲得對(duì)用戶語音的不同粒度和不同層面的客觀評(píng)分信息;步驟四、解析分析結(jié)果,獲得用戶發(fā)音的細(xì)節(jié)信息;步驟五、將用戶信息、練習(xí)內(nèi)容信息、評(píng)分信息和發(fā)音細(xì)節(jié)信息以及時(shí)間信息組合起來,和用戶語音進(jìn)行關(guān)聯(lián),生成記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù);步驟六、匯總大量記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù),得到相同用戶/所有用戶在相同練習(xí)內(nèi)容上的所有歷史學(xué)習(xí)狀況,和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),從而生成匯聚元數(shù)據(jù)。
2.如權(quán)利要求1所述的用于口語學(xué)習(xí)的元數(shù)據(jù)處理方法,其中步驟六還進(jìn)一步包括如下步驟對(duì)大量記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù)進(jìn)行匯總分析,發(fā)現(xiàn)在特定用戶/所有用戶基礎(chǔ)元數(shù)據(jù)上具有共性的信息,總結(jié)出特定用戶/所有用戶學(xué)習(xí)中的重點(diǎn)和難點(diǎn)學(xué)習(xí)內(nèi)容, 和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),生成學(xué)習(xí)難點(diǎn)/重點(diǎn)內(nèi)容元數(shù)據(jù)。
3.如權(quán)利要求2所述的用于口語學(xué)習(xí)的元數(shù)據(jù)處理方法,其中生成學(xué)習(xí)難點(diǎn)/重點(diǎn)內(nèi)容元數(shù)據(jù)的步驟包括步驟1、獲取特定用戶/所有用戶的相同練習(xí)內(nèi)容的基礎(chǔ)元數(shù)據(jù);步驟2、如果基礎(chǔ)元數(shù)據(jù)數(shù)目小于給定閾值,則結(jié)束;否則根據(jù)下式依次計(jì)算所有練習(xí)單元的平均評(píng)分其中N為基礎(chǔ)元數(shù)據(jù)數(shù)目,為第η個(gè)基礎(chǔ)元數(shù)據(jù)上基本學(xué)習(xí)單元X的評(píng)估指標(biāo)i 的系統(tǒng)評(píng)分;步驟3、以不同練習(xí)單元對(duì)齊用戶發(fā)音的內(nèi)容和標(biāo)準(zhǔn)發(fā)音的內(nèi)容,然后根據(jù)下式計(jì)算所有練習(xí)單元上用戶發(fā)音內(nèi)容和標(biāo)準(zhǔn)發(fā)音不一致的情況所占的比例p(x^y) = yl·— Σ , Σ!, ‘兄)[1 otherwise其中Xi表示用戶發(fā)音中第i個(gè)發(fā)音單元的發(fā)音內(nèi)容為X,Yi表示標(biāo)準(zhǔn)發(fā)音中第i個(gè)發(fā)音單元的發(fā)音內(nèi)容為y,Xi和yi是分別用戶發(fā)音和標(biāo)準(zhǔn)發(fā)音中對(duì)應(yīng)的發(fā)音單元內(nèi)容,N為基礎(chǔ)元數(shù)據(jù)數(shù)目,In為第η個(gè)基礎(chǔ)元數(shù)據(jù)中標(biāo)準(zhǔn)發(fā)音的發(fā)音單元數(shù);步驟4、把用戶信息、練習(xí)內(nèi)容信息、評(píng)估信息、錯(cuò)誤實(shí)例信息、時(shí)間信息以及頻次等進(jìn)行組合,并與標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),共同構(gòu)成學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)。
4.如權(quán)利要求3所述的用于口語學(xué)習(xí)的元數(shù)據(jù)處理方法,其中每條基礎(chǔ)元數(shù)據(jù)是一個(gè)包含用戶練習(xí)狀況信息和用戶練習(xí)語音的媒體數(shù)據(jù);除用戶語音數(shù)據(jù)域外,每條基礎(chǔ)元數(shù)據(jù)至少包括如下數(shù)據(jù)域用戶信息域,學(xué)習(xí)內(nèi)容域,評(píng)分信息域,發(fā)音細(xì)節(jié)域和時(shí)間信息域以及抽取模塊信息域,其他部分存放用戶語音數(shù)據(jù)本身;每條匯聚元數(shù)據(jù)由特定內(nèi)容對(duì)應(yīng)的所有的用戶練習(xí)狀況歷史信息和特定內(nèi)容對(duì)應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)構(gòu)成;除標(biāo)準(zhǔn)語音數(shù)據(jù)外,每條匯聚元數(shù)據(jù)至少包括如下信息練習(xí)內(nèi)容域, 基礎(chǔ)元數(shù)據(jù)列表域和時(shí)間信息域以及練習(xí)頻次;以及每條學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)是一個(gè)包含用戶練習(xí)平均狀況信息和標(biāo)準(zhǔn)語音的媒體數(shù)據(jù);學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)至少包含如下信息用戶信息域、評(píng)估信息域、練習(xí)內(nèi)容域、錯(cuò)誤實(shí)例域、時(shí)間信息域和頻次。
5.如權(quán)利要求4所述的用于口語學(xué)習(xí)的元數(shù)據(jù)處理方法,其中所述基礎(chǔ)元數(shù)據(jù)存放于第一元數(shù)據(jù)庫中,所述匯聚元數(shù)據(jù)存放于第二元數(shù)據(jù)庫中,和所述學(xué)習(xí)難點(diǎn)/重點(diǎn)內(nèi)容元數(shù)據(jù)存放于第三元數(shù)據(jù)庫中。
6.一種用于口語學(xué)習(xí)的元數(shù)據(jù)處理系統(tǒng),包括元數(shù)據(jù)抽取模塊,用于監(jiān)測(cè)用戶練習(xí)過程,獲取用戶練習(xí)語音,利用語音分析技術(shù)對(duì)用產(chǎn)語音進(jìn)行分析和評(píng)估,解析評(píng)估結(jié)果,獲得對(duì)用戶語音的不同粒度和層面的客觀評(píng)分信息,解析分析結(jié)果,獲得用戶發(fā)音的細(xì)節(jié)信息,并將用戶信息、練習(xí)內(nèi)容信息、評(píng)分信息和發(fā)音細(xì)節(jié)信息以及時(shí)間信息組合起來,和用戶語音進(jìn)行關(guān)聯(lián),生成記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù);第一元數(shù)據(jù)庫,用于用來存放記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù);元數(shù)據(jù)匯總分析模塊,用于匯總大量記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù),得到相同用戶 /所有用戶在相同練習(xí)內(nèi)容上的所有歷史學(xué)習(xí)狀況,和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),從而生成匯聚元數(shù)據(jù);第二元數(shù)據(jù)庫,用于存放匯聚元數(shù)據(jù)。
7.如權(quán)利要求6所述的用于口語學(xué)習(xí)的元數(shù)據(jù)處理系統(tǒng),其中元數(shù)據(jù)匯總分析模塊進(jìn)一步用于對(duì)大量記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù)進(jìn)行匯總分析,發(fā)現(xiàn)在特定用戶/所有用戶基礎(chǔ)元數(shù)據(jù)上具有共性的信息,總結(jié)出用戶學(xué)習(xí)中的重點(diǎn)和難點(diǎn)學(xué)習(xí)內(nèi)容,和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),生成學(xué)習(xí)難點(diǎn)/重點(diǎn)內(nèi)容元數(shù)據(jù)。
8.如權(quán)利要求7所述的用于口語學(xué)習(xí)的元數(shù)據(jù)處理系統(tǒng),其中每條基礎(chǔ)元數(shù)據(jù)是一個(gè)包含用戶練習(xí)狀況信息和用戶練習(xí)語音的媒體數(shù)據(jù);除用戶語音數(shù)據(jù)域外,每條基礎(chǔ)元數(shù)據(jù)至少包括如下數(shù)據(jù)域用戶信息域,學(xué)習(xí)內(nèi)容域,評(píng)分信息域,發(fā)音細(xì)節(jié)域和時(shí)間信息域以及抽取模塊信息域,其他部分存放用戶語音數(shù)據(jù)本身;每條匯聚元數(shù)據(jù)由特定內(nèi)容對(duì)應(yīng)的所有的用戶練習(xí)狀況歷史信息和特定內(nèi)容對(duì)應(yīng)的標(biāo)準(zhǔn)語音數(shù)據(jù)構(gòu)成;除標(biāo)準(zhǔn)語音數(shù)據(jù)外,每條匯聚元數(shù)據(jù)至少包括如下信息練習(xí)內(nèi)容域, 基礎(chǔ)元數(shù)據(jù)列表域和時(shí)間信息域以及練習(xí)頻次;以及每條學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)是一個(gè)包含用戶練習(xí)平均狀況信息和標(biāo)準(zhǔn)語音的媒體數(shù)據(jù);學(xué)習(xí)難點(diǎn)/重點(diǎn)元數(shù)據(jù)至少包含如下信息用戶信息域、評(píng)估信息域、練習(xí)內(nèi)容域、錯(cuò)誤實(shí)例域、時(shí)間信息域和頻次。
9.如權(quán)利要求8所述的用于口語學(xué)習(xí)的元數(shù)據(jù)處理系統(tǒng),其中還包括第三元數(shù)據(jù)庫, 用于存放所述學(xué)習(xí)難點(diǎn)/重點(diǎn)內(nèi)容元數(shù)據(jù)。
10.如權(quán)利要求6所述的用于口語學(xué)習(xí)的元數(shù)據(jù)處理系統(tǒng),其中元數(shù)據(jù)匯總分析模塊進(jìn)一步生成統(tǒng)計(jì)增值信息,該信息至少包括用戶常見發(fā)音錯(cuò)誤模式,用戶發(fā)音水平變化趨勢(shì),用戶學(xué)習(xí)成績(jī)變化趨勢(shì),用戶練習(xí)時(shí)間變化趨勢(shì)和特定發(fā)音單元的用戶語音和標(biāo)準(zhǔn)語音的比對(duì)。
全文摘要
一種用于口語學(xué)習(xí)系統(tǒng)的元數(shù)據(jù)處理方法和系統(tǒng),其中所述方法包括以下步驟步驟一、監(jiān)控用戶練習(xí)過程,獲取用戶練習(xí)語音;步驟二、利用語音分析技術(shù)對(duì)用戶語音進(jìn)行分析和評(píng)估;步驟三、解析評(píng)估結(jié)果,獲得對(duì)用戶語音的不同粒度和層面的客觀評(píng)分信息;步驟四、解析分析結(jié)果,獲得用戶發(fā)音的細(xì)節(jié)信息;步驟五、將用戶信息、練習(xí)內(nèi)容信息、評(píng)分信息和發(fā)音細(xì)節(jié)信息以及時(shí)間信息組合起來,和用戶語音進(jìn)行關(guān)聯(lián),生成記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù);步驟六、匯總大量記錄用戶練習(xí)狀況的基礎(chǔ)元數(shù)據(jù),得到相同用戶/所有用戶在相同練習(xí)內(nèi)容上的所有歷史學(xué)習(xí)狀況,和標(biāo)準(zhǔn)語音進(jìn)行關(guān)聯(lián),從而生成匯聚元數(shù)據(jù)。
文檔編號(hào)G06F17/30GK102253976SQ20111016328
公開日2011年11月23日 申請(qǐng)日期2011年6月17日 優(yōu)先權(quán)日2011年6月17日
發(fā)明者王歡良, 王艷龍, 鄒平 申請(qǐng)人:蘇州思必馳信息科技有限公司