產(chǎn)生及偵測(cè)混淆音的方法及系統(tǒng)的制作方法

文檔序號(hào)：2837539閱讀：252來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：產(chǎn)生及偵測(cè)混淆音的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明是有關(guān)于一種產(chǎn)生及偵測(cè)混淆音的方法及系統(tǒng)，且特別是有關(guān)于-一種產(chǎn)生及偵測(cè)漢語(yǔ)發(fā)音混淆音的方法及系統(tǒng)。
背景技術(shù)：
由于近年來(lái)電腦計(jì)算能力的提升以及語(yǔ)音辨識(shí)技術(shù)的進(jìn)步，語(yǔ)音處理在我們?nèi)粘Ｉ钌系膽?yīng)用與日俱增，在語(yǔ)言學(xué)習(xí)方面，以電腦輔助使用者進(jìn)行非母語(yǔ)學(xué)習(xí)已受到相當(dāng)重視，各方也紛紛投入相關(guān)的研究。
語(yǔ)言的學(xué)習(xí)大致上可以分為聽(tīng)、說(shuō)、讀、寫這四大部分，在漢語(yǔ)口說(shuō)能力的訓(xùn)練方面，沒(méi)有一個(gè)很好的解決方案來(lái)幫助漢語(yǔ)學(xué)習(xí)者自我練習(xí)與評(píng)量，目前在漢語(yǔ)學(xué)習(xí)軟件市場(chǎng)上提供的輔助發(fā)音會(huì)話學(xué)習(xí)方面，經(jīng)過(guò)切音、系統(tǒng)分析、以及算法等數(shù)據(jù)處理后，只能做到語(yǔ)音評(píng)分，讓使用者知道哪個(gè)單字發(fā)音發(fā)的不夠準(zhǔn)確，但是無(wú)法對(duì)使用者的發(fā)音進(jìn)一歩提出分析或指正，也無(wú)法根據(jù)不同語(yǔ)言或國(guó)家的使用者的特性給予有效的矯正建議，實(shí)用性不大，所能提供的實(shí)質(zhì)幫助有限。
因此，需要一種產(chǎn)生及偵測(cè)發(fā)音錯(cuò)誤模型的方法及系統(tǒng)來(lái)改善上述問(wèn)題。

發(fā)明內(nèi)容
因此本發(fā)明的目的就是在提供一種產(chǎn)生及偵測(cè)混淆音的方法及系統(tǒng)，此方法及系統(tǒng)可以分析出使用者發(fā)音錯(cuò)誤的模式，指出使用者錯(cuò)誤之處，讓使用者知道哪個(gè)發(fā)音發(fā)的不夠準(zhǔn)確，還能進(jìn)一步提出發(fā)音指正，給予有效的矯正建議，增加使用者的學(xué)習(xí)效率。
根據(jù)本發(fā)明的上述目的，提出一種產(chǎn)生及偵測(cè)混淆音的方法。依照本發(fā)明一較佳實(shí)施例，此產(chǎn)生及偵測(cè)混淆音的方法包含產(chǎn)生階段及偵測(cè)階段，產(chǎn)生階
段包含a.輸入漢語(yǔ)語(yǔ)料；b.利用維特比解碼算法(ViterbiDecoding)中的強(qiáng)迫校準(zhǔn)(Forced Alignment),切割漢語(yǔ)語(yǔ)料；c.將切音結(jié)果與漢語(yǔ)聲學(xué)模型比對(duì)；d.
6判別是否有混淆音產(chǎn)生；e.當(dāng)混淆音產(chǎn)生時(shí)，將混淆音加入辨識(shí)網(wǎng)絡(luò)，重復(fù)步
驟b、 C、以及d;以及f.當(dāng)沒(méi)有混淆音產(chǎn)生時(shí)，停止并輸出所有之前產(chǎn)生的混淆音至混淆音設(shè)定檔。偵測(cè)階段包含g.輸入使用者念出的漢語(yǔ)語(yǔ)句；h.利用混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn)；i.決定漢語(yǔ)語(yǔ)句的最佳路徑；以及J.比較最佳路徑與標(biāo)準(zhǔn)路徑，進(jìn)行即時(shí)語(yǔ)音矯正。
根據(jù)本發(fā)明的上述目的，提出一種產(chǎn)生及偵測(cè)混淆音的系統(tǒng)。依照本發(fā)明一較佳實(shí)施例，此產(chǎn)生及偵測(cè)混淆音的系統(tǒng)包含產(chǎn)生系統(tǒng)及偵測(cè)系統(tǒng)，產(chǎn)生系統(tǒng)包含辨識(shí)網(wǎng)絡(luò)，用以辨識(shí)漢語(yǔ)語(yǔ)料；漢語(yǔ)聲學(xué)模型，用以提供411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)；混淆音設(shè)定檔，用以儲(chǔ)存所有產(chǎn)生的混淆音；語(yǔ)音切割模塊，輸入漢語(yǔ)語(yǔ)料，利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)，通過(guò)辨識(shí)網(wǎng)絡(luò)辨識(shí)出最佳路徑，切割漢語(yǔ)語(yǔ)料以得到切音結(jié)果；以及混淆音產(chǎn)生模塊，將切音結(jié)果與漢語(yǔ)聲學(xué)模型比對(duì)以判別是否有混淆音產(chǎn)生，當(dāng)混淆音產(chǎn)生時(shí)，將混淆音加入辨識(shí)網(wǎng)絡(luò)，當(dāng)沒(méi)有混淆音產(chǎn)生時(shí)，停止并輸出所有之前產(chǎn)生的混淆音至混淆富-設(shè)定檔；其中當(dāng)混淆音產(chǎn)生模塊有混淆音產(chǎn)生時(shí)，語(yǔ)音切割模塊會(huì)通過(guò)辨識(shí)網(wǎng)絡(luò)辨識(shí)出一條新的最佳路徑，再次切割漢語(yǔ)語(yǔ)料以得到新的切音結(jié)果，并將新的切音結(jié)果輸出至混淆音產(chǎn)生模塊。
偵測(cè)系統(tǒng)包含混淆音辨識(shí)網(wǎng)絡(luò)，用以辨識(shí)使用者念出的漢語(yǔ)語(yǔ)句，混淆音辨識(shí)網(wǎng)絡(luò)根據(jù)產(chǎn)生階段輸出的混淆音設(shè)定檔所建立；路徑辨識(shí)模塊，利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)決定漢語(yǔ)語(yǔ)句的最佳路徑；以及語(yǔ)音矯正模塊，比較最佳路徑與標(biāo)準(zhǔn)路徑，進(jìn)行即時(shí)語(yǔ)音矯正。
本發(fā)明以迭代(Iteration)的方法來(lái)反復(fù)找出混淆音并加入辨識(shí)網(wǎng)絡(luò)，來(lái)逐次提高切音的正確性以及評(píng)分的客觀性。應(yīng)用本發(fā)明可以分析出使用者發(fā)音錯(cuò)誤的模式，指出使用者錯(cuò)誤之處，讓使用者知道哪個(gè)發(fā)音發(fā)的不夠準(zhǔn)確，還能進(jìn)一步提出發(fā)音指正，給予有效的矯正建議，增加使用者的學(xué)習(xí)效率。

為使本發(fā)明的上述和其它目的、特征、優(yōu)點(diǎn)與實(shí)施例能更明顯易懂，所附附圖的詳細(xì)說(shuō)明如下
圖1A所示為依照本發(fā)明一較佳實(shí)施例的混淆音產(chǎn)生方法流程圖；圖1B所示為依照本發(fā)明一較佳實(shí)施例的混淆音偵測(cè)方法流程圖；圖2A所示為依照本發(fā)明一較佳實(shí)施例于混淆音產(chǎn)生階段時(shí)的辨識(shí)網(wǎng)絡(luò)示
意圖2B所示為依照本發(fā)明一較佳實(shí)施例于混淆音偵測(cè)階段時(shí)的路徑示意
圖2C所示為依照本發(fā)明一較佳實(shí)施例的切音結(jié)果示意圖；圖3A所示為依照本發(fā)明一較佳實(shí)施例的混淆音產(chǎn)生系統(tǒng)的結(jié)構(gòu)示意圖；圖3B所示為依照本發(fā)明一較佳實(shí)施例的混淆音偵測(cè)系統(tǒng)的結(jié)構(gòu)示意圖。其中，附圖標(biāo)記10:輸入漢語(yǔ)語(yǔ)料
120:利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)
切割漢語(yǔ)語(yǔ)料
130:將切音結(jié)果與漢語(yǔ)聲學(xué)模型比對(duì)140:判別是否有混淆音產(chǎn)生150:將混淆音加入辨識(shí)網(wǎng)絡(luò)160:停止并輸出所有之前產(chǎn)生的混淆音170:輸入漢語(yǔ)語(yǔ)句175:利用混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn)180:決定漢語(yǔ)語(yǔ)句的最佳路徑185:進(jìn)行即時(shí)語(yǔ)音矯正210:起始時(shí)的辨識(shí)網(wǎng)絡(luò)220:加入混淆音的辨識(shí)網(wǎng)絡(luò)
具體實(shí)施例方式
此產(chǎn)生及偵測(cè)混淆音的方法可分成產(chǎn)生階段及偵測(cè)階段來(lái)進(jìn)行。請(qǐng)參照?qǐng)D
1A及圖2A，圖1A所示為依照本發(fā)明一較佳實(shí)施例的混淆音產(chǎn)生方法流程圖，圖2A所示為依照本發(fā)明一較佳實(shí)施例在混淆音產(chǎn)生階段時(shí)的辨識(shí)網(wǎng)絡(luò)示意圖。在產(chǎn)生階段時(shí)，可從漢語(yǔ)語(yǔ)音文件或麥克風(fēng)輸入漢語(yǔ)語(yǔ)料(步驟110);接
240:混淆音辨識(shí)網(wǎng)絡(luò)
250:最佳路徑
270:第一次切音的結(jié)果
280:第二次切音的結(jié)果
310:漢語(yǔ)語(yǔ)音文件
320:辨識(shí)網(wǎng)絡(luò)
330:漢語(yǔ)聲學(xué)模型
340:混淆音設(shè)定檔
350:語(yǔ)音切割模塊
360:混淆音產(chǎn)生模塊
362:計(jì)算模塊
364:排名模塊
370:混淆音辨識(shí)網(wǎng)絡(luò)
380:路徑辨識(shí)模塊
385:語(yǔ)音矯正模塊
8著，進(jìn)行切割漢語(yǔ)語(yǔ)料(步驟120)，此步驟是利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)，通過(guò)辨識(shí)網(wǎng)絡(luò)辨識(shí)出一條最佳路徑，辨識(shí)網(wǎng)絡(luò)在起始時(shí)包含一條標(biāo)準(zhǔn)路徑，
此標(biāo)準(zhǔn)路徑為漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容，在此以例句qu-nian-xia-tian-re-si-le(去年夏天熱死了)說(shuō)明，如圖2A中的狀態(tài)210所示，此時(shí)辨識(shí)網(wǎng)絡(luò)內(nèi)的標(biāo)準(zhǔn)路徑是由qu nian xia tian re si le這七個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)所構(gòu)成，根據(jù)這些標(biāo)準(zhǔn)漢語(yǔ)音節(jié)切割漢語(yǔ)語(yǔ)料后可得知每個(gè)音節(jié)的起始時(shí)間及結(jié)束時(shí)間；再來(lái)，將切音后的每個(gè) 音節(jié)與411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)的漢語(yǔ)聲學(xué)模型比對(duì)(步驟130)，此方法是采用隱藏式馬可夫模型作為聲學(xué)模型，將每個(gè)音節(jié)與所有411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)比對(duì)后計(jì)算出對(duì)數(shù)機(jī)率，根據(jù)這些對(duì)數(shù)機(jī)率的高低將411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)排名，當(dāng)一個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)a的排名高于一個(gè)切音后的音節(jié)所應(yīng)對(duì)應(yīng)的標(biāo)準(zhǔn)漢語(yǔ)音節(jié)b時(shí)，標(biāo)準(zhǔn)漢語(yǔ)音節(jié)a即為混淆音，例如一個(gè)切音后的音節(jié)所應(yīng)對(duì)應(yīng)的標(biāo)準(zhǔn)漢語(yǔ)音節(jié) 為re(熱)，然而，le(樂(lè))的排名卻高于re(熱)時(shí)，即可得知學(xué)習(xí)者將re (熱)混淆為le(樂(lè))，找出混淆音le(樂(lè))；以此排名來(lái)判別是否有混淆音產(chǎn)生(步驟140); 接著，將混淆音加入辨識(shí)網(wǎng)絡(luò)(步驟150)，如圖2A中的狀態(tài)220所示，此時(shí)由于有混淆音le(樂(lè))的加入，辨識(shí)網(wǎng)絡(luò)內(nèi)多了另--條路徑；接著重復(fù)步驟120、 130、以及140，直到?jīng)]有混淆音產(chǎn)生為止，當(dāng)沒(méi)有混淆音產(chǎn)生時(shí)，停止并輸出所有之前產(chǎn)生的混淆音至混淆音設(shè)定檔(步驟160)。
由于有混淆音le(樂(lè))加入辨識(shí)網(wǎng)絡(luò)，再次重復(fù)步驟120進(jìn)行切音時(shí)，路徑為 qu-nian-xia-tian-le-si-le，切音的結(jié)果會(huì)更為精準(zhǔn)，此時(shí)因?yàn)榍幸艚Y(jié)果有所變動(dòng)，可能再產(chǎn)生其它的混淆音，需要將切音結(jié)果與漢語(yǔ)聲學(xué)模型再次比對(duì)以判別是否有新的混淆音產(chǎn)生。如圖2C所示，圖2C所示為依照本發(fā)明一較佳實(shí)施例的切音結(jié)果示意圖，狀態(tài)270為第一次切音的結(jié)果，狀態(tài)280為第二次切音的結(jié)果。
請(qǐng)參照?qǐng)D1B及圖2B，圖1B所示為依照本發(fā)明一較佳實(shí)施例的混淆音偵測(cè) 方法流程圖，圖2B所示為依照本發(fā)明一較佳實(shí)施例于混淆音偵測(cè)階段時(shí)的路徑示意圖。在偵測(cè)階段時(shí)，先輸入使用者念出的漢語(yǔ)語(yǔ)句(步驟170);通過(guò)混淆音辨識(shí)網(wǎng)絡(luò)，利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)對(duì)此漢語(yǔ)語(yǔ)句進(jìn)行校準(zhǔn)(步驟175)，混淆音辨識(shí)網(wǎng)絡(luò)是根據(jù)在產(chǎn)生階段輸出的混淆音設(shè)定檔所建立，涵蓋了外國(guó)人學(xué)習(xí)漢語(yǔ)時(shí)常見(jiàn)的混淆音，如圖2B中的狀態(tài)240所示， qu-nian-xia-tian-re-si-le(去年夏天熱死了)的混淆音辨識(shí)網(wǎng)絡(luò)包含混淆音niang、 tiang、以及l(fā)e;然后，得到漢語(yǔ)語(yǔ)句的最佳路徑(步驟180)，如圖2B中的狀態(tài)250所示，辨識(shí)出使用者念出漢語(yǔ)語(yǔ)句的路徑為qu-niang-xia-tiang-le-si-le;最后，
將最佳路徑與標(biāo)準(zhǔn)路徑作比較，找出錯(cuò)誤的發(fā)音，進(jìn)行即時(shí)語(yǔ)音矯正(步驟 185)，得知使用者在此例句中將nian發(fā)成niang、 tian發(fā)成tiang、 re發(fā)成le，并且
對(duì)漢語(yǔ)語(yǔ)句加以評(píng)分。
請(qǐng)參照?qǐng)D3A，圖3A所示為依照本發(fā)明一較佳實(shí)施例的混淆音產(chǎn)生系統(tǒng)的結(jié)構(gòu)示意圖?；煜舢a(chǎn)生系統(tǒng)包含漢語(yǔ)語(yǔ)音文件310，用以儲(chǔ)存漢語(yǔ)語(yǔ)料；辨識(shí)網(wǎng)絡(luò)320，用以辨識(shí)漢語(yǔ)語(yǔ)料；漢語(yǔ)聲學(xué)模型330，用以提供411個(gè)標(biāo)準(zhǔn)漢語(yǔ) 音節(jié)，采用隱藏式馬可夫模型；混淆音設(shè)定檔340，用以儲(chǔ)存所有產(chǎn)生的混淆音；語(yǔ)音切割模塊350;用以切割漢語(yǔ)語(yǔ)料；以及混淆音產(chǎn)生模塊360，用以產(chǎn) 生混淆音，包含計(jì)算模塊362及排名模塊364。
漢語(yǔ)語(yǔ)音文件310儲(chǔ)存了大量來(lái)自漢語(yǔ)學(xué)習(xí)者的語(yǔ)料，極佳地涵蓋了常用的漢語(yǔ)音節(jié)，從漢語(yǔ)語(yǔ)音文件310輸入漢語(yǔ)語(yǔ)料后，語(yǔ)音切割模塊350接著進(jìn)行語(yǔ)料切割，利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)，通過(guò)辨識(shí)網(wǎng)絡(luò)320辨識(shí)出最佳路徑，切割漢語(yǔ)語(yǔ)料，切音后可得知每個(gè)音節(jié)的起始時(shí)間及結(jié)束時(shí)間。辨識(shí)網(wǎng) 絡(luò)320在起始時(shí)包含一條標(biāo)準(zhǔn)路徑，此標(biāo)準(zhǔn)路徑為漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容。混淆音產(chǎn)生模塊360中，計(jì)算模塊362將切音后的每個(gè)音節(jié)與漢語(yǔ)聲學(xué)模型330 的411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)比對(duì)計(jì)算出對(duì)數(shù)機(jī)率后，排名模塊364根據(jù)對(duì)數(shù)機(jī)率的高低來(lái)排名標(biāo)準(zhǔn)漢語(yǔ)音節(jié)，當(dāng)一個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)a的排名高于一個(gè)切音后的音節(jié) 所應(yīng)對(duì)應(yīng)的標(biāo)準(zhǔn)漢語(yǔ)音節(jié)b時(shí)，標(biāo)準(zhǔn)漢語(yǔ)音節(jié)a即為混淆音，學(xué)習(xí)者將b混淆成a，如果有混淆音產(chǎn)生，將混淆音加入辨識(shí)網(wǎng)絡(luò)320，如果沒(méi)有混淆音產(chǎn)生，停止并輸出所有之前產(chǎn)生的混淆音至混淆音設(shè)定檔340。其中當(dāng)混淆音產(chǎn)生模塊360 有混淆音產(chǎn)生時(shí)，語(yǔ)音切割模塊350會(huì)通過(guò)辨識(shí)網(wǎng)絡(luò)320辨識(shí)出一條新的最佳路徑，再次切割漢語(yǔ)語(yǔ)料以得到新的切音結(jié)果，并將新的切音結(jié)果輸出至混淆音產(chǎn)生模塊360以判別是否有混淆音產(chǎn)生。
請(qǐng)參照?qǐng)D3B，圖3B所示為依照本發(fā)明一較佳實(shí)施例的混淆音偵測(cè)系統(tǒng)的結(jié)構(gòu)示意圖。偵測(cè)系統(tǒng)包含混淆音辨識(shí)網(wǎng)絡(luò)370，用以辨識(shí)使用者念出的漢語(yǔ) 語(yǔ)句；路徑辨識(shí)模塊380，用以決定漢語(yǔ)語(yǔ)句的最佳路徑；以及語(yǔ)音矯正模塊 385，用以進(jìn)行即時(shí)語(yǔ)音矯正。
產(chǎn)生階段完成時(shí)，會(huì)找出外國(guó)人學(xué)習(xí)漢語(yǔ)時(shí)常見(jiàn)的混淆音并輸出至混淆音設(shè)定檔，根據(jù)此混淆音設(shè)定檔建立混淆音辨識(shí)網(wǎng)絡(luò)370。輸入使用者念出的漢語(yǔ)語(yǔ)句后，路徑辨識(shí)模塊380通過(guò)混淆音辨識(shí)網(wǎng)絡(luò)370，利用維特比解碼算法中
的強(qiáng)迫校準(zhǔn)得到漢語(yǔ)語(yǔ)句的最佳路徑，語(yǔ)音矯正模塊385將最佳路徑與標(biāo)準(zhǔn)路
徑作比較后，找出錯(cuò)誤的發(fā)音，進(jìn)行即時(shí)語(yǔ)音矯正，并且對(duì)漢語(yǔ)語(yǔ)句加以評(píng)分。此實(shí)施例以迭代的方法來(lái)反復(fù)找出混淆音并加入辨識(shí)網(wǎng)絡(luò)，來(lái)逐次提高切音的正確性以及評(píng)分的客觀性。由上述本發(fā)明較佳實(shí)施例可知，應(yīng)用此產(chǎn)生及偵測(cè)漢語(yǔ)發(fā)音混淆音的方法及系統(tǒng)可以分析出使用者發(fā)音錯(cuò)誤的模式，指出使用者錯(cuò)誤之處，讓使用者知道哪個(gè)發(fā)音發(fā)的不夠準(zhǔn)確，還能進(jìn)一步提出發(fā)音指正，給予有效的矯正建議，增加使用者的學(xué)習(xí)效率。
當(dāng)然，本發(fā)明還可有其它多種實(shí)施例，在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下，熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明做出各種相應(yīng)的改變和變形，但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1. 一種混淆音產(chǎn)生及偵測(cè)方法，其特征在于，包含提供一產(chǎn)生階段，該產(chǎn)生階段包含a. 輸入一漢語(yǔ)語(yǔ)料；b. 利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)，通過(guò)一辨識(shí)網(wǎng)絡(luò)辨識(shí)出一最佳路徑，切割該漢語(yǔ)語(yǔ)料以得到一切音結(jié)果，其中該切音結(jié)果為多個(gè)音節(jié)；c. 將該切音結(jié)果與一漢語(yǔ)聲學(xué)模型比對(duì)，其中該漢語(yǔ)聲學(xué)模型包含多個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)；d. 判別是否有混淆音產(chǎn)生；e. 當(dāng)混淆音產(chǎn)生時(shí)，將混淆音加入該辨識(shí)網(wǎng)絡(luò)，重復(fù)步驟b、c、以及d；以及f. 當(dāng)沒(méi)有混淆音產(chǎn)生時(shí)，停止并輸出所有之前產(chǎn)生的混淆音至一混淆音設(shè)定檔；提供一偵測(cè)階段，該偵測(cè)階段包含g. 輸入一使用者念出的一漢語(yǔ)語(yǔ)句；h. 利用一混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn)，其中該混淆音辨識(shí)網(wǎng)絡(luò)根據(jù)該產(chǎn)生階段輸出的該混淆音設(shè)定檔所建立；i. 決定該漢語(yǔ)語(yǔ)句的最佳路徑；以及j. 比較該最佳路徑與該標(biāo)準(zhǔn)路徑，進(jìn)行即時(shí)語(yǔ)音矯正。
2. 根據(jù)權(quán)利要求l所述的混淆音產(chǎn)生及偵測(cè)方法，其特征在于，由該切音結(jié)果得知每一該音節(jié)的起始時(shí)間及結(jié)束時(shí)間。
3. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法，其特征在于，該漢語(yǔ) 聲學(xué)模型為隱藏式馬可夫模型。
4. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法，其特征在于，該漢語(yǔ) 聲學(xué)模型包含411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)。
5. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法，其特征在于，該辨識(shí) 網(wǎng)絡(luò)在起始時(shí)包含一標(biāo)準(zhǔn)路徑，該標(biāo)準(zhǔn)路徑為該漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容。
6. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法，其特征在于，該步驟 c包含音設(shè)定檔;將每一該音節(jié)與所有該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)比對(duì)以計(jì)算出多個(gè)對(duì)數(shù)機(jī)率；根據(jù)該對(duì)數(shù)機(jī)率的高低來(lái)排名該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)；以及當(dāng)存在一標(biāo)準(zhǔn)漢語(yǔ)音節(jié)，該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)的排名高于每一該音節(jié)所應(yīng)對(duì)應(yīng) 的標(biāo)準(zhǔn)漢語(yǔ)音節(jié)時(shí)，該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)即為混淆音。
7. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法，其特征在于，該方法以迭代的方法來(lái)反復(fù)找出混淆音并加入該辨識(shí)網(wǎng)絡(luò)，來(lái)逐次提高切咅的正確性以及評(píng)分的客觀性。
8. —種混淆音產(chǎn)生及偵測(cè)系統(tǒng)，其特征在于，包含一產(chǎn)生系統(tǒng)，包含一辨識(shí)網(wǎng)絡(luò)，用以辨識(shí)漢語(yǔ)語(yǔ)料；一漢語(yǔ)聲學(xué)模型，用以提供多個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)，其中該漢語(yǔ)聲學(xué)模型包含多個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)；一混淆音設(shè)定檔，用以儲(chǔ)存所有產(chǎn)生的混淆音；一語(yǔ)音切割模塊，輸入一漢語(yǔ)語(yǔ)料，利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)，通過(guò)該辨識(shí)網(wǎng)絡(luò)辨識(shí)出一最佳路徑，切割該漢語(yǔ)語(yǔ)料以得到一切音結(jié)果，其中該切音結(jié)果為多個(gè)音節(jié)；以及一混淆音產(chǎn)生模塊，將該切音結(jié)果與該漢語(yǔ)聲學(xué)模型比對(duì)以判別是否有混淆音產(chǎn)生，.當(dāng)混淆音產(chǎn)生時(shí)，將混淆音加入該辨識(shí)網(wǎng)絡(luò)，當(dāng)沒(méi)有混淆音產(chǎn)生時(shí)，停止并輸出所有之前產(chǎn)生的混淆音至該混淆音設(shè)定檔；其中當(dāng)該混淆音產(chǎn)生模塊有混淆音產(chǎn)生時(shí)，該語(yǔ)音切割模塊會(huì)通過(guò)該辨識(shí) 網(wǎng)絡(luò)辨識(shí)出一新的最佳路徑，再次切割該漢語(yǔ)語(yǔ)料以得到一新的切音結(jié)果，并將該新的切音結(jié)果輸出至該混淆音產(chǎn)生模塊以判別是否有混淆音產(chǎn)生；一偵測(cè)系統(tǒng)，包含一混淆音辨識(shí)網(wǎng)絡(luò)，用以辨識(shí)一使用者念出的一漢語(yǔ)語(yǔ)句，該混淆音辨識(shí) 網(wǎng)絡(luò)根據(jù)該產(chǎn)生階段輸出的該混淆音設(shè)定檔所建立；一路徑辨識(shí)模塊，利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)決定該漢語(yǔ)語(yǔ)句的最佳路徑；以及一語(yǔ)音矯正模塊，比較該最佳路徑與該標(biāo)準(zhǔn)路徑，進(jìn)行即時(shí)語(yǔ)音矯正。
9. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng)，其特征在于，由該切音結(jié)果得知每一該音節(jié)的起始時(shí)間及結(jié)束時(shí)間。
10. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng)，其特征在f，該漢語(yǔ) 聲學(xué)模型為隱藏式馬可夫模型。
11. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng)，其特征在于，該漢語(yǔ) 聲學(xué)模型包含411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)。
12. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng)，其特征在于，該辨識(shí) 網(wǎng)絡(luò)在起始時(shí)包含一標(biāo)準(zhǔn)路徑，該標(biāo)準(zhǔn)路徑為該漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容。
13. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng)，其特征在亍，該混淆音產(chǎn)生模塊包含一計(jì)算模塊，將每一該音節(jié)對(duì)所有該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)計(jì)算出多個(gè)對(duì)數(shù)機(jī)率；以及一排名模塊，根據(jù)該對(duì)數(shù)機(jī)率的高低來(lái)排名該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)，當(dāng)存在--標(biāo) 準(zhǔn)漢語(yǔ)音節(jié)，該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)的排名高于每一該音節(jié)所應(yīng)對(duì)應(yīng)的標(biāo)準(zhǔn)漢語(yǔ)音節(jié) 時(shí)，該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)即為混淆音。
14. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng)，其特征在于，該系統(tǒng) 以迭代的方法來(lái)反復(fù)找出混淆音并加入該辨識(shí)網(wǎng)絡(luò)，來(lái)逐次提高切音的正確性以及評(píng)分的客觀性。
15. —種記錄媒體，其記錄一電腦可讀取程序，該程序使得一電腦執(zhí)行混淆音產(chǎn)生及偵測(cè)，其特征在于，該程序包含提供-產(chǎn)生階段，該產(chǎn)生階段包含a. 輸入一漢語(yǔ)語(yǔ)料；b. 利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)，通過(guò)一辨識(shí)網(wǎng)絡(luò)辨識(shí)出一最佳路徑，切割該漢語(yǔ)語(yǔ)料以得到一切音結(jié)果，其中該切音結(jié)果為多個(gè)音節(jié)；c. 將該切音結(jié)果與一漢語(yǔ)聲學(xué)模型比對(duì)，其中該漢語(yǔ)聲學(xué)模型包含多個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)；d. 判別是否有混淆音產(chǎn)生；e. 當(dāng)混淆音產(chǎn)生時(shí)，將混淆音加入該辨識(shí)網(wǎng)絡(luò)，重復(fù)步驟b、 c、以及d;以及f. 當(dāng)沒(méi)有混淆音產(chǎn)生時(shí)，停止并輸出所有之前產(chǎn)生的混淆音至一混淆音設(shè)定檔；提供一偵測(cè)階段，該偵測(cè)階段包含g. 輸入一使用者念出的一漢語(yǔ)語(yǔ)句；h. 利用一混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn)，其中該混淆音辨識(shí)網(wǎng)絡(luò)根據(jù)該產(chǎn) 生階段輸出的該混淆音設(shè)定檔所建立；i. 決定該漢語(yǔ)語(yǔ)句的最佳路徑；以及 j.比較該最佳路徑與該標(biāo)準(zhǔn)路徑，進(jìn)行即時(shí)語(yǔ)音矯正。
16. 根據(jù)權(quán)利要求15所述的記錄媒體，其特征在于，由該切音結(jié)果得知每一該音節(jié)的起始時(shí)間及結(jié)束時(shí)間。
17. 根據(jù)權(quán)利要求15所述的記錄媒體，其特征在于，該漢語(yǔ)聲學(xué)模型為隱藏式馬可夫模型。
18. 根據(jù)權(quán)利要求15所述的記錄媒體，其中該漢語(yǔ)聲學(xué)模型包含411個(gè) 標(biāo)準(zhǔn)漢語(yǔ)音節(jié)。
19. 根據(jù)權(quán)利要求15所述的記錄媒休，其特征在于，該辨識(shí)網(wǎng)絡(luò)在起始時(shí)包含一標(biāo)準(zhǔn)路徑，該標(biāo)準(zhǔn)路徑為該漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容。
20. 根據(jù)權(quán)利要求15所述的記錄媒體，其特征在于，該步驟c包含將每一該音節(jié)與所有該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)比對(duì)以計(jì)算出多個(gè)對(duì)數(shù)機(jī)率；根據(jù)該對(duì)數(shù)機(jī)率的高低來(lái)排名該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)；以及當(dāng)存在一標(biāo)準(zhǔn)漢語(yǔ)音節(jié)，該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)的排名高于每-，該音節(jié)所應(yīng)對(duì)應(yīng) 的標(biāo)準(zhǔn)漢語(yǔ)音節(jié)時(shí)，該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)即為混淆音。
21. 根據(jù)權(quán)利要求15所述的記錄媒體，其特征在于，該方法以迭代的方法來(lái)反復(fù)找出混淆音并加入該辨識(shí)網(wǎng)絡(luò)，來(lái)逐次提高切音的正確性以及評(píng)分的客觀性。
全文摘要
一種混淆音產(chǎn)生及偵測(cè)方法，包含產(chǎn)生階段及偵測(cè)階段，產(chǎn)生階段包含a.輸入漢語(yǔ)語(yǔ)料；b.利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)，切割漢語(yǔ)語(yǔ)料；c.將切音結(jié)果與漢語(yǔ)聲學(xué)模型比對(duì)；d.判別是否有混淆音產(chǎn)生；e.當(dāng)混淆音產(chǎn)生時(shí)，將混淆音加入辨識(shí)網(wǎng)絡(luò)，重復(fù)步驟b、c、d；以及f.當(dāng)沒(méi)有混淆音產(chǎn)生時(shí)，停止并輸出所有之前產(chǎn)生的混淆音至混淆音設(shè)定檔。偵測(cè)階段包含g.輸入使用者念出的漢語(yǔ)語(yǔ)句；h.利用混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn)；i.決定漢語(yǔ)語(yǔ)句的最佳路徑；以及j.比較最佳路徑與標(biāo)準(zhǔn)路徑，進(jìn)行即時(shí)語(yǔ)音矯正。
文檔編號(hào)G10L15/00GK101458927SQ20071019852
公開(kāi)日2009年6月17日申請(qǐng)日期2007年12月11日優(yōu)先權(quán)日2007年12月11日
發(fā)明者張智星, 林正豪, 王派斌, 陳江村申請(qǐng)人:財(cái)團(tuán)法人資訊工業(yè)策進(jìn)會(huì)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張智星;王派斌;陳江村;林正豪
技術(shù)所有人：財(cái)團(tuán)法人資訊工業(yè)策進(jìn)會(huì)
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

產(chǎn)生及偵測(cè)混淆音的方法及系統(tǒng)的制作方法