亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

產(chǎn)生及偵測(cè)混淆音的方法及系統(tǒng)的制作方法

文檔序號(hào):2837539閱讀:252來(lái)源:國(guó)知局
專利名稱:產(chǎn)生及偵測(cè)混淆音的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明是有關(guān)于一種產(chǎn)生及偵測(cè)混淆音的方法及系統(tǒng),且特別是有關(guān)于-一種產(chǎn)生及偵測(cè)漢語(yǔ)發(fā)音混淆音的方法及系統(tǒng)。
背景技術(shù)
由于近年來(lái)電腦計(jì)算能力的提升以及語(yǔ)音辨識(shí)技術(shù)的進(jìn)步,語(yǔ)音處理在我們?nèi)粘I钌系膽?yīng)用與日俱增,在語(yǔ)言學(xué)習(xí)方面,以電腦輔助使用者進(jìn)行非母語(yǔ)學(xué)習(xí)已受到相當(dāng)重視,各方也紛紛投入相關(guān)的研究。
語(yǔ)言的學(xué)習(xí)大致上可以分為聽(tīng)、說(shuō)、讀、寫這四大部分,在漢語(yǔ)口說(shuō)能力的訓(xùn)練方面,沒(méi)有一個(gè)很好的解決方案來(lái)幫助漢語(yǔ)學(xué)習(xí)者自我練習(xí)與評(píng)量,目前在漢語(yǔ)學(xué)習(xí)軟件市場(chǎng)上提供的輔助發(fā)音會(huì)話學(xué)習(xí)方面,經(jīng)過(guò)切音、系統(tǒng)分析、以及算法等數(shù)據(jù)處理后,只能做到語(yǔ)音評(píng)分,讓使用者知道哪個(gè)單字發(fā)音發(fā)的不夠準(zhǔn)確,但是無(wú)法對(duì)使用者的發(fā)音進(jìn)一歩提出分析或指正,也無(wú)法根據(jù)不同語(yǔ)言或國(guó)家的使用者的特性給予有效的矯正建議,實(shí)用性不大,所能提供的實(shí)質(zhì)幫助有限。
因此,需要一種產(chǎn)生及偵測(cè)發(fā)音錯(cuò)誤模型的方法及系統(tǒng)來(lái)改善上述問(wèn)題。

發(fā)明內(nèi)容
因此本發(fā)明的目的就是在提供一種產(chǎn)生及偵測(cè)混淆音的方法及系統(tǒng),此方法及系統(tǒng)可以分析出使用者發(fā)音錯(cuò)誤的模式,指出使用者錯(cuò)誤之處,讓使用者知道哪個(gè)發(fā)音發(fā)的不夠準(zhǔn)確,還能進(jìn)一步提出發(fā)音指正,給予有效的矯正建議,增加使用者的學(xué)習(xí)效率。
根據(jù)本發(fā)明的上述目的,提出一種產(chǎn)生及偵測(cè)混淆音的方法。依照本發(fā)明一較佳實(shí)施例,此產(chǎn)生及偵測(cè)混淆音的方法包含產(chǎn)生階段及偵測(cè)階段,產(chǎn)生階
段包含a.輸入漢語(yǔ)語(yǔ)料;b.利用維特比解碼算法(ViterbiDecoding)中的強(qiáng)迫校準(zhǔn)(Forced Alignment),切割漢語(yǔ)語(yǔ)料;c.將切音結(jié)果與漢語(yǔ)聲學(xué)模型比對(duì);d.
6判別是否有混淆音產(chǎn)生;e.當(dāng)混淆音產(chǎn)生時(shí),將混淆音加入辨識(shí)網(wǎng)絡(luò),重復(fù)步
驟b、 C、以及d;以及f.當(dāng)沒(méi)有混淆音產(chǎn)生時(shí),停止并輸出所有之前產(chǎn)生的混淆音至混淆音設(shè)定檔。偵測(cè)階段包含g.輸入使用者念出的漢語(yǔ)語(yǔ)句;h.利用混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn);i.決定漢語(yǔ)語(yǔ)句的最佳路徑;以及J.比較最佳路徑與標(biāo)準(zhǔn)路徑,進(jìn)行即時(shí)語(yǔ)音矯正。
根據(jù)本發(fā)明的上述目的,提出一種產(chǎn)生及偵測(cè)混淆音的系統(tǒng)。依照本發(fā)明一較佳實(shí)施例,此產(chǎn)生及偵測(cè)混淆音的系統(tǒng)包含產(chǎn)生系統(tǒng)及偵測(cè)系統(tǒng),產(chǎn)生系統(tǒng)包含辨識(shí)網(wǎng)絡(luò),用以辨識(shí)漢語(yǔ)語(yǔ)料;漢語(yǔ)聲學(xué)模型,用以提供411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié);混淆音設(shè)定檔,用以儲(chǔ)存所有產(chǎn)生的混淆音;語(yǔ)音切割模塊,輸入漢語(yǔ)語(yǔ)料,利用維特比解碼算法中的強(qiáng)迫校準(zhǔn),通過(guò)辨識(shí)網(wǎng)絡(luò)辨識(shí)出最佳路徑,切割漢語(yǔ)語(yǔ)料以得到切音結(jié)果;以及混淆音產(chǎn)生模塊,將切音結(jié)果與漢語(yǔ)聲學(xué)模型比對(duì)以判別是否有混淆音產(chǎn)生,當(dāng)混淆音產(chǎn)生時(shí),將混淆音加入辨識(shí)網(wǎng)絡(luò),當(dāng)沒(méi)有混淆音產(chǎn)生時(shí),停止并輸出所有之前產(chǎn)生的混淆音至混淆富-設(shè)定檔;其中當(dāng)混淆音產(chǎn)生模塊有混淆音產(chǎn)生時(shí),語(yǔ)音切割模塊會(huì)通過(guò)辨識(shí)網(wǎng)絡(luò)辨識(shí)出一條新的最佳路徑,再次切割漢語(yǔ)語(yǔ)料以得到新的切音結(jié)果,并將新的切音結(jié)果輸出至混淆音產(chǎn)生模塊。
偵測(cè)系統(tǒng)包含混淆音辨識(shí)網(wǎng)絡(luò),用以辨識(shí)使用者念出的漢語(yǔ)語(yǔ)句,混淆音辨識(shí)網(wǎng)絡(luò)根據(jù)產(chǎn)生階段輸出的混淆音設(shè)定檔所建立;路徑辨識(shí)模塊,利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)決定漢語(yǔ)語(yǔ)句的最佳路徑;以及語(yǔ)音矯正模塊,比較最佳路徑與標(biāo)準(zhǔn)路徑,進(jìn)行即時(shí)語(yǔ)音矯正。
本發(fā)明以迭代(Iteration)的方法來(lái)反復(fù)找出混淆音并加入辨識(shí)網(wǎng)絡(luò),來(lái)逐次提高切音的正確性以及評(píng)分的客觀性。應(yīng)用本發(fā)明可以分析出使用者發(fā)音錯(cuò)誤的模式,指出使用者錯(cuò)誤之處,讓使用者知道哪個(gè)發(fā)音發(fā)的不夠準(zhǔn)確,還能進(jìn)一步提出發(fā)音指正,給予有效的矯正建議,增加使用者的學(xué)習(xí)效率。


為使本發(fā)明的上述和其它目的、特征、優(yōu)點(diǎn)與實(shí)施例能更明顯易懂,所附附圖的詳細(xì)說(shuō)明如下
圖1A所示為依照本發(fā)明一較佳實(shí)施例的混淆音產(chǎn)生方法流程圖;圖1B所示為依照本發(fā)明一較佳實(shí)施例的混淆音偵測(cè)方法流程圖;圖2A所示為依照本發(fā)明一較佳實(shí)施例于混淆音產(chǎn)生階段時(shí)的辨識(shí)網(wǎng)絡(luò)示
意圖2B所示為依照本發(fā)明一較佳實(shí)施例于混淆音偵測(cè)階段時(shí)的路徑示意
圖2C所示為依照本發(fā)明一較佳實(shí)施例的切音結(jié)果示意圖;圖3A所示為依照本發(fā)明一較佳實(shí)施例的混淆音產(chǎn)生系統(tǒng)的結(jié)構(gòu)示意圖;圖3B所示為依照本發(fā)明一較佳實(shí)施例的混淆音偵測(cè)系統(tǒng)的結(jié)構(gòu)示意圖。其中,附圖標(biāo)記10:輸入漢語(yǔ)語(yǔ)料
120:利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)
切割漢語(yǔ)語(yǔ)料
130:將切音結(jié)果與漢語(yǔ)聲學(xué)模型比對(duì)140:判別是否有混淆音產(chǎn)生150:將混淆音加入辨識(shí)網(wǎng)絡(luò)160:停止并輸出所有之前產(chǎn)生的混淆音170:輸入漢語(yǔ)語(yǔ)句175:利用混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn)180:決定漢語(yǔ)語(yǔ)句的最佳路徑185:進(jìn)行即時(shí)語(yǔ)音矯正210:起始時(shí)的辨識(shí)網(wǎng)絡(luò)220:加入混淆音的辨識(shí)網(wǎng)絡(luò)
具體實(shí)施例方式
此產(chǎn)生及偵測(cè)混淆音的方法可分成產(chǎn)生階段及偵測(cè)階段來(lái)進(jìn)行。請(qǐng)參照?qǐng)D
1A及圖2A,圖1A所示為依照本發(fā)明一較佳實(shí)施例的混淆音產(chǎn)生方法流程圖,圖2A所示為依照本發(fā)明一較佳實(shí)施例在混淆音產(chǎn)生階段時(shí)的辨識(shí)網(wǎng)絡(luò)示意圖。在產(chǎn)生階段時(shí),可從漢語(yǔ)語(yǔ)音文件或麥克風(fēng)輸入漢語(yǔ)語(yǔ)料(步驟110);接
240:混淆音辨識(shí)網(wǎng)絡(luò)
250:最佳路徑
270:第一次切音的結(jié)果
280:第二次切音的結(jié)果
310:漢語(yǔ)語(yǔ)音文件
320:辨識(shí)網(wǎng)絡(luò)
330:漢語(yǔ)聲學(xué)模型
340:混淆音設(shè)定檔
350:語(yǔ)音切割模塊
360:混淆音產(chǎn)生模塊
362:計(jì)算模塊
364:排名模塊
370:混淆音辨識(shí)網(wǎng)絡(luò)
380:路徑辨識(shí)模塊
385:語(yǔ)音矯正模塊
8著,進(jìn)行切割漢語(yǔ)語(yǔ)料(步驟120),此步驟是利用維特比解碼算法中的強(qiáng)迫校 準(zhǔn),通過(guò)辨識(shí)網(wǎng)絡(luò)辨識(shí)出一條最佳路徑,辨識(shí)網(wǎng)絡(luò)在起始時(shí)包含一條標(biāo)準(zhǔn)路徑,
此標(biāo)準(zhǔn)路徑為漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容,在此以例句qu-nian-xia-tian-re-si-le(去 年夏天熱死了)說(shuō)明,如圖2A中的狀態(tài)210所示,此時(shí)辨識(shí)網(wǎng)絡(luò)內(nèi)的標(biāo)準(zhǔn)路徑是 由qu nian xia tian re si le這七個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)所構(gòu)成,根據(jù)這些標(biāo)準(zhǔn)漢語(yǔ)音節(jié)切 割漢語(yǔ)語(yǔ)料后可得知每個(gè)音節(jié)的起始時(shí)間及結(jié)束時(shí)間;再來(lái),將切音后的每個(gè) 音節(jié)與411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)的漢語(yǔ)聲學(xué)模型比對(duì)(步驟130),此方法是采用隱 藏式馬可夫模型作為聲學(xué)模型,將每個(gè)音節(jié)與所有411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)比對(duì)后 計(jì)算出對(duì)數(shù)機(jī)率,根據(jù)這些對(duì)數(shù)機(jī)率的高低將411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)排名,當(dāng)一 個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)a的排名高于一個(gè)切音后的音節(jié)所應(yīng)對(duì)應(yīng)的標(biāo)準(zhǔn)漢語(yǔ)音節(jié)b時(shí), 標(biāo)準(zhǔn)漢語(yǔ)音節(jié)a即為混淆音,例如一個(gè)切音后的音節(jié)所應(yīng)對(duì)應(yīng)的標(biāo)準(zhǔn)漢語(yǔ)音節(jié) 為re(熱),然而,le(樂(lè))的排名卻高于re(熱)時(shí),即可得知學(xué)習(xí)者將re (熱)混淆 為le(樂(lè)),找出混淆音le(樂(lè));以此排名來(lái)判別是否有混淆音產(chǎn)生(步驟140); 接著,將混淆音加入辨識(shí)網(wǎng)絡(luò)(步驟150),如圖2A中的狀態(tài)220所示,此時(shí)由 于有混淆音le(樂(lè))的加入,辨識(shí)網(wǎng)絡(luò)內(nèi)多了另--條路徑;接著重復(fù)步驟120、 130、 以及140,直到?jīng)]有混淆音產(chǎn)生為止,當(dāng)沒(méi)有混淆音產(chǎn)生時(shí),停止并輸出所有 之前產(chǎn)生的混淆音至混淆音設(shè)定檔(步驟160)。
由于有混淆音le(樂(lè))加入辨識(shí)網(wǎng)絡(luò),再次重復(fù)步驟120進(jìn)行切音時(shí),路徑為 qu-nian-xia-tian-le-si-le,切音的結(jié)果會(huì)更為精準(zhǔn),此時(shí)因?yàn)榍幸艚Y(jié)果有所變動(dòng), 可能再產(chǎn)生其它的混淆音,需要將切音結(jié)果與漢語(yǔ)聲學(xué)模型再次比對(duì)以判別是 否有新的混淆音產(chǎn)生。如圖2C所示,圖2C所示為依照本發(fā)明一較佳實(shí)施例的 切音結(jié)果示意圖,狀態(tài)270為第一次切音的結(jié)果,狀態(tài)280為第二次切音的結(jié)果。
請(qǐng)參照?qǐng)D1B及圖2B,圖1B所示為依照本發(fā)明一較佳實(shí)施例的混淆音偵測(cè) 方法流程圖,圖2B所示為依照本發(fā)明一較佳實(shí)施例于混淆音偵測(cè)階段時(shí)的路 徑示意圖。在偵測(cè)階段時(shí),先輸入使用者念出的漢語(yǔ)語(yǔ)句(步驟170);通過(guò)混 淆音辨識(shí)網(wǎng)絡(luò),利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)對(duì)此漢語(yǔ)語(yǔ)句進(jìn)行校準(zhǔn)(步 驟175),混淆音辨識(shí)網(wǎng)絡(luò)是根據(jù)在產(chǎn)生階段輸出的混淆音設(shè)定檔所建立,涵 蓋了外國(guó)人學(xué)習(xí)漢語(yǔ)時(shí)常見(jiàn)的混淆音,如圖2B中的狀態(tài)240所示, qu-nian-xia-tian-re-si-le(去年夏天熱死了)的混淆音辨識(shí)網(wǎng)絡(luò)包含混淆音niang、 tiang、以及l(fā)e;然后,得到漢語(yǔ)語(yǔ)句的最佳路徑(步驟180),如圖2B中的狀態(tài)250所示,辨識(shí)出使用者念出漢語(yǔ)語(yǔ)句的路徑為qu-niang-xia-tiang-le-si-le;最后,
將最佳路徑與標(biāo)準(zhǔn)路徑作比較,找出錯(cuò)誤的發(fā)音,進(jìn)行即時(shí)語(yǔ)音矯正(步驟 185),得知使用者在此例句中將nian發(fā)成niang、 tian發(fā)成tiang、 re發(fā)成le,并且
對(duì)漢語(yǔ)語(yǔ)句加以評(píng)分。
請(qǐng)參照?qǐng)D3A,圖3A所示為依照本發(fā)明一較佳實(shí)施例的混淆音產(chǎn)生系統(tǒng)的 結(jié)構(gòu)示意圖?;煜舢a(chǎn)生系統(tǒng)包含漢語(yǔ)語(yǔ)音文件310,用以儲(chǔ)存漢語(yǔ)語(yǔ)料;辨 識(shí)網(wǎng)絡(luò)320,用以辨識(shí)漢語(yǔ)語(yǔ)料;漢語(yǔ)聲學(xué)模型330,用以提供411個(gè)標(biāo)準(zhǔn)漢語(yǔ) 音節(jié),采用隱藏式馬可夫模型;混淆音設(shè)定檔340,用以儲(chǔ)存所有產(chǎn)生的混淆 音;語(yǔ)音切割模塊350;用以切割漢語(yǔ)語(yǔ)料;以及混淆音產(chǎn)生模塊360,用以產(chǎn) 生混淆音,包含計(jì)算模塊362及排名模塊364。
漢語(yǔ)語(yǔ)音文件310儲(chǔ)存了大量來(lái)自漢語(yǔ)學(xué)習(xí)者的語(yǔ)料,極佳地涵蓋了常用 的漢語(yǔ)音節(jié),從漢語(yǔ)語(yǔ)音文件310輸入漢語(yǔ)語(yǔ)料后,語(yǔ)音切割模塊350接著進(jìn)行 語(yǔ)料切割,利用維特比解碼算法中的強(qiáng)迫校準(zhǔn),通過(guò)辨識(shí)網(wǎng)絡(luò)320辨識(shí)出最佳 路徑,切割漢語(yǔ)語(yǔ)料,切音后可得知每個(gè)音節(jié)的起始時(shí)間及結(jié)束時(shí)間。辨識(shí)網(wǎng) 絡(luò)320在起始時(shí)包含一條標(biāo)準(zhǔn)路徑,此標(biāo)準(zhǔn)路徑為漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容。 混淆音產(chǎn)生模塊360中,計(jì)算模塊362將切音后的每個(gè)音節(jié)與漢語(yǔ)聲學(xué)模型330 的411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)比對(duì)計(jì)算出對(duì)數(shù)機(jī)率后,排名模塊364根據(jù)對(duì)數(shù)機(jī)率的高 低來(lái)排名標(biāo)準(zhǔn)漢語(yǔ)音節(jié),當(dāng)一個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)a的排名高于一個(gè)切音后的音節(jié) 所應(yīng)對(duì)應(yīng)的標(biāo)準(zhǔn)漢語(yǔ)音節(jié)b時(shí),標(biāo)準(zhǔn)漢語(yǔ)音節(jié)a即為混淆音,學(xué)習(xí)者將b混淆成a, 如果有混淆音產(chǎn)生,將混淆音加入辨識(shí)網(wǎng)絡(luò)320,如果沒(méi)有混淆音產(chǎn)生,停止 并輸出所有之前產(chǎn)生的混淆音至混淆音設(shè)定檔340。其中當(dāng)混淆音產(chǎn)生模塊360 有混淆音產(chǎn)生時(shí),語(yǔ)音切割模塊350會(huì)通過(guò)辨識(shí)網(wǎng)絡(luò)320辨識(shí)出一條新的最佳路 徑,再次切割漢語(yǔ)語(yǔ)料以得到新的切音結(jié)果,并將新的切音結(jié)果輸出至混淆音 產(chǎn)生模塊360以判別是否有混淆音產(chǎn)生。
請(qǐng)參照?qǐng)D3B,圖3B所示為依照本發(fā)明一較佳實(shí)施例的混淆音偵測(cè)系統(tǒng)的 結(jié)構(gòu)示意圖。偵測(cè)系統(tǒng)包含混淆音辨識(shí)網(wǎng)絡(luò)370,用以辨識(shí)使用者念出的漢語(yǔ) 語(yǔ)句;路徑辨識(shí)模塊380,用以決定漢語(yǔ)語(yǔ)句的最佳路徑;以及語(yǔ)音矯正模塊 385,用以進(jìn)行即時(shí)語(yǔ)音矯正。
產(chǎn)生階段完成時(shí),會(huì)找出外國(guó)人學(xué)習(xí)漢語(yǔ)時(shí)常見(jiàn)的混淆音并輸出至混淆音 設(shè)定檔,根據(jù)此混淆音設(shè)定檔建立混淆音辨識(shí)網(wǎng)絡(luò)370。輸入使用者念出的漢語(yǔ)語(yǔ)句后,路徑辨識(shí)模塊380通過(guò)混淆音辨識(shí)網(wǎng)絡(luò)370,利用維特比解碼算法中
的強(qiáng)迫校準(zhǔn)得到漢語(yǔ)語(yǔ)句的最佳路徑,語(yǔ)音矯正模塊385將最佳路徑與標(biāo)準(zhǔn)路
徑作比較后,找出錯(cuò)誤的發(fā)音,進(jìn)行即時(shí)語(yǔ)音矯正,并且對(duì)漢語(yǔ)語(yǔ)句加以評(píng)分。 此實(shí)施例以迭代的方法來(lái)反復(fù)找出混淆音并加入辨識(shí)網(wǎng)絡(luò),來(lái)逐次提高切 音的正確性以及評(píng)分的客觀性。由上述本發(fā)明較佳實(shí)施例可知,應(yīng)用此產(chǎn)生及 偵測(cè)漢語(yǔ)發(fā)音混淆音的方法及系統(tǒng)可以分析出使用者發(fā)音錯(cuò)誤的模式,指出使 用者錯(cuò)誤之處,讓使用者知道哪個(gè)發(fā)音發(fā)的不夠準(zhǔn)確,還能進(jìn)一步提出發(fā)音指 正,給予有效的矯正建議,增加使用者的學(xué)習(xí)效率。
當(dāng)然,本發(fā)明還可有其它多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情 況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明做出各種相應(yīng)的改變和變形,但 這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1. 一種混淆音產(chǎn)生及偵測(cè)方法,其特征在于,包含提供一產(chǎn)生階段,該產(chǎn)生階段包含a. 輸入一漢語(yǔ)語(yǔ)料;b. 利用維特比解碼算法中的強(qiáng)迫校準(zhǔn),通過(guò)一辨識(shí)網(wǎng)絡(luò)辨識(shí)出一最佳路徑,切割該漢語(yǔ)語(yǔ)料以得到一切音結(jié)果,其中該切音結(jié)果為多個(gè)音節(jié);c. 將該切音結(jié)果與一漢語(yǔ)聲學(xué)模型比對(duì),其中該漢語(yǔ)聲學(xué)模型包含多個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié);d. 判別是否有混淆音產(chǎn)生;e. 當(dāng)混淆音產(chǎn)生時(shí),將混淆音加入該辨識(shí)網(wǎng)絡(luò),重復(fù)步驟b、c、以及d;以及f. 當(dāng)沒(méi)有混淆音產(chǎn)生時(shí),停止并輸出所有之前產(chǎn)生的混淆音至一混淆音設(shè)定檔;提供一偵測(cè)階段,該偵測(cè)階段包含g. 輸入一使用者念出的一漢語(yǔ)語(yǔ)句;h. 利用一混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn),其中該混淆音辨識(shí)網(wǎng)絡(luò)根據(jù)該產(chǎn)生階段輸出的該混淆音設(shè)定檔所建立;i. 決定該漢語(yǔ)語(yǔ)句的最佳路徑;以及j. 比較該最佳路徑與該標(biāo)準(zhǔn)路徑,進(jìn)行即時(shí)語(yǔ)音矯正。
2. 根據(jù)權(quán)利要求l所述的混淆音產(chǎn)生及偵測(cè)方法,其特征在于,由該切 音結(jié)果得知每一該音節(jié)的起始時(shí)間及結(jié)束時(shí)間。
3. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法,其特征在于,該漢語(yǔ) 聲學(xué)模型為隱藏式馬可夫模型。
4. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法,其特征在于,該漢語(yǔ) 聲學(xué)模型包含411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)。
5. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法,其特征在于,該辨識(shí) 網(wǎng)絡(luò)在起始時(shí)包含一標(biāo)準(zhǔn)路徑,該標(biāo)準(zhǔn)路徑為該漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容。
6. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法,其特征在于,該步驟 c包含音設(shè)定檔;將每一該音節(jié)與所有該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)比對(duì)以計(jì)算出多個(gè)對(duì)數(shù)機(jī)率; 根據(jù)該對(duì)數(shù)機(jī)率的高低來(lái)排名該標(biāo)準(zhǔn)漢語(yǔ)音節(jié);以及當(dāng)存在一標(biāo)準(zhǔn)漢語(yǔ)音節(jié),該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)的排名高于每一該音節(jié)所應(yīng)對(duì)應(yīng) 的標(biāo)準(zhǔn)漢語(yǔ)音節(jié)時(shí),該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)即為混淆音。
7. 根據(jù)權(quán)利要求1所述的混淆音產(chǎn)生及偵測(cè)方法,其特征在于,該方法 以迭代的方法來(lái)反復(fù)找出混淆音并加入該辨識(shí)網(wǎng)絡(luò),來(lái)逐次提高切咅的正確性 以及評(píng)分的客觀性。
8. —種混淆音產(chǎn)生及偵測(cè)系統(tǒng),其特征在于,包含 一產(chǎn)生系統(tǒng),包含一辨識(shí)網(wǎng)絡(luò),用以辨識(shí)漢語(yǔ)語(yǔ)料;一漢語(yǔ)聲學(xué)模型,用以提供多個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié),其中該漢語(yǔ)聲學(xué)模型包含 多個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié);一混淆音設(shè)定檔,用以儲(chǔ)存所有產(chǎn)生的混淆音;一語(yǔ)音切割模塊,輸入一漢語(yǔ)語(yǔ)料,利用維特比解碼算法中的強(qiáng)迫校準(zhǔn), 通過(guò)該辨識(shí)網(wǎng)絡(luò)辨識(shí)出一最佳路徑,切割該漢語(yǔ)語(yǔ)料以得到一切音結(jié)果,其中 該切音結(jié)果為多個(gè)音節(jié);以及一混淆音產(chǎn)生模塊,將該切音結(jié)果與該漢語(yǔ)聲學(xué)模型比對(duì)以判別是否有混 淆音產(chǎn)生,.當(dāng)混淆音產(chǎn)生時(shí),將混淆音加入該辨識(shí)網(wǎng)絡(luò),當(dāng)沒(méi)有混淆音產(chǎn)生時(shí), 停止并輸出所有之前產(chǎn)生的混淆音至該混淆音設(shè)定檔;其中當(dāng)該混淆音產(chǎn)生模塊有混淆音產(chǎn)生時(shí),該語(yǔ)音切割模塊會(huì)通過(guò)該辨識(shí) 網(wǎng)絡(luò)辨識(shí)出一新的最佳路徑,再次切割該漢語(yǔ)語(yǔ)料以得到一新的切音結(jié)果,并 將該新的切音結(jié)果輸出至該混淆音產(chǎn)生模塊以判別是否有混淆音產(chǎn)生;一偵測(cè)系統(tǒng),包含一混淆音辨識(shí)網(wǎng)絡(luò),用以辨識(shí)一使用者念出的一漢語(yǔ)語(yǔ)句,該混淆音辨識(shí) 網(wǎng)絡(luò)根據(jù)該產(chǎn)生階段輸出的該混淆音設(shè)定檔所建立;一路徑辨識(shí)模塊,利用維特比解碼算法中的強(qiáng)迫校準(zhǔn)決定該漢語(yǔ)語(yǔ)句的最 佳路徑;以及一語(yǔ)音矯正模塊,比較該最佳路徑與該標(biāo)準(zhǔn)路徑,進(jìn)行即時(shí)語(yǔ)音矯正。
9. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng),其特征在于,由該切 音結(jié)果得知每一該音節(jié)的起始時(shí)間及結(jié)束時(shí)間。
10. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng),其特征在f,該漢語(yǔ) 聲學(xué)模型為隱藏式馬可夫模型。
11. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng),其特征在于,該漢語(yǔ) 聲學(xué)模型包含411個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié)。
12. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng),其特征在于,該辨識(shí) 網(wǎng)絡(luò)在起始時(shí)包含一標(biāo)準(zhǔn)路徑,該標(biāo)準(zhǔn)路徑為該漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容。
13. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng),其特征在亍,該混淆 音產(chǎn)生模塊包含一計(jì)算模塊,將每一該音節(jié)對(duì)所有該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)計(jì)算出多個(gè)對(duì)數(shù)機(jī)率;以及一排名模塊,根據(jù)該對(duì)數(shù)機(jī)率的高低來(lái)排名該標(biāo)準(zhǔn)漢語(yǔ)音節(jié),當(dāng)存在--標(biāo) 準(zhǔn)漢語(yǔ)音節(jié),該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)的排名高于每一該音節(jié)所應(yīng)對(duì)應(yīng)的標(biāo)準(zhǔn)漢語(yǔ)音節(jié) 時(shí),該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)即為混淆音。
14. 根據(jù)權(quán)利要求8所述的混淆音產(chǎn)生及偵測(cè)系統(tǒng),其特征在于,該系統(tǒng) 以迭代的方法來(lái)反復(fù)找出混淆音并加入該辨識(shí)網(wǎng)絡(luò),來(lái)逐次提高切音的正確性 以及評(píng)分的客觀性。
15. —種記錄媒體,其記錄一電腦可讀取程序,該程序使得一電腦執(zhí)行混 淆音產(chǎn)生及偵測(cè),其特征在于,該程序包含提供-產(chǎn)生階段,該產(chǎn)生階段包含a. 輸入一漢語(yǔ)語(yǔ)料;b. 利用維特比解碼算法中的強(qiáng)迫校準(zhǔn),通過(guò)一辨識(shí)網(wǎng)絡(luò)辨識(shí)出一最佳路徑,切割該漢語(yǔ)語(yǔ)料以得到一切音結(jié)果,其中該切音結(jié)果為多個(gè)音節(jié);c. 將該切音結(jié)果與一漢語(yǔ)聲學(xué)模型比對(duì),其中該漢語(yǔ)聲學(xué)模型包含多 個(gè)標(biāo)準(zhǔn)漢語(yǔ)音節(jié);d. 判別是否有混淆音產(chǎn)生;e. 當(dāng)混淆音產(chǎn)生時(shí),將混淆音加入該辨識(shí)網(wǎng)絡(luò),重復(fù)步驟b、 c、以及d;以及f. 當(dāng)沒(méi)有混淆音產(chǎn)生時(shí),停止并輸出所有之前產(chǎn)生的混淆音至一混淆音設(shè)定檔;提供一偵測(cè)階段,該偵測(cè)階段包含g. 輸入一使用者念出的一漢語(yǔ)語(yǔ)句;h. 利用一混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn),其中該混淆音辨識(shí)網(wǎng)絡(luò)根據(jù)該產(chǎn) 生階段輸出的該混淆音設(shè)定檔所建立;i. 決定該漢語(yǔ)語(yǔ)句的最佳路徑;以及 j.比較該最佳路徑與該標(biāo)準(zhǔn)路徑,進(jìn)行即時(shí)語(yǔ)音矯正。
16. 根據(jù)權(quán)利要求15所述的記錄媒體,其特征在于,由該切音結(jié)果得知 每一 該音節(jié)的起始時(shí)間及結(jié)束時(shí)間。
17. 根據(jù)權(quán)利要求15所述的記錄媒體,其特征在于,該漢語(yǔ)聲學(xué)模型為 隱藏式馬可夫模型。
18. 根據(jù)權(quán)利要求15所述的記錄媒體,其中該漢語(yǔ)聲學(xué)模型包含411個(gè) 標(biāo)準(zhǔn)漢語(yǔ)音節(jié)。
19. 根據(jù)權(quán)利要求15所述的記錄媒休,其特征在于,該辨識(shí)網(wǎng)絡(luò)在起始 時(shí)包含一標(biāo)準(zhǔn)路徑,該標(biāo)準(zhǔn)路徑為該漢語(yǔ)語(yǔ)料的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容。
20. 根據(jù)權(quán)利要求15所述的記錄媒體,其特征在于,該步驟c包含 將每一該音節(jié)與所有該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)比對(duì)以計(jì)算出多個(gè)對(duì)數(shù)機(jī)率; 根據(jù)該對(duì)數(shù)機(jī)率的高低來(lái)排名該標(biāo)準(zhǔn)漢語(yǔ)音節(jié);以及當(dāng)存在一標(biāo)準(zhǔn)漢語(yǔ)音節(jié),該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)的排名高于每-,該音節(jié)所應(yīng)對(duì)應(yīng) 的標(biāo)準(zhǔn)漢語(yǔ)音節(jié)時(shí),該標(biāo)準(zhǔn)漢語(yǔ)音節(jié)即為混淆音。
21. 根據(jù)權(quán)利要求15所述的記錄媒體,其特征在于,該方法以迭代的方法 來(lái)反復(fù)找出混淆音并加入該辨識(shí)網(wǎng)絡(luò),來(lái)逐次提高切音的正確性以及評(píng)分的客 觀性。
全文摘要
一種混淆音產(chǎn)生及偵測(cè)方法,包含產(chǎn)生階段及偵測(cè)階段,產(chǎn)生階段包含a.輸入漢語(yǔ)語(yǔ)料;b.利用維特比解碼算法中的強(qiáng)迫校準(zhǔn),切割漢語(yǔ)語(yǔ)料;c.將切音結(jié)果與漢語(yǔ)聲學(xué)模型比對(duì);d.判別是否有混淆音產(chǎn)生;e.當(dāng)混淆音產(chǎn)生時(shí),將混淆音加入辨識(shí)網(wǎng)絡(luò),重復(fù)步驟b、c、d;以及f.當(dāng)沒(méi)有混淆音產(chǎn)生時(shí),停止并輸出所有之前產(chǎn)生的混淆音至混淆音設(shè)定檔。偵測(cè)階段包含g.輸入使用者念出的漢語(yǔ)語(yǔ)句;h.利用混淆音辨識(shí)網(wǎng)絡(luò)進(jìn)行校準(zhǔn);i.決定漢語(yǔ)語(yǔ)句的最佳路徑;以及j.比較最佳路徑與標(biāo)準(zhǔn)路徑,進(jìn)行即時(shí)語(yǔ)音矯正。
文檔編號(hào)G10L15/00GK101458927SQ20071019852
公開(kāi)日2009年6月17日 申請(qǐng)日期2007年12月11日 優(yōu)先權(quán)日2007年12月11日
發(fā)明者張智星, 林正豪, 王派斌, 陳江村 申請(qǐng)人:財(cái)團(tuán)法人資訊工業(yè)策進(jìn)會(huì)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1