輔助矯正發(fā)音的方法及裝置的制作方法

文檔序號(hào)：2546362閱讀：168來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>辦公文教;裝訂;廣告設(shè)備的制造及其產(chǎn)品制作工藝

專利名稱：輔助矯正發(fā)音的方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種矯正發(fā)音的方法及裝置，特別涉及一種可迅速發(fā)現(xiàn)使用者發(fā)音問
題的輔助矯正發(fā)音的方法及裝置。
背景技術(shù)：
語言學(xué)習(xí)的過程的中，人們常常需要通過各種不同的語言工具書，來輔助其學(xué)習(xí) 語言，如電子辭典、個(gè)人計(jì)算機(jī)(Personal Computer)及個(gè)人數(shù)字助理(Personal Digital Assist,PDA)等，并經(jīng)由軟件執(zhí)行的方式進(jìn)行語言學(xué)習(xí)的功能，其語音發(fā)音是將句子或單字以預(yù)錄方式存儲(chǔ)于計(jì)算機(jī)系統(tǒng)內(nèi)，播放后讓使用者聽到正確的發(fā)音。或者同時(shí)提供錄音的功能，使用者操作計(jì)算機(jī)系統(tǒng)使其進(jìn)行錄音作業(yè)，而可供使用者聆聽自己的聲音，借此操作模式就可以達(dá)到矯正自己發(fā)音正確性以及語言學(xué)習(xí)的效果。如中國臺(tái)灣發(fā)明公開第200713200號(hào)專利"互動(dòng)式矯正發(fā)音的裝置與方法"，利用參考音及使用者發(fā)音進(jìn)行分析，并產(chǎn)生發(fā)音參數(shù)，再根據(jù)參考音并將使用者發(fā)音修改成正確的發(fā)音，借以輔助使用者學(xué)習(xí)正確的發(fā)音；中國臺(tái)灣發(fā)明公告第556152號(hào)專利"自動(dòng) 標(biāo)示音標(biāo)以矯正發(fā)音的使用者界面、系統(tǒng)及方法"，是于使用者提供一個(gè)文句字串并輸入其相對(duì)的聲音信號(hào)的后，在輸入聲音信號(hào)的各個(gè)區(qū)段標(biāo)示出其對(duì)應(yīng)的音標(biāo)，續(xù)以區(qū)段的對(duì)應(yīng) 音標(biāo)以比對(duì)出教學(xué)者聲音信號(hào)與學(xué)習(xí)者聲音信號(hào)之間的差異，如各個(gè)音節(jié)的發(fā)音、音高、強(qiáng) 度、長短的差異等，并據(jù)此進(jìn)行評(píng)分或提出改善建議。上述技術(shù)方案讓使用者無法真正了解發(fā)音錯(cuò)誤的情形，僅能依據(jù)個(gè)人主觀判斷語言發(fā)音語調(diào)的正確性。因此，如何讓教學(xué)者了解每一位學(xué)習(xí)者的發(fā)音錯(cuò)誤，或讓學(xué)習(xí)者了解自己發(fā)音上的錯(cuò)誤，并讓教學(xué)者可以根據(jù)分析后的結(jié)果，提供學(xué)習(xí)者后續(xù)的輔助及矯正，是一個(gè)刻不容緩的待解決課題。

發(fā)明內(nèi)容
有鑒于此，為克服現(xiàn)有技術(shù)的缺陷，本發(fā)明提出一種輔助矯正發(fā)音的方法，先提供
范例句及多個(gè)錯(cuò)誤規(guī)則，其中，范例句包含多個(gè)參考音素，且一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參考音
素，此后再接收使用者發(fā)音，并辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素，于辨識(shí)完成后比對(duì)多個(gè)發(fā)
音音素與多個(gè)錯(cuò)誤規(guī)則，并記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù)。本發(fā)明也提出一種輔助矯正發(fā)音的裝置，包含播放模塊、接收模塊、辨識(shí)模塊、規(guī)
則模塊、比對(duì)模塊。播放模塊用以播放包含多個(gè)參考音素的范例句。接收模塊接收于使用
者依據(jù)范例句所發(fā)出的使用者發(fā)音后，經(jīng)由辨識(shí)模塊辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素。規(guī)
則模塊提供與范例句相對(duì)應(yīng)的多個(gè)錯(cuò)誤規(guī)則，其中，一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參考音素。比對(duì)
模塊比對(duì)多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則。本發(fā)明的功效在于，學(xué)習(xí)者可依據(jù)范例句反復(fù)發(fā)出使用者發(fā)音，即會(huì)辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素，并將多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則進(jìn)行比對(duì)，并記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù)，學(xué)習(xí)者即可通過錯(cuò)誤次數(shù)了解自己發(fā)音上容易發(fā)生的錯(cuò)誤，教學(xué)者也可根據(jù)分析后的結(jié)果，快速掌握每一學(xué)習(xí)者發(fā)音的錯(cuò)誤，并依據(jù)每一學(xué)習(xí)者不同的發(fā)音錯(cuò)誤提供適當(dāng)?shù)暮罄m(xù)輔助及矯正。以下在實(shí)施方式中詳細(xì)敘述本發(fā)明的詳細(xì)特征以及優(yōu)點(diǎn)，其內(nèi)容足以使本領(lǐng)域的普通技術(shù)人員了解本發(fā)明的技術(shù)內(nèi)容并據(jù)以實(shí)施，且根據(jù)本說明書所公開的內(nèi)容、權(quán)利要求及附圖，本領(lǐng)域的普通技術(shù)人員可輕易地理解本發(fā)明相關(guān)的目的及優(yōu)點(diǎn)。

圖1為本發(fā)明輔助矯正發(fā)音的裝置的結(jié)構(gòu)方塊圖；
圖2為本發(fā)明輔助矯正發(fā)音的方法的流程圖。
上述附圖中的附圖標(biāo)記說明如下10輸入模塊20播放模塊30接收模塊40辨識(shí)模塊50規(guī)則模塊60比對(duì)模塊70記錄模塊80輸出模塊90
具體實(shí)施例方式
如圖1所示，為顯示本發(fā)明的輔助矯正發(fā)音的裝置。本發(fā)明的輔助矯正發(fā)音的裝置，包含播放模塊20、接收模塊30、辨識(shí)模塊40、規(guī) 則模塊50、比對(duì)模塊60。播放模塊20以聲音或影像等方式播放范例句，在此，范例句可由多個(gè)單字所組成，每一單字具有至少一參考音素，如范例句為"I am a boy."，是由"I"、"am"、"a"、"boy" 等四個(gè)單字所組成，且其參考音素為aO $m D bCO。此外，組成范例句的單字可存儲(chǔ)于字典 90內(nèi)，并于字典90內(nèi)存儲(chǔ)與每一單字對(duì)應(yīng)的參考音素，在此所述的字典90為一般市面上的英英、英漢、漢英等字典、辭典，并將其資料存儲(chǔ)于存儲(chǔ)單元內(nèi)，但本發(fā)明不以此為限。
接收模塊30于使用者依據(jù)播放模塊20的范例句發(fā)出使用者發(fā)音后，接收使用者所發(fā)出的使用者發(fā)音，以作為后續(xù)判斷使用者發(fā)音是否正確的基準(zhǔn)。辨識(shí)模塊40于接收使用者所發(fā)出的使用者發(fā)音后，辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素，如辨識(shí)使用者發(fā)音為aO Gm D bCO。其中，辨識(shí)模塊40可以直接聲波比對(duì)或聲學(xué)模型比對(duì)進(jìn)行辨識(shí)，且聲學(xué)模型較佳地可為隱藏式馬可夫模型(Hidden Markov Model，HMM)，但本發(fā)明不限于此，聲學(xué)模型也可為神經(jīng)網(wǎng)絡(luò)(Neural Networks)、動(dòng)態(tài)時(shí)間校準(zhǔn)(Dynamic Time Warping， DTW)或語音模板比對(duì)(Template Matching)。規(guī)則模塊50提供與范例句相對(duì)應(yīng)的多個(gè)錯(cuò)誤規(guī)則，在此，一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè) 參考音素，且每一個(gè)錯(cuò)誤規(guī)則具有至少一錯(cuò)誤音素，如對(duì)應(yīng)1"的錯(cuò)誤規(guī)則包含"G"、"A"、 "D"等錯(cuò)誤音素。
5
比對(duì)模塊60比對(duì)辨識(shí)模塊40辨識(shí)的多個(gè)發(fā)音音素與規(guī)則模塊50提供的多個(gè)錯(cuò) 誤規(guī)則，在此，比對(duì)模塊60依序?qū)⒚恳话l(fā)音音素與對(duì)應(yīng)的錯(cuò)誤規(guī)則的錯(cuò)誤音素進(jìn)行比對(duì)。
前述說明的范例句可為系統(tǒng)預(yù)先設(shè)定，或可由教學(xué)者預(yù)先輸入，其中，教學(xué)者可經(jīng) 由輸入模塊10輸入范例句，并且其于輸入時(shí)可依據(jù)課程安排或?qū)W習(xí)者程度輸入不同的范例句。本發(fā)明的輔助矯正發(fā)音的裝置更包含記錄模塊70、輸出模塊80。記錄模塊70可于比對(duì)模塊60每次比對(duì)完成后，記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù)，并可隨時(shí)經(jīng)由輸出模塊80輸出錯(cuò)誤次數(shù)，以供教學(xué)者或?qū)W習(xí)者掌握每次發(fā)音情況。
使用時(shí)教學(xué)者可先以輸入模塊10輸入范例句"I am a boy."，學(xué)習(xí)者再以播放模塊20播放范例句，并依據(jù)播放模塊20的范例句反復(fù)發(fā)出使用者發(fā)音而練習(xí)發(fā)音。學(xué)習(xí)者每次發(fā)出使用者發(fā)音均經(jīng)由接收模塊30接收，再以辨識(shí)模塊40辨識(shí)使用者發(fā)音為多個(gè)發(fā) 音音素，并于比對(duì)模塊60比對(duì)完成后以記錄模塊70記錄錯(cuò)誤次數(shù)，如使用者發(fā)音為a0 $m D bCO共30次，使用者發(fā)音為a0 Gm D bCO共25次，使用者發(fā)音為a0 Am D bCO共10次，則可將其結(jié)果記錄為參考音素($)錯(cuò)誤音素(G)錯(cuò)誤音素(A)總次數(shù)正確率
30次25次15次70次43 % 于輸出模塊80輸出錯(cuò)誤次數(shù)后，學(xué)習(xí)者即可通過錯(cuò)誤次數(shù)了解自己發(fā)音上容易發(fā)生的錯(cuò)誤，教學(xué)者也可根據(jù)分析后的結(jié)果，快速掌握每一學(xué)習(xí)者發(fā)音的錯(cuò)誤，如某一學(xué)習(xí) 者容易將1"發(fā)音成"G"，即可依據(jù)此一學(xué)習(xí)者容易發(fā)生的發(fā)音錯(cuò)誤提供適當(dāng)?shù)暮罄m(xù)輔助及矯正，協(xié)助其將"G"矯正發(fā)音為"$"。如圖2所示，本發(fā)明的輔助矯正發(fā)音的方法，包含下列步驟
步驟201 :提供包含多個(gè)參考音素的范例句。教學(xué)者可經(jīng)由輸入模塊10輸入范例句，并且其于輸入時(shí)可依據(jù)課程安排或?qū)W習(xí) 者程度輸入不同的范例句。此外，范例句可由多個(gè)單字所組成，每一單字具有至少一參考音素，因此可將范例句展開為多個(gè)參考音素，如范例句為"I am a boy."，由"l"、"am"、"a"、 "boy"等四個(gè)單字所組成，且其參考音素為aO $m D bCO。展開范例句的步驟中，可依據(jù)字典90展開范例句，在此，字典90為一般市面上的
英英、英漢、漢英等字典、辭典，并將其資料存儲(chǔ)于存儲(chǔ)單元內(nèi)，但本發(fā)明不以此為限。步驟202 :提供多個(gè)錯(cuò)誤規(guī)則，一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參考音素。以規(guī)則模塊50提供與范例句相對(duì)應(yīng)的多個(gè)錯(cuò)誤規(guī)則，一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參
考音素，且每一個(gè)錯(cuò)誤規(guī)則具有至少一錯(cuò)誤音素，如對(duì)應(yīng)1"的錯(cuò)誤規(guī)則包含"G"、"A"、"D"
等錯(cuò)誤音素。步驟203 :接收使用者發(fā)音。經(jīng)由播放模塊20以聲音或影像等方式播放范例句，學(xué)習(xí)者再依據(jù)范例句反復(fù)發(fā)
出使用者發(fā)音而練習(xí)發(fā)音，并以接收模塊30接收學(xué)習(xí)者每次所發(fā)出使用者發(fā)音。步驟204 :辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素。以辨識(shí)模塊40辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素，其中，辨識(shí)模塊40可以直接聲波比對(duì)或聲學(xué)模型比對(duì)進(jìn)行辨識(shí)，且聲學(xué)模型較佳地可為隱藏式馬可夫模型(Hidden Markov Model, HMM)，但本發(fā)明不限于此，聲學(xué)模型也可為神經(jīng)網(wǎng)絡(luò)(Neural Networks)、動(dòng)態(tài)時(shí)間校準(zhǔn)(Dynamic Time Warping， DTW)或語音模板比對(duì)(Template Matching)。
步驟205 :比對(duì)多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則。在此步驟中，比對(duì)模塊60依序?qū)⒚恳话l(fā)音音素與對(duì)應(yīng)的錯(cuò)誤規(guī)則的錯(cuò)誤音素進(jìn)行比對(duì)。步驟206 :記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù)。
步驟207 :輸出錯(cuò)誤次數(shù)。比對(duì)模塊60比對(duì)完成后以記錄模塊70記錄錯(cuò)誤次數(shù)，并可經(jīng)由輸出模塊80輸出錯(cuò)誤次數(shù)，借以讓學(xué)習(xí)者了解自己發(fā)音上容易發(fā)生的錯(cuò)誤，并可供教學(xué)者快速掌握每一學(xué)習(xí)者發(fā)音的錯(cuò)誤，并依據(jù)各學(xué)習(xí)者容易發(fā)生的發(fā)音錯(cuò)誤提供適當(dāng)?shù)暮罄m(xù)輔助及矯正。
本發(fā)明可應(yīng)用于電子辭典、個(gè)人計(jì)算機(jī)(Personal Computer)及個(gè)人數(shù)字助理(Personal Digital Assist,PDA)等電子裝置，特別是可應(yīng)用于日漸普及的低價(jià)計(jì)算機(jī)上，借以讓學(xué)習(xí)者了解自己發(fā)音上的錯(cuò)誤，同時(shí)可讓教學(xué)者直接了解每一位學(xué)習(xí)者的發(fā)音錯(cuò)誤，而不需耗費(fèi)大量時(shí)間分析每一學(xué)習(xí)者的發(fā)音，此外，教學(xué)者可以根據(jù)分析后的結(jié)果，提供學(xué)習(xí)者后續(xù)的輔助及矯正，不僅讓學(xué)習(xí)者學(xué)習(xí)更具效率，同時(shí)讓教學(xué)者可直接針對(duì)較為嚴(yán)重的發(fā)音錯(cuò)誤提供矯正，有效節(jié)省輔導(dǎo)發(fā)音的時(shí)間。雖然本發(fā)明的技術(shù)內(nèi)容已經(jīng)以優(yōu)選實(shí)施例公開如上，然其并非用以限定本發(fā)明，本領(lǐng)域的普通技術(shù)人員在不脫離本發(fā)明的精神所作些許的改進(jìn)，都應(yīng)涵蓋于本發(fā)明的范疇內(nèi)，因此本發(fā)明的保護(hù)范圍當(dāng)視所附的權(quán)利要求所界定的范圍為準(zhǔn)。
權(quán)利要求
一種輔助矯正發(fā)音的方法，包含下列步驟提供一范例句，該范例句包含多個(gè)參考音素；提供多個(gè)錯(cuò)誤規(guī)則，一個(gè)該錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)該參考音素；接收一使用者發(fā)音；辨識(shí)該使用者發(fā)音為多個(gè)發(fā)音音素；比對(duì)所述多個(gè)發(fā)音音素與所述多個(gè)錯(cuò)誤規(guī)則；及記錄所述多個(gè)發(fā)音音素符合所述多個(gè)錯(cuò)誤規(guī)則的一錯(cuò)誤次數(shù)。
2. 如權(quán)利要求1所述的輔助矯正發(fā)音的方法，在提供該范例句的步驟中，包含展開該范例句為所述多個(gè)參考音素。
3. 如權(quán)利要求2所述的輔助矯正發(fā)音的方法，在展開該范例句的步驟中，依據(jù)一字典展開該范例句。
4. 如權(quán)利要求1所述的輔助矯正發(fā)音的方法，其中該范例句包含至少一單字，該單字由至少一該參考音素所組成。
5. 如權(quán)利要求1所述的輔助矯正發(fā)音的方法，其中該錯(cuò)誤規(guī)則包含至少一錯(cuò)誤音素。
6. 如權(quán)利要求5所述的輔助矯正發(fā)音的方法，在比對(duì)所述多個(gè)發(fā)音音素與所述多個(gè)錯(cuò) 誤規(guī)則的步驟中，依序?qū)⒚恳辉摪l(fā)音音素與對(duì)應(yīng)的該錯(cuò)誤規(guī)則的該錯(cuò)誤音素進(jìn)行比對(duì)。
7. 如權(quán)利要求1所述的輔助矯正發(fā)音的方法，在辨識(shí)該使用者發(fā)音的步驟中，以一直接聲波比對(duì)方式及一聲學(xué)模型比的其中一個(gè)進(jìn)行辨識(shí)。
8. 如權(quán)利要求7所述的輔助矯正發(fā)音的方法，其中該聲學(xué)模型選自一隱藏式馬可夫模型、一神經(jīng)網(wǎng)絡(luò)、一動(dòng)態(tài)時(shí)間校準(zhǔn)及一語音模板比對(duì)所構(gòu)成的群組。
9. 如權(quán)利要求l所述的輔助矯正發(fā)音的方法，在記錄該錯(cuò)誤次數(shù)的步驟后，還包含輸出該錯(cuò)誤次數(shù)。
10. —種輔助矯正發(fā)音的裝置，包含一播放模塊，用以播放一范例句，該范例句包含多個(gè)參考音素；一接收模塊，用以接收于一使用者依據(jù)該范例句所發(fā)出的一使用者發(fā)音；一辨識(shí)模塊，用以辨識(shí)該使用者發(fā)音為多個(gè)發(fā)音音素；一規(guī)則模塊，用以提供與該范例句相對(duì)應(yīng)的多個(gè)錯(cuò)誤規(guī)則，一個(gè)該錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè) 該參考音素；及一比對(duì)模塊，用以比對(duì)所述多個(gè)發(fā)音音素與所述多個(gè)錯(cuò)誤規(guī)則。
11. 如權(quán)利要求io所述的輔助矯正發(fā)音的裝置，其中該范例句包含至少一單字，該單字由至少一該參考音素所組成。
12. 如權(quán)利要求ll所述的輔助矯正發(fā)音的裝置，還包含一字典，用以存儲(chǔ)該單字與對(duì) 應(yīng)的該參考音素。
13. 如權(quán)利要求IO所述的輔助矯正發(fā)音的裝置，其中該辨識(shí)模塊以一直接聲波比對(duì)方式及一聲學(xué)模型比對(duì)的其中一個(gè)進(jìn)行辨識(shí)。
14. 如權(quán)利要求13所述的輔助矯正發(fā)音的裝置，其中該聲學(xué)模型選自一隱藏式馬可夫模型、一神經(jīng)網(wǎng)絡(luò)、一動(dòng)態(tài)時(shí)間校準(zhǔn)及一語音模板比對(duì)所構(gòu)成的群組。
15. 如權(quán)利要求IO所述的輔助矯正發(fā)音的裝置，其中該錯(cuò)誤規(guī)則包含至少一錯(cuò)誤音素。
16. 如權(quán)利要求15所述的輔助矯正發(fā)音的裝置，其中該比對(duì)模塊依序?qū)⒚恳辉摪l(fā)音音素與對(duì)應(yīng)的該錯(cuò)誤規(guī)則的該錯(cuò)誤音素進(jìn)行比對(duì)。
17. 如權(quán)利要求10所述的輔助矯正發(fā)音的裝置，還包含一輸入模塊，用以輸入該范例句而供該播放模塊播放。
18. 如權(quán)利要求10所述的輔助矯正發(fā)音的裝置，還包含一記錄模塊，用以記錄所述多個(gè)發(fā)音音素符合所述多個(gè)錯(cuò)誤規(guī)則的一錯(cuò)誤次數(shù)。
19. 如權(quán)利要求18所述的輔助矯正發(fā)音的裝置，還包含一輸出模塊，用以輸出該錯(cuò)誤次數(shù)。
全文摘要
一種輔助矯正發(fā)音的方法及裝置，此方法包含下列步驟提供范例句，范例句包含多個(gè)參考音素；提供多個(gè)錯(cuò)誤規(guī)則，一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參考音素；接收使用者發(fā)音；辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素；比對(duì)多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則；及記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù)。發(fā)明的功效在于學(xué)習(xí)者可依據(jù)范例句反復(fù)發(fā)出使用者發(fā)音，即會(huì)辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素，并將多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則進(jìn)行比對(duì)，并記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù)，學(xué)習(xí)者和教學(xué)者可根據(jù)分析后的結(jié)果，快速掌握每一發(fā)音的錯(cuò)誤，并依據(jù)每一不同的發(fā)音錯(cuò)誤提供適當(dāng)?shù)暮罄m(xù)輔助及矯正。
文檔編號(hào)G09B19/06GK101727764SQ20081017098
公開日2010年6月9日申請(qǐng)日期2008年10月21日優(yōu)先權(quán)日2008年10月21日
發(fā)明者趙平峽, 顏睿余, 顏銘祥申請(qǐng)人:微星科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載