專利名稱:輔助矯正發(fā)音的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種矯正發(fā)音的方法及裝置,特別涉及一種可迅速發(fā)現(xiàn)使用者發(fā)音問
題的輔助矯正發(fā)音的方法及裝置。
背景技術(shù):
語言學(xué)習(xí)的過程的中,人們常常需要通過各種不同的語言工具書,來輔助其學(xué)習(xí) 語言,如電子辭典、個(gè)人計(jì)算機(jī)(Personal Computer)及個(gè)人數(shù)字助理(Personal Digital Assist,PDA)等,并經(jīng)由軟件執(zhí)行的方式進(jìn)行語言學(xué)習(xí)的功能,其語音發(fā)音是將句子或單字 以預(yù)錄方式存儲(chǔ)于計(jì)算機(jī)系統(tǒng)內(nèi),播放后讓使用者聽到正確的發(fā)音。或者同時(shí)提供錄音的 功能,使用者操作計(jì)算機(jī)系統(tǒng)使其進(jìn)行錄音作業(yè),而可供使用者聆聽自己的聲音,借此操作 模式就可以達(dá)到矯正自己發(fā)音正確性以及語言學(xué)習(xí)的效果。 如中國臺(tái)灣發(fā)明公開第200713200號(hào)專利"互動(dòng)式矯正發(fā)音的裝置與方法",利 用參考音及使用者發(fā)音進(jìn)行分析,并產(chǎn)生發(fā)音參數(shù),再根據(jù)參考音并將使用者發(fā)音修改成 正確的發(fā)音,借以輔助使用者學(xué)習(xí)正確的發(fā)音;中國臺(tái)灣發(fā)明公告第556152號(hào)專利"自動(dòng) 標(biāo)示音標(biāo)以矯正發(fā)音的使用者界面、系統(tǒng)及方法",是于使用者提供一個(gè)文句字串并輸入其 相對(duì)的聲音信號(hào)的后,在輸入聲音信號(hào)的各個(gè)區(qū)段標(biāo)示出其對(duì)應(yīng)的音標(biāo),續(xù)以區(qū)段的對(duì)應(yīng) 音標(biāo)以比對(duì)出教學(xué)者聲音信號(hào)與學(xué)習(xí)者聲音信號(hào)之間的差異,如各個(gè)音節(jié)的發(fā)音、音高、強(qiáng) 度、長短的差異等,并據(jù)此進(jìn)行評(píng)分或提出改善建議。 上述技術(shù)方案讓使用者無法真正了解發(fā)音錯(cuò)誤的情形,僅能依據(jù)個(gè)人主觀判斷語 言發(fā)音語調(diào)的正確性。因此,如何讓教學(xué)者了解每一位學(xué)習(xí)者的發(fā)音錯(cuò)誤,或讓學(xué)習(xí)者了解 自己發(fā)音上的錯(cuò)誤,并讓教學(xué)者可以根據(jù)分析后的結(jié)果,提供學(xué)習(xí)者后續(xù)的輔助及矯正,是 一個(gè)刻不容緩的待解決課題。
發(fā)明內(nèi)容
有鑒于此,為克服現(xiàn)有技術(shù)的缺陷,本發(fā)明提出一種輔助矯正發(fā)音的方法,先提供
范例句及多個(gè)錯(cuò)誤規(guī)則,其中,范例句包含多個(gè)參考音素,且一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參考音
素,此后再接收使用者發(fā)音,并辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素,于辨識(shí)完成后比對(duì)多個(gè)發(fā)
音音素與多個(gè)錯(cuò)誤規(guī)則,并記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù)。 本發(fā)明也提出一種輔助矯正發(fā)音的裝置,包含播放模塊、接收模塊、辨識(shí)模塊、規(guī)
則模塊、比對(duì)模塊。播放模塊用以播放包含多個(gè)參考音素的范例句。接收模塊接收于使用
者依據(jù)范例句所發(fā)出的使用者發(fā)音后,經(jīng)由辨識(shí)模塊辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素。規(guī)
則模塊提供與范例句相對(duì)應(yīng)的多個(gè)錯(cuò)誤規(guī)則,其中,一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參考音素。比對(duì)
模塊比對(duì)多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則。 本發(fā)明的功效在于,學(xué)習(xí)者可依據(jù)范例句反復(fù)發(fā)出使用者發(fā)音,即會(huì)辨識(shí)使用者 發(fā)音為多個(gè)發(fā)音音素,并將多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則進(jìn)行比對(duì),并記錄多個(gè)發(fā)音音素 符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù),學(xué)習(xí)者即可通過錯(cuò)誤次數(shù)了解自己發(fā)音上容易發(fā)生的錯(cuò)誤,教學(xué)者也可根據(jù)分析后的結(jié)果,快速掌握每一學(xué)習(xí)者發(fā)音的錯(cuò)誤,并依據(jù)每一學(xué)習(xí)者不 同的發(fā)音錯(cuò)誤提供適當(dāng)?shù)暮罄m(xù)輔助及矯正。 以下在實(shí)施方式中詳細(xì)敘述本發(fā)明的詳細(xì)特征以及優(yōu)點(diǎn),其內(nèi)容足以使本領(lǐng)域的 普通技術(shù)人員了解本發(fā)明的技術(shù)內(nèi)容并據(jù)以實(shí)施,且根據(jù)本說明書所公開的內(nèi)容、權(quán)利要 求及附圖,本領(lǐng)域的普通技術(shù)人員可輕易地理解本發(fā)明相關(guān)的目的及優(yōu)點(diǎn)。
圖1為本發(fā)明輔助矯正發(fā)音的裝置的結(jié)構(gòu)方塊圖;
圖2為本發(fā)明輔助矯正發(fā)音的方法的流程圖。
上述附圖中的附圖標(biāo)記說明如下10輸入模塊20播放模塊30接收模塊40辨識(shí)模塊50規(guī)則模塊60比對(duì)模塊70記錄模塊80輸出模塊90
具體實(shí)施例方式
如圖1所示,為顯示本發(fā)明的輔助矯正發(fā)音的裝置。 本發(fā)明的輔助矯正發(fā)音的裝置,包含播放模塊20、接收模塊30、辨識(shí)模塊40、規(guī) 則模塊50、比對(duì)模塊60。 播放模塊20以聲音或影像等方式播放范例句,在此,范例句可由多個(gè)單字所組 成,每一單字具有至少一參考音素,如范例句為"I am a boy.",是由"I"、"am"、"a"、"boy" 等四個(gè)單字所組成,且其參考音素為aO $m D bCO。此外,組成范例句的單字可存儲(chǔ)于字典 90內(nèi),并于字典90內(nèi)存儲(chǔ)與每一單字對(duì)應(yīng)的參考音素,在此所述的字典90為一般市面上的 英英、英漢、漢英等字典、辭典,并將其資料存儲(chǔ)于存儲(chǔ)單元內(nèi),但本發(fā)明不以此為限。
接收模塊30于使用者依據(jù)播放模塊20的范例句發(fā)出使用者發(fā)音后,接收使用者 所發(fā)出的使用者發(fā)音,以作為后續(xù)判斷使用者發(fā)音是否正確的基準(zhǔn)。 辨識(shí)模塊40于接收使用者所發(fā)出的使用者發(fā)音后,辨識(shí)使用者發(fā)音為多個(gè)發(fā)音 音素,如辨識(shí)使用者發(fā)音為aO Gm D bCO。其中,辨識(shí)模塊40可以直接聲波比對(duì)或聲學(xué)模 型比對(duì)進(jìn)行辨識(shí),且聲學(xué)模型較佳地可為隱藏式馬可夫模型(Hidden Markov Model,HMM), 但本發(fā)明不限于此,聲學(xué)模型也可為神經(jīng)網(wǎng)絡(luò)(Neural Networks)、動(dòng)態(tài)時(shí)間校準(zhǔn)(Dynamic Time Warping, DTW)或語音模板比對(duì)(Template Matching)。 規(guī)則模塊50提供與范例句相對(duì)應(yīng)的多個(gè)錯(cuò)誤規(guī)則,在此, 一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè) 參考音素,且每一個(gè)錯(cuò)誤規(guī)則具有至少一錯(cuò)誤音素,如對(duì)應(yīng)1"的錯(cuò)誤規(guī)則包含"G"、"A"、 "D"等錯(cuò)誤音素。
5
比對(duì)模塊60比對(duì)辨識(shí)模塊40辨識(shí)的多個(gè)發(fā)音音素與規(guī)則模塊50提供的多個(gè)錯(cuò) 誤規(guī)則,在此,比對(duì)模塊60依序?qū)⒚恳话l(fā)音音素與對(duì)應(yīng)的錯(cuò)誤規(guī)則的錯(cuò)誤音素進(jìn)行比對(duì)。
前述說明的范例句可為系統(tǒng)預(yù)先設(shè)定,或可由教學(xué)者預(yù)先輸入,其中,教學(xué)者可經(jīng) 由輸入模塊10輸入范例句,并且其于輸入時(shí)可依據(jù)課程安排或?qū)W習(xí)者程度輸入不同的范 例句。 本發(fā)明的輔助矯正發(fā)音的裝置更包含記錄模塊70、輸出模塊80。記錄模塊70可 于比對(duì)模塊60每次比對(duì)完成后,記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù),并可隨 時(shí)經(jīng)由輸出模塊80輸出錯(cuò)誤次數(shù),以供教學(xué)者或?qū)W習(xí)者掌握每次發(fā)音情況。
使用時(shí)教學(xué)者可先以輸入模塊10輸入范例句"I am a boy.",學(xué)習(xí)者再以播放模 塊20播放范例句,并依據(jù)播放模塊20的范例句反復(fù)發(fā)出使用者發(fā)音而練習(xí)發(fā)音。學(xué)習(xí)者 每次發(fā)出使用者發(fā)音均經(jīng)由接收模塊30接收,再以辨識(shí)模塊40辨識(shí)使用者發(fā)音為多個(gè)發(fā) 音音素,并于比對(duì)模塊60比對(duì)完成后以記錄模塊70記錄錯(cuò)誤次數(shù),如使用者發(fā)音為a0 $m D bCO共30次,使用者發(fā)音為a0 Gm D bCO共25次,使用者發(fā)音為a0 Am D bCO共10次, 則可將其結(jié)果記錄為 參考音素($)錯(cuò)誤音素(G)錯(cuò)誤音素(A)總次數(shù)正確率
30次25次15次70次43 % 于輸出模塊80輸出錯(cuò)誤次數(shù)后,學(xué)習(xí)者即可通過錯(cuò)誤次數(shù)了解自己發(fā)音上容易 發(fā)生的錯(cuò)誤,教學(xué)者也可根據(jù)分析后的結(jié)果,快速掌握每一學(xué)習(xí)者發(fā)音的錯(cuò)誤,如某一學(xué)習(xí) 者容易將1"發(fā)音成"G",即可依據(jù)此一學(xué)習(xí)者容易發(fā)生的發(fā)音錯(cuò)誤提供適當(dāng)?shù)暮罄m(xù)輔助 及矯正,協(xié)助其將"G"矯正發(fā)音為"$"。 如圖2所示,本發(fā)明的輔助矯正發(fā)音的方法,包含下列步驟
步驟201 :提供包含多個(gè)參考音素的范例句。 教學(xué)者可經(jīng)由輸入模塊10輸入范例句,并且其于輸入時(shí)可依據(jù)課程安排或?qū)W習(xí) 者程度輸入不同的范例句。此外,范例句可由多個(gè)單字所組成,每一單字具有至少一參考音 素,因此可將范例句展開為多個(gè)參考音素,如范例句為"I am a boy.",由"l"、"am"、"a"、 "boy"等四個(gè)單字所組成,且其參考音素為aO $m D bCO。 展開范例句的步驟中,可依據(jù)字典90展開范例句,在此,字典90為一般市面上的
英英、英漢、漢英等字典、辭典,并將其資料存儲(chǔ)于存儲(chǔ)單元內(nèi),但本發(fā)明不以此為限。 步驟202 :提供多個(gè)錯(cuò)誤規(guī)則, 一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參考音素。 以規(guī)則模塊50提供與范例句相對(duì)應(yīng)的多個(gè)錯(cuò)誤規(guī)則, 一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參
考音素,且每一個(gè)錯(cuò)誤規(guī)則具有至少一錯(cuò)誤音素,如對(duì)應(yīng)1"的錯(cuò)誤規(guī)則包含"G"、"A"、"D"
等錯(cuò)誤音素。 步驟203 :接收使用者發(fā)音。 經(jīng)由播放模塊20以聲音或影像等方式播放范例句,學(xué)習(xí)者再依據(jù)范例句反復(fù)發(fā)
出使用者發(fā)音而練習(xí)發(fā)音,并以接收模塊30接收學(xué)習(xí)者每次所發(fā)出使用者發(fā)音。 步驟204 :辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素。 以辨識(shí)模塊40辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素,其中,辨識(shí)模塊40可以直接聲波 比對(duì)或聲學(xué)模型比對(duì)進(jìn)行辨識(shí),且聲學(xué)模型較佳地可為隱藏式馬可夫模型(Hidden Markov Model, HMM),但本發(fā)明不限于此,聲學(xué)模型也可為神經(jīng)網(wǎng)絡(luò)(Neural Networks)、動(dòng)態(tài)時(shí)間校準(zhǔn)(Dynamic Time Warping, DTW)或語音模板比對(duì)(Template Matching)。
步驟205 :比對(duì)多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則。 在此步驟中,比對(duì)模塊60依序?qū)⒚恳话l(fā)音音素與對(duì)應(yīng)的錯(cuò)誤規(guī)則的錯(cuò)誤音素進(jìn)行比對(duì)。 步驟206 :記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù)。
步驟207 :輸出錯(cuò)誤次數(shù)。 比對(duì)模塊60比對(duì)完成后以記錄模塊70記錄錯(cuò)誤次數(shù),并可經(jīng)由輸出模塊80輸出錯(cuò)誤次數(shù),借以讓學(xué)習(xí)者了解自己發(fā)音上容易發(fā)生的錯(cuò)誤,并可供教學(xué)者快速掌握每一學(xué)習(xí)者發(fā)音的錯(cuò)誤,并依據(jù)各學(xué)習(xí)者容易發(fā)生的發(fā)音錯(cuò)誤提供適當(dāng)?shù)暮罄m(xù)輔助及矯正。
本發(fā)明可應(yīng)用于電子辭典、個(gè)人計(jì)算機(jī)(Personal Computer)及個(gè)人數(shù)字助理(Personal Digital Assist,PDA)等電子裝置,特別是可應(yīng)用于日漸普及的低價(jià)計(jì)算機(jī)上,借以讓學(xué)習(xí)者了解自己發(fā)音上的錯(cuò)誤,同時(shí)可讓教學(xué)者直接了解每一位學(xué)習(xí)者的發(fā)音錯(cuò)誤,而不需耗費(fèi)大量時(shí)間分析每一學(xué)習(xí)者的發(fā)音,此外,教學(xué)者可以根據(jù)分析后的結(jié)果,提供學(xué)習(xí)者后續(xù)的輔助及矯正,不僅讓學(xué)習(xí)者學(xué)習(xí)更具效率,同時(shí)讓教學(xué)者可直接針對(duì)較為嚴(yán)重的發(fā)音錯(cuò)誤提供矯正,有效節(jié)省輔導(dǎo)發(fā)音的時(shí)間。 雖然本發(fā)明的技術(shù)內(nèi)容已經(jīng)以優(yōu)選實(shí)施例公開如上,然其并非用以限定本發(fā)明,本領(lǐng)域的普通技術(shù)人員在不脫離本發(fā)明的精神所作些許的改進(jìn),都應(yīng)涵蓋于本發(fā)明的范疇內(nèi),因此本發(fā)明的保護(hù)范圍當(dāng)視所附的權(quán)利要求所界定的范圍為準(zhǔn)。
權(quán)利要求
一種輔助矯正發(fā)音的方法,包含下列步驟提供一范例句,該范例句包含多個(gè)參考音素;提供多個(gè)錯(cuò)誤規(guī)則,一個(gè)該錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)該參考音素;接收一使用者發(fā)音;辨識(shí)該使用者發(fā)音為多個(gè)發(fā)音音素;比對(duì)所述多個(gè)發(fā)音音素與所述多個(gè)錯(cuò)誤規(guī)則;及記錄所述多個(gè)發(fā)音音素符合所述多個(gè)錯(cuò)誤規(guī)則的一錯(cuò)誤次數(shù)。
2. 如權(quán)利要求1所述的輔助矯正發(fā)音的方法,在提供該范例句的步驟中,包含展開該 范例句為所述多個(gè)參考音素。
3. 如權(quán)利要求2所述的輔助矯正發(fā)音的方法,在展開該范例句的步驟中,依據(jù)一字典 展開該范例句。
4. 如權(quán)利要求1所述的輔助矯正發(fā)音的方法,其中該范例句包含至少一單字,該單字 由至少一該參考音素所組成。
5. 如權(quán)利要求1所述的輔助矯正發(fā)音的方法,其中該錯(cuò)誤規(guī)則包含至少一錯(cuò)誤音素。
6. 如權(quán)利要求5所述的輔助矯正發(fā)音的方法,在比對(duì)所述多個(gè)發(fā)音音素與所述多個(gè)錯(cuò) 誤規(guī)則的步驟中,依序?qū)⒚恳辉摪l(fā)音音素與對(duì)應(yīng)的該錯(cuò)誤規(guī)則的該錯(cuò)誤音素進(jìn)行比對(duì)。
7. 如權(quán)利要求1所述的輔助矯正發(fā)音的方法,在辨識(shí)該使用者發(fā)音的步驟中,以一直 接聲波比對(duì)方式及一聲學(xué)模型比的其中一個(gè)進(jìn)行辨識(shí)。
8. 如權(quán)利要求7所述的輔助矯正發(fā)音的方法,其中該聲學(xué)模型選自一隱藏式馬可夫模 型、一神經(jīng)網(wǎng)絡(luò)、一動(dòng)態(tài)時(shí)間校準(zhǔn)及一語音模板比對(duì)所構(gòu)成的群組。
9. 如權(quán)利要求l所述的輔助矯正發(fā)音的方法,在記錄該錯(cuò)誤次數(shù)的步驟后,還包含輸 出該錯(cuò)誤次數(shù)。
10. —種輔助矯正發(fā)音的裝置,包含一播放模塊,用以播放一范例句,該范例句包含多個(gè)參考音素; 一接收模塊,用以接收于一使用者依據(jù)該范例句所發(fā)出的一使用者發(fā)音; 一辨識(shí)模塊,用以辨識(shí)該使用者發(fā)音為多個(gè)發(fā)音音素;一規(guī)則模塊,用以提供與該范例句相對(duì)應(yīng)的多個(gè)錯(cuò)誤規(guī)則, 一個(gè)該錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè) 該參考音素;及一比對(duì)模塊,用以比對(duì)所述多個(gè)發(fā)音音素與所述多個(gè)錯(cuò)誤規(guī)則。
11. 如權(quán)利要求io所述的輔助矯正發(fā)音的裝置,其中該范例句包含至少一單字,該單字由至少一該參考音素所組成。
12. 如權(quán)利要求ll所述的輔助矯正發(fā)音的裝置,還包含一字典,用以存儲(chǔ)該單字與對(duì) 應(yīng)的該參考音素。
13. 如權(quán)利要求IO所述的輔助矯正發(fā)音的裝置,其中該辨識(shí)模塊以一直接聲波比對(duì)方 式及一聲學(xué)模型比對(duì)的其中一個(gè)進(jìn)行辨識(shí)。
14. 如權(quán)利要求13所述的輔助矯正發(fā)音的裝置,其中該聲學(xué)模型選自一隱藏式馬可夫 模型、一神經(jīng)網(wǎng)絡(luò)、一動(dòng)態(tài)時(shí)間校準(zhǔn)及一語音模板比對(duì)所構(gòu)成的群組。
15. 如權(quán)利要求IO所述的輔助矯正發(fā)音的裝置,其中該錯(cuò)誤規(guī)則包含至少一錯(cuò)誤音素。
16. 如權(quán)利要求15所述的輔助矯正發(fā)音的裝置,其中該比對(duì)模塊依序?qū)⒚恳辉摪l(fā)音音 素與對(duì)應(yīng)的該錯(cuò)誤規(guī)則的該錯(cuò)誤音素進(jìn)行比對(duì)。
17. 如權(quán)利要求10所述的輔助矯正發(fā)音的裝置,還包含一輸入模塊,用以輸入該范例 句而供該播放模塊播放。
18. 如權(quán)利要求10所述的輔助矯正發(fā)音的裝置,還包含一記錄模塊,用以記錄所述多個(gè)發(fā)音音素符合所述多個(gè)錯(cuò)誤規(guī)則的一錯(cuò)誤次數(shù)。
19. 如權(quán)利要求18所述的輔助矯正發(fā)音的裝置,還包含一輸出模塊,用以輸出該錯(cuò)誤次數(shù)。
全文摘要
一種輔助矯正發(fā)音的方法及裝置,此方法包含下列步驟提供范例句,范例句包含多個(gè)參考音素;提供多個(gè)錯(cuò)誤規(guī)則,一個(gè)錯(cuò)誤規(guī)則對(duì)應(yīng)一個(gè)參考音素;接收使用者發(fā)音;辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素;比對(duì)多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則;及記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù)。發(fā)明的功效在于學(xué)習(xí)者可依據(jù)范例句反復(fù)發(fā)出使用者發(fā)音,即會(huì)辨識(shí)使用者發(fā)音為多個(gè)發(fā)音音素,并將多個(gè)發(fā)音音素與多個(gè)錯(cuò)誤規(guī)則進(jìn)行比對(duì),并記錄多個(gè)發(fā)音音素符合多個(gè)錯(cuò)誤規(guī)則的錯(cuò)誤次數(shù),學(xué)習(xí)者和教學(xué)者可根據(jù)分析后的結(jié)果,快速掌握每一發(fā)音的錯(cuò)誤,并依據(jù)每一不同的發(fā)音錯(cuò)誤提供適當(dāng)?shù)暮罄m(xù)輔助及矯正。
文檔編號(hào)G09B19/06GK101727764SQ20081017098
公開日2010年6月9日 申請(qǐng)日期2008年10月21日 優(yōu)先權(quán)日2008年10月21日
發(fā)明者趙平峽, 顏睿余, 顏銘祥 申請(qǐng)人:微星科技股份有限公司