專利名稱:一種語音識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音識(shí)別方法,該方法主要應(yīng)用于聲控系統(tǒng)、人機(jī)對(duì)話領(lǐng)域。
背景技術(shù):
現(xiàn)有的語音識(shí)別技術(shù)主要是利用語音的可識(shí)別性,語音識(shí)別系統(tǒng)根據(jù)外界輸入的語音信號(hào),執(zhí)行相應(yīng)的操作。當(dāng)語音識(shí)別系統(tǒng)能夠識(shí)別外界語音信號(hào)時(shí),語音識(shí)別系統(tǒng)就執(zhí)行相應(yīng)的操作;當(dāng)語音識(shí)別系統(tǒng)無法識(shí)別外界語音信號(hào)時(shí),語音識(shí)別系統(tǒng)或者忽略,或者進(jìn)行錯(cuò)誤的理解,執(zhí)行錯(cuò)誤的操作。即只有輸入正確的語音信號(hào),語音識(shí)別系統(tǒng)才能正確識(shí)別,對(duì)于錯(cuò)誤的輸入,語音識(shí)別系統(tǒng)不能識(shí)別,無法進(jìn)行判斷。
以目前市場(chǎng)上流行的大部分幫助學(xué)習(xí)語言的產(chǎn)品,如收錄機(jī)、學(xué)習(xí)機(jī)、復(fù)讀機(jī)等為例,其語音的識(shí)別方法是先播放一段標(biāo)準(zhǔn)錄音;學(xué)習(xí)者聽完后,重復(fù)讀一遍;此時(shí),可以將學(xué)習(xí)者的聲音錄制進(jìn)去后重新播放;由學(xué)習(xí)者自己進(jìn)行對(duì)比,判斷。這種語音識(shí)別方法的缺點(diǎn)是必須由人耳自己進(jìn)行語音的識(shí)別判斷,由于每個(gè)人的標(biāo)準(zhǔn)不一樣,自己聽自己的發(fā)音難免有些主觀性,往往不容易找到錯(cuò)誤或不標(biāo)準(zhǔn)的地方,缺乏客觀性。
發(fā)明內(nèi)容
鑒于上述原因,本發(fā)明的目的是提供一種可以客觀、準(zhǔn)確地判斷、識(shí)別語音的方法。
為實(shí)現(xiàn)上述目的,本發(fā)明采取以下設(shè)計(jì)方案一種語音識(shí)別方法,具體步驟如下第一步將標(biāo)準(zhǔn)語音數(shù)據(jù)錄入在語音數(shù)據(jù)庫中;第二步索引,在標(biāo)準(zhǔn)語音數(shù)據(jù)庫中選取標(biāo)準(zhǔn)的語音片段;第三步輸出標(biāo)準(zhǔn)語音片段;第四步輸入新的語音信號(hào);通過錄音裝置、模數(shù)轉(zhuǎn)換裝置將新的語音信號(hào)轉(zhuǎn)換成語音數(shù)據(jù)存儲(chǔ)在語音數(shù)據(jù)緩存器中;第五步識(shí)別、比較輸入的語音信號(hào)與數(shù)據(jù)庫中標(biāo)準(zhǔn)的語音信號(hào);通過語音識(shí)別器中的語音識(shí)別芯片將新的語音信號(hào)與語音數(shù)據(jù)庫中的標(biāo)準(zhǔn)語音進(jìn)行分析、識(shí)別、比較;第六步進(jìn)行判斷,對(duì)新的語音信號(hào)是否正確給予明確的答復(fù),并顯示結(jié)果;經(jīng)語音識(shí)別芯片的識(shí)別、比較、判斷后,如果輸入的語音正確,則給予肯定的答復(fù),并重新開始下一個(gè)循環(huán),即重復(fù)第一~第六步;經(jīng)判斷,如果輸入的語音不正確,則給予否定的答復(fù),并顯示錯(cuò)誤,重新輸入,重復(fù)第四~第六步。
本發(fā)明語音識(shí)別方法中的第五、第六步是通過語音識(shí)別芯片將輸入的新的語音與語音數(shù)據(jù)庫中標(biāo)準(zhǔn)的語音進(jìn)行分析、識(shí)別、比較。
由于本發(fā)明采用以上技術(shù)方案,即由語音識(shí)別系統(tǒng)直接識(shí)別、比較、判斷新的語音信號(hào)是否正確,并將判斷結(jié)果反饋顯示。即本發(fā)明同時(shí)利用了語音的可識(shí)別性和不可識(shí)別性,因而對(duì)新的語音信號(hào)是否標(biāo)準(zhǔn)的判斷更加準(zhǔn)確、客觀、公正。
下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步說明。
圖1為本發(fā)明語音識(shí)別系統(tǒng)原理框圖;圖2為本發(fā)明語音識(shí)別方法流程圖;圖3為語音識(shí)別芯片控制程序流程圖。
具體實(shí)施例方式
如圖1所示,本發(fā)明語音識(shí)別系統(tǒng)主要由錄音裝置1、模數(shù)轉(zhuǎn)換裝置2、語音數(shù)據(jù)緩存器3、語音數(shù)據(jù)庫4、語音識(shí)別器5和輸出裝置6組成;其中,語音識(shí)別器5中預(yù)先存儲(chǔ)有體現(xiàn)本發(fā)明語音識(shí)別方法的語音識(shí)別程序。本發(fā)明語音識(shí)別器5采用語音識(shí)別系列芯片。
如圖2所示,本發(fā)明語音識(shí)別方法是第一步將標(biāo)準(zhǔn)語音數(shù)據(jù)錄入在語音數(shù)據(jù)庫中;第二步索引,在標(biāo)準(zhǔn)語音數(shù)據(jù)庫中選取標(biāo)準(zhǔn)的語音片段;第三步輸出標(biāo)準(zhǔn)語音片段;可以直接播放該標(biāo)準(zhǔn)語音片段,也可以通過顯示器顯示該標(biāo)準(zhǔn)語音片段,或者通過其他方式提示該標(biāo)準(zhǔn)語音片段的內(nèi)容。
第四步輸入新的語音片段通過錄音裝置、模數(shù)轉(zhuǎn)換裝置將新的語音片段轉(zhuǎn)換成語音數(shù)據(jù)存儲(chǔ)在語音數(shù)據(jù)緩存器中;第五步識(shí)別、比較輸入的語音信號(hào)與數(shù)據(jù)庫中標(biāo)準(zhǔn)的語音信號(hào);通過語音識(shí)別器中的語音識(shí)別芯片將輸入的語音與數(shù)據(jù)庫中的標(biāo)準(zhǔn)語音進(jìn)行分析、識(shí)別、比較。這種識(shí)別、比較是語音識(shí)別芯片本身就具有的功能,只需加以相應(yīng)的程序控制即可,如圖3所示。
第六步進(jìn)行判斷,對(duì)新的語音信號(hào)是否正確給予明確的答復(fù),并顯示結(jié)果;經(jīng)語音識(shí)別芯片的識(shí)別、比較、判斷后,如果輸入的語音正確,給予肯定的答復(fù),并重新開始下一個(gè)循環(huán),即重復(fù)第一~第六步;經(jīng)判斷,如果輸入的語音不正確,給予否定的答復(fù),并明確告知語音輸入錯(cuò)誤,重新輸入,重復(fù)第四~第六步。
本方法同時(shí)利用了語音的可識(shí)別性和不可識(shí)別性。當(dāng)語音識(shí)別系統(tǒng)能識(shí)別外界聲音時(shí),認(rèn)為輸入的語音正確;當(dāng)系統(tǒng)不能識(shí)別時(shí),認(rèn)為輸入的語音錯(cuò)誤,并給予明確的告知,將判斷結(jié)果反饋顯示。
本方法可以具體應(yīng)用在語言復(fù)讀機(jī)、學(xué)習(xí)機(jī)等語言學(xué)習(xí)方法中,其具體實(shí)現(xiàn)過程為在學(xué)習(xí)機(jī)中加入包含有本發(fā)明語音識(shí)別方法的語音識(shí)別系統(tǒng),使用時(shí),學(xué)習(xí)者每說一個(gè)單詞或短語,語音識(shí)別系統(tǒng)就對(duì)學(xué)習(xí)者的語音進(jìn)行客觀、公正的判別和分析,能識(shí)別出來的,認(rèn)為學(xué)習(xí)者發(fā)音正確;不能識(shí)別出來的,認(rèn)為學(xué)習(xí)者發(fā)音錯(cuò)誤,并將結(jié)果反饋給學(xué)習(xí)者。
權(quán)利要求
1.一種語音識(shí)別方法,具體步驟如下第一步將標(biāo)準(zhǔn)語音數(shù)據(jù)錄入在語音數(shù)據(jù)庫中;第二步索引,在標(biāo)準(zhǔn)語音數(shù)據(jù)庫中選取標(biāo)準(zhǔn)的語音片段;第三步輸出標(biāo)準(zhǔn)語音片段;第四步輸入新的語音片段;第五步識(shí)別、比較輸入的語音信號(hào)與數(shù)據(jù)庫中標(biāo)準(zhǔn)的語音信號(hào);第六步進(jìn)行判斷,對(duì)兩種語音是否相同給予明確的答復(fù),并顯示反饋。
2.根據(jù)權(quán)利要求1所述的一種語音識(shí)別方法,其特征在于所述第五、第六步是指通過語音識(shí)別芯片將輸入的語音與語音數(shù)據(jù)庫中的標(biāo)準(zhǔn)語音進(jìn)行分析、識(shí)別、比較。
3.根據(jù)權(quán)利要求1或2所述的一種語音識(shí)別方法,其特征在于所述語音識(shí)別方法具體步驟如下第一步將標(biāo)準(zhǔn)語音數(shù)據(jù)錄入在語音數(shù)據(jù)庫中;第二步索引,在標(biāo)準(zhǔn)語音數(shù)據(jù)庫中選取標(biāo)準(zhǔn)的語音片段;第三步輸出標(biāo)準(zhǔn)語音片段;第四步輸入新的語音片段;學(xué)習(xí)者通過錄音裝置、模數(shù)轉(zhuǎn)換裝置將新的語音片段轉(zhuǎn)換成語音數(shù)據(jù)存儲(chǔ)在語音數(shù)據(jù)緩存器中;第五步識(shí)別、比較輸入的語音信號(hào)與數(shù)據(jù)庫中標(biāo)準(zhǔn)的語音信號(hào);通過語音識(shí)別器、語音識(shí)別芯片將輸入的語音與語音數(shù)據(jù)庫中的標(biāo)準(zhǔn)語音進(jìn)行分析、識(shí)別、比較;第六步進(jìn)行判斷,對(duì)新的語音信號(hào)是否正確給予明確的答復(fù),并顯示反饋;經(jīng)語音識(shí)別芯片的識(shí)別、比較、判斷后,如果輸入的語音正確,給予肯定的答復(fù),并重新開始下一個(gè)循環(huán),即重復(fù)第一~第六步;經(jīng)判斷,如果輸入的語音不正確,給予否定的答復(fù),明確告知輸入語音錯(cuò)誤,重新輸入,重復(fù)第四~第六步。
全文摘要
本發(fā)明公開了一種語音識(shí)別方法,具體步驟是第一步將標(biāo)準(zhǔn)語音數(shù)據(jù)錄入在語音數(shù)據(jù)庫中;第二步索引,選取欲顯示、提示或播放的標(biāo)準(zhǔn)語音片段;第三步輸出標(biāo)準(zhǔn)語音片段;第四步輸入新的語音片段;第五步識(shí)別、比較輸入的語音信號(hào)與數(shù)據(jù)庫中標(biāo)準(zhǔn)的語音信號(hào);第六步進(jìn)行判斷,對(duì)新的語音信號(hào)是否正確給予明確的答復(fù);并反饋顯示。本方法同時(shí)利用了語音的可識(shí)別性和不可識(shí)別性,因而對(duì)語音信號(hào)的判斷更加準(zhǔn)確、客觀、公正。
文檔編號(hào)G10L15/22GK1432997SQ0210004
公開日2003年7月30日 申請(qǐng)日期2002年1月9日 優(yōu)先權(quán)日2002年1月9日
發(fā)明者屈家偉 申請(qǐng)人:比特聯(lián)創(chuàng)電子(北京)有限公司