一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法
【專利摘要】一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法,將全部支持的命令詞分為兩組,用戶常用命令詞和用戶不常用命令詞;將兩組命令詞分別構(gòu)建常用命令詞網(wǎng)絡(luò)和非常用詞識(shí)別網(wǎng)絡(luò);將輸入的語(yǔ)音信號(hào)送入常用命令詞網(wǎng)絡(luò)進(jìn)行識(shí)別,同時(shí)將識(shí)別過(guò)程中提取出的語(yǔ)音特征數(shù)據(jù)送入緩存;如果識(shí)別結(jié)果達(dá)到設(shè)定的置信度門(mén)限,則直接輸出識(shí)別結(jié)果,并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重;否則直接從緩存中將數(shù)據(jù)取出送入非常用詞識(shí)別網(wǎng)絡(luò)進(jìn)行識(shí)別;如果進(jìn)入非常用詞識(shí)別網(wǎng)絡(luò)進(jìn)行識(shí)別,則若識(shí)別結(jié)果達(dá)到設(shè)定的置信度門(mén)限,否則拒識(shí);并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重。本發(fā)明能夠根據(jù)不同用戶的使用習(xí)慣自動(dòng)優(yōu)化命令詞識(shí)別網(wǎng)絡(luò),提升了識(shí)別效果和拒識(shí)效果。
【專利說(shuō)明】一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種語(yǔ)音識(shí)別方法,特別是一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法。
【背景技術(shù)】
[0002]命令詞語(yǔ)音識(shí)別系統(tǒng)主要是完成對(duì)預(yù)先定義的命令詞集合進(jìn)行自動(dòng)語(yǔ)音識(shí)別的功能。用戶在使用該系統(tǒng)時(shí),需要先把定義的命令詞集合送入識(shí)別系統(tǒng),然后識(shí)別系統(tǒng)會(huì)將該命令詞集合中的每個(gè)命令詞轉(zhuǎn)化成相應(yīng)的聲學(xué)音素序列,再將這些音素序列組合成一個(gè)圖網(wǎng)絡(luò),我們稱之為識(shí)別網(wǎng)絡(luò)。
[0003]有了構(gòu)建好的命令詞識(shí)別網(wǎng)絡(luò)后,用戶在使用識(shí)別系統(tǒng)時(shí)只需要說(shuō)出命令詞集合中的語(yǔ)音命令,并送入識(shí)別系統(tǒng),識(shí)別系統(tǒng)就會(huì)根據(jù)語(yǔ)音數(shù)據(jù)的聲學(xué)音素去識(shí)別網(wǎng)絡(luò)中匹配出最優(yōu)的路徑,從而再根據(jù)網(wǎng)絡(luò)路徑中的聲學(xué)音素序列反推出具體的命令詞文本信息,從而給出識(shí)別結(jié)果。
[0004]現(xiàn)有的命令詞語(yǔ)音識(shí)別技術(shù)都是事先定義全部能夠支持的命令詞,然后構(gòu)建整個(gè)語(yǔ)音識(shí)別網(wǎng)絡(luò)。這種方式下識(shí)別網(wǎng)絡(luò)是固定的,不能根據(jù)不同用戶的使用習(xí)慣給出更加精確的網(wǎng)絡(luò)。特別是當(dāng)命令詞數(shù)目過(guò)大時(shí),識(shí)別效果和拒識(shí)效果都會(huì)明顯下降。
【發(fā)明內(nèi)容】
[0005]本發(fā)明技術(shù)解決問(wèn)題:克服現(xiàn)有技術(shù)的不足,提供一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法,能夠根據(jù)不同用戶的使用習(xí)慣自動(dòng)優(yōu)化命令詞識(shí)別網(wǎng)絡(luò),提升了識(shí)別效果和拒識(shí)效果。
[0006]本發(fā)明技術(shù)解決方案:一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法,本發(fā)明首先將全部支持的命令詞分為兩組,一組詞為用戶常用命令詞,另一組為不常用命令詞;然后將兩組命令詞分別構(gòu)建語(yǔ)音識(shí)別網(wǎng)絡(luò);用戶在使用語(yǔ)音識(shí)別系統(tǒng)時(shí),首先會(huì)在常用命令詞網(wǎng)絡(luò)中進(jìn)行匹配,如果識(shí)別結(jié)果達(dá)到一個(gè)定義的得分門(mén)限,則直接返回識(shí)別結(jié)果;否則會(huì)轉(zhuǎn)到不常用的識(shí)別網(wǎng)絡(luò)中繼續(xù)進(jìn)行匹配,直到獲得結(jié)果。在用戶使用語(yǔ)音識(shí)別系統(tǒng)的過(guò)程中對(duì)每次識(shí)別結(jié)果的正確性給出確認(rèn),稱用戶接受一次識(shí)別結(jié)果為正向反饋,拒絕為反向反饋;隨后語(yǔ)音識(shí)別系統(tǒng)會(huì)記錄每次用戶給出正向反饋的識(shí)別結(jié)果和其出現(xiàn)的頻度;最后,通過(guò)統(tǒng)計(jì)用戶使用的反饋信息,重新構(gòu)建識(shí)別網(wǎng)絡(luò)和調(diào)整網(wǎng)絡(luò)路徑權(quán)重。
[0007]具體實(shí)現(xiàn)如下:
[0008](I)首先給支持的所有命令詞進(jìn)行權(quán)重評(píng)分(該評(píng)分為根據(jù)經(jīng)驗(yàn)得來(lái)),每個(gè)命令詞都會(huì)有一個(gè)權(quán)重分,然后根據(jù)評(píng)分將全部命令詞分為兩組,一組詞為用戶常用命令詞,另一組為用戶不常用命令詞;
[0009](2)然后將兩組命令詞分別構(gòu)建語(yǔ)音識(shí)別網(wǎng)絡(luò),即常用命令詞網(wǎng)絡(luò)和非常用詞識(shí)別網(wǎng)絡(luò):先把常用命令詞集合送入識(shí)別系統(tǒng),然后識(shí)別系統(tǒng)會(huì)將該命令詞集合中的每個(gè)命令詞轉(zhuǎn)化成相應(yīng)的聲學(xué)音素序列,再將這些音素序列組合成一個(gè)圖網(wǎng)絡(luò),即為常用詞識(shí)別網(wǎng)絡(luò);再把非常用詞命令詞集合送入識(shí)別系統(tǒng),然后識(shí)別系統(tǒng)會(huì)將該命令詞集合中的每個(gè)命令詞轉(zhuǎn)化成相應(yīng)的聲學(xué)音素序列,再將這些音素序列組合成一個(gè)圖網(wǎng)絡(luò),即為非常用詞識(shí)別網(wǎng)絡(luò)。
[0010](3)將輸入的語(yǔ)音信號(hào)送入常用命令詞網(wǎng)絡(luò)進(jìn)行識(shí)別,同時(shí)將識(shí)別過(guò)程中提取出的語(yǔ)音特征數(shù)據(jù)送入緩存;
[0011](4)如果識(shí)別結(jié)果達(dá)到設(shè)定的置信度門(mén)限,則直接輸出識(shí)別結(jié)果,并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重;否則,則直接從緩存中將數(shù)據(jù)取出送入非常用詞識(shí)別網(wǎng)絡(luò)進(jìn)行識(shí)別;
[0012](5)如果進(jìn)入非常用詞識(shí)別網(wǎng)絡(luò)進(jìn)行識(shí)別,則若識(shí)別結(jié)果達(dá)到設(shè)定的置信度門(mén)限,輸出識(shí)別結(jié)果,否則拒識(shí);并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重;
[0013]所述調(diào)整該命令詞權(quán)重過(guò)程為:接收識(shí)別結(jié)果反饋,對(duì)識(shí)別結(jié)果命令詞進(jìn)行權(quán)重調(diào)整;如果為正向反饋,則權(quán)重增加,如果為反向反饋則權(quán)重減?。桓鶕?jù)調(diào)整后的權(quán)重重新進(jìn)行命令詞分組;所述正向反饋是指對(duì)每次識(shí)別結(jié)果的正確性給出確認(rèn),即用戶接受一次識(shí)別結(jié)果為正向反饋,拒絕則為反向反饋。
[0014]本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于:現(xiàn)有的命令詞語(yǔ)音識(shí)別技術(shù)都是事先定義全部能夠支持的命令詞,然后構(gòu)建整個(gè)語(yǔ)音識(shí)別網(wǎng)絡(luò)。這種方式下識(shí)別網(wǎng)絡(luò)是固定的,不能根據(jù)不同用戶的使用習(xí)慣給出更加精確的網(wǎng)絡(luò)。特別是當(dāng)命令詞數(shù)目過(guò)大時(shí),識(shí)別效果和拒識(shí)效果都會(huì)明顯下降。本發(fā)明事先將命令詞分為常用命令詞和非常用命令詞,并分別構(gòu)建識(shí)別網(wǎng)絡(luò),通過(guò)識(shí)別結(jié)果的反饋,對(duì)每個(gè)命令詞的權(quán)重進(jìn)行調(diào)整,可以根據(jù)用戶習(xí)慣進(jìn)行命令詞識(shí)別網(wǎng)絡(luò)的優(yōu)化,提升識(shí)別和拒識(shí)效果,提高了識(shí)別效率。
【專利附圖】
【附圖說(shuō)明】
[0015]圖1為本發(fā)明中語(yǔ)音識(shí)別過(guò)程流程圖;
[0016]圖2為本發(fā)明中詞匯網(wǎng)絡(luò)權(quán)重調(diào)整流程圖。
【具體實(shí)施方式】
[0017]下面結(jié)合流程圖詳細(xì)說(shuō)明識(shí)別過(guò)程和詞匯分組自優(yōu)化調(diào)整過(guò)程。
[0018]如圖1所示,本發(fā)明具體實(shí)現(xiàn)步驟如下:
[0019](I)首先給支持的所有命令詞進(jìn)行權(quán)重評(píng)分(該評(píng)分為根據(jù)經(jīng)驗(yàn)得來(lái)),每個(gè)命令詞都會(huì)有一個(gè)權(quán)重分,然后根據(jù)評(píng)分將全部命令詞分為兩組,一組詞為用戶常用命令詞,另一組為用戶不常用命令詞;
[0020](2)然后將兩組命令詞分別構(gòu)建語(yǔ)音識(shí)別網(wǎng)絡(luò),即常用命令詞網(wǎng)絡(luò)和非常用詞識(shí)別網(wǎng)絡(luò):先把常用命令詞集合送入識(shí)別系統(tǒng),然后識(shí)別系統(tǒng)會(huì)將該命令詞集合中的每個(gè)命令詞轉(zhuǎn)化成相應(yīng)的聲學(xué)音素序列,再將這些音素序列組合成一個(gè)圖網(wǎng)絡(luò),即為常用詞識(shí)別網(wǎng)絡(luò);再把非常用詞命令詞集合送入識(shí)別系統(tǒng),然后識(shí)別系統(tǒng)會(huì)將該命令詞集合中的每個(gè)命令詞轉(zhuǎn)化成相應(yīng)的聲學(xué)音素序列,再將這些音素序列組合成一個(gè)圖網(wǎng)絡(luò),即為非常用詞識(shí)別網(wǎng)絡(luò)。
[0021]例如,對(duì)于一個(gè)經(jīng)常使用語(yǔ)音識(shí)別系統(tǒng)撥打電話的用戶來(lái)說(shuō),“打電話給”就是一個(gè)使用頻率比較高的命令詞,那么這個(gè)命令詞在初始的權(quán)重分就會(huì)比較高,被分入常用命令詞;而“查天氣”可能使用的頻率沒(méi)那么高,初始的權(quán)重分也比較低,會(huì)被分入非常用命令詞。
[0022](3)將輸入的語(yǔ)音信號(hào)送入常用命令詞網(wǎng)絡(luò)進(jìn)行識(shí)別,同時(shí)將識(shí)別過(guò)程中提取出的語(yǔ)音特征數(shù)據(jù)送入緩存;
[0023](4)如果識(shí)別結(jié)果達(dá)到設(shè)定的置信度門(mén)限,則直接輸出識(shí)別結(jié)果,并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重;否則,則直接從緩存中將數(shù)據(jù)取出送入非常用詞識(shí)別網(wǎng)絡(luò)進(jìn)行識(shí)別;
[0024](5)如果進(jìn)入非常用詞識(shí)別網(wǎng)絡(luò)進(jìn)行識(shí)別,則若識(shí)別結(jié)果達(dá)到設(shè)定的置信度門(mén)限,輸出識(shí)別結(jié)果,否則拒識(shí);并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重。
[0025]結(jié)合圖2,所述詞匯分組自優(yōu)化調(diào)整過(guò)程為:接收識(shí)別結(jié)果反饋,對(duì)識(shí)別結(jié)果命令詞進(jìn)行權(quán)重調(diào)整;如果為正向反饋,則權(quán)重增加,如果為反向反饋則權(quán)重減??;根據(jù)調(diào)整后的權(quán)重重新進(jìn)行命令詞分組;所述正向反饋是指對(duì)每次識(shí)別結(jié)果的正確性給出確認(rèn),即用戶接受一次識(shí)別結(jié)果為正向反饋,拒絕則為反向反饋。
[0026]上述過(guò)程存在于步驟(4)、(5)中,在接收到識(shí)別反饋結(jié)果后即開(kāi)始自動(dòng)調(diào)整命令詞權(quán)重分并重新構(gòu)建常用詞和非常用詞識(shí)別網(wǎng)絡(luò)。
[0027]例如:用戶對(duì)語(yǔ)音識(shí)別系統(tǒng)說(shuō)“查天氣”,識(shí)別系統(tǒng)會(huì)進(jìn)行錄音并提取其中的語(yǔ)音特征數(shù)據(jù)。先將特征數(shù)據(jù)送入常用命令詞網(wǎng)絡(luò)與命令詞進(jìn)行比對(duì)和匹配,而置信度門(mén)限就是匹配相似度的一種度量。這時(shí),如果常用命令詞網(wǎng)絡(luò)中有達(dá)到置信度門(mén)限的命令詞,那么輸出識(shí)別結(jié)果,這時(shí)用戶可以判斷此輸出結(jié)果是否自己想要得到的結(jié)果,如果是,則接受識(shí)別結(jié)果,同時(shí)系統(tǒng)會(huì)給這個(gè)識(shí)別結(jié)果命令詞一個(gè)正向反饋,即增加權(quán)重分;如果不是用戶想要的結(jié)果,則拒絕接受識(shí)別結(jié)果,系統(tǒng)會(huì)給這個(gè)識(shí)別結(jié)果命令詞一個(gè)負(fù)向反饋,即減小這個(gè)命令詞的權(quán)重分。
[0028]但是,如果常用命令詞網(wǎng)絡(luò)中沒(méi)有匹配程度達(dá)到置信度門(mén)限的命令詞,則將“查天氣”這個(gè)命令詞的語(yǔ)音特征數(shù)據(jù)送入非常用詞網(wǎng)絡(luò)進(jìn)行識(shí)別。同樣的,如果有達(dá)到置信度門(mén)限的命令詞,則輸出識(shí)別結(jié)果由用戶判斷是否接受結(jié)果,同樣會(huì)根據(jù)用戶的接受與否對(duì)識(shí)別出的這個(gè)命令詞進(jìn)行權(quán)重分?jǐn)?shù)的調(diào)整,接受則為正向反饋,不接受則為負(fù)向反饋。
[0029]如果非常用詞網(wǎng)絡(luò)中也沒(méi)有達(dá)到置信度門(mén)限的命令詞,則系統(tǒng)對(duì)“查天氣”這個(gè)命令詞進(jìn)行拒識(shí),即不輸出結(jié)果,同時(shí)提示無(wú)法識(shí)別。
[0030]在完成一次識(shí)別的過(guò)程后,命令詞識(shí)別網(wǎng)絡(luò)中的命令詞權(quán)重分發(fā)生了變化。這時(shí)會(huì)根據(jù)現(xiàn)在的權(quán)重分重新生成常用詞識(shí)別網(wǎng)絡(luò)和非常用詞識(shí)別網(wǎng)絡(luò),等待下一次識(shí)別。
[0031]本發(fā)明未詳細(xì)闡述部分屬于本領(lǐng)域公知技術(shù)。
[0032]以上所述,僅為本發(fā)明部分【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本領(lǐng)域的人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法,其特征在于實(shí)現(xiàn)如下: (1)將全部支持的命令詞分為兩組,一組詞為用戶常用命令詞,另一組為用戶不常用命令詞; (2)將兩組命令詞分別構(gòu)建語(yǔ)音識(shí)別網(wǎng)絡(luò),即常用命令詞網(wǎng)絡(luò)和非常用詞識(shí)別網(wǎng)絡(luò); (3)將輸入的語(yǔ)音信號(hào)送入常用命令詞網(wǎng)絡(luò)進(jìn)行識(shí)別,同時(shí)將識(shí)別過(guò)程中提取出的語(yǔ)音特征數(shù)據(jù)送入緩存; (4)如果識(shí)別結(jié)果達(dá)到設(shè)定的置信度門(mén)限,則直接輸出識(shí)別結(jié)果,并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重;否則,則直接從緩存中將數(shù)據(jù)取出送入非常用詞識(shí)別網(wǎng)絡(luò)進(jìn)行識(shí)別; (5)如果進(jìn)入非常用詞識(shí)別網(wǎng)絡(luò)進(jìn)行識(shí)別,則若識(shí)別結(jié)果達(dá)到設(shè)定的置信度門(mén)限,輸出識(shí)別結(jié)果,否則拒識(shí);并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重。
2.根據(jù)權(quán)利要求1所述一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法,其特征在于:所述步驟(I)中的對(duì)支持的所有命令詞進(jìn)行權(quán)重評(píng)分,根據(jù)權(quán)重評(píng)分將全部命令詞分為用戶常用命令詞和用戶非常用命令詞。
3.根據(jù)權(quán)利要求1所述一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法,其特征在于:所述步驟(2)中的非常用詞識(shí)別網(wǎng)絡(luò)構(gòu)建為:把定義好的非常用詞命令詞集合送入識(shí)別系統(tǒng),然后識(shí)別系統(tǒng)會(huì)將該命令詞集合中的每個(gè)命令詞轉(zhuǎn)化成相應(yīng)的聲學(xué)音素序列,再將這些音素序列組合成一個(gè)圖網(wǎng)絡(luò),即為非常用詞識(shí)別網(wǎng)絡(luò)。
4.根據(jù)權(quán)利要求1所述一種對(duì)用戶語(yǔ)音識(shí)別結(jié)果反饋的命令詞識(shí)別自適應(yīng)優(yōu)化方法,其特征在于:所述步驟(4)、(5)中的調(diào)整該命令詞權(quán)重的過(guò)程為:接收識(shí)別結(jié)果反饋,對(duì)識(shí)別結(jié)果命令詞進(jìn)行權(quán)重調(diào)整;如果為正向反饋,則權(quán)重增加,如果為反向反饋則權(quán)重減??;根據(jù)調(diào)整后的權(quán)重重新進(jìn)行命令詞分組;所述正向反饋是指對(duì)每次識(shí)別結(jié)果的正確性給出確認(rèn),即用戶接受一次識(shí)別結(jié)果為正向反饋,拒絕則為反向反饋。
【文檔編號(hào)】G10L15/00GK103531197SQ201310473360
【公開(kāi)日】2014年1月22日 申請(qǐng)日期:2013年10月11日 優(yōu)先權(quán)日:2013年10月11日
【發(fā)明者】張偉, 梅珂, 陳盛, 鹿曉亮, 單言豐 申請(qǐng)人:安徽科大訊飛信息科技股份有限公司