一種語(yǔ)音識(shí)別的方法和裝置制造方法
【專利摘要】本申請(qǐng)?zhí)峁┝艘环N語(yǔ)音識(shí)別的方法和裝置,包括:接收語(yǔ)音識(shí)別系統(tǒng)輸出的多個(gè)候選識(shí)別結(jié)果,將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,其中,所述知識(shí)庫(kù)包括實(shí)體詞表和模板,所述模板存儲(chǔ)符合正則表達(dá)式的書(shū)寫(xiě)規(guī)則語(yǔ)句;若所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板匹配均不成功,則計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離;根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值,根據(jù)所述匹配分值將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,得到所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板的匹配度;根據(jù)所述匹配度,輸出匹配后的識(shí)別結(jié)果。因此,本申請(qǐng)解決了現(xiàn)有語(yǔ)音識(shí)別錯(cuò)誤對(duì)問(wèn)答系統(tǒng)影響的問(wèn)題。
【專利說(shuō)明】一種語(yǔ)音識(shí)別的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及語(yǔ)音識(shí)別領(lǐng)域,特別是涉及一種語(yǔ)音識(shí)別的方法和裝置。
【背景技術(shù)】
[0002]近年來(lái),隨著語(yǔ)言處理技術(shù)的發(fā)展,智能問(wèn)答系統(tǒng)受到了極大的關(guān)注,從聊天軟件‘小黃雞’的風(fēng)靡,到流行于各大網(wǎng)絡(luò)平臺(tái)的應(yīng)答機(jī)器人,智能問(wèn)答系統(tǒng)在眾多領(lǐng)域得到廣泛應(yīng)用。
[0003]大多數(shù)問(wèn)答系統(tǒng)都是以文本鍵入的形式作為問(wèn)答系統(tǒng)的輸入,繁瑣費(fèi)時(shí),特別是在移動(dòng)終端(如手機(jī))等無(wú)鍵盤(pán)設(shè)備上或?qū)τ诶夏耆?、殘疾人等操作困難人群,文本輸入變得異常困難。因此,基于語(yǔ)音輸入的問(wèn)答系統(tǒng)應(yīng)運(yùn)而生,用戶以口述的形式輸入問(wèn)題,經(jīng)過(guò)語(yǔ)音識(shí)別,把識(shí)別結(jié)果傳給問(wèn)答系統(tǒng)進(jìn)行處理,這樣減少了用戶的操作,提高了用戶體驗(yàn)。
[0004]語(yǔ)音智能問(wèn)答系統(tǒng)具有方便、快捷、適用人群廣泛的優(yōu)點(diǎn),然而,將語(yǔ)音作為用戶輸入帶來(lái)了新的問(wèn)題。由于用戶的聲音質(zhì)量的不確定性、環(huán)境噪聲的多樣性、用戶口音變異、未登錄詞等各種復(fù)雜因素的影響,語(yǔ)音識(shí)別的精度很難保證?,F(xiàn)有技術(shù)中語(yǔ)音識(shí)別技術(shù)對(duì)標(biāo)準(zhǔn)普通話的識(shí)別正確率大約在90%左右,如果存在較高的噪音和口音,識(shí)別率的正確率就大大降低了。錯(cuò)誤的識(shí)別結(jié)果會(huì)影響問(wèn)答系統(tǒng)對(duì)用戶輸入的理解,進(jìn)而影響問(wèn)答系統(tǒng)的正確率。
[0005]目前,解決上述問(wèn)題的方法是通過(guò)增加問(wèn)答系統(tǒng)的知識(shí)領(lǐng)域來(lái)提高語(yǔ)音識(shí)別系統(tǒng)的準(zhǔn)確率。然而上述方法,一方面存在著某些語(yǔ)音識(shí)別錯(cuò)誤在后續(xù)問(wèn)答系統(tǒng)中擴(kuò)大,導(dǎo)致問(wèn)答系統(tǒng)正確率急劇下降。另一方面,問(wèn)答系統(tǒng)本身在容錯(cuò)時(shí)容易忽略非關(guān)鍵字,在此情形下對(duì)輸入問(wèn)題進(jìn)行模糊匹配時(shí),將導(dǎo)致問(wèn)答系統(tǒng)輸出錯(cuò)誤結(jié)果的可能性大大增加。
【發(fā)明內(nèi)容】
[0006]本申請(qǐng)?zhí)峁┮环N語(yǔ)音識(shí)別的方法和裝置,以解決上述現(xiàn)有語(yǔ)音識(shí)別錯(cuò)誤對(duì)問(wèn)答系統(tǒng)影響的問(wèn)題。
[0007]為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了一種語(yǔ)音識(shí)別的方法,包括:接收語(yǔ)音識(shí)別系統(tǒng)輸出的多個(gè)候選識(shí)別結(jié)果,將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,其中,所述知識(shí)庫(kù)包括實(shí)體詞表和模板,所述實(shí)體詞表存儲(chǔ)實(shí)體詞,所述模板存儲(chǔ)符合正則表達(dá)式的書(shū)寫(xiě)規(guī)則語(yǔ)句;
[0008]若所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板匹配均不成功,則計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離;
[0009]根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值,根據(jù)所述匹配分值將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,得到所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板的匹配度;
[0010]根據(jù)所述匹配度,輸出匹配后的識(shí)別結(jié)果。
[0011]優(yōu)選地,所述計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離的步驟包括:[0012]通過(guò)編輯距離修正公式計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離,包括:
[0013]通過(guò)第一編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第一距離,其中,所述第一編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和插入錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離;
[0014]通過(guò)第二編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第二距離,其中,所述第二編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和刪除錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離;
[0015]通過(guò)第三編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第三距離,其中,所述第三編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和多個(gè)候選識(shí)別結(jié)果字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的標(biāo)準(zhǔn)音素的失配分值得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離;
[0016]將所述第一距離、第二距離和第三距離中的最小值確定為所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
[0017]優(yōu)選地,所述第一編輯距離修正公式為:D(N,M) = D(1-1, j)+c ;
[0018]所述第二編輯距離修正公式為:D(N,M) = D(i, j-1)+V ;
[0019]所述第二編輯距尚修正公式為:D (N, Μ) = D (i_l, j_l)+d (w, V);
[0020]其中,i為多個(gè)候選識(shí)別結(jié)果的字符串,j為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串,c和V為算法參數(shù),C為插入錯(cuò)誤失配權(quán)重,V為刪除錯(cuò)誤失配權(quán)重,d(w, V)為多個(gè)候選識(shí)別結(jié)果第1-Ι個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-Ι個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值,D(N, M)為多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
[0021]優(yōu)選地,所述d(w,v)通過(guò)以下方式獲得:
[0022]根據(jù)混淆矩陣計(jì)算多個(gè)候選識(shí)別結(jié)果第1-Ι個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-1個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值。
[0023]優(yōu)選地,所述根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值的步驟包括:
[0024]根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度,使用貝葉斯公式計(jì)算多個(gè)候選識(shí)別結(jié)果的匹配分值。
[0025]優(yōu)選地,其中,所述貝葉斯公式為:
[0026]D (O, L)=D (N, M) P (X | O);
[0027]其中,O為輸入語(yǔ)音,X為多個(gè)候選識(shí)別結(jié)果,P(XlO)為語(yǔ)音識(shí)別系統(tǒng)對(duì)多個(gè)候選識(shí)別結(jié)果X的信任度,D(N1M)為多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離,D (O, L)為多個(gè)候選識(shí)別結(jié)果的匹配分值。
[0028] 為了解決上述問(wèn)題,本申請(qǐng)還公開(kāi)了一種語(yǔ)音識(shí)別的裝置,包括:接收模塊,用于接收語(yǔ)音識(shí)別系統(tǒng)輸出的多個(gè)候選識(shí)別結(jié)果,將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,其中,所述知識(shí)庫(kù)包括實(shí)體詞表和模板,所述實(shí)體詞表存儲(chǔ)實(shí)體詞,所述模板存儲(chǔ)符合正則表達(dá)式的書(shū)寫(xiě)規(guī)則語(yǔ)句;
[0029]計(jì)算模塊,用于若所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板匹配均不成功,則計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離;
[0030]匹配模塊,用于根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值,根據(jù)所述匹配分值將多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,得到所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中模板的匹配度;
[0031]輸出模塊,用于根據(jù)所述匹配度,輸出匹配后的識(shí)別結(jié)果。
[0032]優(yōu)選地,所述計(jì)算模塊通過(guò)編輯距離修正公式計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離,包括:
[0033]第一編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第一距離,其中,所述第一編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和插入錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離;
[0034]通過(guò)第二編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第二距離,其中,所述第二編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和刪除錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離;
[0035]通過(guò)第三編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第三距離,其中,所述第三編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和多個(gè)候選識(shí)別結(jié)果字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的標(biāo)準(zhǔn)音素的失配分值得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離;
[0036]將所述第一距離、第二距離和第三距離中的最小值確定為所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
[0037]優(yōu)選地,所述第一編輯距離修正公式為:D (N, M) =D (1-1, j) +c ;
[0038]所述第二編輯距離修正公式為:D (N, M) = D (i, j-1) +v ;
[0039]所述第二編輯距尚修正公式為:D (N, Μ) = D (i_l, j_l)+d (w, V);
[0040]其中,i為多個(gè)候選識(shí)別結(jié)果的字符串,j為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串,c和V為算法參數(shù),C為插入錯(cuò)誤失配權(quán)重,V為刪除錯(cuò)誤失配權(quán)重,d(w, V)為多個(gè)候選識(shí)別結(jié)果第1-Ι個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-Ι個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值,D(N, M)為多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
[0041]優(yōu)選地,所述d(w,v)通過(guò)以下方式獲得:
[0042]根據(jù)混淆矩陣計(jì)算多個(gè)候選識(shí)別結(jié)果第1-Ι個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-1個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值。
[0043]與現(xiàn)有技術(shù)相比,本申請(qǐng)包括以下優(yōu)點(diǎn):
[0044]針對(duì)語(yǔ)音識(shí)別系統(tǒng)輸出的候選識(shí)別結(jié)果易受口音、噪聲等影響出現(xiàn)隨機(jī)錯(cuò)誤的問(wèn)題,本申請(qǐng)通過(guò)計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離,根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值,從計(jì)算出的匹配分值中確定出最優(yōu)匹配分值,將得到的最優(yōu)匹配分值的多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板進(jìn)行模糊匹配,得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板的匹配度,由于知識(shí)庫(kù)中存儲(chǔ)的模板是經(jīng)過(guò)大量的收集和校對(duì)得到的普遍正確的模板,從而解決了語(yǔ)音識(shí)別錯(cuò)誤對(duì)問(wèn)答系統(tǒng)影響的問(wèn)題。
【專利附圖】
【附圖說(shuō)明】
[0045]圖1是本申請(qǐng)實(shí)施例一所述一種語(yǔ)音識(shí)別方法的流程圖;
[0046]圖2是本申請(qǐng)實(shí)施例二所述一種語(yǔ)音識(shí)別方法的流程圖;
[0047]圖3是本申請(qǐng)實(shí)施例三所述一種語(yǔ)音識(shí)別裝置的結(jié)構(gòu)圖。 【具體實(shí)施方式】
[0048]為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說(shuō)明。
[0049]參照?qǐng)D1,示出了本申請(qǐng)實(shí)施例一中的一種語(yǔ)音識(shí)別方法的流程圖,具體包括:
[0050]步驟101:接收語(yǔ)音識(shí)別系統(tǒng)輸出的多個(gè)候選識(shí)別結(jié)果,將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,其中,所述知識(shí)庫(kù)包括實(shí)體詞表和模板,所述實(shí)體詞表存儲(chǔ)實(shí)體詞,所述模板存儲(chǔ)符合正則表達(dá)式的書(shū)寫(xiě)規(guī)則語(yǔ)句。
[0051]語(yǔ)音識(shí)別系統(tǒng)可以保存并輸出一系列可能的識(shí)別結(jié)果,這些識(shí)別結(jié)果稱為多個(gè)候選識(shí)別結(jié)果(n-best)。
[0052]一般來(lái)說(shuō),正確的識(shí)別結(jié)果通常會(huì)在n-best的某個(gè)候選之中或分散在n_best的各個(gè)候選識(shí)別結(jié)果之中。因此,可以通過(guò)n-best得到輸入語(yǔ)音的大量信息,并通過(guò)問(wèn)答系統(tǒng)的知識(shí)領(lǐng)域選擇最優(yōu)的識(shí)別結(jié)果,從而使問(wèn)題提取更加合理。
[0053]例如,用戶輸入的句子為:“請(qǐng)問(wèn)魯訊有哪些書(shū)? ”語(yǔ)音識(shí)別系統(tǒng)輸出的n-best結(jié)果如下:
[0054]1-best:請(qǐng)問(wèn)魯信有哪些書(shū)?
[0055]2-best:親吻魯訊又拿些書(shū)?
[0056]3-best:請(qǐng)問(wèn)路尋有那些書(shū)?
[0057]…
[0058]將以上多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,若候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板匹配成功,則查找數(shù)據(jù)庫(kù),輸出匹配后的識(shí)別結(jié)果。
[0059]在語(yǔ)音識(shí)別系統(tǒng)中,知識(shí)庫(kù)中包含實(shí)體詞表、數(shù)據(jù)庫(kù)和模板。實(shí)體詞表存儲(chǔ)實(shí)體詞,其中,實(shí)體詞由實(shí)體和實(shí)體的屬性組成。數(shù)據(jù)庫(kù)存儲(chǔ)實(shí)體和實(shí)體的屬性等信息,對(duì)于某具體的實(shí)體及其屬性信息通過(guò)實(shí)體詞表中的實(shí)體詞體現(xiàn)。而模板存儲(chǔ)符合正則表達(dá)式的書(shū)寫(xiě)規(guī)則語(yǔ)句。
[0060]例如:書(shū)或作者是實(shí)體,則書(shū)的實(shí)體屬性包含有:書(shū)名、作者、出版社、價(jià)格、評(píng)分等信息;而作者的實(shí)體屬性包含有:作者名、國(guó)家、出生年月、代表作等信息。一個(gè)實(shí)例如下:
[0061]實(shí)體詞表一 author:魯迅張愛(ài)玲毛姆。
[0062]實(shí)體詞表二 book:吶喊小團(tuán)圓人性的枷鎖。
[0063]數(shù)據(jù)庫(kù):魯迅中國(guó)2001.10《狂人日記》。[0064]吶喊魯迅中國(guó)出版社19.8元9.0分。
[0065]模板:(請(qǐng)問(wèn)I我想知道)*book(是)(誰(shuí)I哪個(gè)I作家)(寫(xiě)的I著作的)(呢啊 I 么 I 嘛)*author。
[0066](那I那么I我I你I想I知道)*author(的|書(shū))+book(價(jià)格|價(jià)錢(qián)|多少錢(qián))+ (啊I嗎I呀I呢I嘛I么)*price。
[0067]其中,模板的書(shū)寫(xiě)格式符合正則表達(dá)式的書(shū)寫(xiě)規(guī)則,模板中的author或price表示的是對(duì)應(yīng)查找的目標(biāo)。
[0068]需要說(shuō)明的是,在實(shí)際使用時(shí)用戶可以根據(jù)實(shí)際情況設(shè)置數(shù)據(jù)庫(kù)中實(shí)體中包含的屬性和模板的信息。
[0069]步驟102:若所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板匹配均不成功,則計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離
[0070]例如:多個(gè)候選識(shí)別結(jié)果如下:
[0071]1-best:請(qǐng)問(wèn)魯信有哪些書(shū)?
[0072]2-best:親吻魯訊又拿些書(shū)?
[0073]3-best:請(qǐng)問(wèn)路尋有那些書(shū)?
[0074]此時(shí),知識(shí)庫(kù)中有一個(gè)模板為“*〈作者>*〈哪些I什么 > 書(shū)”,則以上多個(gè)候選識(shí)別結(jié)果全部與知識(shí)庫(kù)中的模板匹配均不成功,則計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
[0075]步驟103:根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值,根據(jù)所述匹配分值將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,得到所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板的匹配度。
[0076]多個(gè)候選識(shí)別結(jié)果的信任度是指語(yǔ)音識(shí)別中語(yǔ)音識(shí)別器會(huì)對(duì)多個(gè)候選結(jié)果進(jìn)行打分,打分后的結(jié)果作為信任度。
[0077]通過(guò)計(jì)算多個(gè)候選識(shí)別結(jié)果的匹配分值,從計(jì)算出的匹配分值中選擇最優(yōu)的匹配分值與知識(shí)庫(kù)中的模板進(jìn)行匹配,得到所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板的匹配度,從而大大提高了知識(shí)庫(kù)中的模板匹配成功率。
[0078]步驟104:根據(jù)所述匹配度,輸出匹配后的識(shí)別結(jié)果。
[0079]匹配后的識(shí)別結(jié)果是指多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板最接近的識(shí)別結(jié)果。例如一個(gè)候選識(shí)別結(jié)果:親吻魯訊又哪些書(shū)?知識(shí)庫(kù)中的模板為:“*〈作者>*〈哪些I什么>書(shū)”、“請(qǐng)問(wèn)*〈書(shū)>*作家”、“你知道*〈書(shū)>*〈作者 >,,’則將這個(gè)候選結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板分別進(jìn)行匹配,得到候選結(jié)果匹配后的識(shí)別結(jié)果是請(qǐng)問(wèn)魯迅有哪些書(shū)?
[0080]通過(guò)本實(shí)施例,針對(duì)語(yǔ)音識(shí)別系統(tǒng)輸出的候選識(shí)別結(jié)果易受口音、噪聲等影響出現(xiàn)隨機(jī)錯(cuò)誤的問(wèn)題,本申請(qǐng)通過(guò)計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離,根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值,從計(jì)算出的匹配分值中確定出最優(yōu)匹配分值,將得到的最優(yōu)匹配分值的多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板進(jìn)行模糊匹配,得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板的匹配度,由于知識(shí)庫(kù)中存儲(chǔ)的模板是經(jīng)過(guò)大量的收集和校對(duì)得到的普遍正確的模板,從而解決了語(yǔ)音識(shí)別錯(cuò)誤對(duì)問(wèn)答系統(tǒng)影響的問(wèn)題。
[0081]參照?qǐng)D2,示出了本申請(qǐng)實(shí)施例二中的一種語(yǔ)音識(shí)別方法的流程圖。[0082]本實(shí)施例中,以語(yǔ)音系統(tǒng)為例,對(duì)本申請(qǐng)的語(yǔ)音識(shí)別方法進(jìn)行說(shuō)明。語(yǔ)音系統(tǒng)包括語(yǔ)音識(shí)別系統(tǒng)和問(wèn)答系統(tǒng)兩個(gè)子系統(tǒng)。其中,用戶以口述的形式將問(wèn)題作為語(yǔ)音輸入傳給語(yǔ)音識(shí)別系統(tǒng),語(yǔ)音識(shí)別系統(tǒng)根據(jù)語(yǔ)音輸入而輸出多個(gè)候選識(shí)別結(jié)果,多個(gè)候選識(shí)別結(jié)果被發(fā)送到問(wèn)答系統(tǒng)。問(wèn)答系統(tǒng)接收到多個(gè)候選識(shí)別結(jié)果后與系統(tǒng)知識(shí)庫(kù)中的模板進(jìn)行匹配,得到最接近的匹配模板,進(jìn)而通過(guò)查詢知識(shí)庫(kù)中的模板得到輸入問(wèn)題的相應(yīng)答案。以下具體說(shuō)明。
[0083]具體地,本實(shí)施例的一種語(yǔ)音識(shí)別方法包括:
[0084]步驟201:接收語(yǔ)音識(shí)別系統(tǒng)輸出的多個(gè)候選識(shí)別結(jié)果。
[0085]步驟202:將接收的多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板進(jìn)行模板匹配。
[0086]步驟203:判斷接收的多個(gè)候選識(shí)別結(jié)果在知識(shí)庫(kù)中是否匹配到模板。
[0087]若多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板匹配成功,則輸出匹配后的識(shí)別結(jié)果。
[0088]若多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板匹配不成功,則計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
[0089]進(jìn)一步地,所述計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離的步驟包括:
[0090]通過(guò)編輯距離修正公式計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離,包括:
[0091]通過(guò)第一編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第一距離,其中,所述第一編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和插入錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離。
[0092]其中,一種單純的編輯距離公式為:
[0093]D(i,j) =D(i_l,j)+l 或 D(i,j) = D (i,j_l)+1,其中,i 為候選識(shí)別結(jié)果的字符
串,j為知識(shí)庫(kù)中存儲(chǔ)的字符串。
[0094]其中,單純的編輯距離公式中的刪除、插入、替換的算法參數(shù)取為1,而本申請(qǐng)中的插入錯(cuò)誤的算法參數(shù)是通過(guò)標(biāo)準(zhǔn)的語(yǔ)音的音素而設(shè)置的,插入錯(cuò)誤的算法參數(shù)一般取值的范圍是0_3。
[0095]通過(guò)第二編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第二距離,其中,所述第二編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和刪除錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離。
[0096]其中,一種單純的編輯距離公式為:
[0097]D(i,j) =D(i_l,j)+l 或 D(i,j) = D (i,j_l)+1,其中,i 為候選識(shí)別結(jié)果的字符串,j為知識(shí)庫(kù)中存儲(chǔ)的字符串,D(i,j)為候選識(shí)別結(jié)果的字符串到知識(shí)庫(kù)中存儲(chǔ)的字符串的距離。
[0098]其中,單純的編輯距離公式中的刪除、插入、替換的懲罰分值取為1,而本申請(qǐng)中的插入錯(cuò)誤的算法參數(shù)是通過(guò)標(biāo)準(zhǔn)的語(yǔ)音的音素而設(shè)置的,插入刪除錯(cuò)誤的算法參數(shù)一般取值的范圍是0-3。
[0099]通過(guò)第三編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第三距離,其中,所述第三編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和多個(gè)候選識(shí)別結(jié)果的字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的標(biāo)準(zhǔn)音素的失配分值得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
[0100]將所述第一距離、第二距離和第三距離中的最小值確定為所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
[0101]進(jìn)一步地,所述第一編輯距離修正公式為:D(N,M) = D(1-1, j)+c。
[0102]所述第二編輯距尚修正公式為:D(N, M) =D(i,j_l)+v。
[0103]所述第二編輯距尚修正公式為:D (N, Μ) = D (i_l, j-1)+d(w, V)。(I)
[0104]其中,i為多個(gè)候選識(shí)別結(jié)果的字符串,j為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串,c和V為算法參數(shù),C為插入錯(cuò)誤失配權(quán)重,V為刪除錯(cuò)誤失配權(quán)重,d(w, V)為多個(gè)候選識(shí)別結(jié)果第1-Ι個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-Ι個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值,D (N, M)為多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
[0105]進(jìn)一步地,所述d(w, V)通過(guò)以下方式獲得:
[0106]根據(jù)混淆矩陣計(jì)算多個(gè)候選識(shí)別結(jié)果第1-Ι個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-Ι個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值。
[0107]對(duì)于語(yǔ)音問(wèn)答系統(tǒng),n-best輸出的多個(gè)候選識(shí)別結(jié)果中的絕大部分發(fā)音和正確發(fā)音都具有相似性,我們可以利用這種相似性來(lái)規(guī)范編輯距離修正公式中的失配分值。即在編輯距離修正公式中,對(duì)發(fā)音相近的失配詞對(duì)給以較小的失配分值,對(duì)發(fā)音相差較大的失配詞給以較大的失配分值。
[0108]本申請(qǐng)通過(guò)混淆矩陣計(jì)算多個(gè)候選識(shí)別結(jié)果的音素與知識(shí)庫(kù)中存儲(chǔ)模板的標(biāo)準(zhǔn)音素的失配分值。
[0109]其中,音素是最小的語(yǔ)音單位,在音質(zhì)意義上來(lái)說(shuō)每個(gè)音素都有自己的發(fā)音特色。音素的基元數(shù)目較少,漢語(yǔ)標(biāo)準(zhǔn)普通話中有35個(gè)音素,如表1所示。
[0110]表1漢語(yǔ)音素
[0111]
【權(quán)利要求】
1.一種語(yǔ)音識(shí)別的方法,其特征在于,包括: 接收語(yǔ)音識(shí)別系統(tǒng)輸出的多個(gè)候選識(shí)別結(jié)果,將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,其中,所述知識(shí)庫(kù)包括實(shí)體詞表和模板,所述實(shí)體詞表存儲(chǔ)實(shí)體詞,所述模板存儲(chǔ)符合正則表達(dá)式的書(shū)寫(xiě)規(guī)則語(yǔ)句; 若所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板匹配均不成功,則計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離; 根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值,根據(jù)所述匹配分值將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,得到所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板的匹配度; 根據(jù)所述匹配度,輸出匹配后的識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離的步驟包括:通過(guò)編輯距離修正公式計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離,包括:通過(guò)第一編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第一距離,其中,所述第一編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和插入錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離; 通過(guò)第二編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第二距離,其中,所述第二編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和刪除錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離; 通過(guò)第三編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第三距離,其中,所述第三編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和多個(gè)候選識(shí)別結(jié)果字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的標(biāo)準(zhǔn)音素的失配分值得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離; 將所述第一距離、第二距離和第三距離中的最小值確定為所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述第一編輯距離修正公式為:D(N,M) = D(1-1, j)+c ; 所述第二編輯距離修正公式為:D(N,M) = D(i, j-l)+v ; 所述第二編輯距尚修正公式為:D (N, Μ) = D (1-1, j-1) +d(w, v); 其中,i為多個(gè)候選識(shí)別結(jié)果的字符串,j為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串,c和V為算法參數(shù),c為插入錯(cuò)誤失配權(quán)重,V為刪除錯(cuò)誤失配權(quán)重,d (W,V)為多個(gè)候選識(shí)別結(jié)果第1-1個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-Ι個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值,D(N1M)為多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述d(W,V)通過(guò)以下方式獲得: 根據(jù)混淆矩陣計(jì)算多個(gè)候選識(shí)別結(jié)果第1-Ι個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-1個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值的步驟包括: 根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度,使用貝葉斯公式計(jì)算多個(gè)候選識(shí)別結(jié)果的匹配分值。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,其中,所述貝葉斯公式為:
D (O, L)=D (N, M) P (XI O); 其中,O為輸入語(yǔ)音,X為多個(gè)候選識(shí)別結(jié)果,P(Xlo)為語(yǔ)音識(shí)別系統(tǒng)對(duì)多個(gè)候選識(shí)別結(jié)果X的信任度,D (N,M)為多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離,D (0,L)為多個(gè)候選識(shí)別結(jié)果的匹配分值。
7.一種語(yǔ)音識(shí)別的裝置,其特征在于,包括: 接收模塊,用于接收語(yǔ)音識(shí)別系統(tǒng)輸出的多個(gè)候選識(shí)別結(jié)果,將所述多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,其中,所述知識(shí)庫(kù)包括實(shí)體詞表和模板,所述實(shí)體詞表存儲(chǔ)實(shí)體詞,所述模板存儲(chǔ)符合正則表達(dá)式的書(shū)寫(xiě)規(guī)則語(yǔ)句; 計(jì)算模塊,用于若所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中的模板匹配均不成功,則計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離; 匹配模塊,用于根據(jù)所述距離和多個(gè)候選識(shí)別結(jié)果的信任度得到多個(gè)候選識(shí)別結(jié)果的匹配分值,根據(jù)所述 匹配分值將多個(gè)候選識(shí)別結(jié)果分別與知識(shí)庫(kù)中的模板進(jìn)行匹配,得到所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中模板的匹配度; 輸出模塊,用于根據(jù)所述匹配度,輸出匹配后的識(shí)別結(jié)果。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述計(jì)算模塊通過(guò)編輯距離修正公式計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離,包括: 第一編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第一距離,其中,所述第一編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和插入錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離; 通過(guò)第二編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第二距離,其中,所述第二編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和刪除錯(cuò)誤的算法參數(shù)得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離; 通過(guò)第三編輯距離修正公式,計(jì)算多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的第三距離,其中,所述第三編輯距離修正公式用于根據(jù)多個(gè)候選識(shí)別結(jié)果的字符串轉(zhuǎn)換為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的距離和多個(gè)候選識(shí)別結(jié)果字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的字符串的標(biāo)準(zhǔn)音素的失配分值得到多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)模板之間的距離; 將所述第一距離、第二距離和第三距離中的最小值確定為所述多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于, 所述第一編輯距離修正公式為:D(N,M) = D(1-1, j)+c ; 所述第二編輯距離修正公式為:D(N,M) = D(i, j-1)+V ;所述第二編輯距尚修正公式為:D (N, M) = D (i_l, j-1)+d (w, V); 其中,i為多個(gè)候選識(shí)別結(jié)果的字符串,j為知識(shí)庫(kù)中存儲(chǔ)的模板的字符串,c和V為算法參數(shù),c為插入錯(cuò)誤失配權(quán)重,V為刪除錯(cuò)誤失配權(quán)重,d (W,V)為多個(gè)候選識(shí)別結(jié)果第1-1個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-Ι個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值,D(N1M)為多個(gè)候選識(shí)別結(jié)果與知識(shí)庫(kù)中存儲(chǔ)的模板的距離。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述d(W,V)通過(guò)以下方式獲得: 根據(jù)混淆矩陣計(jì)算多個(gè)候選識(shí)別結(jié)果第1-Ι個(gè)字符串的音素與知識(shí)庫(kù)中存儲(chǔ)的模板的第j-1個(gè)字符串的標(biāo)準(zhǔn)音素的失配分值。
【文檔編號(hào)】G10L15/26GK104021786SQ201410205944
【公開(kāi)日】2014年9月3日 申請(qǐng)日期:2014年5月15日 優(yōu)先權(quán)日:2014年5月15日
【發(fā)明者】喬亞飛, 趙芳, 游世學(xué), 孟凡興, 鄭永濤 申請(qǐng)人:北京中科匯聯(lián)信息技術(shù)有限公司