亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

嵌入式語音命令識別系統(tǒng)中非命令詞快速拒識方法

文檔序號:2821703閱讀:536來源:國知局
專利名稱:嵌入式語音命令識別系統(tǒng)中非命令詞快速拒識方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語音技術(shù)領(lǐng)域的非命令詞快速拒識方法,具體涉及一種嵌入式語音命令識別系統(tǒng)中非命令詞快速拒識方法。
背景技術(shù)
語音識別系統(tǒng)中的識別詞匯總是有限的,說話人可能會講到識別詞表以外的單詞,夾帶一些呼吸聲、咳嗽聲,周圍的環(huán)境也會有一些突發(fā)的噪聲,這些聲音都會被系統(tǒng)采集到,此時如果系統(tǒng)不能夠正確判斷,必然會得出錯誤識別結(jié)果,有可能使系統(tǒng)進(jìn)一步向錯誤的方向發(fā)展。因此在語音識別系統(tǒng)的實際應(yīng)用中,為提高系統(tǒng)的穩(wěn)健性和可靠性,系統(tǒng)必須能夠處理非關(guān)鍵詞以及咳嗽、呼吸、背景噪聲等非語音發(fā)聲,采用拒識算法對這些詞表以外的語音進(jìn)行檢測與拒識,從而提高系統(tǒng)的整體性能。大多數(shù)現(xiàn)有的拒識算法分為兩類,一種基于廢料模型,它需要為非命令詞發(fā)音建立模型(基于HMM的語音識別)或模板(基于DTW的語音識別),雖然算法具有一定的效果,但這些模型或模板難以設(shè)計和訓(xùn)練,并且會大大增加識別時的計算量。另一種拒識算法則直接應(yīng)用識別結(jié)果,例如前N個候選詞的概率,通過計算置信度或采用分類器(例如神經(jīng)網(wǎng)絡(luò))來實現(xiàn)命令詞與非命令詞的分類。
在語音識別系統(tǒng)的實際應(yīng)用中,特別是基于DSP等硬件的識別系統(tǒng),識別的實時性和有限的運(yùn)算資源要求拒識算法簡單有效,因此直接采用識別結(jié)果進(jìn)行拒識是比較可行的方案,它避免了廢料模型的訓(xùn)練以及多余的計算。
經(jīng)文獻(xiàn)檢索發(fā)現(xiàn),Changxue Ma等人在《Acoustics,Speech and SignalProcessing,2001 IEEE》Volume1,7-11 May 2001上發(fā)表“A Support VectorMachines-based Rejection Technique for Speech Recognition”(《IEEE聲學(xué)、語音與信號處理》,“語音識別中基于支持向量機(jī)的拒識技術(shù)”),該文中對于HMM模型提出了基于支持向量機(jī)的置信度計算方法對識別結(jié)果進(jìn)行驗證與拒識,但不適用于DTW識別方法,也不便于DSP實現(xiàn)。因此,針對嵌入式語音識別系統(tǒng),需要在控制拒識算法復(fù)雜度的基礎(chǔ)之上,進(jìn)一步提高算法的性能。

發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提出一種嵌入式語音命令識別系統(tǒng)中非命令詞快速拒識方法,使得在保持計算簡單、適于嵌入式應(yīng)用的同時,還能進(jìn)一步提高對非命令詞語音的拒識率,可以做到對識別結(jié)果的實時驗證。
本發(fā)明是通過以下技術(shù)方案實現(xiàn)的,本發(fā)明直接利用語音識別結(jié)果中前N個候選詞的識別得分,通過計算歸一化識別得分以及歸一化一階差分,以很小的計算代價提取具有高度區(qū)別性的特征向量用于識別結(jié)果的驗證;同時采用先進(jìn)的支持向量機(jī)理論,結(jié)合數(shù)據(jù)融合技術(shù),提出具有最大推廣能力和抗噪能力的分類器—基于類融合中心的支持向量機(jī);在使用前首先采用訓(xùn)練數(shù)據(jù)得到分類器的優(yōu)化參數(shù),使用時只需將提取的特征向量輸入到此分類器中,就能根據(jù)分類結(jié)果實現(xiàn)對非命令詞的快速拒識。本發(fā)明直接利用識別結(jié)果提取特征,計算簡單有效,并通過數(shù)據(jù)融合技術(shù)改進(jìn)傳統(tǒng)支持向量機(jī)分類器的抗噪性能,進(jìn)一步提高了非命令詞的拒識效果,特別適用于資源非常有效的嵌入式實時語音識別系統(tǒng)。
以下對本發(fā)明作進(jìn)一步的說明,本發(fā)明包括特征提取、改進(jìn)的支持向量機(jī)算法和非命令詞快速拒識三個步驟1、特征提取在語音識別系統(tǒng)中,一般只為待識別的命令建立模型或模板。當(dāng)輸入的語音是非命令詞時,識別結(jié)果的得分一般低于命令詞,由于識別得分對不同說話人存在較大差異,因此其本身并不能很好的區(qū)別命令詞和非命令詞兩類語音。從識別結(jié)果可以發(fā)現(xiàn),對于非命令詞語音而言,其識別所得的最優(yōu)候選詞歸一化得分比命令詞的歸一化識別得分相對較小,即使是不同說話人情況下也是如此。同時,相應(yīng)的歸一化一階差分值也具有相似的特性。由此可以利用每次識別所得的前N個候選詞,將其歸一化識別得分及其歸一化一階差分作為識別結(jié)果驗證的依據(jù),將它們組成特征向量后輸入到預(yù)先訓(xùn)練好的支持向量機(jī)中,實現(xiàn)對命令詞和非命令詞語音的快速分類。
2、基于類融合中心的支持向量機(jī)作為統(tǒng)計學(xué)習(xí)理論所提出的一種可以直接用于實踐的機(jī)器學(xué)習(xí)方法,支持向量機(jī)通過在結(jié)構(gòu)風(fēng)險最小化原則下使分類間隔最大,獲得了很好的泛化能力,明顯優(yōu)于傳統(tǒng)的基于經(jīng)驗風(fēng)險最小化(ERM)的常規(guī)神經(jīng)網(wǎng)絡(luò)方法,但它對噪聲比較敏感。為提高算法的容噪性能,本發(fā)明采用數(shù)據(jù)融合技術(shù)中的分布圖法計算得到命令詞和非命令詞兩類數(shù)據(jù)集的類融合中心x+和x-,通過計算兩類中心之間的分類超平面獲得類似SVM的最佳推廣能力。
根據(jù)SVM中最優(yōu)問題的求解,可得到與其相類似的優(yōu)化問題為MaxmizeW(α)=Σi=1SΔ·αi+β-12[Σi=1Sαiyixi+β(x+-x-)]·[Σj=1Sαjyjxj+β(x+-x-)]]>s.t.Σi=1Sαiyi=0]]>0≤αi≤Ci=1,…,S其中C>0是控制懲罰程度的常數(shù),s為樣本數(shù)。最后得到其分類函數(shù)為f(x)=sgn(w*·x+b*),其中w*=Σi=1Sαi*yixi+β*(x+-x-),]]>α*,β*為上式的解。參數(shù)b*可由訓(xùn)練集中的任一支持向量確定,也可以是所有支持向量所求b*的平均值。非線性情況下仍然采用核函數(shù)實現(xiàn)高維特征空間的映射,這時的分類函數(shù)將為f(x)=sgn[K(w*·x)+b*]]]>=sgn[Σi=1Sαi*yiK(xi,x)+β*K(x+,x)-β*K(x-,x)+b*]]]>通過求解兩類中心之間的分類超平面,使得噪聲經(jīng)過分布圖法剔除以及類融合中心的平均得到抑制,從而有效地提高了支持向量機(jī)的容噪性能。
此外,可以根據(jù)上式的形式簡化算法,簡化后的分類函數(shù)為f(x)=sgn[(1-λ)Σi=1SαiSVMyiK(xi,x)+λ(K(x+,x)-K(x-,x))+b*]]]>如果采用線性核函數(shù),則f(x)=sgn(w*·x+b*),其中w*=(1-λ)wSVM+λ(x+-x-),0≤λ≤1是結(jié)合參數(shù),根據(jù)應(yīng)用情況決定。
3、非命令詞的快速拒識針對每次識別所得的特征向量,利用已訓(xùn)練好的支持向量機(jī),將特征向量作為支持向量機(jī)的輸入,并根據(jù)支持向量機(jī)分類函數(shù)的輸出結(jié)果,快速拒識非命令詞,再利用支持向量機(jī)輸出的分類函數(shù)結(jié)果y=fSVM(x)∈[-1,1],根據(jù)其符號判斷當(dāng)前識別結(jié)果所屬的類,分類函數(shù)結(jié)果的正負(fù)即對應(yīng)命令詞與非命令詞兩類。即當(dāng)分類函數(shù)值為非負(fù)值時認(rèn)為語音識別系統(tǒng)的識別結(jié)果是命令詞,即待識別的命令,輸出識別結(jié)果,當(dāng)其為負(fù)值時則認(rèn)為是非命令詞,系統(tǒng)進(jìn)行拒識,不輸出識別結(jié)果。
本發(fā)明利用了識別結(jié)果中包含的區(qū)別性信息,不僅能有效區(qū)分命令詞與非命令詞,而且無需額外的計算。通過采用具有最大推廣能力的支持向量機(jī)處理信息,能夠快速有效地進(jìn)行非命令詞的拒識。本發(fā)明應(yīng)用于嵌入式命令集自動語音識別系統(tǒng)的后端處理,在保證識別實時性的同時能有效提高系統(tǒng)的可靠性和實用性,是嵌入式自動語音識別系統(tǒng)推向?qū)嵱玫囊豁楆P(guān)鍵技術(shù)。


圖1基于類融合中心的支持向量機(jī)原理2本發(fā)明實施例中基于類融合中心支持向量機(jī)與一般支持向量機(jī)的性能比較其中(a)不存在outlier時一般SVM的分類結(jié)果;(b)存在outlier時一般SVM的分類結(jié)果;(c)存在outlier時FSVM的分類結(jié)果。
圖3識別結(jié)果中包含的區(qū)別性信息(a)歸一化識別得分的分布;(b)歸一化識別得分一階差分值的分布具體實施方式
為更好地理解本發(fā)明的技術(shù)方案,以下用包含10個命令詞的非特定人語音識別系統(tǒng)作為具體的實例作進(jìn)一步的說明。
本發(fā)明提出的非命令詞快速拒識算法完成對語音識別結(jié)果的后端處理,它直接利用識別的計算結(jié)果,實現(xiàn)對命令詞與非命令詞的分類,具有快速、有效、易于實現(xiàn)等特點。在對識別結(jié)果進(jìn)行驗證與拒識之前,支持向量機(jī)已經(jīng)訓(xùn)練好。根據(jù)識別得分的差分值所組成的特征向量,支持向量機(jī)輸出一個與之相對應(yīng)的分類函數(shù)值,由此判斷出此識別結(jié)果對應(yīng)的是待識別命令詞還是非命令詞。算法所用的支持向量機(jī)方法基于統(tǒng)計學(xué)習(xí)理論,是目前最佳的一種小樣本學(xué)習(xí)理論,具有較好的泛化能力,用于嵌入式自動語音識別系統(tǒng)的后端處理具有良好的性能。
實施例1、特征提取可以將歸一化識別得分及其歸一化一階差分值作為區(qū)別性信息,用于非命令詞的檢測。設(shè)q1,q2,Λ,qN為前N個候選詞的識別得分,按從小到大的順序排列。
則其歸一化識別得分為di=qiΣi=1N|qi|,i=1,Λ,N----(8)]]>相應(yīng)的歸一化一階差分值為di′=|qi-qi+1|Σi=1N-1|qi-qi+1|,]]>i=1,Λ,N-1。將它們組成的特征向量{d1,Λ,dN,d1′,Λ,dN-1′}作為支持向量機(jī)(SVM)的輸入,對命令詞和非命令詞進(jìn)行分類。
2、支持向量機(jī)訓(xùn)練首先將訓(xùn)練集的識別結(jié)果導(dǎo)入PC機(jī),利用識別結(jié)果中前10個候選詞的歸一化得分(即經(jīng)過歸一化的DTW結(jié)果)及其歸一化一階差分組成19維的向量,訓(xùn)練分類所用的支持向量機(jī)。為保證拒識計算的實時性,需要支持向量機(jī)的計算簡單,因此采用線性核函數(shù)。這里采用300次發(fā)音的識別結(jié)果訓(xùn)練支持向量機(jī),分別對應(yīng)150個命令詞與150個非命令詞。所有命令詞特征向量對應(yīng)的分類函數(shù)值為+1,表示命令詞屬于類+1;所有非命令詞特征向量對應(yīng)的分類函數(shù)值為-1,表示它屬于類-1。訓(xùn)練步驟如下(1)采用SMO方法訓(xùn)練支持向量機(jī),參數(shù)C=50,得到相應(yīng)的權(quán)值向量wSVM。
(2)然后計算兩類的類融合中心x+和x-采用分布圖法檢驗訓(xùn)練集中同類數(shù)據(jù)的一致性,剔除此類數(shù)據(jù)中與實際類中心偏差較大的樣本點(outliers)的影響。再將剩余的數(shù)據(jù)進(jìn)行平均值運(yùn)算(各向量元素分別求平均),得到的平均值向量作為最后的類融合中心。分布圖算法如下設(shè)屬于同一類的數(shù)據(jù)為x1,x2,……xN,它們?yōu)長維向量。分布圖用中位數(shù)(M)、四分位數(shù)(F)、四分位數(shù)離散度(dF)、淘汰點(ρ)等概念來反映數(shù)據(jù)的分布結(jié)構(gòu),以找出數(shù)據(jù)中較不可靠的離異值。設(shè)向量的范數(shù)值為ti,則ti=||xi||=(Σj=1Lx2ij)1/2i=1,2,......N]]>將ti按由小到大的順序排列為T1T2……TN,則TN、T1分別為上、下極值,中位數(shù)為
相應(yīng)的上、下四分位數(shù)Fu、Fl分別為區(qū)間[M,TN]與[T1,M]的中位數(shù),則四分位數(shù)離散度dF=Fu-Fl。若認(rèn)為與中位數(shù)的距離大于βdF即為離異值,即認(rèn)定|Ti-M|>βdF時,Ti是偏差較大的數(shù)據(jù),則得到相應(yīng)的淘汰點為ρ1=Fl-β2dF,]]>ρ2=Fu+β2dF]]>其中β為常數(shù),其大小由經(jīng)驗決定,一般取0.5、1.0、2.0等值。這里取β=2,凡在區(qū)間[ρ1,ρ2]內(nèi)的樣本點數(shù)據(jù)被認(rèn)為是有效的一致性數(shù)據(jù),將這些數(shù)據(jù)作為新的集合再用分布圖法進(jìn)行一致性檢驗,如此重復(fù)檢驗多次,直至沒有數(shù)據(jù)剔除為止。
(3)取λ=0.06,采用簡化方式計算最后分類函數(shù)f(x)=sgn(w*·x+b*),其中參數(shù)w*=(1-λ)wSVM+λ(x+-x-)。出于穩(wěn)定性的考慮,使用所有支持向量對應(yīng)b值的平均值作為b*b*=averSVagek{f(xk)-ΣSVw*·xk}.]]>通過求解兩類中心之間的分類超平面,使得噪聲經(jīng)過分布圖法剔除以及類融合中心的平均得到抑制,從而有效地提高了支持向量機(jī)的性能。與一般支持向量機(jī)的性能比較如圖2所示。
3、非命令詞的快速拒識針對每次識別得到的結(jié)果,按前面所述的方法組成特征向量,并將特征向量輸入到已訓(xùn)練好的支持向量機(jī)中。利用支持向量機(jī)輸出的分類函數(shù)結(jié)果y=fSVM(x)∈[-1,1],將負(fù)值對應(yīng)的識別結(jié)果劃分為非命令詞,將非負(fù)值對應(yīng)為待識別的命令。從線性核支持向量機(jī)分類函數(shù)可以看出,分類函數(shù)的計算簡單,利用該分類函數(shù)的結(jié)果值,即可快速判斷出被識別的命令是否為命令詞,并對屬于非命令詞的語音進(jìn)行拒識。
通過60次發(fā)音(30個為命令詞發(fā)音,30個為非命令詞發(fā)音)作測試表明,本方法對非命令詞的平均拒識率為80%,而對命令詞的錯誤拒識率僅為3.3%。
本發(fā)明提出的非命令詞快速拒識方法與傳統(tǒng)方法(單層感知器(SLP)及多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)方法)以及一般支持向量機(jī)(SVM)方法的比較如表1所示。
表1.各種算法用于非命令詞拒識的性能比較
從表可以看出,具有線性核函數(shù)的一般支持向量機(jī)(SVM)的性能優(yōu)于SLP神經(jīng)網(wǎng)絡(luò)算法,而計算量卻與之相當(dāng)。雖然SVM的性能略優(yōu)于MLP,但支持向量機(jī)用于非命令詞拒識時的計算量(即分類函數(shù)式的計算量)遠(yuǎn)遠(yuǎn)小于MLP?;陬惾诤现行牡闹С窒蛄繖C(jī)(FSVM)是對SVM的一種改進(jìn),在計算量增加較小的情況下表現(xiàn)出了優(yōu)于SVM、SLP、MLP的性能,能夠保證識別的實時性,適于在硬件環(huán)境下實現(xiàn)。
權(quán)利要求
1.一種嵌入式語音命令識別系統(tǒng)中非命令詞快速拒識方法,其特征在于,直接利用語音識別結(jié)果中前N個候選詞的識別得分,通過計算歸一化識別得分以及歸一化一階差分,以很小的計算代價提取具有高度區(qū)別性的特征向量用于識別結(jié)果的驗證,同時采用支持向量機(jī)理論,結(jié)合數(shù)據(jù)融合技術(shù),提出基于類融合中心的支持向量機(jī),在使用前首先采用訓(xùn)練數(shù)據(jù)得到分類器的優(yōu)化參數(shù),使用時只需將提取的特征向量輸入到此分類器中,就能根據(jù)分類結(jié)果實現(xiàn)對非命令詞的快速拒識。
2.根據(jù)權(quán)利要求1所述的嵌入式語音命令識別系統(tǒng)中非命令詞快速拒識方法,其特征是,對其進(jìn)一步的限定,包括特征提取、基于類融合中心支持向量機(jī)和快速拒識三個基本步驟①特征提取直接利用識別的計算結(jié)果,將前N個候選詞識別得分的差分值作為區(qū)別性信息,提取歸一化識別得分及其歸一化一階差分組成特征向量,輸入分類器,用于判別是命令詞還是非命令詞;②基于類融合中心的支持向量機(jī)為提高支持向量機(jī)算法的抗噪性能,利用分布圖法計算各類的類融合中心,并選擇兩類融合中心之間的最優(yōu)超平面作為支持向量機(jī)的解,并提出簡化算法;③非命令詞的快速拒識針對每次識別所得的特征向量,利用已訓(xùn)練好的支持向量機(jī),將特征向量作為支持向量機(jī)的輸入,并根據(jù)支持向量機(jī)分類函數(shù)的輸出結(jié)果,快速拒識非命令詞,即當(dāng)分類函數(shù)值為非負(fù)值時認(rèn)為語音識別系統(tǒng)的識別結(jié)果是命令詞,即待識別的命令,輸出識別結(jié)果,當(dāng)其為負(fù)值時則認(rèn)為是非命令詞,系統(tǒng)進(jìn)行拒識,不輸出識別結(jié)果。
全文摘要
一種語音技術(shù)領(lǐng)域的嵌入式語音命令識別系統(tǒng)中非命令詞快速拒識方法,直接利用語音識別結(jié)果中前N個候選詞的識別得分,通過計算歸一化識別得分以及歸一化一階差分,以很小的計算代價提取具有高度區(qū)別性的特征向量用于識別結(jié)果的驗證,同時采用支持向量機(jī)理論,結(jié)合數(shù)據(jù)融合技術(shù),提出基于類融合中心的支持向量機(jī),在使用前首先采用訓(xùn)練數(shù)據(jù)得到分類器的優(yōu)化參數(shù),使用時只需將提取的特征向量輸入到此分類器中,就能根據(jù)分類結(jié)果實現(xiàn)對非命令詞的快速拒識。本發(fā)明利用了識別結(jié)果中包含的區(qū)別性信息,不僅能有效區(qū)分命令詞與非命令詞,而且無需額外的計算。通過采用具有最大推廣能力的支持向量機(jī)處理信息,能夠快速有效地進(jìn)行非命令詞的拒識。
文檔編號G10L15/06GK1614685SQ20041006679
公開日2005年5月11日 申請日期2004年9月29日 優(yōu)先權(quán)日2004年9月29日
發(fā)明者朱杰, 蔡鐵 申請人:上海交通大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1