亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

識別至少疊加了一個干擾信號的時變測試信號中的至少一個隱式馬爾科夫模型建模的有...的制作方法

文檔序號:2820034閱讀:306來源:國知局
專利名稱:識別至少疊加了一個干擾信號的時變測試信號中的至少一個隱式馬爾科夫模型建模的有 ...的制作方法
由于技術(shù)系統(tǒng)自動化的日益增長,模式識別的意義也日益增加。經(jīng)常的情形是,模式包含在以某種方式從應(yīng)被檢驗的過程中獲得的測試信號中。一個例子是自然語言的分析,或者簽名的檢驗。作為測試號自動分析,特別適合的是隱式馬爾科夫(Hiedden-Markov-Modelle)模型[3]。
但是,測試信號自動分析的一個問題在于,要檢驗的測試信號常常與統(tǒng)計的、或者與數(shù)量恒定的干擾信號疊加。在采集和分析自然發(fā)音的語言時,可以遇到例如背景噪聲、呼吸噪聲、機器噪聲、或者由接收介質(zhì)和傳輸距離引起的干擾信號。在其它的測試信號中可能有類似的誤差源。為了能夠在困難的條件下從一個較大的模式中找出一個已知的模式,提出一種使用特殊隱式馬爾科夫模型的估計方法[1]。這里引入一個特別的模型(混亂Garbage模型或者背景模型),它把包括通常語音在內(nèi)的背景噪聲的模型化。這一特殊模型必須在所有情況下用相應(yīng)的噪聲或語音訓(xùn)練。這意味著,在識別一個模式時,只能夠考慮存在于訓(xùn)練材料中的那些噪聲或者干擾。在每種情況下,該模型的模型化對一個關(guān)鍵詞或者任何一個要識別的模式的總概率有很大影響。一個另外的缺點是,該背景模型也識別語音發(fā)音或者在其它的測試信號種類情況下識別真正屬于一個要識別的模式或關(guān)鍵詞的模式的某些部分。這樣產(chǎn)生另外建立該模型適當加權(quán)的問題,以避免過低的檢測率[1]。使用隱式馬爾科夫模型分析測試信號時考慮干擾部分的其它途徑,在現(xiàn)有技術(shù)中是不知道的。
因此,本發(fā)明的一個基本任務(wù)是給出一種方法,它能更好地識別在測試信號中存在的疊加有干擾信號的模式。
該任務(wù)按照權(quán)利要求1的特征解決。
本發(fā)明的其它改進從從屬權(quán)利要求給出。
本發(fā)明方法的一個特別的優(yōu)點在于,可以消除各種背景噪聲,同時可與所有其它的音位模型區(qū)分開。
本發(fā)明方法的另一優(yōu)點在于,為模式識別使用的隱式馬爾科夫模型不必用背景噪聲訓(xùn)練。
這里有利的是,通過本發(fā)明的方法,模式識別的概率完全與在測試信號中存在的干擾噪聲無關(guān)。也就是說,有利的是只要研究要識別的模式存在其中的測試信號的時間段。
有利的是本發(fā)明的方法對于應(yīng)用的每種標準方法都是適宜的。
特別有利的是可以使用維特比算法(Viterbi-Algorithmus)進行模式查找和概率估值[2]。但是有利的是該方法也適于鮑姆-維爾希(Baum-Welch)方法,為此只需作些較小的修改。
有利的是本發(fā)明的方法規(guī)定,在使用維特比算法時在路徑上積累的總發(fā)出概率根據(jù)到該時刻為止所考慮的發(fā)出概率數(shù)規(guī)范化,以便由此避免優(yōu)選較短的路徑。
有利的是按照本發(fā)明實現(xiàn)的對隱式馬爾科夫模型,在計算總發(fā)出概率時的修改,通過引入一個簡單的因子而加以考慮,該因子根據(jù)存在的背景狀態(tài),把要考慮的發(fā)出概率數(shù)改變?yōu)榕c該發(fā)出概率存在的背景狀態(tài)數(shù)或者干擾狀態(tài)有關(guān)的數(shù)。
有利的是在本發(fā)明的方法中使用鮑姆-維爾希方法時,用加法函數(shù)代替取極大值運算,以便能夠把出現(xiàn)的發(fā)出概率的不同數(shù)在所述路徑上同樣加以考慮。
特別有利的是,使用本發(fā)明的方法可以分析語音信號,其中特別是關(guān)鍵詞。這里經(jīng)常碰到背景噪聲,而用于語音分析的數(shù)學上有效的方法由于有時發(fā)生的大數(shù)據(jù)流和實時需求而特別重要。
有利的是本發(fā)明的方法也可用于手寫過程分析,其中要分析的測試信號特別有利地通過光學或者壓力測量裝置得出。這里涉及的是經(jīng)常出現(xiàn)的模式識別過程,它們需要可靠的方法。
下面根據(jù)一個附圖進一步敘述本發(fā)明。


圖1表示本發(fā)明方法的一個例子。
圖中表示了為各個待識別模式的各種不同的隱式馬爾科夫模型W1到Wn。待識別模式的各個隱式馬爾科夫模型通過大量狀態(tài)Z1到ZN表示。特別有利的是通過本發(fā)明的方法給每一個隱式馬爾科夫模型附上一個特別的狀態(tài),圖中用H表示。有利的是該狀態(tài)分別直接附加在每一待識別隱式馬爾科夫模型之前和之后。各隱式馬爾科夫模型的該狀態(tài)H代表周圍環(huán)境中的干擾噪聲。其特征特別表現(xiàn)在不占有任何發(fā)出概率和任何轉(zhuǎn)移概率。以這種方式通過本發(fā)明的方法,特別有利的是可以把每個要查找的模式和為此存在的隱式馬爾科夫模型簡單地重疊起來,因為為識別該模式,只需使用該模式在測試信號中存在的相關(guān)的時間段。這里,待分析的測試信號MS從左方被詳細標明。
本發(fā)明的方法可以應(yīng)用于例如單個詞匯命令系統(tǒng)中的自動語音識別。其中實際上經(jīng)常出現(xiàn)這種情況,發(fā)言者說出一個允許的命令詞,并將其例如插入一個句子中。另一種使用常規(guī)識別不能滿意解決的情況是通過環(huán)境噪聲出現(xiàn)的干擾在該命令或關(guān)鍵詞之前和之后。
為解決上面的問題,提出了本發(fā)明方法,它能夠例如從任意干擾信號中查找和識別關(guān)鍵詞。在這件事情上,與其它的估值方法比較,對于背景噪聲不需要任何前提條件。如果該方法應(yīng)用于語音識別,那么不需對干擾信號的種類作任何假定。本發(fā)明的方法是通過應(yīng)用隱式馬爾科夫模型實現(xiàn)這一點的,其中,對一個關(guān)鍵詞或者一個要識別的模式的每一個模型,用一個代表背景噪聲或背景干擾的特別狀態(tài)在詞首和詞尾補全。這里與眾所周知的方法不同,這一特別的狀態(tài)無需對可能的背景噪聲進行訓(xùn)練。于是使用所說明的方法可能非常簡單,只需考慮實際包含所涉及的模式的時間段,因此信號的其余部分可以不必考慮,并且因此使詞的識別或者模式識別大大簡化,而與此相關(guān)的計算開銷也大為簡省。
迄今為止的方法的缺點是,干擾噪聲的基本背景模型也含有一些模式部分。因此,不能干凈地分開要識別的模式和背景噪聲。這里,本發(fā)明設(shè)定,特別在一定程度上人為地準備好在測試信號流中的待識別模式。為此所獲得的隱式馬爾科夫模型為單個的模式擴展一個特珠的狀態(tài),其特征為它不含有任何發(fā)出能量和沒有任何轉(zhuǎn)移概率。這樣可以把待識別的模式干凈地從測試信號信息的其余部分分離出來。并且,本發(fā)明的方法有可能使包含待識別模式的測試信號的時間段為模式識別得到準確利用。如同在眾所周知的方法中那樣,這里把一個背景干擾的特別模型添加在待識別的模式的隱式馬爾科夫模型上。但是該模式模型僅由一個唯一的狀態(tài)組成,同時與其它的標準模型無論其轉(zhuǎn)移概率還是其發(fā)出概率都不同。選擇的轉(zhuǎn)移概率考慮到不可能預(yù)言環(huán)境干擾的持續(xù)時間。正如希望的那樣查找到的模式的時間位置,對于一個產(chǎn)生概率而言完全無關(guān)。另外也不需確定詞界限。與轉(zhuǎn)移概率類似,發(fā)出概率也不必考慮,因為這些干擾不能充分模型化。新的和未預(yù)料到的干擾也被吸收,而無需將該模型為此進行訓(xùn)練,這具有極大優(yōu)點。也就是說,一個關(guān)鍵詞的概率在語音識別時完全獨立于環(huán)境,這意味著,只考慮與該關(guān)鍵詞相關(guān)的時間段。然而在識別該模式時,不需訓(xùn)練背景模型的優(yōu)點是用增大的計算開銷換來的。這會出現(xiàn)下面的問題在重新組合時,亦即在比較兩個可能路徑和決定更可能的路徑時,在路徑中一般包含有許多不同的有效發(fā)出概率。這一點也能從表1得出,表1包含一個以偽編碼表示的程序清單,它表示本發(fā)明方法的一個例子。表中特別要注意累積發(fā)出概率一段?,F(xiàn)在的問題在于,維特比算法總是挑選最大概率的路徑。這在通常情況下是具有最少有效發(fā)出概率的那個路徑。其結(jié)果是對于每次比較,必須根據(jù)所屬路徑上有效發(fā)出概率當時的數(shù)目進行積累概率的規(guī)范化。特別是在這種估值時必須考慮添加的人工環(huán)境狀態(tài)的性質(zhì),如前所述,這種狀態(tài)不具有任何發(fā)出概率和轉(zhuǎn)移概率,因而可能導(dǎo)致估值錯誤。用公式表示的話,標準維特比方法的累積概率用下面的有效遞推方程式給出δt+1(j)=max1<j<N(δt(i)aij*bj(Ot+1))]]>這里t表示當前時間點,j表示模型狀態(tài),i,j表示該模型狀態(tài)的下標,a表示從狀態(tài)i到狀態(tài)j的轉(zhuǎn)移概率,bj表示觀察為O時例如一個語音信號的特征狀態(tài)j的發(fā)出概率,N表示模型狀態(tài)的數(shù)目。在本方法中,它轉(zhuǎn)變?yōu)榱硪幻枋鲂问?。對于發(fā)出概率,下面的關(guān)系成立。定義例如n p個段{S0,S1,SN-1},其中S0例如是所謂的背景模型段。一個詞模型的每一狀態(tài)j,1≤j≤N,在這里正好分配一個段,Segm(j)=Sk,其中Segm(1)=Segm(N)=S0成立。下面用記分(Score),代替概率否則類似[3]。
aij記為Aij(亦即Aij=-const Inaij)bj(Ot) 記為B(Sk,Ot)=-const In bk(Ot)δt(j) 記為Δt(j)另外定義LSc(Sk,Ot)=B(Sk,Ot)-min1≤j≤N-1B(St,Ot)]]>局部分因此,HMM遞推算法可以以下面的修改形式表示
ψ(j)=1≤i≤NargminΔt(i)+Δt+1Inkrement(i,j)1t(i)+1]]>Δt+1(j)=Δt(ψ(j))+Δt+1Inkrement(ψ(j),j)]]>綜合分式中,It(i)表示在Δt(i)中積累的、并從ΔInkrement定義中“否則”場合得出的ΔInkrement數(shù)。
類似地,當通過求和函數(shù)代替argmin運算時,對于鮑姆-維爾希方法也得出同樣結(jié)果。與標準識別方法相比,本發(fā)明的方法由于需要另外存儲路徑長度,使得存儲器用量增大一倍。然而與此相反,本方法由于不需對背景干擾進行訓(xùn)練,而相對于在待識別的模式之前和之后的任何背景干擾來說特別穩(wěn)定。本發(fā)明方法不僅對語音識別,而且對一般模式識別應(yīng)用特別適宜(例如醫(yī)療技術(shù),圖像識別,筆跡識別)。
下面敘述表1,其中以偽碼表示的一個程序給出本發(fā)明方法的一個例子,使用這一程序可以按照本發(fā)明的方法實現(xiàn)語音識別。
該程序以一個由main和end為界的主程序開始。它包括子程序word-spotter。例如這里識別在一個語音信號中包含的命令詞。這一點應(yīng)該借助于經(jīng)訓(xùn)練的隱式馬爾科夫模型實現(xiàn)。子程序word-spotter為每一參考模型計算一次模型發(fā)出概率。它用以“foreach”和“enddo”為界的do循環(huán)形式解決。該do循環(huán)包含一個子程序,compute-modell-emission-probability(計算模型發(fā)出概率)。在該循環(huán)中,對所有要分類的模式的特征向量計算局部對數(shù)發(fā)出概率,亦即特征向量Ot從模型狀態(tài)k發(fā)出的概率。接著,求出對模型狀態(tài)k的最佳路徑的發(fā)出概率。這通過子程序accumulate-emission-probability(累積發(fā)出概率)實現(xiàn)。最佳路徑的長度通過該子程序求出并存儲。如果到達該詞的結(jié)尾,則該子程序確定ifword end detected(如果檢測到詞尾)則返回主程序。子程序compute-modell-emission-probability包含另外一個子程序compute-local-emission-proba bility(計算局部發(fā)出概率)。使用該子程序可以得出各個狀態(tài)的局部發(fā)出概率bk(Ok)。這一點非常重要,因為本發(fā)明的方法要點也在這里。因為根據(jù)本發(fā)明,在模式開始和模式結(jié)尾附在各個隱式馬爾科夫模型的特別狀態(tài)不具有任何發(fā)出概率。這意味著,其局部概率為1,因此其發(fā)出概率為0。該子程序?qū)τ谶@種情況賦予0值,否則它對于當前的特征向量完全正常地計算發(fā)出概率。子程序compute-modell-emission-probability包含另外的子程序accumulate-emission-probability。在這里對按其當時的長度規(guī)范化的所有可能前行者的各個路徑上的累積概率彼此進行比較。接著,把為識別該模式最佳的概率存儲起來。也就是說,把從最佳可能前行者狀態(tài)的累積的對數(shù)發(fā)出概率以及局部對數(shù)發(fā)出概率得出的和存儲起來。這里例如存儲沒有背景噪聲的待識別模式的長度。
該實施例不能看作為對本發(fā)明的限制。它只應(yīng)當把本發(fā)明基本考慮具體化。特別要注意的是,本發(fā)明對任何種類的模式識別都適用。特別是它也可以應(yīng)用于筆跡識別和信號化方法中。
表1<pre listing-type="program-listing"><![CDATA[main()  word-spotter() !使用隱式馬爾科夫模型   !的詞識別  end  ------------------  word-spotter()   foreach reference-model m do   !就組合參考模型循環(huán)   compute-model-emission-probability()   !計算該模型的總發(fā)出概率,亦即   !由馬爾科夫模型m產(chǎn)生的待分類   !的特征向量序列的概率  enddo  ranking() !根據(jù)馬爾科夫模型的總發(fā)出概率! 將其排序  rejecting() !拒絕無關(guān)鍵詞的表示end  --------------------------compute-model-emission-probability()  initialize()!給累積發(fā)出概率置初值  foreach frame t do !就待分類的模式的特征向量   !循環(huán)   foreach state k do !就模型狀態(tài)循環(huán)   compute-local-emission-probability()   !計算局部對數(shù)發(fā)出概率,亦即   !從模型狀態(tài)k發(fā)出的特征向量Ot   !的概率   accumulate-emission-probability()   !計算對模型狀態(tài)k的最佳路徑的   !發(fā)出概率并在該關(guān)鍵詞內(nèi)存儲最   !佳路徑的長度   end do k   if word_end_detected()   !在檢測到詞尾時中斷查找   return  end do tend--------------------------------compute-local-emission-probability()  if state==background !在等待背景噪聲的模型狀   !態(tài)時,局部概率=1  return 0 ?。絣og(1)  else  compute-emission-probability()   !為當前特征向量計算一個對數(shù)發(fā)   ! 出概率endifend---------------------------accumulate-emission-probability()  compare-emission-probability() ??!比較所有可能的前行者的累積 ??!概率,以其當時的長度規(guī)范化  store-best-probability() ?。“褟淖罴芽赡芮靶姓郀顟B(tài)的累積 ??!對數(shù)發(fā)出概率和局部對數(shù)發(fā)出概 ??!率得出的和存儲起來, ?。∵@里存儲不帶背景噪聲的詞長度end----------------------------]]></pre>文獻[1] Rose.R.C.和D.B.Paul(1990).A hidden markov modelbased keyword recognition system.In IEEE InternationalConference on Acoustics,Speech and Signal Processing,pages 129-132,Albuquerque.ICASSP.[2]Forney,D.G.(1973).The Viterbi algorithm.Proceed-ings of the IEEE,61(3)268-278.[3]Rabiner,L.R.和B.H.Juang(1986).An introductionto hidden markov models.IEEE Transaction on Acoustics,Speech and Singal Processing,(1)4-16.
權(quán)利要求
1.識別時變測試信號中至少一個定義的、由隱式馬爾科夫模型表述的模式的方法,所述測試信號至少疊加有一個干擾信號,a)其中在該隱式馬爾科夫模型的開始和結(jié)尾各附一個唯一的全等的狀態(tài),該狀態(tài)代表該干擾信號,并至少具有下述特征-為實現(xiàn)不依賴于所定義的模式的時間位置,該狀態(tài)不具有任何轉(zhuǎn)移概率,-為實現(xiàn)不依賴于所定義的模式的時間環(huán)境中的干擾信號,該狀態(tài)不具有任何發(fā)射概率,b)其中用一個已知的比較方法借助于擴展的隱式馬爾科夫模型,在時變測量信號中,查找和識別有定義的模式。
2.根據(jù)權(quán)利要求1的方法,其中,使用維特比算法作為比較方法。
3.根據(jù)權(quán)利要求1的方法,其中,使用鮑姆-威爾希方法作為比較方法。
4.根據(jù)權(quán)利要求2或者3的方法,其中,在比較方法中在路徑的每次重新組合中,把每一路徑積累的總發(fā)出概率按照到該時刻考慮的發(fā)出概率規(guī)范化,以避免優(yōu)選較短的路徑。
5.根據(jù)權(quán)利要求2或者權(quán)利要求4不包括3的方法,其中,規(guī)范化按下述方式進行
&psi;(j)=1&le;j&le;Nargrnin&Delta;t(i)+&Delta;t+1Inkrement(i,j)lt(i)+1]]>而&Delta;t+1(j)=&Delta;t(&psi;(j))+&Delta;t+1Inkrement(&psi;(j),j)]]>綜合分LSc(Sk,Ot)=B(Sk,Ot)-min1&le;j&le;N-1B(St,Ot)]]>局部分Segm(1)=Segm(N)=S0aij記為Aij(亦即Aij=-const Inaij)bj(Ot) 記為 B(Sk,Ot)=-const In bk(Ot)δt(j)記為 Δt(j)t 當前時刻j 當前模型狀態(tài)aij 轉(zhuǎn)移概率bj(Ot) 觀察Ot的發(fā)射概率N 模型狀態(tài)數(shù)式中,It(i)表示在Δt(i)中積累的、并從ΔInkrement定義中“否則”場合得出的ΔInkrement數(shù);用記分代替概率,否則類似[3]的符號。
6.根據(jù)權(quán)利要求3或者權(quán)利要求4不包括2的方法,其中,使用一個求和函數(shù)代替取極大值運算。
7.根據(jù)前述權(quán)利要求中任何一個權(quán)利要求的方法,其中,使用一個語音信號的測試信號。
8.根據(jù)前述權(quán)利要求中任何一個權(quán)利要求的方法,其中,使用一個手寫過程的測試信號。
9.根據(jù)權(quán)利要求8的方法,其中,測試信號按照光學路徑上得出。
10.根據(jù)權(quán)利要求8的方法,其中,測量信號通過測量書寫時的壓緊力求出。
全文摘要
本發(fā)明涉及識別測試信號中的模式的一種特殊的方法。這些信號包括語音信號或者從字跡識別裝置獲得的信號。為實現(xiàn)本發(fā)明,在為待識別模式模型化建立的隱式馬爾科夫模型上增擴一個特別的狀態(tài),該狀態(tài)不具有任何發(fā)出和轉(zhuǎn)移概率。這使得待查找模式所處的時間位置與其產(chǎn)生概率完全無關(guān)。另外,本發(fā)明還有一個優(yōu)點是可以吸收新的和未預(yù)料到的干擾,而無需為此對模型進行訓(xùn)練。與現(xiàn)行的方法相比,不必對背景模型進行任何訓(xùn)練。但是這意味著在識別該模式時需要更加復(fù)雜的措施,因為必須把有關(guān)其概率的維特比算法的各個路徑以在該路徑上的當前累積概率規(guī)范化,以便對它們能夠比較。本方法的優(yōu)點是僅需分析測試信號中包含該模式的時間段。從而,保證較大的命中概率,同時減少計算機處理的開銷。
文檔編號G10L15/00GK1183158SQ96193581
公開日1998年5月27日 申請日期1996年2月19日 優(yōu)先權(quán)日1995年3月7日
發(fā)明者K·聰克萊爾 申請人:西門子公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1