專利名稱:矢量量化的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在模式識別和使用矢量量化的通訊中使代碼本(Code book)適應(yīng)于一發(fā)言者以及歸一化一欲識別的輸入信號或者歸一化一欲傳送到一發(fā)言者的信號的一種裝置。
矢量量化在傳送語言信號等方面被廣泛地使用作高效率編碼的一種基本技術(shù),并且用于如語言識別這樣的模式識別。以下描述矢量量化的執(zhí)行。
一個感興趣的矢量空間被分成M個局部空間。標(biāo)號(數(shù)字)1,……,M被分派到該局部空間。一對應(yīng)標(biāo)號m的局部空間m(m=1,…,M)的典型矢量(代碼矢量)μm被加以確定。然后使用一代碼本將一個矢量y轉(zhuǎn)換成標(biāo)號1,…,M的任何一個,在該代碼本中μm可被認(rèn)為是使用m的。具體地,該矢量y被轉(zhuǎn)換成一個標(biāo)號 這里d(u、v)代表矢量u和v之間的距離。
上述一個分部空間由組合一組訓(xùn)練矢量(training vectors)加以確定。作為這樣組合的一種方法,經(jīng)常使用熟悉的LBG算法。在這種情況下,該典型的矢量μm是該組m的重力或平均矢量的中心,并且還仍被認(rèn)為是該組m的重心。
使用矢量量化傳送語言信號描述如下。
發(fā)射機(jī)將欲傳送的—PCM語言信號分成每一個包括幾個取樣的塊,將其每塊作為一個n維矢量處理,并將它們轉(zhuǎn)換成一系列使用上述代碼本的標(biāo)號。該處理將參照指明緩沖存儲器的
圖1、2和3加以描述,在緩沖存儲器中1連續(xù)的幾個取樣被交替地儲存。1表示一個開關(guān),用于轉(zhuǎn)換該緩沖器2和3,以使它們交替地儲存上述幾個取樣。4表示一個開關(guān),用于選擇性地輸出在該緩沖存儲器2和3中的幾個取樣。部件1-4使得當(dāng)寫操作在另一緩沖儲存器上執(zhí)行時,讀操作在該緩沖存儲上執(zhí)行。5表示一代碼本,其中,每個m組的一n維典型矢量按照它能使用的標(biāo)號進(jìn)行檢索的方式被存儲起來。6表示一比較部件,用于將存儲在該緩沖存儲器2和3中的該n維矢量同存儲在該代碼碼本5中的M曲型矢量相比較。7表示用于選擇相應(yīng)該典型矢量的標(biāo)號的一標(biāo)號選擇部分,該典型矢量根據(jù)比較結(jié)果是最靠近緩沖存儲器2和3中的典型矢量。選擇的標(biāo)號被加以傳送。換言之,連續(xù)的幾個取樣被按序轉(zhuǎn)換成標(biāo)號,而這標(biāo)號被傳送出去。
接收機(jī)使用一具有如上所述相同結(jié)構(gòu)的代碼本,將接收的標(biāo)號系列轉(zhuǎn)換成相應(yīng)的矢量系列,以便將它們恢復(fù)成時間波形。8表示一代碼矢量讀出部分,而9表示代碼本。該代碼本9具有與代碼本5相同的結(jié)構(gòu)。n維代碼矢量(典型矢量)相應(yīng)接收的標(biāo)號,使用代碼矢量讀出部分8從代碼本9讀出。11和12表示緩沖存儲器,用于交替地儲存從代碼本9讀出的每個包括幾個分量的代碼矢量。10表示一個開關(guān),用于交替地將從代碼本9讀出的代碼矢量指定到緩沖存儲器11和12。13表示一個開關(guān),用于交替地讀以及輸出該緩沖存儲器11和12的內(nèi)容。這樣,緩沖器11和12儲存了在緩沖存儲器2和3中使用代碼矢量取得的矢量的近似值。因此,如果該近似值連續(xù)地讀出用于上述典型的n維矢量單元,則可得到與發(fā)送信號在形式上相近似的解碼信號。緩沖存儲器11和12是相配合的。結(jié)果它們中之一個執(zhí)行寫,而另一個執(zhí)行讀。通過開關(guān)13,在緩沖存儲器11和12上交替執(zhí)行讀出。
例如,如下所述,就傳送一語言信號而論,這樣的裝置提供了一發(fā)送比特率,在該語言信號中,一個取樣由12位代表,這里代碼本尺寸M=256,而一個塊的長度n=8。當(dāng)發(fā)送-PCM信號時,每一塊發(fā)送的量為12×8=96位,如果執(zhí)行矢量量化,該所要求的位僅僅是那些用于區(qū)分標(biāo)號的位,即僅僅log2256=8(位)是要求的。這意味著該發(fā)送比特率降低12倍。在這種情況下包括儲存在上述存儲器中的幾個取樣的每一個矢量y由緊靠它的重心近似(量化)。因此,代碼本尺寸M越大,這樣量化誤差越小。但是,用于編碼所要求的位數(shù)將增加。典型矢量按上述方式從一組準(zhǔn)備用于學(xué)習(xí)(Learning)的矢量取得。為精確地做這件事,用于學(xué)習(xí)的矢量必須隨著代碼尺寸M增加。因此,該代碼尺寸務(wù)必根據(jù)同這樣的量化,發(fā)送比特率,典型矢量的估計誤差等有關(guān)的考慮意向來決定。
一種語言識別裝置將一未知的語言傳導(dǎo)轉(zhuǎn)換成一系列聲學(xué)特征矢量,并且計算預(yù)先儲存的,同每一個種類相關(guān)的每個參考模型的相似性,用于根據(jù)該一系列聲學(xué)特征矢量進(jìn)行識別,以認(rèn)出該最大相似性的參考模型。圖2為使用矢量量化的一般語言識別裝置的方塊圖,其中,20表示一特征提取部分,用于將一輸入語言信號轉(zhuǎn)換成特征矢量。例如,使用一濾波器存儲單元,LPC分析,頻譜分析等,一輸入語言信號,每10msec被轉(zhuǎn)換為n維特征矢量。21表示一個代碼本,用于存儲由組合一組特征矢量得到的每組的重心,該一組特征矢量,如上所述,是使用已知組合方法提前從用于學(xué)習(xí)的語言得到的,并且每一個都標(biāo)明使用該標(biāo)號可檢索的。22表示一包括表示在圖1中的一比較部分14和一標(biāo)號選擇部分15的矢量量化部分。這樣,由特征提取部分20得到的一特征矢量被轉(zhuǎn)換成具有的重心緊靠與代碼本21有關(guān)的特征矢量的組的標(biāo)號。23表示參考模型儲存部分,其中,同用于識別的各種單元相關(guān)的參考模型被儲存起來。例如經(jīng)常使用用于識別的單元,字,字節(jié)以及語音。24表示一校驗(yàn)部分,它根據(jù)在矢量量化部分22輸出端上得到的一系列標(biāo)號計算儲存在參考模型儲存部分23中的參考模型的相似性。25表示一確定部分,它確定用于識別的相應(yīng)最大相似性的參考模型的單元作為識別結(jié)果。
已經(jīng)提出的參考模型包括一具有各種識別單元發(fā)聲作為一系列標(biāo)號的模型,以及一具有所謂HMMS(Hidden Markov Models)的模型,其中狀態(tài),狀態(tài)的發(fā)送,以及在每一狀態(tài)中一特征矢量的出現(xiàn)的次數(shù)都受限定。
前者為已知的SPLIT方法,其中一系列相應(yīng)未知輸入發(fā)聲的符號相對于一系列作為參數(shù)模型的標(biāo)號進(jìn)行校驗(yàn),或者其中來自特征提取部分20的從未知輸入端得到的輸出矢量轉(zhuǎn)換成用于各種重心的距離矢量(對各個重心矢量是介于幀間的距離)或者類似的矢量(對各個重心矢量分量是幀的類似物),而不是轉(zhuǎn)換成標(biāo)號,而且這樣得到的距離(類似)矢量相對于參考模型進(jìn)行校驗(yàn)。
后者是已經(jīng)成為重要技術(shù)潮流的一種方法,并且是基于如下述原理,即使業(yè)已對它進(jìn)行了各種改善。假定供未知輸入端識別的一系列特征矢量用y=y(tǒng)1,y2…,yT表示了具有由HMMλ產(chǎn)生的長度T的一任意系列狀態(tài)用X=X1,X2,…,XT表示;從狀態(tài)i到狀態(tài)j轉(zhuǎn)換的可能性由aij表示;狀態(tài)i的初始可能性,即當(dāng)t=1時該狀態(tài)i的可能性用ci表示;以及在狀態(tài)1中的一矢量yt出現(xiàn)的次數(shù)用Wi(yt)表示。這樣,來自λ的一系列特征矢量y出現(xiàn)次數(shù)用方程2、3和4表示。
方程2L1(Y|λ)=Σxπx1Πt=1Taxtxt+1Πt=1Tωxt(yt)]]>另一方面,方程3L2(Y|λ)=maxx[πx1Πt=1Taxtxt+1Πt=1Tωxt(yt)]]]>另一方面,方程3兩邊的算法可以如下取得。
方程4L3(Y|λ)=maxx[logπx1+Σt=1Tlogaxtxt+1+Σt=1Tlogωxt(yt)]]]>圖4說明一模型的狀態(tài)的轉(zhuǎn)換,這是經(jīng)常使用的。在該圖中指數(shù)W表示對應(yīng)一個用于識別的單元W。如果該模型用HMMW,圖2中參考模型儲存部分23儲存HMMW1,HMMW2,……,HMMW,如圖3中所示那樣。識別結(jié)果將由L1(Y/λw),L2(Y/λw)表示在方程5中,以及L3(Y/λw)對應(yīng)于識別的該單元W。 在方程5中,如果用方程2,則i=1;如果用方程3,i=2;以及如果用方程4,i=3。
有三種HMMS,即連續(xù)HMMS,分立HMMS,以及FVQ式HMMS,后者依賴于這種方式,在該方式中,如于狀態(tài)i的一特征矢量出現(xiàn)的次數(shù)是受限定的。本發(fā)明講述分立HMMS和FVQ式HMMS。
根據(jù)分立HMMS方程6ω1(yt)=bim;m=argmaxk[d(yt,μk)]]]>這里bim表示狀態(tài)i,一標(biāo)號m出現(xiàn)或然率。
作為對分立HMMS的一種改善,存在著基于模糊矢量量化(FXQ或HMMS)的HMMS。對于正常矢量量化,一特征矢量yt被單值地量化到最靠近組的典型矢量。但根據(jù)模糊矢量量化,對于一組的該特征矢量yt的從屬值被限定為0≤Utm≤1,以及Ut1+Ut2+…+Utm=1,并將給出下列定義。
方程7ωi(yt)=Σm=1Mutmblm]]>或者logω1(yt)=Σm=1Mutmlogbtm]]>或者方程8ω1(yt)=Πm=1M(bim)utm]]>一般地,根據(jù)多種發(fā)言者的各種句子,字等的發(fā)聲,代碼本被作為平均值得到。對于這樣的一種平均值將引起失真的增加,該失真將導(dǎo)至通信中一解碼信號在質(zhì)量上的下降,以及導(dǎo)致語言識別中識別性能的降低,如果對每一個發(fā)言者產(chǎn)生一代碼本,并且使用的代碼本依賴該發(fā)言者改變,則性能將被改善。但是,由于龐大的用于學(xué)習(xí)的數(shù)據(jù)必須甚至從單個發(fā)言者收集,所以這是不實(shí)際的。
當(dāng)HMMS儲存在此字小的字節(jié)或語音單元中時,由于在學(xué)習(xí)的字之間和識別的字之間的上下文、字節(jié)順序、語音等的差異,性能將下降。
當(dāng)在識別時間環(huán)境不同于在收集和記錄用于學(xué)習(xí)的數(shù)據(jù)的時間時,性能也能下降。
如上所述,現(xiàn)有技術(shù)語言識別的問題是性能的降低,能由不同的發(fā)言者以及在學(xué)習(xí)時間和識別時間之間的上下文所引起。
根據(jù)本發(fā)明的第一方面,提供了一種矢量量化器,它包括用于儲存在一特征矢量空間中的某些典型矢量的參考代碼本,因此,它們能用相應(yīng)的標(biāo)號檢索;一學(xué)習(xí)矢量儲存裝置,用于儲存學(xué)習(xí)用的某些矢量;一目標(biāo)函數(shù)計算裝置,用于計算定義為典型矢量函數(shù)的目標(biāo)函數(shù)以及學(xué)習(xí)用的矢量;一運(yùn)動矢量計算裝置,用于計算運(yùn)動矢量;以及一匹配裝置,用于將運(yùn)動矢量附加到典型矢量而得到新的典型矢量,其中,輸入矢量借助于將該輸入矢量轉(zhuǎn)換成標(biāo)號或從屬矢量進(jìn)行編碼,對于使用新典型矢量的標(biāo)號,標(biāo)號或從屬矢量分量為該輸入矢量的從屬值,而其中該運(yùn)動矢量計算裝置計算與所說用于學(xué)習(xí)的矢量相關(guān)的目標(biāo)函數(shù)的所說新典型矢量的最大值。
根據(jù)本發(fā)明的第二方面,提供了一種矢量量化器,它包括用于儲存在一特征矢量空間中的某些典型矢量的參考代碼本,它們能用相應(yīng)的標(biāo)號檢索;一學(xué)習(xí)矢量儲存裝置,用于儲存學(xué)習(xí)用的某些矢量;一目標(biāo)函數(shù)計算裝置,用于計算定義的典型矢量函數(shù)的實(shí)體函數(shù)以及學(xué)習(xí)用的矢量;一運(yùn)動矢量裝置,用于計算運(yùn)動的矢量;以及一歸化裝置,用于將該運(yùn)動矢量附加到輸入矢量,其中,輸入矢量借助于將該運(yùn)動矢量附加到輸入矢量進(jìn)行編碼,以得到歸化的輸入矢量,并且由于將它們轉(zhuǎn)換成標(biāo)號或從屬矢量,對于標(biāo)號,它們的分量是輸矢量的從屬值,而且,其中運(yùn)動矢量計算裝置進(jìn)行計算,結(jié)果,當(dāng)學(xué)習(xí)用矢量和運(yùn)動矢量的和被放置在參考代碼本中作為新的學(xué)習(xí)用矢量時,目標(biāo)函數(shù)最大。
在按本發(fā)明第一方面的矢量量化器中,某些特征矢量空間中的典型矢量儲存在一個參考代碼本中,因此它們能使用相應(yīng)的標(biāo)號進(jìn)行檢索;某些學(xué)習(xí)用矢量提前儲存在學(xué)習(xí)矢量存儲裝置中;定義為典型矢量函數(shù)的一目標(biāo)函數(shù)以及學(xué)習(xí)用矢量由一目標(biāo)函數(shù)計算裝置進(jìn)行計算;運(yùn)動矢量由運(yùn)動矢量計算裝置進(jìn)行計算;而新的典型矢量是使用一匹配裝置將該運(yùn)動矢量附加到典型矢量得到的。欲編碼的輸入矢量被轉(zhuǎn)換成標(biāo)號或從屬矢量,對于由一使用新典型矢量的矢量量化裝置提供的標(biāo)號,它們的分量是輸入矢量的從屬值,而運(yùn)動矢量計算裝置進(jìn)行計算,結(jié)果新典型矢量使與學(xué)習(xí)用矢量相關(guān)的目標(biāo)函數(shù)達(dá)最大值。
在按本發(fā)明第二方面的矢量量化器中,在一特征矢量空間中的某些典型矢量被儲存在一參考代碼本中,因此可使用相應(yīng)的標(biāo)號檢索;某些學(xué)習(xí)用矢量提前儲存在一學(xué)習(xí)矢量存儲裝置中;定義為典型矢量函數(shù)的一目標(biāo)函數(shù)和學(xué)習(xí)用矢量由一目標(biāo)函數(shù)計算裝置進(jìn)行計算;運(yùn)動矢量由一運(yùn)動矢量計算裝置進(jìn)行計算;以及該運(yùn)動矢量由一歸一化裝置附加到欲編碼的輸入矢量,以得到歸一化的輸入矢量。歸一化輸入矢量由一矢量歸一化裝置轉(zhuǎn)換成標(biāo)號或從屬矢量,對于使用典型矢量的標(biāo)號,它們的分量是該輸入矢量的從屬值。運(yùn)動矢量由運(yùn)動矢量計算裝置進(jìn)行計算,因此,當(dāng)學(xué)習(xí)用矢量和運(yùn)動矢量的和放置在參考代碼本作為新的學(xué)習(xí)用矢量時,目標(biāo)函數(shù)達(dá)最大。
圖1說明基于矢量量化的一種傳送方法的原理。
圖2說明基于矢量量化的一種語言識別的一般原理。
圖3說明圖2中參考模型儲存部分的細(xì)節(jié)。
圖4說明一種HMM(Hidden Markov Model)的原理。
圖5說明按本發(fā)明的一種匹配方法的實(shí)施例的原理。
圖6說明本發(fā)明另一實(shí)施例的原理。
圖7是基于按圖5中說明原理的矢量量化的一種信號發(fā)射機(jī)的方塊圖。
圖8是基于按圖6中說明原理的矢量量化的一種信號發(fā)射機(jī)的方塊圖。
圖9表示用于圖7和圖8中發(fā)射機(jī)的一種接收機(jī)的實(shí)施例。
圖10表示用于圖7和圖8中發(fā)射機(jī)的一種接收機(jī)的實(shí)施例。
圖11表示用于圖8中發(fā)射機(jī)的一種接收機(jī)的另一實(shí)施例。
圖12是基于按圖5中說明原理的矢量量化的一種模式識別裝置的方塊圖。
圖13是基于按圖6中說明原理的矢量量化的一種模式識別裝置的方塊圖。
圖14說明基于發(fā)言者歸一化的一種發(fā)射機(jī)的實(shí)施例。
圖15說明基于發(fā)言者歸一化的一種接收機(jī)的實(shí)施例。
圖16說明基于發(fā)言者歸一化的一種識別裝置的實(shí)施例。
圖17說明用于按本發(fā)明的發(fā)言者歸一化的一種方法的另一實(shí)施例。
圖18說明按本發(fā)明的一種代碼本校正裝置的實(shí)施例的方塊圖。
圖19是說明代碼校正部分一種實(shí)施例的方塊圖,該代碼校正部分是按本發(fā)明的一種代碼校正裝置的重要部分。
圖20是說明本發(fā)明操作的流程圖。
圖21是說明在圖20中的出現(xiàn)率計算公式由方程9代表的操作的流程圖。
圖22是說明計算一校正矢量的分母和分子的操作的流程圖,其中,在圖20中的校正矢量是對每組得到的。
圖23是說明在圖20中的校正矢量是對每組得到的操作的流程圖。
圖24是說明計算一校正矢量分母和分子的操作的流程圖,其中圖20中的校正矢量一般是對所有組得到并使用的。
圖25是說明在圖20中的校正矢量一般是對所有組得到并使用的操作的流程圖。
圖26是說明按本發(fā)明的一種特征矢量歸化裝置的實(shí)施例的方塊圖。
圖27是說明校正矢量校正部分的實(shí)施例的方塊圖,該部分是本發(fā)明的特征矢量歸一化裝置的重要部分。
圖28是說明包括一代碼本歸一化裝置的語言識別器的實(shí)施例的方塊圖。
圖29是說明包括一歸一化矢量調(diào)整裝置的語言識別器的實(shí)施例的方塊圖。
圖30說明按本發(fā)明的一種匹配方法的實(shí)施例的原理。
圖31說明本發(fā)明另實(shí)施例的原理。
圖32是一種按本發(fā)明的一發(fā)言者歸一化方法的另一實(shí)施例的方塊圖。
圖33是圖30矢量量化的方塊圖,其中過去的輸入聲音逐漸忘卻。
圖34是圖31的矢量量化的方塊圖,其中過去的輸入聲音逐漸忘卻。
本實(shí)施例論述發(fā)言者的歸一化或代碼本的匹配。具體地,本發(fā)明涉及一種方法,如早先所述,在無監(jiān)控基礎(chǔ)上,僅僅根據(jù)發(fā)言者的幾個欲被識別的聲音,借助于校正賴于揚(yáng)聲器的輸入矢量或借助于賴于該發(fā)言者的代碼本的典型矢量,它能解決若干問題(即該系統(tǒng)不教導(dǎo)什么字、句子等,該揚(yáng)聲器就已經(jīng)發(fā)音)。
一代碼本是由組合一組從許多發(fā)言者的發(fā)聲得到的特征矢量建立起來的。組合方法包括所謂硬組合,其中,每一個特征矢量被指派到僅一個組,以及所謂模糊組合,其中,按照用于該組的特征矢量的從屬值,每一個特征矢量被指派到每一組。對于硬組合方法,有一種稱為LGB方法的算法。對于模糊組合,使用已知的方法,例如模糊K-裝置方法。雖然本發(fā)明既能使用硬組合,也能使用模糊組合,硬組合能看成是模糊組合的一種特殊情況。
模糊組合執(zhí)行如下,一系列數(shù)字y1,y2…,yn,…,yN被分派到從多個揚(yáng)聲器發(fā)聲得到的特征矢量。這點(diǎn)是用來決定一重心矩陣V=[u1,u2,…,uM]以及一從屬矩陣U=[Unm],結(jié)果下列實(shí)體函數(shù)最小,使Un1+Un2+…Unm=1,對于一組m,這里Unm代表一特征矢量y的成員數(shù)值(m=1,…,M)而m代表該組m的一重心矢量。
方程9J=Σn=1NΣm=1MunmFd(yn,μm)]]>
這由在矩陣V和U上交替地重復(fù)一種操作來實(shí)現(xiàn),其中該矩陣V式U中之一是固定的,而當(dāng)使用其他矩陣時,實(shí)體函數(shù)J最小。特別地,固定V,以及作為δJ/δU=0對U的解得到U′的操作,固定U,以及作為δJ/δV=0對V的解得到V′的操作,以及建立U=U′和V=V′作為新U和V的操作交替地重復(fù),直到獲得收斂為止。F代表模糊,并且F>1·F值越大,組間模糊越大。
模糊組合在下面步驟中執(zhí)行,這里d(yn,μm)=(yn-μm)T(yn-μm)(步驟1-1)組數(shù),計算循環(huán)數(shù),以及實(shí)體函數(shù)值分別賦于M,S=0,以及J(0)=1,而成員數(shù)矩陣U=[Unm]的初始值U(o)被適當(dāng)?shù)亟o定。(步驟1-2)我們賦于S=S+1(步驟1-3)一組m(m=1,…,M)的平均矢量μm(s)由下面方程得到方程10μm(a)=Σn=1N(unm(s-1))FynΣn=1N(unm(s-1))F;1≤m≤M]]>(步驟1-4)每個點(diǎn)到組的從屬矩陣用下面方程進(jìn)行計算方程11 步驟(1-5)目標(biāo)函數(shù)計算如下,方程12J(s)=Σn=1NΣm=1M(unm(s))Fd(yn,μm(s))]]>(步驟1-6)確定下列用于確定的條件是否滿足方程13|J(s-1)-J(s)|J(s-1)≤ϵ]]>如果否,處理轉(zhuǎn)到步驟1-2。如果是,處理終止。
有一個提前定義的適當(dāng)小正數(shù)。該值越小,計算重心的精度越高,然后收斂時間將更長。
在上述步驟中,方程10由對μm(S-1)解|J(S-1)V|μm(S-1)|=0得到,而方程11用μm(s-1)解下列方程得到,這里有一個拉格朗日的不確定因子。
方程14∂∂unm(s-1)(J(s-1)+θ(Σk=1Munk(s-1)-1))]]>
此外,如果模糊F-1>1+0,1/(F-1)->。當(dāng)μm(S-1)靠近yn時,d(yn,μm(S-1))<d(yn,μh(S-1))對h≠md(yn,μm(S-1))=d(yn,μh(S-1))對h=m因此,{d(yn,μm(S-1))/d(yn,μh(S-1))}1/(F-1)->0對h≠m{d(yn,μm(S-1))/d(yn,μh(S-1))}1/(F-1)=l對h=m則,方程15unm(s)=1form=argminh[d(yn,μh)]]]>unm(s)=0form≠argminh[d(yn,μh)]]]>硬組合就這樣執(zhí)行。
硬組合在執(zhí)行模糊組合時給出Unm(S)=L(n),m(s),這里L(fēng)(n)代表緊靠yn的標(biāo)號。δij代表克羅尼柯增量。δij=1,如果i=j(luò),以及δij=0時,如果i≠j。因此,上述程序?qū)τ步M合情況將由下面取代。
首先,目標(biāo)函數(shù)是方程16J=Σn=1NΣm=1MδL(n),md(yn,μm)]]>在此情況下,組合如下執(zhí)行。(步驟2-1)我們賦S=0以及J(0)=1(步驟2-2)我們賦S=S+1(步驟2-3)一組(m=1,……,M)的平均矢量μm(S)由下面方程取得方程17μm(s)=Σn=1N(δL(n),m)FynΣn=1N(δL(n),m)F]]> =1|Cm|Σn:L(n)=myn]]>這里|Cm|代表包括在組m中的矢量的整數(shù)。(步驟2-4)緊靠每個點(diǎn)的重心對每個點(diǎn)的組進(jìn)行計算。
方程18m^=argminm[d(yn,μm(s))]]]>步驟(2-5)L(n)=m^]]>
目標(biāo)函數(shù)計算如下方程19J(s)=Σm=1MΣn=1NδL(n),md(yn,μm(s))]]>=Σm=1MΣn:L(n)=md(yn,μm(s))]]>(步驟2-6)確定用于確定的下列條件是否滿足。
方程20|J(s-1)-J(s)|J(s)≤ϵ]]>如果否,處理轉(zhuǎn)到步驟2-2。如果是,處理終止。
如上所述產(chǎn)生一代碼本。這樣產(chǎn)生的代碼本適合發(fā)音者A的發(fā)聲。
該點(diǎn)是將重心μm(S)(m=1,……M)轉(zhuǎn)換成緊靠發(fā)音者A的發(fā)聲的μm′。按照本發(fā)明第一實(shí)施例,這是由賦μm′=μm=hm以及從發(fā)言者A的發(fā)聲尋求最佳hm執(zhí)行此轉(zhuǎn)換完成的。特別地,這能借助于尋求給出一適當(dāng)小的解的hm來完成方程21J'=Σ1=11Σm=1Mu1mFd(yA1,μm')]]>=Σi=1IΣm=1MuimFd(yAi,μm+hm)]]>這里用于匹配代碼本的從發(fā)言者A的發(fā)聲得到的特征矢量一系列數(shù)字yA1,yA2,…,yAI表示。
如上所述,按照下面步驟定義d(y,n)T(y-n)將給出hm·S代表確定上限的一個值,用作操作循環(huán)數(shù)。(步驟3-1)從屬矩陣U=[Unm]的初始值U(0)由下式給出方程22unm(o)=1Σk=1Md(yA1,μm+hm(o))d(yAi,μk+hk(o))1/(F-1);1≤m≤M,1≤n≤N]]>這里組數(shù)由M表示;計算循環(huán)數(shù)S=0;目標(biāo)函數(shù)值J(o)=∞;以及hm(o)=0(m=1,…,M)。(步驟3-2)我們賦S=S+1(步驟3-3)一運(yùn)動矢量hm(S)(m=1,…,M)由下面方程得到。
方程23hm(a)=Σi=1I(uim(m-1))F(yA1-μm)Σi=1I(uim(m-1))F]]>(步驟3-4)
對于組的每個點(diǎn)學(xué)習(xí)用矢量的從屬矩陣用下面方程計算。
方程24uim(a)=1Σk=1Md(yAi,μm+hm(a))d(yAi,μk+hm(a))1/(F-1)]]>1≤m≤M,1≤1≤N(步驟3-5)目標(biāo)函數(shù)計算如下。
方程25J(a)=Σi=1IΣm=1M(uim(a))Fd(ya1,μm+hm(m))]]>(步驟3-6)確定用于確定的下列條件是否滿足方程26|J(m-1)-J(m)|J(m-1)≤δors≥S]]>如果否,處理返回步驟3-2,如果是,處理終止。
步驟3-6中的δ是一個適當(dāng)小的數(shù),它取決于代碼本重心接近用于學(xué)習(xí)的聲頻輸入的程度,該代碼本是準(zhǔn)備用作參考值的。如果δ小而S大,代碼本將接近由僅使用用于發(fā)聲的組合得到的聲頻輸入。當(dāng)用于學(xué)習(xí)的發(fā)聲數(shù)量小時,重心的分布過偏用于學(xué)習(xí)的發(fā)聲,而這是可取的。因此,對取決于用于學(xué)習(xí)的發(fā)聲數(shù)量的δ和S必須選擇適當(dāng)?shù)姆怠?br>
當(dāng)用于學(xué)習(xí)的發(fā)聲數(shù)量小時,在目標(biāo)函數(shù)(方程21)中的hm對m=1,…,M各種值最好保持共用。本發(fā)明的第二個實(shí)施例是該裝置的一個例示,其中h=h1=h2=…,hM,而實(shí)體函數(shù)是方程27Jm=Σi=1IΣm=1Mu1mFd(yAi,μm')=Σi=1IΣm=1MuimFd(yA1,μm+h)]]>h從下面步驟取得。(步驟4-1)從屬矩陣U=[Unm]的初始值U(o)由下式給出方程28unm(o)=1Σk=1Md(yAi,μm+h(o))d(yAi,μk+h(o))1/(F-1)]]>1≤m≤M,1≤n≤N這里組數(shù)由M表示;計算循環(huán)數(shù)S=0;目標(biāo)函數(shù)值J(o)=∞;以及hm(o)=0。(步驟4-2)我們賦S=S+1。(步驟4-3)運(yùn)動矢量h(S)由下面方程得到。
方程29h(a)=Σi=1IΣm=1M(u1m(s-1))F(yAi-μm)Σ1=iIΣm=iM(uim(m-1))F]]>(步驟4-4)對于組的每個點(diǎn)(學(xué)習(xí)用矢量)的從屬矩陣采用下面方程計算。
方程30u1m(m)=1Σk=1Md(yAi,μm+h(m))d(yAi,μk+h(m))1/(F-1);1≤m≤M,1≤1≤N]]>(步驟4-5)目標(biāo)函數(shù)計算如下方程31J(a)=Σi=1IΣm=1M(uim(m))Fd(yAl,μm+h(a))]]>(步驟4-6)確定用于確定的下列條件是否滿足。
方程32|J(m-1)-J(m)|J(m-1)≤δors≥S]]>如果否,處理返回到步驟4-2。如果是,處理終止。
再就這種情況而論,用于學(xué)習(xí)的發(fā)聲對重心校正量的影響能通過選擇δ和S加以調(diào)整。
圖5是表示本發(fā)明第一和第二實(shí)施例結(jié)構(gòu)的方塊圖。對于第一實(shí)施例,執(zhí)行步驟3-1—3-6,對第二實(shí)施例,執(zhí)行4-1—4-6步驟。50表示一輸入端,用來產(chǎn)生一代碼本的學(xué)習(xí)用矢量yA1,…,YAN輸入到該端上。51表示一緩沖存儲器,用于儲存學(xué)習(xí)用矢量YA1,…,YANo54表示一個參考代碼本,其中按照允許它們使用標(biāo)號檢索方式,儲存從多個揚(yáng)聲器產(chǎn)生的代碼矢量。53表示一運(yùn)動矢量儲存部分,而55表示一個相加器,它將參考代碼本54的內(nèi)容同運(yùn)動矢量儲存部分53的內(nèi)容相加。52表示運(yùn)動矢量計算部分,它根據(jù)緩沖存儲器51的內(nèi)容和相加器55的輸出按第一實(shí)施例中的步驟6-1—6-6計算hm(m=1,…,M),并且在第二實(shí)施例的步驟4-1—4-6上作計算。計算的運(yùn)動矢量被儲存在運(yùn)動矢量存儲部分53中。當(dāng)上述重復(fù)計算起動時,運(yùn)動矢量儲存部分53的內(nèi)容被初始化到0,按照這種結(jié)構(gòu),在計算期間,運(yùn)動矢量儲存部分53的內(nèi)容都重寫,每次一運(yùn)動矢量要進(jìn)行校正。如果滿足步驟3-6或步驟4-6中的收斂條件,在運(yùn)動矢量儲存部分53中最終得到匹配于發(fā)言者A的運(yùn)動矢量。將這樣得到的運(yùn)動矢量附加到參考代碼本的輸出就能得到適合于該發(fā)言者A的典型矢量。
圖6表示一匹配代碼本56插在相加器55和運(yùn)動矢量計算部分52之間的情況。很明顯,這種結(jié)構(gòu)將最終提供一匹配代碼本作為適合于揚(yáng)聲器A的代碼本。
圖7和圖8表示使用上述原理的一種通信設(shè)備的發(fā)射的實(shí)施例。
圖7表示采用了圖5中所示的匹配一揚(yáng)聲器的方法。方塊1,2,3,4,6和7與圖1中是有相同編號的方塊按相同的方式操作。圖7中的方塊51-54與圖6中具有相同編號的方塊按相同的方式操作,并多半用作發(fā)言者匹配。每次發(fā)言者替換一新成員,代表新發(fā)言者與該參考代碼本不一致的運(yùn)動矢量被進(jìn)行弄清,并且如上所述,被儲存在運(yùn)動矢量儲存部分53中。當(dāng)開關(guān)4的輸出和代碼本5的內(nèi)容在圖1所示的系統(tǒng)中進(jìn)行比較時,圖7表示開關(guān)4的輸出同相加器55輸出相比執(zhí)該相加器55的輸出可以為是已經(jīng)對發(fā)言者偏差進(jìn)行補(bǔ)償?shù)囊粋€參考代碼本。
圖8表示使用如圖6所示的用于發(fā)言者匹配的方法的一種情況。對于這種情況,如上所述,插入一匹配代碼本。比較器6比較開關(guān)中的輸出以及該匹配代碼字的輸出。這是由于該匹配代碼字儲存是對揚(yáng)聲器補(bǔ)償結(jié)果的典型矢量。
圖9-12表示用來從一系列如上所述接收到的標(biāo)號再生初始取樣系列的一種接收機(jī)的實(shí)施例。
參照圖9,同發(fā)言者有關(guān)的運(yùn)動矢量首先被接收到,并提前儲存在一運(yùn)動矢量存儲部分中,因此,相應(yīng)于接收的標(biāo)號的矢量從參考代碼本讀出。這樣讀出的代碼矢量根據(jù)上述運(yùn)動矢量儲存部分的內(nèi)容由相加器93進(jìn)行補(bǔ)償,而方塊10-13執(zhí)行類似于上述的那些處理,以便獲得一解碼信號。
圖10表示提供一種匹配代碼本101的情況。具體地,相加器93的輸出是運(yùn)動矢量92的內(nèi)容與參考代碼本18的內(nèi)容的和,用來對所有的代碼矢量進(jìn)行計算,并提前儲存在匹配代碼本中,并且該匹配代碼本被用來替代圖1中的代碼本9。
圖11表示一代碼字自身而不是運(yùn)動矢量從發(fā)射機(jī)提前發(fā)送的情況。具體地,由一例如在圖8中所示的發(fā)射機(jī)產(chǎn)生的匹配代碼本的內(nèi)容被傳送到一代碼本111并儲存在其中。這并不是說該代碼本81相應(yīng)于圖1中的代碼本9。
圖12和圖13表示實(shí)施例,其中,如上所述的用于發(fā)言者匹配的方法應(yīng)用到聲音的識別。
圖12表示在圖5中的該方法的一種應(yīng)用,其中元件51-55執(zhí)行類似于圖5中的那些元件的功能。因此,在執(zhí)行發(fā)言者匹配之后,相加器55的輸出被用來替代圖2中的代碼本21。
圖13表示在圖6中的該方法的一種應(yīng)用,其中元件51-56執(zhí)行類似于圖6中那些元件的功能,因此,在執(zhí)行發(fā)言者匹配之后,匹配代碼本56的輸出被用來替代圖2中的代碼本21。
現(xiàn)在將描述本發(fā)明的其他實(shí)施例。
用一計算公式計算乘積的和或累加,以取得一系列特征矢量的出現(xiàn)率受到等于代碼本尺寸的整數(shù)1-M的限制。為降低計算量,在多數(shù)情況中使用小的數(shù)字。在本實(shí)施例中,該限制范圍用字母K表示。
圖18是示意說明按本發(fā)明的代碼本校正器的方塊圖。
401表示一校正言語儲存部分,它儲存一發(fā)言者以后稱作為用于校正的言語的R個(r=1~R)已知言語Sr(以后稱作為校正言語)(該言語內(nèi)容對該代碼校正器是提前得知的)。對發(fā)言者而言,參考代碼本(以后也簡稱代碼本)是加以校正的,即使用言語識別的發(fā)言者。該言語被用來順序地校正代碼本。這些校正言語可以是任何字或句子,只要其內(nèi)容是已知的。
402表示一特征提取部分,它將校正言語Sr轉(zhuǎn)換成一系列固定間隔的特征矢量Yr=Y(jié)r1,Yr2,…,Yrt,…,Yrt。Tr表示在校正言語Sr被轉(zhuǎn)換成一系列特征矢量時數(shù)據(jù)的幀數(shù)。
403表示一校正特征矢量儲存部分,它使用特征提取部分402儲存一系列由儲存在校正言語儲存部分401中的校正言語Sr的r(r=1-R)個發(fā)聲而得到的特征矢量Yr。
404表示一數(shù)據(jù)控制部分,它根據(jù)關(guān)于在該R個發(fā)聲中的那一個發(fā)聲(r)是目前處理的,以及該第r個發(fā)聲的內(nèi)容是什么的確定來控制下面的處理。在下面的說明中,術(shù)語″(r)″意味第r個發(fā)聲的內(nèi)容(發(fā)聲內(nèi)容的HMM的號數(shù)W)。
405表示一模糊矢量量化部分,它使用由數(shù)據(jù)控制部分404送出的發(fā)聲號數(shù)r,從校正特征矢量儲存部分403讀出一系列特征矢量Yr,用第一到第K順序的標(biāo)號,控制遞增距離dr(t,m)對儲存在下面描述的代碼本儲存部分406中的矢量C1-Cm編碼,以及用于各代碼矢量的特征矢量Yt的從屬值將它們轉(zhuǎn)換成距離矢量drt=(dt1,dt2,…,dtk),標(biāo)號矢量Ort=(Ut1,Ut2,…,Utk)以及從屬矢量Urt=(Ut1,Ut2…,Utk),在時間t的不同的點(diǎn)上替換特征矢量Yrt,該各代碼矢量是由用于特征矢量Yt的標(biāo)號組進(jìn)行檢索的。并將特征矢量Yrt的系列Yr轉(zhuǎn)換成一系列距離矢量Dr=dr1,dr2,…,drT一系列標(biāo)號矢量Or=Or1,Or2,…,OrT,以及一系列成員數(shù)矢量Ur=Ur1,Ur2,…,UrT。
406表示代碼本儲存部分,用于存儲代碼矢量Cm,結(jié)果它們能使用給定的標(biāo)號m進(jìn)行檢索,代碼矢量由模糊矢量量化部分405用于矢量量化。
407表示一HMM儲存部分,它儲存按欲識別的字的號數(shù)W提前產(chǎn)生的HMM,狀態(tài)轉(zhuǎn)換概率矩陣A和標(biāo)號出現(xiàn)概率矩陣B被儲存來用于每一個欲識別的字。因此,在第W位置的HMMλW由λw{AwBw}表示。
408表示一代碼校正部分,它使用校正言語和在某些由HMMS及時計算的點(diǎn)中處于某些狀態(tài)的HMMS的概率校正代碼儲存部分406中的代碼矢量Cm,語HMMS對應(yīng)于儲存在HMM存儲部分407中的校正語言,以便使由與代碼本相關(guān)的通道概率加數(shù)的一系列特征矢量的量化誤差的失真降低到最小,并將取得作為校正結(jié)果的新代碼矢量C′m轉(zhuǎn)移到代碼本儲存部分406。
409表示一校正收斂確定部分,當(dāng)代碼矢量用校正言語校正體,它確定收斂的狀態(tài)。如果滿足收斂的確定條件,則它使校正操作終止,而如果否,則它使校正代碼矢量重復(fù)直到滿足該條件為止。
本發(fā)明的特征在于代碼校正部分408的結(jié)構(gòu),其中,提供的言語內(nèi)容是已知的,使用由對應(yīng)言語內(nèi)容的HMMS計算的通道概率,以便使由與代碼本相關(guān)的通道概率加數(shù)的一系列特征矢量的量化誤差的失真降低到最小。
圖19是表示代碼本校正部分的具體結(jié)構(gòu)的方塊圖。
終端1-9連接到圖18中的元件。終端1和7連接到代碼本儲存部分406。終端1接收代碼本C,而終端7傳送校正的代碼本C′。終端5和6連接到HMM儲存部分407。終端5接收對應(yīng)于第r個字的HMM的狀態(tài)轉(zhuǎn)移概率矩陣Aword(r)。終端6接收上述的標(biāo)號出現(xiàn)概率矩陣Bword(r)。終端2、3和4連接到模糊矢量量化部分405,以便接收距離矢量Dr系列,標(biāo)號矢量Or系列,以及用于第r個字的從屬矢量Ur系列。端8連接到校正收斂確定部分409,并傳送一個用于確定收斂的平均目標(biāo)函數(shù)值J于它。無需說,該值可以用附加各種目標(biāo)函數(shù)得到,而不用其平均值。端9連接到數(shù)據(jù)控制部分404,以便接收關(guān)于位置(r)的信息,這里存在目前校正言語數(shù)據(jù),并且當(dāng)r=R時,計算校正矢量C和平均目標(biāo)函數(shù)值J。
代碼本校正部分408,即圖19,使用上述交換的信息進(jìn)行操作。
501表示一特征矢量系列出現(xiàn)率計算部分,它計算在時間t對每一個點(diǎn)的特征矢量Wi(t)的出現(xiàn)率,以及根據(jù)從屬值計算HMMS的每個狀態(tài)i,以及根據(jù)距離矢量系列,標(biāo)號矢量系列,從屬矢量系列計算標(biāo)號出現(xiàn)概率,以及計算在端點(diǎn)2、3、4和6接收到的標(biāo)號出現(xiàn)概率矩陣,以便得到一特征矢量出現(xiàn)率矩陣Ω。
502表示一通道概率計算部分,它計算是在時間t某個點(diǎn)處某種狀態(tài)i的HMM的概率的通道概率ri(t),以及每個狀態(tài)i,以得到一通道概率矩陣。
503表示一校正矢量分母/分子計算部分,它計算校正矢量計算方程的分母和分子。
504表示一校正矢量分母/分子儲存部分,它儲存對于由校正矢量分母/分子計算部分503計算的校正矢量計算公式的分母和分子,供下面描述的校正矢量計算部分之用。
505表示一目標(biāo)函數(shù)值計算部分,如上所述它按照方程35,使用通道概率ri(t),從屬矢量Urt,以及距離矢量drt計算用于確定收斂的目標(biāo)函數(shù)值Jr。方程35Jr=Σt=1TrΣi=1Ir1(t)Σk=1KUtotkF·dtotk]]>506表示一目標(biāo)函數(shù)值儲存部分,它根據(jù)量R儲存由目標(biāo)函數(shù)值計算部分505接收的目標(biāo)函數(shù)值Jr,R相應(yīng)于用于校正的字的總數(shù)。這并非說它可以累加那些值而不是儲存它們。
在上述操作在R校正字上執(zhí)行之后(終端8信號″R″),將執(zhí)行下面的操作。
507表示一校正矢量計算部分,根據(jù)校正矢量計算公式,它從對于儲存在校正矢量分母/分子儲存部分中的校正矢量的分母和分子得到一組校正矢量ΔC。
508表示一校正代碼矢量計算部分,它使用從終端1接收的未校正的代碼字C的代碼矢量值及由校正矢量計算部分507得到的校正矢量△C計算校正的代碼本C′的代碼矢量值,并通過終端7將它們傳送到代碼矢量儲存部分406。
509表示一平均目標(biāo)函數(shù)值計算部分,它由平均所有目標(biāo)函數(shù)值得到一平均目標(biāo)函數(shù)值Jave,并通過終端8將其傳送到校正收斂確定部分409。
按本發(fā)明的該代碼本校正部分的結(jié)構(gòu)表示如下。一般地說,該結(jié)構(gòu)可按兩種方法使用。一種方法是用于校正該代碼本的代碼矢量的校正矢量對單獨(dú)組是分別得到的,另一種方法是得到共用的校正矢量。
前一種對單獨(dú)組分別得到校正矢量的情況將參照在圖20-23中表示的流程圖進(jìn)行描述,這些圖說明代碼本校正操作的執(zhí)行情況。
在步驟601,校驗(yàn)用于校正的一發(fā)言者的內(nèi)容已知的言語Sr是否儲存在校正言語儲存部分401中。如果是,處理進(jìn)到下一步驟,而如果否,如602所示,儲存校正言語。步驟603,相應(yīng)于使用在特征提取部分402的已知的特征矢量提取裝置將校正言語Sr轉(zhuǎn)換成特征矢量Yr,并根據(jù)校正言語的r=1~R發(fā)聲執(zhí)行操作。所得到的特征矢量,如604所示,儲存在校正特征矢量儲存部分403中。
下面操作將重復(fù),直到確定該校正已經(jīng)達(dá)到收斂。首先,為對以下步驟作準(zhǔn)備,在步驟605,對用于校正矢量的分母和分子的緩沖寄存器清零。在步驟606或607,讀出在校正言語數(shù)據(jù)中的特征矢量Yr系列,而在步驟608,根據(jù)一已知方法,模糊矢量量化部分405和代碼矢量儲存部分406執(zhí)行矢量量化,以便計算從屬矢量Ur系列和標(biāo)號矢量Or系列。
在步驟609,即在圖21中,在步驟707按照計算公式(方程36)對t=1-Tr以及i=1~T執(zhí)行計算在特征矢量系列出現(xiàn)率計算部分501中的特征矢量出現(xiàn)率Wi(t)。
方程36ω1(t)=Πk=1KbulotktotOrlogω1(t)=Σk=1KUtotk·logblotk]]>或ω1(t)=Σk=1Kblotk·Utotk]]>在步驟610,使用已知的前向/反向算法,通道概率計算部分502計算該通道概率ri(t)。如在技術(shù)中熟悉的,在僅考慮最佳通道的Viterbi算法中,該Viterbi算法可替代使用。
在步驟611,即在圖22中,在步驟803,對所有代碼Cm(m=1-M)重復(fù)校正矢量分母/分子計算部分503的操作,直到特征矢量Yr第r系列的幀長度Tv終止為止,以及在步驟806,計算相應(yīng)第r個發(fā)聲內(nèi)容的HMM的狀態(tài)I的數(shù)量(在步驟809的條件滿足)。在步驟810,使用用于分母的方程37和用于分子的方程38計算對于校正矢量計算公式的分母和分子。對于每個標(biāo)號m,方程37和38都是取得校正矢量計算公式(方程39)分母和分子的方程。
方程37,38,39ΔCm-rdenom=Σt=1TrΣl=1Ir1(t)UtmFdtmr]]>ΔCm-rnumer=Σt=1TrΣl=1Ir1(t)·UtmF]]>ΔCm-=Σr=1RΣt=1TrΣl=1Ir1(t)UtmFdtmrΣr=1RΣt=1TrΣi=1Ir1(t)UtmF]]>ΔCrm_denom和ΔC1rm_numer分別代表一個計算公式的分母和分子,以便得到用于第r字的第m組的一校正矢量ΔCm。
當(dāng)所有幀長度Tr和數(shù)I終止時(在步驟806和803的條件已被滿足),則這部分的計算將被終止。
重復(fù)操作步驟608-611,直到在步驟612確定已選擇了最后的特征矢量YR的系列,即對于整個特征矢量Yr系列(r=1-R),按整個校正言語計算用于每個代碼矢量的校正矢量計算公式的分母和分子。然后,在步驟613-615,即在圖9中,計算校正矢量ΔC={ΔC1,ΔC2,…,Cm}組以及校正的代碼本C′={C1′,C2′,…,Cm′}。
如903所示,在步驟613,即步驟904,使用校正矢量計算公式的分母和分子,根據(jù)方程40,得到用于每一組的校正矢量ΔCm。
方程40ΔC_=Σr=1RΔC_-rmumerΣr=1RΔC-rdenom]]>一旦得到校正矢量ΔC的組,它可被附加到未校正代碼本C的代碼矢量(614,即905),之后該未校正的代碼本C由校正的代碼本C′取代作為一新的代碼本C(615,即906)。
在步驟616將確定,對用于收斂的一預(yù)定條件,校正是否已達(dá)到收斂。如果是,該處理終止,并且在那個體內(nèi)可用的代碼本被用作用于該發(fā)言者的代碼本。如果確定收斂未達(dá)到,處理返回步驟605,并重復(fù),直到取得收斂。
現(xiàn)在,將參照在圖20,20,24和25中所示的流程圖描述對所有組取得公用校正矢量的后一種情況,圖25說明代碼本校正操作的執(zhí)行。
在步驟601,校驗(yàn)用于校正的發(fā)言者的內(nèi)容已知的言語Sr是否儲存在校正言語儲存部分401中。如果是,處理進(jìn)到下一步驟,而如果否,如602所示,儲存校正言語,步驟603,相應(yīng)于使用在特征提取部分402的已知的特征矢量提取裝置將校正言語Sr轉(zhuǎn)換成特征矢量Yr,并根據(jù)校正言語的r=1-R發(fā)聲執(zhí)行操作。所得到的特征矢量,如604所示,儲存在校正特征矢量儲存部分403中。
下面操作將重復(fù),直到確定該校正已經(jīng)達(dá)到收斂。首先,為對順序的步驟作準(zhǔn)備,在步驟605,對用于校正矢量的分母和分子的緩存器清零。在步驟606或607,讀出在校正言語數(shù)據(jù)中的特征矢量Yr系列而在步驟608,根據(jù)一已知的方法,模糊矢量量化部分405和代碼矢量儲存部分406執(zhí)行矢量量化,以便計算距離矢量Dr系列,從屬矢量Ur系列,以及標(biāo)號矢量Or系列。
在步驟609,即在圖21中,在步驟707,按照上述計算公式(方程36),對t=1-TY以及=1-I執(zhí)行計算在特征矢量系列出現(xiàn)率計算部分501中的特征矢量出現(xiàn)率Wi(t)。
在步驟610,使用已知的前向/反向算法,通道概率計算部分502計算該通道概率Yi(t)。如在技術(shù)中熟悉的,在僅考慮最佳通道的Viterbi算法中,該Viterbi算法可替代使用。
在步驟611,即在圖24中,對所有代碼Cm(m=1一M)重復(fù)校正矢量分母/分子計算部分503的操作,直到特征矢量Yr第r個系列的幀長度Tr經(jīng)過步驟1003,以及相應(yīng)于第r個發(fā)聲的內(nèi)容的HMM的狀態(tài)I的數(shù)在步驟1006計數(shù)(滿足步驟1009的條件)。在步驟1010,使用用作分母的方程31和用作分子的方程42計算對于校正矢量計算公式的分母和分子。方程41和42是取得計算公式(方程43)的分母和分子的方程,以得到用于所有標(biāo)號的一公用校正矢量。
方程41,42,43ΔC-rdenom=Σt=1TrΣl=1Ir1(t)Σk=1KUtotkFdtotkr]]>ΔC-rnumer=Σt=1TrΣl=1Ir1(t)Σk=1KUtotkF]]>ΔC_=Σt=1TrΣl=1Ir1(t)Σk=1KUtotkFdtotkrΣt=1TrΣi=1Ir1(t)Σk=1KUtotkF]]>ΔCrm_denem和ΔCrm_numer代表得到用于所有第r個字的組的一公用校正矢量的計算公式的分母和分子。
當(dāng)所有的幀長度Tr和數(shù)I終止時(已滿足步驟1006和1003的條件),這部分的計算也將終止。
在步驟608-611操作將重復(fù),直到在步驟612確定已選定特征矢量YR的最后系列為止,即對于特征矢量Yr(r=1~R)的整個系列,按照用于整個校正言語的公用代碼矢量,計算校正矢量計算公式的分母和分子。之后,在步驟613-615,即在圖25中,計算該公用校正矢量ΔC和校正的代碼本C′={C1′,C2,…,CM′}。
在步驟613,即步驟1101,按照方程44,使用校正矢量計算公式的分母和分子,得到用于整個組的公用校正矢量ΔC。
方程44ΔCm_=Σr=1RΔCm_rnumerΣr=1RΔCm_rdenom]]>一旦得到該校正矢量ΔC,它將被附加到未校正的代碼本C(614,即1105),然后該未校正的代碼本C由該校正的代碼本C′取代作為一新的代碼本C(615,即1106)。
在步驟616將確定對于用于收斂的一預(yù)定條件,校正是否已經(jīng)達(dá)到收斂。如果是,該處理終止,并且在那個時間上可用的代碼本被用作發(fā)言者的代碼本。如果否,處理返回到605,重復(fù)執(zhí)行605,直到達(dá)到收斂為止。
在上述實(shí)施例中,在稱為校正矢量的未校正和校正矢量間用于繪圖的一矢量取得之后,就可得到一校正代碼本。這并非說,校正的代碼本的代碼矢量能直接得到,其結(jié)果由與該代碼本相關(guān)的通道概率加數(shù)的特征矢量系列的量化誤差失真將是最小。
言語識別能簡單地實(shí)現(xiàn),只要用在上述實(shí)施例中得到的校正的代碼本取代在前述普通言語識別設(shè)備的代碼儲存器302中的值。
上述要點(diǎn)為本發(fā)明的一個特征之一,改型在實(shí)現(xiàn)著,由此與由通道概率加數(shù)的量化有關(guān)的失真將被降到最小。對于低通道概率情況,即如果存在同HMM不緊密相關(guān)的部分,則這樣的一個部分將被阻止用于匹配。
至此,關(guān)于發(fā)言者匹配一代碼本的說明已經(jīng)進(jìn)行了說明,與此相反的方法也可考慮,其中,發(fā)言者和一參考代碼本相匹配,即執(zhí)行發(fā)言者量化。具體地,方程21改為方程33J'=Σi=1IΣm=1Mu1mFd(yA1,μm+hm)]]>=Σi=1IΣm=1MuimF{(yA1-(μm+hm))T(yA1-(μm+hm)}]]>=Σi=1IΣm=1MuimF{(yA1-hm)-μm}T{(yA1-hm)-μm}]]>因此,YA1減hm可看作為一發(fā)言者對一代碼本的量化。方程33相應(yīng)圖5或圖6中的結(jié)構(gòu),如果它們結(jié)合圖17a和圖17b的結(jié)構(gòu)使用,下面表示的方程34將從方程33得出。
方程34J''=Σi=1IΣm=1MuimFd(yAi+hm,μm)]]>=Σi=1IΣm=1MuimF((yAi+hm)-μm)T((yAi+hm)-μm)]]>圖14表示一種發(fā)射機(jī)的實(shí)施例,它根據(jù)本發(fā)明第三個實(shí)施例,在使用發(fā)言者量化的矢量量化基礎(chǔ)上,使用通信方法,其中,使用圖5或圖6中的結(jié)構(gòu)。元件51-55執(zhí)行如上所述的相同操作。在這種情況中,如上所述的學(xué)習(xí)用的運(yùn)動矢量從輸入矢量減去,并且用參考代碼本54執(zhí)行矢量量化。131代表一相減器,它從輸入矢量中減去運(yùn)動矢量。
圖15表示與上述發(fā)射機(jī)(結(jié)合圖14)結(jié)合使用的接收機(jī),它將用一參考代碼本91接收的一系列標(biāo)號轉(zhuǎn)換成一系列代碼矢量,并將由發(fā)射機(jī)分別發(fā)射的運(yùn)動矢量附加到代碼矢量,以得到解碼的矢量。141表示執(zhí)行該相加的相加器。92表示一運(yùn)動矢量儲存部分,用于儲存由相加器141相加的運(yùn)動矢量,當(dāng)發(fā)言者改變時,運(yùn)動矢量從發(fā)射機(jī)發(fā)射。
圖16表示根據(jù)本發(fā)明第三實(shí)施例的,在使用發(fā)言者量化的基礎(chǔ)上的一種言語識別器的實(shí)施例。51-55執(zhí)行如上所述的相同操作。對這種情況,相似地,如上所述學(xué)習(xí)用的運(yùn)動矢量由相減器131從輸入矢量減去,而矢量量化用參考代碼本54執(zhí)行。131代表一相減器,它從輸入矢量中減去運(yùn)動矢量。
很明顯,使用圖17a和圖17b的結(jié)構(gòu)將使得提供一發(fā)/收器和結(jié)構(gòu)實(shí)質(zhì)相同的言語識別器成為可能。對此,相加和相減是部分地顛倒的(未示)。
在上述實(shí)施例中,代碼矢量的校正是由將校正矢量ΔC加到校正矢量C完成的。如果從校正矢量ΔC得到的一預(yù)定矢量ΔH(以下稱作量化矢量)是從輸入發(fā)言者的言語的特征矢量Yt中減去的,則能消去輸入言語中與發(fā)言者相關(guān)的差異。這就使執(zhí)行發(fā)言者量化成為可能。
方程45yt=y(tǒng)t-ΔH對這情況,量化矢量提前隨未改變的代碼矢量值儲存起來,并在識別時間,量化矢量從特征矢量系列的每一幀中的特征矢量中減去。圖26是用來對發(fā)言者量化產(chǎn)生這樣一種量化矢量△H的方塊圖。
1201表示一校正言語儲存部分,它儲存一發(fā)言者(以后稱作為用于校正的言語)的R個(r=1-R)已知言語Sr(以后稱作為校正言語)(該言語內(nèi)容對該代碼校正器是提前得知的),對發(fā)言者而言,得到一個量化矢量,即使用言語識別系統(tǒng)的發(fā)言者。該言語用于順序的校正操作。
1202表示一特征提取部分,它如使用在上述識別設(shè)備中那樣,根據(jù)相同特征提取程序?qū)⑿U哉ZSr轉(zhuǎn)換成一系列固定間隔的特征矢量Yr=Y(jié)r1,Yr2,…,Yrt,…,YrT。 Tr表示在校正言語Sr被轉(zhuǎn)換成一系列特征矢量時數(shù)據(jù)的幀數(shù)。
1203表示一校正特征矢量儲存部分,它使用特征提取部分1202儲存一系列由儲存在校正言語儲存部分1201中的校正言語Sr的r(r=1-R)個發(fā)聲而得到的特征矢量Yr。
1204表示一數(shù)據(jù)控制部分,它根據(jù)關(guān)于在該R個發(fā)聲中的哪一個發(fā)聲是目前處理的。以及該第r個發(fā)聲的內(nèi)容是什么的確定來控制下面的處理。在下面的說明中,術(shù)語″字(r)″意味第r個發(fā)聲的內(nèi)容(發(fā)聲內(nèi)容的HMM的號數(shù)W)。
1205表示一量化矢量儲存部分,儲存用于校正特征矢量的一量化矢量。
1206表示一特征矢量歸一化部分,使用儲存在歸化矢量儲存部分1205中的歸一化矢量△H,在時間t的不同點(diǎn)由校正特征矢量的值Yt得到校正的特征矢量。
1207表示一模糊矢量量化部分,它使用由數(shù)據(jù)控制部分1204送出的發(fā)聲號數(shù)r,從校正特征矢量儲存部分1203讀出一系列特征矢量Yr1在使用儲存在歸一化矢量儲存部分1205中的歸一化矢量的特征矢量歸一化部分,在時間t的各個點(diǎn),校正特征矢量Yrt,用第一到第K順序的標(biāo)號,按照遞增距離dr(t,m)對儲存在下面描述的代碼本儲存部分1208中的矢量C1-CM編碼,以及用用于各代碼矢量的特征矢量Yt的從屬值將它們轉(zhuǎn)換成距離矢量drt(dt1,dt2,…,dtk),標(biāo)號矢量Ort=(Ot1,Ot2,…,Otk),以及從屬矢量Urt=Ur1,Ur2,…,UrT,替換校正的特征矢量,該各代碼矢量是由用于特征矢量Yt的符號組進(jìn)行檢索的。K可取任意值,從1高達(dá)代碼本尺寸M,并限制下面將描述的取得特征矢量的出現(xiàn)率的計算量。
1208表示一代碼本儲存部分,用于存儲代碼矢量Cm,結(jié)果它們能使用給定的標(biāo)號m進(jìn)行檢索,代碼矢量由模糊矢量部分1207用于矢量量化。
1209表示一HMM儲存部分,它儲存按欲識別的字的號數(shù)W提前產(chǎn)生的HMM,狀態(tài)轉(zhuǎn)換概率矩陣A和標(biāo)號出現(xiàn)概率矩陣B被儲存來用于每一個欲識別的字。因此,在第W位置的HMMλw由λw={Aw,Bw}表示。
1210表示一歸一化矢量調(diào)節(jié)部分,使用相應(yīng)于儲存在該HMM儲存部分1209中的校正言語的內(nèi)容的校正言語和HMMS調(diào)整在歸一化矢量儲存部分1205中的歸一化矢量ΔH的值,以便使由與代碼本相關(guān)的通道概率加數(shù)的特征矢量系列的量化誤差的失真降到最小,并傳送作為調(diào)整結(jié)果得到的一新的歸一化矢量ΔH′到歸一化矢量儲存部分1205。
1211表示校正收斂確定部分,當(dāng)歸一化矢量用校正言語校正時,它確定收斂的狀態(tài)。它使校正操作終止,如果滿足預(yù)先確定的收斂條件,如果否,它使用同樣的校正言語重復(fù)校正,直到當(dāng)按序匹配歸一化矢量時滿足條件為止。
本發(fā)明的特征在于歸一化矢量調(diào)節(jié)部分1210的結(jié)構(gòu),其中,提供的言語的內(nèi)容是已知的,該歸一化矢量被調(diào)整得使由與代碼本相關(guān)的通道概率加數(shù)的歸一化矢量校正的特征矢量系列的量化誤差的失真降到最小。
圖27是表示歸一化矢量調(diào)節(jié)部分具體結(jié)構(gòu)的方塊圖。
終端1-10連接到圖26的元件,終端1連接到代碼本儲存部分1208,以便接收代碼本C。終端5和6接到HMM儲存部分1209。終端5接收相應(yīng)第r字的HMM的狀態(tài)轉(zhuǎn)移概率矩陣Aword(r)。終端6接收和上述相同的標(biāo)號出現(xiàn)概率矩陣Bword(r)。終端2、3和4連接到模糊矢量化部分1207,以便接收距離矢量Dr系列,標(biāo)號矢量Ov系列,以及用于第r字的從屬矢量Ur。終端7和10連接到歸一化矢量儲存部分1205。終端7接收歸一化矢量ΔH,而終端10傳送一校正的歸一化矢量ΔH′。終端8連接到校正收斂確定部分1211,并傳送一平均目標(biāo)函數(shù)值J于它用于確定收斂。終端9連接到數(shù)據(jù)控制部分1204,以便接收關(guān)于存在著目前的校正言語的位置(r)的信息,并且當(dāng)r=R時,計算歸一化矢量H和平均目標(biāo)數(shù)值J。
代碼本校正部分1210,即圖27,用如上所述交換的信息進(jìn)行操作。
1301表示一特征矢量系列出現(xiàn)率計算部分,它對時間t每一個點(diǎn)計算由方程36表示的一特征矢量的出現(xiàn)率,以及根據(jù)從屬值計算HMM的每個狀態(tài)i,以及根據(jù)距離矢量系列,標(biāo)號矢量系列,從屬矢量系列計算標(biāo)號出現(xiàn)概率,以及計算在終端2、3、4和6收到的標(biāo)號出現(xiàn)概率矩陣,以便得到特征矢量出現(xiàn)率矩陣Ω。
1302表示一通道概率計算部分,它計算通道概率ri(t),該概率是在時間t某點(diǎn)處某一狀態(tài)i的HMM的概率,并計算每一個狀態(tài)i,以便得到一通道概率矩陣。
1303表示一校正矢量分母/分子計算部分,它計算一校正矢量計算方程的分母和分子。
1304表示一校正矢量分母/分子儲存部分,它儲存用于一校正矢量計算公式的分母和分子,該公式是由下述供一校正矢量計算部分用的校正矢量分母/分子計算部分1303進(jìn)行計算的。
1305表示一目標(biāo)函數(shù)值計算部分,它按方程35,使用上述通道概率ri(t),從屬矢量Urt,以及距離矢量drt計算用來確定收斂的目標(biāo)函數(shù)值Jr。
1036表示一目標(biāo)函數(shù)值儲存部分,它根據(jù)量R儲存來自該目標(biāo)函數(shù)值計算部分1305的目標(biāo)函數(shù)值Jr,量R相應(yīng)于用于校正的全部字量。這并非說,它可以累加這些值,而不是儲存它們。
在R校正字上執(zhí)行上述操作之后(終端8信號″R″)將執(zhí)行下列操作。
1037表示一校正矢量計算部分,它按照校正矢量計算公式,從用于儲存在校正矢量分母/分子儲存部分1304的校正矢量的分母和分子得到一組校正矢量ΔC,并通過終端10將其傳送到校正矢量儲存部分1205。
1038表示一歸一化矢量計算部分,它根據(jù)由校正矢量計算部分得到的校正矢量ΔC以及在終端7接收到的未校正的歸一化矢量ΔH獲得新歸一化矢量ΔH′。
1039表示一平均目標(biāo)函數(shù)值計算部分,它由平均所有儲存在目標(biāo)函數(shù)值儲存部分1306中的目標(biāo)函數(shù)值得到一平均目標(biāo)函數(shù)值Jave,并通過終端7將其傳送到校正收斂確定部分1211。
在該上述特征矢量歸一化設(shè)備中的校正矢量計算公式相應(yīng)方程41,42,43和44。
上述說明是集中于這樣一些情況,其中一個系統(tǒng)被分成學(xué)習(xí)狀態(tài)和識別狀態(tài),它也可能執(zhí)行通信和識別,只要在正進(jìn)行談話和識別處理期間重復(fù)地學(xué)習(xí)已給定的(正好)每一個聲調(diào)。具體地,在圖5-圖8,圖12-圖14中表示的緩沖存儲器51取成一種狀態(tài),其中它經(jīng)常接收輸入信號,以及運(yùn)動矢量在接收到的言語數(shù)據(jù)基礎(chǔ)上,按照上述方法,在適當(dāng)?shù)拈g隔上進(jìn)行計算,以便允許代碼本重寫,以及用于發(fā)言者歸一化的歸一化矢量進(jìn)行修改。這使得當(dāng)一般無意識脫離學(xué)習(xí)狀態(tài)的發(fā)言者時執(zhí)行實(shí)時發(fā)言者歸一化,以及按照該發(fā)言者特征變化執(zhí)行發(fā)言者匹配或歸一化成為可能。按本發(fā)明校正言語在代碼本校正設(shè)備和矢量歸一化設(shè)備的上述實(shí)施例中是提前發(fā)音的,當(dāng)考慮該言語的內(nèi)容必須已知這個要求時,則對于使用該語言識別系統(tǒng)的發(fā)言者而言,不必提前發(fā)校正言語的音,如果由于識別結(jié)果能看作上述語言的內(nèi)容,識別結(jié)果呈現(xiàn)出高的可靠性。
對于這種情況,識別結(jié)果可認(rèn)為是可靠的,只要相似性本身是高的,或者對第一和第二條件間的相似性存在大的差異。相反,識別結(jié)果可認(rèn)為不大可靠的。因此,可以這樣來建立適當(dāng)?shù)拈y值,即如果超出這個閾值,代碼本就將被校正,如果相反,代碼本將不被校正。這樣,用識別結(jié)果能執(zhí)行代碼本的校正,甚至言語的內(nèi)容是未知的。
圖28是這樣的一種言語識別設(shè)備的方塊圖。
1401表示一特征提取部分,它使用例如LPC分析將未知的言語信號轉(zhuǎn)換成固定間隔上的特征矢量,以取得特征矢量系列Y=Y(jié)1,Y2,…,Yt…,YT。T代表特征矢量Y的系列的長度用于未知言語信號。
1402表示一儲存代碼矢量的代碼本儲存部分,結(jié)果它們能使用分給它們的標(biāo)號進(jìn)行檢索。
1043表示一模糊矢量量化部分,它按照遞增距離dr(t,m)用K符號對儲存在代碼本儲存部分1402中的矢量進(jìn)行編碼,以及用用于各個代碼矢量的特征矢量Yt,將它們轉(zhuǎn)成距離矢量dvt=(dt1,dt2,…,dtk),標(biāo)號矢量Ort=Ot1,Ot2,…,Otk),以及從屬矢量Urt=Ut1,Ut2,…,Utk)來取代由特征提取部分1401提取的特征矢量Y,該各個代碼矢量是用用于特征矢量Yt的標(biāo)號組進(jìn)行檢索的,以及將該特征矢量Yt的系列Y轉(zhuǎn)換成一系列距離矢量D=d1,d2,…,dT,一系列標(biāo)號矢量O=O1,O2,…,OT,以及一系列從屬矢量U=U1,U2,…,UT。
1404表示一HMM儲存部分,它儲有按欲識別的字的號數(shù)W提前產(chǎn)生的HMMλw(W=1-W),一狀態(tài)轉(zhuǎn)移概率矩陣A,以及儲存用于欲識別的每一個字的一標(biāo)號出現(xiàn)概率矩陣B。因此,處第W位置的HMMλw由λw={Aw,Bw}W=1W表示。
1405表示一特征矢量系列出現(xiàn)率計算部分,它使用由模糊矢量量化部分1403得到的標(biāo)號矢量O的系列,從屬矢量U的系列,儲存在HMM儲存部分1404中的第W個字的標(biāo)號出現(xiàn)概率矩陣Bw,按照公式36計算特征矢量系列出現(xiàn)率矩陣ΩW={ωwit}。
當(dāng)在時間t的一點(diǎn)處,特征矢量Yt服從于模糊矢量量化時,標(biāo)號出現(xiàn)概率biotk是來自HMM的狀態(tài)i的第K個標(biāo)號Otk的出現(xiàn)概率。
1406表示一相似性計算部分,使用用于由特征矢量系列出現(xiàn)率計算部分1405計算的HMMλw的特征矢量系列出現(xiàn)率矩陣Ωw以及用于儲存在HMM部分1404中的HMMλw的狀態(tài)轉(zhuǎn)換概率矩陣AW計算相似性L(Y/λw)。
1407表示一相似性儲存部分,為以后進(jìn)行比較,它儲存用于與由相似性計算部分1406計算的特征矢量Y的系列相關(guān)的每一個字的HMMλw的相似性L(X/λw)。
1408表示一比較/確定部分,它確定與HMM相關(guān)聯(lián)的字,即它在儲存在相似性儲存部分1407中的HMM中給出最大相似性作為識別的一個條件。
元件1405-1407的每一個操作對用于每個字的HMMλw只執(zhí)行一次,并且重復(fù)直到W等于W。這此操作的結(jié)果由比較/確定部分1408估算。
1409表示一識別選擇物(candidate)可靠性計算部分,它使用儲存在相似性儲存部分1407等中的用于識別的選擇物的相似性,計算由比較/確定部分1408選擇的用于識別的選擇物的可靠性。
1410表示一代碼本校正執(zhí)行確定部分,它傳送一代碼本校正信號到下面描述的代碼本校正部分,以執(zhí)行該代碼本的校正,如果由識別選擇物可靠性計算部分1409取得的用于識別的選擇物的可靠性等于或大于一預(yù)定的閾值。
1411表示一代碼本校正部分,它從代碼本校正執(zhí)行確定部分接收代碼本校正信號,使用儲存在代碼本儲存部分1402中的代碼字,由模糊矢量量化部分1403取得的距離矢量D的系列,標(biāo)號矢量O的系列,從屬矢量U的系列,以及通道概率校正代碼本,并將校正的代碼本送到代碼本儲存部分。
類似地,歸一化矢量能使用識別結(jié)果進(jìn)行校正,即使言語的內(nèi)容是未知的,只要這樣制作一種裝置,即當(dāng)一閾值被超過時調(diào)整該歸一化矢量,否則將不作調(diào)整。
圖29是這樣一種言語識別設(shè)備的方塊圖。
1501是一特征提取部分,它使用已知的如LPC分析方法,將一未知信號轉(zhuǎn)換成在固定間隔上的特征矢量,以取得一特征矢量系列Y=Y(jié)1,Y2,…,Yt,…YT。 T代表特征矢量Y系列的長度,用于未知言語信號。
1502表示一歸一化矢量存儲部分,它儲存一歸一化矢量,用于歸一化特征矢量。
1503表示一特征矢量歸一化部分,它使用歸一化矢量歸一化特征矢量。
1504表示一代碼本儲存部分,它儲存代碼矢量,結(jié)果它們能使用給予它們的標(biāo)號進(jìn)行檢索。
1505表示一模糊矢量量化部分,它用K個標(biāo)號,按照遞增距離dr(t,m)對儲存在代碼本儲存部分1502中的矢量編碼,以及用用于各代碼矢量的歸一化特征矢量Y’t的從屬值將它們轉(zhuǎn)換成距離矢量dt=(dt1,dt2,…,dtk),標(biāo)號矢量Ort=(Ot1,Ot2,…,Otk),以及從屬矢量Urt=(Ut1,Ut2,…,Utk),替代由特征矢量歸一化部分歸一化的特征矢量Y’t,以及將該歸一化的特征矢量Y’t的系列Y′轉(zhuǎn)換成一距離矢量D=d1,d2,…,dT,一標(biāo)號矢量系列O=O1,O2,…,OT,以及一從屬矢量系列U=U1,U2,…UT。
1506表示一HMM儲存部分,它儲存提前按欲識別的字的號數(shù)W產(chǎn)生的HMMλw(ω=1-W),一狀態(tài)轉(zhuǎn)移概率矩陣A以及對每一個欲識別的字儲存的一標(biāo)號出現(xiàn)率矩陣B。因此,在第W位置的HMMλw由λw={Aw,Bw}W=1-W表示。
1507表示一特征矢量系列出現(xiàn)率計算部分,它使用由模糊矢量量化部分1505取得的標(biāo)號矢量O的系列,從屬矢量U的系列,以及儲存在該HMM儲存部分1506中的第W個字的標(biāo)號出現(xiàn)概率矩陣Bw,按方程36計算用于HMMλw的一特征矢量系列出現(xiàn)率矩陣ΩW={ωwit}。
當(dāng)在時間t一個點(diǎn)處,特征矢量Y′t服從于模糊矢量量化時,符號出現(xiàn)概率biotk是該出現(xiàn)的概率,只要第K標(biāo)號Otk來自HMM的一個狀態(tài)i。
1508表示一相似性計算部分,它使用用于由特征矢量系列出現(xiàn)率計算部分1507計算的HMMλw計算相似性L(Y/λw),以及用于儲存在HMM儲存部分1506中的HMMλw的狀態(tài)轉(zhuǎn)移概率矩陣Aw。
1509表示一相似性儲存部分,為了以后進(jìn)行比較,它儲存用于每一個字的HMMλw的相似性L(Y/λw),該每一個字與由相信性計算部分1508計算的特征矢量Y的系列有關(guān)。
1510表示一比較/確定部分,它確立與HMM相關(guān)的字,即在儲存在相似性儲存部分1509的HMM中給出最大相似性。
元件1507-1509的每一個操作對用于每個字的HMMλw只執(zhí)行一次,并被重復(fù)直至W等于W。這些操作的結(jié)果由比較/確定部分1510估算。
1511表示一識別選擇物可靠性計算部分,它使用儲存在相似性儲存部分1509等中的用于識別的選擇物的相似性,計算由比較/確定部分1510選擇的用于識別的選擇物的可靠性。
1512表示一歸一化矢量調(diào)節(jié)執(zhí)行確定部分,它傳送一歸一化矢量調(diào)節(jié)信號到下面描述的一歸一化矢量調(diào)節(jié)部分,以執(zhí)行歸一化矢量的調(diào)整,如果由識別選擇物可靠性計算部分1511取得的用于識別的選擇物的可靠性等于或大于一預(yù)定的閾值。
1513表示一歸一化矢量調(diào)整部分,它從歸一化矢量調(diào)整執(zhí)行確定部分接收歸一化矢量調(diào)整信號,使用儲存在歸一化矢量儲存部分1502中歸一化矢量,由模糊矢量量化部分1505得到的距離矢量D系列,標(biāo)號矢量O系列,從屬矢量U系列,以及與用于識別的選擇物有的HMM的通道概率調(diào)整該歸一化矢量,并且將校正的歸一化矢量送到歸一化矢量儲存部分。
所要求是將一重心μm(m=1,…,M)轉(zhuǎn)換成對發(fā)言者A是最佳的μm′。這樣一種轉(zhuǎn)換(匹配)是系列地執(zhí)行的,并且匹配可以在不同的時間執(zhí)行,例如在言語的間隙或預(yù)定的間隔執(zhí)行。本發(fā)明的實(shí)施例將描述關(guān)于一種假設(shè),即匹配在輸入一個字的每一時間執(zhí)行。
按照本發(fā)明第一實(shí)施例,當(dāng)一個字的第n個發(fā)聲輸入時,它是服從于表示成μm1(n)=μm+hm(n)的轉(zhuǎn)換,并用從發(fā)言者A的字的n個過去的發(fā)聲中尋求最佳hm(n)的方法執(zhí)行。
本發(fā)明的特征在于從屬值和矢量Wm(n)以及瞬時運(yùn)動矢量Δm(n)僅由多半是目前輸入的一個字的第n個發(fā)言進(jìn)行計算的,而其中最佳運(yùn)動矢量hm(n)是在從屬值和運(yùn)動矢量Vm(n-1)累積乘積以及從屬值矢量Wm(n-1)的累積和基礎(chǔ)上對所有從第一到第n個發(fā)音的發(fā)音進(jìn)行計算的,該從屬值矢量Wm(n-1)已經(jīng)由(n-1)個過去的發(fā)音進(jìn)行計算。因此,所得到的μm′(n)經(jīng)常被轉(zhuǎn)換的在輸入發(fā)音中(包括過去的發(fā)音)的最佳者。
具體地,當(dāng)由發(fā)言者A的第n個發(fā)音得到的特征矢量被表示為YA1(n),YA2(n),…,YAI(n)時,僅僅用于第n個發(fā)音的一目標(biāo)函數(shù)J′(n)被定義為方程46,而用于所有n個發(fā)音的目標(biāo)函數(shù)JJ′(n)被定義為方程47。
方程46和方程47J'(n)=Σi=1InΣm=1Muim(n)Fd(yAl(n),μm'(n))]]>=Σi=1InΣm=1MuimF(n)d(yAi(n),μm'(n-1)+Δm(n))]]>JJ'(n)=Σr=1nΣi=1IrΣm=1Muim(r)Fd(yAi(r),μm1(r))]]>=Σr=1n-1Σi=1IrΣm=1Muim(r)Fd(yA1(r),μm1(r))]]>+Σi=1InΣm=1MuimF(n)d(yAi(n),μm'(n))]]>=JJ'(n-1)+Σi=1InΣm=1MuimF(n)d(yAi(n),μm+hm(n))]]>因此,該轉(zhuǎn)換能由求得對方程46給出一適當(dāng)小的解Δm(n)以及對方程47給出一適當(dāng)小的解hm(n)來完成。如果給出定義(Y,μ)=(Y-μ)T(Y-μ)(如在早先描述的例子中那樣),則這樣的Δm(n)和hm(n)將按下列步驟得到。S表示目前值,作為用于得到Δm(n)的計算循環(huán)的上限。(步驟3-1)在發(fā)言者發(fā)言輸入之前,置所有初始值。
等待輸入其中設(shè)置全目標(biāo)函數(shù)JJ′=∞;從屬值和運(yùn)動矢量Vm=0(m=1,…,M)累積乘積;從屬值矢量Wm=0(m=1,…,M)的累積和;以及輸入字n=0的個數(shù)的言語。(步驟3-2)輸入語言,之后,輸入字的個數(shù),n=n+1。(步驟3-3)設(shè)置關(guān)于每一個輸入的計算的循環(huán)數(shù),如S=0,設(shè)置目標(biāo)函數(shù)值如J(o)=∞,以及Δm(o)=0(m=1,…,M)。(步驟3-4)對于用于第n個輸入的從屬矩陣U(n)=[Unm(n)]的初始值U(n)(o)由下面方程給出方程48uim(n)(θ)=1Σk=1M(d(yAi(n),μm+hm(n-1)+Δm(n)(θ))d(yAl(n),μk+hk(n-1)+Δk(n)(θ)))1/(F-1)]]>1≤m≤M、1≤i≤In
這里In表示第n個發(fā)音的幀長度。(步驟3-5)S=S+1(步驟3-6)瞬時運(yùn)動矢量Δm(n)(s)(m=1,…,M)由下面方程得到。
方程49Δm(n)(s)=Σ|m|In(ulm(n)(s-1))F(yAi(n)-μm-hm(n-1)))Σi=1In(ulm(n)(s-1))f]]>uim(n)(s)=1Σk=1M(d(yAi(n),μm+hm(n-1)+Δm(n)(a)*)d(yAi(n),μk+hk(n-1)+Δk(n)(s)))1/(F-1);]]>1≤m≤M、1≤i≤In(步驟3-7)對組的每個點(diǎn)(輸入矢量)的從屬矩陣按下面方程計算。
方程50uim(n)(s)=1Σk=1M(d(yAi(n),μm+hm(n-1)+Δm(n)(s))d(yAi(n),μk+hk(n-1)+Δk(n)(s)))1/(F-1)]]>1≤m≤M、1≤i≤In
(步驟3-8)計算目標(biāo)函數(shù)。
方程51J(s)=Σi=1InΣm=1M(uim(n)(s))Fd(yAi(n),μm+hm(n)+Δm(n))]]>(步驟3-9)確定用于確定對目前輸入言語的瞬時運(yùn)動矢量計算的以下條件是否滿足。
方程52|J(s-1)-J(s)|J(s-1)≤δors≥S]]>如果否,處理返回到步驟3-5。如果是,處理進(jìn)行到下一個步驟。(步驟3-10)僅用于第n個發(fā)音的從屬值矢量Wm(n)的和按下面方程計算方程53Wm(n)=Σi=1Inuim(n)(s)]]>(步驟3-11)修改從屬值矢量Wm的累積和以及從屬值和運(yùn)動矢量Vm的累積乘積。
方程54Wm=Wm1+Wm(n)Vm=Vm+wm(n)×Δm(n)(步驟3-12)運(yùn)動矢量hm(n)(m=1,…,M)由下面方程得到。
方程55hm(n)=VmWm]]>(步驟3-13)計算全部目標(biāo)函數(shù)方程56JJ’(n)=JJ’(n-1)+J(n)(s)(步驟3-14)確定用于確定對每一個輸入發(fā)音的瞬時矢量計算的以下條件是否滿足。
方程57|JJ'(n-1)-JJ'(n)|JJ'(n-1)≤δδ]]>如果否,處理返回到步驟3-2,以等待言語輸入。如果是,終止匹配。
步驟3-9中的δ和步驟3-14中的δδ是適當(dāng)小的值,并且取決于準(zhǔn)備作為參考的一代碼本的多少重心偏向于輸入言語。當(dāng)δ是小,而S是大時,重心偏向于由對僅使用輸入言語分組的代碼本。當(dāng)過去輸入的發(fā)音n的數(shù)量小時,可考慮不希望有的情況,即重心的分布過分偏向于該輸入言語。所以,對于依賴輸入發(fā)音n的數(shù)量的δi和S,必須選擇適當(dāng)?shù)拇笮 ?br>
當(dāng)輸入發(fā)音n的數(shù)量小時,最好使在目標(biāo)函數(shù)(方程21)中的Δm(n)以及在所有目標(biāo)函數(shù)(方程47)中的hm(n)對m=1,…,M是通用的。具體地,該想法使用在本發(fā)明的第二實(shí)施中,其中Δ(n)=Δ1(n)=Δ2(n)=…=Δm(n);hn+h1(n)=h2(n)=…=hM(n);一個僅用于第n發(fā)音的目標(biāo)函數(shù)J″(n)由方程58確定。而用于所有幾個發(fā)音的全目標(biāo)函數(shù)JJ″(n)由方程59確定方程58J''(n)=Σi=1InΣm=1Muim(n)Fd(yRi(n),μm'(n))]]>=Σi=1InΣm=1MuimF(n)d(yAi(n),μm'(n-1)+Δ(n))]]>方程59JJ″(n)=Σn=1nΣi=1InΣm=1nuim(n)Fd(yAi(r),μm'(r))]]>=Σn=1n=1Σi=1InΣm=1Muim(r)Fd(yA1(r),μm'(r))]]>+Σi=1InΣm=1MuimF(n)d(yA1(n),μm'(n))]]>=JJ'(n-1)+Σi=1InΣm=1MuimF(n)d(yA1(n),μn+h(n))]]>
(步驟4-1)在發(fā)言者的發(fā)言輸入之前置所有初始值。
等待輸入其中設(shè)置全目標(biāo)函數(shù)JJ′=∞;從屬值矢量Wm=0的累積和;從屬值和運(yùn)動矢量Vm累積乘積;以及輸入字n=0的個數(shù)的言語。(步驟4-2)輸入言語,輸入字的個數(shù)n=n+1。(步驟4-3)設(shè)置關(guān)于每一個輸入計算的循環(huán)數(shù)S=0。設(shè)置目標(biāo)函數(shù)值J(o)=∞以及Δm(o)=0。(步驟4-4)對于用于第n個輸入的從屬矩陣U(n)=[Unm(n)]的初始值U(n)(o)由下面方程給出。
方程60uim(n)(θ)=1Σk=1M(d(yA1(n),μn+h(n-1)+Δ(n)(θ))d(yAi(n),μk+h(n-1)+Δ(n)(θ)))1(F-1)]]>1≤m≤M、1≤i≤In這里±n代表第n個發(fā)音的幀長度。(步驟4-5)S=S+1。
(步驟4-6)瞬時運(yùn)動矢量Δm(n)(s)由下面方程得到。
方程61Δ(n)(s)=Σm=1MΣi=1In(uim(n)(s-1))F(yAi-μm-h(n-1))Σm=1MΣi=1In(uim(n)(s-1))F]]>(步驟4-7)用于組的每一個點(diǎn)(輸入矢量)的從屬矩陣按下面公式計算。
方程62uim(n)(s)=1Σk=1M(d(yA1(n),μm+h(n-1)+Δ(n)(s))d(yA1(n),μk+h(n-1)+Δ(n)(s)))1/(F-1)]]>1≤m≤M、1≤i≤In(步驟4-8)計算目標(biāo)函數(shù)。
方程63J(s)=Σi=1InΣm=1M(uim(n)(s))Fd(yAi(n),μm+h(n)+Δ(n))]]>
(步驟4-9)確定用于確定對目前輸入言語的瞬時運(yùn)動矢量計算的以下條是否滿足。
方程64|J(s-1)-J(s)|J(s-1)≤δors≥S]]>如果否,處理返回步驟4-5,如果是,處理進(jìn)到下一步驟。(步驟4-10)僅用于第n發(fā)音的從屬值矢量Wm(n)的和按下面方程計算。
方程65w(n)=Σi=1lnΣm=1Muim(n)(9)]]>(步驟4-11)修改從屬值矢量累積和以及從屬值和運(yùn)動矢量的累積乘積。
方程66W=W+w(n)V=V+w(n)×Δ(n)運(yùn)動矢量h(n)由下面方程得到。
方程67h(n)=VW]]>
(步驟4-13)計算全目標(biāo)函數(shù)。
方程68JJ’(n)=JJ’(n-1)+J’(n)(s)(步驟4-14)確定用于確定對每一個輸入發(fā)音的運(yùn)動矢量計算的下列條件是否滿足。
方程69|JJ'(n-1)-JJ'(n)|JJ'(n-1)≤δδ]]>如果否,處理返回到步驟4-2,以等待言語輸入。如果是,終止匹配。
還是對于這種情況,輸入言語重心校正量的影響能通過選擇δ,S和δδ加以調(diào)整。
圖30是表示第一和第二實(shí)施例的方塊圖。對第一實(shí)施例,執(zhí)行步驟3-1—3-14,對第二實(shí)施例,執(zhí)行步驟4-1—4-14。
4000表示一輸入端,一系列作為在第n個輸入發(fā)音上執(zhí)行的特征提取結(jié)果的特征矢量Y1A(n),…,YAI(n)輸入到該輸入端、5000代表一參考代碼本,它儲存由多個od發(fā)言者產(chǎn)生的代碼矢量,結(jié)果它們可使用標(biāo)號進(jìn)行檢索。
4200表示一瞬時運(yùn)動矢量儲存部分。4900表示一運(yùn)動矢量儲存部分。5100表示將參考代碼本5000,瞬時運(yùn)動矢量儲存部分4200,以及運(yùn)動矢量儲存部分4900的內(nèi)容相加的一相加器。
4100表示一瞬時運(yùn)動矢量計算部分,它按照第一實(shí)施例中的步驟3-3—3-9計算Δm(n)(m=1,…,M)并且由通過輸入端4000輸入的內(nèi)容和相加器5100的輸出,按第二實(shí)施例中的步驟4-3—4-9計算Δ(n)。計算的瞬時運(yùn)動矢量儲存在瞬時運(yùn)動矢量儲存部分4200。當(dāng)上述重復(fù)計算啟動時,瞬時運(yùn)動矢量儲存部分4200的內(nèi)容被初始化到0。使用這種結(jié)構(gòu),瞬時運(yùn)動矢量儲存部分的內(nèi)容每次都被重寫,在計算期間得到修改的瞬時運(yùn)動矢量。
如果滿足在步驟309或步驟409對于終止的條件,與最后由發(fā)言者A給出的第n個發(fā)音相匹配的瞬時運(yùn)動矢量在瞬時運(yùn)動矢量儲存部分4200得到。如果確認(rèn)瞬時運(yùn)動矢量收斂,則一運(yùn)動矢量被進(jìn)行計算,過去輸入的發(fā)音也反映在該計算中(下面描述)。
4400表示一從屬值矢量累積和儲存部分。4300表示將從屬值矢量累積和儲存部分4400的內(nèi)容和瞬時運(yùn)動矢量計算部分4100的輸出相加的一相加器(從屬值矢量和)。從屬值矢量累積和儲存部分的內(nèi)容重寫到修改的從屬值矢量累積和。
4700表示一從屬值和運(yùn)動矢量累積乘積儲存部分。4600表示一相加器。4500表示一乘法器,它將瞬時運(yùn)動矢量計算部分4100的輸出(從屬值矢量和)同瞬時運(yùn)動矢量儲存部分4200的內(nèi)容相乘。該乘積同從屬值和運(yùn)動矢量的累積乘積儲存部分4700在相加器4600處相加。這樣,從屬值和運(yùn)動矢量的累積乘積儲存部分4700重寫到修改的從屬和運(yùn)動矢量的累積乘積。4800表示一除法器,而4900表示一運(yùn)動矢量儲存部分。除法器4800用從屬值矢量的累積和儲存部分4400的內(nèi)容去除從屬值和運(yùn)動矢量的累積乘積儲存部分4700的內(nèi)容。具體地,在第一實(shí)施例,運(yùn)動矢量hm(n)按步驟3-1,3-2,以及3-10—3-14進(jìn)行計算。在第二實(shí)施例,運(yùn)動矢量h(n)按步驟4-1,4-2以及4-10—4-14進(jìn)行計算。這樣的操作被重復(fù)進(jìn)行,每次輸入一輸入的發(fā)音。一個適合發(fā)言者A的典型矢量能夠借助于將這樣得到的運(yùn)動矢量加到參考代碼本的輸出而得到。
雖然說明集中在一代碼本對一發(fā)言者的匹配,反過來,也可能使一發(fā)言對一參考代碼本匹配,即能執(zhí)行發(fā)言者的歸一化。具體地,方程46和47能變成方程70J'(n)=Σi=1InΣm=1Muim(n)Fd(yA1(n),μm'(n))]]>=Σi=1InΣm=1MuimF(n)d(yAi(n),μm'(n-1)+Δm(n))]]>=Σi=1InΣm=1MuimF(n){yAi(n)-(μm'(n-1)+Δm(n))}T]]>{yAi(n)-(μm’(n-1)+Δm(n))}=Σi=1InΣm=1MuimF(n){yA1(n)-Δm(n))-μm'(n-1)}T]]>{(yAi(n)-Δm(n))-μm’(n-1)}
以及 方程71JJ'(m)=Σf=1nΣi=1InΣm=1Muim(r)Fd(yA1(r),μm'(r))]]>=Σr=1n-1Σi=1IrΣm=1Muim(r)Fd(yA1(r),μm'(r))]]>+Σi=1InΣm=1MuimF(n)d(yA1(n),μm'(n))]]>=JJ'(n-1)+Σi=1InΣm=1MuimF(n)d(yA1(n),μm+hm(n))]]>=JJ,(n-1)+Σi=1InΣm=1MuimF(n){yA1(n)-(μm(n-1)+hm(n))}T]]>{yAi(n)-(μm(n-1)+hm(n))}=JJ’(n-1)+Σi=1InΣm=1MuimF(n){(yA1(n)-hm(n))-μm(n-1)}T]]>{(yAi(n)-h(huán)n(n))-μm(n-1)}因此,從YAi中減去hm能認(rèn)為將一發(fā)言者歸一化到一代碼本。方程70和71分別相應(yīng)于圖30和31。如果圖32的結(jié)構(gòu)被用來給與它們,則方程72和73能被推導(dǎo)出來和方程70及71相關(guān)。
方程72和73J'(n)=Σi=1InΣm=1Muim(n)Fd(yR1(n)',μm)]]>=Σi=1InΣm=1MuimF(n)d(yAi(n)+hm(n-1)+Δm(n),μm)]]>=Σi=1InΣm=1MuimF(n){yAi(n)+hm(n-1)+Δm(n))-μm}T]]>{(yAi(n)+hm(n-1)+Δm(n))-μm}JJ'(n)=Σn=1nΣi=1InΣm=tMuim(r)Fd(yAi(r)',μm)]]>=Σr=1n-1Σi=1IrΣm=1Muim(r)Fd(yAi(r)+hm(r),μm)]]>+Σi=1InΣm=1MuimF(n)d(yAi(n)+hm(n),μm)]]>=JJ'(n-1)+Σi=1InΣm=1MuimF(n)d(yAi(n)+hm(n),μm)]]>=JJ’(n-1)+Σi=1InΣm=1MuimF(n)(yAi(n)+hm(n)-μm)T·μm]]>{yAi(n)+hm(n)-μm(n))]上述內(nèi)容是這樣一種情況,即所有由發(fā)言者A輸入到本系統(tǒng)的過去的聲音被用于匹配,但是存在著這樣一種可能性,即在使用該發(fā)言者期間,情況會改變,而且在這種情況下,最好適應(yīng)地使用某些時間以前的聲音。那就是在圖30,31,32等中的從屬值矢量的累積和儲存部分4400和從屬值和運(yùn)動矢量累積乘積儲存部分4700用前述方法,用每一個確定周期的儲存內(nèi)容計算運(yùn)動矢量,以重寫代碼本或修改發(fā)言者歸一化的歸一化矢量。
使用健忘系數(shù)α(0<α<1)改變方程54和66,以及74和75將導(dǎo)致這樣一種情況,即當(dāng)從屬值矢量和瞬時運(yùn)動矢量從某一過去時間進(jìn)行計算時,則該過去時越長,乘與矢量的值越小。因此,輸入越是接近目前時間,輸入被更大地加數(shù)。
方程74和75Wm=α×Wm+wm(n)Vm=α×Vm+wm(n)×Δm(n)W=α×W+w(n)V=α×V+w(n)×Δ(n)對于這樣情況的結(jié)構(gòu),如圖33和34所示,在從屬值和運(yùn)動矢量的累積乘積儲存部分4700和相加器4600之間放置一個乘法器5400,而且在從屬值矢量4600之間放置一個乘法器5400,而且在從屬值矢量的累積和儲存部分4400和相加器5500之間放置一乘法器5500,以及健忘系數(shù)從健忘系數(shù)儲存部分5300輸出到這些同矢量儲存部分4700,4400相乘的乘法器5400,5500。
現(xiàn)在說明將在執(zhí)行審查本發(fā)明效果的試驗(yàn)上進(jìn)行。一參考代碼提前以20個男發(fā)言者產(chǎn)生、連續(xù)的匹配用由一未知發(fā)言者的發(fā)音輸入執(zhí)行。
關(guān)于識別試驗(yàn)使用100個字,結(jié)果在無匹配情況下對20人形成84.2%的平均識別率。連續(xù)的匹配使識別率上升到88.7%。
按本發(fā)明實(shí)施例,雖然運(yùn)動矢量被計算為h1,h2,hM,它們給出目標(biāo)函數(shù)極端值,這些值可以用不合理的祖?zhèn)鞣椒ɑ蚱渌愃品椒ǖ玫?。而本發(fā)明實(shí)施例集中在一種情況,其中減小目標(biāo)函數(shù)的hi是存在的,增大目標(biāo)函數(shù)的hi可以依賴于目標(biāo)函數(shù)定義得到。例如,當(dāng)在本實(shí)施例中的J由-J替代時當(dāng)然這將發(fā)生。此外,術(shù)語″加″和″減″已用在本實(shí)施例中,它們可以進(jìn)行交換,因?yàn)榘殡S一負(fù)信號或相反的話,加就意味著減。
如上所述,本發(fā)明使使用小數(shù)量取樣對具體發(fā)言者發(fā)聲修改一代碼本,或者歸一化該發(fā)言者的發(fā)聲成為可能,由此它遵守一參考代碼本。因此它可能用少量的學(xué)習(xí)改善對于通信的通信質(zhì)量以及對于識別的識別精度。
按本發(fā)明,一代碼本使用內(nèi)容未知的言語和一校正矢量來進(jìn)行校正,該校正矢量由用同該言語相關(guān)的HMMS計算的通道概率加數(shù),并且被取來使與代碼本相關(guān)的量化失真降到最小。這使補(bǔ)償在產(chǎn)生HMMS的時間和識別時間之間的環(huán)境條件方面的差異成為可能,因此,使言語識別設(shè)備對環(huán)境變化有抵抗力。
按照本發(fā)明,特征矢量使用內(nèi)容未知的言語和一歸一化矢量來進(jìn)行校正的,該歸一化矢量由用同該言語相關(guān)的HMMS計算的通道概率加數(shù),并且被取來使與代碼本相關(guān)的量化失真降低到最小,這使補(bǔ)償在產(chǎn)生HMMS的時間和識別時間之間的環(huán)境條件方面的差異成為可能,因此,使言語識別設(shè)備對環(huán)境變化有抵抗力。
權(quán)利要求
1.一種矢量量化器包括一參考代碼本,用于儲存在一特征矢量空間中的若干典型矢量,使能使用相應(yīng)的標(biāo)號對它們進(jìn)行檢索;一學(xué)習(xí)矢量儲存裝置,用于儲存若干用于學(xué)習(xí)的矢量;一目標(biāo)函數(shù)計算裝置,用于計算被定義為所說典型矢量和所說用于學(xué)習(xí)的矢量的函數(shù)的目標(biāo)函數(shù);一運(yùn)動矢量計算裝置,用于計算運(yùn)動矢量;以及一匹配裝置,用于將所說運(yùn)動矢量與所說典型矢量相加取得新的典型矢量,其中通過將該輸入矢量轉(zhuǎn)換成標(biāo)號或從屬矢量對輸入矢量進(jìn)行編碼,該從屬矢量的分量,為用于所說新典型矢量的標(biāo)號的所說輸入矢量的從屬值;以及所說運(yùn)動矢量計算裝置計算與所說用于學(xué)習(xí)的矢量相關(guān)的目標(biāo)函數(shù)的所說新典型矢量的最大值。
2.一種矢量量化器包括一參考代碼本,用于儲存在一特征矢量空間中的若干典型矢量,使能使用相應(yīng)的標(biāo)號對它們進(jìn)行檢索;一學(xué)習(xí)矢量儲存裝置,用于儲存若干用于學(xué)習(xí)的矢量;一目標(biāo)函數(shù)計算裝置,用于計算被定義為所說典型矢量和所說用于學(xué)習(xí)的矢量的函數(shù)的目標(biāo)函數(shù);一運(yùn)動矢量計算裝置,用于計算運(yùn)動矢量;以及一歸一化裝置,用于將所說運(yùn)動矢量與輸入矢量相比,其中輸入矢量通過將該運(yùn)動矢量與該輸入矢量相加對輸入矢量進(jìn)行編碼,以得到所說歸一化輸入矢量,以及將它們轉(zhuǎn)換成標(biāo)號或從屬矢量進(jìn)行編碼,該從屬量矢量的分量為用于該標(biāo)號的所說輸入矢量的從屬值;以及所說運(yùn)動矢量計算裝置當(dāng)用于學(xué)習(xí)的所說計算所說目標(biāo)函數(shù)的最大值。
3.一種矢量量化器包括一參考代碼本,用于儲存在一特征矢量空間中的若干典型矢量因此,它們中每一個能使用相關(guān)的標(biāo)號進(jìn)行檢索;一言語輸入裝置,用于輸入言語;一言語分析裝置,用于執(zhí)行對于所說輸入言語的特征提取,以便將它轉(zhuǎn)換成一特征矢量系列;一矢量量化裝置,用于將所說特征矢量轉(zhuǎn)換成標(biāo)號或一從屬值矢量,其分量為所說用于典型矢量的特征矢量的從屬值;一目標(biāo)函數(shù)計算裝置,用于計算被定義為所說典型矢量和所說特征矢量系列的函數(shù)的目標(biāo)函數(shù);一瞬時運(yùn)動矢量計算裝置,用于計算僅與目前輸入發(fā)音有關(guān)的一運(yùn)動矢量(瞬時運(yùn)動矢量);一從屬值矢量和計算裝置,用于計算在用于計算所說瞬時運(yùn)動矢量的輸入言語段表中的所說從屬值的和(從屬值矢量和);一從屬值和運(yùn)動矢量乘積計算裝置,用于計算所說為瞬時運(yùn)動矢量和所說從屬值矢量乘積的一矢量(從屬值和運(yùn)動矢量的乘積);一從屬值矢量的累積和儲存裝置,用于累積和儲存過去的從屬值矢量和;一從屬值和運(yùn)動矢量的累積乘積儲存裝置,用于累積和儲存過去的從屬值和運(yùn)動矢量的乘積;一運(yùn)動矢量計算裝置,用于根據(jù)儲存在所說從屬值和運(yùn)動矢量累積乘積儲存裝置中的從屬值和運(yùn)動矢量的過去的累積乘積,以及儲存在所說從屬值矢量的累積和存儲裝置中的從屬值矢量的過去的累積和計算過去的運(yùn)動矢量;以及一匹配裝置,用于將所說運(yùn)動矢量與所說典型矢量相加,以得到新的典型矢量,其中所說瞬時運(yùn)動矢量計算裝置計算所說新典型矢量,使所說目標(biāo)函數(shù)接近于和用于目前輸入發(fā)音的特征矢量有關(guān)的極值,以及其中所說運(yùn)動矢量計算裝置計算使全目標(biāo)函數(shù)接近于和用于過去輸入發(fā)音的特征矢量有關(guān)的極值。
4.一種矢量量化器包括一參考代碼本,用于儲存在一特定矢量空間中的若干典型矢量,使它們中每一個能使用相關(guān)的標(biāo)號進(jìn)行檢索;一語言輸入裝置,用于輸入言語;一言語分析裝置,用于執(zhí)行對于所說輸入言語的特征提取,以便將它轉(zhuǎn)換成一特征矢量系列;一矢量量化裝置,用于將所說特征矢量轉(zhuǎn)換成標(biāo)號或一從屬值矢量,其分量為所說用于典型矢量的特征矢量的從屬值;一目標(biāo)函數(shù)計算裝置,用于計算被定義為所說典型矢量和所說特征矢量系列的函數(shù)的目標(biāo)函數(shù);一瞬時運(yùn)動矢量計算裝置,用于計算僅與目前輸入發(fā)音有關(guān)的一運(yùn)動矢量(瞬時運(yùn)動矢量);一從屬值矢量和計算裝置,用于計算在用于計算所說瞬時運(yùn)動矢量的輸入言語段表中的所說從屬值的和(從屬值矢量和);一從屬值和運(yùn)動矢量乘積計算裝置,用于計算所說為瞬時運(yùn)動矢量和所說從屬值矢量乘積的一矢量(從屬值和運(yùn)動矢量和乘積);一從屬值矢量的累積和儲存裝置,用于累積和儲存過去的從屬值矢量和;一從屬值和運(yùn)動矢量的累積乘積存儲裝置,用于累積和存儲過去的從屬值和運(yùn)動矢量的乘積;一運(yùn)動矢量計算裝置,用于根據(jù)儲存在所說從屬值和運(yùn)動矢量累積乘積存儲裝置中的從屬值和運(yùn)動矢量的過去的累積乘積,以及儲存在所說從屬值矢量的累積和存儲裝置中的從屬值矢量的過去的累積和計算過去的運(yùn)動矢量;以及一歸一化裝置,用于將所說運(yùn)動矢量與一輸入矢量相加,其中,所說瞬時運(yùn)動計算裝置當(dāng)目前輸入矢量與所說運(yùn)動矢量和被取代作為用于學(xué)習(xí)的一新矢量時計算使所說目標(biāo)函數(shù)接近于和所說參考代碼本相關(guān)的極值,以及其中當(dāng)過去的輸入矢量和所說運(yùn)動矢量的和被取代作為用于學(xué)習(xí)的新矢量時,所說運(yùn)動矢量計算裝置計算使全目標(biāo)函數(shù)接近于和所說參考代碼本相關(guān)的極值。
5.按權(quán)利要求1或2的矢量量化器,其中所說運(yùn)動矢量計算裝置得到用于每一個典型矢量的一運(yùn)動矢量。
6.按權(quán)利要求1或2的矢量量化器,其中所說運(yùn)動矢量計算裝置得到用于所有典型矢量的一公用運(yùn)動矢量。
7.按權(quán)利要求1的矢量量化器包括一個相加器,用于將一運(yùn)動矢量和在參考代碼本中的每一個典型矢量相加,其中矢量量化根據(jù)所說相加器輸出執(zhí)行。
8.按權(quán)利要求1的矢量量化器包括一個相加器,用于將一運(yùn)動矢量和在參考代碼本中的每一個典型矢量相加,從一個用于儲存所說相加器輸出的匹配代碼本,其中矢量量化根據(jù)所說匹配代碼本輸出執(zhí)行。
9.一種信號發(fā)射機(jī)包括發(fā)射由權(quán)利要求7或8的矢量量化器編碼的標(biāo)號的一標(biāo)號發(fā)射裝置以及一運(yùn)動矢量發(fā)射裝置。
10.一種信號發(fā)射機(jī)包括發(fā)射由權(quán)利要求8的矢量量化器編碼的標(biāo)號的一標(biāo)號發(fā)射裝置以及用于發(fā)射一匹配代碼本的匹配代碼發(fā)射裝置。
11.一種信號接收機(jī),包括一運(yùn)動矢量儲存部分,用于儲存由權(quán)利要求9的信號發(fā)射機(jī)發(fā)射的運(yùn)動矢量,一參考代碼本,一相加器用于將由與一標(biāo)號相關(guān)的所說參考代碼本讀出的一典型矢量同按照該標(biāo)號由所說運(yùn)動矢量儲存部分讀出的一運(yùn)動矢量相加,以及一譯碼器,用于提供所說相加器的輸出,作為用于所說標(biāo)號的解碼矢量。
12.一種信號接收機(jī),包括一運(yùn)動矢量儲存部分,用于儲存由權(quán)利要求9的信號發(fā)射機(jī)發(fā)射的運(yùn)動矢量,一參考代碼本,一匹配代碼本,用于儲存在所說參考代碼中與標(biāo)號相關(guān)的典型矢量同按照該標(biāo)號由所說運(yùn)動矢量儲存部分讀出的所說運(yùn)動矢量的和,以及一解碼器,用于提供在所說與標(biāo)號相關(guān)的匹配代碼本中的一代碼矢量,該標(biāo)號正被接收作為用于所說標(biāo)號的一解碼矢量。
13.一種信號接收機(jī),包括一匹配代碼本儲存部分,用于儲存由權(quán)利要求10的信號發(fā)射機(jī)發(fā)射的匹配代碼本,以及一解碼器,用于提供在所說與標(biāo)號相關(guān)的匹配代碼中的一代碼矢量,該標(biāo)號已被接收作為用于所說標(biāo)號的一解碼矢量。
14.一識別設(shè)備,包括權(quán)利要求1的矢量量化器,根據(jù)已經(jīng)輸入的每個特征矢量系列執(zhí)行矢量量化,用于將它們轉(zhuǎn)換成標(biāo)號,以及用于按序?qū)⑺f特征矢量系列轉(zhuǎn)換成標(biāo)號系列,一HMM儲存裝置,用于儲存HMM于每一單元以便識別,其中每一標(biāo)號的出現(xiàn)率被確定用于每一狀態(tài),以及一相似性計算裝置,用于計算每一個所說HMMS的相似性,用于所說標(biāo)號系列,用于與HMM相關(guān)的識別單元給出相似性的最大值,視作為識別結(jié)果。
15.一識別設(shè)備,包括權(quán)利要求1的矢量量化器,根據(jù)已經(jīng)輸入的特征矢量系列中之一個系列執(zhí)行矢量量化,用于將它們轉(zhuǎn)換成其分量是矢量的從屬值的從屬矢量,用于單獨(dú)的標(biāo)號,以及用于按序?qū)⑺f特征矢量系列轉(zhuǎn)換成所說從屬矢量系列,一HMM儲存裝置用于儲存用于每個單元的HMM,以用于識別其中每一個標(biāo)號的出現(xiàn)概率被確定用于每個狀態(tài),以及一相似性計算裝置,用于計算每一個所說HMMS的相似性,用于所說從屬矢量系列,用于與HMM相關(guān)的識別單元給出相似性的最大值作為識別結(jié)果。
16.一矢量量化器包括一參考代碼本儲存裝置,用于儲存在一特征矢量空間中有限數(shù)量的典型矢量,使它們能使用指定的標(biāo)號進(jìn)行檢索;一矢量量化裝置,用于使用所說參考代碼本將每個特征矢量系列轉(zhuǎn)換成一組與標(biāo)號相關(guān)的從屬值,以便將所說特征矢量轉(zhuǎn)換成從屬矢量系列;一HMM儲存裝置,用于儲存HMMS,對于它,所說標(biāo)號出現(xiàn)概率(標(biāo)號出現(xiàn)概率)以及一狀態(tài)轉(zhuǎn)移概率被確定采用于其每一狀態(tài);一特征矢量系列出現(xiàn)率的計算裝置,用于根據(jù)所說標(biāo)號出現(xiàn)率和所說從屬矢量,計算來自所說HMMS的特征矢量系列的出現(xiàn)率;一通道概率計算裝置,用于根據(jù)所說特征矢量出現(xiàn)率和所說HMM轉(zhuǎn)移概率,計算在時間t的某點(diǎn)處某一狀態(tài)的存在的概率;以及一代碼本校正裝置,用于校正所說典型矢量,其中,所說代碼本校正裝置包括一校正矢量計算裝置,用于校正所說典型矢量,以使來自由所說通道概率加數(shù)的所說參考代碼本的特征矢量系列的量化誤差的失真降到最小,以及被形成來校正所說典型矢量。
17.一種矢量量化器包括一參考代碼本儲存裝置,用于儲存在一特征矢量空間中有限數(shù)量的典型矢量,使它們能使用指定的標(biāo)號進(jìn)行檢索;一矢量量化裝置,用于使用所說參考代碼本,將所說特征矢量系列轉(zhuǎn)換成一組與標(biāo)號相關(guān)的從屬值,以便將所說特征矢量轉(zhuǎn)換成從屬矢量系列;一HMM儲存裝置,用于儲存HMMS,對于它,所說標(biāo)號出現(xiàn)概率(標(biāo)號出現(xiàn)概率)以及一狀態(tài)轉(zhuǎn)移概率被確定來用于其每一狀態(tài);一特征矢量系列出現(xiàn)率計算裝置,用于根據(jù)所說標(biāo)號出現(xiàn)率和所說從屬矢量,計算來自所說HMMS的特征矢量系列的出現(xiàn)率;一通道概率計算裝置,用于根據(jù)所說特征矢量出現(xiàn)率和所說HMM轉(zhuǎn)移概率,計算在時間t的某點(diǎn)處理一狀態(tài)的存在的概率;一相似性計算裝置,用于計算用于每一個與所說特征矢量系列有關(guān)的所說每一個字的HMM的相似性;一比較和確定裝置,用于確定識別的結(jié)果;一識別選擇物可靠性計算裝置,用于計算一種選擇物的可靠性,用于由所說比較和確定裝置得到的識別;一代碼本校正執(zhí)行確定裝置,用于指令該參考代碼本的校正執(zhí)行,如果所說用于識別的可靠性超過一預(yù)定的閾值;以及一代碼本校正裝置,用于校正每個所說代碼矢量,其中所說參考本代碼校正裝置包括一校正矢量計算裝置,用于校正所說典型矢量,以使來自所說代碼本的由所說通道概率加權(quán)的特征矢量系列的量化誤差的失真降到最小,以及當(dāng)由使用用于識別的選擇物作為言語內(nèi)容而言語的內(nèi)容未知時被形成來校正所說參考代碼本。
18.按權(quán)利要求1的一識別設(shè)備包括矢量量化器,根據(jù)已經(jīng)輸入的每個特征矢量系列執(zhí)行矢量量化,用于將它們轉(zhuǎn)換成標(biāo)號,以及用于按序?qū)⑺f特征矢量系列轉(zhuǎn)換成標(biāo)號系列,一識別模型儲存裝置,用于儲存由一標(biāo)號系列表示的識別模型,用于用于識別的每個單元,以及一距離計算裝置,用于計算距離或在所說輸入標(biāo)號系列和每個所說識別模型之間的類似性,用于與識別模型相關(guān)的識別單元給出所說距離的最小值或所說類似性的最大值,視作為識別的結(jié)果。
19.按權(quán)利要求1的一識別設(shè)備,包括矢量量化器,根據(jù)已經(jīng)輸入的特征矢量系列中之一個系列執(zhí)行矢量量化,用于將它們轉(zhuǎn)換成其分量是各個標(biāo)號的矢量從屬值的從屬矢量,以及用于按序?qū)⑺f特征矢量系列轉(zhuǎn)換成所說從屬矢量系列,一識別模型儲存裝置,用于儲存表一標(biāo)號系列識別模型,用于用于識別的每個單元,以及一距離計算裝置,用于計算距離或在所說輸入標(biāo)號系列和每個所說識別模型之間的類似性,用于與識別模型相關(guān)的識別單元給出所說距離的最小值或所說類似性的最大值視作為識別結(jié)果。
20.按權(quán)利要求2的矢量量化器,包括將一運(yùn)動矢量和輸入矢量相加的一相加器,其中矢量量化根據(jù)所說相加器輸出執(zhí)行。
21.一信號發(fā)射機(jī)包括一標(biāo)號發(fā)射裝置,用于發(fā)射由權(quán)利要求20的矢量量化器編碼的標(biāo)號,以及一運(yùn)動矢量發(fā)射裝置,用于發(fā)射一運(yùn)動矢量。
22.一種信號接收機(jī),包括一運(yùn)動矢量儲存部分,用于儲存由權(quán)利要求21的信號發(fā)射機(jī)發(fā)射的運(yùn)動矢量,一參考代碼本,一相減器,按照接收到的一個標(biāo)號,從由所說參考代碼本的讀出的一典型矢量減去從所說運(yùn)動矢量儲存裝置讀出的一運(yùn)動矢量,以及一解碼器,用于提供所說相減器輸出作為用于所說標(biāo)號的解碼矢量。
23.一種識別設(shè)備,包括權(quán)利要求2的矢量量化器,根據(jù)已經(jīng)輸入的每個特征矢量系列的一歸一化矢量執(zhí)行矢量量化,用于將它們轉(zhuǎn)成標(biāo)號系列,并用于按序?qū)⑺f特征矢量系列轉(zhuǎn)換成一標(biāo)號系列,一HMM儲存裝置,用于儲存一HMM,用于用于識別的每一單元,其中,每一標(biāo)號的出現(xiàn)概率被確定來自于每個狀態(tài),以及一相似性計算裝置,用于計算用于所說從屬矢量的每個所說HMMS的相似性,用于與HMM相關(guān)的識別單元給出相似性的最大值視作識別結(jié)果。
24.一種識別設(shè)備,包括按權(quán)利要求2的矢量量化器,根據(jù)已經(jīng)輸入的每個特征矢量系列的歸一化矢量執(zhí)行矢量量化,用于將它們轉(zhuǎn)換成其分量是各個標(biāo)號的矢量的從屬值的從屬矢量,以及用于按序?qū)⑺f特征矢量系列轉(zhuǎn)換成所說從屬矢量系列,一HMM儲存裝置用于儲存用于每個單元的HMM,以用于識別,其中每一個標(biāo)號的出現(xiàn)概率被確定用于每個狀態(tài),以及一相似性計算裝置,用于計算每一個所說HMMS的相似性,用于所說從屬矢量系列,用于與HMM相關(guān)的識別單元給出相信性的最大值作為識別結(jié)果。
25.一矢量量化器包括一參考代碼本儲存裝置,用于儲存在一特征矢量量空間中有限數(shù)量的典型矢量,使它們能使用指定的標(biāo)號進(jìn)行檢索;一矢量量化裝置,用于使用所說參考代碼本將每個特征矢量系列轉(zhuǎn)換成一組與一標(biāo)號相關(guān)的從屬值,以便將所說特征矢量轉(zhuǎn)換成從屬矢量系列;一HMM儲存裝置,用于儲存HMMS,對于它,所說標(biāo)號出現(xiàn)概率(符號出現(xiàn)率)以及一狀態(tài)轉(zhuǎn)移概率被確定用于其每一狀態(tài);一特征矢量系列出現(xiàn)率計算裝置,用于根據(jù)所說標(biāo)號出現(xiàn)率和所說從屬矢量,計算來自所說HMMS的特征矢量系列的出現(xiàn)率;一通道概率計算裝置,用于根據(jù)所說特征矢量出現(xiàn)率和所說HMM轉(zhuǎn)移概率在時間t的某點(diǎn)處某一狀態(tài)的存在的概率;一特征矢量校正裝置,用于校正所說特征矢量;以及一歸一化矢量調(diào)整裝置,用于計算用于校正所說特征矢量的一歸一矢量,其中所說歸化矢量調(diào)整裝置包括一校正矢量計算裝置,用于校正所說典型矢量,以使來自由所說通道概率加權(quán)的所說參考代碼本的所說特征矢量系列的量化誤差的失真降到最小,以及被形成來校正所說典型矢量。
26.一矢量量化器包括一參考代碼本儲存裝置,用于儲存在一特征矢量空間中有限數(shù)量的典型矢量,使它們能使用指定的標(biāo)號進(jìn)行檢索;一矢量量化裝置,用于使用所說參考代碼本,將所說特征矢量系列轉(zhuǎn)換成一組與標(biāo)號相關(guān)的從屬值,以便將所說特征矢量轉(zhuǎn)換成從屬矢量系列;一HMM儲存裝置,用于儲存HMMS,對于它,所說標(biāo)號出現(xiàn)概率(標(biāo)號出現(xiàn)概率)以及一狀態(tài)轉(zhuǎn)移概率被確定來用于其每一狀態(tài);一特征矢量系列出現(xiàn)率計算裝置,用于根據(jù)所說標(biāo)號出現(xiàn)率和所說從屬矢量,計算來自所說HMMS的特征矢量系列的出現(xiàn)概率;一通道概率計算裝置,用于根據(jù)所說特征矢量出現(xiàn)概率和所說HMM轉(zhuǎn)移概率,計算在時間t的某點(diǎn)處某一狀態(tài)的存在的概率;一相似性計算裝置,用于計算用于每一個與所說特征矢量系列有關(guān)的所說每一個字的HMM的相似性;一比較和確定裝置,用于確定識別的結(jié)果;一識別選擇物可靠性計算裝置,用于計算由所說比較和確定裝置得到的識別選擇物的可靠性;一代碼本校正執(zhí)行確定裝置,用于指令該參考代碼本的校正執(zhí)行,如果所說用于識別的可靠性超過一預(yù)定的閾值;一特征矢量校正裝置,用于校正所說特征矢量;以及一歸一化矢量調(diào)整裝置,用于計算用于校正所說特征矢量的一校正矢量,其中所說參考代碼本校正裝置包括一校正矢量計算裝置,用于校正所說典型矢量,以使來自由所說通道概率加權(quán)的所說參考代碼本的所說特征矢量系列的量化誤差的失真降到最小,以及當(dāng)由使用識別的選擇物作為言語的內(nèi)容而言語的內(nèi)容未知時被形成來校正所說參考代碼本。
27.一種識別設(shè)備,包括權(quán)利要求2的矢量量化器,根據(jù)已經(jīng)輸入的每個特征矢量系列的一歸一化矢量執(zhí)行矢量量化,用于將它們轉(zhuǎn)換成標(biāo)號系列,并用于按序?qū)⑺f特征矢量系列轉(zhuǎn)換成一標(biāo)號系列,一識別模型儲存裝置,用于儲存由一標(biāo)號系列表示的一識別模型,用于用于識別的每一單元,以及一距離計算裝置,用于計算在所說輸入標(biāo)號系列和每一個所說識別模型之間的距離或類似性,用于與識別模型相關(guān)的識別單元給出所說距離的最小值或所說類似性的最大值視作為識別結(jié)果。
28.一種識別設(shè)備,包括按權(quán)利要求2的矢量量化器,根據(jù)已經(jīng)輸入的每個特征矢量系列的歸一化矢量執(zhí)行矢量量化,用于將它們轉(zhuǎn)換成其分量是各個標(biāo)號的矢量的從屬值的從屬矢量,以及用于按序?qū)⑺f特征矢量系列轉(zhuǎn)換成所說從屬矢量系列,一識別模型儲存裝置,用于儲存由一標(biāo)號系列表示的一識別模型,用于用于識別的每一單元,一距離計算裝置,用于計算在所說從屬矢量系列和每一個所說識別模型之間的距離或類似性,用于與識別模型相關(guān)的識別單元給出所說距離的最小值或所說類似性的最大值視作為識別結(jié)果。
29.按權(quán)利要求1的矢量量化器包括一暫存裝置,用于順序地,實(shí)時地儲存一輸入信號的預(yù)定的固定的信號部分,其中,對每一個使用所說暫存裝置內(nèi)容作為用于學(xué)習(xí)矢量的所說信號部分執(zhí)行一代碼本或一運(yùn)動矢量的順次匹配。
30.按權(quán)利要求2的矢量量化器,包括一暫存器裝置,用于順序地,實(shí)時地儲存一輸入信號的預(yù)定的固定的信號部分,其中,對每一個使用所說暫存裝置內(nèi)容作為用于學(xué)習(xí)的矢量的所說信號部分順序地計算用于校正輸入信號的運(yùn)動矢量。
全文摘要
一個用于矢量化的代碼本乃是發(fā)言者適應(yīng)的,或者一發(fā)言者是被歸一化的,結(jié)果,為了學(xué)習(xí)、它遵照使用小取樣數(shù)的代碼本。一運(yùn)動矢量被設(shè)置用于每一組或一輸入矢量的重心。該運(yùn)動矢量是這樣設(shè)置的,即當(dāng)使用從一發(fā)言者取得的用于學(xué)習(xí)的取樣時,一個分別地確定的目標(biāo)函數(shù)達(dá)到最大,如果被確定的達(dá)到最大,或者達(dá)到最小,如果被確定的達(dá)到最小,該發(fā)言者在當(dāng)重心或輸入矢量被一個相應(yīng)于該運(yùn)動矢量的量移動時使用該系統(tǒng)。
文檔編號G10L15/20GK1133467SQ9510323
公開日1996年10月16日 申請日期1995年2月1日 優(yōu)先權(quán)日1994年2月2日
發(fā)明者坪香英一, 中橘順一 申請人:松下電器產(chǎn)業(yè)株式會社