專利名稱:多脈沖分析語言處理系統(tǒng)及其方法
一般地說,本發(fā)明涉及語音處理系統(tǒng),具體地說,涉及多脈沖分析系統(tǒng)。
語音信號處理是技術(shù)上公知的,常用于壓縮輸入的語音信號,以供存儲或傳輸。語音信號處理通常涉及把輸入的語音信號分成幀(frame),然后分析每一幀以確定其分量(component)。然后將各分量存儲或傳輸。
典型情況是,幀分析器確定語音信號的短時和長時特性。幀分析器還能確定語音信號的短時和長時分量(或稱“貢獻(contribu-tion)”)之一或二者。例如,線性預(yù)測系數(shù)分析(LPC)提供短時特性和貢獻,而音調(diào)(pitch)分析和預(yù)測提供長時的特性以及長時貢獻。
典型情況是,從輸入幀中減掉長時和短時預(yù)測器貢獻中的任一個、或二者、或者都不減掉,從而留下要確定其形狀特征的目標(biāo)矢量。可以用多脈沖分析(MPA)來產(chǎn)生這種特征化。多脈沖分析(MPA)由S.古井,在“數(shù)字語音處理、合成與識別(Digital speechProcessing,Synthesis and Recognition)”一書(紐約Marcel Dekker公司出版,NY 1989)中的6.4.2節(jié)中進行了詳細描述。這里把該書作為參考。
在MPA中,由多個樣本構(gòu)成的目標(biāo)矢量用不同位置和不同符號(正或負)的多個單增益脈沖(或尖峰)來構(gòu)成模型。為選擇每個脈沖,在每個樣本位置放置一個脈沖,并確定該脈沖通過一個由LPC系數(shù)定義的濾波器時所確定的脈沖效應(yīng)。能與目標(biāo)矢量擬合得最好的脈沖被選擇出來并從目標(biāo)矢量中去掉該脈沖的效應(yīng),從而產(chǎn)生一個新的目標(biāo)矢量。該過程要繼續(xù)到找出預(yù)定的數(shù)目的脈沖為止。為了存儲或傳輸?shù)哪康?,MPA分析的結(jié)果是脈沖位置的集合以及一個定量化的增益值。
通常該增益是由所確定的第一脈沖確定的。然后這個增益被用于其余的脈沖。不幸的是,第一脈沖的增益值并不總是指示出目標(biāo)矢量的總體增益值,所以對目標(biāo)矢量的擬合并不總是很精確。
所以,本發(fā)明的目的是提供一種改進的語音處理系統(tǒng)。在本發(fā)明的一個實施例中,系統(tǒng)包括一個短時分析器、一個目標(biāo)矢量發(fā)生器和一個最大似然量化(MLQ)多脈沖分析單元。短時分析器確定輸入語音信號的短時特性。目標(biāo)矢量發(fā)生器從至少是該輸入信號產(chǎn)生一個目標(biāo)矢量。MLQ多脈沖分析單元對所造成的目標(biāo)矢量進行操作。
MLQ多脈沖分析單元通常為多脈沖序列確定一個初始增益水平,并完成多次單增益MPA,每次采用不同的增益水平。這些增益水平介于初始增益水平上下一個區(qū)間內(nèi)。所造成的脈沖可為正或負脈沖。
象其他最大似然應(yīng)用中一樣,也測量其結(jié)果的質(zhì)量(在本情況中,通過使一個誤差矢量的能量最小,該誤差矢量定義為目標(biāo)矢量和通過感性加權(quán)濾波器濾波單增益脈沖序列所產(chǎn)生的估計矢量之間的差值)。使誤差矢量的能量達到極小的脈沖序列及其相應(yīng)的增益水平(或增益水平指數(shù)index)便作為MLQ多脈沖分析單元的輸出提供出來。
在另一個實施例中,系統(tǒng)包括一個長時預(yù)測分析器和一個脈沖系列多脈沖分析單元以替代MLQ多脈沖分析單元。在這個實施例中,脈沖系列多脈沖分析單元利用與長時分析器和音調(diào)(pitch)距離來造成一個振幅、同符號脈沖系列,系列中每個脈沖與先前一個脈沖的間距為該音調(diào)距離。然后,多脈沖分析單元輸出一個代表脈沖系列序列的信號,包括正負脈沖系列,這是目標(biāo)矢量的最好代表。
在另外一個實施例中,本系統(tǒng)包括一個MLQ脈沖系列多脈沖分析單元,它是前面兩個實施例的操作的組合。換句話說,提供了一個增益區(qū)間,并對每個增益找出一個脈沖系列序列。提供的序列代表對目標(biāo)矢量最接近的擬合,作為輸出信號。
從下文中結(jié)合附圖所作詳細描述,將更充分地理解和認識本發(fā)明。這些附圖是
圖1是本發(fā)明的語音處理系統(tǒng)的第一實施例的方框圖;圖2是圖1的(MP-MLQ)塊的流程圖;圖3A和3B是用于理解圖2操作的圖示;圖4A和4B分別為描述脈沖系列和使用脈沖系列進行多脈沖分析的圖示;圖5是本發(fā)明利用脈沖系列的語音處理系統(tǒng)的第二個實施例的方框圖;圖6是圖5的脈沖系列多脈沖分析單元的操作流程圖;圖7是與圖1和圖5的系統(tǒng)輸出相比較的第三個實施例的方框圖。
現(xiàn)在參考圖1、2、3A和3B,這2個
了本發(fā)明的第一個實施例。本發(fā)明的語音處理系統(tǒng)包括至少一個短時預(yù)測分析器10、一個長時預(yù)測分析器12、一個目標(biāo)矢量發(fā)生器13和一個最大似然量化多脈沖分析(MP-MLQ)單元14。
短時預(yù)測分析器10在輸入線16上接收由多個數(shù)字化語音樣本構(gòu)成的語音信號的一個輸入幀。通常,每幀有240個語音樣本,幀又往往分成多個子幀。通常,有4個子幀,每個子幀通常為60個樣本長。輸入幀可以是一個原始語音信號的一幀,也可以是原始語音信號被處理后的形態(tài)。
短時預(yù)測分析器10還在輸入線16上接收輸入幀,而在輸出線17上產(chǎn)生該輸入幀的短時特性。在一個實施例中,分析器10完成的線性預(yù)測分析,以產(chǎn)生表征輸入幀的線性預(yù)測系數(shù)(LPC)。
為了本發(fā)明的目的,分析器10能完成任何類型的LPC分析。例如,LPC分析可以如“數(shù)字語音處理、合成與識別”一書中第6.4.2章所描述的那樣按下述方式實現(xiàn)將漢明窗加到以一個子幀為中心的180個樣本構(gòu)成的窗上。使用Durbin迭代方法產(chǎn)生第10階LPC系數(shù)。對每個子幀重復(fù)這一過程。
長時預(yù)測分析器12可以是任何類型的長時預(yù)測器并對線16上的輸入幀進行操作。長時分析器12分析輸入幀的多個子幀,以確定每個子幀內(nèi)的語音音調(diào)(pitch)值,這里的音調(diào)值定義為語音信號進似重復(fù)它本身的間隔樣本數(shù)目。音調(diào)值通常介于20和146之間,這里20表明為高音調(diào)聲音,而146表明為低音調(diào)聲音。
例如,對每2個子幀,可以由二子幀S(n)的正規(guī)化互相關(guān)函數(shù)取最大值來確定一個音調(diào)的估計值,其表達式如下C_i=ΣS(K)S(K-i)Σ(K-i)S(K-i),0≤K≤119,20≤i≤146---(1)]]>對于本例,長時分析器12選擇使互相關(guān)C_i取極大值的指數(shù)i作為這2幀的音調(diào)值。
一旦長時分析器12確定了音調(diào)值,該音調(diào)值被用于確定在輸入線18上提供的子幀的長時預(yù)測信息。
目標(biāo)矢量發(fā)生器13接收長時分析器12和短時分析器10的輸出信號以及在輸入線16上的輸入幀(通過延時19)。目標(biāo)矢量發(fā)生器響應(yīng)這些信號,從輸入信號的至少一個子幀產(chǎn)生一個目標(biāo)矢量。如果希望的話,可以利用長時和短時信息,或者可以忽略這些信息。延時19保證到達目標(biāo)矢量的輸入幀對應(yīng)于分析器10和12的輸出。
目標(biāo)矢量發(fā)生器13的輸出線26與MP-MLQ單元14相連,攜帶目標(biāo)矢量輸出信號。MP-MLQ單元14通常還與攜帶由分析器10產(chǎn)生的短時特性的輸出線17相連。
可以理解,不失其一般性,可以以任何希望的方式產(chǎn)生向MP-MLQ單元提供的目標(biāo)矢量。
根據(jù)本發(fā)明的第一最佳實施例。MP-MLQ單元14包括初始脈中位置確定器(determiner)20、增益區(qū)間確定器22、增益水平選擇器24、脈沖序列確定器25、目標(biāo)矢量匹配器28和可選的編碼器30。圖2中顯示出部件20-30所完成的具體操作,下文將予以詳細描述。下面是單元14操作的一般描述初始脈沖位置確定器20沿輸出線17和26分別接受目標(biāo)矢量發(fā)生器13和短時分析器10的輸出信號,它根據(jù)多脈沖分析技術(shù)確定第一脈沖的樣本位置。
增益區(qū)間確定器22接收單元20的第一脈沖輸出,并確定第一脈沖的振幅以及在所確定振幅絕對值周圍的量化增益水平所在區(qū)間。該區(qū)間的寬度MLQ_STEPS通常為3倍增益水平,并且是由外部提供的。
增益水平選擇器24接收由增益區(qū)間確定器22產(chǎn)生的增益區(qū)間,并移動通過增益區(qū)間內(nèi)的各增益值。它的輸出在輸出線32上,是一個要對其確定單增益脈沖序列的電流增益水平。
脈沖序列確定器25在線26上接收目標(biāo)矢量,在線32上接收電流增益水平,并利用下文描述的多脈沖分析技術(shù)由它們確定一個與目標(biāo)矢量匹配的脈沖序列(有正負兩類脈沖)。該脈沖序列是一系列具有該電流增益水平的正負脈沖。
目標(biāo)矢量匹配器28在輸出線34上接收確定器25的脈沖序列輸出,在輸出線26上接收目標(biāo)矢量。匹配器28利用最大似然型判據(jù)確定匹配質(zhì)量。
由于存在一個增益水平區(qū)間,匹配器28反過來控制增益水平選擇器24去選擇下一個增益水平。這種反過來的控制由箭頭36表明。
對于每個增益值,匹配器28確定匹配質(zhì)量,并且只有當(dāng)它對該判據(jù)提供比先前的匹配更小的值時才保留該匹配(增益指數(shù)和脈沖序列)。
一旦增益選擇器24已經(jīng)移動通過所有增益值,則有儲在匹配28中的增益指數(shù)和脈沖序列是對目標(biāo)矢量的最靠近的匹配。然后匹配器28沿輸出線38向可選編碼器30輸出所存儲的脈沖序列和增益指數(shù)。
可以理解,通過對少量增益水平中的每一個確定一個脈沖序列,MP-MLQ單元14能選定最靠近地匹配于目標(biāo)矢量的那一個脈沖序列。
可選的編碼器30對輸出的脈沖序列和增益指數(shù)進行編碼以供存儲或傳輸。
圖2中給出了MP-MLQ單元14的具體操作。在初始化步驟40,單元14產(chǎn)生如下信號a)由短時特性a_i得到的輸入幀的脈沖響應(yīng)h〔n〕定義為
h〔n〕=∑a_i*h〔n-i〕+δ〔n〕,0≤n≤N-1,i≤i≤p(2)h〔-n〕=0,n=1..P這里P是短時特性的個數(shù),N是在該子幀中的語音樣本數(shù)。
b)對每個樣本位置l,脈沖響應(yīng)的自相關(guān)結(jié)果r_hh〔l〕為r_hh〔l〕=∑h〔n〕*h〔n-l〕,0≤l≤N-1,1≤n≤N-1(3)c)對每個樣本位置l,脈沖響應(yīng)h〔n〕與目標(biāo)矢量t〔n〕之間的互相關(guān)結(jié)果r_th〔l〕為r_th〔l〕=∑t〔n〕*h〔n-l〕,0≤l≤N-1,1≤n≤N-1(4)將會理解,脈沖響應(yīng)是沿線17由分析器10提供的短時特性a_i的函數(shù)。在初始化步驟40產(chǎn)生的脈沖響應(yīng)對應(yīng)于前文所述DurbinLPC分析。
MP-MLQ單元14利用一個局部(local)判據(jù)Lc_kj〔l〕對每個樣本位置l、每個脈沖K、以及每個增益水平j(luò)確定一個定量值。如在下文中所見,該局部判據(jù)的水平依賴于K值(即依賴于已經(jīng)確定的脈沖個數(shù))。
在步驟42,用于確定第一脈沖的局部判據(jù)Lc_o,j〔l〕被初始化為互相關(guān)函數(shù)r_th〔l〕,如下式所示LC_O〔l〕=LC_O,j〔l〕=r_th〔l〕,0≤l≤N-1,j_min≤j≤j_max(5)局部判據(jù)的最大局部值還設(shè)成某個負值。其位置指數(shù)l也初始化為0。
在步驟44-50,確定第一脈沖K=l的位置l。為此,將局部判據(jù)LC_O,j〔l〕的絕對值與最大局部值進行比較(步驟44)。如果LC_O,j〔l〕較大,則存儲位置l,最大局部值被說成局部判據(jù)LC_O,j〔l〕的絕對值(步驟46)并對位置腳標(biāo)l增加1(步驟48)。重復(fù)進行這一操作,直到對所有位置l都已檢查過一遍為止。在所有位置都已檢查一遍之后所存儲的樣本位置l_cpt就是所選擇的樣本位置l_opt。步驟40-50是由脈沖位置確定器20完成的。
步驟52由增益區(qū)間確定器22完成。在步驟52,按下式生成一個產(chǎn)生最大局部判據(jù)LC_O,j〔l〕的位置l的最大振幅A_max
A_max=A_max_j=|lC_O,j〔l_opt〕|/r_max,j_min≤j≤j_max(6)這里l_opt是第一脈沖位置。然后對最大值A(chǔ)_max由預(yù)先確定的一組增益水平中的一個來近似。例如,如果預(yù)期振幅水平在區(qū)間0.1-2.0個單位內(nèi),則增益水平可能是每0.1個單位有一個值。這樣,如果A_max為0.756,它的量化值即為0.8。
步驟54-58由增益選擇器24完成。在步驟54,增益選擇器24確定與所定增益水平對應(yīng)的增益指數(shù)j以及在增益指數(shù)j周圍的增益指數(shù)區(qū)間。增益水平區(qū)間能為任何大小,取決于預(yù)先確定的MLQ_STEPS值,在步驟54,增益選擇器24把增益指數(shù)設(shè)為其極小值。對于前例,0.1可以有增益指數(shù)1,而MLQ_STEPS可以為3。這樣,所確定的增益指數(shù)為8,而區(qū)間為指數(shù)5-11。步驟54還把一個極小全局值設(shè)成任一很大的值,如1013。
在本發(fā)明中,對于每個增益指數(shù),第一脈沖是由脈沖位置確定器20確定的脈沖位置(在步驟44-50中)。而其余的脈沖可為子幀內(nèi)的任何其他脈沖,而且可有正的或負的增益值。在步驟56,增益選擇24存儲第一脈沖位置及其振幅。在步驟58,通常根據(jù)等式5對當(dāng)前脈沖指數(shù)K和增益指數(shù)j來初始化局部判據(jù)LC_K,j〔l〕。
脈沖序列確定器25完成步驟60-74。在步驟60,確定器25把最大局部值設(shè)成一個大值(這和以前一樣),并設(shè)位置指數(shù)l為0。
在步驟62,確定器25更新與前一個脈沖相連系的局部判據(jù),按下式進行LC_K,j〔l〕=LC_K-1,j〔l〕-A_K-1,j*r_hh〔l-l-opt_k-1,j〕,j=增益指數(shù)k=脈沖指數(shù)l=位置指數(shù)在步驟64-70的循環(huán)中,脈沖序列確定器25確定脈沖位置,其確定方式與步驟44-50中完成的方式相似,所以這里不再進一步描述。在步驟72,確定器24存儲所選的脈沖,在步驟74中它更新脈沖值。對序列中的每個脈沖重復(fù)步驟62-74,其結(jié)果是脈沖序列確定器25的脈沖序列輸出。需要說明的是,步驟62對所發(fā)現(xiàn)的每個脈沖更新其局部判據(jù)。
圖3A和3B給出脈沖序列確定器25的不同脈沖序列輸出的兩個實例。因3A的序列有增益指數(shù)7,圖3B的序列有增益指數(shù)8。這兩個序列有相同的第一樣本位置10,但其余脈沖位于其他位置。需要說明的是脈沖可為正或負脈沖。
在步驟76,目標(biāo)矢量匹配28對每個增益水平j(luò)確定其全局判據(jù)GC_j的值。全局判據(jù)GC_j可以是任何適當(dāng)?shù)呐袚?jù),但通常的最大似然型判據(jù)。例如,全局判據(jù)可以測量一個誤差矢量中的能量,該誤差矢量定義為目標(biāo)矢量與通過一個感性加權(quán)濾波器對單增益脈沖序列進行濾波所產(chǎn)生的一個估計矢量之差,在本實施例中,該感性加權(quán)濾波器由短時特性確定。對這樣一個判據(jù),目標(biāo)矢量匹配器28包括一個感性加權(quán)濾波器。
將會理解,脈沖序列本身并不與目標(biāo)矢量匹配;脈沖序列代表一個與目標(biāo)矢量匹配的函數(shù)。
如下面的8a-8e等式所給出的那樣,全局判據(jù)GC_j由兩部分組成,即p_j和d_j二者都是信號x_j〔n〕的函數(shù),而信號x_j〔n〕是由短時脈沖響應(yīng)h〔n〕濾波的增益水平為j的脈沖系列。p_j是目標(biāo)矢量t〔n〕和x〔n〕之間的互相關(guān),d_j是x_j〔n〕的能量。
在步驟78,將當(dāng)前增益指數(shù)j的全局判據(jù)GC_j與當(dāng)前的最小全局值進行比較。如果它小于當(dāng)前最小全局值(在步驟78進行這種檢驗),則目標(biāo)矢量匹配器28存儲(步驟80)該增益指數(shù)及其相應(yīng)的脈沖序列。
在步驟82,增益水平選擇器24更新其增益指數(shù),并在步驟84由它檢驗是否已對全部增益水平確定了脈沖序列。如果是,則所存儲的脈沖序列和增益指數(shù)是根據(jù)全局判據(jù)GC_j最好匹配于目標(biāo)矢量的脈沖序列和增益指數(shù)。
在步驟86,可選編碼器根據(jù)任何一個編碼方法對脈沖序列及增益指數(shù)進行編碼,以構(gòu)成輸出信號供存儲或傳輸。如果愿意的話,目標(biāo)矢量可用x_jopt〔n〕來重建,這里的jopt是由步驟84產(chǎn)生的增益指數(shù)。
將會理解,本發(fā)明的MP-MLQ單元14至少提供所選擇的脈沖序列和增益水平作為輸出信號?,F(xiàn)在參考圖4A、4B、5和6,它們給出本發(fā)明的利用脈沖系列的另一實施例。圖4顯示出一個脈沖系列83。它由脈沖系列81構(gòu)成,各脈沖間距為Q,它就是音調(diào)。
在圖5所示系統(tǒng)中找出一個脈沖系列序列,該序列與一目標(biāo)矢量最匹配。圖4B顯示可能會找到的三個脈沖系列83a、83b和83c的實例序列。每個脈沖系列83從不同的樣本位置開始。脈沖系列83a是第一個,由4個脈沖組成。脈沖系列83b在稍后的一個位置開始,由3個脈沖組成,而脈沖系列83c在其后很多的位置開始,且只由2個脈沖組成。
圖5的系統(tǒng)與圖1的系統(tǒng)相似,其差別只在于a)圖1中的脈沖位置確定器20和脈沖系列確定器25被脈沖系列確定器88和脈沖系列序列確定器89所替代;b)標(biāo)號90的目標(biāo)矢量匹配器作用于系列序列,而不是作用于脈沖序列;c)確定器88和89沿輸出線18接收音調(diào)值Q。此外,輸出線34和38被輸出線92和94所取代,輸出線92和94攜帶的信號代表脈沖系列序列而不是脈沖序列。
脈沖系列確定器88的操作與脈沖確定器20相似,只是確定器88利用脈沖系列的脈沖響應(yīng)h_T〔n〕,而不是利用脈沖的脈沖響應(yīng)h〔n〕。h_T〔n〕定義為h_T〔n〕=∑h〔n-k-Q〕,0≤n≤N-1,0≤n≤(N-1)/Q (9)這里Q是音調(diào)值。可以看出,在較后位置的脈沖系列通常有較少脈沖。
脈沖系列的等式3所示脈沖響應(yīng)自相關(guān)變?yōu)閞_hh〔h〕=∑h_T〔n〕*h-T〔n-1〕,0≤l≤N-1,1≤n≤N-1(10)對每個樣本位置l,脈沖響應(yīng)h_T〔n〕和目標(biāo)矢量t〔n〕之間的互相關(guān)r_th〔l〕變?yōu)閞_th〔l〕=∑t〔n〕*h_T〔n-1〕,0≤l≤N-1,l≤n≤N-1 (11)脈沖系列序列確定器89的操作與脈沖序列確定器25相似,但確定器89產(chǎn)生的是脈沖系列序列。
目標(biāo)矢量匹配器90的操作與目標(biāo)矢量匹配器28相似,然而匹配器90利用的是脈沖系列的脈沖響應(yīng)函數(shù)h_T〔n〕,而不是利用h〔n〕。這樣,等式8d變?yōu)閤_j〔n〕=∑v_j〔i〕*h_T〔i-n〕,0≤i≤n,0≤n≤N-1(12)圖6中給出脈沖系列多脈沖分析單元86的具體操作,其步驟等同于圖2所示步驟,然而各等式是作用于脈沖系列而不是單個脈沖。這樣在等式9中定義脈沖系列的脈沖響應(yīng)h_T〔n〕,它每間隔Q步有脈沖。在較后位置的脈沖系列通常有較少脈沖。
其余的等式也類似,只是它們作用于脈沖響應(yīng)h_T〔n〕。
如果愿意的話,由增益區(qū)間確定器22確定的增益區(qū)間可以只有一個增益指數(shù)。在這個實施例中,脈沖系列多脈沖分析單元86確定的脈沖系列序列有第一脈沖系列序列的增益水平。在這個實施例中,目標(biāo)矢量匹配器90不操作,也沒有增益水平選擇器24和脈沖系列序列確定器89的重復(fù)操作。
將會進一步理解,可以把目標(biāo)矢量匹配器28和90的輸出加以比較,這示于圖7。現(xiàn)在參考圖7。匹配器28和90沿著輸出線38和94向比較器100提供代表序列和全局判據(jù)的輸出信號。比較器100比較來自匹配器28和90的全局判據(jù)GC_jopt,并選擇最低的一個。沿輸出線102提供輸出信號,該信號代表產(chǎn)出的脈沖序列或脈沖系列序列。
將會理解,圖1、5、7的各系統(tǒng)能應(yīng)用于數(shù)字信號處理芯片或軟件中。在一個實施例中,軟件是用程序語言C++寫的,在另一個實施例中是用匯編語言寫的。
精通本門技術(shù)的人們將會理解,本發(fā)明不限于上文已具體顯示和描述的內(nèi)容。本發(fā)明的范圍將只由下文中的權(quán)利要求書所規(guī)定。
權(quán)利要求
1.一種語音處理系統(tǒng),包括連到輸入和輸出線上的一個短時分析器,這里所述短時分析器響應(yīng)所述輸入線上的輸入語音信號,產(chǎn)生所述輸入語音信號的短時特性;目標(biāo)矢量發(fā)生器從至少是所述輸入語音信號產(chǎn)生一目標(biāo)矢量;以及最大似然多脈沖分析器,它連于所述目標(biāo)矢量發(fā)生器的輸出線,用于產(chǎn)生一組單增益脈沖系列,每個系列有不同的增益值,在其輸出端提供一信號,代表最能代表所述目標(biāo)矢量的單增益脈沖系列。
2.根據(jù)權(quán)利要求1的語音處理系統(tǒng),其中的最大似然多脈中分析器包括增益區(qū)間確定器,用于由所述目標(biāo)矢量確定增益水平區(qū)間;脈沖序列確定器,用于產(chǎn)生一組單增益脈沖系列,每個系列對應(yīng)于所述增益水平區(qū)間內(nèi)的所述增益水平中的一個;以及目標(biāo)矢量匹配器,用于將所述系列中的每一個系列與所述目標(biāo)矢量進行匹配,并在輸出線上輸出一個信號,代表最能代表所述目標(biāo)矢量的系列。
3.根據(jù)權(quán)利要求1的系統(tǒng),其中所述一組脈沖系列的每個系列的第一脈沖處在同一樣本位置。
4.根據(jù)權(quán)利要求2的系統(tǒng),其中所述目標(biāo)矢量匹配器是一個全局判據(jù)確定器,其組成是一個感性加權(quán)濾波器,其特性為所述短時特性,用于對脈沖序列濾波;一個確定器,用于對每個增益水平確定一誤差矢量的能量,該誤差矢量定義為所述目標(biāo)矢量和所述濾波器輸出之差。
5.根據(jù)權(quán)利要求1的系統(tǒng),其中所述增益區(qū)間確定器包括確定第一脈沖位置的振幅的裝置及確定在所述振幅周圍增益水平區(qū)間的裝置。
6.一種語音處理系統(tǒng),包括一個與輸入和輸出線相連的長時分析器,這里所述長時分析器響應(yīng)所述輸入線上的輸入語音信號,產(chǎn)生至少一個所述輸入語音信號的音調(diào)距離;一個目標(biāo)矢量發(fā)生器用于從至少是所述輸入語音信號產(chǎn)生一個目標(biāo)矢量;以及一個與所述目標(biāo)矢量發(fā)生器的輸出線相連的脈沖系列多脈沖分析器,用于產(chǎn)生一個脈沖系列的序列,這里每個脈沖系列由一個單增益脈沖序列構(gòu)成,每個脈沖所在的樣本位置與所述序列中前一個脈沖相隔一個所述音調(diào)距離,在其輸出端提供一個信號,代表最代表所述目標(biāo)矢量的單增益脈沖序列。
7.根據(jù)權(quán)利要求6的系統(tǒng),其中所述的脈沖系列有不同的符號。
8.一種語音處理系統(tǒng),包括一個與輸入和輸出線相連的長時分析器,這里所述長時分析器響應(yīng)所述輸入線上的輸入語音信號,產(chǎn)生至少是所述輸入語音信號的音調(diào)距離;一個與所述輸入線及一個輸出線相連的短時分析器,所述短時分析器響應(yīng)所述輸入語音信號,產(chǎn)生所述輸入語音信號的短時特性;一個目標(biāo)矢量發(fā)生器用于由至少是所述輸入語音信號產(chǎn)生一個目標(biāo)矢量;以及一個與所述目標(biāo)矢量發(fā)生器的輸出線相連的最大似然脈沖系列多脈沖分析器,用于產(chǎn)生一組單增益脈沖系列的序列,每個序列有不同的增益值,在其輸出端產(chǎn)生的信號,代表最能代表所述目標(biāo)矢量的單增益脈沖系列序列。
9.根據(jù)權(quán)利要求8的系統(tǒng),其中每個脈沖系列由一單增益脈沖序列組成,每個脈沖所在位置與所述序列中前一個脈沖相距所述音調(diào)距離。
10.根據(jù)權(quán)利要求8的系統(tǒng),其中所述一組脈沖系列序列中的每個系列的第一個脈沖位于同一樣本位置。
11.根據(jù)權(quán)利要求8的語音處理系統(tǒng),其中所述最大似然脈沖系列多脈沖分析器包括一個增益區(qū)間確定器用于由所述目標(biāo)矢量確定一個增益水平區(qū)間;一個脈沖系列序列確定器用于產(chǎn)生一組單增益脈沖系列序列,每個序列應(yīng)對于處在所述增益水平區(qū)間內(nèi)的所述增益水平之一;以及一個目標(biāo)矢量匹配器,用于將所述序列中的每一個匹配于所述目標(biāo)矢量,并在輸出線上輸出一信號,代表最能代表所述目標(biāo)矢量的序列。
12.根據(jù)權(quán)利要求11的系統(tǒng),其中所述目標(biāo)矢量匹配器為一全局判據(jù)確定器,包括一個感性加權(quán)濾波器,其特性為所述短時特性,用于對脈沖系列序列濾波,還包括一個確定器用于對每個增益水平確定一個誤差矢量的能量,該誤差矢量定義為所述目標(biāo)矢量和所述濾波器輸出之差。
13.根據(jù)權(quán)利要求11的系統(tǒng),其中所述增益區(qū)間確定器包括確定第一脈沖位置的振幅的裝置以及確定在所述振幅周圍的增益水平區(qū)間的裝置。
14.根據(jù)權(quán)利要求8的系統(tǒng),還包括一個與所述目標(biāo)矢量發(fā)生器的輸出線相連的最大似然多脈沖分析器,用于產(chǎn)生一組單增益脈沖序列,每個序列有不同的增益值,并在輸出端提供一個信號,代表最能代表所述目標(biāo)矢量的單增益脈沖序列;以及一比較器接收來自所述最大似然脈沖系列分析器和所述最大似然多脈沖分析器的輸出,以選擇最匹配于所述目標(biāo)矢量的輸出。
15.一種語音處理方法,包括下列步驟確定一輸入信號的短時特性;從至少是所述輸入信號產(chǎn)生一個目標(biāo)矢量;產(chǎn)生一組單增脈沖序列,每個序列有一不同的增益水平;將每個所述序列匹配于所述目標(biāo)矢量;以及選擇最能代表所述目標(biāo)矢量的序列。
16.根據(jù)權(quán)利要求15的方法,其中所述一組脈沖序列中每一個序列的第一脈沖處在同一樣本位置。
17.根據(jù)權(quán)利要求15的方法,其中所述的匹配步驟包括下述步驟通過一感性加權(quán)濾波器對脈沖系列序列進行濾波,該濾波器的特性是所述短時特性;以及對每個增益水平,確定在一誤差矢量中的能量,該誤差矢量定義為所述目標(biāo)矢量和所述濾波器的輸出之間的差值。
18.根據(jù)權(quán)利要求15的方法,其中所述產(chǎn)生步驟(第二步)包括確定第一脈沖位置的振幅步驟和確定所述振幅周圍增益區(qū)間的步驟。
19.一種語音處理方法,包括如下步驟確定至少是輸入信號的一個音調(diào)距離;由至少是所述信號產(chǎn)生一目標(biāo)矢量;以及產(chǎn)生一個脈沖系列序列,這里每個脈沖系列由一個單增益脈沖序列構(gòu)成,在所述序列中每個脈沖所在的樣本位置與前一個脈沖相距所述音調(diào)距離;以及產(chǎn)生一個信號,該信號代表最能代表所述目標(biāo)矢量的單增益脈沖系列的序列。
20.根據(jù)權(quán)利要求19的方法,其中所述脈沖系列序列有不同符號。
21.一種語音處理方法,包括下列步驟確定所述輸入信號的短時特性;確定所述輸入信號的至少一個音調(diào)距離;由至少量所述輸入信號產(chǎn)生一個目標(biāo)矢量;產(chǎn)生一組單增益脈沖系列序列,每個序列有不同的增益水平;以及將所述序列中的每個序列匹配于所述目標(biāo)矢量;以及選擇最能代表所述目標(biāo)矢量的脈沖系列序列。
22.根據(jù)權(quán)利要求21的方法,其中每個脈沖系列由一組單增益脈沖組成,在所述序列中每個脈沖所在位置與前一個脈沖相距所述音調(diào)距離。
23.根據(jù)權(quán)利要求21的方法,其中所述組成脈沖系列序列中的每一個序列的第一脈沖開始于同一樣本位置。
24.根據(jù)權(quán)利要求21的方法,其中所述的產(chǎn)生步驟(第二步)包括確定第一脈沖系列位置的振幅步驟以及確定在所述振幅周圍正負增益區(qū)間的步驟。
25.根據(jù)權(quán)利要求21的方法,還包括如下步驟產(chǎn)生一組單增益脈沖序列,每個序列有不同的增益水平;以及將每個所述序列匹配于所述目標(biāo)矢量;選擇最能代表所述目標(biāo)矢量的脈沖序列;以及選擇脈沖序列和脈沖系列序列之一,它是最能代表所述目標(biāo)矢量的一個。
全文摘要
本發(fā)明為語音處理系統(tǒng)和方法。本發(fā)明系統(tǒng)包括至少一個最大似然量化多脈沖分析單元,作用于一目標(biāo)矢量。該單元通常是對多脈沖序列確定初始增益水平,并多次完成單增益多脈沖分析,每次分析針對不同的增益水平。提供最能代表目標(biāo)矢量的脈沖序列作為輸出信號。在另一實施例中,系統(tǒng)包括至少是一個脈沖系列多脈沖分析單元,這里的目標(biāo)矢量被模擬為脈沖系列序列。每個脈沖系列由一組單增益脈沖組成。
文檔編號H03M7/30GK1153566SQ95193454
公開日1997年7月2日 申請日期1995年4月27日 優(yōu)先權(quán)日1994年4月29日
發(fā)明者利昂·比亞利克, 費利克斯·弗曼 申請人:喬納森·愛德華·謝爾曼, 奧迪科德公司