專利名稱::在通信系統(tǒng)中確定速率的裝置和方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及速率確定,更具體地講,是涉及通信系統(tǒng)中的速率確定。在諸如IS-96,IS-127(EVRC),和CDG-27的可變速率語音編碼器系統(tǒng)中,仍然存在著在中低信噪比(SNR)環(huán)境中區(qū)分語音和背景噪聲的問題。問題是如果速率確定算法(RDA)過于敏感,由于大部分背景噪聲以速率1/2或速率1被編碼,所以平均數(shù)據(jù)速率非常高。這樣會在碼分多址(CDMA)系統(tǒng)中帶來容量損失。相反地,如果RDA過于“瘦弱(lean)”,則低電平語音信號會被埋沒在中等噪聲中并且以速率1/8被編碼。由于清晰度較低,所以會降低語音質(zhì)量。自從IS-96以后盡管改進了EVRC和CDG-27中的RDA,但CDMA開發(fā)組(CDG)最近的測試表明在SNR為10dB或更小的汽車噪聲環(huán)境中仍然有問題。這個SNR級別可能會很極端,但在免提無線環(huán)境中應(yīng)當被認為是額定級別。當使用非連續(xù)傳輸(DTX)以延長電池壽命時,時分多址(TDMA)移動單元中的固定速率語音編碼器也會遇到類似的問題。在這種情況下,一個語音活動檢測器(VAD)確定發(fā)送功率放大器是否要被激活,因而在語音質(zhì)量和電池壽命之間存在一個折衷。這樣,需要一種經(jīng)過改進的,在通信系統(tǒng)中進行速率確定的裝置和方法。圖1描述了一個通信系統(tǒng),該系統(tǒng)實現(xiàn)了基于本發(fā)明的改進速率確定。圖2描述了用于實現(xiàn)基于本發(fā)明的速率確定的裝置的模塊圖。圖3描述了在圖2的噪聲抑制系統(tǒng)中出現(xiàn)的幀-幀重疊。圖4描述了在圖2的噪聲抑制系統(tǒng)中出現(xiàn)的預(yù)加重樣本的梯形窗口。圖5描述了在圖2的噪聲抑制系統(tǒng)中的頻譜偏差估測器的模塊圖。圖6描述了在圖2的噪聲抑制系統(tǒng)的修正精度確定器中所執(zhí)行的步驟的流程圖。圖7描述了圖2中基于本發(fā)明的速率確定模塊所執(zhí)行的,確定傳輸速率的步驟的流程圖。圖8描述了基于本發(fā)明的語音活動檢測器所執(zhí)行的,確定語音活動的出現(xiàn)的步驟的流程圖。為了在中低信噪比(SNR)環(huán)境中精確確定速率和語音活動,從而使語音質(zhì)量,系統(tǒng)容量和/或電池壽命最大,來自噪聲抑制系統(tǒng)的參數(shù)被用作速率確定功能的輸入。利用這種方法,從背景噪聲中取出的語音越多,那么與常規(guī)系統(tǒng)相比,在波動噪聲環(huán)境中檢測到的假活動的數(shù)量越低。該方法利于進行語音活動檢測(VAD)和速率確定(RDA),并且與其它的RDA/VAD實現(xiàn)不同,該方法獨立于所使用的語音編碼器的類型(IS-127,CDG-27,IS-96和GSM)。概括地講,一個在通信系統(tǒng)中確定傳輸速率的裝置包括一個噪聲抑制系統(tǒng)和一個速率確定裝置,其中噪聲抑制系統(tǒng)抑制輸入到自身的信號中的背景噪聲,并且產(chǎn)生與背景噪聲抑制有關(guān)的參數(shù),而速率確定裝置把噪聲抑制系統(tǒng)產(chǎn)生的參數(shù)作為輸入并且產(chǎn)生語音編碼器使用的傳輸速率信息。在最優(yōu)實施例中,噪聲抑制系統(tǒng)基本上是一個如IS-127中所定義的噪聲抑制系統(tǒng),并且噪聲抑制系統(tǒng)產(chǎn)生的參數(shù)包含一個控制信號,在背景噪聲的突然增加致使噪聲抑制系統(tǒng)錯誤區(qū)分背景噪聲時,該信號允許噪聲抑制系統(tǒng)進行恢復(fù)。更具體地講,確定通信系統(tǒng)中傳輸速率的裝置包括估測當前信息幀中的信道能量的裝置,以及把估測信道能量作為輸入,并且確定當前信息幀估測信道能量與多個過去信息幀的能量之間的差值從而產(chǎn)生當前幀的總信道能量估測的裝置。一個確定語音量度的裝置接著根據(jù)當前信息幀的信噪比估測確定語音量度,并且一個裝置根據(jù)估測信道能量產(chǎn)生一個總估測噪聲能量。根據(jù)當前幀的總信道能量估測,語音量度和總估測噪聲能量,一個確定傳輸速率的裝置確定出信息幀的傳輸速率。在這個實施例中,裝置還包括一個產(chǎn)生控制信號的裝置,這種裝置把當前信息幀的總信道能量估測,當前信息幀的峰值對平均值比,當前幀和過去幀之間的頻譜偏差,和語音量度當作輸入,而在出現(xiàn)某種信號時控制信號防止修正噪聲估測。更具體地,當為了測試通信系統(tǒng)出現(xiàn)了允許以滿速率發(fā)送正弦波的音頻信號時,控制信號防止修正噪聲估測?;诒景l(fā)明的裝置所執(zhí)行的步驟包括根據(jù)當前信息幀的峰值信噪比確定第一語音量度閾值,并且把語音量度和第一語音量度閾值相比較。當語音量度小于第一語音量度閾值時,以第一速率發(fā)送信息幀。當語音量度大于第一語音量度閾值時,把語音量度和第二語音量度閾值相比較。當語音量度小于第二語音量度閾值時,以第二速率發(fā)送信息幀,否則以第三速率發(fā)送信息幀。實現(xiàn)這些步驟的通信系統(tǒng)是如IS-95所定義的碼分多址(CDMA)通信系統(tǒng)。如IS-95中所定義的,第一速率包括1/8速率,第二速率包括1/2速率,而第三速率包括CDMA通信系統(tǒng)的滿速率。在這個實施例中,第二語音量度閾值是第一語音量度閾值的縮尺表示,并且在以第二或第三速率發(fā)送之后實現(xiàn)一個釋放延遲。在這個實施例中當前信息幀的峰值信噪比包括一個當前信息幀的量化峰值信噪比。這樣,根據(jù)當前信息幀的量化峰值信噪比確定語音量度閾值的步驟還包括計算當前信息幀的總信噪比并且根據(jù)計算出的當前信息幀的總信噪比估測峰值信噪比的步驟。接著對當前信息幀的峰值信噪比進行量化以便確定語音量度閾值。通信系統(tǒng)可以是一個諸如GSMTDMA通信系統(tǒng)的時分多址(TDMA)通信系統(tǒng)。該方法在這種情況下確定第一速率包括一個靜音描述符(SID)幀,而第二和第三速率包括普通速率幀。如上所述,一個SID幀包含普通數(shù)量的信息,但發(fā)送次數(shù)比普通信息幀要少。圖1描述了一個實現(xiàn)了基于本發(fā)明的改進速率確定的通信系統(tǒng)。在圖1所述的實施例中,通信系統(tǒng)是一個碼分多址(CDMA)無線電話系統(tǒng),但本領(lǐng)域的普通技術(shù)人員可以理解,實現(xiàn)可變速率編碼和語音活動檢測(VAD)的各種其它類型的通信系統(tǒng)可以使用本發(fā)明。一種這樣實現(xiàn)VAD以延長電池壽命的系統(tǒng)是時分多址(TDMA)通信系統(tǒng)。如圖1所示,一個公共交換電話網(wǎng)103(PSTN)被連接到一個移動交換中心106(MSC)。眾所周知,PSTN103提供有線交換能力,而MSC106提供涉及CDMA無線電話系統(tǒng)的交換能力??刂破?09也與MSC106相連,控制器109包含基于本發(fā)明的噪聲抑制,速率確定和語音編碼/解碼??刂破?09控制信號路由到達/來自基站112-113,其中基站負責(zé)與移動站115通信。CDMA無線電話系統(tǒng)與臨時標準(IS)95-A兼容。要得到更多有關(guān)IS-95-A的信息,參見TIA/EIA/IS-95-A,雙模式寬帶擴展頻譜蜂窩系統(tǒng)的移動站-基站兼容標準,1993年7月。MSC106的交換能力和控制器109的控制能力如圖1所示,本領(lǐng)域的一個普通技術(shù)人員會理解,在一個用于系統(tǒng)實現(xiàn)的公共物理實體中可以綜合兩個功能。如圖2所示,一個信號s(n)被從MSC106輸入到控制器109并且進入裝置201,該裝置根據(jù)本發(fā)明執(zhí)行基于噪聲抑制的速率確定。在最優(yōu)實施例中,裝置201的噪聲抑制部分是1997年1月在美國出版的,標題為“寬帶擴展頻譜數(shù)字系統(tǒng)的增強可變速率編解碼器,語音服務(wù)部分3”的TIA文檔IS-127的§4.1.2中描述的噪聲抑制系統(tǒng)的細微修改版本,并且在這里參考引用了其中的公開內(nèi)容。離開裝置201的信號s’(n)進入一個語音編碼器(未示出),該語音編碼器在本領(lǐng)域中眾所周知并且對噪聲抑制信號進行編碼以便通過基站112-113傳輸?shù)揭苿诱?15。圖2中還示出了一個速率確定算法(RDA)248,該算法根據(jù)本發(fā)明使用來自噪聲抑制系統(tǒng)的參數(shù)確定語音活動和速率確定信息。為了完全理解來自噪聲抑制系統(tǒng)的參數(shù)如何被用來確定語音活動和速率確定信息,有必要理解裝置201的噪聲抑制系統(tǒng)部分。應(yīng)當注意在這里裝置201的噪聲抑制系統(tǒng)部分的操作是通用的,即可以用于設(shè)計工程師希望在一個具體的通信系統(tǒng)中實現(xiàn)的,任何類型的語音編碼器。注意本申請在圖2中描述的幾個模塊與授予Vilmur的美國專利4,811,404中圖1描述的對應(yīng)模塊相比具有類似的操作。這樣,在這里參考引用了授予Vilmur,被轉(zhuǎn)讓給本申請的受讓人美國專利4,811,404。現(xiàn)在參照圖2,裝置201的噪聲抑制部分包括一個高通濾波器(HPF)200和剩余噪聲抑制器電路。HPF200的輸出shp(n)被用作剩余噪聲抑制器電路的輸入。盡管語音編碼器的幀長度為20ms(如IS-95所定義),剩余噪聲抑制器電路的幀長度為10ms。在最優(yōu)實施例中,每隔20ms的語音幀便執(zhí)行兩次噪聲抑制步驟。為了開始噪聲抑制,高通濾波器(HPF)200對輸入信號s(n)進行高通濾波以便產(chǎn)生信號shp(n)。HPF200是本領(lǐng)域中眾所周知的,具有120HZ截止頻率的四級ChebyshevII型濾波器。HPF200的傳遞函數(shù)被定義成Hhp(z)=Σi=04b(i)z-iΣi=04a(i)z-i,]]>其中相應(yīng)的分子和分母系數(shù)被定義成b={0.898025036,-3.59010601,5.38416243,-3.59010601,0.898024917},a={1.0,-3.78284979,5.37379122,-3.39733505,0.806448996}.本領(lǐng)域的普通技術(shù)人員會理解,可以使用任意數(shù)量的高通濾波器配置。接著,在預(yù)加重模塊203中,使用平滑梯形窗口對信號shp(n)進行窗口處理,其中輸入幀(幀“m”)的前D個樣本d(m)與前面的幀(幀“m-1”)的后D個樣本重疊。這種重疊如圖3所示。除非另有說明,所有變量的初始值為0,例如d(m)=0;m≤0??梢悦枋龀蒬(m,n)=d(m-1,L+n);0≤n<D,其中m是當前幀,n是對緩沖區(qū){d(m)}的樣本索引,L=80是幀長度,D=24是樣本中的重疊(或延遲)。接著以下述方式對輸入緩沖區(qū)中的剩余樣本進行預(yù)加重處理d(m,D+n)=shp(n)+ζpshp(n-1);0≤n<L,其中ζp=-0.8是預(yù)加重因子。這導(dǎo)致輸入緩沖區(qū)包含L+D=104個樣本,其中前D個樣本是來自前面的幀的預(yù)加重重疊,而后L個樣本是來自當前幀的輸入。接著,在圖2的窗口化模塊204中,對樣本使用一個平滑梯形窗口400(圖4)以便構(gòu)成一個離散富立葉變換(DFT)輸入信號g(n)。在最優(yōu)實施例中,g(n)被定義成其中M=128是DFT序列長度并且所有其它項如前所述。在圖2的信道分割器206中,利用下述離散富立葉變換(DFT)進行g(shù)(n)到頻率域的變換G(k)=2MΣn=0M-1g(n)e-j2πnk/M;0≤k≤M,]]>其中ejω是具有即時徑向位置ω的單位振幅復(fù)相量。這是一個非典型的定義,但發(fā)揮了復(fù)數(shù)快速富立葉變換(FFT)的效率。通過對M點實序列進行預(yù)處理以構(gòu)成一個使用一個M/2點復(fù)FFT的M/2點復(fù)序列,從而產(chǎn)生了2/M比例因子。在最優(yōu)實施例中,信號G(k)包括65個唯一信道。在Proakis和Manolakis,數(shù)字信號處理介紹,第二版,NewYork,Macmillan,1988,pp.721-722中可以找到這種技術(shù)的細節(jié)。接著信號G(k)被輸入到信道能量估測器209,其中使用下述等式確定當前幀m的信道能量估測Ech(m)Ech(m,i)=max{Emin,αch(m)Ech(m-1,i)+(1-αch(m))1fH(i)-fL(i)+1Σk=fL(i)fH(i)|G(k)|2}]]>;0≤i<Nc,其中Emin=0.0625是最小允許信道能量,αch(m)是信道能量平滑因子(下面定義),Nc=16是混合信道的數(shù)量,而fL(i)和fH(i)是相應(yīng)的低和高信道混合表fL和fH的第i個元素。在最優(yōu)實施例中,fL和fH被定義成fL={2,4,6,8,10,12,14,17,20,23,27,31,36,42,49,56},fH={3,5,7,9,11,13,16,19,22,26,30,35,41,48,55,63}.信道能量平滑因子αch(m)可以被定義成這意味著假定對于第一個幀(m=1)αch(m)取0值,而對于所有后續(xù)的幀αch(m)的值為0.45。這允許針對第一幀未經(jīng)濾波的信道能量開始信道能量估測。另外,應(yīng)當針對前四個幀的信道能量開始信道噪聲能量估測(如下所述),即En(m,i)=max{Einit,Ech(m,i)};1≤m≤4,0≤i≤Nc其中Einit=16是最小允許信道噪聲初始化能量。接著當前幀的信道能量估測Ech(m)被用來估測量化信道信噪比(SNR)索引。在圖2的信道SNR估測器218中進行這種估測,這種估測被定義如下σq(i)=max{0,min{89,round{10log10(Ech(m,i)En(m,i))/0.375}}};0≤i<Nc,]]>其中En(m)是當前信道噪聲能量估測(如下所述),并且{sq}的值被約束在0到89之間。利用信道SNR估測{sq},通過下述公式在語音量度計算器215中確定語音量度的總和v(m)=Σi=0Nc-1v(σq(i))]]>其中V(k)是90元素語音量度表V中的第k個值,V被定義如下V={2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,4,4,4,5,5,5,6,6,7,7,7,8,8,9,9,10,10,11,12,12,13,13,14,15,15,16,17,17,18,19,20,20,21,22,23,24,24,25,26,27,28,28,29,30,31,32,33,34,35,36,37,37,38,39,40,41,42,43,44,45,46,47,48,49,50,50,50,50,50,50,50,50,50,50}.當前幀的信道能量估測Ech(m)也被用作頻譜偏差估測器210的輸入,該估測器估測頻譜偏差ΔE(m)。參照圖5,信道能量估測Ech(m)被輸入到一個對數(shù)功率頻譜估測器500,對數(shù)功率頻譜被估測成EdB(m,i)=10log10(Ech(m,i));0≤i<Nc.當前幀的信道能量估測Ech(m)也被輸入到一個總信道能量估測器503以便根據(jù)下面公式確定當前幀的總信道能量估測Etot(m)Etot(m)=10log10(Σi=0Nc-1Ech(m,i)).]]>接著,利用下面公式在指數(shù)窗口因子確定器506中確定一個指數(shù)窗口因子α(m)(作為總信道能量Etot(m)的函數(shù))α(m)=αH-(αH-αLEH-EL)(EH-Etot(m)),]]>通過下面公式把α(m)限制在αH和αL之間α(m)=max{αL,min{αH,α(m)}},其中EH和EL是Etot(m)的線性內(nèi)插的能量端點(以分貝或“dB”為單位),Etot(m)被變換成α(m)并且具有限制αΔ≤α(m)≤αH。這些常量的值被定義成EH=50,EL=30,αH=0.99,αL=0.50。假定如此,通過上述計算,一個具有40dB相對能量的信號會使用α(m)=0.745的指數(shù)窗口因子。接著在頻譜偏差估測器509中估測頻譜偏差ΔE(m)。頻譜偏差ΔE(m)是當前功率頻譜和平均長期功率頻譜估測之間的差值ΔE(m)=Σi=0Nc-1|EdB(m,i)-E-dB(m,i)|,]]>其中EdB(m)是平均長期功率頻譜估測,利用下述公式在長期功率頻譜能量估測器512中確定該估測EdB(m+1,i)=α(m)EdB(m,i)+(1-α(m))EdB(m,i);0≤i<Nc,其中所有變量已經(jīng)預(yù)先定義。EdB(m)的初始值被定義成幀1的估測對數(shù)功率頻譜,或EdB(m)=EdB(m);m=1.在這點上,語音量度v(m),當前幀的總信道能量估測Etot(m)和頻譜偏差ΔE(m)的總和被輸入到修正判決確定器212以便進行噪聲抑制。如下面?zhèn)未a所示并且如圖6的流程圖所述的判決邏輯表明如何進行噪聲估測修正判決。處理從步驟600開始并且繼續(xù)到步驟603,其中清除修正標志(update_flag)。接著,在步驟604,通過檢查語音量度v(m)的總和是否小于一個修正閾值(UPDATE_THLD)實現(xiàn)Vilmur的修正邏輯(只有VMSUM)。如果語音量度的總和小于修正閾值,則修正計數(shù)器(update_cnt)在步驟605被清除,并且在步驟606設(shè)置修正標志。步驟603-606的偽碼如下所示<prelisting-type="program-listing"><![CDATA[update_flag=FALSE;if(v(m)≤UPDATE_THLD){update_flag=TRUEupdate_cnt=0}]]></pre>如果在步驟604語音量度總和大于修正閾值,則禁止修正噪聲估測。否則在步驟607把當前幀m的總信道能量估測Etot(m)與以dB為單位的噪聲底限(NOISE_FLOOR_DB)相比較,把頻譜偏差ΔE(m)與偏差閾值(DEV_THLD)相比較。如果總信道能量估測大于噪聲底限并且頻譜偏差小于偏差閾值,則在步驟608增加修正計數(shù)器。在增加修正計數(shù)器后,在步驟609進行測試以便確定修正計數(shù)器是否大于或等于一個修正計數(shù)器閾值(UPDATE_CNT_THLD)。如果步驟609的測試結(jié)果為真,則在步驟613設(shè)置強制修正標志并且在步驟606設(shè)置修正標志。步驟607-609和606的偽碼如下所示<prelisting-type="program-listing"><![CDATA[elseif((Etol(m)>NOISE_FLOOR_DB),(DE(m)<DEV_THLD){update_cnt=update_cnt+1if(update_cnt≥UPDATE_CNT_THLD)update_flag=TRUE}]]></pre>如圖6所示,如果步驟607和609的測試結(jié)果為假,或者在步驟606已經(jīng)設(shè)置修正標志之后,實現(xiàn)一個防止修正計數(shù)器長期“抖動”的邏輯。實現(xiàn)這種滯后邏輯以便防止最小頻譜偏差長期累積,導(dǎo)致一個非法的強制修正。處理從步驟610開始,其中進行測試以確定修正計數(shù)器是否等于后6個幀(HYSTER_CNT_THLD)的最近修正計數(shù)器值(last_update_cnt)。在最優(yōu)實施例中,6個幀被用作閾值,但可以實現(xiàn)任何的幀數(shù)量。如果步驟610的測試結(jié)果為真,則在步驟611清除修正計數(shù)器,并且處理在步驟612退出到下一個幀。如果步驟610的測試結(jié)果為假,則處理直接在步驟612退出到下一個幀。步驟610-612的偽碼如下所示<prelisting-type="program-listing"><![CDATA[if(update_cnt==last_update_cnt)hyster_cnt=hyster_cnt+1elsehyster_cnt=0last_update_cnt=update_cntif(hyster_cnt>HYSTER_CNT_THLD)update_cnt=0.]]></pre>在最優(yōu)實施例中,前面使用的常量的值如下所示UPDATE_THLD=35,NOISE_FLOOR_DB=10log10(1),DEV_THLD=28,UPDATE_CNT_THLD=50,andHYSTER_CNT_THLD=6.只要在步驟606針對給定一個幀設(shè)置了修正標志,則修正下一個幀的信道噪聲估測。利用下面公式在平滑濾波器224中修正信道噪聲估測En(m+1,i)=max{Emin,αnEn(m,i)+(1-αn)Ech(m,i)};0≤i<Nc,]]>其中Emin=0.0625是最小允許信道能量,并且αn=0.9是在平滑濾波器224本地存儲的信道噪聲平滑因子。修正信道噪聲估測被存儲在能量估測存儲器225中,并且能量估測存儲器225的輸出是修正信道噪聲估測En(m)。修正信道噪聲估測En(m)被用作上述信道SNR估測器218的輸入,并且如下所述,也被輸入到增益計算器233。接著,裝置201的噪聲抑制部分確定是否應(yīng)當進行信道SNR修改。在信道SNR修改器227中進行這種確定,該修改器累計信道SNR索引值大于索引閾值的信道數(shù)量。在修改處理期間,信道SNR修改器227減少那些SNR索引小于一個后退閾值(SETBACK_THLD)的特定信道的SNR,或者在語音量度總和小于一個量度閾值(METRIC_THLD)時減少所有信道的SNR。下面提供了在信道SNR修改器227中進行的信道SNR修改處理的偽碼表示<prelisting-type="program-listing"><![CDATA[index_cnt=0for(i=NMtoNc-1step1){if(σq(i)≥INDEX_THLD)index_cnt=index_cnt+1}if(index_cnt<INDEX_CNT_THLD)modify_flag=TRUEelsemodify_flag=FALSEif(modify_flag==TRUE)for(i=0toNc-1step1)if((v(m)≤METRIC_THLD)or(σq(i)≤SETBACK_THLD))σ'q(i)=1elseσ'q(i)=σq(i)else{σ'q}={σq}]]></pre>在這點上,信道SNR索引{σq’}被限制到SNR閾值模塊230中的SNR閾值。常量σth被存儲在SNR閾值模塊230中。下面提供了在SNR閾值模塊230中執(zhí)行的處理的偽碼表示for(i=0toNc-1step1)if(σ'q(i)<σth)σq′′(i)=σth]]>elseσq′′(i)=σq′(i)]]>在最優(yōu)實施例中,前面的常量和閾值被定義如下NM=5,INDEX_THLD=12,INDEX_CNT_THLD=5,METRIC_THLD=45,SETBACK_THLD=12,andσth=6.在這點上,受到限制的SNR索引{σq”}被輸入到增益計算器233,在該計算器中確定信道增益。首先,利用下面公式確定總的增益因子γn=max{γmin,-10log10(1EfloorΣi=0Nc-1En(m,i))},]]>其中γmin=-13是最小總增益,Efloor=1是噪聲底限能量,En(m)是在前面的幀期間計算的估測噪聲頻譜。在最優(yōu)實施例中,常量γmin和Efloor被存儲在增益計算器233中。繼續(xù),利用下面公式確定信道增益(以dB為單位)γdB(i)=μg(σq′′(i)-σth)+γn;0≤i<Nc,]]>其中μg=0.39是增益斜率(也被存儲在增益計算器233中)。接著利用下面公式轉(zhuǎn)換線性信道增益γch(i)=min{1,10γdB(i)/20};0≤i<Nc.在這點上,前面確定的信道增益被用于具有下面原則的變換輸入信號G(k)以便產(chǎn)生信道增益修改器239的輸出信號H(k)H(M-k)=H*(k);0<k<M/2上述公式中的否則條件假定k的區(qū)間為0≤k≤M/2。還假定H(k)的幅度是偶對稱的,因而下面條件也成立其中*表示一個復(fù)共軛。接著使用逆DFT在信道混合器242中把信號H(k)轉(zhuǎn)換(返回)到時域h(m,n)=12Σk=0M-1H(k)ej2πnk/M;0≤n<M,]]>并且通過下述原則進行疊加完成頻域濾波處理,從而產(chǎn)生輸出信號h’(n)通過去加重模塊245對信號h’(n)進行信號去加重處理,從而產(chǎn)生經(jīng)過噪聲抑制的信號s’(n)s′(n)=h′(n)+ζds′(n-1);0≤n<L,其中ζd=0.8是存儲在去加重模塊245本地的去加重因子。如上所述,裝置201的噪聲抑制部分是標題為“寬帶擴展頻譜數(shù)字系統(tǒng)的增強可變速率編解碼器,語音服務(wù)部分3”的TIA文檔IS-127的§4.1.2中描述的噪聲抑制系統(tǒng)的細微修改版本。具體地,在圖2中還示出了一個速率確定算法(RDA)模塊248和一個峰值對平均值比模塊251。增加峰值對平均值比模塊251防止在處理“音頻”信號期間修正噪聲估測。這允許以速率1傳輸對系統(tǒng)測試非常有用的正弦波。參照圖2,IS-127中所述的噪聲抑制系統(tǒng)產(chǎn)生的參數(shù)被用作檢測語音活動并且根據(jù)本發(fā)明確定傳輸速率的基礎(chǔ)。在最優(yōu)實施例中,根據(jù)本發(fā)明在RDA模塊248中實現(xiàn)的噪聲抑制系統(tǒng)產(chǎn)生的參數(shù)是語音量度總和v(m),總信道能量Etot(m),總估測噪聲能量Etn(m),和幀數(shù)量m。另外,產(chǎn)生一個標為“強制修正標志”(fupdate_flag)的新標志,向RDA模塊248指示發(fā)生強制修正的時間。強制修正是一種機制,該機制在背景噪聲的突然增加導(dǎo)致噪聲抑制系統(tǒng)錯誤錯誤區(qū)分背景噪聲時,允許噪聲抑制部分進行恢復(fù)。假定這些參數(shù)是RDA模塊248的輸入并且“速率”是RDA模塊248的輸出,可以更詳細地說明基于本發(fā)明的速率確定。如上所述,在IS-127中定義的噪聲抑制系統(tǒng)產(chǎn)生了多數(shù)輸入到RDA模塊248的參數(shù)。例如,在Eq.4.1.2.4-1中確定了語音量度總和v(m),并且在IS-127的Eq.4.1.2.5-4中確定了總信道能量Etot(m)。由下述公式給出總估測噪聲能量Etn(m)Etn(m)=10log10(Σi=0Nc-1En(m,i))]]>根據(jù)IS-127的Eq.4.1.2.8-1可以得到上述公式。10毫秒幀數(shù)量m從m=1開始。根據(jù)在IS-127的§4.1.2.6中示出的“強制修正”邏輯實現(xiàn)可以導(dǎo)出強制修正標志fupdate_flag。具體地,下面提供了用于產(chǎn)生強制修正標志fupdate_flag的偽碼<prelisting-type="program-listing"><![CDATA[/*Normalupdatelogic*/update_flag=fupdate_flag=FALSEif(v(m)≤UPDATE_THLD){update_flag=TRUEupdate_cnt=0}/*Forcedupdatelogic*/elseif((Etot(m)>NOISE_FLOOR_DB)and(ΔE(m)<DEV_THLD)and(sinewave_flag==FALSE)){update_cnt=update_cnt+1if(update_cnt≥UPDATE_CNT_THLD)update_flag=fupdate_flag=TRUE}]]></pre>這里,當頻譜峰值對平均值比φ(m)大于10dB并且頻譜偏差ΔE(m)(Eq.4.2.1.5-2)小于DEV_THLD時sinewave_flag被設(shè)置成真。換種方式表達其中φ(m)=10log10(max{Ech(m)}Σi=0Nc-1Ech(m,i)/Nc)]]>是在峰值對平均值比模塊251中確定的峰值對平均值比,并且Ech(m)是在IS-127的Eq.4.1.2.2-1中給出的信道能量估測向量。一旦產(chǎn)生了合適的輸入,就可以根據(jù)本發(fā)明執(zhí)行RDA模塊248中的速率確定。針對圖7中描述的流程圖,下述公式給出的修正總能量E'tot(m)這里,初始修正總能量被設(shè)成經(jīng)驗性的56dB。接著在步驟703根據(jù)下面公式可以計算估測總SNRSNR=Etot′(m)-Etn(m)]]>接著在步驟706使用這個結(jié)果根據(jù)下面公式估測長期峰值SNR,SNRp(m)其中SNRp=0.接著在步驟709按照下面公式以3dB的步長對長期峰值SNR進行量化,并且限制在0到19之間SNRQ=max{min{[SNRp(m)/3],19},0}其中[x]是最大整數(shù)≤x(底限函數(shù))。現(xiàn)在可以在步驟712利用量化SNR確定相應(yīng)的語音量度閾值vth,釋放延遲計數(shù)hcnt和脈沖串計數(shù)閾值bth參數(shù)vth=vtable[SNRQ],hcnt=htable[SNRQ],bth=btable[SNRQ]其中SNRQ是被定義如下的表的索引vtable={37,37,37,37,37,37,38,38,43,50,61,75,94,118,146,178,216,258,306,359}htable={25,25,25,20,16,13,10,8,6,5,4,3,2,1,0,0,0,0,0,0}btable={8,8,8,8,8,8,8,8,8,8,8,7,6,5,4,3,2,1,1,1}根據(jù)這些信息,從RDA模塊248輸出速率確定。模塊712輸出的語音量度閾值vth,釋放延遲計數(shù)hcnt和脈沖串計數(shù)閾值bth參數(shù)被輸入到模塊715,在該模塊中進行測試以確定語音量度v(m)是否大于語音量度閾值。利用IS-127的Eq.4.1.2.4-1確定語音量度閾值。重要的是從噪聲抑制系統(tǒng)輸出的語音量度v(m)不會改變,但根據(jù)本發(fā)明語音量度閾值會在RDA248中改變。參照圖7的步驟715,如果語音量度v(m)小于語音量度閾值,則在步驟718確定發(fā)送信號s’(n)的速率為1/8速率。在這種確定之后,在步驟721實現(xiàn)一個釋放延遲。釋放延遲一般被實現(xiàn)成慢速“覆蓋”可能被區(qū)分為噪聲的衰減語音,或者跨過可能被主動語音活動檢測降低質(zhì)量的語音中的小間隙。當在步驟721中實現(xiàn)釋放延遲之后,在步驟736保證進行正確速率的傳輸。在這點上,根據(jù)本發(fā)明以1/8速率對信號s’(n)編碼并且發(fā)送到合適的移動站115。如果在步驟715語音量度v(m)大于語音量度閾值,則在步驟724進行另一個測試以確定語音量度v(m)是否大于一個加權(quán)(通過一個量值α)語音量度閾值。這個處理允許以速率1/2對接近噪聲底限的語音信號進行編碼,其中的優(yōu)點是降低了平均數(shù)據(jù)速率并且保持了高語音質(zhì)量。如果在步驟724語音量度v(m)不大于加權(quán)語音量度閾值,則處理進行到步驟727,在該步驟中發(fā)送信號s’(n)的速率被確定成1/2速率。但如果在步驟724語音量度v(m)大于加權(quán)語音量度閾值,則處理進行到步驟730,在該步驟中發(fā)送信號s’(n)的速率被確定成速率1(也被稱作全速率)。在兩種情況下(通過步驟727以1/2速率發(fā)送或者通過步驟730以全速率發(fā)送),處理進行到確定釋放延遲的步驟733。在確定釋放延遲之后,處理進行到保證以正確速率傳輸?shù)牟襟E736。在這點上,根據(jù)本發(fā)明以1/2速率或全速率對信號s’(n)編碼并且發(fā)送到合適的移動站115。也可以參照下述偽碼說明圖7的步驟715到步驟733<prelisting-type="program-listing"><![CDATA[if(v(m)>vth){if(v(m)>αvth){/*α=1.1*/rate(m)=RATE1}else{rate(m)=RATE1/2}b(m)=b(m-1)+1/*incrementburstcounter*/if(b(m)>bth){/*comparecounterwiththreshold*/h(m)=hcnt/*sethangover*/}}else{b(m)=0/*clearburstcounter*/h(m)=h(m-1)-1/*decrementhangover*/if(h(m)≤0){rate(m)=RATE1/8h(m)=0}else{rate(m)=rate(m-1)}}]]></pre>下面的偽碼表示IS-127中定義的非法速率轉(zhuǎn)換。注意需要兩個10ms噪聲抑制幀確定一個20ms語音編碼器幀速率。根據(jù)兩個基于噪聲抑制的RDA幀中的最大幀確定最終的速率。<prelisting-type="program-listing"><![CDATA[if(rate(m)==RATE1/8andrate(m-2)==RATE1){rate(m)=RATE1/2}]]></pre>前面已經(jīng)參照一個具體實施例說明并描述了本發(fā)明,本領(lǐng)域技術(shù)人員應(yīng)當理解在不偏離本發(fā)明宗旨和范圍的前提下可以對形式和細節(jié)進行各種修改。例如,圖2中示出了用于實現(xiàn)基于本發(fā)明的速率確定,通過通信系統(tǒng)的基礎(chǔ)設(shè)施實現(xiàn)的裝置,但本領(lǐng)域的普通技術(shù)人員可以理解,也可以在移動站115中實現(xiàn)圖2的裝置。在這種實現(xiàn)中,不需要改變圖2以實現(xiàn)基于本發(fā)明的速率確定。并且,針對CDMA通信系統(tǒng)描述的基于本發(fā)明的速率確定的概念可以擴展到用于基于本發(fā)明的時分多址(TDMA)通信系統(tǒng)的語音活動檢測(VAD)。在這種實現(xiàn)中,圖2中RDA模塊248的功能被語音活動檢測(VAD)的功能取代,其中VAD模塊248的輸出是可能被輸入到語音編碼器的VAD判決。確定離開VAD模塊248的語音活動是真或假的步驟類似于圖7的流程圖并且如圖8所示。如圖8所示,步驟703-715與圖7中的相同。但如果步驟715的測試結(jié)果為假,則在步驟818確定VAD為假,并且步驟繼續(xù)到實現(xiàn)釋放延遲的步驟721。如果步驟715的測試結(jié)果為真,則在步驟827確定VAD為真并且流程繼續(xù)到確定一個釋放延遲的步驟733。在下面的權(quán)利要求書中所有裝置或步驟加功能單元的對應(yīng)結(jié)構(gòu),材料,動作和等價物試圖包括用于執(zhí)行結(jié)合了其它權(quán)利要求部分的功能的任何結(jié)構(gòu),材料或動作。權(quán)利要求1.一個確定通信系統(tǒng)中的傳輸速率的裝置,該裝置包括一個噪聲抑制系統(tǒng),用于抑制輸入到該噪聲抑制系統(tǒng)信號中的背景噪聲,并且產(chǎn)生與背景噪聲抑制有關(guān)的參數(shù);一個速率確定裝置,用于把噪聲抑制系統(tǒng)產(chǎn)生的參數(shù)作為輸入并且用于產(chǎn)生語音編碼器使用的傳輸速率信息。2.如權(quán)利要求1所述的裝置,其中噪聲抑制系統(tǒng)基本上是IS-127中定義的噪聲抑制系統(tǒng)。3.如權(quán)利要求1所述的裝置,其中噪聲抑制系統(tǒng)產(chǎn)生的參數(shù)包含一個控制信號,在背景噪聲的突然增加致使噪聲抑制系統(tǒng)錯誤區(qū)分背景噪聲時,該信號允許噪聲抑制系統(tǒng)進行恢復(fù)。4.一個確定通信系統(tǒng)中的傳輸速率的裝置,該裝置包括估測當前信息幀中的信道能量的裝置,把估測信道能量作為輸入,并且確定當前信息幀估測信道能量與多個過去信息幀的能量之間的差值,從而產(chǎn)生當前幀的總信道能量估測的裝置;根據(jù)當前信息幀的信噪比估測確定語音量度的裝置;根據(jù)估測信道能量產(chǎn)生一個總估測噪聲能量的裝置;根據(jù)當前幀的總信道能量估測,語音量度和總估測噪聲能量,確定信息幀的傳輸速率的裝置。5.如權(quán)利要求4所述的裝置,其中還包括一個產(chǎn)生控制信號的裝置,這種裝置把當前信息幀的總信道能量估測,當前信息幀的峰值對平均值比,當前幀和過去幀之間的頻譜偏差,和語音量度當作輸入,而在出現(xiàn)某種信號時控制信號防止修正噪聲估測。6.如權(quán)利要求5所述的裝置,其中控制信號在出現(xiàn)音頻信號時防止修正噪聲估測。7.如權(quán)利要求5所述的裝置,其中當為了測試通信系統(tǒng)出現(xiàn)了某種允許以滿速率發(fā)送正弦波的音頻信號時,控制信號防止修正噪聲估測。8.一個確定通信系統(tǒng)中的信息幀傳輸速率的方法,該方法包括的步驟有根據(jù)當前信息幀的峰值信噪比確定第一語音量度閾值;把語音量度和第一語音量度閾值相比較;當語音量度小于第一語音量度閾值時,以第一速率發(fā)送信息幀;當語音量度大于第一語音量度閾值時,把語音量度和第二語音量度閾值相比較;當語音量度小于第二語音量度閾值時,以第二速率發(fā)送信息幀;當語音量度小于第二語音量度閾值時,以第三速率發(fā)送信息幀。9.如權(quán)利要求8所述的方法,其中如IS-95中所定義的,第一速率包括1/8速率,第二速率包括1/2速率,而第三速率包括CDMA通信系統(tǒng)的滿速率。10.如權(quán)利要求8所述的方法,其中第一速率包括一個靜音描述符(SID)幀,而第二和第三速率包括時分多址(TDMA)通信系統(tǒng)中的正常速率幀。全文摘要為了在中低信噪比(項目703)(SNR)環(huán)境中精確確定速率和語音活動,從而使語音質(zhì)量,系統(tǒng)容量和/或電池壽命最大,來自噪聲抑制系統(tǒng)的參數(shù)被用作速率確定功能的輸入。語音量度被用于和閾值比較(項目715)并且確定出速率(項目721,727,730)。文檔編號G10L19/00GK1248339SQ98802467公開日2000年3月22日申請日期1998年1月5日優(yōu)先權(quán)日1997年2月26日發(fā)明者詹姆斯·P·阿什利申請人:摩托羅拉公司