專利名稱:話音編碼設(shè)備中計算幀原型間線性相移的頻帶識別方法和裝置的制作方法
背景技術(shù):
I.發(fā)明領(lǐng)域本發(fā)明涉及話音處理領(lǐng)域,尤其涉及話音編碼設(shè)備中計算幀原型間線性相移的頻帶識別方法和裝置。
II.背景技術(shù)采用數(shù)字技術(shù)的話音傳輸日益普遍,尤其在長距離電話和數(shù)字無線電話的應(yīng)用中。這又引起關(guān)注決定能在信道上發(fā)送得最少而保持所感受重構(gòu)話音質(zhì)量的信息量。如果用簡單的抽樣和數(shù)字化發(fā)送話音,要求64千位/秒(Kbps)左右的數(shù)據(jù)速率,以達(dá)到常規(guī)模擬電話的話音質(zhì)量。然而,通過采用話音分析,并后續(xù)適當(dāng)?shù)木幋a、發(fā)送,并且在接收機(jī)重新綜合,能達(dá)到數(shù)據(jù)速率顯著降低。
在許多電信領(lǐng)域采用話音壓縮裝置。該領(lǐng)域的一個例子是無線通信。無線通信領(lǐng)域有許多應(yīng)用,包括例如無繩電話、尋呼、無線本地環(huán)路、蜂窩網(wǎng)電話系統(tǒng)和PCS電話系統(tǒng)之類的無線電話、移動互聯(lián)網(wǎng)協(xié)議(IP)電話和衛(wèi)星通信系統(tǒng)。特別重要的應(yīng)用是移動用戶的無線電話。
無線通信系統(tǒng)已開發(fā)各種空中接口,包括例如頻分多址(FDMA)、時分多址(TDMA)和碼分多址(CDMA)。在這方面已建立各種國內(nèi)和國際標(biāo)準(zhǔn),包括例如“高級移動電話業(yè)務(wù)”(AMPS)、“全球移動通信系統(tǒng)”(GSM)和“過渡標(biāo)準(zhǔn)”95(IS-95)。典型的無線電話通信系統(tǒng)是碼分多址(CDMA)系統(tǒng)。電信業(yè)協(xié)會(TIA)和其他公知標(biāo)準(zhǔn)機(jī)構(gòu)頒布IS-95標(biāo)準(zhǔn)及其派生標(biāo)準(zhǔn)IS-95A、ANSI J-STD-008、IS-95B、建議的第3代標(biāo)準(zhǔn)IS-95C和IS-2000等(這里統(tǒng)稱為IS-95),以規(guī)定蜂窩網(wǎng)電話系統(tǒng)或PCS電話通信系統(tǒng)的CDMA的空中接口的應(yīng)用。5103459號和4901307號美國專利闡述實(shí)質(zhì)上根據(jù)IS-95標(biāo)準(zhǔn)的應(yīng)用配置的典型無線通信系統(tǒng),該專利轉(zhuǎn)讓給本發(fā)明受讓人,通過引用與本申請結(jié)合。
通過提取有關(guān)人類語言產(chǎn)生模型的參數(shù),利用各種方法壓縮話音的裝置稱為話音編碼設(shè)備。話音編碼設(shè)備將輸入的話音信號劃分成時間塊或分析幀。該設(shè)備通常包含編碼器和譯碼器。編碼器分析輸入的話音幀,提取某些相關(guān)參數(shù)后,將該參數(shù)量化為二進(jìn)制表示,即二進(jìn)制位組或二進(jìn)制數(shù)據(jù)分組。在信道上將數(shù)據(jù)分組發(fā)給接收機(jī)和譯碼器。譯碼器對數(shù)據(jù)分組進(jìn)行處理,將其去量化,以產(chǎn)生參數(shù),并且用去量化的參數(shù)重新綜合話音幀。
話音編碼設(shè)備的功能是通過去除話音固有的全部自然冗余,將數(shù)字話音信號壓縮成低位速率信號。通過用一組參數(shù)表示輸入話音幀,并利用量化用二進(jìn)制位組表示參數(shù),達(dá)到數(shù)字壓縮。如果輸入話音幀具有Ni個位,話音編碼設(shè)備產(chǎn)生的數(shù)據(jù)分組具有No個位,則該設(shè)備達(dá)到的壓縮因數(shù)為Cr=Ni/No。面臨的挑戰(zhàn)是保持譯碼話音高質(zhì)量,同時達(dá)到目標(biāo)壓縮因數(shù)。話音編碼設(shè)備的性能取決于(1)話音模型或上述分析綜合處理的組合工作的完善程度,以及(2)在每幀No位目標(biāo)位速度下進(jìn)行參數(shù)量化處理的完善程度。因此,話音模型的目標(biāo)是每幀用少量參數(shù)獲取話音信號要素或目標(biāo)話音質(zhì)量。
話音編碼器設(shè)計中最重要的可能是尋找良好的參數(shù)組(包括矢量),以描述話音信號。良好的參數(shù)組對重構(gòu)感覺上正確的話音信號要求系統(tǒng)頻寬小。話音編碼參數(shù)的例子有音調(diào)、信號功率、頻譜包絡(luò)(或共振峰)、振幅頻譜和相位頻譜。
話音編碼設(shè)備可做成時域編碼器,該編碼器通過利用高時間分辨率處理,每次對少量話音段(通常是5毫秒(ms)的子幀)進(jìn)行編碼,試捕獲時域話音波形。每一子幀借助本領(lǐng)域公知的各種尋找算法,從碼本空間尋找高準(zhǔn)確的代表。另外,話音編碼設(shè)備可做成頻域編碼器,該編碼器試圖用參數(shù)組(分析)捕獲輸入話音幀的短期話音頻譜,并且用相應(yīng)的綜合處理從該頻譜參數(shù)重建話音波形。參數(shù)量化器根據(jù)《矢量量化和信號壓縮(Vector Quantization and SignalCompression)》(A.Gersho和R.M.Gray著,1992年)所示的公知量化技術(shù),用存儲的碼矢量表示代表參數(shù),從而保留這些參數(shù)。
公知的時域話音編碼器是碼激勵線性預(yù)測(CELP)編碼器,《話音信號數(shù)字處理(Digital Processing of Speech Signals)(396~453頁,L.B.Rabiner和R.W.Schafer著,1978)闡述該譯碼器,該文獻(xiàn)通過引用與本申請結(jié)合。CELP譯碼器中,利用線性預(yù)測(LP)分析,求短期共振峰濾波器的系數(shù),從而去除話音信號中的短期相關(guān)或冗余。對輸入話音幀采用短期預(yù)測濾波器,產(chǎn)生LP殘留信號,進(jìn)而用長期預(yù)測濾波器參數(shù)和后續(xù)隨機(jī)碼本對其進(jìn)行建模和量化。因此,CELP編碼將時域話音波形編碼任務(wù)劃分成分開的LP短期濾波器系數(shù)編碼任務(wù)和LP殘留編碼任務(wù)。可按固定速率(即各幀采用相同數(shù)量的位No)或可變速率(不同類型的幀內(nèi)容采用不同的位速率)進(jìn)行時域編碼。可變速率編碼器試圖僅用將編譯碼器參數(shù)編碼成達(dá)到適當(dāng)程度目標(biāo)質(zhì)量所需數(shù)量的位。5414796號美國專利闡述一種示范可變速率CELP編碼器,該專利轉(zhuǎn)讓給本發(fā)明受讓人,并通過引用與本申請結(jié)合。
CELP編碼器之類的時域編碼器通常依靠每幀位數(shù)No多,保持時域話音波形準(zhǔn)確。如果每幀位數(shù)No較多(例如8Kbps或以上),該編碼器通常提供優(yōu)越的話音質(zhì)量。然而,低位速率(4Kbps及以下)時,時域編碼器受可用位數(shù)限制,不能保持高質(zhì)量和性能牢靠。低位速率時,高速率商用中配置很成功的常規(guī)時域編碼器,其波形匹配性能受有限碼本空間抑制。因此,盡管時時改進(jìn),以低位速率工作的許多CELP編碼系統(tǒng)仍遭受感覺上顯著失真,其通常特征為噪聲。
目前出現(xiàn)開發(fā)工作在中低位速率(即2.4至4Kbps范圍及以下)的高質(zhì)量話音編碼設(shè)備的研究關(guān)注熱潮和強(qiáng)烈商用需求。其應(yīng)用范圍包括無線電話、衛(wèi)星通信、因特網(wǎng)電話、各種多媒體和聲音流應(yīng)用、話音函件和其它話音存儲系統(tǒng)。驅(qū)動力為高容量需求和分組丟損情況下性能牢靠需求。各種近期話音編碼標(biāo)準(zhǔn)機(jī)構(gòu)是推進(jìn)低速率話音編碼算法研究開發(fā)的另一直接推動力。低速率話音編碼器在每一可用帶寬建立較多信道或用戶。與適當(dāng)信道編碼附加層結(jié)合的低速率話音編碼器能適應(yīng)編碼器規(guī)范的總預(yù)算位數(shù),并且在信道差錯情況下提供牢靠的性能。
一種在低位速率有效的話音編碼技術(shù)是多模式編碼。序列號為09/217341的美國專利申請闡述多模式編碼技術(shù)的范例,該申請?jiān)?998年12月21日提出,題目為“可變速率話音編碼(VARAIBLE RATE SPEECH CODING)”,該申請轉(zhuǎn)讓給本發(fā)明受讓人,并通過引用與本申請結(jié)合。常規(guī)多模式編碼器對不同類型的輸入話音幀采用不同的模式(或編譯碼算法)。用最有效的方式專門制訂各模式或編譯碼處理,以最佳表示某類型的話音段,諸如濁音語(voiced speech)、清音語(unvoiced speech)、過渡語(例如處于濁音與清音之間)和背景噪聲(非語言)。外部開環(huán)模式判決機(jī)構(gòu)審查輸入話音幀,并判決對該幀用何模式。通常通過從輸入幀提取一定數(shù)量的參數(shù),就某些時間特性和頻譜特性評價這些參數(shù)并根據(jù)對該評價的判決模式,進(jìn)行開環(huán)模式判決。
工作在2.4Kbps左右的速率的編碼系統(tǒng)一般是參數(shù)性的。即,該編碼系統(tǒng)通過以規(guī)定間隔發(fā)送描述話音信號音調(diào)周期和頻譜包絡(luò)(或共振峰)的參數(shù),進(jìn)行工作。這些所謂參數(shù)性編碼器的說明例是LP聲碼器系統(tǒng)。
LP聲碼器用每一音調(diào)周期的一個信號脈沖模擬濁音語信號。此基本方法可擴(kuò)大到包含發(fā)送各種參數(shù)中的頻譜包絡(luò)信息。雖然LP聲碼器一般提供合理的信息,但會引入感覺上顯著的失真,其特征通常為蜂音。
近年來,編碼器出現(xiàn)波形編碼器和參數(shù)編碼器的混合體。這些“混合編碼器”的說明例是原型波形插空(PWI)話音編碼系統(tǒng)。該系統(tǒng)也可稱為原型音調(diào)周期(PPP)話音編碼設(shè)備。PWI編碼系統(tǒng)提供濁音語有效編碼方法。PWI的基本概念是按固定時間間隔提取代表性音調(diào)周期(原型波形),發(fā)送其描述,并通過原型波形間內(nèi)插重構(gòu)話音信號。PWI方法可根據(jù)LP殘留信號或話音信號進(jìn)行工作。1998年12月21日提出的序列號為09/217494的美國專利申請闡述PWI或PPP話音編碼設(shè)備的范例,該申請的題目為“周期性話音編碼(PERIODICSPEECH CODING)”,該申請轉(zhuǎn)讓給本發(fā)明受讓人,并通過引用與本申請結(jié)合。5884253號美國專利和“話音編碼的波形插空方法(Methods for WaveformInterpolation in Speech Coding)”(W.Bastiaan Kleijn和Wolfgang Granzow著,1991年,1 Digital Signal Processing,215~230頁)闡述其他PWI或PPP話音編碼器。
常規(guī)話音編碼設(shè)備中,發(fā)送各話音幀內(nèi)每一音調(diào)原型的全部相位信息。然而,低位速率話音編碼器中,希望盡可能保持帶寬。因而,提供發(fā)送較少相位參數(shù)的方法是有利的。這樣,就需要一種每幀發(fā)送少量相位信息的話音編碼器。
發(fā)明內(nèi)容
本發(fā)明涉及一種每幀發(fā)送少量相位信息的話音編碼設(shè)備。因而,本發(fā)明的一個方面中,一種劃分幀原型頻譜的方法有利地包含以下步驟將頻譜劃分成多個段;給每一段分配多個頻帶;對每一段建立多個頻帶用的帶寬組。
本發(fā)明的另一方面中,一種配置成劃分幀原型頻譜的話音編碼設(shè)備有利地包含將頻譜劃分成多個段的裝置;給每段分配多個頻帶的裝置;對每段建立多個頻帶的帶寬組的裝置。
本發(fā)明的再一方面中,一種話音編碼設(shè)備有利地包含原型提取器,從話音編碼設(shè)備進(jìn)行處理的幀提取原型;原型量化器,連接原型提取器,并且配置成將原型的頻譜劃分成多個段,給每段分配多個頻帶,對每段建立多個頻帶用的帶寬組。
圖1是無線電話系統(tǒng)的框圖。
圖2是每端由話音編碼設(shè)備終接的信道的框圖。
圖3是編碼器框圖。
圖4是譯碼器框圖。
圖5是說明話音編碼判決處理的流程圖。
圖6A是話音信號幅度對時間的圖形。
圖6B是線性預(yù)測(LP)殘留幅度對時間的圖形。
圖7是原型音調(diào)周期(PPP)話音編碼設(shè)備的框圖。
圖8是諸如圖7中話音編碼設(shè)備等PPP話音編碼設(shè)備所執(zhí)行算法步驟的說明流程圖,用于識別原型音調(diào)周期的離散傅里葉級數(shù)(DFS)表示中的頻帶。
較佳實(shí)施例的詳細(xì)說明下文所述示范實(shí)施例存在于配置成利用CDMA空中接口的無線電話通信系統(tǒng)。然而,本領(lǐng)域的技術(shù)人員會理解,實(shí)施本發(fā)明特性的二次(子)抽樣方法和設(shè)備可存在于利用各種本領(lǐng)域技術(shù)人員熟知技術(shù)的任何通信系統(tǒng)中。
如圖1所示,CDMA無線電話系統(tǒng)一般包含多個移動用戶單元10、多個基站12、基站控制器(BSC)14和移動通信交換中心(MSC)16。MSC16配置成與常規(guī)公用交換電話網(wǎng)(PSTN)18接口。MSC16還配置成與BSC14接口。BSC14通過路程迂回線路連接基站12。路程迂回線路可配置成支持任何已知接口,其中包括例如E1/T1、ATM、IP、PPP、幀中繼、HDSL、ADSL或XDSL。會理解,該系統(tǒng)中可有2個以上BSC14。有利地是每一基站12包含至少一個扇區(qū)(未圖示),每一扇區(qū)包含全向天線或指向徑向離開基站12的特定方向的天線?;蛘呙恳簧葏^(qū)可包含2付天線,用于分集接收。每一基站12可有利地設(shè)計成支持多種頻率分配。扇區(qū)與頻率分配的交集可稱為CDMA信道?;?2也可稱為基站收發(fā)信機(jī)子系統(tǒng)(BTS)12。或者,“基站”可用于業(yè)界統(tǒng)指BSC14和一個以上的BTS12。BTS12也可指“區(qū)站”12。另外,給定的BTS12的各個扇區(qū)也可稱為區(qū)站。移動用戶單元10通常是蜂窩網(wǎng)電話或PCS電話10。有利的是系統(tǒng)配置成按照IS-95標(biāo)準(zhǔn)使用。
蜂窩網(wǎng)電話系統(tǒng)的典型工作期間,基站12從一些移動單元10接收一組反向鏈路信號。移動單元10進(jìn)行電話呼叫或其它通信。給定基站12接收的各反向鏈路信號在該基站12內(nèi)進(jìn)行處理。所得數(shù)據(jù)傳給BSC14。BSC14提供呼叫資源分配和移動性管理功能,其中包括協(xié)調(diào)基站12間的軟切換。BSC14還將接收數(shù)據(jù)發(fā)給MSC16,后者提供附加的選路業(yè)務(wù),以便與PSTN18接口。同樣,PSTN18也與MSC16接口,MSC16則與BSC14接口,后者轉(zhuǎn)而控制基站12,以對一些移動單元10發(fā)送一組前向鏈路信號。
圖2中,第1編碼器100接收數(shù)字化話音抽樣S(n),并對其進(jìn)行編碼,以在傳送媒體102(或信道102)上發(fā)送到第1譯碼器104。譯碼器104將編碼的話音抽樣譯碼后,綜合成話音輸出信號SSYNTH(n)。為了在相反方向發(fā)送,第2編碼器106將數(shù)字話音抽樣S(n)編碼后,在信道108上發(fā)送。第2譯碼器110接收該編碼話音抽樣,并進(jìn)行譯碼后,產(chǎn)生綜合的話音輸出信號SSYNTH(n)。
話音抽樣S(n)代表根據(jù)本領(lǐng)域公知的任何方法(例如壓縮擴(kuò)展μ律或A律脈碼調(diào)制(PCM))進(jìn)行數(shù)字化和量化的話音信號。本領(lǐng)域已公知,將話音抽樣S(n)組合成輸入數(shù)據(jù)幀,每幀包含預(yù)定數(shù)量的數(shù)字化話音抽樣S(n)。示范實(shí)施例中,采用8KHz的抽樣率,每20ms幀包括160個抽樣。以下所述實(shí)施例中,數(shù)據(jù)傳輸率從13.2Kbps(全速率)到6.2Kbps(半速率)到2.6Kbps(1/4速率)到1Kbps(1/8速率)逐幀變化有利。由于可選擇低位速率用于含較少話音信息的幀,改變數(shù)據(jù)傳輸速率有利。本領(lǐng)域技術(shù)人員已理解,可用其他抽樣率、幀規(guī)模和傳輸速率。
第1編碼器100和第2譯碼器11O一起組成第1話音編碼設(shè)備或話音編碼器。話音編碼設(shè)備可用于傳輸話音信號用的任何通信裝置,包括例如以上參照圖1所示的用戶單元、BTS或BSC。同樣,第2編碼器106和第1譯碼器104一起組成第2話音編碼設(shè)備。本領(lǐng)域技術(shù)人員理解,可用數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、離散門邏輯、固件或任何常規(guī)可編程軟件模塊和微處理器實(shí)現(xiàn)話音編碼設(shè)備。軟件模擬可駐留在RAM存儲器、快速擦寫存儲器、寄存器或本領(lǐng)域公知的任何其它形式的可寫存儲媒體中。另外,任何常規(guī)處理器、控制器或狀態(tài)機(jī)可代替微處理器。5727123號美國專利闡述專門為話音編碼設(shè)計的示范ASIC,1994年2月16日提出的序列號為08/197417的美國專利申請(題目為“聲碼器ASIC(VOCODER ASIC)”)也有闡述,這2個專利都轉(zhuǎn)讓給本發(fā)明受讓人,并并通過引用與本申請結(jié)合。
圖3中,可用于話音編碼設(shè)備的編碼器200包含模式判決模塊202、音調(diào)估計模塊204、LP分析模塊206、LP分析濾波器208、LP量化模塊210和殘數(shù)量化模塊212。將輸入話音幀S(n)提供給模式判決模塊202、音調(diào)估計模塊204、LP分析模塊206和LP分析濾波器208。模式判決模塊202根據(jù)每一輸入話音幀S(n)各特性中的周期性、能量、信噪比(SNR)或過零率,產(chǎn)生模式索引號IM和模式M。5911128號美國專利闡述根據(jù)周期性對話音幀分類的各種方法,該專利轉(zhuǎn)讓給本發(fā)明受讓人,并通過引用與本申請結(jié)合。電信業(yè)協(xié)會的業(yè)界過渡標(biāo)準(zhǔn)TIA/EIA IS-127和TIA/EIA IS-733也編入這些方法。上述序列號為09/217341的美國專利申請也講述模式判決方法的范例。
音調(diào)估計模塊204根據(jù)每一輸入話音幀S(n)產(chǎn)生音調(diào)索引號Ip和滯后值Po。LP分析模塊206對每一輸入話音幀S(n)進(jìn)行線性預(yù)測分析,以產(chǎn)生LP參數(shù)a。該參數(shù)a提供給LP量化模塊210。該模塊2l0還接收模式M,從而以取決于模式的方式進(jìn)行量化處理。該模塊210產(chǎn)生LP索引號ILP和量化LP參數(shù)。LP分析濾波器208除接收輸入話音幀S(n),還接收量化LP參數(shù)。該濾波器208,根據(jù)量化線性預(yù)測參數(shù)產(chǎn)生代表輸入話音幀S(n)之間差錯和重構(gòu)話音的LP殘留信號R[n]。將LP殘留信號R[n]、模式M和量化LP參數(shù)提供給殘數(shù)量化模塊212。該模塊212根據(jù)這些值產(chǎn)生殘數(shù)索引號IR和量化殘留信號 [n]。
圖4中,可用于話音編碼設(shè)備的譯碼器300包含LP參數(shù)譯碼模塊302、殘數(shù)譯碼模塊304、模式譯碼模塊306和LP綜合濾波器308。模式譯碼模塊306接收模式索引號IM,將其譯碼,從而產(chǎn)生模式M。LP參數(shù)譯碼器模塊302接收模式M和LP索引號ILP。該模塊302將接收的值譯碼,產(chǎn)生量化LP參數(shù)。殘數(shù)譯碼模塊304接收殘數(shù)索引號IR、音調(diào)索引號IP和模式索引號IM。該模塊304將接收的值譯碼,產(chǎn)生量化殘留信號 [n]。該信號 [n]和量化LP參數(shù)提供給LP綜合濾波器308,從而綜合成譯碼輸出話音信號[n]。
本領(lǐng)域已公知圖3中編碼器200和圖4中譯碼器300的各模塊的操作和實(shí)現(xiàn),上述5414796號美國專利和《話音信號數(shù)字處理(Digital Processing ofSpeech Signals)》(L.B.Rabiner和R.W.Schafer著,396~453頁,1978年)也對此進(jìn)行闡述。
如圖5的流程圖所示,按照一實(shí)施例的話音編碼設(shè)備在處理傳輸?shù)脑捯舫闃又凶裾找韵虏襟E。步驟400中,話音編碼設(shè)備在連續(xù)幀內(nèi)接收話音信號的數(shù)字抽樣。接收給定幀時話音編碼設(shè)備進(jìn)到步驟402。此步驟402,話音編碼設(shè)備檢測該幀的能量。此能量是該幀話音活動性的度量。通過對數(shù)字話音抽樣幅值的平方求和,并將所得能量與門限值比較,進(jìn)行話音檢測。一實(shí)施例中,該門限值隨背景噪聲電平電變化自適應(yīng)。上述5414796號美國專利闡述可變門限話音活動性檢測器的范例。有些清音語聲可為能量非常低的抽樣,會將其錯誤編碼成背景噪聲。為了避免出現(xiàn)這點(diǎn),可用低能量抽樣頻譜傾斜,以區(qū)別清音語和背景噪聲,如以上5414796號美國專利所述。
檢測幀能量后,話音編碼設(shè)備進(jìn)到步驟404。步驟404中,話音編碼設(shè)備判斷檢測的幀能量是否足以區(qū)分包含話音信息的幀。如果檢測的幀能量下降到預(yù)定電平以下,話音編碼設(shè)備就進(jìn)到步驟406。步驟406中,該設(shè)備將此幀當(dāng)作背景噪聲(即非話音或寂靜)進(jìn)行編碼。一實(shí)施例中,背景噪聲幀以1/8速率或1Kbps編碼。如果步驟404中檢測的幀能量達(dá)到或超過預(yù)定門限電平,則將該幀區(qū)分為話音后,話音編碼設(shè)備進(jìn)到步驟408。
步驟408中,話音編碼設(shè)備判斷該幀是否清音語,也就是說,該設(shè)備審查幀的周期性。各種公知的周期性判斷方法包含例如采用過零點(diǎn)和采用歸一化自相關(guān)函數(shù)(NACF)。具體而言,上述5911128號美國專利和序列號為09/217341的美國專利申請闡述采用過零點(diǎn)和NACF檢測周期性。此外,電信業(yè)協(xié)會過渡標(biāo)準(zhǔn)TIA/EIA IS-127和TIA/EIA IS-733也編入上述區(qū)別清音語與濁音語用的方法。如果步驟408中判定該幀為清音語,話音編碼設(shè)備進(jìn)到步驟410。在步驟410,該設(shè)備將此幀作為清音語編碼。一實(shí)施例中,以1/4速率或2.6Kbps對清音語幀進(jìn)行編碼。如果步驟408中不判定該幀為清音語,話音編碼設(shè)備進(jìn)到步驟412。
步驟412中,話音編碼設(shè)備采用例如以上5911128號美國專利所述的本領(lǐng)域公知周期性檢測方法,判斷該幀是否渡語。如果判定該幀是過渡語,話音編碼設(shè)備進(jìn)到步驟414。在步驟414,將該幀當(dāng)作過渡語(即從清音語過渡到濁音語)進(jìn)行編碼。一實(shí)施例中按照多脈沖插空編碼法對過渡語幀進(jìn)行編碼,序列號為09/307294的美國專利申請闡述該方法,該申請的題目為“過渡語幀的多脈沖插空編碼(MULTIPULSE INTERPOLATIVE CODING OF TRANSITION SPEECHFRAMES)”,1999年5月7日提出,已轉(zhuǎn)讓給本發(fā)明受讓人,并通過引用與本申請結(jié)合。另一實(shí)施例中,以全速率或13.2Kbps對過渡語幀進(jìn)行編碼。
如果在步驟412中話音編碼設(shè)備判定該幀不是過渡語,該設(shè)備進(jìn)到步驟416。步驟416中,話音編碼設(shè)備將該幀當(dāng)作濁音語進(jìn)行編碼。一實(shí)施例中,可用半速率或6.1Kbps對濁音語幀編碼。還可用全速率或13.2Kbps(或8K CELP編碼設(shè)備中的8Kbps全速率)對濁音語幀編碼。然而,本領(lǐng)域的技術(shù)人員會理解,半速率濁音幀編碼通過利用濁音幀的穩(wěn)態(tài)性,使編碼設(shè)備可節(jié)省寶貴的帶寬。此外無論濁音語用何種速率編碼,有利的是利用過去幀的信息對濁音語編碼,因而該語進(jìn)行預(yù)測性編碼。
本領(lǐng)域的技術(shù)人員會理解,可按圖5所示的步驟對話音信號或相應(yīng)的LP殘數(shù)編碼。圖6A的圖形中可看到噪聲、清音語、過渡語和濁音語的波形特性隨時間變化,圖6B的圖形中則可看到噪聲、清音語、過濾語和濁音語的LP殘數(shù)波形特性隨時間變化。
一實(shí)施例中,原型音調(diào)周期(PPP)話音編碼設(shè)備500包含反向?yàn)V波器502、原型提取器504、原型量化器506、原型去量化器508、插空/綜合模塊510和LPC綜合模塊512,如圖7所示。有利的是話音編碼設(shè)備500可作為DSP實(shí)現(xiàn),并且可駐留在例如CS或蜂窩網(wǎng)電話系統(tǒng)的用戶單元或基站中,或者可駐留在衛(wèi)星系統(tǒng)的用戶單元或網(wǎng)關(guān)中。
話音編碼器500中,將數(shù)字化話音信號S(n)(n為幀號)提供給反向LP濾波器502。一具體實(shí)施例中,幀的長度是20ms。按照下述計算反向?yàn)V波器的傳輸函數(shù)A(z)=1-a1z-1-a2z-2-…-apz-p,式中系數(shù)aI為濾波器抽頭,這些抽頭具有按照以上5414796號美國專利和序列號為09/217494的美國專利申請所述的已知方法選擇的預(yù)定值,這些專利前面已按參考資料全部引入。數(shù)p表示反向LP濾波器502用于預(yù)測的先前抽樣的數(shù)量。具體實(shí)施例中,p設(shè)定為10。
反向?yàn)V波器502將LP殘留信號r(n)提供給原型提取器504。原型提取器504從當(dāng)前的幀提取原型。該原型是由插空/綜合模塊510與同樣也位于幀內(nèi)的先前幀原型一起加以線性內(nèi)插的當(dāng)前幀的一部分,進(jìn)行該內(nèi)插目的在于在譯碼器重構(gòu)Lp殘留信號。
原型提取器504將該原型提供給原型量化器506,按照本領(lǐng)域公知的任何量化方法對該原型進(jìn)行量化??蓮牟檎冶?未示出)得到的量化值匯編成包含滯后參數(shù)和其碼本參數(shù)的數(shù)據(jù)分組,以便在信道上傳送。該分組提供給發(fā)射機(jī)(未示出),在信道上發(fā)送到接收機(jī)(也未示出)。設(shè)反向LP濾波器502、原型提取器504和原型量化器506對當(dāng)前的幀進(jìn)行PPP分析。
接收機(jī)接收該分組,將其提供給原型去量化器508。原型去量化器508可根據(jù)任何公知技術(shù)對該分組進(jìn)行去量化。原型去量化器508將去量化的原型提供給插空/綜合模塊510。該模塊510將該原型與同樣位于幀內(nèi)的先前幀原型一起插空,以便對當(dāng)前幀重構(gòu)LP殘留信號。有利的是按照5884254號美國專利和上述序列號為09/217494的美國專利申請所說明的已知方法完成該插空和幀綜合。
插空/綜合模塊510將重構(gòu)件的LP殘留信號 (n)提供給LPC綜合模塊512。LPC綜合模塊512還從發(fā)送的數(shù)據(jù)分組接收線路頻譜對(LSP),用于對重構(gòu)的LP殘留信號 (n)進(jìn)行LPC濾波,以對當(dāng)前幀產(chǎn)生重構(gòu)的話音信號 (n)。另一實(shí)施例中,可在進(jìn)行當(dāng)前幀插空/綜合前,對原型進(jìn)行話音信號 (n)的LPC綜合。原型去量化器508、插空/綜合模塊510和LPC綜合模塊512進(jìn)行當(dāng)前幀的PPP綜合。
一實(shí)施形態(tài)中,諸如圖7的話音編碼設(shè)備500之類的PPP話音編碼設(shè)備識別要計算線性相移的頻帶數(shù)B。有利的是在量化前按照與本申請一起提出的相關(guān)美國專利申請所述的方法和設(shè)備智能化地對相位進(jìn)行二次取樣,該申請題目為“相位頻譜信息二次取樣的方法和設(shè)備(METHOD AND APPARATUS FORSUBSAMPLING PHASE SPECTRUM INFORMATION)”,轉(zhuǎn)讓給本發(fā)明受讓人。有利的是該話音編碼設(shè)備依據(jù)整個離散傅里葉級數(shù)(DFS)矢量中的諧波幅度重要性將所處理幀的原型的DFS矢量劃分成具有可變寬度的少量頻帶,從而成正比地減少需要的量化。將0Hz至Fm Hz的整個頻率范圍(Fm是所處理原型的最高頻率)劃分成L段。因此,存在的諧波數(shù)M等于Fm/Fo,F(xiàn)o Hz是基頻。因而,由幅度矢量和相位矢量組成的原型DFS矢量有M元。該話音編碼設(shè)備預(yù)先對L段分配b1、b2、b3…bL頻帶,從而b1+b2+b3…bL等于所需頻帶總數(shù)B。與此相對應(yīng),第1段有b1個頻帶,第2段有b2個頻帶,……,第L段有bL個頻帶,整個頻率范圍有B個頻帶。一實(shí)施例中,整個頻率范圍是從零至4000Hz,即人類口語話音的范圍。
一實(shí)施例中,在L段的第i段均勻分配bi個頻帶。通過將第i段的頻率范圍分成bi個相等部分,完成這點(diǎn)。與此相對應(yīng),第1段分成b1個相等頻帶,第2段分成b2個相等頻帶,…第L段分成bL個相等頻帶。
另一實(shí)施例中,對第i段中bi個頻段的每一個選擇一組固定的非均勻布局頻帶邊緣。通過在第i段上選擇任意bi個頻帶的組或取得i段能量直方圖總平均值,達(dá)到這點(diǎn)。能量集中度高可要求頻帶窄,能量集中度低則用較寬的頻帶。因而,第1段分成b1個固定的非相等頻帶,第2段分成b2個固定的非相等頻帶,…第L段分成bL個固定的非相等頻帶。
另一實(shí)施例中,對每一子頻帶中bi個頻帶的每個選擇可變的頻帶邊緣組。通過用等于適當(dāng)?shù)椭礔b Hz的目標(biāo)頻帶寬度作為起點(diǎn),完成這點(diǎn)。然后,執(zhí)行以下的步驟。將計數(shù)器n置1。然后,尋找幅度矢量,求最大幅度值的頻率FbmHz和相應(yīng)的諧波數(shù)mb(等于Fbm/Fo)。通過排除先前所有設(shè)定頻帶邊緣覆蓋的范圍(對應(yīng)于1到n-1的迭代),進(jìn)行該尋找。然后,將bi個頻帶中第n頻帶的頻帶邊緣設(shè)定為諧波數(shù)mb-Fb/Fo/2和mb+Fb/Fo/2,相應(yīng)于頻率Fmb-Fb/2和Fmb+Fb/2Hz。接著,計數(shù)器n遞增,并且重復(fù)進(jìn)行尋找幅度矢量和設(shè)定頻帶邊緣的步驟,直到計數(shù)值n超過bi。因而,第1段分成b1個可變的不相等頻帶,第2段分成b2個可變的不相等頻帶,…第L段分成bL個可變的不相等頻帶。
上面剛說明的實(shí)施例中,頻帶進(jìn)一步加細(xì),以去除相鄰頻帶邊緣之間的間隙。一實(shí)施例中,低頻帶的右頻帶邊緣及其最接近的高頻帶的左頻帶邊緣都加以延伸,在2個邊緣間隙的中部重合(位于第2頻帶左方的第1頻帶,頻率低于第2頻帶)。達(dá)到這點(diǎn)的一種方法是將2個頻帶的邊緣設(shè)定成其頻率(和相應(yīng)的諧波數(shù))的平均值。另一實(shí)施例中,將低頻段右邊緣及其最接近的高頻段左邊緣中的任一個設(shè)定成頻率上等于另一個(或設(shè)定成另一個的諧波數(shù)的相鄰諧波數(shù))??梢罁?jù)以右邊緣終止的頻帶和以左邊緣開始的頻帶中包含的能量進(jìn)行頻帶邊緣的均衡。與能量較高的頻帶對應(yīng)的頻帶邊緣保持不變,而另一頻帶邊緣要改變?;蛘撸胁磕芰烤植炕^高的頻帶對應(yīng)的頻帶邊緣改變,而另一頻帶邊緣不改變。另一實(shí)施例中,上述右頻帶邊緣和上述左頻帶邊緣都按x∶y的比率在頻率和諧波數(shù)上移動不相等的距離,其中x和y分別是以左頻帶邊緣開始的頻帶和以右頻帶邊緣終止的頻帶的頻帶能量?;蛘撸瑇和y可分別是中心諧波能量對以右頻帶邊緣終止的頻帶的總能量的比率和中心諧波能量對以左頻帶邊緣開始的頻帶的總能量的比率。
另一實(shí)施例中,一些L段DFS矢量中可用均勻分配的頻帶,另一些可用固定的非均勻頻帶,又一些可用可變的非均勻頻帶。
一實(shí)施例中,諸如圖7中話音編碼設(shè)備500的PPP話音編碼設(shè)備執(zhí)行圖8的流程圖中說明的算法步驟,以在原型音調(diào)周期的離散傅里葉級數(shù)(DFS)表示中識別頻帶。識別這些頻帶,用于計算相對于參考原型DFS的頻帶定位或線性相移。
步驟600中,話音編碼設(shè)備開始進(jìn)行識別頻帶的處理。然后,該設(shè)備進(jìn)入步驟602。在步驟602話音編碼設(shè)備在基頻Fo下計算原型的DFS。然后,該設(shè)備進(jìn)入步驟604。步驟604中,話音編碼設(shè)備將頻率范圍分成L段。一實(shí)施例中,該頻率范圍是從零到4000Hz,即人類口語話音的范圍。然后,話音編碼設(shè)備進(jìn)到步驟606。
步驟606中,話音編碼設(shè)備給L段分配bL個頻帶,使b1+b2+…+bL等于要計算線性相移的頻帶總數(shù)B。然后,該設(shè)備進(jìn)入步驟608。步驟608中,話音編碼設(shè)備將段的計數(shù)i設(shè)定為等于1。然后,該設(shè)備進(jìn)入步驟610。步驟610中,話音編碼設(shè)備選擇每一段中分配頻帶的分配方法。然后,該設(shè)備進(jìn)到步驟612。
步驟612中,話音編碼設(shè)備判斷步驟610的頻帶分配方法是否在段內(nèi)均勻分配頻帶。如果步驟610的頻帶分配方法在段內(nèi)均勻分配頻帶,該設(shè)備進(jìn)到步驟614。反之,步驟610的頻帶分配方法不是在段內(nèi)均勻分配頻帶,則設(shè)備進(jìn)到步驟616。
步驟614中,話音編碼設(shè)備將第i段分成bi個相等頻帶。然后,該設(shè)備進(jìn)到步驟618。步驟618中,話音編碼設(shè)備使段計數(shù)i遞增。然后,該設(shè)備進(jìn)到步驟620。步驟620中,話音編碼設(shè)備判斷段計數(shù)i是否大于L。如果段計數(shù)i大于L,該設(shè)備進(jìn)到步驟622。反之,段計數(shù)i大于L,該設(shè)備進(jìn)到步驟622。反之,段計數(shù)i不大于L,則該設(shè)備返回步驟610,選擇下一段的頻帶分配方法。步驟622中,話音編碼設(shè)備退出頻帶識別算法。
步驟616中,話音編碼設(shè)備判斷步驟610的頻帶分配方法是否在段內(nèi)分配固定的非均勻頻帶。如果步驟610的頻帶分配方法在段內(nèi)分配固定的非均勻頻帶,該設(shè)備進(jìn)到步驟624。反之,步驟610的頻帶分配方法不是在段內(nèi)分配固定的非均勻頻帶,則該設(shè)備進(jìn)到步驟626。
步驟624中,話音編碼設(shè)備將第i段分成bi個不相等的預(yù)置預(yù)帶。用上述方法可完成這點(diǎn)。然后,話音編碼設(shè)備進(jìn)到步驟618,使段計數(shù)i遞增,繼續(xù)對每段分配頻帶,直到整個頻率范圍都分配頻帶。
步驟626中,話音編碼設(shè)備將頻帶計數(shù)n設(shè)定為等于1,并將起始帶寬設(shè)定為等于FbHz。然后,該設(shè)備進(jìn)到步驟628。步驟628中,話音編碼設(shè)備排除從1到n-1范圍內(nèi)帶寬的幅度。然后,該設(shè)備進(jìn)到步驟630。步驟630中,話音編碼設(shè)備對剩下的幅度矢量分類。然后,該設(shè)備進(jìn)到步驟632。
步驟632中,話音編碼設(shè)備判定具有最高諧波數(shù)mb的頻帶的位置。然后,該設(shè)備進(jìn)到步驟634。步驟634中,話音編碼設(shè)備圍繞mb設(shè)定頻帶邊緣,使頻帶邊緣之間包含的諧波總數(shù)等于Fb/Fo。然后,該設(shè)備進(jìn)到步驟636。
步驟636中,話音編碼設(shè)備移動相鄰頻帶的頻帶邊緣,填充頻帶間隙。然后,該設(shè)備進(jìn)到步驟638。步驟638中,話音編碼設(shè)備使頻帶計數(shù)n遞增。然后,該設(shè)備進(jìn)到步驟640。在步驟640話音編碼器判斷頻帶計數(shù)n是否大于bi。如果頻帶計數(shù)n大于bi,設(shè)備進(jìn)到步驟618,使段計數(shù)i遞增,并且對各段分配頻帶,直到整個頻率范圍都分配頻帶。反之,頻帶計數(shù)n不大于bi,則該設(shè)備返回步驟638,建立段內(nèi)下一頻帶的寬度。
這樣,說明了一種新穎的話音編碼設(shè)備中計算幀原型間線性相移用的頻帶識別方法和裝置。本領(lǐng)域的技術(shù)人員會理解,結(jié)合這里所揭示的實(shí)施例闡述的各種說明性邏輯塊和算法步驟可用數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、離散電路門或晶體管邏輯電路、離散硬件部件(諸如寄存器和FIFO)、執(zhí)行固件指令集的處理器或任何常規(guī)可編程軟件模塊和處理器加以實(shí)現(xiàn)或執(zhí)行。處理器為微處理器有利,但另一方面,處理器也可以是任何常規(guī)處理器、微控制器或狀態(tài)機(jī)。軟件模塊可駐留于RAM存儲器、快速擦寫存儲器、寄存器或本領(lǐng)域公知的任何其它類型可寫存儲媒體中。技術(shù)人員還會理解,用電壓、電流、電磁波、磁場或磁粒子、光場或光粒子或這些的任何組合代表以上說明各處會參照的數(shù)據(jù)、指令、命令、信息、信號、二進(jìn)制位、碼元和碼片。
這樣,說明了本發(fā)明的較佳實(shí)施例。然而,本領(lǐng)域的普通技術(shù)人員會明白,這里所揭示的實(shí)施例可做大量變換而不偏離本發(fā)明的實(shí)質(zhì)和范圍。因此,除遵照以下的權(quán)利要求外,本發(fā)明不受限制。
權(quán)利要求
1.一種劃分幀原型頻譜的方法,其特征在于包含以下步驟將頻譜劃分成多個段;給每一段分配多個頻帶;對每一段建立多個頻帶用的帶寬組。
2.如權(quán)利要求1所述的方法,其特征在于,所述建立步驟包含對特定段內(nèi)全部頻帶分配固定的均勻帶寬的步驟。
3.如權(quán)利要求1所述的方法,其特征在于,所述建立步驟包含對特定段內(nèi)多個頻帶分配固定的非均勻帶寬的步驟。
4.如權(quán)利要求3所述的方法,其特征在于,其中所述分配步驟包含與帶內(nèi)能量集中度成反比的改變帶寬的步驟。
5.如權(quán)利要求1所述的方法,其特征在于,所述建立步驟包含對特定段內(nèi)多個頻帶分配可變的帶寬的步驟。
6.如權(quán)利要求5所述的方法,其特征在于,其中分配步驟包含以下步驟設(shè)定目標(biāo)帶寬;除任何先前建立的頻帶邊緣覆蓋的尋找范圍外,對每一帶寬尋找原型的幅度矢量,以確定帶內(nèi)最大諧波數(shù);對每一頻帶圍繞最大諧波數(shù)確定頻帶邊緣位置,使位于頻帶邊緣之間的諧波總數(shù)等于基頻除目標(biāo)帶寬;消除相鄰頻帶邊緣的間隙。
7.如權(quán)利要求6所述的方法,其特征在于,所述消除步驟包含對每一間隙設(shè)定內(nèi)封該間隙的相鄰間隙邊緣,使其等于2個相鄰頻帶邊緣的頻率平均值的步驟。
8.如權(quán)利要求6所述的方法,其特征在于,所述消除步驟包含對每一間隙設(shè)定能量較小的頻帶對應(yīng)的相鄰頻帶邊緣,使其等于能量較大的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值的步驟。
9.如權(quán)利要求6所述的方法,其特征在于,所述消除步驟包含對每一間隙設(shè)定頻帶中心能量局部化較高的頻帶對應(yīng)的相鄰頻帶邊緣,使其等于頻帶中心能量局部化較低的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值的步驟。
10.如權(quán)利要求6所述的方法,其特征在于,所述消除步驟包含以下步驟對每一間隙調(diào)整2個相鄰頻帶邊緣的頻率值,即以x對y的比率相對于頻率較低的相鄰頻帶邊緣頻率值的調(diào)整,調(diào)整頻率較高的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值,其中x是較高頻率的相鄰頻帶的頻帶能量,y是較低頻率相鄰頻帶的頻帶能量。
11.如權(quán)利要求6所述的方法,其特征在于,所述消除步驟包含以下步驟對每一間隙調(diào)整2個相鄰頻帶邊緣的頻率值,即以x對y的比率相對于頻率較低的相鄰頻帶邊緣頻率值的調(diào)整,調(diào)整頻率較高的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值,其中x是較低頻率相鄰頻帶的中心諧波能量對較低頻率相鄰頻帶的總能量的比率,y是較高頻率相鄰頻帶的中心諧振能量對較高頻率相鄰頻帶的總能量的比率。
12.一種話音編碼設(shè)備,配置成劃分幀原型的頻譜,其特征在于包含將頻譜劃分成多個段的裝置;給每段分配多個頻帶的裝置;對每段建立多個頻帶的帶寬組的裝置。
13.如權(quán)利要求12所述的話音編碼設(shè)備,其特征在于,所述建立裝置包含對特定段內(nèi)全部頻帶分配固定的均勻帶寬的裝置。
14.如權(quán)利要求12所述的話音編碼設(shè)備,其特征在于,所述建立裝置包含對特定段內(nèi)多個頻帶分配固定的非均勻帶寬的裝置。
15.如權(quán)利要求14所述的話音編碼設(shè)備,其特征在于,所述分配裝置包含與頻帶內(nèi)能量集中成反比地改變帶寬的裝置。
16.如權(quán)利要求12所述的話音編碼設(shè)備,其特征在于,所述建立裝置包含對特定段的多個頻帶分配可變的帶寬的裝置。
17.如權(quán)利要求16所述的話音編碼設(shè)備,其特征在于,所述分配裝置包含設(shè)定目標(biāo)帶寬的裝置;尋找裝置,對每一頻帶尋找原型的幅度矢量,以決定頻帶內(nèi)除先前建立的頻帶邊緣覆蓋的尋找范圍外的最大諧波數(shù);定位裝置,圍繞最大諧波數(shù)決定頻帶邊緣的位置,使位于頻帶邊緣之間的諧波總數(shù)等于基頻除目標(biāo)帶寬;消除相鄰頻帶邊緣間隙的裝置。
18.如權(quán)利要求17所述的話音編碼設(shè)備,其特征在于,所述消除裝置包含設(shè)定裝置,對每一間隙設(shè)定內(nèi)封該間隙的相鄰頻帶邊緣,使其等于2個相鄰頻帶邊緣的頻率平均值。
19.如權(quán)利要求17所述的話音編碼設(shè)備,其特征在于,所述消除裝置包含設(shè)定裝置,對每一間隙設(shè)定能量較低的頻帶對應(yīng)的相鄰頻帶邊緣,使其等于能量較高的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值。
20.如權(quán)利要求17所述的話音編碼設(shè)備,其特征在于,所述消除裝置包含設(shè)定裝置,對每一間隙設(shè)定頻帶中心能量局部化較高的頻帶對應(yīng)的相鄰頻帶邊緣,使其等于頻帶中心能量局部化較低的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值。
21.如權(quán)利要求17所述的話音編碼設(shè)備,其特征在于,所述消除裝置包含調(diào)整裝置,對每一間隙調(diào)整2個相鄰頻帶邊緣的頻率值,即以x對y的比率相對于頻率較低的相鄰頻帶邊緣頻率值的調(diào)整,調(diào)整頻率較高的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值,其中x是較高頻率相鄰頻帶的頻帶能量,y是較低頻率相鄰頻帶的頻帶能量。
22.如權(quán)利要求17所述的話音編碼設(shè)備,其特征在于,所述消除裝置包含調(diào)整裝置,對每一間隙調(diào)整2個相鄰頻帶邊緣的頻率值,即以x對y的比率相對于頻率較低的相鄰頻帶邊緣頻率值的調(diào)整,調(diào)整頻率較高的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值,其中x是較低頻率相鄰頻帶的中心諧波能量對較低頻率相鄰頻帶的總能量的比率,y是較高頻率相鄰頻帶的中心諧振能量對較高頻率相鄰頻帶的總能量的比率。
23.如權(quán)利要求12所述的話音編碼設(shè)備,其特征在于,所述話音編碼設(shè)備駐留在無線通信系統(tǒng)的用戶單元中。
24.一種話音編碼設(shè)備,其特征在于包含原型提取器,配置成從話音編碼設(shè)備進(jìn)行處理的幀提取原型;原型量化器,耦聯(lián)原型提取器,并且配置成將原型的頻譜劃分成多個段,給每段分配多個頻帶,對每段建立多個頻帶用的帶寬組。
25.如權(quán)利要求24所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成建立帶寬組,作為特定段內(nèi)全部頻帶用的固定的均勻帶寬。
26.如權(quán)利要求24所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成建立帶寬組,作為特定段內(nèi)多個頻帶用的固定的非均勻帶寬。
27.如權(quán)利要求26所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成與頻帶內(nèi)能量集中度成反比地改變帶寬。
28.如權(quán)利要求24所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成建立帶寬組,作為特定段內(nèi)多個頻帶用的可變帶寬。
29.如權(quán)利要求28所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成通過設(shè)定目標(biāo)帶寬設(shè)定可變帶寬;除任何先前建立的頻帶邊緣覆蓋的尋找范圍外,對每一帶寬尋找原型的幅度矢量,以確定頻帶內(nèi)最大諧波數(shù);對每一頻帶圍繞最大諧波數(shù)確定頻帶邊緣位置,使位于頻帶邊緣之間的諧波總數(shù)等于基頻除目標(biāo)帶寬;消除相鄰頻帶邊緣的間隙。
30.如權(quán)利要求29所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成對每一間隙設(shè)定內(nèi)封該間隙的相鄰頻帶邊緣,使其等于2個相鄰頻帶邊緣的頻率平均值,從而消除間隙。
31.如權(quán)利要求29所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成對每一間隙設(shè)定能量較小的頻帶對應(yīng)的相鄰頻帶邊緣,使其等于能量較大的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值,從而消除間隙。
32.如權(quán)利要求29所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成,對每一間隙設(shè)定頻帶中心能量局部化較高的頻帶對應(yīng)的相鄰頻帶邊緣,使其等于頻帶中心能量局部化較低的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值,從而消除間隙。
33.如權(quán)利要求29所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成對每一間隙調(diào)整2個相鄰頻帶邊緣的頻率值,即以x對y的比率相對于頻率較低的相鄰頻帶邊緣頻率值的調(diào)整,調(diào)整頻率較高的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值,其中x是較高頻率的相鄰頻帶的頻帶能量,y是較低頻率相鄰頻帶的頻帶能量,從而消除間隙。
34.如權(quán)利要求29所述的話音編碼設(shè)備,其特征在于,所述原型量化器還配置成對,每一間隙調(diào)整2個相鄰頻帶邊緣的頻率值,即以x對y的比率相對于頻率較低的相鄰頻帶邊緣頻率值的調(diào)整,調(diào)整頻率較高的頻帶所對應(yīng)相鄰頻帶邊緣的頻率值,其中x是較低頻率相鄰頻帶的中心諧波能量對較低頻率相鄰頻帶的總能量的比率,y是較高頻率相鄰頻帶的中心諧振能量對較高頻率相鄰頻帶的總能量的比率,從而消除間隙。
35.如權(quán)利要求24所述的話音編碼設(shè)備,其特征在于,所述話音編碼設(shè)備駐留在無線通信系統(tǒng)的用戶單元中。
全文摘要
一種話音編碼設(shè)備中計算幀原型間線性相移用的頻帶識別方法和裝置,其中通過下述劃分幀原型頻譜將頻譜劃分成多個段、給每一段分配多個頻帶、對每一段建立多個頻帶用的帶寬組。帶寬可在給定任何段內(nèi)固定且均勻分布。帶寬可在任何段內(nèi)固定且非均勻分布。帶寬可在給定任何段內(nèi)可變且非均勻分布。
文檔編號G10L19/12GK1451154SQ00813042
公開日2003年10月22日 申請日期2000年7月18日 優(yōu)先權(quán)日1999年7月19日
發(fā)明者S·曼祖那什, A·P·德加科, A·K·阿南塔薩帕德曼拉巴漢, P·J·黃, E·L·T·肖依 申請人:高通股份有限公司