用于編碼和解碼語音信號的高頻帶部分的方法和設備的制作方法

文檔序號：2830057閱讀：347來源：國知局

專利名稱：用于編碼和解碼語音信號的高頻帶部分的方法和設備的制作方法
技術領域：
本發(fā)明涉及信號處理。
背景技術：
公共交換電話網(wǎng)絡(PSTN)上的語音通信的帶寬傳統(tǒng)上限于300-3400 kHz的頻率范圍。用于語音通信(例如蜂窩式電話和IP語音(因特網(wǎng)協(xié)議，VoIP))的新的網(wǎng)絡可能不具有相同的帶寬限制，且可能需要在此類網(wǎng)絡上發(fā)射和接收包含寬頻帶頻率范圍的語音通信。舉例來說，可能需要支持向下延伸到50 Hz和/或一直到7或8 kHz的音頻頻率范圍。還可能需要支持可能具有在傳統(tǒng)PSTN限制以外的范圍內的音頻語音內容的其它應用，例如高質量音頻或音頻/視頻會議。
語音編碼器所支持的范圍向較高頻率的延伸可改進清晰度。舉例來說，區(qū)分例如"s" 與"f"的摩擦音的信息主要處于高頻率。高頻帶延伸還可改進語音的其它質量，例如存在率。舉例來說，甚至濁元音也可具有遠遠高于PSTN限制的頻譜能量。
寬頻帶語音編碼的一種方法涉及縮放窄頻帶語音編碼技術(例如，經(jīng)配置以編碼0-4 kHz的范圍的技術)以覆蓋寬頻帶頻譜。舉例來說，語音信號可以較高速率取樣以包含處于高頻率的分量，且窄頻帶編碼技術可重新配置以使用更多濾波系數(shù)來表示此寬頻帶信號。然而，例如CELP (密碼本激勵線性預測)的窄頻帶編碼技術計算量較大，而寬頻帶CELP編碼器可能消耗過多處理循環(huán)，以至于對于許多移動和其它嵌入式應用而言不現(xiàn)實。使用這種技術將寬頻帶信號的整個頻譜編碼為所需質量還可能導致帶寬大大增加而令人無法接受。此外，甚至在此經(jīng)編碼信號的窄頻帶部分可傳輸?shù)絻H支持窄頻帶編碼的系統(tǒng)中和/或由所述系統(tǒng)解碼之前，將需要對所述經(jīng)編碼信號進行代碼轉換。
寬頻帶語音編碼的另一種方法涉及從經(jīng)編碼窄頻帶頻譜包絡外推高頻帶頻譜包絡。雖然這種方法可在不增加帶寬且不需要代碼轉換的情況下實施，但通常無法從窄頻帶部分的頻譜包絡中精確地預測出語音信號的高頻帶部分的粗略頻譜包絡或共振峰結構。
可能需要實施寬頻帶語音編碼，使得至少經(jīng)編碼信號的窄頻帶部分可通過窄頻帶信道(例如，PSTN信道)發(fā)送，而不進行代碼轉換或其它顯著修改。還可能需要寬頻帶編碼延伸有效率，以便(例如)避免在例如無線蜂窩式電話以及有線和無線信道上的廣播的應用中可能接受服務的用戶的數(shù)目顯著減少。

發(fā)明內容
在一個實施例中，一種編碼具有低頻帶部分和高頻帶部分的語音信號的高頻帶部分的方法包含計算表征高頻帶部分的頻譜包絡的多個濾波器參數(shù)；通過延伸從低頻帶部分導出的信號的頻譜來計算頻譜延伸信號；根據(jù)(A)基于頻譜延伸信號的高頻帶激勵信號和(B)多個濾波器參數(shù)來產(chǎn)生合成高頻帶信號；以及基于高頻帶部分與基于低頻帶部分的信號之間的關系來計算增益包絡。
在一個實施例中，一種語音處理方法包含基于低頻帶激勵信號產(chǎn)生高頻帶激勵信
號；基于高頻帶語音信號和高頻帶激勵信號產(chǎn)生合成高頻帶信號；以及基于高頻帶語音信號與基于低頻帶激勵信號的信號之間的關系來計算多個增益因數(shù)。
在另一實施例中，一種解碼具有低頻帶部分和高頻帶部分的語音信號的高頻帶部分的方法包含接收表征高頻帶部分的頻譜包絡的多個濾波器參數(shù)和表征高頻帶部分的時間包絡的多個增益因數(shù)；通過延伸基于低頻帶激勵信號之信號頻譜來計算頻譜延伸信號；根據(jù)(A)多個濾波器參數(shù)和(B)基于頻譜延伸信號的高頻帶激勵信號來產(chǎn)生合成高頻
帶信號；以及根據(jù)多個增益因數(shù)來調制合成高頻帶信號的增益包絡。
在另一實施例中，一種經(jīng)配置以編碼具有低頻帶部分和高頻帶部分的語音信號的高
頻帶部分的設備包含分析模塊，其經(jīng)配置以計算表征高頻帶部分的頻譜包絡的一組濾波器參數(shù)；頻譜延伸器，其經(jīng)配置以通過延伸從低頻帶部分導出的信號的頻譜來計算頻譜延伸信號；合成濾波器，其經(jīng)配置以根據(jù)(A)基于頻譜延伸信號的高頻帶激勵信號和 (B)所述組濾波器參數(shù)來產(chǎn)生合成高頻帶信號；以及增益因數(shù)計算器，其經(jīng)配置以基于高頻帶部分與基于低頻帶部分的信號之間的時間變化關系來計算增益包絡。
在另一實施例中，一種高頻帶語音解碼器經(jīng)配置以接收(A)表征語音信號的高頻帶部分的頻譜包絡的多個濾波器參數(shù)和(B)基于語音信號的低頻帶部分的經(jīng)編碼低頻帶激
勵信號。所述解碼器包含頻譜延伸器，其經(jīng)配置以通過延伸基于經(jīng)編碼低頻帶激勵信號之信號頻譜來計算頻譜延伸信號；合成濾波器，其經(jīng)配置以根據(jù)(A)表征高頻帶部分的頻譜包絡的多個濾波器參數(shù)和(B)基于頻譜延伸信號的高頻帶激勵信號來產(chǎn)生合成高頻帶信號；以及增益控制元件，其經(jīng)配置以根據(jù)表征高頻帶部分的時間包絡的多個增益因數(shù)來調制合成高頻帶信號的增益包絡。

圖la展示根據(jù)一實施例的寬頻帶語音編碼器A100的方框圖。
圖lb展示寬頻帶語音編碼器A100的實施方案A102的方框圖。
圖2a展示根據(jù)一實施例的寬頻帶語音解碼器B100的方框圖。
圖2b展示寬頻帶語音編碼器B100的實施方案B102的方框圖。
圖3a展示濾波器組A110的實施方案A112的方框圖。
圖3b展示濾波器組B120的實施方案B122的方框圖。
圖4a展示濾波器組A110的一個實例的低和高頻帶的帶寬覆蓋。
圖4b展示濾波器組A110的另一實例的低和高頻帶的帶寬覆蓋。
圖4c展示濾波器組A112的實施方案A114的方框圖。
圖4d展示濾波器組B122的實施方案B124的方框圖。
圖5a展示語音信號的頻率與對數(shù)幅值的曲線的實例。
圖5b展示基礎線性預測編碼系統(tǒng)的方框圖。
圖6展示窄頻帶編碼器A120的實施方案A122的方框圖。
圖7展示窄頻帶解碼器B110的實施方案B112的方框圖。
圖8a展示濁語音的殘留信號的頻率與對數(shù)幅值的曲線的實例。
圖8b展示濁語音的殘留信號的時間與對數(shù)幅值的曲線的實例。
圖9展示也執(zhí)行長期預測的基礎線性預測編碼系統(tǒng)的方框圖。
圖10展示高頻帶編碼器A200的實施方案A202的方框圖。
圖11展示高頻帶激勵發(fā)生器A300的實施方案A302的方框圖。
圖12展示頻譜延伸器A400的實施方案A402的方框圖。
圖12a展示頻譜延伸操作的一個實例中各點處的信號頻譜的曲線。
圖12b展示頻譜延伸操作的另一實例中各點處的信號頻譜的曲線。
圖13展示高頻帶激勵發(fā)生器A302的實施方案A304的方框圖。
圖14展示高頻帶激勵發(fā)生器A302的實施方案A306的方框圖。
圖15展示包絡計算任務T100的流程圖。
圖16展示組合器490的實施方案492的方框圖。
圖17說明計算高頻帶信號S30的周期性指標的方法。
圖18展示高頻帶激勵發(fā)生器A302的實施方案A312的方框圖。
圖19展示高頻帶激勵發(fā)生器A302的實施方案A314的方框圖。
圖20展示高頻帶激勵發(fā)生器A302的實施方案A316的方框圖。
圖21展示增益計算任務T200的流程圖。
圖22展示增益計算任務T200的實施方案T210的流程圖。
圖23a展示窗口函數(shù)的圖。
圖23b展示將如圖23a所示的窗口函數(shù)應用于語音信號的子幀。
圖24展示高頻帶解碼器B200的實施方案B202的方框圖。
圖25展示寬頻帶語音編碼器A100的實施方案AD10的方框圖。
圖26a展示延遲線D120的實施方案D122的示意圖。
圖26b展示延遲線D120的實施方案D124的示意圖。
圖27展示延遲線D120的實施方案D130的示意圖。
圖28展示寬頻帶語音編碼器AD10的實施方案AD12的方框圖。
圖29展示根據(jù)一實施例的信號處理方法MD100的流程圖。
圖30展示根據(jù)一實施例的方法M100的流程圖。
圖3la展示根據(jù)一實施例的方法M200的流程圖。
圖31b展示方法M200的實施方案M210的流程圖。
圖32展示根據(jù)一實施例的方法M300的流程圖。
在各圖以及隨附的描述中，相同參考標號表示相同或類似的元件或信號。
具體實施例方式
本文描述的實施例包含可經(jīng)配置以向窄頻帶語音編碼器提供延伸以支持傳輸和/或存儲寬頻帶語音信號而帶寬僅增加約800到1000 bps (位/秒)的系統(tǒng)、方法和設備。此類實施方案的潛在優(yōu)點包含支持與窄頻帶系統(tǒng)的兼容性的嵌入式編碼、在窄頻帶與高頻帶編碼信道之間相對容易地分配和再分配位、避免計算量較大的寬頻帶合成操作，以及維持待通過計算量較大的波形編碼例行程序處理的信號的低取樣速率。
除非特別受到上下文限制，否則本文使用術語"計算"來表示其普通含義的任一者，例如計算、產(chǎn)生和從值的列表中選擇。本描述內容和權利要求書中使用術語"包括"時，不排除其它元件或操作。使用術語"A基于B"來表示其普通含義的任一者，包含以下情況(i) "A等于B"和(ii) "A至少基于B"。術語"因特網(wǎng)協(xié)議"包含如IETF (因特網(wǎng)工程工作小組)RFC (請求注解)791中描述的版本4和隨后版本(例如，版本6)。
圖la展示根據(jù)一實施例的寬頻帶語音編碼器A100的方框圖。濾波器組A110經(jīng)配置以對寬頻帶語音信號SIO進行濾波以產(chǎn)生窄頻帶信號S20和高頻帶信號S30。窄頻帶編碼器A120經(jīng)配置以編碼窄頻帶信號S20以產(chǎn)生窄頻帶(NB)濾波器參數(shù)S40和窄頻帶殘留信號S50。如本文進一步詳細描述，窄頻帶編碼器A120通常經(jīng)配置以作為密碼本索引或采取另一量化形式而產(chǎn)生窄頻帶濾波器參數(shù)S40和經(jīng)編碼窄頻帶激勵信號S50。高頻帶編碼器A200經(jīng)配置以根據(jù)經(jīng)編碼窄頻帶激勵信號S50中的信息編碼高頻帶信號 S30以產(chǎn)生高頻帶編碼參數(shù)S60。如本文進一步詳細描述，高頻帶編碼器A200通常經(jīng)配置以作為密碼本索引或采取另一量化形式而產(chǎn)生高頻帶編碼參數(shù)S60。寬頻帶語音編碼器AlOO的一個特定實例經(jīng)配置以在約8.55 kbps (千位/秒)的速率下編碼寬頻帶語音信號SIO，其中約7.55 kbps用于窄頻帶濾波器參數(shù)S40和經(jīng)編碼窄頻帶激勵信號S50,且約1 kbps用于高頻帶編碼參數(shù)S60。
可能需要將經(jīng)編碼窄頻帶和高頻帶信號組合為單一位流。舉例來說，可能需要將經(jīng) 編碼信號多路復用在一起以作為經(jīng)編碼寬頻帶語音信號用于傳輸(例如，在有線、光學或無線傳輸信道上)或用于存儲。圖lb展示寬頻帶語音編碼器AlOO的實施方案A102 的方框圖，寬頻帶語音編碼器AIOO包含多路復用器A130，其經(jīng)配置以將窄頻帶濾波器參數(shù)S40、經(jīng)編碼窄頻帶激勵信號S50和高頻帶濾波器參數(shù)S60組合為多路復用信號S70。
一種包含編碼器A102的設備還可包含經(jīng)配置以將多路復用信號S70傳輸?shù)嚼缬?線、光學或無線信道的傳輸信道中的電路。此設備還可經(jīng)配置以對信號執(zhí)行一個或一個以上信道編碼操作，例如誤差校正編碼(例如，速率兼容巻積編碼)和/或誤差檢測編碼 (例如，循環(huán)冗余編碼)，和/或一層或一層以上網(wǎng)絡協(xié)議編碼(例如，以太網(wǎng)、TCP/IP、 cdma2000)。
可能需要多路復用器A130經(jīng)配置以嵌入經(jīng)編碼窄頻帶信號(包含窄頻帶濾波器參數(shù) S40和經(jīng)編碼窄頻帶激勵信號S50)作為可分離的多路復用信號S70支流，使得經(jīng)編碼窄頻帶信號可獨立于多路復用信號S70的另一部分(例如，高頻帶和/或低頻帶信號)被恢復并解碼。舉例來說，多路復用信號S70可經(jīng)配置使得經(jīng)編碼窄頻帶信號可通過剝除高
頻帶濾波器參數(shù)S60而恢復。這一特征的一個潛在優(yōu)點是避免在將經(jīng)編碼寬頻帶信號傳遞到支持窄頻帶信號的解碼但不支持高頻帶部分的解碼的系統(tǒng)之前需要對所述經(jīng)編碼寬頻帶信號進行代碼轉換。
圖2a展示根據(jù)一實施例的寬頻帶語音解碼器B100的方框圖。窄頻帶解碼器B110 經(jīng)配置以解碼窄頻帶濾波器參數(shù)S40和經(jīng)編碼窄頻帶激勵信號S50以產(chǎn)生窄頻帶信號 S90。高頻帶解碼器B200經(jīng)配置以根據(jù)基于經(jīng)編碼窄頻帶激勵信號S50的窄頻帶激勵信號S80而解碼高頻帶編碼參數(shù)S60，以產(chǎn)生高頻帶信號SIOO。在此實例中，窄頻帶解碼器B110經(jīng)配置以將窄頻帶激勵信號S80提供到高頻帶解碼器B200。濾波器組B120經(jīng)配置以將窄頻帶信號S90與高頻帶信號S100組合以產(chǎn)生寬頻帶語音信號SllO。
圖2b是寬頻帶語音解碼器B100的實施方案B102的方框圖，寬頻帶語音解碼器B100 包含多路分解器B130，其經(jīng)配置以從多路復用信號S70中產(chǎn)生經(jīng)編碼信號S40、 S50和 S60。一種包含解碼器B102的設備可包含經(jīng)配置以從例如有線、光學或無線信道的傳輸信道接收多路復用信號S70的電路。此設備還可經(jīng)配置以對信號執(zhí)行一個或一個以上信道解碼操作，例如誤差校正解碼(例如，速率兼容巻積解碼)和/或誤差檢測解碼(例如，循環(huán)冗余解碼)，和/或一層或一層以上網(wǎng)絡協(xié)議解碼(例如，以太網(wǎng)、TCP/IP、 cdma2000)。
濾波器組A110經(jīng)配置以根據(jù)分裂頻帶方案對輸入信號進行濾波以產(chǎn)生低頻率子頻帶和高頻率子頻帶。視特定應用的設計標準而定，輸出子頻帶可具有相等或不等的帶寬且可能重疊或不重疊。產(chǎn)生兩個以上子頻帶的濾波器組A110配置也是可能的。舉例來說，此濾波器組可經(jīng)配置以產(chǎn)生一個或一個以上低頻帶信號，所述低頻帶信號包含處于窄頻帶信號S20的頻率范圍以下的頻率范圍(例如50-300 Hz的范圍)內的分量。此濾波器組也可能經(jīng)配置以產(chǎn)生一個或一個以上額外高頻帶信號，所述額外高頻帶信號包含處于高頻帶信號S30的頻率范圍以上的頻率范圍(例如14-50、 16-20或16-32 kHz的范圍) 內的分量。在此情況下，可實施寬頻帶語音編碼器A100以單獨編碼此信號(一個或多個)，且多路復用器A130可經(jīng)配置以將額外經(jīng)編碼信號(一個或多個)包含在多路復用信號 S70中(例如，作為可分離部分)。
圖3a展示濾波器組A110的實施方案A112的方框圖，濾波器組A110經(jīng)配置以產(chǎn)生具有減小的取樣速率的兩個子頻帶信號。濾波器組A110經(jīng)配置以接收具有高頻率(或高頻帶)部分和低頻率(或低頻帶)部分的寬頻帶語音信號SIO。濾波器組A112包含經(jīng)配置以接收寬頻帶語音信號S10并產(chǎn)生窄頻帶語音信號S20的低頻帶處理路徑，和經(jīng)配置以接收寬頻帶語音信號SIO并產(chǎn)生高頻帶語音信號S30的高頻帶處理路徑。低通濾波器
110對寬頻帶語音信號S10進行濾波以通過選定的低頻率子頻帶，且高通濾波器130對寬頻帶語音信號S10進行濾波以通過選定的高頻率子頻帶。因為兩個子頻帶信號的帶寬比寬頻帶語音信號S10窄，所以其取樣速率可在一定程度上減小而無信息損失。向下取樣器120根據(jù)所需的抽選因數(shù)(例如，通過去除信號的樣本和/或用平均值代替樣本)來減小低通信號的取樣速率，且向下取樣器140同樣地根據(jù)另一所需的抽選因數(shù)來減小高通信號的取樣速率。
圖3b展示濾波器組B120的相應實施方案B122的方框圖。向上取樣器150 (例如，通過零塞入和/或通過復制樣本)增加窄頻帶信號S90的取樣速率，且低通濾波器160對向上取樣信號進行濾波以僅通過低頻帶部分(例如，以防止混疊)。同樣，向上取樣器 170增加高頻帶信號S100的取樣速率，且高通濾波器180對向上取樣信號進行濾波以僅通過高頻帶部分。接著，將兩個通頻帶信號求和以形成寬頻帶語音信號SllO。在解碼器 B100的一些實施方案中，濾波器組B120經(jīng)配置以根據(jù)由高頻帶解碼器B200接收和/或計算的一個或一個以上權數(shù)來產(chǎn)生兩個通頻帶信號的加權總和。還預期將兩個以上通頻帶信號組合的濾波器組B120配置。
濾波器110、 130、 160、 180的每一者可實施為有限脈沖響應(FIR)濾波器或實施為無限脈沖響應(IIR)濾波器。編碼器濾波器IIO和130的頻率響應可具有抑止頻帶與通頻帶之間的對稱或相異形狀的轉變區(qū)。同樣，解碼器濾波器160和180的頻率響應可具有抑止頻帶與通頻帶之間的對稱或相異形狀的轉變區(qū)?？赡苄枰?但不是嚴格有必要) 低通濾波器110與低通濾波器160具有相同響應，且高通濾波器130與高通濾波器180 具有相同響應。在一個實例中，兩個濾波器對110、 130和160、 180是正交鏡像濾波器 (QMF)組，其中濾波器對HO、 130與濾波器對160、 180具有相同系數(shù)。
在典型實例中，低通濾波器IIO具有包含300-3400 Hz的有限PSTN范圍的通頻帶(例如，0到4kHz的頻帶)。圖4a和4b展示兩個不同實施實例中寬頻帶語音信號S10、窄頻帶信號S20和高頻帶信號S30的相對帶寬。在這兩個特定實例中，寬頻帶語音信號S10 具有16 kHz的取樣速率(表示0到8 kHz范圍內的頻率分量)，且窄頻帶信號S20具有8 kHz的取樣速率(表示0到4kHz范圍內的頻率分量)。
在圖4a的實例中，兩個子頻帶之間不存在明顯重疊。此實例中所示的高頻帶信號 S30可通過使用具有4-8kHz的通頻帶的高通濾波器130來獲得。在此情況下，可能需要通過以2為因數(shù)向下取樣經(jīng)濾波信號而將取樣速率減小為8kHz。可預期此操作會顯著減小對信號的進一步處理操作的計算復雜性，此操作將把通頻帶能量下移到0到4 kHz范圍內而無信息損失。
在圖4b的替代實例中，上部和下部子頻帶具有明顯重疊，使得兩個子頻帶信號均描述3.5至lj 4kHz的區(qū)域。此實例中的高頻帶信號S30可通過使用具有3.5-7 kHz的通頻帶的高通濾波器130來獲得。在此情況下，可能需要通過以16/7為因數(shù)向下取樣經(jīng)濾波信號而將取樣速率減小為7 kHz。可預期此操作會顯著減小對信號的進一步處理操作的計算復雜性，此操作將把通頻帶能量下移到0到3.5 kHz范圍內而無信息損失。
在典型電話通信手機中，一個或一個以上變換器(即，麥克風和耳機或揚聲器)缺乏7-8 kHz的頻率范圍上的明顯響應。在圖4b的實例中，寬頻帶語音信號S10的處于7 與8 kHz之間的部分不包含在經(jīng)編碼信號中。高通濾波器130的其它特定實例具有3.5-7.5 kHz禾B 3.5-8 kHz的通頻帶。
在一些實施方案中，如在圖4b的實例中在子頻帶之間提供重疊允許使用在重疊區(qū)上具有平滑衰減的低通和/或高通濾波器。此類濾波器與具有較急劇或"磚墻式(brick-wall)" 響應的濾波器相比，通常較易設計，計算上不太復雜，且/或引起的延遲較少。具有急劇轉變區(qū)的濾波器往往比具有平滑衰減的類似等級的濾波器具有更高的旁瓣(這可能引起混疊)。具有急劇轉變區(qū)的濾波器還可能具有長脈沖響應，這可能引起振鈴假象。對于具有一個或一個以上IIR濾波器的濾波器組實施方案，允許重疊區(qū)上的平滑衰減可使得能夠使用極點較遠離單位圓的濾波器(一個或多個)，這對于確保穩(wěn)定的定點實施方案可能較重要。
子頻帶重疊允許低頻帶與高頻帶的平滑混合，這可導致較少的可聽到的假象，減少混疊，且/或使一個頻帶到另一頻帶的轉變不太明顯。此外，窄頻帶編碼器A120'(例如，波形編碼器)的編碼效率可隨著頻率不斷增加而下降。舉例來說，可能在低位速率下，尤其在存在背景噪聲的情況下減小窄頻帶編碼器的編碼質量。在此類情況下，提供子頻帶重疊可提高重疊區(qū)中復制的頻率分量的質量。
此外，子頻帶重疊允許低頻帶與高頻帶的平滑混合，其可能導致較少的可聽到的假象，減少混疊，且/或使一個頻帶到另一頻帶的轉變不太明顯。此特征對于窄頻帶編碼器 A120和高頻帶編碼器A200根據(jù)不同編碼方法操作的實施方案可能尤其合乎需要。舉例來說，不同編碼技術可產(chǎn)生聽起來非常不同的信號。以密碼本索引形式編碼頻譜包絡的編碼器可產(chǎn)生具有與改為編碼幅值譜的編碼器不同的聲音的信號。時域編碼器(例如，脈沖-代碼調制或PCM編碼器)可產(chǎn)生具有與頻域編碼器不同的聲音的信號。以頻譜包絡和相應殘留信號的表示形式編碼信號的編碼器可產(chǎn)生具有與僅以頻譜包絡表示形式編
碼信號的編碼器不同的聲音的信號。將信號編碼為其波形的表示形式的編碼器可產(chǎn)生具有與來自正弦編碼器的輸出不同的聲音的輸出。在此類情況下，使用具有急劇轉變區(qū)的濾波器來界定非重疊子頻帶可能導致合成的寬頻帶信號中子頻帶之間的轉變較突然且感覺上較明顯。
盡管子頻帶技術中通常使用具有互補重疊頻率響應的QMF濾波器組，但此類濾波器不適于本文描述的寬頻帶編碼實施方案中的至少一些實施方案。編碼器處的QMF濾波器組經(jīng)配置以產(chǎn)生較大程度的混疊，所述混疊在解碼器處的相應QMF濾波器組中被消去。此配置可能不適于信號招致濾波器組之間的大量失真的應用，因為失真可減小混疊消去性質的效力。舉例來說，本文描述的應用包含經(jīng)配置以在非常低的位速率下操作的編碼實施方案。由于位速率非常低，所以經(jīng)解碼信號很可能與原始信號相比呈現(xiàn)為明顯失真，使得QMF濾波器組的使用可導致未消去的混疊。使用QMF濾波器組的應用通常具有較高位速率(例如，對于AMR超過12kbps，且對于G722超過64 kbps)。
另外，編碼器可經(jīng)配置以產(chǎn)生感覺上類似于原始信號但實際上顯著不同于原始信號的合成信號。舉例來說，如本文所描述從窄頻帶殘留中導出高頻帶激勵的編碼器可產(chǎn)生此信號，因為經(jīng)解碼信號中可能完全不存在實際高頻帶殘留。在此類應用中使用QMF濾波器組可導致由未消去的混疊引起的較大程度的失真。
如果受影響子頻帶較窄，那么可減小QMF混疊引起的失真量，因為混疊的影響限于與子頻帶寬度相等的帶寬。然而，對于本文描述的其中每一子頻帶包含寬頻帶帶寬的約一半的實例，由未消去的混疊引起的失真可能影響信號的大部分。信號的質量也可能受上面發(fā)生未消去的混疊的頻帶的位置影響。舉例來說，寬頻帶語音信號中心附近(例如， 3與4kHz之間)產(chǎn)生的失真可能比信號邊緣附近(例如，6kHz以上)發(fā)生的失真有害得多。
雖然QMF濾波器組的濾波器的響應彼此嚴格相關，但濾波器組A110和B120的低頻帶和高頻帶路徑可經(jīng)配置以具有除兩個子頻帶的重疊外完全不相關的頻譜。我們將兩個子頻帶的重疊定義為高頻帶濾波器的頻率響應下降到-20 dB的點至低頻帶濾波器的頻率響應下降到-20dB的點的距離。在濾波器組A110和/或B120的各種實例中，此重疊范圍為約200 Hz到約1 kHz。約400到約600 Hz的范圍可表示編碼效率與感知平滑度之間的理想折衷。在上文提及的一個特定實例中，重疊在500Hz附近。
可能需要實施濾波器組A112和/或B122來在若干階段執(zhí)行圖4a和4b中說明的操作。舉例來說，圖4c展示濾波器組A112的實施方案A114的方框圖，實施方案A114使用一
系列內插、再取樣、抽選和其它操作來執(zhí)行功能等效的高通濾波和向下取樣操作。此類實施方案可較易設計且/或可允許再使用邏輯和/或代碼的功能塊。舉例來說，可使用相同功能塊來執(zhí)行如圖4c所示至14 kHz的抽選以及至7 kHz的抽選的操作?？赏ㄟ^將信號
與函數(shù)e,或序列(-iy相乘來實施頻譜反轉操作，所述序列(-l)11的值在+1與-1之間交
替。頻譜成形操作可實施為經(jīng)配置以使信號成形從而獲得所需的總體濾波器響應的低通濾波器。
注意到，由于頻譜反轉操作的緣故，高頻帶信號S30的頻譜反轉。可相應地配置編碼器和相應解碼器中的后續(xù)操作。舉例來說，本文描述的高頻帶激勵發(fā)生器A300可經(jīng)配置以產(chǎn)生同樣具有頻譜反轉形式的高頻帶激勵信號S120。
圖4d展示濾波器組B122的實施方案B124的方框圖，濾波器組B122使用一系列內插、再取樣和其它操作來執(zhí)行功能等效的向上取樣和高通濾波操作。濾波器組B124包含高頻帶中的頻譜反轉操作，其使與例如編碼器的濾波器組(例如，濾波器組A114)中執(zhí) 行的類似的操作反轉。在此特定實例中，濾波器組B124還包含低頻帶和高頻帶中的陷波濾波器，其削弱7100 Hz處的信號分量，但此類濾波器是任選的且不需要包含此類濾波器。與此一同申請的代理人案號為050551的專利申請案"SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING"包含關于濾波器組A110和B120的特定實施方案的元件的響應的額外描述和圖式，且此材料在此以引用的方式并入。
窄頻帶編碼器A120根據(jù)源-濾波器模型而實施，其將輸入語音信號編碼為(A) — 組描述濾波器的參數(shù)和(B)驅動所描述的濾波器產(chǎn)生輸入語音信號的合成復制物的激勵信號。圖5a展示語音信號的頻譜包絡的實例。表現(xiàn)此頻譜包絡的特征的峰值表示聲域的諧振且稱為共振峰。大多數(shù)語音編碼器至少將此粗略譜結構編碼為一組參數(shù)(例如，濾波器系數(shù))。
圖5b展示如應用于窄頻帶信號S20的頻譜包絡的編碼的基礎源-濾波器配置的實例。分析模塊計算描述對應于一段時間(通常20毫秒)內的語音聲音的濾波器的一組參數(shù)。根據(jù)那些濾波器參數(shù)配置的白化濾波器(也稱為分析或預測誤差濾波器)去除頻譜包絡以對信號進行頻譜整平。所得的白化信號(也稱為殘留)與原始語音信號相比，具有較少能量且因此變化較小并且較易于編碼。由于對殘留信號編碼引起的誤差還可能較均勻地散布在頻譜上。濾波器參數(shù)和殘留通常經(jīng)過量化以用于在信道上有效傳輸。在解碼器處，根據(jù)濾波器參數(shù)配置的合成濾波器由基于殘留的信號激勵以產(chǎn)生原始語音聲音的合成版本。合成濾波器通常經(jīng)配置以具有轉移函數(shù)，所述轉移函數(shù)是白化濾波器的轉移函
數(shù)的反轉形式。
圖6展示窄頻帶編碼器A120的基礎實施方案A122的方框圖。在此實例中，線性預測編碼(LPC)分析模塊210將窄頻帶信號S20的頻譜包絡編碼為一組線性預測(LP) 系數(shù)(例如，全極濾波器的系數(shù)1/A(z))。分析模塊通常將輸入信號處理為一系列非重疊幀，其中為每一幀計算一組新的系數(shù)。幀周期通常是可預期信號在本地靜止的周期；一個常見實例為20毫秒(等效于8 kHz的取樣速率下160個樣本)。在一個實例中，LPC 分析模塊210經(jīng)配置以計算一組10個LP濾波器系數(shù)以描述每一20毫秒幀的共振峰結構。也可能實施分析模塊以將輸入信號處理為一系列重疊幀。
分析模塊可經(jīng)配置以直接分析每一幀的樣本，或者可首先根據(jù)窗口函數(shù)(例如，漢明窗口)對樣本進行加權。也可在大于幀的窗口 (例如，30毫秒窗口)上執(zhí)行分析。此窗口可對稱(例如5-20-5，使得其包含緊接著20毫秒幀之前和之后的5毫秒)或不對稱 (例如10-20，使得其包含先前幀的最后10毫秒)。LPC分析模塊通常經(jīng)配置以使用 Levinson-Durbin遞歸式或Leroux-Gueguen算法計算LP濾波器系數(shù)。在另一實施方案中，分析模塊可經(jīng)配置以計算每一幀的一組倒譜系數(shù)而不是一組LP濾波器系數(shù)。
編碼器A120的輸出速率可通過量化濾波器系數(shù)而顯著減小，且對復制質量的影響相對較小。線性預測濾波器系數(shù)難以有效量化，且通常映射為另一表示形式，例如線譜對 (LSP)或線譜頻率(LSF)，以用于量化和/或熵編碼。在圖6的實例中，LP濾波器系數(shù) -LSF變換220將所述組LP濾波器系數(shù)變換為一組相應的LSF。 LP濾波器系數(shù)的其它一對一表示形式包含部分自相關系數(shù)、對數(shù)面積比值、導抗譜對(ISP)和導抗譜頻率(ISF)，其用于GSM (全球移動通信系統(tǒng))AMR-WB (自適應多速寬頻帶)編譯碼器中。通常，一組LP濾波器系數(shù)與一組相應的LSF之間的變換是可逆的，但實施例還包含變換不可在無誤差情況下可逆的編碼器A120實施方案。
量化器230經(jīng)配置以量化所述組窄頻帶LSF (或其它系數(shù)表示形式)，且窄頻帶編碼器A122經(jīng)配置以輸出此量化的結果作為窄頻帶濾波器參數(shù)S40。此量化器通常包含向量量化器，其將輸入向量編碼為對于表或密碼本中的相應向量條目的索引。
如圖6所示，窄頻帶編碼器A122還通過使窄頻帶信號S20通過根據(jù)所述組濾波器系數(shù)配置的白化濾波器260 (也稱為分析或預測誤差濾波器)來產(chǎn)生殘留信號。在此特定實例中，白化濾波器260實施為FIR濾波器，但也可使用IIR實施方案。此殘留信號通常將含有窄頻帶濾波器參數(shù)S40中未表示的感覺上較重要的語音幀信息，例如與音調有關的長期結構。量化器270經(jīng)配置以計算此殘留信號的量化表示形式以作為經(jīng)編碼的窄頻帶激勵信號S50輸出。此量化器通常包含向量量化器，其將輸入向量編碼為對于表或密碼本中的相應向量條目的索引。或者，此量化器可經(jīng)配置以發(fā)送一個或一個以上參數(shù)，可在解碼器處從所述參數(shù)中動態(tài)地產(chǎn)生向量，而不是如稀疏密碼本方法中一樣從存儲裝置中檢索向量。此方法用于例如代數(shù)CELP (密碼本激勵線性預測)的編碼方案和例如3GPP2 (第三代合作伙伴關系2) EVRC (增強可變速率編譯碼器)的編譯碼器中。
需要窄頻帶編碼器A120根據(jù)將可用于相應窄頻帶解碼器的相同濾波器參數(shù)值來產(chǎn) 生經(jīng)編碼窄頻帶激勵信號。以此方式，所得的經(jīng)編碼窄頻帶激勵信號可能已在某種程度上考慮那些參數(shù)值的不理想性，例如量化誤差。因此，需要使用將在解碼器處可用的相同系數(shù)值來配置白化濾波器。在如圖6所示的編碼器A122的基礎實例中，反轉量化器 240對窄頻帶編碼參數(shù)S40解量化，LSF-LP濾波器系數(shù)變換250將所得值映射回一組相應的LP濾波器系數(shù)，且此組系數(shù)用于配置白化濾波器260以產(chǎn)生由量化器270量化的殘留信號。
窄頻帶編碼器A120的一些實施方案經(jīng)配置以通過從一組密碼本向量中識別出與殘留信號最佳匹配的一個向量來計算經(jīng)編碼窄頻帶激勵信號S50。然而，注意到，窄頻帶編碼器A120也可經(jīng)實施以計算殘留信號的量化表示形式而不實際上產(chǎn)生殘留信號。舉例來說，窄頻帶編碼器A120可經(jīng)配置以使用許多密碼本向量來產(chǎn)生相應的合成信號(例如，根據(jù)一組當前濾波器參數(shù))，并選擇與感知加權域中和原始窄頻帶信號S20最佳匹配的所產(chǎn)生信號相關聯(lián)的密碼本向量。
圖7展示窄頻帶解碼器B110的實施方案B112的方框圖。反轉量化器310對窄頻帶濾波器參數(shù)S40解量化(在此情況下，解量化為一組LSF)，且LSF-LP濾波器系數(shù)變換 320將LSF變換為一組濾波器系數(shù)(例如，如上文參照窄頻帶編碼器A122的反轉量化器 240和變換250所描述)。反轉量化器340對窄頻帶殘留信號S40解量化以產(chǎn)生窄頻帶激勵信號S80?；跒V波器系數(shù)和窄頻帶激勵信號S80,窄頻帶合成濾波器330合成窄頻帶信號S90。換句話說，窄頻帶合成濾波器330經(jīng)配置以根據(jù)解量化濾波器系數(shù)對窄頻帶激勵信號S80進行頻譜成形，以產(chǎn)生窄頻帶信號S90。窄頻帶解碼器B112還將窄頻帶激勵信號S80提供到高頻帶編碼器A200，高頻帶編碼器A200使用窄頻帶激勵信號S80來導出高頻帶激勵信號S120，如本文所描述。在下文描述的一些實施方案中，窄頻帶解碼器B110可經(jīng)配置以將與窄頻帶信號有關的額外信息(例如，頻譜傾斜、音調增益和滯后，以及語音模式)提供到高頻帶解碼器B200。
窄頻帶編碼器A122和窄頻帶解碼器B112的系統(tǒng)是合成分析語音編譯碼器的基礎實
例。密碼本激勵線性預測(CELP)編碼是合成分析編碼的一個普遍系列，且此類編碼器的實施方案可執(zhí)行殘留的波形編碼，其中包含例如從固定和自適應密碼本中選擇條目的操作、誤差最小化操作和/或感知加權操作。合成分析編碼的其它實施方案包含混合激勵線性預領lj (MELP)、代數(shù)CELP (ACELP)、松弛CELP (RCELP)、夫見貝U脈沖激勵(RPE)、多脈沖CELP (MPE)和向量和激勵線性預測(VSELP)編碼。相關編碼方法包含多頻帶激勵(MBE)和原型波形內插(PWI)編碼。標準合成分析語音編譯碼器的實例包含使用殘留激勵線性預測(RELP)的ETSI (歐洲電信標準協(xié)會)GSM全速率編譯碼器(GSM 06.10)、 GSM增強全速率編譯碼器(ETSI-GSM 06.60)、 ITU (國際電信聯(lián)盟)標準11.8 kb/s G.729 Annex E編碼器、IS-136的IS (臨時標準)641編譯碼器(時分多址方案)、 GSM自適應多速率(GSM-AMR)編譯碼器，禾B 4GV (第四代Vocoder )編譯碼器 (加州圣地亞哥市的高通公司(QUALCOMM Incorporated, San Diego， CA))。窄頻帶編碼器A120和相應的解碼器B10可根據(jù)這些技術中的任一者或任何其它語音編碼技術(已知的或待開發(fā)的)實施，所述語音編碼技術將語音信號表示為(A) —組描述濾波器的參數(shù)和(B)用于驅動所描述的濾波器復制語音信號的激勵信號。
即使在白化濾波器已從窄頻帶信號S20中去除粗略頻譜包絡之后，也可能保留相當大量的精細諧波結構(尤其對于濁語音來說)。圖8a展示濁音信號(例如，元音)的殘留信號(如可能由白化濾波器產(chǎn)生)的一個實例的頻譜曲線。此實例中可見的周期性結構與音調有關，且同一說話者發(fā)出的不同濁音可能具有不同的共振峰結構但具有類似的音調結構。圖8b展示此殘留信號的實例的時域曲線，其展示音調脈沖的時間序列。
可通過使用一個或一個以上參數(shù)值編碼音調結構的特性來增加編碼效率和/或語音質量。音調結構的一個重要特性是第一諧波的頻率(也稱為基頻)，其通常在60到400 Hz 范圍內。此特性通常編碼為基頻的反轉形式，也稱為音調滯后(pitch lag)。音調滯后指示一個音調周期中樣本的數(shù)目，且可編碼為一個或一個以上密碼本索引。來自男性說話者的語音信號往往比來自女性說話者的語音信號具有更大的音調滯后。
與音調結構有關的另一信號特性是周期性，其指示諧波結構的強度，或換句話說，信號為諧波或非諧波的程度。周期性的兩個典型指示符是零交叉和標準化自相關函數(shù) (NACF)。周期性也可由音調增益來指示，所述音調增益通常編碼為密碼本增益(例如，量化自適應密碼本增益)。
窄頻帶編碼器A120可包含經(jīng)配置以編碼窄頻帶信號S20的長期諧波結構的一個或一個以上模塊。如圖9所示，可使用的一個典型CELP范例包含開放式回路LPC分析模塊，其編碼短期特性或粗略頻譜包絡，之后是閉合式回路長期預測分析階段，所述階段編碼精細音調或諧波結構。短期特性編碼為濾波器系數(shù)，且長期特性編碼為例如音調滯后和音調增益的參數(shù)的值。舉例來說，窄頻帶編碼器A120可經(jīng)配置以便以包含一個或一個以上密碼本索引(例如，固定密碼本索引和自適應密碼本索引)和相應增益值的形式輸出經(jīng)編碼窄頻帶激勵信號S50。窄頻帶殘留信號的這種量化表示形式的計算(例如，通過量化器270)可包含選擇這些索引和計算這些值。音調結構的編碼還可包含內插音調原型波形，所述操作可包含計算連續(xù)音調脈沖之間的差。可針對對應于清語音(其通常類似于噪聲且未系統(tǒng)化)的幀禁用長期結構的建模。
根據(jù)圖9所示的范例的窄頻帶解碼器B110的實施方案可經(jīng)配置以在長期結構(音調或諧波結構)已恢復之后將窄頻帶激勵信號S80輸出到高頻帶解碼器B200。舉例來說，此解碼器可經(jīng)配置以輸出窄頻帶激勵信號S80作為經(jīng)編碼窄頻帶激勵信號S50的解量化版本。當然，也可能實施窄頻帶解碼器BllO，使得高頻帶解碼器B200執(zhí)行經(jīng)編碼窄頻帶激勵信號S50的解量化以獲得窄頻帶激勵信號S80。
在根據(jù)圖9所示的范例的寬頻帶語音編碼器A100的實施方案中，高頻帶編碼器A200
可經(jīng)配置以接收由短期分析或白化濾波器產(chǎn)生的窄頻帶激勵信號。換句話說，窄頻帶編碼器A120可經(jīng)配置以在編碼長期結構之前將窄頻帶激勵信號輸出到高頻帶編碼器 A200。然而，高頻帶編碼器A200需要從窄頻帶信道接收將由高頻帶解碼器B200接收的相同編碼信息，使得高頻帶編碼器A200產(chǎn)生的編碼參數(shù)可能已在某種程度上考慮所述信息的不理想性。因此，可能優(yōu)選的是，高頻帶編碼器A200從待由寬頻帶語音編碼器A100 輸出的相同參數(shù)化和/或量化經(jīng)編碼窄頻帶激勵信號S50中重建窄頻帶激勵信號S80。此方法的一個潛在優(yōu)點是較準確地計算下文描述的高頻帶增益因數(shù)S60b。
除了描述窄頻帶信號S20的短期和/或長期結構的參數(shù)外，窄頻帶編碼器A120還可產(chǎn)生與窄頻帶信號S20的其它特性有關的參數(shù)值。這些值(其可能經(jīng)適宜量化以由寬頻帶語音編碼器A100輸出)可包含在窄頻帶濾波器參數(shù)S40中或單獨輸出。高頻帶編碼器A200也可經(jīng)配置以根據(jù)這些額外參數(shù)中的一者或一者以上(例如，解量化之后)計算高頻帶編碼參數(shù)S60。在寬頻帶語音解碼器B100處，高頻帶解碼器B200可經(jīng)配置以經(jīng) 由窄頻帶解碼器BllO (例如，解量化之后)接收參數(shù)值。或者，高頻帶解碼器B200可經(jīng)配置以直接接收(且可能用于解量化)參數(shù)值。
在額外窄頻帶編碼參數(shù)的一個實例中，窄頻帶編碼器A120產(chǎn)生每一幀的頻譜傾斜和語音模式參數(shù)的值。頻譜傾斜與通頻帶上頻譜包絡的形狀有關，且通常由量化第一反射
系數(shù)表示。對于大多數(shù)濁音，頻譜能量隨著頻率的不斷增加而減小，使得第一反射系數(shù) 為負且可接近-1。大多數(shù)清音具有平整的頻譜，從而使得第一反射系數(shù)接近零，或者在高頻率下具有較多能量，從而使得第一反射系數(shù)為正且可接近+1。
語音模式(也稱為發(fā)聲模式)指示當前幀表示濁語音還是清語音。此參數(shù)可具有二進制值，其基于周期性的一個或一個以上指標(例如，零交叉、NACF、音調增益)和/ 或幀的聲音活動(例如，此指標與閾值之間的關系)。在其它實施方案中，語音模式參數(shù) 具有一個或一個以上其它狀態(tài)以指示例如無聲或背景噪聲或無聲與濁語音之間的轉變的模式。
高頻帶編碼器A200經(jīng)配置以根據(jù)源-濾波器模型來編碼高頻帶信號S30，其中此濾波器的激勵是基于經(jīng)編碼窄頻帶激勵信號。圖10展示高頻帶編碼器A200的實施方案 A202的方框圖，高頻帶編碼器A200經(jīng)配置以產(chǎn)生包含高頻帶濾波器參數(shù)S60a和高頻帶增益因數(shù)S60b的高頻帶編碼參數(shù)S60流。高頻帶激勵發(fā)生器A300從經(jīng)編碼窄頻帶激勵信號S50中導出高頻帶激勵信號S120。分析模塊A210產(chǎn)生描述高頻帶信號S30的頻譜包絡的一組參數(shù)值。在此特定實例中，分析模塊A210經(jīng)配置以執(zhí)行LPC分析以便為高頻帶信號S30的每一幀產(chǎn)生一組LP濾波器系數(shù)。線性預測濾波器系數(shù)-LSF變換410將所述組LP濾波器系數(shù)變換為一組相應的LSF。如上文參照分析模塊210和變換220所述，分析模塊A210和/或變換410可經(jīng)配置以使用其它系數(shù)組(例如，倒譜系數(shù))和/或系數(shù) 表示形式(例如，ISP)。
量化器420經(jīng)配置以量化所述組高頻帶LSF (或其它系數(shù)表示形式，例如ISP),且高頻帶編碼器A202經(jīng)配置以輸出此量化的結果作為高頻帶濾波器參數(shù)S60a。此量化器通常包含向量量化器，其將輸入向量編碼為對于表或密碼本中的相應向量條目的索引。
高頻帶編碼器A202還包含合成濾波器A220,其經(jīng)配置以根據(jù)分析模塊A210產(chǎn)生的高頻帶激勵信號S120和經(jīng)編碼頻譜包絡(例如，所述組LP濾波器系數(shù))來產(chǎn)生合成高頻帶信號S130。合成濾波器A220通常實施為IIR濾波器，但也可使用FIR實施方案。在特定實例中，合成濾波器A220實施為六次線性自回歸濾波器。
高頻帶增益因數(shù)計算器A230計算原始高頻帶信號S30與合成高頻帶信號S130的電平之間的一個或一個以上差，以指定幀的增益包絡。量化器430可實施為將輸入向量編碼為對于表或密碼本中的相應向量條目的索引的向量量化器，其量化指定增益包絡的值 (一或多個)，且高頻帶編碼器A202經(jīng)配置以輸出此量化的結果作為高頻帶增益因數(shù) S60b。
在如圖IO所示的實施方案中，合成濾波器A220經(jīng)配置以從分析模塊A210接收濾波器系數(shù)。高頻帶編碼器A202的替代實施方案包含反轉量化器和反轉變換，其經(jīng)配置以從高頻帶濾波器參數(shù)S60a中解碼濾波器系數(shù)，且在此情況下合成濾波器A220經(jīng)配置以改為接收經(jīng)解碼濾波器系數(shù)。此替代配置可支持由高頻帶增益計算器A230較準確地計算增益包絡。
在一個特定實例中，分析模塊A210和高頻帶增益計算器A230分別每幀輸出一組六個LSF和一組五個增益值，使得可僅用每幀十一個額外值來實現(xiàn)窄頻帶信號S20的寬頻帶延伸。耳朵對于高頻率下的頻率誤差往往較不敏感，因而低LPC級的高頻帶編碼可產(chǎn) 生具有可與較高LPC級的窄頻帶編碼相比的感知質量的信號。高頻帶編碼器A200的典型實施方案可經(jīng)配置以每幀輸出8到12位用于頻譜包絡的高質量重建，以及每幀輸出另外8到12位用于時間包絡的高質量重建。在另一特定實例中，分析模塊A210每幀輸出一組八個LSF。
高頻帶編碼器A200的一些實施方案經(jīng)配置以通過以下方式產(chǎn)生高頻帶激勵信號 S120:產(chǎn)生具有高頻帶頻率分量的隨機噪聲信號，并根據(jù)窄頻帶信號S20、窄頻帶激勵信號S80或高頻帶信號S30的時域包絡對噪聲信號進行幅值調制。雖然這種基于噪聲的方法對于清音可產(chǎn)生適當結果，然而，其對于濁音可能不理想，濁音的殘留通常為諧波且因此具有某種周期性結構。
高頻帶激勵發(fā)生器A300經(jīng)配置以通過將窄頻帶激勵信號S80的頻譜延伸到高頻帶頻率范圍中來產(chǎn)生高頻帶激勵信號S120。圖11展示高頻帶激勵發(fā)生器A300的實施方案 A302的方框圖。反轉量化器450經(jīng)配置以解量化經(jīng)編碼窄頻帶激勵信號S50以產(chǎn)生窄頻帶激勵信號S80。頻譜延伸器A400經(jīng)配置以基于窄頻帶激勵信號S80產(chǎn)生諧波延伸信號 S160。組合器470經(jīng)配置以將噪聲發(fā)生器480產(chǎn)生的隨機噪聲信號與包絡計算器460計算的時域包絡組合以產(chǎn)生經(jīng)調制噪聲信號S170。組合器490經(jīng)配置以將諧波延伸信號S60
與經(jīng)調制噪聲信號S170混合以產(chǎn)生高頻帶激勵信號S120。
在一個實例中，頻譜延伸器A400經(jīng)配置以對窄頻帶激勵信號S80執(zhí)行頻譜折疊操作(也稱為鏡射)以產(chǎn)生諧波延伸信號S160。頻譜折疊可由零塞入激勵信號S80執(zhí)行且接著應用高通濾波器來保留偽信號。在另一實例中，頻譜延伸器A400經(jīng)配置以通過將窄頻帶激勵信號S80頻譜轉譯到高頻帶中(例如，經(jīng)由向上取樣，之后與恒定頻率余弦信號相乘)來產(chǎn)生諧波延伸信號S160。
頻譜折疊和轉譯方法可產(chǎn)生諧波結構在相位和/或頻率上與窄頻帶激勵信號S80的原始諧波結構不連續(xù)的頻譜延伸信號。舉例來說，此類方法可產(chǎn)生具有通常不位于基頻的倍數(shù)處的峰值的信號，這可能在重建的語音信號中引起聲音微弱的假象。這些方法往往還產(chǎn)生具有不自然較強音調特性的高頻率諧波。然而，因為PSTN信號可在8 kHz下取樣但帶寬被限制為不大于3400 Hz，所以窄頻帶激勵信號S80的上部頻譜可能含有極少或不含有能量，使得根據(jù)頻譜折疊或頻譜轉譯操作產(chǎn)生的延伸信號可具有3400 Hz以上的頻譜缺陷。
產(chǎn)生諧波延伸信號S160的其它方法包含識別窄頻帶激勵信號S80的一個或一個以上基頻，和根據(jù)所述信息產(chǎn)生諧音。舉例來說，激勵信號的諧波結構可由基頻與幅值和相位信息一起描述。高頻帶激勵發(fā)生器A300的另一實施方案基于基頻和幅值(例如，如由音調滯后和音調增益指示)來產(chǎn)生諧波延伸信號S160。然而，除非諧波延伸信號與窄頻帶激勵信號S80在相位上相干，否則所得的經(jīng)解碼語音的質量可能不可接受。
可使用非線性函數(shù)來產(chǎn)生與窄頻帶激勵相位上相干并保持諧波結構而沒有相位不連續(xù)性的高頻帶激勵信號。非線性函數(shù)還可提供高頻率諧波之間的增加的噪聲電平，其往往比通過例如頻譜折疊和頻譜轉譯的方法產(chǎn)生的音調高頻率諧波聽起來更為自然?？捎?頻譜延伸器A400的各種實施方案應用的典型無記憶非線性函數(shù)包含絕對值函數(shù)(也稱為全波整流)、半波整流、平方、立方和削波。頻譜延伸器A400的其它實施方案可經(jīng)配置以應用具有記憶的非線性函數(shù)。
圖12是頻譜延伸器A400的實施方案A402的方框圖，頻譜延伸器A400經(jīng)配置以應用非線性函數(shù)來延伸窄頻帶激勵信號S80的頻譜。向上取樣器510經(jīng)配置以對窄頻帶激勵信號S80進行向上取樣?？赡苄枰獙π盘栠M行充分向上取樣以使應用非線性函數(shù)時的混疊最小化。在一個特定實例中，向上取樣器510以8為因數(shù)對信號進行向上取樣。向上取樣器510可經(jīng)配置以通過對輸入信號進行零塞入并對結果進行低通濾波來執(zhí)行向上取樣操作。非線性函數(shù)計算器520經(jīng)配置以將非線性函數(shù)應用于經(jīng)向上取樣信號。對于頻譜延伸(例如，平方)而言，絕對值函數(shù)相對于其它非線性函數(shù)的一個潛在優(yōu)點是，不需要能量標準化。在一些實施方案中，可通過剝離或清除每一樣本的符號位來有效地應用絕對值函數(shù)。非線性函數(shù)計算器520還可經(jīng)配置以執(zhí)行經(jīng)向上取樣或頻譜延伸信號的幅值偏差。
向下取樣器530經(jīng)配置以對應用非線性函數(shù)的頻譜延伸結果進行向下取樣。向下取樣器530可能需要執(zhí)行帶通濾波操作以在減小取樣速率(例如，以便減小或避免由于不必要圖像引起的混疊或訛誤)之前選擇頻譜延伸信號的所需頻帶。向下取樣器530可能
還需要在一個以上階段減小取樣速率。
圖12a是展示頻譜延伸操作的一個實例中各點處的信號頻譜的圖，其中頻率標度在各曲線上相同。曲線(a)展示窄頻帶激勵信號S80的一個實例的頻譜。曲線(b)展示信號S80 己被以8為因數(shù)向上取樣之后的頻譜。曲線(c)展示應用非線性函數(shù)之后的延伸頻譜的實例。曲線(d)展示低通濾波之后的頻譜。在此實例中，通頻帶延伸到高頻帶信號S30的頻率上限(例如，7kHz或8kHz)。
曲線(e)展示向下取樣的第一階段之后的頻譜，其中使取樣速率以4為因數(shù)減小以獲得寬頻帶信號。曲線(f)展示進行高通濾波操作以選擇延伸信號的高頻帶部分之后的頻譜，且曲線(g)展示向下取樣的第二階段之后的頻譜，其中使取樣速率以2為因數(shù)減小。在一個特定實例中，向下取樣器530通過使寬頻帶信號通過濾波器組A112 (或具有相同響應的其它結構或例行程序)的高通濾波器130和向下取樣器140來執(zhí)行高通濾波和向下取樣的第二階段，以產(chǎn)生具有高頻帶信號S30的頻率范圍和取樣速率的頻譜延伸信號。
如曲線(g)中可見，曲線(f)所示的高通信號的向下取樣促使其頻譜反轉。在此實例中，向下取樣器530還經(jīng)配置以對信號執(zhí)行頻譜翻轉操作。曲線(h)展示應用頻譜翻轉操作的
結果，所述頻譜翻轉操作可通過將信號與函數(shù)e》^或序列(-l)n相乘來執(zhí)行，所述序列(-1)11 的值在+1與-l之間交替。此操作等效于在頻域中將信號的數(shù)字頻譜移位距離n。注意到，還可通過以不同次序應用向下取樣和頻譜翻轉操作來獲得相同結果。向上取樣和/或向下取樣的操作還可經(jīng)配置以包含再取樣來獲得具有高頻帶信號S30的取樣速率(例如，7 kHz)的頻譜延伸信號。
如上文注意到，濾波器組A110和B120可經(jīng)實施使得窄頻帶和高頻帶信號S20、 S30 中的一者或兩者在濾波器組A110的輸出處具有頻譜反轉形式，以頻譜反轉形式被編碼和解碼，并在寬頻帶語音信號S110中輸出之前在濾波器組B120處再次頻譜反轉。當然，在此情況下，將不需要如圖12a所示的頻譜翻轉操作，因為高頻帶激勵信號S120將也需要具有頻譜反轉形式。
頻譜延伸器A402執(zhí)行的頻譜延伸操作的向上取樣和向下取樣的各個任務可以許多不同方式配置和安排。舉例來說，圖12b是展示頻譜延伸操作的另一實例中各點處的信號頻譜的圖，其中頻率標度在各曲線上相同。曲線(a)展示窄頻帶激勵信號S80的一個實例的頻譜。曲線(b)展示信號S80己被以2為因數(shù)向上取樣之后的頻譜。曲線(c)展示應用非線性函數(shù)之后的延伸頻譜的實例。在此情況下，接受較高頻率中可能發(fā)生的混疊。
曲線(d)展示頻譜反轉操作之后的頻譜。曲線(e)展示向下取樣的單一階段之后的頻
譜，其中使取樣速率以2為因數(shù)減小以獲得所需頻譜延伸信號。在此實例中，所述信號采取頻譜反轉形式，且可用于處理采取此形式的高頻帶信號S30的高頻帶編碼器A200 的實施方案中。
非線性函數(shù)計算器520產(chǎn)生的頻譜延伸信號很可能隨著頻率增加而幅值明顯降低。頻譜延伸器A402包含頻譜整平器540，其經(jīng)配置以對經(jīng)向下取樣信號執(zhí)行白化操作。頻譜整平器540可經(jīng)配置以執(zhí)行固定白化操作或執(zhí)行自適應白化操作。在自適應白化的特定實例中，頻譜整平器540包含LPC分析模塊，其經(jīng)配置以依據(jù)經(jīng)向下取樣信號計算一組四個濾波器系數(shù)；以及四次分析濾波器，其經(jīng)配置以根據(jù)那些系數(shù)對信號進行白化。頻譜延伸器A400的其它實施方案包含頻譜整平器540在向下取樣器530之前對頻譜延伸信號操作的配置。
可實施高頻帶激勵發(fā)生器A300以輸出諧波延伸信號S160作為高頻帶激勵信號 S120。然而，在一些情況下，僅使用諧波延伸信號作為高頻帶激勵可能導致可聽到的假象。語音的諧波結構在高頻帶中通常不如低頻帶中明顯，且在高頻帶激勵信號中使用過多諧波結構可能導致嗡嗡聲。此假象在來自女性說話者的語音信號中可能尤其明顯。
實施例包含經(jīng)配置以將諧波延伸信號S160與噪聲信號混合的高頻帶激勵發(fā)生器 A300的實施方案。如圖11所示，高頻帶激勵發(fā)生器A302包含噪聲發(fā)生器480，其經(jīng)配置以產(chǎn)生隨機噪聲信號。在一個實例中，噪聲發(fā)生器480經(jīng)配置以產(chǎn)生單位方差白色偽隨機噪聲信號，但在其它實施方案中，噪聲信號不需要為白色的且可具有隨著頻率變化的功率密度。噪聲發(fā)生器480可能需要經(jīng)配置以輸出噪聲信號作為確定性函數(shù)以便可在解碼器處復制其狀態(tài)。舉例來說，噪聲發(fā)生器480可經(jīng)配置以輸出噪聲信號作為早先在相同幀內編碼的信息(例如，窄頻帶濾波器參數(shù)S40和/或經(jīng)編碼窄頻帶激勵信號S50) 的確定性函數(shù)。
在與諧波延伸信號S160混合之前，噪聲發(fā)生器480產(chǎn)生的隨機噪聲信號可經(jīng)幅值調制以具有近似窄頻帶信號S20、高頻帶信號S30、窄頻帶激勵信號S80或諧波延伸信號 S160的隨時間能量分布的時域包絡。如圖ll所示，高頻帶激勵發(fā)生器A302包含組合器 470，其經(jīng)配置以根據(jù)包絡計算器460計算的時域包絡對噪聲發(fā)生器480產(chǎn)生的噪聲信號進行幅值調制。舉例來說，組合器470可實施為乘法器，其經(jīng)配置以根據(jù)包絡計算器460 計算的時域包絡來縮放噪聲發(fā)生器480的輸出以產(chǎn)生經(jīng)調制噪聲信號S170。
如圖13的方框圖所示，在高頻帶激勵發(fā)生器A302的實施方案A304中，包絡計算器460經(jīng)配置以計算諧波延伸信號S160的包絡。如圖14的方框圖所示，在高頻帶激勵
發(fā)生器A302的實施方案A306中，包絡計算器460經(jīng)配置以計算窄頻帶激勵信號S80的包絡。高頻帶激勵發(fā)生器A302的另外的實施方案可以其它方式配置以根據(jù)窄頻帶音調脈沖的位置及時向諧波延伸信號S160添加噪聲。
包絡計算器460可經(jīng)配置以作為一項包含一系列子任務的任務而執(zhí)行包絡計算。圖 15展示此任務的實例T100的流程圖。子任務T110計算包絡待建模的信號(例如，窄頻帶激勵信號S80或諧波延伸信號S160)的幀的每一樣本的平方以產(chǎn)生平方值序列。子任務T120對平方值序列執(zhí)行平滑操作。在一個實例中，子任務T120根據(jù)以下表達式向序列應用一次IIR低通濾波器
y(n) = ax(n) + (l-a)y(n-l), (1)
其中x是濾波器輸入，y是濾波器輸出，n是時域索引，且a是具有0.5與l之間的值的平滑系數(shù)。平滑系數(shù)a的值可為固定的，或者在替代實施方案中，可根據(jù)輸入信號中噪聲的指示而自適應，使得在無噪聲的情況下a較接近l，且在存在噪聲的情況下較接近0.5。子任務T130將平方根函數(shù)應用于經(jīng)平滑序列的每一樣本以產(chǎn)生時域包絡。
包絡計算器460的此實施方案可經(jīng)配置以按照串行和/或并行方式執(zhí)行任務T100的各個子任務。在任務T100的另外的實施方案中，子任務T110之前可以是帶通操作，其經(jīng)配置以選擇包絡待建模的信號的所需頻率部分，例如3-4kHz范圍。
組合器490經(jīng)配置以將諧波延伸信號S160與經(jīng)調制噪聲信號S170混合以產(chǎn)生高頻帶激勵信號S120。組合器4卯的實施方案可經(jīng)配置(例如)以將高頻帶激勵信號S120 計算為諧波延伸信號S160與經(jīng)調制噪聲信號S170的和。組合器490的此實施方案可經(jīng) 配置以通過在求和之前向諧波延伸信號S160和/或向經(jīng)調制噪聲信號S170應用加權因數(shù)，而將高頻帶激勵信號S120計算為加權總和。可根據(jù)一個或一個以上標準來計算每一此類加權因數(shù)，且所述加權因數(shù)可為固定值，或者在逐幀或逐子幀基礎上計算出的自適應值。
圖16展示組合器490的實施方案492的方框圖，所述實施方案492經(jīng)配置以將高頻帶激勵信號S120計算為諧波延伸信號S160與經(jīng)調制噪聲信號S170的加權總和。組合器 492經(jīng)配置以根據(jù)諧波加權因數(shù)S180加權諧波延伸信號S160，根據(jù)噪聲加權因數(shù)S190 加權經(jīng)調制噪聲信號S170，并輸出高頻帶激勵信號S120作為被加權信號的總和。在此實例中，組合器492包含加權因數(shù)計算器550，其經(jīng)配置以計算諧波加權因數(shù)S180和噪聲加權因數(shù)S190。
加權因數(shù)計算器550可經(jīng)配置以根據(jù)高頻帶激勵信號S120中諧波含量與噪聲含量的所需比率來計算加權因數(shù)S180和S190。舉例來說，組合器492可能需要產(chǎn)生高頻帶激勵信號S120以具有與高頻帶信號S30的諧波能量與噪聲能量比相似的諧波能量與噪聲能量比。在加權因數(shù)計算器550的一些實施方案中，根據(jù)與窄頻帶信號S20或窄頻帶殘留信號的周期性有關的一個或一個以上參數(shù)(例如，音調增益和/或語音模式)來計算加權因數(shù)S180、 S190。加權因數(shù)計算器550的此實施方案可經(jīng)配置以向諧波加權因數(shù)S180 指派(例如)與音調增益成正比的值，及/或對于清語音信號比對于濁語音信號向噪聲加權因數(shù)S190指派更高的值。
在其它實施方案中，加權因數(shù)計算器550經(jīng)配置以根據(jù)高頻帶信號S30的周期性指標來計算諧波加權因數(shù)S180和/或噪聲加權因數(shù)S190的值。在一個此類實例中，加權因數(shù)計算器550將諧波加權因數(shù)S180計算為高頻帶信號S30的當前幀或子幀的自相關系數(shù) 的最大值，其中在包含一個音調滯后延遲且不包含零樣本延遲的搜索范圍內執(zhí)行自相關。圖17展示以一個音調滯后延遲為中心并具有不大于一個音調滯后的寬度的長度為ii個樣本的此搜索范圍的實例。
圖17還展示加權因數(shù)計算器550在若干階段計算高頻帶信號S30的周期性指標的另一方法的實例。在第一階段，將當前幀劃分為許多子幀，且針對每一子幀單獨識別自相關系數(shù)為最大時的延遲。如上文所提及，在包含一個音調滯后延遲且不包含零樣本延遲的搜索范圍內執(zhí)行自相關。
在第二階段，通過將相應識別的延遲應用于每一子幀、連接所得的子幀以建立最佳延遲幀、并將諧波加權因數(shù)S180計算為原始幀與最佳延遲幀之間的相關系數(shù)來建立延遲幀。在另一替代實施方案中，加權因數(shù)計算器550將諧波加權因數(shù)S180計算為第一階段中針對每一子幀獲得的最大自相關系數(shù)的平均值。加權因數(shù)計算器550的實施方案還可經(jīng)配置以縮放相關系數(shù)，和/或將其與另一值組合，以計算諧波加權因數(shù)S180的值。
加權因數(shù)計算器550可能需要僅在以其它方式指示幀存在周期性的情況下計算高頻帶信號S30的周期性指標。舉例來說，加權因數(shù)計算器550可經(jīng)配置以根據(jù)當前幀的周期性的另一指示符(例如，音調增益)與閾值之間的關系來計算高頻帶信號S30的周期性指標。在一個實例中，加權因數(shù)計算器550經(jīng)配置以僅當幀的音調增益(例如，窄頻帶殘留的自適應密碼本增益)的值大于0.5 (或者，至少0.5)時才對高頻帶信號S30執(zhí) 行自相關運算。在另一實例中，加權因數(shù)計算器550經(jīng)配置以僅針對具有特定語音模式狀態(tài)的幀(例如，僅針對濁音信號)對高頻帶信號S30執(zhí)行自相關運算。在此類情況下，
加權因數(shù)計算器550可經(jīng)配置以針對具有其它語音模式狀態(tài)和/或較小的音調增益值的幀分派默認加權因數(shù)。
實施例包含經(jīng)配置以根據(jù)不同于周期性或除周期性以外的特性來計算加權因數(shù)的加權因數(shù)計算器550的另外的實施方案。舉例來說，此實施方案可經(jīng)配置以針對具有大音調滯后的語音信號比針對具有小音調滯后的語音信號向噪聲增益因數(shù)S190分派更大的值。加權因數(shù)計算器550的另一此類實施方案經(jīng)配置以根據(jù)處于基頻的倍數(shù)處的信號能量相對于處于其它頻率分量處的信號能量的指標，來確定寬頻帶語音信號S10或高頻帶信號S30的諧度的指標。
寬頻帶語音編碼器A100的一些實施方案經(jīng)配置以基于本文描述的音調增益和/或周期性或諧度的另一指標，來輸出周期性或諧度的指示(例如，指示幀為諧波還是非諧波的l位旗標)。在一個實例中，相應的寬頻帶語音解碼器B100使用此指示來配置例如加權因數(shù)計算的操作。在另一實例中，此指示用于編碼器和/或解碼器處來計算語音模式參數(shù)的值。
可能需要高頻帶激勵發(fā)生器A302產(chǎn)生高頻帶激勵信號S120，使得激勵信號的能量大致不受加權因數(shù)S180和S190的特定值的影響。在此情況下，加權因數(shù)計算器550可經(jīng)配置以計算諧波加權因數(shù)S180或噪聲加權因數(shù)S190的值(或從存儲裝置或高頻帶編碼器A200的另一元件接收此值)，并根據(jù)例如以下表達式導出另一加權因數(shù)的值
(W諧波)2+(W噪聲)、1， (2)
其中W諧波表示諧波加權因數(shù)S180，且W,表示噪聲加權因數(shù)S190?；蛘撸訖嘁?數(shù)計算器550可經(jīng)配置以根據(jù)當前幀或子幀的周期性測量的值從多對加權因數(shù)S180、 S190中選出相應一者，其中所述對經(jīng)預先計算以滿足例如表達式(2)的恒定能量比。對于遵循表達式(2)的加權因數(shù)計算器550的實施方案，諧波加權因數(shù)S180的典型值在約0.7到約l.O范圍內，且噪聲加權因數(shù)S190的典型值在約0.1到約0.7范圍內。加權因數(shù)計算器550的其它實施方案可經(jīng)配置以根據(jù)依據(jù)諧波延伸信號S160與經(jīng)調制噪聲信號S170之間的所需基線加權修改的表達式(2)型式來操作。
當已使用稀疏密碼本(條目大部分為零值的密碼本)來計算殘留的量化表示形式時，合成語音信號中可能發(fā)生假象。尤其當以低位速率編碼窄頻帶信號時，會發(fā)生密碼本稀疏。密碼本稀疏引起的假象通常在時間上是準周期性的，且主要在3 kHz以上發(fā)生。因為人耳在較高頻率下具有較好的時間分辨能力，所以這些假象在高頻帶中可能較明顯。
實施例包含經(jīng)配置以執(zhí)行抗稀疏濾波的高頻帶激勵發(fā)生器A300的實施方案。圖18 展示高頻帶激勵發(fā)生器A302的實施方案A312的方框圖，所述實施方案A312包含抗稀疏濾波器600,其經(jīng)配置以對反轉量化器450產(chǎn)生的經(jīng)解量化窄頻帶激勵信號進行濾波。圖19展示高頻帶激勵發(fā)生器A302的實施方案A314的方框圖，所述實施方案A314包含抗稀疏濾波器600，其經(jīng)配置以對頻譜延伸器A400產(chǎn)生的頻譜延伸信號進行濾波。圖20 展示高頻帶激勵發(fā)生器A302的實施方案A316的方框圖，所述實施方案A316包含抗稀疏濾波器600，其經(jīng)配置以對組合器490的輸出進行濾波以產(chǎn)生高頻帶激勵信號S120。當然，預期并在此明確地揭示將實施方案A304和A306的任一者的特征與實施方案 A312、 A314和A316的任一者的特征組合的高頻帶激勵發(fā)生器A300的實施方案?？瓜?疏濾波器600也可配置在頻譜延伸器A400內例如在頻譜延伸器A402中的元件510、 520、530和540的任一者之后。特別注意到，抗稀疏濾波器600也可用于頻譜延伸器A400 的執(zhí)行頻譜折疊、頻譜轉譯或諧波延伸的實施方案。
抗稀疏濾波器600可經(jīng)配置以改變其輸入信號的相位。舉例來說，抗稀疏濾波器600 可能需要經(jīng)配置和安排，使得高頻帶激勵信號S120的相位隨著時間隨機化或其它方式更為均勻地分布?？赡苓€需要抗稀疏濾波器600的響應為頻譜整平的，使得經(jīng)濾波信號的幅值頻譜不會有相當大的改變。在一個實例中，抗稀疏濾波器600根據(jù)以下表達式實施為具有轉移函數(shù)的全通濾波器
u, 、 -0.7 + z"4 0.6+ z—6
1-0.7z-4 1 + 0.6 。 (3)
此濾波器的一個作用可以是將輸入信號的能量散布開使得其不再僅集中于幾個樣本中。
密碼本稀疏引起的假象通常對于其中殘留包含較少音調信息的類似噪聲的信號較明顯，且對于背景噪聲中的語音也較明顯。稀疏在激勵具有長期結構的情況下通常引起較少假象，且事實上相位修改可引起濁音信號中的噪聲。因此，可能需要配置抗稀疏濾波器600以對清音信號進行濾波并在不作出改變的情況下使至少一些濁音信號通過。清音信號的特征在于低音調增益(例如，量化窄頻帶自適應密碼本增益)和接近零或為正的頻譜傾斜(例如，量化第一反射系數(shù))，從而指示整平或隨著頻率的不斷增加而向上傾斜的頻譜包絡?？瓜∈铻V波器600的典型實施方案經(jīng)配置以對清音(例如，如頻譜傾斜的值所指示)進行濾波，當音調增益低于闊值(或者，不大于閾值)時對濁音進行濾波，且否則在不作出改變的情況下使信號通過。
抗稀疏濾波器600的另外的實施方案包含兩個或兩個以上濾波器，其經(jīng)配置以具有不同的最大相位修改角(例如，高達180度)。在此情況下，抗稀疏濾波器600可經(jīng)配置以根據(jù)音調增益(例如，量化自適應密碼本或LTP增益)的值在這些組成濾波器中進行選擇，以便將較大的最大相位修改角用于具有較低音調增益值的幀?？瓜∈铻V波器600 的實施方案還可包含不同的組成濾波器，其經(jīng)配置以在頻譜的或多或少的部分上修改相位，以便將經(jīng)配置以在輸入信號的較寬頻率范圍上修改相位的濾波器用于具有較低音調增益值的幀。
為了準確地復制經(jīng)編碼語音信號，可能需要使合成寬頻帶語音信號S100的高頻帶與窄頻帶部分的電平之間的比率類似于原始寬頻帶語音信號S10中的所述比率。除了高頻帶編碼參數(shù)S60a表示的頻譜包絡外，高頻帶編碼器A200還可經(jīng)配置以通過指定時間或增益包絡來表征高頻帶信號S30。如圖10所示，高頻帶編碼器A202包含高頻帶增益因數(shù)計算器A230，其經(jīng)配置和安排以根據(jù)高頻帶信號S30與合成高頻帶信號S130之間的關系(例如，所述兩個信號在幀或其某一部分上的能量之間的差或比率)來計算一個或一個以上增益因數(shù)。在高頻帶編碼器A202的其它實施方案中，高頻帶增益計算器A230 可同樣地配置但改為經(jīng)安排以根據(jù)高頻帶信號S30與窄頻帶激勵信號S80或高頻帶激勵信號S120之間的這種時間變化關系來計算增益包絡。
窄頻帶激勵信號S80和高頻帶信號S30的時間包絡很可能類似。因此，編碼基于高頻帶信號S30與窄頻帶激勵信號S80 (或從中導出的信號，例如高頻帶激勵信號S120或合成高頻帶信號S130)之間的關系的增益包絡通常將比編碼僅基于高頻帶信號S30的增益包絡有效。在典型實施方案中，高頻帶編碼器A202經(jīng)配置以輸出為每一幀指定5個增益因數(shù)的8到12位的量化索引。
高頻帶增益因數(shù)計算器A230可經(jīng)配置以作為一項包含一個或一個以上系列的子任務的任務而執(zhí)行增益因數(shù)計算。圖21展示根據(jù)高頻帶信號S30與合成高頻帶信號S130 的相對能量計算相應子幀的增益值的任務的實例T200的流程圖。任務220a和220b計算各個信號的相應子幀的能量。舉例來說，任務220a和220b可經(jīng)配置以將能量計算為各個子幀的樣本的平方的和。任務T230將子幀的增益因數(shù)計算為那些能量的比率的平方根。在此實例中，任務T230將增益因數(shù)計算為子幀上高頻帶信號S30的能量與合成高頻帶信號S130的能量的比率的平方根。
高頻帶增益因數(shù)計算器A230可能需要經(jīng)配置以根據(jù)窗口函數(shù)來計算子幀能量。圖 22展示增益因數(shù)計算任務T200的此實施方案T210的流程圖。任務T215a將窗口函數(shù)應用于高頻帶信號S30,且任務T215b將相同窗口函數(shù)應用于合成高頻帶信號S130。任務 220a和220b的實施方案222a和222b計算各自窗口的能量，且任務T230將子幀的增益因數(shù)計算為能量的比率的平方根。
可能需要應用與鄰近子幀重疊的窗口函數(shù)。舉例來說，可以重疊-相加方式應用的產(chǎn) 生增益因數(shù)的窗口函數(shù)可幫助減小或避免子幀之間的不連續(xù)性。在一個實例中，高頻帶增益因數(shù)計算器A230經(jīng)配置以應用如圖23a所示的梯形窗口函數(shù)，其中窗口與兩個鄰近子幀的每一者重疊一毫秒。圖23b展示將此窗口函數(shù)應用于20毫秒幀的五個子幀的每一者。高頻帶增益因數(shù)計算器A230的其它實施方案可經(jīng)配置以應用具有不同重疊周期和/ 或不同窗口形狀(例如，矩形、漢明)(其可對稱或不對稱)的窗口函數(shù)。高頻帶增益因數(shù)計算器A230的實施方案還可能經(jīng)配置以將不同窗口函數(shù)應用于幀內的不同子幀和/或包含具有不同長度的子幀的幀。
提供以下值(沒有限制)作為特定實施方案的實例。針對這些情況假定一個20毫秒的幀，但可使用任何其它持續(xù)時間。對于以7 kHz取樣的高頻帶信號，每一幀具有140 個樣本。如果將此幀劃分為具有相等長度的五個子幀，那么每一子幀將具有28個樣本，且如圖23a所示的窗口將為42個樣本寬。對于以8kHz取樣的高頻帶信號，每一幀具有 160個樣本。如果此幀劃分為具有相等長度的五個子幀，那么每一子幀將具有32個樣本，且如圖23a所示的窗口將為48個樣本寬。在其它實施方案中，可使用具有任何寬度的子幀，且甚至可能使高頻帶增益計算器A230的實施方案經(jīng)配置以針對幀的每一樣本產(chǎn)生不同的增益因數(shù)。
圖24展示高頻帶解碼器B200的實施方案B202的方框圖。高頻帶解碼器B202包含高頻帶激勵發(fā)生器B300，其經(jīng)配置以基于窄頻帶激勵信號S80產(chǎn)生高頻帶激勵信號 S120。視特定系統(tǒng)設計選擇而定，可根據(jù)本文描述的高頻帶激勵發(fā)生器A300的實施方案的任一者來實施高頻帶激勵發(fā)生器B300。通常，需要將高頻帶激勵發(fā)生器B300實施為具有與特定編碼系統(tǒng)的高頻帶編碼器的高頻帶激勵發(fā)生器相同的響應。然而，因為窄
頻帶解碼器B110通常將執(zhí)行經(jīng)編碼窄頻帶激勵信號S50的解量化，所以在大多數(shù)情況下，高頻帶激勵發(fā)生器B300可經(jīng)實施以從窄頻帶解碼器B110接收窄頻帶激勵信號S80，而不需要包含經(jīng)配置以對經(jīng)編碼窄頻帶激勵信號S50解量化的反轉量化器。窄頻帶解碼器 B110也可能經(jīng)實施以包含抗稀疏濾波器600的實例，其經(jīng)配置以在將經(jīng)解量化的窄頻帶激勵信號輸入到例如濾波器330的窄頻帶合成濾波器之前對所述信號進行濾波。
反轉量化器560經(jīng)配置以對高頻帶濾波器參數(shù)S60a (在此實例中為一組LSF)解量
化，且LSF-LP濾波器系數(shù)變換570經(jīng)配置以將LSF變換為一組濾波器系數(shù)(例如，如上文參照窄頻帶編碼器A122的反轉量化器240和變換250所描述)。在其它實施方案中，如上文所提及，可使用不同系數(shù)組(例如，倒譜系數(shù))和/或系數(shù)表示形式(例如，ISP)。高頻帶合成濾波器B200經(jīng)配置以根據(jù)高頻帶激勵信號S120和所述組濾波器系數(shù)產(chǎn)生合成高頻帶信號。對于其中高頻帶編碼器包含合成濾波器的系統(tǒng)(例如，如上述編碼器A202 的實例中)，可能需要將高頻帶合成濾波器B200實施為具有與所述合成濾波器相同的響應(例如，相同轉移函數(shù))。
高頻帶解碼器B202還包含經(jīng)配置以對高頻帶增益因數(shù)S60b解量化的反轉量化器 580,和經(jīng)配置和安排以將經(jīng)解量化的增益因數(shù)應用于合成高頻帶信號以產(chǎn)生高頻帶信號 S100的增益控制元件590 (例如，乘法器或放大器)。對于其中幀的增益包絡由一個以上增益因數(shù)指定的情況，增益控制元件590可包含經(jīng)配置以可能根據(jù)窗口函數(shù)將增益因數(shù) 應用于各個子幀的邏輯，所述窗口函數(shù)可與由相應高頻帶編碼器的增益計算器(例如，高頻帶增益計算器A230)應用的窗口函數(shù)相同或不同。在高頻帶解碼器B202的其它實施方案中，增益控制元件590經(jīng)類似地配置但經(jīng)安排以改為將經(jīng)解量化的增益因數(shù)應用于窄頻帶激勵信號S80或應用于高頻帶激勵信號S120。
如上文所提及，可能需要在高頻帶編碼器與高頻帶解碼器中獲得相同狀態(tài)(例如，通過在編碼期間使用經(jīng)解量化值)。因此，可能需要在根據(jù)此實施方案的編碼系統(tǒng)中確保高頻帶激勵發(fā)生器A300和B300中的相應噪聲發(fā)生器具有相同狀態(tài)。舉例來說，此實施方案的高頻帶激勵發(fā)生器A300和B300可經(jīng)配置而使得噪聲發(fā)生器的狀態(tài)是相同幀內已編碼的信息(例如，窄頻帶濾波器參數(shù)S40或其一部分，和/或經(jīng)編碼窄頻帶激勵信號S50 或其一部分)的確定性函數(shù)。
本文描述的元件的量化器中的一者或一者以上(例如，量化器230、 420或430)可經(jīng)配置以執(zhí)行分類向量量化。舉例來說，此量化器可經(jīng)配置以基于窄頻帶信道中和/或高頻帶信道中的相同幀內已編碼的信息從一組密碼本中選出一個密碼本。此技術通常以存儲額外的密碼本為代價提供增加的編碼效率。
如上文參看例如圖8和9所論述，在從窄頻帶語音信號S20中去除粗略頻譜包絡之后，相當大量的周期性結構可能保留在殘留信號中。舉例來說，殘留信號可隨時間而含有粗略周期性脈沖或尖峰信號序列。此結構(通常與音調有關)尤其有可能發(fā)生在濁音語音信號中。窄頻帶殘留信號的量化表示形式的計算可包含根據(jù)由(例如) 一個或一個以上密碼本表示的長期周期性的模型來編碼此音調結構。實際殘留信號的音調結構可能不與周期性模型完全匹配。舉例來說，殘留信號可能包含音調脈沖的位置規(guī)則性的較小抖動，使得幀中連續(xù)音調脈沖之間的距離不完全相等且所述結構并非相當規(guī)則。這些不規(guī)則性往往會降低編碼效率。
窄頻帶編碼器A120的一些實施方案經(jīng)配置以通過在量化之前或期間將自適應時間偏差應用于殘留，或通過以其它方式在經(jīng)編碼激勵信號中包含自適應時間偏差，來執(zhí)行音調結構的規(guī)則化。舉例來說，此編碼器可經(jīng)配置以選擇或以其它方式計算時間偏差的程度(例如，根據(jù)一個或一個以上感知加權和/或誤差最小化標準)，使得所得的激勵信號與長期周期性的模型最佳擬和。音調結構的規(guī)則化由稱為松弛代碼激勵線性預測 (RCELP)編碼器的CELP編碼器子組執(zhí)行。
RCELP編碼器通常經(jīng)配置以執(zhí)行時間偏差作為自適應時移。此時移可為負幾毫秒到正幾毫秒范圍的延遲，且其通常平滑地變化以避免可聽到的不連續(xù)性。在一些實施方案中，此編碼器經(jīng)配置以用分段方式應用規(guī)則化，其中每一幀或子幀偏差相應的固定時移。在其它實施方案中，編碼器經(jīng)配置以應用規(guī)則化作為連續(xù)偏差函數(shù)，使得幀或子幀根據(jù) 音調輪廓(也稱為音調軌跡)而偏差。在一些情況下(例如，如第2004/0098255號美國專利申請公開案中所描述)，編碼器經(jīng)配置以通過將偏移應用于用于計算經(jīng)編碼激勵信號的感知加權輸入信號而在經(jīng)編碼激勵信號中包含時間偏差。
編碼器計算規(guī)則化和量化的經(jīng)編碼激勵信號，且解碼器對經(jīng)編碼激勵信號解量化以獲得用于合成經(jīng)解碼語音信號的激勵信號。經(jīng)解碼輸出信號因此展現(xiàn)出與通過規(guī)則化而包含在經(jīng)編碼激勵信號中的延遲相同的變化的延遲。通常，不將任何指定規(guī)則化量的信息傳輸?shù)浇獯a器。
規(guī)則化往往使殘留信號較易編碼，這改進了來自長期預測器的編碼增益且因此推進了總體編碼效率，而通常不會產(chǎn)生假象?？赡苄枰獌H對濁音幀執(zhí)行規(guī)則化。舉例來說，窄頻帶編碼器A124可經(jīng)配置以僅偏移那些具有長期結構(例如，濁音信號)的幀或子幀。甚至可能需要僅對包含音調脈沖能量的子幀執(zhí)行規(guī)則化。第5,704,003號美國專利(Kldjii 等人)和第6，879，955號美國專利(Rao)和第2004/0098255號美國專利申請公開案(Kovesi 等人)中描述了 RCELP編碼的各種實施方案。RCELP編碼器的現(xiàn)有實施方案包含如電信工業(yè)協(xié)會(TIA) IS-127中所描述的增強可變速率編譯碼器(EVRC)，和第三代合作伙伴關系計劃2 (3GPP2)可選模式聲碼器(SMV)。
不幸的是，規(guī)則化對于其中從經(jīng)編碼窄頻帶激勵信號導出高頻帶激勵的寬頻帶語音編碼器(例如，包含寬頻帶語音編碼器A100和寬頻帶語音解碼器B100的系統(tǒng))可能導致若干問題。由于高頻帶激勵信號是從時間偏差信號導出的，所以高頻帶激勵信號通常將具有與原始高頻帶語音信號的時間特性不同的時間特性。換句話說，高頻帶激勵信號將不再與原始高頻帶語音信號同步。
偏差高頻帶激勵信號與原始高頻帶語音信號之間的時間上的不對準可能引起若干問題。舉例來說，偏差高頻帶激勵信號可能不再為根據(jù)從原始高頻帶語音信號中提取的濾波器參數(shù)配置的合成濾波器提供適宜的源激勵。因此，合成高頻帶信號可含有減小經(jīng) 解碼寬頻帶語音信號的感知質量的可聽到的假象。
時間上的不對準還可能引起增益包絡編碼的低效率。如上文所提及，窄頻帶激勵信號S80與高頻帶信號S30的時間包絡之間很可能存在相關。通過根據(jù)這兩個時間包絡之間的關系編碼高頻帶信號的增益包絡，與直接編碼增益包絡相比可實現(xiàn)編碼效率的提高。然而，當經(jīng)編碼窄頻帶激勵信號規(guī)則化時，此相關可能削弱。窄頻帶激勵信號S80與高頻帶信號S30之間的時間上的不對準可導致高頻帶增益因數(shù)S60b中出現(xiàn)波動，且編碼效率可能降低。
實施例包含根據(jù)相應經(jīng)編碼窄頻帶激勵信號中包含的時間偏差對高頻帶語音信號執(zhí) 行時間偏差的寬頻帶語音編碼方法。此類方法的潛在優(yōu)點包含改進經(jīng)解碼寬頻帶語音信號的質量和/或改進編碼高頻帶增益包絡的效率。
圖25展示寬頻帶語音編碼器A100的實施方案AD10的方框圖。編碼器AD10包含窄頻帶編碼器A120的實施方案A124，所述實施方案A124經(jīng)配置以在計算經(jīng)編碼窄頻帶激勵信號S50期間執(zhí)行規(guī)則化。舉例來說，窄頻帶編碼器A124可根據(jù)上文論述的 RCELP實施方案中的一者或一者以上配置。
窄頻帶編碼器A124還經(jīng)配置以輸出指定所應用的時間偏差的程度的規(guī)則化數(shù)據(jù)信號SD10。對于窄頻帶編碼器A124經(jīng)配置以將固定時移應用于每一幀或子幀的各種情況，規(guī)則化數(shù)據(jù)信號SD10可包含一系列值，其以樣本、毫秒或某一其它時間增量為單位將每一時移量指示為整數(shù)或非整數(shù)值。對于窄頻帶編碼器A124經(jīng)配置以用其它方式修改幀或其它樣本序列的時間標度(例如，通過壓縮一個部分并擴展另一部分)的情況，規(guī)則化信息信號SDIO可包含對修改的相應描述，例如一組函數(shù)參數(shù)。在一個特定實例中，窄頻帶編碼器A124經(jīng)配置以將幀劃分為三個子幀并計算每一子幀的固定時移，使得規(guī)則化數(shù)據(jù)信號SD10指示經(jīng)編碼窄頻帶信號的每一規(guī)則化幀的三個時移量。
寬頻帶語音編碼器AD10包含延遲線D120，其經(jīng)配置以根據(jù)由輸入信號指示的延遲量來推進或阻滯高頻帶語音信號S30的若干部分，從而產(chǎn)生時間偏差高頻帶語音信號
S30a。在圖25所示的實例中，延遲線D120經(jīng)配置以根據(jù)由規(guī)則化數(shù)據(jù)信號SD10指示的偏差來對高頻帶語音信號S30執(zhí)行時間偏差。以此方式，經(jīng)編碼窄頻帶激勵信號S50 中包含的相同時間偏差量也在分析之前應用于高頻帶語音信號S30的相應部分。盡管此實例將延遲線D120展示為高頻帶編碼器A200的單獨元件，但在其它實施方案中，延遲線D120配置為高頻帶編碼器的一部分。
高頻帶編碼器A200的另外的實施方案可經(jīng)配置以執(zhí)行未偏差高頻帶語音信號S30 的頻譜分析(例如，LPC分析)，并在計算高頻帶增益參數(shù)S60b之前執(zhí)行高頻帶語音信號S30的時間偏差。此編碼器可包含(例如)經(jīng)配置以執(zhí)行時間偏差的延遲線D120的實施方案。然而，在此類情況下，基于對未偏差信號S30的分析的高頻帶濾波器參數(shù)S60a 可描述與高頻帶激勵信號S120在時間上不對準的頻譜包絡。
延遲線D120可根據(jù)適于將所需時間偏差操作應用于高頻帶語音信號S30的邏輯元件與存儲元件的任何組合來配置。舉例來說，延遲線D120可經(jīng)配置以根據(jù)所需的時移從緩沖器中讀取高頻帶語音信號S30。圖26a展示延遲線D120的此實施方案D122的示意圖，所述延遲線D120包含移位寄存器SR1。移位寄存器SR1是經(jīng)配置以接收和存儲高頻帶語音信號S30的m個最新近樣本的具有大約長度m的緩沖器。值m至少等于將支持的最大正(或"推進")與負(或"阻滯")時移的總和。值m等于高頻帶信號S30的幀或子幀的長度可能會較方便。
延遲線D122經(jīng)配置以從移位寄存器SR1的偏移位置OL輸出時間偏差高頻帶信號 S30a。偏移位置OL的定位根據(jù)由例如規(guī)則化數(shù)據(jù)信號SD10指示的當前時移而在參考位置(零時移)附近變化。延遲線D122可經(jīng)配置以支持相等的推進和阻滯限制，或者一個限制大于另一限制，使得可在一個方向上比在另一方向上執(zhí)行更大偏移。圖26a展示支持的正時移大于負時移的特定實例。延遲線D122可經(jīng)配置以一次輸出一個或一個以上樣本(例如視輸出總線寬度而定)。
具有大于幾毫秒的量值的規(guī)則化時移可引起經(jīng)解碼信號中的可聽到的假象。通常，由窄頻帶編碼器A124執(zhí)行的規(guī)則化時移的量值將不超過幾毫秒，使得由規(guī)則化數(shù)據(jù)信號 SD10指示的時移將有限。然而，在此類情況下可能需要延遲線D122經(jīng)配置以對正和/ 或負方向上的時移強加最大限制(例如，以遵循比窄頻帶編碼器強加的限制更為嚴格的限制)。
圖26b展示延遲線D122的實施方案D124的示意圖，延遲線D122包含移位窗口 SW。在此實例中，偏移位置OL的定位受移位窗口 SW限制。盡管圖26b展示緩沖器長度m
大于移位窗口 SW的寬度的情況，但延遲線D124也可經(jīng)實施使得移位窗口 SW的寬度等于m。
在其它實施方案中，延遲線D120經(jīng)配置以根據(jù)所需時移將高頻帶語音信號S30寫入到緩沖器。圖27展示延遲線D120的實施方案D130的示意圖，所述實施方案D130 包含經(jīng)配置以接收和存儲高頻帶語音信號S30的兩個移位寄存器SR2和SR3。延遲線 D130經(jīng)配置以根據(jù)例如由規(guī)則化數(shù)據(jù)信號SD10指示的時移而將來自移位寄存器SR2的幀或子幀寫入到移位寄存器SR3。移位寄存器SR3配置為FIFO緩沖器，其經(jīng)配置以輸出時間偏差高頻帶信號S30。
在圖27所示的特定實例中，移位寄存器SR2包含幀緩沖器部分FBI和延遲緩沖器部分DB，且移位寄存器SR3包含幀緩沖器部分FB2、推進緩沖器部分AB和阻滯緩沖器部分RB。推進緩沖器AB和阻滯緩沖器RB的長度可相等，或者其中一者可大于另一者，使得所支持的一個方向上的偏移大于所支持的另一方向上的偏移。延遲緩沖器DB和阻滯緩沖器部分RB可經(jīng)配置以具有相同長度?；蛘撸舆t緩沖器DB可比阻滯緩沖器RB 短以考慮到將樣本從幀緩沖器FB1轉移到移位寄存器SR3所需的時間間隔，所述轉移可包含例如在存儲到移位寄存器SR3之前先使樣本偏差的其它處理操作。
在圖27的實例中，幀緩沖器FBI經(jīng)配置以具有與高頻帶信號S30的一個幀的長度相等的長度。在另一實例中，幀緩沖器FB1經(jīng)配置以具有與高頻帶信號S30的一個子幀的長度相等的長度。在此情況下，延遲線D130可經(jīng)配置以包含用于將相同(例如，平均) 延遲應用于待偏移的幀的所有子幀的邏輯。延遲線D130還可包含用于將來自幀緩沖器 FBI的值與阻滯緩沖器RB或推進緩沖器AB中待重寫的值進行平均的邏輯。在另一實例中，移位寄存器SR3可經(jīng)配置以僅經(jīng)由幀緩沖器FB1接收高頻帶信號S30的值，且在此情況下，延遲線D130可包含用于在寫入到移位寄存器SR3的連續(xù)幀或子幀之間的間隙上進行內插的邏輯。在其它實施方案中，延遲線D130可經(jīng)配置以在將來自幀緩沖器FB1 的樣本寫入到移位寄存器SR3之前對所述樣本執(zhí)行偏差操作(例如，根據(jù)由規(guī)則化數(shù)據(jù) 信號SD10描述的函數(shù))。
延遲線D120可能需要應用基于但不等同于由規(guī)則化數(shù)據(jù)信號SD10指定的偏差的時間偏差。圖28展示寬頻帶語音編碼器AD10的實施方案AD12的方框圖，寬頻帶語音編碼器AD10包含延遲值映射器DllO。延遲值映射器D110經(jīng)配置以將由規(guī)則化數(shù)據(jù)信號 SD10指示的偏差映射為經(jīng)映射延遲值SD10a。延遲線D120經(jīng)配置以根據(jù)由經(jīng)映射延遲值SD10a指示的偏差來產(chǎn)生時間偏差高頻帶語音信號S30a。可預期窄頻帶編碼器應用的時移隨時間平滑地進展。因此，通常計算語音幀期間應用于子幀的平均窄頻帶時移并根據(jù)此平均值來偏移高頻帶語音信號S30的相應幀已足夠。在一個此類實例中，延遲值映射器D110經(jīng)配置以計算每一幀的子幀延遲值的平均值，且延遲線D120經(jīng)配置以將計算出的平均值應用于高頻帶信號S30的相應幀。在其它實例中，可計算和應用較短周期(例如，兩個子幀，或半個幀)或較長周期(例如，兩個幀)內的平均值。在平均值是樣本的非整數(shù)值的情況下，延遲值映射器D110可經(jīng)配置以在將所述值輸出到延遲線D120之前將所述值四舍五入為樣本的整數(shù)數(shù)目。
窄頻帶編碼器A124可經(jīng)配置以在經(jīng)編碼窄頻帶激勵信號中包含非整數(shù)數(shù)目的樣本的規(guī)則化時移。在此情況下，延遲值映射器D110可能需要經(jīng)配置以將窄頻帶時移四舍五入為樣本的整數(shù)數(shù)目，且延遲線D120可能需要將經(jīng)四舍五入的時移應用于高頻帶語音信號S30。
在寬頻帶語音編碼器AD10的一些實施方案中，窄頻帶語音信號S20與高頻帶語音信號S30的取樣速率可能不同。在此類情況下，延遲值映射器D110可經(jīng)配置以調節(jié)規(guī)則化數(shù)據(jù)信號SDIO中指示的時移量，以考慮窄頻帶語音信號S20(或窄頻帶激勵信號S80) 與高頻帶語音信號S30的取樣速率之間的差異。舉例來說，延遲值映射器D110可經(jīng)配置以根據(jù)取樣速率的比率縮放時移量。在上文提及的一個特定實例中，以8kHz對窄頻帶語音信號S20進行取樣，且以7 kHz對高頻帶語音信號S30進行取樣。在此情況下，延遲值映射器D110經(jīng)配置以將每一偏移量乘以7/8。延遲值映射器D110的實施方案還可經(jīng)配置以執(zhí)行此縮放運算以及本文描述的整數(shù)四舍五入和/或時移平均運算。
在另外的實施方案中，延遲線D120經(jīng)配置以用其它方式修改幀或其它樣本序列的時間標度(例如，通過壓縮一個部分并擴展另一部分)。舉例來說，窄頻帶編碼器A124可經(jīng)配置以根據(jù)例如音調輪廓或軌跡的函數(shù)來執(zhí)行規(guī)則化。在此情況下，規(guī)則化數(shù)據(jù)信號 SD10可包含對所述函數(shù)的相應描述(例如一組參數(shù))，且延遲線D120可包含經(jīng)配置以根據(jù)所述函數(shù)對高頻帶語音信號S30的幀或子幀執(zhí)行偏差的邏輯。在其它實施方案中，延遲值映射器D110經(jīng)配置以在將所述函數(shù)通過延遲線D120應用于高頻帶語音信號S30之前對所述函數(shù)進行平均、縮放和/或四舍五入。舉例來說，延遲值映射器D110可經(jīng)配置以根據(jù)所述函數(shù)計算一個或一個以上延遲值，每一延遲值指示樣本數(shù)目，其接著由延遲線D120應用以對高頻帶語音信號S30的一個或一個以上相應幀或子幀執(zhí)行時間偏差。
圖29展示根據(jù)相應經(jīng)編碼窄頻帶激勵信號中包含的時間偏差對高頻帶語音信號執(zhí) 行時間偏差的方法MD100的流程圖。任務TD100處理寬頻帶語音信號以獲得窄頻帶語
音信號和高頻帶語音信號。舉例來說，任務TD100可經(jīng)配置以使用具有低通濾波器和高通濾波器的濾波器組(例如濾波器組A110的實施方案)對寬頻帶語音信號進行濾波。任務TD200將窄頻帶語音信號至少編碼為經(jīng)編碼的窄頻帶激勵信號和多個窄頻帶濾波器參數(shù)。所述經(jīng)編碼的窄頻帶激勵信號和/或濾波器參數(shù)可量化，且經(jīng)編碼的窄頻帶激勵信號還可包含例如語音模式參數(shù)的其它參數(shù)。任務TD200還包含經(jīng)編碼的窄頻帶激勵信號中的時間偏差。
任務TD300基于窄頻帶激勵信號產(chǎn)生高頻帶激勵信號。在此情況下，窄頻帶激勵信號基于經(jīng)編碼的窄頻帶激勵信號。任務TD400根據(jù)至少所述高頻帶激勵信號，將高頻帶語音信號至少編碼為多個高頻帶濾波器參數(shù)。舉例來說，任務TD400可經(jīng)配置以將高頻帶語音信號編碼為多個量化LSF。任務TD500將時移應用于高頻帶語音信號，所述時移基于與經(jīng)編碼窄頻帶激勵信號中包含的時間偏差有關的信息。
任務TD400可經(jīng)配置以對高頻帶語音信號執(zhí)行頻譜分析(例如，LPC分析)，且/或計算高頻帶語音信號的增益包絡。在此類情況下，任務TD500可經(jīng)配置以在所述分析和 /或增益包絡計算之前將時移應用于高頻帶語音信號。
寬頻帶語音編碼器A100的其它實施方案經(jīng)配置以將由經(jīng)編碼窄頻帶激勵信號中包含的時間偏差引起的高頻帶激勵信號S120的時間偏差反轉。舉例來說，高頻帶激勵發(fā)生器A300可經(jīng)實施以包含延遲線D120的實施方案，延遲線D120的所述實施方案經(jīng)配置以接收規(guī)則化數(shù)據(jù)信號SD10或經(jīng)映射延遲值SD10a，并將相應的反轉時移應用于窄頻帶激勵信號S80，且/或應用于基于所述窄頻帶激勵信號S80的隨后信號(例如，諧波延伸信號S160或高頻帶激勵信號S120)。
另外的寬頻帶語音編碼器實施方案可經(jīng)配置以彼此獨立地對窄頻帶語音信號S20和高頻帶語音信號S30進行編碼，使得高頻帶語音信號S30被編碼為高頻帶頻譜包絡和高頻帶激勵信號的表示形式。此實施方案可經(jīng)配置以根據(jù)與經(jīng)編碼窄頻帶激勵信號中包含的時間偏差有關的信息對高頻帶殘留信號執(zhí)行時間偏差，或用其它方式將時間偏差包含在經(jīng)編碼高頻帶激勵信號中。舉例來說，高頻帶編碼器可包含本文描述的經(jīng)配置以將時間偏差應用于高頻帶殘留信號的延遲線D120和/或延遲值映射器D110的實施方案。此操作的潛在優(yōu)點包含對高頻帶殘留信號的較有效編碼，和合成窄頻帶與高頻帶語音信號之間的較好匹配。
如上文所提及，本文描述的實施例包含可用于執(zhí)行嵌入式編碼、支持與窄頻帶系統(tǒng) 的兼容性并避免需要代碼轉換的實施方案。對高頻帶編碼的支持還可用于按照成本來區(qū)
分具有寬頻帶支持與向后兼容性的芯片、芯片組、裝置和/或網(wǎng)絡與僅具有窄頻帶支持的芯片、芯片組、裝置和/或網(wǎng)絡。如本文所描述的對高頻帶編碼的支持也可與用于支持低頻帶編碼的技術結合使用，且根據(jù)此實施例的系統(tǒng)、方法或設備可支持對例如約50或 100 Hz —直到約7或8 kHz的頻率分量的編碼。
如上文所提及，向語音編碼器添加高頻帶支持可改進清晰度，尤其是在摩擦音的區(qū) 分方面。盡管這種區(qū)分通?？赡苡扇祟愂章犝吒鶕?jù)特定上下文推導出來，但高頻帶支持可在語音識別和其它機器解譯應用(例如用于自動化語音菜單導航和/或自動呼叫處理的系統(tǒng))中充當啟用特征。
根據(jù)一實施例的設備可嵌入到便攜式無線通信裝置(例如，蜂窩式電話或個人數(shù)字助理(PDA))中。或者，此設備可包含在另一通信裝置中，例如VoIP手機、經(jīng)配置以支持VoIP通信的個人計算機或經(jīng)配置以路由電話或VoIP通信的網(wǎng)絡裝置。舉例來說，根據(jù)一實施例的設備可實施在通信裝置的芯片或芯片組中。視特定應用而定，此裝置還可包含例如以下特征對語音信號的模擬-數(shù)字和/或數(shù)字-模擬轉換、用于對語音信號執(zhí) 行放大和/或其它信號處理操作的電路，和/或用于發(fā)射和/或接收經(jīng)編碼語音信號的射頻電路。
明確預期且揭示實施例可包含第60/667,901號和第60/673,965號美國臨時專利申請案中揭示的其它特征中的任一者或一者以上且/或與其一起使用，本申請案中主張所述臨時專利申請案的權益。此類特征包含去除發(fā)生于高頻帶中且在窄頻帶中大體上不存在的具有短持續(xù)時間的高能量突發(fā)。此類特征包含例如高頻帶LSF的系數(shù)表示形式的固定或自適應平滑。此類特征包含與例如LSF的系數(shù)表示形式的量化相關聯(lián)的噪聲的固定或自適應成形。此類特征還包含增益包絡的固定或自適應平滑，以及增益包絡的自適應衰減。
提供對所描述實施例的以上介紹以便使所屬領域的技術人員能夠制造或使用本發(fā) 明?？赡軐@些實施例作出各種修改，且本文提供的一般原理也可應用于其它實施例。舉例來說，實施例可部分或整體地實施為硬連線電路，實施為制造到專用集成電路中的電路配置，或者實施為作為機器可讀代碼加載到非易失性存儲裝置中的固件程序、或從數(shù)據(jù)存儲媒體加載或加載到數(shù)據(jù)存儲媒體中的軟件程序，所述代碼為可由例如微處理器或其它數(shù)字信號處理單元的邏輯元件陣列執(zhí)行的指令。數(shù)據(jù)存儲媒體可為存儲元件陣列，例如半導體存儲器(其可包含(不限于)動態(tài)或靜態(tài)RAM (隨機存取存儲器)、ROM (只讀存儲器)和/或快閃RAM)，或鐵電、磁阻、雙向開關半導體、聚合物或相變存儲器；或者例如磁盤或光盤的圓盤式媒體。術語"軟件"應理解為包含源代碼、匯編語言代碼、
機器代碼、二進制代碼、固件、宏代碼、微碼、可由邏輯元件陣列執(zhí)行的任何一個或一個以上指令組或序列，以及此類實例的任何組合。
高頻帶激勵發(fā)生器A300和B300、高頻帶編碼器AIOO、高頻帶解碼器B200、寬頻帶語音編碼器A100和寬頻帶語音解碼器B100的實施方案的各種元件可實施為(例如) 駐存在芯片組中的同一芯片上或兩個或兩個以上芯片之間的電子和/或光學裝置，但也預期存在沒有此限制的其它配置。此設備的一個或一個以上元件可整體或部分地實施為一個或一個以上指令組，所述指令組經(jīng)配置以在一個或一個以上固定或可編程邏輯元件(例如，晶體管、門)陣列上執(zhí)行，所述元件例如為微處理器、內嵌式處理器、IP核心、數(shù) 字信號處理器、FPGA (場可編程門陣列)、ASSP (專用標準產(chǎn)品)和ASIC (專用集成電路)。一個或一個以上此類元件也可能具有共同結構(例如，用于在不同時間執(zhí)行對應于不同元件的代碼部分的處理器、經(jīng)執(zhí)行以在不同時間執(zhí)行對應于不同元件的任務的指令組，或者在不同時間針對不同元件執(zhí)行操作的電子和/或光學裝置的配置)。此外，一個或一個以上此類元件可能用于執(zhí)行與設備的操作并不直接相關的任務或其它指令組，例如與內嵌有所述設備的裝置或系統(tǒng)的另一操作相關的任務。
圖30展示根據(jù)一實施例對具有窄頻帶部分和高頻帶部分的語音信號的所述高頻帶部分進行編碼的方法M100的流程圖。任務X100計算表示高頻帶部分的頻譜包絡的特征的一組濾波器參數(shù)。任務X200通過將非線性函數(shù)應用于從窄頻帶部分導出的信號來計算頻譜延伸信號。任務X300根據(jù)(A)所述組濾波器參數(shù)和(B)基于所述頻譜延伸信號的高頻帶激勵信號來產(chǎn)生合成高頻帶信號。任務X400基于(C)高頻帶部分的能量與(D) 從窄頻帶部分導出的信號的能量之間的關系來計算增益包絡。
圖31a展示根據(jù)一實施例產(chǎn)生高頻帶激勵信號的方法M200的流程圖。任務Y100通過將非線性函數(shù)應用于從語音信號的窄頻帶部分導出的窄頻帶激勵信號來計算經(jīng)諧波延伸信號。任務Y200將經(jīng)諧波延伸信號與經(jīng)調制噪聲信號混合以產(chǎn)生高頻帶激勵信號。圖 31b展示根據(jù)包含任務Y300和Y400的另一實施例產(chǎn)生高頻帶激勵信號的方法M210的流程圖。任務Y300根據(jù)窄頻帶激勵信號和經(jīng)諧波延伸信號中的一者的隨時間的能量來計算時域包絡。任務Y400根據(jù)時域包絡調制噪聲信號以產(chǎn)生經(jīng)調制噪聲信號。
圖32展示根據(jù)一實施例對具有窄頻帶部分和高頻帶部分的語音信號的所述高頻帶部分進行解碼的方法M300的流程圖。任務Z100接收表征所述高頻帶部分的頻譜包絡的一組濾波器參數(shù)和表征所述高頻帶部分的時間包絡的一組增益因數(shù)。任務Z200通過將非線性函數(shù)應用于從窄頻帶部分導出的信號來計算頻譜延伸信號。任務Z300根據(jù)(A)所述組濾波器參數(shù)和(B)基于所述頻譜延伸信號的高頻帶激勵信號來產(chǎn)生合成高頻帶信號。任務Z400基于所述組增益因數(shù)來調制所述合成高頻帶信號的增益包絡。舉例來說，任務 Z400可經(jīng)配置以通過將所述組增益因數(shù)應用于從窄頻帶部分導出的激勵信號、應用于頻譜延伸信號、應用于高頻帶激勵信號，或應用于合成高頻帶信號，來調制所述合成高頻帶信號的增益包絡。
實施例還包含如本文中(例如)通過對經(jīng)配置以執(zhí)行額外語音譯碼、編碼和解碼方法的結構實施例的描述而明確揭示的所述額外語音譯碼、編碼和解碼方法。這些方法的每一者也可確實地實施(例如，在如上文列舉的一個或一個以上數(shù)據(jù)存儲媒體中)為可由包含邏輯元件(例如，處理器、微處理器、微控制器或其它有限狀態(tài)機)陣列的機器讀取和/或執(zhí)行的一個或一個以上指令組。因此，本發(fā)明不希望限于上文展示的實施例，而是應符合與本文中(包含所提交的形成原始揭示案的一部分的所附權利要求書中)以任何方式揭示的原理和新穎特征一致的最廣泛范圍。
權利要求
1.一種編碼具有低頻帶部分和高頻帶部分的語音信號的所述高頻帶部分的方法，所述方法包括計算表征所述高頻帶部分的頻譜包絡的多個濾波器參數(shù)；通過延伸從所述低頻帶部分導出的信號的頻譜來計算頻譜延伸信號；根據(jù)(A)基于所述頻譜延伸信號的高頻帶激勵信號和(B)所述多個濾波器參數(shù)來產(chǎn)生合成高頻帶信號；以及基于所述高頻帶部分與基于所述低頻帶部分的信號之間的關系來計算增益包絡。
2. 根據(jù)權利要求1所述的方法，其中所述計算頻譜延伸信號包括通過將非線性函數(shù)應用于從所述低頻帶部分導出的信號來延伸所述信號的頻譜。
3. 根據(jù)權利要求1所述的方法，其中所述計算增益包絡是基于所述高頻帶部分的能量與基于所述低頻帶部分的信號的能量之間的關系。
4. 根據(jù)權利要求3所述的方法，其中所述計算增益包絡是基于所述高頻帶部分的能量與所述合成高頻帶信號的能量之間的關系。
5. —種語音處理方法，所述方法包括基于低頻帶激勵信號產(chǎn)生高頻帶激勵信號；基于高頻帶語音信號和所述高頻帶激勵信號產(chǎn)生合成高頻帶信號；以及基于所述高頻帶語音信號與基于所述低頻帶激勵信號的信號之間的關系來計算多個增益因數(shù)。
6. 根據(jù)權利要求5所述的方法，其中所述多個增益因數(shù)的每一者均基于所述高頻帶語音信號的時間部分的能量與基于所述低頻帶激勵信號之信號相應時間部分的能量之間的關系。
7. 根據(jù)權利要求5所述的方法，其中所述計算多個增益因數(shù)包括基于所述高頻帶語音信號與所述合成高頻帶信號之間的關系來計算多個增益因數(shù)。
8. 根據(jù)權利要求7所述的方法，其中所述多個增益因數(shù)的每一者均基于所述高頻帶語音信號的時間部分的能量與所述合成高頻帶信號的相應時間部分的能量之間的關系。
9. 根據(jù)權利要求5所述的方法，其中產(chǎn)生合成高頻帶信號包含基于所述高頻帶激勵信號和從所述高頻帶語音信號導出的多個濾波器參數(shù)來產(chǎn)生所述合成高頻帶信號。
10. —種解碼具有低頻帶部分和高頻帶部分的語音信號的所述高頻帶部分的方法，所述方法包括接收表征所述高頻帶部分的頻譜包絡的多個濾波器參數(shù)和表征所述高頻帶部分的時間包絡的多個增益因數(shù)；通過延伸基于低頻帶激勵信號之信號頻譜來計算頻譜延伸信號；根據(jù)(A)所述多個濾波器參數(shù)和(B)基于所述頻譜延伸信號的高頻帶激勵信號來產(chǎn)生合成高頻帶信號；以及根據(jù)所述多個增益因數(shù)來調制所述合成高頻帶信號的增益包絡。
11. 根據(jù)權利要求10所述的方法，其中所述計算頻譜延伸信號包括通過將非線性函數(shù) 應用于基于低頻帶激勵信號的信號來延伸所述信號的頻譜。
12. 根據(jù)權利要求10所述的方法，其中所述調制增益包絡包含根據(jù)所述多個增益因數(shù) 來修改以下各項中至少一者隨時間的幅值基于所述低頻帶激勵信號的信號、所述頻譜延伸信號、所述高頻帶激勵信號和所述合成高頻帶信號。
13. —種經(jīng)配置以編碼具有低頻帶部分和高頻帶部分的語音信號的所述高頻帶部分的設備，所述設備包括分析模塊，其經(jīng)配置以計算表征所述高頻帶部分的頻譜包絡的一組濾波器參數(shù)；頻譜延伸器，其經(jīng)配置以通過延伸從所述低頻帶部分導出的信號的頻譜來計算頻譜延伸信號；合成濾波器，其經(jīng)配置以根據(jù)(A)基于所述頻譜延伸信號的高頻帶激勵信號和 (B)所述組濾波器參數(shù)來產(chǎn)生合成高頻帶信號；以及增益因數(shù)計算器，其經(jīng)配置以基于所述高頻帶部分與基于所述低頻帶部分的信號之間的時間變化關系來計算增益包絡。
14. 根據(jù)權利要求13所述的設備，其中所述頻譜延伸器經(jīng)配置以通過將非線性函數(shù)應用于從所述低頻帶部分導出的信號來延伸所述信號的頻譜。
15. 根據(jù)權利要求13所述的設備，其中所述增益因數(shù)計算器經(jīng)配置以基于所述高頻帶部分的能量與基于所述低頻帶部分的信號的能量之間的時間變化關系來計算所述增益包絡。
16. 根據(jù)權利要求15所述的設備，其中所述增益因數(shù)計算器經(jīng)配置以基于所述高頻帶部分的能量與所述合成高頻帶信號的能量之間的時間變化關系來計算所述增益包絡。
17. 根據(jù)權利要求13所述的設備，其中所述增益因數(shù)計算器經(jīng)配置以將所述增益包絡計算為多個增益因數(shù)，其中所述多個增益因數(shù)的每一者均基于所述高頻帶語音信號的時間部分的能量與所述合成高頻帶信號的相應時間部分的能量之間的關系。
18. 根據(jù)權利要求13所述的設備，所述設備包括蜂窩式電話。
19. 一種高頻帶語音解碼器，其經(jīng)配置以接收(A)表征語音信號的高頻帶部分的頻譜包絡的多個濾波器參數(shù)和(B)基于所述語音信號的低頻帶部分的經(jīng)編碼低頻帶激勵信號，所述解碼器包括頻譜延伸器，其經(jīng)配置以通過延伸基于所述經(jīng)編碼低頻帶激勵信號之信號頻譜來計算頻譜延伸信號；合成濾波器，其經(jīng)配置以根據(jù)所述多個濾波器參數(shù)和基于所述頻譜延伸信號的高頻帶激勵信號來產(chǎn)生合成高頻帶信號；以及增益控制元件，其經(jīng)配置以根據(jù)表征所述高頻帶部分的時間包絡的多個增益因數(shù) 來調制所述合成高頻帶信號的增益包絡。 .
20. 根據(jù)權利要求19所述的解碼器，其中所述頻譜延伸器經(jīng)配置以通過將非線性函數(shù) 應用于基于所述經(jīng)編碼低頻帶激勵信號的信號來延伸所述信號的頻譜。
21. 根據(jù)權利要求19所述的解碼器，其中所述增益控制元件經(jīng)配置以根據(jù)所述多個增益因數(shù)來修改以下各項中至少一者隨時間的幅值所述經(jīng)編碼低頻帶激勵信號、所述頻譜延伸信號、所述高頻帶激勵信號和所述合成高頻帶信號。
22. 根據(jù)權利要求19所述的解碼器，其中所述增益控制元件包括乘法器和放大器中的至少一者。
全文摘要
本發(fā)明涉及一種包含低頻帶編碼器和高頻帶編碼器的寬頻帶語音編碼器，根據(jù)一個實施例，所述低頻帶編碼器經(jīng)配置以將寬頻帶語音信號的低頻帶部分編碼為一組濾波器參數(shù)和經(jīng)編碼激勵信號。所述高頻帶編碼器經(jīng)配置以計算指定所述寬頻帶語音信號的高頻帶部分的頻譜包絡和時間包絡的編碼參數(shù)的值。所述時間包絡基于從所述經(jīng)編碼激勵信號中導出的高頻帶激勵信號。在一個此類實例中，所述時間包絡基于所述高頻帶部分與合成高頻帶信號之間的電平差異，其中所述合成高頻帶信號是根據(jù)所述高頻帶激勵信號和一組高頻帶濾波器參數(shù)產(chǎn)生的。
文檔編號G10L21/04GK101185127SQ200680018213
公開日2008年5月21日申請日期2006年4月3日優(yōu)先權日2005年4月1日
發(fā)明者科恩·貝爾納德·福斯, 阿南塔帕德馬納卜漢·A·坎達達伊申請人:高通股份有限公司

完整全部詳細技術資料下載