專利名稱:快速語音編碼的代數(shù)碼書深度優(yōu)先搜索的制作方法
本文是關于于1995年3月10日提交的美國專利申請No.08/401,785“快速語音編碼的代數(shù)碼書深度優(yōu)先搜索”的部分繼續(xù)申請。
本發(fā)明涉及一種考慮到聲音信號的傳輸與合成而對聲音信號進行數(shù)字編碼的改進技術。尤其涉及語音信號,但不排除適用于其他聲音信號。
語音通過衛(wèi)星陸地移動臺,數(shù)字廣播,分組網(wǎng)絡的傳輸,語音存儲,語音應答,以及無線電話等應用對能夠提供良好主觀質(zhì)量與比特率折衷的高效的數(shù)字語音編碼技術提出了日益增加的需求。
碼激勵線性預測(CELP)是現(xiàn)有技術中所采用的能夠獲得良好質(zhì)量與比特率折衷的最好的技術方案之一。根據(jù)該技術,語音信號經(jīng)過抽樣,以L個樣點(即矢量)組成的連續(xù)塊的形式處理,其中L是某個預置數(shù)。CELP技術使用了一個碼書。
在CELP中,碼書就是稱作L維碼矢量的L個樣點所組成的序列的一個有序集。碼書包括一個從1到M變化的下標(index)k,M表示了碼書的大小,有時M用比特數(shù)b表示。
M=2b碼書可以存儲在物理內(nèi)存中(如一個查尋表),或者借助一機制把下標與相應的碼矢量聯(lián)系起來(如一個公式)。
在CELP中,碼書中恰當?shù)拇a矢量經(jīng)過依據(jù)語音信號譜特征建模的時變?yōu)V波器濾波,可以實現(xiàn)對樣點組成的每一數(shù)據(jù)塊的語音合成。在編碼器端,計算碼書中所有的碼矢量或其子集的合成輸出,根據(jù)一感覺加權失真測度保留能夠產(chǎn)生與原始語音最接近的合成輸出的碼矢量。
第一類碼書叫做“隨機”碼書。此類碼書的一個缺點是它經(jīng)常要使用大量的物理存儲空間。它們是隨機的,隨機意謂著從下標到相應碼矢量的路徑涉及一查找表,而該查找表是在大量的語音訓練集上應用隨機數(shù)產(chǎn)生或統(tǒng)計技術得到的。隨機碼書的大小由于存儲空間及/或搜索的復雜度而受到限制。
第二類碼書是代數(shù)碼書。與隨機碼書相比,代數(shù)碼書不具有隨機性,不需要大量的存儲單元。代數(shù)碼書是一個碼矢量有序集,其中第k個碼矢量的脈沖幅度和相位可以根據(jù)一個規(guī)則由相應的下標k推出。代數(shù)碼書不需或只需極少的物理存儲單元,因此其大小不受存儲空間的限制。代數(shù)碼書還可以進行快速搜索。
本發(fā)明的目的是提供一種適用于多種類型碼書并且能夠在聲音編碼時極大地降低碼書搜索復雜度的方法和裝置。
根據(jù)本發(fā)明,尤其提供了一種進行聲音信號編碼時執(zhí)行碼書深度優(yōu)先搜索的方法碼書由碼矢量AK的一個集合組成,定義了多個不同位置p并包括N個幅度非零的脈沖,每個脈沖可分配至碼矢量的預置有效位置;深度優(yōu)先搜索涉及一M級/層(level)有序的樹結構,每一級m與Nm個幅度非零的脈沖相關聯(lián),Nm為一預置數(shù),Nm>=1,涉及所有M級的各級預置數(shù)的和與組成碼矢量的幅度非零的脈沖數(shù)目N相等。樹結構的每一級m進一步涉及一路徑建立操作,一給定脈沖順序規(guī)則,和選擇準則;碼書深度優(yōu)先搜索操作包括以下步驟---在樹結構的第一層相關的路徑建立操作包括根據(jù)相應的脈沖順序規(guī)則,在N個幅度非零的脈沖中選擇N1個脈沖;根據(jù)相應的選擇準則,在N1個幅度非零的脈沖的P個有效位置中至少選擇一個有效位置,從而定義至少一條第一層候選路徑;---在樹結構的m級,相應的路徑建立操作通過擴展(m-1)級的一條候選路徑迭代定義了一條m級候選路徑,步驟如下根據(jù)相應的脈沖順序規(guī)則,選擇在建立m-1級路徑時沒有選擇的幅度非零的Nm個脈沖;根據(jù)相應的選擇準則,在這Nm個幅度非零的脈沖中至少選擇一個有效位置p,從而定義至少一條m級候選路徑;其中源于一條第1級候選路徑并在樹結構的后續(xù)級路徑建立中擴展的一條M級候選路徑確定了碼矢量中N個幅度非零的脈沖的各個的位置P,由此定義了一個候選碼矢量AK。
根據(jù)本發(fā)明也提供一種聲音編碼的碼書深度優(yōu)先搜索的方法,其中,碼書由一個碼矢量AK的集合組成,每個碼矢量定義了多個不同位置p并且包括N個幅度非零的脈沖組成,其中每個脈沖都分配至碼矢量的預置有效位置P;深度優(yōu)先搜索涉及(a)將N個幅度非零的脈沖劃分至M個子集,每一子集至少包括一個幅度非零的脈沖,(b)一樹結構,其每一節(jié)點代表了N個幅度非零脈沖的有效位置p,該樹結構定義了多個搜索級,每一搜索級與M個子集中的一個相關聯(lián),并有給定的脈沖順序規(guī)則和選擇準則;碼書深度優(yōu)先搜索操作包括以下步驟---在樹結構的第一搜索級,根據(jù)相應的脈沖順序規(guī)則,在N個幅度非零的脈沖中至少選擇一個以形成相應子集;根據(jù)相應的選擇準則,在上述至少一個幅度非零脈沖的有效位置p中至少選擇一個有效位置,以定義至少一條通過樹節(jié)點的路徑;---在樹結構的每一后續(xù)搜索級根據(jù)相應的脈沖順序規(guī)則,至少選擇一個先前未選擇的上述幅度非零的脈沖,以形成相應子集;根據(jù)相應的選擇準則,在上述至少含有一個幅度非零脈沖的有效位置p的相應子集中至少選擇一個有效位置,以延伸至少一條通過樹節(jié)點的上述路徑;其中在第一搜索級定義并在后續(xù)搜索級延伸的每條路徑確定了碼矢量AK的N個幅度非零的脈沖的各個位置p,從而在聲音編碼時構成了一個候選碼矢量。
本發(fā)明還涉及一聲音信號編碼時執(zhí)行碼書深度優(yōu)先搜索操作的裝置,其中,碼書由一個碼矢量AK的集合組成,每個定義了多個不同位置p并且包括N個幅度非零的脈沖組成,其中每個脈沖都分配至碼矢量的預置有效位置P深度優(yōu)先搜索涉及(a)將N個幅度非零的脈沖劃分至M個子集,每一子集至少包括一個幅度非零的脈沖,(b)一樹結構,每一節(jié)點代表了N個幅度非零脈沖的有效位置p,該樹結構定義了多個搜索級,每一搜索級與M個子集中的一個相關聯(lián),并有自己的脈沖順序規(guī)則和選擇準則;碼書深度優(yōu)先搜索裝置包括對于樹結構的第一搜索級,第一裝置,根據(jù)相應的脈沖順序規(guī)則,在N個幅度非零的脈沖中至少選擇一個以形成相應子集;第一裝置,根據(jù)相應的選擇準則,在上述至少一個幅度非零的脈沖的有效位置p中選擇至少一個有效位置以定義至少一條通過樹節(jié)點的路徑;對于樹結構的每一后續(xù)搜索級,第二裝置,根據(jù)相應的脈沖順序規(guī)則,選擇至少一個先前未選擇的上述幅度非零的脈沖,以形成相應子集;第二裝置,后續(xù)搜索級根據(jù)相應的選擇準則,在上述至少含有一個幅度非零脈沖的有效位置p的相應子集中選擇至少一個有效位置,以延伸至少一條通過樹節(jié)點的上述路徑;其中在第一搜索級定義并在后續(xù)搜索級延伸的每條路徑確定了碼矢量AK的N個幅度非零的脈沖的各個位置p,從而在聲音編碼時構成了一個候選碼矢量。
本發(fā)明進一步涉及服務于分為若干蜂窩的大片地理區(qū)域的蜂窩通信系統(tǒng),它包括移動發(fā)射/接收單元;位于各蜂窩的蜂窩基站;蜂窩基站間進行通信控制的設備;在小區(qū)中的每個移動單元和小區(qū)蜂窩基站間進行雙向無線通信的子系統(tǒng),該雙向無線通信的子系統(tǒng)的移動單元和基站均具有(a)包括對語音信號進行編碼的裝置及傳輸編碼的語音信號的裝置的發(fā)射機,(b)包括接收編碼后的信號及解碼裝置的接收機;
其中的語音信號編碼裝置包括在對語音信號進行編碼時進行碼書深度優(yōu)先搜索的模塊,其中碼書由一個碼矢量AK的集合組成,定義了多個不同位置p的并且包括N個幅度非零的脈沖,其中每個脈沖都分配至碼矢量的預定有效位置P;深度優(yōu)先搜索涉及(a)將N個幅度非零的脈沖劃分至M個子集,每一子集至少包括一個幅度非零的脈沖,(b)一樹結構,每一節(jié)點代表了N個幅度非零的脈沖的有效位置p,該樹結構定義了多個搜索級,每一搜索級與M個子集中的一個相關聯(lián),并有自己的脈沖順序規(guī)則和選擇準則;碼書深度優(yōu)先搜索裝置包括---對于樹結構的第一搜索級,第一裝置,根據(jù)相應的脈沖順序規(guī)則,在N個幅度非零的脈沖中至少選擇一個以形成相應子集;第一裝置,根據(jù)相應的選擇準則,在上述至少一個幅度非零的脈沖的有效位置p中選擇至少一個有效位置以定義至少一條通過樹節(jié)點的路徑;---對于樹結構的每一后續(xù)搜索級第二裝置,根據(jù)相應的脈沖順序規(guī)則,選擇至少一個先前未被選擇的上述幅度非零的脈沖,以形成相應子集;第二裝置,后續(xù)搜索級根據(jù)相應的選擇準則,在上述至少含有一個幅度非零脈沖的有效位置p的相應子集中選擇至少一個有效位置,以延伸至少一條通過樹節(jié)點的上述路徑;其中在第一搜索級定義并在后續(xù)搜索級延伸的每條路徑?jīng)Q定了碼矢量AK的N個幅度非零的脈沖的各個位置p,從而在聲音編碼時構成了一個候選碼矢量。
通過對帶有附圖的實施例的非嚴格描述,本發(fā)明的目的、優(yōu)點和其它特征會有更明顯的體現(xiàn)。
圖1為根據(jù)本發(fā)明的一種編碼系統(tǒng)實施例的原理框圖,系統(tǒng)包括一脈沖位置似然估計器和一優(yōu)化控制器;圖2為與圖1所示編碼系統(tǒng)對應的解碼系統(tǒng)原理框圖;圖3為圖1中編碼系統(tǒng)的優(yōu)化控制器為計算最優(yōu)碼矢量使用的若干嵌套循環(huán)的圖解表示;圖4a的樹結構作為一個例子來說明圖3中的“嵌套循環(huán)搜索”技術的一些特色;圖4b是在較低層處理的性能值超過某一給定門限的條件時圖4a的樹結構;這是一種僅僅把注意力集中最可能的樹區(qū)域的快速樹搜索方法;圖5顯示了深度優(yōu)先搜索技術是如何通過樹結構進行脈沖位置組合的;本例是根據(jù)交織單脈沖排列設計的一個40位置的碼矢量的10脈沖碼書;圖6是圖1中的脈沖位置似然估計器和優(yōu)化控制器的操作流程圖;圖7是典型蜂窩通信系統(tǒng)的結構框圖。
雖然在本說明中,碼書深度優(yōu)先搜索算法及相應裝置應用于蜂窩通信系統(tǒng)是作為一個無限制使用范圍的例子而公開的,但需指出,本算法及裝置可用于許多其它需要語言編碼的通信系統(tǒng),并且可以獲得同樣的效果。
在蜂窩通信系統(tǒng)1(圖7)中,大片地理區(qū)域劃分為若干小區(qū)以提供通信業(yè)務。每一小區(qū)有一蜂窩基站2,提供無線信令信道(radio signallingchannels)及音頻與數(shù)據(jù)信道。
在蜂窩基站所能覆蓋的范圍內(nèi)(小區(qū)),無線信令信道用于尋呼移動無線電話(移動發(fā)射機/接收機單元)如3,播叫本小區(qū)或其它小區(qū)內(nèi)的其它無線電話3,或者撥入其它網(wǎng)絡,如公用電話交換網(wǎng)(PSTN)4。
一旦無線電話3成功地撥叫或接收到一個電話,無線電話3所在小區(qū)的基站2就建立起一條語音或數(shù)據(jù)信道,基站2、無線電話3通過該語音或數(shù)據(jù)信道進行通信。在通話期間,無線電話3通過信令信道接收控制和定時信息。
如果在通話期間,無線電話3由一個小區(qū)進入另一個小區(qū),那么無線電話將把通話切換到給新小區(qū)的一個可用的語音或數(shù)據(jù)信道上。與之類似,如果在漫游時沒有通話,則在信令信道上傳送一控制信息,使無線電話3注冊在新小區(qū)的基站2上。這種方式使得在廣大地理區(qū)域上進行移動通信成為可能。
蜂窩通信系統(tǒng)1還包括一控制基站2與公用電話交換網(wǎng)4之間通信,例如在無線電話3與公用電話交換網(wǎng)(PSTN)4之間的通信或者第一小區(qū)內(nèi)的無線電話3與第二小區(qū)內(nèi)的無線電話3之間的通信的終端設備5。
當然要建立某一小區(qū)內(nèi)的每一無線電話3與該小區(qū)基站2之間的通信,雙向無線通信子系統(tǒng)是必不可少的。雙向無線通信子系統(tǒng)通常在無線電話3和蜂窩基站2上包括(a)進行語音編碼以及通過如天線6或7發(fā)射編碼的發(fā)射機,(b)通過同樣的天線6或7接收傳輸?shù)木幋a語音信號及解碼裝置的接收機。一般技術人員所共知,為了壓縮通過雙向無線通信系統(tǒng),即無線電話3與基站2之間,傳送話音所需的帶寬,語音編碼必不可少的。
本發(fā)明的目的是提供一種高效的數(shù)字語音編碼技術,在例如蜂窩基站2和無線電話3通過語音或數(shù)據(jù)通道進行雙向語音傳送時,能夠獲得良好主觀品質(zhì)/比特率的折衷。圖1是一適于采用本技術的數(shù)字語音編碼裝置的結構框圖。
圖1的語音編碼系統(tǒng)與U.S父專利申請No.07/927,528圖1中所示的編碼裝置完全相同,在父申請的圖1中已加入了根據(jù)本發(fā)明的脈沖位置估計器112。父美國專利申請No.07/927,528是關于發(fā)明“基于代數(shù)碼的有效語音編碼的動態(tài)碼書”的專利申請,于1992年9月10日提交。
輸入的模擬語音信號經(jīng)過采樣以數(shù)據(jù)塊(bloCK)的形式處理。需指出本發(fā)明并不限于語音信號,也可考慮用于其它類型聲音的編碼。
在圖示例子中,輸入的采樣語音數(shù)據(jù)決S(圖1)由L個連續(xù)采樣點組成。在CELP中,L定義為子幀長(subframe length),通常在20~80之間取值,L個樣點組成的塊定義為L維矢量。在編碼過程中,產(chǎn)生不同的L維矢量。以下給出圖1和圖2中有關矢量及傳輸參數(shù)的列表主要L維矢量列表S輸入語音矢量R基音去除的殘余矢量X目標矢量D后向濾波目標矢量AK代數(shù)碼書中下標為k的碼矢量CK更新矢量(濾波后的碼矢量)傳輸參數(shù)列表k碼矢量下標(代數(shù)碼書的輸入)g增益STP短時預測參數(shù)(定義為A(z))及LTP長時預測參數(shù)(定義基音增益b,基音延遲T)解碼原則首先描述圖2的語音解碼裝置。圖2顯示了數(shù)字輸入(信號隔離器205的輸入)和語音采樣輸出(合成濾波器204的輸出)之間執(zhí)行的不同操作的步驟。
信號隔離器205接收數(shù)字輸入信道上的二進制信息,從中提取出下標k,增益g,短時預測參數(shù)STP,長時預測參數(shù)LTP。語音信號的當前L維矢量在這4個參數(shù)的基礎上合成,解釋如下。
圖2的語音解碼裝置由一動態(tài)碼書208構成,碼書包括一代數(shù)碼書發(fā)生器201,一自適應前置濾波器202,一放大器206,一加法器207,一長時預測器203,和一合成濾波器204。
第一步,代數(shù)碼書根據(jù)下標k產(chǎn)生碼矢量AK。
第二步,碼矢量AK經(jīng)過輸入有短時預測參數(shù)STP的自適應前置濾波器202處理,產(chǎn)生輸出更新矢量CK。自適應前置濾波器202動態(tài)地控制輸出更新矢量CK的頻率成分以提高語音質(zhì)量,即減少干擾人耳的頻率造成的聽覺失真。通常,自適應前置濾波器202的轉移函數(shù)如下式Fa(z)=A(z/γ1)A(z/γ2)]]>Fb(z)=1(1-b0zT)]]>fa(z)是共振峰前置濾波器,γ1、γ2是常數(shù),0<γ1<γ2<1。該前置濾波器能增加共振峰區(qū)域,在碼率低于5bit/s時,工作非常有效。
Fb(z)是基音前置濾波器,T是時變基音延遲,b0是常數(shù)或等于當前或先前子幀的長時基音預測參數(shù)的量化值。Fb(z)可在任何碼率有效地增強基音諧波頻率(Pitch harmonic frequencies)。因此F(z)通常包括一基音前置濾波器,有時附加一共振峰前置濾波器,即F(z)=Fa(z)fb(z)。當然也可使用其它類型的前置濾波器。
依據(jù)CELP技術,首先碼書208輸出的更新矢量CK在放大器206中由增益因子g進行尺度變換從而獲得取樣語音信號S輸出,然后加法器207將變換后的波形gCK與輸入LTP參數(shù)的長時預測器203的輸出E(合成濾波器204的信號激勵的長時預測分量〕相加。長時預測器和加法器形成反饋環(huán),其轉移函數(shù)B(z)定義為B(z)=bz-T,b、T分別是上文定義的基音增益和延時。
預測器203是一個依據(jù)上次接收的LTP參數(shù)b、T對語音的基音周期建模的轉移函數(shù)的濾波器。它引入了樣值的適當?shù)幕粼鲆鎎和時延T。復合信號E+gCK構成了轉移函數(shù)是1/A(z)的合成濾波器204的激勵信號。濾波器204依據(jù)上次接收的STP參數(shù)形成正確的波譜,更確切地說,濾波器204對語音的共振頻率(共振峰)建模。輸出塊S就是合成的抽樣語音信號,使用本領域熟知的抗混迭濾波技術,它可以轉化為模擬信號。
有許多設計代數(shù)碼書208的方法。本發(fā)明的代數(shù)碼書是由N個幅度非零的脈沖(或簡稱非零脈沖)組成的矢量構成。
以Pi代表第i個幅度非零的脈沖的位置,
代表其幅度。因為第i個脈沖的幅度固定或有某種方法可在搜索前確定出
,所以假設幅度
為已知量。
軌跡i(track i)用Ti表示,它代表了在1到L間的取值的位置Pi的集合。在L=40的條件下給出一些典型的軌跡集。第一個例子是在上文中提到的有關“單脈沖交織排列(ISSP)″的U.S專利申請No.927,528中介紹的設計實例。在該設計實例中,40個位置的集合分至5個交織軌跡,每一軌跡有40/5=8個有效位置,需要3bit確定一脈沖的這8=23個有效位置,因此,對于這種特定的代數(shù)碼書結構,共需5×3=15個編碼位以確定脈沖的位置。
設計1ISSP(40,5)i 軌跡(第i個脈沖的有效位置)1 T1={1,6,11,16,21,26,31,36}2 T2={2,7,12,17,22,27,32,37}3 T3={3,8,13,18,23,28,33,38}4 T4={4,9,14,19,24,29,34,39}5 T5={5,10,15,20,25,30,35,40}在這40個位置屬于一個且僅屬于一個軌跡的意義上,該ISSP是完備的??梢杂卸喾N方法從一個或多個ISSP推導出滿足特定的脈沖數(shù)目或編碼位要求的碼書結構。例如,在ISSP(40,5)中簡單地忽略軌跡5或?qū)④壽E4、5看作一個軌跡,就可得到一4脈沖碼書。設計2,3提供了完備的ISSP設計的其它實例。
設計2ISSP(40,10)i 軌跡(第i個脈沖的有效位置)1 T1={1,11,21,31}2 T2={2,12,22,32}3 T3={3,13,23,33}9 T4={9,19,29,39}10 T5={10,20,30,40}設計3ISSP(48,12)i 軌跡(第i個脈沖的有效位置)1 T1={1,13,25,37}2 T2={2,14,26,38}3 T3={3,15,27,39}4 T4={4,16,28,40}5 T5={5,17,29,41}… ……11 T11={11,23,35,47}12 T12={12,24,36,48}注意在設計3中,軌跡T5至T12的最后一個脈沖的位置落在了子幀長度L=40之外,此時,最后一個脈沖將被忽略。
設計4兩個ISSP(40,1)的和i 軌跡(第i個脈沖的有效位置)1 T1={1,2,3,4,5,6,7,…,39,40}2 T2={1,2,3,4,5,6,7,…,39,40}在設計4中,軌跡T1、T2允許40個有效位置的任何一個位置,兩者重疊。當幾個脈沖占據(jù)了同一位置時,它們的幅度簡單相加。
圍繞ISSP的設計思想可以建立各種碼書。
編碼原則抽樣后的語音信號S以連續(xù)塊的形式由圖1中的編碼系統(tǒng)編碼。編碼系統(tǒng)分為11個模塊,102到112。因為大多數(shù)模塊的功能與U.S父專利申請No.07/1927,328的對應部分相同,所以在下面的敘述中僅簡單解釋各模塊的功能和執(zhí)行的操作,而將注意力集中在與公開的U.S父專利申請No.07/927,528相比新的部分。
依照先前的技術,每一L個樣點組成的語音信號塊由一線性預測編碼(LPC)譜分析儀102生成線性預測編碼(LPC)參數(shù)集,LPC參數(shù)稱為短時預測參數(shù)(STP),確切地說,分析儀對每一L個樣點的塊S的譜特性建模。
白化濾波器103對L個樣點的輸入塊S白化濾波。基于當前的STP參數(shù)的白化濾波器的轉移函數(shù)如下A(z)=Σi=0Maiz-i]]>a0=1,z是Z變換的一般特征變量。如圖1所示,白化濾波器103輸出殘余矢量R。
基音提取器104計算、量化LTP參數(shù)基音延時T和基音增益g。提取器104的初始狀態(tài)值設置為由初始狀態(tài)提取器110輸入的FS值。在U.S父專利申請No.07/927,528中敘述了計算與量化LTP參數(shù)的詳細過程,相信這也是普通技術人員所熟知的技術,所以在本申請中不再進一步展開敘述。
濾波響應特征器105輸入STP和LTP參數(shù),它為下述步驟計算濾波器響應特征FRC。FRC信息由以下三個分量組成,其中n=1,2,…,Lf(n)F(z)的響應。注意,F(xiàn)(z)通常包括一基音前置濾波器。h(n)1/A(zr-1)對f(n)的響應,r是感知因子。一般而言,h(n)是對前置濾波器F(z),感知加權濾波器W(z),合成濾波器1/A(z)的級聯(lián)F(z)W(z)/A(z)的脈沖響應。F(z)和1/A(z)與解碼器使用的濾波器相同。U(i,j)依據(jù)下述表達式的h(n)的自相關U(i,j)=Σk=1Lh(k-i+1)h(k-j+1)]]>i=1,2,…,L1≤i≤j≤L;當n<1時,h(n)=0;
長時預測器106輸入上次的激勵信號(即前一子幀的E+gCK),利用合適的基音延時T和增益b產(chǎn)生一個新的E分量。
感知濾波器107的初始狀態(tài)設置為由初始狀態(tài)提取器110輸入的值FS。圖1的減法器計算基音去除殘余矢量R′=R-E,R′輸入至感知濾波器107,在107的輸出端得到目標矢量X。如圖1所示,濾波器107依據(jù)輸入的STP參數(shù)改變其轉移函數(shù)。基本上說,X=R′-P,P代表包括了過去激勵的震鈴(ringing)的長時預測成分。誤差Δ的MSE指標由下述矩陣形式表示mink||Δ||2=mink||S′-S^′||2=min||S′-[p-gAkHT]||2=mink||X-gAkHT||2]]>其中Δ=S^′-S′,S^′,]]>S′分別是
,S經(jīng)過具有如下轉移函數(shù)的感知加權濾波器的輸出。
,r=0.8是一感知常數(shù)H是下述的h(n)響應形成的一L×L的下三角Toeplitz矩陣,h(0)占據(jù)了矩陣的對角線,h(1),h(2),…h(huán)(L-1)分別占據(jù)了相應的下三角。
圖1的濾波器108完成后向濾波。令上文的誤差表達式對增益的一階偏導為0,可求出最佳增益值∂||Δ||2∂g=0]]>g=X(AkHT)T||AkHT||2]]>g為上述值時,最小誤差變?yōu)閙ink||Δ||2=mink{||X||2-(X(AkHT)T)2||AkHT||2}]]>目的是找出取得最小誤差時對應的具體下標k。觀察發(fā)現(xiàn)‖X‖2是固定值,所以使下面的值取最大值即可求出下標k。maxk(X(AkHT)T)2||AkHT||2=maxk((XH)AkT)2αk2=maxk(DAkT)2αk2]]>D=(XH)αk2=‖AkHT‖2后向濾波器108計算出后向濾波目標矢量D=(XH)?!昂笙驗V波”一詞源于將(XH)解釋為X的時間翻轉濾波。
優(yōu)化控制器109的作用是為編碼當前L個樣點的塊在代數(shù)碼書可用的碼矢量中選出最佳碼矢量。在一具有N個幅度非零的脈沖的碼矢量組成的集合中,最佳碼矢量的選擇準則是以使一比值取最大值的形式給出的基本選擇準則k=maxk-1[Qk(N)]]]>Qk(N)=[(DAkT)2αk2]]]>AK由N個幅度非零的脈沖組成,上式中的分子是DAkT=ΣDpiSpi]]>的平方。D是后向濾波目標矢量,AK是N個幅度
非零脈沖的代數(shù)碼矢量。
分母是一能量項,可表示為αk2=Σi=1NSpiU(pi,pj)+2Σi=1N-1Σj=i+1NSpiSpjU(pi,pj)]]>U(Pi,Pj)是位置在Pi,Pj的兩單位脈沖的相關,一個在位置Pi,一個在位置Pj。依據(jù)上述等式,矩陣在濾波響應模塊105中計算,并包含在圖1中的FRC參數(shù)集中。
快速計算分母的方法涉及圖4的N層嵌套循環(huán)。圖中S(i)、SS(i,j)用在表示量值
的地方。計算分母是最耗時間的操作。圖4中從最外層到最內(nèi)層的每一層循環(huán)計算分母的操作可分別在單獨的一行寫出。αk2=Sp12U(p1,p1)]]>+Sp22U(p2,p2)+2Sp1Sp2U(p1,p2)]]>+SP32U(P3,P3)+2[SP1SP3U(P1,P3)+Sp2SP3U(P2,P3)]]]>+..........SPN2U(PN,PN)+2[Sp1SpNU(p1,pN)+Sp2SpNU(p2,pN)+.....+Spn-1SpNU(pN-1,pN)]]]>Pi是第i個幅度非零的脈沖的位置。
如果優(yōu)化控制器執(zhí)行一些預運算,將由濾波器響應特征器105輸入的矩陣U(i,j)依照下面的關系變換成U′(i,j),前面的等式就可簡化。
U′(j,k)=SjSkU(j,k)Sk是位置為k的一獨立脈沖依照下文中的幅度估計的量化值選擇的幅度。為精簡等式,在后續(xù)描述中,因子2將忽略。
利用新矩陣U′(j,k),圖3中從最外到最內(nèi)的每層循環(huán)計算分母的快速算法按如下形式寫在單獨一行。αk2=U′(p1,p1)+U′(p2,p2)+U′(p1,p2)+U′(P3,P3)+U′(P1,P3)+U′(P2,P3)+..... ..... .......
+U′(pN,pN)+U′(p1,pN)+U′(P2,PN)+.......+U′(pN-1,pN.)圖4a與4b圖示了兩個樹結構,體現(xiàn)了圖3描述的“循環(huán)嵌套搜索”的一些特征,從而與本發(fā)明相比較。圖4a樹的底層終結結點圖示了對于每一脈沖可位于4個位置的5脈沖例子(N=5)的所有的脈沖位置組合。窮舉“循環(huán)嵌套”技術基本是按樹節(jié)點從左至右的方式進行。它的缺點之一是搜索復雜度是脈沖數(shù)目N的增函數(shù)。為了能夠處理具有大量數(shù)目N的脈沖的碼書,只能滿足于碼書的局部搜索。圖4b與4a的結構相同,但將注意力集中在了樹中最可能的區(qū)域,從而實現(xiàn)快速搜索。精確地說,較底層的操作并非是系統(tǒng)的,而是基于性能參數(shù)超過某一門限的條件之下的。
深度優(yōu)先搜索現(xiàn)在,我們把注意力轉移向另一種更快的技術,即本發(fā)明的目的,該技術由圖1中的脈沖位置似然估計器112和優(yōu)化控制器109執(zhí)行。首先描述其總體特征,然后是該技術的一些具體實施例。
搜索的目的是在假定脈沖幅度固定或搜索前已由某種信號機制,例如在1995年2月6日提交的共同未決的U.S專利申請NO.08/383,968中所描述的那樣,確定出了信號幅度的條件下,找出N脈沖位置最佳集的碼矢量?;具x擇準則是使上文提到的比值QK取最大值。
為減少搜索復雜度,一次決定Nm個脈沖的位置。更準確地說,這N個有效脈沖劃分至(圖6步驟601)M個Nm脈沖組成的非空子集,N1+N2+...+Nm…+NM=N。對于最前面的J=N1+N2…+Nm-1個脈沖的特定位置選擇稱為一m級路徑或長度為J的路徑。在僅考慮這J個相關脈沖時,選擇一J脈沖位置路徑的基本準則是比值QK(J)。
搜索從子集#1開始,依據(jù)樹結構對后續(xù)子集處理,其中在樹的m級搜索m子集。
在第一層搜索的目的是研究子集#1的N1個脈沖及其有效位置以決定出一條或若干長度為N1的候選路徑,構成第一層的樹結點。
在m層,研究Nm個新脈沖和其有效位置,將在m-1層的每個終結結點的路徑都延伸為m層的長度為N1+N2+…+Nm的候選路徑,一個或一些候選路徑用于構成m層結點。
最佳碼矢量就是對所有的M層結點使比值QK(N)最大的長度為N的路徑。
在上文提到的U.S專利申請NO.927,528中,脈沖(或軌跡)按預定順序處理,在本發(fā)明中,脈沖以不同的順序處理。事實上,在每次搜索過程特定的情形下,脈沖是按照最有可能的順序處理的。最終使用了一新順序下標n(n=1,2,…,N),搜索中處理的第n個脈沖的(D)標識號(由“脈沖順序函數(shù)”i=i(n)給出。例如對于一5脈沖碼書,在某些特定時刻,搜索路徑按下述脈沖順序函數(shù)處理n=1 2 3 4 5 順序號i=4 3 1 5 2 脈沖(或軌跡)ID為了智能地猜測出任一時刻何種脈沖順序更有可能,本發(fā)明引入了基于語音信號的“脈沖位置似然估計矢量”B。估計矢量B的第p個分量Bp表示了一脈沖在尋找的最佳碼矢量中占據(jù)位置p(p=1,2,...,L)的可能性。最佳碼矢量仍然是未知量,本發(fā)明的目的就是公開如何從和語音相關的信號中推導出最佳碼矢量的一些特征。
按如下方式使用估計矢量B首先,估計矢量B作為決定哪個軌跡i或j更易猜測出脈沖位置的基礎,以便先處理最易猜測出脈沖位置的軌跡。這一屬性經(jīng)常用在樹結構的第一層選擇Nm個脈沖的脈沖順序規(guī)則中。
其次,對一給定軌跡,估計矢量B表明了每一有效位置的相對可能性。因為在前幾級只有很少的脈沖在選擇有效位置時能提供穩(wěn)定的性能,所以在樹結構的前幾級用估計矢量代替基本選擇準則QK(j)作為選擇準則更為有利,從語音相關的信號中得到脈沖位置的似然估計矢量B的這一優(yōu)選的方法包括計算歸一的后向濾波目標矢量D,
和歸一的基音去除殘余矢量信號R′,
的和,從而計算出脈沖位置的似然估計矢量BB=(1-β)D||D||+βR′||R′||]]>,β為一固定常數(shù),典型值為1/2(依據(jù)代數(shù)碼中的非零脈沖的百分比,β在0,1間取值)。
這里需指出同樣的估計矢量B在1995年2月6日提交的共同未決的U.S專利申請No.08/383,968中用于不同的含義和目的。該專利申請是關于發(fā)明“快速語音編碼的信號選擇脈沖幅度代數(shù)碼書”的專利申請,它公開了一種選擇最優(yōu)或近似最優(yōu)的脈沖幅度組合的方法。因為非零脈沖的幅度可以假設為q個值中的一個,q>1,所以該方法在代數(shù)碼書設計中非常有用。觀察發(fā)現(xiàn)為了有效地進行語音編碼,從信號自身推出好的估計例如B是非常重要的。事實上,除了作為位置或幅度的估計,B也是碼矢量AK自身的估計。因此,任何綜合上述共同未決的U.S專利申請No.08/383,968和本專利申請的搜索方法都明顯地屬于本方法的原則之列。以下是在本發(fā)明范圍之列的典型組合技術。在本公開材料中早已指出,當兩重疊軌跡中的兩個或多個脈沖在一幀中位置相同時,兩脈沖幅度相加。這種位置幅度折衷可以由格搜索共同優(yōu)化。
為方便起見,下面給出已定義的常量變量。
常量列表常數(shù) 例值 名稱/含義L 40幀長(位置數(shù))N 10脈沖數(shù)Li4 軌跡i中可能的位置數(shù)M 5 層數(shù)Nm2 m層的脈沖數(shù)Sp-1位置p的幅度Pi13第i個脈沖的位置Pi(n)19第n個處理脈沖的位置變量列表符號取值范圍標準用法p 1-L 幀內(nèi)的位置號I 1-N 脈沖號m 1-M 子集號n 1-N 處理順序號i(n)1-N 第n個處理的脈沖號Pi(n)1-L 第n個處理的脈沖位置Sp{±1} 位置p的幅度Spi(n){±1} 第n個脈沖所在位置的幅度深度優(yōu)先搜索實施例下面是一些深度優(yōu)先搜索的典型實施例。
搜索技術#1代數(shù)碼書L=40;N=5ISSP(40,5)(即L1=L2==L5=8)搜索過程層數(shù)m 脈沖數(shù)Nm候選路徑脈沖順序規(guī)則 選擇準則11 10 R1,R2 B22 2 R2 QK(2)32 2 R2 QK(4)規(guī)則R1第一層路徑建立時,依次考慮5個軌跡,對于每一軌跡依次選擇使Bp最大化的兩個位置中的一個,選擇出第一脈沖位置Pi(1)的10條路徑。規(guī)則R2規(guī)則2定義了用于第2,3層的4脈沖脈沖順序函數(shù),將剩余的4個下標排列在一個圓環(huán)上,以順時針順序從i(1)脈沖(第一層的節(jié)點數(shù)目)的右面開始重新編號。
稱為搜索技術#2的碼書搜索的第二個例子能更明確地說明深度優(yōu)先原則。
搜索技術#2代數(shù)碼書L=40;N=10ISSP(40,10)(即L1=L2=…L10=4)搜索過程層數(shù)m 脈沖數(shù)Nm候選路徑 脈沖順序規(guī)則 選擇準則
129R3B221R4QK(4)321R4QK(6)421R4QK(8)521R4QK(10)規(guī)則R3選擇脈沖i(1),根據(jù)能夠使對所有的p使Bp取得最大值的原則選擇其位置。對于i(2),在剩余的9個脈沖中依次選擇,選擇某i(2)的標準是在軌跡內(nèi)使Bp取最大值。規(guī)則R4第一層結束后,將剩余的8個下標排成環(huán),以順時針順序從i(2)的右面開始重新編號,由此決定出整個脈沖順序函數(shù)。
圖5,6說明了搜索技術#2,圖5為依據(jù)單脈沖交織排列,對于40位置碼矢量的10脈沖碼書應用深度優(yōu)先搜索技術#2的樹結構;圖6為相應流圖。
L=40個位置劃分至10個軌跡,每一軌跡與碼矢量中N=10個幅度非零的脈沖關聯(lián),10個軌跡依照N個單脈沖排列進行交織。步驟601計算前文所述的脈沖位置似然估計矢量B。步驟602計算絕對值最大的估計Bp的位置p。步驟603(開始第一層路徑建立操作)選擇脈沖(即軌跡)i(1)和其有效位置以與步驟602中計算出的位置相符合(圖5,501)。步驟604(結束第一層路徑建立操作)對于i(2)依次在剩余的9個脈沖選擇,選擇標準是在所述i(2)的軌跡中使Bp最大的位置。由此產(chǎn)生了9條不同的候選路徑(圖5中的502)。這些候選路徑中的每一條通過后續(xù)級的延伸形成了9個不同的碼矢量。很明顯,第一層的目的就是在B估計的基礎上挑選出9個好的脈沖起始對。正是由于此原因,圖5中的第一層的路徑建立操作被稱為“基于信號的脈沖篩選”。步驟605(規(guī)則R4)為節(jié)省計算時間,后續(xù)4級的脈沖順序是預定的。剩余的8個下標排成環(huán),以順時針順序從i(2)的右面開始重新編號,從而決出n=3,4,.......,10的脈沖順序函數(shù)i(n)。依此順序選出第二層脈沖i(3)、i(4),選出第三層i(5)、i(6),依此類推。步驟606,607,608,609(2至5層)為了獲得有效性,設計成了2至5層,即依據(jù)相應的選擇準則QK(2m),m=2,3,4,5為層號,對兩個脈沖的4個位置的16種組合進行窮舉搜索。
因為2至5層每層的路徑建立操作僅產(chǎn)生一條候選路徑(即分支因子為1)(圖5的504),搜索的復雜度僅隨脈沖總數(shù)線性增加,故2至5層執(zhí)行的操作可看作深度優(yōu)先搜索。樹搜索技術在其結構、標準和所處理問題的領域有很大不同,在人工智能領域,通常對“廣度優(yōu)先搜索”和“深度優(yōu)先搜索”這兩類搜索原則進行比較。步驟6109條不同的1級候選路徑在604步驟產(chǎn)生,在2至5層延伸(步驟605至609),構成了9個候選碼矢量AK(圖5,505)。
步驟610的目的是比較這9個候選矢量AK,依據(jù)最后一層的選擇準則,即QK(10),選出最佳碼矢量。
下面以第三個碼書深度優(yōu)先搜索的例子“搜索技術3”說明幾個脈沖占據(jù)相同位置的情況。
搜索技術#3不超過10個脈沖代數(shù)碼書L=40;N=10 不同脈沖數(shù)≤10兩個ISSP(40,5)(即L1=L2=…L5=8;L6=L7=…L10=8)搜索過程層數(shù)m 脈沖數(shù)Nm候選路徑 脈沖順序規(guī)則 選則準則1 250 R5 B2 22 R6 QK(4)3 22 R6 QK(6)
421R6QK(8)521R6QK(10)規(guī)則R5注意兩個脈沖占據(jù)了相同的位置,它們幅度相加得到一個幅度加倍的脈沖。規(guī)則5決定了選擇前兩個脈沖的位置的方法以提供第一層候選路徑集合,第一層候選路徑的節(jié)點對應于在5個不同軌跡中選出使Bp最大的一個幅度加倍脈沖,及通過在5個軌跡中選出使Bp最大的兩位置從10脈沖集合中選出所有兩位置的組合。第一層的候選路徑有節(jié)點。規(guī)則R6類似規(guī)則R4雖然以上對本發(fā)明的推薦實施例進行了詳細描述,但是在不背離本發(fā)明宗旨、在附屬專利要求的范圍,可對實施例進行任意修改。本發(fā)明可以處理語音信號以外的其它聲音信號。這些改變保留了本發(fā)明的基本原則,顯然仍屬于本發(fā)明范圍之列。
權利要求
1.一種對聲音信號編碼時執(zhí)行碼書深度優(yōu)先搜索的方法,其中所述的碼書包括一個碼矢量AK的集合,每個碼矢量定義了多個不同位置p并且包括N個幅度非零的脈沖,每個脈沖可分配至碼矢量的預置有效位置;所述的深度優(yōu)先搜索涉及一M有序的樹結構,每一級m與Nm個幅度非零的脈沖相關聯(lián),Nm為一預置數(shù),Nm>=1與所有所述M層相關的所述預置數(shù)的和與組成所述碼矢量的幅度非零的脈沖數(shù)目N相等,樹結構的每一層m還涉及一路徑建立操作、一給定脈沖順序規(guī)則、一給定的選擇準則;所述的碼書深度優(yōu)先搜索操作包括以下步驟---在樹結構的第一層相關的路徑建立操作包括根據(jù)相應的脈沖順序規(guī)則,所述N個幅度非零的脈沖中選擇N1個脈沖;根據(jù)相應的選擇準則,在N1個幅度非零的脈沖的P個有效位置中選擇至少一個有效位置,從而定義至少一個第一層候選路徑;---在樹結構的m層,相應的路徑建立操作是通過延伸(m-1)層的一條候選路徑迭代定義了一條m層候選路徑,步驟如下根據(jù)相應的脈沖順序規(guī)則,選擇建立m-1級路徑時沒有選擇的幅度非零的Nm個脈沖;根據(jù)相應的選擇準則,在這Nm個幅度非零的脈沖中至少選擇一個有效位置P,從而定義至少一個m層候選路徑;其中源于一條第一層候選路徑并在樹結構的后續(xù)級路徑建立中延伸的一條M層候選路徑?jīng)Q定了碼矢量中N個幅度非零的脈沖的各個的位置P,由此定義了一個候選碼矢量AK。
2.一種聲音編碼的碼書深度優(yōu)先搜索的方法,其中所述的碼書由一個碼矢量AK的集合組成,每個碼矢量定義了多個不同位置p并且包括N個幅度非零的脈沖組成,其中每個脈沖都分配至碼矢量的預效位置P;所述的深度優(yōu)先搜索涉及(a)將N個幅度非零的脈沖劃分至M個子集,每一子集至少包括一個幅度非零的脈沖,(b)一樹結構,其每一節(jié)點代表了N個幅度非零的脈沖的有效位置p,該樹結構定義了多個搜索級,每一搜索級對應于M個子集中的一個,并有給定的脈沖順序規(guī)則和選擇準則;所述的碼書深度優(yōu)先搜索操作包括以下步驟---在樹結構的第一搜索級,根據(jù)相應的脈沖順序規(guī)則,在N個幅度非零的脈沖中至少選擇一個以形成相應子集;根據(jù)相應的選擇準則,在所述至少一個幅度非零的脈沖的有效位置p中至少選擇一個有效位置以定義至少一條通過樹節(jié)點的路徑;---在樹結構的每一后續(xù)搜索級根據(jù)相應的脈沖順序規(guī)則,至少選擇一個先前未被選擇的所述幅度非零的脈沖,以形成相應子集;根據(jù)相應的選擇準則,在所述至少有一個幅度非零脈沖的有效位置p的相應子集中至少選擇一個有效位置,以延伸至少一條通過樹節(jié)點的上述路徑;其中在第一搜索級定義并在后續(xù)搜索級延伸的每條路徑確定了碼矢量AK的N個幅度非零的脈沖的各個位置p,從而在聲音編碼時構成了一個候選碼矢量。
3.權利要求2描述的碼書深度優(yōu)先搜索執(zhí)行方法,其中所述的至少一條路徑包括若干路徑,所述的樹結構的搜索級包括一最后搜索級,并且其中所述的方法在樹結構的最后搜索級包括聲音編碼時依照相應的選擇準則選擇所述路徑定義的一候選碼矢量AK的步驟。
4.權利要求2描述的碼書深度優(yōu)先搜索執(zhí)行方法,進一步包括依照至少一個交錯單脈沖排列導出N個幅度非零的脈沖的預置有效位置p的步驟。
5.權利要求2描述的碼書深度優(yōu)先搜索執(zhí)行方法,其中,在樹結構的每一所述后續(xù)搜索級,所述選擇步驟包括對于在前搜索級選出的脈沖位置p定義并且由所述搜索級對應的至少有一個脈沖的子集的每一有效位置p延伸的每條路徑,計算一給定的算術比值;保留使所述比值取最大值的脈沖位置p定義的延伸路徑。
6.權利要求2描述的碼書深度優(yōu)先搜索執(zhí)行方法,其中,在樹結構的第一搜索級,選擇步驟如下及計算聲音信號的脈沖位置似然估計矢量;依照所述的脈沖位置似然估計矢量選擇所述相應子集的至少一個幅度非零的脈沖,及其至少一個有效位置p。
7.權利要求6描述的碼書深度優(yōu)先搜索執(zhí)行方法,其中計算脈沖位置似然估計矢量的步驟包括處理聲音信號,產(chǎn)生一目標信號X,一后向濾波目標信號D,一基音去除殘余信號R’;計算脈沖位置似然估計矢量以響應至少一個所述目標信號X、后向濾波目標信號D及基音去除殘余信號R′中。
8.權利要求7描述的碼書深度優(yōu)先搜索執(zhí)行方法,其中計算脈沖位置似然估計矢量以響應至少一個所述目標信號X、后向濾波目標信號D、基音去除殘余信號R′中的步驟包括對后向濾波目標信號D的歸一化值
與基音去除殘余信號R′的歸一化值
求和,得到脈沖位置似然估計矢量BB=(1-β)D||D||+βR′||R′||,]]>β為一固定常數(shù)。
9.權利要求8描述的碼書深度優(yōu)先搜索執(zhí)行方法,其中β是0,1間取值的固定常數(shù)。
10.權利要求9描述的碼書深度優(yōu)先搜索執(zhí)行方法,其中β是值為1/2的固定常數(shù)。
11.權利要求2描述的碼書深度優(yōu)先搜索執(zhí)行方法,其中所述的N個幅度非零的脈沖有各自的下標,并且其中在樹結構的所述后續(xù)搜索級,依照相應的脈沖順序規(guī)則選出至少一個先前未選出的幅度非零的脈沖的步驟包括將先前未選出的脈沖的下標排成環(huán)狀,依照順時針順序,從上一級選出的最后一個幅度非零的脈沖的右面開始,選出所述至少一個幅度非零的脈沖。12對聲音信號進行編碼時執(zhí)行碼書深度優(yōu)先搜索的裝置,其中所述碼書由一個碼矢量AK的集合組成,每個碼矢量定義了多個不同位置p并且包括N個幅度非零的脈沖組成,其中每個脈沖都分配至碼矢量的預置有效位置P;所述深度優(yōu)先搜索涉及(a)將N個幅度非零的脈沖劃分至M個子集,每一子集包括至少一個幅度非零的脈沖,(b)一樹結構,每一節(jié)點代表了N個幅度非零的脈沖的有效位置p,該樹結構定義了多個搜索級,每一搜索級與M個子集中的一個對應,并有自己的脈沖順序規(guī)則和選擇準則;所述碼書深度優(yōu)先搜索裝置包括---對于樹結構的第一搜索級,第一裝置,根據(jù)相應的脈沖順序規(guī)則,在N個幅度非零的脈沖中至少選擇一個以形成相應子集;第一裝置,根據(jù)相應的選擇準則,在所述至少一個幅度非零的脈沖的有效位置p中選擇至少一個有效位置以定義至少一條通過樹節(jié)點的路徑;---對于樹結構的每一后續(xù)搜索級,第二裝置,根據(jù)相應的脈沖順序規(guī)則,選擇至少一個先前未被選擇的所述幅度非零的脈沖,以形成相應子集;第二裝置,后續(xù)搜索級根據(jù)相應的選擇準則,在所述至少有一個幅度非零脈沖的有效位置p的相應子集中選擇至少一個有效位置,延伸至少一條通過樹節(jié)點的所述路徑;其中在第一搜索級定義并在后續(xù)搜索級延伸的每條路徑確定了碼矢量AK的N個幅度非零的脈沖的各個位置p,從而在聲音編碼時構成了一個候選碼矢量。
13..權利要求12描述的執(zhí)行碼書深度優(yōu)先搜索的裝置,其中所述的至少一條路徑包括若干路徑,所述的樹結構的搜索級包括一最后搜索級,并且所述的裝置包括對聲音進行編碼時在樹結構的最后搜索級及依照相應的選擇準則選擇由所述路徑定義的一候選碼矢量AK的裝置。
14.權利要求12描述的執(zhí)行碼書深度優(yōu)先搜索裝置,進一步包括依照至少一個交錯單脈沖排列導出N個幅度非零的脈沖的預置有效位置p的裝置。
15.權利要求12描述的執(zhí)行碼書深度優(yōu)先搜索裝置,其中所述的第二裝置包括對由前搜索級選出的脈沖位置p所定義的并且由所述搜索級關聯(lián)的至少有一個脈沖的子集的每一有效位置P所延伸的每條路徑計算一給定的算術比值的裝置;保留使所述比值取最大值的脈沖位置p所定義的延伸路徑的裝置。
16.權利要求12描述的執(zhí)行碼書深度優(yōu)先搜索方法裝置,其中第一挑選裝置和第一選擇裝置包括計算聲音信號的脈沖位置似然估計矢量的裝置;依照所述的脈沖位置似然估計矢量選擇所述相應子集的至少一個幅度非零RN SYP脈沖,及其至少一個有效位置p的裝置。
17.權利要求16描述的執(zhí)行碼書深度優(yōu)先搜索裝置,其中所述計算脈沖位置似然估計矢量的裝置包括處理聲音信號,產(chǎn)生目標信號X,后向濾波目標信號D,基音去除殘余信號R’的裝置;計算脈沖位置似然估計矢量以響應所述目標信號X、后向濾波目標信號D、基音去除殘余信號R′中的至少一個信號的裝置。
18.權利要求17描述的執(zhí)行碼書深度優(yōu)先搜索裝置,其中所述計算脈沖位置似然估計矢量以響應所述目標信號X、后向濾波目標信號D、基音去除殘余信號R′中的至少一個信號的裝置包括對后向濾波目標信號D的歸一化值
與基音去除殘余信號R′的歸一化值
求和,得到脈沖位置似然估計矢量B裝置;B=(1-β)D||D||R′||R′||]]>β為一固定常數(shù)。
19.權利要求18描述的執(zhí)行碼書深度優(yōu)先搜索裝置,其中β是0,1間取值的固定常數(shù)。
20.權利要求19描述的執(zhí)行碼書深度優(yōu)先搜索裝置,其中β是值為1/2的固定常數(shù)。
21.權利要求12描述的執(zhí)行碼書深度優(yōu)先搜索裝置,所述的N個幅度非零的脈沖有各自的下標,其中所述第二裝置包括將先前未選出的脈沖的下標排成環(huán)的裝置;依照順時針順序,從上一級選出的最后一個幅度非零的脈沖的右面開始,選出至少一個幅度非零的脈沖的裝置。
22.服務于已被分為若干蜂窩的大片地理區(qū)域的蜂窩通信系統(tǒng),它包括移動發(fā)射/接收單元;位于所述各蜂窩的蜂窩基站;蜂窩基站間進行通信控制的設備;蜂窩內(nèi)的每一移動用戶和該區(qū)域的基站進行雙向無線通信的子系統(tǒng),在移動單元和蜂窩基站中所述雙向無線通信子系統(tǒng)包括(a)包括進行語音編碼的裝置和傳輸編碼的語音信號的裝置的發(fā)射機,(b)包括接收編碼后信號及對接收信號解碼的裝置的接收機;其中的語音信號編碼裝置包括在對語音信號進行編碼時進行碼書深度優(yōu)先搜索的模塊,其中所述碼書由碼矢量AK的一個集合組成,每個定義了多個不同位置p并且包括N個幅度非零的脈沖組成,其中每個脈沖都分配至碼矢量的預定有效位置P所述深度優(yōu)先搜索涉及(a)將N個幅度非零的脈沖劃分至M個子集,每一子集至少包括一個幅度非零的脈沖,(b)一樹結構,每一節(jié)點代表了N個幅度非零的脈沖的有效位置p,該樹結構定義了多個搜索級,每一搜索級與M個子集中的一個對應,還有自己的脈沖順序規(guī)則和選擇準則;所述碼書深度優(yōu)先搜索裝置包括---對于樹結構的第一搜索級,第一裝置,根據(jù)相應的脈沖順序規(guī)則,在N個幅度非零的脈沖中選擇至少一個以形成相應子集;第一裝置,根據(jù)相應的選擇準則,在所述至少一個幅度非零的脈沖的有效位置p中選擇至少一個有效位置以定義至少一條通過樹節(jié)點的路徑;---對于樹結構的每一后續(xù)搜索級第二裝置,根據(jù)相應的脈沖順序規(guī)則,選擇至少一個先前未被選擇的所述幅度非零的脈沖,以形成相應子集;第二裝置,后續(xù)搜索級根據(jù)相應的選擇準則,在所述至少有一個幅度非零脈沖的有效位置p的相應子集中選擇至少一個有效位置,以延伸至少一條通過樹節(jié)點的所述路徑;其中在第一搜索級定義并在后續(xù)搜索級延伸的每條路徑?jīng)Q定了碼矢量AK的N個幅度非零的脈沖的各個位置p,從而在聲音編碼時構成了一個候選碼矢量。
23..權利要求22描述的蜂窩通信系統(tǒng),其中所述的至少一條路徑包括若干路徑,其中所述的樹結構的搜索級包括一最后搜索級,并且所述的裝置包括對聲音進行編碼時在樹結構的最后搜索級及依照相應的選擇準則選擇由所述路徑定義的一候選碼矢量AK的裝置。
24.權利要求22描述的蜂窩通信系統(tǒng),進一步包括依照至少一個交錯單脈沖排列推導出N個幅度非零的脈沖的預置有效位置p的裝置。
25.權利要求22描述的蜂窩通信系統(tǒng),所述的二級選擇裝置包括對由前搜索級選出的脈沖位置p所定義的并且由所述搜索級關聯(lián)的至少有一個脈沖的子集的每一有效位置P所延伸的每條路徑計算一給定的算術比值的裝置;保留使所述比值取最大值的脈沖位置p所定義的延伸路徑的裝置。
26.權利要求22描述的蜂窩通信系統(tǒng),其中第一挑選裝置和第一選擇裝置包括計算聲音信號的脈沖位置似然估計矢量的裝置;依照所述的脈沖位置似然估計矢量選擇所述相應子集的至少一個幅度非零的脈沖,及其至少選擇一個有效位置p的裝置。
27.權利要求26描述的蜂窩通信系統(tǒng),其中所述計算脈沖位置似然估計矢量的裝置包括處理聲音信號,產(chǎn)生目標信號X,后向濾波目標信號D,基音去除殘余信號R’的裝置;計算脈沖位置似然估計矢量以響應所述目標信號X、后向濾波目標信號D、基音去除殘余信號R′中的至少一個信號的裝置。
28.權利要求27描述的執(zhí)行碼書深度優(yōu)先搜索裝置,其中所述計算脈沖位置似然估計矢量以響應所述目標信號X、后向濾波目標信號D、基音去除殘余信號R′中的至少一個信號的裝置包括對后向濾波目標信號D的歸一化值
與基音去除殘余信號R′的歸一化值
求和,得到脈沖位置似然估計矢量B的裝置;B=(1-β)D||D||+βR′||R′||,]]>β為一固定常數(shù)。
29.權利要求28描述的蜂窩通信系統(tǒng),其中β是0,1間取值的固定常數(shù)。
30.權利要求29描述的蜂窩通信系統(tǒng),其中β是值為1/2的固定常數(shù)。
31.權利要求22描述的執(zhí)行碼書深度優(yōu)先搜索裝置,所述的N個幅度非零的脈沖有各自的下標,所述二級選擇裝置包括將先前未選出的脈沖的下標排成環(huán)的裝置;依照順時針順序,從上一級選出的最后一個幅度非零的脈沖的右面開始,選出至少一個幅度非零的脈沖的裝置。
全文摘要
在聲音編碼時要進行碼書搜索。碼書由40個位置的碼矢量的一個集合組成,每一碼矢量由分至其預置有效位置的N個幅度非零的脈沖組成。為減少搜索復雜度,使用了涉及從1到M排序的樹結構的深度優(yōu)先搜索。每級執(zhí)行路徑建立操作,依照給定的脈沖順序規(guī)則和選擇準則,選出預置數(shù)目的新脈沖,并為這些新脈沖選定有效位置,以延伸來自上一級的一條候選路徑。
文檔編號G10L19/12GK1181151SQ96193196
公開日1998年5月6日 申請日期1996年3月5日 優(yōu)先權日1995年3月10日
發(fā)明者瓊-皮埃爾·阿杜, 克勞德·拉弗拉默 申請人:舍布魯克大學