亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于語音快速編碼的被選信號脈沖幅度的代數碼本的制作方法

文檔序號:7517142閱讀:507來源:國知局
專利名稱:用于語音快速編碼的被選信號脈沖幅度的代數碼本的制作方法
本申請是1996年2月2日提交的中國專利申請?zhí)枮镹o.96193095.0,題為“用于語音快速編碼的被選信號脈沖幅度的代數碼本”的發(fā)明的分案申請。
背景技術
目前具有良好的主觀質量/比特率的折衷的最好的現有技術中有一種所謂的碼激勵線性預測編碼(CELP)技術。按照這一技術,語音信號以含L個樣值的數據塊(即矢量)的形式被采樣和處理,其中L是某個預先設定的數值。CELP技術采用一碼本(code book)。
在CELP技術中的碼本是被稱為L維碼矢量(定義L個不同位置的脈沖組合,并且包括分配給組合中各個位置p=1,2......,L的零幅脈沖和非零幅脈沖)的長為L個樣值的序列的一個附標集合。該碼本包括一個從1至M變化的標引K,其中M表示碼本的大小,有時表示為比特數bM=2b一個碼本可以被貯存在物理存儲器(如查尋表)中,或者指的是將標引與相應碼矢量聯系起來的一種機理(例如一個公式)。
為按照CELP技術合成語音,通過模擬語音信號的頻譜特性的時變?yōu)V波器從碼本中篩選出適當的碼矢量來合成每一塊語音樣值。在編碼器端,對來自碼本的所有候選碼矢量或候選碼矢量的一個子集計算合成的輸出信號(碼本搜索)。得以保留的碼矢量為根據感覺加權失真方法,產生的合成輸出信號最接近于原始語音信號的那個碼矢量。
一種類型的碼本為所謂的“隨機”碼本。這些碼本的一個缺點是它們經常需要相當大的物理存儲空間。從標引到相關的碼矢量的路徑涉及到查尋表,這些查尋表是隨機產生的數字或者對大量的語音訓練集合應用統計技術的結果。從這個意義來講,這些碼本是隨機的,即無規(guī)則的。隨機碼本的容量容易受到存儲空間和/或搜索復雜程度的限制。
另一種類型的碼本為代數碼本。與隨機碼本相比,代數碼本不是隨機的且不需要存儲空間。一個代數碼本是一個附標碼矢量的集合,其中第K個碼矢量的各脈沖的幅度和位置可通過一種不需要或只需要極少的物理存儲空間的規(guī)則來根據其標引K推導出來。因而,代數碼本的容量不受存儲需求的限制。代數碼本也能設計用于高效搜索。
本發(fā)明的目的本發(fā)明的一個目的是提供一種能顯著減少對聲音信號進行編碼時的碼本檢索復雜程度的方法和裝置。這些方法和裝置適用于一大類碼本。
本發(fā)明的內容具體而言,本發(fā)明提供了一種在碼本中進行搜索以對聲音信號編碼的方法。該碼本由一個脈沖幅度/位置組合的集合組成,每個脈沖幅度/位置組合定義了L個不同的位置p,并包括分配給該組合中各個位置p=1,2,...,L的零幅脈沖和非零幅脈沖。每一非零幅脈沖采用(assume)q種可能的幅度之一。該碼本搜索實施方法包括從碼本中預選與該聲音信號有關的脈沖幅度/位置組合的一個子集的步驟;以及僅搜索脈沖幅度/位置組合的該子集以對聲音信號編碼,從而由于僅搜索碼本中脈沖幅度/位置組合的一個子集,而降低搜索復雜度的步驟。預選脈沖幅度/位置組合的一個子集步驟包括與該聲音信號相關地在位置p=1,2,...,L和q種可能幅度之間預先建立一個幅度/位置函數。預先建立一個幅度/位置函數步驟包括給每個位置p預先分配q種可能幅度之一作為有效幅度。給每個位置p預先分配q種可能幅度之一的步驟包括a)對聲音信號進行處理以產生一個經逆向濾波的目標信號D和一個已去除音調的殘留信號R′;b)響應經逆向濾波的目標信號D和已去除音調的殘留信號R′計算幅度預估矢量B;以及c)對每一位置p,量化矢量B的幅度預估值Bp以得出準備給該位置p選取的幅度。最后,搜索脈沖幅度/位置組合的一個子集的步驟包括將該搜索限制在對碼本中具有滿足該預先建立的函數的非零幅脈沖的脈沖幅度/位置組合。
本發(fā)明還涉及一種用于在碼本中進行搜索以對聲音信號編碼的設備。該碼本包含脈沖幅度/位置組合的一個集合,每個脈沖幅度/位置組合定義了L個不同的位置,并包括分配給該組合中的各個位置p=1,2,...L的零幅脈沖和非零幅脈沖。每一非零幅脈沖取q種可能幅度之一。該碼本搜索實施裝置包括用于從碼本中預選出與聲音信號有關的脈沖幅度/位置組合的一個子集的裝置;以及用于僅搜索脈沖幅度/位置組合的該子集以對聲音信號編碼,從而由于僅搜索碼本中的脈沖幅度/位置組合的一個子集,而降低搜索復雜度的裝置。該預選裝置包括用于與該聲音信號有關地、在位置p=1,2,...,L和q種可能幅度之間預先建立一個幅度/位置函數的裝置,并且該預先建立裝置包括給每個位置p預先分配q種可能幅度之一作為有效幅度的裝置。給每個位置p預先分配q種可能幅度之一的裝置包括a)用于對聲音信號進行處理以產生一個經逆向濾波的目標信號D和一個已去除音調的殘留信號R′的裝置;b)用于響應經逆向濾波的目標信號D和已去除音調的殘留信號R′計算幅度預估矢量B的裝置;以及c)用于對每一位置p,量化矢量B的幅度預估值Bp以得出準備給該位置p選取的幅度的裝置。最后,該搜索裝置包括用于將搜索限制在對碼本中具有滿足該預先建立的函數的非零幅脈沖的脈沖幅度/位置組合的裝置。
當一個脈沖幅度/位置組合中的每一個非零幅脈沖都具有與由預先建立的函數預先分配給所述非零幅脈沖的位置p的幅度相等的幅度時,該預先建立的函數得以滿足是非常具有好處的。
按照一個優(yōu)選實施例,幅度預估矢量B可以通過將歸一化形式的經逆向濾波的目標信號D(1-β)D||D||]]>加到歸一化形式的已去除音調的殘留信號R′βR′||R′||]]>從而得到如下形式的幅度預估矢量BB=(1-β)D||D||+βR′||R′||]]>來進行計算,其中β是一個固定常數,其值位于0和1之間。
按照另一優(yōu)選實施例,通過對每個位置p,采用下述表達式Bp/maxn|Bn|]]>對矢量B的已經峰值歸一化的幅度預估值Bp進行量化來量化該幅度矢量預估,其中分母maxn|Bn|]]>是一個歸一化因子,表示非零幅脈沖的峰值幅度。
按照第三優(yōu)選實施例,該方法還包括根據一組脈沖位置的軌跡來限制碼本的組合的非零幅脈沖的位置p的步驟。每個軌跡的脈沖位置與其他軌跡的脈沖位置相互交織。該脈沖組合中的每一個都包括N個非零幅脈沖,該組軌跡包括N個分別與N個非零幅脈沖關聯的脈沖位置的軌跡,并且每一個非零幅脈沖的脈沖位置限制于所關聯的軌跡位置。
按照第四優(yōu)選實施例-每一個脈沖幅度/位置組合包括N個非零幅脈沖;-通過使具有分母為α2k的一個給定比值最大化搜索脈沖幅度/位置組合的該子集,α2k通過N層嵌套循環(huán)根據下述關系式來計算αk2=U′(p1,p1)]]>+U′(p2,p2)+2U′(p1,p2)]]>+U′(p3,p3)+2U′(p1,p3)+2U′(p2,p3)]]>... ... ... ...+U′(pN,pN)+2U′(p1,pN)+2U′(p2,pN)+...+2U′(pN-1,pN)]]>其中每一循環(huán)的計算內容寫在從N層嵌套循環(huán)的最外層循環(huán)至最內層循環(huán)的不同線上,pn是組合中第n個非零幅脈沖的位置,U′(px,py)是取決于預先分配給位置p中的某一位置px的幅度Spx和預先分配給位置p中的某一位置py的幅度Spy的一個函數;以及-使給定比值最大化的步驟包括當下述不等式成立時,至少可以跳過N層嵌套循環(huán)中的最內層循環(huán)的步驟Σn=1N-1SPnDPn<TD]]>其中Spn是預先分配給位置pn的幅度,Dpn是目標矢量D的第pn個分量。TD為與經逆向濾波的目標矢量D有關的一個閾值。
本方面還涉及一種蜂窩通信系統,服務于被劃分為多個小區(qū)的大地理區(qū)域,該系統包括移動發(fā)射機/接收機單元;分別位于所述小區(qū)內的蜂窩基臺;用于控制所述各蜂窩基臺之間通信的裝置;位于一個小區(qū)內的每一移動單元與所述小區(qū)內的蜂窩基臺之間的一個雙向無線通信子系統,所述雙向無線通信子系統包括在移動單元和蜂窩基臺內都具備的(a)發(fā)射機,包括用于對語音信號編碼的裝置和用于發(fā)送編碼語音信號的裝置;和(b)接收機,包括用于接收被發(fā)送的編碼語音信號的裝置和用于對接收到的編碼語音信號進行解碼的裝置。所述語音信號編碼裝置包括用于響應該語音信號產生語音信號編碼參數的裝置,這些語音信號編碼參數產生裝置包括如上所述,用于在碼本內進行搜索以產生至少一個語音信號編碼參數的設備,在其中語音信號構成聲音信號。
按照本發(fā)明,還提供-蜂窩網絡元件,它包括(a)發(fā)射機,包括用于對語音信號編碼的裝置和用于發(fā)送編碼語音信號的裝置;和(b)接收機,包括用于接收被發(fā)送的編碼語音信號的裝置和用于對接收到的編碼語音信號進行解碼的裝置。所述語音信號編碼裝置包括用于響應該語音信號產生語音信號編碼參數的裝置,這些語音信號編碼參數產生裝置包括如上所述,用于在碼本內進行搜索以產生至少一個語音信號編碼參數的設備,在其中語音信號構成聲音信號。
-蜂窩移動發(fā)射機/接收機單元,它包括(a)發(fā)射機,包括用于對語音信號編碼的裝置和用于發(fā)送編碼語音信號的裝置;和(b)接收機,包括用于接收被發(fā)送的編碼語音信號的裝置和用于對接收到的編碼語音信號進行解碼的裝置。所述語音信號編碼裝置包括用于響應該語音信號產生語音信號編碼參數的裝置,這些語音信號編碼參數產生裝置包括如上所述,用于在碼本內進行搜索以產生至少一個語音信號編碼參數的設備,在其中語音信號構成聲音信號。
-服務于一個被劃分為多個小區(qū)的大地理區(qū)域的一種蜂窩通信系統,包括移動發(fā)射機/接收機單元、分別位于所述小區(qū)內的蜂窩基臺以及用于控制所述各蜂窩基臺之間通信的裝置;位于一個小區(qū)內的每一移動單元與所述小區(qū)內的蜂窩基臺之間的雙向無線通信子系統,這個雙向無線通信子系統包括在移動單元和蜂窩基臺內都具備的(a)發(fā)射機,包括用于對語音信號編碼的裝置和用于發(fā)送編碼語音信號的裝置;和(b)接收機,包括用于接收被發(fā)送的編碼語音信號的裝置和用于對接收到的編碼語音信號進行解碼的裝置。所述語音信號編碼裝置包括用于響應該語音信號產生語音信號編碼參數的裝置,這些語音信號編碼參數產生裝置包括如上所述,用于在碼本內進行搜索以產生至少一個語音信號編碼參數的設備,在其中語音信號構成聲音信號。
通過閱讀下面的關于優(yōu)選實施例的非限制性敘述,參照附圖,就可以對本發(fā)明的目的、優(yōu)點和其它特征有一個更清晰的了解。
附圖簡要說明在附圖中

圖1是一個根據本發(fā)明的包括一個幅度選擇器和一個最佳控制器的聲音信號編碼裝置的示意方框圖;圖2是一個與圖1中的編碼裝置相關的解碼裝置的示意方框圖;圖3a是根據本發(fā)明的基于信號選擇的脈沖幅度進行快速碼本搜索的基本操作步驟的順序圖;圖3b是給脈沖幅度/位置組合的每一位置p預先分配q種幅度中的一種幅度的操作步驟的順序圖;圖3c是N層嵌套循環(huán)搜索過程中包含的操作步驟的順序圖,其中,當認為第一組N-1個脈沖對分子DATK的貢獻不夠充分時,跳過最內層循環(huán);圖4是在碼本搜索過程中采用的N層嵌套循環(huán)的示意圖;圖5是說明一個典型蜂窩通信系統的基礎結構的示意方框圖。
優(yōu)選實施例的詳細說明圖5圖解說明了一個典型蜂窩通信系統1的基礎結構。
盡管在本說明書中,作為一個非限制性的例子,對根據本發(fā)明的搜索執(zhí)行方法和裝置應用于一個蜂窩通信系統的情況作了說明,但是,應指出這些方法和裝置可以被應用到許多其它類型的需要對聲音信號進行編碼的通信系統中,并具有同樣的優(yōu)點。
對于諸如1的蜂窩通信系統,通過將一個大的地理區(qū)域劃分成許多較小的小區(qū),可以在這個大的區(qū)域內提供通信服務。每一小區(qū)有一個蜂窩基站2(圖5),用于提供無線電信令信道,以及音頻和數據信道。
無線電信令通道用于在蜂窩基站的覆蓋區(qū)域范圍(小區(qū))內呼叫諸如3的移動無線電話機(移動發(fā)射機/接收機單元),以及與基站所在小區(qū)內或外的其它無線電話機通話,或與另外的網絡如公共交換電話網(PSTN)4通話。
一旦無線電話機3成功地打通電話或接到電話,音頻或數據信道就對于與無線電話機3所處的小區(qū)相對應的蜂窩基站2而建立,則基站2和無線電話機3之間的通信就通過該音頻或數據通道進行。無線電話機3還可以在通話進行時,通過信令信道接收控制或定時信息。
如果無線電話機3在通話過程中離開某一小區(qū)進入另一小區(qū),無線電話機就將電話過區(qū)切換到新小區(qū)內的可用的音頻或數據信道上。類似地,如果沒有通話,就通過信令信道發(fā)送一條控制信息使得無線電話機登錄在與新小區(qū)相關的基站2上。采用這種方式,就可能實現在一個寬闊的地域內的移動通信。
蜂窩通信系統1還包含一個終端5,用于在諸如無線電話機3與PSTN4通信期間或者在一第一小區(qū)內無線電話機3和第二小區(qū)內的無線電話機3之間的通信期間,控制蜂窩基站2和公共交換電話網絡4之間的通信。
當然,需要一個雙向無線通信子系統來建立位于一個小區(qū)內的每一臺無線電話機3和該小區(qū)內的蜂窩基站2之間的通信。這樣一種雙向無線通信系統一般包含在無線電話機3和蜂窩基站內都有的(a)發(fā)射機,用于對語音信號編碼,并通過如6或7的天線發(fā)送已被編碼的語音信號,以及(b)接收機,用于通過同一天線6或7接收被發(fā)送的編碼語音信號,并對接收到的編碼語音信號進行解碼。對本領域普通技術人員都知道,需要對聲音編碼以減少帶寬,這對于通過雙向無線通信系統即在無線電話機3和基站2之間發(fā)送語音信號來說是必須的。
本發(fā)明的目的是提供一種具有良好的主觀質量/比特率的折衷的高效數字語音編碼技術,例如用于在蜂窩基站2和無線電話機3之間通過音頻數據信道進行語音信號的雙向傳送。圖1是適合于實現這一高效技術的一種數字語音編碼裝置的示意方框圖。
圖1中的語音編碼裝置與專利號為No.07/927,528的美國專利中的圖1所示的編碼裝置相同,只是在本發(fā)明中增加了一個幅度選擇器112。美國專利申請No.07/927,528申請日為1992年9月10日,題為“基于代數碼的用于高效語音編碼的動態(tài)碼本”的發(fā)明。
模擬語音信號被采樣并成塊處理。必須明白的是,本發(fā)明并不局限于只應用于語音信號。也可以考慮應用本發(fā)明對其它類型的聲音信號進行編碼。
在圖示的例子中,輸入的采樣語音的數據塊S(圖1)由L個樣值組成。在CELP的文獻中,L表示“子幀”長度,一般位于20和80之間。含L個樣值的塊也被稱為L維矢量。在編碼處理過程中會產生各種各樣的L維矢量。下面給出了一個在圖1和2中出現的矢量的列表,以及一個發(fā)送參數的列表關于主要L維矢量的列表S輸入語音矢量;R′ 去掉音調的殘留信號;X目標矢量;D經逆向濾波的目標矢量;Ak代數碼本中標引為k的碼矢量;Ck修正矢量(Innovation vector)(經濾波的碼矢量);發(fā)送參數的列表k碼矢量的標引(代數碼本的輸入);g增益;STP 短期預測參數(定義A(Z));以及LTP 長期預測參數(定義音調增益b和音調延時T)解碼原理最好是首先敘述圖2中的語言解碼裝置,以說明在數字輸入(多路信號分離器205的輸入)和輸出的取樣語音(合成濾波器204的輸出)之間進行的各個步驟。
多路信號分離器205從接收自數字輸入信道的二進制信息中提取四種不同的參數,即標引k、增益g、短期預測參數STP和長期預測參數LTP。在這四種參數的基礎上合成語音信號的當前L維矢量S,在下面的敘述中將對此加以解釋。
圖2中的語音解碼裝置包含動態(tài)碼本208、放大器206、加法器207、長期預測器203和合成濾波器204,其中動態(tài)碼本208由一個代數碼發(fā)生器206和一個自適應前置濾波器202組成。
第一步,代數碼產生器201響應標引k產生一個碼矢量Ak。
第二步,給自適應前置濾波器202提供短期預測參數STP和/或長期預測參數LTP,由其對碼矢量Ak進行處理,以產生一個輸出修正矢量Ck。采用自適應前置濾波器202的目的是對輸出修正矢量Ck的頻率成分進行動態(tài)控制以提高語音質量,也就是減少由刺耳的頻率引起的聲音失真。下面給出了自適應前置濾波器202的典型傳輸函數F(Z)Fa(Z)=(A(z/γ1)A(z/γ2))]]>Fb(Z)=1(1-b0zT)]]>Fa(Z)是一種共振峰(formant)前置濾波器,γ1和γ2為常數,且0<γ1<γ2<1。這種前置濾波器能增強共振峰區(qū)域的頻率成分。并且在編碼速率低于5k比特/s時能非常有效地工作。
Fb(Z)是一個音調前置濾波器,其中T是時變音調延時,bo或是常數或是等于根據當前或以前的子幀量化的長期音調預測參數。Fb(Z)用于加強各種碼速率F的音調諧波頻率非常有效。因此,F(Z)一般包括一個有時與一個共振峰前置濾波器相結合的音調前置濾波器,即F(z)=Fa(z)Fb(z)按照CELP技術,首先用經放大器206的增益g來放大碼本208中的修正矢量Ck來獲得輸出的取樣語音信號S。然后,由加法器207將放大的波形gck加到提供有LTP參數的長期預測器203的輸出E上(合成濾波器204的信號激勵的長期預測部分),長期預測器203置于反饋環(huán)中,并具有如下的傳輸函數B(Z)B(Z)=bZ-T其中b和T分別為所述的音調增益和延時。
預測器203是一個模擬語音的音調周期性的濾波器,具有基于最新接收到的LTP參數b和T的傳輸函數。它引入樣值的適當的音調增益b和延時T。復合信號E+gCk構成合成濾波器204的信號激勵,合成濾波器的傳輸函數為1/A(Z)(A(Z)將在下面的敘述中定義)。濾波器204根據最新接收到的STP參數進行正確的頻譜整形。具體而言,濾波器204模擬語音的共振頻率(共振峰)。輸出的樣值組S為合成取樣語音信號,根據在本技術領域中的公知技術,采用合適的去混疊濾波,可以將該合成取樣語音信號轉化為模擬信號。
有許多方式來設計代數碼發(fā)生器201。在所述的專利申請?zhí)枮镹o.07/927,528的美國專利中提出了一種較好的方法,該方法采用至少一種N交織的單脈沖置換碼。
用一個簡單的代數碼發(fā)生器201來對這一概念加以說明。在這個例子中,L=40并且40維的碼矢量集合中只包含N=5個非零幅脈沖,稱之為Sp1、Sp2、Sp3、Sp4、Sp5。在這種更細致的標注法中,pi表示子幀內的第i個脈沖的位置(即pi在0至L-1范圍內取值)。假設脈沖Spi被限制在如下的8種可能位置p1p1=0,5,10,15,20,25,30,35=0+8m1;m1=0,1,...,7在被稱為“軌跡”#1的這八種可能的位置內,Sp1和7個零幅脈沖可以自由置換。稱之為“單脈沖置換碼”。現在讓我們通過用類似的方式對余下的脈沖的位置也加以限制來交織五個這種“單脈沖置換碼”(即軌跡#2,軌跡#3、軌跡#4和軌跡#5)。
p1=0,5,10,15,20,25,30,35=0+8m1p2=1,6,11,16,21,26,31,36=1+8m2p3=2,7,12,17,22,27,32,37=2+8m3p4=3,8,13,18,23,28,33,38=3+8m4p5=4,9,14,19,24,29,34,39=4+8m5注意整數m1=0,1,...,7可以完全確定每一個脈沖Spi的位置pi。因而,采用下述關系式,通過對各mi直接倍乘,就可以推導出一種簡單的位置標引KpKp=4096m1+512m2+64m3+8m4+m5
必須指出的是,采用上述脈沖軌跡也能推導出其它的碼本。例如,只采用4個脈沖,其中前三個脈沖分別占據前三條軌跡的位置,同時第四個脈沖或者占據第四條軌跡或者占據第五條軌跡,用一個比特來說明其處于哪一個軌跡。這種設計能得到一個13位位置碼本。
在現有技術中,由于碼矢量搜索的復雜性的緣故,假定非零幅脈沖在各種實際應用中都具有固定的幅度。事實上,如果脈沖Spi可以取q種可能幅度中的一種的話,在搜索中就必須考慮有qN種之多的脈沖一幅度組合。例如,如果允許第一個例子中的5個脈沖取q=4種可能幅度,如Spi=+1,-1,+2,-2而不是固定幅度的話,代數碼本的大小就會從15位跳至15+(5×2)位=25位;也就是說,搜索將復雜一千倍。
本發(fā)明的目的是指出這樣一個令人驚訝的方案,即在不用付出很大代價的情況下,采用有q種幅度的脈沖能取得非常好的性能。這種方案是將搜索范圍限制在碼矢量的一個限定的子集內。選擇碼矢量的方法與輸入語音信號有關,下面的敘述中將對此加以說明。
本發(fā)明的有用之處在于通過允許單個脈沖取不同的可能幅度,能夠增加動態(tài)代數碼本208的大小,而不增加碼矢量搜索的復雜性。編碼原理取樣語音信號S由圖1中的編碼系統按塊編碼在一塊上。圖1中的解碼系統可被分解為標號從102至112的11個模塊。大多數這些模塊的功能和操作相對于美國專利和申請?zhí)枮镹o.07/927,528的母專利中的描述來說沒有變化。因而,在下面的敘述中盡管將不得不對每一個模塊的功能和操作一些簡要的解釋。但主要將敘述對于美國專利申請?zhí)枮镹o.07/927,528的母專利而言為新的內容。
按照現有技術,通過一個LPC頻譜分析器102,給語音信號的每一個含L個樣值的數據塊,產生一組被稱為短期預測(STP)參數的線性預測編碼(LPC)參數。具體而言,分析器102模擬L個樣值的每一塊S的頻譜特性。
L個樣值S的輸入塊S由“白化”濾波器103白化,“白化”濾波器103具有下述基于STP參數的當前值的傳輸函數A(z)=Σi=0Maiz-i]]>其中a0=1,Z為所謂的Z變換中的一般變量。如圖1所示,“白化”濾波器103產生殘留矢量R。
音調提取器104用于計算和量化LTP參數,即音調延時T和音調增益g。提取器104的初始狀態(tài)也被設置為來自初始狀態(tài)提取器110的一個值FS。在美國專利申請?zhí)枮镹o.07/927,528的母專利中對計算和量化LTP參數的詳細過程已有敘述,并且相信對本領域普通技術人員是熟知的。因而,在本文中不再對此作進一步的敘述。
給濾波器響應特性計算器105(圖1)提供STP和LTP參數以計算濾波器的響應特性FRC供后續(xù)步驟使用。FRC信息包括下述三個組成部分,其中n=1,2,...,L。·f(n)F(Z)的響應注意F(Z)一般包括音調前置濾波器。·h(n) 對f(n)的響應其中γ是一個感覺因子。更一般而言,h(n)是前置濾波器F(Z),感覺加權濾波器W(Z)和合成濾波器1/A(Z)的級聯F(Z)W(Z)/A(Z)脈沖響應。注意F(Z)和1/A(Z)與在圖2的解碼器中采用的濾波器相同?!(i,j)基于下述表達式的h(n)的自相關u(i,j)=Σk=1Lh(k-i+1)h(k-j+1)]]>1≤i≤L且i≤j≤L;當n<1時h(n)=0給長期預測器106輸入以前的激勵信號(即前面子幀的E+gCk),以采用適當的音調延時T和增益b形成新的E成分。
感覺濾波器(perceptual filter)107的初始狀態(tài)被設置成由初始狀態(tài)提取器110輸入的值FS。然后,將由減法器121(圖1)計算出的已去掉音調的殘留矢量R′=R-E輸入至感覺濾波器107以使感覺濾波器107輸出一個目標矢量X。如圖1所示,將STP參數輸入濾波器107中以改變其與這些參數相關的傳輸函數。實質上,X=R′-p,其中p表示包含由以前的激勵信號引起的“振鈴”的長期預測(LTP)的貢獻。適用于Δ的MSE判據現在能用下述的矩陣符號表述mink||Δ||2=mink||S′-S^′||2=mink||S′-[P-gAkHT]||2]]>=mink||X-gAkHT||2]]>其中M為由如下的h(n)響應形成的一個L×L下三角托普利茲(Toeplitz)矩陣。h(0)項位于矩陣的對角線,h(1),h(2),...,h(L-1)位于相應較低的對角線。
由圖1中的濾波器108來完成逆向濾波步驟。設上式對增益g的微分等于0,就可得到如下的最佳增益∂||Δ||2∂g=0]]>g=X(AkHT)T||AkHT||2]]>取g為這一值,最小值就變?yōu)閙ink||Δ||2=mink{||X||2-(X(AkHT)T)2||AkHT||2}]]>目的是尋找一個特定的標引k,使得到最小值。注意由于‖X‖2為一固定的數值。因而可以通過使下述數值最大來尋找同一標引maxk(X(AkHT)T)2||AkHT||2maxk((XH)AkT)2∞k2=maxk(DAkT)2∞k2]]>其中D=(XH)且α2k=‖AkHT‖2在逆向濾波器108中計算經逆向濾波的目標矢量D=(XH)。把此運算稱為術語“逆向濾波”是因為將(XH)解釋為時間反演X的濾波。
只在所述美國專利申請?zhí)枮镹o.07/927,528的母專利的圖1中增加了一個幅度選擇器112。幅度選擇器112的功能是通過最佳控制器109將待搜索的碼矢量Ak限制在最可能的碼矢量Ak的范圍內從而減小碼矢量搜索的復雜性。如前面的描敘所述。每一個碼矢量Ak是一個脈沖幅度/位置組合波形。它定義了L個不同的位置p,并包括分配給該組合中各個位置p=1,2,...,L的零幅脈沖和非零幅脈沖,其中每一個非零幅脈沖具有q種不同的可能幅度中的至少一種幅度。
現在參照圖3a、3b和3c,幅度選擇器112的作用是預先建立碼矢量波形的位置p和各脈沖幅度的q種可能值之間的函數關系Sp。在碼本搜索之前與語音信號相關聯推導出預先建立的函數關系Sp。具體而言,這一函數的預先建立過程包括與語音信號相關地,給波形的每一個位置p預先分配q種可能幅度中的至少一種幅度(圖3a中的步驟301)。
為給波形的每一個位置p預先分配q種可能幅度中的一種,響應于經逆向濾波的目標矢量D和已去除音調的殘留矢量R′來計算幅度預估矢量B。具體而言,通過對歸一化形式的經逆向濾波的目標矢量D(1-β)D||D||]]>和歸一化形式的已去除音調的殘留矢量R′βR′||R′||]]>求和來計算幅度預估矢量B(圖3b中的子步驟301-1)從而得到如下形式的幅度預估矢量BB=(1-β)D||D||+βR′||R′||]]>其中β是一個固定常數,其典型值為1/2(β值根據在代數碼本中采用的非零幅脈沖的百分比在0和1之間選擇)。
對波形的每一個位置p來說,通過量化矢量B的相應的幅度預估值Bp來獲取要預先分配給該位置p的幅度Sp。具體而言,對波形的每一個位置p,采用下述表達式來量化矢量B的經峰值歸一化的幅度預估值Bp(圖3b中的子步驟301-2)Sp=Q(Bp/maxn|Bn|]]>其中Q(.)為量化函數而且maxn|Bn|]]>是一個歸一化因子,表示非零幅脈沖的峰值幅度。
在下述重要的特殊情形中-q=2,即脈沖幅度只能取兩個值(即Spi=±1);以及-非零幅脈沖密度N/L小于等于15%β值可以等于零;因而幅度預估矢量B就簡化為只與經逆向濾波的目標矢量D有關,結果為Sp=Sign(Dp)。
最佳控制器119的作用是從代數碼本中選擇出最佳碼矢量Ak。選擇判據以定額(ration)的形式給出,對每一個碼矢量Ak計算其定額,并從所有碼矢量中尋找最大值(步驟303)maxk(DAkT)2αk2]]>其中D=(XH)且α2k=‖AkHT‖2由于Ak是一個代數碼矢量,它具有N個非零幅脈沖,且各個脈沖的幅度分別為Spi,因而分子為下式的平方DAkT=Σi=1NDPiSPi]]>且分母為能夠表示為如下形式的一個能量項αk2=Σi=1NSPi2U(pi,pj)+2Σi=1N-1Σj-i+1NSPiSPiU(pi,pj)]]>其中U(pi,pj)是與兩個單位幅度脈沖有關的相關量,一個脈沖位于位置pi,另一個脈沖位于位置pj。在濾波器響應特性計算器105中根據上式計算該矩陣。該矩陣被包括在圖1的方框圖中稱FRC的一組參數中。
一種用于計算這一分母的快速方法包含如圖4所示的N層嵌套循環(huán)。在圖4中用對齊符號S(i)和SS(i,j)分別代替參數“Spi”和“SpiSpj”。分母α2k的計算是最費時的過程。對α2k有貢獻的在每一個循環(huán)中完成的計算可以用如下形式寫在從最外層循環(huán)至最內層循環(huán)的不同線上αk2=SP12U′(p1,p1)]]>+SP22U(p2,p2)+2SP1SP2U(p1,p2)]]>+SP32U(p3,p3)+2[SP1SP3U(p1,p3)+SP2SP3U(p2,p3)]]]>... ... ... ...+SPN2U(pN,pN)+2[SP1SPNU(p1,pN)+SP2SPNU(p2,pN)+...+SPN-1SPNU(pN-1,pn)]]]>其中pi是第i個非零幅脈沖的位置。值得注意的是圖4中的N層嵌套循環(huán)能夠根據N交織單脈沖置換碼來限制碼矢量Ak的非零幅脈沖。
在本發(fā)明中,通過將待搜索的碼矢量Ak的子集限制為其N個非零幅脈沖滿足在圖3a的步驟301中預先建立的函數關系的碼矢量,可以顯著減小搜索的復雜程度。當碼矢量Ak的N個非零幅脈沖中的每一個都具有與預先分配給處于位置p的非零幅脈沖的幅度相等的幅度時,預先建立的函數關系就得到了滿足。
所述碼矢量子集的限制過程通過首先將預先建立的函數Sp與矩陣元U(i,j)相結合(圖3a中的步驟302)。然后采用假定為固定位置,極性為正、具有單位幅度的所有脈沖S(i)進行N層嵌套循環(huán)(步驟303)。因而,即使代數碼本中的非零幅脈沖的幅度可以取q種可能值中的任意一種,也可以將搜索的復雜程度減小至固定脈沖幅度的情形。更準確地說,根據下述關系式將由濾波器響應特性計算器105提供的矩陣U(i,j)與預先建立的函數相組合(步驟302)U′(i,j)=SiSjU(i,j)其中Si來源于幅度選擇器102的選擇方法,即Si為在對相應的幅度預估值量化之后給每個位置i所選擇的幅度。
采用這個新的矩陣,該快速算法的每一循環(huán)中的計算可以如下形式寫在從最外層至內層循環(huán)的不同線上αk2=U′(p1,p1)]]>+U′(p2,p2)+2U′(p1,p2)]]>+U′(p3,p3)+2U′(p1,p3)+2U′(p2,p3)]]>... ... ... ...+U′(pN,pN)+2U′(p1,pN)+2U′(p2,pN)+...+2U′(pN-1,pn)]]>其中px為波形中第X個非零幅脈沖的位置,U′(px,py)為取決于預先分配給位置p中的某一位置px的幅度Spx和預先分配給位置p中的某一位置py的幅度Spy的一個函數。
為了更進一步減小搜索的復雜性,只要下述不等式成立,就可以跳過最內層循環(huán)(參照圖3c)。而且跳過最內層循環(huán)只是個特例,而不是僅僅只指最內層循環(huán) 其中Spn是預先分配給位置pn的幅度,Dpn是目標矢量D的第pn個分量,TD是與經逆向濾波的目標矢量D有關的一個閾值。
全局的信號激勵信號E+gCk由加法器120(圖1)根據來自控制器109的信號gCk和來自預測器106的輸出E來計算。由具有隨STP參數變化的傳輸函數1/A(Zγ-1)的感覺濾波器構成的初始狀態(tài)提供模塊110,從殘留信號R中減去信號激勵信號E+gCk,以獲取最終濾波器狀態(tài)FS,供濾波器107和音調提取器104作為初始狀態(tài)使用。
四種參數k,g,LTP和STP的集合通過多路復用器111轉換為合適的數字信道格式,從而完成對語音信號的樣值塊S的編碼過程。
盡管上面已經參照優(yōu)選實施例對本發(fā)明進行了描述,在不偏離本發(fā)明的精神和實質的情形下,在后附的權利要求所聲明的范圍之內,還可以對這些實施例進行修改。
權利要求
1.一種在碼本中進行搜索以對聲音信號編碼的方法,其中-所述碼本包含脈沖幅度/位置組合(Ak)的一個集合;-每個脈沖幅度/位置組合(Ak)定義L個不同的位置,并且包括分配給該組合中各個位置p=1,2,...,L的零幅脈沖和非零幅脈沖;-每一非零幅脈沖采用q種可能的幅度之一;以及-所述碼本搜索實施方法包括與所述聲音信號相關地從所述碼本中預選脈沖幅度/位置組合(Ak)的一個子集;以及僅搜索所述脈沖幅度/位置組合(Ak)的所述子集以對聲音信號編碼,從而由于僅搜索碼本中脈沖幅度/位置組合的一個子集,而降低搜索復雜度;其中所述預選脈沖幅度/位置組合(Ak)步驟包括與所述聲音信號相關地、在位置p=1,2,...,L和q種可能幅度之間預先建立一個幅度/位置函數(Sp);預先建立幅度/位置函數(Sp)的步驟包括給每一位置p預先分配q種可能幅度之一作為有效幅度;以及給每一位置p預先分配q種可能幅度之一的步驟包括對所述聲音信號進行處理以產生一個經逆向濾波的目標信號D和一個已去除音調的殘留信號R′;根據經逆向濾波的目標信號D和已去除音調的殘留信號R′計算幅度預估矢量B;以及對所述的每一位置p,量化所述矢量B的幅度預估值Bp以得出準備為所述位置p選擇的幅度;以及搜索脈沖幅度/位置組合(Ak)的所述子集的步驟包括將搜索限制在所述碼本中具有滿足所述預先建立的函數(Sp)的非零幅脈沖的脈沖幅度/位置組合(Ak)的范圍內的步驟。
2.如權利要求1所述的方法,其中當脈沖幅度/位置組合(Ak)中的每一個非零幅脈沖都具有與由預先建立的函數(Sp)預先分配給所述非零幅脈沖的位置p的幅度相等的幅度時,滿足該預先建立的函數(Sp)。
3.如權利要求1或2所述的方法,其中所述計算幅度預估矢量B的步驟包括將歸一化形式的經逆向濾波的目標信號D(1-β)D||D||]]>與歸一化形式的已去除音調的殘留信號R′;βR′||R′||]]>相加從而得到如下形式的幅度預估計矢量BB=(1-β)D||D||+βR′||R′||]]>其中β是一個固定常數。
4.如權利要求3所述的方法,其中β是一個固定常數,其值位于0和1之間。
5.如權利要求1至4之一所述的方法,其中對每個所述位置p,所述量化幅度矢量預估值的步驟包括用下述表達式量化所述矢量B的已經峰值歸一化的幅度預估值BpBp/maxn|Bn|]]>其中分母maxn|Bn|]]>是一個歸一化因子,表示所述非零幅脈沖的峰值幅度。
6.如權利要求1至5之一所述的方法,還包括根據一組脈沖位置的軌跡限制該碼本中的組合(Ak)的非零幅脈沖的位置p的步驟。
7.如權利要求6所述的方法,其中每個軌跡的脈沖位置與其他軌跡的脈沖位置相互交織。
8.如權利要求6所述的方法,其中-所述脈沖組合(Ak)中的每一個都包括N個非零幅脈沖;-該組軌跡包括分別與N個非零幅脈沖關聯的脈沖位置的N個軌跡;-每個軌跡的脈沖位置與其他N-1個軌跡的脈沖位置相互交織;以及-限制位置p包括將每一個非零幅脈沖的脈沖位置限制于所關聯的軌跡的位置。
9.如權利要求1至8之一所述的方法,其中所述的每一個脈沖幅度/位置組合(Ak)都包含N個非零幅脈沖,并且其中搜索所述脈沖幅度/位置組合(Ak)的步驟包含使分母為α2k的給定比值最大化的步驟,α2k通過N層嵌套循環(huán)根據下述關系式來計算αk2=U′(p1,p1)]]>+U′(p2,p2)+2U′(p1,p2)]]>+U′(p3,p3)+2U′(p1,p3)+2U′(p2,p3)]]>... ... ... ...+U′(pN,pN)+2U′(p1,pN)+2U′(p2,pN)+...+2U′(pN-1,pn)]]>其中每一循環(huán)的計算內容寫在從N層嵌套循環(huán)的最外層循環(huán)至最內層循環(huán)的不同線上,pn是該組合中第n個非零幅脈沖的位置,U′(px,py)是取決于預先分配給位置p中的某一位置px的幅度Spx和預先分配給位置p中的某一位置py的幅度Spy的一個函數。
10.如權利要求9所述的方法,其中使所述給定比值最大化的步驟包含當下述不等式成立時至少跳過N層嵌套循環(huán)的最內層循環(huán)的步驟Σn=1N-1SPnDPn<TD]]>其中Spn是預先分配給位置pn的幅度,Dpn是目標矢量D的第pn個分量,TD是與經逆向濾波的目標矢量D有關的一個閾值。
11.一種在碼本中進行搜索以對聲音信號編碼的設備,其中-所述碼本包含脈沖幅度/位置組合(Ak)的一個集合,每個脈沖幅度/位置組合(Ak)定義了L個不同的位置,并包括分配給該組合中各個位置p=1,2,...,L的零幅脈沖和非零幅脈沖;-每一非零幅脈沖采用q種可能的幅度之一;-所述碼本搜索實施裝置包括用于與所述聲音信號相關地從所述碼本中預選脈沖幅度/位置組合(Ak)的一個子集的裝置;以及用于僅搜索所述脈沖幅度/位置組合(Ak)子集以對聲音信號編碼,從而由于僅搜索碼本中一個脈沖幅度/位置組合(Ak)的一個子集,而降低搜索復雜度的裝置;其中所述預先選擇裝置包括用于與所述聲音信號相關地、在位置p=1,2,...,L和所述q種可能幅度之間預先建立一個幅度/位置函數(Sp)的裝置;該預先建立的裝置包括給每一位置p預先分配q種可能幅度之一作為有效幅度的裝置;以及給每一位置p預先分配q種可能幅度之一的裝置包括對所述聲音信號進行處理以產生一個經逆向濾波的目標信號D和一個已去除音調的殘留信號R′的裝置;根據經逆向濾波的目標信號D和已去除音調的殘留信號R′計算幅度預估矢量B的裝置;以及對所述的每一位置p,量化所述矢量B的幅度預估值Bp以得出準備為所述位置p選擇的幅度的裝置;以及該搜索裝置包括將搜索限制在所述碼本中具有滿足所述預先建立的函數(Sp)的非零幅脈沖的脈沖幅度/位置組合(Ak)的范圍內的裝置。
12.如權利要求11所述的設備,其中當脈沖幅度/位置組合(Ak)中的每一個非零幅脈沖都具有與由預先建立的函數Sp預先分配給所述非零幅脈沖的位置p的幅度相等的幅度時,滿足該預先建立的函數。
13.如權利要求11或12所述的設備,其中所述用于計算幅度預估矢量B的裝置包括用于將歸一化形式的經逆向濾波的目標信號D(1-β)D||D||]]>和歸一化形式的已去除音調的殘留信號R′βR′||R′||]]>相加從而得到如下形式的幅度預估矢量B的裝置B=(1-β)D||D||+βR′||R′||]]>其中β是一個固定常數。
14.如權利要求13所述的設備,其中β是一個固定常數,其值位于0和1之間。
15.如權利要求11至14之一所述的設備,其中所述量化幅度矢量預估裝置包括用于對所述每一位置p,采用下述表達式來量化所述矢量B的已經峰值歸一化的幅度預估值Bp的裝置Bp/maxn|Bn|]]>其中分母maxn|Bn|]]>是一個歸一化因子,表示非零幅脈沖的峰值幅度。
16.如權利要求11至15之一所述的設備,還包含用于根據一組脈沖位置的軌跡來限制碼本中的組合(Ak)的非零幅脈沖的位置p的裝置。
17.如權利要求16所述的設備,其中每個軌跡的脈沖位置與其他軌跡的脈沖位置相互交織。
18.如權利要求16所述的設備,其中-所述脈沖組合(Ak)中的每一個都包括N個非零幅脈沖;-該組軌跡包括分別與N個非零幅脈沖關聯的脈沖位置的N個軌跡;-每個軌跡的脈沖位置與其他N-1個軌跡的脈沖位置相互交織;以及-限制位置p的裝置包括用于將每一個非零幅脈沖的脈沖位置限制于所關聯的軌跡的位置。
19.如權利要求11至18之一所述的設備,其中所述的每一脈沖幅度/位置組合(Ak)包括N個非零幅脈沖,其中搜索搜索脈沖幅度/位置組合(Ak)的所述子集的裝置包括用于使分母為α2k的給定比值最大化的裝置,分母α2k是通過N層嵌套循環(huán)根據下述關系式計算的αk2=U′(p1,p1)]]>+U′(p2,p2)+2U′(p1,p2)]]>+U′(p3,p3)+2U′(p1,p3)+2U′(p2,p3)]]>... ... ... ...+U′(pN,pN)+2U′(p1,pN)+2U′(p2,pN)+...+2U′(pN-1,pN)]]>其中每一循環(huán)的計算內容寫在從N層嵌套循環(huán)的最外層循環(huán)到最內層循環(huán)的不同線內,其中pn是所述組合中第n個非零幅脈沖的位置,U′(px,py)是取決于預先分配給位置p中的某一位置px的幅度Spx和預先分配給位置p中的某一位置py的幅度Spy的一個函數。
20.如權利要求19所述的設備,其中所述用于最大化所述給定比率的裝置包括每當下述不等式成立時至少跳過N層嵌套循環(huán)的最內層循環(huán)的裝置Σn=1N-1SPnDPn<TD]]>其中Spn是預先分配給位置pn的幅度,Dpn是目標矢量D的第pn個分量,TD是與經逆向濾波的目標矢量D有關的一個閾值。
21.一種服務于一個被劃分為多個小區(qū)的大地理區(qū)域的蜂窩通信系統,包括移動發(fā)射機/接收機單元(3);分別位于所述小區(qū)內的蜂窩基臺(2);用于控制所述各蜂窩基臺(2)之間通信的裝置(5);位于一個小區(qū)內的每一移動單元(3)與所述一個小區(qū)內的蜂窩基臺(2)之間的雙向無線通信子系統,所述雙向無線通信子系統包括在移動單元(3)和蜂窩基臺(2)內都具備的(a)發(fā)射機,包括用于對語音信號編碼的裝置和用于發(fā)送編碼語音信號的裝置;和(b)接收機,包括用于接收被發(fā)送的編碼語音信號的裝置和用于對接收到的編碼語音信號進行解碼的裝置;-其中所述語音信號編碼裝置包括用于響應該語音信號產生語音信號編碼參數的裝置,并且其中所述語音信號編碼參數產生裝置包括權利要求11至20中的任何一個敘述的設備,用于在碼本內進行搜索以產生至少一個所述語音信號編碼參數,其中語音信號構成所述聲音信號。
22.一種蜂窩網絡元件(2),它包括(a)發(fā)射機,包括用于對語音信號編碼的裝置和用于發(fā)送編碼語音信號的裝置;和(b)接收機,包括用于接收被發(fā)送的編碼語音信號的裝置和用于對接收到的編碼語音信號進行解碼的裝置;-其中所述語音信號編碼裝置包括用于響應該語音信號產生語音信號編碼參數的裝置,和其中所述語音信號編碼參數產生裝置包括權利要求11至20中的任何一個敘述的設備,用于在碼本內進行搜索以產生至少一個所述語音信號編碼參數,在其中語音信號構成所述聲音信號。
23.一種蜂窩移動發(fā)射機/接收機單元(3),它包括(a)發(fā)射機,包括用于對語音信號編碼的裝置和用于發(fā)送編碼語音信號的裝置;和(b)接收機,包括用于接收被發(fā)送的編碼語音信號的裝置和用于對接收到的編碼語音信號進行解碼的裝置;-所述語音信號編碼裝置包括用于響應該語音信號產生語音信號編碼參數的裝置,其中所述語音信號編碼參數產生裝置包括權利要求11至20中的任何一個敘述的設備,用于在碼本內進行搜索以產生至少一個所述語音信號編碼參數,其中語音信號構成所述聲音信號。
24.一種服務于被劃分為多個小區(qū)的大地理區(qū)域的蜂窩通信系統,包括移動發(fā)射機/接收機單元(3)、分別位于所述小區(qū)內的蜂窩基臺(2)以及用于控制所述各蜂窩基臺(2)之間通信的裝置(5);-位于一個小區(qū)內的每一移動單元(3)與所述一個小區(qū)內的蜂窩基臺(2)之間的雙向無線通信子系統,所述雙向無線通信子系統包括在移動單元(3)和蜂窩基臺(2)內都具備的(a)發(fā)射機,包括用于對語音信號編碼的裝置和用于發(fā)送編碼語音信號的裝置;和(b)接收機,包括用于接收被發(fā)送的編碼語音信號的裝置和用于對接收到的編碼語音信號進行解碼的裝置;-其中所述語音信號編碼裝置包括用于響應該語音信號產生語音信號編碼參數的裝置,和其中所述語音信號編碼參數產生裝置包括權利要求11至20中的任何一個敘述的設備,用于在碼本內進行搜索以產生至少一個所述語音信號編碼參數,其中語音信號構成所述聲音信號。
全文摘要
本發(fā)明涉及對碼本進行搜索以對聲音信號進行編碼的方法和設備。該碼本由一個脈沖幅度/位置組合的集合組成,每個脈沖幅度/位置組合定義了L個不同的位置,并包括分配給該組合的各個位置的零幅脈沖和非零幅脈沖。每個非零幅脈沖有q種可能幅度。該方法從碼本中預選脈沖幅度/位置組合的一個子集,并將該搜索限制在該子集內。預選該子集前預先建立幅度/位置函數。預先建立幅度/位置函數包括通過a)對聲音信號進行處理以產生目標信號D和殘留信號R′;b)根據目標信號D和殘留信號R′計算幅度預估矢量B;以及c)對每一位置p,量化矢量B的幅度預估值B
文檔編號H03M7/30GK1410970SQ0210790
公開日2003年4月16日 申請日期2002年3月21日 優(yōu)先權日1995年2月6日
發(fā)明者讓-皮埃爾·阿杜爾, 克勞德·拉弗雷米 申請人:舍布魯克大學
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1