專利名稱:有特殊步長適應(yīng)的自適應(yīng)差分脈碼調(diào)制語音編碼系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及有語音編碼器以及與所述語音編碼器合作的語音解碼器的語音編碼系統(tǒng),語音編碼器包括預(yù)處理器以及有量化器和步長適應(yīng)裝置的ADPCM(自適應(yīng)差分脈碼調(diào)制)編碼器并且語音解碼器包括有和ADPCM編碼器中類似的步長適應(yīng)裝置以及有一個(gè)解碼器的ADPCM解碼器,和一個(gè)后處理器,量化器裝備有包括步長Δ(n)的校正因子α(c(n))值的存儲(chǔ)裝置,所述校正因子依靠量化器輸出信號(hào)c(n)。
語音編碼器產(chǎn)生能被存儲(chǔ)或通過信道發(fā)送的一個(gè)比特流。劣質(zhì)存儲(chǔ)裝置或壞的傳輸信道可能不能保存這個(gè)信息;以比特變化形式的誤碼可能出現(xiàn)。而且,當(dāng)聲音信號(hào)在標(biāo)準(zhǔn)P2CM音頻編碼系統(tǒng)編碼器中,也就是,處理的ADPCM編碼器和解碼器中被處理時(shí),可以出現(xiàn)這樣的誤碼。當(dāng)誤碼率高于1%時(shí),能聽到非自然信號(hào)。大多數(shù)這些非自然信號(hào)以突然增加或降低音量標(biāo)記。編碼器的閉合檢查揭示對(duì)于誤碼編碼系統(tǒng)最薄弱的部分是自適應(yīng)步長Δ(n)裝置。適應(yīng)依靠產(chǎn)生的編碼等級(jí)。當(dāng)這些編碼等級(jí)由于誤碼而變化時(shí),ADPCM編碼器和ADPCM解碼器的步長不再相同。因此,已推薦提供有包括步長Δ(n)校正因子α(c(n))值的存儲(chǔ)裝置的量化器。例如,步長隨后可以根據(jù)關(guān)系式修改 A是一個(gè)常數(shù)(A<1)。按比例遞降的步長[Δ(n)+b]。如果未超出允許的最大步長Δmax則A依據(jù)因子α(c(n))(≥1)按比例增大。校正因子值α(c(n))的選擇是這樣的以致于對(duì)屬于較高量化等級(jí)的編碼做出更快的適應(yīng)以允許當(dāng)輸入信號(hào)等級(jí)突然增加時(shí)編碼系統(tǒng)更快的適應(yīng),然而,在量化器輸入中出現(xiàn)小的能量變化的情況下,以已知的校正表適應(yīng)校正因子α(c(n))是不充分的。
本發(fā)明的目的是在語音編碼器和解碼器的量化器中提供一個(gè)改進(jìn)的步長適應(yīng)。
因此,根據(jù)本發(fā)明,如公開段中描述的語音編碼系統(tǒng)的特征為步長適應(yīng)根據(jù)以下關(guān)系式出現(xiàn) 其中b,A和Δmax是常數(shù)。
特別如ID604963中描述的,當(dāng)預(yù)處理器裝備有相位涂抹(phase-smearing)濾波器裝置以及此外后處理器裝備有反向?yàn)V波器裝置時(shí),輸入到ADPCM編碼器的能量更逐漸增加,允許更好地選擇α(c(n))。因此,所述專利申請(qǐng)的內(nèi)容被認(rèn)為是本發(fā)明描述的一部分。沒有這樣的相位涂抹濾波器裝置,隨著出現(xiàn)在閉合擴(kuò)音器記錄中的類似脈沖輸入信號(hào)可能出現(xiàn)問題。
參考附圖和以下描述的實(shí)施方案,這些以及本發(fā)明的其它方面將是明顯的并被說明。在附圖中
圖1顯示根據(jù)本發(fā)明的P2CM編碼系統(tǒng)的框圖。
圖2A-2F顯示有ADPCM編碼器量化和比例因子的現(xiàn)有技術(shù)表。
圖3A-3F顯示根據(jù)本發(fā)明在預(yù)處理器中有相位涂抹濾波器以及在后處理器中有反向相位涂抹濾波器的ADPCM編碼器的量化和比例因子表。
圖1中的P2CM音頻編碼系統(tǒng)由編碼器1和解碼器2構(gòu)成。編碼器1包括預(yù)處理器3和ADPCM編碼器4,同時(shí)解碼器2裝備有ADPCM解碼器5和后處理器6。ADPCM編碼器包括量化器塊7,步長適應(yīng)塊8,解碼器塊9和預(yù)測器塊10。ADPCM解碼器包括步長適應(yīng)塊12,解碼器塊13和預(yù)測器塊14。預(yù)處理器包括在量化器輸入中消除快速高能量變化影響的相位涂抹濾波器以及在編碼前修改信號(hào)頻譜的頻譜幅度彎曲裝置,同時(shí)后處理器包括取消預(yù)處理器中彎曲影響的裝置和一個(gè)反向?yàn)V波器。在一個(gè)優(yōu)選實(shí)施方案中,相位涂抹濾波彎曲以及反向?yàn)V波解除彎曲(unwarp)在頻域中實(shí)現(xiàn)。因此,預(yù)處理器和后處理器都裝備有裝置如FFT單元,把時(shí)域音頻信號(hào)轉(zhuǎn)換到頻域,以及裝置如反向FFT,把被處理用于濾波和彎曲或反向?yàn)V波和不彎曲的信號(hào)分別從頻域轉(zhuǎn)換到時(shí)域。如ID604963中描述的,在一個(gè)特殊的實(shí)施方案中,相位涂抹濾波器具有在0和奈奎斯特之間充分地線性增加頻率的特性和恒定幅度的特性。
ADPCM編碼器4輸入的是一個(gè)由預(yù)處理器3提供的采樣音頻信號(hào)。當(dāng)采樣n具有數(shù)值s(n)時(shí),對(duì)于每個(gè)輸入值s(n)在這個(gè)值和估算(預(yù)測)值s(n1)之間的差被認(rèn)為是一個(gè)隨后給出輸出編碼c(n)的量化器塊7量化和編碼的錯(cuò)誤信號(hào)e(n)。輸出編碼c(n)構(gòu)成由ADPCM解碼器5發(fā)送或傳輸和接收的比特流。在圖1中,這個(gè)由虛線11指示。輸出編碼c(n)通過塊8和解碼器塊9還被用于量化器步長Δn的適應(yīng)以得到量化的錯(cuò)誤信號(hào)e’(n)。量化的錯(cuò)誤信號(hào)e’(n)被附加到預(yù)測值s(n-1),從而得到量化的輸入數(shù)值s’(n)。這個(gè)數(shù)值s’(n)被預(yù)測器塊10用于修改它的預(yù)測系數(shù)。ADPCM解碼器5正好是編碼器4的一個(gè)子設(shè)備;它讀取從比特流接收的量化編碼c(n)并且用和編碼器4一樣的方式更新它的內(nèi)部變量。解碼器塊13輸出的是量化的錯(cuò)誤信號(hào)e’(n),它在被附加到預(yù)測值s(n-1)后,給出量化的音頻信號(hào)s(n)。后面的信號(hào)構(gòu)成后處理器6的輸入信號(hào)。作為已提及的構(gòu)成本發(fā)明專利申請(qǐng)一部分的預(yù)處理器和后處理器以及ADPCM解碼器和編碼器在ID604963中被描述。
ADPCM編碼器4另外的輸入信號(hào)由編解碼器模式信號(hào)構(gòu)成,它被用碼字發(fā)送或傳輸?shù)紸DPCM解碼器5。這個(gè)編解碼器模式信號(hào)決定ADPCM編碼器4和ADPCM解碼器5的比特流輸出中碼字的比特分配。依靠選擇的編解碼器模式,作為結(jié)果的比特流具有比特率如12.8,16,19.2,21.6,24或32千比特/秒。
在量化器中做下面的計(jì)算首先根據(jù)以下關(guān)系式做出量化 其中 表示截?cái)嗖僮鳌?br>
量化信號(hào)q(n)限定在0和cmax之間,這意味著c(n)=max
。Cmax值依靠編解碼器模式以及因此依靠比特率。例如,對(duì)應(yīng)上述比特率,cmax可以依次是2,3,4,5,7和15。隨后,根據(jù)以下關(guān)系式計(jì)算新的步長 其中,在一個(gè)特別的實(shí)施方案中,b,A和Δmax被分別設(shè)置為16,0.996和8192。而且量化器塊裝備有存儲(chǔ)裝置,它包括依靠c(n)的α(c(n))表。特別在一個(gè)相位涂抹被應(yīng)用的實(shí)施方案中,這些校正因子允許對(duì)所有編碼的步長Δ(n)的更逐漸的適應(yīng),帶來改進(jìn)的誤碼容限。尤其高比特率模式從這里獲利。誤碼能被參數(shù)A控制;當(dāng)誤碼率變得高于1%時(shí),看來數(shù)值0.75是在誤碼穩(wěn)健性和總語音質(zhì)量之間的一個(gè)好的折衷。
在現(xiàn)有技術(shù)中,根據(jù)說明書導(dǎo)言部分中提及的公式(P)的步長適應(yīng),在圖2A-2F的表中給出了α(c(n))值。這些表中的每一個(gè)依靠量化器輸出信號(hào)c(n)索引號(hào)或與此對(duì)應(yīng)的量化等級(jí)e(n)/Δn給出比例因子α(c(n))。對(duì)于這些表,cmax分別是2,3,4,5,7和15。特別從圖2F,作為最長的表,可以看到結(jié)合公式(P)尤其是較高編碼帶來快得多的步長適應(yīng)。更高的比例因子對(duì)于當(dāng)量化器輸入信號(hào)等級(jí)突然增加時(shí)允許步長更快是重要的。對(duì)于較低的編碼,α=1;這個(gè)實(shí)例中步長將逐漸減少。然而,更快的步長適應(yīng)意味著更大的誤碼危險(xiǎn)。
根據(jù)公式在步長適應(yīng)中,在圖3A-3F表中給出了α(c(n))值。再者,這些表的每一個(gè)依據(jù)量化器輸出信號(hào)c(n)的索引號(hào)或與此對(duì)應(yīng)的量化等級(jí)e(n)/Δn索引號(hào)給出比例因子α(c(n))。而且對(duì)于這些表,cmax分別是2,3,4,5,7和15。在量化器輸入中快速高能變化不出現(xiàn)的實(shí)例中,根據(jù)圖3A-3F的表選擇比例因子是可能的。這對(duì)于聲音被已發(fā)生錄音的房間中的回聲涂抹的長距離錄音或有如ID604963中描述的相位涂抹濾波器的編碼系統(tǒng)是可能的。圖3A-3F中比例因子供給更慢的步長適應(yīng),但是有降低誤碼危險(xiǎn)的有利結(jié)果。
通過可以以能夠在P2CM音頻編碼器和解碼器中的信號(hào)處理裝置上運(yùn)行的計(jì)算機(jī)程序的形式的算法實(shí)現(xiàn)上面描述的實(shí)施方案。在迄今為止的圖表的部分中顯示執(zhí)行某些可編程的功能的單元,這些單元必須被認(rèn)為是計(jì)算機(jī)程序的子部分。
本發(fā)明所描述的并不局限于已描述的實(shí)施方案。其中可能修改。特別應(yīng)該注意在所描述的實(shí)施方案中提及的以及圖表中所示的數(shù)值和表僅僅是作為例子給出的,其它的數(shù)值和表也是可能的。
權(quán)利要求
1.有語音編碼器以及與所述語音編碼器合作的語音解碼器的語音編碼系統(tǒng),語音編碼器包括預(yù)處理器以及有量化器和步長適應(yīng)裝置的ADPCM(自適應(yīng)差分脈碼調(diào)制)編碼器,并且語音解碼器包括有和ADPCM編碼器中類似的步長適應(yīng)裝置以及有一個(gè)解碼器的ADPCM解碼器,和一個(gè)后處理器,量化器裝備有包括步長Δ(n)的校正因子α(c(n))值的存儲(chǔ)裝置,所述校正因子取決于量化器輸出信號(hào)c(n),其特征在于步長適應(yīng)根據(jù)以下關(guān)系式出現(xiàn) 其中b,A和Δmax是常數(shù)。
2.根據(jù)權(quán)利要求1的語音編碼系統(tǒng),其特征在于量化器中的存儲(chǔ)裝置包括根據(jù)圖3A-3F的任何一個(gè)中的表的校正因子α(c(n))值。
3.根據(jù)權(quán)利要求1或2的語音編碼系統(tǒng),其特征在于使校正因子α(c(n))適合于編碼系統(tǒng),其中在預(yù)處理器中應(yīng)用相位涂抹濾波器裝置以及在后處理器中應(yīng)用反向相位涂抹濾波器裝置。
全文摘要
在具有一個(gè)編碼器和一個(gè)與所述編碼器合作的解碼器的語音編碼系統(tǒng)中,語音編碼器包括一個(gè)預(yù)處理器和一個(gè)具有一個(gè)量化器和一個(gè)步長適應(yīng)裝置的ADPCM編碼器,而語音解碼器包括一個(gè)具有向ADPCM編碼器那樣的類似步長適應(yīng)裝置的ADPCM解碼器和一個(gè)后處理器。量化器被裝備有存儲(chǔ)裝置,其含有步長?(n)的校正因子α(c(n))值,所述校正因子依賴于量化器輸出信號(hào)c(n)。步長適應(yīng)根據(jù)一個(gè)關(guān)系式而進(jìn)行。
文檔編號(hào)G10L19/00GK1460247SQ02801105
公開日2003年12月3日 申請(qǐng)日期2002年3月25日 優(yōu)先權(quán)日2001年4月9日
發(fā)明者E·F·吉吉 申請(qǐng)人:皇家菲利浦電子有限公司