專利名稱:一種音頻信號(hào)編碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種對(duì)音頻信號(hào)進(jìn)行編碼的方法,特別地,但不專門地涉及語(yǔ)音信號(hào)的編碼方法及設(shè)備。
背景技術(shù):
音頻信號(hào)的編碼方法有很多種,傳統(tǒng)波形編碼器用減少量化誤差的方法,使重構(gòu)音頻朝著原始音頻信號(hào)收斂;參量編碼器則利用音頻產(chǎn)生的數(shù)學(xué)模型,提取音頻信號(hào)的特征參量,并按照模型參量重構(gòu)音頻信號(hào)。
波形編碼器與參量編碼器相比較各有優(yōu)缺點(diǎn),總體來(lái)說(shuō),波形編碼器具有音質(zhì)好、復(fù)雜度小的優(yōu)點(diǎn),但比特率較高,如比特率為32Kbit/s的自適應(yīng)差分脈碼調(diào)制(ADPCM,ITU-T G.726),復(fù)雜度為1.25MIPS;而參量編碼器具有比特率較低的優(yōu)點(diǎn),但音質(zhì)稍差,復(fù)雜度較高,如比特率為8Kbit/s的G.729語(yǔ)音編碼器(CELP,ITU-T G.729),復(fù)雜度為25MIPS。
在音頻信號(hào)編碼中,廣泛使用了矢量量化方法,按照這種方法,將一個(gè)輸入矢量與存儲(chǔ)在一個(gè)代碼本中的代碼矢量比較,以輸出這些代碼矢量中的一個(gè)最佳矢量的索引。矢量量化方法能夠以非常低的比特率,提供超過(guò)標(biāo)量量化的性能,但是,如果代碼本中所含代碼矢量的數(shù)目較大,則會(huì)增加為輸入矢量尋找匹配的代碼矢量的搜索操作次數(shù),明顯地增大代碼本搜索處理的工作量,也增加了相應(yīng)音頻信號(hào)編碼器的復(fù)雜度。
本發(fā)明的目的在于提供一種音頻信號(hào)編碼的方法和設(shè)備,它能夠減少音頻編碼過(guò)程中對(duì)音頻信號(hào)進(jìn)行矢量量化操作產(chǎn)生的代碼本搜索的處理量,在較低的復(fù)雜度和比特率下,實(shí)現(xiàn)音頻信號(hào)高質(zhì)量的重構(gòu)。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的第一方面提供了編碼音頻信號(hào)的方法,包括步驟設(shè)定上閥值頻率和下閥值頻率(上閥值頻率>下閥值頻率);采樣音頻信號(hào);將樣本音頻信號(hào)分成多個(gè)正、負(fù)半波;對(duì)每個(gè)半波將其頻率與閥值頻率比較,分成三類第一類半波頻率大于上閥值頻率的半波;第二類半波頻率小于下閥值頻率的半波;第三類半波頻率小于或等于上閥值頻率且大于或等于下閥值頻率的半波;對(duì)第一、二類半波判定為不發(fā)聲信號(hào);對(duì)第三類半波進(jìn)行矢量量化以形成多個(gè)索引;其特征在于根據(jù)采樣頻率和作為人的聽(tīng)覺(jué)性質(zhì)的聽(tīng)覺(jué)靈敏特性,選擇上述的上閥值頻率和下閥值頻率,并對(duì)樣本音頻信號(hào)按照時(shí)域和量化數(shù)值分成多個(gè)正、負(fù)半波,對(duì)處于上、下閥值頻率之間的每個(gè)半波根據(jù)其兩個(gè)零點(diǎn)間所包含的采樣點(diǎn)數(shù)目,即該半波矢量的維數(shù),各自尋找對(duì)應(yīng)維數(shù)的分代碼本,進(jìn)行矢量量化,輸出索引,對(duì)其他半波作不發(fā)聲信號(hào)處理。
參照?qǐng)D1示出了根據(jù)本發(fā)明的方法將音頻信號(hào)分成多個(gè)正、負(fù)半波,以及半波的零點(diǎn)位置。
更好地,對(duì)包含相同矢量維數(shù)的第三類半波根據(jù)其正、負(fù)特性,分別尋找對(duì)應(yīng)正、負(fù)特性的分代碼本,進(jìn)行矢量量化。
利用本發(fā)明的方法,選擇對(duì)人的聽(tīng)覺(jué)感受最重要的信號(hào)頻率區(qū)間,對(duì)多個(gè)半波根據(jù)其矢量維數(shù)的不同,分別按照不同的分代碼本進(jìn)行矢量量化,能夠較好的重構(gòu)原始音頻信號(hào);同時(shí),與迄今為止所知的其他矢量量化方法相比,在總代碼本大小相同的情況下,本發(fā)明的方法由于各半波對(duì)應(yīng)的分代碼本的長(zhǎng)度遠(yuǎn)小于總代碼本的長(zhǎng)度,且在代碼本搜索方法相同的情況下,各分代碼本搜索運(yùn)算量的和總不大于各分代碼本搜索運(yùn)算量的乘,于是減少了尋找匹配代碼矢量的代碼本搜索的運(yùn)算量。
根據(jù)本發(fā)明的第二方面,提供了一種解碼輸入數(shù)據(jù)信號(hào)用于音頻輸出的方法,包括步驟從輸入的數(shù)據(jù)信號(hào)中獲取發(fā)聲/不發(fā)聲判定信息;根據(jù)數(shù)據(jù)信號(hào)的索引作矢量去量化操作獲取半波信息;根據(jù)不發(fā)聲判定信息和半波信息構(gòu)造一音頻信號(hào)。
根據(jù)本發(fā)明的第三方面,提供了一種音頻編碼設(shè)備,包括用于采樣音頻信號(hào)并將采樣的信號(hào)分成多個(gè)正、負(fù)半波的裝置;半波頻率與閥值頻率比較裝置,用于獲取半波類別;變換裝置,用于將前述第一、二類半波變換為不發(fā)聲信號(hào);矢量量化裝置,用于量化前述第三類半波以形成輸出索引;其特征在于該音頻編碼設(shè)備以半波為音頻編碼單位,對(duì)于包含不同矢量維數(shù)的前述第三類半波,用包含對(duì)應(yīng)維數(shù)的代碼本進(jìn)行矢量量化。
根據(jù)本發(fā)明的第四方面,提供了一種用于解碼輸入數(shù)據(jù)信號(hào)以作音頻合成的解碼設(shè)備,包括發(fā)聲/不發(fā)聲判定裝置;矢量去量化裝置;根據(jù)不發(fā)聲信息和半波信息構(gòu)造一音頻信號(hào)的裝置。
圖1以舉例的形式說(shuō)明半波的劃分。
圖2是本發(fā)明的編碼設(shè)備的一個(gè)實(shí)施例的方框圖。
圖3是用于解碼利用圖2所示實(shí)施例編碼的語(yǔ)音的本發(fā)明的解碼設(shè)備的一個(gè)實(shí)施例的方框圖。
具體實(shí)施例方式
參照?qǐng)D2,示出了根據(jù)本發(fā)明的編碼設(shè)備的一個(gè)實(shí)例。
一輸入音頻信號(hào)在100被采樣作模數(shù)轉(zhuǎn)換(A/D)并將信號(hào)按時(shí)域和量化數(shù)值分成多個(gè)正、負(fù)半波。
然后在110對(duì)每個(gè)半波的半波頻率進(jìn)行上、下閥值頻率比較分類,將半波頻率大于上閥值頻率或小于下閥值頻率的半波信號(hào)送往120;將半波頻率處于上、下閥值頻率之間的半波信號(hào)送往130。
送往120的半波信號(hào)被變換為不發(fā)聲信號(hào)后送往140。
送往130的半波信號(hào)根據(jù)其所含矢量維數(shù)的不同,尋找具有對(duì)應(yīng)矢量維數(shù)的分代碼本進(jìn)行矢量量化,輸出代碼矢量的索引至140。
在140的組合過(guò)程保持每個(gè)元素以預(yù)定的順序相互離散以使得可作下面將要描述的解碼。
參照?qǐng)D3,示出了解碼圖2的輸出信號(hào)的解碼器,它執(zhí)行圖2的編碼器的相反操作。
在310數(shù)據(jù)信號(hào)被判定分成發(fā)聲/不發(fā)聲信號(hào)兩部分,不發(fā)聲信號(hào)直接送至340,發(fā)聲信號(hào)則將代碼矢量的索引送至330。
代碼矢量的索引在330通過(guò)抽取正確的代碼矢量而被解碼,然后送至340。
在340以預(yù)定的順序組裝信號(hào)各部分并通過(guò)數(shù)模轉(zhuǎn)換(D/A)形成一個(gè)音頻信號(hào)。
本發(fā)明特別適用于以數(shù)字形式實(shí)時(shí)傳輸音頻信號(hào)的設(shè)備,例如有線IP電話機(jī)和無(wú)線IP電話機(jī)。
本發(fā)明尤其適用于無(wú)線IP電話機(jī),因?yàn)樗枰^好的音頻質(zhì)量但同時(shí)作為電源能力有限、帶寬不穩(wěn)定的移動(dòng)通訊器,需要較低的數(shù)字編碼計(jì)算和較小的比特率以降低功耗保證通信質(zhì)量。
利用本發(fā)明的此實(shí)例便可能以低于2MIPS的復(fù)雜度,以8Kbit/s的比特率傳輸數(shù)字音頻信息。
上述描述的此實(shí)施例不應(yīng)理解為限定性的。例如雖然選擇了64個(gè)半波形的分代碼本進(jìn)行矢量量化,但也可根據(jù)對(duì)音頻編碼語(yǔ)音質(zhì)量和比特率的要求,選擇更多的或更少的半波形的分代碼本進(jìn)行矢量量化;同時(shí)各半波形的分代碼本長(zhǎng)度也可根據(jù)需要的量化精度與對(duì)音頻編碼語(yǔ)音質(zhì)量的要求而進(jìn)行調(diào)整,而且每一個(gè)半波形的分代碼本都可以選擇不同的代碼本種類和量化方法,以進(jìn)一步降低音頻編碼的復(fù)雜度、音頻編碼的比特率或提高音頻編碼的語(yǔ)音質(zhì)量。
權(quán)利要求
1.一種音頻信號(hào)編碼的方法,包括步驟設(shè)定設(shè)定上、下閥值頻率;采樣音頻信號(hào);將樣本音頻信號(hào)分成多個(gè)正、負(fù)半波;對(duì)每個(gè)半波將其頻率于閥值頻率比較,分成三類第一類半波頻率大于上閥值頻率的半波;第二類半波頻率小于下閥值頻率的半波;第三類半波頻率小于或等于上閥值頻率且大于或等于下閥值頻率的半波;對(duì)第一、二類半波判定為不發(fā)聲信號(hào);對(duì)第三類半波進(jìn)行矢量量化以形成多個(gè)索引;其特征在于根據(jù)采樣頻率和作為人的聽(tīng)覺(jué)性質(zhì)的聽(tīng)覺(jué)靈敏特性,選擇上述的上閥值頻率和下閥值頻率,并對(duì)樣本音頻信號(hào)按照時(shí)域和量化數(shù)值分成多個(gè)正、負(fù)半波,對(duì)處于上、下閥值頻率之間的每個(gè)半波根據(jù)其兩個(gè)零點(diǎn)間所包含的采樣點(diǎn)數(shù)目,即該半波矢量的維數(shù),各自尋找對(duì)應(yīng)維數(shù)的分代碼本,進(jìn)行矢量量化,輸出索引,對(duì)其他半波作不發(fā)聲信號(hào)處理。
2.根據(jù)權(quán)利要求1的方法,對(duì)包含相同矢量維數(shù)的第三類半波根據(jù)其正、負(fù)特性,分別尋找對(duì)應(yīng)正、負(fù)特性的分代碼本,進(jìn)行矢量量化。
3.一種用于解碼由前述任一權(quán)利要求的方法所編碼的信號(hào)的方法,包括步驟從輸入的數(shù)據(jù)信號(hào)中獲取發(fā)聲/不發(fā)聲判定信息;根據(jù)數(shù)據(jù)信號(hào)的索引作矢量去量化操作獲取半波信息;根據(jù)不發(fā)聲判定信息和半波信息構(gòu)造一音頻信號(hào)。
4.用于執(zhí)行前述任一權(quán)利要求的方法的設(shè)備。
5.音頻編碼設(shè)備,包括用于采樣音頻信號(hào)并將采樣的信號(hào)分成多個(gè)正、負(fù)半波的裝置;半波頻率與閥值頻率比較裝置,用于獲取半波類別;變換裝置,用于將前述第一、二類半波變換為不發(fā)聲信號(hào);矢量量化裝置,用于量化前述第三類半波以形成輸出索引;其特征在于該音頻編碼設(shè)備以半波為音頻編碼單位,對(duì)于包含不同矢量維數(shù)的前述第三類半波,用包含對(duì)應(yīng)維數(shù)的代碼本進(jìn)行矢量量化。
6.用于解碼輸入數(shù)據(jù)信號(hào)以作音頻合成的解碼設(shè)備,包括發(fā)聲/不發(fā)聲判定裝置;矢量去量化裝置;根據(jù)不發(fā)聲信息和半波信息構(gòu)造一音頻信號(hào)的裝置。
7.組合權(quán)利要求5~6任一項(xiàng)的設(shè)備。
8.用于存儲(chǔ)及復(fù)制音頻的設(shè)備,包括權(quán)利要求5~6任一項(xiàng)的設(shè)備。
9.一種手持無(wú)線IP通信設(shè)備,包括權(quán)利要求5~6任一項(xiàng)的設(shè)備。
全文摘要
公開(kāi)了一種音頻信號(hào)編碼方法,其中該音頻信號(hào)被采樣并分割成多個(gè)正、負(fù)半波,根據(jù)設(shè)定的上、下閾值頻率對(duì)該半波進(jìn)行發(fā)聲/不發(fā)聲判定。對(duì)判定為發(fā)聲的多個(gè)半波根據(jù)其兩個(gè)零點(diǎn)間所包含的采樣點(diǎn)數(shù)目,即該半波的矢量維數(shù),各自尋找對(duì)應(yīng)維數(shù)的分代碼本,進(jìn)行矢量量化,形成輸出索引,由于各半波所對(duì)應(yīng)的分代碼本長(zhǎng)度遠(yuǎn)小于總代碼本長(zhǎng)度,因此能夠不降低解碼時(shí)音頻信號(hào)的聽(tīng)覺(jué)品質(zhì),減少矢量量化中代碼搜索的運(yùn)算量。還公開(kāi)了一種執(zhí)行編碼和解碼方法的解碼方法及設(shè)備。
文檔編號(hào)G10L19/00GK1815894SQ200510007330
公開(kāi)日2006年8月9日 申請(qǐng)日期2005年2月6日 優(yōu)先權(quán)日2005年2月6日
發(fā)明者俞鐵城, 許牧 申請(qǐng)人:許牧