亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

低比特速率音頻編碼的制作方法

文檔序號:7505427閱讀:223來源:國知局
專利名稱:低比特速率音頻編碼的制作方法
技術領域
本發(fā)明總體上涉及數(shù)字音頻編碼系統(tǒng)和方法,更具體而言涉及提高從非常低比特速率的音頻編碼系統(tǒng)和方法得到的音頻信號的感覺質(zhì)量。
背景技術
音頻編碼系統(tǒng)被使用來把音頻信號編碼成適合于傳輸或貯存的編碼的信號,以及隨后接收或恢復編碼信號和譯碼它,以得到原先的音頻信號的版本用于播放。感知的音頻編碼系統(tǒng)試圖把音頻信號編碼成具有比起原先的音頻信號更低的信息容量要求的編碼信號,隨后譯碼該編碼的信號,以提供感覺上與原先的音頻信號不能區(qū)分的輸出。感知的音頻編碼技術在Bosi等人的“ISO/IEC MPEG-2 Advanced AudioCoding(ISO/IEC MPEG-2高級音頻編碼)”,J.AES,Vol.45,No.10,October1997,pp.789-814中描述,它被稱為高級音頻編碼(AAC)。
像AAC那樣的感知編碼技術把分析濾波器庫加到音頻信號上,得到數(shù)字信號分量,它典型地具有范圍為16-24比特的高精度級別,以及被安排在頻率子頻帶。子頻帶寬度典型地是變化的,以及通常是與人的聽覺系統(tǒng)的所謂的臨界頻帶的帶寬相當?shù)?。通過把子頻帶信號分量量化成低得多的精度級別,可以減小信號的信息容量要求。另外,量化的分量也可以通過諸如Huffman編碼那樣的熵編碼過程被編碼。量化會注入噪聲到量化的信號,但感知音頻編碼系統(tǒng)使用心理聲學模型,試圖控制量化噪聲的幅度,這樣,它被信號中的譜分量掩蔽或使人聽不見。子頻帶信號分量的不精確的復制品是通過互補的熵譯碼和去量化從編碼信號得出的。
許多傳統(tǒng)的感知編碼系統(tǒng)的目標是量化子頻帶信號分量,以及以最佳或?qū)嶋H上盡量接近最佳的方式把熵編碼過程加到量化的信號分量。量化和熵編碼通常被設計成以盡可能高的數(shù)學效率運行。
最佳或接近最佳的量化器的設計取決于要被量化的信號分量數(shù)值的統(tǒng)計特性。在使用變換來實施分析濾波器庫的感知編碼系統(tǒng)中,信號分量數(shù)值是從頻域變換系數(shù)得出的,這些頻域變換系數(shù)被分組為子頻帶,然后相對于在每個子頻帶中最大幅度分量進行歸一化或縮放??s放的一個例子是被稱為塊壓縮的過程。被分組為每個子頻帶的系數(shù)的數(shù)目典型地隨子頻帶頻率增加,以使得子頻帶帶寬近似人的聽覺系統(tǒng)的臨界帶寬。心理聲學模型和比特定位過程確定對于每個子頻帶的縮放量。分組和縮放將改變要被量化的信號分量數(shù)值的統(tǒng)計特性;所以,量化效率通常是對于分組的和縮放的信號分量的特性被最佳化。
在像上述的AAC系統(tǒng)那樣的典型的感知編碼系統(tǒng)中,較寬的子頻帶往往具有幾個主要的、有相對較大的幅度的子頻帶信號分量和許多更小的、有相對較小的幅度的信號分量。均勻的量化器不能以高效率量化這樣的數(shù)值分布。量化器效率可以通過以較大的精度量化較小的信號分量和以較小的精度量化較大的信號分量而被提高。這常常是通過使用諸如μ定律或A定律量化器那樣的壓縮量化器而完成的。壓縮量化器可以由壓縮器后面跟隨均勻量化器來實施,或它可以由等價于兩個步驟的過程的非均勻量化器來實施。擴展的去量化器被使用來顛倒壓縮量化器的效果。擴展的去量化器提供擴展,它基本上是在壓縮量化器中提供的壓縮的逆過程。
壓縮量化器通常在感知音頻編碼系統(tǒng)中提供有益的結果,它用量化精度級別表示所有的信號分量,該精度級別基本上等于或大于由掩蔽量化噪聲所需要的心理聲學模型規(guī)定的精度。壓縮通常通過把信號分量數(shù)值更均勻地重新分布在量化器的輸入范圍內(nèi)而提高量化效率。
非常低比特速率(VLBR)的音頻編碼系統(tǒng)通常不能用足以掩蔽量化噪聲的量化精度來表示所有的信號分量。某些VLBR編碼系統(tǒng)試圖通過發(fā)送或記錄只具有一部分輸入信號帶寬的基帶信號和在播放期間通過從基帶信號復制頻譜分量而再生信號帶寬的丟失的播放,來播放具有高的感知質(zhì)量級別的輸出信號。這個技術有時稱為“頻譜變換”或“頻譜再生”。本發(fā)明人看到,壓縮量化器當被使用于諸如使用頻譜再生的系統(tǒng)那樣的VLBR編碼系統(tǒng)中,通常無法提供有益的結果。
諸如被使用于典型的音頻編碼系統(tǒng)中的那樣的最佳的或接近最佳的編碼器的設計取決于要被編碼的數(shù)值的統(tǒng)計特性。在典型的系統(tǒng)中,量化的信號分量組通過Huffman編碼過程被編碼,Huffman編碼過程使用一個或多個碼本來生成表示量化的信號分量的可變長度的代碼。最短的代碼被使用來表示預期最經(jīng)常出現(xiàn)的那些量化的數(shù)值。每個代碼由整數(shù)個比特表示。
Huffman編碼常常在可以用足以掩蔽量化噪聲的量化精度來表示所有的信號分量的音頻編碼系統(tǒng)中提供良好的結果。然而,本發(fā)明人看到,Huffman編碼具有嚴重的限制,這使得它不適用于許多VLBR編碼系統(tǒng)。這些限制在下面說明。

發(fā)明內(nèi)容
本發(fā)明的目的是提供克服使用壓縮量化器和像Huffman編碼那樣的熵編碼的典型的音頻編碼的缺點的、改進的音頻編碼系統(tǒng)和方法。
按照本發(fā)明的一個方面,音頻編碼發(fā)送器包括分析濾波器庫,生成表示具有子頻帶信號分量的音頻信號的頻率子頻帶的多個子頻帶信號;被耦合到分析濾波器庫的量化器,對于在第一數(shù)值區(qū)間內(nèi)的子頻帶信號分量使用第一量化精度和對于在第二數(shù)值區(qū)間內(nèi)的子頻帶信號分量使用第二量化精度量化一個或多個子頻帶信號的子頻帶信號分量,其中第一量化精度低于第二量化精度,第一區(qū)間是與第二區(qū)間相鄰的,以及在第一區(qū)間內(nèi)的數(shù)值小于在第二區(qū)間內(nèi)的數(shù)值;被耦合到量化器的編碼器,通過使用無損編碼過程把量化的子頻帶信號分量編碼成編碼的子頻帶信號;以及被耦合到編碼器的格式化器,把編碼的子頻帶信號裝配成輸出信號。
按照本發(fā)明的另一個方面,音頻譯碼接收機包括去格式化器,從輸入信號得出一個或多個編碼的子頻帶信號;被耦合到去格式化器的譯碼器,通過使用無損譯碼過程譯碼編碼的子頻帶信號而生成一個或多個譯碼的子頻帶信號;被耦合到譯碼器的去量化器,去量化子頻帶信號分量,其中去量化器是與對于在第一數(shù)值區(qū)間內(nèi)的數(shù)值使用第一量化精度和對于在第二數(shù)值區(qū)間內(nèi)的數(shù)值使用第二量化精度的量化器互補的,其中第一量化精度低于第二量化精度,第一區(qū)間是與第二區(qū)間相鄰的,以及在第一區(qū)間內(nèi)的數(shù)值小于在第二區(qū)間內(nèi)的數(shù)值;以及被耦合到去量化器的合成濾波器庫,根據(jù)該一個或多個去量化的子頻帶信號生成輸出信號。
按照本發(fā)明的又一個方面,音頻編碼發(fā)送器包括分析濾波器庫,生成表示具有子頻帶信號分量的音頻信號的頻率子頻帶的多個子頻帶信號;被耦合到分析濾波器庫的量化器,對于具有其幅度小于一個或多個第一子頻帶信號分量的、一個或多個第二子頻帶信號分量的子頻帶信號,通過把第二子頻帶信號分量推壓到一個數(shù)值范圍,以使得第二子頻帶信號數(shù)值被量化成比起不推壓時出現(xiàn)的更少的量化級別,由此降低量化精度和減小量化的第二子頻帶信號分量的熵,而量化一個或多個子頻帶信號,生成量化的子頻帶信號;被耦合到量化器的編碼器,通過使用熵編碼過程編碼該一個或多個量化的子頻帶信號;以及被耦合到編碼器的格式化器,把編碼的子頻帶信號裝配成輸出信號。
按照本發(fā)明的再一個方面,音頻譯碼接收機包括去格式化器,從輸入信號得出一個或多個編碼的子頻帶信號;被耦合到去格式化器的譯碼器,通過使用無損譯碼過程譯碼編碼的子頻帶信號而生成一個或多個譯碼的子頻帶信號;被耦合到譯碼器的去量化器,去量化譯碼的子頻帶信號分量的子頻帶信號分量,其中去量化器是與對于具有一個或多個第一子頻帶信號分量和其幅度小于一個或多個第一子頻帶信號分量的、一個或多個第二子頻帶信號分量的子頻帶信號,把第二子頻帶信號分量推壓到一個數(shù)值范圍,以便把它們量化成比起不推壓時出現(xiàn)的更少的量化級別,由此降低量化精度和減小量化的第二子頻帶信號分量的熵的量化器互補的;以及被耦合到去量化器的合成濾波器庫,根據(jù)該一個或多個去量化的子頻帶信號生成輸出信號。
通過參考以下的討論和附圖,可以更好地理解本發(fā)明的各種特征和它的優(yōu)選實施例。以下的討論和附圖的內(nèi)容僅僅是作為例子闡述的,不應當看作為表示為對于本發(fā)明的范圍的限制。


圖1是音頻編碼發(fā)送器的示意性方框圖。
圖2是音頻譯碼接收機的示意性方框圖。
圖3是假設的子頻帶信號分量的壓縮和擴展的圖形表示。
圖4A-4C是圖3所示的子頻帶信號分量的量化的圖形表示。
圖5是壓縮量化函數(shù)的圖形表示。
圖6是壓縮函數(shù)的圖形表示。
圖7是均勻量化函數(shù)的圖形表示。
圖8是擴展函數(shù)的圖形表示。
圖9是擴展量化函數(shù)的圖形表示。
圖10是擴展/壓縮量化函數(shù)的圖形表示。
圖11是算術編碼的圖形表示。
圖12是可被使用來實施本發(fā)明的各個方面的設備的示意方框圖。
具體實施例方式
A.發(fā)送器1.綜述圖1顯示可以引用本發(fā)明的各種方面的音頻編碼發(fā)送器的一個實施方案。在這個實施方案中,分析濾波器庫12從路徑11接收表示音頻信號的音頻信息,以及作為響應,提供表示音頻信號的頻率子頻帶的數(shù)字信息。在每個頻率子頻帶中的數(shù)字信息被各個量化器14、15、16量化,以及被傳送到編碼器17。編碼器17生成量化信息的編碼表示,它被傳送到格式化器18。在一個實施方案中,在量化器14、15、16中的量化函數(shù)根據(jù)從量化器控制器接收的量化控制信息被調(diào)整,該量化器控制器根據(jù)從路徑11接收的音頻信息生成量化控制信息。格式化器18把量化信息的編碼的表示和量化控制信息裝配成適合于傳輸或貯存的輸出信號,以及沿著路徑19傳送輸出信號。
圖1所示的發(fā)送器顯示三個頻率子頻帶的分量。在典型的應用中使用多得多子頻帶,但這里為了說明清晰起見只顯示三個子頻帶。在本發(fā)明的原理中具體數(shù)目并不重要。
分析濾波器庫12實際上可以以想要的任何方式來實施,包括各種各樣的數(shù)字濾波器技術、塊變換、和小波變換。例如,分析濾波器庫12可以通過一個或多個正交鏡像濾波器(QMF)的級聯(lián),各種離散傅立葉型變換,諸如離散余弦變換(DCT)、或被稱為時域混淆抵銷(TDAC)變換的特定的修正的DCT,它在Princen等人的“Subband/Transform Coding Using Filter Bank Designs Based onTime Domain Aliasing Cancellation(使用基于時域混淆抵銷的濾波器庫的子頻帶/變換編碼)”,ICASSP 1987 Conf.Proc.,May1987,pp.2161-64中描述。
通過塊變換實施的分析濾波器庫把輸入信號的塊或區(qū)間變換成一組變換系數(shù),它表示該信號區(qū)間的譜內(nèi)容。一個或多個相鄰的變換系數(shù)的組表示在具有與組中的系數(shù)數(shù)目相當?shù)膸挼奶囟ǖ念l率子頻帶內(nèi)的譜內(nèi)容。
由諸如多相濾波器的某些類型的數(shù)字濾波器--而不是塊變換--實施的分析濾波器庫把輸入信號分離成一組子頻帶信號。每個子頻帶信號是在特定的頻率子頻帶內(nèi)輸入信號的譜內(nèi)容的基于時間的表示。優(yōu)選地,子頻帶信號被分樣,以使得每個子頻帶信號具有具有與單位時間區(qū)間內(nèi)子頻帶信號中樣本數(shù)目相當?shù)膸挕?br> 在本討論中,術語“子頻帶信號”是指一個或多個相鄰的變換系數(shù)的組,以及術語“子頻帶信號分量”是指變換系數(shù)。然而,本發(fā)明的原理可以應用于其他類型的實施方案,所以,術語“子頻帶信號”可以總的理解為也是指信號的特定的頻率子頻帶的譜內(nèi)容,以及術語“子頻帶信號分量”可以總的理解為是指基于時間的子頻帶信號的樣本。
下面更詳細地討論量化器14、15、16和編碼器17。
量化器控制器13可以執(zhí)行可能想要的、基本上任何類型的處理。一個例子是把心理聲學模型應用到音頻信息,以估計音頻信號中不同的譜分量的心理聲學掩蔽效應的過程。例如,量化器控制器13可以根據(jù)在分析濾波器庫12的輸出端處--代替在分析濾波器庫12的輸出端處,或除了在分析濾波器庫12的輸出端處以外--可提供的頻率子頻帶信息生成量化控制信息。作為另一個例子,可以消除量化器控制器13,以及量化器14、15、16使用不調(diào)整的量化函數(shù)。本發(fā)明不需要特定的過程。
格式化器18把量化的和編碼的信號分量裝配成適合于沿路徑傳送的形式,用于傳輸或貯存。被格式化的信號可包括如想要的同步圖案、錯誤檢測/糾正信息,以及控制信息。
2.量化器(a)壓縮量化器許多典型的音頻編碼系統(tǒng)中的量化器14、15、16是壓縮量化器,因為壓縮可提高量化效率。對于這種效率提高的原因在下面段落中說明。
圖3的線31表示假設的子頻帶信號分量的分量數(shù)值。為了顯示清晰起見,直線段連接相鄰的數(shù)值。在這個圖以及其他的圖上只顯示正的數(shù)值;然而,這里討論的原理可應用于具有正的和負的分量數(shù)值的實施方案。分量數(shù)值相對于子頻帶信號中最大的分量的數(shù)值被歸一化或被縮放。八個量化級別覆蓋從零到一的歸一化數(shù)值范圍。
圖4A是使用諸如圖7所示的、把信號分量數(shù)值舍入最接近的量化級別的函數(shù)那樣的均勻量化函數(shù)的、在線31上的子頻帶信號分量的八級別量化的圖形表示。正的量化級別可以由3比特二進制數(shù)表示。被量化成低于“4”級別的級別的分量數(shù)值不能有效地量化,因為這些量化級別只能由2比特表示。實際上,對于被量化成低于“4”級別的每個信號分量,一個比特是浪費的。
圖4B是使用圖5所示的、把信號分量數(shù)值舍入最接近的量化級別的壓縮量化函數(shù)的、在線31上的子頻帶信號分量的八級別量化的圖形表示。壓縮量化器比起均勻量化器具有更高的量化效率,因為較少的信號分量被量化成低于“4”級別。壓縮量化器可以通過諸如圖5所示的那樣的非均勻量化函數(shù)被實施,或它可以通過諸如圖6所示的函數(shù)那樣的壓縮函數(shù),后面跟隨圖7所示的均勻量化器被實施。圖3上的線32表示在被圖6所示的函數(shù)壓縮后線32的信號值。
壓縮量化器的量化精度對于所有的輸入值是不均勻的。對于小的幅度值的區(qū)間的量化精度高于對于較大的幅度值的相鄰的區(qū)間的量化精度。
壓縮通過減小數(shù)值的動態(tài)范圍而改變子頻帶信號樣本的統(tǒng)計分布。壓縮與歸一化或縮放相組合,通過把這些數(shù)值推壓實際上使用更多的比特的更高的量化級別而提高許多較小的數(shù)值的精度。在接收機中使用擴展和反向縮放過程,顛倒由縮放和壓縮造成的結果。
圖6所示的壓縮函數(shù)是以下形式的冪函數(shù)y=c(x)=xn(Ia)其中c(x)=x的壓縮函數(shù)y=壓縮的數(shù)值;和n=是小于1的正的實數(shù)值。
互補的擴展函數(shù)顯示于圖8上,以及具有以下的形式x=e(y)=y(tǒng)1/n(1b)其中e(y)=y(tǒng)的擴展函數(shù)。
壓縮和擴展函數(shù)的另一個例子是以下形式的函數(shù)y=c(x)=logb(x) (2a)x=e(y)=by(2b)在傳統(tǒng)的編碼系統(tǒng)中使用許多壓縮和擴展函數(shù)的形式,以及實際上任何形式可以在引用本發(fā)明的方面的編碼系統(tǒng)中使用。
(b)非常低比特速率的系統(tǒng)像在公共計算機網(wǎng)絡上流動的音頻那樣的應用需要這樣慢的比特速率的編碼的數(shù)字音頻流,以使得所有的主要的信號分量不能以保證量化噪聲被掩蔽的、足夠的精度被量化。
提供非常低的比特速率(VLBR)編碼系統(tǒng)的許多嘗試,試圖通過編碼和發(fā)送只表示輸入信號的帶寬的一部分的基帶信號和使用技術再生在重新播放期間丟失的帶寬的部分而提供良好的發(fā)聲音頻。典型地,高頻分量從基帶信號中被排除,以及在重新播放期間被再生。這個技術取可被使用來編碼高頻分量的比特和使用這些比特來提高較低的頻率分量的量化精度。
這種基帶/再生技術不能提供滿意的結果。提高這種類型的VLBR編碼系統(tǒng)的質(zhì)量的許多努力試圖改進再生技術;然而,本發(fā)明人確定已知的頻譜再生技術不能很好地起作用,因為由于至少兩個原因,比特無法最佳地分配到頻譜分量。
第一個原因是基帶信號太窄。這具有把比特從基帶信號以外的所有的信號分量--包括重要的大幅度分量--移開,以編碼基帶內(nèi)的信號分量--包括不重要的低幅度分量--的效果。本發(fā)明人確定,基帶信號應當具有約5kHz或更多的帶寬。不幸地,在許多VLBR應用中,比特速率限制是如此嚴重,以致于對于具有5kHz帶寬的信號的每個頻譜分量只有約1比特可被傳輸。因為每個頻譜系數(shù)1比特不足以允許重新播放高質(zhì)量輸出信號,所以已知的編碼系統(tǒng)減小基帶信號的帶寬到遠低于5kHz,以使得在較窄的基帶信號中剩余的信號分量可以以較高的精度被量化。
第二個原因在于,太多的比特被分配給具有小幅度的基帶信號的信號分量。這這具有把比特從重要的大幅度分量移開,更精確地編碼不重要的低幅度分量的效果。這個問題被使用縮放和壓縮量化器的編碼系統(tǒng)加劇,因為如上所述,縮放和壓縮把小的分量數(shù)值推壓較大的量化級別。
由這些原因的每個原因引起的問題可以通過把不太重要的小的數(shù)值的信號分量推壓被量化到較少的數(shù)目的量化級別的數(shù)值范圍而被緩和。這個處理過程降低小的數(shù)值的分量的量化精度,但它也把量化后的小數(shù)值信號的熵減小到比起沒有推壓時的熵更小的水平。所有的信號分量被熵編碼成表示不太重要的小數(shù)值的分量的代碼,具有比起沒有把它們推壓較少的量化級別時的可能的更少的比特,以及剩余的比特被使用來更加精確地量化其他信號分量。被推壓較少的量化級別的信號分量的數(shù)目可以通過使用擴展量化器被控制。
(c)擴展量化器圖4C是使用圖9所示的、把信號分量數(shù)值舍入最接近的量化級別的擴展量化函數(shù)的、在線31上的子頻帶信號分量的八級別量化的圖形表示。擴展量化器比起均勻量化器具有更低的量化效率,因為較多的信號分量被量化成低于“4”級別。擴展量化器可以通過如圖9所示的非均勻量化函數(shù)被實施,或它可以通過諸如圖8所示的函數(shù)那樣的壓縮函數(shù),后面跟隨圖7所示的均勻量化器被實施。圖3上的線33表示在被圖8所示的函數(shù)擴展后線31的信號值。
擴展量化器的量化精度對于所有的輸入值是不均勻的。對于小的幅度值的區(qū)間的量化精度低于對于較大的幅度值的相鄰的區(qū)間的量化精度。
在接收機中使用壓縮和反向縮放過程,顛倒由縮放和擴展造成的結果。
擴展通過加大數(shù)值的動態(tài)范圍而改變子頻帶信號樣本的統(tǒng)計分布。擴展與歸一化或縮放相組合,通過把這些數(shù)值推壓實際上更低的量化級別而降低許多較小的數(shù)值的精度。更多的數(shù)目的較小的數(shù)值的信號分量例如被推壓“0”量化級別。通過增加被量化為包括“量化到零”(QTZ)信號分量的低的量化級別和通過有效地使用表示這些較小的和QTZ分量的代碼,更多的比特是可提供來更加精確地量化較大的數(shù)值的信號分量。
實際上,擴展和量化被使用來識別在較寬的帶寬上重要的信號分量,以便更精確地編碼。這使得比特的分配最佳化,以使得可以從VLBR編碼的信號再生較高質(zhì)量的信號。
量化器可以僅僅為要被量化的整個數(shù)值范圍的一部分提供擴展。擴展對于較小的數(shù)值是重要的。如果想要的話,量化器也可以對于諸如具有較大的數(shù)值的那些信號分量的某些信號分量,提供壓縮。圖10顯示提供按照函數(shù)41的擴展和壓縮的量化函數(shù)42。擴展被提供給具有最小的幅度的數(shù)值,以及壓縮被提供給具有最大的幅度的數(shù)值。對于具有中等幅度的數(shù)值,既不提供擴展也不提供壓縮。
擴展和壓縮的量,如果有的話,可以根據(jù)任何或所有的各種各樣的條件--包括信號特性、可提供用來編碼量化的信號分量的比特的數(shù)目、以及與主要的大幅度分量的靠近性--進行調(diào)整。例如,對于具有相對較平坦的頻譜的、像噪聲的子頻帶信號通常需要更多的擴展。如果相對較大的數(shù)目的比特是可提供用于編碼的,則需要較小的擴展。對于接近主要的大幅度信號分量的信號分量應當使用較小的擴展。如何調(diào)整擴展和壓縮的指示,應當以某種方式提供給接收機,以使得它能調(diào)整太多互補的過程。
量化器14、15、16每個可應用相同的或不同的擴展函數(shù)和量化函數(shù)。而且,用于特定的子頻帶信號的量化器可以以獨立的或至少與在量化器中對于其他子頻帶信號完成的不同的方式被調(diào)整或變化。另外,對于所有的子頻帶信號不需要提供擴展。
3.編碼器編碼器17對于量化的信號分量施加熵編碼,以減小信息容量要求。Huffman編碼被使用于許多已知的編碼系統(tǒng),但它由于至少兩個原因不適合于在許多VLBR系統(tǒng)中使用。
第一個原因在于,Huffman代碼由整數(shù)個比特組成,以及最短的代碼是1比特的長度。Huffman編碼使用最短的代碼,用于具有最高的發(fā)生概率的量化的碼元。合理的假設,最可能的要編碼的量化的數(shù)值是零,因為本發(fā)明有助于增加子頻帶信號中QTZ信號分量的數(shù)目。本發(fā)明可以很大地提高VLBR系統(tǒng)中的信號質(zhì)量,如果QTZ分量可以由長度上小于1比特的代碼表示的話。
通過使用具有多維代碼簿的Huffman編碼可以得到更加短的有效的代碼長度。這允許Huffman編碼使用1比特代碼來表示多個量化的數(shù)值。例如,二維代碼簿允許1比特代碼表示兩個數(shù)值。不幸地,多維代碼對于大多數(shù)子頻帶信號不是非常有效的,以及需要相當大量的存儲器了存儲代碼簿。Huffman編碼可以在單維和多維代碼簿之間自適應地切換,但在編碼信號中需要控制比特來識別哪個代碼簿被使用來編碼信號的部分。這些控制比特偏移通過使用多維代碼簿得到的增益。
Huffman編碼不適用于許多VLBR編碼系統(tǒng)的第二個原因是因為編碼效率對于要編碼的信號的統(tǒng)計值非常敏感。如果代碼簿被使用,被設計來編碼比起實際被編碼的信號值具有非常不同的統(tǒng)計值的數(shù)值,則Huffman可以通過增加編碼信號的信息容量需要而施加懲罰。這個問題可以通過從一組代碼簿選擇最好的代碼簿被緩和,但需要控制比特識別被使用的代碼簿。這些控制比特偏移通過使用多個代碼簿得到的增益。
各種編碼技術,諸如運行長度代碼,可以單獨地使用或結合其他的編碼形式被使用。然而,在優(yōu)選實施例中,使用算術編碼,因為它可被自動地適合于實際的信號統(tǒng)計值,以及它能夠生成比起對于Huffman編碼經(jīng)??赡艿母痰拇a。
算術編碼過程計算在半封閉區(qū)間[0,1)內(nèi)的實數(shù)來表示一個或多個“符號”的“消息”。在這方面,符號是信號分量的量化的數(shù)值以及消息是對于多個信號分量的量化的級別組?!白帜副怼笔窃谙⒅锌赡艹霈F(xiàn)的所有的可能的符號組或量化的數(shù)值組??梢杂蓪崝?shù)表示的、在消息中符號的數(shù)目由可以由編碼器表達的實數(shù)的精度限制。由實數(shù)代碼表示的符號數(shù)目以某些方式提供給譯碼器。
如果M表示在字母表中符號的數(shù)目,則在一個算術編碼過程中的步驟為如下1.把區(qū)間[0,1)劃分成M個分組,其中每個分段相應于字母表中特定的符號。對于各個符號的分段具有正比于該符號的出現(xiàn)的概率的長度。
2.從消息得出第一符號,以及選擇相應的分段。
3.把選擇的分段以類似于步驟(1)中進行的方式劃分成M個分段。每個分段相應于在字母表中的各個符號,以及具有正比于該符號的出現(xiàn)概率的長度。
4.從消息得出下一個符號和選擇相應的分段。
5.繼續(xù)進行步驟(3)和(4),直至整個消息被編碼或直至達到精度極限為止。
6.生成表示在最后選擇的分段內(nèi)的任何數(shù)的最短的可能的二進制分數(shù)。
圖11顯示在加到表示四個量化級別0、1、2和3的四符號的字母表內(nèi)的四個符號“1300”的消息時的這個過程。這些符號的每個符號的出現(xiàn)概率分別是0.55、0.20、0.15和0.10。
圖的左面的第一個方塊表示步驟(1),其中半閉合的區(qū)間[0,1)被劃分成對于字母表的每個符號的四個分段,具有正比于相應的符號的出現(xiàn)概率的長度。
在步驟(2),表示“1”量化級別的第一個符號是從子頻帶消息得出的,以及選擇相應的半閉合分段[0.55,0.75)。
緊接在第一方塊的右面的第二個方塊表示步驟(3),其中選擇的分段被劃分成對于字母表中每個符號的四個分段。
在步驟(4),表示“3”量化級別的第二個符號是從子頻帶消息得出的,以及選擇相應的半閉合分段[0.73,0.75)。
步驟(5)迭代步驟(3)和(4)。緊接在第二方塊的右面的第三個方塊表示步驟(3)的迭代,其中以前選擇的分段被劃分成對于字母表中每個符號的四個分段。
在步驟(4)的迭代中,表示“0”量化級別的第三個符號是從消息得出的,以及選擇相應的半閉合分段[0.730,0.741)。
步驟(5)再次迭代步驟(3)和(4)。在圖的右面的第四個方塊表示步驟(3)的迭代,其中以前選擇的分段被劃分成對于字母表中每個符號的四個分段。
在步驟(4)的迭代中,表示“0”量化級別的第四個和最后的符號是從消息得出的,以及選擇相應的半閉合分段[0.73000,0.73605)。
到達消息的末端,步驟(6)生成表示最后選擇的分段內(nèi)某個數(shù)目的最短的可能的二進制分數(shù)。生成6比特的二進制分數(shù)0.1011112=0.73437510。
上述的編碼過程需要符號字母表的概率分布,以及這個分布必須以某個方式被提供到譯碼器。如果概率分布改變,則編碼過程變?yōu)榇巫罴训?。編碼器17可以從對于編碼接收的符號的實際的概率計算新的分布。這個計算可以連續(xù)進行,當每個碼元從消息被得出時,或它可以不太經(jīng)常地被計算。譯碼器23可以執(zhí)行同一個計算,以及保持它的分布與編碼器17同步。編碼過程可以從任何想要的概率分布開始。
有關算術編碼的附加信息可以從Bell,Cleary和Witten.,“TextCompression(文本壓縮)”,Prentice Hall,Englewood Cliffs,NJ,1990,pp.109-120,和從Saywood,“Introduction to Data Compression(數(shù)據(jù)壓縮入門)”,Morgan Kaufmann Publishers,Inc.,San Francisco,1996,pp.61-96.得到。
B.接收機圖2顯示可以引用本發(fā)明的各個方面的音頻譯碼接收機的一個實施方案。在本實施方案中,去格式化器22從路徑21接收輸送表示音頻信號的頻率子頻帶的量化的數(shù)字信息的編碼表示的輸入信號。去格式化器22從輸入信號得到編碼表示,以及把它傳送到譯碼器23。譯碼器23把編碼表示譯碼成量化的信息的頻率子頻帶。在某個頻率子頻帶中的量化的數(shù)字信息被各個去量化器25、26、27去量化,以及被傳送到合成濾波器庫28,它生成沿路徑29的表示音頻信號的音頻信息。在去量化器25、26、27中的去量化函數(shù)根據(jù)從去量化控制器24接收的去量化控制信息被調(diào)整,該去量化控制器24根據(jù)由去格式化器22從輸入信號得到的控制信息生成去量化控制信息。
譯碼器23施加與由編碼器17施加的過程互補的過程。
去量化器25、26、27提供與在量化器14、15、16提供到擴展互補的壓縮。壓縮去量化器可以通過非均勻去量化函數(shù)被實施,或它可以通過均勻去量化函數(shù),后面跟隨壓縮函數(shù)而被實施。分均勻和均勻去量化可以通過查找表實施。非均勻去量化可以通過僅僅把適當?shù)臄?shù)目的不太附著到量化的數(shù)值的過程而實施。附著的比特可以具有零值或它們可以具有某些其他數(shù)值,諸如來自顫抖信號或偽隨機噪聲信號的樣本。
如果量化器14、15、16沒有在全部數(shù)值范圍內(nèi)提供擴展,則在全部數(shù)值范圍內(nèi)不應當提供壓縮。
去量化控制器24實際上可以執(zhí)行可能想要的任何類型的處理。一個例子是把心理聲學模型加到從輸入信號得出的信息,以估計在音頻信號中不同的譜分量的心理聲學掩蔽效應的過程。作為另一個例子,去量化控制器24被消除,以及去量化器25、26、27可以或者使用不作調(diào)整的去量化函數(shù)或它們可以使用根據(jù)直接從由去格式化器22從輸入信號得到的去量化控制信息被調(diào)整的去量化函數(shù)。本發(fā)明不需要特定的處理過程。
圖2所示的接收機顯示對于三個頻率子頻帶的分量。在典型的應用中使用多得多子頻帶,但這里為了說明清晰起見只顯示三個子頻帶。在本發(fā)明的原理中具體數(shù)目并不重要。
合成濾波器庫28實際上可以以想要的任何方式來實施,包括與以上對于分析濾波器庫12討論的技術的顛倒的方式。由塊變換實施的合成濾波器庫28合成來自變換系數(shù)組的輸出信號。由諸如多相濾波器那樣的某些類型的數(shù)字濾波器—而不是塊變換--實施的合成濾波器庫28合成來自子頻帶信號組的輸出信號。每個子頻帶信號是在特定的頻率子頻帶內(nèi)輸入信號的譜內(nèi)容的基于時間的表示。
C.實施方案本發(fā)明的各個方面可以以各種各樣的方式被實施,包括在通用計算機系統(tǒng)中的軟件或在某些其他設備,包括更專用的部件,諸如被耦合到類似于在通用計算機系統(tǒng)中發(fā)現(xiàn)的那些的部件的數(shù)字信號處理器(DSP)電路。圖12是在音頻編碼發(fā)送器或音頻編碼接收機中可被使用來實施本發(fā)明的各個方面的設備70的方框圖。DSP72提供計算資源。RAM73是被DSP72使用于信號處理的系統(tǒng)隨機存取存儲器(RAM)。ROM74表示永久貯存的某種形式,諸如用于存儲對于運行設備71所需要的程序的只讀存儲器(ROM)。I/O控制75表示接口電路,通過通信信道76、77接收和發(fā)送信號。模擬-數(shù)字變換器和數(shù)字-模擬變換器可被包括在I/O控制75中,如想要地接收和或發(fā)送模擬音頻信號。在所示的實施例中,所有的主要系統(tǒng)部件連接到總線71,它可表示一條以上的物理總線;然而,并不需要總線結構來實施本發(fā)明。
在通用計算機系統(tǒng)中實施的實施例,附加部件可被包括用來接口到諸如鍵盤或鼠標和顯示器那樣的裝置,以及用來控制具有諸如磁帶、磁盤、或光媒體那樣的貯存媒體的貯存設備。貯存媒體可被使用來記錄用于操作系統(tǒng)的指令的程序、公共事業(yè)和應用,以及可包括實施本發(fā)明的各個方面的程序的實施例。
對于實施本發(fā)明所需要的功能可以由專用部件來執(zhí)行,該專用部件可以由包括分立式邏輯元件、一個或多個ASIC和或程序控制的處理器的各種各樣的方式被實施。這些部件被實施的方式對于本發(fā)明并不重要。
本發(fā)明的軟件實施方案可以通過各種各樣的機器可讀的媒體——諸如在包括從超聲波到紫外線頻率的全部頻譜上的基帶或調(diào)制的通信路徑,或通過貯存媒體——包括使用基本上任何磁的或光的記錄技術輸送信息的包括磁帶、磁盤、和光盤的那些媒體被輸送。各個方面也可以在計算機系統(tǒng)70的各個部件中由諸如由以ROM或RAM的各種形式體現(xiàn)的程序控制的ASIC、通用集成電路、微處理器那樣的處理電路實施。
權利要求
1.一種音頻編碼發(fā)送器,其接收表示音頻信號的輸入信號和生成輸送所述音頻信號的編碼的表示的輸出信號,該音頻編碼發(fā)送器包括分析濾波器庫,響應輸入信號生成表示音頻信號的頻率子頻帶的多個子頻帶信號,其中每個子頻帶信號包括一個或多個子頻帶信號分量;被耦合到分析濾波器庫的量化器,通過對在第一數(shù)值區(qū)間內(nèi)的子頻帶信號分量數(shù)值使用第一量化精度且對在第二數(shù)值區(qū)間內(nèi)的子頻帶信號分量數(shù)值使用第二量化精度量化一個或多個子頻帶信號的子頻帶信號分量,產(chǎn)生一個或多個量化子頻帶信號,其中第一量化精度低于第二量化精度,第一區(qū)間是與第二區(qū)間相鄰的,以及在第一區(qū)間內(nèi)的數(shù)值小于在第二區(qū)間內(nèi)的數(shù)值;被耦合到量化器的編碼器,通過使用減小量化的子頻帶信號的信息容量要求的無損編碼過程編碼該一個或多個量化的子頻帶信號而生成一個或多個編碼的子頻帶信號;以及被耦合到編碼器的格式化器,把該一個或多個編碼的子頻帶信號裝配成輸出信號。
2.權利要求1的音頻編碼發(fā)送器,其中分析濾波器庫通過一個或多個變換實施,以及子頻帶信號分量是變換系數(shù)。
3.權利要求1或2的音頻編碼發(fā)送器,其中量化器包括擴展器,具有被耦合到分析濾波器庫的輸入端和具有輸出端;以及均勻量化器,具有被耦合到擴展器輸出端的輸入端和具有被耦合到編碼器的輸出端。
4.權利要求1到3的任一項的音頻編碼發(fā)送器,其中該量化器是非均勻量化器。
5.權利要求1到4的任一項的音頻編碼發(fā)送器,其中量化器對在第三數(shù)值區(qū)間內(nèi)的子頻帶信號分量,使用第三量化精度,第三量化精度低于第二量化精度,以及在第二區(qū)間內(nèi)的數(shù)值小于在第三區(qū)間內(nèi)的數(shù)值。
6.權利要求1到5的任一項的音頻編碼發(fā)送器,其中編碼器生成可變長度代碼以及編碼過程適合于被編碼的量化的子頻帶信號的統(tǒng)計值。
7.權利要求1到6的任一項的音頻編碼發(fā)送器,其中編碼過程是算術編碼。
8.權利要求1到7的任一項的音頻編碼發(fā)送器,該音頻編碼發(fā)送器響應子頻帶信號分量數(shù)值的特性相對于第二量化精度調(diào)整第一量化精度。
9.一種音頻譯碼接收機,它接收輸送音頻信號的編碼的表示的輸入信號和生成表示音頻信號的輸出信號,音頻譯碼接收機包括去格式化器,從輸入信號得出一個或多個編碼的子頻帶信號;被耦合到去格式化器的譯碼器,通過使用增加編碼的子頻帶信號的信息容量要求的無損譯碼過程譯碼一個或多個編碼的子頻帶信號而生成一個或多個譯碼的子頻帶信號,其中每個譯碼的子頻帶信號包括一個或多個子頻帶信號分量和表示音頻信號的各個頻率子頻帶;被耦合到譯碼器的去量化器,通過去量化一個或多個譯碼的子頻帶信號的子頻帶信號分量而生成一個或多個去量化的子頻帶信號,其中去量化器是與對在第一數(shù)值區(qū)間內(nèi)的數(shù)值使用第一量化精度和對在第二數(shù)值區(qū)間內(nèi)的數(shù)值使用第二量化精度的量化器互補的,其中第一量化精度低于第二量化精度,第一區(qū)間是與第二區(qū)間相鄰的,以及在第一區(qū)間內(nèi)的數(shù)值小于在第二區(qū)間內(nèi)的數(shù)值;以及被耦合到去量化器的合成濾波器庫,響應包括一個或多個去量化的子頻帶信號的多個子頻帶信號生成輸出信號。
10.權利要求9的音頻譯碼接收機,其中合成濾波器庫通過一個或多個變換被實施,以及子頻帶信號分量是變換系數(shù)。
11.權利要求9或10的音頻譯碼接收機,其中去量化器包括均勻去量化器,具有被耦合到譯碼器的輸入端和具有輸出端;以及壓縮器,具有被耦合到均勻去量化器輸出端的輸入端和具有被耦合到合成濾波器庫的輸出端。
12.權利要求9到11的任一項的音頻譯碼接收機,其中去量化器是非均勻去量化器。
13.權利要求9到12的任一項的音頻譯碼接收機,其中去量化器是與對在第三數(shù)值區(qū)間內(nèi)的子頻帶信號分量數(shù)值使用第三量化精度的量化器互補的,第三量化精度低于第二量化精度,以及在第二區(qū)間內(nèi)的數(shù)值小于在第三區(qū)間內(nèi)的數(shù)值。
14.權利要求9到13的任一項的音頻譯碼接收機,其中譯碼器譯碼可變長度代碼以及譯碼過程適合于被譯碼的量化的子頻帶信號的統(tǒng)計值。
15.權利要求9到14的任一項的音頻譯碼接收機,其中譯碼過程是算術譯碼。
16.權利要求9到15的任一項的音頻譯碼接收機,其響應從輸入信號得到的控制信息調(diào)整去量化器,其中去量化器適合于與相對于第二量化精度調(diào)整第一量化精度的量化器互補。
17.一種設備可讀的和輸送可由設備執(zhí)行以執(zhí)行音頻編碼方法的指令的程序的媒體,該音頻編碼方法包括執(zhí)行以下行動的步驟把分析濾波器庫施加到輸入信號,生成表示音頻信號的頻率子頻帶的多個子頻帶信號,其中每個子頻帶信號包括一個或多個子頻帶信號分量;通過對在第一數(shù)值區(qū)間內(nèi)的子頻帶信號分量數(shù)值使用第一量化精度和對在第二數(shù)值區(qū)間內(nèi)的子頻帶信號分量數(shù)值使用第二量化精度量化一個或多個子頻帶信號的子頻帶信號分量,以生成一個或多個量化的子頻帶信號,其中第一量化精度低于第二量化精度,第一區(qū)間是與第二區(qū)間相鄰的,以及在第一區(qū)間內(nèi)的數(shù)值小于在第二區(qū)間內(nèi)的數(shù)值;通過使用減小量化的子頻帶信號的信息容量要求的無損編碼過程編碼該一個或多個量化的子頻帶信號,生成一個或多個編碼的子頻帶信號;以及把該一個或多個編碼的子頻帶信號裝配成輸出信號。
18.權利要求17的媒體,其中分析濾波器庫通過一個或多個變換被實施,以及子頻帶信號分量是變換系數(shù)。
19.權利要求17或18的媒體,其中量化包括擴展子頻帶信號分量以及用均勻量化函數(shù)量化擴展的子頻帶信號分量。
20.權利要求17到19的任一項的媒體,其中量化按照非均勻量化函數(shù)。
21.權利要求17到20的任一項的媒體,其中量化對在第三數(shù)值區(qū)間內(nèi)的子頻帶信號分量使用第三量化精度,第三量化精度低于第二量化精度,以及在第二區(qū)間內(nèi)的數(shù)值小于在第三區(qū)間內(nèi)的數(shù)值。
22.權利要求17到21的任一項的媒體,其中編碼生成可變長度代碼以及編碼過程適合于被編碼的量化的子頻帶信號的統(tǒng)計值。
23.權利要求17到22的任一項的媒體,其中編碼過程是算術編碼。
24.權利要求17到23的任一項的媒體,其中該方法響應子頻帶信號分量數(shù)值的特性相對于第二量化精度調(diào)整第一量化精度。
25.一種設備可讀的和輸送可由設備執(zhí)行以執(zhí)行音頻譯碼方法的指令的程序的媒體,該音頻譯碼方法包括執(zhí)行以下行動的步驟從輸入信號得出一個或多個編碼的子頻帶信號;通過使用增加編碼的子頻帶信號的信息容量要求的無損譯碼過程譯碼一個或多個編碼的子頻帶信號,生成一個或多個譯碼的子頻帶信號,其中每個譯碼的子頻帶信號包括一個或多個子頻帶信號分量和表示音頻信號的各個頻率子頻帶;去量化一個或多個譯碼的子頻帶信號的子頻帶信號分量,以生成一個或多個去量化的子頻帶信號,其中去量化是與對在第一數(shù)值區(qū)間內(nèi)的數(shù)值使用第一量化精度和對在第二數(shù)值區(qū)間內(nèi)的數(shù)值使用第二量化精度的量化互補的,其中第一量化精度低于第二量化精度,第一區(qū)間是與第二區(qū)間相鄰的,以及在第一區(qū)間內(nèi)的數(shù)值小于在第二區(qū)間內(nèi)的數(shù)值;以及把合成濾波器庫施加到包括一個或多個去量化的子頻帶信號的多個子頻帶信號,以生成輸出信號。
26.權利要求25的媒體,其中合成濾波器庫通過一個或多個變換被實施,以及子頻帶信號分量是變換系數(shù)。
27.權利要求25或26的媒體,其中去量化包括均勻去量化和壓縮子頻帶信號分量。
28.權利要求25到27的任一項的媒體,其中去量化按照非均勻去量化函數(shù)。
29.權利要求25到28的任一項的媒體,其中去量化是與對在第三數(shù)值區(qū)間內(nèi)的子頻帶信號分量數(shù)值使用第三量化精度的量化互補的,第三量化精度低于第二量化精度,以及在第二區(qū)間內(nèi)的數(shù)值小于在第三區(qū)間內(nèi)的數(shù)值。
30.權利要求25到29的任一項的媒體,其中譯碼過程適合于被譯碼的量化的子頻帶信號的統(tǒng)計值。
31.權利要求25到30的任一項的媒體,其中譯碼過程是算術譯碼。
32.權利要求25到31的任一項的媒體,其中該方法響應從輸入信號得到的控制信息調(diào)整去量化,其中去量化適合于與相對于第二量化精度調(diào)整第一量化精度的量化互補。
33.一種音頻編碼發(fā)送器,接收表示音頻信號的輸入信號和生成輸送音頻信號的編碼的表示的輸出信號,音頻編碼發(fā)送器包括分析濾波器庫,響應輸入信號生成表示音頻信號的頻率子頻帶的多個子頻帶信號,其中每個子頻帶信號包括一個或多個子頻帶信號分量;被耦合到分析濾波器庫的量化器,量化一個或多個子頻帶信號,生成量化的子頻帶信號,其中對于具有一個或多個第一子頻帶信號分量和其幅度小于一個或多個第一子頻帶信號分量的一個或多個第二子頻帶信號分量的子頻帶信號,第二子頻帶信號分量被推壓到一個數(shù)值范圍,這個數(shù)值范圍被量化成比起不推壓時出現(xiàn)的量化級別更少的量化級別,由此降低量化精度和減小量化的第二子頻帶信號分量的熵;被耦合到量化器的編碼器,通過使用減小量化的子頻帶信號的信息容量要求的熵編碼過程編碼該一個或多個量化的子頻帶信號而生成一個或多個編碼的子頻帶信號;以及被耦合到編碼器的格式化器,把一個或多個編碼的子頻帶信號裝配成輸出信號。
34.權利要求33的音頻編碼發(fā)送器,其中分析濾波器庫通過一個或多個變換被實施,以及子頻帶信號分量是變換系數(shù)。
35.權利要求33或34的音頻編碼發(fā)送器,其中量化器包括擴展器,具有被耦合到分析濾波器庫的輸入端和具有輸出端;以及均勻量化器,具有被耦合到擴展器輸出端的輸入端和具有被耦合到編碼器的輸出端。
36.權利要求33到35的任一項的音頻編碼發(fā)送器,其中量化器是非均勻量化器。
37.權利要求33到36的任一項的音頻編碼發(fā)送器,其中編碼過程適合于被編碼的量化的子頻帶信號的統(tǒng)計值。
38.權利要求33到37的任一項的音頻編碼發(fā)送器,其中編碼過程是算術編碼。
39.權利要求33到38的任一項的音頻編碼發(fā)送器,它響應子頻帶信號分量數(shù)值的特性調(diào)整第二子頻帶信號分量被推壓到的數(shù)值的范圍。
40.一種音頻譯碼接收機,接收輸送音頻信號的編碼的表示的輸入信號和生成表示音頻信號的輸出信號,音頻譯碼接收機包括去格式化器,從輸入信號得出一個或多個編碼的子頻帶信號;被耦合到去格式化器的譯碼器,通過使用增加編碼的子頻帶信號的信息容量要求的熵譯碼過程譯碼一個或多個編碼的子頻帶信號而生成一個或多個譯碼的子頻帶信號,其中每個譯碼的子頻帶信號包括一個或多個子頻帶信號分量和表示音頻信號的各個頻率子頻帶;被耦合到譯碼器的去量化器,通過去量化一個或多個譯碼的子頻帶信號的子頻帶信號分量而生成一個或多個去量化的子頻帶信號,其中去量化器是與對于具有一個或多個第一子頻帶信號分量和其幅度小于一個或多個第一子頻帶信號分量的一個或多個第二子頻帶信號分量的子頻帶信號而把第二子頻帶信號分量推壓到一個數(shù)值范圍以便把它們量化成比起不推壓時出現(xiàn)的量化級別更少的量化級別從而降低量化精度和減小量化的第二子頻帶信號分量的熵的量化器互補的;以及合成濾波器庫,響應包括一個或多個去量化的子頻帶信號的多個子頻帶信號生成輸出信號。
41.權利要求40的音頻譯碼接收機,其中合成濾波器庫通過一個或多個變換被實施,以及子頻帶信號分量是變換系數(shù)。
42.權利要求40或41的音頻譯碼接收機,其中去量化器包括均勻去量化器,具有被耦合到譯碼器的輸入端和具有輸出端;以及壓縮器,具有被耦合到均勻去量化器輸出端的輸入端和具有被耦合到合成濾波器庫的輸出端。
43.權利要求40到42的任一項的音頻譯碼接收機,其中去量化器是非均勻去量化器。
44.權利要求40到43的任一項的音頻譯碼接收機,其中譯碼過程適合于被譯碼的量化的子頻帶信號的統(tǒng)計值。
45.權利要求40到44的任一項的音頻譯碼接收機,其中譯碼過程是算術譯碼。
46.權利要求40到45的任一項的音頻譯碼接收機,其響應從輸入信號得到的控制信息調(diào)整去量化器,其中去量化器適合于與響應子頻帶信號分量數(shù)值的特性調(diào)整第二子頻帶信號分量被推壓到的數(shù)值范圍的量化器互補。
47.一種設備可讀的和輸送可由設備執(zhí)行以執(zhí)行音頻編碼方法的指令的程序的媒體,該音頻編碼方法包括執(zhí)行以下行動的步驟把分析濾波器庫施加到輸入信號,生成表示音頻信號的頻率子頻帶的多個子頻帶信號,其中每個子頻帶信號包括一個或多個子頻帶信號分量;量化一個或多個子頻帶信號的子頻帶信號分量,生成量化的子頻帶信號,其中對于具有一個或多個第一子頻帶信號分量和其幅度小于一個或多個第一子頻帶信號分量的一個或多個第二子頻帶信號分量的子頻帶信號,第二子頻帶信號分量被推壓到一個數(shù)值范圍,該數(shù)值范圍被量化成比起不推壓時出現(xiàn)的量化級別更少的量化級別,由此降低量化精度和減小量化的第二子頻帶信號分量的熵;通過使用減小量化的子頻帶信號的信息容量要求的熵編碼過程編碼該一個或多個量化的子頻帶信號,生成一個或多個編碼的子頻帶信號;以及把該一個或多個編碼的子頻帶信號裝配成輸出信號。
48.權利要求47的媒體,其中分析濾波器庫通過一個或多個變換被實施,以及子頻帶信號分量是變換系數(shù)。
49.權利要求47或48的媒體,其中量化包括擴展子頻帶信號分量以及用均勻量化函數(shù)量化擴展的子頻帶信號分量。
50.權利要求47到49的任一項的媒體,其中量化按照非均勻量化函數(shù)。
51.權利要求47到50的任一項的媒體,其中熵編碼過程適合于被編碼的量化的子頻帶信號的統(tǒng)計值。
52.權利要求47到51的任一項的媒體,其中熵編碼過程是算術編碼。
53.權利要求47到52的任一項的媒體,其中該方法響應子頻帶信號分量數(shù)值的特性調(diào)整第二子頻帶信號分量被推壓到的數(shù)值的范圍。
54.一種設備可讀的和輸送可由設備執(zhí)行以執(zhí)行音頻譯碼方法的指令的程序的媒體,該音頻譯碼方法包括執(zhí)行以下行動的步驟從輸入信號得出一個或多個編碼的子頻帶信號;通過使用增加編碼的子頻帶信號的信息容量要求的無損譯碼過程譯碼一個或多個編碼的子頻帶信號,生成一個或多個譯碼的子頻帶信號,其中每個譯碼的子頻帶信號包括一個或多個子頻帶信號分量和表示音頻信號的各個頻率子頻帶;去量化一個或多個譯碼的子頻帶信號的子頻帶信號分量,生成一個或多個去量化的子頻帶信號,其中去量化是與對在第一數(shù)值區(qū)間內(nèi)的數(shù)值使用第一量化精度和對在第二數(shù)值區(qū)間內(nèi)的數(shù)值使用第二量化精度的量化互補的,其中第一量化精度低于第二量化精度,第一區(qū)間是與第二區(qū)間相鄰的,以及在第一區(qū)間內(nèi)的數(shù)值小于在第二區(qū)間內(nèi)的數(shù)值;以及把合成濾波器庫施加到包括一個或多個去量化的子頻帶信號的多個子頻帶信號,以生成輸出信號。
55.權利要求54的媒體,其中合成濾波器庫通過一個或多個變換被實施,以及子頻帶信號分量是變換系數(shù)。
56.權利要求54或55的媒體,其中去量化包括均勻去量化和壓縮子頻帶信號分量。
57.權利要求54到56的任一項的媒體,其中去量化按照非均勻去量化函數(shù)。
58.權利要求54到57的任一項的媒體,其中熵譯碼過程適合于被譯碼的量化的子頻帶信號的統(tǒng)計值。
59.權利要求54到58的任一項的媒體,其中熵譯碼過程是算術譯碼。
60.權利要求54到59的任一項的媒體,其中該方法響應從輸入信號得到的控制信息調(diào)整去量化,其中去量化適合于與響應子頻帶信號分量數(shù)值的特性調(diào)整第二子頻帶信號分量被推壓到的數(shù)值的范圍的量化互補。
全文摘要
從非常低的比特速率音頻編碼系統(tǒng)得到的音頻信號的感知的質(zhì)量,通過使用在發(fā)送器中的擴展量化器和算術編碼和使用在接收機中的互補的壓縮和算術譯碼而被改進。擴展量化器被使用來控制被量化到零的信號分量的數(shù)目,以及算術編碼被使用來有效地編碼被量化到零的系數(shù)。這允許更寬的帶寬的和更精確地量化的基帶信號被輸送到接收機,接收機通過合成丟失的分量再生輸出信號。
文檔編號H03M7/30GK1669072SQ03816833
公開日2005年9月14日 申請日期2003年7月8日 優(yōu)先權日2002年7月16日
發(fā)明者馬克·S.·溫登, 邁克爾·M.·杜魯門 申請人:杜比實驗室特許公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1