亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

信息信號(hào)編碼的制作方法

文檔序號(hào):2830477閱讀:388來(lái)源:國(guó)知局
專利名稱:信息信號(hào)編碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息信號(hào)編碼,如音頻或視頻編碼。
背景技術(shù)
在新的通信網(wǎng)絡(luò)以及在專業(yè)音頻制作中使用數(shù)字音頻編碼來(lái)進(jìn)行 雙向?qū)崟r(shí)通信需要非常經(jīng)濟(jì)的算法編碼以及非常短的編碼延遲。數(shù)字 音頻編碼的應(yīng)用在延遲時(shí)間意義上變得非常關(guān)鍵的一種典型情形是同 時(shí)使用直接的(即未編碼的)和己傳送的(即己編碼和解碼的)信號(hào)
的情況。因此,示例是使用無(wú)繩麥克風(fēng)和同時(shí)(在耳中(in-ear))監(jiān) 聽(tīng)的直播制作,或"分散(scattered)"制作(其中藝術(shù)家在不同的演 播室中同時(shí)演奏)。在這些應(yīng)用中,可容許的總延遲時(shí)間段小于10ms。 例如,如果使用不對(duì)稱的參與者線路進(jìn)行通信,則比特率是另外的限 制因素。
諸如MPEG-1 3 (MP3)、 MPEG-2 AAC和MPEG-2/4之類的標(biāo)準(zhǔn) 音頻編碼器的低延遲的算法延遲的范圍從20毫秒到數(shù)百毫秒,其中例 如參考了以下文獻(xiàn)M. Lutzky, G. Schuller, M. Gayer; U. Kraemer, S. Wabnik: "A guideline to audio codec delay", presented at the 116th AES Convention, Berlin, May 2004。語(yǔ)音編碼器操作于更低的比特率,并具
有更小的算法延遲,但僅提供有限的音頻質(zhì)量。
例如,文獻(xiàn)B. Edler, C. Faller and G. Schuller, "Perceptual Audio Coding Using a Time-Varying Linear Pre- and Postfilter", presented at 109th AES Convention, Los Angeles, S印tember 2000描述了一種編碼方 案,該編碼方案縮小了上述一方面的標(biāo)準(zhǔn)音頻編碼器而另一方面的語(yǔ) 音編碼器之間的差異,根據(jù)這一方案,在編碼器側(cè),使用掩蔽閾值的 倒數(shù)對(duì)要編碼的信號(hào)進(jìn)行濾波,隨后對(duì)其進(jìn)行量化以執(zhí)行不相關(guān)性減少,將量化信號(hào)提供給熵編碼以執(zhí)行與不相關(guān)性減少分離的冗余減少, 在解碼器側(cè),對(duì)經(jīng)量化和預(yù)濾波的信號(hào)進(jìn)行重構(gòu),并在后濾波器中使 用標(biāo)記閾值作為傳輸函數(shù)地對(duì)其進(jìn)行濾波。這樣的編碼方案(以下稱
為ULD編碼方案)產(chǎn)生了可以與標(biāo)準(zhǔn)音頻編碼器(如MP3)相比的 感知質(zhì)量,其比特率約為每信道80kbit/s及更高。例如,WO 2005/078703 Al中也描述了一種這樣的編碼器。
具體地,其中所描述的ULD編碼器使用了心理聲學(xué)控制的線性 濾波器來(lái)形成量化噪聲。由于其結(jié)構(gòu),該量化噪聲總是在給定的閾值 之上,即便在給定頻域內(nèi)沒(méi)有信號(hào)時(shí)也是如此。只要噪聲與心理聲學(xué) 掩蔽閾值相對(duì)應(yīng),則該噪聲就保持為不可聽(tīng)見(jiàn)。為了獲得甚至比該閾 值所預(yù)定的比特率更小的比特率,必須增大量化噪聲,這將使噪聲變 得可聽(tīng)見(jiàn)。具體地,可以在沒(méi)有信號(hào)部分的域中聽(tīng)見(jiàn)噪聲。因此,示 例是非常低或非常高的音頻。通常,在這些域中只有非常低的信號(hào)部 分,而掩蔽閾值較高。如果在整個(gè)頻域內(nèi)均勻地增大掩蔽閾值,則量 化噪聲處于該增大的閾值處(即使沒(méi)有信號(hào)),使得該量化噪聲可以被 聽(tīng)覺(jué)感知為聽(tīng)起來(lái)虛假的信號(hào)?;谧訋У木幋a器沒(méi)有這個(gè)問(wèn)題,這 是因?yàn)樵摼幋a器簡(jiǎn)單地將具有比該閾值更小信號(hào)的子帶量化為零。
在所允許的比特率下降至最低比特率(所述最低比特率不會(huì)引起 虛假量化噪聲,并由掩蔽閾值確定)以下時(shí)出現(xiàn)的上述問(wèn)題不是唯一 的問(wèn)題。此外,在上述參考文獻(xiàn)中描述的ULD編碼器為了獲得恒定 的數(shù)據(jù)速率而經(jīng)受復(fù)雜的過(guò)程,尤其是由于使用了迭代環(huán),其中,為 了每個(gè)采樣塊確定用于調(diào)整解量化步長(zhǎng)的放大因子的值,必須經(jīng)過(guò)所 述迭代環(huán)。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種信息編碼方案,能夠在低比特率和高編 碼質(zhì)量的情況下,允許ULD類型編碼器的短延時(shí)。
該目的是通過(guò)根據(jù)權(quán)利要求1或24所述的設(shè)備、根據(jù)權(quán)利要求 44或45所述的方法以及根據(jù)權(quán)利要求47所述的編碼器和根據(jù)權(quán)利要 求48所述的解碼器來(lái)實(shí)現(xiàn)的。本發(fā)明的中心思想是以下發(fā)現(xiàn),即通過(guò)不直接對(duì)預(yù)濾波信號(hào)進(jìn)行 量化,而是對(duì)由預(yù)濾波信號(hào)的前向自適應(yīng)預(yù)測(cè)而獲得的預(yù)測(cè)誤差進(jìn)行 量化,可以實(shí)現(xiàn)超過(guò)由掩蔽閾值所確定的度量的極粗略的量化,而不 會(huì)帶來(lái)質(zhì)量損失或僅帶來(lái)非常小的質(zhì)量損失。由于前向自適應(yīng),量化 誤差對(duì)預(yù)測(cè)系數(shù)沒(méi)有負(fù)面影響。
根據(jù)另一個(gè)實(shí)施例,以非線性方式對(duì)預(yù)濾波信號(hào)進(jìn)行平滑量化或 平滑限幅,即通過(guò)量化函數(shù)來(lái)進(jìn)行量化,所述量化函數(shù)將預(yù)測(cè)誤差的
未量化值映射到量化階的量化索引上,所述量化函數(shù)的過(guò)程在閾值之 下比在閾值之上更陡。因此,由于較低的可用比特率,相對(duì)于掩蔽閾
值而增大的噪聲PSD調(diào)整為信號(hào)PSD,使得在沒(méi)有信號(hào)部分的頻譜部 分中不出現(xiàn)違反掩蔽閾值的情況,盡管可用比特率降低,但這分別進(jìn) 一步提高了收聽(tīng)質(zhì)量或維持了收聽(tīng)質(zhì)量。
根據(jù)本發(fā)明的另一個(gè)實(shí)施例,量化是分別通過(guò)限幅(即分別通過(guò) 量化至數(shù)目有限且固定的量化等級(jí)或量化階)來(lái)進(jìn)行的平滑量化或平 滑限幅。通過(guò)前向自適應(yīng)預(yù)測(cè)來(lái)預(yù)測(cè)預(yù)濾波信號(hào),粗略的量化對(duì)預(yù)測(cè) 系數(shù)本身沒(méi)有負(fù)面影響。通過(guò)量化至固定數(shù)目的量化等級(jí),固有地避 免了用于獲得恒定比特率的迭代。
根據(jù)本發(fā)明的另一個(gè)實(shí)施例,以后向自適應(yīng)的方式,根據(jù)先前通 過(guò)量化所獲得的量化等級(jí)索引來(lái)分別確定固定數(shù)目的量化等級(jí)之間的 量化步長(zhǎng)或階高。因此, 一方面,盡管量化等級(jí)的數(shù)目非常小,但是 可以分別獲得預(yù)測(cè)誤差或殘差信號(hào)的更好的或至少盡可能最好的量 化,而無(wú)須向解碼器側(cè)提供進(jìn)一步的輔助信息。另一方面,可以確保 在向解碼器側(cè)傳輸量化后的殘差信號(hào)的過(guò)程中的傳輸誤差對(duì)于具有適 當(dāng)?shù)暮笙蜃赃m應(yīng)步長(zhǎng)調(diào)整配置的解碼器側(cè)而言僅具有短時(shí)效應(yīng)。


下面將參考附圖討論本發(fā)明的優(yōu)選實(shí)施例。附圖示出了
圖1是根據(jù)本發(fā)明的實(shí)施例的編碼器的框圖; 圖2a/b分別示例性地示出了如下圖在根據(jù)權(quán)利要求1所述的編 碼器的情況下,與掩蔽閾值和信號(hào)功率譜密度相關(guān)的噪聲頻譜的過(guò)程(圖a),或者在具有對(duì)預(yù)濾波信號(hào)的后向自適應(yīng)預(yù)測(cè)和迭代以及掩蔽 閾值逐塊量化步長(zhǎng)調(diào)整的情況下,與掩蔽閾值和信號(hào)功率譜密度相關(guān)
的噪聲頻譜的過(guò)程(圖b);
圖3a/3b和3c分別示例性地示出如下圖在如圖1所示的編碼器 中執(zhí)行預(yù)濾波信號(hào)的前向自適應(yīng)預(yù)測(cè)以及迭代量化步長(zhǎng)調(diào)整的情況 下,分別對(duì)于不同的限幅范圍或不同數(shù)目的量化等級(jí)的、與噪聲或誤 差功率譜密度相關(guān)的信號(hào)功率譜密度;
圖4是根據(jù)本發(fā)明的實(shí)施例的圖1的編碼器中的系數(shù)編碼器的結(jié) 構(gòu)的框圖5是根據(jù)本發(fā)明的實(shí)施例的用于對(duì)圖1中的編碼器所編碼的信 息信號(hào)進(jìn)行解碼的解碼器的框圖6是根據(jù)本發(fā)明的實(shí)施例的圖1的編碼器或圖5的解碼器中的 系數(shù)編碼器的結(jié)構(gòu)的框圖7是用于例證收聽(tīng)測(cè)試結(jié)果的圖;以及
圖8a至8c是可以分別用于圖1、 4、 5和6中的量化和量化/限幅 裝置中的示例性量化函數(shù)的圖。
具體實(shí)施例方式
在參照附圖更詳細(xì)地討論本發(fā)明的實(shí)施例之前,首先,為了更好 地理解這些實(shí)施例的優(yōu)點(diǎn)和原理,將討論ULD類型的編碼方案的可能 實(shí)現(xiàn)作為比較示例,基于該比較示例,可以更清晰地說(shuō)明最終導(dǎo)致后 續(xù)實(shí)施例的這些實(shí)施例的潛在的實(shí)質(zhì)性優(yōu)點(diǎn)和考慮。
如在本說(shuō)明書的介紹部分已經(jīng)描述的,需要更低比特率(例如 64kbit/s)的、具有可比感知質(zhì)量的ULD版本,以及用于獲得恒定比特 率(尤其是用于獲得所需的更低比特率)的較簡(jiǎn)單的方案。此外,傳 輸誤差之后的恢復(fù)時(shí)間保持為較低或保持在最小值將是有利的。
為了減少經(jīng)心理聲學(xué)預(yù)處理后的信號(hào)的冗余,比較ULD編碼器使 用了一種逐樣本的后向自適應(yīng)閉環(huán)預(yù)測(cè)。這意味著,對(duì)編碼器和解碼 器中的預(yù)測(cè)系數(shù)的計(jì)算僅僅基于過(guò)去的或已經(jīng)量化和重構(gòu)的信號(hào)樣 本。為了分別獲得對(duì)信號(hào)或預(yù)濾波信號(hào)的適配,針對(duì)每個(gè)樣本再次計(jì)算新的預(yù)測(cè)器系數(shù)集合。這產(chǎn)生了以下優(yōu)點(diǎn)由于不需要將預(yù)測(cè)器系 數(shù)從編碼器側(cè)傳送到解碼器側(cè),因此可以使用較長(zhǎng)的預(yù)測(cè)器或預(yù)測(cè)值 確定公式,即具體為可以使用較大數(shù)目的預(yù)測(cè)器系數(shù)。另一方面,這 意味著必須在不損失精確度的情況下將量化后的預(yù)測(cè)誤差傳送至解碼 器,以獲得與編碼過(guò)程中潛在的預(yù)測(cè)系數(shù)完全相同的預(yù)測(cè)系數(shù)。否則, 編解碼和解碼器中的預(yù)測(cè)的值彼此分別不同,這將導(dǎo)致不穩(wěn)定的編碼 過(guò)程。更合理地,在比較ULD編碼器中,需要在編碼器和解碼器側(cè)周 期性地復(fù)位預(yù)測(cè)器,以便能夠選擇性地訪問(wèn)編碼比特流以及阻止傳輸 誤差的傳播。然而,周期性復(fù)位導(dǎo)致了比特率達(dá)到峰值,這對(duì)比特率 可變的信道不是問(wèn)題,但對(duì)于比特率固定的信道而言,該比特率峰值 限制了恒定比特率調(diào)整的下限。
從隨后利用本發(fā)明的實(shí)施例對(duì)ULD比較編碼方案的更詳細(xì)描述
中可以得出,這些實(shí)施例與比較編碼方案的差別在于使用具有后向 自適應(yīng)量化步長(zhǎng)調(diào)整的逐塊前向自適應(yīng)預(yù)測(cè),來(lái)代替逐樣本的后向自 適應(yīng)預(yù)測(cè)。另一方面,其缺點(diǎn)在于為了限制用于向編碼器側(cè)傳送所 需預(yù)測(cè)系數(shù)的所需輔助信息量,預(yù)測(cè)器應(yīng)該更短,這還可能導(dǎo)致編碼 器效率降低,但是,另一方面,其優(yōu)點(diǎn)在于,隨后的實(shí)施例的過(guò)程對(duì) 更高的量化誤差(這是比特率減小的結(jié)果)仍能夠有效工作,因此解 碼器側(cè)的預(yù)測(cè)器可以用于對(duì)噪聲形狀進(jìn)行量化。
從隨后的比較也可以得出,與比較ULD編碼器相比,通過(guò)在傳輸 之前限制預(yù)測(cè)余數(shù)值的范圍來(lái)限制比特率。與比較ULD編碼方案相 比,這導(dǎo)致了修正的噪聲形狀,也導(dǎo)致了不同且更少的虛假的收聽(tīng)人 工效應(yīng)。此外,在不使用迭代環(huán)的情況下產(chǎn)生恒定比特率。此外,由 于逐塊的前向適配,對(duì)于每個(gè)樣本塊,固有地包括了 "復(fù)位"。此外, 在以下描述的實(shí)施例中,針對(duì)預(yù)濾波器系數(shù)和前向預(yù)測(cè)系數(shù)使用了一 種編碼方案,該方案對(duì)系數(shù)的LSF (線譜頻率)表示,使用了具有后 向自適應(yīng)量化步長(zhǎng)控制的不同編碼。如以下要描述的,該方案提供了 對(duì)系數(shù)的逐塊訪問(wèn),產(chǎn)生了恒定的輔助信息比特率,并在該比特率上 對(duì)傳輸誤差具有魯棒性。
下面,將更詳細(xì)地描述比較ULD編碼器和解碼器的結(jié)構(gòu),接著描述本發(fā)明的實(shí)施例并例證其在從較高恒定比特率傳輸至較低比特率方 面的優(yōu)點(diǎn)。
在比較ULD編碼方案中,在編碼器側(cè),分別通過(guò)感知模型或收聽(tīng) 模型來(lái)對(duì)編碼器的輸入信號(hào)迸行分析,以獲得關(guān)于信號(hào)中在感知上無(wú) 關(guān)的部分的信息。該信息用于通過(guò)時(shí)變?yōu)V波器系數(shù)來(lái)控制預(yù)濾波器。
從而,預(yù)濾波器將輸入信號(hào)相對(duì)于其掩蔽閾值進(jìn)行歸一化。每128樣本 的塊計(jì)算一次濾波器系數(shù),對(duì)其進(jìn)行量化,并將其傳送至編碼器側(cè)作 為輔助信息。
在通過(guò)減去后向自適應(yīng)預(yù)測(cè)信號(hào)來(lái)將預(yù)濾波信號(hào)與放大因子相 乘之后,通過(guò)均勻(uniform)量化器(即具有均勻步長(zhǎng)的量化器)對(duì) 預(yù)測(cè)誤差進(jìn)行量化。如上所述,通過(guò)逐樣本后向閉環(huán)預(yù)測(cè)來(lái)獲得該預(yù) 測(cè)信號(hào)。相應(yīng)地,不需要向解碼器傳送預(yù)測(cè)系數(shù)。隨后,對(duì)量化的預(yù) 測(cè)殘差信號(hào)進(jìn)行熵編碼。為了獲得恒定比特率,提供了一種環(huán),該環(huán) 對(duì)每個(gè)預(yù)濾波樣本塊重復(fù)數(shù)次相乘、預(yù)測(cè)、量化和熵編碼的步驟。在 迭代之后,確定預(yù)定放大值集合中仍滿足恒定比特率條件的最高放大 因子。將該放大值傳送至解碼器。然而,如果確定了小于l的放大值, 則在解碼后量化噪聲是可感知的,即其頻譜被整形為與掩蔽閾值類似, 但其總功率高于預(yù)測(cè)模型所預(yù)定的功率。對(duì)于輸入信號(hào)頻譜的部分,
量化噪聲甚至可能高于輸入信號(hào)頻譜本身,由于預(yù)測(cè)編碼器的使用, 這還在該頻譜部分中產(chǎn)生了可聽(tīng)見(jiàn)的人工效應(yīng),否則在該頻譜部分中 不會(huì)出現(xiàn)可聽(tīng)見(jiàn)的信號(hào)。在考慮更低的恒定比特率時(shí),量化噪聲所導(dǎo) 致的效應(yīng)表示了一種限制因素。
繼續(xù)描述該比較ULD方案,僅將預(yù)濾波系數(shù)作為幀內(nèi)LSF差來(lái)傳
送,而且僅當(dāng)其超過(guò)特定限制時(shí)才進(jìn)行傳送。為了避免非受限的時(shí)間 段的傳輸誤差傳播,時(shí)常對(duì)該系統(tǒng)進(jìn)行復(fù)位??梢允褂闷渌夹g(shù)來(lái)對(duì) 傳輸誤差情況下解碼信號(hào)感知的下降進(jìn)行最小化。該傳輸方案產(chǎn)生了 可變的輔助信息比特率,在上述環(huán)中通過(guò)調(diào)整上述放大因子相應(yīng)地調(diào) 節(jié)(level)該比特率。
在比較ULD編碼器的情況下,量化預(yù)測(cè)殘差信號(hào)的熵編碼包括諸 如Golomb、 Huffman或算術(shù)編碼方法之類的方法。必須時(shí)常對(duì)該熵編碼迸行復(fù)位,并且該熵編碼固有地產(chǎn)生可變比特率,該可變比特率仍 由上述環(huán)來(lái)調(diào)節(jié)的可變比特率。
在比較ULD編碼方案的情況下,根據(jù)熵編碼獲得解碼器中的量化 預(yù)測(cè)殘差信號(hào),在其上加入預(yù)測(cè)余數(shù)和預(yù)測(cè)信號(hào),將和與所傳送的放 大因子的倒數(shù)相乘,由此,通過(guò)其頻率響應(yīng)為一個(gè)預(yù)濾波器的倒數(shù)的 后濾波器來(lái)產(chǎn)生重構(gòu)的輸出信號(hào),其中,該后濾波器使用傳送的預(yù)濾 波器系數(shù)。
例如,在32kHz至48kHz的釆樣頻率上,剛剛描述的類型的比較 ULD編碼器獲得5.33至8ms的總編碼器/解碼器延遲。在沒(méi)有(虛假環(huán)) 迭代的情況下,該ULD編碼器產(chǎn)生80至96kbit/s范圍內(nèi)的比特率。如上 所述,在較低恒定比特率上,由于噪聲頻譜更為均勻,該編碼器中的 收聽(tīng)質(zhì)量下降。此外,由于迭代,獲得均勻比特率的代價(jià)較高。以下 描述的實(shí)施例克服或最小化了這些缺點(diǎn)。在恒定傳輸數(shù)據(jù)速率上,以 下描述的實(shí)施例的編碼方案在不需要任何迭代的情況下使得量化誤差 的噪聲形狀改變。更準(zhǔn)確地,在上述比較ULD編碼方案中,在迭代過(guò) 程中具有恒定傳輸數(shù)據(jù)速率的情況下,確定了乘數(shù),在該乘數(shù)的幫助 下,在量化之前對(duì)來(lái)自預(yù)濾波器的信號(hào)進(jìn)行相乘,其中量化噪聲在頻 譜上是白的,這導(dǎo)致解碼器中的量化噪聲被成形為類似于收聽(tīng)閨值, 但根據(jù)所選擇的乘數(shù),該量化噪聲略低于或略高于該收聽(tīng)閾值,如上 所述,該乘數(shù)也可以被理解為是對(duì)預(yù)定的收聽(tīng)閾值的一種移位。與之 相關(guān)的是,在解碼之后產(chǎn)生量化噪聲,其功率在各頻域內(nèi)甚至可以超 過(guò)各頻域內(nèi)的輸入信號(hào)的功率??梢郧逦芈?tīng)見(jiàn)所產(chǎn)生的編碼人工效 應(yīng)。以下描述的實(shí)施例對(duì)量化噪聲進(jìn)行整形,以使得其功率譜密度在 頻譜上不再是白的。更合理地,對(duì)預(yù)濾波器信號(hào)的粗略量化/限制或限 幅將產(chǎn)生的量化噪聲分別整形為類似于預(yù)濾波器信號(hào)的功率譜密度。 從而,對(duì)解碼器中的量化噪聲進(jìn)行整形,以使其保持在輸入信號(hào)的功 率譜密度以下。這可以被理解為是所確定的收聽(tīng)閾值的變形 (deformation)。與比較ULD編碼方案相比,這樣產(chǎn)生的編碼人工效應(yīng) 不那么虛假。此外,隨后的實(shí)施例不需要迭代過(guò)程,從而降低了復(fù)雜 度。由于通過(guò)描述上述比較ULD編碼方案已經(jīng)提供了充分的基礎(chǔ),從
而將注意力轉(zhuǎn)到以下實(shí)施例中潛在的優(yōu)點(diǎn)和考慮,以用于描述這些實(shí) 施例,首先,下面將描述根據(jù)本發(fā)明的實(shí)施例的編碼器的結(jié)構(gòu)。
總體上由10表示的圖1中的編碼器包括用于要編碼的信息信號(hào)的 輸入12,以及用于已編碼信息信號(hào)的輸出14,其中,以下示例性地假 定該信號(hào)是音頻信號(hào),尤其示例性地假設(shè)該信號(hào)是已采樣的音頻信號(hào), 但是也可以在輸入12之后的編碼器中進(jìn)行采樣。在圖1中,x(n)表示輸
入的輸出信號(hào)的樣本。
如圖1所示,可以將編碼器10劃分為掩蔽閾值確定裝置16、預(yù)濾 波裝置18、前向預(yù)測(cè)預(yù)測(cè)裝置20和量化/限幅裝置22以及比特流產(chǎn)生裝 置24。掩蔽閾值確定裝置16分別根據(jù)感知模型或收聽(tīng)模型來(lái)操作,使 用感知模型分別確定從輸入12處輸入的音頻信號(hào)的掩蔽或收聽(tīng)閾值的 表示,該表示指示了與可感知性或可聽(tīng)見(jiàn)性分別無(wú)關(guān)的音頻信號(hào)部分, 或表示了頻率的頻譜閾值,在該頻率上,頻譜能量分別由于心理聲學(xué) 的遮蔽效應(yīng)而保持不可聽(tīng)見(jiàn),或不被人所感知。如以下將要描述的, 確定裝置16以逐塊的方式來(lái)確定掩蔽閾值,即該裝置針對(duì)音頻信號(hào)的 后續(xù)樣本塊中的每一塊確定掩蔽閾值。也可以進(jìn)行其他過(guò)程。與隨后 的描述(尤其是關(guān)于圖4的描述)相反,從確定裝置16產(chǎn)生的掩蔽閾值
的表示也可以是頻譜掩蔽閾值的頻譜樣本的表示。
預(yù)濾波或預(yù)估計(jì)裝置18與掩蔽閾值確定裝置16和輸入12相耦合,
并對(duì)輸出信號(hào)進(jìn)行濾波,以將其相對(duì)于掩蔽閾值進(jìn)行歸一化,以獲得 預(yù)濾波信號(hào)f(n)。例如,預(yù)濾波裝置18基于線性濾波器,并被實(shí)現(xiàn)為 根據(jù)掩蔽閾值確定裝置16所提供的掩蔽閾值的表示來(lái)調(diào)整濾波器系 數(shù),以使得該線性濾波器的傳輸函數(shù)實(shí)質(zhì)上與掩蔽閾值的倒數(shù)相對(duì)應(yīng)。 可以逐塊地、每半塊地(例如在以下描述的在掩蔽閾值確定中塊一半 重疊的情況下)、或逐樣本地執(zhí)行濾波器系數(shù)的調(diào)整,例如通過(guò)對(duì)由逐 塊確定的掩蔽閾值表示所獲得的濾波器系數(shù)進(jìn)行內(nèi)插、或者通過(guò)對(duì)跨 過(guò)塊間隔而獲得的濾波器系數(shù)進(jìn)行內(nèi)插來(lái)執(zhí)行。
前向預(yù)測(cè)裝置20與預(yù)濾波裝置18相耦合,用于對(duì)預(yù)濾波信號(hào)的樣 本f(n)(通過(guò)使用心理聲學(xué)掩蔽閾值在時(shí)域中對(duì)其進(jìn)行了自適應(yīng)濾波)進(jìn)行前向自適應(yīng)預(yù)測(cè),以獲得預(yù)測(cè)信號(hào)六")、表示與預(yù)濾波信號(hào)f(n) 的預(yù)測(cè)誤差的殘差信號(hào)r(n)以及預(yù)測(cè)濾波器系數(shù)的表示,基于此可以 重構(gòu)預(yù)測(cè)信號(hào)。具體地,前向自適應(yīng)預(yù)測(cè)裝置20被實(shí)現(xiàn)為直接根據(jù)預(yù) 濾波信號(hào)f來(lái)確定預(yù)測(cè)濾波器系數(shù)的表示,而不僅僅基于殘差信號(hào)r的 后續(xù)量化。如以下將參照?qǐng)D4更詳細(xì)地討論的,盡管在LFS域中(尤其 采取LFS預(yù)測(cè)殘差的形式)表示預(yù)測(cè)濾波器系數(shù),但是,其他表示也 是可能的,例如線性濾波器系數(shù)整形中的中間表示。此外,根據(jù)隨后 的描述,裝置20示例性地逐塊(即對(duì)預(yù)濾波信號(hào)的樣本f(n)中的后續(xù) 塊中的每一塊)執(zhí)行預(yù)測(cè)濾波器系數(shù)的確定,然而,其中其他過(guò)程也 是可能的。然后,裝置20被實(shí)現(xiàn)為通過(guò)所確定的這些預(yù)測(cè)濾波器系數(shù) 來(lái)確定預(yù)測(cè)信號(hào)/,并將其從預(yù)濾波信號(hào)f中減去,其中,例如通過(guò)線
性濾波器來(lái)執(zhí)行該預(yù)測(cè)信號(hào)的確定,其中根據(jù)前向自適應(yīng)確定的預(yù)測(cè) 系數(shù)表示來(lái)調(diào)整該線性濾波器的濾波器系數(shù)。如以下將要更詳細(xì)地描 述的,解碼器側(cè)提供的與先前輸出的濾波器輸出信號(hào)值相加的殘差信 號(hào)(即經(jīng)量化和限幅的殘差信號(hào)Un))可以作為濾波器輸出信號(hào)。
量化/限幅裝置22與預(yù)測(cè)裝置20相耦合,用于通過(guò)量化函數(shù)對(duì)殘差 信號(hào)分別進(jìn)行量化和限幅,該量化函數(shù)將殘差信號(hào)的值r(n)映射到數(shù) 目恒定且有限的量化等級(jí),以及用于向前向自適應(yīng)預(yù)測(cè)裝置20傳送以 這種方式在量化索引的整形中獲得的如上所述的量化殘差信號(hào)ie(n)。
量化殘差信號(hào)ic(n)、裝置20所確定的預(yù)測(cè)系數(shù)的表示、以及由裝 置16確定的掩蔽閾值的表示構(gòu)成了通過(guò)編碼信號(hào)14向解碼器側(cè)提供的 信息,其中,因此在圖1中示例性提供了比特流產(chǎn)生裝置24,用于根據(jù) 串行比特流或分組傳輸,可能地通過(guò)使用其他無(wú)損編碼方式來(lái)組合該 信息。
在對(duì)圖l中的編碼器的更詳細(xì)的結(jié)構(gòu)進(jìn)行討論之前,以下基于編 碼器10的上述結(jié)構(gòu)來(lái)描述編碼器1的操作模式。預(yù)濾波裝置18使用與掩
蔽閾值的倒數(shù)相對(duì)應(yīng)的傳輸函數(shù)來(lái)對(duì)音頻信號(hào)進(jìn)行濾波,從而產(chǎn)生預(yù) 濾波信號(hào)f(n),該信號(hào)通過(guò)均勻量化獲得了誤差的功率譜密度,該功 率譜密度主要與白噪聲相對(duì)應(yīng),并且可能導(dǎo)致在解碼器側(cè)的后濾波器 中濾波得到的噪聲功率譜與掩蔽閾值類似。然而,首先,前向自適應(yīng)預(yù)測(cè)裝置20通過(guò)從殘差信號(hào)f中減去前向自適應(yīng)的預(yù)測(cè)信號(hào)/來(lái)獲得
預(yù)測(cè)誤差r。不論在編碼器還是在解碼器側(cè),量化/限幅裝置22對(duì)該預(yù) 測(cè)誤差r進(jìn)行的后續(xù)的粗略量化對(duì)預(yù)測(cè)裝置20的預(yù)測(cè)系數(shù)沒(méi)有影響,這 是由于該預(yù)測(cè)系數(shù)的計(jì)算是以前向自適應(yīng)方式執(zhí)行的,因此是基于未 量化的值f(n)。不僅在使用粗略量化步長(zhǎng)的意義上利用粗略的方式來(lái) 執(zhí)行量化,而且在僅執(zhí)行平滑量化至數(shù)目恒定且有限的量化等級(jí)的意 義上以粗略的方式來(lái)執(zhí)行量化,因此,為了表示每個(gè)量化殘差信號(hào)ic(n) 或編碼音頻信號(hào)14中的每個(gè)量化索引,僅需要固定的比特?cái)?shù),這固有 地允許了殘差值ie(n)的恒定比特率。如以下將要描述的,主要通過(guò)量 化至固定數(shù)目的均勻間隔的量化等級(jí)來(lái)執(zhí)行量化(以下示例性地量化 至僅3個(gè)量化等級(jí)的數(shù)目),其中,例如,執(zhí)行量化以使未量化的殘差 信號(hào)值r(n)被量化至下一個(gè)量化等級(jí),以獲得該信號(hào)值的對(duì)應(yīng)量化等 級(jí)的量化索引ie(n)。因此,將未量化殘差信號(hào)r(n)的極高或極低的值分 別映射至各自最高或最低的量化等級(jí)或各自量化等級(jí)索引(即使在具 有相同步長(zhǎng)的均勻量化中它們也可以被映射到更高的量化等級(jí))。自 此,裝置22也分別對(duì)殘差信號(hào)r進(jìn)行"限幅"或限制。然而,如以下 將要描述的,后者具有以下效果,即預(yù)濾波信號(hào)的誤差PSD (PSD-功 率譜密度)不再是白噪聲,而是根據(jù)限幅的程度而近似于預(yù)濾波信號(hào) 的信號(hào)PSD。在解碼器側(cè),這具有以下效果,即甚至在比掩蔽閾值所 預(yù)定的比特率更低的比特率上,噪聲PSD也保持在信號(hào)PSD以下。
下面將更詳細(xì)地描述圖l的編碼器的結(jié)構(gòu)。具體地,掩蔽閾值確 定裝置16分別包括根據(jù)感知模型進(jìn)行操作的掩蔽閾值確定器或感知模 型26、預(yù)濾波器系數(shù)計(jì)算模塊28和系數(shù)編碼器30, 二者以命名順序連 接在輸入12與預(yù)濾波器裝置18以及比特流產(chǎn)生器24之間。預(yù)濾波器裝 置18包括系數(shù)解碼器32,其輸入與系數(shù)編碼器30的輸出相連接;以 及預(yù)濾波器34,例如,預(yù)濾波器34是自適應(yīng)線性濾波器,其數(shù)據(jù)輸入 與輸入12相連接,其數(shù)據(jù)輸出與裝置20相連接,而其用于對(duì)濾波器系 數(shù)進(jìn)行適配的適配輸入與系數(shù)解碼器32的輸出相連接。預(yù)測(cè)裝置20包 括預(yù)測(cè)系數(shù)計(jì)算模塊36、系數(shù)編碼器38、系數(shù)解碼器40、減法器42、 預(yù)測(cè)濾波器44、延遲元件46、另一加法器48和解量化器50。預(yù)測(cè)系數(shù)計(jì)算模塊46和系數(shù)編碼器38串聯(lián)在一起,其連接順序分別是在預(yù)濾器 34的輸出與系數(shù)解碼器40的輸入或比特流產(chǎn)生器24的另一個(gè)輸入之 間,并協(xié)作用于以前向自適應(yīng)方式逐塊確定預(yù)測(cè)系數(shù)的表示。系數(shù)解 碼器40連接在系數(shù)編碼器38與預(yù)測(cè)濾波器44之間,預(yù)測(cè)濾波器44是例 如線性預(yù)測(cè)濾波器。除了與系數(shù)解碼器40連接的預(yù)測(cè)系數(shù)輸入之外, 濾波器44包括數(shù)據(jù)輸入和數(shù)據(jù)輸出,該數(shù)據(jù)輸入和數(shù)據(jù)輸入將濾波器 44連接在閉環(huán)中,除了濾波器44之外,該閉環(huán)包括加法器48和延遲元 件46。具體地,延遲元件46連接在加法器48和濾波器44之間,而濾波 器44的數(shù)據(jù)輸出與加法器48的第一輸入連接。此外,濾波器44的數(shù)據(jù) 輸出也與減法器42的反相輸入連接。減法器42的非反相輸入與預(yù)濾波 器34的輸出連接,而加法器48的第二輸入與解量化器50的輸出連接。 解量化器50的數(shù)據(jù)輸入與量化/限幅裝置22連接,并與解量化器50的步 長(zhǎng)控制輸入連接。量化/限幅裝置22包括量化器模塊52和步長(zhǎng)適配塊 54,其中,量化模塊52還由具有均勻可控步長(zhǎng)的均勻量化器56和限幅 器58構(gòu)成,均勻量化器56和限幅器58以命名順序串聯(lián)在減法器42的輸 出與比特流產(chǎn)生器24的另一個(gè)輸入之間,其中,步長(zhǎng)適配塊54還包括 步長(zhǎng)適配模塊60和延遲部件62,步長(zhǎng)適配模塊60和延遲部件62以命名 順序串聯(lián)在限幅器58的輸出與量化器56的步長(zhǎng)控制輸入之間。此外, 限幅器58的輸出與解量化器50的數(shù)據(jù)輸入連接,其中,解量化器50的 步長(zhǎng)控制輸入還與步長(zhǎng)適配模塊60連接。比特流產(chǎn)生器24的輸出還形 成了編碼器10的輸出14。
在上述詳細(xì)描述了圖l的編碼器詳細(xì)結(jié)構(gòu)之后,以下描述其操作 模式。感知模型模塊26以逐塊的方式分別根據(jù)音頻信號(hào)來(lái)確定或估計(jì) 掩蔽閾值。因此,例如,感知模型模塊26使用長(zhǎng)度為256的DFT,即塊 長(zhǎng)為256個(gè)樣本的x(n),塊之間存在50%的重疊,該重疊導(dǎo)致了編碼器 10的128個(gè)樣本的音頻信號(hào)延遲。例如,以Bark帶或線性頻率縮放的頻 譜采樣的形式來(lái)表示感知模型模塊26輸出的掩蔽閾值的估計(jì)。在系數(shù) 計(jì)算模塊24中,使用感知模型模塊26逐塊輸出的掩蔽閾值來(lái)計(jì)算預(yù)定 濾波器(即濾波器34)的濾波器系數(shù)。例如,模塊28計(jì)算的系數(shù)可以 是對(duì)掩蔽閾值進(jìn)行建模的LPC系數(shù)。系數(shù)編碼器30還對(duì)每塊的預(yù)濾波器系數(shù)進(jìn)行編碼,這將參照?qǐng)D4更詳細(xì)地討論。系數(shù)解碼器34對(duì)編碼的 預(yù)濾波器系數(shù)進(jìn)行解碼,以重新獲得模塊28的預(yù)濾波器系數(shù),其中, 預(yù)濾波器34還分別獲得這些參數(shù)或預(yù)濾波器系數(shù),并使用它們,因此 預(yù)濾波器34分別關(guān)于輸入信號(hào)x(n)的掩蔽閾值來(lái)對(duì)輸入信號(hào)x(n)進(jìn)行 歸一化,或使用傳輸函數(shù)對(duì)輸入信號(hào)x(n)進(jìn)行濾波,該傳輸函數(shù)本質(zhì) 上與該掩蔽閾值的倒數(shù)相對(duì)應(yīng)。與輸入信號(hào)相比,產(chǎn)生的預(yù)濾波信號(hào) f(n)在量上明顯更小。
在預(yù)測(cè)系數(shù)計(jì)算模塊36中,以逐塊的方式來(lái)處理預(yù)濾波信號(hào)的樣 本f(n),其中,感知模型模塊26可以示例性地將逐塊劃分與音頻信號(hào) 12之一相對(duì)應(yīng),但不是必需的。對(duì)于每個(gè)預(yù)濾波樣本塊,系數(shù)計(jì)算模 塊36計(jì)算預(yù)測(cè)濾波器44所使用的預(yù)測(cè)系數(shù)。因此,例如,系數(shù)計(jì)算模 塊36執(zhí)行每個(gè)預(yù)濾波信號(hào)塊的LPC (LPO線性預(yù)測(cè)編碼)分析,以獲 得預(yù)測(cè)系數(shù)。然后,如以下將要更詳細(xì)討論的,與系數(shù)編碼器30類似, 系數(shù)編碼器38對(duì)預(yù)測(cè)系數(shù)進(jìn)行編碼,并向比特流產(chǎn)生器24 (具體是系 數(shù)解碼器40)輸出該預(yù)測(cè)系數(shù)的表示,其中,系數(shù)解碼器40使用所獲 得的預(yù)測(cè)系數(shù)表示來(lái)向線性濾波器44施加系數(shù)計(jì)算模塊36在LPC分析
中獲得的預(yù)測(cè)系數(shù),使得由濾波器44、延遲部件46和加法器48的閉環(huán) 組成的閉環(huán)預(yù)測(cè)器產(chǎn)生預(yù)測(cè)信號(hào),減法器42再次從預(yù)濾波信號(hào)f(n) 中減去六")。例如,線性濾波器44是長(zhǎng)度為N的A(z) = 2 =1%^類型
的線性預(yù)測(cè)濾波器,其中,系數(shù)解碼器40根據(jù)系數(shù)計(jì)算模塊36所計(jì)算 的預(yù)測(cè)系數(shù)來(lái)調(diào)整值ai,即用于對(duì)先前預(yù)測(cè)值六")加上解量化后的殘
差信號(hào)值進(jìn)行加權(quán)并求和以分別獲得新的或當(dāng)前的預(yù)測(cè)值/的權(quán)重。
在量化器56中,對(duì)減法器42所獲得的預(yù)測(cè)余數(shù)r(n)進(jìn)行均勻量化, 即具有均勻量化步長(zhǎng)的量化,其中,步長(zhǎng)A(n)是時(shí)變的,并由步長(zhǎng)適 配模塊以后向自適應(yīng)方式(即從量化殘差信號(hào)到先前的殘差信號(hào) r(m<n))分別計(jì)算或確定。更準(zhǔn)確地,均勻量化器56對(duì)每個(gè)殘差信號(hào) r(n)輸出量化殘差值q(n),可表示為q(n)—(n) A(n),可將其稱為具有 索引的臨時(shí)量化步長(zhǎng)。限幅器58還將臨時(shí)量化索弓U(n)限幅至量C = [-c;c],其中c是常數(shù)c e{l,2,...}。具體地,限幅器58被實(shí)現(xiàn)為將在li(n)一 c之內(nèi)的所有臨時(shí)索引值i(n)設(shè)置為-c或c (根據(jù)哪個(gè)更接近)。僅分別通過(guò)限幅或限制,限幅器58將索引序列或系列ic(n)分別輸出至比特流 產(chǎn)生器24、解量化器50和步長(zhǎng)適配塊54或延遲元件62,因?yàn)檠舆t部件 62和本實(shí)施例中的所有其他延遲部件將輸入值延遲了一個(gè)樣本。
現(xiàn)在,通過(guò)步長(zhǎng)適配塊54來(lái)實(shí)現(xiàn)后向自適應(yīng)步長(zhǎng)控制,其中,步 長(zhǎng)適配塊54使用延遲部件62所延遲的過(guò)去的索引序列值ie(n)來(lái)不斷地 適配步長(zhǎng)A(n),以將限幅器58所限制的區(qū)域(即由"允許的"量化索 引或?qū)?yīng)的量化等級(jí)分別設(shè)定的區(qū)域)設(shè)置為未量化殘差值r(n)的出 現(xiàn)統(tǒng)計(jì)概率,使得所允許的量化等級(jí)在所產(chǎn)生的限幅的量化索引序列 流ic(n)中盡可能均勻地出現(xiàn)。具體地,例如,步長(zhǎng)適配模塊60例如使 用兩個(gè)緊接在前的限幅量化索引i。(n-l)和i2(n-2)以及前一次確定的步 長(zhǎng)值A(chǔ)(n-l)至A(n)=卩A(n-l) + S(n)來(lái)計(jì)算當(dāng)前的步長(zhǎng)A(n),其中(3 e[O.O;l.O[, S(n) = S0, (|ic(n-l) + ie(n-2)^ I); 5(n)-S,,其中(卩c(n-l)十 ic(n-2)|>I),其中,5Q、 ^和I以及(3是適當(dāng)調(diào)整的常數(shù)。
如以下參照?qǐng)D5更詳細(xì)地討論的,解碼器使用所獲得的量化索引
序列ie(n)和步長(zhǎng)序列A(n),步長(zhǎng)序列A(n)還利用后向自適應(yīng)方式來(lái)計(jì)
算,以通過(guò)計(jì)算ic(n"A(n)來(lái)重構(gòu)解量化的殘差值序列qc(n),這也在圖
1中的編碼器10中執(zhí)行,即由預(yù)測(cè)裝置20中的解量化器50執(zhí)行。與解碼
器側(cè)類似,以逐樣本的方式,將按照該方式重構(gòu)的殘差值序列qc(n)與 預(yù)測(cè)值六")相加,其中在編碼器10中,通過(guò)加法器48來(lái)執(zhí)行該相加。
盡管被分別重構(gòu)或解量化,但是在編碼器10中,除了計(jì)算后續(xù)預(yù)測(cè)值 六n)之外,不再使用按照該方式獲得的預(yù)濾波信號(hào),在解碼器側(cè),后
濾波器由此產(chǎn)生解碼的音頻樣本序列y(n),該后濾波器取消了預(yù)濾波 器34進(jìn)行的歸一化。
由于限幅,在量化索引序列qc(n)中引入的量化噪聲不再是白噪 聲。而是其頻譜形成了預(yù)濾波信號(hào)的一個(gè)復(fù)制。為了說(shuō)明這一點(diǎn),現(xiàn) 在簡(jiǎn)要地參照?qǐng)D3,圖3分別在圖形a、 b和c中示出了不同數(shù)目的量化等 級(jí)或量化階的預(yù)濾波信號(hào)的PSD (上圖)和量化誤差的PSD (各下圖), 即圖形a中針對(duì)C-[-15; 15],圖形b中針對(duì)[-7; 7]的限幅器范圍,以及圖 形c中針對(duì)[-l; l]的限幅范圍。為了清楚原因,還應(yīng)注意,以-10dB的偏 移畫出了每個(gè)圖形A-C中誤差PSD的PSD過(guò)程??梢钥吹剑A(yù)濾波信號(hào)與功率為(72= 34的有色噪聲相對(duì)應(yīng)。在步長(zhǎng)A-1的量化中,信號(hào)位于 [-21; 21]之內(nèi),即預(yù)濾波信號(hào)的樣本分別具有位于該域之內(nèi)的出現(xiàn)分 布或形成在該域之內(nèi)的直方圖。對(duì)于圖3中的圖形a至c,如上所述,量 化范圍被限制為a)中的[-15; 15]、 b)中的[-7; 7]和c)中的[-l; l]。將量 化誤差作為未量化預(yù)濾波信號(hào)與解碼的預(yù)濾波信號(hào)之差來(lái)度量??梢?看出,通過(guò)增大限幅,或隨著對(duì)量化等級(jí)數(shù)目的限制的增加,向預(yù)濾 波信號(hào)添加量化噪聲,該量化噪聲復(fù)制了預(yù)濾波信號(hào)的PSD,其中, 復(fù)制的程度分別取決于所應(yīng)用的限幅的硬度(hardness)或程度。由 此可見(jiàn),在后濾波之后,解碼器側(cè)的量化噪聲頻譜更多地復(fù)制音頻輸 入信號(hào)的PSD。這意味著,在解碼之后,量化噪聲保持在信號(hào)頻譜之 下。圖2示意了這樣的效果,在圖形a中,針對(duì)后向自適應(yīng)預(yù)測(cè)的情況, 即根據(jù)上述比較ULD方案的預(yù)測(cè)的情況,在圖形b中,針對(duì)根據(jù)圖l的 應(yīng)用了限幅的前向自適應(yīng)預(yù)測(cè)的情況,分別示出了歸一化頻域中的三 個(gè)過(guò)程,即自上而下分別為信號(hào)PSD (即音頻信號(hào)的PSD)、量化誤 差PSD或解碼后的量化噪聲(直線)以及掩蔽閾值(虛線)??梢钥闯觯?對(duì)于比較ULD編碼器(圖2a),量化噪聲被形成為類似于掩蔽閾值,并 對(duì)于信號(hào)部分超過(guò)了信號(hào)頻譜?,F(xiàn)在,圖2b中清晰地示意了分別與隨 后的量化等級(jí)數(shù)目的限幅或限制相結(jié)合的預(yù)濾波信號(hào)的前向自適應(yīng)預(yù) 測(cè)的效果,從圖2b可以看到,量化噪聲總是低于信號(hào)頻譜,其形狀表 現(xiàn)出信號(hào)頻譜和掩蔽閾值的混合。在收聽(tīng)測(cè)試中,已經(jīng)發(fā)現(xiàn),根據(jù)圖 2b的編碼人工效應(yīng)不那么虛假,即所感知的收聽(tīng)質(zhì)量更好。
圖l的編碼器的操作模式的上述描述集中于預(yù)濾波信號(hào)f(n)的后 處理,以用于獲得要向解碼器側(cè)發(fā)送的限幅的量化索引ic(n)。由于它 們?cè)醋运饕龜?shù)目恒定而有限的量,因此,在輸出14的編碼數(shù)據(jù)流中,
可以使用相同的比特?cái)?shù)來(lái)表示它們中的每一個(gè)。因此,例如,比特流 產(chǎn)生器24使用將量化索引映射至可以由預(yù)定比特?cái)?shù)m來(lái)表示的m個(gè)比
特字的單射(injective)映射。
以下描述討論將系數(shù)計(jì)算模塊28和36分別計(jì)算的預(yù)濾波器或預(yù)
測(cè)系數(shù)傳送至解碼器側(cè),即具體利用針對(duì)系數(shù)編碼器30和38的結(jié)構(gòu)的
實(shí)施例。如圖所示,根據(jù)圖4的實(shí)施例的系數(shù)編碼器包括LSF轉(zhuǎn)換模塊102、 第一減法器104、第二減法器106、具有均勻且可調(diào)整的量化步長(zhǎng)的均 勻量化器108、限幅器IIO、解量化器112、第三加法器114、兩個(gè)延遲 部件116和118、分別具有固定濾波器系數(shù)或恒定濾波器系數(shù)的預(yù)測(cè)濾 波器120、以及步長(zhǎng)適配模塊122。要編碼的濾波器系數(shù)來(lái)自輸入124, 其中,提供了輸入126用于輸出編碼表示。
LSF轉(zhuǎn)換模塊102的輸入直接跟著輸入124。減法器104使用其非反 相輸入和輸出連接在LSF轉(zhuǎn)換模塊102的輸出與減法器106的第一輸入 之間,其中,將常數(shù)le施加至減法器104的輸入。減法器106使用其非 反相輸入和輸出連接在第一減法器104與量化器108之間,其中,其反 相輸入與預(yù)測(cè)濾波器120的輸出相耦合。預(yù)測(cè)濾波器120與延遲部件118 和加法器114一起形成了閉環(huán)預(yù)測(cè)器,其中,它們串聯(lián)在具有反饋的回 路中,以使得延遲部件U8連接在加法器114的輸出與預(yù)測(cè)濾波器120 的輸入之間,預(yù)測(cè)濾波器120的輸出與加法器114的第一輸入連接。其 余結(jié)構(gòu)大體上與編碼器10的裝置22之一相對(duì)應(yīng),即量化器108連接在減 法器106的輸出與限幅器110的輸入之間,限幅器110的輸出還與輸出 126、延遲部件116的輸入以及解量化器112的輸入連接。延遲部件116 的輸出與步長(zhǎng)適配模塊122的輸入連接,從而一起形成了步長(zhǎng)適配塊。 步長(zhǎng)適配模塊122的輸出與量化器108的步長(zhǎng)控制輸入以及解量化器 112連接。解量化器112的輸出與加法器114的第二輸入連接。
在以上描述了系數(shù)編碼器的結(jié)構(gòu)之后,下面再次參照?qǐng)Dl,描述 其操作模式。通過(guò)使用由根據(jù)圖4的結(jié)構(gòu)實(shí)現(xiàn)的恒定比特率編碼方案, 分別執(zhí)行預(yù)濾波器和預(yù)測(cè)或預(yù)測(cè)器系數(shù)的傳送,或其者編碼。然后, 在LSF轉(zhuǎn)換模塊102中,首先將濾波器系數(shù)(即分別為預(yù)濾波器或預(yù)測(cè) 系數(shù))分別轉(zhuǎn)換為L(zhǎng)SF值l(n),或轉(zhuǎn)移至LSF域。然后,圖4中的其余元 件如下對(duì)每個(gè)譜線頻率l(n)進(jìn)行處理。這意味著,以下描述僅涉及一個(gè) 譜線頻率,其中,對(duì)所有譜線頻率執(zhí)行過(guò)程的處理。例如,模塊102 對(duì)每個(gè)表示掩蔽閾值的預(yù)濾波器系數(shù)的集合或預(yù)測(cè)預(yù)濾波信號(hào)的預(yù)測(cè) 系數(shù)塊產(chǎn)生LSF值。減法器104從計(jì)算的值l(n)中減去恒定參考值le,其 中,le的充分范圍例如從0至7T。減法器106從產(chǎn)生的差ld(n)中減去預(yù)測(cè)值/:("),該預(yù)測(cè)值由包括具有固定系數(shù)A(z)的預(yù)測(cè)濾波器120 (例如線
性濾波器)在內(nèi)的閉環(huán)預(yù)測(cè)器120、 118和114來(lái)計(jì)算。自適應(yīng)步長(zhǎng)量化
器108對(duì)剩余值(即殘差值)進(jìn)行量化,其中,限幅器U0將量化器108
輸出的量化索引限幅至由其接收的量化索引的子集,例如,對(duì)于由限
幅器110輸出的所有限幅的量化索弓Ue(n),適用以下關(guān)系V : U(n) e
{-1,0,1}。對(duì)于LSF殘差量化器108的A(n)的量化步長(zhǎng)適配,步長(zhǎng)適配模
塊122和延遲部件116例如利用關(guān)于參照?qǐng)D1的步長(zhǎng)適配塊54所描述的
方式來(lái)協(xié)作,然而可能利用不同的適配函數(shù)或利用不同的常數(shù)J3、 I、
5o、 5,和I。盡管量化器108使用當(dāng)前步長(zhǎng)來(lái)將當(dāng)前殘差值量化為le(n),
解量化器112使用步長(zhǎng)A,(n)再次對(duì)該索引值le(n)進(jìn)行解量化,并向加法
器114提供產(chǎn)生的針對(duì)LSF殘差值的重構(gòu)值(減法器106已輸出的),加 法器114將該值與對(duì)應(yīng)的預(yù)測(cè)值&(w)相加,并將經(jīng)由延遲部件118延遲
一個(gè)樣本的預(yù)測(cè)值提供給濾波器120,用以計(jì)算下一個(gè)LSF值ld(n)的預(yù) 測(cè)LSF值i^n)。
如果利用圖4所述的方式來(lái)實(shí)現(xiàn)兩個(gè)系數(shù)編碼器30和38,則圖l中 的編碼器10滿足恒定比特率條件,而無(wú)需使用任何環(huán)。由于LPC系數(shù) 的逐塊前向適配和所應(yīng)用的編碼方案,不需要顯式地復(fù)位預(yù)測(cè)器。
在以下討論根據(jù)圖1和4的編碼器所獲得的收聽(tīng)測(cè)試結(jié)果之前,下 面參照?qǐng)D5和6,討論根據(jù)本發(fā)明的實(shí)施例的解碼器的結(jié)構(gòu),該結(jié)構(gòu)適 于對(duì)來(lái)自該編碼器的編碼數(shù)據(jù)流進(jìn)行解碼。圖6也示出了圖1中的系數(shù) 解碼器的結(jié)構(gòu)。
在圖5中,總體上由200表示的解碼器包括輸入202,用于接收 編碼數(shù)據(jù)流;輸出204,用于輸出解碼音頻流y(n);解量化裝置206, 具有數(shù)目有限且恒定的量化等級(jí);預(yù)測(cè)裝置208;重構(gòu)裝置210;以及 后濾波器裝置212。此外,提供了提取器214,提取器214與輸入202相 耦合,并被實(shí)現(xiàn)為從輸入的編碼比特流中提取量化并限幅的預(yù)濾波殘 差信號(hào)ic(n)、關(guān)于預(yù)濾波器系數(shù)的編碼信息以及關(guān)于預(yù)測(cè)系數(shù)的編碼 信息,因?yàn)橄禂?shù)編碼器30和38 (圖l)已經(jīng)產(chǎn)生了這些編碼信息,并通 過(guò)各自輸出將這些編碼信息輸出。解量化裝置206與提取器214相耦合, 以從提取器214獲得量化索引ic(n),并對(duì)這些索引執(zhí)行解量化,將這些索引解量化為有限且恒定數(shù)目的量化等級(jí),即——放入與上述相同的
表示——{-c A(n); c A(n)},以分別獲得解量化或重構(gòu)的預(yù)濾波信號(hào) qc(n)。預(yù)測(cè)裝置208與提取器214相耦合,以獲得預(yù)濾波信號(hào)的預(yù)測(cè)信
號(hào),即根據(jù)關(guān)于預(yù)測(cè)系數(shù)的信息來(lái)獲得力。)。預(yù)測(cè)裝置208與提取器214
相耦合,以從關(guān)于預(yù)測(cè)系數(shù)的信息中獲得預(yù)濾波信號(hào)的預(yù)測(cè)信號(hào),即 其中,根據(jù)圖5的實(shí)施例的預(yù)測(cè)裝置208也與重構(gòu)裝置210的輸
出連接。提供重構(gòu)裝置210用于基于預(yù)測(cè)信號(hào)/(打)和解量化殘差信號(hào)
qc(n)來(lái)重構(gòu)預(yù)濾波信號(hào)。然后,隨后的后濾波器裝置2I2使用該重構(gòu), 基于從提取器214接收的預(yù)濾波器系數(shù)信息來(lái)對(duì)預(yù)濾波信號(hào)進(jìn)行濾波, 從而消除關(guān)于掩蔽閾值的歸一化,以獲得解碼的音頻信號(hào)y(n)。
在以上描述了圖5的解碼器的基本結(jié)構(gòu)之后,將更詳細(xì)地討論解 碼器200的結(jié)構(gòu)。具體地,解量化器206包括延遲部件216和步長(zhǎng)自適配 模塊218組成的步長(zhǎng)適配塊以及均勻解量化器220。解量化器220的數(shù)據(jù) 輸入與提取器214的輸出連接,以獲得量化索引ic(n)。此外,步長(zhǎng)適配 模塊218經(jīng)由延遲部件216與提取器214的這個(gè)輸出連接,步長(zhǎng)適配模塊 218的輸出還與解量化器220的步長(zhǎng)控制輸入連接。解量化器220的輸出 與形成重構(gòu)裝置210的加法器222的第一輸入連接。預(yù)測(cè)裝置208包括系 數(shù)解碼器224、預(yù)測(cè)濾波器226以及延遲部件228。系數(shù)解碼器224、加 法器222、預(yù)測(cè)濾波器226和延遲部件228在其操作模式及其連接方面與 編碼器10的元件40、 44、 46和48相對(duì)應(yīng)。具體地,預(yù)測(cè)濾波器226的輸 出與加法器222的另一個(gè)輸入連接,加法器222的輸出還經(jīng)由延遲部件 228反饋至預(yù)測(cè)濾波器226的數(shù)據(jù)輸入,并與后濾波器裝置212相耦合。 系數(shù)解碼器224連接在提取器224的另一輸出與預(yù)測(cè)濾波器226的適配 輸入之間。該后濾波器裝置包括系數(shù)解碼器230和后濾波器232,其中, 后濾波器232的數(shù)據(jù)輸入與加法器22的輸出連接,后濾波器232的數(shù)據(jù) 輸出與輸出204連接,而后濾波器232的適配輸入與用于對(duì)濾波器232 進(jìn)行適配的系數(shù)解碼器230的輸出連接,系數(shù)解碼器230的輸入還與提 取器214的另一輸出連接。
如上所述,提取器214從輸入202處的編碼數(shù)據(jù)流中提取表示量化的預(yù)濾波殘差信號(hào)的量化索引ie(n)。在均勻解量化器220中,將這些量 化索引解量化為量化殘差值qc(n)。固有地,由于在編碼器側(cè)已經(jīng)對(duì)量 化索引ic(n)進(jìn)行了限幅,因此該解量化仍保持在所允許的量化等級(jí)內(nèi)。 利用與圖1的編碼器的步長(zhǎng)適配塊54中相同的方式,利用后向適配方式 執(zhí)行步長(zhǎng)適配。在沒(méi)有傳輸誤差的情況下,解量化器220產(chǎn)生與圖1的 編碼器的解量化器50相同的值。因此,元件222、 226、 228和224基于 編碼的預(yù)測(cè)系數(shù)來(lái)獲得與圖1的編碼器10中在加法器48的輸出處所獲 得的相同的結(jié)果,即分別獲得解量化或重構(gòu)的預(yù)濾波信號(hào)。在后濾波 器232中,使用與掩蔽閾值相對(duì)應(yīng)的傳輸函數(shù),對(duì)重構(gòu)的預(yù)濾波信號(hào)進(jìn) 行濾波,其中,系數(shù)解碼器230對(duì)后濾波器232進(jìn)行自適應(yīng)調(diào)整,系數(shù) 解碼器230基于預(yù)濾波器系數(shù)信息,分別適當(dāng)?shù)卣{(diào)整后濾波器232或其 濾波器系數(shù)。
假定向編碼器10提供了如圖4所示地實(shí)現(xiàn)的系數(shù)編碼器30和38, 則如圖6所示地構(gòu)造編碼器200的系數(shù)解碼器224和230以及編碼器10的 系數(shù)解碼器40??梢钥闯觯禂?shù)解碼器包括兩個(gè)延遲部件302和304、 與延遲部件302—起形成步長(zhǎng)適配塊的步長(zhǎng)適配模塊306、具有均勻步 長(zhǎng)的均勻解量化器308、預(yù)測(cè)濾波器310、兩個(gè)加法器312和314、 LSF 重轉(zhuǎn)換模塊316以及用于接收具有恒定偏移-le的量化LSF殘差值le(n)的 輸入318和用于分別輸出重構(gòu)的預(yù)測(cè)或預(yù)濾波器系數(shù)的輸出320。由此, 延遲部件302連接在步長(zhǎng)適配模塊306與輸入318之間,解量化器308的 輸入也與輸入318連接,解量化器308的步長(zhǎng)適配輸入與步長(zhǎng)適配模塊 306的輸出連接。元件302、 306和308的操作模式和連接與圖4中的元件 112、 U6和122相對(duì)應(yīng)。由延遲部件304、預(yù)測(cè)濾波器310和加法器312 組成的閉環(huán)預(yù)測(cè)器與解量化器308的輸出連接,其中,通過(guò)將延遲部件 304連接在加法器312的輸出與預(yù)測(cè)濾波器310的輸入之間、將加法器 312的第一輸入與解量化器308的輸出連接以及將加法器312的第二輸 入與預(yù)測(cè)濾波器310的輸出連接,將延遲部件304、預(yù)測(cè)濾波器310和加 法器312連接在公共回路中。元件304、 310和312在其操作模式和連接 方面與圖4中的元件120、 118和114相對(duì)應(yīng)。此外,加法器312的輸出與 加法器314的第一輸入連接,在加法器314的第二輸入施加常數(shù)值lc,其中,根據(jù)本實(shí)施例,常數(shù)le是一個(gè)協(xié)議量,該量被呈現(xiàn)給編碼器和 解碼器,因此不必作為輔助信息的一部分來(lái)傳送,盡管后者也是可能
的。LSF重轉(zhuǎn)換模塊316連接在加法器314的輸出與輸出320之間。
解量化器308對(duì)在輸入318處輸入的LSF殘差信號(hào)索引le(n)進(jìn)行解 量化,其中,解量化器308使用后向自適應(yīng)步長(zhǎng)值A(chǔ)(n),后向自適應(yīng)步 長(zhǎng)值A(chǔ)(n)是由步長(zhǎng)適配模塊306利用后向適配的方式從已經(jīng)解量化的 量化索引(即已由延遲部件302延遲一個(gè)樣本的量化索引)中確定的。 加法器312將預(yù)測(cè)信號(hào)添加到解量化的LSF殘差值中,這從加法器312 先前已經(jīng)計(jì)算的和來(lái)計(jì)算延遲部件304和預(yù)測(cè)濾波器210的組合,從而 表示了重構(gòu)的LSF值(僅由常數(shù)偏移le提供了恒定偏移)。加法器314 通過(guò)向加法器312輸出的LSF值添加le來(lái)校正該偏移。因此,在加法器 314的輸出處,產(chǎn)生了重構(gòu)的LSF值,模塊316將其從LSF域分別轉(zhuǎn)換回 重構(gòu)的預(yù)測(cè)或預(yù)濾波器系數(shù)。因此,LSF重轉(zhuǎn)換模塊316考慮了所有的 譜線頻率,而圖6中的其他元件的討論局限于對(duì)一個(gè)譜線頻率的描述。 然而,元件302-314也在其他譜線頻率處執(zhí)行上述措施。
在提供了上述編碼器和解碼器的實(shí)施例之后,下面將基于圖7來(lái) 呈現(xiàn)收聽(tīng)測(cè)試結(jié)果,該結(jié)果是通過(guò)根據(jù)圖l、 4、 5和6的編碼方案而獲 得的。在所執(zhí)行的測(cè)試中,在根據(jù)省略了仲裁員的MUSHRA標(biāo)準(zhǔn)的收 聽(tīng)測(cè)試中,已經(jīng)測(cè)試了根據(jù)圖l、 4和6的編碼器和根據(jù)在附圖描述的開(kāi) 始處所討論的比較ULD編碼方案的編碼器。在安靜的辦公室環(huán)境中, 在具有外部數(shù)模轉(zhuǎn)換器和STAX放大器/耳機(jī)的膝上型電腦上執(zhí)行 MUSHRA測(cè)試。 一組8個(gè)測(cè)試收聽(tīng)者由專家和非專家收聽(tīng)者組成。在 參與者開(kāi)始收聽(tīng)測(cè)試之前,他們有機(jī)會(huì)收聽(tīng)測(cè)試集合。使用MPEG測(cè) 試集合中的12個(gè)單聲道音頻文件來(lái)執(zhí)行測(cè)試,其中,所有文件具有 32kHz的采樣頻率,即es01 (Suzanne Vega)、 es02 (男性語(yǔ)音,德語(yǔ))、 es03 (女性語(yǔ)音,英語(yǔ))、sc01 (小號(hào))、sc02 (管弦樂(lè))、sc03 (流行 音樂(lè))、si01 (羽管鍵琴)、si02 (響板)、si03 (律管)、sm01 (風(fēng)笛)、 sm02 (鐘琴)、sm03 (彈撥樂(lè)器)。
對(duì)于比較ULD編碼方案,在實(shí)現(xiàn)中使用了長(zhǎng)度為64的后向自適應(yīng) 預(yù)測(cè),以及具有64kbit/s的恒定比特率的、用于熵編碼的后向自適應(yīng)Golomb編碼器。相反,為了實(shí)現(xiàn)根據(jù)圖l、 4和6的編碼器,使用了長(zhǎng) 度為12的前向自適應(yīng)預(yù)測(cè)器,其中,將不同量化等級(jí)的數(shù)目限制為3, 即使得Vn : ic(n) e {-1,0,1}。這與編碼的輔助信息一起產(chǎn)生了64kbit/s 的恒定比特率,這意味著相同的比特率。
圖7示出了MUSHRA收聽(tīng)測(cè)試的結(jié)果,其中,分別針對(duì)12個(gè)測(cè)試 片斷,并針對(duì)所有片斷上的總體結(jié)果示出了平均值和95%的置信區(qū)間。 只要置信區(qū)間重疊,則在編碼方法之間沒(méi)有統(tǒng)計(jì)上的顯著差異。
片斷es01 (Suzanne Vega)是根據(jù)圖l、 4、 5和6的編碼方案在較 低比特率下的優(yōu)越性的很好的示例。與比較ULD編碼方案相比,解碼 信號(hào)頻譜的較高部分示出了較少的可聽(tīng)見(jiàn)人工效應(yīng)。這導(dǎo)致了根據(jù)圖 1、 4、 5和6的方案具有明顯更高的評(píng)級(jí)。
對(duì)于比較ULD編碼方案,片斷sm02 (鐘琴)的信號(hào)瞬變具有較高 的比特率要求。利用所使用的64kbit/s,比較ULD編碼方案在全部樣本 塊上產(chǎn)生了虛假的編碼人工效應(yīng)。相反,根據(jù)圖l、 4和6操作的編碼器 分別提供了明顯改善的收聽(tīng)質(zhì)量或感知質(zhì)量。將圖7中的圖形右側(cè),根 據(jù)圖l、 4和6形成的編碼方案的總體評(píng)級(jí)獲得了比對(duì)比ULD編碼方案 明顯更好的評(píng)級(jí)??傮w而言,在給定的測(cè)試條件下,該編碼方案得到 了 "良好音頻質(zhì)量"的總體評(píng)級(jí)。
總而言之,根據(jù)上述實(shí)施例中,產(chǎn)生了具有低延遲結(jié)果的音頻編 碼方案,該方案使用逐塊前向自適應(yīng)預(yù)測(cè)以及限幅/限制來(lái)代替后向自 適應(yīng)逐樣本預(yù)測(cè)。噪聲整形不同于比較ULD編碼方案。收聽(tīng)測(cè)試表明, 在較低比特率的情況下,上述實(shí)施例優(yōu)于根據(jù)比較ULD編碼方案的后 向自適應(yīng)方法。隨后,上述實(shí)施例是用于縮小高質(zhì)量語(yǔ)音編碼器與具 有低延遲的音頻編碼器之間的比特率差異的候選方案??傮w上,對(duì)于 減小的比特率,上述實(shí)施例提供了一種具有6-8ms的非常低的延遲的音 頻編碼方案的可能性,與比較ULD編碼器相比,該音頻編碼方案具有 以下優(yōu)點(diǎn)。該方案相對(duì)于高量化誤差更為魯棒,具有附加的噪聲整形 能力,具有更好的獲得恒定比特率的能力,并表現(xiàn)出更好的誤差恢復(fù) 行為。實(shí)施例通過(guò)一種修正的方式,增大掩蔽閾值之上的量化噪聲, 即通過(guò)向掩蔽閾值加入信號(hào)頻譜來(lái)取代均勻地增大掩蔽閾值至某個(gè)程度,解決了在比較ULD編碼方案的情況下在沒(méi)有信號(hào)的位置處出現(xiàn)可
聽(tīng)見(jiàn)的量化噪聲的問(wèn)題。按照這種方式,在沒(méi)有信號(hào)的位置處不存在 可聽(tīng)見(jiàn)的量化噪聲。
換言之,上述實(shí)施例與比較ULD編碼方案的不同之處在于下列方 式。在比較ULD編碼方案中,使用了后向自適應(yīng)預(yù)測(cè),這意味著基 于逐樣本,根據(jù)先前解碼的信號(hào)值來(lái)更新預(yù)測(cè)濾波器A(z)的系數(shù)。使 用具有可變步長(zhǎng)的量化器,其中,通過(guò)使用來(lái)自熵編碼器的信息,使 得步長(zhǎng)適配全部128個(gè)樣本,該信息作為輔助信息被發(fā)送至解碼器側(cè)。 通過(guò)這一過(guò)程,增大了量化步長(zhǎng),這向預(yù)濾波信號(hào)添加了更多白噪聲, 從而均勻地增大了掩蔽閾值。在比較ULD編碼方案中,如果使用前向 自適應(yīng)逐塊預(yù)測(cè)來(lái)代替后向自適應(yīng)預(yù)測(cè),這意味著,針對(duì)未量化預(yù)濾 波樣本中的128個(gè)樣本,計(jì)算一次預(yù)測(cè)濾波器A(z)的系數(shù),并將其作為
輔助信息來(lái)發(fā)送,此外如果通過(guò)來(lái)自熵編碼器、并作為輔助信息發(fā)送 至解碼器側(cè)的信息來(lái)使步長(zhǎng)適配128個(gè)樣本,則如比較ULD編碼方案
的情況一樣,量化步長(zhǎng)仍增大,但是任何量化均不影響預(yù)測(cè)器的更新。 上述實(shí)施例僅使用前向自適應(yīng)逐塊預(yù)測(cè),其中,量化器另外僅具有給 定數(shù)目2N+1的量化階,該量化階具有固定的步長(zhǎng)。對(duì)于具有在量化器 范圍[-NA;NA]之外的幅度的預(yù)濾波信號(hào)x(n),將量化信號(hào)限制在 [-NA;NA]。這樣產(chǎn)生其PSD不再是白的、但復(fù)制了輸入信號(hào)(預(yù)濾波 音頻信號(hào))的PSD的量化噪聲。
作為總結(jié),在上述實(shí)施例中應(yīng)注意以下內(nèi)容。首先,應(yīng)注意,對(duì) 于發(fā)送關(guān)于掩蔽閾值的表示的信息,存在不同的可能性,該信息是由 編碼器內(nèi)的感知模型模塊26產(chǎn)生的,分別發(fā)送至預(yù)濾波器34或預(yù)測(cè)濾 波器44,并發(fā)送至解碼器,具體發(fā)送至后濾波器232和預(yù)測(cè)濾波器226。 具體地,應(yīng)注意,不要求編碼器內(nèi)的系數(shù)解碼器32和40精確地接收與 在編碼器的輸出14處輸出的、以及在解碼器的輸出202接收的掩蔽閾值 相關(guān)的信息。更合理地,例如,在根據(jù)圖4的系數(shù)編碼器30的結(jié)構(gòu)中, 所獲得索引le(n)以及預(yù)濾波殘差信號(hào)量化索引ic(n)也可以僅源自三個(gè) 值的量,即-1、 0、 1,比特流產(chǎn)生器24可以將這些索引清晰地映射至 對(duì)應(yīng)的n比特字。分別根據(jù)如圖l、 4或5、 6的實(shí)施例,將每個(gè)源自量-1、0、 l的預(yù)濾波器量化索引、預(yù)測(cè)系數(shù)量化索引和/或預(yù)濾波器量化索引,
5個(gè)一組地映射至8比特字,這與將35種可能性映射至28比特字相對(duì)應(yīng)。 由于該映射不是滿射的,因此若干8比特字保持為未使用,可以利用其 他方式來(lái)使用它們,例如用于同步等等。
在這種情況下,應(yīng)注意以下內(nèi)容。在上文中,參考圖6描述的系 數(shù)解碼器32和230的結(jié)構(gòu)是相同的。在這種情況下,預(yù)濾波器34和后濾 波器232被實(shí)現(xiàn)為使得當(dāng)應(yīng)用相同的濾波器系數(shù)時(shí),它們具有互為倒數(shù) 的傳輸函數(shù)。然而,以下過(guò)程當(dāng)然也是可能的,例如,系數(shù)編碼器32 執(zhí)行附加的濾波器系數(shù)轉(zhuǎn)換,以使得該預(yù)濾波器具有大體與掩蔽閾值 的倒數(shù)相對(duì)應(yīng)的傳輸函數(shù),而該后濾波器具有大體與掩蔽閾值相對(duì)應(yīng) 的傳輸函數(shù)。
在上述實(shí)施例中,假定在模塊26中計(jì)算掩蔽閾值。然而,應(yīng)注意, 所計(jì)算的閾值不必與心理聲學(xué)閾值精確對(duì)應(yīng),而是可以表示其或多或 少精確的估計(jì),可以不考慮全部心理聲學(xué)效應(yīng)而僅考慮其中的一些。 具體地,該閾值可以表示有意地經(jīng)過(guò)與對(duì)心理聲學(xué)的掩蔽閾值的估計(jì) 相反的修正的心理聲學(xué)引起的閾值。
此外,應(yīng)注意,在對(duì)預(yù)濾波殘差信號(hào)值進(jìn)行量化中,不需要步長(zhǎng) 的后向自適應(yīng)適配。更合理地,在特定應(yīng)用情況下,固定步長(zhǎng)是足夠 的。
此外,應(yīng)注意,本發(fā)明不局限于音頻編碼領(lǐng)域。更合理地,要編 碼的信號(hào)也可以是用于剌激計(jì)算機(jī)空間手套中的指尖的信號(hào),其中, 在這種情況下,感知模型26考慮人類的觸覺(jué)不再能感知到的特定的觸 覺(jué)特性。例如,要編碼的信息信號(hào)的另一個(gè)示例是視頻信號(hào)。具體地, 要編碼的信息信號(hào)可以分別是像素或圖像點(diǎn)的亮度信息,其中,感知 模型26也可以考慮不同的時(shí)間、位置和頻率心理視覺(jué)遮蔽效應(yīng),例如
視覺(jué)掩蔽閾值。
此外,應(yīng)注意,量化器56和限幅器58或量化器108和限幅器110分 別不必是分離的組件。更合理地,也可以由單個(gè)映射來(lái)執(zhí)行未量化值 至量化值/限幅值的映射。另一方面,可以使用除法器接著是步長(zhǎng)均勻 且恒定的量化器的串聯(lián)來(lái)分別實(shí)現(xiàn)量化器56和量化器108,其中,該除法器可以使用從各自的步長(zhǎng)適配模塊中獲得的步長(zhǎng)值A(chǔ)(n)作為除數(shù), 而要編碼的殘差信號(hào)形成被除數(shù)??梢蕴峁┎介L(zhǎng)恒定且均勻的量化器 作為簡(jiǎn)單的舍入模塊,該模塊將除法結(jié)果舍入至下一個(gè)整數(shù),基于此, 隨后的限幅器可以如上所述地將該整數(shù)限制為具有所允許的量C的整 數(shù)。在各解量化器中,簡(jiǎn)單地使用A(n)作為乘數(shù)來(lái)執(zhí)行均勻解量化。
此外,應(yīng)注意,上述實(shí)施例局限于具有恒定比特率的應(yīng)用。然而, 本發(fā)明不局限于此,因此,在這些實(shí)施例中使用的例如通過(guò)限幅預(yù)濾 波信號(hào)來(lái)進(jìn)行量化僅是一種可能的備選。可以使用具有非線性特性曲 線的量化函數(shù)來(lái)代替限幅。為了說(shuō)明這一點(diǎn),參照?qǐng)D8a至圖8c。圖8a 示出了上述使用的在三個(gè)量化階上產(chǎn)生限幅的量化函數(shù),即具有3個(gè)階 402a、 b、 c的階梯函數(shù),該函數(shù)將未量化值(x軸)映射至量化索引(y 軸),其中也標(biāo)記了量化階高或量化步長(zhǎng)A(n)。可以看出,高于A(n)/2 的未量化值被分別限幅至各自的下一階402a或c。圖8b總體上示出了產(chǎn) 生限幅至2n+l個(gè)量化階的量化函數(shù)。再次示出了量化步長(zhǎng)A(n)。圖8a 和8b的量化函數(shù)表示了這樣的量化函數(shù),即其中以均勻的方式(即使 用相同的階高)進(jìn)行閾值-A(n)與A(n)或-NA(n)與NA(n)之間的量化,基 于這種方式,量化階函數(shù)以平坦的方式行進(jìn),這與限幅相對(duì)應(yīng)。圖8c 示出了非線性量化函數(shù),其中,該量化函數(shù)在-N厶(n)與NA(n)之間的區(qū) 域的行進(jìn)不是完全平坦的,而是與第一區(qū)域相比具有較低的傾斜,即 分別具有較大的步長(zhǎng)或階高。如在上述實(shí)施例中的情況一樣,這種非 線性量化不固有地產(chǎn)生恒定比特率,但是也產(chǎn)生上述量化噪聲的變形, 使得量化噪聲調(diào)整為信號(hào)PSD。僅作為一種預(yù)防性措施,應(yīng)注意,參 照?qǐng)D8a-c,可以使用非均勻量化取代均勻量化區(qū)域,在非均勻量化中, 例如,階高連續(xù)增大,其中,在保持其相互關(guān)系的同時(shí),可以通過(guò)階 高調(diào)整值A(chǔ)(n)來(lái)縮放階高。因此,例如,可以在各量化器中通過(guò)非線 性函數(shù)將未量化值映射至中間值,其中,在映射之前或之后執(zhí)行與A(n) 的相乘,最終,對(duì)所產(chǎn)生的值進(jìn)行均勻量化。在各解量化器中,執(zhí)行 相反的過(guò)程,即通過(guò)A(n)的均勻解量化,接著是反非線性映射,或相 反地,首先進(jìn)行非線性轉(zhuǎn)換映射,接著使用A(n)進(jìn)行解量化。最終, 應(yīng)注意,當(dāng)階高可以被調(diào)整至足夠高,或量化足夠粗略,使得對(duì)于要量化的信號(hào)(如預(yù)濾波信號(hào))的信號(hào)統(tǒng)計(jì)量,該量化有效地如非線性
量化一樣工作時(shí),通過(guò)獲得上述誤差PSD的變形效果,實(shí)現(xiàn)連續(xù)均勻
(即線性)的量化也是可能的,其中,預(yù)測(cè)的前向自適應(yīng)再次使該階 高調(diào)整成為可能。
此外,在編碼比特流的處理方面,上述實(shí)施例也可以變化。
具體地,也可以分別省略比特流產(chǎn)生器和提取器214。
不同的量化索引,即預(yù)濾波信號(hào)的殘差值、預(yù)濾波器系數(shù)的殘差 值和預(yù)測(cè)系數(shù)的殘差值也可以分別通過(guò)單獨(dú)的信道,并行地互相傳送、 存儲(chǔ)或以其他方式為解碼所用。另一方面,在恒定比特率不是必需的 情況下,也可以對(duì)這些數(shù)據(jù)進(jìn)行熵編碼。
具體地,可以單獨(dú)實(shí)現(xiàn)或以子程序過(guò)程的結(jié)合來(lái)實(shí)現(xiàn)圖l、 4、 5 和6的塊中的上述功能。可選地,以集成電路的形式來(lái)實(shí)現(xiàn)本發(fā)明的設(shè) 備,例如其中將這些塊實(shí)現(xiàn)為ASIC的單獨(dú)電路部分。
特別地,應(yīng)注意,根據(jù)情況,可以以軟件來(lái)實(shí)現(xiàn)本發(fā)明的方案。 實(shí)現(xiàn)方式可以是在數(shù)字存儲(chǔ)介質(zhì)上,尤其是具有電子可讀的控制信號(hào) 的光盤或CD上,所述控制信號(hào)可以與可編程計(jì)算機(jī)系統(tǒng)協(xié)作來(lái)執(zhí)行各 方法。 一般地,因此,本發(fā)明也在于具有程序代碼的計(jì)算機(jī)程序產(chǎn)品, 所述程序代碼存儲(chǔ)在機(jī)器可讀載體上,當(dāng)計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上 運(yùn)行時(shí),所述程序代碼執(zhí)行本發(fā)明的方法。換言之,因此,本發(fā)明可 以被認(rèn)為是具有程序代碼的計(jì)算機(jī)程序,當(dāng)計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn) 行時(shí),所述程序代碼執(zhí)行本方法。
權(quán)利要求
1. 一種用于將信息信號(hào)編碼為編碼信息信號(hào)的設(shè)備,包括用于確定的裝置(16),通過(guò)使用感知模型來(lái)確定心理感知引起的閾值的表示,所述表示指示了信息信號(hào)中與感知不相關(guān)的部分;用于濾波的裝置(18),對(duì)所述信息信號(hào)進(jìn)行濾波,以關(guān)于所述心理感知引起的閾值來(lái)對(duì)所述信息信號(hào)進(jìn)行歸一化,獲得預(yù)濾波信號(hào);用于預(yù)測(cè)的裝置(20),用于以前向自適應(yīng)方式來(lái)預(yù)測(cè)所述預(yù)濾波信號(hào),以獲得預(yù)測(cè)信號(hào)、預(yù)濾波信號(hào)的預(yù)測(cè)誤差以及預(yù)測(cè)系數(shù)的表示,所述預(yù)濾波信號(hào)是能夠基于預(yù)測(cè)信號(hào)、預(yù)濾波信號(hào)的預(yù)測(cè)誤差以及預(yù)測(cè)系數(shù)的表示來(lái)重構(gòu)的;以及用于量化的裝置(22),對(duì)所述預(yù)測(cè)誤差進(jìn)行量化,以獲得量化預(yù)測(cè)誤差,其中,所述編碼信息信號(hào)包括關(guān)于心理感知引起的閾值的表示、預(yù)測(cè)系數(shù)的表示以及量化預(yù)測(cè)誤差的信息。
2. 如權(quán)利要求l所述的設(shè)備,其中,所述用于量化的裝置(22) 被實(shí)現(xiàn)為通過(guò)量化函數(shù)來(lái)對(duì)預(yù)測(cè)誤差進(jìn)行量化,所述量化函數(shù)將預(yù)測(cè) 誤差的未量化值映射至量化階的量化索引,以及所述量化函數(shù)的過(guò)程 在閾值之下比在閾值之上更陡。
3. 如權(quán)利要求1或2所述的設(shè)備,其中,所述用于量化的裝置(22)被實(shí)現(xiàn)為以后向自適應(yīng)方式從所述量化預(yù)測(cè)誤差中獲得所述量化函數(shù) 的量化階高A(n)。
4. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于量化預(yù)測(cè)誤 差的裝置(22)被實(shí)現(xiàn)為使得通過(guò)量化函數(shù)的限幅來(lái)對(duì)預(yù)測(cè)誤差的未 量化值進(jìn)行量化,所述量化函數(shù)將預(yù)測(cè)誤差的未量化值映射至恒定且 有限的第一數(shù)目的量化階的量化索引,以獲得所述量化預(yù)測(cè)誤差。
5. 如權(quán)利要求4所述的設(shè)備,其中,所述用于量化的裝置(22)被實(shí)現(xiàn)為以后向自適應(yīng)方式,根據(jù)量化預(yù)測(cè)誤差的兩個(gè)過(guò)去的量化 索引ic(n-l)和i2(n-2),根據(jù)A(n),(n-l) + 5(n),獲得用于對(duì)預(yù)測(cè)誤差 的值(r(n))進(jìn)行量化的量化函數(shù)的量化階高A(n),其中P e
,對(duì)于lic(n-l) + ic(n畫2)pl, S(n) = 5。,對(duì)于lie(n-l) + ic(n-2)| >1, S(n"5, 其中,SQ、 S!、 I是恒定參數(shù),并且A(n-l)表示所獲得的用于對(duì)量化誤 差的先前值進(jìn)行量化的量化階高。
6. 如權(quán)利要求4或5所述的設(shè)備,其中,所述用于量化的裝置(22) 被實(shí)現(xiàn)為以非線性方式來(lái)對(duì)量化誤差進(jìn)行量化。
7. 如權(quán)利要求4至6中任一項(xiàng)所述的設(shè)備,其中,所述恒定且有限 的第一數(shù)目是3。
8. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于確定的裝置 (16)被實(shí)現(xiàn)為以逐塊的方式根據(jù)所述信息信號(hào)來(lái)確定所述心理感知引起的閾值。
9. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于確定的裝置 (16)被實(shí)現(xiàn)為在LSF域中表示所述心理感知引起的閾值。
10. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于確定的裝 置(16)被實(shí)現(xiàn)為以逐塊的方式確定所述心理感知引起的閾值,并將 其以濾波系數(shù)表示,對(duì)濾波器系數(shù)進(jìn)行預(yù)測(cè),并通過(guò)另一量化函數(shù)對(duì) 預(yù)測(cè)產(chǎn)生的濾波器系數(shù)殘差信號(hào)進(jìn)行量化,所述另一量化函數(shù)將濾波 器系數(shù)殘差信號(hào)的未量化值映射至量化階的量化索引,以獲得量化的 濾波器系數(shù)殘差信號(hào),所述另一量化函數(shù)的過(guò)程在另一閾值之下比在 所述另一閾值之上更陡,其中,所述編碼信息信號(hào)也包括與量化的濾 波器系數(shù)殘差信號(hào)有關(guān)的信息。
11. 如權(quán)利要求10所述的設(shè)備,其中,用于確定的裝置(16)被實(shí)現(xiàn)為通過(guò)所述另一量化函數(shù)的限幅來(lái)對(duì)濾波器系數(shù)殘差信號(hào)的未量 化值進(jìn)行量化,所述另一量化函數(shù)將濾波器系數(shù)殘差信號(hào)的未量化值 映射至恒定且有限的第二數(shù)目的量化階的量化索引。
12. 如權(quán)利要求ll所述的設(shè)備,其中,所述用于確定的裝置(16) 被實(shí)現(xiàn)為使得以后向自適應(yīng)方式,基于量化的濾波器系數(shù)殘差信號(hào)的 量化索引來(lái)執(zhí)行預(yù)測(cè)。
13. 如權(quán)利要求10至12中任一項(xiàng)所述的設(shè)備,其中,所述用于確定的裝置(16)被實(shí)現(xiàn)為通過(guò)使用具有恒定系數(shù)的預(yù)測(cè)濾波器來(lái)執(zhí)行 對(duì)所述濾波器系數(shù)的預(yù)測(cè)。
14. 如權(quán)利要求9至13中任一項(xiàng)所述的設(shè)備,其中,所述用于確定的裝置(16)還被實(shí)現(xiàn)為在對(duì)表示所述心理感知引起的閾值的濾波器系數(shù)進(jìn)行預(yù)測(cè)之前,將其與常數(shù)值相減。
15. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于以前向自適應(yīng)方式來(lái)預(yù)測(cè)預(yù)濾波信號(hào)的用于預(yù)測(cè)的裝置(20)還包括用于確定預(yù)測(cè)濾波器系數(shù)的裝置(36),用于根據(jù)所述預(yù)濾波信 號(hào)確定預(yù)測(cè)濾波器系數(shù);以及用于預(yù)測(cè)預(yù)濾波信號(hào)的裝置(44、 446、 48),用于通過(guò)受控于所 述預(yù)測(cè)濾波器系數(shù)的濾波器(44)來(lái)預(yù)測(cè)所述預(yù)濾波信號(hào)。
16. 如權(quán)利要求15所述的設(shè)備,其中,所述用于確定預(yù)測(cè)濾波器 系數(shù)的裝置(36)被實(shí)現(xiàn)為以逐塊的方式,根據(jù)所述預(yù)濾波信號(hào)來(lái)確 定所述預(yù)測(cè)濾波器系數(shù)。
17. 如權(quán)利要求15或16所述的設(shè)備,其中,所述用于確定預(yù)測(cè)濾 波器系數(shù)的裝置(36)被實(shí)現(xiàn)為在LSF域中表示所述預(yù)測(cè)濾波器系數(shù)。
18. 如權(quán)利要求15至17中任一項(xiàng)所述的設(shè)備,其中,所述用于確 定預(yù)測(cè)濾波器系數(shù)的裝置(36)被實(shí)現(xiàn)為以逐塊的方式確定所述預(yù)測(cè) 濾波器系數(shù),對(duì)所述預(yù)測(cè)濾波器系數(shù)進(jìn)行預(yù)測(cè),并通過(guò)第三量化函數(shù) 對(duì)預(yù)測(cè)產(chǎn)生的預(yù)測(cè)濾波器系數(shù)殘差信號(hào)進(jìn)行量化,所述第三量化函數(shù) 將預(yù)測(cè)濾波器系數(shù)殘差信號(hào)的未量化值映射至量化階的量化索引,以 獲得量化的預(yù)測(cè)濾波器系數(shù)殘差信號(hào),所述第三量化函數(shù)的過(guò)程在第 三閾值之下比在所述第三閾值之上更陡,其中,所述編碼信息信號(hào)也 包括與量化的預(yù)測(cè)濾波器系數(shù)殘差信號(hào)相關(guān)的信息。
19. 如權(quán)利要求18所述的設(shè)備,其中,用于確定預(yù)測(cè)濾波器系數(shù) 的裝置(36)被實(shí)現(xiàn)為通過(guò)所述第三量化函數(shù),通過(guò)限幅來(lái)將所述 預(yù)測(cè)濾波器系數(shù)殘差信號(hào)的未量化值量化為第三數(shù)目的量化階的量化 索引,所述第三量化函數(shù)將所述預(yù)測(cè)濾波器系數(shù)殘差信號(hào)的未量化值 映射至恒定且有限的第三數(shù)目的量化階的量化索引。
20. 如權(quán)利要求18所述的設(shè)備,其中,所述用于確定預(yù)測(cè)濾波器 系數(shù)的裝置(36)被實(shí)現(xiàn)為使得以后向自適應(yīng)方式,基于所述預(yù)濾波 信號(hào)的一個(gè)或多個(gè)先前塊的量化的預(yù)測(cè)濾波器系數(shù)殘差信號(hào)的量化索引來(lái)執(zhí)行預(yù)測(cè)。
21. 如權(quán)利要求18至19中任一項(xiàng)所述的設(shè)備,其中,所述用于確 定預(yù)測(cè)濾波器系數(shù)的裝置(36)被實(shí)現(xiàn)為使得通過(guò)使用具有恒定系數(shù) 的預(yù)測(cè)濾波器來(lái)執(zhí)行所述預(yù)測(cè)濾波器系數(shù)的預(yù)測(cè)。
22. 如權(quán)利要求18至21中任一項(xiàng)所述的設(shè)備,其中,所述用于確 定預(yù)測(cè)濾波器系數(shù)的裝置(36)還被實(shí)現(xiàn)為在對(duì)所述預(yù)測(cè)濾波器系數(shù) 進(jìn)行預(yù)測(cè)之前,將其與常數(shù)值相減。
23. 如之前任一權(quán)利要求所述的設(shè)備,所述設(shè)備被實(shí)現(xiàn)為將音頻 信號(hào)或視頻信號(hào)編碼為信息信號(hào),其中,所述感知模型是心理聲學(xué)模 型,所述心理感知引起的閾值是心理聲學(xué)引起的閾值,或所述感知模 型是心理視覺(jué)模型,所述心理感知引起的閾值是心理視覺(jué)引起的閾值。
24. —種用于將編碼信息信號(hào)解碼為解碼信息信號(hào)的設(shè)備,所述 編碼信息信號(hào)包括關(guān)于心理感知引起的閾值的表示、預(yù)測(cè)系數(shù)的表示 以及量化預(yù)測(cè)誤差的信息,所述設(shè)備包括用于解量化的裝置(206),對(duì)量化預(yù)測(cè)誤差進(jìn)行解量化,以獲得 解量化預(yù)測(cè)誤差;用于確定預(yù)測(cè)信號(hào)的裝置(208),基于所述預(yù)測(cè)系數(shù)來(lái)確定預(yù)測(cè) 信號(hào);用于重構(gòu)的裝置(210),基于所述預(yù)測(cè)信號(hào)和所述解量化預(yù)測(cè)誤 差來(lái)重構(gòu)預(yù)濾波信號(hào);以及用于對(duì)預(yù)濾波信號(hào)進(jìn)行濾波的裝置(212),對(duì)所述預(yù)濾波信號(hào)進(jìn) 行濾波來(lái)對(duì)關(guān)于所述心理感知引起的閾值的歸一化進(jìn)行重轉(zhuǎn)換,以獲 得解碼信息信號(hào)。
25. 如權(quán)利要求24所述的設(shè)備,其中,所述用于解量化的裝置 (206)被實(shí)現(xiàn)為將所述量化預(yù)測(cè)誤差解量化至有限且恒定數(shù)目的量化階。
26. 如權(quán)利要求25所述的設(shè)備,其中,所述用于解量化的裝置 (206)被實(shí)現(xiàn)為以后向自適應(yīng)方式,從己解量化的量化預(yù)測(cè)誤差的量化索引中獲得量化階之間的量化階高A(n)。
27. 如權(quán)利要求25或26所述的設(shè)備,其中,所述用于解量化的裝置(206)被實(shí)現(xiàn)為以后向自適應(yīng)方式,根據(jù)量化預(yù)測(cè)誤差的兩個(gè)過(guò)去的量化索引ic(n-l)和i2(n-2),根據(jù)A(n"卩A(n-l) + 5(n),獲得用于對(duì) 所述量化預(yù)測(cè)誤差的量化索引進(jìn)行解量化的量化階之間的量化階高 A(n),其中p e
,對(duì)于卩c(n-l) + ic(n-2)|S I, S(n) = 50,對(duì)于卩c(n-l) + ic(n-2)|>I, 5(n):Sp其中,50、 5" I是恒定參數(shù),并且A(n-l)表示 所獲得的用于對(duì)ie(n-l)進(jìn)行解量化的量化階高。
28. 如權(quán)利要求25至27中任一項(xiàng)所述的設(shè)備,其中,所述恒定且 有限的數(shù)目小于或等于32。
29. 如權(quán)利要求25至28中任一項(xiàng)所述的設(shè)備,其中,所述恒定且 有限的數(shù)目是3。
30. 如權(quán)利要求24至29中任一項(xiàng)所述的設(shè)備,其中,所述用于對(duì) 預(yù)濾波信號(hào)進(jìn)行濾波的裝置(212)包括用于確定感知閾值濾波系數(shù)的裝置(230),用于針對(duì)預(yù)濾波信號(hào) 的塊序列,以逐塊的方式,根據(jù)關(guān)于所述心理感知引起的閾值的表示 的信息來(lái)確定感知閾值濾波系數(shù);以及后濾波器(232),用于通過(guò)使用所述感知閾值濾波器系數(shù)來(lái)對(duì)所述預(yù)濾波信號(hào)進(jìn)行濾波。
31. 如權(quán)利要求24至30中任一項(xiàng)所述的設(shè)備,其中,所述用于確 定感知閾值濾波系數(shù)的裝置(230)被實(shí)現(xiàn)為通過(guò)從LSF域的重轉(zhuǎn)換來(lái)獲得所述感知閾值濾波器系數(shù)。
32. 如權(quán)利要求24至31中任一項(xiàng)所述的設(shè)備,其中,所述用于確 定感知閾值濾波系數(shù)的裝置(230)被實(shí)現(xiàn)為從所述心理感知引起的 閾值的表示中獲得量化的濾波器系數(shù)殘差信號(hào)的量化索引;將其解量 化至有限且恒定的第二數(shù)目的量化等級(jí),以獲得解量化的濾波器系數(shù) 殘差信號(hào);預(yù)測(cè)表示所述心理感知引起的閾值的濾波器系數(shù),并將其 與解量化的濾波器系數(shù)殘差信號(hào)相加;以及通過(guò)重轉(zhuǎn)換,將所述相加 產(chǎn)生的重構(gòu)的濾波器系數(shù)殘差信號(hào)轉(zhuǎn)換為所述感知閾值濾波器系數(shù)。
33. 如權(quán)利要求32所述的設(shè)備,其中,所述用于確定感知閾值濾 波系數(shù)的裝置(230)被實(shí)現(xiàn)為使得以后向自適應(yīng)方式,基于已預(yù)測(cè) 的表示所述心理感知引起的閾值的濾波器系數(shù)來(lái)執(zhí)行所述預(yù)測(cè)。
34. 如權(quán)利要求32或33所述的設(shè)備,其中,所述用于確定感知閾 值濾波系數(shù)的裝置(230)被實(shí)現(xiàn)為使得通過(guò)使用具有恒定系數(shù)的預(yù) 測(cè)濾波器來(lái)執(zhí)行對(duì)表示所述所述心理感知引起的閾值的濾波器系數(shù)的
35. 如權(quán)利要求32至34中任一項(xiàng)所述的設(shè)備,其中,所述用于確 定感知閾值濾波系數(shù)的裝置(230)還被實(shí)現(xiàn)為在重轉(zhuǎn)換之前,將所 述相加產(chǎn)生的重構(gòu)的濾波器系數(shù)殘差信號(hào)與常數(shù)值相減。
36. 如權(quán)利要求24至37中任一項(xiàng)所述的設(shè)備,其中,所述用于確 定預(yù)測(cè)信號(hào)的裝置(208)還包括用于確定預(yù)測(cè)濾波器系數(shù)的裝置(224),用于根據(jù)所述編碼信息 信號(hào)中包括的預(yù)測(cè)系數(shù)的表示來(lái)確定預(yù)測(cè)濾波器系數(shù);以及用于預(yù)測(cè)預(yù)濾波信號(hào)的裝置(226、 228),用于通過(guò)受控于所述 預(yù)測(cè)濾波器系數(shù)的濾波器(226)來(lái)預(yù)測(cè)所述預(yù)濾波信號(hào)。
37. 如權(quán)利要求36所述的設(shè)備,其中,所述用于確定預(yù)測(cè)濾波器 系數(shù)的裝置(224)被實(shí)現(xiàn)為以逐塊的方式,針對(duì)所述預(yù)濾波信號(hào)的 塊序列中的塊,確定所述預(yù)測(cè)濾波器系數(shù)。
38. 如權(quán)利要求36或37所述的設(shè)備,其中,所述用于確定預(yù)測(cè)濾 波器系數(shù)的裝置(224)被實(shí)現(xiàn)為通過(guò)從LSF域的重轉(zhuǎn)換來(lái)獲得所述預(yù) 測(cè)濾波器系數(shù)。
39. 如權(quán)利要求36至38中任一項(xiàng)所述的設(shè)備,其中,所述用于確 定預(yù)測(cè)濾波器系數(shù)的裝置(224)被實(shí)現(xiàn)為從所述預(yù)測(cè)系數(shù)的表示中 獲得量化的預(yù)測(cè)系數(shù)殘差信號(hào)的量化索引;將其解量化至有限且恒定 的第三數(shù)目的量化等級(jí),以獲得解量化的預(yù)測(cè)系數(shù)殘差信號(hào);對(duì)預(yù)測(cè) 濾波器系數(shù)進(jìn)行預(yù)測(cè),并將其與所述解量化的預(yù)測(cè)系數(shù)殘差信號(hào)相加; 以及通過(guò)重轉(zhuǎn)換,將所述相加產(chǎn)生的重構(gòu)的預(yù)測(cè)系數(shù)殘差信號(hào)轉(zhuǎn)換為 預(yù)測(cè)濾波器系數(shù)。
40. 如權(quán)利要求39所述的設(shè)備,其中,所述用于確定預(yù)測(cè)濾波器 系數(shù)的裝置(224)被實(shí)現(xiàn)為使得以后向自適應(yīng)方式,基于己預(yù)測(cè)的預(yù)測(cè)系數(shù)來(lái)執(zhí)行所述預(yù)測(cè)。
41. 如權(quán)利要求39或40所述的設(shè)備,其中,所述用于確定預(yù)測(cè)濾波器系數(shù)的裝置(224)被實(shí)現(xiàn)為使得通過(guò)使用具有恒定系數(shù)的預(yù)測(cè)濾 波器來(lái)執(zhí)行對(duì)預(yù)測(cè)系數(shù)的預(yù)測(cè)。
42. 如權(quán)利要求39至41中任一項(xiàng)所述的設(shè)備,其中,所述用于確 定預(yù)測(cè)濾波器系數(shù)的裝置(224)還被實(shí)現(xiàn)為在重轉(zhuǎn)換之前,將所述 相加產(chǎn)生的重構(gòu)的預(yù)測(cè)系數(shù)殘差信號(hào)與常數(shù)值相減。
43. 如權(quán)利要求24至42中任一項(xiàng)所述的設(shè)備,所述設(shè)備被實(shí)現(xiàn)為 將音頻信號(hào)或視頻信號(hào)解碼為信息信號(hào),其中,所述心理感知引起的 閾值是聲學(xué)掩蔽閾值或視覺(jué)掩蔽閾值。
44. 一種用于將信息信號(hào)編碼為編碼信息信號(hào)的方法,包括 使用感知模型來(lái)確定心理感知引起的閾值的表示,所述表示指示了信息信號(hào)中與感知不相關(guān)的部分;對(duì)所述信息信號(hào)進(jìn)行濾波,以關(guān)于所述心理感知引起的閾值來(lái)對(duì) 信息信號(hào)進(jìn)行歸一化,以獲得預(yù)濾波信號(hào);以前向自適應(yīng)方式來(lái)預(yù)測(cè)所述預(yù)濾波信號(hào),以獲得預(yù)測(cè)信號(hào)、預(yù) 濾波信號(hào)的預(yù)測(cè)誤差以及預(yù)測(cè)系數(shù)的表示,基于預(yù)測(cè)信號(hào)、預(yù)濾波信 號(hào)的預(yù)測(cè)誤差以及預(yù)測(cè)系數(shù)的表示來(lái)重構(gòu)預(yù)濾波信號(hào);以及對(duì)所述預(yù)測(cè)誤差進(jìn)行量化,以獲得量化預(yù)測(cè)誤差,其中,所述編 碼信息信號(hào)包括關(guān)于心理感知引起的閾值的表示、預(yù)測(cè)系數(shù)的表示以 及量化預(yù)測(cè)誤差的信息。
45. —種用于將編碼信息信號(hào)解碼為解碼信息信號(hào)的方法,所述 編碼信息信號(hào)包括關(guān)于心理感知引起的闞值的表示、預(yù)測(cè)系數(shù)的表示 以及量化預(yù)測(cè)誤差的信息,所述方法包括對(duì)量化預(yù)測(cè)誤差進(jìn)行解量化,以獲得解量化預(yù)測(cè)誤差; 基于所述預(yù)測(cè)系數(shù)來(lái)確定預(yù)測(cè)信號(hào);基于所述預(yù)測(cè)信號(hào)和所述解量化預(yù)測(cè)誤差來(lái)重構(gòu)預(yù)濾波信號(hào);以及對(duì)所述預(yù)濾波信號(hào)進(jìn)行濾波,以對(duì)關(guān)于所述心理感知引起的閾值 的歸一化進(jìn)行重轉(zhuǎn)換,以獲得解碼信息信號(hào)。
46. —種具有程序代碼的計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算 機(jī)上運(yùn)行時(shí),用于執(zhí)行如權(quán)利要求44或45所述的方法。
47. —種編碼器,包括 信息信號(hào)輸入(12);感知閾值確定器(26),其根據(jù)概率模型進(jìn)行操作,并具有與所 述信息信號(hào)輸入耦合的輸入以及感知閾值輸出;自適應(yīng)預(yù)濾波器(34),包括與所述信息信號(hào)輸入耦合的濾波器輸入、濾波器輸出、以及與所述感知閾值輸出耦合的適配控制輸入;前向預(yù)測(cè)系數(shù)確定器(36),包括與所述預(yù)濾波器輸出耦合的輸 入以及預(yù)測(cè)系數(shù)輸出;第一差分器(42),包括與所述預(yù)濾波器輸出耦合的第一差分器 輸入、第二差分器輸入以及差分器輸出;限幅/量化級(jí)(52),包括有限且恒定數(shù)目的量化等級(jí)、與所述 差分器輸出耦合的輸入、量化步長(zhǎng)控制輸入、以及輸出;步長(zhǎng)調(diào)整器(54),包括與所述限幅/量化級(jí)(52)的輸出耦合的 輸入、以及與所述限幅/量化級(jí)(52)的步長(zhǎng)控制輸入耦合的量化步長(zhǎng) 輸出;解量化級(jí)(50),包括與所述限幅/量化級(jí)的輸出耦合的輸入、以 及解量化器控制輸出;加法器(48),包括與所述解量化器輸出耦合的第一加法器輸入、 第二加法器輸入、以及加法器輸出;預(yù)測(cè)濾波器(44、 46),包括與所述加法器輸出耦合的預(yù)測(cè)濾波 器輸入、與所述第二差分器輸入以及第二加法器輸入耦合的預(yù)測(cè)濾波 器輸出、以及與所述預(yù)測(cè)系數(shù)輸出耦合的預(yù)測(cè)系數(shù)輸入;信息信號(hào)產(chǎn)生器(24),包括與所述感知閾值輸出耦合的第一輸 入、與所述預(yù)測(cè)系數(shù)輸出耦合的第二輸入、與所述限幅/量化級(jí)的輸出 耦合的第三輸入、以及表示編碼器輸出的輸出。
48. —種用于將編碼信息信號(hào)解碼為解碼信息信號(hào)的解碼器,所述編碼信息信號(hào)包括關(guān)于心理感知引起的閾值的表示、預(yù)測(cè)系數(shù)以及量化預(yù)測(cè)誤差的信息,所述解碼器包括 解碼器輸入;提取器(214),包括與所述解碼器輸入耦合的輸入、感知閾值輸出、預(yù)測(cè)系數(shù)輸出以及量化預(yù)測(cè)誤差輸出;解量化器(206),包括有限且恒定數(shù)目的量化等級(jí)、與所述量化 預(yù)測(cè)誤差輸出連接的解量化輸入、解量化器輸出以及量化閾值控制輸 入;后向自適應(yīng)閾值調(diào)整器,包括與所述量化預(yù)測(cè)誤差輸出耦合的輸 入和與所述量化閾值控制輸入耦合的輸出;加法器(222),包括與所述解量化器輸出耦合的第一加法器輸入、 第二加法器輸入以及加法器輸出;預(yù)測(cè)濾波器(226),包括與所述加法器輸出耦合的準(zhǔn)確濾波器輸 入、與所述第二輸入耦合的預(yù)測(cè)濾波器輸出、以及與所述預(yù)測(cè)系數(shù)輸 出耦合的預(yù)測(cè)濾波器系數(shù)輸入;以及自適應(yīng)后濾波器(232),包括與所述加法器輸出耦合的預(yù)測(cè)濾波 器輸入、表示解碼器輸出的預(yù)測(cè)濾波器輸出、以及與所述感知閾值輸 出耦合的適配控制輸入。
全文摘要
通過(guò)不直接對(duì)預(yù)濾波信號(hào)進(jìn)行量化,而是對(duì)預(yù)濾波信號(hào)的前向自適應(yīng)預(yù)測(cè)所獲得的預(yù)測(cè)誤差進(jìn)行量化,在沒(méi)有或僅有非常小質(zhì)量損失的情況下,實(shí)現(xiàn)了超過(guò)掩蔽閾值所確定的度量的非常粗略的量化。由于前向自適應(yīng),量化誤差對(duì)解碼器側(cè)的預(yù)測(cè)沒(méi)有負(fù)面影響。
文檔編號(hào)G10L19/00GK101443842SQ200780017256
公開(kāi)日2009年5月27日 申請(qǐng)日期2007年2月28日 優(yōu)先權(quán)日2006年5月12日
發(fā)明者烏爾里?!た死啄? 延斯·希斯費(fèi)爾德, 斯特凡·瓦希尼克, 曼弗雷德·盧茨基, 格拉爾德·舒勒 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1