專利名稱:改善音頻信號(hào)編碼效率的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及如本發(fā)明附加權(quán)利要求1的前序所述的一種方法,用于改善音頻信號(hào)的編碼效率。本發(fā)明還涉及如附加權(quán)利要求21的一種數(shù)據(jù)傳輸系統(tǒng)、涉及如附加權(quán)利要求27前序部分的一種編碼器、涉及如附加權(quán)利要求30前序部分的一種解碼器、并涉及如附加權(quán)利要求38前序部分的一種解碼方法。
一般來(lái)說(shuō),音頻編碼系統(tǒng)從諸如象語(yǔ)音信號(hào)這樣的一種模擬音頻信號(hào)中產(chǎn)生出編碼信號(hào)。通常,借助于專用于某種數(shù)據(jù)傳輸系統(tǒng)的數(shù)據(jù)傳輸方法,將編碼信號(hào)傳送到一個(gè)接收機(jī)。在接收機(jī)中,音頻信號(hào)的產(chǎn)生是以編碼信號(hào)為基礎(chǔ)的。將要傳輸?shù)男畔⒘坷缡軐?duì)系統(tǒng)內(nèi)的信息進(jìn)行編碼所用的帶寬的影響,同時(shí)還受執(zhí)行編碼的編碼效率的影響。
為了編碼,例如以0.125ms的固定的時(shí)間間隔,從模擬信號(hào)中產(chǎn)生出數(shù)字采樣。通常,是以固定大小的組,例如是以具有大約20ms的間隔的組為單位來(lái)處理這些采樣的。這樣一組一組的采樣也被稱作“幀”。一般來(lái)說(shuō),幀是處理音頻數(shù)據(jù)的基本單位。
音頻編碼系統(tǒng)的目的在于產(chǎn)生在可用帶寬內(nèi)盡可能好的一種音質(zhì)。為此,可以利用音頻信號(hào)內(nèi),特別是語(yǔ)音信號(hào)內(nèi)出現(xiàn)的周期性。語(yǔ)音的周期性例如是源于聲帶的振動(dòng)。通常,振動(dòng)的周期處于2ms到20ms的級(jí)別內(nèi)。在已有技術(shù)的眾多語(yǔ)音編碼器中,使用了已知的一種長(zhǎng)期預(yù)測(cè)(LTP)的技術(shù),其目的是估計(jì)并利用這種周期性,以提高編碼處理的效率。這樣,在編碼期間,將編碼信號(hào)的所述部分(幀)與該信號(hào)的在先編碼部分相比較。如果一個(gè)相似的信號(hào)位于在先編碼部分,則檢驗(yàn)該相似編碼與將要編碼的信號(hào)之間的時(shí)間延遲(滯后)。以該相似信號(hào)為基礎(chǔ),構(gòu)成表示將要編碼的信號(hào)的一個(gè)預(yù)測(cè)信號(hào)。另外,還產(chǎn)生了一個(gè)誤差信號(hào),它表示預(yù)測(cè)信號(hào)和將要編碼的信號(hào)之間的差異。這樣,非常方便地執(zhí)行了編碼,使得只傳送滯后信息和誤差信號(hào)。在接收機(jī)內(nèi),從存儲(chǔ)器中檢索出正確采樣,用于對(duì)將要編碼的信號(hào)部分進(jìn)行預(yù)測(cè),并基于滯后,與誤差信號(hào)進(jìn)行組合。在算術(shù)上,這種間距預(yù)測(cè)器可被看作執(zhí)行了一種濾波操作,它可以由以下傳輸函數(shù)來(lái)表示
P(z)=βZ-α上述等式表示一階間距預(yù)測(cè)器的傳輸函數(shù)。β是間距預(yù)測(cè)器的系數(shù),α是周期性的延遲。在更高階的間距預(yù)測(cè)濾波器的情況下,有可能使用更一般的傳輸函數(shù)P(z)=Σk=-m1mnβkZ-(z+k)]]>其目的是以這樣一種方式,為每一幀選取系數(shù)βk,使得編碼誤差,即實(shí)際信號(hào)與利用在先采樣構(gòu)成的信號(hào)之間的差異,盡可能地小。能非常方便地選出編碼時(shí)所使用的這些系數(shù),這些系數(shù)使得在使用最小二乘法時(shí),可以獲取最小誤差。能非常方便地一幀一幀地更新這些系數(shù)。
美國(guó)專利No.5,528,629公開(kāi)了一種已有的語(yǔ)音編碼系統(tǒng),它采用了短期預(yù)測(cè)(STP),同時(shí)還有一階長(zhǎng)期預(yù)測(cè)。
已有的編碼器具有這樣一種缺陷沒(méi)有注意到音頻信號(hào)的頻率與其周期性之間的關(guān)系。這樣,不能在所有狀態(tài)下,有效利用信號(hào)的周期性,從而編碼信息量變得不必要地長(zhǎng),或接收機(jī)中所重建的音頻信號(hào)的音質(zhì)惡化。
在某些情況下,例如,當(dāng)音頻信號(hào)具有高度的周期特性,并很少隨時(shí)間變化時(shí),單獨(dú)的滯后信息就可提供一個(gè)良好的主要部分,用于信號(hào)預(yù)測(cè)。在這種情況下,沒(méi)有必要使用高階間距預(yù)測(cè)器。在某些其它情況下,也存在相反的情形。滯后不必是采樣間隔的整數(shù)倍。例如,滯后可以位于音頻信號(hào)的兩個(gè)連續(xù)采樣之間。在這種情況下,高階間距預(yù)測(cè)器可以有效地內(nèi)插在多個(gè)離散采樣時(shí)間之間,以提供對(duì)信號(hào)的更精確的表示。另外,作為頻率的函數(shù),高階間距預(yù)測(cè)器的頻率響應(yīng)趨于減小。這意味著高階間距預(yù)測(cè)器為音頻信號(hào)內(nèi)的低頻分量提供了較好的模型。在語(yǔ)音編碼中,由于與高頻分量相比,低頻分量對(duì)語(yǔ)音信號(hào)的可覺(jué)察的品質(zhì)具有更重要的影響,因而上述高階間距預(yù)測(cè)器是一種優(yōu)勢(shì)。因此,應(yīng)當(dāng)理解,非常需要的是能依據(jù)信號(hào)的演化,而改變用于預(yù)測(cè)音頻信號(hào)的間距預(yù)測(cè)器的階數(shù)。采用固定階的間距預(yù)測(cè)器在某些情況下過(guò)于復(fù)雜,同時(shí)也不能充分模擬其它情況下的音頻信號(hào)。
本發(fā)明的一個(gè)目的是在數(shù)據(jù)傳輸系統(tǒng)內(nèi)實(shí)現(xiàn)一種方法,用于改善音頻信號(hào)的編碼精度和傳輸效率,與已有技術(shù)的方法相比,在本發(fā)明中,音頻信號(hào)被編碼到一個(gè)更高的精度,并以更高的效率被傳輸。在依據(jù)本發(fā)明的編碼器中,其目的是盡可能精確地對(duì)將要編碼的音頻信號(hào)一幀一幀地預(yù)測(cè),同時(shí),確保所要傳輸?shù)男畔⒘勘3譃榈?。依?jù)本發(fā)明的方法的特征在于附加權(quán)利要求1的特征部分所述的內(nèi)容。依據(jù)本發(fā)明的數(shù)據(jù)傳輸系統(tǒng)的特征在于附加權(quán)利要求21的特征部分所述的內(nèi)容。依據(jù)本發(fā)明的編碼器的特征在于附加權(quán)利要求27的特征部分所述的內(nèi)容。依據(jù)本發(fā)明的解碼器的特征在于附加權(quán)利要求30的特征部分所述的內(nèi)容。此外,依據(jù)本發(fā)明的解碼方法的特征在于附加權(quán)利要求38的特征部分所述的內(nèi)容。
與已有的解決方案相比,本發(fā)明具有相當(dāng)大的優(yōu)勢(shì)。與已有技術(shù)的方法相比,依據(jù)本發(fā)明的方法使得能更有效地對(duì)音頻信號(hào)進(jìn)行編碼,同時(shí)確保表示編碼信號(hào)所需的信息量保持為低。與已有技術(shù)的方法相比,本發(fā)明還允許以更靈活的方式來(lái)執(zhí)行對(duì)音頻信號(hào)的編碼。可以以這樣一種方式實(shí)現(xiàn)本發(fā)明,該方式特別考慮了對(duì)音頻信號(hào)進(jìn)行預(yù)測(cè)的精度(質(zhì)量上最高),特別考慮了減少表達(dá)編碼音頻信號(hào)所需的信息量(數(shù)量最少),或交替使用這兩種方法。使用依據(jù)本發(fā)明的方法,有可能更好地考慮存在于音頻信號(hào)內(nèi)的不同頻率的周期性。
以下,將參照附圖,詳細(xì)說(shuō)明本發(fā)明,其中
圖1顯示了依據(jù)本發(fā)明一個(gè)最佳實(shí)施例的一種編碼器,圖2顯示了依據(jù)本發(fā)明一個(gè)最佳實(shí)施例的一種解碼器,圖3是一種簡(jiǎn)化框圖,該圖顯示了依據(jù)本發(fā)明一個(gè)最佳實(shí)施例的一種方法,圖4是一個(gè)流程圖,它顯示了依據(jù)本發(fā)明一個(gè)最佳實(shí)施例的一種方法,以及圖5a和5b是由依據(jù)本發(fā)明一個(gè)最佳實(shí)施例的編碼器所產(chǎn)生的數(shù)據(jù)傳輸幀的例子。
圖1是一個(gè)簡(jiǎn)化框圖,它顯示了依據(jù)本發(fā)明一個(gè)最佳實(shí)施例的編碼器1。圖4是一個(gè)流程圖400,它說(shuō)明了依據(jù)本發(fā)明的方法。編碼器1例如可以是無(wú)線通信設(shè)備2(圖3)的語(yǔ)音編碼器,用于將音頻信號(hào)轉(zhuǎn)換為將要在數(shù)據(jù)傳輸系統(tǒng)中傳送的編碼信號(hào),這種數(shù)據(jù)傳輸系統(tǒng)例如可以是移動(dòng)通信網(wǎng)或互聯(lián)網(wǎng)。這樣,就可以非常方便地將解碼器33安裝在移動(dòng)通信網(wǎng)的基站內(nèi)。與此相對(duì)應(yīng),如果需要,可以在模擬-數(shù)字轉(zhuǎn)換器4內(nèi),將模擬音頻信號(hào),例如是由麥克風(fēng)29產(chǎn)生并在音頻單元30內(nèi)放大的一個(gè)信號(hào),轉(zhuǎn)換為數(shù)字信號(hào)。轉(zhuǎn)換精度例如為8或12比特,連續(xù)采樣之間的間隔(時(shí)間分辨率)例如是0.125ms。很明顯,本說(shuō)明書(shū)中所出現(xiàn)的數(shù)值僅僅是用于說(shuō)明本發(fā)明的例子,并不能限制本發(fā)明。
所獲得的來(lái)自音頻信號(hào)的采樣,被存儲(chǔ)在采樣緩沖器(未示出)中,可以用這樣一種已知方式來(lái)實(shí)現(xiàn)存儲(chǔ),例如可以存儲(chǔ)在無(wú)線通信設(shè)備2的存儲(chǔ)裝置5中。可以以逐幀為基礎(chǔ),來(lái)執(zhí)行音頻信號(hào)的編碼,這樣,預(yù)定數(shù)目的采樣被傳送到將要執(zhí)行編碼的編碼器1,所述預(yù)定數(shù)目的采樣例如可以是20ms的時(shí)間段(=160個(gè)采樣,假定連續(xù)采樣之間的時(shí)間間隔為0.125ms)內(nèi)所產(chǎn)生的采樣。將要編碼的一幀的采樣被很方便地傳送到變換單元6,在該單元內(nèi),例如可以借助于一種改進(jìn)的離散余弦變換(MDCT),將音頻信號(hào)從時(shí)域變換到一個(gè)變換域(頻域)。變換單元6的輸出提供了一組值,這些值表示被變換信號(hào)在頻域內(nèi)的特性。在圖4的流程圖中,由方框404表示這種變換。
將時(shí)域信號(hào)變換到頻域的另一種實(shí)現(xiàn)手段,是由幾個(gè)帶通濾波器組成的濾波器組。每一個(gè)濾波的通帶相當(dāng)窄,其中,這些濾波器輸出端上的信號(hào)幅度表示所要變換的信號(hào)的頻譜。
滯后單元7確定在指定時(shí)刻,哪個(gè)在先采樣序列與將要編碼的幀最匹配(方框402)。很方便以這樣一種方式來(lái)實(shí)現(xiàn)這一級(jí)的滯后的確定,滯后單元7將存儲(chǔ)在基準(zhǔn)緩沖器8內(nèi)的值與將要編碼的幀的采樣進(jìn)行比較,并利用例如可以是最小二乘法,來(lái)計(jì)算將要編碼的幀的采樣與基準(zhǔn)緩沖器內(nèi)存儲(chǔ)的相應(yīng)的采樣序列之間的誤差。最好是,選擇由連續(xù)采樣構(gòu)成、并具有最小誤差的采樣序列,作為采樣的基準(zhǔn)序列。
當(dāng)滯后單元7從所存儲(chǔ)的采樣中選出采樣的基準(zhǔn)序列時(shí)(方框403),滯后單元7將與之有關(guān)的信息傳送到系數(shù)計(jì)算單元9,以便對(duì)間距預(yù)測(cè)系數(shù)進(jìn)行估計(jì)。這樣,在系數(shù)計(jì)算單元9中,就以采樣基準(zhǔn)序列內(nèi)的采樣為基準(zhǔn),對(duì)不同的間距預(yù)測(cè)器的階,例如是1,3,5和7,計(jì)算間距預(yù)測(cè)系數(shù)b(k)。之后,所計(jì)算出的系數(shù)b(k)被傳送到間距預(yù)測(cè)單元10。在圖4的流程圖中,這些階段被顯示在方框405-411內(nèi)。很明顯,這里所出現(xiàn)的階數(shù)僅僅是舉例,用于說(shuō)明本發(fā)明,而不是限制本發(fā)明,可實(shí)施的階數(shù)也可以與本文中所出現(xiàn)的四種階數(shù)完全不同。
在計(jì)算出間距預(yù)測(cè)系數(shù)之后,對(duì)其進(jìn)行量化,這樣就獲得了經(jīng)量化的間距預(yù)測(cè)系數(shù)。最好以這樣一種方式對(duì)間距預(yù)測(cè)系數(shù)進(jìn)行量化,使得在無(wú)誤差數(shù)據(jù)傳輸條件下,接收機(jī)解碼器33內(nèi)所產(chǎn)生的重建信號(hào)盡可能地接近原始信號(hào)。在對(duì)間距預(yù)測(cè)系數(shù)進(jìn)行量化時(shí),使用最高分辨率(可能是最小的量化階距)是非常有利的,以便能使舍入誤差最小。
在采樣基準(zhǔn)序列內(nèi)的存儲(chǔ)采樣被傳送到間距預(yù)測(cè)單元10,在該單元中,利用所計(jì)算出的、并經(jīng)量化的間距預(yù)測(cè)系數(shù)b(k),為每一個(gè)間距預(yù)測(cè)階數(shù)產(chǎn)生了一個(gè)預(yù)測(cè)信號(hào)。每一個(gè)預(yù)測(cè)信號(hào)代表對(duì)將要編碼的信號(hào)的預(yù)測(cè),它是利用所討論的間距預(yù)測(cè)階數(shù)而估計(jì)出的。在發(fā)明的當(dāng)前最佳實(shí)施例中,預(yù)測(cè)信號(hào)還被傳送到第二變換單元11,在該第二變換單元內(nèi),這些數(shù)據(jù)被變換到頻域。第二變換單元11利用兩個(gè)或更多不同的階,來(lái)執(zhí)行變換,其中,產(chǎn)生了與利用不同的間距預(yù)測(cè)階數(shù)而預(yù)測(cè)出的信號(hào)相應(yīng)的成組的變換值??梢砸赃@樣一種方式來(lái)實(shí)現(xiàn)間距預(yù)測(cè)單元10以及第二變換單元11,使得它們對(duì)每個(gè)間距預(yù)測(cè)階執(zhí)行必要的操作,或者是,對(duì)每一階,實(shí)現(xiàn)單獨(dú)的一個(gè)間距預(yù)測(cè)單元10和單獨(dú)的一個(gè)第二變換單元11。
在計(jì)算單元12中,將預(yù)測(cè)信號(hào)經(jīng)頻域變換后的值,與所得到的來(lái)自變換單元6的、將要編碼的音頻信號(hào)經(jīng)頻域變換后的表示法進(jìn)行比較。通過(guò)獲取將要編碼的音頻信號(hào)頻譜與利用間距預(yù)測(cè)器所預(yù)測(cè)出的信號(hào)頻譜之間的差異,而計(jì)算出一個(gè)預(yù)測(cè)誤差信號(hào)。非常有利的是,預(yù)測(cè)誤差信號(hào)包括一組預(yù)測(cè)誤差值,該組預(yù)測(cè)誤差值與將要編碼的信號(hào)頻率分量和預(yù)測(cè)信號(hào)的頻率分量之間的差相對(duì)應(yīng)。例如可以用音頻信號(hào)的頻譜與預(yù)測(cè)信號(hào)的頻譜之間的平均差來(lái)表示的編碼誤差,也被計(jì)算出來(lái)。最好是,利用最小二乘法來(lái)計(jì)算編碼誤差??梢允褂萌魏纹渌线m的方法,包括以音頻信號(hào)的心理聲學(xué)模型為基礎(chǔ)的方法,來(lái)確定能最好地表達(dá)將要編碼的音頻信號(hào)的預(yù)測(cè)信號(hào)。
在單元12中,還對(duì)編碼效率度量(預(yù)測(cè)增益)進(jìn)行了計(jì)算,以便確定將要傳送給傳輸信道的信息(方框413)。其目的是使所需傳送的信息量(比特)最小(數(shù)量最小),同時(shí)也使信號(hào)內(nèi)的失真最小(質(zhì)量最高)。
為了能以存儲(chǔ)在接收設(shè)備內(nèi)的預(yù)先采樣為基礎(chǔ),在接收機(jī)內(nèi)重建信號(hào),必須向接收機(jī)傳送與階、滯后相關(guān)的信息、與預(yù)測(cè)誤差相關(guān)的信息,例如是用于所選階的、經(jīng)量化的間距預(yù)測(cè)系數(shù)。非常有利的是,編碼效率度量指出是否有可能利用比傳送與原始信號(hào)有關(guān)的信息更少數(shù)目的比特,來(lái)傳送對(duì)在間距預(yù)測(cè)單元10中經(jīng)過(guò)編碼的信號(hào)進(jìn)行解碼所需的信息。例如,可以以這樣一種方式來(lái)實(shí)現(xiàn)這種判定,使得如果解碼所必需的信息是利用特定的間距預(yù)測(cè)器來(lái)產(chǎn)生的,則第一基準(zhǔn)值被定義為表示將要傳送的信息量。另外,如果解碼所必需的信息是以原始音頻信號(hào)為基礎(chǔ)形成的,則將第二基準(zhǔn)值定義為表示所要傳送的信息量。編碼效率度量剛好是第二基準(zhǔn)值與第一基準(zhǔn)值的比值。表達(dá)預(yù)測(cè)信號(hào)所需的比特?cái)?shù)目,例如可以取決于間距預(yù)測(cè)器的階數(shù)(即將要傳送的系數(shù)的數(shù)目)、每個(gè)系數(shù)所表示的(被量化的)精度、還有與預(yù)測(cè)信號(hào)相關(guān)的誤差信息的量和精度。另一方面,傳送與原始音頻信號(hào)相關(guān)的信息所需的比特?cái)?shù)目,例如可以取決于音頻信號(hào)在頻域內(nèi)的精度。
如果以這種方式所確定的編碼效率大于壹,則表示可以利用比與原始信號(hào)相關(guān)的信息少的比特?cái)?shù),來(lái)傳送對(duì)預(yù)測(cè)信號(hào)進(jìn)行解碼所必需的信息。在計(jì)算單元12中,對(duì)于這兩種不同選擇的傳送,確定它們所需的比特?cái)?shù)目,并選出所需比特?cái)?shù)目較小的那個(gè)方案(方框414)。
依據(jù)本發(fā)明的第一實(shí)施例,選擇用于獲取最小編碼誤差的間距預(yù)測(cè)器的階,對(duì)音頻信號(hào)進(jìn)行編碼(方框412)。如果用于所選間距預(yù)測(cè)器的編碼效率度量大于壹,則選擇與預(yù)測(cè)信號(hào)相關(guān)的信息,用于傳輸。如果編碼效率信息不大于壹,則將要傳送的信息是依據(jù)原始音頻信號(hào)構(gòu)成的。依據(jù)本發(fā)明的這個(gè)實(shí)施例,重點(diǎn)在于使預(yù)測(cè)誤差最小(品質(zhì)最高)。
依據(jù)本發(fā)明的第二個(gè)有益的實(shí)施例,為每一個(gè)間距預(yù)測(cè)器的階,計(jì)算其編碼效率度量。從那些編碼效率度量大于壹的階中,選取一個(gè)能提供最小編碼誤差的間距預(yù)測(cè)器的階,用于對(duì)音頻信號(hào)進(jìn)行編碼。如果沒(méi)有一個(gè)預(yù)測(cè)編碼器的階能夠提供一個(gè)預(yù)測(cè)增益(即沒(méi)有編碼效率度量大于壹),則可以依據(jù)原始音頻信號(hào),而形成將要傳送的信息。本發(fā)明的這一實(shí)施例使得在預(yù)測(cè)誤差和編碼效率之間進(jìn)行了折中。
依據(jù)本發(fā)明的第三實(shí)施例,為每個(gè)間距預(yù)測(cè)器的階,計(jì)算編碼效率度量,從那些其編碼效率度量大于壹的階中,選出能提供最大編碼效率的階,對(duì)音頻信號(hào)進(jìn)行編碼。如果沒(méi)有一個(gè)間距預(yù)測(cè)器的階能提供一個(gè)預(yù)測(cè)增益(即沒(méi)有一個(gè)編碼效率度量大于壹),則所要傳送的信息的構(gòu)成,是以原始音頻信號(hào)為基礎(chǔ)的。這樣,本發(fā)明的這個(gè)實(shí)施例的著眼點(diǎn)在于,使編碼效率最高(數(shù)量最小)。
依據(jù)本發(fā)明的第四實(shí)施例,為每個(gè)間距預(yù)測(cè)器的階,計(jì)算編碼效率度量,選出能提供最大編碼效率的階,對(duì)音頻信號(hào)進(jìn)行編碼,即便是沒(méi)有編碼效率大于壹。
對(duì)編碼誤差的計(jì)算以及與間距預(yù)測(cè)器的階的選擇是在每幀之間的間隙執(zhí)行的,并且,最好是為每一幀分別執(zhí)行上述操作,其中,在不同的幀內(nèi),有可能使用與指定時(shí)間處的音頻信號(hào)特性最相符的間距預(yù)測(cè)階數(shù)。
如上所述,如果在單元12內(nèi)所確定的編碼效率不大于壹,這表示傳送原始信號(hào)的頻譜非常有利,其中,將要傳送到數(shù)據(jù)傳輸信道的位串501是以下述方式構(gòu)成的(方框415)。在來(lái)自計(jì)算單元12的、與所選傳輸相關(guān)的信息被傳送到選擇單元13(圖1中的線D1和D4)。在選擇單元13中,經(jīng)頻域變換的表示原始音頻信號(hào)的值被選出,傳送到量化單元14。對(duì)于將原始音頻信號(hào)經(jīng)過(guò)頻域變換后的值傳送到量化單元14這一過(guò)程,是由圖1的框圖中的線A1所表示的。在量化單元14中,以所述方式對(duì)經(jīng)過(guò)頻域變換的信號(hào)值進(jìn)行量化。量化值被傳送到多路復(fù)用單元15,在該單元中,形成了將要傳送的位串。圖5a和5b顯示了一種位串結(jié)構(gòu)的一個(gè)例子,它可以有利地應(yīng)用于本發(fā)明。與所選編碼方法相關(guān)的信息,被從計(jì)算單元12傳送到多路復(fù)用單元15(線D1和D3),在這里,位串是依據(jù)傳輸選擇而形成的。第一邏輯值,例如是邏輯0狀態(tài),被用作編碼方法信息502,以指明表示原始音頻信號(hào)的經(jīng)過(guò)頻域變換后的值是以所討論的位串的形式傳送的。除了編碼方法信息502外,這些值本身也以被量化到指定精度的位串的形式進(jìn)行傳輸。在圖5a中,將用于傳送這些值的字段標(biāo)以參考號(hào)503。每個(gè)位串中所傳送的值的數(shù)量,取決于采樣頻率,以及在一個(gè)時(shí)刻所檢驗(yàn)到的幀的長(zhǎng)度。在這種情況下,由于在接收機(jī)內(nèi),是依據(jù)位串501中所傳送的原始音頻信號(hào)的頻域內(nèi)的值,來(lái)重建信號(hào)的,因此,不傳送間距預(yù)測(cè)器的階信息、間距預(yù)測(cè)系數(shù)、滯后以及誤差信息。
如果編碼效率大于壹,則可以很方便是使用所選的間距預(yù)測(cè)器,對(duì)音頻信號(hào)執(zhí)行編碼,并可以以下述方式(方框416),形成將要傳送到數(shù)據(jù)傳輸信道的位串501(圖5b)。與所選傳輸選擇相關(guān)的信息,被從計(jì)算單元12傳送到選擇單元13。這一過(guò)程,是由圖1的方框中的線D1和D4來(lái)表示的。在選擇單元13中,選取經(jīng)量化的間距預(yù)測(cè)系數(shù),將其傳送到多路復(fù)用單元15。這一過(guò)程由圖1框圖內(nèi)的線B1來(lái)表示。很明顯,也可以不通過(guò)選擇單元13,而使用另一條路徑,將間距預(yù)測(cè)系數(shù)傳送到多路復(fù)用單元15。將要傳送的位串是在多路復(fù)用單元15內(nèi)形成的。與所選編碼方法有關(guān)的信息,被從計(jì)算單元12傳送到多路復(fù)用單元15(線D1和D3),其中,是依據(jù)傳輸選擇而形成位串的。第二邏輯值,例如是邏輯1狀態(tài),被用作編碼方法信息502,以表明是以所討論的位串的形式,傳送所述經(jīng)量化的間距預(yù)測(cè)系數(shù)的。依據(jù)所選間距預(yù)測(cè)階數(shù),來(lái)設(shè)定一個(gè)階字段504的比特。如果,有可能有4個(gè)不同的階,則2比特(00,01,10,11)足以表明在指定時(shí)間,選擇了哪一階。另外,以位串的形式,將有關(guān)滯后的信息傳送到滯后字段505內(nèi)。在這個(gè)最佳實(shí)施例中,使用了11比特來(lái)表示滯后,但很明顯,也可以使用本發(fā)明范圍內(nèi)的其它長(zhǎng)度。經(jīng)量化的間距預(yù)測(cè)系數(shù)被添加到系數(shù)字段506內(nèi)的位串中。如果所選的間距預(yù)測(cè)器的階為1,則只傳送1個(gè)系數(shù),如果階為3,則傳送3個(gè)系數(shù)等等。在不同的實(shí)施方案中,也可以改變傳輸系數(shù)時(shí)所使用的比特?cái)?shù)。在一個(gè)有利的實(shí)施例中,一階系數(shù)是用3比特來(lái)表示的,3階系數(shù)是由總計(jì)5比特來(lái)表示的,5階系數(shù)是用總計(jì)9比特來(lái)表示的,而7階系數(shù)是由10比特來(lái)表示的。一般來(lái)說(shuō),可以這樣認(rèn)為,所選的階越高,則傳送經(jīng)量化的間距預(yù)測(cè)系數(shù)所需的比特?cái)?shù)越多。
除了前述信息之外,當(dāng)基于所選間距預(yù)測(cè)器,對(duì)音頻信號(hào)進(jìn)行編碼時(shí),必須傳送誤差字段507內(nèi)的預(yù)測(cè)誤差信息。這個(gè)預(yù)測(cè)誤差信息是在計(jì)算單元12內(nèi)作為一個(gè)差信號(hào)而產(chǎn)生的,該差信號(hào)表示了將要編碼的音頻信號(hào)的頻譜與可被解碼(即重建)的信號(hào)頻譜之間的差,其中所述解碼,利用了所選的間距預(yù)測(cè)器的經(jīng)量化的間距預(yù)測(cè)系數(shù),同時(shí)還利用了采樣的基準(zhǔn)序列。這樣,誤差信號(hào)例如可以經(jīng)由第一選擇單元13,被傳送到量化單元14,接受量化。經(jīng)量化的誤差信號(hào),被從量化單元14傳送到多路復(fù)用單元15,其中量化預(yù)測(cè)誤差值被添加到位串的誤差字段507。
依據(jù)本發(fā)明的編碼器1還包括本機(jī)解碼功能。經(jīng)編碼的音頻信號(hào),被從量化單元14傳送到反量化單元17。如上所述,在編碼效率不大于1的情況下,音頻信號(hào)由其量化頻譜值來(lái)表示。在這種情況下,量化頻譜值被傳送到反量化單元17,在該單元中,以所述的已知方式,對(duì)這些值去量化,使得盡可能精確地還原音頻信號(hào)的原始頻譜。所提供的表示原始音頻信號(hào)的頻譜的去量化值,作為一個(gè)輸出,從單元17輸出到求和單元18。
如果編碼效率大于1,則以間距預(yù)測(cè)信息來(lái)表示音頻信號(hào),這種間距預(yù)測(cè)信息例如可以是表現(xiàn)為量化頻域值的間距預(yù)測(cè)器的階信息、量化的間距預(yù)測(cè)系數(shù)、滯后值以及預(yù)測(cè)誤差信息。如上所述,預(yù)測(cè)誤差信息表示將要編碼的音頻信號(hào)頻譜與可依據(jù)所選間距預(yù)測(cè)器以及采樣的基準(zhǔn)序列而重建的音頻信號(hào)的頻譜之間的差異。因此,在這種情況下,包含預(yù)測(cè)誤差信息的量化頻域值,被傳送到反量化單元17,在該單元中,上述值被去量化,使得盡可能精確地還原預(yù)測(cè)誤差的頻域值。這樣,單元17的輸出包括去量化的預(yù)測(cè)誤差值。這些值被進(jìn)一步輸入到求和單元18,在該單元中,將這些值與利用所選間距預(yù)測(cè)器預(yù)測(cè)的信號(hào)的頻域值相加。以這種方式,就形成了所重建的原始音頻信號(hào)的頻域表示。從計(jì)算單元12中,可得到預(yù)測(cè)信號(hào)的頻域值,在該計(jì)算單元中,聯(lián)系預(yù)測(cè)誤差的確定,對(duì)這些頻域值進(jìn)行計(jì)算,并將它們傳送到求和單元18,正如圖1中的線C1所指示的那樣。
根據(jù)由計(jì)算單元12所提供的控制信息,來(lái)選通(接通和斷開(kāi))求和單元18的操作。允許這一選通操作的控制信息的傳輸,是由計(jì)算單元12和求和單元18之間的連接(圖1中的線D1和D2)來(lái)指示的。選通操作是必需的,以便考慮由反量化單元17所提供的不同類型的去量化頻域值。如上所述,如果編碼效率不大于1,則單元17的輸出包括表示原始音頻信號(hào)的去量化頻域值。在這種情況下,不再需要求和操作,不再需要在計(jì)算單元12內(nèi),構(gòu)建與任何預(yù)測(cè)音頻信號(hào)的頻域值相關(guān)的信息。在這種情況下,來(lái)自計(jì)算單元12的控制信息禁止求和單元18的操作,表示原始音頻信號(hào)的去量化頻域值通過(guò)求和單元18。另一方面,如果編碼效率大于1,單元17的輸出包含去量化預(yù)測(cè)誤差值。在這種情況下,有必要將去量化預(yù)測(cè)誤差值與預(yù)測(cè)信號(hào)的頻譜相加,以便構(gòu)成一個(gè)重建的原始音頻信號(hào)的頻域表示?,F(xiàn)在,來(lái)自計(jì)算單元12的控制信息允許求和單元12執(zhí)行操作,這使得去量化預(yù)測(cè)誤差值與預(yù)測(cè)信號(hào)的頻譜相加。必要控制信息是由編碼方法信息提供的,而該編碼方法信息是在單元12內(nèi),聯(lián)系對(duì)音頻信號(hào)所采用的編碼的選擇,而產(chǎn)生的。
在本發(fā)明的另一個(gè)實(shí)施例中,可以在計(jì)算預(yù)測(cè)誤差和編碼效率值之前進(jìn)行量化,其中預(yù)測(cè)誤差和編碼效率的計(jì)算的執(zhí)行,是利用了表示原始信號(hào)和預(yù)測(cè)信號(hào)的量化頻域值。量化是在單元6和12以及單元11和12之間的量化單元(未示出)中執(zhí)行的。在這一實(shí)施例中,不需要量化單元14,但在線C1所指使的路徑中,需要額外的去量化單元。
求和單元18的輸出,是與采樣的編碼序列(音頻信號(hào))相應(yīng)的經(jīng)采樣的頻域數(shù)據(jù)。在改進(jìn)的DCT逆變換器19內(nèi),進(jìn)一步將該經(jīng)采樣的頻域數(shù)據(jù)變換到時(shí)域,在變換器19內(nèi),采樣編碼序列被傳送到將要存儲(chǔ)的基準(zhǔn)緩沖器8內(nèi),并在與對(duì)后續(xù)幀進(jìn)行編碼的相關(guān)之處使用??梢砸罁?jù)所討論的、獲取使用的編碼效率需要所必需的采樣數(shù)目,來(lái)選擇基準(zhǔn)緩沖器8的存儲(chǔ)容量,在基準(zhǔn)緩沖器8中,最好通過(guò)改寫(xiě)緩沖器內(nèi)最舊的采樣,而存儲(chǔ)一個(gè)新的采樣序列,即該緩沖器是一個(gè)所謂的環(huán)行緩沖器。
編碼器1中所形成的位串被傳送到發(fā)送器16,在該發(fā)送器內(nèi),同樣以已知方式執(zhí)行調(diào)制。調(diào)制信號(hào)經(jīng)由數(shù)據(jù)傳輸信道3,被傳送到接收器,例如可以作為一個(gè)射頻信號(hào)。非常方便的是,可以在對(duì)一個(gè)指定幀進(jìn)行的編碼結(jié)束之后,立即逐幀傳送編碼音頻信號(hào)?;蛘咭部梢?,對(duì)音頻信號(hào)進(jìn)行編碼,并將其存儲(chǔ)在發(fā)送端的存儲(chǔ)器內(nèi),在之后的某個(gè)時(shí)刻進(jìn)行傳送。
在接收設(shè)備31中,在接收單元20內(nèi),同樣以已知方式,對(duì)所接收的來(lái)自數(shù)據(jù)傳輸信道的信號(hào)進(jìn)行解調(diào)。對(duì)解調(diào)數(shù)據(jù)幀內(nèi)所包含的信息的確定,是在解碼器33內(nèi)執(zhí)行的。在解碼器33的信號(hào)分解單元21中,首先依據(jù)位串的編碼方法信息502,來(lái)檢驗(yàn)所接收到的信息是否是基于原始音頻信號(hào)而形成的。如果解碼器確定出,編碼器1中所形成的位串501,不包括原始信號(hào)的頻域變換值,則按以下方式執(zhí)行解碼。由階字段504確定出間距預(yù)測(cè)單元24中所使用的階M,由滯后字段505確定出滯后。位串501的系數(shù)字段506內(nèi)所接收的量化間距預(yù)測(cè)系數(shù)、同時(shí)還有與階和滯后相關(guān)的信息,都被傳送到解碼器的間距預(yù)測(cè)單元24。這一過(guò)程用圖2中的線B2來(lái)表示。在位串的字段507中所接收到的預(yù)測(cè)誤差信號(hào)的量化值,在去量化單元22內(nèi)被去量化,并被傳送到解碼器的求和單元23。依據(jù)滯后信息,解碼器的間距預(yù)測(cè)單元24從采樣緩沖器8中,搜索用作基準(zhǔn)序列的采樣,并基于所選的階M,執(zhí)行一個(gè)預(yù)測(cè),間距預(yù)測(cè)單元24依據(jù)該階M而使用所接收到的間距預(yù)測(cè)系數(shù)。因此,產(chǎn)生了第一重建的時(shí)域信號(hào),它在變換單元25內(nèi),被變換到頻域。該頻域信號(hào)被傳送到求和單元23,在該求和單元中,產(chǎn)生了作為該頻域信號(hào)與去量化的預(yù)測(cè)誤差信號(hào)之和的一個(gè)頻域信號(hào)。這樣,在無(wú)誤差數(shù)據(jù)傳輸條件下,重建的頻域信號(hào)充分與頻域內(nèi)的原始編碼信號(hào)相對(duì)應(yīng)。借助于逆變換單元26內(nèi)的改進(jìn)的DCT逆變換,將這一頻域信號(hào)變換到時(shí)域,結(jié)果,數(shù)字音頻信號(hào)出現(xiàn)在逆變換單元26的輸出端。在數(shù)字/模擬轉(zhuǎn)換器27中,將這一信號(hào)轉(zhuǎn)換為模擬信號(hào),如果需要還可將其放大,并按照同樣是已知的方式,將其傳送到其它更多的處理級(jí)中。這一點(diǎn)已由圖3中的音頻單元32所表示。
如果編碼器1內(nèi)形成的位串501包括變換到頻域的原始信號(hào)的值,則以以下方式執(zhí)行解碼。量化的頻域變換值在去量化單元22內(nèi)被去量化,并經(jīng)由求和單元23,被傳送到擬變換單元。在逆變換單元26內(nèi),借助于改進(jìn)的DCT逆變換,將頻域信號(hào)變換到時(shí)域,其中,以數(shù)字格式,產(chǎn)生了了與原始音頻信號(hào)相應(yīng)的時(shí)域信號(hào)。如果需要,可在數(shù)字/模擬轉(zhuǎn)換器27內(nèi),將這一信號(hào)轉(zhuǎn)換為模擬信號(hào)。
圖2中,標(biāo)記A2顯示了控制信號(hào)傳輸?shù)角蠛蛦卧?3。以這樣一種方式使用這種控制信息,這種方式與所描述的有關(guān)的編碼器的本機(jī)解碼器的功能相似。換言之,如果所接收的位串501的字段502中所提供的編碼方法信息表明位串包含由音頻信號(hào)自身導(dǎo)出的量化頻域值,則禁止求和單元23的操作。這使得音頻信號(hào)的量化頻域值能夠通過(guò)求和單元23,到達(dá)逆變換單元26。另一方面,如果從所接收的位串的字段503中檢索出的編碼方法信息表明對(duì)音頻信號(hào)的編碼使用了間距預(yù)測(cè)器,則允許求和單元23的操作,這使得去量化的預(yù)測(cè)誤差數(shù)據(jù)能與變換單元25所產(chǎn)生的預(yù)測(cè)信號(hào)的頻域表示法相加。
在圖3所示的例子中,發(fā)送設(shè)備是一個(gè)無(wú)線通信設(shè)備2,接收設(shè)備是一個(gè)基站31,其中,在基站31的解碼器33中,對(duì)從無(wú)線通信設(shè)備2發(fā)射出的信號(hào)進(jìn)行解碼,在解碼器33中,模擬音頻信號(hào)同樣被以已知方式傳送到更多的處理級(jí)中。
很明顯,在本例中,僅出現(xiàn)了應(yīng)用本發(fā)明所必需的特征,但在實(shí)際應(yīng)用中,數(shù)據(jù)傳輸系統(tǒng)還包括本文所出現(xiàn)的特征以外的一些功能。也有可能使用與依據(jù)本發(fā)明的編碼相關(guān)的其它編碼方法,例如短期預(yù)測(cè)。此外,當(dāng)發(fā)送依據(jù)本發(fā)明進(jìn)行編碼的信號(hào)時(shí),也可以執(zhí)行其它的處理步驟,例如信道編碼。
還可以在時(shí)域內(nèi),確定預(yù)測(cè)信號(hào)與實(shí)際信號(hào)之間的一致性。這樣,在本發(fā)明的另一個(gè)實(shí)施例中,就不需要將信號(hào)變換到頻域,這樣就不再需要變換單元6、11,也不再需要編碼器的逆變換單元19,同時(shí)還有解碼器的變換單元25以及逆變換單元26。這樣,就可基于時(shí)域信號(hào),來(lái)確定編碼效率和預(yù)測(cè)誤差。
先前說(shuō)說(shuō)明的音頻信號(hào)編碼/解碼級(jí)可應(yīng)用于各種不同的數(shù)據(jù)傳輸系統(tǒng),例如移動(dòng)通信系統(tǒng)、衛(wèi)星TV系統(tǒng)、視頻需求(video on demand)系統(tǒng)等。例如,對(duì)于全雙工發(fā)送音頻信號(hào)的移動(dòng)通信系統(tǒng),在無(wú)線通信設(shè)備2和基站31或類似設(shè)備中,需要一個(gè)編碼器/解碼器對(duì)。在圖3的框圖中,無(wú)線通信設(shè)備2和基站31的相應(yīng)功能的單元被標(biāo)記有相同的參考號(hào)。盡管圖3中,編碼器1和解碼器33表現(xiàn)為分立單元,但在實(shí)際應(yīng)用中,可以將它們實(shí)現(xiàn)于同一個(gè)單元內(nèi),即所謂的編解碼器,在該編解碼器中,可執(zhí)行編碼和解碼所必需的所有操作。如果在移動(dòng)通信系統(tǒng)中,以數(shù)字格式發(fā)送音頻信號(hào),則在基站中,就不再需要模擬/數(shù)字轉(zhuǎn)換以及數(shù)字/模擬轉(zhuǎn)換。這樣,就會(huì)在通過(guò)其,而使移動(dòng)通信網(wǎng)連接到另一種電通信網(wǎng)的無(wú)線通信設(shè)備以及接口內(nèi),執(zhí)行這種變換,其中所述另一種無(wú)線電通信網(wǎng)例如是公共電話網(wǎng)。但是,如果該電話網(wǎng)是數(shù)字電話網(wǎng),那么,也可以在例如是與這種電話網(wǎng)相連的一個(gè)數(shù)字電話(未示出)內(nèi),執(zhí)行這種變換。
在有關(guān)傳輸中,前述編碼級(jí)不是非有不可的,但但可以存儲(chǔ)編碼信息,用于后續(xù)傳輸。此外,加到編碼器上的音頻信號(hào)不必一定是一個(gè)實(shí)時(shí)音頻信號(hào),但對(duì)于將要編碼的音頻信號(hào),可以從該音頻信號(hào)的早期開(kāi)始,對(duì)其進(jìn)行信息存儲(chǔ)。
以下,將用數(shù)學(xué)方法來(lái)描述依據(jù)本發(fā)明一個(gè)實(shí)施例的不同的編碼B(z)=Σk=-m1m2b(k)z-(α+k)......(1)]]>級(jí)。間距預(yù)測(cè)單元的傳輸函數(shù)具有以下形式其中α是滯后,b(k)是間距預(yù)測(cè)器的系數(shù),m1和m2取決于于階(M),它們被表示如下m1=(M-1)/2m2=M-m1-1有利的是,最相符的采樣序列(即基準(zhǔn)序列)的確定,是利用了最小二乘法。這可以表示如下E=Σi=0N-1(x(i)-Σj=-m1m2b(j)x~(i+j-α))2.....(2)]]>其中E=誤差,xO是時(shí)域中的輸入信號(hào), 是從采樣的在先序列中重建出的信號(hào),N是幀檢驗(yàn)中的采樣數(shù)??赏ㄟ^(guò)將變量設(shè)置為m1=0,m2=0,從而計(jì)算出滯后α,并從等式2中求解出b。求解出α的另一種方法是使用歸一化相關(guān)方法,通過(guò)利用等式 當(dāng)發(fā)現(xiàn)最相符的(基準(zhǔn))采樣序列時(shí),滯后單元7具有有關(guān)滯后的信息,即音頻信號(hào)中所出現(xiàn)的相符的采樣序列究竟提前了多少。
可由等式(2),計(jì)算出用于每種階(M)的間距預(yù)測(cè)系數(shù)b(k),可以以下形式重新表示等式(2)E=Σi=0N-1x(i)2-2·Σi=0N-1x(i)Σj=-m1m2b(j)x~(i+j-α)+Σi=0N-1(Σj=-m1m2b(j)x~(i+j-α))2....(4)]]>可通過(guò)搜尋誤差變化相對(duì)于b(k)為盡可能小的一個(gè)系數(shù)b(k),來(lái)確定系數(shù)b(k)的一個(gè)優(yōu)化值??赏ㄟ^(guò)將相對(duì)于b的誤差關(guān)系的偏導(dǎo)數(shù)設(shè)定為零(E/b=0),從而實(shí)現(xiàn)上述計(jì)算,其中實(shí)現(xiàn)了以下等式-2·Σi=0N-1x(i)Σj=-m1m2x~(i+j-α)+2·Σi=0N-1[(Σj=-m1m2b(j)x~(i+j-α))·Σj=-m1m2x~(i+j-α)]=0...(5)]]>即Σi=0N-1[Σj=-m1m2b(j)x~(i+j-α)·Σj=-m1m2x~(i+j-α)]=Σi=0N-1x(i)Σj=-m1m2x~(i+j-α)]]>可以以矩陣形式寫(xiě)出該等式,其中可通過(guò)對(duì)矩陣等式求解,從而b=A-1.r確定系數(shù)b(k)其中, 在依據(jù)本發(fā)明的方法中,其目的是比依據(jù)已有技術(shù)的系統(tǒng)更有效地利用音頻信號(hào)的周期性。可以通過(guò)對(duì)幾種階計(jì)算其間距預(yù)測(cè)系數(shù),來(lái)增強(qiáng)編碼器對(duì)音頻信號(hào)頻率內(nèi)改變的適應(yīng)性,從而實(shí)現(xiàn)這一點(diǎn)的。可以以這樣一種方式來(lái)選擇對(duì)音頻信號(hào)進(jìn)行編碼所使用的間距預(yù)測(cè)器的階,以便使預(yù)測(cè)誤差最小,使編碼效率最大,或交替使用預(yù)測(cè)誤差和編碼效率。這種選擇是在某些間隔處執(zhí)行的,最好為每幀單獨(dú)執(zhí)行這種選擇。這樣,可以一幀一幀地改變階和間距預(yù)測(cè)系數(shù)。這樣,與使用固定階的已有技術(shù)的編碼方法相比,在依據(jù)本發(fā)明的方法中,有可能提高編碼的適應(yīng)性。此外,在依據(jù)本發(fā)明的方法中,如果不能利用編碼來(lái)減小將要傳送給一個(gè)指定幀的信息量(比特?cái)?shù)),則可以發(fā)送變換到頻域的原始信號(hào),而不是間距預(yù)測(cè)系數(shù)和誤差信號(hào)。
依據(jù)本發(fā)明的方法中所使用的先前出現(xiàn)的計(jì)算步驟,可以以程序的形式來(lái)方便地實(shí)現(xiàn),以及/或以硬件形式來(lái)方便地實(shí)現(xiàn),所述程序可以表現(xiàn)為數(shù)字信號(hào)處理單元或類似單元內(nèi)的控制器34的程序代碼。依據(jù)本發(fā)明的上述說(shuō)明,本領(lǐng)域技術(shù)人員可以依據(jù)本發(fā)明而實(shí)現(xiàn)編碼器1,這樣,就不需要在本文中更詳細(xì)地討論編碼器1的不同功能的單元。
為了向接收機(jī)發(fā)送所述間距預(yù)測(cè)系數(shù),有可能使用所謂的查找表。在這種查找表中,存儲(chǔ)有不同的系數(shù)值,其中,發(fā)送的是查找表內(nèi)的該系數(shù)的索引,而不是該系數(shù)。編碼器1和解碼器33都知道這個(gè)查找表。在接收端,有可能通過(guò)使用查找表,從而依據(jù)所發(fā)送的索引,來(lái)確定所討論的間距預(yù)測(cè)系數(shù)。在某些情況下,與傳送間距預(yù)測(cè)系數(shù)相比,使用查找表,可以減少將要發(fā)送的比特?cái)?shù)。
本發(fā)明并不僅限于上述出現(xiàn)的幾個(gè)實(shí)施例,也不只限于其它幾個(gè)方面,但可以在附加權(quán)利要求書(shū)的范圍內(nèi),實(shí)現(xiàn)一些改進(jìn)。
權(quán)利要求
1.用于對(duì)音頻信號(hào)進(jìn)行編碼的方法,其特征在于至少執(zhí)行以下步驟——檢驗(yàn)將要編碼的音頻信號(hào)的一部分,以發(fā)現(xiàn)與將要編碼的音頻信號(hào)的該部分基本相符的音頻信號(hào)的另一部分,——基于所述音頻信號(hào)的基本相符部分,利用一組間距預(yù)測(cè)器的階,產(chǎn)生一組預(yù)測(cè)信號(hào),——對(duì)于所述預(yù)測(cè)信號(hào)中的至少一個(gè),確定一個(gè)編碼效率,以及——利用所確定的編碼效率,選取一種編碼方法,用于將要編碼的音頻信號(hào)的所述部分。
2.依據(jù)權(quán)利要求1的所述方法,其特征在于可選編碼方法包括這樣一種方法以一個(gè)預(yù)測(cè)信號(hào)為基礎(chǔ),對(duì)將要編碼的音頻信號(hào)進(jìn)行編碼。
3.依據(jù)權(quán)利要求2的所述方法,其特征在于可選編碼方法包括這樣一種方法以音頻信號(hào)自身為基礎(chǔ),對(duì)將要編碼的音頻信號(hào)進(jìn)行編碼。
4.依據(jù)權(quán)利要求1的所述方法,其特征在于為所述每一個(gè)預(yù)測(cè)信號(hào),確定一個(gè)編碼誤差。
5.依據(jù)權(quán)利要求4的所述方法,其特征在于對(duì)具有最小所述編碼誤差的預(yù)測(cè)信號(hào),確定一個(gè)編碼效率,其特征還在于如果所確定的編碼效率信息表明與依據(jù)將要編碼的音頻信號(hào)的所述部分而執(zhí)行編碼的情況相比,編碼信息量較小,則所述編碼是依據(jù)具有最小編碼誤差的預(yù)測(cè)信號(hào)而執(zhí)行。
6.依據(jù)權(quán)利要求5的所述方法,其特征在于將需編碼的音頻信號(hào)的所述部分變換到頻域,以確定音頻信號(hào)的頻譜,將每個(gè)預(yù)測(cè)信號(hào)變換到頻域,以確定每個(gè)預(yù)測(cè)信號(hào)的頻譜,其特征還在于依據(jù)所述音頻信號(hào)的頻譜,以及預(yù)測(cè)信號(hào)的頻譜,為具有最小編碼誤差的所述預(yù)測(cè)信號(hào),確定所述編碼效率。
7.依據(jù)權(quán)利要求1的所述方法,其特征在于為每個(gè)所述預(yù)測(cè)信號(hào),確定一個(gè)編碼效率,對(duì)那些所確定的編碼效率信息表示出以下信息的預(yù)測(cè)信號(hào),確定一個(gè)編碼誤差,并依據(jù)提供了最小編碼誤差的預(yù)測(cè)信息,而執(zhí)行編碼,其中所表示出的以下信息為與依據(jù)即將要編碼的音頻信號(hào)的所述部分而執(zhí)行編碼的情況相比,該編碼信息量較小。
8.依據(jù)權(quán)利要求1的方法,其特征在于為每個(gè)所述預(yù)測(cè)信號(hào),確定一個(gè)編碼效率,如果所確定的編碼效率表示與依據(jù)將要編碼的音頻信號(hào)的所述部分而執(zhí)行編碼相比,該編碼信息量較小,則以能提供最高編碼效率的預(yù)測(cè)信號(hào)為基礎(chǔ),執(zhí)行編碼。
9.依據(jù)權(quán)利要求1的所述方法,其特征在于為每個(gè)所述預(yù)測(cè)信息,確定一個(gè)編碼效率,并以能提供最高編碼效率的預(yù)測(cè)信號(hào)為基礎(chǔ),執(zhí)行編碼。
10.依據(jù)權(quán)利要求7、8或9的方法,其特征在于將需編碼的音頻信號(hào)的所述部分變換到頻域,以確定所述音頻信號(hào)的頻譜,將每個(gè)預(yù)測(cè)信號(hào)變換到頻域,以確定每個(gè)預(yù)測(cè)信號(hào)的頻譜,其特征還在于以所述音頻信號(hào)的頻譜,以及預(yù)測(cè)信號(hào)的頻譜為基礎(chǔ),為每個(gè)預(yù)測(cè)信號(hào)確定所述編碼效率。
11.依據(jù)權(quán)利要求5、6、7、8或9的所述方法,其特征在于對(duì)每個(gè)所述預(yù)測(cè)信號(hào),確定其預(yù)測(cè)誤差信息。
12.依據(jù)權(quán)利要求5、6、7、8或9的所述方法,其特征在于所述預(yù)測(cè)信號(hào)的構(gòu)成,是對(duì)沒(méi)個(gè)所述預(yù)測(cè)信號(hào),使用了不同的預(yù)測(cè)階數(shù)。
13.依據(jù)權(quán)利要求6或10的所述方法,其特征在于為每個(gè)所述預(yù)測(cè)信號(hào)確定所述預(yù)測(cè)信息的計(jì)算,是利用的所述音頻信號(hào)的所述頻譜以及預(yù)測(cè)信號(hào)的所述頻譜,求得一個(gè)差值譜表示法,從而計(jì)算出的。
14.依據(jù)權(quán)利要求10或13的所述方法,其特征在于變換到頻域的這種變換,是利用了改進(jìn)的DCT變換而執(zhí)行的。
15.依據(jù)權(quán)利要求1到14中任何一個(gè)權(quán)利要求所述的方法,其特征在于預(yù)測(cè)信號(hào)的編碼信息(501)至少包括與編碼方法相關(guān)的數(shù)據(jù)(502)、與所選階(504)、滯后(505)、間距預(yù)測(cè)系數(shù)(506)相關(guān)的數(shù)據(jù)、以及與預(yù)測(cè)誤差相關(guān)的數(shù)據(jù)(507)。
16.依據(jù)權(quán)利要求1到15中任何一個(gè)權(quán)利要求所述的方法,其特征在于所述音頻信號(hào)被分為若干幀,其中編碼是對(duì)由音頻信號(hào)構(gòu)成的每一幀單獨(dú)執(zhí)行的。
17.依據(jù)權(quán)利要求1到16中任何一個(gè)權(quán)利要求所述的方法,其特征在于所述音頻信號(hào)是一個(gè)語(yǔ)音信號(hào)。
18.依據(jù)權(quán)利要求4到7中任何一個(gè)權(quán)利要求所述的方法,其特征在于是利用以下方法中的一種來(lái)確定所述編碼誤差的——最小二乘法;——基于對(duì)將要編碼的音頻信號(hào)創(chuàng)建心理聲學(xué)模型的一種方法。
19.依據(jù)權(quán)利要求18的所述方法,其特征在于如果是利用最小二乘法確定的所述編碼誤差,則由所述預(yù)測(cè)誤差,計(jì)算出所述編碼誤差。
20.依據(jù)權(quán)利要求1到19中任何一個(gè)權(quán)利更求所述的方法,其特征在于所述編碼的音頻信號(hào)被發(fā)送到接收設(shè)備。
21.包含對(duì)音頻信號(hào)進(jìn)行編碼的裝置(16,20)的一種數(shù)據(jù)傳輸系統(tǒng),其特征在于所述數(shù)據(jù)傳輸系統(tǒng)還包括——用于檢驗(yàn)將要編碼的音頻信號(hào)的一部分,以發(fā)現(xiàn)與將要編碼的該音頻信號(hào)的所述部分基本相符的音頻信號(hào)的另一部分的裝置(7,8),——利用一組間距預(yù)測(cè)器的階,以依據(jù)所述音頻信號(hào)的基本相符部分,產(chǎn)生一組預(yù)測(cè)信號(hào)的裝置(9,10),——為所述預(yù)測(cè)信號(hào)中的至少一個(gè),確定編碼效率的裝置(12),——利用所確定的編碼效率,為將要編碼的音頻信號(hào)的所述部分選取一種編碼方法的裝置(12,13,14),以及——用于發(fā)送編碼音頻信號(hào)的裝置(16)。
22.依據(jù)權(quán)利要求21的數(shù)據(jù)傳輸系統(tǒng),其特征在于它包括用于為所述預(yù)測(cè)信號(hào)中的至少一個(gè),確定一個(gè)編碼誤差的裝置。
23.依據(jù)權(quán)利要求21的數(shù)據(jù)傳輸系統(tǒng),其特征在于它包括將需編碼的音頻信號(hào)的所述部分變換到頻域的裝置,以及將每個(gè)預(yù)測(cè)信號(hào)變換到頻域的裝置。
24.依據(jù)權(quán)利要求21的數(shù)據(jù)傳輸系統(tǒng),其特征在于它包括形成一個(gè)位串(15),以便發(fā)送到一個(gè)接收設(shè)備的裝置,所述位串至少包括與所選編碼方法相關(guān)的信息。
25.依據(jù)權(quán)利要求21到24中任何一個(gè)權(quán)利要求的數(shù)據(jù)傳輸系統(tǒng),其特征在于它包括用于將所述音頻信號(hào)分為若干幀的裝置。
26.依據(jù)權(quán)利要求21到24中任何一個(gè)權(quán)利要求的數(shù)據(jù)傳輸系統(tǒng),其特征在于它包括一個(gè)移動(dòng)終端。
27.包括對(duì)一個(gè)音頻信號(hào)進(jìn)行編碼的裝置(16,20)的一個(gè)編碼器(1),其特征在于該編碼器包括——用于對(duì)將要編碼的音頻信號(hào)的一部分進(jìn)行檢驗(yàn),以發(fā)現(xiàn)與將要編碼的音頻信號(hào)的所述部分基本相符的音頻信號(hào)的另一部分的裝置(7),——使用一組間距預(yù)測(cè)器的階,以便依據(jù)所述音頻信號(hào)的基本相符部分,產(chǎn)生一組預(yù)測(cè)信號(hào)的裝置(9,10),——為至少一個(gè)所述預(yù)測(cè)信號(hào),確定一個(gè)編碼效率的裝置(12),以及——利用所確定的編碼效率,為將要編碼的音頻信號(hào)的所述部分選取一種編碼方法的裝置(12,13,14)。
28.依據(jù)權(quán)利要求27的一種編碼器(1),其特征在于它包括依據(jù)預(yù)測(cè)信號(hào),對(duì)音頻信號(hào)進(jìn)行編碼的裝置(4,6-14)。
29.依據(jù)權(quán)利要求28的編碼器(1),其特征在于它包括對(duì)音頻信號(hào)自身進(jìn)行編碼的裝置(4,6,14)。
30.用于對(duì)在依據(jù)權(quán)利要求27的編碼器內(nèi)進(jìn)行編碼的音頻信號(hào)進(jìn)行解碼的一種解碼器(33),其特征在于該解碼器包括對(duì)將要解碼的音頻信號(hào)的編碼方法進(jìn)行確定的裝置,以及依據(jù)所確定的解碼方法,對(duì)音頻信號(hào)進(jìn)行解碼的方法。
31.依據(jù)權(quán)利要求30的一種解碼器,其特征在于該解碼器包括接收與預(yù)測(cè)信號(hào)相關(guān)的信息的裝置(21)。
32.依據(jù)權(quán)利要求31的一種解碼器,其特征在于該解碼器包括依據(jù)所接收的信息,而產(chǎn)生一個(gè)預(yù)測(cè)信號(hào)的裝置(24,28)。
33.依據(jù)權(quán)利要求31或32的一種解碼器,其特征在于該解碼器包括從所接收到的信號(hào)中,至少確定出與所選階(504)、滯后(505)、至少一個(gè)間距預(yù)測(cè)系數(shù)(506)以及預(yù)測(cè)誤差數(shù)據(jù)(507)相關(guān)的數(shù)據(jù)的裝置(21)。
34.依據(jù)權(quán)利要求33的一種解碼器,其特征在于它包括使用與所選階(504)、滯后(505)、至少一個(gè)間距預(yù)測(cè)系數(shù)(506)相關(guān)的所述數(shù)據(jù),產(chǎn)生一個(gè)預(yù)測(cè)信號(hào)的裝置(24,28)。
35.依據(jù)權(quán)利要求33或34的一種解碼器,其特征在于它包括利用所述預(yù)測(cè)信號(hào)以及所述預(yù)測(cè)誤差數(shù)據(jù),產(chǎn)生一個(gè)重建的音頻信號(hào)的裝置(23,24,28)。
36.依據(jù)權(quán)利要求30的一種解碼器,其特征在于它包括用于接收與音頻信號(hào)自身相關(guān)的信息的裝置(21)。
37.依據(jù)權(quán)利要求36的一種解碼器,其特征在于它包括利用所述與音頻信號(hào)本身有關(guān)的接收信息,產(chǎn)生一個(gè)重建的音頻信號(hào)的裝置(22,23,26)。
38.對(duì)依據(jù)權(quán)利要求1的方法進(jìn)行編碼的音頻信號(hào)執(zhí)行解碼的一種方法,其特征在于對(duì)將要解碼的音頻信號(hào)的編碼方法進(jìn)行確定,并依據(jù)所確定的音頻信號(hào)的編碼方法,執(zhí)行解碼。
39.依據(jù)權(quán)利要求38的一種方法,其特征在于所述編碼方法是以下方法中的一種——利用一個(gè)指定階的間距預(yù)測(cè)器,對(duì)音頻信號(hào)進(jìn)行編碼的方法,——依據(jù)音頻信號(hào)自身,對(duì)音頻信號(hào)進(jìn)行編碼的方法。
全文摘要
本發(fā)明涉及用于改善音頻信號(hào)的編碼精度以及傳輸效率的方法。依據(jù)本發(fā)明,將要編碼的音頻信號(hào)的一部分與該音頻信號(hào)在先存儲(chǔ)的采樣進(jìn)行比較,確定出與所述音頻信號(hào)最相符的采樣基準(zhǔn)序列。通過(guò)長(zhǎng)期預(yù)測(cè),使用至少兩種不同的LTP階(M),以及用于每種間距預(yù)測(cè)階的一組間距預(yù)測(cè)系數(shù)(b(K)),從該基準(zhǔn)序列中產(chǎn)生出預(yù)測(cè)信號(hào)。將對(duì)預(yù)測(cè)信號(hào)進(jìn)行編碼所需的信息量與對(duì)原始信號(hào)進(jìn)行編碼所需的信息量進(jìn)行比較,并選取能最好地表示音頻信號(hào),同時(shí)能使所需數(shù)據(jù)量最小的一種編碼方法。
文檔編號(hào)G10L19/08GK1372683SQ00812488
公開(kāi)日2002年10月2日 申請(qǐng)日期2000年7月5日 優(yōu)先權(quán)日1999年7月5日
發(fā)明者J·奧延佩雷 申請(qǐng)人:諾基亞有限公司