專利名稱:信號編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對信號進(jìn)行編碼,尤其是對音頻信號進(jìn)行編碼。
已知的音頻編碼方案使用了幀,這些幀包含了一組表示該幀涉及的時間間隔的音頻信號(分量)的值。至少某些幀涉及的是時間上具有重疊的時間間隔。為了實現(xiàn)低比特率,舉例來說,可以通過使用差分編碼技術(shù)來利用在連續(xù)時刻獲取的值之間的冗余度。
本發(fā)明的一個目的是提供有益的編碼。為此目的,本發(fā)明提供了獨立權(quán)利要求中定義的一種編碼方法、一種編碼器、一個比特流、一種存儲介質(zhì)、一種解碼方法、一種解碼器、一個發(fā)射機、一個接收機和一個系統(tǒng)。而有益的實施例則是在從屬權(quán)利要求中定義的。
本方法的第一方面提供的是信號編碼,所述編碼包括在信號的第一時間間隔中提供涉及后續(xù)時間的第一組值,在信號的第二時間間隔中提供涉及后續(xù)時間的第二組值,其中第一時間間隔(在時間上)與第二時間間隔存在重疊,所述重疊包含了第二間隔的至少兩個后續(xù)時間,其中對涉及處于重疊中的至少兩個后續(xù)時間的第二組的值來說,至少有一個值是根據(jù)第一組中的一個值來進(jìn)行編碼的,這個來自第一組的值在時間上比第二組中其他值更接近第二組中的所述至少一個值。通過根據(jù)第一組中在時間上比第二組中任何其他值都更接近第二組中至少一個值的值來對第二組中的所述至少一個值進(jìn)行編碼,可以更好地使用這些值中的冗余度。本發(fā)明的這個方面基于這樣一種理解,那就是在使用重疊的時間間隔的時候,在其他組中有一個值與一個時間相關(guān)聯(lián),所述時間相比第二組中可用的任何值都更接近將被編碼的第二組中的當(dāng)前值。由于這些值一般在時間上更為接近的時候也會更為相關(guān),因此通??梢允褂酶玫南嚓P(guān)性來對信號進(jìn)行更有效地編碼。
后續(xù)時間可以是時刻(或點)或小于所述時間間隔(例如涉及子幀)的時段。在時間上,第二時間間隔通常處于第一時間間隔之后,但也可以在所述第一時間間隔之前。
所述重疊時間不一定相等,相對第一時間間隔的時間而言,第二時間間隔的時間可以具有一個偏移。在所述時間是時刻的情況下,第一時間間隔中的后續(xù)時刻之間的時差未必等同于第二時間間隔中的后續(xù)時刻之間的時差。此外,如果所述時間是時段,那么在相應(yīng)的時間間隔內(nèi)部或是相對于另一個時間間隔而言,這些時段未必具有相同的長度。在優(yōu)選實施例中,對第一時間間隔或第二時間間隔來說,每一時間間隔中的時間量都是相同的,并且所述時間(實質(zhì)上)均勻分布在相應(yīng)的時間間隔上。
這組值可以包含在幀或子幀中。
盡管本發(fā)明適用于任何一種使用了涉及重疊時間間隔的幀和任何類型的值的編碼方案,但是非常有利的是,本發(fā)明適用于一種參量音頻編碼方案,其中舉例來說,所述值可以是音頻信號中的噪聲分量的增益。
本發(fā)明的這些和其他方面將從附圖中變得清楚并且將會根據(jù)附圖來說明本發(fā)明的這些和其他方面。
在附圖中
圖1顯示的是一個將涉及重疊時段的幀與常規(guī)編碼方法結(jié)合使用來對有關(guān)本發(fā)明的見解進(jìn)行描述的例圖;圖2顯示的是依照本發(fā)明第一實施例實施的編碼;圖3顯示的依照本發(fā)明的第二實施例實施的編碼;以及圖4顯示的依照本發(fā)明一個實施例的系統(tǒng)。
在這些附圖中只顯示了理解本發(fā)明實施例所需要的那些部件。圖中的數(shù)字表示的是指定的子幀中的值的序號,后續(xù)序號則涉及指定子幀所涉及的相應(yīng)時間間隔中的后續(xù)時間。
在一個優(yōu)選參量編碼方案中,輸入信號通常分解成瞬態(tài)信號分量、正弦信號分量和噪聲分量?,F(xiàn)在對WO01/69593-A1加以參考。表示正弦分量的參數(shù)通常選作幅度、頻率和相位。對瞬態(tài)分量來說,這種帶有包絡(luò)描述的參數(shù)擴展是瞬態(tài)分量的一種有效表示。就噪聲而言,對隨機噪聲發(fā)生器進(jìn)行控制的頻譜形狀和增益參數(shù)代表的是一個有效的參量表示。為了以足夠低的比特率來編碼這些參數(shù),在這里必須使用處于連續(xù)時刻上的這些參數(shù)之間的冗余度。舉例來說,在正弦分量的情況下,單個分量的振幅和頻率參數(shù)在時間上是緩慢變化的。因此對振幅和頻率中的變化進(jìn)行編碼是非常有益的。根據(jù)分析幀,可以對一個用于頻率和振幅的單獨參數(shù)進(jìn)行編碼。
在對噪聲進(jìn)行參數(shù)化的情況下,在每一個子幀上都得到了多個增益參數(shù)值,其中舉例來說,所述參數(shù)值數(shù)目可以是七個,每一個增益值都表示其涉及的子子幀之中的功率。在一個噪聲幀中包含了多個子幀。舉例來說,分析幀具有50%的重疊。這一點可以在圖1中看出。在實際實施例中,對每個子幀來說,子子幀的時段都具有相同或相似的長度。
由于增益參數(shù)的緩慢變化特性,在這里是通過對這些參數(shù)進(jìn)行差分編碼來使用冗余度的。為此目的,在這里將估計的增益參數(shù)按順序組織起來。接著則對所述差值進(jìn)行熵編碼。
...g(i-1,7) g(i,1)g(i,2)... g(i,6) g(i,7) g(i+1,1)g(i+1,2)... g(i+1,6) g(i+1,7)...
其中g(shù)(a,b)表示子幀a的第b個噪聲增益表示電平。最終,這些差分表示電平是使用霍夫曼表而被熵編碼的。
根據(jù)本發(fā)明的實施例,在這個增益參數(shù)實例中將估計的參數(shù)值組織起來,以便更好地使用所述冗余度。根據(jù)常規(guī)編碼,對比特流語法進(jìn)行簡單改變就可以在編碼效率方面帶來改進(jìn)。
方法1在參量編碼實例中,如下組織估計的噪聲增益(參見圖2)...g(i,3) g(i,4)g(i,5) g(i+1,1) g(i,6) g(i+1,2) g(i,7)g(i+1,3) g(i+1,4) g(i+1,5)...
優(yōu)選地,在這里以差分方式來對由此得到的增益參數(shù)序列進(jìn)行編碼。
方法2對參量編碼實例而言,已經(jīng)證實如下方法更為有效(參見圖3)步驟A)首先,對第i幀而言,將增益組織成g(i,3)g(i,4)g(i,5)g(i,6)g(i,7),然后對其進(jìn)行編碼(優(yōu)選使用差分方式)。
步驟B)然后則對g(i,5)g(i+1,1),g(i,6)g(i+1,2)以及g(i,7)g(i+1,3)這些對進(jìn)行編碼(優(yōu)選使用差分方式)。
方法3進(jìn)一步的研究顯示,這三個幀間差g(i+1,1)-g(i,5)、g(i+1,2)-g(i,6)以及g(i+1,3)-g(i)具有很大的相似性。因此,更為有效的是對這些差值的均值m進(jìn)行編碼,然后根據(jù)這個均值來對差值進(jìn)行編碼。由此意味著將平均差這個附加參數(shù)包含在比特流中。
作為不同方法的對比,考慮以下實例增益值 數(shù)值g(i,5) 12g(i,6) 16g(i,7) 8g(i+1,1)15g(i+1,2)20g(i+1,3)13對如上所述使用了差分編碼的不同方法而言,由此將會提供如下序列初始方法 方法1方法2 方法3........................
+4 (16-12)+3 (15-12)+4 (16-12)+4 (16-12)-8 (8-16) +1 (16-15)-8 (8-16) -8 (8-16)+7 (15-8) +4 (20-16)+3 (15-12)+4 (均值m*)+5 (20-5) -12(8-20) +4 (20-16)-1 (15-12-m)-7 (20-13)+5 (13-8) +5 (13-8) 0 (20-16-m)..................1 (13-8-m)*將均值m計算為((15-12)+(20-16)+(13-8)/3=4。
應(yīng)該注意的是,即使在方法3中添加了一個附加參數(shù),也可以對最終得到的序列進(jìn)行更有效的編碼。
在噪聲幀編碼的一個實際實施例中,每一個子幀定義或更新那些在于幀上保持恒定的濾波器參數(shù)。若干個后續(xù)增益參數(shù)值是根據(jù)每個子幀給出的,這些參數(shù)涉及的是與子幀相關(guān)的時間間隔中的后續(xù)時間。這些子幀在時間上重疊。而在這里則定義了一個刷新噪聲幀,所述幀是從一個包含了刷新濾波器參數(shù)的子幀開始的,其中所述刷新過濾器參數(shù)是作為絕對濾波器參數(shù)來編碼的。在其他子幀中,濾波器參數(shù)主要是以差分方式編碼的。
在一個優(yōu)選的實際實施例中使用了以下編碼策略對‘刷新幀’的第一子幀來說,第一噪聲增益是以絕對方式編碼的。而這個子幀的所有后續(xù)噪聲增益則是以差分方式編碼的。
對所有其他子幀而言,被編碼的是差值g(i+1,1)-g(i,5)而不是差值g(i+1,1)-g(i,5),由此使用了在相似時間實例分析的噪聲增益之間非常明顯的冗余度。此外還為g(i+1,2)和g(i+1,3)進(jìn)行了相同的處理。因此在這里分別對差值g(i+1,2)-g(i,6)、g(i+1,3)-g(i,7)而不是差值g(i+1,2)-g(i+1,1)、g(i+1,3)-g(i+1,2)進(jìn)行了編碼。
在更優(yōu)選的實施例中使用了以下編碼策略對‘刷新幀’的第一子幀來說,第一噪聲增益是以絕對方式編碼的。子幀的所有后續(xù)噪聲增益則以差分方式編碼。對任何其他子幀i+1來說,在這里將會計算差值g(i+1,1)-g(i,5)、g(i+1,2)-g(i,6)和g(i+1,3)-g(i,7)以及這些差值的平均值m(i+1)。其中首先將平均值m(i+1)編碼到比特流中,隨后跟隨的是差值g(i+1,1)-g(,5)-m(i+1)、g(i+1,2)-g(i,6)-m(i+1)以及g(i+1,3)-g(i,7)-m(i+1),它們表示的是相對于均值的差值。最終則將值g(i+1,4)-g(i+1,3)、g(i+1,5)-g(i+1,4)、g(i+1,6)-g(i+1,5)以及g(i+1,7)-g(i+1,6)編碼到比特流中。
除了一個刷新噪聲幀的第一子幀之外,首先還將重疊差值的平均值m(i+1)插入了代表濾波器的差分參數(shù)之后。緊接著在平均值m(i+1)之后,將相對于所述均值m(i+1)的差值插入比特流中。對那些不重疊的增益值來說,這些參數(shù)是以差分方式編碼的。這個實施例將會產(chǎn)生以下比特流語法
刷新噪聲幀的第一子幀(在上述實施例中為子幀i){刷新濾波器參數(shù)第一絕對增益值(例如g(i,1))差分編碼的其他的增益值(例如g(i,2)...g(i,7))}噪聲幀的其他子幀(刷新和不刷新)(例如以上實例中的子幀i+1){差分編碼的濾波器參數(shù)重疊差值的均值(例如m(i+1))重疊增益值相對于均值的差值差分編碼的非重疊增益值}優(yōu)選地,平均差分增益系數(shù)m(i+1)是通過使用霍夫曼表來編碼的。此外較為優(yōu)選的是,相對于均值m(i+1)的差值是通過使用一個霍夫曼表來編碼的。并且優(yōu)選的是,另一個差分噪聲參數(shù)也是通過使用一個霍夫曼表來編碼的。
在解碼器中,涉及重疊的子幀i+1的噪聲增益參數(shù)值是通過向子幀i的噪聲增益參數(shù)值中添加均值m(i+1)以及相應(yīng)的“相對于均值的差值”來獲取的,其中所述噪聲增益參數(shù)值被用作了參考值。舉例來說,在上述實例中(參見圖3),g(i+1,3)=g(i,7)+m(i+1)+[g(i+1,3)-g(i,7)-m(i+1)]。
特別地,對參量編碼來說非常重要的語音選錄也得益于本發(fā)明的實施例。本發(fā)明實施例所引起的附加的編碼器復(fù)雜性則是可以忽略的。
圖4顯示的根據(jù)本發(fā)明一個實施例的系統(tǒng)。該系統(tǒng)包括一個用于傳送或記錄編碼信號[S]的設(shè)備1。設(shè)備1包括用于接收信號S的輸入單元10,其中所述信號最好是一個音頻信號。輸入單元10可以是天線、麥克風(fēng)、網(wǎng)絡(luò)連接等等。設(shè)備1還包括一個編碼器11,所述編碼器依照本發(fā)明的上述實施例(特別參見圖2和3)來對信號S進(jìn)行編碼,以便獲取一個編碼信號。經(jīng)過編碼的信號提供到一個輸出設(shè)備12,該設(shè)備在具有適于經(jīng)由傳輸介質(zhì)或存儲介質(zhì)傳輸或存儲的比特流[S]中變換所述編碼音頻信號。所述系統(tǒng)還包括一個接收機或再現(xiàn)設(shè)備3,該設(shè)備在一個輸入單元30中接收編碼信號[S]。而所述輸入單元30則將編碼信號[S]提供到解碼器31。解碼器31則通過執(zhí)行一個解碼處理來對編碼信號進(jìn)行解碼,其中所述解碼處理是編碼器11中的編碼的逆運算。解碼器31將解碼信號S′提供到一個供應(yīng)解碼信號S′的輸出單元32。所述輸出單元32可以是一個再現(xiàn)單元,例如再現(xiàn)解碼信號S′的揚聲器。此外舉例來說,所述輸出單元32也可以是一個在非本地網(wǎng)絡(luò)及其他網(wǎng)絡(luò)上進(jìn)一步傳送所述解碼信號S′的發(fā)射機。
本發(fā)明實施例的應(yīng)用領(lǐng)域是因特網(wǎng)下載,因特網(wǎng)無線電廣播,固態(tài)音頻。
應(yīng)該指出的是,上述實施例是對本發(fā)明進(jìn)行描述而不是限制,本領(lǐng)域技術(shù)人員能在不脫離附加權(quán)利要求范圍的情況下設(shè)計出多種替換實施例。在權(quán)利要求中,括號中放置的任何參考符號都不應(yīng)視為是對權(quán)利要求進(jìn)行限制。單詞“包含”并不排除存在與權(quán)利要求中列舉的部件或步驟不同的其他部件或步驟。本發(fā)明可以借助包含了若干不同部件的硬件來實現(xiàn),也可以借助于適當(dāng)編程的計算機來實現(xiàn)。在一個枚舉了若干裝置的設(shè)備權(quán)利要求中,所述若干裝置可以由同一硬件實現(xiàn)。僅僅在互不相同的從屬權(quán)利要求中敘述了某些量度這個事實并不表明不能使用這些量度來使優(yōu)點突出。某些測量在互不相同的從屬權(quán)利要求中論述這個事實并不表示不能更有利地使用這些測量的組合。
權(quán)利要求
1.一種編碼信號的方法,所述方法包括在信號的第一時間間隔中提供涉及后續(xù)時間的第一組值;在信號的第二時間間隔中提供涉及后續(xù)時間的第二組值;所述第一時間間隔與第二時間間隔存在重疊,所述重疊包含了第二間隔的至少兩個后續(xù)時間,其中在第二組中與重疊的至少兩個后續(xù)時間相關(guān)的至少一個值是根據(jù)第一組中的一個值來進(jìn)行編碼的,所述第一組中的值在時間上比第二組中的任何其他值都更接近第二組的所述至少一個值。
2.權(quán)利要求1的方法,其中所述重疊包括第一時間間隔的至少兩個時間。
3.權(quán)利要求1的方法,其中g(shù)(i,b)是第一組i中的值并且g(i+1,b)是第二組i+1中的值,其中b表示指定組中的指定值的序號,而后續(xù)序號則涉及后續(xù)時間,所述重疊包括第二時間間隔的k個時間,其中第一組的值g(i,b)和第二組中的值g(i+1,b)是按照以下順序編碼的...g(i,n-k)g(i,n-k+1)g(i+1,1)g(i,n-k+2)g(i+1,2)...g(i,n)g(i+1,k)g(i+1,k+1)g(i+1,k+2)...其中n是第一組中的最大序號。
4.權(quán)利要求1的方法,其中g(shù)(i,b)是第一組i中的值并且g(i+1,b)是第二組i+1中的值,其中b表示指定組中的指定值的序號,而后續(xù)序號則涉及后續(xù)時間,所述重疊包括第二時間間隔的k個時間,其中所述編碼包括對序列...g(i,n-k)g(i,n-k+1)g(i,n-k+2)...g(i,n)進(jìn)行編碼對幀間差值g(i+1,1)-g(i,n-k+1)、g(i+1,2)-g(i,n-k+2)、......、g(i+1,k)-g(i,n)進(jìn)行編碼,其中n是第一組中的最高序號。
5.權(quán)利要求4的方法,其中將會確定幀間差值的平均值m(i+1)并且將相應(yīng)的幀間差值編碼成相對于所述均值的差值。
6.權(quán)利要求1的方法,其中重疊的第一時間間隔中的時間數(shù)量與重疊的第二時間間隔中的時間數(shù)量是相等的。
7.權(quán)利要求1的方法,其中所述值是相同類型的參數(shù)的值。
8.權(quán)利要求1的方法,其中所述值包含在相應(yīng)的幀或子幀中。
9.權(quán)利要求1的方法,其中所述編碼是一個差分編碼。
10.權(quán)利要求1的方法,其中所述信號是一個音頻信號。
11.權(quán)利要求10的方法,其中所述值是音頻信號中的噪聲分量的增益值。
12.一種用于對信號進(jìn)行編碼的編碼器,所述編碼器包括用于在信號的第一時間間隔中提供涉及后續(xù)時間的第一組值的裝置;用于在信號的第二時間間隔中提供涉及后續(xù)時間的第二組值的裝置;所述第一時間間隔與第二時間間隔存在重疊,所述重疊包含了第二間隔的至少兩個后續(xù)時間,所述設(shè)備還包括根據(jù)第一組中的一個值來對與重疊中的至少兩個后續(xù)時間相關(guān)的第二組中的至少一個值進(jìn)行編碼,其中所述第一組中的值在時間上比第二組中的任何其他值都更接近第二組的所述至少一個值。
13.一種表示經(jīng)過編碼的信號的比特流,所述比特流包括涉及第一時間間隔中的后續(xù)時間的第一組編碼值;涉及第二時間間隔中的后續(xù)時間的第二組編碼值;所述第一時間間隔與第二時間間隔存在重疊,所述重疊包含了第二間隔的至少兩個后續(xù)時間,其中第二組中與重疊的至少兩個后續(xù)時間相關(guān)的至少一個值是根據(jù)第一組中的一個值來進(jìn)行編碼的,所述第一組中的值在時間上比第二組中的任何其他值都更接近第二組的所述至少一個值。
14.一種存儲介質(zhì),其上保存了權(quán)利要求13所要求保護(hù)的比特流。
15.一種對表示編碼信號的比特流進(jìn)行解碼的方法,所述解碼包括在第一時間間隔中接收與后續(xù)時間有關(guān)的第一組編碼值;在第二時間間隔中接收與后續(xù)時間有關(guān)的第二組編碼信號;所述第一時間間隔與第二時間間隔存在重疊,所述重疊包含了第二間隔的至少兩個后續(xù)時間,其中第二組中與重疊相關(guān)的至少兩個后續(xù)時間中的至少一個值是根據(jù)第一組中的一個值來進(jìn)行編碼的,所述第一組中的值在時間上比第二組中的任何其他值都更接近第二組的所述至少一個值,所述解碼還包括對第一組值進(jìn)行解碼,以便獲取第一組解碼值,以及對第二組值進(jìn)行解碼,以便獲取第二組解碼值,其中與重疊中的至少兩個后續(xù)時間相關(guān)的第二組的至少一個值是根據(jù)第一組的值來解碼的,所述第一組的值在時間上比第二組中的任何其他值都更接近第二組中的所述至少一個值。
16.一種用于對表示編碼信號的比特流進(jìn)行解碼的解碼器,所述解碼器包括用于在第一時間間隔中接收與后續(xù)時間有關(guān)的第一組編碼值的裝置;用于在第二時間間隔中接收與后續(xù)時間有關(guān)的第二組編碼值的裝置;所述第一時間間隔與第二時間間隔存在重疊,所述重疊包含了第二間隔的至少兩個后續(xù)時間,其中第二組中與重疊中至少兩個后續(xù)時間相關(guān)的至少一個值是根據(jù)第一組中的一個值來進(jìn)行編碼的,所述第一組中的值在時間上比第二組中的任何其他值都更接近第二組的所述至少一個值,所述解碼還包括用于解碼第一組的值來獲取第一組解碼值的裝置,以及用于解碼第二組的值來獲取第二組解碼值的裝置,其中與重疊中的至少兩個后續(xù)時間相關(guān)的第二組的至少一個值是根據(jù)第一組的值來解碼的,所述第一組的值在時間上比第二組中的任何其他值都更接近第二組中的所述至少一個值。
17.一種發(fā)射機,包括一個輸入單元(10),用于接收一個信號,一個如權(quán)利要求12所述的編碼器(11),用于對信號(S)進(jìn)行編碼,以便獲取一個經(jīng)過編碼的信號([S]),以及一個輸出單元,用于提供一個代表所述經(jīng)過編碼的信號([S])的比特流。
18.一種接收機,包括一個輸入單元,用于接收一個代表經(jīng)過編碼的信號([S])的比特流,一個如權(quán)利要求16所述的解碼器(31),用于對經(jīng)過編碼的信號([S])進(jìn)行解碼,以便獲取一個經(jīng)過解碼的信號(S),以及一個提供解碼信號(S)的輸出單元(32)。
19.一種系統(tǒng),其中包含了如權(quán)利要求17所述的發(fā)射機以及如權(quán)利要求18所述的接收機。
全文摘要
在這里提供的是信號編碼,其中提供了涉及信號的第一組時間間隔中的后續(xù)時間的第一組值,并且提供了涉及信號的第二時間間隔中的后續(xù)時間的第二組值,所述第一時間間隔于第二時間間隔存在重疊,所述重疊包含了第二間隔的至少兩個后續(xù)時間,其中第二組中涉及重疊的至少兩個后續(xù)時間的至少一個值是根據(jù)第一組中的一個值來進(jìn)行編碼的,所述第一組中的值在時間上比第二組中的任何其他值都更接近第二組的所述至少一個值。
文檔編號G10L19/02GK1596434SQ02823826
公開日2005年3月16日 申請日期2002年11月13日 優(yōu)先權(quán)日2001年11月30日
發(fā)明者E·G·P·舒杰斯, A·W·J·奧門 申請人:皇家飛利浦電子股份有限公司