亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

音頻編解碼方法及相編解碼器和計(jì)算機(jī)程序的制作方法

文檔序號(hào):2831790閱讀:187來源:國知局
專利名稱:音頻編解碼方法及相編解碼器和計(jì)算機(jī)程序的制作方法
專利說明音頻編解碼方法及相編解碼器和計(jì)算機(jī)程序 本發(fā)明涉及音頻信號(hào)的編碼裝置,特別適用于數(shù)字和壓縮音頻信號(hào)的存儲(chǔ)或傳輸場(chǎng)合下。
更準(zhǔn)確地,本發(fā)明涉及音頻分層編碼系統(tǒng),具有提供可變速率的容量,通過分配關(guān)于一個(gè)要在分層排列序列中編碼的聲音信號(hào)的信息,以使該信息可以被用于關(guān)于聲音質(zhì)量的重要性的次序。用于確定次序所考慮的標(biāo)準(zhǔn)是一個(gè)最優(yōu)化(或者最小劣化)編碼聲音信號(hào)質(zhì)量的標(biāo)準(zhǔn)。分層編碼特別適合于在異構(gòu)網(wǎng)絡(luò)間或者那些具有隨時(shí)間可變速率的網(wǎng)絡(luò)間的傳輸,或者也用于到具有不同或可變特性的終端的傳輸。
更具體地,本發(fā)明涉及3D聲音場(chǎng)景的分層編碼。3D聲音場(chǎng)景包括多個(gè)與單通道聲音信號(hào)相關(guān)的聲音信道,其也被認(rèn)為是空間化的聲音。
一個(gè)已編碼的聲音場(chǎng)景將被一個(gè)聲音再現(xiàn)系統(tǒng)再現(xiàn),該聲音再現(xiàn)系統(tǒng)可以包括一個(gè)簡單的聽筒,電腦的兩個(gè)喇叭或者一個(gè)具有五個(gè)喇叭的家庭影院5.1型系統(tǒng)(其中一個(gè)喇叭在屏幕的水平線上,在理論聽眾的前方一個(gè)喇叭在左側(cè)而另一個(gè)在右側(cè);在理論聽眾的后方一個(gè)喇叭在左側(cè)而另一個(gè)在右側(cè)),等等。
例如,考慮到一個(gè)原始聲音場(chǎng)景包括三個(gè)不同的聲源,位于空間的不同位置上。描述該聲音場(chǎng)景的信號(hào)被編碼。產(chǎn)生于該編碼的數(shù)據(jù)被傳送到解碼器,然后被解碼。解碼數(shù)據(jù)被用以產(chǎn)生五個(gè)信號(hào),用于聲音再現(xiàn)系統(tǒng)中的五個(gè)喇叭。五個(gè)喇叭中的每個(gè)播送其中的一個(gè)信號(hào),被喇叭播送的信號(hào)集合合成了3D聲音場(chǎng)景并且因此而在空間中定位了三個(gè)虛擬的聲源。
對(duì)聲音場(chǎng)景的編碼存在不同的技術(shù)。
例如,所使用的一種技術(shù)包括確定描述聲音場(chǎng)景的要素,接著進(jìn)行每一個(gè)單聲道信號(hào)的壓縮。產(chǎn)生于這些壓縮以及要素描述的數(shù)據(jù)接著被提供給解碼器。
依據(jù)上述第一種技術(shù)的數(shù)率適應(yīng)性(亦稱可縮放性)可以通過改變?cè)趬嚎s操作中的速率來獲取,但是它是通過單獨(dú)地考慮針對(duì)每一個(gè)的信號(hào)質(zhì)量的最優(yōu)化標(biāo)準(zhǔn)來獲得的。
另一種編碼技術(shù)包括從各種通道上的所有單聲道音頻信號(hào)提取并編碼空間參數(shù),所述編碼技術(shù)用于“MPEG音頻環(huán)繞”編碼器(參見“Text of ISO/IEC FDIS 23003-1,MPEG Surround”,ISO/IEC JTC1/SC29/WG11 N8324,July 2006,Klagenfurt,Austria,即“ISO/IEC FDIS 23003-1的文本,MPEG環(huán)繞”,ISO/IEC JTC1/SC29/WG11 N8324,2006年7月,克拉根福,奧地利)中。接著將這些信號(hào)混合以獲得單聲道或立體聲信號(hào),所述信號(hào)接著由常規(guī)單聲道或立體聲編碼器(例如,MPEG-4AAC、HE-AAC型,等等)壓縮。在解碼器層級(jí)處,由空間參數(shù)和經(jīng)解碼單聲道或立體聲信號(hào)來進(jìn)行3D聲音場(chǎng)景的合成。
使用此另一技術(shù),可因此通過使用分級(jí)單聲道或立體聲編碼器來實(shí)現(xiàn)速率適應(yīng)性,但它是根據(jù)用于最佳化單聲道或立體聲信號(hào)的質(zhì)量的準(zhǔn)則來進(jìn)行的。
另外,PSMAC(Progressive Syntax-Rich MultichannelAudio Codec,漸進(jìn)富語法多通道音頻編解碼器)方法使得能夠通過使用KLT變換(Karhunen Loeve Transform,卡洛變換)對(duì)來自各種通道的信號(hào)進(jìn)行編碼,KLT變換主要可用于信號(hào)的解相關(guān),且對(duì)應(yīng)于表示信號(hào)統(tǒng)計(jì)數(shù)據(jù)的空間中的主要分量分解。其使得有可能區(qū)別能量最多的分量與能量最少的分量。
速率適應(yīng)性是基于能量較少的分量的消除。盡管如此,這些成份有時(shí)對(duì)于聲音總體質(zhì)量來說具有重要意義。
因此,盡管已知技術(shù)在速率適應(yīng)性方面得到良好結(jié)果,但沒有一個(gè)能基于最優(yōu)化聲音總體質(zhì)量的標(biāo)準(zhǔn),提供完全滿意的速率適應(yīng)性的方法,且在還原解碼3D聲音場(chǎng)景過程中,針對(duì)定義的壓縮數(shù)據(jù)最優(yōu)化所感知的聲音總體質(zhì)量。
而且,已知的3D聲音場(chǎng)景編碼技術(shù)也沒有在還原3D聲音場(chǎng)景的過程中允許基于最優(yōu)化空間分辨率標(biāo)準(zhǔn)的速率適應(yīng)性。此適應(yīng)性將使得有可能保證速率的每一次減少都會(huì)盡可能少地?fù)p害空間中的聲音源的定位準(zhǔn)確度及再現(xiàn)區(qū)域的尺寸,該尺寸必須盡可能地寬以環(huán)繞聽眾的頭部。
此外,對(duì)于任何用于恢復(fù)3D聲音場(chǎng)景的聲音呈現(xiàn)系統(tǒng),已知3D聲音場(chǎng)景編碼技術(shù)均沒有使得能直接保證最佳質(zhì)量的速率適應(yīng)性成為可能。目前的編碼算法經(jīng)定義以最佳化相對(duì)于聲音再現(xiàn)系統(tǒng)的特定配置的質(zhì)量。事實(shí)上,在上述“MPEG音頻環(huán)繞”編碼器的情況下,舉例來說,用一耳機(jī)或兩個(gè)揚(yáng)聲器直接收聽、或單聲道收聽是可能的。如果希望用5.1或7.1型的聲音再現(xiàn)系統(tǒng)來處理經(jīng)壓縮位流,那么必須在解碼器層級(jí)處實(shí)施額外處理,例如借助于OTT(One-To-Two,一到二)盒,以便由兩個(gè)經(jīng)解碼信號(hào)產(chǎn)生五個(gè)或七個(gè)信號(hào)。這些盒使得能夠在5.1或7.1型的聲音再現(xiàn)系統(tǒng)的情況下獲得所需要數(shù)目的信號(hào),但不可能再現(xiàn)真實(shí)空間方面。此外,這些盒不保證對(duì)除了5.1或7.1型的聲音再現(xiàn)系統(tǒng)外的聲音再現(xiàn)系統(tǒng)的適應(yīng)性。
本發(fā)明旨在改善所述狀況。
為此,根據(jù)第一方面,本發(fā)明提出了一種用于對(duì)有待編碼的要素的頻譜成份進(jìn)行排序的方法,這些成份產(chǎn)生于一個(gè)包括N個(gè)信號(hào)的聲音場(chǎng)景,其中N>1,一個(gè)有待編碼的要素包括與各個(gè)不同頻帶相關(guān)的頻譜成份。
該方法包括以下步驟 -計(jì)算至少一些頻譜成份的各自影響,可以根據(jù)產(chǎn)生于N個(gè)信號(hào)中的至少一些的頻譜參數(shù)進(jìn)行計(jì)算,根據(jù)所述頻譜成份的編碼基于頻帶上的遮噪比確定; -根據(jù)針對(duì)所述頻譜成份所計(jì)算出的影響,與其他計(jì)算出的影響相比較,給至少一個(gè)頻譜成份分配優(yōu)先級(jí)次序。
因此,根據(jù)本發(fā)明的一種方法允許根據(jù)有待編碼的要素的成份的整體聲音質(zhì)量來安排重要性次序。
在整個(gè)場(chǎng)景的有待編碼的不同要素的不同頻譜成份進(jìn)行相互比較之后,構(gòu)造一個(gè)二進(jìn)制序列,關(guān)于它們對(duì)感知的整體聲音質(zhì)量的貢獻(xiàn)進(jìn)行相互比較。因此,為了將多個(gè)信號(hào)一起進(jìn)行壓縮,信號(hào)間的交互作用也因此得到考慮。
碼流可以這樣被排序,以使每一個(gè)速率的減少盡量小地降低3D聲音場(chǎng)景的感知整體聲音質(zhì)量,因?yàn)楦鶕?jù)它們對(duì)于整體聲音質(zhì)量水平的貢獻(xiàn),重要性最低的要素被檢測(cè),以便可以不把它們插入(當(dāng)分配給該傳輸?shù)乃俾什蛔阋园l(fā)送所有有待編碼的要素的成份時(shí))或者把它們置于二進(jìn)制序列的末端(使得由于切斷序列而產(chǎn)生的缺陷最小化成為可能)。
在一個(gè)實(shí)施例中,計(jì)算一個(gè)頻譜成份的影響通過以下步驟進(jìn)行 a-對(duì)根據(jù)第一速率編碼的有待編碼要素的頻譜成份的第一集合進(jìn)行編碼; b-確定每個(gè)頻帶的第一遮噪比; c-確定比所述第一速率低的第二速率; d-刪除有待編碼的要素中的所述通常頻譜成份,并對(duì)根據(jù)第二速率的有待編碼的要素的剩余頻譜成份進(jìn)行編碼; e-確定每個(gè)頻帶的第二遮噪比; f-根據(jù)對(duì)于每個(gè)頻帶的第一和第二速率的第一和第二遮噪比之間已確定的差別,計(jì)算遮噪比的變化; g-針對(duì)用于排序的有待編碼的要素的頻譜成份集合中的每一個(gè)頻譜成份迭代步驟d到f,并確定最小遮噪比的變化;分配給符合最小變化的頻譜成份的優(yōu)先級(jí)次序作為最小優(yōu)先級(jí)次序。
這樣一個(gè)過程使得確定有待編碼的要素的至少一個(gè)成份成為可能,根據(jù)對(duì)整體聲音質(zhì)量的貢獻(xiàn),與有待編碼用于排序的要素的其它成份的集合相比,該成份的重要性最低。
在一個(gè)實(shí)施例中,針對(duì)用于排序的有待編碼的要素的頻譜成份集合再重復(fù)步驟a到g,所述集合通過刪除已經(jīng)分配優(yōu)先級(jí)順序的頻譜成份而受到限制。
在另一個(gè)實(shí)施例中,針對(duì)用于排序的有待編碼的要素的頻譜成份集合再重復(fù)步驟a到g,其中已經(jīng)分配優(yōu)先級(jí)順序的頻譜成份在使用重疊量化器期間被分配了更低的量化值。
在一個(gè)實(shí)施例中,其中所述有待編碼的要素包括對(duì)于N個(gè)信號(hào)計(jì)算的頻譜參數(shù)。這些要素是例如被直接編碼的信號(hào)的頻譜成份。
在另一個(gè)實(shí)施例中,其中所述有待編碼的要素包括通過對(duì)于N個(gè)信號(hào)計(jì)算的頻譜參數(shù)進(jìn)行空間變換所得到的要素,例如環(huán)繞聲變換。一方面,這一安排使得減少要被發(fā)送的數(shù)據(jù)的數(shù)量成為可能,一般地,N個(gè)信號(hào)可以通過數(shù)量被減少的環(huán)繞聲成份而得到很好地描述(例如,數(shù)量等于3到5),小于N。該安排還允許適配至任何類型的聲音再現(xiàn)系統(tǒng),因?yàn)樗诮獯a側(cè)采用大小為Q′x(2p′+1)的逆環(huán)繞聲變換是足夠的,(其中Q′等于在解碼器輸出端所使用的聲音再現(xiàn)系統(tǒng)的喇叭數(shù)量,2p′+1等于所接收到的逆環(huán)繞聲成份的數(shù)量),以用于確定提供給聲音再現(xiàn)系統(tǒng)的信號(hào),同時(shí)保證整體信號(hào)質(zhì)量。
在一個(gè)實(shí)施例中,代替空間變換,使用其它線性變換例如KLT變換等。
在一個(gè)實(shí)施例中,根據(jù)因?yàn)榫幋a以及與有待編碼要素相關(guān)的誤差,空間變換矩陣以及依據(jù)所述空間變換矩陣的變換,確定所述遮噪比。
在一個(gè)實(shí)施例中,有待編碼的要素是環(huán)繞聲成份,頻譜成份中的一些是環(huán)繞聲成份的頻譜參數(shù)。該方法包括以下步驟 a.基于角度向量(angle vector)計(jì)算所述頻譜成份中的至少一些的影響,所述角度向量根據(jù)與葛容準(zhǔn)則(Gerzon criteria)相關(guān)的能量和速度向量(energy and velocity vectors)定義,并根據(jù)基于所述量化的環(huán)繞聲成份的逆環(huán)繞聲變換來計(jì)算; b.根據(jù)針對(duì)至少一個(gè)頻譜成份所計(jì)算的影響與其它計(jì)算所得的影響,為所述至少一個(gè)頻譜成份分配優(yōu)先級(jí)順序。
從而,根據(jù)本發(fā)明的方法使得,根據(jù)它們對(duì)于空間精度的貢獻(xiàn)的重要性,對(duì)有待排序的集合的環(huán)繞聲成份的至少一些頻譜參數(shù)進(jìn)行排序成為可能。
空間分辨率或空間準(zhǔn)確度度量了聲音源在空間中的位置的精細(xì)程度。增加的空間分辨率使聲音對(duì)象在房間中的更精細(xì)定位成為可能,且使收聽者頭部周圍更寬闊的恢復(fù)區(qū)域成為可能。
考慮信號(hào)之間的相互作用及其與空間準(zhǔn)確度有關(guān)的后果,以將它們一起進(jìn)行壓縮。
碼流可以這樣被排序,以使每一個(gè)速率的減少盡量小地降低3D聲音場(chǎng)景的感知整體聲音質(zhì)量,因?yàn)楦鶕?jù)它們對(duì)于整體聲音質(zhì)量水平的貢獻(xiàn),重要性最低的要素被檢測(cè),以便把它們置于二進(jìn)制序列的末端(使得由于切斷序列而產(chǎn)生的缺陷最小化成為可能)。
根據(jù)該方法的一個(gè)實(shí)施例,使用與葛容準(zhǔn)則的速度向量

和能量向量

有關(guān)的角度ξV和ξE,正如下文指出的,以便識(shí)別出有待編碼的要素中哪些與所考慮的對(duì)于3D聲音場(chǎng)景的空間精度的貢獻(xiàn)最低程度相關(guān)。因此,與慣常手段相反,速度向量

和能量向量

并不用于優(yōu)化所述聲音再現(xiàn)系統(tǒng)。
在一個(gè)實(shí)施例中,計(jì)算頻譜參數(shù)的影響是按照以下步驟實(shí)施的 a-對(duì)根據(jù)第一速率編碼的有待編碼的環(huán)繞聲成份的頻譜參數(shù)的第一集合進(jìn)行編碼; b-確定每個(gè)頻帶的第一角向量; c-確定比所述第一速率低的第二速率; d-刪除有待編碼的成份中的所述通常頻譜參數(shù),并對(duì)根據(jù)第二速率的有待編碼的成份的剩余頻譜參數(shù)進(jìn)行編碼; e-確定每個(gè)頻帶的第二角向量; f-根據(jù)對(duì)于每個(gè)頻帶的第一和第二速率的第一和第二角向量之間已確定的差別,計(jì)算角向量的變化; g-針對(duì)用于排序的有待編碼的成份的頻譜參數(shù)集合中的每一個(gè)頻譜參數(shù)迭代步驟d到f,并確定最小角向量的變化;分配給符合最小變化的頻譜參數(shù)的優(yōu)先級(jí)次序作為最小優(yōu)先級(jí)次序。
這一安排使得,通過有限次數(shù)的計(jì)算,確定所要確定的成份的頻譜參數(shù)成為可能,其對(duì)于空間精度的貢獻(xiàn)最小。
在一個(gè)實(shí)施例中,針對(duì)用于排序的有待編碼的成份的頻譜參數(shù)集合再重復(fù)步驟a到g,所述集合通過刪除已經(jīng)分配優(yōu)先級(jí)順序的頻譜參數(shù)而受到限制。
在另一個(gè)實(shí)施例中,針對(duì)用于排序的有待編碼的成份的頻譜參數(shù)集合再重復(fù)步驟a到g,其中已經(jīng)分配優(yōu)先級(jí)順序的頻譜參數(shù)在使用重疊量化器期間被分配了更低的量化值。
這樣一種迭代方法使得在還沒有分配優(yōu)先級(jí)順序的環(huán)繞聲成份的頻譜參數(shù)中連續(xù)識(shí)別出那些對(duì)于空間精度的貢獻(xiàn)最小的頻譜參數(shù)成為可能。
在一個(gè)實(shí)施例中,能量向量的第一坐標(biāo)符合函數(shù)公式

能量向量的第二坐標(biāo)符合函數(shù)公式

速度向量的第一坐標(biāo)符合函數(shù)公式

速度向量的第二坐標(biāo)符合函數(shù)公式

其中Ti,i=1到Q,代表基于根據(jù)所考慮的速率的所述量化頻譜參數(shù)的逆環(huán)繞聲變換所確定的信號(hào),ξi,i=1到Q是確定的角度。
在一個(gè)實(shí)施例中,角度向量的第一坐標(biāo)表示該角度是速度向量的第二坐標(biāo)的符號(hào)以及速度向量的第一坐標(biāo)的反余弦的函數(shù),并且,角度向量的第二坐標(biāo)表示該角度是能量向量的第二坐標(biāo)的符號(hào)以及能量向量的第一坐標(biāo)的反余弦的函數(shù)。
根據(jù)本發(fā)明的第二方面,本發(fā)明提出了一種用于實(shí)施本發(fā)明第一方面的方法的排序模塊。
根據(jù)本發(fā)明的第三方面,本發(fā)明提出了一種用于對(duì)在輸出碼流中包括N個(gè)不同信號(hào)的3D聲音場(chǎng)景進(jìn)行編碼的音頻編碼器,其中N>1,該編碼器包括 -變換模塊,用于根據(jù)N個(gè)信號(hào)確定與各個(gè)頻帶相關(guān)的頻譜成份; -根據(jù)本發(fā)明第二方面所述的排序模塊,用于對(duì)與各個(gè)頻帶相關(guān)的頻譜成份中的至少一些進(jìn)行排序; -用于構(gòu)造二進(jìn)制序列的模塊,根據(jù)所述排序模塊執(zhí)行的排序,用于構(gòu)造二進(jìn)制序列,所述序列包括指示與各個(gè)頻帶相關(guān)的頻譜成份的數(shù)據(jù)。
根據(jù)本發(fā)明的第四方面,本發(fā)明提出了一種計(jì)算機(jī)程序,用于安裝在排序模塊中,在通過所述模塊的處理裝置執(zhí)行該程序過程中,所述程序包括用于執(zhí)行根據(jù)本發(fā)明第一方面所述方法的指令。
根據(jù)本發(fā)明的第五方面,本發(fā)明提出了一種用于解碼碼流的方法,該碼流根據(jù)本發(fā)明的第一方面所述的方法進(jìn)行編碼,以確定用于通過Q′個(gè)喇叭還原3D聲音場(chǎng)景的Q′個(gè)聲音信號(hào),該方法包括 -接收二進(jìn)制序列; -抽取編碼數(shù)據(jù),并且,根據(jù)所抽取的數(shù)據(jù),確定針對(duì)Q′個(gè)通道的與各個(gè)頻帶相關(guān)的參數(shù)集合; -根據(jù)每個(gè)參數(shù)集合,確定至少一個(gè)信號(hào)幀。
根據(jù)本發(fā)明的第六方面,本發(fā)明提出了一種解碼器,用于解碼根據(jù)本發(fā)明的第一方面的方法進(jìn)行編碼的碼流,以確定用于通過Q′個(gè)喇叭還原3D聲音場(chǎng)景的Q′個(gè)聲音信號(hào),該解碼器包括用于執(zhí)行根據(jù)本發(fā)明的第四方面所述的方法的步驟的裝置。
根據(jù)本發(fā)明的第七方面,本發(fā)明提出了一種安裝在解碼器中的計(jì)算機(jī)程序,用于解碼根據(jù)本發(fā)明的第一方面所述的方法進(jìn)行編碼的碼流,以確定用于通過Q′個(gè)喇叭還原3D聲音場(chǎng)景的Q′個(gè)聲音信號(hào),在通過所述解碼器的處理裝置執(zhí)行該程序過程中,所述程序包括用于執(zhí)行根據(jù)本發(fā)明第四方面所述方法的指令。
根據(jù)本發(fā)明的第八方面,本發(fā)明提出了一種二進(jìn)制序列,包括與產(chǎn)生于包括N個(gè)信號(hào)的聲音場(chǎng)景中的待編碼的要素的各個(gè)頻帶相關(guān)的頻譜成份,其中N>1,其特征在于,這些頻譜成份中的至少一些是根據(jù)本發(fā)明的第一方面所述的排序方法進(jìn)行排序的。
本發(fā)明的其它特點(diǎn)和優(yōu)點(diǎn)將通過下面的描述變得更加清晰。這是示例性的,并且必須借助于參照相關(guān)附圖,其中 -

圖1表示本發(fā)明的一個(gè)實(shí)施例中的編碼器; -圖2表示本發(fā)明的一個(gè)實(shí)施例中的解碼器; -圖3表示空間中的一個(gè)平面波的傳播; -圖4的流程圖表示本發(fā)明的一個(gè)實(shí)施例中的第一處理Proc1的各個(gè)步驟; -圖5a表示本發(fā)明的一個(gè)實(shí)施例中構(gòu)造的二進(jìn)制序列; -圖5b表示本發(fā)明的另一個(gè)實(shí)施例中構(gòu)造的二進(jìn)制序列Seq; -圖6的流程圖表示本發(fā)明的一個(gè)實(shí)施例中的第二處理Proc2的各個(gè)步驟; -圖7表示一個(gè)包括8個(gè)喇叭h1,h2...,h8的聲音再現(xiàn)系統(tǒng)的構(gòu)造示例; -圖8表示一個(gè)處理流程; -圖9表示一個(gè)第二處理流程; -圖10表示一個(gè)第三處理流程; -圖11的流程圖表示本發(fā)明的一個(gè)實(shí)施例中的方法Proc的各個(gè)步驟。
圖1表示本發(fā)明的一個(gè)實(shí)施例中的音頻編碼器。
編碼器1包括時(shí)間/頻率變換模塊3,屏蔽曲線計(jì)算模塊7,空間變換模塊4,用于定義有待編碼的最低程度相關(guān)要素的模塊5,其與量化模塊10相連,用于對(duì)要素進(jìn)行排序的模塊6,用于構(gòu)造二進(jìn)制序列的模塊8,用以傳輸碼流Φ。
一個(gè)包括N個(gè)通道的3D場(chǎng)景,在每個(gè)通道上分別傳輸信號(hào)S1,...,SN。
圖2表示本發(fā)明的一個(gè)實(shí)施例中的解碼器100。
解碼器100包括二進(jìn)制序列讀取模塊104,逆量化模塊105,逆環(huán)繞聲變換模塊101,以及頻率/時(shí)間變換模塊102。
解碼器100用于在輸入端接收由編碼器1發(fā)送的碼流Φ,并且在輸出端輸出Q′個(gè)信號(hào)S′1,S′2,...,S′Q′,用于輸入到聲音再現(xiàn)系統(tǒng)103的Q′個(gè)喇叭H1,H2...,HQ′。
每個(gè)喇叭Hi,i=1到Q′與一個(gè)表示來自喇叭的傳播的角度βi相關(guān)。
在編碼器側(cè)執(zhí)行的處理 編碼器1的時(shí)間/頻率變換模塊3在其輸入端接收有待編碼的3D聲音場(chǎng)景的N個(gè)信號(hào)S1,...,SN。
每個(gè)信號(hào)Si,i=1到N,由3D場(chǎng)景的聲波的聲音全向壓力(omnidirectional pressure)Pi以及傳播角度θi表示。
在每個(gè)信號(hào)的每個(gè)時(shí)間幀上,這些時(shí)間幀表示由聲音壓力Pi的隨時(shí)間變化所取的不同值,時(shí)間/頻率變換模塊3進(jìn)行時(shí)間/頻率變換,在當(dāng)前情況下,進(jìn)行改進(jìn)的離散余弦變換(modified discrete cosine transform,MDCT)。
從而對(duì)于每個(gè)信號(hào)Si,i=1到N,可以確定其頻譜表示為Xi,用M個(gè)MDCT變換系數(shù)X(i,j)表征,其中j=0到M-1。因此,MDCT系數(shù)表示頻帶Fj的信號(hào)Si的頻譜。
信號(hào)Si,i=1到N,的頻譜表示Xi,被提供到空間變換模塊4的輸入端,該模塊還在其輸入端接收表征輸入信號(hào)Si的聲音傳播角度θi。
信號(hào)Si,i=1到N,的頻譜表示Xi,還被提供到屏蔽曲線計(jì)算模塊7的輸入端。
屏蔽曲線計(jì)算模塊7用于確定每一個(gè)單獨(dú)的信號(hào)Si的屏蔽曲線,通過使用其頻譜表示Xi以及心理聲學(xué)模型(psychoacoustic model),其為每一個(gè)頻譜表示Xi的每一個(gè)頻帶Fj,j=0到M-1,提供了一個(gè)屏蔽水平(masking level)。這些屏蔽曲線的定義要素被傳送到用于定義有待編碼的最小程度相關(guān)要素的模塊5。
空間變換模塊4用于對(duì)所提供的輸入信號(hào)進(jìn)行空間變換,也就是,確定來自空間參考系統(tǒng)發(fā)射的信號(hào)的空間成份,依賴于變換的次序??臻g變換的順序與“搜索”聲域的角頻率相關(guān)。
在一個(gè)實(shí)施例中,空間變換模塊4執(zhí)行環(huán)繞聲變換,給出了3D聲音場(chǎng)景的緊湊空間表示(compact spatial representation),通過在相關(guān)球形或者圓柱形諧函數(shù)上制造聲域的聲音發(fā)射。
為了獲取更多關(guān)于環(huán)繞聲變換的信息,可以參考以下文獻(xiàn)“Représentation dechamps acoustiques,application àla transmission et àla reproduction de scènessonores complexes dans un contexte multimédia”(聲場(chǎng)的表示方法,應(yīng)用多媒體環(huán)境下的復(fù)雜聲音場(chǎng)景的傳播與重現(xiàn)),Doctoral Thesis of the University of Paris 6,

DANIEL,31 July 2001,″A highly scalable spherical microphone arraybased on an orthonormal decomposition of the sound field″(基于聲場(chǎng)的正交分解的高級(jí)球星擴(kuò)音器排列),Jens Meyer-Gary Elko,Vol.II-pp.1781-1784 in Proc.ICASSP 2002。
參考圖3,以下公式給出了應(yīng)用于在聲場(chǎng)的信號(hào)Si的無限階圓柱形諧波的分解公式
其中(Jm)表示貝塞爾函數(shù)(the Bessel functions),r表示從幀中央到位于點(diǎn)M的聽者的位置的距離,Pi是信號(hào)Si的聲音壓力,θi是與信號(hào)Si相應(yīng)的聲波的傳播角度,φ是聽者位置與幀的軸線之間的夾角。
如果環(huán)繞聲變換是p階(p表示任何一個(gè)正整數(shù)),對(duì)于2D環(huán)繞聲變換(在水平面上),則對(duì)于在時(shí)域中表示的信號(hào)Si的環(huán)繞聲變換包括以下2p+1個(gè)成份 (Pi,Pi.cosθi,Pi.sinθi,Pi.cos2θi,Pi.sin2θi,Pi.cos3θi,Pi.sin3θi,...,Pi.cospθi,Pi.sinpθi). 在下文中,已經(jīng)考慮了2D環(huán)繞聲變換。然而,本發(fā)明可以在3D環(huán)繞聲變換的情況下實(shí)施(在這種情況下,考慮聽眾按照球面排列)。
在頻域中考慮環(huán)繞聲成份Ak,k=1到Q=2p+1,每一個(gè)都包括M個(gè)頻譜參數(shù)A(k,j),j=0到M-1,分別與頻帶Fj相關(guān),以使得 如果矩陣A包括產(chǎn)生于信號(hào)Si,i=1到N的p階的環(huán)繞聲變換的成份Ak,k=1到Q,Amb(p)是環(huán)繞聲對(duì)于空間聲場(chǎng)的p階的環(huán)繞聲變換矩陣,X是信號(hào)Si,i=1到N的頻率成份的矩陣,那么 Amb(p)=[Amb(p)(i,j)],其中i=1到Q,并且j=1到N,其中Amb(p)(1,j)=1, 如果i是偶數(shù), 如果i是奇數(shù),即 且 這樣我們可以得到A=Amb(p)xX等式(1). 空間變換模塊4用于確定矩陣A,根據(jù)其輸入端收到的數(shù)據(jù)X(i,j)及θi(i=1到N,j=0到M-1)使用等式(1)。
考慮到一種特殊情況,環(huán)繞聲成份Ak,k=1到Q,也就是矩陣A的參數(shù)A(k,j),k=1到Q且j=0到M-1,是有待被編碼器1進(jìn)行編碼的二進(jìn)制序列中的要素。
環(huán)繞聲成份Ak,k=1到Q被傳送到模塊5,模塊5用于定義量化的最低相關(guān)要素以及確定環(huán)繞聲成份的排序。
用于定義量化的最低相關(guān)要素的模塊5通過模塊5的處理裝置,用于執(zhí)行第一算法和/或第二算法的操作,用以定義有待編碼的最低相關(guān)要素并且對(duì)有待編碼的要素進(jìn)行彼此排序。
該有待編碼的要素排序隨后在構(gòu)造將被傳輸?shù)亩M(jìn)制序列的過程中使用。
第一算法包括用于執(zhí)行如下文參考圖4所述的過程Proc1的指令,當(dāng)這些指令在模塊5的處理裝置上被執(zhí)行時(shí)。
過程Proc1 過程Proc1的原理是計(jì)算至少一些頻譜成份的相應(yīng)影響,其可以根據(jù)產(chǎn)生于N個(gè)信號(hào)中的至少一些的頻譜參數(shù)進(jìn)行計(jì)算,基于根據(jù)對(duì)所述頻譜成份的編碼的在頻帶上確定的遮噪比(mask-to-noise ratios)。然后,根據(jù)對(duì)至少一個(gè)頻譜成份計(jì)算的影響與其他成份計(jì)算的影響的比值,對(duì)所述至少一個(gè)頻譜成份分配優(yōu)先級(jí)順序。
在一個(gè)實(shí)施例中,過程Proc1具體為 初始化 ·步驟1a 在該步驟中,定義第一速率D0=Dmax以及對(duì)于該速率D0在有待編碼的要素A(k,j),(k,j)∈E0={(k,j)使得k=1到Q且j=0到M-1}之間分配的速率的一部分。在該分配期間分配到有待編碼的要素A(k,j),(k,j)∈E0的速率(這些速率的總和dk,j|k=1到Q,j=0到M-1等于D0)被稱為dk,j且對(duì)于(k,j)∈E0,δ0=mindk,j。
接著,有待編碼的要素A(k,j),(k,j)∈E0,根據(jù)針對(duì)速率D0已定義的分配,通過量化模塊10進(jìn)行量化。
·步驟1b 接著,計(jì)算每個(gè)信號(hào)Si以及每個(gè)子帶Fj的屏蔽量化誤差(噪音)比(the ratio of the maskto the quantification error)(“遮噪比”″Mask to noise Ratio″或者M(jìn)NR),其中i=1到N且j=0到M-1,其等于頻帶Fj中的信號(hào)Si的屏蔽功率除以與頻帶Fj中的信號(hào)Si相關(guān)的量化噪音(E(i,j))的功率。
為了實(shí)現(xiàn)這個(gè)步驟,有待編碼的要素A(k,j)(k,j)∈E0的每個(gè)頻帶Fj中的量化誤差b(k,j)首先由如下步驟確定的 b(k,j)=A(k,j)-A(k,j),其中A(k,j)是量化結(jié)果,然后對(duì)要素A(k,j)的量化求倒數(shù)(量化通常提供一個(gè)量化指數(shù)表示在字典中量化的要素值,量化倒數(shù)提供了根據(jù)量化指數(shù)進(jìn)行量化的要素的值)。
然后,確定針對(duì)每個(gè)信號(hào)Si在每個(gè)頻帶Fj中的量化誤差E(i,j),其中i=1到N且j=0到M-1,根據(jù)速率D0下的有待編碼的要素的量化值,通過計(jì)算包括要素E(i,j)的矩陣E 等式(2) 其中Q=2p+1,Amb(p)是p階的環(huán)繞聲變換矩陣,并且

并且
然后,根據(jù)因此計(jì)算所得的相對(duì)于頻帶Fj中的信號(hào)Si的量化噪音E(i,j),以及屏蔽計(jì)算模塊7提供的頻帶Fj中的信號(hào)Si的屏蔽,確定針對(duì)每個(gè)信號(hào)Si以及每個(gè)子帶Fj的屏蔽量化誤差比,其中i=1到N且j=0到M-1。
MNR(0,D0)指的是矩陣,矩陣MNR(0,D0)的元素(i,j),i=1到N且j=0到M-1,表示之前執(zhí)行的量化步驟中的頻帶Fj以及信號(hào)Si的屏蔽量化誤差比。
在描述過程Proc1的第一次迭代之前,下面將給出等式(2)是如何確定的。
圖8表示處理流程200,包括p階的環(huán)繞聲變換模塊201(類似于圖1中的p階的環(huán)繞聲變換模塊4),接著是p階的逆環(huán)繞聲變換模塊202。p階的環(huán)繞聲變換模塊201在其輸入端接收信號(hào)S1,...,SN的頻譜表示X1,...,XN,在這些信號(hào)上執(zhí)行p階的環(huán)繞聲變換,將所獲得的環(huán)繞聲信號(hào)A1到AQ傳輸至p階的逆環(huán)繞聲變換模塊202,該模塊輸出N個(gè)不同的聽覺壓力信號(hào)∏i,i=1到N。
接著,我們有其中Amb(p)是p階環(huán)繞聲變換矩陣,而AmbInv(p)是p階逆環(huán)繞聲變換矩陣(也叫作環(huán)繞聲解碼矩陣)。
圖9表示處理流程210,包括p階環(huán)繞聲變換模塊201,接著是量化模塊203,然后是逆量化模塊204,以及p階逆環(huán)繞聲變換模塊202。在處理流程210的輸入端p階環(huán)繞聲變換模塊201在輸入端接收信號(hào)S1,...,SN的頻譜表示X1,...,XN,并輸出獲得的環(huán)繞聲信號(hào)A1到AQ,這些信號(hào)被提供到量化模塊203的輸入端。信號(hào)A1,...,AQ是通過逆量化模塊204輸出到逆環(huán)繞聲變換模塊202的信號(hào),它們來自對(duì)量化模塊203輸出的信號(hào)所進(jìn)行的逆量化。Q階逆環(huán)繞聲變換模塊202輸出N個(gè)不同的聽覺壓力信號(hào)∏’i,i=1到N。
圖9中的處理流程210提供了與圖10中的處理流程211相同的輸出聽覺壓力∏’i,其中p階環(huán)繞聲變換模塊201被置于逆量化模塊204以及p階逆環(huán)繞聲變換模塊202之間。在處理流程211中,在處理流程211的輸出端,量化模塊203在其輸入端接收頻譜表示X1,...,XN,對(duì)其進(jìn)行量化,并將該量化結(jié)果輸出到逆量化模塊204,該模塊輸出N個(gè)信號(hào)X1,...,XN。這些信號(hào)X1,...,XN接著被提供到被級(jí)聯(lián)設(shè)置的環(huán)繞聲變換模塊以及環(huán)繞聲逆變換模塊201和202。p階逆環(huán)繞聲變換模塊202輸出N個(gè)不同的聽覺壓力信號(hào)∏’i,i=1到N。
然后我們可以寫成 設(shè) 并且, 這樣我們可以據(jù)此推出E=(AmbInv(p)×Amb(p))-1AmbInv(p)×B. 如果環(huán)繞聲解碼矩陣與具有普通喇叭的系統(tǒng)相應(yīng),我們有(事實(shí)上,N個(gè)量化誤差E或B僅僅依賴于所執(zhí)行的編碼而不依賴于解碼。根據(jù)所使用的解碼矩陣,在解碼側(cè)將發(fā)生的對(duì)應(yīng)于所使用的喇叭的系統(tǒng)的變化,在于在喇叭間分配誤差的方式。這取決于所使用的心理聲學(xué)沒有考慮信號(hào)間的干擾。因此,如果計(jì)算是針對(duì)明確定義的解碼矩陣進(jìn)行的,并且量化模塊優(yōu)化了針對(duì)該矩陣的誤差,那么對(duì)于其它解碼矩陣,該誤差是次優(yōu)的)。
因此從中推出等式(2)。
回到對(duì)于圖4的描述。
第1次迭代 ·步驟1c 現(xiàn)在定義第二編碼速率D1,其中D1=D0-δ0,以及該編碼速率D1在有待編碼的要素A(k,j),k=1到Q且j=0到M-1間的分配。
·步驟1d 然后,對(duì)于每個(gè)配對(duì)(k,j)∈E0,根據(jù)E0的配對(duì)的詞典編纂的(lexicographical)讀取順序,連續(xù)地考慮從配對(duì)(1.0)直到配對(duì)(Q,M-1),重復(fù)以下操作a1到a7 a1-對(duì)于操作a2到a5認(rèn)為子帶(k,j)被刪除; a2-有待編碼的要素A(i,n)((i,n)等于除了配對(duì)(k,j)之外的每個(gè)E0配對(duì))被量化模塊10量化,其中(i,n)∈E0\(k,j),根據(jù)在所述有待編碼的要素A(i,n)之間的對(duì)速率Di的已定義的分配,其中(i,n)∈E0\(k,j); a3-與步驟1b中所示的方法相同,基于產(chǎn)生于步驟a2中執(zhí)行的量化操作的要素A(i,n),(i,n)∈E0\(k,j),計(jì)算矩陣MNRk,j(1,D1)=[MNRk,j(1,D1)(i,t)]i=1到N且t=0到M-1,這樣每個(gè)矩陣的元素MNRk,j(1,D1)(i,t)表示對(duì)于每個(gè)信號(hào)和每個(gè)子帶的屏蔽量化誤差(或噪音)比,其中i=1到N且t=0到M-1,遵循在步驟a2中執(zhí)行的量化(所考慮的子帶(k,j)被刪除,量化噪音b(k,j)在計(jì)算時(shí)被認(rèn)為是0)。矩陣MNRk,j(1,D1)的元素的取值被保存; a4-接著,計(jì)算并存儲(chǔ)屏蔽量化誤差比的變化矩陣ΔMNRk,j(1),ΔMNRk,j(1)=|MNRk,j(1,D1)-MNRk,j(0,D0)|,其中MNRk,j(0,D0)是指示其要素(k,j)已被刪除的矩陣MNR(0,D0)。
a5-計(jì)算矩陣ΔMNRk,j(1)的范數(shù)(norm)||ΔMNRk,j(1)||。該范數(shù)的值評(píng)價(jià)了在信號(hào)Si的信噪比的集合上,在有待編碼的要素A(i,n)中刪除成份A(k,j)的影響,其中(i,n)∈E0。
計(jì)算的范數(shù)使得測(cè)量MNRk,j(1,D1)和MNRk,j(0,D0)之間的差別成為可能,例如等于矩陣ΔMNRk,j(1)的每個(gè)要素的平方的和的均方根。
a6-考慮子帶(k,j)不再被刪除; a7-如果(k,j)≠max E0=(Q,M-1),在E0中增大配對(duì)(k,j),并且步驟a1到a7被再重復(fù)直到達(dá)到max E0。
·步驟1e 根據(jù)當(dāng)(k,j)∈E0時(shí)獲得的||ΔMNRk,j(1)||值中的最小值,確定(i1,j1),也就是 有待編碼的要素A(i1,j1)因此被識(shí)別為在有待編碼的要素A(i,j)集合中的針對(duì)總體聲音質(zhì)量的最小相關(guān)要素,其中(i,j)∈E0。
·步驟1f 配對(duì)(i1,j1)的標(biāo)識(shí)符被輸出到排序模塊6,作為過程Proc1的第一迭代的結(jié)果。
·步驟1g 在過程Proc1的剩余過程中,在有待編碼的要素集合中刪除頻帶(i1,j1)。得到集合E1=E0\{(i1,j1)}。
第2次迭代及后續(xù) 針對(duì)每個(gè)n,執(zhí)行與步驟1c到1g相似的步驟,其中n≥2,在下面進(jìn)行描述。
步驟1c定義第(n+1)個(gè)編碼速率Dn,其中Dn=Dn-1-δn-1,以使δn-1=min(dij),其中(i,j)∈En-1。
步驟1d接著,對(duì)于每個(gè)配對(duì)(k,j)∈En-1,根據(jù)詞典編纂的順序,連續(xù)地考慮,重復(fù)以下操作a1到a7 a1-對(duì)于操作a2到a5認(rèn)為子帶(k,j)被刪除; a2-有待編碼的要素A(i,n)被量化模塊10量化,其中(i,n)∈En-1\{(k,j)},根據(jù)在所述有待編碼的要素A(i,n)之間的對(duì)速率Dn的分配,其中(i,n)∈En-1\{(k,j)}; a3-基于根據(jù)步驟a2中的量化所確定的要素A(i,n),(i,n)∈En-1\{(k,j)},計(jì)算矩陣MNRk,j(n,Dn),其表示對(duì)于每個(gè)信號(hào)和每個(gè)子帶的屏蔽量化誤差(或噪音)比,其中i=1到N且j=0到M-1,遵循在步驟a2中執(zhí)行的量化; a4-接著,計(jì)算并存儲(chǔ)屏蔽量化誤差比的變化矩陣ΔMNRk,j(n)=|MNRk,j(n,Dn)-MNRk,j(n-1,Dn-1)|,其中MNRk,j(n-1,Dn-1)對(duì)應(yīng)于指示要素(k,j)已被刪除的矩陣MNR(n-1,Dn-1),以及矩陣ΔMNRk,j(n)的范數(shù)||ΔMNRk,j(n)||。該范數(shù)的值評(píng)價(jià)了在信號(hào)Si的信噪比的集合上,在有待編碼的要素A(i,n)中刪除成份A(k,j)的影響,其中(i,n)∈En-1\{(k,j)}。
a5-認(rèn)為子帶(k,j)不再被刪除; a6-如果(k,j)≠maxEn-1,在En-1中增大配對(duì)(k,j),并且步驟a1到a6被再重復(fù)直到達(dá)到maxEn-1。
·步驟1e 根據(jù)當(dāng)(k,j)∈En-1時(shí)獲得的||ΔMNRk,j(n)||值中的最小值,確定(in,jn),也就是矩陣也被存儲(chǔ)。
有待編碼的要素A(in,jn)因此被識(shí)別為在有待編碼的要素A(i,j)集合中的針對(duì)總體聲音質(zhì)量的最小相關(guān)要素,其中(i,j)∈En-1。
·步驟1f 配對(duì)(in,jn)的標(biāo)識(shí)符被輸出到排序模塊6,作為過程Proc1的第一迭代的結(jié)果。
·步驟1g 在過程Proc1的剩余過程中,在有待編碼的要素集合中刪除頻帶(in,jn)。得到集合En=En-1\{(in,jn)}。
過程Proc1被再迭代r次,最大為Q*M-1次。
然后,由排序模塊6將優(yōu)先級(jí)次序分配給不同的頻帶,以便將編碼數(shù)據(jù)插入到二進(jìn)制序列中。
對(duì)有待編碼的要素進(jìn)行排序并構(gòu)造二進(jìn)制序列 基于由過程Proc1的連續(xù)迭代所提供的連續(xù)性的結(jié)果 在一個(gè)實(shí)施例中,有待編碼的要素的排序是通過排序模塊6進(jìn)行的,僅僅基于模塊5執(zhí)行的為了定義有待編碼的最小相關(guān)要素而由處理步驟Proc1的連續(xù)重復(fù)所連續(xù)提供的結(jié)果,排除了處理步驟Proc2所提供的結(jié)果,后者確定了所述有待編碼要素的次序,反映了涉及總體聲音質(zhì)量的有待編碼的重要性。
參考圖5a,對(duì)應(yīng)于配對(duì)(i1,j1)的有待編碼的要素A(i1,j1)在Proc1的第一次重復(fù)過程中,被認(rèn)為是與總體聲音質(zhì)量最小相關(guān)。它因此被模塊5分配了一個(gè)最小優(yōu)先級(jí)指數(shù)Prio1。
對(duì)應(yīng)于配對(duì)A(i2,j2)的有待編碼的要素在Proc1的第二次重復(fù)過程中,被認(rèn)為是與總體聲音質(zhì)量最小相關(guān),在分配了優(yōu)先級(jí)Prio1之后。它因此被分配了一個(gè)最小優(yōu)先級(jí)指數(shù)Prio2,其中Prio2>Prio1。當(dāng)步驟的迭代次數(shù)r嚴(yán)格小于Q*M-1時(shí),排序模塊6因此連續(xù)地確定r個(gè)有待編碼的要素,每個(gè)要素被分配的優(yōu)先級(jí)指數(shù)從Prio1,Prio2增加到Prio r。在處理步驟Proc1中還沒有被分配優(yōu)先級(jí)次序的有待編碼的要素對(duì)于總體聲音質(zhì)量比已經(jīng)分配了優(yōu)先級(jí)次序的有待編碼的要素的重要程度更高。
當(dāng)r等于Q*M-1次時(shí),所有有待編碼的要素被一個(gè)接一個(gè)地排序。
在此情況下,過程Proc1所進(jìn)行的迭代次數(shù)被認(rèn)為是等于Q*M-1次。
分配給有待編碼的要素A(k,j)的優(yōu)先級(jí)次序同樣被分配給產(chǎn)生于該有待編碼的要素的量化的已被編碼的要素A(k,j)。
用于構(gòu)造二進(jìn)制序列的模塊8構(gòu)造了一個(gè)二進(jìn)制序列,與每個(gè)信號(hào)Si的幀相應(yīng),其中i=1到N,通過連續(xù)地對(duì)已被編碼的要素A(k,j)求積分,減小分配的優(yōu)先級(jí)指數(shù)的次序,碼流Φ中的二進(jìn)制序列將被發(fā)送。
這樣,構(gòu)造的二進(jìn)制序列按照模塊6執(zhí)行的排序步驟被排序。
二進(jìn)制序列被與各個(gè)頻帶相關(guān)的頻譜成份構(gòu)造,這些成份是產(chǎn)生于一個(gè)包括N個(gè)信號(hào)的聲音場(chǎng)景的有待編碼的要素中的,其中N>1,并且根據(jù)在頻帶上確定的對(duì)于遮噪比的影響進(jìn)行排序。
二進(jìn)制序列的頻譜成份例如是根據(jù)本發(fā)明中的方法進(jìn)行排序的。
在一個(gè)實(shí)施例中,在包括在構(gòu)造的二進(jìn)制序列中的僅僅一些頻譜成份使用依據(jù)本發(fā)明的方法進(jìn)行排序。
在上述實(shí)施例中,對(duì)于算法Proc1的每一次迭代,都要從有待編碼的要素A(i,j)中刪除一個(gè)頻譜成份。
在另一個(gè)實(shí)施例中,使用了重疊量化器用于執(zhí)行量化操作。在這種情況下,一個(gè)已被識(shí)別的有待編碼的要素A(i0,j0)中的頻譜成份沒有被刪除,但是該成份的編碼被分配了一個(gè)減小了的速率,至于有待編碼的要素中的其它頻譜成份仍然要被排序。
編碼器1是一個(gè)考慮不同單頻信號(hào)間的干擾的因而允許速率適配性的編碼器。它允許定義壓縮數(shù)據(jù)對(duì)感知總體聲音質(zhì)量進(jìn)行優(yōu)化。
對(duì)二進(jìn)制序列的要素的排序與二進(jìn)制序列的構(gòu)造使用了上述的本發(fā)明實(shí)施例中的Proc1,其中有待編碼的要素包括信號(hào)的環(huán)繞聲成份。
在另一個(gè)實(shí)施例中,根據(jù)本發(fā)明的一個(gè)編碼器沒有對(duì)這些環(huán)繞聲成份進(jìn)行編碼,而是對(duì)信號(hào)Si的頻譜系數(shù)X(i,j)進(jìn)行編碼,其中j=0到M。
在這種情況下,在過程1的第一次重復(fù)時(shí),例如最小優(yōu)先級(jí)指數(shù)(在剩余的有待編碼的要素中的最小值)被分配給有待編碼的要素,這樣刪除頻譜成份就引起了遮噪比的最小變化。接著,過程Proc1被重復(fù)。
處理步驟Proc2 葛容準(zhǔn)則一般被用于表征虛擬聲源的位置,通過合成從一個(gè)已知聲音表現(xiàn)系統(tǒng)的喇叭中還原的信號(hào)。
這些準(zhǔn)則基于研究聲壓的速度和能量向量,該聲壓通過使用一個(gè)聲音表現(xiàn)系統(tǒng)而產(chǎn)生。
當(dāng)一個(gè)聲音表現(xiàn)系統(tǒng)包括L個(gè)喇叭時(shí),通過這些喇叭產(chǎn)生的信號(hào)Si,i=1到L,通過一個(gè)聲壓Ti以及一個(gè)聲音傳播角度ξi定義。
然后速度向量

被這樣定義 存在一對(duì)極坐標(biāo)(rV,ξV)以使 等式(3) 能量向量

被定義為 存在一對(duì)極坐標(biāo)(rF,ξF)以使 等式(4) 為定位適宜的虛擬聲源所需要的條件通過尋找角度ξi而確定,表征所述聲音表現(xiàn)系統(tǒng)的喇叭的位置,符合以下所述葛容準(zhǔn)則,其中 -準(zhǔn)則1,與低頻下的聲源S的聲音圖像的精度有關(guān)ξV=ξ;;其中ξ是尋求獲得的真正聲源S的傳播角度。
-準(zhǔn)則2,與低頻下的聲源S的聲音圖像的穩(wěn)定性有關(guān)rV=1; -準(zhǔn)則3,與高頻下的聲源S的聲音圖像的精度有關(guān)ξE=ξ; -準(zhǔn)則4,與高頻下的聲源S的聲音圖像的穩(wěn)定性有關(guān)rE=1; 在下面描述的本發(fā)明的一個(gè)實(shí)施例的操作中,使用了葛容向量(Gerzonvector),除了包括尋找表示所述聲音表現(xiàn)系統(tǒng)的喇叭位置的最佳角度ξi。
葛容準(zhǔn)則基于研究聲壓的速度和能量向量,該聲壓通過使用一個(gè)聲音表現(xiàn)系統(tǒng)而產(chǎn)生。
等式3和4中所示的關(guān)于能量和速度向量的與葛容準(zhǔn)則相關(guān)的每個(gè)系數(shù)xV,yV,xE,yE都是[-1,1]的元素。因此存在一個(gè)簡單的配對(duì)(ξV,ξE)驗(yàn)證以下等式,符合理想的情況(rV,rF)=(1,1) 且 該簡單配對(duì)中的角度ξV和ξF因此被以下等式定義(等式(5)) 此后,一般的葛容角度向量術(shù)語將用于指代向量

以使 第二算法包括用于執(zhí)行的指令,當(dāng)它們?cè)谀K5的處理裝置上執(zhí)行時(shí),參考圖6下面描述的過程Proc2的步驟的指令。
過程Proc2的原理如下對(duì)一個(gè)要被排序的頻譜參數(shù)集合中的每一個(gè)頻譜參數(shù),計(jì)算其對(duì)于一個(gè)角度向量的影響,該角度向量根據(jù)與葛容準(zhǔn)則相關(guān)的能量與速度向量而被定義,并根據(jù)一個(gè)對(duì)于所述量化環(huán)繞聲成份的逆環(huán)繞聲變換而被計(jì)算。此外,對(duì)至少一個(gè)頻譜參數(shù)分配優(yōu)先級(jí)次序,根據(jù)一個(gè)對(duì)所述頻譜參數(shù)所計(jì)算的影響與其它計(jì)算的影響相比較。
在一個(gè)實(shí)施例中,過程Proc2具體如下所述 初始化(n=0) ·步驟2a 一個(gè)速率D0=Dmax以及在有待編碼的要素A(k,j)間分配的該速率被定義,其中(k,j)∈E0={(k,j)以使k=1到Q且j=0到M-1}。
在該初始分配中分配給有待編碼的要素的速率被定義為dk,j(這些速率的和dk,j|i=1到Q,j=0到M-1等于D0),并且δ0=min dk,j,其中(k,j)∈E0。
·步驟2b 然后,每個(gè)有待編碼的要素A(k,j)被量化模塊10根據(jù)已經(jīng)在步驟2a中被分配的速率dk,j進(jìn)行量化,其中(k,j)∈E0。
A是要素A(k,j)的矩陣,其中k=1到Q且j=0到M-1。每個(gè)要素都是量化的結(jié)果,環(huán)繞聲成份A(k)的參數(shù)A(k,j)的速率dk,j與頻帶Fj有關(guān)。因此要素A(k,j)定義了對(duì)于所述環(huán)繞聲成份Ak的頻帶Fj的頻譜表示的量化值。
·步驟2c 然后,這些被量化的環(huán)繞聲成份A(k,j)(k=1到Q且j=0到M-1)被進(jìn)行p階的環(huán)繞聲解碼,以使2p+1=Q,并且與一個(gè)具有N個(gè)喇叭的規(guī)則系統(tǒng)相符合,目的是確定作為該環(huán)繞聲解碼的結(jié)果而獲取的聲音信號(hào)的聲壓T1i,i=1到N。
在所屬情況下,AmbInv(p)是p階逆環(huán)繞聲變換矩陣(或者p階環(huán)繞聲解碼),輸出與N個(gè)不同的喇叭H′1,...,H′N相應(yīng)的N個(gè)信號(hào)T11,...,T1N,這些喇叭圍繞一個(gè)點(diǎn)規(guī)則地安裝。結(jié)果,矩陣AmbInv(p)通過矩陣Amb(p,N)的變換推導(dǎo)而來,矩陣Amb(p,N)是來自于聲音場(chǎng)景的編碼的環(huán)繞聲編碼矩陣,該場(chǎng)景由與N個(gè)喇叭H′1,...,H′N相應(yīng)的N個(gè)聲源定義,這些喇叭分別置放在位置ξ1,...,ξN。因此我們可以得到 T1是與頻帶Fj(j=0到M-1)相關(guān)的信號(hào)T1i(i=1到N)的頻譜成份的矩陣。這些頻譜成份來自p階環(huán)繞聲逆變換,應(yīng)用于量化環(huán)繞聲成份A(k,j),k=1到Q且j=0到M-1。
接著我們有 等式(6) 這樣成份T1(i,j)(i=1到N)取決于與所述環(huán)繞聲成份A(k,j)(k=1到Q且j=0到M-1)的量化相關(guān)的量化誤差(事實(shí)上,每一量化要素都是有待量化的環(huán)繞聲成份的頻譜參數(shù)以及與所述參數(shù)相關(guān)的量化噪音的和)。
對(duì)每一頻帶Fj,j=0到M-1,使用等式(5),接著在過程Proc2(n=0)的初始化時(shí)計(jì)算一般葛容角度向量

根據(jù)一個(gè)由下面的環(huán)繞聲解碼(其由i=1到N)所確定的頻譜成份T1(i,j)(i=1到N且j=0到M-1)。
從而確定 需要指出,這里的環(huán)繞聲解碼矩陣已經(jīng)被考慮用于一個(gè)規(guī)則聲音表現(xiàn)裝置,其中包括與輸入信號(hào)數(shù)目相等的喇叭,以使對(duì)于環(huán)繞聲解碼矩陣的計(jì)算簡單。然而,該步驟對(duì)于一個(gè)與不規(guī)則聲音表現(xiàn)裝置相應(yīng)的環(huán)繞聲解碼矩陣,以及與輸入信號(hào)數(shù)目不相等的喇叭也可以實(shí)現(xiàn)。
第1次迭代(n=1) ·步驟2d 速率D1=D0-δ0以及在有待編碼的要素A(k,j)間分配的該速率D1被定義,其中(k,j)∈E0。
·步驟2e 然后,每個(gè)有待編碼的要素A(k,j)被量化模塊10根據(jù)已經(jīng)在步驟2d中分配的速率dk,j進(jìn)行量化,其中(k,j)∈E0。
A是量化要素A(k,j)的更新矩陣,其中(k,j)∈E0,每個(gè)都來自于根據(jù)參數(shù)A(k,j)的總體速率D1的最后一次量化。
·步驟2f 以與前述步驟2c中相似的方式,在根據(jù)對(duì)于總體速率為D1的要素執(zhí)行的p階新環(huán)繞聲解碼計(jì)算之后,對(duì)于過程Proc2的第一次迭代,對(duì)于每個(gè)頻帶Fj計(jì)算其中的第一一般葛容角度向量

根據(jù)從上述新環(huán)繞聲解碼確定的頻譜成份T1(i,j)(i=1到N,j=0到M-1),使用等式(6)。
接著對(duì)于向量

進(jìn)行計(jì)算,該向量等于在初始化步驟2c中計(jì)算的葛容角度向量

與在第1次迭代的初始化步驟2f中計(jì)算的一般葛容角度向量

之間的差j=0到M-1。
·步驟2q 計(jì)算每一頻帶Fj中的變化到M-1的范數(shù)
該范數(shù)表示在每一頻帶Fj的速率從D0到D1的下降時(shí)一般葛容角度向量的變化。
頻帶

的指數(shù)j1這樣被確定,以使在頻帶

中計(jì)算的葛容角度變化的范數(shù)

小于或者等于對(duì)于每個(gè)頻帶Fj(j=0到M-1)計(jì)算的每個(gè)范數(shù)

我們因此可以得到 ·步驟2h 現(xiàn)在考慮相對(duì)于頻帶

的環(huán)繞聲成份的頻譜參數(shù),也就是參數(shù)A(k,j1),其中k∈F0=[1,Q]。
對(duì)任何一個(gè)所述i∈F0,都從1到Q依次重復(fù)下面的步驟2h1到2h5 2h1-認(rèn)為對(duì)于步驟2h2到2h4都刪除子帶(i,j1);因此,可以認(rèn)為A(i,j1)為0并且相應(yīng)的量化要素A(i,ji)為0; 2h2-以與前述步驟2c相似的方式,在根據(jù)對(duì)于總體速率為D1(A(i,ji)為0)的要素執(zhí)行的p階環(huán)繞聲解碼計(jì)算之后,在頻帶

中確定一般葛容角度向量根據(jù)所述環(huán)繞聲解碼確定的頻譜成份T1(i,j)(i=1到N,j=0到M-1),使用等式(6)。
2h3-接下來計(jì)算向量

該向量代表頻帶

中的上述計(jì)算的一般葛容角度向量以及在上述第1次迭代的步驟2f中計(jì)算的一般葛容角度向量

之間的差別然后,計(jì)算向量

的范數(shù) 該范數(shù)代表對(duì)于速率D1頻率環(huán)繞聲成份A(i,j1)被刪除時(shí),頻帶

中的一般葛容角度向量的變化。
2h4-如果i≠max F0,則認(rèn)為子帶(i,j1)不再被刪除,并且我們轉(zhuǎn)到步驟2h5。如果i=max F0,認(rèn)為子帶(i,j1)不再被刪除,并且我們轉(zhuǎn)到步驟2i。
2h5-在集合F0中增加i,且重復(fù)步驟2h1到2h4,直到i=max F0. 因此對(duì)于每一i∈F0=[1,Q],可以獲得Q個(gè)一般葛容角度變化值
·步驟2i 對(duì)于每一個(gè)i∈F0=[1,Q],互相比較

的值,確定這些值中的最小值,并且確定相應(yīng)于最小值的指數(shù)in∈Fn,也就是。
因此成份A(i1,j1)被標(biāo)識(shí)為有待編碼的要素中對(duì)于空間精度的重要性最低的成份,相比于其它有待編碼的要素A(k,j),(k,j)∈E0。
·步驟2j 對(duì)于每個(gè)頻帶Fj,重新定義并計(jì)算針對(duì)速率D1的來自于第1次迭代的一般葛容角度向量
如果j∈
\{j1}; 如果j=j(luò)1. 該重新定義的一般葛容角度向量,針對(duì)等于D1的量化速率建立,考慮到有待編碼要素A(i1,j1)的刪除,并且將被用于下面的過程Proc2的重復(fù)。
·步驟2k 配對(duì)(i1,j1)的標(biāo)識(shí)符被傳送到排序模塊6,作為過程Proc2的第一次迭代的結(jié)果。
·步驟2m 然后,有待編碼要素A(i1,j1)被從過程Proc2中的剩余部分的有待編碼的要素集合中刪除。
定義序列E1=E0\(i1,j1)。
定義δ1=min dk,j,其中(k,j)∈E1。
在過程Proc2的第二次迭代中,重復(fù)與上述步驟2d到2n相似的步驟。
過程Proc2被根據(jù)需要盡可能多地重復(fù),以對(duì)剩余的要排序的有待編碼的要素A(k,j),(k,j)∈E1中的一些或者所有進(jìn)行排序。
因此,上述步驟2d到2h被進(jìn)行第n次重復(fù)。
第n次迭代(n>1) En-1=E0\{(i1,j1),...,(in-1,jn-1)}。
有待編碼的要素A(k,j)(其中(k,j)∈E0\En-1)已經(jīng)在前一次迭代的步驟2m中被刪除。
·步驟2d 速率Dn=Dn-1-δn-1以及在有待編碼的要素A(k,j)間分配的該速率Dn被定義,其中(k,j)∈En-1。
在下面進(jìn)行的計(jì)算環(huán)繞聲解碼的過程中,認(rèn)為被量化的要素A(k,j)(其中(k,j)∈E0\En-1)為0。
·步驟2e 然后,每個(gè)有待編碼的要素A(k,j)被量化模塊10根據(jù)已經(jīng)在上述步驟2d中分配的速率進(jìn)行量化,其中(k,j)∈En-1。
該有待編碼的要素A(k,j)的量化結(jié)果為A(k,j),(k,j)∈En-1。
·步驟2f 以與前述第1次迭代中相似的方式,在根據(jù)對(duì)于總體速率為Dn的要素執(zhí)行的p階環(huán)繞聲解碼計(jì)算之后(因此認(rèn)為在該環(huán)繞聲解碼期間成份A(i1,j1),...,A(in-1,jn-1)為0),對(duì)于過程Proc2的第n次重復(fù),對(duì)于每個(gè)頻帶Fj計(jì)算其中的第一一般葛容角度向量

根據(jù)從上述環(huán)繞聲解碼確定的頻譜成份T1i,i=1到N,使用等式(6)。
接著對(duì)于向量

進(jìn)行計(jì)算,該向量等于在第n-1次迭代的步驟2j中計(jì)算的葛容角度向量

與在當(dāng)前步驟中計(jì)算的一般葛容角度向量

之間的差j=0到M-1。
·步驟2g 計(jì)算每一頻帶Fj中的變化到M-1的范數(shù)
該范數(shù)表示在每一頻帶Fj的速率從Dn到Dn-1的下降時(shí)一般葛容角度向量的變化(參數(shù)A(i1,j1),...,A(in-1,jn-1)以及A(i1,j1),...,A(in-1,jn-1)被刪除)。
頻帶

的索引jn這樣被確定,以使在頻帶

中計(jì)算的葛容角度變化的范數(shù)

小于或者等于對(duì)于每個(gè)頻帶Fj(j=0到M-1)計(jì)算的每個(gè)范數(shù)

我們因此可以得到 ·步驟2h 現(xiàn)在考慮相對(duì)于頻帶

的環(huán)繞聲成份的頻譜參數(shù),也就是參數(shù)A(k,jn),其中k∈Fn-1={i∈[1...,Q]以使(i,jn)∈En-1}。
對(duì)任何一個(gè)所述i∈Fn-1,從序列Fn-1中的最小元素(min Fn-1)到序列Fn-1中的最大元素(max Fn-1)依次重復(fù)下面的步驟2h1到2h5 2h1-認(rèn)為對(duì)于步驟2h2到2h4都刪除子帶(i,jn);因此,可以認(rèn)為A(i,jn)為0并且相應(yīng)的量化要素A(i,jn)為0; 2h2-以與前述步驟2c相似的方式,在根據(jù)對(duì)于總體速率為Dn(A(i,jn)為0)的要素執(zhí)行p階環(huán)繞聲解碼計(jì)算之后,在頻帶

中確定一般葛容角度向量根據(jù)所述環(huán)繞聲解碼確定的頻譜成份T1(i,j)(i=1到N,j=0到M-1),使用等式(6)。
2h3-接下來計(jì)算向量

該向量代表頻帶

中的上述步驟2h2計(jì)算的一般葛容角度向量以及在上述第n次迭代的步驟2f中計(jì)算的一般葛容角度向量

之間的差別然后,計(jì)算向量

的范數(shù) 該范數(shù)代表對(duì)于速率D1頻率環(huán)繞聲成份A(i,jn)在過程Proc 2的第n次迭代中被刪除時(shí),頻帶

中的一般葛容角度向量的變化。
2h4-如果i≠max Fn-1,則認(rèn)為子帶(i,jn)不再被刪除,并且我們轉(zhuǎn)到步驟2h5。如果i=max Fn-1,認(rèn)為子帶(i,jn)不再被刪除,并且我們轉(zhuǎn)到步驟2i。
2h5-在集合Fn-1中增加i,并且重復(fù)步驟2h1到2h4,直到i=max Fn-1. 因此對(duì)于每一i∈Fn-1,可獲得值

其代表了因?yàn)槌煞軦(i,jn)被刪除時(shí),在頻帶

中的一般葛容角度向量的變化。。
·步驟2i 對(duì)于每一個(gè)i∈Fn-1,互相比較

的值,確定這些值中的最小值,并且確定相應(yīng)于最小值的指數(shù)i1∈Fn,也就是 因此成份A(in,jn)被標(biāo)識(shí)為有待編碼的要素中對(duì)于空間精度的重要性最低的成份,相比于其它有待編碼的要素A(k,j),(k,j)∈En-1。
·步驟2j 對(duì)于每個(gè)頻帶Fj,重新定義來自于第n次迭代的一般葛容角度向量
若j∈
\{jn}; 若j=j(luò)n. 該重新定義的一般葛容角度向量,針對(duì)等于Dn的量化速率建立,考慮到有待編碼的要素A(in,jn)的刪除,并且將被用于下面的迭代。
·步驟2k 配對(duì)(in,jn)的標(biāo)識(shí)符被傳送到排序模塊6,作為過程Proc2的第n次迭代的結(jié)果。
·步驟2m 然后,有待編碼的要素(in,jn)被從過程Proc2中的剩余部分的有待編碼的要素集合中刪除,也就是有待編碼的要素A(in,jn)被刪除。
定義序列En=En-1\(in,jn)。有待編碼的要素A(i,j)仍然要被排序,其中(i,j)∈En。有待編碼的要素A(i,j),其中(i,j)∈{(i1,j1)...,(in,jn)},已經(jīng)在第1到n迭代中被排序。
過程Proc2被重復(fù)r次,且最多為Q*M-1次。
然后,排序模塊6將優(yōu)先級(jí)指數(shù)分配給有待編碼的要素,其目的在于將編碼數(shù)據(jù)插入到二進(jìn)制序列。
有待編碼的要素的排序以及二進(jìn)制序列的構(gòu)造,基于過程Proc2的連續(xù)重復(fù)所提供的連續(xù)結(jié)果 在一個(gè)實(shí)施例中,基于由模塊5所執(zhí)行的過程Proc2的連續(xù)重復(fù)所提供的連續(xù)結(jié)果有待編碼的要素由排序模塊6執(zhí)行排序,其中模塊5用于定義有待編碼的要素的最小相關(guān)要素,(排除由過程Proc1提供的結(jié)果),排序模塊6定義了所述有待編碼要素的順序,其反映了與空間精度相關(guān)的有待編碼要素的重要性。
參考圖5b,與配對(duì)相應(yīng)(i1,j1)的在過程Proc2的第1次迭代過程中所確定的有待編碼的要素A(i1,j1)被認(rèn)為是與空間精度最小相關(guān)的要素。因此,模塊5分配了一個(gè)最小優(yōu)先級(jí)指數(shù)Prio1。
在分配了優(yōu)先級(jí)指數(shù)Prio1之后,與配對(duì)相應(yīng)(i2,j2)的在過程Proc2的第二次迭代過程中確定的有待編碼的要素A(i2,j2)被認(rèn)為是與空間精度最小相關(guān)的要素。因此分配了一個(gè)最小優(yōu)先級(jí)指數(shù)Prio2,其中Prio2>Prio1。因此,排序模塊6連續(xù)為r個(gè)有待編碼的要素中的每個(gè)都分配了逐漸增加的優(yōu)先級(jí)指數(shù)Prio1,Prio2到Prio r。
在過程Proc2的重復(fù)過程中還沒有被分配優(yōu)先級(jí)次序的有待編碼的要素比分配了優(yōu)先級(jí)次序的有待編碼的要素的有關(guān)空間精度的重要性更高。
當(dāng)r等于Q*M-1次時(shí),有待編碼的要素集合被一個(gè)接一個(gè)地排序。
在上述情況下,可以認(rèn)為執(zhí)行的過程Proc2的迭代次數(shù)r的數(shù)目等于Q*M-1。
分配給有待編碼的要素A(k,j)的優(yōu)先級(jí)次序也被分配給已編碼的要素,根據(jù)該有待編碼要素的量化結(jié)果A(k,j)。與有待編碼的要素A(k,j)相應(yīng)的已編碼要素同樣表示為A(k,j)。
用于構(gòu)造二進(jìn)制序列的模塊8構(gòu)造一個(gè)與每個(gè)信號(hào)Si(i=1到N)的幀相應(yīng)的二進(jìn)制序列Seq,按照所分配的優(yōu)先級(jí)指數(shù)逐漸降低,這些序列連續(xù)地整合成為已編碼要素A(k,j),二進(jìn)制序列成為待發(fā)送的碼流Φ。
因此,組成的二進(jìn)制序列Seq由模塊6所執(zhí)行的排序進(jìn)行排序。
在上述實(shí)施例中,在過程Proc2中的每一次迭代時(shí)從有待編碼的要素A(i,j)中刪除一個(gè)頻譜成份。
在另一個(gè)實(shí)施例中,一個(gè)重疊量化器被用于量化步驟。在這種情況下,在過程Proc2的迭代過程中被標(biāo)識(shí)的關(guān)于空間精度的重要性最低的有待編碼要素的頻譜成份未被刪除,但相對(duì)于有待排序的有待編碼要素的其它頻譜成份,對(duì)該成份的編碼分配了一個(gè)減小的速率。
因此,編碼器1是一個(gè)考慮到不同單頻信號(hào)之間的干擾,而允許速率可適配性的編碼器。它使得定義優(yōu)化感知空間精度的壓縮數(shù)據(jù)成為可能。
過程Proc1和Proc2的聯(lián)合 在一個(gè)實(shí)施例中,有待編碼的要素中重要性最低的要素通過使用了一個(gè)聯(lián)合上述過程Proc1和Proc2的的方法的過程Proc的方法而得到定義,根據(jù)一個(gè)考慮到總體聲音質(zhì)量和空間相關(guān)性的標(biāo)準(zhǔn)。
過程Proc的初始化包括上述過程Proc1和Proc2的初始化。
現(xiàn)在結(jié)合圖11對(duì)這樣一個(gè)方法Proc的第n次迭代(n>1)進(jìn)行描述,考慮第(n+1)個(gè)編碼速率Dn,以及一個(gè)有待排序的有待編碼的要素A(k,j)集合,其中(k,j)∈En-1。
基于使用了Proc1和Proc2的方法的方法Proc的前一次迭代,該速率以及該有待編碼的要素集合在方法Proc的前一次迭代過程中被確定。根據(jù)所定義的標(biāo)準(zhǔn),前一次迭代已經(jīng)允許確定有待編碼要素為最不重要的要素。
根據(jù)所需要的總體聲音質(zhì)量和空間精度,這些所定義的標(biāo)準(zhǔn)已經(jīng)被建立。
平行地,過程Proc1的步驟1d和1e的重復(fù)是基于該有待排序的要素集合,確定與總體聲音質(zhì)量最小相關(guān)的有待編碼的要素A(in1,jn1),并且過程Proc2的步驟2e和2i的重復(fù)是基于該有待排序的要素序列,確定與空間精度最小相關(guān)的有待編碼的要素A(in2,jn2)。
根據(jù)所定義的標(biāo)準(zhǔn),在步驟300中,兩個(gè)所確定的有待編碼要素中的一個(gè)或者兩個(gè)被選擇。這個(gè)或者每個(gè)被選擇的有待編碼的要素表示為A(in,jn)。
接著,另一方面,配對(duì)(in,jn)的一個(gè)或多個(gè)標(biāo)識(shí)符被提供到排序模塊6,作為過程Proc2的第n次迭代的結(jié)果,模塊6根據(jù)已經(jīng)定義的標(biāo)準(zhǔn)對(duì)其分配一個(gè)優(yōu)先級(jí)Prion。該分配的優(yōu)先級(jí)Prio n比在過程Proc的前一次迭代中根據(jù)已定義的標(biāo)準(zhǔn)為所選擇的有待編碼的要素所分配的優(yōu)先級(jí)大。該步驟代替了如前所述的過程Proc1的步驟1f以及過程Proc2的步驟2k。
該被選擇的有待編碼的一個(gè)或多個(gè)要素接著被插入到將被發(fā)送的二進(jìn)制序列,在方法Proc的前一次迭代過程中被選擇的有待編碼的要素之前(由于根據(jù)已定義的標(biāo)準(zhǔn),有待編碼的要素A(in,jn)的重要性比被過程Proc之前所選擇的有待編碼的要素的重要性更高)。該被選擇的一個(gè)或多個(gè)有待編碼的要素A(in,jn)被插入到將被發(fā)送的二進(jìn)制序列,在集合En-1的其它有待編碼的要素(由于根據(jù)已定義的標(biāo)準(zhǔn),該有待編碼的要素A(in,jn)的重要性比這些其它有待編碼的要素的重要性更低)。
另一方面,在步驟301中,被選擇用于方法Proc的下一次迭代(第n+1次迭代)(包括方法Proc 1和Proc 2的第n+1次迭代)的一個(gè)或多個(gè)有待編碼的要素A(in,jn)被刪除,并接著應(yīng)用于有待編碼的要素集合En=En-1\A(in,jn),基于一個(gè)如過程Proc1的步驟1g以及過程Proc 2的步驟2n中定義的被減小的速率。
該步驟301代替了如前所述的方法Proc1的步驟1g以及過程Proc 2的步驟2m。
該被定義的標(biāo)準(zhǔn)使得選擇分別在方法Proc的步驟300中所標(biāo)識(shí)出的一個(gè)或多個(gè)最小相關(guān)要素成為可能。
例如,在一個(gè)實(shí)施例中,由過程Proc1在每一次迭代n中所標(biāo)識(shí)出的要素被刪除,其中n為偶數(shù),并且由過程Proc2在每一次迭代n時(shí)所標(biāo)識(shí)出的要素被刪除,其中n為奇數(shù),這使得最佳程度地保持總體聲音質(zhì)量以及空間精度成為可能。
也可以使用其它標(biāo)準(zhǔn)。執(zhí)行這樣的方法Proc的一種編碼使得獲得一個(gè)關(guān)于聲音質(zhì)量以及空間精度的可適配速率的碼流成為可能。
在解碼側(cè)所執(zhí)行的操作 解碼器100包括二進(jìn)制序列讀取模塊104,逆量化模塊105,逆環(huán)繞聲變換模塊101以及頻率/時(shí)間變換模塊102。
解碼器100用于在輸入端接收編碼器1發(fā)送的碼流Φ,并且在輸出端輸出Q′個(gè)信號(hào)S′1,S′2,...,S′Q′,用于提供給聲音表現(xiàn)系統(tǒng)103的Q′個(gè)對(duì)應(yīng)的喇叭H1,...,HQ′。在一個(gè)實(shí)施例中,喇叭的數(shù)目Q′可以與所發(fā)送的環(huán)繞聲成份的數(shù)目Q不同。
作為示例,圖7示出了一個(gè)包括8個(gè)喇叭h1,h2...,h8的聲音表現(xiàn)系統(tǒng)的配置。
二進(jìn)制序列讀取模塊104從所接收的二進(jìn)制序列Φ中提取數(shù)據(jù),該數(shù)據(jù)指示為要素所確定的A(k,j)(k=1到Q且j=0到M-1)的量化指數(shù),并且將它們提供給逆量化模塊105的輸入端。
逆量化模塊105執(zhí)行逆量化操作。
確定要素A′(k,j),k=1到Q且j=0到M-1的要素矩陣A′,以使得當(dāng)接收到的序列包括表示要素A(k,j)的量化指數(shù)時(shí),A′(k,j)=A(k,j),其中A(k,j)來自于解碼器的環(huán)繞聲成份的參數(shù)編碼A(k,j),以及當(dāng)接收到的序列不包括表示要素A(k,j)的量化指數(shù)時(shí)(例如,這些數(shù)據(jù)已經(jīng)在碼流服務(wù)器側(cè)被截?cái)啵员氵m應(yīng)網(wǎng)絡(luò)的可適配速率和/或終端的特性),A′(k,j)=0。
逆空間變換模塊101適于確定矩陣X′的元素X′(i,j),i=1到Q′,j=0到M-1,,該矩陣X’定義了Q′i個(gè)信號(hào)中的每一個(gè)S′i的M個(gè)頻譜系數(shù),i=1到Q′,j=0到M-1,,基于環(huán)繞聲成份A′(k,j),其中k=1到Q且j=0到M-1,被逆量化模塊105所確定。
AmbInv(p′,Q′)是對(duì)于3D場(chǎng)景的p’階逆環(huán)繞聲變換矩陣,用于確定Q′個(gè)信號(hào)S′i,i=1到Q′,用于與解碼器100相關(guān)的聲音表現(xiàn)系統(tǒng)的Q′個(gè)喇叭,基于接收到的Q個(gè)環(huán)繞聲成份。角度βi,其中i=1到Q′,表示來自喇叭Hi的聲音傳播角度。在圖7的示例中,這些角度對(duì)應(yīng)于由喇叭所發(fā)出的聲音的傳播軸線與軸XX之間的角度。
X′是信號(hào)Si′(i=1到Q′)關(guān)于頻帶Fj(j=0到M-1)的頻譜成份X′(i,j)的矩陣。這樣 并且 并且我們有 X′=AmbInv(p′,Q′)×A′ 等式(7)。
逆空間變換模塊101用于根據(jù)等式(7)確定矩陣X’的元素,頻譜系數(shù)X′(i,j),i=1到Q′,j=0到M-1。
這些元素X′(i,j),i=1到Q′,j=0到M-1,一旦確定,就被發(fā)送到頻率/時(shí)間變換模塊102的輸入端。
解碼器100的頻率/時(shí)間變換模塊102基于接收到的頻譜系數(shù)X′(i,j),i=1到Q′,j=0到M-1,將頻率空間表示(the space of frequency representation)變換為時(shí)間空間表示(the space of time representation)(該變換在當(dāng)前情況下為逆MDCT變換),并且,它可以因此確定Q′個(gè)信號(hào)S′1...,S’Q′中的每一個(gè)的時(shí)間幀。
每一個(gè)信號(hào)S′i,i=1到Q′,用于聲音表現(xiàn)系統(tǒng)103的喇叭Hi。
在一個(gè)實(shí)施例中,由解碼器執(zhí)行的操作中的至少一些通過解碼器處理裝置的計(jì)算機(jī)程序指令執(zhí)行。
對(duì)于來自前述信號(hào)S1,...,SN的環(huán)繞聲變換的成份的編碼的一個(gè)優(yōu)點(diǎn)是,如果聲音場(chǎng)景的信號(hào)數(shù)目N很大,它們可以通過一個(gè)比N小很多的Q個(gè)環(huán)繞聲成份來表示,同時(shí)很小程度地降低信號(hào)的空間質(zhì)量。需要發(fā)送的數(shù)據(jù)量因此而被減小,同時(shí)沒有明顯降低聲音場(chǎng)景的聲音質(zhì)量。
根據(jù)本發(fā)明的編碼的另一個(gè)優(yōu)點(diǎn)在于,這樣的編碼可以適配于不同類型的聲音表現(xiàn)系統(tǒng),無論該聲音表現(xiàn)系統(tǒng)提供的是何種數(shù)量、排列以及類型的喇叭。
事實(shí)上,接收包括Q個(gè)環(huán)繞聲成份的二進(jìn)制序列的解碼器,后續(xù)可以執(zhí)行任何階次p’的逆環(huán)繞聲變換的操作,并且與將使用被解碼信號(hào)的聲音表現(xiàn)系統(tǒng)的喇叭數(shù)目Q′相應(yīng)。
編碼器1執(zhí)行的編碼使得,利用第一過程Proc1根據(jù)有待編碼的要素對(duì)聲音質(zhì)量的貢獻(xiàn),和/或利用第二過程Proc2根據(jù)有待編碼的要素對(duì)空間精度以及在聲音場(chǎng)景中包含的傳播方向的正確再現(xiàn)的貢獻(xiàn),對(duì)有待編碼的要素進(jìn)行排序成為可能。
為了與所使用的速率限制相適應(yīng),完全可以截?cái)嘣谛蛄兄信帕械木哂休^低優(yōu)先級(jí)次序的要素的序列。然后,可以保證提供最佳總體聲音質(zhì)量(當(dāng)執(zhí)行過程Proc1時(shí))和/或最佳空間精度(當(dāng)執(zhí)行過程Proc2時(shí))。事實(shí)上,對(duì)于要素的排序已經(jīng)以這樣的方式執(zhí)行,即那些對(duì)于總體聲音質(zhì)量和/或空間精度貢獻(xiàn)最小的要素被置于序列的末端。
為了確定一個(gè)二進(jìn)制序列,過程Proc1和Proc 2可以根據(jù)各實(shí)施例彼此單獨(dú)或者組合實(shí)施。
權(quán)利要求
1.一種用于對(duì)有待編碼的要素(A1...,AQ)的頻譜成份進(jìn)行排序的方法,這些成份產(chǎn)生于一個(gè)包括N個(gè)信號(hào)(Sii=1到N)的聲音場(chǎng)景,其中N>1,一個(gè)有待編碼的要素包括與各個(gè)不同頻帶相關(guān)的頻譜成份,其特征在于,該方法包括以下步驟
-計(jì)算至少一些頻譜成份的各自影響,可以根據(jù)產(chǎn)生于N個(gè)信號(hào)中的至少一些的頻譜參數(shù)進(jìn)行計(jì)算,根據(jù)所述頻譜成份的編碼基于頻帶上的遮噪比確定;
-根據(jù)針對(duì)所述頻譜成份所計(jì)算出的影響,與其他計(jì)算出的影響相比較,給至少一個(gè)頻譜成份分配優(yōu)先級(jí)次序。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,計(jì)算頻譜成份的影響通過以下步驟進(jìn)行
a-對(duì)根據(jù)第一速率編碼的有待編碼要素的頻譜成份的第一集合進(jìn)行編碼;
b-確定每個(gè)頻帶的第一遮噪比;
c-確定比所述第一速率低的第二速率;
d-刪除有待編碼的要素中的所述通常頻譜成份,并對(duì)根據(jù)第二速率的有待編碼的要素的剩余頻譜成份進(jìn)行編碼;
e-確定每個(gè)頻帶的第二遮噪比;
f-根據(jù)對(duì)于每個(gè)頻帶的第一和第二速率的第一和第二遮噪比之間已確定的差別,計(jì)算遮噪比的變化;
g-針對(duì)用于排序的有待編碼的要素的頻譜成份集合中的每一個(gè)頻譜成份迭代步驟d到f,并確定最小遮噪比的變化;分配給符合最小變化的頻譜成份的優(yōu)先級(jí)次序作為最小優(yōu)先級(jí)次序。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,針對(duì)用于排序的有待編碼的要素的頻譜成份集合再重復(fù)步驟a到g,所述集合通過刪除已經(jīng)分配優(yōu)先級(jí)順序的頻譜成份而受到限制。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,針對(duì)用于排序的有待編碼的要素的頻譜成份集合再重復(fù)步驟a到g,其中已經(jīng)分配優(yōu)先級(jí)順序的頻譜成份在使用重疊量化器期間被分配了更低的量化值。
5.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,其中所述有待編碼的要素包括對(duì)于N個(gè)信號(hào)計(jì)算的頻譜參數(shù)。
6.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,其中所述有待編碼的要素包括通過對(duì)于N個(gè)信號(hào)計(jì)算的頻譜參數(shù)進(jìn)行空間變換所得到的要素(A1...,AQ)。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述空間變換是環(huán)繞聲變換。
8.根據(jù)權(quán)利要求6或7所述的方法,其特征在于,根據(jù)因?yàn)榫幋a以及與有待編碼要素相關(guān)的誤差,空間變換矩陣以及依據(jù)所述空間變換矩陣的變換,確定所述遮噪比。
9.根據(jù)前述權(quán)利要求中任一項(xiàng)以及權(quán)利要求6所述的方法,一些頻譜成份是環(huán)繞聲成份的頻譜參數(shù),所述方法還包括以下步驟
a.基于角度向量計(jì)算所述頻譜成份中的至少一些的影響,所述角度向量根據(jù)與葛容準(zhǔn)則相關(guān)的能量和速度向量定義,并根據(jù)基于所述量化的環(huán)繞聲成份的逆環(huán)繞聲變換來計(jì)算;
b.根據(jù)針對(duì)至少一個(gè)頻譜成份所計(jì)算的影響與其它計(jì)算所得的影響,為所述至少一個(gè)頻譜成份分配優(yōu)先級(jí)順序。
10.一鐘排序模塊(5),包括用于執(zhí)行根據(jù)前述權(quán)利要求中任一項(xiàng)所述方法的裝置。
11.一種用于對(duì)在輸出碼流中包括N個(gè)不同信號(hào)的3D聲音場(chǎng)景進(jìn)行編碼的編碼器(1),其中N>1,該編碼器包括
-變換模塊(3,4),用于根據(jù)N個(gè)信號(hào)確定與各個(gè)頻帶相關(guān)的頻譜成份;
-根據(jù)權(quán)利要求10所述的排序模塊(6),用于對(duì)與各個(gè)頻帶相關(guān)的頻譜成份中的至少一些進(jìn)行排序;
-用于構(gòu)造二進(jìn)制序列的模塊(8),根據(jù)所述排序模塊執(zhí)行的排序,用于構(gòu)造二進(jìn)制序列,
所述序列包括指示與各個(gè)頻帶相關(guān)的頻譜成份的數(shù)據(jù)。
12.一種安裝在排序模塊(6)中的計(jì)算機(jī)程序,在通過所述模塊的處理裝置執(zhí)行該程序過程中,所述程序包括用于執(zhí)行根據(jù)權(quán)利要求1至9中任一項(xiàng)所述方法的指令。
13.一種二進(jìn)制序列,包括與產(chǎn)生于包括N個(gè)信號(hào)的聲音場(chǎng)景中的待編碼的要素的各個(gè)頻帶相關(guān)的頻譜成份,其中N>1,其特征在于,這些頻譜成份中的至少一些是根據(jù)權(quán)利要求1至9中任一項(xiàng)所述的排序方法進(jìn)行排序的。
全文摘要
本發(fā)明涉及一種用于對(duì)有待編碼的要素(A1,...,AQ)進(jìn)行排序的方法,這些要素產(chǎn)生于一個(gè)包括N個(gè)信號(hào)(Sii=1到N)的聲音場(chǎng)景,其中N>1,一個(gè)有待編碼的要素包括與各個(gè)頻帶相關(guān)的頻譜成份,其特征在于,該方法包括以下步驟計(jì)算至少一些頻譜成份的各自影響,這些成份可以通過產(chǎn)生于N個(gè)信號(hào)中的至少一些的頻譜參數(shù)的函數(shù)進(jìn)行計(jì)算,基于頻帶上的遮噪比確定,根據(jù)一個(gè)對(duì)于所述頻譜成份編碼的函數(shù);分配至少一個(gè)頻譜成份的優(yōu)先級(jí)次序,通過一個(gè)函數(shù)比較計(jì)算出的所述頻譜成份的影響與其它成份的影響。
文檔編號(hào)G10L19/00GK101730832SQ200880022393
公開日2010年6月9日 申請(qǐng)日期2008年4月16日 優(yōu)先權(quán)日2007年5月10日
發(fā)明者艾迪·莫辛, 拉蒂夫·杰隆·圖伊米 申請(qǐng)人:法國電信
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1