專利名稱:一種分層音頻編碼幀結(jié)構(gòu)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種音頻編碼幀結(jié)構(gòu),更具體地,涉及一種分層音頻編碼幀結(jié)構(gòu)。
背景技術(shù):
如圖1A-1B所示,作為中國音頻編碼電子行業(yè)標(biāo)準(zhǔn)的DRA音頻編、解碼技術(shù)近年來 已為業(yè)內(nèi)所熟知。有關(guān)DRA (Digital Rise Audio)音頻編解碼技術(shù)更詳細(xì)的內(nèi)容可參見信 息產(chǎn)業(yè)部2007年1月4日發(fā)布的、標(biāo)準(zhǔn)序號(hào)SJ/T11368-2006的行業(yè)標(biāo)準(zhǔn),該標(biāo)準(zhǔn)的全部內(nèi) 容在此以引用的方式并入本文。另外,為了敘述方便,下文中將該標(biāo)準(zhǔn)簡稱為“DRA標(biāo)準(zhǔn)”, 并將與DRA標(biāo)準(zhǔn)相應(yīng)的DRA多聲道數(shù)字音頻編解碼技術(shù)簡稱為“DRA技術(shù)”。DRA技術(shù)是一種高質(zhì)量的多聲道音頻編碼算法,其可支持固定碼率和可變碼率音 頻編碼,為DRA技術(shù)在不同領(lǐng)域的實(shí)施和推廣打下了良好的基礎(chǔ)。但DRA技術(shù)目前還不 能支持分層編碼(即,可伸縮編碼),這就使其無法具有下文所述的可伸縮編碼算法所具 備的額外的優(yōu)勢(1)將最重要(內(nèi)層)的數(shù)據(jù)包以更好的錯(cuò)誤保護(hù)機(jī)制傳輸a)當(dāng)使用 UEP(Unequal Error Protection 不等錯(cuò)保護(hù))時(shí),可以從內(nèi)層到外層劃分不同保護(hù)級(jí)別 的數(shù)據(jù)塊;b)當(dāng)進(jìn)行自適應(yīng)信道調(diào)度(如利用OFDM多載波中不同載波具有不同的信噪比 時(shí))來實(shí)現(xiàn)UEP等作用,需要要求音頻編碼具有分級(jí)分層的數(shù)據(jù)結(jié)構(gòu)。(2)對于網(wǎng)絡(luò)(打包 方式)傳輸a)能夠標(biāo)記每個(gè)音頻幀中各個(gè)數(shù)據(jù)包的重要性;b)如果當(dāng)前所獲得的帶寬下 降,可以丟掉不重要的包(即外層碼流數(shù)據(jù)),可以保證實(shí)時(shí)播放(不需要緩沖)。(3)對于 音頻數(shù)據(jù)庫a)高質(zhì)量內(nèi)容被編碼和存儲(chǔ);b)不用重新編碼,可以預(yù)聽其低質(zhì)量版本。(4) 對于僅僅一次編碼,即可用于多傳輸通道的同播節(jié)目源如可以用于多種網(wǎng)絡(luò)傳輸路徑或 無線傳輸通道,不需要另外編碼(相對應(yīng)VBR模式情況,VBR可以滿足一種特定可變帶寬應(yīng) 用)。隨著DRA技術(shù)在產(chǎn)業(yè)中越來越廣泛地應(yīng)用,有必要定義一種基于DRA核心算法的 分層編碼幀結(jié)構(gòu),通過該幀結(jié)構(gòu)存儲(chǔ)的音頻可至少獲得上文(1)_(4)所述的優(yōu)點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于基于現(xiàn)有的DRA音頻編碼關(guān)鍵技術(shù),設(shè)計(jì)可分層的DRA音頻編 碼幀結(jié)構(gòu),使DRA技術(shù)能被應(yīng)用在一些需要分層編碼的技術(shù)領(lǐng)域中。本發(fā)明首先提供了一種分層音頻編碼方法,其包括:A)通過多聲道音頻編碼算法 編碼輸入多聲道音頻數(shù)據(jù);B)被編碼的數(shù)據(jù)被分為多個(gè)輔助數(shù)據(jù)塊和多個(gè)頻譜塊;并且按 照多個(gè)頻譜塊中所含數(shù)據(jù)對應(yīng)的譜線序號(hào)值大小來排列各個(gè)頻譜塊。優(yōu)選地,多聲道音頻 編碼算法是DRA多聲道音頻編碼算法。進(jìn)一步地,所述方法還包括C)將多個(gè)頻譜塊的數(shù)據(jù)中與頻譜有關(guān)的部分分別排 列到多個(gè)頻譜塊中的每一個(gè)的譜系數(shù)部分中;以及D)將多個(gè)頻譜塊的數(shù)據(jù)中與頻譜無關(guān) 的部分分別排列到多個(gè)頻譜塊中的每一個(gè)的剩余部分,也就是邊信息部分中。進(jìn)一步地,在多個(gè)頻譜塊的每一個(gè)中,E)每一個(gè)譜系數(shù)部分都首先按照所對應(yīng)譜
3線序號(hào)值的大小排列編號(hào)較小的聲道,然后再按照所對應(yīng)譜線序號(hào)值的大小排列編號(hào)較大 的聲道。進(jìn)一步地,在多個(gè)頻譜塊的每一個(gè)中,E)每個(gè)譜系數(shù)部分都首先按照聲道編號(hào)的 大小排列具有較小譜線序號(hào)值的編碼數(shù)據(jù),然后再按照聲道編號(hào)的大小排列具有較大譜線 序號(hào)值的編碼數(shù)據(jù)。進(jìn)一步地,根據(jù)編碼特性,分別選擇上述E)和F)兩種方式之一對每個(gè)譜系數(shù)部分 進(jìn)行排列。優(yōu)選地,編碼特性包括僅使用E)或僅使用F)進(jìn)行所有譜系數(shù)部分排列所獲得的 總編碼效率。更進(jìn)一步地,每一個(gè)頻譜塊的長度可精確對應(yīng)固定比特率地劃分、近似對應(yīng)固定 比特率地劃分、以及基于相應(yīng)DRA碼書段的長度來劃分頻譜塊的長度。更進(jìn)一步地,可通過在前和在后的各一個(gè)頻譜塊恢復(fù)當(dāng)前的頻譜塊。優(yōu)選地,頻譜 塊恢復(fù)包括使用在前和在后的各一個(gè)頻譜塊的系數(shù)進(jìn)行線性內(nèi)插。更進(jìn)一步地,頻譜塊的分層個(gè)數(shù)的計(jì)算方法為頻譜塊的分層個(gè)數(shù)=(碼率所對 應(yīng)的幀長_幀頭_邊信息)/分層帶寬。更進(jìn)一步地,頻譜塊的邊界都代替DRA碼書段的邊界。更進(jìn)一步地,當(dāng)頻譜塊的邊界與DRA碼書段的邊界的距離小于某個(gè)預(yù)定閾值時(shí), 采用DRA碼書段的邊界來代替頻譜塊的邊界;當(dāng)頻譜塊的邊界與DRA碼書段的邊界的距離 大于某個(gè)預(yù)定閾值時(shí),采用頻譜塊的邊界代替DRA碼書段的邊界。本發(fā)明還提供了一種分層音頻編碼系統(tǒng),包括G)音頻編碼器,編碼器使用多聲道 音頻編碼算法;H)分割器,包括分割模塊,將被編碼的數(shù)據(jù)分割為多個(gè)輔助數(shù)據(jù)塊和多個(gè) 頻譜塊;該系統(tǒng)按照多個(gè)頻譜塊中所含數(shù)據(jù)對應(yīng)的譜線序號(hào)值大小來排列各個(gè)頻譜塊。優(yōu)選地,多聲道音頻編碼算法是DRA多聲道音頻編碼算法。進(jìn)一步地,分割器還包括排列模塊,其用于I)將多個(gè)頻譜塊的數(shù)據(jù)中與頻譜有關(guān) 的部分排列到多個(gè)頻譜塊中的每一個(gè)的譜系數(shù)部分中;以及J)將多個(gè)頻譜塊的數(shù)據(jù)中與 頻譜無關(guān)的部分排列到多個(gè)頻譜塊中的每一個(gè)的邊信息部分。進(jìn)一步地,在多個(gè)頻譜塊的每一個(gè)中,E)每個(gè)譜系數(shù)部分都首先按照所對應(yīng)譜線 序號(hào)值的大小排列編號(hào)較小的聲道,然后再按照所對應(yīng)譜線序號(hào)值的大小排列編號(hào)較大的聲道。進(jìn)一步地,在多個(gè)頻譜塊的每一個(gè)中,F(xiàn))每個(gè)譜系數(shù)部分都首先按照聲道編號(hào)的 大小排列具有較小譜線序號(hào)值的編碼數(shù)據(jù),然后再按照聲道編號(hào)的大小排列具有較大譜線 序號(hào)值的編碼數(shù)據(jù)。進(jìn)一步地,根據(jù)編碼特性,分別選擇上述E)和F)兩種方式之一對每個(gè)譜系數(shù)部分 進(jìn)行排列。優(yōu)選地,編碼特性包括僅使用E)或僅使用F)進(jìn)行所有譜系數(shù)部分排列所獲得的 總編碼效率。更進(jìn)一步地,每一個(gè)頻譜塊的長度可精確對應(yīng)固定比特率地劃分、近似對應(yīng)固定 比特率地劃分、以及基于相應(yīng)DRA碼書段的長度來劃分頻譜塊的長度。更進(jìn)一步地,可通過在前和在后的各一個(gè)頻譜塊恢復(fù)當(dāng)前的頻譜塊。優(yōu)選地,頻譜塊恢復(fù)包括使用在前和在后的各一個(gè)頻譜塊的系數(shù)進(jìn)行線性內(nèi)插。更進(jìn)一步地,頻譜塊的分層個(gè)數(shù)的計(jì)算方法為頻譜塊的分層個(gè)數(shù)=(碼率所對 應(yīng)的幀長_幀頭_邊信息)/分層帶寬。更進(jìn)一步地,頻譜塊的邊界都代替DRA碼書段的邊界。更進(jìn)一步地,當(dāng)頻譜塊的邊界與DRA碼書段的邊界的距離小于某個(gè)預(yù)定閾值時(shí), 采用DRA碼書段的邊界來代替頻譜塊的邊界;當(dāng)頻譜塊的邊界與DRA碼書段的邊界的距離 大于某個(gè)預(yù)定閾值時(shí),采樣頻譜塊的邊界代替DRA碼書段的邊界。本發(fā)明還提供了一種分層編碼的多聲道數(shù)字音頻幀結(jié)構(gòu),包括多個(gè)輔助數(shù)據(jù)塊 和多個(gè)頻譜塊;并且按照多個(gè)頻譜塊中所含數(shù)據(jù)對應(yīng)的譜線序號(hào)值大小來排列各個(gè)頻譜 塊。優(yōu)選地,幀結(jié)構(gòu)保存的是經(jīng)過DRA多聲道音頻編碼算法編碼后的數(shù)據(jù)。進(jìn)一步地,多個(gè)頻譜塊的每一個(gè)分別包括排列了多個(gè)頻譜塊的數(shù)據(jù)中與頻譜有 關(guān)部分的譜系數(shù)部分;以及邊排列了多個(gè)頻譜塊的數(shù)據(jù)中與頻譜無關(guān)部分的信息部分。進(jìn)一步地,在多個(gè)頻譜塊的每一個(gè)中,E)每個(gè)譜系數(shù)部分都首先按照所對應(yīng)譜線 序號(hào)值的大小排列編號(hào)較小的聲道,然后再按照所對應(yīng)頻譜的大小排列編號(hào)較大的聲道。進(jìn)一步地,在多個(gè)頻譜塊的每一個(gè)中,E)每個(gè)譜系數(shù)部分都首先按照聲道編號(hào)的 大小排列具有較小譜線序號(hào)值的編碼數(shù)據(jù),然后再按照聲道編號(hào)的大小排列具有較大譜線 序號(hào)值的編碼數(shù)據(jù)。進(jìn)一步地,根據(jù)編碼特性,分別選擇上述E)和F)兩種方式之一對每個(gè)譜系數(shù)部分 進(jìn)行排列。優(yōu)選地,編碼特性包括僅使用E)或僅使用F)進(jìn)行所有譜系數(shù)部分排列所獲得的 總編碼效率。更進(jìn)一步地,每一個(gè)頻譜塊的長度可精確對應(yīng)固定比特率地劃分、近似對應(yīng)固定 比特率地劃分、以及基于相應(yīng)DRA碼書段的長度來劃分頻譜塊的長度。更進(jìn)一步地,通過在前和在后的各一個(gè)頻譜塊可恢復(fù)當(dāng)前的頻譜塊。優(yōu)選地,頻譜 塊恢復(fù)包括使用在前和在后的各一個(gè)頻譜塊的系數(shù)進(jìn)行線性內(nèi)插。更進(jìn)一步地,頻譜塊的分層個(gè)數(shù)的計(jì)算方法為頻譜塊的分層個(gè)數(shù)=(碼率所對 應(yīng)的幀長_幀頭_邊信息)/分層帶寬。更進(jìn)一步地,頻譜塊的邊界都代替DRA碼書段的邊界。更進(jìn)一步地,當(dāng)頻譜塊的邊界與DRA碼書段的邊界的距離小于某個(gè)預(yù)定閾值時(shí), 采用DRA碼書段的邊界來代替頻譜塊的邊界;當(dāng)頻譜塊的邊界與DRA碼書段的邊界的距離 大于某個(gè)預(yù)定閾值時(shí),采用頻譜塊的邊界都代替DRA碼書段的邊界?;谏鲜黾夹g(shù)方案,在現(xiàn)有DRA編碼技術(shù)的基礎(chǔ)上,通過對被編碼的數(shù)據(jù)進(jìn)行分 層結(jié)構(gòu)處理,設(shè)計(jì)出可分層的DRA音頻編碼幀結(jié)構(gòu)。
圖1A和1B是方框圖,其分別示出了 DRA音頻編碼器和解碼器;圖1C示意性表示了經(jīng)過DRA音頻編碼器處理后的DRA音頻幀結(jié)構(gòu);圖2A是流程圖,其示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的分層音頻編碼方法;圖2B是流程圖,其示出了根據(jù)本發(fā)明又一實(shí)施例的分層音頻編碼方法;圖2C是流程圖,其示出了根據(jù)本發(fā)明再一實(shí)施例的分層音頻編碼方法;
在圖3是流程圖,其示出了根據(jù)本發(fā)明實(shí)施例的精確劃分頻譜塊0方法;在圖4是流程圖,其示出了根據(jù)本發(fā)明實(shí)施例的近似劃分頻譜塊0方法;在圖5A是示意圖,其示出了確定頻譜塊邊界與DRA碼書段邊界的方法;在圖5B是示意圖,其示出了確定頻譜塊邊界與DRA碼書段邊界的又一方法;
在圖5C是示意圖,其示出了確定頻譜塊邊界與DRA碼書段邊界的再一方法;圖6是方框圖,其示出了根據(jù)本發(fā)明實(shí)施例的一種分層音頻編碼系統(tǒng);圖7A是方框圖,其示出了根據(jù)本發(fā)明實(shí)施例的音頻幀結(jié)構(gòu);圖7B是方框圖,其示出了根據(jù)另一本發(fā)明實(shí)施例的音頻幀結(jié)構(gòu);以及圖7C是方框圖,其示出了根據(jù)本發(fā)明再一實(shí)施例的音頻幀結(jié)構(gòu)。
具體實(shí)施例方式通過借助附圖在下文中將描述本發(fā)明的優(yōu)選實(shí)施例。在以下描述中,將不詳細(xì)描 述已成為現(xiàn)有技術(shù)的功能或結(jié)構(gòu),因?yàn)椴槐匾募?xì)節(jié)將導(dǎo)致本發(fā)明的介紹含混不清。在圖IA中示出了典型的DRA音頻編碼器100,其可通過硬件、軟件、和/或韌件來 實(shí)現(xiàn)。簡言之,DRA標(biāo)準(zhǔn)所涉及的技術(shù)就是以多個(gè)技術(shù)模塊對源音(例如,輸入PCM樣本) 進(jìn)行信號(hào)處理,以達(dá)到幾乎無損壓縮源音的目的。上述多個(gè)技術(shù)模塊包括但不限于暫態(tài)分 析模塊120、多分辨率濾波器組模塊122、線性標(biāo)量量化模塊130、量化指數(shù)編碼模塊132、碼 表選擇模塊134、人耳聽覺模型模塊140、全局比特分配模塊142及多路復(fù)用模塊150。按照 DRA標(biāo)準(zhǔn)的相關(guān)規(guī)定,上述技術(shù)模塊為必選模塊,即符合標(biāo)準(zhǔn)的DRA輸出碼流(即,DRA標(biāo)準(zhǔn) 碼流)一定是經(jīng)過上述模塊處理后的碼流。與之相對應(yīng)地,圖IB中示出了典型的DRA音頻 解碼器,它用于接收被DRA編碼器處理后的碼流,并通過執(zhí)行編碼的逆過程而將編碼碼流 還原為PCM樣本輸出。圖IC示意性示出了經(jīng)過DRA音頻編碼器處理后的DRA音頻幀結(jié)構(gòu),包括同步字、 幀頭信息、每聲道的信息、填充比特、附加信息等5大部分。DRA技術(shù)是一種高質(zhì)量的多聲道音頻編碼算法,其可支持固定碼率和可變碼率音 頻編碼,為DRA技術(shù)在不同領(lǐng)域的實(shí)施和推廣打下了良好的基礎(chǔ)。但DRA技術(shù)目前還不能 支持分層編碼(即,可伸縮編碼),這就使其無法具有分層編碼所具備的優(yōu)勢。為了解決上述問題,本發(fā)明提供了基于DRA編碼技術(shù)的音頻分層編碼幀結(jié)構(gòu)。在隨后的附圖及說明中,幀頭信息(見圖1C,用于存儲(chǔ)和傳輸解碼所用的部分輔 助信息;為了更清楚地表示該部分的作用,下文也稱之為“幀頭邊信息”)包括原DRA幀中的 窗序列信息、幀頭類型信息、和差立體聲及強(qiáng)度立體聲總開關(guān)等信息;而在每個(gè)頻譜塊的編 碼邊信息(下文稱之為頻譜塊邊信息,見圖7A和7B)中,則包括了 Huffman碼書下標(biāo)和碼 書應(yīng)用范圍、譜系數(shù)量化下標(biāo)、譜系數(shù)量化步長、和差立體聲開關(guān)以及進(jìn)行強(qiáng)度立體聲時(shí)的 譜系數(shù)量化步長等信息。但本領(lǐng)域技術(shù)人員通過閱讀本說明書后能夠理解的是幀頭邊信 息以及頻譜塊邊信息中所包含的具體內(nèi)容并不受本發(fā)明限定。例如,頻譜塊邊信息中同樣 可包含和差立體聲及強(qiáng)度立體聲總開關(guān)等信息。圖2A示出了根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的分層音頻編碼方法10A。如圖所示,方 法IOA開始于步驟11 ;隨后,在步驟12中,接收來自外部裝置的多聲道音頻碼流。接下來, 在步驟13中,對接收的碼流行進(jìn)行分割,將它們分成多個(gè)輔助數(shù)據(jù)塊和多個(gè)頻譜塊。然后,在步驟14A中,將多個(gè)頻譜塊中的每一個(gè)頻譜塊分割成邊信息部分和譜系數(shù)部分(例如圖 7A中所示,頻譜塊O到頻譜塊N-I的每一個(gè)都被分為兩部分頻譜塊X的編碼邊信息和頻 譜塊X的熵編碼數(shù)據(jù),X從O到N-I之間取值),在譜系數(shù)部分中存儲(chǔ)與譜系數(shù)有關(guān)的部分。 接下來,在步驟15A中,每個(gè)譜系數(shù)部分中的數(shù)據(jù)都首先按照所對應(yīng)譜線序號(hào)值的大小排 列編號(hào)較小的聲道。然后,在步驟16A中,再按照所對應(yīng)譜線序號(hào)值的大小排列編號(hào)較大的 聲道。最后,如步驟17所示,將步驟16A產(chǎn)生的排列后的數(shù)據(jù)、步驟14A產(chǎn)生的邊信息部分、 以及步驟13產(chǎn)生的多個(gè)輔助數(shù)據(jù)塊一起打包,形成分層編碼的DRA幀(如圖7A所示,下文 還將詳細(xì)說明)。隨后,在步驟18結(jié)束編碼過程。優(yōu)選地,在步驟12所接收的多聲道音頻 碼流是經(jīng)過DRA編碼算法處理的音頻碼流。
圖2B示出了根據(jù)本發(fā)明的另一個(gè)優(yōu)選實(shí)施例的分層音頻編碼方法10B。如圖所 示(結(jié)合圖2A),方法IOB中的步驟11-13與方法IOA中的步驟11-13完全相同,在此不再 贅述。方法IOB和IOA的主要不同點(diǎn)在于當(dāng)存在多聲道音頻信號(hào)時(shí),通過首先對各個(gè)聲道 的頻域譜系數(shù)進(jìn)行交織來達(dá)到分層編碼的目的。具體來說,首先在步驟14B中,將多個(gè)頻譜 塊中的每一個(gè)頻譜塊分割成邊信息部分和譜系數(shù)部分(詳見圖7B,下文中還將詳細(xì)描述); 然后,在步驟15B中,每個(gè)譜系數(shù)部分都首先按照聲道編號(hào)的大小排列具有較小譜線序號(hào) 值的編碼數(shù)據(jù);接下來,在步驟16B中,再按照聲道編號(hào)的大小排列具有較大譜線序號(hào)值的 編碼數(shù)據(jù);最后,如步驟17所示,將步驟16B產(chǎn)生的排列后的數(shù)據(jù)、步驟14B產(chǎn)生的邊信息 部分以及步驟13產(chǎn)生的多個(gè)輔助數(shù)據(jù)塊一起打包,形成分層編碼的DRA幀(如圖7B所示, 下文還將詳細(xì)說明)。隨后,在步驟18結(jié)束編碼過程。優(yōu)選地,在步驟12所接收的多聲道 音頻碼流是經(jīng)過DRA編碼算法處理的音頻碼流。圖2C示出了根據(jù)本發(fā)明的再一個(gè)優(yōu)選實(shí)施例的分層音頻編碼方法10C。如圖所 示(結(jié)合圖2A、2B),方法IOC中步驟11-13與方法IOA中的步驟完全相同。接下來,在步 驟19中,判斷多個(gè)頻譜塊中的譜系數(shù)部分所采用的排列方法,具體判斷方法將在下文中詳 細(xì)描述。如果在步驟19中判斷標(biāo)志位為0,則執(zhí)行方法IOA中的步驟14A-16A ;否則,執(zhí)行 方法IOB中的步驟14B-16B。最后,如步驟17所示,將步驟16A或步驟16B排列后的數(shù)據(jù)、 步驟14A或步驟14B產(chǎn)生的邊信息部分、以及步驟13產(chǎn)生的多個(gè)輔助數(shù)據(jù)塊一起打包,形 成分層編碼的DRA幀(如圖7C所示,下文還將詳細(xì)說明)。隨后,在步驟18結(jié)束編碼過程。 優(yōu)選地,在步驟12所接收的多聲道音頻碼流是經(jīng)過DRA編碼算法處理的音頻碼流。具體來說,在步驟19中,標(biāo)志位是根據(jù)編碼特性決定的。編碼特性例如包括僅使 用方法IOA或僅使用方法IOB進(jìn)行所有譜系數(shù)部分排列所獲得的總編碼效率。步驟19所 進(jìn)行的判斷實(shí)際就是從方法IOA所對應(yīng)的效率和方法IOB所對應(yīng)的效率中選出兩者中較大 的一個(gè),然后輸出判斷結(jié)果選擇效率較高者對應(yīng)的那種編碼方法。在隨后的附圖及說明中,標(biāo)號(hào)η表示譜線序號(hào)值,BL表示預(yù)定的固定比特率(可 由用戶分配),Bn表示0-η個(gè)譜線的總碼率,L0表示頻譜塊0的長度。在圖3中示出了根據(jù)本發(fā)明實(shí)施例中的精確劃分頻譜塊0的長度Ltl的方法30。本 領(lǐng)域技術(shù)人員通過閱讀本說明書,可類推獲得其它頻譜塊的劃分方法。方法30開始于步驟 31,譜線序號(hào)值初始值設(shè)置為0。接下來,參考方法IOA在步驟32中對頻譜塊0中的譜系數(shù) 部分進(jìn)行排列。接下來在步驟33中,比較Bn與固定比特率BL的大小。如果Bn小于BL,則 使η加1,繼續(xù)進(jìn)行步驟32-33 ;否則,進(jìn)入判斷步驟34 當(dāng)Bn等于BL時(shí),轉(zhuǎn)到步驟35,令Ltl取值η并輸出L0 ;否則,轉(zhuǎn)到步驟36,令L0取值η-1并輸出Lqo根據(jù)本發(fā)明的另一個(gè)實(shí)施例,在步驟32還可能根據(jù)方法IOB或IOC對頻譜塊中的 譜系數(shù)部分進(jìn)行排列,然后再根據(jù)隨后的步驟判斷和輸出Ltl,上述對步驟32的變形對于本 領(lǐng)域技術(shù)人員來說是顯而易見地,在此不再贅述。根據(jù)方法30,當(dāng)選擇的Ltl使得每一頻譜塊的總比特率BJS于固定比特率BL時(shí), 在第Ltl個(gè)譜線所對應(yīng)的數(shù)據(jù)之后填充比特‘0’,直到總比特率達(dá)到固定比特率BL為止,以 保證精確匹配預(yù)定比特率。圖4示出了根據(jù)本發(fā)明實(shí)施例的近似劃分頻譜塊0的長度Ltl的方法40。下文將 詳細(xì)介紹頻譜塊0的近似劃分方法,本領(lǐng)域技術(shù)人員通過閱讀本說明書,可類推獲得其它 頻譜塊的劃分方法。本方法開始于步驟41,譜線序號(hào)值初始值設(shè)置為0。接下來在步驟42, 按照方法IOA對譜系數(shù)部分進(jìn)行排列。接下來,在步驟43中,比較Bn與固定比特率BL的大 小。如果Bn大于BL,則進(jìn)入步驟44 (隨后描述);否則,使η加1,繼續(xù)進(jìn)行步驟42-43。在 步驟44中,判斷Blri-BL的絕對值與Bn-BL的絕對值之間大小關(guān)系,并根據(jù)該判斷如下執(zhí)行 方法40 如果Blri-BL的絕對值大于或等于Bn-BL的絕對值,則進(jìn)入步驟46,使Ltl = η并輸 出L0 ;否則,進(jìn)入步驟45,使Ltl = η-1并輸出Lqo根據(jù)本發(fā)明的另一個(gè)實(shí)施例,在步驟42還可能根據(jù)方法IOB或IOC對頻譜塊中的 譜系數(shù)部分進(jìn)行排列,然后再根據(jù)隨后的步驟判斷和輸出Ltl,上述對步驟42的變形對于本 領(lǐng)域技術(shù)人員來說是顯而易見地,在此不再贅述。根據(jù)方法40,選取的Ltl保證頻譜塊0的總比特率B。與固定比特率BL最為接近 (但可能大于或小于BL)。當(dāng)Ltl所對應(yīng)的比特率Btl超出固定比特率BL時(shí),不舍棄最后一個(gè) 譜線;當(dāng)L0所對應(yīng)的比特率Btl低于固定比特率BL時(shí),在其后也不填充比特‘0’。以上述方 法選取Ltl的結(jié)果只能是近似匹配預(yù)定比特率。根據(jù)本發(fā)明再一實(shí)施例,本發(fā)明還公開了通過在前和在后的各一個(gè)頻譜塊來恢復(fù) 丟失的當(dāng)前頻譜塊的方法。具體來說,用在前和在后的各一個(gè)頻譜塊的系數(shù)進(jìn)行線性內(nèi)插 恢復(fù)當(dāng)前頻譜塊。根據(jù)本發(fā)明的另一個(gè)實(shí)施例,本發(fā)明還公開了劃分頻譜塊個(gè)數(shù)的計(jì)算公式頻譜 塊的分層個(gè)數(shù)=(碼率所對應(yīng)的幀長_幀頭-邊信息)/分層帶寬。具體地,假定該幀的碼 率是128kbps,幀頭與邊信息所占的碼率是16kbps,分層帶寬為4kbps,根據(jù)計(jì)算公式,可以 得出頻譜塊的分層個(gè)數(shù)=(128kbps-16kbps)/4kbps = 28。在圖5A-5C中,示出了根據(jù)本發(fā)明再一實(shí)施例的、確認(rèn)頻譜塊邊界與DRA碼書段邊 界的方法。頻譜塊η的長度用Ln表示。在本發(fā)明的一個(gè)示例中,選取頻譜塊個(gè)數(shù)為3,當(dāng)然 也可取為其它數(shù)值。如圖5所示,頻譜塊分別為ΙΛ、ΙΑ、ΙΛ,邊界分別為a,b,c,d。DRA碼 書段分別為R0,R1, R2,邊界分別為a,,b,,C,,d,。在圖5A中,示出了用頻譜塊的邊界來代替DRA碼書段邊界的方法。即當(dāng)確定頻譜 塊ΙΛ、IA、LB2的邊界a,b,c,d時(shí),碼書段被重新劃分為Rtl, R1, R2,邊界a’,b’,C’,d’與頻 譜塊LB。LB1, LB2的邊界a,b,c, d完全對應(yīng)。即,頻譜塊的邊界一一對應(yīng)地代替了 DRA碼 書段的邊界。在圖5B中,示出了確定頻譜塊邊界與DRA碼書段邊界的又一方法。具體地,以邊界b為例首先是確定一閾值Tl,判斷頻譜塊邊界b與DRA碼書段邊界b’之間的距離。在圖5B中,頻譜塊邊界b與DRA碼書段邊界b’的距離小于預(yù)定閾值TI,判定采用DRA碼書段 邊界b’來代替頻譜塊邊界b。即,頻譜塊的邊界被重新劃分為b’。在圖5C中,示出了確定頻譜塊邊界與DRA碼書段邊界的再一方法。如圖5C所示, 虛線是原來DRA碼書段Rtl,邊界為b’。在圖5C的情況下,頻譜塊邊界b與DRA碼書段邊界 b’的距離大于某個(gè)預(yù)定閾值TI時(shí),此時(shí)與圖5B中方法相反,采用頻譜塊的邊界b代替DRA 碼書段的邊界b’。S卩,重新確認(rèn)DRA碼書段邊界b’,采用頻譜塊的邊界b來代替DRA碼書 段的邊界b’。
在圖6中,示出了根據(jù)本發(fā)明實(shí)施例的分層音頻編碼系統(tǒng)60。如圖所示,系統(tǒng)60 包括音頻編碼器62和分割器63。其中音頻編碼器62接收音頻數(shù)據(jù)61,并例如采用DRA多 聲道音頻編碼算法對音頻數(shù)據(jù)61加以音頻編碼處理。分割器63接收音頻編碼器62處理 后的數(shù)據(jù),并將輸出的數(shù)據(jù)打包64。分割器63包括分割模塊(未示出),用于將被編碼的 數(shù)據(jù)分割成多個(gè)輔助數(shù)據(jù)塊和多個(gè)頻譜塊,并以多個(gè)頻譜塊中所含數(shù)據(jù)對應(yīng)的譜線序號(hào)值 大小來排列各個(gè)頻譜塊。此外,分割器63中還可進(jìn)一步包括排列模塊(未示出),用于將多個(gè)頻譜塊的數(shù)據(jù) 中與頻譜有關(guān)的部分排列到多個(gè)頻譜塊中的每一個(gè)的譜系數(shù)部分中;以及將多個(gè)頻譜塊的 數(shù)據(jù)中與頻譜無關(guān)的部分排列到多個(gè)頻譜塊中的每一個(gè)的邊信息部分。分割器63中的排列模塊可以采用第一種方式來對每個(gè)譜系數(shù)部分進(jìn)行排列對 每一個(gè)頻譜塊中的每一個(gè)譜系數(shù)部分,首先按照所對應(yīng)譜線序號(hào)值的大小排列編號(hào)較小的 聲道,然后再按照所對應(yīng)譜線序號(hào)值的大小排列編號(hào)較大的聲道。分割器63中的排列模塊還可以采用第二種方式來對每個(gè)譜系數(shù)部分進(jìn)行排列 對每一個(gè)頻譜塊中的每一個(gè)譜系數(shù)部分,首先按照聲道編號(hào)的大小排列具有較小譜線序號(hào) 值的編碼數(shù)據(jù),然后再按照聲道編號(hào)的大小排列具有較大譜線序號(hào)值的編碼數(shù)據(jù)。分割器63中的排列模塊中還可以進(jìn)一步包括判斷模塊,根據(jù)編碼特性分別判斷 并選擇上述兩種方式之一來對每個(gè)譜系數(shù)部分進(jìn)行排列。其中,編碼特性包括僅使用第一 種方式或僅使用第二種方式來對每個(gè)譜系數(shù)部分進(jìn)行排列所獲得的總編碼效率;判斷模塊 用來選擇上述兩種方式中總編碼效率較高的那種譜系數(shù)部分排列的方式。分割器63中的分割模塊劃分頻譜塊的長度,可以精確對應(yīng)固定比特率劃分和近 似對應(yīng)固定比特率劃分以及基于相應(yīng)DRA碼書段的長度來劃分頻譜塊的長度。其中,精確 對應(yīng)固定比特率劃分和近似對應(yīng)固定比特率劃分的方法在前面分別結(jié)合圖3的方法30和 圖4的方法40中已經(jīng)詳細(xì)介紹,在此不再贅述。而基于相應(yīng)DRA碼書段的長度來劃分頻譜 塊的長度和方法,對于本領(lǐng)域技術(shù)人員來說是顯而易見地。分割器63中的分割模塊劃分后的頻譜塊,可以通過在前和在后的各一個(gè)頻譜塊 恢復(fù)丟失的當(dāng)前頻譜塊。具體來說,用在前和在后的各一個(gè)頻譜塊的系數(shù)進(jìn)行線性內(nèi)插恢 復(fù)當(dāng)前頻譜塊。根據(jù)本發(fā)明的另一個(gè)實(shí)施例,本發(fā)明還公開了劃分頻譜塊個(gè)數(shù)的計(jì)算公式頻譜 塊的分層個(gè)數(shù)=(碼率所對應(yīng)的幀長_幀頭-邊信息)/分層帶寬。具體地,假定該幀的碼 率是128kbps,幀頭與邊信息所占的碼率是16kbps,分層帶寬為4kbps,根據(jù)計(jì)算公式,可以 得出頻譜塊的分層個(gè)數(shù)=(128kbps-16kbps)/4kbps = 28。分割器62中的分割模塊劃分頻譜塊時(shí),根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例,對頻譜塊邊界的確定,有兩種方式。一種是以頻譜塊邊界都取代DRA碼書段的邊界。S卩,其中DRA碼 書段邊界與頻譜塊邊界一一對應(yīng)。另一種設(shè)定方式DRA碼書段邊界和頻譜塊邊界是通過設(shè)置某個(gè)預(yù)定閾值來實(shí)現(xiàn) 的。當(dāng)頻譜塊邊界與DRA碼書段邊界的距離小于某個(gè)預(yù)定閾值時(shí),采用DRA碼書段邊界來 代替頻譜塊邊界;當(dāng)頻譜塊邊界與DRA碼書段邊界的距離大于某個(gè)預(yù)定閾值時(shí),采用頻譜 塊邊界來代替DRA碼書段邊界。詳細(xì)的描述在前面結(jié)合圖5A、圖5B以及圖5C中已將介紹, 在此不在累贅。
在圖7A、7B及圖7C中詳細(xì)描述了根據(jù)本發(fā)明實(shí)施例的分層編碼方法所獲得的音 頻幀結(jié)構(gòu);其中,S[block] [ch] [bin]中的三維坐標(biāo)依次表示塊號(hào)、聲道號(hào)和譜系數(shù)。如圖7A、圖7B及圖7C所示,多聲道數(shù)字音頻幀結(jié)構(gòu)包括多個(gè)輔助數(shù)據(jù)塊和多個(gè)頻 譜塊。具體地,多個(gè)輔助數(shù)據(jù)塊包括同步字、幀頭信息及一般邊信息、填充比特、以及附加數(shù) 據(jù)等數(shù)據(jù)。進(jìn)一步地,按照多個(gè)頻譜塊中所含數(shù)據(jù)對應(yīng)的譜線序號(hào)值大小來排列各個(gè)頻譜 塊。具體地,頻譜塊分為N塊,分別標(biāo)記為頻譜塊O、頻譜塊1...頻譜塊N-1。進(jìn)一步地,多 個(gè)頻譜塊中的每一個(gè)頻譜塊分為譜系數(shù)部分和邊信息部分,其中,譜系數(shù)部分排列了編碼 后的數(shù)據(jù)中與頻譜有關(guān)的部分,邊信息部分排列了編碼后的數(shù)據(jù)中與頻譜無關(guān)的部分。如圖7A所示,對每一個(gè)頻譜塊中的每一個(gè)譜系數(shù)部分按照所對應(yīng)譜線序號(hào)值的 大小排列編號(hào)較小的聲道,然后再按照所對應(yīng)譜線序號(hào)值的大小排列編號(hào)較大的聲道。具體地,頻譜塊O的譜系數(shù)排列為S
S[O][O][Lq-I]、S[O][I][O] S
[1] [L0-I]. . · · S
[nch-1]
S
[nch-1] [L0-I]。頻譜塊1 的譜系數(shù)為 S[1H0][LJ StlHOHWlLStlHl] [L0] S[l] [1] [^+L1-I]. . . . S[l] [nch-1] [L0] S [ 1 ] [nch-1 ] [LjL1-1 ]頻
譜塊 H 的譜系數(shù)為 S[N.1]
[] S[N-1]
[]、
N-2Ν-\Λ _2
Σ 4Σ,廣1Σ 4
S[N-1][1][ -οS[N-1][1][ '=ο ].... S[N-l][nch-l][ -=ο ]
Ν-\
ΣΑ-1
S[N-l][nch-l]['=。 ]。如圖7Β中所示,對每一個(gè)頻譜塊中的每一個(gè)譜系數(shù)部分都首先按照聲道 編號(hào)的大小排列具有較小譜線序號(hào)值的編碼數(shù)據(jù),然后再按照聲道編號(hào)的大小排列 具有較大譜線序號(hào)值的編碼數(shù)據(jù)。具體地,頻譜塊O的譜系數(shù)排列為S
S
[nch-1]
、S
[1] S
[nch-1][1]____S
[L0-I] S
[nch-1]。頻譜塊 1 的譜系數(shù)為 S[1]
[LJ S[l][nCh-l][LQ]、S[l]
[L。+l] S[l] [nch-1] [L0+l]· · · · S[l]
[L0+L「l] S[l] [nch-1] [L0+L「l]。頻譜塊 N-I 的譜系數(shù)
N-2N-2N-2
為 S[N-l]
[Z、:hS[N-l][nCh-l][Z4 ]、S[N-l]
[X4 +l] S[N-1] [nch-1]
/=0 i=0 i=0 N-2N-IN-\….S[N-1]
[ X4-lhS[N-l][nch-l][XA-l]0
(=0 /=0 i=0如圖7C中所示,在幀頭信息中增加一個(gè)比特作為結(jié)構(gòu)標(biāo)志位。具體地,根據(jù)編碼 特性,結(jié)構(gòu)標(biāo)志位可設(shè)為“O”或“1”。當(dāng)結(jié)構(gòu)標(biāo)志位為“O”時(shí),本幀中頻譜塊的譜系數(shù)部分用圖7A中的排列方法,即,使用圖7A中的音頻幀結(jié)構(gòu);當(dāng)結(jié)構(gòu)位為“1”時(shí),本幀中頻譜塊的 譜系數(shù)部分用圖7B中的排列方法,即,使用圖7B中的音頻幀結(jié)構(gòu)。優(yōu)選地,編碼特性包括僅使用圖7A中音頻幀結(jié)構(gòu)或僅使用圖7B中音頻幀結(jié)構(gòu)進(jìn) 行所有譜系數(shù)部分排列所獲得的總編碼效率。雖然結(jié)合目前被認(rèn)為是最實(shí)際和最優(yōu)的實(shí)施例描述了本發(fā)明,但本領(lǐng)域技術(shù)人員 應(yīng)當(dāng)理解本發(fā) 明不限于所公開的實(shí)施例,相反,本發(fā)明旨在覆蓋所附權(quán)利要求的精神和范 疇之內(nèi)包括的各種各樣的修改和等價(jià)結(jié)構(gòu)。本領(lǐng)域技術(shù)人員能夠理解的是可如示于特定 實(shí)施例地將多種變形和/或改進(jìn)使用到本發(fā)明,而這并不脫離以寬廣方式描述的本發(fā)明精 神或范圍。因此,本文的實(shí)施例被認(rèn)為在各個(gè)方面是描述性的而非限定性的。
權(quán)利要求
一種分層編碼的多聲道數(shù)字音頻幀結(jié)構(gòu),包括多個(gè)輔助數(shù)據(jù)塊和多個(gè)頻譜塊;其特征在于,按照所述多個(gè)頻譜塊中所含數(shù)據(jù)對應(yīng)的譜線序號(hào)值大小來排列各個(gè)頻譜塊。
2.根據(jù)權(quán)利要求1所述的幀結(jié)構(gòu),其特征在于,所述幀結(jié)構(gòu)保存的是經(jīng)過DRA多聲道音 頻編碼算法編碼后的數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的幀結(jié)構(gòu),其特征在于,所述多個(gè)頻譜塊的每一個(gè)分別包括譜系數(shù)部分,其中排列了所述多個(gè)頻譜塊的數(shù)據(jù)中與頻譜有關(guān)的部分;以及邊信息部分,其中排列了所述多個(gè)頻譜塊的數(shù)據(jù)中與頻譜無關(guān)的部分。
4.根據(jù)權(quán)利要求3所述的幀結(jié)構(gòu),其特征在于,在所述多個(gè)頻譜塊的每一個(gè)中,E)每個(gè) 所述譜系數(shù)部分都首先按照所對應(yīng)譜線序號(hào)值的大小排列編號(hào)較小的聲道,然后再按照所 對應(yīng)譜線序號(hào)值的大小排列編號(hào)較大的聲道。
5.根據(jù)權(quán)利要求3所述的幀結(jié)構(gòu),其特征在于,在所述多個(gè)頻譜塊的每一個(gè)中,F(xiàn))每個(gè) 所述譜系數(shù)部分都首先按照聲道編號(hào)的大小排列具有較小譜線序號(hào)值的編碼數(shù)據(jù),然后再 按照聲道編號(hào)的大小排列具有較大譜線序號(hào)值的編碼數(shù)據(jù)。
6.根據(jù)權(quán)利要求3所述的幀結(jié)構(gòu),其特征在于,根據(jù)編碼特性,分別選擇以下兩種方式 之一來對每個(gè)所述譜系數(shù)部分進(jìn)行排列E)每個(gè)所述譜系數(shù)部分都首先按照所對應(yīng)譜線序號(hào)值的大小排列編號(hào)較小的聲道,然 后再按照所對應(yīng)譜線序號(hào)值的大小排列編號(hào)較大的聲道;或F)每個(gè)所述譜系數(shù)部分都首先按照聲道編號(hào)的大小排列具有較小譜線序號(hào)值的編碼 數(shù)據(jù),然后再按照聲道編號(hào)的大小排列具有較大譜線序號(hào)值的編碼數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的幀結(jié)構(gòu),其特征在于,所述編碼特性包括僅使用E)或僅使用 F)進(jìn)行所有所述譜系數(shù)部分排列所獲得的總編碼效率。
8.根據(jù)權(quán)利要求4-6之一所述的幀結(jié)構(gòu),其特征在于,近似對應(yīng)固定比特率地劃分所 述頻譜塊的長度。
9.根據(jù)權(quán)利要求4-6之一所述的幀結(jié)構(gòu),其特征在于,基于相應(yīng)DRA碼書段的長度來劃 分所述頻譜塊的長度。
10.根據(jù)權(quán)利要求34-36之一所述的幀結(jié)構(gòu),其特征在于,通過在前和在后的各一個(gè)頻 譜塊恢復(fù)當(dāng)前的頻譜塊。
11.根據(jù)權(quán)利要求10所述的幀結(jié)構(gòu),其特征在于,所述恢復(fù)包括使用所述在前和在后 的各一個(gè)頻譜塊的系數(shù)進(jìn)行線性內(nèi)插。
12.根據(jù)權(quán)利要求4-6之一所述的幀結(jié)構(gòu),其特征在于,所述頻譜塊的分層個(gè)數(shù)=(碼 率所對應(yīng)的幀長_幀頭_邊信息)/分層帶寬。
13.根據(jù)權(quán)利要求4-6之一所述的幀結(jié)構(gòu),其特征在于,采用頻譜塊的邊界來直接代替 DRA碼書段的邊界。
14.根據(jù)權(quán)利要求4-6之一所述的幀結(jié)構(gòu),其特征在于,當(dāng)所述頻譜塊的邊界與所述 DRA碼書段的邊界的距離小于某個(gè)預(yù)定閾值時(shí),采用所述DRA碼書段的邊界來代替所述頻 譜塊的邊界;當(dāng)所述頻譜塊的邊界與所述DRA碼書段的邊界的距離大于某個(gè)預(yù)定閾值時(shí), 采用所述頻譜塊的邊界都代替所述DRA碼書段的邊界。
全文摘要
本發(fā)明涉及一種分層音頻編碼幀結(jié)構(gòu),包括多個(gè)輔助數(shù)據(jù)塊和多個(gè)頻譜塊;并按照所述多個(gè)頻譜塊中所含數(shù)據(jù)對應(yīng)的譜線序號(hào)值大小來排列各個(gè)頻譜塊。通過使用根據(jù)本發(fā)明的分層音頻編碼幀結(jié)構(gòu),使DRA技術(shù)能被應(yīng)用在一些需要分層編碼的技術(shù)領(lǐng)域中。
文檔編號(hào)G10L19/02GK101840701SQ200910080308
公開日2010年9月22日 申請日期2009年3月18日 優(yōu)先權(quán)日2009年3月18日
發(fā)明者徐茂, 王磊, 閆建新 申請人:數(shù)維科技(北京)有限公司