用于提高三維音頻空間參數(shù)壓縮率的編解碼方法及系統(tǒng)的制作方法

文檔序號：10654542閱讀：268來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

用于提高三維音頻空間參數(shù)壓縮率的編解碼方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了用于提高三維音頻空間參數(shù)壓縮率的編解碼方法及系統(tǒng)，本發(fā)明在編碼時輸入三維音頻的音頻信號、三維音頻的空間邊信息和空間參數(shù)所屬音頻對象的編號，編碼時依次對空間參數(shù)進行聚類、量化、幀內(nèi)編碼、幀間差分編碼；解碼時依次進行幀間差分解碼、幀內(nèi)解碼、反量化、空間參數(shù)映射；本發(fā)明基于同一聲源同一幀內(nèi)的不同子帶空間參數(shù)具有相似性的特點，采用空間參數(shù)聚類的方法來提高三維音頻的空間參數(shù)的壓縮率，可以得到更高的三維音頻空間參數(shù)壓縮率。
【專利說明】
用于提高H維音頻空間參數(shù)壓縮率的編解碼方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及數(shù)字音頻領(lǐng)域，針對提高=維音頻空間參數(shù)壓縮率的需求，尤其設(shè)及一種提高=維音頻空間參數(shù)壓縮率的編解碼方法及系統(tǒng)。
【背景技術(shù)】
[0002] 2009年底，S維電影《阿凡達》在全球S十多個國家登上票房榜首，到2010年9月初，全球累計票房超過27億美元。《阿凡達》之所W能取得如此輝煌的票房成績，在于它所采用的全新的=維特效制作技術(shù)帶給人們感官上的震撼效果。
[0003] 為了給聽音者提供3D空間中一種更加沉浸的感覺W及一種更加真實的聲場，空間音頻對象編碼(SAOC)，方向音頻編碼(DirAC) W及空間壓棒音頻編碼(S3AC)被提出。隨著3D 空間分辨率的提高W及越來越多的聲道或者對象，空間參數(shù)的比特率也急劇地提高。比如，在S3AC編碼的空間定位量化點（SLQP)方法中，空間參數(shù)的比特率是18化ps/對象，那么對于 16個聲源對象，空間參數(shù)需要288kbps的比特率。因此，減少3D音頻編碼中的空間參數(shù)的比特率非常急迫。
[0004] 空間參數(shù)的壓縮方法BCC,MPEG SurroundW及S3AC考慮了相鄰帖之間的特性，則空間參數(shù)的比特率可W通過差分編碼來減少。運些方法可W除去同一頻帶中相鄰帖之間空間參數(shù)的帖間冗余，但是同一帖內(nèi)同一聲源不同頻帶之間空間參數(shù)的帖內(nèi)冗余仍然存在。若能想辦法除去運些帖內(nèi)冗余，則空間參數(shù)比特率可W被進一步壓縮。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的目的在于針對上述現(xiàn)有技術(shù)在壓縮3D音頻空間參數(shù)上存在的不足，提供一種新的針對3D音頻錄制的基于對象的空間參數(shù)壓縮方法;該方法基于同一聲源在同一帖內(nèi)的不同頻帶具有相同的空間參數(shù)的特性，可W高比率地移除已有的空間參數(shù)壓縮方法中未考慮的空間參數(shù)的帖內(nèi)冗余，從而進一步壓縮空間參數(shù)比特率。
[0006] 本發(fā)明的技術(shù)方案提供一種用于提高=維音頻空間參數(shù)壓縮率的編解碼方法，包括編碼過程和解碼過程，所述編碼過程包括W下步驟：
[0007] 步驟Cl,輸入包括包含n個對象的=維音頻信號、=維音頻空間參數(shù)W及空間參數(shù) 所屬音頻對象的編號，將=維音頻時域信號變換到頻域，具體如下，
[000引設(shè)；維音頻的時域信號為S(t)，所述的S(t)包括Sl(t)、S2(t)、Sk(t)…、SK(t)，S 維音頻的空間參數(shù)況陽如Ap，，1，所述的馬的口，r)包括化",州孚,'}、化刪腳單,?)、訊,,./)(0取句…、 5?扣々(傍斯巧，空間參數(shù)所屬音頻對象的編號為Index(n，f);將S維音頻的時域信號s(t)變換到頻域，得到S維音頻的頻域信號S(n，f)，所述的S(n，f)包括Si (n，f)、S2 (n，f)、Sk(n， f)…、SK(n，f);其中，sk(t)為第k個有向性音頻信號的時域表達，t表示時間；Sk(n，f)為第k 個有向性音頻信號的頻域表達；訊",Ww')表示第k個有向性音頻信號對應(yīng)的空間參數(shù)，0 為水平角，9^為高度角，1'為距離邊信息;4的取值為1，2，…，!(，!(為原有的有向性音頻信號的總數(shù);Index(n，f)的值為空間參數(shù)所屬音頻對象的編號;n代表帖索引，f代表頻率索引；
[0009] 步驟C2,對輸入的空間參數(shù)進行帖內(nèi)編碼，實現(xiàn)如下，對同一帖內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類;對聚類后的空間參數(shù)進行量化;對量化后的空間參數(shù)進行帖內(nèi)編碼；
[0010] 步驟C3,對空間參數(shù)進行帖間編碼，生成S維音頻編碼碼流，編碼方法為差分編碼；
[0011] 所述解碼過程包括W下步驟；
[0012] 步驟Dl，對空間參數(shù)進行帖間解碼，解碼方法為差分解碼；
[0013] 步驟D2,對空間參數(shù)進行帖內(nèi)解碼，實現(xiàn)如下，對空間參數(shù)進行帖內(nèi)解碼;對帖內(nèi) 解碼后的空間參數(shù)進行反量化;還原原始的空間參數(shù)卻
[0014] 步驟D3,將音頻信號的頻域表達S'（n，f)變換到時域，得到音頻信號的時域表達s' (0，縮所述的5'（11，門是5(11，門經(jīng)過編解碼后的信號，所述的3'（*)是3(〇經(jīng)過編解碼后的信號;包含n個對象的音頻信號的時域表達s'（t)和步驟D2所得空間參數(shù)5?,,,/)的9>，r)W及原始的空間參數(shù)所屬音頻對象的編號Index(n，f)構(gòu)成解碼后的包含n個對象的=維音頻的音頻信號，空間參數(shù)W及空間參數(shù)所屬音頻對象的編號。
[0015] 進一步的，所述的步驟C2中，是對同一帖內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類，即對于n相同，Index(n，f)的值相同但f不同的空間參數(shù)<5/踩巧的換巧進行聚類，生成聚類后的空間參數(shù)進AY,;X6口，叫。
[0016] 進一步的，所述的步驟D2中，是將已經(jīng)聚類的屬于同一帖的同一音頻對象的不同頻帶的空間參數(shù)地-W的口，r)映射至它們相應(yīng)的頻帶，還原成原始的空間參數(shù)訊陽/)(0.妍叫。
[0017] 進一步的，所述的步驟C2中，對聚類后的空間參數(shù)規(guī)陽的W，r)進行量化，所述的量化是感知量化或直接量化;對量化后的空間參數(shù)進行帖內(nèi)編碼，所述的編碼是感知編碼或直接編碼。
[0018] 進一步的，所述的步驟D2中，對空間參數(shù)進行帖內(nèi)解碼，所述的解碼是感知解碼或直接解碼;對帖內(nèi)解碼后的空間參數(shù)進行反量化，所述的反量化是針對于感知量化的反量化或是針對于直接量化的反量化。
[0019] -種用于提高=維音頻空間參數(shù)壓縮率的編解碼系統(tǒng)，包括編碼器和解碼器；
[0020] 所述編碼器包括W下模塊：
[0021] 時頻變換模塊，用于輸入包括包含n個對象的=維音頻信號、=維音頻空間參數(shù)W 及空間參數(shù)所屬音頻對象的編號，將=維音頻時域信號變換到頻域，具體是設(shè)=維音頻的時域信號為S(t)，所述的S(t)包括31(*)、32(*)、31^(*)。'、31((*)，^維音頻的空間參數(shù) 及相々的，所述的沒化/做巧乃包括訊估々(0,礦/')、邱化片的矜r)、訊化々(負戸、t恥化沒(技,巧啼空間參數(shù)所屬音頻對象的編號為Index(n，f);將=維音頻的時域信號s(t)變換到頻域，得到 S維音頻的頻域信號S(n，f)，所述的S(n，f)包括51(11，門、52(11，門、51^(11，門-'、51((11，門；其中，sk(t)為第k個有向性音頻信號的時域表達，t表示時間；Sk(n，f)為第k個有向性音頻信號的頻域表達;瑞卿J從斯勺表示第k個有向性音頻信號對應(yīng)的空間參數(shù)，0為水平角，:界為高度角，r為距離邊信息;k的取值為1，2,…，K，K為原有的有向性音頻信號的總數(shù);Index(n，f)的值為空間參數(shù)所屬音頻對象的編號;n代表帖索引，f代表頻率索引；
[0022] 帖內(nèi)編碼模塊，用于對輸入的空間參數(shù)進行帖內(nèi)編碼，包括用于對同一帖內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類;對聚類后的空間參數(shù)進行量化；對量化后的空間參數(shù)進行帖內(nèi)編碼；
[0023] 帖間編碼模塊，對空間參數(shù)進行帖間編碼，生成=維音頻編碼碼流，編碼方法為差分編碼；
[0024] 所述解碼器包括W下模塊：
[0025] 帖間解碼模塊，用于對空間參數(shù)進行帖間解碼，解碼方法為差分解碼；
[0026] 帖內(nèi)解碼模塊，用于對空間參數(shù)進行帖內(nèi)解碼，包括用于對空間參數(shù)進行帖內(nèi)解碼;對帖內(nèi)解碼后的空間參數(shù)進行反量化;還原原始的空間參數(shù)碼
[0027] 時頻反變換模塊，用于將音頻信號的頻域表達S'（n，f)變換到時域，得到音頻信號的時域表達s'（t)，縮所述的S'（n，f)是S(n，f)經(jīng)過編解碼后的信號，所述的s'（t)是s(t)經(jīng) 過編解碼后的信號；包含n個對象的音頻信號的時域表達s'（t)和步驟D2所得空間參數(shù) 講及原始的空間參數(shù)所屬音頻對象的編號Index(n，f)構(gòu)成解碼后的包含n個對象的=維音頻的音頻信號，空間參數(shù)W及空間參數(shù)所屬音頻對象的編號。
[0028] 進一步的，所述的帖內(nèi)編碼模塊包括聚類模塊，所述的聚類模塊用于對同一帖內(nèi) 屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類，即對于n相同，Index(n，f)的值相同但 f不同的空間參數(shù)進燦,/)(負巧r)進行聚類，生成聚類后的空間參數(shù)訊如(如/V-)。
[0029] 進一步的，所述的帖內(nèi)解碼模塊包括還原模塊，所述的還原模塊用于將已經(jīng)聚類的屬于同一帖的同一音頻對象的不同頻帶的空間參數(shù)S/a-wW口，呼映射至它們相應(yīng)的頻帶，還原成原始的空間參數(shù)S4腳.々(0，胖r)。
[0030] 進一步的，所述的帖內(nèi)編碼模塊包括量化模塊，所述的量化模塊用于對聚類后的空間參數(shù)的進行量化，所述的量化是感知量化或直接量化;對量化后的空間參數(shù)進行帖內(nèi)編碼，所述的編碼是感知編碼或直接編碼。
[0031] 進一步的，所述的帖內(nèi)解碼模塊包括反量化模塊，所述的反量化模塊用于對空間參數(shù)進行帖內(nèi)解碼，所述的解碼是感知解碼或直接解碼;對帖內(nèi)解碼后的空間參數(shù)進行反量化，所述的反量化是針對于感知量化的反量化或是針對于直接量化的反量化。
[0032] 本發(fā)明的有益效果是:本發(fā)明基于同一帖內(nèi)同一聲源的不同頻帶有相同的空間參數(shù)，在編碼端通過空間參數(shù)聚類、空間參數(shù)量化、空間參數(shù)帖內(nèi)編碼，然后進行空間參數(shù)帖間差分編碼，進一步壓縮=維音頻空間參數(shù)比特率，提高空間參數(shù)壓縮率。解碼端對=維音頻碼流進行解碼，包括對空間參數(shù)進行帖間差分解碼，空間參數(shù)帖內(nèi)解碼，對帖內(nèi)解碼后的空間參數(shù)進行反量化，并將聚類的空間參數(shù)進行映射，得到=維音頻的音頻信號、空間參數(shù) W及空間參數(shù)所屬音頻對象的編號。因此，本發(fā)明通過增加帖內(nèi)編解碼，解決了 W往只已有的空間參數(shù)壓縮方法中未考慮空間參數(shù)帖內(nèi)冗余的缺陷，可W進一步壓縮=維音頻空間參數(shù)比特率，提高空間參數(shù)壓縮率。
【附圖說明】
[0033] 圖1是本發(fā)明實施例的編碼端的流程圖；
[0034] 圖2是本發(fā)明實施例的解碼端的流程圖。
【具體實施方式】
[0035] W下結(jié)合附圖和實施例詳細說明本發(fā)明技術(shù)方案(其中步驟Cl至步驟C3為編碼過程，步驟Dl至步驟D3為解碼過程）。
[0036] 參見圖1，本發(fā)明實施例的編碼端執(zhí)行W下流程：
[0037] 步驟Cl,將=維音頻的時域信號s(t)變換到頻域，得到=維音頻的頻域信號S(n， f)〇
[0038] 編碼端的輸入為:包含n個對象的=維音頻信號、=維音頻空間參數(shù)W及空間參數(shù) 所屬音頻對象的編號。S維音頻的音頻信號的時域表達為S(t)，S(t)由Sl(t)、S2(t)、…、SK (t)構(gòu)成，t表示時間己維音頻的空間參數(shù)，也即每個時頻點對應(yīng)的空間參數(shù)巧"1如6料')由慰晰../)的矜/-)、化咐,i)的口，、進町"./)的口，'-)構(gòu)成；空間參數(shù)所屬音頻對象的編號，用Index (11，門表達。其中，3如)為第4個有向性音頻信號的時域表達，卻機.々的扣/')康示第1^個有向性音頻信號對應(yīng)的空間參數(shù)，空間參數(shù)由方位參數(shù)(水平角9,高度角90和距離參數(shù)r構(gòu)成。k的取值為1，2，…，K，K為原有的有向性音頻信號的總數(shù)。
[0039] 將=維音頻的時域信號變換到頻域，可W將=維音頻的時域信號s(t)采用短時傅里葉變換（STFT)變換到頻域，得到S維音頻的頻域信號S(n，f)，S(n，f)由Si (n，f)、S2(n， f)、…、SK(n，f)。其中，Sk(n，f)為第k個有向性音頻信號的頻域表達，n代表帖索引，f代表頻率索引。具體實施時，也可采用MDCT或希爾伯特黃等其他方法進行變換。
[0040] 實施例中K = 8，f = l，2,…，40。8個有向性音頻信號si(t)、S2(t)、…、S8(t)的頻域信號為（S 1 ( n，f )，S 2 ( n，f )，…，S 8 ( n，f ))，它們對應(yīng)的空間參數(shù)為 S/咐.々(6口，。，巧口，勺，".，57抓明(0，巧，。，而運些空間參數(shù)所屬對象的編號為index(n，f)。
[0041] 步驟C2，對空間參數(shù)進行帖內(nèi)編碼，實施例進行步驟C3時，具體執(zhí)行了 W下步驟：
[0042] C21:對同一帖內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類，即對于n相同，Index(n，f)的值相同但f不同的空間參數(shù)訊化々(0，料')，57加,々(0，料')，…，訊化々(0，料')進行聚類，生成聚類后的空間參數(shù)訊W拘糾?)，5?,,的界，^)，…，57柳做，口，r);
[0043] C22 :對聚類后的空間參數(shù)訊腳的化仰識A;')，。.，訊W(0系r).進行量化，可W 是感知量化或直接量化；
[0044] C23:對量化后的空間參數(shù)進行帖內(nèi)編碼，可W是感知編碼或直接編碼；
[0045] 步驟C3,對空間參數(shù)進行帖間編碼，生成S維音頻編碼碼流，實施例進行步驟C3 時，編碼方法為差分編碼。
[0046] 參見圖2，本發(fā)明實施例的解碼端執(zhí)行W下流程：
[0047] 步驟Dl，對空間參數(shù)進行帖間解碼，實施例進行步驟Dl時，解碼方法為差分解碼。
[0048] 步驟D2，對空間參數(shù)進行帖內(nèi)解碼，實施例進行步驟D2時，具體執(zhí)行了 W下步驟：
[0049] D21:對空間參數(shù)進行帖內(nèi)解碼，可W是感知解碼或直接解碼；
[0050] D22:對帖內(nèi)解碼后的空間參數(shù)進行反量化，可W是針對于感知量化的反量化或是針對于直接量化的反量化；
[0051] D23:將已經(jīng)聚類的屬于同一帖的同一音頻對象的不同頻帶的空間參數(shù) 訊所腳，,')，進卿供0，,-)，…，進咐槪r)映射至它們相應(yīng)的頻帶，還原成原始的空間參數(shù)
[0052] 步驟D3,將音頻信號的頻域表達S'（n，f)變換到時域，得到音頻信號的時域表達s' (〇,5'（11，門是5(11，門經(jīng)過編解碼后的信號，3'（〇是3(〇經(jīng)過編解碼后的信號;包含11個對象的音頻信號的時域表達s'（t)和步驟D2所得空間參數(shù)訊YA/化料')W及原始的空間參數(shù)所屬音頻對象的編號Index(n，f)構(gòu)成解碼后的包含n個對象的=維音頻的音頻信號，空間參數(shù)W及空間參數(shù)所屬音頻對象的編號。具體實施時可W據(jù)此采用不同配置的揚聲器或耳機來重建=維音頻聲場，即可還原原始的=維音頻。
[0053] 實施例將編解碼后的8個有向性音頻信號(5'1(11，門，5'2(11，門，-，，5'8(11，門）變換到時域，得到8個有向性音頻信號S'l(t)，S'2(t)，…，S'8(t)與已解碼空間參數(shù) 訊化方的護叫，S/-，化々(60，。，…，說柳的奶r)U及原始的空間參數(shù)所屬音頻對象的編號Index (n，f)構(gòu)成解碼后的包含n個對象的=維音頻的音頻信號，空間參數(shù)W及空間參數(shù)所屬音頻對象的編號。本實施例采用耳機來實現(xiàn)帶距離邊信息的=維音頻信號的重放，為了實現(xiàn)耳機的S維音頻重現(xiàn)，需要用到頭相關(guān)傳遞函數(shù)化RTF)庫，PKU&I0A皿TF庫對遠場和近場都做了測量，距離r從20cm變化到160cm，水平角和高度角的分辨率分別是5哺10<^我們選擇 PKU&I0A HRTF庫來完成進行了帖內(nèi)壓縮和帖間壓縮的S維音頻重建。
[0054] 通過實驗對比，增加了帖內(nèi)編碼的=維音頻壓縮方法比原有的只有帖間編碼的= 維音頻壓縮方法的壓縮效果好，壓縮率更高且重建音頻質(zhì)量仍然被保持。由于增加了帖內(nèi) 編碼，可W消除帖內(nèi)冗余，因此本方法在保證重建=維音頻質(zhì)量的基礎(chǔ)上提高了 =維空間參數(shù)壓縮率，降低了空間參數(shù)比特率。
[0055] 本發(fā)明所提供方法可W采用軟件技術(shù)實現(xiàn)自動運行，也可實現(xiàn)為相應(yīng)的模塊化系統(tǒng)。本發(fā)明提供的一種用于提高=維音頻空間感距離感的參數(shù)編解碼系統(tǒng)，包括編碼器和解碼器，所述編碼器包括W下模塊，
[0056] 時頻變換模塊，用于輸入包括包含n個對象的=維音頻信號、=維音頻空間參數(shù)W 及空間參數(shù)所屬音頻對象的編號，將=維音頻時域信號變換到頻域，具體是設(shè)=維音頻的時域信號為S(t)，所述的S(t)包括31(*)、32(*)、31^(*)。'、31((*)，^維音頻的空間參數(shù) 毋化。怕P.,-)，所述的泣化0的口包括進咐冶的9，r)、慰加 ,片(6,口，r)、進林,誠(0，口，r).,'、掛巧",々的^)，/')，空間參數(shù)所屬音頻對象的編號為Index(n，f);將S維音頻的時域信號s(t)變換到頻域，得到 S 維音頻的頻域信號 S(n，f)，所述的 S(n，f)包括 Si(n，f)、S2(n，f)、Sk(n，f)-'、SK(n，f); 其中，sk(t)為第k個有向性音頻信號的時域表達，t表示時間；Sk(n，f)為第k個有向性音頻信號的頻域表達;進柄/)(0W')表示第k個有向性音頻信號對應(yīng)的空間參數(shù)，0為水平角，口為高度角，r為距離邊信息;k的取值為1，2,…，K，K為原有的有向性音頻信號的總數(shù);Index(n，f) 的值為空間參數(shù)所屬音頻對象的編號;n代表帖索引，f代表頻率索引；
[0057] 帖內(nèi)編碼模塊，用于對輸入的空間參數(shù)進行帖內(nèi)編碼，包括用于對同一帖內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類;對聚類后的空間參數(shù)卻;W的口，/')進行量化；對量化后的空間參數(shù)進行帖內(nèi)編碼；
[0058] 帖間編碼模塊，對空間參數(shù)進行帖間編碼，生成=維音頻編碼碼流，編碼方法為差分編碼；
[0059] 所述解碼器包括W下模塊：
[0060]帖間解碼模塊，用于對空間參數(shù)進行帖間解碼，解碼方法為差分解碼；
[0061 ]帖內(nèi)解碼模塊，用于對空間參數(shù)進行帖內(nèi)解碼，包括用于對空間參數(shù)進行帖內(nèi)解碼;對帖內(nèi)解碼后的空間參數(shù)進行反量化;還原原始的空間參數(shù)訊t,,./)(負妍勺；
[0062] 時頻反變換模塊，用于將音頻信號的頻域表達S'（n，f)變換到時域，得到音頻信號的時域表達s'（t)，縮所述的S'（n，f)是S(n，f)經(jīng)過編解碼后的信號，所述的s'（t)是s(t)經(jīng) 過編解碼后的信號；包含n個對象的音頻信號的時域表達s'（t)和步驟D2所得空間參數(shù) 57知",/)(0系r) W及原始的空間參數(shù)所屬音頻對象的編號Index(n，f)構(gòu)成解碼后的包含n個對象的=維音頻的音頻信號，空間參數(shù)W及空間參數(shù)所屬音頻對象的編號。
[0063] 帖內(nèi)編碼模塊包括聚類模塊，所述的聚類模塊用于對同一帖內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類，即對于n相同，Index(n，f)的值相同但f不同的空間參數(shù) 訊所/)(負糾-)進行聚類，生成聚類后的空間參數(shù)訊種做口，7-)。
[0064] 帖內(nèi)解碼模塊包括還原模塊，所述的還原模塊用于將已經(jīng)聚類的屬于同一帖的同一音頻對象的不同頻帶的空間參數(shù)t訊W識口，r)映射至它們相應(yīng)的頻帶，還原成原始的空間參數(shù)徽角治從弘勺。
[0065] 帖內(nèi)編碼模塊包括量化模塊，所述的量化模塊用于對聚類后的空間參數(shù) 口./')進行量化，所述的量化是感知量化或直接量化;對量化后的空間參數(shù)進行帖內(nèi)編碼，所述的編碼是感知編碼或直接編碼。
[0066] 帖內(nèi)解碼模塊包括反量化模塊，所述的反量化模塊用于對空間參數(shù)進行帖內(nèi)解碼，所述的解碼是感知解碼或直接解碼;對帖內(nèi)解碼后的空間參數(shù)進行反量化，所述的反量化是針對于感知量化的反量化或是針對于直接量化的反量化。
[0067] 各模塊具體實現(xiàn)與方法步驟相應(yīng)，本發(fā)明不予寶述。
[0068] 本文中所描述的具體實施例僅僅是對本
【發(fā)明內(nèi)容】
作舉例說明。本發(fā)明所屬技術(shù)領(lǐng) 域的技術(shù)人員可W對所描述的具體實施例做各種各樣的修改或補充或采用類似的方式替代，但并不會偏離本發(fā)明的內(nèi)容或者超越所附權(quán)利要求書所定義的范圍。
【主權(quán)項】
1. 一種用于提高三維音頻空間參數(shù)壓縮率的編解碼方法，其特征在于，包括編碼過程和解碼過程，所述編碼過程包括以下步驟：步驟Cl，輸入包括包含η個對象的三維音頻信號、三維音頻空間參數(shù)以及空間參數(shù)所屬音頻對象的編號，將三維音頻時域信號變換到頻域，具體如下，設(shè)三維音頻的時域信號為s(t)，所述的s(t)包括81(〇、82(〇、％(〇'"、 81((〇，三維音頻的空間參數(shù)1 所述的扒r)包括扒Γ)、系，).··、 57m/)(^,r)，空間參數(shù)所屬音頻對象的編號為 Index(n，f);將三維音頻的時域信號s(t)變換到頻域，得到三維音頻的頻域信號S(n，f)，所述的S(n，f)包括SKnjhSKnjhSkU， f)…、S K(n，f);其中，Sk(t)為第k個有向性音頻信號的時域表達，t表示時間；Sk(n，f)為第k 個有向性音頻信號的頻域表達;專r)表示第k個有向性音頻信號對應(yīng)的空間參數(shù)，Θ 為水平角，^為高度角，r為距離邊信息;k的取值為1，2，…，K，K為原有的有向性音頻信號的總數(shù);Index(n，f)的值為空間參數(shù)所屬音頻對象的編號;η代表幀索引，f代表頻率索引；步驟C2，對輸入的空間參數(shù)進行幀內(nèi)編碼，實現(xiàn)如下，對同一幀內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類;對聚類后的空間參數(shù)力進行量化;對量化后的空間參數(shù)進行幀內(nèi)編碼；步驟C3，對空間參數(shù)進行幀間編碼，生成三維音頻編碼碼流，編碼方法為差分編碼；所述解碼過程包括以下步驟；步驟D1，對空間參數(shù)進行幀間解碼，解碼方法為差分解碼；步驟D2，對空間參數(shù)進行幀內(nèi)解碼，實現(xiàn)如下，對空間參數(shù)進行幀內(nèi)解碼;對幀內(nèi)解碼后的空間參數(shù)進行反量化;還原原始的空間參數(shù)雙^狀％); 步驟D3,將音頻信號的頻域表達S'（n，f)變換到時域，得到音頻信號的時域表達s'（t)，縮所述的S'（n，f)是S(n，f)經(jīng)過編解碼后的信號，所述的s'（t)是s(t)經(jīng)過編解碼后的信號;包含η個對象的音頻信號的時域表達s'（t)和步驟D2所得空間參數(shù)&恤,/)說以及原始的空間參數(shù)所屬音頻對象的編號Inde X(n，f)構(gòu)成解碼后的包含η個對象的三維音頻的音頻信號，空間參數(shù)以及空間參數(shù)所屬音頻對象的編號。2. 根據(jù)權(quán)利要求1所述用于提高三維音頻參數(shù)壓縮率的編解碼方法，其特征在于：所述的步驟C2中，是對同一幀內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類，即對于η相同，Index(n，f)的值相同但f不同的空間參數(shù)進行聚類，生成聚類后的空間參數(shù)恥如⑷參小3. 根據(jù)權(quán)利要求1所述用于提高三維音頻參數(shù)壓縮率的編解碼方法，其特征在于：所述的步驟D2中，是將已經(jīng)聚類的屬于同一幀的同一音頻對象的不同頻帶的空間參數(shù) 57"心,r)映射至它們相應(yīng)的頻帶，還原成原始的空間參數(shù)57響/)(%^)。4. 根據(jù)權(quán)利要求1所述用于提高三維音頻參數(shù)壓縮率的編解碼方法，其特征在于：所述的步驟C2中，對聚類后的空間參數(shù)進行量化，所述的量化是感知量化或直接量化;對量化后的空間參數(shù)進行幀內(nèi)編碼，所述的編碼是感知編碼或直接編碼。5. 根據(jù)權(quán)利要求1所述用于提高三維音頻參數(shù)壓縮率的編解碼方法，其特征在于：所述的步驟D2中，對空間參數(shù)進行幀內(nèi)解碼，所述的解碼是感知解碼或直接解碼;對幀內(nèi)解碼后的空間參數(shù)進行反量化，所述的反量化是針對于感知量化的反量化或是針對于直接量化的反量化。6. -種用于提高三維音頻空間參數(shù)壓縮率的編解碼系統(tǒng)，其特征在于:包括編碼器和解碼器，所述編碼器包括以下模塊，時頻變換模塊，用于輸入包括包含η個對象的三維音頻信號、三維音頻空間參數(shù)以及空間參數(shù)所屬音頻對象的編號，將三維音頻時域信號變換到頻域，具體是設(shè)三維音頻的時域信號為s(t)，所述的S(t)包括Sl(t)、S2(t)、Sk(t)···、SK(t)，三維音頻的空間參數(shù)，所述的叭"包括覽"",β(漢叭r)、漢叭。、沒物W(漢叭r)…、S/份力(漢叭7$ 所屬音頻對象的編號為Index(n，f);將三維音頻的時域信號s(t)變換到頻域，得到三維音頻的頻域信號 S(n，f)，所述的 S(n，f)包括 S1(IiJ)、S2(n，f)、Sk(n，f)···、SK(n，f);其中， Sk(t) 為第k個有向性音頻信號的時域表達，t表示時間；Sk(n，f)為第k個有向性音頻信號的頻域表達；表示第k個有向性音頻信號對應(yīng)的空間參數(shù)，Θ為水平角，f為高度角，r為距離邊信息;k的取值為1，2,…，K，K為原有的有向性音頻信號的總數(shù);Index(n，f)的值為空間參數(shù)所屬音頻對象的編號;η代表幀索引，f代表頻率索引；幀內(nèi)編碼模塊，用于對輸入的空間參數(shù)進行幀內(nèi)編碼，包括用于對同一幀內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類;對聚類后的空間參數(shù)進行量化;對量化后的空間參數(shù)進行幀內(nèi)編碼；幀間編碼模塊，對空間參數(shù)進行幀間編碼，生成二維首頻編碼碼流，編碼方法為差分編碼；所述解碼器包括以下模塊：幀間解碼模塊，用于對空間參數(shù)進行幀間解碼，解碼方法為差分解碼；幀內(nèi)解碼模塊，用于對空間參數(shù)進行幀內(nèi)解碼，包括用于對空間參數(shù)進行幀內(nèi)解碼;對幀內(nèi)解碼后的空間參數(shù)進行反量化;還原原始的空間參數(shù)W); 時頻反變換模塊，用于將音頻信號的頻域表達S'（n，f)變換到時域，得到音頻信號的時域表達s'（t)，縮所述的5'（11，〇是5(11，〇經(jīng)過編解碼后的信號，所述的8'（〖)是8(〇經(jīng)過編解碼后的信號；包含η個對象的音頻信號的時域表達s'（t)和幀內(nèi)解碼模塊所得空間參數(shù) 以及原始的空間參數(shù)所屬音頻對象的編號Inde X(n，f)構(gòu)成解碼后的包含η個對象的三維音頻的音頻信號，空間參數(shù)以及空間參數(shù)所屬音頻對象的編號。7. 根據(jù)權(quán)利要求6所述用于提高三維音頻參數(shù)壓縮率的編解碼系統(tǒng)，其特征在于:所述的幀內(nèi)編碼模塊包括聚類模塊，所述的聚類模塊用于對同一幀內(nèi)屬于同一音頻對象的不同頻帶的空間參數(shù)進行聚類，即對于η相同，Inde X(n，f)的值相同但f不同的空間參數(shù) 進行聚類，生成聚類后的空間參數(shù)57咖(心外8. 根據(jù)權(quán)利要求6所述用于提高三維音頻參數(shù)壓縮率的編解碼系統(tǒng)，其特征在于:所述的幀內(nèi)解碼模塊包括還原模塊，所述的還原模塊用于將已經(jīng)聚類的屬于同一幀的同一音頻對象的不同頻帶的空間參數(shù)戰(zhàn)樹(?奶r)映射至它們相應(yīng)的頻帶，還原成原始的空間參數(shù) Sly,lt0,(p，r)〇9. 根據(jù)權(quán)利要求6所述用于提高三維音頻參數(shù)壓縮率的編解碼系統(tǒng)，其特征在于:所述的幀內(nèi)編碼模塊包括量化模塊，所述的量化模塊用于對聚類后的空間參數(shù)見細⑷承β進行量化，所述的量化是感知量化或直接量化;對量化后的空間參數(shù)進行幀內(nèi)編碼，所述的編碼是感知編碼或直接編碼。10.根據(jù)權(quán)利要求6所述用于提高三維音頻參數(shù)壓縮率的編解碼系統(tǒng)，其特征在于:所述的幀內(nèi)解碼模塊包括反量化模塊，所述的反量化模塊用于對空間參數(shù)進行幀內(nèi)解碼，所述的解碼是感知解碼或直接解碼;對幀內(nèi)解碼后的空間參數(shù)進行反量化，所述的反量化是針對于感知量化的反量化或是針對于直接量化的反量化。
【文檔編號】G10L19/008GK106023999SQ201610541939
【公開日】2016年10月12日
【申請日】2016年7月11日
【發(fā)明人】胡瑞敏, 楊乘, 王曉晨, 杜鵬慧, 蘇柳月, 武庭照, 陳瑋, 楊玉紅
【申請人】武漢大學(xué)

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：胡瑞敏;楊乘;王曉晨;杜鵬慧;蘇柳月;武庭照;陳瑋;楊玉紅;
技術(shù)所有人：武漢大學(xué);
我是此專利的發(fā)明人

上一篇：一種基于頻譜映射的端到端的語音加解密方法
上一篇：攝像頭音頻輸入裝置、去噪方法和攝像頭的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

提高壓縮率相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于提高三維音頻空間參數(shù)壓縮率的編解碼方法及系統(tǒng)的制作方法