音頻信號幀中事件時隙位置的編碼與譯碼技術(shù)的制作方法
【專利摘要】對音頻信號幀中包含事件的時隙位置的譯碼裝置(10、40、60、410)、編碼裝置(510)、譯碼方法、及編碼方法及相應(yīng)的計算機(jī)程序及編碼信號,其中,所述譯碼裝置(10、40、60、410)包括:分析單元(20、42、70、420),用以分析指示該音頻信號幀中的時隙總數(shù)的幀時隙數(shù),指示該音頻信號幀的包含事件的時隙數(shù)的事件時隙數(shù),及事件狀態(tài)數(shù);以及生成單元(30、45、80、430),用于使用該幀時隙數(shù)、事件時隙數(shù)、及事件狀態(tài)數(shù)來生成對在該音頻信號幀中包含事件的多個時隙位置的指示。
【專利說明】音頻信號幀中事件時隙位置的編碼與譯碼技術(shù)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻處理及音頻編碼領(lǐng)域,特別是涉及音頻信號幀中事件時隙(slot)位置的編碼與譯碼技術(shù)。
【背景技術(shù)】
[0002]音頻處理及音頻編碼以各個領(lǐng)域均發(fā)展迅猛。特別是,空間音頻應(yīng)用已變得愈來愈重要。音頻信號處理常用來去相關(guān)或渲染(render)信號。此外,信號的去相關(guān)及渲染用在單聲道至立體聲上混(upmix)、單聲道/立體聲至多聲道上混、人工混響、立體聲加寬或使用者交互式混合/渲染的處理程序中。
[0003]若干音頻信號處理系統(tǒng)采用去相關(guān)器。一個重要實例為在參數(shù)性空間音頻譯碼器中應(yīng)用去相關(guān)信號來恢復(fù)從一或多個下混(downmix)信號重構(gòu)的兩個以上信號間的特定去相關(guān)性質(zhì)。去相關(guān)器的應(yīng)用顯著地改進(jìn)輸出信號的知覺質(zhì)量,例如當(dāng)與立體聲強(qiáng)度比較時。更明確言之,使用去相關(guān)器實現(xiàn)以寬廣聲音映像、若干并行聲音對象及/或環(huán)境氣氛來適當(dāng)合成空間聲音。但眾所周知,去相關(guān)器也會導(dǎo)入假影,例如時間信號結(jié)構(gòu)、音質(zhì)等的改變。
[0004]去相關(guān)器在音頻處理的其它應(yīng)用實例有例如產(chǎn)生人造混響來改變空間效果,或在多聲道回聲消除系統(tǒng)使用去相關(guān)器來改良混響表現(xiàn)。
[0005]一種重要的空間音頻編碼方案為參數(shù)立體聲(PS)。圖1例示說明單聲道至立體聲譯碼器結(jié)構(gòu)。單個去相關(guān)器從單聲道輸入信號M (“干燥(dry)”信號)產(chǎn)生去相關(guān)器信號D(“濕(wet)”信號)。去相關(guān)信號D然后連同信號M饋入混合器。然后,混合器對輸入信號M及D應(yīng)用混合矩陣H來產(chǎn)生輸出信號L及R?;旌暇仃嘓中的系數(shù)可以是固定的、信號依賴的、或由使用者所控制的。
[0006]可選地,混合矩陣由側(cè)邊信息控制,側(cè)邊信息連同下混傳輸并含有有關(guān)參數(shù)描述,該參數(shù)描述如何上混該下混的信號來形成期望的多聲道輸出。空間側(cè)邊信息通常在根據(jù)信號編碼器的單聲道下混處理期間產(chǎn)生。
[0007]如前述空間音頻編碼廣泛應(yīng)用于例如參數(shù)立體聲。參數(shù)立體聲譯碼器的典型結(jié)構(gòu)顯示于圖2。在圖2中,去相關(guān)在變換域執(zhí)行??臻g參數(shù)可由使用者或額外工具修改,例如雙耳渲染/呈現(xiàn)的后處理。在此種情況下,上混參數(shù)與得自雙耳濾波器的參數(shù)被組合來計算混合矩陣的輸入?yún)?shù)。
[0008]混合矩陣H的輸出L/R從單聲道輸入信號M及去相關(guān)信號D計算。
【權(quán)利要求】
1.一種用于譯碼被編碼的音頻信號的裝置(10、40、60、410),該被編碼的音頻信號具有包含時隙及與所述時隙相關(guān)聯(lián)的事件的音頻信號幀,該裝置包括: 分析單元(20、42、70、420),用于分析指示所述音頻信號幀中的時隙總數(shù)的幀時隙數(shù),指示所述音頻信號幀中的包含事件的時隙數(shù)的事件時隙數(shù),以及事件狀態(tài)數(shù);以及 生成單元(30、45、80、430),用于使用所述幀時隙數(shù)、所述事件時隙數(shù)、以及所述事件狀態(tài)數(shù)來生成對所述音頻信號幀中包含所述事件的多個時隙位置的指示。
2.根據(jù)權(quán)利要求1所述的譯碼裝置(10、40、60、410), 其中,所述譯碼裝置(10、40、60、410)適用于譯碼音頻信號幀中的瞬態(tài)的時隙位置。
3.根據(jù)權(quán)利要求1或2所述的譯碼裝置(10、40、60、410), 其中,所述分析單元(20、42、70、420)適用于進(jìn)行測試,以比較所述事件狀態(tài)數(shù)或更新后的事件狀態(tài)數(shù)與閾值。
4.根據(jù)權(quán)利要求3所述的譯碼裝置(10、40、60、410), 其中,所述分析單元(20、42、70、420)適用于通過比較所述事件狀態(tài)數(shù)或更新后的事件狀態(tài)數(shù)是否大于、大于等于、小于、或小于等于所述閾值而進(jìn)行所述測試,并且 其中,所述生成單元(30、45、80、430)還適用于根據(jù)所述測試結(jié)果而更新所述事件狀態(tài)數(shù)或所述更新后的事件狀態(tài)數(shù)。
5.根據(jù)權(quán)利要求3或4所述的譯碼裝置(10、40、60), 其中,所述譯碼裝置(10、4 0、60 )還包括時隙選擇器(90 ), 其中,所述時隙選擇器(90)適用于選擇時隙作為考慮時隙, 其中,所述分析單元(20、42、70)適用于關(guān)于考慮時隙進(jìn)行所述測試,以及 其中,所述閾值取決于所述幀時隙數(shù)、所述事件時隙數(shù)并取決于所述考慮時隙在所述幀內(nèi)部的位置。
6.根據(jù)權(quán)利要求5所述的譯碼裝置(10、40), 其中,所述分析單元(20、42、70 )適用于進(jìn)行所述測試以比較所述事件狀態(tài)數(shù)或所述更新后的事件狀態(tài)數(shù)與所述閾值, 其中,所述閾值為 p
7.根據(jù)權(quán)利要求1至4中任一項所述的譯碼裝置(10、40、410), 其中,所述譯碼裝置(10、40、410)還包括幀劃分器(440), 其中,所述幀劃分器(440)適用于將所述幀分成包含所述幀的第一組時隙的第一幀劃分及包含所述幀第二組時隙的第二幀劃分,并且其中,所述譯碼裝置(10、40、410)還適用于針對每一個所述幀劃分獨(dú)立地確定包含所述事件的時隙位置。
8.根據(jù)任一前述權(quán)利要求所述的譯碼裝置(10、40、60、410),還包括: 音頻信號處理器(50),用于利用使用所述幀時隙數(shù)、所述事件時隙數(shù)、及所述事件狀態(tài)數(shù)生成的對所述音頻信號幀中包含所述事件的多個時隙位置的所述指示來生成音頻輸出信號。
9.根據(jù)權(quán)利要求8所述的譯碼裝置(10、60、410), 其中,如果對包含所述事件的多個時隙位置的所述指示處于第一指示狀態(tài),則所述音頻信號處理器(50)適用于根據(jù)第一方法生成所述音頻輸出信號,并且其中,如果對包含所述事件的多個時隙位置的所述指示處于與所述第一指示狀態(tài)不同的第二指示態(tài),則所述音頻信號處理器(50)適用于根據(jù)不同的第二方法生成所述音頻輸出信號。
10.根據(jù)權(quán)利要求9所述的譯碼裝置(10、40、60、410), 其中,所述音頻信號處理器(50)適用于使得如果所述第一指示狀態(tài)指示所述時隙包含瞬態(tài),則所述第一方法包括采用瞬態(tài)去相關(guān)器(56)來譯碼時隙,并且如果所述第二指示態(tài)指示所述時隙不包含瞬態(tài),則所述第二方法包括采用第二去相關(guān)器(54)來譯碼時隙。
11.一種用于編碼音頻信號幀中包含事件的時隙位置的裝置(510),所述裝置包括: 事件狀態(tài)數(shù)生成器(530),用于通過編碼事件狀態(tài)數(shù)來編碼所述時隙位置;以及 時隙信息單元(520),適用于提供指示所述音頻信號幀的時隙總數(shù)的幀時隙數(shù)和指示所述音頻信號幀中包含所述事件的時隙數(shù)的事件時隙數(shù)給所述事件狀態(tài)數(shù)生成器(530),其中,所述事件狀態(tài)數(shù)、所述幀時隙數(shù)、和所述事件時隙數(shù)共同指示所述音頻信號幀中包含所述事件 的多個時隙位置。
12.根據(jù)權(quán)利要求11所述的譯碼裝置(510), 其中,所述事件狀態(tài)數(shù)生成器(530)適用于通過對包含事件的每個時隙加正整數(shù)值而生成事件狀態(tài)數(shù)。
13.根據(jù)權(quán)利要求11所述的譯碼裝置(510), 其中,所述事件狀態(tài)數(shù)生成器(530)適用于通過針對第一幀劃分生成第一事件子狀態(tài)數(shù),針對第二幀劃分生成第二事件子狀態(tài)數(shù),并組合所述第一事件子狀態(tài)數(shù)和所述第二事件子狀態(tài)數(shù)而生成所述事件狀態(tài)數(shù),從而生成所述事件狀態(tài)數(shù)。
14.一種用于譯碼音頻信號幀中包含事件的時隙位置的方法,所述方法包括: 分析指示所述音頻信號幀的時隙總數(shù)的幀時隙數(shù),指示所述音頻信號幀中的包含事件的時隙數(shù)的事件時隙數(shù),和事件狀態(tài)數(shù);以及 使用所述幀時隙數(shù)、所述事件時隙數(shù)、和所述事件狀態(tài)數(shù)生成對所述音頻信號幀中包含所述事件的多個時隙位置的指示。
15.一種用于編碼音頻信號幀中包含事件的時隙位置的方法,所述方法包括: 接收或確定指示所述音頻信號幀的時隙總數(shù)的幀時隙數(shù), 接收或確定指示所述音頻信號幀中的包含事件的時隙數(shù)的事件時隙數(shù), 基于事件狀態(tài)數(shù)、所述幀時隙數(shù)、和所述事件時隙數(shù)編碼所述事件狀態(tài)數(shù),使得能夠使用所述幀時隙數(shù)、所述事件時隙數(shù)、及所述事件狀態(tài)數(shù)來對所述音頻信號幀中包含所述事件的多個時隙位置的指示進(jìn)行譯碼。
16.一種用于譯碼音頻信號幀中包含事件的時隙位置的計算機(jī)程序,所述計算機(jī)程序?qū)崿F(xiàn)根據(jù)權(quán)利要求14所述的用于譯碼所述音頻信號幀中所述事件的時隙位置的方法。
17.一種用于編碼音頻信號幀中包含事件的時隙位置的計算機(jī)程序,所述計算機(jī)程序?qū)崿F(xiàn)根據(jù)權(quán)利要求15所述的用于編碼所述音頻信號幀中所述事件的時隙位置的方法。
18.—種包含事件狀態(tài)數(shù)的編碼音頻信號,其中,所述包含事件的時隙位置能夠根據(jù)權(quán)利要求14所述的方法被譯碼。
【文檔編號】G10L19/008GK103620677SQ201280013909
【公開日】2014年3月5日 申請日期:2012年1月17日 優(yōu)先權(quán)日:2011年1月18日
【發(fā)明者】阿希姆·昆茨, 薩沙·迪施, 湯姆·貝克斯特倫 申請人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司