亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

使用相位值平滑對(duì)下混頻音頻信號(hào)進(jìn)行上混頻的裝置、方法和計(jì)算機(jī)程序與流程

文檔序號(hào):12541344閱讀:192來源:國知局
使用相位值平滑對(duì)下混頻音頻信號(hào)進(jìn)行上混頻的裝置、方法和計(jì)算機(jī)程序與流程
使用相位值平滑對(duì)下混頻音頻信號(hào)進(jìn)行上混頻的裝置、方法和計(jì)算機(jī)程序本申請(qǐng)是申請(qǐng)日為2010年4月1日的中國專利申請(qǐng)201080003595.6(使用相位值平滑對(duì)下混頻音頻信號(hào)進(jìn)行上混頻的裝置、方法和計(jì)算機(jī)程序)的分案申請(qǐng)。技術(shù)領(lǐng)域根據(jù)本發(fā)明的實(shí)施例涉及一種用于對(duì)下混頻音頻信號(hào)進(jìn)行上混頻的裝置、方法和計(jì)算機(jī)程序。根據(jù)本發(fā)明的一些實(shí)施例涉及參數(shù)多聲道音頻編碼的自適應(yīng)相位參數(shù)平滑。

背景技術(shù):
下面將描述本發(fā)明的背景。參數(shù)音頻編碼領(lǐng)域中的新近發(fā)展發(fā)表了將多聲道音頻(例如,5.1)信號(hào)聯(lián)合編碼成一個(gè)(或一個(gè)以上)下混頻聲道加輔助信息流的技術(shù)。這些技術(shù)被稱為雙耳提示編碼(BinauralCueCoding)、參數(shù)立體聲、及MPEG環(huán)繞等等。許多出版物描述了所謂的“雙耳提示編碼”參數(shù)多聲道編碼方法,例如見參考文獻(xiàn)[1][2][3][4][5]。“參數(shù)立體聲」”是一種基于傳輸?shù)膯温暤佬盘?hào)加參數(shù)輔助信息的雙聲道立體聲信號(hào)的參數(shù)編碼的相關(guān)技術(shù),例如見參考文獻(xiàn)[6][7]?!癕PEG環(huán)繞”是參數(shù)多聲道編碼的ISO標(biāo)準(zhǔn),例如見參考文獻(xiàn)[8]。上面提及的技術(shù)是基于將壓縮形式的人類空間聽覺的相關(guān)感知提示以及相關(guān)聯(lián)的單聲道或立體聲下混頻信號(hào)傳輸至接收器。典型的提示可以是聲道間級(jí)差(ILD)、聲道間相關(guān)或相干(ICC)、以及聲道間時(shí)間差(ITD)、聲道間相位差(IPD)、及總相位差(OPD)。這些參數(shù)在一些情況中以適合于人類聽覺分辨率的頻率與時(shí)間分辨率來傳輸。對(duì)該傳輸而言,典型地對(duì)這些參數(shù)進(jìn)行量化(或在一些情況中甚至必須被量化),其中經(jīng)常(尤其是對(duì)低比特率情境)使用相當(dāng)粗略的量化。時(shí)間上的更新間隔由編碼器根據(jù)信號(hào)特性確定。這意味著,并非對(duì)下混頻信號(hào)的每個(gè)采樣都傳輸參數(shù)。換言之,在一些情況中,描述上面提及的提示的參數(shù)的傳輸速率(或傳輸頻率,或更新速率)可以小于音頻采樣(或諸組音頻采樣)的傳輸速率(或傳輸頻率,或更新速率)。代替?zhèn)鬏斅暤篱g相位差(IPD)及總相位差(OPD),僅傳輸聲道間相位差(IPD)并估計(jì)解碼器中總相位差(OPD)也是可能的。由于解碼器在一些情況中可能必須以無隙方式隨時(shí)間將參數(shù)連續(xù)應(yīng)用于例如每個(gè)采樣(或音頻采樣),因此可能需要在解碼器側(cè)處得到中間參數(shù),典型地是通過過去與當(dāng)前參數(shù)集的間的內(nèi)插。然而,一些傳統(tǒng)內(nèi)插方法導(dǎo)致不良的音頻質(zhì)量。下面參考圖7將描述通用雙耳提示編碼方案。圖7示出了雙耳提示編碼傳輸系統(tǒng)800的示意框圖,該雙耳提示編碼傳輸系統(tǒng)800包含雙耳提示編碼編碼器810及雙耳提示編碼解碼器820。雙耳提示編碼編碼器810可以例如接收多個(gè)音頻信號(hào)812a、812b及812c。進(jìn)一步地,雙耳提示編碼編碼器810被配置為利用下混頻器814來對(duì)音頻輸入信號(hào)812a-812c進(jìn)行下混頻以獲得下混頻信號(hào)816,該下混頻信號(hào)816例如可以是和信號(hào)且可被用“AS”或“X”表示。進(jìn)一步地,雙耳提示編碼編碼器810被配置為利用分析器818來分析音頻輸入信號(hào)812a-812c以獲得輔助信息信號(hào)819(“SI”)。和信號(hào)816及輔助信息信號(hào)819自雙耳提示編碼編碼器810傳輸至雙耳提示編碼解碼器820。雙耳提示編碼解碼器820可被配置為基于和信號(hào)816及聲道間提示824合成多聲道音頻輸出信號(hào),該多聲道音頻輸入信號(hào)例如包含音頻聲道y1、y2,...yN。為此目的,雙耳提示編碼解碼器820可以包含雙耳提示編碼合成器822,該雙耳提示編碼合成器822接收和信號(hào)816及聲道間提示824并提供音頻信號(hào)y1、y2,...yN。雙耳提示編碼解碼器820進(jìn)一步包含輔助信息處理器826,該輔助信息處理器826被配置為接收輔助信息819,以及可選地接收使用者輸入827。該輔助信息處理器826被配置為基于輔助信息819和可選使用者輸入827來提供聲道間提示824??傊?,對(duì)音頻輸入信號(hào)進(jìn)行分析且下混頻。和信號(hào)與輔助信息被傳輸至解碼器。聲道間提示是由輔助信息及本地使用者輸入來產(chǎn)生的。雙耳提示編碼合成產(chǎn)生多聲道音頻輸出信號(hào)。至于詳情請(qǐng)參考C.Faller與F.Baumgarte所著文章“BinauralCueCodingPartII:Schemesandapplications,″(出版于:2003年11月第11卷語音與音頻處理的IEEE學(xué)報(bào))。然而,已得知的是,如果輔助信息被粗略量化或分辨率不足,許多傳統(tǒng)雙耳提示編碼解碼器提供質(zhì)量劣化的多聲道輸出音頻信號(hào)。鑒于此問題,需要一種將下混頻音頻信號(hào)上混頻成上混頻的音頻信號(hào)的改進(jìn)構(gòu)思,這在描述上混頻信號(hào)不同聲道中之間的相位關(guān)系的輔助信息以相對(duì)低分辨率被量化的情況下,減少了聽覺印象的降級(jí)。

技術(shù)實(shí)現(xiàn)要素:
根據(jù)本發(fā)明的實(shí)施例建立一種用于將描述了一個(gè)或一個(gè)以上下混頻音頻聲道的下混頻音頻信號(hào)上混頻成描述了多個(gè)上混頻音頻聲道的上混頻音頻信號(hào)的裝置。該裝置包含上混頻器,該上混頻器被配置為應(yīng)用時(shí)變上混頻參數(shù)來對(duì)下混頻信號(hào)進(jìn)行上混頻,以便獲得上混頻音頻信號(hào)。該時(shí)變上混頻參數(shù)包含時(shí)變平滑的相位值。該裝置進(jìn)一步包含參數(shù)確定器,該參數(shù)確定器被配置為基于量化的上混頻參數(shù)輸入信息來獲得一個(gè)或一個(gè)以上時(shí)間平滑的上混頻參數(shù),以由該上混頻器使用。該參數(shù)確定器被配置為利用相位改變限制算法,來將前一平滑的相位值的縮放版本與輸入相位信息的縮放版本相組合,以基于該前一平滑的相位值及該輸入相位信息來確定當(dāng)前平滑的相位值。根據(jù)本發(fā)明的該實(shí)施例是基于下述發(fā)現(xiàn):上混頻信號(hào)中的可聽偽像可以通過利用相位改變限制算法來將前一平滑的相位值的縮放版本與輸入相位信息的縮放版本相組合來減少或甚至避免,因?yàn)榻Y(jié)合相位改變限制算法考慮前一平滑的相位值允許將平滑的相位值的不連續(xù)性保持適度地小。后續(xù)平滑的相位值的間(例如,前一平滑的相位值與當(dāng)前平滑的相位值)不連續(xù)性的減小相應(yīng)地有助于避免(或保持足夠小)應(yīng)用了后續(xù)相位值(例如,前一平滑的相位值與當(dāng)前平滑的相位值)的音頻信號(hào)的部分之間的過渡的可聽頻率變化。綜上所述,本發(fā)明建立參數(shù)多聲道音頻編碼的自適應(yīng)相位處理的一般性概念。根據(jù)本發(fā)明的實(shí)施例通過減少由粗略量化或快速改變相位參數(shù)而引起的輸出信號(hào)中的偽像取代其它技術(shù)。在優(yōu)選實(shí)施例中,參數(shù)確定器被配置為將前一平滑的相位值的縮放版本與輸入相位信息的縮放版本相組合,使得當(dāng)前平滑的相位值在第一角度區(qū)域與一第二角度區(qū)域中的較小角度區(qū)域中,其中第一角度區(qū)域沿著數(shù)學(xué)正方向從前一平滑的相位值所定義的第一開始方向延伸至相位輸入信息所定義的第一結(jié)束方向,其中第二角度區(qū)域沿著數(shù)學(xué)正方向從輸入相位信息所定義的一第二開始方向延伸至前一平滑的相位值所定義的第二結(jié)束方向。因此,在本發(fā)明的一些實(shí)施例中,由相位值的遞歸(無限脈沖響應(yīng)型)平滑而引入的相位變化保持盡可能小。因此,可聽偽像保持盡可能小。例如,裝置可以被配置為確保當(dāng)前平滑的相位值置于兩角度范圍中的較小角度范圍中,其中該兩角度范圍中的第一角度范圍覆蓋大于180°及其中該角度范圍中的第二角度范圍覆蓋小于180°,兩個(gè)角度范圍共同覆蓋360°。因此,相位改變限制算法確保了前一平滑化的相位值與當(dāng)前平滑的相位值之間的相位差小于180°,優(yōu)選地甚至小于90°。這有助于保持可聽偽像盡可能小。在優(yōu)選實(shí)施例中,參數(shù)確定器被配置為根據(jù)相位輸入信息與前一平滑的相位值之間的差值,從多個(gè)不同組合規(guī)則中選擇組合規(guī)則,并利用選定的組合規(guī)則來確定該當(dāng)前平滑的相位值。因此,可以實(shí)現(xiàn)的是選擇適當(dāng)?shù)慕M合規(guī)則,這確保了前一平滑化相位值與當(dāng)前平滑的相位值之間的相位改變小于預(yù)定閾值、或更概括而言足夠地小或盡可能小。因此,本發(fā)明裝置勝過類似具有固定組合規(guī)則的類似裝置。在優(yōu)選實(shí)施例中,參數(shù)確定器被配置為如果相位輸入信息與前一平滑的相位值之間的差值在-π與+π的范圍內(nèi),則選擇基本組合規(guī)則,否則選擇一個(gè)或一個(gè)以上不同的相位適應(yīng)組合規(guī)則?;窘M合規(guī)則定義了相位輸入信息的縮放版本與前一平滑化相位值的縮放版本的線性組合,而無需恒定被加數(shù)。一個(gè)或一個(gè)以上相位適應(yīng)組合規(guī)則考慮了恒定相位適應(yīng)被加數(shù),定義了輸入相位信息的縮放版本與前一平滑的相位值的縮放版本線性組合。因此,可以執(zhí)行前一平滑的相位值與輸入相位信息的有利且易于實(shí)施的線性組合,其中如果前一平滑的相位值與輸入相位信息之間的差值取相對(duì)大的值(大于π或小于-π),則可以選擇性地應(yīng)用附加的被加數(shù)。因此,前一平滑的相位值與輸入相位信息之間的差值大的問題情況可用特定適宜的相位適應(yīng)組合規(guī)則來處理,該特定適宜的相位適應(yīng)組合規(guī)則允許保持后續(xù)平滑的相位值之間的相位改變足夠小。在優(yōu)選實(shí)施例中,該參數(shù)確定器包含平滑控制器,其中該平滑控制器被配置為,在平滑的相位量與對(duì)應(yīng)的輸入相位量之間的差值大于預(yù)定閾值的情況下,選擇性地禁用相位值平滑功能。因此,如果存在較大的輸入相位信息改變,則可以禁用相位值平滑功能。典型地,輸入相位信息的極大改變表示的是,確實(shí)期望執(zhí)行非平滑的相位改變,因?yàn)檩斎胂辔恍畔⒌南喈?dāng)大的改變(顯著大于量化步驟)通常與音頻信號(hào)內(nèi)的特定聲音事件有關(guān)。因此,在大部分情況下改進(jìn)聽覺印象的對(duì)相位值的平滑在此特定情況中是有害的。因此,該聽覺印象甚至可以通過選擇性地禁用相位值平滑功能來改進(jìn)。在優(yōu)選實(shí)施例中,平滑控制器被配置為對(duì)兩個(gè)平滑的相位值之間的差值進(jìn)行評(píng)估作為該平滑的相位量,并且對(duì)與這兩個(gè)平滑的相位值相對(duì)應(yīng)的兩個(gè)輸入相位值之間的差值進(jìn)行評(píng)估,作為對(duì)應(yīng)的輸入相位量。已經(jīng)發(fā)現(xiàn),在一些情況中,與多聲道音頻信號(hào)的不同(上混頻)聲道相關(guān)聯(lián)的相位值之間的差值是判定應(yīng)當(dāng)啟用還是禁用相位值平滑功能的特別有意義的量。在優(yōu)選實(shí)施例中,上混頻器被配置為,如果平滑化功能(或相位值平滑功能)被啟用,則對(duì)于指定時(shí)間部分應(yīng)用由不同平滑的相位值定義的不同時(shí)間上平滑的相位旋轉(zhuǎn),來獲得具有聲道間相位差的上混頻音頻聲道的信號(hào),并且如果平滑功能(或相位值平滑功能)被禁用,則應(yīng)用由不同非平滑相位值定義的時(shí)間上非平滑的相位旋轉(zhuǎn),來獲得具有聲道間相位差的不同上混頻音頻聲道的信號(hào)。在此情況中,參數(shù)確定器包含平滑控制器,平滑控制器被配置為,如果平滑的相位值之間的差值與非平滑的聲道間相位差值存在差異且該差異超過預(yù)定閾值,則選擇性地禁用相位值平滑功能,平滑的相位值被應(yīng)用于獲得不同上混頻音頻聲道的信號(hào),非平滑的聲道間相位差值由所述裝置接收或由所述裝置從接收到的信息中導(dǎo)出。已經(jīng)發(fā)現(xiàn),如果聲道間相位差值被評(píng)估為用于激活和去激活相位值平滑功能的準(zhǔn)則,則相位值平滑功能的選擇性去激活就提高聽覺印象而言是特別有用的。在優(yōu)選實(shí)施例中,參數(shù)確定器被配置為,根據(jù)平滑的相位值與對(duì)應(yīng)的輸入相位值之間的當(dāng)前差值,來調(diào)整濾波器時(shí)間常數(shù),以確定平滑相位值序列。通過調(diào)整濾波器時(shí)間常數(shù)可以實(shí)現(xiàn)的是,非常大的輸入相位值改變獲得足夠小的穩(wěn)定時(shí)間(settlingtime),而對(duì)輸入相位值的較低或中等改變保持充分良好的平滑特性。此功能帶來了特別的好處,因?yàn)檩斎胂辔恢档南喈?dāng)小的(或至多中等規(guī)模的)改變通常是由量化粒度引起。換言之,由量化粒度引起的輸入相位值的逐步改變可以造成有效的平滑操作。在這種情況中,平滑功能特別有利,其中,相對(duì)長的濾波器時(shí)間常數(shù)帶來良好結(jié)果。相反,顯著大于量化步驟的非常大的輸入相位值改變典型地對(duì)應(yīng)于期望的較大相位值改變。在此情況中,相對(duì)短的濾波器時(shí)間常數(shù)帶來良好結(jié)果。因此,通過根據(jù)平滑的相位值與對(duì)應(yīng)的輸入相位值之間的當(dāng)前差值,來調(diào)整濾波器時(shí)間常數(shù)可達(dá)到的是,輸入相位值的有意較大改變?cè)斐善交南辔恢档目焖俑淖儯×炕襟E的規(guī)模的輸入相位值的相對(duì)小的改變?cè)斐善交辔恢档南鄬?duì)慢且平滑的過渡。因此,對(duì)于期望相位值的有意、較大改變以及對(duì)于期望相位值的較小改變(然而可以由一個(gè)量化步驟引起該輸入相位值的改變)皆達(dá)到良好的聽覺印象。在優(yōu)選實(shí)施例中,參數(shù)確定器被配置為根據(jù)平滑聲道間相位差與非平滑聲道相位差之間的差值,來調(diào)整濾波器時(shí)間常數(shù)以確定平滑相位值序列,平滑聲道間相位差由與上混頻音頻信號(hào)的不同聲道相關(guān)聯(lián)的兩個(gè)平滑的相位值之間的差值來定義,非平滑聲道相位差由非平滑聲道間相位差信息來定義。已經(jīng)發(fā)現(xiàn),選擇性地調(diào)整濾波器時(shí)間常數(shù)的構(gòu)想可以有利地結(jié)合聲道間相位差的處理來使用。在優(yōu)選實(shí)施例中,用于上混頻的裝置被配置為根據(jù)從音頻比特流中提取的信息,選擇性地啟用或禁用相位值平滑功能。已經(jīng)發(fā)現(xiàn),聽覺印象的改進(jìn)可以通過在音頻編碼器的控制下提供選擇性啟用或禁用音頻解碼器內(nèi)的相位值平滑功能的可能性來獲得。根據(jù)本發(fā)明的實(shí)施例建立一種實(shí)施上面所討論用于將下混頻音頻信號(hào)上混頻成上混頻音頻信號(hào)的裝置的功能的方法。所述方法基于與所討論裝置的相同構(gòu)想。此外,根據(jù)本發(fā)明的實(shí)施例建立一種用于執(zhí)行所述方法的計(jì)算機(jī)程序。附圖說明參考附圖隨后將描述根據(jù)本發(fā)明的實(shí)施例,在附圖中:圖1示出了根據(jù)本發(fā)明實(shí)施例的用于對(duì)下混頻音頻信號(hào)進(jìn)行上混頻的裝置示意框圖;圖2a和2b示出了根據(jù)本發(fā)明另一實(shí)施例的用于對(duì)下混頻音頻信號(hào)進(jìn)行上混頻的裝置的示意框圖;圖3示出了總相位差OPD1、OPD2和聲道間相位差I(lǐng)PD的示意圖;圖4a和4b示出了相位改變限制算法的第一種情況的相位關(guān)系的圖示;圖5a和5b示出了相位改變限制算法的第二種情況的相位關(guān)系的圖示;圖6示出了根據(jù)本發(fā)明實(shí)施例的用于將下混頻音頻信號(hào)上混頻成上混頻音頻信號(hào)的方法的流程圖;圖7示出了表示通用雙耳提示編碼方案的示意框圖。具體實(shí)施方式1.根據(jù)圖1的實(shí)施例圖1示出了根據(jù)本發(fā)明實(shí)施例的用于對(duì)下混頻音頻信號(hào)進(jìn)行上混頻的裝置100的示意框圖。裝置100被配置為接收對(duì)一個(gè)或一個(gè)以上下混頻音頻聲道加以描述的下混頻音頻信號(hào)110,并且提供對(duì)多個(gè)上混頻音頻聲道加以描述的上混頻音頻信號(hào)120。裝置100包含上混頻器130,該上混頻器130被配置為應(yīng)用時(shí)變上混頻參數(shù)來對(duì)下混頻音頻信號(hào)進(jìn)行上混頻,以便獲得上混頻的音頻信號(hào)120。裝置100還包含參數(shù)確定器140,該參數(shù)確定器140被配置為接收量化的上混頻參數(shù)輸入信息142。參數(shù)確定器140被配置為基于量化的上混頻參數(shù)輸入信息142來獲得一個(gè)或一個(gè)以上時(shí)間上平滑的上混頻參數(shù)144以供上混頻器130使用。參數(shù)確定器140被配置為利用相位改變限制算法146,將前一平滑的相位值的縮放版本與包括在量化的上混頻參數(shù)輸入信息142中的輸入相位信息142a的縮放版本相組合,以基于前一平滑的相位值和該輸入相位信息142來確定當(dāng)前平滑的相位值144a。該當(dāng)前平滑的相位值144a包括在時(shí)變平滑的上混頻參數(shù)144中。下面將說明有關(guān)裝置100的功能的一些細(xì)節(jié)。下混頻音頻信號(hào)110例如以復(fù)值集合序列的形式被輸入至上混頻器130中,該復(fù)值集合序列表示時(shí)頻域(描述在由此處未示出的編碼器確定的更新速率下的交疊與非交疊頻帶或頻率子帶)中的下混頻音頻信號(hào)。上混頻器130被配置為根據(jù)時(shí)變、平滑的上混頻參數(shù)來將下混頻音頻信號(hào)110的多個(gè)聲道線性組合,及/或?qū)⑾禄祛l音頻信號(hào)110的聲道與輔助信號(hào)(例如,去相關(guān)信號(hào))線性組合(其中該輔助信號(hào)可以從下混頻音頻信號(hào)110的當(dāng)前音頻聲道、下混頻音頻信號(hào)110的一個(gè)或一個(gè)以上其它音頻聲道、或下混頻音頻信號(hào)110的音頻聲道的組合中獲得)。因此,上混頻器130可以使用時(shí)變平滑的上混頻參數(shù)144,基于下混頻音頻信號(hào)110來判定在產(chǎn)生上混頻音頻信號(hào)120(或其聲道)中所使用的幅度縮放和/或相位旋轉(zhuǎn)(或時(shí)間延遲)。參數(shù)確定器140典型地被配置為以等于(或在一些情況中高于)量化的上混頻參數(shù)輸入信息142所描述的輔助信息的更新速率來提供時(shí)變、平滑的上混頻參數(shù)144。參數(shù)確定器140可以被配置為避免(或至少減小)由量化的上混頻參數(shù)輸入信息142的粗略(比特率節(jié)省)量化而引起的偽像。為此目的,參數(shù)確定器140可以對(duì)例如描述聲道間相位差的相位信息應(yīng)用平滑。該對(duì)包括在量化的上混頻參數(shù)輸入信息142中的輸入相位信息142a的平滑是利用相位改變限制算法143來執(zhí)行的,使得避免了會(huì)造成可聽偽像的相位的較大且突然的改變(或至少被限制到可容忍的程度)。優(yōu)選地,通過將前一平滑的相位值與輸入相位信息142a的值相結(jié)合來執(zhí)行平滑,使得當(dāng)前平滑化的相位值依賴于前一平滑的相位值和輸入相位信息142a的當(dāng)前值。如此,可以利用簡單結(jié)構(gòu)的平滑算法來獲得特定的平滑過渡。換言之,有限脈沖響應(yīng)平滑的缺點(diǎn)可以通過提供考慮了前一平滑化相位值的無限脈沖響應(yīng)型平滑來避免??蛇x地,參數(shù)確定器140可以包含附加的內(nèi)插功能,如果量化的上混頻參數(shù)輸入信息142以相對(duì)長的時(shí)間間隔來傳輸(例如,每組下混頻音頻信號(hào)110的頻譜值不到一次),則該內(nèi)插功能是有利的。總之,裝置100允許基于量化的上混頻參數(shù)輸入信息142提供時(shí)變平滑的相位值144a,使得時(shí)變平滑的相位值144a非常適合于利用上混頻器130從下混頻音頻信號(hào)中導(dǎo)出上混頻音頻信號(hào)120。利用上面討論構(gòu)思來提供平滑的相位值144減小了(或甚至消除)可聽偽像,其中對(duì)前一平滑的相位值的考慮與相位改變限制結(jié)合。因此,實(shí)現(xiàn)上混頻音頻信號(hào)120的良好聽覺效果。2.根據(jù)圖2的實(shí)施例2.1.圖2的實(shí)施例的概述參考圖2a和2b將描述有關(guān)用于對(duì)音頻信號(hào)進(jìn)行上混頻的裝置的結(jié)構(gòu)和操作的進(jìn)一步細(xì)節(jié)。圖2a和2b示出了根據(jù)本發(fā)明另一實(shí)施例的用于對(duì)下混頻音頻信號(hào)進(jìn)行混頻的裝置200的詳細(xì)示意性框圖。裝置200可以被視作用于基于下混頻音頻信號(hào)210和輔助信息SI產(chǎn)生多聲道(例如,5.1)音頻信號(hào)的解碼器。裝置200實(shí)現(xiàn)了關(guān)于裝置100而描述的功能。裝置200可以例如服務(wù)對(duì)根據(jù)所謂的“雙耳提示編碼”、所謂的“參數(shù)立體聲”或所謂的“MPEG環(huán)繞”而編碼的多聲道音頻信號(hào)。自然地,裝置200可以類似地用于對(duì)根據(jù)其它利用空間提示的系統(tǒng)而編碼的多聲道音頻信號(hào)進(jìn)行上混頻。為簡明起見,裝置200被描述為對(duì)單一聲道下混頻音頻信號(hào)執(zhí)行一上混頻成為雙聲道信號(hào)。然而,這里說明的構(gòu)想易于擴(kuò)展至下混頻音頻信號(hào)包含一個(gè)以上聲道的情況,且也易于擴(kuò)展至上混頻音頻信號(hào)包含兩個(gè)以上聲道的情況。2.2.圖2實(shí)施例的輸入信號(hào)與輸入時(shí)序裝置200被配置為接收下混頻音頻信號(hào)210及輔助信息212。此外,裝置200被配置為提供包含例如多個(gè)聲道的上混頻音頻信號(hào)214。下混頻音頻信號(hào)210例如可以是由編碼器(例如,圖7所示的BCC編碼器810)產(chǎn)生的和信號(hào)。例如,下混頻音頻信號(hào)210可以例如以復(fù)值頻率分解的形式在時(shí)頻域中表示。例如,音頻信號(hào)的多個(gè)頻率子帶(可以交疊或非交疊)的音頻內(nèi)容可以用對(duì)應(yīng)的復(fù)值表示。對(duì)于指定頻帶,下混頻音頻信號(hào)可以由對(duì)考慮了后續(xù)(交疊與非交疊)時(shí)間間隔的頻率子帶中的音頻內(nèi)容加以描述的復(fù)值序列來表示。后續(xù)時(shí)間間隔的后續(xù)復(fù)值可以在裝置100(其可以是多聲道音頻信號(hào)解碼器的部分)或耦接至裝置100的附加裝置中例如利用濾波器組(例如,QMF濾波器組)、快速傅立葉變換或其它同等物來獲得。然而,本文所予以描述的下混頻音頻信號(hào)210的表示通常不等同于用于從多聲道音頻信號(hào)編碼器傳輸至多聲道音頻信號(hào)解碼器或裝置100的下混頻信號(hào)的表示。因此,下混頻音頻信號(hào)210可以由復(fù)值集合或向量組成的流來表示。下面假定,下混頻音頻信號(hào)210的后續(xù)時(shí)間間隔用整數(shù)值索引k標(biāo)示。還假定的是,裝置200在下混頻音頻信號(hào)210的每一間隔k及每一聲道接收一個(gè)復(fù)值集合或向量。因此,在時(shí)間索引k描述的每一個(gè)音頻采樣更新間隔內(nèi)接收一個(gè)采樣(復(fù)值集合或向量)。換言之,下混頻音頻信號(hào)210的音頻采樣(“AS”)由裝置210接收,使得單一音頻采樣AS與每個(gè)音頻采樣更新間隔k相關(guān)聯(lián)。裝置200還接收對(duì)上混頻參數(shù)加以描述的輔助信息。例如,輔助信息212可以描述下列上混頻參數(shù)中的一個(gè)或多個(gè):聲道間級(jí)差(ILD)、聲道間相關(guān)(或相干)(ICC)、聲道間時(shí)間差(ITD)、聲道間相位差(IPD)、及總相位差(OPD)。典型地,輔助信息212包含ILD參數(shù)及參數(shù)ICC、ITD、IPD、OPD中的至少一個(gè)。然而,為了節(jié)省頻寬,在一些實(shí)施例中輔助信息212在下混頻音頻信號(hào)210的每倍數(shù)音頻采樣更新間隔k內(nèi)僅朝裝置200傳輸或由裝置200接收一次(或單一輔助信息集合的傳輸可以在時(shí)間上覆蓋多個(gè)音頻采樣更新間隔k)。因此,在一些情況中,對(duì)于多個(gè)音頻采樣更新間隔k僅有一個(gè)輔助信息參數(shù)集合。然而,在其它情況中,對(duì)于每個(gè)音頻采樣更新間隔k可以有一組輔助信息參數(shù)。輔助信息更新的間隔以索引n表示,其中僅為簡單起見,下面將假定,用整數(shù)值索引k表示的下混頻音頻信號(hào)210的后續(xù)時(shí)間間隔等于更新輔助信息SI212的時(shí)間間隔,使得關(guān)系k=n成立。然而,如果在下混頻音頻信號(hào)210的每多個(gè)后續(xù)時(shí)間間隔k內(nèi)僅執(zhí)行一次輔助信息SI212更新,則例如可以在后續(xù)輸入相位信息值αn或后續(xù)平滑的相位值之間執(zhí)行內(nèi)插。例如,輔助信息可以以音頻采樣更新間隔k=4、k=8及k=16被傳輸至裝置200(或由裝置200接收)。相反,在音頻采樣更新間隔之間不向裝置200傳輸(或由裝置200接收)輔助信息212。因此,輔助信息212的更新間隔可以隨時(shí)間變化,因?yàn)榫幋a器可以例如僅在當(dāng)需要時(shí)(例如,當(dāng)解碼器認(rèn)識(shí)到輔助信息的改變大于預(yù)定值時(shí))才確定提供輔助信息更新。例如,裝置200在音頻采樣更新間隔k=4接收到的輔助信息可以與音頻采樣更新間隔k=3、4、5相關(guān)聯(lián)。類似地,裝置200在音頻采樣更新間隔k=8接收到的輔助信息可以與音頻采樣更新間隔k=6、7、8、9、10相關(guān)聯(lián),以此類推。然而,不同關(guān)聯(lián)自然是可能的,且針對(duì)輔助信息的更新間隔自然地也可以大于或小于所討論的間隔。2.3.圖2實(shí)施例的輸出信號(hào)與輸出時(shí)序然而,裝置200服務(wù)于在復(fù)值頻率組成中提供上混頻音頻信號(hào)。例如,裝置200可以被配置為提供上混頻音頻信號(hào)214,使得該上混頻音頻信號(hào)包含與下混頻音頻信號(hào)210相同的音頻采樣更新間隔或音頻信號(hào)更新速率。換言之,對(duì)于下混頻音頻信號(hào)210的每一采樣(或音頻采樣更新間隔k),在一些實(shí)施例中產(chǎn)生上混頻音頻信號(hào)214的采樣。2.4.上混頻下面將詳細(xì)描述對(duì)于每一音頻采樣間隔k如何獲得用于對(duì)下混頻音頻信號(hào)210進(jìn)行上混頻的上混頻參數(shù)的更新,即便在一些實(shí)施例中解碼器輸入輔助信息212僅可以以較大更新間隔來更新。下面,將說明對(duì)單個(gè)子帶的處理,但是此構(gòu)思自然地可以擴(kuò)展至多個(gè)子帶。裝置200可以包含上混頻器230作為關(guān)鍵組件,該上混頻器230被配置為作為復(fù)值線性組合器進(jìn)行操作。上混頻器230被配置為接收與音頻采樣更新間隔k相關(guān)聯(lián)的下混頻音頻信號(hào)210(例如,表示特定頻帶)的采樣x(t)或x(k)。信號(hào)x(t)或x(k)有時(shí)也表示為“干信號(hào)”。另外,上混頻器230被配置為接收表示下混頻音頻信號(hào)的去相關(guān)版本的采樣q(t)或q(k)。此外,裝置200包含去相關(guān)器(例如,延遲器或混響器)240,去相關(guān)器240被配置為接收下混頻音頻信號(hào)的采樣x(k)并基于此下混頻音頻信號(hào)的采樣x(k)提供下混頻音頻信號(hào)(用x(k)表示)的去相關(guān)版本的采樣q(k)。下混頻音頻信號(hào)(采樣x(k))的去相關(guān)版本(采樣q(k))可以被表示為“濕信號(hào)”。上混頻器230包含例如矩陣向量乘法器232,該矩陣向量乘法器232被配置為執(zhí)行“干信號(hào)”(用x(k)表示)與“濕信號(hào)”(用q(k)表示)的實(shí)值(或在一些情況中,多個(gè)值)線性組合,以獲得第一上混頻聲道信號(hào)(用采樣y1(k)表示)與第二上混頻聲道信號(hào)(用采樣y2(k)表示)。矩陣向量乘法器232可以例如被配置為執(zhí)行下列矩陣向量乘法來獲得上混頻聲道信號(hào)的采樣y1(k)與y2(k):矩陣向量乘法器232或復(fù)值線性組合器230還可以包含相位調(diào)整器233,該相位調(diào)整器233被配置為調(diào)整表示上混頻聲道信號(hào)的采樣y1(k)與y2(k)的相位。例如,相位調(diào)整器233可以被配置為獲得相位調(diào)整的第一上混頻聲道信號(hào),該相位調(diào)整的第一上混頻信號(hào)根據(jù)下式由采樣表示并獲得相位調(diào)整的第二上混頻聲道信號(hào),該相位調(diào)整的第二上混頻聲道信號(hào)根據(jù)下式由采樣表示因此,上混頻音頻信號(hào)214(其采樣用與表示)是由復(fù)值線性組合器230基于干信號(hào)與濕信號(hào)利用時(shí)變上混頻參數(shù)而獲得的。時(shí)變平滑的相位值用于確定上混頻音頻信號(hào)與的相位(或聲道間相位差)。例如,相位調(diào)整器232可以被配置為應(yīng)用時(shí)變平滑的相位值。然而,備選地,時(shí)變平滑的相位值可能已被矩陣向量乘法器232使用(或甚至在矩陣H的項(xiàng)的產(chǎn)生中)。在此情況中,可以完全忽略相位調(diào)整器233。2.5上混頻參數(shù)的更新如由上述方程式可見,期望在每一音頻采樣更新間隔k內(nèi)更新上混頻參數(shù)矩陣H(k)與上混頻聲道相位值α1(k)、α2(k)。在每一音頻采樣更新間隔k內(nèi)更新上混頻參數(shù)矩陣帶來該上混頻參數(shù)矩陣始終良好適應(yīng)于實(shí)際聲學(xué)環(huán)境的優(yōu)點(diǎn)。因?yàn)樯匣祛l參數(shù)矩陣的改變分布于多個(gè)音頻采樣更新間隔上,即使僅在音頻采樣的每倍數(shù)更新間隔k內(nèi)更新一次輔助信息212,在每一音頻采樣更新間隔k內(nèi)更新上混頻參數(shù)矩陣也允許保持后續(xù)音頻采樣間隔k之間的上混頻參數(shù)矩陣H(或其項(xiàng))的逐步改變較小。同樣,期望平滑化由對(duì)輔助信息SI212的量化而引起的上混頻參數(shù)矩陣H的任何改變。類似地,期望頻繁地更新上混頻聲道相位值α1(k)與α2(k),以便至少在連續(xù)音頻信號(hào)期間避免所述上混頻聲道相位值的逐步改變。再者,期望在時(shí)間上平滑上混頻聲道相位值以便減小或避免可能由對(duì)輔助信息SI212的量化而引起的偽像。裝置200包含輔助信息處理單元250,該輔助信息處理單元250被配置為基于輔助信息212提供時(shí)變上混頻參數(shù)262,例如,矩陣H(k)的項(xiàng)Hij(k)與上混頻聲道相位值α1(k)、α2(k)。輔助信息處理單元250例如被配置為在每一音頻采樣更新間隔k內(nèi)提供更新的上混頻參數(shù)組,即使僅在音頻采樣的每倍數(shù)更新間隔k內(nèi)更新一次輔助信息212。然而,在一些實(shí)施例中輔助信息處理單元250可以被配置為不經(jīng)常提供更新的時(shí)變平滑上混頻參數(shù)組,例如輔助信息SI212的每次更新僅提供一次。輔助信息處理單元250包含上混頻參數(shù)輸入信息確定器252,該上混頻參數(shù)輸入信息確定器252被配置為接收輔助信息212并基于此輔助信息212而獲得一個(gè)或多個(gè)上混頻參數(shù)(例如,以上混頻參數(shù)的幅值序列254和上混頻參數(shù)的相位值序列256的形式),一個(gè)或多個(gè)上混頻參數(shù)可以被視作上混頻參數(shù)輸入信息(包含例如,輸入幅度信息254及輸入相位信息256)。例如,上混頻參數(shù)輸入信息確定器252可以組合多個(gè)提示(例如,ILD、ICC、ITD、IPD、OPD)來獲得上混頻參數(shù)輸入信息254、256或可以單獨(dú)評(píng)估提示中的一個(gè)或多個(gè)。上混頻參數(shù)輸入信息確定器252被配置為以輸入幅值(也表示為輸入幅度信息)序列254和分離的輸入相位值(也表示為輸入相位信息)序列256的形式來描述上混頻參數(shù)。輸入相位值序列256的元素可被視作輸入相位信息αn。序列254的輸入幅值可以例如代表復(fù)數(shù)的絕對(duì)值,及序列256的輸入相位值可以例如代表該復(fù)數(shù)的角度值(或相位值)(例如相對(duì)于實(shí)部虛部正交坐標(biāo)系中的實(shí)部軸而測(cè)量的)。因此,上混頻參數(shù)輸入信息確定器252可以提供上混頻參數(shù)的輸入幅值序列254和上混頻參數(shù)的輸入相位值序列256。上混頻參數(shù)輸入信息確定器252可以被配置為從輔助信息集合中獲得完整的上混頻參數(shù)集合(例如,矩陣H的完整矩陣元素集合和相位值α1、α2的完整集合)。輔助信息集合212與輸入上混頻參數(shù)集合254、256之間存在關(guān)聯(lián)。因此,上混頻參數(shù)輸入信息確定器252可以被配置為在每一上混頻參數(shù)更新間隔內(nèi)更新一次序列254、256的輸入上混頻參數(shù),即每次更新該輔助信息集合時(shí)更新一次。輔助信息處理單元還包含參數(shù)平滑器(有時(shí)也被簡單表示為“參數(shù)確定器”)260,該參數(shù)平滑器260將在下面詳細(xì)說明。參數(shù)平滑器260被配置為接收上混頻參數(shù)(或矩陣元素)的(實(shí)數(shù)值)輸入幅值序列254與上混頻參數(shù)(或矩陣元素)的(實(shí)數(shù)值)輸入相位值序列256,上混頻參數(shù)(或矩陣元素)的(實(shí)數(shù)值)輸入相位值序列256可以被視作輸入相位信息αn。此外,參數(shù)平滑器被配置為基于對(duì)序列254與序列256的平滑來提供時(shí)變平滑的上混頻參數(shù)序列262。參數(shù)平滑器260包含幅值平滑器270與相位值平滑器272。幅值平滑器被配置為接收序列254并基于序列254提供上混頻參數(shù)(或矩陣的矩陣元素)的平滑幅值序列274。幅值平滑器270可以例如被配置為執(zhí)行幅值平滑,這將在下面詳細(xì)討論。類似地,相位值平滑器272可以被配置為接收序列256并基于序列256提供上混頻參數(shù)(或矩陣值)的時(shí)變平滑的相位值序列276。相位值平滑器272可以例如被配置為執(zhí)行平滑化算法,這將在下面被詳細(xì)討論。在一些實(shí)施例中,幅值平滑器270和相位值平滑器被配置為分開或獨(dú)立地執(zhí)行幅值平滑和相位值平滑。因此,序列254的幅值并不影響相位值平滑,且序列256的相位值并不影響幅值平滑。然而,假定的是,量值平滑器270與相位值平滑器272以時(shí)間同步方式進(jìn)行操作,使得序列274、276包含上混頻參數(shù)的對(duì)應(yīng)的成對(duì)的平滑幅值和平滑相位值。通常,參數(shù)平滑器260分別用作不同的上混頻參數(shù)或矩陣元素。因此,參數(shù)平滑器260可以針對(duì)每一上混頻參數(shù)(出自多個(gè)上混頻參數(shù))或矩陣H的矩陣元素接收一個(gè)幅值序列254。類似地,參數(shù)平滑器260可以接收輸入相位值αn序列256供每一上混頻音頻聲道的相位調(diào)整。2.6有關(guān)參數(shù)平滑的細(xì)節(jié)下面將說明有關(guān)本發(fā)明的一實(shí)施例的細(xì)節(jié),該實(shí)施例減小了解碼器中由IPD/OPD的量化和/或OPD的估計(jì)而引擎的相位處理偽像。為了簡明起見,下面描述僅限為自一個(gè)至兩個(gè)聲道的上混頻,并不限制可應(yīng)用相同技術(shù)的自m至n個(gè)聲道的上混頻的一般情況。解碼器的例如自一個(gè)至兩個(gè)聲道的上混頻過程由向量與上混頻矩陣H的矩陣乘法來執(zhí)行,該向量包括被稱為干信號(hào)的下混頻信號(hào)x(也用x(k)表示)和被稱為濕信號(hào)的下混頻信號(hào)q(也用q(k)表示)的去相關(guān)版本。濕信號(hào)q由通過去相關(guān)濾波器240饋送下混頻信號(hào)x而產(chǎn)生。上混頻信號(hào)y是包含輸出的第一及第二聲道的向量(例如,y1(k)與y2(k))。所有信號(hào)x、q、y在幅值頻率分解(例如,時(shí)頻域表示)中是可用的。此矩陣運(yùn)算是針對(duì)每一頻帶的所有子帶采樣(或至少針對(duì)一些頻帶的一些子帶采樣)而執(zhí)行(例如,單獨(dú)地)。例如,矩陣運(yùn)算可根據(jù)下列方程式來執(zhí)行:上混頻矩陣H的系數(shù)是從空間提示(典型地,ILD和ICC)中導(dǎo)出,獲得基本上對(duì)于每一聲道基于ICC執(zhí)行干信號(hào)與濕信號(hào)混合的實(shí)值矩陣元素,并依ILD確定調(diào)整兩個(gè)輸出聲道的輸出級(jí)。對(duì)于空間提示(例如,ILD、ICC、ITD、IPD和/或OPD)的傳輸,期望在編碼器中量化一些或所有類型的參數(shù)。特別地對(duì)于低比特率情形,經(jīng)常期望(或甚至必需)利用相當(dāng)粗略的量化來減少傳輸?shù)臄?shù)據(jù)量。然而,對(duì)于特定類型的信號(hào),粗略量化可以導(dǎo)致可聽偽像。為了減小這些偽像,平滑操作可以應(yīng)用于上混頻矩陣H的元素來平滑引起偽像的相鄰量化器步驟之間的過渡。該平滑例如可由對(duì)矩陣元素的簡單低通濾波來執(zhí)行:此平滑例如可由幅值平滑器270來執(zhí)行,其中當(dāng)前輸入幅度信息Hn(例如,由上混頻參數(shù)輸入信息確定器252提供并且用254表示)可以與前一平滑的幅值(或幅度矩陣)相組合,以便獲得當(dāng)前平滑的幅值(或幅度矩陣)因?yàn)槠交梢詫?duì)信號(hào)部分有一負(fù)面影響,其中空間參數(shù)快速改變,平滑可以由從編碼器傳輸?shù)母郊虞o助信息來控制。下面將詳細(xì)描述相位值的應(yīng)用和確定。如果使用IPD和/或OPD,則可以將附加的相移應(yīng)用于輸出信號(hào)(例如,采樣y1(k)和y2(k)定義的信號(hào))。IPD描述兩個(gè)聲道(例如,由采樣定義的相位調(diào)整后的第一上混頻聲道信號(hào)與采樣定義的相位調(diào)整后的第二上混頻聲道信號(hào))之間的相位差,而OPD描述一個(gè)聲道與下混頻之間的相位差。下面參考圖3將簡要闡述IPD與OPD的定義,圖3示出了下混頻信號(hào)與多個(gè)聲道信號(hào)之間相位關(guān)系的示意圖?,F(xiàn)在參考圖3,下混頻信號(hào)(或其頻譜系數(shù)x(k))的相位由第一指針310表示。相位調(diào)整后的第一上混頻聲道信號(hào)(或其一頻譜系數(shù))的相位由第二指針320表示。下混頻信號(hào)(或其頻譜值或系數(shù))與相位調(diào)整后的第一上混頻聲道信號(hào)(或其頻譜系數(shù))之間的相位差用OPD1來表示。相位調(diào)整后的第二上混頻聲道信號(hào)(或其頻譜系數(shù))由第三指針330表示。下混頻信號(hào)(或其頻譜系數(shù))與相位調(diào)整后的第二上混頻聲道信號(hào)(或其頻譜系數(shù))之間的相位差用OPD2來表示。相位調(diào)整后的第一上混頻聲道信號(hào)(或其頻譜系數(shù))與相位調(diào)整后的第二上混頻聲道信號(hào)(或其頻譜系數(shù))之間的相位差用IPD表示。為重構(gòu)原始信號(hào)的相位屬性(基于干信號(hào)提供具有適當(dāng)相位的相位調(diào)整后的第一上混頻聲道信號(hào)與相位調(diào)整后的第二上混頻聲道信號(hào)),應(yīng)知曉這兩個(gè)聲道的OPD。通常,IPD連同OPD一起傳輸(第二OPD接著可由此計(jì)算)。為減少傳輸?shù)臄?shù)據(jù)量,利用包含在下混頻信號(hào)中的相位信息連同傳輸?shù)腎LD和IPD,在解碼器中僅傳輸IPD并估計(jì)OPD也是可能的。此處理可例如由上混頻參數(shù)輸入信息確定器252來執(zhí)行。解碼器(例如,裝置200)中的相位重構(gòu)是根據(jù)下列方程式由輸出子帶信號(hào)(例如,由頻譜系數(shù)y1(k)、y2(k)所描述的信號(hào))的復(fù)旋轉(zhuǎn)來執(zhí)行:在上面方程式中,角度α1與α2等于兩個(gè)聲道的OPD(或,例如,平滑的OPD)。如上所述,參數(shù)(例如,ILD參數(shù)和/或ICC參數(shù))的粗略量化會(huì)導(dǎo)致可聽偽像,這也適用于IPD和OPD的量化。如上所述的平滑操作被應(yīng)用于上混頻矩陣Hn的元素,它僅減少由ILD與ICC的量化而引起的偽像,而那些由相位參數(shù)的量化而引起的偽像并不受影響。此外,額外的偽像可由上述被應(yīng)用于每一輸出聲道的時(shí)變相位旋轉(zhuǎn)而引入。已經(jīng)發(fā)現(xiàn),如果相移角度α1與α2隨時(shí)間快速波動(dòng),則應(yīng)用的旋轉(zhuǎn)角度可以導(dǎo)致瞬時(shí)信號(hào)頻率的短漏失或改變。這兩個(gè)問題可通過將上述平滑方法的修改版本應(yīng)用于角度α1和α2而顯著減少。因?yàn)樵诖饲闆r中,平滑濾波器被應(yīng)用于環(huán)繞每個(gè)2π的角度,優(yōu)選地通過所謂的展開(unwrapping)來修改平滑濾波器。因此,根據(jù)下列算法來計(jì)算平滑的相位值該算法通常規(guī)定對(duì)相位改變的限制:下面參考圖4a、4b、5a和5b將簡要描述上述算法的功能。參考上述用于計(jì)算當(dāng)前平滑的相位值的方程式或算法,可以看出的是,如果,值αn與之間的差值小于或等于π(上述方程式的“否則”的情況),當(dāng)前平滑的相位值是通過當(dāng)前輸入相位信息αn與前一平滑的相位值的加權(quán)線性組合來獲得,而無需額外被加數(shù)。假定δ是0與1之間的參數(shù),該參數(shù)確定(或表示)平滑過程的時(shí)間常數(shù),當(dāng)前平滑的相位值在值αn與之間。例如,如果δ=0.5,則的值是αn與的平均值(算術(shù)平均值)。然而,如果αn與之間的差值大于π,則滿足上述方程式的第一種情況(行)。在此情況中,當(dāng)前平滑的相位值是由αn與的線性組合來獲得的,考慮了恒定相位修改項(xiàng)-2πδ。因此,可實(shí)現(xiàn)保持與之間的差值足夠小。在圖4a中示出了這種情況的示例,其中相位由第一指針410指示,相位αn由第二指針412指示,相位由第三指針414指示。圖4b示出了針對(duì)不同值與αn的相同情況。同樣,相位值αn及由指針450、452、454指示。同樣,應(yīng)當(dāng)實(shí)現(xiàn)的是,與之間的角度差保持足夠小。在兩種情況中,相位值所定義的方向是兩個(gè)角度區(qū)域中的較小區(qū)域,其中兩各角度區(qū)域中的第一區(qū)域通過將指針410、450以數(shù)學(xué)正(逆時(shí)針)方向朝指針412、452旋轉(zhuǎn)而覆蓋,其中第二角度區(qū)域?qū)⑼ㄟ^將指針412、452以數(shù)學(xué)正(逆時(shí)針)方向朝指標(biāo)410、450旋轉(zhuǎn)而覆蓋。然而,如果得知相位值αn與之間的差值小于-π,則利用上述方程式的第二種情況(行)來獲得的值。相位值是通過αn與的線性組合來獲得的,具有常數(shù)相位適應(yīng)項(xiàng)2πδ。在圖5a和5b中說明此種小于-π情況的示例。總之,相位值平滑器272可以被配置為根據(jù)值αn與之間的差值,來選擇不同的相位值計(jì)算規(guī)則(可以是線性組合規(guī)則)。2.7平滑構(gòu)思的可選擴(kuò)展下面將討論上面所討論相位值平滑構(gòu)思的一些可選擴(kuò)展。至于其它參數(shù)(例如,ILD、ICC、ITD),在需要旋轉(zhuǎn)角度快速改變的情況下可能有信號(hào),例如,如果原始信號(hào)(例如編碼器處理的信號(hào))的IPD快速改變。對(duì)于此類信號(hào),相位值平滑器272執(zhí)行的平滑將(在一些情況中)對(duì)輸出質(zhì)量有負(fù)面影響且不應(yīng)該被應(yīng)用于此類情況中。為了避免由頻帶編碼器針對(duì)每一信號(hào)處理頻帶控制平滑所需要的可能的比特率開銷,在解碼器中(例如,在裝置200中)可以利用自適應(yīng)平滑控制(例如,利用平滑控制器來實(shí)現(xiàn)):生成的IPD(即兩個(gè)平滑角度之間的差值,例如,計(jì)算角度α1(k)與α2(k)之間的差值)且與傳輸?shù)腎PD(例如,輸入相位信息αn描述的聲道間相位差)比較。如果差值大于特定閾值,則平滑可以被禁用,且(例如,相位調(diào)整器233)可以使用未處理的角度(例如,由輸入相位信息描述且由上混頻參數(shù)輸入信息確定器提供的角度αn),否則低通濾波的角度(例如,相位值平滑器272提供的平滑相位值)可以(例如,通過相位調(diào)整器233)應(yīng)用于輸出信號(hào)。在(可選的)高級(jí)版本中,相位值平滑器272應(yīng)用的算法可以利用可變?yōu)V波器時(shí)間常數(shù)來擴(kuò)展,該可變?yōu)V波器時(shí)間常數(shù)是基于處理后的IPD與未處理IPD之間的當(dāng)前差值來修改。例如,參數(shù)δ的值(其確定濾波器時(shí)間常數(shù))可以根據(jù)當(dāng)前平滑的相位值與當(dāng)前輸入相位值αn之間的差值或根據(jù)前一平滑的相位值與當(dāng)前輸入相位值αn之間的差值來調(diào)整。此外在一些實(shí)施例中,在自適應(yīng)平滑控制無法給出最佳結(jié)果的關(guān)鍵信號(hào)情況下,在比特流(表示下混頻音頻信號(hào)210和輔助信息212)中傳輸(可選地)單個(gè)比特,以完全啟用或禁用編碼器對(duì)所有頻帶的平滑。3.結(jié)論綜上所述,已經(jīng)描述了參數(shù)化多聲道音頻編碼的自適應(yīng)相位處理的一般性概念。根據(jù)本發(fā)明的實(shí)施例通過減小由對(duì)相位參數(shù)的粗略量化或快速改變而引起的輸出信號(hào)中的偽像來取代其它技術(shù)。4.方法根據(jù)本發(fā)明的實(shí)施例包含一種將描述一或多個(gè)下混頻音頻聲道的下混頻音頻信號(hào)上混頻成描述多個(gè)上混頻音頻聲道的上混頻音頻信號(hào)的方法。圖6示出了這種方法的流程圖,其整體用700來表示。方法700包含步驟710:利用相位改變限制算法將前一平滑的相位值的縮放版本與當(dāng)前相位輸入信息的縮放版本相組合,以基于前一平滑的相位值和輸入相位信息,來確定當(dāng)前平滑化的相位值。方法700也包含步驟720:應(yīng)用時(shí)變上混頻參數(shù)來對(duì)下混頻音頻信號(hào)進(jìn)行上混頻,以便獲得上混頻的音頻信號(hào),其中時(shí)變上混頻參數(shù)包含時(shí)間平滑的相位值。自然地,方法700可以由本文就發(fā)明裝置而予以描述的特征與功能當(dāng)中的任一項(xiàng)來補(bǔ)充。5.實(shí)現(xiàn)備選方案盡管在裝置的上下文中描述了一些方面,然而應(yīng)清楚,這些方面也可以表示對(duì)相應(yīng)方法的描述,其中,模塊或裝置對(duì)應(yīng)于方法步驟或方法步驟的特征。類似地,在方法步驟的上下文中描述的方面也可以表示對(duì)相應(yīng)設(shè)備的相應(yīng)模塊或條目或特征的描述。一些或所有方法步驟可由(或利用)硬件裝置來執(zhí)行,例如,微處理器、可編程計(jì)算機(jī)或電子電路。在一些實(shí)施例中,某一個(gè)或多個(gè)最重要方法步驟可以由這樣的裝置來執(zhí)行根據(jù)特定的實(shí)現(xiàn)需要,本發(fā)明的實(shí)施例可以以硬件或軟件的形式實(shí)現(xiàn)??梢允褂脭?shù)字存儲(chǔ)介質(zhì)來執(zhí)行這種實(shí)現(xiàn),所述數(shù)字存儲(chǔ)介質(zhì)例如是上面存儲(chǔ)有電可讀控制信號(hào)的軟盤、DVD、藍(lán)光、CD、ROM、PROM、EPROM、EEPROM或閃存,所述電可讀控制信號(hào)與可編程計(jì)算機(jī)系統(tǒng)協(xié)作(或能夠與可編程計(jì)算機(jī)系統(tǒng)協(xié)作),以執(zhí)行相應(yīng)的方法。因此,所述數(shù)字存儲(chǔ)介質(zhì)可以是計(jì)算機(jī)可讀的。根據(jù)本發(fā)明的一些實(shí)施例包括數(shù)據(jù)載體,所述數(shù)據(jù)載體具有電可讀控制信號(hào),所述電可讀控制信號(hào)可以與可編程計(jì)算機(jī)系統(tǒng)協(xié)作,以執(zhí)行本文描述的方法之一。通常,本發(fā)明的實(shí)施例可以被實(shí)現(xiàn)為具有程序代碼的計(jì)算機(jī)程序產(chǎn)品,所述程序代碼用于在所述計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行上述方法之一。程序代碼例如可以存儲(chǔ)在機(jī)器可讀載體上。其他實(shí)施例包括用于執(zhí)行本文中描述的方法之一的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序存儲(chǔ)在機(jī)器可讀載體上。換言之,本發(fā)明的方法的實(shí)施例因此是一種具有程序代碼的計(jì)算機(jī)程序,所述程序代碼用于在計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行本文描述的方法之一。本發(fā)明方法的另一實(shí)施例因此是一種數(shù)據(jù)載體(或數(shù)字存儲(chǔ)介質(zhì),或計(jì)算機(jī)可讀介質(zhì)),包括記錄在該數(shù)據(jù)載體上的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于執(zhí)行本文描述的方法之一。因此本發(fā)明的方法的另一實(shí)施例是一種數(shù)據(jù)流或信號(hào)序列,所述數(shù)據(jù)流或信號(hào)序列表示用于執(zhí)行本文描述的方法之一的計(jì)算機(jī)程序。所述數(shù)據(jù)流或信號(hào)序列可以例如被配置為經(jīng)由數(shù)據(jù)通信連接(例如,經(jīng)由互聯(lián)網(wǎng))來傳遞。另一實(shí)施例包括一種處理裝置,例如計(jì)算機(jī)或可編程邏輯裝置,所述處理裝置被配置為適于執(zhí)行本文描述的方法之一。另一實(shí)施例包括一種上面安裝有計(jì)算機(jī)程序的計(jì)算機(jī),所述計(jì)算機(jī)程序用于執(zhí)行本文描述的方法之一。在一些實(shí)施例中,可以使用可編程邏輯裝置(例如,現(xiàn)場(chǎng)可編程門陣列)來執(zhí)行本文描述的方法的一些或全部功能。在一些實(shí)施例中,現(xiàn)場(chǎng)可編程門陣列可以與微處理器協(xié)作,以執(zhí)行本文描述的方法之一。通常,方法優(yōu)選地由任何硬件設(shè)備來執(zhí)行。上述實(shí)施例僅用于說明本發(fā)明的原理。應(yīng)理解,對(duì)于本領(lǐng)域技術(shù)人員來說,本文描述的布置和細(xì)節(jié)的修改和變化是顯而易見的。因此,本發(fā)明僅由非待審專利權(quán)利要求來限制,而不由本文中通過描述和說明實(shí)施例而提供的特定細(xì)節(jié)來限制。參考文獻(xiàn)[l]C.FallerandF.Baumgarte,″Efficientrepresentationofspatialaudiousingperceptualparameterization″,IEEEWASPAA,Mohonk,NY,October2001[2]F.BaumgarteandC.Faller,″Estimationofauditoryspatialcuesforbinauralcuecoding″,ICASSP,Orlando,F(xiàn)L,May2002[3]C.FallerandF.Baumgarte,″Binauralcuecoding:anovelandefficientrepresentationofspatialaudio,″ICASSP,Orlando,F(xiàn)L,May2002[4]C.FallerandF.Baumgarte,″Binauralcuecodingappliedtoaudiocompressionwithflexiblerendering″,AES113thConvention,LosAngeles,Preprint5686,October2002[5]C.FallerandF.Baumgarte,″BinauralCueCoding-PartII:Schemesandapplications,″IEEETrans,onSpeechandAudioProc.,vol.11,no.6,Nov.2003[6]J.Breebaart,S.vandePar,A.Kohlrausch,E.Schuijers,″High-QualityParametricSpatialAudioCodingatLowBitrates″,AES116thConvention,Berlin,Preprint6072,May2004[7]E.Schuijers,J.Breebaart,H.Purnhagen,J.Engdegard,″LowComplexityParametricStereoCoding″,AES116thConvention,Berlin,Preprint6073,May2004[8]ISO/IECJTC1/SC29/WG11,23003-1,MPEGSurround[9]J.Blauert,SpatialHearing:ThePsychophysicsofHumanSoundLocalization,TheMITPress,Cambridge,MA,revisededition1997。
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1