亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于組合多個(gè)參數(shù)編碼的音頻源的設(shè)備和方法

文檔序號(hào):7678681閱讀:267來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):用于組合多個(gè)參數(shù)編碼的音頻源的設(shè)備和方法
技術(shù)領(lǐng)域
本發(fā)明涉及多聲道音頻編碼,具體涉及一種以靈活且有效的方式 組合參數(shù)編碼音頻流的概念。
背景技術(shù)
音頻編碼領(lǐng)域的最新發(fā)展已經(jīng)提出若干參數(shù)音頻編碼技術(shù),用于
共同將多聲道音頻信號(hào)(例如,5.1聲道)編碼成一個(gè)(或更多個(gè))下 混聲道加輔助信息流。通常,輔助信息流具有與多聲道信號(hào)的原始聲 道相對(duì)于多聲道信號(hào)的其他原始聲道或相對(duì)于下混聲道的屬性相關(guān)的 參數(shù)。這些參數(shù)與參考聲道的參數(shù)的特定定義相關(guān)聯(lián),所述特定定義 取決于特定實(shí)現(xiàn)。本領(lǐng)域已知的一些技術(shù)是"雙耳線(xiàn)索編碼"、"空間 音頻編碼"和"參數(shù)立體聲"。
針對(duì)這些特定實(shí)現(xiàn)的細(xì)節(jié), 一并參照相關(guān)公開(kāi)。例如,雙耳線(xiàn)索
編碼描述如下
C. Faller禾卩F. Baumgarte的"Efficient representation of spatial audio using perceptual parametrization ,, , IEEE WASPAA, Mohonk, NY, October 2001; F, Baumgarte禾卩C. Faller的"Estimation of auditory spatial cues for binaural cue coding", ICASSP, Orlando, FL, May 2002; C. Faller 禾口 F. Baumgarte的 "Binaural cue coding: a novel and efficient representation of spatial audio", ICASSP, Orlando, FL, May 2002; C. Faller禾口F. Baumgarte 的"Binaural cue coding applied to audio compression with flexible rendering", AES 113th Convention, Los Angeles, Preprint 5686, October 2002; C. Faller禾口F. Baumgarte的 "Binaural Cue Coding - Part II: Schemes and applications", IEEE Trans, on Speech and Audio Proc. , vol. 11, no. 6 , Nov. 2003 。
盡管雙耳線(xiàn)索編碼使用多個(gè)原始聲道,但參數(shù)立體聲是產(chǎn)生發(fā)送單聲道信號(hào)和參數(shù)輔助信息的雙聲道立體聲信號(hào)的參數(shù)編碼的相關(guān)技 術(shù),例如,見(jiàn)以下公開(kāi)
J. Breebaart, S. van de Par、 A. Kohlrausch、 E. Schuijers上網(wǎng) "High-Quality Parametric Spatial Audio Coding at Low Bitrates", AES 116th Convention, Berlin, Preprint 6072, May 2004; E. Schuijers、 J. Breebaart、 H. Purnhagen、 J. Engdegard的"Low Complexity Parametric Stereo Coding", AES 116th Convention, Berlin, Preprint 6073, May 2004。
其他技術(shù)基于將任意數(shù)目的音頻源或?qū)ο髲?fù)用成單個(gè)發(fā)送音頻 聲道。例如,在BCC (雙耳線(xiàn)索編碼)相關(guān)公開(kāi)中、或最近通過(guò)被稱(chēng) 作"聯(lián)合源編碼"(JSC)的方案引入基于復(fù)用的方案作為"柔性呈現(xiàn)"。 例如,相關(guān)公開(kāi)為C. Faller的"Parametric Joint Coding of Audio Sources", Convention Paper 6752, 120th AES Convention, Paris, May 2006。與參數(shù)立體聲和雙耳線(xiàn)索編碼方案類(lèi)似,這些技術(shù)意在對(duì)多個(gè) 原始音頻對(duì)象(聲道)進(jìn)行編碼,以通過(guò)較少的下混聲道進(jìn)行發(fā)送。 此外,通過(guò)導(dǎo)出每一輸入聲道的基于對(duì)象的參數(shù),可以在接收機(jī)側(cè)將 這些對(duì)象分離并呈現(xiàn)(混合)至特定數(shù)目的輸出設(shè)備,例如頭戴耳機(jī)、 雙聲道立體聲揚(yáng)聲器或多聲道揚(yáng)聲器裝置,可以以極低的數(shù)據(jù)速率對(duì) 所述基于對(duì)象的參數(shù)進(jìn)行編碼并將其發(fā)送至接收機(jī)。該方法允許將不 同音頻對(duì)象電平調(diào)整并重新分配(規(guī)劃)至再現(xiàn)裝置(即接收機(jī)側(cè)) 中的不同位置。
基本上,這樣的技術(shù)始于M-k-N發(fā)射機(jī),M是輸入處的音頻對(duì)象 的數(shù)目,k是發(fā)送的下混聲道的數(shù)目,通常kS2。 N是呈現(xiàn)器輸出處的 音頻聲道的數(shù)目,S卩,例如揚(yáng)聲器的數(shù)目。也就是說(shuō),N:2針對(duì)立體 聲呈現(xiàn)器,或N-6針對(duì)5.1多聲道揚(yáng)聲器裝置。在壓縮效率方面,感知 編碼的下混聲道(由k個(gè)音頻聲道組成)的典型值為例如小于等于 64kbps,并且每一發(fā)送的音頻對(duì)象的對(duì)象參數(shù)的典型值為3kbps。
例如,上述技術(shù)的應(yīng)用情況是與電影院電影產(chǎn)品相關(guān)的空間音頻 場(chǎng)景的編碼,用以允許家庭影院系統(tǒng)中聲音的空間再現(xiàn)。普通示例是 電影介質(zhì)(例如DVD等)上的廣泛熟知的5.1和7.1環(huán)繞聲軌跡。電影產(chǎn)品相對(duì)于音頻場(chǎng)景越來(lái)越復(fù)雜,意在提供空間收聽(tīng)體驗(yàn),由此必須 更仔細(xì)地混合電影場(chǎng)景??梢晕胁煌囊繇憥熁旌喜煌沫h(huán)繞聲或 聲音效果,并因此期望在各個(gè)錄音師之間發(fā)送感知編碼的多聲道情況, 從而有效地傳遞各個(gè)錄音師的音頻流。
此類(lèi)技術(shù)的其他應(yīng)用情況是在點(diǎn)對(duì)點(diǎn)連接的任一端處的多個(gè)談 話(huà)者的電話(huà)會(huì)議。為了節(jié)約帶寬,大多數(shù)電話(huà)會(huì)議裝置按單聲道發(fā)送 方式運(yùn)行。例如,使用聯(lián)合源編碼或用于發(fā)送的其他多聲道編碼技術(shù) 之一,可以在接收端(每一端)處實(shí)現(xiàn)不同談話(huà)者的電平調(diào)整和重新 分配,并因此通過(guò)花費(fèi)比單聲道系統(tǒng)相對(duì)增加的比特速率來(lái)增強(qiáng)揚(yáng)聲 器的清晰度和平衡。在將會(huì)議的每一單個(gè)參與者分配給多聲道揚(yáng)聲器 的單個(gè)聲道(和這樣的揚(yáng)聲器)的特定情況下,增加清晰度的優(yōu)點(diǎn)變 得特別明顯。然而,這是特定情況。通常,參與者的數(shù)目與接收端處 的揚(yáng)聲器的數(shù)目不相匹配。然而,可以通過(guò)使用現(xiàn)有的揚(yáng)聲器裝置來(lái) 呈現(xiàn)與每一參與者相關(guān)聯(lián)的信號(hào),從而看起來(lái)所述信號(hào)源自任一期望 的位置。也就是說(shuō),不僅可以通過(guò)單個(gè)參與者的不同聲音而且可以通 過(guò)與對(duì)話(huà)參與者相關(guān)的音頻源來(lái)識(shí)別該單個(gè)參與者。
盡管現(xiàn)有技術(shù)實(shí)現(xiàn)概念是關(guān)于如何有效地對(duì)多個(gè)聲道或音頻對(duì) 象進(jìn)行編碼,所有當(dāng)前已知的技術(shù)缺乏有效地組合兩個(gè)或多個(gè)這些發(fā) 送的音頻流來(lái)導(dǎo)出輸出流(輸出信號(hào))的能力,所述輸出流代表所有 輸入音頻流(輸入音頻信號(hào))。
例如,當(dāng)考慮具有兩個(gè)以上位置(每一位置具有一個(gè)或多個(gè)揚(yáng)聲 器)的電話(huà)會(huì)議情況時(shí),會(huì)出現(xiàn)問(wèn)題。因此,需要中間步驟來(lái)接收單 個(gè)源的音頻輸入信號(hào),以及針對(duì)僅具有剩余電話(huà)會(huì)議位置的信息的每 一電話(huà)會(huì)議位置產(chǎn)生音頻輸出信號(hào)。也就是說(shuō),中間步驟必須產(chǎn)生輸 出信號(hào),該輸出信號(hào)是從兩個(gè)或獨(dú)個(gè)音頻輸入信號(hào)的組合中導(dǎo)出的, 并允許再現(xiàn)兩個(gè)或多個(gè)輸入信號(hào)的單個(gè)音頻聲道或音頻對(duì)象。
當(dāng)電影院電影生產(chǎn)中的兩個(gè)錄音師期望組合他們的空間音頻信 號(hào)來(lái)檢查兩個(gè)信號(hào)所產(chǎn)生的收聽(tīng)印象時(shí),也會(huì)出現(xiàn)類(lèi)似的情況。因此, 可能期望直接組合兩個(gè)編碼多聲道信號(hào)來(lái)檢査組合的收聽(tīng)印象。也就 是說(shuō),組合信號(hào)需要類(lèi)似兩個(gè)錄音師的所有音頻對(duì)象(源)。然而,根據(jù)現(xiàn)有技術(shù),這樣的組合僅通過(guò)對(duì)音頻信號(hào)(流)進(jìn)行 解碼才是可行的。因此,現(xiàn)有技術(shù)的多聲道編碼器可以再次對(duì)解碼的 音頻信號(hào)進(jìn)行重新編碼,以來(lái)產(chǎn)生恰當(dāng)?shù)卮硭性家纛l聲道或音 頻對(duì)象的組合信號(hào)。
這具有高計(jì)算復(fù)雜性的缺點(diǎn),因此,浪費(fèi)大量資源,并且有時(shí)(特 別是在實(shí)時(shí)情況下)甚至無(wú)法應(yīng)用該概念。此外,由于特定應(yīng)用(例 如,電話(huà)會(huì)議/電信)不能接受的兩個(gè)處理步驟,因此后續(xù)音頻編碼和 重新編碼的組合可以引起相當(dāng)大的延時(shí)。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種有效地組合多個(gè)參數(shù)編碼的音頻信號(hào) 的概念。
根據(jù)本發(fā)明的第一方面,這個(gè)目的通過(guò)一種用于產(chǎn)生音頻輸出信 號(hào)的音頻信號(hào)發(fā)生器來(lái)實(shí)現(xiàn),音頻信號(hào)發(fā)生器包括音頻信號(hào)接收機(jī), 用于接收第一音頻信號(hào)和第二音頻信號(hào),第一音頻信號(hào)包括具有關(guān)于 兩個(gè)或更多個(gè)第一原始聲道的信息的第一下混聲道,第一音頻信號(hào)還 包括與第一原始聲道中的一個(gè)相關(guān)聯(lián)的、描述第一原始聲道中的一個(gè) 相對(duì)于參考聲道的屬性的原始參數(shù),第二音頻信號(hào)包括具有關(guān)于至少 一個(gè)第二原始聲道的信息的第二下混聲道;聲道組合器,用于通過(guò)將 第一下混聲道和第二下混聲道進(jìn)行組合來(lái)導(dǎo)出組合下混聲道;參數(shù)計(jì) 算器,用于導(dǎo)出第一組合參數(shù)和第二組合參數(shù),第一組合參數(shù)描述第 一原始聲道中的一個(gè)相對(duì)于公共參考聲道的屬性,第二組合參數(shù)描述 第一原始聲道中的另一個(gè)或所述至少一個(gè)第二原始聲道相對(duì)于公共參 考聲道的屬性;以及輸出接口,用于輸出包括組合下混聲道、第一和 第二組合參數(shù)在內(nèi)的音頻輸出信號(hào)。
根據(jù)本發(fā)明的第二方面,這個(gè)目的通過(guò)一種產(chǎn)生音頻輸出信號(hào)的 方法來(lái)實(shí)現(xiàn),所述方法包括接收第一音頻信號(hào)和第二音頻信號(hào),第 一音頻信號(hào)包括具有關(guān)于兩個(gè)或更多個(gè)第一原始聲道的信息的第一下 混聲道,第一音頻信號(hào)還包括與第一原始聲道中的一個(gè)相關(guān)聯(lián)的、描 述第一原始聲道中的一個(gè)相對(duì)于參考聲道的屬性的原始參數(shù),第二音頻信號(hào)包括具有關(guān)于至少一個(gè)第二原始聲道的信息的第二下混聲道;
通過(guò)將第一下混聲道和第二下混聲道進(jìn)行組合來(lái)導(dǎo)出組合下混聲道; 導(dǎo)出第一組合參數(shù)和第二組合參數(shù),第一組合參數(shù)描述第一原始聲道 中的一個(gè)相對(duì)于公共參考聲道的屬性,第二組合參數(shù)描述第一原始聲 道中的另一個(gè)或至少一個(gè)第二原始聲道相對(duì)于公共參考聲道的屬性; 以及輸出包括組合下混聲道以及第一和第二組合參數(shù)在內(nèi)的音頻輸出 信號(hào)。
根據(jù)本發(fā)明的第三方面,這個(gè)通過(guò)三個(gè)或更多個(gè)音頻聲道的表示
來(lái)實(shí)現(xiàn),所述表示包括組合下混聲道,作為第一下混聲道和第二下
混聲道的組合,第一下混聲道具有關(guān)于至少兩個(gè)第一原始聲道的信息,
第二下頻聲道具有關(guān)于至少一個(gè)第二原始聲道的信息;第一參數(shù),描 述至少兩個(gè)第一原始聲道中的一個(gè)相對(duì)于參考聲道的屬性;以及第二
參數(shù),描述第一原始聲道中的另一聲道相對(duì)于參考聲道的屬性或至少 一個(gè)第二原始聲道相對(duì)于參考聲道的屬性。
根據(jù)本發(fā)明的第四方面,這個(gè)目的通過(guò)實(shí)現(xiàn)一種用于產(chǎn)生音頻輸 出信號(hào)的方法的計(jì)算機(jī)程序來(lái)實(shí)現(xiàn),所述方法包括接收第一音頻信 號(hào)和第二音頻信號(hào),第一音頻信號(hào)包括具有關(guān)于兩個(gè)或更多個(gè)第一原 始聲道的信息的第一下混聲道,并包括與第一原始聲道中的一個(gè)相關(guān) 聯(lián)的、描述第一原始聲道中的一個(gè)相對(duì)于參考聲道的屬性的原始參數(shù), 第二音頻信號(hào)包括具有關(guān)于至少一個(gè)第二原始聲道的信息的第二下混 聲道;通過(guò)將第一下混聲道和第二下混聲道進(jìn)行組合來(lái)導(dǎo)出組合下混 聲道;導(dǎo)出第一組合參數(shù)和第二組合參數(shù),第一組合參數(shù)描述第一原 始聲道中的一個(gè)相對(duì)于公共參考聲道的屬性,第二組合參數(shù)描述第一 原始聲道中的另一個(gè)或至少一個(gè)第二原始聲道相對(duì)于公共參考聲道的 屬性;以及輸出包括組合下混聲道以及第一和第二組合參數(shù)在內(nèi)的音 頻輸出信號(hào)。
根據(jù)本發(fā)明的第五方面,這個(gè)目的通過(guò)一種具有用于產(chǎn)生音頻輸 出信號(hào)的音頻信號(hào)發(fā)生器的會(huì)議系統(tǒng)來(lái)實(shí)現(xiàn),所述會(huì)議系統(tǒng)包括音 頻信號(hào)接收機(jī),用于接收第一音頻信號(hào)和第二音頻信號(hào),第一音頻信 號(hào)包括具有關(guān)于兩個(gè)或更多個(gè)第一原始聲道的信息的第一下混聲道,
12第一音頻信號(hào)還包括與第一原始聲道中的一個(gè)相關(guān)聯(lián)的、描述第一原 始聲道中的一個(gè)相對(duì)于參考聲道的屬性的原始參數(shù),第二音頻信號(hào)包 括具有關(guān)于至少一個(gè)第二原始聲道的信息的第二下混聲道;聲道組合 器,用于通過(guò)將第一下混聲道和第二下混聲道進(jìn)行組合來(lái)導(dǎo)出組合下 混聲道;參數(shù)計(jì)算器,用于導(dǎo)出第一組合參數(shù)和第二組合參數(shù),第一
組合參數(shù)描述第一原始聲道中的一個(gè)相對(duì)于公共參考聲道的屬性,第 二組合參數(shù)描述第一原始聲道中的另一個(gè)或至少一個(gè)第二原始聲道相
對(duì)于公共參考聲道的屬性;以及輸出接口,用于輸出包括組合下混聲 道、第一和第二組合參數(shù)在內(nèi)的音頻輸出信號(hào)。
本發(fā)明基于以下發(fā)現(xiàn)可以使用音頻信號(hào)發(fā)生器或音頻信號(hào)組合
器來(lái)有效地組合多個(gè)參數(shù)編碼的音頻信號(hào),所述音頻信號(hào)發(fā)生器或音 頻信號(hào)組合器通過(guò)在參數(shù)域內(nèi)直接將下混聲道與音頻輸入信號(hào)的相關(guān) 參數(shù)進(jìn)行組合來(lái)產(chǎn)生音頻輸出信號(hào),即,不用在產(chǎn)生音頻輸出信號(hào)之 前對(duì)單個(gè)音頻輸入信號(hào)進(jìn)行重構(gòu)或解碼。更具體地,這可以通過(guò)直接 混合各個(gè)輸入信號(hào)的關(guān)聯(lián)下混聲道來(lái)得以實(shí)現(xiàn),例如通過(guò)對(duì)各個(gè)輸入 信號(hào)的關(guān)聯(lián)下混聲道的線(xiàn)性組合的求和或形成來(lái)實(shí)現(xiàn)。本發(fā)明的關(guān)鍵
特征在于通過(guò)簡(jiǎn)單、計(jì)算量少的算術(shù)運(yùn)算(例如,求和)來(lái)實(shí)現(xiàn)下 混聲道的組合。
這同樣適用于與下混聲道相關(guān)聯(lián)的參數(shù)的組合。通常,在輸入音 頻信號(hào)的組合期間將至少必須改變關(guān)聯(lián)參數(shù)的子集,最重要的是,執(zhí) 行改變參數(shù)的計(jì)算是簡(jiǎn)單的,并且不需要大量的計(jì)算量也不會(huì)引起附 加的延時(shí),例如,通過(guò)使用涉及存儲(chǔ)器的濾波器組或其他運(yùn)算。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,實(shí)現(xiàn)一種用于產(chǎn)生音頻輸出信號(hào)的音 頻信號(hào)發(fā)生器,以將第一和第二音頻信號(hào)進(jìn)行組合,第一和第二音頻 信號(hào)均為參數(shù)編碼的。為了產(chǎn)生音頻輸出信號(hào),本發(fā)明的音頻信號(hào)發(fā) 生器提取輸入音頻信號(hào)的下混聲道,并通過(guò)形成兩個(gè)下混聲道的線(xiàn)性 組合來(lái)產(chǎn)生組合下混聲道。也就是將各個(gè)聲道與所應(yīng)用的附加權(quán)重相 加。
在本發(fā)明的優(yōu)選實(shí)施例中,所應(yīng)用的權(quán)重是通過(guò)非常簡(jiǎn)單的算術(shù) 運(yùn)算導(dǎo)出的,例如,通過(guò)使用由第一音頻信號(hào)和第二音頻信號(hào)表示的聲道的數(shù)目作為計(jì)算的基礎(chǔ)。
在另一優(yōu)選實(shí)施例中,在假設(shè)輸入信號(hào)的每一原始音頻聲道對(duì)于 具有相同量的總信號(hào)能量有所貢獻(xiàn)的前提下,執(zhí)行加權(quán)計(jì)算。也就是 說(shuō),所應(yīng)用的權(quán)重是輸入信號(hào)的聲道數(shù)目與聲道總數(shù)目的比。
在本發(fā)明的另一優(yōu)選實(shí)施例中,基于包含在下混聲道內(nèi)的能量來(lái) 計(jì)算各個(gè)下混聲道的權(quán)重,從而能夠更加可靠地再現(xiàn)所產(chǎn)生的輸出音 頻信號(hào)中所包括的組合下混聲道。
在本發(fā)明的另一優(yōu)選實(shí)施例中,由于僅改變與兩個(gè)音頻信號(hào)中的 一個(gè)相關(guān)聯(lián)的參數(shù),將進(jìn)一步降低計(jì)算量。也就是說(shuō),照舊發(fā)送另一 音頻信號(hào)的參數(shù),因此,不會(huì)引起任何計(jì)算并使本發(fā)明的音頻信號(hào)發(fā) 生器上的負(fù)載最小化。
在以下段落中,將針對(duì)使用聯(lián)合源編碼(JSC)的編碼方案來(lái)詳 細(xì)描述本發(fā)明的概念。在這種情況下,本發(fā)明將這項(xiàng)技術(shù)擴(kuò)展用于通 過(guò)在參數(shù)域內(nèi)混合JSC下混信號(hào)和對(duì)象信息來(lái)將多個(gè)單聲道或支持
JSC的收發(fā)機(jī)連接至遠(yuǎn)程站。如上所述,本發(fā)明的概念不局限于使用 JSC編碼,并且還可以通過(guò)BCC編碼或其他多聲道編碼方案(例如, MPEG空間音頻編碼(MPEG環(huán)繞)等)得以實(shí)現(xiàn)。
由于本發(fā)明的概念主要將通過(guò)使用JSC編碼來(lái)詳細(xì)描述,因此在 以下段落中將簡(jiǎn)要地回顧JSC編碼,以便在將本發(fā)明的概念應(yīng)用至現(xiàn) 有的多聲道音頻編碼方案時(shí),更清晰地指出本發(fā)明概念的靈活性以及 和相對(duì)于現(xiàn)有技術(shù)的提高。


圖1示出了JSC編碼方案的示例; 圖2示出了JSC呈現(xiàn)器的示例; 圖3示出了具有兩個(gè)位置的電話(huà)會(huì)議情況; 圖4示出了具有三個(gè)位置的電話(huà)會(huì)議情況;
圖5示出了使用本發(fā)明的音頻信號(hào)發(fā)生器的電話(huà)會(huì)議的示例; 圖6示出了使用本發(fā)明的音頻信號(hào)發(fā)生器的電話(huà)會(huì)議的另一示
例;
14圖6b示出了本發(fā)明的概念的反向兼容性;以及 圖7示出了本發(fā)明的音頻信號(hào)發(fā)生器的示例。
具體實(shí)施例方式
下面將參照?qǐng)D1和2對(duì)JSC編碼進(jìn)行解釋。在附圖中,功能相同的
組件共享相同的附圖標(biāo)記,這表明在不喪失或限制功能并且不限制 本發(fā)明的范圍的前提下,可以在本發(fā)明的單個(gè)實(shí)施例之間互換提供相 同功能的各個(gè)組件。
圖l示出了聯(lián)合源編碼方案的方框圖、相應(yīng)的編碼器2和相應(yīng)解碼器4。
編碼器2接收離散音頻輸入Si(n)6a、 6b和6c,并且例如通過(guò)波形疊 加創(chuàng)建下混信號(hào)s(n)8。
此外,編碼器2內(nèi)的參數(shù)提取器10提取每一單個(gè)對(duì)象(信號(hào)6a、 6b和6c)的參數(shù)輔助信息。盡管未在圖l中示出,下混信號(hào)8還可以通 過(guò)語(yǔ)音或音頻編碼器進(jìn)行壓縮,并同相鄰參數(shù)輔助信息一起被發(fā)送至 JSC解碼器4。解碼器4內(nèi)的合成模塊12重新產(chǎn)生輸入對(duì)象(聲道6a、 6b和6c)的估計(jì)14a、 14b和14c (&( ))。
為了重構(gòu)感知上類(lèi)似于離散輸入對(duì)象(輸入聲道)6a、 6b和6c的 估計(jì)14a、 14b和14c,必須提取每一聲道的適合的參數(shù)輔助信息。由于 為了產(chǎn)生下混信號(hào)8而各個(gè)聲道進(jìn)行,因而聲道之間的功率比是適合的 量。因此,不同對(duì)象或聲道的參數(shù)信息由每一對(duì)象相對(duì)于第一對(duì)象(參 考對(duì)象)的功率比Ap組成。
該信息是以與人類(lèi)聽(tīng)覺(jué)感知的臨界頻帶分辨率相對(duì)應(yīng)的非等間 距頻帶(子帶)在頻域中導(dǎo)出的。這是例如在J.Blauert的"Spatial Hearing: The Psychophysics of Human Sound Localization", The MIT Press, Cambridge, MA, revised edition 1997中更詳細(xì)描述的概念。
也就是說(shuō),將寬帶輸入音頻信號(hào)濾波成帶寬有限的若干頻帶,并 且針對(duì)各個(gè)頻帶中的每一個(gè)執(zhí)行以下計(jì)算。如上所述,第一對(duì)象(參 考對(duì)象或參考聲道)的分段頻帶功率作為參考值。△a(") = 1010g,o^2,, ,' = 2...M 方程l
為了避免人工產(chǎn)物的引入(例如通過(guò)除零而引入的人工產(chǎn)物), 還可以將這些功率比限制在例如每一子帶24dB的最大值。此外,可以 在提交之前對(duì)功率比進(jìn)行進(jìn)一步量化,以另外節(jié)省傳輸帶寬。
沒(méi)有必要顯式地發(fā)送第一對(duì)象的功率。取而代之,可以根據(jù)以下 假設(shè)導(dǎo)出該值對(duì)于統(tǒng)計(jì)上獨(dú)立的對(duì)象,合成信號(hào);,(W)的功率之和等
于下混信號(hào)^0的功率。在數(shù)學(xué)表達(dá)式方面,這表示為-
E(/(")卜Ze(《("" 方程2
基于該假設(shè)和方程,可以重構(gòu)第一對(duì)象(參考對(duì)象或參考聲道) 的子帶功率,這在下面詳述本發(fā)明概念時(shí)將進(jìn)一步予以描述。
總之,根據(jù)JSC的音頻信號(hào)或音頻流包括下混聲道和關(guān)聯(lián)參數(shù),
該參數(shù)描述原始聲道相對(duì)于一個(gè)原始參考聲道的功率比。應(yīng)當(dāng)注意的 是,由于選擇其他聲道作為參考聲道,因此可以容易地改變這種情況。 例如,下混聲道本身可以是參考聲道,需要發(fā)送一個(gè)附加參數(shù),將第 一、前一個(gè)參考聲道的功率與下混聲道的功率相關(guān)。同樣,由于可以 選擇具有最大功率的一個(gè)聲道作為參考聲道,因此可以改變所選的參 考聲道。因此,各個(gè)聲道內(nèi)的功率可以隨著時(shí)間改變,參考聲道也可 以隨著時(shí)間改變。同樣,由于通常以頻率選擇方式執(zhí)行所有處理的事 實(shí),參考聲道對(duì)于不同頻帶可以不同。
圖2示出了基于圖1的方案的JSC編碼的另一增強(qiáng)方案。存儲(chǔ)或發(fā) 送框20包括了關(guān)于圖1的詳細(xì)特征,存儲(chǔ)或發(fā)送框20接收要被編碼的輸 入聲道6,并輸出輸入聲道6的估計(jì)14。由于圖2的方案還包括用于接收 估計(jì)的混合器22,因而增強(qiáng)了圖2的方案。也就是說(shuō),合成的對(duì)象14 并不作為單個(gè)音頻信號(hào)而直接輸出,而是在混合器模塊中被呈現(xiàn)給N 個(gè)輸出聲道??梢砸圆煌姆绞絹?lái)實(shí)現(xiàn)這樣的混合器,例如,接收附 加的混合參數(shù)24作為輸入來(lái)操縱對(duì)于合成對(duì)象14的混合。僅作為示例, 可以考慮電話(huà)會(huì)議的情況,其中,輸出聲道26中的每一個(gè)屬于會(huì)議的 一個(gè)參與者。因此,接收端處的參與者實(shí)質(zhì)上能夠通過(guò)將他們的語(yǔ)音分配到各個(gè)位置來(lái)隔開(kāi)其他參與者。因此,不僅語(yǔ)音可以作為準(zhǔn)則來(lái) 區(qū)分電話(huà)會(huì)議的不同參與者,而且收聽(tīng)者可以根據(jù)方向接收參與者的 語(yǔ)音。此外,收聽(tīng)者可以布置輸出聲道,從而將來(lái)自相同電話(huà)會(huì)議位 置的所有參與者聚集在同一方向,更加增強(qiáng)感知的體驗(yàn)。
如圖2所示,^")..&(^表示^(:編碼器的輸入處的離散音頻對(duì)象。
在JSC解碼器的輸出處,1 |(>0..4(>7)表示被饋送進(jìn)混合器的'實(shí)質(zhì)上'
隔開(kāi)的音頻對(duì)象。可以在接收機(jī)側(cè)處對(duì)混合參數(shù)24進(jìn)行交互修改,以 在輸出聲道^^...^^)所再現(xiàn)的聲音舞臺(tái)中放置不同的對(duì)象。
圖3示出了多聲道音頻編碼方案在基本電話(huà)會(huì)議場(chǎng)景中的應(yīng)用, 這是在兩個(gè)位置之間發(fā)生的。這里,第一位置40與第二位置42進(jìn)行通 信。第一位置可以具有A參與者,即音頻對(duì)象,第二位置具有B參與者 或音頻對(duì)象。對(duì)于點(diǎn)對(duì)點(diǎn)的電話(huà)會(huì)議,可以直接應(yīng)用所描述的JSC編 碼技術(shù)來(lái)在每一位置處向相應(yīng)的遠(yuǎn)程站發(fā)送多個(gè)對(duì)象的音頻信號(hào)。也 就是說(shuō),將(A-l)參數(shù)ai和關(guān)聯(lián)下混傳遞至位置42。在相反方向,將 (B-l)參數(shù)b,與關(guān)聯(lián)下混一同發(fā)送至位置40。
如圖4所示,對(duì)于與多于兩個(gè)終端的電話(huà)會(huì)議,情況完全不同。 圖4示出了位置40和42以外的第三位置44。在圖4中可以看到,這 樣的情況需要針對(duì)關(guān)聯(lián)音頻信號(hào)的中央分配器(通常被稱(chēng)作多點(diǎn)控制 單元MCU)。位置(站點(diǎn))40、 42和44中的每一個(gè)連接至MCU46。對(duì) 于每一站點(diǎn)40、 42、 44,存在到包含來(lái)自站點(diǎn)的信號(hào)的MCU的單個(gè)上 游。由于每一單個(gè)站點(diǎn)需要從剩余站點(diǎn)接收信號(hào),除了站點(diǎn)自身的信 號(hào)以外,每一站點(diǎn)40、 42和44的下游是其他站點(diǎn)的信號(hào)的混合(也被 稱(chēng)作(N-l)信號(hào))。通常,為了滿(mǎn)足建立的需要并保持適當(dāng)?shù)偷膫鬏?帶寬,從MCU到每一站點(diǎn)發(fā)送N-1個(gè)JSC編碼流不可行。當(dāng)然,這是直 接的操作。
導(dǎo)出單個(gè)下游的現(xiàn)有技術(shù)方法是使用JSC解碼器在MCU 46內(nèi)再 合成所有輸入的流(對(duì)象)。然后,對(duì)再合成的音頻對(duì)象進(jìn)行重新分組 和重新編碼,以向每一站點(diǎn)提供包括期望音頻對(duì)象或音頻聲道在內(nèi)的 音頻流。即使在這種簡(jiǎn)單的情況下,這意味著在MCU 46中必須同時(shí) 執(zhí)行的三次解碼和三次編碼的任務(wù)。除了大量的計(jì)算需要,通過(guò)該參數(shù)"前后編碼"(重復(fù)編碼/解碼)處理還可以另外預(yù)期可聽(tīng)的人工產(chǎn) 物。增加站點(diǎn)的數(shù)目將進(jìn)一步增加流的數(shù)目,并增加所需的編碼或解 碼過(guò)程的次數(shù),使直接方法對(duì)于實(shí)施情況不可行。
因此,根據(jù)本發(fā)明,針對(duì)這樣的MCU類(lèi)型的情況,開(kāi)發(fā)了在下混 和對(duì)象參數(shù)域內(nèi)直接混合不同參數(shù)編碼流(在本特定示例中使JSC流) 的方案,創(chuàng)建具有最小計(jì)算量和質(zhì)量損失的期望輸出信號(hào)(輸出音頻 流)。
在以下段落中,針對(duì)JSC編碼音頻流,詳述在參數(shù)域內(nèi)直接混合 多聲道參數(shù)編碼音頻流的本發(fā)明概念。
本發(fā)明概念是通過(guò)將兩個(gè)原始音頻信號(hào)(流)組合成一個(gè)輸出信 號(hào)來(lái)解釋的。從組合兩個(gè)流的情況可以容易地導(dǎo)出將三個(gè)或更多個(gè)流 結(jié)合在一起。以下通過(guò)圖5對(duì)數(shù)學(xué)條件進(jìn)行描述,圖5示出了站點(diǎn)A的 三個(gè)音頻聲道必須與站點(diǎn)B的四個(gè)音頻聲道進(jìn)行組合的情況。也就是 說(shuō),當(dāng)然僅一個(gè)示例就可以設(shè)想本發(fā)明的概念。當(dāng)使用JSC編碼時(shí), 具有產(chǎn)生信號(hào)SAx的三個(gè)會(huì)議參與者(講話(huà)者)52a至52c的站點(diǎn)50 (A) 發(fā)送音頻流或音頻信號(hào)54。音頻信號(hào)54具有下混聲道Sa以及參數(shù)a2 和&,使聲道52b和52c的功率與聲道52a的功率相關(guān)。同樣,站點(diǎn)56(B)
發(fā)送具有下混聲道SB和三個(gè)參數(shù)b2、 b3和b4的音頻信號(hào),下混聲道Sb和
三個(gè)參數(shù)b2、 b3、和b4是四個(gè)講話(huà)者60a至60d的JSC編碼表示。MCU 46 將音頻信號(hào)54和58進(jìn)行組合,以導(dǎo)出具有組合下混聲道SY和六個(gè)參數(shù) y2、…、y 的輸出信號(hào)62。
在接收側(cè),接收機(jī)64對(duì)輸出信號(hào)62進(jìn)行解碼,以導(dǎo)出七個(gè)音頻對(duì) 象或站點(diǎn)50和56的音頻聲道的表示。
一般地,目標(biāo)是形成兩個(gè)JSC流54和58的單一組合表示62,通過(guò)
一個(gè)公共下混信號(hào)SY和表征對(duì)象的一組對(duì)象參數(shù)來(lái)表示多個(gè)對(duì)象。理
想情況下,組合的JSC表示應(yīng)當(dāng)與通過(guò)將基于兩個(gè)JSC流的原始源信號(hào) 的完整集合在一個(gè)步驟中編碼成單個(gè)JSC流而獲得的表示相同。
為了使以下的方程簡(jiǎn)單化,假設(shè)從方程l獲得的相對(duì)功率比在對(duì) 數(shù)域中不可用,而僅作為功率比??梢詮囊韵路匠虒?dǎo)出特定對(duì)象i的每 一對(duì)象參數(shù),,(《)。E{《(")}
方程3
然后,將對(duì)數(shù)域的變換應(yīng)用于每一參數(shù),以便實(shí)現(xiàn)使用對(duì)數(shù)冪刻 度的量化。
以下假設(shè)將所有信號(hào)分解成子帶表示,分別對(duì)每一子帶應(yīng)用一次 計(jì)算。
流A具有其下混信號(hào)^和對(duì)象U的參數(shù)^.^ (相對(duì)功率比)。流B 包括下混信號(hào)^和對(duì)象V的參數(shù)Zv.i^
可以形成組合下混信號(hào)^作為兩個(gè)下混信號(hào)^和^的線(xiàn)性組合。 為了確保不同對(duì)象貢獻(xiàn)的正確音量級(jí),可以應(yīng)用增益系數(shù)^和&。
如果已經(jīng)對(duì)相等平均功率的單個(gè)聲音源求和并歸一化為下混路 徑的滿(mǎn)量程,則這種縮放是有意義的。
備選地,可以針對(duì)增益系數(shù)使用功率保留方法。
其他可能是選擇增益系數(shù),從而使兩個(gè)下混信號(hào)對(duì)組合的下混貢 獻(xiàn)相同的平均功率,即通過(guò)以下方程來(lái)選擇
組合流&的對(duì)象參數(shù);K,應(yīng)當(dāng)表示所有U+V對(duì)象。
由于與下混聲道相關(guān)的參數(shù)是相對(duì)功率比,因此可以照舊使用參
數(shù)a2,…,au (未改變),并且將對(duì)象B的參數(shù)拼接至參數(shù)a2,…,au。 一旦選 擇信號(hào)A的第一對(duì)象作為參考對(duì)象或參考聲道,則必須將原始參數(shù)bi 變換為與參考聲道相關(guān)。應(yīng)當(dāng)注意的是,僅必須重新計(jì)算一個(gè)流的參 數(shù),這進(jìn)一步降低了MCU46中的計(jì)算負(fù)載。
還應(yīng)當(dāng)注意的是,沒(méi)有必要使用原始音頻流之一的參考聲道作為 新參考聲道。利用選自站點(diǎn)A或B的原始聲道的其他參考聲道也可以很
其中,
19好地實(shí)現(xiàn)在參數(shù)域內(nèi)組合參數(shù)編碼音頻流的本發(fā)明的概念。還可以使 用組合下混聲道作為新的參考聲道。
以下是使用站點(diǎn)A的原始參考聲道(組合參考聲道)作為新參考 聲道的方法,首先必須計(jì)算每一信號(hào)A和B的第一對(duì)象(聲道)的能量 (功率),這是由于這些僅隱式地可用。
假設(shè)統(tǒng)計(jì)上獨(dú)立的源,下混信號(hào)A的功率保持給出了以下方程
的:
e{ } = 5>{《(")}
信號(hào)功率E&0^.』^^"是利用其相對(duì)功率^.^和E^O^定義
E化2(")卜a2-E(^(《 EK(")}= "3
E{《(")}=%.E{《(")} 這使^的功率為
E化(")}=— t 1 J (1 +a2 + fl3 +…十
對(duì)下混信號(hào)&應(yīng)用同樣的運(yùn)算,可以計(jì)算對(duì)象&的功率為
現(xiàn)在可以為信號(hào)^的所有對(duì)象構(gòu)建新的參數(shù)集合 ;V (未發(fā)送、參考對(duì)象、隱式可用)
少2,
少3 =a3
j E{4,(")} I-g〗E{<(")}
(信號(hào)B的第一對(duì)象相對(duì)于參考對(duì)象Al的功率比)<formula>formula see original document page 21</formula>
(重新歸一化的信號(hào)B的第二對(duì)象與參考對(duì)象A1的功率的功率
比)
<formula>formula see original document page 21</formula>
如先前段落所示,本發(fā)明的概念使得僅僅使用簡(jiǎn)單的算術(shù)運(yùn)算就 能夠產(chǎn)生組合音頻流,因此在計(jì)算上非常有效。因此,可以實(shí)時(shí)地執(zhí) 行對(duì)多個(gè)參數(shù)編碼的音頻流的組合。
為了進(jìn)一步強(qiáng)調(diào)本發(fā)明概念的極大靈活性,圖6示出了如何有創(chuàng) 造性地將站點(diǎn)56處的單個(gè)講話(huà)者所產(chǎn)生的單聲道信號(hào)70與站點(diǎn)50處的 講話(huà)者的兩個(gè)或更多個(gè)JSC編碼信號(hào)進(jìn)行組合。也就是說(shuō),由于本發(fā) 明的概念的靈活性,可以創(chuàng)造性地將任意電話(huà)會(huì)議系統(tǒng)的單聲道信號(hào) 與參數(shù)編碼多聲道(多對(duì)象)源進(jìn)行組合,以產(chǎn)生表示所有原始音頻 聲道(對(duì)象)的JSC編碼音頻信號(hào)。
可延伸的兼容性還具有無(wú)法發(fā)送JSC對(duì)象而只能發(fā)送傳統(tǒng)單聲道 信號(hào)的遠(yuǎn)程站,該技術(shù)還可應(yīng)用于將來(lái)自例如傳統(tǒng)會(huì)議設(shè)備的單聲道 對(duì)象插入基于對(duì)象的流中。
上述具有JSC流A (下混A,參數(shù)"2...^)和單聲道對(duì)象C (下混^)
的示例產(chǎn)生具有下混信號(hào)的組合信號(hào)Z & = & & + & &
增益系數(shù)如前所述,其對(duì)象參數(shù)如下-乂未發(fā)送(參考對(duì)象、隱式可用)^ E飼
』—Z.iR^T}
(信號(hào)C相對(duì)于參考對(duì)象A1的功率比)
譯碼/合并兩個(gè)JSC流的上述示例取決于方程l中給出的對(duì)象功率
的表示。盡管如此,本發(fā)明的方法同樣還可以應(yīng)用于其他表示該信息 的方式。
圖6b同樣強(qiáng)調(diào)合并一個(gè)單聲道音頻源的本發(fā)明概念的極大靈活 性。圖6b是基于圖4的多聲道情況,并且還示出了如何使用本發(fā)明的 MCU 46輕易地將音頻源C(44)處的現(xiàn)有技術(shù)單聲道音頻編碼器集成到 多聲道音頻會(huì)議中。
如前所述,本發(fā)明的概念不局限于具有預(yù)定固定參考聲道的JSC 編碼。因此,在備選示例中,可以計(jì)算相對(duì)于隨時(shí)間變化的參考聲道 的功率比,參考聲道是在給出的預(yù)定時(shí)間間隔內(nèi)具有最大能量的一個(gè) 聲道。代替將分段頻帶信號(hào)功率值歸一化至固定參考聲道(對(duì)象)的 相應(yīng)頻帶的功率、并將結(jié)果變換至如方程l所概述的對(duì)數(shù)(dB)域,
可以在特定頻帶中相對(duì)于所有對(duì)象的最大功率進(jìn)行歸一化
E|y2(")} 七w >i
=-^~^ , / = 1…Af 乃不王4
由于這些歸一化的功率值本身具有o和i之間的值,這些歸一化的 功率值(以線(xiàn)性表示給出)不需要再受限于特定的上限。這一優(yōu)點(diǎn)必 然伴隨著必須發(fā)送不再是先驗(yàn)的已知參考聲道的一個(gè)附加參數(shù)的缺 點(diǎn)。
這種情況的混合處理將包括以下步驟(同樣必須針對(duì)每一子帶分
別執(zhí)行)
使得流A具有下混信號(hào)&和對(duì)象U的參數(shù)a,..^ (歸一化功率值,
方程3、方程l)。
流B由下混信號(hào)4和對(duì)象V的參數(shù)^.iv組成。
可以根據(jù)已經(jīng)示出的選項(xiàng)之一來(lái)形成組合下混信號(hào)
& = g^T ^ + gs ' &
必須關(guān)于具有信號(hào)Y的所有對(duì)象的最高功率的對(duì)象來(lái)設(shè)置組合表示y,的所有歸一化功率值。對(duì)于Y的該"最大對(duì)象"存在兩個(gè)候選,A
的最大對(duì)象或B的最大對(duì)象,二者均可以由歸一化功率比"1"標(biāo)識(shí)。
這一判定可以通過(guò)比較兩個(gè)候選的絕對(duì)功率來(lái)進(jìn)行。此外,可以
使用下混信號(hào)的功率的關(guān)系式(方程2)來(lái)獲得 K寺,和K"》^1
現(xiàn)在可以將加權(quán)的最大對(duì)象功率與下混處理的增益系數(shù)進(jìn)行比

g〗 《(")}>"{《(")}
不管對(duì)象的功率是否更高,該對(duì)象將用作組合參數(shù)的少,"最大對(duì)象"。
作為示例,使^成為兩個(gè)信號(hào)A和B的總最大功率對(duì)象,然后所
有其他參數(shù)可以組合為
少2 = 02
少U
"E{《max(")}
AM — A 2.r("2 /、、
& E{((")}
(信號(hào)B的第一對(duì)象相對(duì)于"最大對(duì)象"(這里為A)的功率比)
》."2_、 gE^m"")}
2 g〗E[〗瞎(""
對(duì)于本示例,由于信號(hào)A攜帶總的最大對(duì)象,A的對(duì)象的所有參 數(shù)保持不變。
同樣在該表示中,相應(yīng)地可以進(jìn)行單聲道對(duì)象的插入,例如通過(guò) 假設(shè)V-1。
通常,如果己經(jīng)將兩個(gè)流的所有原始對(duì)象編碼進(jìn)第一地點(diǎn)的單個(gè)JSC流,則執(zhí)行譯碼處理,使得其結(jié)果接近已經(jīng)實(shí)現(xiàn)的結(jié)果。
圖7示出了用于產(chǎn)生音頻輸出信號(hào)的本發(fā)明的音頻信號(hào)發(fā)生器的
示例,其可以在MCU46內(nèi)使用,以實(shí)現(xiàn)本發(fā)明的概念。
音頻信號(hào)產(chǎn)生器100包括音頻信號(hào)接收機(jī)102 、聲道組合器104、 參數(shù)計(jì)算器106和輸出接口108。
音頻信號(hào)接收機(jī)102接收包括第一下混聲道110a的第一音頻信號(hào) 110,第一下混聲道110a具有有關(guān)兩個(gè)或更多個(gè)第一原始聲道的信息, 并包括與原始第一聲道中的一個(gè)相關(guān)聯(lián)的、描述原始第一聲道中的一 個(gè)相對(duì)于參考聲道的屬性的原始參數(shù)110b。音頻信號(hào)接收機(jī)102還接收 包括第二下混聲道112a的第二音頻信號(hào)112,第二下混聲道112a具有關(guān) 于至少一個(gè)第二原始聲道的信息。
音頻信號(hào)接收機(jī)將第一下混聲道110a和第二下混聲道112a輸出至 聲道組合器104的輸入,并且將第一下混聲道110a、第二下混聲道112a 和原始參數(shù)110b輸出至參數(shù)計(jì)算器106。
聲道組合器104通過(guò)將第一下混聲道110a和第二下混聲道112b進(jìn) 行組合來(lái)導(dǎo)出組合下混聲道114, g卩,在無(wú)需重構(gòu)基本原始音頻聲道的 情況下直接組合下混聲道。
參數(shù)計(jì)算器106導(dǎo)出第一組合參數(shù)116a和第二組合參數(shù)116b,第一 組合參數(shù)116a描述第一原始聲道中的一個(gè)相對(duì)于公共參考聲道的屬 性,第二組合參數(shù)116b描述第一原始聲道中的另一個(gè)或至少一個(gè)第二 原始聲道相對(duì)于相同公共參考聲道的屬性。將第一和第二組合參數(shù)輸 入至輸出接口108,輸出接口108還從聲道組合器104接收組合下混聲道 114。最后,輸出接口輸出包括組合下混聲道114以及第一和第二組合 參數(shù)116a和116b在內(nèi)的輸出信號(hào)120。
因此,在無(wú)需全部重構(gòu)輸入音頻信號(hào)、并且無(wú)需大量計(jì)算運(yùn)算的 情況下,已經(jīng)導(dǎo)出音頻輸出信號(hào)。
在上述段落中,已經(jīng)示出了混合各自基于JSC參數(shù)方法的兩個(gè)或 更多個(gè)信號(hào)的總體概念。具體地,上述方程示出了如何將該技術(shù)應(yīng)用 于由相對(duì)功率比組成的參數(shù)信息的情況。然而,該技術(shù)不局限于對(duì)象 參數(shù)的特定表示。因此,也可以使用描述各個(gè)音頻聲道的幅度測(cè)量或
24其他屬性(例如,相關(guān))的參數(shù)。以發(fā)送一個(gè)附加參數(shù)為代價(jià),還可 以計(jì)算相對(duì)于組合下混聲道的功率比。相反,由于不使用參考聲道的 功率(沒(méi)有以"普通"JSC方式顯式地進(jìn)行發(fā)送)的重構(gòu),該備選情 況的優(yōu)點(diǎn)是在音頻流混合期間降低了計(jì)算復(fù)雜性。
此外,本發(fā)明不局限于電話(huà)會(huì)議情況,并且可應(yīng)用于期望將參數(shù)
對(duì)象復(fù)用成單個(gè)流的任何情況。這可以例如是BCC編碼方案、MPEG
空間環(huán)繞以及其他的情況。
;如上所述,本發(fā)明的概念甚至能夠無(wú)縫地包括將單個(gè)單聲道信號(hào) 提供到基于對(duì)象的情況中的傳統(tǒng)遠(yuǎn)程站。除了組合不同的對(duì)象流,本 發(fā)明的概念還示出了如何產(chǎn)生表示參數(shù)數(shù)據(jù)的不同方式,從而適于實(shí) 現(xiàn)計(jì)算效率高的組合處理。同樣,本發(fā)明的參數(shù)比特流語(yǔ)法的有益特
征是以通過(guò)僅執(zhí)行簡(jiǎn)單的運(yùn)算來(lái)組合兩個(gè)流的方式表示對(duì)象屬性。
因此,本發(fā)明的概念還教導(dǎo)了如何通過(guò)所附的以下準(zhǔn)則為參數(shù)編
碼的多個(gè)原始音頻信號(hào)(音頻對(duì)象)創(chuàng)建適合的比特流或比特流格式 簡(jiǎn)單地從部分下混信號(hào)中形成組合的下混信號(hào)
通過(guò)組合各個(gè)參數(shù)輔助信號(hào)來(lái)形成組合的參數(shù)輔助信息以及 簡(jiǎn)單地計(jì)算下混信號(hào)的特征(例如,能量)
不必執(zhí)行針對(duì)音頻對(duì)象的諸如解碼/重新編碼步驟之類(lèi)的復(fù)雜 操作。
因此,必須選擇描述對(duì)象的參數(shù)表示,以便可以?xún)H使用可用的比 特流字段作為參數(shù)輔助信息的一部分來(lái)進(jìn)行兩個(gè)或更多個(gè)對(duì)象流的組 合("加法"),并且可以簡(jiǎn)單地計(jì)算下混信號(hào)的度量(例如,能量,峰 值)。
這種表示的示例應(yīng)當(dāng)是針對(duì)每一對(duì)象使用歸一化功率值(方程
4)。這些表示可能被變換為對(duì)數(shù)表示(dB),然后被量化為特定數(shù)目 的量化階或其各自的量化器索引。比特流語(yǔ)法應(yīng)當(dāng)能夠?qū)崿F(xiàn)簡(jiǎn)單地增 加(或減小)(例如,通過(guò)簡(jiǎn)單地拼接、插入或移除參數(shù))流中的對(duì)象 參數(shù)的數(shù)目。
總之,本發(fā)明的概念能夠?qū)崿F(xiàn)參數(shù)編碼音頻流的最靈活的、且計(jì) 算效率高的組合。由于高的計(jì)算效率,本發(fā)明的概念不局限于要被組合的最大數(shù)目。原則上,可以將能夠被實(shí)時(shí)組合的任意數(shù)目的聲道提 供給本發(fā)明的音頻信號(hào)發(fā)生器。同樣,用于例證本發(fā)明概念的精確參 數(shù)表示OSC)并非強(qiáng)制的。此外,如前所述,其他參數(shù)編碼方案(例 如公知的環(huán)繞方案)可以是應(yīng)用和本發(fā)明的概念的基礎(chǔ)。
此外,不必以軟件形式實(shí)施必要的計(jì)算。還可以使用例如DSP、
ASIC和其他集成電路的硬件實(shí)現(xiàn)來(lái)執(zhí)行計(jì)算,這將進(jìn)一步增大本發(fā)明
的概念的速度,從而實(shí)現(xiàn)本發(fā)明的概念在實(shí)時(shí)情況下的應(yīng)用。
由于本發(fā)明的概念的靈活性,本發(fā)明的音頻流可以基于不同參數(shù) 表示。要被發(fā)送的參數(shù)例如還可以是幅度測(cè)量、原始音頻聲道之間的 時(shí)間差、相干性測(cè)量等。
因此,已經(jīng)示出了混合各自基于JSC類(lèi)型的參數(shù)方法的兩個(gè)或更
多個(gè)信號(hào)的總體概念。
上述方程示出了如何將該技術(shù)應(yīng)用于由相對(duì)功率比組成的參數(shù) 信息的情況。然而,該技術(shù)不局限于對(duì)象參數(shù)的特定表示。
此外,本發(fā)明不局限于電話(huà)會(huì)議情況,而是可以應(yīng)用于有利于將
參數(shù)對(duì)象復(fù)用成單個(gè)JSC流的任何情況。
此外,該技術(shù)能夠無(wú)縫地包括在基于對(duì)象的情況中提供單個(gè)信號(hào) 的傳統(tǒng)遠(yuǎn)程站。
除了組合不同對(duì)象流的實(shí)際處理,本發(fā)明還示出了表示參數(shù)的不 同方法如何適于實(shí)現(xiàn)該組合處理。由于并非所有可能的參數(shù)都表示允 許在對(duì)象的不完全解碼/重新編碼的情況下的所述組合處理,參數(shù)比特
流語(yǔ)法的有利特性是通過(guò)僅執(zhí)行簡(jiǎn)單運(yùn)算來(lái)組合兩個(gè)流的方式來(lái)表
示對(duì)象屬性。
根據(jù)本發(fā)明的方法的特定實(shí)現(xiàn)需求,本發(fā)明的方法可以以硬件或 軟件來(lái)實(shí)現(xiàn)??梢允褂脭?shù)字存儲(chǔ)介質(zhì)來(lái)執(zhí)行本發(fā)明,特別是在其上存
儲(chǔ)了電可讀控制信號(hào)的磁盤(pán)、DVD或CD,該電可讀控制信號(hào)與可編 程計(jì)算機(jī)系統(tǒng)協(xié)作以執(zhí)行本發(fā)明的方法。通常,本發(fā)明是具有存儲(chǔ)在 機(jī)器可讀載體上的程序代碼的計(jì)算機(jī)程序產(chǎn)品,當(dāng)計(jì)算機(jī)程序產(chǎn)品在 計(jì)算機(jī)上運(yùn)行時(shí),程序代碼可操作用于執(zhí)行本發(fā)明的方法。換言之, 本發(fā)明的方法是具有程序代碼的計(jì)算機(jī)程序,該程序代碼用于當(dāng)計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行至少一項(xiàng)本發(fā)明的方法。
盡管已經(jīng)參照具體實(shí)施例部分地示出并描述了上述,然而本領(lǐng)域 的技術(shù)人員將理解的是,在不背離本發(fā)明的精神和范圍的情況下,可 以進(jìn)行形式和細(xì)節(jié)上的各種其他改變。應(yīng)當(dāng)理解的是,在不背離這里 所公開(kāi)的、以及以下權(quán)利要求所包括的更寬概念的情況下,可以進(jìn)行 適于不同實(shí)施例的各種改變。
權(quán)利要求
1、一種用于產(chǎn)生音頻輸出信號(hào)的音頻信號(hào)發(fā)生器(100),包括音頻信號(hào)接收機(jī)(102),用于接收第一音頻信號(hào)(110),第一音頻信號(hào)(110)包括第一下混聲道(110a),所述第一下混聲道(110a)具有關(guān)于兩個(gè)或更多個(gè)第一原始聲道的信息,第一音頻信號(hào)(110)還包括與第一原始聲道中的一個(gè)相關(guān)聯(lián)的、描述第一原始聲道中的一個(gè)相對(duì)于參考聲道的屬性的原始參數(shù)(110b);以及第二音頻信號(hào)(112),第二音頻信號(hào)(112)包括具有關(guān)于至少一個(gè)第二原始聲道的信息的第二下混聲道(112a);聲道組合器(104),用于通過(guò)將第一下混聲道(110a)和第二下混聲道(112a)進(jìn)行組合來(lái)導(dǎo)出組合下混聲道(114);參數(shù)計(jì)算器(106),用于導(dǎo)出第一組合參數(shù)(116a)和第二組合參數(shù)(116b),第一組合參數(shù)(116a)描述第一原始聲道中的一個(gè)相對(duì)于公共參考聲道的屬性,第二組合參數(shù)(116b)描述第一原始聲道中的另一個(gè)或所述至少一個(gè)第二原始聲道相對(duì)于公共參考聲道的屬性;以及輸出接口,用于輸出包括組合下混聲道(114)、第一組合參數(shù)(116a)和第二組合參數(shù)(116b)在內(nèi)的音頻輸出信號(hào)(120)。
2、 根據(jù)權(quán)利要求l的音頻信號(hào)發(fā)生器(100),其中,聲道組合器 (104)可操作用于使用第一下混聲道(110a)與第二下混聲道(110b)的線(xiàn)性組合來(lái)導(dǎo)出所述組合下混聲道(114)。
3、 根據(jù)權(quán)利要求2的音頻信號(hào)發(fā)生器(100),其中,聲道組合器 (104)可操作用于使用線(xiàn)性組合,所述線(xiàn)性組合具有取決于第一下混聲道(110a)內(nèi)的能量E(sJ(n))和第二下混聲道(112a)內(nèi)的能量E(Sb2(11)) 的系數(shù)。
4、 根據(jù)權(quán)利要求3的音頻信號(hào)發(fā)生器(100),其中,聲道組合器 U04)可操作用于使用具有第一下混聲道的系數(shù)gA和第二下混聲道的系數(shù)gB的線(xiàn)性組合,所述線(xiàn)性組合利用以下方程導(dǎo)出
5、 根據(jù)權(quán)利要求2的音頻信號(hào)發(fā)生器(100),其中,聲道組合器(104)可操作用于使用線(xiàn)性組合,所述線(xiàn)性組合具有取決于第一原始聲道的數(shù)目U和第二原始聲道的數(shù)目V的系數(shù)。
6、 根據(jù)權(quán)利要求5的音頻信號(hào)發(fā)生器(100),其中,聲道組合器(104)可操作用于使用具有第一下混聲道(110a)的系數(shù)gA和第二下混聲道(112a)的系數(shù)gB的線(xiàn)性組合,所述系數(shù)gA和系數(shù)gB是根據(jù)以下方程之一導(dǎo)出的
7、 根據(jù)權(quán)利要求1至6的音頻信號(hào)發(fā)生器(100),其中,參數(shù)計(jì)算器(106)可操作用于使用第一原始聲道或所述至少一個(gè)第二原始聲道的預(yù)定聲道作為公共參考聲道。
8、 根據(jù)權(quán)利要求1至6的音頻信號(hào)發(fā)生器(100),其中,參數(shù)計(jì)算器(106)可操作用于使用第一音頻信號(hào)(110)的參考聲道作為公共參考聲道。
9、 根據(jù)權(quán)利要求1至6的音頻信號(hào)發(fā)生器(100),其中,參數(shù)計(jì)算器(106)可操作用于使用所述組合下混聲道(114)作為公共參考聲道。
10、 根據(jù)權(quán)利要求1至6的音頻信號(hào)發(fā)生器(100),其中,參數(shù)計(jì)算器(106)可操作用于使用原始聲道作為具有最高能量的公共參考聲道。
11、 根據(jù)前述權(quán)利要求中任一項(xiàng)的音頻信號(hào)發(fā)生器(100),其中,參數(shù)計(jì)算器(106)可操作用于通過(guò)導(dǎo)出第一下混聲道(110a)的能量E(SA"和與除了參考聲道以外的其他聲道相關(guān)的參數(shù)ai(i- l,...,n},根據(jù)以下方程計(jì)算參考聲道的能量E(s^f)丄1 = Ek(")}。
12、 根據(jù)前述權(quán)利要求中任一項(xiàng)的音頻信號(hào)發(fā)生器(100),其中,參數(shù)計(jì)算器(106)可操作用于使用參考聲道作為公共參考聲道并使用原始參數(shù)a2作為第一組合參數(shù)yu,以及用于導(dǎo)出所述至少一個(gè)第二原始聲道相對(duì)于參考聲道的第二組合參數(shù)y^。
13、 根據(jù)前述權(quán)利要求中任一項(xiàng)的音頻信號(hào)發(fā)生器(100),其中,參數(shù)計(jì)算器(106)可操作用于使用第一下混聲道(110a)的能量E(SA2(11)〉和第二下混聲道(112b)的能量E(s^(n))來(lái)導(dǎo)出組合參數(shù)。
14、 根據(jù)權(quán)利要求13的音頻信號(hào)發(fā)生器(100),其中,參數(shù)計(jì)算器(106)可操作用于進(jìn)一步使用與第一下混聲道(110a)相關(guān)聯(lián)的系數(shù)gA和與第二下混聲道(112a)相關(guān)聯(lián)的系數(shù)gB,所述系數(shù)用于聲道組合器(104)所使用的第一下混聲道和第二下混聲道的線(xiàn)性組合。
15、 根據(jù)權(quán)利要求14的音頻信號(hào)發(fā)生器(100),其中,參數(shù)計(jì)算器(106)可操作用于根據(jù)以下方程計(jì)算所述至少一個(gè)第二原始聲道的第二組合參數(shù)yuw回 g〗E{《(")}其中,E^("卄是根據(jù)以下公式使用第一下混聲道的能量Efc("))導(dǎo)出的參考聲道的能量其中,a2是使第一原始聲道與參考聲道相關(guān)的原始參數(shù)。
16、 根據(jù)前述權(quán)利要求中任一項(xiàng)的音頻信號(hào)發(fā)生器(IOO),其中,參數(shù)計(jì)算器(106)可操作用于處理與離散頻率間隔相關(guān)聯(lián)的第一下混聲道和第二下混聲道的頻率部分,以便針對(duì)每一離散頻率間隔導(dǎo)出組合參數(shù)。
17、 根據(jù)前述權(quán)利要求中任一項(xiàng)的音頻信號(hào)發(fā)生器(100),其中,音頻信號(hào)接收機(jī)可操作用于接收包括下混聲道(110a, 112a)在內(nèi)的音頻信號(hào)(110, 112),所述下混聲道(110a, 112a)由使用預(yù)定采樣頻率進(jìn)行采樣的采樣參數(shù)表示。
18、 一種產(chǎn)生音頻輸出信號(hào)的方法,所述方法包括接收第一音頻信號(hào)(110)和第二音頻信號(hào)(112),所述第一音頻信號(hào)(110)包括具有關(guān)于兩個(gè)或更多個(gè)第一原始聲道的信息的第一下混聲道(110a),并包括與第一原始聲道中的一個(gè)相關(guān)聯(lián)的、描述第一原始聲道中的一個(gè)相對(duì)于參考聲道的屬性的原始參數(shù)(110b);第二音頻信號(hào)(112)包括具有關(guān)于至少一個(gè)第二原始聲道的信息的第二下混聲道(112a);通過(guò)將第一下混聲道(110a)和第二下混聲道(112a)進(jìn)行組合來(lái)導(dǎo)出組合下混聲道(114);導(dǎo)出第一組合參數(shù)(116a)和第二組合參數(shù)(116b),第一組合參數(shù)(116a)描述第一原始聲道中的一個(gè)相對(duì)于公共參考聲道的屬性,第二組合參數(shù)(116b)描述第一原始聲道中的另一個(gè)或所述至少一個(gè)第二原始聲道相對(duì)于公共參考聲道的屬性;以及輸出包括組合下混聲道(114)、第一組合參數(shù)(116a)和第二組合參數(shù)(116b)在內(nèi)的音頻輸出信號(hào)(120)。
19、 三個(gè)或多個(gè)音頻聲道(120)的表示,包括組合下混聲道(114),作為第一下混聲道和第二下混聲道的組合,第一下混聲道具有關(guān)于至少兩個(gè)第一原始聲道的信息,第二下混聲道具有關(guān)于至少一個(gè)第二原始聲道的信息;第一參數(shù)Ul6b),描述所述至少兩個(gè)第一原始聲道中的一個(gè)相對(duì)于參考聲道的屬性;以及第二參數(shù)(116b),描述第一原始聲道中的另一個(gè)相對(duì)于參考聲道的屬性或所述至少一個(gè)第二原始聲道相對(duì)于參考聲道的屬性。
20、 一種具有用于產(chǎn)生音頻輸出信號(hào)的音頻信號(hào)發(fā)生器(100)的會(huì)議系統(tǒng),包括音頻信號(hào)接收機(jī)(102),用于接收第一音頻信號(hào)(110),第一音頻信號(hào)(110)包括第一下混聲道(110a),所述第一下混聲道(U0a)具有關(guān)于兩個(gè)或更多個(gè)第一原始聲道的信息,第一音頻信號(hào)(110)還包括與第一原始聲道中的一個(gè)相關(guān)聯(lián)的、描述第一原始聲道中的一個(gè)相對(duì)于參考聲道的屬性的原始參數(shù)(110b);以及第二音頻信號(hào)(112),第二音頻信號(hào)(112)包括具有關(guān)于至少一個(gè)第二原始聲道的信息的第二下混聲道(112a);聲道組合器(104),用于通過(guò)將第一下混聲道(110a)和第二下混聲道(112a)進(jìn)行組合來(lái)導(dǎo)出組合下混聲道(114);參數(shù)計(jì)算器(106),用于導(dǎo)出第一組合參數(shù)(116a)和第二組合參數(shù)(U6b),第一組合參數(shù)(116a)描述第一原始聲道中的一個(gè)相對(duì)于公共參考聲道的屬性,第二組合參數(shù)(116b)描述第一原始聲道中的另一個(gè)或所述至少一個(gè)第二原始聲道相對(duì)于公共參考聲道的屬性;以及輸出接口 (108),用于輸出包括組合下混聲道(114)、第一組合參數(shù)(116a)和第二組合參數(shù)(116b)在內(nèi)的音頻輸出信號(hào)(120)。
21、 一種計(jì)算機(jī)程序,用于當(dāng)其運(yùn)行在計(jì)算機(jī)上時(shí),實(shí)現(xiàn)用于產(chǎn)生音頻輸出信號(hào)的方法,所述方法包括接收第一音頻信號(hào)和第二音頻信號(hào),所述第一音頻信號(hào)包括具有關(guān)于兩個(gè)或更多個(gè)第一原始聲道的信息的第一下混聲道,并包括與第一原始聲道中的一個(gè)相關(guān)聯(lián)的、描述第一原始聲道中的一個(gè)相對(duì)于參考聲道的屬性的原始參數(shù);第二音頻信號(hào)包括具有關(guān)于至少一個(gè)第二原始聲道的信息的第二下混聲道;通過(guò)將第一下混聲道和第二下混聲道進(jìn)行組合來(lái)導(dǎo)出組合下混聲道;導(dǎo)出第一組合參數(shù)和第二組合參數(shù),第一組合參數(shù)描述第一原始聲道中的一個(gè)相對(duì)于公共參考聲道的屬性,第二組合參數(shù)描述第一原始聲道中的另一個(gè)或所述至少一個(gè)第二原始聲道相對(duì)于公共參考聲道的屬性;以及輸出包括組合下混聲道、第一組合參數(shù)和第二組合參數(shù)在內(nèi)的音頻輸出信號(hào)。
22、 一種參數(shù)表示,使用參數(shù)來(lái)描述多聲道信號(hào)的聲道之一相對(duì)于參考聲道的信號(hào)屬性,所述參考聲道是多聲道信號(hào)的另一聲道或多聲道信號(hào)的下混聲道,所述參數(shù)具有來(lái)自參數(shù)值范圍的值,所述參數(shù)表示的特征在于僅使用關(guān)于下混聲道的信息、所述參數(shù)和備選參考聲道的相應(yīng)參數(shù),就能夠?qū)С雒枋鱿鄬?duì)于備選參考聲道的信號(hào)屬性的備選參數(shù),以使得所述備選參數(shù)具有來(lái)自所述參數(shù)值范圍的值。
23、 根據(jù)權(quán)利要求22的參數(shù)表示,其中,所述信號(hào)屬性是能量或幅度測(cè)量。
24、 根據(jù)權(quán)利要求22或23的參數(shù)表示,其中,所述參數(shù)描述聲道的有限寬度頻率間隔的信號(hào)屬性。
全文摘要
根據(jù)本發(fā)明,可以使用音頻信號(hào)發(fā)生器(100)來(lái)有效地組合多個(gè)參數(shù)編碼的音頻信號(hào),該音頻信號(hào)發(fā)生器(100)通過(guò)在參數(shù)域內(nèi)直接將下混聲道(110a,112a)與音頻信號(hào)的相關(guān)參數(shù)進(jìn)行組合來(lái)產(chǎn)生音頻輸出信號(hào)(120),也就是說(shuō),無(wú)需在產(chǎn)生音頻輸出信號(hào)(120)之前對(duì)各個(gè)輸入音頻信號(hào)進(jìn)行重構(gòu)和解碼。這通過(guò)直接混合各個(gè)輸入信號(hào)的相關(guān)下混聲道(110a,112a)來(lái)實(shí)現(xiàn)。本發(fā)明的一個(gè)關(guān)鍵特征在于通過(guò)簡(jiǎn)單、計(jì)算量低的算術(shù)運(yùn)算來(lái)實(shí)現(xiàn)下混聲道(110a,112a)的組合。
文檔編號(hào)H04N7/15GK101506875SQ200780031682
公開(kāi)日2009年8月12日 申請(qǐng)日期2007年4月24日 優(yōu)先權(quán)日2006年7月7日
發(fā)明者于爾根·赫勒, 卡斯滕·林茨邁爾, 奧立弗·赫爾穆特, 索爾斯滕·克斯特納, 約翰內(nèi)斯·希爾珀特 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1