專利名稱:用于雙聲道提示碼編碼方案和類似方案的散射聲音整形的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及所述音頻信號的編碼和隨后的從編碼后的音頻數(shù)據(jù)合成聽覺場景。
背景技術(shù):
當人聽到由特定音源產(chǎn)生的音頻信號(即,聲音)時,所述音頻信號通常會在兩個不同的時間抵達人的左耳與右耳且具有兩個不同的音頻音量大小(例如,分貝),這些不 同的時間和音量大小是路徑中差異的函數(shù),通過所述路徑音頻信號分別傳播抵達左耳與右 耳,人的大腦解讀這些時間和音量大小的差異從而使人感覺到所接收的音頻信號是由位于 相對于所述人的特定位置(例如,方向與距離)的音源所產(chǎn)生。聽覺場景為一人同時聽到 的由位于相對于所述人的一個或多個不同位置的一個或多個不同音源所產(chǎn)生的音頻合成串音。通過大腦此處理的存在可被用來合成聽覺場景,其中來自一個或多個不同音源的 音頻信號可以目的性地修改以產(chǎn)生左邊與右邊音頻信號,所述左邊和右邊音頻信號使聽者 感覺到不同音源相對于所述聽者位于不同的位置。圖1表示傳統(tǒng)的立體聲信號合成器100的高級框圖,其將單一音源信號(例如, 單聲道信號)轉(zhuǎn)換成立體聲信號的左邊與右邊音頻信號,其中立體聲信號被定義為在聽者 的鼓膜處所接收的兩個信號。除所述音源信號外,合成器100接收對應于相對聽者的音源 的期望位置的一組空間提示信號。在典型的實施中,所述這組空間提示信號包括通道間電 平差(ICLD)值(其辨識分別在左耳與右耳所接收的左與右音頻信號間音頻音量大小的差 異),和音頻通道中時差異(ICTD)值(其辨識如分別在左耳與右耳所接收的左邊與右邊音 頻信號間抵達時間的差異)。此外或作為替換,一些合成技術(shù)包括用于從音源到耳膜的聲音 的方向依賴轉(zhuǎn)移函數(shù)的建模,也可引用頭部相關(guān)的轉(zhuǎn)移函數(shù)(HRTF),參見例如,J.Blauert, ThePsychophysics of Human Sound Localization, MIT Press,1983,胃弓|入以## 考。使用圖1的立體聲信號合成器100,由單一音源所產(chǎn)生的單聲道音頻信號可被 處理以便當通過耳機收聽時,所述音源通過使用適當空間提示信號組(例如,ICLD、ICTD 和/或HRTF)來為每一個耳朵產(chǎn)生音頻信號,參見例如,D. R.Begault,3-D Sound for VirtualReality and Multimedia, Academic Press, Cambridge, MA,1994。圖1的立體聲信號合成器100產(chǎn)生最簡單型式的聽覺場景,它們相對于聽者具有 單一音源,包括相對于聽者的位于不同位置的兩個或多個音源的更復雜的聽覺場景可使用 聽覺場景合成器被產(chǎn)生,所述聽覺場景合成器通過使用多個立體聲信號合成器而本質(zhì)上被 實施,其中每個立體聲信號合成器產(chǎn)生對應于不同音源的立體聲信號,因為每個不同音源 相對于聽者具有不同的位置,不同空間提示信號組被用來對每個不同音源產(chǎn)生立體聲音頻 信號。
發(fā)明內(nèi)容
根據(jù)一個實施例,本發(fā)明涉及用于將具有輸入時序包絡的輸入音頻信號轉(zhuǎn)換成具 有輸出時序包絡的輸出音頻信號的方法和設備。所述輸入音頻信號的所述輸入時序包絡被 特性化。對所述輸入音頻信號進行處理以產(chǎn)生處理后音頻信號,其中所述處理將所述輸入 音頻信號去關(guān)聯(lián)?;谒鎏匦曰妮斎霑r序包絡對所屬處理后音頻信號進行處理以產(chǎn)生 所述輸出音頻信號,其中所述輸出時序包絡大體上與所述輸入時序包絡相匹配。依據(jù)本發(fā)明的另一實施例,本發(fā)明涉及對C個輸入音頻通道編碼以產(chǎn)生E個傳輸 音頻通道的方法和設備。為所述C個輸入通道中的兩個或多個而產(chǎn)生一個或多個提示碼。 對所述c個輸入通道進行下混以產(chǎn)生所述E個傳輸通道,其中C > E≥ 1。所述C個輸入通道中的一個或多個和所述E個傳輸通道被分析,以產(chǎn)生一個在所述E個傳輸通道解碼期間 用來指示所述E個傳輸通道的解碼器是否執(zhí)行包絡整形的標記。根據(jù)另外一個實施例,本發(fā)明涉及通過前面段落中提到的方法產(chǎn)生的編碼后音頻 比特流。根據(jù)另外一個實施例,本發(fā)明涉及包括E個傳輸通道、一個或多個提示碼和標記 的編碼后音頻比特流。通過為所述C個輸入通道中的兩個或多個而產(chǎn)生一個或多個提示碼 從而產(chǎn)生一個或多個提示碼。通過對所述C個輸入通道進行下混產(chǎn)生所述E個傳輸通道, 其中C>E> 1。通過對所述C個輸入通道中的一個或多個進行分析產(chǎn)生所述標記,其中在 所述E個傳輸通道解碼期間用來指示所述E個傳輸通道的解碼器是否執(zhí)行包絡整形。
本發(fā)明的其他的方面、特征和優(yōu)點從下面的詳細描述、所附的權(quán)利要求和附圖中 將會更明顯,其中相同的附圖標記表示相似或相同的元件。圖1為傳統(tǒng)的立體聲信號合成器的高級框圖;圖2為一般雙聲道提示碼編碼(BCC)音頻處理系統(tǒng)的框圖;圖3為可被使用于圖2的下混器的框圖;圖4為可被使用于圖2的BCC合成器的框圖;圖5依據(jù)本發(fā)明的實施例,顯示圖2中所述BCC評估器的框圖;圖6表示用于五音頻通道的ICTD和ICLD數(shù)據(jù)的生成;圖7表示用于五音頻通道的ICC數(shù)據(jù)的生成;圖8表示圖4的所述BCC合成器的實施的框圖,其在單一傳輸總和信號s (n)加空 間提示信號下可被使用于BCC解碼器中以產(chǎn)生立體聲或多通道音頻信號;圖9表示ICTD與ICLD作為頻率函數(shù)如何在基頻帶中被改變;圖10為根據(jù)本發(fā)明的一個實施例的表示BCC解碼器的至少一部分的框圖;圖11表示在圖4的BCC合成器的范圍內(nèi)的圖10的包絡整形方案的示范應用;圖12表示圖4的BCC合成器的范圍內(nèi)的圖10的包絡整形方案的替換示范應用, 其中包絡整形被應用到時域中;圖13(a)和(b)表示圖12中的TPA和TP的可能的實施,其中只有當頻率高于截 止頻率fTP時包絡整形才可以實施;圖14表示在2004年4月1日申請的美國申請?zhí)枮?0/815,591,代理人號為 BaUmgarte7-12的申請中描述的基于后期回響的ICC合成方案范圍內(nèi)的圖10中的包絡整形 方案的示范應用;圖15表示根據(jù)可以替換成圖10所示方案的本發(fā)明的實施例的BCC解碼器的至少 一部分的框圖;圖16表示根據(jù)可以替換成圖10和圖15所示方案的本發(fā)明的實施例的BCC解碼 器的至少一部分的框圖;圖17表示在圖4中的BCC合成器的范圍內(nèi)的圖15的包絡整形方案的示范應用;圖18 (a)-(c)表示圖17中的TPA、ITP禾口 TP的 能實施的框圖。
具體實施例方式在雙聲道提示碼編碼(BCC)中,編碼器對C個輸入音頻通道編碼以產(chǎn)生E個傳輸 音頻通道,其中C > E > 1。特別是C個輸入通道中的兩個或多個被提供于頻域中,且一個 或多個提示碼被產(chǎn)生用于頻域中兩個或多個輸入通道中一個或多個不同頻帶的每一個。此 外,所述C個輸入通道被下混以產(chǎn)生E個傳輸通道,在一些下混實施中,所述E個傳輸通道 中的至少一個基于所述C個輸入通道中的兩個或多個,且至少所述E個傳輸通道中的一個 僅基于C個輸入通道中的單一通道。在一個實施例中,BCC碼器具有兩個或多個濾波器庫、一個代碼評估器與一個下混 器,所述兩個或多個濾波器庫將所述C個輸入通道中的兩個或多個從時域轉(zhuǎn)換到頻域,所 述代碼評估器產(chǎn)生一個或多個提示碼用于所述兩個或多個經(jīng)轉(zhuǎn)換輸入通道中一個或多個 不同頻帶的每一個,下混器下混C輸入通道以產(chǎn)生E個傳輸通道,其中C > E彡1。在BCC解碼中,E個傳輸音頻通道被解碼以產(chǎn)生C回放音頻通道。特別對于一個 或多個頻帶中的每一個,一個或多個E個傳輸通道在頻域中被上混以在頻域中產(chǎn)生C回放 通道中的兩個或多個,其中C>E> 1。一個或多個提示碼被施加至頻域中所述兩個或多個 回放音頻通道中的所述一個或多個不同頻段的每一個以產(chǎn)生兩個或多個經(jīng)修改的通道,且 所述兩個或多個經(jīng)修改的音道從頻域被轉(zhuǎn)換成時域。在一些上混實施中,至少C回放通道 中的一個基于E個傳輸音頻通道中的至少一個和至少一個提示碼,且C回放通道中的至少 一個僅基于E個傳輸音頻通道中的單一一個且與任何提示碼無關(guān)。在一個實施例中,BCC解碼器具有上混器、合成器和一個或多個反向濾波器庫,對 于一個或多個不同頻帶中的每一個,所述上混器在頻域中上混E個傳輸通道中的一個或多 個以便在頻域中產(chǎn)生C個回放通道中的兩個或多個,其中C > E > 1,所述合成器施加一個 或多個提示碼至頻域中所述兩個或多個回放通道中的所述一個或多個不同頻段的每一個, 以便產(chǎn)生兩個或多個經(jīng)修改的通道,所述一個或多個反向濾波器庫將所述兩個或多個修改 的通道從頻域轉(zhuǎn)換成時域。根據(jù)特別實施,指定的回放通道可基于一個單一傳輸通道,而不是兩個或多個傳 輸通道的結(jié)合。例如,當僅有一個傳輸通道,C個回放通道中的每一個基于所述傳輸通道。 在這些情況下,上混對應所述相應的傳輸通道的復制。如此,對僅有一個傳輸通道的應用, 所述上混器可使用為每一個回放通道復制傳輸通道的復制器而被實施。BCC編碼器和/或解碼器可合并成一些系統(tǒng)或應用,其包含,例如數(shù)字錄像機/放 影機、數(shù)字錄音機/放音機、計算機、衛(wèi)星發(fā)送器/接收器、有線發(fā)送器/接收器、陸地廣播 發(fā)送器/接收器、家用娛樂系統(tǒng)與電影劇院系統(tǒng)。(一般 BCC 處理)圖2為普通的雙聲道提示碼編碼(BCC)音頻處理系統(tǒng)200的框圖,其包括編碼器 202和解碼器204,編碼器202包含下混器206和BCC評估器208。下混器206將C個輸入音頻通道Xi (n)轉(zhuǎn)換成E個傳輸音頻通道(n),其中C > 1。在此說明書中,使用變量n表示的信號為時域信號,同時使用變量k表示的信號為
頻域信號。根據(jù)特殊的實施,下混能在時域或頻域中實施。BCC評估器208從C個輸入音頻 通道產(chǎn)生BCC碼且傳輸這些BCC碼作為相對于E個傳輸音頻通道的頻帶內(nèi)或頻帶外輔助信 息。通常的BCC碼包含一個或多個通道間時差(ICTD)、通道間電平差(ICLD)和在輸入通道的某些對間被評估作為頻率與時間的函數(shù)的通道間關(guān)聯(lián)(ICC)數(shù)據(jù)。所述特別實施將在輸 入通道的特定對之間指示BCC碼被評估。ICC數(shù)據(jù)對應立體聲信號的一致性,其與所述音源的感覺寬度有關(guān)。音源越寬,所 產(chǎn)生立體聲信號的左邊與右邊通道間的一致性越低。例如,對應于傳過一個禮堂講臺的管 弦樂隊的立體聲信號的一致性通常低于對應于單個小提琴獨奏的立體聲信號的一致性。通 常,一致性較低的音頻信號通常被感覺為在聽覺空間中更能被傳播。如此,ICC數(shù)據(jù)通常與 聽者環(huán)境的明顯音源寬度和程度有關(guān)。見例如,J.Blauert,The Psychophysics of Human SoundLocalization, MIT press,1983。根據(jù)特殊的應用,所述E個傳輸音頻通道和對應的BCC碼可直接被傳輸?shù)浇獯a器 204或儲存在合適類型的儲存裝置中用于解碼器后續(xù)存取。依據(jù)所述情況,術(shù)語“傳輸”可 弓I用為直接傳輸至解碼器或是用于對解碼器后續(xù)供應的儲存。在任意種情況下,解碼器204 接收傳輸音頻通道和輔助信息并且執(zhí)行上混和使用BCC碼的BCC合成以將E個傳輸音頻通 道轉(zhuǎn)換成超過E(通常,但不必須,C)個回放音頻通道天(勸用于音頻回放。根據(jù)特殊的實施, 上混可在既能在時域中也能在頻域中被執(zhí)行。除圖2中所示的BCC處理外,普通的BCC音頻處理系統(tǒng)可包括有額外的編碼和 譯碼階段以進一步分別在編碼器壓縮音頻信號然后在解碼器對所述音頻信號解壓縮。這 些編解碼器可基于傳統(tǒng)的音頻壓縮/解壓縮技術(shù),例如那些基于脈沖碼調(diào)制(PCM)、差分 PCM(DPCM)或適應性 DPCM(ADPCM)。當下混器206產(chǎn)生單一總和信號(即,E = 1)時,BCC編碼能夠在比特率僅稍高于 所需要表示單聲道音頻的信號來表示多通道音頻信號,這是因為在通道對間所述經(jīng)評估的 ICTD、ICLD和ICC數(shù)據(jù)含有較音頻波形少約兩個數(shù)量級大小的信息。不僅對BCC編碼的低位率,而且對其向后兼容性方面也是有利的。單一傳輸總和 信號對應原先立體聲或多通道信號的單聲道下混。對于接收器,其不支持立體聲或多通道 音頻重現(xiàn),傾聽傳輸總和信號是在低外形單聲道再現(xiàn)設備上呈現(xiàn)所述音頻素材的正確方 法,BCC編碼可因此也被使用以提升涉及從單聲道音頻素材向多通道音頻的傳輸?shù)默F(xiàn)有服 務。例如,如果B C C輔助信息可被嵌入到現(xiàn)有傳輸通道中,現(xiàn)有單聲道音頻無線廣播系統(tǒng) 可被提升用于立體聲或多通道回放。類似的能力存在于當下混多通道音頻至對應立體聲的 兩個總和信號。BCC處理具某時間與頻率分辨率的音頻信號,所用的所述頻率分辨率主要由人體 聽覺系統(tǒng)的頻率分辨率所引起,心理聲學建議空間感覺最有可能基于所述音頻輸入信號的 臨界頻帶表示。此頻率分辨率通過使用具有頻寬等于或與人體聽覺系統(tǒng)的臨界頻寬成正比 的基頻帶的可反向濾波器庫(例如,基于快速傅立葉轉(zhuǎn)換(FFT)或正交鏡像濾波器(QMF)) 被考慮。(一般下混)在優(yōu)選實施中,所述傳輸總和信號包含所述輸入音頻信號的全部信號成份。目標 為每一個信號成份被完全保持。所述音頻輸入通道的簡單總和導致信號成份的放大或衰 減。換句話說,在“簡單”總和中信號成份的功率經(jīng)常是大于或小于每一個音頻通道的相應 信號成份的功率總和??墒褂孟禄旒夹g(shù),該技術(shù)使所述總和信號均衡,以便使總和信號中的 信號成份的功率大約與在全部輸入通道中的相應功率相同。
8一個矩陣組件進行平方而得到,且/^.⑷
信號的功率值巧,a)將大于或小于使用 第(2)式所計算得值,由于當信號成份分別是同相或不同相時信號放大或取消。為避免如 此,第(1)式的下混操作接著以乘法器310的校準操作被施加到基頻帶中,校準因子ei(k) (1彡i彡E)可由第(3)式得出如下 其中,巧,⑷為如以第⑵式計算的基頻帶功率,且作⑷為相應經(jīng)下混基頻帶信號 夕,(幻的功率。除了提供可選擇的校準或不用可選擇的校準,校準/延遲區(qū)塊306可選擇地對信 號施加延遲。每一個反向濾波器庫308將頻域中的一組相應的經(jīng)校準的系數(shù)歹,(幻轉(zhuǎn)換成相應 的數(shù)字、傳輸通道yi(n)的幀。雖然圖3顯示輸入通道的全部C被轉(zhuǎn)換成頻域用于后續(xù)下混,在一個替代實施中,圖3表示下混器300的框圖,其可依據(jù)BCC系統(tǒng)200的特殊實施被使用于圖2的 下混器206。下混器300具有濾波器庫(FB) 302用于每個輸入通道Xi(n)、下混區(qū)塊304、可 選擇校準/延遲區(qū)塊306和反向FB (IFB) 308用于每個編碼通道(n)。每一個濾波器庫302將時域中相應的數(shù)字輸入通道\(11)的每一幀(例如, 20msec)轉(zhuǎn)換成頻域中一組輸入系數(shù)萬(幻。下混區(qū)塊304將C相應的輸入系數(shù)的每一個基頻 帶下混成E經(jīng)下混頻域系數(shù)的相應基頻帶。方程式(1)表示輸入系數(shù)民(幻,&(幻,…,乓(幻) 的第k個基頻帶的下混以產(chǎn)生經(jīng)下混系數(shù)僅㈨,九㈨,...,尺㈨)的第k個基頻帶如下
(1)其中Dce為一個實值的C-by-E下混矩陣。選擇的校準/延遲區(qū)塊306包括一組乘法器310,每一個乘法器以一校準因子 ei(k)乘上相應的經(jīng)下混系數(shù)j),(幻以產(chǎn)生相應的比例系數(shù)5U幻,用于校準操作的動機為相 等于對每一個通道用于以任意加權(quán)因子下混所一般化的等化。如果輸入通道為獨立的,接 著每一個基頻帶的經(jīng)下混信號的功率巧,⑷以方程式(2)得到如下 其中;通過對C-by-E下混矩陣Dce中的每 為輸入通道i的基頻帶k的功率。如果基頻帶不是獨立的,接著所述經(jīng)下混C個輸入通道中的一個或多個(但少于C-1)可避開圖3中所顯示的所述操作的一些或全部 且可被傳輸作為未修改音頻通道的相等數(shù)量,根據(jù)所述特別實施,這些未修改的音頻通道 可或不可被圖2的BCC評估器208使用以產(chǎn)生傳輸BCC碼。在下混器300的實施中其產(chǎn)生單一總和信號y(n),E = 1,且每一個輸入通道c的 每一個基頻帶的信號元(幻被加入且接著以因子e(k)相乘,依據(jù)第(4)式如下 因子e(k)以第(5)式得到如下
( 其中;幻為在時間索引k時無⑷功率的短時間評估,且巧㈨為功率Hq元㈨的
短時間評估,所述相等的基頻帶被轉(zhuǎn)換回到產(chǎn)生被傳輸至所述BCC解碼器的總和信號的時 域。(一般 BCC 合成)圖4顯示BCC合成器400的框圖,其依據(jù)BCC系統(tǒng)200的某些實施可被使用于圖2 的解碼器204,BCC合成器400具有濾波器庫402用于每一個傳輸通道(n),上混區(qū)塊404, 延遲器406,乘法器408,相關(guān)區(qū)塊410和反向濾波器庫412用于每一個回放通道天(勸。每一個濾波器庫402將時域中相應的數(shù)字、傳輸通道yi (n)的每一幀轉(zhuǎn)換成頻域 中一組輸入系數(shù)又(幻。上混區(qū)塊404將E相應的傳輸通道系數(shù)的每一個基頻帶上混成C經(jīng) 上混頻域系數(shù)的一相應的基頻帶,方程式(4)表示傳輸通道系數(shù)僅(幻,艿(幻,…,么(幻)的第 k個基頻帶的上混以產(chǎn)生上混系數(shù)伝㈨,5;㈨,…,?;⑷)的kth基頻帶如下
其中UEe為一個實值E-by-C上混矩陣,在頻域中執(zhí)行上混使上混能被獨立地施加 于每一個不同的基頻帶。每一個延遲器406施加基于用于ICTD數(shù)據(jù)的相應的BCC碼的延遲值屯(k)以確 保所要的ICTD值出現(xiàn)于回放通道的某些對中。每一個乘法器408施加基于用于ICLD數(shù)據(jù) 的相應的BCC碼的校準因子ai(k)以確保所要的ICLD值出現(xiàn)于回放通道的某些對中,相關(guān) 區(qū)塊410執(zhí)行用于ICC數(shù)據(jù)的相應的BCC碼的去關(guān)聯(lián)操作A以確保所要的ICC值出現(xiàn)于 回放通道的某些對中,相關(guān)區(qū)塊的操作的進一步描述可見2002年5月24日申請的美國第 10/155,437 號專利申請如 Baumgarte 2-10。ICLD值的合成比ICLD和ICC值的合成容易一些,因為ICLD合成僅涉及基頻帶fi 號的校準。因為ICLD提示信號為最通常使用的方向性提示信號,ICLD值接近原始音頻
號的這些值是通常更重要的,如此,ICLD數(shù)據(jù)可被評估在全部通道對之間。對每一個基頻 帶的校準因子ai(k), (1 ^ i ^ C)最好被選取使得每一個回放通道的基頻帶功率接近原始 輸入音頻通道的相應的功率。一個目標可施加相對少的信號修改用以合成ICTD和ICC值,這樣,所述BCC值可 不包含用于全部通道對的ICTD和ICC值,在所述情形中,BCC合成器400將僅在某些通道 對之間合成ICTD和ICC值。每一個反向濾波器庫412將一組頻域中的相應的經(jīng)合成系數(shù)幻轉(zhuǎn)換成相應的 數(shù)字的、回放通道戈…)的幀。雖然圖4顯示全部E個傳輸通道被轉(zhuǎn)換成頻域用于后續(xù)上混與BCC處理,在另外 實施中,所述E個傳輸通道中的一個或多個(但非全部)可避開圖4所示的處理的一些或 全部。例如,傳輸通道的一個或多個可以是未修改通道,其未接受任何上混。除了作為C個 回放通道中的一個或多個之外,這些未修改通道,輪流地,可以是但不必須被用作為參考通 道,其BCC處理被施加給合成其它回放通道中的一個或多個。在任情形中,這些未修改通道 可受到延遲以補償涉及上混的操作時間與/或用以產(chǎn)生其余回放通道的BCC操作。注意的是,雖然圖4顯示C個回放通道自E個傳輸通道被合成,其中,C也為原始 輸入通道的數(shù)目,BCC合成不限于回放通道的所述數(shù)目,通常,回放通道的數(shù)目可以是通道 的任何數(shù)目,包含數(shù)目大于或小于C和可能甚至當回放通道的數(shù)目是等于或小于傳輸通道 數(shù)目的情形。(介于音頻通道之間的“感覺上相對差異”)假設單一總和信號,BCC合成立體聲或多通道音頻信號使得ICTD、ICLD和ICC接 近原始音頻信號的相應的提示信號,以下,關(guān)于聽覺空間影像屬性的ICTD、ICLD和ICC的作 用將予討論。關(guān)于空間聽覺的知識包含有對于一個聽覺事件,ICTD和ICLD與感覺方向是相關(guān) 的。當考慮到音源的立體聲空間脈沖響應(BRIRs)時,在聽覺事件的寬度和聽者包封和為 BRIRs的早期和后期部分評估的ICC數(shù)據(jù)之間具有關(guān)系。然而,在ICC和這些普通信號(和 不只是BRIRs)的性質(zhì)之間的關(guān)系不是直接的。立體聲和多通道音頻信號通常包含同步主動源信號的復雜混合,所述主動源信號 是從圍繞空間中錄音所產(chǎn)生的經(jīng)反射信號成份所迭加,或用于人工生成的空間印象的錄音 工程師所賦加,不同的音源信號與它們的反射占據(jù)時間-頻率平面中的不同區(qū)域。此由 ICTD、ICLD與ICC所反映,其作為時間與頻率的函數(shù)而改變。在此情形下,瞬時現(xiàn)象ICTD、 ICLD和ICC和音頻事件方向與空間印象間的關(guān)系是不明顯的。某些BCC實施例的策略是不 明顯地合成這些提示信號,以便使它們接近原始音頻信號的相應的提示信號。具有基頻帶頻寬等于兩倍相等的矩形頻寬(ERB)的濾波器庫被使用。非正式的傾 聽會顯示當選取較高頻率分辨率時BCC的音頻質(zhì)量未顯著改善。較低頻率分辨率可為需求 的,因為它導致較少ICTD、ICLD與ICC值需要被傳輸至解碼器,且因此以較低比特率傳輸。關(guān)于時間分辨率,ICTD、ICLD和ICC為通常在固定時間間距下被考慮,當ICTD、 ICLD與ICC以約每4到16ms被考慮時,可得到高性能。注意的是,除非所述提示信號在非 常短的時間間隔被考慮,先前效果未直接考慮,假設音頻刺激的典性領(lǐng)先-落后對,假如所 述領(lǐng)先和落后位于時間間隔僅一組提示信號被合成,則所述領(lǐng)先的局部化優(yōu)勢未被考慮。雖然如此,BCC達到音頻質(zhì)量以平均MU SHRA分數(shù)反映為平均約87 (即,“極佳”音頻質(zhì)量), 且對某些音頻信號高到接近于100。參考信號與經(jīng)合成信號間的所述經(jīng)常得到的感覺上小差異暗示關(guān)于寬度范圍的 聽覺空間影像屬性的提示信號為暗示性地在固定時間間隔被合成ICTD、ICLD和ICC所考 慮。以下,一些論點對于ICTD、ICLD和ICC可如何與聽覺空間影像屬性的范圍有關(guān)。(空間提示信號的評估)以下中,將描述ICTD、ICLD和ICC如何被評估,用于這些(經(jīng)量化的與編碼的)空 間提示信號的傳輸比特率可為剛好為幾個kb/s并因此,使用BCC,它可能在比特率接近對 單一音頻通道的要求下傳輸立體聲與多通道音頻信號。圖5顯示依據(jù)本發(fā)明,圖2的BCC評估器208的框圖,BCC評估器208包括濾波器 庫(FB) 502,其可與圖3的濾波器庫302相同,和評估區(qū)塊504其對由濾波器庫502所產(chǎn)生 的每一個不同頻率產(chǎn)生ICTD、ICLD與ICC空間提示信號。(用于立體聲信號的ICTD、ICLD和ICC的評估)以下量測為使用于ICTD、ICLD和ICC用以相應的二(例如,立體聲)音頻通道的 基頻帶信號寫(幻與幻。ICTD [例子]rX2{k) = argmax{012(J,A)}(7)
d具有由以下第(8)式得到的經(jīng)標準化交叉相關(guān)函數(shù)的短時間評估。
Pa (d, k)Ol2(d,k)= ! 二、(8)其中= max{-d,0}d2 = max{d,0}且,(d,幻為名(k — dt)x2(k -為)平均數(shù)的短時間評估ICLD[dB]
fAL,2(^:) = 101og(
(9)
y^、 ,、 作ft,
(10)ICCcn{k) = m^i\<^n(d,k)\
d
(11)注意經(jīng)標準化交叉相關(guān)的絕對值被考慮且c12(k)具有
的范圍。(用于多通道音頻信號的ICTD、ICLD和ICC的評估)當有超過兩個輸入通道,它通常足以在參考通道間限定ICTD和ICLD(例如,音頻 通道號碼1)與其它通道,如圖6中所說明用于C = 5個通道的情形,其中t lc(k)與AL12(k) 在參考通道1與通道c之間分別指示ICTD與ICLD。與ICTD和ICLD相反的,ICC通常具有較多自由度,所限定的ICC在所有可能的輸 入通道對之間具有不同的值,對C個通道而言,具有C(C-l)/2個可能的音頻通道對,例如, 對5個通道會有如圖7 (a)中所例示的10個通道對,然而,這些方式需要在每一時間索引對每一基頻帶評估且傳輸C(C_l)/2個ICC值,導致高計算復雜度與高比特率。或者,對每一基頻帶,實施ICTD與ICLD決定基頻帶中相應的信號成份的音頻事件 的方向。每基頻帶的單一 ICC參數(shù)可接著被用于描述全部音頻通道間的整體一致性,良好 的結(jié)果可通過僅在每一時間索引的每一基頻帶中具有最多能量的兩個通道間評估和傳輸 ICC提示信號而得到。此例示于圖7(b)中,其中時間瞬間k-1與k的所述通道對(3,4)與 (1,2)分別為最強。啟發(fā)式規(guī)則可被用于在其它通道對間決定ICC。(空間提示信號的合成)圖8顯示圖4的BCC合成器400的實施框圖,其在給單一傳輸總和信號s (n)加空 間提示信號下,可被使用于BCC解碼器中以產(chǎn)生立體聲或多通道音頻信號。總和信號s(n) 被分解成基頻帶,其中?(幻指示這些基頻帶。為產(chǎn)生每一個輸出通道的相應的基頻帶,延遲 d。校準因子a。與濾波器h。被施加至總和信號的相應的基頻帶,(為簡化表示,時間索引k 在延遲、校準因子和濾波器中被省略),ICTD通過加上延遲,ICTD通過校準和ICC通過施加 去相關(guān)濾波器被合成,圖8中所示的處理被獨立地施加至每一基頻帶。(ICTD 合成)延遲dc從ICTDs T lc(k)被決定,依據(jù)如下第(12)式 用于參考通道的延遲屯被計算使得延遲d。的最大數(shù)量被最小化,越少基頻帶信號 被修改,越少的人為危害產(chǎn)生,假如基頻帶取樣率對ICTD合成未提供夠高的時間分辨率, 延遲可通過使用合適的全通濾波器更準確地被加于其上。(ICLD 合成)為使輸出基頻帶信號在通道c和參考通道1具有所要的ICLDs A L12 (k),增益因子 a。應所述滿足如下第(13)式 此外,輸出基頻帶最好被標準化使得全部輸出通道的功率與輸入總和信號的功率 相等。因為在每一基頻帶中的全部原始信號功率被保存在總和信號中,在絕對基頻帶功率 中的此標準化結(jié)果對每一個輸出通道接近原始編碼器音頻信號的相應的功率,在這些限制 下,校準因子a。由以下第(14)式得到。 (ICC 合成)在某些實施例中,ICC合成的目標為在延遲后的基頻帶間降低相關(guān)且校準已被施 加,而不會影響ICTD和ICLD。此可通過設計圖8中的濾波器h。而達到,使得ICTD和ICLD 如同一頻率函數(shù)有效地被改變,使得在每一基頻帶(音頻臨界頻帶)中平均變異為0。
圖9說明ICTD和ICLD如何在一基頻帶中作為頻率函數(shù)被改變,ICTD和ICLD變 異的振幅決定去相關(guān)的程度且作為ICC函數(shù)被控制,注意ICTD被平緩地改變(如圖9 (a)), 同時ICLD被任意改變(如圖9(b))??扇缤琁CTD平緩般地變化ICLD,但此將導致音頻信
號產(chǎn)生更多的聲染色。用于合成ICC的另一方法,特別適合于多通道ICC合成,被更詳細描述于 C.Faller,"Parametric multi-channel audio coding :Synthesis ofcoherence cues, "IEEE Trans, on Speech and Audio Proc.,2003,其啟示被并入于此以供參考,作為 時間和頻率的函數(shù),人為后期回響(latereverberation)的特定量被加于每一個輸出通道 用以獲得想要的ICC,另外,頻譜修改可被施加以使得產(chǎn)生信號的頻譜包絡接近原始音頻信 號的頻譜包絡。其它用于立體聲信號(或音頻通道對)的相關(guān)與不相關(guān)的ICC合成技術(shù)已發(fā)表 于 E. Schuijers,W. Oomen,B. den Brinker,andj. Breebaart,‘‘Advances in parametric coding for high-quality audio, ”in Preprint 114th Conv. Aud. Eng. Soc.,Mar. 2003, and J.Engdegard, H. Purnhagen, J. Roden, and L. Liljeryd, "Synthetic ambience in parametric stereo coding,,,in Preprint 117th Cov. Aud. Eng. Soc.,May 2004,二者的啟 示并入于此以供參考。(C-to-E BCC)如先前描述,BCC可以超過傳輸通道被實施,BCC的變形已被描述,其代表C個音 頻通道并非為單一(傳輸)通道,但作為E個音頻通道,標示為由C到E(C-to-E)BCC。對 C-to-E BCC至少有兩個動機具備傳輸通道的BCC提供向后(backwards)可兼容路徑用以升級現(xiàn)有的單聲道系 統(tǒng)用于立體聲或多通道音頻回放,所述經(jīng)升級的系統(tǒng)通過現(xiàn)有的單聲道架構(gòu)傳輸BCC下混 總和信號,從C到E (C-to-E)的BCC可施加C個通道音頻的向后可兼容的編碼至E個通道。從C到E的BCC以傳輸通道數(shù)目的不同程度的減少引進校準??梢灶A期當更多的 音頻通道被傳輸會有更佳的音頻質(zhì)量。對從C到E的BCC的信號處理細節(jié),諸如如何定義ICTD、ICLD和ICC提示信號,被 描述于2004年1月20日的美國第10/762,100號專利申請中(Faller 13-1) 0(散射聲音整形)在某些實施中,BCC編碼包括用于ICTD、ICLD和ICC合成的算法。ICC提示信號可 以通過對在相應的基頻帶中的信號分量進行去關(guān)聯(lián)被合成。這可以通過ICLD的頻率相關(guān) 變化、ICTD和ICLD的頻率相關(guān)變化、全通濾波或者通過與回響算法相關(guān)的想法來完成。當這些技術(shù)在音頻信號上使用時,所述信號的時序包絡特征不被保存。特別地,當 被應用到瞬時現(xiàn)象上時,瞬時信號能量可能被傳播了一段時期。這就導致了人為結(jié)果例如 “前回聲”或者“模糊的瞬時現(xiàn)象”。本發(fā)明的某些實施例的一般原理與觀測結(jié)果有關(guān),所述觀測結(jié)果為BCC解碼器合 成的聲音應該不僅具有與原始聲音相似的空間特征,還應該與所述原始聲音的時序包絡非 常近似,以便具有相似的感知特征。通常這是在通過包括動態(tài)ICLD合成的類似BCC方案中 實現(xiàn)的,其對大約每個信號通道的時序包絡進行時間變化校準操作。對于瞬變信號(突發(fā)、 打擊樂器等),這種處理的瞬時清晰度可以,然而,不足以產(chǎn)生合成信號,該合成信號足夠接
14近原始時序包絡。本節(jié)描述了許多具有十分精細的時間分辨率的方法來實現(xiàn)這個。另外,對于不能訪問所述原始信號的時序包絡的BCC解碼器,思路是將所述傳輸 “總和信號”的時序包絡作為近似值替換。這樣,就不需要將輔助信息從所述BCC編碼器到 所述BCC解碼器進行傳輸以傳送這樣的包絡信息??傊?,本發(fā)明依賴下面的原則所述傳輸音頻通道(S卩“總和通道”)或者BCC合成可能基于的這些通道的線性組 合通過時序包絡提取器進行分析用于其具有高時間分辨率的時序包絡(例如,比BCC區(qū)塊 的大小更顯著地精細)。用于每個輸出通道的所述后續(xù)合成聲音被整形以便-即使是在ICC合成之后-其 能夠盡量地與通過所述提取器所決定的時序包絡相匹配。這會保證即使在瞬時信號的情況 下,所述合成的輸出聲音并沒有被ICC合成/信號去關(guān)聯(lián)處理顯著地降低品質(zhì)。圖10顯示的是根據(jù)本發(fā)明的一個實施例,表示BCC解碼器1000至少一部分的框 圖。在圖10中,區(qū)塊1002表示BCC合成處理,其包括,至少,ICC合成。BCC合成區(qū)塊1002 接收基通道1001并產(chǎn)生合成通道1003。在某些實施中,區(qū)塊1002表示圖4中的區(qū)塊406、 408和410的處理,其中基通道1001為上混區(qū)塊404產(chǎn)生的信號,并且合成通道1003是關(guān) 聯(lián)區(qū)塊410產(chǎn)生的信號。圖10表示對一個基通道1001和它相應的合成通道實施的處理。 相似的處理也被實施在每個其他的基通道和它相應的合成通道上。 包絡提取器1004決定基通道1001,的細微時序包絡a,并且包絡提取器1006決定 合成通道1003’的細微時序包絡b。反包絡調(diào)節(jié)器1008使用來自包絡提取器1006的時序 包絡b以標準化合成通道1003’的所述包絡(即“平滑”所述時序細微結(jié)構(gòu))來產(chǎn)生具有標 記(即統(tǒng)一的)時間包絡的平滑的信號1005’。根據(jù)特殊的實施,平滑化可以在上混前或上 混后實施。包絡調(diào)節(jié)器1010使用來自包絡提取器1004的時序包絡a以對平滑信號1005’ 上的原始信號包絡進行再加強來產(chǎn)生具有與基通道1001的時序包絡大體上相等的時序包 絡的輸出信號1007,。根據(jù)所述實施,此時序包絡處理(在此也引用為“包絡整形”)可以應用在整個合 成通道(如所示的那樣)或者只應用在所述合成通道(如后面所描述的)的正交的部分 (例如,后期回響部分、去關(guān)聯(lián)部分)。此外,根據(jù)所述實施,包絡整形可以應用在時域信號 或者以頻率依賴的方式應用(例如,所述時序包絡分別以不同的頻率被評估和加強)。反包 絡調(diào)節(jié)器1008和包絡調(diào)節(jié)器1010可以依不同的方式實施。在一種實施方式中,信號的包 絡通過信號的時域樣本(或者頻譜/基帶樣本)和時間變化的振幅改變函數(shù)(例如,用于 反包絡調(diào)節(jié)器1008的1/b和用于包絡調(diào)節(jié)器1010的a)的相乘來進行操作??蛇x擇地,所 述信號的關(guān)于頻率的頻譜表示的卷積/濾波可以以在現(xiàn)有技術(shù)中為了對低速率音頻編碼 器的量化噪聲進行整形為目的的方式被使用。相似地,信號的時序包絡可以通過分析信號 的時間結(jié)構(gòu)或者檢查關(guān)于頻率的信號頻譜的自動關(guān)聯(lián)直接地被提取。圖11表現(xiàn)的是圖4中的BCC合成器400范圍內(nèi)的圖10的包絡整形方案的示范性 應用。在本實施例中,有單一傳輸總和信號s(n),所述C個基信號通過復制那個總和來產(chǎn) 生,并且包絡整形被單獨地應用到不同的基帶。在替換實施例中,延遲、校準和其他處理的 順序可以不同。此外,在替換實施例中,包絡整形并不限定為獨立地處理每個基帶。對于基 于卷積/濾波的實施來說使用頻帶的協(xié)方差來得到關(guān)于所述信號時序細微結(jié)構(gòu)的信息是 特別準確的。
在圖11(a)中時序處理分析器(TPA)1104與圖10中的包絡提取器1004相似,并 且每個時序處理器(TP) 1106與圖10中的包絡提取器1006、反包絡調(diào)節(jié)器1008和包絡調(diào)節(jié) 器1010的組合相似。圖11(b)為TPA1104的一個可能的基于時域的實施的框圖,其中所述基信號樣本 被平方(1110),然后被低通濾波(1112)以對所述基信號的時序包絡a進行特性化。圖11(c)為TP1106的一個可能的基于時域的實施的框圖,其中所述合成信號樣本 被平方(1114),然后被低通濾波(1116)以對所述合成信號的時序包絡b進行特性化。一個 校準因子(例如,sqrt(a/b))被產(chǎn)生,然后被應用到合成信號上以產(chǎn)生具有與所述原始基 通道的時序包絡大體上相等的時序包絡的輸出信號。在TPA1104和TP1106的替換實施中,通過使用量值操作而不是將所述信號樣本平 方而使所述時序包絡被特性化。在這樣的實施中,a/b的比率可以用作校準因子而不用進 行平方根的操作。雖然圖11(c)中的所述校準操作對應于TP處理的基于時域的實施,但是TP處理 (又TPA和反TP(ITP)處理)也能使用頻域信號,如圖17 18(后面描述)中的實施例中 的,進行實施。這樣,為了本說明書的目的,術(shù)語“校準函數(shù)”應該被理解為覆蓋時域或者頻 域操作,例如圖18(b)和(c)中的濾波操作。通常,TPA1104和TP1106優(yōu)選地被設計以便其不修改信號功率(S卩,能量)。根據(jù) 特殊實施,該信號功率可以是每個通道的短時間平均信號功率,例如,基于合成窗定義的時 間段里的每通道的總信號功率或者一些其他合適的功率量。這樣,ICLD合成(例如使用乘 法器408)的校準能夠在包絡整形之前或之后應用。注意到在圖11(a)中,每個通道有兩個輸出,其中TP處理只被應用到他們其中的 一個。這反映出ICC合成方案,該方案混合兩個信號分量未修改的和正交的信號,其中未 修改的和正交的信號的比率決定ICC。在圖11(a)所示的實施例中,TP只被應用到正交的 信號分量上,其中總和節(jié)點1108將未修改信號分量和相應的時序整形的正交的信號分量
重新組合。圖12表現(xiàn)了圖4中的BCC合成器400范圍內(nèi)的圖10中的包絡整形方案的替換 示范性實施,其中包絡整形被應用到時域中。這樣的實施例可以被保證,當頻譜表示,其中 ICTD、ICLD和ICC被執(zhí)行,的時間分辨率對于通過加強需要的時序包絡來有效阻止“前回 響”的時候。例如,這會是一種情況,當BCC實施短時間傅立葉變換(STFT)的時候。如圖12(a)所示,TPA1204和每個TP1206在時域被實施,其中全基帶信號被校準 以便其具有期望的時序包絡(例如,從傳輸總和信號評估的包絡)。圖12(b)和(c)為與圖 1Kb)和(c)所示相似的TPA1204和TP1206的可能的實施。在此實施例中,TP處理被應用到所述輸出信號,而不僅是正交信號分量。在替換 實施例中,如果希望的話,基于時域的TP處理能夠被僅應用到正交信號分量上,其中未修 改和正交的基頻帶將會被轉(zhuǎn)換到具有分開的反向濾波庫的時域。由于BCC輸出信號的全頻帶校準可以導致人為現(xiàn)象,所以包絡整形可以只在指定 的頻率應用,例如,頻率高于某個截止頻率fTP(例如,500Hz)。注意到用于分析(TPA)的頻 率范圍可以與用于合成(TP)的頻率范圍不同。圖13(a)和(b)為TPA1204和TP1206的可能的實施,其中包絡整形只在高于所述截止頻率fTP的頻率應用。特別地,圖13(a)示出了高通濾波器1302的附加部分,其在時序 包絡特性化之前濾出低于fTP的頻率。圖13為具有在兩個基頻帶之間的fTP的截止頻率的 兩頻帶濾波庫1304,其中只有高頻部分被時序整形。兩頻帶反向濾波庫1306然后將低頻部 分與時序整形的高頻部分進行重新組合以產(chǎn)生所述輸出信號。圖14表現(xiàn)的是所在2004年4月1日申請的代理人號是Baumgarte 7-12的美國 申請?zhí)枮?0/815,591號申請描述的基于后期回響ICC合成方案的范圍內(nèi)的圖10種的包絡 整形方案的示范性應用。在此實施例中,TPA1404和每個TP1406在時域中應用,如圖12或 圖13所示,但是其中每個TP1406被應用到來自不同的后期回響(LR)區(qū)塊1402的輸出上。圖15所示的為根據(jù)本發(fā)明的實施例的表示BCC解碼器1500至少一個部分的框 圖,其可以與圖10所示的方案進行替換。在圖15中,BCC合成區(qū)塊1502、包絡提取器1504 和包絡調(diào)節(jié)器1510與圖10中的BCC合成區(qū)塊1002、包絡提取器1004和包絡調(diào)節(jié)器1010 相似。在圖15中,然而,反包絡調(diào)節(jié)器1508在BCC合成之前被應用,而不是BCC合成之后, 如圖10所示。這樣,反包絡調(diào)節(jié)器1508在BCC合成應用之前對基通道進行平滑處理。圖16所示為根據(jù)本發(fā)明的實施例的表示BCC解碼器1600至少一部分的框圖,其 可以與圖10和圖15所示的方案互換。在圖16中,包絡提取器1604和包絡調(diào)節(jié)器1610與 圖15中的包絡提取器1504和包絡調(diào)節(jié)器1510相似。在圖15中的實施例,然而,合成區(qū) 塊,1602表示與圖16所示的相似的基于后期回響的ICC合成。在這種情況下,包絡整形只 被應用到不關(guān)聯(lián)的后期回響信號,并且總和節(jié)點1612將時序整形的后期回響信號加到所 述原始基通道(其具有期望的時序包絡)。要注意的是,在這種情況下,不需要使用反包絡 調(diào)節(jié)器,因為后期回響信號具有在區(qū)塊1602中的產(chǎn)生處理中生成的大約平的時序包絡。圖17為圖4中的BCC合成器400的范圍內(nèi)的圖15中的包絡整形方案的示范性應 用。在圖17中,TPA1704、反TP(ITP) 1708和TP1710與圖15中的包絡提取器1504、反包絡 調(diào)節(jié)器1508和包絡調(diào)節(jié)器1510相似。在此基于頻率的實施例中,通過對沿著頻率軸的(例如,STFT)濾波庫402的頻率 碼使用卷積來進行發(fā)散聲音的包絡整形。在此可參考美國專利5,781,888 (Herre)和美國 專利5,812,971 (Herre),其啟示在此飲用作為參考,其主題與這項技術(shù)相關(guān)。圖18 (a)表現(xiàn)的是圖17中的TPA1704的可能的實施地框圖。在此實施中,TPA1704 作為線性預測編碼(LPC)分析操作被實施,其決定最合適的預測系數(shù)用于一系列有關(guān)頻率 的頻譜系數(shù)。這種LPC分析技術(shù)是眾所周知的,例如,從語音編碼和很多用于LPC系數(shù)的有 效計算的算法可知,例如自動關(guān)聯(lián)方法(涉及信號自動關(guān)聯(lián)函數(shù)和后續(xù)levinson-Durbin 遞歸)。作為這個計算的結(jié)果,一套LPC系數(shù)在表示信號時序包絡的輸出是可用的。圖18(b)和(c)表示的是圖17的ITP1708和TP1710的可能實施的框圖。在這兩 個實施中,將要處理的信號的頻譜系數(shù)以頻率的順序(增加或減小)被處理,其在此通過旋 轉(zhuǎn)開關(guān)電路被符號化,通過預先濾波處理(在此處理之后再次回來)將這些系數(shù)轉(zhuǎn)化為一 系列用于處理的順序。在ITP1708的情況下,預先濾波計算預留量并以這種方式平滑所述 時序信號包絡。在TP1710的情況下,所述反濾波器從TPA1704重新引入LPC系數(shù)表示的所 述時序包絡。對于通過TPA1704的信號時序包絡的計算,重要的是消除濾波庫402的分析窗的 影響,如果使用這樣的窗。這可以通過以分析窗整形標準化結(jié)果包絡或使用分開的不使用分析窗的分析濾波庫來實現(xiàn)。圖17中的基于卷積/濾波技術(shù)也可以在圖16中的包絡整形方案的范圍內(nèi)應用, 其中包絡提取器1604和包絡調(diào)節(jié)器1610分別基于圖18(a)的TPA和圖18(c)的TP。(另外可替換實施例)BCC解碼器能夠被設計用于選擇地開啟/關(guān)閉包絡整形。例如當合成信號的時序 包絡充分地波動時,BCC解碼器能夠應用傳統(tǒng)的BCC合成方案和開啟包絡整形,以便包絡整 形的好處大于任何包絡整形產(chǎn)生的人為影響。該開啟/關(guān)閉控制可以通過以下方式實現(xiàn)(1)瞬時現(xiàn)象檢測如果檢測到瞬時現(xiàn)象,那么TP處理被啟動。瞬時現(xiàn)象檢測能 夠以展望的方式實施以在瞬時現(xiàn)象之前和之后立刻有效的即對瞬時現(xiàn)象整形也能對信號 整形。檢測瞬時現(xiàn)象可能的方式包括當有指示瞬時現(xiàn)象發(fā)生的突然的功率上的增加出現(xiàn)時,觀察傳輸BCC總和信號的 時序包絡以進行檢測;和檢查預先(LPC)濾波器的倍率。如果LPC預先倍率超出指定的閥值,則可設想信 號為瞬時現(xiàn)象或高波動。LPC的分析關(guān)于頻譜自動關(guān)聯(lián)被計算。(2)隨機檢測當時序包絡隨機假波動時,存在一些情景。在這些情景中,沒有瞬 時現(xiàn)象被檢測到,但是TP處理可以仍然被實施(例如,相應于這種情景的熱烈鼓掌的信 號)。另外,在某些實施中,為了阻止可能的音調(diào)信號的人為影響,當傳輸總和信號為高 時,TP處理不被實施。此外,相似的方法可以在BCC編碼器中使用以在TP處理應該被激活時進行檢測。 因為編碼器可以訪問所有原始輸入信號,其可以使用更精密的算法(例如,評估區(qū)塊208的 一部分)以便在TP處理應該啟動時進行決定。這個決定的結(jié)果(當TP應該被激活時,發(fā) 出信號)能夠被傳輸?shù)紹CC解碼器(例如,圖2中的輔助信息的一部分)。雖然本發(fā)明已就BCC編碼方面被描述,其中具有單一總和信號,本發(fā)明也可在具 有兩個或多個總和信號的BCC編碼方面被實施,在此情形下,用于每一個不同“基礎(chǔ)”的總 和信號的時序包絡可于施加BCC合成前被評估,且不同的BCC輸出通道可基于不同的時序 包絡被產(chǎn)生,根據(jù)總和信號被用以合成不同輸出通道,輸出通道從兩個或多個總和通道被 合成可基于有效的時序包絡被產(chǎn)生,所述時序包絡將所述構(gòu)成總和通道的相對效果列入考 慮(例如,通過加權(quán)平均)。雖然本發(fā)明已描述了涉及ICTD、ICLD和ICC碼的BCC碼的方面,本發(fā)明也可在僅 涉及這三種碼(例如,ICLD、ICC而非ICTD)類型中的一個或兩個的BCC碼方面實施和/或 額外碼類型中的一個或多個,而且,BCC合成處理的順序與包絡整形可在不同實施中變化, 例如,當包絡整形被施加至頻域信號,如圖14與16,包絡整形可于ICTD合成(于那些使用 ICTD合成的實施例中)后但先于ICLD合成另外被實施,在其它實施例中,包絡整形于任何 其它BCC合成被施加前可被施加至上混信號。雖然本發(fā)明已在BCC編碼方案方面進行了描述,本發(fā)明也可在其它音頻處理方面 實施,其中音頻信號被去相關(guān)或需要去相關(guān)信號的其它音頻處理。雖然本發(fā)明已在實施方面進行了描述,其中編碼器在時域中接收輸入音頻信號, 且在時域中產(chǎn)生傳輸音頻信號,且解碼器在時域中接收傳輸音頻信號,且在時域中產(chǎn)生回放音頻信號,本發(fā)明不限于此,例如,在其它實施中,任意一個或多個輸入、傳輸和回放音頻 信號可被表示于頻域中。BCC編碼器和/或解碼器可與多種不同應用或系統(tǒng)連接或被并入多種不同應用或 系統(tǒng)中,包含用于電視或電子音樂發(fā)布、電影院、廣播、流向和/或接收的系統(tǒng),這些包含系 統(tǒng)用于編碼/解碼傳輸通過,例如,地面、衛(wèi)星、有線電視、因特網(wǎng)、網(wǎng)間網(wǎng)絡或物理媒介(例 如,磁盤、數(shù)字磁盤、半導體芯片、硬盤、記憶卡和相類物),BCC編碼器和/或解碼器也可被 使用于游戲與游戲系統(tǒng)中,包含,例如,想要與娛樂用的使用者互動的交互式軟件產(chǎn)品和/ 或可被出版用于多項機器、平臺或媒介的教育,進而BCC編碼器和/或解碼器可被并入于 PC軟件應用,其是結(jié)合數(shù)字解碼(例如,播放機、解碼器)和結(jié)合數(shù)字編碼能力的軟件應用 (例如,編碼器、錄音器、自動點唱機)。本發(fā)明可以以基于電路的制程被實現(xiàn),包含作為單一集成電路(如,ASIC或 FPGA)、多芯片模塊、單一卡片或多卡電路組的可能的實施,其對本領(lǐng)域技術(shù)人員電路組件 的各種功能也可如軟件程序的處理步驟被實施將是明顯的,這些軟件也可被使用于例如, 數(shù)字信號處理器、微控制器或一般計算機。本發(fā)明也可具體表現(xiàn)在方法和用以實施這些方法的設備中,本發(fā)明也可被具體實 施在包含在實體媒介的程序代碼中,如磁盤、CD-ROMs、硬盤或任何其它機器可讀取儲存媒 體,其中當程序代碼被加載且通過機器如計算機執(zhí)行,所述機器變成用以實施本發(fā)明的設 備,本發(fā)明也可被具體表現(xiàn)于程序代碼,例如,是否儲存在儲存媒體、通過機器加載或執(zhí)行 或傳輸經(jīng)過一些傳輸媒體或載體,如以電線或有線、通過光纖或通過電磁輻射,其中,當程 序代碼通過機器如計算機被加載和執(zhí)行,所述機器變成用以實施本發(fā)明的設備,當在一般 處理器上實施時,所述程序代碼區(qū)段結(jié)合所述處理器用以提供特殊裝置,其操作為類似于 特定邏輯電路。它將進而了解到在細節(jié)、材料與已描述和說明以便解釋本發(fā)明的本質(zhì)的零件配置 上的各種變化,對本領(lǐng)域技術(shù)人員來說,可無需脫離本發(fā)明表示在以下的權(quán)利要求書而實 現(xiàn)。雖然以下方法權(quán)利要求書中的步驟,若有的話,可以特定順序和相應的標示被詳 述,除非所述權(quán)利要求書詳述另外暗指特定順序用以實施這些步驟的一些或全部,這些步 驟不必被限定為以所述特定順序被實施。
19
權(quán)利要求
一種用于對C個輸入音頻通道進行編碼以產(chǎn)生E個傳輸音頻通道的方法,該方法包括為所述C個輸入通道中的兩個或多個產(chǎn)生一個或多個提示碼;將所述C個輸入通道下混以產(chǎn)生所述E個傳輸通道,其中C>E≥1;和對所述C個輸入通道中和所述E個傳輸通道中的一個或多個進行分析以產(chǎn)生一個標記,所述標記在所述E個傳輸通道解碼期間用來指示所述E個傳輸通道的解碼器是否執(zhí)行包絡整形,所述分析步驟包括以用于展望方式在所述解碼器中對不僅瞬時現(xiàn)象,而且在所述瞬時現(xiàn)象前后的信號進行整形的瞬時現(xiàn)象檢測,當檢測到瞬時現(xiàn)象時設置標記,或包括用于檢測是否時序包絡是以假的隨機方式的波動的隨機檢測,當時序包絡是以假的隨機方式的波動時,設置所述標記,或包括用于當E個傳輸通道是音調(diào)時不設置所述標記的音調(diào)檢測。
2.如權(quán)利要求1所述的發(fā)明,其中所述包絡整形對由所述解碼器產(chǎn)生的解碼后通道的 時序包絡進行調(diào)整以便大體上與相應的傳輸通道的時序包絡大體上匹配。
3.一種用于對C個輸入音頻通道進行編碼以產(chǎn)生E個傳輸音頻通道的設備,該設備包括用于為所述C個輸入通道中的兩個或多個產(chǎn)生一個或多個提示碼的裝置; 用于將所述C個輸入通道進行下混以產(chǎn)生所述E個傳輸通道的裝置,其中C > E > 1 ;禾口用于對所述C個輸入通道中的一個或多個和所述E個傳輸通道中的一個或多個進行 分析以產(chǎn)生一個標記的裝置,所述標記在所述E個傳輸通道解碼期間用來指示所述E個傳 輸通道的解碼器是否執(zhí)行包絡整形,所述用于分析的裝置包括以用于展望方式在所述解碼 器中對不僅瞬時現(xiàn)象,而且在所述瞬時現(xiàn)象前后的信號進行整形的瞬時現(xiàn)象檢測,當檢測 到瞬時現(xiàn)象時設置標記,或包括用于檢測是否時序包絡是以假的隨機方式的波動的隨機檢 測,當時序包絡是以假的隨機方式的波動時,設置所述標記,或包括用于當E傳輸通道是音 調(diào)時不設置所述標記的音調(diào)檢測。
4.如權(quán)利要求3所述的設備,其中用于產(chǎn)生的裝置包括代碼評估器;和 其中用于下混的裝置包括下混器。
5.如權(quán)利要求4所述的發(fā)明,其中所述設備為從數(shù)字放影機、數(shù)字音頻播放機、計算機、衛(wèi)星發(fā)送器、有線發(fā)送器、陸地廣 播發(fā)送器、家用娛樂系統(tǒng)與電影劇院系統(tǒng)組成的組的系統(tǒng);及 所述系統(tǒng)包括所述代碼評估器和所述下混器。
6.通過對C個輸入音頻通道進行編碼以產(chǎn)生E個傳輸音頻通道而產(chǎn)生的編碼后的音頻 比特流,其中為所述C個輸入通道中的兩個或多個產(chǎn)生一個或多個提示碼; 對所述C個輸入通道進行下混以產(chǎn)生E個傳輸通道,其中C > E > 1 ; 通過對所述C個輸入通道中和所述E個傳輸通道中的一個或多個進行分析而產(chǎn)生的標 記,其中所述標記用來指示所述E個傳輸通道的解碼器是否執(zhí)行包絡整形;所述標記通過 以用于展望方式在所述解碼器中對不僅瞬時現(xiàn)象,而且在所述瞬時現(xiàn)象前后的信號進行整形的瞬時現(xiàn)象檢測進行檢測,當檢測到瞬時現(xiàn)象時設置標記,或包括用于檢測是否時序包 絡是以假的隨機方式的波動的隨機檢測,當時序包絡是以假的隨機方式的波動時,設置所 述標記,或包括用于當E傳輸通道是音調(diào)時不設置所述標記的音調(diào)檢測,和所述E個傳輸通道、一個或多個提示碼和所述標記被編 碼到所屬編碼后音頻比特流中。
全文摘要
將具有輸入時序包絡的輸入音頻信號轉(zhuǎn)換成具有輸出時序包絡的輸出音頻信號。所述輸入音頻信號的輸入時序包絡被特性化。所述輸入音頻信號被處理以產(chǎn)生處理后音頻信號,其中所述的處理將所述輸入音頻信號進行去關(guān)聯(lián)。所述處理后音頻信號基于特性化的輸入時序包絡被調(diào)整以產(chǎn)生所述輸出音頻信號,其中所述輸出時序包絡大體上與所述輸入時序包絡相匹配。
文檔編號H04S3/02GK101853660SQ20101013845
公開日2010年10月6日 申請日期2005年9月12日 優(yōu)先權(quán)日2004年10月20日
發(fā)明者于爾根·赫勒, 克里斯托夫·法勒, 埃里克·阿拉曼奇, 薩沙·迪施 申請人:弗勞恩霍夫應用研究促進協(xié)會;艾格瑞系統(tǒng)有限公司