亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多通道音頻信號(hào)的參數(shù)編碼和解碼的制作方法

文檔序號(hào):11635848閱讀:517來(lái)源:國(guó)知局
多通道音頻信號(hào)的參數(shù)編碼和解碼的制造方法與工藝

相關(guān)申請(qǐng)的交叉引用

本申請(qǐng)要求于2014年10月31日提交的美國(guó)臨時(shí)專(zhuān)利申請(qǐng)no.62/073,642和2015年3月4日提交的美國(guó)臨時(shí)專(zhuān)利申請(qǐng)no.62/128,425的優(yōu)先權(quán),其每一個(gè)的全部?jī)?nèi)容通過(guò)引用合并入本文。

本文公開(kāi)的發(fā)明一般性涉及音頻信號(hào)的參數(shù)編碼和解碼,并且特別涉及基于通道的音頻信號(hào)的參數(shù)編碼和解碼。



背景技術(shù):

包括多個(gè)揚(yáng)聲器的音頻回放系統(tǒng)經(jīng)常用于再現(xiàn)由多通道音頻信號(hào)表示的音頻場(chǎng)景,其中,所述多通道音頻信號(hào)的各個(gè)通道在相應(yīng)的揚(yáng)聲器上回放。例如,多通道音頻信號(hào)可以經(jīng)由多個(gè)聲換能器被記錄,或者可以由音頻創(chuàng)作設(shè)備生成。在許多情況下,存在對(duì)于將音頻信號(hào)發(fā)送至回放設(shè)備的帶寬限制和/或?qū)τ谟糜趯⒁纛l信號(hào)存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中或便攜式存儲(chǔ)裝置中的有限空間。存在用于音頻信號(hào)的參數(shù)編碼的音頻編碼系統(tǒng),以便減少帶寬或存儲(chǔ)大小。在編碼器側(cè),這些系統(tǒng)通常將多通道音頻信號(hào)下混合成通常是單通道(單通道)或立體聲(雙通道)下混合的下混信號(hào),并且借助于參數(shù)像電平差和互相關(guān)來(lái)提取描述通道特性的邊信息。然后,下混合和邊信息被編碼并發(fā)送至解碼器側(cè)。在解碼器側(cè),在邊信息的參數(shù)的控制下,從下混合重構(gòu)即近似多通道音頻信號(hào)。

鑒于可用于包括針對(duì)家庭中終端用戶(hù)的新興領(lǐng)域的回放多通道音頻內(nèi)容的廣泛的不同類(lèi)型的裝置和系統(tǒng),需要新的和替代的方式來(lái)對(duì)多通道音頻內(nèi)容進(jìn)行高效地編碼,以便減少帶寬要求和/或存儲(chǔ)所需的存儲(chǔ)大小,便于在解碼器側(cè)重構(gòu)多通道音頻信號(hào),以及/或者增加如在解碼器側(cè)重構(gòu)的多通道音頻信號(hào)的保真度。

附圖說(shuō)明

在下文中,將更詳細(xì)地并參照附圖描述示例實(shí)施方式,在附圖中:

圖1和圖2是根據(jù)示例實(shí)施方式的用于將m通道音頻信號(hào)編碼為雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)的編碼部的一般性框圖;

圖3是根據(jù)示例實(shí)施方式的包括圖1所示的編碼部的音頻編碼系統(tǒng)的一般性框圖;

圖4和圖5是根據(jù)示例實(shí)施方式的用于將m通道音頻信號(hào)編碼為雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)的音頻編碼方法的流程圖;

圖6至圖8示出了根據(jù)示例實(shí)施方式的將11.1通道(或7.1+4通道或7.1.4通道)音頻信號(hào)劃分成由各個(gè)下混通道表示的通道組的替選方式;

圖9是根據(jù)示例實(shí)施方式的用于基于雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)來(lái)重構(gòu)m通道音頻信號(hào)的解碼部的一般性框圖。

圖10是根據(jù)示例實(shí)施方式的包括圖9所示的解碼部的音頻解碼系統(tǒng)的一般性框圖;

圖11是根據(jù)示例實(shí)施方式的包括在圖9所示的解碼部中的混合部的一般性框圖;

圖12是根據(jù)示例實(shí)施方式的用于基于雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)來(lái)重構(gòu)m通道音頻信號(hào)的音頻解碼方法的流程圖;

圖13是根據(jù)示例實(shí)施方式的用于基于5.1通道信號(hào)和相關(guān)聯(lián)的上混參數(shù)重構(gòu)13.1通道音頻信號(hào)的解碼部的一般性框圖;

圖14是編碼部的一般性框圖,所述編碼部被配置成:確定要用于對(duì)m通道音頻信號(hào)(以及可能的另外的通道)進(jìn)行編碼的適當(dāng)編碼格式,并且對(duì)于所選擇的格式將m通道音頻信號(hào)表示為雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù);

圖15是圖14所示的編碼部中的雙模式下混部的細(xì)節(jié);

圖16是圖14所示的編碼部中的雙模式分析部的細(xì)節(jié);以及

圖17是可以由圖14至圖16所示的部件執(zhí)行的音頻編碼方法的流程圖。

所有附圖是示意性的,并且通常僅示出了為了闡明本發(fā)明所必需的部分,而可以省略其或僅暗示他部分。

具體實(shí)施方式

如本文所使用的,“音頻信號(hào)”可以是獨(dú)立音頻信號(hào)、視聽(tīng)信號(hào)或多媒體信號(hào)的音頻部分、或者與元數(shù)據(jù)結(jié)合的任意一個(gè)。如本文所使用的,“通道”是與預(yù)定義/固定的空間位置/取向或未定義的空間位置如“左”或“右”相關(guān)聯(lián)的音頻信號(hào)。

一、概述——解碼器側(cè)

根據(jù)第一方面,示例實(shí)施方式提出了一種音頻解碼系統(tǒng)、音頻解碼方法以及相關(guān)聯(lián)的計(jì)算機(jī)程序產(chǎn)品。根據(jù)第一方面的提出的解碼系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品通??梢怨灿邢嗤奶卣骱蛢?yōu)點(diǎn)。

根據(jù)示例實(shí)施方式,提供了一種音頻解碼方法,其包括接收雙通道下混信號(hào)和用于基于下混信號(hào)進(jìn)行m通道音頻信號(hào)的參數(shù)重構(gòu)的上混參數(shù),其中m≥4。音頻解碼方法包括接收指示m通道音頻信號(hào)的至少兩種編碼格式中的所選擇的一種編碼格式的信令,其中,編碼格式與各個(gè)不同劃分對(duì)應(yīng),所述劃分將m通道音頻信號(hào)的通道分到相應(yīng)的第一組和第二組的一個(gè)或更多個(gè)通道中。在所指示的編碼格式下,下混信號(hào)的第一通道與m通道音頻信號(hào)的第一組的一個(gè)或更多個(gè)通道的線性組合對(duì)應(yīng),并且下混信號(hào)的第二通道與m通道音頻信號(hào)的第二組的一個(gè)或更多個(gè)通道的線性組合對(duì)應(yīng)。音頻解碼方法還包括:基于所指示的編碼格式確定預(yù)去相關(guān)系數(shù)集合;將去相關(guān)輸入信號(hào)計(jì)算為下混信號(hào)的線性映射,其中,所述預(yù)去相關(guān)系數(shù)集合被應(yīng)用于下混信號(hào);基于去相關(guān)輸入信號(hào)生成去相關(guān)信號(hào);基于所接收的上混參數(shù)和所指示的編碼格式,確定第一類(lèi)型上混系數(shù)(本文中被稱(chēng)為濕上混系數(shù))集和第二類(lèi)型上混系數(shù)(本文中被稱(chēng)為干上混系數(shù))集;將第一類(lèi)型上混信號(hào)(本文中被稱(chēng)為干上混信號(hào))計(jì)算為下混信號(hào)的線性映射,其中,所述干上混系數(shù)集合被應(yīng)用于下混信號(hào);將第二類(lèi)型上混信號(hào)(本文中被稱(chēng)為濕上混信號(hào))計(jì)算為去相關(guān)信號(hào)的線性映射,其中,所述濕上混系數(shù)集合被應(yīng)用于去相關(guān)信號(hào);以及組合干上混信號(hào)和濕上混信號(hào)以獲得與要重構(gòu)的m通道音頻信號(hào)對(duì)應(yīng)的多維重構(gòu)信號(hào)。

取決于m通道音頻信號(hào)的音頻內(nèi)容,將m通道音頻信號(hào)的通道分到第一組和第二組(其中,每個(gè)組對(duì)下混信號(hào)的通道有貢獻(xiàn))中的不同劃分可以適合于:例如有利于從下混信號(hào)重構(gòu)m通道音頻信號(hào),提高從下混信號(hào)重構(gòu)的m通道音頻信號(hào)的(感知)保真度,以及/或者提高下混信號(hào)的編碼效率。音頻解碼方法接收指示編碼格式中的所選擇的一種編碼格式的信令以及使預(yù)去相關(guān)系數(shù)以及濕上混系數(shù)和干上混系數(shù)的確定適應(yīng)于所指示的編碼格式的能力,允許例如基于m通道音頻信號(hào)的音頻內(nèi)容在編碼器側(cè)選擇編碼格式,以用于利用采用該特定編碼格式的比較優(yōu)勢(shì)來(lái)表示m通道音頻信號(hào)。

特別地,基于所指示的編碼格式確定預(yù)去相關(guān)系數(shù)可以允許在生成去相關(guān)的信號(hào)之前,基于所指示的編碼格式來(lái)選擇和/或衡量從其生成去相關(guān)信號(hào)的下混信號(hào)的通道或多個(gè)通道。因此,音頻解碼方法對(duì)于不同的編碼格式不同地確定預(yù)去相關(guān)系數(shù)的能力可以允許提高如重構(gòu)的m通道音頻信號(hào)的保真度。

下混信號(hào)的第一通道可以例如根據(jù)所指示的編碼格式例如在編碼器側(cè)形成為第一組的一個(gè)或更多個(gè)通道的線性組合。類(lèi)似地,下混信號(hào)的第二通道可以例如根據(jù)所指示的編碼格式在編碼器側(cè)形成為第二組的一個(gè)或更多個(gè)通道的線性組合。

m通道音頻信號(hào)的通道可以例如形成一起表示聲場(chǎng)的較大量通道的子集。

去相關(guān)信號(hào)用于增加如收聽(tīng)者所感知的下混信號(hào)的音頻內(nèi)容的維度。生成去相關(guān)信號(hào)可以例如包括將線性濾波器應(yīng)用于去相關(guān)輸入信號(hào)。

將去相關(guān)輸入信號(hào)計(jì)算為下混信號(hào)的線性映射指的是通過(guò)對(duì)下混信號(hào)應(yīng)用第一線性變換來(lái)獲得去相關(guān)輸入信號(hào)。該第一線性變換采用下混信號(hào)的兩個(gè)通道作為輸入,并且提供去相關(guān)輸入信號(hào)的通道作為輸出,并且預(yù)去相關(guān)系數(shù)是限定該第一線性變換的定量性質(zhì)的系數(shù)。

將干上混信號(hào)計(jì)算為下混信號(hào)的線性映射指的是通過(guò)對(duì)下混信號(hào)應(yīng)用第二線性變換來(lái)獲得干上混信號(hào)。該第二線性變換采用下混信號(hào)的兩個(gè)通道作為輸入,并且提供m個(gè)通道作為輸出,并且干上混系數(shù)是限定該第二線性變換的定量性質(zhì)的系數(shù)。

將濕上混信號(hào)計(jì)算為去相關(guān)信號(hào)的線性映射指的是通過(guò)對(duì)去相關(guān)信號(hào)應(yīng)用第三線性變換來(lái)獲得濕上混信號(hào)。該第三線性變換采用去相關(guān)信號(hào)的通道作為輸入,并且提供m個(gè)通道作為輸出,并且濕上混系數(shù)是限定該第三線性變換的定量性質(zhì)的系數(shù)。

組合干上混信號(hào)和濕上混信號(hào)可以包括將來(lái)自干上混信號(hào)的各個(gè)通道的音頻內(nèi)容添加至濕上混信號(hào)的各個(gè)對(duì)應(yīng)通道的音頻內(nèi)容,例如在逐樣本或逐變換系數(shù)的基礎(chǔ)上采用加法混合。

信令可以例如與下混信號(hào)和/或上混參數(shù)一起被接收。下混信號(hào)、上混參數(shù)和信令可以例如從比特流中提取。

在示例實(shí)施方式中,可以保持m=5,即,m通道音頻信號(hào)可以是五通道音頻信號(hào)。本示例實(shí)施方式的音頻解碼方法可以例如用于從這五個(gè)通道的雙通道下混合重構(gòu)當(dāng)前建立的5.1音頻格式之一的五個(gè)常規(guī)通道,或用于從這五個(gè)通道的雙通道下混合重構(gòu)11.1多通道音頻信號(hào)中的左側(cè)或右側(cè)的五個(gè)通道??商孢x地,可以保持m=4或m≥6。

在示例實(shí)施方式中,去相關(guān)輸入信號(hào)和去相關(guān)信號(hào)可以各自包括m-2個(gè)通道。在本示例實(shí)施方式中,可以基于去相關(guān)輸入信號(hào)的不超過(guò)一個(gè)的通道來(lái)生成去相關(guān)信號(hào)的通道。例如,可以基于去相關(guān)輸入信號(hào)的不超過(guò)一個(gè)的通道來(lái)生成去相關(guān)信號(hào)的每個(gè)通道,但是可以例如基于去相關(guān)輸入信號(hào)的不同通道來(lái)生成去相關(guān)信號(hào)的不同通道。

在本示例實(shí)施方式中,預(yù)去相關(guān)系數(shù)可以被確定成使得在每種編碼格式下,去相關(guān)輸入信號(hào)的通道接收來(lái)自下混信號(hào)的不超過(guò)一個(gè)的通道的貢獻(xiàn)。例如,預(yù)去相關(guān)系數(shù)可以被確定成使得在每種編碼格式下,去相關(guān)輸入信號(hào)的每個(gè)通道與下混信號(hào)的通道一致。然而,應(yīng)當(dāng)理解,去相關(guān)輸入信號(hào)的通道的至少一些可以例如在給定的編碼格式中和/或在不同的編碼格式中與下混信號(hào)的不同通道一致。

由于在每個(gè)給定的編碼格式中,下混信號(hào)的兩個(gè)通道表示不相交的第一組的一個(gè)或更多個(gè)通道和第二組的一個(gè)或更多個(gè)通道,所以第一組可以從下混信號(hào)的第一通道重構(gòu),例如采用基于下混信號(hào)的第一通道生成的去相關(guān)信號(hào)的一個(gè)或更多個(gè)通道,而第二組可以從下混信號(hào)的第二通道重構(gòu),例如采用基于下混信號(hào)的第二通道生成的去相關(guān)信號(hào)的一個(gè)或更多個(gè)通道。在本示例實(shí)施方式中,在每種編碼格式中可以避免從第二組的一個(gè)或更多個(gè)通道經(jīng)由去相關(guān)信號(hào)對(duì)第一組的一個(gè)或更多個(gè)通道的重構(gòu)版本的貢獻(xiàn)。類(lèi)似地,在每種編碼格式中可以避免從第一組的一個(gè)或更多個(gè)通道經(jīng)由去相關(guān)信號(hào)對(duì)第二組的一個(gè)或更多個(gè)通道的重構(gòu)版本的貢獻(xiàn)。因此,本示例實(shí)施方式可以允許增加所重構(gòu)的m通道音頻信號(hào)的保真度。

在示例實(shí)施方式中,預(yù)去相關(guān)系數(shù)可以被確定成使得在編碼格式的至少兩種編碼格式中m通道音頻信號(hào)的第一通道經(jīng)由下混信號(hào)對(duì)去相關(guān)輸入信號(hào)的第一固定通道產(chǎn)生貢獻(xiàn)。也就是說(shuō),在這兩種編碼格式中m通道音頻信號(hào)的第一通道可以經(jīng)由下混信號(hào)對(duì)去相關(guān)輸入信號(hào)的同一通道產(chǎn)生貢獻(xiàn)。應(yīng)當(dāng)理解,在本示例實(shí)施方式中,在給定的編碼格式中m通道音頻信號(hào)的第一通道可以例如經(jīng)由下混信號(hào)對(duì)去相關(guān)輸入信號(hào)的多個(gè)通道產(chǎn)生貢獻(xiàn)。

在本示例實(shí)施方式中,如果所指示的編碼格式在兩種編碼格式之間切換,則在切換期間保持去相關(guān)輸入信號(hào)的第一固定通道的至少一部分。這可以允許如由收聽(tīng)者在重構(gòu)的m通道音頻信號(hào)的回放期間所感知的編碼格式之間的較平滑和/或較不突然的轉(zhuǎn)變。特別地,發(fā)明人認(rèn)識(shí)到,由于去相關(guān)信號(hào)可能例如基于下混信號(hào)的與在其期間可能在下混信號(hào)中發(fā)生編碼格式之間的切換的若干時(shí)間幀對(duì)應(yīng)的一部分來(lái)生成,所以由于編碼格式之間切換可能潛在地在去相關(guān)信號(hào)中生成可聽(tīng)見(jiàn)的失真。即使響應(yīng)于編碼格式之間的切換來(lái)對(duì)濕上混系數(shù)和干上混系數(shù)進(jìn)行插值,在去相關(guān)信號(hào)中生成的失真仍然可以被存留在如重構(gòu)的m通道音頻信號(hào)中。提供根據(jù)本示例實(shí)施方式的去相關(guān)輸入信號(hào)允許抑制由編碼格式之間的切換引起的去相關(guān)信號(hào)中的這樣的失真,并且可以提高重構(gòu)的m通道音頻信號(hào)的回放質(zhì)量。

在示例實(shí)施方式中,預(yù)去相關(guān)系數(shù)可以被確定成使得另外地,在編碼格式中的至少兩種編碼格式中,m通道音頻信號(hào)的第二通道經(jīng)由下混信號(hào)對(duì)去相關(guān)輸入信號(hào)的第二固定通道產(chǎn)生貢獻(xiàn)。也就是說(shuō),在這兩種編碼格式中,m通道音頻信號(hào)的第二通道經(jīng)由下混信號(hào)對(duì)去相關(guān)輸入信號(hào)的同一通道產(chǎn)生貢獻(xiàn)。在本示例實(shí)施方式中,如果所指示的編碼格式在兩種編碼格式之間切換,則在切換期間保持第二固定去相關(guān)輸入信號(hào)的至少一部分。因此,僅單個(gè)去相關(guān)器饋送受編碼格式之間的轉(zhuǎn)變的影響。這可以允許如由收聽(tīng)者在重構(gòu)的m通道音頻信號(hào)的回放期間所感知的編碼格式之間的較平滑和/或較不突然的轉(zhuǎn)變。

m通道音頻信號(hào)的第一通道和第二通道可以例如彼此不同。去相關(guān)輸入信號(hào)的第一固定通道和第二固定通道可以例如彼此不同。

在示例實(shí)施方式中,所接收的信令可以指示至少三種編碼格式中的所選擇的一種編碼格式,并且預(yù)去相關(guān)系數(shù)可以被確定成使得在編碼格式中的至少三種編碼格式中m通道音頻信號(hào)的第一通道經(jīng)由下混信號(hào)對(duì)去相關(guān)輸入信號(hào)的第一固定通道產(chǎn)生貢獻(xiàn)。也就是說(shuō),在這三種編碼格式中m通道音頻信號(hào)的第一通道經(jīng)由下混信號(hào)對(duì)去相關(guān)輸入信號(hào)的同一通道產(chǎn)生貢獻(xiàn)。在本示例實(shí)施方式中,如果所指示的編碼格式在三種編碼格式中的任意之間變化,則在切換期間保持去相關(guān)輸入信號(hào)的第一固定通道的至少一部分,這允許如由收聽(tīng)者在重構(gòu)的m通道音頻信號(hào)的回放期間所感知的編碼格式之間的較平滑和/或較不突然的轉(zhuǎn)變。

在示例實(shí)施方式中,預(yù)去相關(guān)系數(shù)可以被確定成使得在編碼格式中的至少兩種編碼格式中m通道音頻信號(hào)的通道對(duì)經(jīng)由下混信號(hào)對(duì)去相關(guān)輸入信號(hào)的第三固定通道產(chǎn)生貢獻(xiàn)。也就是說(shuō),在這兩種編碼格式中m通道音頻信號(hào)的這對(duì)通道經(jīng)由下混信號(hào)對(duì)去相關(guān)輸入信號(hào)的同一通道產(chǎn)生貢獻(xiàn)。在本示例實(shí)施方式中,如果所指示的編碼格式在兩種編碼格式之間切換,則在切換期間保持去相關(guān)輸入信號(hào)的第三固定通道的至少一部分,這允許如由收聽(tīng)者在重構(gòu)的m通道音頻信號(hào)的回放期間所感知的編碼格式之間的較平滑和/或較不突然的轉(zhuǎn)變。

這對(duì)通道可以例如與m通道音頻信號(hào)的第一通道和第二通道不同。去相關(guān)輸入信號(hào)的第三固定通道可以例如與去相關(guān)輸入信號(hào)的第一固定通道和第二固定通道不同。

在示例實(shí)施方式中,音頻解碼方法還可以包括:響應(yīng)于檢測(cè)到所指示的編碼格式從第一編碼格式到第二編碼格式的切換,執(zhí)行從與第一編碼格式相關(guān)聯(lián)的預(yù)去相關(guān)系數(shù)值到與第二編碼格式相關(guān)聯(lián)的預(yù)去相關(guān)系數(shù)值的逐漸轉(zhuǎn)變。在編碼格式之間的切換期間采用在預(yù)去相關(guān)系數(shù)之間的逐漸轉(zhuǎn)變?cè)试S如由收聽(tīng)者在重構(gòu)的m通道音頻信號(hào)的回放期間所感知的編碼格式之間的較平滑和/或較不突然的轉(zhuǎn)變。特別地,發(fā)明人認(rèn)識(shí)到,由于去相關(guān)信號(hào)可能例如基于下混信號(hào)的與在其期間可能在下混信號(hào)中發(fā)生編碼格式之間的切換的若干時(shí)間幀對(duì)應(yīng)的一部分來(lái)生成,所以由于編碼格式之間切換可能潛在地在去相關(guān)信號(hào)中生成可聽(tīng)見(jiàn)的失真。即使響應(yīng)于編碼格式之間的切換來(lái)對(duì)濕上混系數(shù)和干上混系數(shù)進(jìn)行插值,在去相關(guān)信號(hào)中生成的失真仍然可以被存留在重構(gòu)的m通道音頻信號(hào)中。提供根據(jù)本示例實(shí)施方式的去相關(guān)輸入信號(hào)允許抑制由編碼格式之間的切換引起的去相關(guān)信號(hào)中的這樣的失真,并且可以提高如重構(gòu)的m通道音頻信號(hào)的回放質(zhì)量。

可以例如經(jīng)由線性或連續(xù)插值來(lái)執(zhí)行逐漸轉(zhuǎn)變??梢岳缃?jīng)由具有有限變化率的插值來(lái)執(zhí)行逐漸轉(zhuǎn)變。

在示例實(shí)施方式中,音頻解碼方法還可以包括:響應(yīng)于檢測(cè)到所指示的編碼格式從第一編碼格式到第二編碼格式的切換,執(zhí)行從與第一編碼格式相關(guān)聯(lián)的包括零值系數(shù)的濕上混系數(shù)值和干上混系數(shù)值到與第二編碼格式相關(guān)聯(lián)的再次包括零值系數(shù)的濕上混系數(shù)值和干上混系數(shù)值的插值。注意,下混通道對(duì)應(yīng)于來(lái)自原始編碼的m通道音頻信號(hào)的通道的不同組合,使得在第一編碼格式下為零值的上混系數(shù)不需要在第二編碼格式下為零值,反之在第二編碼格式下為零值的上混系數(shù)也不需要在第一編碼格式下為零值。優(yōu)選地,插值作用于上混系數(shù),而不是系數(shù)的緊湊表示——例如下面討論的表示。

上混系數(shù)值之間的線性或連續(xù)插值可以例如用于提供如由收聽(tīng)者在重構(gòu)的m通道音頻信號(hào)的回放期間所感知的編碼格式之間的較平滑的轉(zhuǎn)變。

在與編碼格式之間的切換相關(guān)聯(lián)的特定時(shí)間點(diǎn)處用新的上混系數(shù)值代替舊的上混系數(shù)值的陡峭插值(steepinterpolation)可以例如允許提高重構(gòu)的m通道音頻信號(hào)的保真度,例如,在m通道音頻信號(hào)的音頻內(nèi)容快速變化并且在編碼器側(cè)編碼格式被切換的情況下,響應(yīng)于這些改變,用于提高重構(gòu)的m通道音頻信號(hào)的保真度。

在示例實(shí)施方式中,音頻解碼方法還可以包括:接收指示要用于一種編碼格式內(nèi)的濕上混參數(shù)和干上混參數(shù)的插值(即,當(dāng)在未出現(xiàn)編碼格式變化的時(shí)間段內(nèi)新值被分配給上混系數(shù)時(shí))的多個(gè)插值方案之一的信令;以及使用所指示的插值方案。指示多個(gè)插值方案之一的信令可以例如與下混信號(hào)和/或上混參數(shù)一起被接收。優(yōu)選地,由信令指示的插值方案還可以用于編碼格式之間的轉(zhuǎn)變。

在原始m通道音頻信號(hào)可用的編碼器側(cè),可以例如選擇特別適合于m通道音頻信號(hào)的實(shí)際音頻內(nèi)容的插值方案。例如,在平滑切換對(duì)于重構(gòu)的m通道音頻信號(hào)的總體效果而言是重要的的情況下,可以使用線性或連續(xù)插值;而當(dāng)快速切換對(duì)于重構(gòu)的m通道音頻信號(hào)的總體效果而言是重要的的情況下,可以采用陡峭插值,即在與編碼格式之間的轉(zhuǎn)變相關(guān)聯(lián)的特定時(shí)間點(diǎn)處用新的上混系數(shù)值代替舊的上混系數(shù)值。

在示例實(shí)施方式中,所述至少兩種編碼格式可以包括第一編碼格式和第二編碼格式。在每種編碼格式中存在控制m通道音頻信號(hào)的通道對(duì)下混信號(hào)的通道對(duì)應(yīng)的線性組合之一的貢獻(xiàn)的增益。在本示例實(shí)施方式中,在第一編碼格式下的增益可以與在第二編碼格式下控制m通道音頻信號(hào)的相同通道的貢獻(xiàn)的增益一致。

在第一編碼格式和第二編碼格式中采用相同的增益可以例如增加第一編碼格式下的下混信號(hào)的通道的組合音頻內(nèi)容與第二編碼格式下的下混信號(hào)的通道的組成音頻內(nèi)容之間的相似度。由于下混信號(hào)的通道用于重構(gòu)m通道下混信號(hào),所以這可以有助于如收聽(tīng)者所感知的這兩種編碼格式之間的較平滑的轉(zhuǎn)變。

在第一編碼格式和第二編碼格式中采用相同的增益可以例如允許第一編碼格式下的下混信號(hào)的相應(yīng)第一通道和第二通道的音頻內(nèi)容分別與第二編碼格式下的下混信號(hào)的相應(yīng)第一通道和第二通道的音頻內(nèi)容更加類(lèi)似。這可以有助于如收聽(tīng)者所感知的這兩種編碼格式之間的較平滑的轉(zhuǎn)變。

在本示例實(shí)施方式中,可以例如對(duì)m通道音頻信號(hào)的不同通道采用不同的增益。在第一示例中,第一編碼格式和第二編碼格式下的所有增益可以具有值1。在第一示例中,在第一編碼格式和第二編碼格式兩者下,下混信號(hào)的第一通道和第二通道可以分別與第一組的非加權(quán)和和第二組的非加權(quán)和對(duì)應(yīng)。在第二示例中,至少一些增益可以具有與1不同的值。在第二示例中,下混信號(hào)的第一通道和第二通道可以分別與第一組的加權(quán)和和第二組的加權(quán)和對(duì)應(yīng)。

在示例實(shí)施方式中,m通道音頻信號(hào)可以包括:表示m通道音頻信號(hào)的回放環(huán)境中的不同水平方向的三個(gè)通道,以及表示與回放環(huán)境中的三個(gè)通道的方向垂直分離的方向的兩個(gè)通道。換句話(huà)說(shuō),m通道音頻信號(hào)可以包括:旨在用于由位于與收聽(tīng)者(或收聽(tīng)者的耳朵)基本上相同的高度處的音頻源的回放和/或基本上水平地傳播的三個(gè)通道;以及旨在用于由位于其他高度的音頻源的回放和/或(基本上)非水平地傳播的兩個(gè)通道。所述兩個(gè)通道可以例如表示升高的方向。

在示例實(shí)施方式中,在第一編碼格式下,第二組通道可以包括表示與回放環(huán)境中的三個(gè)通道的方向垂直分離的方向的兩個(gè)通道。在回放環(huán)境中的豎直維度對(duì)于m通道音頻信號(hào)的總體效果是重要的的情況下,使這兩個(gè)通道在第二組中并且采用下混信號(hào)的相同通道來(lái)表示這兩個(gè)通道可以例如提高重構(gòu)的m通道音頻信號(hào)的保真度。

在示例實(shí)施方式中,在第一編碼格式下,第一組的一個(gè)或更多個(gè)通道可以包括表示m通道音頻信號(hào)的回放環(huán)境中的不同水平方向的三個(gè)通道,并且第二組的一個(gè)或更多個(gè)通道可以包括表示與回放環(huán)境中的三個(gè)通道的方向垂直分離的方向的兩個(gè)通道。在本示例實(shí)施方式中,第一編碼格式允許下混信號(hào)的第一通道表示上述三個(gè)通道并且允許下混信號(hào)的第二通道表示上述兩個(gè)通道,例如在回放環(huán)境中的豎直維度對(duì)于m通道音頻信號(hào)的總體效果是重要的的情況下,這可以提高重構(gòu)的m通道音頻信號(hào)的保真度。

在示例實(shí)施方式中,在第二編碼格式下,第一組和第二組中的每一個(gè)可以包括表示與m通道音頻信號(hào)的回放環(huán)境中的三個(gè)通道的方向垂直分離的方向的兩個(gè)通道之一。使這兩個(gè)通道在不同組中并且采用下混信號(hào)的不同通道來(lái)表示這兩個(gè)通道,例如在回放環(huán)境中的豎直維度對(duì)m通道音頻信號(hào)的總體效果不像那么重要的情況下,可以提高重構(gòu)的m通道音頻信號(hào)的保真度。

在示例實(shí)施方式中,在編碼格式(本文稱(chēng)為特定編碼格式)下,第一組的一個(gè)或更多個(gè)通道可以由n個(gè)通道組成,其中n≥3。在本示例實(shí)施方式中,響應(yīng)于所指示的編碼格式為特定編碼格式,預(yù)去相關(guān)系數(shù)可以被確定成使得基于下混信號(hào)的第一通道生成去相關(guān)信號(hào)的n-1個(gè)通道;并且干上混系數(shù)和濕上混系數(shù)可以被確定成使得將第一組的一個(gè)或更多個(gè)通道重構(gòu)為下混信號(hào)的第一通道和去相關(guān)信號(hào)的n-1個(gè)通道的線性映射,其中,干上混系數(shù)的子集被應(yīng)用于下混信號(hào)的第一通道,并且濕上混系數(shù)的子集被應(yīng)用于去相關(guān)信號(hào)的n-1個(gè)通道。

預(yù)去相關(guān)系數(shù)可以例如被確定成使得去相關(guān)輸入信號(hào)的n-1個(gè)通道與下混信號(hào)的第一通道一致??梢岳缤ㄟ^(guò)處理去相關(guān)輸入信號(hào)的這些n-1個(gè)通道來(lái)生成去相關(guān)信號(hào)的n-1個(gè)通道。

將第一組的一個(gè)或更多個(gè)通道重構(gòu)為下混信號(hào)的第一通道和去相關(guān)信號(hào)的n-1個(gè)通道的線性映射指的是通過(guò)對(duì)下混信號(hào)的第一通道和去相關(guān)信號(hào)的n-1個(gè)通道應(yīng)用線性變換來(lái)獲得第一組的一個(gè)或更多個(gè)通道的重構(gòu)版本。該線性變換采用n個(gè)通道作為輸入,并且提供n個(gè)通道作為輸出,其中,干上混系數(shù)的子集和濕上混系數(shù)的子集一起由限定該線性變換的定量性質(zhì)的系數(shù)組成。

在示例實(shí)施方式中,接收的上混參數(shù)可以包括第一類(lèi)型上混參數(shù)(本文中被稱(chēng)為濕上混參數(shù))以及第二類(lèi)型上混參數(shù)(本文中被稱(chēng)為干上混參數(shù))。在本示例實(shí)施方式中,在特定編碼格式下確定濕上混系數(shù)集合和干上混系數(shù)集合可以包括:基于干上混參數(shù)確定干上混系數(shù)的子集;基于所接收的濕上混參數(shù)填充具有比接收到的濕上混參數(shù)的數(shù)量多的元素的中間矩陣,并且確信該中間矩陣屬于預(yù)定義矩陣類(lèi);以及通過(guò)將中間矩陣乘以預(yù)定義矩陣來(lái)獲得濕上混系數(shù)的子集,其中,所述濕上混系數(shù)的子集與由上述相乘產(chǎn)生的矩陣對(duì)應(yīng),并且包括比中間矩陣中的元素的數(shù)量多的系數(shù)。

在本示例實(shí)施方式中,濕上混系數(shù)子集中的濕上混系數(shù)的數(shù)量大于接收到的濕上混參數(shù)的數(shù)量。通過(guò)利用預(yù)定義矩陣和預(yù)定義矩陣類(lèi)的知識(shí)從所接收的濕上混參數(shù)獲得濕上混系數(shù)的子集,可以減少對(duì)第一組的一個(gè)或更多個(gè)通道的參數(shù)重構(gòu)所需的信息量,從而允許減少與來(lái)自編碼器側(cè)的下混信號(hào)一起發(fā)送的元數(shù)據(jù)量。通過(guò)減少參數(shù)重構(gòu)所需的數(shù)據(jù)量,可以減少用于傳輸m通道音頻信號(hào)的參數(shù)表示所需的帶寬和/或用于存儲(chǔ)這樣的表示的所需的存儲(chǔ)大小。

預(yù)定義矩陣類(lèi)可以與對(duì)于類(lèi)中的所有矩陣有效的至少一些矩陣元素的已知屬性(如一些矩陣元素之間的某些關(guān)系,或者一些矩陣元素為零)相關(guān)聯(lián)。這些屬性的知識(shí)允許基于比中間矩陣中的矩陣元素的全部數(shù)量少的濕上混參數(shù)來(lái)填充中間矩陣。解碼器側(cè)具有至少以下知識(shí):基于較少的濕上混參數(shù)計(jì)算所有矩陣元素所需的元素的特性,和基于較少的濕上混參數(shù)計(jì)算所有矩陣元素所需的元素之間的關(guān)系。

在美國(guó)臨時(shí)專(zhuān)利申請(qǐng)no.61/974,544中的第16頁(yè)第15行至第20頁(yè)第2行更詳細(xì)地描述了如何確定和使用預(yù)定義矩陣和預(yù)定義矩陣類(lèi);第一署名發(fā)明人:larsvillemoes;申請(qǐng)日期:2014年4月3日。具體參見(jiàn)其中具體式(9)中的預(yù)定義矩陣的示例。

在示例實(shí)施方式中,所接收的上混參數(shù)可以包括n(n-1)/2個(gè)濕上混參數(shù)。在本示例實(shí)施方式中,填充中間矩陣可以包括:基于所接收的n(n-1)/2濕上混參數(shù)獲得(n-1)2矩陣元素的值,并且確信中間矩陣屬于預(yù)定義矩陣類(lèi)。這可以包括:將濕上混參數(shù)的值立即插入為矩陣元素,或以合適的方式處理濕上混參數(shù)以導(dǎo)出矩陣元素的值。在本示例實(shí)施方式中,預(yù)定義矩陣可以包括n(n-1)個(gè)元素,并且濕上混系數(shù)的子集可以包括n(n-1)個(gè)系數(shù)。例如,所接收的上混參數(shù)可以包括不超過(guò)n(n-1)/2個(gè)獨(dú)立可分配的濕上混參數(shù),并且/或者濕上混參數(shù)的數(shù)量可以不超過(guò)濕上混系數(shù)子集中的濕上混系數(shù)的數(shù)量的一半。

在示例實(shí)施方式中,所接收的上混參數(shù)可以包括(n-1)個(gè)干上混參數(shù)。在本示例實(shí)施方式中,干上混系數(shù)的子集可以包括n個(gè)系數(shù),并且可以基于所接收的(n-1)個(gè)干上混參數(shù)以及基于干上混系數(shù)的子集中的系數(shù)之間的預(yù)定義關(guān)系來(lái)確定干上混系數(shù)的子集。例如,所接收的上混參數(shù)可以包括不超過(guò)(n-1)個(gè)獨(dú)立可分配的干上混參數(shù)。

在示例實(shí)施方式中,預(yù)定義矩陣類(lèi)可以是以下之一:下三角矩陣或上三角矩陣,其中,該類(lèi)中的所有矩陣的已知屬性包括:預(yù)定義矩陣元素為零;對(duì)稱(chēng)矩陣,其中,該類(lèi)中的所有矩陣的已知屬性包括預(yù)定義矩陣元素(主對(duì)角線的任一側(cè))相等;以及正交矩陣與對(duì)角矩陣的乘積,其中,該類(lèi)中所有矩陣的已知屬性包括預(yù)定義矩陣元素之間的已知關(guān)系。換句話(huà)說(shuō),預(yù)定義矩陣類(lèi)可以是下三角矩陣類(lèi)、上三角矩陣的類(lèi)、對(duì)稱(chēng)矩陣類(lèi)或正交矩陣與對(duì)角矩陣的乘積類(lèi)。上述類(lèi)中的每一個(gè)的共同屬性是其維數(shù)小于矩陣元素的全部數(shù)量。

在示例實(shí)施方式中,預(yù)定義矩陣和/或預(yù)定義矩陣類(lèi)可以與所指示的編碼格式相關(guān)聯(lián),例如,使得解碼方法能夠相應(yīng)地調(diào)整濕上混系數(shù)集合的確定。

根據(jù)示例實(shí)施方式,提供了一種音頻解碼方法,其包括:接收指示至少兩個(gè)預(yù)定義通道配置之一的信令;響應(yīng)于檢測(cè)到指示第一預(yù)定義通道配置的所接收的信令,執(zhí)行第一方面的任意音頻解碼方法。音頻解碼方法可以包括響應(yīng)于檢測(cè)到指示第二預(yù)定義通道配置的所接收的信令:接收雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù);基于下混信號(hào)的第一通道和上混參數(shù)中的至少一些上混參數(shù)來(lái)執(zhí)行第一三通道音頻信號(hào)的參數(shù)重構(gòu);以及基于下混信號(hào)的第二通道和上混參數(shù)中的至少一些來(lái)執(zhí)行第二三通道音頻信號(hào)的參數(shù)重構(gòu)。

第一預(yù)定義通道配置可以與由所接收的雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)表示的m通道音頻信號(hào)對(duì)應(yīng)。第二預(yù)定義通道配置可以與分別由所接收的下混信號(hào)的第一通道和第二通道以及由相關(guān)聯(lián)的上混參數(shù)表示的第一三通道音頻信號(hào)和第二三通道音頻信號(hào)對(duì)應(yīng)。

接收指示至少兩個(gè)預(yù)定義通道配置之一的信令并基于所指示的通道配置執(zhí)行參數(shù)重構(gòu)的能力,可以允許將公共格式用于攜載m通道音頻信號(hào)或兩個(gè)三通道音頻信號(hào)的從編碼器側(cè)到解碼器側(cè)的參數(shù)表示的計(jì)算機(jī)可讀介質(zhì)。

根據(jù)示例實(shí)施方式,提供了一種音頻解碼系統(tǒng),其包括:解碼部,其被配置成基于雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)來(lái)重構(gòu)m通道音頻信號(hào),其中m≥4。音頻解碼系統(tǒng)包括控制部,其被配置成接收指示m通道音頻信號(hào)的至少兩種編碼格式中的所選擇的一種編碼格式的信令。編碼格式與各個(gè)不同劃分對(duì)應(yīng),所述劃分將m通道音頻信號(hào)的通道分到相應(yīng)的第一組和第二組的一個(gè)或更多個(gè)通道中。在所指示的編碼格式下,下混信號(hào)的第一通道與m通道音頻信號(hào)的第一組的一個(gè)或更多個(gè)通道的線性組合對(duì)應(yīng),并且下混信號(hào)的第二通道與m通道音頻信號(hào)的第二組的一個(gè)或更多個(gè)通道的線性組合對(duì)應(yīng)。解碼部包括:預(yù)去相關(guān)部,其被配置成基于所指示的編碼格式來(lái)確定預(yù)去相關(guān)系數(shù)集合,并且將去相關(guān)輸入信號(hào)計(jì)算為下混信號(hào)的線性映射,其中,所述預(yù)去相關(guān)系數(shù)集合被應(yīng)用于下混信號(hào);以及去相關(guān)部,其被配置成基于去相關(guān)輸入信號(hào)生成去相關(guān)信號(hào)。解碼部包括混合部,其被配置成:基于所接收的上混參數(shù)和所指示的編碼格式來(lái)確定濕上混系數(shù)集合和干上混系數(shù)集合;將干上混信號(hào)計(jì)算為下混信號(hào)的線性映射,其中,所述干上混系數(shù)集合被應(yīng)用于下混信號(hào);將濕上混信號(hào)計(jì)算為去相關(guān)信號(hào)的線性映射,其中,所述濕上混系數(shù)集合被應(yīng)用于去相關(guān)信號(hào);并且組合干上混信號(hào)和濕上混信號(hào)以獲得與要重構(gòu)的m通道音頻信號(hào)對(duì)應(yīng)的多維重構(gòu)信號(hào)。

在示例實(shí)施方式中,音頻解碼系統(tǒng)還可以包括另外的解碼部,其被配置成基于另外的雙通道下混信號(hào)和相關(guān)聯(lián)的另外的上混參數(shù)來(lái)重構(gòu)另外的m通道音頻信號(hào)??刂撇靠梢员慌渲贸山邮罩甘玖硗獾膍通道音頻信號(hào)的至少兩種編碼格式中的所選擇的一種編碼格式的信令。另外的m通道音頻信號(hào)的編碼格式可以與各個(gè)不同劃分對(duì)應(yīng),所述劃分將另外的m通道音頻信號(hào)的通道分到相應(yīng)的第一組和第二組的一個(gè)或更多個(gè)通道中。在另外的m通道音頻信號(hào)的所指示的編碼格式下,另外的下混信號(hào)的第一通道可以與另外的m通道音頻信號(hào)的第一組的一個(gè)或更多個(gè)通道的線性組合對(duì)應(yīng),并且另外的下混信號(hào)的第二通道可以與另外的m通道音頻信號(hào)的第二組的一個(gè)或更多個(gè)通道的線性組合對(duì)應(yīng)。另外的解碼部可以包括:另外的預(yù)去相關(guān)部,其被配置成基于另外的m通道音頻信號(hào)的所指示的編碼格式來(lái)確定另外的預(yù)去相關(guān)系數(shù)集合,并且將另外的去相關(guān)輸入信號(hào)計(jì)算為另外的下混信號(hào)的線性映射,其中,所述另外的預(yù)去相關(guān)系數(shù)集合被應(yīng)用于另外的下混信號(hào);以及另外的去相關(guān)部,其被配置成基于附加的去相關(guān)輸入信號(hào)來(lái)生成另外的去相關(guān)信號(hào)。另外的解碼部還可以包括另外的混合部,其被配置成:基于所接收的另外的上混參數(shù)和另外的m通道音頻信號(hào)的所指示的編碼格式來(lái)確定另外的濕上混系數(shù)集合和干上混系數(shù)集合;將另外的干上混信號(hào)計(jì)算為另外的下混信號(hào)的線性映射,其中,另外的干上混系數(shù)集合被應(yīng)用于另外的下混信號(hào);將另外的濕上混信號(hào)計(jì)算為另外的去相關(guān)信號(hào)的線性映射,其中,另外的濕上混系數(shù)集合被應(yīng)用于另外的去相關(guān)信號(hào);并且組合另外的干上混信號(hào)和濕上混信號(hào)以獲得與要重構(gòu)的另外的m通道音頻信號(hào)對(duì)應(yīng)的另外的多維重構(gòu)信號(hào)。

在本示例實(shí)施方式中,另外的解碼部、另外的預(yù)去相關(guān)部、另外的去相關(guān)部和另外的混合部可以例如可以獨(dú)立于解碼部、預(yù)去相關(guān)部、去相關(guān)部和混合部來(lái)操作。

在本示例實(shí)施方式中,另外的解碼部、另外的預(yù)去相關(guān)部、另外的去相關(guān)部和另外的混合部可以分別例如在功能上等同于(或類(lèi)似地被配置成)解碼部、預(yù)去相關(guān)部、去相關(guān)部和混合部??商孢x地,與由解碼部、預(yù)去相關(guān)部、去相關(guān)部和混合部的對(duì)應(yīng)部分執(zhí)行相比,另外的解碼部、另外的預(yù)去相關(guān)部、另外的去相關(guān)部和另外的混合部中的至少一個(gè)可以例如被配置成執(zhí)行至少一種不同的插值類(lèi)型。

例如,所接收的信令可以指示用于m通道音頻信號(hào)和另外的m通道音頻信號(hào)的不同編碼格式。可替選地,兩個(gè)m通道音頻信號(hào)的編碼格式可以例如總是一致,并且所接收的信令可以指示用于兩個(gè)m通道音頻信號(hào)的至少兩種公共編碼格式中的所選擇的一種編碼格式。

用于響應(yīng)于m通道音頻信號(hào)的編碼格式之間的切換的預(yù)去相關(guān)系數(shù)之間的逐漸轉(zhuǎn)變的插值方案可以與用于響應(yīng)于另外的m通道音頻信號(hào)的編碼格式之間切換的另外的預(yù)去相關(guān)系數(shù)之間的逐漸轉(zhuǎn)變的插值方案一致或不同。

類(lèi)似地,用于響應(yīng)于m通道音頻信號(hào)的編碼格式之間的切換的濕上混系數(shù)和干上混系數(shù)的值的插值的插值方案可以與用于響應(yīng)于另外的m通道音頻信號(hào)的編碼格式之間的切換的另外的濕上混系數(shù)和干上混系數(shù)的值的插值的插值方案一致或不同。

在示例實(shí)施方式中,音頻解碼系統(tǒng)還可以包括解復(fù)用器,其被配置成從比特流提取下混信號(hào)、與下混信號(hào)相關(guān)聯(lián)的上混參數(shù)、以及離散編碼的音頻通道。解碼系統(tǒng)還可以包括可操作以對(duì)離散編碼的音頻通道進(jìn)行解碼的單通道解碼部。離散編碼的音頻通道可以例如使用感知音頻編解碼器如杜比數(shù)字、mpegaac或其演變被編碼在比特流中,并且單通道解碼部可以例如包括用于對(duì)離散編碼的音頻通道進(jìn)行解碼的核心解碼器。單通道解碼部可以例如可操作以獨(dú)立于解碼部對(duì)離散編碼的音頻通道進(jìn)行解碼。

根據(jù)示例實(shí)施方式,提供了一種計(jì)算機(jī)程序產(chǎn)品,其包括具有用于執(zhí)行第一方面的任意方法的指令的計(jì)算機(jī)可讀介質(zhì)。

二、概述——編碼器側(cè)

根據(jù)第二方面,示例實(shí)施方式提出了一種音頻編碼系統(tǒng)和音頻編碼方法以及相關(guān)聯(lián)的計(jì)算機(jī)程序產(chǎn)品。根據(jù)第二方面的提出的編碼系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品通常可以共有相同的特征和優(yōu)點(diǎn)。此外,上文根據(jù)第一方面針對(duì)解碼系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的特征呈現(xiàn)的優(yōu)點(diǎn)通??梢詫?duì)根據(jù)第二方面的編碼系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的對(duì)應(yīng)特征有效。

根據(jù)示例實(shí)施方式,提供了一種音頻編碼方法,其包括:接收m通道音頻信號(hào),其中m≥4。音頻編碼方法包括基于任何合適的選擇標(biāo)準(zhǔn)例如信號(hào)屬性、系統(tǒng)負(fù)載、用戶(hù)偏好、網(wǎng)絡(luò)條件來(lái)重復(fù)地選擇至少兩種編碼格式之一??梢詫?duì)音頻信號(hào)的每個(gè)時(shí)間幀重復(fù)一次選擇,或者對(duì)每n個(gè)時(shí)間幀重復(fù)一次選擇,從而可能導(dǎo)致選擇與最初選擇的格式不同的格式;可替選地,選擇可以是事件驅(qū)動(dòng)的。編碼格式與各個(gè)不同劃分對(duì)應(yīng),所述劃分將m通道音頻信號(hào)的通道分到相應(yīng)的第一組和第二組的一個(gè)或更多個(gè)通道中。在每種編碼格式下,雙通道下混信號(hào)包括:形成為m通道音頻信號(hào)的第一組的一個(gè)或更多個(gè)通道的線性組合的第一通道,和形成為m通道音頻信號(hào)的第二組的一個(gè)或更多個(gè)通道的線性組合的第二通道。對(duì)于選擇的編碼格式,基于m通道音頻信號(hào)來(lái)計(jì)算下混通道。一旦計(jì)算,則輸出當(dāng)前選擇的編碼格式的下混信號(hào)以及指示當(dāng)前選擇的編碼格式的信令和能夠?qū)崿F(xiàn)m通道音頻信號(hào)的參數(shù)重構(gòu)的邊信息。如果選擇導(dǎo)致從第一選擇的編碼格式到第二不同選擇的編碼格式的改變,則可以啟動(dòng)轉(zhuǎn)變,由此輸出根據(jù)第一選擇的編碼格式的下混信號(hào)和根據(jù)第二選擇的編碼格式的下混信號(hào)的交叉衰落。在這種情況下,交叉衰落可以是兩個(gè)信號(hào)的線性或非線性時(shí)間插值。例如,

y(t)=tx1(t)+(1-t)x2(t),t∈[0,1]

提供隨時(shí)間從函數(shù)x2到函數(shù)x1的線性交叉衰落y,其中,x1,x2可以是表示根據(jù)相應(yīng)編碼格式的下混信號(hào)的時(shí)間的向量值函數(shù)。為了簡(jiǎn)化符號(hào),執(zhí)行交叉衰落的時(shí)間間隔已被重新調(diào)整至[0,1],其中,t=0表示交叉衰落的開(kāi)始,而t=1表示交叉衰落完成的時(shí)間點(diǎn)。

物理單位中點(diǎn)t=0和t=1的位置可能對(duì)重構(gòu)的音頻的感知輸出質(zhì)量是重要的。作為用于定位交叉衰落的可行準(zhǔn)則,可以在確定了不同格式的需求之后盡可能早地進(jìn)行開(kāi)始,以及/或者交叉衰落可以在感知上不明顯的最短可能時(shí)間內(nèi)完成。因此,對(duì)于實(shí)現(xiàn)每幀重復(fù)選擇編碼格式,一些示例實(shí)施方式提供:交叉衰落在幀的開(kāi)始處開(kāi)始(t=0),并且其末端點(diǎn)(t=1)盡可能近,但又足夠遠(yuǎn)以使得平均收聽(tīng)者不能注意到由于基于兩種不同編碼格式的公共m通道音頻信號(hào)(具有典型內(nèi)容)的兩次重構(gòu)之間的轉(zhuǎn)變而引起的失真或劣化。在一種示例實(shí)施方式中,由音頻編碼方法輸出的下混信號(hào)被分割成時(shí)間幀,并且交叉衰落可以占據(jù)一幀。在另一種示例實(shí)施方式中,由音頻編碼方法輸出的下混信號(hào)被分割成交疊的時(shí)間幀,并且交叉衰落的持續(xù)時(shí)間與從一個(gè)時(shí)間幀到下一個(gè)時(shí)間幀的步幅對(duì)應(yīng)。

在示例實(shí)施方式中,指示當(dāng)前選擇的編碼格式的信令可以逐幀地被編碼??商孢x地,信令可能是時(shí)間微分,意義在于如果所選擇的編碼格式?jīng)]有變化就可以在一個(gè)或更多個(gè)連續(xù)幀中省略這樣的信令。在解碼器側(cè),這樣的幀序列可以被解讀為意味著最近發(fā)出的編碼格式保持為所選擇的編碼格式。

取決于m通道音頻信號(hào)的音頻內(nèi)容,將m通道音頻信號(hào)的通道分到由下混信號(hào)的相應(yīng)通道表示的第一組和第二組的不同劃分可以是合適的,以便對(duì)m通道音頻信號(hào)進(jìn)行捕捉和有效地編碼,并且當(dāng)根據(jù)下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)重構(gòu)該信號(hào)時(shí)保持保真度。因此,可以通過(guò)選擇適當(dāng)?shù)木幋a格式(即多種預(yù)定義編碼格式中最適合的)來(lái)增加重構(gòu)的m通道音頻信號(hào)的保真度。

在示例實(shí)施方式中,邊信息包括干上混系數(shù)和濕上混系數(shù),與上文在本公開(kāi)內(nèi)容中已經(jīng)使用的這些術(shù)語(yǔ)具有相同的意思。除非出于具體的實(shí)施原因,否則為當(dāng)前選擇的編碼格式計(jì)算邊信息(特別是干上混系數(shù)和濕上混系數(shù))通常是足夠的。特別地,干上混系數(shù)集合(其可以表示為m×2維的矩陣)可以限定近似m通道音頻信號(hào)的各個(gè)的下混信號(hào)的線性映射。濕上混系數(shù)集合(可以表示為m×p維的矩陣,其中,去相關(guān)器的數(shù)量p可以被設(shè)置為p=m-2)限定去相關(guān)信號(hào)的線性映射,使得通過(guò)去相關(guān)信號(hào)的所述線性映射獲得的信號(hào)的協(xié)方差補(bǔ)充通過(guò)所選擇的編碼格式的下混信號(hào)的線性映射近似的m通道音頻信號(hào)的協(xié)方差。濕上混系數(shù)集合限定的去相關(guān)信號(hào)的映射將補(bǔ)充(所近似的)m通道音頻信號(hào)的協(xié)方差,意義在于使m通道音頻信號(hào)和去相關(guān)信號(hào)的映射之和的協(xié)方差通常更接近于所接收的m通道音頻信號(hào)的協(xié)方差。添加輔助協(xié)方差的效果可以提高解碼器側(cè)的重構(gòu)信號(hào)的保真度。

下混信號(hào)的線性映射提供了m通道音頻信號(hào)的近似。當(dāng)在解碼器側(cè)重構(gòu)m通道音頻信號(hào)時(shí),采用去相關(guān)信號(hào)來(lái)增加下混信號(hào)的音頻內(nèi)容的維數(shù),并且通過(guò)去相關(guān)信號(hào)的線性映射獲得的信號(hào)與通過(guò)下混信號(hào)的線性映射獲得的信號(hào)組合以提高m通道音頻信號(hào)的近似的保真度。由于去相關(guān)信號(hào)基于下混信號(hào)的至少一個(gè)通道確定,并且不包括來(lái)自下混信號(hào)中尚不可用的m通道音頻信號(hào)的任何音頻內(nèi)容,因此所接收的m通道音頻信號(hào)的協(xié)方差與通過(guò)下混信號(hào)的線性映射近似的m通道音頻信號(hào)的協(xié)方差之間的差不僅可以指示通過(guò)下混信號(hào)的線性映射近似的m通道音頻信號(hào)的保真度,而且可以指示使用下混信號(hào)和去相關(guān)信號(hào)兩者重構(gòu)的m通道音頻信號(hào)的保真度。特別地,所接收的m通道音頻信號(hào)的協(xié)方差與通過(guò)下混信號(hào)的線性映射近似的m通道音頻信號(hào)的協(xié)方差之間的減小的差可以指示重構(gòu)的m通道音頻信號(hào)的提高的保真度。濕上混系數(shù)集合限定的去相關(guān)信號(hào)的映射補(bǔ)充(從下混信號(hào)獲得)m通道音頻信號(hào)的協(xié)方差,意義在于m通道音頻信號(hào)和去相關(guān)信號(hào)的映射之和的協(xié)方差更接近于所接收的m通道音頻信號(hào)的協(xié)方差。因此,基于相應(yīng)的計(jì)算的差選擇編碼格式之一允許提高重構(gòu)的m通道音頻信號(hào)的保真度。

應(yīng)當(dāng)理解,可以例如直接基于計(jì)算的差,或基于根據(jù)所計(jì)算的差確定的系數(shù)和/或值來(lái)選擇編碼格式。

還應(yīng)當(dāng)理解,除相應(yīng)的計(jì)算的差之外,可以基于例如相應(yīng)的計(jì)算的干上混參數(shù)來(lái)選擇編碼格式。

在假設(shè)僅下混信號(hào)可用于重構(gòu)的情況下,即在假設(shè)不采用去相關(guān)信號(hào)進(jìn)行重構(gòu)的情況下,干上混系數(shù)集合可以例如經(jīng)由最小均方誤差近似來(lái)確定。

所計(jì)算的差可以例如是所接收的m通道音頻信號(hào)的協(xié)方差矩陣與由不同編碼格式的下混信號(hào)的各個(gè)線性映射所近似的m通道音頻信號(hào)的協(xié)方差矩陣之間的差。選擇編碼格式之一可以例如包括:計(jì)算用于協(xié)方差矩陣之間的相應(yīng)差的矩陣范數(shù),以及基于所計(jì)算的矩陣范數(shù)來(lái)選擇編碼格式之一,例如選擇與所計(jì)算的矩陣范數(shù)中的最小一個(gè)相關(guān)聯(lián)的編碼格式。

去相關(guān)信號(hào)可以例如包括至少一個(gè)通道且至多m-2個(gè)通道。

干上混系數(shù)集合限定近似m通道下混信號(hào)的下混信號(hào)的線性映射指的是通過(guò)對(duì)下混信號(hào)應(yīng)用線性變換來(lái)獲得m通道下混信號(hào)的近似。該線性變換采用下混信號(hào)的兩個(gè)通道作為輸入,并且提供m個(gè)通道作為輸出,并且干上混系數(shù)是定義該線性變換的定量性質(zhì)的系數(shù)。

類(lèi)似地,濕上混參數(shù)限定以去相關(guān)信號(hào)的通道為輸入的線性變換的定量性質(zhì),并提供m個(gè)通道作為輸出。

在示例實(shí)施方式中,可以確定濕上混參數(shù),使得通過(guò)去相關(guān)信號(hào)的線性映射(其由濕上混參數(shù)限定)獲得的信號(hào)的協(xié)方差近似所接收的m通道音頻信號(hào)的協(xié)方差與通過(guò)所選擇的編碼格式的下混信號(hào)的線性映射近似的m通道音頻信號(hào)的協(xié)方差之間的差。換句話(huà)說(shuō),下混信號(hào)的(由干上混參數(shù)限定的)第一線性映射和去相關(guān)信號(hào)的(根據(jù)該示例實(shí)施方式確定的由濕上混參數(shù)限定的)第二線性映射之和的協(xié)方差將接近于構(gòu)成上文討論的音頻編碼方法的輸入的m通道音頻信號(hào)的協(xié)方差。根據(jù)本示例實(shí)施方式的確定濕上混系數(shù)可以提高重構(gòu)的m通道音頻信號(hào)的保真度。

可替選地,可以確定濕上混參數(shù),使得通過(guò)去相關(guān)信號(hào)的線性映射獲得的信號(hào)的協(xié)方差近似所接收的m通道音頻信號(hào)的協(xié)方差與通過(guò)所選擇的編碼格式的下混信號(hào)的線性映射所近似的m通道音頻信號(hào)的協(xié)方差之間的差的一部分。例如,如果有限數(shù)量的去相關(guān)器在解碼器側(cè)可用,則可能不可能完全恢復(fù)所接收的m通道音頻信號(hào)的協(xié)方差。在這樣的示例中,可以在編碼器側(cè)確定適用于使用減少數(shù)量的去相關(guān)器的m通道音頻信號(hào)的協(xié)方差的部分重構(gòu)的濕上混參數(shù)。

在示例實(shí)施方式中,對(duì)于至少兩種編碼格式中的每一種,音頻編碼方法還可以包括:確定濕上混系數(shù)集合,其與(該編碼格式的)干上混系數(shù)一起允許從(該編碼格式的)下混信號(hào)并從基于(該編碼格式的)確定的去相關(guān)信號(hào)進(jìn)行m通道音頻信號(hào)的參數(shù)重構(gòu),其中,濕上混系數(shù)集合限定去相關(guān)信號(hào)的線性映射,使得通過(guò)去相關(guān)信號(hào)的線性映射獲得的信號(hào)的協(xié)方差近似所接收的m通道音頻信號(hào)的協(xié)方差與通過(guò)(該格式的)下混信號(hào)的線性映射近似的m通道音頻信號(hào)的協(xié)方差之間的差。在本示例實(shí)施方式中,可以基于各個(gè)確定的濕上混系數(shù)集合的值來(lái)選擇所選擇的編碼格式。

例如,可以基于確定的濕上混系數(shù)來(lái)獲得重構(gòu)的m通道音頻信號(hào)的保真度的指示。編碼格式的選擇可以例如基于所確定的濕上混系數(shù)的加權(quán)和或非加權(quán)和,基于所確定的濕上混系數(shù)的量級(jí)的加權(quán)和或非加權(quán)和,以及/或者基于所確定的濕上混系數(shù)的加權(quán)平方和或非加權(quán)平方和,例如還基于相應(yīng)的計(jì)算的干上混系數(shù)的對(duì)應(yīng)的和。

可以例如針對(duì)m通道信號(hào)的多個(gè)頻帶計(jì)算濕上混參數(shù),并且編碼格式的選擇可以例如基于各個(gè)頻帶中相應(yīng)確定的濕上混系數(shù)集合的值。

在示例實(shí)施方式中,第一編碼格式與第二編碼格式之間的轉(zhuǎn)變包括輸出一個(gè)時(shí)間幀中的第一編碼格式的干上混系數(shù)和濕上混系數(shù)的離散值,以及后續(xù)時(shí)間幀中的第二編碼格式的干上混系數(shù)和濕上混系數(shù)的離散值。解碼器中最終重構(gòu)m通道信號(hào)的功能可以包括輸出離散值之間的上混系數(shù)的插值。憑借這樣的解碼器側(cè)功能,將有效地產(chǎn)生從第一編碼格式到第二編碼格式的交叉衰落。如上所述,像應(yīng)用于下混信號(hào)的交叉衰落一樣,當(dāng)重構(gòu)m通道音頻信號(hào)時(shí),這樣的交叉衰落可以引起編碼格式之間的較不可感知的轉(zhuǎn)變。

應(yīng)當(dāng)理解,用于基于m通道音頻信號(hào)計(jì)算下混信號(hào)的系數(shù)可以被插值,即從與根據(jù)第一編碼格式計(jì)算下混信號(hào)的幀相關(guān)聯(lián)的值至與根據(jù)第二編碼格式計(jì)算下混信號(hào)的幀相關(guān)聯(lián)的值。至少如果下混合發(fā)生在時(shí)域中,則由所概述類(lèi)型的系數(shù)插值產(chǎn)生的下混交叉衰落將相當(dāng)于由直接對(duì)各個(gè)下混信號(hào)執(zhí)行的插值產(chǎn)生的交叉衰落。應(yīng)當(dāng)記住,用于計(jì)算下混信號(hào)的系數(shù)的值通常不是信號(hào)相關(guān)的,而是可以針對(duì)可用編碼格式中的每一種來(lái)預(yù)定義。

回到下混信號(hào)和上混系數(shù)的交叉衰落,認(rèn)為有利的是確保兩個(gè)交叉衰落之間的同步性。優(yōu)選地,下混信號(hào)和上混系數(shù)的各個(gè)轉(zhuǎn)變周期可以一致。特別地,負(fù)責(zé)相應(yīng)交叉衰落的實(shí)體可以由公共控制數(shù)據(jù)流來(lái)控制。這樣的控制數(shù)據(jù)可以包括交叉衰落的起點(diǎn)和終點(diǎn),以及可選的交叉衰落波形,如線性、非線性等。在上混系數(shù)的情況下,可以通過(guò)管理解碼裝置的行為的預(yù)定插值規(guī)則給出交叉衰落波形;然而,可以通過(guò)限定和/或輸出上混系數(shù)的離散值的位置來(lái)隱含地控制交叉衰落的起點(diǎn)和終點(diǎn)。兩個(gè)交叉衰落過(guò)程的時(shí)間相關(guān)的相似性確保了下混信號(hào)與為其重構(gòu)所提供的參數(shù)之間的良好匹配,這可以導(dǎo)致解碼器側(cè)的失真減少。

在示例實(shí)施方式中,編碼格式的選擇基于將所接收的m通道信號(hào)與基于下混信號(hào)重構(gòu)的m通道信號(hào)在協(xié)方差方面的差進(jìn)行比較。特別地,重構(gòu)可以等于由僅干上混系數(shù)限定的下混信號(hào)的線性映射,即,沒(méi)有來(lái)自使用去相關(guān)確定的信號(hào)的貢獻(xiàn)(例如,以增加下混信號(hào)的音頻內(nèi)容的維數(shù))。特別地,在比較中不考慮由任意濕上混系數(shù)集合限定的線性映射的貢獻(xiàn)。換句話(huà)說(shuō),進(jìn)行比較,就像沒(méi)有去相關(guān)的信號(hào)可用。該選擇的基礎(chǔ)可能有利于當(dāng)前允許較多忠實(shí)再現(xiàn)的編碼格式??蛇x地,在執(zhí)行該比較并且對(duì)編碼格式的選擇作出決定之后,確定濕上混系數(shù)集合。與該過(guò)程相關(guān)聯(lián)的優(yōu)點(diǎn)是,對(duì)于所接收的m通道音頻信號(hào)的給定部分,不存在濕上混系數(shù)的重復(fù)確定。

在前面段落中描述的示例實(shí)施方式的變型中,針對(duì)所有編碼格式計(jì)算干上混系數(shù)和濕上混系數(shù),并且將濕上混系數(shù)的定量測(cè)量用作選擇編碼格式的基礎(chǔ)。實(shí)際上,基于所確定的濕上混系數(shù)計(jì)算的量可以提供重構(gòu)的m通道音頻信號(hào)的保真度的(反)指示。編碼格式的選擇可以例如基于所確定的濕上混系數(shù)的加權(quán)和或非加權(quán)和,基于所確定的濕上混系數(shù)的量級(jí)的加權(quán)和或非加權(quán)和,以及/或者基于所確定的濕上混系數(shù)的加權(quán)平方和或非加權(quán)平方和。這些選項(xiàng)中的每一個(gè)可以與相應(yīng)的計(jì)算干上混系數(shù)的相應(yīng)和進(jìn)行組合??梢岳玑槍?duì)m通道信號(hào)的多個(gè)頻帶計(jì)算濕上混參數(shù),并且編碼格式的選擇可以例如基于各個(gè)頻帶中相應(yīng)確定的濕上混系數(shù)集合的值。

在示例實(shí)施方式中,音頻編碼方法還可以包括:對(duì)于至少兩種編碼格式中的每一種,計(jì)算相應(yīng)的濕上混系數(shù)的平方和和相應(yīng)的干上混系數(shù)的平方和。在本示例實(shí)施方式中,可以基于計(jì)算的平方和來(lái)選擇所選擇的編碼格式。發(fā)明人認(rèn)識(shí)到,所計(jì)算的平方和可以提供由收聽(tīng)者感知到的當(dāng)基于濕貢獻(xiàn)和干貢獻(xiàn)的混合來(lái)重構(gòu)m通道音頻信號(hào)時(shí)出現(xiàn)的保真度損失的特別良好的指示。

例如,可以基于所計(jì)算的各個(gè)編碼格式的平方和形成針對(duì)每種編碼格式的比率,并且所選擇的編碼格式可以與所形成的比率中的最小比率或最大比率相關(guān)聯(lián)。形成比率可以例如包括將濕上混系數(shù)的平方和除以干上混系數(shù)的平方和和濕上混系數(shù)的平方和之和??商孢x地,該比率可以通過(guò)將濕上混系數(shù)的平方和除以干上混系數(shù)的平方和來(lái)形成。

在示例實(shí)施方式中,該方法提供對(duì)m通道音頻信號(hào)和至少一個(gè)相關(guān)聯(lián)的(m2通道)音頻信號(hào)的編碼。音頻信號(hào)可以被關(guān)聯(lián),意義在于它們例如通過(guò)已被同時(shí)記錄或在公共創(chuàng)作過(guò)程中生成來(lái)描述公共音頻場(chǎng)景。音頻信號(hào)不需要借助于公共下混信號(hào)進(jìn)行編碼,而是可以在單獨(dú)的過(guò)程中進(jìn)行編碼。在這樣的設(shè)置中,對(duì)編碼格式之一的選擇還考慮與所述至少一個(gè)另外的音頻通道有關(guān)的數(shù)據(jù),并且因此選擇的編碼格式將用于對(duì)m通道音頻信號(hào)和相關(guān)聯(lián)的(m2通道)音頻信號(hào)兩者進(jìn)行編碼。

在示例實(shí)施方式中,通過(guò)音頻編碼方法輸出的下混信號(hào)可以被分割成時(shí)間幀,編碼格式的選擇可以每幀執(zhí)行一次,并且在選擇不同的編碼格式之前,所選擇的編碼格式可以被保持多達(dá)至少預(yù)定數(shù)量的時(shí)間幀。幀的編碼格式的選擇可以通過(guò)以上概述的任意方法(例如通過(guò)考慮協(xié)方差之間的差,考慮可用編碼格式的濕上混系數(shù)的值等)來(lái)執(zhí)行。通過(guò)將所選擇的編碼格式保持多達(dá)最小數(shù)量的時(shí)間幀,可以例如避免編碼格式之間來(lái)回重復(fù)的跳躍。本示例實(shí)施方式可以例如提高由收聽(tīng)者所感知的重構(gòu)的m通道音頻信號(hào)的回放質(zhì)量。

時(shí)間幀的最小數(shù)量可以例如為10。

所接收的m通道音頻信號(hào)可以例如緩沖最小數(shù)量的時(shí)間幀,并且編碼格式的選擇可以例如基于通過(guò)移動(dòng)窗口的多數(shù)決定來(lái)執(zhí)行,所述移動(dòng)窗口包括鑒于所選擇的編碼格式將被維護(hù)的所述最小幀數(shù)而選擇的多個(gè)時(shí)間幀。這樣的穩(wěn)定功能的實(shí)現(xiàn)可以包括各種平滑濾波器中的一個(gè),特別是數(shù)字信號(hào)處理中已知的有限脈沖響應(yīng)平滑濾波器。替代該方法,當(dāng)發(fā)現(xiàn)新的編碼格式被選擇用于所述最小數(shù)量的按順序的幀時(shí),編碼格式可以切換至新的編碼格式。為了強(qiáng)制實(shí)施這個(gè)標(biāo)準(zhǔn),具有最小數(shù)量的連續(xù)幀的移動(dòng)時(shí)間窗可以被應(yīng)用于例如用于緩沖幀的過(guò)去的編碼格式選擇。如果在第一編碼格式的幀序列之后,對(duì)于移動(dòng)窗口中的每個(gè)幀仍然選擇了第二編碼格式,則第二編碼格式的轉(zhuǎn)變被確認(rèn),并且從移動(dòng)窗口開(kāi)始就向前起作用。上述穩(wěn)定功能的實(shí)現(xiàn)可以包括狀態(tài)機(jī)。

在示例實(shí)施方式中,提供了干上混參數(shù)和濕上混參數(shù)的緊湊表示,其特別地包括生成中間矩陣,所述中間矩陣借助于屬于預(yù)定義矩陣類(lèi)由比矩陣中的元素少的參數(shù)數(shù)量唯一確定。在本公開(kāi)內(nèi)容的早些部分描述了該緊湊表示的各個(gè)方面,并且具體參考美國(guó)臨時(shí)專(zhuān)利申請(qǐng)no61/974,544,第一署名發(fā)明人:larsvillemoes;申請(qǐng)日期:2014年4月3日。

在示例實(shí)施方式中,在所選擇的編碼格式下,m通道音頻信號(hào)的第一組的一個(gè)或更多個(gè)通道可以由n個(gè)通道組成,其中n≥3。第一組的一個(gè)或更多個(gè)通道可以通過(guò)應(yīng)用濕上混系數(shù)和干上混系數(shù)的至少一些來(lái)根據(jù)下混信號(hào)的第一通道和去相關(guān)信號(hào)的n-1個(gè)通道重構(gòu)。

在本示例實(shí)施方式中,確定所選擇的編碼格式的干上混系數(shù)集合可以包括確定所選擇的編碼格式的干上混系數(shù)的子集,以便限定所選擇的編碼格式的下混信號(hào)的第一通道的線性映射,所述所述線性映射近似所選擇的編碼格式的第一組的一個(gè)或更多個(gè)通道。

在本示例實(shí)施方式中,確定所選擇的編碼格式的濕上混系數(shù)集合可以包括:基于所接收的所選擇的編碼格式的第一組的一個(gè)或更多個(gè)通道的協(xié)方差與通過(guò)所選擇的編碼格式的下混信號(hào)的第一通道的線性映射近似的所選擇的編碼格式的第一組的一個(gè)或更多個(gè)通道的協(xié)方差之間的差來(lái)確定中間矩陣。當(dāng)乘以預(yù)定矩陣時(shí),中間矩陣可以與所選擇的編碼格式的濕上混系數(shù)的子集對(duì)應(yīng),所述選擇的編碼格式的濕上混系數(shù)的子集限定去相關(guān)信號(hào)的n-1個(gè)通道的線性映射作為所選擇的編碼格式的第一組的一個(gè)或更多個(gè)通道的參數(shù)重構(gòu)的一部分。所選擇的編碼格式的濕上混系數(shù)的子集可以包括比中間矩陣中的元素的數(shù)量多的系數(shù)。

在本示例實(shí)施方式中,輸出上混參數(shù)可以包括第一類(lèi)型上混參數(shù)(本文中被稱(chēng)為干上混參數(shù),干上混系數(shù)的子集可從所述第一類(lèi)型上混參數(shù)得到)集,以及第二類(lèi)型上混參數(shù)(本文中被稱(chēng)為濕上混參數(shù),假如中間矩陣屬于預(yù)定義矩陣類(lèi)則唯一地限定中間矩陣)集。中間矩陣可以具有比所選擇的編碼格式的濕上混參數(shù)的子集中的元素的數(shù)量多的元素。

在本示例實(shí)施方式中,解碼器側(cè)的第一組的一個(gè)或更多個(gè)通道的參數(shù)重構(gòu)副本包括:作為一個(gè)貢獻(xiàn)的通過(guò)下混信號(hào)的第一通道的線性映射形成的干上混信號(hào),以及作為另外的貢獻(xiàn)的通過(guò)去相關(guān)信號(hào)的n-1個(gè)通道的線性映射形成的濕上混信號(hào)。干上混系數(shù)的子集限定下混信號(hào)的第一通道的線性映射,而濕上混系數(shù)的子集限定去相關(guān)信號(hào)的線性映射。通過(guò)輸出少于濕上混系數(shù)子集中的系數(shù)數(shù)量的濕上混參數(shù),并且根據(jù)基于預(yù)定義矩陣和預(yù)定義矩陣類(lèi)從中可得到濕上混系數(shù)的子集的濕上混系數(shù),可以減少發(fā)送給解碼器側(cè)能夠重構(gòu)m通道音頻信號(hào)的信息量。通過(guò)減少參數(shù)重構(gòu)所需的數(shù)據(jù)量,可以減少用于傳輸m通道音頻信號(hào)的參數(shù)表示所需的帶寬和/或用于存儲(chǔ)這樣的表示所需的存儲(chǔ)大小。

中間矩陣可以例如被確定成使得通過(guò)去相關(guān)信號(hào)的n-1個(gè)通道的線性映射獲得的信號(hào)的協(xié)方差補(bǔ)充由下混信號(hào)的第一通道的線性映射近似的第一組的一個(gè)或更多個(gè)通道的協(xié)方差。

上面提到的美國(guó)臨時(shí)專(zhuān)利申請(qǐng)no.61/974,544中第16頁(yè)第15行至第20頁(yè)第2行更詳細(xì)地描述了如何確定和使用預(yù)定義矩陣和預(yù)定義矩陣類(lèi)。具體參見(jiàn)其中的具體式(9)中的預(yù)定義矩陣的示例。

在示例實(shí)施方式中,確定中間矩陣可以包括將中間矩陣確定成使得通過(guò)由濕上混系數(shù)子集定義的去相關(guān)信號(hào)的n-1個(gè)通道的線性映射獲得的信號(hào)的協(xié)方差近似接收的第一組的一個(gè)或更多個(gè)通道的協(xié)方差與通過(guò)下混信號(hào)的第一通道的線性映射近似的第一組的一個(gè)或更多個(gè)通道的協(xié)方差之間的差或基本上與其一致。換句話(huà)說(shuō),中間矩陣可以被確定成使得由通過(guò)下混信號(hào)的第一通道的線性映射形成的干上混信號(hào)與通過(guò)去相關(guān)信號(hào)的n-1個(gè)通道的線性映射完全或至少近似地形成濕上混信號(hào)之和得到的第一組的一個(gè)或更多個(gè)通道的重構(gòu)副本使所接收的第一組的一個(gè)或更多個(gè)通道的協(xié)方差恢復(fù)。

在示例實(shí)施方式中,濕上混參數(shù)可以包括不超過(guò)n(n-1)/2個(gè)獨(dú)立可分配的濕上混參數(shù)。在本示例實(shí)施方式中,中間矩陣可以具有(n-1)2個(gè)矩陣元素,并且假如中間矩陣屬于預(yù)定義矩陣類(lèi),則可以由濕上混參數(shù)唯一地限定。在本示例實(shí)施方式中,濕上混系數(shù)的子集可以包括n(n-1)個(gè)系數(shù)。

在示例實(shí)施方式中,干上混系數(shù)的子集可以包括n個(gè)系數(shù)。在本示例實(shí)施方式中,干上混參數(shù)可以包括不超過(guò)n-1個(gè)干上混參數(shù),并且干上混系數(shù)的子集可以使用預(yù)定義規(guī)則從n-1個(gè)干上混參數(shù)得到。

在示例實(shí)施方式中,所確定的干上混系數(shù)子集可以限定與第一組的一個(gè)或更多個(gè)通道的最小均方差近似對(duì)應(yīng)的下混信號(hào)的第一通道的線性映射,即在下混信號(hào)的第一通道的線性映射集之間,所確定的干上混系數(shù)集合可以限定在最小均方意義上最近似第一組的一個(gè)或更多個(gè)通道的線性映射。

在示例實(shí)施方式中,提供了一種音頻編碼系統(tǒng),其包括:編碼部,其被配置成將m通道音頻信號(hào)編碼為雙通道音頻信號(hào)和相關(guān)聯(lián)的上混參數(shù),其中m≥4。編碼部包括:下混部,其被配置成對(duì)于與將m通道音頻信號(hào)的通道分到相應(yīng)的第一組和第二組的一個(gè)或更多個(gè)通道中的各個(gè)不同劃分對(duì)應(yīng)的兩種編碼格式中的至少一種,根據(jù)編碼格式基于m通道音頻信號(hào)計(jì)算雙通道下混信號(hào)。下混信號(hào)的第一通道形成為m通道音頻信號(hào)的第一組的一個(gè)或更多個(gè)通道的線性組合,并且下混信號(hào)的第二通道形成為m通道音頻信號(hào)的第二組的一個(gè)或多個(gè)通道的線性組合。

音頻編碼系統(tǒng)還包括控制部,其被配置成基于任意合適的標(biāo)準(zhǔn)例如信號(hào)屬性、系統(tǒng)負(fù)載、用戶(hù)偏好、網(wǎng)絡(luò)條件來(lái)選擇編碼格式之一。音頻編碼系統(tǒng)還包括下混插值器,其在轉(zhuǎn)變已被控制部排序時(shí),使兩種編碼格式之間的下混信號(hào)進(jìn)行交叉衰落。在這樣的轉(zhuǎn)變期間,可以計(jì)算兩種編碼格式的下混信號(hào)。除了下混信號(hào)之外或者當(dāng)其交叉衰落適用時(shí),音頻編碼系統(tǒng)至少輸出指示當(dāng)前選擇的編碼格式的信令以及基于下混信號(hào)實(shí)現(xiàn)m通道音頻信號(hào)的參數(shù)重構(gòu)的邊信息。如果系統(tǒng)包括并行操作的多個(gè)編碼部,例如以對(duì)各組音頻通道進(jìn)行編碼,則控制部可以從這些編碼部中的每一個(gè)自主實(shí)現(xiàn),并且負(fù)責(zé)選擇要由每個(gè)編碼部使用的公共編碼格式。

在示例實(shí)施方式中,提供了一種計(jì)算機(jī)程序產(chǎn)品,其包括具有用于執(zhí)行本節(jié)中描述的任意方法的指令的計(jì)算機(jī)可讀介質(zhì)。

三、示例實(shí)施方式

圖6至圖8示出了將11.1通道音頻信號(hào)劃分成通道組以用于將11.1通道音頻信號(hào)參數(shù)編碼為5.1通道音頻信號(hào)的替代方法。11.1通道音頻信號(hào)包括通道l(左邊)、ls(左側(cè))、lb(左后)、tfl(左前上方)、tbl(左后上方)、r(右邊)、rs(右側(cè))、rb(右后)、tfr(右前上方)、tbr(右后上方)、c(中心)和lfe(低頻效果)。五個(gè)通道l、ls、lb、tfl和tbl形成表示11.1通道音頻信號(hào)的回放環(huán)境中的左半空間的五通道音頻信號(hào)。三個(gè)通道l、ls和lb表示回放環(huán)境中的不同的水平方向,并且兩個(gè)通道tfl和tbl表示與三個(gè)通道l、ls和lb的方向垂直分離的方向。兩個(gè)通道tfl和tbl可以例如旨在用于在天花板揚(yáng)聲器中回放。類(lèi)似地,五個(gè)通道r、rs、rb、tfr和tbr形成表示回放環(huán)境的右半空間的另外的五通道音頻信號(hào),即表示回放環(huán)境中的不同水平方向的三個(gè)通道r、rs和rb以及表示與三個(gè)通道r、rs和rb的方向垂直分離的方向的兩個(gè)通道tfr和tbr。

為了將11.1通道音頻信號(hào)表示為5.1通道音頻信號(hào),可以將通道l、ls、lb、tfl、tbl、r、rs、rb、tfr、tbr、c和lfe的集合劃分為由各自的下混通道和相關(guān)聯(lián)的上混參數(shù)表示的通道組。五通道音頻信號(hào)l,ls,lb,tfl,tbl可以由雙通道下混信號(hào)l1,l2和相關(guān)聯(lián)的上混參數(shù)表示,而另外的五通道音頻信號(hào)r,rs,rb,tfr,tbr可以由另外的雙通道下混信號(hào)r1,r2和相關(guān)聯(lián)的另外的上混參數(shù)來(lái)表示。通道c和lfe在11.1通道音頻信號(hào)的5.1通道表示中仍可以保持為單獨(dú)的通道。

圖6示出了第一編碼格式f1,其中,五通道音頻信號(hào)l,ls,lb,tfl,tbl被劃分成通道l,ls,lb的第一組601和通道tfl,tbl的第二組602,并且其中,另外的五通道音頻信號(hào)r,rs,rb,tfr,tbr被劃分成通道r,rs,rb的另外的第一組603以及通道tfr,tbr的另外的第二組604。在第一編碼格式f1下,第一通道組601由雙通道下混信號(hào)的第一通道l1表示,并且第二通道組602由雙通道下混信號(hào)的第二通道l2表示。下混信號(hào)的第一通道l1可以按照l(shuí)1=l+ls+lb而與第一組601的通道之和對(duì)應(yīng),并且下混信號(hào)的第二通道l2可以按照l(shuí)2=tfl+tbl而與第二組602的通道之和對(duì)應(yīng)。

在一些示例實(shí)施方式中,可以在求和之前將一些或全部通道重新調(diào)整,使得下混信號(hào)的第一通道l1可以根據(jù)l1=c1l+c2ls+c3lb而與第一組601的通道的線性組合對(duì)應(yīng),并且下混信號(hào)的第二通道l2可以根據(jù)l2=c4tfl+c5tbl而與第二組602的通道的線性組合對(duì)應(yīng)。增益c2,c3,c4,c5可以例如相一致,而增益c1可以例如具有不同的值;例如,c1可以與根本沒(méi)有重新調(diào)整相對(duì)應(yīng)。例如,可以使用值c1=1且如果例如在第一編碼格式f1下應(yīng)用于各自通道l,ls,lb,tfl,tbl的增益c1,...,c5與下面參照?qǐng)D7和圖8描述的在其他編碼格式f2和f3下應(yīng)用于這些通道的增益一致,則當(dāng)在不同編碼格式f1,f2,f3之間切換時(shí)這些增益不會(huì)影響下混信號(hào)如何改變,并且因此經(jīng)重新調(diào)整的通道c1l,c2ls,c3lb,c4tfl,c5tbl可以被視為好像它們是原始通道l,ls,lb,tfl,tbl一樣。另一方面,如果在不同的編碼格式中采用不同的增益以用于同一通道的重新調(diào)整,則這些編碼格式之間的切換可能例如導(dǎo)致下混信號(hào)中的通道l,ls,lb,tfl,tbl的被不同地調(diào)整的版本之間的突變,這可能潛在地在解碼器側(cè)引起可聽(tīng)見(jiàn)的失真。如下面關(guān)于等式(3)和等式(4)所述的,這樣的失真可以例如通過(guò)使用從在編碼格式的切換之前被采用以形成下混信號(hào)的系數(shù)到在編碼格式的切換之后被采用以形成下混信號(hào)的系數(shù)進(jìn)行插值、以及/或者通過(guò)使用預(yù)去相關(guān)系數(shù)的插值來(lái)抑制。

類(lèi)似地,另外的第一通道組603由另外的下混信號(hào)的第一通道r1表示,并且另外的第二通道組604由另外的下混信號(hào)的第二通道r2表示。

第一編碼格式f1提供用于表示天花板通道tfl、tbl、tfr和tbr的專(zhuān)用下混通道l2和r2。因此,在例如回放環(huán)境中的豎直維度對(duì)于11.1通道音頻信號(hào)的總體效果而言是重要的的情況下,第一編碼格式f1的使用可以允許具有較高保真度的11.1通道音頻信號(hào)的參數(shù)重構(gòu)。

圖7示出了第二編碼格式f2,其中,五通道音頻信號(hào)l,ls,lb,tfl,tbl被劃分成由下混信號(hào)的相應(yīng)通道l1,l2表示的第一通道組701和第二通道組702,其中,通道l1和l2對(duì)應(yīng)于各自組701和702的通道之和,或者如在第一編碼格式f1中那樣采用相同的增益c1,...,c5以用于重新調(diào)整各自的通道l,ls,lb,tfl,tbl的各自組701和702的通道的線性組合。類(lèi)似地,另外的五通道音頻信號(hào)r,rs,rb,tfr,tbr被劃分成由各自的通道r1和r2表示的另外的第一通道組703和另外的第二通道組704。

第二編碼格式f2不提供用于表示天花板通道tfl,tbl,tfr和tbr的專(zhuān)用下混通道,但是例如在回放環(huán)境中的豎直維度對(duì)11.1通道音頻信號(hào)的總體效果不那么重要的情況下,可以允許具有相對(duì)高保真度的11.1通道音頻信號(hào)的參數(shù)重構(gòu)。

圖8示出了第三編碼格式f3,其中,五通道音頻信號(hào)l,ls,lb,tfl,tbl被劃分成由下混信號(hào)的相應(yīng)通道l1和l2表示的的第一組的一個(gè)或更多個(gè)通道801和第二組的一個(gè)或更多個(gè)通道802,其中,通道l1和l2信號(hào)對(duì)應(yīng)于各自組801和802的一個(gè)或更多個(gè)通道之和,或者如在第一編碼格式f1中那樣采用相同的系數(shù)c1,...,c5以用于重新調(diào)整各自的通道l,ls,lb,tfl,tbl的各自組801和802的一個(gè)或更多個(gè)通道的線性組合。類(lèi)似地,另外的五通道信號(hào)r,rs,rb,tfr,tbr被劃分成由各自的通道r1和r2表示的另外的第一通道組803和另外的第二通道組804。在第三編碼格式f3中,僅通道l由下混信號(hào)的第一通道l1表示,而四個(gè)通道ls、lb、tfl和tbl由下混信號(hào)的第二通道l2表示。

在將參照?qǐng)D1至圖5描述的編碼器側(cè),根據(jù)下式將雙通道下混信號(hào)l1,l2計(jì)算為五通道音頻信號(hào)x=[llslbtfltbl]t的線性映射:

其中,dn,m,n=1,2,m=1...,5是由下混矩陣d表示的下混系數(shù)。在將參照?qǐng)D9至圖13描述的解碼器側(cè),根據(jù)下式執(zhí)行五通道音頻信號(hào)[llslbtfltbl]t的參數(shù)重構(gòu):

其中,cn,m,n=1,...,5,m=1,2是由干上混矩陣表示的干上混系數(shù)βl,pn,k,n=1,...,5,k=1,2,3是由濕上混矩陣表示的濕上混系數(shù)γl,并且zk,k=1,2,3是基于下混信號(hào)l1,l2生成的三通道去相關(guān)信號(hào)z的通道。

圖1是根據(jù)示例實(shí)施方式的用于將m通道音頻信號(hào)編碼為雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)的編碼部100的一般性框圖。

m通道音頻信號(hào)在本文中由參照?qǐng)D6至圖8描述的五通道音頻信號(hào)l、ls、lb、tfl和tbl來(lái)舉例說(shuō)明。還可以設(shè)想以下示例實(shí)施方式,其中,編碼部100基于m通道音頻信號(hào)計(jì)算雙通道下混信號(hào),其中m=4或m≥6。

編碼部100包括下混部110和分析部120。對(duì)于參照?qǐng)D6至圖8描述的編碼格式f1,f2,f3中的每一個(gè),下混部110基于五通道音頻信號(hào)l,ls,lb,tfl,tbl根據(jù)編碼格式來(lái)計(jì)算雙通道下混信號(hào)l1,l2。在例如第一編碼格式f1中,下混信號(hào)的第一通道l1形成為五通道音頻信號(hào)l,ls,lb,tfl,tbl中的第一組601的通道的線性組合(例如,五通道音頻信號(hào)l,ls,lb,tfl,tbl中的第一組601的通道之和),并且下混信號(hào)的第二通道l2形成為五通道音頻信號(hào)l,ls,lb,tfl,tbl中的第二組602的通道的線性組合(例如,五通道音頻信號(hào)l,ls,lb,tfl,tbl中的第二組602的通道之和)。由下混部110執(zhí)行的操作可以例如表示為式(1)。

對(duì)于編碼格式f1,f2,f3中的每一個(gè),分析部120確定限定近似五通道音頻信號(hào)l,ls,lb,tfl,tbl的各下混信號(hào)l1,l2的線性映射的干上混系數(shù)集合βl,并且計(jì)算所接收的五通道音頻信號(hào)l,ls,lb,tfl,tbl的協(xié)方差與通過(guò)各下混信號(hào)l1,l2的相應(yīng)線性映射所近似的五通道音頻信號(hào)的協(xié)方差之間的差。計(jì)算的差在本文中通過(guò)所接收的五通道音頻信號(hào)l,ls,lb,tfl,tbl的協(xié)方差矩陣與通過(guò)各下混信號(hào)l1,l2的相應(yīng)線性映射所近似的五通道音頻信號(hào)的協(xié)方差矩陣之間的差來(lái)舉例說(shuō)明。對(duì)于編碼格式f1,f2,f3中的每一個(gè),分析部120基于相應(yīng)的計(jì)算的差來(lái)確定濕上混系數(shù)γl集合,濕上混系數(shù)γl與干上混系數(shù)βl一起允許從下混信號(hào)l1,l2以及從基于下混信號(hào)l1,l2在解碼器側(cè)確定的三通道去相關(guān)信號(hào)進(jìn)行五通道音頻信號(hào)l,ls,lb,tfl,tbl的根據(jù)式(2)的參數(shù)重構(gòu)。濕上混系數(shù)γl集合限定去相關(guān)信號(hào)的線性映射,使得通過(guò)去相關(guān)信號(hào)的線性映射獲得的信號(hào)的協(xié)方差矩陣近似所接收的五通道音頻信號(hào)l,ls,lb,tfl,tbl的協(xié)方差矩陣與通過(guò)下混信號(hào)l1,l2的線性映射所近似的五通道音頻信號(hào)的協(xié)方差矩陣之間的差。

下混部110可以例如在時(shí)域中即基于五通道音頻信號(hào)l,ls,lb,tfl,tbl的時(shí)域表示計(jì)算下混信號(hào)l1,l2,或者在頻域中即基于五通道音頻信號(hào)l,ls,lb,tfl,tbl的頻域表示來(lái)計(jì)算下混信號(hào)l1,l2。

分析部120可以例如基于五通道音頻信號(hào)l,ls,lb,tfl,tbl的頻域分析來(lái)確定干上混系數(shù)βl和濕上混系數(shù)γl。分析部120可以例如接收由下混部110計(jì)算的下混信號(hào)l1,l2,或者可以計(jì)算其自身版本的下混信號(hào)l1,l2以用于確定干上混系數(shù)βl和濕上混系數(shù)γl。

圖3是根據(jù)示例實(shí)施方式的包括參照?qǐng)D1描述的編碼部100的音頻編碼系統(tǒng)300的一般性框圖。在本示例實(shí)施方式中,例如由一個(gè)或更多個(gè)聲換能器301記錄或由音頻創(chuàng)作設(shè)備301生成的音頻內(nèi)容以參照?qǐng)D6至圖8描述的11.1通道音頻信號(hào)的形式提供。正交鏡像濾波器(qmf)分析部302(或?yàn)V波器組)將五通道音頻信號(hào)l,ls,lb,tfl,tbl逐時(shí)間段地變換為qmf域以供編碼部100以時(shí)間片/頻率片的形式對(duì)五通道音頻信號(hào)l,ls,lb,tfl,tbl進(jìn)行處理。(如下文將進(jìn)一步解釋的,qmf分析部302及其對(duì)應(yīng)物、qmf合成部305是可選的。)音頻編碼系統(tǒng)300包括另外的編碼部303,其與編碼部100類(lèi)似,并且適用于將另外的五通道音頻信號(hào)r、rs、rb、tfr和tbr編碼為另外的雙通道下混信號(hào)r1,r2以及相關(guān)聯(lián)的另外的干上混參數(shù)βr和另外的濕上混參數(shù)γr。qmf分析部302還將另外的五通道音頻信號(hào)r、rs、rb、tfr和tbr變換成qmf域以供另外的編碼部303處理。

控制部304基于編碼部100和另外的編碼部303針對(duì)各自的編碼格式f1,f2,f3確定的濕上混系數(shù)γl,γr和干上混系數(shù)βl,βr來(lái)選擇編碼格式f1,f2,f3之一。例如,對(duì)于編碼格式f1,f2,f3中的每一個(gè),控制部304可以計(jì)算以下比率:

其中,ewet是濕上混系數(shù)γl和γr的平方和,并且edry是干上混系數(shù)的平方和。所選擇的編碼格式可以與編碼格式f1,f2,f3的比率e中的最小比率相關(guān)聯(lián),即,控制部304可以選擇與最小比率e對(duì)應(yīng)的編碼格式。發(fā)明人認(rèn)識(shí)到,比率e的減小的值可以指示根據(jù)相關(guān)聯(lián)的編碼格式所重構(gòu)的11.1通道音頻信號(hào)的增加的保真度。

在一些示例實(shí)施方式中,干上混系數(shù)βl,βr的平方和edry可以例如包括值為1的附加項(xiàng),對(duì)應(yīng)于以下事實(shí):通道c被發(fā)送至解碼器側(cè),并且可以在沒(méi)有任何去相關(guān)的情況下例如僅采用值為1的干上混系數(shù)被重構(gòu)。

在一些示例實(shí)施方式中,控制部304可以分別基于濕上混系數(shù)γl和干上混系數(shù)βl以及另外的濕上混系數(shù)γr和另外的干上混系數(shù)βr來(lái)彼此獨(dú)立地選擇兩個(gè)五通道音頻信號(hào)l,ls,lb,tfl,tbl和r,rs,rb,tfr,tbr的編碼格式。

然后,音頻編碼系統(tǒng)300可以輸出:所選擇的編碼格式的下混信號(hào)l1,l2和另外的下混信號(hào)r1,r2;上混參數(shù)α,從上混參數(shù)α可得到與所選擇的編碼格式相關(guān)聯(lián)的干上混系數(shù)βl和濕上混系數(shù)γl以及另外的干上混系數(shù)βr和另外的濕上混系數(shù)γr;以及指示所選擇的編碼格式的信令s。

在本示例實(shí)施方式中,控制部304輸出:所選擇的編碼格式的下混信號(hào)l1,l2和另外的下混信號(hào)r1,r2、上混參數(shù)α,從上混參數(shù)α可得到與所選擇的編碼格式相關(guān)聯(lián)的干上混系數(shù)βl和濕上混系數(shù)γl以及另外的干上混系數(shù)βr和另外的濕上混系數(shù)γr;以及指示所選擇的編碼格式的信令s。下混信號(hào)l1,l2和另外的下混信號(hào)r1,r2由qmf合成部305(或?yàn)V波器組)從qmf域變換回來(lái),并且由變換部306變換成改進(jìn)的離散余弦變換(mdct)域。量化部307對(duì)上混參數(shù)進(jìn)行量化。例如,可以使用步長(zhǎng)為0.1或0.2(無(wú)量綱)的均勻量化,接著以霍夫曼編碼的形式進(jìn)行熵編碼??梢岳绮捎貌介L(zhǎng)為0.2的較粗略量化來(lái)節(jié)省傳輸帶寬,并且可以例如采用步長(zhǎng)為0.1的較精細(xì)量化來(lái)提高解碼器側(cè)的重構(gòu)的保真度。通道c和lfe也被變換部308變換成mdct域。然后,通過(guò)復(fù)用器309將mdct變換的下混信號(hào)和通道、量化的上混參數(shù)和信令組合成比特流b,用于傳輸至解碼器側(cè)。音頻編碼系統(tǒng)300還可以包括核心編碼器(圖3中未示出),其被配置成在下混信號(hào)以及通道c和lfe被提供給復(fù)用器309之前使用感知音頻編解碼器如杜比數(shù)字、mpegaac或其演變來(lái)對(duì)下混信號(hào)l1,l2、另外的下混信號(hào)r1,r2以及通道c和lfe進(jìn)行編碼。例如可以在形成比特流b之前將例如與-8.7db對(duì)應(yīng)的修剪增益應(yīng)用于下混信號(hào)l1,l2、另外的下混信號(hào)r1,r2和通道c??商孢x地,由于參數(shù)獨(dú)立于絕對(duì)電平,所以也可以在形成與l1,l2對(duì)應(yīng)的線性組合之前將修剪增益應(yīng)用于所有輸入通道。

還可以設(shè)想以下實(shí)施方式,其中,控制部304僅接收不同編碼格式f1,f2,f3的濕上混系數(shù)γl,γr和干上混系數(shù)βl,βr(或者不同的編碼格式的濕上混系數(shù)和干上混系數(shù)的平方和)以用于選擇編碼格式,即控制部304不一定需要接收不同編碼格式的下混信號(hào)l1,l2,r1,r2。在這樣的實(shí)施方式中,控制部304可以例如控制編碼部100,303來(lái)將所選擇的編碼格式的下混信號(hào)l1,l2,r1,r2、干上混系數(shù)βl,βr和濕上混系數(shù)γl,γr傳送為音頻編碼系統(tǒng)300的輸出或者傳送為復(fù)用器309的輸入。

如果選擇的編碼格式在編碼格式之間切換,則可以例如在編碼格式切換之前使用的下混系數(shù)值與編碼格式切換之后使用的下混系數(shù)值之間進(jìn)行插值,以根據(jù)式(1)形成下混信號(hào)。這通常相當(dāng)于根據(jù)各自下混系數(shù)值集合產(chǎn)生的下混信號(hào)的插值。

雖然圖3示出了下混信號(hào)可以如何在qmf域中生成以及然后接著變換回到時(shí)域,但是可以在沒(méi)有qmf部302,305的情況下實(shí)現(xiàn)滿(mǎn)足相同任務(wù)的替選編碼器,由此其直接在時(shí)域中計(jì)算下混信號(hào)。這在下混系數(shù)不是頻率相關(guān)的情況下(這通常成立)是可行的。利用替選編碼器,編碼格式轉(zhuǎn)變可以通過(guò)在相應(yīng)編碼格式的兩個(gè)下混信號(hào)之間進(jìn)行交叉衰落來(lái)處理,或者通過(guò)在產(chǎn)生下混信號(hào)的下混系數(shù)(包括格式之一中的為零值的系數(shù))之間進(jìn)行插值來(lái)處理。這樣的替選編碼器可以具有較低的延遲/等待時(shí)間和/或較低的計(jì)算復(fù)雜度。

圖2是根據(jù)示例實(shí)施方式的與參照?qǐng)D1描述的編碼部100類(lèi)似的編碼部200的一般性框圖。編碼部200包括下混部210和分析部220。如在參照?qǐng)D1描述的編碼部100中,對(duì)于編碼格式f1,f2,f3中的每一個(gè),下混部210基于五通道音頻信號(hào)l,ls,lb,tfl,tbl來(lái)計(jì)算雙通道下混信號(hào)l1,l2并且分析部220確定相應(yīng)的干上混系數(shù)βl集合,并且計(jì)算所接收的五通道音頻信號(hào)l,ls,lb,tfl,tbl的協(xié)方差矩陣與通過(guò)各下混信號(hào)的相應(yīng)線性映射近似的五通道音頻信號(hào)的協(xié)方差矩陣之間的差δl。

與參照?qǐng)D1描述的編碼部100中的分析部120相比,分析部220不計(jì)算所有編碼格式的濕上混參數(shù)。相對(duì)地,計(jì)算的差δl被提供給控制部304(參見(jiàn)圖3)以用于選擇編碼格式。一旦基于所計(jì)算的差δl選擇了編碼格式,則可以由控制部304確定用于所選擇的編碼格式的濕上混系數(shù)(將被包括在上混參數(shù)集合中)。可替選地,控制部304負(fù)責(zé)基于上面討論的協(xié)方差矩陣之間的計(jì)算的差δl來(lái)選擇編碼格式,但是經(jīng)由上行方向的信令來(lái)指示分析部220計(jì)算濕上混系數(shù)γl;根據(jù)該替選(未示出),分析部220具有輸出差和濕上混系數(shù)兩者的能力。

在本示例實(shí)施方式中,濕上混系數(shù)集合被確定成使得通過(guò)由濕上混系數(shù)限定的通過(guò)去相關(guān)信號(hào)的線性映射獲得的信號(hào)的協(xié)方差矩陣補(bǔ)充通過(guò)所選擇的編碼格式的下混信號(hào)的線性映射所近似的五通道音頻信號(hào)的協(xié)方差矩陣。換句話(huà)說(shuō),當(dāng)在解碼器側(cè)重構(gòu)五通道音頻信號(hào)l,ls,lb,tfl,tbl時(shí),濕上混參數(shù)不一定需要被確定成實(shí)現(xiàn)全協(xié)方差重構(gòu)。濕上混參數(shù)可以被確定成提高重構(gòu)的五通道音頻信號(hào)的保真度,但是,如果例如解碼器側(cè)的去相關(guān)器的數(shù)量受到限制,則濕上混參數(shù)可以被確定成允許五通道音頻信號(hào)l,ls,lb,tfl,tbl的盡可能多的協(xié)方差矩陣的重構(gòu)。

可以設(shè)想以下實(shí)施方式,其中,與參照?qǐng)D3描述的音頻編碼系統(tǒng)300類(lèi)似的音頻編碼系統(tǒng)包括參照?qǐng)D2描述的類(lèi)型的一個(gè)或更多個(gè)編碼部200。

圖4是根據(jù)示例實(shí)施例的用于將m通道音頻信號(hào)編碼為雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)的音頻編碼方法400的流程圖。音頻編碼方法400在本文中通過(guò)由包括參照?qǐng)D2描述的編碼部200的音頻編碼系統(tǒng)執(zhí)行的方法舉例說(shuō)明。

音頻編碼方法400包括:接收410五通道音頻信號(hào)l,ls,lb,tfl,tbl;根據(jù)參照?qǐng)D6至圖8描述的編碼格式f1,f2,f3中的第一種,基于五通道音頻信號(hào)l,ls,lb,tfl,tbl來(lái)計(jì)算420雙通道下混信號(hào)l1,l2;根據(jù)編碼格式確定430干上混系數(shù)βl集;以及根據(jù)編碼格式計(jì)算440差δl。音頻編碼方法400包括:確定450是否對(duì)于編碼格式f1,f2,f3中的每一種計(jì)算差δl。只要對(duì)于至少一種編碼格式仍然要計(jì)算差δl,則音頻編碼方法400方法返回至根據(jù)下一個(gè)編碼格式計(jì)算420下混信號(hào)l1,l2,這由流程圖中的n指示。

如果由流程圖中的y所指示的已經(jīng)對(duì)于編碼格式f1,f2,f3中的每一種計(jì)算了差δl,則方法400繼續(xù)進(jìn)行為:基于相應(yīng)的計(jì)算的差δl選擇460編碼格式f1,f2,f3之一;以及確定470濕上混系數(shù)集合,濕上混系數(shù)與所選擇的編碼格式的干上混系數(shù)βl一起允許五通道音頻信號(hào)l,ls,lb,tfl,tbl的根據(jù)式(2)的參數(shù)重構(gòu)。音頻編碼方法400還包括:輸出480所選擇的編碼格式的下混信號(hào)l1,l2、以及上混參數(shù),從上混參數(shù)可得到與所選擇的編碼格式相關(guān)聯(lián)的干上混系數(shù)和濕上混系數(shù);以及輸出490指示所選擇的編碼格式的信令s。

圖5是根據(jù)示例實(shí)施方式的用于將m通道音頻信號(hào)編碼為雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)的音頻編碼方法500的流程圖。音頻編碼方法500在本文中通過(guò)由參照?qǐng)D3描述的音頻編碼系統(tǒng)300執(zhí)行的方法來(lái)舉例說(shuō)明。

與參照?qǐng)D4描述的音頻編碼方法400類(lèi)似,音頻編碼方法500包括:接收410五通道音頻信號(hào)l,ls,lb,tfl,tbl;根據(jù)編碼格式f1,f2,f3中的第一編碼格式,基于五通道音頻信號(hào)l,ls,lb,tfl,tbl來(lái)計(jì)算420雙通道下混信號(hào)l1,l2;根據(jù)編碼格式確定430干上混系數(shù)βl集;以及根據(jù)編碼格式計(jì)算440差δl。音頻編碼方法500還包括確定560濕上混系數(shù)γl集,濕上混系數(shù)γl與編碼格式的干上混系數(shù)βl一起允許m通道音頻信號(hào)的根據(jù)式(2)的參數(shù)重構(gòu)。音頻編碼方法500包括:確定550是否對(duì)于編碼格式f1,f2,f3中的每一個(gè)計(jì)算了濕上混系數(shù)γl和干上混系數(shù)βl。只要對(duì)于至少一種編碼格式仍然要計(jì)算濕上混系數(shù)γl和干上混系數(shù)βl,則音頻編碼方法500返回至根據(jù)下一個(gè)編碼格式計(jì)算420下混信號(hào)l1,l2,這由流程圖中的n來(lái)指示。

如果由流程圖中的y所指示的已經(jīng)對(duì)于編碼格式f1,f2,f3中的每一個(gè)計(jì)算了濕上混系數(shù)γl和干上混系數(shù)βl,則音頻編碼方法500繼續(xù)進(jìn)行為:基于相應(yīng)的計(jì)算的濕上混系數(shù)γl和干上混系數(shù)βl來(lái)選擇570編碼格式f1,f2,f3之一;輸出480所選擇的編碼格式的下混信號(hào)l1,l2、以及上混參數(shù),從上混參數(shù)可得到與所選擇的編碼格式相關(guān)聯(lián)的干上混系數(shù)βl和濕上混系數(shù)γl;以及輸出490指示所選擇的編碼格式的信令。

圖9是根據(jù)示例實(shí)施方式的用于基于雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)αl重構(gòu)m通道音頻信號(hào)的解碼部900的一般性框圖。

在本示例實(shí)施方式中,下混信號(hào)通過(guò)由參照?qǐng)D1描述的編碼部100輸出的下混信號(hào)l1,l2舉例說(shuō)明。在本示例實(shí)施方式中,由編碼部100輸出且適用于五通道音頻信號(hào)l,ls,lb,tfl,tbl的參數(shù)重構(gòu)的干上混參數(shù)βl和濕上混參數(shù)γl可從上混參數(shù)αl中得到。然而,也可以設(shè)想以下實(shí)施方式,其中,上混參數(shù)αl適用于m通道音頻信號(hào)的參數(shù)重構(gòu),其中m=4或m≥6。

解碼部900包括預(yù)去相關(guān)部910、去相關(guān)部920和混合部930。預(yù)去相關(guān)部910基于在編碼器側(cè)被采用來(lái)對(duì)五通道音頻信號(hào)l,ls,lb,tfl,tbl進(jìn)行編碼的所選擇的編碼格式來(lái)確定預(yù)去相關(guān)系數(shù)集合。如下面參照?qǐng)D10所述,可以經(jīng)由來(lái)自編碼器側(cè)的信令來(lái)指示所選擇的編碼格式。預(yù)去相關(guān)部910將去相關(guān)輸入信號(hào)d1,d2,d3計(jì)算為下混信號(hào)l1,l2的線性映射,其中,預(yù)去相關(guān)系數(shù)組被應(yīng)用于下混信號(hào)l1,l2。

去相關(guān)部920基于去相關(guān)輸入信號(hào)d1,d2,d3生成去相關(guān)信號(hào)。去相關(guān)信號(hào)在本文中由三通道舉例說(shuō)明,均通過(guò)在去相關(guān)部920的去相關(guān)器921至923中對(duì)去相關(guān)輸入信號(hào)的通道之一進(jìn)行處理而生成,該處理例如包括將線性濾波器應(yīng)用于去相關(guān)輸入信號(hào)d1,d2,d3的各自通道。

混合部930基于所接收的上混參數(shù)αl和在編碼器側(cè)被采用來(lái)對(duì)五通道音頻信號(hào)l,ls,lb,tfl,tbl進(jìn)行編碼的選擇的編碼格式來(lái)確定濕上混系數(shù)γl集和干上混系數(shù)βl集?;旌喜?30根據(jù)式(2)執(zhí)行五通道音頻信號(hào)l,ls,lb,tfl,tbl的參數(shù)重構(gòu),即,混合部930將干上混信號(hào)計(jì)算為下混信號(hào)l1,l2的線性映射,其中,所述干上混系數(shù)βl集被應(yīng)用于下混信號(hào)l1,l2;將濕上混信號(hào)計(jì)算為去相關(guān)信號(hào)的線性映射,其中,濕上混系數(shù)γl集被應(yīng)用于去相關(guān)信號(hào);以及組合干上混信號(hào)和濕上混信號(hào)以獲得與要重構(gòu)的五通道音頻信號(hào)l,ls,lb,tfl,tbl對(duì)應(yīng)的多維重構(gòu)信號(hào)

在一些示例實(shí)施方式中,接收的上混參數(shù)αl可以本身就包括濕上混系數(shù)和干上混系數(shù)βl,γl,或者可以對(duì)應(yīng)于較緊湊的形式,基于所使用的特定緊湊形式的知識(shí)而包括與在解碼器側(cè)從上混參數(shù)αl可以得到濕上混系數(shù)γl和干上混系數(shù)βl的濕上混系數(shù)γl和干上混系數(shù)βl的數(shù)量相比較少的參數(shù)。

圖11示出了在下混信號(hào)l1,l2表示根據(jù)參照?qǐng)D6描述的第一編碼格式f1的五通道音頻信號(hào)l,ls,lb,tfl,tbl的示例場(chǎng)景中參照?qǐng)D9描述的混合部930的操作。應(yīng)當(dāng)理解,混合部930的操作可以與在下混信號(hào)l1,l2表示根據(jù)第二編碼格式f2和第三編碼格式f3中的任意編碼格式的五通道音頻信號(hào)l,ls,lb,tfl,tbl的示例場(chǎng)景中的類(lèi)似。特別地,混合部930可以暫時(shí)激活將馬上描述的上混部和組合部的另外的實(shí)例,以實(shí)現(xiàn)兩種編碼格式之間的交叉衰落,這可能需要所計(jì)算的下混信號(hào)的同時(shí)可用性。

在本示例場(chǎng)景中,下混信號(hào)的第一通道l1表示三個(gè)通道l,ls,lb,并且下混信號(hào)的第二通道l2表示兩個(gè)通道tfl,tbl。預(yù)去相關(guān)部910將預(yù)去相關(guān)系數(shù)確定成:使得基于下混信號(hào)的第一通道l1生成去相關(guān)信號(hào)的兩個(gè)通道;以及使得基于下混信號(hào)的第二通道l2生成去相關(guān)信號(hào)的一個(gè)通道。

第一干上混部931提供三通道干上混信號(hào)x1作為下混信號(hào)的第一通道l1的線性映射,其中,從接收的上混參數(shù)αl可得到的干上混系數(shù)的子集被應(yīng)用于下混信號(hào)的第一通道l1。第一濕上混部932提供三通道濕上混信號(hào)y1作為去相關(guān)信號(hào)的兩個(gè)通道的線性映射,其中,從接收的上混參數(shù)αl可得到的濕上混系數(shù)的子集被應(yīng)用于去相關(guān)信號(hào)的兩個(gè)通道。第一組合部933將第一干上混信號(hào)x1和第一濕上混信號(hào)y1組合成通道l,ls,lb的重構(gòu)版本

類(lèi)似地,第二干上混部934提供雙通道干上混信號(hào)x2作為下混信號(hào)的第二通道l2的線性映射,并且第二濕上混部935提供雙通道濕上混信號(hào)y2作為去相關(guān)信號(hào)的一個(gè)通道的線性組合。第二組合部936將第二干上混信號(hào)x2和第二濕上混信號(hào)y2組合成通道tfl,tbl的重構(gòu)版本

圖10是根據(jù)示例實(shí)施方式的包括參照?qǐng)D9描述的解碼部900的音頻解碼系統(tǒng)1000的一般性框圖。例如包括解復(fù)用器的接收部1001接收從參照?qǐng)D3描述的音頻編碼系統(tǒng)300發(fā)送的比特流b,并且從比特流b中提取下混信號(hào)l1,l2、另外的下混信號(hào)r1,r2和上混參數(shù)α以及通道c和lfe。上混參數(shù)α可以例如包括與要重構(gòu)的11.1通道音頻信號(hào)l,ls,lb,tfl,tbl,r,rs,rb,tfr,tbr,c,lfe的左手邊和右手邊分別相關(guān)聯(lián)的第一子集αl和第二子集αr。

在使用感知音頻編解碼器如杜比數(shù)字、mpegaac或其演變將下混信號(hào)l1,l2、另外的下混信號(hào)r1,r2和/或通道c和lfe編碼在比特流b中的情況下,音頻解碼系統(tǒng)1000可以包括核心解碼器(圖10中未示出),其被配置成當(dāng)從比特流b提取時(shí)對(duì)各個(gè)信號(hào)和通道進(jìn)行解碼。

變換部1002通過(guò)執(zhí)行逆mdct來(lái)變換下混信號(hào)l1,l2,并且qmf分析部1003將下混信號(hào)l1,l2變換為qmf域以供解碼部900以時(shí)間片/頻率片的形式對(duì)下混信號(hào)l1,l2進(jìn)行處理。去量化部1004在將第一子集αl的上混參數(shù)提供給解碼部900之前,對(duì)例如熵編碼格式的第一子集αl的上混參數(shù)進(jìn)行去量化。如參照?qǐng)D3所述,可以使用兩種不同步長(zhǎng)之一例如0.1或0.2執(zhí)行量化。所采用的實(shí)際步長(zhǎng)可以被預(yù)定義,或者可以從編碼器側(cè)例如經(jīng)由比特流b用信號(hào)傳遞給音頻解碼系統(tǒng)1000。

在本示例實(shí)施方式中,音頻解碼系統(tǒng)1000包括與解碼部900類(lèi)似的另外的解碼部1005。另外的解碼部1005被配置成:接收參照?qǐng)D3描述的另外的雙通道下混信號(hào)r1,r2和第二子集αr的上混參數(shù),并且基于另外的下混信號(hào)r1,r2和第二子集αr的上混參數(shù)提供另外的五通道音頻信號(hào)r,rs,rb,tfr,tbr的重構(gòu)版本

變換部1006通過(guò)執(zhí)行逆mdct來(lái)變換另外的下混信號(hào)r1,r2,并且qmf分析部1007將另外的下混信號(hào)r1,r2變換為qmf域以供另外的解碼部1005以時(shí)間片/頻率片的形式對(duì)另外的下混信號(hào)r1,r2進(jìn)行處理。去量化部1008在將第二子集αr的上混參數(shù)提供給另外的解碼部1005之前,對(duì)例如熵編碼格式的第二子集αr的上混參數(shù)進(jìn)行去量化。

在在編碼器側(cè)修剪增益被應(yīng)用于下混信號(hào)l1,l2、另外的下混信號(hào)r1,r2和的通道c的示例實(shí)施方式中,可以在音頻解碼系統(tǒng)1000中將例如與8.7db對(duì)應(yīng)的相應(yīng)的增益應(yīng)用于這些信號(hào)以補(bǔ)償修剪增益。

控制部1009接收指示在編碼器側(cè)被采用來(lái)將11.1通道音頻信號(hào)編碼為下混信號(hào)l1,l2和另外的下混信號(hào)r1,r2以及相關(guān)聯(lián)的上混參數(shù)α的編碼格式f1,f2,f3中的所選擇的一種編碼格式的信令s??刂撇?009控制解碼部900(例如解碼部900中的去相關(guān)部910和混合部920)和另外的解碼部(1005)來(lái)根據(jù)指示的編碼格式執(zhí)行參數(shù)重構(gòu)。

在本示例實(shí)施方式中,由解碼部900和另外的解碼部1005分別輸出的五通道音頻信號(hào)l,ls,lb,tfl,tbl和另外的五通道音頻信號(hào)r,rs,rb,tfl,tbl的重構(gòu)版本在與通道c和lfe一起被提供為音頻解碼系統(tǒng)1000的輸出以用于多揚(yáng)聲器系統(tǒng)1012上的回放的之前,由qmf合成部1011從qmf域變換回來(lái)。在通道c和lfe被包括在音頻解碼系統(tǒng)1000的輸出中之前,變換部1010通過(guò)執(zhí)行逆mdct將通道c和lfe變換成時(shí)域。

通道c和lfe可以例如以離散編碼的形式從比特流b中提取,并且音頻解碼系統(tǒng)1000可以例如包括被配置成對(duì)相應(yīng)的離散編碼通道進(jìn)行解碼的單通道解碼部(圖10中未示出)。單通道解碼部可以例如包括用于使用感知音頻編解碼器如杜比數(shù)字、mpegaac或其演變對(duì)編碼的音頻內(nèi)容進(jìn)行解碼的核心解碼器。

在本示例實(shí)施方式中,預(yù)去相關(guān)系數(shù)由預(yù)去相關(guān)部910被確定成使得在編碼格式f1,f2,f3中的每一種下,去相關(guān)輸入信號(hào)d1,d2,d3的通道的每一個(gè)根據(jù)表1與下混信號(hào)l1,l2的通道一致。

從表1可以看出,在所有三種編碼格式f1,f2,f3中通道tbl經(jīng)由下混信號(hào)l1,l2對(duì)去相關(guān)輸入信號(hào)的第三通道d3產(chǎn)生貢獻(xiàn),而在編碼格式中的至少兩種編碼格式中通道對(duì)ls,lb和通道對(duì)tfl,tbl中的每一對(duì)分別經(jīng)由下混信號(hào)l1,l2對(duì)去相關(guān)輸入信號(hào)的第三通道d3產(chǎn)生貢獻(xiàn)。

表1示出了在兩種編碼格式中通道l和tfl中的每一個(gè)分別經(jīng)由下混信號(hào)l1,l2對(duì)去相關(guān)輸入信號(hào)的第一通道d1產(chǎn)生貢獻(xiàn),并且在編碼格式中的至少兩種編碼格式中通道對(duì)ls,lb經(jīng)由下混信號(hào)l1,l2對(duì)去相關(guān)輸入信號(hào)的第一通道d1產(chǎn)生貢獻(xiàn)。

表1還示出了在第二編碼格式f2和第三編碼格式f3兩者中三個(gè)通道ls,lb,tbl經(jīng)由下混信號(hào)l1,l2對(duì)去相關(guān)輸入信號(hào)的第二通道d2產(chǎn)生貢獻(xiàn),而在所有三種編碼格式f1,f2,f3中通道對(duì)ls,lb經(jīng)由下混信號(hào)l1,l2對(duì)去相關(guān)輸入信號(hào)的第二通道d2產(chǎn)生貢獻(xiàn)。

當(dāng)指示的編碼格式在不同的編碼格式之間切換時(shí),去相關(guān)器921至923的輸入改變。在本示例實(shí)施方式中,在切換期間去相關(guān)輸入信號(hào)d1,d2,d3的至少一些部分將被保持,即,在編碼格式f1,f2,f3中的兩種之間的任意切換中五通道音頻信號(hào)l,ls,lb,tfl,tbl中的至少一個(gè)通道將保持在去相關(guān)輸入信號(hào)d1,d2,d3的每個(gè)通道中,這允許如由收聽(tīng)者在重構(gòu)的m通道音頻信號(hào)的回放期間感知的編碼格式之間的較平滑的轉(zhuǎn)變。

發(fā)明人認(rèn)識(shí)到,由于去相關(guān)信號(hào)可能基于下混信號(hào)l1,l2的與在其期間可能發(fā)生編碼格式的切換的若干時(shí)間幀對(duì)應(yīng)的區(qū)段來(lái)生成,所以由于編碼格式的切換在去相關(guān)信號(hào)中可能潛在地生成可聽(tīng)見(jiàn)的失真。即使響應(yīng)于編碼格式之間的轉(zhuǎn)變對(duì)濕上混系數(shù)γl和干上混系數(shù)βl進(jìn)行插值,在去相關(guān)信號(hào)中引起的失真仍然可能存留在重構(gòu)的五通道音頻信號(hào)l,ls,lb,tfl,tbl中。假設(shè)根據(jù)表1的去相關(guān)輸入信號(hào)d1,d2,d3可以抑制由編碼格式的切換引起的去相關(guān)信號(hào)中的可聽(tīng)見(jiàn)的失真,并且可以提高重構(gòu)的五通道音頻信號(hào)l,ls,lb,tfl,tbl的回放質(zhì)量。

盡管表1依據(jù)編碼格式f1,f2,f3表示,針對(duì)所述編碼格式f1,f2,f3下混信號(hào)l1,l2的通道分別被生成為第一組通道之和和第二組通道之和,但是當(dāng)下混信號(hào)的通道分別被形成為第一組通道的線性組合和第二組通道的線性組合時(shí),可以例如采用預(yù)去相關(guān)系數(shù)的相同值,使得去相關(guān)輸入信號(hào)d1,d2,d3的通道根據(jù)表1與下混信號(hào)l1,l2的通道一致。應(yīng)當(dāng)理解,當(dāng)下混信號(hào)的通道分別被形成為第一組通道的線性組合和第二通道組的線性組合時(shí),也可以以該方式提高重構(gòu)的五通道音頻信號(hào)的回放質(zhì)量。

為了進(jìn)一步提高重構(gòu)的五通道音頻信號(hào)的回放質(zhì)量,可以例如響應(yīng)于編碼格式的切換來(lái)執(zhí)行預(yù)去相關(guān)系數(shù)的值的插值。在第一編碼格式f1下,去相關(guān)輸入信號(hào)d1,d2,d3可以被確定為

而在第二編碼格式f2中,去相關(guān)輸入信號(hào)d1,d2,d3可以被確定為

響應(yīng)于從第一編碼格式f1到第二編碼格式f2的切換,可以例如在式(3)中的預(yù)去相關(guān)矩陣與式(4)中的預(yù)去相關(guān)矩陣之間執(zhí)行連續(xù)或線性插值。

式(3)和(4)中的下混信號(hào)l1,l2可以例如在qmf域中,并且當(dāng)在編碼格式之間切換時(shí),可以在例如32個(gè)qmf時(shí)隙期間對(duì)在編碼器側(cè)被采用以根據(jù)式(1)計(jì)算下混信號(hào)l1,l2的下混系數(shù)進(jìn)行插值。預(yù)去相關(guān)系數(shù)(或矩陣)的插值可以例如與下混系數(shù)的插值同步,例如,預(yù)去相關(guān)系數(shù)(或矩陣)的插值可以在相同的32個(gè)qmf時(shí)隙期間執(zhí)行。預(yù)去相關(guān)系數(shù)的插值可以例如是例如用于由音頻解碼系統(tǒng)1000解碼的所有頻帶的寬帶插值。

干上混系數(shù)βl和濕上混系數(shù)γl也可以被插值??梢岳缃?jīng)由來(lái)自編碼器側(cè)的信令s來(lái)控制干上混系數(shù)βl和濕上混系數(shù)γl的插值以提高轉(zhuǎn)變處理。在編碼格式的切換的情況下,在編碼器側(cè)選擇的用于在解碼器側(cè)對(duì)干上混系數(shù)βl和濕上混系數(shù)γl進(jìn)行插值的插值方案可以例如是適用于編碼格式的切換的插值方案,其可以與在未發(fā)生編碼格式的切換時(shí)用于干上混系數(shù)和濕上混系數(shù)的插值方案不同。

在一些示例實(shí)施方式中,與在另外的解碼部1005中相比,在解碼部900中可以采用至少一種不同的插值方案。

圖12是根據(jù)示例實(shí)施方式的用于基于雙通道下混信號(hào)和相關(guān)聯(lián)的上混參數(shù)重構(gòu)m通道音頻信號(hào)的音頻解碼方法1200的流程圖。解碼方法1200在本文中通過(guò)可以由參照?qǐng)D10描述的音頻解碼系統(tǒng)1000執(zhí)行的解碼方法舉例說(shuō)明。

音頻解碼方法1200包括:接收1201雙通道下混信號(hào)l1,l2和用于基于下混信號(hào)l1,l2進(jìn)行參照?qǐng)D6至圖8描述的五通道音頻信號(hào)l,ls,lb,tfl,tbl的參數(shù)重構(gòu)的上混參數(shù)αl;接收1202指示參照?qǐng)D6至圖8描述的編碼格式f1,f2,f3中選擇的一種的信令s;以及基于所指示的編碼格式確定1203預(yù)去相關(guān)系數(shù)集合。

音頻解碼方法1200包括檢測(cè)1204所指示的格式是否從一種編碼格式切換至另一編碼格式。如果沒(méi)有檢測(cè)到切換——由流程圖中的n指示,則下一步驟是將去相關(guān)輸入信號(hào)d1,d2,d3計(jì)算1205為下混信號(hào)l1,l2的線性映射,其中,預(yù)去相關(guān)系數(shù)集合被應(yīng)用于下混信號(hào)。另一方面,如果檢測(cè)到編碼格式的切換——由流程圖中的y指示,則下一步驟是以從一種編碼格式的預(yù)去相關(guān)系數(shù)值到另一編碼格式的預(yù)去相關(guān)系數(shù)值的逐漸轉(zhuǎn)變的形式執(zhí)行1206插值,以及然后使用插值的預(yù)去相關(guān)系數(shù)值來(lái)計(jì)算1205去相關(guān)輸入信號(hào)d1,d2,d3。

音頻解碼方法1200包括基于去相關(guān)輸入信號(hào)d1,d2,d3生成1207去相關(guān)信號(hào),并且基于所接收的上混參數(shù)和所指示的編碼格式來(lái)確定1208濕上混系數(shù)γl集和干上混系數(shù)βl集。

如果沒(méi)有檢測(cè)到編碼格式的切換——由來(lái)自判定框1209的分支n指示,則方法1200繼續(xù)為:將干上混信號(hào)計(jì)算1210為下混信號(hào)的線性映射,其中,干上混系數(shù)βl集被應(yīng)用于下混信號(hào)l1,l2;并且將濕上混信號(hào)計(jì)算1211為去相關(guān)信號(hào)的線性映射,其中,濕上混系數(shù)γl集被應(yīng)用于去相關(guān)信號(hào)。另一方面,如果指示的編碼格式從一種編碼格式切換至另一編碼格式——由來(lái)自判定框1209的分支y指示,則該方法代替地繼續(xù)為:執(zhí)行1212從適用于一種編碼格式的干上混系數(shù)和濕上混系數(shù)(包括零值系數(shù))的值到適用于另一種編碼格式的干上混系數(shù)和濕上混系數(shù)(包括零值系數(shù))的值的插值;將干上混信號(hào)計(jì)算1210為下混信號(hào)l1,l2的線性映射,其中,經(jīng)插值的干上混系數(shù)集合被應(yīng)用于下混信號(hào)l1,l2;并且將濕上混信號(hào)計(jì)算1211為去相關(guān)信號(hào)的線性映射,其中,經(jīng)插值的濕上混系數(shù)集合被應(yīng)用于去相關(guān)信號(hào)。該方法還包括:組合1213干上混信號(hào)和濕上混信號(hào),以獲得與要重構(gòu)的五通道音頻信號(hào)對(duì)應(yīng)的多維重構(gòu)信號(hào)

圖13是根據(jù)示例實(shí)施方式的用于基于5.1通道音頻信號(hào)和相關(guān)聯(lián)的上混參數(shù)α重構(gòu)13.1通道音頻信號(hào)的解碼部1300的一般性框圖。

在本示例實(shí)施方式中,13.1通道音頻信號(hào)由通道lw(左寬)、lscrn(左屏幕)、tfl(左前上方)、ls(左側(cè))、lb(左后)、tbl(左后上方)、rw(右寬)、rscrn(右屏幕)、tfr(右前上方)、rs(右側(cè))、rb(右后)、tbr(右后上方)、c(中心)和lfe(低頻效果)。5.1通道信號(hào)包括:下混信號(hào)l1,l2,其第一通道l1與通道lw,lscrn,tfl的線性組合對(duì)應(yīng),并且其第二通道l2與通道ls,lb,tbl的線性組合對(duì)應(yīng);另外的下混信號(hào)r1,r2,其第一通道r1與通道rw,rscrn,tfr的線性組合對(duì)應(yīng),并且其第二通道r2與通道rs,rb,tbr的線性組合對(duì)應(yīng);以及通道c和lfe。

第一上混部1310在上混參數(shù)的至少一些的控制下基于下混信號(hào)的第一通道l1來(lái)重構(gòu)通道lw、lscrn和tfl;第二上混部1320在上混參數(shù)α的至少一些的控制下基于下混信號(hào)的第二通道l2來(lái)重構(gòu)通道ls,lb,tbl;第三上混部1330在上混參數(shù)α的至少一些的控制下基于另外的下混信號(hào)的第一通道r1來(lái)重構(gòu)通道rw,rscrn,tfr,并且第四上混部1340在上混參數(shù)α的至少一些的控制下基于下混信號(hào)的第二通道r2來(lái)重構(gòu)通道rs,rb,tbr。13.1通道音頻信號(hào)的重構(gòu)版本可以被提供為解碼部1310的輸出。

在示例實(shí)施方式中,參照?qǐng)D10描述的音頻解碼系統(tǒng)1000除解碼部900和1005之外還可以包括解碼部1300,或者可以至少能夠通過(guò)與由解碼部1300執(zhí)行的方法類(lèi)似的方法來(lái)重構(gòu)13.1通道信號(hào)。從比特流b提取的信令s可以例如指示所接收的5.1通道音頻信號(hào)l1,l2,r1,r2,c,lfe和相關(guān)聯(lián)的上混參數(shù)是否表示如參照?qǐng)D10描述的11.1通道信號(hào),或者所接收的5.1通道音頻信號(hào)l1,l2,r1,r2,c,lfe和相關(guān)聯(lián)的上混參數(shù)是否表示如參照?qǐng)D13描述的13.1通道音頻信號(hào)。

控制部1009可以檢測(cè)所接收的信令s是指示11.1通道配置還是指示13.1通道配置,并且可以控制音頻解碼系統(tǒng)1000的其他部分執(zhí)行如參照?qǐng)D10描述的11.1通道音頻信號(hào)的參數(shù)重構(gòu)或如參照?qǐng)D13描述的13.1通道音頻信號(hào)的參數(shù)重構(gòu)。對(duì)于13.1通道配置可以例如采用單個(gè)編碼格式,而非如對(duì)于11.1通道配置的兩種或三種編碼格式。在信令s指示13.1通道配置的情況下,編碼格式因此可以被隱含地指示,并且信令s不需要明確地指示所選擇的編碼格式。

應(yīng)當(dāng)理解,盡管根據(jù)參照?qǐng)D6至圖8描述的11.1通道音頻信號(hào)來(lái)制定參照?qǐng)D1至圖5描述的示例實(shí)施方式,但是可以設(shè)想以下編碼系統(tǒng),其可以包括任意數(shù)量的編碼部,并且其可以被配置成對(duì)任意數(shù)量的m個(gè)通道音頻信號(hào)進(jìn)行編碼,其中m≥4。類(lèi)似地,應(yīng)當(dāng)理解,盡管根據(jù)參照?qǐng)D6至圖8描述的11.1通道音頻信號(hào)來(lái)制定參照?qǐng)D9至圖12描述的示例實(shí)施方式,但是可以設(shè)想以下解碼系統(tǒng),其可以包括任意數(shù)量的解碼部,并且其可以被配置成重構(gòu)任意數(shù)量的m通道音頻信號(hào),其中m≥4。

在一些示例實(shí)施方式中,編碼器側(cè)可以在所有三種編碼格式f1,f2,f3之間進(jìn)行選擇。在其他示例實(shí)施方式中,編碼器側(cè)可以在僅兩種編碼格式例如第一編碼格式f1和第二編碼格式f2之間進(jìn)行選擇。

圖14是根據(jù)示例實(shí)施方式的用于將m通道音頻信號(hào)編碼為雙通道下混信號(hào)以及相關(guān)聯(lián)的干上混系數(shù)和濕上混系數(shù)的編碼部1400的一般性框圖。編碼部1400可以被布置在圖3所示類(lèi)型的音頻編碼系統(tǒng)中。更準(zhǔn)確地說(shuō),它可以被布置在由編碼部100占據(jù)的位置中。如當(dāng)描述所示部件的內(nèi)部工作時(shí)將變得清楚的,編碼部1400可以以?xún)煞N不同的編碼格式操作;然而,可以在不脫離本發(fā)明的范圍的情況下實(shí)現(xiàn)能夠以三種或更多種編碼格式操作的類(lèi)似的編碼部。

編碼部1400包括下混部1410和分析部1420。對(duì)于可以是參照?qǐng)D6至圖7描述的編碼格式之一或者可以是不同的格式的編碼格式f1,f2中的至少選擇的一種(參見(jiàn)編碼部1400的控制部1430的下文描述),下混部1410根據(jù)編碼格式基于五通道音頻信號(hào)l,ls,lb,tfl,tbl計(jì)算雙通道下混信號(hào)l1,l2。在例如第一編碼格式f1中,下混信號(hào)的第一通道l1形成為五通道音頻信號(hào)l,ls,lb,tfl,tbl的第一組通道的線性組合(例如,五通道音頻信號(hào)l,ls,lb,tfl,tbl的第一組通道之和),并且下混信號(hào)的第二通道l2形成為五通道音頻信號(hào)l,ls,lb,tfl,tbl的第二組通道的線性組合(例如,五通道音頻信號(hào)l,ls,lb,tfl,tbl的第二組通道之和)。由下混部1410執(zhí)行的操作可以例如表示為式(1)。

對(duì)于編碼格式f1,f2中的至少所述選擇的一種,分析部1420確定限定近似五通道音頻信號(hào)l,ls,lb,tfl,tbl的相應(yīng)下混信號(hào)l1,l2的線性映射的干上混系數(shù)βl集合。對(duì)于編碼格式f1,f2中的每一個(gè),分析部1420基于各自的計(jì)算的差進(jìn)一步確定濕上混系數(shù)γl集合,濕上混系數(shù)γl與干上混系數(shù)βl一起允許從下混信號(hào)l1,l2以及從在解碼器側(cè)基于下混信號(hào)l1,l2確定的三通道去相關(guān)信號(hào)來(lái)進(jìn)行五通道音頻信號(hào)l,ls,lb,tfl,tbl的根據(jù)式(2)的參數(shù)重構(gòu)。濕上混系數(shù)集合γl限定去相關(guān)信號(hào)的線性映射,使得通過(guò)去相關(guān)信號(hào)的線性映射獲得的信號(hào)的協(xié)方差矩陣近似如接收的五通道音頻信號(hào)l,ls,lb,tfl,tbl的協(xié)方差矩陣與通過(guò)下混信號(hào)l1,l2的線性映射近似的五通道音頻信號(hào)的協(xié)方差矩陣之間的差。

下混部1410可以例如在時(shí)域中即基于五通道音頻信號(hào)l,ls,lb,tfl,tbl的時(shí)域表示來(lái)計(jì)算下混信號(hào)l1,l2,或在頻域中即基于五通道音頻信號(hào)l,ls,lb,tfl,tbl的頻域表示來(lái)計(jì)算下混信號(hào)l1,l2。至少在對(duì)編碼格式的決定不是頻率選擇性并且因此適用于m通道音頻信號(hào)的所有頻率分量的情況下,可以在時(shí)域中計(jì)算l1,l2;這是當(dāng)前優(yōu)選的情況。

分析部1420可以例如基于五通道音頻信號(hào)l,ls,lb,tfl,tbl的頻域分析來(lái)確定干上混系數(shù)βl和濕上混系數(shù)γl。頻域分析可以在m通道音頻信號(hào)的窗口部分上執(zhí)行。對(duì)于窗口,可以例如使用不相交的矩形或交疊的三角形窗口。出于確定干上混系數(shù)βl和濕上混系數(shù)γl的特定目的,分析部1420可以例如接收由下混部1410(圖14中未示出)計(jì)算的下混信號(hào)l1,l2,或者可以計(jì)算其自身版本的下混信號(hào)l1,l2。

編碼部1400還包括控制部1430,其負(fù)責(zé)選擇當(dāng)前使用的編碼格式??刂撇?430利用特定標(biāo)準(zhǔn)或特定理由來(lái)決定要選擇的編碼格式不是必須的。由控制部1430生成的信令s的值指示控制部1430對(duì)m通道音頻信號(hào)的當(dāng)前考慮部分(例如,時(shí)間幀)的決策的結(jié)果。信令s可以被包括在由其中包括編碼部1400的編碼系統(tǒng)300產(chǎn)生的比特流b中,以便于編碼音頻信號(hào)的重構(gòu)。此外,信令s被饋送到下混部1410和分析部1420中的每一個(gè),以通知這些部分要使用的編碼格式。與分析部1420類(lèi)似,控制部1430可以考慮m通道信號(hào)的窗口部分。出于完整性注意到,下混部1410可以相對(duì)于控制部1430以1幀或2幀的延遲和可能的另外的前瞻進(jìn)行操作??蛇x地,信令s還可以包含下混部1410產(chǎn)生的與下混信號(hào)的交叉衰落相關(guān)的信息和/或分析部1420提供的與干上混系數(shù)和濕上混系數(shù)的離散值的解碼器側(cè)插值相關(guān)的信息,以便確保子幀時(shí)間尺度上的同步性。

作為可選部件,編碼部1400可以包括穩(wěn)定器1440,其緊鄰控制部1430的下游布置,并且在控制部1430的輸出信號(hào)被其他部件處理之前立即作用于控制部1430的輸出信號(hào)?;谠撦敵鲂盘?hào),穩(wěn)定器1440將邊信息s提供給下游部件。穩(wěn)定器1440可以實(shí)現(xiàn)不過(guò)于頻繁地改變所選擇的編碼格式的期望目的。為此,穩(wěn)定器1440可以考慮針對(duì)m通道音頻信號(hào)的過(guò)去時(shí)間幀的大量代碼格式選擇,并且確保所選擇的編碼格式被保持多達(dá)至少預(yù)定義數(shù)量的時(shí)間幀??商孢x地,穩(wěn)定器可以對(duì)多個(gè)過(guò)去的編碼格式選擇(例如,表示為離散變量)應(yīng)用平均濾波器,這可以產(chǎn)生平滑效果。作為另一替選方案,穩(wěn)定器1440可以包括狀態(tài)機(jī),其被配置成如果狀態(tài)機(jī)確定由控制部1430提供的編碼格式選擇貫穿移動(dòng)時(shí)間窗口保持穩(wěn)定,則為移動(dòng)時(shí)間窗口中的所有時(shí)間幀提供邊信息s。移動(dòng)時(shí)間窗口可以與存儲(chǔ)多個(gè)過(guò)去時(shí)間幀的編碼格式選擇的緩沖器對(duì)應(yīng)。如研究本公開(kāi)內(nèi)容的技術(shù)人員容易實(shí)現(xiàn)的,這樣的穩(wěn)定功能可能需要伴隨有穩(wěn)定器1440與至少下混部1410和分析部1420之間的操作延遲的增加。該延遲可以借助于m通道音頻信號(hào)的緩沖部來(lái)實(shí)現(xiàn)。

需注意的是,圖14是圖3中的編碼系統(tǒng)的局部視圖。盡管圖14所示的部件僅涉及左側(cè)通道l,ls,lb,tfl,tbl的處理,但是編碼系統(tǒng)也處理至少右側(cè)通道r,rs,rb,tfr,tbr。例如,編碼部1400的另外的實(shí)例(例如,功能上等同的副本)可以并行操作,以對(duì)包括所述通道r,rs,rb,tfr,tbr的右側(cè)信號(hào)進(jìn)行編碼。盡管左側(cè)通道和右側(cè)通道對(duì)兩個(gè)分離的下混信號(hào)(或至少對(duì)公共下混信號(hào)的分離的通道組產(chǎn)生貢獻(xiàn))產(chǎn)生貢獻(xiàn),但是優(yōu)選使用所有通道的公共編碼格式。也就是說(shuō),左側(cè)編碼部1400內(nèi)的控制部1430可以負(fù)責(zé)決定用于左側(cè)通道和右側(cè)通道兩者的公共編碼格式;那么優(yōu)選地,控制部1430也訪問(wèn)右側(cè)通道r,rs,rb,tfr,tbr,或者訪問(wèn)從這些信號(hào)得到的量如協(xié)方差、下混信號(hào)等,并且可以在決定要使用的編碼格式時(shí)考慮這些。然后,信令s不僅被提供給(左側(cè))控制部1430的下混部1410和分析部1420,而且還提供給右側(cè)編碼部(未示出)的等效部分??商孢x地,可以通過(guò)使控制部1430本身對(duì)于編碼部1400的左側(cè)實(shí)例和其右側(cè)實(shí)例都是公共的來(lái)實(shí)現(xiàn)對(duì)所有通道使用公共編碼格式的目的。在圖3所示類(lèi)型的布局中,編碼部1430可以設(shè)置在分別負(fù)責(zé)左側(cè)通道和右側(cè)通道的編碼部100和另外的編碼部303兩者外部,以接收所有左側(cè)通道l,ls,lb,tfl,tbl和右側(cè)通道r,rs,rb,tfr,tbr并且輸出信令s,所述信令s指示編碼格式的選擇并且至少被提供給編碼部100和另外的編碼部303。

圖15示意性地示出了下混部1410的可能實(shí)現(xiàn),其被配置成根據(jù)信令s在兩個(gè)預(yù)定義編碼格式f1,f2之間交替并且提供這些編碼格式的交叉衰落。下混部1410包括兩個(gè)下混子部1411,1412,其被配置成接收m通道音頻信號(hào)并且輸出兩通道下混信號(hào)。兩個(gè)下混子部1411,1412盡管配置有不同的下混設(shè)置(例如,用于基于m通道音頻信號(hào)產(chǎn)生下混信號(hào)l1,l2的系數(shù)值),但仍可以是一個(gè)設(shè)計(jì)的功能上等同的副本。在正常操作中,兩個(gè)下混子部1411,1412一起根據(jù)第一編碼格式f1提供一個(gè)下混信號(hào)l1(f1),l2(f1)以及/或者根據(jù)第二編碼格式f2提供一個(gè)下混信號(hào)l1(f2),l2(f2)。下混子部1411,1412的下游設(shè)置有第一下混插值部1413和第二下混插值部1414。第一下混插值部1413被配置成對(duì)下混信號(hào)的第一通道l1進(jìn)行插值(包括交叉衰落),并且第二下混插值部1414被配置成對(duì)下混信號(hào)的第二通道l2進(jìn)行插值(包括交叉衰落)。第一下混插值部1413可以在至少以下?tīng)顟B(tài)中進(jìn)行操作:

a)僅第一編碼格式(l1=l1(f1)),如可以在第一編碼格式下的穩(wěn)態(tài)操作中使用的;

b)僅第二編碼格式(l1=l1(f2)),如可以在第二編碼格式下的穩(wěn)態(tài)操作中使用的;以及

c)根據(jù)兩種編碼格式的混合的下混通道(l1=α1l1(f1)+α2l1(f2),其中0<α1<1和0<α2<1),如可以在從第一編碼格式到第二編碼格式的轉(zhuǎn)變或者從第二編碼格式到第一編碼格式的轉(zhuǎn)變中使用的。

混合狀態(tài)(c)可以要求下混信號(hào)可從第一下混子部1411和第二下混子部1412兩者獲得。優(yōu)選地,第一下混插值部1413可以在多種混合狀態(tài)(c)下操作,使得精細(xì)子步驟中的轉(zhuǎn)變,或甚至準(zhǔn)連續(xù)的交叉衰落是可行的。這具有使交叉衰落較不可感知的優(yōu)點(diǎn)。例如,在α1+α2=1的插值器設(shè)計(jì)中,如果(α1,α2)的以下值被定義為:(0.2,0.8)、(0.4,0.6)、(0.6,0.4)、(0.8,0.2),則五步交叉衰落是可行的。第二下混插值部1414可以具有相同或相似的能力。

在上述混合部1410的實(shí)施方式的變形例中,如由圖15中的虛線所示,信令s也可以被饋送到第一下混子部1411和第二下混子部1412。如上面解釋的,然后可以抑制與未選擇的編碼格式相關(guān)聯(lián)的下混信號(hào)的生成。這會(huì)降低平均計(jì)算負(fù)荷。

該變化另外地或可替代地,兩種不同編碼格式的下混信號(hào)之間的交叉衰落可以通過(guò)使下混系數(shù)交叉衰落來(lái)實(shí)現(xiàn)。第一下混子部1411然后可以被饋送有經(jīng)插值的下混系數(shù)并且接收信令s作為輸入,所述經(jīng)插值的下混系數(shù)由存儲(chǔ)要在可用編碼格式f1,f2中使用的下混系數(shù)的預(yù)定義值系數(shù)插值器(未示出)產(chǎn)生。在該配置中,所有第二下混子部1412以及第一插值子部1413和第二插值子部1414可以被消除或永久地去激活。

下混部1410接收的信令s至少被提供給下混插值部1413,1414,但不一定提供給下混子部1411,1412。如果期望交替操作,即如果在編碼格式之間的轉(zhuǎn)變之外要減少下混合的冗余量,則需要將信令s提供給下混子部1411,1412。信令可以是例如參考下混插值部1413,1414的不同操作模式的低級(jí)命令,或者可以涉及高級(jí)指令,如在指定的起點(diǎn)處執(zhí)行預(yù)定義交叉衰落程序的命令(例如,各自具有預(yù)定義持續(xù)時(shí)間的一系列操作模式)。

轉(zhuǎn)到圖16,示出了被配置成根據(jù)信令s在兩個(gè)預(yù)定義編碼格式f1,f2之間交替的分析部1420的可能實(shí)現(xiàn)。分析部1420包括被配置成接收m通道音頻信號(hào)并輸出干上混系數(shù)和濕上混系數(shù)的兩個(gè)分析子部1421,1422。兩個(gè)分析子部1421,1422可以是一個(gè)設(shè)計(jì)的功能上等同的副本。在正常操作中,兩個(gè)分析子部1421,1422一起提供根據(jù)第一編碼格式f1的一個(gè)干上混系數(shù)βl(f1)和濕上混系數(shù)γl(f1)集合以及/或者提供根據(jù)第二編碼格式f2的一個(gè)干上混系數(shù)βl(f2)和濕上混系數(shù)γl(f2)集合。

如上文對(duì)于分析部1420整體所解釋的,可以從下混部1410接收當(dāng)前的下混信號(hào),或者可以在分析部1420中產(chǎn)生該信號(hào)的副本。更準(zhǔn)確地說(shuō),第一分析子部1421可以從下混部1410中的第一下混子部1411接收根據(jù)第一編碼格式f1的下混信號(hào)l1(f1),l2(f1),或者可以自己產(chǎn)生一個(gè)副本。類(lèi)似地,第二分析子部1422可以從第二下混子部1412接收根據(jù)第二編碼格式f2的下混信號(hào)l1(f2),l2(f2),或者可以自己產(chǎn)生該信號(hào)的副本。

分析部1421,1422的下游布置有干上混系數(shù)選擇器1423和濕上混系數(shù)選擇器1424。干上混系數(shù)選擇器1423被配置成從第一分析子部1421或第二分析子部1422中轉(zhuǎn)發(fā)干上混系數(shù)βl集合,并且濕上混系數(shù)選擇器1424被配置成從第一分析子部1421或第二分析子部1422轉(zhuǎn)發(fā)濕上混系數(shù)γl集合。干上混系數(shù)選擇器1423可以在至少上面針對(duì)第一下混插值部1413所討論的狀態(tài)(a)和(b)下進(jìn)行處理。然而,如果圖3的編碼系統(tǒng)——其一部分在此被描述——被配置成與解碼系統(tǒng)協(xié)作,所述解碼系統(tǒng)像圖9所示的解碼系統(tǒng)一樣基于其接收的上混系數(shù)的插值離散值執(zhí)行參數(shù)重構(gòu),則不需要配置如針對(duì)下混插值部1413,1414所限定的混合狀態(tài)(c)。濕上混系數(shù)選擇器1424可以具有類(lèi)似的功能。

分析部1420接收的信令s至少被提供給濕上混系數(shù)選擇器1423和干上混系數(shù)選擇器1424。分析子部1421,1422不需要接收信令,盡管這有利于避免轉(zhuǎn)變之外的上混系數(shù)的冗余計(jì)算。信令可以是例如參考干上混系數(shù)選擇器1423和濕上混系數(shù)選擇器1424的不同操作模式的低級(jí)命令,或者可以涉及高級(jí)指令,如在給定時(shí)間幀內(nèi)從一種編碼格式轉(zhuǎn)變到另一種編碼格式的命令。如上所述,這優(yōu)選地不涉及交叉衰落操作,但是可以相當(dāng)于對(duì)合適的時(shí)間點(diǎn)限定上混系數(shù)的值,或者限定這些值在合適的時(shí)間點(diǎn)處應(yīng)用。

現(xiàn)在將描述根據(jù)示例實(shí)施方式的作為用于將m通道音頻信號(hào)編碼為雙通道下混信號(hào)的方法的變型的方法1700,其被示意性地示出為圖17中的流程圖。在此所舉例說(shuō)明的方法可以由包括上面參照?qǐng)D14至圖16描述的編碼部1400的音頻編碼系統(tǒng)來(lái)執(zhí)行。

音頻編碼方法1700包括:接收1710m通道音頻信號(hào)l,ls,lb,tfl,tbl;選擇1720參照?qǐng)D6至圖8描述的編碼格式f1,f2,f3中的至少兩種之一;針對(duì)選擇的編碼格式基于m通道音頻信號(hào)l,ls,lb,tfl,tbl計(jì)算1730雙通道下混信號(hào)l1,l2;輸出1740所選擇的編碼格式的下混信號(hào)l1,l2和基于下混信號(hào)實(shí)現(xiàn)m通道音頻信號(hào)的參數(shù)重構(gòu)的邊信息;并且輸出1750指示所選擇的編碼格式的信令s。該方法例如針對(duì)m通道音頻信號(hào)的每個(gè)時(shí)間幀重復(fù)。如果選擇1720的結(jié)果是與緊接著之前所選擇的編碼格式不同的編碼格式,則下混信號(hào)在合適的持續(xù)時(shí)間內(nèi)通過(guò)根據(jù)先前的及當(dāng)前的編碼格式的下混信號(hào)之間的交叉衰落來(lái)代替。如已經(jīng)討論的,不需要或不可能對(duì)可能經(jīng)受固有的解碼器側(cè)插值的邊信息進(jìn)行交叉衰落。

注意,在此描述的方法可以在沒(méi)有圖4所示的四個(gè)步驟430、440、450和470中的一個(gè)或更多個(gè)的情況下實(shí)現(xiàn)。

四、等同、擴(kuò)展、替選和其他

即使本公開(kāi)內(nèi)容描述和示出了具體示例實(shí)施方式,但是本發(fā)明不限于這些具體示例。在不脫離由僅所附權(quán)利要求限定的本發(fā)明的范圍的情況下,可以對(duì)上述示例實(shí)施方式進(jìn)行修改和變化。

在權(quán)利要求中,“包括(comprising)”一詞并不排除其他元件或步驟,并且不定冠詞“一(a)”或“一個(gè)(an)”不排除多個(gè)。在相互不同的從屬權(quán)利要求中記載某些措施的事實(shí)并不指示這些措施的組合不能有利地使用。權(quán)利要求中出現(xiàn)的任何附圖標(biāo)記不應(yīng)被理解為限制其范圍。

以上公開(kāi)的裝置和方法可以被實(shí)現(xiàn)為軟件、固件、硬件或其組合。在硬件實(shí)現(xiàn)中,在上述描述中提及的功能單元之間的任務(wù)劃分不一定與物理單元的劃分對(duì)應(yīng);相反,一個(gè)物理部件可以具有多個(gè)功能,并且一個(gè)任務(wù)可以通過(guò)合作的幾個(gè)物理部件以分布式方式來(lái)執(zhí)行。某些部件或所有部件可以被實(shí)現(xiàn)為由數(shù)字處理器、信號(hào)處理器或微處理器執(zhí)行的軟件,或被實(shí)現(xiàn)為硬件或?qū)S眉呻娐?。這樣的軟件可以分布在可以包括計(jì)算機(jī)存儲(chǔ)介質(zhì)(或非暫態(tài)介質(zhì))和通信介質(zhì)(或暫態(tài)介質(zhì))的計(jì)算機(jī)可讀介質(zhì)上。如本領(lǐng)域技術(shù)人員所熟知的,術(shù)語(yǔ)“計(jì)算機(jī)存儲(chǔ)介質(zhì)”包括以用于存儲(chǔ)如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)的信息的任意方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性、可移動(dòng)和不可移動(dòng)介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括但不限于ram、rom、eeprom、閃存或其他存儲(chǔ)器技術(shù)、cd-rom、數(shù)字通用盤(pán)(dvd)或其他光盤(pán)存儲(chǔ)器、磁帶盒、磁帶、磁盤(pán)存儲(chǔ)器或其他磁存儲(chǔ)這種或者可用于存儲(chǔ)所需信息并可由計(jì)算機(jī)訪問(wèn)的任何其他介質(zhì)。此外,本領(lǐng)域技術(shù)人員眾所周知的是,通信介質(zhì)通常在如載波或其他傳輸機(jī)制的調(diào)制數(shù)據(jù)信號(hào)中體現(xiàn)計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù),并且包括任何信息傳遞介質(zhì)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1