專利名稱:音頻編碼和解碼中相位信息的有效利用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻編碼和音頻解碼,更具體地說,涉及一種當(dāng)相位信息的重建是感 知相關(guān)時選擇性地提取和/或傳輸相位信息的編碼和解碼方案。
背景技術(shù):
例如雙耳線索編碼(BCC)、參數(shù)立體聲(PS)或MPEG環(huán)繞(MPS)的最近的參數(shù)多信 道編碼方案使用人類聽覺系統(tǒng)的針對空間感知的線索的緊湊參數(shù)表示。這允許了具有兩個 或多個音頻信道的音頻信號的速率有效表示。為此,編碼器進(jìn)行從M個輸入信道至N個輸 出信道的降混,且將所提取的線索連同該降混信號一起傳輸。此外,根據(jù)人類感知的原理對 這些線索進(jìn)行量化,即,人類聽覺系統(tǒng)無法聽到或無法區(qū)別的信息可被刪除或粗略量化。當(dāng)降混信號為“一般性”音頻信號時,這種原始音頻信號的編碼表示所消耗的帶寬 可以通過使用單信道音頻壓縮器對降混信號或降混信號的信道進(jìn)行壓縮而進(jìn)一步減少。在 下文中,將各種類型的這些單信道音頻壓縮器概括為核心編碼器。用于描述兩個或多個音頻信道間的空間相互關(guān)系的典型線索是將輸入信道間的 電平關(guān)系進(jìn)行參數(shù)化的信道間電平差(ILD)、將輸入信道間的統(tǒng)計相依性進(jìn)行參數(shù)化的信 道間互相關(guān)性/相干性(ICC),以及將輸入信道的類似信號段間的時間或相位差進(jìn)行參數(shù) 化的信道間時間/相位差(ITD或IPD)。為了維持由降混與先前描述的線索所表示的信號的高感知質(zhì)量,通常是針對不同 頻帶計算個別線索。也就是,針對該信號的給定時段,傳輸將相同屬性進(jìn)行參數(shù)化的多個線 索,每個線索-參數(shù)表示信號的預(yù)定頻帶。可以在時間和頻率上依賴于接近于人類的頻率分辨率的標(biāo)尺來計算這些線索。無 論何時當(dāng)表示多信道音頻信號時,相應(yīng)的解碼器基于傳輸?shù)目臻g線索和降混傳輸?shù)男盘?(因此所傳輸?shù)慕祷斐1环Q為載波信號)進(jìn)行從M信道至N信道的升混。通常,得到的升混信道可描述為傳輸?shù)慕祷斓碾娖胶拖辔患訖?quán)版本。如傳輸?shù)南?關(guān)性參數(shù)(ICC)所指示的,通過對傳輸?shù)慕祷煨盘?“干”信號)和從該降混信號導(dǎo)出的去 相關(guān)信號(“濕”信號)進(jìn)行混合與加權(quán),可以合成在編碼信號的同時導(dǎo)出的去相關(guān)性。這 樣,升混信道與原始信道相比具有彼此類似的相關(guān)性。通過將該降混饋送至濾波器鏈例如 全通濾波器和延遲線,可產(chǎn)生去相關(guān)信號(即,當(dāng)與傳輸?shù)男盘柣ハ嚓P(guān)時具有接近于零的 互相關(guān)性系數(shù)的信號)。然而,可以使用其它導(dǎo)出去相關(guān)信號的方式。顯然,在前述編碼/解碼方案的特定實現(xiàn)中,必須進(jìn)行編碼信號的傳輸比特率(理 想的是盡可能地低)與可實現(xiàn)的質(zhì)量(理想的是盡可能地高)間的折衷。因此,可以決定不傳輸空間線索的完整集合,而忽略一個特定參數(shù)的傳輸。附加 地,此決定可能受到選擇適當(dāng)?shù)纳斓挠绊?。例如,適當(dāng)?shù)纳炜善骄卦佻F(xiàn)未傳輸?shù)目臻g 線索。也就是,至少針對完整帶寬信號的長期分段,保留平均空間屬性。特別地,并非所有參數(shù)多信道方案都使用信道間時間差或信道間相位差,從而避 免相應(yīng)的計算或合成。例如MPEG環(huán)繞等方案僅依賴于ILD和ICC的合成。通過去相關(guān)性合成隱性地對信道間相位差進(jìn)行近似,該去相關(guān)性合成將兩種去相關(guān)信號的表示與所傳輸 的降混信號進(jìn)行混合,其中兩種表示具有180度的相對相移。忽略IPD的傳輸,從而減少參 數(shù)信息的需要量,同時接受再現(xiàn)質(zhì)量的惡化。因此,需要提供更佳的信號重建質(zhì)量而不明顯增加所需的比特率。
發(fā)明內(nèi)容
本發(fā)明的一個實施例通過使用相位估計器來實現(xiàn)上述目的,當(dāng)輸入音頻信號之間 的相移超過預(yù)定閾值時,該相位估計器導(dǎo)出指示第一和第二輸入音頻信號間的相位關(guān)系的 相位信息。當(dāng)從感知觀點來看,需要傳輸相位信息時,用于將空間參數(shù)和降混信號包括到輸 入音頻信號的編碼表示中的關(guān)聯(lián)輸出接口將僅包括導(dǎo)出的相位信息。為此,可連續(xù)進(jìn)行相位信息的確定,且可以基于閾值僅進(jìn)行是否要包括該相位信 息的判定。例如,該閾值可描述針對其不需要附加相位信息處理來實現(xiàn)重建后的信號的可 接受質(zhì)量的最大容許相移。可選地,輸入音頻信號間的相移可以與相位信息的實際產(chǎn)生無關(guān)地導(dǎo)出,這樣,僅 當(dāng)超過相位閾值時才進(jìn)行導(dǎo)出相位信息的正式相位分析??蛇x地,可以實現(xiàn)空間輸出模式判決器,其接收連續(xù)產(chǎn)生的相位信息,并且僅當(dāng)滿 足相位信息條件時,即,例如,當(dāng)輸入信號間的相位差超過預(yù)定閾值時,該判決器才操控輸 出接口以包括相位信息。也就是說,輸出接口主要將ICC參數(shù)和ILD參數(shù)以及降混信號僅包括到輸入音頻 信號的編碼表示中。當(dāng)出現(xiàn)具有特定信號特征的信號時,附加地包括所確定的相位信息,從 而可以較高質(zhì)量地重建使用編碼表示重建的信號。但是,這可以僅以最小量附加傳輸信息 來實現(xiàn),因為確實僅針對關(guān)鍵的那些信號部分傳輸相位信息。這一方面允許高質(zhì)量重建,而另一方面允許低比特率實現(xiàn)。本發(fā)明的另一實施例對該信號進(jìn)行分析來導(dǎo)出信號特征信息,該信號特征信息用 于在具有不同信號類型或特征的輸入音頻信號之間進(jìn)行區(qū)分。例如,這可以是不同特征的 語音信號和音樂信號。當(dāng)輸入音頻信號具有第一特征時,僅需要相位估計器;而當(dāng)輸入音頻 信號具有第二特征時,相位估計可以作廢。因此,當(dāng)編碼其中需要相位合成的信號以提供重 建后信號的可接受質(zhì)量時,輸出接口僅包括該相位信息。其它空間線索例如相關(guān)性信息(例如ICC參數(shù))被持久地包括在編碼表示中,因 為其存在對信號類型或信號特征這兩者可能均較為重要。對于信道間電平差也一樣如此, 該信道間電平差主要是描述兩個重建的信道間的能量關(guān)系。在另一實施例中,可基于其它空間線索,諸如基于第一和第二輸入音頻信號間的 相關(guān)性ICC,來進(jìn)行相位估計。當(dāng)存在包括信號特征上的一些附加限制的特征信息時,這是 可行的。于是,除了統(tǒng)計信息之外,也可使用ICC參數(shù)來提取相位信息。根據(jù)另一個實施例,可極其比特有效地包括相位信息,因為僅實現(xiàn)一個相位切換, 對具有預(yù)定大小的相移的應(yīng)用信號通知。雖然如此,如下文中所詳細(xì)描述的,在再現(xiàn)中粗略 重建相位關(guān)系可能對某些信號類型就足夠了。在另外的實施例中,能夠以高得多的分辨率 (例如10個或20個的不同相移)來對相位信息進(jìn)行信號通知,或者甚至作為用于給定-180 度至+180度的可能的相對相位角的連續(xù)參數(shù)來進(jìn)行信號通知。
當(dāng)信號特征已知時,可僅對少數(shù)頻帶傳輸相位信息,該頻帶數(shù)目可能遠(yuǎn)小于用于 導(dǎo)出ICC參數(shù)和/或ILD參數(shù)的頻帶數(shù)目。例如,當(dāng)已知音頻輸入信號具有語音特征時,對 于整個帶寬僅需要一個單個相位信息。在另一附加實施例中,可以針對例如IOOHz至5kHz 間的頻率范圍導(dǎo)出單個相位信息,因為假設(shè)揚(yáng)聲器的信號能量主要分布于此頻率范圍內(nèi)。 例如,當(dāng)相移超過90度或超過60度時,針對全部帶寬的公共相位信息參數(shù)是可行的。此外,當(dāng)信號特征已知時,通過將閾值標(biāo)準(zhǔn)應(yīng)用到所述參數(shù),可以從已存在的ICC 參數(shù)或相關(guān)性參數(shù)直接導(dǎo)出相位信息。例如當(dāng)ICC參數(shù)小于-0. 1時,可以斷定此相關(guān)性參 數(shù)與固定的相移相對應(yīng),因為輸入音頻信號的語音特征限制了其它參數(shù),在下文中將詳細(xì) 描述的。在本發(fā)明的另一實施例中,當(dāng)將該相位信息包括到比特流中時,還對從信號導(dǎo)出 的ICC參數(shù)(相關(guān)性參數(shù))進(jìn)行修改或后處理。這利用了下述事實ICC(相關(guān)性)參數(shù)實 際上可以包括與兩個特征有關(guān)的信息,即,與輸入音頻信號間的統(tǒng)計相依性有關(guān)的信息、以 及與這些信號間的相移有關(guān)的信息。因此,當(dāng)傳輸附加相位信息時,對相關(guān)性參數(shù)進(jìn)行修 改,使得在重建信號時,盡可能最佳地分離地考慮相位和相關(guān)性。在完全后向兼容的情境下,也可以通過本發(fā)明解碼器的實施例來進(jìn)行這樣的相關(guān) 性修改。當(dāng)解碼器接收附加相位信息時可激活相關(guān)性修改。為了實現(xiàn)這種感知上優(yōu)異的重建,本發(fā)明的音頻編碼器的實施例可包括附加信號 處理器,該附加信號處理器對由音頻解碼器的內(nèi)部升混器所產(chǎn)生的中間信號進(jìn)行操作。例 如,升混器會接收降混信號和除了相位信息(ICC和ILD)以外的全部空間線索。升混器導(dǎo) 出具有如空間線索所描述的信號屬性的第一和第二中間音頻信號。為此,可以預(yù)見附加混 響(去相關(guān))信號的產(chǎn)生,以便對去相關(guān)信號部分(濕信號)和傳輸?shù)慕祷煨诺?干信號) 進(jìn)行混合。然而,當(dāng)音頻解碼器接收到相位信息時,中間信號后處理器會將附加相移應(yīng)用到 中間信號的至少一個。即,僅當(dāng)傳輸附加相位信息時,該中間信號后處理器才可操作。也就 是,本發(fā)明的音頻解碼器的實施例與傳統(tǒng)的音頻解碼器完全兼容。在解碼器的一些實施例中的處理以及在編碼器側(cè)的處理可以按照時間和頻率選 擇性方式來進(jìn)行。也就是,可以處理具有多個頻帶的一連串相鄰時間片。因此音頻編碼器 的一些實施例包括了信號組合器,以對所產(chǎn)生的中間音頻信號和后處理的中間音頻信號進(jìn) 行組合,使得該編碼器輸出時間連續(xù)的音頻信號。換句話說,針對第一幀(時段),信號組合器可以使用由升混器所導(dǎo)出的中間音頻 信號;而針對第二幀,信號組合器可以使用后處理的中間信號,因為該信號由中間信號后處 理器導(dǎo)出。除了引入相移之外,當(dāng)然也可以在該中間信號后處理器中實現(xiàn)更先進(jìn)的信號處理。可選地或附加地,音頻解碼器的實施例可以包括相關(guān)性信息處理器,諸如當(dāng)附加 地接收到相位信息時對所接收的相關(guān)性信息ICC進(jìn)行后處理。然后,由傳統(tǒng)升混器使用后 處理的相關(guān)性信息來產(chǎn)生中間音頻信號,使得結(jié)合由信號后處理器所引入的相移,可以實 現(xiàn)音頻信號的自然聲音再現(xiàn)。
在下文中將參考附圖描述本發(fā)明的多個實施例,其中,圖1示出了用于從降混信號產(chǎn)生兩個輸出信號的升混器;圖2示出了由圖1的升混器使用ICC參數(shù)的實例;圖3示出了要被編碼的音頻輸入信號的信號特征的實例;圖4示出了音頻編碼器的實施例;圖5示出了音頻編碼器的另一實施例;圖6示出了由圖4和圖5的編碼器中的一個所產(chǎn)生的音頻信號的編碼表示的實例;圖7示出了編碼器的另一實施例;圖8示出了用于語音/音樂編碼的編碼器的另一實施例;圖9示出了解碼器的實施例;圖10示出了解碼器的另一實施例;圖11示出了解碼器的另一實施例;圖12示出了語音/音樂解碼器的實施例;圖13示出了一種編碼方法的實施例;以及圖14示出了一種解碼方法的實施例。
具體實施例方式圖1示出了一種可以用于解碼器的實施例中的升混器,使用降混信號6來產(chǎn)生第 一中間音頻信號2和第二中間音頻信號4。此外,使用附加信道間相關(guān)性信息和信道間電平 差信息作為控制升混的放大器的操控參數(shù)。升混器包括去相關(guān)器10、三個具有相關(guān)性的關(guān)聯(lián)的放大器1 至12c、第一混合節(jié) 點14a、第二混合節(jié)點14b、以及第一和第二電平關(guān)聯(lián)的放大器16a和16b。降混音頻信號6 是分配到去相關(guān)器10和分配到去相關(guān)的關(guān)聯(lián)的放大器1 和12b的輸入的單聲信號(mono signal)。去相關(guān)器10使用該降混音頻信號6,根據(jù)去相關(guān)性算法創(chuàng)建該信號的去相關(guān)版 本。將去相關(guān)音頻信道(去相關(guān)信號)輸入到第三相關(guān)性關(guān)聯(lián)的放大器12c中??梢宰⒁?到,僅包括降混音頻信號的樣本的升混器的信號分量經(jīng)常也稱作為“干”信號;而僅包括去 相關(guān)信號的樣本的信號分量常稱作“濕”信號。ICC關(guān)聯(lián)放大器12a至12c根據(jù)取決于傳輸?shù)腎CC參數(shù)的縮放規(guī)則來縮放濕信號 分量和干信號分量?;旧?,在通過求和節(jié)點Ha和14b對干和濕信號分量求和之前,調(diào)整 這些信號的能量。為此,將相關(guān)性關(guān)聯(lián)的放大器12a的輸出提供至第一求和節(jié)點14a的第 一輸2 ;而將相關(guān)性關(guān)聯(lián)的放大器12b的輸出信號提供至求和節(jié)點14b的第一輸入。將與 濕信號關(guān)聯(lián)的相關(guān)性關(guān)聯(lián)的放大器12c的輸出提供至第一求和節(jié)點1 的第二輸入以及第 二求和節(jié)點14b的第二輸入。然而,如圖1所示,求和節(jié)點處的濕信號的符號的不同在于 以負(fù)號的方式將其輸入到第一求和節(jié)點14a,而將具有原始符號的濕信號輸入到第二求和 節(jié)點14b中。即,將去相關(guān)信號與具有其原始相位的第一干信號分量混合,而將其與具有反 向相位(即,有180度相移)的第二干信號分量混合。如已經(jīng)解釋的,依據(jù)相關(guān)性參數(shù)對能量比進(jìn)行在先調(diào)整,使得從求和節(jié)點1 和 14b輸出的信號具有與原始編碼信號的相關(guān)性(其由傳輸?shù)腎CC參數(shù)進(jìn)行參數(shù)化)類似的相關(guān)性。最后,使用能量關(guān)聯(lián)放大器16a和16b對第一信道2與第二信道4間的能量關(guān)系 進(jìn)行調(diào)整。能量關(guān)系由ILD參數(shù)進(jìn)行參數(shù)化,使得兩個放大器均由取決于ILD參數(shù)的函數(shù) 來操控。也就是,所產(chǎn)生的左信道2和右信道4具有與原始編碼信號的統(tǒng)計相依性類似的 統(tǒng)計相依性。然而,對直接源自于傳輸?shù)慕祷煲纛l信號6的所產(chǎn)生的第一(左)和第二(右) 輸出信號2和4的貢獻(xiàn)在于具有相同相位。雖然圖1假定了升混的寬帶實現(xiàn),但另一實現(xiàn)可對多個并行頻帶分別進(jìn)行升混, 使得圖4的升混器可以對原始信號的帶寬受限表示進(jìn)行操作。于是,可通過在最終合成混 合中添加所有帶寬受限輸出信號,來獲得具有全頻帶的已重建信號。圖2示出了用于操控具有相關(guān)性的關(guān)聯(lián)的放大器1 至12c的ICC參數(shù)相依函數(shù) 的實例。使用該函數(shù)并從要被編碼的原始信道適當(dāng)導(dǎo)出ICC參數(shù),可粗略(平均地)再現(xiàn) 原始編碼信號間的相移。針對此討論,了解所傳輸?shù)腎CC參數(shù)的產(chǎn)生是必要的。本討論的 基礎(chǔ)可以是從要被編碼的兩個輸入音頻信號的兩個相應(yīng)信號段之間所導(dǎo)出的復(fù)數(shù)信道間 相干性參數(shù),定義如下
ICC復(fù)數(shù)=Λ ΣΣ\^, )\2ΣΣ\^
V k Ik I上式中,指標(biāo)1是所處理的信號段內(nèi)部的樣本數(shù)目,而可選指標(biāo)k表示多個子帶中 的一個,根據(jù)一些特定實施例,可以由一個單一 ICC參數(shù)表示。換句話說,X1和\是兩個信 道的復(fù)數(shù)值子帶樣本,k是子帶指標(biāo),而1是時間指標(biāo)。通過將原始取樣的輸入信號饋送到QMF濾波器組,可以導(dǎo)出復(fù)數(shù)值子帶樣本,例 如導(dǎo)出64個子帶,其中每個子帶內(nèi)部的樣本以復(fù)數(shù)值的數(shù)來表示。通過使用前面的公式來 計算復(fù)數(shù)互相關(guān)性,以一個復(fù)數(shù)值參數(shù)(即,參數(shù)ICCss)使兩個相應(yīng)信號段特征化,該參 數(shù)ICCsii具有下列性質(zhì)其長度I ICC I表示兩個信號的相干性。矢量越長,則兩個信號間的統(tǒng)計相依性越高。也就是說,無論何時當(dāng)ICCsii的長度或絕對值等于1時,除了一個全局縮放因子之 外,兩個信號完全相同。但是可以具有相對相位差,相對相位差則由ICCsii的相位角產(chǎn)生。 在此情況下,ICCss相對于實軸的角度表示兩個信號間的相位角。但是,當(dāng)使用多于一個子 帶(即,k彡2)進(jìn)行ICCsii的導(dǎo)出時,相位角因而是所有已處理的參數(shù)頻帶的平均角度。換句話說,當(dāng)兩個信號是統(tǒng)計上強(qiáng)相依的(I ICC復(fù)數(shù)I ^ 1)時,實數(shù)部分Re UCCs 近似為相位角的余弦,并因而為信號間相位差的余弦。當(dāng)ICCsii的絕對值顯著低于1時,不再將矢量ICCsii與實軸間的角度θ解譯為相 同信號間的相位角。相反,其是統(tǒng)計上相當(dāng)獨立的信號間的最佳匹配相位。圖3給出了可能的矢量ICCs數(shù)的三個實例20a、20b和20c。矢量20a的絕對值 (長度)接近于單位1,意味著矢量20a所表示的兩個信號幾乎相同,但彼此相移。換句話 說,兩個信號是高度相干的。在此情況下,相位角30 (Θ)直接與幾乎相同的信號之間的相移相對應(yīng)。然而,如果ICC復(fù)數(shù)的評估得到矢量20b,則相位角θ的含義不再是明確確定的。 因為復(fù)數(shù)矢量20b具有顯著低于1的絕對值,兩個已分析信號部分或信號在統(tǒng)計上是相當(dāng) 獨立的。即,所觀察的時段內(nèi)的信號不具有共同形狀。另外,相位角30有一些表示與兩個 信號的最佳匹配相對應(yīng)的相移。但是,當(dāng)這些信號是非相干的時,兩個信號間的共同相移幾 乎不重要。此外,矢量20c也有接近于單位1的絕對值,因而可以將其相位角32 (Φ)再次無 疑義地識別為兩個類似信號間的相位差。此外,顯而易見的是,大于90度的相移與矢量ICC ^勺實數(shù)部分相對應(yīng),該實數(shù)部分小于0。在關(guān)注兩個或更多已編碼信號的統(tǒng)計相依性的正確構(gòu)建的音頻編碼方案中,圖1 示出了從傳輸?shù)慕祷煨诺绖?chuàng)建第一和第二輸出信道的可能升混進(jìn)程。作為控制具有相關(guān)性的關(guān)聯(lián)的放大器20a-20c的ICC相依函數(shù),經(jīng)常使用圖2所 示的函數(shù),以允許從完全相關(guān)信號到完全去相關(guān)信號的平滑過渡,而不會引入任何不連續(xù)。 圖2示出了如何在干信號分量(通過操控放大器1 和12b)與濕信號分量(通過操控放 大器12c)之間分配信號能量。為了實現(xiàn)此目的,傳輸ICCs數(shù)的實數(shù)部分,作為針對ICCfiii 的長度的度量,并因而作為針對信號之間的相似性的度量。在圖2中,χ軸給出了傳輸?shù)腎CC參數(shù)的值,y軸給出了由升混器的求和節(jié)點1 和14b混合在一起的干信號(實線30a)和濕信號(虛線30b)的能量的量。即,當(dāng)信號極 好地相關(guān)(相同的信號形狀,相同的相位)時,傳輸?shù)腎CC參數(shù)將為單位1。因此,升混器將 所接收的降混音頻信號6分配至輸出,而不添加任何濕信號部分。由于降混音頻信號基本 上是編碼的原始信道的求和,因此,就相位和相關(guān)性而言該再現(xiàn)是正確的。然而,如果信號反相關(guān)(相位=180度,相同的信號形狀),則傳輸?shù)腎CC參數(shù) 為-1。因此,重建后的信號將不包括干信號的信號部分,而僅包括濕信號的信號分量。由于 將濕信號部分添加到第一音頻信道,并從產(chǎn)生的第二音頻信道扣除,信號之間的相移被正 確重建為180度。但是,該信號根本不包括任何干信號部分。這是不利的,因為干信號實際 上包括傳輸至解碼器的整個直接信息。因此,可以降低已重建信號的信號質(zhì)量。然而,該降低取決于所編碼的信號類型, 即,取決于底層信號的信號特征。一般來說,由去相關(guān)器10所提供的相關(guān)信號具有類似混 響的聲音特征。也就是說,例如,與語音信號相比,僅使用去相關(guān)信號所導(dǎo)致的聽覺失真對 于音樂信號而言是相當(dāng)?shù)偷?,其中根?jù)混響的音頻信號的重建會導(dǎo)致不自然的聲音。概括地說,前述解碼方案僅粗略對相位特性進(jìn)行近似,因為至多對其進(jìn)行平均地 恢復(fù)。這是極為粗糙的近似,由于其僅通過改變添加的信號來實現(xiàn),其中,所添加的信號部 分具有180度的相對相位差。對于明確去相關(guān)的信號或者甚至是反相關(guān)的信號(ICC <0), 需要相當(dāng)?shù)牧康娜ハ嚓P(guān)信號來恢復(fù)此去相關(guān),即信號間的統(tǒng)計獨立性。通常,由于作為全通 濾波器輸出的去相關(guān)信號具有”混響狀”聲音,極大降低了可達(dá)到的總體質(zhì)量。如已經(jīng)提到的,針對一些信號類型,相位關(guān)系的恢復(fù)較不重要,但對其它信號類 型,正確恢復(fù)可能是感知上相關(guān)的。尤其是,當(dāng)從這些信號導(dǎo)出的相位信息滿足某種感知上 激勵的相位重建標(biāo)準(zhǔn)時,可能需要原始相位關(guān)系的重建。因此,當(dāng)滿足某種相位特性時,本發(fā)明的一些實施例確實將相位信息包括到音頻信號的編碼表示中。即當(dāng)優(yōu)勢(在速率失真估計中)明顯時,僅有時傳輸相位信息。此外, 可以對傳輸?shù)南辔恍畔⑦M(jìn)行粗略量化,從而僅需要少量的附加比特率。給定傳輸?shù)南辔恍畔?,可以利用干信號分量之間、即從原始信號直接導(dǎo)出的信號 分量(因而感知上高度相關(guān))之間的正確相位關(guān)系來重建該信號。例如,如果以ICCsii矢量20c來對信號進(jìn)行編碼,則傳輸?shù)腎CC參數(shù)(ICCsii的實 數(shù)部分)近似為-0.4。也就是,在升混中,大于50%能量將從去相關(guān)信號導(dǎo)出。但是,因為 可聽見的能量的量仍源自于降混音頻信道,因此由于可聽見,源自于降混音頻信道的信號 分量間的相位關(guān)系仍然較為重要。即,更接近地對重建信號的干信號部分間的相位關(guān)系進(jìn) 行近似是可期望的。因此,一旦確定原始音頻信道間的相移大于預(yù)定閾值,則傳輸附加相位信息。根據(jù) 特定實現(xiàn),這樣的閾值實例可以是60度、90度或120度。根據(jù)該閾值,可以以高分辨率來傳 輸該相位關(guān)系,即,信號通知多個預(yù)定相移中的一個,或傳輸連續(xù)改變的相位角。在本發(fā)明的一些實施例中,僅傳輸單一相移指示器或相位信息,用于指示重建信 號的相位將以預(yù)定相位角偏移。根據(jù)一個實施例,僅當(dāng)ICC參數(shù)在預(yù)定負(fù)值范圍內(nèi)時才應(yīng) 用此相移。根據(jù)相位閾值標(biāo)準(zhǔn),此范圍例如可為-1至-0.3或-0.8至-0.3。也就是說,可 能需要一個單個比特的相位信息。當(dāng)ICCe的實數(shù)部分為正時,由于干信號分量的相位相同處理,由圖1的升混器正 確地對已重建信號間的相位關(guān)系進(jìn)行平均地近似。然而,如果所傳輸?shù)腎CC參數(shù)低于0,則原始信號的相移平均大于90度。同時,由 升混器使用干信號的仍然可聽的信號部分。因此,在始于ICC = 0至例如ICC近似為-0. 6 的區(qū)域中,固定相移(例如,對應(yīng)于與前面引入的區(qū)間的中間相對應(yīng)的相移)能夠僅以一個 單個傳輸比特的代價,來提供具有顯著增加的感知質(zhì)量的重建信號。例如,當(dāng)ICC參數(shù)行進(jìn) 至更小數(shù)值例如低于-0. 6時,僅第一和第二輸出信道2和4中的少量信號能源自于干信號 分量。因此可以再次跳過對這些感知上較不相關(guān)的信號部分間的正確相位特性的恢復(fù),因 為干信號部分幾乎根本不可聽。圖4示出了用于產(chǎn)生第一輸入音頻信號40a和第二輸入音頻信號40b的編碼表示 的本發(fā)明的編碼器的一個實施例。音頻編碼器42包括空間參數(shù)估計器44、相位估計器46、 輸出操作模式判決器48和輸出接口 50。將第一和第二輸入音頻信號40a和40b分配至空間參數(shù)估計器44和相位估計器 46??臻g參數(shù)估計器適于導(dǎo)出空間參數(shù),指示兩個信號相對于彼此的信號特征,諸如ICC參 數(shù)和ILD參數(shù)。將估計的參數(shù)提供給輸出接口 50。相位估計器46適于導(dǎo)出兩個輸入音頻信號40a和40b的相位信息。這樣的相位 信息例如可以是兩個信號間的相移。例如,可以通過直接進(jìn)行兩個輸入音頻信號40a和40b 的相位分析來直接估計該相移。在另一可選實施例中,可以通過可選信號線52將由空間參 數(shù)估計器44導(dǎo)出的ICC參數(shù)提供給相位估計器。相位估計器46然后可以使用任何方式導(dǎo) 出的ICC參數(shù)進(jìn)行相位差的確定。與利用兩個音頻輸入信號的完整相位分析的實施例相比 較,這可以得到較低復(fù)雜度的實現(xiàn)。將導(dǎo)出的相位信息提供給輸出操作模式判決器48,該判決器能夠在第一輸出模式 與第二輸出模式之間對輸出接口 50進(jìn)行切換。將導(dǎo)出的相位信息提供給輸出接口 50,該輸出接口 50通過將產(chǎn)生的ICC、ILD或PI (相位信息)參數(shù)的特定子集包括在編碼表示中, 創(chuàng)建第一和第二輸入音頻信號40a和40b的編碼表示。在第一操作模式中,輸出接口 50將 ICC、ILD和相位信息PI包括在編碼表示M中。在第二操作模式中,輸出接口 50僅將ICC 和ILD參數(shù)包括在編碼表示M中。當(dāng)相位信息指示大于預(yù)定閾值的第一和第二音頻信號40a和40b間的相位差時, 輸出操作模式判決器48判定為第一輸出模式。相位差例如可通過執(zhí)行信號的完整相位分 析來確定。例如,這可以通過相對于彼此偏移輸入音頻信號并通過計算針對各個信號偏移 的互相關(guān)性來執(zhí)行。具有最高值的互相關(guān)性與該相移相對應(yīng)。在可選實施例中,從ICC參數(shù)來估計相位信息。當(dāng)ICC參數(shù)(ICCsii的實數(shù)部分) 低于預(yù)定閾值時,認(rèn)為有明顯相位差。針對檢測的可能相移可以例如為大于60度、90度或 120度的相移。相反地,ICC參數(shù)的標(biāo)準(zhǔn)可以為0. 3、0或-0. 3的閾值。引入到該表示中的相位信息可以是例如指示預(yù)定相移的單個比特??蛇x地,通過 以更精細(xì)的量化來傳輸相移,直到相移的連續(xù)表示,傳輸?shù)南辔恍畔⒖梢愿鼮榫珳?zhǔn)。此外,音頻編碼器可對輸入音頻信號的帶寬受限拷貝進(jìn)行操作,使得圖4的多個 音頻編碼器43并聯(lián)實現(xiàn),各個音頻編碼器對原始寬帶信號的帶寬濾波版本進(jìn)行操作。圖5示出了本發(fā)明的音頻編碼器的另一實施例,包括相關(guān)性估計器62、相位估計 器46、信號特征估計器66和輸出接口 68。相位估計器46與圖4中引入的相位估計器相對 應(yīng)。因此,省略對相位估計器的特性的進(jìn)一步討論以免不必要的重復(fù)。通常,具有相同或類 似的功能的組件被賦予了相同的參考符號。將第一輸入音頻信號40a和第二輸入音頻信號 40b分配至信號特征估計器66、相關(guān)性估計器62和相位估計器46。信號特征估計器適于導(dǎo)出信號特征信息,其指示輸入音頻信號的第一或第二不同 特征。例如,語音信號可被檢測為第一特征,而音樂信號可被檢測作為第二信號特征。附加 信號特征信息可用來確定相位信息傳輸?shù)男枰?,或者附加地,用來根?jù)相位關(guān)系來解譯相 關(guān)性參數(shù)。在一個實施例中,信號特征估計器66為信號分類器,用來導(dǎo)出信息,指示該音頻 信號即第一和第二輸入音頻信道40a和40b的當(dāng)前提取為語音類的還是非語音的。依據(jù)導(dǎo) 出的信號特征,可通過可選控制鏈路70來接通和斷開相位估計器46的相位估計??蛇x地, 可一直進(jìn)行相位估計,同時通過可選第二控制鏈路72來操控輸出接口,例如,當(dāng)檢測到輸 入音頻信號的第一特征例如語音特征時,僅包括相位信息74。相反,一直進(jìn)行ICC確定,從而提供編碼信號的升混所需的相關(guān)性參數(shù)??蛇x地,音頻編碼器的另一實施例可以包括降混器76,其適于來導(dǎo)出降混音頻信 號78,可選地,可將該降混音頻信號78包括到由音頻編碼器60所提供的編碼表示M中。在 可選實施例中,如對圖4的實施例已經(jīng)討論的,相位信息可以基于相關(guān)性信息ICC的分析。 為此,相關(guān)性估計器62的輸出可以通過可選信號線52提供給相位估計器46。當(dāng)在語音信號和音樂信號間對信號進(jìn)行區(qū)分時,根據(jù)以下考慮,這樣的確定可以 諸如基于ICCsir當(dāng)從信號特征信息66得知該信號為語音信號時,可根據(jù)以下考慮評估ICCfiii
當(dāng)確定為語音信號時,可以作出以下結(jié)論人類聽覺信號所接收的信號是強(qiáng)相關(guān) 的,這是由于語音信號的源為點狀的。因此,ICCsii的絕對值接近于1。因此,根據(jù)下述公 式,可以僅使用ICCssW實數(shù)部分的信息來估計出圖3的相位角Θ (IPD),而甚至無需評估 復(fù)數(shù)矢量ICC復(fù)數(shù)Re{ICC 復(fù)數(shù)}= cos(IPD)可以基于ICCsii的實數(shù)部分來獲得相位信息,可以無需計算ICCsii的虛數(shù)部分就 可以進(jìn)行確定該ICCsii的實數(shù)部分。簡而言之,可以作出以下結(jié)論IICC復(fù)數(shù) I l_>Re{ICC復(fù)數(shù)} = cos (IPD)在上式中,要注意的是,cos(IPD)與圖3的cos (θ)相對應(yīng)。更為一般地,在解碼器端進(jìn)行相位合成的必要性也可以根據(jù)下述考慮得出相干性(abS(ICCfii;))顯著大于0,相關(guān)性(Real(ICCfiii))顯著小于1,或相位角 (arg(ICC復(fù)數(shù)))顯著不同于0。要注意的是,這些是一般標(biāo)準(zhǔn),其中在存在語音的情況下,隱性地假定了 abs(ICC
復(fù)數(shù))明顯大于0。圖6給出了圖5的編碼器60導(dǎo)出的編碼表示的實例。與時段80a和第一時段80b 相對應(yīng),該編碼表示僅包括相關(guān)性信息,其中對于第二時段80c,由輸出接口 68所產(chǎn)生的該 編碼表示包括相關(guān)性信息和相位信息PI。簡而言之,由音頻編碼器所產(chǎn)生的編碼表示的特 征在于其包括降混信號(為求簡明并未示出),該降混信號是使用第一和第二原始輸出信 道產(chǎn)生的。該編碼表示還包括第一相關(guān)性信息82a,用于指示第一時段80b內(nèi)的第一和第二 原始音頻信道間的相關(guān)性。另外,所述表示還包括第二相關(guān)性信息82b,用于指示第二時段 80c內(nèi)的第一和第二音頻信道間的去相關(guān)性;以及第一相位信息84,用于指示針對第二時 段的第一和第二原始音頻信道間的相位關(guān)系,其中對第一時段80b并未包括相位信息。要 注意的是,為易于說明,圖6僅示出了輔助信息而未示出也被傳輸?shù)慕祷煨诺?。圖7示意性地示出了本發(fā)明的另一實施例,其中音頻編碼器90還包括相關(guān)性信息 修改器92。圖7的圖示假定已經(jīng)進(jìn)行了例如參數(shù)ICC和ILD的空間參數(shù)提取,從而將空間 參數(shù)94連同音頻信號96 —起提供。音頻編碼器90還包括信號特征估計器66和相位估計 器46,其操作如上所示。根據(jù)信號分類和/或相位分析的結(jié)果,根據(jù)由上部信號路徑指示的 第一操作模式來提取和遞交相位參數(shù)??蛇x地,由信號分類和/或相位分析操控的開關(guān)98 可以激活第二操作模式,其中對提供的空間參數(shù)94無需修改即進(jìn)行傳輸。然而,當(dāng)選擇需要傳輸相位信息的第一操作模式時,相關(guān)性信息修改器92從接收 的ICC參數(shù)導(dǎo)出相關(guān)性度量,傳輸該度量來替代ICC參數(shù)。選擇相關(guān)性度量,使得當(dāng)確定第 一和第二輸入音頻信號間的相對相移時,以及當(dāng)音頻信號被歸類為語音信號時,相關(guān)性度 量大于相關(guān)性信息。另外,由相位參數(shù)提取器100來提取并傳輸相位參數(shù)。可選ICC調(diào)整或替代最初導(dǎo)出的ICC參數(shù)而被遞交的相關(guān)性度量的確定可以具有更佳的感知質(zhì)量的效果,原因在于其考慮下述事實對于小于0的ICC,重建信號將僅包括 少于50 %的干信號,其實際上僅為從原始音頻信號直接導(dǎo)出的信號。也就是說,雖然已經(jīng)知 道音頻信號僅由于相移而有明顯差異,但是重建提供了由去相關(guān)的信號(濕信號)支配的 信號。當(dāng)由相關(guān)性信息修改器增加ICC參數(shù)(ICCss的實數(shù)部分)時,該升混將自動使用來 自于干信號的更多信號能量,即,使用更多”真正”音頻信息,從而使得當(dāng)?shù)贸鱿辔辉佻F(xiàn)的必 要性時,再現(xiàn)的信號更接近于原始信號。換句話說,以解碼器升混添加較少的去相關(guān)性信號的方式,對傳輸?shù)腎CC參數(shù)進(jìn) 行修改。ICC參數(shù)的一個可能修改在于使用信道間相干性(ICCssW絕對值),來替代通常 用作ICC參數(shù)的信道間互相關(guān)性。信道間互相關(guān)性定義為ICC = Re{ICC復(fù)數(shù)},并且,該信道間互相關(guān)性取決于這些信道的相位關(guān)系。然而,信道間相干性系與相 位關(guān)系獨立,定義如下ICC= IICC 復(fù)數(shù) I。計算信道間相位差,并將其連同其余空間輔助信息一起傳輸至解碼器。從圖8的 實施例中將顯而易見的是,該表示在實際相位值的量化上是非常粗糙的,并且還可以具有 粗糙的頻率分辨率,其中甚至寬帶相位信息可以是有用的。從復(fù)數(shù)信道間關(guān)系可以導(dǎo)出相位差,如下IPD = arg(ICC復(fù)數(shù))。如果相位信息被包括在比特流中,即被包括到編碼表示M中,解碼器的去相關(guān)性 合成可以使用已修改的ICC參數(shù)(相關(guān)性度量)來產(chǎn)生具有降低的混響的升混信號。例如,如果信號分類器在語音信號與音樂信號間進(jìn)行區(qū)分,一旦確定該信號的主 要語音特征,則可根據(jù)下述規(guī)則來進(jìn)行是否需要相位合成的判定。首先,針對多個用來產(chǎn)生ICC和ILD參數(shù)的參數(shù)頻帶,可以導(dǎo)出寬帶指示值或相移 指示器。也就是說,例如,可以對語音信號主要存在的頻率范圍(例如IOOHz至2KHz)進(jìn)行 評估。一個可能的評估將是基于已經(jīng)導(dǎo)出的頻帶的ICC參數(shù)來計算此頻率范圍內(nèi)的平均相 關(guān)性。如果結(jié)果是此平均相關(guān)性小于預(yù)定閾值,則可認(rèn)為該信號是異相的并觸發(fā)相移。此 外,依據(jù)相位重建的期望粒度,可以使用多個閾值來信號通知不同的相移??赡艿拈撝悼梢?例如為0、-0.3或-0.5。圖8示出了本發(fā)明的另一個實施例,其中編碼器150可操作用于編碼語音信號和 音樂信號。將第一和第二輸入音頻信號40a和40b提供給編碼器150,該編碼器150包括信 號特征估計器66、相位估計器46、降混器152、音樂核心編碼器154、語音核心編碼器156和 相關(guān)性信息修改器158。信號特征估計器66適于在作為第一信號特征的語音特征與作為第 二信號特征的音樂特征之間進(jìn)行區(qū)分。通過控制鏈路160,信號特征估計器66可操作用于 依據(jù)導(dǎo)出的信號特征來操控輸出接口 68。相位估計器或者直接根據(jù)輸入音頻信道40a和40b、或者根據(jù)由降混器152導(dǎo)出 的ICC參數(shù)來估計相位信息。該降混器創(chuàng)建降混音頻信道M(16》和相關(guān)性信息ICC(164)。 根據(jù)前述實施例,可選地,相位估計器46可直接從提供的ICC參數(shù)164導(dǎo)出相位信息???以將降混音頻信道162提供給音樂核心編碼器154、以及語音核心編碼器156,這兩者均連 接到輸出接口 68以提供音頻降混信道的編碼表示。一方面,將相關(guān)性信息164直接提供給輸出接口 68。另一方面,將其提供給相關(guān)性信息修改器158的輸入,該修改器158適于修改 提供的相關(guān)性信息且將這樣導(dǎo)出的相關(guān)性度量提供給輸出接口 68。根據(jù)信號特征估計器66估計的信號特征,該輸出接口將不同參數(shù)子集包括到該 解碼表示中。在第一(語音)操作模式中,輸出接口 68包括由語音核心編碼器156編碼的 降混音頻信道162的編碼表示、以及從相位估計器46導(dǎo)出的相位信息PI和相關(guān)性度量。該 相關(guān)性度量可以是由降混器152所導(dǎo)出的相關(guān)性參數(shù)ICC,或者可選地,是相關(guān)性信息修改 器158修改的相關(guān)性度量。為此,相關(guān)性信息修改器158可由相位估計器46操控和/或激 活。在音樂操作模式中,輸出接口包括如由音樂核心編碼器IM編碼的降混音頻信道 162和由降混器152導(dǎo)出的相關(guān)性信息ICC。不言而喻,如同上述的特定實施例,包括不同參數(shù)子集能夠以不同方式來實現(xiàn)。例 如,可以使音樂編碼器和/或語音編碼器去激活,直到激活信號根據(jù)由信號特征估計器66 導(dǎo)出的信號特征將其切換到信號路徑。圖9示出了根據(jù)本發(fā)明的解碼器的實施例。音頻解碼器200適于從編碼表示204 中導(dǎo)出第一音頻信道20 和第二音頻信道202b,編碼表示204包括降混音頻信號206a、針 對降混信號的第一時段的第一相關(guān)性信息208、以及針對降混信號的第二時段的第二相關(guān) 性信息210,其中僅針對第一時段或第二時段包括相位信息212。解復(fù)用器(未顯示)對該編碼表示204的各個分量進(jìn)行解復(fù)用,并將第一和第二 相關(guān)性信息連同降混音頻信號206a —起提供給升混器220。升混器220可以是例如圖1所 述的升混器。然而,也可以使用有不同的內(nèi)部升混算法的不同升混器。通常,升混器適于使 用第一相關(guān)性信息208和降混音頻信號206a導(dǎo)出針對第一時段的第一中間音頻信號22 ; 以及使用第二相關(guān)性信息210和降混音頻信號206a導(dǎo)出與第二時段相對應(yīng)的第二中間音 頻信號222b。換句話說,使用去相關(guān)性信息ICC1重建第一時段,而使用ICC2重建第二時段。將 第一和第二中間信號22 和222b提供給中間信號后處理器224,該中間信號后處理器2M 適于使用相應(yīng)的相位信息212來導(dǎo)出針對第一時段的后處理中間信號226。為此,中間信號 后處理器2M接收相位信息212、以及由升混器220產(chǎn)生的中間信號。當(dāng)存在與特定音頻信 號相對應(yīng)的相位信息時,該中間信號后處理器2M適于將相移添加到中間音頻信號的音頻 信道中的至少一個。也就是說,中間信號后處理器2M將相移添加到第一中間音頻信號222a,其中中 間信號后處理器224并未將任何相移添加到第二中間音頻信號222b。中間信號后處理器 224輸出后處理中間信號2 來替代第一中間音頻信號,以及未變更的第二中間音頻信號 222b。音頻解碼器200還包括信號組合器230,用于組合從中間信號后處理器2M輸出的 信號,并因而導(dǎo)出由音頻解碼器200所產(chǎn)生的第一和第二音頻信道20 和202b。在一個特定實施例中,該信號組合器對從該中間信號后處理器輸出的這些信號進(jìn) 行級聯(lián),以最終導(dǎo)出針對第一和第二時段的音頻信號。在另一實施例中,信號組合器可以實 現(xiàn)某種交叉衰落,例如,通過在從中間信號后處理器提供的信號間進(jìn)行衰落來導(dǎo)出第一和 第二音頻信號20 和202b。當(dāng)然,信號組合器230的其它實現(xiàn)也是可行的。
利用如圖9所示的本發(fā)明解碼器的實施例提供了添加附加相移的靈活性,因為附 加相移可以由編碼器信號進(jìn)行信號通知或以反向兼容方式解碼該信號。圖10示出了本發(fā)明的另一實施例,其中音頻解碼器包括去相關(guān)電路M3,取決于 傳輸?shù)南辔恍畔?,該去相關(guān)電路243能夠依據(jù)第一去相關(guān)規(guī)則和第二去相關(guān)規(guī)則進(jìn)行操 作。根據(jù)圖10的實施例,可以對根據(jù)其從傳輸?shù)慕祷煲纛l信道240導(dǎo)出去相關(guān)信號242的 去相關(guān)規(guī)則進(jìn)行切換,其中該切換取決于現(xiàn)有相位信息。在其中傳輸相位信息的第一模式中,使用第一去相關(guān)規(guī)則來導(dǎo)出去相關(guān)信號M2。 在其中未接收到相位信息的第二模式中,使用第二去相關(guān)規(guī)則,創(chuàng)建去相關(guān)信號,該信號比 使用第一去相關(guān)規(guī)則創(chuàng)建的信號更為去相關(guān)。換句話說,當(dāng)需要相位合成時,可以導(dǎo)出去相關(guān)信號,該信號不如當(dāng)不需要相位合 成時所使用的信號那樣高度去相關(guān)。即,解碼器然后可以使用更類似于干信號的去相關(guān)信 號,從而在升混中自動創(chuàng)建具有更多干信號分量的信號。這通過使去相關(guān)信號更類似于干 信號來實現(xiàn)。在另一實施例中,可以將可選相移器246應(yīng)用到針對具有相位合成的重建而產(chǎn)生 的去相關(guān)信號。通過提供已經(jīng)具有相對于干信號的正確相位關(guān)系的去相關(guān)信號,這提供了 重建信號的相位特性的更接近重建。圖11示出了本發(fā)明的音頻解碼器的另一實施例,包括分析濾波器組260和合成濾 波器組沈2。解碼器接收降混音頻信號206、以及相關(guān)的ICC參數(shù)(ICCtl. .. ICCn)。然而,在 圖11中,不同ICC參數(shù)不僅與不同時段相關(guān)聯(lián),同時也與音頻信號的不同頻帶相關(guān)聯(lián)。艮口, 每個時段處理具有完整的關(guān)聯(lián)ICC參數(shù)集合(ICCtl. . . ICCn)。由于該處理以頻率選擇方式執(zhí)行,分析濾波器組沈0導(dǎo)出傳輸?shù)慕祷煲纛l信號 206的64個子帶表示。即,導(dǎo)出64個帶寬受限信號(在濾波器組表示中),每個信號與一 個ICC參數(shù)相關(guān)聯(lián)。可選地,多個帶寬受限信號可以共享公共ICC參數(shù)。各個子帶表示由 升混器^^、264b、...處理。各個升混器可以是例如根據(jù)圖1的實施例的升混器。因此,針對每個帶寬受限表示,創(chuàng)建第一和第二音頻信道(兩者均帶寬受限)。 將每個子帶這樣創(chuàng)建的音頻信道中的至少一個輸入到中間音頻信號后處理器266a、 ^56b、...,例如,如圖9所述的中間音頻信號后處理器。根據(jù)圖11的實施例,中間音頻信號 后處理器沈63、26613、...由相同的公共相位信息212操控。即,在子帶信號由合成濾波器 組沈2合成以成為由解碼器所輸出的第一和第二音頻信道20 和202b之前,將相同相移 應(yīng)用到每個子帶信號??梢赃@樣進(jìn)行相位合成,僅需要傳輸一個附加公共相位信息。在圖11的實施例 中,可以進(jìn)行原始信號的相位特性的正確恢復(fù),而無需比特率的適當(dāng)增加。根據(jù)另一實施例,針對其使用公共相位信息212的子帶數(shù)目是信號相關(guān)的。因此, 當(dāng)應(yīng)用相應(yīng)的相移時,可以僅針對能夠?qū)ζ鋵崿F(xiàn)感觀質(zhì)量提高的子帶來評估相位信息。這 可進(jìn)一步提高已解碼信號的感知質(zhì)量。圖12示出了音頻解碼器的另一實施例,該音頻解碼器適于解碼原始音頻信號的 編碼表示,所述信號可以是語音信號或音樂信號。即,或者在編碼表示內(nèi)傳輸信號特征信 息,指示傳輸了哪種信號特征;或者可以根據(jù)比特流中的相位信息的存在,隱性地導(dǎo)出信號 特征。為此,相位信息的存在可以指示音頻信號的語音特征。根據(jù)信號特征,傳輸?shù)慕祷煲纛l信號206或者由語音解碼器266解碼或者由音樂解碼器268解碼。如圖11所示出和闡 明的,執(zhí)行進(jìn)一步處理。因此,對于進(jìn)一步的實現(xiàn)細(xì)節(jié),參考圖11的解釋。圖13示出了用于產(chǎn)生第一和第二輸入音頻信號的編碼表示的本發(fā)明方法的實施 例。在空間參數(shù)提取步驟300,從第一和第二輸入音頻信號導(dǎo)出ICC參數(shù)和ILD參數(shù)。在相 位估計步驟302中,導(dǎo)出指示第一和第二輸入音頻信號間的相位關(guān)系的相位信息。在模式 判定304中,當(dāng)相位關(guān)系指示大于預(yù)定閾值的第一和第二輸入音頻信號間的相位差時,選 擇第一輸出模式;而當(dāng)該相位差小于該閾值時,選擇第二輸出模式。在表示產(chǎn)生步驟306, 在第一輸出模式中將ICC參數(shù)、ILD參數(shù)和相位信息包括在編碼表示中;而在第二輸出模式 中僅將ICC參數(shù)和ILD參數(shù)包括在編碼表示中而不包括相位關(guān)系。圖14示出了使用音頻信號的編碼表示產(chǎn)生第一和第二音頻信道的方法的實施 例,所述編碼表示包括降混音頻信號;用于指示用來產(chǎn)生降混信號的第一和第二原始音頻 信道間的相關(guān)性的第一和第二相關(guān)性信息,所述第一相關(guān)性信息具有針對降混信號的第一 時段的信息,而所述第二相關(guān)性信息具有針對第二不同時段的信息;以及相位信息,所述相 位信息用于指示針對第一時段的第一和第二原始音頻信道間的相位關(guān)系。在升混步驟400,使用降混信號和第一相關(guān)性信息導(dǎo)出第一中間音頻信號,該第一 中間音頻信號與第一時段相對應(yīng)且包括第一和第二音頻信道。在升混步驟400,還使用降混 音頻信號和第二相關(guān)性信息導(dǎo)出第二中間音頻信號,該第二中間音頻信號與第二時段相對 應(yīng)且包括第一和第二音頻信道。在后處理步驟402,使用第一中間音頻信號,針對第一時段導(dǎo)出后處理中間信號, 其中將由相位關(guān)系指示的附加相移添加到第一中間音頻信號的第一或第二音頻信道中的 至少一個。在信號組合步驟404,使用后處理中間信號和第二中間音頻信號,產(chǎn)生第一和第二 音頻信道。根據(jù)本發(fā)明方法的特定實現(xiàn)要求,本發(fā)明方法能夠以硬件或軟件的方式來實現(xiàn)。 可利用數(shù)字存儲介質(zhì)來進(jìn)行實現(xiàn)(尤其是其上存儲了電子可讀控制信號的盤、DVD或CD), 該數(shù)字存儲介質(zhì)與可編程計算機(jī)系統(tǒng)協(xié)作從而執(zhí)行本發(fā)明方法??偟膩碚f,本發(fā)明因而是 具有存儲在機(jī)器可讀載體上的程序代碼的計算機(jī)程序產(chǎn)品,所述程序代碼可操作用于當(dāng)計 算機(jī)程序產(chǎn)品在計算機(jī)上運行時執(zhí)行本發(fā)明方法。因此,換句話說,本發(fā)明方法是具有當(dāng)計 算機(jī)程序在計算機(jī)上運行時執(zhí)行本發(fā)明方法中的至少一個的程序代碼的計算機(jī)程序。盡管在前面已經(jīng)參考特定實施例具體示出并描述了本發(fā)明,但是本領(lǐng)域的技術(shù)人 員將會理解,在不脫離本發(fā)明的精神和范圍的情況下,可以在形式和細(xì)節(jié)上作出各種其它 改變。要理解的是,在不脫離這里所述以及由所附權(quán)利要求包括的更廣泛概念的情況下,可 以在適配到不同實施例時作出各種改變。
權(quán)利要求
1.一種用于產(chǎn)生第一和第二輸入音頻信號的編碼表示的音頻編碼器,包括相關(guān)性估計器,所述相關(guān)性估計器適于導(dǎo)出指示第一和第二輸入音頻信號之間的相關(guān) 性的相關(guān)性信息;信號特征估計器,所述信號特征估計器適于導(dǎo)出信號特征信息,所述信號特征信息指 示所述輸入音頻信號的不同的第一或第二特征;相位估計器,所述相位估計器適于當(dāng)所述輸入音頻信號具有第一特征時導(dǎo)出相位信 息,所述相位信息指示所述第一和第二輸入音頻信號之間的相位關(guān)系;以及輸出接口,所述輸出接口適于當(dāng)所述輸入音頻信號具有第一特征時將所述相位信息和相關(guān)性度量包括到所述編碼 表示中;或者當(dāng)所述輸入音頻信號具有第二特征時將所述相關(guān)性信息包括到所述編碼表示中,其中 當(dāng)所述輸入音頻信號具有第二特征時不包括所述相位信息。
2.根據(jù)權(quán)利要求1所述的音頻編碼器,其中由所述信號估計器指示的所述第一信號特 征是語音特征;以及由所述信號估計器指示的所述第二信號特征是音樂特征。
3.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述相位估計器適于使用所述相關(guān)性信息 來導(dǎo)出所述相位信息。
4.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述相位信息指示所述第一和第二輸入音 頻信號之間的相移。
5.根據(jù)權(quán)利要求3所述的音頻編碼器,其中所述相關(guān)性估計器適于產(chǎn)生ICC參數(shù)作為 去相關(guān)性信息,所述ICC參數(shù)由所述第一和第二輸入音頻信號的取樣信號段的復(fù)數(shù)互相關(guān) 性ICC復(fù)數(shù)的實數(shù)部分表示,每個信號段由1個樣本值X(I)表示,其中ICC參數(shù)可以由下 式描述
6.根據(jù)權(quán)利要求5所述的音頻編碼器,其中所述預(yù)定閾值等于或小于0.3。
7.根據(jù)權(quán)利要求5所述的音頻編碼器,其中針對相關(guān)性信息的所述預(yù)定閾值與大于90 度的相移相對應(yīng)。
8.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述相關(guān)性估計器適于導(dǎo)出多個相關(guān)性參 數(shù),作為相關(guān)性信息,每個相關(guān)性參數(shù)與所述第一和第二輸入音頻信號的相應(yīng)子帶有關(guān);以 及其中所述相位估計器適于導(dǎo)出用于指示針對與所述相關(guān)性參數(shù)相對應(yīng)的子帶中的至少 兩個子帶的所述第一和第二輸入音頻信號之間的相位關(guān)系的相位信息。
9.根據(jù)權(quán)利要求1所述的音頻編碼器,還包括相關(guān)性信息修改器,所述相關(guān)性信息修 改器適于導(dǎo)出所述相關(guān)性度量,以便所述相關(guān)性度量指示比所述相關(guān)性信息更高的相關(guān)性;以及其中所述輸出接口適于包括所述相關(guān)性度量而非所述相關(guān)性信息。
10.根據(jù)權(quán)利要求9所述的音頻編碼器,其中所述相關(guān)性信息修改器適于使用所述第 一和第二輸入音頻信號的兩個取樣的信號段的復(fù)數(shù)互相關(guān)性ICC復(fù)數(shù)的絕對值,作為所述 相關(guān)性度量ICC,每個信號段由1個復(fù)數(shù)值樣本值X(I)表示,所述相關(guān)性度量ICC由下式描 述
11.一種用于產(chǎn)生第一和第二輸入音頻信號的編碼表示的音頻編碼器,包括空間參數(shù)估計器,所述空間參數(shù)估計器適于導(dǎo)出ICC參數(shù)或ILD參數(shù),所述ICC參數(shù)指示所述第一和第二輸入音頻信號之間的相關(guān)性,所述ILD參數(shù)指示所述第一和第二輸入音 頻信號之間的電平關(guān)系;相位估計器,所述相位估計器適于導(dǎo)出相位信息,所述相位信息指示所述第一和第二 輸入音頻信號之間的相位關(guān)系;輸出操作模式判決器,所述輸出操作模式判決器適于當(dāng)所述相位關(guān)系指示大于預(yù)定閾值的所述第一和第二輸入音頻信號之間的相位差時,指示第一輸出模式,或者當(dāng)所述相位差小于所述預(yù)定閾值時,指示第二輸出模式;以及輸出接口,所述輸出接口適于在第一輸出模式中,將所述ICC參數(shù)或ILD參數(shù)以及所述相位信息包括到所述編碼表 示中;以及在第二輸出模式中,將所述ICC參數(shù)和ILD參數(shù)包括到所述編碼表示中而不將所述相 位信息包括到所述編碼表示中。
12.根據(jù)權(quán)利要求11所述的音頻編碼器,其中所述預(yù)定閾值與60度的相移相對應(yīng)。
13.根據(jù)權(quán)利要求11所述的音頻編碼器,其中所述空間參數(shù)估計器適于導(dǎo)出多個ICC 參數(shù)或ILD參數(shù),每個ICC參數(shù)或ILD參數(shù)與所述第一和第二輸入音頻信號的子帶表示的 相應(yīng)子帶有關(guān);以及其中所述相位估計器適于導(dǎo)出用于指示針對子帶表示的子帶中的至少 兩個子帶的所述第一和第二輸入音頻信號之間的所述相位關(guān)系的相位信息。
14.根據(jù)權(quán)利要求13所述的音頻編碼器,其中所述輸出接口適于將單個相位信息參數(shù) 包括到所述表示中,作為所述相位信息,所述單個相位信息參數(shù)指示針對子帶表示的子帶 中的預(yù)定子組的所述相位關(guān)系。
15.根據(jù)權(quán)利要求11所述的音頻編碼器,其中所述相位關(guān)系由指示預(yù)定相移的單個比 特表示。
16.一種使用音頻信號的編碼表示來產(chǎn)生第一和第二音頻信道的音頻解碼器,所述編 碼表示包括降混音頻信號、以及指示用來產(chǎn)生降混音頻信號的第一和第二原始音頻信道之 間的相關(guān)性的第一和第二相關(guān)性信息,所述第一相關(guān)性信息具有針對所述降混信號的第一 時段的信息,以及第二相關(guān)性信息具有針對不同的第二時段的信息;所述編碼表示還包括針對第一時段和第二時段的相位信息,所述相位信息指示所述第一和第二原始音頻信道之 間的相位關(guān)系,所述音頻解碼器包括升混器,所述升混器適于使用所述降混音頻信號和所述第一相關(guān)性信息導(dǎo)出第一中間音頻信號,所述第一中間 音頻信號與所述第一時段相對應(yīng)且包括第一和第二音頻信道;和使用所述降混音頻信號和所述第二相關(guān)性信息導(dǎo)出第二中間音頻信號,所述第二中間 音頻信號與所述第二時段相對應(yīng)且包括第一和第二音頻信道;中間信號后處理器,所述中間信號后處理器適于使用所述第一中間音頻信號和所述相 位信息來導(dǎo)出針對所述第一時段的后處理中間音頻信號,其中所述中間信號后處理器適于 將由所述相位關(guān)系指示的附加相移添加到所述第一中間音頻信號的第一或第二音頻信道 中的至少一個上;以及音頻組合器,所述音頻組合器適于通過對所述后處理中間音頻信號與所述第二中間音 頻信號進(jìn)行組合來產(chǎn)生所述第一和第二音頻信道。
17.根據(jù)權(quán)利要求16所述的音頻解碼器,其中所述升混器適于使用多個相關(guān)性參數(shù), 作為所述相關(guān)性信息,每個相關(guān)性參數(shù)與所述第一和第二原始音頻信號的多個子帶中的一 個子帶相對應(yīng);以及其中所述中間信號后處理器適于將由所述相位關(guān)系指示的附加相移添加到所述第一 中間音頻信號的相應(yīng)子帶中的至少兩個子帶上。
18.根據(jù)權(quán)利要求16所述的音頻解碼器,還包括相關(guān)性信息處理器,所述相關(guān)性信息 處理器適于導(dǎo)出相關(guān)性度量,所述相關(guān)性度量指示比第一相關(guān)性更高的相關(guān)性;以及其中,當(dāng)相位信息指示高于預(yù)定閾值的所述第一和第二原始音頻信道之間的相移時, 所述升混器使用所述相關(guān)性度量而非所述相關(guān)性信息。
19.根據(jù)權(quán)利要求16所述的音頻解碼器,還包括去相關(guān)器,所述去相關(guān)器適于根據(jù)針 對所述第一時段的第一去相關(guān)規(guī)則和根據(jù)針對所述第二時段的第二去相關(guān)規(guī)則,從所述降 混音頻信號導(dǎo)出去相關(guān)音頻信道,其中所述第一去相關(guān)規(guī)則與所述第二去相關(guān)規(guī)則相比創(chuàng) 建了更少的去相關(guān)的音頻信道。
20.根據(jù)權(quán)利要求19所述的音頻解碼器,其中所述去相關(guān)器還包括相移器,所述相移 器適于將附加相移施加到使用所述第一去相關(guān)規(guī)則所產(chǎn)生的去相關(guān)音頻信道,所述附加相 移取決于所述相位信息。
21.一種用于產(chǎn)生第一和第二輸入音頻信號的編碼表示的方法,包括導(dǎo)出指示所述第一和第二輸入音頻信號之間的相關(guān)性的相關(guān)性信息;導(dǎo)出信號特征信息,所述信號特征信息指示所述輸入音頻信號的不同的第一或第二特征;當(dāng)所述輸入音頻信號具有第一特征時導(dǎo)出相位信息,所述相位信息指示所述第一和第 二輸入音頻信號之間的相位關(guān)系;以及當(dāng)所述輸入音頻信號具有所述第一特征時將所述相位信息和相關(guān)性度量包括到所述 編碼表示中;或者當(dāng)所述輸入音頻信號具有所述第二特征時將所述相關(guān)性信息包括到所述編碼表示中, 其中當(dāng)所述輸入音頻信號具有所述第二特征時不包括所述相位信息。
22.一種用于產(chǎn)生第一和第二輸入音頻信號的編碼表示的方法,包括導(dǎo)出ICC參數(shù)或ILD參數(shù),所述ICC參數(shù)指示所述第一和第二輸入音頻信號之間的相 關(guān)性,所述ILD參數(shù)指示所述第一和第二輸入音頻信號間的電平關(guān)系;導(dǎo)出相位信息,所述相位信息指示所述第一和第二輸入音頻信號之間的相位關(guān)系; 當(dāng)所述相位關(guān)系指示大于預(yù)定閾值的所述第一和第二輸入音頻信號之間的相位差時, 指示第一輸出模式,或者當(dāng)所述相位差小于預(yù)定閾值時,指示第二輸出模式;以及在第一輸出模式中,將所述ICC參數(shù)或ILD參數(shù)以及所述相位關(guān)系包括到所述編碼表 示中;或者在第二輸出模式中,將所述ICC參數(shù)或ILD參數(shù)包括到所述編碼表示中而不將所述相 位關(guān)系包括到所述編碼表示中。
23.一種使用音頻信號的編碼表示來導(dǎo)出第一和第二音頻信道的方法,所述編碼表示 包括降混音頻信號、以及指示用來產(chǎn)生所述降混音頻信號的第一和第二原始音頻信道之間 的相關(guān)性的第一和第二相關(guān)性信息,所述第一相關(guān)性信息具有針對所述降混信號的第一時 段的信息,以及所述第二相關(guān)性信息具有針對不同的第二時段的信息;所述編碼表示還包 括針對所述第一時段和第二時段的相位信息,所述相位信息指示所述第一和第二原始音頻 信道之間的相位關(guān)系,所述方法包括使用所述降混音頻信號和所述第一相關(guān)性信息導(dǎo)出第一中間音頻信號,所述第一中間 音頻信號與所述第一時段相對應(yīng)且包括第一和第二音頻信道;使用所述降混音頻信號和所述第二相關(guān)性信息導(dǎo)出第二中間音頻信號,所述第二中間 音頻信號與所述第二時段相對應(yīng)且包括第一和第二音頻信道;使用所述第一中間音頻信號和所述相位信息,導(dǎo)出針對所述第一時段的后處理中間信 號,其中,通過將由所述相位關(guān)系指示的附加相移添加到所述第一中間信號的第一或第二 音頻信道中的至少一個上來導(dǎo)出后處理中間信號;以及對所述后處理中間信號和所述第二中間音頻信號進(jìn)行組合以導(dǎo)出所述第一和第二音 頻信道。
24.一種音頻信號的編碼表示,包括降混信號,所述降混信號是利用第一和第二原始音頻信道產(chǎn)生的; 第一相關(guān)性信息,所述第一相關(guān)性信息用于指示在第一時段內(nèi)的所述第一和第二原始 音頻信道間的相關(guān)性;第二相關(guān)性信息,所述第二相關(guān)性信息用于指示在第二時段內(nèi)的所述第一和第二原始 音頻信道間的相關(guān)性;以及相位信息,所述相位信息用于指示針對所述第一時段的所述第一和第二原始音頻信道 之間的相位關(guān)系,其中所述相位信息是針對所述第一時段和第二時段的包括在所述表示中 的僅有的相位信息。
25.一種具有程序代碼的計算機(jī)程序,所述程序代碼用于當(dāng)在計算機(jī)上運行時執(zhí)行根 據(jù)權(quán)利要求21至23中任一項所述的方法。
全文摘要
當(dāng)附加地考慮指示輸入音頻信號的至少第一或第二不同特征的信號特征信息時,可以使用指示第一和第二輸入音頻信號間的相關(guān)性的相關(guān)性信息,來導(dǎo)出第一和第二輸入音頻信號的有效編碼表示。當(dāng)輸入音頻信號具有第一特征時,導(dǎo)出指示第一和第二輸入音頻信號間的相位關(guān)系的相位信息。當(dāng)輸入音頻信號具有第一特征時,將相位信息和相關(guān)性度量包括到該編碼表示中;而當(dāng)輸入音頻信號具有第二特征時,僅將相關(guān)性信息包括在該編碼表示中。
文檔編號G10L19/00GK102089807SQ200980127092
公開日2011年6月8日 申請日期2009年6月30日 優(yōu)先權(quán)日2008年7月11日
發(fā)明者伯恩哈特·格里爾, 朱利恩·羅比利亞德, 瑪利亞·路易斯-瓦萊羅, 約翰內(nèi)斯·希勒佩特, 馬蒂亞斯·諾伊辛格 申請人:弗朗霍夫應(yīng)用科學(xué)研究促進(jìn)協(xié)會