專利名稱:使用解碼信號的特征適配合成頻譜分量的音頻編碼系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及音頻編碼系統(tǒng),尤其涉及改善得自音頻編碼系統(tǒng)的音頻信號的感知質(zhì)量。
背景技術(shù):
音頻編碼系統(tǒng)用于將音頻信號編碼為適合于傳輸或存儲的編碼信號,然后接收或檢索編碼信號并解碼以獲得用于回放的原始音頻信號的版本。感知音頻編碼試圖將原始音頻信號編碼為比原始音頻信號的信息容量要求更低的編碼信號,然后將編碼信號解碼并提供在感知上與原始音頻信號難以區(qū)別的輸出。感知音頻編碼系統(tǒng)的一個實例參見高級電視系統(tǒng)委員會(ATSC)2001年8月20日出版的A/A52文件,其標(biāo)題是“Revision A to Digital Audio Compression(AC-3)Standard”,稱之為杜比數(shù)字。另一個實例參見Bodi等人的文獻(xiàn),“ISO/IEC MPEG-2 Advanced Audio Coding,”J.AES,vol.45,no.10,October 1997,pp.789-814,稱之為高級音頻編碼(AAC)。在這兩個編碼系統(tǒng)和其它許多感知編碼系統(tǒng)中,分頻帶發(fā)送器對音頻信號使用分析濾波器組以獲得按聚類或頻帶排列的頻譜分量,并按照心理聲學(xué)原理對頻譜分量編碼從而產(chǎn)生編碼信號。其帶寬通常是變化的并且通常與人類聽覺系統(tǒng)所謂臨界帶的寬度相當(dāng)。互補的分頻帶接收器接收并解碼編碼信號以恢復(fù)頻譜分量,然后對解碼頻譜分量使用合成濾波器組以獲得原始音頻信號的一個復(fù)本。
感知編碼系統(tǒng)可以用于減少音頻信號的信息容量需求同時保留音頻質(zhì)量的主觀或感知度量,所以音頻信號的編碼表示能夠以更少的帶寬通過信道傳輸或以更少的空間存儲在記錄媒體上。通過量化頻譜分量可以減少信息容量需求,量化將噪聲引入被量化信號,但是感知音頻編碼系統(tǒng)通常使用心理聲學(xué)模型控制量化噪聲的幅度,以通過信號中的頻譜分量掩蔽噪聲或使其不可聞。
在允許發(fā)送或記錄的編碼信號有方法達(dá)到高比特率的音頻編碼系統(tǒng)中,傳統(tǒng)的感知編碼技術(shù)工作得相當(dāng)好。但是當(dāng)將編碼信號限制為低比特率時,這些技術(shù)本身不提供很好的音頻質(zhì)量。其它技術(shù)試圖與感知編碼技術(shù)結(jié)合起來在低比特率下提供高質(zhì)量的信號。
一種稱為“高頻再生”(HFR)的技術(shù)參見Truman等人2002年3月28日提交的題為“Broadband Frequency Translation for HighFrequency Regeneration”的美國專利申請第10/113,858號,該文獻(xiàn)在此被全文引用作為參考。在使用HFR的音頻系統(tǒng)中,發(fā)送器去除編碼信號中的高頻分量而接收器再生或合成類似噪聲分量代替缺失的高頻分量。接收器輸出端提供的合成信號一般與輸入到發(fā)送器的原始信號在感知上不一樣,但成熟的再生技術(shù)提供的輸出信號可以是具有相當(dāng)高感知質(zhì)量的原始輸入信號相當(dāng)好的近似,另外在低比特率下也是可能的。在本說明中,高質(zhì)量通常的意思是寬帶且感知噪聲水平低。
另一個稱為“頻譜孔填充”(SHF)的合成技術(shù)參見Truman等人2002年6月17日提交的題為“Improved Audio Coding System UsingSpectral Hole Filling”的美國專利申請第10/174,493號,該文獻(xiàn)在此被全文引用作為參考。根據(jù)該技術(shù),發(fā)送器量化和編碼輸入信號頻譜分量的方法是忽略編碼信號中一些頻帶的頻譜分量。這些缺失頻譜分量的頻帶稱之為頻譜孔。SHF技術(shù)通常不提供與原始輸入信號在感知上相同的輸出信號,但是它能改善那些被限制工作于低比特率編碼信號的系統(tǒng)中輸出信號的感知質(zhì)量。
類似HFR和SHF的技術(shù)在許多情況下是有優(yōu)勢的,但并不能在所有情況下都表現(xiàn)得很好。在用塊變換實現(xiàn)分析和合成濾波器組的系統(tǒng)對幅度快速變化的音頻信號進(jìn)行編碼的情況下就特別麻煩。在這種情況下,聽得見的類似噪聲的頻譜分量在對應(yīng)變換塊的一段時間內(nèi)會變得模糊。
一種可以用于減少聽得見的時間模糊噪聲影響的技術(shù)是在高度非平穩(wěn)的輸入信號段減少分析和合成變換的塊長度。該技術(shù)在允許傳送或記錄有方法獲得高比特率的編碼信號的音頻編碼系統(tǒng)中工作得很好,但是因為較短塊的使用減少了變換所能獲得的編碼增益,該技術(shù)在較低比特率系統(tǒng)中不能很好工作。
在另一個技術(shù)中,發(fā)送器在應(yīng)用分析變換之前修改輸入信號以消除或減少幅度的快速變化。接收器在應(yīng)用合成變換之后反轉(zhuǎn)這種修改的影響。不幸的是,該技術(shù)模糊了輸入信號的真實譜特征,因為發(fā)送器必須利用發(fā)送信號的一部分傳遞接收器反轉(zhuǎn)修改影響時所需的參數(shù),因此使有效的感知編碼需要的失真信息。
在第三個稱之為時間噪聲整形的技術(shù)中,發(fā)送器對分析濾波器組輸出的頻譜分量使用預(yù)測濾波器,并在發(fā)送信號中傳遞預(yù)測誤差和預(yù)測濾波器的系數(shù),接收器對預(yù)測誤差信號使用逆濾波器以恢復(fù)頻譜分量。因為傳遞預(yù)測濾波器的系數(shù)需要信號開銷,所以該技術(shù)在低比特率系統(tǒng)中不受歡迎。
發(fā)明內(nèi)容
本發(fā)明的一個目的就是提供可以用于低比特率音頻編碼系統(tǒng)中改善由該系統(tǒng)生成的音頻信號的感知質(zhì)量的技術(shù)。
根據(jù)本發(fā)明,編碼音頻信息的處理包括接收編碼音頻信息并獲得代表一些但不是全部音頻信號頻譜內(nèi)容的子帶信號,檢查子帶信號以獲得音頻信號的特征,生成具有音頻信號特征的合成頻譜分量,集成所合成頻譜分量與子帶信號以生成一組修改的子帶信號,以及對該組修改的子帶信號使用合成濾波器組以生成音頻信息。
通過參考下面的說明和附圖,可以更好的理解本發(fā)明的各分量特征及其最佳實施例。下面說明的內(nèi)容和附圖僅僅作為示例而不能理解為對本發(fā)明范疇的限定。
附圖簡述
圖1是音頻編碼系統(tǒng)中發(fā)送器的示意框圖。
圖2是音頻編碼系統(tǒng)中接收器的示意框圖。
圖3是可以用于實施本發(fā)明各個方面的一個裝置的示意框圖。
具體實施例方式
A.概述本發(fā)明的各個方面可以與類似圖1和2所示的多種信號處理方法和裝置結(jié)合在一起。一些方面可以由僅僅在接收器上的處理過程來實施,而其它方面需要接收器和發(fā)送器的協(xié)同處理過程。下面提供可以用于實施本發(fā)明這些方面的過程描述以及可以用于執(zhí)行這些過程的典型裝置的概述。
圖1示出了分頻帶音頻發(fā)送器的一個實施例,其中分析濾波器組12接收來自通道11的代表音頻信號的音頻信息,并作為響應(yīng)提供代表音頻信號頻譜內(nèi)容的頻率子帶信號。每個子帶信號傳遞到編碼器14,由其生成子帶信號的編碼表示并將該編碼表示傳遞給格式器16。格式器16將編碼表示裝配成適合傳輸或存儲的輸出信號,然后沿通道17傳遞該輸出信號。
圖2示出了分頻帶音頻接收器的一個實施例,其中解格式器22接收通道21的輸入信號,該信號傳載代表音頻信號頻譜內(nèi)容的頻率子帶信號的編碼表示。解格式器22從輸入信號中獲得編碼表示并將其傳遞到解碼器24。解碼器24將編碼表示解碼為頻率子帶信號。分析器25檢查子帶信號以獲得子帶信號所代表的音頻信號的一個或多個特征。將特征指示傳遞給分量合成器26,后者使用響應(yīng)于該特征的適配過程生成合成頻譜分量。集成器27將解碼器24提供的子帶信號與分量合成器26生成的合成頻譜分量集成在一起生成一組修改子帶信號。作為對該組修改子帶信號的響應(yīng),合成濾波器組28沿通道29生成代表音頻信號的音頻信息。在圖中所示的具體實施例中,分析器25和分量合成器26都不響應(yīng)于由解格式器22得自輸入信號的任何控制信息而適配處理過程。在其它實施例中,分析器25和/或分量合成器26可以響應(yīng)于得自輸入信號的控制信息。
圖1和圖2所示的設(shè)備示出了用于三個頻率子帶的濾波器組。在典型實施例中使用更多的子帶,但為了說明清楚僅顯示三個。對于本發(fā)明任何具體數(shù)字都是不重要的。
分析與合成濾波器組基本上可以用包括離散傅里葉變換或離散余弦變換(DCT)在內(nèi)的任何塊變換實現(xiàn)。在包含如上所述發(fā)送器和接收器的一個音頻編碼系統(tǒng)中,分析濾波器組12和合成濾波器組28是由所謂時域假信號抵消(TDAC)變換的修改DCT實現(xiàn)的,其說明參見Princen等人的文獻(xiàn),“Subband/Transform Coding Using FilterBank Designs Based on Time Domain Aliasing Cancellation,”ICASSP1987 Conf.Proc.,May 1987,pp.2161-64。
由塊變換實現(xiàn)的分析濾波器組將一塊或一段音調(diào)信號變換為代表該段信號譜內(nèi)容的變換系數(shù)。一個或多個相鄰變換系數(shù)的組合代表某一頻率子帶內(nèi)的頻譜內(nèi)容,該子帶的帶寬與組合中系數(shù)的數(shù)目相當(dāng)。術(shù)語“子帶信號”是指一個或多個相鄰變換系數(shù)的組合,術(shù)語“頻譜分量”是指變換系數(shù)。
本說明中使用的術(shù)語“編碼器”和“編碼”是指可以用于用編碼信息表示音頻信號的信息處理裝置和方法,其編碼信息比音頻信號本身的信息容量需求更低。術(shù)語“解碼器”和“解碼”是指可以用于從編碼表示中恢復(fù)音頻信號的信息處理裝置和方法。兩個關(guān)于縮減信息容量需求的實例是需要處理與前面提及的杜比數(shù)字和AAC編碼標(biāo)準(zhǔn)兼容的比特流的編碼。對于本發(fā)明任何具體類型的編碼或解碼都是不重要的。
B.接收器本發(fā)明的各個方面可以在接收器上實施而不需要來自發(fā)送器的任何具體處理或信息。首先說明這些方面。
1.信號特征的分析本發(fā)明可以用于以極低比特率編碼信號表示音頻信號的編碼系統(tǒng)。極低比特率系統(tǒng)的編碼信息通常包含僅僅代表音頻信號一部分頻譜分量的子帶信號。分析器25檢查這些子帶信號以獲得子帶信號所代表的部分音頻信號的一個或多個特征。將這些一個或多個特征的表示傳遞給分量合成器26,并用于調(diào)集成成頻譜分量的生成。下面說明可以采用的幾種特征實例。
a)幅度許多編碼系統(tǒng)生成的編碼信息代表已量化為某個所需比特長度或量化分解度的頻譜分量。當(dāng)小頻譜分量的幅度小于由量化分量最低有效位(LSB)表示的水平時,可以從編碼信息中忽略該分量,或者以某種形式表示的量化值為零或認(rèn)為是零。對應(yīng)于由編碼信號傳載的量化頻譜分量的LSB的水平可以認(rèn)為是從編碼信息中忽略的小頻譜分量幅度的上界。
分量合成器26可以使用該水平限制代替缺失頻譜分量的任何合成頻譜分量幅度。
b)譜形狀包含在編碼信息中的子帶信號的譜形狀可從子帶信號本身之中即時獲得,但是譜形狀的其它信息可以通過在頻域?qū)ψ訋盘柺褂脼V波器導(dǎo)出。該濾波器可以使預(yù)測濾波器,低通濾波器或基本上所需的任何濾波器。
譜形狀的指示或濾波器輸出適當(dāng)?shù)貍鬟f給分量合成器26。如果需要,也應(yīng)傳遞使用何濾波器的指示。
c)掩蔽可以使用感知模型估計子帶信號中頻譜分量的心理聲學(xué)掩蔽效應(yīng)。因為這些掩蔽效應(yīng)隨頻率變化,即使第一個和第二個頻譜分量具有相同的幅度,第一個頻譜分量在某個頻率提供的掩蔽也不必和第二個頻譜分量在另一個頻率提供的掩蔽具有相同的水平。
將估計的掩蔽效應(yīng)指示傳遞給分量合成器26,后者控制頻譜分量的合成,以使合成頻譜分量的估計掩蔽效應(yīng)與子帶中頻譜分量的估計掩蔽效應(yīng)具有所需的聯(lián)系。
d)音調(diào)子帶信號的音調(diào)可以用包括計算譜平坦度量在內(nèi)的多種方法估計,平坦度是子帶信號樣本的算術(shù)平均值除以子帶信號樣本的幾何平均之后的規(guī)格化商。還可以用分析子帶信號內(nèi)頻譜分量的分布或排列的方法估計音調(diào)。例如,如果少量大的頻譜分量被長段的非常小的頻譜分量分隔,那么可以認(rèn)為子帶信號更似音調(diào)而不是噪聲。還有一種方法對子帶信號使用預(yù)測濾波器以確定預(yù)測增益,大的預(yù)測增益傾向于指示該信號更似音調(diào)。
將音調(diào)指示傳遞給分量合成器26,后者控制頻譜分量的合成,以使合成分量具有適當(dāng)?shù)囊粽{(diào)水平。這可以通過構(gòu)造類似音調(diào)和類似噪聲合成分量的加權(quán)組合已獲得所需的音調(diào)水平來完成。
e)時間形狀子帶信號代表的信號的時間形狀可以直接由子帶信號估計出來。時間形狀估計器的一個實施例的技術(shù)基礎(chǔ)可以用公式1所代表的線性系統(tǒng)來解釋。
y(t)=h(t)·x(t)(1)其中,y(t)是其時間形狀待估計的信號;h(t)是信號y(t)的時間形狀;點符號(·)表示相乘;以及x(t)是信號y(t)的時間平坦化的版本。
該公式可以重寫為Y[k]=H[k]*X[k](2)其中,Y[k]是信號y(t)的頻域表示;H[k]是h(t)的頻域表示;星號(*)表示卷積;以及X[k]是信號x(t)的頻域表示。
頻域表示Y[k]對應(yīng)于解碼器24獲得的一個或多個子帶信號。通過求解由Y[k]和X[k]的自回歸移動平均(ARMA)模型導(dǎo)出的方程組,分析器25可以得到時間形狀h(t)頻域表示H[k]的估計。關(guān)于使用ARMA模型的附加信息可以由Proakis和Manolakis的文章“DigitalSignal ProcessingPrinciples,Algorithms and Applications”(MacMillan Publishing Co.,New York,1988)獲得,特別參見818-821頁。
頻域表示Y[k]按照變換系數(shù)的塊排列,變換系數(shù)的每個塊表達(dá)了信號y(t)的一個短時譜。頻域表示X[k]也是按照塊排列,頻域表示X[k]中系數(shù)的每個塊代表假設(shè)為廣義平穩(wěn)的時間平坦信號x(t)的樣本的一個塊。還假設(shè)表示X[k]的每個塊中的系數(shù)是獨立分布的。給定這些假設(shè),信號可以用下面的ARMA模型表示Y[k]+Σl=1LalY[k-l]=Σq=0QbqX[k-q]---(3)]]>其中L是ARMA模型中自回歸部分的長度;以及Q是ARMA模型中移動平均部分的長度。
可以通過求解Y[k]的自相關(guān)求解公式3中的al和bqE{Y[k]·Y[k-m]}=-Σl=1LalE{Y[k-l]Y[k-m]}+Σq=0QbqE{X[k-q]·Y[k-m]}----(4)]]>其中E{}表示期望值函數(shù)。
公式4可以重寫為RYY[m]=-Σl=1LalRYY[m-l]+Σq=0QbqRXY[m-q]----(5)]]>其中RYY[m]表示Y[n]的自相關(guān);以及RXY[k]表示Y[k]和X[k]的互相關(guān)。
如果進(jìn)一步假設(shè)H[k]代表的線性系統(tǒng)僅僅是自回歸的,那么公式5右邊第二分量可以忽略。于是公式5可以重寫為 這表示可以用于求解L個系數(shù)ai的一組L個線性方程。
用這個解釋,在此可以說明一個使用頻域技術(shù)的時間形狀估計器的實施例。在該實施例中,時間形狀估計器接收一個或多個子帶信號y(t)的頻域表示Y[k]并計算對于-L≤m≤L的自相關(guān)序列RYY[m]。這些值用于建立一組求解系數(shù)ai的線性方程,這些系數(shù)表示下面公式7所示的線性全極點濾波器FR的極點。
FR(z)=11+Σi=1Laiz-i----(7)]]>
該濾波器可用于如同類似噪聲信號的任意時間平坦化信號的頻域表達(dá),以獲得時間形狀基本上等于信號y(t)時間形狀的時間平坦化信號的一個版本的頻域表達(dá)。
濾波器FR的極點描述可以傳遞給分量合成器26,它可以使用該濾波器生成代表具有所需時間形狀的信號的合成頻譜分量。
2.合成頻譜分量的生成分量合成器26可以用多種方法生成合成頻譜分量。下面說明兩種方法??梢圆捎枚喾N方法。例如,根據(jù)由子帶信號導(dǎo)出的特征或頻率可以選擇不同的方法。
第一種方法生成類似噪聲信號。例如,很多種時域或頻域技術(shù)中的任何一個都基本上可以用于生成類似噪聲信號。
第二種方法使用一種稱為譜平移或譜復(fù)制的技術(shù),從一個或多個頻率子帶中復(fù)制頻譜分量。因為較高頻率分量通常以某種方式與較低頻率分量相聯(lián)系,所以較低頻率的頻譜分量通常復(fù)制到較高頻率。但原則上,頻譜分量可以復(fù)制到較低或較高的頻率。如果需要,可以將噪聲添加或混合入平移分量中并可以按需要適配幅度。所作的適配最好能消除或至少減少合成分量相位的不連續(xù)。
頻譜分量的合成由接收自分析器25的信息控制以使合成頻譜分量具有得自子帶信號的一個或多個特征。
3.信號分量的集成可以用多種方法將合成頻譜分量與子帶信號頻譜分量集成在一起。一種方法是通過組合代表相應(yīng)頻率的相應(yīng)合成分量與子帶分量,將合成分量作為一種顫動的形式。另一種方法是用一個或多個合成分量代替所選的子帶信號中出現(xiàn)的頻譜分量。還有一種方法是合并合成分量與子帶信號分量以代表子帶信號中沒有出現(xiàn)的頻譜分量。這些與其他方法可以用于多種組合。
C.發(fā)送器前面說明的本發(fā)明的各個方面可以在接收器上實現(xiàn),而不需要發(fā)送器提供任何超過用接收器接收和解碼沒有本發(fā)明特征的子帶信號時所需要的控制信息。如果提供了附加的控制信息那么本發(fā)明的這些方面可以得到增強。下面討論一個例子。
將時間整形應(yīng)用于合成分量的程度可以由編碼信息中提供的控制信息進(jìn)行適配??梢圆捎玫囊环N方法是使用如下面公式所示的參數(shù)β。
當(dāng)β=0時濾波器不提供時間整形,當(dāng)β=1時,濾波器提供的時間整形程度使得合成分量的時間形狀和子帶信號的時間形狀之間的相關(guān)性最大。β為其它值時提供的時間整形程度介于前面二者之間。
在一個是實例中,發(fā)送器提供的控制信息允許接收器設(shè)置β值取八個值中的一個。
發(fā)送器可以提供其它的控制信息以使接收器可以按所需的任何方法將其用于適配分量合成過程。
D.實施本發(fā)明的各個方面可以用很多種方法實施,包括通用計算機(jī)系統(tǒng)中或其它一些裝置中的軟件,這些裝置包括更專門化的器件如數(shù)字信號處理(DSP)電路,連接到類似于通用計算機(jī)中的那些元件。圖3是可以用于實施本發(fā)明在發(fā)送器或接收器中各個方面的裝置70的框圖。DSP 72提供計算資源。RAM 73是信號處理時DSP 72使用的系統(tǒng)隨機(jī)存取存儲器(RAM);ROM 74表示持久存儲的某種形式,如只讀存儲器(ROM),它存儲操作裝置70以及實施本發(fā)明各個方面所需的程序。I/O(輸入/輸出)控制器75表示的是通過通信信道76、77接收和發(fā)送信號的接口電路。當(dāng)需要接收和/或發(fā)送模擬音頻信號時,I/O控制器75可以包含模-數(shù)發(fā)送器和數(shù)-模發(fā)送器。如實施例所示,所有主要的系統(tǒng)組件都與總線71相連,該總線代表的物理總線可能不止一種;但總線結(jié)構(gòu)對于本發(fā)明的實施不是必需的。
在通用計算機(jī)系統(tǒng)中的實施例,可以包含附加的元件,用于連接鍵盤或鼠標(biāo)以及顯示器等裝置,以及控制含有存儲媒體的存儲裝置,媒體如磁帶或磁盤或光學(xué)媒體等。存儲媒體可以用于記錄操作系統(tǒng)、實用及應(yīng)用的指令程序,可以包含實施本發(fā)明各個方面的程序本身。
實施本發(fā)明各個方面所需的功能可由以多種方式實現(xiàn)的部件來執(zhí)行,包括分立邏輯部件、一個或多個ASIC和/或程控處理器。這些部件的實現(xiàn)方式對于本發(fā)明不重要。
本發(fā)明的軟件實施可以通過多種機(jī)器可讀媒介傳輸,如覆蓋從超聲到紫外頻段頻率范圍的基帶或調(diào)制通信線路,或通過使用基本上任何磁性或光學(xué)記錄技術(shù)傳送信息的存儲媒體傳送,包括磁帶,磁盤和光盤。也可以在計算機(jī)系統(tǒng)70的各個組件中采用處理電路實施各個方面,如ASIC,通用集成電路,由包含在各種ROM或RAM中的程序控制的微處理器以及其它技術(shù)。
權(quán)利要求
1.一種處理編碼音頻信息的方法,其中該方法包括接收編碼音頻信息并從其中獲得代表音頻信號的一些但不是全部頻譜內(nèi)容的子帶信號;檢查子帶信號以獲得音頻信號的特征;生成具有該音頻信號特征的合成頻譜分量;集成合成頻譜分量與子帶信號以生成一組修改的子帶信號;以及通過對該組修改的子帶信號應(yīng)用合成濾波器組來生成音頻信息。
2.權(quán)利要求1的方法,其中所述特征是時間形狀,該方法通過生成頻譜分量并將生成的頻譜分量與該時間形狀的頻域表示進(jìn)行卷積以生成具有該時間形狀的合成頻譜分量。
3.權(quán)利要求1的方法,該方法通過計算子帶信號的至少一些分量的自相關(guān)函數(shù)以獲得時間形狀。
4.權(quán)利要求1的方法,其中所述特征是時間形狀,該方法通過生成頻譜分量并對至少一些生成的頻譜分量應(yīng)用濾波器以生成具有該時間形狀的合成頻譜分量。
5.權(quán)利要求4的方法,該方法從編碼信息中獲得控制信息并響應(yīng)于控制信息適配濾波器。
6.權(quán)利要求1的方法,該方法通過合并合成頻譜分量與子帶信號的分量以生成該組修改的子帶信號。
7.權(quán)利要求1的方法,該方法通過組合合成頻譜分量與子帶信號的相應(yīng)分量以生成該組修改的子帶信號。
8.權(quán)利要求1的方法,該方法通過用合成頻譜分量代替子帶信號的相應(yīng)分量以生成該組修改的子帶信號。
9.權(quán)利要求1的方法,該方法通過檢查頻譜第一部分中的一個或多個子帶信號的分量以獲得音頻信號的特征;通過復(fù)制頻譜第一部分中的一個或多個子帶信號分量到頻譜的第二部分以形成合成子帶信號并修改復(fù)制的分量以使得合成子帶信號具有音頻信號的特征,來生成合成頻譜分量;以及通過組合合成子帶信號與子帶信號來集成合成頻譜分量與子帶信號。
10.權(quán)利要求1的方法,其中所述特征是幅度、譜形狀、心理聲學(xué)掩蔽效應(yīng)、音調(diào)以及時間形狀中的任何一種。
11.一種媒體,該媒體對于某一裝置是可讀的并且傳送該裝置可執(zhí)行的指令程序以執(zhí)行編碼音頻信息處理方法,其中該方法包括執(zhí)行下面操作的步驟接收編碼音頻信息然后獲得代表一些但不是全部音頻信號頻譜內(nèi)容的子帶信號;檢查子帶信號以獲得音頻信號的特征;生成具有音頻信號特征的合成頻譜分量;集成合成頻譜分量與子帶信號以生成一組修改的子帶信號;以及通過對該組修改的子帶信號使用合成濾波器組來生成音頻信息。
12.權(quán)利要求11的媒體,其中所述特征是時間形狀并且該方法通過生成頻譜分量并將生成的頻譜分量與時間形狀的頻域表示進(jìn)行卷積以生成具有該時間形狀的合成頻譜分量。
13.權(quán)利要求11的媒體,其中該方法通過計算子帶信號至少一些分量的自相關(guān)函數(shù)以獲得時間形狀。
14.權(quán)利要求11的媒體,其中所述特征是時間形狀,該方法通過生成頻譜分量并對至少一些生成的頻譜分量使用濾波器以生成具有該時間形狀的合成頻譜分量。
15.權(quán)利要求14的媒體,其中該方法從編碼信息中獲得控制信息并響應(yīng)于控制信息適配濾波器。
16.權(quán)利要求11的媒體,其中該方法通過合并合成頻譜分量與子帶信號分量以生成該組修改的子帶信號。
17.權(quán)利要求11的媒體,其中該方法通過組合合成頻譜分量與子帶信號的相應(yīng)分量以生成該組修改的子帶信號。
18.權(quán)利要求11的媒體,其中該方法通過用合成頻譜分量代替子帶信號的相應(yīng)分量以生成該組修改的子帶信號。
19.權(quán)利要求11的媒體,其中該方法通過檢查頻譜第一部分的一個或多個子帶信號分量以獲得音頻信號的特征;復(fù)制頻譜第一部分的一個或多個子帶信號分量到頻譜的第二部分以構(gòu)造合成子帶信號并修改復(fù)制的分量以使得合成子帶信號具有音頻信號的特征,從而生成合成頻譜分量;以及通過組合合成子帶信號與子帶信號以集成合成頻譜分量與子帶信號。
20.權(quán)利要求11的媒體,其中所述特征是幅度,譜形狀,心理聲學(xué)掩蔽效應(yīng),音調(diào)以及時間形狀中的任何一種。
21.一種用于處理編碼音頻信息的裝置,其中該裝置包括接收編碼音頻信息的輸入端;存儲器;以及與輸入端和存儲器連接的處理電路;其中處理電路適合于接收編碼音頻信息并從中獲得代表音頻信號的一些但不是全部頻譜內(nèi)容的子帶信號;檢查子帶信號以獲得音頻信號的特征;生成具有該音頻信號特征的合成頻譜分量;集成合成頻譜分量與子帶信號以生成一組修改的子帶信號;以及通過對該組修改的子帶信號應(yīng)用合成濾波器組來生成音頻信息。
22.權(quán)利要求21的媒體,其中所述特征是時間形狀,該處理電路適合于通過生成頻譜分量并將生成的頻譜分量與該時間形狀的頻域表示進(jìn)行卷積以生成具有該時間形狀的合成頻譜分量。
23.權(quán)利要求21的媒體,其中該處理電路適合于通過計算子帶信號的至少一些分量的自相關(guān)函數(shù)以獲得時間形狀。
24.權(quán)利要求21的媒體,其中所述特征是時間形狀,該處理電路適合于通過生成頻譜分量并對至少一些生成的頻譜分量應(yīng)用濾波器以生成具有該時間形狀的合成頻譜分量。
25.權(quán)利要求24的媒體,其中該處理電路適合于從編碼信息中獲得控制信息并響應(yīng)于控制信息適配濾波器。
26.權(quán)利要求21的媒體,其中該處理電路適合于通過合并合成頻譜分量與子帶信號的分量以生成該組修改的子帶信號。
27.權(quán)利要求21的媒體,其中該處理電路適合于通過組合合成頻譜分量與子帶信號的相應(yīng)分量以生成該組修改的子帶信號。
28.權(quán)利要求21的媒體,其中該處理電路適合于通過用合成頻譜分量代替子帶信號的相應(yīng)分量以生成該組修改的子帶信號。
29.權(quán)利要求21的媒體,其中該處理電路適合于通過檢查頻譜第一部分中的一個或多個子帶信號的分量以獲得音頻信號的特征;通過復(fù)制頻譜第一部分中的一個或多個子帶信號分量到頻譜的第二部分以形成合成子帶信號并修改復(fù)制的分量以使得合成子帶信號具有音頻信號的特征,來生成合成頻譜分量;以及通過組合合成子帶信號與子帶信號以集成合成頻譜分量與子帶信號。
30.權(quán)利要求21的媒體,其中所述特征是幅度、譜形狀、心理聲學(xué)掩蔽效應(yīng)、音調(diào)以及時間形狀中的任何一種。
全文摘要
音頻編碼系統(tǒng)中的接收器接收傳載音頻信號的頻率子帶信號的信號。檢查子帶信號以估計音頻信號的一個或多個特征。合成具有估計特征的頻譜分量。集成合成頻譜分量與子帶信號并通過合成濾波器組以生成輸出信號。在一個實施例中,估計的特征是時間形狀,合成的類似噪聲的頻譜分量具有音頻信號的時間形狀。
文檔編號G10L19/02GK1662960SQ03813969
公開日2005年8月31日 申請日期2003年6月9日 優(yōu)先權(quán)日2002年6月17日
發(fā)明者格蘭特·A.·戴維森, 邁克爾·M.·杜魯門, 馬修·C.·費勒斯, 馬克·S.·文頓 申請人:杜比實驗室特許公司