專利名稱:一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,尤其是適合于包含多種編碼速率的音頻編碼器,屬于音頻編碼領(lǐng)域
背景技術(shù):
變速率的音頻編碼技術(shù)是根據(jù)輸入音頻信號的統(tǒng)計特性,或者通信鏈路質(zhì)量,或者網(wǎng)絡(luò)用戶的需求來控制信息傳輸速率,從而降低傳輸?shù)钠骄a率,提高傳輸效率,它相對于傳統(tǒng)的固定速率編碼方法能夠更好的節(jié)省信道帶寬,受到研究者的廣泛重視。一般而言, 變速率的語音編碼算法可以分為信源控制的或信道控制的兩大類,后者可以是信道或網(wǎng)絡(luò)控制編碼速率可變,通常是根據(jù)外部控制信號從一種速率切換為預(yù)定速率集合中的另一種速率,如AMR自適應(yīng)多速率語音編碼,也可以是可分級的編解碼方式。信源控制的變速率編碼方法則是根據(jù)輸入信號的特性來動態(tài)的分配編碼比特或采用不同的編碼模式,其編碼器的目的是為了確保輸出信號質(zhì)量的同時給每幀音頻信號分配盡可能少的比特,如3GPP2標(biāo)準(zhǔn)中提出的SMV可選模式聲碼器。目前變速率編碼的方法大多用于基于線性預(yù)測和碼本激勵的語音編碼器,例如我國專利申請?zhí)枮?00810210215(
公開日2009年03月18日)和申請專利號為 200710153938 (
公開日2009年02月04日)的發(fā)明專利提出了根據(jù)合成數(shù)字話音幀的話音激活檢測結(jié)果或者清濁音檢測結(jié)果來確定編碼速率的變速率碼激勵線性預(yù)測編碼器和編碼方法。后期產(chǎn)生了多模式變速率方法,它是針對不同特性的輸入信號幀設(shè)計最佳的編碼模式和分配最低的編碼速率,并使編碼器能夠保持較好的解碼聲音質(zhì)量。通常有兩種技術(shù)可以實現(xiàn)多模式變速率,一種是閉環(huán)方式,一種是開環(huán)方式。前者基于某種失真準(zhǔn)則通過閉環(huán)搜索判斷哪種模式最適合當(dāng)前幀編碼,當(dāng)選擇合適的失真準(zhǔn)則時能夠使得語音幀和編碼模式達到最佳匹配,后者通?;谡Z音幀分類的方式,對不同類的語音幀采用不同的編碼模式或編碼速率,以達到編碼比特有效分配的效果。開環(huán)方式的復(fù)雜度較低,但需要魯棒性較高的語音幀分類算法,閉環(huán)的計算復(fù)雜度較高,但編碼模式匹配效果較好。VAD話音激活檢測技術(shù)是變速率語音編碼器中常用的方法,它通過降低語音靜默段的量化編碼比特從而大大降低整體編碼速率,但在音樂信號的編碼中并不適用,音樂信號不像語音信號在通話過程中存在50%左右的靜默段,可以利用VAD技術(shù)來降低靜默段的編碼速率。3GPP2標(biāo)準(zhǔn)中提出的EVRC增強型可變速率編碼器和SMV可選模式聲碼器都是基于語音幀分類的方式來確定每幀的量化編碼方式和編碼速率,從而達到整體編碼速率的降低。而3GPP 標(biāo)準(zhǔn)中的 AMR-NB (TS 26. 090)、AMR-ffB (TS 26. 190)則是根據(jù)信道傳輸?shù)膼毫忧闆r來從預(yù)定的多種速率中選擇合適的編碼速率傳輸窄帶或?qū)拵дZ音,AMR-WB+(TS 26. 290)則是一種在AMR-WB基礎(chǔ)上發(fā)展的自適應(yīng)多速率的語音和音樂混合編碼方法,在編碼之前首先確定編碼速率,對于每幀音頻信號再選擇合適的ACELP (代數(shù)碼本激勵)或 TCX (Transform Coded Excitation)變換碼激勵編碼模式,ACELP傾向于編碼語音幀,TCX 傾向于編碼音頻幀,對于每幀輸入音頻信號,從26種ACELP/TCX組合編碼模式中選擇最佳的編碼模式。我國AVS數(shù)字音視頻編碼標(biāo)準(zhǔn)工作組提出的AVS-PlO是多速率的移動語音和音頻混合的編解碼器,與AMR-WB+的編解碼原理相似,其核心模塊的編碼方式有所不同, AVS-PlO核心模塊采用ACELP/TVC (Transform Vector Coding,變換域矢量編碼),兩者的單聲道編碼速率都有8種速率,立體聲編碼速率都有16種速率,兩者均是信道控制的變速率編碼,而沒有采用信源控制變速率編碼方法,尤其對音樂信號未有合適的源控變速率方式
發(fā)明內(nèi)容
本發(fā)明的目的是為了進一步提高多速率音頻編碼器的編碼效率,壓縮編碼帶寬, 利用閉環(huán)源控變速率的方式降低某些音頻幀的編碼速率,通過設(shè)計合適的閉環(huán)選擇準(zhǔn)則從而達到整體的平均編碼速率的降低。為了實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是首先對每幀音頻信號在高速率下進行編解碼,將該速率下各種編碼模式的編碼輸入信號和解碼輸出信號通過感知加權(quán)濾波器后計算平均分段信噪比,并選出使感知加權(quán)平均分段信噪比最大的編碼模式,然后在臨近高速率的低編碼速率下選出使編碼輸入信號和解碼輸出信號的感知加權(quán)平均分段信噪比最大的編碼模式,最后分別對于高、低速率下選出來的編碼模式,計算編碼輸入信號和解碼輸出信號平均分段信噪比,如果低速率編碼模式下的平均分段信噪比相比高速率編碼模式下的偏大,則切換到低速率編碼模式,反之則切換到高速率編碼模式。本發(fā)明所用到的技術(shù)方案中涉及到的感知加權(quán)濾波器的表達式為
P
權(quán)利要求
1.一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,設(shè)置一個預(yù)先設(shè)定的編碼速率集合和一個預(yù)先設(shè)定的編碼模式集合,該編碼速率集合涉及一組從高到低的不同編碼速率,且至少包含兩種編碼速率,該編碼模式集合涉一組不同的音頻信號編碼模式,且至少包含兩種編碼模式,每幀音頻信號將從由高速率到低速率的編碼模式集合中根據(jù)解碼輸出信號相對于編碼輸入信號和的失真大小選擇最佳編碼模式和編碼速率;其特征在于,本發(fā)明是通過如下步驟實現(xiàn)的對于待處理的每幀音頻信號(1)從編碼速率集合(Ri,i = 1,...,M,M是編碼速率的個數(shù))中選定一種編碼速率 Rh(h > 1),在該編碼速率下對于編碼模式集合(O” i = 1,...,N,N是編碼模式的個數(shù))中的每種編碼模式,對該幀音頻信號分別進行編解碼;(2)分別將步驟(1)中每種編碼模式下得到的編碼輸入信號和解碼輸出信號通過感知加權(quán)濾波器得到加權(quán)輸入信號和加權(quán)輸出信號;(3)分別計算步驟(2)中每個編碼模式下得到的加權(quán)輸入信號和加權(quán)輸出信號的平均分段信噪比,選出使平均分段信噪比最大的編碼模式,記為Oh ;(4)在步驟(3)中選出來的高速率編碼模式Oh下,計算編碼輸入信號和解碼輸出信號的平均分段信噪比,記為SH;(5)采用比編碼速率Rh低一級的相鄰編碼速率R1G=h-l)對該幀音頻信號進行編解碼,并在每種編碼模式下,將編碼輸入信號和解碼輸出信號分別通過感知加權(quán)濾波器后計算平均分段信噪比,選出使平均分段信噪比最大的編碼模式,記為;(6)在步驟(5)中選出來的低速率編碼模式下,計算編碼輸入信號和解碼輸出信號的平均分段信噪比,記為(7)對上述步驟中選出來的高速率編碼模式Oh下的Sh和低速率編碼模式下的&判斷大小,如果& > Sh,則從高速率編碼模式Oh切換到低速率編碼模式(\,反之則從低速率編碼模式切換到高速率編碼模式0H。
2.如權(quán)利要求1所述的一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,其特征在于步驟(2)中所述的感知加權(quán)濾波器的表達式為P
3.如權(quán)利要求1所述的一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,其特征在于輸出信號釾“)相對于輸入信號χ (η)的平均分段信噪比的計算過程為a.將一幀信號劃分為Nsf個子幀,計算每個子幀的分段信噪比
全文摘要
本發(fā)明涉及一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,屬于音頻編碼領(lǐng)域,特別是適合用于多速率的音頻編碼器。其技術(shù)特點是首先對每幀音頻信號在高速率下進行編解碼,將該速率下各種編碼模式的編碼輸入信號和解碼輸出信號通過感知加權(quán)濾波器后計算平均分段信噪比,并選出使感知加權(quán)平均分段信噪比最大的編碼模式,然后在臨近高速率的低編碼速率下選出使編碼輸入信號和解碼輸出信號的感知加權(quán)平均分段信噪比最大的編碼模式,最后分別對于高、低速率下選出來的編碼模式,計算編碼輸入信號和解碼輸出信號平均分段信噪比,如果低速率編碼模式下的平均分段信噪比相比高速率編碼模式下的偏大,則切換到低速率編碼模式,反之則切換到高速率編碼模式。本發(fā)明的方法對每幀音頻信號根據(jù)輸出信號相對輸入信號的失真大小,在相鄰的高低編碼速率下的各編碼模式間切換,從而在保持良好編碼質(zhì)量的同時,降低音頻信號的平均編碼速率,從而提高多速率音頻編碼器的編碼效率。
文檔編號G10L19/12GK102254562SQ201110180050
公開日2011年11月23日 申請日期2011年6月29日 優(yōu)先權(quán)日2011年6月29日
發(fā)明者孟凱, 楊果, 王晶, 趙勝輝 申請人:北京理工大學(xué)