專(zhuān)利名稱(chēng):高頻耦合的偽小波5聲道音頻編/解碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種對(duì)單聲道進(jìn)行高頻耦合的方法,特別涉及一種高頻耦合的偽小波5聲道音頻編/解碼方法。
背景技術(shù):
5聲道音頻是一種被廣泛用于電影、數(shù)字電視、家庭影院和虛擬現(xiàn)實(shí)等視聽(tīng)領(lǐng)域內(nèi)的音頻應(yīng)用形式。使用5聲道音頻的視聽(tīng)節(jié)目或媒體產(chǎn)品,其特點(diǎn)是具有極強(qiáng)的定位感、空間感、真實(shí)感,能夠營(yíng)造出逼真的聲場(chǎng)環(huán)境,帶給聽(tīng)眾親臨其境般的聽(tīng)覺(jué)體驗(yàn)和享受。
從技術(shù)角度看,5聲道的數(shù)字音頻信號(hào)原始數(shù)據(jù)量是單聲道音頻的5倍之多。這就意味著5聲道音頻的存儲(chǔ)、傳輸、處理和回放的各個(gè)環(huán)節(jié)都要比單聲道音頻困難得多,更需要先進(jìn)的數(shù)字壓縮技術(shù)的支持。而另一方面,5聲道音頻本質(zhì)上的各個(gè)聲道間具有相關(guān)性的特點(diǎn),以及人耳在高頻端依靠譜包絡(luò)定位的聽(tīng)覺(jué)特點(diǎn),造成5個(gè)聲道的音頻信號(hào)之間存在巨大的感知信息冗余,為對(duì)其進(jìn)一步壓縮提供了相當(dāng)大的空間。
發(fā)明內(nèi)容
本發(fā)明的偽小波5聲道高頻耦合編碼是基于人耳在高頻區(qū)對(duì)頻譜的細(xì)節(jié)不敏感,而對(duì)頻譜包絡(luò)及其變化敏感的特性進(jìn)行的。針對(duì)5聲道聲場(chǎng)的對(duì)稱(chēng)性,通過(guò)有選擇地忽略特定的高頻細(xì)節(jié)信息,而保留高頻譜包絡(luò)及其變化,達(dá)到減少信息的感知冗余并提高編碼效率的目的。
一種基于高頻耦合的偽小波5聲道音頻編/解碼方法,是對(duì)于5聲道編碼,以及對(duì)單、雙聲道的高頻耦合,但不局限于單、雙聲道編/解碼結(jié)構(gòu)。在編碼端輸入5聲道的時(shí)域信號(hào),將信號(hào)分別傳輸至信號(hào)類(lèi)型檢測(cè)、心理聲學(xué)模型和偽小波濾波器組,信號(hào)經(jīng)類(lèi)型檢測(cè)后可以判斷出該信號(hào)是緩變信號(hào)還是快變信號(hào),用以控制偽小波濾波器組的分辨率,具體的說(shuō)是對(duì)于緩變信號(hào)用頻率分辨率較高的濾波器組,對(duì)于快變信號(hào)的中高頻部分則用時(shí)域分辨率較高的濾波器組,而快變信號(hào)的低頻部分用頻率分辨率較高的濾波器組,信號(hào)經(jīng)過(guò)偽小波變換后的系數(shù)被傳送到相關(guān)系數(shù)計(jì)算單元中進(jìn)行相關(guān)系數(shù)計(jì)算,然后根據(jù)單元計(jì)算的結(jié)果,并按照耦合模式選擇準(zhǔn)則選取最佳耦合模式,然后用最佳耦合模式來(lái)量化和編碼偽小波系數(shù),其中量化和編碼所用的比特分配方案由心理聲學(xué)模型來(lái)控制,最后將量化和編碼系數(shù)和邊信息一起傳送到多聲道碼流進(jìn)行合成輸出。
所述的偽小波5聲道音頻編/解碼方法,耦合模式對(duì)各個(gè)聲道的高頻部分進(jìn)行耦合編碼,最后對(duì)耦合關(guān)聯(lián)系數(shù)進(jìn)行量化,并形成碼流寫(xiě)入輸出碼流文件,而對(duì)于非耦合聲道以及耦合聲道的非耦合頻段的編碼方式與單聲道的編碼方式完全一樣。
所述的偽小波5聲道音頻編/解碼方法,可以根據(jù)不同的情況對(duì)高頻耦合模式進(jìn)行多種組合。高頻耦合模式有五個(gè)聲道都不做高頻耦合;由一個(gè)聲道耦合另一個(gè)聲道;由一個(gè)聲道耦合其它兩個(gè)聲道;由一個(gè)聲道耦合其它三個(gè)聲道。
所述的偽小波5聲道音頻編/解碼方法,信號(hào)類(lèi)型檢測(cè)用來(lái)判斷該幀信號(hào)是快變信號(hào)還是緩變信號(hào),并對(duì)快變類(lèi)型的信號(hào)的高頻部分采取時(shí)域分辨率較高的濾波器組,快變信號(hào)的低頻部分用頻率分辨率較高的濾波器組的處理方式,對(duì)于緩變類(lèi)型信號(hào),偽小波變換采取頻域分辨率較高的處理方式。
所述的偽小波5聲道音頻編/解碼方法,高頻耦合中的相關(guān)系數(shù)計(jì)算單元的計(jì)算式表示為設(shè)x1(k),x2(k)為兩個(gè)不同聲道的信號(hào),則這兩個(gè)聲道在耦合頻段的相關(guān)系數(shù)定義為Cor12=1NΣi=begbendb[Σk=flifhix1(k)x2(k)/[Σk=flifhix12(k)Σk=flifhix22(k)]]]]>其中N為參加耦合的子帶數(shù);begb和endb分別為耦合的開(kāi)始子帶編號(hào)和結(jié)束子帶編號(hào);fli和fhi分別為第i個(gè)子帶的下邊界和上邊界的頻率;所述的偽小波5聲道音頻編/解碼方法,最佳耦合模式的選擇式為a. b. c.當(dāng)a和b中的條件都不滿(mǎn)足時(shí),可以通過(guò)相關(guān)系數(shù)對(duì)如下三種情況唯一地確定最佳耦合模式只有一個(gè)耦合聲道(耦合模式1~8),有兩個(gè)耦合聲道(耦合模式9~12),有三個(gè)耦合聲道(耦合模式13~15)。首先對(duì)每一種情況按照相關(guān)系數(shù)各找出一種耦合模式。
所述的偽小波5聲道音頻編/解碼方法,偽小波變換可以根據(jù)該信號(hào)是快變信號(hào)還是緩變信號(hào)自適應(yīng)的改變頻域(時(shí)域)分辨率;具體的說(shuō)就是對(duì)于快變類(lèi)型的信號(hào)的高頻部分采取時(shí)域分辨率較高的濾波器組,對(duì)于快變信號(hào)的低頻部分用頻率分辨率較高的濾波器組的處理方式,對(duì)于緩變信號(hào)采取頻域分辨率較高的處理方式。
所述的偽小波5聲道音頻編/解碼方法,比特分配采用公共比特池技術(shù),該技術(shù)是在量化編碼模塊中實(shí)現(xiàn)的,在量化循環(huán)的每一步中,都要對(duì)5聲道的所有非耦合子帶按NMR排序,找出NMR最大的子帶并減小其量化步長(zhǎng)。
所述的偽小波5聲道音頻編/解碼方法,耦合關(guān)聯(lián)系數(shù)CCi定義為 上式中ECi,ERi分別代表耦合頻段中耦合聲道和恢復(fù)聲道在子帶i的能量。
所述的偽小波5聲道音頻編/解碼方法,耦合關(guān)聯(lián)系數(shù),用非線(xiàn)性量化的方法將其離散化并表示為8位的符號(hào)數(shù)。非線(xiàn)性量化的公式為CCi_transmitted=INT[(4log10CCi)0.814]上式中的INT表示取整函數(shù)。
本發(fā)明在使用高頻耦合的5聲道偽小波編碼器中,當(dāng)原始音頻信號(hào)為16位48khz采樣的PCM流時(shí),在目標(biāo)碼率為384kbps下對(duì)5聲道測(cè)試音頻幀基本都能達(dá)到透明編碼(也即是感知無(wú)失真的編碼),比不用高頻耦合的5聲道偽小波編碼提高了至少3個(gè)百分點(diǎn)以上,這說(shuō)明5聲道的耦合編碼相當(dāng)明顯地提高了編碼的質(zhì)量。
圖1是本發(fā)明的信號(hào)流程框圖。
圖2是5聲道音頻應(yīng)用的聲場(chǎng)布置示意圖。
具體實(shí)施例方式
下面將結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的說(shuō)明。
請(qǐng)參見(jiàn)圖1所示,本發(fā)明的一種基于高頻耦合的偽小波5聲道音頻編/解碼,包括但不局限于單、雙聲道編碼結(jié)構(gòu),以及對(duì)5聲道進(jìn)行高頻耦合處理,由圖中可以看出除了中間虛線(xiàn)框10外,其他結(jié)構(gòu)均與單聲道編碼結(jié)構(gòu)一樣,亦即5聲道編碼是由單聲道編碼擴(kuò)展而來(lái)。在編碼端輸入5聲道的時(shí)域信號(hào),將信號(hào)分別傳輸至信號(hào)類(lèi)型檢測(cè)1、心理聲學(xué)模型3和偽小波濾波器組2,信號(hào)經(jīng)類(lèi)型檢測(cè)1后可以判斷出該信號(hào)是緩變信號(hào)還是快變信號(hào),用以控制偽小波濾波器組2的分辨率,具體的說(shuō)是對(duì)于緩變信號(hào)用頻率分辨率較高的偽小波變換,對(duì)于快變信號(hào)則用時(shí)域分辨率較高的偽小波變換。信號(hào)經(jīng)過(guò)偽小波變換后的系數(shù)被傳送到相關(guān)系數(shù)計(jì)算單元5中進(jìn)行相關(guān)系數(shù)計(jì)算,然后根據(jù)5單元計(jì)算的結(jié)果,并按照耦合模式選擇準(zhǔn)則選取最佳耦合模式6,然后用最佳耦合模式來(lái)量化和編碼偽小波系數(shù),其中量化和編碼所用的比特分配方案4由心理聲學(xué)模型3來(lái)控制,最后將量化和編碼系數(shù)和邊信息一起傳送到多聲道碼流進(jìn)行合成9輸出。
濾波器組以下簡(jiǎn)稱(chēng)偽小波變換,這里用偽小波變換來(lái)表示比傳統(tǒng)小波變換更豐富的濾波器組實(shí)現(xiàn)技術(shù),即偽小波變換不僅包括傳統(tǒng)的小波變換,還包括有余弦調(diào)制等技術(shù)實(shí)現(xiàn)的多分辨率濾波技術(shù)。
偽小波5聲道高頻耦合編碼是基于人耳在高頻區(qū)對(duì)頻譜的細(xì)節(jié)不敏感,而對(duì)頻譜包絡(luò)及其變化敏感的特性進(jìn)行的。針對(duì)5聲道聲場(chǎng)的對(duì)稱(chēng)性,通過(guò)有選擇地忽略特定的高頻細(xì)節(jié)信息,而保留高頻譜包絡(luò)及其變化,達(dá)到減少信息的感知冗余并提高編碼效率的目的。
偽小波5聲道高頻耦合編碼的實(shí)現(xiàn)在編碼端輸入5聲道的時(shí)域信號(hào)后,首先在時(shí)域?qū)π盘?hào)進(jìn)行分析,判斷該幀信號(hào)的類(lèi)型是快變信號(hào)還是緩變信號(hào);偽小波變換在時(shí)頻變換過(guò)程中根據(jù)信號(hào)的類(lèi)型選擇不同的處理方式,具體來(lái)說(shuō),對(duì)于緩變類(lèi)型信號(hào),偽小波變換采取頻域分辨率較高的處理方式,而對(duì)于快變類(lèi)型的信號(hào),則采取時(shí)域分辨率較高的處理方式;在得到各聲道的頻域系數(shù)后,判斷各聲道在臨界頻率后的高頻部分之間相關(guān)性的強(qiáng)弱,考慮到絕大多數(shù)五聲道數(shù)據(jù)都在左聲道和右聲道、左環(huán)繞聲道和右環(huán)繞聲道之間存在較強(qiáng)的相關(guān)性,所以在滿(mǎn)足一定條件下優(yōu)先考慮對(duì)這兩對(duì)聲道做高頻耦合,而條件不滿(mǎn)足時(shí),則根據(jù)各聲道之間相關(guān)性的強(qiáng)弱關(guān)系,挑選出若干最能體現(xiàn)當(dāng)前特定相關(guān)性的耦合模式,按這幾種模式分別嘗試進(jìn)行5聲道聯(lián)合編碼,根據(jù)噪聲掩蔽比的計(jì)算,從中找出使感知失真最小的耦合模式——即最佳耦合模式,并根據(jù)該耦合模式對(duì)各個(gè)聲道的高頻部分進(jìn)行耦合編碼。最后對(duì)耦合關(guān)聯(lián)系數(shù)進(jìn)行量化,并形成碼流寫(xiě)入輸出碼流文件。而對(duì)于非耦合聲道以及耦合聲道的非耦合頻段的編碼方式與單聲道完全編碼方式完全一樣。
如圖2所示中5個(gè)揚(yáng)聲器L,R,C,Ls,Rs,分別代表左聲道、右聲道、中央聲道、左環(huán)繞聲道和右環(huán)繞聲道。在我們定義的高頻耦合模式中,存在耦合關(guān)系的聲道在圖中都用雙向箭頭標(biāo)出。其中加粗箭頭的代表這兩對(duì)聲道可能存在強(qiáng)的相關(guān)性。在下面描述中,左聲道與右聲道、左環(huán)繞與右環(huán)繞的地位是平等對(duì)稱(chēng)的。即如果文中指出可以由左聲道恢復(fù)右聲道,那么也就代表著可以由右聲道恢復(fù)左聲道,環(huán)繞聲與其類(lèi)似。
以下分別說(shuō)明耦合頻段的定義、耦合模式的定義、聲道相關(guān)性計(jì)算、最佳耦合模式的選擇、耦合關(guān)聯(lián)系數(shù)的計(jì)算及量化和公共比特池的具體實(shí)現(xiàn)方法耦合頻段的定義由于耦合只在高頻進(jìn)行,因此我們規(guī)定在偽小波濾波器的某個(gè)子帶(稱(chēng)為臨界子帶)以上的所有子帶都為耦合頻段,這個(gè)特定的子帶實(shí)際上就決定了高頻耦合的頻率(稱(chēng)為臨界頻率)。為了更靈活地進(jìn)行編/解碼,并且提高解碼擴(kuò)展性與兼容性,我們對(duì)于不同的信號(hào)類(lèi)型定義了幾種常用的耦合臨界子帶,并將其序號(hào)作為邊信號(hào)編入壓縮后的音頻碼流。
耦合模式的定義耦合模式可以分成以下三種情況(一)五個(gè)聲道都不做高頻耦合;(二)由一個(gè)聲道耦合另一個(gè)聲道;(三)由一個(gè)聲道耦合其它兩個(gè)聲道。耦合模式具體定義如下(一)五個(gè)聲道都不做高頻耦合在表中它總是耦合模式0;(二)由一個(gè)聲道耦合另一個(gè)聲道可表示成Ti,j,其中i可為左聲道、中央聲道或左環(huán)繞聲道,則j可為右聲道或右環(huán)繞聲道;(三)由一個(gè)聲道耦合其它兩個(gè)聲道可表示為T(mén)i,j,k,其中i可為左聲道或中央聲道,則j可為右聲道、左環(huán)繞聲道或右環(huán)繞聲道由以上三種情況即可組成多種表,每個(gè)表選擇最有代表性的k(k為自然數(shù))種耦合模式。如表1即為多種表選擇出的一種,對(duì)于每種模式給出了哪些聲道是耦合聲道,并指明解碼時(shí)該聲道由哪個(gè)聲道來(lái)恢復(fù)即恢復(fù)聲道。其中T0,T1,T2,T3,T4,分別代表5聲道中的左聲道(L),右聲道(R),中央聲道(C),左環(huán)繞聲道(LS),右環(huán)繞聲道(RS)。表1中的符號(hào)“_”表示該聲道是耦合聲道,即在耦合頻段上不編碼。
表1 4bit動(dòng)態(tài)聲道耦合模式
按耦合模式解碼時(shí)遵循以下原則
(1)一行中若有Ti,j,則表示j聲道中的高頻譜系數(shù)由i聲道復(fù)制;(2)一行中若有Ti,j,k,則表示j聲道和k聲道中的高頻譜系數(shù)均由i聲道復(fù)制。
聲道間相關(guān)系數(shù)的計(jì)算由于基于高頻耦合的5聲道編碼中耦合聲道的高頻譜細(xì)節(jié)信息是由恢復(fù)聲道復(fù)制得來(lái)的,所以應(yīng)該選擇與耦合聲道相關(guān)性最強(qiáng)的聲道來(lái)進(jìn)行譜復(fù)制。相關(guān)性計(jì)算就是為了動(dòng)態(tài)自適應(yīng)地尋找當(dāng)前音頻信號(hào)中哪些聲道之間具有這種相關(guān)性。有幾種計(jì)算相關(guān)性的方法,下面是其中一種設(shè)x1(k),x2(k)為兩個(gè)不同聲道的信號(hào),則這兩個(gè)聲道在耦合頻段的相關(guān)系數(shù)定義為Cor12=1NΣi=begbendb[Σk=flifhix1(k)x2(k)/[Σk=flifhix12(k)Σk=flifhix22(k)]]]]>其中N為參加耦合的子帶數(shù);begb和endb分別為耦合的開(kāi)始子帶編號(hào)和結(jié)束子帶編號(hào);fli和fhi分別為第i個(gè)子帶的下邊界和上邊界的頻率;上面公式只是多種計(jì)算相關(guān)系數(shù)公式中的一個(gè),熟練的技術(shù)人員可以經(jīng)過(guò)一定修改和調(diào)整,完成與上述公式同樣的功能,也是屬于本專(zhuān)利保護(hù)范圍。
最佳耦合模式的選擇最佳耦合模式選擇準(zhǔn)則a. b. c.當(dāng)a和b中的條件都不滿(mǎn)足時(shí),可以通過(guò)相關(guān)系數(shù)對(duì)如下三種情況唯一地確定最佳耦合模式只有一個(gè)耦合聲道(耦合模式1~8),有兩個(gè)耦合聲道(耦合模式9~12),有三個(gè)耦合聲道(耦合模式13~15)。首先對(duì)每一種情況按照相關(guān)系數(shù)各找出一種耦合模式。這樣,就找到三種耦合模式,然后對(duì)這三種耦合模式分別進(jìn)行嘗試編碼,最后根據(jù)編碼后噪聲掩蔽比(NMR)最小(包括量化噪聲和耦合噪聲)的原則即可得出最佳耦合模式。在此處量化噪聲和耦合噪聲的意義是不一樣的,所以相等數(shù)值的量化噪聲和耦合噪聲對(duì)人耳的聽(tīng)覺(jué)效果是不一樣的。所以在判斷NMR時(shí)要對(duì)量化噪聲和耦合噪聲采用不同的閾值。
上面所述方法只是多種選擇最佳耦合模式方案中的一個(gè),熟練的技術(shù)人員可以經(jīng)過(guò)一定修改和調(diào)整,完成與上述方法同樣的功能,也是屬于本專(zhuān)利的保護(hù)范圍;如果根據(jù)權(quán)利要求3選擇了多種耦合模式,則本要求也要進(jìn)行相應(yīng)的變化,這也屬于本專(zhuān)利的保護(hù)范圍。說(shuō)明a.耦合模式的定義見(jiàn)表1;
b.其中w1為低相關(guān)系數(shù)閾值,w2為高相關(guān)系數(shù)閾值,w1和w2的值均由實(shí)驗(yàn)決定,一般信號(hào)可取w1=0.3,w2=0.6;c.Cor01為左聲道與右聲道之間的相關(guān)系數(shù),Cor34為左環(huán)繞聲道與右環(huán)繞聲道之間的相關(guān)系數(shù)。
耦合關(guān)聯(lián)系數(shù)的計(jì)算及量化由于耦合聲道在耦合頻段內(nèi)的譜信息是從恢復(fù)聲道中復(fù)制過(guò)來(lái)的,為了使各個(gè)子帶的譜包絡(luò)在編碼前后維持不變,需要給這些譜系數(shù)乘以一個(gè)反映耦合聲道與恢復(fù)聲道在各個(gè)子帶能量對(duì)比的系數(shù),即耦合關(guān)聯(lián)系數(shù)。耦合關(guān)聯(lián)系數(shù)CCi定義為CCi=ECiERi]]>上式中ECi,ERi分別代表耦合頻段中耦合聲道和恢復(fù)聲道在子帶i的能量。
上述公式只是計(jì)算耦合關(guān)聯(lián)系數(shù)方法之一,熟練的技術(shù)人員可以經(jīng)過(guò)一定修改和調(diào)整,完成與上述方法同樣的功能,同樣屬于本專(zhuān)利的保護(hù)范圍。
為了編碼耦合關(guān)聯(lián)系數(shù),用非線(xiàn)性量化的方法將其離散化并表示為8位的符號(hào)數(shù),寫(xiě)入碼流。非線(xiàn)性量化的公式為CCi_transmitted=INT[(4log10CCi)0.814]上式中的INT表示取整函數(shù)。這樣可以0.25分貝的分辨率非線(xiàn)性地表示±96分貝的動(dòng)態(tài)范圍,能夠滿(mǎn)足幾乎所有的音頻應(yīng)用,也符合人耳的聽(tīng)覺(jué)特性。解碼端用反變換即可將耦合關(guān)聯(lián)解出并恢復(fù)耦合聲道在耦合頻段的所有譜系數(shù)。
上述公式只是量化耦合關(guān)聯(lián)系數(shù)方法之一,熟練的技術(shù)人員可以經(jīng)過(guò)一定修改和調(diào)整,完成與上述方法同樣的功能,同樣屬于本專(zhuān)利的保護(hù)范圍。
公共比特池由于音頻編碼是按幀進(jìn)行的,對(duì)于給定的目標(biāo)碼率和采樣率,每幀數(shù)據(jù)平均耗用比特?cái)?shù)是一個(gè)常數(shù)。實(shí)際的編碼中,對(duì)于達(dá)到感知無(wú)失真的編碼要求而言,對(duì)比特?cái)?shù)的需求會(huì)在這個(gè)常數(shù)附近隨時(shí)間變化而波動(dòng)起伏。為了提高編碼的無(wú)失真率,常用比特池緩沖技術(shù)以減少比特需求不能滿(mǎn)足的機(jī)會(huì)。
多聲道的編碼中每幀的比特需求不僅隨時(shí)間而起伏,而且各聲道之間也有差別。如果每個(gè)聲道能夠依其動(dòng)態(tài)變化著的比特需求按比例從公共的比特池中分配比特,而非按不隨時(shí)間變化的固定比例分配,則能夠大大提高編碼的無(wú)失真率。
公共比特池是在量化編碼模塊中實(shí)現(xiàn)的。在量化循環(huán)中噪聲掩蔽比(NMR)最大的子帶即最需要比特的子帶。在量化循環(huán)的每一步中,都要對(duì)5聲道的所有非耦合子帶按NMR排序,找出NMR最大的子帶并減小其量化步長(zhǎng)(也即從公共比特池中分配比特給這個(gè)子帶)。這樣就保證了比特總是分配給最需要它的聲道,實(shí)現(xiàn)了在聲道間按需分配比特的目的。
在使用高頻耦合的5聲道偽小波編碼器中,當(dāng)原始音頻信號(hào)為16位48khz采樣的PCM流時(shí),在目標(biāo)碼率為384kbps下對(duì)5聲道測(cè)試音頻幀基本都能達(dá)到透明編碼(也即是感知無(wú)失真的編碼),比不用高頻耦合的5聲道偽小波編碼提高了至少3個(gè)百分點(diǎn)以上。這說(shuō)明5聲道的耦合編碼相當(dāng)明顯地提高了編碼的質(zhì)量。
權(quán)利要求
1.一種基于高頻耦合的偽小波5聲道音頻編/解碼方法,是對(duì)于5聲道編碼,以及對(duì)單、雙聲道的高頻耦合,但不局限于單、雙聲道編/解碼結(jié)構(gòu),其特征在于在編碼端輸入5聲道的時(shí)域信號(hào),將信號(hào)分別傳輸至信號(hào)類(lèi)型檢測(cè)(1)、心理聲學(xué)模型(3)和偽小波濾波器組(2),信號(hào)經(jīng)類(lèi)型檢測(cè)(1)后可以判斷出該信號(hào)是緩變信號(hào)還是快變信號(hào),用以控制偽小波濾波器組(2)的分辨率,具體的說(shuō)是對(duì)于緩變信號(hào)用頻率分辨率較高的濾波器組,對(duì)于快變信號(hào)的中高頻部分則用時(shí)域分辨率較高的濾波器組,而快變信號(hào)的低頻部分用頻率分辨率較高的濾波器組,信號(hào)經(jīng)過(guò)偽小波變換后的系數(shù)被傳送到相關(guān)系數(shù)計(jì)算單元(5)中進(jìn)行相關(guān)系數(shù)計(jì)算,然后根據(jù)(5)單元計(jì)算的結(jié)果,并按照耦合模式選擇準(zhǔn)則選取最佳耦合模式(6),然后用最佳耦合模式來(lái)量化和編碼偽小波系數(shù),其中量化和編碼所用的比特分配方案(4)由心理聲學(xué)模型(3)來(lái)控制,最后將量化和編碼系數(shù)和邊信息一起傳送到多聲道碼流進(jìn)行合成(9)輸出。
2.根據(jù)權(quán)利要求1所述的偽小波5聲道音頻編/解碼方法,其特征在于耦合模式對(duì)各個(gè)聲道的高頻部分進(jìn)行耦合編碼,最后對(duì)耦合關(guān)聯(lián)系數(shù)進(jìn)行量化,并形成碼流寫(xiě)入輸出碼流文件,而對(duì)于非耦合聲道以及耦合聲道的非耦合頻段的編碼方式與單聲道的編碼方式完全一樣。
3.根據(jù)權(quán)利要求1所述的偽小波5聲道音頻編/解碼方法,其特征在于可以根據(jù)不同的情況對(duì)高頻耦合模式進(jìn)行多種組合。
4.根據(jù)權(quán)利要求1、3所述的偽小波5聲道音頻編/解碼方法,其特征在于高頻耦合模式有五個(gè)聲道都不做高頻耦合;由一個(gè)聲道耦合另一個(gè)聲道;由一個(gè)聲道耦合其它兩個(gè)聲道;由一個(gè)聲道耦合其它三個(gè)聲道。
5.根據(jù)權(quán)利要求1所述的偽小波5聲道音頻編/解碼方法,其特征在于信號(hào)類(lèi)型檢測(cè)(1)用來(lái)判斷該幀信號(hào)是快變信號(hào)還是緩變信號(hào),并對(duì)快變類(lèi)型的信號(hào)的高頻部分采取時(shí)域分辨率較高的濾波器組,快變信號(hào)的低頻部分用頻率分辨率較高的濾波器組的處理方式,對(duì)于緩變類(lèi)型信號(hào),偽小波變換采取頻域分辨率較高的處理方式。
6.根據(jù)權(quán)利要求1所述的偽小波5聲道音頻編/解碼方法,其特征在于高頻耦合中的相關(guān)系數(shù)計(jì)算(5)單元的計(jì)算式表示為設(shè)x1(k),x2(k)為兩個(gè)不同聲道的信號(hào),則這兩個(gè)聲道在耦合頻段的相關(guān)系數(shù)定義為Cor12=1NΣi=begbendb[Σk=flifhix1(k)x2(k)/[Σk=flifhix12(k)Σk=flifhix22(k)]]]]>其中N為參加耦合的子帶數(shù);begb和endb分別為耦合的開(kāi)始子帶編號(hào)和結(jié)束子帶編號(hào);fli和fhi分別為第i個(gè)子帶的下邊界和上邊界的頻率;w1和w2的值可選擇0與1之間的任意實(shí)數(shù),如可取w1=0.3,w2=0.6。
7.根據(jù)權(quán)利要求1所述的偽小波5聲道音頻編/解碼方法,其特征在于最佳耦合模式的選擇式為a. b. c.當(dāng)a和b中的條件都不滿(mǎn)足時(shí),可以通過(guò)相關(guān)系數(shù)對(duì)如下三種情況唯一地確定最佳耦合模式只有一個(gè)耦合聲道(耦合模式1~8),有兩個(gè)耦合聲道(耦合模式9~12),有三個(gè)耦合聲道(耦合模式13~15)。首先對(duì)每一種情況按照相關(guān)系數(shù)各找出一種耦合模式。
8.根據(jù)權(quán)利要求1所述的偽小波5聲道音頻編/解碼方法,其特征在于偽小波變換可以根據(jù)該信號(hào)是快變信號(hào)還是緩變信號(hào)自適應(yīng)的改變頻域(時(shí)域)分辨率;具體的說(shuō)就是對(duì)于快變類(lèi)型的信號(hào)的高頻部分采取時(shí)域分辨率較高的濾波器組,對(duì)于快變信號(hào)的低頻部分用頻率分辨率較高的濾波器組的處理方式,對(duì)于緩變信號(hào)采取頻域分辨率較高的處理方式。
9.根據(jù)權(quán)利要求1所述的偽小波5聲道音頻編/解碼方法,其特征在于比特分配采用公共比特池技術(shù),該技術(shù)是在量化編碼模塊中實(shí)現(xiàn)的,在量化循環(huán)的每一步中,都要對(duì)5聲道的所有非耦合子帶按NMR排序,找出NMR最大的子帶并減小其量化步長(zhǎng)。
10.根據(jù)權(quán)利要求1所述的偽小波5聲道音頻編/解碼方法,其特征在于耦合關(guān)聯(lián)系數(shù)CCi定義為CCi=ECiERi]]>上式中ECi,EiR分別代表耦合頻段中耦合聲道和恢復(fù)聲道在子帶i的能量;耦合關(guān)聯(lián)系數(shù),用非線(xiàn)性量化的方法將其離散化并表示為8位的符號(hào)數(shù),非線(xiàn)性量化的公式為CCi_transmitted=INT[(4log10CCi)0.814]上式中的TNT表示取整函數(shù)。
全文摘要
本發(fā)明公開(kāi)了一種基于高頻耦合的偽小波5聲道音頻編/解碼方法,是對(duì)于5聲道編碼,以及對(duì)單、雙聲道的高頻耦合,但不局限于單、雙聲道編/解碼結(jié)構(gòu),在編碼端輸入5聲道的時(shí)域信號(hào),將信號(hào)分別傳輸至信號(hào)類(lèi)型檢測(cè)、心理聲學(xué)模型和偽小波濾波器組,信號(hào)經(jīng)類(lèi)型檢測(cè)后可以判斷出該信號(hào)是緩變信號(hào)還是快變信號(hào),用以控制偽小波濾波器組的分辨率,信號(hào)經(jīng)過(guò)偽小波變換后的系數(shù)被傳送到相關(guān)系數(shù)計(jì)算單元中進(jìn)行相關(guān)系數(shù)計(jì)算,然后根據(jù)單元計(jì)算的結(jié)果,并按照耦合模式選擇準(zhǔn)則選取最佳耦合模式,然后用最佳耦合模式來(lái)量化和編碼偽小波系數(shù),其中量化和編碼所用的比特分配方案由心理聲學(xué)模型來(lái)控制,最后將量化和編碼系數(shù)和邊信息一起傳送到多聲道碼流進(jìn)行合成輸出。
文檔編號(hào)H03M7/00GK1424713SQ0310043
公開(kāi)日2003年6月18日 申請(qǐng)日期2003年1月14日 優(yōu)先權(quán)日2003年1月14日
發(fā)明者潘興德, 李鵬, 王磊 申請(qǐng)人:北京阜國(guó)數(shù)字技術(shù)有限公司