專利名稱:一種數(shù)碼兼容式三維環(huán)繞聲算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種環(huán)繞聲算法本發(fā)明是對(duì)中國(guó)專利號(hào)為00117448.7的“一種兼容式環(huán)繞聲算法”的發(fā)展,主要提供在數(shù)碼音頻記錄的媒體上實(shí)現(xiàn)更多聲道和包括上下方向的三維空間算法方案,采用壓縮方式更多,并和原媒體兼容。兼容分為方式A,原所有聲道可在原媒體上播放并高保真播放。方式B,原有一半聲道可在原媒體上播放但可以提供更多的聲音通道。本算法還可輸出圖形字符等數(shù)據(jù),本發(fā)明中有部分公式和壓縮方法更詳細(xì)的請(qǐng)參看00117448.7專利。
為了達(dá)到上述目的。在聲音模擬信號(hào)期間采用Lp=L+ac+as,Rp=R+ac-as進(jìn)行處理,在信號(hào)量化過(guò)程中采用超取樣量化和高比特24比特量比,再轉(zhuǎn)換成規(guī)定樣值如44.1K/S,96K/S,和規(guī)定20比特,16比特或下文所說(shuō)的去掉壓縮數(shù)據(jù)所占用的位值。超取樣轉(zhuǎn)換成規(guī)定樣值有現(xiàn)成集成電路完成或按如下方法完成n倍超取樣,(n-1)間隔取樣。如2倍超取樣按1、2、3、4這樣取樣,則記錄按1、3樣號(hào)記錄,其余去掉。算法流程如下a、多路原始模擬信號(hào)輸入。
b、根據(jù)媒體容量確定聲道數(shù),然后按Lp=L+ac+as,Rp=R+ac-as合成相應(yīng)聲道。
c、模擬信號(hào)n倍超取樣并24比特量化。
d、把n倍超取樣按(n-1)間隔記錄,24比特?cái)?shù)據(jù)變換成相應(yīng)低比特格式。
上式中,Lp為左通道信息量,L為兩聲道中處于左向的信息,C為兩通道中處于中間聲信息,若無(wú)則為零。Rp為右通道信息量,R為兩聲道中處于右向的信息,S為兩聲道處于后面聲信息,若無(wú)則為零,a為0.1~0.6之間的系數(shù),需視制作情況而定,24比特量化數(shù)據(jù)變換成低比特?cái)?shù)據(jù),可采用專利號(hào)00117448.7的梯形線量變換,即用一部分比特表示位值,另一部分表示權(quán)值,上部權(quán)值比下部權(quán)值大,但在同一權(quán)值內(nèi)信號(hào)量化是等量的。
隨著數(shù)字處理技術(shù)發(fā)展,人們要求盡可能設(shè)計(jì)較多獨(dú)立聲道。真正三維環(huán)繞聲應(yīng)包括上環(huán)繞聲道和下環(huán)繞聲道。為了確切表示PCM或壓縮后數(shù)據(jù)在相應(yīng)聲道,需采用隱含移動(dòng)數(shù)據(jù)的三維空間指令,表示形式如下引導(dǎo)代碼→主PCM單獨(dú)聲道代碼→壓縮方式代碼→(隔一個(gè)比特位為零的碼)次壓縮單獨(dú)聲道代碼組成。引導(dǎo)代碼用二個(gè)隔離碼表示,壓縮方式用四位表示(可自定義),本文用1111表示本文提及波形壓縮方式,若僅有PCM聲道則壓縮方式代碼、次壓縮單獨(dú)聲道代碼均全為零。隱含移動(dòng)數(shù)據(jù)的三維空間指令存放在壓縮數(shù)據(jù)的頭部,或PCM數(shù)據(jù)低位,原媒體壓縮數(shù)據(jù)段的附加數(shù)據(jù)位置(可單獨(dú)放入聲道代碼),或原媒體壓縮數(shù)據(jù)中樣本數(shù)據(jù)位置中的最低位,并把原樣本數(shù)據(jù)最低位全部去掉(如圖2所示)。上述格式定義應(yīng)在媒體目錄表中進(jìn)行指定。對(duì)于同一聲道數(shù)據(jù)僅有壓縮數(shù)據(jù)的,則主PCM單獨(dú)聲道代碼去掉。為了提高識(shí)別能力,上述隱含指令應(yīng)重復(fù)一次。隔離碼本文定為100001表示,若有數(shù)據(jù)與0000相同的,應(yīng)在數(shù)據(jù)第三個(gè)零后加1,解碼時(shí)再去掉1,由于采用聲音數(shù)碼壓縮方式,原媒體數(shù)據(jù)量未能全部用完,把空閑數(shù)據(jù)位記錄一些圖形字符其它數(shù)據(jù),為隱含數(shù)據(jù)圖形指令,存放在PCM數(shù)據(jù)低位或壓縮數(shù)據(jù)頭部或尾部,排列格式為引導(dǎo)碼(由三個(gè)隔離碼表示)→圖形或字符數(shù)據(jù),具體圖形或字符數(shù)據(jù)由用戶定義,本文不提出具體格式。由于既有聲音壓縮數(shù)據(jù),又有圖形字符數(shù)據(jù),所以在隱含圖形指令前增加一個(gè)數(shù)據(jù)聯(lián)合標(biāo)識(shí),放在隱含圖形指令之前,排列方式為引導(dǎo)代碼(本文定為三個(gè)隔離碼組成)→聯(lián)合標(biāo)識(shí)代碼→隱含圖形指令。聯(lián)合標(biāo)識(shí)代碼無(wú)則全為零。有則以二進(jìn)制1為開(kāi)始的代碼。
聲道排列分為上面聲道和下面聲道。
圖1為一種最簡(jiǎn)單雙三角形三維環(huán)繞聲排列方式,即前面左右聲道之間中線上有一個(gè)上前聲道,后面左右聲道之間中線上有一個(gè)上后聲道,經(jīng)過(guò)優(yōu)化,選用重低音聲道代碼為000,下前中置聲道代碼為001,下后中置聲道代碼為110(其它大于12聲道代碼可指定聲道位),因此用三位比特表示的代碼中還有五個(gè)未用,由于要同原媒體兼容,因此規(guī)定,某一聲道僅能在指定空間位置移動(dòng),在CD或DVD-V中如原媒體用PCM數(shù)據(jù)記錄的左聲道僅在下前左和下后左之間位置移動(dòng),如原媒體用PCM數(shù)據(jù)記錄的右聲道僅在下前右和下后右之間位置移動(dòng),原媒體用壓縮數(shù)據(jù)記錄在PCM低位的左聲道僅在上前聲道和下后左聲道之間移動(dòng),如原媒體用壓縮數(shù)據(jù)記錄在PCM低位的右聲道僅在上后聲道和下后右聲道之間移動(dòng)。因此僅用三位代碼不會(huì)造成聲道之間混亂,如圖1所示,至于其它聲道,壓縮方式記錄為次聲道。在一個(gè)聲場(chǎng)中,下面聲道為主聲道,上面聲道為次聲道,在前后聲場(chǎng)中,前面聲道為主聲道,后面聲道為次聲道。
本發(fā)明中,除了可用MPEG的音頻層1、層2、層3、ACC壓縮方式外,還可用基于波形的波形壓縮方式,越后方式比前方式效果好,壓縮數(shù)據(jù)率更低,利于方式A高保真化,用層3二聲道數(shù)據(jù)率可代替層2一個(gè)聲道數(shù)據(jù)率。ACC壓縮方式可用于DCD-V中96K/S取樣率中方式A,波形壓縮適用于CD中44.1K/S取樣率中方式A,波形壓縮推薦采用專利號(hào)“00117448.7”提到的波形壓縮。其表示方式如下真實(shí)數(shù)據(jù)初值→壓縮數(shù)值→間隔位→壓縮長(zhǎng)度→間隔位→波形形式→未位值→間隔位→重復(fù)數(shù)。
真實(shí)數(shù)據(jù)初值用以表示真實(shí)波形開(kāi)始初值,壓縮數(shù)值是用1或0模擬波形,用1表示升高,用0表示降低,0,1或1,0相間出現(xiàn)表示不變值。壓縮長(zhǎng)度用于表示壓縮數(shù)值在時(shí)域上長(zhǎng)度,數(shù)值每增加1表示時(shí)域增加一個(gè)取樣值,波形方式在波形中表示是正弦,余弦,脈沖或其它,分別用01,10,11,00二位表示,未位值表示波形的結(jié)束值,重復(fù)數(shù)表示在上述壓縮數(shù)值的重復(fù)個(gè)數(shù),間隔位本文用100001六位表示,若有數(shù)據(jù)出現(xiàn)0000時(shí),則在第三個(gè)0后加1,解碼時(shí)再去掉1。上述壓縮方式是建立在人耳聽(tīng)覺(jué)的掩蓋效應(yīng)上,即取強(qiáng)去弱,超前掩蓋或滯后掩蓋,用1,0二值進(jìn)行波形摸擬波形特征,無(wú)需進(jìn)行離散余弦變換后利用于頻帶方式記錄,節(jié)省不少數(shù)據(jù)沉余量,也提高記錄準(zhǔn)確性。
壓縮后數(shù)據(jù)存放在PCM低位1-4位的,如圖4,5所示,有如圖4的1,2,3,4排列方式,有如圖5,一層一層1,2,或A,B排列方式。用下式進(jìn)行計(jì)算位數(shù)=聲道數(shù)×音頻取樣率/壓縮后數(shù)據(jù)率,如僅需壓縮1個(gè)聲道,已知取樣率為44.1K,已知壓縮后數(shù)據(jù)率為44K,則僅用PCM最低位可以記錄1一個(gè)聲道后壓縮數(shù)據(jù)。方式A是推薦采用最低位來(lái)記錄壓縮數(shù)據(jù)的高保真播放方式的。若方式A未能裝下所有聲道,則采用方式B,方式B是用一半通道記錄壓縮數(shù)據(jù)的(如圖3所示)。
顯然,若采用DVD-A記錄方式B,則最大聲道數(shù)將超過(guò)36聲道。以上算法流程如下e、選擇方式A,是去下面,否去h。
f、位數(shù)=聲道數(shù)×音頻取樣率/壓縮方式數(shù)據(jù)率,分別選擇壓縮方式和聲道數(shù),并彈出相應(yīng)數(shù)據(jù)種類給媒體目錄表,彈出隱含指令給數(shù)據(jù)頭部或PCM低位。
g、按時(shí)間次序組合給媒體進(jìn)行數(shù)據(jù)記錄。
h、選擇方式B,聲道數(shù)=音頻總數(shù)據(jù)率/壓縮方式數(shù)據(jù)率,選擇壓縮方式,并彈出相應(yīng)數(shù)據(jù)種類給媒體目錄表彈出隱含指令給數(shù)據(jù)頭部,或PCM最低位。
i、按時(shí)間次序組合給媒體進(jìn)行數(shù)據(jù)記錄。
j、是否記錄圖形字符,是按下面進(jìn)行,否回到a。
k、選擇空閑數(shù)據(jù)位進(jìn)行圖形,字符記錄,并彈出相應(yīng)隱含指令給數(shù)據(jù),完后回到a。
MPEG音頻壓縮方法、波形壓縮方法請(qǐng)參閱MPEG、及00117448.7有關(guān)說(shuō)明。解碼按上述相反過(guò)程進(jìn)行。
權(quán)利要求
1.由原媒體編碼和采用隱含指令的一種數(shù)碼兼容式三維環(huán)繞聲算法,其特征在于其所有聲音數(shù)據(jù)在編碼和壓縮前采用超取樣并24比特PCM編碼量化,其所有的原PCM數(shù)據(jù),基于MPEG音頻壓縮數(shù)據(jù)和基于波形壓縮方式數(shù)據(jù)或其它壓縮方式數(shù)據(jù),均采用了隱含移動(dòng)數(shù)據(jù)的三維空間指令和隱含數(shù)據(jù)圖形指令。原編碼存放在原媒體PCM數(shù)據(jù)或MPEG樣本高位,隱含移動(dòng)數(shù)據(jù)的三維空間指令或壓縮后的聲音數(shù)據(jù)分別存放在MPEG樣本或PCM數(shù)據(jù)低位,為方式A。原編碼存放在原媒體一半通道,壓縮后的聲音數(shù)據(jù)存放在原媒體另一半通道,為方式B。
2,根據(jù)權(quán)利要求1所述的一種數(shù)碼兼容式三維環(huán)繞聲算法,其特征在于壓縮后聲音數(shù)據(jù)存放于PCM數(shù)據(jù)最低位的1至4位。
3,根據(jù)權(quán)利要求1所述的一種數(shù)碼兼容式三維環(huán)繞聲算法,其特征在于隱含移動(dòng)數(shù)據(jù)的三維空間指令是由引導(dǎo)代碼、主PCM單獨(dú)聲道代碼、壓縮方式代碼(隔一個(gè)比特位)、次壓縮單獨(dú)聲道代碼組成。
4.根據(jù)權(quán)利要求1所述的一種數(shù)碼兼容式三維環(huán)繞聲算法,其特征在于用壓縮后數(shù)據(jù)代替原一半PCM數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的一種數(shù)碼兼容式三維環(huán)繞聲算法,其特征在于用低失真子頻帶壓縮算法代替高失真子頻帶壓縮算法。
6.根據(jù)權(quán)利要求1所述的一種數(shù)碼兼容式三維環(huán)繞聲算法,其特征在于用波形壓縮算法代替子頻帶壓縮算法。
全文摘要
本發(fā)明主要提供在數(shù)碼音頻記錄的媒體上實(shí)現(xiàn)更多聲道和包括上下的三維空間的算法方案,并和原媒體兼容。兼容分為方式A,原所有聲道可在原媒體上高保真播放。方式B,原一半聲道可在原媒體上播放,并提供更多的聲音通道。本算法還可輸出圖形字符等。
文檔編號(hào)H04B1/66GK1381955SQ0111463
公開(kāi)日2002年11月27日 申請(qǐng)日期2001年4月18日 優(yōu)先權(quán)日2001年4月18日
發(fā)明者梁曉 申請(qǐng)人:梁曉