亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種3d音頻中水平方位參數(shù)量化方法

文檔序號:2833292閱讀:411來源:國知局
專利名稱:一種3d音頻中水平方位參數(shù)量化方法
技術(shù)領(lǐng)域
本發(fā)明涉及量化編碼技術(shù)領(lǐng)域,更具體地,涉及一種3D音頻中水平方位參數(shù)量化方法。
背景技術(shù)
量化是壓縮編碼的主要步驟,通過用一個較小的數(shù)據(jù)集表示較大的數(shù)據(jù)集來實現(xiàn)數(shù)據(jù)量的減少。較小的數(shù)據(jù)集通常稱為碼本,碼本中的數(shù)據(jù)稱為碼字。較大的數(shù)據(jù)集就是待量化值的集合。數(shù)據(jù)經(jīng)過量化后,只用輸出碼字在碼本中的位置值即可。這個位置值通常稱為索引。常用的量化技術(shù)有很多類型,大體可以分為標量量化和矢量量化兩類。標量量化是對待量化數(shù)據(jù)逐個進行量化,復(fù)雜度較低;矢量量化則是將若干個數(shù)據(jù)看成一個矢量,對每個矢量進行整體量化,保留了數(shù)據(jù)之間的相關(guān)性。其中根據(jù)實際情況的不同,矢量量化 又有很多不同的算法,如格形矢量量化、乘積碼量化等等。3D音頻的基本原理是通過模擬空間某聲源在人耳處產(chǎn)生的聲場,使聽者感覺聲音從空間某聲源對應(yīng)位置發(fā)出。其中,聲源水平方位信息的判斷主要由依靠雙耳效應(yīng)完成。水平方位參數(shù)是3D音頻中用來表達聲源水平方位信息的重要參數(shù),主要包括時間差(ITD,interaural time difference)和強度差(ILD, interaural level difference)等。在生理上,ITD和ILD的聽覺相對重要性受到頻率、激勵信號時間結(jié)構(gòu)等因素的影響。人耳對聲音的頻域分辨率有一定規(guī)律,在低頻段人耳頻域分辨率很高,兩個頻率相近的聲音都不會相互掩蔽;但在高頻段人耳的分辨率相對較低。實際音頻編解碼中,會根據(jù)這一特性將信號劃分成若干個子帶,每個子帶提取相應(yīng)的ILD和ITD。因此,在對水平方位參數(shù)進行量化的時候,也需要考慮人耳在不同頻帶的感知能力進行量化處理,使得量化結(jié)果更加符合人耳的主觀聽感?,F(xiàn)有量化算法只針對水平方位參數(shù)進行量化,未考慮頻帶等相關(guān)信息對主觀聽感的影響,以客觀性能最佳為量化目標,但客觀性能與人耳的主觀聽感并不完全一致,導致量化器的主觀感知性能并非最優(yōu)。針對上述問題,迫切需要將水平方位參數(shù)額外信息考慮在內(nèi),同時將人耳對聲音的感受考慮進去,符合人耳主觀聽感的量化器,以提升整體編碼主觀性能。

發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有量化技術(shù)的不足,提出一種適于人耳感知的應(yīng)用于3D音頻水平方位參數(shù)編碼的量化技術(shù)方案,在量化過程中考慮與水平方位參數(shù)相關(guān)的其他信息,以主觀感知失真為最優(yōu)碼字篩選標準量化算法。目的是通過結(jié)合水平方位參數(shù)的相關(guān)信息,依據(jù)符合人耳感知特性的評價標準選擇碼字,減小人耳的感知失真,實現(xiàn)整體量化主觀性能的提聞。本發(fā)明的技術(shù)方案為一種3D音頻中水平方位參數(shù)量化方法,包括以下步驟步驟I. I、設(shè)3D音頻的子帶總數(shù)為N,輸入N個子帶的水平方位參數(shù)Xl,X2,…,xN,通過查表得到對應(yīng)的JND值Jnd1, Jnd2, ...,jndN ;
步驟I. 2、按照預(yù)設(shè)的維數(shù)k,劃分得到多個k維的水平方位參數(shù)矢量[(X1, X2,…,Xk) (xk+1, Xk+2,…,X2k)…(XN_k+1, XN_k+2,…,Xn)],根據(jù)劃分結(jié)果生成相應(yīng)的碼本;同時將對應(yīng)的 JND 值劃分成多個 k 維矢量[(Jnd1, jnd2, ...,jndk) (jndk+1, jndk+2, ...,jnd2k)...(jndN_k+1, jndN_k+2,, jndN)];步驟I. 3、對每個水平方位參數(shù)矢量(xi+1,xi+2, -,xi+k)進行量化,得到k維碼字矢量(yi+i,yi+2,…,yi+k),i的取值為i,k+i*“N-k+i;實現(xiàn)方式為,對每個水平方位參數(shù)矢量(xi+1, xi+2,…,xi+k)執(zhí)行以下子步驟,步驟1.3. I、從碼本中按順序讀入一個碼字,將讀入的碼字作為k維碼字矢量(yi+1,yi+2,…,yi+k)的當前量化結(jié)果;步驟I. 3. 2、根據(jù)I. 3. I所得k維碼字矢量(yi+1,yi+2, - ,yi+k)的當前量化結(jié)果和步驟I. 2所得相應(yīng)的k維矢量(jndi+1, jndi+2,…,jndi+k)計算量化的主觀感知失真
Aj. =Z[(.V. - ' ) -jndf]/2-, i步驟I. 3. 3、返回步驟I. 3. I從碼本中按順序讀入下一個碼字并作為k維碼字矢量(yi+1,yi+2,…,yi+k)的當前量化結(jié)果,直到遍歷完碼本中的碼字,然后根據(jù)每次執(zhí)行步驟I. 3. 2的結(jié)果選擇其中主觀感知失真Dsp的值最小的相應(yīng)碼字作為k維碼字矢量(yi+1,yi+2,…,yi+k)的最終量化結(jié)果;步驟I. 4、根據(jù)步驟 I. 3. 3 所得 k 維碼字矢量[(Y1, y2,...,yk) (yk+1,yk+2,…,ya)...(yN-k+1,yN-k+2,…,yN)]的最終量化結(jié)果,輸出n個子帶的量化水平方位參數(shù){yi,y2,"、yN}以及相應(yīng)索引值Index1, Index2,…,IndexN,將索引值輸出至碼流。而且,預(yù)設(shè)的維數(shù)k為2,步驟I. 2中,劃分得到多個二維的水平方位參數(shù)矢量[(Xl,x2) (x3, X4)…0 + xN)],根據(jù)劃分結(jié)果生成相應(yīng)的碼本;同時將對應(yīng)的JND值兩個一組劃分成多個二維矢量[(Jnd1, jnd2) (jnd3, jnd4)... (jncV” jndN)];步驟I. 3中,對每個水平方位參數(shù)矢量(Xi,Xi+1)進行量化,得到二維碼字矢量(Yi, yi+1), i的取值為1,3-N_1 ;實現(xiàn)方式為,對每個水平方位參數(shù)矢量(Xi,Xi+1)執(zhí)行以下子步驟,步驟1.3. I、從碼本中按順序讀入一個碼字,將讀入的碼字作為二維碼字矢量(Yi, yi+i)的當前分量;步驟I. 3. 2、根據(jù)I. 3. I所得二維碼字矢量(yi,yi+1)的當前分量和步驟I. 2所得
/+I
相應(yīng)的二維矢量Undi, jndi+1)計算量化的主觀感知失真^ = ->’/)_ KP2 ;
I步驟I. 3. 3、返回步驟I. 3. I從碼本中按順序讀入下一個碼字并作為二維碼字矢量(y” yi+1)的當前分量,直到遍歷完碼本中的碼字,然后根據(jù)每次執(zhí)行步驟I. 3. 2的結(jié)果選擇其中主觀感知失真Dsp的值最小的相應(yīng)碼字作為二維碼字矢量(yi,yi+1)的最終結(jié)果;步驟I. 4中,根據(jù)步驟I. 3. 3所得二維碼字矢量Ky1, y2) (y3, y4)…(ym yN)],輸出N個子帶的量化水平方位參數(shù){yi,y2,一,yN}的最終量化結(jié)果以及相應(yīng)索引值Index1, Index2,…,IndexN,將索引值輸出至碼流。 本發(fā)明提供的水平方位參數(shù)量化編碼技術(shù)方案可以應(yīng)用于各類量化方法,在原有量化算法用統(tǒng)計學失真篩選最優(yōu)碼字的基礎(chǔ)上,結(jié)合水平方位參數(shù)的相關(guān)信息,計算量化的主觀感知失真,既保留了各類量化裝置原有的特性,同時使量化結(jié)果更加符合人耳的主觀感知特性。為了計算水平方位參數(shù)量化的主觀失真,本發(fā)明引入了人耳可感知的最小差異JND值,它是一個隨著水平方位參數(shù)大小和所在頻帶變化而變化的量。在計算出量化客觀失真的基礎(chǔ)上,將其與JND值(可感知差異值)進行結(jié)合運算得到主觀感知失真。計算出的主觀失真能很好的反映人耳的主觀聽感,有助于提高整個量化裝置的主觀感知性能。


圖I為本發(fā)明實施例的編碼流程圖;圖2為本發(fā)明實施例的解碼流程圖。
具體實施例方式本發(fā)明提供了 3D音頻中水平方位參數(shù)量化方法,主要思路是輸入待量化的水平 方位參數(shù),并通過查表得到所在頻帶對應(yīng)的JND值;迭代執(zhí)行讀入碼本中的碼字,對待量化碼本水平方位參數(shù)進行量化;、計算出使用當前碼字量化后的統(tǒng)計學失真、結(jié)合統(tǒng)計學失真和待量化水平方位參數(shù)的JND值計算使用當前碼字量化的主觀感知失真;直至遍歷整個碼本,選出使主觀量化失真最小的碼字并輸出其索引值。相應(yīng)解碼過程包括接收從編碼端傳入的索引值;根據(jù)索引值查找碼本,得到對應(yīng)量化水平方位參數(shù)。具體實施時,可以由本領(lǐng)域技術(shù)人員采用計算機軟件手段根據(jù)所提供技術(shù)方案實現(xiàn)自動化量化編碼。由于在編碼應(yīng)用中,往往將編碼軟件方法固化形成編碼裝置,因此按本發(fā)明所提供方法實現(xiàn)的編碼裝置也在保護范圍內(nèi)。本發(fā)明按照預(yù)設(shè)的維數(shù)k對水平方位參數(shù)分組,得到多個k維的水平方位參數(shù)矢量,然后計算量化的主觀感知失真,可以累加每個分量造成的誤差。因此,k的取值范圍是
I,2,…N,取I時相當于每個水平方位參數(shù)作為I個矢量,取N時相當于所有水平方位參數(shù)作為I個矢量。具體實施時,本領(lǐng)域技術(shù)人員可以根據(jù)具體情況自行設(shè)定取值。一般使得N是k的整數(shù)倍,如果不是整數(shù)倍,最后一個劃分的水平方位參數(shù)矢量少于k維,根據(jù)實際維數(shù)進行處理即可。本發(fā)明建議k的取值為2或3。實施例中預(yù)設(shè)的維數(shù)k為2,擇矢量量化中的分裂矢量量化作為量化算法,采用的統(tǒng)計學失真為均方誤差。以下結(jié)合附圖和實施例對本發(fā)明技術(shù)方案做詳細說明。如附圖I所示,實施例的量化編碼步驟如下步驟I. I、設(shè)3D音頻的子帶總數(shù)為N (N為偶數(shù)),輸入N個子帶的水平方位參數(shù)X1, X2, Xn,記為集合X = {x1; X2, XnI ,并根據(jù)水平方位參數(shù)的大小和所在頻帶查JND表,通過查表得到對應(yīng)的JND值jndp jnd2,…,如‘記為集合JND = Ijnd1, jnd2,…,jndN}。步驟1.2中,按照預(yù)設(shè)的維數(shù)k=2,劃分得到多個二維的水平方位參數(shù)矢量[(X1, x2) (x3, X4)…(XN_i,xN)],根據(jù)劃分結(jié)果生成相應(yīng)的碼本;同時將對應(yīng)的JND值兩個一組劃分成多個二維矢量[(Jnd1, jnd2) (jnd3, jnd4)... (jnd^, jndN)]。具體實施時,維數(shù)k確定后,即可根據(jù)該維數(shù)需求來訓練碼本,并可將訓練好的碼本放入量化器,作為量化器的一個組成部分。具體訓練方式為現(xiàn)有技術(shù),本發(fā)明不予贅述。碼本中的碼字個數(shù)可以根據(jù)精度需要設(shè)定。
步驟1.3、對每個水平方位參數(shù)矢量(Xi,Xi+1)進行量化,得到二維碼字矢量(Yi, yi+1), i 的取值為 1,3"*N-1。本步驟進行矢量量化,碼本是提前訓練好的碼字集合,量化就是從碼本中選取和待量化矢量最接近的碼字。其中“最接近”的評價標準就是失真(誤差)的計算,因而在量化中,是依次讀入每一個碼字去計算失真,通過迭代選取使失真最小的碼字作為量化結(jié)果,實施例是選擇對應(yīng)主觀感知失真Dsp的值最小的相應(yīng)兩個碼字作為二維碼字矢量(yi,yi+1)。因此,實施例對每個水平方位參數(shù)矢量(Xi,xi+1)執(zhí)行以下子步驟,步驟1.3. I、從碼本中按順序讀入一個碼字量化水平方位參數(shù)矢量(Xi, xi+1),即將讀入的碼字作為二維碼字矢量(yi,yi+1)的當前量化結(jié)果。例如對水平方位參數(shù)矢 量(Xl,x2),第I次執(zhí)行步驟I. 3. I時,從碼本中讀入第I個碼字(y/,Y21),再次執(zhí)行步驟
1.3. I時,從碼本中讀入第2個碼字(yi2,y22)…依次類推,直到讀入碼本中最后一個碼字(y;, y2m),m為碼本中的碼字個數(shù)。步驟I. 3. 2、根據(jù)I. 3. I所得二維碼字矢量(yi,yi+1)的當前量化結(jié)果和步驟I. 2所得相應(yīng)的二維矢量(如屯,jndi+1)計算量化的主觀感知失真Ap =f;[(-U,)2-JM2]/2 o
I
i+l普通矢量量化時,計算量化客觀失真采用均方誤差公式£> = ;S(x, -7,)2,而實施例
i
是在均方誤差的基礎(chǔ)上計算主觀感知失真,即結(jié)合改均方差公式和JND值Undi, jndi+1)計算主觀感知失真Dsp。步驟I. 3. 3、返回步驟1.3. I從碼本中按順序讀入碼字并作為二維碼字矢量(Yi, yi+1)的當前量化結(jié)果,直到遍歷完碼本中的碼字,然后選擇其中主觀感知失真Dsp的值最小的相應(yīng)碼字作為二維碼字矢量(yi,yi+1)的最終量化結(jié)果,即對水平方位參數(shù)矢量(Xi, xi+1)找到的二維水平方位參數(shù)矢量量化結(jié)果。例如對水平方位參數(shù)矢量(Xl,X2),就是從(y/,Y21)、(Y12, y22)…(yim,y2m)中選擇主觀感知失真Dsp的值最小者,作為最終量化結(jié)果。步驟I. 4中,根據(jù)步驟I. 3. 3所得二維碼字矢量[(Y1, J2) (y3, y4)…(ym yN)],輸出N個子帶的量化水平方位參數(shù){yi,y2,一,yN}的最終量化結(jié)果以及相應(yīng)索引值Index1, Index2,…,IndexN,將索引值輸出至碼流。如附圖I所示,實施例的解碼步驟可以如下步驟2. I、從碼流中讀入索引值Index1, Index2,…,IndexN。步驟2. 2、根據(jù)索引值Index1, Index2,…,IndexN在碼本中查找得到量化水平方位參數(shù){yi,y2,…,yd。為說明本發(fā)明效果起見,采用實施例所提供技術(shù)方案進行具體量化舉例,輸入的N個子帶水平方位參數(shù)為6個。(a) 6 維輸入待量化水平方位參數(shù) X= {23. 709299,-20. 163263,0. 947107,2.862993,34. 412148,22. 736864},查表得到對應(yīng)的 JND 值為 JND={0. 815555417,
0.66236129,0.601276375,0.732569875,0.619971,0. 722825075}。(b)將輸入數(shù)據(jù)組成 3 個二維矢量(23. 709299,-20. 163263),(0. 947107,
2.862993),(34. 412148,22. 736864),對應(yīng) JND 值也組成 3 個二維矢量(0. 815555417,0. 66236129), (0.601276375,0. 732569875), (0.619971,0. 722825075)。(c)分別對X中的三個矢量進行量化,矢量(23. 709299,-20. 163263)對應(yīng)的JND值為(0. 619971,0. 722825075),與碼本中的碼字逐個計算統(tǒng)計失真,并計算主觀感知失真,得到最小主觀感知失真為0. 236205,對應(yīng)的碼字為(25. 689648,-20. 168681 ),輸出索引為5。 (d)對剩下兩個矢量做同樣操作,得到對應(yīng)的碼字為(1. 542842,2. 684604 ),(34. 535961,22. 689129),即為主觀感知效果最好的量化結(jié)果,輸出對應(yīng)的量化索引分別為3、7。(d)得到量化后的水平方位參數(shù) X ' = (25. 689648, -20. 168681,1. 542842,2. 684604,34. 535961,22. 689129),輸出對應(yīng)的量化索引分別為5、3、7。本文中所描述的具體實施例僅僅是對本發(fā)明精神作舉例說明。本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員可以對所描述的具體實施例做各種各樣的修改或補充或采用類似的方式替代,但并不會偏離本發(fā)明的精神或者超越所附權(quán)利要求書所定義的范圍。
權(quán)利要求
1.一種3D音頻中水平方位參數(shù)量化方法,其特征在于,包括以下步驟 步驟I. I、設(shè)3D音頻的子帶總數(shù)為N,輸入N個子帶的水平方位參數(shù)Xl,X2,…,xN,通過查表得到對應(yīng)的JND值Jnd1, jnd2, ...,jndN ; 步驟I. 2、按照預(yù)設(shè)的維數(shù)k,劃分得到多個k維的水平方位參數(shù)矢量[(Xl,X2,…,xk)(Xk+1 Xk+2, ,X2k) (XN-k+lJ XN-k+2 , XN)],根據(jù)劃分結(jié)果生成相應(yīng)的碼本;同時將對應(yīng)的 JND 值劃分成多個 k 維矢量[(Jnd1, jnd2, ...,jndk) (jndk+1, jndk+2, ...,jnd2k)...(jndN_k+1, jndN_k+2,, jndN)]; 步驟I. 3、對每個水平方位參數(shù)矢量(xi+1,xi+2,…,xi+k)進行量化,得到k維碼字矢量(yi+i,yi+2,…,yi+k),i的取值為i,k+i…N-k+i;實現(xiàn)方式為,對每個水平方位參數(shù)矢量(xi+1, xi+2,…,xi+k)執(zhí)行以下子步驟, 步驟I. 3. I、從碼本中按順序讀入一個碼字,將讀入的碼字作為k維碼字矢量(yi+1,yi+2,…,yi+k)的當前量化結(jié)果; 步驟I. 3. 2、根據(jù)I. 3. I所得k維碼字矢量(yi+1,yi+2,…,yi+k)的當前量化結(jié)果和步驟I. 2所得相應(yīng)的k維矢量(jndi+1, jndi+2,…,jndi+k)計算量化的主觀感知失真
2.如權(quán)利要求I所述的3D音頻中水平方位參數(shù)量化方法,其特征在于預(yù)設(shè)的維數(shù)k為2, 步驟I. 2中,劃分得到多個二維的水平方位參數(shù)矢量[(Xl,x2) (x3, x4)…(XN_i,xN)],根據(jù)劃分結(jié)果生成相應(yīng)的碼本;同時將對應(yīng)的JND值兩個一組劃分成多個二維矢量[(Jnd1, jnd2) (jnd3, jnd4)... (jncV” jndN)]; 步驟I. 3中,對每個水平方位參數(shù)矢量(Xi,Xi+1)進行量化,得到二維碼字矢量(Yi, yi+1), i的取值為1,3-N_1 ;實現(xiàn)方式為,對每個水平方位參數(shù)矢量(Xi,Xi+1)執(zhí)行以下子步驟, 步驟I. 3. I、從碼本中按順序讀入一個碼字,將讀入的碼字作為二維碼字矢量(yi,yi+1)的當前分量; 步驟I. 3. 2、根據(jù)I. 3. I所得二維碼字矢量(yi,yi+1)的當前分量和步驟I. 2所得相應(yīng) /+I的二維矢量(jndi,jndi+1)計算量化的主觀感知失真
全文摘要
本發(fā)明提出一種3D音頻中水平方位參數(shù)量化方法,考慮了人耳在不同頻帶的感知能力,引入了人耳可感知的最小差異JND值;在量化客觀失真的基礎(chǔ)上,將其與JND值進行結(jié)合運算得到主觀感知失真,以此為依據(jù)選出最符合人耳感知特性的碼字作為量化結(jié)果。利用這種技術(shù)方案進行量化,量化結(jié)果的人耳主觀感知性能較好。
文檔編號G10L19/00GK102760442SQ20121025699
公開日2012年10月31日 申請日期2012年7月24日 優(yōu)先權(quán)日2012年7月24日
發(fā)明者馮云杰, 劉夢穎, 李登實, 楊姍姍, 楊玉紅, 涂衛(wèi)平, 王曉晨, 章佩, 胡瑞敏 申請人:武漢大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1