亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

瞬態(tài)音頻信號的判別方法

文檔序號:2818943閱讀:1038來源:國知局
專利名稱:瞬態(tài)音頻信號的判別方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種瞬態(tài)音頻信號的判別方法,特別涉及一種在音頻編碼過程中瞬態(tài)音頻信號的判別方法。
背景技術(shù)
感知音頻編碼是一種有損熵約束變換域編碼,時域數(shù)字音頻信號組成一幀(一定長度的向量)后分別進(jìn)入分析濾波器組和心理聲學(xué)模型,分析濾波器組對信號加上一定長度和形狀的窗函數(shù)(即與一定長度的向量逐點相乘)后,進(jìn)行一定塊長的域變換操作,獲得音頻信號的變換域頻譜;心理聲學(xué)模型則獲得用于編碼控制的信息;信號的變換域頻譜送到量化器中,依據(jù)編碼控制信息進(jìn)行熵約束;經(jīng)過量化的變換域頻譜和控制信息進(jìn)過碼流合成打包成所需要的格式后輸出,就完成了一幀信號的編碼。音頻信號的信息量降低是在感知音頻編碼的量化環(huán)節(jié)實現(xiàn)的。編碼器對在變換域不同頻帶的音頻信號使用不同的量化精度,獲得最終的整體信息量降低,同時各頻帶也引入了不同大小的量化噪聲。通過心理聲學(xué)模型的指導(dǎo),引入的量化噪聲可以控制在人可以感知的程度以下,使得編碼重建后的音頻質(zhì)量在聽覺上沒有明顯地降低。在分析濾波器組中,對音頻信號加不同形狀和長度的窗函數(shù),得到的變換域頻譜有著不同的時間分辨率和頻譜分辨率,它們有著不同的編碼效率。一般情況下使用長塊編碼(加較長的窗函數(shù))獲得較高的頻譜分辨率,獲得較高的音頻編碼質(zhì)量,但由于頻譜的時間分辨率較低,編碼后量化噪聲在時域上將擴(kuò)散在整個變換塊長的范圍內(nèi),在面對瞬態(tài)信號時,擴(kuò)散的量化噪聲很容易將能量較小的信號掩蓋,引起瞬態(tài)失真。為消除這個效應(yīng),塊切換機(jī)制被引入到音頻編碼器中,它允許編碼器對信號加不同的窗,進(jìn)行長塊編碼或短塊編碼,以應(yīng)對不同情況下時間分辨率和頻譜分辨率的需求。雖然塊切換增加了編碼的延遲和復(fù)雜度,但因為它在抑制量化噪聲擴(kuò)散,消除瞬態(tài)失真方面的較好效果,包括先進(jìn)音頻編碼(Advanced audio coding,AAC),MPEG audio layer III (MP3)等在內(nèi)的主流音頻編碼標(biāo)準(zhǔn)均有這一可選機(jī)制。為獲得高效率編碼,塊切換的判斷需要依據(jù)輸入信號自適應(yīng)地運作。塊切換的判斷有兩種主要的分類基于量化的后驗算法和基于信號分析的先驗算法?;诹炕暮篁炈惴ㄍ瑫r做兩種塊長的量化編碼并比較它們的效率,這樣信號所加的窗函數(shù)類型將作為量化參數(shù)的一部分進(jìn)入多維優(yōu)化,多維優(yōu)化問題由量化失真控制算法處理,這種塊切換判斷算法有最高的理論性能,但它極大增加了編碼算法的復(fù)雜度,通常實現(xiàn)的編碼器中幾乎沒有采用?;谛盘柗治龅南闰炈惴ㄔ诰幋a前分析輸入信號,通過建立準(zhǔn)則來進(jìn)行塊長切換判斷,這種方法自然有較低的復(fù)雜度,也被廣泛使用。美國專利5,285, 498便提供了一種基于感知熵的塊切換判斷方法,它將心理聲學(xué)模型輸出的參數(shù)感知熵作為主要的比較參數(shù), 設(shè)立閾值用于判斷信號是否瞬態(tài),目前部分MP3和AAC編碼器便使用這種算法,并將其集成在心理聲學(xué)模型PAMII中。美國專利5,701,389提供了另一種判別方法,它用信號頻譜的高頻能量和低頻能量的比值作為主要的比較參數(shù),設(shè)立閾值用于判斷信號是否為瞬態(tài)信號。除此以外,瞬態(tài)信號還可以通過時域能量檢測來判斷。塊切換判斷算法本質(zhì)上是對信號瞬態(tài)特性的判斷,而判斷方法必然有著一定的錯過率和誤判率,錯過率便是沒有檢測出瞬態(tài)信號的幾率,誤判率是非瞬態(tài)信號判斷為瞬態(tài)信號的幾率,前者容易引起較大的瞬態(tài)失真,后者則一定程度降低音頻編碼質(zhì)量?;诟兄嘏袛嗪透叩皖l能量比判斷的方法,實際的檢測瞬態(tài)信號的效果并不好,開啟塊切換以后音頻編碼器的音頻質(zhì)量提高很有限;基于時域能量檢測的方法則僅利用了時域的信息,它對于時域能量有明顯變化的瞬態(tài)信號有很好的檢測效果,但如果信號的能量保持穩(wěn)定,而在頻率上發(fā)生劇烈變化,這種方法便無法檢測。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種瞬態(tài)音頻信號的判別方法,用以解決在現(xiàn)有技術(shù)中由于瞬態(tài)信號無法準(zhǔn)確檢測出或者檢測錯誤率過高,從而降低音頻編碼質(zhì)量的問題。為解決上述問題,本發(fā)明提供的瞬態(tài)音頻信號的判別方法包括如下步驟步驟一,獲取對數(shù)域時頻分量矩陣y ;步驟二,按照投影的原理,計算時頻分量矩陣視平面投影或視線投影的最小面積 D ·
1^area ,步驟三,通過該視平面投影或視線投影的最小面積Dara,利用判別公式ACXDarea> DCXThr判別瞬態(tài)信號與穩(wěn)態(tài)信號,其中公式中DC為直流分量的能量值或幅度值,而AC為交流分量的能量值或幅度值,Thr為判別閾值,如果上述判別公式成立,則信號為瞬態(tài)信號, 否則為穩(wěn)態(tài)信號。較佳地,在上述方法中是先將音頻信號轉(zhuǎn)換成二維的時頻信號,通過直接對非均勻的短時時頻變換或者子帶濾波器組輸出的非均勻時頻分量(絕對值或能量)取對數(shù)變換獲得,或者通過對均勻的短時時頻變換或者子帶濾波器組所獲得的均勻時頻分量矩陣做映射變換獲得對數(shù)域時頻分量矩陣y ;所述的對數(shù)域時頻分量矩陣y由下式表示
權(quán)利要求
1.一種瞬態(tài)音頻信號的判別方法,其特征在于該方法包括如下步驟 步驟一,獲取對數(shù)域時頻分量矩陣y ;步驟二,按照投影的原理,計算時頻分量矩陣視平面投影或視線投影的最小面積Darea ; 步驟三,通過該視平面投影或視線投影的最小面積,利用判別公式ACXDa_ > DCXThr判別瞬態(tài)信號與穩(wěn)態(tài)信號,其中公式中DC為直流分量的能量值或幅度值,而AC為交流分量的能量值或幅度值,Thr為判別閾值,如果上述判別公式成立,則信號為瞬態(tài)信號, 否則為穩(wěn)態(tài)信號。
2.如權(quán)利要求1所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的對數(shù)域時頻分量矩陣y由下式表示yia ."Λ ··· Λ況y2,2 · “ ^2, “.* y2、Ny-,2 ·y η.· Υ η,Ν少W,2 · * yMjn *其中,m= 1,2,...,M,代表第m頻帶,η = 1,2,...,N,代表第η時間塊,M代表它具有M個頻帶,N代表它有N線的時間分辨率;對數(shù)域時頻分量矩陣y的時間軸要求是均勻的, 即Ym^,ym,n,yffl,n+i有著相同的時間間隔,而頻率軸是非均勻的,要求Yn^n,ym,n,ym+1,n所代表的頻帶帶寬逐漸遞增。
3.如權(quán)利要求1所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的對數(shù)域時頻分量矩陣y直接通過對非均勻的短時時頻變換或者子帶濾波器組輸出的非均勻時頻分量的絕對值或能量取對數(shù)變換獲得。
4.如權(quán)利要求1所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的對數(shù)域時頻分量矩陣y通過對均勻的短時時頻變換或者子帶濾波器組所獲得的均勻時頻分量矩陣X做映射變換并取對數(shù)變換獲得,所述的均勻的短時時頻變換或者子帶濾波器組所獲得的均勻時頻分量矩陣X為xIa ·"xU · * XUL太2,1X2’2 ·“xU · · X2,LXk,\Xk、2 ··· xkJ · · Xm’Lxsca · ‘ xKJ ‘.* xKJ. _X的大小為KXL,K代表著它具有K條頻線,對應(yīng)短時變換具有的K條譜線或子帶濾波的K條子帶,L代表著它有L線的時間分辨率,對應(yīng)短時變換具有的L塊或子帶濾波的L次輸出。
5.如權(quán)利要求4所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的映射變換對于時間軸的映射是均勻的,對于頻率軸的映射是非均勻的。
6.如權(quán)利要求4所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的映射變換便是將均勻時頻分量矩陣X中一部分Xsub合并為點ym,n,xsub由下式表示
7.如權(quán)利要求6所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的合并的方法是能量和、能量均值、絕對幅度和、絕對幅度均值、絕對幅度最大值中的一種或者這幾種方法在行列間交替使用。
8.如權(quán)利要求1所述的瞬態(tài)音頻信號的判別方法,其特征在于,時頻分量矩陣y的最小視平面投影或者視線投影的面積計算采用點到投影線距離的最小平方和近似表示。
9.如權(quán)利要求1所述的瞬態(tài)音頻信號的判別方法,其特征在于,如果所有投影線的斜率相同,則計算視平面投影的最小面積。
10.如權(quán)利要求1所述的瞬態(tài)音頻信號的判別方法,其特征在于,如果投影線各自的斜率不同,則計算視線投影的最小面積。
11.如權(quán)利要求9所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的視平面投影的最小面積的計算方法如下Lm為一系列具有相同斜率的投影線,表示為ax+y+bm = 0,其中a是斜率,bm是偏置;點 (n, yffl,n)到L1Jg離的平方和為
12.如權(quán)利要求10所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的視線投影的最小面積的計算方法如下LmS—系列不同斜率的投影線,對于第m頻帶上的N點(n,ym, n),最佳擬合直線y = f(x),可以使得點到Lm距離的平方和,即平方誤差I(lǐng) f (n) _yn 12最小,該直線的代數(shù)方程為
13.如權(quán)利要求12所述的瞬態(tài)音頻信號的判別方法,其特征在于,如果在對均勻時頻分量矩陣做映射變換時使用的合并方法是能量和或能量均值,那么所述的加權(quán)是對能量進(jìn)行的,最大值為對數(shù)域的最大能量值。
14.如權(quán)利要求12所述的瞬態(tài)音頻信號的判別方法,其特征在于,如果在對均勻時頻分量矩陣做映射變換時實用的合并方法是絕對幅度和、絕對幅度均值或絕對幅度最大值, 所述的加權(quán)是對幅度值進(jìn)行的,最大值為對數(shù)域的最大幅度值。
15.如權(quán)利要求1所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的判別閾值Thr 為一預(yù)先設(shè)定的值。
16.如權(quán)利要求2所述的瞬態(tài)音頻信號的判別方法,其特征在于,所述的判別閾值Thr 的設(shè)置參考M,N的大小以及對時頻信號取對數(shù)時用的底數(shù),具體計算方法為計算時頻信號矩陣y中所有元素平方和的長期平均ya,即通過對多幀y獲得的所有元素平方和取平均; ^在固定的M,N的大小、取對數(shù)的底數(shù)和輸入信號的幅度范圍的共同約定下也可以視為一個常數(shù),即判斷閾值Thr = Yya,系數(shù)Y —般設(shè)為到5%之間并依據(jù)實際需要做微調(diào)優(yōu)化,系數(shù)Y代表穩(wěn)態(tài)信號允許波動能量超過整體能量的百分?jǐn)?shù)上限。
17.如權(quán)利要求1所述的瞬態(tài)音頻信號的判別方法,其特征在于,如果在對均勻時頻分量矩陣做映射變換時使用的合并方法是能量和或能量均值時,則判別公式使用直流分量和交流分量的能量值。
18.如權(quán)利要求1所述的瞬態(tài)音頻信號的判別方法,其特征在于,如果在對均勻時頻分量矩陣做映射變換時使用的合并方法是絕對幅度和、絕對幅度均值或絕對幅度最大值時, 則判別公式使用直流分量和交流分量的幅度值。
全文摘要
本發(fā)明公開了一種瞬態(tài)音頻信號的判別方法,旨在提供一種在音頻編碼過程中瞬態(tài)音頻信號的判別方法。其技術(shù)方案的要點是將音頻信號轉(zhuǎn)換成二維的時頻信號,通過計算最小視平面投影或視線投影,以提取用于判別的參數(shù),最后判別出瞬態(tài)信號。本發(fā)明通過更準(zhǔn)確的判別出瞬態(tài)信號,配合多種音頻編碼器使用以提高音頻編碼的質(zhì)量。
文檔編號G10L11/00GK102419977SQ20111000706
公開日2012年4月18日 申請日期2011年1月14日 優(yōu)先權(quán)日2011年1月14日
發(fā)明者吳晟, 張本好, 徐晶明, 李曇, 林福輝 申請人:展訊通信(上海)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1