亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

數(shù)字音頻信號(hào)中的前回聲的有效衰減的制作方法

文檔序號(hào):9264882閱讀:962來源:國知局
數(shù)字音頻信號(hào)中的前回聲的有效衰減的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及用于當(dāng)解碼數(shù)字音頻信號(hào)時(shí)處理前回聲的衰減的方法和設(shè)備。
【背景技術(shù)】
[0002] 針對(duì)在電信網(wǎng)絡(luò)上的數(shù)字音頻信號(hào)的傳輸,不管它們例如是固定網(wǎng)絡(luò)還是移動(dòng)網(wǎng) 絡(luò),或者針對(duì)信號(hào)的存儲(chǔ),涉及實(shí)現(xiàn)編碼系統(tǒng)的壓縮(或源編碼)過程,這些系統(tǒng)通常具有 通過線性預(yù)測類型的時(shí)間編碼或通過變換類型的頻率編碼。
[0003] 本發(fā)明的方法和設(shè)備、主題因此位于聲音信號(hào)、特別是通過頻率變換而被編碼的 數(shù)字音頻信號(hào)的壓縮的范圍內(nèi)。
[0004] 通過展示的方式,圖1表示根據(jù)現(xiàn)有技術(shù)通過重疊相加包括分析-合成的變換的 數(shù)字音頻信號(hào)的編碼和解碼的示意圖。
[0005] 特定的音樂序列諸如打擊樂和特定的語音片段如爆破音(/k/、/t/等)特征在于 非常突然的開始,這些開始反映在幾個(gè)樣本的空間中的信號(hào)的動(dòng)態(tài)范圍的非常迅速的過渡 和非常強(qiáng)的變化中。示例性過渡從樣本410在圖1中給出。
[0006] 針對(duì)編碼/解碼處理,輸入信號(hào)被細(xì)分為長度為L的樣本塊,這些塊的邊界在圖1 中由豎直的點(diǎn)線表示。輸入信號(hào)表示為x(n),其中n是樣本的索引。分解為連續(xù)塊(或幀) 導(dǎo)致了塊XN(n) = [x(N.L)…x(N.L+L-l)] = [xN(0)*"xN(L-l)]的定義,其中N是塊(或 幀)的索引,L是幀的長度。在圖1中,L= 160個(gè)樣本。在修正離散余弦變換MDCT的情況 下,兩個(gè)塊XN(n)和XN+1(n)被聯(lián)合分析以給出一批與索引為N的幀相關(guān)聯(lián)的變換系數(shù),并且 分析窗口是正弦的。
[0007] 通過變換編碼應(yīng)用的劃分成塊(也稱為幀)完全獨(dú)立于聲音信號(hào)并且過渡能夠因 此出現(xiàn)在分析窗口的任一點(diǎn)。現(xiàn)在,在變換解碼之后,重構(gòu)信號(hào)被由量化(Q)_逆量化(Q, 操作導(dǎo)致的"噪聲"(或失真)影響。此編碼噪聲在變換塊的全部時(shí)間媒介上(也就是說, 在長度為2L個(gè)樣本(與L個(gè)樣本重疊)的窗口的全部長度上)以相對(duì)統(tǒng)一的方式在時(shí)間 上分布。編碼噪聲的能量總體上與塊的能量成比例并且是編碼/解碼比特率的函數(shù)。
[0008]針對(duì)包括開始的塊(如圖1中的塊320-480),信號(hào)的能量較高,噪聲也因此具有高 電平。
[0009] 在變換編碼中,針對(duì)立即跟隨過渡的高能量片段,編碼噪聲的電平典型地低于信 號(hào)的電平,但是針對(duì)低能量片段,顯著地是在過渡之前的部分上(圖1的樣本160-410),該 電平高于信號(hào)的電平。針對(duì)上述部分,信噪比是負(fù)的并且所導(dǎo)致的退化在傾聽時(shí)會(huì)變得非 常惱人。前回聲是給過渡之前的編碼噪聲的名稱,并且后回聲是給過渡之后的噪聲的名稱。
[0010] 在圖1中可以看出前回聲影響過渡之前的幀以及過渡發(fā)生處的幀。
[0011] 心理聲學(xué)實(shí)驗(yàn)已經(jīng)示出人耳執(zhí)行幾毫秒級(jí)的相當(dāng)有限的聲音的時(shí)間前掩蔽。當(dāng)前 回聲的時(shí)長大于前掩蔽時(shí)長時(shí),開始之前的噪聲或前回聲是可聽見的。
[0012] 在從高能量序列到低能量序列的過渡中,人耳也執(zhí)行從5至60毫秒的更長時(shí)長的 后掩蔽。因此針對(duì)后回聲比針對(duì)前回聲可接受的不舒適的比率或水平較高。
[0013] 當(dāng)塊的長度就樣本的數(shù)量而言是顯著的時(shí),前回聲的現(xiàn)象更關(guān)鍵地是格外惱人 的?,F(xiàn)在,在變換編碼中,眾所周知的是針對(duì)靜態(tài)信號(hào),變換的長度增加的越多,編碼增益 變得越大。在具有固定采樣頻率和固定比特率的情況下,如果窗口的點(diǎn)數(shù)(因此變換的長 度)增加,每幀將會(huì)有更多比特編碼被心理聲學(xué)模型認(rèn)為有用的頻率射線,因此會(huì)有利用 大長度的塊的益處。例如,MPEGAAC(高級(jí)音頻編碼)編碼使用包含固定數(shù)目2048的樣本 的大長度的窗口,即,如果采樣頻率是32kHz,大于64ms的時(shí)長;前回聲的問題通過使其能 夠通過中間窗口(被稱為過渡窗口)從這些長窗口切換到8個(gè)短窗口而被管理,這要求在 編碼中的特定延遲以檢測過渡的出現(xiàn)并且適配窗口。這些短窗口的長度因此是256個(gè)樣本 (在32kHz處的8ms)。在低比特率處,具有幾毫秒的可聽見的前回聲仍然是可能的。窗口 的切換使得衰減前回聲而不是消除前回聲成為可能。用于對(duì)話式的應(yīng)用如ITU-TG. 722. 1、 G. 722. 1C或G. 719的變換編碼器經(jīng)常在16、32或48kHz處(分別地)使用20ms的幀長度 和40ms時(shí)長的窗口??梢宰⒁獾?,ITU-TG. 719編碼器結(jié)合具有瞬態(tài)檢測的窗口切換機(jī)制, 但是前回聲并不以低比特率(典型地以32kbit/s)完全地減少。
[0014] 為了減少前回聲現(xiàn)象的上述惱人的影響,在編碼器和/或解碼器水平已經(jīng)提出了 不同的解決方案。
[0015] 窗口的切換已經(jīng)被引用;其要求發(fā)送輔助信息以標(biāo)識(shí)在當(dāng)前幀中使用的窗口的類 型。另一個(gè)解決方案包括應(yīng)用自適應(yīng)濾波。在開始之前的區(qū)域中,重構(gòu)信號(hào)被視作原始信 號(hào)和量化噪聲的和。
[0016] 在由Y.馬耶克斯(Y.Mahieux)和J.P.佩蒂特(J.P.Petit)發(fā)表的電氣電子工 程師協(xié)會(huì)通信會(huì)報(bào)1994年11月第11期42卷標(biāo)題為"以64kbits的高質(zhì)量音頻變換編碼 (HighQualityAudioTransformCodingat64kbits)" 的文章中已經(jīng)描述了相應(yīng)的濾波 技術(shù)。
[0017] 此類濾波的實(shí)現(xiàn)需要參數(shù)的知識(shí),其中的許多例如預(yù)測系數(shù)和由前回聲損壞的信 號(hào)的方差從噪聲樣本中在解碼器上被估算。相比之下,諸如原始信號(hào)的能量的信息僅能夠 被編碼器已知并且必須因此被發(fā)送。這需要發(fā)送附加信息,這種具有受約束的比特率的附 加信息減少了分配給變換編碼的相對(duì)預(yù)算。當(dāng)所接收的塊包含動(dòng)態(tài)范圍的突然變化時(shí),濾 波處理被應(yīng)用到該塊。
[0018] 上述濾波過程沒有使得檢索原始信號(hào)成為可能,但是提供了前回聲的強(qiáng)減少。然 而,這確實(shí)需要發(fā)送附加參數(shù)到解碼器。
[0019] 不像先前的解決方案,不具有信息的特定發(fā)送的不同前回聲減少技術(shù)已經(jīng)被提 出。例如,在層級(jí)編碼的上下文中的前回聲的減少的綜述被呈現(xiàn)在2008年8月瑞士洛桑 市EUSIPC0 的B?科斯伍德(B.Kdvesi)、S?拉戈(S.Ragot)、M.高德納(M.Gartner)、 H. 塔代伊(H.Taddei)的文章"在ITU-TG. 729. 1嵌入式編碼器中的前回聲減少(Pre-echo reductionintheITU-TG. 729.lembeddedcoder)" 中。
[0020] 在法國專利申請(qǐng)F(tuán)R0856248中描述了沒有輔助信息的前回聲衰減方法的典型示 例。在此示例中,在其中已經(jīng)檢測到過渡或開始的子塊之前的低能量子塊中的每子塊的衰 減因子被確定。
[0021] 在第k個(gè)子塊g(k)中的衰減因子是例如作為在最強(qiáng)能量的子塊的能量和相關(guān)的 第k個(gè)子塊的能量之間的比率R(k)的函數(shù)被計(jì)算:
[0022] g(k) =f(R(k))
[0023] 其中f是具有在0和1之間的值的遞減函數(shù)并且k是子塊的編號(hào)。因子g(k)的 其他定義是可能的,例如作為當(dāng)前子塊中的能量En(k)的函數(shù)和前一子塊中的能量的函數(shù) En(k_l)〇
[0024] 如果子塊的能量相對(duì)于在當(dāng)前幀中考慮的子塊的最大能量變化很小,則沒有衰減 是必需的;因子g(k)被設(shè)置在禁止衰減的衰減因子處,也就是說,1。否則,衰減因子位于0 和1之間。
[0025] 在大多數(shù)情況下,首先是前回聲惱人時(shí),前回聲幀之前的幀具有對(duì)應(yīng)于低能量片 段(典型地背景噪聲)的能量的均勻能量。憑經(jīng)驗(yàn),在前回聲衰減處理之后,信號(hào)的能量 變?yōu)榈陀谔幚韰^(qū)域之前的信號(hào)的平均能量(每子塊)既不是有用的也不是令人期望的,典 型地是低于先前幀的平均能量,表示為7^,或低于先前幀的后半部分的平均能量,表示為En' 〇
[0026] 針對(duì)有待處理的索引為k的子塊,可能的是計(jì)算衰減因子的極限值,表示為 limg(k),從而準(zhǔn)確獲得與在有待處理的子塊之前的片段的每子塊的平均能量相同的能量。 這個(gè)值當(dāng)然被限制為最大為1,因?yàn)榇颂幨谷烁信d趣的是衰減值。更確切地說,以下在此定 義:
[0027]
[0028] 其中,先前片段的平均能量通過值來近似。
[0029] 由此獲得的值limg(k)作為在子塊的衰減因子的最終計(jì)算中的下限,并且因此被 如下使用:
[0030] g(k) =max(g(k), 1img (k))
[0031] 每子塊確定的衰減因子(或增益)g(k)然后能夠被平滑函數(shù)平滑化,該平滑函數(shù) 被逐個(gè)樣本應(yīng)用以避免衰減因子在塊的邊界處的突然變化。
[0032] 例如,可能的是首先定義每樣本的增益作為分段的常量函數(shù):
[0033] gpre (n) =g(k),n=kL',…,(k+1)L' -1
[0034] 其中L'表示子塊的長度。
[0035] 該函數(shù)然后根據(jù)以下等式被平滑化:
[0036] gpre (n) : =agpre (n-1) + (1-a)gpre (n),n= 0,…,L-1
[0037] 常規(guī)的是,gpM(_l)是針對(duì)先前子塊的最后樣本獲得的最后衰減因子,a是平滑系 數(shù),典型地a= 〇. 85。
[0038] 其他平滑函數(shù)也是可能的,諸如例如在u個(gè)樣本上的線性交叉衰落:
[0039]
[0040] 其中,gpre' (n)是非平滑衰減并且gpre(n)是平滑衰減,gpre' (n)和n= -(u_l),… ,-1是針對(duì)先前子塊的最后樣本而獲得的最后u-1個(gè)衰減因子。例如,可能的是取u= 5。
[0041]一旦gpM(n)因子被由此計(jì)算,通過將每個(gè)樣本乘以相應(yīng)的因子,在當(dāng)前幀中 xMC;(n)重構(gòu)的信號(hào)上完成前回聲的衰減:
[0042]xrec;g(n) =gpre (n)xrec (n),n= 0,???,L~1
[0043] 此處x_,g(n)是由前回聲減少解碼和后處理的信號(hào)。
[0044] 圖2和圖3展示了如上述描述的、并且先前總結(jié)的、現(xiàn)有技術(shù)專利申請(qǐng)的衰減方法 的實(shí)現(xiàn)。
[0045] 在這些示例中,信號(hào)在32kHz處被采樣,幀的長度是L=640個(gè)樣本,并且每個(gè)幀 被劃分為8個(gè)k= 80個(gè)樣本的子塊。
[0046] 在圖2的部分a)中,表示了在32kHz處被采樣的原始信號(hào)的幀。信號(hào)中的開始 (或過渡)位于在索引320處開始的子塊中。此信號(hào)已經(jīng)以低比特率(24kbit/s)由MDCT 類型的變換編碼器編碼。
當(dāng)前第1頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1