專利名稱:歷史音頻噪聲檢測(cè)與消除方法
技術(shù)領(lǐng)域:
本發(fā)明涉及噪聲檢測(cè)與去除方法。
背景技術(shù):
音頻降噪是指從帶噪聲音信號(hào)中提取出盡可能純凈的原始聲音信號(hào)。音頻信號(hào) 中,短時(shí)的、非連續(xù)的、幅度大的脈沖或噪聲尖峰稱為脈沖噪聲。脈沖噪聲可由多種噪聲源 產(chǎn)生,如老唱片的劃痕,唱片表面附著灰塵和顆粒,錄音帶的突然停止以及唱片表面的非規(guī) 則變化等。脈沖噪聲按照持續(xù)時(shí)間的長(zhǎng)短分為短時(shí)脈沖噪聲和暫態(tài)脈沖噪聲(或稱為持續(xù) 脈沖噪聲)。傳統(tǒng)的信號(hào)分析與處理工具是傅立葉變換,但傅立葉變換無(wú)法給出信號(hào)的頻譜 隨時(shí)間變化的規(guī)律。近年時(shí)頻聯(lián)合分析方法得到了發(fā)展,它將時(shí)域和頻域用一個(gè)二維域聯(lián) 合表示。此方法分為線性和非線性兩種,線性時(shí)頻變換有短時(shí)傅立葉變換(簡(jiǎn)記為STFT)、 小波變換(Wavelet Transformation)和戈勃(Gabor)展開(kāi)等。維格納分布(Wigner-Ville, 簡(jiǎn)記為WVD)是一種重要的非線性時(shí)頻表示方法。文獻(xiàn)《基于短時(shí)傅立葉變換譜圖的非平穩(wěn) 信號(hào)時(shí)延估計(jì)方法》(《探測(cè)與控制學(xué)報(bào)》)指出,短時(shí)傅立葉變換的能量分布具有比維格納 分布圖更好的能量集中特性?!兑环N改進(jìn)的小波變換閾值去噪方法》(《通信學(xué)報(bào)》彭玉華)中闡述了小波變換閾 值去噪方法,.《基于小波變換模極大值的脈沖噪聲去除方法》(《山東理工大學(xué)學(xué)報(bào)》(自 然科學(xué)版)潘金鳳)中提出了一種基于小波變換模極大值的脈沖噪聲去除方法,但是這兩 種方法都會(huì)引起原始信號(hào)音色的變化。也有使用一種基于AR模型的線性預(yù)測(cè)方法進(jìn)行脈 沖噪聲抑制,此方法需要對(duì)信號(hào)進(jìn)行訓(xùn)練,復(fù)雜度較高且依賴于對(duì)模型系數(shù)預(yù)測(cè)的準(zhǔn)確性。 用貝葉斯方法能較好地抑制此類噪聲,但算法復(fù)雜,效率低,且需要預(yù)先估計(jì)噪聲的統(tǒng)計(jì)特 性。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種歷史音頻噪聲檢測(cè)與消除方法,簡(jiǎn)單實(shí)用的,當(dāng)檢測(cè)到 的候選噪聲信號(hào)滿足一定的閾值條件后才用中值濾波對(duì)其加以消除。針對(duì)暫態(tài)脈沖噪聲, 本發(fā)明提供了一種基于前后信息相關(guān)聯(lián)的帶通噪聲抑制方法,使用一個(gè)限制帶先把較寬的 持續(xù)脈沖限制在一定范圍內(nèi),再對(duì)其進(jìn)行處理。該方法速度快,不需要提前進(jìn)行預(yù)測(cè)和估 計(jì),而且經(jīng)實(shí)驗(yàn)證明該方法可以取得令人滿意的效果。上述的目的通過(guò)以下的技術(shù)方案實(shí)現(xiàn)歷史音頻噪聲檢測(cè)與消除方法,該方法包括如下步驟(1)聲音建模聲音信號(hào)可以用以下方法描述y(k) =x(k)+j(k)*d(k),其中, y(k)為被污染的帶噪信號(hào),x(k)為純凈信號(hào),j(k) * d(k)為噪聲部分,其中j(k)為標(biāo)志 位,表示此處是否出現(xiàn)脈沖噪聲,d(k)表示脈沖噪聲的幅度值;(2)短時(shí)傅立葉變換和譜圖使用一個(gè)隨時(shí)間滑動(dòng)的分析窗對(duì)非平穩(wěn)信號(hào)進(jìn)行加 窗截?cái)鄬⒎瞧椒€(wěn)信號(hào)分解成一系列近似平穩(wěn)的短時(shí)信號(hào),然后用傅立葉變換分析各短時(shí)平穩(wěn)信號(hào)的頻譜;(3)脈沖噪聲檢測(cè);(4)脈沖噪聲檢測(cè)性能分析;(5)信號(hào)的修復(fù)與重建;(6)實(shí)驗(yàn)結(jié)果與分析。所述的歷史音頻噪聲檢測(cè)與消除方法,所述的脈沖噪聲的檢測(cè)包括(1)對(duì)帶噪 信號(hào)進(jìn)行短時(shí)傅立葉變換,(2)在頻率域上應(yīng)用選擇標(biāo)準(zhǔn)檢測(cè)出含脈沖噪聲的窗口,(3)根 據(jù)時(shí)頻聯(lián)合域(η,ω)返回信號(hào)在時(shí)域上的位置。所述的歷史音頻噪聲檢測(cè)與消除方法,所述的脈沖噪聲檢測(cè)性能分析包括利 用有效檢測(cè)率(Efficient Detection Percentage,簡(jiǎn)記為EDP)和檢測(cè)成功率(Right Detection Percentage,簡(jiǎn)記為RDP),作為脈沖噪聲檢測(cè)過(guò)程的性能評(píng)價(jià)指標(biāo)。其中,EDP 表示檢測(cè)的精確度;RDP反映檢測(cè)的準(zhǔn)確性,獲得最大的RDP是算法的首要目標(biāo)。EDP越大, 則冗余度越小,RDP越大,檢測(cè)越準(zhǔn)確,檢測(cè)性能越好,對(duì)后面的修復(fù)和重建越有利。二者是 有內(nèi)在聯(lián)系的,RDP的基數(shù)是信號(hào)中的脈沖噪聲總數(shù),在選定處理對(duì)象后它是個(gè)確定值,因 此為了提高RDP必須放寬檢測(cè)標(biāo)準(zhǔn),使更多的噪聲信號(hào)落在所檢測(cè)的窗口中,從而會(huì)降低 EDP。所述的歷史音頻噪聲檢測(cè)與消除方法,所述的信號(hào)的修復(fù)與重建包括(1)中值濾波及其改進(jìn),采取措施保留那些檢測(cè)到的、但非脈沖噪聲的聲音的細(xì) 節(jié),改進(jìn)了中值濾波,增加了一個(gè)可調(diào)系數(shù)的閾值過(guò)濾系統(tǒng)以減少信號(hào)的誤檢與失真,即當(dāng) 信號(hào)的采樣值與窗口的中值相差大于某個(gè)閾值時(shí)才用中值代替采樣值;(2)信號(hào)修復(fù)的實(shí)現(xiàn),利用聲音信號(hào)在時(shí)域上的連續(xù)性,將相鄰的兩個(gè)窗口進(jìn)行比 較,用前面沒(méi)有被噪聲信號(hào)污染過(guò)的純凈信號(hào)來(lái)修復(fù)后面的帶噪聲音,利用前一窗口純凈 信號(hào)的均值及最大值、最小值信息來(lái)設(shè)置一個(gè)帶通限制器,讓帶噪信號(hào)窗口通過(guò)此限制器, 幅值在這個(gè)限制器范圍內(nèi)的信號(hào)將被保留,在此范圍外的信號(hào)將被此限制器的邊界取代;(3)脈沖噪聲修復(fù)性能分析。有益效果1.首次利用信號(hào)的短時(shí)傅立葉變換后的譜圖對(duì)脈沖噪聲加以檢測(cè),這種方法基于 脈沖噪聲的檢測(cè),采用新的寬脈沖限制方法和改進(jìn)的中值濾波方法對(duì)兩種脈沖噪聲加以了 抑制和消除。根據(jù)純凈信號(hào)與脈沖噪聲在頻率域上的不同特點(diǎn)對(duì)這兩種信號(hào)加以區(qū)分,首 先根據(jù)這兩種信號(hào)在不同頻率上的能量不同,通過(guò)調(diào)整參數(shù),篩選出可能的脈沖噪聲點(diǎn);再 利用這兩種信號(hào)的相關(guān)性的不同檢測(cè)出脈沖噪聲,并用短時(shí)傅立葉變換將信號(hào)從頻域?qū)?yīng) 到時(shí)域上。2.提出了四個(gè)指標(biāo)用于衡量檢測(cè)和修復(fù)方法的性能。在噪聲檢測(cè)方面,把有效 檢測(cè)率(Efficient Detection Percentage,簡(jiǎn)記為 EDP)和檢測(cè)成功率(RightDetection Percentage,簡(jiǎn)記為RDP)作為脈沖噪聲檢測(cè)過(guò)程的性能評(píng)價(jià)指標(biāo)。其中,EDP表示檢測(cè)的 精確度;RDP反映檢測(cè)的準(zhǔn)確性,EDP和RDP越大越好。在噪聲信號(hào)修復(fù)方面,,把誤修率 (False Reconstruction Percen-tage,簡(jiǎn)記為 FRP)禾口漏修率(Missing Reconstruction Percentage,簡(jiǎn)記為MRP)作為評(píng)價(jià)指標(biāo)。其中,有效修復(fù)用脈沖噪聲前后兩個(gè)純凈信號(hào)的 平均值與修復(fù)后的幅度值之差來(lái)刻畫。FRP和MRP越小表示修復(fù)質(zhì)量越高。這四個(gè)指標(biāo)可
4以反映檢測(cè)和修復(fù)的有效性和正確性,同樣適合于其他脈沖噪聲的檢測(cè)與修復(fù)方法。3.改進(jìn)中值濾波以減小信號(hào)修復(fù)中的FRP。該方法能夠有效地消除脈沖噪聲,并 且保留了原始信號(hào)的更多細(xì)節(jié),對(duì)各種不同密度的脈沖噪聲均能取得令人滿意的結(jié)果,易 于工程實(shí)現(xiàn)。但在使用中也需要注意以下問(wèn)題,如音頻信號(hào)中有用的沖擊脈沖信息有可能 被錯(cuò)誤地指示成脈沖噪聲,比如某些打擊音等,這些點(diǎn)和脈沖噪聲的時(shí)域頻域特性非常相 似,按照音樂(lè)特性這些信號(hào)應(yīng)該保留。4.針對(duì)暫態(tài)脈沖噪聲提出了一種帶通抑制方法。本發(fā)明提出了一種基于前后信息 相關(guān)聯(lián)的帶通噪聲抑制方法,其核心思想是利用聲音信號(hào)在時(shí)域上的連續(xù)性,將相鄰的兩 個(gè)窗口進(jìn)行比較,用前面沒(méi)有被噪聲信號(hào)污染過(guò)的純凈信號(hào)來(lái)修復(fù)后面的帶噪聲音,利用 前一窗口純凈信號(hào)的均值及最大值、最小值信息來(lái)設(shè)置一個(gè)帶通限制器,讓帶噪信號(hào)窗口 通過(guò)此限制器,幅值在這個(gè)限制器范圍內(nèi)的信號(hào)將被保留,在此范圍外的信號(hào)將被此限制 器的邊界取代。該方法可有效抑制持續(xù)時(shí)間較長(zhǎng)的脈沖噪聲。
圖1 (a)帶噪信號(hào)在窗口長(zhǎng)度為4時(shí)的短時(shí)傅立葉變換后結(jié)果;(b)帶噪信號(hào)在窗 口長(zhǎng)度為16時(shí)的短時(shí)傅立葉變換后結(jié)果;(c)帶噪信號(hào)在窗口長(zhǎng)度為64時(shí)的短時(shí)傅立葉 變換后結(jié)果;(d)帶噪信號(hào)在窗口長(zhǎng)度為128時(shí)的短時(shí)傅立葉變換后結(jié)果。圖2信號(hào)變換過(guò)程窗口變換示意圖。圖3帶通示意圖。圖4 (a)系統(tǒng)流程圖;(b)檢測(cè)算法基本流程圖;(C)修復(fù)算法基本流程圖。圖5經(jīng)過(guò)檢測(cè)算法標(biāo)記的實(shí)驗(yàn)結(jié)果。圖6脈沖噪聲去除算法修復(fù)前后信號(hào)對(duì)比圖。圖7(a)噪聲率為0. 22%時(shí)窗口大小與檢測(cè)指標(biāo)關(guān)系圖;(b)噪聲率為0. 22%時(shí) 窗口 L= 14時(shí)kl對(duì)修復(fù)指標(biāo)的影響圖;(c)噪聲率為6. 01%時(shí)窗口大小與檢測(cè)指標(biāo)關(guān)系 圖;(d)噪聲率為6. 01%時(shí)窗口 L = 8時(shí)kl對(duì)修復(fù)指標(biāo)的影響圖。
具體實(shí)施例方式實(shí)施例1 歷史音頻噪聲檢測(cè)與消除方法,該方法包括如下步驟(1)聲音建模聲音信號(hào)可以用以下方法描述y(k) = x(k)+j(k)*d(k) (1)其中,y(k)為被污染的帶噪信號(hào),x(k)為純凈信號(hào),j(k)女d(k)為噪聲部分,其 中j(k)為標(biāo)志位,表示此處是否出現(xiàn)脈沖噪聲,d(k)表示脈沖噪聲的幅度值;(2)短時(shí)傅立葉變換和譜圖使用一個(gè)隨時(shí)間滑動(dòng)的分析窗對(duì)非平穩(wěn)信號(hào)進(jìn)行加
窗截?cái)鄬⒎瞧椒€(wěn)信號(hào)分解成一系列近似平穩(wěn)的短時(shí)信號(hào),然后用傅立葉變換分析各短時(shí)平
穩(wěn)信號(hào)的頻譜;其定義式如下
+00STFT(t,iy)= Jχ{τ)ω{τ- )^ιφ{(diào)-]ωτ) τ
(2)
其中⑵式為連續(xù)短時(shí)傅立葉變換,(3)式為其離散變換,ω (t)為分析窗。其實(shí) 質(zhì)就是利用窗函數(shù)《(τ _t)對(duì)信號(hào)進(jìn)行加窗,得到以時(shí)間t為中心的局部窗口的頻譜信息。 為了去除邊緣效應(yīng),各窗之間應(yīng)有一些重疊。STFT的高時(shí)間分辨率要求一個(gè)較短的窗,高頻 率分辨率要求一個(gè)窄帶分析窗,根據(jù)Heisenberg的不確定性原理,時(shí)間分辨率和頻率分辨 率是矛盾的,不可能同時(shí)達(dá)到最高。譜圖定義為STFT模值的平方,是信號(hào)能量的分布。利用不同的分析窗長(zhǎng)度可以得 到不同分辨率的譜圖,圖1給出了海明窗長(zhǎng)度分別為L(zhǎng) = 16,L = 64和L = 128時(shí)的譜圖。從圖1中可以看出,L= 128時(shí)的譜圖具有最高的頻率分辨率,L = 64時(shí)的譜圖次 之,L = 16時(shí)譜圖頻率分辨率最低。同時(shí)能清晰看出,脈沖噪聲在高頻部分的能量比較集 中,在譜圖上表現(xiàn)為顏色鮮艷,且與周圍信號(hào)在頻率譜上不連續(xù)。實(shí)驗(yàn)證明,可以把噪聲信 號(hào)和聲音信號(hào)在譜圖上能量分布的區(qū)別作為檢測(cè)脈沖噪聲的重要依據(jù)。(3)脈沖噪聲檢測(cè);(4)脈沖噪聲檢測(cè)性能分析;(5)信號(hào)的修復(fù)與重建;(6)實(shí)驗(yàn)結(jié)果與分析。實(shí)施例2 根據(jù)實(shí)施例1所述的歷史音頻噪聲檢測(cè)與消除方法,所述的脈沖噪聲的檢測(cè)包 括(1)對(duì)帶噪信號(hào)進(jìn)行短時(shí)傅立葉變換,(2)在頻率域上應(yīng)用選擇標(biāo)準(zhǔn)檢測(cè)出含脈沖噪聲 的窗口,⑶根據(jù)時(shí)頻聯(lián)合域(η,ω)返回信號(hào)在時(shí)域上的位置。對(duì)源信號(hào)作短時(shí)傅立葉變換時(shí),窗口類型和窗口大小會(huì)對(duì)譜圖產(chǎn)生很大影響。海 明窗和漢寧窗與矩形窗相比具有較優(yōu)的分析性能;若窗口選擇的太大,會(huì)引起檢測(cè)位置的 不準(zhǔn)確,降低有效檢測(cè)率(參見(jiàn)2. 4節(jié));若窗口選擇的過(guò)小,則會(huì)大大增加計(jì)算量,同時(shí)也 會(huì)丟失窗口中的部分信息。為了保存邊緣信息,需要增加窗口之間的重復(fù)計(jì)算量,這個(gè)數(shù)字記為wrap,假設(shè)窗 口長(zhǎng)度為N,信號(hào)變換過(guò)程的窗口變換示意見(jiàn)圖2。首先在聲音信號(hào)前補(bǔ)充wrap個(gè)0,再依 次進(jìn)行窗口變換。為達(dá)到更好的檢測(cè)性能必須權(quán)衡這些參數(shù),第4部分在不同的脈沖噪聲 密度下研究了每個(gè)參數(shù)對(duì)噪聲檢測(cè)性能的影響,并給出了參數(shù)選擇的實(shí)驗(yàn)指導(dǎo)以獲得更好 的性能。得到譜圖后,首先根據(jù)高頻部分能量在整個(gè)窗口中所占的比例,利用閾值選取出 可能是脈沖噪聲的信號(hào)(此閾值適合取得比較小,一般小于1/5,閾值小可以增加檢測(cè)成功 率,見(jiàn)2. 4節(jié)),再將這些候選窗與相鄰的多個(gè)窗綜合分析,呈線性變化時(shí),可認(rèn)為此窗口內(nèi) 不含脈沖噪聲信號(hào);呈不規(guī)則變化且此窗與周圍窗口相關(guān)性大時(shí)(兩窗口相關(guān)性判斷一般 為差值或向量乘運(yùn)算),則可認(rèn)定此窗內(nèi)含有脈沖噪聲。當(dāng)脈沖噪聲密度較大時(shí),系統(tǒng)將變 得更復(fù)雜,需要建立多級(jí)判斷機(jī)制,才能做到更準(zhǔn)確的檢測(cè)。檢測(cè)好帶脈沖噪聲的窗口之后,可以根據(jù)圖2中的變換方法,利用數(shù)學(xué)公式計(jì)算 出噪聲位置,即完成了檢測(cè)過(guò)程。實(shí)施例3
根據(jù)實(shí)施例1所述的歷史音頻噪聲檢測(cè)與消除方法,所述的脈沖噪聲檢測(cè)性能分 析包括利用有效檢測(cè)率(Efficient Detection Percentage,簡(jiǎn)記為EDP)和檢測(cè)成功率 (Right Detection Percentage,簡(jiǎn)記為RDP),作為脈沖噪聲檢測(cè)過(guò)程的性能評(píng)價(jià)指標(biāo)。二 者的計(jì)算公式如下EDP =(檢測(cè)到的脈沖噪聲數(shù)/檢測(cè)到的信號(hào)總數(shù))*100% (4)RDP =(檢測(cè)到的脈沖噪聲數(shù)/信號(hào)中的脈沖噪聲總數(shù))*100% (5)其中,EDP表示檢測(cè)的精確度;RDP反映檢測(cè)的準(zhǔn)確性,獲得最大的RDP是算法的首 要目標(biāo)。EDP越大,則冗余度越小,RDP越大,檢測(cè)越準(zhǔn)確,檢測(cè)性能越好,對(duì)后面的修復(fù)和重 建越有利。二者是有內(nèi)在聯(lián)系的,RDP的基數(shù)是信號(hào)中的脈沖噪聲總數(shù),在選定處理對(duì)象后 它是個(gè)確定值,因此為了提高RDP必須放寬檢測(cè)標(biāo)準(zhǔn),使更多的噪聲信號(hào)落在所檢測(cè)的窗 口中,從而會(huì)降低EDP。此標(biāo)準(zhǔn)可以準(zhǔn)確反映檢測(cè)過(guò)程的有效性和正確性,不僅可以用于本 方法,同樣適用于其他的脈沖噪聲檢測(cè)方法。實(shí)施例4 根據(jù)實(shí)施例1所述的歷史音頻噪聲檢測(cè)與消除方法,所述的信號(hào)的修復(fù)與重建包 括(1)中值濾波及其改進(jìn),中值濾波的基本思想是利用一個(gè)給定長(zhǎng)度的窗依次滑過(guò) 要處理的信號(hào),然后將窗口中間的信號(hào)值用窗口中這些序列的中值取代。其中,中值可以通 過(guò)先將序列排序再取中間值得到。對(duì)于一個(gè)長(zhǎng)度為L(zhǎng) = 2K+1 (K為正整數(shù))的濾波窗口, 假設(shè)在第η時(shí)刻輸入信號(hào)序列在窗口內(nèi)的樣本點(diǎn)為x(n-K),…,x(n),…,x(n+K)如果用 y(n)表示中值濾波的輸出,則y(n) =Xmedian (η) = median [χ (η-Κ), ...,χ(η),...,χ(η+Κ)] (6)當(dāng)窗口的寬度為2Κ+1時(shí),信號(hào)序列中寬度不大于K的脈沖便會(huì)被中值濾波清除。 在信號(hào)中大范圍使用中值濾波器通常會(huì)引起信號(hào)的衰減,以及原來(lái)信號(hào)質(zhì)量和音色的變化 等問(wèn)題。針對(duì)前面檢測(cè)中可能會(huì)出現(xiàn)的冗余檢測(cè)問(wèn)題,本發(fā)明采取了如下措施保留那些檢 測(cè)到的、但非脈沖噪聲的聲音的細(xì)節(jié),改進(jìn)了中值濾波,增加了一個(gè)可調(diào)系數(shù)的閾值過(guò)濾系 統(tǒng)以減少信號(hào)的誤檢與失真,即當(dāng)信號(hào)的采樣值與窗口的中值相差大于某個(gè)閾值時(shí)才用中 值代替采樣值 其中,χ(η)是采樣信號(hào),σ (η)為可調(diào)節(jié)的閾值,它與信號(hào)的特性有關(guān),&為總體信
號(hào)均值,kl為過(guò)濾系數(shù)。盡管如此,改進(jìn)的中值濾波也不是最優(yōu)的,因?yàn)樗](méi)有充分利用 噪聲模型的統(tǒng)計(jì)信息,但它實(shí)現(xiàn)簡(jiǎn)單,算法復(fù)雜度低,并具有較好的處理效果,易于工程實(shí) 現(xiàn)。(2)信號(hào)修復(fù)的實(shí)現(xiàn),采用改進(jìn)的中值濾波可以有效地處理短時(shí)脈沖噪聲,且能降 低噪聲失真,但當(dāng)脈沖持續(xù)時(shí)間大于中值濾波器的步長(zhǎng)的一半時(shí),中值濾波將失去作用。為了更好的處理這類噪聲,本發(fā)明提出了一種基于前后信息相關(guān)聯(lián)的帶通噪聲抑制方法。該 方法的核心思想是利用聲音信號(hào)在時(shí)域上的連續(xù)性,將相鄰的兩個(gè)窗口進(jìn)行比較,用前面 沒(méi)有被噪聲信號(hào)污染過(guò)的純凈信號(hào)來(lái)修復(fù)后面的帶噪聲音,利用前一窗口純凈信號(hào)的均值 及最大值、最小值信息來(lái)設(shè)置一個(gè)帶通限制器,讓帶噪信號(hào)窗口通過(guò)此限制器,幅值在這個(gè) 限制器范圍內(nèi)的信號(hào)將被保留,在此范圍外的信號(hào)將被此限制器的邊界取代。圖3是這種方法的示意圖,假設(shè)前一窗口為Wnri,后一個(gè)窗口為Wm,用ym (η)表示輸 出,則帶噪信號(hào)通過(guò)限制器之后的輸出為 其中,^"表示前一個(gè)窗口中信號(hào)的均信,表示窗口中信號(hào)的最大
值,相應(yīng)地,min(C)表示最小值。k2為調(diào)節(jié)系數(shù),為了不影響信號(hào)的失真,一般取值 大于1. 5。(3)脈沖噪聲修復(fù)性能分析。為了衡量修復(fù)方法的性能,避免失真,本發(fā)明把誤修率(FalseReconstruction Percen-tage,簡(jiǎn)記為 FRP)禾口漏修率(Missing ReconstructionPercentage,簡(jiǎn)記為 MRP)作 為評(píng)價(jià)指標(biāo)對(duì)修復(fù)方法作一個(gè)客觀的評(píng)價(jià)。其中,F(xiàn)RP =(錯(cuò)誤修復(fù)的非脈沖噪聲信號(hào)點(diǎn)數(shù)/(檢測(cè)到的信號(hào)總數(shù)-檢測(cè)到的脈沖噪 聲數(shù)))*100% (9)MRP =((信號(hào)中的脈沖噪聲總數(shù)-有效修復(fù)的脈沖噪聲數(shù))/信號(hào)中的脈沖噪聲 總數(shù))*100% (10)有效修復(fù)用脈沖噪聲前后兩個(gè)純凈信號(hào)的平均值與修復(fù)后的幅度值之差來(lái)刻畫, 假設(shè)^;表示修復(fù)后的信號(hào),則當(dāng)1乂^1= 乂“74"1)時(shí)表示該修復(fù)有效,
否則無(wú)效。其中k3 —般設(shè)置為kl的幾分之一,θ (η)與信號(hào)特性有關(guān)。FRP和MRP越小表示修復(fù)質(zhì)量越高。FRP反映信號(hào)失真的程度,越小越好;MRP則 表示脈沖噪聲消除比率,MRP越小,未被有效處理的脈沖噪聲就越少。FRP和MRP與修復(fù)算 法密切相關(guān),普通的中值濾波方法對(duì)所有檢測(cè)到的點(diǎn)都進(jìn)行處理,使得FRP很大,經(jīng)過(guò)改進(jìn) 后對(duì)信號(hào)再次進(jìn)行分析,大大降低了 FRP,其中過(guò)濾系數(shù)kl設(shè)置的越精確,F(xiàn)RP越小。此標(biāo) 準(zhǔn)同樣適用于其他的脈沖噪聲去除方法。為了驗(yàn)證基于短時(shí)傅立葉譜圖的脈沖噪聲去除方法的性能,給出了在matlab中 的仿真計(jì)算結(jié)果。圖4給出了算法的基本流程,圖5是對(duì)一段數(shù)字化采集后的帶噪音頻檢測(cè)后的實(shí)驗(yàn)結(jié)果,其中進(jìn)行STFT的窗口大小設(shè)置為64,時(shí)域軸上的“女”號(hào)表示檢測(cè)到此窗 口中含有脈沖噪聲。圖6中給出了原聲音和經(jīng)過(guò)對(duì)脈沖信號(hào)修復(fù)后的信號(hào)的對(duì)比。為了選擇適當(dāng)?shù)膮?shù)以獲得更好的性能,本發(fā)明對(duì)一段純凈信號(hào)人工加上脈沖信 號(hào),對(duì)含不同噪聲密度的帶噪噪聲進(jìn)行了實(shí)驗(yàn)。固定wrap為窗口長(zhǎng)度的一半,固定k2和其 他參數(shù),對(duì)一段加幅度值為士1的噪聲的實(shí)驗(yàn)結(jié)果如圖7所示。其中,(a)和(b)是對(duì)噪聲率為0. 22%的帶噪信號(hào)進(jìn)行檢測(cè)和修復(fù)的實(shí)驗(yàn)結(jié)果, (c)和(d)是對(duì)噪聲率為6. 01%音頻信號(hào)的實(shí)驗(yàn)結(jié)果。對(duì)比(a)和(c)可得,當(dāng)噪聲密度 較大時(shí),檢測(cè)指標(biāo)對(duì)窗口大小變化敏感,窗口設(shè)置的比較小時(shí)才可以獲得更好的性能;當(dāng)噪 聲密度較小時(shí),適當(dāng)增加窗口的寬度可以獲得更好的性能,在本實(shí)驗(yàn)中窗口大小設(shè)為14時(shí) 效果最優(yōu)。同時(shí)可看出兩種噪聲密度下EDP都比較小,這是因?yàn)檎麄€(gè)信號(hào)是按照窗口來(lái)處 理的,檢測(cè)到了一個(gè)窗口,則整個(gè)窗口中的信號(hào)都被檢測(cè)到,從而使得EDP比較小。應(yīng)用中 噪聲密度小時(shí),窗口大小一般取8-64,當(dāng)噪聲密度較大時(shí),窗口大小取4-16可以獲得較好 效果。附加的仿真實(shí)驗(yàn)表明,F(xiàn)RP和MRP與EDP和RDP有著內(nèi)在的聯(lián)系。EDP越大,檢測(cè) 到的信號(hào)中非脈沖噪聲所占的比例越小,在相同修復(fù)算法處理下,F(xiàn)RP越??;RDP越大,檢測(cè) 地越準(zhǔn)確,修復(fù)的脈沖噪聲數(shù)增加,MRP越??;所以在檢測(cè)和修復(fù)兩個(gè)過(guò)程中,檢測(cè)是關(guān)鍵。 根據(jù)(a)和(c)的實(shí)驗(yàn)結(jié)果,(b)和(d)分別為窗口大小取L = 14和L = 8時(shí)修復(fù)結(jié)果,過(guò) 濾系數(shù)kl從0到1依次變化,每次增加0. 1。其中,kl = 0時(shí)的指標(biāo)表示未加過(guò)濾系統(tǒng)的 中值濾波性能。從這兩幅圖中可明顯看出,kl = 0時(shí),修復(fù)性能很差,且隨kl的增大,F(xiàn)RP 不斷減小,MRP稍有增大,當(dāng)kl取為0. 8時(shí)FRP和MRP都比較小,可以取得很好的修復(fù)性能。 同時(shí)由(b)和(d)的比較可以得出,當(dāng)噪聲率為0.22%時(shí),成功修復(fù)比例大于94% (漏修 率約0.06);但當(dāng)噪聲率為6. 01%時(shí),成功修復(fù)比例僅有83%。實(shí)驗(yàn)發(fā)現(xiàn),在噪聲密度較大 時(shí),適當(dāng)修改參數(shù)再重復(fù)使用該方法可以獲得很好的修復(fù)效果(3次修復(fù)后成功修復(fù)比例 約達(dá)93%),同時(shí)引起信號(hào)的失真較小。該方法簡(jiǎn)單實(shí)用,且對(duì)含不同噪聲密度的脈沖信號(hào) 均有很好的處理效果,易于工程實(shí)現(xiàn)。
權(quán)利要求
一種歷史音頻噪聲檢測(cè)與消除方法,其特征是該方法包括如下步驟(1)聲音建模聲音信號(hào)可以用以下方法描述y(k)=x(k)+j(k)*d(k),其中,y(k)為被污染的帶噪信號(hào),x(k)為純凈信號(hào),j(k)*d(k)為噪聲部分,其中j(k)為標(biāo)志位,表示此處是否出現(xiàn)脈沖噪聲,d(k)表示脈沖噪聲的幅度值;(2)短時(shí)傅立葉變換和譜圖使用一個(gè)隨時(shí)間滑動(dòng)的分析窗對(duì)非平穩(wěn)信號(hào)進(jìn)行加窗截?cái)鄬⒎瞧椒€(wěn)信號(hào)分解成一系列近似平穩(wěn)的短時(shí)信號(hào),然后用傅立葉變換分析各短時(shí)平穩(wěn)信號(hào)的頻譜;(3)脈沖噪聲檢測(cè);(4)脈沖噪聲檢測(cè)性能分析;(5)信號(hào)的修復(fù)與重建;(6)實(shí)驗(yàn)結(jié)果與分析。
2.根據(jù)權(quán)利要求1所述的歷史音頻噪聲檢測(cè)與消除方法,其特征是所述的脈沖噪聲 的檢測(cè)包括(1)對(duì)帶噪信號(hào)進(jìn)行短時(shí)傅立葉變換,(2)在頻率域上應(yīng)用選擇標(biāo)準(zhǔn)檢測(cè)出含 脈沖噪聲的窗口,⑶根據(jù)時(shí)頻聯(lián)合域(n,co)返回信號(hào)在時(shí)域上的位置。
3.根據(jù)權(quán)利要求1所述的歷史音頻噪聲檢測(cè)與消除方法,其特征是所述的脈沖噪聲 檢測(cè)性能分析包括利用有效檢測(cè)率EDP和檢測(cè)成功率RDP,作為脈沖噪聲檢測(cè)過(guò)程的性能 評(píng)價(jià)指標(biāo),其中,EDP表示檢測(cè)的精確度;RDP反映檢測(cè)的準(zhǔn)確性,獲得最大的RDP是算法的 首要目標(biāo),EDP越大,則冗余度越小,RDP越大,檢測(cè)越準(zhǔn)確,檢測(cè)性能越好,對(duì)后面的修復(fù)和 重建越有利,二者是有內(nèi)在聯(lián)系的,RDP的基數(shù)是信號(hào)中的脈沖噪聲總數(shù),在選定處理對(duì)象 后它是個(gè)確定值,因此為了提高RDP必須放寬檢測(cè)標(biāo)準(zhǔn),使更多的噪聲信號(hào)落在所檢測(cè)的 窗口中,從而會(huì)降低EDP。
4.根據(jù)權(quán)利要求1所述的歷史音頻噪聲檢測(cè)與消除方法,其特征是所述的信號(hào)的修 復(fù)與重建包括(1)中值濾波及其改進(jìn),采取措施保留那些檢測(cè)到的、但非脈沖噪聲的聲音的細(xì)節(jié),改 進(jìn)了中值濾波,增加了一個(gè)可調(diào)系數(shù)的閾值過(guò)濾系統(tǒng)以減少信號(hào)的誤檢與失真,即當(dāng)信號(hào) 的采樣值與窗口的中值相差大于某個(gè)閾值時(shí)才用中值代替采樣值;(2)信號(hào)修復(fù)的實(shí)現(xiàn),利用聲音信號(hào)在時(shí)域上的連續(xù)性,將相鄰的兩個(gè)窗口進(jìn)行比較, 用前面沒(méi)有被噪聲信號(hào)污染過(guò)的純凈信號(hào)來(lái)修復(fù)后面的帶噪聲音,利用前一窗口純凈信號(hào) 的均值及最大值、最小值信息來(lái)設(shè)置一個(gè)帶通限制器,讓帶噪信號(hào)窗口通過(guò)此限制器,幅值 在這個(gè)限制器范圍內(nèi)的信號(hào)將被保留,在此范圍外的信號(hào)將被此限制器的邊界取代;(3)脈沖噪聲修復(fù)性能分析。
全文摘要
歷史音頻噪聲檢測(cè)與消除方法?,F(xiàn)有的歷史音頻噪聲消除方法復(fù)雜度較高且依賴于對(duì)模型系數(shù)預(yù)測(cè)的準(zhǔn)確性,算法復(fù)雜,效率低,且需要預(yù)先估計(jì)噪聲的統(tǒng)計(jì)特性。本發(fā)明方法包括(1)聲音建模聲音信號(hào)可以用以下方法描述y(k)=x(k)+j(k)*d(k),(2)短時(shí)傅立葉變換和譜圖使用一個(gè)隨時(shí)間滑動(dòng)的分析窗對(duì)非平穩(wěn)信號(hào)進(jìn)行加窗截?cái)鄬⒎瞧椒€(wěn)信號(hào)分解成一系列近似平穩(wěn)的短時(shí)信號(hào),然后用傅立葉變換分析各短時(shí)平穩(wěn)信號(hào)的頻譜;(3)脈沖噪聲檢測(cè);(4)脈沖噪聲檢測(cè)性能分析;(5)信號(hào)的修復(fù)與重建;(6)實(shí)驗(yàn)結(jié)果與分析。本發(fā)明用于去除音頻資料中的脈沖噪聲。
文檔編號(hào)G10L21/02GK101882442SQ20091007194
公開(kāi)日2010年11月10日 申請(qǐng)日期2009年5月4日 優(yōu)先權(quán)日2009年5月4日
發(fā)明者吳粵北, 張瀟, 朱俊敏, 王旌陽(yáng), 董笑菊, 袁征 申請(qǐng)人:上海音樂(lè)學(xué)院;上海交通大學(xué)