基于頻點(diǎn)修正的卷積盲源分離方法
【專利摘要】本發(fā)明請求保護(hù)一種基于頻點(diǎn)修正的卷積盲源分離方法,屬于信號處理技術(shù)領(lǐng)域。通過對源信號短時傅立葉變換(STFT)和相應(yīng)頻點(diǎn)分離信號做特性分析,找出各頻點(diǎn)間的相似性;然后,通過設(shè)立門限值來找到盲源分離錯誤的頻點(diǎn),再利用相鄰頻點(diǎn)處正確的分離信號對其進(jìn)行校正;最后將排序和修正后的信號逆變換,還原出分離信號。本方法可以在低信噪比的環(huán)境先分離出比較準(zhǔn)確地還原出語音信號,實際播放有良好的效果,從而對卷積盲源分離的研究具有重要意義。
【專利說明】
基于頻點(diǎn)修正的卷積盲源分離方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及語音信號處理,具體為一種基于頻點(diǎn)修正的卷積盲源分離問題。
【背景技術(shù)】
[0002] 盲源分離(BSS,blind source separation)是從混合方式未知的觀測信號中還原 出源信號的過程。到目前為止,盲源分離領(lǐng)域衍生出了很多分支,比如獨(dú)立和非獨(dú)立,線性 和非線性,欠定和非欠定,瞬時混合和卷積混合等,其中屬瞬時混合盲源分離算法的研究最 為成熟,并且盲源分離在通信、生物信號處理等領(lǐng)域中有很多潛在的應(yīng)用,例如噪聲的魯棒 識別和串聲分離。然而現(xiàn)實生活中信號常以卷積方式混合,尤其是在多徑環(huán)境影響的情況 下,瞬時混合只是卷積混合一種特殊的存在方式,因此卷積盲源分離的科學(xué)研究顯得十分 有必要。近年來,國內(nèi)外諸多學(xué)者對此做了大量研究,并且有了一定的成效,主要分為時域 方法和頻域方法。其中時域法是直接在時域從混合信號中求解源信號的方法,由于卷積模 型復(fù)雜,導(dǎo)致信號建模困難,計算量非常大,并且隨著卷積長度的增加,時域算法變得不穩(wěn) 定,效果不理想。而頻域法則是利用卷積混合信號頻域瞬時特性,把混合信號變換到頻域直 接利用成熟的BSS算法還原出源信號,由于該過程避免了卷積運(yùn)算,受卷積階數(shù)的影響小, 所以計算量比較小。但是,由于獨(dú)立成分分析固有的輸出順序不確定性和幅值不確定性問 題,直接導(dǎo)致了從頻域各頻點(diǎn)上的分離信號還原出錯誤的源信號。
[0003] 目前文獻(xiàn)針對語音信號的卷積盲源分離算法研究的文獻(xiàn)比較少,且集中在頻域 法方面。文獻(xiàn)"湯輝,王殊.基于穩(wěn)健聯(lián)合分塊對角化的卷積盲分離.自動化學(xué)報,2013",通 過對分離子信號相鄰頻段幅度相關(guān)系數(shù)大小估計來解決排序不確定性問題,但是由于頻點(diǎn) 處盲分離算法性能不穩(wěn)定,間接的影響該算法的穩(wěn)健性。文獻(xiàn)"薄祥雷,何怡剛,尹柏強(qiáng),等. 基于影響因子的頻域盲源分離排序算法.電子學(xué)報,2013"改進(jìn)了頻域幅度相關(guān)排序算法, 通過設(shè)定不同的影響因子來控制頻點(diǎn)距離和各頻點(diǎn)分離質(zhì)量對排序的影響,但是,該方法 需要了解源信號的先驗信息,并且對于不同的語音信號需要設(shè)立不同影響因子,影響因子 的不同直接導(dǎo)致該算法分離效果的差異。文獻(xiàn)"Ikram M Z,Morgan D R.Permutation inconsistency in blind speech separation: investigation and solutions. Speech and Audio Processing,IEEE Transactions on,2005"和文南犬"Clark F S P,Petraglia M R,Haddad D B.A New Initialization Method for Frequency-Domain Blind Source Separation Algorithms. IEEE Signal Processing Letters,2011"通過對各步頁點(diǎn)波達(dá)方 向角的估計來確定獨(dú)立分量所對應(yīng)的源信號,該方法首先需要對源信號的方位進(jìn)行估計, 計算量比較大,并且精度不足。文獻(xiàn)"Wang Lin,Ding Heping,Yin Fuliang.A Region-Growing Permutation Alignment Approach in Frequency-Domain Blind Source Separation of Speech Mixtures. IEEE Transactions on Audio Speech&Language Pr〇CeSSing,2011"利用每個頻點(diǎn)分離出的信號的能量比的相似系數(shù)把整個頻點(diǎn)劃分為多 個區(qū)域,然后逐個區(qū)域進(jìn)行排序校正。然而,真實的語音混合環(huán)境總是千變?nèi)f化的,并且在 多數(shù)情況下對源信號的先驗信息掌握不夠充分,因此,有必要對頻域盲分離算法做進(jìn)一步 研究,提出了基于頻點(diǎn)校正的語音信號的卷積盲源分離方法。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明所要解決的技術(shù)問題,針對頻域盲源分離排序算法中存在的單一頻點(diǎn)盲 分離錯誤引起的頻點(diǎn)反轉(zhuǎn)問題,提出一種頻點(diǎn)校正的排序算法,解決了語音信號卷積盲分 離的難題。該方法能夠精確的還原出原始的語音信號。在頻點(diǎn)校正的過程中采用相鄰點(diǎn)間 替代的方法能夠到達(dá)精確還原語音信號的目的。
[0005] 本發(fā)明解決上述技術(shù)問題的技術(shù)方案是:一種基于頻點(diǎn)校正的語音信號卷積盲源 分離算法。其步驟在于,首先通過對源信號短時傅立葉變換(STFT,short time Fourier transform)和相應(yīng)頻點(diǎn)分離信號做特性分析,找出各頻點(diǎn)間的相似性;然后,通過設(shè)立門限 值τ來找到盲源分離錯誤的頻點(diǎn),再利用相鄰頻點(diǎn)處正確的分離信號對其進(jìn)行校正;最后將 排序和修正后的信號逆變換,還原出分離信號。
[0006]典型的卷積盲分離模型可以寫成+巧的,其中S1U)是 未知源信號,hdl)表示從源信號i到達(dá)傳感器(接收點(diǎn)或觀察點(diǎn))j的沖激響應(yīng),nKt)表示 加性噪聲,一般是加性高斯白噪聲。通過對上面公式做STFT變換處理就可以得到其頻域的 單頻點(diǎn)模型為¥〇11,〇=1(〇乂(111,〇,其中乂(111,〇為第111幀數(shù)據(jù)混合信號的短時傅立葉變換, Y(m,f)為第m幀數(shù)據(jù)分離信號的短時傅立葉變換,W(f)為W ij(I)的短時傅立葉變換,fe[l, L],L為STFT變換點(diǎn)數(shù)。通過對單頻點(diǎn)信號X(m,f)的分析,得到了再利用BSS方法分離時有錯 誤的情況,以至于分利息效果不理想,為了解決這種問題,本發(fā)明改進(jìn)了幅度相關(guān)排序算 法,提出一種頻點(diǎn)修正的排序算法。該算法首先通過相似度檢測各頻點(diǎn)的分離信號的正確 性,然后用正確的相鄰頻點(diǎn)信號校正分離錯誤的頻點(diǎn),直到排序結(jié)束,最后,逆變換還原出 源信號。本文分析比較了傳統(tǒng)的排序算法,并且在不同環(huán)境下測試了兩種算法的性能,本 發(fā)明的方法性能從各個方面要優(yōu)于傳統(tǒng)的排序算法。
【附圖說明】
[0007] 圖1本發(fā)明卷積盲源分離頻域算法框架圖;
[0008] 圖2本發(fā)明STFT滑動窗函數(shù)示意圖;
[0009] 圖3本發(fā)明語音信號頻域相鄰頻點(diǎn)實部和虛部值;
[0010] 圖4本發(fā)明源語音信號的相鄰頻點(diǎn)間的相似系數(shù);
[0011 ]圖5本發(fā)明利用傳統(tǒng)相關(guān)排序算法在無噪聲的環(huán)境中分離效果;
[0012]圖6本發(fā)明在分離信號錯誤情況想的頻點(diǎn)間幅值相關(guān)系數(shù);
[0013]圖7本發(fā)明頻點(diǎn)校正排序方法基本框圖;
[0014] 圖8本發(fā)明與傳統(tǒng)方法分離效果對比圖;
[0015] 圖9本發(fā)明與傳統(tǒng)方法分離性能對比圖;
[0016] 圖10本發(fā)明衰減系數(shù)對不同信號分離性能效果對比圖
【具體實施方式】
[0017] 以下結(jié)合附圖和具體實例,對本發(fā)明的實施作進(jìn)一步的描述。
[0018] 圖1為本發(fā)明采用方法的具體流程框圖,具體步驟:首先對混合信號進(jìn)行STFT變 換,再對每個頻點(diǎn)下的信號做瞬時盲源分離,得到不同頻點(diǎn)下的分離信號,再用排序算法對 各個頻點(diǎn)的分離信號分類解決排序不確定性問題,再用幅值歸一化算法解決幅度不確定性 問題,最后逆變換還原出源信號,實現(xiàn)語音信號的卷積盲源分離。
[0019] 卷積混合盲源分離的目的是從未知卷積混合信號中將源信號恢復(fù)出來,設(shè)有N個 未知源信號si(t),i = l,. . .N,M個可觀察混合信號xj(t), j = l, . . .M,典型的卷積盲分離模 型可以寫成:
[0020]
(!)
[0021 ]其中hi j (1)表示從源信號i到達(dá)傳感器(接收點(diǎn)或觀察點(diǎn))j的沖激響應(yīng),nj (t)表示 加性噪聲,一般是加性高斯白噪聲。卷積盲源分離的目標(biāo)就是要找到一組分離濾波器Wlj (1),解卷積得到y(tǒng) i (t)。
[0022]
(-)
[0023]忽略噪聲影響,式(1)可以寫成:
[0024]
P)
[0025]由STFT變換到頻域單頻點(diǎn)的分離模型為:
[0026] Y(m,f)=ff(f)X(m,f) (4)
[0027] 其中X(m,f)為第m幀數(shù)據(jù)混合信號的短時傅立葉變換,Y(m,f)為第m幀數(shù)據(jù)分離信 號的短時傅立葉變換,W(f)為 Wij(1)的短時傅立葉變換,f e [ I,L],L為STFT變換點(diǎn)數(shù)。
[0028] 卷積盲分離問題由此轉(zhuǎn)化成了頻域瞬時盲源分離問題,所以式(4)的問題可以用 復(fù)數(shù)域的瞬時盲源分離算法解決,比如CFastICA、Jade算法,然而瞬時盲分離固有的排列不 確定性和輸出幅值不確定性存在于各個頻點(diǎn),其可以表示為:
[0029] Y(m,f)=ff(f)X(m,f) = Λ (f)D(f)S(m,f) (5)
[0030] 其中Λ (f)為對角矩陣,表示頻點(diǎn)f處的幅度不確定性問題,D(f)為置換矩陣,表示 頻點(diǎn)f處的幅值不確定性問題。所以,在頻域盲源分離算法中,有必要解決排列問題和幅值 不確定性問題,否則還原不出源信號。本文通過各頻點(diǎn)間的聯(lián)系來解決排列問題,幅值不確 定性問題可以由最,丨、生直準(zhǔn)0丨丨魅決;
[0031]
(6)
[0032] 其中WP(f)為經(jīng)過排序后的頻點(diǎn)f處的分離矩陣,,/(/)是^(〇的逆矩陣,diag (·)為取矩陣對角線上的元素,Ws(f)為處理了幅值不確定性問題后f頻點(diǎn)處的分離矩陣。 [0033]圖2為所示為STFT的滑動窗函數(shù)示意圖:
[0034] 語音信號是一種非平穩(wěn)信號,其又具有短時平穩(wěn)特性,而標(biāo)準(zhǔn)的傅立葉變換要求 信號是全局平穩(wěn),所以針對此問題有了分幀加窗的傅立葉變換,其定義式如下:
[0035]
(7)
[0036] 其中w( ·)為窗函數(shù),η是短時傅立葉變換點(diǎn)數(shù)。
[0037] 由圖2可以看出,窗函數(shù)w(k-m)和w(k-m+l)對于x(m)信息的截取是比較相近的,尤 其是在STFT點(diǎn)數(shù)比較多的情況下,相鄰的頻點(diǎn)包含的信息越相近。以采樣率為8000,信號長 度為20000的一段語音信號為例,對其分別做不同點(diǎn)數(shù)的STFT變換,窗函數(shù)為64為長度的 harming窗,分別取一些相鄰頻點(diǎn)信號的實部與虛部進(jìn)行觀察如圖3所示。
[0038] 圖3所示為相鄰頻點(diǎn)間的實部和虛部值,可以看出相鄰頻點(diǎn)處信息的實部和虛部 的輪廓非常相似,因此可以對不同信號各相鄰頻點(diǎn)間的特性進(jìn)行做相關(guān)度測試,所以定義:
[0039]
[0040] (9)
[0041] 其中V1(Hij)第i個信號的第m幀數(shù)據(jù)頻域f頻點(diǎn)處信號的幅值,T為數(shù)據(jù)的幀數(shù),Plj 為信號i和信號j之間的相關(guān)度。
[0042] 圖4為相鄰頻點(diǎn)間信號的相似系數(shù),其可以看出同一信號相鄰頻點(diǎn)之間的相似度 非常高,而兩個不同信號之頻點(diǎn)間的相似度明顯要低于同一信號頻點(diǎn)之間的相似度。因此, 在頻域分離出來的信號也會在一定程度上繼承這一特點(diǎn),所以可以利用頻點(diǎn)間的相似性, 解決盲分離的排列不確定性問題。
[0043] 由上面的推導(dǎo)可知,利用頻點(diǎn)間的相關(guān)性解決排序問題具有一定的可行性,通過 對各頻點(diǎn)間包絡(luò)相關(guān)性大小的比較可以對分離信號區(qū)分,將其統(tǒng)一歸類。以兩路混合信號 為例,定義比較系數(shù)λ為:
[0044] (10)
[0045] (1Π
[0046] 如果λ>1則輸出順序正確,不需要重新排列,其中Y1(Hij)為頻點(diǎn)f處的第i路分離 信號。
[0047] 本文瞬時盲分離算法采用復(fù)數(shù)域的聯(lián)合對角化(JADE)算法,其代價函數(shù)為:
[0048] (12)
[0049]
[0050] 其中Qx(D)為觀測矩陣的四階累計量,Qs(D)為源信號的四階累積量,D為任意nXn 矩陣,U為酉變換矩陣, 〇ff( ·)為非對角元素的平方和,U1為U矩陣的第i列,通過最小化白 化信號四階統(tǒng)計量的非對角元素來求解酉矩陣U,再通過矩陣U估計出源信號。
[0051] 混合信道采用模擬高斯信道,多徑衰減系數(shù)為〇,H(k)為一個2 X 2信道指數(shù)矩陣, hdk)為k徑中第i個發(fā)射器到第j個接受器上的信道指數(shù),其產(chǎn)生方式如下:
[0052]
(14)
[0053]圖5為采用兩路聲音對算法做測試,其中多徑衰減系數(shù)〇 = 0.8,模擬卷積階數(shù)為20 階分離效果圖。由其可知通過相鄰頻點(diǎn)間的相關(guān)度來解決排序問題具有可行性,但是,對于 比較復(fù)雜的語音信號而言,頻域的復(fù)數(shù)盲分離算法并不能保證每個頻點(diǎn)分離結(jié)果的正確 性,由此,對于那些分離效果不理想的頻點(diǎn),其分離結(jié)果有可能會導(dǎo)致相鄰頻點(diǎn)相關(guān)度與 源信號同頻點(diǎn)的相關(guān)度有許多差異,并且此排序算法是通過相鄰頻點(diǎn)逐次排序的,所以會 造成由幾個頻點(diǎn)錯誤引起整體排序錯亂的情況,最后得到的分離信號與源信號相比,還原 的精度不高,甚至直接導(dǎo)致還原出錯亂的信號,其中錯誤情況中相鄰頻點(diǎn)間的相關(guān)度一種 情況如圖6所示。
[0054]圖6為在分離信號錯誤情況想的頻點(diǎn)間幅值相關(guān)系數(shù),在STFT變換頻點(diǎn)數(shù)為1024 個點(diǎn)的情況下,有許多個點(diǎn)的幅值相關(guān)度值發(fā)生了異變,并在一段頻點(diǎn)內(nèi)相關(guān)度值都比較 小,這正是由頻點(diǎn)處盲源分離輸出錯誤引起的連鎖反應(yīng),因此,分離效果的正確性直接與每 個頻點(diǎn)輸出排列順序有關(guān)。
[0055] 基于上面的分析可知,相鄰頻點(diǎn)間相關(guān)排序法確實在一定程度上能解決排序問 題,但是其也存在許多不足,特別是對于瞬時盲分離算法精度不足所引起的排序錯亂的情 況,針對此問題,本文提出一個頻點(diǎn)校正的方法,改進(jìn)的算法框圖如下圖7所示。
[0056] 圖7本發(fā)明頻點(diǎn)校正排序方法基本框圖,該算法是基于相鄰頻點(diǎn)間幅度相關(guān)排序 的改進(jìn)算法,其中心思想是在對各頻點(diǎn)進(jìn)行排序的時候先通過相關(guān)系數(shù)值來確認(rèn)頻域盲分 離算法分離的結(jié)果的正確性,由于相鄰頻點(diǎn)的分離信號有非常大的相似度,因此可以用前 一個頻點(diǎn)排序好的分離信號來近似替代當(dāng)前頻點(diǎn)分離效果差的信號,然后重復(fù)以上算法, 直到排序結(jié)束。
[0057]定義相關(guān)度門限值τ如下:
[0058] τ = min(0.7,0.8xp..1:!K(a)) (15)
[0059] 其中Am⑷為前d個已排序好的頻點(diǎn)的最大相關(guān)度Pmax=max (Pi j)的平均值,當(dāng)當(dāng) 前頻點(diǎn)的最大相關(guān)度Pmax和次大相關(guān)度P_x小于α?xí)r,則認(rèn)為該頻點(diǎn)的盲分離算法分離結(jié)果 不準(zhǔn)確,然后用上一個頻點(diǎn)處的分離結(jié)果來代替當(dāng)前頻點(diǎn)的分離值。
[0060] 綜上所述,本專利算法具體實現(xiàn)流程描述:
[0061 ] 1、分別對X1 (t),X2 (t)做L點(diǎn)長度的STFT變換,得到X1 (m,f),X2 (m,f);
[0062] 2、從€=1^(〇 = [乂1011,032(111,0],用復(fù)數(shù)域盲分離算法對乂(€)做盲源分離, 得到冊,/),冊,/);
[0063] 3、從f = 2開始,按式(9)計算Pij,然后找到最大相關(guān)度iw和次大相關(guān)度Ρ_χ,通過 對比門限τ值來判斷是否盲分離算法分離正確,得到ΥΚπι,?Ο,ΥΚπι,?·),如果小于門限值則用 前一個頻點(diǎn)的分離結(jié)果代替,如果大于門限值則轉(zhuǎn)到步驟5;
[0064] 4、計算出λ值,如果λ>1則不需要變換該頻點(diǎn)分離結(jié)果的順序,反之對調(diào)相應(yīng)頻點(diǎn) 分離結(jié)果的位置,再令f = 3,轉(zhuǎn)到步驟4;
[0065] 5、當(dāng)f = L時,整個排序過程結(jié)束,用式(6)對每個頻點(diǎn)進(jìn)行幅值處理;
[0066] 6、把整個頻點(diǎn)f = I: L看成一個整體,然后進(jìn)行ISTFT變換得到分離信號yi(t),y2 (t)〇
[0067] 圖8所示本發(fā)明與傳統(tǒng)方法分離效果對比圖,圖9所示為本發(fā)明與傳統(tǒng)方法分離性 能對比圖。語音信號盲分離通常利用客觀評價標(biāo)準(zhǔn),即盲源分離工具箱(Blind Source Separation Evaluation,BSS_EV AL)來判定改進(jìn)算法的性能。將分離得到的估計信號 分解為式(16)所示的四個部分,其中Starge3t(t)表示估計信號中屬于源信號的部分,稱為正 面貢獻(xiàn),e int(3rf(t)表示估計信號中不符合源信號的,但屬于混合信號的部分,是由其它信號 源引起的估計誤差,e ncilSf3(t)表示觀測噪聲干擾誤差,eartlf(t)表示由于算法產(chǎn)生的系統(tǒng)噪 聲誤差,
[0068] (16)
[0069]由亍本文沒W考慮十杌噪戸的影啊,所以enciise(t)為零,所以可以得到三個性能參 數(shù),分別為信號偏差(3〇11;1^6-1:〇-0丨81:〇1'1:;[0111^1:;[0,30 10,信號干擾比(3011;1^6-1:0-Interference Ratio,SIR),系統(tǒng)誤差比(Source-to-Artifacts Ratio,SAR)如式(17)、式 (18)、式(19)所示,三個性能參數(shù)值越高表示分離效果越好。
[0070] (17)
[0071] (18)
[0072] (卜))
[0073]
[0074] (20)
[0075] 其中N為源信號數(shù)目,SIRk為第k路信號的輸出信號干擾比。
[0076]可以看出經(jīng)過頻點(diǎn)校正過后還原出的信號較單純用相關(guān)排序法還原出來的信號 整體要平滑一些,并且毛刺較少。從圖9可以看出,改進(jìn)的算法在分離信號各指標(biāo)上也有提 升,具體在分離信號1上SDR、SIR、SAR分別有0.66dB、0.9dB、0.8dB的性能提升,在分離信號2 上分別有〇. 5dB、0.5dB、0.8dB的性能提升,而整個算法在平均信道干擾比(I)上有0.7dB 的性能提升,從而驗證了本文算法的有效性,并且在一定的性能指標(biāo)上本文算法要優(yōu)于傳 統(tǒng)算法,從SAR,SDR,SIR的指標(biāo)上可以看出,改進(jìn)算法的分離效果和分離質(zhì)量都要比傳統(tǒng)方 法好。
[0077]圖10本發(fā)明衰減系數(shù)對不同信號分離性能效果對比圖,可以看出衰減系數(shù)σ的增 加對于算法的分離性能起著反作用,無論是對于傳統(tǒng)方法,還是對于改進(jìn)算法,衰減系數(shù) 越高則分離效果越差,10(a)可以看出經(jīng)過頻點(diǎn)校正后的分離信號較傳統(tǒng)的算法在衰減系 數(shù)的變換下有〇.3dB到0.9dB的性能的提升;并且,對比于10(b)可以得到,本文算法在兩個 源信號有一定相似度的情況下分離性能和傳統(tǒng)方法性能基本一致,說明了源信號的相似性 對本文提出的方法有一定的影響。
【主權(quán)項】
1. 一種基于頻點(diǎn)修正的卷積盲源分離方法,其步驟在于W頻域各相鄰點(diǎn)間的相似系數(shù) 化J作參考,設(shè)立一個口限值r = min(0.7,0.8x只來篩選分離結(jié)果錯誤的頻點(diǎn),然后利用 頻域各頻點(diǎn)間的相似性利用相隔比較近的頻點(diǎn)上的分離信號來替換鄰近錯誤的頻點(diǎn),W此 來達(dá)到頻點(diǎn)修正的目的。最后再利用相關(guān)排序算法來糾正整個頻點(diǎn),逆變換還原出原始信 號。2. 根據(jù)權(quán)利1的要求所述的修正方法,其特征在于采用頻域相鄰頻點(diǎn)間的相似性,設(shè)置 一個合理的口限值r = min(0.7,0.8x兒來篩選出錯誤信號的頻點(diǎn),對于口限值τ的選 擇,是在不同條件下的實驗結(jié)果得出,然后再利用相鄰頻點(diǎn)替換的方法修正錯誤頻點(diǎn)的信 號。
【文檔編號】G10L21/0232GK105845148SQ201610149053
【公開日】2016年8月10日
【申請日】2016年3月16日
【發(fā)明人】張?zhí)祢U, 歐旭東, 張世會, 張剛, 羅忠濤
【申請人】重慶郵電大學(xué)