專利名稱:使用多重解相關(guān)方法的卷積盲源分隔的制作方法
本申請要求1998年4月8日申請的序號為60/081,101的美國臨時申請的權(quán)益,現(xiàn)將這一申請并入此處以做參考。
本發(fā)明涉及信號處理,更具體地說,本發(fā)明涉及一種用于實現(xiàn)信號分隔的方法與裝置,這一方法與裝置使用了一種多重解相關(guān)技術(shù)。
本發(fā)明的背景最近,越來越多的研究人員發(fā)表了可實現(xiàn)盲源分隔(BSS)的技術(shù),即能夠把一個合成信號分隔成其構(gòu)成成分信號,而無需對這些信號的先前知識加以了解的技術(shù)。這些技術(shù)已應(yīng)用于各種應(yīng)用,例如,使用多個麥克風(fēng)的語音檢測、多通道通信中的串音消除、多路徑通道識別與均衡化、聲吶陣列中的到達方向(DOA)估計、針對音頻和無源聲吶的聚束麥克風(fēng)的改進、以及在各種生物信號(例如EEG、MEG等)中的獨立源信號的發(fā)現(xiàn)。許多BSS技術(shù)要求(或假定)成分信號之間的一個統(tǒng)計上的相關(guān)性,以精確地分隔這些信號。信號制模中的更多的理論上的發(fā)展生成了一些新的技術(shù),這些技術(shù)可解決統(tǒng)計地標識獨立信號的問題—一個處于源分隔核心的一個問題。
通過假定ds統(tǒng)計上獨立的源 s(t)= 對基本的源分隔問題簡單地加以描述,其中,這些統(tǒng)計上獨立的源在一個導(dǎo)向dx傳感器信號x(t)= (可能包括附加的傳感器噪音n(t))的線性媒介上進行卷積并混合在一起。在時間域中,卷積的、含有噪音的信號由下列方程(叫做正向模型)x(t)=Σr=0pA(τ)s(t-τ)+n(t)---(1)]]>加以表示。源分隔技術(shù)用于標識通道A的dxdsP系數(shù),并最終用于確定一個針對未知源信號的估計 (t)。
另外,也可以使用由下列方程(叫做反向模型)u(t)=Σr=0QW(τ)x(t-τ)---(2)]]>表示的一個有限的沖激響應(yīng)(FIR)對卷積的信號加以過濾。
在這一表示中,一個BSS技術(shù)必須估價FIR反向成分W,以至于模型源信號u(t)= 在統(tǒng)計上是獨立的。
在Weinsteinetal的″通過解相關(guān)實現(xiàn)多通道信號分隔″(IEEE TransactiononSpeechandAudioProcessing,1993年,卷1,4號,405~413頁)中討論過的在統(tǒng)計上獨立的條件下一個實現(xiàn)源分隔的方案中,對于非穩(wěn)定信號,規(guī)定了一組二階條件,這些條件唯一地確定了正向模式中的參數(shù)A。然而,沒有用于基于Weinsteinetal的論文中所給定的非穩(wěn)定性實現(xiàn)源分隔的具體算法。
在信號處理領(lǐng)域,早期的工作一直建議解相關(guān)所測量的信號,即針對多個時間延遲對角線化所測量的相關(guān)性。對于一個即時混合(也叫做恒定增益情況),已證明對于非-白信號,使用多個過濾器抽頭解相關(guān)足以恢復(fù)源信號。但對于卷積混合的寬帶信號來說,這一技術(shù)不能產(chǎn)生一個唯一的方案,而且事實上,可能生成被解相關(guān)的,而且在統(tǒng)計上獨立的源估計。如本論文以上所引用的Weinsteinetal先前所標識的,為了發(fā)現(xiàn)統(tǒng)計上獨立的源信號,必須捕獲二階以上的統(tǒng)計,因為統(tǒng)計上的獨立不僅要求二階而且要求所有更高的交叉時刻消失。
在卷積的情況下,Yellin和Weinstein在″多通道信號分隔方法與分析″(IEEE TransactiononSignalProcessing,44卷1號,106~118頁,1996年1月)中,建立了關(guān)于允許卷積串音消除的更高階的多抽頭交叉時刻條件。盡管優(yōu)化準則自然地擴展到更高的維度,但先前的研究一直集中在二維的情況,因為多通道FIR模型(參見方程2)可以通過一個適當選擇的體系結(jié)構(gòu)(使用了估計的正向過濾器)加以反轉(zhuǎn)。到目前為止,對于更高的維度,一直未能找到正向模型的一個穩(wěn)定的近似。
一般情況下,這些事前技術(shù)能夠以計算機仿真的形式令人滿意地加以操作,但對于實際的信號(例如音頻信號)不能很好加以實現(xiàn)。人們可能推測實際信號的信號密度可能不具有這些假設(shè)的結(jié)構(gòu),較高階的統(tǒng)計可能導(dǎo)致估價的不穩(wěn)定,或信號穩(wěn)定性條件的一個違例可能導(dǎo)致不精確的方案。
因此,在這一技術(shù)中存在著對能夠精確地實現(xiàn)卷積信號解相關(guān)的盲源分隔技術(shù)的需求。
本發(fā)明的概述事前技術(shù)的缺點可通過使用卷積信號解相關(guān)實現(xiàn)盲源分隔的一種方法和裝置加以克服(通過同時在多個時間周期對角線化二階統(tǒng)計)。更具體地說,本發(fā)明累積一定長度(一段)的輸入信號,這一輸入信號包括獨立信號源的一個混合。然后,本發(fā)明把這段輸入信號劃分成一系列T-長度周期(窗口),并在每一T-長度周期上的混合信號上執(zhí)行一個離散的傅里葉變換(DFT)。此后,本發(fā)明計算K個互相關(guān)功率譜,在N個T-長度周期上每一個功率譜是平均的。使用互相關(guān)的功率值,一個梯度下降處理計算一個FIR過濾器的系數(shù),這一過濾器將通過同時解相關(guān)K個互相關(guān)的功率譜,有效分隔輸入信號中的源信號。為了實現(xiàn)一個精確的方案,對梯度下降處理加以限制,其中,過濾器系數(shù)的時間-域值僅可達到某些值,即把T-長度周期中的時間-域過濾器系數(shù)值W(τ)限制為對于任何τ>Q<<T,為0。在這一方式中,所謂的″置換問題″得以解決,而且針對FIR過濾器系數(shù)計算一個唯一的方案,以致于使用這些系數(shù)所產(chǎn)生的一個過濾器將有效分隔源信號。
一般情況下,可把本發(fā)明作為一個軟件程序加以實現(xiàn),這一程序存儲在一個存儲媒介中,并在一個通用計算機系統(tǒng)上加以執(zhí)行。然而,根據(jù)以下的詳細描述,一個硬件實現(xiàn)將是十分顯然的。
本發(fā)明可作為用于解相關(guān)來自不同源的一個信號處理器系統(tǒng),在話音識別系統(tǒng)中得以應(yīng)用,以致于一個話音識別處理器可以利用由本發(fā)明所分隔的各種話音信號。然后,在響應(yīng)話音信號的過程中,話音識別處理器可以產(chǎn)生計算機命令或計算機文本。
對附圖的簡要描述結(jié)合附圖,并考察以下的詳細描述,本發(fā)明的技術(shù)可以很容易地加以理解。其中
圖1描述了一個用于執(zhí)行本發(fā)明的一個軟件實現(xiàn)的系統(tǒng);圖2是本發(fā)明的一個方法的流程圖;圖3描述了本發(fā)明所生成的過濾器系數(shù)的一個頻率域圖。
圖4描述了本發(fā)明所生成的過濾器系數(shù)的一個時間域圖。
為了更好地加以理解,凡是在可能的地方,本申請使用了一致的參照數(shù)字,以指示對于這些圖來說是公共的元素。
詳細描述本發(fā)明針對方程2的反向模式估價參數(shù)W的值,估價處理假定源信號是非穩(wěn)定的,并使用了一個最小平方(LS)優(yōu)化,以估計W以及信號和噪音功率。本發(fā)明把源分隔問題轉(zhuǎn)換到頻率域,并針對每一頻率同時解決一個源分隔問題。
圖1描述了一個用于實現(xiàn)本發(fā)明的源分隔方法的系統(tǒng)100。系統(tǒng)100包括一個卷積的信號源126(提供了將要被分隔成其構(gòu)成信號的信號)以及一個計算機系統(tǒng)108(執(zhí)行本發(fā)明的多重解相關(guān)程序124)。源126可以包含任何卷積信號源,但圖中僅例證性地加以描述,它包含一個傳感器陣列102、一個信號處理器104以及一個所記錄的信號源106。傳感器陣列包含一個或多個轉(zhuǎn)換裝置102A、102B、102C(例如麥克風(fēng))。轉(zhuǎn)換裝置連接于一個執(zhí)行信號數(shù)字化的信號處理器104。一個數(shù)字信號連接于計算機系統(tǒng)108,用于信號分隔和進一步的處理。一個所記錄的信號源106可以有選擇地形成需要加以分隔的卷積的信號的一個源。
計算機系統(tǒng)108包括一個中央處理器(CPU)114、一個內(nèi)存122、支持電路116、以及一個輸入/輸出(I/O)接口120。一般情況下,計算機系統(tǒng)108通過I/O接口120連接于一臺顯示器112和各種輸入設(shè)備110(例如一個鼠標和鍵盤)。支持電路通常包含人們所熟悉的電路,例如超高速緩存、電源供給裝置、時鐘電路、一條通信總線等。內(nèi)存122可以包括隨機存取內(nèi)存(RAM)、只讀內(nèi)存(ROM)、磁盤驅(qū)動器、磁帶驅(qū)動器等,或內(nèi)存設(shè)備的某種組合。把本發(fā)明作為多重解相關(guān)程序124加以實現(xiàn),這一程序存儲在內(nèi)存122中,并由CPU114加以執(zhí)行,以處理來自信號源126的信號。因此,計算機系統(tǒng)108是一個通用計算機系統(tǒng),當執(zhí)行本發(fā)明的程序124時,變成一個專用計算機系統(tǒng)。盡管把一個通用計算機系統(tǒng)例證性地說明為一個用于實現(xiàn)本發(fā)明的平臺,但那些熟悉這一技術(shù)的人將認識到本發(fā)明也可以用硬件加以實現(xiàn),即作為一個面向具體應(yīng)用的集成電路(ASIC)、一個數(shù)字信號處理(DSP)集成電路或其它一個或多個硬件設(shè)備加以實現(xiàn)。因此,本發(fā)明可以用軟件、硬件或軟件與硬件的一個組合加以實現(xiàn)。
用作說明的計算機系統(tǒng)108還包括語音識別處理器118(例如一個語音識別電路卡或一個語音識別軟件),這一處理器將用于處理本發(fā)明從卷積信號中抽取的成分信號。因此,可以使用多個麥克風(fēng)102對一個擁有許多正在講話的人以及背景噪音的會議室加以監(jiān)視。麥克風(fēng)102產(chǎn)生一個合成語音信號,如果把一個語音識別系統(tǒng)用于把每一個人的語音轉(zhuǎn)換成計算機文本或計算機命令,那么需要把這一個合成語音信號分隔成成分信號。信號處理器104對合成語音信號進行過濾、放大、以及數(shù)字化,并連接于計算機系統(tǒng)108。CPU114(執(zhí)行多重解相關(guān)程序124)把合成信號分隔成其成分信號。從這些構(gòu)成成份中,可以很容易地把背景噪音加以消除。然后把無噪音的構(gòu)成成分連接于語音識別處理器118,以把成分信號處理成計算機文本或計算機命令。在這一方式中,計算機系統(tǒng)108在執(zhí)行多重解相關(guān)程序124的同時,針對語音識別處理器118執(zhí)行信號預(yù)處理或調(diào)節(jié)。
圖2描述了本發(fā)明的多重解相關(guān)程序124的一個流程圖。在步驟200處,輸入卷積的(混合的)信號,對這一信號進行解析,即解析成一系列含有輸入信號X(t)的T-樣本的窗口,該程序針對每一窗口X(t)產(chǎn)生一個離散的傅里葉變換(DFT)值,即針對長度T樣本的每一個窗口產(chǎn)生一個DFT值。
在步驟202處,程序124使用DFT值累加K個互相關(guān)功率譜,其中K個功率譜中的每一個在N個長度T樣本的窗口上進行平均。
對于非穩(wěn)定信號,互相關(guān)估計將依賴于絕對時間,而且從一個估計段(一個NT周期)到下一個估計段將很不相同。把步驟204中所計算的互相關(guān)估計表示為R^x(t,v)=1NΣn=0N-1x(t+nT,v)xT(t+nT,v)---(5)]]>其中X(t+nT,ν)=FFT X(t+nT)X(t)=[x(t)-x(t+T-1)],X(v)是一個含有T個樣本的一個窗口內(nèi)的輸入信號的FFT。照此,在步驟204,該程序計算一個針對每一時間t和每一頻率υ的矩陣,然后把所有矩陣元素與每一其它矩陣元素相加。步驟206、208、210以及212在n=0~N與k=0~K上迭代步驟204的相關(guān)估計,以產(chǎn)生K個頻譜。
然后,可以把方程5簡化成一個矩陣表示R^x(t,v)=A(v)Λs(t,v)AH(v)+Λn(t,v)---(6)]]>如果N足夠大,可把Λs(t,υ)和Λn(t,υ)模制成一個對角線矩陣,因為假設(shè)信號是獨立的。對于將針對不同時間成為線性獨立的方程6來說,Λs(t,υ)將必須隨時間變化,即信號是非穩(wěn)定的。
使用方程6的互相關(guān)估計,本發(fā)明使用了滿足下列方程Λs(t,v)=W(v)(R^x(t,v)-Λn(t,v))WH(v)---(7)]]>的″交叉功率譜″計算源信號。
為了針對每一時間周期獲得獨立條件,通常把時間周期選擇成擁有針對 (tk,υ),即tk=kTN的非重疊估計的次數(shù)。但如果信號變化得足夠快,可能會對重疊估計次數(shù)加以利用。進而,盡管一般情況下窗口T是順序化的,但窗口也可以互相重疊,以致于可從也包含于先前窗口的信號信息推導(dǎo)出每一DFT值。在一個音頻信號處理系統(tǒng)中,基于對信號加以記錄的房間的房間音響效果,對T的具體值進行選擇。例如,一個具有有許多回響路徑的大房間需要一個長的窗口T,以致于本發(fā)明可以處理大量信號信息,以實現(xiàn)源信號分隔。一般情況下,N的值是根據(jù)可用于處理的數(shù)據(jù)的數(shù)據(jù)量所決定的,通常的值為N=20,T=1024個樣本以及K=5。
本發(fā)明的方法計算一個多路徑通道W(即一個多維FIR過濾器的抽頭值),對于K個估計周期(例如用于處理音頻信號的2~5個估計周期),多路徑通道W同時滿足方程7。在步驟214、216、218執(zhí)行這樣的一個處理(這些步驟共同構(gòu)成一個過濾器參數(shù)估計處理224),并使用一個如下的最小平方估計處理加以表示W(wǎng)^,Λ^s,Λ^n=argminW(τ)=0.τ>QWii(v)=1W,Λs,ΛnΣv=1TΣk=1K||E(k,v)||2]]>
其中E(k,v)=W(v)(R^x(k,v)-Λn(k,v))WH(v)-Λs(k,v)]]>(8)為了加以簡化,在方程8中使用了一個短形式的名稱,其中,Λs(k,ν)=Λs(tk,ν)和Λs= 。同樣的簡化表示也施用于Λn(t,υ)和Rx(t,υ)。
為了產(chǎn)生參數(shù)W,使用了一個梯度下降處理224(包含步驟214、216、218以及220)。當對費用函數(shù)(8)進行最小化時,該處理迭代W的值。在步驟216中,把W更新為Wnew=Wold-μwE,其中wE是梯度步長值,μ是一個控制更新大小的加權(quán)常數(shù)。更具體地說,梯度下降處理決定著梯度值,如下σ^E∂W*(v)=Σk=1KE(k,v)W(v)BH(k,v)---(10)]]>σ^E∂Λ^s*(k)=-diag(E(k,v))---(11)]]>σ^E∂Λ^n*(k)=-diag(WH(v)E(k,v)W(v))---(12)]]>B(k,v)≡R^x(k,v)-Λn(k,v)---(13)]]>由于方程11等于0,程序可以針對參數(shù)Λs(k,υ)顯式地求解,而參數(shù)Λn(k,υ)和W(υ)是使用一個梯度下降規(guī)則計算的,例如Λs(k,υ)和W(υ)的新值是利用每一個通過該程序加以計算的,直至W(υ)的新值完全不同于W(υ)的舊值時,即W為收斂時。
注意,方程8包含在時間域中對過濾器規(guī)格的一個附加的限制。受這一限制似乎不同的頻率υ=1,…,T代表了不相關(guān)的問題。然而,方案W(υ)受限于那些響應(yīng)時間沒有超過τ>Q<<T范圍的過濾器。該程序使用Qdsdx參數(shù)W(τ)有效地參數(shù)化W(υ)中的Tdsdx過濾器系數(shù)。在實踐中,在步驟214,W的值產(chǎn)生于頻率域中,例如W(υ),然后于步驟218,在這些頻率域值上執(zhí)行一個FFT,以把W(υ)的值轉(zhuǎn)換到時間域,例如W(τ)。在時間域中,把任何出現(xiàn)在一個大于時間Q的時間的W值設(shè)置成O,并且不對低于Q的范圍中的所有值加以調(diào)整。然后,使用一個逆FFT把所調(diào)整的時間域值轉(zhuǎn)換回頻率域。通過在時間域中(針對所有大于Q的時間)零化過濾器的響應(yīng),對過濾器的頻率響應(yīng)加以平滑,以致于在每一頻率上的一個唯一的方案很容易得以確定。
圖3描述了兩個頻率響應(yīng)302A和302B。圖4描述了它們的相應(yīng)的時間域響應(yīng)304A和304B。使用在步驟224執(zhí)行的一個梯度下降處理,找出針對系數(shù)的最小平方方案,以致于可使用一個迭代方案確定W的正確的值。一旦方程10中的梯度變成″平坦的″,如在步驟220中所標識的,則在步驟222,該程序把計算過的過濾器系數(shù)施用于一個FIR過濾器。按長度,在時間周期KNT中,F(xiàn)IR過濾器用于過濾輸入(混合的)信號x(t)的樣本。在步驟226,F(xiàn)IR過濾器生成混合信號的解相關(guān)的成分信號。接下來,在步驟228,該程序得到用于處理的樣本的下一個KNT數(shù),并前進到步驟200,以過濾下面的KNT個樣本。把先前的KNT個樣本從內(nèi)存中移去。
如上所述,對于τ>Q<<T,令W(τ)=0來對梯度方程加以限制,以使其保持在所允許的方案子空間中。這一點是十分重要的,因為方程8要想達到一個好的近似,這是一個必要的條件。
在實際的應(yīng)用(例如話音識別信號預(yù)處理)中,本發(fā)明的程序大大改進了話音識別的精度,即單詞出錯率減少了5~50%。在某一實例方案中,當無噪音出現(xiàn)時,這樣的出錯率是可以實現(xiàn)的。當把一個所希望的話音信號與音樂或另一個話音信號作為背景噪音相結(jié)合時,可以看到這一出錯率的改進。
盡管此處已給出了并入了本發(fā)明的技術(shù)的各種實施例,并進行了詳細的描述,但那些熟悉這一技術(shù)的人可以很容易地設(shè)計出許多其它也并入了這些技術(shù)的不同的實施例。
權(quán)利要求
1.一種用于把一個混合的信號分隔成一系列成分信號的方法,該方法包括下列步驟(a)產(chǎn)生一系列離散的傅里葉變換(DFT)值,針對上述混合信號的每一個T樣本產(chǎn)生一個DFT值;(b)產(chǎn)生一個互相關(guān)的估計矩陣,在N個DFT值上這一矩陣是平均的;(c)重復(fù)步驟(b)K次,以產(chǎn)生一系列互相關(guān)的估計值;(d)使用一個梯度下降處理計算一系列過濾器系數(shù),這些系數(shù)用于使用互相關(guān)估計值的一個有限的沖激響應(yīng)(FIR)過濾器;以及(e)使用一個擁有已計算出的過濾器系數(shù)的FIR過濾器過濾混合的信號,以把混合的信號分隔成一系列成分信號。
2.權(quán)力要求1中的方法,其中步驟(d)還包括如下步驟(d1)把來自頻率域的過濾器系數(shù)轉(zhuǎn)換到時間域;(d2)針對任何大于一個預(yù)定時間Q的時間,零化任何擁有一個非零值的過濾器系數(shù),以產(chǎn)生可調(diào)的時間域過濾器系數(shù),其中Q小于T;以及(d3)把來自時間域的可調(diào)整的時間域過濾器系數(shù)轉(zhuǎn)換到頻率域,以產(chǎn)生在梯度下降處理中所使用的過濾器系數(shù)。
3.權(quán)力要求1中的方法,其中互相關(guān)的估計值是在步驟(b)使用下列方程產(chǎn)生的R^x(t,v)=1NΣn=0N-1x(t+nT,v)xT(t+nT,v)]]>其中X(t,υ)是頻率域中的混合的信號。
4.權(quán)力要求3中的方法,其中梯度下降處理最小化函數(shù)Σv=1TΣk=1K||E(k,v)||2]]>其中,E(k,υ)是一個誤差函數(shù)。
5.用于把一個混合的信號分隔成一系列成分信號的裝置,該裝置包括用于產(chǎn)生一系列離散的傅里葉變換(DFT)值的裝置,針對上述混合信號的每一個T樣本產(chǎn)生一個DFT值;用于使用DFT值產(chǎn)生一系列互相關(guān)估計值的裝置;用于計算一系列過濾器系數(shù)的梯度下降處理器,其中過濾器系數(shù)用于使用互相關(guān)的估計值的一個有限的沖激響應(yīng)(FIR)過濾器;以及使用具有已計算出的過濾器系數(shù)的FIR過濾器過濾混合信號的過濾器,以把混合的信號分隔成一系列成分信號。
6.權(quán)力要求5中的裝置,其中梯度下降處理器還包括一個用于把來自頻率域的過濾器系數(shù)轉(zhuǎn)換到時間域的第一轉(zhuǎn)換器;用于針對任何大于一個預(yù)定時間Q的時間零化任何擁有一個非零值的過濾器系數(shù)以產(chǎn)生可調(diào)的時間域過濾器系數(shù)的裝置,其中Q小于T;以及一個用于把來自時間域的可調(diào)整的時間域過濾器系數(shù)轉(zhuǎn)換到頻率域以產(chǎn)生在梯度下降處理中所使用的過濾器系數(shù)的第二裝置。
7.權(quán)力要求5中的裝置,其中互相關(guān)的估計值是使用下列方程產(chǎn)生的R^x(t,v)=1NΣn=0N-1x(t+nT,v)xT(t+nT,v)]]>其中X(t,υ)是頻率域中的混合信號。
8.權(quán)力要求5中的裝置還包括一個話音識別系統(tǒng),用于處理一系列成分信號中的至少一個成分信號。
9.權(quán)力要求5中的裝置還包括產(chǎn)生混合信號的麥克風(fēng)。
10.權(quán)力要求5中的方法,其中梯度下降處理器最小化函數(shù)Σv=1TΣk=1K||E(k,v)||2]]>其中,E(k,υ)是一個誤差函數(shù)。
11.一個包含一個程序的計算機可讀的存儲媒介,當在一個通用計算機系統(tǒng)上執(zhí)行時,導(dǎo)致通用計算機系統(tǒng)成為一個可執(zhí)行一個能夠把一個混合信號分隔成一系列成分信號的方法的專用計算機系統(tǒng),包括下列步驟(a)產(chǎn)生一系列離散的傅里葉變換(DFT)值,其中針對上述混合的信號的每一個T樣本產(chǎn)生一個DFT值;(b)產(chǎn)生一個互相關(guān)的估計矩陣,在N個DFT值上這一矩陣是平均的;(c)重復(fù)步驟(b)K次,以產(chǎn)生一系列互相關(guān)的估計值;(d)使用一個梯度下降處理計算一系列過濾器系數(shù),這些系數(shù)用于使用互相關(guān)估計值的一個有限的沖激響應(yīng)(FIR)過濾器;以及(e)使用一個擁有已計算出的過濾器系數(shù)的FIR過濾器過濾混合的信號,以把混合的信號分隔成一系列成分信號。
12.權(quán)力要求11中的計算機可讀的存儲媒介,其中,方法的步驟(d)還包括下列步驟(d1)把來自頻率域的過濾器系數(shù)轉(zhuǎn)換到時間域;(d2)針對任何大于一個預(yù)定時間Q的時間,零化任何擁有一個非零值的過濾器系數(shù),以產(chǎn)生可調(diào)的時間域過濾器系數(shù),其中Q小于T;以及(d3)把來自時間域的可調(diào)整的時間域過濾器系數(shù)轉(zhuǎn)換到頻率域,以產(chǎn)生在梯度下降處理中所使用的過濾器系數(shù)。
13.權(quán)力要求11中的計算機可讀的存儲媒介,其中,在步驟(d)中所產(chǎn)生的互相關(guān)估計值使用了下列方程R^x(t,v)=1NΣn=0N-1x(t+nT,v)xT(t+nT,v)]]>其中X(t,υ)是頻率域中的混合的信號。
14.權(quán)力要求11中的計算機可讀的存儲媒介,其中梯度下降處理最小化函數(shù)Σv=1TΣk=1K||E(k,v)||2]]>其中E(k,υ)是一個誤差函數(shù)。
全文摘要
使用卷積信號解相關(guān)技術(shù)執(zhí)行盲源分隔的方法與裝置。本發(fā)明累加一段輸入信號(混合的信號),這一輸入信號包括一系列來自獨立信號源的獨立的信號。然后,本發(fā)明把這段輸入信號劃分成一系列T-長度周期(窗口),并在每一T-長度周期中的信號上執(zhí)行一個離散的傅里葉變換(DFT),然后使用一系列平均的DFT值計算估計的互相關(guān)的值。計算總數(shù)為K個的互相關(guān)的值,其中K個值中的每一個在N個T-長度周期上是平均的。一個梯度下降處理使用互相關(guān)的值計算一個FIR過濾器的系數(shù),這一處理將有效分隔輸入信號中的源信號。為了實現(xiàn)一個精確的方案,對梯度下降處理加以限制,其中,過濾器系數(shù)的時間域值僅可達到某些值,即把時間域過濾器系數(shù)值W(τ)限制在每一T-長度周期中,以使其對于任何時間t>Q時為0。在這一方式中,計算出針對FIR過濾器系數(shù)的一個唯一的方案,使用這些系數(shù)所產(chǎn)生的一個過濾器將有效分隔源信號。
文檔編號G10L19/00GK1307747SQ99807114
公開日2001年8月8日 申請日期1999年4月8日 優(yōu)先權(quán)日1998年4月8日
發(fā)明者盧卡斯·帕拉, 克萊·道格拉斯·斯彭斯 申請人:薩爾諾夫公司