專利名稱:使用獨(dú)立分量分析算法分離音樂與語音的裝置與方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種歌曲伴奏裝置與方法,更具體地,涉及一種從音樂與語音信號(hào)的混合信號(hào)中消除語音信號(hào)的歌曲伴奏裝置與方法。
背景技術(shù):
具有卡拉OK功能的歌曲伴奏裝置被廣泛應(yīng)用于歌唱和/或娛樂。歌曲伴奏裝置一般輸出(例如演奏)人們可以隨之一起唱的歌曲伴奏。可替換地,人們可以只欣賞音樂而不一起唱。此處所使用的名詞“歌曲伴奏”指沒有語音伴隨的音樂。在此類歌曲伴奏裝置中,一般使用存儲(chǔ)器來存儲(chǔ)用戶所選擇的歌曲伴奏。因此,對(duì)于給定的歌曲伴奏裝置,歌曲伴奏的數(shù)目可能受限于該存儲(chǔ)器的容量。另外,此類歌曲伴奏裝置一般較昂貴。
對(duì)于只輸出歌曲伴奏的密致盤(CD)播放器、數(shù)字視頻盤(DVD)播放器、以及磁帶播放器可以容易地實(shí)現(xiàn)卡拉OK功能。類似地,如果從FM音頻廣播輸出消除了語音從而只有歌曲伴奏輸出,則也可以容易地實(shí)現(xiàn)卡拉OK功能。用戶可以播放其所喜愛的無線電臺(tái)。
從CD播放器、DVD播放器、磁帶播放器、以及FM無線電輸出的聲學(xué)信號(hào)包含音樂與語音信號(hào)的混合信號(hào)。用來從該混合信號(hào)中消除語音信號(hào)的技術(shù)還遠(yuǎn)未完善。從混合信號(hào)中消除語音信號(hào)的一般方法包括將聲學(xué)信號(hào)轉(zhuǎn)換到頻域,并去除語音信號(hào)所在的特定頻帶。到頻域的轉(zhuǎn)換一般使用快速傅立葉(FFT)或者子頻帶過濾來完成。在1994年12月20日提交的美國專利5375188中公開了一種使用這種頻率轉(zhuǎn)換從混合信號(hào)中消除語音信號(hào)的方法。
然而,因?yàn)槟承┮魳沸盘?hào)分量被包含在與語音信號(hào)一樣的頻帶中,其在幾kHZ的范圍內(nèi),當(dāng)去除這些頻帶時(shí)將丟失一些音樂信號(hào),由此降低了輸出伴奏的質(zhì)量。為了減少混合信號(hào)中音樂信號(hào)的損失,人們已經(jīng)試圖檢測(cè)語音信號(hào)的音調(diào)頻率(pitch frequency),并且只去除該音調(diào)的頻域。但是,由于音樂信號(hào)的影響而不容易檢測(cè)語音信號(hào)的音調(diào),所以這種方法并不十分可靠。
發(fā)明內(nèi)容
本發(fā)明提供了一種通過使用對(duì)于二維前向網(wǎng)絡(luò)的獨(dú)立分量分析方法、在較短的收斂時(shí)間內(nèi)從音樂與語音信號(hào)的混合信號(hào)中分離音樂與語音信號(hào)的裝置。該裝置根據(jù)傳感器錄制位置的差異來估計(jì)信號(hào)混合處理。
本發(fā)明提供了一種通過使用對(duì)于二維前向網(wǎng)絡(luò)的獨(dú)立分量分析算法、在較短的收斂時(shí)間內(nèi)從音樂與語音信號(hào)的混合信號(hào)中分離音樂與語音信號(hào)的方法。該方法根據(jù)傳感器錄制位置的差異來估計(jì)信號(hào)混合處理。
根據(jù)本發(fā)明的一方面,提供了一種用于從混合信號(hào)中分離音樂與語音的裝置,包括獨(dú)立分量分析器,音樂信號(hào)選擇器,濾波器,以及轉(zhuǎn)接器。
所述獨(dú)立分量分析器用來接收包含音樂與語音分量的第一過濾后信號(hào)與第二過濾后信號(hào),并且輸出當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù),這些系數(shù)使用獨(dú)立分量分析方法來確定。
所述音樂信號(hào)選擇器用來作為對(duì)所述第二系數(shù)的最高有效位與所述第三系數(shù)的最高有效位的響應(yīng)輸出轉(zhuǎn)接器控制信號(hào)。
所述濾波器用來接收表示可聽音響信號(hào)的R聲道信號(hào)與L聲道信號(hào),并輸出第一過濾后信號(hào)與第二過濾后信號(hào)所述轉(zhuǎn)接器用來作為對(duì)所述轉(zhuǎn)接器控制信號(hào)的響應(yīng)選擇性地輸出所述第一過濾后信號(hào)或第二過濾后信號(hào)。
所述濾波器還包括第一乘法器,用來將所述R聲道信號(hào)乘以所述第一系數(shù),并輸出第一乘積信號(hào);第二乘法器,用來將所述R聲道信號(hào)乘以所述第二系數(shù),并輸出第二乘積信號(hào);第三乘法器,用來將所述L聲道信號(hào)乘以所述第三系數(shù),并輸出第三乘積信號(hào);第四乘法器,用來將所述L聲道信號(hào)乘以所述第四系數(shù),并輸出第四乘積信號(hào);第一加法器,用來將所述第一乘積信號(hào)與所述第三乘積信號(hào)相加,以確定所述第一過濾后信號(hào);以及第二加法器,用來將所述第二乘積信號(hào)與所述第四乘積信號(hào)相加,以確定所述第二過濾后信號(hào)。
所述獨(dú)立分量分析器根據(jù)以下公式確定所述當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)Wn=Wn-1+(I-2tanh(u)uT)Wn-1其中,Wn為包含當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)的2×2矩陣,Wn-1為包含先前第一系數(shù)、先前第二系數(shù)、先前第三系數(shù)、以及先前第四系數(shù)的2×2矩陣,I為2×2單位矩陣,u為包含所述第一過濾后信號(hào)與第二過濾后信號(hào)的2×1列矩陣,uT為行矩陣,uT為列矩陣u的轉(zhuǎn)置。
所述當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)分別為Wn11、Wn21、Wn12、與Wn22,所述先前第一系數(shù)、先前第二系數(shù)、先前第三系數(shù)、以及先前第四系數(shù)分別為Wn-111、Wn-121、Wn-112、與Wn-122,并且所述第一過濾后信號(hào)與第二過濾后信號(hào)分別為u1與u2。
所述R聲道信號(hào)與L聲道信號(hào)可以無區(qū)別地互換。
所述R聲道信號(hào)與L聲道信號(hào)為從包括CD播放器、DVD播放器、磁帶播放器、以及FM無線電廣播接收器的音響系統(tǒng)輸出的二聲道立體聲數(shù)字信號(hào)。
根據(jù)本發(fā)明的另一方面,提供了一種用于從混合信號(hào)中分離音樂與語音的方法,包括以下步驟(a)在獨(dú)立分量分析器處,接收包含音樂與語音分量的第一過濾后信號(hào)與第二過濾后信號(hào),并且輸出當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù);(b)作為對(duì)所述第二系數(shù)的最高有效位與所述第三系數(shù)的最高有效位的響應(yīng)輸出轉(zhuǎn)接器控制信號(hào);(c)接收表示可聽音響信號(hào)的R聲道信號(hào)與L聲道信號(hào),并輸出第一過濾后信號(hào)與第二過濾后信號(hào);以及(d)作為對(duì)所述轉(zhuǎn)接器控制信號(hào)的響應(yīng)選擇性地輸出所述第一過濾后信號(hào)或第二過濾后信號(hào)。
在步驟(c)中,進(jìn)一步包括以下步驟(i)通過將所述R聲道信號(hào)乘以所述第一系數(shù),生成第一乘積信號(hào);(ii)通過將所述R聲道信號(hào)乘以所述第二系數(shù),生成第二乘積信號(hào);(iii)通過將所述L聲道信號(hào)乘以所述第三系數(shù),生成第三乘積信號(hào);(iv)通過將所述L聲道信號(hào)乘以所述第四系數(shù),生成第四乘積信號(hào);(v)通過將所述第一乘積信號(hào)與所述第三乘積信號(hào)相加,生成所述第一過濾后信號(hào);以及(vi)通過將所述第二乘積信號(hào)與所述第四乘積信號(hào)相加,生成所述第二過濾后信號(hào)。
所述獨(dú)立分量分析器根據(jù)以下公式確定所述當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)Wn=Wn-1+(I-2tanh(u)uT)Wn-1其中,Wn為包含當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)的2×2矩陣,Wn-1為包含先前第一系數(shù)、先前第二系數(shù)、先前第三系數(shù)、以及先前第四系數(shù)的2×2矩陣,I為2×2單位矩陣,u為包含所述第一過濾后信號(hào)與第二過濾后信號(hào)的2×1列矩陣,uT為行矩陣,uT為列矩陣u的轉(zhuǎn)置。
所述當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)分別為Wn11、Wn21、Wn12、與Wn22,所述先前第一系數(shù)、先前第二系數(shù)、先前第三系數(shù)、以及先前第四系數(shù)分別為Wn-111、Wn-121、Wn-112、與Wn-122,并且所述第一過濾后信號(hào)與第二過濾后信號(hào)分別為u1與u2。
所述R聲道信號(hào)與L聲道信號(hào)可以無區(qū)別地互換。
所述R聲道信號(hào)與L聲道信號(hào)為從包括CD播放器、DVD播放器、磁帶播放器、以及FM無線電廣播接收器的音響系統(tǒng)輸出的二聲道立體聲數(shù)字信號(hào)。
結(jié)合附圖,從以下描述中可以更詳細(xì)地理解本發(fā)明的優(yōu)選實(shí)施方式,其中圖1為根據(jù)本發(fā)明優(yōu)選實(shí)施方式的、用于分離音樂與語音的裝置的方框圖;以及圖2為根據(jù)本發(fā)明優(yōu)選實(shí)施方式的、獨(dú)立分量分析方法的流程圖。
具體實(shí)施例方式
下面將參照附圖更全面地描述本發(fā)明的優(yōu)選實(shí)施方式,在附圖中顯示了本發(fā)明的優(yōu)選實(shí)施方式。然而,本發(fā)明可以用不同形式實(shí)施,并且不應(yīng)該被理解為局限于此處所列出的實(shí)施方式。提供這些實(shí)施方式只是為了使本公開徹底、完整,并且向本領(lǐng)域技術(shù)人員完整闡述本發(fā)明的范圍。
參照?qǐng)D1,其顯示了根據(jù)本發(fā)明優(yōu)選實(shí)施方式的、用來分離音樂與語音的裝置100的方框圖。裝置100包括獨(dú)立分量分析器110、音樂信號(hào)選擇器120、濾波器130、以及轉(zhuǎn)接器140。
獨(dú)立分量分析器110接收第一輸出信號(hào)MAS1與第二輸出信號(hào)MAS2,其中每個(gè)都包含音樂信號(hào)與語音信號(hào)。獨(dú)立分量分析器110輸出當(dāng)前系數(shù)Wn11、當(dāng)前第二系數(shù)Wn21、當(dāng)前第三系數(shù)Wn12、以及當(dāng)前第四系數(shù)Wn22。這些當(dāng)前系數(shù)使用獨(dú)立分量分析方法來計(jì)算。下標(biāo)n表示獨(dú)立分量分析方法的當(dāng)前迭代次數(shù)。
如下詳細(xì)所述,該獨(dú)立分量方法將混合的聲學(xué)信號(hào)分離為分離的語音信號(hào)與音樂信號(hào)。語音信號(hào)與音樂信號(hào)之間的無關(guān)性被最大化。即,語音信號(hào)與音樂信號(hào)被恢復(fù)到其被混合前的原始狀態(tài)。該混合信號(hào)可以從(例如)一個(gè)或更多個(gè)傳感器獲得。
音樂信號(hào)選擇器120輸出轉(zhuǎn)接器控制信號(hào),其具有第一邏輯狀態(tài)(例如低邏輯狀態(tài))與第二邏輯狀態(tài)(例如高邏輯狀態(tài))。作為對(duì)第二系數(shù)Wn21的最高有效位的第二邏輯狀態(tài)的響應(yīng),輸出第一邏輯狀態(tài)。作為對(duì)第三系數(shù)Wn12的最高有效位的第二邏輯狀態(tài)的響應(yīng),輸出第二邏輯狀態(tài)。第二系數(shù)Wn21與第三系數(shù)Wn12的最高有效位具有表示負(fù)值或正值的符號(hào)。當(dāng)這些最高有效位處于第二邏輯狀態(tài)時(shí),第二系數(shù)Wn21與第三系數(shù)Wn12具有負(fù)值。此處第一輸出信號(hào)MAS1與第二輸出信號(hào)MAS2位經(jīng)過消除的音樂信號(hào)。
濾波器130接收R聲道信號(hào)RAS與L聲道信號(hào)LAS,其中每個(gè)都表示可聽音響信號(hào)。第一乘法器131將R聲道信號(hào)RAS乘以當(dāng)前系數(shù)Wn11并輸出第一乘法結(jié)果。第三乘法器135將L聲道信號(hào)LAS乘以當(dāng)前第三系數(shù)Wn12并輸出第三乘法結(jié)果。第一乘法結(jié)果與第三乘法結(jié)果由第一加法器138相加,以生成第一輸出信號(hào)MAS1。
第二乘法器133將R聲道信號(hào)RAS乘以當(dāng)前第二系數(shù)Wn21并輸出第二乘法結(jié)果。第四乘法器137將L聲道信號(hào)LAS乘以當(dāng)前第四系數(shù)Wn12并輸出第四乘法結(jié)果。第二乘法結(jié)果與第四乘法結(jié)果由第二加法器139相加,以生成第二輸出信號(hào)MAS2。
R聲道信號(hào)RAS與L聲道信號(hào)LAS可以是從諸如密致盤(CD)播放器、數(shù)字視頻盤(DVD)播放器、音頻磁帶播放器、FM接收器等音響系統(tǒng)輸出的二聲道數(shù)字信號(hào)。如果R聲道信號(hào)RAS與L聲道信號(hào)LAS的值互換將產(chǎn)生同樣的輸出。即,R聲道信號(hào)RAS與L聲道信號(hào)LAS的值可以互換而沒有任何后果。
響應(yīng)于轉(zhuǎn)接器控制信號(hào)的邏輯狀態(tài),轉(zhuǎn)接器140輸出第一輸出信號(hào)MAS1或第二輸出信號(hào)MAS2。如上所述,第一與第二輸出信號(hào)MAS1與MAS2為沒有語音信號(hào)的音樂信號(hào)(即,歌曲伴奏)。例如,用戶可以通過揚(yáng)聲器聆聽音樂伴奏。
參照?qǐng)D2,其中顯示了根據(jù)本發(fā)明優(yōu)選實(shí)施方式的獨(dú)立分量分析方法200的流程圖。該流程圖顯示了對(duì)于二維前向網(wǎng)絡(luò)的獨(dú)立分量分析方法200,如圖1所示。該獨(dú)立分量分析方法200可以由圖1的獨(dú)立分量分析器110來完成。
圖2的獨(dú)立分量分析方法200控制圖1的當(dāng)前第一系數(shù)Wn11、當(dāng)前第二系數(shù)Wn21、當(dāng)前第三系數(shù)Wn12、以及當(dāng)前第四系數(shù)Wn22。該獨(dú)立分量分析方法200被實(shí)現(xiàn)為包含圖1的輸出信號(hào)MAS1與MAS2的矩陣u的非線性函數(shù)(tanh(u)),如以下公式(1)所示。如上所述,輸出信號(hào)MAS1與MAS2包括音樂信號(hào)與語音信號(hào)Wn=Wn-1+(I-2tanh(u)uT)Wn-1,......(1)Wn為包含當(dāng)前四個(gè)系數(shù)(即Wn11、Wn21、Wn12、與Wn22)的2×2矩陣,Wn-1為包含先前四個(gè)系數(shù)(即Wn-111、Wn-121、Wn-112、與Wn-122)的2×2矩陣,I為2×2單位矩陣,u為包含輸出信號(hào)的2×1列矩陣,uT為行矩陣,其為列矩陣u的轉(zhuǎn)置。
在公式(1)中,當(dāng)Wn表示為包含當(dāng)前四個(gè)系數(shù)Wn11、Wn21、Wn12、與Wn22的2×2矩陣時(shí),就確立了下面的表達(dá)式(2)。類似地,在公式(1)中,當(dāng)Wn-1表示為包含包含先前四個(gè)系數(shù)Wn-111、Wn-121、Wn-112、與Wn-122的2×2矩陣時(shí),就確立了下面的表達(dá)式(3)。因?yàn)镮為2×2單位矩陣,所以確立下面的表達(dá)式(4)。因?yàn)閡為包含輸出兩個(gè)信號(hào)MAS1與MAS2的2×1列矩陣,所以確立下面的表達(dá)式(5)。因?yàn)閡T為行矩陣,其為列矩陣u的轉(zhuǎn)置,所以確立下面的表達(dá)式(6)。根據(jù)表達(dá)式(2)與表達(dá)式(5),當(dāng)前第一系數(shù)Wn11、當(dāng)前第二系數(shù)Wn21、當(dāng)前第三系數(shù)Wn12、以及當(dāng)前第四系數(shù)Wn22為構(gòu)成矩陣Wn的元素。第一輸出信號(hào)MAS1與第二輸出信號(hào)MAS2分別為構(gòu)成矩陣u的u1與u2。
Wn11Wn12Wn21Wn22......(2)]]>Wn-111Wn-112Wn-121Wn-122.........(3)]]>
1001......(4)]]>u1u2=MAS1MAS2......(5)]]>[u1 u2]=[MAS1 MAS2]......(6)當(dāng)開通用于分離音樂與語音的裝置100,圖1的獨(dú)立分量分析器110在步驟S211復(fù)位該裝置。在步驟S213,例如當(dāng)n=1時(shí),在復(fù)位時(shí)識(shí)別初始狀態(tài)。并且,在步驟S215,接收四個(gè)系數(shù)Wo11、Wo21、Wo12、與Wo22,這些系數(shù)在步驟S215預(yù)先被設(shè)置為初始值。另外,在步驟S217,獨(dú)立分量分析器110接收公式(1)的I與u。
接著,在步驟S219,圖1的獨(dú)立分量分析器110計(jì)算以上的公式(1),并且在步驟S221,輸出當(dāng)前4個(gè)系數(shù)Wn11、Wn21、Wn12、與Wn22。在步驟S223,確定獨(dú)立分量分析器110是否被關(guān)斷。如果在步驟S223確定獨(dú)立分量分析器110未被關(guān)閉,則在步驟S225獨(dú)立分量分析器110將n加1,然后再次進(jìn)行S215到S221的步驟。
圖2的獨(dú)立分量分析方法200以較短收斂時(shí)間進(jìn)行。因此,當(dāng)圖1的用于分離音樂與語音的裝置100被安裝在音響系統(tǒng)上并且通過該獨(dú)立分量分析方法200所估計(jì)的純粹的音樂信號(hào)(即沒有語音信號(hào))從揚(yáng)聲器輸出時(shí),用戶可以實(shí)時(shí)地聆聽質(zhì)量被改進(jìn)的純粹的音樂信號(hào)。
如上所述,根據(jù)本發(fā)明優(yōu)選實(shí)施方式的圖1的用于分離音樂與語音的裝置100包括獨(dú)立分量分析器110,其接收的包含音樂信號(hào)與聲音信號(hào)的輸出信號(hào)MAS1與MAS2,并輸出使用所述獨(dú)立分量分析方法所計(jì)算的當(dāng)前第一系數(shù)Wn11、當(dāng)前第二系數(shù)Wn21、當(dāng)前第三系數(shù)Wn12、以及當(dāng)前第四系數(shù)Wn22,從而根據(jù)第一、第二、第三、以及第四系數(shù)(即分別為Wn11、Wn21、Wn12、Wn22)處理當(dāng)前輸入聲學(xué)信號(hào)RAS與LAS。結(jié)果,從混合信號(hào)中估計(jì)出音樂信號(hào)與語音信號(hào),并且可以確定純粹的音樂信號(hào)。
通過使用所述獨(dú)立分量分析方法,根據(jù)本發(fā)明優(yōu)選實(shí)施方式的圖1的用于分離音樂與語音的裝置100可以以較短的收斂時(shí)間從混合信號(hào)中分離出音樂信號(hào)與語音信號(hào)??梢苑蛛x地錄制混合信號(hào)的音樂信號(hào)與語音信號(hào)。圖2的獨(dú)立分量分析方法200根據(jù)傳感器的錄制位置的差異來估計(jì)信號(hào)混合處理。由此,用戶可以輕易地從其自己的CD、DVD、或音頻磁帶、或FM無線電中選擇伴奏音樂,并且實(shí)時(shí)聆聽質(zhì)量被改進(jìn)的音樂。用戶可以只是傾聽音樂伴奏或者與之一起唱(即加上其自己的歌詞)。另外,因?yàn)橛糜诜蛛x音樂與語音的獨(dú)立分量分析方法200相對(duì)較簡單,并且進(jìn)行該獨(dú)立分量分析方法200所需的時(shí)間一般不長,所以該方法可以輕易地實(shí)現(xiàn)于數(shù)字信號(hào)處理器(DSP)芯片、微處理器等等之中。
雖然參照附圖描述了一些示范性實(shí)施方式,但應(yīng)該理解本發(fā)明并不局限于這些實(shí)施方式的精確形式,本領(lǐng)域技術(shù)人員可以在不脫離本發(fā)明原理與范圍的前提下進(jìn)行各種修改與變動(dòng)。所有這些修改與變動(dòng)都包括在權(quán)利要求所限定的范圍之內(nèi)。
權(quán)利要求
1.一種用于從混合信號(hào)中分離音樂與語音的裝置,包括獨(dú)立分量分析器,用來接收包含音樂與語音分量的第一過濾后信號(hào)與第二過濾后信號(hào),并且輸出當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù);音樂信號(hào)選擇器,用來作為對(duì)所述第二系數(shù)的最高有效位與所述第三系數(shù)的最高有效位的響應(yīng),輸出轉(zhuǎn)接器控制信號(hào);濾波器,用來接收表示可聽音響信號(hào)的R聲道信號(hào)與L聲道信號(hào),并輸出第一過濾后信號(hào)與第二過濾后信號(hào);以及轉(zhuǎn)接器,用來作為對(duì)所述轉(zhuǎn)接器控制信號(hào)的響應(yīng),選擇性地輸出所述第一過濾后信號(hào)或第二過濾后信號(hào)。
2.如權(quán)利要求1所述的裝置,其中所述濾波器包括第一乘法器,用來將所述R聲道信號(hào)乘以所述第一系數(shù),并輸出第一乘積信號(hào);第二乘法器,用來將所述R聲道信號(hào)乘以所述第二系數(shù),并輸出第二乘積信號(hào);第三乘法器,用來將所述L聲道信號(hào)乘以所述第三系數(shù),并輸出第三乘積信號(hào);第四乘法器,用來將所述L聲道信號(hào)乘以所述第四系數(shù),并輸出第四乘積信號(hào);第一加法器,用來將所述第一乘積信號(hào)與所述第三乘積信號(hào)相加,以確定所述第一過濾后信號(hào);以及第二加法器,用來將所述第二乘積信號(hào)與所述第四乘積信號(hào)相加,以確定所述第二過濾后信號(hào)。
3.如權(quán)利要求1所述的裝置,其中所述獨(dú)立分量分析器根據(jù)以下公式確定所述當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)Wn=Wn-1+(I-2tanh(u)uT)Wn-1,其中,Wn為包含當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)的2×2矩陣,Wn-1為包含先前第一系數(shù)、先前第二系數(shù)、先前第三系數(shù)、以及先前第四系數(shù)的2×2矩陣,I為2×2單位矩陣,u為包含所述第一過濾后信號(hào)與第二過濾后信號(hào)的2×1列矩陣,uT為行矩陣,uT為列矩陣u的轉(zhuǎn)置。
4.如權(quán)利要求3所述的裝置,其中所述當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)分別為Wn11、Wn21、Wn12、與Wn22,所述先前第一系數(shù)、先前第二系數(shù)、先前第三系數(shù)、以及先前第四系數(shù)分別為Wn-111、Wn-121、Wn-112、與Wn-122,并且所述第一過濾后信號(hào)與第二過濾后信號(hào)分別為u1與u2。
5.如權(quán)利要求1所述的裝置,其中所述R聲道信號(hào)與L聲道信號(hào)可以無區(qū)別地互換。
6.如權(quán)利要求1所述的裝置,其中所述R聲道信號(hào)與L聲道信號(hào)為從音響系統(tǒng)輸出的二聲道立體聲數(shù)字信號(hào)。
7.如權(quán)利要求6所述的裝置,其中所述音響系統(tǒng)為以下之一密致盤播放器、數(shù)字視頻盤播放器、磁帶播放器、以及FM接收器。
8.一種用于從混合信號(hào)中分離音樂與語音的方法,包括以下步驟(a)在獨(dú)立分量分析器處,接收包含音樂與語音分量的第一過濾后信號(hào)與第二過濾后信號(hào),并且輸出當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù);(b)作為對(duì)所述第二系數(shù)的最高有效位與所述第三系數(shù)的最高有效位的響應(yīng),生成轉(zhuǎn)接器控制信號(hào);(c)接收表示可聽音響信號(hào)的R聲道信號(hào)與L聲道信號(hào),并輸出第一過濾后信號(hào)與第二過濾后信號(hào);以及(d)作為對(duì)所述轉(zhuǎn)接器控制信號(hào)的響應(yīng),選擇性地輸出所述第一過濾后信號(hào)或第二過濾后信號(hào)。
9.如權(quán)利要求8所述的方法,其中,在步驟(c)中,進(jìn)一步包括以下步驟(i)通過將所述R聲道信號(hào)乘以所述第一系數(shù),生成第一乘積信號(hào);(ii)通過將所述R聲道信號(hào)乘以所述第二系數(shù),生成第二乘積信號(hào);(iii)通過將所述L聲道信號(hào)乘以所述第三系數(shù),生成第三乘積信號(hào);(iv)通過將所述L聲道信號(hào)乘以所述第四系數(shù),生成第四乘積信號(hào);(v)通過將所述第一乘積信號(hào)與所述第三乘積信號(hào)相加,生成所述第一過濾后信號(hào);以及(vi)通過將所述第二乘積信號(hào)與所述第四乘積信號(hào)相加,生成所述第二過濾后信號(hào)。
10.如權(quán)利要求8所述的方法,其中,所述獨(dú)立分量分析器根據(jù)以下公式確定所述當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)Wn=Wn-1+(I-2tanh(u)uT)Wn-1其中,Wn為包含當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)的2×2矩陣,Wn-1為包含先前第一系數(shù)、先前第二系數(shù)、先前第三系數(shù)、以及先前第四系數(shù)的2×2矩陣,I為2×2單位矩陣,u為包含所述第一過濾后信號(hào)與第二過濾后信號(hào)的2×1列矩陣,uT為行矩陣,uT為列矩陣u的轉(zhuǎn)置。
11.如權(quán)利要求10所述的方法,其中,所述當(dāng)前第一系數(shù)、當(dāng)前第二系數(shù)、當(dāng)前第三系數(shù)、以及當(dāng)前第四系數(shù)分別為Wn11、Wn21、Wn12、與Wn22,所述先前第一系數(shù)、先前第二系數(shù)、先前第三系數(shù)、以及先前第四系數(shù)分別為Wn-111、Wn-121、Wn-112、與Wn-122,并且所述第一過濾后信號(hào)與第二過濾后信號(hào)分別為u1與u2。
12.如權(quán)利要求8所述的方法,其中所述R聲道信號(hào)與L聲道信號(hào)可以無區(qū)別地互換。
13.如權(quán)利要求8所述的方法,其中所述R聲道信號(hào)與L聲道信號(hào)為從音響系統(tǒng)輸出的二聲道立體聲數(shù)字信號(hào)。
14.如權(quán)利要求13所述的方法,其中所述音響系統(tǒng)為以下之一密致盤播放器、數(shù)字視頻盤播放器、磁帶播放器、以及FM接收器。
全文摘要
提供了一種使用對(duì)于二維前向網(wǎng)絡(luò)的獨(dú)立分量分析方法的分離音樂與語音的裝置與方法。該分離音樂與語音的裝置通過使用所述獨(dú)立分量分析方法可以在較短的收斂時(shí)間內(nèi)從混合信號(hào)中分離語音信號(hào)與音樂信號(hào),其中每個(gè)信號(hào)都可以被獨(dú)立地錄制,所述獨(dú)立分量分析方法根據(jù)傳感器錄制位置的差異來估計(jì)信號(hào)混合處理。由此,用戶可以容易地從其自己的密致盤(CD)、數(shù)字視頻盤(DVD)、或音頻磁帶、或FM無線電中選擇伴奏,并且實(shí)時(shí)地聆聽質(zhì)量被改進(jìn)的音樂。相應(yīng)地,用戶可以只是傾聽音樂伴奏或者與之一起唱。另外,該方法在數(shù)字信號(hào)處理器(DSP)芯片、微處理器等等之中易于實(shí)現(xiàn)。
文檔編號(hào)G10L21/02GK1573920SQ20041004655
公開日2005年2月2日 申請(qǐng)日期2004年6月2日 優(yōu)先權(quán)日2003年6月2日
發(fā)明者趙南翊, 崔埈源, 具亨一 申請(qǐng)人:三星電子株式會(huì)社