專利名稱:音頻信號處理裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于從包括來自多個聲音源的音頻信號的兩個聲道的輸入時序音頻信號中分離特定聲音源的音頻信號的音頻信號處理裝置和方法。
背景技術(shù):
通常,記錄在盤、壓縮盤等中的雙聲道(右聲道和左聲道)立體聲音頻信號包括來自多個聲音源的音頻信號。這種立體聲音頻信號通常水平有差異地記錄在各個聲道中,從而當利用兩個揚聲器再現(xiàn)立體聲音頻信號時,多個聲音源的聲像位于揚聲器之間。
例如,五個聲音源1到5的信號S1到S5被記錄為左聲道和右聲道音頻信號SL和SR,如下所示SL=S1+0.9S2+0.7S3+0.4S4SR=S5+0.4S2+0.7S3+0.9S4這種情況下,聲音源1到5的信號S1到S5水平有差異地混合在左聲道和右聲道中,并且產(chǎn)生各個聲道的音頻信號。
當例如利用圖19所示的兩個揚聲器1L和1R再現(xiàn)立體聲音頻信號(在該立體聲音頻信號中,聲音源1到5的信號S1到S5水平有差異地分配到右聲道和左聲道中)時,聽者2可以感覺到對應(yīng)于聲音源1、2、3、4和5的聲像A、B、C、D和E。同樣在本領(lǐng)域中所公知的,聲像A、B、C、D和E位于揚聲器1L和1R之間。
如圖20所示,當佩戴著頭戴耳機設(shè)備3的聽者2再現(xiàn)來自頭戴耳機設(shè)備3的右揚聲器單元3R和左揚聲器單元3L的右聲道和左聲道的立體聲音頻信號時,聽者2可以感覺到在聽者頭腦內(nèi)部的對應(yīng)于聲音源1、2、3、4和5的聲像A、B、C、D和E。
一種用于從通常的雙聲道立體聲音頻信號中只分離并輸出特定聲音源的音頻信號的機制允許只提取歌唱者的聲音或只提取特定聲音源(如小提琴)的聲音,并且可以用于各種應(yīng)用。
在圖21中示出了一種用于從雙聲道立體聲音頻信號中分離并輸出特定聲音源的音頻信號的已知方法(見PCT日本專利申請No.2003-515771)。在該方法中,對于要分離的期望聲音源,提供了相應(yīng)數(shù)目的帶通濾波器,其中每個帶通濾波器用于提取期望聲音源的音頻信號的高頻能量分量,并且?guī)V波器被用于從雙聲道立體聲音頻信號中分離期望聲音源的音頻信號。
在圖21所示的示例中,從左聲道音頻信號SL中分離出聲音源a的音頻信號Sa和聲音源b的音頻信號Sb,從右聲道音頻信號SR中分離出聲音源c的音頻信號Sc和聲音源d的音頻信號Sd。聲音源分離處理電路7包括對應(yīng)于聲音源a到d的四個帶通濾波器3到6。
如圖21所示,左聲道音頻信號SL被提供到帶通濾波器3以提取構(gòu)成音頻信號Sa的聲音源a的高頻能量分量,還被提供到帶通濾波器4以提取構(gòu)成音頻信號Sb的聲音源b的高頻能量分量。從帶通濾波器3和4中分別獲得了音頻信號Sa和Sb。
右聲道音頻信號SR被提供到帶通濾波器5以提取構(gòu)成音頻信號Sc的聲音源c的高頻能量分量,還被提供到帶通濾波器6以提取構(gòu)成音頻信號Sd的聲音源d的高頻能量分量。從帶通濾波器5和6中分別獲得了音頻信號Sc和Sd。
發(fā)明內(nèi)容
然而,圖21所示的方法有以下問題。可以在一定程度上分離具有不同頻帶內(nèi)的中心頻率的聲音源(如低音吉他和鐃鈸);然而,難以分離共享許多頻帶的聲音源的信號,包括存在于重疊頻帶中的波和帶通濾波器所選頻率范圍外部的聲音源的諧波。
因此,希望提供一種音頻信號處理裝置和方法,用于從包括來自多個聲音源的音頻信號的雙聲道音頻信號中分離特定聲音源的音頻信號。
根據(jù)本發(fā)明一個實施例的音頻信號處理裝置包括以下元件。劃分裝置將兩個音頻信號中的每一個劃分為多個頻帶。水平比較裝置確定在劃分裝置劃分的多個頻帶的每一個中,兩個音頻信號之間的水平比或水平差。輸出控制裝置根據(jù)水平比較裝置確定的水平比或水平差,控制劃分裝置的輸出。
根據(jù)本發(fā)明的一個實施例,利用了這樣的特性,即,聲音源的音頻信號以預(yù)定水平比或水平差被混合在兩個音頻信號中。這種情況下,兩個音頻信號中的每一個被劃分為多個頻帶。確定了每個頻帶中兩個音頻信號之間的水平比或水平差,并且從兩個音頻信號的至少一個中提取了頻帶中的提供預(yù)定水平比或水平差或者大約為預(yù)定水平比或水平差的信號分量。
如果預(yù)定水平比或水平差被設(shè)為一個水平比或水平差,其中特定聲音源的音頻信號以該水平比或水平差被混合在兩個音頻信號中,則從至少兩個音頻信號的至少一個中提取了構(gòu)成特定聲音源的音頻信號的頻率分量。從而,提取了特定聲音源的音頻信號。
根據(jù)本發(fā)明另一個實施例的音頻信號處理裝置包括以下元件。第一變換裝置將兩個時序音頻信號中的第一時序音頻信號變換為第一頻域信號。第二變換裝置將兩個時序音頻信號中的第二時序音頻信號變換為第二頻域信號。水平確定裝置確定從第一變換裝置獲得的第一頻域信號的頻譜與從第二變換裝置獲得的第二頻域信號的頻譜之間的水平比或水平差。輸出控制裝置基于水平確定裝置確定的水平比或水平差,控制并輸出從第一變換裝置和第二變換裝置的至少一個獲得的頻譜的水平。
根據(jù)本發(fā)明的一個實施例,兩個時序音頻信號被第一和第二變換裝置獨立地變換為頻域信號,每個頻域信號都有多個頻譜分量。
從第一變換裝置獲得的頻譜與從第二變換裝置獲得的頻譜之間的水平比或水平差被確定?;谒_定的水平比或水平差,從第一變換裝置和第二變換裝置的至少一個獲得的頻譜的水平被控制,并且提供了預(yù)定水平比或水平差或者大約為預(yù)定水平比或水平差的頻率分量被提取并輸出。
如果預(yù)定水平比或水平差被設(shè)為一個水平比或水平差,其中特定聲音源的音頻信號以該水平比或水平差被混合在兩個音頻信號中,則從至少兩個音頻信號的至少一個中提取了構(gòu)成特定聲音源的音頻信號的頻域分量。從而,提取了特定聲音源的音頻信號。
根據(jù)本發(fā)明的一個實施例,音頻信號處理裝置還包括相位差確定裝置,用于確定從第一變換裝置獲得的第一頻域信號的頻譜與從第二變換裝置獲得的第二頻域信號的頻譜之間的相位差,并且,輸出控制裝置基于由水平確定裝置確定的水平比或水平差以及由相位差確定裝置確定的相位差,控制并輸出從第一變換裝置和第二變換裝置的至少一個獲得的頻譜的水平。
根據(jù)本發(fā)明的一個實施例,兩個時序音頻信號被第一和第二變換裝置獨立地變換為頻域信號,每個頻域信號都有多個頻譜分量。
從第一變換裝置獲得的頻譜與從第二變換裝置獲得的頻譜之間的相位差被確定。基于所確定的相位差,從第一變換裝置和第二變換裝置的至少一個獲得的頻譜的水平被控制,并且提供預(yù)定相位差或者大約為預(yù)定相位差的頻率分量被提取并輸出。
如果預(yù)定相位差被設(shè)為一個相位差,其中特定聲音源的音頻信號以該相位差被混合在兩個音頻信號中,則從至少兩個音頻信號的至少一個中提取了構(gòu)成特定聲音源的音頻信號的頻域分量。從而,提取了特定聲音源的音頻信號。
因此,根據(jù)本發(fā)明的實施例,可以從兩個音頻信號的至少一個中分離以預(yù)定水平比或水平差或者以預(yù)定相位差被混合在兩個音頻信號中的聲音源的音頻信號。
圖1是根據(jù)本發(fā)明第一實施例的音頻信號處理裝置的框圖;圖2是圖1所示音頻信號處理裝置中的頻譜比較處理器的框圖;圖3是圖1所示音頻信號處理裝置中的頻譜控制處理器的框圖;圖4A-4E是示出了在頻譜控制處理器內(nèi)的乘法系數(shù)發(fā)生器中所用的函數(shù)的示圖;圖5是根據(jù)本發(fā)明第二實施例的音頻信號處理裝置的框圖;圖6是圖5所示音頻信號處理裝置中的頻譜比較處理器和頻譜控制處理器的框圖;圖7是根據(jù)本發(fā)明第三實施例的音頻信號處理裝置的框圖;圖8A和8B是示出了在圖7所示的音頻信號處理裝置內(nèi)的乘法系數(shù)發(fā)生器中所用的函數(shù)的示圖;圖9是根據(jù)本發(fā)明第四實施例的音頻信號處理裝置的框圖;圖10是根據(jù)本發(fā)明第五實施例的音頻信號處理裝置的框圖;圖11是根據(jù)本發(fā)明第六實施例的音頻信號處理裝置的框圖;圖12是圖11所示音頻信號處理裝置中的頻譜比較處理器和頻譜控制處理器的框圖;圖13A-13E是示出了在圖12所示的頻譜控制處理器內(nèi)的乘法系數(shù)發(fā)生器中所用的函數(shù)的示圖;圖14是根據(jù)本發(fā)明第七實施例的音頻信號處理裝置的框圖;圖15是示出了根據(jù)本發(fā)明第八實施例的音頻信號處理裝置中的數(shù)據(jù)段的示圖;圖16是示出了根據(jù)本發(fā)明第八實施例的音頻信號處理裝置中的數(shù)據(jù)段的示圖;圖17是示出了根據(jù)本發(fā)明第九實施例的音頻信號處理裝置中的數(shù)據(jù)段的示圖;圖18是示出了根據(jù)本發(fā)明第九實施例的音頻信號處理裝置中的數(shù)據(jù)段的示圖;圖19是示出了來自多個聲音源的雙聲道信號的聽覺定位的示圖;圖20是示出了來自多個聲音源的雙聲道信號的聽覺定位的示圖;以及圖21是用于分離特定聲音源的音頻信號的相關(guān)技術(shù)的裝置框圖。
具體實施例方式
下面參考附圖描述根據(jù)本發(fā)明實施例的音頻信號處理裝置和方法。
在下面的描述中,從立體聲音頻信號中分離出聲音源,其中立體聲音頻信號包括左聲道音頻信號SL和右聲道音頻信號SR。
例如,來自聲音源1到5的音頻信號S1到S5通過下面等式(1)和(2)中定義的比率,水平有差異地分配在左聲道音頻信號SL和右聲道音頻信號SR中SL=S1+0.9S2+0.7S3+0.4S4等式(1)SR=S5+0.4S2+0.7S3+0.9S4等式(2)比較等式(1)和(2),聲音源1到5的音頻信號S1到S5以上述的水平差異分配在左聲道音頻信號SL和右聲道音頻信號SR中。從而,通過根據(jù)分配比率,重新分配聲音源,可以從左聲道音頻信號SL和/或右聲道音頻信號SR中分離出初始聲音源。
在下面的實施例中,利用了聲音源通常具有不同的波譜分量的特性,并且利用高分辨率快速傅立葉變換(FFT)將每個右聲道立體聲音頻信號和左聲道立體聲音頻信號在頻域上劃分為多個頻譜分量。然后,確定每個聲道的音頻信號中頻譜分量之間的水平比(level ratio)或水平差(leveldifference),并且檢測其水平比或水平差對應(yīng)于等式(1)和(2)中定義的分配比率的頻譜分量,然后分離所檢測的頻譜分量,其中期望聲音源的音頻信號按等式(1)和(2)分配。因此,可以分離聲音源,而較少受其他聲音源的干擾。
第一實施例圖1是根據(jù)本發(fā)明第一實施例的音頻信號處理裝置10的框圖。雙聲道立體聲信號中的左聲道音頻信號SL被提供到充當正交變換器的FFT單元11。當信號SL是模擬信號時,將信號SL轉(zhuǎn)換為數(shù)字信號,然后進行FFT處理,以將時序音頻信號變換為頻域數(shù)據(jù)。當信號SL是數(shù)字信號時,F(xiàn)FT單元11不必執(zhí)行模數(shù)轉(zhuǎn)換。
雙聲道立體聲信號中的右聲道音頻信號SR被提供到充當正交變換器的FFT單元12。當信號SR是模擬信號時,將信號SR轉(zhuǎn)換為數(shù)字信號,然后進行FFT處理,以將時序音頻信號變換為頻域數(shù)據(jù)。當信號SR是數(shù)字信號時,F(xiàn)FT單元12不必執(zhí)行模數(shù)轉(zhuǎn)換。
FFT單元11和12有類似的結(jié)構(gòu),并分別將時序信號SL和SR劃分為具有多個不同頻率的頻譜分量。被劃分以產(chǎn)生頻譜的頻率數(shù)取決于聲音源分離的精確度,例如為500或更大,優(yōu)選地為4000或更大。頻率數(shù)取決于在FFT單元11和12中所用點的數(shù)目。
從FFT單元11和12輸出的頻譜F1和F2被提供到頻譜比較處理器13和頻譜控制處理器14。
頻譜比較處理器13確定同一頻率的來自FFT單元11和12的頻譜分量F1和F2的水平比,并將水平比輸出到頻譜控制處理器14。當水平以對數(shù)表示為分貝(dB)時,水平比表示為水平差。
頻譜控制處理器14基于來自頻譜比較處理器13的水平比信息,從FFT單元11和12中的至少一個的輸出中僅提取具有預(yù)定水平比的頻譜分量,并將提取輸出Fex輸出到反FFT單元15。在圖1所示的示例中,頻譜控制處理器14從FFT單元11和12兩者的輸出中提取具有預(yù)定水平比的頻譜分量,并將其作為提取輸出Fex輸出到反FFT單元15。
在頻譜控制處理器14中,取決于要分離的聲音源,用戶預(yù)設(shè)要提取哪個水平比的頻譜分量。因此,頻譜控制處理器14只提取根據(jù)用戶設(shè)置的用于分離的水平比而被分配到右聲道和左聲道的聲音源的音頻信號的頻譜分量。
反FFT單元15將從頻譜控制處理器14輸出的所提取的頻譜分量Fex變換為初始時序信號,并將所得到的信號輸出作為要被用戶分離的期望聲音源的音頻信號SO。為了輸出模擬音頻信號,在反FFT單元15的輸出側(cè)提供數(shù)模(D/A)轉(zhuǎn)換器,以將信號轉(zhuǎn)換為模擬音頻信號。以下實施例相同。
下面將描述頻譜比較處理器13的結(jié)構(gòu)。
頻譜比較處理器13在功能上有圖2所示的結(jié)構(gòu)。頻譜比較處理器13包括水平檢測器21和22、水平比計算器23和24,以及選擇器25。
水平檢測器21檢測來自FFT單元11的頻譜分量F1中的頻率分量的水平,并輸出所檢測的水平D1。水平檢測器22檢測來自FFT單元12的頻譜分量F2中的頻率分量的水平,并輸出所檢測的水平D2。為了確定每個頻譜的水平,以示例地方式檢測幅度譜。也可以檢測功率譜來確定每個頻譜的水平。
水平比計算器23確定比率D2/D1。水平比計算器24確定反比率D1/D2。水平比計算器23和24所確定的水平比被提供到選擇器25,并且從選擇器25中提取其中一個水平比作為輸出水平比r。
選擇器25接收選擇控制信號SEL,用于根據(jù)用戶要分離的聲音源和該聲音源的水平比,控制水平比計算器23或24的輸出的選擇。從選擇器25獲得的輸出水平比r被提供到頻譜控制處理器14。
以示例的方式,頻譜控制處理器14所使用的要分離的聲音源的水平比具有恒定滿足水平比≤1的值。即,通過將低水平的頻譜的水平除以高水平的頻譜的水平,來確定輸入到頻譜控制處理器14中的水平比r。
因此,頻譜控制處理器14使用從水平比計算器23輸出的水平比,以便分離以較高比率分配在左聲道音頻信號SL中的聲音源信號,并使用從水平比計算器24輸出的水平比,以便分離以較高比率分配在右聲道音頻信號SR中的聲音源信號。
例如,假定信號分配到右聲道和左聲道的分配比率PR和PL被用戶設(shè)置作為要分離的聲音源的水平比,其中PL和PR為1或更小。如果分配比率PL和PR滿足PR/PL≤1,則選擇控制信號SEL被設(shè)為這樣的選擇控制信號,其用于控制選擇器25選擇水平比計算器23的輸出(D2/D1)作為輸出水平比r。如果分配比率PL和PR滿足PR/PL≥1,則選擇控制信號SEL被設(shè)為這樣的選擇控制信號,其用于控制選擇器25選擇水平比計算器24的輸出(D1/D2)作為輸出水平比r。
如果用戶所設(shè)置的分配比率PL和PR彼此相等,即,水平比=1,則選擇器25既可以選擇水平比計算器23的輸出,又可以選擇水平比計算器24的輸出。
下面將描述頻譜控制處理器14的結(jié)構(gòu)。
頻譜控制處理器14在功能上有圖3所示的結(jié)構(gòu)。頻譜控制處理器14包括乘法因子發(fā)生器31和源分離器32。源分離器32包括乘法器33和34以及加法器35。
乘法器33接收來自FFT單元11的頻譜分量和來自乘法因子發(fā)生器31的乘法因子w,并將頻譜分量和乘法因子w的相乘結(jié)果提供到加法器35。乘法器34接收來自FFT單元12的頻譜分量和來自乘法因子發(fā)生器31的乘法因子w,并將頻譜分量和乘法因子w的相乘結(jié)果提供到加法器35。加法器35的輸出對應(yīng)于頻譜控制處理器14的輸出Fex。
乘法因子發(fā)生器31接收來自頻譜比較處理器13中的選擇器25的輸出水平比r,并生成對應(yīng)于水平比r的乘法因子w。乘法因子發(fā)生器31可以是用于生成關(guān)于乘法因子w的函數(shù)的函數(shù)發(fā)生電路,其中水平比r是變量。乘法因子發(fā)生器31中所使用的函數(shù)取決于用戶根據(jù)要分離的聲音源而設(shè)置的分配比率PL和PR。
由于提供給乘法因子發(fā)生器31的水平比r以頻譜的頻率分量的單位變化,因此來自乘法因子發(fā)生器31的乘法因子w也以頻譜的頻率分量的單位變化。
因此,在乘法器33中,來自FFT單元11的頻譜的水平由乘法因子w控制。在乘法器34中,來自FFT單元12的頻譜的水平由乘法因子w控制。
圖4A-4E示出了在充當乘法因子發(fā)生器31的函數(shù)發(fā)生電路中所使用的示例性函數(shù)。例如,當要從在等式(1)和(2)定義的左聲道音頻信號SL和右聲道音頻信號SR中分離出位于右聲道聲像和左聲道聲像中心部位的聲音源的音頻信號S3時,乘法因子發(fā)生器31可以是具有圖4A所示特性的函數(shù)發(fā)生電路。
在圖4A所示的函數(shù)特性中,相對于右聲道和左聲道之間的水平比r為1或接近1的頻譜分量(右聲道和左聲道之間水平相同或基本相同的頻譜分量),乘法因子w為1或約等于1。在右聲道和左聲道之間的水平比r約為0.6或更低的區(qū)域內(nèi),乘法因子w為0。
由于相對于從選擇器25提供的水平比r為1或約等于1的頻譜分量,乘法因子w為1或接近1,因此該頻譜分量以基本相同的水平從乘法器33和34輸出。另一方面,相對于從選擇器25提供的水平比r約為0.6或更小的頻譜分量,乘法因子w為0,因此,該頻譜分量的輸出水平為0。即,該頻譜分量不從乘法器33和34輸出。
從而,在多個頻譜分量中,右聲道和左聲道之間具有相同或大約相同的水平的頻譜分量以基本相同的水平從乘法器33和34輸出,而右聲道和左聲道之間具有較大水平差的頻譜分量的輸出水平為0,因此不從乘法器33和34輸出。因此,從加法器35中只獲得了以相同水平分配在右聲道音頻信號SR和左聲道音頻信號SL中的聲音源音頻信號S3的頻譜分量。
例如,當要從在等式(1)和(2)定義的左聲道音頻信號SL和右聲道音頻信號SR中分離出位于右聲道或左聲道中的聲音源的音頻信號S1或S5時,乘法因子發(fā)生器31可以是具有圖4B所示特性的函數(shù)發(fā)生電路。
根據(jù)第一實施例,為了分離音頻信號S1,用戶對要分離的聲音源設(shè)置左右分配比PL∶PR=1∶0?;蛘撸脩艨梢栽O(shè)置PL=1且PR=0。響應(yīng)于用戶設(shè)置,用于控制選擇來自水平比計算器23的水平比的選擇控制信號SEL被提供到選擇器25。
為了分離音頻信號S5,用戶對要分離的聲音源設(shè)置左右分配比PLPR=0∶1?;蛘?,用戶可以設(shè)置PL=0且PR=1。響應(yīng)于用戶設(shè)置,用于控制選擇來自水平比計算器24的水平比的選擇控制信號SEL被提供到選擇器25。
在圖4B所示的函數(shù)特性中,相對于右聲道和左聲道之間的水平比r為0或接近0的頻譜分量,乘法因子w為1或約等于1。在右聲道和左聲道之間的水平比r約為0.4或更高的區(qū)域內(nèi),乘法因子w為0。
由于相對于從選擇器25提供的水平比r為1或約等于1的頻譜分量,乘法因子w為0或接近0,因此該頻譜分量以基本相同的水平從乘法器33和34輸出。另一方面,相對于從選擇器25提供的水平比r約為0.4或更高的頻譜分量,乘法因子w為0,因此,該頻譜分量的輸出水平為0。即,該頻譜分量不從乘法器33和34輸出。
從而,在多個頻譜分量中,右聲道和左聲道中的一個具有比另一個大的多的水平的頻譜分量以基本相同的水平從乘法器33和34輸出,而右聲道和左聲道之間的水平差較小的頻譜分量的輸出水平為0,因此不從乘法器33和34輸出。因此,從加法器35中只獲得了被分配在左聲道音頻信號SL或右聲道音頻信號SR中的聲音源音頻信號S1或S5的頻譜分量。
例如,當要從在等式(1)和(2)定義的左聲道音頻信號SL和右聲道音頻信號SR中分離出位于左聲道和右聲道中的具有預(yù)定水平差的聲音源的音頻信號S2或S4時,乘法因子發(fā)生器31可以是具有圖4C所示特性的函數(shù)發(fā)生電路。
音頻信號S2以水平比D2/D1(=SR/SL)=0.4/0.9=0.44被分配到右聲道和左聲道。音頻信號S4以水平比D1/D2(=SL/SR)=0.4/0.9=0.44被分配到右聲道和左聲道。
根據(jù)第一實施例,為了分離音頻信號S2,用戶對要分離的聲音源設(shè)置左右分配比PL∶PR=0.9∶0.4?;蛘撸脩艨梢栽O(shè)置PL=0.9且PR=0.4。由于滿足PR/PL<1,因此用于控制選擇來自水平比計算器23的水平比的選擇控制信號SEL被提供到選擇器25。
為了分離音頻信號S4,用戶對要分離的聲音源設(shè)置左右分配比PL∶PR=0.4∶0.9?;蛘?,用戶可以設(shè)置PL=0.4且PR=0.9。由于滿足PR/PL>1,因此用于控制選擇來自水平比計算器24的水平比的選擇控制信號SEL被提供到選擇器25。
在圖4C所示的函數(shù)特性中,相對于右聲道和左聲道之間的水平比r等于D2/D1(=PR/PL)=0.4/0.9=0.44的頻譜分量,乘法因子w為1,或者相對于水平比r接近0.44的頻譜分量,乘法因子w為1或約等于1。在右聲道和左聲道之間的水平比r不為約0.4的區(qū)域內(nèi),乘法因子w為0。
由于相對于從選擇器25提供的水平比r為0.44或約等于0.44的頻譜分量,乘法因子w為1或接近1,因此該頻譜分量以基本相同的水平從乘法器33和34輸出。另一方面,相對于從選擇器25提供的水平比r低于或高于約0.44的頻譜分量,乘法因子w為0,因此,該頻譜分量的輸出水平為0。即,該頻譜分量不從乘法器33和34輸出。
從而,在多個頻譜分量中,右聲道和左聲道之間的水平比為0.44或約等于0.44的頻譜分量以基本相同的水平從乘法器33和34輸出,而右聲道和左聲道之間的水平比r低于或高于約0.44的頻譜分量的輸出水平為0,因此不從乘法器33和34輸出。
因此,從加法器35中只獲得了以水平比0.44被分配在右聲道音頻信號SR和左聲道音頻信號SL中的聲音源音頻信號S2或S4的頻譜分量。
因此,根據(jù)第一實施例,根據(jù)某一預(yù)定的分配比率,可以從右聲道和左聲道的音頻信號中分離出以該預(yù)定分配比率被分配到這兩個聲道中的聲音源的音頻信號。
在第一實施例中,從兩個聲道的音頻信號中提取要分離的期望聲音源的音頻信號。然而,要分離的期望聲音源的音頻信號并非必須從兩個聲道中分離并提取,而是可以從其中一個聲道中分離并提取。
在第一實施例中,聲音源信號被分配到兩個音頻信號中的水平比被用來從兩個音頻信號中分離出聲音源信號。然而,基于聲音源信號和兩個音頻信號之間的水平差,可以從兩個音頻信號中的至少一個中分離并提取聲音源信號。
盡管在左聲道和右聲道立體聲信號的情況中(其中,聲音源根據(jù)等式(1)和(2)中定義的比率被分配到左聲道和右聲道)描述了前述內(nèi)容,但是通過選擇圖4A-4C中所示的函數(shù)特性,也可以將期望的聲音源從通常有意未分配的立體聲音樂信號中分離出來。
利用圖4D和4E中所示的其他函數(shù),可以改變或加寬或縮窄用于分離的水平比的范圍,從而提供不同的聲音源的選擇性。
考慮到聲音源波譜特性,大部分立體聲音頻信號從具有不同波譜的聲音源中產(chǎn)生。這些聲音源也可以以上述方式被分離。
此外,通過提高FFT單元11和12中的頻率分辨率,例如使用具有4000或更多個的點的FFT電路,可以實現(xiàn)具有許多重疊波譜分量的聲音源的高質(zhì)量分離。
第二實施例在第一實施例中,從兩個音頻信號(具體地說,右聲道和左聲道立體聲信號SL和SR)的至少一個中,分離并提取在兩個音頻信號中以預(yù)定水平比或水平差分配的單個聲音源的音頻信號。
根據(jù)本發(fā)明第二實施例的音頻信號處理裝置適用于從兩個音頻信號中一次分離并提取在兩個音頻信號中以預(yù)定水平比或水平差分配的多個聲音源的音頻信號,而不是單個聲音源的音頻信號。
圖5示出了根據(jù)第二實施例的音頻信號處理裝置的結(jié)構(gòu)。在圖5中,與根據(jù)第一實施例的圖1中所示的組件相對應(yīng)的組件以相同的標號指示。圖5中所示的頻譜比較處理器13和頻譜控制處理器14適用于分離多個聲音源的音頻信號,因而不同于圖1中所示根據(jù)第一實施例的處理器。此外,反FFT單元151、152、...、15n的數(shù)目等于要分離并提取的輸出的數(shù)目。
圖6示出了根據(jù)第二實施例的頻譜比較處理器13和頻譜控制處理器14的內(nèi)部結(jié)構(gòu)。
如同第一實施例中那樣,根據(jù)第二實施例的頻譜比較處理器13也包括水平檢測器21和22以及水平比計算器23和24,并檢測來自FFT單元11和12的頻譜分量的水平比D2/D1和D1/D2。從水平比計算器23和24輸出的所檢測的水平比被提供到多個選擇器251、252、...、25n。選擇器251、252、...、25n的數(shù)目對應(yīng)于要分離的聲音源數(shù)目。
多個選擇器251、252、...、25n接收選擇控制信號SEL1、SEL2、...、SELn,每個選擇控制信號用于取決于分配比率來選擇從水平比計算器23和24輸出的檢測的水平比中的一個,其中要分離的期望聲音源的音頻信號根據(jù)所述分配比率被分配到右聲道和左聲道。如上所述,每個選擇控制信號SEL1、SEL2、...、SELn用于控制每個選擇器251、252、...、25n選擇這樣的水平比,該水平比的分母是要分離的期望聲音源的音頻信號以較高比率被分配到的聲道的水平。
頻譜控制處理器14包括多個乘法因子發(fā)生器311、312、...、31n和源分離器321、322、...、32n。乘法因子發(fā)生器311、312、...、31n和源分離器321、322、...、32n的數(shù)目對應(yīng)于要分離的聲音源數(shù)目。水平比r1、r2、...、m從頻譜比較處理器13中的多個選擇器251、252、...、25n分別提供到乘法因子發(fā)生器311、312、...、31n。
如同第一實施例中那樣,相對于在右聲道和左聲道音頻信號中要分離的期望聲音源的音頻信號的分配水平比,每個乘法因子發(fā)生器311、312、...、31n設(shè)置乘法因子的函數(shù)(見圖4中所示的函數(shù))。
從而,乘法因子w1、w2、...、wn從乘法因子發(fā)生器311、312、...、31n提供到源分離器321、322、...、32n,其中,乘法因子w1、w2、...、wn對應(yīng)于來自選擇器251、252、...、25n的水平比r1、r2、...、rn,也對應(yīng)于要分離的聲音源的音頻信號。
盡管在圖6中未示出,但是如同圖3所示的源分離器32中一樣,每個源分離器321、322、...、32n包括用于將輸出F1乘上乘法因子的乘法器33、用于將輸出F2乘上乘法因子的乘法器34,以及用于將乘法器33和34的輸出相加的加法器35。
具有等于或接近于分配比率(其中,要分離的期望聲音源的音頻信號根據(jù)該分配比率被分配到右聲道和左聲道音頻信號中)的水平比的頻譜分量以基本相同的水平從每個源分離器321、322、...、32n中的乘法器33和34輸出。其他頻譜分量的水平較低或為0。因此,從源分離器321、322、...、32n中分別獲得了要分離的多個期望聲音源的頻譜分量的提取輸出Fex1、Fex2、...、Fexn。
來自源分離器321、322、...、32n的提取輸出Fex1、Fex2、...、Fexn分別被提供到反FFT單元151、152、...、15n,并且被變換回初始的時序音頻信號。所得到的信號被輸出作為分離的聲音源的音頻信號輸出SO1、SO2、...、SOn。
第三實施例根據(jù)本發(fā)明第三實施例的音頻信號處理裝置適用于從右聲道和左聲道音頻信號中的左聲道音頻信號SL和右聲道音頻信號SR中分離并提取同一聲音源的音頻信號或不同聲音源的音頻信號。
圖7的框圖示出了根據(jù)第三實施例的音頻信號處理裝置的結(jié)構(gòu)。在圖7所示的音頻信號處理裝置中,從FFT單元11和12輸出的頻譜分量F1和F2被提供到頻譜比較處理器13和頻譜控制處理器14。
如下所述,頻譜控制處理器14輸出從左聲道音頻信號SL中提取的預(yù)定聲音源音頻信號的頻譜分量輸出FexL和從右聲道音頻信號SR中提取的預(yù)定聲音源音頻信號的頻譜分量輸出FexR。頻譜分量輸出FexL和FexR分別被提供到反FFT單元15L和15R,并且被變換回初始的時序音頻信號。從反FFT單元15L和15R得到的結(jié)果信號被輸出作為預(yù)定聲音源的輸出音頻信號SOL和SOR。
如同第一實施例中那樣,根據(jù)第三實施例的頻譜比較處理器13也包括水平檢測器21和22以及水平比計算器23和24,并檢測來自FFT單元11和12的頻譜分量的水平比D2/D1和D1/D2。從水平比計算器23和24輸出的所檢測的水平比被提供到左聲道選擇器25L和右聲道選擇器25R。
選擇器25L和25R接收選擇控制信號SELL和SELR,每個選擇控制信號用于取決于分配比率選擇從水平比計算器23和24輸出的所檢測水平比中的一個,其中要從右聲道和左聲道的每一個中分離的期望聲音源的音頻信號根據(jù)所述分配比率被分配到右聲道和左聲道中。如上所述,每個選擇控制信號SELL和SELR用于控制每個選擇器25L和25R選擇這樣的水平比,該水平比的分母是要分離的期望聲音源的音頻信號以較高比率被分配到的聲道的水平。
頻譜控制處理器14包括左聲道乘法因子發(fā)生器31L、右聲道乘法因子發(fā)生器31R、左聲道乘法器32L和右聲道乘法器32R。水平比rL從頻譜比較處理器13中的選擇器25L被提供到乘法因子發(fā)生器31L,水平比rR從選擇器25R被提供到乘法因子發(fā)生器31R。
如同第一實施例中那樣,相對于在右聲道和左聲道音頻信號中要分離的期望聲音源的音頻信號的分配水平比,每個乘法因子發(fā)生器31L和31R設(shè)置乘法因子函數(shù)(見圖4中所示的函數(shù))。
從而,乘法因子wL和wR分別從乘法因子發(fā)生器31L和31R被提供到乘法器32L和32R,其中,乘法因子wL和wR對應(yīng)于來自選擇器25L和25R的水平比rL和rR,也對應(yīng)于要分離的期望聲音源的音頻信號。
具有等于或接近于分配比率(其中,要分離的期望聲音源的音頻信號根據(jù)該分配比率被分配到右聲道和左聲道音頻信號中)的水平比的頻譜分量以基本相同的水平從每個乘法器32L和32R輸出。其他頻譜分量的水平較低或為0。因此,從乘法器32L和32R中分別獲得了要分離的期望聲音源的頻譜分量的提取輸出FexL和FexR。
來自乘法器32L和32R的提取輸出FexL和FexR分別被提供到反FFT單元15L和15R,并且被變換回初始的時序音頻信號。所得到的信號被輸出作為分離的聲音源的音頻信號輸出SOL和SOR。
在第三實施例中,在乘法因子發(fā)生器31L和31R中設(shè)置的函數(shù)不僅可以適用于分離要從右聲道和左聲道中分離的不同聲音源的音頻信號,而且可以適用于分離根據(jù)預(yù)定水平比或水平差被分配到右聲道和左聲道中的同一聲音源的音頻信號。
在后者情況下,選擇器25L和25R可以選擇性地輸出來自水平比計算器23和24的相同水平比,并且乘法因子發(fā)生器31L和31R可以使用相同函數(shù)。因此,例如可以從左聲道和右聲道音頻信號SL和SR中分離并提取在等式(1)和(2)中定義的左聲道和右聲道立體聲信號SL和SR中的信號S2或S4,并且可以信號S2或S4可以被獲取作為輸出SOL和SOR。
當要分離相同聲音源時,在乘法因子發(fā)生器31L和31R中設(shè)置的水平比相對于乘法因子的函數(shù)可以具有不同的特性。例如,如圖8A和8B所示,函數(shù)可以展現(xiàn)同位相似特性曲線,其相對于水平比r有不同的乘法因子w。
因此,例如以一定水平差被分配到右聲道和左聲道中的聲音源音頻信號可以以相同水平被輸出,作為從左聲道和右聲道音頻信號SL和SR中分離的音頻信號SOL和SOR。
第四實施例圖9示出了根據(jù)本發(fā)明第四實施例的自動音樂錄制裝置,作為對圖7中所示根據(jù)第三實施例的音頻信號處理裝置的修改形式。
圖9中所示的根據(jù)第四實施例的自動音樂錄制裝置包括位于頻譜控制處理器14的輸出側(cè)的最大頻譜水平檢測器16L和16R,以替代圖7中所示的反FFT單元15L和15R。
根據(jù)第四實施例,由于分離的聲音源的波譜結(jié)構(gòu),具有最大幅度水平的頻譜分量是該聲音源的基頻。從而,最大頻譜水平檢測器16L和16R從來自頻譜控制處理器14的輸出FexL和FexR中檢測具有最大幅度水平的頻譜分量的頻率,并將所檢測的頻率f1和f2以及水平V1和V2輸出作為數(shù)據(jù)。
盡管在圖9中未示出,但是來自最大頻譜水平檢測器16L和16R的頻率f1和f2以及水平V1和V2可以例如被提供到音調(diào)(pitch)檢測器以檢測聲音的音調(diào),并且可以將所檢測的音調(diào)記錄到記錄介質(zhì)上,或者利用樂譜寫入裝置(或音樂錄制裝置)寫到音樂樂譜上。
因此,根據(jù)第四實施例,首先從立體聲音頻信號中分離出聲音源,然后分析分離的聲音源的波譜,以檢測來自聲音源的聲音的音調(diào)?;谒鶛z測的音調(diào),執(zhí)行自動音樂錄制。因此,可以實現(xiàn)能夠根據(jù)具有多個聲音源組合的立體聲聲音源進行自動音樂錄制的系統(tǒng)。
盡管圖9所示的裝置從右聲道和左聲道的每一個中分離聲音源,并執(zhí)行自動音樂錄制,但是也可以將圖5和6中所示根據(jù)第二實施例的裝置(其從雙聲道音頻信號的每一個中提取多個聲音源的頻譜分量)實現(xiàn)為自動音樂錄制裝置。這種情況下,圖5中所示的所有反FFT單元151、152、...、15n被替代為最大頻譜水平檢測器,以獲得具有最大水平的頻譜的頻率和水平,并且輸出的頻率和水平經(jīng)由音調(diào)檢測器被提供到音樂錄制裝置。
根據(jù)第四實施例的自動音樂錄制裝置也可以應(yīng)用于根據(jù)第一實施例的音頻信號處理裝置。應(yīng)當理解,根據(jù)第四實施例的自動音樂錄制裝置也可以應(yīng)用于根據(jù)以下實施例的用于聲音源分離的音頻信號處理裝置。
第五實施例根據(jù)本發(fā)明第五實施例的音頻信號處理裝置適用于允許用戶動態(tài)地改變要從雙聲道音頻信號中分離的聲音源。
具體地說,根據(jù)第五實施例的音頻信號處理裝置被應(yīng)用到根據(jù)第三實施例的音頻信號處理裝置,并且適用于如下情形在要從雙聲道音頻信號SL和SR的每一個中分離出不同聲音源的音頻信號(或相同聲音源的音頻信號)時,允許用戶動態(tài)地選擇和改變要分離的一個或多個聲音源。
參考圖10,根據(jù)第五實施例,頻譜控制處理器14包括多個左聲道乘法因子發(fā)生器31L1、31L2、...、31Ln,以及切換電路36L。切換電路36L選擇從多個乘法因子發(fā)生器31L1、31L2、...、31Ln中的任何一個生成的乘法因子,并將所選擇的乘法因子提供到乘法器32L作為乘法因子wL。
頻譜控制處理器14還包括多個右聲道乘法因子發(fā)生器31R1、31R2、...、31Rn,以及切換電路36R。切換電路36R選擇從多個乘法因子發(fā)生器31R1、31R2、...、31Rn中的任何一個生成的乘法因子,并將所選擇的乘法因子提供到乘法器32R作為乘法因子wR。
例如,多個乘法因子發(fā)生器31L1、31L2、...、31Ln、31R1、31R2、...、31Rn中的每一個設(shè)置水平比相對于乘法因子的函數(shù),其用來分離在右聲道和左聲道之間的具有各種值的水平比的聲音源。
頻譜比較處理器13包括選擇和分配電路250。選擇和分配電路250接收從水平比計算器23和24輸出的水平比,并將任一個水平比輸出提供到每一個乘法因子發(fā)生器31L1、31L2、...、31Ln、31R1、31R2、...、31Rn。
根據(jù)第五實施例的音頻信號處理裝置還包括源分離選擇信號發(fā)生器17。源分離選擇信號發(fā)生器17響應(yīng)于用戶利用選擇操作單元(下面將描述)所操作的信號Ma,生成要被提供到選擇和分配電路250的選擇信號SELT,以選擇要分離的聲音源。源分離選擇信號發(fā)生器17還生成用于控制切換電路36L的切換操作的信號SWL和用于控制切換電路36R的切換操作的信號SWR。
盡管在圖10中未示出,但是根據(jù)第五實施例的音頻信號處理裝置接收用戶例如使用選擇操作桿或按鈕或顯示單元(如具有接觸式面板的液晶顯示器(LCD))上的圖形用戶界面的聲音源選擇操作。通過用戶操作被選擇的聲音源是可由乘法因子發(fā)生器31L1、31L2、...、31Ln、31R1、31R2、...、31Rn中設(shè)置的函數(shù)分離的多個聲音源。
例如,可被分離的多個聲音源可以是其聲像位置在左聲道中的聲像位置和右聲道中的聲像位置之間稍稍改變的聲音源。
用戶可以在右聲道和左聲道的每一個中獨立指定期望的聲音源。
例如,當用戶使用選擇操作桿或按鈕或圖形用戶界面,選擇可以利用來自左聲道乘法因子發(fā)生器31L1的乘法因子從左聲道音頻信號SL中分離出的聲音源時,源分離選擇信號發(fā)生器17接收對應(yīng)于選擇操作的信號Ma,并根據(jù)信號Ma,生成切換控制信號SWL和選擇信號SELT。
切換電路36L被來自源分離選擇信號發(fā)生器17的切換控制信號SWL切換到選擇乘法因子發(fā)生器31L1。選擇和分配電路250被選擇信號SELT控制為選擇水平比計算器23或24(其輸出的水平比為1或更低),并且所選擇的水平比被提供到乘法因子發(fā)生器31L1。
從而,所選聲音源的頻譜分量FexL從乘法器32L中獲得,并且被反FFT單元15L變換回初始的時序音頻信號,然后被輸出為SOL輸出。
同樣在右聲道中,提取了用戶所選擇的要分離的期望聲音源的音頻信號。
根據(jù)圖10所示的第五實施例,從雙聲道音頻信號的每一個中分離并提取了預(yù)定聲音源的音頻信號(即,根據(jù)第五實施例的音頻信號處理裝置被應(yīng)用于第三實施例)。根據(jù)第五實施例的音頻信號處理裝置也可應(yīng)用于第一或第二實施例。
例如,當根據(jù)第五實施例的音頻信號處理裝置應(yīng)用于第一實施例時,提供了多個乘法因子發(fā)生器以替代圖3中所示的乘法因子發(fā)生器31,并且在多個乘法因子發(fā)生器和聲音源分離器32之間提供了切換電路,以將來自多個乘法因子發(fā)生器的其中之一的乘法因子提供到聲音源分離器32。還提供了源分離選擇信號發(fā)生器,以響應(yīng)于來自用戶的選擇操作信號Ma,控制切換電路的切換操作,并生成控制信號,以執(zhí)行控制,將來自水平比計算器23和24的其中一個的合適的水平提供到乘法因子發(fā)生器。
例如,當根據(jù)第五實施例的音頻信號處理裝置應(yīng)用于第二實施例時,提供了多個乘法因子發(fā)生器以替代圖6中所示的乘法因子發(fā)生器311、312、...、31n中的每一個,并且在多個乘法因子發(fā)生器和每個聲音源分離器321、322、...、32n之間提供了多個切換電路,以將來自多個乘法因子發(fā)生器的其中之一的乘法因子提供到每個聲音源分離器321、322、...、32n。還提供了源分離選擇信號發(fā)生器,以響應(yīng)于來自用戶的選擇操作信號Ma,生成控制信號以控制每個切換電路的切換操作,并生成控制信號以執(zhí)行控制,將來自水平比計算器23和24其中一個的合適的水平提供到每個乘法因子發(fā)生器。
第六實施例在前述實施例中,聲音源的音頻信號被同相分配到雙聲道音頻信號中。聲音源的音頻信號也可以反相分配。例如,來自六個聲音源MS1到MS6的音頻信號S1到S6被分配到左聲道和右聲道,以產(chǎn)生如下等式(3)和(4)中所定義的立體聲音頻信號SL和SRSL=S1+0.9S2+0.7S3+0.4S4+0.7S6等式(3)SR=S5+0.4S2+0.7S3+0.9S4-0.7S6 等式(4)聲音源MS3的音頻信號S3和聲音源MS6的音頻信號S6以相同水平被分配到右聲道和左聲道中。然而,聲音源MS3的音頻信號S3被同相分配到右聲道和左聲道中,而聲音源MS6的音頻信號S6被反相分配到右聲道和左聲道中。
如果僅僅基于水平比或水平差,而不考慮相位,以前述實施例中所述的方式分離并提取聲音源MS3的音頻信號S3或聲音源MS6的音頻信號S6,則由于音頻信號S3和S6以相同水平被分配到右聲道和左聲道中,因此很難分離并提取任何一個信號。
根據(jù)第六實施例,通過首先以與前述實施例類似的方式,利用水平比或水平差,然后利用相位差來分離音頻分量,分離并輸出聲音源MS3的音頻信號S3和聲音源MS6的音頻信號S6。
圖11的框圖示出了根據(jù)第六實施例的音頻信號處理裝置的結(jié)構(gòu)。根據(jù)第六實施例的音頻信號處理裝置包括頻譜比較處理器103,并且頻譜比較處理器103包括水平比較處理器1031和相位比較處理器1032。
根據(jù)第六實施例的音頻信號處理裝置還包括頻譜控制處理器104,并且頻譜控制處理器104包括第一頻譜控制處理器1041和第二頻譜控制處理器1042,用于基于相位差的聲音源分離。
圖12的框圖示出了根據(jù)第六實施例的頻譜比較處理器103和頻譜控制處理器104的結(jié)構(gòu)細節(jié)。頻譜比較處理器103中的水平比較處理器1031具有與根據(jù)第一實施例的頻譜比較處理器13類似的結(jié)構(gòu),并且包括水平檢測器21和22、水平比計算器23和24以及選擇器25。
除了頻譜控制處理器1041不包括加法器35之外,頻譜控制處理器104中的第一頻譜控制處理器1041具有與根據(jù)第一實施例的頻譜控制處理器14類似的結(jié)構(gòu)。第一頻譜控制處理器1041包括乘法因子發(fā)生器31以及含有乘法器33和34的聲音源分離器32。
如圖11和12所示,來自水平比較處理器1031的水平比輸出r以第一實施例中所述的方式被提供到第一頻譜控制處理器1041中的乘法因子發(fā)生器31,并且乘法因子發(fā)生器31根據(jù)在乘法因子發(fā)生器31中設(shè)置的函數(shù)生成乘法因子wr。乘法因子wr被提供到乘法器33和34。
來自FFT單元11的頻譜分量F1被提供到乘法器33,并且頻譜分量F1和乘法因子wr的相乘結(jié)果從乘法器33提供。來自FFT單元12的頻譜分量F2被提供到乘法器34,并且頻譜分量F2和乘法因子wr的相乘結(jié)果從乘法器34提供。
即,從乘法器33和34輸出來自FFT單元11和12的頻譜分量F1和F2,其水平根據(jù)來自乘法因子發(fā)生器31的乘法因子wr而被控制。
如上所述,乘法因子發(fā)生器31可以是用于生成關(guān)于乘法因子wr的函數(shù)的函數(shù)發(fā)生電路,其中水平比r是變量。乘法因子發(fā)生器31中所用的函數(shù)取決于右聲道和左聲道音頻信號中要分離的聲音源的分配比率。
例如,乘法因子發(fā)生器31設(shè)置圖4A-4E中所示的乘法因子wr相對于水平比的函數(shù)。例如,當如上所述地分離并提取以相同水平分配到右聲道和左聲道中的聲音源音頻信號時,乘法因子發(fā)生器31設(shè)置圖4A中所示的特定函數(shù)。
根據(jù)第六實施例,乘法器33和34的輸出被提供到頻譜比較處理器103中的相位比較處理器1032和頻譜控制處理器104中的第二頻譜控制處理器1042。
如圖12所示,相位比較處理器1032包括用于檢測乘法器33和34的輸出之間的相位差φ的相位差檢測器26。相位差檢測器26將關(guān)于相位差φ的信息提供到第二頻譜控制處理器1042。
第二頻譜控制處理器1042包括乘法因子發(fā)生器301和305、乘法器302、303、306和307,以及加法器304和308。
第一頻譜控制處理器1041中的乘法器33的輸出和來自乘法因子發(fā)生器301的乘法因子wp1被提供到乘法器302。乘法器302將乘法器33的輸出乘上乘法因子wp1,并將相乘結(jié)果提供到加法器304。第一頻譜控制處理器1041中的乘法器34的輸出和來自乘法因子發(fā)生器301的乘法因子wp1被提供到乘法器303。乘法器303將乘法器34的輸出乘上乘法因子wp1,并將相乘結(jié)果提供到加法器304。加法器304輸出頻譜控制處理器104的第一輸出Fex1。
第一頻譜控制處理器1041中的乘法器33的輸出和來自乘法因子發(fā)生器305的乘法因子wp2被提供到乘法器306。乘法器306將乘法器33的輸出乘上乘法因子wp2,并將相乘結(jié)果提供到加法器308。第一頻譜控制處理器1041中的乘法器34的輸出和來自乘法因子發(fā)生器305的乘法因子wp2被提供到乘法器307。乘法器307將乘法器34的輸出乘上乘法因子wp2,并將相乘結(jié)果提供到加法器308。加法器308輸出頻譜控制處理器104的第二輸出Fex2。
乘法因子發(fā)生器301和305從相位差檢測器26接收關(guān)于相位差φ的信息,并基于相位差φ生成乘法因子wp1和wp2。乘法因子發(fā)生器301和305可以是用于生成關(guān)于乘法因子wp的函數(shù)的函數(shù)發(fā)生電路,其中相位差φ是變量。乘法因子發(fā)生器301和305中所用的函數(shù)由用戶根據(jù)兩個聲道和要分離的聲音源之間的相位差而確定。
被提供到乘法因子發(fā)生器301和305的相位差φ以頻譜的頻率分量的單位改變。從而,來自乘法因子發(fā)生器301和305的乘法因子wp1和wp2也以頻譜的頻率分量的單位而改變。
因此,在乘法器302和306中,來自乘法器33的頻譜的水平由乘法因子wp1和wp2控制。在乘法器303和307中,來自乘法器34的頻譜的水平由乘法因子wp1和wp2控制。
圖13A-13E示出了在充當乘法因子發(fā)生器301和305的函數(shù)發(fā)生電路中所使用的示例性函數(shù)。
在圖13A所示的函數(shù)特性中,相對于右聲道和左聲道之間的相位差φ為0或接近0的頻譜分量(即,右聲道和左聲道同相或相位接近的頻譜分量),乘法因子wp為1或約等于1。在右聲道和左聲道之間的相位差φ約為π/4或更高的區(qū)域內(nèi),乘法因子wp為0。
例如,當乘法因子發(fā)生器301設(shè)置具有圖13A中所示特性的函數(shù)時,相對于從相位差檢測器26提供的相位差φ為0或約等于0的頻譜分量,乘法因子wp為1或約等于1。從而,該頻譜分量以基本相同的水平從乘法器302和303輸出。另一方面,相對于從相位差檢測器26提供的相位差φ約為π/4或更高的頻譜分量,乘法因子wp為0,因此,該頻譜分量的輸出水平為0。即,該頻譜分量不從乘法器302和303輸出。
從而,在多個頻譜分量中,右聲道和左聲道同相或其相位差較小的頻譜分量以基本相同的水平從乘法器302和303輸出,而右聲道和左聲道之間具有較大相位差的頻譜分量的輸出水平為0,因此不從乘法器302和303輸出。因此,從加法器304只獲得了被同相分配到右聲道和左聲道音頻信號SL和SR中的聲音源音頻信號的頻譜分量。
因此,具有圖13A中所示特性的函數(shù)用于提取被同相分配到右聲道和左聲道中的聲音源信號。
在圖13B所示的函數(shù)特性中,相對于右聲道和左聲道之間的相位差φ為π或接近π的頻譜分量(即,右聲道和左聲道反相或接近反相的頻譜分量),乘法因子wp為1或約等于1。在右聲道和左聲道之間的相位差φ約為3π/4或更低的區(qū)域內(nèi),乘法因子wp為0。
例如,當乘法因子發(fā)生器301設(shè)置具有圖13B中所示特性的函數(shù)時,相對于從相位差檢測器26提供的相位差φ為π或約等于π的頻譜分量,乘法因子wp為1或約等于1。從而,該頻譜分量以基本相同的水平從乘法器302和303輸出。另一方面,相對于從相位差檢測器26提供的相位差φ約為3π/4或更低的頻譜分量,乘法因子wp為0,因此,該頻譜分量的輸出水平為0。即,該頻譜分量不從乘法器302和303輸出。
從而,在多個頻譜分量中,右聲道和左聲道反相或其相位差較大的頻譜分量以基本相同的水平從乘法器302和303輸出,而右聲道和左聲道之間具有較小相位差的頻譜分量的輸出水平為0,因此不從乘法器302和303輸出。因此,從加法器304只獲得了被反相分配到右聲道和左聲道音頻信號SL和SR中的聲音源音頻信號的頻譜分量。
因此,具有圖13B中所示特性的函數(shù)用于提取被反相分配到右聲道和左聲道中的聲音源信號。
在具有圖13C所示特性的函數(shù)中,相對于右聲道和左聲道之間的相位差φ約為π/2或接近于約π/2的頻譜分量,乘法因子wp為1或約等于1。在相位差φ不為約π/2的區(qū)域內(nèi),乘法因子wp為0。因此,具有圖13C中所示特性的函數(shù)用于提取以約π/2的相位差被分配到右聲道和左聲道中的聲音源信號。
乘法因子發(fā)生器301和305可以取決于相位差,使用具有圖13D或13E中所示特性的函數(shù),其中要分離的聲音源的音頻信號根據(jù)該相位差被分配到兩個聲道中。
因此,從頻譜控制處理器104獲得的第一輸出Fex1和第二輸出Fex2分別被提供到反FFT單元1501和1502,并且被變換回初始的時序音頻信號。所得到的信號被獲取作為第一和第二輸出信號SO10和SO20。當要獲得模擬信號的第一和第二輸出信號SO10和SO20時,在反FFT單元1501和1502的輸出級提供了D/A轉(zhuǎn)換器。
例如,在第六實施例中,當要從在等式(3)和(4)中定義的右聲道和左聲道音頻信號SL和SR中分離出被同相分配到右聲道和左聲道中的聲音源MS3的音頻信號S3以及被反相分配到右聲道和左聲道中的聲音源MS6的音頻信號S6(其中音頻信號S3和S6以相同的水平分配)時,乘法因子發(fā)生器31設(shè)置圖4A中所示的特性函數(shù),而乘法因子發(fā)生器301和305分別設(shè)置具有圖13A和13B中所示特性的函數(shù)。
這種情況下,如圖11和12所示,在頻譜控制處理器104的第一頻譜控制處理器1041中,乘法器33輸出左聲道音頻信號SL中的FFT信號(頻譜)的頻譜分量(S3+S6),而乘法器34輸出右聲道音頻信號SR中的FFT信號(頻譜)的頻譜分量(S3-S6)。即,由于信號S3和S6以相同水平被分配到右聲道和左聲道中,因此信號S3和S6不被分離地從第一頻譜控制處理器1041中輸出。
根據(jù)第六實施例,以下面的方式分離被反相分配到右聲道和左聲道中的信號S3和S6。
乘法器33和34的輸出被提供到頻譜比較處理器103內(nèi)的相位比較處理器1032中的相位差檢測器26,以檢測乘法器33和34的輸出之間的相位差φ。相位差檢測器26所檢測到的關(guān)于相位差φ的信息被提供到乘法因子發(fā)生器301和乘法因子發(fā)生器305。
在乘法因子發(fā)生器301中設(shè)置的具有圖13A中所示特性的函數(shù)允許乘法器302和303提取被同相分配到右聲道和左聲道中的聲音源的音頻信號。從而,從每個乘法器302和303只獲得了頻譜分量(S3+S6)和(S3-S6)中同相的聲音源MS3的音頻信號S3的頻譜分量,并且其被提供到加法器304。
因此,聲音源MS3的音頻信號S3的頻譜分量被獲得作為來自加法器304的輸出信號Fex1,并且被提供到反FFT單元1501。分離的音頻信號S3被反FFT單元1501變換回時序信號,然后輸出為輸出信號SO10。
在乘法因子發(fā)生器305中設(shè)置的具有圖13B中所示特性的函數(shù)允許乘法器306和307提取被反相分配到右聲道和左聲道中的聲音源的音頻信號。從而,從每個乘法器306和307中只獲得了頻譜分量(S3+S6)和(S3-S6)中反相的聲音源MS6的音頻信號S6的頻譜分量,并且其被提供到加法器308。
因此,聲音源MS6的音頻信號S6的頻譜分量被獲得作為來自加法器308的輸出信號Fex2,并且被提供到反FFT單元1502。分離的音頻信號S6被反FFT單元1502變換回時序信號,然后輸出作為輸出信號SO20。
在參考圖11和12所述的第六實施例中,兩個信號(如,同相信號S3和反相信號S6)是利用各個乘法因子和乘法器由第二頻譜控制處理器1042分離的,而不是利用水平比由第一頻譜控制處理器1041分離的?;蛘?,不是利用水平比分離的兩個信號中的一個信號可以利用相位差φ和乘法因子來分離,并且可以從來自第一頻譜控制處理器1041的信號的和(或者來自乘法器33的輸出和來自乘法器34的輸出的和)中減去分離出的信號,以分離兩個信號中的另一個信號。
盡管在參考圖11和12所述的第六實施例中獲得了兩個分離的聲音源信號,但是要輸出的分離聲音源信號的數(shù)目可以是1。根據(jù)第六實施例的音頻信號處理裝置也可應(yīng)用于根據(jù)第二實施例的音頻信號處理裝置,以一次分離多個聲音源的音頻信號。
根據(jù)參考圖11和12所述的第六實施例,基于兩個頻譜的水平比,提取了以相同水平被分配到兩個音頻信號中的聲音源分量,其后,基于所提取的聲音源分量的兩個頻譜之間的相位差,分離了期望的聲音源。當輸入音頻信號是兩個音頻信號(如(S3+S6)和(S3-S6))時,應(yīng)當理解,可以僅僅基于相位差而分離聲音源。
根據(jù)第六實施例的音頻信號處理裝置也可應(yīng)用于根據(jù)第四實施例的自動音樂錄制裝置。
第七實施例圖14的框圖示出了根據(jù)本發(fā)明第七實施例的音頻信號處理裝置的結(jié)構(gòu)。圖14中所示的音頻信號處理裝置適用于利用數(shù)字濾波器42,從左聲道和右聲道音頻信號SL和SR的其中一個(如,在圖14所示的示例中的左聲道音頻信號SL)中,分離以預(yù)定水平比或水平差被分配到右聲道和左聲道中的聲音源的音頻信號。
左聲道音頻信號(在本示例中是數(shù)字信號)SL經(jīng)由定時調(diào)節(jié)延遲單元41被提供到數(shù)字濾波器42。數(shù)字濾波器42接收濾波系數(shù)(下面將描述),并且從數(shù)字濾波器42提取期望聲音源的音頻信號,其中濾波系數(shù)是基于水平比而生成的,要分離的期望聲音源的音頻信號以該水平比被分配到右聲道和左聲道中。
以下面方式生成濾波系數(shù)。首先,將左聲道和右聲道音頻信號(數(shù)字信號)SL和SR分別提供到FFT單元43和44,并進行FFT處理,從而使時序音頻信號被變換為頻域數(shù)據(jù)。從每個FFT單元43和44中輸出具有不同頻率的多個頻譜分量。
從FFT單元43和44輸出的頻譜分量分別被提供到水平檢測器45和46,以檢測頻譜分量的幅度譜或功率譜,從而檢測水平D1和D2。水平檢測器45和46所檢測的水平D1和D2被提供到水平比計算器47,以確定水平比D1/D2或D2/D1。
水平比計算器47所確定的水平比被提供到加權(quán)因子發(fā)生器48。加權(quán)因子發(fā)生器48對應(yīng)于根據(jù)前述實施例的乘法因子發(fā)生器。加權(quán)因子發(fā)生器48相對于等于或接近于一個水平比的水平比輸出較大的加權(quán)因子,而相對于其他的水平比輸出較小的加權(quán)因子,其中,要分離的聲音源的音頻信號以所述這個水平比被混合在右聲道和左聲道音頻信號中。對于從FFT單元43和44輸出的頻譜分量的每個頻率,獲得加權(quán)因子。
來自加權(quán)因子發(fā)生器48的頻域加權(quán)因子被提供給濾波系數(shù)發(fā)生器49,并被變換為時域濾波系數(shù)。濾波系數(shù)發(fā)生器49對頻域加權(quán)因子執(zhí)行反FFT,以生成要提供給數(shù)字濾波器42的濾波系數(shù)。
來自濾波系數(shù)發(fā)生器49的濾波系數(shù)被提供給數(shù)字濾波器42。數(shù)字濾波器42分離并提取與加權(quán)因子發(fā)生器48中設(shè)置的函數(shù)相對應(yīng)的聲音源的音頻信號分量,并將其作為輸出SO輸出。延遲單元41調(diào)節(jié)直到生成了要提供給數(shù)字濾波器42的濾波系數(shù)的處理延遲時間。
盡管在圖14所示的示例中只考慮了水平比,但是也可以只考慮相位差或者考慮水平比和相位差的組合。例如,當考慮水平比和相位差的組合時,F(xiàn)FT單元43和44的輸出也被提供給相位差檢測器(未示出),并且相位差檢測器所檢測的相位差被提供給加權(quán)因子發(fā)生器。加權(quán)因子發(fā)生器是用于生成相對于可變水平差和可變相位差的加權(quán)因子的函數(shù)發(fā)生電路,其中要分離的聲音源以該可變水平差和可變相位差被分配到右聲道和左聲道音頻信號中。
因此,加權(quán)因子發(fā)生器設(shè)置一個函數(shù),該函數(shù)被設(shè)計用來在相對于等于或接近于一個水平比的水平比以及相對于等于或接近于一個相位差的相位差時生成大的加權(quán)因子,而在其他情況下生成小的因子,其中,要分離的聲音源的音頻信號以所述這個水平比被分配到右聲道和左聲道中,并且要分離的聲音源的音頻信號以所述這個相位差被分配到右聲道和左聲道中。
對來自加權(quán)因子發(fā)生器的加權(quán)因子進行反FFT處理,以生成數(shù)字濾波器42的濾波系數(shù)。
盡管圖14中只從左聲道中分離出期望聲音源的音頻信號,但是通過分別地提供用于生成濾波系數(shù)的類似系統(tǒng),也可以從右聲道音頻信號中分離出預(yù)定聲音源的音頻信號。
其他實施例在前述實施例中,由于難以對較長的時序信號(如音樂)的輸入音頻信號執(zhí)行FFT處理,因此時序信號被分段為預(yù)定的分析幀,從而使對每個幀中的數(shù)據(jù)段執(zhí)行FFT處理。
然而,如果時序數(shù)據(jù)被分段為具有某一特定長度的幀,并且在執(zhí)行反FFT以組合幀之前進行聲音源分離,則經(jīng)歷反FFT處理的時序數(shù)據(jù)的波形可能在幀邊界處不連續(xù),這導(dǎo)致聽到噪聲。
根據(jù)本發(fā)明的第八實施例,如圖15所示,從數(shù)字音頻信號中提取幀1、2、3、4...的數(shù)據(jù)段。幀1、2、3、4...是長度相同的單位幀,并且相鄰的幀例如重疊半個單位的幀。在圖15中,數(shù)字音頻信號包括數(shù)據(jù)采樣x0、x1、x2、x3、...、xn。
當對數(shù)字音頻信號進行前述實施例中所述的聲音源分離和反FFT處理時,圖16中所示的得到的時序數(shù)據(jù)(y0、y1、y2、y3、...、yn)也具有重疊的幀,例如輸出數(shù)據(jù)段1和2。
其后,根據(jù)第八實施例,如圖16所示,圖16中所示的三角形窗函數(shù)1和2被應(yīng)用到幀彼此重疊的相鄰輸出數(shù)據(jù)段,例如輸出數(shù)據(jù)段1和2,并且輸出數(shù)據(jù)段1和2的重疊幀中的同步數(shù)據(jù)點被相加,以獲得圖16中所示的輸出合成數(shù)據(jù)。所分離的輸出音頻信號在幀邊界處無不連續(xù)的波形,或者說無噪聲。
根據(jù)本發(fā)明的第九實施例,如圖17所示,數(shù)據(jù)段被提取使得相鄰數(shù)據(jù)段的預(yù)定幀(例如幀1、2、3和4)彼此重疊,并且在執(zhí)行FFT處理之前,圖17中所示的三角形窗函數(shù)1、2、3和4應(yīng)用到幀1、2、3和4的所提取的數(shù)據(jù)段。
在施加圖17中所示的窗函數(shù)1、2、3和4之后,執(zhí)行FFT處理。當利用反FFT來變換經(jīng)歷合適聲音源分離處理的信號時,產(chǎn)生圖18中所示的輸出數(shù)據(jù)段1和2。輸出數(shù)據(jù)段1和2是已將窗函數(shù)施加到重疊的幀部分上的經(jīng)窗處理后的數(shù)據(jù)段。因此,輸出部分只需要將重疊的數(shù)據(jù)段相加,以產(chǎn)生無噪聲的已分離音頻信號,其波形在幀邊界處無不連續(xù)。
除了三角形窗函數(shù)外,也可以使用其他窗函數(shù),如Hanning窗函數(shù)、Hamming窗函數(shù)和Blackman窗函數(shù)。
在前述實施例中,利用正交變換將時間離散的信號變換為頻域信號,并且比較立體聲聲道的頻譜。原理上,可利用多個帶通濾波器將信號在時域分段,并且對于每個頻帶可執(zhí)行類似的處理。然而,前述實施例中的FFT處理更為實用,這是因為其易于增大頻率分辨率并提高源分離性能。
盡管在將雙聲道立體聲信號作為兩個音頻信號的情況中描述了前述實施例,但是也可以使用任何類型的兩個音頻信號,只要聲音源的音頻信號以預(yù)定水平比或水平差被分配到這兩個音頻信號中即可。對于相位差也是一樣的。
在前述實施例中,確定了兩個音頻信號的頻譜之間的水平比,并且乘法因子發(fā)生器設(shè)置水平比相對于乘法因子的函數(shù)。也可以確定兩個音頻信號的頻譜之間的水平差,并且乘法因子發(fā)生器也可以使用水平差相對于乘法因子的函數(shù)。
用于將時序信號變換為頻域信號的正交變換器并不限于FFT處理器,可以使用能夠比較頻譜的水平或相位的任何變換器。
本領(lǐng)域的技術(shù)人員應(yīng)當理解,取決于設(shè)計需求和其他因素,可以進行各種修改、組合、子組合和替換,它們落在所附權(quán)利要求及其等同物的范圍內(nèi)。
本發(fā)明包含2004年9月8日向日本特許廳提交的日本專利申請JP2004-260397的相關(guān)主題,這里通過引用并入其全部內(nèi)容。
權(quán)利要求
1.一種音頻信號處理裝置,包括劃分裝置,用于將兩個音頻信號中的每一個劃分為多個頻帶;水平比較裝置,用于確定在通過所述劃分裝置被劃分的所述多個頻帶的每一個中,所述兩個音頻信號之間的水平比或水平差;和輸出控制裝置,用于根據(jù)通過所述水平比較裝置確定的所述水平比或水平差,控制所述劃分裝置的輸出。
2.一種音頻信號處理裝置,包括第一變換裝置,用于將兩個時序音頻信號中的第一時序音頻信號變換為第一頻域信號;第二變換裝置,用于將所述兩個時序音頻信號中的第二時序音頻信號變換為第二頻域信號;水平確定裝置,用于確定從所述第一變換裝置獲得的所述第一頻域信號的頻譜與從所述第二變換裝置獲得的所述第二頻域信號的頻譜之間的水平比或水平差;和輸出控制裝置,用于基于通過所述水平確定裝置確定的所述水平比或水平差,控制并輸出從所述第一變換裝置和所述第二變換裝置的至少一個獲得的頻譜的水平。
3.根據(jù)權(quán)利要求2所述的音頻信號處理裝置,還包括反變換裝置,用于將來自所述輸出控制裝置的頻域信號變換為時序信號。
4.根據(jù)權(quán)利要求2所述的音頻信號處理裝置,還包括相位差確定裝置,用于確定從所述第一變換裝置獲得的所述第一頻域信號的頻譜與從所述第二變換裝置獲得的所述第二頻域信號的頻譜之間的相位差,其中,所述輸出控制裝置基于通過所述水平確定裝置確定的水平比或水平差以及通過所述相位差確定裝置確定的相位差,控制并輸出從所述第一變換裝置和所述第二變換裝置的至少一個獲得的頻譜的水平。
5.根據(jù)權(quán)利要求4所述的音頻信號處理裝置,還包括反變換裝置,用于將來自所述輸出控制裝置的頻域信號變換為時序信號。
6.根據(jù)權(quán)利要求2所述的音頻信號處理裝置,其中,所述輸出控制裝置包括乘法因子發(fā)生部分,所述乘法因子發(fā)生部分生成乘法因子,所述乘法因子被設(shè)置為通過所述水平確定裝置確定的水平比或水平差的函數(shù);和聲音源分離部分,所述聲音源分離部分將從所述第一變換裝置和所述第二變換裝置的至少一個獲得的頻譜乘上由所述乘法因子發(fā)生部分生成的乘法因子,并確定所述頻譜的輸出水平。
7.根據(jù)權(quán)利要求4所述的音頻信號處理裝置,其中,所述輸出控制裝置包括乘法因子發(fā)生部分,所述乘法因子發(fā)生部分生成乘法因子,所述乘法因子被設(shè)置為通過所述相位差確定裝置確定的相位差的函數(shù);和聲音源分離部分,所述聲音源分離部分將從所述第一變換裝置和所述第二變換裝置的至少一個獲得的頻譜乘上由所述乘法因子發(fā)生部分生成的乘法因子,并確定所述頻譜的輸出水平。
8.根據(jù)權(quán)利要求3所述的音頻信號處理裝置,其中,所述輸出控制裝置包括多個乘法因子發(fā)生部分,所述多個乘法因子發(fā)生部分生成乘法因子,所述乘法因子被設(shè)置為通過所述水平確定裝置確定的水平比或水平差的函數(shù);和多個聲音源分離部分,各個所述聲音源分離部分將從所述第一變換裝置和所述第二變換裝置的至少一個獲得的頻譜乘上由所述乘法因子發(fā)生部分生成的各個乘法因子,并確定所述頻譜的輸出水平,并且所述反變換裝置包括多個反變換部分,所述多個反變換部分將來自所述多個聲音源分離部分的輸出變換為時序信號。
9.根據(jù)權(quán)利要求2所述的音頻信號處理裝置,其中,所述輸出控制裝置包括多個乘法因子發(fā)生部分,所述多個乘法因子發(fā)生部分生成乘法因子,所述乘法因子被設(shè)置為通過所述水平確定裝置確定的水平比或水平差的函數(shù);和選擇部分,所述選擇部分選擇由所述多個乘法因子發(fā)生部分生成的乘法因子中的一個;和聲音源分離部分,所述聲音源分離部分將從所述第一變換裝置和所述第二變換裝置的至少一個獲得的頻譜乘上通過所述選擇部分選擇的乘法因子,并確定所述頻譜的輸出水平。
10.根據(jù)權(quán)利要求2所述的音頻信號處理裝置,還包括檢測裝置,用于檢測來自所述輸出控制裝置的輸出譜中的最大水平的頻率,并將所檢測出的頻率輸出為輸出數(shù)據(jù)。
11.根據(jù)權(quán)利要求6所述的音頻信號處理裝置,其中,對于通過所述水平確定裝置確定的水平比或水平差在預(yù)定范圍外的頻譜,乘法因子被設(shè)為0。
12.根據(jù)權(quán)利要求3所述的音頻信號處理裝置,還包括分段裝置,用于將所述兩個時序音頻信號分段為預(yù)定的幀以產(chǎn)生數(shù)據(jù)段,使得相鄰的數(shù)據(jù)段在所述幀的一部分上相互重疊,以及用于將所述數(shù)據(jù)段提供到所述第一變換裝置和所述第二變換裝置;和輸出裝置,用于將窗函數(shù)應(yīng)用到與來自所述反變換裝置的輸出時序信號相對應(yīng)的數(shù)據(jù)段,將所述輸出時序信號中的同步數(shù)據(jù)段相加,并輸出所得到的時序信號。
13.根據(jù)權(quán)利要求3所述的音頻信號處理裝置,還包括分段裝置,用于將所述兩個時序音頻信號分段為預(yù)定的幀以產(chǎn)生數(shù)據(jù)段,使得相鄰的數(shù)據(jù)段在所述幀的一部分上相互重疊,以及用于將窗函數(shù)應(yīng)用到所述數(shù)據(jù)段,并將所述數(shù)據(jù)段提供到所述第一變換裝置和所述第二變換裝置;和輸出裝置,用于將來自所述反變換裝置的輸出時序信號中的同步數(shù)據(jù)段相加,并輸出所得到的時序信號。
14.一種音頻信號處理方法,包括以下步驟將兩個音頻信號中的每一個劃分為多個頻帶;確定在所述多個劃分出的頻帶的每一個中,所述兩個音頻信號之間的水平比或水平差;以及根據(jù)在所述確定水平比或水平差的步驟中確定的所述水平比或水平差,控制所述被劃分的音頻信號的輸出。
15.一種音頻信號處理方法,包括以下步驟將兩個時序音頻信號變換為頻域信號,以產(chǎn)生兩個頻譜;確定在所述變換兩個時序音頻信號的步驟中產(chǎn)生的所述兩個頻譜之間的水平比或水平差;以及基于在所述確定水平比或水平差的步驟中確定的所述水平比或水平差,控制并輸出在所述變換兩個時序音頻信號的步驟中產(chǎn)生的所述兩個頻譜中的至少一個頻譜的水平。
16.根據(jù)權(quán)利要求15所述的音頻信號處理方法,還包括以下步驟將在所述控制并輸出水平的步驟中獲得的所述頻域信號變換為時序信號。
17.根據(jù)權(quán)利要求15所述的音頻信號處理方法,還包括以下步驟確定在所述變換兩個時序音頻信號的步驟中產(chǎn)生的所述頻譜之間的所述兩個時序音頻信號的相位差,其中,所述控制并輸出水平的步驟基于在所述確定水平比或水平差的步驟中確定的所述水平比或水平差以及在所述確定相位差的步驟中確定的所述相位差,控制并輸出在所述變換兩個時序音頻信號的步驟中產(chǎn)生的所述兩個頻譜中的至少一個頻譜的水平。
18.根據(jù)權(quán)利要求17所述的音頻信號處理方法,還包括以下步驟將在所述控制并輸出水平的步驟中獲得的所述頻域信號變換為時序信號。
19.根據(jù)權(quán)利要求15所述的音頻信號處理方法,還包括以下步驟檢測在所述控制并輸出水平的步驟中獲得的所述輸出譜中的最大水平的頻率,以將所檢測出的頻率輸出為輸出數(shù)據(jù)。
20.一種音頻信號處理裝置,包括劃分單元,所述劃分單元將兩個音頻信號中的每一個劃分為多個頻帶;水平比較單元,所述水平比較單元確定在通過所述劃分單元被劃分的所述多個頻帶的每一個中,所述兩個音頻信號之間的水平比或水平差;和輸出控制單元,所述輸出控制單元根據(jù)通過所述水平比較單元確定的所述水平比或水平差,控制所述劃分單元的輸出。
21.一種音頻信號處理裝置,包括第一變換單元,所述第一變換單元將兩個時序音頻信號中的第一時序音頻信號變換為第一頻域信號;第二變換單元,所述第二變換單元將所述兩個時序音頻信號中的第二時序音頻信號變換為第二頻域信號;水平確定單元,所述水平確定單元確定從所述第一變換單元獲得的所述第一頻域信號的頻譜與從所述第二變換單元獲得的所述第二頻域信號的頻譜之間的水平比或水平差;和輸出控制單元,所述輸出控制單元基于通過所述水平確定單元確定的所述水平比或水平差,控制并輸出從所述第一變換單元和所述第二變換單元的至少一個獲得的頻譜的水平。
全文摘要
本發(fā)明公開了一種音頻信號處理裝置和方法。音頻信號處理裝置包括劃分單元,用于將兩個音頻信號中的每一個劃分為多個頻帶;水平比較單元,用于確定在劃分單元劃分的多個頻帶的每一個中,兩個音頻信號之間的水平比或水平差;以及輸出控制單元,用于根據(jù)水平比較單元確定的水平比或水平差,控制劃分單元的輸出。
文檔編號H04S7/00GK1747608SQ200510098788
公開日2006年3月15日 申請日期2005年9月7日 優(yōu)先權(quán)日2004年9月8日
發(fā)明者山田裕司, 沖本越 申請人:索尼株式會社