1.一種分離音頻內(nèi)容中的音頻源的方法,所述音頻內(nèi)容包括多個(gè)聲道,所述方法包括:
從所述音頻內(nèi)容的多個(gè)時(shí)頻塊中獲得多個(gè)數(shù)據(jù)樣本;
在多次迭代中分析所述數(shù)據(jù)樣本以生成多個(gè)成分,其中所述成分中的每個(gè)成分指示具有所述數(shù)據(jù)樣本的方差的方向,并且其中在所述多次迭代的每次迭代中,利用權(quán)值來(lái)加權(quán)所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本,所述權(quán)值基于所述多個(gè)成分中所選擇的成分;以及
基于所選擇的成分來(lái)確定所述音頻內(nèi)容的源方向,以供從所述音頻內(nèi)容中分離音頻源。
2.根據(jù)權(quán)利要求1所述的方法,其中在所述多次迭代的每次迭代中,所選擇的成分是指示具有所述數(shù)據(jù)樣本的最高方差的方向的成分。
3.根據(jù)權(quán)利要求1或2所述的方法,其中在多次迭代中分析所述數(shù)據(jù)樣本以生成多個(gè)成分包括:
針對(duì)所述多次迭代中的每次迭代:
對(duì)所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本進(jìn)行加權(quán);
分析經(jīng)加權(quán)的數(shù)據(jù)樣本以生成多個(gè)成分;以及
基于所述多個(gè)成分中的所選擇的成分,確定在下一次迭代的所述加權(quán)中用于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的權(quán)值。
4.根據(jù)權(quán)利要求3所述的方法,其中確定用于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的權(quán)值包括:
基于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的方向與由所選擇的成分指示的方向之間的相關(guān)度,確定用于所述數(shù)據(jù)樣本的權(quán)值,
其中所述權(quán)值與所述相關(guān)度正相關(guān)。
5.根據(jù)權(quán)利要求3所述的方法,其中確定用于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的權(quán)值包括:
基于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的強(qiáng)度,確定用于所述數(shù)據(jù)樣本的權(quán)值,
其中所述權(quán)值與所述強(qiáng)度正相關(guān)。
6.根據(jù)權(quán)利要求1或2所述的方法,進(jìn)一步包括:
在所述多次迭代的一次迭代中將所選擇的成分調(diào)整預(yù)定的偏移值。
7.根據(jù)權(quán)利要求1或2所述的方法,其中所述權(quán)值是第一權(quán)值并且所述多次迭代是第一多次迭代,并且其中所述方法進(jìn)一步包括:
在第二多次迭代中執(zhí)行所述第一多次迭代和所述確定以獲得用于從所述音頻內(nèi)容中分離音頻源的多個(gè)源方向,
其中在所述第二多次迭代的每次迭代中,利用第二權(quán)值來(lái)加權(quán)所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本,所述第二權(quán)值基于獲得的源方向而被確定。
8.根據(jù)權(quán)利要求7所述的方法,其中在第二多次迭代中執(zhí)行所述第一多次迭代和所述確定包括:
針對(duì)所述第二多次迭代中的每次迭代:
利用所述第二權(quán)值對(duì)所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本進(jìn)行加權(quán);
基于經(jīng)加權(quán)的數(shù)據(jù)樣本來(lái)執(zhí)行所述第一多次迭代和所述確定,以獲得源方向;以及
基于所述源方向,確定在所述第二多次迭代的下一次迭代的所述加權(quán)中用于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的所述第二權(quán)值。
9.根據(jù)權(quán)利要求8所述的方法,其中確定用于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的所述第二權(quán)值包括:
基于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的方向和所述源方向的相關(guān)度與預(yù)定閾值之間的差異,確定用于所述數(shù)據(jù)樣本的所述第二權(quán)值,
其中所述第二權(quán)值與所述相關(guān)度負(fù)相關(guān)。
10.根據(jù)權(quán)利要求9所述的方法,其中所述閾值基于所述數(shù)據(jù)樣本的方向與所述源方向之間的相關(guān)度的分布而被確定。
11.根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包括:
通過(guò)基于所獲得的源方向預(yù)先下混音所述音頻內(nèi)容來(lái)修剪所獲得的源方向,以丟棄冗余源方向。
12.根據(jù)權(quán)利要求11所述的方法,其中修剪所獲得的源方向包括:
從所述源方向中選擇源方向作為確認(rèn)源方向;以及
針對(duì)剩余的源方向中的給定源方向:
基于所述確認(rèn)源方向和所述給定源方向來(lái)預(yù)先下混音所述音頻內(nèi)容,以從所述音頻內(nèi)容中分離音頻源,
確定所分離的音頻源之間的相似度,
基于所述相似度確定所述給定源方向是冗余源方向或者是確認(rèn)源方向,以及
響應(yīng)于確定所述給定源方向是冗余源方向而丟棄所述給定源方向。
13.一種分離音頻內(nèi)容中的音頻源的系統(tǒng),所述音頻內(nèi)容包括多個(gè)聲道,所述系統(tǒng)包括:
數(shù)據(jù)樣本獲取單元,被配置為從所述音頻內(nèi)容的多個(gè)時(shí)頻塊中獲得多個(gè)數(shù)據(jù)樣本;
成分分析單元,被配置為在多次迭代中分析所述數(shù)據(jù)樣本以生成多個(gè)成分,其中所述成分中的每個(gè)成分指示具有所述數(shù)據(jù)樣本的方差的方向,并且其中在所述多次迭代的每次迭代中,利用權(quán)值來(lái)加權(quán)所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本,所述權(quán)值基于所述多個(gè)成分中所選擇的成分;以及
源方向確定單元,被配置為基于所選擇的成分來(lái)確定所述音頻內(nèi)容的源方向,以供從所述音頻內(nèi)容中分離音頻源。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其中在所述多次迭代的每次迭代中,所選擇的成分指示具有所述數(shù)據(jù)樣本的最高方差的方向。
15.根據(jù)權(quán)利要求13或14所述的系統(tǒng),其中所述成分分析單元被配置為:
針對(duì)所述多次迭代中的每次迭代:
對(duì)所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本進(jìn)行加權(quán);
分析經(jīng)加權(quán)的數(shù)據(jù)樣本以生成多個(gè)成分;以及
基于所述多個(gè)成分中的所選擇的成分,確定在下一次迭代的所述加權(quán)中用于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的權(quán)值。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其中所述成分分析單元被配置為基于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的方向與由所選擇的成分指示的方向之間的相關(guān)度,確定用于所述數(shù)據(jù)樣本的權(quán)值,
其中所述權(quán)值與所述相關(guān)度正相關(guān)。
17.根據(jù)權(quán)利要求15所述的系統(tǒng),其中所述成分分析單元被配置為基于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的強(qiáng)度,確定用于所述數(shù)據(jù)樣本的權(quán)值,
其中所述權(quán)值與所述強(qiáng)度正相關(guān)。
18.根據(jù)權(quán)利要求13或14所述的系統(tǒng),進(jìn)一步包括:
成分調(diào)整單元,被配置為在所述多次迭代的一次迭代中將所選擇的成分調(diào)整預(yù)定的偏移值。
19.根據(jù)權(quán)利要求13或14所述的系統(tǒng),其中所述權(quán)值是第一權(quán)值并且所述多次迭代是第一多次迭代,并且其中所述系統(tǒng)進(jìn)一步包括:
迭代執(zhí)行單元,被配置為在第二多次迭代中執(zhí)行所述第一多次迭代和所述確定以獲得用于從所述音頻內(nèi)容中分離音頻源的多個(gè)源方向,
其中在所述第二多次迭代的每次迭代中,利用第二權(quán)值來(lái)加權(quán)所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本,所述第二權(quán)值基于獲得的源方向而被確定。
20.根據(jù)權(quán)利要求19所述的系統(tǒng),其中所述迭代執(zhí)行單元被配置為:
針對(duì)所述第二多次迭代中的每次迭代:
利用所述第二權(quán)值對(duì)所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本進(jìn)行加權(quán);
基于經(jīng)加權(quán)的數(shù)據(jù)樣本來(lái)執(zhí)行所述第一多次迭代和所述確定,以獲得源方向;以及
基于所述源方向,確定在所述第二多次迭代的下一次迭代的所述加權(quán)中用于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的所述第二權(quán)值。
21.根據(jù)權(quán)利要求20所述的系統(tǒng),其中所述迭代執(zhí)行單元被配置為:基于所述數(shù)據(jù)樣本中的每個(gè)數(shù)據(jù)樣本的方向和所述源方向的相關(guān)度與預(yù)定閾值之間的差異,確定用于所述數(shù)據(jù)樣本的所述第二權(quán)值,
其中所述第二權(quán)值與所述相關(guān)度負(fù)相關(guān)。
22.根據(jù)權(quán)利要求21所述的系統(tǒng),其中所述閾值基于所述數(shù)據(jù)樣本的方向與所述源方向之間的相關(guān)度的分布而被確定。
23.根據(jù)權(quán)利要求19所述的系統(tǒng),進(jìn)一步包括:
源方向修剪單元,被配置為通過(guò)基于所獲得的源方向預(yù)先下混音所述音頻內(nèi)容來(lái)修剪所獲得的源方向,以丟棄冗余源方向。
24.根據(jù)權(quán)利要求23所述的系統(tǒng),其中所述源方向修剪單元被配置為:
從所述源方向中選擇源方向作為確認(rèn)源方向;以及
針對(duì)剩余的源方向中的給定源方向:
基于所述確認(rèn)源方向和所述給定源方向來(lái)預(yù)先下混音所述音頻內(nèi)容,以從所述音頻內(nèi)容中分離音頻源,
確定所分離的音頻源之間的相似度,
基于所述相似度確定所述給定源方向是冗余源方向或者是確認(rèn)源方向,以及
響應(yīng)于確定所述給定源方向是冗余源方向而丟棄所述給定源方向。
25.一種分離音頻內(nèi)容中的音頻源的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括被有形地體現(xiàn)在機(jī)器可讀介質(zhì)上的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包含程序代碼,所述程序代碼用于執(zhí)行根據(jù)權(quán)利要求1至12中任一項(xiàng)所述的方法。