1.一種用于因果關(guān)系挖掘的方法,包括:
基于切分點將目標(biāo)數(shù)據(jù)及其影響因素的時間序列劃分為多個時間分段;以及
學(xué)習(xí)所述多個時間分段中的各個時間分段中的因果關(guān)系以及延遲參數(shù),
其中所述劃分和所述學(xué)習(xí)迭代地執(zhí)行,以得到優(yōu)化時間分段和各個優(yōu)化時間分段中的因果關(guān)系和延遲參數(shù),其中在迭代中所使用的切分點基于先前迭代中的各個時間分段中的延遲參數(shù)來更新。
2.根據(jù)權(quán)利要求1所述的方法,其中學(xué)習(xí)所述多個時間分段中的各個時間分段中的因果關(guān)系以及延遲參數(shù)包括:
采樣所述各個時間分段的延遲參數(shù),所述延遲參數(shù)包括延遲最小值以及延遲長度,其中基于所述延遲最小值和所述延遲長度確定所述影響因素的向量選取范圍;
基于所述延遲最小值和所述延遲長度建立分組spike-and-slab模型;以及
利用可逆跳變馬爾科夫鏈蒙特卡洛采樣結(jié)合期望傳播來推導(dǎo)所述各個時間分段的因果關(guān)系和延遲參數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其中利用可逆跳變馬爾科夫鏈蒙特卡洛采樣結(jié)合期望傳播來推導(dǎo)所述各個時間分段的因果關(guān)系和延遲參數(shù)包括:
基于所述可逆跳變馬爾科夫鏈蒙特卡洛采樣來更新所述切分點;以及
基于所述期望傳播來推導(dǎo)各個時間分段的因果關(guān)系和延遲參數(shù)。
4.根據(jù)權(quán)利要求3所述的方法,其中更新所述切分點和推導(dǎo)各個時間分段的因果關(guān)系和延遲參數(shù)基于隨機(jī)采樣的第一概率的大小選擇性地執(zhí)行。
5.根據(jù)權(quán)利要求3或4所述的方法,其中所述切分點的更新動作包括新增、刪除以及移動其中一個。
6.根據(jù)權(quán)利要求3或4所述的方法,其中基于可逆跳變馬爾科夫鏈蒙特卡洛采樣來更新所述切分點包括:
響應(yīng)于所述隨機(jī)采樣的第一概率滿足切分點的特定更新動作的條件,執(zhí)行所述特定更新動作;
基于根據(jù)最近推導(dǎo)的各個時間分段中的延遲參數(shù)而確定的模型參數(shù)空間的更新前聯(lián)合分布和更新后聯(lián)合分布,確定所述特定更新動作的接受概率;以及
響應(yīng)于隨機(jī)采樣的第二概率小于所述特定更新動作的接受概率,接受所述特定更新動作。
7.根據(jù)權(quán)利要求1-4任一項所述的方法,其中在學(xué)習(xí)所述多個時間分段中的各個時間分段中的因果關(guān)系以及延遲參數(shù)時,至少還基于所述多個時間分段中除待學(xué)習(xí)時間分段之外的其他時間分段來執(zhí)行對待學(xué)習(xí)時間分段的訓(xùn)練。
8.根據(jù)權(quán)利要求7所述的方法,其中針對所述待學(xué)習(xí)時間分段和所述其它時間分段分配相應(yīng)的分段權(quán)重,其中距離所述待學(xué)習(xí)時間分段較近的時間分段比距離所述待學(xué)習(xí)時間分段較遠(yuǎn)的時間分段具有更大的分段權(quán)重。
9.根據(jù)權(quán)利要求7所述的方法,其中所述其他時間分段是所述多個時間分段中除所述待學(xué)習(xí)時間分段之外的所有其他時間分段。
10.根據(jù)權(quán)利要求7所述的方法,其中所述分段權(quán)重基于核函數(shù)來確定。
11.根據(jù)權(quán)利要求1至4其中任一項所述的方法,其中初始的切分點的數(shù)目是基于截斷的泊松分布而選擇的,并且其中切分點位置不重疊且所述切分點位置的選擇概率為均勻分布。
12.根據(jù)權(quán)利要求1至4任一項所述的方法,其中基于以下其中任何一個來確定已經(jīng)搜到索優(yōu)化時間分段:
多次迭代的分段劃分更新情況;以及
潛在規(guī)模縮減因子。
13.一種用于因果關(guān)系挖掘的裝置,包括:
切分點劃分模塊,被配置為基于切分點將目標(biāo)數(shù)據(jù)及其影響因素的時間序列劃分為多個時間分段;以及
關(guān)系和參數(shù)學(xué)習(xí)模塊,被配置為學(xué)習(xí)所述多個時間分段中的各個時間分段中的因果關(guān)系以及延遲參數(shù),
其中所述切分點劃分模塊和所述關(guān)系和參數(shù)學(xué)習(xí)模塊迭代地執(zhí)行操作,以得到優(yōu)化時間分段和各個優(yōu)化時間分段中的因果關(guān)系和延遲參數(shù),其中在迭代中所使用的切分點基于先前迭代中的各個時間分段中的延遲參數(shù)來更新。
14.根據(jù)權(quán)利要求13所述的裝置,其中所述關(guān)系和參數(shù)學(xué)習(xí)模塊包括:
延遲參數(shù)采集模塊,被配置為采樣所述各個時間分段的延遲參數(shù),所述延遲參數(shù)包括延遲最小值以及延遲長度,其中基于所述延遲最小值和所述延遲長度確定所述影響因素的向量選取范圍;
模型構(gòu)建模塊,被配置為基于所述延遲最小值和所述延遲長度建立分組spike-and-slab模型;以及
關(guān)系和參數(shù)推導(dǎo)模塊,被配置為利用可逆跳變馬爾科夫鏈蒙特卡洛采樣結(jié)合期望傳播來推導(dǎo)所述各個時間分段的因果關(guān)系和延遲參數(shù)。
15.根據(jù)權(quán)利要求14所述的裝置,其中所述關(guān)系和參數(shù)推導(dǎo)模塊被進(jìn)一步配置為:
基于所述可逆跳變馬爾科夫鏈蒙特卡洛采樣來更新所述切分點;以及
基于所述期望傳播來推導(dǎo)各個時間分段的因果關(guān)系和延遲參數(shù)。
16.根據(jù)權(quán)利要求15所述的裝置,其中更新所述切分點和推導(dǎo)各個時間分段的因果關(guān)系和延遲參數(shù)基于隨機(jī)采樣的第一概率的大小而選擇性地執(zhí)行。
17.根據(jù)權(quán)利要求15或16所述的裝置,其中所述切分點的更新動作包括新增、刪除以及移動其中一個。
18.根據(jù)權(quán)利要求15或16所述的裝置,其中基于可逆跳變馬爾科夫鏈蒙特卡洛采樣來更新所述切分點包括:
響應(yīng)于所述隨機(jī)采樣的第一概率滿足切分點的特定更新動作的條件,執(zhí)行所述特定更新動作;
基于根據(jù)最近推導(dǎo)的各個時間分段中的延遲參數(shù)而確定的模型參數(shù)空間的更新前聯(lián)合分布和更新后聯(lián)合分布,確定所述特定更新動作的接受概率;以及
響應(yīng)于隨機(jī)采樣的第二概率小于所述特定更新動作的接受概率,接受所述特定更新動作。
19.根據(jù)權(quán)利要求13-16任一項所述的裝置,其中所述關(guān)系和參數(shù)學(xué)習(xí)模塊在學(xué)習(xí)所述多個時間分段中的各個時間分段中的因果關(guān)系以及延遲參數(shù)時,至少還基于所述多個時間分段中除待學(xué)習(xí)時間分段之外的其他時間分段來執(zhí)行對待學(xué)習(xí)時間分段的訓(xùn)練。
20.根據(jù)權(quán)利要求19所述的裝置,其中所述關(guān)系和參數(shù)學(xué)習(xí)模塊被配置為針對所述待學(xué)習(xí)時間分段和所述其它時間分段分配相應(yīng)的分段權(quán)重,其中距離所述待學(xué)習(xí)時間分段較近的時間分段比距離所述待學(xué)習(xí)時間分段較遠(yuǎn)的時間分段具有更大的分段權(quán)重。
21.根據(jù)權(quán)利要求19所述的裝置,其中所述其他時間分段是所述多個時間分段中除所述待學(xué)習(xí)時間分段之外的所有其他時間分段。
22.根據(jù)權(quán)利要求19所述的裝置,其中所述分段權(quán)重基于核函數(shù)來確定。
23.根據(jù)權(quán)利要求13至16其中任一項所述的裝置,其中初始的切分點的數(shù)目是基于截斷的泊松分布而選擇的,并且其中切分點位置不重疊且所述切分點位置的選擇概率在時間序列中均勻分布。
24.根據(jù)權(quán)利要求13至16任一項所述的裝置,其中基于以下其中任何一個來確定是否已經(jīng)搜到索優(yōu)化時間分段:
多次迭代的分段劃分更新情況;以及
潛在規(guī)??s減因子。