本發(fā)明屬于計(jì)算機(jī)領(lǐng)域,特別涉及計(jì)算機(jī)中的數(shù)據(jù)挖掘領(lǐng)域,具體涉及一種多元時(shí)序數(shù)據(jù)的模式預(yù)測(cè)方法。
背景技術(shù):
時(shí)序預(yù)測(cè)在天氣預(yù)報(bào),股票等領(lǐng)域是一個(gè)非常重要的研究方向。在時(shí)序預(yù)測(cè)中一個(gè)最重要的方法就是能夠根據(jù)一些變量的趨勢(shì)去預(yù)測(cè)其他變量的行為,這就叫做多元時(shí)序預(yù)測(cè)。例如,如果我們認(rèn)為兩個(gè)變量相關(guān),那我們可能想知道例如在天氣預(yù)報(bào)中溫度增加了10%是否影響了濕度的趨勢(shì)。
在多元預(yù)測(cè)中,我們可以將主要的一些方法分成數(shù)學(xué)和人工的方法。數(shù)學(xué)方法中如arima(autoregressiveintegratedmovingaveragemodel,將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將因變量?jī)H對(duì)它的滯后值以及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸所建立的模型)或者指數(shù)平滑算法在處理真實(shí)世界中的非線性無(wú)規(guī)律數(shù)據(jù)時(shí)均不可靠。人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和k近鄰都是一些應(yīng)用于時(shí)間序列預(yù)測(cè)的機(jī)器學(xué)習(xí)方法。然而由于很多的時(shí)間變量會(huì)隨著時(shí)間平移和伸縮,這些傳統(tǒng)的方法就會(huì)失效。為了解決這個(gè)問題,一個(gè)解決方案就是考慮一個(gè)序列的行為而不是考慮一個(gè)變量值。例如一些方法在時(shí)間序列分析中進(jìn)行模式預(yù)測(cè)。這些方法都假定一種對(duì)數(shù)據(jù)表示然后盡力去尋找最頻繁的模式。然而,這些解決方案存在的主要問題是:這些方法中數(shù)據(jù)表示并沒有降低數(shù)據(jù)維數(shù)尤其是高維數(shù)據(jù),而且他們還必須去用例如聚類的方法處理數(shù)據(jù)導(dǎo)致時(shí)間復(fù)雜度提高;另外一個(gè)問題是他們的研究沒有能力解釋輸出規(guī)則和關(guān)系,因此時(shí)間復(fù)雜度的減小和解釋輸出規(guī)則和關(guān)系需要得要有效的解決。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)的缺陷和不足,本發(fā)明的目的是提供一種多元時(shí)序數(shù)據(jù)的模式預(yù)測(cè)方法,解決現(xiàn)有的數(shù)據(jù)處理方法時(shí)間復(fù)雜度高的問題。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案予以實(shí)現(xiàn):
一種多元時(shí)序數(shù)據(jù)的模式預(yù)測(cè)方法,包括以下步驟:
階段一:對(duì)每一個(gè)條件變量及決策變量所形成的時(shí)間序列尋找候選興趣模式集,分別對(duì)每個(gè)候選興趣模式集進(jìn)行聚類;
步驟1:尋找候選興趣模式集;
步驟1.1:尋找可用初始子序列
對(duì)于時(shí)間序列s={s1,…,sl},從s1開始依次尋找斜率m1≠0的兩個(gè)相鄰時(shí)間序列值,將首次尋找到的兩個(gè)相鄰時(shí)間序列值作為初始子序列si={si,si+1},其中,i=1,2,…,l-1,l為時(shí)間序列的長(zhǎng)度,斜率m1的計(jì)算公式為:
步驟1.2:計(jì)算相鄰時(shí)間序列值的斜率
給可用初始子序列增加下一個(gè)si+2,計(jì)算si+2和si+1的斜率m2;
步驟1.3:獲取興趣模式
如果m2不等于m1,得到興趣模式pα={si,si+1,si+2};
如果m2等于m1,繼續(xù)步驟1.2,直到mk不等于m1為止,得到興趣模式pα={si,si+1,…,si+k},其中,mk為si+k和si+k-1的斜率,k=1,2,…,l-2;
步驟1.4獲取候選興趣模式集
對(duì)于時(shí)間序列s={s1,…,sl},從興趣模式pα的最后一個(gè)時(shí)間序列值開始,重復(fù)步驟1.1至步驟1.3,直到找到整個(gè)時(shí)間序列s={s1,…,sl}中所有的興趣模式,形成候選興趣模式集pc={p1,p2,…,pα,…,pβ,…,pn};
步驟2:候選興趣模式集聚類;
步驟2.1:利用以下剪枝規(guī)則①和剪枝規(guī)則②給滿足規(guī)則條件的模式距離值賦為無(wú)窮大;
剪枝規(guī)則①:如果候選興趣模式集pc中的任意兩個(gè)興趣模式pα,pβ沒有同時(shí)出現(xiàn)在區(qū)域?qū)挾葹閣s的同一區(qū)域中,將距離矩陣d中的dαβ賦為無(wú)窮大;其中,ws是用戶指定的參數(shù),d為興趣模式的距離矩陣,
dαβ=dαβ(pα,pβ),dαβ為pα和pβ的歐幾里德距離;
剪枝規(guī)則②:如果興趣模式pα的斜率為負(fù),且興趣模式pβ的斜率為正,將距離矩陣d中的dαβ賦為無(wú)窮大;
步驟2.2:計(jì)算距離矩陣中dαβ為非無(wú)窮大的元素的距離,并賦值到距離矩陣中相應(yīng)的位置;
步驟2.3:比較dαβ(pα,pβ)和用戶指定的dmin之間的大小,若dαβ≤dmin,從pc中刪除pα和pβ兩個(gè)興趣模式中時(shí)間序列值的個(gè)數(shù)較小的興趣模式,最終得到新的興趣模式集p;
其中,dmin取相鄰兩個(gè)時(shí)間序列值之間的歐幾里德距離最小值和最大值之間的某個(gè)值,具體由用戶指定;
階段二:產(chǎn)生預(yù)測(cè)規(guī)則
步驟3:用apriori算法計(jì)算關(guān)聯(lián)規(guī)則
合并每個(gè)時(shí)間變量的興趣模式集p得到pall,利用apriori算法對(duì)pall中的興趣模式進(jìn)行關(guān)聯(lián)規(guī)則挖掘,獲取不同時(shí)間變量間的多個(gè)關(guān)聯(lián)規(guī)則;
步驟4:生成預(yù)測(cè)規(guī)則
①把m(pvm)=m(p′)=1的多個(gè)關(guān)聯(lián)規(guī)則合并形成如下的預(yù)測(cè)規(guī)則:
a1≤v(pv1)≤b1,且a2≤v(pv2)≤b2,…,且aj≤v(pv)j≤bj,…,且aλ≤v(pvλ)≤b,則c1≤v(p′)≤c2,并且延遲δt1個(gè)單位時(shí)間;
其中,pvj是條件變量形成的興趣模式,j=1,2,…,λ,λ≥1,λ為條件變量的個(gè)數(shù),p′是決策變量形成的興趣模式;
m(pvm)是sl和s1之間的斜率,m(pvm)=sgn(sl-s1),pvm是條件變量中對(duì)決策變量影響最大的興趣模式,sl是pvm中最后一個(gè)時(shí)間序列值,s1是pvm中第一個(gè)時(shí)間序列值;m(p′)是s′l和s1′之間的斜率,s′l代表p′中最后一個(gè)時(shí)間序列值,s1′代表p′中第一個(gè)時(shí)間序列值;
aj和bj分別是m(pvm)=m(p′)=1的興趣模式關(guān)聯(lián)規(guī)則中v(pvj)的最小值和最大值,c1和c2分別是m(pvm)=m(p′)=1的興趣模式關(guān)聯(lián)規(guī)則中v(p′)的最小值和最大值,aj、bj、c1和c2均是正數(shù);
v(pvj)是條件變量中興趣模式pvj的變化量,v(p′)是決策變量中興趣模式p′的變化量,
v(pvj)=(max(pvj)-min(pvj))×m(pvj)
v(p′)=(max(p′)-min(p′))×m(p′)
max(pvj)和min(pvj)分別表示興趣模式pvj的最大時(shí)間序列值和最小時(shí)間序列值;
時(shí)延δt1=max(δ(rg)),δ(rg)=ipvm-ip′,ipvm是pvm的起始時(shí)間值,ip′是p′的起始時(shí)間值;
②把m(pvm)=m(p′)=-1的多個(gè)關(guān)聯(lián)規(guī)則合并形成如下的預(yù)測(cè)規(guī)則:
e1≤v(pv1)≤f1,且e2≤v(pv2)≤f2,…,且ej≤v(pv)j≤f,j…,且eη≤v(pvη)≤fη,則g1≤v(p′)≤g2,并且延遲δt2個(gè)單位時(shí)間;
其中,ej和fj分別是m(pvm)=m(p′)=-1的興趣模式關(guān)聯(lián)規(guī)則中v(pj)的最小值和最大值,g1和g2分別是m(pvm)=m(p′)=-1的興趣模式關(guān)聯(lián)規(guī)則中v(p′)的最小值和最大值,j=1,2,…,η,η≥1,η為條件變量的個(gè)數(shù);ej、fj、g1和g2均是負(fù)數(shù),j為自然數(shù);δt2=max(δ(rg));
階段三:將待測(cè)數(shù)據(jù)的條件變量執(zhí)行階段一獲得的興趣模式去匹配階段二的預(yù)測(cè)規(guī)則,若滿足預(yù)測(cè)規(guī)則的前件,則輸出決策變量的預(yù)測(cè)結(jié)果。
進(jìn)一步的,所述的步驟2中候選興趣模式集聚類方法可以用如下方法替換:
步驟2.1:利用r-tree構(gòu)建候選模式集中的每個(gè)模式的mbr,形成模式的數(shù)據(jù)結(jié)構(gòu),得到模式的索引;
步驟2.2:對(duì)r-tree數(shù)據(jù)結(jié)構(gòu)中的每個(gè)孩子節(jié)點(diǎn)i和j,利用以下剪枝規(guī)則1和規(guī)則2給滿足規(guī)則條件的模式距離值賦為無(wú)窮大。
剪枝規(guī)則①:如果兩個(gè)興趣模式pα,pβ沒有同時(shí)出現(xiàn)在區(qū)域?qū)挾葹閣s的同一區(qū)域中,將距離矩陣中的dαβ賦為無(wú)窮大;其中,ws是用戶指定的參數(shù),d為興趣模式的距離矩陣,
dαβ=dαβ(pα,pβ),dαβ為pα和pβ的歐幾里德距離;
剪枝規(guī)則②:如果興趣模式pα的斜率為負(fù),且興趣模式pβ的斜率為正,將距離矩陣d中的dαβ賦為無(wú)窮大;
步驟2.3:距離矩陣d中dαβ為非無(wú)窮大的元素按照歐幾里德距離進(jìn)行計(jì)算,并賦值到距離矩陣中相應(yīng)的位置;
步驟2.4:比較dαβ(pα,pβ)和用戶指定的dmin之間的大小,若dαβ≤dmin,從pc中刪除pα和pβ兩個(gè)興趣模式中時(shí)間序列的個(gè)數(shù)較小的興趣模式,最終得到新的興趣模式集p;其中,dmin取相鄰兩個(gè)時(shí)間序列之間的歐幾里德距離最小值和最大值之間的某個(gè)值,具體由用戶指定。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:本發(fā)明的多元時(shí)序數(shù)據(jù)的模式預(yù)測(cè)方法計(jì)算量小,有效的減小模式預(yù)測(cè)中的時(shí)間復(fù)雜度,解決了傳統(tǒng)方法中時(shí)間復(fù)雜度過高的問題。
附圖說明
圖1是空氣溫度和夯土溫度的時(shí)序圖。
圖2是空氣溫度和夯土溫度的變量關(guān)系圖。
圖3是模式間的mbr。
圖4是本發(fā)明所提出的用于檢索候選模式的基于r-tree的數(shù)據(jù)結(jié)構(gòu)圖。
圖5是歐幾里得距離測(cè)量的使用剪枝與未使用剪枝策略進(jìn)行距離矩陣計(jì)算的性能與序列號(hào)圖。
圖6是使用剪枝規(guī)則的歐氏距離計(jì)算所用的時(shí)間和使用剪枝和r-tree進(jìn)行距離矩陣計(jì)算的時(shí)間性能比較圖。
圖7是實(shí)施例中生成的六個(gè)規(guī)則的性能評(píng)價(jià)。
以下結(jié)合實(shí)施例對(duì)本發(fā)明的具體內(nèi)容作進(jìn)一步詳細(xì)解釋說明。
具體實(shí)施方式
本發(fā)明中的條件變量是能夠用來預(yù)測(cè)其他變量的變量,決策變量就是可以被其他變量預(yù)測(cè)的變量。
本發(fā)明的方法過程分為三個(gè)階段:
階段一:對(duì)每一個(gè)條件變量及決策變量所形成的時(shí)間序列尋找候選興趣模式集,分別對(duì)每個(gè)候選興趣模式集進(jìn)行聚類;階段二:產(chǎn)生預(yù)測(cè)規(guī)則;階段三:根據(jù)階段二生成的預(yù)測(cè)規(guī)則對(duì)待測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè)。
其中階段一和階段二是訓(xùn)練階段,將已有的數(shù)據(jù)執(zhí)行階段一和階段二后得到預(yù)測(cè)規(guī)則,階段三是針對(duì)待測(cè)量的數(shù)據(jù),將待測(cè)量數(shù)據(jù)經(jīng)歷階段一后獲得的興趣模式去匹配階段二中的預(yù)測(cè)規(guī)則,若滿足預(yù)測(cè)規(guī)則的前件,則輸出決策變量的預(yù)測(cè)結(jié)果。
在階段一中:尋找興趣模式,并總結(jié)數(shù)據(jù)的行為,對(duì)于數(shù)據(jù)的變化,尋找斜率為正和斜率為負(fù)的模式。由于序列數(shù)據(jù)可能包含重復(fù)的模式,該算法對(duì)這些模式進(jìn)行聚類和分組,具體為:
步驟1:尋找候選興趣模式集
步驟1.1:尋找可用初始子序列
對(duì)于時(shí)間序列s={s1,…,sl},從s1開始依次尋找斜率m1不為0的兩個(gè)相鄰時(shí)間序列值,將首次尋找到的兩個(gè)相鄰時(shí)間序列值作為初始子序列si={si,si+1},其中,i=1,2,…,l-1,l為時(shí)間序列的長(zhǎng)度,
步驟1.2:計(jì)算相鄰時(shí)間序列值的斜率
給可用初始子序列增加下一個(gè)si+2,計(jì)算si+2和si+1的斜率m2;
步驟1.3:獲取興趣模式
如果m2不等于m1,得到興趣模式pα={si,si+1,si+2};
如果m2等于m1,繼續(xù)步驟1.2,直到mk不等于m1為止,得到興趣模式pα={si,si+1,…,si+k},其中,mk為si+k和si+k-1的斜率,k=1,2,…,l-2;
步驟1.4獲取候選興趣模式集
對(duì)于時(shí)間序列s={s1,…,sl},從興趣模式pα的最后一個(gè)時(shí)間序列值(即si+k)開始,重復(fù)步驟1.1至步驟1.3,直到找到整個(gè)時(shí)間序列s={s1,…,sl}的n個(gè)興趣模式,形成候選興趣模式集pc={p1,p2,…,pα,…,pβ,…,pn};
步驟2:候選興趣模式集聚類;
在候選模式集中將相似模式分組,尋找相似模式的第一步是在模式之間生成一個(gè)距離矩陣。對(duì)于每一對(duì)模式,一個(gè)距離矩陣的元素顯示了兩個(gè)模式的距離。然而傳統(tǒng)的算法的時(shí)間消耗太大,為了解決這個(gè)問題,本發(fā)明中提出了兩種方法:一種為剪枝規(guī)則,另一種為r-tree結(jié)合剪枝規(guī)則。
對(duì)于剪枝規(guī)則,具體如下:
步驟2.1:利用以下剪枝規(guī)則①和剪枝規(guī)則②給滿足規(guī)則條件的模式距離值賦為無(wú)窮大;
剪枝規(guī)則①:如果候選興趣模式集pc中的任意兩個(gè)興趣模式pα,pβ沒有同時(shí)出現(xiàn)在區(qū)域?qū)挾葹閣s的同一區(qū)域中,那么這兩個(gè)模式的距離為無(wú)窮大,將距離矩陣d中的dαβ賦為無(wú)窮大;其中,ws是用戶指定的參數(shù),d為興趣模式的距離矩陣,
dαβ=dαβ(pα,pβ),dαβ為pα和pβ的歐幾里德距離;
剪枝規(guī)則②:使用模式的斜率來進(jìn)行剪枝,如果興趣模式pα的斜率為負(fù),且興趣模式pβ的斜率為正,則它們不能被認(rèn)為是相似的,將距離矩陣d中的dαβ填充為無(wú)窮大;
步驟2.2:計(jì)算距離矩陣中dαβ為非無(wú)窮大的元素之間的歐幾里德距離,并賦值到距離矩陣中相應(yīng)的位置。
步驟2.3:比較dαβ(pα,pβ)和用戶指定的dmin之間的大小,若dαβ≤dmin,從pc中刪除pα和pβ兩個(gè)興趣模式中時(shí)間序列值的個(gè)數(shù)較小的興趣模式,最終得到新的興趣模式集p;其中,dmin取相鄰兩個(gè)時(shí)間序列值之間的歐幾里德距離最小值和最大值之間的某個(gè)值,時(shí)間序列值具體由用戶指定。
對(duì)于r-tree結(jié)合剪枝規(guī)則,r-tree用來索引候選模式集pc,如圖4所示,p1-p9為候選模式,r樹結(jié)構(gòu)中每一個(gè)樹的葉結(jié)點(diǎn)為一個(gè)候選模式的mbr。具體如下:
步驟2.1:利用r-tree構(gòu)建候選模式集中的每個(gè)模式的mbr,形成模式的數(shù)據(jù)結(jié)構(gòu),得到模式的索引;其中每一個(gè)葉子節(jié)點(diǎn)是一個(gè)模式的mbr,r-tree的中間項(xiàng)用附近的mbr來索引模式。這個(gè)數(shù)據(jù)結(jié)構(gòu)通過減少處理的模式的數(shù)量將被用來減少算法的時(shí)間復(fù)雜度。圖3說明了模式p1和模式p2間的mbr。
步驟2.2:對(duì)r-tree數(shù)據(jù)結(jié)構(gòu)中的每個(gè)孩子節(jié)點(diǎn)i和j,利用以下剪枝規(guī)則1和規(guī)則2給滿足規(guī)則條件的模式距離值賦為無(wú)窮大。
剪枝規(guī)則①:如果候選興趣模式集pc中的任意兩個(gè)興趣模式pα,pβ沒有同時(shí)出現(xiàn)在區(qū)域?qū)挾葹閣s的同一區(qū)域中,那么這兩個(gè)模式的距離為無(wú)窮大,將距離矩陣d中的dαβ賦為無(wú)窮大;其中,ws是用戶指定的參數(shù),d為興趣模式的距離矩陣,
dαβ=dαβ(pα,pβ),dαβ為pα和pβ的歐幾里德距離;
剪枝規(guī)則②:使用模式的斜率來進(jìn)行剪枝,如果興趣模式pα的斜率為負(fù),且興趣模式pβ的斜率為正,則它們不能被認(rèn)為是相似的,將距離矩陣d中的dαβ填充為無(wú)窮大;
步驟2.3:計(jì)算距離矩陣中dαβ為非無(wú)窮大的元素之間的歐幾里德距離,并賦值到距離矩陣中相應(yīng)的位置。
步驟2.4:比較dαβ(pα,pβ)和用戶指定的dmin之間的大小,若dαβ≤dmin,從pc中刪除pα和pβ兩個(gè)興趣模式中時(shí)間序列值的個(gè)數(shù)較小的興趣模式,最終得到新的興趣模式集p;其中,dmin取相鄰兩個(gè)時(shí)間序列值之間的歐幾里德距離最小值和最大值之間的某個(gè)值,具體由用戶指定。
階段二:產(chǎn)生預(yù)測(cè)規(guī)則
步驟3:用apriori算法計(jì)算關(guān)聯(lián)規(guī)則
合并每個(gè)時(shí)間變量的興趣模式集p成pall,利用apriori算法對(duì)pall中的興趣模式進(jìn)行關(guān)聯(lián)規(guī)則挖掘,獲取不同時(shí)間變量間興趣模式的關(guān)聯(lián)規(guī)則:
其中,g=1,2,…,r,pvj是條件變量形成的興趣模式,p′是決策變量形成的興趣模式;
按照如下的公式計(jì)算關(guān)聯(lián)規(guī)則rg的方向、時(shí)延和變化量:
關(guān)聯(lián)規(guī)則的方向計(jì)算公式:
其中,m(pvm)是sl和s1之間的斜率,m(pvm)=sgn(sl-s1),pvm是條件變量中對(duì)決策變量影響最大的興趣模式,sl代表pvm中最后一個(gè)時(shí)間序列值,s1代表pvm中第一個(gè)時(shí)間序列值;m(p′)是s′l和s′之間的斜率,s′l代表p′中最后一個(gè)時(shí)間序列值,s′代表p′中第一個(gè)時(shí)間序列值;
時(shí)延的計(jì)算公式:
δt1=max(δ(rg)),δ(rg)=ipvm-ip′(4)
其中,ipvm是pvm的起始時(shí)間值,ip′是p′的起始時(shí)間值;
規(guī)則的變化量:
v(pvj)=(max(pvj)-min(pvj))×m(pvj)
v(p′)=(max(p′)-min(p′))×m(p′)(5)
其中,v(pvj)是條件變量中興趣模式pvj的變化量,v(p′)是決策變量中興趣模式p′的變化量,max(pvj)和min(pvj)分別表示興趣模式pvj的最大時(shí)間序列值和最小時(shí)間序列值。
步驟4:生成預(yù)測(cè)規(guī)則
①把m(pvm)=m(p′)=1的多個(gè)關(guān)聯(lián)規(guī)則合并形成如下的預(yù)測(cè)規(guī)則:
a1≤v(pv1)≤b1,且a2≤v(pv2)≤b2,…,且aj≤v(pv)j≤bj,…,且aλ≤v(pvλ)≤b,則c1≤v(p′)≤c2,并且延遲δt1個(gè)單位時(shí)間;
其中,aj和bj分別是m(pvm)=m(p′)=1的興趣模式關(guān)聯(lián)規(guī)則rg中v(pvj)的最小值和最大值,c1和c2分別是m(pvm)=m(p′)=1的興趣模式關(guān)聯(lián)規(guī)則rg中v(p′)的最小值和最大值,j=1,2,…,λ,λ≥1,λ為條件變量的個(gè)數(shù),aj、bj、c1和c2均是正數(shù)。
②把m(pvm)=m(p′)=-1的多個(gè)關(guān)聯(lián)規(guī)則合并形成如下的預(yù)測(cè)規(guī)則:
e1≤v(pv1)≤f1,且e2≤v(pv2)≤f2,…,且ej≤v(pv)j≤f,j…,且eη≤v(pvη)≤fη,則g1≤v(p′)≤g2,并且延遲δt2個(gè)單位時(shí)間;
其中,ej和fj分別是m(pvm)=m(p′)=-1的興趣模式關(guān)聯(lián)規(guī)則中v(pj)的最小值和最大值,g1和g2分別是m(pvm)=m(p′)=-1的興趣模式關(guān)聯(lián)規(guī)則中v(p′)的最小值和最大值,ej、fj、g1和g2均是負(fù)數(shù),j=1,2,…,η,η≥1,η為條件變量的個(gè)數(shù);δt2=max(δ(rg)),δ(rg)=ipvm-ip′,ipvm是pvm的起始時(shí)間值,ip′是p′的起始時(shí)間值;
本發(fā)明使用命中率h用于說明本發(fā)明算法的性能,h定義為:
其中,n為條件變量中準(zhǔn)確匹配預(yù)測(cè)規(guī)則的興趣模式的數(shù)目,m為條件變量中興趣模式的總數(shù)目。
以下給出本發(fā)明的具體實(shí)施例,需要說明的是本發(fā)明并不局限于以下具體實(shí)施例,凡在本申請(qǐng)技術(shù)方案基礎(chǔ)上做的等同變換均落入本發(fā)明的保護(hù)范圍。
實(shí)施例1
本實(shí)施例給出將本發(fā)明算法用于預(yù)測(cè)明長(zhǎng)城遺址的土體溫度,其中,圖1和圖2分別為明長(zhǎng)城遺址空氣溫度和夯土溫度的時(shí)序圖及其變量關(guān)系圖,將該時(shí)序數(shù)據(jù)通過上述三個(gè)階段的處理,其中,本實(shí)施例在階段一中只使用了剪枝規(guī)則候選興趣模式集聚類,其結(jié)果如圖5,其中,naive曲線表示的是既不使用剪枝規(guī)則也不使用r-tree數(shù)據(jù)結(jié)構(gòu)的聚類結(jié)果,pruning-based曲線表示使用剪枝規(guī)則的聚類結(jié)果,從圖中可以看出,隨著時(shí)間序列數(shù)量的增加,未使用剪枝規(guī)則的歐氏距離計(jì)算所用的時(shí)間程指數(shù)增長(zhǎng),而使用了剪枝規(guī)則進(jìn)行距離計(jì)算的時(shí)間增長(zhǎng)緩慢。
實(shí)施例2
本實(shí)施例與實(shí)施例1的區(qū)別點(diǎn)在于:本實(shí)施例在階段一中使用了r-tree的數(shù)據(jù)結(jié)構(gòu)結(jié)合剪枝規(guī)則候選興趣模式集聚類,這個(gè)數(shù)據(jù)結(jié)構(gòu)通過減少處理的模式的數(shù)量將被用來減少算法的時(shí)間復(fù)雜度,如圖6所示。橫軸是時(shí)間序列的數(shù)量,可以看到隨著時(shí)間序列數(shù)量的增加,使用剪枝規(guī)則結(jié)合r-tree進(jìn)行距離矩陣計(jì)算的時(shí)間比僅使用剪枝規(guī)則進(jìn)行距離矩陣計(jì)算的時(shí)間增長(zhǎng)緩慢。在空氣溫度的時(shí)序圖中,p1和p2為本發(fā)明算法識(shí)別的候選模式集,可以構(gòu)建兩個(gè)模式間的mbr,圖3所示為模式p1和模式p2之間的mbr。
表1為本實(shí)施例生成的六個(gè)具體的預(yù)測(cè)規(guī)則,
表1預(yù)測(cè)規(guī)則
圖7是本實(shí)施例根據(jù)上述六個(gè)預(yù)測(cè)規(guī)則的預(yù)測(cè)結(jié)果,圖中橫軸為監(jiān)測(cè)區(qū)域,縱軸為命中率。圖7中展示了生成的六個(gè)預(yù)測(cè)規(guī)則在區(qū)域1,2,3,4,5中進(jìn)行預(yù)測(cè)的命中率h的對(duì)比結(jié)果,其中規(guī)則3的平均命中率最高。