亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于BCC?KNN的云計算中心智能運維方法及系統(tǒng)與流程

文檔序號:12278185閱讀:461來源:國知局
一種基于BCC?KNN的云計算中心智能運維方法及系統(tǒng)與流程

本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種基于BCC-KNN的云計算中心智能運維方法及系統(tǒng)。



背景技術(shù):

NIST定義云計算是一個模型,用于隨時隨地的按需快速的通過網(wǎng)絡(luò)訪問一個可配置的計算資源(網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用程序和服務(wù))共享池。計算資源只需要很小的管理代價和與服務(wù)提供商較少的交互便能夠快速的獲取和釋放。云計算模型由5個基本特征、3種服務(wù)模型、4種部署模型組成。

基本特征有按需自服務(wù)、資源池化、廣泛的網(wǎng)絡(luò)連接方式、快速的彈性擴展、可計量的服務(wù)。

按需自服務(wù)是指用戶可以自主地根據(jù)需要單向地準(zhǔn)備計算資源,不需要與服務(wù)提供商進行交互。

資源池化是指服務(wù)提供者將計算資源匯集到資源池中(類型包括存儲、處理、內(nèi)存、帶寬、和虛擬機等),通過多租戶模式共享給多個消費者,根據(jù)消費者的需求對不同的物理資源和虛擬資源進行動態(tài)分配或重分配。以用戶為中心的界面使云基礎(chǔ)架構(gòu)能夠?qū)崿F(xiàn)應(yīng)用對用戶的透明性,用戶基于自已的需求訪問服務(wù)而不用考慮服務(wù)是在哪里提供。

廣泛的網(wǎng)絡(luò)連接方式是指通過標(biāo)準(zhǔn)化,云計算提供的資源能夠被各種異構(gòu)的瘦終端或特定的客戶端,比如手機、平板電腦、工作站所訪問。

快速的彈性擴展是云計算的一個很重要的特征,因為資源池化和快速彈性,用戶能夠獲取的資源似乎是無窮無盡的,并且可以在任何時候獲取任何數(shù)量的資源。彈性的重要性在于能夠按需分配資源,應(yīng)用程序駐留在可以快速進行水平擴展的數(shù)據(jù)中心中,即云服務(wù)的規(guī)??煽焖偕炜s,以自動適應(yīng)業(yè)務(wù)負(fù)載的動態(tài)變化。用戶使用的資源同業(yè)務(wù)的需求相一致,避免了因為服務(wù)器性能過載或冗余而導(dǎo)致的服務(wù)質(zhì)量下降或資源浪費。值得注意的是,資源的擴展必須是細(xì)粒度并且足夠快速才能使計算資源跟計算負(fù)載很好的匹配。因為服務(wù)器的峰值工作量比平均值要高3-10倍,所以傳統(tǒng)的數(shù)據(jù)中心的服務(wù)器利用率大概僅在10%到30%左右。為了保證服務(wù)質(zhì)量,服務(wù)器要按峰值工作量需求來部署,這就必然導(dǎo)致了非峰值時間資源的浪費,而且負(fù)載的波動性越強浪費的資源就越多。

可計量的服務(wù)是指云系統(tǒng)利用一種計量功能來自動調(diào)控和優(yōu)化資源利用,根據(jù)不同的服務(wù)類型按照合適的度量指標(biāo)進行計量、監(jiān)控和報告資源使用情況,提升服務(wù)提供者和服務(wù)消費者的透明度。

然而,現(xiàn)在云計算中心的規(guī)模過大,傳統(tǒng)環(huán)境中的低頻異常在云計算中心就會因規(guī)模化而變成高頻異常,并且許多的異常會重復(fù)出現(xiàn)。因此,若是不能利用有效的方式而是要人為負(fù)責(zé)大量異常的處理,這就會導(dǎo)致了較高的同種異常人工重復(fù)處理成本,即異常發(fā)生并處理后,當(dāng)再次出現(xiàn)時人工還要重復(fù)處理過程。

另外,云應(yīng)用本身在運行過程中會產(chǎn)生相關(guān)的狀態(tài)數(shù)據(jù),這些數(shù)據(jù)會指導(dǎo)運維人員對異常進行判定,但大量的云應(yīng)用產(chǎn)生的海量的運行狀態(tài)數(shù)據(jù)會導(dǎo)致運維人員要花費大量的時間和精力去分析這些數(shù)據(jù)來定位異常并判定其類型,延長了異常的修復(fù)時間。

最后,由于傳統(tǒng)環(huán)境下的維護管理的手段、系統(tǒng)、模型的設(shè)計都不是面向云計算中心的,所以許多的維護任務(wù)不能用簡單的步驟一次完成,這就迫使云管理者要投入大量人力資源,導(dǎo)致較高的運營費用。



技術(shù)實現(xiàn)要素:

為了解決上述技術(shù)問題,本發(fā)明的目的是提供一種能快速處理異常情況,且能降低運營成本的一種基于BCC-KNN的云計算中心智能運維方法及系統(tǒng)。

本發(fā)明所采用的技術(shù)方案是:

一種基于BCC-KNN的云計算中心智能運維方法,包括以下步驟:

A、檢測所有服務(wù)的運行狀態(tài)是否發(fā)生異常,并對發(fā)生異常的服務(wù)采集其運行狀態(tài)數(shù)據(jù);

B、對采集得到的運行狀態(tài)數(shù)據(jù)進行處理并將其利用BCC-KNN算法進行分類處理;

C、根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案并執(zhí)行。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟A包括:

A1、對所有服務(wù)的運行狀態(tài)數(shù)據(jù)進行循環(huán)檢測,判斷其是否發(fā)生異常,若是,則執(zhí)行步驟A2;否則進行執(zhí)行步驟A1;

A2、對發(fā)生異常的服務(wù)進行運行狀態(tài)數(shù)據(jù)的采集。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟B包括:

B1、對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理;

B2、將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式;

B3、對轉(zhuǎn)換格式后的運行狀態(tài)數(shù)據(jù)利用BCC-KNN算法進行實時分類處理,得出服務(wù)對應(yīng)的異常類別。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟B3包括:

B31、將存儲的實例集按照異常類別進行劃分聚簇;

B32、計算各聚簇內(nèi)所有實例的數(shù)據(jù)的均值,得到異常聚簇中心;

B33、對未分類的運行狀態(tài)數(shù)據(jù)與各異常聚簇中心進行相似度計算,將其歸類至與其相似度最高的異常聚簇中心所在的聚簇,并將該聚簇的異常類別作為其對應(yīng)的異常類別,從而得到該服務(wù)對應(yīng)的異常類別。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟C包括:

C1、根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案;

C2、根據(jù)需要調(diào)用的解決方案,生成其自動化執(zhí)行腳本,并執(zhí)行。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟C2后還包括:

C3、檢測腳本執(zhí)行后該異常是否處理成功,若不成功,則發(fā)送警報通知工作人員進行人為處理;

C4、根據(jù)分類后聚簇的運行狀態(tài)數(shù)據(jù),對聚簇的異常聚簇中心進行更新。

本發(fā)明所采用的另一技術(shù)方案是:

一種基于BCC-KNN的云計算中心智能運維系統(tǒng),包括:

異常狀態(tài)采集模塊,用于檢測所有服務(wù)的運行狀態(tài)是否發(fā)生異常,并對發(fā)生異常的服務(wù)采集其運行狀態(tài)數(shù)據(jù);

異常檢測模塊,用于對采集得到的運行狀態(tài)數(shù)據(jù)進行處理并將其利用BCC-KNN算法進行分類處理;

異常處理模塊,用于根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案并執(zhí)行。

作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常狀態(tài)采集模塊包括:

運行狀態(tài)檢測模塊,用于對所有服務(wù)的運行狀態(tài)數(shù)據(jù)進行循環(huán)檢測,判斷其是否發(fā)生異常,若是,則執(zhí)行數(shù)據(jù)采集模塊;否則進行執(zhí)行運行狀態(tài)檢測模塊;

數(shù)據(jù)采集模塊,用于對發(fā)生異常的服務(wù)進行運行狀態(tài)數(shù)據(jù)的采集。

作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常檢測模塊包括:

數(shù)據(jù)處理模塊,用于對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理;

數(shù)據(jù)轉(zhuǎn)換模塊,用于將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式;

數(shù)據(jù)分類模塊,用于對轉(zhuǎn)換格式后的運行狀態(tài)數(shù)據(jù)利用BCC-KNN算法進行實時分類處理,得出服務(wù)對應(yīng)的異常類別。

作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常處理模塊包括:

處理方案生成模塊,用于根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案;

自動化執(zhí)行模塊,用于根據(jù)需要調(diào)用的解決方案,生成其自動化執(zhí)行腳本,并執(zhí)行。

本發(fā)明的有益效果是:

本發(fā)明一種基于BCC-KNN的云計算中心智能運維方法通過對異常情況依次進行檢測、判定和自動化解決執(zhí)行的過程,能對云服務(wù)發(fā)生的異常情況進行智能自主處理,有效減少人為的介入,提高異常處理的速度,實現(xiàn)提高服務(wù)的可用性和減少工作人員的工作量的目的,大大減少運營成本。

本發(fā)明的另一個有益效果是:

本發(fā)明一種基于BCC-KNN的云計算中心智能運維系統(tǒng)通過異常狀態(tài)采集模塊、異常檢測模塊和異常處理模塊對異常情況依次進行檢測、判定和自動化解決執(zhí)行的過程,能對云服務(wù)發(fā)生的異常情況進行智能自主處理,有效減少人為的介入,提高異常處理的速度,實現(xiàn)提高服務(wù)的可用性和減少工作人員的工作量的目的,大大減少運營成本。

附圖說明

下面結(jié)合附圖對本發(fā)明的具體實施方式作進一步說明:

圖1是本發(fā)明一種基于BCC-KNN的云計算中心智能運維方法的步驟流程圖;

圖2是本發(fā)明一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的模塊方框圖。

具體實施方式

參考圖1,本發(fā)明一種基于BCC-KNN的云計算中心智能運維方法,包括以下步驟:

A、檢測所有服務(wù)的運行狀態(tài)是否發(fā)生異常,并對發(fā)生異常的服務(wù)采集其運行狀態(tài)數(shù)據(jù);

B、對采集得到的運行狀態(tài)數(shù)據(jù)進行處理并將其利用BCC-KNN算法進行分類處理;

C、根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案并執(zhí)行。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟A包括:

A1、對所有服務(wù)的運行狀態(tài)數(shù)據(jù)進行循環(huán)檢測,判斷其是否發(fā)生異常,若是,則執(zhí)行步驟A2;否則進行執(zhí)行步驟A1;

A2、對發(fā)生異常的服務(wù)進行運行狀態(tài)數(shù)據(jù)的采集。

其中,對機器或服務(wù)進行檢測,若發(fā)生異常則采集異常發(fā)生時的運行狀態(tài)數(shù)據(jù)。這里需要預(yù)先對正常情況數(shù)據(jù)進行設(shè)定范圍,超過則判定為異常,比如對某項服務(wù)要求是對一個請求的響應(yīng)時間不能超過3秒,因此編寫的檢測工具就可以是對訪問時間進行計時,超過三秒即認(rèn)為該服務(wù)發(fā)生異常,然后對該服務(wù)進行循環(huán)檢測,當(dāng)發(fā)生異常時(相應(yīng)時間超3秒)便采集該服務(wù)的運行狀態(tài)數(shù)據(jù)。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟B包括:

B1、對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理;

B2、將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式;

B3、對轉(zhuǎn)換格式后的運行狀態(tài)數(shù)據(jù)利用BCC-KNN算法進行實時分類處理,得出服務(wù)對應(yīng)的異常類別。

BCC-KNN算法主要有三個優(yōu)點,第一點在于在存在傾斜類分布的情況下仍然具備較好的分類性能,第二點在于改進了傳統(tǒng)KNN需要存儲整個訓(xùn)練集的缺點,只需存儲由訓(xùn)練集轉(zhuǎn)換的數(shù)據(jù)結(jié)構(gòu),大副降低存儲代價并提高分類的實時性,第三點在于BCC-KNN支持增量學(xué)習(xí),能隨著異常數(shù)據(jù)的不斷產(chǎn)生自主進化,持續(xù)的適應(yīng)新的環(huán)境。

進一步,所述對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理包括處理無效值、缺失值并去除不完整的數(shù)據(jù)、錯誤的數(shù)據(jù)、重復(fù)的數(shù)據(jù)使得注入處理系統(tǒng)的數(shù)據(jù)量降低,加快數(shù)據(jù)的處理速度進而提升處理效率。

進一步,將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式包含將數(shù)據(jù)轉(zhuǎn)換成其它合適的數(shù)值表示方式,或者對數(shù)據(jù)進行歸一化處理,使得每個屬性的取值范圍不會相差過大,并且數(shù)據(jù)的每個屬性都是可計算的。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟B3包括:

B31、將存儲的實例集按照異常類別進行劃分聚簇;

B32、計算各聚簇內(nèi)所有實例的數(shù)據(jù)的均值,得到異常聚簇中心;

B33、對未分類的運行狀態(tài)數(shù)據(jù)與各異常聚簇中心進行相似度計算,將其歸類至與其相似度最高的異常聚簇中心所在的聚簇,并將該聚簇的異常類別作為其對應(yīng)的異常類別,從而得到該服務(wù)對應(yīng)的異常類別。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟C包括:

C1、根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案;

C2、根據(jù)需要調(diào)用的解決方案,生成其自動化執(zhí)行腳本,并執(zhí)行。

進一步,解決方案的生成調(diào)用是利用相對簡單的異常處理方案組合而成,也就是說一個異常解決方案是由很多個子方案構(gòu)成,這樣可以增加方案的靈活性和重用性。解決方案需要按照預(yù)先定義好的格式進行編寫,執(zhí)行時可以根據(jù)機器的環(huán)境自動生成相對應(yīng)的腳本。

作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟C2后還包括:

C3、檢測腳本執(zhí)行后該異常是否處理成功,若不成功,則發(fā)送警報通知工作人員進行人為處理;

C4、根據(jù)分類后聚簇的運行狀態(tài)數(shù)據(jù),對聚簇的異常聚簇中心進行更新。

進一步,當(dāng)一個新異常出現(xiàn)時,已存的方案不能很好的進行處理導(dǎo)致處理失敗,此時就需要通知工作人員進行人為編寫解決方案并放入方案庫,更新異常類別和方案的對應(yīng)關(guān)系,同時將新的異常狀態(tài)加入訓(xùn)練集用以提高該類的預(yù)測準(zhǔn)確率,進而當(dāng)該異常狀態(tài)再次出現(xiàn)時就能夠自主處理而不用人為再次參與。

參考圖2,本發(fā)明一種基于BCC-KNN的云計算中心智能運維系統(tǒng),包括:

異常狀態(tài)采集模塊,用于檢測所有服務(wù)的運行狀態(tài)是否發(fā)生異常,并對發(fā)生異常的服務(wù)采集其運行狀態(tài)數(shù)據(jù);

異常檢測模塊,用于對采集得到的運行狀態(tài)數(shù)據(jù)進行處理并將其利用BCC-KNN算法進行分類處理;

異常處理模塊,用于根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案并執(zhí)行。

作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常狀態(tài)采集模塊包括:

運行狀態(tài)檢測模塊,用于對所有服務(wù)的運行狀態(tài)數(shù)據(jù)進行循環(huán)檢測,判斷其是否發(fā)生異常,若是,則執(zhí)行數(shù)據(jù)采集模塊;否則進行執(zhí)行運行狀態(tài)檢測模塊;

數(shù)據(jù)采集模塊,用于對發(fā)生異常的服務(wù)進行運行狀態(tài)數(shù)據(jù)的采集。

作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常檢測模塊包括:

數(shù)據(jù)處理模塊,用于對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理;

數(shù)據(jù)轉(zhuǎn)換模塊,用于將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式;

數(shù)據(jù)分類模塊,用于對轉(zhuǎn)換格式后的運行狀態(tài)數(shù)據(jù)利用BCC-KNN算法進行實時分類處理,得出服務(wù)對應(yīng)的異常類別。

作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常處理模塊包括:

處理方案生成模塊,用于根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案;

自動化執(zhí)行模塊,用于根據(jù)需要調(diào)用的解決方案,生成其自動化執(zhí)行腳本,并執(zhí)行。

其中,本發(fā)明中的BCC-KNN算法核心思想是將訓(xùn)練實例集轉(zhuǎn)換成異常聚簇中心集。一個異常類別包含許多的實例,每個實例有自已的具體屬性數(shù)據(jù),我們依據(jù)異常類別將實例進行劃分,即具有相同異常類別的所有實例屬于同一個聚簇。

當(dāng)HTTP數(shù)據(jù)集按異常類別劃分后,同一個劃分內(nèi)的實例類別相同,因此每個類別可以看作是一個聚簇。因為傳統(tǒng)KNN算法要和每個全部訓(xùn)練集實例進行相似度運算,這就有很大的計算開銷并且要將整個訓(xùn)練集存儲起來,所以我們?nèi)裟軐澐趾蟮木鄞赜靡粋€模型表示,那么就能將訓(xùn)練數(shù)據(jù)集轉(zhuǎn)換成了模型,我們采用的模型就是計算聚簇內(nèi)的所有的實例的均值,并將這個均值作為聚簇的中心,這樣每個聚簇就只需要一條記錄即可表示,存儲量大大降低。有了異常聚簇中心集后,就要對未分類的實例進行分類,算法將未分類的實例與轉(zhuǎn)換后的異常聚簇中心進行相似度計算,而不是和整個訓(xùn)練集計算相似度,然后將相似度最高的聚簇中心的異常類別作為實例的類別。具體的說就是利用KNN算法的思想,將未分類的實例與每個聚簇中心進行相似度計算。若相似度采用歐式距離,那么在和所有的聚簇中心依次計算距離后,將與其距離最近的聚簇中心所在的異常類別作為該實例的分類結(jié)果。因為算法的分類采用相似度計算,并且選取相似度最高的聚簇中心作為實例的分類結(jié)果,即K的取值為1,這就降低偏斜類分布的影響。

另外,算法將訓(xùn)練集轉(zhuǎn)換成異常聚簇中心,使得算法只需與異常聚簇中心而不是和整個訓(xùn)練集進行相似度計算,這樣不但使得分類的速度大大加快降低時間復(fù)雜度,同時也降低了空間復(fù)雜度,因為同樣只需要存儲聚簇中心而不是整個訓(xùn)練集,使得所有的異常聚簇中心可以全部放入內(nèi)存,有利于聚簇中心的快速更新,此處的重要性在于時間和空間復(fù)雜度的降低使得算法能夠大幅提高分類的實時性。

因為BCC-KNN將數(shù)據(jù)集轉(zhuǎn)換為異常聚簇中心集,所以為了實現(xiàn)增量式學(xué)習(xí)算法要能根據(jù)新產(chǎn)生異常實例來調(diào)整異常聚簇中心集,將新知識與舊知識結(jié)合,使得異常聚簇中心集能隨著新知識的加入不斷調(diào)整適應(yīng)新的環(huán)境。同時為了防止過期的舊知識對新環(huán)境的處理造成影響,還要丟棄過期的部分聚簇中心值。當(dāng)產(chǎn)生異常實例時,異常的類別只有新的異常和已經(jīng)發(fā)生異常兩種類型。針對這兩種類型的異常算法的增量學(xué)習(xí)策略如下:

若異常是已經(jīng)發(fā)生過的,那么就將該異常實例劃分到該異常類別對應(yīng)的聚簇中,然后基于該實例與聚簇中心重新計算聚簇中心。

若異常是新的異常,那么此時就將該異常實例劃分為一個新的聚簇,然后將該實例作為聚簇中心。

存儲了異常聚簇中心集后,異常實例產(chǎn)生后我們要對異常聚簇中心進行更新,我們用(Anew,Bnew,Cnew,Nnew…,class)向量來描述新產(chǎn)生的HTTP數(shù)據(jù)和異常的類別正確對應(yīng),具體為(0.75,0.78,0.79,0.29,0,0.77,負(fù)載過高),記為(VCTnew,class)。首先我們判定class的值,因class的值“負(fù)載過高”能在聚簇列別中找到,就說明產(chǎn)生的異常實例是已經(jīng)發(fā)生過的,那么直接將該異常實例與其異常類別對應(yīng)的聚簇中心進行平均值計算。負(fù)載過高對應(yīng)的聚簇中心向量CLUcenter進行平均值計算,新中心向量記為NEWCLUcenter,因此計算公式如下:

若異常實例所屬的異常類別是第一次出現(xiàn),我們同樣用(VCTnew,class)來描述,具體的數(shù)據(jù)與異常類別對應(yīng)為(0.8,0.1,0.1,0,0,0,配置錯誤),即其class的值為配置錯誤。由于異常聚簇中心集中就沒有配置錯誤類別對應(yīng)的聚簇條目,因此可知該異常類別是第一次發(fā)生,所以我們要將該異常實例劃分到一個新的聚簇中,聚簇對應(yīng)的類別就是配置錯誤,而實例的聚簇中心NEWCLUcenter就初始化為(VCTnew,class)。

通過前面的描述,可知算法能夠根據(jù)新產(chǎn)生的異常實例不斷調(diào)整異常聚簇中心集,但是為了防止舊數(shù)據(jù)對利用新知識分類這個過程的影響,算法會丟棄過期的數(shù)據(jù),算法定義一個固定時間段,這也是數(shù)據(jù)的有效期,那么隨著時間的流逝,超過有效期的數(shù)據(jù)就會被丟棄,這樣就使得異常聚簇中心集總是能夠持續(xù)的適應(yīng)最新的環(huán)境。

由于我們的聚簇中心是計算該異常類別下所有實例的平均值,因此,為了刪除過期的數(shù)據(jù),我們給異常聚簇中心集中的每個數(shù)據(jù)條目一個時間戳,然后將時間戳在有效期內(nèi)的子聚簇中心組合共同來計算平均值。簡單說就是聚簇中心由幾個子中心構(gòu)成,每個子中心都有自己的時間戳,隨時間流逝,過期的時間戳標(biāo)識的子聚簇中心就被刪除,不能再被用作生成聚簇中心。

比如我們把過期時間限定為三個月,以月為單位刪除舊數(shù)據(jù),那么我們可以將每個月作為一個子聚類中心,因此就有3個子聚簇中心,假設(shè)當(dāng)前月為0,上個月為1,上上個月為2。實際的聚簇中心是由三個子聚簇中心算出的,我們用CLU0sub-center來表示時間戳為0的條目,CLU1sub-center來表示時間戳為1的條目,CLU2sub-center來表示時間戳為2的條目,并假設(shè)我們用(中心屬性Areal,中心屬性Breal,中心屬性Creal…)向量來表示負(fù)載過高異常類別的聚簇中心,記為CLUreal-center,而這個聚簇中心是真正用來計算相似度的使用的,那么CLUreal-center計算公式如下;

當(dāng)時間進入新的月份后,所有新產(chǎn)生的實例都標(biāo)識為新月份的時間戳,子聚簇中心的初始化過程和新異常類別發(fā)生的過程相似,即將新月份內(nèi)產(chǎn)生的第一個該異常類別的實例作為子聚簇中心,其后的產(chǎn)生的實例與再與該子聚簇中心重新計算均值。接下來要將時間超過三個月的子聚簇中心刪除,以多時間戳聚簇中心集為例,當(dāng)進入新的月份時,每個時間戳的值加1,異常聚簇中心集中的所有時間戳標(biāo)識大于2的條目應(yīng)被刪除。我們假設(shè)進入新月份產(chǎn)生的負(fù)載過高異常為(0.73,0.782,0.80,0.22,0,0.76,負(fù)載過高)。

以上是對本發(fā)明的較佳實施進行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實施例,熟悉本領(lǐng)域的技術(shù)人員在不違背本發(fā)明精神的前提下還可做作出種種的等同變形或替換,這些等同的變形或替換均包含在本申請權(quán)利要求所限定的范圍內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1