數(shù)據(jù)預(yù)處理裝置及方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種數(shù)據(jù)預(yù)處理裝置及方法。根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)預(yù)處理裝置,包括:風(fēng)險(xiǎn)度分析單元,利用對(duì)象系統(tǒng)的故障歷史信息及所述對(duì)象系統(tǒng)的特性信息來(lái)計(jì)算所述對(duì)象系統(tǒng)的故障風(fēng)險(xiǎn)度;采集周期設(shè)定單元,根據(jù)計(jì)算出的所述故障風(fēng)險(xiǎn)度,確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期;預(yù)處理單元,根據(jù)所述數(shù)據(jù)采集周期,對(duì)從所述對(duì)象系統(tǒng)采集的數(shù)據(jù)執(zhí)行預(yù)處理。
【專(zhuān)利說(shuō)明】
數(shù)據(jù)預(yù)處理裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的實(shí)施例涉及一種數(shù)據(jù)預(yù)處理裝置及方法。
【背景技術(shù)】
[0002]近年來(lái),隨著企業(yè)或公共機(jī)關(guān)的業(yè)務(wù)的電子化,構(gòu)筑專(zhuān)門(mén)的數(shù)據(jù)中心的事例越來(lái)越多。對(duì)于數(shù)據(jù)中心而言,一般被構(gòu)成為包括用于分別執(zhí)行所分配的工作的多個(gè)服務(wù)器及用于監(jiān)控各個(gè)服務(wù)器及檢測(cè)故障的專(zhuān)門(mén)的監(jiān)控設(shè)備。
[0003]由于包括在數(shù)據(jù)中心的服務(wù)器與其他驅(qū)動(dòng)服務(wù)器一起被驅(qū)動(dòng)的情況多于各自獨(dú)立地被驅(qū)動(dòng),因此即便僅一部分網(wǎng)絡(luò)服務(wù)器出現(xiàn)障礙,稍有不慎也會(huì)影響整體業(yè)務(wù)。因此,迅速檢測(cè)出各個(gè)服務(wù)器的故障而應(yīng)對(duì),在運(yùn)營(yíng)數(shù)據(jù)中心時(shí)非常重要。但是構(gòu)成數(shù)據(jù)中心的各個(gè)服務(wù)器的設(shè)備構(gòu)成部件(中央處理器、存儲(chǔ)器、磁盤(pán)、文件系統(tǒng)等)、各個(gè)構(gòu)成部件的測(cè)定周期、采集的數(shù)據(jù)的種類(lèi)等非常多樣。因此,為了對(duì)在各自不同的服務(wù)器中采集的數(shù)據(jù)進(jìn)行準(zhǔn)確分析,針對(duì)所采集的原始數(shù)據(jù)的預(yù)處理工作是必需的。
[0004]【現(xiàn)有技術(shù)文獻(xiàn)】
[0005]【專(zhuān)利文獻(xiàn)】
[0006]第2012-0179658 號(hào)美國(guó)公開(kāi)專(zhuān)利公報(bào)(2012.07.12.)
[0007]第2010-0257145 號(hào)美國(guó)公開(kāi)專(zhuān)利公報(bào)(2010.10.07.)
【發(fā)明內(nèi)容】
[0008]本發(fā)明的實(shí)施例旨在提供一種針對(duì)從由多種規(guī)格(specificat1n)構(gòu)成的服務(wù)器獲得的數(shù)據(jù)的有效的預(yù)處理手段。
[0009]根據(jù)本發(fā)明的一方面,提供了一種數(shù)據(jù)預(yù)處理裝置,包括:風(fēng)險(xiǎn)度分析單元,利用對(duì)象系統(tǒng)的故障歷史信息及所述對(duì)象系統(tǒng)的特性信息來(lái)計(jì)算所述對(duì)象系統(tǒng)的故障風(fēng)險(xiǎn)度;采集周期設(shè)定單元,根據(jù)計(jì)算出的所述故障風(fēng)險(xiǎn)度,確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期;預(yù)處理單元,根據(jù)所述數(shù)據(jù)采集周期,對(duì)從所述對(duì)象系統(tǒng)采集的數(shù)據(jù)執(zhí)行預(yù)處理。
[0010]所述風(fēng)險(xiǎn)度分析單元可基于所述故障歷史信息來(lái)生成包括回歸分析模型、機(jī)器學(xué)習(xí)模型或者基于規(guī)則的模型中的一種以上的風(fēng)險(xiǎn)度分析模型,并將所述對(duì)象系統(tǒng)的特性信息或者所述對(duì)象系統(tǒng)的狀態(tài)信息應(yīng)用到生成的所述風(fēng)險(xiǎn)度分析模型而計(jì)算出所述對(duì)象系統(tǒng)的故障風(fēng)險(xiǎn)度。
[0011]所述采集周期設(shè)定單元可以以計(jì)算出的所述故障風(fēng)險(xiǎn)度越高所述數(shù)據(jù)采集周期就越短的方式確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期。
[0012]所述采集周期設(shè)定單元可利用計(jì)算出的所述故障風(fēng)險(xiǎn)度及已設(shè)定的系統(tǒng)負(fù)載時(shí)間段信息來(lái)確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期。
[0013]所述采集周期設(shè)定單元可將所述系統(tǒng)負(fù)載時(shí)間段內(nèi)的數(shù)據(jù)采集周期設(shè)定為短于除所述系統(tǒng)負(fù)載時(shí)間段外的數(shù)據(jù)采集周期。
[0014]所述數(shù)據(jù)預(yù)處理裝置還可包括:計(jì)算區(qū)間設(shè)定單元,根據(jù)所述對(duì)象系統(tǒng)的狀態(tài)來(lái)設(shè)定用于所述預(yù)處理單元的數(shù)據(jù)預(yù)處理的計(jì)算區(qū)間(time window)。
[0015]所述計(jì)算區(qū)間設(shè)定單元可將所述計(jì)算區(qū)間設(shè)定為,所述對(duì)象系統(tǒng)的中央處理器使用率或者輔助存儲(chǔ)裝置使用率越高,所述計(jì)算區(qū)間就越短。
[0016]所述對(duì)象系統(tǒng)的特性信息可包括:所述對(duì)象系統(tǒng)的硬件規(guī)格(specificat1n)、操作系統(tǒng)(Operat1n System)信息、系統(tǒng)設(shè)定信息及正在執(zhí)行的軟件信息中的一種以上。
[0017]所述數(shù)據(jù)的預(yù)處理可包括:從所述對(duì)象系統(tǒng)采集的數(shù)據(jù)的歸一化(normalizat1n)、插值(interpolat1n)、填補(bǔ)(imputat1n)、主成分分析(principalcomponent analysis)或者統(tǒng)計(jì)分析中的一種以上。
[0018]所述對(duì)象的系統(tǒng)狀態(tài)信息可包括:所述對(duì)象系統(tǒng)的中央處理器(CPU)使用率或者輔助存儲(chǔ)裝置使用率中的一種以上。
[0019]此外,根據(jù)本發(fā)明的另一方面,提供了一種數(shù)據(jù)預(yù)處理方法,包括如下步驟:在風(fēng)險(xiǎn)度分析單元中,利用對(duì)象系統(tǒng)的故障歷史信息及所述對(duì)象系統(tǒng)的特性信息來(lái)計(jì)算所述對(duì)象系統(tǒng)的故障風(fēng)險(xiǎn)度;在采集周期設(shè)定單元中,根據(jù)計(jì)算出的所述故障風(fēng)險(xiǎn)度,確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期;在預(yù)處理單元中,根據(jù)所述數(shù)據(jù)采集周期,對(duì)從所述對(duì)象系統(tǒng)采集的數(shù)據(jù)執(zhí)行預(yù)處理。
[0020]分析所述風(fēng)險(xiǎn)度的步驟還可包括如下步驟:可基于所述故障歷史信息來(lái)生成包括回歸分析模型、機(jī)器學(xué)習(xí)模型或者基于規(guī)則的模型中的一種以上的風(fēng)險(xiǎn)度分析模型;將所述對(duì)象系統(tǒng)的特性信息或者所述對(duì)象系統(tǒng)的狀態(tài)信息應(yīng)用到生成的所述風(fēng)險(xiǎn)度分析模型而計(jì)算出所述對(duì)象系統(tǒng)的故障風(fēng)險(xiǎn)度。
[0021 ] 在確定所述數(shù)據(jù)采集周期的步驟中,可以以計(jì)算出的所述故障風(fēng)險(xiǎn)度越高所述數(shù)據(jù)采集周期就越短的方式確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期。
[0022]確定所述數(shù)據(jù)采集周期的步驟可被構(gòu)成為,利用計(jì)算出的所述故障風(fēng)險(xiǎn)度及已設(shè)定的系統(tǒng)負(fù)載時(shí)間段信息來(lái)確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期。
[0023]確定所述數(shù)據(jù)采集周期的步驟可被構(gòu)成為,將所述系統(tǒng)負(fù)載時(shí)間段內(nèi)的數(shù)據(jù)采集周期設(shè)定為短于除所述系統(tǒng)負(fù)載時(shí)間段外的數(shù)據(jù)采集周期。
[0024]所述數(shù)據(jù)預(yù)處理方法還可包括如下步驟:在所述執(zhí)行預(yù)處理的步驟之前,在計(jì)算區(qū)間設(shè)定單元中,根據(jù)所述對(duì)象系統(tǒng)的狀態(tài)來(lái)設(shè)定用于所述預(yù)處理單元的數(shù)據(jù)預(yù)處理的計(jì)算區(qū)間(time window)。
[0025]設(shè)定所述計(jì)算區(qū)間的步驟可被構(gòu)成為,所述對(duì)象系統(tǒng)的中央處理器使用率或者輔助存儲(chǔ)裝置使用率越高,所述計(jì)算區(qū)間就越短。
[0026]所述對(duì)象系統(tǒng)的特性信息可包括:所述對(duì)象系統(tǒng)的硬件規(guī)格(specificat1n)、操作系統(tǒng)(Operat1n System)信息、系統(tǒng)設(shè)定信息及正在執(zhí)行的軟件信息中的一種以上。
[0027]所述數(shù)據(jù)的預(yù)處理可包括:從所述對(duì)象系統(tǒng)采集的數(shù)據(jù)的歸一化(normalizat1n)、插值(interpolat1n)、填補(bǔ)(imputat1n)、主成分分析(principalcomponent analysis)或者統(tǒng)計(jì)分析中的一種以上。
[0028]所述對(duì)象的系統(tǒng)狀態(tài)信息可包括:所述對(duì)象系統(tǒng)的中央處理器(CPU)使用率或者輔助存儲(chǔ)裝置使用率中的一種以上。
[0029]根據(jù)本發(fā)明的實(shí)施例,可使得根據(jù)多種采集周期從彼此不同種類(lèi)的服務(wù)器采集的多種形態(tài)的數(shù)據(jù)變換為具有統(tǒng)一性及一致性的信息。
[0030]此外,根據(jù)本發(fā)明的實(shí)施例,基于各個(gè)服務(wù)器的特性及狀態(tài)、已設(shè)定的混雜時(shí)間段信息等動(dòng)態(tài)地改變各個(gè)服務(wù)器的數(shù)據(jù)采集周期,從而可在減輕各個(gè)服務(wù)器的負(fù)荷(load)的同時(shí),維持采集到的數(shù)據(jù)的容量也能夠最佳狀態(tài)。
[0031]而且,根據(jù)本發(fā)明的實(shí)施例,考慮各個(gè)服務(wù)器的當(dāng)前狀態(tài)來(lái)適應(yīng)性地調(diào)整用于預(yù)處理的計(jì)算區(qū)間(time window),從而可有效地掌握各個(gè)服務(wù)器的狀態(tài)變化及異常與否。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0032]圖1是用于說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)采集系統(tǒng)100的框圖。
[0033]圖2是用于說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)預(yù)處理裝置104的詳細(xì)構(gòu)成的框圖。
[0034]圖3是用于說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的計(jì)算區(qū)間設(shè)定單元208中的計(jì)算區(qū)間的改變所帶來(lái)的效果的曲線(xiàn)圖。
[0035]圖4是用于說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)預(yù)處理方法400的流程圖。
[0036]符號(hào)說(shuō)明:
[0037]100:數(shù)據(jù)采集系統(tǒng)
[0038]102 ;服務(wù)器
[0039]104 ;數(shù)據(jù)預(yù)處理裝置
[0040]202:風(fēng)險(xiǎn)度分析單元
[0041]204:采集周期設(shè)定單元
[0042]206 ;預(yù)處理單元
[0043]208:計(jì)算區(qū)間設(shè)定單元
【具體實(shí)施方式】
[0044]以下,將參照附圖對(duì)本發(fā)明的【具體實(shí)施方式】進(jìn)行描述。然而,這只不過(guò)是示例,并且本發(fā)明不限于此。
[0045]在對(duì)本發(fā)明進(jìn)行描述時(shí),在對(duì)與本發(fā)明相關(guān)的公知技術(shù)的具體描述被認(rèn)為是會(huì)使本發(fā)明的主旨不清楚的情況下,省略其詳細(xì)描述。并且,后述的術(shù)語(yǔ)作為考慮本發(fā)明中的功能而定義的術(shù)語(yǔ),可根據(jù)使用者、運(yùn)用者的意圖或者慣例等而不同。因此,其定義應(yīng)基于貫穿整個(gè)本說(shuō)明書(shū)的內(nèi)容而做出。
[0046]本發(fā)明的技術(shù)構(gòu)思由權(quán)利要求書(shū)確定,并且以下的實(shí)施例只是用于高效地將本發(fā)明的技術(shù)思想解釋給本發(fā)明所屬的【技術(shù)領(lǐng)域】中具有普通的知識(shí)的技術(shù)人員的一種方式而已。
[0047]圖1是用于說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)采集系統(tǒng)100的框圖。根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)采集系統(tǒng)100是指如下的一種系統(tǒng):從一個(gè)以上的服務(wù)器采集能夠掌握各個(gè)服務(wù)器的性能或當(dāng)前狀態(tài)的數(shù)據(jù),并基于采集的數(shù)據(jù)來(lái)監(jiān)控各個(gè)服務(wù)器的狀態(tài)。如圖所示,本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)采集系統(tǒng)100包括一個(gè)以上的服務(wù)器102及數(shù)據(jù)預(yù)處理裝置104。
[0048]服務(wù)器102是具備中央處理器(CPU)及輔助存儲(chǔ)裝置(存儲(chǔ)器)等的計(jì)算機(jī)系統(tǒng),例如可以是包含于企業(yè)等的數(shù)據(jù)中心的一群計(jì)算機(jī)裝置。只是,在本發(fā)明的實(shí)施例中,服務(wù)器102的種類(lèi)沒(méi)有特別的限制,并且可包括具有與通用計(jì)算機(jī)相同或相似的構(gòu)造且執(zhí)行被分配的工作的所有種類(lèi)的計(jì)算機(jī)裝置。
[0049]數(shù)據(jù)預(yù)處理裝置104從一個(gè)以上的服務(wù)器102周期性地采集數(shù)據(jù)。數(shù)據(jù)預(yù)處理裝置104從服務(wù)器102采集的信息可包括通常為了掌握計(jì)算機(jī)裝置的狀態(tài)而能夠從相關(guān)計(jì)算機(jī)裝置采集到的所有種類(lèi)的信息,例如,中央處理器使用率、中央處理器運(yùn)行隊(duì)列(runqueue)、存儲(chǔ)器使用率、系統(tǒng)溫度等。
[0050]此外,數(shù)據(jù)預(yù)處理裝置104可對(duì)采集的數(shù)據(jù)執(zhí)行預(yù)處理(preprocessing)以對(duì)采集的數(shù)據(jù)進(jìn)行分析。通常,構(gòu)成數(shù)據(jù)中心等的各個(gè)服務(wù)器102具有多種硬件構(gòu)成(例如,中央處理器、存儲(chǔ)器、磁盤(pán)、文件系統(tǒng))。此外,可按硬件分別進(jìn)行測(cè)量的項(xiàng)目也非常多樣且被細(xì)分,并且其測(cè)量方式在很多情況下也不同。例如,僅以中央處理器為例,會(huì)根據(jù)中央處理器使用率、待機(jī)時(shí)間、運(yùn)行隊(duì)列(run queue)等多種屬性來(lái)采集性能測(cè)量數(shù)據(jù)。從而,在直接利用采集的數(shù)據(jù)的情況下,無(wú)法準(zhǔn)確比較具有彼此不同的硬件的服務(wù)器的狀態(tài),因此數(shù)據(jù)預(yù)處理裝置104轉(zhuǎn)換所采集的數(shù)據(jù),以通過(guò)對(duì)采集的數(shù)據(jù)的適當(dāng)?shù)念A(yù)處理過(guò)程來(lái)在相同的標(biāo)準(zhǔn)下對(duì)各個(gè)數(shù)據(jù)進(jìn)行比較。與數(shù)據(jù)的預(yù)處理過(guò)程相關(guān)的詳細(xì)說(shuō)明將后續(xù)闡述。以下,為了與預(yù)處理的數(shù)據(jù)進(jìn)行區(qū)分,將從服務(wù)器102采集的數(shù)據(jù)(即,預(yù)處理前的數(shù)據(jù))稱(chēng)為“原始數(shù)據(jù)(Raw Data) ”。
[0051]圖2是用于說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)預(yù)處理裝置104的詳細(xì)構(gòu)成的框圖。如圖所示,根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)預(yù)處理裝置104包括風(fēng)險(xiǎn)度分析單元202、采集周期設(shè)定單元204及預(yù)處理單元206,根據(jù)需要還可包括計(jì)算區(qū)間設(shè)定單元208。
[0052]風(fēng)險(xiǎn)度分析單元202利用一個(gè)以上的服務(wù)器102中的每個(gè)的故障歷史信息及各個(gè)服務(wù)器102的特性信息來(lái)計(jì)算各個(gè)服務(wù)器102的故障風(fēng)險(xiǎn)度。首先,風(fēng)險(xiǎn)度分析單元202基于從各個(gè)服務(wù)器102采集的已往的故障歷史信息來(lái)生成每個(gè)服務(wù)器102的風(fēng)險(xiǎn)度分析模型。在本發(fā)明的實(shí)施例中,服務(wù)器的故障風(fēng)險(xiǎn)度是指將在相關(guān)服務(wù)器中實(shí)際發(fā)生故障的可能性數(shù)值化的值。為了分析所述故障風(fēng)險(xiǎn)度,雖然可利用回歸分析模型、機(jī)器學(xué)習(xí)模型或者基于規(guī)則的模型等多種分析方法,但是本發(fā)明的實(shí)施例不限于特定的分析模型或方法,并且可利用包括本領(lǐng)域公知的方法的多種分析模型來(lái)計(jì)算出每個(gè)服務(wù)器的故障危險(xiǎn)度。
[0053]在一個(gè)實(shí)施例中,風(fēng)險(xiǎn)度分析單元202可由多個(gè)規(guī)則(rule)構(gòu)成所述風(fēng)險(xiǎn)度分析模塊。例如,風(fēng)險(xiǎn)度分析單元202可生成對(duì)于將特定硬件規(guī)格或特定服務(wù)器狀態(tài)作為條件時(shí)的風(fēng)險(xiǎn)度進(jìn)行定義的多個(gè)規(guī)則,并且可根據(jù)相關(guān)規(guī)則來(lái)計(jì)算出各個(gè)服務(wù)器102的風(fēng)險(xiǎn)度。除此之外,風(fēng)險(xiǎn)度分析單元202可被構(gòu)成為利用考慮服務(wù)器102的特性及被分配的工作的特性等的多種風(fēng)險(xiǎn)度分析模型及標(biāo)準(zhǔn)來(lái)計(jì)算出各個(gè)服務(wù)器102的故障風(fēng)險(xiǎn)度。
[0054]若如上所述地生成風(fēng)險(xiǎn)度分析模型,則風(fēng)險(xiǎn)度分析單元202可將相關(guān)服務(wù)器102的系統(tǒng)特性信息或當(dāng)前狀態(tài)信息應(yīng)用到所生成的所述風(fēng)險(xiǎn)度分析模型來(lái)計(jì)算出服務(wù)器102的故障風(fēng)險(xiǎn)度。此時(shí),系統(tǒng)特性信息可以是硬件規(guī)格(specificat1n)、操作系統(tǒng)(Operat1nSystem)信息、系統(tǒng)設(shè)定信息及正在運(yùn)行的軟件信息等。例如,根據(jù)所述風(fēng)險(xiǎn)度分析,對(duì)于具有特定硬件的服務(wù)器102,可以導(dǎo)出所述特定硬件的溫度和相關(guān)服務(wù)器102的故障發(fā)生之間的相關(guān)關(guān)系密切的結(jié)果。在此情況下,風(fēng)險(xiǎn)度分析單元202可基于測(cè)量的溫度信息從所述特定硬件計(jì)算出相關(guān)服務(wù)器102的故障風(fēng)險(xiǎn)度。
[0055]采集周期設(shè)定單元204根據(jù)在風(fēng)險(xiǎn)度分析單元202中計(jì)算出的所述故障風(fēng)險(xiǎn)度來(lái)確定各個(gè)服務(wù)器102的數(shù)據(jù)采集周期。在一個(gè)實(shí)施例中,采集周期設(shè)定單元204可以以計(jì)算出的所述故障風(fēng)險(xiǎn)度越高所述數(shù)據(jù)采集周期就越短的方式確定數(shù)據(jù)采集周期。其理由在于,感測(cè)到系統(tǒng)異常征兆時(shí),只有時(shí)時(shí)刻刻迅速掌握變化的情況,才有可能進(jìn)行完備的事前應(yīng)對(duì)。
[0056]此外,除故障風(fēng)險(xiǎn)度以外,采集周期設(shè)定單元204還可利用已設(shè)定的系統(tǒng)負(fù)載時(shí)間段來(lái)確定各個(gè)服務(wù)器102的數(shù)據(jù)采集周期。例如,風(fēng)險(xiǎn)度分析單元202可通過(guò)時(shí)間序列分析方法等來(lái)對(duì)已往采集的數(shù)據(jù)進(jìn)行分析以掌握各個(gè)服務(wù)器102的系統(tǒng)負(fù)載高的時(shí)間段。據(jù)此,采集周期設(shè)定單元204可通過(guò)在處于各個(gè)服務(wù)器102的系統(tǒng)負(fù)載高的時(shí)間段的情況下,將數(shù)據(jù)采集周期設(shè)定為相對(duì)較短,從而以更短的周期采集各個(gè)服務(wù)器102的狀態(tài)。SP,在本發(fā)明的實(shí)施例中采集周期設(shè)定單元204可考慮各個(gè)服務(wù)器102的故障風(fēng)險(xiǎn)度及各個(gè)服務(wù)器102的負(fù)載時(shí)間段信息中的一種以上的信息來(lái)確定各個(gè)服務(wù)器102的數(shù)據(jù)采集周期。此外,采集周期設(shè)定單元204在各個(gè)服務(wù)器102的故障風(fēng)險(xiǎn)度已改變或要改變的情況下,可通過(guò)反映該情況來(lái)適應(yīng)性地改變已設(shè)定的數(shù)據(jù)采集周期。
[0057]預(yù)處理單元206根據(jù)在采集周期設(shè)定單元204中確定的數(shù)據(jù)采集周期對(duì)從各個(gè)服務(wù)器102采集的數(shù)據(jù)執(zhí)行預(yù)處理。在本發(fā)明的實(shí)施例中,對(duì)從各個(gè)服務(wù)器102采集的原始數(shù)據(jù)進(jìn)行的預(yù)處理可包括:從所述原始數(shù)據(jù)的歸一化(normalizat1n)、插值(interpolat1n)、填補(bǔ)(imputat1n)、主成分分析(principal component analysis)或者統(tǒng)計(jì)分析中的一種以上。
[0058]在一個(gè)實(shí)施例中,預(yù)處理單元206可對(duì)從各個(gè)服務(wù)器102采集的原始數(shù)據(jù)執(zhí)行一種歸一化。為了利用從各個(gè)服務(wù)器102采集的數(shù)據(jù)來(lái)事先感測(cè)各個(gè)服務(wù)器102的異常征兆,需要進(jìn)行所采集的數(shù)據(jù)之間的相互關(guān)聯(lián)性分析。然而,所采集的多種數(shù)據(jù)根據(jù)各個(gè)測(cè)量項(xiàng)目,基于單位及數(shù)值的范圍等都不相同。因此,預(yù)處理單元206基于按各個(gè)數(shù)據(jù)項(xiàng)目的最大值/最小值獲知數(shù)據(jù)的范圍(range)之后,基于此范圍對(duì)數(shù)據(jù)進(jìn)行歸一化(Normalizat1n),使得各個(gè)數(shù)據(jù)在同一個(gè)標(biāo)準(zhǔn)下被分析。
[0059]此外,在執(zhí)行預(yù)處理操作時(shí),預(yù)處理單元206可在對(duì)采集的各個(gè)數(shù)據(jù)進(jìn)行預(yù)處理之前留有延遲時(shí)間(例如,大致I分鐘)。這是因?yàn)?,雖然為了對(duì)采集的各個(gè)數(shù)據(jù)進(jìn)行準(zhǔn)確的分析,需要在同一時(shí)間內(nèi)進(jìn)行所采集的數(shù)據(jù)之間的比較,但是一部分?jǐn)?shù)據(jù)因網(wǎng)絡(luò)延遲等而有可能導(dǎo)致發(fā)送推遲。
[0060]在預(yù)處理單元206中執(zhí)行的預(yù)處理可包括例如如下過(guò)程。
[0061]1.數(shù)據(jù)清理(cleaning)及轉(zhuǎn)換(transformat1n)
[0062]-缺失值(missingvalue)代替:忽視相關(guān)元組、基于規(guī)則(Rule)的測(cè)量值計(jì)算、借助專(zhuān)家進(jìn)行的處理
[0063]-修勻(smoothing):將脫離整體趨勢(shì)的數(shù)據(jù)變換為符合趨勢(shì)以消除噪聲數(shù)據(jù)
[0064]-歸一化(normalizat1n):作為對(duì)數(shù)據(jù)賦予整體的統(tǒng)一'丨生的過(guò)程,包括最大/最小(min/max)歸一化、Z 值(z-score)、十進(jìn)制(decimal scaling)等
[0065]-聚合(aggregat1n):歸納數(shù)據(jù)并生成多維數(shù)據(jù)集(cube)(主要用于數(shù)據(jù)倉(cāng)庫(kù)(data warehouse))
[0066]-異常值確認(rèn)及去除(outlierdetect1n and removal):從數(shù)據(jù)集分類(lèi)及去除呈現(xiàn)出與大部分的其他數(shù)據(jù)不同的特征的數(shù)據(jù)
[0067]-主要方法:聚類(lèi)、統(tǒng)計(jì)測(cè)量方法(例:Grubb’s test)等
[0068]2.數(shù)據(jù)集成(integrat1n)及不一致性的解決
[0069]-多種日志文件(logfile)/數(shù)據(jù)庫(kù)的整合、轉(zhuǎn)換為具有一致性的數(shù)據(jù)形態(tài)
[0070]-主要問(wèn)題及解決方法
[0071]I)重復(fù)性問(wèn)題:是指相同內(nèi)容的數(shù)據(jù)以不同的名稱(chēng)被存儲(chǔ)的狀態(tài),通過(guò)關(guān)聯(lián)關(guān)系分析等檢測(cè)重復(fù)性數(shù)據(jù)
[0072]2) 一致性問(wèn)題:是指能夠通過(guò)計(jì)算/統(tǒng)計(jì)獲得的值為錯(cuò)誤的情況,通過(guò)專(zhuān)門(mén)的計(jì)算來(lái)驗(yàn)證已計(jì)算出的值
[0073]3)表現(xiàn)上的相異性問(wèn)題:因計(jì)量/計(jì)測(cè)單位不同引起的缺乏數(shù)據(jù)統(tǒng)一性的情況,通過(guò)表現(xiàn)的一致化過(guò)程來(lái)解決
[0074]4)通過(guò)數(shù)據(jù)之間的相關(guān)性分析的問(wèn)題的發(fā)現(xiàn)及解決:分析結(jié)果值越是接近0,越是判斷為彼此無(wú)關(guān)
[0075]3.數(shù)據(jù)縮小(reduct1n)或表現(xiàn)特征提取
[0076]-獲得即便少量也很好地代表全體數(shù)據(jù)集合的數(shù)據(jù)的過(guò)程
[0077]-為了提高大規(guī)模數(shù)據(jù)的分析操作時(shí)的效率,是必要的
[0078]-次元縮小方法:通過(guò)消除重復(fù)屬性、與分析無(wú)關(guān)的屬性來(lái)尋找最小集合的過(guò)程(stepwise forward select1n, stepwise backward eliminat1n)
[0079]-數(shù)據(jù)編碼,通過(guò)轉(zhuǎn)換來(lái)減小存儲(chǔ)大?。焕脫p失或無(wú)損失壓縮方法
[0080]-離散小波變換(DffT:discrete wavelet transformat1n):作為線(xiàn)性信號(hào)處理技術(shù),將采集數(shù)據(jù)變換為個(gè)數(shù)不同而長(zhǎng)度卻相同的矢量(小波系數(shù)(wa veletcoefficient))之后,從多個(gè)矢量中選擇最有影響力的矢量來(lái)消除其他的矢量
[0081]-主成分分析(PCA:Principal Component Analysis):選擇并組合最能表現(xiàn)數(shù)據(jù)的直角坐標(biāo)系上的數(shù)據(jù)矢量,通過(guò)尋找其他的小集合的方法進(jìn)行壓縮。計(jì)算的過(guò)程簡(jiǎn)單且也可處理沒(méi)有被排列的屬性,并且可處理稀疏的數(shù)據(jù)或者統(tǒng)一的數(shù)據(jù)
[0082]-通常PAC對(duì)稀疏的數(shù)據(jù)處理有用,DffT對(duì)高次數(shù)據(jù)處理有用
[0083]接下來(lái),計(jì)算區(qū)間設(shè)定單元208設(shè)定用于執(zhí)行從各個(gè)服務(wù)器102采集的數(shù)據(jù)的預(yù)處理的計(jì)算區(qū)間(time window)。在本發(fā)明的實(shí)施例中,計(jì)算區(qū)域是指用于數(shù)據(jù)的預(yù)處理的原始數(shù)據(jù)的區(qū)間。例如,假設(shè)預(yù)處理單元206執(zhí)行計(jì)算特定數(shù)據(jù)的平均值的預(yù)處理。在這種情況下,如果設(shè)定的計(jì)算區(qū)間為I分鐘,則利用從計(jì)算時(shí)間點(diǎn)起到I分鐘之前的數(shù)據(jù)來(lái)計(jì)算平均值,如果設(shè)定的計(jì)算區(qū)間為5分鐘,則利用從計(jì)算時(shí)間點(diǎn)起到5分鐘之前的數(shù)據(jù)來(lái)計(jì)算平均值。
[0084]在本發(fā)明的實(shí)施例中,計(jì)算區(qū)間設(shè)定單元208可根據(jù)各個(gè)服務(wù)器102的當(dāng)前狀態(tài)來(lái)彈性地設(shè)定用于所述預(yù)處理的計(jì)算區(qū)間。例如,在各個(gè)服務(wù)器102的中央處理器(CPU)使用率或者輔助存儲(chǔ)裝置(例如,存儲(chǔ)器)的使用率中的任意一個(gè)增加到標(biāo)準(zhǔn)值以上時(shí),計(jì)算區(qū)間設(shè)定單元208判斷為系統(tǒng)故障風(fēng)險(xiǎn)度升高,從而可將所述計(jì)算區(qū)間設(shè)定為短。此外,計(jì)算區(qū)間設(shè)定單元208可基于在風(fēng)險(xiǎn)度分析單元202中計(jì)算的每個(gè)服務(wù)器102的故障風(fēng)險(xiǎn)度來(lái)掌握各個(gè)服務(wù)器102的當(dāng)前狀態(tài),并據(jù)此適應(yīng)性地變更所述計(jì)算區(qū)間。這樣,在計(jì)算區(qū)間變短的情況下,由于與原始數(shù)據(jù)的采集周期相比能夠更加密集地生成預(yù)處理結(jié)果,因此帶來(lái)彌補(bǔ)因相對(duì)長(zhǎng)的采集周期而導(dǎo)致的信息丟失的效果。與此相反,在服務(wù)器102的閑置狀態(tài)持續(xù)的情況下,換句話(huà)說(shuō)在CPU或存儲(chǔ)器使用率為特征值以下的情況下,計(jì)算區(qū)間設(shè)定單元208可將計(jì)算區(qū)間設(shè)定為長(zhǎng),在此情況下,整體的預(yù)處理計(jì)算結(jié)果與原始日志數(shù)據(jù)(log data)相比,表現(xiàn)為相對(duì)精簡(jiǎn)的結(jié)果(比起散漫性更具有一般性)。
[0085]圖3是用于說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的計(jì)算區(qū)間設(shè)定單元208中的計(jì)算區(qū)間的改變所帶來(lái)的效果的曲線(xiàn)圖。在圖示的實(shí)施例中,示出了利用線(xiàn)性插值法(linearinterpolat1n)來(lái)對(duì)原始數(shù)據(jù)進(jìn)行插值的示例。線(xiàn)性插值法時(shí)指當(dāng)在直角坐標(biāo)系上存在任意兩點(diǎn)時(shí)用直線(xiàn)連接該兩點(diǎn)的方法。在圖示的示例中,折線(xiàn)表示實(shí)際數(shù)據(jù),波浪線(xiàn)表示在計(jì)算區(qū)間窄時(shí)被插值的數(shù)據(jù),直線(xiàn)表示在計(jì)算區(qū)間寬時(shí)被插值的數(shù)據(jù)。如圖所示,可得知計(jì)算區(qū)間窄的情況與計(jì)算區(qū)間寬的情況相比,與實(shí)際數(shù)據(jù)的相似度更高。
[0086]此外,根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)預(yù)處理裝置104還可包括數(shù)據(jù)庫(kù)(未示出)。所述數(shù)據(jù)庫(kù)不僅惡意存儲(chǔ)及管理預(yù)處理單元206中執(zhí)行的原始數(shù)據(jù)的預(yù)處理結(jié)果,同時(shí)還可以對(duì)各個(gè)服務(wù)器102的數(shù)據(jù)采集周期、計(jì)算區(qū)間、已往故障歷史、各個(gè)服務(wù)器102的硬件規(guī)格等的信息進(jìn)行存儲(chǔ)及管理。存儲(chǔ)的信息將來(lái)可作為用于每個(gè)服務(wù)器102的風(fēng)險(xiǎn)度分析、采集周期設(shè)定及計(jì)算區(qū)間設(shè)定的參考資料來(lái)使用。
[0087]圖4是用于說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的數(shù)據(jù)預(yù)處理方法400的流程圖。在所示的流程圖中,雖然示出為各個(gè)步驟具有時(shí)間上的先后關(guān)系,但是這只是示例性的,應(yīng)留意至少一部分的步驟可與前后的步驟同時(shí)被執(zhí)行或在還可改變順序而執(zhí)行。
[0088]在步驟402中,風(fēng)險(xiǎn)度分析單元202利用各個(gè)服務(wù)器102的故障歷史信息及各個(gè)服務(wù)器102的特性信息來(lái)計(jì)算各個(gè)服務(wù)器102的故障風(fēng)險(xiǎn)度。此時(shí),在步驟402中,還可包括如下步驟:基于故障歷史信息來(lái)生成包括回歸分析模型、機(jī)器學(xué)習(xí)模型或者基于規(guī)則的模型中的一種以上的風(fēng)險(xiǎn)度分析模型;將各個(gè)服務(wù)器102的特性信息或者狀態(tài)信息應(yīng)用到生成的風(fēng)險(xiǎn)度分析模型而計(jì)算出各個(gè)服務(wù)器102的故障風(fēng)險(xiǎn)度。各個(gè)服務(wù)器102的特性信息可包括:各個(gè)服務(wù)器102的硬件規(guī)格(specificat1n)、操作系統(tǒng)(Operat1n System)信息、系統(tǒng)設(shè)定信息及正在執(zhí)行的軟件信息中的一種以上。
[0089]在步驟404中,采集周期設(shè)定單元204根據(jù)計(jì)算出的故障風(fēng)險(xiǎn)度來(lái)確定各個(gè)服務(wù)器102的數(shù)據(jù)采集周期。在一個(gè)實(shí)施例中,所述步驟404中可以以在所述步驟402中計(jì)算出的所述故障風(fēng)險(xiǎn)度越高所述數(shù)據(jù)采集周期就越短的方式來(lái)確定從各個(gè)服務(wù)器102采集數(shù)據(jù)的數(shù)據(jù)采集周期。
[0090]此外,所述步驟404可被構(gòu)成為,利用計(jì)算出的所述故障風(fēng)險(xiǎn)度及已設(shè)定的系統(tǒng)負(fù)載時(shí)間段信息來(lái)確定從各個(gè)服務(wù)器102采集數(shù)據(jù)的數(shù)據(jù)采集周期,在此情況下,可將系統(tǒng)負(fù)載時(shí)間段內(nèi)的數(shù)據(jù)采集周期設(shè)定為短于除所述系統(tǒng)負(fù)載時(shí)間段外的數(shù)據(jù)采集周期。
[0091]在步驟406中,預(yù)處理單元206根據(jù)在所述步驟404中確定的數(shù)據(jù)采集周期來(lái)執(zhí)行對(duì)從各個(gè)服務(wù)器102采集的數(shù)據(jù)的預(yù)處理。所述數(shù)據(jù)預(yù)處理過(guò)程的詳細(xì)組成如前所述。
[0092]此外,在執(zhí)行所述步驟406之前,可添加如下步驟:在計(jì)算區(qū)間設(shè)定單元208中,根據(jù)各個(gè)服務(wù)器102的狀態(tài)來(lái)設(shè)定用于預(yù)處理單元206的數(shù)據(jù)預(yù)處理的計(jì)算區(qū)間(timewindow)。所述狀態(tài)信息可包括:各個(gè)服務(wù)器102的中央處理器(CPU)使用率或者輔助存儲(chǔ)裝置使用率中的一種以上。此外,在此情況下,計(jì)算區(qū)間設(shè)定單元208可以將各個(gè)服務(wù)器102的計(jì)算區(qū)間設(shè)定為,各個(gè)服務(wù)器102的中央處理器使用率或者輔助存儲(chǔ)裝置使用率越高,與相關(guān)服務(wù)器102對(duì)應(yīng)的計(jì)算區(qū)間就越短。
[0093]此外,本發(fā)明的實(shí)施例可包括記錄有用于在計(jì)算機(jī)上執(zhí)行本說(shuō)明書(shū)中記載的方法的程序的計(jì)算機(jī)可讀記錄介質(zhì)。所述計(jì)算機(jī)可讀記錄介質(zhì)可單獨(dú)地包括程序命令、本地?cái)?shù)據(jù)文件、本地?cái)?shù)據(jù)結(jié)構(gòu)等,或者包括它們的組合。所述介質(zhì)可以是為本發(fā)明而專(zhuān)門(mén)設(shè)計(jì)并構(gòu)成的介質(zhì),或者可以是計(jì)算機(jī)軟件領(lǐng)域的普通技術(shù)人員所公知而可以使用的介質(zhì)。所述計(jì)算機(jī)可讀記錄介質(zhì)的示例包括為了存儲(chǔ)并執(zhí)行程序命令而專(zhuān)門(mén)構(gòu)成的硬件裝置:諸如硬盤(pán)、軟盤(pán)及磁帶的磁介質(zhì)、諸如CD-ROM、DVD的光記錄介質(zhì)、諸如軟盤(pán)的磁光介質(zhì)及ROM、RAM、閃存等。程序命令的示例可包括:由編譯器編寫(xiě)的機(jī)器語(yǔ)言代碼以及使用解釋器等而由計(jì)算機(jī)來(lái)執(zhí)行的高級(jí)語(yǔ)言代碼。
[0094]雖然已通過(guò)代表性實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)描述,但本發(fā)明所屬的【技術(shù)領(lǐng)域】中具有公知常識(shí)的技術(shù)人員應(yīng)該理解在不脫離本發(fā)明的范圍的情況下可以對(duì)上述實(shí)施例進(jìn)行各種變形。
[0095]因此,本發(fā)明的權(quán)利范圍不應(yīng)局限于所描述的實(shí)施例而確定,而是應(yīng)當(dāng)由權(quán)利要求書(shū)及其等同物來(lái)確定。
【權(quán)利要求】
1.一種數(shù)據(jù)預(yù)處理裝置,包括: 風(fēng)險(xiǎn)度分析單元,利用對(duì)象系統(tǒng)的故障歷史信息及所述對(duì)象系統(tǒng)的特性信息來(lái)計(jì)算所述對(duì)象系統(tǒng)的故障風(fēng)險(xiǎn)度; 采集周期設(shè)定單元,根據(jù)計(jì)算出的所述故障風(fēng)險(xiǎn)度,確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期; 預(yù)處理單元,根據(jù)所述數(shù)據(jù)采集周期,對(duì)從所述對(duì)象系統(tǒng)采集的數(shù)據(jù)執(zhí)行預(yù)處理。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)預(yù)處理裝置,其中, 所述風(fēng)險(xiǎn)度分析單元基于所述故障歷史信息來(lái)生成包括回歸分析模型、機(jī)器學(xué)習(xí)模型或者基于規(guī)則的模型中的一種以上的風(fēng)險(xiǎn)度分析模型, 將所述對(duì)象系統(tǒng)的特性信息或者所述對(duì)象系統(tǒng)的狀態(tài)信息應(yīng)用到所生成的所述風(fēng)險(xiǎn)度分析模型而計(jì)算出所述對(duì)象系統(tǒng)的故障風(fēng)險(xiǎn)度。
3.根據(jù)權(quán)利要求1所述的數(shù)據(jù)預(yù)處理裝置,其中, 所述采集周期設(shè)定單元以計(jì)算出的所述故障風(fēng)險(xiǎn)度越高所述數(shù)據(jù)采集周期就越短的方式確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期。
4.根據(jù)權(quán)利要求1所述的數(shù)據(jù)預(yù)處理裝置,其中, 所述采集周期設(shè)定單元利用計(jì)算出的所述故障風(fēng)險(xiǎn)度及已設(shè)定的系統(tǒng)負(fù)載時(shí)間段信息來(lái)確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期。
5.根據(jù)權(quán)利要求4所述的數(shù)據(jù)預(yù)處理裝置,其中, 所述采集周期設(shè)定單元將所述系統(tǒng)負(fù)載時(shí)間段內(nèi)的數(shù)據(jù)采集周期設(shè)定為短于除所述系統(tǒng)負(fù)載時(shí)間段外的數(shù)據(jù)采集周期。
6.根據(jù)權(quán)利要求1所述的數(shù)據(jù)預(yù)處理裝置,還包括: 計(jì)算區(qū)間設(shè)定單元,根據(jù)所述對(duì)象系統(tǒng)的狀態(tài)來(lái)設(shè)定用于所述預(yù)處理單元的數(shù)據(jù)預(yù)處理的計(jì)算區(qū)間。
7.根據(jù)權(quán)利要求6所述的數(shù)據(jù)預(yù)處理裝置,其中, 所述計(jì)算區(qū)間設(shè)定單元將所述計(jì)算區(qū)間設(shè)定為所述對(duì)象系統(tǒng)的中央處理器使用率或者輔助存儲(chǔ)裝置使用率越高,所述計(jì)算區(qū)間就越短。
8.根據(jù)權(quán)利要求2所述的數(shù)據(jù)預(yù)處理裝置,其中, 所述對(duì)象系統(tǒng)的特性信息包括:所述對(duì)象系統(tǒng)的硬件規(guī)格、操作系統(tǒng)信息、系統(tǒng)設(shè)定信息及正在執(zhí)行的軟件信息中的一種以上。
9.根據(jù)權(quán)利要求1所述的數(shù)據(jù)預(yù)處理裝置,其中, 所述數(shù)據(jù)的預(yù)處理包括:從所述對(duì)象系統(tǒng)采集的數(shù)據(jù)的歸一化、插值、填補(bǔ)、主成分分析或者統(tǒng)計(jì)分析中的一種以上。
10.根據(jù)權(quán)利要求2所述的數(shù)據(jù)預(yù)處理裝置,其中, 所述對(duì)象的系統(tǒng)狀態(tài)信息包括:所述對(duì)象系統(tǒng)的中央處理器使用率或者輔助存儲(chǔ)裝置使用率中的一種以上。
11.一種數(shù)據(jù)預(yù)處理方法,包括如下步驟: 在風(fēng)險(xiǎn)度分析單元中,利用對(duì)象系統(tǒng)的故障歷史信息及所述對(duì)象系統(tǒng)的特性信息來(lái)計(jì)算所述對(duì)象系統(tǒng)的故障風(fēng)險(xiǎn)度; 在采集周期設(shè)定單元中,根據(jù)計(jì)算出的所述故障風(fēng)險(xiǎn)度,確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期; 在預(yù)處理單元中,根據(jù)所述數(shù)據(jù)采集周期,對(duì)從所述對(duì)象系統(tǒng)采集的數(shù)據(jù)執(zhí)行預(yù)處理。
12.根據(jù)權(quán)利要求11所述的數(shù)據(jù)預(yù)處理方法,其中, 分析所述風(fēng)險(xiǎn)度的步驟還包括如下步驟: 基于所述故障歷史信息來(lái)生成包括回歸分析模塊、機(jī)器學(xué)習(xí)模塊或者基于規(guī)則的模塊中的一種以上的風(fēng)險(xiǎn)度分析模塊; 將所述對(duì)象系統(tǒng)的特性信息或者所述對(duì)象系統(tǒng)的狀態(tài)信息應(yīng)用到生成的所述風(fēng)險(xiǎn)度分析模型而計(jì)算出所述對(duì)象系統(tǒng)的故障風(fēng)險(xiǎn)度。
13.根據(jù)權(quán)利要求11所述的數(shù)據(jù)預(yù)處理方法,其中, 在確定所述數(shù)據(jù)采集周期的步驟中,以計(jì)算出的所述故障風(fēng)險(xiǎn)度越高所述數(shù)據(jù)采集周期就越短的方式確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期。
14.根據(jù)權(quán)利要求11所述的數(shù)據(jù)預(yù)處理方法,其中, 確定所述數(shù)據(jù)采集周期的步驟被構(gòu)成為,利用計(jì)算出的所述故障風(fēng)險(xiǎn)度及已設(shè)定的系統(tǒng)負(fù)載時(shí)間段信息來(lái)確定從所述對(duì)象系統(tǒng)采集數(shù)據(jù)的數(shù)據(jù)采集周期。
15.根據(jù)權(quán)利要求14所述的數(shù)據(jù)預(yù)處理方法,其中, 確定所述數(shù)據(jù)采集周期的步驟被構(gòu)成為,將所述系統(tǒng)負(fù)載時(shí)間段內(nèi)的數(shù)據(jù)采集周期設(shè)定為短于除所述系統(tǒng)負(fù)載時(shí)間段外的數(shù)據(jù)采集周期。
16.根據(jù)權(quán)利要求11所述的數(shù)據(jù)預(yù)處理方法,還包括如下步驟: 所述執(zhí)行預(yù)處理的步驟之前,在計(jì)算區(qū)間設(shè)定單元中,根據(jù)所述對(duì)象系統(tǒng)的狀態(tài)來(lái)設(shè)定用于所述預(yù)處理單元的數(shù)據(jù)預(yù)處理的計(jì)算區(qū)間。
17.根據(jù)權(quán)利要求16所述的數(shù)據(jù)預(yù)處理方法,其中, 設(shè)定所述計(jì)算區(qū)間的步驟被構(gòu)成為,所述對(duì)象系統(tǒng)的中央處理器使用率或者輔助存儲(chǔ)裝置使用率越高,所述計(jì)算區(qū)間就越短。
18.根據(jù)權(quán)利要求12所述的數(shù)據(jù)預(yù)處理方法,其中, 所述對(duì)象系統(tǒng)的特性信息包括:所述對(duì)象系統(tǒng)的硬件規(guī)格、操作系統(tǒng)信息、系統(tǒng)設(shè)定信息及正在執(zhí)行的軟件信息中的一種以上。
19.根據(jù)權(quán)利要求11所述的數(shù)據(jù)預(yù)處理方法,其中, 所述數(shù)據(jù)的預(yù)處理包括:從所述對(duì)象系統(tǒng)采集的數(shù)據(jù)的歸一化、插值填補(bǔ)、主成分分析或者統(tǒng)計(jì)分析中的一種以上。
20.根據(jù)權(quán)利要求12所述的數(shù)據(jù)預(yù)處理方法,其中, 所述對(duì)象的系統(tǒng)狀態(tài)信息包括:所述對(duì)象系統(tǒng)的中央處理器使用率或者輔助存儲(chǔ)裝置使用率中的一種以上。
【文檔編號(hào)】G06F11/34GK104516808SQ201410521651
【公開(kāi)日】2015年4月15日 申請(qǐng)日期:2014年9月30日 優(yōu)先權(quán)日:2013年10月1日
【發(fā)明者】南宮榮桓, 李在英, 鄭雅英, 金達(dá)云 申請(qǐng)人:三星Sds株式會(huì)社