聚合事件消息的方法、應(yīng)用及系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了聚合事件消息的方法、應(yīng)用和系統(tǒng)。其中,聚合事件消息的應(yīng)用適于駐留在聚合服務(wù)器中。該應(yīng)用包括消息獲取單元、消息合并單元和消息聚合單元。消息獲取單元適于獲取由至少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控而生成的多條原始事件消息。消息合并單元適于根據(jù)第二標(biāo)識(shí)和第三標(biāo)識(shí)對(duì)多條原始事件消息進(jìn)行分組,并分別將每組第二標(biāo)識(shí)和第三標(biāo)識(shí)相同的原始事件消息合并為一條合并事件消息。消息聚合單元適于根據(jù)合并事件消息的相似度執(zhí)行聚類(lèi)操作,分別將每類(lèi)相似度超過(guò)閾值的合并事件消息聚合為一簇事件消息。
【專(zhuān)利說(shuō)明】
聚合事件消息的方法、應(yīng)用及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及互聯(lián)網(wǎng)領(lǐng)域,尤其設(shè)及聚合事件消息的方法、應(yīng)用及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的發(fā)展,IT技術(shù)已應(yīng)用到多個(gè)領(lǐng)域。ITOMQT化eration Mangement, IT運(yùn)營(yíng)管理)已成為IT設(shè)備管理的重要環(huán)節(jié)。IT運(yùn)營(yíng)管理例如可W包括監(jiān)控和告警。在面對(duì) 大量的運(yùn)維工作時(shí),ITOM通常會(huì)采用諸如za化ix、nagios等監(jiān)控工具。
[0003] 現(xiàn)有的運(yùn)些監(jiān)控工具通常基于單次監(jiān)控內(nèi)容(服務(wù)或指標(biāo))而產(chǎn)生告警。例如,告 警和通知之間基本上是1對(duì)1的關(guān)系。具體而言,監(jiān)控工具基于闊值、口線等,在觸發(fā)一個(gè)原 始告警事件時(shí)進(jìn)行一次通知,容易引發(fā)告警風(fēng)暴。大量的原始告警事件會(huì)產(chǎn)生干擾,消耗運(yùn) 維人員精力,可能引發(fā)狼來(lái)了的疲勞效應(yīng)。
[0004] 因此,缺少一種降低大量告警消息冗余度的方案。
【發(fā)明內(nèi)容】
[0005] 為此,本發(fā)明提供一種新的聚合事件消息的技術(shù)方案,有效的解決了上述至少一 個(gè)問(wèn)題。
[0006] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種聚合事件消息的方法,適于在聚合服務(wù)器中 執(zhí)行。該方法包括如下步驟。獲取由至少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控 而生成的多條原始事件消息。其中,每條原始事件消息包括所對(duì)應(yīng)的性能監(jiān)控設(shè)備的第一 標(biāo)識(shí)、標(biāo)識(shí)觸發(fā)該事件的計(jì)算設(shè)備的第二標(biāo)識(shí)、標(biāo)識(shí)該事件的第=標(biāo)識(shí)和該事件所對(duì)應(yīng)的 觸發(fā)時(shí)間點(diǎn)。根據(jù)第二標(biāo)識(shí)和第=標(biāo)識(shí)對(duì)多條原始事件消息進(jìn)行分組,并分別將每組第二 標(biāo)識(shí)和第=標(biāo)識(shí)相同的原始事件消息合并為一條合并事件消息。每條合并事件消息還包括 其所對(duì)應(yīng)的一組原始事件消息的所有觸發(fā)時(shí)間點(diǎn)所處的觸發(fā)時(shí)間段。根據(jù)合并事件消息的 相似度執(zhí)行聚類(lèi)操作,分別將每類(lèi)相似度超過(guò)闊值的合并事件消息聚合為一簇事件消息。
[0007] 可選地,在根據(jù)本發(fā)明聚合事件消息的方法中,獲取由至少一個(gè)性能監(jiān)控設(shè)備對(duì) 至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控而生成的多條原始事件消息的步驟包括下述中任一種:接收駐 留在每個(gè)性能監(jiān)控設(shè)備中的事件采集應(yīng)用所采集并傳輸?shù)脑际录?接收所述至少一 個(gè)性能監(jiān)控系統(tǒng)中每一個(gè)所發(fā)送的原始事件消息。
[000引可選地,根據(jù)本發(fā)明聚合事件消息的方法還包括,繼續(xù)獲取來(lái)自所述至少一個(gè)性 能監(jiān)控設(shè)備的一條原始事件消息。W及,計(jì)算本次獲取的原始事件消息與每簇事件消息的 相似度,并將該原始事件消息聚合到與其相似度最高且超過(guò)闊值的一簇事件消息中。
[0009] 可選地,在根據(jù)本發(fā)明聚合事件消息的方法中,根據(jù)合并事件消息的相似度執(zhí)行 聚類(lèi)操作,分別將每類(lèi)相似度超過(guò)闊值的合并事件消息聚合為一簇事件消息的步驟包括: 分別計(jì)算所述合并事件消息中兩兩之間相似度;將兩兩之間相似度的平均值超過(guò)闊值的一 組合并事件消息聚合為一簇事件消息。
[0010] 可選地,在根據(jù)本發(fā)明聚合事件消息的方法中,每條原始事件消息還包括標(biāo)識(shí)運(yùn) 條原始事件消息所對(duì)應(yīng)的計(jì)算設(shè)備所處集群的第四標(biāo)識(shí)。分別計(jì)算所述合并事件消息中兩 兩之間相似度的步驟包括:對(duì)所述合并事件消息中任意兩條合并事件消息,計(jì)算運(yùn)兩條合 并事件消息之間的時(shí)間段相似度。計(jì)算運(yùn)兩條合并事件消息之間的第二標(biāo)識(shí)的相似度。計(jì) 算運(yùn)兩條合并事件消息之間的第四標(biāo)識(shí)的相似度。將運(yùn)兩條合并事件消息的時(shí)間段相似 度、第二標(biāo)識(shí)的相似度和第四標(biāo)識(shí)的相似度的權(quán)重平均值作為運(yùn)兩條合并事件消息的相似 度。
[0011] 可選地,在根據(jù)本發(fā)明聚合事件消息的方法中,計(jì)算運(yùn)兩條合并事件消息之間的 時(shí)間段相似度的步驟包括:
[0012]
[OOU]其中,SimUXi,拉)為合并事件消息Xi與X2的時(shí)間段相似度,ts化讀示Xi的觸發(fā)時(shí) 間段的開(kāi)始時(shí)間點(diǎn),ts(X2)表示X2的觸發(fā)時(shí)間段的開(kāi)始時(shí)間點(diǎn),te(Xl)表示Xl的觸發(fā)時(shí)間段 的結(jié)束時(shí)間點(diǎn),te(X2)表示X2的觸發(fā)時(shí)間段的結(jié)束時(shí)間點(diǎn),T為時(shí)間闊值。
[0014] 可選地,在根據(jù)本發(fā)明聚合事件消息的方法中,計(jì)算運(yùn)兩條合并事件消息之間的 第二標(biāo)識(shí)的相似度的步驟包括:311112化龍)=(5刪-〇)151')/51逼其中,311112化龍)為合并 消息Xi和X2之間的第二標(biāo)識(shí)的相似度,SUM為Xi和X2的字符串的長(zhǎng)度總和,LDIST為Xi和X2之 間的第二標(biāo)識(shí)的萊文斯坦距離。
[0015] 可選地,在根據(jù)本發(fā)明聚合事件消息的方法中,計(jì)算運(yùn)兩條合并事件消息之間的 第四標(biāo)識(shí)的相似度的步驟包括:
[0016] 811113口1,乂2) = 1611口1〇乂2)/111曰又(1611口1),1611口2))其中,311113口1,乂2)為乂1和乂2之 間的第四標(biāo)識(shí)的相似度,1 en (Xi n拉)為Xi和拉之間字符串交集的長(zhǎng)度。
[0017] 可選地,在根據(jù)本發(fā)明聚合事件消息的方法中,時(shí)間段相似度、第二標(biāo)識(shí)的相似度 和第四標(biāo)識(shí)的相似度的權(quán)重相同。將運(yùn)兩條合并事件消息的時(shí)間段相似度、第二標(biāo)識(shí)的相 似度和第四標(biāo)識(shí)的相似度的權(quán)重平均值作為運(yùn)兩條合并事件消息的相似度的步驟包括:
[001 引
[0019] 其中,Sim化,X2)為合并事件消息Xi和X2之間的相似度,simUXi,X2)為Xi和X2之間 的時(shí)間段相似度,sim2(Xi,X2)為Xi和枯之間的第二標(biāo)識(shí)的相似度,sim3(Xi,枯)為Xi和枯之間 的第四標(biāo)識(shí)的相似度。
[0020] 可選地,在根據(jù)本發(fā)明聚合事件消息的方法中,計(jì)算本次獲取的原始事件消息與 每簇事件消息的相似度的步驟包括:計(jì)算本次獲取的原始事件消息與運(yùn)簇事件消息中每一 個(gè)的相似度,并將與運(yùn)簇事件消息中每一個(gè)的相似度的平均值作為該原始事件消息與運(yùn)簇 事件消息的相似度。
[0021] 根據(jù)本發(fā)明又一個(gè)方面,提供一種聚合事件消息的應(yīng)用,適于駐留在聚合服務(wù)器 中。該應(yīng)用包括消息獲取單元、消息合并單元和消息聚合單元。消息獲取單元適于獲取由至 少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控而生成的多條原始事件消息。其中,每 條原始事件消息包括所對(duì)應(yīng)的性能監(jiān)控設(shè)備的第一標(biāo)識(shí)、標(biāo)識(shí)觸發(fā)該事件的計(jì)算設(shè)備的第 二標(biāo)識(shí)、標(biāo)識(shí)該事件的第=標(biāo)識(shí)和該事件所對(duì)應(yīng)的觸發(fā)時(shí)間點(diǎn)。消息合并單元適于根據(jù)第 二標(biāo)識(shí)和第=標(biāo)識(shí)對(duì)多條原始事件消息進(jìn)行分組,并分別將每組第二標(biāo)識(shí)和第=標(biāo)識(shí)相同 的原始事件消息合并為一條合并事件消息。每條合并事件消息還包括其所對(duì)應(yīng)的一組原始 事件消息的所有觸發(fā)時(shí)間點(diǎn)所處的觸發(fā)時(shí)間段。消息聚合單元適于根據(jù)合并事件消息的相 似度執(zhí)行聚類(lèi)操作,分別將每類(lèi)相似度超過(guò)闊值的合并事件消息聚合為一簇事件消息。
[0022] 可選地,在根據(jù)本發(fā)明的聚合事件消息的應(yīng)用中,消息獲取單元適于根據(jù)下述中 任一種方式來(lái)獲取由至少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控而生成的多條 原始事件消息:接收駐留在每個(gè)性能監(jiān)控設(shè)備中的事件采集應(yīng)用所采集并傳輸?shù)脑际录?消息;接收至少一個(gè)性能監(jiān)控系統(tǒng)中每一個(gè)所發(fā)送的原始事件消息。
[0023] 可選地,在根據(jù)本發(fā)明的聚合事件消息的應(yīng)用中,消息獲取單元還適于繼續(xù)獲取 來(lái)自至少一個(gè)性能監(jiān)控設(shè)備的一條原始事件消息。消息聚合單元還適于計(jì)算本次獲取的原 始事件消息與每簇事件消息的相似度,并將該原始事件消息聚合到與其相似度最高且超過(guò) 闊值的一簇事件消息中。
[0024] 可選地,在根據(jù)本發(fā)明的聚合事件消息的應(yīng)用中,消息聚合單元適于通過(guò)下述方 式W根據(jù)合并事件消息的相似度執(zhí)行聚類(lèi)操作,分別將每類(lèi)相似度超過(guò)闊值的合并事件消 息聚合為一簇事件消息:分別計(jì)算所述合并事件消息中兩兩之間相似度。將兩兩之間相似 度的平均值超過(guò)所述闊值的合并事件消息聚合為一簇事件消息。
[0025] 可選地,在根據(jù)本發(fā)明的聚合事件消息的應(yīng)用中,每條原始事件消息還包括標(biāo)識(shí) 運(yùn)條原始事件消息所對(duì)應(yīng)的計(jì)算設(shè)備所處集群的第四標(biāo)識(shí)。消息聚合單元適于根據(jù)下述方 式分別計(jì)算所述合并事件消息中兩兩之間相似度。對(duì)所述合并事件消息中任意兩條合并事 件消息,計(jì)算運(yùn)兩條合并事件消息之間的時(shí)間段相似度。計(jì)算運(yùn)兩條合并事件消息之間的 第二標(biāo)識(shí)的相似度。計(jì)算運(yùn)兩條合并事件消息之間的第四標(biāo)識(shí)的相似度。將運(yùn)兩條合并事 件消息的時(shí)間段相似度、第二標(biāo)識(shí)的相似度和第四標(biāo)識(shí)的相似度的權(quán)重平均值作為運(yùn)兩條 合并事件消息的相似度。
[0026] 可選地,在根據(jù)本發(fā)明的聚合事件消息的應(yīng)用中,消息聚合單元適于根據(jù)下述方 式計(jì)算運(yùn)兩條合并事件消息之間的時(shí)間段相似度:
[0027]
[0028] 其中,SimUXi,拉)為合并事件消息Xi與X2的時(shí)間段相似度,ts(Xi)表示Xi的觸發(fā)時(shí) 間段的開(kāi)始時(shí)間點(diǎn),ts ( X2 )表示X2的觸發(fā)時(shí)間段的開(kāi)始時(shí)間點(diǎn),te ( Xl )表示Xl的觸發(fā)時(shí)間段 的結(jié)束時(shí)間點(diǎn),te (X2 )表示X2的觸發(fā)時(shí)間段的結(jié)束時(shí)間點(diǎn),T為時(shí)間闊值。
[0029] 可選地,在根據(jù)本發(fā)明的聚合事件消息的應(yīng)用中,消息聚合單元適于根據(jù)下述方 式計(jì)算運(yùn)兩條合并事件消息之間的第二標(biāo)識(shí)的相似度:
[0030] S im2 (Xi,X2) = (SUM-LDIST) /SUM
[0031] 其中,S im2 (Xi,X2)為合并消息Xi和X2之間的第二標(biāo)識(shí)的相似度,SUM為Xi和X2的字 符串的長(zhǎng)度總和,LDIST為Xi和拉之間的第二標(biāo)識(shí)的萊文斯坦距離。
[0032] 可選地,在根據(jù)本發(fā)明的聚合事件消息的應(yīng)用中,消息聚合單元適于根據(jù)下述方 式計(jì)算運(yùn)兩條合并事件消息之間的第四標(biāo)識(shí)的相似度:
[0033] sim3(Xi,X2) = len(XinX2)/max(len(Xi),len(&))
[0034] 其中,sim3(Xi,X2)為Xi和X2之間的第四標(biāo)識(shí)的相似度,Ien化nX2)為Xi和X2之間字 符串交集的長(zhǎng)度。
[0035] 可選地,在根據(jù)本發(fā)明的聚合事件消息的應(yīng)用中,時(shí)間段相似度、第二標(biāo)識(shí)的相似 度和第四標(biāo)識(shí)的相似度的權(quán)重相同。消息聚合單元適于根據(jù)下述公式計(jì)算運(yùn)兩條合并事件 消息的相似度:
[0036]
[0037] 其中,Sim化,X2)為合并事件消息Xi和X2之間的相似度,siml(Xi,X2)為Xi和X2之間 的時(shí)間段相似度,sim2(Xi,X2)為Xi和枯之間的第二標(biāo)識(shí)的相似度,sim3(Xi,枯)為Xi和枯之間 的第四標(biāo)識(shí)的相似度。
[0038] 可選地,在根據(jù)本發(fā)明的聚合事件消息的應(yīng)用中,消息聚合單元適于根據(jù)下述方 式計(jì)算本次獲取的原始事件消息與每簇事件消息的相似度:計(jì)算本次獲取的原始事件消息 與運(yùn)簇事件消息中每一個(gè)的相似度,并將與運(yùn)簇事件消息中每一個(gè)的相似度的平均值作為 該原始事件消息與運(yùn)簇事件消息的相似度。
[0039] 根據(jù)本發(fā)明又一個(gè)方面,提供一種聚合事件消息的系統(tǒng),包括至少一個(gè)性能監(jiān)控 設(shè)備和聚合服務(wù)器。每個(gè)性能監(jiān)控設(shè)備適于對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控并而生成原始事 件消息。聚合服務(wù)器駐留有根據(jù)本發(fā)明的聚合事件消息的應(yīng)用。
[0040] 根據(jù)本發(fā)明的聚合事件消息的方案,可W獲取一個(gè)或多個(gè)性能監(jiān)控設(shè)備(例如, za化ix或nagios等)的多條原始事件消息(例如針對(duì)集群中每個(gè)節(jié)點(diǎn)的原始告警消息)。運(yùn) 樣,本發(fā)明的方案可W將現(xiàn)有的大量分散在不同性能監(jiān)控設(shè)備的原始事件消息進(jìn)行匯集。 另外,本發(fā)明的方案通過(guò)對(duì)大量的原始事件消息進(jìn)行聚合,實(shí)現(xiàn)了對(duì)原始事件消息的壓縮, 并且對(duì)事件消息建立;了精準(zhǔn)關(guān)聯(lián)。運(yùn)樣,本發(fā)明的方案可W極大節(jié)省運(yùn)維人員的精力,提 高解決事件消息對(duì)應(yīng)的設(shè)備故障的效率。
【附圖說(shuō)明】
[0041] 為了實(shí)現(xiàn)上述W及相關(guān)目的,本文結(jié)合下面的描述和附圖來(lái)描述某些說(shuō)明性方 面,運(yùn)些方面指示了可W實(shí)踐本文所公開(kāi)的原理的各種方式,并且所有方面及其等效方面 旨在落入所要求保護(hù)的主題的范圍內(nèi)。通過(guò)結(jié)合附圖閱讀下面的詳細(xì)描述,本公開(kāi)的上述 W及其它目的、特征和優(yōu)勢(shì)將變得更加明顯。遍及本公開(kāi),相同的附圖標(biāo)記通常指代相同的 部件或元素。
[0042] 圖1示出了根據(jù)本發(fā)明一些實(shí)施例的聚合事件消息的系統(tǒng)100的示意圖;
[0043] 圖2示出了根據(jù)本發(fā)明的一些實(shí)施例的聚合事件消息的應(yīng)用200的示意圖;
[0044] 圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的多簇事件消息的顯示界面;W及
[0045] 圖4示出了根據(jù)本發(fā)明一些實(shí)施例的聚合事件消息的方法400的流程圖。
【具體實(shí)施方式】
[0046] 下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi) 的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可W W各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被運(yùn)里闡述的實(shí)施例 所限制。相反,提供運(yùn)些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍 完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0047] 圖1示出了根據(jù)本發(fā)明一些實(shí)施例的聚合事件消息的系統(tǒng)100的示意圖。
[004引如圖1所示,系統(tǒng)100包括性能監(jiān)控設(shè)備110-1.....1IO-N和聚合服務(wù)器120。每個(gè) 性能監(jiān)控設(shè)備(IlO-N)是指駐留有例如zat)bix、nagios、阿里云或者solarwinds等監(jiān)控工具 的平臺(tái),但不限于此。通常,性能監(jiān)控設(shè)備適于對(duì)計(jì)算設(shè)備進(jìn)行性能監(jiān)控。運(yùn)里,計(jì)算設(shè)備可 W是單個(gè)物理實(shí)體的計(jì)算裝置,例如應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器或者超算中屯、節(jié)點(diǎn)等。計(jì)算 設(shè)備也可W是分布式集群。換言之,計(jì)算設(shè)備可W包括多個(gè)分布式布置的服務(wù)節(jié)點(diǎn)或者數(shù) 據(jù)庫(kù)節(jié)點(diǎn)等。取決于期望的配置,性能監(jiān)控設(shè)備可W對(duì)計(jì)算設(shè)備中內(nèi)存占用、CPU占用、磁盤(pán) 占用、網(wǎng)絡(luò)數(shù)據(jù)吞吐、業(yè)務(wù)應(yīng)用等各種性能數(shù)據(jù)進(jìn)行監(jiān)控。
[0049] 聚合服務(wù)器120既可W是單個(gè)物理實(shí)體,也可W是分布式應(yīng)用,本發(fā)明對(duì)此不作過(guò) 多限制。聚合服務(wù)器120可W與一個(gè)或者多個(gè)性能監(jiān)控設(shè)備進(jìn)行直接或間接通信,W從每個(gè) 性能監(jiān)控設(shè)備獲取與監(jiān)控相關(guān)的原始事件消息。通常原始事件消息可W是針對(duì)計(jì)算設(shè)備故 障的告警事件消息,但不限于此。針對(duì)不同的性能監(jiān)控設(shè)備,聚合服務(wù)器120可W采用多種 方式來(lái)獲取原始事件消息。
[0050] 在根據(jù)本發(fā)明一個(gè)實(shí)施例中,性能監(jiān)控設(shè)備可W駐留一個(gè)事件采集應(yīng)用,例如采 集探針(agent)。采集探針可W從性能監(jiān)控設(shè)備中駐留的監(jiān)控工具獲取原始事件消息。具體 而言,采集探針可W被配置為定時(shí)(例如,周期為1分鐘,但不限于此)訪問(wèn)監(jiān)控工具,通過(guò)監(jiān) 控工具的公開(kāi)API、數(shù)據(jù)文件或者相關(guān)數(shù)據(jù)庫(kù)來(lái)獲取事件消息。另外,采集探針還可W被配 置為監(jiān)聽(tīng)監(jiān)控工具的通知消息。采集探針可W通過(guò)S醒P Trap(簡(jiǎn)單網(wǎng)絡(luò)協(xié)議捕獲)等監(jiān)聽(tīng) 方式來(lái)獲取事件消息。
[0051] 在根據(jù)本發(fā)明又一個(gè)實(shí)施例中,性能監(jiān)控設(shè)備的監(jiān)控工具(例如化en-Falcon等) 可W被配置為直接與告警服務(wù)器進(jìn)行通信,并傳輸所生成的原始事件消息。又例如,性能監(jiān) 控設(shè)備可W將與其監(jiān)控的計(jì)算設(shè)備相關(guān)的事件消息發(fā)布到一個(gè)消息隊(duì)列(例如存儲(chǔ)在一個(gè) 分布式數(shù)據(jù)庫(kù))中。聚合服務(wù)器120可W從運(yùn)個(gè)消息隊(duì)列獲取來(lái)自運(yùn)個(gè)性能監(jiān)控設(shè)備的原始 事件消息。需要說(shuō)明的是,除了上述對(duì)獲取事件消息的示例性說(shuō)明,根據(jù)本發(fā)明的實(shí)施例也 可W采用其他公知的方式從一個(gè)或多個(gè)性能監(jiān)控設(shè)備(也可W稱(chēng)為監(jiān)控系統(tǒng))獲取原始事 件消息,本發(fā)明對(duì)比不做過(guò)多限制。
[0052] 如上所述,根據(jù)本發(fā)明的聚合服務(wù)器120可W獲取一個(gè)或多個(gè)性能監(jiān)控設(shè)備的原 始事件消息。在此基礎(chǔ)上,本發(fā)明的聚合服務(wù)器120可W進(jìn)一步對(duì)來(lái)自同一個(gè)性能監(jiān)控設(shè)備 的多條原始事件消息或者來(lái)自不同性能監(jiān)控設(shè)備的多條原始事件消息進(jìn)行聚合。
[0053] 下面將結(jié)合圖2對(duì)聚合服務(wù)器120的聚合實(shí)現(xiàn)過(guò)程進(jìn)行說(shuō)明。
[0054] 圖2示出了根據(jù)本發(fā)明的一些實(shí)施例的聚合事件消息的應(yīng)用200的示意圖。應(yīng)用 200適于駐留在聚合服務(wù)器(120)中。應(yīng)用200包括消息獲取單元210、消息合并單元220和消 息聚合單元230。
[0055] 消息獲取單元210適于獲取由至少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān) 控而生成的多條原始事件消息。消息獲取單元210獲取原始事件消息的具體方式與圖1說(shuō)明 中聚合服務(wù)器120的方式一致,運(yùn)里不再寶述。每條原始事件消息可W包括所對(duì)應(yīng)的性能監(jiān) 控設(shè)備的第一標(biāo)識(shí)、標(biāo)識(shí)觸發(fā)該事件的計(jì)算設(shè)備的第二標(biāo)識(shí)、標(biāo)識(shí)該事件的第=標(biāo)識(shí)和該 事件所對(duì)應(yīng)的觸發(fā)時(shí)間點(diǎn)。但不限于此,原始事件消息還可W包括更多的信息內(nèi)容。運(yùn)里, 第=標(biāo)識(shí)可W是與事件內(nèi)容(例如,故障類(lèi)型標(biāo)識(shí)和故障簡(jiǎn)述等)相關(guān)的標(biāo)識(shí)。可選地,每條 原始事件消息還包括標(biāo)識(shí)所對(duì)應(yīng)的計(jì)算設(shè)備所在的集群的第四標(biāo)識(shí)。運(yùn)里,計(jì)算設(shè)備所在 的集群是該計(jì)算設(shè)備所在的網(wǎng)絡(luò)分組。在根據(jù)本發(fā)明一個(gè)實(shí)施例中,原始事件消息的數(shù)據(jù) 格式如下:
[005
[0058]關(guān)于上述數(shù)據(jù)格式的參數(shù)項(xiàng)說(shuō)明如下:
[005
[0化9]
[0060]
[006。 在采用上述數(shù)據(jù)格式的一個(gè)實(shí)施例中,第一標(biāo)識(shí)為"app",第二標(biāo)識(shí)為 "entityName",第=標(biāo)識(shí)為"eventld",觸發(fā)時(shí)間點(diǎn)(上述格式未示出)例如為性能監(jiān)控設(shè)備 監(jiān)測(cè)到計(jì)算設(shè)備發(fā)生異常的時(shí)間點(diǎn)。
[0062] 在根據(jù)本發(fā)明一個(gè)實(shí)施例中,消息合并單元220適于根據(jù)第二標(biāo)識(shí)和第=標(biāo)識(shí)對(duì) 多條原始事件消息進(jìn)行分組。消息合并單元220分別將每組第二標(biāo)識(shí)和第=標(biāo)識(shí)相同的原 始事件消息合并為一條合并事件消息。每條合并事件消息還包括其所對(duì)應(yīng)的一組原始事件 消息的所有觸發(fā)時(shí)間點(diǎn)所處的觸發(fā)時(shí)間段。每條合并事件消息可W通過(guò)開(kāi)始和結(jié)束時(shí)間來(lái) 表示觸發(fā)時(shí)間段。另外,每條合并事件消息還可W包括所合并的原始事件消息的數(shù)量。除了 根據(jù)第二、第=標(biāo)識(shí)進(jìn)行合并W外,根據(jù)本發(fā)明的實(shí)施例也可W基于原始事件消息其他的 屬性值來(lái)分組并合并為一條合并事件消息,本發(fā)明對(duì)此不做過(guò)多限制。根據(jù)本發(fā)明一個(gè)實(shí) 施例,所生成的合并事件消息的部分屬性值的數(shù)據(jù)示例如下:
[0063] 開(kāi)始時(shí)間點(diǎn)結(jié)束時(shí)間點(diǎn)第四標(biāo)識(shí)第二標(biāo)識(shí)
[0064] [1460344041,1460:344281, 'product'mysql,,'mysqll,],
[00化][1460344061,1460:344301, 'product'mysql,,,mysql5,],
[0066] [1460344081,1460:344141,,main,class,,'testl,],
[0067] [1460344401,1460:344521,,it, a卵,,'webl,],
[006引[1460345841,1460:347041,'it,a卵,product',Veb2'],
[0069] [1460350041,1460350641,,it,a卵,product,,,web3,],
[0070] [1460344066,1460:345866, 'product,mysql,,,mysql3,],
[0071 ] [1460354841,1460355561,'ct'nagiosmonitor,,'nagiosl,],
[0072] [1460347641,1460:348541, 'saas,zabbixmonitor','zabbixl '],
[0073] [1460351241,1460352321,'paas,cluster','redisl']
[0074] 消息聚合單元230適于根據(jù)合并事件消息的相似度執(zhí)行聚類(lèi)操作,并分別將每類(lèi) 相似度超過(guò)闊值的合并事件消息聚合為一簇事件消息。具體而言,根據(jù)本發(fā)明一個(gè)實(shí)施例, 消息聚合單元230首先計(jì)算所生成的合并事件消息兩兩之間的相似度。然后,消息聚合單元 230將兩兩之間相似度的平均值超過(guò)闊值的合并事件消息聚合為一簇事件消息。運(yùn)里,闊值 例如為0.5。另外,消息聚合單元230也可W選擇其他公知的聚類(lèi)方式來(lái)實(shí)現(xiàn)對(duì)合并事件消 息的聚類(lèi),本發(fā)明對(duì)此不做過(guò)多限制。
[0075] 下面對(duì)任意兩條合并事件消息之間相似性的方式進(jìn)行示例性說(shuō)明。消息聚合單元 230可W選定合并事件消息的屬性參數(shù)項(xiàng),并根據(jù)所選定的屬性參數(shù)項(xiàng)對(duì)合并事件消息進(jìn) 行相似度計(jì)算。在根據(jù)本發(fā)明一個(gè)實(shí)施例中,聚合單元230選定的屬性參數(shù)項(xiàng)包括觸發(fā)時(shí)間 段、第二和第四標(biāo)識(shí)。消息聚合單元230可W先計(jì)算各屬性參數(shù)項(xiàng)的相似度,然后計(jì)算各個(gè) 屬性參數(shù)項(xiàng)的相似度平均值。運(yùn)樣,消息聚合單元230可W將該相似度權(quán)重平均值作為運(yùn)兩 條合并事件消息之間的相似度。例如時(shí)間段相似度、第二標(biāo)識(shí)的相似度和第四標(biāo)識(shí)的相似 度的權(quán)重相同。消息聚合單元230適于根據(jù)下述公式計(jì)算運(yùn)兩條合并事件消息的相似度:
[0076]
[0077] 其中,Sim化,X2)為合并事件消息Xi和X2之間的相似度,siml(Xi,X2)為Xi和X2之間 的時(shí)間段相似度,sim2(Xi,X2)為Xi和枯之間的第二標(biāo)識(shí)的相似度,sim3(Xi,枯)為Xi和枯之間 的第四標(biāo)識(shí)的相似度。
[0078] 下面對(duì)觸發(fā)時(shí)間段、第二和第四標(biāo)識(shí)中每一個(gè)屬性參數(shù)項(xiàng)的相似度的計(jì)算過(guò)程進(jìn) 行示例性說(shuō)明。
[0079] 在根據(jù)本發(fā)明一個(gè)實(shí)施例中,計(jì)算觸發(fā)時(shí)間段相似度的公式如下:
[0080]
[0081] 其中,simUXi,拉)為合并事件消息Xi與X2的時(shí)間段相似度。ts化讀示Xi的觸發(fā)時(shí) 間段的開(kāi)始時(shí)間點(diǎn)。ts ( X2 )表示X2的觸發(fā)時(shí)間段的開(kāi)始時(shí)間點(diǎn)。te ( Xl )表示Xl的觸發(fā)時(shí)間段 的結(jié)束時(shí)間點(diǎn)。te(X2)表示X2的觸發(fā)時(shí)間段的結(jié)束時(shí)間點(diǎn)。T為時(shí)間闊值,可W表示時(shí)間點(diǎn)之 間的相關(guān)度。相似度值在[0,1]的區(qū)間上。SimUXi, X2)的分別在巧巾情況下有不同的相似度 值。
[0082] 消息聚合單元230計(jì)算第二標(biāo)識(shí)相似度的方式如下:
[0083] sim2(Xi,X2) = ( SUM-LDIST) /SUM
[0084] 其中,S im2 (Xi,X2)為合并消息Xi和X2之間的第二標(biāo)識(shí)的相似度,SUM為Xi和X2的字 符串的長(zhǎng)度總和,LDIST為Xi和拉之間的第二標(biāo)識(shí)的萊文斯坦距離。
[0085] 消息聚合單元230計(jì)算第四標(biāo)識(shí)相似度的方式如下:
[0086] sim3(Xi,X2) = len(XinX2)/max(len(Xi),len(&))
[0087] 其中,S im3 (Xi,X2)為Xi和拉之間的第四標(biāo)識(shí)的相似度,1 en (Xi n拉)為Xi和X2之間字 符串交集的長(zhǎng)度。
[0088] 通過(guò)上述基于相似度的聚合過(guò)程,消息聚合單元230可W將多條合并事件消息聚 合為多簇事件消息。下述的數(shù)據(jù)格式為前文所示的10條合并事件消息聚合為多簇事件消息 后的數(shù)據(jù)示例:
[0089] 0: [[1460344041,1460:344281,'product,mysql,,'mysqir],
[0090] [1460344061,1460:344301,'product,mysql,,,mysql5,],
[0091] [1460344066,1460:345866, 'product,mysql,,,mysql3,]],
[0092] 1:[[1460344081,1460:M4141,,main,class,,'testl,]],
[0093] 2: [[1460344401,1460:344521,,it, app,,'webl,]],
[0094] 3: [[1460345841,1460:347041,'it,app,product','web2']],
[00巧]4:[[1460350041,1460350641,,it,app,product,,,web3,]],
[0096] 5:[[1460354841,1460355561,'ct'nagiosmonitor','nagiosl']],
[0097] 6:[[1460347641,1460:348541,'saas,zabbixmonitor','zabbixl']],
[009引 7:[[1460351241,1460352321,'paas,cluster','redisl']]
[0099] 如上所示,10條合并事件消息聚合為8個(gè)簇:0、I、2、3、4、5、6和7。經(jīng)驗(yàn)證,mysql I所 在的合并事件消息和mysql5所在的合并事件消息的相似度為0.94,mysqU和mysql3相似度 為0.65,mysql5和mysql3的相似度為0.65。由此可見(jiàn),第0簇中每條合并事件消息的兩兩相 似度均大于闊值(例如為0.5)。
[0100] 另外,性能監(jiān)控設(shè)備生成原始事件消息是一個(gè)持續(xù)的過(guò)程。相應(yīng)地,消息獲取單元 210可W從性能監(jiān)控設(shè)備持續(xù)獲取新的原始事件消息。對(duì)于新獲取的一條原始事件消息,消 息聚合單元230適于計(jì)算運(yùn)條原始事件消息與已有的每簇事件消息之間的相似度。消息聚 合單元230適于將運(yùn)條原始事件消息聚合到與其相似度最高且超過(guò)闊值的一簇事件消息 中。具體而言,根據(jù)本發(fā)明一個(gè)實(shí)施例,消息聚合單元230在計(jì)算運(yùn)條原始事件消息與一簇 事件消息的相似度時(shí),首先計(jì)算運(yùn)條原始事件消息與運(yùn)簇事件消息中每一個(gè)合并事件消息 的相似度,然后將與每一個(gè)合并事件消息的相似度之間的平均值作為運(yùn)條原始事件消息和 該簇的相似度。運(yùn)樣,消息聚合單元230可W確定與運(yùn)條原始事件消息相似度最高的一簇事 件消息。如果最高相似度超過(guò)闊值,消息聚合單元230將運(yùn)條原始告警消息聚合到該簇事件 消息中。如果最高相似度未超過(guò)闊值,消息聚合單元230為運(yùn)條原始事件消息消息創(chuàng)建一個(gè) 新簇(類(lèi))。
[0101] 綜上,根據(jù)本發(fā)明的聚合事件消息的應(yīng)用200可W將來(lái)自一個(gè)或多個(gè)性能監(jiān)控設(shè) 備的多條原始事件消息進(jìn)行聚合,從而極大降低了原始事件消息的數(shù)據(jù)量,并且將不同的 原始事件消息進(jìn)行了準(zhǔn)確關(guān)聯(lián)。為了便于本領(lǐng)域技術(shù)人員更直觀理解聚合事件消息的應(yīng)用 的技術(shù)效果,下面W計(jì)算設(shè)備是MyS化數(shù)據(jù)庫(kù)集群的應(yīng)用場(chǎng)景為例進(jìn)行說(shuō)明。數(shù)據(jù)庫(kù)集群包 括多個(gè)數(shù)據(jù)庫(kù)節(jié)點(diǎn)。當(dāng)某個(gè)節(jié)點(diǎn)發(fā)生查詢(xún)慢的性能事件后,引發(fā)了其他節(jié)點(diǎn)出現(xiàn)性能、負(fù)載 故障,甚至引發(fā)數(shù)據(jù)庫(kù)集群性能負(fù)載高故障。而數(shù)據(jù)庫(kù)集群故障,又會(huì)引發(fā)業(yè)務(wù)服務(wù)故障。 運(yùn)樣,性能監(jiān)控設(shè)備(IlO-N)會(huì)針對(duì)每個(gè)節(jié)點(diǎn)的每個(gè)指標(biāo)項(xiàng)(對(duì)應(yīng)一項(xiàng)故障)生成一條原始 事件消息(運(yùn)里主要是告警消息)。本發(fā)明的聚合事件消息的應(yīng)用可W將運(yùn)些大量的事件消 息進(jìn)行聚合,從而將異構(gòu)的數(shù)據(jù)庫(kù)集群的故障事件進(jìn)行精準(zhǔn)關(guān)聯(lián)和壓縮。運(yùn)將極大節(jié)省運(yùn) 維人員的精力和提高運(yùn)維效率。圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的多簇事件消息的顯示 界面。如圖3所示,10.127.11.192服務(wù)器所在的一簇事件消息310包括5個(gè)合并事件消息 320。運(yùn)5個(gè)合并事件消息包括1個(gè)HTTP告警、一個(gè)MySQL數(shù)據(jù)庫(kù)告警和2個(gè)網(wǎng)絡(luò)Ping告警類(lèi) 型。
[0102] 圖4示出了根據(jù)本發(fā)明一些實(shí)施例的聚合事件消息的方法400的流程圖。方法400 始于在聚合服務(wù)器(120)中執(zhí)行。如圖4所示,方法400始于步驟S410。在步驟S410中,獲取由 至少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控而生成的多條原始事件消息。其中, 每條原始事件消息包括所對(duì)應(yīng)的性能監(jiān)控設(shè)備的第一標(biāo)識(shí)、標(biāo)識(shí)觸發(fā)該事件的計(jì)算設(shè)備的 第二標(biāo)識(shí)、標(biāo)識(shí)該事件的第=標(biāo)識(shí)和該事件所對(duì)應(yīng)的觸發(fā)時(shí)間點(diǎn)。可選地,原始事件消息還 可W包括標(biāo)識(shí)計(jì)算設(shè)備所在集群的第四標(biāo)識(shí),但不限于此。具體而言,根據(jù)本發(fā)明一個(gè)實(shí)施 例,在步驟S410中,接收駐留在每個(gè)性能監(jiān)控設(shè)備中的事件采集應(yīng)用所采集并傳輸?shù)脑?事件消息。又例如,接收至少一個(gè)性能監(jiān)控設(shè)備中每一個(gè)所發(fā)送的原始事件消息。步驟S410 更具體的實(shí)現(xiàn)方式與圖2說(shuō)明中消息獲取單元210-致,運(yùn)里不再寶述。
[0103] 對(duì)于步驟S410中獲取的多條原始告警消息,方法400可W通過(guò)執(zhí)行步驟S420來(lái)進(jìn) 行相同告警事件的合并操作。根據(jù)本發(fā)明一個(gè)實(shí)施例,在步驟S420中,根據(jù)第二標(biāo)識(shí)和第= 標(biāo)識(shí)對(duì)所述多條原始事件消息進(jìn)行分組,并分別將每組第二標(biāo)識(shí)和第=標(biāo)識(shí)相同的原始事 件消息合并為一條合并事件消息。每條合并事件消息還可W包括其所對(duì)應(yīng)的一組原始事件 消息的所有觸發(fā)時(shí)間點(diǎn)所處的觸發(fā)時(shí)間段和運(yùn)組原始事件消息的消息總數(shù)。應(yīng)注意,步驟 S420也可W選擇除第二和第=標(biāo)識(shí)之外的其他屬性參數(shù)項(xiàng)作為是否合并的依據(jù),運(yùn)里不再 --歹U舉。
[0104] 方法400通過(guò)執(zhí)行步驟S430來(lái)對(duì)步驟S420所生成的合并事件消息進(jìn)行聚合。在步 驟S430中,根據(jù)合并事件消息的相似度執(zhí)行聚類(lèi)操作,分別將每類(lèi)相似度超過(guò)闊值的合并 事件消息聚合為一簇事件消息。根據(jù)本發(fā)明一個(gè)實(shí)施例,在步驟S430中,首先分別計(jì)算合并 事件消息中兩兩之間相似度,然后將兩兩之間相似度的平均值超過(guò)闊值(例如0.5)的合并 事件消息聚合為一簇事件消息。對(duì)于任意兩條合并事件消息,步驟S430可W通過(guò)計(jì)算運(yùn)兩 條合并事件消息的屬性參數(shù)項(xiàng)來(lái)計(jì)算相似度。例如,分別計(jì)算時(shí)間段相似度、第二標(biāo)識(shí)的相 似度和第四標(biāo)識(shí)的相似度,然后將運(yùn)兩條合并事件消息的時(shí)間段相似度、第二標(biāo)識(shí)的相似 度和第四標(biāo)識(shí)的相似度的權(quán)重平均值作為運(yùn)兩條合并事件消息的相似度。
[0105] 步驟S430中時(shí)間段相似度的計(jì)算可W采用下述公式進(jìn)行計(jì)算。
[0106]
[0107] 其中,Siml (Xi,拉)為合并事件消息Xi與X2的時(shí)間段相似度。ts(Xi)表示Xi的觸發(fā)時(shí) 間段的開(kāi)始時(shí)間點(diǎn)。ts(X2)表示X2的觸發(fā)時(shí)間段的開(kāi)始時(shí)間點(diǎn)。te(Xl)表示Xl的觸發(fā)時(shí)間段 的結(jié)束時(shí)間點(diǎn)。te (X2 )表示X2的觸發(fā)時(shí)間段的結(jié)束時(shí)間點(diǎn)。T為時(shí)間闊值。
[0108] 另外,步驟S430中第二標(biāo)識(shí)的相似度可W采用下述公式進(jìn)行計(jì)算:
[0109] S im2 (Xi,X2) = (SUM-LDIST) /SUM
[0110] 其中,S im2 (Xi,X2)為合并消息Xi和X2之間的第二標(biāo)識(shí)的相似度。SUM為Xi和X2的字 符串的長(zhǎng)度總和。LDIST為Xi和拉之間的第二標(biāo)識(shí)的萊文斯坦距離。
[0111] 步驟S430中第四標(biāo)識(shí)的相似度可W采用下述公式進(jìn)行計(jì)算:
[0112] sim3(Xi,X2) = len(XinX2)/max(len(Xi),len(&))
[0113] 其中,Sim3(Xi,X2)為Xi和拉之間的第四標(biāo)識(shí)的相似度,1 en(Xi n拉)為Xi和X2之間字 符串交集的長(zhǎng)度。
[0114] 在根據(jù)本發(fā)明一個(gè)實(shí)施例中,時(shí)間段相似度、第二標(biāo)識(shí)的相似度和第四標(biāo)識(shí)的相 似度的巧重相同。巧驢S430計(jì)貸兩條合并車(chē)件消息的相化原力?式化下:
[0115]
[0116] 其中,Sim化,X2)為合并事件消息Xi和X2之間的相似度,Siml (Xi,X2)為Xi和X2之間 的時(shí)間段相似度,sim2化,X2)為Xi和枯之間的第二標(biāo)識(shí)的相似度,sim3(Xi,枯)為Xi和枯之間 的第四標(biāo)識(shí)的相似度。步驟S430更具體的實(shí)現(xiàn)方式與圖2說(shuō)明中消息聚合單元230-致,運(yùn) 里不再寶述。
[0117] 另外,性能監(jiān)控設(shè)備生成事件消息是一個(gè)持續(xù)的過(guò)程??蛇x地,方法400還包括步 驟S440和步驟S450。在步驟S430,繼續(xù)獲取來(lái)自至少一個(gè)性能監(jiān)控設(shè)備的一條原始事件消 息。隨后,在步驟S440中,計(jì)算本次獲取的原始事件消息與每簇事件消息的相似度,并將該 原始事件消息聚合到與其相似度超過(guò)闊值且最高的一簇事件消息。運(yùn)里,計(jì)算該原始事件 消息與任一簇事件消息過(guò)程為:計(jì)算本次獲取的原始事件消息與運(yùn)簇事件消息中每一個(gè)的 相似度,并將與運(yùn)簇事件消息中每一個(gè)的相似度的平均值作為該原始事件消息與運(yùn)簇事件 消息的相似度。另外,如果運(yùn)條原始事件消息與每簇事件消息的相似度都沒(méi)有超過(guò)闊值,貝U 可W運(yùn)條原始事件生成為一簇新的事件消息。
[0118] A9、如A5所述的方法,其中,所述時(shí)間段相似度、第二標(biāo)識(shí)的相似度和第四標(biāo)識(shí)的 相似度的權(quán)重相同,所述將運(yùn)兩條合并事件消息的時(shí)間段相似度、第二標(biāo)識(shí)的相似度和第 四標(biāo)識(shí)的相似度的權(quán)重平均值作為運(yùn)兩條合并事件消息的相似度的步驟包括:
[0119]
[0120] 其中,Sim化,X2)為合并事件消息Xi和X2之間的相似度,Siml (Xi,X2)為Xi和X2之間 的時(shí)間段相似度,sim2化,X2)為Xi和拉之間的第二標(biāo)識(shí)的相似度,sim3(Xi,拉)為Xi和拉之間 的第四標(biāo)識(shí)的相似度。
[0121] A10、如A3所述的方法,其中所述計(jì)算本次獲取的原始事件消息與每簇事件消息的 相似度的步驟包括:計(jì)算本次獲取的原始事件消息與運(yùn)簇事件消息中每一個(gè)的相似度,并 將與運(yùn)簇事件消息中每一個(gè)的相似度的平均值作為該原始事件消息與運(yùn)簇事件消息的相 似度。A12、如All所述的方法,其中,所述消息獲取單元適于根據(jù)下述中任一種方式來(lái)獲取 由至少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控而生成的多條原始事件消息:接收 駐留在每個(gè)性能監(jiān)控設(shè)備中的事件采集應(yīng)用所采集并傳輸?shù)脑际录?接收所述至少 一個(gè)性能監(jiān)控系統(tǒng)中每一個(gè)所發(fā)送的原始事件消息。A13、如All或A12所示的應(yīng)用,其中,所 述消息獲取單元還適于繼續(xù)獲取來(lái)自至少一個(gè)性能監(jiān)控設(shè)備的一條原始事件消息;所述消 息聚合單元還適于計(jì)算本次獲取的原始事件消息與每簇事件消息的相似度,并將該原始事 件消息聚合到與其相似度最高且超過(guò)所述闊值的一簇事件消息中。A14、如A11-A13中任一 項(xiàng)所述的應(yīng)用,其中,所述消息聚合單元適于通過(guò)下述方式W根據(jù)合并事件消息的相似度 執(zhí)行聚類(lèi)操作,分別將每類(lèi)相似度超過(guò)闊值的合并事件消息聚合為一簇事件消息:分別計(jì) 算所述合并事件消息中兩兩之間相似度;將兩兩之間相似度的平均值超過(guò)所述闊值的合并 事件消息聚合為一簇事件消息。A15、如A14所述的應(yīng)用,其中,所述每條原始事件消息還包 括標(biāo)識(shí)運(yùn)條原始事件消息所對(duì)應(yīng)的計(jì)算設(shè)備所處集群的第四標(biāo)識(shí),所述消息聚合單元適于 根據(jù)下述方式分別計(jì)算所述合并事件消息中兩兩之間相似度:
[0122] 對(duì)所述合并事件消息中任意兩條合并事件消息,
[0123] 計(jì)算運(yùn)兩條合并事件消息之間的時(shí)間段相似度;
[0124] 計(jì)算運(yùn)兩條合并事件消息之間的第二標(biāo)識(shí)的相似度;
[0125] 計(jì)算運(yùn)兩條合并事件消息之間的第四標(biāo)識(shí)的相似度;W及
[0126] 將運(yùn)兩條合并事件消息的時(shí)間段相似度、第二標(biāo)識(shí)的相似度和第四標(biāo)識(shí)的相似度 的權(quán)重平均值作為運(yùn)兩條合并事件消息的相似度。A16、如A15所述的應(yīng)用,其中,所述消息 聚合單元適于根據(jù)下述方式計(jì)算運(yùn)兩條合并事件消息之間的時(shí)間段相似度:
[0127]
[012引其中,SimUXi,拉)為合并事件消息Xi與X2的時(shí)間段相似度,ts化讀示Xi的觸發(fā)時(shí) 間段的開(kāi)始時(shí)間點(diǎn),ts ( X2 )表示X2的觸發(fā)時(shí)間段的開(kāi)始時(shí)間點(diǎn),te ( Xl )表示Xl的觸發(fā)時(shí)間段 的結(jié)束時(shí)間點(diǎn),te(X2)表示X2的觸發(fā)時(shí)間段的結(jié)束時(shí)間點(diǎn),T為時(shí)間闊值。A17、如A15所述的 應(yīng)用,其中,所述消息聚合單元適于根據(jù)下述方式計(jì)算運(yùn)兩條合并事件消息之間的第二標(biāo) 識(shí)的相似度:
[0129] S im2 (Xi,X2) = (SUM-LDIST) /SUM
[0130] 其中,sim2(Xi,X2)為合并消息Xi和X2之間的第二標(biāo)識(shí)的相似度,SUM為Xi和X2的字 符串的長(zhǎng)度總和,LDIST為Xi和拉之間的第二標(biāo)識(shí)的萊文斯坦距離。
[0131] A18、如A15所述的應(yīng)用,其中,所述消息聚合單元適于根據(jù)下述方式計(jì)算運(yùn)兩條合 并事件消息之間的第四標(biāo)識(shí)的相似度:
[0132] sim3(Xi,X2) = len(XinX2)/max(len(Xi),len(&))
[0133] 其中,Sim3(Xi,X2)為Xi和拉之間的第四標(biāo)識(shí)的相似度,1 en(Xi n拉)為Xi和X2之間字 符串交集的長(zhǎng)度。A19、如A15所述的應(yīng)用,其中,所述時(shí)間段相似度、第二標(biāo)識(shí)的相似度和第 四標(biāo)識(shí)的相似度的權(quán)重相同,所述消息聚合單元適于根據(jù)下述公式計(jì)算運(yùn)兩條合并事件消 息的相似度:
[0134]
[01對(duì)其中,Sim化,X2)為合并事件消息Xi和X2之間的相似度,siml(Xi,X2)為Xi和X2之間 的時(shí)間段相似度,sim2(Xi,X2)為Xi和枯之間的第二標(biāo)識(shí)的相似度,sim3(Xi,枯)為Xi和枯之間 的第四標(biāo)識(shí)的相似度。A20、如A13所述的應(yīng)用,其中,所述消息聚合單元適于根據(jù)下述方式 計(jì)算本次獲取的原始事件消息與每簇事件消息的相似度:計(jì)算本次獲取的原始事件消息與 運(yùn)簇事件消息中每一個(gè)的相似度,并將與運(yùn)簇事件消息中每一個(gè)的相似度的平均值作為該 原始事件消息與運(yùn)簇事件消息的相似度。
[0136] 在此處所提供的說(shuō)明書(shū)中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施 例可W在沒(méi)有運(yùn)些具體細(xì)節(jié)的情況下被實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié) 構(gòu)和技術(shù),W便不模糊對(duì)本說(shuō)明書(shū)的理解。
[0137] 類(lèi)似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在 上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施 例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋成反映如下意圖:即所要求保 護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多特征。更確切地說(shuō),如下面的 權(quán)利要求書(shū)所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵 循【具體實(shí)施方式】的權(quán)利要求書(shū)由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都 作為本發(fā)明的單獨(dú)實(shí)施例。
[0138] 本領(lǐng)域那些技術(shù)人員應(yīng)當(dāng)理解在本文所公開(kāi)的示例中的設(shè)備的模塊或單元或組 件可W布置在如該實(shí)施例中所描述的設(shè)備中,或者可替換地可W定位在與該示例中的設(shè)備 不同的一個(gè)或多個(gè)設(shè)備中。前述示例中的模塊可W組合為一個(gè)模塊或者此外可W分成多個(gè) 子模塊。
[0139] 本領(lǐng)域那些技術(shù)人員可W理解,可W對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地 改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??蒞把實(shí)施例中的模塊或單 元或組件組合成一個(gè)模塊或單元或組件,W及此外可W把它們分成多個(gè)子模塊或子單元或 子組件。除了運(yùn)樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可W采用任何 組合對(duì)本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征W及如此公開(kāi)的任 何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(shū)(包括伴隨的權(quán) 利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可W由提供相同、等同或相似目的的替代特征來(lái)代 替。
[0140] 此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例 中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的 范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書(shū)中,所要求保護(hù)的實(shí)施例的任 意之一都可WW任意的組合方式來(lái)使用。
[0141] 此外,所述實(shí)施例中的一些在此被描述成可W由計(jì)算機(jī)系統(tǒng)的處理器或者由執(zhí)行 所述功能的其它裝置實(shí)施的方法或方法元素的組合。因此,具有用于實(shí)施所述方法或方法 元素的必要指令的處理器形成用于實(shí)施該方法或方法元素的裝置。此外,裝置實(shí)施例的在 此所述的元素是如下裝置的例子:該裝置用于實(shí)施由為了實(shí)施該發(fā)明的目的的元素所執(zhí)行 的功能。
[0142] 如在此所使用的那樣,除非另行規(guī)定,使用序數(shù)詞"第一"、"第二"、"第等等來(lái) 描述普通對(duì)象僅僅表示設(shè)及類(lèi)似對(duì)象的不同實(shí)例,并且并不意圖暗示運(yùn)樣被描述的對(duì)象必 須具有時(shí)間上、空間上、排序方面或者W任意其它方式的給定順序。
[0143] 盡管根據(jù)有限數(shù)量的實(shí)施例描述了本發(fā)明,但是受益于上面的描述,本技術(shù)領(lǐng)域 內(nèi)的技術(shù)人員明白,在由此描述的本發(fā)明的范圍內(nèi),可W設(shè)想其它實(shí)施例。此外,應(yīng)當(dāng)注意, 本說(shuō)明書(shū)中使用的語(yǔ)言主要是為了可讀性和教導(dǎo)的目的而選擇的,而不是為了解釋或者限 定本發(fā)明的主題而選擇的。因此,在不偏離所附權(quán)利要求書(shū)的范圍和精神的情況下,對(duì)于本 技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)許多修改和變更都是顯而易見(jiàn)的。對(duì)于本發(fā)明的范圍,對(duì)本 發(fā)明所做的公開(kāi)是說(shuō)明性的,而非限制性的,本發(fā)明的范圍由所附權(quán)利要求書(shū)限定。
【主權(quán)項(xiàng)】
1. 一種聚合事件消息的方法,適于在聚合服務(wù)器中執(zhí)行,該方法包括: 獲取由至少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控而生成的多條原始事件 消息,其中每條原始事件消息包括所對(duì)應(yīng)的性能監(jiān)控設(shè)備的第一標(biāo)識(shí)、標(biāo)識(shí)觸發(fā)該事件的 計(jì)算設(shè)備的第二標(biāo)識(shí)、標(biāo)識(shí)該事件的第三標(biāo)識(shí)和該事件所對(duì)應(yīng)的觸發(fā)時(shí)間點(diǎn); 根據(jù)第二標(biāo)識(shí)和第三標(biāo)識(shí)對(duì)所述多條原始事件消息進(jìn)行分組,并分別將每組第二標(biāo)識(shí) 和第三標(biāo)識(shí)相同的原始事件消息合并為一條合并事件消息,每條合并事件消息還包括其所 對(duì)應(yīng)的一組原始事件消息的所有觸發(fā)時(shí)間點(diǎn)所處的觸發(fā)時(shí)間段;以及 根據(jù)合并事件消息的相似度執(zhí)行聚類(lèi)操作,分別將每類(lèi)相似度超過(guò)閾值的合并事件消 息聚合為一簇事件消息。2. 如權(quán)利要求1所述的方法,其中,所述獲取由至少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算 設(shè)備進(jìn)行監(jiān)控而生成的多條原始事件消息的步驟包括下述中任一種: 接收駐留在每個(gè)性能監(jiān)控設(shè)備中的事件采集應(yīng)用所采集并傳輸?shù)脑际录?和 接收所述至少一個(gè)性能監(jiān)控系統(tǒng)中每一個(gè)所發(fā)送的原始事件消息。3. 如權(quán)利要求1或2所示的方法,還包括: 繼續(xù)獲取來(lái)自所述至少一個(gè)性能監(jiān)控設(shè)備的一條原始事件消息, 計(jì)算本次獲取的原始事件消息與每簇事件消息的相似度,并將該原始事件消息聚合到 與其相似度最高且超過(guò)所述閾值的一簇事件消息中。4. 如權(quán)利要求1-3中任一項(xiàng)所述的方法,其中,所述根據(jù)合并事件消息的相似度執(zhí)行聚 類(lèi)操作,分別將每類(lèi)相似度超過(guò)閾值的合并事件消息聚合為一簇事件消息的步驟包括: 分別計(jì)算所述合并事件消息中兩兩之間相似度; 將兩兩之間相似度的平均值超過(guò)所述閾值的一組合并事件消息聚合為一簇事件消息。5. 如權(quán)利要求4所述的方法,其中,所述每條原始事件消息還包括標(biāo)識(shí)這條原始事件消 息所對(duì)應(yīng)的計(jì)算設(shè)備所處集群的第四標(biāo)識(shí),所述分別計(jì)算所述合并事件消息中兩兩之間相 似度的步驟包括: 對(duì)所述合并事件消息中任意兩條合并事件消息, 計(jì)算這兩條合并事件消息之間的時(shí)間段相似度; 計(jì)算這兩條合并事件消息之間的第二標(biāo)識(shí)的相似度; 計(jì)算這兩條合并事件消息之間的第四標(biāo)識(shí)的相似度;以及 將這兩條合并事件消息的時(shí)間段相似度、第二標(biāo)識(shí)的相似度和第四標(biāo)識(shí)的相似度的權(quán) 重平均值作為這兩條合并事件消息的相似度。6. 如權(quán)利要求5所述的方法,其中,所述計(jì)算這兩條合并事件消息之間的時(shí)間段相似度 的步驟包括:其中,SimKX1, X2)為合并事件消息XgX2的時(shí)間段相似度,U(X1)表示X 1的觸發(fā)時(shí)間段 的開(kāi)始時(shí)間點(diǎn),ts (X2)表示X2的觸發(fā)時(shí)間段的開(kāi)始時(shí)間點(diǎn),(Xi)表示Xi的觸發(fā)時(shí)間段的結(jié) 束時(shí)間點(diǎn),L(X 2)表示X2的觸發(fā)時(shí)間段的結(jié)束時(shí)間點(diǎn),T為時(shí)間閾值。7. 如權(quán)利要求5所述的方法,其中,所述計(jì)算這兩條合并事件消息之間的第二標(biāo)識(shí)的相 似度的步驟包括: s im2 (Xi, X2) = (SUM-LDIST) /SUM 其中,s im2 (X1,X2)為合并消息XjPX2之間的第二標(biāo)識(shí)的相似度,SUM為XjPX 2的字符串 的長(zhǎng)度總和,LDIST為XjPX2之間的第二標(biāo)識(shí)的萊文斯坦距離。8. 如權(quán)利要求5所述的方法,其中,所述計(jì)算這兩條合并事件消息之間的第四標(biāo)識(shí)的相 似度的步驟包括: sim3(Xi,X2) = len(Xi Π X2)/max(len(Xi),len(X2)) 其中,Sin^X1, X2)為XjPX2之間的第四標(biāo)識(shí)的相似度,len (X1H X2)為XjPX2之間字符串 交集的長(zhǎng)度。9. 一種聚合事件消息的應(yīng)用,適于駐留在聚合服務(wù)器中,該應(yīng)用包括: 消息獲取單元,適于獲取由至少一個(gè)性能監(jiān)控設(shè)備對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控而生 成的多條原始事件消息,其中每條原始事件消息包括所對(duì)應(yīng)的性能監(jiān)控設(shè)備的第一標(biāo)識(shí)、 標(biāo)識(shí)觸發(fā)該事件的計(jì)算設(shè)備的第二標(biāo)識(shí)、標(biāo)識(shí)該事件的第三標(biāo)識(shí)和該事件所對(duì)應(yīng)的觸發(fā)時(shí) 間點(diǎn); 消息合并單元,適于根據(jù)第二標(biāo)識(shí)和第三標(biāo)識(shí)對(duì)所述多條原始事件消息進(jìn)行分組,并 分別將每組第二標(biāo)識(shí)和第三標(biāo)識(shí)相同的原始事件消息合并為一條合并事件消息,每條合并 事件消息還包括其所對(duì)應(yīng)的一組原始事件消息的所有觸發(fā)時(shí)間點(diǎn)所處的觸發(fā)時(shí)間段;以及 消息聚合單元,適于根據(jù)合并事件消息的相似度執(zhí)行聚類(lèi)操作,分別將每類(lèi)相似度超 過(guò)閾值的合并事件消息聚合為一簇事件消息。10. -種聚合事件消息的系統(tǒng),包括: 至少一個(gè)性能監(jiān)控設(shè)備,每個(gè)性能監(jiān)控設(shè)備適于對(duì)至少一個(gè)計(jì)算設(shè)備進(jìn)行監(jiān)控并而生 成原始事件消息;以及 聚合服務(wù)器,駐留有如權(quán)利要求9所述的聚合事件消息的應(yīng)用。
【文檔編號(hào)】G06F11/30GK106021063SQ201610301051
【公開(kāi)日】2016年10月12日
【申請(qǐng)日】2016年5月9日
【發(fā)明人】陳伯龍, 孫洪龍, 李俊
【申請(qǐng)人】北京藍(lán)海訊通科技股份有限公司