本發(fā)明涉及服務(wù)器監(jiān)控技術(shù)領(lǐng)域,特別是涉及一種服務(wù)器預警方法及裝置。
背景技術(shù):
隨著計算機技術(shù)的快速發(fā)展,各行各業(yè)建設(shè)的信息系統(tǒng)越來越多。服務(wù)器作為信息系統(tǒng)的關(guān)鍵部件,其健康運行是信息系統(tǒng)的業(yè)務(wù)正常運行的保障。
在實際應用中,服務(wù)器的預警系統(tǒng)尤為重要,預警系統(tǒng)在發(fā)現(xiàn)服務(wù)器可能存在問題時可以發(fā)出預警通知,能夠很好地幫助管理員及時處理和定位問題。
在現(xiàn)有技術(shù)中,預警通知的發(fā)出基于一組固定的狀態(tài)閾值,當預警系統(tǒng)監(jiān)測到服務(wù)器出現(xiàn)超過閾值的狀態(tài)時,針對該預警事件的預警通知就會被下達。
在這種方式下,如果閾值設(shè)置的太高,將會有很多潛在的問題被忽略;如果閾值設(shè)置的較低,則會有很多不必要的預警通知發(fā)生。而有的預警事件可能并不需要當時就進行處理,預警通知的頻繁發(fā)送將會給管理員帶來困擾,給其分析處理造成混亂。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種服務(wù)器預警方法及裝置,以自適應地確定是否發(fā)出針對預警事件的預警通知,避免頻繁發(fā)送預警通知給用戶帶來困擾。
為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:
一種服務(wù)器預警方法,包括:
在目標服務(wù)器運行過程中,監(jiān)測所述目標服務(wù)器的預警項;
如果第一預警項的監(jiān)測值達到所述第一預警項對應的設(shè)定閾值,則生成第一預警事件;
根據(jù)預先獲得的事件與行為記錄表,預測所述第一預警事件是否為重要事件,所述事件與行為記錄表中記錄有每個預警項對應的歷史預警事件及針對每個歷史預警事件,根據(jù)用戶對該歷史預警事件的處理行為,確定的該歷史預警事件的重要程度的標記信息;
如果是,則將針對所述第一預警事件的預警通知發(fā)送給所述用戶。
在本發(fā)明的一種具體實施方式中,所述根據(jù)預先獲得的事件與行為記錄表,預測所述第一預警事件是否為重要事件,包括:
在預先獲得的事件與行為記錄表中查找所述第一預警項對應的歷史預警事件;
根據(jù)查找到的每個歷史預警事件對應的監(jiān)測值及每個歷史預警事件的標記信息,預測所述第一預警事件是否為重要事件。
在本發(fā)明的一種具體實施方式中,在所述生成第一預警事件之后,還包括:
在所述事件與行為記錄表中記錄所述第一預警事件。
在本發(fā)明的一種具體實施方式中,還包括:
如果監(jiān)測到所述用戶基于所述第一預警事件對所述目標服務(wù)器進行了相應處理,則在所述事件與行為記錄表中將所述第一預警事件標記為重要事件。
在本發(fā)明的一種具體實施方式中,在所述將針對所述第一預警事件的預警通知發(fā)送給用戶之后,還包括:
接收所述用戶基于所述預警通知的反饋信息;
如果所述反饋信息為忽略所述預警通知,則在所述事件與行為記錄表中將所述第一預警事件標記為非重要事件;
如果所述反饋信息為接受所述預警通知,則在所述事件與行為記錄表中將所述第一預警事件標記為重要事件。
一種服務(wù)器預警裝置,包括:
預警項監(jiān)測模塊,用于在目標服務(wù)器運行過程中,監(jiān)測所述目標服務(wù)器的預警項;
預警事件生成模塊,用于如果第一預警項的監(jiān)測值達到所述第一預警項對應的設(shè)定閾值,則生成第一預警事件;
重要事件預測模塊,用于根據(jù)預先獲得的事件與行為記錄表,預測所述第一預警事件是否為重要事件,所述事件與行為記錄表中記錄有每個預警項對應的歷史預警事件及針對每個歷史預警事件,根據(jù)用戶對該歷史預警事件的處理行為,確定的該歷史預警事件的重要程度的標記信息,如果是,則觸發(fā)預警通知發(fā)送模塊;
所述預警通知發(fā)送模塊,用于將針對所述第一預警事件的預警通知發(fā)送給所述用戶。
在本發(fā)明的一種具體實施方式中,所述重要事件預測模塊,具體用于:
在預先獲得的事件與行為記錄表中查找所述第一預警項對應的歷史預警事件;
根據(jù)查找到的每個歷史預警事件對應的監(jiān)測值及每個歷史預警事件的標記信息,預測所述第一預警事件是否為重要事件。
在本發(fā)明的一種具體實施方式中,還包括預警事件記錄模塊,用于:
在所述生成第一預警事件之后,在所述事件與行為記錄表中記錄所述第一預警事件。
在本發(fā)明的一種具體實施方式中,還包括:
重要事件第一標記模塊,用于在監(jiān)測到所述用戶基于所述第一預警事件對所述目標服務(wù)器進行了相應處理時,在所述事件與行為記錄表中將所述第一預警事件標記為重要事件。
在本發(fā)明的一種具體實施方式中,還包括重要事件第二標記模塊,用于:
在所述將針對所述第一預警事件的預警通知發(fā)送給用戶之后,接收所述用戶基于所述預警通知的反饋信息;
如果所述反饋信息為忽略所述預警通知,則在所述事件與行為記錄表中將所述第一預警事件標記為非重要事件;
如果所述反饋信息為接受所述預警通知,則在所述事件與行為記錄表中將所述第一預警事件標記為重要事件。
應用本發(fā)明實施例所提供的技術(shù)方案,在監(jiān)測目標服務(wù)器的預警項的過程中,如果第一預警項的監(jiān)測值達到該第一預警項對應的設(shè)定閾值,則可以生成第一預警事件,根據(jù)事件與行為記錄表,可以預測第一預警事件是否為重要事件,如果第一預警事件為重要事件,則可以將針對該第一預警事件的預警通知發(fā)送給用戶。事件與行為記錄表中記錄有每個預警項對應的歷史預警事件及針對每個歷史預警事件,根據(jù)用戶對該歷史預警事件的處理行為,確定的該歷史預警事件的重要程度的標記信息,在生成第一預警項對應的第一預警事件后,可以根據(jù)用戶對第一預警項對應的歷史預警事件的重要程度,預測第一預警事件是否為重要事件,參考了用戶對于服務(wù)器狀態(tài)的認知,可以自適應地確定是否發(fā)出針對該第一預警事件的預警通知,避免頻繁發(fā)送預警通知給用戶帶來困擾,使得發(fā)出的預警通知更加合理有效,縮短了管理員對預警事件的處理時間,提高了預警系統(tǒng)的可用性。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例中一種服務(wù)器預警方法的實施流程圖;
圖2為本發(fā)明實施例中一種服務(wù)器預警裝置的結(jié)構(gòu)示意圖。
具體實施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和具體實施方式對本發(fā)明作進一步的詳細說明。顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
參見圖1所示,為本發(fā)明實施例所提供的一種服務(wù)器預警方法的實施流程圖,該方法可以包括以下步驟:
S110:在目標服務(wù)器運行過程中,監(jiān)測目標服務(wù)器的預警項。
目標服務(wù)器可以為任意一個信息系統(tǒng)中的任意一臺服務(wù)器,其具體可以是Linux服務(wù)器,還可以是Unix服務(wù)器。
在本發(fā)明實施例中,可以預先根據(jù)目標服務(wù)器的應用場景、業(yè)務(wù)類型等,確定目標服務(wù)器的預警項,不同服務(wù)器的預警項可以相同或者不同。預警項具體可以為處理器負載狀態(tài)、內(nèi)存使用狀態(tài)、網(wǎng)絡(luò)狀態(tài)等。不同預警項對應不同的設(shè)定閾值。可以預先在預警閾值表中存儲各個預警項的設(shè)定閾值信息。預警系統(tǒng)對外可以提供HTTP接口,用于為用戶提供設(shè)定閾值的修改及查看等操作。
在目標服務(wù)器運行過程中,可以監(jiān)測目標服務(wù)器的各個預警項,獲得各個預警項的監(jiān)測值。在實際應用中,可以針對不同預警項設(shè)定不同的監(jiān)測周期。
S120:如果第一預警項的監(jiān)測值達到第一預警項對應的設(shè)定閾值,則生成第一預警事件。
在對目標服務(wù)器的預警項進行監(jiān)測的過程中,如果第一預警項的監(jiān)測值達到第一預警項對應的設(shè)定閾值,則可以生成第一預警事件。
第一預警項為目標服務(wù)器對應的多個預警項中的任意一個預警項。第一預警事件中可以包含第一預警項的名稱信息、第一預警項的監(jiān)測值信息等。
S130:根據(jù)預先獲得的事件與行為記錄表,預測第一預警事件是否為重要事件。
在本發(fā)明的一個實施例中,在步驟S120生成第一預警事件后,可以在事件與行為記錄表中記錄第一預警事件。即在對目標服務(wù)器的預警項進行監(jiān)測的過程中,生成的預警事件都可以記錄到事件與行為記錄表中。
在本發(fā)明實施例中,事件與行為記錄表中記錄有每個預警項對應的歷史預警事件及針對每個歷史預警事件,根據(jù)用戶對該歷史預警事件的處理行為,確定的該歷史預警事件的重要程度的標記信息。根據(jù)標記信息,可以確定每個歷史預警事件是否為重要事件。用戶可以是管理員、技術(shù)人員等。
在步驟S120生成第一預警事件后,可以根據(jù)預先獲得的事件與行為記錄表,預測第一預警事件是否為重要事件。如果是,則可以繼續(xù)執(zhí)行步驟S140的操作。如果否,則在事件與行為記錄表中記錄第一預警事件后,不做其他操作。
在本發(fā)明的一種具體實施方式中,步驟S130可以包括以下步驟:
步驟一:在預先獲得的事件與行為記錄表中查找第一預警項對應的歷史預警事件;
步驟二:根據(jù)查找到的每個歷史預警事件對應的監(jiān)測值及每個歷史預警事件的標記信息,預測第一預警事件是否為重要事件。
為便于描述,將上述兩個步驟結(jié)合起來進行說明。
事件與行為記錄表中記錄有每個預警項對應的歷史預警事件及每個歷史預警事件的標記信息。
通過查找事件與行為記錄表,可以查找到第一預警項對應的歷史預警事件。每個歷史預警事件對應第一預警項的一個監(jiān)測值。
根據(jù)查找到的每個歷史預警事件對應的監(jiān)測值及每個歷史預警事件的標記信息,可以預測第一預警事件是否為重要事件。具體的,可以以第一預警項對應的歷史預警事件為訓練數(shù)據(jù),使用分類算法,預測當前生成的第一預警事件是否為重要事件。
在本發(fā)明的一種具體實施方式中,可以利用kNN算法進行分類預測。kNN算法是指將事件與行為記錄表中的數(shù)據(jù),即每個預警項對應的歷史預警事件作為訓練數(shù)據(jù)集,訓練數(shù)據(jù)集中只存在兩種類型,一種為重要事件類型,一種為非重要事件類型,訓練過程中找出兩種類型的中心點。當新的預警事件發(fā)生時,計算該預警事件對應的監(jiān)測值與訓練數(shù)據(jù)集中兩中心點的歐氏距離,預測結(jié)果為與其距離較小的中心點的類型。預測完成后,更新類型中心點。
舉例而言,假設(shè)第一預警項為內(nèi)存使用狀態(tài),其對應的設(shè)定閾值為50%,在事件與行為記錄表中記錄的該第一預警項對應的歷史預警事件分別為:
事件1:監(jiān)測值為55%,標記信息為非重要事件;
事件2:監(jiān)測值為60%,標記信息為非重要事件;
事件3:監(jiān)測值為80%,標記信息為重要事件。
當前第一預警事件:監(jiān)測值為58%,其與非重要事件類型中心點的距離小于其與重要事件類型中心點的距離,可以預測該第一預警事件為非重要事件。
如果事件與行為記錄表中沒有記錄第一預警項對應的歷史預警事件,則可以直接將第一預警事件確定為重要事件。
S140:將針對第一預警事件的預警通知發(fā)送給用戶。
根據(jù)事件與行為記錄表,如果預測第一預警事件為重要事件,則可以將針對第一預警事件的預警通知發(fā)送給用戶。具體的,可以通過短信、郵件或者電話等方式發(fā)送該預警通知。以便用戶能夠及時獲知第一預警事件,并及時處理相應問題。用戶可以通過預警系統(tǒng)對外提供的HTTP接口,配置接收預警通知的方式。
根據(jù)用戶對歷史預警事件的處理行為預測第一預警事件是否為重要事件,如果是重要事件,則表明第一預警事件是用戶更加關(guān)注的問題,預警作用更為有效。
應用本發(fā)明實施例所提供的方法,在監(jiān)測目標服務(wù)器的預警項的過程中,如果第一預警項的監(jiān)測值達到該第一預警項對應的設(shè)定閾值,則可以生成第一預警事件,根據(jù)事件與行為記錄表,可以預測第一預警事件是否為重要事件,如果第一預警事件為重要事件,則可以將針對該第一預警事件的預警通知發(fā)送給用戶。事件與行為記錄表中記錄有每個預警項對應的歷史預警事件及針對每個歷史預警事件,根據(jù)用戶對該歷史預警事件的處理行為,確定的該歷史預警事件的重要程度的標記信息,在生成第一預警項對應的第一預警事件后,可以根據(jù)用戶對第一預警項對應的歷史預警事件的重要程度,預測第一預警事件是否為重要事件,參考了用戶對于服務(wù)器狀態(tài)的認知,可以自適應地確定是否發(fā)出針對該第一預警事件的預警通知,避免頻繁發(fā)送預警通知給用戶帶來困擾,使得發(fā)出的預警通知更加合理有效,縮短了管理員對預警事件的處理時間,提高了預警系統(tǒng)的可用性。
在本發(fā)明的一個實施例中,該方法還可以包括以下步驟:
如果監(jiān)測到用戶基于第一預警事件對目標服務(wù)器進行了相應處理,則在事件與行為記錄表中將第一預警事件標記為重要事件。
在本發(fā)明實施例中,生成第一預警事件后,可以在事件與行為記錄表中記錄第一預警事件。無論是否向用戶發(fā)送針對第一預警事件的預警通知,用戶都可以通過事件與行為記錄表查看到該第一預警事件。
如果監(jiān)測到用戶基于該第一預警事件對目標服務(wù)器進行了相應處理,則表明該第一預警事件為重要事件,可以在事件與行為記錄表中將第一預警事件標記為重要事件。
在本發(fā)明的一個實施例中,在步驟S140之后,還可以包括以下步驟:
第一個步驟:接收用戶基于預警通知的反饋信息;
第二個步驟:如果反饋信息為忽略預警通知,則在事件與行為記錄表中將第一預警事件標記為非重要事件;
第三個步驟:如果反饋信息為接受預警通知,則在事件與行為記錄表中將第一預警事件標記為重要事件。
為便于描述,將上述三個步驟結(jié)合起來進行說明。
在將針對第一預警事件的預警通知發(fā)送給用戶后,用戶可以分析并判斷第一預警事件對應的問題的嚴重性,并做出處理或者忽略。用戶可以基于該預警通知返回反饋信息。如果用戶認為該預警通知較為重要,則可以返回接受該預警通知的反饋信息,如果用戶認為該預警通知并不重要,或者當前并不需要對該預警通知對應的第一預警事件進行處理,則可以返回忽略該預警通知的反饋信息。
根據(jù)用戶的反饋信息,可以確定是否要在事件與行為記錄表中將第一預警事件標記為重要事件。具體的,如果反饋信息為忽略預警通知,則在事件與行為記錄表中將第一預警事件標記為非重要事件,如果反饋信息為接受預警通知,表明用戶接受了該預警通知,則可以在事件與行為記錄表中將第一預警事件標記為重要事件。
本發(fā)明實施例引入了用戶對預警通知的行為的影響,用戶對于整個服務(wù)器的狀態(tài)具有較好的認識和把握,如服務(wù)器運行的業(yè)務(wù)類型、可能存在的風險等。
經(jīng)過多次迭代,預警系統(tǒng)發(fā)出的預警通知契合用戶的處理結(jié)果。針對不需要發(fā)送預警通知的預警事件,預警系統(tǒng)可以取消該預警通知,這樣,可以減少預警通知發(fā)送頻次,減少管理員的工作量。
應用本發(fā)明實施例所提供的技術(shù)方案,預警系統(tǒng)可以自我調(diào)整,逐漸適應于用戶關(guān)注的服務(wù)器狀態(tài),從而使得發(fā)送的預警通知更加有效、必要。
相應于上面的方法實施例,本發(fā)明實施例還提供了一種服務(wù)器預警裝置,下文描述的一種服務(wù)器預警裝置與上文描述的一種服務(wù)器預警方法可相互對應參照。
參見圖2所示,該裝置可以包括以下模塊:
預警項監(jiān)測模塊210,用于在目標服務(wù)器運行過程中,監(jiān)測目標服務(wù)器的預警項;
預警事件生成模塊220,用于如果第一預警項的監(jiān)測值達到第一預警項對應的設(shè)定閾值,則生成第一預警事件;
重要事件預測模塊230,用于根據(jù)預先獲得的事件與行為記錄表,預測第一預警事件是否為重要事件,事件與行為記錄表中記錄有每個預警項對應的歷史預警事件及針對每個歷史預警事件,根據(jù)用戶對該歷史預警事件的處理行為,確定的該歷史預警事件的重要程度的標記信息,如果是,則觸發(fā)預警通知發(fā)送模塊240;
預警通知發(fā)送模塊240,用于將針對第一預警事件的預警通知發(fā)送給用戶。
應用本發(fā)明實施例所提供的裝置,在監(jiān)測目標服務(wù)器的預警項的過程中,如果第一預警項的監(jiān)測值達到該第一預警項對應的設(shè)定閾值,則可以生成第一預警事件,根據(jù)事件與行為記錄表,可以預測第一預警事件是否為重要事件,如果第一預警事件為重要事件,則可以將針對該第一預警事件的預警通知發(fā)送給用戶。事件與行為記錄表中記錄有每個預警項對應的歷史預警事件及針對每個歷史預警事件,根據(jù)用戶對該歷史預警事件的處理行為,確定的該歷史預警事件的重要程度的標記信息,在生成第一預警項對應的第一預警事件后,可以根據(jù)用戶對第一預警項對應的歷史預警事件的重要程度,預測第一預警事件是否為重要事件,參考了用戶對于服務(wù)器狀態(tài)的認知,可以自適應地確定是否發(fā)出針對該第一預警事件的預警通知,避免頻繁發(fā)送預警通知給用戶帶來困擾,使得發(fā)出的預警通知更加合理有效,縮短了管理員對預警事件的處理時間,提高了預警系統(tǒng)的可用性。
在本發(fā)明的一種具體實施方式中,重要事件預測模塊230,具體用于:
在預先獲得的事件與行為記錄表中查找第一預警項對應的歷史預警事件;
根據(jù)查找到的每個歷史預警事件對應的監(jiān)測值及每個歷史預警事件的標記信息,預測第一預警事件是否為重要事件。
在本發(fā)明的一種具體實施方式中,還包括預警事件記錄模塊,用于:
在生成第一預警事件之后,在事件與行為記錄表中記錄第一預警事件。
在本發(fā)明的一種具體實施方式中,還包括:
重要事件第一標記模塊,用于在監(jiān)測到用戶基于第一預警事件對目標服務(wù)器進行了相應處理時,在事件與行為記錄表中將第一預警事件標記為重要事件。
在本發(fā)明的一種具體實施方式中,還包括重要事件第二標記模塊,用于:
在將針對第一預警事件的預警通知發(fā)送給用戶之后,接收用戶基于預警通知的反饋信息;
如果反饋信息為忽略預警通知,則在事件與行為記錄表中將第一預警事件標記為非重要事件;
如果反饋信息為接受預警通知,則在事件與行為記錄表中將第一預警事件標記為重要事件。
本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其它實施例的不同之處,各個實施例之間相同或相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應,所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
專業(yè)人員還可以進一步意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應認為超出本發(fā)明的范圍。
結(jié)合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實施。軟件模塊可以置于隨機存儲器(RAM)、內(nèi)存、只讀存儲器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。
本文中應用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的技術(shù)方案及其核心思想。應當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對本發(fā)明進行若干改進和修飾,這些改進和修飾也落入本發(fā)明權(quán)利要求的保護范圍內(nèi)。