一種分布式web系統(tǒng)的運行維護(hù)的方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種分布式web系統(tǒng)的運行維護(hù)的方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著計算機互聯(lián)網(wǎng)技術(shù)的發(fā)展,各種系統(tǒng)的計算任務(wù)越來越重,從而出現(xiàn)了分布式的web系統(tǒng),多臺服務(wù)器協(xié)同工作,大大提升了各種應(yīng)用系統(tǒng)的處理能力。目前很大一部分的互聯(lián)網(wǎng)項目都采用了分布式web結(jié)構(gòu),但多臺服務(wù)器的協(xié)同在計算能力提升的同時,也帶來了運營維護(hù)方面的困難,幾十上百臺服務(wù)器運行中,不可避免的會出現(xiàn)軟硬件方面問題,如果沒有好的處理方法,運維人員可能很晚才發(fā)現(xiàn)出問題,而要找到出問題的服務(wù)器又可能花費很大精力。
[0003]現(xiàn)有技術(shù)中,在對分布式web系統(tǒng)的進(jìn)行運行維護(hù)時,通過獲取運行在各服務(wù)器上的軟件和硬件的運行信息,來監(jiān)控各個服務(wù)器的運行狀態(tài),當(dāng)檢測到故障信息時,發(fā)出警報,外部管理人員根據(jù)故障信息來找出解決方案。
[0004]由上述描述可見,現(xiàn)有技術(shù)中能夠提供故障信息來供外部參考,管理人員根據(jù)故障信息來找出解決方案,在分析故障信息找解決方案的過程中,會耗費一定的時間,而且不同的管理人員通過主觀判斷可能會給出不同的解決方案,解決方案不統(tǒng)一,而且可能會由于人為因素的影響造成解決方案不準(zhǔn)確。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供了一種分布式web系統(tǒng)的運行維護(hù)的方法及系統(tǒng),能夠針對故障信息給出解決方案。
[0006]一方面,本發(fā)明提供了一種分布式web系統(tǒng)的運行維護(hù)的方法,預(yù)先設(shè)置故障信息與解決方案的對應(yīng)關(guān)系,所述方法包括:
[0007]獲取待測服務(wù)器的運行信息;
[0008]從運行信息中提取所述待測服務(wù)器的故障信息;
[0009]查找與待測服務(wù)器的故障信息對應(yīng)的解決方案,輸出所述解決方案。
[0010]進(jìn)一步地,所述獲取待測服務(wù)器的運行信息,包括:向待測服務(wù)器發(fā)送請求運行信息的請求信息,接收待測服務(wù)器返回的運行信息。
[0011]進(jìn)一步地,在所述從運行信息中提取所述待測服務(wù)器的故障信息之后,進(jìn)一步包括:
[0012]查詢待測服務(wù)器的故障信息是否與已發(fā)出報警信號的任一故障信息相同,
[0013]如果是,則不發(fā)送報警信號;
[0014]如果不是,則發(fā)送報警信號。
[0015]進(jìn)一步地,所述查找與待測服務(wù)器的故障信息對應(yīng)的解決方案,進(jìn)一步包括:
[0016]如果沒有查找到與待測服務(wù)器的故障信息對應(yīng)的解決方案,則接收外部輸入的待測服務(wù)器的故障信息的解決方案,并建立待測服務(wù)器的故障信息與外部輸入的解決方案的對應(yīng)關(guān)系。
[0017]進(jìn)一步地,所述方法還包括:針對已得到的故障信息,設(shè)置該故障信息發(fā)生前預(yù)設(shè)時間的歷史運行信息、該故障信息、該故障信息的解決方案三者的對應(yīng)關(guān)系;
[0018]在所述獲取待測服務(wù)器的運行信息之后,進(jìn)一步包括:
[0019]分析所述待測服務(wù)器的運行信息與所述歷史運行信息的相似度,如果超過了預(yù)先設(shè)置的相似度閾值,則發(fā)出提醒信號,查找所述歷史運行信息對應(yīng)的解決方案,輸出所述對應(yīng)的解決方案。
[0020]另一方面,本發(fā)明提供了一種分布式web系統(tǒng)的運行維護(hù)的系統(tǒng),所述系統(tǒng)包括:
[0021]第一對應(yīng)關(guān)系模塊,用于保存預(yù)先設(shè)置的故障信息與解決方案的對應(yīng)關(guān)系;
[0022]獲取模塊,用于獲取待測服務(wù)器的運行信息,發(fā)送待測服務(wù)器的運行信息;
[0023]提取模塊,用于從獲取模塊發(fā)送的待測服務(wù)器的運行信息中提取待測服務(wù)器的故障信息,發(fā)送所述待測服務(wù)器的故障信息;
[0024]查找模塊,用于接收提取模塊發(fā)送的待測服務(wù)器的故障信息,在所述第一對應(yīng)關(guān)系模塊中查找與所述待測服務(wù)器的故障信息對應(yīng)的解決方案,輸出所述解決方案。
[0025]進(jìn)一步地,所述獲取模塊,用于向待測服務(wù)器發(fā)送請求運行信息的請求信息,接收待測服務(wù)器返回的運行信息。
[0026]進(jìn)一步地,所述系統(tǒng)進(jìn)一步包括:報警模塊,用于接收提取模塊發(fā)送的待測服務(wù)器的故障信息,查詢待測服務(wù)器的故障信息是否與已發(fā)出報警信號的任一故障信息相同,
[0027]如果是,則不發(fā)送報警信號;
[0028]如果不是,則發(fā)送報警信號。
[0029]進(jìn)一步地,所述查找模塊,還用于如果在第一對應(yīng)關(guān)系模塊中沒有查找到與提取模塊發(fā)送的待測服務(wù)器的故障信息對應(yīng)的解決方案,則接收外部輸入的所述待測服務(wù)器的故障信息的解決方案,并建立所述待測服務(wù)器的故障信息與外部輸入的解決方案的對應(yīng)關(guān)系,保存到第一對應(yīng)關(guān)系模塊中。
[0030]進(jìn)一步地,所述系統(tǒng)還包括:第二對應(yīng)關(guān)系模塊,用于保存針對已得到的故障信息,設(shè)置的該故障信息發(fā)生前預(yù)設(shè)時間的歷史運行信息、該故障信息、該故障信息的解決方案三者的對應(yīng)關(guān)系;
[0031]預(yù)測模塊,用于接收獲取模塊發(fā)送的待測服務(wù)器的運行信息,分析所述待測服務(wù)器的運行信息與所述歷史運行信息的相似度,如果超過了預(yù)先設(shè)置的相似度閾值,則發(fā)出提醒信號,查找第二對應(yīng)關(guān)系模塊中歷史運行信息對應(yīng)的解決方案,輸出所述對應(yīng)的解決方案。
[0032]通過本發(fā)明提供的一種分布式web系統(tǒng)的運行維護(hù)的方法及系統(tǒng),在從運行信息中提取出故障信息后,根據(jù)預(yù)先設(shè)置故障信息與解決方案的對應(yīng)關(guān)系,快速的找到解決方案,節(jié)省了通過分析故障信息來找解決方案的時間,并且解決方案不會受人為因素影響,方案統(tǒng)一準(zhǔn)確。
【附圖說明】
[0033]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0034]圖1是本發(fā)明實施例一提供的一種分布式web系統(tǒng)的運行維護(hù)的方法流程圖;
[0035]圖2是本發(fā)明實施例二提供的另一種分布式web系統(tǒng)的運行維護(hù)的方法流程圖;
[0036]圖3是本發(fā)明實施例三提供的一種分布式web系統(tǒng)的運行維護(hù)的系統(tǒng)示意圖;
[0037]圖4是本發(fā)明實施例三提供的另一種分布式web系統(tǒng)的運行維護(hù)的系統(tǒng)示意圖。
【具體實施方式】
[0038]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例,基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0039]實施例1:
[0040]隨著分布式的web系統(tǒng)的發(fā)展,盡快解決服務(wù)器出現(xiàn)的故障十分重要。為了能盡快消除服務(wù)器的故障,本發(fā)明實施例提供了一種分布式web系統(tǒng)的運行維護(hù)的方法,參見圖1,該方法包括:
[0041]步驟101:預(yù)先設(shè)置故障信息與解決方案的對應(yīng)關(guān)系;
[0042]步驟102:獲取待測服務(wù)器的運行信息;
[0043]步驟103:從運行信息中提取待測服務(wù)器的故障信息;
[0044]步驟104:查找與待測服務(wù)器的故障信息對應(yīng)的解決方案,輸出該解決方案。
[0045]通過本發(fā)明實施例提供的一種分布式web系統(tǒng)的運行維護(hù)的方法,在從運行信息中提取出故障信息后,根據(jù)預(yù)先設(shè)置故障信息與解決方案的對應(yīng)關(guān)系,快速的找到解決方案,節(jié)省了通過分析故障信息來找解決方案的時間,并且解決方案不會受人為因素影響,方案統(tǒng)一準(zhǔn)確。
[0046]在步驟101中,根據(jù)歷史統(tǒng)計信息中,對各種故障的解決方法預(yù)先設(shè)置故障信息與解決方案的對應(yīng)關(guān)系,方便在解決出現(xiàn)故障時,快速找到對應(yīng)的解決方案。
[0047]在步驟102中,獲取待測服務(wù)器的運行信息的方式有多種,可以通過向待測服務(wù)器發(fā)送請求信息的方式來實現(xiàn),