一種網(wǎng)絡(luò)監(jiān)控處理方法以及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種網(wǎng)絡(luò)監(jiān)控處理方法以及裝置。
【背景技術(shù)】
[0002]在目前的IM(Instant Messaging,即時通訊)系統(tǒng)中,來自客戶端的請求消息首先是通過接入節(jié)點(diǎn)的處理,然后再轉(zhuǎn)發(fā)到后端的服務(wù)節(jié)點(diǎn),服務(wù)節(jié)點(diǎn)對請求消息處理完畢后再將結(jié)果經(jīng)由接入節(jié)點(diǎn)返回給客戶端。為了實(shí)現(xiàn)系統(tǒng)的可靠性,通常會在不同的區(qū)域的機(jī)房部署多個對等的服務(wù)節(jié)點(diǎn)。接入節(jié)點(diǎn)通常是按照隨機(jī)或者輪詢方式將請求消息轉(zhuǎn)發(fā)給服務(wù)節(jié)點(diǎn)。當(dāng)某個服務(wù)節(jié)點(diǎn)網(wǎng)絡(luò)出現(xiàn)問題時,仍然會有部分請求消息轉(zhuǎn)發(fā)到這個問題服務(wù)節(jié)點(diǎn)上,從而會對客戶端的請求造成影響。在這種情況下,就需要人工采取措施,隔離或者停止這個問題服務(wù)節(jié)點(diǎn),而且在該服務(wù)節(jié)點(diǎn)所處機(jī)房網(wǎng)絡(luò)不是很穩(wěn)定的情況下,就需要管理員頻繁對問題服務(wù)節(jié)點(diǎn)進(jìn)行隔離或停止,導(dǎo)致人工維護(hù)成本增加。
【發(fā)明內(nèi)容】
[0003]本發(fā)明實(shí)施例提供一種網(wǎng)絡(luò)監(jiān)控處理方法以及裝置,可降低對服務(wù)節(jié)點(diǎn)的人工維護(hù)成本。
[0004]本發(fā)明實(shí)施例提供了一種網(wǎng)絡(luò)監(jiān)控處理方法,包括:
[0005]獲取接入節(jié)點(diǎn)與服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息;
[0006]根據(jù)所述消息發(fā)送狀態(tài)信息中的消息延時率或消息失敗率,確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài);
[0007]當(dāng)所述網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)時,將所述服務(wù)節(jié)點(diǎn)添加到正常服務(wù)節(jié)點(diǎn)集合;
[0008]當(dāng)所述網(wǎng)絡(luò)狀態(tài)為異常狀態(tài)時,將所述服務(wù)節(jié)點(diǎn)添加到暫停服務(wù)節(jié)點(diǎn)集合,以便于所述接入節(jié)點(diǎn)僅對所述正常服務(wù)節(jié)點(diǎn)集合中的所有服務(wù)節(jié)點(diǎn)進(jìn)行通信。
[0009]相應(yīng)地,本發(fā)明實(shí)施例還提供了一種網(wǎng)絡(luò)監(jiān)控處理裝置,包括:
[0010]獲取模塊,用于獲取接入節(jié)點(diǎn)與服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息;
[0011]確定模塊,用于根據(jù)所述消息發(fā)送狀態(tài)信息中的消息延時率或消息失敗率,確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài);
[0012]添加模塊,用于當(dāng)所述網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)時,將所述服務(wù)節(jié)點(diǎn)添加到正常服務(wù)節(jié)點(diǎn)集合;
[0013]所述添加模塊,還用于當(dāng)所述網(wǎng)絡(luò)狀態(tài)為異常狀態(tài)時,將所述服務(wù)節(jié)點(diǎn)添加到暫停服務(wù)節(jié)點(diǎn)集合,以便于所述接入節(jié)點(diǎn)僅對所述正常服務(wù)節(jié)點(diǎn)集合中的所有服務(wù)節(jié)點(diǎn)進(jìn)行通信。
[0014]本發(fā)明實(shí)施例通過獲取接入節(jié)點(diǎn)與服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息,并根據(jù)所述消息發(fā)送狀態(tài)信息中的消息延時率或消息失敗率,確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài),可以在所述網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)時,將所述服務(wù)節(jié)點(diǎn)添加到正常服務(wù)節(jié)點(diǎn)集合;或在所述網(wǎng)絡(luò)狀態(tài)為異常狀態(tài)時,將所述服務(wù)節(jié)點(diǎn)添加到暫停服務(wù)節(jié)點(diǎn)集合,以便于所述接入節(jié)點(diǎn)僅對所述正常服務(wù)節(jié)點(diǎn)集合中的所有服務(wù)節(jié)點(diǎn)進(jìn)行通信。由于所述接入節(jié)點(diǎn)只將請求消息轉(zhuǎn)發(fā)給所述正常服務(wù)節(jié)點(diǎn)集合中的服務(wù)節(jié)點(diǎn),所以可以有效降低問題服務(wù)節(jié)點(diǎn)對客戶端的請求所造成的影響,而且基于所述正常服務(wù)節(jié)點(diǎn)集合和所述暫停服務(wù)節(jié)點(diǎn)集合對服務(wù)節(jié)點(diǎn)的劃分,可以自動對問題服務(wù)節(jié)點(diǎn)進(jìn)行隔離或停止,從而可降低對服務(wù)節(jié)點(diǎn)的人工維護(hù)成本。
【附圖說明】
[0015]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0016]圖1是本發(fā)明實(shí)施例提供的一種網(wǎng)絡(luò)架構(gòu)的不意圖;
[0017]圖2是本發(fā)明實(shí)施例提供的一種網(wǎng)絡(luò)監(jiān)控處理方法的流程示意圖;
[0018]圖3是本發(fā)明實(shí)施例提供的另一種網(wǎng)絡(luò)監(jiān)控處理方法的流程示意圖;
[0019]圖4是本發(fā)明實(shí)施例提供的一種網(wǎng)絡(luò)監(jiān)控處理裝置的結(jié)構(gòu)示意圖;
[0020]圖5是本發(fā)明實(shí)施例提供的一種獲取模塊的結(jié)構(gòu)示意圖;
[0021 ]圖6是本發(fā)明實(shí)施例提供的一種計(jì)算生成單元的結(jié)構(gòu)示意圖;
[0022]圖7是本發(fā)明實(shí)施例提供的一種確定模塊的結(jié)構(gòu)示意圖;
[0023]圖8是本發(fā)明實(shí)施例提供的另一種網(wǎng)絡(luò)監(jiān)控處理裝置的結(jié)構(gòu)示意圖;
[0024]圖9是本發(fā)明實(shí)施例提供的又一種網(wǎng)絡(luò)監(jiān)控處理裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0025]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0026]請參見圖1,是本發(fā)明實(shí)施例提供的一種網(wǎng)絡(luò)構(gòu)架的示意圖。如圖1所示,該網(wǎng)絡(luò)構(gòu)架可以包括網(wǎng)絡(luò)監(jiān)控處理裝置、接入節(jié)點(diǎn)以及多個服務(wù)節(jié)點(diǎn)。所述網(wǎng)絡(luò)監(jiān)控處理裝置可以應(yīng)用于IM系統(tǒng)中,具體可以為部署于IM系統(tǒng)中的某一臺或多臺服務(wù)器。所述網(wǎng)絡(luò)監(jiān)控處理裝置可以分別于所述接入節(jié)點(diǎn)和所述多個服務(wù)節(jié)點(diǎn)進(jìn)行網(wǎng)絡(luò)連接,所述接入節(jié)點(diǎn)也可以與所述多個服務(wù)節(jié)點(diǎn)進(jìn)行網(wǎng)絡(luò)連接。本發(fā)明實(shí)施例中,所述網(wǎng)絡(luò)監(jiān)控處理裝置可以獲取所述接入節(jié)點(diǎn)與每個服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息,并根據(jù)每個消息發(fā)送狀態(tài)信息中的消息延時率或消息失敗率,分別確定各消息發(fā)送狀態(tài)信息所對應(yīng)的服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài),所述網(wǎng)絡(luò)監(jiān)控處理裝置還可以將所述網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)的服務(wù)節(jié)點(diǎn)添加到正常服務(wù)節(jié)點(diǎn)集合,并將所述網(wǎng)絡(luò)狀態(tài)為異常狀態(tài)的服務(wù)節(jié)點(diǎn)添加到暫停服務(wù)節(jié)點(diǎn)集合,并控制所述接入節(jié)點(diǎn)僅對所述正常服務(wù)節(jié)點(diǎn)集合中的所有服務(wù)節(jié)點(diǎn)進(jìn)行通信,從而可以有效降低問題服務(wù)節(jié)點(diǎn)對客戶端的請求所造成的影響,而且還可以自動對問題服務(wù)節(jié)點(diǎn)進(jìn)行隔離或停止,從而可降低對服務(wù)節(jié)點(diǎn)的人工維護(hù)成本。由于對每個服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài)監(jiān)控過程都一樣,且對每個服務(wù)節(jié)點(diǎn)的集合判斷過程也一樣,所以以下圖2至圖9對應(yīng)的實(shí)施例均以其中一個服務(wù)節(jié)點(diǎn)為例進(jìn)行說明,且該服務(wù)節(jié)點(diǎn)可以為該網(wǎng)絡(luò)架構(gòu)中的任意一個服務(wù)節(jié)點(diǎn)。
[0027]基于圖1所示的網(wǎng)絡(luò)構(gòu)架,本發(fā)明實(shí)施例公開了的一種網(wǎng)絡(luò)監(jiān)控處理方法。請參見圖2,是本發(fā)明實(shí)施例提供的一種網(wǎng)絡(luò)監(jiān)控處理方法的流程示意圖,所述方法可以包括:
[0028]S201,獲取接入節(jié)點(diǎn)與服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息;
[0029]具體的,網(wǎng)絡(luò)監(jiān)控處理裝置可以獲取接入節(jié)點(diǎn)與服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息,所述消息發(fā)送狀態(tài)信息可以包括消息延時率和消息失敗率。其中,消息延時率可以是某段時間內(nèi)所述接入節(jié)點(diǎn)發(fā)送到所述服務(wù)節(jié)點(diǎn)的所有請求消息中,屬于延時狀態(tài)的請求消息所占的比例;所述消息失敗率可以是時間內(nèi)所述接入節(jié)點(diǎn)發(fā)送到所述服務(wù)節(jié)點(diǎn)的所有請求消息中,屬于失敗狀態(tài)的請求消息所占的比例。其中,所述接入節(jié)點(diǎn)在發(fā)送請求消息到所述服務(wù)節(jié)點(diǎn)后,所述服務(wù)節(jié)點(diǎn)可以對所述請求消息進(jìn)行響應(yīng)并返回確認(rèn)消息。因此,當(dāng)所述接入節(jié)點(diǎn)從發(fā)送某請求消息到接收到對應(yīng)的確認(rèn)消息的時長超過預(yù)設(shè)的第一時長閾值時,可以將該請求消息確定為屬于延時狀態(tài)的請求消息;當(dāng)所述接入節(jié)點(diǎn)無法接收到某請求消息對應(yīng)的確認(rèn)消息時,可以將該請求消息確定為屬于失敗狀態(tài)的請求消息。例如,所述接入節(jié)點(diǎn)在1分鐘內(nèi)向服務(wù)節(jié)點(diǎn)發(fā)送了 100個請求消息,其中,屬于延時狀態(tài)的請求消息為20個,屬于失敗狀態(tài)的請求消息為10個,那么,可以計(jì)算出消息延時率為20%,消息失敗率為10%。
[0030]S202,根據(jù)所述消息發(fā)送狀態(tài)信息中的消息延時率或消息失敗率,確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài);
[0031]具體的,所述網(wǎng)絡(luò)監(jiān)控處理裝置可以判斷所述消息發(fā)送狀態(tài)信息中的消息延時率或消息失敗率是否大于預(yù)設(shè)的比例閾值,若判斷為是,說明有過多的請求消息出現(xiàn)延時或過多的請求消息出現(xiàn)響應(yīng)失敗,則可以確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài)為異常狀態(tài),否則,可以確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)。其中,用于判斷所述消息延時率是否過大的比例閾值,與用于判斷所述消息失敗率是否過大的比例閾值可以相同,也可以不同。
[0032]S203,當(dāng)所述網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)時,將所述服務(wù)節(jié)點(diǎn)添加到正常服務(wù)節(jié)點(diǎn)集合;
[0033]S204,當(dāng)所述網(wǎng)