態(tài)為異常狀態(tài)時(shí),將所述服務(wù)節(jié)點(diǎn)添加到暫停服務(wù)節(jié)點(diǎn)集合,以便于所述接入節(jié)點(diǎn)僅對(duì)所述正常服務(wù)節(jié)點(diǎn)集合中的所有服務(wù)節(jié)點(diǎn)進(jìn)行通信。由于所述接入節(jié)點(diǎn)只將請(qǐng)求消息轉(zhuǎn)發(fā)給所述正常服務(wù)節(jié)點(diǎn)集合中的服務(wù)節(jié)點(diǎn),所以可以有效降低問題服務(wù)節(jié)點(diǎn)對(duì)客戶端的請(qǐng)求所造成的影響,而且基于所述正常服務(wù)節(jié)點(diǎn)集合和所述暫停服務(wù)節(jié)點(diǎn)集合對(duì)服務(wù)節(jié)點(diǎn)的劃分,可以自動(dòng)對(duì)問題服務(wù)節(jié)點(diǎn)進(jìn)行隔離或停止,從而可降低對(duì)服務(wù)節(jié)點(diǎn)的人工維護(hù)成本。
[0080]再請(qǐng)參見圖8,是本發(fā)明實(shí)施例提供的另一種網(wǎng)絡(luò)監(jiān)控處理裝置的結(jié)構(gòu)示意圖,所述網(wǎng)絡(luò)監(jiān)控處理裝置1可以包括上述圖4對(duì)應(yīng)實(shí)施例中的獲取模塊10、確定模塊20、添加模塊30,進(jìn)一步的,所述網(wǎng)絡(luò)監(jiān)控處理裝置1還可以包括:第一轉(zhuǎn)移模塊40、第二轉(zhuǎn)移模塊50;
[0081]所述第一轉(zhuǎn)移模塊40,用于當(dāng)檢測(cè)到所述服務(wù)節(jié)點(diǎn)處于所述暫停服務(wù)節(jié)點(diǎn)集合中的時(shí)長(zhǎng)達(dá)到所述第二時(shí)長(zhǎng)閾值時(shí),將所述服務(wù)節(jié)點(diǎn)從所述暫停服務(wù)節(jié)點(diǎn)集合中轉(zhuǎn)移至所述正常服務(wù)節(jié)點(diǎn)集合;
[0082]具體的,當(dāng)將所述服務(wù)節(jié)點(diǎn)添加到所述暫停服務(wù)節(jié)點(diǎn)集合后,所述第一轉(zhuǎn)移模塊40即可開始計(jì)時(shí),并在檢測(cè)到所述服務(wù)節(jié)點(diǎn)處于所述暫停服務(wù)節(jié)點(diǎn)集合中的時(shí)長(zhǎng)達(dá)到所述第二時(shí)長(zhǎng)閾值時(shí),將所述服務(wù)節(jié)點(diǎn)從所述暫停服務(wù)節(jié)點(diǎn)集合中轉(zhuǎn)移至所述正常服務(wù)節(jié)點(diǎn)集合,使得被隔離或停止的服務(wù)節(jié)點(diǎn)可以被自動(dòng)恢復(fù),進(jìn)一步降低了人工維護(hù)成本。進(jìn)一步的,當(dāng)所述服務(wù)節(jié)點(diǎn)重新轉(zhuǎn)移到所述正常服務(wù)節(jié)點(diǎn)集合后,所述網(wǎng)絡(luò)監(jiān)控處理裝置1將會(huì)重新檢測(cè)所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài),若檢測(cè)到所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài)依然為異常狀態(tài),則所述服務(wù)節(jié)點(diǎn)將會(huì)再次被轉(zhuǎn)移至所述暫停服務(wù)節(jié)點(diǎn)集合,此時(shí),所述第二時(shí)長(zhǎng)閾值將會(huì)變?yōu)樵鹊?倍,即所述服務(wù)節(jié)點(diǎn)需要在所述暫停服務(wù)節(jié)點(diǎn)集合中停留更久的時(shí)間后才會(huì)被轉(zhuǎn)移到所述正常服務(wù)節(jié)點(diǎn)集合中。例如,若所述服務(wù)節(jié)點(diǎn)第一次進(jìn)入所述暫停服務(wù)節(jié)點(diǎn)集合時(shí)的所述第二時(shí)長(zhǎng)閾值為t,那么所述服務(wù)節(jié)點(diǎn)第二次進(jìn)入所述暫停服務(wù)節(jié)點(diǎn)集合時(shí)的所述第二時(shí)長(zhǎng)閾值將變?yōu)?*t,以此類推,所述服務(wù)節(jié)點(diǎn)第η次進(jìn)入所述暫停服務(wù)節(jié)點(diǎn)集合時(shí)的所述第二時(shí)長(zhǎng)閾值將變?yōu)閚*t。
[0083]所述第二轉(zhuǎn)移模塊50,用于當(dāng)檢測(cè)到所述暫停服務(wù)節(jié)點(diǎn)集合中的服務(wù)節(jié)點(diǎn)數(shù)量大于所述正常服務(wù)節(jié)點(diǎn)集合中的服務(wù)節(jié)點(diǎn)數(shù)量時(shí),將所述暫停服務(wù)節(jié)點(diǎn)集合中的所有服務(wù)節(jié)點(diǎn)都轉(zhuǎn)移至所述正常服務(wù)節(jié)點(diǎn)集合中,并生成與所述接入節(jié)點(diǎn)相關(guān)聯(lián)的告警通知信息;
[0084]具體的,當(dāng)檢測(cè)到所述暫停服務(wù)節(jié)點(diǎn)集合中的服務(wù)節(jié)點(diǎn)數(shù)量大于所述正常服務(wù)節(jié)點(diǎn)集合中的服務(wù)節(jié)點(diǎn)數(shù)量時(shí),說明所述接入節(jié)點(diǎn)到各個(gè)服務(wù)節(jié)點(diǎn)的鏈路都有問題,即通常是其本身網(wǎng)絡(luò)出現(xiàn)問題,需要對(duì)接入節(jié)點(diǎn)進(jìn)行處理。
[0085]本發(fā)明實(shí)施例通過獲取接入節(jié)點(diǎn)與服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息,并根據(jù)所述消息發(fā)送狀態(tài)信息中的消息延時(shí)率或消息失敗率,確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài),可以在所述網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)時(shí),將所述服務(wù)節(jié)點(diǎn)添加到正常服務(wù)節(jié)點(diǎn)集合;或在所述網(wǎng)絡(luò)狀態(tài)為異常狀態(tài)時(shí),將所述服務(wù)節(jié)點(diǎn)添加到暫停服務(wù)節(jié)點(diǎn)集合,以便于所述接入節(jié)點(diǎn)僅對(duì)所述正常服務(wù)節(jié)點(diǎn)集合中的所有服務(wù)節(jié)點(diǎn)進(jìn)行通信。由于所述接入節(jié)點(diǎn)只將請(qǐng)求消息轉(zhuǎn)發(fā)給所述正常服務(wù)節(jié)點(diǎn)集合中的服務(wù)節(jié)點(diǎn),所以可以有效降低問題服務(wù)節(jié)點(diǎn)對(duì)客戶端的請(qǐng)求所造成的影響,而且基于所述正常服務(wù)節(jié)點(diǎn)集合和所述暫停服務(wù)節(jié)點(diǎn)集合對(duì)服務(wù)節(jié)點(diǎn)的劃分,可以自動(dòng)對(duì)問題服務(wù)節(jié)點(diǎn)進(jìn)行隔離或停止,而且在檢測(cè)到所述服務(wù)節(jié)點(diǎn)處于所述暫停服務(wù)節(jié)點(diǎn)集合中的時(shí)長(zhǎng)達(dá)到所述第二時(shí)長(zhǎng)閾值時(shí),可以將所述服務(wù)節(jié)點(diǎn)從所述暫停服務(wù)節(jié)點(diǎn)集合中轉(zhuǎn)移至所述正常服務(wù)節(jié)點(diǎn)集合,使得被隔離或停止的服務(wù)節(jié)點(diǎn)可以被自動(dòng)恢復(fù),從而可降低對(duì)服務(wù)節(jié)點(diǎn)的人工維護(hù)成本。
[0086]基于圖1所示的網(wǎng)絡(luò)構(gòu)架,本發(fā)明實(shí)施例公開了的又一種網(wǎng)絡(luò)監(jiān)控處理裝置。請(qǐng)參見圖9,是本發(fā)明實(shí)施例提供的又一種網(wǎng)絡(luò)監(jiān)控處理裝置的結(jié)構(gòu)示意圖。所述網(wǎng)絡(luò)監(jiān)控處理裝置1000可以包括處理器1001、通信接口 1002和存儲(chǔ)器1003(所述網(wǎng)絡(luò)監(jiān)控處理裝置1000中的處理器1001的數(shù)量可以為一個(gè)或多個(gè),圖9中以一個(gè)處理器為例)。本發(fā)明的一些實(shí)施例中,處理器1001、通信接口 1002和存儲(chǔ)器1003可通過通信總線或其他方式連接,其中,圖9以通過通信總線連接為例。
[0087]其中,所述通信接口1002,用于與接入節(jié)點(diǎn)和服務(wù)節(jié)點(diǎn)進(jìn)行通信;
[0088]所述存儲(chǔ)器1003用于存儲(chǔ)程序;
[0089]所述處理器1001用于執(zhí)行所述程序,以實(shí)現(xiàn)
[0090]獲取接入節(jié)點(diǎn)與服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息;
[0091 ]根據(jù)所述消息發(fā)送狀態(tài)信息中的消息延時(shí)率或消息失敗率,確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài);
[0092]當(dāng)所述網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)時(shí),將所述服務(wù)節(jié)點(diǎn)添加到正常服務(wù)節(jié)點(diǎn)集合;
[0093]當(dāng)所述網(wǎng)絡(luò)狀態(tài)為異常狀態(tài)時(shí),將所述服務(wù)節(jié)點(diǎn)添加到暫停服務(wù)節(jié)點(diǎn)集合,以便于所述接入節(jié)點(diǎn)僅對(duì)所述正常服務(wù)節(jié)點(diǎn)集合中的所有服務(wù)節(jié)點(diǎn)進(jìn)行通信。
[0094]在一個(gè)實(shí)施例中,所述處理器1001在執(zhí)行獲取接入節(jié)點(diǎn)與服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息時(shí),具體用于:
[0095]在預(yù)設(shè)時(shí)間周期內(nèi),獲取所述接入節(jié)點(diǎn)與所述服務(wù)節(jié)點(diǎn)之間的至少一個(gè)時(shí)間戳信息,每個(gè)時(shí)間戳信息均包括發(fā)送時(shí)間戳和接收時(shí)間戳;所述每個(gè)時(shí)間戳信息中的所述發(fā)送時(shí)間戳為所述接入節(jié)點(diǎn)發(fā)送請(qǐng)求消息到所述服務(wù)節(jié)點(diǎn)時(shí)的時(shí)間戳,所述接收時(shí)間戳為所述接入節(jié)點(diǎn)接收到所述服務(wù)節(jié)點(diǎn)對(duì)所述請(qǐng)求消息進(jìn)行響應(yīng)的確認(rèn)消息時(shí)的時(shí)間戳;
[0096]分別計(jì)算所述每個(gè)時(shí)間戳信息中的所述發(fā)送時(shí)間戳和所述接收時(shí)間戳之間的時(shí)間差,并根據(jù)所述每個(gè)時(shí)間戳信息對(duì)應(yīng)的時(shí)間差以及預(yù)設(shè)的第一時(shí)長(zhǎng)閾值,生成所述接入節(jié)點(diǎn)與所述服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息。
[0097]在一個(gè)實(shí)施例中,所述處理器1001在執(zhí)行分別計(jì)算所述每個(gè)時(shí)間戳信息中的所述發(fā)送時(shí)間戳和所述接收時(shí)間戳之間的時(shí)間差,并根據(jù)所述每個(gè)時(shí)間戳信息對(duì)應(yīng)的時(shí)間差以及預(yù)設(shè)的第一時(shí)長(zhǎng)閾值,生成所述接入節(jié)點(diǎn)與所述服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息時(shí),具體用于:
[0098]分別計(jì)算所述每個(gè)時(shí)間戳信息中的所述發(fā)送時(shí)間戳和所述接收時(shí)間戳之間的時(shí)間差;
[0099]將所述時(shí)間差大于所述第一時(shí)長(zhǎng)閾值的時(shí)間戳信息確定為延時(shí)信息,并將所述時(shí)間差為異常值的時(shí)間戳信息確定為失敗信息;為異常值的時(shí)間差所對(duì)應(yīng)的所述接收時(shí)間戳為空值;
[0100]統(tǒng)計(jì)所述延時(shí)信息的數(shù)量和所述失敗信息的數(shù)量,并根據(jù)所述延時(shí)信息的數(shù)量與所述時(shí)間戳信息的總數(shù)量計(jì)算消息延時(shí)率,并根據(jù)所述失敗信息的數(shù)量與所述時(shí)間戳信息的總數(shù)量計(jì)算消息失敗率;
[0101]生成包含所述消息延時(shí)率和所述消息失敗率的消息發(fā)送狀態(tài)信息。
[0102]在一個(gè)實(shí)施例中,所述處理器1001在執(zhí)行根據(jù)所述消息發(fā)送狀態(tài)信息中的消息延時(shí)率或消息失敗率,確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài)時(shí),具體用于:
[0103]判斷所述消息發(fā)送狀態(tài)信息中的消息延時(shí)率或消息失敗率是否大于預(yù)設(shè)的比例閾值;
[0104]若判斷為是,則確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài)為異常狀態(tài);
[0105]若判斷為否,則確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)。
[0106]在一個(gè)實(shí)施例中,所述處理器1001在執(zhí)行當(dāng)所述網(wǎng)絡(luò)狀態(tài)為異常狀態(tài)時(shí),將所述服務(wù)節(jié)點(diǎn)添加到暫停服務(wù)節(jié)點(diǎn)集合之后,還用于:
[0107]當(dāng)檢測(cè)到所述服務(wù)節(jié)點(diǎn)處于所述暫停服務(wù)節(jié)點(diǎn)集合中的時(shí)長(zhǎng)達(dá)到所述第二時(shí)長(zhǎng)閾值時(shí),將所述服務(wù)節(jié)點(diǎn)從所述暫停服務(wù)節(jié)點(diǎn)集合中轉(zhuǎn)移至所述正常服務(wù)節(jié)點(diǎn)集合。
[0108]在一個(gè)實(shí)施例中,所述處理器1001還用于:
[0109]當(dāng)檢測(cè)到所述暫停服務(wù)節(jié)點(diǎn)集合中的服務(wù)節(jié)點(diǎn)數(shù)量大于所述正常服務(wù)節(jié)點(diǎn)集合中的服務(wù)節(jié)點(diǎn)數(shù)量時(shí),將所述暫停服務(wù)節(jié)點(diǎn)集合中的所有服務(wù)節(jié)點(diǎn)都轉(zhuǎn)移至所述正常服務(wù)節(jié)點(diǎn)集合中,并生成與所述接入節(jié)點(diǎn)相關(guān)聯(lián)的告警通知信息。
[0110]本發(fā)明實(shí)施例通過獲取接入節(jié)點(diǎn)與服務(wù)節(jié)點(diǎn)之間的消息發(fā)送狀態(tài)信息,并根據(jù)所述消息發(fā)送狀態(tài)信息中的消息延時(shí)率或消息失敗率,確定所述服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)狀態(tài),可以在所述網(wǎng)絡(luò)狀態(tài)為正常狀態(tài)時(shí),將所述服務(wù)節(jié)點(diǎn)添加到正常服務(wù)節(jié)點(diǎn)集合;或在