識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的方法、設(shè)備和系統(tǒng)的制作方法
【專利摘要】本發(fā)明的實(shí)施方式涉及用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的方法、設(shè)備和系統(tǒng)。具體地,提供一種用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的方法。該方法包括:收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù);基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布;根據(jù)所計(jì)算的分布建立識(shí)別模式;以及使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。利用本發(fā)明的實(shí)施方式,可以更為有效地識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
【專利說(shuō)明】識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的方法、設(shè)備和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的實(shí)施方式總體上涉及網(wǎng)絡(luò)信息【技術(shù)領(lǐng)域】,更具體地,涉及以動(dòng)態(tài)模式方式識(shí)別系統(tǒng)中的熱點(diǎn)和可能故障的方法、設(shè)備和系統(tǒng)。
【背景技術(shù)】
[0002]在信息【技術(shù)領(lǐng)域】,特別是隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,越來(lái)越多的計(jì)算設(shè)備以服務(wù)器的形式出現(xiàn),這些服務(wù)器通過(guò)其上運(yùn)行的應(yīng)用來(lái)為其他設(shè)備(稱為客戶端設(shè)備)提供相應(yīng)的服務(wù)和/或數(shù)據(jù)。作為示例,常見(jiàn)的服務(wù)器包括但不限于:游戲服務(wù)器、電子郵件(email)服務(wù)器、消息收發(fā)服務(wù)器、文件服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器,等等。應(yīng)當(dāng)理解,在此使用的術(shù)語(yǔ)“服務(wù)器”意在表示能夠通過(guò)網(wǎng)絡(luò)向其他設(shè)備提供數(shù)據(jù)、信息、服務(wù)等的任何適當(dāng)?shù)挠?jì)算設(shè)備,包括但不限于:主機(jī)計(jì)算機(jī)、個(gè)人計(jì)算機(jī)、膝上型計(jì)算機(jī)、移動(dòng)計(jì)算設(shè)備、個(gè)人數(shù)字助理(PDA),等等。而且,還應(yīng)理解,在此提及的“服務(wù)器”和“客戶端”是相對(duì)的。特定的計(jì)算設(shè)備可能在某些情況下充當(dāng)服務(wù)器,而在另一些情況下充當(dāng)客戶端。而且,計(jì)算設(shè)備同時(shí)充當(dāng)服務(wù)器和客戶端也是可能的。
[0003]在實(shí)際應(yīng)用中,為了改善單個(gè)服務(wù)器的性能,通常將集群技術(shù)用于服務(wù)器中。因此,在某些情況下,往往將多個(gè)服務(wù)器組織起來(lái)進(jìn)行協(xié)同工作,以模擬功能更強(qiáng)大解決問(wèn)題的單個(gè)服務(wù)器。這種技術(shù)成為集群技術(shù)。將該集群(即計(jì)算機(jī)系統(tǒng))中的每個(gè)計(jì)算機(jī)稱為節(jié)點(diǎn)。這樣,多個(gè)服務(wù)器以群集的方式組合成服務(wù)器集群(即服務(wù)器系統(tǒng)),并且相互協(xié)作以完成具體服務(wù)器的功能。例如,5個(gè)服務(wù)器以集群方式組合成服務(wù)器系統(tǒng),以實(shí)現(xiàn)游戲服務(wù)器的功能。在實(shí)際應(yīng)用中,可能存在如下情況,即服務(wù)器系統(tǒng)中的僅某一節(jié)點(diǎn)很繁忙,而其他節(jié)點(diǎn)不繁忙。則這一繁忙的節(jié)點(diǎn)可能為系統(tǒng)中的熱點(diǎn)或者可能出現(xiàn)了故障。因此,識(shí)別該服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障對(duì)于維持正常的網(wǎng)絡(luò)服務(wù)和通信而言至關(guān)重要。
[0004]在現(xiàn)有技術(shù)中,監(jiān)控設(shè)備使用固定的規(guī)則來(lái)識(shí)別系統(tǒng)中的熱點(diǎn)和可能故障。例如,通過(guò)設(shè)置服務(wù)閾值,并且監(jiān)控系統(tǒng)中的每個(gè)節(jié)點(diǎn)的負(fù)載(諸如CPU利用率、硬盤(pán)占用率、響應(yīng)時(shí)間(即探測(cè)請(qǐng)求)等)是否超過(guò)該服務(wù)閾值,以判斷在該節(jié)點(diǎn)的服務(wù)是否緊張、繁忙、是否需要擴(kuò)展,即該節(jié)點(diǎn)是否為系統(tǒng)中的熱點(diǎn)和可能故障。如果某一節(jié)點(diǎn)的負(fù)載超過(guò)閾值,則發(fā)出警示。例如,如果持續(xù)一段時(shí)間某一節(jié)點(diǎn)的CPU利用率超過(guò)90 %、硬盤(pán)占用率超過(guò)80%或者響應(yīng)時(shí)間超過(guò)300ms,則可以確定該節(jié)點(diǎn)的服務(wù)較繁忙,其可能為系統(tǒng)中的熱點(diǎn)或者可能故障。然后可以通過(guò)增加節(jié)點(diǎn)(即服務(wù)器)來(lái)擴(kuò)展該系統(tǒng),或者在節(jié)點(diǎn)之間重新分配負(fù)載以使負(fù)載平衡來(lái)緩解服務(wù)繁忙狀況,確保服務(wù)器系統(tǒng)的正常運(yùn)行。
[0005]然而,現(xiàn)有技術(shù)的此類(lèi)方案存在明顯的缺陷。通過(guò)此類(lèi)方案,只能確定節(jié)點(diǎn)的當(dāng)前負(fù)載高于固定的閾值。但是,節(jié)點(diǎn)的當(dāng)前負(fù)載超過(guò)閾值并不一定表明該節(jié)點(diǎn)為系統(tǒng)中的熱點(diǎn),也不能表明該服務(wù)器發(fā)生了故障。例如,節(jié)點(diǎn)的負(fù)載狀況可能跟時(shí)間有關(guān),例如在白天(例如,下午6-7點(diǎn)),系統(tǒng)中的節(jié)點(diǎn)由于大量的業(yè)務(wù)量都處于很繁忙的狀態(tài)。因此,某一節(jié)點(diǎn)的負(fù)載超過(guò)閾值并不表明該節(jié)點(diǎn)為系統(tǒng)中的熱點(diǎn)或者該節(jié)點(diǎn)處于故障狀態(tài)。此外,在晚上,負(fù)載本該很低,但是某節(jié)點(diǎn)的負(fù)載明顯高于其他節(jié)點(diǎn)的負(fù)載(但是可能還未超過(guò)所設(shè)置的閾值),則該節(jié)點(diǎn)可能已經(jīng)出現(xiàn)故障。如果這種情況得不到及時(shí)有效地處理,則可能在某一時(shí)間,由于總體業(yè)務(wù)量較大,系統(tǒng)中的服務(wù)很繁忙,系統(tǒng)將在節(jié)點(diǎn)未出現(xiàn)故障的情況下不斷發(fā)出警示。因此,服務(wù)器系統(tǒng)維護(hù)人員將需要查看服務(wù)器系統(tǒng)的運(yùn)行日志來(lái)評(píng)估可能的熱點(diǎn)或者故障,并采取相應(yīng)的措施。這不利于快速、及時(shí)地識(shí)別系統(tǒng)中的熱點(diǎn)和可能故障,并且將耗費(fèi)可觀的人力和物力成本。而在系統(tǒng)處于不繁忙狀態(tài)時(shí),某一節(jié)點(diǎn)的負(fù)載明顯高于其他節(jié)點(diǎn)的負(fù)載(但是可能還未超過(guò)閾值),則也不能有效地將該節(jié)點(diǎn)識(shí)別為可能的熱點(diǎn)和故障。此外,在某些情況下,系統(tǒng)中的服務(wù)器數(shù)目固定。因此,在多個(gè)服務(wù)器都繁忙的情況下,不可能通過(guò)增加節(jié)點(diǎn)數(shù)目而擴(kuò)展服務(wù)器系統(tǒng)或者通過(guò)在節(jié)點(diǎn)之間重新分配負(fù)載來(lái)使負(fù)載均衡。因此,在這種情況下的警示是不必要的。
[0006]由此,本領(lǐng)域中需要一種動(dòng)態(tài)的、更為有效、快速和準(zhǔn)確的方式來(lái)識(shí)別系統(tǒng)中的熱點(diǎn)和可能故障的方法和設(shè)備。
【發(fā)明內(nèi)容】
[0007]為了克服現(xiàn)有技術(shù)中的上述缺陷,本發(fā)明的實(shí)施方式提供用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的方法、設(shè)備和系統(tǒng)。
[0008]在本發(fā)明的一個(gè)方面,提供一種用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的方法。該方法包括:收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù);基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布;根據(jù)所計(jì)算的分布建立識(shí)別模式;以及使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
[0009]根據(jù)本發(fā)明的某些實(shí)施方式,該方法還包括針對(duì)不符合模式的節(jié)點(diǎn)發(fā)出警示。根據(jù)本發(fā)明的某些實(shí)施方式,其中通過(guò)分布式信息收集系統(tǒng)收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù)。根據(jù)本發(fā)明的某些實(shí)施方式,其中基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的分布包括計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的平均值。根據(jù)本發(fā)明的某些實(shí)施方式,其中基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的分布包括計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的方差。根據(jù)本發(fā)明的某些實(shí)施方式,其中根據(jù)所計(jì)算的分布建立識(shí)別模式包括建立每個(gè)節(jié)點(diǎn)的運(yùn)行負(fù)載關(guān)于時(shí)間的模式。根據(jù)本發(fā)明的某些實(shí)施方式,其中根據(jù)所計(jì)算的分布建立識(shí)別模式包括建立所述服務(wù)器系統(tǒng)中的所有節(jié)點(diǎn)的平均運(yùn)行負(fù)載關(guān)于時(shí)間的模式。根據(jù)本發(fā)明的某些實(shí)施方式,其中使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障包括將當(dāng)前負(fù)載值超過(guò)所述模式的對(duì)應(yīng)點(diǎn)處的值一定百分比的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。在該實(shí)施方式中,該一定百分比為20%或者30%。根據(jù)本發(fā)明的某些實(shí)施方式,其中使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障包括將當(dāng)前負(fù)載曲線在當(dāng)前點(diǎn)處的導(dǎo)數(shù)超過(guò)所述模式的對(duì)應(yīng)點(diǎn)處的導(dǎo)數(shù)一定百分比的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。在該實(shí)施方式中,該一定百分比為20%或者30%。根據(jù)本發(fā)明的某些實(shí)施方式,其中服務(wù)器系統(tǒng)包括以下的一個(gè)或多個(gè):游戲服務(wù)器、電子郵件服務(wù)器、消息收發(fā)服務(wù)器、文件服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器。
[0010]在本發(fā)明的另一方面,提供一種用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的設(shè)備,所述設(shè)備包括:收集裝置,配置用于收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù);分布計(jì)算裝置,配置用于基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布;模式建立裝置,配置用于根據(jù)所計(jì)算的分布建立識(shí)別模式;以及識(shí)別裝置,配置用于使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
[0011]在本發(fā)明的又一方面,提供一種系統(tǒng)。該系統(tǒng),包括:服務(wù)器系統(tǒng),其包括多個(gè)節(jié)點(diǎn);存儲(chǔ)庫(kù),其耦合至所述服務(wù)器系統(tǒng),配置為用于存儲(chǔ)從所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)收集的運(yùn)行負(fù)載數(shù)據(jù);以及監(jiān)控設(shè)備,其耦合至所述存儲(chǔ)庫(kù),配置為用于識(shí)別所述識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障,其中所述監(jiān)控設(shè)備包括如上文所述的設(shè)備。
[0012]通過(guò)上述實(shí)施方式,可以以動(dòng)態(tài)的、更為有效、快速和準(zhǔn)確的方式來(lái)識(shí)別系統(tǒng)中的熱點(diǎn)和可能故障。
【專利附圖】
【附圖說(shuō)明】
[0013]通過(guò)參考附圖閱讀下文的詳細(xì)描述,本發(fā)明實(shí)施方式的上述以及其他目的、特征和優(yōu)點(diǎn)將變得易于理解。在附圖中,以示例性而非限制性的方式示出了本發(fā)明的若干實(shí)施方式,其中:
[0014]圖1示出了根據(jù)本發(fā)明的實(shí)施方式可在其中實(shí)現(xiàn)的網(wǎng)絡(luò)環(huán)境100的示意圖;
[0015]圖2示出了根據(jù)本發(fā)明的實(shí)施方式用于識(shí)別系統(tǒng)中的熱點(diǎn)和可能故障的方法200的流程圖;
[0016]圖3示出了根據(jù)本發(fā)明的實(shí)施方式用于識(shí)別系統(tǒng)中的熱點(diǎn)和可能故障的設(shè)備301的框圖;以及
[0017]圖4示出了適合用來(lái)實(shí)踐本發(fā)明實(shí)施方式的計(jì)算機(jī)系統(tǒng)400的框圖。
[0018]在附圖中,相同或?qū)?yīng)的標(biāo)號(hào)表不相同或?qū)?yīng)的部分。
【具體實(shí)施方式】
[0019]下面將參考若干示例性實(shí)施方式來(lái)描述本發(fā)明的原理和精神。應(yīng)當(dāng)理解,給出這些實(shí)施方式僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實(shí)現(xiàn)本發(fā)明,而并非以任何方式限制本發(fā)明的范圍。
[0020]總體上,本發(fā)明的實(shí)施方式涉及用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的方法、設(shè)備和系統(tǒng)。通過(guò)下文詳細(xì)描述將會(huì)理解,可以通過(guò)收集服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù);基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布;根據(jù)所計(jì)算的分布建立識(shí)別模式;以及使用所建立的識(shí)別模式來(lái)將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。以此方式,可以改進(jìn)識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的機(jī)制。下面將詳細(xì)描述本發(fā)明的各種實(shí)施方式。
[0021]首先參考圖1,其示出了根據(jù)本發(fā)明的實(shí)施方式可在其中實(shí)現(xiàn)的網(wǎng)絡(luò)環(huán)境100的示意圖。如圖所示,根據(jù)本發(fā)明的實(shí)施方式,網(wǎng)絡(luò)環(huán)境100可以包括:監(jiān)控設(shè)備101,服務(wù)器系統(tǒng)102,以及存儲(chǔ)庫(kù)103。
[0022]根據(jù)本發(fā)明的實(shí)施方式,監(jiān)控設(shè)備101可配置為用于識(shí)別服務(wù)器系統(tǒng)102中的熱點(diǎn)和可能故障,其可以與服務(wù)器系統(tǒng)102和/或存儲(chǔ)庫(kù)103通信。關(guān)于監(jiān)控設(shè)備101的詳細(xì)描述將在下文給出。
[0023]服務(wù)器系統(tǒng)102是通過(guò)網(wǎng)絡(luò)向被稱作客戶端的其他設(shè)備(圖1中未示出)提供服務(wù)的多個(gè)服務(wù)器(102-1、102-2到102-N)的集群。服務(wù)器系統(tǒng)102可以包括目前已知或者將來(lái)開(kāi)發(fā)的任何類(lèi)型的網(wǎng)絡(luò)服務(wù)器,包括但不限于:游戲服務(wù)器、電子郵件(email)服務(wù)器、消息收發(fā)服務(wù)器、文件服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器,等等。此外,服務(wù)器102-1、102-2到102-N可以通過(guò)任何適當(dāng)?shù)脑O(shè)備來(lái)實(shí)現(xiàn),包括但不限于:主機(jī)計(jì)算機(jī)、個(gè)人計(jì)算機(jī)、膝上型計(jì)算機(jī)、移動(dòng)計(jì)算設(shè)備、個(gè)人數(shù)字助理(PDA),等等。應(yīng)當(dāng)理解,上文列舉的示例僅僅出于說(shuō)明而非限制的目的,本發(fā)明的范圍在此方面不受限制。在本發(fā)明中,多個(gè)服務(wù)器(102-1、102-2到102-N)以群集的方式組合成服務(wù)器系統(tǒng)102,以共同為客戶端提供各種功能,諸如游戲、電子郵件、消息收發(fā)、文件、應(yīng)用、數(shù)據(jù)庫(kù),等等。
[0024]服務(wù)器系統(tǒng)102上可以運(yùn)行有至少一個(gè)應(yīng)用。取決于服務(wù)器系統(tǒng)102的所提供的功能和服務(wù),這些應(yīng)用可以是任何適當(dāng)類(lèi)型的應(yīng)用。當(dāng)這些應(yīng)用在服務(wù)器系統(tǒng)102上運(yùn)行時(shí),其實(shí)現(xiàn)服務(wù)器系統(tǒng)102所要提供的部分或者全部功能。
[0025]在服務(wù)器系統(tǒng)102的運(yùn)行期間,通過(guò)分布式系統(tǒng)(未示出)收集每個(gè)服務(wù)器即節(jié)點(diǎn)(102-1、102-2到102-N)處的運(yùn)行負(fù)載數(shù)據(jù)。在現(xiàn)有技術(shù)中,所收集的運(yùn)行負(fù)載數(shù)據(jù)被存儲(chǔ)在服務(wù)器系統(tǒng)102本地的系統(tǒng)運(yùn)行日志(未示出)中。
[0026]根據(jù)本發(fā)明的實(shí)施方式,除了將應(yīng)用產(chǎn)生的運(yùn)行負(fù)載數(shù)據(jù)存儲(chǔ)于系統(tǒng)運(yùn)行日志,或者作為替代,這些運(yùn)行負(fù)載數(shù)據(jù)還可以被保存于存儲(chǔ)庫(kù)103。存儲(chǔ)庫(kù)103可以是用于存儲(chǔ)信息的任何適當(dāng)介質(zhì),并且其可以通過(guò)任何適當(dāng)?shù)臄?shù)據(jù)結(jié)構(gòu)來(lái)保存信息,包括但不限于:列表、隊(duì)列、棧、堆、數(shù)據(jù)庫(kù)的表、文件,等等。根據(jù)本發(fā)明的實(shí)施方式103,存儲(chǔ)庫(kù)103可與監(jiān)控設(shè)備101和/或服務(wù)器系統(tǒng)102通信,并且是這二者可訪問(wèn)的。
[0027]應(yīng)當(dāng)注意,盡管在圖2中將監(jiān)控設(shè)備101、服務(wù)器系統(tǒng)102以及存儲(chǔ)庫(kù)103示為獨(dú)立的設(shè)備,但這僅僅是為了說(shuō)明目的而進(jìn)行的邏輯劃分。在實(shí)踐中,設(shè)備101-103可以根據(jù)需要具有不同的實(shí)現(xiàn)方式。例如,盡管在圖2中存儲(chǔ)庫(kù)103處于監(jiān)控設(shè)備101和服務(wù)器系統(tǒng)102 二者的外部,但是在備選實(shí)施方式中,存儲(chǔ)庫(kù)103可以包含在監(jiān)控設(shè)備101和服務(wù)器系統(tǒng)102之一中。實(shí)際上,在某些實(shí)施方式中,監(jiān)控設(shè)備101本身也可以與服務(wù)器系統(tǒng)102定位在同一物理計(jì)算設(shè)備上,這將在下文詳述。
[0028]在監(jiān)控設(shè)備101、服務(wù)器系統(tǒng)102和/或存儲(chǔ)庫(kù)103彼此獨(dú)立的實(shí)施方式中,它們之間的通信可以通過(guò)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)。網(wǎng)絡(luò)可以包括有線網(wǎng)絡(luò)、無(wú)線網(wǎng)絡(luò)或其組合,包括但不限于:蜂窩電話網(wǎng)絡(luò),以太網(wǎng),基于IEEE802.11,802.16,802.20等的無(wú)線局域網(wǎng)(WLAN),和/或全球微波接入互操作性(WiMAX)網(wǎng)絡(luò)。此外,網(wǎng)絡(luò)可以是公共網(wǎng)絡(luò)(諸如,因特網(wǎng))、專用網(wǎng)絡(luò)(諸如,企業(yè)內(nèi)部網(wǎng))或其組合。在分層式網(wǎng)絡(luò)通信架構(gòu)下,網(wǎng)絡(luò)的傳輸層可以按照傳輸控制協(xié)議(TCP)、實(shí)時(shí)傳輸協(xié)議(RTP)或其他傳輸邏輯進(jìn)行操作。網(wǎng)絡(luò)層可以基于網(wǎng)際協(xié)議v4、v6(即,IPv4或IPv6)或其他網(wǎng)絡(luò)層協(xié)議來(lái)路由信息。數(shù)據(jù)鏈路層可以包括有線或無(wú)線鏈路,如異步傳輸模式(ATM)、光纖分布式數(shù)據(jù)接口(FDDI)、光纖、同軸電纜、雙絞線或其他物理層上的其他數(shù)據(jù)鏈路層。
[0029]本領(lǐng)域技術(shù)人員將會(huì)理解,圖1中僅僅示出了網(wǎng)絡(luò)環(huán)境中與本發(fā)明的主題有關(guān)的設(shè)備和元件。網(wǎng)絡(luò)環(huán)境還可以包括諸如接入點(diǎn)、路由器、防火墻等各種網(wǎng)元。
[0030]下面將參考圖2詳細(xì)描述根據(jù)本發(fā)明實(shí)施方式的用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的方法200的流程圖。出于說(shuō)明目的,下文將主要結(jié)合圖1中示出的環(huán)境100來(lái)描述方法200的實(shí)施方式。特別地,根據(jù)本發(fā)明的實(shí)施方式,方法200例如可以由參考圖1描述的網(wǎng)絡(luò)環(huán)境100中的監(jiān)控設(shè)備101來(lái)實(shí)現(xiàn)。然而,應(yīng)當(dāng)理解,方法200也可以在其他環(huán)境中和/或由其他設(shè)備來(lái)實(shí)現(xiàn)。
[0031]方法200開(kāi)始之后,在步驟S202,動(dòng)態(tài)地收集服務(wù)器系統(tǒng)中的在每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù)。
[0032]根據(jù)本發(fā)明的實(shí)施方式,這些運(yùn)行負(fù)載數(shù)據(jù)除了被寫(xiě)入服務(wù)器系統(tǒng)102的本地系統(tǒng)運(yùn)行日志之外,還可以被保存在特定的存儲(chǔ)庫(kù)(例如,圖1中的存儲(chǔ)庫(kù)103)。根據(jù)本發(fā)明的實(shí)施方式,來(lái)自服務(wù)器系統(tǒng)102的運(yùn)行負(fù)載數(shù)據(jù)例如可以被保存在存儲(chǔ)庫(kù)103處的消息隊(duì)列(MQ)中。注意,這僅僅是示例性的,本發(fā)明的實(shí)施方式在此不受限制。
[0033]在運(yùn)行負(fù)載數(shù)據(jù)被保存在存儲(chǔ)庫(kù)103中的情況下,在步驟S202中,這些運(yùn)行負(fù)載數(shù)據(jù)例如可由負(fù)責(zé)識(shí)別服務(wù)器系統(tǒng)102中的熱點(diǎn)和可能故障的監(jiān)控設(shè)備(例如,圖1中的監(jiān)控設(shè)備101)從其收集。根據(jù)本發(fā)明的實(shí)施方式,監(jiān)控設(shè)備101可以通過(guò)各種模式從存儲(chǔ)庫(kù)103收集這些運(yùn)行負(fù)載數(shù)據(jù)。例如,從監(jiān)控設(shè)備101的角度考慮,運(yùn)行負(fù)載數(shù)據(jù)可以按照推送(push)模式被收集。在這種實(shí)施方式中,運(yùn)行負(fù)載數(shù)據(jù)由存儲(chǔ)庫(kù)103主動(dòng)向監(jiān)控設(shè)備101發(fā)送。又如,根據(jù)本發(fā)明的另一些實(shí)施方式,運(yùn)行負(fù)載數(shù)據(jù)可以按照拉取(pull)模式被收集。換言之,在這種實(shí)施方式中,監(jiān)控設(shè)備101主動(dòng)地訪問(wèn)存儲(chǔ)庫(kù)103以獲取其中保存的運(yùn)行負(fù)載數(shù)據(jù)。
[0034]應(yīng)當(dāng)注意,不論是按照推送還是拉取模式來(lái)收集運(yùn)行負(fù)載數(shù)據(jù),步驟S202中的收集可以被周期性地執(zhí)行。具體而言,在推送模式下,存儲(chǔ)庫(kù)103可以按照預(yù)定的時(shí)間間隔向監(jiān)控設(shè)備101發(fā)送運(yùn)行負(fù)載數(shù)據(jù)。類(lèi)似地,在拉取模式下,監(jiān)控設(shè)備101可以按照預(yù)定的時(shí)間間隔訪問(wèn)存儲(chǔ)庫(kù)103并且取回運(yùn)行負(fù)載數(shù)據(jù)??梢岳斫?,從監(jiān)控設(shè)備101的角度考慮,定期拉取存儲(chǔ)庫(kù)103中保存的運(yùn)行負(fù)載數(shù)據(jù)可被理解為一種輪詢。
[0035]如上文所述,為了收集運(yùn)行負(fù)載數(shù)據(jù),監(jiān)控設(shè)備101需要與存儲(chǔ)庫(kù)103進(jìn)行通信。然而應(yīng)當(dāng)注意,如上文所述,存儲(chǔ)庫(kù)103可以位于服務(wù)器系統(tǒng)102外部,也可以與服務(wù)器系統(tǒng)102處于同一物理機(jī)器上。在后一種情況下,監(jiān)控設(shè)備101可以通過(guò)直接與服務(wù)器系統(tǒng)102通信來(lái)收集運(yùn)行負(fù)載數(shù)據(jù)。甚至在某些情況下,監(jiān)控設(shè)備101本身也可以與服務(wù)器系統(tǒng)102位于相同的物理機(jī)器上。此時(shí),二者之間的通信例如可以是模塊間或進(jìn)程間通信。本發(fā)明的范圍在此方面不受限制。
[0036]此外,應(yīng)當(dāng)理解,上文描述的僅僅是收集運(yùn)行負(fù)載數(shù)據(jù)的幾個(gè)示例性實(shí)施方式?;谠诖私o出的教導(dǎo)和啟示,本領(lǐng)域的技術(shù)人員可以想到任何適當(dāng)?shù)募夹g(shù)手段來(lái)實(shí)現(xiàn)步驟S202處的收集。
[0037]接下來(lái),方法200進(jìn)行到步驟S204,在此基于收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布。根據(jù)本發(fā)明的實(shí)施方式,可以計(jì)算服務(wù)器系統(tǒng)102的運(yùn)行負(fù)載數(shù)據(jù)的平均值、最大值、中位數(shù)或者方差。例如,可以計(jì)算每個(gè)節(jié)點(diǎn)的運(yùn)行負(fù)載數(shù)據(jù)的平均值。例如,通過(guò)在步驟S202中收集的數(shù)據(jù),計(jì)算節(jié)點(diǎn)102在早上8點(diǎn)的運(yùn)行負(fù)載數(shù)據(jù)的平均值、最大值、中位數(shù)、方差等?;蛘呖梢愿鶕?jù)在步驟S202中收集的數(shù)據(jù),計(jì)算服務(wù)器系統(tǒng)102在某一時(shí)間(例如早上8點(diǎn))在所有節(jié)點(diǎn)的運(yùn)行負(fù)載數(shù)據(jù)的最大值、平均值、中位數(shù)以及方差等。注意,這僅僅示例性的,本領(lǐng)域技術(shù)人員可以根據(jù)具體情況為服務(wù)器系統(tǒng)102計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布的其他參數(shù)。
[0038]接著,根據(jù)本發(fā)明的某些實(shí)施方式,在步驟S206處,可以根據(jù)所計(jì)算的分布建立識(shí)別模式。例如,可以基于步驟S204中計(jì)算的分布來(lái)建立識(shí)別模式。例如,可以根據(jù)在步驟S204中的平均值,建立在近一個(gè)月以來(lái),服務(wù)器系統(tǒng)102在所有節(jié)點(diǎn)處運(yùn)行負(fù)載數(shù)據(jù)的平均值或者其每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù)的平均值相對(duì)于一天中的時(shí)間的模式,即負(fù)載曲線。注意,這僅僅示例性的,本領(lǐng)域技術(shù)人員可以根據(jù)具體情況,根據(jù)服務(wù)器系統(tǒng)102或者其每個(gè)節(jié)點(diǎn)建立其近某一時(shí)間維度(例如,一個(gè)月、兩個(gè)月、一個(gè)季度)以來(lái)的運(yùn)行負(fù)載數(shù)據(jù)的最大值、中位數(shù)、方差等來(lái)建立識(shí)別模式。
[0039]然后,在步驟208處,使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為服務(wù)器系統(tǒng)102中的熱點(diǎn)和可能故障。例如,如果服務(wù)器102-1的當(dāng)前負(fù)載值超過(guò)負(fù)載曲線的對(duì)應(yīng)點(diǎn)處的值20%,則將服務(wù)器102-1識(shí)別為服務(wù)器系統(tǒng)102中的熱點(diǎn)和可能故障?;蛘撸缛绻?wù)器102-3的負(fù)載曲線在當(dāng)前點(diǎn)處的導(dǎo)數(shù)超過(guò)所建立的負(fù)載曲線在對(duì)應(yīng)點(diǎn)處的導(dǎo)數(shù)20%或者30%,則將服務(wù)器102-3識(shí)別為服務(wù)器系統(tǒng)102中的熱點(diǎn)和可能故障。該負(fù)載曲線可能是(I)該節(jié)點(diǎn)關(guān)于時(shí)間的負(fù)載曲線,或者(2)該服務(wù)器系統(tǒng)102的所有節(jié)點(diǎn)關(guān)于時(shí)間的平均負(fù)載曲線。其中,在負(fù)載曲線是⑴的情況下,表明該服務(wù)器比它自身在過(guò)去的相同時(shí)間段忙很多,因此,該服務(wù)器可能為系統(tǒng)中的熱點(diǎn)或者已經(jīng)出現(xiàn)了故障。而在負(fù)載曲線是(2)的情況下,表明該服務(wù)器比系統(tǒng)中的其他服務(wù)器忙很多,因此,該服務(wù)器可能為系統(tǒng)中的熱點(diǎn)或者已經(jīng)出現(xiàn)了故障。應(yīng)當(dāng)理解,這些具體數(shù)字20%或者30%僅僅是示例性的,本發(fā)明的范圍在此方面不受限制。
[0040]備選地或附加地,在步驟S210處,還可以基于在步驟S208中識(shí)別的節(jié)點(diǎn),針對(duì)該節(jié)點(diǎn)發(fā)出警示。
[0041]現(xiàn)在參考圖3,其示出了根據(jù)本發(fā)明的實(shí)施方式用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的設(shè)備301的框圖。根據(jù)本發(fā)明的實(shí)施方式,設(shè)備301可以對(duì)應(yīng)于上文參考圖1描述的監(jiān)控設(shè)備101,或者作為部分被包括在監(jiān)控設(shè)備101中。
[0042]如圖3所示,設(shè)備301可以包括收集裝置302、分布計(jì)算裝置304、模式建立裝置306以及識(shí)別裝置308。收集裝置302可配置用于從該服務(wù)器系統(tǒng)收集運(yùn)行負(fù)載數(shù)據(jù)。分布計(jì)算裝置304可配置為用于基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布。
[0043]根據(jù)本發(fā)明的某些實(shí)施方式,運(yùn)行負(fù)載數(shù)據(jù)被所述服務(wù)器存儲(chǔ)在存儲(chǔ)庫(kù)中,并且收集裝置302可配置為用于從該存儲(chǔ)庫(kù)收集運(yùn)行負(fù)載數(shù)據(jù)。備選地或附加地,收集裝置302可配置為用于以推送或者拉取模式從該服務(wù)器收集該運(yùn)行負(fù)載數(shù)據(jù)。此外,收集裝置302可配置為用于定期收集該運(yùn)行負(fù)載數(shù)據(jù)。
[0044]根據(jù)本發(fā)明的某些實(shí)施方式,模式建立裝置306可配置用于根據(jù)所計(jì)算的分布建立識(shí)別模式。
[0045]在這種實(shí)施方式中,設(shè)備301還可以包括識(shí)別裝置308,其可配置用于使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
[0046]此外,設(shè)備300還可以包括警示裝置。例如,警示裝置310可配置為用于通過(guò)以下一個(gè)或多個(gè)來(lái)發(fā)送該警示消息:電子郵件,短消息服務(wù)SMS消息,以及多媒體消息MMS。
[0047]為清晰起見(jiàn),在圖3中并未示出各個(gè)裝置所包含的子裝置。然而,應(yīng)當(dāng)理解,設(shè)備301中記載的裝置302-308及其子裝置分別與參考圖2描述的方法200中的步驟相對(duì)應(yīng)。由此,上文針對(duì)圖2中的方法200描述的操作和特征同樣適用于設(shè)備301及其中包含的裝置和子裝置,在此不再贅述。
[0048]還應(yīng)當(dāng)理解,設(shè)備301可以利用各種方式來(lái)實(shí)現(xiàn)。例如,在某些實(shí)施方式中,設(shè)備301可以利用軟件和/或固件模塊來(lái)實(shí)現(xiàn)。此外,設(shè)備301也可以利用硬件模塊來(lái)實(shí)現(xiàn)。例如,設(shè)備301可以實(shí)現(xiàn)為集成電路(IC)芯片或?qū)S眉呻娐?ASIC)。設(shè)備301也可以實(shí)現(xiàn)為片上系統(tǒng)(SOC)?,F(xiàn)在已知或者將來(lái)開(kāi)發(fā)的其他方式也是可行的,本發(fā)明的范圍在此方面不受限制。
[0049]圖4示出了適于用來(lái)實(shí)踐本發(fā)明實(shí)施方式的計(jì)算機(jī)系統(tǒng)的示意性框圖。圖4示出了適于用來(lái)實(shí)踐本發(fā)明實(shí)施方式的計(jì)算機(jī)系統(tǒng)的示意性框圖。如圖4所示,計(jì)算機(jī)系統(tǒng)可以包括:CPU(中央處理單元)401、RAM(隨機(jī)存取存儲(chǔ)器)402、R0M(只讀存儲(chǔ)器)403、系統(tǒng)總線404、硬盤(pán)控制器405、鍵盤(pán)控制器406、串行接口控制器407、并行接口控制器408、顯示控制器409、硬盤(pán)410、鍵盤(pán)411、串行外部設(shè)備412、并行外部設(shè)備413和顯示器414。在這些設(shè)備中,與系統(tǒng)總線404耦合的有CPU401、RAM402、R0M403、硬盤(pán)控制器405、鍵盤(pán)控制器406、串行控制器407、并行控制器408和顯示控制器409。硬盤(pán)410與硬盤(pán)控制器405耦合,鍵盤(pán)411與鍵盤(pán)控制器406耦合,串行外部設(shè)備412與串行接口控制器407耦合,并行外部設(shè)備413與并行接口控制器408耦合,以及顯示器414與顯示控制器409耦合。應(yīng)當(dāng)理解,圖4所述的結(jié)構(gòu)框圖僅僅為了示例的目的而示出的,而不是對(duì)本發(fā)明范圍的限制。在某些情況下,可以根據(jù)具體情況而增加或者減少某些設(shè)備。
[0050]應(yīng)當(dāng)理解,圖4所述的結(jié)構(gòu)框圖僅僅為了示例的目的而示出的,而不是對(duì)本發(fā)明范圍的限制。在某些情況下,可以根據(jù)具體情況而增加或者減少某些設(shè)備。
[0051]特別地,除硬件實(shí)施方式之外,本發(fā)明的實(shí)施方式可以通過(guò)計(jì)算機(jī)程序產(chǎn)品的形式實(shí)現(xiàn)。例如,參考圖2描述的方法200可以通過(guò)計(jì)算機(jī)程序產(chǎn)品來(lái)實(shí)現(xiàn)。該計(jì)算機(jī)程序產(chǎn)品可以存儲(chǔ)在例如圖4所示的RAM404、R0M404、硬盤(pán)410和/或任何適當(dāng)?shù)拇鎯?chǔ)介質(zhì)中,或者通過(guò)網(wǎng)絡(luò)從適當(dāng)?shù)奈恢孟螺d到計(jì)算機(jī)系統(tǒng)400上。計(jì)算機(jī)程序產(chǎn)品可以包括計(jì)算機(jī)代碼部分,其包括可由適當(dāng)?shù)奶幚碓O(shè)備(例如,圖4中示出的CPU401)執(zhí)行的程序指令。該計(jì)算機(jī)程序產(chǎn)品可用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。根據(jù)本發(fā)明的實(shí)施方式,計(jì)算機(jī)程序產(chǎn)品中包含的程序指令至少可以包括:用于收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù)的指令;用于基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布的指令;用于根據(jù)所計(jì)算的分布建立識(shí)別模式的指令;以及用于使用所建立的識(shí)別模式來(lái)將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的指令。
[0052]上文已經(jīng)結(jié)合若干【具體實(shí)施方式】闡釋了本發(fā)明的精神和原理。通過(guò)下文詳細(xì)描述將會(huì)理解,可以通過(guò)收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù);基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布;根據(jù)所計(jì)算的分布建立識(shí)別模式;以及使用所建立的識(shí)別模式來(lái)將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。以此方式,可以改進(jìn)識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的機(jī)制。下面將詳細(xì)描述本發(fā)明的各種實(shí)施方式。
[0053]應(yīng)當(dāng)注意,本發(fā)明的實(shí)施方式可以通過(guò)硬件、軟件或者軟件和硬件的結(jié)合來(lái)實(shí)現(xiàn)。硬件部分可以利用專用邏輯來(lái)實(shí)現(xiàn);軟件部分可以存儲(chǔ)在存儲(chǔ)器中,由適當(dāng)?shù)闹噶顖?zhí)行系統(tǒng),例如微處理器或者專用設(shè)計(jì)硬件來(lái)執(zhí)行。本領(lǐng)域的普通技術(shù)人員可以理解上述的設(shè)備和方法可以使用計(jì)算機(jī)可執(zhí)行指令和/或包含在處理器控制代碼中來(lái)實(shí)現(xiàn),例如在諸如磁盤(pán)、CD或DVD-ROM的載體介質(zhì)、諸如只讀存儲(chǔ)器(固件)的可編程的存儲(chǔ)器或者諸如光學(xué)或電子信號(hào)載體的數(shù)據(jù)載體上提供了這樣的代碼。本發(fā)明的設(shè)備及其模塊可以由諸如超大規(guī)模集成電路或門(mén)陣列、諸如邏輯芯片、晶體管等的半導(dǎo)體、或者諸如現(xiàn)場(chǎng)可編程門(mén)陣列、可編程邏輯設(shè)備等的可編程硬件設(shè)備的硬件電路實(shí)現(xiàn),也可以用由各種類(lèi)型的處理器執(zhí)行的軟件實(shí)現(xiàn),也可以由上述硬件電路和軟件的結(jié)合例如固件來(lái)實(shí)現(xiàn)。
[0054]說(shuō)明書(shū)中提及的通信網(wǎng)絡(luò)可以包括各類(lèi)網(wǎng)絡(luò),包括但不限于局域網(wǎng)(“LAN”),廣域網(wǎng)(“WAN”),根據(jù)IP協(xié)議的網(wǎng)絡(luò)(例如,因特網(wǎng))以及端對(duì)端網(wǎng)絡(luò)(例如,ad hoc對(duì)等網(wǎng)絡(luò))。
[0055]應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了設(shè)備的若干裝置或子裝置,但是這種劃分僅僅并非強(qiáng)制性的。實(shí)際上,根據(jù)本發(fā)明的實(shí)施方式,上文描述的兩個(gè)或更多裝置的特征和功能可以在一個(gè)裝置中具體化。反之,上文描述的一個(gè)裝置的特征和功能可以進(jìn)一步劃分為由多個(gè)裝置來(lái)具體化。
[0056]此外,盡管在附圖中以特定順序描述了本發(fā)明方法的操作,但是,這并非要求或者暗示必須按照該特定順序來(lái)執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實(shí)現(xiàn)期望的結(jié)果。相反,流程圖中描繪的步驟可以改變執(zhí)行順頁(yè)序。附加地或備選地,可以省略某些步驟,將多個(gè)步驟合并為一個(gè)步驟執(zhí)行,和/或?qū)⒁粋€(gè)步驟分解為多個(gè)步驟執(zhí)行。
[0057]雖然已經(jīng)參考若干【具體實(shí)施方式】描述了本發(fā)明,但是應(yīng)該理解,本發(fā)明并不限于所公開(kāi)的【具體實(shí)施方式】。本發(fā)明旨在涵蓋所附權(quán)利要求的精神和范圍內(nèi)所包括的各種修改和等同布置。所附權(quán)利要求的范圍符合最寬泛的解釋,從而包含所有這樣的修改及等同結(jié)構(gòu)和功能。
【權(quán)利要求】
1.一種用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的方法,所述方法包括: 收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù); 基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布; 根據(jù)所計(jì)算的分布建立識(shí)別模式;以及 使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
2.根據(jù)權(quán)利要求1所述的方法,還包括針對(duì)不符合所述模式的節(jié)點(diǎn)發(fā)出警示。
3.根據(jù)權(quán)利要求1所述的方法,其中通過(guò)分布式信息收集系統(tǒng)收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的方法,其中基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的分布包括計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的平均值、最大值、中位數(shù)。
5.根據(jù)權(quán)利要求1所述的方法,其中基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的分布包括計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的方差。
6.根據(jù)權(quán)利要求1所述的方法,其中根據(jù)所計(jì)算的分布建立識(shí)別模式包括建立每個(gè)節(jié)點(diǎn)的運(yùn)行負(fù)載關(guān)于時(shí)間的模式。
7.根據(jù)權(quán)利要求1所述的方法,其中根據(jù)所計(jì)算的分布建立識(shí)別模式包括建立所述服務(wù)器系統(tǒng)中的所有節(jié)點(diǎn)的平均運(yùn)行負(fù)載關(guān)于時(shí)間的模式。
8.根據(jù)權(quán)利要求1所述的方法,其中使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障包括將當(dāng)前負(fù)載值超過(guò)所述模式的對(duì)應(yīng)點(diǎn)處的值一定百分比的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
9.根據(jù)權(quán)利要求8所述的方法,其中所述一定百分比為20%或者30%。
10.根據(jù)權(quán)利要求1所述的方法,其中使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障包括將當(dāng)前負(fù)載曲線在當(dāng)前點(diǎn)處的導(dǎo)數(shù)超過(guò)所述模式的對(duì)應(yīng)點(diǎn)處的導(dǎo)數(shù)一定百分比的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
11.根據(jù)權(quán)利要求10所述的方法,其中所述一定百分比為20%或者30%。
12.根據(jù)權(quán)利要求1所述的方法,其中所述服務(wù)器系統(tǒng)包括以下的一個(gè)或多個(gè):游戲服務(wù)器、電子郵件服務(wù)器、消息收發(fā)服務(wù)器、文件服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器。
13.一種用于識(shí)別服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障的設(shè)備,所述設(shè)備包括: 收集裝置,配置用于收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù); 分布計(jì)算裝置,配置用于基于所收集的運(yùn)行負(fù)載數(shù)據(jù)計(jì)算運(yùn)行負(fù)載數(shù)據(jù)的分布; 模式建立裝置,配置用于根據(jù)所計(jì)算的分布建立識(shí)別模式;以及 識(shí)別裝置,配置用于使用所建立的識(shí)別模式將不符合所述模式的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
14.根據(jù)權(quán)利要求13所述的設(shè)備,還包括警示裝置,配置用于針對(duì)不符合所述模式的節(jié)點(diǎn)發(fā)出警示。
15.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述收集裝置配置用于通過(guò)分布式信息收集系統(tǒng)收集所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)處的運(yùn)行負(fù)載數(shù)據(jù)。
16.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述分布計(jì)算裝置配置用于計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的平均值、最大值、中位數(shù)。
17.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述分布計(jì)算裝置配置用于計(jì)算所述運(yùn)行負(fù)載數(shù)據(jù)的方差。
18.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述分布建立裝置配置用于建立每個(gè)節(jié)點(diǎn)的運(yùn)行負(fù)載關(guān)于時(shí)間的模式。
19.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述分布建立裝置配置用于建立所述服務(wù)器系統(tǒng)中的所有節(jié)點(diǎn)的平均運(yùn)行負(fù)載關(guān)于時(shí)間的模式。
20.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述識(shí)別裝置配置用于將當(dāng)前負(fù)載值超過(guò)所述模式的對(duì)應(yīng)點(diǎn)處的值一定百分比的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
21.根據(jù)權(quán)利要求20所述的設(shè)備,其中所述一定百分比為20%或者30%。
22.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述識(shí)別裝置配置用于將當(dāng)前負(fù)載曲線在當(dāng)前點(diǎn)處的導(dǎo)數(shù)超過(guò)所述模式的對(duì)應(yīng)點(diǎn)處的導(dǎo)數(shù)一定百分比的節(jié)點(diǎn)識(shí)別為所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障。
23.根據(jù)權(quán)利要求22所述的設(shè)備,其中所述一定百分比為20%或者30%。
24.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述服務(wù)器系統(tǒng)包括以下的一個(gè)或多個(gè):游戲服務(wù)器、電子郵件服務(wù)器、消息收發(fā)服務(wù)器、文件服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器。
25.—種系統(tǒng),包括: 服務(wù)器系統(tǒng),其包括多個(gè)節(jié)點(diǎn); 存儲(chǔ)庫(kù),其耦合至所述服務(wù)器系統(tǒng),配置為用于存儲(chǔ)從所述服務(wù)器系統(tǒng)的每個(gè)節(jié)點(diǎn)收集的運(yùn)行負(fù)載數(shù)據(jù);以及 監(jiān)控設(shè)備,其耦合至所述存儲(chǔ)庫(kù),配置為用于識(shí)別所述服務(wù)器系統(tǒng)中的熱點(diǎn)和可能故障,其中所述監(jiān)控設(shè)備包括根據(jù)權(quán)利要求13-24任一項(xiàng)所述的設(shè)備。
【文檔編號(hào)】H04L12/24GK103580903SQ201210279582
【公開(kāi)日】2014年2月12日 申請(qǐng)日期:2012年8月2日 優(yōu)先權(quán)日:2012年8月2日
【發(fā)明者】于昕 申請(qǐng)人:人人游戲網(wǎng)絡(luò)科技發(fā)展(上海)有限公司