亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法

文檔序號:6421033閱讀:147來源:國知局
專利名稱:一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法
技術(shù)領(lǐng)域
本發(fā)明涉及高性能機(jī)群服務(wù)器技術(shù)領(lǐng)域,特別是一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法。
背景技術(shù)
機(jī)群是當(dāng)今高性能計算中一種質(zhì)優(yōu)價廉的解決方案,隨著機(jī)群技術(shù)的成熟與成本的降低,它的規(guī)模增長也是越來越快。機(jī)群龐大的規(guī)模和大量的資源都需要我們能夠及時有效的了解它們的狀態(tài),這對于一個計算環(huán)境能否正常運(yùn)行和形成計算能力有著重要的意義,所以,這就要求我們能夠有一套有效的監(jiān)控方法來監(jiān)控這樣大規(guī)模的計算資源。
以往的機(jī)群監(jiān)控方法有著一些不足,首先,以往的機(jī)群監(jiān)控系統(tǒng)一般采用Client/Server(客戶機(jī)/服務(wù)器)模式的兩層結(jié)構(gòu),這樣一來對機(jī)群本身規(guī)模限制過多,一旦機(jī)群規(guī)模發(fā)生變化,特別是規(guī)模增長數(shù)倍的時候,監(jiān)控系統(tǒng)很難適應(yīng),其次,以往的監(jiān)控方法大多是從物理視圖的角度對機(jī)群內(nèi)部某個(些)結(jié)點的運(yùn)行狀態(tài)進(jìn)行描述,而不能從邏輯視圖的角度對機(jī)群整體內(nèi)部某一類資源的狀態(tài)進(jìn)行描述,第三,以往的機(jī)群監(jiān)控方法往往只監(jiān)控諸如中央處理器利用率、內(nèi)存利用率等操作系統(tǒng)軟件級別的狀態(tài)信息,而不對機(jī)群環(huán)境的溫度、電壓、風(fēng)扇轉(zhuǎn)速等狀態(tài)信息進(jìn)行監(jiān)控。

發(fā)明內(nèi)容
鑒于現(xiàn)有的機(jī)群監(jiān)控方法的不足,本發(fā)明提供了一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法。該方法為大規(guī)模機(jī)群的監(jiān)控系統(tǒng)提供了一種施行方案,也同時構(gòu)造了一個多層次的監(jiān)控環(huán)境,在網(wǎng)絡(luò)環(huán)境中實現(xiàn)了對被監(jiān)控機(jī)群服務(wù)器進(jìn)行狀態(tài)信息采集、狀態(tài)信息匯總、狀態(tài)信息整理、狀態(tài)信息存儲、狀態(tài)信息顯示的功能。
本發(fā)明的具體實現(xiàn)方法如下a.機(jī)群監(jiān)控方法的框架結(jié)構(gòu)本方法將監(jiān)控系統(tǒng)整體從結(jié)構(gòu)上分為4個層次和5個器件,分別是結(jié)點信息采集層(軟件信息采集器、硬件信息采集器)、組信息管理層(組信息管理器)、機(jī)群信息管理層(機(jī)群信息管理器)、機(jī)群監(jiān)控層(機(jī)群監(jiān)控終端)。詳見Linux機(jī)群超級服務(wù)器監(jiān)控系統(tǒng)結(jié)構(gòu)示意圖。這種多層次的系統(tǒng)構(gòu)架使得本監(jiān)控系統(tǒng)很容易適應(yīng)各種規(guī)模的機(jī)群,從幾個結(jié)點的規(guī)模到上千個結(jié)點的規(guī)模,都可以完成對它們的監(jiān)控。
b.機(jī)群系統(tǒng)狀態(tài)信息的采集整個大規(guī)模機(jī)群系統(tǒng)的狀態(tài)信息由各個結(jié)點的狀態(tài)信息匯總而成,而每個結(jié)點的狀態(tài)信息的采集工作由結(jié)點信息采集層來完成,結(jié)點信息采集層由軟件信息采集器和硬件信息采集器2個器件構(gòu)成。
軟件信息采集器通過定時讀取操作系統(tǒng)參數(shù)獲取系統(tǒng)狀態(tài)數(shù)據(jù)。軟件信息采集器模塊所需要采集的系統(tǒng)狀態(tài)數(shù)據(jù)主要包括中央處理器使用情況、系統(tǒng)內(nèi)存容量及使用情況、系統(tǒng)交互分區(qū)大小及使用情況、磁盤使用情況(讀寫操作的繁忙程度)、各套網(wǎng)絡(luò)的狀態(tài)(通斷)、收發(fā)包情況、丟包率、應(yīng)用程序運(yùn)行的狀態(tài)。
硬件信息采集器是個硬件設(shè)備,它通過數(shù)據(jù)監(jiān)控卡(采集卡)、溫度探頭、電壓測量裝置、風(fēng)扇轉(zhuǎn)速測量裝置來完成對機(jī)群系統(tǒng)內(nèi)部硬件設(shè)備的狀態(tài)信息的采集。硬件信息采集器所采集的數(shù)據(jù)主要包括各個硬件設(shè)備的電壓值和工作溫度、各個風(fēng)扇轉(zhuǎn)速等。
c.機(jī)群系統(tǒng)狀態(tài)信息的匯總本監(jiān)控方法的體系結(jié)構(gòu)分為4個層次,機(jī)群系統(tǒng)狀態(tài)信息由底層的結(jié)點信息采集層采集完成后,分別經(jīng)過各個層次的整理、匯總而成。
結(jié)點信息采集層收集的各個結(jié)點的狀態(tài)信息在組信息管理器處得到第一次匯總。組信息管理器會周期性的向它的組成員(結(jié)點)發(fā)請求,索取每個結(jié)點的軟件和硬件的狀態(tài)信息,每個結(jié)點上的軟件信息采集器會通過基于socket的通信方式,將該結(jié)點軟件狀態(tài)信息匯報給組信息管理器,而每個結(jié)點上的硬件信息采集器則通過I2C協(xié)議將結(jié)點的硬件狀態(tài)數(shù)據(jù)由串行口傳遞到組信息管理器。
各個組信息管理器將自己所管理的所有組成員的狀態(tài)數(shù)據(jù)匯報給機(jī)群信息管理器,是狀態(tài)數(shù)據(jù)在機(jī)群內(nèi)部的第二次匯總。機(jī)群信息管理器會周期性的向每個組信息管理器發(fā)請求,索取每個組信息管理器保留的各個結(jié)點的匯總信息。收到請求后,每個組信息管理器會將自己保留的組內(nèi)所有成員的狀態(tài)信息通過基于socket的通信方式發(fā)送給機(jī)群信息管理器,機(jī)群內(nèi)部所有結(jié)點的軟件、硬件的狀態(tài)信息在機(jī)群信息管理器得到匯總。
d.機(jī)群系統(tǒng)狀態(tài)信息的保存結(jié)點上的軟件信息采集器會在結(jié)點操作系統(tǒng)啟動成功后,在結(jié)點內(nèi)存中劃分出一塊兒內(nèi)存區(qū)用來保留該結(jié)點的狀態(tài)數(shù)據(jù),該內(nèi)存中保留的狀態(tài)數(shù)據(jù)會周期性的被軟件信息采集器刷新。
和軟件信息采集器類似,組信息管理器在結(jié)點操作系統(tǒng)啟動成功后,在結(jié)點內(nèi)存中劃分出一塊兒內(nèi)存區(qū)用來保留該組所有結(jié)點匯報上來的狀態(tài)數(shù)據(jù)集合,內(nèi)存中保留的狀態(tài)數(shù)據(jù)會周期性的被組信息管理器刷新。
機(jī)群信息管理器管理整個機(jī)群的狀態(tài)數(shù)據(jù),其中包括當(dāng)前狀態(tài)數(shù)據(jù)的管理和歷史數(shù)據(jù)的管理,當(dāng)前狀態(tài)數(shù)據(jù)的管理和軟件信息采集器類似,在結(jié)點操作系統(tǒng)啟動成功后,機(jī)群信息管理器在結(jié)點內(nèi)存中劃分出一塊兒內(nèi)存區(qū)用來保留機(jī)群內(nèi)部所有組信息管理器匯報上來的狀態(tài)數(shù)據(jù)集合,內(nèi)存中保留的狀態(tài)數(shù)據(jù)會周期性的被機(jī)群信息管理器刷新。同時,機(jī)群信息管理器也管理著機(jī)群歷史狀態(tài)數(shù)據(jù),這一工作通過利用MySQL數(shù)據(jù)庫來完成。機(jī)群信息管理器將每個周期從組信息管理器收集上來的狀態(tài)數(shù)據(jù)存入MySQL的表中,表是按天建立,每一天建立一張新表,來存放當(dāng)天該機(jī)群的所有狀態(tài)數(shù)據(jù)。
e.機(jī)群系統(tǒng)狀態(tài)信息的顯示機(jī)群系統(tǒng)狀態(tài)信息的顯示由機(jī)群監(jiān)控終端來完成,機(jī)群監(jiān)控終端位于機(jī)群監(jiān)控層。
機(jī)群監(jiān)控終端的界面由一組視圖組成,它包括靜態(tài)信息視圖、實時信息視圖和歷史數(shù)據(jù)分析視圖三類。通過圖形的方式將被監(jiān)控機(jī)群的信息表示出來,機(jī)群監(jiān)控終端的數(shù)據(jù)來源于數(shù)據(jù)庫服務(wù)器。靜態(tài)信息視圖按照機(jī)群為單位顯示其中央處理器信息、內(nèi)存大小、硬盤容量等和機(jī)群配置相關(guān)的信息。實時信息視圖以柱狀圖或者折線圖形式動態(tài)顯示機(jī)群中各節(jié)點中央處理器利用率、內(nèi)存利用率、交互分區(qū)利用率、硬盤利用率,以及硬件故障情況,包括電壓、電流不穩(wěn),風(fēng)扇停轉(zhuǎn),溫度異常等。歷史數(shù)據(jù)分析視圖以時間為序、機(jī)群整體為分析對象,給出機(jī)群內(nèi)所有節(jié)點的中央處理器使用情況、硬盤工作狀態(tài)、內(nèi)存利用率、交互分區(qū)利用率的變化趨勢,分析當(dāng)前機(jī)群的性能是否能滿足當(dāng)前應(yīng)用的需求,同時,以時間為序,統(tǒng)計軟、硬件故障點及故障頻率,以便協(xié)助進(jìn)行軟、硬件的升級。視圖也是以柱狀圖和折線圖的形式顯示。


圖1是本發(fā)明的大規(guī)模機(jī)群系統(tǒng)監(jiān)控方法的結(jié)構(gòu)示意圖;圖2是圖1的應(yīng)用該方法的機(jī)群監(jiān)控系統(tǒng)的部署示意圖;圖3是本發(fā)明的大規(guī)模機(jī)群系統(tǒng)監(jiān)控方法的流程圖。
如圖1中所示,將大規(guī)模機(jī)群系統(tǒng)監(jiān)控方法從結(jié)構(gòu)上分為4個層次、5個器件,它們分別為結(jié)點信息采集層1(軟件信息采集器、硬件信息采集器)、組信息管理層2(組信息管理器)、機(jī)群信息管理層3(機(jī)群信息管理器)、機(jī)群監(jiān)控層4(機(jī)群監(jiān)控終端)。
結(jié)點信息采集分為軟件信息采集和硬件信息采集兩個部分。每個結(jié)點上的硬件信息采集器通過I2C專用網(wǎng)絡(luò)把收集到的結(jié)點硬件信息傳遞到組信息管理器,同樣,每個結(jié)點上的軟件信息采集器也把相應(yīng)的結(jié)點系統(tǒng)狀態(tài)信息傳遞給組信息管理器,每個組信息管理器可以管理0~128個結(jié)點的信息,若干個組信息管理器的信息匯總到機(jī)群信息管理器內(nèi),機(jī)群信息管理器要收集、處理并利用數(shù)據(jù)庫保存這些不斷發(fā)送過來的數(shù)據(jù),為管理員監(jiān)控機(jī)群內(nèi)部每個結(jié)點狀態(tài),了解結(jié)點的歷史運(yùn)行信息提供了數(shù)據(jù)。機(jī)群監(jiān)控終端是一組圖形化界面管理工具,它通過從數(shù)據(jù)庫中獲取機(jī)群內(nèi)部結(jié)點當(dāng)前以及歷史狀態(tài)信息,并以圖形化的界面展示給管理員方式,使得管理員直觀、及時、準(zhǔn)確的獲取被監(jiān)測機(jī)群的當(dāng)前及歷史狀態(tài)信息。
如圖2中所示,應(yīng)用了本方法的監(jiān)控系統(tǒng)將每個模塊部署在機(jī)群中相應(yīng)的結(jié)點上,形成一套完整的監(jiān)控系統(tǒng),并協(xié)調(diào)工作。
軟、硬件信息采集器部署在機(jī)群內(nèi)部各個計算結(jié)點上,負(fù)責(zé)收集該結(jié)點的軟、硬件狀態(tài)信息;組信息管理器部署在機(jī)群內(nèi)部組管理結(jié)點上,負(fù)責(zé)匯總組內(nèi)各個結(jié)點的狀態(tài)信息;機(jī)群信息管理器部署在機(jī)群網(wǎng)絡(luò)出口(同時擁有外網(wǎng)和內(nèi)網(wǎng))的結(jié)點上,負(fù)責(zé)匯總各個組的狀態(tài)信息,同時將數(shù)據(jù)存入數(shù)據(jù)庫;機(jī)群監(jiān)控終端部署在和數(shù)據(jù)庫有網(wǎng)絡(luò)連接的終端上,對數(shù)據(jù)庫中的各種狀態(tài)信息進(jìn)行顯示。
圖3的大規(guī)模機(jī)群系統(tǒng)監(jiān)控方法,其步驟如下步驟S1軟件信息采集器和硬件信息采集器分別周期性的收集該結(jié)點的軟件和硬件的運(yùn)行狀態(tài)信息,各個結(jié)點的狀態(tài)信息周期性的匯總于所屬組信息管理器,步驟S2各個組信息管理器收集、整理管理的各個結(jié)點狀態(tài)信息周期性的匯總于機(jī)群信息管理器,步驟S3機(jī)群信息管理器收集、保存管理的各個組周期性的將所管理的機(jī)群狀態(tài)信息整理并存入數(shù)據(jù)庫,步驟S4機(jī)群監(jiān)控終端從數(shù)據(jù)庫中取得所需信息進(jìn)行顯示。
本發(fā)明的效果體現(xiàn)在1.本監(jiān)控方法提出的四個層次的體系結(jié)構(gòu)更容易適應(yīng)不通規(guī)模的機(jī)群,特別是大規(guī)模機(jī)群,較之以往機(jī)群監(jiān)控系統(tǒng)采用的Client/Server模式的兩層結(jié)構(gòu)有著更好的可擴(kuò)展性。
2.本機(jī)群監(jiān)控方法利用數(shù)據(jù)庫技術(shù)對大量的狀態(tài)數(shù)據(jù)進(jìn)行管理,定期備份,并為數(shù)據(jù)分析工具提供源數(shù)據(jù),極大的方便了管理人員對被監(jiān)控機(jī)群歷史運(yùn)行狀態(tài)數(shù)據(jù)的分析。
3.本機(jī)群監(jiān)控方法提出了視圖邏輯層次的可縮放性,為管理員提供了不同的視角來觀察被監(jiān)測格點的各種資源的狀態(tài),管理員既可以將機(jī)群內(nèi)所有結(jié)點當(dāng)作一個整體來觀察它的某類資源狀態(tài),也可以查看格點內(nèi)任意結(jié)點的某種資源使用狀況。
4.本機(jī)群監(jiān)控方法不但對中央處理器利用率、內(nèi)存利用率等操作系統(tǒng)軟件級別的狀態(tài)信息進(jìn)行監(jiān)控,而且還對機(jī)群環(huán)境的溫度、電壓、風(fēng)扇轉(zhuǎn)速等硬件狀態(tài)信息進(jìn)行監(jiān)控,這是以往的機(jī)群監(jiān)控系統(tǒng)沒有的。
權(quán)利要求
1.一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其分為四個層次、五個器件,包括結(jié)點信息采集層、組信息管理層、機(jī)群信息管理層、機(jī)群監(jiān)控層,其特征在于通過由軟件信息采集器、硬件信息采集器周期性采集系統(tǒng)狀態(tài)信息,組信息管理器周期性的從軟、硬件信息采集器收集、整理每個組成員(結(jié)點)的狀態(tài)信息,機(jī)群信息管理器再周期性的從每個組信息管理器收集、整理、保存(利用MySQL數(shù)據(jù)庫)每個組信息管理器管理的狀態(tài)數(shù)據(jù),最后由機(jī)群監(jiān)控終端從MySQL數(shù)據(jù)庫中將這些狀態(tài)數(shù)據(jù)讀取出來,并以圖形的方式和邏輯視圖的角度將各種類型的被監(jiān)控對象的狀態(tài)數(shù)據(jù)顯示給管理員,在本方法中,機(jī)群監(jiān)控終端與MySQL數(shù)據(jù)庫之間的通信方式采用基于JDBC(Java DataBaseConnectivity-Java數(shù)據(jù)庫連接)的通信模式,除此以外不同層次的模塊間通信采用基于socket(套接字)的通信模式來完成。
2.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于本方法將監(jiān)控系統(tǒng)分為四個層次、五個器件,包括結(jié)點信息采集層(軟件信息采集器、硬件信息采集器)、組信息管理層(組信息管理器)、機(jī)群信息管理層(機(jī)群信息管理器)、機(jī)群監(jiān)控層(機(jī)群監(jiān)控終端)。
3.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于由軟件信息采集器周期性采集被監(jiān)控系統(tǒng)的軟件狀態(tài)信息。
4.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于由硬件信息采集器周期性采集被監(jiān)控系統(tǒng)的硬件狀態(tài)信息
5.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于由組信息管理器周期性的從軟、硬件信息采集器收集、整理每個組成員(結(jié)點)的狀態(tài)信息。
6.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于組信息管理器與下層軟件信息管理器的通信采用基于socket的通信方式。
7.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于機(jī)群信息管理器周期性的從每個組信息管理器收集、整理、保存(利用MySQL數(shù)據(jù)庫)每個組信息管理器管理的狀態(tài)數(shù)據(jù)。
8.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于機(jī)群信息管理器與下層組信息管理器的通信采用基于socket的通信方式。
9.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于由機(jī)群監(jiān)控終端從MySQL數(shù)據(jù)庫中將這些狀態(tài)數(shù)據(jù)讀取出來,并用圖形的方式將各種類型的被監(jiān)控對象的狀態(tài)數(shù)據(jù)顯示給管理員。
10.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于由機(jī)群監(jiān)控終端從MySQL數(shù)據(jù)庫中將這些狀態(tài)數(shù)據(jù)讀取出來,并從機(jī)群資源的邏輯視角將這些資源的狀態(tài)數(shù)據(jù)顯示給管理員。
11.如權(quán)利要求1所述的一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其特征在于機(jī)群監(jiān)控終端與下層MySQL數(shù)據(jù)庫間通信采用基于JDBC的通信模式來完成。
12.一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,其步驟如下步驟S1軟件信息采集器和硬件信息采集器分別周期性的收集該結(jié)點的軟件和硬件的運(yùn)行狀態(tài)信息,各個結(jié)點的狀態(tài)信息周期性的匯總于所屬組信息管理器,步驟S2各個組信息管理器收集、整理管理的各個結(jié)點狀態(tài)信息周期性的匯總于機(jī)群信息管理器,步驟S3機(jī)群信息管理器收集、保存管理的各個組周期性的將所管理的機(jī)群狀態(tài)信息整理并存入數(shù)據(jù)庫,步驟S4機(jī)群監(jiān)控終端從數(shù)據(jù)庫中取得所需信息進(jìn)行顯示。
全文摘要
一種大規(guī)模機(jī)群系統(tǒng)的監(jiān)控方法,本方法將監(jiān)控系統(tǒng)分為四個層次、五個器件。方法通過由軟、硬件信息采集器(結(jié)點信息采集層)周期性采集系統(tǒng)狀態(tài)信息,組信息管理器(組信息管理層)周期性從軟、硬件信息采集器收集、整理每個組成員(結(jié)點)狀態(tài)信息,機(jī)群信息管理器(機(jī)群信息管理層)周期性的從每個組信息管理器收集、整理,并利用MySQL數(shù)據(jù)庫保存每個組信息管理器管理的狀態(tài)數(shù)據(jù),最后由機(jī)群監(jiān)控終端(機(jī)群監(jiān)控層)從MySQL數(shù)據(jù)庫中將這些狀態(tài)數(shù)據(jù)讀取出來,并用圖形的方式將各種類型的被監(jiān)控對象的狀態(tài)數(shù)據(jù)顯示給管理員,從而達(dá)到對大規(guī)模機(jī)群系統(tǒng)運(yùn)行狀態(tài)進(jìn)行監(jiān)控的目的。
文檔編號G06F11/30GK1547121SQ200310119410
公開日2004年11月17日 申請日期2003年12月10日 優(yōu)先權(quán)日2003年12月10日
發(fā)明者李博, 馬捷, 李 博 申請人:中國科學(xué)院計算技術(shù)研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1