專利名稱:一種機群性能監(jiān)控接口及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及機群監(jiān)控領(lǐng)域,尤其涉及對機群中的各個節(jié)點的性能進行監(jiān)控的用戶 接口以及監(jiān)控方法。
背景技術(shù):
為了滿足各種對強大計算性能要求的應(yīng)用,出現(xiàn)了將多個獨立的計算機用軟件和 硬件組合在一起以提供強大計算性能的機群系統(tǒng)。在機群系統(tǒng)中的每個獨立計算機稱為節(jié) 點。在將機群系統(tǒng)投入運行中時,機群系統(tǒng)的性能,即在特定的硬件環(huán)境和軟件環(huán)境下,機 群系統(tǒng)對于特定的工作負(fù)載所表現(xiàn)的計算能力是個非常關(guān)鍵的因素。機群系統(tǒng)的性能通常 取決于機群系統(tǒng)中各個節(jié)點的性能。一般而言,這些節(jié)點的性能指標(biāo)包括每個節(jié)點的內(nèi)存 交換區(qū)(以下簡稱SWAP)的利用率、SWAP的訪問率,內(nèi)存的利用率、內(nèi)存的訪問率、中央處 理器(以下簡稱CPU)的利用率、CPU主頻、CPU個數(shù)和核數(shù)、存儲的讀寫速率以及網(wǎng)絡(luò)的收 發(fā)速率等。目前,已經(jīng)存在有多種機群性能監(jiān)控系統(tǒng),用于對機群的性能進行監(jiān)控。附圖1給出了惠普公司的機群管理軟件CMU的用戶接口,其中在接口的左側(cè)部分 列出了機群中的各個節(jié)點,而在右下側(cè)以圓形餅圖方式示出了機群的各類性能的整體性能 參數(shù)。但是惠普公司的CMU存在以下問題首先,該用戶接口并沒有給出諸如單個節(jié)點CPU 每核的利用率、SWAP的利用率以及I B數(shù)據(jù)之類的關(guān)鍵性能指標(biāo);其次,CMU的用戶接口無 法在單個界面內(nèi)容顯示整個機群中各個節(jié)點的具體性能狀態(tài);而且CMU也不支持同時顯示 多個機群的性能。附圖2給出了 CGGVeritas公司的機群軟件GeoCluster提供的機群監(jiān)控接口 SCP, 如附圖2可以看出,該監(jiān)控接口只提供了多個節(jié)點在過去24小時的CPU使用情況,并沒有 提供實時顯示,另外該監(jiān)控接口僅僅提供有關(guān)每個節(jié)點的CPU使用率的性能指標(biāo)的信息, 而沒有提供其他同樣非常重要的性能指標(biāo),因而無法被使用該監(jiān)控接口的用戶用于性能分 析。由于機群監(jiān)控系統(tǒng)一般在機群系統(tǒng)運行時實時運行,而且一般有用戶通過機群監(jiān) 控接口來實時監(jiān)控機群系統(tǒng)的運行狀況,因此,能夠在單個機群監(jiān)控接口中呈現(xiàn)盡可能多 的機群性能信息,尤其是機群中各個節(jié)點的性能信息是所希望的。另外,由于機群監(jiān)控接 口中通常呈現(xiàn)大量的信息,監(jiān)控接口的用戶通常希望能夠在監(jiān)控中及時發(fā)現(xiàn)存在問題的節(jié) 點,因此,能夠以足夠引起注意的方式來顯示存在問題的節(jié)點也是機群監(jiān)控接口所希望有 的功能。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上 述問題的機群性能監(jiān)控接口和機群監(jiān)控方法。根據(jù)本發(fā)明的一個方面提供了 一種機群性能監(jiān)控接口,適于監(jiān)控一個或者多個機群,其中每個機群包括多個節(jié)點,所述機群性能監(jiān)控接口包括多個節(jié)點監(jiān)控接口,每個節(jié)點 監(jiān)控接口對應(yīng)于所述多個節(jié)點中的每個節(jié)點并為相應(yīng)節(jié)點顯示其性能指標(biāo),其中所述多個 節(jié)點監(jiān)控接口中的每個節(jié)點監(jiān)控接口包括多個子監(jiān)控部件,每個子監(jiān)控部件包括多個監(jiān) 控單元,其中每個子監(jiān)控部件實時顯示所述相應(yīng)節(jié)點的某個類別性能的指標(biāo),而且多個監(jiān) 控單元中的每個監(jiān)控單元實時顯示所述類別性能中某個性能的當(dāng)前指標(biāo),其中所述每個監(jiān) 控單元都以柱狀圖形式顯示相應(yīng)性能的指標(biāo),所述柱狀圖中的柱高度反映了所述相應(yīng)性能 指標(biāo)的大小,以及其中所述每個節(jié)點監(jiān)控接口具有相同的子監(jiān)控部件布局。根據(jù)本發(fā)明的另一個方面,提供了適于監(jiān)控一個或者多個機群的機群性能監(jiān)控方 法,其中所述每個機群包括多個節(jié)點,所述方法包括步驟為所述機群中的每個節(jié)點提供具 有相同布局的相應(yīng)節(jié)點監(jiān)控接口 ;為所述相應(yīng)節(jié)點監(jiān)控接口提供多個子監(jiān)控部件,其中每 個子監(jiān)控部件對應(yīng)于所述相應(yīng)節(jié)點的某個類別性能;為所述每個子監(jiān)控部件提供多個監(jiān)控 單元,每個監(jiān)控單元對應(yīng)于所述類別性能中的某個性能;以及在所述每個監(jiān)控單元中,以 柱狀圖形式實時顯示所述性能指標(biāo),其中所述柱狀圖中的柱高度反映了所述性能指標(biāo)的大 小。根據(jù)本發(fā)明的機群性能監(jiān)控接口和方法可以在單個監(jiān)控接口中同時顯示機群中 所有節(jié)點的多個重要性能指標(biāo),由于每個性能指標(biāo)都已不同顏色或者方式的柱狀圖顯示, 而且每個節(jié)點具有相同的監(jiān)控接口布局,因此用戶使用根據(jù)本發(fā)明的機群性能監(jiān)控接口可 以方便且容易地查看整個機群的運行狀態(tài)。每個節(jié)點監(jiān)控接口包括四個子監(jiān)控部件,分別為用于內(nèi)存類性能的子監(jiān)控部件、 用于CPU類性能的子監(jiān)控部件、用于存儲類性能的子監(jiān)控部件以及用于網(wǎng)絡(luò)類性能的子監(jiān) 控部件。其中用于CPU類性能的子監(jiān)控部件的每個監(jiān)控單元對應(yīng)于相應(yīng)節(jié)點中的每個CPU 核心,且每個監(jiān)控單元以綠色(其在RGB色彩模式中的值為(0,255,0))柱子來呈現(xiàn)相應(yīng) CPU核心的CPU利用率。用于內(nèi)存類性能的子監(jiān)控部件包括用于內(nèi)存交換分區(qū)的訪問率和 內(nèi)存交換分區(qū)的利用率的監(jiān)控單元,用于內(nèi)存交換分區(qū)的訪問率和內(nèi)存交換分區(qū)的利用率 的監(jiān)控單元分別以紅色(其在RGB色彩模式中的值為(255,0,0))柱子來呈現(xiàn)內(nèi)存交換分 區(qū)的訪問率和內(nèi)存交換分區(qū)的利用率。就機群性能而言,各個節(jié)點的CPU利用率以及內(nèi)存交換分區(qū)的狀況屬于節(jié)點運行 狀況的最重要判斷指標(biāo),通過以例如綠色或者紅色之類能夠引起人足夠關(guān)注度的顏色顯示 這些指標(biāo),可以使得機群監(jiān)控接口的用戶面對具有大量節(jié)點的監(jiān)控接口時及時關(guān)注可能存 在問題的節(jié)點,從而可以及時發(fā)現(xiàn)機群系統(tǒng)運行時可能出現(xiàn)的問題。
通過閱讀下文優(yōu)選實施方式的詳細(xì)描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通 技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明 的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中圖1示意性地示出了現(xiàn)有技術(shù)中惠普公司的機群管理工具CMU監(jiān)控接口 ;圖2示意性地示出了現(xiàn)有技術(shù)中CGGVeritas公司的機群軟件GeoCluster提供的 機群監(jiān)控接口 SCP ;圖3示意性地示出了根據(jù)本發(fā)明一個實施例的機群監(jiān)控接口 ;
圖4示意性地示出了根據(jù)本發(fā)明一個實施例的機群監(jiān)控接口中的節(jié)點監(jiān)控接口 ;圖5示意性地示出了根據(jù)本發(fā)明一個實施例的節(jié)點監(jiān)控接口中用于內(nèi)存類性能 的子監(jiān)控部件;圖6示意性地示出了根據(jù)本發(fā)明一個實施例的節(jié)點監(jiān)控接口中用于CPU類性能的 子監(jiān)控部件;圖7示意性地示出了根據(jù)本發(fā)明一個實施例的節(jié)點監(jiān)控接口中用于存儲類性能 的子監(jiān)控部件;圖8示意性地示出了根據(jù)本發(fā)明一個實施例的節(jié)點監(jiān)控接口中用于網(wǎng)絡(luò)類性能 的子監(jiān)控部件;圖9示意性地示出了根據(jù)本發(fā)明另一個實施例的機群監(jiān)控接口 ;以及圖10示意性地示出了根據(jù)本發(fā)明一個實施例的機群監(jiān)控方法。
具體實施例方式下面結(jié)合附圖和具體的實施方式對本發(fā)明作進一步的描述。圖3示意性地示出了根據(jù)本發(fā)明一個實施例的機群監(jiān)控接口 300,如圖3所示,機 群監(jiān)控接口 300包括多個節(jié)點監(jiān)控接口 310_1,310_2,... , 310_n (在下文中,當(dāng)不特指特定 節(jié)點監(jiān)控接口時,用符號310泛指節(jié)點監(jiān)控接口)。每個節(jié)點監(jiān)控接口 310具有相同的布 局,并且對應(yīng)于一個相應(yīng)的節(jié)點,并且顯示該相應(yīng)節(jié)點中的各種性能指標(biāo)。同時,如圖3所 示,當(dāng)機群包括較多節(jié)點時,可以利用定位裝置(例如鼠標(biāo))選擇機群監(jiān)控接口 300中的某 個節(jié)點監(jiān)控接口 310來放大顯示所選擇的節(jié)點監(jiān)控接口 310以便更清楚顯示該節(jié)點中的各 種性能指標(biāo)。為了保持接口的一致性,放大前后的節(jié)點監(jiān)控接口 310除了尺寸之外,其他布 局均相同。如圖3所示,在機群監(jiān)控接口中,多個節(jié)點監(jiān)控接口以行和列的方式排列,而且由 于機群中的節(jié)點可以根據(jù)功能的不同而可以歸類為具有不同屬性的節(jié)點。例如,節(jié)點可以 劃分為管理節(jié)點、IO節(jié)點和計算節(jié)點。將具有相關(guān)屬性的節(jié)點布置在同一行或者緊鄰的多 行中可以便于對節(jié)點進行監(jiān)控。因此在圖3中,第一行節(jié)點為屬于管理節(jié)點的節(jié)點,第二行 節(jié)點為屬于IO節(jié)點的節(jié)點,而后面幾行的節(jié)點為計算節(jié)點。圖4示出了根據(jù)本發(fā)明一個實施例的機群監(jiān)控接口中的節(jié)點監(jiān)控接口 310的具體 結(jié)構(gòu)。如圖4所示,節(jié)點監(jiān)控接口 310包括多個子監(jiān)控部件410(如410_1、410_2、410_3和 410_4)。每個子監(jiān)控部件410對應(yīng)于節(jié)點中某個類別性能的指標(biāo),并且顯示該類性能指標(biāo) 的值。通過將某個類別的性能指標(biāo)集中在一個子監(jiān)控部件中顯示,可以便于機群監(jiān)控接口 的用戶方便定位節(jié)點中某個類別的性能。每個子監(jiān)控部件410還包括一個或者多個監(jiān)控單元510,每個監(jiān)控單元510對應(yīng)于 相應(yīng)類別性能中的每個性能指標(biāo)。這些監(jiān)控單元通常為矩形,并且在矩形中,以柱狀圖的形 式顯示相應(yīng)性能指標(biāo),例如,相應(yīng)性能指標(biāo)的值由柱狀圖中柱的高度來反映。應(yīng)當(dāng)注意的是,監(jiān)控單元可以沿不同的方向延伸,而且監(jiān)控單元中的柱子也可以 根據(jù)需要沿不同方向延伸。同時,可以根據(jù)各個類別性能的特點來選擇監(jiān)控單元的延伸方 向以及柱子的延伸方向。如圖4所示,節(jié)點監(jiān)控接口 310包括四個子監(jiān)控部件,分別為用于內(nèi)存類性能的子監(jiān)控部件410_1、用于CPU類性能的子監(jiān)控部件410_2、用于存儲類性能的子監(jiān)控部件410_3 以及用于網(wǎng)絡(luò)類性能的子監(jiān)控部件410_4。其中,用于CPU類性能的子監(jiān)控部件410_2位 于節(jié)點監(jiān)控接口 310的中央,用于內(nèi)存類性能的子監(jiān)控部件410_1位于用于CPU類性能的 子監(jiān)控部件410_2的左側(cè),用于存儲類性能的子監(jiān)控部件410_3位于用于內(nèi)存類性能的子 監(jiān)控部件410_1和用于CPU類性能的子監(jiān)控部件410_2的下方,以及用于網(wǎng)絡(luò)類性能的子 監(jiān)控部件410_4位于用于CPU類性能的子監(jiān)控部件410_2和用于存儲類性能的子監(jiān)控部件 410_3的右側(cè)。利用這個布局,在節(jié)點監(jiān)控接口的中央部分著重顯示用于CPU類性能的子監(jiān) 控部件410_2,由于在機群性能監(jiān)控中,每個節(jié)點的CPU類性能是重要的性能指標(biāo),利用該 布局,可以便于機群監(jiān)控接口的用戶在接口上方便地注意到各個節(jié)點的重要狀態(tài)。應(yīng)當(dāng)注意的是,本發(fā)明并不局限于僅僅四個子監(jiān)控部件,而是可以根據(jù)實際機群 性能監(jiān)控的需要來增加或者減少子監(jiān)控部件。下面詳細(xì)介紹各個子監(jiān)控部件410的具體結(jié) 構(gòu)。圖5示意性地示出了根據(jù)本發(fā)明一個實施例的節(jié)點監(jiān)控接口中用于內(nèi)存類性能 的子監(jiān)控部件410_1的具體結(jié)構(gòu)。如圖5所示,子監(jiān)控部件410_1包括四個監(jiān)控單元,其中 沿縱向包括涉及內(nèi)存交換區(qū)(SWAP)和內(nèi)存的監(jiān)控單元,而沿橫向包括涉及訪問率和利用 率的監(jiān)控單元,也就是說,子監(jiān)控部件410_1包括處于左上角區(qū)域的用于SWAP訪問率的監(jiān) 控單元510、處于右上角區(qū)域的用于SWAP利用率的監(jiān)控單元520、處于左下角區(qū)域的用于內(nèi) 存訪問率的監(jiān)控單元530以及處于右下角區(qū)域的用于內(nèi)存利用率的監(jiān)控單元540。在監(jiān)控 單元510和520中,即在涉及SWAP的監(jiān)控單元中,柱狀圖中的柱子以較為醒目的顏色如紅 色填充,而在涉及內(nèi)存的監(jiān)控單元530和540中,柱子以相對較為柔和的顏色如深黃色(其 在RGB色彩模式中的值為(128,128,0))來填充。由于在機群性能監(jiān)控中,如果某個節(jié)點的 SWAP的訪問率和利用率較高,則該節(jié)點出現(xiàn)問題的幾率較大,根據(jù)本發(fā)明的機群監(jiān)控接口 以較為醒目的顏色來顯示SWAP的性能指標(biāo),可以便于機群監(jiān)控接口的用戶快速地在多個 節(jié)點中定位可能出現(xiàn)問題的節(jié)點,從而提高機群監(jiān)控的效率。另外,在用于內(nèi)存類性能的子 監(jiān)控部件410_1中,各個監(jiān)控單元510-540中的柱狀圖向上填充,即隨著SWAP或者內(nèi)存的 訪問率或者利用率的增加,柱狀圖中的柱子向上逐步上升。圖6示意性地示出了根據(jù)本發(fā)明一個實施例的節(jié)點監(jiān)控接口中用于CPU類性能的 子監(jiān)控部件410_2的具體結(jié)構(gòu)。如圖6所示,子監(jiān)控部件410_2根據(jù)相應(yīng)節(jié)點中的實際的 CPU核數(shù)沿縱向劃分成多個監(jiān)控單元610,每個監(jiān)控單元610對應(yīng)于一個CPU核。每個監(jiān)控 單元610的柱狀圖中的柱子高度指示相應(yīng)CPU內(nèi)核的利用率。由于在節(jié)點的性能指標(biāo)中, 就某個CPU內(nèi)核的CPU利用率而言,其中CPU用于操作系統(tǒng)的利用率也是值得關(guān)注的性能。 為了在單個柱狀圖中同時顯示這兩個性能指標(biāo),在每個監(jiān)控單元610中,將指示CPU內(nèi)核利 用率的柱狀圖分為兩個部分,其中以柱子的總長度指示CPU內(nèi)核的整體利用率,而在柱狀 圖的底部,以不同顏色的部分柱子長度指示CPU用于操作系統(tǒng)的利用率。由于CPU用于操 作系統(tǒng)的利用率僅僅為CPU整體利用率的一部分,因此,可以以單根柱子來同時指示兩個 不同性能指標(biāo)。同時,在監(jiān)控單元610的柱狀圖顯示中,以深紅色(其在RGB色彩模式中的 值為(128,0,0))的柱子指示CPU用于操作系統(tǒng)的利用率,而以較為醒目但對眼睛刺激較少 的顏色如綠色柱子表示除去CPU用于操作系統(tǒng)的利用率之外的CPU利用率的其他部分。由 于CPU利用率是性能監(jiān)控中經(jīng)常要關(guān)注的性能指標(biāo),通過在節(jié)點監(jiān)控接口的中央部分并以較為醒目但對眼睛刺激較少的顏色如綠色來顯示CPU利用率,可以減少對機群監(jiān)控接口的 用戶的眼睛刺激,并同時便于用戶進行監(jiān)控。另外,在用于CPU類性能的子監(jiān)控部件410_2 中,各個監(jiān)控單元610中的柱狀圖向上填充,即隨著CPU利用率的增加,柱狀圖中的柱子向 上逐步填充。圖7示意性地示出了根據(jù)本發(fā)明一個實施例的節(jié)點監(jiān)控接口中用于存儲類性能 的子監(jiān)控部件410_3的具體結(jié)構(gòu)。如圖7所示,子監(jiān)控部件410_3沿縱向包括涉及存儲類 型的監(jiān)控單元,并且沿橫向包括涉及讀操作和寫操作的監(jiān)控單元。具體而言,子監(jiān)控單元 410_3可包括四個監(jiān)控單元,如處于左上角區(qū)域的用于第一種存儲設(shè)備的讀取速率的監(jiān)控 單元710、處于右上角區(qū)域的用于第一種存儲設(shè)備的寫入速率的監(jiān)控單元720、處于左下角 區(qū)域的用于第二種存儲設(shè)備的讀取速率的監(jiān)控單元730以及處于右下角區(qū)域的用于第二 種存儲設(shè)備的寫入速率的監(jiān)控單元740。子監(jiān)控部件410_3可以為節(jié)點中的每種存儲設(shè)備 包括兩個分別對應(yīng)于讀取和寫入速率的監(jiān)控單元,而不僅僅限于兩種存儲設(shè)備??紤]在大 規(guī)模情況下的顯示效果,需要使用亮度較高的色彩來顯示磁盤數(shù)據(jù),本方案使用橙色(其 在RGB色彩模式中的值為(255,128,0))的柱子指示存儲設(shè)備的讀取速率,使用天藍(lán)色(其 在RGB色彩模式中的值為(0,128,255))的柱子指示存儲設(shè)備的寫入速率。同時,指示存儲 設(shè)備讀取速率的監(jiān)控單元(如710和730)中的柱狀圖從中間向左填充(即隨著讀取速率 的增大,柱子從中間向左填充),而指示存儲設(shè)備寫入速率的監(jiān)控單元(如720和740)中的 柱狀圖從中間向右填充(即隨著讀取速率的增大,柱子從中間向右填充)。圖8示意性地示出了根據(jù)本發(fā)明一個實施例的節(jié)點監(jiān)控接口中用于網(wǎng)絡(luò)類性能 的子監(jiān)控部件410_4的具體結(jié)構(gòu)。如圖8所示,子監(jiān)控部件410_4沿橫向包括涉及網(wǎng)絡(luò) 接口類型的監(jiān)控單元,而沿橫向包括涉及網(wǎng)絡(luò)數(shù)據(jù)發(fā)送和接收速率的監(jiān)控單元。具體而 言,子監(jiān)控部件410_4包括四個監(jiān)控單元,如處于左上角區(qū)域的用于第一種網(wǎng)絡(luò)接口(如 以太網(wǎng)接口)的網(wǎng)絡(luò)數(shù)據(jù)發(fā)送速率的監(jiān)控單元810、處于左下角區(qū)域的用于第一種網(wǎng)絡(luò) 接口的網(wǎng)絡(luò)數(shù)據(jù)接收速率的監(jiān)控單元830、處于右上角區(qū)域的用于第二種網(wǎng)絡(luò)接口(如 IB(Infiniband)接口 )的網(wǎng)絡(luò)數(shù)據(jù)發(fā)送速率的監(jiān)控單元820以及處于右下角區(qū)域的用于 第二種網(wǎng)絡(luò)接口的網(wǎng)絡(luò)數(shù)據(jù)接收速率的監(jiān)控單元840。子監(jiān)控部件410_4可以為節(jié)點中的 每種網(wǎng)絡(luò)接口包括兩個分別對應(yīng)于網(wǎng)絡(luò)數(shù)據(jù)發(fā)送和接收速率的監(jiān)控單元,而不僅僅限于兩 種網(wǎng)絡(luò)接口。另外,根據(jù)本發(fā)明的一個實施方式,以洋紅色(其在RGB色彩模式中的值為 (255,0,255))柱子指示網(wǎng)絡(luò)數(shù)據(jù)的發(fā)送速率,而以青色(其在RGB色彩模式中的值為(0, 255,255))柱子指示網(wǎng)絡(luò)數(shù)據(jù)的接收速率。同時,指示網(wǎng)絡(luò)數(shù)據(jù)發(fā)送速率的監(jiān)控單元(如 810和820)中的柱狀圖從中間向上填充(即隨著網(wǎng)絡(luò)數(shù)據(jù)發(fā)送速率的增大,柱子從中間向 上填充),而指示網(wǎng)絡(luò)數(shù)據(jù)接收速率的監(jiān)控單元(如830和840)中的柱狀圖從中間向下填 充(即隨著網(wǎng)絡(luò)數(shù)據(jù)接收速率的增大,柱子從中間向下填充)。圖9示意性地示出了根據(jù)本發(fā)明另一個實施例的機群監(jiān)控接口 900,其類似于圖3 所示的機群監(jiān)控接口 300,但是在圖9中,還示出了另一個機群中的所有節(jié)點,即根據(jù)本發(fā) 明的機群監(jiān)控接口可以將多個節(jié)點監(jiān)控接口根據(jù)相對應(yīng)節(jié)點所述的機群而分組成相應(yīng)的 一個或者多個節(jié)點監(jiān)控接口組,并同時顯示多個機群。圖10示意性地示出了根據(jù)本發(fā)明一個實施例的機群監(jiān)控方法1000的流程圖,該 方法適于監(jiān)控一個或者多個機群的性能,而且每個機群包括多個節(jié)點。如圖10所示,該方法始于步驟S1010,其中對于機群中的每個節(jié)點,提供具有相同布局的相應(yīng)節(jié)點監(jiān)控接口。 隨后,該方法進入步驟S1020,其中為每個節(jié)點監(jiān)控接口提供多個子監(jiān)控部件,其中每個子 監(jiān)控部件對應(yīng)于所述相應(yīng)節(jié)點的某個類別性能。并且在步驟S1030中,為每個子監(jiān)控部件 提供多個監(jiān)控單元,其中每個監(jiān)控單元對應(yīng)于子監(jiān)控部件所對應(yīng)類別性能中的某個性能。 然后在步驟S1040中,在每個監(jiān)控單元中,以柱狀圖形式實時顯示與該監(jiān)控單元相對應(yīng)的 性能指標(biāo)的值,其中柱狀圖中的柱的高度反映了該性能指標(biāo)的大小。利用根據(jù)圖10所述的 方法,可以構(gòu)造一個可以同時顯示機群中所有節(jié)點的重要性能指標(biāo)的機群監(jiān)控接口,從而 便于機群監(jiān)控接口的用戶進行監(jiān)控。通常,在機群監(jiān)控接口中,每個節(jié)點監(jiān)控接口具有相同的背景色,而每個節(jié)點監(jiān)控 接口中的多個子監(jiān)控部件以及子監(jiān)控部件中的監(jiān)控單元可以具有不同的前景色。通過以不 同前景色顯示各個性能指標(biāo),便于機群監(jiān)控接口的用戶根據(jù)某個顏色柱狀圖的長度就可以 判斷出某個相應(yīng)性能指標(biāo)的大小。根據(jù)本發(fā)明的一個實施方式,節(jié)點的性能類別可以包括內(nèi)存類性能、CPU類性 能、存儲類性能和網(wǎng)絡(luò)類性能。而每個節(jié)點監(jiān)控接口的結(jié)構(gòu)可以如上面參考圖4-8所述的 那樣布局。因此,上述為每個節(jié)點監(jiān)控接口提供多個子監(jiān)控部件的步驟S 1020可以包括下 列子步驟即提供用于內(nèi)存類性能的子監(jiān)控部件;提供用于CPU類性能的子監(jiān)控部件;提供 用于存儲類性能的子監(jiān)控部件;以及提供用于網(wǎng)絡(luò)類性能的子監(jiān)控部件。另外,根據(jù)本發(fā)明的方法,還可以根據(jù)節(jié)點的屬性對節(jié)點監(jiān)控接口的位置進行排 列。因此,方法還可以包括步驟根據(jù)相應(yīng)節(jié)點所屬機群而將多個節(jié)點監(jiān)控接口分組成相應(yīng) 的一個或者多個節(jié)點監(jiān)控接口組;以及根據(jù)節(jié)點的屬性對所述一個或者多個節(jié)點監(jiān)控接口 組中的節(jié)點監(jiān)控接口進行排列。本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行 的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實踐中使用 微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的機群監(jiān)控接口中的一些 或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一 部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本 發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣 的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。應(yīng)該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng) 域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中, 不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在 未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這 樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計算機來 實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件 項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為 名稱。
權(quán)利要求
一種機群性能監(jiān)控接口,適于監(jiān)控一個或者多個機群,其中每個機群包括多個節(jié)點,所述機群監(jiān)控接口包括多個節(jié)點監(jiān)控接口,每個節(jié)點監(jiān)控接口對應(yīng)于所述多個節(jié)點中的每個節(jié)點并為相應(yīng)節(jié)點顯示其性能指標(biāo),其中所述多個節(jié)點監(jiān)控接口中的每個節(jié)點監(jiān)控接口包括多個子監(jiān)控部件,每個子監(jiān)控部件包括多個監(jiān)控單元,其中每個子監(jiān)控部件實時顯示所述相應(yīng)節(jié)點的某個類別性能的指標(biāo),而且多個監(jiān)控單元中的每個監(jiān)控單元實時顯示所述類別性能中某個性能的當(dāng)前指標(biāo),其中所述每個監(jiān)控單元都以柱狀圖形式顯示相應(yīng)性能的指標(biāo),所述柱狀圖中的柱高度反映了所述相應(yīng)性能指標(biāo)的大小,以及其中所述每個節(jié)點監(jiān)控接口具有相同的子監(jiān)控部件布局。
2.如權(quán)利要求1所述的機群性能監(jiān)控接口,其中所述每個節(jié)點監(jiān)控接口具有相同的背 景色,而所述每個節(jié)點監(jiān)控接口中的多個子監(jiān)控部件具有不同的前景色。
3.如權(quán)利要求1所述的機群性能監(jiān)控接口,其中所述節(jié)點的性能類別選自包括以下性 能類別的組中的一個或者多個性能類別內(nèi)存類性能、CPU類性能、存儲類性能和網(wǎng)絡(luò)類性 能。
4.如權(quán)利要求3所述的機群性能監(jiān)控接口,其中所述內(nèi)存類性能包括一個或者多個下 述性能內(nèi)存交換分區(qū)的訪問率、內(nèi)存交換分區(qū)的利用率、內(nèi)存訪問率和內(nèi)存利用率;所述CPU類性能包括一個或者多個下述性能節(jié)點中各個CPU核心的CPU利用率、CPU 系統(tǒng)利用率,以及高級性能指標(biāo)代碼綜合效率;所述存儲類性能包括一個或者多個下述性能節(jié)點中各種類型存儲器的存儲器寫入速 率和存儲器讀取速率;以及所述網(wǎng)絡(luò)類性能包括一個或者多個下述性能以太網(wǎng)數(shù)據(jù)發(fā)送速率、以太網(wǎng)數(shù)據(jù)接收 速率、高速互聯(lián)網(wǎng)絡(luò)帶寬數(shù)據(jù)發(fā)送速率以及高速互聯(lián)網(wǎng)絡(luò)帶寬數(shù)據(jù)接收速率。
5.如權(quán)利要求3或者4所述的機群性能監(jiān)控接口,其中所述多個子監(jiān)控部件之一包括 用于CPU類性能的子監(jiān)控部件,其處于節(jié)點監(jiān)控接口的中央?yún)^(qū)域,以及所述用于CPU類性能的子監(jiān)控部件的每個監(jiān)控單元對應(yīng)于相應(yīng)節(jié)點中的每個CPU核 心,且每個監(jiān)控單元以綠色柱子來呈現(xiàn)相應(yīng)CPU核心的CPU利用率。
6.如權(quán)利要求3-5中任一個所述的機群性能監(jiān)控接口,其中所述每個節(jié)點監(jiān)控接口包 括四個子監(jiān)控部件,分別為用于內(nèi)存類性能的子監(jiān)控部件、用于CPU類性能的子監(jiān)控部件、 用于存儲類性能的子監(jiān)控部件以及用于網(wǎng)絡(luò)類性能的子監(jiān)控部件。
7.如權(quán)利要求6所述的機群性能監(jiān)控接口,其中所述用于CPU類性能的子監(jiān)控部件位 于所述節(jié)點監(jiān)控接口的中央,所述用于內(nèi)存類性能的子監(jiān)控部件位于所述用于CPU類性能 的子監(jiān)控部件的左側(cè),所述用于存儲類性能的子監(jiān)控部件位于所述用于內(nèi)存類性能的子監(jiān) 控部件和所述用于CPU類性能的子監(jiān)控部件的下方,以及所述用于網(wǎng)絡(luò)類性能的子監(jiān)控部 件位于所述用于CPU類性能的子監(jiān)控部件和所述用于存儲類性能的子監(jiān)控部件的右側(cè)。
8.如權(quán)利要求7所述的機群性能監(jiān)控接口,其中所述用于內(nèi)存類性能的子監(jiān)控部件包 括分別用于內(nèi)存交換分區(qū)的訪問率和內(nèi)存交換分區(qū)的利用率的監(jiān)控單元,所述用于內(nèi)存交 換分區(qū)的訪問率和內(nèi)存交換分區(qū)的利用率的監(jiān)控單元分別以紅色柱子來呈現(xiàn)內(nèi)存交換分 區(qū)的訪問率和內(nèi)存交換分區(qū)的利用率。
9.如權(quán)利要求1-8中的任一個所述的機群性能監(jiān)控接口,其中所述多個節(jié)點監(jiān)控接口 根據(jù)相對應(yīng)節(jié)點所述的機群而分組成相應(yīng)的一個或者多個節(jié)點監(jiān)控接口組,而且所述一個 或者多個節(jié)點監(jiān)控接口組中的節(jié)點監(jiān)控接口根據(jù)節(jié)點的屬性而進行排列。
10.如權(quán)利要求9所述的機群性能監(jiān)控接口,其中在所述一個或者多個節(jié)點監(jiān)控接口 組中,節(jié)點監(jiān)控接口以行和列的方式排列,并且具有相同節(jié)點屬性的節(jié)點監(jiān)控接口布置在 相同行中。
11.一種適于監(jiān)控一個或者多個機群的機群性能監(jiān)控方法,其中所述每個機群包括多 個節(jié)點,所述方法包括步驟為所述機群中的每個節(jié)點提供具有相同布局的相應(yīng)節(jié)點監(jiān)控接口;為所述相應(yīng)節(jié)點監(jiān)控接口提供多個子監(jiān)控部件,其中每個子監(jiān)控部件對應(yīng)于所述相應(yīng) 節(jié)點的某個類別性能;為所述每個子監(jiān)控部件提供多個監(jiān)控單元,每個監(jiān)控單元對應(yīng)于所述類別性能中的某 個性能;以及在所述每個監(jiān)控單元中,以柱狀圖形式實時顯示所述性能指標(biāo),其中所述柱狀圖中的 柱高度反映了所述性能指標(biāo)的大小。
12.如權(quán)利要求11所述的機群性能監(jiān)控方法,其中所述每個節(jié)點監(jiān)控接口具有相同的 背景色,而所述每個節(jié)點監(jiān)控接口中的多個子監(jiān)控部件具有不同的前景色。
13.如權(quán)利要求11所述的機群性能監(jiān)控方法,其中所述節(jié)點的性能類別選自包括以下 性能類別的組中的一個或者多個性能類別內(nèi)存類性能、CPU類性能、存儲類性能和網(wǎng)絡(luò)類 性能。
14.如權(quán)利要求13所述的機群性能監(jiān)控方法,其中所述內(nèi)存類性能包括一個或者多個 下述性能內(nèi)存交換分區(qū)的訪問率、內(nèi)存交換分區(qū)的利用率、內(nèi)存訪問率和內(nèi)存利用率;所述CPU類性能包括一個或者多個下述性能節(jié)點中各個CPU核心的CPU利用率和CPU 系統(tǒng)利用率;所述存儲類性能包括一個或者多個下述性能節(jié)點中各種類型存儲器的存儲器吸入速 率和存儲器讀取速率;以及所述網(wǎng)絡(luò)類性能包括一個或者多個下述性能以太網(wǎng)數(shù)據(jù)發(fā)送速率、以太網(wǎng)數(shù)據(jù)接收 速率、無線帶寬數(shù)據(jù)發(fā)送速率以及無線帶寬數(shù)據(jù)接收速率。
15.如權(quán)利要求13或者14所述的機群性能監(jiān)控方法,其中所述為所述相應(yīng)節(jié)點監(jiān)控接 口提供多個子監(jiān)控部件的步驟包括提供用于CPU類性能的子監(jiān)控部件,其處于節(jié)點監(jiān)控 接口的中央?yún)^(qū)域,以及所述為所述每個子監(jiān)控部件提供多個監(jiān)控單元的步驟包括為所述用于CPU類性能的 子監(jiān)控部件提供多個監(jiān)控單元,其中所述多個監(jiān)控單元中的每個監(jiān)控單元對應(yīng)于相應(yīng)節(jié)點 中的每個CPU核心,且每個監(jiān)控單元以綠色柱子來呈現(xiàn)相應(yīng)CPU核心的CPU利用率。
16.如權(quán)利要求13-15中任一個所述的機群性能監(jiān)控方法,其中所述為所述相應(yīng)節(jié)點 監(jiān)控接口提供多個子監(jiān)控部件的步驟包括提供用于內(nèi)存類性能的子監(jiān)控部件;提供用于CPU類性能的子監(jiān)控部件;提供用于存儲類性能的子監(jiān)控部件;以及提供用于網(wǎng)絡(luò)類性能的子監(jiān)控部件。
17.如權(quán)利要求16所述的機群性能監(jiān)控方法,其中所述用于CPU類性能的子監(jiān)控部件 位于所述節(jié)點監(jiān)控接口的中央,所述用于內(nèi)存類性能的子監(jiān)控部件位于所述用于CPU類性 能的子監(jiān)控部件的左側(cè),所述用于存儲類性能的子監(jiān)控部件位于所述用于內(nèi)存類性能的子 監(jiān)控部件和所述用于CPU類性能的子監(jiān)控部件的下方,以及所述用于網(wǎng)絡(luò)類性能的子監(jiān)控 部件位于所述用于CPU類性能的子監(jiān)控部件和所述用于存儲類性能的子監(jiān)控部件的右側(cè)。
18.如權(quán)利要求17所述的機群性能監(jiān)控方法,其中所述用于內(nèi)存類性能的子監(jiān)控部件 包括分別用于內(nèi)存交換分區(qū)的訪問率和內(nèi)存交換分區(qū)的利用率的監(jiān)控單元,所述用于內(nèi)存 交換分區(qū)的訪問率和內(nèi)存交換分區(qū)的利用率的監(jiān)控單元分別以紅色柱子來呈現(xiàn)內(nèi)存交換 分區(qū)的訪問率和內(nèi)存交換分區(qū)的利用率。
19.如權(quán)利要求11-18中的任一個所述的機群性能監(jiān)控方法,還包括步驟根據(jù)相應(yīng)節(jié)點所屬機群而將多個節(jié)點監(jiān)控接口分組成相應(yīng)的一個或者多個節(jié)點監(jiān)控 接口組;以及根據(jù)節(jié)點的屬性對所述一個或者多個節(jié)點監(jiān)控接口組中的節(jié)點監(jiān)控接口進行排列。
20.如權(quán)利要求19所述的機群性能監(jiān)控方法,其中在所述一個或者多個節(jié)點監(jiān)控接口 組中,節(jié)點監(jiān)控接口以行和列的方式排列,并且具有相同節(jié)點屬性的節(jié)點監(jiān)控接口布置在 相同行中。
全文摘要
本發(fā)明公開了一種機群性能監(jiān)控接口,適于監(jiān)控一個或者多個機群,其中每個機群包括多個節(jié)點,機群性能監(jiān)控接口包括多個節(jié)點監(jiān)控接口,每個節(jié)點監(jiān)控接口對應(yīng)于每個節(jié)點并為相應(yīng)節(jié)點顯示其性能指標(biāo),其中每個節(jié)點監(jiān)控接口包括多個子監(jiān)控部件,每個子監(jiān)控部件包括多個監(jiān)控單元,其中每個子監(jiān)控部件實時顯示相應(yīng)節(jié)點的某個類別性能的指標(biāo),而且多個監(jiān)控單元中的每個監(jiān)控單元實時顯示該類別性能中某個性能的當(dāng)前指標(biāo),其中每個監(jiān)控單元都以柱狀圖形式顯示相應(yīng)性能的指標(biāo),柱狀圖中的柱高度反映了相應(yīng)性能指標(biāo)的大小,以及其中每個節(jié)點監(jiān)控接口具有相同的子監(jiān)控部件布局。本發(fā)明還公開了相應(yīng)的機群性能監(jiān)控方法。
文檔編號G06F11/30GK101996126SQ20101053399
公開日2011年3月30日 申請日期2010年11月1日 優(yōu)先權(quán)日2010年11月1日
發(fā)明者不公告發(fā)明人 申請人:北京并行科技有限公司