亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

機群網(wǎng)絡(luò)中間代理結(jié)點的選擇方法

文檔序號:6593452閱讀:324來源:國知局
專利名稱:機群網(wǎng)絡(luò)中間代理結(jié)點的選擇方法
技術(shù)領(lǐng)域
本發(fā)明涉及計算機機群網(wǎng)絡(luò)的通信方法,尤其涉及機群網(wǎng)絡(luò)通信中間代理結(jié)點的選擇方法。
計算機機群系統(tǒng)是多臺服務(wù)器(結(jié)點機)組成,它們通過專用高速網(wǎng)絡(luò)聚合在一起,構(gòu)成一個超級服務(wù)器。在實際應(yīng)用中,機群系統(tǒng)的安全穩(wěn)定運行顯得尤為重要,因此,有必要對機群系統(tǒng)中的所有結(jié)點機軟硬件的運行情況進行監(jiān)控,隨時發(fā)現(xiàn)問題,并排除故障,而且,人們更希望把整個機群系統(tǒng)作為一個單一映像進行監(jiān)控。這就需要有一個能夠?qū)φ麄€機群系統(tǒng)進行監(jiān)控的監(jiān)控系統(tǒng)。
目前,經(jīng)常使用的一種監(jiān)控系統(tǒng)采用的通信方案是監(jiān)控主機直接與各個結(jié)點機通信,獲取監(jiān)控信息(如

圖1所示)。先由運行于各結(jié)點機服務(wù)器上的代理程序獲取所在結(jié)點機2的運行狀態(tài)信息,然后直接傳送給監(jiān)控主機1,實現(xiàn)監(jiān)控主機對各服務(wù)器的監(jiān)控。
現(xiàn)有通信方法存在許多明顯的缺陷首先,現(xiàn)有方案僅適用于結(jié)點數(shù)較少的情況,當(dāng)結(jié)點數(shù)目增大到一定數(shù)量時,采用這種直接的通信方式就不能夠滿足要求。例如,所監(jiān)控的機群共有256個結(jié)點,如果采用TCP(傳輸控制協(xié)議)作為底層通信協(xié)議,則監(jiān)控主機需要維持256個TCP連接,這會占用大量的系統(tǒng)資源,甚至根本不能實現(xiàn)。如果采用UDP(用戶數(shù)據(jù)報協(xié)議)作為底層通信協(xié)議,則監(jiān)控主機有可能在同一時間收到大量的UDP包,一旦監(jiān)控主機未能及時處理這些包,就很有可能出現(xiàn)丟包情況,即出現(xiàn)丟失監(jiān)控信息的情況。對于這種情況,目前還沒有較好的解決辦法。
其次,監(jiān)控系統(tǒng)作為機群系統(tǒng)的重要組成部分,是作為后臺服務(wù)運行的,它不能占用過多的系統(tǒng)資源而影響機群系統(tǒng)的其他應(yīng)用的運行。而按照現(xiàn)有的監(jiān)控系統(tǒng)通信方案,監(jiān)控系統(tǒng)的運行會占用大量的系統(tǒng)資源,從而干擾機群系統(tǒng)的正常運行。為此,需要一種新的實現(xiàn)方式,盡可能地少占用系統(tǒng)資源,使得監(jiān)控系統(tǒng)在整個機群系統(tǒng)中的運行開銷降至最低。
再次,現(xiàn)有監(jiān)控系統(tǒng)的通信方案不能很好地保證對各個結(jié)點數(shù)據(jù)采集的同步性,也就是說,不能同步地對各個結(jié)點機在同一時刻的運行情況進行收集。這樣,就不能夠客觀、準(zhǔn)確地了解機群系統(tǒng)的整體運行情況,而且也不能體現(xiàn)整個機群系統(tǒng)的單一映像特征。
基于現(xiàn)有監(jiān)控系統(tǒng)通信方案的上述缺陷,我們迫切需要一種新的技術(shù)解決方案,能夠適用于多結(jié)點的大型機群系統(tǒng),在不占用過多的系統(tǒng)資源的前提下,同步地對各個結(jié)點機的運行情況進行監(jiān)控。而且,新的解決方案應(yīng)當(dāng)能夠保證監(jiān)控系統(tǒng)安全、穩(wěn)定地運行。
本發(fā)明的另外一個目的在于提供一種機群監(jiān)控系統(tǒng)中間代理結(jié)點的選擇方法。
本發(fā)明的再一個目的在于提供一種在中間代理結(jié)點失效時自動替換的方法。
本發(fā)明的進一步目的在于提供一種能夠安全穩(wěn)定運行的監(jiān)控網(wǎng)絡(luò)。
本發(fā)明是一種解決機群監(jiān)控網(wǎng)絡(luò)中間代理結(jié)點選擇的方法,該方法包括將被監(jiān)控機群的所有結(jié)點機分為若干個組,在各結(jié)點機上運行一個結(jié)點采集模塊,負(fù)責(zé)對結(jié)點數(shù)據(jù)的采集,在每個節(jié)點機上都運行中間代理模塊,使中間代理模塊可以運行于兩種狀態(tài),在系統(tǒng)啟動時,對中間代理結(jié)點進行初始設(shè)置,在系統(tǒng)運行過程中,如果出現(xiàn)中間代理模塊失效,進行動態(tài)的替換。
圖1表示現(xiàn)有監(jiān)控網(wǎng)絡(luò)的結(jié)構(gòu)。
圖2表示根據(jù)本發(fā)明的分級監(jiān)控網(wǎng)絡(luò)的通信結(jié)構(gòu)。
圖3表示根據(jù)本發(fā)明的分級監(jiān)控網(wǎng)絡(luò)引入中間代理結(jié)點選擇方法后的通信結(jié)構(gòu)。
圖4表示根據(jù)本發(fā)明的系統(tǒng)啟動時的NP配置過程。
圖5表示根據(jù)本發(fā)明的系統(tǒng)運行過程中的NP替換過程。
其中,BSP負(fù)責(zé)在需要了解機群系統(tǒng)運行狀態(tài)時發(fā)出數(shù)據(jù)采集命令,然后等待并接收由結(jié)點機返回的數(shù)據(jù),對其進行匯總和分析處理;NP負(fù)責(zé)在收到來自BSP的采集命令后,將采集命令傳送給該組中所有結(jié)點機的NA模塊,然后等待并接收NA模塊返回的數(shù)據(jù),將其匯總后統(tǒng)一發(fā)送給BSP;NA則負(fù)責(zé)周期性地采集所在結(jié)點機的運行狀態(tài)數(shù)據(jù),并在收到采集命令后立即返回最新一次的采集數(shù)據(jù)。
在一次信息采集過程中,BSP通過UDP廣播方式把采集命令發(fā)送到所有的NP,NP收到采集命令后,再通過UDP廣播方式把命令發(fā)送到所在組中所有NA。運行于各結(jié)點機上NA周期性地采集所在結(jié)點機的運行狀態(tài)數(shù)據(jù),當(dāng)收到所在組中某個結(jié)點機上的NP發(fā)出的采集命令時,就將數(shù)據(jù)傳遞給該NP,再由NP把收集到的數(shù)據(jù)統(tǒng)一傳遞給監(jiān)控主機上運行的BSP。監(jiān)控主機上運行的BSP接到各個NP傳來的所有結(jié)點機的運行狀態(tài)數(shù)據(jù),進行匯總和分析,實現(xiàn)對整個機群的監(jiān)控。
采用這種分級策略,結(jié)點代理模塊在整個監(jiān)控網(wǎng)絡(luò)中起著關(guān)鍵作用,如果某個結(jié)點代理模塊由于意外原因不能正常工作,監(jiān)控主機就不能及時獲得相應(yīng)組所有結(jié)點的運行狀態(tài)數(shù)據(jù)。
可見,需要進一步解決兩個問題第一,對代理結(jié)點(運行結(jié)點代理模塊的結(jié)點)的選擇,第二,如果代理結(jié)點本身出現(xiàn)故障而不能繼續(xù)行使代理功能,選出新的代理結(jié)點。
本發(fā)明在于讓中間代理模塊NP可以運行于兩種狀態(tài)使能狀態(tài)(NPenable)和禁止?fàn)顟B(tài)(NPdisable)。
如圖3所示,在監(jiān)控主機上運行著基本服務(wù)模塊(BSP)11,所有的結(jié)點機分為m個組12,每個組中有n個結(jié)點機,在各個組中,每個結(jié)點機上都同時運行著結(jié)點采集模塊(NA)13和結(jié)點代理模塊NP(包括運行于使能狀態(tài)的NPenable21和禁止?fàn)顟B(tài)的NPdisable22),但是,在每個組中,只有一個結(jié)點機上運行的NP處于使能狀態(tài),即NPenable。
在一次信息采集過程中,BSP通過UDP廣播方式把采集命令發(fā)送到所有的NPenable,NPenable收到采集命令后,再通過UDP廣播方式把命令發(fā)送到所在組中所有NA。運行于各結(jié)點機上NA周期性地采集所在結(jié)點機的運行狀態(tài)數(shù)據(jù),當(dāng)收到所在組的NPenable發(fā)出的采集命令時,就將數(shù)據(jù)傳遞給該NPenable,再由NPenable把收集到的數(shù)據(jù)統(tǒng)一傳遞給監(jiān)控主機上運行的BSP。監(jiān)控主機上運行的BSP接到各個NPenable傳來的所有結(jié)點機的運行狀態(tài)數(shù)據(jù),進行匯總和分析,實現(xiàn)對整個機群的監(jiān)控。
根據(jù)以上說明,我們可以看出,只有處于使能狀態(tài)的NP(即NPenable)才真正行使中間代理結(jié)點的職能,負(fù)責(zé)在BSP與NP之間傳遞命令和數(shù)據(jù)。如果NPenable所在結(jié)點機出現(xiàn)意外情況,導(dǎo)致該NPenable無法正常工作(我們稱之為NP失效),監(jiān)控系統(tǒng)就無法對該NPenable所在組的結(jié)點機進行監(jiān)控。
本發(fā)明著眼于不同情況下對NP兩種運行狀態(tài)的轉(zhuǎn)換來實現(xiàn)中間代理結(jié)點的自動選擇和替換。
中間代理結(jié)點的自動選擇,需要綜合兩種情況,一種是監(jiān)控系統(tǒng)啟動時的NPenable選擇,另一種是監(jiān)控系統(tǒng)運行過程中NPenable的替換。下面結(jié)合附圖詳細(xì)說明對NPenable選擇和替換的方法一、系統(tǒng)啟動時的NPenable選擇。
如圖4所示,監(jiān)控系統(tǒng)啟動時,每個結(jié)點機上都運行NA、NP兩個模塊。所有NP模塊處于初始化狀態(tài),向BSP發(fā)送心跳信息。BSP記下每組結(jié)點中第一個心跳的NP,并把它作為該組結(jié)點的NPenable,然后,以廣播方式發(fā)出NP配置命令31,通知該組中所有的NP。被選擇的NP改變其狀態(tài)為使能狀態(tài)NPenable,并向BSP發(fā)出NP配置響應(yīng)32,其它NP改變其狀態(tài)為禁止?fàn)顟B(tài)。NPenable進一步以廣播方式向該組中所有NA發(fā)出NP配置通告,告知NPenable所在的位置。
二、監(jiān)控系統(tǒng)運行過程中的NPenable替換。
在監(jiān)控系統(tǒng)運行過程中,如果NPenable所在結(jié)點機出現(xiàn)故障,可能會導(dǎo)致NPenable不能完成既定功能。因此,要求系統(tǒng)能夠及時檢測出NP失效的情況,并選出新的NPenable。
處于使能狀態(tài)的NP(即NPenable)會不停地向BSP發(fā)送心跳信息,而處于禁止?fàn)顟B(tài)的NP(即NPdisable)不向BSP發(fā)送心跳信息。這樣,BSP能夠隨時與各組結(jié)點中的NPenable保持聯(lián)系。一旦某組結(jié)點中的NPenable失效,BSP就會迅速得知這一情況,并按下述過程進行NP選擇。
如圖5所示,BSP要在某組結(jié)點中選出新的NPenable,首先向該組中所有NP模塊發(fā)送NP選擇命令35。每個NP模塊(不管其是否處于使能狀態(tài))都向BSP發(fā)送NP選擇響應(yīng)36,BSP記下第一個發(fā)送響應(yīng)的NP,把它作為該組結(jié)點的NPenable,然后以廣播方式發(fā)送NP配置命令31,通知該組中的所有NP。被選擇作為NPenable的NP模塊改變其狀態(tài)為使能狀態(tài),并向BSP發(fā)出NP配置響應(yīng)32,其它NP模塊改變其狀態(tài)為禁止?fàn)顟B(tài)(如果原來處于使能狀態(tài))或者保持其禁止?fàn)顟B(tài)。接下來,新的NPenable進一步以廣播方式向該組中所有NA模塊發(fā)送NP配置通告33,告知NPenable所在的位置。
我們不難看出,根據(jù)本發(fā)明的方法,監(jiān)控系統(tǒng)可以實現(xiàn)對大型機群系統(tǒng)的監(jiān)控。而且,在監(jiān)控系統(tǒng)啟動時,能夠自動進行中間代理結(jié)點的選擇,而在在監(jiān)控系統(tǒng)運行過程中,當(dāng)中間代理結(jié)點出現(xiàn)故障而不能完成既定功能時,也同樣能夠選擇出新的中間代理結(jié)點,從而保證監(jiān)控系統(tǒng)的穩(wěn)定運行。
顯然,關(guān)于各種程序的內(nèi)部結(jié)構(gòu),本技術(shù)領(lǐng)域的技術(shù)人員根據(jù)本發(fā)明對其編程是很容易的,這里就不再贅述。
本領(lǐng)域的技術(shù)人員可以對本發(fā)明的計算機機群通信的方法和系統(tǒng)進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權(quán)利要求
1.一種機群網(wǎng)絡(luò)通信中間代理結(jié)點選擇的方法,該方法包括如下步驟在各結(jié)點機上運行一個結(jié)點采集模塊,負(fù)責(zé)對結(jié)點數(shù)據(jù)的采集;在每個結(jié)點機上都運行中間代理模塊;使中間代理模塊可以運行于兩種狀態(tài);在系統(tǒng)啟動時,對中間代理結(jié)點進行初始設(shè)置;在系統(tǒng)運行過程中,如果出現(xiàn)中間代理模塊失效,進行動態(tài)的替換。
2.如權(quán)利要求1所述的中間代理結(jié)點選擇的方法,所述使中間代理模塊可以運行于兩種狀態(tài)包括步驟使中間代理模塊處于使能狀態(tài)或禁止?fàn)顟B(tài),處于使能狀態(tài)的中間代理模塊所在結(jié)點為當(dāng)前的中間代理結(jié)點,負(fù)責(zé)在監(jiān)控主機和各結(jié)點機之間傳遞命令和數(shù)據(jù)。
3.如權(quán)利要求1所述的中間代理結(jié)點選擇的方法,所述對中間代理結(jié)點進行初始設(shè)置包括步驟監(jiān)控主機向各個中間代理模塊發(fā)出設(shè)置命令,各個中間代理模塊返回設(shè)置回應(yīng),被設(shè)置為使能狀態(tài)的中間代理模塊向該組內(nèi)各結(jié)點采集模塊發(fā)出設(shè)置通告。
4.如權(quán)利要求1所述的中間代理結(jié)點選擇的方法,所述進行動態(tài)替換包括步驟監(jiān)控主機向各個中間代理模塊發(fā)出選擇命令,各個中間代理模塊返回選擇回應(yīng),監(jiān)控主機向各個中間代理模塊發(fā)出設(shè)置命令,各個中間代理模塊返回設(shè)置回應(yīng),被設(shè)置為使能狀態(tài)的中間代理模塊向該組內(nèi)各結(jié)點采集模塊發(fā)出設(shè)置通告。
5.如權(quán)利要求1、2、3、4中的任一個的中間代理結(jié)點選擇的方法,進一步包括步驟將所述機群分的節(jié)點機為若干組,每個組內(nèi)建立一個所述中間代理模塊。
全文摘要
一種機群網(wǎng)絡(luò)通信的方法。本網(wǎng)絡(luò)通信的方法引入了中間代理結(jié)點。在系統(tǒng)啟動時,能夠自動進行中間代理結(jié)點的選擇,而在系統(tǒng)運行過程中,當(dāng)中間代理結(jié)點出現(xiàn)故障而不能完成既定功能時,也同樣能夠選擇出新的中間代理結(jié)點。
文檔編號G06F11/30GK1466055SQ0214216
公開日2004年1月7日 申請日期2002年8月27日 優(yōu)先權(quán)日2002年6月10日
發(fā)明者程菊生, 吳雪麗, 胡毅, 金正操, 顧光導(dǎo) 申請人:聯(lián)想(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1