集群中自動發(fā)現(xiàn)節(jié)點的方法
【專利摘要】本發(fā)明涉及集群中自動發(fā)現(xiàn)節(jié)點的方法,首先在集群中的各個節(jié)點安裝DHCP服務(wù),然后啟動集群內(nèi)的一個節(jié)點,設(shè)置成DHCP服務(wù)器,并將所述節(jié)點作為Active節(jié)點,再啟動集群中的其他節(jié)點,設(shè)置成DHCP客戶端,并將所述節(jié)點作為普通節(jié)點;當有新的普通節(jié)點啟動時,Active節(jié)點為該普通節(jié)點分配IP,同時檢查該普通節(jié)點的硬件配置,若硬件配置與Active節(jié)點不同,則標記其狀態(tài),并在集群運行過程中不向該普通節(jié)點分配任務(wù);若硬件配置與Active節(jié)點相同,則在集群內(nèi)增加該普通節(jié)點;當有普通節(jié)點在運行過程中發(fā)生故障時,Active節(jié)點將該普通節(jié)點標記為不可用狀態(tài),同時備份該普通節(jié)點上的所有數(shù)據(jù)。與現(xiàn)有技術(shù)相比,本發(fā)明能夠提高集群穩(wěn)定性,減輕維護人員的工作量,提高工作效率。
【專利說明】集群中自動發(fā)現(xiàn)節(jié)點的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息【技術(shù)領(lǐng)域】,尤其是涉及一種集群中自動發(fā)現(xiàn)節(jié)點的方法。
【背景技術(shù)】
[0002]當前是一個信息化的社會,而計算機則成為信息傳播的主流載體。計算機作為新興電子產(chǎn)品已經(jīng)走進大多數(shù)企業(yè)和家庭,成為辦公和生活中不可或缺的一部分。那么如何保證企業(yè)和個人計算機的速度和穩(wěn)定性,則成為保證工作效率和生活水平的關(guān)鍵。
[0003]集群是一種計算機系統(tǒng),它由一組松散集成的計算機軟件或硬件連接起來,高度緊密地協(xié)作完成計算工作。在某種意義上,他們可以被看作是一臺計算機。集群中的單個計算機通常稱為節(jié)點,集群通過局域網(wǎng)連接,也支持其它的連接方式。集群通常用來改進單個計算機的計算速度和數(shù)據(jù)流的負載均衡。集群以其極快的計算速度和低廉的價格,受到企業(yè)的親睞,正在企業(yè)中普及開來。
[0004]集群是由節(jié)點組成的一個龐大的系統(tǒng),,其節(jié)點數(shù)量從幾臺到幾百臺甚至上千臺不等,那如何講集群中的所有計算機組成一個有序工作的系統(tǒng),并保證系統(tǒng)的穩(wěn)定性和速率。則成為大多數(shù)企業(yè)需要考慮的問題。目前大多數(shù)企業(yè)采取的方法是,系統(tǒng)維護人員將節(jié)點一一啟動,并逐個針對接點進行配置,配置節(jié)點中的網(wǎng)絡(luò),保證不沖突并且各節(jié)點在同一網(wǎng)絡(luò)中,配置環(huán)境等。該方法加重了維護人員的負擔,當網(wǎng)絡(luò)出現(xiàn)故障或者特殊情況時,需要重新配置,工作效率低下,并且加重了維護人員的工作。影響了企業(yè)的工作效率,若使用超級計算機,又增加了企業(yè)的成本造成不必要的浪費,并且在超級計算機故障后,超級計算機中的數(shù)據(jù)會丟失給企業(yè)造成不可估量的損失。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種集群中自動發(fā)現(xiàn)節(jié)點的方法。
[0006]本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):
[0007]一種集群中自動發(fā)現(xiàn)節(jié)點的方法,首先在集群中的各個節(jié)點安裝DHCP服務(wù),然后啟動集群內(nèi)的一個節(jié)點,設(shè)置成DHCP服務(wù)器,并將所述節(jié)點作為Active節(jié)點,再啟動集群中的其他節(jié)點,設(shè)置成DHCP客戶端,并將所述節(jié)點作為普通節(jié)點;
[0008]當有新的普通節(jié)點啟動時,Active節(jié)點為該普通節(jié)點分配IP,同時檢查該普通節(jié)點的硬件配置,若硬件配置與Active節(jié)點不同,則標記其狀態(tài),并且在集群運行過程中不向該普通節(jié)點分配任務(wù);若硬件配置與Active節(jié)點相同,則在集群內(nèi)增加該普通節(jié)點;
[0009]當有普通節(jié)點在運行過程中發(fā)生故障時,Active節(jié)點將該普通節(jié)點標記為不可用狀態(tài),同時備份該普通節(jié)點上的所有數(shù)據(jù)。
[0010]Active節(jié)點為該普通節(jié)點分配IP時,將其IP與Mac地址綁定。
[0011]Active節(jié)點普通節(jié)點的硬件配置,包括檢查網(wǎng)卡數(shù)量以及是否含有綁定網(wǎng)卡。
[0012]與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:[0013]1.由于采用了自動發(fā)現(xiàn)節(jié)點的方法,方便快捷,減輕了集群管理人員的工作任務(wù),做到了成本低,效率高。
[0014]2.將集群中的多個節(jié)點由Active節(jié)點即DHCP服務(wù)端統(tǒng)一管理普通節(jié)點即DHCP客戶端,由ACTIVE節(jié)點統(tǒng)一進行負載均衡,數(shù)據(jù)分流等操作大大提高了集群的效率。集群中的節(jié)點越多,這種優(yōu)勢越明顯。
[0015]3.在集群的發(fā)現(xiàn)節(jié)點的過程中,多數(shù)情況下由程序自動執(zhí)行,無需人工干預,不影響集群正常運轉(zhuǎn),不需要復雜的配置和額外的工具,因此本方案具有易操作、易維護的特點。
[0016]4.本發(fā)明不僅適用于不同品牌的服務(wù)器平臺,對于各種虛擬機也同樣適用因此具有很好的硬件平臺適應性。得益于DHCP服務(wù),該服務(wù)的穩(wěn)定性極高,可以保證集群在長時間高負荷穩(wěn)定工作,減少了維護集群系統(tǒng)時對用戶業(yè)務(wù)的影響。
[0017]5.在集群運行過程中,普通節(jié)點的網(wǎng)卡故障或者內(nèi)存已滿,此時Active節(jié)點能自動監(jiān)控到該變化,并且將該節(jié)點的狀態(tài)置為不可用狀態(tài),并且在其他普通節(jié)點上快速備份該故障節(jié)點的所有數(shù)據(jù),保證集群的高可用,做到數(shù)據(jù)的完整不丟失。
[0018]6.當企業(yè)或者個人為了提升集群的運算速率或者容量時增加一臺節(jié)點時,本發(fā)明可以快速發(fā)現(xiàn)節(jié)點方便集群擴容。
【專利附圖】
【附圖說明】
[0019]圖1為當前集群中僅有一個Active節(jié)點時發(fā)現(xiàn)新節(jié)點的示意圖;
[0020]圖2為當前集群中包含Active節(jié)點和多個普通節(jié)點時發(fā)現(xiàn)新節(jié)點的示意圖;
[0021]圖3為圖1所示情況下Active節(jié)點檢測到不同硬件配置的普通節(jié)點的示意圖;
[0022]圖4為圖2所示情況下Active節(jié)點檢測到不同硬件配置的普通節(jié)點的示意圖。
【具體實施方式】
[0023]下面結(jié)合附圖和具體實施例對本發(fā)明進行詳細說明。
[0024]實施例
[0025]本發(fā)明提供了一種集群中自動發(fā)現(xiàn)節(jié)點的方法,主要利用DHCP方式給集群中的每一個配置一個固定IP,并保證IP可用不沖突,在集群的運行過程中,IP唯一且不變,做到節(jié)點的即插即用,并且在節(jié)點的硬件發(fā)生故障時,保證數(shù)據(jù)的不流失,其主要步驟包括:
[0026]1、在集群中的各個節(jié)點安裝DHCP服務(wù),DHCP是Dynamic Host ConfigurationProtlcol的縮寫,它是TCP / IP協(xié)議族的一種,主要用來給網(wǎng)絡(luò)客戶機分配分配IP地址。并根據(jù)企業(yè)需要安裝其他安裝軟件,包括系統(tǒng)軟件,應用軟件等,并檢查安裝是否正確保證安裝軟件可用。
[0027]2、啟動集群中的一個節(jié)點,并設(shè)置成DHCP服務(wù)器,并給該啟動節(jié)點配置可用的IP和掩碼,保證其能工作,將所述節(jié)點作為Active節(jié)點。
[0028]3、啟動集群中的其他節(jié)點,設(shè)置成DHCP客戶端,并將所述節(jié)點作為普通節(jié)點。
[0029]4、當有新的普通節(jié)點啟動時,若此時集群中僅有Active節(jié)點一個,則該普通節(jié)點被發(fā)現(xiàn),如圖1所示:若此時集群中以有多個普通節(jié)點被發(fā)現(xiàn),則會逐一發(fā)現(xiàn)這些待發(fā)現(xiàn)的普通節(jié)點,如圖2所示。在發(fā)現(xiàn)普通節(jié)點后,Active節(jié)點會為該普通節(jié)點分配IP,將其IP與Mac地址綁定,避免出現(xiàn)IP沖突以及IP重復等問題。同時檢查該普通節(jié)點的硬件配置,包括檢查網(wǎng)卡數(shù)量以及是否含有綁定網(wǎng)卡,如圖3和圖4所示。若硬件配置與Active節(jié)點不同,則標記其狀態(tài),并且在集群運行過程中不向該普通節(jié)點分配任務(wù);若硬件配置與Active節(jié)點相同,則在集群內(nèi)增加該普通節(jié)點。
[0030]5、當有普通節(jié)點在運行過程中發(fā)生故障時,Active節(jié)點將該普通節(jié)點標記為不可用狀態(tài),同時備份該普通節(jié)點上的所有數(shù)據(jù),保證整個集群的數(shù)據(jù)完整性。
[0031]采用本發(fā)明的方法,能夠自動發(fā)現(xiàn)集群中的節(jié)點,自動配置集群中的節(jié)點,從而在不過分需要人工干預的條件下實現(xiàn)集群的功能,保證集群節(jié)點正常工作,減輕維護人員的工作量,提高集群的效率。
【權(quán)利要求】
1.一種集群中自動發(fā)現(xiàn)節(jié)點的方法,其特征在于,首先在集群中的各個節(jié)點安裝DHCP服務(wù),然后啟動集群內(nèi)的一個節(jié)點,設(shè)置成DHCP服務(wù)器,并將所述節(jié)點作為Active節(jié)點,再啟動集群中的其他節(jié)點,設(shè)置成DHCP客戶端,并將所述節(jié)點作為普通節(jié)點; 當有新的普通節(jié)點啟動時,Active節(jié)點為該普通節(jié)點分配IP,同時檢查該普通節(jié)點的硬件配置,若硬件配置與Active節(jié)點不同,則標記其狀態(tài),并且在集群運行過程中不向該普通節(jié)點分配任務(wù);若硬件配置與Active節(jié)點相同,則在集群內(nèi)增加該節(jié)點; 當有普通節(jié)點在運行過程中發(fā)生故障時,Active節(jié)點將該普通節(jié)點標記為不可用狀態(tài),同時備份該普通節(jié)點上的所有數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的一種集群中自動發(fā)現(xiàn)節(jié)點的方法,其特征在于,Active節(jié)點為該普通節(jié)點分配IP時,將其IP與Mac地址綁定。
3.根據(jù)權(quán)利要求1所述的一種集群中自動發(fā)現(xiàn)節(jié)點的方法,其特征在于,Active節(jié)點普通節(jié)點的硬件配置,包括檢查網(wǎng)卡數(shù)量以及是否含有綁定網(wǎng)卡。
【文檔編號】H04L12/24GK103618634SQ201310674137
【公開日】2014年3月5日 申請日期:2013年12月11日 優(yōu)先權(quán)日:2013年12月11日
【發(fā)明者】趙亞萍 申請人:上海愛數(shù)軟件有限公司