一種高可用集群資源監(jiān)控方法
【技術領域】
[0001]本發(fā)明涉及Iinux操作系統(tǒng)下高可用集群資源的監(jiān)控技術領域,特別涉及一種高可用集群資源監(jiān)控方法。
【背景技術】
[0002]信息化建設的不斷推進,各個企事業(yè)單位的活動越來越多的依賴于其關鍵的業(yè)務信息系統(tǒng),這些業(yè)務信息系統(tǒng)對整個機構的運營和發(fā)展起著至關重要的作用,一旦發(fā)生宕機故障或應用停機,將給機構帶來巨大的經濟損失。
[0003]可見,對那些需要保障信息安全和提供不間斷的信息服務的機構來說,業(yè)務系統(tǒng)的容錯性和不間斷性顯得尤為重要。如何保障各種關鍵應用持續(xù)運營,達到永續(xù)經營的良性循環(huán),已成為當今企事業(yè)單位和IT領域急需解決的關鍵問題,計算資源的高可用變得越來越重要。尤其目前隨著國產化的推進,在國產平臺上實現(xiàn)高可用集群變得越來越重要。
[0004]針對國產平臺上高可用集群的管理,為了實現(xiàn)不間斷信息服務,保障信息安全,本發(fā)明提出了一種高可用集群資源監(jiān)控方法。
【發(fā)明內容】
[0005]本發(fā)明為了彌補現(xiàn)有技術的缺陷,提供了一種安全穩(wěn)定、高效的高可用集群資源監(jiān)控方法。
[0006]本發(fā)明是通過如下技術方案實現(xiàn)的:
一種高可用集群資源監(jiān)控方法,其特征在于:所述基于國產平臺的集群節(jié)點上修改、編譯并安裝有心跳軟件,集群資源層軟件和集群圖形化管理軟件;同時,在基于國產平臺的集群中設置主節(jié)點,備份節(jié)點,管理節(jié)點和監(jiān)控節(jié)點,所述備份節(jié)點隨時和主節(jié)點保持信息同步,當主節(jié)點發(fā)生宕機故障時,所述備份節(jié)點及時接管主節(jié)點工作;所述管理節(jié)點負責收集各監(jiān)控節(jié)點的發(fā)送的狀態(tài)信息,將狀態(tài)變化信息發(fā)送給其他各節(jié)點,還根據整個集群中的負載情況進行決策處理,通知實施引擎進行迀移;所述監(jiān)控節(jié)點負責接收狀態(tài)信息。
[0007]所述圖形化集群管理軟件用于在主節(jié)點服務器上部署并啟動國產平臺的浮動IP、Apache服務、MySql數(shù)據庫服務、IP-San存儲服務等服務。
[0008]所述高可用集群即支持單活-主從模式,又支持雙活-主從模式,所述單活-主從模式是指主節(jié)點處于工作狀態(tài),而備用節(jié)點處于備用狀態(tài),所述雙活-主從模式是指主節(jié)點和備用節(jié)點均處于工作狀態(tài)。
[0009]本發(fā)明高可用集群資源監(jiān)控方法,包括以下步驟:
(1)在國產平臺上修改、編譯、安裝心跳軟件并進行,集群管理軟件和圖形化集群管理軟件,使其可以運行在國產平臺上;
(2)修改集群配置文件/etc/hosts,添加主節(jié)點,備份節(jié)點以及其IP等信息;
(3)配置ssh,在本地創(chuàng)建密鑰,并在備份節(jié)點上安裝ssh密鑰;
(4)主節(jié)點上心跳軟件發(fā)出心跳,修改主節(jié)點的配置文件,并將配置文件傳送至備份節(jié)占.(5)所述監(jiān)控節(jié)點監(jiān)聽到國產平臺主節(jié)點上心跳軟件發(fā)出的心跳,當所述監(jiān)控節(jié)點監(jiān)聽到心跳時,開始監(jiān)控狀態(tài)信息,否則通知所述備份節(jié)點接管主節(jié)點工作;
(6)當所述監(jiān)控節(jié)點監(jiān)測到狀態(tài)信息變更時,將狀態(tài)信息保存到該節(jié)點上的CIB文件中,并將狀態(tài)信息發(fā)送給管理節(jié)點;當所述監(jiān)控節(jié)點沒有監(jiān)測到狀態(tài)信息變更時,則返回步驟(5),監(jiān)聽心跳;
(7)所述管理節(jié)點接收到監(jiān)控節(jié)點的發(fā)送的狀態(tài)信息后,保存變更信息,并打包發(fā)送給各節(jié)點將狀態(tài)變化信息發(fā)送給其他各節(jié)點,并根據整個集群中的負載情況進行決策處理,通知實施引擎進行迀移;
(8)所述監(jiān)控節(jié)點返回步驟(5),繼續(xù)監(jiān)聽心跳,否則結束進程。
[0010]本發(fā)明的有益效果是:該高可用集群資源監(jiān)控方法,使備份節(jié)點隨時和主節(jié)點保持信息同步,當主節(jié)點發(fā)生宕機故障時,備份節(jié)點能夠及時接管主節(jié)點工作,能夠保障國產平臺上各種關鍵應用的信息安全和不間斷持續(xù)運營,實現(xiàn)永續(xù)經營的良性循環(huán)。
【附圖說明】
[0011]附圖1為高可用集群資源監(jiān)控流程示意圖;
附圖2為本發(fā)明單活模式集群部署示意圖;
附圖3為本發(fā)明Ν+Μ多節(jié)點集群部署示意圖。
【具體實施方式】
[0012]附圖為本發(fā)明的一種具體實施例,下面結合附圖對本發(fā)明進行詳細說明。
[0013]該高可用集群資源監(jiān)控方法,所述基于國產平臺的集群節(jié)點上修改、編譯并安裝有心跳軟件,集群資源層軟件和集群圖形化管理軟件;同時,在基于國產平臺的集群中設置主節(jié)點,備份節(jié)點,管理節(jié)點和監(jiān)控節(jié)點,所述備份節(jié)點隨時和主節(jié)點保持信息同步,當主節(jié)點發(fā)生宕機故障時,所述備份節(jié)點及時接管主節(jié)點工作;所述管理節(jié)點負責收集各監(jiān)控節(jié)點的發(fā)送的狀態(tài)信息,將狀態(tài)變化信息發(fā)送給其他各節(jié)點,還根據整個集群中的負載情況進行決策處理,通知實施引擎進行迀移;所述監(jiān)控節(jié)點負責接收狀態(tài)信息。
[0014]所述圖形化集群管理軟件用于在主節(jié)點服務器上部署并啟動國產平臺的浮動ΙΡ、Apache服務、MySql數(shù)據庫服務、IP-San存儲服務等服務。
[0015]所述高可用集群即支持單活-主從模式,又支持雙活-主從模式,所述單活-主從模式是指主節(jié)點處于工作狀態(tài),而備用節(jié)點處于備用狀態(tài),所述雙活-主從模式是指主節(jié)點和備用節(jié)點均處于工作狀態(tài)。
[0016]本發(fā)明高可用集群資源監(jiān)控方法,包括以下步驟:
(1)在國產平臺上修改、編譯、安裝心跳軟件并進行,集群管理軟件和圖形化集群管理軟件,使其可以運行在國產平臺上;
(2)修改集群配置文件/etc/hosts,添加主節(jié)點,備份節(jié)點以及其IP等信息;
(3)配置ssh,在本地創(chuàng)建密鑰,并在備份節(jié)點上安裝ssh密鑰;
(4)主節(jié)點上心跳軟件發(fā)出心跳,修改主節(jié)點的配置文件,并將配置文件傳送至備份節(jié)占.V, (5)所述監(jiān)控節(jié)點監(jiān)聽到國產平臺主節(jié)點上心跳軟件發(fā)出的心跳,當所述監(jiān)控節(jié)點監(jiān)聽到心跳時,開始監(jiān)控狀態(tài)信息,否則通知所述備份節(jié)點接管主節(jié)點工作;
(6)當所述監(jiān)控節(jié)點監(jiān)測到狀態(tài)信息變更時,將狀態(tài)信息保存到該節(jié)點上的CIB文件中,并將狀態(tài)信息發(fā)送給管理節(jié)點;當所述監(jiān)控節(jié)點沒有監(jiān)測到狀態(tài)信息變更時,則返回步驟(5),監(jiān)聽心跳;
(7)所述管理節(jié)點接收到監(jiān)控節(jié)點的發(fā)送的狀態(tài)信息后,保存變更信息,并打包發(fā)送給各節(jié)點將狀態(tài)變化信息發(fā)送給其他各節(jié)點,并根據整個集群中的負載情況進行決策處理,通知實施引擎進行迀移;
(8)所述監(jiān)控節(jié)點返回步驟(5),繼續(xù)監(jiān)聽心跳,否則結束進程。
[0017]在國產平臺上,實現(xiàn)高可用集群資源監(jiān)控,主要是監(jiān)控各集群節(jié)點的狀態(tài)及集群節(jié)點上的浮動IP、Apache服務、Drbd存儲、IP-San存儲、Orcal數(shù)據庫、Mysql數(shù)據庫等資源狀態(tài)。
[0018]所述高可用集群采用單活-主從模式,包括2臺國產服務器和I個共享存儲,I臺國產服務器作為主節(jié)點,I臺國產服務器作為從節(jié)點。所述單活模式(Active/Passive)集群可改為雙活(Active/Active),如附圖3所示,還支持N+1和N+M等多節(jié)點集群備份模式。
【主權項】
1.一種高可用集群資源監(jiān)控方法,其特征在于:所述基于國產平臺的集群節(jié)點上修改、編譯并安裝有心跳軟件,集群資源層軟件和集群圖形化管理軟件;同時,在基于國產平臺的集群中設置主節(jié)點,備份節(jié)點,管理節(jié)點和監(jiān)控節(jié)點,所述備份節(jié)點隨時和主節(jié)點保持信息同步,當主節(jié)點發(fā)生宕機故障時,所述備份節(jié)點及時接管主節(jié)點工作;所述管理節(jié)點負責收集各監(jiān)控節(jié)點的發(fā)送的狀態(tài)信息,將狀態(tài)變化信息發(fā)送給其他各節(jié)點,還根據整個集群中的負載情況進行決策處理,通知實施引擎進行迀移;所述監(jiān)控節(jié)點負責接收狀態(tài)信息。2.根據權利要求1所述的高可用集群資源監(jiān)控方法,其特征在于:所述圖形化集群管理軟件用于在主節(jié)點服務器上部署并啟動國產平臺的浮動IP、Apache服務、MySql數(shù)據庫服務、IP-San存儲服務等服務。3.根據權利要求1所述的高可用集群資源監(jiān)控方法,其特征在于:所述高可用集群即支持單活-主從模式,又支持雙活-主從模式,所述單活-主從模式是指主節(jié)點處于工作狀態(tài),而備用節(jié)點處于備用狀態(tài),所述雙活-主從模式是指主節(jié)點和備用節(jié)點均處于工作狀??τ O4.根據權利要求1所述的高可用集群資源監(jiān)控方法,其特征在于包括以下步驟: (1)在國產平臺上修改、編譯、安裝心跳軟件并進行,集群管理軟件和圖形化集群管理軟件,使其可以運行在國產平臺上; (2)修改集群配置文件/etc/hosts,添加主節(jié)點,備份節(jié)點以及其IP等信息; (3)配置ssh,在本地創(chuàng)建密鑰,并在備份節(jié)點上安裝ssh密鑰; (4)主節(jié)點上心跳軟件發(fā)出心跳,修改主節(jié)點的配置文件,并將配置文件傳送至備份節(jié)占.V, (5)所述監(jiān)控節(jié)點監(jiān)聽到國產平臺主節(jié)點上心跳軟件發(fā)出的心跳,當所述監(jiān)控節(jié)點監(jiān)聽到心跳時,開始監(jiān)控狀態(tài)信息,否則通知所述備份節(jié)點接管主節(jié)點工作; (6)當所述監(jiān)控節(jié)點監(jiān)測到狀態(tài)信息變更時,將狀態(tài)信息保存到該節(jié)點上的CIB文件中,并將狀態(tài)信息發(fā)送給管理節(jié)點;當所述監(jiān)控節(jié)點沒有監(jiān)測到狀態(tài)信息變更時,則返回步驟(5),監(jiān)聽心跳; (7)所述管理節(jié)點接收到監(jiān)控節(jié)點的發(fā)送的狀態(tài)信息后,保存變更信息,并打包發(fā)送給各節(jié)點將狀態(tài)變化信息發(fā)送給其他各節(jié)點,并根據整個集群中的負載情況進行決策處理,通知實施引擎進行迀移; (8)所述監(jiān)控節(jié)點返回步驟(5),繼續(xù)監(jiān)聽心跳,否則結束進程。
【專利摘要】本發(fā)明特別涉及一種高可用集群資源監(jiān)控方法。該高可用集群資源監(jiān)控方法,所述基于國產平臺的集群節(jié)點上修改、編譯并安裝有心跳軟件,集群資源層軟件和集群圖形化管理軟件;同時,在基于國產平臺的集群中設置主節(jié)點,備份節(jié)點,管理節(jié)點和監(jiān)控節(jié)點,所述備份節(jié)點隨時和主節(jié)點保持信息同步,當主節(jié)點發(fā)生宕機故障時,所述備份節(jié)點及時接管主節(jié)點工作。該高可用集群資源監(jiān)控方法,使備份節(jié)點隨時和主節(jié)點保持信息同步,當主節(jié)點發(fā)生宕機故障時,備份節(jié)點能夠及時接管主節(jié)點工作,能夠保障國產平臺上各種關鍵應用的信息安全和不間斷持續(xù)運營,實現(xiàn)永續(xù)經營的良性循環(huán)。
【IPC分類】H04L29/08, H04L12/26, H04L12/24
【公開號】CN105141456
【申請?zhí)枴緾N201510525461
【發(fā)明人】于麗, 趙瑞東, 吳登勇, 王則陸
【申請人】山東超越數(shù)控電子有限公司
【公開日】2015年12月9日
【申請日】2015年8月25日