專利名稱:機(jī)群操作系統(tǒng)高可用內(nèi)核系統(tǒng)及其構(gòu)造方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)系統(tǒng)技術(shù)領(lǐng)域,特別涉及機(jī)群操作系統(tǒng)高可用內(nèi)核系統(tǒng)及其構(gòu)造方法。
背景技術(shù):
機(jī)群自問世以來,以其良好的可擴(kuò)展性和富有競爭力的性能/價(jià)格比迅速成為高性能計(jì)算的主流體系結(jié)構(gòu),其應(yīng)用也遍布因特網(wǎng)服務(wù)、數(shù)據(jù)庫服務(wù)等商業(yè)領(lǐng)域。
機(jī)群操作系統(tǒng)建立在結(jié)點(diǎn)操作系統(tǒng)基礎(chǔ)之上,為普通用戶、軟件開發(fā)者和系統(tǒng)管理員提供單一系統(tǒng)映像支撐,是機(jī)群最基本的系統(tǒng)軟件集。早期研制的機(jī)群操作系統(tǒng)軟件基本上是獨(dú)立、分離的,各軟件只實(shí)現(xiàn)一個(gè)或有限的幾個(gè)功能,如作業(yè)管理軟件、系統(tǒng)監(jiān)控軟件等。當(dāng)用這些軟件構(gòu)造機(jī)群服務(wù)器時(shí),會(huì)導(dǎo)致如下問題的出現(xiàn)●功能冗余,系統(tǒng)龐雜,效率低●各軟件難以實(shí)現(xiàn)彼此的互操作●缺少一致的系統(tǒng)概念,各軟件間有不一致情況出現(xiàn)●缺少通用性上述問題在Beowulf系統(tǒng)(通過網(wǎng)絡(luò)把計(jì)算機(jī)連接起來,形成機(jī)群,它的性能可比大型計(jì)算機(jī),但是花費(fèi)只有大型計(jì)算機(jī)的一小部分。美國宇航局的科學(xué)家于1994年最先創(chuàng)造了這樣一個(gè)系統(tǒng),他們把它命名為Beowulf。)上表現(xiàn)得最為明顯。Beowulf就是商品化組件加上開發(fā)源代碼的機(jī)群功能軟件,它是多個(gè)獨(dú)立的機(jī)群功能軟件的簡單“收集”和“堆砌”,彼此間難以互操作,不是一個(gè)集成的、一體化的機(jī)群操作系統(tǒng)軟件。
這種通過多個(gè)子系統(tǒng)堆集的機(jī)群功能軟件的引導(dǎo)、運(yùn)行和維護(hù)依賴于系統(tǒng)管理員的大量時(shí)間的觀察、需要長時(shí)間的經(jīng)驗(yàn)積累,方可使系統(tǒng)高效而不出錯(cuò)的運(yùn)行。尤其在大規(guī)模機(jī)群操作系統(tǒng)引導(dǎo)過程中,因?yàn)槎鄠€(gè)子系統(tǒng)建立在成百上千個(gè)節(jié)點(diǎn)操作系統(tǒng)的基礎(chǔ)上。系統(tǒng)成功地引導(dǎo)基本上依賴于系統(tǒng)管理員的經(jīng)驗(yàn),這使得系統(tǒng)管理員不僅要記住很多復(fù)雜的命令,而且要保證系統(tǒng)引導(dǎo)的正確性,而這種正確性只能通過試錯(cuò)法得到保障。
在系統(tǒng)運(yùn)行過程中,需要系統(tǒng)管理員不斷介入,了解機(jī)群各個(gè)節(jié)點(diǎn)的運(yùn)行狀態(tài)、網(wǎng)絡(luò)狀態(tài)以及分散在各個(gè)節(jié)點(diǎn)上的子系統(tǒng)精靈程序(Daemon)的狀態(tài)。系統(tǒng)程序員只有不斷了解各種狀態(tài),采取正確的措施,整個(gè)機(jī)群系統(tǒng)才能正確的運(yùn)行。如實(shí)時(shí)的監(jiān)測節(jié)點(diǎn)的狀態(tài),在節(jié)點(diǎn)死亡后,重起節(jié)點(diǎn)以及節(jié)點(diǎn)上的精靈程序。因此高可用性是機(jī)群系統(tǒng)的一個(gè)重要要求。
一個(gè)高可用的機(jī)群操作系統(tǒng)要求自身是高可靠的同時(shí),必需能在機(jī)群系統(tǒng)失效時(shí)及時(shí)探測和修復(fù)失效。機(jī)群系統(tǒng)的失效主要包括應(yīng)用失效、節(jié)點(diǎn)失效和網(wǎng)絡(luò)失效。應(yīng)用的失效需要應(yīng)用本身提供失效的處理,而如果機(jī)群操作系統(tǒng)能夠及時(shí)提供節(jié)點(diǎn)失效和網(wǎng)絡(luò)失效信息,應(yīng)用從而能對(duì)失效情況做一個(gè)完整的判斷。因此,在機(jī)群操作系統(tǒng)中實(shí)現(xiàn)及時(shí)的節(jié)點(diǎn)運(yùn)行狀態(tài)和節(jié)點(diǎn)網(wǎng)絡(luò)狀態(tài)的探測,可以為上層模塊提供可靠而及時(shí)的失效信息,從而保證機(jī)群操作系統(tǒng)是高可靠的。當(dāng)系統(tǒng)出現(xiàn)故障時(shí),系統(tǒng)管理員能夠及時(shí)的獲取故障信息,并分析故障原因,有利于及時(shí)排除故障。位于機(jī)群操作系統(tǒng)之上的應(yīng)用程序可以及時(shí)的得知失效信息,并利用自己的失效處理機(jī)制,進(jìn)行必要的處理,保證應(yīng)用的正常執(zhí)行。
無論是從系統(tǒng)實(shí)現(xiàn)還是從系統(tǒng)管理的角度來說,機(jī)群操作系統(tǒng)都需要有一個(gè)高可用內(nèi)核系統(tǒng),它覆蓋了機(jī)群操作系統(tǒng)核心的最小功能子集,并且提供統(tǒng)一而標(biāo)準(zhǔn)的接口給上層子系統(tǒng)使用?,F(xiàn)有的機(jī)群操作系統(tǒng)缺少一個(gè)高可用的內(nèi)核,而停留在多個(gè)子系統(tǒng)的堆積和疊加上,結(jié)果導(dǎo)致功能冗余、效率較低,缺少一種有效的容錯(cuò)(fault-tolerant)機(jī)制保證機(jī)群系統(tǒng)長時(shí)間的運(yùn)行,而過多地依賴于系統(tǒng)管理員的工作。而系統(tǒng)管理員可能因?yàn)槭д`或者判斷錯(cuò)誤,而在系統(tǒng)中引入新的錯(cuò)誤。這限制了機(jī)群系統(tǒng)在對(duì)可靠性要求較高的商業(yè)環(huán)境中的應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明的目的是設(shè)計(jì)機(jī)群操作系統(tǒng)高可用內(nèi)核系統(tǒng)及其構(gòu)造方法,實(shí)現(xiàn)機(jī)群操作系統(tǒng)高可用內(nèi)核的自主引導(dǎo),為機(jī)群操作系統(tǒng)提供一種容錯(cuò)的運(yùn)行機(jī)制,從而降低系統(tǒng)管理的復(fù)雜性,減輕系統(tǒng)管理員的負(fù)擔(dān)。本發(fā)明的具體方案如下機(jī)群操作系統(tǒng)內(nèi)核是機(jī)群操作系統(tǒng)的核心部分,本方法構(gòu)造的機(jī)群操作系統(tǒng)高可用內(nèi)核包括偵測服務(wù)裝置、組服務(wù)裝置、事件管理裝置、高可用服務(wù)裝置、配置服務(wù)裝置五個(gè)裝置組成。
本發(fā)明提出了機(jī)群操作系統(tǒng)高可用內(nèi)核系統(tǒng)及其構(gòu)造方法,高可用內(nèi)核系統(tǒng)包括偵測、組服務(wù)、事件管理、高可用服務(wù)、配置服務(wù)這五個(gè)服務(wù)裝置。偵測服務(wù)裝置提供了機(jī)群范圍內(nèi)一致的結(jié)點(diǎn)死活、網(wǎng)絡(luò)連通度以及應(yīng)用狀態(tài)信息;組服務(wù)裝置本身形成組,它基于偵測服務(wù)裝置提供的信息,進(jìn)行自身的日常性的高可用管理,并且向上層應(yīng)用組提供創(chuàng)建服務(wù)組、備份以及相應(yīng)的通信支持。事件管理服務(wù)裝置基于組服務(wù)裝置創(chuàng)建,它提供了事件產(chǎn)生者和消費(fèi)者的注冊(cè)、事件的過濾、事件的發(fā)送。高可用服務(wù)裝置負(fù)責(zé)特定服務(wù)的探測,并且在服務(wù)失效后重起它。在機(jī)群引導(dǎo)過程中,組服務(wù)裝置和偵測服務(wù)裝置依次通過配置服務(wù)裝置提供的接口獲取基本信息后啟動(dòng),啟動(dòng)成功后向配置服務(wù)裝置發(fā)送成功啟動(dòng)的消息。此后,在組服務(wù)裝置基礎(chǔ)上創(chuàng)建的事件管理服務(wù)裝置啟動(dòng)。在事件管理服務(wù)裝置成功啟動(dòng)后,高可用服務(wù)裝置完成自身的啟動(dòng)。配置服務(wù)裝置在獲得事件管理服務(wù)裝置成功啟動(dòng)的消息后,開始向高可用服務(wù)裝置發(fā)送注冊(cè)請(qǐng)求,直到注冊(cè)成功,自身變?yōu)楦呖捎梅?wù),自此機(jī)群高可用內(nèi)核完成了自動(dòng)引導(dǎo)。
本發(fā)明的效果體現(xiàn)在機(jī)群操作系統(tǒng)高可用內(nèi)核結(jié)構(gòu)清晰,功能劃分明確,易于實(shí)現(xiàn)和保證正確性;該方法構(gòu)造的機(jī)群操作系統(tǒng)高可用內(nèi)核具有高可靠性;該方法實(shí)現(xiàn)了內(nèi)核的自動(dòng)引導(dǎo),提高了機(jī)群操作系統(tǒng)的自主性和靈活性,較輕了系統(tǒng)管理員的負(fù)擔(dān)。
圖1是本發(fā)明的機(jī)群操作系統(tǒng)高可用內(nèi)核系統(tǒng)結(jié)構(gòu)圖。
圖2是本發(fā)明的事件管理服務(wù)裝置的工作機(jī)制圖。
圖3是本發(fā)明的配置服務(wù)裝置的工作機(jī)制示意圖。
圖4是本發(fā)明的組服務(wù)裝置和偵測服務(wù)裝置的啟動(dòng)過程示意圖。
圖5是本發(fā)明的偵測服務(wù)裝置和組服務(wù)裝置啟動(dòng)成功后的示意圖。
圖6是本發(fā)明的事件管理服務(wù)裝置的啟動(dòng)過程示意圖。
圖7是本發(fā)明的事件管理服務(wù)裝置啟動(dòng)成功后的示意圖。
圖8是本發(fā)明的配置服務(wù)裝置向高可用服務(wù)裝置注冊(cè),完成角色轉(zhuǎn)換過程的示意圖。
圖9是本發(fā)明的機(jī)群高可用內(nèi)核的引導(dǎo)過程示意圖。
具體實(shí)施例方式
圖1中,機(jī)群操作系統(tǒng)內(nèi)核是機(jī)群操作系統(tǒng)的核心部分,機(jī)群操作系統(tǒng)高可用內(nèi)核系統(tǒng)包括偵測服務(wù)裝置1、組服務(wù)裝置2、事件管理服務(wù)裝置3、高可用服務(wù)服務(wù)裝置4以及配置服務(wù)裝置5五個(gè)部分。偵測服務(wù)裝置1提供了機(jī)群范圍內(nèi)一致的結(jié)點(diǎn)死活、網(wǎng)絡(luò)連通度以及進(jìn)程狀態(tài)信息,是機(jī)群操作系統(tǒng)的基礎(chǔ),這個(gè)裝置能夠準(zhǔn)確的探測失效,并針對(duì)失效區(qū)分節(jié)點(diǎn)失效、網(wǎng)絡(luò)不通、進(jìn)程死亡三種情況,為機(jī)群高可用內(nèi)核和高可用應(yīng)用的開發(fā)提供基礎(chǔ)。組服務(wù)裝置2本身形成組,它基于一致的結(jié)點(diǎn)死活和網(wǎng)絡(luò)連通度信息,進(jìn)行自身的日常性的高可用管理,并且向上層應(yīng)用組提供創(chuàng)建服務(wù)組、備份以及相應(yīng)的通信支持。事件管理服務(wù)裝置3基于組服務(wù)裝置創(chuàng)建,它提供了事件產(chǎn)生者和消費(fèi)者的注冊(cè)、事件的過濾、事件的發(fā)送,通過事件管理服務(wù)裝置3可以及時(shí)把失效事件通知上層模塊。高可用服務(wù)裝置4負(fù)責(zé)特定服務(wù)(如配置服務(wù)裝置5)的探測,并且在服務(wù)失效后重起它。
圖2中,帶箭頭的虛線表示事件類型注冊(cè),對(duì)于事件提供者來說,就是產(chǎn)生的事件類型的注冊(cè),對(duì)于事件消費(fèi)者來說,就是感興趣的事件類型。帶箭頭的實(shí)線表示推送事件,對(duì)于事件提供者來說,是將事件推送到事件管理服務(wù)裝置3,對(duì)于事件管理服務(wù)裝置來說,是將事件推送到事件消費(fèi)者。
事件管理服務(wù)裝置3基于組服務(wù)裝置創(chuàng)建,它提供了事件產(chǎn)生者和消費(fèi)者的注冊(cè)、事件的過濾、事件的發(fā)送,通過事件管理服務(wù)裝置3,組服務(wù)裝置2可以及時(shí)把失效事件通知上層模塊。
圖3中,配置服務(wù)裝置5在機(jī)群操作系統(tǒng)引導(dǎo)成功后,通過向高可用服務(wù)裝置注冊(cè),變成高可用服務(wù)后,長時(shí)間地向其他子系統(tǒng)提供機(jī)群配置信息。但是在機(jī)群啟動(dòng)之初,配置服務(wù)裝置5有特殊的作用,本方法通過配置服務(wù)裝置實(shí)現(xiàn)機(jī)群高可用內(nèi)核的引導(dǎo)。
機(jī)群啟動(dòng)時(shí),配置服務(wù)裝置5通過數(shù)據(jù)庫6讀取相關(guān)的數(shù)據(jù)庫文件,將物理分區(qū)信息存入內(nèi)存7。
圖4中,機(jī)群高可用內(nèi)核的組服務(wù)裝置2以及偵測服務(wù)裝置1通過配置服務(wù)裝置5提供的接口獲取信息而啟動(dòng),啟動(dòng)成功后給配置服務(wù)裝置5發(fā)送成功消息。
圖5中,是組服務(wù)裝置2和偵測服務(wù)裝置1啟動(dòng)成功后的示意圖。D(Detector的簡稱)是偵測服務(wù)裝置1,gsd(group service daemon的簡稱)是組服務(wù)裝置2。偵測服務(wù)裝置1定期(每5秒鐘一次)通過所有的網(wǎng)絡(luò)向組服務(wù)裝置2發(fā)送消息包,組服務(wù)裝置2檢查所收到的消息包的時(shí)間標(biāo)記來判斷偵測服務(wù)裝置1所在節(jié)點(diǎn)和各套網(wǎng)絡(luò)的狀態(tài)。圖6中,此后,在組服務(wù)裝置2基礎(chǔ)上創(chuàng)建的事件管理服務(wù)裝置3啟動(dòng),事件管理服務(wù)裝置3啟動(dòng)成功后,向配置服務(wù)裝置5發(fā)送成功啟動(dòng)的消息。
圖7中,gsd是組服務(wù)裝置2,ES是事件管理服務(wù)裝置3。圖7是在組服務(wù)裝置2的基礎(chǔ)上創(chuàng)建事件管理服務(wù)裝置3應(yīng)用組成功后的物理部署圖。組服務(wù)裝置2將它管理的節(jié)點(diǎn)狀態(tài)和網(wǎng)絡(luò)狀態(tài)傳送給事件管理服務(wù)裝置3,而事件管理服務(wù)裝置3也定期(每5秒鐘一次)向組服務(wù)裝置2發(fā)送消息包,組服務(wù)管理裝置2通過檢查事件管理服務(wù)裝置3發(fā)送的時(shí)間標(biāo)記來判斷事件管理服務(wù)裝置3的狀態(tài),如果它失效,則在該節(jié)點(diǎn)上重起。
圖8中,配置服務(wù)裝置5在獲得事件管理服務(wù)裝置3成功啟動(dòng)的消息之后,即向高可用服務(wù)裝置4發(fā)送注冊(cè)為高可用服務(wù)的請(qǐng)求,如果收到注冊(cè)成功的返回信息,則整個(gè)機(jī)群操作系統(tǒng)的高可用內(nèi)核引導(dǎo)成功。如果收到的是注冊(cè)出錯(cuò)的返回信息,配置服務(wù)裝置5認(rèn)為高可用服務(wù)裝置4尚未就緒,間隔一段時(shí)間重發(fā)請(qǐng)求,直到返回注冊(cè)成功為止。至此,機(jī)群高可用內(nèi)核完成了自動(dòng)引導(dǎo),在此基礎(chǔ)上的機(jī)群系統(tǒng)軟件和充分利用機(jī)群特性的商業(yè)應(yīng)用軟件得到了穩(wěn)定的高可用支持。同時(shí),配置服務(wù)裝置5本身也實(shí)現(xiàn)了從啟動(dòng)引導(dǎo)角色到高可用服務(wù)角色的自動(dòng)轉(zhuǎn)換。
圖9中,描述了機(jī)群高可用內(nèi)核由不穩(wěn)定狀態(tài)變?yōu)榉€(wěn)定狀態(tài)的引導(dǎo)過程的流程圖步驟1啟動(dòng)配置服務(wù)裝置5,系統(tǒng)管理員創(chuàng)建配置信息;步驟2啟動(dòng)組服務(wù)裝置2,獲取基本配置信息,成功后向配置服務(wù)裝置報(bào)告;步驟3在組服務(wù)裝置2的基礎(chǔ)上,啟動(dòng)偵測服務(wù)裝置1,獲取基本配置信息,成功后向配置服務(wù)裝置報(bào)告;步驟4在組服務(wù)裝置2的基礎(chǔ)上,創(chuàng)建事件管理服務(wù)裝置3組,獲取基本配置信息,成功后向配置服務(wù)裝置報(bào)告;步驟5在事件管理服務(wù)裝置的基礎(chǔ)上,啟動(dòng)高可用服務(wù)裝置4,獲取基本配置信息,成功后向配置服務(wù)裝置報(bào)告;步驟6高可用服務(wù)裝置4啟動(dòng)成功后,配置服務(wù)裝置5向高可用服務(wù)裝置4注冊(cè)為高可用服務(wù);步驟7配置服務(wù)裝置5向高可用服務(wù)裝置4成功注冊(cè)為高可用服務(wù)后,機(jī)群高可用內(nèi)核變?yōu)榉€(wěn)定狀態(tài)。
權(quán)利要求
1.一種構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,將高可用內(nèi)核分為偵測、組服務(wù)、事件管理、高可用服務(wù)、配置服務(wù)這五個(gè)服務(wù)裝置,其特征在于,在高可用內(nèi)核引導(dǎo)過程中,高可用內(nèi)核根據(jù)組服務(wù)、偵測、事件管理以及高可用服務(wù)的先后次序,依次通過配置服務(wù)裝置提供的接口獲取基本信息,完成啟動(dòng);在四個(gè)服務(wù)裝置完成引導(dǎo)后,配置管理服務(wù)裝置向高可用服務(wù)裝置注冊(cè),注冊(cè)成功后配置服務(wù)裝置完成角色轉(zhuǎn)換,機(jī)群高可用內(nèi)核從不穩(wěn)定狀態(tài)變?yōu)榉€(wěn)定狀態(tài)。
2.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于,定義了機(jī)群操作系統(tǒng)高可用內(nèi)核的概念。
3.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于,定義了機(jī)群操作系統(tǒng)高可用內(nèi)核的層次結(jié)構(gòu)。
4.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于將高可用內(nèi)核分為偵測、組服務(wù)、事件管理、高可用服務(wù)、配置服務(wù)這五個(gè)服務(wù)裝置。
5.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核引導(dǎo)方法,其特征在于定義了機(jī)群操作系統(tǒng)高可用內(nèi)核的服務(wù)裝置之間的相互關(guān)系。
6.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于,偵測服務(wù)裝置提供了機(jī)群范圍內(nèi)一致的結(jié)點(diǎn)死活和網(wǎng)絡(luò)連通度以及應(yīng)用狀態(tài)信息;
7.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于,組服務(wù)裝置本身形成組。
8.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于,組服務(wù)裝置基于偵測服務(wù)裝置提供的信息,進(jìn)行自身的日常性的高可用管理
9.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于,組服務(wù)裝置向上層應(yīng)用組提供創(chuàng)建服務(wù)組、備份以及相應(yīng)的通信支持。
10.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于事件管理服務(wù)裝置基于組服務(wù)裝置創(chuàng)建。
11.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于,事件管理服務(wù)裝置提供了事件產(chǎn)生者和消費(fèi)者的注冊(cè)、事件的過濾、事件的發(fā)送。
12.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于高可用服務(wù)裝置基于事件管理服務(wù)裝置創(chuàng)建。
13.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于,高可用服務(wù)裝置負(fù)責(zé)特定服務(wù)的探測,并且在服務(wù)失效后重起它。
14.如權(quán)利要求1所述的機(jī)群操作系統(tǒng)高可用內(nèi)核引導(dǎo)方法,其特征在于配置服務(wù)裝置為整個(gè)機(jī)群提供了主動(dòng)智能的信息服務(wù)。
15.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于配置服務(wù)裝置在機(jī)群操作系統(tǒng)高可用內(nèi)核中的特殊地位,即機(jī)群啟動(dòng)過程中的引導(dǎo)地位和機(jī)群穩(wěn)定運(yùn)行時(shí)的高可用服務(wù)提供者地位。
16.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于定義了高可用內(nèi)核的引導(dǎo)次序依次為組服務(wù)、偵測、事件管理以及高可用服務(wù)。
17.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于在高可用內(nèi)核引導(dǎo)過程中,定義了每個(gè)引導(dǎo)過程的前提條件,如事件管理服務(wù)裝置引導(dǎo)的前提條件是組服務(wù)裝置的引導(dǎo)成功。
18.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于組服務(wù)、偵測、事件管理以及高可用服務(wù)裝置完成引導(dǎo)后,配置管理服務(wù)裝置向高可用服務(wù)裝置注冊(cè)申請(qǐng)成為高可用服務(wù)。
19.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于定義了機(jī)群引導(dǎo)過程成功的臨界點(diǎn)。
20.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于配置管理服務(wù)裝置注冊(cè)成功為高可用服務(wù)之后,機(jī)群成功完成引導(dǎo),可用內(nèi)核從不穩(wěn)定狀態(tài)變?yōu)榉€(wěn)定狀態(tài)。
21.如權(quán)利要求1所述的構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,其特征在于機(jī)群引導(dǎo)過程成功的臨界點(diǎn)是配置管理服務(wù)完成高可用服務(wù)注冊(cè)。
22.如權(quán)利要求1所述的機(jī)群操作系統(tǒng)高可用內(nèi)核引導(dǎo)方法,其特征在于配置服務(wù)裝置在機(jī)群運(yùn)行的過程中扮演不同的角色。
23.如權(quán)利要求1所述的機(jī)群操作系統(tǒng)高可用內(nèi)核引導(dǎo)方法,其特征在于配置服務(wù)裝置本身在高可用內(nèi)核引導(dǎo)成功前后的角色自動(dòng)轉(zhuǎn)換。
24.如權(quán)利要求1所述的機(jī)群操作系統(tǒng)高可用內(nèi)核引導(dǎo)方法,其特征在于配置服務(wù)裝置在高可用內(nèi)核引導(dǎo)成功前扮演引導(dǎo)角色。
25.如權(quán)利要求1所述的機(jī)群操作系統(tǒng)高可用內(nèi)核引導(dǎo)方法,其特征在于配置服務(wù)裝置在高可用內(nèi)核引導(dǎo)成功后扮演高可用服務(wù)提供者角色。
26.一種構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核系統(tǒng),機(jī)群操作系統(tǒng)由高可用內(nèi)核的偵測服務(wù)裝置、組服務(wù)裝置、事件管理服務(wù)裝置、高可用服務(wù)裝置裝置、配置服務(wù)裝置組成,其中,偵測服務(wù)裝置用于提供了機(jī)群范圍內(nèi)一致的結(jié)點(diǎn)死活、網(wǎng)絡(luò)連通度以及應(yīng)用狀態(tài)信息; 組服務(wù)裝置,基于偵測服務(wù)裝置提供的信息,進(jìn)行自身的日常性的高可用管理,并且向上層應(yīng)用組提供創(chuàng)建服務(wù)組、備份以及相應(yīng)的通信支持;事件管理服務(wù)裝置,用于組服務(wù)裝置創(chuàng)建,提供事件產(chǎn)生者和消費(fèi)者的注冊(cè)、事件的過濾、事件的發(fā)送;高可用服務(wù)裝置,用于負(fù)責(zé)特定服務(wù)的探測,并且在服務(wù)失效后重起,配置服務(wù)裝置,用于通過數(shù)據(jù)庫讀取相關(guān)的數(shù)據(jù)庫文件,將物理分區(qū)信息存入內(nèi)存,其特征在于,配置服務(wù)裝置連接于高可用服務(wù)裝置,而偵測服務(wù)裝置連接于組服務(wù)裝置和配置服務(wù)裝置,組服務(wù)裝置連接于事件管理服務(wù)裝置和配置服務(wù)裝置,事件管理服務(wù)裝置連接于高可用服務(wù)裝置裝置。
27.一種構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核系統(tǒng)的方法,其步驟如下步驟1啟動(dòng)配置服務(wù)裝置5,系統(tǒng)管理員創(chuàng)建配置信息;步驟2啟動(dòng)組服務(wù)裝置2,獲取基本配置信息,成功后向配置服務(wù)裝置報(bào)告;步驟3在組服務(wù)裝置2的基礎(chǔ)上,啟動(dòng)偵測服務(wù)裝置1,獲取基本配置信息,成功后向配置服務(wù)裝置報(bào)告;步驟4在組服務(wù)裝置2的基礎(chǔ)上,創(chuàng)建事件管理服務(wù)裝置3組,獲取基本配置信息,成功后向配置服務(wù)裝置報(bào)告;步驟5在事件管理服務(wù)裝置的基礎(chǔ)上,啟動(dòng)高可用服務(wù)裝置4,獲取基本配置信息,成功后向配置服務(wù)裝置報(bào)告;步驟6高可用服務(wù)裝置4啟動(dòng)成功后,配置服務(wù)裝置5向高可用服務(wù)裝置4注冊(cè)為高可用服務(wù);步驟7配置服務(wù)裝置5向高可用服務(wù)裝置4成功注冊(cè)為高可用服務(wù)后,機(jī)群高可用內(nèi)核變?yōu)榉€(wěn)定狀態(tài)。
全文摘要
一種構(gòu)造機(jī)群操作系統(tǒng)高可用內(nèi)核的方法,將高可用內(nèi)核分為偵測、組服務(wù)、事件管理、高可用服務(wù)這四個(gè)服務(wù)裝置。在高可用內(nèi)核引導(dǎo)過程中,高可用內(nèi)核根據(jù)組服務(wù)、偵測、事件管理以及高可用服務(wù)的先后次序,依次通過配置服務(wù)裝置提供的接口獲取基本信息,完成引導(dǎo);在四個(gè)服務(wù)裝置完成引導(dǎo)后,配置管理服務(wù)裝置向高可用服務(wù)裝置注冊(cè),注冊(cè)成功后配置服務(wù)裝置完成角色轉(zhuǎn)換,機(jī)群高可用內(nèi)核從不穩(wěn)定狀態(tài)變?yōu)榉€(wěn)定狀態(tài)。采用該方法構(gòu)造的機(jī)群操作系統(tǒng)內(nèi)核具有高可靠性,由于實(shí)現(xiàn)了內(nèi)核的自動(dòng)引導(dǎo),提高了機(jī)群操作系統(tǒng)的自主性和靈活性,減輕了系統(tǒng)管理員的負(fù)擔(dān)。
文檔編號(hào)G06F9/445GK1545027SQ20031011838
公開日2004年11月10日 申請(qǐng)日期2003年11月25日 優(yōu)先權(quán)日2003年11月25日
發(fā)明者詹劍鋒, 韋華穎, 陳熠, 劉建華, 孟丹 申請(qǐng)人:中國科學(xué)院計(jì)算技術(shù)研究所