專利名稱:集群系統(tǒng)的系統(tǒng)結(jié)構(gòu)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息技術(shù),特別涉及一種集群系統(tǒng)的新型系統(tǒng)結(jié)構(gòu)。
圖1所示為傳統(tǒng)集群系統(tǒng)的系統(tǒng)結(jié)構(gòu)。在該圖中,傳統(tǒng)集群系統(tǒng)中的集群服務(wù)是實現(xiàn)于系統(tǒng)中的操作系統(tǒng)之上的。系統(tǒng)硬件是節(jié)點系統(tǒng)的硬件部分,如系統(tǒng)主板;操作系統(tǒng)就是傳統(tǒng)的操作系統(tǒng);集群服務(wù)位于操作系統(tǒng)之上,提供與集群相關(guān)的服務(wù);集群應(yīng)用則位于傳統(tǒng)操作系統(tǒng)與集群服務(wù)之上,從而可以利用兩者所提供的服務(wù);網(wǎng)絡(luò)應(yīng)用位于傳統(tǒng)操作系統(tǒng)。
雖然降低了集群服務(wù)的實現(xiàn)難度,這種系統(tǒng)結(jié)構(gòu)給集群系統(tǒng)的實現(xiàn)、管理、部署等方面都帶來了許多問題。在實際應(yīng)用中,這些集群系統(tǒng)普遍存在著以下的問題●集群服務(wù)與網(wǎng)絡(luò)應(yīng)用共享同一個CPU。
■當(dāng)忙于處理用戶請求時,節(jié)點系統(tǒng)就難以有效地支持集群服務(wù),使得所需的集群服務(wù)不能及時完成,而產(chǎn)生集群系統(tǒng)管理的誤動作;■節(jié)點系統(tǒng)主要服務(wù)于服務(wù)用戶請求,而且經(jīng)常較為繁忙。集群軟件使得已經(jīng)超載的節(jié)點系統(tǒng)更加繁忙。
●集群服務(wù)運行于并依賴于傳統(tǒng)操作系統(tǒng)。
■集群軟件的可移植性大大降低;■很難支持異構(gòu)的集群系統(tǒng)(支持不同的操作系統(tǒng))。
●集群系統(tǒng)的管理及相關(guān)服務(wù)部署較為困難。
■當(dāng)集群系統(tǒng)中的各個節(jié)點系統(tǒng)需要協(xié)作時,各節(jié)點系統(tǒng)采用緊密耦合方式。這使得集群系統(tǒng)的部署,特別是系統(tǒng)升級及配置變更需同步完成。
●相對簡單的實現(xiàn)導(dǎo)致節(jié)點系統(tǒng)不了解整個集群系統(tǒng)中的資源狀況。從而使共享集群系統(tǒng)資源非常困難。雖有一些集群系統(tǒng)支持系統(tǒng)資源共享,其實現(xiàn)往往過于復(fù)雜。
為了徹底解決以上的問題,我們需要重新設(shè)計一種新型的集群系統(tǒng)的系統(tǒng)結(jié)構(gòu)。傳統(tǒng)集群系統(tǒng)的諸多問題的根源在于其系統(tǒng)結(jié)構(gòu)。如圖2所示,正確的邏輯關(guān)系為網(wǎng)絡(luò)應(yīng)用依賴于傳統(tǒng)操作系統(tǒng);集群應(yīng)用依賴于傳統(tǒng)操作系統(tǒng)和集群服務(wù);傳統(tǒng)操作系統(tǒng)依賴于集群服務(wù);集群服務(wù)依賴于系統(tǒng)硬件。雖然這種邏輯關(guān)系是非常正常和自然,現(xiàn)有服務(wù)器的系統(tǒng)結(jié)構(gòu)并不能有效地支持基于這種邏輯關(guān)系的集群系統(tǒng)。因此,必須對現(xiàn)有服務(wù)器的系統(tǒng)結(jié)構(gòu)進行大量改造和重新實現(xiàn)才能直接支持這種集群系統(tǒng)的系統(tǒng)結(jié)構(gòu)。從實際可行性方面考慮,這不是實際可行的。
為實現(xiàn)上述目的,集群系統(tǒng)的系統(tǒng)結(jié)構(gòu)包括多個節(jié)點系統(tǒng),每個節(jié)點系統(tǒng)中包括為網(wǎng)絡(luò)用戶提供網(wǎng)絡(luò)服務(wù)的應(yīng)用系統(tǒng)和為集群系統(tǒng)提供系統(tǒng)服務(wù)的網(wǎng)絡(luò)系統(tǒng);互連交換網(wǎng)絡(luò),集群系統(tǒng)中的所有節(jié)點系統(tǒng)分布式的通過互連網(wǎng)絡(luò)連接。
本發(fā)明高效地支持傳統(tǒng)集群服務(wù),降低集群服務(wù)給主機系統(tǒng)所帶來的負載;提高集群系統(tǒng)軟件的可移植性;強有力地支持異構(gòu)的集群系統(tǒng);支持新型集群服務(wù)的增刪、升級,以及動態(tài)查詢和服務(wù)綁定功能,使得集群系統(tǒng)具有很強的延展性;提出了服務(wù)集中器的概念,將集群系統(tǒng)中節(jié)點系統(tǒng)相互隔離,從而使集群系統(tǒng)的部署及升級更為簡單;靈活地支持集群系統(tǒng)中資源(存儲資源、計算資源等)的表述方式,使每個節(jié)點機可以充分、簡單地利用系統(tǒng)中的資源。
網(wǎng)絡(luò)系統(tǒng)的一個功能承受大部分原由應(yīng)用系統(tǒng)負責(zé)的網(wǎng)絡(luò)協(xié)議處理負載。由于網(wǎng)絡(luò)系統(tǒng)的操作系統(tǒng)是面向網(wǎng)絡(luò)和集群處理專用的系統(tǒng),這使得在網(wǎng)絡(luò)系統(tǒng)上實現(xiàn)集群系統(tǒng)相關(guān)的處理成為可能,網(wǎng)絡(luò)相關(guān)的處理更為高效,也使得應(yīng)用系統(tǒng)可以更好地服務(wù)于用戶請求。
網(wǎng)絡(luò)系統(tǒng)為集群系統(tǒng)提供集群系統(tǒng)服務(wù)。我們提供所有與集群服務(wù)相關(guān)的功能,如集群成員服務(wù)和節(jié)點負載監(jiān)控等。因此,實現(xiàn)于網(wǎng)絡(luò)系統(tǒng)上的集群服務(wù)軟件就可以為節(jié)點系統(tǒng)提供必要的集群服務(wù)。這種系統(tǒng)結(jié)構(gòu)可以有效地提高集群服務(wù)的質(zhì)量;根除集群服務(wù)對于應(yīng)用系統(tǒng)的依賴,從而提高集群系統(tǒng)服務(wù)的可移植性并有力地支持異構(gòu)集群系統(tǒng)。
網(wǎng)絡(luò)系統(tǒng)的另外一個功能是提供集群系統(tǒng)的資源抽象。在集群資源抽象模塊中,我們將集群系統(tǒng)中各種資源進行抽象,為集群應(yīng)用提供簡單的接口。由于網(wǎng)絡(luò)系統(tǒng)上運行著一個獨立的系統(tǒng),我們可以將集群系統(tǒng)中的資源抽象表述,并提供給相應(yīng)的應(yīng)用系統(tǒng)。對于應(yīng)用系統(tǒng),網(wǎng)絡(luò)系統(tǒng)是一個偽多功能卡;這個偽多功能卡為系統(tǒng)不僅提供了網(wǎng)絡(luò)接口,而且還有其他的資源,如大量的存儲資源,計算資源等。應(yīng)用系統(tǒng)通過其系統(tǒng)中的標(biāo)準(zhǔn)接口(集群服務(wù)訪問接口)訪問這些資源。這種資源和服務(wù)抽象在網(wǎng)絡(luò)系統(tǒng)上是通過一個偽文件系統(tǒng)實現(xiàn)。與系統(tǒng)V中的/proc文件系統(tǒng)相似,這個偽文件系統(tǒng)并非是物理存在的文件系統(tǒng),而且對于每個文件的訪問也是可以具有不同的語義的。所有網(wǎng)絡(luò)系統(tǒng)提供的集群資源和服務(wù)的抽象在文件樹中都通過某種文件方式表現(xiàn)出來。圖4所示為網(wǎng)絡(luò)系統(tǒng)上的一個可能的抽象文件樹。從應(yīng)用系統(tǒng)上,集群應(yīng)用可以通過訪問文件樹中的某個特殊文件而實現(xiàn)對于集群系統(tǒng)資源或服務(wù)的訪問。圖5所示為應(yīng)用系統(tǒng)上的一個可能的集群服務(wù)接口。在這個意義上,我們又將網(wǎng)絡(luò)系統(tǒng)稱之為服務(wù)集中器。因為對于應(yīng)用系統(tǒng),任何集群系統(tǒng)中的資源和服務(wù)都似乎是由網(wǎng)絡(luò)系統(tǒng)提供的。
為了支持集群系統(tǒng)服務(wù)的延展性,網(wǎng)絡(luò)系統(tǒng)必須支持集群服務(wù)的在線添加、刪除和升級。為此,網(wǎng)絡(luò)系統(tǒng)提供動態(tài)的集群服務(wù)查詢及綁定服務(wù)。這種動態(tài)服務(wù)分為兩個層次節(jié)點系統(tǒng)之內(nèi)和節(jié)點系統(tǒng)之間。在一個節(jié)點系統(tǒng)之內(nèi),應(yīng)用系統(tǒng)中的集群應(yīng)用必須能夠動態(tài)地查詢和綁定相應(yīng)網(wǎng)絡(luò)系統(tǒng)上的抽象服務(wù)。應(yīng)用系統(tǒng)與網(wǎng)絡(luò)系統(tǒng)間的通訊可以通過各種方式實現(xiàn),例如I2O系統(tǒng)結(jié)構(gòu)。I2O標(biāo)準(zhǔn)中服務(wù)的通訊協(xié)議非常復(fù)雜,不支持動態(tài)的服務(wù)查詢和綁定。為了支持靈活的服務(wù)擴展,我們必須擴展相應(yīng)的通訊協(xié)議以確保動態(tài)地查詢和綁定服務(wù)。一種最為簡單的查詢方式應(yīng)用系統(tǒng)通過遍歷位于網(wǎng)絡(luò)系統(tǒng)上的服務(wù)樹而查找、綁定集群服務(wù)。在節(jié)點系統(tǒng)之間,網(wǎng)絡(luò)系統(tǒng)應(yīng)通過集群系統(tǒng)配置或發(fā)現(xiàn)機制定位集群系統(tǒng)中的資源和服務(wù),然后通過抽象接口提供給應(yīng)用系統(tǒng)。
服務(wù)抽象的另外一個重要作用是將應(yīng)用系統(tǒng)與其它節(jié)點系統(tǒng)相隔離。通過這種服務(wù)抽象,我們將服務(wù)的使用者(一個節(jié)點)與服務(wù)的提供者(另一個節(jié)點)通過網(wǎng)絡(luò)系統(tǒng)從緊密耦合關(guān)系變?yōu)樗缮Ⅰ詈详P(guān)系,從而使集群系統(tǒng)的實現(xiàn)、使用、管理和部署更為簡單、自然。
與傳統(tǒng)的智能網(wǎng)卡系統(tǒng)類似,集群系統(tǒng)中的網(wǎng)絡(luò)系統(tǒng)使得應(yīng)用系統(tǒng)可以更好地服務(wù)于用戶請求;與傳統(tǒng)的智能網(wǎng)卡系統(tǒng)不同,在集群系統(tǒng)中,網(wǎng)絡(luò)系統(tǒng)不再從屬于其相應(yīng)的應(yīng)用系統(tǒng),特別是在集群系統(tǒng)中處于主要的控制地位。
權(quán)利要求
1.一種集群系統(tǒng)的系統(tǒng)結(jié)構(gòu),包括多個節(jié)點系統(tǒng),每個節(jié)點系統(tǒng)中包括為網(wǎng)絡(luò)用戶提供網(wǎng)絡(luò)服務(wù)的應(yīng)用系統(tǒng)和為集群系統(tǒng)提供系統(tǒng)服務(wù)的網(wǎng)絡(luò)系統(tǒng);互連交換網(wǎng)絡(luò),集群系統(tǒng)中的所有節(jié)點系統(tǒng)分布式的通過互連網(wǎng)絡(luò)連接。
2.按權(quán)利要求1所述的系統(tǒng)結(jié)構(gòu),其特征在于所述的應(yīng)用系統(tǒng)和網(wǎng)絡(luò)系統(tǒng)通過某種互聯(lián)方式互連。
3.按權(quán)利要求1所述的系統(tǒng)結(jié)構(gòu),其特征在于所述的為集群系統(tǒng)提供系統(tǒng)服務(wù)的網(wǎng)絡(luò)系統(tǒng)包括網(wǎng)絡(luò)處理模塊、集群服務(wù)模塊、集群資源抽象模塊、網(wǎng)絡(luò)系統(tǒng)操作系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)硬件。
4.按權(quán)利要求1所述的系統(tǒng)結(jié)構(gòu),其特征在于所述的網(wǎng)絡(luò)系統(tǒng)是一個集群系統(tǒng)資源接口。
5.按權(quán)利要求1所述的系統(tǒng)結(jié)構(gòu),其特征在于所述的應(yīng)用系統(tǒng)包括集群服務(wù)接口。
6.按權(quán)利要求1所述的系統(tǒng)結(jié)構(gòu),其特征在于所述的應(yīng)用系統(tǒng)包括集群服務(wù)的在線添加、刪除和升級。
全文摘要
一種集群系統(tǒng)的系統(tǒng)結(jié)構(gòu),包括多個節(jié)點系統(tǒng),每個節(jié)點系統(tǒng)中包括為網(wǎng)絡(luò)用戶提供網(wǎng)絡(luò)服務(wù)的應(yīng)用系統(tǒng)和為集群系統(tǒng)提供系統(tǒng)服務(wù)的網(wǎng)絡(luò)系統(tǒng);互連交換網(wǎng)絡(luò),集群系統(tǒng)中的所有節(jié)點系統(tǒng)分布式的通過互連網(wǎng)絡(luò)連接。本發(fā)明高效地支持傳統(tǒng)集群服務(wù),降低集群服務(wù)給主機系統(tǒng)所帶來的負載;提高集群系統(tǒng)軟件的可移植性;強有力地支持異構(gòu)的集群系統(tǒng);支持新型集群服務(wù)的增刪、升級,以及動態(tài)查詢和服務(wù)綁定功能,使得集群系統(tǒng)具有很強的延展性;提出了服務(wù)集中器的概念,將集群系統(tǒng)中節(jié)點系統(tǒng)相互隔離,從而使集群系統(tǒng)的部署及升級更為簡單;靈活地支持集群系統(tǒng)中資源(存儲資源、計算資源等)的表述方式,使每個節(jié)點機可以充分、簡單地利用系統(tǒng)中的資源。
文檔編號G06F13/14GK1464405SQ0212247
公開日2003年12月31日 申請日期2002年6月5日 優(yōu)先權(quán)日2002年6月5日
發(fā)明者許魯, 范中磊, 張建剛, 韓曉明, 張瑾, 馬一力 申請人:中國科學(xué)院計算技術(shù)研究所