本發(fā)明涉及集群管理技術(shù)領(lǐng)域,特別涉及一種集群系統(tǒng)管理優(yōu)化方法及平臺。
背景技術(shù):
當(dāng)前,隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,集群系統(tǒng)以其強(qiáng)大的運(yùn)算能力和健壯的容錯機(jī)制逐漸成為了計(jì)算機(jī)行業(yè)的焦點(diǎn)。
然而,在傳統(tǒng)集群系統(tǒng)中,同一個集群管理器下的所有主機(jī)無法作為一個DRS域(DRS,即Distributed Resource Scheduler,分布式資源調(diào)度)或HA域(HA,即High Available,高可用)來使用,每次為該集群管理器下的所有主機(jī)配備高可用時,均需要進(jìn)一步指定DRS域或HA域,還需要從不同的共享存儲區(qū)域中對相應(yīng)的資源進(jìn)行遷移操作,這樣需要消耗大量的時間,從而影響了集群系統(tǒng)的DRS性能和HA性能。
綜上所述可以看出,如何進(jìn)一步提升集群系統(tǒng)的DRS性能和HA性能是目前亟待解決的問題。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明的目的在于提供一種集群系統(tǒng)管理優(yōu)化方法及平臺,進(jìn)一步提升了集群系統(tǒng)的DRS性能和HA性能。其具體方案如下:
一種集群系統(tǒng)管理優(yōu)化方法,包括:
在集群系統(tǒng)中創(chuàng)建N個共享存儲區(qū)域,N為正整數(shù),并分別為每個共享存儲區(qū)域設(shè)置相應(yīng)的對該共享存儲區(qū)域進(jìn)行集群管理的sanlock分布式鎖管理器;其中,所述集群系統(tǒng)中包括N個子集群,所述N個子集群與所述N個共享存儲區(qū)域一一對應(yīng);
將從每個共享存儲區(qū)域上劃分出的一塊存儲空間確定為該共享存儲區(qū)域上sanlock分布式鎖管理器的ids空間;
將每個子集群中的所有主機(jī)掛載至與該子集群對應(yīng)的共享存儲區(qū)域中,并且當(dāng)需要將任一主機(jī)掛載至任一共享存儲區(qū)域,則控制該主機(jī)在該共享存儲區(qū)域上執(zhí)行add_lockspace操作,以將該主機(jī)的主機(jī)ID以及該主機(jī)的sanlock標(biāo)識符保存至該共享存儲區(qū)域上的ids空間。
優(yōu)選的,所述集群系統(tǒng)管理優(yōu)化方法,還包括:
在任一ids空間中,將該ids空間中所有主機(jī)的主機(jī)ID保存至預(yù)設(shè)的主機(jī)ID列表,并將該ids空間中所有主機(jī)的sanlock標(biāo)識符保存至預(yù)設(shè)的sanlock標(biāo)識符列表。
優(yōu)選的,所述集群系統(tǒng)管理優(yōu)化方法,還包括:
在任一ids空間中,根據(jù)相應(yīng)主機(jī)ID列表中每個主機(jī)ID所屬的時間戳,來判斷相應(yīng)子集群中所有主機(jī)的在線狀態(tài);其中,當(dāng)任一主機(jī)ID所屬的時間戳超時,則判定與該主機(jī)ID對應(yīng)的主機(jī)處于離線狀態(tài),當(dāng)任一主機(jī)ID所屬的時間戳未超時,則判定與該主機(jī)ID對應(yīng)的主機(jī)處于在線狀態(tài)。
優(yōu)選的,所述集群系統(tǒng)管理優(yōu)化方法,還包括:
當(dāng)任一ids空間中的任一主機(jī)ID所屬的時間戳超時,則發(fā)送輕量級的殺死進(jìn)程命令到與該主機(jī)ID對應(yīng)的主機(jī),以輕度殺掉該主機(jī)在相應(yīng)共享存儲區(qū)域上所占用的共享資源。
優(yōu)選的,所述集群系統(tǒng)管理優(yōu)化方法,還包括:
當(dāng)任一共享存儲區(qū)域上的任一主機(jī)與該共享存儲區(qū)域斷開連接后,則依次向該主機(jī)發(fā)送輕量級的殺死進(jìn)程命令、強(qiáng)制性的殺死進(jìn)程命令以及主機(jī)重啟命令,以重度殺掉該主機(jī)在該共享存儲區(qū)域上所占用的共享資源。
優(yōu)選的,在將主機(jī)掛載至共享存儲區(qū)域中時,允許將同一臺主機(jī)同時掛載至不同的共享存儲區(qū)域上。
優(yōu)選的,所述將同一臺主機(jī)同時掛載至不同的共享存儲區(qū)域上的過程,包括:
將同一臺主機(jī)上不同的虛擬操作系統(tǒng)掛載至不同的共享存儲區(qū)域。
本發(fā)明還公開了一種集群系統(tǒng)管理優(yōu)化平臺,包括:
共享存儲區(qū)域建立模塊,用于在集群系統(tǒng)中創(chuàng)建N個共享存儲區(qū)域,N為正整數(shù),并分別為每個共享存儲區(qū)域設(shè)置相應(yīng)的對該共享存儲區(qū)域進(jìn)行集群管理的sanlock分布式鎖管理器;其中,所述集群系統(tǒng)中包括N個子集群,所述N個子集群與所述N個共享存儲區(qū)域一一對應(yīng);
空間確定模塊,用于將從每個共享存儲區(qū)域上劃分出的一塊存儲空間確定為該共享存儲區(qū)域上sanlock分布式鎖管理器的ids空間;
主機(jī)掛載模塊,用于將每個子集群中的所有主機(jī)掛載至與該子集群對應(yīng)的共享存儲區(qū)域中,并且當(dāng)需要將任一主機(jī)掛載至任一共享存儲區(qū)域,則控制該主機(jī)在該共享存儲區(qū)域上執(zhí)行add_lockspace操作,以將該主機(jī)的主機(jī)ID以及該主機(jī)的sanlock標(biāo)識符保存至該共享存儲區(qū)域上的ids空間。
優(yōu)選的,所述主機(jī)掛載模塊在將主機(jī)掛載至共享存儲區(qū)域中時,允許將同一臺主機(jī)同時掛載至不同的共享存儲區(qū)域上。
本發(fā)明中,集群系統(tǒng)管理優(yōu)化方法,包括:在集群系統(tǒng)中創(chuàng)建N個共享存儲區(qū)域,并分別為每個共享存儲區(qū)域設(shè)置相應(yīng)的對該共享存儲區(qū)域進(jìn)行集群管理的sanlock分布式鎖管理器;其中,集群系統(tǒng)中包括N個子集群,上述N個子集群與上述N個共享存儲區(qū)域一一對應(yīng);將從每個共享存儲區(qū)域上劃分出的一塊存儲空間確定為該共享存儲區(qū)域上sanlock分布式鎖管理器的ids空間;將每個子集群中的所有主機(jī)掛載至與該子集群對應(yīng)的共享存儲區(qū)域中,并且當(dāng)需要將任一主機(jī)掛載至任一共享存儲區(qū)域,則控制該主機(jī)在該共享存儲區(qū)域上執(zhí)行add_lockspace操作,以將該主機(jī)的主機(jī)ID以及該主機(jī)的sanlock標(biāo)識符保存至該共享存儲區(qū)域上的ids空間。
可見,本發(fā)明中,集群系統(tǒng)中的每個共享存儲區(qū)域上均由一個與其對應(yīng)的sanlock分布式鎖管理器對其進(jìn)行集群管理,并且,與任一共享存儲區(qū)域?qū)?yīng)的子集群下的所有主機(jī)均掛載至該共享存儲區(qū)域中,任一主機(jī)掛載至某一共享存儲區(qū)域時,該主機(jī)需要在該共享存儲區(qū)域上執(zhí)行add_lockspace操作,以上技術(shù)方案使得與同一個sanlock分布式鎖管理器對應(yīng)的所有主機(jī)均掛載到同一個共享存儲區(qū)域中,從而使得同一個sanlock分布式鎖管理器下的所有主機(jī)可作為一個DRS域或HA域,無需在為同一個sanlock分布式鎖管理器下的所有主機(jī)配備高可用時進(jìn)一步指定DRS域或HA域,并且由于是掛載到同一個共享存儲區(qū)域中,所以也無需在為同一個sanlock分布式鎖管理器下的所有主機(jī)配備高可用時進(jìn)行存儲資源的遷移,從而進(jìn)一步提升了集群系統(tǒng)的DRS性能和HA性能。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例公開的一種集群系統(tǒng)管理優(yōu)化方法流程圖;
圖2為本發(fā)明實(shí)施例公開的一種集群系統(tǒng)管理優(yōu)化平臺結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例公開了一種集群系統(tǒng)管理優(yōu)化方法,參見圖1所示,該方法包括:
步驟S11:在集群系統(tǒng)中創(chuàng)建N個共享存儲區(qū)域,N為正整數(shù),并分別為每個共享存儲區(qū)域設(shè)置相應(yīng)的對該共享存儲區(qū)域進(jìn)行集群管理的sanlock分布式鎖管理器;其中,集群系統(tǒng)中包括N個子集群,上述N個子集群與上述N個共享存儲區(qū)域一一對應(yīng)。
需要說明的是,上述sanlock分布式鎖管理器是一個基于SAN(即Storage Area Network)的分布式鎖管理器。
另外需要說明的是,上述每個子集群中均包括至少兩臺主機(jī),并且,同一臺主機(jī)可以只屬于同一個子集群,也可以分別屬于不同的子集群。
步驟S12:將從每個共享存儲區(qū)域上劃分出的一塊存儲空間確定為該共享存儲區(qū)域上sanlock分布式鎖管理器的ids空間。
也即,本實(shí)施例中的每個共享存儲區(qū)域上均設(shè)有一塊存儲空間用作相應(yīng)sanlock分布式鎖管理器的ids空間。其中,上述所謂的ids空間也即是指sanlock分布式鎖管理器的ids leases空間。
步驟S13:將每個子集群中的所有主機(jī)掛載至與該子集群對應(yīng)的共享存儲區(qū)域中,并且當(dāng)需要將任一主機(jī)掛載至任一共享存儲區(qū)域,則控制該主機(jī)在該共享存儲區(qū)域上執(zhí)行add_lockspace操作,以將該主機(jī)的主機(jī)ID以及該主機(jī)的sanlock標(biāo)識符保存至該共享存儲區(qū)域上的ids空間。
可以理解的是,在同一臺主機(jī)分別屬于不同的子集群的情況下,同一臺主機(jī)便可以掛載至相應(yīng)的不同共享存儲區(qū)域上??梢?,本實(shí)施例中,在將主機(jī)掛載至共享存儲區(qū)域中時,可允許將同一臺主機(jī)同時掛載至不同的共享存儲區(qū)域上。這意味著,本實(shí)施例中的同一臺主機(jī)可以歸屬于多個DRS域或多個HA域,當(dāng)與這種主機(jī)對應(yīng)的某個共享存儲區(qū)域出現(xiàn)問題后,這種主機(jī)上的其他共享存儲區(qū)域的業(yè)務(wù)不會因此而受到影響。
本實(shí)施例中,將同一臺主機(jī)同時掛載至不同的共享存儲區(qū)域上的過程具體可以為:將同一臺主機(jī)上不同的虛擬操作系統(tǒng)掛載至不同的共享存儲區(qū)域。例如,假設(shè)一臺主機(jī)上安裝了兩套不同的虛擬操作系統(tǒng),則這臺主機(jī)可以掛載到兩個不同的共享存儲區(qū)域上,其余的以此類推。
本發(fā)明實(shí)施例中,集群系統(tǒng)管理優(yōu)化方法,包括:在集群系統(tǒng)中創(chuàng)建N個共享存儲區(qū)域,并分別為每個共享存儲區(qū)域設(shè)置相應(yīng)的對該共享存儲區(qū)域進(jìn)行集群管理的sanlock分布式鎖管理器;其中,集群系統(tǒng)中包括N個子集群,上述N個子集群與上述N個共享存儲區(qū)域一一對應(yīng);將從每個共享存儲區(qū)域上劃分出的一塊存儲空間確定為該共享存儲區(qū)域上sanlock分布式鎖管理器的ids空間;將每個子集群中的所有主機(jī)掛載至與該子集群對應(yīng)的共享存儲區(qū)域中,并且當(dāng)需要將任一主機(jī)掛載至任一共享存儲區(qū)域,則控制該主機(jī)在該共享存儲區(qū)域上執(zhí)行add_lockspace操作,以將該主機(jī)的主機(jī)ID以及該主機(jī)的sanlock標(biāo)識符保存至該共享存儲區(qū)域上的ids空間。
可見,本發(fā)明實(shí)施例中,集群系統(tǒng)中的每個共享存儲區(qū)域上均由一個與其對應(yīng)的sanlock分布式鎖管理器對其進(jìn)行集群管理,并且,與任一共享存儲區(qū)域?qū)?yīng)的子集群下的所有主機(jī)均掛載至該共享存儲區(qū)域中,任一主機(jī)掛載至某一共享存儲區(qū)域時,該主機(jī)需要在該共享存儲區(qū)域上執(zhí)行add_lockspace操作,以上技術(shù)方案使得與同一個sanlock分布式鎖管理器對應(yīng)的所有主機(jī)均掛載到同一個共享存儲區(qū)域中,從而使得同一個sanlock分布式鎖管理器下的所有主機(jī)可作為一個DRS域或HA域,無需在為同一個sanlock分布式鎖管理器下的所有主機(jī)配備高可用時進(jìn)一步指定DRS域或HA域,并且由于是掛載到同一個共享存儲區(qū)域中,所以也無需在為同一個sanlock分布式鎖管理器下的所有主機(jī)配備高可用時進(jìn)行存儲資源的遷移,從而進(jìn)一步提升了集群系統(tǒng)的DRS性能和HA性能。
本發(fā)明實(shí)施例公開了一種具體的集群系統(tǒng)管理優(yōu)化方法,相對于上一實(shí)施例,本實(shí)施例對技術(shù)方案作了進(jìn)一步的說明和優(yōu)化。具體的:
為了便于對主機(jī)ID和sanlock標(biāo)識符進(jìn)行統(tǒng)一管理,本實(shí)施例中,在任一個共享存儲區(qū)域上的所有主機(jī)均執(zhí)行完add_lockspace操作后,可以將相應(yīng)ids空間中所有主機(jī)的主機(jī)ID保存至預(yù)設(shè)的主機(jī)ID列表,并將該ids空間中所有主機(jī)的sanlock標(biāo)識符保存至預(yù)設(shè)的sanlock標(biāo)識符列表?;蛘呤窃谌我粋€共享存儲區(qū)域上的任一臺主機(jī)執(zhí)行完add_lockspace操作后,將該臺主機(jī)相應(yīng)的主機(jī)ID保存至上述預(yù)設(shè)的主機(jī)ID列表,并將相應(yīng)的sanlock標(biāo)識符保存至上述預(yù)設(shè)的sanlock標(biāo)識符列表。
另外,在任一ids空間中,可以根據(jù)相應(yīng)主機(jī)ID列表中每個主機(jī)ID所屬的時間戳,來判斷相應(yīng)子集群中所有主機(jī)的在線狀態(tài);具體的,當(dāng)任一主機(jī)ID所屬的時間戳超時,則判定與該主機(jī)ID對應(yīng)的主機(jī)處于離線狀態(tài),當(dāng)任一主機(jī)ID所屬的時間戳未超時,則判定與該主機(jī)ID對應(yīng)的主機(jī)處于在線狀態(tài)。
為了提升集群系統(tǒng)中的資源保護(hù)能力,本實(shí)施例中的集群系統(tǒng)管理優(yōu)化方法,還可以包括:
當(dāng)任一ids空間中的任一主機(jī)ID所屬的時間戳超時,則發(fā)送輕量級的殺死進(jìn)程命令到與該主機(jī)ID對應(yīng)的主機(jī),以輕度殺掉該主機(jī)在相應(yīng)共享存儲區(qū)域上所占用的共享資源。
為了進(jìn)一步提升集群系統(tǒng)中的資源保護(hù)能力,本實(shí)施例中的集群系統(tǒng)管理優(yōu)化方法,還可以包括:
當(dāng)任一共享存儲區(qū)域上的任一主機(jī)與該共享存儲區(qū)域斷開連接后,則依次向該主機(jī)發(fā)送輕量級的殺死進(jìn)程命令、強(qiáng)制性的殺死進(jìn)程命令以及主機(jī)重啟命令,以重度殺掉該主機(jī)在該共享存儲區(qū)域上所占用的共享資源。
相應(yīng)的,本發(fā)明實(shí)施例還公開了一種集群系統(tǒng)管理優(yōu)化平臺,參見圖2所示,該集群系統(tǒng)管理優(yōu)化平臺包括:
共享存儲區(qū)域建立模塊21,用于在集群系統(tǒng)中創(chuàng)建N個共享存儲區(qū)域,N為正整數(shù),并分別為每個共享存儲區(qū)域設(shè)置相應(yīng)的對該共享存儲區(qū)域進(jìn)行集群管理的sanlock分布式鎖管理器;其中,集群系統(tǒng)中包括N個子集群,N個子集群與N個共享存儲區(qū)域一一對應(yīng);
空間確定模塊22,用于將從每個共享存儲區(qū)域上劃分出的一塊存儲空間確定為該共享存儲區(qū)域上sanlock分布式鎖管理器的ids空間;
主機(jī)掛載模塊23,用于將每個子集群中的所有主機(jī)掛載至與該子集群對應(yīng)的共享存儲區(qū)域中,并且當(dāng)需要將任一主機(jī)掛載至任一共享存儲區(qū)域,則控制該主機(jī)在該共享存儲區(qū)域上執(zhí)行add_lockspace操作,以將該主機(jī)的主機(jī)ID以及該主機(jī)的sanlock標(biāo)識符保存至該共享存儲區(qū)域上的ids空間。
其中,上述主機(jī)掛載模塊在將主機(jī)掛載至共享存儲區(qū)域中時,允許將同一臺主機(jī)同時掛載至不同的共享存儲區(qū)域上。
關(guān)于上述各個模塊更加詳盡的工作過程可參考前述實(shí)施例的相關(guān)內(nèi)容,在此不再進(jìn)行一一贅述。
可見,本發(fā)明實(shí)施例中,集群系統(tǒng)中的每個共享存儲區(qū)域上均由一個與其對應(yīng)的sanlock分布式鎖管理器對其進(jìn)行集群管理,并且,與任一共享存儲區(qū)域?qū)?yīng)的子集群下的所有主機(jī)均掛載至該共享存儲區(qū)域中,任一主機(jī)掛載至某一共享存儲區(qū)域時,該主機(jī)需要在該共享存儲區(qū)域上執(zhí)行add_lockspace操作,以上技術(shù)方案使得與同一個sanlock分布式鎖管理器對應(yīng)的所有主機(jī)均掛載到同一個共享存儲區(qū)域中,從而使得同一個sanlock分布式鎖管理器下的所有主機(jī)可作為一個DRS域或HA域,無需在為同一個sanlock分布式鎖管理器下的所有主機(jī)配備高可用時進(jìn)一步指定DRS域或HA域,并且由于是掛載到同一個共享存儲區(qū)域中,所以也無需在為同一個sanlock分布式鎖管理器下的所有主機(jī)配備高可用時進(jìn)行存儲資源的遷移,從而進(jìn)一步提升了集群系統(tǒng)的DRS性能和HA性能。
最后,還需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
以上對本發(fā)明所提供的一種集群系統(tǒng)管理優(yōu)化方法及平臺進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。