亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

集群式數(shù)據(jù)處理系統(tǒng)中的存儲裝置管理的制作方法

文檔序號:6362203閱讀:252來源:國知局
專利名稱:集群式數(shù)據(jù)處理系統(tǒng)中的存儲裝置管理的制作方法
集群式數(shù)據(jù)處理系統(tǒng)中的存儲裝置管理技術領域
本發(fā)明總體涉及集群式數(shù)據(jù)處理系統(tǒng),并且具體地涉及集群式數(shù)據(jù)處理系統(tǒng)內的共享存儲裝置的管理和利用。更具體而言,本發(fā)明涉及一種用于基于對集群式數(shù)據(jù)處理系統(tǒng)內的共享分布式存儲裝置利用的節(jié)點故障恢復的改進方法和系統(tǒng)。
背景技術
虛擬化的數(shù)據(jù)處理系統(tǒng)配置在計算機(并且具體為計算機服務器)產業(yè)中正在變得越來越常見,該數(shù)據(jù)處理系統(tǒng)配置提供處理器、存儲器和操作系統(tǒng)(OS)資源的虛擬化。在更少程度上,也已知并且在有限環(huán)境中提供存儲裝置虛擬化。然而在虛擬化計算環(huán)境內,存儲裝置虛擬化和管理被實現(xiàn)為從服務器虛擬化和管理分離的虛擬化模型。因此,與不同的虛擬化的服務器系統(tǒng)關聯(lián)的不同客戶端邏輯分區(qū)(LPAR)可以訪問相同存儲裝置訪問網(wǎng)絡(SAN)存儲裝置。然而在一個服務器上的客戶端LPAR沒有對客戶端LPAR正在試圖訪問的存儲裝置訪問網(wǎng)絡(SAN)盤是否正在由屬于另一服務器的某一其它客戶端LPAR使用的任何“了解”。在共享SAN存儲裝置內提供存儲裝置虛擬化的分布式服務器系統(tǒng)的常規(guī)實現(xiàn)方式可能引起數(shù)據(jù)完整性問題并且可以潛在地引起數(shù)據(jù)破壞和客戶端分區(qū)崩潰。
活動分區(qū)移動性(LPM)是從一個服務器向另一服務器移動虛擬化的客戶端分區(qū)而未顯現(xiàn)中斷客戶端上的操作這樣的實踐。然而故障在這些LPM事件期間偶然出現(xiàn)。遺憾的是,常規(guī)方式在處置LPM操作期間的硬件故障時一直沒有效果。
這是很復雜的問題,因為狀態(tài)排列方式眾多并且不能依賴于單個節(jié)點來幸免于故障。傳統(tǒng)方式在集群式環(huán)境中不起作用,因為除了清理因故障而孤立的存儲資源之外不存在同步用于各種節(jié)點的關系信息。利用當前方式,從故障中恢復將需要緩慢的逐個節(jié)點的記賬(account)和清理過程,這會限制集群的功能(潛在地失去用于客戶端分區(qū)的服務)達某一時間量。發(fā)明內容
本發(fā)明尋求提供一種用于利用集群感知以有效地支持活動分區(qū)移動性(LPM)事件并且提供從虛擬輸入/輸出(I/o)服務器(VIOS)集群內的節(jié)點/VIOS故障中恢復的方法、系統(tǒng)和計算機程序產品?;顒臃謪^(qū)移動性(LPM)實用工具在發(fā)起對應LPM事件時在第一 VIOS上創(chuàng)建監(jiān)視線程。監(jiān)視線程跟蹤LPM事件的狀況并且在數(shù)據(jù)庫的移動性表中記錄狀況信息。LPM實用工具在(相同)源計算電子復合體(computing electronic complex,CEC)上運行的其它VIOS上創(chuàng)建其它監(jiān)視線程。如果第一 VIOS遭受多個故障條件之一(例如VIOS不再能夠執(zhí)行1/0操作、變成離線或者從集群被去除),則LPM實用工具向其它工作中的節(jié)點/VIOS提供通知。LPM實用工具使工作中的監(jiān)視線程能夠更新LPM事件狀況。具體而言,最后的監(jiān)視線程可以基于在第一服務器上存在處于故障狀態(tài)中的節(jié)點的指示在數(shù)據(jù)庫內執(zhí)行更新操作。


現(xiàn)在將參照附圖僅通過示例描述本發(fā)明的實施例,在附圖中:
圖1A圖示根據(jù)一個實施例的集群(感知)數(shù)據(jù)處理系統(tǒng)的第一視圖,在該數(shù)據(jù)處理系統(tǒng)內實現(xiàn)描述的實施例的功能特征中的各種特征;
圖1B圖示根據(jù)一個實施例的圖1的集群數(shù)據(jù)處理系統(tǒng)(DPS)的第二視圖,該視圖描繪計算復合體和共享存儲裝置內的附加功能部件;
圖2A圖示根據(jù)一個實施例的在具有虛擬化的OS分區(qū)的集群DPS內的計算電子復合體(CEC)的內部配置,這些OS分區(qū)包括虛擬I/O服務器(VIOS)分區(qū);
圖2B是根據(jù)一個實施例的在VIOS內利用的集群感知操作系統(tǒng)的功能部件/模塊的框示;
圖3是根據(jù)一個實施例的方法的流程圖,通過該方法在CA DPS內完成客戶端創(chuàng)建和注冊的過程;
圖4A是根據(jù)一個實施例的與在CA_DPS內的VIOS集群關聯(lián)的并且由該VIOS集群利用的存儲裝置池的框圖表示;
圖4B是根據(jù)一個實施例的在VIOS DB內的存儲的數(shù)據(jù)結構以及包括源節(jié)點和目標節(jié)點部件的其它功能部件的框圖表示,這些數(shù)據(jù)結構和功能部件支持集群級信息/數(shù)據(jù)的管理和在管理工具、源節(jié)點、第二/目標節(jié)點和共享數(shù)據(jù)庫之間的交換;
圖5A是根據(jù)一個實施例的數(shù)據(jù)處理系統(tǒng)的框圖表示,該數(shù)據(jù)處理系統(tǒng)向管理控制臺的功能提供可以用來在Viso集群內發(fā)起和支持活動分區(qū)移動性的硬件和軟件部件;
圖5B圖示根據(jù)一個實施例的VIOS集群環(huán)境,該VIOS集群環(huán)境具有被配置用于有效地支持活動分區(qū)移動性(LPM)事件的兩個CEC和多個VIOS ;
圖6圖示根據(jù)一個實施例的監(jiān)視線程在LPM事件期間更新的移動性表;
圖7是根據(jù)一個實施例的示例方法的高級邏輯流程圖,VIOS集群監(jiān)視器通過該方法監(jiān)視LPM事件、更新移動性表并且提供從節(jié)點故障中恢復;并且
圖8是根據(jù)另一實施例的示例方法的高級邏輯流程圖,VIOS集群通過該方法利用在第一監(jiān)視線程已經出故障之后保持工作(活躍)的監(jiān)視線程以保持數(shù)據(jù)庫為當前并且提供數(shù)據(jù)庫一致性。
具體實施方式
示例實施例描述一種用于利用集群感知來有效支持活動分區(qū)移動性(LPM)事件并且提供從虛擬輸入/輸出(I/o)服務器(VIOS)集群內的節(jié)點故障中恢復的方法、數(shù)據(jù)處理系統(tǒng)和計算機程序產品?;顒臃謪^(qū)移動性(LPM)實用工具在發(fā)起對應LPM事件時在第一VIOS上創(chuàng)建監(jiān)視線程。監(jiān)視線程跟蹤LPM事件的狀況并且在數(shù)據(jù)庫的移動性表中記錄狀態(tài)信息。LPM實用工具在(相同)源計算電子復合體(CEC)上運行的其它VIOS上創(chuàng)建其它監(jiān)視線程。如果第一 VIOS遭受多個故障條件之一(例如VIOS不再能夠執(zhí)行I/O操作、變成離線或者從集群被去除),則LPM實用工具向其它工作中的節(jié)點/VIOS提供通知。LPM實用工具使工作中的監(jiān)視線程能夠更新LPM事件狀況。具體而言,最后監(jiān)視線程可以基于在第一服務器上存在處于故障狀態(tài)中的節(jié)點這樣的指示在數(shù)據(jù)庫內執(zhí)行更新操作。
在本發(fā)明的示例實施例的下文具體描述中,以充分細節(jié)描述其中可以實踐本發(fā)明的具體示例實施例以使本領域技術人員能夠實踐本發(fā)明,并且將理解可以利用其它實施例并且可以進行邏輯、架構、程序、機械、電氣和其它改變而未脫離本發(fā)明的范圍。因此將不在限制意義上看待下文具體描述,并且本發(fā)明的范圍由所附權利要求及其等效含義限定。
在附圖的不同視圖的描述內,向相似單元提供與先前附圖的名稱和標號相似的名稱和標號。提供向單元指派的具體標號僅輔助描述而并非為了意味著關于描述的實施例的任何限制(結構或者功能或者以別的方式)。
理解使用具體部件、設備和/或參數(shù)名稱(比如這里描述的執(zhí)行實用工具/邏輯/固件的部件、設備和/或參數(shù)名稱)僅為了距離而并非為了意味著關于本發(fā)明的任何限制。因此可以用這里用來描述部件/設備/參數(shù)的不同命名/術語實施本發(fā)明而無限制。提供在描述實施例的一個或者多個單元、特征或者概念時對任何具體協(xié)議或者專用名稱的引用僅作為一個實現(xiàn)方式的示例,并且這樣的引用未限制使本發(fā)明擴展至其中利用不同單元、特征或者概念名稱的實施例。因此將向這里利用的每個術語給予它在其中利用該術語的上下文給定中的最廣義解釋。
如下文進一步描述的那樣,處理設備/結構內提供本發(fā)明的功能特征的實現(xiàn)方式并且該實現(xiàn)方式涉及到使用硬件、固件以及若干軟件級構造(例如程序代碼)的組合。呈現(xiàn)的附示具有具體數(shù)目的處理節(jié)點(例如計算電子復合體)的示例數(shù)據(jù)處理架構內的硬件部件和軟件部件二者。示例和描述的實施例假設可以將系統(tǒng)架構升級至數(shù)目大得多的處理節(jié)點。
在下文描述中,提供標題或者章節(jié)標簽以分離在具體章節(jié)中提供的對本發(fā)明的部分的功能描述。提供這些標題以支持在呈現(xiàn)示例性實施例時的更好流暢性而并非為了意味著關于本發(fā)明或者關于在特定章節(jié)中描述的總體功能中的任何功能的任何限制。在任何一個章節(jié)中呈現(xiàn)的材料可以適用于下一章節(jié)并且反之亦然。在說明書內呈現(xiàn)以下標題和子標題序列:
A.總體架構
B.集群感知VIOS
C.CA VIOS 通信協(xié)議
D.用于集群管理的VIOS共享DB
E.VIOS集群移動性
F.在集群式分區(qū)移動性期間的故障恢復
A.總體架構
現(xiàn)在具體參照圖1A,描繪示例集群感知(CA)分布式數(shù)據(jù)處理系統(tǒng)(DPS)架構100的框圖,可以在該DPS架構內有利地實現(xiàn)描述的實施例的功能方面。為了簡化,集群感知分布式DPS架構100這里應當簡稱為DPS100。DPS100包括這里各自稱為計算電子復合體(CEC)的多個計算節(jié)點,圖示這些CEC中的CEC110A和110B。在DPS100內的CEC的數(shù)目可以變化,范圍從更小系統(tǒng)中的單個CEC擴展上至更大升級系統(tǒng)中的數(shù)以百計或者數(shù)以千計的CEC。為了簡化,將從單個CEC(CECllOA)或者兩個CEC(CEC110A、110B)的視角描述實施例。每個CEC110A-110B包括具有如下文描述的功能的至少一個(并且在多數(shù)實例中為多個)虛擬輸入/輸出服務器112 (這里也稱為VIO服務器或者V10S)。在DPS100的每個CECllO內的VIOSl 12的實際數(shù)目是設計特征并且可以變化。在每個CECl 10A-1IOB內也支持客戶端邏輯分區(qū)(可互換地稱為客戶端LPAR或者“客戶端”),圖示這些客戶端中的前兩個客戶端、即客戶端A114a和客戶端B114b。如下文描述的那樣,參照圖2,客戶端LPAR114是虛擬化(或者操作系統(tǒng)分區(qū))的計算系統(tǒng)的邏輯分區(qū)。在每個CECllO內的客戶端的實際數(shù)目可以變化并且可以范圍從單個客戶端至數(shù)以百計或者數(shù)以千計的客戶端(并非作為限制)。為了在這里呈現(xiàn)發(fā)明概念時的效率,在各種示例性和描述的實施例的每個CECllO內僅呈現(xiàn)兩個客戶端。DPS100也包括對每個CECllO和CECllO內的部件可訪問的分布式存儲裝置設施。在描述的實施例內,分布式存儲裝置設施將被稱為分布式數(shù)據(jù)存儲庫150,并且分布式數(shù)據(jù)存儲庫150支持這里描述的實施例提供的客戶端級功能特征中的若干功能特征。分布式數(shù)據(jù)存儲庫150是分布式存儲裝置設施,該分布式存儲裝置設施在集群感知分布式系統(tǒng)內提供每個CECllO利用的、并且用于每個CECllO的每個客戶端114的存儲裝置的單個視圖。分布式數(shù)據(jù)存儲庫150包括本地物理存儲裝置160和網(wǎng)絡存儲裝置161,二者包括多個物理存儲裝置單元162(例如盤、固態(tài)驅動等)。組成分布式數(shù)據(jù)存儲庫150的物理盤可以跨存儲裝置網(wǎng)絡(例如SAN)分布。此外,分布式數(shù)據(jù)存儲庫150提供儲藏庫,在該儲藏庫內存儲和維護在維護DPS100的客戶端級、系統(tǒng)管理和存儲裝置級操作/特征時利用的軟件實用工具、指令代碼、OS映像、客戶端映像、數(shù)據(jù)(系統(tǒng)、節(jié)點和客戶端級)和/或其它功能信息。除了分布式數(shù)據(jù)存儲庫150之外,DPS100也包括VIOS數(shù)據(jù)庫(DB) 140,該VIOS DB也可以是包括跨存儲裝置網(wǎng)絡的物理盤的分布式存儲裝置設施。VIOSDB (或者DB) 140是貯存庫,該貯存庫存儲并且提供對支持這里描述的各種集群感知功能的集群配置數(shù)據(jù)以及其它功能部件/模塊和數(shù)據(jù)結構的訪問。在一個實施例中,可以分配分布式數(shù)據(jù)存儲庫150的一部分以提供用于集群的存儲裝置池。集群的每個V10S112維護DB140的本地視圖并且在創(chuàng)建或者更新DB140內的集群級信息/數(shù)據(jù)/數(shù)據(jù)結構時更新這樣的信息/數(shù)據(jù)。一般經由多個CEC間互連支持在每個CECllO的每個V10S112之間以及與至少一個其它CECllO的VIOS的通信,圖示這些CEC間互連為連接成對V10S112的雙向虛線。箭頭指示在部件之間的雙路數(shù)據(jù)交換或者通信。除了 CEC間互連之外,每個V10S112也經由圖示為實線雙向箭頭的CEC到存儲庫互連連接到分布式數(shù)據(jù)存儲庫150。每個V10S112也經由呈現(xiàn)為虛線和點線的VIOS到DB互連連接到DB140。除了從第一 CEC的第一 VIOS(例如VIOSl 12a)向在相同CEC上的第二 VIOS(例如VIOSl 12b)伸展(run)的CEC間連接器之外,各種互聯(lián)代表在集群的VIOS節(jié)點與DB140和分布式數(shù)據(jù)存儲庫150之間的網(wǎng)絡級連通。如這里利用的那樣,假設對一個或者多個“節(jié)點”的指代具體是指在集群內的V10S。DPS100也包括管理工具(未示出)在其上執(zhí)行的管理控制臺175。現(xiàn)在轉向圖1B,圖示了 DPS100的另一視圖,該視示CECllO到分布式存儲貯存庫150和DB140的基于網(wǎng)絡的連接。圖1B更具體圖示VIOS和CEC到彼此和到分布式存儲貯存庫150的網(wǎng)絡連通。就這一視圖而言,CEC_A (節(jié)點_A) 11OA和CEC_B (節(jié)點_B) 11OB包括與如圖1A中呈現(xiàn)的構造相似的構造。在DPS100內的每個CECllO經由一個或者多個網(wǎng)絡和/或I/O互連/交換機結構(一般圖示為互連/網(wǎng)絡結構170)連接到分布式存儲貯存庫150。描述和圖示假設DPS100的CECllO中的一些CEC和分布式存儲貯存庫150位于相互遠離、例如包括位于不同國家中,從而在相應設備之間無直接物理連通存在。為了簡化,將實施例描述為具有包括專用廣域網(wǎng)(WAN)或者公用WAN(比如因特網(wǎng))的主要互連/網(wǎng)絡170,但是其它網(wǎng)絡類型(例如局域網(wǎng))是可能的并且受到支持。
如描繪的那樣,在一個或者多個實施例中,每個CECllO還連接到一個或者多個鄰居CECllO以便提供如下文描述的高效故障保護和/或移動性支持和其它功能。如這里利用的那樣,術語鄰居是指第一 CEC能夠與之通信的連接的第二 CEC,并且對鄰居CEC的引用不限于與第一 CEC在地理上鄰近的第二 CEC。圖示CEC_A110A和CEC_B110B經由某一連接介質相互連接,該連接介質可以包括不同網(wǎng)絡(比如局域網(wǎng))172或者在物理上相互接近時的某一類型的直接互連(例如光纖信道連接)。將在鄰居CEC110A與IlOB之間的連接圖示為在CEClIOA與IIOB之間的直接線路連接或者輔助網(wǎng)絡連接(172)。然而要理解的是連接不一定是直接的、而是可以實際上通過與其它CEC連接相同的總體互連/網(wǎng)絡170被路由到分布式存儲貯存庫150。在一個或者多個備選實施例中,在CEC之間的連接可以經由不同網(wǎng)絡(例如圖1B的網(wǎng)絡172)、比如局域網(wǎng)(LAN)。
如描繪的那樣,每個CECl 10包括用于使得CECl 10并且因此使得CECl 10的其它部件(即客戶端分區(qū))能夠參與網(wǎng)絡級通信的一個或者多個網(wǎng)絡接口 134和一個或者多個I/O適配器132。每個V10S112模擬虛擬客戶端I/O適配器226a_22c,以支持具體指派的客戶端LPAR114a-114c與分布式存儲貯存庫150和/或在相同CEC內或者在不同CEC上的其它客戶端通信。VIOSl 12模擬這些虛擬I/O適配器226a-226c并且通過與在分布式存儲貯存庫150處的對應虛擬服務器I/O適配器(SVA) 152a-152c連接來與分布式存儲貯存庫150通信。用通過虛擬化管理部件進行路由的實心連線圖示在V10S112與客戶端LPAR114a-114c之間的內部CEC通信,而由經由網(wǎng)絡/互連結構172連接的虛線提供VIOS到服務器通信。在各種實施例中利用管理控制臺175以執(zhí)行設置和/或初始化用于個別V10S112的和/或作為整體的VIOS集群的這里描述的備份和恢復操作。在每個CECllO內的VIOSl 12因此能夠支持客戶端級對分布式存儲裝置150的訪問并且支持與分布式存儲貯存庫150交換系統(tǒng)級和客戶端級信息。
此外,每個VIOSl 12也包括用于使DPS100內的VIOSl 12能夠感知集群(DPS100)內任何地方的其它VIOS的功能部件/模塊和數(shù)據(jù)。從這一視角來看,VIOSl 12這里被稱為集群感知,并且它們在DPS100內的互連結構因此使DPS100也能夠可互換地被稱為集群感知DPSlOOo作為集群感知的一部分,每個V10S112也經由網(wǎng)絡170連接到DB140并且與DB140進行集群級數(shù)據(jù)通信以支持這里描述的集群管理功能。
圖1B也圖示示例分布式存儲貯存庫150的部件組成的初始視圖和DB140的一些部件的初始列表。為了支持與V10S112和關聯(lián)虛擬客戶端I/O適配器的虛擬I/O操作,分布式存儲貯存庫150包括通信基礎結構151。通信基礎結構151包括用于集群級通信并且支持訪問在分布式存儲貯存庫150中存儲的數(shù)據(jù)/代碼/軟件實用工具以對其完成I/O操作的網(wǎng)絡接口 153和多個服務器I/O適配器152。具體而言,也將這些服務器I/O適配器呈現(xiàn)為與向CECllO的客戶端114指派的虛擬I/O適配器(132)配對的虛擬服務器I/O適配器。
如圖所示,分布式數(shù)據(jù)存儲庫150 —般包括提供已指派客戶端存儲裝置165(可以劃分成用于客戶端組的相應存儲裝置池)、未指派空余存儲裝置167和備份/冗余CEC/VIOS/客戶端配置數(shù)據(jù)存儲裝置169的總體存儲裝置空間160(其可以劃分成存儲裝置池的可用本地化網(wǎng)絡存儲裝置容量)。在一個實施例中,將已指派客戶端存儲裝置分配為存儲裝置池,并且使用存儲裝置池來支持與共享存儲資源、提供對共享存儲裝置的安全訪問、以及集群內的VIOS之中支持存儲裝置的集群級控制有關的特征中的若干特征。在VIOS集群內實施時,存儲裝置池提供一種邏輯上組織一個或者多個用于由組成VIOS集群的VIOS支持的客戶端使用的物理卷的方法。圖4A圖示在集群感知DPS100內利用的存儲裝置池的示例配置。具體而言,圖4A提供關于如何在存儲裝置池內使用這些物理卷的細節(jié)。如圖所示,在集群內的存儲裝置池460包含一個或者多個盤組462。盤組462向管理員提供用于提供對存儲裝置池460內的物理卷162的給定子集的訪問策略的能力。一旦已經定義盤組462,管理員可以基于盤特性將子集進一步分類成存儲裝置層464。一旦已經定義盤組462和存儲裝置層464,管理員切分將向客戶端分區(qū)(114)導出的邏輯單元(LU)466。利用這里提供的虛擬池化能力,管理員分配用于池的存儲裝置并且從該單個存儲裝置池部署多個V10S。利用這一實現(xiàn)方式,將SAN監(jiān)管功能從系統(tǒng)監(jiān)管功能去耦合,并且系統(tǒng)管理員可以服務于客戶端(具體為客戶的客戶端114)或者如果需要VIOS以提供用于客戶的數(shù)據(jù)存儲服務則添加附加V10S。存儲裝置池也可以跨越集群可訪問從而允許管理員在必要時通過將工作量移向不同硬件來管理VIOS工作量。利用存儲裝置池的集群感知VIOS實現(xiàn)方式,提供附加功能以使VIOS能夠控制對各種存儲裝置池的訪問,從而每個客戶端/客戶數(shù)據(jù)/信息是安全的以免于其它客戶端/客戶端的訪問。如圖所示,DSR150還包括多個軟件、固件和/或軟件實用工具部件,這些部件包括DSR配置實用工具154、DSR配置數(shù)據(jù)155 (例如用于基本文件系統(tǒng)訪問、元數(shù)據(jù)、認證和其它過程的索引節(jié)點)和DSR管理實用工具156。為了支持DPS100的集群感知特征并且根據(jù)示例性實施例,DPS100也包括VIOS數(shù)據(jù)庫(DB) 140,在該VIOS數(shù)據(jù)庫中存儲在VIOS集群連接的處理部件(例如VIOS和管理池)的設置和/或后續(xù)處理期間生成的各種數(shù)據(jù)結構。DB140包括多個軟件或者固件部件和/或數(shù)據(jù)、數(shù)據(jù)模塊或者數(shù)據(jù)結構,為了圖示,在圖1B中呈現(xiàn)這些部件中的若干部件。在這些部件之中是集群管理(CM)實用工具182、VIO適配器ID數(shù)據(jù)結構183、集群配置數(shù)據(jù)184、客戶端標識(ID)數(shù)據(jù)185、活躍節(jié)點列表186和I/O冗余性數(shù)據(jù)187以及其它部件。這些各種部件支持一個或者多個VIOSl 12的如這里描述的各種集群功能和集群I/O操作。在本實施例中,VIOS DB 140也包括移動性表510,VIOS集群的節(jié)點通過該移動性表能夠跟蹤和支持VIOS集群內的VIOS分區(qū)和/或客戶端分區(qū)的移動和/或重定位。在其余附圖的描述內和貫穿各種呈現(xiàn)的實施例描述呈現(xiàn)DB140和分布式存儲貯存庫150的附加特征以及支持各種集群功能的具體部件或者子部件。通過這里描述的處理部件和/模塊中的一個或者多個處理部件/模塊的一個或者多個操作來創(chuàng)建、維護和/或更新和/或刪除附示和/或這里描述的各種數(shù)據(jù)結構。在一個實施例中,管理工具180和/或一個或者多個VIOSl 12通過執(zhí)行集群感知操作系統(tǒng)來激活存儲裝置池、VIOS DB140和對應數(shù)據(jù)結構的初始設置。然而一旦建立基礎結構,與DB 140和管理工具180通信的V10S112執(zhí)行在需要時維護基礎結構、包括擴展節(jié)點數(shù)目。管理控制臺175也與DPS100關聯(lián)并且通信地耦合到與分布式存儲貯存庫150和DB140以及V10S122,該管理控制臺可以由DPS100的(或者分布式存儲貯存庫150或者DB 140的)管理員用來訪問DB140或者分布式存儲貯存庫150并且配置DB140的和分布式存儲貯存庫150的資源和功能用于由集群內的連接的CECl 10的VIOSl 12和客戶端114訪問/使用。如圖1B中所示和貫穿說明書描述的那樣,在管理控制臺175內實施管理工具180。然而理解可以選擇/選用DPS100內的任何節(jié)點(的資源)以執(zhí)行管理工具180的功能,并且選擇的節(jié)點然后將利用DB140和分布式存儲貯存庫150提供的資源的可用性來執(zhí)行下文描述的集群創(chuàng)建以及其它集群監(jiān)視和管理功能中的一個或者多個功能。
在備選實施例中,管理工具180是在DPS100內的CEC之一的客戶端分區(qū)內執(zhí)行的可執(zhí)行模塊。在一個實施例中,管理工具180控制集群的操作,并且使集群內的每個節(jié)點能夠維護關于集群的當前/更新的信息、包括對集群內的節(jié)點中的一個或者多個節(jié)點進行的任何改變提供通知。在一個實施例中,管理工具180向單個V10S112b注冊,并且因此能夠從VIOS取回/接收集群級數(shù)據(jù),該數(shù)據(jù)包括整個集群的FFDC數(shù)據(jù)(191)。
現(xiàn)在參照圖2A,呈現(xiàn)示例DPS100的第三視圖,該視圖強調處理系統(tǒng)架構200 (即個別CEC并且具體為CEC_A110A的架構)。CEC_A110A(CEC110A)用作在圖2A中更具體并且貫穿說明書描述的示例CEC。將CEC110A呈現(xiàn)為包括硬件部件和軟件/固件/OS部件的服務器,邏輯上對這些部件分區(qū)以創(chuàng)建多個虛擬化的機器分區(qū),指派這些機器分區(qū)作為客戶端邏輯分區(qū)(LPAR)和虛擬I/O服務器(VIOS)。示例CEClIOA的硬件部件230包括一個或者多個處理器231A-231P、一個或者多個存儲器233A-233M和本地存儲裝置234。處理器230A-230P經由總線、互連/交換機或者互連結構(未具體示出)與一個或者多個存儲器233A-233M和與本地存儲裝置234互連??梢钥绱笠?guī)?;ミB結構分布的部件的具體內部連通與描述的實施例無密切關系,并且未呈現(xiàn)關于在系統(tǒng)硬件部件之間的具體互連通類型的進一步細節(jié)。
在硬件部件230內還包括一個或者多個物理網(wǎng)絡接口 134,CEC_A110A通過該物理網(wǎng)絡接口到外部網(wǎng)絡、比如網(wǎng)絡170以及其它部件。此外,硬件部件230包括提供用于CEC_AllOA的I/O接口的多個I/O適配器232A-232E。I/O適配器232A-232E是物理適配器,這些物理適配器使CEC_A110能夠支持經由I/O接口與包括SF存儲裝置150的本地連接和遠程(聯(lián)網(wǎng))連接的I/O設備二者的I/O操作。I/O適配器的示例包括外圍部件接口(PCI)、PC1-X或者PCI快速適配器和小型計算機系統(tǒng)互連(SCSI)適配器以及其它I/O適配器。邏輯上對CECllO分區(qū),從而虛擬化不同I/O適配器232,然后可以向不同邏輯分區(qū)唯一指派虛擬I/o適配器。在一個或者多個實施例中,在每個VIOS內維護與向VIOS(或者受具體VIOS支持的客戶端)指派的虛擬化的適配器和其它部件有關的配置數(shù)據(jù),并且VIOS OS可以在對這樣的配置進行改變時以及在添加和/或去除和/或指派適配器時維護和更新配置數(shù)據(jù)。
作為一個實施例,作為Power Hypervisor (PHYP) 225 (IBM公司的注冊商標)提供的虛擬化管理部件在邏輯上位于硬件級(230)上方。盡管貫穿各種實施例圖示和描述為PHYP225,但是完全理解可以利用其它類型的虛擬化管理部件、并且其它類型的虛擬化管理部件同樣適用于各種實施例的實現(xiàn)方式。PHYP225具有在CECllO內耦合到PHYP225的關聯(lián)服務處理器227。服務處理器227可以用來提供用于一個或者多個邏輯分區(qū)的各種服務。PHYP225還耦合到存在于物理CECllO外部的硬件管理控制器(HMC) 229。HMC229是圖1A-1B所示管理控制臺175的一個可能實現(xiàn)方式,并且具體在這一圖示內使用HMC229僅用于在若干可用選項之中的一個實際實施例的圖示??梢酝ㄟ^HMC229控制不同邏輯分區(qū)的操作,該HMC是分離的數(shù)據(jù)處理系統(tǒng),系統(tǒng)管理員可以從該數(shù)據(jù)處理系統(tǒng)執(zhí)行各種功能、t匕如將資源向不同邏輯分區(qū)重定位。重要的是,在本實施例中通過HMC控制與OS分區(qū)的并且具體為VIOS和VIOS集群的備份和恢復有關的特征,但是在這里呈現(xiàn)的各種其它實施例中更一般地參照管理控制臺175描述這些特征。
CEC_A110A還包括表示為CEClIOA內的個別客戶端邏輯分區(qū)(LPAR) 114A-114B的多個用戶級LPAR,示出這些LPAR中的前兩個LPAR。根據(jù)各種說明性實施例,CEC110A支持在虛擬化的環(huán)境內“創(chuàng)建”的多個客戶端和其它功能操作OS分區(qū)。每個LPAR、例如客戶端LPAR114A接收具體虛擬化的硬件和OS資源的分配,這些資源包括虛擬化的CPU205A、存儲器210A、0S214A、本地固件216和本地存儲裝置(L存儲庫)218。每個客戶端LPAR114包括相應主機操作系統(tǒng)214,該主機操作系統(tǒng)控制對CECl IOA的硬件層(230)和/或對通過V10S112提供的虛擬化的I/O功能和/或服務的低級訪問。在一個實施例中,可以使用0S/400來實施操作系統(tǒng),該0S/400被設計用于與分區(qū)管理固件、比如PHYP225對接,并且可從國際商用機器公司獲得。要理解的是根據(jù)具體實現(xiàn)方式例如可以利用其它類型的操作系統(tǒng)(比如:Advanced Interactive Executive (AIX)操作系統(tǒng),IBM公司的商標!Microsoft Windows ,微軟公司的商標;或者GNU /LinUX ,F(xiàn)ree SoftwareFoundation和Linux Mark Institute的注冊商標),并且僅使用0S/400作為示例。
此外,根據(jù)示例性實施例,CECl 10A也包括一個或者多個V10S,圖示該VIOS中的兩個V10S112A和112B。在一個實施例中,每個V10S112在存儲器233A-233M之一內被配置,并且包括硬件部件的虛擬化的版本,這些硬件部件包括CPU206、存儲器207、本地存儲裝置208和1/0適配器226以及其它硬件部件。根據(jù)一個實施例,將每個V10S112實施為擁有具體網(wǎng)絡和盤(1/0)適配器的邏輯分區(qū)(LPAR)。每個V10S112也代表單一用途的、專用的LPAR0 V10S112有助于在客戶端邏輯分區(qū)之間共享物理1/0資源。每個V10S112允許其它OS LPAR(其可以被稱為VIO客戶端或者客戶端114),以經由虛擬適配器配對利用V10S112的物理資源。因此,V10S112向CECllO內的客戶端LPAR114提供虛擬小型計算機系統(tǒng)接口(SCSI)目標和共享網(wǎng)絡適配器能力。如這里提供的那樣,V10S112支持虛擬實際存儲器和(對分布式存儲貯存庫150的訪問的)虛擬共享存儲裝置能力以及集群功能。在每個V10S112的本地存儲裝置(L_ST)208內存儲相關VIOS數(shù)據(jù)和集群級數(shù)據(jù)。例如在一個實施例中為本地VIOS硬件、虛擬和邏輯部件的VIOS配置數(shù)據(jù)。此外,本地存儲裝置(L_ST)208包括集群配置數(shù)據(jù)184、集群狀態(tài)數(shù)據(jù)185、活躍節(jié)點列表186。
在CEC110A內,V10S112和客戶端LPAR114利用內部虛擬網(wǎng)絡通信。通過對PHYP225的存儲器的API調用來實施這一通信。V10S112然后將虛擬網(wǎng)絡橋接到物理(1/0)適配器以允許客戶端LPAR114外部通信??蛻舳薒PAR114因此能夠完全在VLAN環(huán)境中連接和互操作。
本領域普通技術人員將理解,圖1A、1B、2A和2B中描繪的硬件、固件/軟件實用工具和軟件部件及其基本配置可以變化。DPS100的所示部件并且具體為CECl 10A內的部件并非旨在于窮舉、而是實際上作為代表以突出顯示為了實施描述的實施例中的某些實施例而利用的部件中的一些部件。例如可以提供數(shù)據(jù)處理系統(tǒng)/CEC設備的不同配置,這些配置包含可以除了描繪的硬件之外也使用的或者取代描繪的硬件而使用的其它設備/部件,并且該其它設備/部件可以不同地進行配置。描繪的示例并非為了意味著隱含關于當前描述的實施例和/或總體發(fā)明的架構或者其它限制。在各種附圖中描繪的CECllO可以例如是運行 Advanced Interactive Executive (AIX)操作系統(tǒng)或者 LINUX 操作系統(tǒng)的 IBM eServerpSeries系統(tǒng),這是Armonk, N.Y.的國際商用機器公司的產品。B.集群感知VIOS上文參照先前附圖并且特別為圖2的描述討論與集群感知VIOS (例如圖1A、圖1B和圖2的V10S112)的實現(xiàn)方式關聯(lián)的特征中的某些特征。將繼續(xù)參照圖1A、圖1B和圖2的圖示提供VIOS的具體功能的描述。如圖2呈現(xiàn)的那樣,每個V10S112是在虛擬化的環(huán)境中模擬硬件的虛擬機實例。向VIOSl 12分派的任務是模擬SCSI存儲設備并且與PHYP225配合批準訪問分布式數(shù)據(jù)存儲庫150。通過HMC229的硬件管理工具執(zhí)行VIOS的配置。SCSI存儲設備支持如下命令的集合,這些命令向SCSI發(fā)起器許可用于控制對存儲裝置的訪問的能力。例如數(shù)據(jù)庫程序可以通過常稱為持久保留的SCSI命令集合管理對分布式數(shù)據(jù)存儲庫150的訪問。V10S112也支持其它類型的保留,并且這樣的命令的匯總組這里稱為保留命令。如這里提供的那樣,每個V10S112允許在客戶端LPAR之間共享物理I/O資源,這包括共享虛擬小型計算機系統(tǒng)接口(SCSI)和虛擬聯(lián)網(wǎng)??梢韵蚍植际綌?shù)據(jù)存儲庫150呈現(xiàn)這些I/o資源為內部或者外部SCSI或者具有RAID適配器或者經由光纖信道適配器的SCSI。然而客戶端LPARl 14使用虛擬SCSI設備驅動器。在一個實施例中,V10S112也通過在分布式數(shù)據(jù)存儲庫150上為每個虛擬盤創(chuàng)建對應文件來提供用于客戶端LPAR的盤虛擬化。VIOSl 12允許通過在客戶端LPAR之間共享來更高效利用物理資源,并且支持單個機器(例如CEC110)并發(fā)地和相互隔離地運行多個操作系統(tǒng)(OS)映像。如在CEC110A的V10S112內提供的那樣,V10S112包括集群感知(CA)OS內核220 (或者簡稱為CA_0S220)以及用于執(zhí)行用于VIOS LPARl 14的與OS內核有關的功能的LPAR功能代碼224。在一個或者多個實施例中,VIOS操作系統(tǒng)是包括集群感知功能并且因此被稱為集群感知0S(CA_0S)的增強型OS。一個實施例例如利用集群感知AIX(CAA)作為操作系統(tǒng)。CA_0S220管理VIOS LPARl 12并且使集群內的VIOS能夠集群感知。圖2B圖不根據(jù)一個實施例的具有若干功能模塊內的不例CA_0S內核220。在說明性的一個實施例中,CA_0S內核220包括集群管理(CM)實用工具222,該CM實用工具支持用于集群級功能的VIOS配置。在CA_0S內還圖示主要節(jié)點選取/操作實用工具182、節(jié)點監(jiān)視和報告實用工具183和事件模塊181以及其它部件。這些附加軟件部件中的每個軟件部件可以在一個實施例中是在CM實用工具內的功能模塊,并且貫穿本說明書的其余部分這樣來描述。在一個實施例中,CM實用工具222可以是(例如從DB140)本地安裝或者下載的分離的實用工具,作為對CECllO內的現(xiàn)有OS的增強。然后在配置VIOS以加入集群時執(zhí)行CM實用工具222,并且CM實用工具222變成集群內的集群感知節(jié)點,并且CM實用工具使OS能夠支持各種集群感知以及其它集群級特征和功能。在備選實施例中,CA_0S220包括所有集群特征和功能,并且在CEC110/V10S112加入集群時和/或在配置VIOSl 12以變成集群感知期間鋪開各種特征。根據(jù)一個實施例,集群感知使多個獨立物理系統(tǒng)能夠作為單個系統(tǒng)來操作和管理。當在一個或者多個節(jié)點內執(zhí)行時,CA_0S220支持如下文更具體描述的各種集群功能、比如形成集群、向集群添加成員和從集群去除成員。在一個實施例中,CM實用工具222也可以支持取回和呈現(xiàn)整個集群的資源的全面視圖。要理解的是盡管將集群操作的各種功能方面描述為分離的部件、模塊和/或實用工具和關聯(lián)數(shù)據(jù)構造,但是不同部件/實用工具/數(shù)據(jù)的整個分組可以由單個可執(zhí)行實用工具/應用、比如CA 0S220提供。因此,在一個實施例中,CA_OS在V10S112內執(zhí)行并且在V10S112內和在DB140內生成/繁衍多個功能部件。在圖1B內介紹這些功能部件中的一些功能部件,并且貫穿這里提供的各種實施例描述其它功能部件。為了在下文描述中的簡化,將假設對集群管理實用工具和CA_0S220的引用是指相同總體部件(即CM實用工具222是CA_0S220的子部件),并且可以貫穿說明書可互換地利用術語。
如說明性實施例(例如圖2A)進一步呈現(xiàn)的那樣,V10S112包括一個或者多個附加功能模塊/部件、比如VIO適配器(接口)226和虛擬I/O驅動器/實用工具228,該功能模塊/部件向VIOSl 12提供I/O功能并且使VIOSl 12能夠向分布式數(shù)據(jù)存儲裝置150和/或DB140內的數(shù)據(jù)結構和存儲裝置路由數(shù)據(jù)流量和從分布式數(shù)據(jù)存儲裝置150和/或DB140內的數(shù)據(jù)結構和存儲裝置路由數(shù)據(jù)流量。如這里描述的那樣,虛擬I/o適配器226和CM實用工具222也使VIOSl 12能夠向每個客戶端LPARl 14提供對在分布式數(shù)據(jù)存儲庫150內可訪問的全范圍存儲裝置以及其它集群支持的功能的訪問。
在說明性實施例中,每個客戶端LPAR114經由PHYP225與V10S112通信。V10S112和客戶端LPAR114A-114B在邏輯上耦合到允許/支持在兩個虛擬化的結構之間通信的PHYP225。每個部件向PHYP225轉發(fā)信息,并且PHYP225然后在物理存儲器中的不同部件(233A-233M)之間路由數(shù)據(jù)。在一個實施例中,I/O適配器的虛擬化的接口也鏈接到PHYP225,從而可以在不同邏輯分區(qū)與一個或者多個本地和/或遠程I/O設備之間傳達I/O操作。與本地I/O路由一樣,經由PHYP225向具體V10S112傳遞從遠程I/O設備進入和/或離開I/O適配器接口或者網(wǎng)絡接口的數(shù)據(jù)流量。
利用圖1A、圖1B和圖2A的上文介紹的系統(tǒng)配置,第一 V10S112a(通過經由PHYP225建立的通信信道)批準通過一個或者多個虛擬適配器對另一 VIOSl 12b的訪問。V10S112包括用于向PHYP225查詢CECllO上的如下客戶端LPAR114的標識的功能,V10S112當前正在該客戶端LPAR上運行。
C.CA VIOS 通信協(xié)議
一個實施例提供一種使得經由相應V10S112和在V10S112內向具體客戶端114指派的虛擬I/o適配器在客戶端114與分布式數(shù)據(jù)存儲庫150之間能夠高效通信的通信協(xié)議。該實施例還經由關于集群感知和分布式數(shù)據(jù)存儲庫150的使用而實施的具體通信機制/協(xié)議提供存儲裝置虛擬化和管理,從而在服務器(CECllO)虛擬化管理的上下文內呈現(xiàn)虛擬化。利用呈現(xiàn)的協(xié)議,與不同CECllO關聯(lián)的不同V10S112訪問相同單個分布式DB140,并且與每個客戶端I/O過程共享/通信集群級信息,從而在第一 CEC上的第一客戶端感知哪些SAN盤資源正在由在第二 CEC上(或者在相同CEC上)的第二客戶端訪問。在與分布式數(shù)據(jù)存儲庫150的I/O交換中考慮這一感知,第一客戶端可以避免訪問第二客戶端當前正在利用的相同存儲資源、因此防止將潛在地引起數(shù)據(jù)破壞和客戶端分區(qū)崩潰的數(shù)據(jù)完整性問題。
通信協(xié)議提供高度集成的、基于服務器的存儲裝置虛擬化以及跨集群式VIOS分區(qū)的分布式存儲裝置。這一協(xié)議包括一個或者多個支持跨越整個集群動態(tài)跟蹤存儲資源使用的查詢特征。貫穿下文描述,應當將通信和管理協(xié)議描述為VIOS協(xié)議。VIOS協(xié)議提供跨集群式Vios分區(qū)的分布式存儲裝置。利用VIOS協(xié)議,存儲裝置被視為包含向每個客戶端114分配的存儲裝置組塊(即邏輯單元或者LU)的一個大型存儲裝置池?,F(xiàn)在構造整個系統(tǒng)(DPS)IOO內的VIOS為集群的一部分而每個VIOS是集群中的節(jié)點。每個VIOS節(jié)點利用VIOS協(xié)議來與其它VIOS節(jié)點通信。利用這一 VIOS配置,在屬于不同CECllO的兩個或者更多客戶端LPARl 14共享SAN上的存儲裝置(例如向兩個客戶端指派重疊LU)時,VIOS協(xié)議使每個節(jié)點能夠查詢(在集群內的每個客戶端)以確定存儲設備的當前使用。在接收這一信息時,VIOS然后可以向其它VIOS散布這一信息。因此使每個客戶端感知到客戶端正在嘗試訪問的SAN存儲設備是否當前正在由某一其它客戶端使用。根據(jù)描述的實現(xiàn)方式,不同客戶端-Vio適配器ID配對在整個集群內唯一,從而在整個集群內沒有兩個客戶端可以共享相同虛擬適配器并且沒有兩個vio適配器ID在單個客戶端內相同。圖3是圖示根據(jù)一個實施例的方法的流程圖,在DPSlOO內的CECllO上的VIOSl 12通過該方法在客戶端LPARl 14與分布式數(shù)據(jù)存儲庫150之間支持集群級通信。過程始于塊302,V10S112在該塊向PHYP225查詢客戶端LPAR1I4的標識。在塊304,V10S112創(chuàng)建用于客戶端的唯一標識符(ID)(即客戶端ID)。V10S112然后在DB140內的客戶端ID數(shù)據(jù)結構159 (圖1B)存儲唯一客戶端ID (塊306)。DB140并且擴展為客戶端ID數(shù)據(jù)結構159可由協(xié)作集群(DPS)IOO內的每個VIOS分區(qū)訪問。在塊308,V10S112也生成用于每個虛擬IT連結的標識符(虛擬I/O適配器ID),該虛擬IT連接用于向客戶端LPARl 14指派的每個虛擬適配器。在一個實施例中,客戶端LPAR114可以具有向它指派的多個虛擬適配器。這些vio適配器ID被存儲于適配器ID數(shù)據(jù)結構158中(塊310)并且與它們的對應客戶端ID關聯(lián)(塊312)。圖3所示方法結束于終止塊314,而已經用DB140關聯(lián)每個客戶端ID與對應一個或者多個vio適配器ID。下文描述的圖4B圖示這些數(shù)據(jù)結構以及在DB140內存儲的其它部件中的若干部件。VIOS SCSI模擬代碼(V10軟件實用工具228提供的可執(zhí)行模塊)利用vio適配器ID以模擬保留命令。通過在與每個存儲裝置池關聯(lián)的訪問列表上提供的唯一客戶端ID管理對存儲裝置池的安全訪問。在一個實施例中,V10S112支持作為在集群環(huán)境中將客戶端LPARl 14從第一(源)CEC(110A)移向第二(目的地)CEC(110B)的部分而調用的命令。命令生成描述虛擬設備的數(shù)據(jù)流,這些數(shù)據(jù)流包括vio適配器信息。該信息用來修改客戶端ID數(shù)據(jù)庫159,從而在目的地CEC (IlOB)上的客戶端的標識與該客戶端的唯一客戶端ID關聯(lián),并且在源CEC (110A)上的VIP適配器的唯一標識符(V10適配器ID)由在目的地CEC(IlOB)上的I/O適配器繼承。P.用于集群管理的VIOS共享DB如這里描述的那樣,用集群的VIOS實施集群感知使VIOS能夠向虛擬客戶端(114)提供集群存儲服務。Vios軟件棧提供以下高級能力以及其它能力:存儲裝置聚合和配備;精簡配備;虛擬客戶端克隆;虛擬客戶端快照;虛擬客戶端遷移;分布式存儲貯存庫;虛擬客戶端鏡像;以及服務器管理基礎設施集成。更一般而言,Vios協(xié)議允許分布式存儲裝置被視為具有名稱空間、位置透明性、串行化和細微粒度安全性的集中式結構化的存儲裝置。VIOS協(xié)議提供存儲裝置池化、分布式存儲裝置以及跨異構SAN和網(wǎng)絡可訪問存儲裝置(NAS)的一致存儲裝置虛擬化接口和能力。為了利用分布式貯存庫來提供塊存儲服務,每個VIOS配置將要向虛擬客戶端導出的虛擬設備。一旦成功配置并且向虛擬主機(VHOST)適配器映射每個虛擬設備,客戶端可以開始根據(jù)需要利用設備。在一個實施例中,利用POWER 虛擬機(VM)虛擬化技術來執(zhí)行虛擬化,該技術允許設備配置過程無縫出現(xiàn),因為物理塊存儲裝置總是可從OS分區(qū)訪問。在去除虛擬目標設備時,刪除對應ODM條目。在集群式環(huán)境內,向其它VIOS通知任何LU的去除。根據(jù)描述的方法,利用分布式設備貯存庫和本地貯存庫高速緩存以保證集群內的節(jié)點變成從集群中的每個節(jié)點(VIOS)的設備級同步。
根據(jù)一個實施例,在DB140中存儲為了配置虛擬目標設備(VTD)而需要的信息。在VIOS集群中的所有節(jié)點可以利用集群感知OS提供的服務、諸如但不限于集群感知AIX(CAA)來訪問這一數(shù)據(jù)庫(DB140)。此外,在每個節(jié)點上的本地數(shù)據(jù)庫(ODM)(例如圖2的存儲裝置234的虛擬化的部分)針對在該節(jié)點上存在的設備存儲某些小的集群數(shù)據(jù)級。這一本地存儲裝置是必要的以便在本地節(jié)點上運行的過程能夠匹配VIOS設備與在分布式數(shù)據(jù)庫中的正確信息。
當在DB140中存儲關于每個設備的信息時,可以從在集群中的任何VIOS節(jié)點而不是僅設備駐留于其上的設備執(zhí)行那些設備上的操作。當在“遠程”(非本地)節(jié)點(即除了設備物理上駐留于的節(jié)點之外的節(jié)點)執(zhí)行設備上的操作時,操作能夠按照需要對設備在DB140中的信息進行任何改變。當在設備的本地數(shù)據(jù)庫中需要對應改變時,對應CM實用工具222使遠程節(jié)點能夠向本地節(jié)點發(fā)送消息(使用集群服務)以通知本地節(jié)點進行所需改變。此外,在引導集群中的節(jié)點時或者在節(jié)點在已經被丟失持續(xù)任何時間段之后重新加入集群時,節(jié)點將自治地引用DB140以便同步其中的數(shù)據(jù)與節(jié)點的本地數(shù)據(jù)。
作為示例,如果在遠程節(jié)點上執(zhí)行用于從本地模式刪除VIOS設備的操作,則操作將從DB140去除與該設備關聯(lián)的信息,并且向本地節(jié)點發(fā)送消息以告知本地設備從本地數(shù)據(jù)庫去除設備。如果本地設備停機或者當前不是集群的一部分,則在本地節(jié)點首次引導或者重新加入集群時,本地節(jié)點將自動訪問DB140、取回當前數(shù)據(jù)/信息——該當前數(shù)據(jù)/信息指示已經去除用于本地設備之一的信息——并且從本地數(shù)據(jù)庫記錄刪除該設備。
圖4B是源節(jié)點、目標節(jié)點和共享存儲裝置(DB140)的功能部件的框圖表示,這些功能部件用于在包括活動分區(qū)移動性操作的集群級操作期間支持集群級信息/數(shù)據(jù)存儲、管理和在節(jié)點與VIOS共享存儲裝置(DB) 140之間的交換。在一個實施例中,DB140的本地副本由在集群內的每個VIOS共享。在一個實施例中,每個VIOS然后負責存儲、維護和更新在DB140的數(shù)據(jù)結構。如圖4B所示,DB140可由各種VIOS節(jié)點112和管理工具405訪問。數(shù)據(jù)庫140包括可以在多種格式(例如表、原始數(shù)據(jù)、定序的數(shù)據(jù)等)中排列的若干不同數(shù)據(jù)模塊。根據(jù)該圖,DB140包括虛擬適配器數(shù)據(jù)結構425,該數(shù)據(jù)結構維護虛擬適配器的列表和關于虛擬適配器的配置信息。DB140也包括第二數(shù)據(jù)結構430,該數(shù)據(jù)結構保持唯一適配器標識符(適配器ID)并且因此在這里被稱為適配器ID數(shù)據(jù)結構430。DB140在VIOS數(shù)據(jù)結構435內維護VIOS的列表和關于VIOS的信息。在一個或者多個實施例中,描述的數(shù)據(jù)結構425-435中的每個數(shù)據(jù)結構可以是或者可以包括DB140內的表。VIOS DB140還包括移動性表510。在一個實施例中,可以在分布式存儲裝置貯存庫150處維護移動性表的副本。
在首次發(fā)現(xiàn)虛擬適配器時,集群管理(CM)實用工具122 (圖1B)創(chuàng)建虛擬適配器數(shù)據(jù)結構425內的行和唯一適配器ID數(shù)據(jù)結構430內的行。在不同數(shù)據(jù)結構中的這兩行相互關聯(lián),并且確保標識符(ID)唯一。在一個或者多個實施例中,適配器名稱在每個CECllO內唯一,并且在VIOS分區(qū)是非“移動”的(即并不從第一 CEC移向第二 CEC)時,可以使用CEC名稱三元組來標識適配器名稱。向內核擴展傳遞適配器ID,并且內核擴展利用適配器ID以標識IT連結、因此允許VIOS集群基于保留命令限制對存儲裝置的訪問。這一方案允許被設計用于訪問物理設備(例如SCSI設備)的軟件有安全性地操作而無需任何修改。這一方案還允許客戶具有對與系統(tǒng)管理員相似的全套現(xiàn)有軟件解決方案的訪問。也向內核分派的任務一旦內核在VOIS登錄時發(fā)現(xiàn)VIOS的標識通過套接字發(fā)送消息。VIOS使用SCSI標準登錄命令,該登錄命令是被稱為SRP的協(xié)議的一部分。由VIOS在PHYP傳送層之上模擬SRP協(xié)議。可以使用SRP登錄作為用于將命令與VIOS的CEC相對標識一起通過套接字發(fā)送的觸發(fā)。一旦處理消息,向內核擴展發(fā)送回消息。消息觸發(fā)對DB140的訪問,該訪問檢查VIOS是否已知。如果VIOS在集群內并不已知,則向VIOS指派唯一標識符并且在DB140內的VIOS數(shù)據(jù)結構435中插入行。在DB140中的適配器數(shù)據(jù)結構425的創(chuàng)建的適配器行與VIOS數(shù)據(jù)結構435的這一行關聯(lián)。管理工具驗證VIOS在由適配器用來模擬邏輯單元時具有對存儲裝置池的訪問權。在描述的實施例中,內核擴展直至VIOS標識被驗證才允許對利用受限存儲裝置池的邏輯單元的I/O訪問。在說明性實施例的主要功能特征之中是用于對DSP100內的各種CECl 10的V10S112集群化的能力(圖1A-圖1B)。此外,VIOS提供如下集群服務,可以暴露這些服務以讓操作不僅在本地VIOS上而且在遠程節(jié)點上被調用而客戶沒有感知這樣的動作。這些技術的引入需要客戶、即管理工具能夠理解VIOS在VIOS是集群的一部分時當前正在用什么能力運行以及VIOS潛在地能夠運行什么。圖4B圖示在根據(jù)一個實施例的管理工具180 (比如IBM公司的Systems Director)與在DPS100內的VIOS節(jié)點之間的通信。E.VIOS集群移動件根據(jù)一個或者多個實施例,由CM實用工具222提供的算法/功能軟件模塊也解決VIOS從這里稱為源CEC的第一 CEC移向這里稱為目的地或者目標CEC的第二 CEC。VIOS在支持在集群感知DPS100內執(zhí)行移動性操作時發(fā)揮的作用之一是向在目的地CEC上的VIOS描述在源CEC上在使用中的存儲裝置。由第一 V10S112a提供的描述包括向用于源適配器的適配器表中的關鍵字。關鍵字用來基于數(shù)據(jù)庫關系(例如在數(shù)據(jù)庫內的數(shù)據(jù)結構(例如表)的關聯(lián))發(fā)現(xiàn)客戶端(114)和唯一適配器ID信息。向驗證存儲器裝置訪問的內核擴展傳遞唯一適配器ID。PHYP發(fā)信號通知移動性操作的終止,并且作為該完成的一部分,用新CEC相對標識符更新VIOS表內的行。因此,盡管完成特定LPAR的移動,但是在數(shù)據(jù)庫(分布式存儲貯存庫150)內未改變向該OS分區(qū)指派的唯一適配器ID。CEC相對標識符允許VIOS得以被發(fā)現(xiàn),而唯一適配器ID允許安全實施存儲裝置池訪問權。這一方案允許用于池安全性的管理工具實施的靈活性從而允許系統(tǒng)管理員便利地使用。F.在集群式分區(qū)移動性期間的故障恢復在一個實現(xiàn)方式中,在可由對應VIOSl 12訪問的本地設備存儲裝置上對CM實用工具222的某些功能部件編碼,從而VIOSl 12能夠立即向集群注冊和/或(在向集群成功注冊時)從DB140取回/下載或者已經下載必要CM軟件、信息和/或數(shù)據(jù)以在CECllO內初始地激活VIOS時變成集群感知。除了 CM實用工具222的本地存儲的軟件實用工具部件之夕卜,可以在CEC被上電時或者在CECl 10上啟用一個或者多個VIOSl 12和/或一個或者多個新客戶端LPAR114時從DB140下載CM實用工具222的其它功能部件。此外,根據(jù)當前描述的實施例,在CEC上提供附加功能以在活動分區(qū)移動性期間支持故障恢復?;顒臃謪^(qū)移動性(LPM)實用工具在如下CEC內執(zhí)行,來自該CEC的客戶端分區(qū)正在經歷從在第一 CEC上的源VIOS向在第二 CEC上的目標VIOS的活動移動性操作。LPM實用工具激活集群的源VIOS和包括目標VIOS的一個或者多個其它VIOS內的(的CA_0S的CM實用工具的)LPM模塊。
根據(jù)一個或者多個實施例并且如圖5A和圖5B所示,將LPM實用工具550實施為管理工具180的和/或來自管理控制臺175的一部分。其它實施例可以提供LPM實用工具位于PHYP225內或者與PHYP225關聯(lián)?,F(xiàn)在參照圖5A,圖示根據(jù)一個或者多個實施例的數(shù)據(jù)處理系統(tǒng),該數(shù)據(jù)處理系統(tǒng)具有可以用來在VIOS集群內發(fā)起和支持活動分區(qū)移動性的硬件和軟件部件。所示處理系統(tǒng)提供/支持示例管理控制臺的功能并且因此這里稱為管理控制臺175以求一致性。理解管理控制臺175的物理配置可以不同于圖5A中所示物理配置,并且僅出于示例目的而提供這里呈現(xiàn)的具體配置。
如圖所示,管理控制臺175包括經由系統(tǒng)總線/互連504通信地耦合到本地存儲器506和I/O控制器/橋接器510的處理器502。I/O控制器/橋接器510具有一個或者多個I/O設備所連接到的關聯(lián)I/O總線,圖示該I/O設備中的鍵盤514和指點設備516 (例如鼠標)。顯示器520經由圖形/顯示適配器518連接到I/O總線512。同樣連接到I/O總線512的還有網(wǎng)絡接口 522和I/O適配器524。網(wǎng)絡接口支持與比如網(wǎng)絡結構170(圖1A-圖1C)所示外部網(wǎng)絡的連接。I/O適配器524可以是支持與I/O設備和/或另一數(shù)據(jù)處理系統(tǒng)、比如CECllO (圖1A-圖1C和圖2) I/O對接的任何I/O適配器。管理控制臺175還包括存儲設備530,可以在該存儲設備內存儲與管理控制臺上的過程有關的指令/代碼/數(shù)據(jù)。
除了這些硬件部件之外,使管理控制臺175能夠在VIOS集群環(huán)境內充當管理設備的多個軟件部件位于本地存儲器506內。在這些軟件部件之中是本地0S508和管理工具180。如先前描述的管理工具180支持/提供與VIOS集群的管理有關的功能中的某些功能,這些功能包括發(fā)起設置向具體客戶端指派的個別客戶端LPAR以及與CEC上或者VIOS集群內的客戶端LPAR和VIOS關聯(lián)的全部管理功能。具體針對當前描述的實施例,管理工具180提供/包括LPM實用工具550,該LPM實用工具在處理器502上執(zhí)行以提供與在VIOS集群內的活動分區(qū)移動性操作關聯(lián)的多個功能。在一個實施例中,可以經由虛擬化管理部件225支持管理工具180 (和/或LPM實用工具550)功能到VIOS的通信。在提供的實施例中,也可以在VIOS內提供LPM實用工具180的特征中的一些特征,并且描述實施例而無對是否在管理控制臺175上或者在管理工具通信地連接到的V10S112上實施特征的具體限制。
在一個實施例中,LPM實用工具550提供如下代碼/程序指令,在CECllO內的一個或者多個VIOSl 12的一個或者多個虛擬處理器資源上和/或在管理控制臺175的處理器502上執(zhí)行這些代碼/程序指令以提供具體功能。在執(zhí)行LPM實用工具550時提供的并且這里更具體描述的功能之中是以下非窮盡性列舉:(a)在第一 VIOS上創(chuàng)建第一監(jiān)視線程以跟蹤LPM事件的狀況;通過使用所述第一監(jiān)視線程在數(shù)據(jù)庫內監(jiān)視關于LPM事件的信息;(b)如果第一 VIOS和第一監(jiān)視線程崩潰則標識繼續(xù)在第一源服務器上工作的第一組工作中的監(jiān)視線程;(c)確定第一組工作中的監(jiān)視線程是否為單個最后監(jiān)視線程;并且(d)如果在第一服務器上存在表現(xiàn)多個預先標識的故障條件(來自如下非窮盡性列舉:(a) VIOS不再能夠執(zhí)行I/O操作、(b)VIOS離線或者(c)從集群去除V10S)中的一個或者多個故障條件的節(jié)點,則經由最后工作線程基于在第一服務器上存在處于崩潰狀態(tài)中的節(jié)點這樣的指示在數(shù)據(jù)庫內執(zhí)行更新操作。現(xiàn)在轉向圖5B,圖示根據(jù)一個實施例的被配置用于有效支持活動分區(qū)移動性(LPM)事件的示例VIOS集群(即VIOS的集群感知匯集)。根據(jù)一個或者多個實施例,LPM實用工具550提供的算法/功能軟件模塊還考慮一個LPAR(例如LPAR114A)從源CEC110A向目標/目的地CEC110B的遷移。在VIOS集群(DPS100)內的每個VIOS可以被視為集群中的節(jié)點。響應于檢測到LPM事件的開始,LPM實用工具550發(fā)起在與LPM事件對應的第一V10S112A上創(chuàng)建第一監(jiān)視線程(例如通過使用監(jiān)視器線程模塊504)。LPM事件具體是指在CEClIOA(即第一源服務器)上的LPAR向在相同VIOS集群(DPS100)內的CEClIOB(即第二目標服務器)的傳送。第一 V10S112A在如下源服務器(例如CEC110A)上運行,客戶端/LPAR114A當前訪問來自該源服務器的存儲裝置。此外,LPM實用工具550發(fā)起在(相同)源服務器上運行的每個其它VIOS (包括V10S112B)上創(chuàng)建其它監(jiān)視線程(例如經由監(jiān)視線程模塊506)。另外,LPM實用工具550在如下目標服務器(例如CECl10B)上的第二 VIOS上發(fā)起創(chuàng)建監(jiān)視線程,一旦(遷移的)客戶端正在目標服務器(例如CEC110B)上運行,客戶端隨后訪問(即被預計后續(xù)訪問)來自該目標服務器的存儲裝置。與在源服務器上創(chuàng)建其它監(jiān)視線程相似,LPM實用工具550在目標服務器上的每個其它VIOS (例如包括VIOSl 12D)上創(chuàng)建其它監(jiān)視線程的匯集。LPM實用工具550通過使適當監(jiān)視線程能夠在V10SDB140的數(shù)據(jù)庫520中的“移動性表”(例如表510)中創(chuàng)建或者更新相應行來提供關于特定LPM事件的當前/最新信息。在一個實施例中,移動性表510可以與在分布式存儲貯存庫150內存儲的數(shù)據(jù)庫關聯(lián)。監(jiān)視線程通過與管理程序125通信來不斷檢查LPM的狀態(tài)。如果特定VIOS (例如V10S512A)處于故障條件(或者正在經歷若干預定義故障條件之一),則LPM實用工具550向其它工作節(jié)點/VIOS提供分區(qū)故障的通知。LPM實用工具550使工作中的監(jiān)視線程能夠更新表510內的LPM狀況。具體而言,最后監(jiān)視線程可以基于在第一服務器上存在處于故障狀態(tài)中的節(jié)點這樣的指示而在數(shù)據(jù)庫內執(zhí)行更新操作。在圖6中進一步描述利用移動性表510以在集群式分區(qū)移動性中高效提供多節(jié)點故障恢復。圖6圖示根據(jù)一個實施例的監(jiān)視線程在LPM事件期間更新的示例移動性表。表510分別在表510的三行內提供關于三個示例LPM事件的信息。在表510中,與監(jiān)視器線程模塊504關聯(lián)的第一監(jiān)視線程在發(fā)起與LPARl 14A關聯(lián)的LPM事件時創(chuàng)建行602。在一個實施例中,LPM實用工具550使(關系)數(shù)據(jù)庫能夠指向客戶端分區(qū)表以保持客戶端分區(qū)的跟蹤并且提供關于客戶端(例如“客戶端I”)的信息。另外,LPM實用工具550使數(shù)據(jù)庫能夠映射到若干客戶端分區(qū)表,在LPM事件中涉及到的和/或在源服務器上正在運行的每個VIOS —個分區(qū)表。在用于集群VIOS的數(shù)據(jù)庫系統(tǒng)中,這些客戶端分區(qū)表可以被統(tǒng)稱為客戶端移動性表。在一個實施例中,LPM實用工具550檢測LPM事件的開始并且使特定監(jiān)視線程能夠在移動性表510中創(chuàng)建行。在一個實施例中,LPM實用工具550確定特定LPM事件已經具有在移動性表中保留的行。如果尚未向移動性表中錄入特定LPM事件,則LPM實用工具550使在其上發(fā)起LPM的VIOS的第一監(jiān)視線程能夠在移動性表510中創(chuàng)建適當行。如果先前已經向移動性表中錄入特定LPM事件,則LPM實用工具550使第一監(jiān)視線程或者其它適當監(jiān)視線程(例如最后監(jiān)視線程)能夠更新移動性表510的相應行。
在更新/創(chuàng)建的行502中,LPM實用工具550支持存儲關于以下各項的信息:(a)監(jiān)視線程所基于的服務器(例如CEC110A) ;(b)監(jiān)視線程針對其來監(jiān)視關聯(lián)LPM的客戶端(例如控制/利用LPAR114A的“客戶端I” );以及(c)與監(jiān)視的LPM對應的節(jié)點/VIOS的當前狀態(tài)(即節(jié)點/VIOS是否正在運行或者已經崩潰)。例如行502指示LPARl當前正在“運行”。由于第一監(jiān)視線程在分區(qū)(例如V10S512A和關聯(lián)LPAR)停機的情況下中止存在于事件中,所以LPM實用工具550通過集群感知DPS100提供的功能在數(shù)據(jù)庫(例如VIOSDB140)保持狀態(tài)字段為當前。也就是說,如果集群識別出節(jié)點故障,則集群更新VIOS表的適當行內的狀態(tài)字段以指示“故障”。監(jiān)視線程通過與管理程序125通信來不斷檢查LPM的狀態(tài)。如果終止遷移,則第一監(jiān)視線程執(zhí)行某些動作,這些動作包括可能清理存儲資源和從移動性表510去除相應行。第一監(jiān)視線程執(zhí)行這些預計和所需的功能直至節(jié)點(VIOS)在LPM期問出故障(并且作為結果,第一監(jiān)視線程也出故障)。在第一監(jiān)視線程出故障(例如由于VIOS故障條件)時,LPM實用工具550運用在相同CEC內保持工作的其它監(jiān)視線程以完成出故障的第一監(jiān)視線程不能執(zhí)行的工作如下:在向監(jiān)視線程通知LPM操作結束(完成或者出故障)時,也向監(jiān)視線程供應在服務器上有多少其它線程當前正在監(jiān)視遷移的計數(shù)。如果通知的監(jiān)視線程為最后,則LPM實用工具550使“最后”監(jiān)視線程能夠查詢移動性數(shù)據(jù)庫表510以確定在相同服務器上是否存在處于故障/崩潰狀態(tài)中的任何節(jié)點。對于(最后)監(jiān)視線程發(fā)現(xiàn)在崩潰狀態(tài)中的任何條目(例如(第二)行504的LPAR2),最后監(jiān)視線程執(zhí)行為了保持數(shù)據(jù)庫為當前/ 一致而需要的操作、然后從表510去除行。因而只要在LPM操作中涉及到的至少單個節(jié)點幸存(并且提供“最后”監(jiān)視線程)就容許多個節(jié)點故障。在一個實施例中,LPM實用工具550能夠使遷移退回至遷移過程的特定階段。因此例如響應于LPM操作已經作為故障條件的結果而結束,實用工具返回至對應遷移過程的特定階段以便恢復和完成移動性操作。如果LPM過程失敗,則LPM實用工具550可以觸發(fā)終止使用在目標服務器的資源。另一方面,如果LPM過程成功,則LPM實用工具550可以終止使用在源服務器處的資源。作為DPS100的集群感知特征和特性的結果,在相同共享VIOS DB 140的表510中的第三行506的條目指示在LPM事件中涉及到的并且基于不同服務器(例如CEC110B)的特定分區(qū)(即LPAR3)也正在由在集群(即DPS100)內的監(jiān)視線程監(jiān)視。圖7-圖8是圖示各種方法的流程圖,通過這些方法完成示例實施例的上述過程。雖然可以參照圖1-6中圖示的并且參照圖1-圖6描述的部件和功能描述圖7-8中所示方法,但是應當理解,這僅出于方便,并且可以在實施各種方法時運用其備選部件和配置。方法的某些部分可以由在VIOSl 12(圖1或者2)內的一個或者多個(虛擬)處理器(CPU206A)上或者在管理工具180 (在管理控制臺175內)或者DB140的處理資源上執(zhí)行的LPM實用工具550完成。執(zhí)行的過程然后控制CEC110、客戶端LPAR114、V10S112、DB140和/或分布式數(shù)據(jù)存儲庫150的和/或在它們上的具體操作。為了方法描述的簡化,從LPM實用工具550或者VIOS/節(jié)點112或者二者的視角描述所有方法過程。圖7圖示了根據(jù)一個實施例的方法,VIOS集群通過該方法監(jiān)視LPM事件、更新移動性表并且提供從節(jié)點故障中恢復。該方法始于發(fā)起塊702并且繼續(xù)塊704,LPM實用工具550在該塊檢測LPM事件的發(fā)起。在塊706,LPM實用工具550發(fā)起創(chuàng)建在與LPM事件對應的VIOS上的第一監(jiān)視線程和在如下源服務器上的VIOS上的其它監(jiān)視線程,客戶端當前從該源服務器訪問存儲裝置。在塊708,LPM實用工具550使第一監(jiān)視線程更新/創(chuàng)建移動性表510的行。在塊710,LPM實用工具550發(fā)起通過經由一個或者多個監(jiān)視線程與PHYP通信來不斷檢查LPM狀態(tài)。在塊712,LPM實用工具550檢測與LPM事件對應的節(jié)點/VIOS的故障。在塊714,LPM實用工具550向集群通知節(jié)點故障。如在塊716所示,LPM實用工具550使集群并且具體為在源服務器上的VIOS上的其它監(jiān)視線程能夠將LPM狀況更新為崩潰。在判決塊718,LPM實用工具550確定是否成功完成或者終止LPAR遷移。如果LPM實用工具550確定終止或者成功完成LPAR遷移,則如在塊720所示,LPM實用工具550從移動性表510去除對應行。如果LPM實用工具550確定未終止或者成功完成LPAR遷移,則過程移向塊722,過程在該塊結束。
圖8圖示根據(jù)一個實施例的方法,VIOS集群通過該方法使用在第一監(jiān)視線程已經出故障之后保持工作/或活躍的監(jiān)視線程,以保持數(shù)據(jù)庫為當前并且提供數(shù)據(jù)庫一致性。該方法始于塊802并且前進到塊804,LPM實用工具550在該塊804經由(第一)監(jiān)視線程監(jiān)視LPM事件。在判決塊806,LPM實用工具550確定是否結束(即終止或者完成)LPM事件。如果LPM實用工具550確定結束LPM事件,則如在塊808所示,LPM實用工具550接收計數(shù),該計數(shù)指示當前監(jiān)視LPM的其它線程的數(shù)量。如果LPM實用工具550確定LPM事件尚未結束,則過程返回至塊804。在塊810,LPM實用工具550發(fā)起檢查以確定接收計數(shù)信息的特定監(jiān)視線程是否為最后監(jiān)視線程。在判決塊812,LPM實用工具550確定計數(shù)信息是否由單個/最后剩余(和工作)監(jiān)視線程接收。如果LPM實用工具550在判決塊812確定計數(shù)信息由最后監(jiān)視線程所接收,則如在塊814所示,LPM實用工具550使最后監(jiān)視線程能夠查詢數(shù)據(jù)庫/表以確定在服務器上是否存在出于故障/崩潰狀態(tài)中的節(jié)點。在一個實施例中,如果LPM實用工具550在判決塊812確定最后監(jiān)視線程未接收計數(shù)信息(即多于一個工作的監(jiān)視線程剩余),則如在塊815所示,LPM實用工具550選擇特定監(jiān)視線程以查詢數(shù)據(jù)庫/表以確定在服務器上是否存在處于崩潰狀態(tài)中的節(jié)點。在判決塊816,LPM實用工具550確定在服務器上是否存在處于故障/崩潰狀態(tài)中的VIOS/節(jié)點。如果LPM實用工具550確定在服務器上存在處于故障/崩潰狀態(tài)中的VIOS/節(jié)點,則如在塊818所示,LPM實用工具550從移動性表510 (經由最后或所選擇的監(jiān)視線程)去除與一個或者多個出故障/崩潰的VIOS對應的行。如果LPM實用工具550確定在服務器上無處于崩潰狀態(tài)中的VIOS/節(jié)點,則過程移向塊820,過程在該塊結束。
在這里呈現(xiàn)和描述的各種附圖中的流程圖和框示根據(jù)本發(fā)明的各種實施例的系統(tǒng)、方法和計算機程序產品的可能實現(xiàn)方式的架構、功能和操作。就這一點而言,在流程圖或者框圖中的每個塊可以代表如下代碼模塊、段或者部分,該代碼模塊、段或者部分包括用于實施指定的邏輯功能的一個或者多個可執(zhí)行指令。也應當注意,在一些備選實現(xiàn)方式中,在塊中指出的功能可以不按圖中指出的順序出現(xiàn)。例如事實上根據(jù)涉及到的功能可以基本上并行執(zhí)行接連示出的兩個塊或者有時可以按照相反順序執(zhí)行這些塊。也將注意,框圖和/或流程示的每個塊以及在框圖和/或流程示中的塊組合可以由執(zhí)行指定的功能或者動作的基于專用硬件的系統(tǒng)實施或者由專用硬件與計算機指令的組合實施。
在上述流程圖中,在包含計算機可讀代碼的計算機可讀介質中實現(xiàn)方法中的一種或者多種方法,從而當(處理單元)在計算設備上執(zhí)行計算機可讀代碼時執(zhí)行系列步驟。在一些實現(xiàn)方式中,組合、同時或者按照不同順序執(zhí)行或者可能省略方法的某些過程而未脫離本發(fā)明的精神實質和范圍。因此,盡管在特定序列中描述和圖示方法過程,但是特定序列的使用并非為了意味著關于本發(fā)明的任何限制??梢躁P于過程序列進行改變而未脫離本發(fā)明的范圍。因此不會在限制意義上解釋特定序列的使用,并且本發(fā)明的范圍擴展至所附權利要求及其等效含義。所屬技術領域的技術人員知道,本發(fā)明的各個方面可以實現(xiàn)為系統(tǒng)、方法或計算機程序產品。因此,本發(fā)明的各個方面可以具體實現(xiàn)為以下形式,即:完全的硬件實施方式、完全的軟件實施方式(包括固件、駐留軟件、微代碼等),或硬件和軟件方面結合的實施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。此外,在一些實施例中,本發(fā)明的各個方面還可以實現(xiàn)為在一個或多個計算機可讀介質中的計算機程序產品的形式,該計算機可讀介質中包含計算機可讀的程序代碼。可以采用一個或多個計算機可讀介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可以是一但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、便攜式計算機盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPR0M或閃存)、光纖、便攜式緊湊盤只讀存儲器(CD-ROM)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結合使用。計算機可讀的信號介質可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括——但不限于——電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質還可以是計算機可讀存儲介質以外的任何計算機可讀介質,該計算機可讀介質可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結合使用的程序。計算機可讀介質上包含的程序代碼可以用任何適當?shù)慕橘|傳輸,包括一但不限于——無線、有線、光纜、RF等等,或者上述的任意合適的組合??梢砸砸环N或多種程序設計語言的任意組合來編寫用于執(zhí)行本發(fā)明操作的計算機程序代碼,所述程序設計語言包括面向對象的程序設計語言-諸如Java、Smalltalk、C++等,還包括常規(guī)的過程式程序設計語言-諸如“C”語言或類似的程序設計語言。程序代碼可以完全地在用戶計算機上執(zhí)行、部分地在用戶計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務器上執(zhí)行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網(wǎng)絡一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)-連接到用戶計算機,或者,可以連接到外部計算機(例如利用因特網(wǎng)服務提供商來通過因特網(wǎng)連接)。下面將參照根據(jù)本發(fā)明實施例的方法、裝置(系統(tǒng))和計算機程序產品的流程圖和/或框圖描述本發(fā)明。應當理解,流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方框的組合,都可以由計算機程序指令實現(xiàn)。這些計算機程序指令可以提供給通用計算機、專用計算機或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產出一種機器,使得這些計算機程序指令在通過計算機或其它可編程數(shù)據(jù)處理裝置的處理器執(zhí)行時,產生了實現(xiàn)流程圖和/或框圖中的一個或多個方框中規(guī)定的功能/動作的裝置。
這些計算機程序指令也可以存儲于計算機可讀介質中,該計算機可讀介質可以指引計算機、其它可編程數(shù)據(jù)處理裝置或者其它設備以特定方式工作,從而存儲于計算機可讀介質中的指令產生包括指令的制造品,這些指令實施在流程圖和/或框圖的一個或者多個塊中指定的功能/動作。也可以向計算機、其它可編程數(shù)據(jù)處理裝置或者其它設備上加載計算機程序指令以使系列操作步驟在計算機、其它可編程裝置或者其它設備上執(zhí)行以產生計算機實施的過程,從而在計算機或者其它可編程裝置上執(zhí)行的指令提供用于實施在流程圖和/或框圖的一個或者多個塊中指定的功能/動作的過程。
如將進一步理解的那樣,可以使用軟件、固件或者硬件的任何組合來實施本發(fā)明的實施例中的過程。作為在軟件中實現(xiàn)本發(fā)明的預備步驟,程序代碼(無論是軟件或者固件)將通常存儲于一個或者多個機器可讀存儲介質、比如固定(硬)驅動、磁盤、光盤、磁帶、半導體存儲器如ROM、PROM等中、由此產生根據(jù)本發(fā)明的制造品。通過從存儲設備直接執(zhí)行編程代碼、通過從存儲設備向諸如硬盤、RAM等另一存儲設備中復制代碼或者通過使用傳輸型介質、比如數(shù)字和模擬通信鏈路傳輸代碼用于遠程執(zhí)行來使用包含編程代碼的制造品??梢酝ㄟ^組合包含根據(jù)本發(fā)明的代碼的一個或者多個機器可讀存儲設備與適當處理硬件以執(zhí)行其中包含的代碼來實現(xiàn)本發(fā)明的方法。用于實現(xiàn)本發(fā)明的裝置可以是一個或者多個處理設備和存儲系統(tǒng),該存儲系統(tǒng)包含根據(jù)本發(fā)明編碼的程序或者具有對該程序的網(wǎng)絡訪問。
因此重要的是,盡管在具有安裝(或者執(zhí)行)的軟件的全功能計算機(服務器)系統(tǒng)的背景中描述本發(fā)明的一個示例實施例,但是本領域技術人員將理解,能夠用多種形式分發(fā)本發(fā)明的一個示例實施例的軟件方面為程序產品并且本發(fā)明的一個示例實施例無論用來實際實現(xiàn)分發(fā)的特定介質類型如何都同樣適用。
盡管已經參照示例實施例描述本發(fā)明,但是本領域技術人員將理解,可以進行各種改變并且等效要素可以替換其要素而未脫離本發(fā)明的范圍。此外,可以進行許多修改以使特定系統(tǒng)、設備或者其部件適應本發(fā)明的教導而未脫離其實質范圍。因此旨在于本發(fā)明不限于公開的用于實現(xiàn)本發(fā)明的具體實施例、但是本發(fā)明將包括落入所附權利要求的范圍內的所有實施例。另外,使用術語第一、第二等未表示任何順序或者重要性,但是實際上,術語第一、第二等用來區(qū)分一個要素與另一要素。
這里所用術語僅用于描述具體實施例這樣的目的而并非旨在于限制本發(fā)明。如這里所用,除非上下文另有明示,則單數(shù)形式“一(個)”和“該(所述)”旨在于也包括復數(shù)形式。還將理解,術語“包括”在使用于本說明書中時指定存在陳述的特征、整件、步驟、操作、單元和/或部件、但是未排除存在或者添加一個或者多個其它特征、整件、步驟、操作、單元、部件和/或其組合。
在所附權利要求中的所有裝置或者步驟加上功能單元的對應結構、材料、動作和等效物旨在于包括如具體要求保護的用于與其它要求保護的單元組合執(zhí)行功能的任何結構、材料或者動作。本發(fā)明的描述已經出于示例和描述的目的而加以呈現(xiàn)、但是并非旨在于窮舉本發(fā)明或者使本發(fā)明限于公開的形式。許多修改和變化將為本領域普通技術人員所清楚而未脫離本發(fā)明的范圍和精神實質。選擇和描述實施例以便最好地說明本發(fā)明的原理和實際應用并且使本領域其他普通技術人員能夠針對具有如與設想的特定使用相適合的各種修改的各種實施例理解本發(fā)明。
權利要求
1.一種用于操作數(shù)據(jù)處理系統(tǒng)的方法,所述數(shù)據(jù)處理系統(tǒng)具有處理器、耦合到所述處理器的存儲器、支持到具有共享存儲貯存庫的外部網(wǎng)絡的連接的至少一個輸入/輸出(I/O)適配器、以及形成具有共享數(shù)據(jù)庫的虛擬I/O服務器(VIOS)集群的多個V10S,其中每個VIOS是集群感知的,所述方法包括: 在第一服務器的第一 VIOS上激活第一監(jiān)視線程以跟蹤活動分區(qū)移動性(LPM)事件的狀況; 通過使用所述第一監(jiān)視線程在所述共享數(shù)據(jù)庫內記錄關于所述LPM事件的信息; 響應于所述第一 VIOS遭受故障條件而標識繼續(xù)在源服務器上工作的一個或者多個工作中的監(jiān)視線程,其中所述故障條件造成所述第一監(jiān)視線程對LPM事件監(jiān)視的丟失; 確定所述一個或者多個工作中的監(jiān)視線程是否為單個、最后的監(jiān)視線程;以及響應于在所述第一服務器上的第一 VIOS處于故障狀態(tài)而經由所述最后的監(jiān)視線程在所述共享數(shù)據(jù)庫內執(zhí)行清理和更新操作,其中響應于接收到在所述第一服務器上存在處于所述故障狀態(tài)的一個或者多個節(jié)點的指示來 執(zhí)行所述清理和更新。
2.根據(jù)權利要求1所述的方法,其中所述激活第一監(jiān)視線程還包括: 檢測LPM事件的發(fā)起;以及 響應于檢測到所述LPM事件的所述發(fā)起,創(chuàng)建以下各項中的一項或者多項:(a)在所述集群感知數(shù)據(jù)處理系統(tǒng)內的所述第一服務器上的所述第一 VIOS上的所述第一監(jiān)視線程;(b)在所述第一服務器上的其它VIOS上的第一組監(jiān)視線程;以及(c)在第二目標服務器上的VIOS上的第二組監(jiān)視線程。
3.根據(jù)權利要求1或者2所述的方法,其中所述記錄還包括: 使用所述監(jiān)視線程將關于所述LPM事件的信息記錄到移動性表中, 其中所記錄的信息包括關于以下各項中的一項或者多項的信息:(a)客戶端;(b)所述服務器;以及(c)參與所述LPM事件的對應VIOS的狀況; 確定所述LPM事件何時被終止;以及 響應于所述LPM事件被終止而經由所述第一監(jiān)視線程提供以下各項中的一項或者多項:(a)對存儲資源的相關聯(lián)更新;(b)在所述數(shù)據(jù)庫的移動性表中去除對應條目;以及(c)其它維護操作。
4.根據(jù)任一前述權利要求所述的方法,還包括: 檢測與所述LPM對應的虛擬化的客戶端分區(qū)相關聯(lián)的特定VIOS何時已經遭受故障條件; 響應于檢測到所述特定VIOS已經遭受所述故障條件并且對應的監(jiān)視線程不再存在,而向在所述集群感知DPS內的相同服務器上的其它VIOS提供所述VIOS的所述故障狀態(tài)的通知;以及 使得所述其它VIOS中的一個或者多個VIOS能夠在所述數(shù)據(jù)庫中適當?shù)馗翷PM事件狀況。
5.根據(jù)任一前述權利要求所述的方法,還包括: 發(fā)起由其它監(jiān)視線程經由所述其它監(jiān)視線程與管理程序的通信而對所述LPM事件的狀態(tài)的不斷檢查; 確定所述LPM事件是否為以下各項之一:(a)終止;(b)完成;以及(c)處于故障狀態(tài);響應于所述LPM事件結束而向所述其它監(jiān)視線程提供:(a)指示所述LPM事件結束的信息;以及(b)關于當前監(jiān)視所述LPM事件的所述組的其它監(jiān)視線程的計數(shù)的信息; 響應于所述組的其它監(jiān)視線程為單個、最后的監(jiān)視線程,而經由所述最后監(jiān)視線程發(fā)起對所述數(shù)據(jù)庫的查詢以確定在適當?shù)姆掌魃鲜欠翊嬖谔幱诠收蠣顟B(tài)的節(jié)點;以及 響應于在所述適當?shù)姆掌魃系墓?jié)點處于故障狀態(tài),而經由所述最后的監(jiān)視線程在對應移動性表上執(zhí)行包括以下操作中的一個或者多個操作的更新操作:(a)為了將所述數(shù)據(jù)庫保持為一致且當前的而需要的操作;(b)從所述對應移動性表去除對應行/條目;以及(c)其它維護操作。
6.根據(jù)權利要求5所述的方法,還包括: 響應于所述LPM事件已經作為故障條件的結果而結束,返回至對應遷移過程的特定階段以便恢復和完成所述移動性操作。
7.一種數(shù)據(jù)處理系統(tǒng),包括: 處理器; 分布式數(shù)據(jù)存儲庫; 輸入/輸出(I/O)接口,耦合到外部網(wǎng)絡;以及 存儲器,耦合到所述處理器,其中所述存儲器包括: 管理程序; 多個操作系統(tǒng)(OS)分區(qū);以及 實用工具,其在所述處理器上被執(zhí)行時提供: 用于在第一服務器的第一 VIOS上激活第一監(jiān)視線程以跟蹤活動分區(qū)移動性(LPM)事件的狀況的裝置; 用于通過使用所述第一監(jiān)視線程而在所共享的數(shù)據(jù)庫內記錄關于所述LPM事件的信息的裝置; 用于響應于所述第一 VIOS遭受故障條件來標識繼續(xù)在源服務器上工作的一個或者多個工作中的監(jiān)視線程的裝置,其中所述故障條件造成所述第一監(jiān)視線程對LPM事件監(jiān)視的丟失; 用于確定所述一個或者多個工作中的監(jiān)視線程是否為單個、最后的監(jiān)視線程的裝置;以及 用于響應于在所述第一服務器上的第一 VIOS處于故障狀態(tài)而經由所述最后的監(jiān)視線程在所共享的數(shù)據(jù)庫內執(zhí)行清理和更新操作的裝置,其中響應于接收到在所述第一服務器上存在處于所述故障狀態(tài)中的一個或者多個節(jié)點的指示來執(zhí)行所述清理和更新。
8.根據(jù)權利要求7所述的數(shù)據(jù)處理系統(tǒng),其中所述用于激活第一監(jiān)視線程的裝置還包括: 用于檢測LPM事件的發(fā)起的裝置;以及 用于響應于檢測到所述LPM事件的所述發(fā)起來創(chuàng)建以下各項中的一項或者多項的裝置:(a)在所述集群感知數(shù)據(jù)處理系統(tǒng)內的所述第一服務器上的所述第一 VIOS上的所述第一監(jiān)視線程;(b)在所述第一服務器上的其它VIOS上的第一組監(jiān)視線程;以及(c)在第二目標服務器上的VIOS上的第二組監(jiān)視線程。
9.根據(jù)權利要求7或者8所述的數(shù)據(jù)處理系統(tǒng),其中所述用于記錄的裝置還包括:用于使用所述監(jiān)視線程將關于所述LPM事件的信息記錄到移動性表中的裝置, 其中所記錄的信息包括關于以下各項中的一項或者多項的信息:(a)客戶端;(b)所述服務器;以及(c)參與所述LPM事件的對應VIOS的狀況; 用于確定所述LPM事件何時被終止的裝置;以及 用于響應于所述LPM事件被終止而經由所述第一監(jiān)視線程提供以下各項中的一項或者多項的裝置:(a)對存儲資源的相關聯(lián)更新;(b)在所述數(shù)據(jù)庫的移動性表中去除對應條目;以及(c)其它維護操作。
10.根據(jù)權利要求7至9中的任一權利要求所述的數(shù)據(jù)處理系統(tǒng),其中所述實用工具還包括: 用于檢測與所述LPM對應的虛擬化的客戶端分區(qū)相關聯(lián)的特定VIOS何時已經遭受故障條件的裝置; 用于響應于檢測到所述特定VIOS已經遭受所述故障條件并且對應的監(jiān)視線程不再存在而向在所述集群感知DPS內的相同服務器上的其它VIOS提供所述VIOS的所述故障狀態(tài)的通知的裝置;以及 用于使得所述其它VIOS中的一個或者多個VIOS能夠在所述數(shù)據(jù)庫中適當?shù)馗翷PM事件狀況的裝置。
11.根據(jù)權利要求7至10中的任一權利要求所述的數(shù)據(jù)處理系統(tǒng),其中所述實用工具還包括: 用于由其它監(jiān)視線程發(fā)起經由所述其它監(jiān)視線程與管理程序的通信而對所述LPM事件的狀態(tài)的不斷檢查的裝置; 用于確定所述LPM事件是否為以下各項之一的裝置:(a)終止;(b)完成;以及(c)處于故障狀態(tài); 用于響應于所述組的其它監(jiān)視線程為單個、最后的監(jiān)視線程而經由所述最后的監(jiān)視線程發(fā)起對所述數(shù)據(jù)庫的查詢以確定在適當?shù)姆掌魃鲜欠翊嬖谔幱诠收蠣顟B(tài)的節(jié)點的裝置;以及 用于響應于在所述適當?shù)姆掌魃系墓?jié)點處于故障狀態(tài)而經由所述最后的監(jiān)視線程在對應移動性表上執(zhí)行包括以下操作中的一個或者多個操作的更新操作的裝置:(a)為了將所述數(shù)據(jù)庫保持為一致且當前的而需要的操作;(b)從所述對應移動性表去除對應行/條目;以及(C)其它維護操作。
12.根據(jù)權利要求11所述的數(shù)據(jù)處理系統(tǒng),其中所述實用工具還包括:用于響應于所述LPM事件已經作為故障條件的結果而結束而返回至對應遷移過程的特定階段以便恢復和完成所述移動性操作的裝置。
13.一種計算機程序產品,包括: 計算機存儲介質;以及 在所述計算機存儲介質上的程序代碼,所述程序代碼在由數(shù)據(jù)處理系統(tǒng)內的處理器執(zhí)行時提供以下功能: 在第一服務器的第一 VIOS上激活第一監(jiān)視線程以跟蹤活動分區(qū)移動性(LPM)事件的狀況; 通過使用所述第一監(jiān)視線程在所共享的數(shù)據(jù)庫內記錄關于所述LPM事件的信息;響應于所述第一 Vios遭受故障條件而標識繼續(xù)在源服務器上工作的一個或者多個工作中的監(jiān)視線程,其中所述故障條件造成所述第一監(jiān)視線程對LPM事件監(jiān)視的丟失; 確定所述一個或者多個工作中的監(jiān)視線程是否為單個、最后的監(jiān)視線程;以及響應于在所述第一服務器上的第一 VIOS處于故障狀態(tài)而經由所述最后的監(jiān)視線程在所共享的數(shù)據(jù)庫內執(zhí)行清理和更新操作,其中響應于接收到在所述第一服務器上存在處于所述故障狀態(tài)的一個或者多個節(jié)點的指示來執(zhí)行所述清理和更新。
14.根據(jù)權利要求13所述的計算機程序產品,其中所述用于激活第一監(jiān)視線程的程序代碼還包括用于以下功能的程序代碼: 檢測LPM事件的發(fā)起;以及 響應于檢測到所述LPM事件的所述發(fā)起,創(chuàng)建以下各項中的一項或者多項:(a)在所述集群感知數(shù)據(jù)處理系統(tǒng)內的所述第一服務器上的所述第一 VIOS上的所述第一監(jiān)視線程;(b)在所述第一服務器上的其它VIOS上的第一組監(jiān)視線程;以及(c)在第二目標服務器上的VIOS上的第二組監(jiān)視線程。
15.根據(jù)權利要求13所述的計算機程序產品,其中所述用于記錄的程序代碼還包括用于以下功能的程序代碼: 使用所述監(jiān)視線程將關于所述LPM事件的信息記錄到移動性表中, 其中所記錄的信息包括關于 以下各項中的一項或者多項的信息:(a)客戶端;(b)所述服務器;以及(c)參與所述LPM事件的對應VIOS的狀況; 確定所述LPM事件何時被終止;以及 響應于所述LPM事件被終止,經由所述第一監(jiān)視線程提供以下各項中的一項或者多項:(a)對存儲資源的相關聯(lián)更新;(b)在所述數(shù)據(jù)庫的移動性表中去除對應條目;以及(c)其它維護操作。
16.根據(jù)權利要求13所述的計算機程序產品,還包括用于以下功能的程序代碼: 檢測與所述LPM對應的虛擬化的客戶端分區(qū)相關聯(lián)的特定VIOS何時已經遭受故障條件; 響應于檢測到所述特定VIOS已經遭受所述故障條件并且對應的監(jiān)視線程不再存在而向在所述集群感知DPS內的相同服務器上的其它VIOS提供所述VIOS的所述故障狀態(tài)的通知;以及 使得所述其它VIOS中的一個或者多個VIOS能夠在所述數(shù)據(jù)庫中適當?shù)馗翷PM事件狀況。
17.根據(jù)權利要求13所述的計算機程序產品,還包括用于以下功能的程序代碼: 發(fā)起由其它監(jiān)視線程經由所述其它監(jiān)視線程與管理程序的通信而對所述LPM事件的狀態(tài)的不斷檢查; 確定所述LPM事件是否為以下各項之一:(a)終止;(b)完成;以及(c)處于故障狀態(tài);響應于所述組的其它監(jiān)視線程為單個、最后的監(jiān)視線程,經由所述最后的監(jiān)視線程發(fā)起對所述數(shù)據(jù)庫的查詢以確定在適當?shù)姆掌魃鲜欠翊嬖谔幱诠收蠣顟B(tài)的節(jié)點;以及 響應于在所述適當?shù)姆掌魃系墓?jié)點處于故障狀態(tài)而經由所述最后的監(jiān)視線程在對應移動性表上執(zhí)行包括以下操作中的一個或者多個操作的更新操作:(a)為了將所述數(shù)據(jù)庫保持為一致且當前的而需要的操作;(b)從所述對應移動性表去除對應行/條目;以及(C)其它維護操作。
18.根據(jù)權利要求17所述的計算機程序產品,還包括用于以下功能的程序代碼: 響應于所述LPM事件已經作為故障條件的結果而結束,返回至對應遷移過程的特定階段以便恢復和完成所述移動性操作。
19.一種計算機程序,包括計算機程序代碼裝置,所述計算機程序代碼裝置適于在所述程序在數(shù)據(jù)處理系統(tǒng) 上運行時執(zhí)行根據(jù)權利要求1至6所述的所有步驟。
全文摘要
一種方法、系統(tǒng)和計算機程序產品利用集群感知以有效地支持活動分區(qū)移動性(LPM)事件并且提供從虛擬輸入/輸出(I/O)服務器(VIOS)集群內的節(jié)點故障中恢復。LPM實用工具在發(fā)起對應LPM事件時在第一VIOS上創(chuàng)建監(jiān)視線程。監(jiān)視線程跟蹤LPM的狀態(tài)并且在數(shù)據(jù)庫的移動性表中記錄狀態(tài)信息。LPM實用工具在(相同)源服務器上運行的其它VIOS上創(chuàng)建其它監(jiān)視線程。如果第一VIOS遭受多個故障之一,則LPM實用工具向其它工作節(jié)點/VIOS提供通知。LPM實用工具使工作中的監(jiān)視線程能夠更新LPM狀態(tài)。具體而言,最后的監(jiān)視線程可以基于在第一服務器上存在處于故障狀態(tài)中的節(jié)點的指示在數(shù)據(jù)庫內執(zhí)行清理/更新操作。
文檔編號G06F11/20GK103189847SQ201180053200
公開日2013年7月3日 申請日期2011年10月24日 優(yōu)先權日2010年11月5日
發(fā)明者G·梅維尼, J·帕弗米, D·尼瓦里茨, J·J·羅薩萊斯 申請人:國際商業(yè)機器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1