專利名稱:用于使存儲管理便于進行的設備、系統(tǒng)和方法
技術領域:
本發(fā)明涉及數據存儲計算機系統(tǒng)。具體來說,本發(fā)明涉及用于通過組織存儲資源來使存儲管理便于進行的設備、系統(tǒng)和方法。
背景技術:
計算機和信息技術在其能力和復雜性方面繼續(xù)前進并發(fā)展。特別是,數據存儲系統(tǒng)繼續(xù)發(fā)展,以滿足對物理數據存儲系統(tǒng)的可靠性、可用性和可服務性(serviceability)及其硬件、軟件和各個其它組件的日益增長的需要。數據存儲系統(tǒng)常常處理任務關鍵數據。因此,依照24/7調度,期望數據存儲系統(tǒng)保持是聯(lián)機且可用的。此外,在不顯著地損害處理來自主機的數據輸入/輸出(I/O)的可靠性和可用性的情況下,期望數據存儲系統(tǒng)處理功率和服務停機、硬件和軟件故障、甚至是例程系統(tǒng)維護。
圖1圖示了常規(guī)的數據存儲系統(tǒng)100。系統(tǒng)100包括通過諸如存儲區(qū)域網絡(Storage Area Network,SAN)106連接到存儲子系統(tǒng)104的一個或多個主機102。主機102向存儲子系統(tǒng)104傳送數據I/O。主機102在本領域中是公知的,并且包括被配置為向存儲子系統(tǒng)104傳送數據I/O的任何計算機系統(tǒng)。
適于與本發(fā)明一起使用的存儲子系統(tǒng)104的一個例子是可從紐約Armonk的國際商業(yè)機器公司(IBM)處獲得的IBM EnterpriseStorage Server(企業(yè)存儲服務器)。為了提供可靠性、可用性和冗余性,存儲子系統(tǒng)104包括經由獨立信道連接到SAN106的多個主機適配器(未示出)。主機適配器108可以支持諸如光纖信道(FibreChannel)之類的高速通信協(xié)議。當然,可以使用其它各種主機適配器108來支持其它協(xié)議,其中包括但不限于因特網小型計算機接口(Internet Small Computer Interface,iSCSI)、基于IP的光纖信道(Fibre Channel over IP,F(xiàn)CIP)、企業(yè)系統(tǒng)連接(Enterprise SystemsConnection,ESCON)、InfiniBand和以太網。存儲子系統(tǒng)104使用一個或多個海量存儲設備108來存儲并獲取數據,所述海量存儲設備108諸如為但不局限于直接存取存儲設備、磁帶存儲設備等。
隨著硬件成本下降,由于包括冗余的硬件和硬件子系統(tǒng),所以數據存儲系統(tǒng)100變得更加復雜了。通常,硬件組件對故障很敏感。因此,存儲子系統(tǒng)104可以包括一個或多個處理器、電子存儲器設備、主機適配器等。
典型情況下,為了最高產地使用冗余硬件,特別地在多個邏輯節(jié)點110之間分配或共享硬件。邏輯節(jié)點110表示分配存儲子系統(tǒng)104的計算硬件資源,使得每個邏輯節(jié)點110能夠獨立于另一邏輯節(jié)點110來執(zhí)行操作系統(tǒng)(OS)112。另外,每個邏輯節(jié)點110操作獨立的應用集114。邏輯節(jié)點110在主機102看來是獨立的物理計算系統(tǒng)。
也被稱為管理程序(Hypervisor,PHYP)116的協(xié)調模塊116在兩個或更多個定義的邏輯節(jié)點110之間協(xié)調對專用和共享的硬件資源的使用??梢栽趯S锰幚砥魃嫌霉碳韺崿F(xiàn)PHYP 116。典型情況下,邏輯節(jié)點110共享存儲器。PHYP 116可以確保邏輯節(jié)點110不會訪問存儲器的不適當扇區(qū)。
把存儲子系統(tǒng)104分離為多個邏輯節(jié)點110提供了更高的可靠性。如果一個邏輯節(jié)點110由于軟件或硬件問題而導致崩潰/失敗,一個或多個其它邏輯節(jié)點110可以用來繼續(xù)或重新開始正由崩潰的邏輯節(jié)點110所執(zhí)行的任務。
管理、控制和服務于多個邏輯節(jié)點110是一個挑戰(zhàn)。任何管理、控制、維護、監(jiān)視、故障檢修或服務操作都應當與恒定的I/O處理相協(xié)調,從而使得不會損害存儲子系統(tǒng)104的24/7可用性。典型情況下,管理控制臺118經由與I/O信道分離的控制通信(這里被稱作“帶外(out-of-band)通信”)來管理存儲子系統(tǒng)104。
存儲子系統(tǒng)104可以包括諸如以太網卡之類的網絡適配器,以用于進行帶外通信。管理控制臺118可以包括獨立的計算機系統(tǒng),諸如用于執(zhí)行獨立的OS和管理應用集的工作站。管理控制臺118允許管理員與PHYP116對接以便開始(創(chuàng)建)、停止并配置邏輯節(jié)點110。
不幸地是,管理控制臺118的管理能力受到嚴重限制。特別地,邏輯節(jié)點110是完全獨立且無關的。因此,為了管理多個邏輯節(jié)點110,例如,為了設置存儲空間定額,管理員必須單獨地登錄到每個節(jié)點110,做出修改并繼而注銷。此處理過程非常乏味,并且隨著操作中所涉及的邏輯節(jié)點110的數目增加,可能會導致錯誤。當前,無法同時管理兩個或多個邏輯節(jié)點110。順序地一次一個地管理節(jié)點110。
由于可靠性和可用性優(yōu)點的原因,希望關聯(lián)兩個或多個邏輯節(jié)點110以使得每個節(jié)點110主動地鏡像其它節(jié)點的所有操作。依照這種方式,如果一個節(jié)點110出故障/崩潰了,那么其它節(jié)點可以接管并繼續(xù)服務于I/O請求。還希望從單個管理節(jié)點根據需要將相關聯(lián)的邏輯節(jié)點110一起作為單個實體來管理或分別地對其進行管理。然而,當前在邏輯節(jié)點110之間不存在關系,并且無法一次同時管理一個以上的邏輯節(jié)點110。
在存儲子系統(tǒng)104中加劇了管理和服務改變的重復性質,其中節(jié)點110可以是高度統(tǒng)一的,并且可能在配置方面只是如小到名稱這樣的屬性不同。存儲設備還可能希望向一個或多個通常配置的節(jié)點110應用策略、屬性或約束的各種組合。當前,為了這樣做,管理員必須分別跟蹤節(jié)點110之間的異同之處,以便可以實現(xiàn)并維護策略。實現(xiàn)并維護應用于節(jié)點110的子集上的任何策略是困難且費時的。
即便節(jié)點110是相關的,管理員也必須分別地登錄到每個節(jié)點110,并且可能必須物理地移動到不同的管理控制臺118的機器以便完成管理操作。相關的節(jié)點110可以提供冗余的I/O操作。但是,管理相關的節(jié)點110是一種挑戰(zhàn)且是費時的。每個均必須被分別管理的節(jié)點110的大量數目限制了管理員的效率。
發(fā)明內容
因此,本發(fā)明提供了一種用于通過單個管理模塊使對邏輯節(jié)點的管理便于進行的設備、系統(tǒng)和方法,其克服了本領域中的許多或所有上述缺點。
依照本發(fā)明的一個方面的設備包括配置模塊、信息模塊和尋址(address)模塊。配置模塊配置第一邏輯實體和第二邏輯實體以便在對等域中相互交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信。
對等域可以包括相關的兩個或多個邏輯實體,使得由一個實體所執(zhí)行的I/O和管理操作由其它實體自動地執(zhí)行。兩個或多個邏輯實體可以是相關的,以便提供專用于每個邏輯實體的硬件的冗余。邏輯實體可以對應于邏輯節(jié)點、虛擬機、邏輯分區(qū)(Logical Partitions,LPAR)、存儲設備映像(Storage Facility Image,SFI)、存儲應用映像(Storage Application Image,SAI)等。對等域中的邏輯實體均可以包括基本上相等的權限以彼此監(jiān)視并管理。在一個實施例中,對等域中的第一邏輯實體和第二邏輯實體被配置為,響應于邏輯實體之一出現(xiàn)故障,而接管另一邏輯實體的操作。操作的邏輯實體可以記錄自從出故障的邏輯實體脫機以來的改變的集合,并且響應于出故障的邏輯實體變?yōu)槁?lián)機,而恢復該改變集合。
信息模塊向管理節(jié)點揭示第一邏輯實體的本地資源和第二邏輯實體的本地資源。本地資源被揭示,使得第一邏輯實體和第二邏輯實體的本地資源可用作來自管理節(jié)點的管理命令的目標資源。信息模塊可以向管理節(jié)點廣播第一邏輯實體的本地資源和第二邏輯實體的本地資源。作為選擇,信息模塊可以把第一邏輯實體的本地資源和第二邏輯實體的本地資源登記在可由管理節(jié)點存取的中央儲存庫中。
管理節(jié)點可以與第一邏輯實體和第二邏輯實體處于管理關系。管理關系定義了允許管理節(jié)點管理并監(jiān)視邏輯實體的管理域。然而,邏輯實體不能管理或監(jiān)視管理節(jié)點。
在某些實施例中,管理域包括彼此在對等域中的第一組邏輯實體和彼此在對等域中的第二組邏輯實體。每個邏輯實體的本地資源可以被揭示給管理節(jié)點,以便用作管理命令的目標資源。此外,每組的邏輯實體可能不能與其它組的邏輯實體進行通信。管理命令可以是以兩組邏輯實體、一組邏輯實體、或任一組或兩組中的個別邏輯實體為目標的。
在另一實施例中,管理域包括被配置為與在管理對等域中的管理節(jié)點相交互的第二管理節(jié)點。管理對等域允許任一管理節(jié)點響應于管理節(jié)點之一的故障而監(jiān)視并接管管理操作。
在某些實施例中,同步模塊響應于由第一邏輯實體或第二邏輯實體對本地資源所進行的修改,使用于表示第一邏輯實體和第二邏輯實體的本地資源的資源定義同步。
第一邏輯實體和第二邏輯實體可以包括通用硬件平臺的邏輯分區(qū)(LPAR)。LPAR可以被配置為使得每個LPAR在通用硬件平臺的獨立中央電子設備復合體(Central Electronics Complex,CEC)上執(zhí)行。第一邏輯實體和第二邏輯實體可以定義可獨立管理的存儲設備映像(SFI)。管理模塊可以被配置為向管理域內的多個SFI發(fā)送管理命令。作為選擇,或者另外地,在可獨立管理的存儲應用映像(SAI)中定義了邏輯實體對。
還給出了本發(fā)明的信號承載介質,其包括被配置為執(zhí)行用于通過組織存儲資源而使存儲管理便于進行的操作的計算機可讀指令。在一個實施例中,所述操作包括用于配置第一邏輯實體和第二邏輯實體以便在對等域中彼此相交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信的操作。另一操作向管理節(jié)點揭示第一邏輯實體的本地資源和第二邏輯實體的本地資源,使得所述第一邏輯實體和第二邏輯實體的本地資源可用作來自管理節(jié)點的管理命令的目標資源。最后,執(zhí)行一個操作,以便有選擇地從管理節(jié)點向第一邏輯實體的本地資源和第二邏輯實體的本地資源尋址(address)管理命令。
本發(fā)明還包括被設置為下述系統(tǒng)、方法和設備的實施例,該系統(tǒng)、方法和設備包括與上面針對所述設備和方法所描述的組件和步驟基本上相同的功能。
因此,在本發(fā)明的實施例中,提供了一種用于使存儲管理便于進行的設備、系統(tǒng)和方法。有利的是,這種設備、系統(tǒng)和方法根據需要自動地把兩個或多個相關節(jié)點作為單個實體管理或分別地加以管理。類似地,所述設備、系統(tǒng)和方法支持對相關節(jié)點的組的管理,使得在所述組之間維護了安全性,但是可以容易地實現(xiàn)并維護不同的策略。此外,所述設備、系統(tǒng)和方法支持對多個硬件平臺、諸如例如存儲子系統(tǒng)的管理,以用于節(jié)點的不同分組(grouping)。所述設備、系統(tǒng)和方法允許冗余管理節(jié)點主動地管理多個相關和/或無關的節(jié)點。
現(xiàn)在參考附圖僅以舉例形式來描述本發(fā)明的實施例,其中圖1是圖示了用于管理多個無關的、獨立的邏輯節(jié)點的常規(guī)系統(tǒng)的框圖;圖2是依照本發(fā)明的實施例圖示了通過組織存儲資源來使存儲管理便于進行的實體組織結構的邏輯框圖;圖3是依照本發(fā)明的任何實施例圖示了通過組織存儲資源來使存儲管理便于進行的設備的一個實施例的邏輯框圖;圖4是圖示了適于實現(xiàn)本發(fā)明的某些實施例的代表性系統(tǒng)的示意性框圖;圖5是依照本發(fā)明的一個實施例圖示了利用在圖4中所圖示的系統(tǒng)組件的實體的邏輯表示的示意性框圖;和圖6是圖示了通過組織存儲資源來使存儲管理便于進行的方法的示意性流程圖。
具體實施例方式
通過參考附圖最好地理解了本發(fā)明所圖示的實施例,其中在所有附圖中同樣的部分由同樣的數字來表示。以下的描述僅僅意在舉例,并且簡單地圖示了與這里所要求的本發(fā)明一致的設備、系統(tǒng)和處理過程的某些選擇的實施例。
圖2圖示了用于使存儲管理便于進行的管理結構200的邏輯表示。在某些實施例中,第一邏輯實體202和第二邏輯實體204共享對等關系206。如這里所用,“邏輯實體”指的是用于表示共享一個關系的兩個或多個事物(邏輯或物理的)的任何邏輯構造。據此,在整個說明書中所使用的邏輯實體可以包括邏輯節(jié)點、虛擬機、邏輯分區(qū)(LPAR)、存儲設備映像(SFI,下面將更詳細地論述)、存儲應用映像(SAI,下面將更詳細地論述)等。
由對等關系206相關的一對邏輯實體202、204是有益的。在一個實施例中,邏輯實體202、204可以充當用于定義可由主機102訪問的多個邏輯存儲設備的存儲實體。換句話說,存儲設備上的存儲空間可以被分配給每個邏輯設備,并且被配置為給出邏輯存儲設備以供主機102使用。
優(yōu)選地,第一邏輯實體202被配置為基本上與第二邏輯實體204相同。每個邏輯實體202、204可以主動地服務于I/O通信,從而使得如果一個實體202、204出故障,那么另一實體202、204可以繼續(xù)服務于進一步的I/O通信而沒有任何中斷。邏輯實體202、204互相充當彼此的“熱(hot)”(主動)備份。當一個邏輯實體202、204出故障時,在使用一個邏輯實體202、204或另一個邏輯實體的過程中不存在延遲。因為希望一個邏輯實體202、204的故障不為主機102所注意,所以利用相同的大小、參數及其它屬性來配置所述邏輯實體202、204。
還應當使用相同的命令來管理類似配置的邏輯實體202、204,使得實體202、204在其配置方面保持與另一實體202、204同步。本發(fā)明把邏輯實體202、204組織到對等域208中。對等域208表示一個或多個實體202、204的邏輯分組。每個邏輯實體202、204與另一邏輯實體202、204通信,使得在一個實體202、204上所執(zhí)行的操作也在另一實體202、204上自動執(zhí)行。還可以定義第二對等域210,其具有處于對等關系206中的第三邏輯實體212和第四邏輯實體214。優(yōu)選的是,阻止第一對等域208中的成員與第二對等域210中的成員進行通信或對其進行監(jiān)視或控制,并且反之亦然?,F(xiàn)在描述對等域208和邏輯實體202、204。本領域技術人員將會認識到,還可以容易地向對等域210和第三邏輯實體212以及第四邏輯實體214應用該描述。
優(yōu)選的是,對等域208在對等域208的邏輯實體202、204之間提供了直接通信(沒有中介物)。當然,對等域208可以包括兩個以上的邏輯實體202、204。
典型情況下,把兩個或多個邏輯實體202、204置于對等域208中,提供了可從邏輯實體202、204中所獲得的資源的較高可用性。如果一個實體202、204出故障,那么另一實體繼續(xù)操作。然而,如上所述,如果要求管理節(jié)點216分別連接到并管理每個邏輯實體202、204,那么邏輯實體202、204的常規(guī)管理可能遭到挑戰(zhàn)。
在本發(fā)明中,對等域208的分組確保了由一個實體202、204所執(zhí)行的I/O操作和管理操作被鏡像到另一實體202、204上。在某些實施例中,對等域208的第一成員(即,將要聯(lián)機的第一個成員)變?yōu)閷Φ润w領導者(peer leader)。管理節(jié)點216可以向對等域208的任何成員或直接向對等體領導者傳送(218)管理命令。如果實體202、204不是對等體領導者,那么所述命令可以被轉發(fā)到所述對等體領導者。對等體領導者解釋所述命令。如果命令可適用于對等域208的所有成員,那么在所有成員之間鏡像該命令。依照這種方式,單個管理命令可以被發(fā)布到對等域208的單個實體202、204,并且對所述對等域208的所有成員進行改變。同樣地,第二對等域210依照類似方式操作。
把實體202、204組織到對等域208中,允許管理員分組同樣的實體,諸如,互相充當彼此的冗余自動備份的存儲實體。雖然管理節(jié)點216可以根據需要與每個實體202、204進行通信(218),但是管理節(jié)點216還可以向作為單個實體208的對等域208傳達單個管理命令。依照這種方式,降低了管理負擔/開銷。
管理節(jié)點216是用于監(jiān)視并管理一個或多個實體202、204、212、214的操作的物理或邏輯計算設備。優(yōu)選的是,管理節(jié)點216使用帶外通信信道218,以便與實體202、204、212、214相交互并監(jiān)視它們。與管理節(jié)點216進行通信(218)的實體202、204、212、214定義了管理域220。
管理域220包括至少一個管理節(jié)點216和至少一個管理實體。管理節(jié)點216向所管理的實體202、204、212、214發(fā)送諸如狀態(tài)查詢或配置改變之類的管理命令。
某些監(jiān)視和管理命令要求管理節(jié)點216可以訪問為每個202、204所定義的資源222、223。如這里所用,“資源”指的是被物理地分配給邏輯實體202、204、212、214的或在邏輯上為所述邏輯實體202、204、212、214定義的固件、軟件、硬件和邏輯實體。資源的例子包括物理和邏輯存儲設備、存儲設備控制器、I/O設備、I/O設備驅動器、存儲器設備、存儲器控制器、處理器、對稱多處理器控制器、固件設備、固件可執(zhí)行代碼、操作系統(tǒng)、應用、進程、線程、操作系統(tǒng)服務等。
對等域208中的每個實體202、204的資源222、223可以是相同的。作為選擇,不考慮域208、210,在所有實體202、204、212、214上的資源222、223可以是相同或不同的。如關于圖3更詳細地解釋得那樣,本發(fā)明揭示管理域220中的所有實體202、204、212、214的資源222、223。管理節(jié)點216使用關于資源222、223的信息,以便使管理命令以特定的資源222、223(也被稱為是目標資源222、223)為目標。典型情況下,目標資源是管理命令的對象,并且可以包括整個實體202。
圖2圖示了在管理域220中將實體202、204、212、214設置在對等域208、210中的一種潛在方案。當然,其它配置也是可以的。例如,第三邏輯實體212可以位于對等域208內,并且與第一實體202和第二實體204具有直接對等關系206。把實體分組到管理域220內的對等域208、210中,允許將成對的同構邏輯實體202、204作為單個實體(對等域208)來管理。此外,組織結構可以依照包括實體202、204的目的、功能或地理位置在內的各種因素來分組所述實體202、204。對等域208、210可以為了安全和保密目的而分離,但是仍然通過單個管理節(jié)點216來管理。
在一個實施例中,第一實體202和第二實體204包括第一對等域208的處于對等關系206中的第一組邏輯實體202、204。第三實體212和第四實體214包括第二對等域210的處于對等關系206中的第二組邏輯實體212、214。優(yōu)選的是,在第一組邏輯實體202、204和第二組邏輯實體212、214之間不存在通信。第一組邏輯實體202、204、第二組邏輯實體212、214和管理節(jié)點216一起形成管理域220。第一組邏輯實體202、204和第二組邏輯實體212、214的資源222、223被揭示給管理節(jié)點216,使得所述管理節(jié)點216可以發(fā)送以任何一組的資源222、223為目標的管理命令。
依照這種方式,第一組邏輯實體202、204和第二組邏輯實體212、214彼此相分離。然而,管理節(jié)點216可以向作為單個實體的兩組之一、向單個實體、或一起向兩個組發(fā)送管理命令。這種組織結構提供了靈活性,特別是因為一組兩個或多個實體可以作為單個單元來管理。如上所述,被發(fā)送到一組中的對等體領導者的管理命令根據需要被適當地路由到該組的相關實體(一個或多個)。管理節(jié)點216可以向第一組、第二組或者第一組和第二組兩者發(fā)送命令。
例如,如果在第二組邏輯實體212、214上要求服務過程,那么管理節(jié)點216可以發(fā)布單個停頓存儲命令,用于在邏輯實體212、214兩者上自動地處理排隊的I/O并且停止任何進一步的I/O通信處理。然后服務過程可以包括諸如使邏輯實體212、214脫機(再次使用單個命令)之類的附加管理命令等。
如上所述,系統(tǒng)的物理和邏輯實體的冗余向計算系統(tǒng)提供了高的可用性、可靠性和可服務性。一個冗余實體是不可用的,而另一個冗余實體是可用的,使得冗余資源222、223的用戶在不通知不可用實體的情況下繼續(xù)使用所述資源222、223。
在一個實施例中,冗余管理節(jié)點224鏡像管理節(jié)點216的操作。管理節(jié)點216、224可以在對等關系206中相交互。管理節(jié)點216、224一起形成管理對等域226,用于允許任一管理節(jié)點216、224響應于管理節(jié)點216、224之一的故障而監(jiān)視并接管對多個對等域208、210的管理操作。管理對等域226只包括管理節(jié)點216、224,并且允許所述管理節(jié)點216、224根據需要互相監(jiān)視并實現(xiàn)接管過程。依照這種方式,可以提供冗余管理,以便進一步提高系統(tǒng)的可靠性、可服務性和可用性。
圖3圖示了用于使存儲管理便于進行的設備300的一個實施例。設備300使計算機系統(tǒng)管理員能夠向在通用域306中所定義的、無組織的多個實體302和管理節(jié)點304應用組織和次序。根據組織的需要和物理硬件,通用域306中的實體數目可以介于二和幾百之間。在沒有某種形式的組織結構的情況下,把實體302或其資源222、223標識為管理命令的目的地或目標,可能是困難的。如果組織希望實現(xiàn)冗余的同構實體,那么問題會進一步復雜化。本發(fā)明的設備300實現(xiàn)了一定的次序和組織結構,并且實施了關于中間實體通信的某些規(guī)則以使得管理便于進行和自動化,特別是對于那些旨在彼此互相鏡像并備份的實體來說更是如此。因此,只需要較少的、被尋址到不同邏輯實體的重復的管理命令。另外,次序和組織使得便于區(qū)分兩個或多個類似配置的實體302。
設備300可以包括配置模塊308、信息模塊310和同步模塊312。配置模塊308配置第一邏輯實體314以便與對等域208中的第二邏輯實體316相交互。第一邏輯實體314與第二邏輯實體316直接通信,并且鏡像所述第二邏輯實體316的操作。換句話說,第一邏輯實體314和第二邏輯實體316具有對等關系206。
在一個實施例的對等域208中,邏輯實體314、316具有基本上相等的權限來互相監(jiān)視并管理。這允許任一邏輯實體314、316充當對等體領導者并且向另一邏輯實體314傳遞管理命令。因此,如同在本發(fā)明的不同系統(tǒng)和子系統(tǒng)中所提供的冗余一樣,不存在單個故障點。優(yōu)選的是,每個組件具有冗余的相應組件,從而提供了高可用性。
在一個實施例中,邏輯實體314、316包括計算機系統(tǒng)的邏輯分區(qū)(LPAR),每個LPAR被分配有獨立的計算機硬件集合(處理器、存儲器、I/O、存儲設備)。對等域208可以包括一對LPAR,以便提供冗余。
在一個實施例中,配置模塊308定義了用于控制邏輯實體314、316的通信和鏡像從而使得每個邏輯實體只鏡像并管理對等域208中的另一邏輯實體314、316的操作的邏輯。例如,一個邏輯實體314、316可以被指定為對等體領導者。被發(fā)送到對等域208的所有管理命令通過對等體領導者來路由。管理命令和I/O通信可以根據需要被鏡像到每個邏輯實體314、316上。
信息模塊310向管理節(jié)點318揭示第一邏輯實體314和第二邏輯實體316的本地資源222。在一個實施例中,信息模塊310使用每個管理節(jié)點318的預定通信地址來向管理域220中的每個管理節(jié)點318廣播用于定義本地資源222的信息。信息模塊310可以廣播用于定義本地資源222的初始信息以及對用于定義所述本地資源222的信息所進行的修改。每個管理節(jié)點318可以接收所述信息,并且把該信息與適當實體314、316的標識符相關聯(lián)。
作為選擇,信息模塊310把用于邏輯實體314、316的本地資源222登記(320)到中央儲存庫322中。信息模塊310可以登記初始信息。然后,根據需要,邏輯實體可以登記對所述信息的更新。目標資源222的中央儲存庫322可以包括數據庫,其中把目標資源222與適當的邏輯實體314、316相關聯(lián)。作為選擇,中央儲存庫322可以包括文件或任何其它數據結構,其用于把本地資源222與邏輯實體314、316相關聯(lián),并且可由管理節(jié)點318訪問。
在某些實施例中,管理節(jié)點318使用面向對象的架構來管理邏輯實體314、316,其中管理節(jié)點和邏輯實體由包括屬性和方法的軟件對象來表示。所述屬性存儲關于對象的數據。所述方法包括被特別地配置為實現(xiàn)所述對象的某一功能的邏輯。面向對象的架構可以控制對關于資源222的信息的訪問。例如,如果管理節(jié)點318是經授權的管理器,那么用于表示實體314、316的軟件對象可以允許訪問方法報告關于本地資源的信息。換句話說,可以使通??赡軙嫵蓪ο蟮乃接袑傩院?或方法的信息可用于用來表示管理節(jié)點318的軟件對象。
同步模塊312使用于表示本地資源222的資源定義同步。資源定義可以被存儲在中央儲存庫322中。在由邏輯實體314、316或直接由管理節(jié)點318對本地資源222進行修改之后,同步模塊312使資源定義同步。修改可以包括資源222的配置改變、更新的版本信息、定義或刪除等。在某些實施例中,同步模塊312和/或其某些部分可以駐留在邏輯實體314、316和/或管理節(jié)點318上。
在一個實施例中,設備300包括駐留在管理節(jié)點318上的尋址模塊324。在某些實施例中,尋址模塊324和/或其某些部分可以駐留在邏輯實體314、316和/或管理節(jié)點318上。尋址模塊324從管理節(jié)點318向邏輯實體314、316的本地資源222有選擇地尋址管理命令。如上所述和如這里所用,本地資源222可以表示與邏輯實體314、316相關聯(lián)的各種物理和邏輯組件以及實體314、316本身。例如,本地資源222可以包括將邏輯實體作為根并且將各個邏輯和物理對象作為子孫后代的資源層級。
哪個本地資源222被尋址,取決于管理命令的性質和所預期的影響。例如,假定將要在對等域208中進行全局改變,諸如,向每個邏輯實體314、316的邏輯存儲器設備“D”分配附加的一兆字節(jié)的存儲器。管理命令可能無法為邏輯實體314、316直接尋址。作為替代,每個邏輯實體314、316的邏輯存儲器設備“D”可能需要接收管理命令。通常,單獨的命令可能會被發(fā)送到每個邏輯實體314、316的邏輯存儲器設備“D”。然而,因為邏輯實體314、316處于通用對等域208中,并且每個均具有邏輯存儲器設備“D”,所以管理節(jié)點318向對等體領導者發(fā)送被尋址到邏輯存儲器設備“D”的單個管理命令。然后,對等體領導者把管理命令中繼到對等域208中的其它對等體(一個或多個)。
那些本領域技術人員將會認識到,可以使用各種尋址技術來發(fā)送目標為特定資源222的管理命令。例如,可以利用包括資源222、邏輯實體316和對等域208的唯一標識符的唯一標識符來登記資源222。如這里所用,對以特定資源或確定了目標的(targeted)資源為目標的描述意味著,管理命令作用于該特定的資源222,而且所述資源222可以被列為用于執(zhí)行管理命令的自變量。在任一實例中,管理節(jié)點318應當能夠準確地引用用于定義資源222的信息。
在一個實施例中,尋址模塊324使用面向對象的消息傳送來向目標資源222尋址管理命令。尋址模塊324可以維護對等域208的清單。尋址模塊324還可以維護對等域208的成員和管理域220的成員之間的關聯(lián),從而使得可以執(zhí)行諸如用于特定邏輯實體314的特定硬件命令之類的管理命令。
尋址模塊324可以利用面向對象的架構來向所想要的邏輯實體314、316和/或本地資源222發(fā)送管理命令。特別的是,對等域208可以由軟件對象來表示,所述軟件對象在面向對象的架構中由唯一的名稱/標識符來唯一地標識。通過引用邏輯實體與域208的關聯(lián),尋址模塊324可以直接引用用于表示邏輯實體314的軟件對象。然后,面向對象的架構把確定了目標的管理命令中繼到特定的邏輯實體314和/或本地資源222。這只是管理節(jié)點318可以怎樣以本地資源222為目標的一個例子。
第一邏輯實體314和第二邏輯實體316與管理節(jié)點318具有管理關系326。管理關系326允許管理節(jié)點318(通過管理命令)監(jiān)視并管理實體314、316的操作。然而,實體314、316不能管理或監(jiān)視管理節(jié)點318(因此,單向箭頭表示管理權限)。管理節(jié)點318和包括實體314、316的對等域208一起構成管理域220。
圖4圖示了適于實現(xiàn)用于使存儲管理便于進行的系統(tǒng)400的系統(tǒng)硬件。如上所述,當把不那么貴的硬件組合到單個物理外殼中時,數據處理系統(tǒng)繼續(xù)變得更為復雜。然后,所述硬件在物理上、邏輯上或依照物理和邏輯分區(qū)的組合被劃分為多個邏輯實體202、204(參見圖2)。通過包括諸如邏輯實體202、204之類的冗余子組件,使用重復的硬件提供了更高的可用性。
在適于用為存儲子系統(tǒng)的一個實施例中,系統(tǒng)400包括通過通用硬件平臺402結合的至少兩個物理上獨立的中央電子設備復合體(CEC)。通用硬件平臺402可以包括簡單的物理外殼。
CEC是連接到諸如PHYP116之類的通用協(xié)調模塊116(參見圖1)的物理計算設備的獨立集合。CEC包括組織在處理器復合體404中的多個對稱多處理器、多個電子存儲器設備406、多個直接存取存儲設備(DASD)408、諸如主機適配器410之類的多個網絡I/O接口設備410、以及諸如網絡適配器412之類的多個管理接口設備412。CEC可以包括獨立的功率耦合和功率基礎設施以及通風和冷卻系統(tǒng)。每個CEC可以被獨立地循環(huán)供電。甚至某些子系統(tǒng)可以在不影響CEC的其它部分性能的情況下被循環(huán)供電。當然,本領域技術人員應當認識到,上述某些硬件設備可以被組織到子系統(tǒng)中并且包括與本發(fā)明無關的各種控制器,但是其使得CEC能夠支持多個邏輯節(jié)點206。
在一個實施例中,系統(tǒng)400包括第一CEC414和第二CEC416。優(yōu)選的是,第二CEC416包括與第一CEC414基本上相同數量、類型、品牌和配置的硬件。如果出現(xiàn)問題,那么具有通用硬件減少了在故障調試中所涉及的變數。在一個實施例中,第一CEC414和第二CEC416可以由經由網絡適配器412連接的單個硬件管理控制臺(Hardware Management Console,HMC)418來管理并控制。在一個實施例中,HMC 418是諸如個人計算機之類的專用硬件管理設備,用于運行LINUX操作系統(tǒng)和適當的管理應用。
應當注意,甚至是在單個CEC內管理硬件的這種復雜系統(tǒng)400也可能遭遇相當大的挑戰(zhàn)。特別是要維護24/7可用性的目標時。因此,HMC418包括復合體服務和維護腳本與例程,以便在服務于CEC的過程中引導管理員,從而使得可以維護最高的可用性等級。單個錯誤可能造成驚人的后果。在某些實施例中,在多個資源管理器中實現(xiàn)管理邏輯。各個資源管理器監(jiān)視并檢查ESS的各個硬件和軟件子系統(tǒng)的健康。軟件模塊和腳本指導服務技術人員和系統(tǒng)管理員診斷并修復問題以及執(zhí)行預防性維護。典型情況下,這些例程適當地關閉(循環(huán)供電)子組件和/或系統(tǒng),而其余硬件組件保持聯(lián)機。
圖5圖示了圖4的硬件系統(tǒng)400,并且包括在所述硬件上操作的軟件和邏輯實體。系統(tǒng)400包括通用硬件平臺402內的第一CEC414和第二CEC416。在一個實施例中,CEC414、416是完全獨立的并且在存儲子系統(tǒng)內操作。
系統(tǒng)400包括第一邏輯分區(qū)(LPAR)502、第二LPAR504、第三LPAR506和第四LPAR508。某些系統(tǒng)400可以包括比所圖示的LPAR更多的LPAR。每個LPAR502-508包括計算資源的分配,所述計算資源包括一個或多個處理器510、一個或多個I/O信道512以及持久性和/或非持久性的存儲器514。某些計算硬件可以共享,而其它硬件則僅僅專用于特定的LPAR。如這里所用,LPAR指的是管理并分配一個或多個處理器、存儲器和I/O通信,從而使得每個LPAR能夠獨立于其它LPAR來執(zhí)行操作系統(tǒng)。通常用于描述LPAR的其它術語包括虛擬機和邏輯實體202、204(參見圖2)。
在一個實施例中,第一LPAR502和第二LPAR504是同構的,從而使得處理器510、I/O512和存儲器514的配置是相同的。類似地,在存儲器514中執(zhí)行的軟件可以是同構的。各自的LPAR 502、504、存儲器514可以執(zhí)行相同的OS516和資源管理器518。
優(yōu)選的是,資源管理器518包括用于處理到達特定LPAR502、504的管理命令的邏輯。資源管理器518可以包括同步模塊520。同步模塊520可以包括與就圖3所描述的同步模塊312基本上相同的邏輯。
在一個實施例中,在第一CEC414上操作的第一LPAR502依照與在第二CEC416上操作的第二LPAR504的對等關系524來操作。第一LPAR502和第二LPAR504一起定義了存儲設備映像(SFI)526。優(yōu)選的是,SFI526基本上對應于就圖2所描述的對等域208的分組、特征和功能。在某些實施例中,SFI526可以包括對等域208的子集,這是因為,在對等域208可以具有兩個或多個LPAR502、504的情況下,在一個實施例中SFI526可以被限制為兩個LPAR502、504。
SFI526提供了冗余的邏輯資源以用于存儲并獲取數據。當一個LPAR不可用而其余LPAR處理所有工作時,一般在LPAR502和LPAR504之間邏輯上拆分所有數據存儲處理。優(yōu)選的是,SFI526包括在物理硬件上操作的一個LPAR502,所述物理硬件完全獨立于第二LPAR504的物理硬件。因此,在優(yōu)選實施例中,SFI526包括硬件的物理分區(qū)。依照這種方式,一個CEC416可以是脫機的或在物理上被斷電,并且SFI526可以保持聯(lián)機。一旦CEC416返回到聯(lián)機狀態(tài),資源管理器518就可以使存儲器514和存儲同步,從而使得第二LPAR504再次匹配于第一LPAR502。
SFI526可以被進一步分為邏輯存儲設備。SFI526還可以包括用于管理邏輯存儲設備的虛擬化驅動器軟件。優(yōu)選的是,SFI526只包括為存儲和取得數據所必需的軟件。例如,一個SFI526可以包括用于允許存儲和取得數據的OS中的文件系統(tǒng)。
系統(tǒng)400還可以包括存儲應用映像(SAI)528,其包括處于對等關系524中的第三LPAR506和第四LPAR508。優(yōu)選的是,用于定義SAI528的LPAR506、508包括相同的OS516和相同的資源管理器518。在某些實施例中,SFI526的OS516和/或資源管理器518可以不同于SAI528的OS516和/或資源管理器518。在某些實施例中,SAI528基本上對應于就圖2所描述的對等域208的分組、特征和功能。在某些實施例中,SAI528可以包括對等域208的子集,這是因為,在對等域208可以具有兩個或多個LPAR502、504的情況下,在一個實施例中SAI528可以被限制為兩個LPAR502、504。
優(yōu)選的是,保持對等域208、210互相分離。如果在多個對等域208、210的成員之間想要對等關系,那么組合多個對等域208、210以便形成單個對等域208。因此,兩個SFI526和/或SAI528可能不會彼此處于對等域208中。因為在存儲環(huán)境中存儲設備映像與存儲應用映像服務于不同的目的,所以這可能是有益的。換句話說,在SFI526上和SAI528上所執(zhí)行的I/O和管理操作之間可能幾乎沒有或者沒有任何關系。
SAI528把存儲應用組織到單個邏輯單元中,該邏輯單元可以獨立于SFI526的邏輯和物理存儲設備408(參見圖4)來管理。由于第三LPAR506和第四LPAR508鏡像彼此之上的數據處理,所以SAI528還包括冗余。優(yōu)選的是,SFI526包括在物理硬件上操作的第三LPAR506,所述物理硬件完全獨立于第四LPAR508的物理硬件。因此,在優(yōu)選實施例中,SAI528包括硬件的物理分區(qū)。依照這種方式,一個CEC416可以是脫機的或在物理上被斷電,并且SAI528可以保持聯(lián)機。SAI528的存儲應用530包括特別用于管理數據的存儲和取得的應用。存儲應用的例子包括來自IBM的Tivoli存儲管理器、數據庫管理系統(tǒng)等。
管理模塊532被配置為有選擇地向SFI526和/或SAI528(對等域)傳送管理命令。作為選擇或者另外地,管理模塊532可以根據需要直接向各個LPAR502-508發(fā)送管理命令。LPAR502-508的所揭示的本地資源533允許管理模塊532向特定資源533發(fā)送管理命令,和/或把特定資源533自變量包括在某些管理命令中。
管理模塊532包括配置模塊534、信息模塊536和尋址模塊538,它們包括與就圖3所描述的配置模塊308、信息模塊310和尋址模塊324基本上相同的功能。特別地,信息模塊536或其組件可以廣播用于定義SFI526和/或SAI528的本地資源533的信息。作為選擇,信息模塊536或其組件可以把用于定義SFI526和/或SAI528的本地資源533的信息登記到可由管理模塊532訪問的諸如數據庫之類的中央儲存庫中。
在某些實施例中,信息模塊536通過周期性輪詢來從LPAR502-508獲取用于定義本地資源的信息。作為選擇,信息模塊536可以根據來自LPAR502-508的信號來獲取用于定義本地資源的信息。有利的是,管理模塊532提取用于表示單個SFI526的多個LPAR502、504的細節(jié),并且允許用戶向整個SFI526尋址管理命令,同時確保對每個LPAR502、504進行特定改變。
優(yōu)選的是,管理模塊532向SFI526和SAI528傳送管理命令,并因而通過管理子系統(tǒng)540向LPAR502-508傳送管理命令,所述管理子系統(tǒng)540在邏輯上鏈接管理模塊532和LPAR502-508??梢砸勒毡景l(fā)明修改的子系統(tǒng)的一個例子是可從紐約的Armonk的國際商業(yè)機器公司(IBM)處獲得的資源監(jiān)視和控制(Resource Monitoring andControl,RMC)子系統(tǒng)。本領域技術人員應當認識到,用于支持本發(fā)明的管理子系統(tǒng)540與它所源于的常規(guī)RMC子系統(tǒng)并不相同。
基于RMC的管理子系統(tǒng)540是典型情況下被并入到操作系統(tǒng)、諸如AIX中的功能模塊。當然,可以在包括LINUX、UNIX、Windows等的其它操作系統(tǒng)中實現(xiàn)管理子系統(tǒng)540。管理子系統(tǒng)540的附贈組件可以駐留在管理模塊532和LPAR 502-508上。
管理子系統(tǒng)540監(jiān)視諸如盤空間、處理器使用、設備驅動器、適配卡狀態(tài)等之類的資源。管理子系統(tǒng)540被設計成響應于預定義的條件來執(zhí)行動作。然而,常規(guī)的RMC不能與對等域208中的一對LPAR502-508(SFI526或SAI528)同時對接。作為替代,常規(guī)的RMC子系統(tǒng)一次與一個LPAR通信。
在本發(fā)明的某些實施例中,常規(guī)的RMC子系統(tǒng)被擴展并修改以便創(chuàng)建修改的管理子系統(tǒng)540,其能夠允許在對等域208內的管理和監(jiān)視并且防止LPAR管理或監(jiān)視在另一對等域208中的LPAR。所修改的管理子系統(tǒng)540還可以允許諸如管理模塊532之類的管理節(jié)點管理兩個或多個對等域208、210。
所修改的管理子系統(tǒng)540可以包括對象模型,其包括用于表示一個或多個LPAR502-508的每個可管理資源的對象。對象表示物理和邏輯資源的特征和屬性。所述對象可以存儲諸如通信地址、版本信息、特征信息、兼容性信息、操作狀態(tài)信息等之類的信息。
管理子系統(tǒng)540進一步包括一組資源管理器518。在一個實施例中,資源管理器518包括用于解釋管理命令并把該管理命令應用于在對象模型中所定義的資源533的邏輯。在某些實施例中,資源管理器518是在每個LPAR502-508上執(zhí)行的現(xiàn)有RMC模塊的軟件擴展。資源管理器518可以擴展面向對象的RMC模塊或程序設計的RMC模塊。
在某些實施例中,管理模塊532充當多個SFI526、SAI528和其中所定義的相關聯(lián)LPAR502-508的管理中央點。管理模塊532可以經由帶外通信網絡耦合到多個硬件平臺542。管理模塊532優(yōu)選地被配置為向分布在多個平臺542上的SFI 526和SAI528發(fā)送一個或多個管理命令。此外,每個SFI526和/或SAI528可以包括不同的OS516和/或應用集530??梢砸勒盏乩?、共同目的、功能或其它特性把SFI526和/或SAI528組織到共同的管理域544中。應當注意,管理域544可以包括多個硬件平臺542。管理模塊532可以允許發(fā)布命令以便選擇對等域208、210,對等域208、210包括SFI526、SAI528或SFI526和SAI528的組合。
仍然參照圖5,管理子系統(tǒng)540和資源管理器518優(yōu)選地被配置為響應于LPAR502、504之一的故障,第一LPAR502接管第二LPAR504的操作,并且反之亦然。對等域208通過提供通信信道使得每個LPAR502、504鏡像另一個LPAR的操作,來使其成為可能。在某些實施例中,當對等域208的LPAR502、504之一出故障時,管理子系統(tǒng)540可以記錄自從出故障的LPAR脫機以來對未出故障的LPAR所進行的改變的集合。另外,一旦出故障的LPAR返回到聯(lián)機狀態(tài),管理子系統(tǒng)540就可以幫助有效的LPAR的資源管理器518恢復該改變集合。
對等域208允許每個LPAR502、504監(jiān)視另一個LPAR。因此,LPAR502、504可以包括用于檢測另一LPAR何時具有諸如變得脫機之類的錯誤情況的邏輯。一旦檢測到錯誤情況,就可以開始記錄。相同的監(jiān)視器可以發(fā)信號通知何時LPAR返回到聯(lián)機狀態(tài)并且觸發(fā)恢復該改變集合。依照這種方式,提供了實時的冗余,從而使得對等域208作為整體(或SFI526或SAI528)保持可用于主機102。
圖6依照一個實施例圖示了用于通過組織存儲資源來使存儲便于進行的方法600的流程圖。一旦管理員希望在管理域220內把邏輯實體202、204、212、214和管理節(jié)點216、224組織到一個或多個對等域208、210(參見圖2)中,方法600就開始了(602)。例如,管理員可以把成對的LPAR組織到諸如SFI526之類的對等域208中,使得一個LPAR是用于另一LPAR的冗余有效備份。另外,管理員可能希望從單個管理節(jié)點216跨過多個硬件平臺542控制并管理多個SFI526。在管理域220內組織一個或多個對等域208、210,允許利用單個管理命令來尋址所述對等域208、210內的資源或所述對等域208內的LPAR。
最初,管理員把兩個或多個邏輯實體202、204配置(604)到對等域208中,從而使得每個邏輯實體202、204鏡像另一個邏輯實體的操作。典型情況下,這意味著,在兩個或多個邏輯實體202、204之間建立了某些通信信道和協(xié)議,從而使得每個邏輯實體202、204與對等域208中的每個其它邏輯實體202、204具有直接通信。優(yōu)選的是,使用專用管理信道來在邏輯上鏈接邏輯實體202、204。
接下來,信息模塊310揭示(606)單個管理域220的一個或多個對等域208、210內的每個邏輯實體314、314的本地資源222。如上所述,存在可用來向管理節(jié)點318通知本地資源222從而使得本地資源222可以被用作管理命令中的目標資源322的各種技術。另外,當本地資源222被更新和修改時,信息模塊310與其它管理子系統(tǒng)合作可以維護目標資源322。
然后,當管理節(jié)點318發(fā)布管理命令,尋址模塊324向與對等域208相關聯(lián)的本地資源222有選擇地尋址(608)管理命令。作為選擇,尋址模塊324向對等域208的第一邏輯實體314或第二邏輯實體316尋址(608)管理命令。管理命令被發(fā)往哪個資源222部分地取決于管理命令的類型。較高級(其意味著與硬件設備不相關)的管理命令可以被發(fā)送到在實體314、316之間共用的一對資源222。較低級(其意味著與硬件設備相關)的管理命令可以被發(fā)送到特定實體314、316的特定資源222??梢允褂酶鞣N尋址技術。
接下來,確定(610)邏輯實體314或LPAR502是否脫機。LPAR502可以被斷定為脫機以用于服務或故障調試,或者LPAR502可能由于錯誤情況而無意地脫機。如果LPAR502脫機了,那么用于定義對等域208的邏輯(即,在實體314、316上執(zhí)行的記錄模塊)可以開始記錄(612)對所述對等域208的一個或多個聯(lián)機的LPAR504所進行的改變的集合。一旦脫機的LPAR502返回到聯(lián)機狀態(tài),所述邏輯就可以通過向LPAR502應用該記錄的改變集合來恢復所述LPAR502。典型情況下,保持聯(lián)機的LPAR504向所恢復的LPAR502應用更新。
如果沒有一個邏輯實體314、316或LPAR502、504脫機,那么確定(614)是否有更多管理命令對于管理域220的邏輯實體314、316而言是待處理的。如果是的話,那么方法600返回到尋址(608)下一管理命令。如果不是的話,那么方法600結束(616)。
本領域技術人員將會很快地認識到本發(fā)明所提供的潛在益處。分別管理SFI526和SAI528(整個對等域208)和/或各個LPAR502-508的能力為管理員節(jié)省了大量的時間,并且顯著地降低了出現(xiàn)錯誤和差錯的可能性。另外,可以在管理對等域226中使多個管理節(jié)點216、224相關。像邏輯實體202一樣,管理節(jié)點216、224可以互相監(jiān)視并管理,從而使得如果一個管理節(jié)點出故障,那么另一個管理節(jié)點可以在出故障的管理節(jié)點216停用的情況下繼續(xù)執(zhí)行管理命令集。因此,本發(fā)明在管理邏輯實體方面提供了進步,所述邏輯實體可以是相關的以便形成SFI526和SAI528。本發(fā)明在LPAR級和管理節(jié)點級上提供了冗余。最后,本發(fā)明減輕了對邏輯實體的管理負擔,所述邏輯實體在典型情況下為了冗余目的而被類似地配置。
可以在不脫離本發(fā)明的本質特征的情況下,采用其它具體形式來實現(xiàn)本發(fā)明。所描述的實施例在各個方面都應當被認為僅僅是說明性的而并非限制性的。因此,本發(fā)明的范圍應當由所附權利要求而不是上述描述來表明。落入權利要求的等效意義和范圍內的所有改變都將被包含在所述權利要求的范圍內。
在此說明書中所描述的許多功能單元已經被標記為模塊,以便更特別地強調它們的實現(xiàn)獨立性。例如,模塊可以被實現(xiàn)為硬件電路,其包括定制的VLSI電路或門陣列、諸如邏輯芯片之類的現(xiàn)成半導體、晶體管或其它分立元件。模塊還可以用諸如現(xiàn)場可編程門陣列、可編程陣列邏輯、可編程邏輯器件等之類的可編程硬件設備來實現(xiàn)。
模塊也可以用由各種類型的處理器所執(zhí)行的軟件來實現(xiàn)??蓤?zhí)行代碼的標識模塊例如可以包括計算機指令的一個或多個物理或邏輯塊,所述計算機指令例如可以被組織為對象、過程、函數或其它構造。盡管如此,所標識模塊的可執(zhí)行部分在物理上不必位于一起,而是可以包括在不同位置中所存儲的完全不同的指令,所述指令當在邏輯上結合在一起時構成所述模塊并且實現(xiàn)所述模塊所聲明的目的。
實際上,可執(zhí)行代碼的模塊可以是單個指令或許多指令,并且甚至可以分布在幾個不同的代碼段上、分布在不同的程序之間、以及分布在幾個存儲器設備之上。類似地,在此可以在模塊內標識并圖示操作數據,并且其可以依照任何適當形式來實現(xiàn)并且被組織在任何適當類型的數據結構內。操作數據可以被收集為單個數據集,或者可以分布在不同位置上,其中包括分布在不同存儲設備上,并且可以至少部分地僅僅作為系統(tǒng)或網絡上的電子信號存在。
在此說明書中,對“選定實施例”、“一個實施例”或“實施例”的描述意味著,結合所述實施例所描述的具體特征、結構或特性被包括在本發(fā)明的至少一個實施例中。因此,在此說明書中的不同位置上出現(xiàn)的短語“選定實施例”、“在一個實施例中”或“在實施例中”不一定都涉及相同的實施例。
此外,可以在一個或多個實施例中以任何適當的方式組合所描述的特征、結構或特性。在下面的描述中,提供了許多具體細節(jié),諸如編程、軟件模塊、用戶選擇、用戶接口、網絡事務、數據庫查詢、數據庫結構、硬件模塊、硬件電路、硬件芯片等的例子,以便提供對本發(fā)明實施例的徹底了解。然而,相關領域的技術人員應當認識到,可以在沒有一個或多個具體細節(jié)的情況下或者用其它方法、組件、材料等來實施本發(fā)明。在其它實例中,沒有示出或詳細描述眾所周知的結構、材料或操作,以免模糊本發(fā)明的特征。
權利要求
1.一種用于使存儲管理便于進行的設備,所述設備包括配置裝置,用于配置第一邏輯實體和第二邏輯實體以便在對等域中彼此相互交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信;信息裝置,被配置為向管理節(jié)點揭示第一邏輯實體的本地資源和第二邏輯實體的本地資源,從而使得所述第一邏輯實體和第二邏輯實體的本地資源可用作來自所述管理節(jié)點的管理命令的目標資源;和尋址裝置,被配置為有選擇地從所述管理節(jié)點向所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源尋址管理命令。
2.如權利要求1所述的設備,其中,所述配置裝置被設計成配置所述管理節(jié)點以便依照定義了管理域的管理關系與第一邏輯實體和第二邏輯實體相交互。
3.如權利要求2所述的設備,其中,所述管理域包括所述管理節(jié)點和至少一個邏輯實體,所述至少一個邏輯實體被配置為由所述管理節(jié)點管理并監(jiān)視,并且不能管理或監(jiān)視所述管理節(jié)點。
4.如權利要求2所述的設備,其中,所述管理域包括彼此處于對等域中的三個或更多邏輯實體,每個邏輯實體的本地資源被揭示給所述管理節(jié)點以用作來自所述管理節(jié)點的管理命令的目標資源。
5.如權利要求2所述的設備,其中,所述管理域包括彼此處于對等域中的第一組邏輯實體和彼此處于對等域中的第二組邏輯實體,每個邏輯實體的本地資源被揭示給所述管理節(jié)點以用作管理命令的目標資源,一組中的邏輯實體不能與另一組中的邏輯實體進行通信。
6.如權利要求5所述的設備,其中,所述尋址裝置被進一步配置為使管理命令直接以所述第一組為目標。
7.如權利要求5所述的設備,其中,所述尋址裝置被進一步配置為使管理命令直接以所述第一組和第二組為目標。
8.如權利要求1所述的設備,其中,所述管理域進一步包括第二個管理節(jié)點,其被配置為在管理對等域中與所述管理節(jié)點相交互,所述管理對等域允許任何一個管理節(jié)點響應于管理節(jié)點之一的故障而監(jiān)視并接管管理操作。
9.如權利要求1所述的設備,其中,所述對等域包括被配置具有基本上相等的權限以便互相監(jiān)視并管理的至少兩個邏輯節(jié)點。
10.如權利要求1所述的設備,其中,對等域的第一邏輯實體和第二邏輯實體被配置為響應于邏輯實體之一的故障而接管另一邏輯實體的操作,記錄自從出故障的邏輯實體脫機以來的改變的集合,并且響應于出故障的邏輯實體變?yōu)槁?lián)機而恢復該改變集合。
11.如權利要求1所述的設備,其中,所述信息裝置被進一步配置為向管理節(jié)點廣播所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源。
12.如權利要求1所述的設備,其中,所述信息裝置被進一步配置為把所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源登記到可由所述管理節(jié)點訪問的中央儲存庫中。
13.如權利要求1所述的設備,進一步包括同步裝置,其被配置為響應于由所述第一邏輯實體或第二邏輯實體對本地資源所進行的修改,而使用于表示所述第一邏輯實體和第二邏輯實體的本地資源的資源定義相同步。
14.如權利要求1所述的設備,其中,所述管理節(jié)點經由與由所述第一邏輯實體和第二邏輯實體所使用的一個或多個輸入/輸出(I/O)信道相分離的通信信道來發(fā)送管理命令。
15.如先前權利要求中任何一個所述的設備,其中,所述第一邏輯實體和第二邏輯實體包括通用硬件平臺的邏輯分區(qū)(LPAR)。
16.如權利要求1所述的設備,其中,所述第一邏輯實體和第二邏輯實體定義了可獨立管理的存儲設備映像(SFI),并且其中所述尋址模塊被進一步配置為向管理域內的多個存儲設備映像發(fā)送管理命令。
17.一種用于使存儲管理便于進行的系統(tǒng),所述系統(tǒng)包括可操作地耦合到硬件平臺的第一中央電子設備復合體(CEC),所述第一中央電子設備復合體包括被組織為第一處理器復合體的多個對稱多處理器、多個電子存儲器設備、多個直接存取存儲設備、多個網絡輸入/輸出(I/O)接口設備和多個管理接口設備,所述中央電子設備復合體的每個設備電耦合以便交換數據和控制信息;可操作地耦合到硬件平臺的第二中央電子設備復合體,所述第二中央電子設備復合體包括被組織為第二處理器復合體的多個對稱多處理器、多個電子存儲器設備、多個直接存取存儲設備、多個網絡輸入/輸出(I/O)接口設備和多個管理接口設備,所述中央電子設備復合體的每個設備電耦合以便交換數據和控制信息;至少一個存儲設備映像(SFI),其包括被定義為使用所述第一中央電子設備復合體的計算資源來操作的第一邏輯分區(qū)(LPAR)和被定義為使用所述第二中央電子設備復合體的計算資源來操作的第二邏輯分區(qū),所述第一邏輯分區(qū)和第二邏輯分區(qū)專用于存儲和獲取數據;至少一個存儲應用映像(SAI),其包括被定義為使用所述第一中央電子設備復合體的計算資源來操作的第三邏輯分區(qū)(LPAR)和被定義為使用所述第二中央電子設備復合體的計算資源來操作的第四邏輯分區(qū),所述第三邏輯分區(qū)和第四邏輯分區(qū)專用于數據存儲應用;配置模塊,用于配置所述第一邏輯分區(qū)和第二邏輯分區(qū)以便在對等域中互相交互,從而使得每個邏輯分區(qū)鏡像另一邏輯分區(qū)的操作并與之直接通信,并且所述配置模塊進一步配置所述第三邏輯分區(qū)和第四邏輯分區(qū)以便在對等域中互相交互,從而使得每個邏輯分區(qū)鏡像另一邏輯分區(qū)的操作并與之直接通信;信息模塊,被配置為向管理節(jié)點揭示至少一個存儲設備映像和至少一個存儲應用映像的本地資源定義,從而使得所述至少一個存儲設備映像和至少一個存儲應用映像的本地資源可用作來自所述管理節(jié)點的管理命令的目標資源;和尋址模塊,被配置為有選擇地從所述管理節(jié)點向所述至少一個存儲設備映像和至少一個存儲應用映像的本地資源尋址管理命令。
18.如權利要求17所述的系統(tǒng),進一步包括同步模塊,其被配置為響應于對所述至少一個存儲設備映像或至少一個存儲應用映像的任一邏輯分區(qū)的本地資源所進行的修改,而使用于表示所述至少一個存儲設備映像和至少一個存儲應用映像的本地資源的資源定義相同步。
19.如權利要求17所述的系統(tǒng),其中,所述信息模塊被進一步配置為向所述管理節(jié)點廣播所述至少一個存儲設備映像的本地資源和所述至少一個存儲應用映像的本地資源。
20.如權利要求17所述的系統(tǒng),其中,所述信息模塊被進一步配置為把所述至少一個存儲設備映像的本地資源和所述至少一個存儲應用映像的本地資源登記到可由所述管理節(jié)點訪問的中央儲存庫中。
21.一種用于使存儲管理便于進行的方法,包括配置第一邏輯實體和第二邏輯實體以便在對等域中彼此相互交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信;向管理節(jié)點揭示所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源,從而使得所述第一邏輯實體和第二邏輯實體的本地資源可用作來自所述管理節(jié)點的管理命令的目標資源;以及有選擇地從所述管理節(jié)點向所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源尋址管理命令。
22.如權利要求21所述的方法,進一步包括配置所述管理節(jié)點以便依照定義了管理域的管理關系與第一邏輯實體和第二邏輯實體相交互。
23.如權利要求22所述的方法,其中,所述管理域包括彼此處于對等域中的第一組邏輯實體和彼此處于對等域中的第二組邏輯實體,每個邏輯實體的本地資源被揭示給所述管理節(jié)點以用作管理命令的目標資源,一組中的邏輯實體不能與另一組中的邏輯實體進行通信。
24.如權利要求23所述的方法,其中,操作進一步包括用于使管理命令直接以所述第一組為目標的操作。
25.如權利要求23所述的方法,其中,操作進一步包括用于使管理命令直接以所述第一組和第二組為目標的操作。
26.如權利要求21所述的方法,其中,揭示步驟進一步包括向所述管理節(jié)點廣播所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源。
27.如權利要求21所述的方法,其中,揭示步驟進一步包括把所述第一邏輯實體的本地資源和所述第二邏輯實體的本地資源登記到可由所述管理節(jié)點訪問的中央儲存庫中。
28.如權利要求21所述的方法,進一步包括響應于由所述第一邏輯實體或第二邏輯實體對本地資源所進行的修改,使用于表示所述第一邏輯實體和第二邏輯實體的本地資源的資源定義相同步。
29.一種計算機程序,包括用于執(zhí)行如權利要求21到28中任何一個所述的方法的所有步驟的計算機可執(zhí)行指令。
全文摘要
提供了一種用于通過組織存儲資源來使存儲管理便于進行的設備、系統(tǒng)和方法。所述設備包括配置模塊,其用于配置第一邏輯實體和第二邏輯實體以便在對等域中彼此相交互,從而使得每個邏輯實體鏡像另一邏輯實體的操作并且與之直接通信。信息模塊向管理節(jié)點揭示第一邏輯實體的本地資源和第二邏輯實體的本地資源,從而使得所述本地資源可用作來自所述管理節(jié)點的管理命令的目標資源。尋址模塊從管理節(jié)點有選擇地向按照管理命令的類型所確定的第一邏輯實體的本地資源和/或第二邏輯實體的本地資源尋址管理命令。
文檔編號G06F17/30GK101019120SQ200580031026
公開日2007年8月15日 申請日期2005年9月29日 優(yōu)先權日2004年10月12日
發(fā)明者約翰·E.·??坡? 科薩瓦普拉薩斯·拉加納薩恩, 邁克爾·A.·施密特, 史蒂文·R.·范·甘迪 申請人:國際商業(yè)機器公司