專利名稱:存儲集群系統(tǒng)、數(shù)據(jù)處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種存儲集群系統(tǒng),其中多個存儲裝置通過網(wǎng)絡(luò)彼此連接,如此主機裝置可以經(jīng)由多個存儲裝置訪問同一邏輯卷,一種在存儲集群系統(tǒng)中的數(shù)據(jù)處理方法,以及實現(xiàn)所述數(shù)據(jù)處理方法的程序。
背景技術(shù):
通常,在包括由多個存儲裝置組成的存儲集群和經(jīng)由通信網(wǎng)絡(luò)連接到所述存儲集群的主機裝置的存儲集群系統(tǒng)中,在這種將由主機裝置訪問的存儲裝置中的邏輯卷和由組成該邏輯卷的至少一個HDD等構(gòu)成的物理存儲介質(zhì)之間固定地存在著對應關(guān)系。因此,該相應關(guān)系不能根據(jù)保存數(shù)據(jù)的位置的情況而改變,所以,例如,出現(xiàn)了一種情況,即,可能集中地對一個物理裝置進行訪問并且?guī)缀醪辉L問其他物理裝置。結(jié)果,就出現(xiàn)了一種情形在存儲集群系統(tǒng)中的諸如HDD的存儲裝置不能被有效地利用。
尤其在最近,隨著磁盤陣列子系統(tǒng)規(guī)模的擴張和HDD單體的存儲能力的增長,上述的訪問偏差已經(jīng)越來越經(jīng)常地發(fā)生了,并且這個趨勢正在增長。在這種環(huán)境之下,增長了對虛擬化磁盤陣列子系統(tǒng)的技術(shù)的需求,例如在http://www.linux.or.jp/JF/JFdocs/LVM-HOWTO-3.html中描述的系統(tǒng)正被推廣到實際應用。在上述技術(shù)中,磁盤陣列子系統(tǒng)中的物理存儲資源被限制在具有固定尺寸的區(qū)域(盤區(qū)(extent))中,并且至少一個所述盤區(qū)的組合和所述邏輯卷之間的相應關(guān)系被動態(tài)地管理。隨后,在盤區(qū)之間復制數(shù)據(jù),由此能夠改變所述數(shù)據(jù)的物理存在位置(其被稱為“盤區(qū)遷移(extent migration)”),而所述數(shù)據(jù)被保持。
同樣,在這種虛擬化的磁盤陣列子系統(tǒng)中,當主機裝置獲得訪問時,必須使用邏輯單元號(LUN)和邏輯塊地址(LBA),它們基于常規(guī)的SCSI協(xié)議。磁盤陣列子系統(tǒng)將來自主機裝置的數(shù)據(jù)寫入到由指定的LUN和LBA的組合所指示的物理介質(zhì)的位置上,或者傳送(讀)所述數(shù)據(jù)到主機裝置。每個盤區(qū)尺寸單元的邏輯卷的部分被稱為邏輯盤區(qū),在盤區(qū)尺寸單元中根據(jù)盤區(qū)尺寸限定邏輯卷。此處,需要保存指示邏輯盤區(qū)和實際存儲區(qū)域(此后被稱作“物理盤區(qū)”)之間的相應關(guān)系的表(此后被稱作“邏輯-物理盤區(qū)映射表”)。
然而,在能力和性能可擴展的存儲集群系統(tǒng)(此后被稱作“虛擬存儲集群系統(tǒng)”)的情形中,上述邏輯-物理盤區(qū)映射表為了經(jīng)由路由傳輸?shù)哪康模彩菫榱伺c網(wǎng)絡(luò)相連的其他磁盤陣列裝置,而需要被保存,使得上述多個虛擬化磁盤陣列子系統(tǒng)可以通過網(wǎng)絡(luò)彼此連接并且經(jīng)網(wǎng)絡(luò)連接的任意磁盤陣列裝置可以取得對任意物理盤區(qū)的訪問。用于其他裝置的路由信息與被包含在存儲集群中的裝置的數(shù)量成比例地增長,這導致一個問題,即在盤區(qū)遷移時的配置改變可能影響整個存儲集群,增加了表的檢索時間和用于保存表的存儲區(qū)域。
發(fā)明內(nèi)容
考慮到上述情況,開發(fā)了本發(fā)明,并且,本發(fā)明的目標是提供一種存儲集群系統(tǒng)、一種數(shù)據(jù)處理方法和程序,它們可以避免與被包含在存儲集群中的存儲裝置的數(shù)量成比例的路由信息的增長,可以抑制表的檢索時間的增長和用于表保存的存儲區(qū)域的增長,并且可以根據(jù)需要,在盤區(qū)遷移時自動地改變配置,由此實現(xiàn)有效的路由。
為了實現(xiàn)所述目標,本發(fā)明采用下述步驟。
確切地說,本發(fā)明的第一方面針對一種數(shù)據(jù)處理方法,其被應用到存儲集群系統(tǒng),所述存儲集群系統(tǒng)包括由多個存儲裝置組成的存儲集群,和通過第一通信網(wǎng)絡(luò)連接到所述存儲集群的主機裝置;應用所述數(shù)據(jù)處理方法的存儲集群系統(tǒng);以及實現(xiàn)所述數(shù)據(jù)處理方法的程序。
此處,每個存儲裝置包括多個可訪問區(qū)域、控制器以及優(yōu)先順序信息,其中主機裝置在邏輯上可訪問的區(qū)域被劃分為所述可訪問區(qū)域,控制器訪問由存儲裝置在物理上管理的多個可訪問區(qū)域的物理可訪問區(qū)域,所述優(yōu)先順序信息被控制器參考并且定義包括控制器的存儲裝置到其他存儲裝置的訪問優(yōu)先順序。
進一步,在各自的存儲裝置中的控制器通過第二通信網(wǎng)絡(luò)互相連接,藉此,每個存儲裝置都可以經(jīng)由控制器訪問任何其他存儲裝置中的物理可訪問區(qū)域。
當從主機裝置發(fā)送對于不在存儲裝置中的物理可訪問區(qū)域的處理請求時,存儲裝置中的控制器根據(jù)由優(yōu)先順序信息定義的優(yōu)先順序,將處理請求發(fā)送到除了處理請求已經(jīng)發(fā)送到的存儲裝置之外的,最高優(yōu)先順序的其他存儲裝置中的處理器,并且當從主機裝置發(fā)送對于存在于存儲裝置的物理可訪問區(qū)域的處理請求時,存儲裝置中的控制器執(zhí)行響應于處理請求的處理并且發(fā)送所述處理的結(jié)果到處理請求的發(fā)送源,并且當處理結(jié)果從其它存儲裝置的控制器發(fā)送到存儲裝置時,存儲裝置中的控制器發(fā)送處理結(jié)果到發(fā)送源,所述發(fā)送源已經(jīng)發(fā)送對應于所述處理結(jié)果的處理請求到存儲裝置,所述處理結(jié)果被發(fā)送到存儲裝置,所述存儲裝置已經(jīng)從主機裝置接收處理請求,并且這個存儲裝置將所接收的處理結(jié)果發(fā)送到主機裝置。
本發(fā)明的第二方面針對數(shù)據(jù)處理方法,其被應用到存儲集群系統(tǒng),所述存儲集群系統(tǒng)包括由多個存儲裝置組成的存儲集群,以及通過第一通信網(wǎng)絡(luò)被連接到存儲集群的主機裝置;應用所述數(shù)據(jù)處理方法的存儲集群系統(tǒng);以及實現(xiàn)所述數(shù)據(jù)處理方法的程序。
此處,每個存儲裝置包括多個可訪問區(qū)域、控制器以及優(yōu)先順序信息,其中主機裝置在邏輯上可訪問的區(qū)域被劃分為所述可訪問區(qū)域,控制器訪問由存儲裝置在物理上管理的多個可訪問區(qū)域的物理可訪問區(qū)域,所述優(yōu)先順序信息被控制器參考并且定義包括控制器的存儲裝置到其他存儲裝置的訪問優(yōu)先順序。
在各自的存儲裝置中的控制器通過第二通信網(wǎng)絡(luò)互相連接,藉此,每個存儲裝置都可以經(jīng)由控制器訪問任何其他存儲裝置中的物理可訪問區(qū)域。
存儲裝置接收來自主機裝置的對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求,從處理請求中獲得對應于該處理請求的特有命令,將包括存儲裝置的標識符和主機裝置的標識符的比特映射數(shù)據(jù)引入到命令代碼中,在比特映射數(shù)據(jù)中對應于存儲裝置的標識符的比特位置上設(shè)置比特,并且根據(jù)優(yōu)先順序信息,將命令代碼發(fā)送給除了處理請求已經(jīng)被發(fā)送到的存儲裝置之外的最高優(yōu)先順序的任何其他存儲裝置;在以下情況中,即,在到達存儲裝置的命令代碼是從多個存儲裝置中的任何一個發(fā)送的所述存儲裝置中,與所述命令代碼對應的處理請求是對于不在所述存儲裝置的物理可訪問區(qū)域的處理請求,則存儲裝置在對應于包含在所述命令代碼中的比特映射數(shù)據(jù)的標識符的比特位置上設(shè)置比特,并且根據(jù)優(yōu)先順序信息,將命令代碼發(fā)送到除了處理請求已經(jīng)被發(fā)送到的存儲裝置之外的,最高優(yōu)先順序的存儲裝置;在對應于已發(fā)送的命令代碼的處理請求是對于存在于存儲裝置中的物理可訪問區(qū)域的處理請求的情況下以及比特映射數(shù)據(jù)未包含在已發(fā)送的命令代碼中的情況下,這個存儲裝置執(zhí)行處理以響應于對應所述命令代碼的處理請求,并且將所述處理的結(jié)果發(fā)送到主機裝置;在比特映射數(shù)據(jù)被包含在已發(fā)送的命令代碼中并且在比特位置的任何一個上設(shè)置比特的情況下,這個存儲裝置執(zhí)行處理以響應于對應命令代碼的處理請求,并且將所述處理的結(jié)果發(fā)送到具有對應于設(shè)置所述比特的比特位置的標識符的存儲裝置;在比特映射數(shù)據(jù)被包含在已發(fā)送的命令代碼中并且在多個比特位置上設(shè)置比特的情況下,這個存儲裝置執(zhí)行處理以響應于對應命令代碼的處理請求,產(chǎn)生對于從所述主機裝置直接接收所述處理請求的存儲裝置的響應,并且將生成的響應發(fā)送到存儲裝置,所述存儲裝置已經(jīng)經(jīng)由具有對應于設(shè)置比特的比特位置的標識符的存儲裝置從主機裝置接收處理請求;所述響應被發(fā)送到的存儲裝置請求已經(jīng)生成所述響應的存儲裝置發(fā)送所述處理結(jié)果;被請求的存儲裝置發(fā)送所述處理結(jié)果到請求源的存儲裝置,由此在存儲裝置的任意一個獲得的處理結(jié)果被發(fā)送到已經(jīng)直接從主機裝置接收到處理請求的存儲裝置。接著,已經(jīng)直接從主機裝置接收到處理請求的存儲裝置發(fā)送處理結(jié)果到主機裝置。
本發(fā)明的第三方面針對根據(jù)第一或者第二方面的存儲集群系統(tǒng),其中,在處理請求根據(jù)優(yōu)先順序信息中定義的優(yōu)先順序而被發(fā)送到其他存儲裝置的控制器的情況下和在目的地的控制器不接收處理請求的情況下以及從控制器返回錯誤響應的情況下或者在控制器在預定時間沒有給出響應的情況下,所述處理請求被發(fā)送到除了處理請求已經(jīng)被發(fā)送到的存儲裝置之外的下一個最高優(yōu)先順序的存儲裝置中的控制器。
本發(fā)明的第四方面針對根據(jù)第一或者第二方面的存儲集群系統(tǒng),其中主機裝置已經(jīng)訪問的多個存儲裝置的存儲裝置被配置了通知部分,其通知主機裝置在每個存儲裝置中保存的物理可訪問區(qū)域的信息,并且主機裝置配置了切換部分,其基于通知部分所通知的信息和處理請求的內(nèi)容,切換處理請求將被發(fā)送到的存儲裝置。
本發(fā)明的第五方面針對根據(jù)第一或者第二方面的存儲集群系統(tǒng),其中存儲集群的每個存儲裝置包括數(shù)據(jù)表、主機識別號和物理可訪問區(qū)域識別號,所述數(shù)據(jù)表管理邏輯卷的容量信息的組合,所述邏輯卷由被包含在每個存儲裝置中的所述多個可訪問區(qū)域中的一個或者兩個或多個的組合所構(gòu)成并且被主機裝置所識別,所述主機識別號指定被允許訪問邏輯卷的主機裝置,物理可訪問區(qū)域識別號指定主機裝置訪問的物理可訪問區(qū)域。僅在其中存在物理可訪問區(qū)域的存儲裝置在物理可訪問區(qū)域和邏輯可訪問區(qū)域之間保持一個對應關(guān)系,并且主機裝置能夠在組成邏輯卷的可訪問區(qū)域之中識別邏輯可訪問區(qū)域;并且主機裝置已經(jīng)訪問的存儲裝置,響應于由主機裝置發(fā)送的處理請求中除了包括寫和讀命令的介質(zhì)訪問命令以外的處理請求,發(fā)送處理結(jié)果到主機裝置。
本發(fā)明的第六方面針對根據(jù)第一或者第二方面的存儲集群系統(tǒng),其進一步包括管理存儲集群的管理控制臺。管理控制臺發(fā)送存儲裝置的信息和存儲集群的構(gòu)造請求到任意一個存儲裝置,并且目的地的存儲裝置被定義為構(gòu)造主裝置,其起到存儲集群的構(gòu)造處理的主裝置(master)的作用。所述構(gòu)造主裝置向與從所述管理控制臺發(fā)送的信息相對應的每個存儲裝置發(fā)送測試消息;每個已經(jīng)接收測試消息的存儲裝置將對測試消息的響應返回到構(gòu)造主裝置;構(gòu)造主裝置基于從存儲裝置返回的響應,測量存儲裝置對測試消息的響應時間,從響應時間短的側(cè)面優(yōu)先考慮存儲裝置以由此生成優(yōu)先順序信息,并且將包含在存儲集群中的存儲裝置的列表發(fā)送到每個存儲裝置;除了構(gòu)造主裝置,存儲裝置的每一個依據(jù)所述發(fā)送的列表傳送測試消息給該存儲裝置之外的存儲裝置;已經(jīng)接收到測試消息的每個存儲裝置返回對測試消息的響應給傳送源的存儲裝置;除了構(gòu)造主裝置之外的存儲裝置基于返回的響應,測量該存儲裝置對測試消息的響應時間,從響應時間短的側(cè)面考慮存儲裝置的優(yōu)先順序,以由此生成優(yōu)先順序信息,向構(gòu)造主裝置返回對優(yōu)先順序信息構(gòu)造完成響應;以及當已經(jīng)接收到構(gòu)造完成的響應時,構(gòu)造主裝置返回對于優(yōu)先順序信息的構(gòu)造完成響應到管理控制臺,以執(zhí)行存儲集群的構(gòu)造處理。
本發(fā)明的第七方面針對根據(jù)第一或者第二方面的存儲集群系統(tǒng),其進一步包括管理控制臺,其執(zhí)行追加新的存儲裝置到正在操作的存儲集群的追加處理。管理控制臺發(fā)送新存儲裝置追加的請求和新存儲裝置的信息到任意一個存儲裝置,并且發(fā)送的目的地的存儲裝置被定義為起到存儲裝置追加過程的主裝置的作用的追加主裝置。追加主裝置發(fā)送測試消息給所述新存儲裝置,所述信息已經(jīng)從管理控制臺被發(fā)送到所述新存儲裝置,追加主裝置確認由新存儲裝置發(fā)送的對已傳送的測試消息的響應,將新存儲裝置的訪問優(yōu)先順序作為最低的優(yōu)先順序追加到優(yōu)先順序信息中,并且發(fā)送關(guān)于新存儲裝置的追加的消息到存儲集群以及發(fā)送新存儲裝置的信息給已經(jīng)在優(yōu)先順序信息中定義了訪問優(yōu)先順序存儲裝置;除了追加主裝置和新存儲裝置之外的存儲裝置在該存儲裝置的優(yōu)先順序信息的最低位置加入新存儲裝置,并且返回追加完成響應到追加主裝置;追加主裝置將被包含在存儲集群中的存儲裝置的列表發(fā)送到新存儲裝置;新存儲裝置依據(jù)所述列表將測試消息發(fā)送到除了該存儲裝置之外的存儲裝置;已經(jīng)接收了測試消息的存儲裝置返回對測試消息的響應到新存儲裝置;新存儲裝置基于所返回的響應,測量存儲裝置對測試消息的響應時間,并且從響應時間短的方面考慮存儲裝置的優(yōu)先順序以由此生成優(yōu)先順序信息,并且向追加主裝置返回對優(yōu)先順序信息的構(gòu)造完成的響應;并且當已經(jīng)接收到構(gòu)造完成響應和追加完成響應時,追加主裝置將對于新存儲裝置的追加完成響應返回給管理控制臺,由此,完成新存儲裝置的追加的過程。
根據(jù)本發(fā)明,能夠避免路由信息與包含在存儲集群中的存儲裝置的數(shù)量成比例地增長,其抑制了表搜索時間的增長以及用于表保存的存儲區(qū)域的增長。另外,如果需要,在盤區(qū)遷移時的配置可以自動地改變。因此,本發(fā)明可以實現(xiàn)存儲集群系統(tǒng),數(shù)據(jù)處理方法和允許有效路由的程序。
本發(fā)明的追加目的和優(yōu)勢將在隨后的說明中闡明,并且部分地將從說明書中變得明顯,或者可以通過本發(fā)明的實踐而被理解。本發(fā)明的目的和優(yōu)勢可以通過尤其在下文中指出的手段和組合來實現(xiàn)和獲得。
附圖被包含在說明書中并且構(gòu)成說明書的一部分,其闡明了本發(fā)明的實施方式,并且結(jié)合上述給出的總體描述和下面將給出的實施方式的詳細描述,幫助解釋本發(fā)明的原理。
圖1是表示根據(jù)第一實施方式的應用數(shù)據(jù)處理方法的存儲集群系統(tǒng)的配置示例的方塊圖;圖2是表示被劃分為三個盤區(qū)的物理存儲介質(zhì)的示例的概念圖表;圖3是表示根據(jù)第一實施方式的存儲集群系統(tǒng)中的處理請求命令的路由的示意圖;圖4是表示根據(jù)第二實施方式的存儲集群系統(tǒng)的操作示例的流程圖;圖5是總結(jié)根據(jù)第二實施方式的在存儲集群系統(tǒng)的操作中的情況1到情況5之中的差別的表格;圖6是表示根據(jù)第二實施方式的在存儲集群系統(tǒng)的操作的情況5中的處理流程的圖表;圖7是表示根據(jù)第三實施方式的在存儲集群系統(tǒng)的操作中的處理流程的圖表;
圖8是表示根據(jù)第四實施方式的在存儲集群系統(tǒng)的操作中的處理流程的圖表;圖9是表示根據(jù)第五實施方式的在存儲集群系統(tǒng)的操作中的處理流程的圖表;圖10是表示包含管理控制臺的存儲集群系統(tǒng)的配置示例的方塊圖;圖11是表示包含管理控制臺的存儲集群系統(tǒng)的另一個配置示例的方塊圖;圖12是表示根據(jù)第六實施方式的把存儲集群系統(tǒng)中的路由表結(jié)構(gòu)區(qū)分優(yōu)先次序的處理流程的流程圖;圖13是表示追加新存儲裝置到存儲集群系統(tǒng)的配置示例的圖表;圖14是表示根據(jù)第七實施方式的在存儲集群系統(tǒng)中追加新存儲裝置的處理流程的流程圖;圖15是表示根據(jù)所述實施方式的存儲集群系統(tǒng)的配置示例的功能性方塊圖;圖16A是表示邏輯盤區(qū)和物理盤區(qū)之間的相應關(guān)系的表格的一個示例;圖16B是表示邏輯盤區(qū)和物理盤區(qū)之間的相應關(guān)系的表格的一個示例;圖16C是表示邏輯盤區(qū)和物理盤區(qū)之間的相應關(guān)系的表格的一個示例;圖17是表示在主機裝置的識別號、主機裝置的精確值、邏輯盤區(qū)號和LUN號之間的關(guān)系的主機裝置-LUN映射表的一個示例;圖18A是區(qū)分優(yōu)先次序的路由表的一個示例;圖18B是區(qū)分優(yōu)先次序的路由表的一個示例;圖18C是區(qū)分優(yōu)先次序的路由表的一個示例;圖19A表示在其中對于發(fā)送源的每個裝置匯總讀和寫的SCSI命令的表格;圖19B表示命令格式的一個示例的表格;
圖20A表示盤區(qū)路由表的一個示例的表格;圖20B表示盤區(qū)路由表的一個示例的表格;以及圖20C表示盤區(qū)路由表的一個示例的表格。
具體實施例方式
下面將參考附圖描述執(zhí)行本發(fā)明的最佳方式。
(第一實施方式)圖1是表示應用根據(jù)本發(fā)明的第一實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)的配置示例的方塊圖。
確切地說,根據(jù)本發(fā)明實施方式的存儲集群系統(tǒng)10包括多個存儲裝置12(#A、#B和#C)以及主機裝置18,其中存儲裝置12經(jīng)由由光纖通道、iSCSI等組成的存儲區(qū)域網(wǎng)絡(luò)11而彼此連接,主機裝置18類似地被連接到存儲區(qū)域網(wǎng)絡(luò)11。多個存儲裝置12(#A、#B和#C)也被統(tǒng)稱為存儲集群。
每一個存儲裝置12包括控制器14和由存儲器硬件、HDD等構(gòu)成的物理存儲介質(zhì)16。在附圖中僅僅代表性地顯示了三個存儲裝置12,但是其數(shù)量并不限于三個。
物理存儲介質(zhì)16被劃分為例如,如圖2所示的多個盤區(qū)EXT。每個盤區(qū)是主機裝置18以邏輯順序訪問的單位區(qū)域。圖2表示包括三個區(qū)域EXT(#0、#1,和#2)的示例,但是毋庸說其數(shù)量并不限于三個。進而,所述盤區(qū)被分類為由主機裝置18所識別的邏輯盤區(qū)和由存儲裝置12在物理上管理的物理盤區(qū)。
提供控制器14以允許訪問物理盤區(qū)??刂破?4保存區(qū)分優(yōu)先次序的路由表,其定義從一個包括控制器14本身的存儲裝置12到其他存儲裝置12的優(yōu)先順序。
各個存儲裝置12經(jīng)由存儲區(qū)域網(wǎng)絡(luò)11與這些控制器14互相連接。結(jié)果,各個存儲裝置12分別經(jīng)由控制器14訪問在其他存儲裝置12中的物理存儲介質(zhì)16的物理盤區(qū)。
當從主機裝置18發(fā)送處理請求命令到任何一個組成存儲集群的存儲裝置12時,控制器14如下所述那樣運轉(zhuǎn)。
當從主機裝置18發(fā)送處理請求命令到例如存儲裝置12(#A)時,并且如果這個處理請求訪問存在于存儲裝置12(#A)的物理存儲介質(zhì)16(#A)中的物理盤區(qū)時,控制器14(#A)執(zhí)行處理以響應于處理請求命令,并接著返回處理結(jié)果給作為處理請求的發(fā)送源的主機裝置18。
另一方面,當從主機裝置18發(fā)送處理請求命令到存儲裝置12(#A)時并且如果這個處理請求訪問不存在于存儲裝置12(#A)的物理存儲介質(zhì)16(#A)中的物理盤區(qū)時,控制器14(#A)根據(jù)區(qū)分優(yōu)先次序的路由表中定義的訪問優(yōu)先順序,傳送處理請求命令到具有最高優(yōu)先順序的存儲裝置12中的控制器14,該最高優(yōu)先順序緊挨著除了上游存儲裝置(即,處理請求命令已經(jīng)被發(fā)送到的存儲裝置)的上述存儲裝置。例如,如果存儲裝置12(#B)具有區(qū)分優(yōu)先次序的路由表中的最高優(yōu)先順序并且其處于存儲裝置12(#A)的下游側(cè),存儲裝置12(#A)的控制器14(#A)傳送處理請求命令到控制器14(#B)。
如果處理請求命令以這種方式從控制器14(#A)發(fā)送到控制器14(#B)并且這個處理請求訪問存在于物理存儲介質(zhì)16(#B)的物理盤區(qū),則控制器14(#B)執(zhí)行處理以響應于處理請求命令并且返回處理結(jié)果給作為處理請求命令的發(fā)送源的控制器14(#A)。當處理結(jié)果已經(jīng)以這種方式從控制器14(#B)返回到控制器14(#A)后,控制器14(#A)返回處理結(jié)果給作為處理請求的發(fā)送源的主機裝置18。
另一方面,當處理請求命令從控制器14(#A)發(fā)送到控制器14(#B)時并且如果這個處理請求訪問不存在于物理存儲介質(zhì)16(B)的物理盤區(qū),則控制器14(#B)根據(jù)區(qū)分優(yōu)先次序的路由表中定義的訪問優(yōu)先順序,傳送處理請求命令到除了上游存儲裝置之外的最高優(yōu)先順序的存儲裝置12中的控制器14。例如,如果存儲裝置12(#C)具有緊鄰除了上游存儲裝置之外的存儲裝置12(#B)的高優(yōu)先順序,控制器14(#B)傳送處理請求命令給控制器14(#C)。
如果處理請求命令以這種方式從控制器14(#B)發(fā)送到控制器14(#C)并且這個處理請求訪問存在于物理存儲介質(zhì)16(#C)的物理盤區(qū)中,控制器14(#C)執(zhí)行處理以響應于處理請求命令并返回處理結(jié)果到作為處理請求命令的發(fā)送源的控制器14(#B)。在處理結(jié)果已經(jīng)以這種方式從控制器14(#C)返回到控制器14(#B)之后,控制器14(#B)返回處理結(jié)果到作為處理命令的發(fā)送源的控制器14(#A)。進而,在處理結(jié)果已經(jīng)以這種方式從控制器14(#B)返回到控制器14(#A)后,控制器14(#A)返回處理結(jié)果給作為處理請求命令的發(fā)送源的主機裝置18。
另一方面,當處理請求命令從控制器14(#B)發(fā)送到控制器14(#C)時以及如果這個處理請求訪問不存在于物理存儲介質(zhì)16(#C)的物理盤區(qū),則控制器14(#C)根據(jù)區(qū)分優(yōu)先次序的路由表中定義的訪問優(yōu)先順序傳送處理請求命令到除了上游存儲裝置之外的最高優(yōu)先順序的存儲裝置12中的控制器14。
在主機裝置18發(fā)送處理請求命令到存儲集群的任意存儲裝置12的情況下,每個存儲裝置12中的控制器14如上所述那樣運轉(zhuǎn),使得從作為具有處理所需的物理盤區(qū)的存儲裝置12的目標存儲裝置依次地在以上存儲裝置12和上游存儲裝置12之間順序地進行諸如寫和讀的數(shù)據(jù)轉(zhuǎn)移,并且處理結(jié)果最終被返回給主機裝置18。
將會更加顯著的是,如上所述構(gòu)成的存儲集群系統(tǒng)10通過例如將記錄在例如磁盤[軟(注冊商標)盤、硬盤等]、光盤(CD-ROM、DVD等)或者半導體存儲器中的程序,或者經(jīng)由例如因特網(wǎng)的通信網(wǎng)絡(luò)下載的程序,讀取到主機裝置18和存儲裝置12中,并接著通過所述程序控制主機裝置18和存儲裝置12的操作來實現(xiàn)。進而,記錄在記錄介質(zhì)中的程序包括設(shè)置程序,所述設(shè)置程序?qū)⒂捎嬎銠C執(zhí)行的軟件手段(不僅僅包括執(zhí)行程序還包括表和數(shù)據(jù)結(jié)構(gòu))引入到主機裝置18和存儲裝置12中。當從記錄介質(zhì)或者通信介質(zhì)將上述程序讀入到計算機中時,上述程序引起計算機如上所述地運轉(zhuǎn)。
如上所述構(gòu)成的根據(jù)本發(fā)明實施方式的存儲集群系統(tǒng)中的處理請求命令的路由將在圖3中簡略的示出。
確切地說,當請求命令從主機裝置18或者上游存儲裝置12被發(fā)送到存儲裝置12時(S1),并且如果這個處理請求訪問不存在于它的物理存儲介質(zhì)16的物理盤區(qū)(S2的“否”),則控制器14根據(jù)區(qū)分優(yōu)先次序的路由表中定義的訪問優(yōu)先順序,傳送處理請求命令到除了上游存儲裝置之外的最高優(yōu)先順序的存儲裝置12中的控制器14(S3)。
另一方面,在步驟S2,如果這個處理請求訪問存在于物理存儲介質(zhì)16中的物理盤區(qū)(S2的“是”),處理請求命令訪問物理存儲介質(zhì)16,以便執(zhí)行處理以響應于處理請求命令(S4)。
如上所述,在根據(jù)本實施方式的存儲集群系統(tǒng)中,在主機裝置18通過如上所述的這種功能發(fā)送處理請求命令給任意一個存儲集群的存儲裝置12的情況下,使得從作為具有處理所需的物理盤區(qū)的存儲裝置12的目標存儲裝置依次地在以上存儲裝置12和上游存儲裝置12之間順序地進行諸如寫和讀的數(shù)據(jù)轉(zhuǎn)移,并且處理結(jié)果最終被返回給主機裝置18。
這樣可以避免與包含在存儲集群中的存儲裝置12的數(shù)量成比例的路由信息的增長,其抑制了表的檢索時間的增長以及用于表保存的存儲區(qū)域的增長。另外,如果需要,在盤區(qū)遷移時的配置可以自動地改變。結(jié)果,可以實現(xiàn)有效的路由。
(第二實施方式)下面將根據(jù)第二實施方式描述本發(fā)明。
應用根據(jù)本發(fā)明的第二實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)是對應用根據(jù)本發(fā)明的第一實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)的變型例,控制器14的操作是它們之間的唯一不同。因此,在這個實施方式中,以下將只描述控制器14的操作,重復的解釋將被省略。
提供控制器14去訪問物理盤區(qū)??刂破?4保存區(qū)分優(yōu)先次序的路由表,其定義從包括控制器14的存儲裝置12到其他存儲裝置12的訪問優(yōu)先順序。
各個存儲裝置12經(jīng)由存儲區(qū)域網(wǎng)絡(luò)11與這些控制器14互相連接。結(jié)果,各個存儲裝置12經(jīng)由控制器14訪問其他存儲裝置12中的物理存儲介質(zhì)16的物理盤區(qū)。
當處理請求命令從主機裝置18發(fā)送到任何一個組成存儲集群的存儲裝置12時,控制器14如下所述地運轉(zhuǎn)。
當從主機裝置18發(fā)送處理請求命令到例如存儲裝置12(#A)時,并且如果這個處理請求訪問存在于存儲裝置12(#A)的物理存儲介質(zhì)16(#A)中的物理盤區(qū),則控制器14(#A)執(zhí)行處理以響應于處理請求命令并接著返回處理結(jié)果給作為處理請求的發(fā)送源的主機裝置18。
另一方面,當從主機裝置18發(fā)送處理請求命令到存儲裝置12(#A)時,并且如果這個處理需要訪問不存在于存儲裝置12(#A)的物理存儲介質(zhì)16(#A)中的物理盤區(qū),則控制器14(#A)從處理請求命令獲得廠商專有(vendor-unique)命令代碼,所述廠商專有命令代碼是對應于處理請求命令的特有命令,并且將包括上述存儲裝置12(#A)的標識符的比特映射數(shù)據(jù)和主機裝置18的標識符引入到廠商專有命令代碼中。接著,控制器14(#A)在對應于比特映射數(shù)據(jù)中的上述存儲裝置12(#A)的標識符的比特位置上設(shè)置比特,并且根據(jù)區(qū)分優(yōu)先次序的路由表中定義的訪問優(yōu)先順序,將廠商專有命令代碼轉(zhuǎn)送到除了上游存儲裝置之外的最高優(yōu)先順序的存儲裝置12中的控制器14。例如,如果除了上游存儲裝置之外的具有緊鄰存儲裝置12(#A)的具有最高優(yōu)先順序的存儲裝置是存儲裝置12(#B),則控制器14(#A)轉(zhuǎn)送廠商專有命令代碼到控制器14(#B)。
當廠商專有命令代碼以這種方式從控制器14(#A)發(fā)送到控制器14(#B)時,并且如果對應的處理要求訪問存在于物理存儲介質(zhì)16(#B)中的物理盤區(qū),則控制器14(#B)執(zhí)行這個處理并且將處理的結(jié)果返回到存儲裝置12中的控制器14,所述存儲裝置12具有與比特位置對應的標識符,并且在所述比特位置將比特設(shè)置在廠商專有命令數(shù)據(jù)中,即,存儲裝置12(#A)中的控制器14(#A)。在處理結(jié)果已經(jīng)以這種方式從控制器14(#B)返回到控制器14(#A)之后,控制器14(#A)返回處理結(jié)果到作為處理請求命令的發(fā)送源的主機裝置18。
另一方面,當廠商專有命令代碼從控制器14(#A)發(fā)送到控制器14(#B)時,以及如果對應于廠商專有命令代碼的處理需要訪問不存在于物理存儲介質(zhì)16(#B)中的物理盤區(qū),則控制器14(#B)在對應于比特映射數(shù)據(jù)中它的標識符的比特位置上設(shè)置比特,所述比特映射數(shù)據(jù)包含在廠商專有命令代碼中,并且控制器14(#B)根據(jù)區(qū)分優(yōu)先次序的路由表中定義的訪問優(yōu)先順序,傳送廠商專有命令代碼到除了上游存儲裝置之外的最高優(yōu)先順序的存儲裝置12中的控制器14。例如,如果除了上游存儲裝置之外的具有緊鄰存儲裝置12(#B)的具有最高優(yōu)先順序的存儲裝置是存儲裝置12(#C),則控制器14(#B)傳送廠商專有命令代碼到控制器14(#C)。
當廠商專有命令代碼以這種方式從控制器14(#B)發(fā)送到控制器14(#C)時,并且如果對應的處理需要訪問存在于物理存儲介質(zhì)16(#C)中的物理盤區(qū),則控制器14(#C)執(zhí)行對應的處理,生成對存儲裝置12(#A)的響應,存儲裝置12(#A)是已經(jīng)直接從主機裝置18接收處理請求的存儲裝置,并且控制器14(#C)經(jīng)由存儲裝置12(#B)發(fā)送已生成的對存儲裝置12(#A)的響應,存儲裝置12(#B)是具有對應于設(shè)置所述比特的所述比特位置的標識符的存儲裝置。
在控制器14(#A)已經(jīng)接收到所述響應之后,存儲裝置12(#A)請求存儲裝置12(#C)中的控制器14(#C)來發(fā)送處理的結(jié)果。
接著,響應于所述請求,控制器14(#C)發(fā)送處理結(jié)果到存儲裝置12(#A)的控制器14(#A)。已經(jīng)接收到處理結(jié)果之后,控制器14(#A)將其發(fā)送到主機裝置18。
以這種方式在存儲裝置(#A、#B和#C)的任意一個中執(zhí)行的處理結(jié)果通過存儲裝置12(#A)被發(fā)送到主機裝置18,所述存儲裝置12(#A)直接從主機裝置18接收處理請求。然而,正如參考存儲裝置12(#C)的示例所解釋的,在不執(zhí)行所述處理的存儲裝置12(#B)出現(xiàn)在已經(jīng)直接從主機裝置18接收到處理請求的存儲裝置12(#A)和執(zhí)行所述處理(此處,存儲裝置12(#B)被定義為“中間存儲裝置”)的存儲裝置12(#C)之間的情形中,在存儲裝置12(#C)中執(zhí)行的處理結(jié)果被直接發(fā)送到存儲裝置12(#A)而不經(jīng)過存儲裝置12(#B)。結(jié)果,數(shù)據(jù)經(jīng)由最短的路徑被有效地發(fā)送。
接下來,根據(jù)上述構(gòu)造的本實施方式的存儲集群系統(tǒng)的操作示例將參考圖4所示的流程圖進行描述。
當處理請求命令從主機裝置18發(fā)送到存儲裝置12(#A)(S11)時,并且如果這個處理需要訪問存在于存儲裝置12(#A)中的物理存儲介質(zhì)16(#A)的物理盤區(qū)(S12的“是”,S13的情況3),則控制器14(#A)執(zhí)行處理以響應于處理請求命令并且返回處理結(jié)果給作為處理源的發(fā)送源的主機裝置18(S14)。
另一方面,如果這個處理需要訪問不存在于存儲裝置12(#A)中的物理存儲介質(zhì)16(#A)中的物理盤區(qū)(S12的“否”,S17的“是”(情況2)),則控制器14(#A)從處理請求命令獲得廠商專有命令代碼,其是對應于處理請求命令的特有命令,并且將包括存儲裝置12(#A)的標識符和主機裝置18的標識符的比特映射數(shù)據(jù)引入廠商專有命令代碼。接著,在比特映射數(shù)據(jù)中,控制器14(#A)在對應于存儲裝置12(#A)的標識符的比特位置上設(shè)置比特,并且根據(jù)區(qū)分優(yōu)先次序的路由表中定義的訪問優(yōu)先順序?qū)S商專有命令代碼傳送到除了上游存儲裝置之外,最高優(yōu)先順序的存儲裝置12(#B)中的控制器14(#B)(S18)。
當廠商專有命令代碼以這種方式從控制器14(#A)發(fā)送到控制器14(#B)(S11)時,并且如果對應的處理需要訪問存在于物理存儲介質(zhì)16(#B)中的物理盤區(qū)(S12的“是”,S13的情況4),控制器14(#B)執(zhí)行這個處理并且將處理的結(jié)果返回到具有與在廠商專有命令數(shù)據(jù)中設(shè)置比特的比特位置對應的標識符的存儲裝置12中的控制器14,即,存儲裝置12(#A)中的控制器14(#A)(S15)。在處理結(jié)果已經(jīng)以這種方式從控制器14(#B)返回到控制器14(#A)之后,控制器14(#A)返回處理結(jié)果到作為處理請求命令的發(fā)送源的主機裝置18。
另一方面,當廠商專有命令代碼從控制器14(#A)發(fā)送到控制器14(#B)時,以及如果對應于這個廠商專有命令代碼的處理需要訪問不存在于物理存儲介質(zhì)16(#B)中的物理盤區(qū)(S17的“否”(情況1)),則控制器14(#B)在對應于它的包含在這個廠商專有命令代碼中的比特映射數(shù)據(jù)中的標識符的比特位置上設(shè)置比特,并且根據(jù)區(qū)分優(yōu)先次序的路由表中定義的訪問優(yōu)先順序,傳送廠商專有命令代碼到除了上游存儲裝置之外的最高優(yōu)先順序的存儲裝置12中的控制器14。例如,如果除了上游存儲裝置之外的具有緊鄰存儲裝置12(#B)的最高優(yōu)先順序的存儲裝置是存儲裝置12(#C),則控制器14(#B)傳送廠商專有命令代碼到控制器14(#C)(S19)。
當廠商專有命令代碼以這種方式從控制器14(#B)發(fā)送到控制器14(#C)(S11)時,并且如果對應的處理需要訪問存在于物理存儲介質(zhì)16(#C)中的物理盤區(qū)(S12的“是”,S13的情況5),則控制器14(#C)執(zhí)行對應的處理,并生成作為對存儲裝置12(#A)的響應的感應數(shù)據(jù),存儲裝置12(#A)是已經(jīng)直接從主機裝置18接收處理請求的存儲裝置,并且控制器14(#C)經(jīng)由存儲裝置12(#B)發(fā)送已生成的感應數(shù)據(jù)到存儲裝置12(#A)(S16)。在存儲裝置12(#A)中的控制器14(#A)已經(jīng)接收感應數(shù)據(jù)之后,控制器14(#A)請求控制器14(#C)發(fā)送處理結(jié)果。接著,響應于所述請求,控制器14(#C)發(fā)送處理結(jié)果給存儲裝置12(#A)中的控制器14(#A)。當已經(jīng)接收到所述處理結(jié)果時,控制器14(#A)將其發(fā)送到主機裝置18。
圖5是概括在上述情況1到情況5之中的差別的表格。在圖5中,主機存儲裝置對應于存儲裝置12(#A),中間存儲裝置對應于存儲裝置12(#B),以及目標存儲裝置對應于存儲裝置12(#C)。
圖6是表示上述情況5中處理流程的圖表。確切地說,處理請求命令從主機裝置18被發(fā)送到存儲裝置12(#A)(a1)。然而,這個處理需要訪問存在于物理存儲介質(zhì)16(#C)中的物理盤區(qū),由此控制器14(#A)生成包括比特映射數(shù)據(jù)的廠商專有命令代碼,在比特映射數(shù)據(jù)中設(shè)置對應于存儲裝置12(#A)的比特,并且控制器14(#A)將所生成的廠商專有命令代碼發(fā)送到控制器14(#B)(a2)。進而,控制器14(#B)設(shè)置對應于存儲裝置12(#B)的比特并且將廠商專有命令代碼發(fā)送到控制器14(#C)(a3)。
接著,控制器14(#C)執(zhí)行對應于廠商專有命令代碼的處理,生成響應于存儲裝置12(#A)的感應數(shù)據(jù),并經(jīng)由存儲裝置12(#B)(a4)發(fā)送所生成的感應數(shù)據(jù)到存儲裝置12(#A)(a5)。
在存儲裝置12(#A)已經(jīng)接收到感應數(shù)據(jù)之后,控制器14(#A)請求控制器14(#C)發(fā)送處理的結(jié)果(a6),使得響應于這個請求,控制器14(#C)發(fā)送處理結(jié)果到存儲裝置12(#A)中的控制器14(#A)(a7)。在已經(jīng)接收到這個處理結(jié)果之后,控制器14(#A)將其發(fā)送到主機裝置18(a8)。
如上所述,在根據(jù)本實施方式的存儲集群系統(tǒng)中,在任何一個存儲裝置(#A、#B和#C)中被執(zhí)行的處理的結(jié)果通過存儲裝置12(#A)被返回到主機裝置18,所述存儲裝置12(#A)已經(jīng)直接從主機裝置18接收到了處理請求。在這種情況中,正如所述處理在存儲裝置12(#C)中完成的情況,如果不執(zhí)行所述處理的存儲裝置12(#B)被插入到直接從主機裝置18接收處理請求的存儲裝置12(#A)和執(zhí)行所述處理的存儲裝置12(#C)之間,在存儲裝置12(#C)中執(zhí)行的處理結(jié)果就能夠直接被發(fā)送到存儲裝置12(#A)而不需要通過存儲裝置12(#B)。結(jié)果,即使在已經(jīng)從主機裝置18接收處理請求的存儲裝置12中未執(zhí)行所述處理的情況下,作為處理結(jié)果的數(shù)據(jù)也可以通過最短路徑被有效地發(fā)送。
(第三實施方式)下面將參考第三實施方式描述本發(fā)明。
應用根據(jù)本發(fā)明第三實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)是應用根據(jù)第一或者第二實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)的變型例,并且它們之間僅僅是控制器14的操作不同。因此,下面將只描述控制器14的操作,重復的解釋將被省略。
確切地說,在根據(jù)本實施方式的存儲集群系統(tǒng)中,在根據(jù)區(qū)分優(yōu)先次序的路由表中定義的訪問優(yōu)先順序,發(fā)送處理請求到除了上游存儲裝置12之外的任何其他存儲裝置12中的控制器14的情況下,并且如果在目的地的存儲裝置12中由于它的錯誤等使得控制器14不接受處理請求(不可能傳送),如果從目的控制器14發(fā)送錯誤響應,或者如果因為在預定的時間段內(nèi)沒有從目的地的控制器發(fā)送的響應使得所述處理超時,所述處理請求被再次發(fā)送到除了上游存儲裝置12之外的具有次高優(yōu)先順序的存儲裝置中的控制器。
例如,如圖7所示,自主機裝置18給定的處理請求根據(jù)區(qū)分優(yōu)先次序的路由表中定義的優(yōu)先順序,從存儲裝置12(#A)中的控制器14(#A)被發(fā)送到存儲裝置12(#B)中的控制器14(#B)。在這種情況下,如果存儲裝置12(#B)正在正常操作,處理結(jié)果或者感應數(shù)據(jù)應該從控制器14(#B)返回到存儲裝置12(#A)中的控制器14(#A)。然而,如果存儲裝置12(#B)由于錯誤等未正常操作,則控制器14(#B)不接受所述處理請求(不可能傳送),從所述控制器14(#B)發(fā)送錯誤響應或者在預定時間段內(nèi)沒有響應從控制器14(#B)發(fā)送,由此,控制器14(#A)確定它已經(jīng)超時(b2)。
在這種情況下,控制器14(#A)再次將發(fā)送到控制器14(#B)的處理請求發(fā)送到控制器14(#C)(b3)。
在這種方式中,處理請求通過繞過不正常操作的存儲裝置12,被發(fā)送到其他存儲裝置12,由此,能夠繼續(xù)所述處理而不打斷它。
(第四實施方式)下面將參考第四實施方式描述本發(fā)明。
應用根據(jù)本發(fā)明第四實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)是應用根據(jù)第一或者第二實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)的變型例。在所述變型例中,除了在第一和第二實施方式中描述的功能之外,分別對控制器14增加了下述通知功能以及對主機裝置18增加了下述切換功能。因此,下面將只描述差別,重復的解釋被省略。
確切地說,在存儲裝置12(#A、#B和#C)的本實施方式中,如圖8所示,主機裝置18訪問的存儲裝置12(#A)具有通知主機裝置18由存儲裝置12(#A、#B和#C)同步或者異步保存的物理盤區(qū)的信息的功能,例如,每個不變周期。
進而,主機裝置18被配置成具有這樣的功能,該功能基于由存儲裝置12(#A)的通知功能通知的信息以及處理請求的內(nèi)容,切換到處理請求將被發(fā)送到的存儲裝置12。
在上述根據(jù)本實施方式的存儲集群系統(tǒng)的配置中,存儲裝置12(#A)向主機裝置18通知存儲裝置12(#A、#B和#C)中保存的物理盤區(qū)的信息(c2),所述主機裝置18應當通過存儲裝置12(#A)(c1)訪問存儲裝置12(#C)。
因此,主機裝置18獲知對應于處理請求的物理盤區(qū)存在于存儲裝置12(#C)中,由此,處理請求被發(fā)送到的存儲裝置12從存儲裝置12(#A)切換到存儲裝置12(#C)(c3)。
結(jié)果,來自主機裝置18的處理請求的路徑和處理請求的處理結(jié)果返回到主機裝置18所經(jīng)過的路徑能夠被最小化,由此能夠?qū)崿F(xiàn)有效傳輸。
(第五實施方式)下面將參考第五實施方式描述本發(fā)明。
應用根據(jù)本發(fā)明第五實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)是應用根據(jù)第一或者第二實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)的變型例。對于存儲裝置12,除了上述在第一和第二實施方式中進行的描述之外,增加了下面的新功能。在這個實施方式中,由此,下面將只描述差別,重復的解釋被省略。
確切地說,在根據(jù)本實施方式的存儲集群系統(tǒng)中,每個存儲裝置12保存管理數(shù)據(jù)表。管理數(shù)據(jù)表可以被主機裝置18識別,并且管理由盤區(qū)構(gòu)成的邏輯卷的容量信息,指定被允許訪問所述邏輯卷的主機裝置18的主機標識符數(shù),以及用于指定主機裝置18訪問的物理盤區(qū)的物理可訪問區(qū)域標識符數(shù)的組合。進而,組成邏輯卷的盤區(qū)的物理盤區(qū)和邏輯盤區(qū)之間的對應關(guān)系僅僅被保存在存儲裝置12中,該存儲裝置12中存在對應的物理盤區(qū)。
響應于處理請求命令而不是包括自主機裝置18發(fā)送的處理請求的讀和寫指令的基于介質(zhì)訪問的指令,例如,諸如SCSI的查詢命令的控制命令、讀容量命令(Read Capacity command)和報告LUN命令,主機裝置18已經(jīng)訪問的存儲裝置12將處理結(jié)果發(fā)送到主機裝置18。
接下來,根據(jù)如上所述構(gòu)成的本實施方式的存儲集群系統(tǒng)的處理流程將參考圖9所示的流程圖被描述。
處理請求命令從主機裝置18被發(fā)送到存儲集群,并接著由存儲裝置12(#A)接收所述處理請求命令(S21)。
在這個處理請求命令是任何不同于基于介質(zhì)訪問的命令(S22的“否”)的情況下,存儲裝置12(#A)執(zhí)行所述處理,并發(fā)送處理的結(jié)果給主機裝置18作為響應(S23)。
另一方面,在這個處理請求命令是基于介質(zhì)訪問的命令(S22的“是”)的情況下,如第一或者第二實施方式所述來執(zhí)行該處理,最終處理的結(jié)果被發(fā)送到主機裝置18(S24)。
結(jié)果,如果處理請求命令是不同于基于介質(zhì)訪問的命令,能夠?qū)崿F(xiàn)有效的傳輸而不通過無效的路徑。
(第六實施方式)下面將參考第六實施方式描述本發(fā)明。
應用根據(jù)本發(fā)明第六實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)是應用根據(jù)第一或者第二實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)的變型例。如圖10或者11所示,應用根據(jù)第一或者第二實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)進一步包括管理控制臺20。這個管理控制臺20構(gòu)造默認的區(qū)分優(yōu)先次序的路由表。因此,下面將僅僅描述管理控制臺20,重復的解釋將被省略。
圖10是表示提供管理控制臺20的存儲區(qū)域網(wǎng)絡(luò)11中的配置示例的方塊圖,以及圖11是表示存儲裝置12(#A、#B和#C)通過LAN 22互相連接和提供管理控制臺20給LAN 22的另一個配置示例的方塊圖。
管理控制臺20發(fā)送存儲裝置12(#A、#B和#C)的信息以及存儲集群的命令請求到存儲裝置12(#A、#B和#C)的任意存儲裝置12。發(fā)送目的地的存儲裝置12被定義為構(gòu)造主裝置,其起到存儲集群的構(gòu)造處理的主裝置的作用。此后,存儲裝置12(#A)將被描述為構(gòu)造主裝置。
存儲裝置12(#A),其作為構(gòu)造主裝置,發(fā)送測試消息給存儲裝置12(#B)和12(#C)。
接著,存儲裝置12(#B)和12(#C)接收測試消息,并返回對測試消息的響應到作為構(gòu)造主裝置的存儲裝置12(#A)。
作為構(gòu)造主裝置的存儲裝置12(#A)基于自存儲裝置12(#B和#C)返回的響應,測量存儲裝置12(#B和#C)對所述測試消息的響應時間,自響應時間的較短一側(cè)對存儲裝置12(#B和#C)進行優(yōu)先排序,以由此確定訪問優(yōu)先順序并且生成默認的區(qū)分優(yōu)先次序的路由表,并且發(fā)送包含在存儲集群中的存儲裝置12(#A、#B和#C)的列表到每個存儲裝置12(#B和#C)。
根據(jù)所返回的列表,不同于構(gòu)造主裝置的存儲裝置12(#B和#C)發(fā)送測試消息給其他存儲裝置。例如,存儲裝置12(#B)發(fā)送測試消息給存儲裝置12(#A)和存儲裝置12(#C),并且存儲裝置12(#C)發(fā)送測試消息給存儲裝置12(#A)和存儲裝置12(#B)。另一方面,當已經(jīng)接收測試消息時,每個存儲裝置12都返回對測試消息的響應到發(fā)送源的存儲裝置12。
不同于構(gòu)造主裝置的存儲裝置12(#B和#C)基于這樣的返回響應,測量存儲裝置12對測試消息的響應時間,自響應時間的較短一側(cè)對存儲裝置12進行優(yōu)先排序,以由此確定訪問優(yōu)先順序并且生成默認的區(qū)分優(yōu)先次序的路由表,并且發(fā)送訪問優(yōu)先順序的構(gòu)造完成響應給作為構(gòu)造主裝置的存儲裝置12(#A)。
作為構(gòu)造主裝置的存儲裝置12(#A),當已經(jīng)接收到構(gòu)造完成響應時,返回訪問優(yōu)先順序的構(gòu)造完成響應給管理控制臺20,以執(zhí)行存儲集群的構(gòu)造處理。
接下來,將參考圖12所示的流程圖描述存儲集群的上述構(gòu)造處理。
當存儲集群的構(gòu)造處理開始時(S30),管理控制臺20發(fā)送存儲裝置12(#A、#B和#C)的信息和存儲集群的構(gòu)造請求給存儲裝置12(#A、#B和#C)的任意存儲裝置12(此處,存儲裝置12(#A))。發(fā)送目的地的存儲裝置12(#A)被定義為構(gòu)造主裝置,其擔任存儲集群的構(gòu)造處理的主裝置(S31)。
接著,從作為構(gòu)造主裝置的存儲裝置12(#A),測試消息被發(fā)送到存儲裝置12(#B)和存儲裝置12(#C)(S32)。
當這個測試消息被存儲裝置(#B和#C)所接受時,存儲裝置12(#B和#C)生成對測試消息的響應,并且所生成的響應被返回到作為構(gòu)造主裝置的存儲裝置12(#A)(S33)。
作為構(gòu)造主裝置的存儲裝置12(#A)基于自存儲裝置12(#B和#C)返回的響應,測量存儲裝置12(#B和#C)對測試消息的響應時間,并且自響應時間的較短一側(cè)對存儲裝置12(#B和#C)進行優(yōu)先排序,以由此確定訪問優(yōu)先順序并且生成默認的區(qū)分優(yōu)先次序的路由表(S34)。進而,發(fā)送包含在存儲集群中的存儲裝置12(#A、#B和#C)的列表到存儲裝置12(#B和#C)(S35)。
根據(jù)所發(fā)送的列表,從不同于構(gòu)造主裝置的存儲裝置12(#B和#C)將測試消息發(fā)送到該存儲裝置之外的存儲裝置12。已經(jīng)接收到測試消息的每個存儲裝置12都返回對測試消息的響應到發(fā)送源存儲裝置12。除了構(gòu)造主裝置之外的存儲裝置12(#B和#C)基于所返回的響應,測量存儲裝置12對測試消息的響應時間,并且自響應時間的較短一側(cè)對存儲裝置12進行優(yōu)先排序,以由此確定訪問優(yōu)先順序并且生成區(qū)分優(yōu)先次序的路由表(S36)。接著,從除了構(gòu)造主裝置之外的存儲裝置12(#B和#C),返回區(qū)分優(yōu)先次序的路由表的生成完成響應到存儲裝置12(#A),所述存儲裝置12(#A)是向存儲裝置12(#A)通知訪問優(yōu)先順序的構(gòu)造完成的構(gòu)造主裝置(S37)。
接著,在所述完成響應被作為構(gòu)造主裝置的存儲裝置12(#A)接收后,訪問優(yōu)先順序的構(gòu)造完成響應從作為構(gòu)造主裝置的存儲裝置12(#A)返回到管理控制臺20(S38),由此,存儲集群的構(gòu)造處理完成(S39)。
根據(jù)本實施方式的存儲集群系統(tǒng)使其能夠有效地構(gòu)造如上所述的區(qū)分優(yōu)先次序的路由表。
(第七實施方式)下面將參考第七實施方式描述本發(fā)明。
應用根據(jù)本發(fā)明第七實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)是應用根據(jù)第六實施方式的數(shù)據(jù)處理方法的存儲集群系統(tǒng)的變型例。在這個變型例中,管理控制臺20執(zhí)行用于追加新存儲裝置12到正在操作的存儲集群的追加處理。因此,下面將描述執(zhí)行所述追加處理的管理控制臺20,并且重復的解釋將被省略。
如圖13所示,例如,管理控制臺20在新存儲裝置12(#D)被追加到正在操作的存儲集群的情況下執(zhí)行追加處理。圖13表示管理控制臺20被連接到與存儲裝置12(#A、#B、#C和#D)相連的LAN22的配置示例,但是管理控制臺20可能被連接到存儲區(qū)域網(wǎng)絡(luò)11,例如,如圖10所示。
在追加新存儲裝置12(#D)到正在操作的存儲集群的情況下,管理控制臺20發(fā)送用于新存儲裝置12(#D)的追加的請求和新存儲裝置12(#D)的信息到現(xiàn)在正在操作的存儲裝置12(#A、#B和#C)的任意存儲裝置(其在此被暫定為存儲裝置12(#A))。發(fā)送目的地的存儲裝置12(#A)被定義為追加主裝置,該追加主裝置在存儲裝置12(#D)的追加過程中起到主裝置的作用。此后,將在存儲裝置12(#A)是追加主裝置的假設(shè)下進行說明。
作為追加主裝置的存儲裝置12(#A)發(fā)送測試消息給新存儲裝置12(#D)。當測試消息以這種方式被發(fā)送到那里時,存儲裝置12(#D)響應作為追加主裝置的存儲裝置12(#A)。
在作為追加主裝置的存儲裝置12(#A)已經(jīng)確定所述響應的接收之后,存儲裝置12(#D)的訪問優(yōu)先順序被追加到區(qū)分優(yōu)先次序的路由表作為最低訪問優(yōu)先位置。進而,存儲裝置12(#A)發(fā)送關(guān)于追加新存儲裝置12(#D)的消息給存儲集群并且發(fā)送新存儲裝置12(#D)的信息給存儲裝置12(#B和#C),在存儲裝置12(#B和#C)中,訪問優(yōu)先順序已經(jīng)被定義在區(qū)分優(yōu)先次序的路由表中。
除了作為追加主裝置的存儲裝置12(#A)的存儲裝置12以及新存儲裝置12(#D)之外,即,存儲裝置12(#B)和存儲裝置12(#C)分別將新存儲裝置12(#D)追加到它們的區(qū)分優(yōu)先次序的路由表中的最低優(yōu)先位置上,并返回追加完成響應給追加主裝置。
接下來,作為追加主裝置的存儲裝置12(#A)發(fā)送在存儲集群中包含的存儲裝置的列表給新存儲裝置12(#D)。根據(jù)此列表,新存儲裝置12(#D)發(fā)送測試消息給除了存儲裝置12(#D)之外的存儲裝置12,即存儲裝置12(#A)、存儲裝置12(#B)和存儲裝置12(#C)。
存儲裝置12(#A、#B和#C)接收所述測試消息,并返回對所述測試消息的響應給新存儲裝置12(#D)。
新存儲裝置12(#D)基于發(fā)送回的響應,測量存儲裝置12(#A、#B和#C)對測試消息的響應時間,并且自響應時間的較短一側(cè)對存儲裝置12(#A、#B和#C)進行優(yōu)先排序,以由此確定訪問優(yōu)先順序,這樣生成區(qū)分優(yōu)先次序的路由表。接著,新存儲裝置12(#D)返回區(qū)分優(yōu)先次序的路由表的生成完成響應到作為追加主裝置的存儲裝置12(#A)。
作為追加主裝置的存儲裝置12(#A)接收來自新存儲裝置12(#B和#C)的追加完成響應并且生成來自存儲裝置12(#D)的完成響應,并接著返回新存儲裝置12(#D)的追加完成響應給管理控制臺20,由此,完成追加新存儲裝置12(#D)的的過程。
接下來,新存儲裝置到上述存儲集群的追加過程的流程將參考圖14所示的流程圖進行描述。此后,將在存儲裝置12(#A)是追加主裝置的假設(shè)下進行說明。
在追加新存儲裝置12(#D)到正在操作的存儲集群的情形中,管理控制臺20發(fā)送新存儲裝置12(#D)的追加請求以及新存儲裝置12(#D)的信息給現(xiàn)在正在操作的存儲裝置12(#A、#B和#C)的任意存儲裝置(此處,存儲裝置12(#A))(S40)。根據(jù)所發(fā)送的追加請求和信息被存儲裝置12(#A)所接收的事實,存儲裝置12(#A)被定義為追加的主裝置,其擔任存儲裝置12(#D)的追加過程的主裝置(S41)。
被定義為追加主裝置的存儲裝置12(#A)發(fā)送測試消息給新存儲裝置12(#D)(S42)。
在如此發(fā)送的測試消息已經(jīng)被存儲裝置12(#D)接收以后,存儲裝置12(#D)響應作為追加的主裝置的存儲裝置12(#A)(S43)。
在這個響應已經(jīng)被作為追加主裝置的存儲裝置12(#A)所接收并且確認以后,存儲裝置12(#A)追加存儲裝置12(#D)的訪問優(yōu)先順序到區(qū)分優(yōu)先次序的路由表,作為最低優(yōu)先順序(S44)。進而,存儲裝置12(#A)發(fā)送關(guān)于追加新存儲裝置12(#D)的消息給存儲集群以及新存儲裝置12(#D)的信息給其訪問優(yōu)先順序已經(jīng)被定義在區(qū)分優(yōu)先次序的路由表中的存儲裝置12(#B和#C)(S45)。
在每一個存儲裝置12(#A)、存儲裝置12(#B)和存儲裝置12(#C)中,新存儲裝置12(#D)被追加到區(qū)分優(yōu)先次序的路由表的最低優(yōu)先位置(S46)。
然后,存儲裝置12(#B)和存儲裝置12(#C)將追加完成響應返回到作為追加主裝置的存儲裝置12(#A)(S47)。
接下來,作為追加主裝置的存儲裝置12(#A)發(fā)送包含在存儲集群中的存儲裝置的列表到新存儲裝置12(#D)(S48)。
另一方面,新存儲裝置12(#D)根據(jù)上述列表,發(fā)送測試消息給除了新存儲裝置12(#D)之外的存儲裝置12,即存儲裝置12(#A)、存儲裝置12(#B)和存儲裝置12(#C)(S49)。在已經(jīng)接收到所述測試消息之后,存儲裝置12(#A、#B和#C)返回對所述測試消息的響應給新存儲裝置12(#D)。
存儲裝置12(#D)基于發(fā)送回的響應,測量存儲裝置12(#A、#B和#C)對這個測試消息的響應時間,并且自響應時間的較短一側(cè)對存儲裝置12(#A、#B和#C)進行優(yōu)先排序,以由此確定訪問優(yōu)先順序,這樣生成區(qū)分優(yōu)先次序的路由表(S50)。接著,存儲裝置12(#D)返回區(qū)分優(yōu)先次序的路由表的生成完成響應到作為追加主裝置的存儲裝置12(#A)(S51)。
當已經(jīng)接收到來自新存儲裝置12(#D)的生成完成響應時,作為追加主裝置的存儲裝置12(#A)返回新存儲裝置12(#D)的追加完成響應給管理控制臺20(S52)。由此,完成用于新存儲裝置12(#D)的追加的過程(S53)。
根據(jù)本實施方式的存儲集群系統(tǒng)能夠以上述方式使新存儲裝置12(#D)有效追加。
(示例)下面將進一步描述在第一到第七實施方式中描述的存儲集群系統(tǒng)的特定示例。
首先,將通過使用具有如圖15所示配置的存儲集群系統(tǒng)10,在下面描述第一、第二和第五實施方式中的更具體的示例。
存儲裝置12(#0、#1和#2)組成圖15的存儲集群系統(tǒng)10,分別具有物理存儲介質(zhì)16(#0、#1和#2),如圖2所示。每個物理存儲介質(zhì)16(#0、#1和#2)具有三個1GB大小的盤區(qū)EXT(#0、#1和#2),并由此每個物理存儲介質(zhì)16(#0、#1和#2)具有3GB的總?cè)萘俊D15所示的配置示例的存儲集群具有三個存儲裝置12,并因此整個存儲集群的總?cè)萘繛?GB。
另一方面,每個邏輯盤區(qū)LDISK和每個物理盤區(qū)EXT之間的相應關(guān)系由圖16所示的表進行定義。圖16A中的表被保存在存儲裝置12(#0)中,圖16B中的表被保存在存儲裝置12(#1)中,并且圖16C中的表被保存在存儲裝置12(#2)中。
進一步,如圖17所示,存儲裝置12(#0、#1和#2)共同具有主機裝置-LUN映射表,其表示主機裝置18的標識符號(主機ID)、主機裝置18的特定值(參見圖15)、邏輯盤區(qū)LDISK號和LUN號之間的關(guān)系。
存儲裝置12(#0)保存如第六實施方式所述并例如在圖18A中所示而生成的區(qū)分優(yōu)先次序的路由表。類似地,存儲裝置12(#1)保存圖18B中所示的區(qū)分優(yōu)先次序的路由表,以及存儲裝置12(#2)保存圖18C中所示的這樣的區(qū)分優(yōu)先次序的路由表。
接下來,下面描述在從主機裝置18(#0)發(fā)送到存儲裝置12(#0)的處理請求是如下給出的讀請求命令A的情況下的讀處理流程。
命令ASCSI Command Code=28h(READ EXTENDED)LUN=02hLBA=400001h(≥2GB,<3GB)Transfer Size=100h(128KB)處理流程1)主機裝置18(#0)發(fā)送命令A到存儲裝置12(#0)。
2)存儲裝置12(#0)基于命令A的請求,指定主機ID=0來決定命令A是否是從主機裝置18(#0)對可訪問的邏輯卷的訪問。在這種情況下,存儲裝置12(#0)首先指定命令A中的訪問邏輯盤區(qū)LDISK。在這種情況下,存儲裝置12(#0)參考圖17的映射表以決定命令A是對邏輯盤區(qū)LDISK2的訪問并且是可訪問的。
3)接下來,存儲裝置12(#0)決定哪個邏輯盤區(qū)LDISK是命令A訪問的。從命令A1的LBA決定在邏輯盤區(qū)LDISK上的哪個邏輯盤區(qū),但是在這種情況下,在2GB≤LBA<3GB的基礎(chǔ)上,存儲裝置12(#0)決定命令A是對物理盤區(qū)EXT(#2)的訪問。因此,考慮上述步驟2)的結(jié)果,存儲裝置12(#0)決定命令A是對邏輯盤區(qū)LDISK(2,2)的訪問。
4)存儲裝置12(#0)決定與邏輯盤區(qū)LDISK(2,2)對應的物理盤區(qū)是否存在于存儲裝置12(#0)自身中。在這種情況下,存儲裝置12(#0)參考圖16A所示的表決定邏輯盤區(qū)(2,2)不存在于存儲裝置12(#0)的物理存儲介質(zhì)16(#0)中。
5)由于命令A不是對存儲裝置12(#0)的物理存儲介質(zhì)16(#0)的訪問,存儲裝置12(#0)發(fā)送請求給除了由圖18A的區(qū)分優(yōu)先次序的路由表所定義的上游存儲裝置之外的最高優(yōu)先順序的存儲裝置,即,存儲裝置12(#1)。此時,所述請求被以諸如如下命令B所示的廠商專有命令的形式發(fā)送,其作為第二實施方式中的廠商專有命令。注意到,圖19A是在其中對發(fā)送源的每個裝置匯總了用于讀和寫的SCSI命令的表,而圖19B是示出了命令格式的一個示例的表。
命令B(從存儲裝置12(#0)發(fā)送到存儲裝置12(#1))SCSI Command Code=C8h(READ REDIRECT)LUN=02hLBA=400001h(≥2GB,<3GB)Transfer Size=100h(128KB)Host ID=00hUnit ID Bitmap|=0×01(設(shè)置Bit 0)(→Host ID Bitmap=0×01)6)存儲裝置12(#1)接收命令B,并考慮主機ID和包含在命令B中的LUN的組合,決定命令B是對邏輯盤區(qū)LDISK(2,2)的訪問,如以上步驟2)到4),并且進一步?jīng)Q定相應的物理盤區(qū)EXT是否存在于存儲裝置12(#1)的物理存儲介質(zhì)16(#1)中。在這種情況下,存儲裝置12(#1)參考圖16B所示的表,以決定邏輯盤區(qū)LDISK(2,2)不存在于存儲裝置12(#1)的物理存儲介質(zhì)16(#1)中。
7)由于命令A不是對存儲裝置12(#1)的物理存儲介質(zhì)16(#1)的訪問,存儲裝置12(#1)發(fā)送請求給作為除了在圖18B所示的區(qū)分優(yōu)先次序的路由表的主機1ID比特映射中所存在的上游存儲裝置之外的最高優(yōu)先順序的存儲裝置的存儲裝置12(#2)。此時,請求A被以諸如如下命令C所示的廠商專有命令的形式發(fā)送,其作為第二實施方式中的廠商專有命令。
命令C(從存儲裝置12(#1)發(fā)送到存儲裝置12(#2))SCSI Command Code=D8h(READ PASSTHRU)(廠商專有)LUN=02hLBA=400001h(≥2GB,<3GB)
Transfer Size=100h(128KB)Host ID=00hUnit ID Bitmap|=0×02(設(shè)置Bit 0)(→Host ID Bitmap=0×03)8)存儲裝置12(#2)接收命令C,并考慮到主機ID和包含在命令C中的LUN的組合,決定命令C是對邏輯盤區(qū)LDISK(2,2)的訪問,如以上步驟2)到4),并且進一步?jīng)Q定相應的物理盤區(qū)EXT是否存在于存儲裝置12(#2)的物理存儲介質(zhì)16(#2)中。在這種情況下,存儲裝置12(#2)參考圖16C所示的表,以決定邏輯盤區(qū)LDISK(2,2)存在于存儲裝置12(#2)的物理存儲介質(zhì)16(#2)并且對應于物理盤區(qū)EXT(2,2)。
9)存儲裝置12(#2)通過命令C的命令代碼決定命令C被從中間存儲裝置12(#1)發(fā)送。即,決定從主機裝置18(#0)發(fā)送到存儲裝置12(#0)的命令是經(jīng)由存儲裝置12(#1)傳送的。
10)如在第二實施中所述的,存儲裝置12(#2)返回如下面響應A所示的感應數(shù)據(jù)到作為命令C的發(fā)送源的存儲裝置12(#1)。
響應ASCSI Status=Check Condition(02h)Sense Key=Not Direct Transfer(C0h)(廠商專用)Sense Date=Host ID of Storage device 12(02h)(#2)11)響應A以與所述命令的情況相反的順序被發(fā)送,即,以存儲裝置12(#2)→存儲裝置12(#1)→存儲裝置12(#0)的順序。如圖20A和20B所示,當所述訪問獲取對于相應邏輯盤區(qū)LDISK(2,2)的盤區(qū)路由表時,在接下來接收對相同的邏輯盤區(qū)LDISK(2,2)的訪問的情況下,存儲裝置12(#1)和存儲裝置12(#2)學會直接發(fā)送響應A到存儲裝置12(#2)。
12)在已經(jīng)接收響應A之后,作為主機的存儲裝置12(#0)基于上述步驟11)中獲悉的盤區(qū)路由表(圖20A)發(fā)送下面的命令D到存儲裝置12(#2)。
命令DSCSI Command Code=C8h(READ REDIRECT)LUN=02hLBA=400001h(≥2GB,<3GB)Transfer Size=100h(128KB)Host ID=00hUnit ID Bitmap|=0×01(設(shè)置Bit 0)(→Host ID Bitmap=0×01)13)存儲裝置12(#2)接收命令D,并且以與步驟2)到4)中的相同方式?jīng)Q定命令D是對邏輯盤區(qū)LDISK(2,2)的訪問并且進一步?jīng)Q定相應的物理盤區(qū)EXT是否存在于存儲裝置12(#2)的物理存儲介質(zhì)16(#2)中。在這種情況下,存儲裝置12(#2)參考圖16C所示的表,以決定邏輯盤區(qū)LDISK(2,2)存在于存儲裝置12(#2)的物理存儲介質(zhì)16(#2)中并且對應于物理盤區(qū)EXT(2,2)。
14)存儲裝置12(#2)根據(jù)命令D的命令代碼決定命令D被從存儲裝置,即,存儲裝置12(#2)發(fā)送。
15)存儲裝置12(#2)執(zhí)行對物理盤區(qū)EXT(2,2)的讀訪問以在存儲裝置12(#0)和存儲裝置12(#2)之間傳送一系列數(shù)據(jù)。
16)在存儲裝置12(#0)和存儲裝置12(#2)之間的讀傳送完成之后,存儲裝置12(#0)進行到主機裝置18(#0)的讀傳送,由此完成所述處理。
因此,能夠避免與在存儲集群中包含的存儲裝置12的數(shù)目成比例的路由信息增加,其抑制了表搜索時間的增加和用于表保存的存儲區(qū)域的增加。另外,如果需要,能夠自動地改變盤區(qū)遷移時的構(gòu)成。結(jié)果,可以實現(xiàn)有效的路由。
已經(jīng)參考附圖如上描述了用以執(zhí)行本發(fā)明的最佳模式,但是本發(fā)明并不限制在所述模式的構(gòu)成中。在權(quán)利要求中的發(fā)明的技術(shù)范疇內(nèi),本領(lǐng)域技術(shù)人員可以創(chuàng)造不同的改變和修改。因此,可以理解這些改變和修改將落入本發(fā)明的技術(shù)范圍內(nèi)。
附加的優(yōu)勢和修改將會很容易地被本領(lǐng)域技術(shù)人員所想到。因此,在其更寬的方面,本發(fā)明不被限制于在此示出和描述的具體細節(jié)和代表性實施方式中。于是,可以做出不同的修改而不脫離如所附權(quán)利要求及其等同所定義的總的發(fā)明概念的精神或范圍。
權(quán)利要求
1.一種存儲集群系統(tǒng),其包括由多個存儲裝置組成的存儲集群,和通過第一通信網(wǎng)絡(luò)連接到所述存儲集群的主機裝置,每個存儲裝置的特征在于,包括多個可訪問區(qū)域,其中所述主機裝置在邏輯上可訪問的區(qū)域被劃分為該多個可訪問區(qū)域;控制器,用以訪問由所述存儲裝置在物理上管理的所述多個可訪問區(qū)域的物理可訪問區(qū)域;以及優(yōu)先順序信息,其被所述控制器參考并且定義了包括該控制器的存儲裝置到其他存儲裝置的訪問優(yōu)先順序;其中,在各自的存儲裝置中的控制器被通過第二通信網(wǎng)絡(luò)互相連接,由此每個所述存儲裝置能夠經(jīng)由所述控制器訪問所述其他存儲裝置的任何一個中的所述物理可訪問區(qū)域,當從所述主機裝置發(fā)送對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求時,該存儲裝置中的控制器根據(jù)所述優(yōu)先順序信息中定義的優(yōu)先順序,將該處理請求發(fā)送到除了該處理請求已經(jīng)發(fā)送到的存儲裝置之外的、最高優(yōu)先順序的其他存儲裝置中的處理器,當從所述主機裝置發(fā)送對于存在于所述存儲裝置的物理可訪問區(qū)域的處理請求時,該存儲裝置中的控制器進行響應于該處理請求的處理并且發(fā)送所述處理的結(jié)果到該處理請求的發(fā)送源,當所述處理結(jié)果被從所述其它存儲裝置中的控制器發(fā)送到所述存儲裝置時,該存儲裝置中的控制器發(fā)送處理結(jié)果到已經(jīng)發(fā)送了對應于所述處理結(jié)果的處理請求到所述存儲裝置的所述發(fā)送源,所述處理結(jié)果被發(fā)送到已經(jīng)從所述主機裝置接收了該處理請求的所述存儲裝置,并且這個存儲裝置將所接收的處理結(jié)果發(fā)送到所述主機裝置。
2.一種存儲集群系統(tǒng),包括由多個存儲裝置組成的存儲集群,以及通過第一通信網(wǎng)絡(luò)被連接到該存儲集群的主機裝置,每個所述存儲裝置的特征在于,包括多個可訪問區(qū)域,其中所述主機裝置在邏輯上可訪問的區(qū)域被劃分為該多個可訪問區(qū)域,控制器,用以訪問由所述存儲裝置在物理上管理的所述多個可訪問區(qū)域的物理可訪問區(qū)域;以及優(yōu)先順序信息,其被所述控制器參考并且定義了包括該控制器的存儲裝置到其他存儲裝置的訪問優(yōu)先順序;其中,在各自的存儲裝置中的控制器被通過第二通信網(wǎng)絡(luò)互相連接,由此每個所述存儲裝置能夠經(jīng)由所述控制器訪問所述其他存儲裝置的任何一個中的所述物理可訪問區(qū)域,已接收到來自所述主機裝置的對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求的所述存儲裝置,從該處理請求中獲取對應于該處理請求的特有命令,將包括該存儲裝置的標識符和所述主機裝置的標識符的比特映射數(shù)據(jù)引入到命令代碼中,在該比特映射數(shù)據(jù)中與所述存儲裝置的標識符相對應的比特位置上設(shè)置比特,并且根據(jù)所述優(yōu)先順序信息,將所述命令代碼發(fā)送給除了所述處理請求已經(jīng)被發(fā)送到的存儲裝置之外的最高優(yōu)先順序的所述其他存儲裝置的任何一個;在以下情況下,即,在所述命令代碼被從所述多個存儲裝置中的任何一個發(fā)送到的所述存儲裝置中,與所述命令代碼對應的處理請求是對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求,則所述存儲裝置在與包含在所述命令代碼中的比特映射數(shù)據(jù)中的標識符對應的比特位置上設(shè)置比特,并且根據(jù)所述優(yōu)先順序信息,將所述命令代碼發(fā)送到除了所述處理請求已經(jīng)被發(fā)送到的存儲裝置之外的、最高優(yōu)先順序的存儲裝置,在對應于所述發(fā)送的命令代碼的處理請求是對于存在于所述存儲裝置中的物理可訪問區(qū)域的處理請求的情況下以及在所述比特映射數(shù)據(jù)未被包含在所述發(fā)送的命令代碼中的情況下,這個存儲裝置響應于對應所述命令代碼的處理請求進行處理,并且將所述處理的結(jié)果發(fā)送到所述主機裝置,在所述比特映射數(shù)據(jù)被包含在所述發(fā)送的命令代碼中并且在所述比特位置的任何一個上設(shè)置比特的情況下,這個存儲裝置響應于對應所述命令代碼的處理請求進行處理,并且將所述處理的結(jié)果發(fā)送到具有與設(shè)置所述比特的比特位置對應的標識符的存儲裝置,在所述比特映射數(shù)據(jù)被包含在所述發(fā)送的命令代碼中并且在多個比特位置上設(shè)置所述比特的情況下,這個存儲裝置響應于對應所述命令代碼的處理請求進行處理,產(chǎn)生對于已從所述主機裝置直接接收了所述處理請求的存儲裝置的響應,并且將所述生成的響應發(fā)送到已經(jīng)經(jīng)由具有與設(shè)置所述比特的所述比特位置對應的標識符的存儲裝置從所述主機裝置接收了所述處理請求的存儲裝置,所述響應被發(fā)送到的存儲裝置請求已經(jīng)生成了所述響應的存儲裝置發(fā)送所述處理結(jié)果,所述被請求的存儲裝置發(fā)送所述處理結(jié)果到請求源的存儲裝置,使得在所述存儲裝置的任意一個獲得的處理結(jié)果被發(fā)送到已經(jīng)直接從所述主機裝置接收了所述處理請求的存儲裝置,并且已經(jīng)直接從所述主機裝置接收到所述處理請求的存儲裝置發(fā)送所述處理結(jié)果到該主機裝置。
3.根據(jù)權(quán)利要求1或2的存儲集群系統(tǒng),其特征在于,在根據(jù)所述優(yōu)先順序信息中定義的優(yōu)先順序?qū)⑺鎏幚碚埱蟀l(fā)送到其他存儲裝置的控制器的情況下以及在目的地的控制器不接收該處理請求的情況下以及從所述控制器返回錯誤響應的情況下或者在所述控制器在預定時間經(jīng)過沒有給出響應的情況下,所述處理請求被發(fā)送到除了該處理請求已經(jīng)被發(fā)送到的存儲裝置之外的下一個最高優(yōu)先順序的存儲裝置中的控制器。
4.根據(jù)權(quán)利要求1或2的存儲集群系統(tǒng),其特征在于,所述主機裝置已經(jīng)訪問的所述多個存儲裝置中的存儲裝置被配置了通知部分,其通知所述主機裝置在每個所述存儲裝置中保持的物理可訪問區(qū)域的信息,以及所述主機裝置配置了切換部分,其基于從所述通知部分通知的信息和所述處理請求的內(nèi)容,切換所述處理請求將被發(fā)送到的存儲裝置。
5.根據(jù)權(quán)利要求1或2的存儲集群系統(tǒng),其特征在于,所述存儲集群的每個存儲裝置包括數(shù)據(jù)表、主機識別號和物理可訪問區(qū)域識別號,所述數(shù)據(jù)表管理邏輯卷的容量信息的組合,其中所述邏輯卷由在每個存儲裝置中包含的所述多個可訪問區(qū)域中的一個或者兩個或更多個的組合所構(gòu)成并且能被所述主機裝置識別,所述主機識別號用以指定被允許訪問所述邏輯卷的主機裝置,以及所述物理可訪問區(qū)域識別號用以指定所述主機裝置訪問的物理可訪問區(qū)域,僅在其中存在所述物理可訪問區(qū)域的存儲裝置保持了在物理可訪問區(qū)域和邏輯可訪問區(qū)域之間的對應關(guān)系,并且所述主機裝置能夠在構(gòu)成所述邏輯卷的可訪問區(qū)域之中識別該邏輯可訪問區(qū)域,以及所述主機裝置已經(jīng)訪問的存儲裝置,響應于從該主機裝置發(fā)送的處理請求中除了包括寫和讀命令的介質(zhì)訪問命令以外的處理請求,發(fā)送處理結(jié)果到所述主機裝置。
6.根據(jù)權(quán)利要求1或2的存儲集群系統(tǒng),進一步包括管理所述存儲集群的管理控制臺,其特征在于,所述管理控制臺發(fā)送所述存儲裝置的信息和所述存儲集群的構(gòu)造請求到任意一個存儲裝置,并且目的地的存儲裝置被定義為構(gòu)造主裝置,其起到所述存儲集群的構(gòu)造處理的主裝置的作用,所述構(gòu)造主裝置向與從所述管理控制臺發(fā)送的信息相對應的每個存儲裝置發(fā)送測試消息,每個已經(jīng)接收了所述測試消息的存儲裝置將對該測試消息的響應返回到所述構(gòu)造主裝置,所述構(gòu)造主裝置基于從所述存儲裝置返回的響應,測量存儲裝置對所述測試消息的響應時間,從所述響應時間短的方面考慮存儲裝置的優(yōu)先順序以從而生成優(yōu)先順序信息,并且將包含在所述存儲集群中的存儲裝置的列表發(fā)送到每個存儲裝置,除了所述構(gòu)造主裝置,所述存儲裝置的每一個依據(jù)所述發(fā)送的列表傳送測試消息給該存儲裝置之外的存儲裝置;已經(jīng)接收到所述測試消息的每個存儲裝置返回對該測試消息的響應給傳送源的存儲裝置,除了所述構(gòu)造主裝置之外的存儲裝置基于所述返回的響應,測量所述存儲裝置對所述測試消息的響應時間,從響應時間短的方面考慮存儲裝置的優(yōu)先順序,以由此生成優(yōu)先順序信息,向所述構(gòu)造主裝置返回該優(yōu)先順序信息的構(gòu)造完成響應,以及當已經(jīng)接收到所述構(gòu)造完成響應時,所述構(gòu)造主裝置返回所述優(yōu)先順序信息的構(gòu)造完成響應到所述管理控制臺,以進行所述存儲集群的構(gòu)造處理。
7.根據(jù)權(quán)利要求1或2的存儲集群系統(tǒng),進一步包括管理控制臺,其進行追加新的存儲裝置到正在工作的存儲集群的追加處理,其特征在于,所述管理控制臺發(fā)送追加所述新的存儲裝置的請求和該新的存儲裝置的信息到任意一個存儲裝置,并且發(fā)送的目的地的存儲裝置被定義為追加主裝置,其起到所述存儲裝置的追加處理的主裝置的作用,所述追加主裝置發(fā)送測試消息給所述信息已經(jīng)被從所述管理控制臺發(fā)送到的所述新的存儲裝置,確認由該新的存儲裝置發(fā)送的對所述傳送的測試消息的響應,將該新的存儲裝置的訪問優(yōu)先順序作為最低的優(yōu)先順序追加到所述優(yōu)先順序信息中,并且發(fā)送關(guān)于該新的存儲裝置的追加的消息到所述存儲集群以及發(fā)送該新的存儲裝置的信息給已經(jīng)在所述優(yōu)先順序信息中定義了訪問優(yōu)先順序的存儲裝置,除了所述追加主裝置和所述新的存儲裝置之外的存儲裝置在該存儲裝置的優(yōu)先順序信息的最低位置加入所述新的存儲裝置,并且返回追加完成響應到所述追加主裝置;所述追加主裝置將所述存儲集群中包含的存儲裝置的列表發(fā)送到所述新的存儲裝置,所述新的存儲裝置依據(jù)所述列表將測試消息發(fā)送到除了該存儲裝置之外的存儲裝置;已經(jīng)接收了所述測試消息的存儲裝置返回對該測試消息的響應到所述新的存儲裝置,所述新的存儲裝置基于所述返回的響應,測量所述存儲裝置對所述測試消息的響應時間,并且從響應時間短的方面考慮存儲裝置的優(yōu)先順序以由此生成優(yōu)先順序信息,并且向所述追加主裝置返回所述優(yōu)先順序信息的構(gòu)造完成響應,以及當已經(jīng)接收到所述構(gòu)造完成響應和所述追加完成響應時,所述追加主裝置將所述新的存儲裝置的追加完成響應返回給所述管理控制臺,由此完成所述新的存儲裝置的追加處理。
8.一種數(shù)據(jù)處理方法,其被應用到存儲集群系統(tǒng),所述存儲集群系統(tǒng)包括由多個存儲裝置組成的存儲集群,和通過第一通信網(wǎng)絡(luò)連接到所述存儲集群的主機裝置,每個存儲裝置的特征在于,包括多個可訪問區(qū)域,其中所述主機裝置在邏輯上可訪問的區(qū)域被劃分為該多個可訪問區(qū)域;控制器,用以訪問由所述存儲裝置在物理上管理的所述多個可訪問區(qū)域的物理可訪問區(qū)域;以及優(yōu)先順序信息,其被所述控制器參考并且定義了包括該控制器的存儲裝置到其他存儲裝置的訪問優(yōu)先順序;其中,在各自的存儲裝置中的控制器被通過第二通信網(wǎng)絡(luò)互相連接,由此每個所述存儲裝置能夠經(jīng)由所述控制器訪問所述其他存儲裝置的任何一個中的所述物理可訪問區(qū)域,當從所述主機裝置發(fā)送對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求時,該存儲裝置中的控制器根據(jù)所述優(yōu)先順序信息中定義的優(yōu)先順序,將該處理請求發(fā)送到除了該處理請求已經(jīng)發(fā)送到的存儲裝置之外的、最高優(yōu)先順序的其他存儲裝置中的處理器,當從所述主機裝置發(fā)送對于存在于所述存儲裝置的物理可訪問區(qū)域的處理請求時,該存儲裝置中的控制器進行響應于該處理請求的處理并且發(fā)送所述處理的結(jié)果到該處理請求的發(fā)送源,當所述處理結(jié)果被從所述其它存儲裝置中的控制器發(fā)送到所述存儲裝置時,該存儲裝置中的控制器發(fā)送處理結(jié)果到已經(jīng)發(fā)送了對應于所述處理結(jié)果的處理請求到所述存儲裝置的所述發(fā)送源,所述處理結(jié)果被發(fā)送到已經(jīng)從所述主機裝置接收了該處理請求的所述存儲裝置,并且這個存儲裝置將所接收的處理結(jié)果發(fā)送到所述主機裝置。
9.一種數(shù)據(jù)處理方法,其被應用到存儲集群系統(tǒng),所述存儲集群系統(tǒng)包括由多個存儲裝置組成的存儲集群,以及通過第一通信網(wǎng)絡(luò)連接到所述存儲集群的主機裝置,每個所述存儲裝置的特征在于,包括多個可訪問區(qū)域,其中所述主機裝置在邏輯上可訪問的區(qū)域被劃分為該多個可訪問區(qū)域,控制器,用以訪問由所述存儲裝置在物理上管理的所述多個可訪問區(qū)域的物理可訪問區(qū)域;以及優(yōu)先順序信息,其被所述控制器參考并且定義了包括該控制器的存儲裝置到其他存儲裝置的訪問優(yōu)先順序;其中,在各自的存儲裝置中的控制器被通過第二通信網(wǎng)絡(luò)互相連接,由此每個所述存儲裝置能夠經(jīng)由所述控制器訪問所述其他存儲裝置的任何一個中的所述物理可訪問區(qū)域,已接收到來自所述主機裝置的對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求的所述存儲裝置,從該處理請求中獲取對應于該處理請求的特有命令,將包括該存儲裝置的標識符和所述主機裝置的標識符的比特映射數(shù)據(jù)引入到命令代碼中,在該比特映射數(shù)據(jù)中與所述存儲裝置的標識符相對應的比特位置上設(shè)置比特,并且根據(jù)所述優(yōu)先順序信息,將所述命令代碼發(fā)送給除了所述處理請求已經(jīng)被發(fā)送到的存儲裝置之外的最高優(yōu)先順序的所述其他存儲裝置的任何一個;在以下情況下,即,在所述命令代碼被從所述多個存儲裝置中的任何一個發(fā)送到的所述存儲裝置中,與所述命令代碼對應的處理請求是對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求,則所述存儲裝置在與包含在所述命令代碼中的比特映射數(shù)據(jù)中的標識符對應的比特位置上設(shè)置比特,并且根據(jù)所述優(yōu)先順序信息,將所述命令代碼發(fā)送到除了所述處理請求已經(jīng)被發(fā)送到的存儲裝置之外的、最高優(yōu)先順序的存儲裝置,在對應于所述發(fā)送的命令代碼的處理請求是對于存在于所述存儲裝置中的物理可訪問區(qū)域的處理請求的情況下以及所述比特映射數(shù)據(jù)未被包含在所述發(fā)送的命令代碼中的情況下,這個存儲裝置響應于對應所述命令代碼的處理請求進行處理,并且將所述處理的結(jié)果發(fā)送到所述主機裝置,在所述比特映射數(shù)據(jù)被包含在所述發(fā)送的命令代碼中并且在所述比特位置的任何一個上設(shè)置比特的情況下,這個存儲裝置響應于對應所述命令代碼的處理請求進行處理,并且將所述處理的結(jié)果發(fā)送到具有與設(shè)置所述比特的比特位置對應的標識符的存儲裝置,在所述比特映射數(shù)據(jù)被包含在所述發(fā)送的命令代碼中并且在多個比特位置上設(shè)置所述比特的情況下,這個存儲裝置響應于對應所述命令代碼的處理請求進行處理,產(chǎn)生對于已從所述主機裝置直接接收了所述處理請求的存儲裝置的響應,并且將所述生成的響應發(fā)送到已經(jīng)經(jīng)由具有與設(shè)置所述比特的所述比特位置對應的標識符的存儲裝置從所述主機裝置接收了所述處理請求的存儲裝置,所述響應被發(fā)送到的存儲裝置請求已經(jīng)生成了所述響應的存儲裝置發(fā)送所述處理結(jié)果,所述被請求的存儲裝置發(fā)送所述處理結(jié)果到請求源的存儲裝置,使得在所述存儲裝置的任意一個獲得的處理結(jié)果被發(fā)送到已經(jīng)直接從所述主機裝置接收了所述處理請求的存儲裝置,并且已經(jīng)直接從所述主機裝置接收到所述處理請求的存儲裝置發(fā)送所述處理結(jié)果到該主機裝置。
10.根據(jù)權(quán)利要求8或9的數(shù)據(jù)處理方法,其特征在于,在根據(jù)所述優(yōu)先順序信息中定義的優(yōu)先順序?qū)⑺鎏幚碚埱蟀l(fā)送到其他存儲裝置的控制器的情況下以及在目的地的控制器不接收該處理請求的情況下以及從所述控制器返回錯誤響應的情況下或者在所述控制器在預定時間經(jīng)過沒有給出響應的情況下,所述處理請求被發(fā)送到除了該處理請求已經(jīng)被發(fā)送到的存儲裝置之外的下一個最高優(yōu)先順序的存儲裝置中的控制器。
11.根據(jù)權(quán)利要求8或9的數(shù)據(jù)處理方法,其特征在于,所述主機裝置已經(jīng)訪問的所述多個存儲裝置中的存儲裝置通知所述主機裝置在每個所述存儲裝置中保持的物理可訪問區(qū)域的信息,以及所述主機裝置基于從所述通知的信息和所述處理請求的內(nèi)容,切換所述處理請求將被發(fā)送到的存儲裝置。
12.根據(jù)權(quán)利要求8或9的數(shù)據(jù)處理方法,其特征在于,所述存儲集群的每個存儲裝置包括數(shù)據(jù)表、主機識別號和物理可訪問區(qū)域識別號,所述數(shù)據(jù)表管理邏輯卷的容量信息的組合,其中所述邏輯卷由在每個存儲裝置中包含的所述多個可訪問區(qū)域中的一個或者兩個或更多個的組合所構(gòu)成并且能被所述主機裝置識別,所述主機識別號用以指定被允許訪問所述邏輯卷的主機裝置,以及所述物理可訪問區(qū)域識別號用以指定所述主機裝置訪問的物理可訪問區(qū)域,僅在其中存在所述物理可訪問區(qū)域的存儲裝置保持了在物理可訪問區(qū)域和邏輯可訪問區(qū)域之間的對應關(guān)系,并且所述主機裝置能夠在構(gòu)成所述邏輯卷的可訪問區(qū)域之中識別該邏輯可訪問區(qū)域,以及所述主機裝置已經(jīng)訪問的存儲裝置,響應于從該主機裝置發(fā)送的處理請求中除了包括寫和讀命令的介質(zhì)訪問命令以外的處理請求,發(fā)送處理結(jié)果到所述主機裝置。
13.根據(jù)權(quán)利要求8或9的數(shù)據(jù)處理方法,其特征在于,所述存儲集群系統(tǒng)進一步包括管理所述存儲集群的管理控制臺,所述管理控制臺發(fā)送所述存儲裝置的信息和所述存儲集群的構(gòu)造請求到任意一個存儲裝置,并且目的地的存儲裝置被定義為構(gòu)造主裝置,其起到所述存儲集群的構(gòu)造處理的主裝置的作用,所述構(gòu)造主裝置向與從所述管理控制臺發(fā)送的信息相對應的每個存儲裝置發(fā)送測試消息,每個已經(jīng)接收了所述測試消息的存儲裝置將對該測試消息的響應返回到所述構(gòu)造主裝置,所述構(gòu)造主裝置基于從所述存儲裝置返回的響應,測量存儲裝置對所述測試消息的響應時間,從所述響應時間短的方面考慮存儲裝置的優(yōu)先順序以從而生成優(yōu)先順序信息,并且將包含在所述存儲集群中的存儲裝置的列表發(fā)送到每個存儲裝置,除了所述構(gòu)造主裝置,所述存儲裝置的每一個依據(jù)所述發(fā)送的列表傳送測試消息給該存儲裝置之外的存儲裝置;已經(jīng)接收到所述測試消息的每個存儲裝置返回對該測試消息的響應給傳送源的存儲裝置,除了所述構(gòu)造主裝置之外的存儲裝置基于所述返回的響應,測量所述存儲裝置對所述測試消息的響應時間,從響應時間短的方面考慮存儲裝置的優(yōu)先順序,以由此生成優(yōu)先順序信息,向所述構(gòu)造主裝置返回該優(yōu)先順序信息的構(gòu)造完成響應,以及當已經(jīng)接收到所述構(gòu)造完成響應時,所述構(gòu)造主裝置返回所述優(yōu)先順序信息的構(gòu)造完成響應到所述管理控制臺,以進行所述存儲集群的構(gòu)造處理。
14.根據(jù)權(quán)利要求8或9的數(shù)據(jù)處理方法,其特征在于,所述存儲集群系統(tǒng)進一步包括管理控制臺,其進行追加新的存儲裝置到正在工作的存儲集群的追加處理,所述管理控制臺發(fā)送追加所述新的存儲裝置的請求和該新的存儲裝置的信息到任意一個存儲裝置,并且發(fā)送的目的地的存儲裝置被定義為追加主裝置,其起到所述存儲裝置的追加處理的主裝置的作用,所述追加主裝置發(fā)送測試消息給所述信息已經(jīng)被從所述管理控制臺發(fā)送到的所述新的存儲裝置,確認由該新的存儲裝置發(fā)送的對所述傳送的測試消息的響應,將該新的存儲裝置的訪問優(yōu)先順序作為最低的優(yōu)先順序追加到所述優(yōu)先順序信息中,并且發(fā)送關(guān)于該新的存儲裝置的追加的消息到所述存儲集群以及發(fā)送該新的存儲裝置的信息給已經(jīng)在所述優(yōu)先順序信息中定義了訪問優(yōu)先順序的存儲裝置,除了所述追加主裝置和所述新的存儲裝置之外的存儲裝置在該存儲裝置的優(yōu)先順序信息的最低位置加入所述新的存儲裝置,并且返回追加完成響應到所述追加主裝置;所述追加主裝置將所述存儲集群中包含的存儲裝置的列表發(fā)送到所述新的存儲裝置,所述新的存儲裝置依據(jù)所述列表將測試消息發(fā)送到除了該存儲裝置之外的存儲裝置;已經(jīng)接收了所述測試消息的存儲裝置返回對該測試消息的響應到所述新的存儲裝置,所述新的存儲裝置基于所述返回的響應,測量所述存儲裝置對所述測試消息的響應時間,并且從響應時間短的方面考慮存儲裝置的優(yōu)先順序以由此生成優(yōu)先順序信息,并且向所述追加主裝置返回所述優(yōu)先順序信息的構(gòu)造完成響應,以及當已經(jīng)接收到所述構(gòu)造完成響應和所述追加完成響應時,所述追加主裝置將所述新的存儲裝置的追加完成響應返回給所述管理控制臺,由此完成所述新的存儲裝置的追加處理。
15.一種程序,其被應用到存儲集群系統(tǒng),所述存儲集群系統(tǒng)包括由多個存儲裝置組成的存儲集群,和通過第一通信網(wǎng)絡(luò)連接到所述存儲集群的主機裝置,每個存儲裝置的特征在于,包括多個可訪問區(qū)域,其中所述主機裝置在邏輯上可訪問的區(qū)域被劃分為該多個可訪問區(qū)域,控制器,用以訪問由所述存儲裝置在物理上管理的所述多個可訪問區(qū)域的物理可訪問區(qū)域,以及優(yōu)先順序信息,其被所述控制器參考并且定義了包括該控制器的存儲裝置到其他存儲裝置的訪問優(yōu)先順序,在各自的存儲裝置中的控制器被通過第二通信網(wǎng)絡(luò)互相連接,所述程序使得計算機實現(xiàn)這樣的功能,每個所述存儲裝置能夠經(jīng)由所述控制器訪問所述其他存儲裝置的任何一個中的所述物理可訪問區(qū)域,這樣的功能,當從所述主機裝置發(fā)送對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求時,該存儲裝置中的控制器根據(jù)所述優(yōu)先順序信息中定義的優(yōu)先順序,將該處理請求發(fā)送到除了該處理請求已經(jīng)發(fā)送到的存儲裝置之外的、最高優(yōu)先順序的其他存儲裝置中的處理器,這樣的功能,當從所述主機裝置發(fā)送對于存在于所述存儲裝置的物理可訪問區(qū)域的處理請求時,該存儲裝置中的控制器進行響應于該處理請求的處理并且發(fā)送所述處理的結(jié)果到該處理請求的發(fā)送源,這樣的功能,當所述處理結(jié)果被從所述其它存儲裝置中的控制器發(fā)送到所述存儲裝置時,該存儲裝置中的控制器發(fā)送處理結(jié)果到已經(jīng)發(fā)送了對應于所述處理結(jié)果的處理請求到所述存儲裝置的所述發(fā)送源,所述處理結(jié)果被發(fā)送到已經(jīng)從所述主機裝置接收了該處理請求的所述存儲裝置,以及這樣的功能,已經(jīng)接收到此處理結(jié)果的存儲裝置將此處理結(jié)果發(fā)送到所述主機裝置。
16.一種程序,其被應用到存儲集群系統(tǒng),所述存儲集群系統(tǒng)包括由多個存儲裝置組成的存儲集群,和通過第一通信網(wǎng)絡(luò)連接到所述存儲集群的主機裝置,每個所述存儲裝置包括多個可訪問區(qū)域,其中所述主機裝置在邏輯上可訪問的區(qū)域被劃分為該多個可訪問區(qū)域,控制器,用以訪問由所述存儲裝置在物理上管理的所述多個可訪問區(qū)域的物理可訪問區(qū)域,以及優(yōu)先順序信息,其被所述控制器參考并且定義了包括該控制器的存儲裝置到其他存儲裝置的訪問優(yōu)先順序,在各自的存儲裝置中的控制器被通過第二通信網(wǎng)絡(luò)互相連接,所述程序使得計算機實現(xiàn)這樣的功能,每個所述存儲裝置能夠經(jīng)由所述控制器訪問所述其他存儲裝置的任何一個中的所述物理可訪問區(qū)域,這樣的功能,已接收到來自所述主機裝置的對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求的所述存儲裝置,從該處理請求中獲取對應于該處理請求的特有命令,將包括該存儲裝置的標識符和所述主機裝置的標識符的比特映射數(shù)據(jù)引入到命令代碼中,在該比特映射數(shù)據(jù)中與所述存儲裝置的標識符相對應的比特位置上設(shè)置比特,并且根據(jù)所述優(yōu)先順序信息,將所述命令代碼發(fā)送給除了所述處理請求已經(jīng)被發(fā)送到的存儲裝置之外的最高優(yōu)先順序的所述其他存儲裝置的任何一個;這樣的功能,在以下情況下,即,在所述命令代碼被從所述多個存儲裝置中的任何一個發(fā)送到的所述存儲裝置中,與所述命令代碼對應的處理請求是對于不在所述存儲裝置中的物理可訪問區(qū)域的處理請求,則所述存儲裝置在與包含在所述命令代碼中的比特映射數(shù)據(jù)中的標識符對應的比特位置上設(shè)置比特,并且根據(jù)所述優(yōu)先順序信息,將所述命令代碼發(fā)送到除了所述處理請求已經(jīng)被發(fā)送到的存儲裝置之外的、最高優(yōu)先順序的存儲裝置,這樣的功能,在對應于所述發(fā)送的命令代碼的處理請求是對于存在于所述存儲裝置中的物理可訪問區(qū)域的處理請求的情況下以及在所述比特映射數(shù)據(jù)未被包含在所述發(fā)送的命令代碼中的情況下,這個存儲裝置響應于對應所述命令代碼的處理請求進行處理,并且將所述處理的結(jié)果發(fā)送到所述主機裝置,這樣的功能,在對應于所述發(fā)送的命令代碼的處理請求是對于存在于所述存儲裝置中的物理可訪問區(qū)域的處理請求的情況下以及在所述比特映射數(shù)據(jù)被包含在所述發(fā)送的命令代碼中并且在所述比特位置的任何一個上設(shè)置比特的情況下,這個存儲裝置響應于對應所述命令代碼的處理請求進行處理,并且將所述處理的結(jié)果發(fā)送到具有與設(shè)置所述比特的比特位置對應的標識符的存儲裝置,這樣的功能,在對應于所述發(fā)送的命令代碼的處理請求是對于存在于所述存儲裝置中的物理可訪問區(qū)域的處理請求的情況下以及在所述比特映射數(shù)據(jù)被包含在所述發(fā)送的命令代碼中并且在多個比特位置上設(shè)置所述比特的情況下,這個存儲裝置響應于對應所述命令代碼的處理請求進行處理,產(chǎn)生對于已從所述主機裝置直接接收了所述處理請求的存儲裝置的響應,并且將所述生成的響應發(fā)送到已經(jīng)經(jīng)由具有與設(shè)置所述比特的所述比特位置對應的標識符的存儲裝置從所述主機裝置接收了所述處理請求的存儲裝置,這樣的功能,所述響應被發(fā)送到的存儲裝置請求已經(jīng)生成了所述響應的存儲裝置發(fā)送所述處理結(jié)果,這樣的功能,所述被請求的存儲裝置發(fā)送所述處理結(jié)果到請求源的存儲裝置,使得在所述存儲裝置的任意一個獲得的處理結(jié)果被發(fā)送到已經(jīng)直接從所述主機裝置接收了所述處理請求的存儲裝置,并且這樣的功能,已經(jīng)直接從所述主機裝置接收到所述處理請求的存儲裝置發(fā)送所述處理結(jié)果到該主機裝置。
17.根據(jù)權(quán)利要求15或16的程序,其使得計算機進一步實現(xiàn)這樣的功能,在根據(jù)所述優(yōu)先順序信息中定義的優(yōu)先順序?qū)⑺鎏幚碚埱蟀l(fā)送到其他存儲裝置的控制器的情況下以及在目的地的控制器不接收該處理請求的情況下以及從所述控制器返回錯誤響應的情況下或者在所述控制器在預定時間經(jīng)過沒有給出響應的情況下,所述處理請求被發(fā)送到除了該處理請求已經(jīng)被發(fā)送到的存儲裝置之外的下一個最高優(yōu)先順序的存儲裝置中的控制器。
18.根據(jù)權(quán)利要求15或16的程序,其使得計算機進一步實現(xiàn)這樣的功能,所述主機裝置已經(jīng)訪問的所述多個存儲裝置中的存儲裝置通知所述主機裝置在每個所述存儲裝置中保持的物理可訪問區(qū)域的信息,以及這樣的功能,所述主機裝置基于從所述通知的信息和所述處理請求的內(nèi)容,切換所述處理請求將被發(fā)送到的存儲裝置。
19.根據(jù)權(quán)利要求15或16的程序,其特征在于,所述存儲集群的每個存儲裝置包括數(shù)據(jù)表、主機識別號和物理可訪問區(qū)域識別號,所述數(shù)據(jù)表管理邏輯卷的容量信息的組合,其中所述邏輯卷由在每個存儲裝置中包含的所述多個可訪問區(qū)域中的一個或者兩個或更多個的組合所構(gòu)成并且能被所述主機裝置識別,所述主機識別號用以指定被允許訪問所述邏輯卷的主機裝置,以及所述物理可訪問區(qū)域識別號用以指定所述主機裝置訪問的物理可訪問區(qū)域,以及僅在其中存在所述物理可訪問區(qū)域的存儲裝置保持了在物理可訪問區(qū)域和邏輯可訪問區(qū)域之間的對應關(guān)系,并且所述主機裝置能夠在構(gòu)成所述邏輯卷的可訪問區(qū)域之中識別該邏輯可訪問區(qū)域,所述程序使得計算機進一步實現(xiàn)這樣的功能,所述主機裝置已經(jīng)訪問的存儲裝置,響應于從該主機裝置發(fā)送的處理請求中除了包括寫和讀命令的介質(zhì)訪問命令以外的處理請求,發(fā)送處理結(jié)果到所述主機裝置。
20.根據(jù)權(quán)利要求15或16的程序,其特征在于,所述存儲集群系統(tǒng)進一步包括管理所述存儲集群的管理控制臺,所述程序使得計算機進一步實現(xiàn)這樣的功能,所述管理控制臺發(fā)送所述存儲裝置的信息和所述存儲集群的構(gòu)造請求到任意一個存儲裝置,并且目的地的存儲裝置被定義為構(gòu)造主裝置,其起到所述存儲集群的構(gòu)造處理的主裝置的作用,這樣的功能,所述構(gòu)造主裝置向與從所述管理控制臺發(fā)送的信息相對應的每個存儲裝置發(fā)送測試消息,這樣的功能,每個已經(jīng)接收了所述測試消息的存儲裝置將對該測試消息的響應返回到所述構(gòu)造主裝置,這樣的功能,所述構(gòu)造主裝置基于從所述存儲裝置返回的響應,測量存儲裝置對所述測試消息的響應時間,從所述響應時間短的方面考慮存儲裝置的優(yōu)先順序以從而生成優(yōu)先順序信息,并且將包含在所述存儲集群中的存儲裝置的列表發(fā)送到每個存儲裝置,這樣的功能,除了所述構(gòu)造主裝置,所述存儲裝置的每一個依據(jù)所述發(fā)送的列表傳送測試消息給該存儲裝置之外的存儲裝置;這樣的功能,已經(jīng)接收到所述測試消息的每個存儲裝置返回對該測試消息的響應給傳送源的存儲裝置,這樣的功能,除了所述構(gòu)造主裝置之外的存儲裝置基于所述返回的響應,測量所述存儲裝置對所述測試消息的響應時間,從響應時間短的方面考慮存儲裝置的優(yōu)先順序,以由此生成優(yōu)先順序信息,向所述構(gòu)造主裝置返回該優(yōu)先順序信息的構(gòu)造完成響應,以及這樣的功能,當已經(jīng)接收到所述構(gòu)造完成響應時,所述構(gòu)造主裝置返回所述優(yōu)先順序信息的構(gòu)造完成響應到所述管理控制臺,以進行所述存儲集群的構(gòu)造處理。
21.根據(jù)權(quán)利要求15或16的程序,其特征在于,所述存儲集群系統(tǒng)進一步包括管理控制臺,其進行追加新的存儲裝置到正在工作的存儲集群的追加處理,所述程序使得計算機進一步實現(xiàn)這樣的功能,所述管理控制臺發(fā)送追加所述新的存儲裝置的請求和該新的存儲裝置的信息到任意一個存儲裝置,并且發(fā)送的目的地的存儲裝置被定義為追加主裝置,其起到所述存儲裝置的追加處理的主裝置的作用,這樣的功能,所述追加主裝置發(fā)送測試消息給所述信息已經(jīng)被從所述管理控制臺發(fā)送到的所述新的存儲裝置,確認由該新的存儲裝置發(fā)送的對所述傳送的測試消息的響應,將該新的存儲裝置的訪問優(yōu)先順序作為最低的優(yōu)先順序追加到所述優(yōu)先順序信息中,并且發(fā)送關(guān)于該新的存儲裝置的追加的消息到所述存儲集群以及發(fā)送該新的存儲裝置的信息給已經(jīng)在所述優(yōu)先順序信息中定義了訪問優(yōu)先順序的存儲裝置,這樣的功能,除了所述追加主裝置和所述新的存儲裝置之外的存儲裝置在該存儲裝置的優(yōu)先順序信息的最低位置加入所述新的存儲裝置,并且返回追加完成響應到所述追加主裝置;這樣的功能,所述追加主裝置將所述存儲集群中包含的存儲裝置的列表發(fā)送到所述新的存儲裝置,這樣的功能,所述新的存儲裝置依據(jù)所述列表將測試消息發(fā)送到除了該存儲裝置之外的存儲裝置;這樣的功能,已經(jīng)接收了所述測試消息的存儲裝置返回對該測試消息的響應到所述新的存儲裝置,這樣的功能,所述新的存儲裝置基于所述返回的響應,測量所述存儲裝置對所述測試消息的響應時間,并且從響應時間短的方面考慮存儲裝置的優(yōu)先順序以由此生成優(yōu)先順序信息,并且向所述追加主裝置返回所述優(yōu)先順序信息的構(gòu)造完成響應,以及這樣的功能,當已經(jīng)接收到所述構(gòu)造完成響應和所述追加完成響應時,所述追加主裝置將所述新的存儲裝置的追加完成響應返回給所述管理控制臺,由此完成所述新的存儲裝置的追加處理。
全文摘要
公開的是一種存儲集群系統(tǒng),其包括由多個存儲裝置(12)組成的存儲集群,以及通過第一通信網(wǎng)絡(luò)(11)連接到所述存儲集群的主機裝置(18),并且每個存儲裝置(12(#A,#B,#C))包括多個可訪問區(qū)域,其中主機裝置(18)在邏輯上可訪問的區(qū)域被劃分為該多個可訪問區(qū)域,控制器(14),用以訪問由存儲裝置(12)在物理上管理的所述多個可訪問區(qū)域的物理可訪問區(qū)域,以及優(yōu)先順序信息,其被控制器(14)參考并且定義了包括控制器(14)的存儲裝置(12)到其他存儲裝置(12)的訪問優(yōu)先順序。
文檔編號H04L29/06GK101064656SQ20071012662
公開日2007年10月31日 申請日期2007年3月30日 優(yōu)先權(quán)日2006年3月30日
發(fā)明者友永和聰 申請人:株式會社東芝, 東芝解決方案株式會社