亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于在高電源效率的大容量可擴(kuò)展存儲(chǔ)系統(tǒng)中存取輔助數(shù)據(jù)的方法和系統(tǒng)的制作方法

文檔序號(hào):6570251閱讀:349來(lái)源:國(guó)知局
專利名稱:用于在高電源效率的大容量可擴(kuò)展存儲(chǔ)系統(tǒng)中存取輔助數(shù)據(jù)的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明主要涉及數(shù)據(jù)存儲(chǔ)系統(tǒng),尤其涉及的是在高電源效率的 大容量數(shù)據(jù)存儲(chǔ)系統(tǒng)中存取輔助數(shù)據(jù)。
背景技術(shù)
用于計(jì)算應(yīng)用的數(shù)據(jù)存儲(chǔ)系統(tǒng)包含了諸如硬盤(pán)驅(qū)動(dòng)器、軟盤(pán)驅(qū) 動(dòng)器、磁帶驅(qū)動(dòng)器和緊湊型碟盤(pán)之類的存儲(chǔ)設(shè)備。隨著這些應(yīng)用數(shù) 量和復(fù)雜度的提升,對(duì)更大存儲(chǔ)容量的需要也在成比例增長(zhǎng)。由 此,大容量存儲(chǔ)設(shè)備的生產(chǎn)也在增長(zhǎng)。但是,大存儲(chǔ)容量需要用到 具有高數(shù)據(jù)傳輸速率的可靠存儲(chǔ)設(shè)備。此外,單個(gè)存儲(chǔ)設(shè)備的存儲(chǔ) 容量無(wú)法超出一定限度而增長(zhǎng)。因此,為了滿足日益增長(zhǎng)的存儲(chǔ)容 量提升需要,通常會(huì)使用各種應(yīng)用了多個(gè)存儲(chǔ)設(shè)備的數(shù)據(jù)存儲(chǔ)系統(tǒng) 配置和拓?fù)浼夹g(shù)。
為了滿足不斷增長(zhǎng)的需求,數(shù)據(jù)存儲(chǔ)系統(tǒng)配置包括使用多個(gè)磁 盤(pán)驅(qū)動(dòng)器。該配置允許提供存儲(chǔ)數(shù)據(jù)冗余度。如果設(shè)備發(fā)生故障, 那么該冗余度將會(huì)確保數(shù)據(jù)完整性。在很多此類數(shù)據(jù)存儲(chǔ)系統(tǒng)中, 在數(shù)據(jù)存儲(chǔ)系統(tǒng)內(nèi)部可以借助中央處理器以及使用奇偶性之類的數(shù) 據(jù)冗余度及其生成處理來(lái)自動(dòng)恢復(fù)一般故障。這其中的一種數(shù)據(jù)存 儲(chǔ)系統(tǒng)通常被稱為大規(guī)模非活動(dòng)/獨(dú)立磁盤(pán)陣列(MAID)。
但是,MAID存儲(chǔ)系統(tǒng)存在某些增加了系統(tǒng)數(shù)據(jù)存取時(shí)間的固 有缺陷。在MAID系統(tǒng)中,只有在需要存儲(chǔ)設(shè)備時(shí)才為其通電。由
于在某個(gè)時(shí)間只有一部分磁盤(pán)驅(qū)動(dòng)器通電,因此,要想存取當(dāng)前斷 電的磁盤(pán)驅(qū)動(dòng)器將會(huì)耗費(fèi)時(shí)間。這是因?yàn)閿嚯姷拇疟P(pán)驅(qū)動(dòng)器需要通 電,而這將會(huì)增加針對(duì)這些磁盤(pán)驅(qū)動(dòng)器的首次讀/寫(xiě)請(qǐng)求的數(shù)據(jù)存取 時(shí)間。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)實(shí)施例,在這里提供了一種用于在數(shù)據(jù)存儲(chǔ) 系統(tǒng)中預(yù)備用于存取的數(shù)據(jù)單元的方法。該數(shù)據(jù)存儲(chǔ)系統(tǒng)包括多個(gè) 數(shù)據(jù)存儲(chǔ)設(shè)備,由此在同一時(shí)間并非所有存儲(chǔ)設(shè)備都被通電。該方
法包括為在對(duì)數(shù)據(jù)單元執(zhí)行存取請(qǐng)求的過(guò)程中將被斷電的存儲(chǔ)設(shè) 備上的數(shù)據(jù)單元預(yù)備輔助數(shù)據(jù),并且將輔助數(shù)據(jù)存儲(chǔ)在多個(gè)存儲(chǔ)設(shè) 備上,由此在數(shù)據(jù)單元是存取請(qǐng)求的對(duì)象時(shí),該輔助數(shù)據(jù)在通電存 儲(chǔ)設(shè)備上始終可用。這種以始終可用以及可存取的方式給出的輔助
數(shù)據(jù)也被稱為釘扣數(shù)據(jù)(pinned data)。
在本發(fā)明的另一個(gè)實(shí)施例中,其中提供了一種數(shù)據(jù)存儲(chǔ)系統(tǒng)。 該數(shù)據(jù)存儲(chǔ)系統(tǒng)包括多個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備以及存儲(chǔ)管理單元。所述多 個(gè)數(shù)據(jù)存儲(chǔ)設(shè)備包括數(shù)據(jù)單元,并且在同一時(shí)間并非所有數(shù)據(jù)存儲(chǔ) 設(shè)備都被通電。對(duì)在數(shù)據(jù)單元存取請(qǐng)求期間將要斷電的存儲(chǔ)設(shè)備來(lái) 說(shuō),存儲(chǔ)管理單元會(huì)為該存儲(chǔ)設(shè)備上的數(shù)據(jù)單元預(yù)備輔助數(shù)據(jù)。此 外,存儲(chǔ)管理單元還在多個(gè)存儲(chǔ)設(shè)備上存儲(chǔ)這些輔助數(shù)據(jù),由此在 數(shù)據(jù)單元是存取請(qǐng)求的對(duì)象時(shí),這些輔助數(shù)據(jù)在通電的存儲(chǔ)設(shè)備上 始終可用。


在下文中將會(huì)結(jié)合附圖來(lái)對(duì)本發(fā)明的不同實(shí)施例進(jìn)行描述,這 些實(shí)施例是為了描述而不是為了限制本發(fā)明給出的,其中相同標(biāo)志
表示的是相同的部件,其中
圖1是描述依照一個(gè)實(shí)施例的多磁盤(pán)數(shù)據(jù)存儲(chǔ)系統(tǒng)的通用結(jié)構(gòu) 的圖示。
圖2A和2B是描述在依照一個(gè)實(shí)施例的密集數(shù)據(jù)存儲(chǔ)系統(tǒng)中的 控制器與磁盤(pán)驅(qū)動(dòng)器之間互連的圖示。
圖3是描述依照一個(gè)實(shí)施例的密集數(shù)據(jù)存儲(chǔ)系統(tǒng)的物理配置的 圖示。
圖4是描述依照一個(gè)實(shí)施例的用于確定密集數(shù)據(jù)存儲(chǔ)系統(tǒng)的電 源管理方案的方式的流程圖。
圖5是描述根據(jù)一個(gè)實(shí)施例的用于將信息寫(xiě)入奇偶磁盤(pán)的方式 以及用于為磁盤(pán)驅(qū)動(dòng)器通電和斷電的方式的圖示。
圖6是描述根據(jù)一個(gè)實(shí)施例的元數(shù)據(jù)磁盤(pán)內(nèi)容的圖示。 圖7是描述根據(jù)一個(gè)實(shí)施例的存儲(chǔ)在元數(shù)據(jù)磁盤(pán)上的信息結(jié)構(gòu) 的圖示。
圖8是描述根據(jù)一個(gè)實(shí)施例的用于在一組磁盤(pán)驅(qū)動(dòng)器上排列數(shù) 據(jù)容器的方式的圖示。
圖9是描述根據(jù)一個(gè)實(shí)施例的用于在元數(shù)據(jù)巻上存儲(chǔ)來(lái)自多個(gè) 磁盤(pán)驅(qū)動(dòng)器的初始分段的方式的圖示。
圖10是描述根據(jù)一個(gè)實(shí)施例的冗余磁盤(pán)驅(qū)動(dòng)器配對(duì)、相應(yīng)奇偶 性以及元數(shù)據(jù)巻的應(yīng)用的圖示。
圖11是描述根據(jù)一個(gè)實(shí)施例并且借助直接連接而使用數(shù)據(jù)存儲(chǔ) 系統(tǒng)作為主存儲(chǔ)備份目標(biāo)以及作為磁帶庫(kù)的媒體(備份)服務(wù)器的 圖示。
圖12是描述根據(jù)一個(gè)實(shí)施例而從主機(jī)(服務(wù)或終端服務(wù)器)互 連到終端磁盤(pán)驅(qū)動(dòng)器的圖示。
圖13是描述根據(jù)一個(gè)實(shí)施例將通道控制器與多個(gè)集束控制器 (stick controller)互連的圖示。
圖14是描述根據(jù)一個(gè)實(shí)施例而將SATA通道控制器的輸出與相 應(yīng)集束控制器數(shù)據(jù)/命令路由器設(shè)備互連的圖示。
圖15是描述根據(jù)一個(gè)實(shí)施例來(lái)實(shí)施機(jī)架控制器(rack controller)的圖示。
圖16是描述根據(jù)本發(fā)明一個(gè)實(shí)施例的主機(jī)與數(shù)據(jù)存儲(chǔ)系統(tǒng)的交 互的圖示。
圖17是描述根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)存儲(chǔ)系統(tǒng)的圖示。 圖18是描述根據(jù)本發(fā)明一個(gè)實(shí)施例來(lái)預(yù)備用于數(shù)據(jù)存儲(chǔ)系統(tǒng)存 取的數(shù)據(jù)單元的方法的流程圖。
圖19是描述根據(jù)本發(fā)明另一個(gè)實(shí)施例來(lái)預(yù)備用于數(shù)據(jù)單元的輔 助數(shù)據(jù)的方法的流程圖。
圖20是描述根據(jù)本發(fā)明一個(gè)實(shí)施例來(lái)配置數(shù)據(jù)存儲(chǔ)系統(tǒng)的方法 的流程圖。
圖21是描述根據(jù)本發(fā)明一個(gè)實(shí)施例的控制器組件的圖示。 圖22是描述根據(jù)本發(fā)明一個(gè)實(shí)施例來(lái)重新配置數(shù)據(jù)存儲(chǔ)系統(tǒng)的 方法的流程圖。
圖23是描述根據(jù)本發(fā)明一個(gè)實(shí)施例而在一組存儲(chǔ)設(shè)備上保持輔 助數(shù)據(jù)的方法的流程圖。
雖然本發(fā)明具有不同的修改和變更形式,但附圖以及附帶的詳 細(xì)描述中是舉例顯示本發(fā)明的具體實(shí)施例的。盡管如此,應(yīng)該理解 的是,這些附圖和詳細(xì)描述的目的并不是將本發(fā)明局限于所描述的 特定實(shí)施例。取而代之的是,本公開(kāi)旨在覆蓋所有那些落入附加權(quán) 利要求限定的發(fā)明范圍以內(nèi)的修改、等價(jià)物以及變更形式。
具體實(shí)施例方式
在下文中將對(duì)本發(fā)明的一個(gè)或多個(gè)實(shí)施例進(jìn)行描述。應(yīng)該指出 的是,下文描述的這些和其他實(shí)施例是例示性的,其目的是對(duì)本發(fā) 明進(jìn)行例證,而不是對(duì)其進(jìn)行限制。
正如這里描述的那樣,本發(fā)明的不同實(shí)施例包含了用于提供高 電源效率的可擴(kuò)展和可靠的大容量數(shù)據(jù)存儲(chǔ)的系統(tǒng)和方法,其中具 有相應(yīng)數(shù)據(jù)存儲(chǔ)驅(qū)動(dòng)器的大量密集數(shù)據(jù)驅(qū)動(dòng)器是根據(jù)其使用需求而 被單獨(dú)通電和斷電的。
在一個(gè)實(shí)施例中,本發(fā)明是在RAID類型的數(shù)據(jù)存儲(chǔ)系統(tǒng)中實(shí) 施的。該系統(tǒng)使用了大量硬盤(pán)驅(qū)動(dòng)器。在將數(shù)據(jù)寫(xiě)入系統(tǒng)時(shí),數(shù)據(jù) 將被寫(xiě)入一個(gè)或多個(gè)磁盤(pán)驅(qū)動(dòng)器。元數(shù)據(jù)和與元數(shù)據(jù)相對(duì)應(yīng)的奇偶 性信息同樣被寫(xiě)入一個(gè)或多個(gè)磁盤(pán)驅(qū)動(dòng)器,從而降低數(shù)據(jù)丟失或損 壞的可能性。除了元數(shù)據(jù)和奇偶性磁盤(pán)之外,將數(shù)據(jù)寫(xiě)入磁盤(pán)的方 式通常一次只涉及一個(gè)數(shù)據(jù)磁盤(pán)。同樣,數(shù)據(jù)讀取通常一次也只涉 及一個(gè)磁盤(pán)。由此,當(dāng)前未存取的數(shù)據(jù)磁盤(pán)可以斷電。這樣一來(lái),
系統(tǒng)被配置成單獨(dú)控制每個(gè)磁盤(pán)電源,由此可以為當(dāng)前存取的磁盤(pán) 子集通電,同時(shí)將未存取的磁盤(pán)子集斷電。
由于在任何指定時(shí)間,在系統(tǒng)中只有一部分磁盤(pán)驅(qū)動(dòng)器通電, 因此,系統(tǒng)功耗要小于與之相當(dāng)且在同一時(shí)間為所有磁盤(pán)驅(qū)動(dòng)器通 電的常規(guī)系統(tǒng)(也就是具有總數(shù)大致相同的類似磁盤(pán)驅(qū)動(dòng)器的系 統(tǒng))。與常規(guī)系統(tǒng)相比,由于系統(tǒng)功耗降低,因此該系統(tǒng)產(chǎn)生的熱量 較少,需要的冷卻處理也相對(duì)較少。由此,與可比擬的系統(tǒng)相比, 本系統(tǒng)可以封裝在較小外殼中。本系統(tǒng)和常規(guī)系統(tǒng)的另一個(gè)不同之 處在于常規(guī)系統(tǒng)需要具有根據(jù)系統(tǒng)使用的數(shù)據(jù)保護(hù)方案(例如 RAID等級(jí)3)而將數(shù)據(jù)路由到恰當(dāng)數(shù)據(jù)磁盤(pán)的切換器。另一方面, 在本系統(tǒng)中,大多數(shù)磁盤(pán)驅(qū)動(dòng)器在指定時(shí)間是斷電的,由此數(shù)據(jù)可 以通過(guò)簡(jiǎn)單的扇出互連來(lái)進(jìn)行分發(fā),與常規(guī)系統(tǒng)中使用的切換器相 比,這種處理消耗的電力相對(duì)較少,并且在系統(tǒng)機(jī)殼內(nèi)部占據(jù)較小 體積。本系統(tǒng)和常規(guī)系統(tǒng)的另一個(gè)不同之處在于如果給出了單個(gè)
磁盤(pán)驅(qū)動(dòng)器的某種可靠性(例如平均故障時(shí)間或MTTF),那么本系
統(tǒng)可以被設(shè)計(jì)成滿足特定的可靠性等級(jí)(例如平均無(wú)故障時(shí)間
MTBF),這一點(diǎn)與常規(guī)系統(tǒng)相反,對(duì)常規(guī)系統(tǒng)來(lái)說(shuō),它主要受系統(tǒng) 中磁盤(pán)驅(qū)動(dòng)器數(shù)量以及單個(gè)磁盤(pán)驅(qū)動(dòng)器的可靠性的限制。
本發(fā)明的不同實(shí)施例可以在上述四個(gè)領(lǐng)域中提供超越常規(guī)系統(tǒng) 的優(yōu)勢(shì),即電源管理;數(shù)據(jù)保護(hù);物理封裝以及存儲(chǔ)事務(wù)性能。在 下文中將會(huì)參考不同的影響方面來(lái)描述這些優(yōu)點(diǎn)。
電源管理
在電源管理方面,通過(guò)對(duì)驅(qū)動(dòng)器執(zhí)行優(yōu)化的電源循環(huán),本發(fā)明 的實(shí)施例不但可以降低功耗,而且還可以提高系統(tǒng)可靠性。換句話 說(shuō),在任何時(shí)間,在所有驅(qū)動(dòng)器中只有一個(gè)子集通電。由此,整體 系統(tǒng)可靠性可以被設(shè)計(jì)成超出某個(gè)可接受閾值。
以個(gè)體為基礎(chǔ)的驅(qū)動(dòng)器電源循環(huán)是區(qū)分本實(shí)施例與常規(guī)系統(tǒng)的 一個(gè)特征。如上所述,現(xiàn)有技術(shù)中的多驅(qū)動(dòng)器系統(tǒng)不允許在系統(tǒng)操 作過(guò)程中以確定方式將單個(gè)驅(qū)動(dòng)器乃至驅(qū)動(dòng)器集合斷電,從而節(jié)約 能量。取而代之的是,這些系統(tǒng)教導(dǎo)的是抓住時(shí)機(jī)將整個(gè)系統(tǒng)斷
電。毫無(wú)疑問(wèn),在系統(tǒng)斷電期間,該系統(tǒng)是無(wú)法使用的。對(duì)本發(fā)明 實(shí)施例而言,在保持系統(tǒng)中其他驅(qū)動(dòng)器通電的同時(shí),通過(guò)將單個(gè)驅(qū) 動(dòng)器斷電,該實(shí)施例提供了具有高電源效率的數(shù)據(jù)存儲(chǔ)系統(tǒng),并且 啟用了諸如使用密集驅(qū)動(dòng)器而在相同占地面積中實(shí)現(xiàn)超出常規(guī)系統(tǒng) 的驅(qū)動(dòng)器密度之類的特征。 數(shù)據(jù)保護(hù)
在數(shù)據(jù)保護(hù)方面,較為理想的是提供這樣一種數(shù)據(jù)保護(hù)方案, 其中該方案允許在沒(méi)有明顯中斷的情況下更換故障磁盤(pán),并且允許 在更換磁盤(pán)的同時(shí)確保所用存儲(chǔ)開(kāi)銷的效率。這種方案必須在驅(qū)動(dòng) 器電源循環(huán)方面進(jìn)行優(yōu)化,這是因?yàn)镽AID方案必須與在任何時(shí)間 通電的正確驅(qū)動(dòng)器子集一起工作。由此,即使對(duì)固定的驅(qū)動(dòng)器集合 通電,讀取或?qū)懭氩僮饕脖仨氃陬A(yù)期時(shí)間完成。由于本發(fā)明實(shí)施例 使用的是一種沒(méi)有同時(shí)使用大多數(shù)或所有數(shù)據(jù)磁盤(pán)的數(shù)據(jù)保護(hù)方 案,因此,斷電驅(qū)動(dòng)器是很容易在不明顯中斷操作的情況下被更換 的物理封裝
在系統(tǒng)物理封裝方面,大多數(shù)存儲(chǔ)設(shè)備必須符合特定的體積限 制。例如對(duì)標(biāo)準(zhǔn)支架來(lái)說(shuō),其在尺寸和重量方面具有相應(yīng)的限制, 并且很多用戶必須使用處于這些限制以內(nèi)的系統(tǒng)。本發(fā)明的實(shí)施例 使用了高密度封裝以及驅(qū)動(dòng)器互連來(lái)優(yōu)化驅(qū)動(dòng)器的物理組織,并且 實(shí)現(xiàn)了可以落入這些限制以內(nèi)的最大數(shù)量的驅(qū)動(dòng)器。
存儲(chǔ)事務(wù)性能
在存儲(chǔ)事務(wù)性能方面,驅(qū)動(dòng)器電源循環(huán)將會(huì)導(dǎo)致在任何時(shí)間只
有有限數(shù)量的驅(qū)動(dòng)器通電。首先,全部I/O受限于通電驅(qū)動(dòng)器的數(shù) 量。其次,在起轉(zhuǎn)(spin-up)時(shí)間,對(duì)斷電驅(qū)動(dòng)器中的塊實(shí)施的隨 機(jī)讀取操作將會(huì)招致很大損失。本發(fā)明的實(shí)施例使用了大量的單獨(dú) 驅(qū)動(dòng)器,由此,即使通電驅(qū)動(dòng)器數(shù)量只是驅(qū)動(dòng)器總數(shù)中的一小部 分,所述數(shù)量的通電驅(qū)動(dòng)器也能使全部I/O處于規(guī)定范圍以內(nèi)。在 起轉(zhuǎn)延遲方面,該數(shù)據(jù)存取方案將會(huì)屏蔽延遲,由此主機(jī)系統(tǒng)不會(huì) 察覺(jué)到延遲或遭遇性能降級(jí)。
參考圖1,該圖顯示的是根據(jù)本發(fā)明一個(gè)實(shí)施例的多磁盤(pán)數(shù)據(jù) 存儲(chǔ)系統(tǒng)的通用結(jié)構(gòu)的圖示。應(yīng)該指出的是,圖1所示系統(tǒng)是一種 非常簡(jiǎn)化的結(jié)構(gòu),其目的僅僅是描述本發(fā)明實(shí)施例的一個(gè)方面(電 源循環(huán))。關(guān)于優(yōu)選實(shí)施例的更詳細(xì)陳述是在圖2以及附帶的后續(xù)文 本中描述的。
如圖1所示,數(shù)據(jù)存儲(chǔ)系統(tǒng)10包括多個(gè)磁盤(pán)驅(qū)動(dòng)器。應(yīng)該指出 的是,出于公開(kāi)目的,附圖中的相同對(duì)象可以用帶有小寫(xiě)字母的相
同參考數(shù)字指示,例如20a、 20b等等。在這里,這些對(duì)象可以合 在一起用參考數(shù)字表示。每個(gè)磁盤(pán)驅(qū)動(dòng)器20都經(jīng)由互連40而與控 制器30相連。
在圖1中可以看出,磁盤(pán)驅(qū)動(dòng)器20分為兩個(gè)子集50和60。子 集50和子集60的不同之處在于其中一個(gè)子集(例如50)中的磁 盤(pán)驅(qū)動(dòng)器是通電的,而另一個(gè)子集(例如60)中的磁盤(pán)驅(qū)動(dòng)器是斷 電的。對(duì)系統(tǒng)中的單個(gè)磁盤(pán)驅(qū)動(dòng)器來(lái)說(shuō),只有在需要時(shí),這些磁盤(pán) 驅(qū)動(dòng)器才會(huì)通電(或加電)。在不需要這些磁盤(pán)驅(qū)動(dòng)器時(shí),它們將會(huì) 斷電(掉電)。由此,構(gòu)成每個(gè)子集的特定磁盤(pán)驅(qū)動(dòng)器將會(huì)根據(jù)需要 而改變,從而允許一個(gè)或多個(gè)用戶執(zhí)行數(shù)據(jù)存取(讀取和寫(xiě)入)。該 處理是非常特別的,這是因?yàn)槿缟纤?,常?guī)的數(shù)據(jù)存儲(chǔ)(例如 RAID)系統(tǒng)只提供了整個(gè)磁盤(pán)驅(qū)動(dòng)器集合的電源循環(huán)——它們不允 許系統(tǒng)中的單個(gè)磁盤(pán)驅(qū)動(dòng)器根據(jù)需要而被通電或斷電。
如上所述,在這里,圖1所述系統(tǒng)僅僅被用于引入本發(fā)明一個(gè) 實(shí)施例的電源循環(huán)特性。這里描述的這個(gè)實(shí)施例以及其他實(shí)施例都 是例示性的,并且針對(duì)這些實(shí)施例的眾多變化都是可行的。舉例來(lái) 說(shuō),雖然圖1實(shí)施例使用了多個(gè)磁盤(pán)驅(qū)動(dòng)器,但是其它數(shù)據(jù)存儲(chǔ)類 型同樣是可以使用的,例如固態(tài)存儲(chǔ)器、光盤(pán)驅(qū)動(dòng)器等等。此外, 混合媒體驅(qū)動(dòng)器也是可以使用的,但是可以預(yù)期的是,這種應(yīng)用通 常是不切實(shí)際的。由此,在這里關(guān)于磁盤(pán)驅(qū)動(dòng)器或數(shù)據(jù)存儲(chǔ)驅(qū)動(dòng)器 的引用將被廣義地解釋成是覆蓋了任何數(shù)據(jù)存儲(chǔ)類型。同樣,雖然 圖1實(shí)施例具有一個(gè)通電和一個(gè)斷電的兩個(gè)磁盤(pán)驅(qū)動(dòng)器子集,但是 其他電源狀態(tài)也是可能的。例如,磁盤(pán)驅(qū)動(dòng)器有可能存在多種附加
操作狀態(tài)(例如待用),并且其中每個(gè)狀態(tài)都具有自己的功耗特性。
如果只對(duì)系統(tǒng)中的磁盤(pán)驅(qū)動(dòng)器子集通電,那么在與所有驅(qū)動(dòng)器 都被同時(shí)供電的系統(tǒng)相同的占地面積中將可以允許使用數(shù)量更多的 驅(qū)動(dòng)器。由此,本發(fā)明的一個(gè)實(shí)施例提供了高密度的磁盤(pán)驅(qū)動(dòng)器封 裝和互連。該系統(tǒng)包含具有多個(gè)支架的機(jī)架,其中每個(gè)支架都包含 了多個(gè)行或多個(gè)"集束"磁盤(pán)驅(qū)動(dòng)器。在圖2中對(duì)該系統(tǒng)的結(jié)構(gòu)進(jìn)行 了描述。
參考圖2,在該圖左側(cè)顯示了系統(tǒng)控制器120與支架110之間 的頂級(jí)互連。在該圖右側(cè)顯示了與磁盤(pán)驅(qū)動(dòng)器160中的每個(gè)集束 150相連的支架級(jí)互連。如圖左側(cè)所示,該系統(tǒng)具有多個(gè)支架 110,其中每個(gè)支架都與系統(tǒng)控制器120相連。每個(gè)集束150還與 每個(gè)磁盤(pán)驅(qū)動(dòng)器160相連,由此可以在磁盤(pán)驅(qū)動(dòng)器的數(shù)據(jù)存取以及 磁盤(pán)驅(qū)動(dòng)器的通電/斷電方面對(duì)其單獨(dú)控制。在下文中將對(duì)用于確定 系統(tǒng)驅(qū)動(dòng)器的最優(yōu)封裝和互連配置的機(jī)制進(jìn)行描述。
應(yīng)該指出的是,為了清楚起見(jiàn),在圖2中并不是所有相同對(duì)象 都用參考數(shù)字單獨(dú)標(biāo)識(shí)。例如,只有少量磁盤(pán)支架("0a 110c)、 集束(150a 150b)以及磁盤(pán)驅(qū)動(dòng)器(160a 160c)進(jìn)行了編號(hào)。 但這并不是為了區(qū)分具有參考數(shù)字的對(duì)象與不具有參考數(shù)字的對(duì) 象。
假設(shè)系統(tǒng)中的驅(qū)動(dòng)器數(shù)量是/V,其中A/是一個(gè)很大的數(shù)字。
然后,A/被分解成一個(gè)三元組,由此/V-s丄d,其中
s:系統(tǒng)中的支架單元數(shù)量,它通常由系統(tǒng)物理高度確定。例如
對(duì)44U的標(biāo)準(zhǔn)支架系統(tǒng)來(lái)說(shuō),s可以被選定為8。
f:每個(gè)支架單元中的"集束"數(shù)量,其中一個(gè)集束包含一列磁
盤(pán)。例如在寬為24英寸的支架中,^==8。
C/:處于支架的每個(gè)集束中的磁盤(pán)驅(qū)動(dòng)器數(shù)量。在標(biāo)準(zhǔn)機(jī)架中,
d可以是14。
圖2所示配置被分解為支架、集束和磁盤(pán),由此可以實(shí)現(xiàn)最佳 的磁盤(pán)密集封裝,從而獲取最大的磁盤(pán)驅(qū)動(dòng)器體積容量。在圖3中 顯示它的一個(gè)實(shí)例。借助這種可用大型機(jī)架,在該機(jī)架中可以封裝
近1000個(gè)3.5"磁盤(pán)。
對(duì)優(yōu)選的配置來(lái)說(shuō),它是通過(guò)將A/分解成s、 f和c/以及在如下 方面進(jìn)行優(yōu)化而被實(shí)現(xiàn)的i)驅(qū)動(dòng)器和整體系統(tǒng)(機(jī)架)的容量限 制,以及ii)完整系統(tǒng)的重量限制。后一個(gè)限制是由數(shù)據(jù)中心的物 理大小以及標(biāo)準(zhǔn)機(jī)架大小的重量限制施加的。
除了重量和大小方面的限制之外,大規(guī)模驅(qū)動(dòng)器封裝還必須提 供適當(dāng)?shù)臍饬骱蜕幔允勾疟P(pán)能夠工作在規(guī)定的環(huán)境溫度以下。 這種熱散耗限制還會(huì)影響到如何在系統(tǒng)內(nèi)部排列磁盤(pán)。
在圖3中顯示了一種配置,該配置是一種在提供用于散熱的足 夠氣流的同時(shí)最大化驅(qū)動(dòng)器密度的具體實(shí)施方式

用于提升系統(tǒng)可靠性和可服務(wù)性的驅(qū)動(dòng)器電源循環(huán)
本發(fā)明的一個(gè)實(shí)施例包含的是大容量存儲(chǔ)或準(zhǔn)聯(lián)機(jī)(NOL)系 統(tǒng)。該存儲(chǔ)系統(tǒng)是一個(gè)包含多個(gè)支架的機(jī)架級(jí)磁盤(pán)系統(tǒng)。主機(jī)可以 通過(guò)系統(tǒng)級(jí)機(jī)架控制器上的光纖通道接口與存儲(chǔ)系統(tǒng)相連。每個(gè)支 架都具有用于控制支架中的所有驅(qū)動(dòng)器的本地控制器,RAID功能是 在每個(gè)具有足夠驅(qū)動(dòng)器的機(jī)架內(nèi)部得到支持的,由此可以提供用于 奇偶性保護(hù)的冗余度以及用于替換故障磁盤(pán)的磁盤(pán)備件。
在該實(shí)施例中,系統(tǒng)具有循環(huán)電源。特別地,單個(gè)驅(qū)動(dòng)器將被 通電或斷電,以便提高整個(gè)(大型)驅(qū)動(dòng)器集合的系統(tǒng)可靠性。如 果給出的是當(dāng)前己知的按年計(jì)算故障率(AFR),那么1000個(gè)ATA 驅(qū)動(dòng)器的集合預(yù)計(jì)將會(huì)具有大小約為20天的MTBF。在企業(yè)環(huán)境 中,用于為存儲(chǔ)系統(tǒng)提供服務(wù)的大小為20天的驅(qū)動(dòng)器更換周期是無(wú) 法接受的。對(duì)于為單個(gè)驅(qū)動(dòng)器執(zhí)行有效電源循環(huán)的本方案來(lái)說(shuō),該 方案顯著延長(zhǎng)了驅(qū)動(dòng)器實(shí)際壽命。但是,出于多種原因,有必要對(duì) 這種電源循環(huán)進(jìn)行很大優(yōu)化。例如,電源循環(huán)將會(huì)導(dǎo)致產(chǎn)生很多接 觸起停(CSS),并且增加CSS將會(huì)縮短驅(qū)動(dòng)器的總體壽命。此 外,如果通電的驅(qū)動(dòng)器較少,那么要在大型RAID集合上擴(kuò)展數(shù)據(jù) 將會(huì)非常困難。由此,要在與RAID 5等價(jià)的級(jí)別實(shí)施數(shù)據(jù)保護(hù)將 會(huì)非常困難。此外,當(dāng)通電驅(qū)動(dòng)器很少時(shí),實(shí)際系統(tǒng)帶寬也會(huì)減 小。
在一個(gè)實(shí)施例中,在圖4中顯示并且在下文中描述了用于確定 電源循環(huán)參數(shù)的方法。應(yīng)該指出的是,下文的描述假設(shè)磁盤(pán)驅(qū)動(dòng)器
具有指數(shù)故障率(即故障概率為1-e—M,其中A是故障率的倒數(shù))。 在其他實(shí)施例中,磁盤(pán)(或其他類型的驅(qū)動(dòng)器)故障率可以具有通 過(guò)其他數(shù)學(xué)函數(shù)而被更精確估計(jì)的故障率。對(duì)此類系統(tǒng)來(lái)說(shuō),下文 描述的計(jì)算使用了替換故障率,以此來(lái)取代當(dāng)前的指數(shù)函數(shù)。
在具有N個(gè)密集封裝于單個(gè)物理系統(tǒng)的驅(qū)動(dòng)器的情況下,當(dāng)N 變成很大的數(shù)字時(shí),系統(tǒng)的MTTF將會(huì)顯著增大。
如果單個(gè)驅(qū)動(dòng)器的MTTF是f (通常以小時(shí)為單位),其中f=V (驅(qū)動(dòng)器故障率),那么系統(tǒng)中單個(gè)驅(qū)動(dòng)器故障之間的系統(tǒng)MTFB, F將會(huì)是
<formula>formula see original document page 15</formula>
對(duì)N-100以及f-500,000小時(shí)或57年來(lái)說(shuō),F(xiàn)-22天。對(duì)大多
數(shù)數(shù)據(jù)中心和企業(yè)來(lái)說(shuō),這么低的MTBF是無(wú)法接受的。如上所 述,通過(guò)為驅(qū)動(dòng)器通電和斷電,也就是通過(guò)對(duì)驅(qū)動(dòng)器執(zhí)行電源循 環(huán),可以提高系統(tǒng)中每個(gè)驅(qū)動(dòng)器的總體壽命,由此可以提升系統(tǒng)的 MTBF。這樣做有助于系統(tǒng)維護(hù),這是因?yàn)樵诳赡苄迯?fù)或更換組件 (驅(qū)動(dòng)器)時(shí),企業(yè)中的計(jì)算系統(tǒng)的可服務(wù)性需要確定性的調(diào)度服 務(wù)時(shí)間。由于較理想的是具有處于規(guī)則間隔的調(diào)度服務(wù),因此,在 以下計(jì)算中引入了這個(gè)約束條件。
假設(shè)更換故障磁盤(pán)驅(qū)動(dòng)器的系統(tǒng)服務(wù)間隔是T,并且所需電源 循環(huán)占空率是R。
實(shí)際系統(tǒng)MTBF是7",并且實(shí)際系統(tǒng)故障率是7/7。
那么,在具有N個(gè)磁盤(pán)的系統(tǒng)中,實(shí)際MTBF是
<formula>formula see original document page 15</formula>
由此,在單個(gè)系統(tǒng)的大量驅(qū)動(dòng)器中,我們可以計(jì)算出磁盤(pán)的實(shí) 際MTBF,由此服務(wù)間隔是r。
由于實(shí)際MTTF是f,因此,我們采用的方法是對(duì)驅(qū)動(dòng)器實(shí)施電 源循環(huán),也就是在一段時(shí)間關(guān)閉驅(qū)動(dòng)器,然后在一定時(shí)段將其開(kāi)啟。
如果R是滿足有效MTTF的占空率,那么
由此,如果驅(qū)動(dòng)器的ON (通電)周期是p小時(shí),那么這些驅(qū) 動(dòng)器在p/R小時(shí)中必須OFF (斷電)。
此外,由于在任何時(shí)間都只有全部驅(qū)動(dòng)器的一個(gè)子集通電,因 此,系統(tǒng)中通電的有效驅(qū)動(dòng)器數(shù)量是『N。
這樣一來(lái),在某個(gè)支架上,所有驅(qū)動(dòng)器比值R同樣也是必須通 電的驅(qū)動(dòng)器的數(shù)量。這樣做不但限制了用于數(shù)據(jù)寫(xiě)入或讀取的驅(qū)動(dòng) 器數(shù)量,而且還限制了用于保持元數(shù)據(jù)的其他驅(qū)動(dòng)器的數(shù)量。
在電源循環(huán)過(guò)程中,其中還必須滿足另一個(gè)用以確定大小為p 小時(shí)的通電周期的約束條件。
如果驅(qū)動(dòng)器的典型壽命是f個(gè)小時(shí)(與正常MTTF相同),那么 用于驅(qū)動(dòng)器的電源循環(huán)事件的數(shù)量是CSS (用于接觸起停)
由于CSS受限于最大值CSSmax,因此對(duì)任何一個(gè)驅(qū)動(dòng)器來(lái)
說(shuō),
CSS < CSSmax
由此必須對(duì)p進(jìn)行選擇,從而永遠(yuǎn)不會(huì)超出CSSmax。
圖4描述的是用于確定電源循環(huán)參數(shù)的流程圖。
用于準(zhǔn)聯(lián)機(jī)(NOL)系統(tǒng)的有效數(shù)據(jù)保護(hù)方案
在一個(gè)實(shí)施例中,其中實(shí)施了一種全新的RAID變體,以便滿 足當(dāng)前電源管理系統(tǒng)的需要。為了滿足系統(tǒng)可服務(wù)性需要,驅(qū)動(dòng)器 的電源占空率R小于100%,并且較為恰當(dāng)?shù)氖堑陀?0%。由此, 在將數(shù)據(jù)巻寫(xiě)入支架中的RAID巻時(shí),RAID集合中的所有驅(qū)動(dòng)器都 不能通電(加電)。而這里公開(kāi)的RAID變體則被設(shè)計(jì)為提供如下特 征。
首先,該方案被設(shè)計(jì)成提供適當(dāng)?shù)钠媾夹员Wo(hù)。此外,它還被 設(shè)計(jì)成確保不會(huì)違反由可服務(wù)性需要施加的CSS閾值。另外, RAID條帶參數(shù)被設(shè)計(jì)成滿足工作負(fù)載模式、支架級(jí)支持帶寬以及存 取時(shí)間的需要。而第一個(gè)字節(jié)的存取時(shí)間還必須遠(yuǎn)遠(yuǎn)優(yōu)于磁帶或順
序媒體。此外,該方案還被設(shè)計(jì)成提供基于奇偶性的數(shù)據(jù)保護(hù)以及 低開(kāi)銷的磁盤(pán)備用。
在數(shù)據(jù)保護(hù)方案中,其中有很多問(wèn)題需要解決。例如在讀取過(guò) 程中,磁盤(pán)故障(該故障是由系統(tǒng)中大量驅(qū)動(dòng)器招致的增大的磁盤(pán) 故障概率造成的)有可能導(dǎo)致未完成I/O事務(wù)。由此,在該方案中 應(yīng)該設(shè)計(jì)用于在寫(xiě)入過(guò)程中確保數(shù)據(jù)完整性和避免數(shù)據(jù)丟失的裝
置。此外,數(shù)據(jù)保護(hù)處理還需要RAID冗余或奇偶性保護(hù)。但是, 由于數(shù)據(jù)和奇偶性是在多個(gè)驅(qū)動(dòng)器上寫(xiě)入的,因此,RAID操作通常 需要所有驅(qū)動(dòng)器都處于通電狀態(tài)。另外,使用RAID保護(hù)和磁盤(pán)備 用往往還會(huì)導(dǎo)致很高的磁盤(pán)空間開(kāi)銷,而這有可能會(huì)減小實(shí)際容 量。此外,電源循環(huán)還會(huì)增加接觸起停(CSS)數(shù)量,由此CSS故 障率往往會(huì)增大4倍或更多。
在一個(gè)實(shí)施例中,在每個(gè)支架中都有3種驅(qū)動(dòng)器在每次調(diào)度 時(shí)或者通過(guò)讀取/寫(xiě)入活動(dòng)而被實(shí)施電源循環(huán)的數(shù)據(jù)和奇偶性驅(qū)動(dòng) 器;用于在驅(qū)動(dòng)器發(fā)生故障時(shí)遷移數(shù)據(jù)的備用驅(qū)動(dòng)器;以及保持任 何指定RAID集合的狀態(tài)和配置的元數(shù)據(jù)驅(qū)動(dòng)器。元數(shù)據(jù)驅(qū)動(dòng)器包 含了關(guān)于所有I/O操作以及磁盤(pán)驅(qū)動(dòng)器操作轉(zhuǎn)換(通電,斷電,備 用等等)的元數(shù)據(jù)。處于該巻的數(shù)據(jù)將被組織,以便提供關(guān)于磁盤(pán) 驅(qū)動(dòng)器集合上的數(shù)據(jù)的信息,以及對(duì)將要寫(xiě)入未通電驅(qū)動(dòng)器或是從 該驅(qū)動(dòng)器中讀取的數(shù)據(jù)進(jìn)行緩存。由此,元數(shù)據(jù)巻在磁盤(pán)管理、I/O 性能以及故障容錯(cuò)方面將會(huì)起到非常重要的作用。
當(dāng)前系統(tǒng)所使用的RAID變體將會(huì)"串行化"RAID集合中的最小 磁盤(pán)子集的寫(xiě)入操作,同時(shí)確保不超出CSS限度,此外還確保I/O 寫(xiě)入性能不受存取時(shí)間和數(shù)據(jù)率影響。
實(shí)施RAID變體的方法
在應(yīng)用數(shù)據(jù)保護(hù)技術(shù)的過(guò)程中,驅(qū)動(dòng)器集合和數(shù)據(jù)可以駐留于 多種狀態(tài)。在一個(gè)實(shí)施例中,其中使用了下列狀態(tài)。初始化——在 該狀態(tài)中,某個(gè)巻已被分配,但是除了可能的文件元數(shù)據(jù)之外,在 相應(yīng)磁盤(pán)中尚未寫(xiě)入數(shù)據(jù)。正常一在該狀態(tài)中,巻具有駐留在相 應(yīng)磁盤(pán)驅(qū)動(dòng)器集合內(nèi)部的有效數(shù)據(jù)。這其中包括I/O操作在數(shù)據(jù)傳
遞過(guò)程中產(chǎn)生的巻。數(shù)據(jù)冗余——在該狀態(tài)中,巻先前已經(jīng)降級(jí), 并且處于恢復(fù)整個(gè)巻上的數(shù)據(jù)冗余的過(guò)程中。備用一在該狀態(tài) 中,集合內(nèi)部的磁盤(pán)驅(qū)動(dòng)器將被更換。 假設(shè)
一般來(lái)說(shuō),在開(kāi)發(fā)用于數(shù)據(jù)保護(hù)的技術(shù)的時(shí)候?qū)?huì)根據(jù)所選擇 的技術(shù)來(lái)進(jìn)行權(quán)衡。而在考慮權(quán)衡時(shí)則會(huì)做出兩個(gè)假設(shè)。第一個(gè)假 設(shè)是該數(shù)據(jù)存儲(chǔ)系統(tǒng)并沒(méi)有實(shí)現(xiàn)或者趨近于企業(yè)聯(lián)機(jī)存儲(chǔ)系統(tǒng)的 1/0性能。換句話說(shuō),該系統(tǒng)并不是為1/0事務(wù)設(shè)計(jì)的,而是為了可 靠性設(shè)計(jì)的。第二個(gè)假設(shè)是用于數(shù)據(jù)存儲(chǔ)的I/O工作負(fù)載應(yīng)用通 常是較大的順序?qū)懭胩幚硪约搬槍?duì)介質(zhì)的較大的順序讀取。
初始化磁盤(pán)驅(qū)動(dòng)器集合
初始化的磁盤(pán)驅(qū)動(dòng)器集合包括一個(gè)映射數(shù)據(jù)組織,在該組織 中,單個(gè)磁盤(pán)驅(qū)動(dòng)器的故障不會(huì)導(dǎo)致數(shù)據(jù)丟失。對(duì)該技術(shù)而言,所 有磁盤(pán)驅(qū)動(dòng)器全都初始化成零值。
"零初始化"磁盤(pán)驅(qū)動(dòng)器的存在通常會(huì)作為基礎(chǔ)來(lái)創(chuàng)建"滾動(dòng)奇偶
性(rolling parity)"更新。舉例來(lái)說(shuō),參考圖5,在具有4個(gè)磁盤(pán)驅(qū) 動(dòng)器201 204的集合中,所有驅(qū)動(dòng)器(3個(gè)數(shù)據(jù)和1個(gè)奇偶性)都 被初始化為"0"(應(yīng)該指出的是,這些磁盤(pán)驅(qū)動(dòng)器在圖中是水平排列 的_每個(gè)垂直對(duì)準(zhǔn)的列代表的是處于不同時(shí)間點(diǎn)的單個(gè)磁盤(pán))。 XOR計(jì)算結(jié)果代表了奇偶性驅(qū)動(dòng)器的內(nèi)容(0@0 0 = 0)。如果將 值為"5"的數(shù)據(jù)寫(xiě)入第一磁盤(pán)201,那么寫(xiě)入到奇偶性磁盤(pán)204的奇 偶性將會(huì)表示"5" (5 0 0 = 5)。如果為下一個(gè)磁盤(pán)(磁盤(pán)202)寫(xiě) 入值"A",那么奇偶性將被表示為"F" (5 A@0 = F)。應(yīng)該指出的 是,雖然奇偶性磁盤(pán)包含的是與所有三個(gè)數(shù)據(jù)磁盤(pán)的XOR運(yùn)算結(jié)果 相等的值,但是沒(méi)有必要通過(guò)為所有磁盤(pán)通電來(lái)產(chǎn)生正確的奇偶 性。取而代之的是,在這里僅僅對(duì)舊的奇偶性信息("5")和新寫(xiě)入 的數(shù)據(jù)("A")執(zhí)行XOR運(yùn)算,以便產(chǎn)生新的奇偶性("F')。由 此,磁盤(pán)202上的舊數(shù)據(jù)不必處于XOR計(jì)算之外。 元數(shù)據(jù)巻
在一個(gè)實(shí)施例中,為了保持指定RAID集合的狀態(tài)和配置,其
中將會(huì)保持一個(gè)"元數(shù)據(jù)巻"(MDV)。該巻是聯(lián)機(jī)工作磁盤(pán)驅(qū)動(dòng)器集 合,其中該集合可被鏡像,以便用于故障容錯(cuò)。這個(gè)巻與磁盤(pán)驅(qū)動(dòng) 器集合駐留在相同的域中。由此,所述工作環(huán)境應(yīng)該提供足夠電
力、冷卻和封裝,以便支持所述巻。該巻包含了關(guān)于I/O操作和磁
盤(pán)驅(qū)動(dòng)器操作變換(通電,斷電,備用等等)的元數(shù)據(jù)。駐留在該 巻中的數(shù)據(jù)將被組織,以使數(shù)據(jù)子集拷貝代表磁盤(pán)驅(qū)動(dòng)器集合上的數(shù)據(jù)。
在一個(gè)優(yōu)選實(shí)施方式中,元數(shù)據(jù)巻處于每一個(gè)支架內(nèi)部,并且 該支架與駐留于支架的磁盤(pán)之上的所有數(shù)據(jù)巻的元數(shù)據(jù)相對(duì)應(yīng)。參
考圖6和7,該圖描述的是元數(shù)據(jù)巻的數(shù)據(jù)內(nèi)容。所述巻包含了關(guān) 于支架、RAID、磁盤(pán)以及機(jī)殼的所有元數(shù)據(jù)。此外,關(guān)于機(jī)架控制 器的元數(shù)據(jù)也是存在的。該元數(shù)據(jù)被用于確定機(jī)架控制器與磁盤(pán)支 架之間的正確系統(tǒng)配置。
在一個(gè)實(shí)施例中,元數(shù)據(jù)巻包含了諸如驅(qū)動(dòng)器總數(shù)、驅(qū)動(dòng)器備 件、未使用數(shù)據(jù)之類的支架屬性,諸如RAID集合設(shè)置(set set) 之類的RAID集合屬性和會(huì)員資格,諸如序列號(hào)、硬件修訂、固件 修訂之類的數(shù)據(jù)屬性,以及包括讀取緩存和寫(xiě)入緩存在內(nèi)的巻緩 存。
巻配置
在一個(gè)實(shí)施例中,元數(shù)據(jù)巻是一組鏡像磁盤(pán)驅(qū)動(dòng)器。在本實(shí)施 例中,鏡像驅(qū)動(dòng)器的最小數(shù)量是2。元數(shù)據(jù)巻中的磁盤(pán)驅(qū)動(dòng)器數(shù)量 可被配置,以便與用戶請(qǐng)求的保護(hù)等級(jí)相匹配。這些磁盤(pán)的數(shù)量不 能超出磁盤(pán)控制器數(shù)量。為了在磁盤(pán)支架內(nèi)部提供最高的故障容錯(cuò) 等級(jí),元數(shù)據(jù)巻會(huì)在每個(gè)磁盤(pán)驅(qū)動(dòng)器上被鏡像。這種處理消除了單 個(gè)磁盤(pán)驅(qū)動(dòng)器禁用支架控制器的可能性。
為了提供最佳元數(shù)據(jù)巻性能,在這里啟用了動(dòng)態(tài)的再配置處 理,以便確定讓磁盤(pán)驅(qū)動(dòng)器工作的最佳磁盤(pán)控制器。此外,如果元 數(shù)據(jù)巻磁盤(pán)發(fā)生故障,則使用磁盤(pán)支架內(nèi)部的第一個(gè)未分配的磁盤(pán) 驅(qū)動(dòng)器。由此,如果不再有未分配磁盤(pán)驅(qū)動(dòng)器,則使用第一個(gè)已分 配的空閑磁盤(pán)驅(qū)動(dòng)器。如果不再有可用磁盤(pán),那么支架控制器將會(huì)
保持停機(jī)狀態(tài),直至定址了元數(shù)據(jù)巻為止。 巻布局
元數(shù)據(jù)巻的布局被設(shè)計(jì)為提供永久數(shù)據(jù)以及磁盤(pán)支架狀態(tài)。該
數(shù)據(jù)被用于支架配置、RAID集合配置、巻配置以及磁盤(pán)配置。在磁 盤(pán)支架的所有階段(初始化、正常、重建、服務(wù)等等),該永久數(shù)據(jù) 都會(huì)更新和使用。
元數(shù)據(jù)巻數(shù)據(jù)被用于向機(jī)架控制器傳遞狀態(tài)和配置數(shù)據(jù)。例 如,元數(shù)據(jù)可以包括每個(gè)磁盤(pán)驅(qū)動(dòng)器的健康信息(也就是磁盤(pán)驅(qū)動(dòng) 器的使用時(shí)長(zhǎng),磁盤(pán)驅(qū)動(dòng)器的通電和斷電次數(shù),以及可能影響其穩(wěn) 定性的其他因素)。如果特定磁盤(pán)驅(qū)動(dòng)器的健康信息表明該驅(qū)動(dòng)器應(yīng) 該更換,那么,倘若第一驅(qū)動(dòng)器發(fā)生故障,則系統(tǒng)可以開(kāi)始將該磁 盤(pán)驅(qū)動(dòng)器上的數(shù)據(jù)拷貝到另一個(gè)驅(qū)動(dòng)器,或者它也可以僅僅在下一 個(gè)正常服務(wù)間隔提供一個(gè)表明驅(qū)動(dòng)器應(yīng)該更換的通知。此外,元數(shù) 據(jù)巻的數(shù)據(jù)還具有為每個(gè)巻指定的巻緩存區(qū)域。如果某個(gè)巻聯(lián)機(jī), 那么對(duì)存儲(chǔ)在用于脫機(jī)巻的元數(shù)據(jù)巻中的數(shù)據(jù)來(lái)說(shuō),當(dāng)所述巻聯(lián)機(jī) 時(shí),該數(shù)據(jù)是可以使用的。就該處理而言,借助來(lái)自機(jī)架控制器的 請(qǐng)求,該處理提供了一個(gè)大小為10~12秒的窗口 (或是為相應(yīng)驅(qū)動(dòng) 器通電所需要的時(shí)間),在此期間,在為脫機(jī)巻的驅(qū)動(dòng)器通電的同時(shí) 將會(huì)緩存寫(xiě)入數(shù)據(jù)。在為驅(qū)動(dòng)器通電以及所述巻聯(lián)機(jī)之后,這時(shí)會(huì) 將緩存數(shù)據(jù)寫(xiě)入所述巻。
支架初始化
當(dāng)磁盤(pán)支架通電/復(fù)位時(shí),這時(shí)會(huì)從元數(shù)據(jù)巻中讀取所有數(shù)據(jù)。 該數(shù)據(jù)被用于將磁盤(pán)支架引入工作模式。 一旦磁盤(pán)支架完成初始化 處理,那么它會(huì)等待機(jī)架控制器啟動(dòng)該機(jī)架控制器的初始化處理。
巻操作
一旦磁盤(pán)支架處于工作模式,那么每個(gè)巻都會(huì)與元數(shù)據(jù)巻同 步。每個(gè)巻在磁盤(pán)驅(qū)動(dòng)器上都具有相關(guān)聯(lián)的元數(shù)據(jù)集合。如果發(fā)生 災(zāi)難性的元數(shù)據(jù)巻故障,那么該處理將是必需的。
讀取緩存操作
元數(shù)據(jù)巻具有用于每個(gè)巻的保留空間。在元數(shù)據(jù)巻的保留空間
內(nèi)部駐留的是已分配的巻讀取緩存(VRC)。該讀取緩存被設(shè)計(jì)成在 使用電源來(lái)啟動(dòng)磁盤(pán)驅(qū)動(dòng)器時(shí)緩解磁盤(pán)驅(qū)動(dòng)器的起轉(zhuǎn)和尋道時(shí)間。
VRC將會(huì)復(fù)制每個(gè)巻的初始部分。并且在VRC中復(fù)制的數(shù)據(jù)大小 取決于預(yù)期性能和環(huán)境狀況。由此,如果為脫機(jī)巻給出I/O讀取請(qǐng) 求,那么可以從VRC中獲取數(shù)據(jù)。在這里需要注意確保該數(shù)據(jù)與關(guān) 聯(lián)巻是相干和一致的。 寫(xiě)入緩存操作
如上所述,元數(shù)據(jù)巻具有用于每個(gè)巻的保留空間。在元數(shù)據(jù)巻 的保留空間內(nèi)部駐留的是已分配的巻寫(xiě)入緩存(VWC)。該寫(xiě)入緩 存被設(shè)計(jì)成在使用電源啟動(dòng)磁盤(pán)驅(qū)動(dòng)器時(shí)緩解磁盤(pán)驅(qū)動(dòng)器的起轉(zhuǎn)和 尋道時(shí)間。VWC具有為每個(gè)巻復(fù)制的一部分初始數(shù)據(jù),例如 512MB。由此,如果為某個(gè)脫機(jī)巻給出I/O寫(xiě)入請(qǐng)求,那么該數(shù)據(jù) 可以臨時(shí)存儲(chǔ)在VWC中。同樣,在這里必須注意確保該數(shù)據(jù)與關(guān) 聯(lián)巻是相干和一致的。
磁盤(pán)I/O操作集合
參考圖8,該圖顯示的是用于描述如何在一組磁盤(pán)上存儲(chǔ)數(shù)據(jù) 的圖示。某一組磁盤(pán)被分成"大型連續(xù)的"數(shù)據(jù)塊集合,而這些數(shù)據(jù)塊 集合即為通常所說(shuō)的容器"。對(duì)于為存儲(chǔ)用戶或服務(wù)器呈現(xiàn)的單個(gè)或 多個(gè) 磁盤(pán)巻來(lái)說(shuō),這些巻可以代表一個(gè)容器。處于容器內(nèi)部的數(shù)據(jù) 塊是用磁盤(pán)扇區(qū)大小規(guī)定的,并且所述大小通常是512字節(jié)。每個(gè) 容器都是靜態(tài)分配的,并且是從0到x尋址的,其中x是數(shù)據(jù)塊數(shù) 量減1。由此,每個(gè)容器都可以分成一定數(shù)量的子容器。
針對(duì)每個(gè)容器的存取將會(huì)通過(guò)某個(gè)地址間接等級(jí)。該容器是一 個(gè)從0定址到x的連續(xù)塊集合。在存取設(shè)備時(shí),相關(guān)聯(lián)的磁盤(pán)驅(qū)動(dòng) 器必須通電和工作。舉個(gè)例子,容器0完全包含在磁盤(pán)驅(qū)動(dòng)器1的 地址空間內(nèi)部。由此,在讀寫(xiě)容器0時(shí),唯一通電的驅(qū)動(dòng)器是磁盤(pán) 驅(qū)動(dòng)器1 。
如果用于系統(tǒng)的電源和冷卻能力有限,并且一次只能存取一個(gè) 磁盤(pán)驅(qū)動(dòng)器,那么為了存取容器2,在容器2跨越范圍為磁盤(pán)驅(qū)動(dòng) 器1和2時(shí),這兩個(gè)磁盤(pán)驅(qū)動(dòng)器必須交替通電。在一開(kāi)始,磁盤(pán)驅(qū)
動(dòng)器1通電。然后,磁盤(pán)驅(qū)動(dòng)器1將會(huì)斷電,并且磁盤(pán)驅(qū)動(dòng)器2將 會(huì)通電。由此,對(duì)磁盤(pán)驅(qū)動(dòng)器2來(lái)說(shuō),其在存取準(zhǔn)備就緒之前存在
延遲。這樣一來(lái),針對(duì)磁盤(pán)驅(qū)動(dòng)器2上的下一組數(shù)據(jù)塊實(shí)施的存取
處理將會(huì)延遲。就磁盤(pán)驅(qū)動(dòng)器存取來(lái)說(shuō),這種情況通常并不是可接 受的行為。由此,每個(gè)磁盤(pán)驅(qū)動(dòng)器和/或容器的第一個(gè)分段都會(huì)緩存
在一組單獨(dú)的有效/聯(lián)機(jī)磁盤(pán)驅(qū)動(dòng)器上。在本實(shí)施例中,如圖9所 示,用于容器2的數(shù)據(jù)塊駐留在元數(shù)據(jù)巻中。
在該技術(shù)中,兩個(gè)磁盤(pán)驅(qū)動(dòng)器之間的變換是通過(guò)為一個(gè)磁盤(pán)驅(qū) 動(dòng)器斷電以及為另一個(gè)磁盤(pán)驅(qū)動(dòng)器通電來(lái)完成的,并且該技術(shù)同樣 可以應(yīng)用于一對(duì)以上的磁盤(pán)驅(qū)動(dòng)器。如果需要更高帶寬,那么上述 單個(gè)驅(qū)動(dòng)器可以各自代表一組磁盤(pán)驅(qū)動(dòng)器。這種磁盤(pán)驅(qū)動(dòng)器配置可 以包括RAID10或是可以在眾多磁盤(pán)驅(qū)動(dòng)器(主軸)上擴(kuò)展數(shù)據(jù)的 其他形式的數(shù)據(jù)組織。
變?yōu)槿哂嗟拇疟P(pán)驅(qū)動(dòng)器集合
參考圖10,該圖顯示的是用于描述如何使用配對(duì)冗余磁盤(pán)驅(qū)動(dòng) 器的圖示。在將數(shù)據(jù)分配給一組磁盤(pán)驅(qū)動(dòng)器時(shí),這時(shí)需要實(shí)施數(shù)據(jù) 復(fù)制。假設(shè)該復(fù)制處理采用的是RAID (1, 4, 5等等)形式,那么 合并處理必須保持?jǐn)?shù)據(jù)相干。該處理可以與每個(gè)寫(xiě)入操作同時(shí)完 成,或者也可以在稍后時(shí)間執(zhí)行。由于在任何一個(gè)時(shí)間并不是所有 磁盤(pán)驅(qū)動(dòng)器都會(huì)通電,因此,較為有益的是追蹤一組磁盤(pán)驅(qū)動(dòng)器的 當(dāng)前狀態(tài)。這個(gè)內(nèi)務(wù)處理包括重新產(chǎn)生數(shù)據(jù)塊所需要的信息,以便 在恢復(fù)數(shù)據(jù)的過(guò)程中確切了解哪一個(gè)磁盤(pán)驅(qū)動(dòng)器集合或磁盤(pán)驅(qū)動(dòng)器 子集有效。
可變的RAID集合成員
對(duì)這里描述的電源管理系統(tǒng)來(lái)說(shuō),它的一個(gè)顯著益處是可以重 復(fù)使用RAID集合中的驅(qū)動(dòng)器,即便在多個(gè)磁盤(pán)驅(qū)動(dòng)器發(fā)生故障時(shí) 也是如此。在常規(guī)的RAID系統(tǒng)中,由于數(shù)據(jù)是分片段或分布在 RAID集合中的所有驅(qū)動(dòng)器上的,因此,在RAID集合中, 一個(gè)以上 的驅(qū)動(dòng)器的故障將會(huì)導(dǎo)致需要放棄該RAID集合中的所有驅(qū)動(dòng)器。 對(duì)這里描述的電源管理系統(tǒng)來(lái)說(shuō),該系統(tǒng)可以重復(fù)使用不同RAID
集合中的剩余驅(qū)動(dòng)器或不同大小的RAID集合。這樣做的結(jié)果是更
多地使用了總體系統(tǒng)中的存儲(chǔ)空間。
如果在同一 RAID集合中發(fā)生多個(gè)驅(qū)動(dòng)器故障,那么該RAID 集合中的成員驅(qū)動(dòng)器集合可以減小(例如從六個(gè)驅(qū)動(dòng)器減小到4 個(gè))。通過(guò)使用如上所述的"基于零"XOR奇偶性屬性,減小的驅(qū)動(dòng)器 集合的奇偶性信息可以從駐留于這些驅(qū)動(dòng)器的數(shù)據(jù)中計(jì)算得到。這 種處理允許在將來(lái)驅(qū)動(dòng)器發(fā)生故障時(shí)將數(shù)據(jù)存儲(chǔ)于剩余驅(qū)動(dòng)器。如 果奇偶性驅(qū)動(dòng)器是發(fā)生故障的驅(qū)動(dòng)器之一,那么可以為新形成的 RAID集合指定新的奇偶性驅(qū)動(dòng)器,并且所述奇偶性信息將會(huì)存儲(chǔ)在 這個(gè)驅(qū)動(dòng)器上。而磁盤(pán)驅(qū)動(dòng)器元數(shù)據(jù)則會(huì)更新,以便反映現(xiàn)在構(gòu)成 減小的或新形成的RAID集合的剩余和/或新驅(qū)動(dòng)器。
在一個(gè)例示實(shí)施例中,RAID集合具有五個(gè)成員驅(qū)動(dòng)器,其中包 括四個(gè)數(shù)據(jù)驅(qū)動(dòng)器和一個(gè)奇偶性驅(qū)動(dòng)器。如果某個(gè)數(shù)據(jù)驅(qū)動(dòng)器發(fā)生 故障,那么倘若有足夠空間可用,則可以在剩余磁盤(pán)驅(qū)動(dòng)器上重建 數(shù)據(jù)(如果存在可用于更換故障驅(qū)動(dòng)器的備件,并且不必減小RAID 集合,那么可以在新的成員驅(qū)動(dòng)器上重建數(shù)據(jù))。如果兩個(gè)或多個(gè)數(shù) 據(jù)驅(qū)動(dòng)器同時(shí)發(fā)生故障,那么未發(fā)生故障的驅(qū)動(dòng)器上的數(shù)據(jù)可被保 留,并且可以繼續(xù)使用減小的RAID集合上的剩余數(shù)據(jù)來(lái)執(zhí)行操 作,此外,減小的RAID集合還可以重新初始化,并且可以用作新 的RAID集合。
同樣的原理還可以應(yīng)用于擴(kuò)展一組磁盤(pán)驅(qū)動(dòng)器。換句話說(shuō),如 果較理想的是為RAID集合添加驅(qū)動(dòng)器(例如將所述集合從四個(gè)驅(qū) 動(dòng)器增加至五個(gè)),那么該處理可以采用一種與減小的RAID集合相 類似的方式來(lái)完成。如果RAID集合準(zhǔn)許附加的磁盤(pán)驅(qū)動(dòng)器,那么 有必要對(duì)磁盤(pán)驅(qū)動(dòng)器元數(shù)據(jù)進(jìn)行更新,以便表示一個(gè)或多個(gè)新驅(qū)動(dòng) 器的成員資格。
磁盤(pán)驅(qū)動(dòng)器集合備用(sparing)
涉及磁盤(pán)驅(qū)動(dòng)器集合中的故障磁盤(pán)的備用處理是針對(duì)發(fā)生故障 的數(shù)據(jù)塊和發(fā)生故障的磁盤(pán)驅(qū)動(dòng)器事件執(zhí)行的。故障數(shù)據(jù)塊的備用 將被臨時(shí)再生。如果使用元數(shù)據(jù)巻和"備用"磁盤(pán)驅(qū)動(dòng)器,那么在磁盤(pán)
驅(qū)動(dòng)器集合內(nèi)部恢復(fù)冗余度的處理將會(huì)更為有效。該處理與為磁盤(pán) 驅(qū)動(dòng)器集合中的每個(gè)剩余磁盤(pán)驅(qū)動(dòng)器通電的處理是匹配的。
如果超出故障數(shù)據(jù)塊閾值,則分配一個(gè)備用磁盤(pán)驅(qū)動(dòng)器,以此 作為用于RAID集合的更換候選方。由于在一個(gè)時(shí)間只有數(shù)量有限 的驅(qū)動(dòng)器通電,因此,在這里會(huì)為具有故障數(shù)據(jù)塊的驅(qū)動(dòng)器和候選 驅(qū)動(dòng)器通電。這時(shí),只有已知的良好數(shù)據(jù)塊才會(huì)拷貝到故障數(shù)據(jù)塊 的相應(yīng)地址位置。
一旦拷貝了所有已知的良好數(shù)據(jù)塊,則啟動(dòng)用于
恢復(fù)故障數(shù)據(jù)塊的處理。由此,整個(gè)RAID集合需要通電。雖然需 要對(duì)整個(gè)磁盤(pán)驅(qū)動(dòng)器集合通電,但是該集合只需要在修復(fù)壞數(shù)據(jù)塊 所需要的時(shí)間通電。在修復(fù)了所有壞數(shù)據(jù)塊之后,這些驅(qū)動(dòng)器將會(huì) 返回到斷電狀態(tài)。
如果磁盤(pán)驅(qū)動(dòng)器發(fā)生故障,那么RAID集合中的所有磁盤(pán)驅(qū)動(dòng) 器都會(huì)通電。由此將會(huì)啟動(dòng)先前部分中論述的重建處理,以便恢復(fù) 故障磁盤(pán)驅(qū)動(dòng)器上的所有數(shù)據(jù)。
RAID自動(dòng)存儲(chǔ)管理特征
舉例來(lái)說(shuō),系統(tǒng)的終端用戶既可以將該系統(tǒng)用作直接附著于服 務(wù)器的磁盤(pán)系統(tǒng),作為直接附加存儲(chǔ)(DAS),還可以將其用作存儲(chǔ) 局域網(wǎng)(SAN)中的備用存儲(chǔ)。在圖11中,該系統(tǒng)經(jīng)由直接連接而 被用作初級(jí)存儲(chǔ)的備份目標(biāo),然后經(jīng)由媒體(備份)服務(wù)器與磁帶 庫(kù)相連。在其他實(shí)施例中,該系統(tǒng)也可以采用其他方式來(lái)使用。
在本實(shí)施例中,系統(tǒng)向服務(wù)器或系統(tǒng)用戶呈現(xiàn)巻圖像。但是, 物理巻是不能由終端用戶直接存取的。如先前所述,出現(xiàn)這種情況 是因?yàn)闊o(wú)論對(duì)通電還是斷電的物理驅(qū)動(dòng)器來(lái)說(shuō),通過(guò)電源管理 RAID,系統(tǒng)都會(huì)隱藏了物理驅(qū)動(dòng)器存取的復(fù)雜度。處于機(jī)架和支架 級(jí)的控制器則會(huì)將邏輯巻與物理巻以及驅(qū)動(dòng)器隔離開(kāi)來(lái)。
在給出了磁盤(pán)巻的邏輯視圖顯示的情況下,系統(tǒng)可以將邏輯巻 重寫(xiě)、重定位或是移動(dòng)到不同物理位置。這種處理能夠啟用下文描 述的眾多巻級(jí)功能。例如,該系統(tǒng)可以提供與磁盤(pán)驅(qū)動(dòng)器類型、容 器、數(shù)據(jù)速率等等無(wú)關(guān)的獨(dú)立性。在新媒體可用以及采用新技術(shù) 時(shí),這種處理允許遷移到新的媒體。此外,它還消除了引入技術(shù)陳 舊所需要的設(shè)備(磁盤(pán))管理。
該系統(tǒng)還可以為災(zāi)難恢復(fù)提供自動(dòng)復(fù)制。初級(jí)巻的次級(jí)拷貝可
以通過(guò)局域或廣域之類的網(wǎng)絡(luò)而被獨(dú)立拷貝第三方存儲(chǔ)設(shè)備。此 外,該設(shè)備還可以是另一個(gè)磁盤(pán)系統(tǒng)、另一個(gè)磁帶系統(tǒng)等等。同 樣,所述巻可以復(fù)制到多個(gè)地點(diǎn),以便同時(shí)創(chuàng)建多個(gè)遠(yuǎn)程或本地拷 貝。
該系統(tǒng)還可以提供自動(dòng)遞增備份,以便保留媒體和帶寬。存儲(chǔ) 巻中的遞增和差分變化則可以傳播到第三個(gè)或后續(xù)拷貝。
該系統(tǒng)還可以提供驗(yàn)證和授權(quán)服務(wù)。用于存取物理和邏輯巻和 驅(qū)動(dòng)器的處理可以由機(jī)架和支架控制器控制,這是因?yàn)樵撎幚肀环?置在了到巻的終端用戶與物理驅(qū)動(dòng)器之間的。
該系統(tǒng)還可以提供自動(dòng)數(shù)據(jù)復(fù)原。由于磁盤(pán)媒體上的數(shù)據(jù)有可 能隨時(shí)間降級(jí),因此,系統(tǒng)控制器可以自動(dòng)將巻數(shù)據(jù)刷新到不同驅(qū) 動(dòng)器。由于控制器具有何時(shí)對(duì)磁盤(pán)和驅(qū)動(dòng)器執(zhí)行寫(xiě)入的信息,因此 它們可以追蹤到哪些磁盤(pán)數(shù)據(jù)必須刷新或復(fù)原。
該系統(tǒng)還可以提供同時(shí)恢復(fù)處理多個(gè)恢復(fù)處理既可以同時(shí)實(shí) 施,也可以異步啟動(dòng),還可以借助系統(tǒng)控制器的策略。
該系統(tǒng)還可以采用如下方式而在存儲(chǔ)巻內(nèi)部提供唯一的元數(shù)據(jù) 索引記錄關(guān)于包含在巻內(nèi)的對(duì)象細(xì)節(jié)的元數(shù)據(jù)信息,其中舉例來(lái) 說(shuō),所述巻可以是支架中的元數(shù)據(jù)巻。這些元數(shù)據(jù)可以由控制器使 用,以便在系統(tǒng)巻中快速搜索特定對(duì)象。
該系統(tǒng)還可以提供其他存儲(chǔ)管理特征,以便管理巻的次級(jí)和多 個(gè)拷貝,例如用于簡(jiǎn)化和降低所有巻拷貝管理成本的所有數(shù)據(jù)的單 獨(dú)視圖,用于分發(fā)數(shù)據(jù)拷貝的自動(dòng)化管理,以及在使用系統(tǒng)創(chuàng)建備 份時(shí)對(duì)備份初級(jí)巻的自動(dòng)發(fā)現(xiàn)和變化檢測(cè)。
優(yōu)選的實(shí)施方式
互連
優(yōu)選互連系統(tǒng)提供了一種用于連接896個(gè)磁盤(pán)驅(qū)動(dòng)器的手段, 其中這些磁盤(pán)驅(qū)動(dòng)器被配置為每個(gè)支架具有112個(gè)磁盤(pán)以及每個(gè)機(jī)
架具有8個(gè)支架。內(nèi)部系統(tǒng)互連被設(shè)計(jì)成提供一個(gè)與六個(gè)2Gb/sec
的光纖通道接口 (1000MB/S讀取或?qū)懭?等價(jià)的累積吞吐量,
的。外部系統(tǒng)接口是光纖通道。該互連系統(tǒng)以所需吞吐量的每磁盤(pán)
最低成本為目的來(lái)進(jìn)行優(yōu)化。圖12顯示了從主機(jī)(服務(wù)器或終端用 戶)到終端磁盤(pán)驅(qū)動(dòng)器的互連方案。
該互連系統(tǒng)在支架級(jí)引入了 RAID,以便提供數(shù)據(jù)可靠性。該 RAID控制器被設(shè)計(jì)成定址112個(gè)磁盤(pán),其中某些磁盤(pán)可被分配,以 便用于備用。該RAID控制器控制范圍為8個(gè)集束,其中每個(gè)集束 都具有14個(gè)磁盤(pán)。RAID集合則應(yīng)該被配置成控制范圍為多個(gè)集 束,以便預(yù)防單個(gè)集束控制器或互連丟失,或者是單個(gè)磁盤(pán)驅(qū)動(dòng)器 丟失。
從支架到集束的系統(tǒng)互連可以被配置成在集束級(jí)提供冗余度, 以便提高可靠性。
集束級(jí)互連包括集束控制器(FPGA/ASIC加SERDES),支架 控制器(FPGA/ASIC加SERDES,外部處理器和存儲(chǔ)器),機(jī)架控 制器(FPGA/ASIC力B SERDES)以及相關(guān)聯(lián)的電纜、連接器、印 刷電路板、電源和其他組件。作為一個(gè)選項(xiàng),SERDES禾卩/或處理器 功能可以集成到高級(jí)FPGA中(例如使用X川nx Virtex II pro)。
支架和集束控制器
在圖13中顯示了支架控制器以及相關(guān)聯(lián)的8個(gè)集束控制器。在 該實(shí)施方式中,支架控制器經(jīng)由光纖通道互連與機(jī)架控制器(圖 15)相連。應(yīng)該指出的是,在其他實(shí)施例中也可以使用其它類型的 控制器和互連(例如SCSI)。
在可以經(jīng)由八個(gè)SATA啟動(dòng)器端口存取的可編程磁盤(pán)RAID集 合上,支架控制器可以提供不同的RAID級(jí)支持,例如RAID 0、 1、 5及其組合。RAID功能是在固件中實(shí)施的,而加速處理則是由 硬件形式的XOR引擎和DMA引擎提供的。在這種情況下,諸如 Intel IOP321之類的配備了 XOR的CPU是可以使用的。但是,優(yōu) 選實(shí)施方式并未使用配備XOR的CPU, —般來(lái)說(shuō),任何控制器芯 片都是可以使用的。
支架控制器RAID控制單元在PCI-X總線上經(jīng)由SATA通道控
制器與集束控制器相連。對(duì)SATA通道控制器的8個(gè)SATA輸出來(lái) 說(shuō),其中每個(gè)輸出都與集束控制器數(shù)據(jù)/命令路由器設(shè)備(圖14)相 連。每個(gè)數(shù)據(jù)/命令路由器則對(duì)每個(gè)集束的14個(gè)SATA驅(qū)動(dòng)器進(jìn)行 控制。
機(jī)架控制器
機(jī)架控制器包括一個(gè)主板,該主板具有一個(gè)ServerWorks GC-LE芯片組以及四到八個(gè)PCI-X插槽。在圖15所示的實(shí)施方式中, PCI-X插槽組裝有雙端口或四端口的2G光纖通道PCI-X目標(biāo)總線 適配器(TBA)。在其他實(shí)施例中,使用其他協(xié)議的其他組件也是可 以使用的。舉例來(lái)說(shuō),在一個(gè)實(shí)施例中,其中可以將使用了 U320 的四端口支架SCSI適配器用于支架單元。
輔助數(shù)據(jù)存取
本發(fā)明的實(shí)施例還提供了一種用于為高電源效率和大容量的可 靠可擴(kuò)展數(shù)據(jù)存儲(chǔ)系統(tǒng)預(yù)備用于存取的數(shù)據(jù)單元的方法、系統(tǒng)和計(jì) 算機(jī)程序產(chǎn)品。該數(shù)據(jù)存儲(chǔ)系統(tǒng)包括多個(gè)存儲(chǔ)設(shè)備。在某些時(shí)候, 該數(shù)據(jù)存儲(chǔ)系統(tǒng)的所有存儲(chǔ)設(shè)備并未同時(shí)通電。
下文描述的發(fā)明實(shí)施例涉及的是在數(shù)據(jù)存儲(chǔ)系統(tǒng)中預(yù)備數(shù)據(jù)單 元,其中舉例來(lái)說(shuō),該數(shù)據(jù)存儲(chǔ)系統(tǒng)可以是電源管理的獨(dú)立/經(jīng)濟(jì)磁 盤(pán)冗余陣列(RAID)存儲(chǔ)系統(tǒng)或大規(guī)模非活動(dòng)/獨(dú)立磁盤(pán)陣列 (MAID)。
圖16是描述根據(jù)本發(fā)明實(shí)施例而將數(shù)據(jù)存儲(chǔ)系統(tǒng)1602與主機(jī) 1604互連的框圖。數(shù)據(jù)存儲(chǔ)系統(tǒng)1602接收來(lái)自主機(jī)1604的數(shù)據(jù) 存取請(qǐng)求或存取請(qǐng)求。該數(shù)據(jù)存儲(chǔ)系統(tǒng)1602包括多個(gè)存儲(chǔ)設(shè)備。 應(yīng)該指出的是,為了清楚起見(jiàn),在圖16中只顯示了一個(gè)主機(jī) 1604。 一般來(lái)說(shuō), 一個(gè)以上的主機(jī)可以向數(shù)據(jù)存儲(chǔ)系統(tǒng)1602發(fā)起 存取請(qǐng)求。
圖17是描述根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)存儲(chǔ)系統(tǒng)1602的圖 示。數(shù)據(jù)存儲(chǔ)系統(tǒng)1602包括存儲(chǔ)管理單元1702,存儲(chǔ)設(shè)備1704, 控制器1706,再配置管理器1708,輔助數(shù)據(jù)區(qū)域管理應(yīng)用程序接 口 (API) 1710以及數(shù)據(jù)管理器1712。存儲(chǔ)設(shè)備1704的實(shí)例包括
但不局限于硬盤(pán)驅(qū)動(dòng)器,軟盤(pán)驅(qū)動(dòng)器,磁帶驅(qū)動(dòng)器,緊湊型光盤(pán), 固態(tài)存儲(chǔ)器,光盤(pán)驅(qū)動(dòng)器或磁光驅(qū)動(dòng)器等等。此外,不同媒體驅(qū)動(dòng) 器的組合也是可以使用的。由此,在這里對(duì)于磁盤(pán)驅(qū)動(dòng)器或數(shù)據(jù)存 儲(chǔ)系統(tǒng)的引用應(yīng)該廣義地解釋成是覆蓋了任何類型的存儲(chǔ)設(shè)備。存 儲(chǔ)管理單元1702能夠?yàn)樵诖鎯?chǔ)數(shù)據(jù)存儲(chǔ)系統(tǒng)1602的過(guò)程中斷電的
存儲(chǔ)設(shè)備1704中的某個(gè)存儲(chǔ)設(shè)備上的數(shù)據(jù)單元或邏輯巻預(yù)備輔助
數(shù)據(jù)。"數(shù)據(jù)單元"或其變體指示的是所存儲(chǔ)的任何邏輯或虛擬數(shù)據(jù) 量,例如比特、字節(jié)、字、塊、文件、幀等等。該數(shù)據(jù)單元可以進(jìn) 一步拆分或劃分為邏輯塊。在數(shù)據(jù)單元中,邏輯或虛擬數(shù)據(jù)存儲(chǔ)于 邏輯塊之中。
"輔助數(shù)據(jù)"或是其變體包含了存儲(chǔ)于多個(gè)數(shù)據(jù)區(qū)域的數(shù)據(jù)。此 外,在多個(gè)數(shù)據(jù)區(qū)域中,至少有兩個(gè)數(shù)據(jù)區(qū)域處于不同設(shè)備,這些 設(shè)備可以在互不相關(guān)的情況下實(shí)施電源調(diào)整。由于至少一個(gè)存儲(chǔ)數(shù) 據(jù)區(qū)域的設(shè)備可能已知或者有可能處于較高功率和較低等待時(shí)間的 狀態(tài),因此,該處理允許使用縮短的等待時(shí)間來(lái)存取輔助數(shù)據(jù)。在 "釋放"輔助數(shù)據(jù)之前,輔助數(shù)據(jù)的移動(dòng)有可能是受限的("釘扣"數(shù) 據(jù))。該輔助數(shù)據(jù)包括但不局限于可用于數(shù)據(jù)單元的數(shù)據(jù),例如"元 數(shù)據(jù)"。舉例來(lái)說(shuō),所述元數(shù)據(jù)可以包括創(chuàng)建數(shù)據(jù)單元的時(shí)間、數(shù)據(jù)
單元大小以及與數(shù)據(jù)單元相對(duì)應(yīng)的文件的名稱。存儲(chǔ)管理單元1702 同樣能在存儲(chǔ)設(shè)備1704上存儲(chǔ)輔助數(shù)據(jù),由此該輔助數(shù)據(jù)在諸如 存儲(chǔ)設(shè)備1714之類的通電存儲(chǔ)設(shè)備上是可能得到的。在本發(fā)明的 一個(gè)實(shí)施例中,輔助數(shù)據(jù)存儲(chǔ)在存儲(chǔ)設(shè)備1704中的每個(gè)存儲(chǔ)設(shè)備 的輔助數(shù)據(jù)區(qū)域中。在本發(fā)明的例示實(shí)施例中,輔助數(shù)據(jù)區(qū)域是存 儲(chǔ)設(shè)備1704中的每個(gè)存儲(chǔ)設(shè)備的較低的首字節(jié)平均時(shí)間(low Mean Time to First Byte) (MTFB)區(qū)域,或者是實(shí)際可以即時(shí)可 存取和可用的。在本發(fā)明的不同實(shí)施例中,低MTFB區(qū)域映射到數(shù) 據(jù)存儲(chǔ)系統(tǒng)的一個(gè)或多個(gè)數(shù)據(jù)單元的一組邏輯塊。而該組邏輯塊則 會(huì)在配置數(shù)據(jù)存儲(chǔ)系統(tǒng)1602的過(guò)程中被設(shè)置。此外,存儲(chǔ)設(shè)備 1704中的每個(gè)存儲(chǔ)設(shè)備還包括用于存儲(chǔ)除輔助數(shù)據(jù)之外的數(shù)據(jù)的較 高的首字節(jié)平均時(shí)間(high Mean Time to First Byte) (MTFB)區(qū)
域。
存儲(chǔ)管理單元1702還能更新輔助數(shù)據(jù)。控制器1706與存儲(chǔ)設(shè) 備1704相耦合,該控制器通過(guò)存儲(chǔ)管理單元1702來(lái)為輔助數(shù)據(jù)更 新提供便利。在本發(fā)明的一個(gè)實(shí)施例中,在具有最近更新的輔助數(shù) 據(jù)的存儲(chǔ)設(shè)備1704中,至少一個(gè)存儲(chǔ)設(shè)備是始終通電的。再配置 管理器1708對(duì)存儲(chǔ)設(shè)備1704中的所有存儲(chǔ)設(shè)備上的輔助數(shù)據(jù)區(qū)域 進(jìn)行再配置。輔助數(shù)據(jù)區(qū)域管理API 1710確定將要在存儲(chǔ)設(shè)備 1704的輔助數(shù)據(jù)區(qū)域中管理的數(shù)據(jù)存儲(chǔ)系統(tǒng)1602的一個(gè)或多個(gè)數(shù) 據(jù)單元的邏輯塊集合。而輔助數(shù)據(jù)區(qū)域管理器1712則將輔助數(shù)據(jù) 保持在存儲(chǔ)設(shè)備1704中。
圖18是描述根據(jù)本發(fā)明一個(gè)實(shí)施例而在數(shù)據(jù)存儲(chǔ)系統(tǒng)1602中 預(yù)備用于存取的數(shù)據(jù)單元的方法的流程圖。在本發(fā)明的不同實(shí)施例 中,預(yù)備輔助數(shù)據(jù)所需要的電能是由存儲(chǔ)管理單元1702提供的。 在步驟1802,其中將會(huì)預(yù)備用于存儲(chǔ)設(shè)備上的數(shù)據(jù)單元的輔助數(shù) 據(jù)。由于存儲(chǔ)設(shè)備1704中的所有存儲(chǔ)設(shè)備并未在同一時(shí)間通電, 因此,該輔助數(shù)據(jù)是為在數(shù)據(jù)單元存取請(qǐng)求期間斷電的存儲(chǔ)設(shè)備預(yù) 備的。通過(guò)預(yù)備輔助數(shù)據(jù),可以為存取數(shù)據(jù)存儲(chǔ)系統(tǒng)1602中的數(shù) 據(jù)單元的處理提供便利。在步驟1804,輔助數(shù)據(jù)將會(huì)存儲(chǔ)在存儲(chǔ)設(shè) 備1704上,由此輔助數(shù)據(jù)有可能在通電的存儲(chǔ)設(shè)備上是可用的。 在本發(fā)明的一個(gè)實(shí)施例中,輔助數(shù)據(jù)存儲(chǔ)在存儲(chǔ)設(shè)備1704的所有 存儲(chǔ)設(shè)備中。當(dāng)數(shù)據(jù)存儲(chǔ)系統(tǒng)1602接收到關(guān)于輔助數(shù)據(jù)的存取請(qǐng) 求時(shí),該存取請(qǐng)求現(xiàn)在可以由數(shù)據(jù)存儲(chǔ)系統(tǒng)1602中的任何一個(gè)通 電存儲(chǔ)設(shè)備提供服務(wù)。但是,如果存儲(chǔ)請(qǐng)求針對(duì)的是特定數(shù)據(jù)而不 是輔助數(shù)據(jù),那么對(duì)存儲(chǔ)了該特定數(shù)據(jù)的一個(gè)或多個(gè)存儲(chǔ)設(shè)備來(lái) 說(shuō),如果這些存儲(chǔ)設(shè)備尚未通電,則為這些存儲(chǔ)設(shè)備通電。
圖19是描述根據(jù)本發(fā)明一個(gè)實(shí)施例來(lái)為數(shù)據(jù)單元預(yù)備輔助數(shù)據(jù) 的方法的流程圖。該輔助數(shù)據(jù)是在數(shù)據(jù)存儲(chǔ)單元1602處于脫機(jī)狀 態(tài)時(shí)預(yù)備的,也就是說(shuō),該數(shù)據(jù)是在數(shù)據(jù)存儲(chǔ)系統(tǒng)1602與主機(jī) 1604沒(méi)有交互的時(shí)候預(yù)備的。換言之,數(shù)據(jù)存儲(chǔ)系統(tǒng)1602并未接 收或者服務(wù)于主機(jī)1604發(fā)起的請(qǐng)求。在步驟1902,數(shù)據(jù)存儲(chǔ)系統(tǒng)1602將被配置。用于配置數(shù)據(jù)存儲(chǔ)系統(tǒng)1602的步驟是結(jié)合圖20 來(lái)詳細(xì)說(shuō)明的。圖20是描述根據(jù)本發(fā)明一個(gè)實(shí)施例來(lái)配置數(shù)據(jù)存儲(chǔ) 系統(tǒng)1602的方法的流程圖。在步驟2002,將處于數(shù)據(jù)存儲(chǔ)系統(tǒng) 1602中的每個(gè)存儲(chǔ)設(shè)備的輔助數(shù)據(jù)區(qū)域分配給數(shù)據(jù)存儲(chǔ)系統(tǒng)1602 的一個(gè)或多個(gè)數(shù)據(jù)單元的邏輯塊集合。在步驟1904,該輔助數(shù)據(jù)從 輔助數(shù)據(jù)區(qū)域收集到數(shù)據(jù)單元的邏輯塊集合。
通過(guò)配置數(shù)據(jù)存儲(chǔ)系統(tǒng)1602,可以使那些在數(shù)據(jù)存儲(chǔ)系統(tǒng) 1602的主機(jī)存取過(guò)程中可能需要用到的數(shù)據(jù)處于存儲(chǔ)設(shè)備1704的 輔助數(shù)據(jù)區(qū)域中。換句話說(shuō),輔助數(shù)據(jù)區(qū)域?qū)⒈挥成涞竭壿媺K集 合,由此該輔助數(shù)據(jù)將會(huì)借助數(shù)據(jù)單元的邏輯塊集合而始終可用。 在數(shù)據(jù)存儲(chǔ)系統(tǒng)1602的引導(dǎo)周期(boot cycle)中,數(shù)據(jù)存儲(chǔ)系統(tǒng) 1602將被配置。在本發(fā)明的一個(gè)實(shí)施例中,存儲(chǔ)管理單元1702對(duì) 數(shù)據(jù)存儲(chǔ)系統(tǒng)1602進(jìn)行配置。此外,存儲(chǔ)管理單元1702還可以在 數(shù)據(jù)存儲(chǔ)系統(tǒng)1602的未來(lái)引導(dǎo)循環(huán)中再次配置數(shù)據(jù)存儲(chǔ)系統(tǒng) 1602。例如,當(dāng)輔助數(shù)據(jù)的主機(jī)指定發(fā)生變化時(shí),該處理可以實(shí)施。
應(yīng)該指出的是,雖然輔助數(shù)據(jù)通常被描述成是"始終"可用的,但 在依照這里的描述來(lái)提供輔助數(shù)據(jù)或其他數(shù)據(jù)并且所述數(shù)據(jù)并非始 終可用的實(shí)施例中,相同的實(shí)質(zhì)性益處同樣是可以實(shí)現(xiàn)的。出于這
個(gè)原因,使用所述"始終"旨在描述這樣的情況數(shù)據(jù)在足夠時(shí)間可 用,由此對(duì)整個(gè)存儲(chǔ)系統(tǒng)性能產(chǎn)生的顯著影響是不存在、不明顯或 可忽略的。
在執(zhí)行了配置之后,在步驟1904中同步數(shù)據(jù)存儲(chǔ)系統(tǒng)1602中 的所有數(shù)據(jù)單元的輔助數(shù)據(jù)。通過(guò)對(duì)數(shù)據(jù)存儲(chǔ)系統(tǒng)1602的數(shù)據(jù)單 元進(jìn)行同步,可以使所有數(shù)據(jù)單元具有相同的輔助數(shù)據(jù)。在同步了 數(shù)據(jù)存儲(chǔ)系統(tǒng)1602之后,數(shù)據(jù)存儲(chǔ)系統(tǒng)1602可以聯(lián)機(jī)。換句話 說(shuō),數(shù)據(jù)存儲(chǔ)系統(tǒng)1602將會(huì)為主機(jī)1604的存取做好準(zhǔn)備。
當(dāng)主機(jī)1604發(fā)起存取請(qǐng)求時(shí),這時(shí)將會(huì)為其提供一個(gè)特定數(shù) 據(jù)單元,該數(shù)據(jù)單元即為存取請(qǐng)求對(duì)象。但是,對(duì)于物理存儲(chǔ)與該 數(shù)據(jù)單元相對(duì)應(yīng)的數(shù)據(jù)的存儲(chǔ)設(shè)備來(lái)說(shuō),并非所有這些存儲(chǔ)設(shè)備都
是通電的。由此,存取請(qǐng)求針對(duì)的必要數(shù)據(jù)有可能處于斷電存儲(chǔ)設(shè) 備。現(xiàn)在,控制器1706將會(huì)檢查該存取請(qǐng)求針對(duì)的是輔助數(shù)據(jù)還 是輔助數(shù)據(jù)之外的特定數(shù)據(jù)。如果該存取請(qǐng)求針對(duì)的是特定數(shù)據(jù), 那么對(duì)一個(gè)或多個(gè)存儲(chǔ)所述特定數(shù)據(jù)的存儲(chǔ)設(shè)備來(lái)說(shuō),如果該存儲(chǔ) 設(shè)備尚未通電,則為這些存儲(chǔ)設(shè)備通電。如果發(fā)現(xiàn)該存取請(qǐng)求針對(duì) 的是輔助數(shù)據(jù),那么數(shù)據(jù)單元為來(lái)自通電存儲(chǔ)設(shè)備的存取請(qǐng)求提供 服務(wù)。在這種情況下,該存取請(qǐng)求是在沒(méi)有延遲的情況下得到服務(wù) 的。這是因?yàn)檩o助數(shù)據(jù)已經(jīng)準(zhǔn)備就緒。此外,該輔助數(shù)據(jù)已經(jīng)存儲(chǔ)
在了數(shù)據(jù)存儲(chǔ)系統(tǒng)1602中可能將要通電的各個(gè)存儲(chǔ)設(shè)備上。該存
取請(qǐng)求可以是讀取操作或?qū)懭氩僮?。?duì)讀取操作來(lái)說(shuō),該存取請(qǐng)求
是從數(shù)據(jù)存儲(chǔ)系統(tǒng)1602中的任何一個(gè)通電存儲(chǔ)設(shè)備服務(wù)的。對(duì)寫(xiě) 入操作來(lái)說(shuō),該數(shù)據(jù)將會(huì)寫(xiě)入所有通電存儲(chǔ)設(shè)備的輔助數(shù)據(jù)區(qū)域。
盡管如此,這些存儲(chǔ)設(shè)備并不是始終通電的。在某個(gè)時(shí)刻通電 的存儲(chǔ)設(shè)備取決于在該時(shí)刻作為存取請(qǐng)求對(duì)象的是哪個(gè)或哪些數(shù)據(jù) 單元。由此,在執(zhí)行了寫(xiě)入操作之后,在該時(shí)刻通電的存儲(chǔ)設(shè)備已 經(jīng)修改了輔助數(shù)據(jù)。在響應(yīng)新的存取請(qǐng)求而將其他存儲(chǔ)設(shè)備從斷電 變?yōu)橥姇r(shí),在新通電的存儲(chǔ)設(shè)備上將會(huì)更新或同步那些經(jīng)過(guò)修改 的輔助數(shù)據(jù)。換句話說(shuō),在根據(jù)存取請(qǐng)求而為下一組設(shè)備通電時(shí), 輔助數(shù)據(jù)將會(huì)從一組存儲(chǔ)設(shè)備同步到下一組存儲(chǔ)設(shè)備。通過(guò)更新輔 助數(shù)據(jù),可以使新通電的存儲(chǔ)設(shè)備在相應(yīng)輔助數(shù)據(jù)區(qū)域中具有最新 的輔助數(shù)據(jù)拷貝。在本發(fā)明的一個(gè)實(shí)施例中,利用生成標(biāo)識(shí)號(hào)更新 輔助數(shù)據(jù)。在每次將通電存儲(chǔ)設(shè)備之一斷電時(shí),該生成標(biāo)識(shí)號(hào)都會(huì) 遞增。這樣做將會(huì)確保那些在下一次引導(dǎo)數(shù)據(jù)存儲(chǔ)系統(tǒng)1602之后 通電的存儲(chǔ)設(shè)備具有最新的輔助數(shù)據(jù)拷貝。此外,控制器1706還 會(huì)記錄輔助數(shù)據(jù)的每次更新。在該實(shí)施例中,如果與特定輔助數(shù)據(jù) 區(qū)域中的輔助數(shù)據(jù)相對(duì)應(yīng)的生成標(biāo)識(shí)號(hào)不是最新的,那么輔助數(shù)據(jù) 將被更新。
圖21是描述根據(jù)本發(fā)明一個(gè)實(shí)施例的控制器1706的圖示。該 控制器1706包括計(jì)數(shù)器2102和變化日志2104。在每次將通電存 儲(chǔ)設(shè)備斷電時(shí),計(jì)數(shù)器2102都會(huì)遞增與輔助數(shù)據(jù)區(qū)域相對(duì)應(yīng)的生
成標(biāo)識(shí)號(hào)。變化日志2104存儲(chǔ)的是與生成標(biāo)識(shí)號(hào)的每次遞增相對(duì)
應(yīng)的更新。由此,計(jì)數(shù)器2102和變化日志2104為輔助數(shù)據(jù)區(qū)域的 輔助數(shù)據(jù)更新提供了便利。例如,通電存儲(chǔ)設(shè)備的輔助數(shù)據(jù)區(qū)域包 括輔助數(shù)據(jù)'X',并且該數(shù)據(jù)具有生成標(biāo)識(shí)號(hào)'10'。假設(shè)生成標(biāo)識(shí)號(hào)的 最新值是'16',并且相應(yīng)輔助數(shù)據(jù)區(qū)域包括輔助數(shù)據(jù)'Y'。那么,變化 日志2104將會(huì)包含與生成標(biāo)識(shí)號(hào)從'10'到'16'的遞增相對(duì)應(yīng)的條 目,也就是與數(shù)據(jù)從'X'到'Y'的變化相對(duì)應(yīng)的條目。這樣做排除了改 寫(xiě)每個(gè)通電存儲(chǔ)設(shè)備中的輔助數(shù)據(jù)區(qū)域上的已修改輔助數(shù)據(jù)的需 要。此外,與具有已更新輔助數(shù)據(jù)的存儲(chǔ)設(shè)備相對(duì)應(yīng)的生成標(biāo)識(shí)號(hào) 將會(huì)從'10'遞增到'16'。
在數(shù)據(jù)存儲(chǔ)系統(tǒng)1602聯(lián)機(jī)期間,輔助數(shù)據(jù)并未與數(shù)據(jù)單元同 步。但是,在經(jīng)過(guò)大量時(shí)間之后,數(shù)據(jù)存儲(chǔ)系統(tǒng)1602將會(huì)聯(lián)機(jī), 并且數(shù)據(jù)存取需求有可能改變。由此可能需要通過(guò)再配置數(shù)據(jù)存儲(chǔ) 系統(tǒng)1602來(lái)更新數(shù)據(jù)單元,使之能夠有效定址那些來(lái)自輔助數(shù)據(jù) 區(qū)域的存取請(qǐng)求。
圖22是描述根據(jù)本發(fā)明一個(gè)實(shí)施例來(lái)對(duì)數(shù)據(jù)存儲(chǔ)系統(tǒng)1602進(jìn) 行再配置的方法的流程圖。該數(shù)據(jù)存儲(chǔ)系統(tǒng)1602是由再配置管理 器1708執(zhí)行再配置的。在步驟2202,對(duì)來(lái)自那些在配置過(guò)程中不 再需要的輔助數(shù)據(jù)區(qū)域的輔助數(shù)據(jù)來(lái)說(shuō),這些輔助數(shù)據(jù)將被除去或 釋放到存儲(chǔ)設(shè)備。在步驟2204,新的輔助數(shù)據(jù)區(qū)域?qū)⒈恢付ńo數(shù)據(jù) 存儲(chǔ)系統(tǒng)1602中的一個(gè)或多個(gè)數(shù)據(jù)單元的邏輯塊集合。在步驟 2206,輔助數(shù)據(jù)將被從這些數(shù)據(jù)單元的邏輯塊收集到新的輔助數(shù)據(jù) 區(qū)域。在本發(fā)明的一個(gè)實(shí)施例中,該配置可以用廠家專用命令迸行 修改。
在本發(fā)明的一個(gè)實(shí)施例中,廠家專用命令通過(guò)帶內(nèi)接口接收, 也就是說(shuō),該命令可以經(jīng)由小型計(jì)算機(jī)系統(tǒng)接口 (SCSI)而被直接 提供給再配置管理器1708。在本發(fā)明的另一個(gè)實(shí)施例中,廠家專用 命令是通過(guò)帶外接口接收的,也就是說(shuō),該命令是由再配置管理器 1708經(jīng)由諸如局域網(wǎng)和廣域網(wǎng)之類的網(wǎng)絡(luò)接收的。在修改了邏輯塊 集合之后,輔助數(shù)據(jù)區(qū)域中的輔助數(shù)據(jù)將會(huì)同步。通過(guò)同步該輔助
數(shù)據(jù)區(qū)域,可以使所有輔助數(shù)據(jù)區(qū)域具有相同的輔助數(shù)據(jù)。在本發(fā) 明的不同實(shí)施例中,通過(guò)對(duì)數(shù)據(jù)存儲(chǔ)系統(tǒng)1602執(zhí)行再配置,可以 釋放那些以后不再需要使用的輔助數(shù)據(jù)。此外,在輔助數(shù)據(jù)區(qū)域中 還會(huì)添加或釘扣新的輔助數(shù)據(jù)。
此外,根據(jù)本發(fā)明的一個(gè)實(shí)施例,存儲(chǔ)設(shè)備1704的存儲(chǔ)設(shè)備 集合將被保持。該存儲(chǔ)設(shè)備集合將會(huì)保持通電,以便保持所述數(shù) 據(jù)。另外,存儲(chǔ)設(shè)備集合中的存儲(chǔ)設(shè)備還會(huì)以循環(huán)方式旋轉(zhuǎn),以便
提升數(shù)據(jù)存儲(chǔ)系統(tǒng)1702中的存儲(chǔ)設(shè)備1704的壽命。輔助數(shù)據(jù)區(qū)域 管理器1712對(duì)哪些存儲(chǔ)設(shè)備保持通電進(jìn)行控制。在存儲(chǔ)設(shè)備集合 中,通電存儲(chǔ)設(shè)備與斷電存儲(chǔ)設(shè)備是周期性交換的。換句話說(shuō),某 些當(dāng)前斷電的存儲(chǔ)設(shè)備將被通電,以便替換某些當(dāng)前通電的存儲(chǔ)設(shè) 備。然后,這些當(dāng)前通電的存儲(chǔ)設(shè)備將會(huì)斷電。在本發(fā)明的一個(gè)實(shí) 施例中,最小數(shù)量的通電存儲(chǔ)設(shè)備將會(huì)與斷電存儲(chǔ)設(shè)備交換。在本 發(fā)明的另一個(gè)實(shí)施例中,用于周期性交換存儲(chǔ)設(shè)備的周期是由自監(jiān) 視、分析和報(bào)告技術(shù)(SMART)數(shù)據(jù)提供的。所述SMART數(shù)據(jù)保 持了為存儲(chǔ)設(shè)備集合中的每個(gè)存儲(chǔ)設(shè)備通電的時(shí)間記錄。在本發(fā)明 的另一個(gè)實(shí)施例,存儲(chǔ)設(shè)備集合包括那些在最短時(shí)間通電的存儲(chǔ)設(shè) 備,其中該最短時(shí)間與為存儲(chǔ)設(shè)備1704中的其他存儲(chǔ)設(shè)備通電的 時(shí)間相關(guān)。
上述實(shí)施例將會(huì)確保在接收到存取請(qǐng)求時(shí),數(shù)據(jù)存儲(chǔ)系統(tǒng)的存 儲(chǔ)管理單元需要的輔助數(shù)據(jù)有可能在通電存儲(chǔ)設(shè)備上是可用的。此 外,由于預(yù)備用于存取的數(shù)據(jù)單元的處理不需要來(lái)自數(shù)據(jù)存儲(chǔ)系統(tǒng) 的附加電能,因此,這些實(shí)施例是在電能預(yù)算以內(nèi)工作的。所述電 能是由用于預(yù)備數(shù)據(jù)單元的存儲(chǔ)管理單元提供的,或者也可以在后 臺(tái)工作模式中得到。在聯(lián)機(jī)工作模式中,輔助數(shù)據(jù)是從通電存儲(chǔ)設(shè) 備存取的。這些方法和系統(tǒng)能夠檢測(cè)并且隨后保持?jǐn)?shù)據(jù)存儲(chǔ)系統(tǒng)中 的降級(jí)存儲(chǔ)設(shè)備。此外,當(dāng)存儲(chǔ)管理單元在預(yù)定時(shí)間空閑時(shí),這些 方法和系統(tǒng)還會(huì)確保維護(hù)處理得以執(zhí)行。
雖然在這里結(jié)合本發(fā)明的具體實(shí)施例而對(duì)其進(jìn)行了描述,但是 這些實(shí)施例是為了描述而不是限制本發(fā)明,舉例來(lái)說(shuō),參數(shù)的具體
數(shù)值和范圍顯然可以與這里描述的數(shù)值和范圍不同。對(duì)p、 c、 r、 m、 s、 t等閾值參數(shù)來(lái)說(shuō),這些閾值參數(shù)的值既可以在知道了新實(shí)
驗(yàn)數(shù)據(jù)時(shí)改變,也可以在首選項(xiàng)或總體系統(tǒng)特性變化時(shí)改變,還可 以為了實(shí)現(xiàn)改進(jìn)或預(yù)期的性能而改變。雖然在這里給出了用于計(jì)算 數(shù)值和定義變量的具體公式,但是用于獲取數(shù)值、變量或參數(shù)的其 他方式也是可以使用的。
雖然在這里使用了"存儲(chǔ)設(shè)備"、"磁盤(pán)驅(qū)動(dòng)器"等術(shù)語(yǔ),但是任何 類型的存儲(chǔ)單元都適于與本發(fā)明結(jié)合工作。例如,在這里可以使用
盤(pán)驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器、隨機(jī)存取存儲(chǔ)器(RAM)等等。此外,不 同的當(dāng)前和未來(lái)存儲(chǔ)技術(shù)也是可以使用的,例如那些使用磁性、固 態(tài)、光學(xué)、生物電、納米工程或其他技術(shù)創(chuàng)建的存儲(chǔ)技術(shù)。另外, 不同的存儲(chǔ)系統(tǒng)排列和架構(gòu)同樣是可以使用的。
存儲(chǔ)單元既可以位于計(jì)算機(jī)內(nèi)部,也可以位于計(jì)算機(jī)外部與計(jì) 算機(jī)相連的單獨(dú)外殼中。對(duì)這里論述的系統(tǒng)來(lái)說(shuō),其存儲(chǔ)單元、控 制器和其他組件既可以包含于單個(gè)位置,也可以分離在不同位置。 這些組件可以通過(guò)任何適當(dāng)手段相互連接,例如網(wǎng)絡(luò)、通信鏈路或 其他技術(shù)。雖然在這里將具體功能論述成是工作或駐留于特定的位 置和時(shí)間,但是一般來(lái)說(shuō),這些功能是可以在不同位置和時(shí)間提供 的。例如,諸如數(shù)據(jù)保護(hù)步驟之類的功能可以在分層控制器的不同 等級(jí)提供。此外,任何類型的RAID或RAIV方案或配置都是可以使 用的。
為了全面理解本發(fā)明的實(shí)施例,在這里的描述中提供了眾多具 體細(xì)節(jié),例如組件和/或方法的實(shí)例。但是,本領(lǐng)域技術(shù)人員將會(huì)意 識(shí)到,本發(fā)明的實(shí)施例既可以在沒(méi)有一個(gè)或多個(gè)具體細(xì)節(jié)的情況下 實(shí)施,也可以結(jié)合其他設(shè)備、系統(tǒng)、配件、方法、組件、材料、部 件等等來(lái)實(shí)現(xiàn)。為了避免與本發(fā)明的實(shí)施例特性相混淆,在其他實(shí) 例中并未具體顯示以及詳細(xì)描述那些眾周知的結(jié)構(gòu)、材料或操 作。
"處理器"或"處理"包含了任何人類、硬件和/或軟件系統(tǒng)、機(jī)制或 是用于處理數(shù)據(jù)、信號(hào)或其他信息的組件。處理器既可以包括具有
通用中央處理器多個(gè)處理單元、用于實(shí)現(xiàn)功能的專用電路的系統(tǒng), 也可以包括其他系統(tǒng)。所述處理并不需要受地理位置限制或是具有 時(shí)間限制。舉例來(lái)說(shuō),處理器可以采用"實(shí)時(shí)"、"脫機(jī)"、"批處理模 式"等形式來(lái)執(zhí)行其功能。此外,某些處理部分可以在不同時(shí)間和不 同位置由不同(或相同)處理系統(tǒng)來(lái)執(zhí)行。
在整個(gè)說(shuō)明書(shū)中,關(guān)于"一個(gè)實(shí)施例"、"某個(gè)實(shí)施例"或"具體實(shí)施 例"的引用意味著在本發(fā)明的至少一個(gè)實(shí)施例中包含了結(jié)合該實(shí)施例 描述的特定特征、結(jié)構(gòu)或特性,但是所述特征、結(jié)構(gòu)或特性不必包 含在所有的實(shí)施例中。由此在整個(gè)說(shuō)明書(shū)中,處于不同位置的短語(yǔ) "在一個(gè)實(shí)施例中"、"在某個(gè)實(shí)施例中"或"在某個(gè)具體實(shí)施例中"不必 指示相同的實(shí)施例。此外,本發(fā)明任何一個(gè)具體實(shí)施例的特定特 征、結(jié)構(gòu)或特性都可以采用任何適當(dāng)?shù)姆绞脚c一個(gè)或多個(gè)其他實(shí)施 例相結(jié)合。應(yīng)該理解的是,對(duì)這里描述和圖示的發(fā)明實(shí)施例來(lái)說(shuō), 根據(jù)這里的教導(dǎo),這些實(shí)施例的其他變化和修改都是可行的,并且 這些變化和修改都被認(rèn)為是本發(fā)明的實(shí)質(zhì)和范圍的一部分。
此外還應(yīng)該預(yù)期的是,附圖中描述的一個(gè)或多個(gè)部件可以采用 更為分離或集成的方式來(lái)實(shí)施,在某些情況下,如果根據(jù)特定應(yīng)用 而被確定有益,那么所述部件甚至可以移除或是不工作。另外,在 機(jī)器可讀介質(zhì)中還可以存儲(chǔ)程序或代碼,以便允許計(jì)算就執(zhí)行任何 一個(gè)上述方法,而實(shí)施所述程序或代碼的處理同樣處于本發(fā)明的實(shí) 質(zhì)和范圍以內(nèi)。
作為補(bǔ)充,除非以別的方式具體注釋,否則應(yīng)該將附圖中的信 號(hào)箭頭視為例示性而不是限制性的。此外,除非以別的方式加以指 示,否則這里使用的術(shù)語(yǔ)"或"通常旨在表示"和/或"。組件或步驟的組 合同樣是以所注釋的方式來(lái)看待的,其中這些術(shù)語(yǔ)被預(yù)見(jiàn)為表示分 離或組合能力是不完全的。
對(duì)在這里的描述以及后續(xù)的全部權(quán)利要求中使用的"一"、"一個(gè)" 和"該"來(lái)說(shuō),除非在上下文中以別的方式明確指示,否則所述"一"、 "一個(gè)"和"該"將會(huì)包括多個(gè)引用。此外,對(duì)在這里的描述和后續(xù)權(quán)利 要求全文中使用的"在......之中"來(lái)說(shuō),除非在上下文中以別的方式明
確指示,否則所述"在......之中"的含義包含了"在......之中"和"在......
之上"。
上文中關(guān)于本發(fā)明圖示實(shí)施例的描述包含了在摘要中描述的內(nèi) 容,這些描述并不是為了窮舉本發(fā)明或者將本發(fā)明局限于這里公開(kāi) 的確切形式。雖然在這里完全出于例示目的而對(duì)本發(fā)明的具體實(shí)施 例和實(shí)例進(jìn)行了描述,但是正如相關(guān)領(lǐng)域的技術(shù)人員所了解和預(yù)見(jiàn) 的那樣,在本發(fā)明的實(shí)質(zhì)和范圍以內(nèi),各種等價(jià)的修改都是可行 的。如所示,根據(jù)上文中關(guān)于本發(fā)明圖示實(shí)施例的描述,在這里可 以對(duì)本發(fā)明進(jìn)行這些修改,并且這些修改將會(huì)包含在本發(fā)明的實(shí)質(zhì) 和范圍以內(nèi)。
由此,雖然在這里參考本發(fā)明的特定實(shí)施例而對(duì)其進(jìn)行了描 述,但在前文的公開(kāi)中預(yù)期了眾多的修改、各種變化和替換形式。 應(yīng)該預(yù)期的是,在某些實(shí)例中,本發(fā)明實(shí)施例的某些特征是在沒(méi)有 相應(yīng)地使用其他特征的情況下使用的,而這并未脫離所闡述的本發(fā) 明的范圍和實(shí)質(zhì)。由此,在這里可以執(zhí)行眾多修改,以使特定的情 形或材料與本發(fā)明的基本范圍和實(shí)質(zhì)相適應(yīng)。本發(fā)明并不局限于后 續(xù)權(quán)利要求中使用的特定術(shù)語(yǔ)和/或被認(rèn)為是實(shí)施本發(fā)明的最佳模式 而被公開(kāi)的特定實(shí)施例,相反,本發(fā)明將會(huì)包含落入附加權(quán)利要求 范圍以內(nèi)的任何一個(gè)實(shí)施例和等價(jià)物。
在上文中已經(jīng)結(jié)合具體實(shí)施例而對(duì)本發(fā)明提供的益處和優(yōu)點(diǎn)進(jìn) 行了描述。對(duì)這些益處和優(yōu)點(diǎn)以及可能導(dǎo)致產(chǎn)生這些益處和優(yōu)點(diǎn)或 是使之更為顯著的任何部件或限制來(lái)說(shuō),它們不應(yīng)該解釋成是任何 一個(gè)或所有權(quán)利要求的重要、必要或本質(zhì)特征。這里使用的術(shù)語(yǔ)"包 括"、"包含"或是其任何變體應(yīng)該被解釋成是非排它地包含了跟隨在 這些術(shù)語(yǔ)之后的部件或限制。相應(yīng)的,包含一組部件的系統(tǒng)、方法 或其他實(shí)施例并不局限于這些部件,而是可以包括并未明確列舉或 是要求保護(hù)的實(shí)施例所固有的其他部件。
雖然在這里參考特定實(shí)施例而對(duì)本發(fā)明進(jìn)行了描述,但是應(yīng)該 理解,這些實(shí)施例是例示性的,并且本發(fā)明的范圍并不局限于這些 實(shí)施例。針對(duì)上述實(shí)施例的眾多變化、修改、補(bǔ)充和改進(jìn)都是可行
的。此外還可以預(yù)期,這些變化、修改、補(bǔ)充和改進(jìn)全都落入后續(xù) 權(quán)利要求內(nèi)部詳述的本發(fā)明的范圍以內(nèi)。
權(quán)利要求
1.一種用于在數(shù)據(jù)存儲(chǔ)系統(tǒng)中預(yù)備用于存取的數(shù)據(jù)單元的方法,該數(shù)據(jù)存儲(chǔ)系統(tǒng)包含了多個(gè)具有數(shù)據(jù)單元的存儲(chǔ)設(shè)備,其中并非將所有存儲(chǔ)設(shè)備在相同時(shí)間通電,該方法包括為在數(shù)據(jù)單元存取請(qǐng)求期間將要斷電的存儲(chǔ)設(shè)備上的數(shù)據(jù)單元預(yù)備輔助數(shù)據(jù);以及將該輔助數(shù)據(jù)存儲(chǔ)在多個(gè)存儲(chǔ)設(shè)備上,由此當(dāng)數(shù)據(jù)單元是存取請(qǐng)求的對(duì)象時(shí),該輔助數(shù)據(jù)在通電存儲(chǔ)設(shè)備上始終可用。
2. 權(quán)利要求1的方法,其中該輔助數(shù)據(jù)存儲(chǔ)在所有存儲(chǔ)設(shè)備上。
3. 權(quán)利要求l的方法,還包括使用存儲(chǔ)設(shè)備上的輔助數(shù)據(jù)區(qū)域來(lái)存儲(chǔ)輔助數(shù)據(jù);以及 更新輔助數(shù)據(jù)。
4. 權(quán)利要求3的方法,還包括使用變化日志和生成標(biāo)識(shí)號(hào)來(lái)更新輔助數(shù)據(jù)。
5. 權(quán)利要求4的方法,其中在每次更新輔助數(shù)據(jù)時(shí)都遞增生成 標(biāo)識(shí)號(hào)。
6. 權(quán)利要求4的方法,其中當(dāng)生成標(biāo)識(shí)號(hào)并非最新時(shí),在輔助 數(shù)據(jù)區(qū)域上更新輔助數(shù)據(jù)。
7. 權(quán)利要求4的方法,其中變化日志包括與生成標(biāo)識(shí)號(hào)的每一 次遞增相對(duì)應(yīng)的更新。
8. 權(quán)利要求3的方法,其中當(dāng)根據(jù)存取請(qǐng)求將下一個(gè)存儲(chǔ)設(shè)備 集合通電時(shí),輔助數(shù)據(jù)將會(huì)從一個(gè)存儲(chǔ)設(shè)備集合更新到所述下一個(gè) 存儲(chǔ)設(shè)備集合。
9. 權(quán)利要求3的方法,其中更新輔助數(shù)據(jù)包括 當(dāng)存取請(qǐng)求是寫(xiě)入操作時(shí),修改數(shù)據(jù)存儲(chǔ)系統(tǒng)中的所有通電存儲(chǔ)設(shè)備上的輔助數(shù)據(jù)。
10. 權(quán)利要求1的方法,其中當(dāng)存取請(qǐng)求是讀取操作時(shí),從數(shù) 據(jù)存儲(chǔ)系統(tǒng)的通電存儲(chǔ)設(shè)備之一讀取輔助數(shù)據(jù)。
11. 權(quán)利要求l的方法,其中從主機(jī)接收存取請(qǐng)求。
12. 權(quán)利要求l的方法,其中為數(shù)據(jù)單元預(yù)備輔助數(shù)據(jù)包括 在數(shù)據(jù)存儲(chǔ)系統(tǒng)的引導(dǎo)周期中配置數(shù)據(jù)存儲(chǔ)系統(tǒng);以及 將數(shù)據(jù)存儲(chǔ)系統(tǒng)的所有數(shù)據(jù)單元中的輔助數(shù)據(jù)進(jìn)行同步。
13. 權(quán)利要求12的方法,其中配置數(shù)據(jù)存儲(chǔ)系統(tǒng)包括 將數(shù)據(jù)存儲(chǔ)系統(tǒng)中的每一個(gè)存儲(chǔ)設(shè)備上的輔助數(shù)據(jù)區(qū)域分配給數(shù)據(jù)存儲(chǔ)系統(tǒng)的一個(gè)或多個(gè)數(shù)據(jù)單元的邏輯塊集合;以及將來(lái)自輔助數(shù)據(jù)區(qū)域的輔助數(shù)據(jù)收集到一個(gè)或多個(gè)數(shù)據(jù)單元的 邏輯塊集合。
14. 權(quán)利要求12的方法,還包括 對(duì)所有存儲(chǔ)設(shè)備上的輔助數(shù)據(jù)區(qū)域進(jìn)行再配置。
15. 權(quán)利要求14的方法,其中對(duì)輔助數(shù)據(jù)區(qū)域執(zhí)行再配置包括從不再處于配置處理的輔助數(shù)據(jù)區(qū)域中去除輔助數(shù)據(jù); 將新的輔助數(shù)據(jù)區(qū)域分配給一個(gè)或多個(gè)數(shù)據(jù)單元的邏輯塊集 合;以及將來(lái)自一個(gè)或多個(gè)數(shù)據(jù)單元的邏輯塊集合的數(shù)據(jù)收集到新的輔 助數(shù)據(jù)區(qū)域。
16. 權(quán)利要求15的方法,其中對(duì)輔助數(shù)據(jù)區(qū)域進(jìn)行再配置還包括通過(guò)使用經(jīng)由帶外和帶內(nèi)接口之一接收的廠家專用命令來(lái)修改 邏輯塊集合。
17. 權(quán)利要求16的方法,還包括同步輔助數(shù)據(jù)區(qū)域中的數(shù)據(jù)。
18. 權(quán)利要求1的方法,還包括當(dāng)數(shù)據(jù)存儲(chǔ)系統(tǒng)的存儲(chǔ)管理單元在預(yù)定時(shí)間內(nèi)處于空閑時(shí),在 多個(gè)存儲(chǔ)設(shè)備中的存儲(chǔ)設(shè)備集合上以后臺(tái)模式保持輔助數(shù)據(jù)。
19. 權(quán)利要求18的方法,其中保持輔助數(shù)據(jù)包括以后臺(tái)模式來(lái)為存儲(chǔ)設(shè)備集合通電。
20. 權(quán)利要求19的方法,其中為存儲(chǔ)設(shè)備集合通電的處理包 括周期性交換斷電存儲(chǔ)設(shè)備和存儲(chǔ)設(shè)備集合中的通電存儲(chǔ)設(shè)備。
21. 權(quán)利要求20的方法,其中由自監(jiān)視、分析和報(bào)告技術(shù)(SMART)數(shù)據(jù)提供用于周期性交換存儲(chǔ)設(shè)備和將要交換的存儲(chǔ)設(shè) 備的周期,其中該SMART數(shù)據(jù)保持了存儲(chǔ)設(shè)備集合中的每個(gè)存儲(chǔ) 設(shè)備通電的時(shí)間記錄。
22. 權(quán)利要求20的方法,存儲(chǔ)設(shè)備集合包括具有最小通電時(shí)間 的存儲(chǔ)設(shè)備。
23. —種數(shù)據(jù)存儲(chǔ)系統(tǒng),包括具有數(shù)據(jù)單元的多個(gè)存儲(chǔ)設(shè)備,其中并非將所有存儲(chǔ)設(shè)備在相 同時(shí)間通電;存儲(chǔ)管理單元,該存儲(chǔ)管理單元能夠執(zhí)行下列處理 為在數(shù)據(jù)單元存取請(qǐng)求期間將要斷電的存儲(chǔ)設(shè)備上的數(shù)據(jù)單元 預(yù)備輔助數(shù)據(jù);以及將該輔助數(shù)據(jù)存儲(chǔ)在多個(gè)存儲(chǔ)設(shè)備上,由此當(dāng)數(shù)據(jù)單元是存取 請(qǐng)求的對(duì)象時(shí),該輔助數(shù)據(jù)在通電存儲(chǔ)設(shè)備上始終可用。
24. 權(quán)利要求23的數(shù)據(jù)存儲(chǔ)系統(tǒng),還包括與多個(gè)存儲(chǔ)設(shè)備中的 每一個(gè)存儲(chǔ)設(shè)備相耦合的控制器,其中該控制器包括計(jì)數(shù)器,用于遞增生成標(biāo)識(shí)號(hào),其中在每次更新輔助數(shù)據(jù)區(qū)域 時(shí)遞增該生成標(biāo)識(shí)號(hào);以及變化日志,用于存儲(chǔ)與生成標(biāo)識(shí)號(hào)的每次遞增相對(duì)應(yīng)的更新。
25. 權(quán)利要求24的數(shù)據(jù)存儲(chǔ)系統(tǒng),其中在包含輔助數(shù)據(jù)最近更 新的多個(gè)存儲(chǔ)設(shè)備中的至少一個(gè)存儲(chǔ)設(shè)備是始終通電的。
26. 權(quán)利要求23的數(shù)據(jù)存儲(chǔ)系統(tǒng),還包括用于對(duì)所有存儲(chǔ)設(shè)備 上的輔助數(shù)據(jù)區(qū)域進(jìn)行再配置的再配置管理器。
27. 權(quán)利要求23的數(shù)據(jù)存儲(chǔ)系統(tǒng),還包括用于確定將要在輔助 數(shù)據(jù)區(qū)域中管理的邏輯塊的輔助數(shù)據(jù)區(qū)域管理應(yīng)用程序接口 。
28. 權(quán)利要求23的數(shù)據(jù)存儲(chǔ)系統(tǒng),還包括輔助數(shù)據(jù)區(qū)域管理 器,用于當(dāng)存儲(chǔ)管理單元在預(yù)定時(shí)間內(nèi)處于空閑時(shí)以后臺(tái)模式在多 個(gè)存儲(chǔ)設(shè)備上保持輔助數(shù)據(jù)。
29. 權(quán)利要求23的數(shù)據(jù)存儲(chǔ)系統(tǒng),其中輔助數(shù)據(jù)區(qū)域是多個(gè)存 儲(chǔ)設(shè)備中的每一個(gè)存儲(chǔ)設(shè)備的較低的首字節(jié)平均時(shí)間(MTFB)區(qū) 域。
30. 權(quán)利要求29的數(shù)據(jù)存儲(chǔ)系統(tǒng),其中低MTFB區(qū)域映射到邏 輯塊集合,其中在數(shù)據(jù)存儲(chǔ)系統(tǒng)配置過(guò)程中設(shè)置該邏輯塊集合。
31. —種設(shè)備,包括 用于執(zhí)行指令的處理器;以及 機(jī)器可讀介質(zhì),包括用于為在數(shù)據(jù)單元存取請(qǐng)求期間將要斷電的存儲(chǔ)設(shè)備上的數(shù)據(jù) 單元預(yù)備輔助數(shù)據(jù)的一個(gè)或多個(gè)指令;以及用于將該輔助數(shù)據(jù)存儲(chǔ)在多個(gè)存儲(chǔ)設(shè)備上的一個(gè)或多個(gè)指令, 由此當(dāng)數(shù)據(jù)單元是存取請(qǐng)求的對(duì)象時(shí),該輔助數(shù)據(jù)在通電存儲(chǔ)設(shè)備 上始終可用。
32. —種機(jī)器可讀介質(zhì),包括可以由處理器執(zhí)行而在數(shù)據(jù)存儲(chǔ) 系統(tǒng)中預(yù)備用于存取的數(shù)據(jù)單元的指令,該數(shù)據(jù)存儲(chǔ)系統(tǒng)包含了多 個(gè)具有數(shù)據(jù)單元的存儲(chǔ)設(shè)備,其中并非將所有存儲(chǔ)設(shè)備在相同時(shí)間 通電,該機(jī)器可讀介質(zhì)包括用于為在數(shù)據(jù)單元存取請(qǐng)求期間將要斷電的存儲(chǔ)設(shè)備上的數(shù)據(jù) 單元預(yù)備輔助數(shù)據(jù)的一個(gè)或多個(gè)指令;以及用于將該輔助數(shù)據(jù)存儲(chǔ)在多個(gè)存儲(chǔ)設(shè)備上的一個(gè)或多個(gè)指令, 由此當(dāng)數(shù)據(jù)單元是存取請(qǐng)求的對(duì)象時(shí),該輔助數(shù)據(jù)在通電存儲(chǔ)設(shè)備 上是始終可用的。
全文摘要
在這里公開(kāi)的是一種預(yù)備用于存取的數(shù)據(jù)單元的方法。數(shù)據(jù)存儲(chǔ)系統(tǒng)包括多個(gè)具有數(shù)據(jù)單元的存儲(chǔ)設(shè)備。在同一時(shí)間,該數(shù)據(jù)存儲(chǔ)系統(tǒng)中的所有存儲(chǔ)設(shè)備并沒(méi)有全部通電。該方法包括預(yù)備和存儲(chǔ)輔助數(shù)據(jù)。該輔助數(shù)據(jù)是為在數(shù)據(jù)單元存取請(qǐng)求期間將會(huì)斷電的存儲(chǔ)設(shè)備上的數(shù)據(jù)單元預(yù)備的。該輔助數(shù)據(jù)存儲(chǔ)在存儲(chǔ)設(shè)備上,由此當(dāng)數(shù)據(jù)單元是存取請(qǐng)求的對(duì)象時(shí),該輔助數(shù)據(jù)在通電存儲(chǔ)設(shè)備上有可能是可用的。
文檔編號(hào)G06F1/28GK101351760SQ200680050118
公開(kāi)日2009年1月21日 申請(qǐng)日期2006年12月26日 優(yōu)先權(quán)日2005年12月30日
發(fā)明者杰弗里·卡森斯, 艾克·顧哈, 金·B·禮 申請(qǐng)人:科潘系統(tǒng)公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1