專利名稱:存儲系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于減少將數(shù)據(jù)存儲在至少 一個硬盤設(shè)備以及其它存儲介質(zhì) 的存儲控制裝置中的功率消耗的技術(shù)。
背景技術(shù):
近來,在諸如數(shù)據(jù)中心之類的信息商務(wù)的現(xiàn)場,減少存儲系統(tǒng)(存儲控制 裝置和硬盤設(shè)備等的總稱)中的TCO( Total Cost of Ownership,整體擁有成本) 一直被認為更為重要。此外,需要長期且安全地存^渚數(shù)據(jù)。例如,依照諸如個 人信息保護法之類的法律規(guī)定,日本的金融機構(gòu)和醫(yī)療機構(gòu)必須積累它們的文 件數(shù)據(jù)而不刪除。
在這種背景基礎(chǔ)上,存儲系統(tǒng)應(yīng)高度可靠且大容量。 一般,在使用硬盤驅(qū) 動器(在下文稱為HDD)的具有大容量的存儲系統(tǒng)中,功率消耗與存儲介質(zhì) 容量成比例增長。具體地,具有大容量存儲系統(tǒng)會導(dǎo)致包括電費在內(nèi)的TCO 的增長。
鑒于上述缺點,當(dāng)需要積累大量的信息,如有必要,需要長期保存該數(shù)據(jù) 信息時,考慮到對存儲的數(shù)據(jù)的各種要求,通過恰當(dāng)?shù)貙?shù)據(jù)存儲在一個合適 的存儲位置,可以有效地減少整個存儲系統(tǒng)的TCO,尤其是由功率消耗量代 表的運行成本。
另外,近來,作為非易失性存儲器,閃存器一直受到關(guān)注。 一般地,與 HDD相比,閃存器減小功率消耗至幾十分之一,并可以提供高速讀取。由于 沒有HDD所需的驅(qū)動機構(gòu),閃存器可以小型化,并一般具有高的抗故障性。
然而,由于用于保存信息的單元的物理特性,閃存器有寫入次數(shù)的限制。 為了應(yīng)對該限制,通過采用所謂的平均讀寫(WARE LEVELING )調(diào)整,其中 提供一種控制來保持單元位置和上位設(shè)備表示的地址的對應(yīng),并使寫入各個單元的次數(shù)平均,來提高了閃存器的可重寫次數(shù)。
在下文中,作為保持信息的元件而使用的閃存器、將包括用于進行平均讀 寫調(diào)整和對于上位設(shè)備的協(xié)議處理的機構(gòu)的閃存器稱為"閃存器設(shè)備"。
盡管在元件級的存儲區(qū)域的分布方面,上述技術(shù)在對閃存器設(shè)備的寫入次 數(shù)的限制方面提高了效率,但是,閃存器設(shè)備的寫入次數(shù)的限制依然存在。閃
存器有另一缺點,即當(dāng)需要在寫入新數(shù)據(jù)前刪除數(shù)據(jù)時,寫入速度降至與HDD 相同的速度。
為了將具有上述特性的閃存器應(yīng)用于存儲系統(tǒng),作為傳統(tǒng)技術(shù)中對所存儲 的數(shù)據(jù)的各種要求,從寫入性能以及可靠性或成本的觀點出發(fā),在專利文獻l (見以下專利文獻1 )中公開了在適當(dāng)?shù)拇鎯ξ恢么鎯?shù)據(jù)的技術(shù)。
為了實現(xiàn)較低功率消耗的存儲系統(tǒng),介紹了與MAID(Massive Array of Idle Disks,大規(guī)模非活動磁盤陣列)相關(guān)的技術(shù),如在美國專利申請公開號為 2004/0054939和專利文獻2 (見以下的專利文獻2 )中所公開的^支術(shù)。
然而,因為專利文獻1中公開的技術(shù)未考慮到各個存儲介質(zhì)間的重寫次 數(shù)、寫入速度和功率消耗的差異,所以對整個存儲系統(tǒng)進行適當(dāng)?shù)目刂拼嬖诤?多困難。在美國專利申請公開號為2004/0054939和專利文獻2中的存儲系統(tǒng) 中,MAID的可應(yīng)用目的地受到限制,因此,在更低系統(tǒng)功率消耗和系統(tǒng)的高 性能的維持兩者間保持折衷存在很多困難。
專利文獻1: John Wilkes, Richard Golding, Carl Staelin, and Tim Sullivan, "The HP AutoRAID hierarchical storage system", Transactions on Computer Systems (TOCS) archive, America ,ACM( Association for Computing Machinery ), February 1996, Volume 14, Issue 1 , ISSN:0734-2071, Pages: 108-136
專利文獻2: Dennis Colarelli, Dirk Grunwald, and Michael Neufeld, "The Case for Massive Arrays of Idle Disks (MAID)", [online], January 7, 2002, USENIX (U.S.A.), (Searched on August 5, 2005)
<URL:http:〃www.usenix.org/publications/library/proceedings/fast02/wips/col arelii.pdf^
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明的目的在于,在存儲系統(tǒng)的低功率消耗和高性能的維持之間實現(xiàn)成功的平衡。
本發(fā)明涉及一種存儲系統(tǒng)。該存儲系統(tǒng)包括多個磁盤設(shè)備,存儲從主機
計算機接收的數(shù)據(jù);
多個非易失性設(shè)備,存儲從主機計算機接收的數(shù)據(jù);以及
處理單元,控制從主機計算機到與多個磁盤設(shè)備和多個非易失性設(shè)備相對 應(yīng)的多個邏輯巻的讀/寫請求,并且管理與多個邏輯巻相對應(yīng)的多個磁盤設(shè)備 和多個非易失性設(shè)備的存儲層和多個磁盤設(shè)備和多個非易失性設(shè)備的每一個 的屬性信息之間的關(guān)系,
其中處理單元基于用戶策略將存儲層的第一存4諸層確定為源存儲層,以及 將存儲層的第二存儲層確定為目的存儲層,并且基于用戶策略將存儲在第一存 儲層的至少 一個邏輯巻中的數(shù)據(jù)轉(zhuǎn)移到第二存儲層的至少 一個邏輯巻。
在結(jié)合附圖閱讀下面的說明書和權(quán)利要求的基礎(chǔ)上,本發(fā)明的其它方面、 特征以及優(yōu)點將會變得更為明白。
圖1是表示根據(jù)包括存儲系統(tǒng)S的本發(fā)明的一個實施方式的整體構(gòu)成的框圖。
圖2是表示通道控制單元104的結(jié)構(gòu)的框圖。 圖3是表示FM控制單元106的結(jié)構(gòu)的框圖。 圖4是表示FM控制單元106的另 一結(jié)構(gòu)的框圖。 圖5是表示FM控制單元106的另一結(jié)構(gòu)的框圖。
圖6是表示存在多個存儲控制裝置101的整體構(gòu)成的一個說明例中的信息 流的圖。
圖7是表示邏輯巻管理表700的一個例子的圖。 圖8是表示使用狀態(tài)管理表800的一個例子的圖。 圖9是表示讀/寫次數(shù)管理表900的一個例子的圖。 圖10是表示設(shè)備類型管理表1000的一個例子的圖。 圖11A是表示MP單元220在HDD110和FM控制單元106的FM306之 間進行數(shù)據(jù)轉(zhuǎn)移的判定處理的一個例子的流程圖。
圖11B是表示用于在HDD110和FM控制單元106中的FM306之間進行數(shù)據(jù)轉(zhuǎn)移的判定處理的 一個例子的流程圖。
圖12是表示當(dāng)在數(shù)據(jù)轉(zhuǎn)移操作期間從主機102收到讀請求時,MP單元 220的處理的 一個例子的流矛呈圖。
圖13時表示當(dāng)在數(shù)據(jù)轉(zhuǎn)移操作期間,從主機102接收到寫請求時,MP ; 單元220的處理一個例子的流程圖。
圖14是表示在通過使用圖6中所示的管理終端601,對整個存儲系統(tǒng)S 進行功率消耗管理的情況下所使用的整體信息表1400的一個例子的圖。
具體實施例方式
下面,參照附圖,對如下根據(jù)本發(fā)明的一個實施方式的存儲系統(tǒng)S進行詳 i 細說明。
圖1是表示包括一個存儲系統(tǒng)的本發(fā)明的一個實施方式的整體結(jié)構(gòu)的輪 廓的框圖。存儲系統(tǒng)S包括存儲控制裝置101和HDD (硬盤驅(qū)動器)110。存 儲控制裝置101通過通道114,經(jīng)過由SAN開關(guān)等構(gòu)成的SAN(Storage Area Network存儲區(qū)域網(wǎng)絡(luò))103,連接到一個或多個主機102 (圖中為兩個)。
存儲控制裝置lOl還經(jīng)由磁盤側(cè)通道lll與存儲數(shù)據(jù)的多個HDD IO相連。 存儲控制裝置101包括多個通道控制單元(連接單元)104,多個高速緩沖 存儲器(存儲器單元)113,控制信息存儲區(qū)(存儲器單元)117,多個-茲盤控 制單元(連4妄單元)105,多個FM控制單元106,以及經(jīng)內(nèi)部通i 各115將上 述組件互相連接的相互接合網(wǎng)絡(luò)107。
通道控制單元104,通過通道114從主機102接收I/O請求,并解釋該I/O 請求的請求類型(例如,用于將數(shù)據(jù)讀寫到HDD110上的讀/寫請求)或其目 標(biāo)地址,以^更對該請求進行適當(dāng)?shù)奶幚怼?br>
高速緩沖存儲器113臨時存儲將要存儲在HDD110和FM控制單元106 內(nèi)的閃存器306(非易失性存儲介質(zhì)后述)上的數(shù)據(jù),或?qū)⒁l(fā)送至主機102 的數(shù)據(jù)??刂菩畔⒋鎯^(qū)117是在存儲系統(tǒng)S上存儲控制信息的區(qū)域,其包括 存4諸器如RAM (Random Access Memory,隨才幾存4諸器)。
通過根據(jù)要存儲的信息類型準(zhǔn)備物理上不同的存儲器,或通過向其分配邏 輯上不同的區(qū)域,高速緩沖存儲器113和控制信息存儲區(qū)117可以獨立使用。
磁盤控制單元105,響應(yīng)來自通道控制單元104的請求,通過磁盤側(cè)通道111對HDD 110進行控制,實施由主機102請求的數(shù)據(jù)獲取或數(shù)據(jù)存儲。此時, 磁盤控制單元105根據(jù)RAID (Redundant Arrays of Inexpensive Disks (廉價磁 盤冗余陣列)管理多個HDD的技術(shù))對HDD 100進行控制,以便提高存儲 系統(tǒng)S的可靠性、可用性和性能。
FM控制單元106對閃存器306 (在圖3中進一步詳述)或存儲系統(tǒng)S內(nèi) 的閃存器設(shè)備(圖4和圖5中進一步詳述)進行控制。FM控制單元106響應(yīng) 來自通道控制單元104等的請求,在閃存器306或閃存器設(shè)備中,進行由主機 102請求的數(shù)據(jù)獲取或數(shù)據(jù)存儲。此時,F(xiàn)M控制單元106可對閃存器設(shè)備進 行RAID控制,以便提高存儲系統(tǒng)S的可靠性、可用性和性能。
接著,參照圖2,對通道控制單元104的結(jié)構(gòu)進行說明(如有必要,參照 圖1 )。圖2是表示通道控制單元104的結(jié)構(gòu)的框圖。通道控制單元104包括 MP (微處理器)單元(處理單元)220、多個通道協(xié)議處理單元204和內(nèi)部網(wǎng) 絡(luò)接口單元205。 MP單元220包括多個處理器201、存儲器模塊202和外圍 處理單元203。
每個處理器201通過諸如總線之類的連接介質(zhì)與外圍處理單元203相連。 外圍處理單元203與存儲器模塊202相連,以便對存儲器模塊202進行控制。 外圍處理單元203還通過通信系統(tǒng)的總線215與通道協(xié)議處理單元204以及內(nèi) 部網(wǎng)絡(luò)接口單元205相連。
外圍處理單元203,從與其相連的處理器201、通道協(xié)議處理單元204以 及內(nèi)部網(wǎng)絡(luò)接口單元205接收信息包(數(shù)據(jù))。若接收到的信息包所指示的傳 輸目的地地址存儲在存儲器模塊202中,則進行對應(yīng)于該地址的適當(dāng)?shù)奶幚恚?如有必要,將數(shù)據(jù)返回到內(nèi)部網(wǎng)絡(luò)接口單元205。若傳輸目的地地址是存儲器 模塊202之外的位置地址,則外圍處理單元203進行數(shù)據(jù)轉(zhuǎn)發(fā)(數(shù)據(jù)傳輸)。 通過諸如LAN(Local Area Network)之類的內(nèi)部通信網(wǎng)絡(luò)221,外圍處理單元 203與存儲控制裝置101的另一單元,諸如^茲盤控制單元105相連(圖6中進 一步詳述)。
存儲器it塊202具有郵箱213,用于與外圍處理單元203相連的處理器201 之間的通信。處理器201通過外圍處理單元203訪問存儲器模塊202,根據(jù)存 儲在存儲器模塊202中的控制程序212進行適當(dāng)?shù)奶幚?。存儲器模塊202存儲著當(dāng)進行DMA (Direct Memory access (直接內(nèi)存訪 問)不通過處理器201進行數(shù)據(jù)傳輸?shù)募夹g(shù))時通道協(xié)議處理單元204使用 的傳輸列表214。通道協(xié)議處理單元204對通道114進行協(xié)議控制,將來自主 機102的數(shù)據(jù)轉(zhuǎn)換為協(xié)議格式,從而可以在存儲系統(tǒng)S內(nèi)對其進行處理。具體 地,當(dāng)通過通道114從主機102接收I/O請求時,通道協(xié)議處理單元204向處 理器201通知主機號碼、LUN(邏輯單元號碼HDD 110的邏輯單元的識別 符,與圖7中邏輯巻ID 701對應(yīng)的存儲區(qū))或用于I/O請求的訪問目的地地 址。響應(yīng)來自通道協(xié)議處理單元204的通知,處理器201訪問控制信息存儲區(qū) 117上的目錄信息、或已在存儲器模塊202上復(fù)制并展開的目錄信息。如果目 錄信息中存在I/O請求的數(shù)據(jù)必須凈皮存儲到的地址,或I/O請求的數(shù)據(jù)本身, 則處理器201在存儲器模塊202中創(chuàng)建傳輸列表214。根據(jù)傳輸列表214,通 道協(xié)議處理單元204進行數(shù)據(jù)傳輸。如果讀請求的數(shù)據(jù)不存在于高速緩沖存儲器113上,而是存儲在HDD 110 上,則處理器201指示磁盤控制單元105以將數(shù)據(jù)存儲在高速緩沖存儲器113 中(此操作稱為"升級(staging)"),然后根據(jù)傳輸列表214傳輸數(shù)據(jù)。如果由主機102讀請求的數(shù)據(jù)存儲在閃存器上(如閃存器306:在圖3至 圖5中后述),則處理器201在傳輸列表214中設(shè)置閃存器的地址。傳輸列表 214是高速緩沖存儲器113或閃存器上的地址的列表。當(dāng)由主機102接收到寫請求時,通道協(xié)議處理單元204通過內(nèi)部網(wǎng)絡(luò)接口 單元205,經(jīng)由內(nèi)部通路115將主機102請求的數(shù)據(jù)寫入對應(yīng)于傳輸列表214 中的地址的位置。當(dāng)接收到來自主才幾102的讀請求時,通道協(xié)議處理單元204 從傳輸列表214中記載的對應(yīng)地址讀取數(shù)據(jù),然后將數(shù)據(jù)返回主機102。內(nèi)部網(wǎng)絡(luò)接口單元205,用作在通道控制單元104和另一存儲系統(tǒng)S之間 經(jīng)由內(nèi)部通路115進行內(nèi)部通信時的接口 。盡管;茲盤控制單元105和104具有大致相同的結(jié)構(gòu),但是,^茲盤控制單元 105,具有與控制程序212對應(yīng)的部分不同的部分,具有用于和HDD110進行 通信的、與通道協(xié)議處理單元204對應(yīng)的部分。需要注意的是,通道114和磁盤側(cè)通道111可以具有彼此不同的協(xié)議。然ii而,在進行磁盤側(cè)通道111上的協(xié)議處理,以使該處理可以在存儲系統(tǒng)S內(nèi)進行這一點上,磁盤控制單元105中與通道協(xié)議處理單元204對應(yīng)的部分與通道 控制單元104中的通道協(xié)議處理單元204相似。如果在高速緩沖存儲器113中存在數(shù)據(jù),則處理器201根據(jù)來自通道控制 單元104的請求或以一定的時間間隔,將高速緩沖存儲器113中的數(shù)據(jù)寫入 HDDllO。如果高速緩沖存儲器113中沒有數(shù)據(jù),則處理器201接收來自通道 控制單元104的指示,然后根據(jù)該指示,從HDD IIO讀取數(shù)據(jù),并將該數(shù)據(jù) 寫入高速緩沖存儲器113。處理器201訪問存儲在控制信息存儲區(qū)117上的目錄信息,以便才企索由主 機102請求的數(shù)據(jù)將被讀出或被存儲入的高速緩沖存儲器113的存儲地址。當(dāng)所請求的數(shù)據(jù)不在高速緩沖存儲器113中時,或當(dāng)為了創(chuàng)建空閑區(qū)域而 將現(xiàn)有的數(shù)據(jù)存儲在HDD 110中(該操作被稱為"降級(destaging)")時, 磁盤控制單元105通過-茲盤側(cè)通道111控制HDD 110。此時,磁盤控制單元 105可以對HDDllO組進行RAID控制,從而可以提高整個HDD 110的可用 性和性能。參照圖3,對FM控制單元106的結(jié)構(gòu)進行說明(如有必要,參照圖l和 圖2)。圖3是表示FM控制單元106的結(jié)構(gòu)的框圖。FM控制單元106包括 內(nèi)部網(wǎng)絡(luò)接口單元301、進行DMA控制的DMA控制器302、非易失性存儲 器的存儲器模塊304、控制存儲器模塊304的存儲器控制器303、作為非易失 性存儲元件的閃存器(FM) 306、控制FM306的存儲器控制器305。內(nèi)部網(wǎng)絡(luò)接口單元301用作經(jīng)由內(nèi)部通路115在FM控制單元106和另一 存儲控制裝置101之間進行內(nèi)部通信時的接口。存儲器模塊304具有用于在FM控制單元106中進行DMA的傳輸列表308。FM控制單元106中包含的DMA控制器302,為了在高速緩沖存儲器113 中創(chuàng)建空閑區(qū),例如,當(dāng)處理來自主機102的寫請求時,根據(jù)通道控制單元 104的處理器201設(shè)置的傳輸列表214,進行從高速緩沖存儲器113到FM306 的數(shù)據(jù)傳輸。存儲器控制器305,根據(jù)經(jīng)內(nèi)部通路115來自通道控制單元104的讀請求和DMA控制器302的寫請求,對FM 306進行控制并存耳又(handle)數(shù)據(jù)。 存儲器控制器305在其存儲區(qū)307存儲關(guān)于FM 306的使用的信息。存儲在存 儲區(qū)307的信息被用來創(chuàng)建^f吏用狀態(tài)管理表800 (在圖8中后述)。代替使用FM306,也可以使用其它存儲器,比如鐵電體存儲器(使用 鐵電的材料的非易失性存儲器FeRAM (Ferroelectric Random Access Memory, 鐵電隨機存儲器)或相變存儲器(通過使用非結(jié)晶狀態(tài)的變化(即,相變化) 來存儲數(shù)據(jù)的非易失性存儲器,比如OUM(Ovonic Unified Memory,奧弗辛斯 基電效應(yīng)統(tǒng)一存儲器))。參照圖4,對圖3中的FM控制單元106的另一結(jié)構(gòu)進flS兌明(見圖1至 圖3)。圖4是表示FM控制單元106的另一結(jié)構(gòu)的框圖。該FM控制單元106 使用閃存器(FM)設(shè)備409。關(guān)于與圖3相同的結(jié)構(gòu),使用相同的符號,將 省略i兌明。FM設(shè)備409是一存儲系統(tǒng),其包括類似于圖3中的FM 306的一個或 多個閃存器、 一個或多個存儲器控制303、用于和FM協(xié)議處理單元407進行 通信的通信裝置(圖中未示出)。如圖4所示,F(xiàn)Mi殳備409存在于每個FM控制單元106中,其經(jīng)連接器 408和FM控制單元106可拆卸地連4妄。因此,當(dāng)FM "i殳備409發(fā)生故障時易 于更換FM設(shè)備409。為了便于更換FM設(shè)備409,通道控制單元104的處理 器201可以設(shè)置傳輸列表214,以使冗余結(jié)構(gòu)在各個FM設(shè)備409間共享。上述結(jié)構(gòu)也使FM設(shè)備409本身可以用具有更大容量的另一設(shè)備替換。 通過諸如FFS (Fast File System,快速文件系統(tǒng))之類的通用協(xié)議,與FM設(shè)備 409進行通信。因此,F(xiàn)M協(xié)i義處理單元407對用于與FM設(shè)備409進行通信 的格式進行轉(zhuǎn)換,使其在存儲控制裝置101內(nèi)可用。FM協(xié)議處理單元407將關(guān)于FM設(shè)備409的使用的信息,存儲在存儲區(qū) 410,存儲在存儲區(qū)410的信息被用來創(chuàng)建使用狀態(tài)管理表800(在后面的圖8 中描述)。下面,參照圖5,對不同于圖3和圖4所示的FM控制單元106的另一結(jié) 構(gòu)進行說明(見圖1至圖4)。圖5是表示FM控制單元106的另一結(jié)構(gòu)的框 圖。MF側(cè)通道510建立與FM設(shè)備409的連接。對于與圖3或圖4中使用相13同附圖標(biāo)記的相同的結(jié)構(gòu),將省略其說明。
FM協(xié)議處理單元507與FM協(xié)議處理單元407類似地工作,在其存4諸區(qū) 508內(nèi),存儲關(guān)于與其連接的多個FM設(shè)備409的使用狀態(tài)的信息。在存儲區(qū) 508中存儲的信息用于創(chuàng)建使用狀態(tài)管理表800 (在后面的圖8中描述)。
這種結(jié)構(gòu)不僅帶來圖4中所述的FM控制單元106的特征,-而且使得更多 FM設(shè)備409與FM控制單元106連接,從而可以實現(xiàn)大容量的存儲系統(tǒng)S。
作為圖3中的FM306的一種安裝方式,可以將其直接配置在基板上。在 這種情況下,不需要連接器408、 FM協(xié)議處理單元407和FM側(cè)通道510, 從而可以實現(xiàn)更小型的存儲系統(tǒng)S。
此外,在圖3中,每個存儲器控制器305可以對其FM306進行平均讀寫 調(diào)整。存儲器控制器305可以收集有關(guān)在訪問FM306時所發(fā)生的擦除錯誤發(fā) 生次數(shù)和壞塊數(shù)的統(tǒng)計信息,并將該信息存儲在FM306的一部分上,或存儲 在另外提供的另一 FM306上,其中可以設(shè)置任何單元以根據(jù)來自處理器的請 求發(fā)送該統(tǒng)計信息。
接著,參照圖6,對存儲控制裝置101以及其它部件中的信息流進行說明 (如有必要,見圖1)。圖6表示存在多個存^渚控制裝置101的情況下的整體 結(jié)構(gòu)的一說明性例子中的信息流。對于與圖1中使用相同附圖標(biāo)記的相同的結(jié) 構(gòu),省略其說明。
多個(圖6中是2個)存儲控制裝置101經(jīng)網(wǎng)絡(luò)602與管理終端601相連。 管理終端601可以是普通的服務(wù)器,用于從一臺或多臺存儲控制裝置101 收集內(nèi)部信息,集中管理該內(nèi)部信息,如性能和功率消耗量(可以是根據(jù)存 儲控制裝置101中各部件的基本功率消耗量,由運行中的部件的數(shù)量計算而得 到的換算值),或是關(guān)于故障信息的統(tǒng)計信息(在圖8至圖IO中進一步詳細說 明)。
具體地,管理終端601具有諸如CPU ( Central Processing Unit)之類的管 理終端處理單元(圖中未示出)以及諸如硬盤驅(qū)動器之類的管理終端存儲單元 (圖中未示出)。管理終端601,作為收集信息的一個單元,經(jīng)由一般的通信 網(wǎng)絡(luò)602,通過各存儲控制裝置101中的管理單元603,訪問存儲在存儲控制 裝置101中的信息,例如,存儲在控制信息存儲區(qū)117中的圖8中的使用狀態(tài)管理表800等設(shè)備內(nèi)部信息604,或者,通過管理單元603獲取該信息604。 管理終端601,根據(jù)從各個存儲系統(tǒng)101收集到的設(shè)備內(nèi)部信息604,生成信 息608 (例如,圖14中的整體信息表1400 )。
在存儲控制系統(tǒng)101內(nèi),在各通道控制單元104中有MP單元220,在各 A茲盤控制單元105中有MP 1051。還有用于在MP單元220和1051之間、或 MP單元220、 1051和管理單元603之間進行通信的內(nèi)部通信網(wǎng)絡(luò)221。
管理單元603可以直接或間接訪問由MP單元220和1051收集到的信息, 或者在各個高速緩沖存儲器113等上累積的構(gòu)成信息和統(tǒng)計信息等設(shè)備內(nèi)部 信息604。
管理終端601,以預(yù)定的標(biāo)準(zhǔn)(閾值)比較所收集到的信息,從而可以根 據(jù)信息的內(nèi)容進行恰當(dāng)?shù)牟僮鳌O旅?,對存儲控制裝置101中的控制的一例進 行說明后,對管理終端601中的動作和處理進行進一步說明。
參照圖7,將對HDD IIO(下文中也稱為設(shè)備)的設(shè)備管理表進行說明(如 有必要,參照圖1)。圖7表示設(shè)備管理表700的一例。具體地,其說明如何 通過使用邏輯巻管理表700對存儲控制裝置101中的各存儲設(shè)備(如控制信息 存儲區(qū)117)進行管理,以及說明作為主機102可見的訪問對象的一例的邏輯 巻(相當(dāng)于前面所述的邏輯單元)。
盡管在此作為一例說明主機102對各個塊的訪問,但是主機102對各個文 件的訪問也可以同樣方式考慮,因為在最低存儲層次的控制,由包括各種存儲 介質(zhì)(HDD 110和閃存器等)的設(shè)備實現(xiàn)。
具體地,代替SAN 103,也可以使用由NAS(Network Attached Storage (網(wǎng) 絡(luò)連接存儲)與網(wǎng)絡(luò)直接相連而使用的文件服務(wù)器專用計算機)所使用的另一 網(wǎng)絡(luò),如因特網(wǎng)。
當(dāng)主機102對HDD進行寫操作時,寫訪問不對作為HDD 110的物理識別 符的設(shè)備ID進行,而是對作為邏輯巻的識別符的邏輯巻ID進行。
如圖7所示,在邏輯巻管理表700中,邏輯巻ID 701是邏輯巻的識別符, 其與作為存儲控制裝置ioi中的HDD 110的邏輯設(shè)備的識別符的邏輯設(shè)備ID 702相關(guān)聯(lián)。邏輯設(shè)備ID 702還與作為虛擬設(shè)備的識別符的虛擬設(shè)備ID 703 相關(guān)聯(lián)。虛擬設(shè)備ID 703與作為實際的(物理的)設(shè)備的識別符的設(shè)備ID 704、 表示設(shè)備內(nèi)的空間區(qū)域的設(shè)備范圍705相關(guān)聯(lián)。設(shè)備范圍705是可以存儲一定 數(shù)據(jù)量的區(qū)域的管理單元。根據(jù)本發(fā)明的實施例,該數(shù)據(jù)量的具體值與本發(fā)明 的實質(zhì)無關(guān),因此該數(shù)據(jù)量沒有限制。
虛擬設(shè)備ID 703定義為由一個或多個設(shè)備ID 704所表示的設(shè)備的存儲區(qū) 域的集合體。
需要注意,邏輯巻管理表700配置在所有處理器(MP單元220、 1051) 可以直接或間接查詢該管理表700的這樣的位置(例如,控制信息存儲區(qū)117 )。
接著,參照圖8,對管理各設(shè)備的使用狀態(tài)管理表進行說明。圖8表示使 用狀態(tài)管理表的一例。
使用狀態(tài)管理表800, 對于與其自己的設(shè)備ID 801 (對應(yīng)于圖7中的設(shè) 備ID704)關(guān)聯(lián)的各個設(shè)備,管理其與特性、屬性、使用狀態(tài)有關(guān)的信息。現(xiàn) 在,假設(shè)對閃存器等存儲介質(zhì)進行管理,從使用開始的總寫入次數(shù)802和總擦 除次數(shù)803、壞塊數(shù)量804、壞塊增長率805以及平均擦除時間806與設(shè)備ID 801相關(guān)。盡管圖中未示出,但在使用狀態(tài)管理表800中,或在另外的專門用 于管理閾值的表中,對每一項信息的各閾值進行管理。
各個信息及其閾值被用于管理設(shè)備。例如,當(dāng)設(shè)備的平均擦除時間806 變長時,可以判定該設(shè)備(如FM306)的使用期限即將結(jié)束。
除所述信息以外,也可以管理擦除操作錯誤次數(shù)(擦除錯誤次數(shù))等其它 信息,來幫助判斷該設(shè)備的使用期限。
需要注意,當(dāng)初始化設(shè)備或改變設(shè)備的配置時,有必要從使用開始持續(xù)地 存儲總寫入次凄t 802和總擦除次數(shù)803。
使用狀態(tài)管理表800也可對除FM 306以外的、應(yīng)用使用ATA (AT Attachment: AT附加設(shè)備)磁盤驅(qū)動器等MAID技術(shù)的其它設(shè)備和存儲設(shè)備進 行管理,其中,使用次數(shù)(總寫入次數(shù)和總擦除次數(shù))、總加速/減速次數(shù)和錯
誤產(chǎn)生率是管理i殳備使用期限必要的。
例如,如果HDD 110由SCSI (Small Computer System Interface:小型計算 機系統(tǒng)接口)磁盤和ATA磁盤驅(qū)動器組成,或由ATA磁盤驅(qū)動器單獨組成,則 磁盤控制單元105通過使用MAID技術(shù)可以控制該ATA;茲盤驅(qū)動器的旋轉(zhuǎn)和停止。
可以與-茲盤控制單元105相連的不僅是HDD 110,而且還有裝備有HDD 110和控制單元(未圖示)的磁盤陣列設(shè)備(未圖示)。在這種情況下,通過 磁盤控制單元105的指示以及裝備在控制單元(未圖示)的MAID,可以控制 ATA磁盤驅(qū)動器的旋轉(zhuǎn)和停止。即,ATA磁盤驅(qū)動器在硬件基礎(chǔ)上是脆弱的, 因此,和管理FM306相同地,最好在使用狀態(tài)管理表800上在使用期限方面 管理ATA磁盤驅(qū)動器。
作為管理閃存器的一例,對使用狀態(tài)管理表800進行說明。然而,在ATA 磁盤驅(qū)動器、或應(yīng)用了使用ATA磁盤驅(qū)動器MAID的驅(qū)動器的裝置情況下, 使用狀態(tài)管理表800可包括總加速/減速次數(shù)、總旋轉(zhuǎn)時間和錯誤發(fā)生率。具 體地,使用狀態(tài)管理表800,根據(jù)其狀況,具有與存儲介質(zhì)和設(shè)備的使用期限 有關(guān)的各種信息(總使用時間、錯誤發(fā)生率、壞塊增長率、訪問次數(shù)等)。
使用狀態(tài)管理表800,和邏輯巻表700的情況相同,故配置在所有處理器 (MP單元220、 1051)可以直接或間接對其進行查詢的位置。
參照圖9,對讀/寫次數(shù)管理表900進行說明(如有必要,見圖1)。圖9 表示讀/寫次數(shù)管理表900的一例。
讀/寫次數(shù)管理表900與邏輯巻ID卯l (對應(yīng)于邏輯巻ID 701 )、邏輯設(shè)備 ID卯2 (對應(yīng)于邏輯設(shè)備ID 702 )、 RD次數(shù)(總讀取次數(shù))903 、和WR次數(shù) (總寫入次數(shù))904關(guān)聯(lián)。讀/寫次數(shù)管理表900,每當(dāng)訪問邏輯巻ID901或邏 輯設(shè)備ID 902時,作為統(tǒng)計信息更新。
讀/寫次數(shù)管理表卯0,和邏輯巻管理表700的情況相同地,設(shè)置在所有處 理器(MP單元220、 1051)能夠查詢表900的位置。
讀/寫次數(shù)管理表900用在具有與寫入的頻率相比讀:取的頻率更高的大量 數(shù)據(jù)被從每一定時間段的功率消耗高的HDD 110向每一定時間段的功率消耗 低的閃存器轉(zhuǎn)移的處理中(從后面的圖11到圖13中描述)。
類似地,盡管與讀/寫次數(shù)管理表900無關(guān),存儲在被指定為WORM (Write Once Read Many,單寫多讀)、只讀、或長期的保持期間的邏輯巻中的數(shù)據(jù)可 以被轉(zhuǎn)移(從HDD 110到FM 306 )。
接著,參照圖10,對設(shè)備類型管理表進行說明(如有必要,見圖1)。圖
17一個例子。
設(shè)備類型管理表1000,與表示設(shè)備類型的存儲層設(shè)備類型1001、每一定
時間段的功率消耗量1002、表示運行中的設(shè)備的數(shù)量的活動設(shè)備數(shù)1003、以 及空閑的低功率消耗設(shè)備池的數(shù)量(低功率消耗的存儲介質(zhì)的空閑容量)1400 關(guān)聯(lián)。
在存儲層設(shè)備類型1001中,"Flash"表示FM 306, "ATA"表示作為在 MAID技術(shù)中使用的HDD110的整個或一部分的ATA磁盤驅(qū)動器、應(yīng)用MAID 技術(shù)的磁盤陣列設(shè)備在磁盤陣列設(shè)備與磁盤控制單元105相連的情況下所包 含的ATA磁盤驅(qū)動器、或者包含上述磁盤陣列設(shè)備所具有的ATA磁盤驅(qū)動器 的邏輯設(shè)備(邏輯巻)。"SCSI"表示作為HDD110的整體或者一部分的SCSI 磁盤驅(qū)動器。"Cache"表示作為高速緩沖存儲器113使用的RAM。
空閑低功率消耗設(shè)備池的數(shù)量1004的單位為兆字節(jié)(MB)和十億字節(jié) CGB)等
存儲控制裝置101的總功率消耗量,通過在其電源單元(未圖示)設(shè)有測 量實際功率消耗的設(shè)備(例如功率計)來進行測量和記錄的方法可以得到。為
了去除測量單元如功率計,通過使用設(shè)備類型管理表1000來計算總功率消耗 量的粗略估計值。
換言之,因為存儲控制裝置101監(jiān)視各部件的操作狀態(tài),只要將設(shè)備類型 管理表1000中的信息作為統(tǒng)計信息來管理,就可以得到總功率消耗量的粗略 估計值。在圖IIA至圖13中后述的處理中,可以使用設(shè)備類型管理表1000 以便根據(jù)各部件的狀態(tài)及其功率消耗量,將數(shù)據(jù)轉(zhuǎn)移至較低功率消耗的設(shè)備, 以便減少各部件的功率消耗。
需要注意,設(shè)備類型管理表1000,和邏輯巻表700的情況相同地,設(shè)置 在所有處理器(MP單元220、 1051)能夠直接或間接查詢該表1000的位置。
此外,參照圖IIA至圖13,對存儲系統(tǒng)的操作進行說明(如有必要,參 見圖6等)。
圖11A是表示MP單元220在HDD 110和FM控制單元106之間進行數(shù) 據(jù)轉(zhuǎn)移時的判定處理的一個例子的流程圖。
MP 220執(zhí)行該數(shù)據(jù)轉(zhuǎn)移處理時的時序,例如,當(dāng)從主機102接收周期性讀/寫請求時,或當(dāng)從主機102接收特定某邏輯巻為WORM的指示時。
在圖3至圖5中顯示了 FM控制單元106的結(jié)構(gòu)的3個例子。在此,對圖 3中的例子進行說明。
MP單元220,當(dāng)執(zhí)行該數(shù)據(jù)轉(zhuǎn)移的判定處理時,對所收集到的信息(圖 8至圖10中的各個表)進行確認(Slll)。
接著,MP單元220根據(jù)所收集到的信息和判定條件(n),對狀態(tài)進行分 析(S112)。判定條件(n)包括,例如FM306的使用期限管理(通過查詢總 寫入次數(shù)802,判定總寫入次數(shù)是否超過預(yù)定值)、功率消耗的減少(查詢設(shè) 備類型管理表1000 )、因來自主機102的WORM的指示而進行的數(shù)據(jù)轉(zhuǎn)移、 RD/RW次數(shù)比(通過查詢RD次數(shù)903和WR次數(shù)904,若RD次lt 903對 WR次數(shù)904的比值超過預(yù)定值,則判定將數(shù)據(jù)轉(zhuǎn)移至FM 306的可能性)。這 些判定條件(n)按照優(yōu)先順序彼此結(jié)合使用。
MP單元220,根據(jù)在步驟S112的分析,判定是否存在超過閾值的狀態(tài) (S113)。步驟S113用于判定FM306的總寫入次數(shù)是否超過閾值,若其超過 閾值,則將其數(shù)據(jù)轉(zhuǎn)移至沒有寫入次數(shù)限制的HDD 110。
如果沒有超過閾值的狀態(tài)(在S113中為"NO"),則MP單元220結(jié)束處理。
如果存在超過閾值的狀態(tài)(在S113中為"YES"),則MP220選擇數(shù)據(jù)轉(zhuǎn) 移的源和目的地(S114),并通過查詢空閑低功率消耗設(shè)備池的數(shù)量1004等, 判斷是否存在數(shù)據(jù)轉(zhuǎn)移的目的地(S115 )。
若沒有數(shù)據(jù)轉(zhuǎn)移的目的地(在S115中為"NO"),則MP單元220判斷是 否可能在判定條件中較高優(yōu)先級的某條件范圍內(nèi),生成一個數(shù)據(jù)轉(zhuǎn)移目的地 (S117)。
此外,若不可能生成數(shù)據(jù)轉(zhuǎn)移的目的地(在S117中為"NO"),則MP單 元220結(jié)束處理。
如杲可能生成lt據(jù)轉(zhuǎn)移的目的地(在S117中為"YES"),則MP單元220 生成數(shù)據(jù)轉(zhuǎn)移的目的地(S118),并開始數(shù)據(jù)轉(zhuǎn)移處理(S119)。
具體地,如果試圖從HDD 110向任何一個FM 306轉(zhuǎn)移數(shù)據(jù),但在FM 306 中沒有用于數(shù)據(jù)轉(zhuǎn)移的目的地(即,沒有空閑容量),例如,在判定條件(n)中優(yōu)先級高的某條件(例如與功率消耗相關(guān)的條件)的范圍內(nèi),將FM306上的部分數(shù)據(jù)轉(zhuǎn)移到HDD 110,以便在FM306上生成一些可以向其中轉(zhuǎn)移數(shù)據(jù)的空閑容量。
若存在數(shù)據(jù)轉(zhuǎn)移目的地(在SU5中的"YES"),則MP單元220判斷是否由于數(shù)據(jù)轉(zhuǎn)移,狀態(tài)超過判定條件(n)中優(yōu)先級較高的某條件(S116)。
若狀態(tài)超過判定條件(n)中優(yōu)先級較高的條件(在S116中的"NO"),則MP單元220結(jié)束處理。例如,盡管由于數(shù)據(jù)轉(zhuǎn)移,F(xiàn)M 306在其4吏用期限內(nèi)沒有問題,但是如果不滿足優(yōu)先級較高的條件,則MP單元220不進行數(shù)據(jù)轉(zhuǎn)移。
如杲狀態(tài)未超過判定條件中優(yōu)先級較高的條件(在S116中的"YES"),則MP單元220開始數(shù)據(jù)轉(zhuǎn)移的處理(S119 )。
如上所述,在存儲系統(tǒng)S內(nèi),可以進行數(shù)據(jù)轉(zhuǎn)移以便優(yōu)化整體功率消耗和FM306的使用期限管理。具體地,通過根據(jù)設(shè)備的寫/讀頻率,進行向具有較低功率消耗的FM 306的數(shù)據(jù)轉(zhuǎn)移,從而可以降低總體功率消耗。
接著,參照圖11B,對數(shù)據(jù)轉(zhuǎn)移處理進行說明(如有必要,見圖6等)。圖11B是表示用于使FM控制單元106在HDD110和FM306之間進4亍數(shù)據(jù)轉(zhuǎn)移的判定處理的一個例子的流程圖。需要注意,該步驟在圖11A的步驟S119后執(zhí)行。
首先,MP單元220判斷目的地區(qū)域是否在FM306中(步驟SllOl)。
如果目的地區(qū)域在FM306中(在SllOl中的"YES"),由于FM306對寫入次數(shù)和性能敏感,所以,在HDD IIO中確保暫時存儲區(qū)(S1102)。與此同時,MP單元220在控制信息存儲區(qū)117中創(chuàng)建暫時存儲區(qū)管理表。
如果目的地區(qū)域不在FM306中(在SllOl中的"NO,,),則沒有必要確保暫時存儲區(qū),從而前進到步驟S1103。
然后,MP單元220創(chuàng)建用于以一定單位大小管理數(shù)據(jù)轉(zhuǎn)移目的地的存儲區(qū)的管理表(未圖示)(S1103)。該管理表,例如,可以是管理64KB單位大小的數(shù)據(jù)的位圖表。只要可以對數(shù)據(jù)轉(zhuǎn)移的進程提供管理,除位圖表以外的其它任何表都可以用于該管理表。
接著上述步驟,MP單元220通過向DMA控制器302發(fā)送指示,將源數(shù)
20據(jù)復(fù)制到婆t據(jù)轉(zhuǎn)移的目的地(S1104 )。
MP單元220,根據(jù)上述管理表(即,位圖表),檢查結(jié)束了數(shù)據(jù)轉(zhuǎn)移的區(qū) 域,例如,通過將位從"0"變更為T (S簡)。
MP單元220,才艮據(jù)管理表判斷是否已復(fù)制了轉(zhuǎn)移對象的全部數(shù)據(jù)區(qū)域, 即,數(shù)據(jù)轉(zhuǎn)移的進程是否已達到了 100% (S1106)。
如果轉(zhuǎn)移對象的整個數(shù)據(jù)區(qū)域還沒有復(fù)制完,則MP單元220重復(fù)在步驟 S1104和步驟S1105的處理。
如果轉(zhuǎn)移對象的整個數(shù)據(jù)區(qū)域的復(fù)制進程已結(jié)束(在S1106中的"YES"), 則MP單元220前進到步驟SI 107。
此外,在步驟S1101到步驟S1106的數(shù)據(jù)轉(zhuǎn)移處理期間,存儲控制裝置 101偶爾接收數(shù)據(jù)的讀和寫請求。以后在圖12和圖13中對這種情況下的適當(dāng) 處理進行說明。
接著,在步驟S1107, MP單元220查詢在步驟S1102所創(chuàng)建的暫時存儲 區(qū)域管理表,并檢查在暫時存儲區(qū)域中是否存在存儲的數(shù)據(jù)。
如果在暫時存儲區(qū)域中存在任何存儲的數(shù)據(jù)(在S1107中的"YES"),則 MP單元220將暫時存儲區(qū)域中所存儲的數(shù)據(jù)反映到轉(zhuǎn)移目的地區(qū)域(S1108 ), 并重復(fù)在步驟S1108的處理,直到全部數(shù)據(jù)的轉(zhuǎn)移已結(jié)束(在S1109中的"YES ")。
如果暫時存儲區(qū)域內(nèi)沒有存儲的數(shù)據(jù)(在S1107中的"NO"),則MP單 元220前進到步驟SlllO。
MP單元220,根據(jù)數(shù)據(jù)轉(zhuǎn)移,重寫邏輯巻管理表700 (SlllO)。在這種 情況下,例如,若在表700中的設(shè)備ID704的適當(dāng)單元,將ID名從轉(zhuǎn)移源設(shè) 備ID變更為轉(zhuǎn)移目的地設(shè)備ID,則沒必要重寫在主機中的虛擬設(shè)備(對應(yīng)于 虛擬設(shè)備ID703 )。
MP單元220將在步驟S1110中變得不必要的轉(zhuǎn)移源設(shè)備釋放,以便于以 其它目的對其進^f亍再利用(Sllll)。
如上所述,在存儲系統(tǒng)S中,可以根據(jù)圖11A中所述的有關(guān)轉(zhuǎn)移的判定 結(jié)果進行數(shù)據(jù)轉(zhuǎn)移。
另夕卜,還有另一方法,其在步驟S1104至S1106實現(xiàn)數(shù)據(jù)轉(zhuǎn)移的實際操作
21之前,在步驟Sllll進行邏輯執(zhí)行。該方法,不僅可以應(yīng)用于數(shù)據(jù)轉(zhuǎn)移操作, 而且可以應(yīng)用于數(shù)據(jù)復(fù)制功能中的高速快照訪問功能(一般稱為巻鏡像分隔
(volume mirror-split)或快照)。在使用該方法的情況下,可以根據(jù)各個目的, 在后面圖12和圖13中所描述的處理(對于讀/寫請求)中進行適當(dāng)?shù)母淖儭?br>
接著,參照圖12,對數(shù)據(jù)轉(zhuǎn)移操作期間從主機102接收到讀請求時MP 單元220的處理進行說明(圖11B中的S1101至S1106)(如有需要,見圖6)。 圖12是表示這種情況下MP單元220的處理的一個例子的流程圖。
首先,MP單元220,從主初j 102接收數(shù)據(jù)轉(zhuǎn)移操作期間對數(shù)據(jù)的讀請求 (S1201),然后,在管理表(在圖11的步驟S1103中創(chuàng)建)上,對最新的數(shù) 據(jù)存儲位置(在轉(zhuǎn)移源設(shè)備或暫時存儲區(qū)域中)進行確認(S1202)。
接著,MP單元220通過從其適當(dāng)?shù)拇鎯ξ恢冒l(fā)送數(shù)據(jù),向主機102返回 讀響應(yīng)(S1203 )。
然后,如果讀對象的數(shù)據(jù)轉(zhuǎn)移還未結(jié)束,MP單元220將轉(zhuǎn)移源數(shù)據(jù)復(fù)制 到轉(zhuǎn)移目的地(S1204)。
MP單無220將執(zhí)行了數(shù)據(jù)轉(zhuǎn)移操作的區(qū)域內(nèi)的操作的完成反映到管理 表上(S1205 )。
需要注意,步驟S1203和步驟S1204的處理,可以在步驟S1202的處理 前進行。
如上所述,存儲系統(tǒng)S,即使在數(shù)據(jù)轉(zhuǎn)移進行中,也可以滿足來自主機102 的讀請求。
參照圖13,對當(dāng)在數(shù)據(jù)轉(zhuǎn)移操作期間從主機102接收到寫請求時MP單 元220的處理進行說明(圖11B中的S1101至S1106)(如有必要,見圖6等)。 圖13是表示在這種情況下MP單元220的處理的一個例子的流程圖。
首先,MP單元220從主機102接收對轉(zhuǎn)移操作期間的數(shù)據(jù)的寫請求 (S1301),然后,將對應(yīng)于其訪問地址而編址的、被寫請求的數(shù)據(jù)寫入暫時存 儲區(qū)域(S1302)。
然后,MP單元220,對在圖11B中的步驟S1102創(chuàng)建的暫時存儲區(qū)域表 進行更新,以便反映最新的數(shù)據(jù)位于暫時存儲區(qū)域內(nèi)(S1303 )。
如上所述,即使在進行數(shù)據(jù)轉(zhuǎn)移時,存儲系統(tǒng)S也可以滿足來自主機102的寫請求。
此外,被主機102寫請求的數(shù)據(jù)暫時存儲在暫時存儲區(qū)中,然后在后面被
反映,使得即使轉(zhuǎn)移目的地是像FM306那樣的通過諸如追加、指針替換和塊 擦除之類的復(fù)雜的過程來實施寫入的設(shè)備,或是像使用ATA磁盤驅(qū)動器來僅 處理用于重復(fù)加速和減速的磁盤設(shè)備的設(shè)備,也可以實現(xiàn)平穩(wěn)的數(shù)據(jù)轉(zhuǎn)移操 作。
盡管描述MP單元220進行圖IIA至圖13中的各個處理,但是,其它功 能或裝置也可用于各處理,如由MP單元220和MP單元1051所指示的DMA 功能。
在此,參照圖14,對本方面的另一實施例進刊"沈明(如有必要,見圖6 等)。圖14表示在圖6中所描述的管理終端601對整個存儲系統(tǒng)S提供功率消 耗管理的情況下,使用的整體信息表1400的一個例子。
在整體信息表1400中,作為存儲控制裝置101的識別符的控制設(shè)備ID 1401、各個存儲控制裝置101中的每一定時間段的功率消耗量1402、表示諸 如FM306之類的運行中的低功率消耗介質(zhì)的數(shù)量的活動設(shè)備1403、表示運行 中的低功率消耗介質(zhì)的總?cè)萘康幕顒釉O(shè)備總?cè)萘?404、表示諸如HDD110之 類的普通功率消耗介質(zhì)的數(shù)量的活動設(shè)備1405、表示運行中的普通功率消耗 介質(zhì)的總?cè)萘康幕顒釉O(shè)備總?cè)萘?406、表示空閑低功率消耗設(shè)備的數(shù)量的空 閑低功率消耗設(shè)備池1407、各自關(guān)聯(lián)。
即使在某存儲控制裝置101中,不可能將數(shù)據(jù)從具有普通功率消耗的設(shè) 備,轉(zhuǎn)移到具有低功率消耗的設(shè)備,該整體信息表1400使數(shù)據(jù)可以從該普通 功率消耗設(shè)備轉(zhuǎn)移至另一存儲控制裝置101中的低功率消耗設(shè)備,由此,可以 減少整個存儲系統(tǒng)S的功率消耗。
需要注意,在整體信息表1400或?qū)S糜陉R值管理的不同表(未圖示)中, 對整個存儲系統(tǒng)S的功率消耗的閾值進行存儲和管理。
具體的數(shù)據(jù)轉(zhuǎn)移處理,與根據(jù)圖IIA至圖13中的流詳呈圖的處理相似。例 如,圖11B中所示的同樣的單個存儲控制裝置101內(nèi)的設(shè)備間的數(shù)據(jù)轉(zhuǎn)移處 理,可以在不同存儲控制裝置101中的設(shè)備間進行。然后,主機102可以識別 訪問目的地設(shè)"^的變更?;蛘撸梢杂芍鳈C102上的巻虛擬化軟件或虛擬化開關(guān)實現(xiàn),以識別訪問目的地設(shè)備的變化。
才艮據(jù)本發(fā)明的存儲系統(tǒng)S可實現(xiàn)這樣的系統(tǒng),該系統(tǒng)具有低功率消耗,沒 有關(guān)于必要的數(shù)據(jù)的性能的惡化,可大規(guī)模構(gòu)成,并能夠?qū)?shù)據(jù)存儲在最佳的 存儲介質(zhì)中。對于每個存儲介質(zhì)具有的特性(例如重寫次數(shù)的使用期限和容錯 性),存儲系統(tǒng)S還可以提高整個系統(tǒng)的可靠性和可用性。
上面對4艮據(jù)本發(fā)明的實施例進行了說明,但是本發(fā)明的實施例不限于這些 說明,本領(lǐng)域技術(shù)人員明確本發(fā)明的必要特征,在不超出權(quán)利要求的主旨和范 圍的情況下,可以對本發(fā)明進行多種修改和變更,來使其適用于各種用途和條 件。
權(quán)利要求
1.一種存儲系統(tǒng),包括多個磁盤設(shè)備,存儲從主機計算機接收的數(shù)據(jù);多個非易失性設(shè)備,存儲從主機計算機接收的數(shù)據(jù);以及處理單元,控制從主機計算機到與所述多個磁盤設(shè)備和所述多個非易失性設(shè)備相對應(yīng)的多個邏輯卷的讀/寫請求,并且管理與所述多個邏輯卷相對應(yīng)的所述多個磁盤設(shè)備和所述多個非易失性設(shè)備的存儲層與所述多個磁盤設(shè)備和所述多個非易失性設(shè)備的每一個的屬性信息之間的關(guān)系,其中處理單元基于用戶策略將所述存儲層的第一存儲層確定為源存儲層,以及將所述存儲層的第二存儲層確定為目的存儲層,并且基于用戶策略將存儲在所述第一存儲層的至少一個邏輯卷中的數(shù)據(jù)轉(zhuǎn)移到所述第二存儲層的至少一個邏輯卷。
2. 根據(jù)權(quán)利要求1所述的存儲系統(tǒng),其中,用戶策略是用于優(yōu)化存儲系統(tǒng)的性能的商業(yè)策略。
3. 根據(jù)權(quán)利要求1所述的存儲系統(tǒng),其中,用戶策略是從主機計算機到與所述多個磁盤設(shè)備或所述多個非易失性設(shè) 備相關(guān)的至少 一個邏輯巻的實時訪問模式。
4. 根據(jù)權(quán)利要求1所述的存儲系統(tǒng),其中,處理單元管理使用狀態(tài)管理表,所述使用狀態(tài)管理表存儲與所述多個非易 失性設(shè)備的每一個的耐久性相關(guān)的使用狀態(tài)信息以及耐久性閾值,處理單元管理讀/寫周期管理表,所述讀/寫周期管理表存儲所述多個邏輯 巻的每一個的讀周期和寫周期,如果處理單元請求優(yōu)化存儲系統(tǒng)的性能,處理單元基于所述使用狀態(tài)管理 表和所述讀/寫周期管理表來將所述第 一存儲層確定為所述源存儲層,以及將 所述第二存儲層確定為所述目的存儲層。
5. 根據(jù)權(quán)利要求4所述的存儲系統(tǒng),其中,處理單元還管理i殳備類型管理表,所述設(shè)備類型管理表存儲至少一個類型 的》茲盤設(shè)備和一個類型的非易失性設(shè)備在一定時間周期內(nèi)功率消耗量的信息,并且基于所述設(shè)備類型管理表來計數(shù)激活的所述多個磁盤設(shè)備的功率消耗和 激活的所述多個非易失性設(shè)備的功率消耗的總量,如果處理單元請求優(yōu)化存儲系統(tǒng)的性能,處理單元基于所述使用狀態(tài)管理 表和所迷讀/寫周期管理表來將所述第 一存儲層確定為所述源存儲層,以及將 所述第二存儲層確定為所述目的存儲層,并且基于包括所述非易失性設(shè)備的功 率消耗和耐久性的條件的優(yōu)先級將存儲在所述第一存儲層的至少一個邏輯巻 中的數(shù)據(jù)轉(zhuǎn)移到所述第二存儲層的至少 一 個邏輯巻。
6. 根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中,如果處理單元請求將所述功率消耗的總量優(yōu)化為較高的優(yōu)先級,處理單元 基于所述讀/寫周期管理表檢測其中讀周期與寫周期的比率超過預(yù)定閾值的由 磁盤設(shè)備配置的第 一邏輯巻,并且處理單元將所述f茲盤設(shè)備確定為所述第 一存 儲層并且將所述非易失性設(shè)備確定為所述第二存儲層。
7. 根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中,如果不存在所述非易失性設(shè)備的空閑容量,處理單元通過將數(shù)據(jù)從某個非 易失性設(shè)備轉(zhuǎn)移到在功率消耗的總量的較高優(yōu)先級的條件的范圍內(nèi)的一個磁 盤設(shè)備來生成所述多個非易失性設(shè)備的所述某個非易失性設(shè)備的空閑容量。
8. 根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中,如果不存在所述非易失性設(shè)備的空閑容量,并且不存在基于所述使用狀態(tài) 管理表滿足所述非易失性設(shè)備的耐久性的條件的非易失性設(shè)備,處理單元基于所述第 一存儲層轉(zhuǎn)移到所述第二存儲層。
9. 根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中,如果處理單元請求將所述非易失性設(shè)備的耐久性優(yōu)化為較高的優(yōu)先級,如 果處理單元基'于所述使用狀態(tài)管理表檢測到所述多個非易失性設(shè)備的一個的 使用狀態(tài)超過了耐久性閾值,處理單元將所述非易失性設(shè)備確定為所述第一存 儲層并且將所迷磁盤設(shè)備確定為所述第二存儲層。
10. 根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中,如果所述多個磁盤單元的類型是ATA先進技術(shù)附加磁盤,處理單元管理 使用狀態(tài)管理表,所述使用狀態(tài)管理表存儲與所述多個磁盤單元的每一個的耐久性相關(guān)的使用狀態(tài)信息和耐久性閾值。
11. 根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中,通過從主機計算機接收讀/寫請求或通過從主機計算機接收指示以將某個邏輯巻指定為WORM單寫多讀,處理單元請求周期地優(yōu)化所述非易失性設(shè)備的功率消耗的總量或耐久性。
12. 根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中,每個非易失性設(shè)備與磁盤設(shè)備相比具有更少的可重寫周期,所述使用狀態(tài)管理表包括重寫周期作為每個非易失性設(shè)備的使用狀態(tài)信息,并且包括所述重寫周期的閾值作為耐久性閾值,以及如果處理單元請求將所述非易失性設(shè)備的耐久性優(yōu)化為較高的優(yōu)先級,如果處理單元基于所述使用狀態(tài)管理表檢測到所述多個非易失性設(shè)備的一個的重寫周期的使用狀態(tài)超過了所述重寫周期的閾值,處理單元將所述非易失性設(shè)備確定為所述第 一存儲層以及將所述磁盤設(shè)備確定為所述第二存儲層。
13. 根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中, 所述磁盤設(shè)備與每個非易失性設(shè)備相比具有較低的讀取響應(yīng)速度,使用狀態(tài)信息,并且包括所述讀取數(shù)據(jù)的使用周期的閾值作為耐久性閾值,以及如果處理單元請求將功率消耗的總量優(yōu)化為較高的優(yōu)先級,如果處理單元基于所述使用狀態(tài)管理表檢測到所述多個非易失性設(shè)備的一個的讀取數(shù)據(jù)的使用周期的使用狀態(tài)超過了所述讀取數(shù)據(jù)的使用周期的閾值,處理單元將所述非易失性設(shè)備確定為所述第二存儲層以及將所述^茲盤設(shè)備確定為所述第 一存儲層。
14. 根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中,所述使用狀態(tài)管理表包括故障區(qū)域的數(shù)目作為每個非易失性設(shè)備的使用狀態(tài)信息,并且包括所述故障區(qū)域的數(shù)目的閾值作為耐久性閾值,以及如果處理單元請求將非易失性設(shè)備的耐久性優(yōu)化為較高的優(yōu)先級,并且如果處理設(shè)備基于所述使用狀態(tài)管理表檢測到所述多個非易失性設(shè)備的一個的故障區(qū)域的數(shù)目的使用狀態(tài)超過了所述故障區(qū)域的數(shù)目的閾值,處理單元將所述非易失性設(shè)備確定為所述第 一存儲層,并且將所述磁盤設(shè)備確定為所迷第二存儲層。
15.根據(jù)權(quán)利要求5所述的存儲系統(tǒng),其中,如果所述第二存儲層是非易失性設(shè)備,處理單元將所述磁盤設(shè)備的某個區(qū)域確定作為臨時存儲區(qū)域,并且將要被轉(zhuǎn)移的數(shù)據(jù)連續(xù)地一部分一部分地復(fù)制到所述磁盤設(shè)備的所述臨時存儲區(qū)域,并且當(dāng)在數(shù)據(jù)轉(zhuǎn)移操作過程中從主機計算機接收部分數(shù)據(jù)的讀請求時,處理單元將所述第一存儲層的磁盤設(shè)備中存儲的對應(yīng)數(shù)據(jù)重新發(fā)送到主機計算機,并且異步地處理數(shù)據(jù)轉(zhuǎn)移以將數(shù)據(jù)連續(xù)地一部分一部分地轉(zhuǎn)移到所述第二存儲層的非易失性設(shè)備。
全文摘要
本發(fā)明涉及一種存儲系統(tǒng)。該存儲系統(tǒng)包括多個磁盤設(shè)備,存儲從主機計算機接收的數(shù)據(jù);多個非易失性設(shè)備,存儲從主機計算機接收的數(shù)據(jù);以及處理單元,控制從主機計算機到與多個磁盤設(shè)備和多個非易失性設(shè)備相對應(yīng)的多個邏輯卷的讀/寫請求,并且管理與多個邏輯卷相對應(yīng)的多個磁盤設(shè)備和多個非易失性設(shè)備的存儲層和多個磁盤設(shè)備和多個非易失性設(shè)備的每一個的屬性信息之間的關(guān)系,其中處理單元基于用戶策略將存儲層的第一存儲層確定為源存儲層,以及將存儲層的第二存儲層確定為目的存儲層,并且基于用戶策略將存儲在第一存儲層的至少一個邏輯卷中的數(shù)據(jù)轉(zhuǎn)移到第二存儲層的至少一個邏輯卷。
文檔編號G06F3/06GK101676857SQ200910204748
公開日2010年3月24日 申請日期2006年6月29日 優(yōu)先權(quán)日2005年9月22日
發(fā)明者中村崇仁, 藤本和久, 藤林昭 申請人:株式會社日立制作所