專利名稱:集群型存儲系統(tǒng)及其管理方法
技術領域:
本發(fā)明涉及可從小規(guī)模擴展到大規(guī)模配置的存儲系統(tǒng),以及該存儲系統(tǒng)的管理方法。
背景技術:
由于IT系統(tǒng)對商業(yè)的滲入和因特網(wǎng)的發(fā)展導致的IT系統(tǒng)便攜性在商業(yè)中的擴展,用于保存IT系統(tǒng)中處理的數(shù)據(jù)的存儲系統(tǒng)已經(jīng)在IT系統(tǒng)中起到了核心的作用。存在許多類型的存儲系統(tǒng),從小規(guī)模配置的系統(tǒng)到大規(guī)模配置的系統(tǒng)。
作為現(xiàn)有技術中提供小規(guī)模到大規(guī)模配置的主存儲系統(tǒng)的一個例子,在JP-A-2000-99281中公開了例如圖2所示的存儲系統(tǒng)的體系結(jié)構(gòu)。這個存儲系統(tǒng)8配置有和計算機3(也稱作″服務器″)執(zhí)行數(shù)據(jù)傳送的多個通道IF(接口)單元11,和硬盤組2執(zhí)行數(shù)據(jù)傳送的多個磁盤IF單元16,臨時存儲硬盤組2中存儲的數(shù)據(jù)的高速緩沖存儲器單元14,和存儲涉及存儲系統(tǒng)8的控制信息的控制存儲器單元15(例如涉及存儲系統(tǒng)8中的數(shù)據(jù)傳送控制的信息和硬盤組2中存儲的數(shù)據(jù)的管理信息)。互連網(wǎng)絡41連接通道IF單元11,磁盤IF單元16和高速緩沖存儲器單元14,而互連網(wǎng)絡42連接通道IF單元11,磁盤IF單元16和控制存儲器單元15。并且,由公共總線和交換機構(gòu)造互連網(wǎng)絡41和互連網(wǎng)絡42。
通過這種方式,在單個存儲系統(tǒng)8中,高速緩沖存儲器單元14和控制存儲器單元15具有可從所有通道IF單元11和磁盤IF單元16訪問的構(gòu)造。
通道IF單元11包含連接到服務器3的接口(主機IF)104,控制針對服務器3的輸入/輸出的微處理器103,控制對高速緩沖存儲器單元14的訪問的存儲器訪問單元106,和控制對控制存儲器單元15的訪問的存儲器訪問單元107。并且,磁盤IF單元16包含連接到硬盤組2的接口(磁盤IF)105,控制針對硬盤組2的輸入/輸出的微處理器103,控制對高速緩沖存儲器單元14的訪問的存儲器訪問單元106,和控制對控制存儲器單元15的訪問的存儲器訪問單元107。磁盤IF單元16也執(zhí)行RAID的控制。
在上述存儲系統(tǒng)中,已經(jīng)能夠靈活地改變通道IF單元11和磁盤IF單元16的數(shù)量,因為控制與服務器3的數(shù)據(jù)傳送的通道IF單元11和控制與硬盤組2的數(shù)據(jù)傳送的磁盤IF單元16被分離,并且通過高速緩沖存儲器單元14和控制存儲器單元15控制通道IF單元11和磁盤IF單元16之間的數(shù)據(jù)傳送。因此,存儲系統(tǒng)已經(jīng)可以具有小規(guī)模到大規(guī)模的配置。
并且,在JP-A-2000-242434公開的現(xiàn)有技術中,如圖21所示,多個磁盤陣列設備4通過磁盤陣列交換機5連接到多個服務器3,使得連接到磁盤陣列交換機5和每個磁盤陣列設備4的系統(tǒng)配置管理裝置60將多個磁盤陣列設備4管理為單個存儲系統(tǒng)9。
發(fā)明內(nèi)容
在以銀行,安全公司和電話公司為代表的大型公司中,出現(xiàn)了通過將通常散布于不同位置的計算機系統(tǒng)和存儲系統(tǒng)構(gòu)造成集中于數(shù)據(jù)中心內(nèi)的計算機系統(tǒng)和存儲系統(tǒng),來降低運行、維護和管理計算機系統(tǒng)和存儲系統(tǒng)所需的費用的趨勢。
另外,在例如IT泡沫崩潰的效應所導致的經(jīng)濟衰退期間,出現(xiàn)了企業(yè)縮減IT系統(tǒng)的初始投資并且響應企業(yè)規(guī)模的擴充而進行系統(tǒng)擴充的趨勢。因此,要求存儲系統(tǒng)具有性能和成本的可伸縮性,使得能夠縮減初始投資并且以和企業(yè)規(guī)模相稱的合理投資來擴充規(guī)模。
在圖2示出的現(xiàn)有技術中,所有通道IF單元11和所有磁盤IF單元16通過利用高速緩沖存儲器單元14和控制存儲器單元15控制通道IF單元11和磁盤IF單元16之間的數(shù)據(jù)傳送,執(zhí)行從服務器3對硬盤組2的數(shù)據(jù)讀/寫。因此,來自所有通道IF單元11和所有磁盤IF單元16的訪問負載集中在高速緩沖存儲器單元14和控制存儲器單元15上。
要求存儲系統(tǒng)具備的性能(單位時間數(shù)據(jù)輸入/輸出頻率和單位時間數(shù)據(jù)傳送量)逐年提高。為了適應未來的要求,有必要改進通道IF單元11和磁盤IF單元16的數(shù)據(jù)傳送處理性能。
如上所述,所有通道IF單元11和所有磁盤IF單元16通過高速緩沖存儲器單元14和控制存儲器單元15控制通道IF單元11和磁盤IF單元16之間的數(shù)據(jù)傳送。于是,存在的問題是,當通道IF單元11和磁盤IF單元16的數(shù)據(jù)傳送處理性能提高時,高速緩沖存儲器單元14和控制存儲器單元15的訪問負載增加,從而成為瓶頸,使得難以在未來提高存儲系統(tǒng)8的性能。
可以通過增加高速緩沖存儲器單元14和控制存儲器單元15的規(guī)模來提高允許的訪問性能。然而,為了使高速緩沖存儲器單元14和控制單元15可從所有通道IF單元11和磁盤IF單元16訪問,有必要將高速緩沖存儲器單元14和控制存儲器單元15分別管理為單個共享存儲器空間。于是,存在的問題是,當高速緩沖存儲器單元14和控制存儲器單元15的規(guī)模增加時,難以降低小規(guī)模配置的存儲系統(tǒng)的成本,并且難以低成本地提供小規(guī)模配置的系統(tǒng)。
并且,在圖21示出的現(xiàn)有技術中,通過增加磁盤陣列交換機5的端口數(shù)量并且以多級段連接多個磁盤陣列交換機5,可以增加可連接的磁盤陣列設備4和服務器3的數(shù)量,使得可以提供能夠可伸縮地適應小規(guī)模到大規(guī)模的配置的存儲系統(tǒng)9。然而存在的問題是,因為服務器3通過磁盤陣列交換機5訪問磁盤陣列設備4,發(fā)生在與磁盤陣列交換機5中服務器3的接口部分上、將服務器3和磁盤陣列交換機5之間的協(xié)議轉(zhuǎn)換成磁盤陣列交換機5中的協(xié)議的處理,以及在與磁盤陣列交換機5中磁盤陣列設備4的接口部分上、將磁盤陣列交換機5中的協(xié)議轉(zhuǎn)換成磁盤陣列交換機5和磁盤陣列設備4之間的協(xié)議的處理,使得與無需磁盤陣列交換機5的干預便可直接訪問磁盤陣列設備4的情況相比,響應性能較差。
通過一種存儲系統(tǒng)解決了上述問題,該存儲系統(tǒng)包括多個協(xié)議轉(zhuǎn)換單元,包含與外部設備的接口,并且將與外部設備交換的數(shù)據(jù)的讀/寫協(xié)議轉(zhuǎn)換成系統(tǒng)內(nèi)的協(xié)議;多個高速緩存控制單元,包含存儲與外部設備讀/寫的數(shù)據(jù)的高速緩沖存儲器,并且包含控制高速緩沖存儲器的功能;和互連多個協(xié)議轉(zhuǎn)換單元和多個高速緩存控制單元的互連網(wǎng)絡,其中多個高速緩存控制單元被分成多個控制集群,在控制集群內(nèi)獨立進行高速緩沖存儲器的控制,并且系統(tǒng)管理單元將多個協(xié)議轉(zhuǎn)換單元和多個控制集群管理為單個系統(tǒng)。
可以如此構(gòu)造存儲系統(tǒng),使得互連網(wǎng)絡被分成傳送與外部設備讀/寫的數(shù)據(jù)的第三互連網(wǎng)絡,和傳送用于管理存儲系統(tǒng)的控制信息的第四互連網(wǎng)絡,其中系統(tǒng)管理單元連接到第四互連網(wǎng)絡。
也可以如此構(gòu)造存儲系統(tǒng),使得高速緩存控制單元和第二協(xié)議轉(zhuǎn)換單元被安裝在相同的板上。
此外,可以如此構(gòu)造存儲系統(tǒng),使得執(zhí)行數(shù)據(jù)處理的至少一個外部設備和至少一個第二存儲系統(tǒng)連接到與多個第一協(xié)議轉(zhuǎn)換單元的外部設備的接口,并且通過經(jīng)由互連網(wǎng)絡在執(zhí)行數(shù)據(jù)處理的外部設備連接到的第一協(xié)議轉(zhuǎn)換單元和第二存儲系統(tǒng)連接到的第一協(xié)議轉(zhuǎn)換單元之間執(zhí)行數(shù)據(jù)傳送,進行從執(zhí)行數(shù)據(jù)處理的外部設備針對第二存儲系統(tǒng)的數(shù)據(jù)輸入/輸出。
并且,可以如此構(gòu)造存儲系統(tǒng),使得系統(tǒng)管理單元包含將第二存儲系統(tǒng)提供的邏輯卷管理為存儲系統(tǒng)的卷,以及將邏輯卷提供給包含數(shù)據(jù)處理功能的外部設備的功能。
通過本發(fā)明的實施例和附圖可以本申請公開的問題和解決方案。
圖1的圖例示出了存儲系統(tǒng)的構(gòu)造的例子;圖2的圖例示出了常規(guī)存儲系統(tǒng)的構(gòu)造的例子;圖3的圖例示出了存儲系統(tǒng)的構(gòu)造的例子;圖4的圖例示出了存儲系統(tǒng)的邏輯構(gòu)造的例子;圖5的圖例示出了存儲系統(tǒng)的構(gòu)造的例子;
圖6的圖例示出了互連網(wǎng)絡的詳細結(jié)構(gòu)的例子;圖7的圖例示出了互連網(wǎng)絡的詳細結(jié)構(gòu)的例子;圖8的圖例示出了協(xié)議轉(zhuǎn)換單元的構(gòu)造的例子;圖9的圖例示出了高速緩存控制單元的構(gòu)造的例子;圖10的圖例示出了系統(tǒng)管理單元的構(gòu)造的例子;圖11的圖例示出了存儲系統(tǒng)的示例性管理配置;圖12的圖例示出了管理表的例子;圖13的圖例示出了管理表的例子;圖14的圖例示出了管理表的例子;圖15的圖例示出了管理表的例子;圖16的圖例示出了系統(tǒng)啟動時的初始化流程的例子;圖17的圖例示出了系統(tǒng)關閉時的流程的例子;圖18的圖例示出了讀操作流程的例子;圖19的圖例示出了寫操作流程的例子;圖20的圖例示出了存儲系統(tǒng)被安裝在外殼中的例子;圖21的圖例示出了常規(guī)存儲系統(tǒng)的構(gòu)造的例子;圖22的圖例示出了交換單元的構(gòu)造的例子;圖23的圖例示出了分組格式的例子;圖24的圖例示出了存儲系統(tǒng)的構(gòu)造的例子;圖25的圖例示出了磁盤控制單元的構(gòu)造的例子;圖26的圖例示出了外部設備連接到協(xié)議轉(zhuǎn)換單元的構(gòu)造的例子;圖27的圖例示出了外部設備連接到協(xié)議轉(zhuǎn)換單元的構(gòu)造的例子;圖28的圖例示出了存儲系統(tǒng)的構(gòu)造的例子;圖29的圖例示出了互連網(wǎng)絡的詳細結(jié)構(gòu)的例子;圖30的圖例示出了存儲系統(tǒng)的構(gòu)造的例子;而圖31的圖例示出了高速緩存控制單元的構(gòu)造的例子。
具體實施例方式
下面參照附圖詳細描述本發(fā)明的實施例。
如圖1所示,存儲系統(tǒng)1包含作為與服務器3或硬盤組2的接口單元的協(xié)議轉(zhuǎn)換單元10,高速緩存控制單元21,系統(tǒng)管理單元60和硬盤組2。通過互連網(wǎng)絡31連接協(xié)議轉(zhuǎn)換單元10,高速緩存控制單元21和系統(tǒng)管理單元60。
圖6示出了互連網(wǎng)絡31的特定構(gòu)造的例子。
互連網(wǎng)絡31包含兩個交換單元51。在從協(xié)議轉(zhuǎn)換單元10,高速緩存控制單元21和系統(tǒng)管理單元60到兩個交換單元51之間均連接有一個路徑。于是,在協(xié)議轉(zhuǎn)換單元10,高速緩存控制單元21和系統(tǒng)管理單元60之間保證有兩個路徑,使得能夠提高可靠性。并且系統(tǒng)管理單元60是冗余的。于是能夠提高整個系統(tǒng)的可靠性。這里,上述數(shù)量只是一個例子,這種數(shù)量并不限于上述示例性數(shù)量。
并且,雖然將使用交換機的互連網(wǎng)絡示出作為一個例子,然而對于該互連網(wǎng)絡而言,只要能夠互連網(wǎng)絡并且傳送控制信息和數(shù)據(jù),便是適用的。例如,互連網(wǎng)絡也可以由總線構(gòu)成。
圖8示出了協(xié)議轉(zhuǎn)換單元10的特定例子。
協(xié)議轉(zhuǎn)換單元10包含至少4個與服務器3或硬盤組2的IF(外部IF)100,控制與高速緩存控制單元21或系統(tǒng)管理單元60的數(shù)據(jù)/控制信息傳送的傳送控制單元105,和兩個微處理器102。每個微處理器102包含連接到其自身以作為主存儲器的存儲器(未示出)。
這里,上述數(shù)量只是一個例子,這種數(shù)量并不限于上述示例性數(shù)量。下面所有說明中的數(shù)量只是示例性,并不用于限制本發(fā)明。
微處理器102通過共享總線108連接到外部IF 100和傳送控制單元105。并且,外部IF 100直接連接到傳送控制單元105。微處理器102控制外部IF 100和傳送控制單元105,因而微處理器102相互轉(zhuǎn)換外部IF100和服務器3或硬盤組2之間的數(shù)據(jù)讀/寫協(xié)議,以及高速緩存控制單元21或系統(tǒng)管理單元60與傳送控制單元105之間的數(shù)據(jù)傳送協(xié)議。于是,協(xié)議轉(zhuǎn)換單元10從服務器3向目標高速緩存控制單元21或另一個協(xié)議轉(zhuǎn)換單元10傳送讀/寫請求。并且,協(xié)議轉(zhuǎn)換單元10執(zhí)行從高速緩存控制單元21或另一個協(xié)議轉(zhuǎn)換單元10向硬盤組2傳送讀/寫請求的處理。
這里,微處理器102,外部IF 100和傳送控制單元105之間的連接構(gòu)造只是一個例子,此構(gòu)造并不限于上述例子。只要其具有使得微處理器102能夠控制外部IF 100和傳送控制單元105并且從外部IF 100向傳送控制單元105傳送數(shù)據(jù)的構(gòu)造,便沒有問題。
圖9示出了高速緩存控制單元21的特定例子。
高速緩存控制單元21包含至少4個微處理器101,控制與協(xié)議轉(zhuǎn)換單元10或系統(tǒng)管理單元60的數(shù)據(jù)/控制信息傳送的傳送控制單元105,臨時存儲與服務器3或硬盤組2交換的數(shù)據(jù)的高速緩沖存儲器單元111,和存儲涉及數(shù)據(jù)傳送、高速緩沖存儲器單元111的管理和硬盤組2的管理的控制信息的控制存儲器單元112。高速緩沖存儲器單元111和控制存儲器單元112中的每個包含存儲器模塊122和控制對存儲器模塊122的訪問的存儲器控制器121。這里,如果高速緩沖存儲器單元111和控制存儲器單元112均具有相同的存儲器控制器121和存儲器模塊122,并且如果高速緩沖存儲器區(qū)和控制存儲器區(qū)被分配給單個存儲器空間上的不同區(qū)域,則沒有問題。并且,每個微處理器101包含連接到其自身以作為主存儲器的存儲器(未示出)??蛇x地,如果4個微處理器以SMP構(gòu)造以作為其自身的主存儲器,其中它們共享高速緩沖存儲器單元111和控制存儲器單元112,則沒有問題。
通過交換機109連接微處理器101,高速緩沖存儲器單元111,控制存儲器單元112和傳送控制單元105。微處理器101使用控制存儲器單元112中存儲的控制信息控制對高速緩沖存儲器的數(shù)據(jù)讀/寫,高速緩沖存儲器的目錄管理,與協(xié)議轉(zhuǎn)換單元10的數(shù)據(jù)傳送和與系統(tǒng)管理單元60的系統(tǒng)管理信息交換。微處理器101也對向連接到協(xié)議轉(zhuǎn)換單元10的硬盤組2寫入的數(shù)據(jù)執(zhí)行所謂的RAID處理或冗余處理。如果也在協(xié)議轉(zhuǎn)換單元10中執(zhí)行這個RAID處理,則沒有問題。
這里,微處理器101,高速緩沖存儲器單元111,控制存儲器單元112和傳送控制單元105之間的連接構(gòu)造只是一個例子,此構(gòu)造并不限于上述例子。只要其具有使得微處理器101能夠控制高速緩沖存儲器單元111,控制存儲器單元112和傳送控制單元105的構(gòu)造,便沒有問題。
圖22示出了交換單元51的特定例子。
交換單元51包含至少4個路徑IF 130,頭分析單元131,仲裁器132,縱橫交換機133,10個緩沖區(qū)134,4個路徑IF 135和2個路徑IF 136。
路徑IF 130是將連接路徑與協(xié)議轉(zhuǎn)換單元10相連的IF,并且從4個協(xié)議轉(zhuǎn)換單元10中的每個均連接一個路徑。路徑IF 135是將連接路徑與高速緩存控制單元21相連的IF,并且從4個高速緩存控制單元21中的每個均連接一個路徑。緩沖區(qū)134緩沖協(xié)議轉(zhuǎn)換單元10,高速緩存控制單元21和系統(tǒng)管理單元60之間傳送的分組。
圖23示出了協(xié)議轉(zhuǎn)換單元10,高速緩存控制單元21和系統(tǒng)管理單元60之間傳送的傳送的格式的例子。分組200包含頭210,有效負載220和檢錯碼230。頭210中存儲至少表示分組的發(fā)送源和發(fā)送目的地的信息。有效負載220中存儲命令,地址,數(shù)據(jù)和狀態(tài)。檢錯碼230是在傳送分組時用于檢測分組內(nèi)的差錯的編碼。當分組被輸入到路徑IF 130,135和136時,分組的頭210被發(fā)送到頭分析單元131。在頭分析單元131中,根據(jù)路徑IF的分組的發(fā)送目的地確定相連路徑IF的請求,并且這個連接請求被發(fā)送到仲裁器132。在仲裁器132中,根據(jù)來自路徑IF的連接請求進行仲裁,并且根據(jù)仲裁結(jié)果針對縱橫交換機133輸出表示連接切換的信號,以切換縱橫交換機133中的連接。這里,在本實施例中,交換單元51被構(gòu)造成在每個路徑IF上具有緩沖區(qū),但是如果其構(gòu)造使得交換單元51具有單個較大緩沖區(qū)并且從中為每個路徑IF分配分組存儲區(qū),則沒有問題。并且,在頭分析單元131中存儲交換單元51內(nèi)的差錯信息。
圖10示出了系統(tǒng)管理單元60的特定例子。
系統(tǒng)管理單元60包含至少一個微處理器101,控制與協(xié)議轉(zhuǎn)換單元10或高速緩存控制單元21的數(shù)據(jù)/控制信息傳送的傳送控制單元105,存儲器控制器121,存儲器模塊122和LAN控制器123。微處理器101使用存儲器模塊122作為其自身的主存儲器??蛇x地,如果微處理器101具有連接到其自身、與存儲器模塊122分離的存儲器作為主存儲器,則沒有問題。
微處理器101通過存儲器控制器121連接到存儲器模塊122,傳送控制單元105和LAN控制器123。微處理器101根據(jù)從協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21收集的管理信息,互連網(wǎng)絡31的管理信息和用戶從連接到LAN控制器123的管理控制臺設置的信息整理出整個存儲系統(tǒng)1的管理信息,并且在存儲器模塊122中存儲這個管理信息。微處理器101還使用這個信息進行存儲系統(tǒng)1的管理。這個管理信息保存在連接到存儲器控制器121的硬盤組2或非易失存儲器(未示出)中,從而能夠提高存儲系統(tǒng)1的可靠性。
這里,微處理器101,存儲器控制器121,存儲器模塊122,LAN控制器123和傳送控制單元105之間的連接構(gòu)造只是一個例子,此構(gòu)造并不限于上述例子。只要其具有使得微處理器101能夠控制存儲器控制器121,存儲器模塊122,LAN控制器123和傳送控制單元105的構(gòu)造,便沒有問題。
如圖1所示,在本實施例中,2個高速緩存控制單元21被合并為單個控制集群70,并且高速緩沖存儲器單元111的管理被封閉在控制集群70內(nèi)。也就是說,指定控制集群70的高速緩存控制單元21內(nèi)的微處理器101只管理該控制集群70內(nèi)的高速緩沖存儲器單元111和控制存儲器單元112,而不管理另一個控制集群70內(nèi)的高速緩沖存儲器單元111和控制存儲器單元112。
這里,2個高速緩存控制單元21內(nèi)的高速緩沖存儲器單元111和2個高速緩存控制單元21內(nèi)的控制存儲器單元112可以加倍(doubled)。通過如此,在一個高速緩存控制單元21中產(chǎn)生差錯的情況下,能夠繼續(xù)其存儲器被加倍的另一個高速緩存控制單元21中的操作,使得能夠提高存儲系統(tǒng)1的可靠性。
如果有必要在多個控制集群70內(nèi)的高速緩沖存儲器單元111中倍增存儲(multiply store)相同數(shù)據(jù),則傳送這個數(shù)據(jù)到高速緩存控制單元21的協(xié)議轉(zhuǎn)換單元10在系統(tǒng)管理單元60的存儲器的預定區(qū)域中,記錄表示在哪些控制集群70的高速緩沖存儲器單元111中倍增存儲哪些數(shù)據(jù)的控制信息。同時,協(xié)議轉(zhuǎn)換單元10向高速緩存控制單元21發(fā)送表示數(shù)據(jù)是倍增存儲數(shù)據(jù)的控制信息和數(shù)據(jù)。如果其高速緩沖存儲器單元111中倍增存儲的數(shù)據(jù)被更新或刪除,則高速緩存控制單元21向系統(tǒng)管理單元60發(fā)送表示此情況的控制信息。當系統(tǒng)管理單元60接收此信息時,它根據(jù)表示哪些控制集群70的高速緩沖存儲器單元111中倍增存儲存儲器內(nèi)記錄的數(shù)據(jù)的控制信息,執(zhí)行更新或刪除倍增存儲的數(shù)據(jù)的處理。
如上所述,通過將高速緩存控制單元21內(nèi)微處理器101控制的高速緩沖存儲器單元111的范圍限制到控制集群70內(nèi)部,能夠降低高速緩沖存儲器單元111和控制存儲器單元112的訪問負載,結(jié)果能夠提高存儲系統(tǒng)1的性能。
如圖4所示,還可以有這樣的構(gòu)造,其中協(xié)議轉(zhuǎn)換單元10被組合成連接到服務器3的協(xié)議轉(zhuǎn)換單元10和連接到硬盤組2的協(xié)議轉(zhuǎn)換組10,連接到硬盤組的2個高速緩存控制單元21和2個協(xié)議轉(zhuǎn)換單元10被合并成單個控制集群71,并且在該控制集群71的高速緩存控制單元21內(nèi)的高速緩沖存儲器單元111中只存儲連接到該控制集群內(nèi)的協(xié)議轉(zhuǎn)換單元10的硬盤組2中記錄的數(shù)據(jù)或已經(jīng)記錄的數(shù)據(jù)。同時,高速緩沖存儲器單元111的管理被封閉在控制集群71內(nèi)部。也就是說,指定控制集群71的高速緩存控制單元21內(nèi)的微處理器101只管理該控制集群71內(nèi)的高速緩沖存儲器單元111,而不管理另一個控制集群71內(nèi)的緩沖存儲器單元111。
這里,雖然在附圖中示出了分離連接到服務器3的協(xié)議轉(zhuǎn)換單元10所鏈接到的互連網(wǎng)絡31和連接到硬盤組2的協(xié)議轉(zhuǎn)換單元10所鏈接到的互連網(wǎng)絡31的例子,然而協(xié)議轉(zhuǎn)換單元10物理連接到相同的互連網(wǎng)絡31。
并且,2個高速緩存控制單元21之間可以加倍高速緩沖存儲器單元111和控制存儲器單元112的內(nèi)容。通過如此,在一個高速緩存控制單元21中產(chǎn)生差錯的情況下,能夠繼續(xù)其存儲器被加倍的另一個高速緩存控制單元21中的操作,使得能夠提高存儲系統(tǒng)1的可靠性。
如上所述,通過將高速緩存控制單元21內(nèi)微處理器101控制的高速緩沖存儲器單元111的范圍限制到控制集群71內(nèi)部,能夠降低高速緩沖存儲器單元111和控制存儲器單元112的訪問負載,結(jié)果能夠提高存儲系統(tǒng)1的性能。
并且,由于上述管理,數(shù)據(jù)不再倍增存儲在圖4示出的構(gòu)造的多個控制集群71的高速緩沖存儲器單元111中。于是,與圖1的構(gòu)造相比,在圖1的構(gòu)造中曾經(jīng)必要的系統(tǒng)管理單元60對多個控制集群70的高速緩沖存儲器單元111中倍增存儲的數(shù)據(jù)的一致性控制變得不必要,系統(tǒng)管理被簡化,并且能夠進一步提高了存儲系統(tǒng)1的性能。
如圖30所示,也可以有這樣的構(gòu)造,其中控制集群70中的2個高速緩存控制單元21通過2個路徑相連。圖31示出了在這種情況下高速緩存控制單元21的詳細結(jié)構(gòu)。
圖31示出的高速緩存控制單元與圖9示出的高速緩存控制單元21具有相同的構(gòu)造,除了連接到交換機109的內(nèi)部IF 126之外。因為使用連接2個高速緩存控制單元21的連接路徑進行數(shù)據(jù)和控制信息的通信,2個內(nèi)部IF 126連接到交換機109。通過將2個高速緩存控制單元21的內(nèi)部IF 126與連接路徑互連,通過連接路徑進行數(shù)據(jù)和控制信息的通信。例如,通過連接路徑進行2個高速緩存控制單元21的高速緩沖存儲器單元111或控制存儲器單元112中存儲的信息的加倍。于是,在構(gòu)成控制集群70的2個高速緩存控制單元21之一中產(chǎn)生差錯的情況下,由于能夠繼續(xù)存儲系統(tǒng)與其它高速緩存控制單元進行的操作,所以提高了可靠性。
下面根據(jù)圖11描述整個存儲系統(tǒng)1的管理配置的例子。
這里會描述圖4示出的構(gòu)造的存儲系統(tǒng)1的管理配置的例子。
在系統(tǒng)管理單元60中,通過將整個存儲系統(tǒng)1的管理分為3層-即網(wǎng)絡,邏輯路徑和存儲-來進行管理,使得管理被簡化。具體地,系統(tǒng)管理單元60包含作為軟件程序的網(wǎng)絡管理部分503,邏輯路徑管理部分502和存儲管理部分501。應當注意,圖11示出的每個部分實際是由系統(tǒng)管理單元60的微處理器101執(zhí)行的軟件程序。這些程序通過網(wǎng)絡或便攜存儲介質(zhì)被存儲在系統(tǒng)管理單元60的存儲器中。
此外,在下面的說明中,在考察圖11示出的每個部分的情況下,這個處理實際由系統(tǒng)管理單元60的微處理器執(zhí)行。此外,每個部分中包含的處理也是程序。應當注意,每個部分也可以由專用硬件執(zhí)行。
這里,通過網(wǎng)絡表示互連網(wǎng)絡31。網(wǎng)絡管理部分503至少執(zhí)行網(wǎng)絡控制541和網(wǎng)絡出錯處理542。例如,在圖6示出的交換單元51所構(gòu)造的互連網(wǎng)絡的情況下,網(wǎng)絡管理部分503執(zhí)行協(xié)議轉(zhuǎn)換單元10,交換單元51,高速緩存控制單元21和系統(tǒng)管理單元60的物理鏈路的設置,鏈路的復位和物理差錯的檢測/處理。
接著,邏輯路徑管理部分502至少執(zhí)行邏輯路徑分配531和邏輯路徑阻塞/切換處理532。這里,通過邏輯路徑表示分別在協(xié)議轉(zhuǎn)換單元10,高速緩存控制單元21和系統(tǒng)管理單元60之間設置的邏輯路徑。例如在圖6示出的構(gòu)造的情況下,通過一個交換單元51從一個協(xié)議轉(zhuǎn)換單元10引向一個高速緩存控制單元21的路徑充當一個邏輯路徑。于是,在一個協(xié)議轉(zhuǎn)換單元10和一個高速緩存控制單元21之間設置2個邏輯路徑。類似地,在協(xié)議轉(zhuǎn)換單元10和系統(tǒng)管理單元60之間,系統(tǒng)管理單元60和高速緩存控制單元21之間,協(xié)議轉(zhuǎn)換單元10之間,高速緩存控制單元21之間和系統(tǒng)管理單元60之間設置2個邏輯路徑。在邏輯路徑管理部分502中,執(zhí)行系統(tǒng)啟動時邏輯路徑的設置,單元之間的2個邏輯路徑之一中出現(xiàn)差錯的情況下的阻塞,和切換到其它邏輯路徑的處理。
接著,存儲管理部分501至少執(zhí)行卷集成管理521,服務器LU(邏輯單元)分配522和系統(tǒng)錯誤處理523。在卷管理521中,集成和管理每個控制集群71中分別管理的邏輯卷。在服務器LU分配522中,LU從集成的邏輯卷中分出來并且分配給每個服務器3。由于卷管理521和服務器LU分配522,對于服務器3,可以說明分別執(zhí)行獨立控制的多個控制集群71被組合成單個存儲系統(tǒng)1。
在本實施例中,如圖26所示,也可以將其它存儲系統(tǒng)4連接到連接服務器3的協(xié)議轉(zhuǎn)換單元10。在這種情況下,也在卷集成管理521中管理其它存儲系統(tǒng)提供的LU,并且這些LU被分配給服務器LU分配522中的服務器3,從而可以通過存儲系統(tǒng)1從服務器3訪問其它存儲系統(tǒng)4的卷。
并且在存儲管理部分501中,管理一個表示哪些服務器被連接到哪些協(xié)議轉(zhuǎn)換單元10的表,從而能夠進行連接到存儲系統(tǒng)1的多個服務器3之間的通信和數(shù)據(jù)傳送。
當在存儲系統(tǒng)4和連接到協(xié)議轉(zhuǎn)換單元10的服務器3之間執(zhí)行數(shù)據(jù)傳送時,通過互連網(wǎng)絡31在協(xié)議轉(zhuǎn)換單元10之間執(zhí)行數(shù)據(jù)傳送。在這種情況下,數(shù)據(jù)也可以被高速緩存在系統(tǒng)管理單元60的存儲器中。數(shù)據(jù)也可以被高速緩存在高速緩存控制單元21的高速緩沖存儲器單元111中。于是,提高了服務器3和存儲系統(tǒng)4之間的數(shù)據(jù)傳送的性能。
并且,在本實施例中,如圖27所示,可以通過SAN交換機65連接存儲系統(tǒng)1,服務器3和其它存儲系統(tǒng)4。此外,協(xié)議轉(zhuǎn)換單元10內(nèi)的外部IF 100被構(gòu)造成通過SAN交換機65訪問服務器3和其它存儲系統(tǒng)4。通過如此,可以從連接到存儲系統(tǒng)1的服務器3訪問服務器3和連接到SAN交換機65或包括多個SAN交換機65的網(wǎng)絡的其它存儲系統(tǒng)4。
在系統(tǒng)出錯處理523中,從協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21收集相應的錯誤信息,從邏輯路徑管理部分502收集邏輯路徑錯誤信息,并且根據(jù)這種信息確定存儲系統(tǒng)1中阻塞/替代的設備點。另外,命令實施阻塞處理的控制信息被發(fā)送到相應設備點(協(xié)議轉(zhuǎn)換單元10,高速緩存控制單元21或交換單元51),并且針對已經(jīng)接收控制信息的相應設備點執(zhí)行阻塞處理。在完成阻塞處理之后,在管理控制臺上顯示提示用戶替換出錯設備點的消息。此外,當用戶輸入指示出錯設備點的替換完成的消息時,命令阻塞刪除的控制信息被發(fā)送到相應設備點,并且針對已經(jīng)接收控制信息的設備點執(zhí)行阻塞刪除處理。在完成阻塞刪除處理之后,系統(tǒng)返回到正常操作。
如上所述,通過在系統(tǒng)管理單元60內(nèi)將管理分成3個層來管理整個存儲系統(tǒng)1。
這里,即使使用網(wǎng)絡管理部分503和邏輯路徑管理部分502作為單個管理部分來執(zhí)行系統(tǒng)的控制,也沒有問題。
在本發(fā)明中,以前在現(xiàn)有技術中與服務器3的數(shù)據(jù)/命令發(fā)送和接收,在通道IF單元11中執(zhí)行的命令分析和對來自服務器3的請求的排序處理,與硬盤組2的數(shù)據(jù)/命令發(fā)送和接收,以及磁盤IF單元16中執(zhí)行的命令分析和針對硬盤組2的請求的排序,被分離為協(xié)議轉(zhuǎn)換單元10的處理,并且通道IF單元11和磁盤IF單元16的其它處理被合并為高速緩存控制單元21中的處理。
于是在高速緩存控制單元21中至少執(zhí)行控制集群內(nèi)的高速緩存控制561,數(shù)據(jù)傳送控制562和卷管理563。在高速緩存控制161中,執(zhí)行針對高速緩沖存儲器單元111的數(shù)據(jù)讀/寫的控制,控制存儲器單元112中存儲的高速緩沖存儲器單元111內(nèi)目錄的管理,和檢查所請求數(shù)據(jù)是否存在于高速緩沖存儲器單元111中的命中/命中失誤處理。在數(shù)據(jù)傳送控制562中,執(zhí)行協(xié)議轉(zhuǎn)換單元10和高速緩沖存儲器單元111之間的數(shù)據(jù)傳送的控制。在控制集群內(nèi)的卷控制563中,通過硬盤組2的物理卷構(gòu)造控制集群內(nèi)的邏輯卷,并且管理表示此關系的表。
并且,協(xié)議轉(zhuǎn)換單元10被分成作為連接到服務器3的協(xié)議轉(zhuǎn)換單元10的組的服務器連接組504,和作為連接到硬盤組2的協(xié)議轉(zhuǎn)換單元10的組的設備連接組506。
服務器連接組504中包含的協(xié)議轉(zhuǎn)換單元10至少執(zhí)行命令處理551和請求排序552。在命令處理551中,執(zhí)行與服務器3的命令發(fā)送和接收,并且執(zhí)行對來自服務器3的命令的分析和向服務器3的命令提交。在請求排序552中,來自服務器3的數(shù)據(jù)和數(shù)據(jù)讀/寫命令被轉(zhuǎn)換到內(nèi)部協(xié)議,并且被傳送到相應的高速緩存控制單元21或協(xié)議轉(zhuǎn)換單元10。并且,從高速緩存控制單元21或協(xié)議轉(zhuǎn)換單元10到服務器3的命令和數(shù)據(jù)被從內(nèi)部協(xié)議轉(zhuǎn)換到服務器3和協(xié)議轉(zhuǎn)換單元10之間的協(xié)議,并且被發(fā)送到服務器3。
屬于設備連接組506的協(xié)議轉(zhuǎn)換單元10至少執(zhí)行命令處理571,請求排序572,設備控制和設備出錯處理。
在本實施例中,通過設備表示硬盤組2,但是只要是記錄塊數(shù)據(jù)的設備即可。例如,即使設備是光盤也沒有問題。
在命令處理571中,執(zhí)行與設備的命令發(fā)送和接收,并且執(zhí)行對設備的命令提交和對來自設備的應答的分析。在請求排序572中,針對設備的數(shù)據(jù)和數(shù)據(jù)讀/寫命令被從內(nèi)部協(xié)議轉(zhuǎn)換到設備和協(xié)議轉(zhuǎn)換單元之間的協(xié)議,并且傳送到相應設備。并且,來自設備的應答和數(shù)據(jù)被傳送到相應高速緩存控制單元21或協(xié)議轉(zhuǎn)換單元10。在設備控制573中,執(zhí)行對設備的讀/寫的控制。在設備出錯處理574中,在設備中出現(xiàn)錯誤的情況下,執(zhí)行設備的阻塞/替換處理。
如上所述,通過在高速緩存控制單元21中合并和執(zhí)行原來在現(xiàn)有技術中被通道IF單元11和磁盤IF單元16分擔與執(zhí)行的處理,可以提高存儲系統(tǒng)1的性能,因為免去了為數(shù)據(jù)傳送而通過控制存儲器單元15在通道IF單元11和磁盤IF單元16之間執(zhí)行的通信處理。
雖然前面描述了圖4示出的構(gòu)造的存儲系統(tǒng)1中的管理配置,然而在圖1示出的構(gòu)造的情況下,對多個控制集群的緩沖存儲器單元中倍增存儲的數(shù)據(jù)執(zhí)行一致性控制的處理被加到系統(tǒng)管理單元60中,從而可以進行相同的處理。
下面在圖12到15中示出了有關物理卷和邏輯卷之間的關系,邏輯卷和邏輯單元之間的關系,以及邏輯單元到服務器的分配關系的例子。下面,邏輯卷被稱作虛擬卷。
圖12示出了物理設備管理表651。也就是說,圖12示出了物理設備(在本例子中為硬盤組2)和其中物理設備合并為卷的虛擬卷之間的關系。
物理設備號(PDEV#)630分別對應于一個硬盤。由4個物理設備構(gòu)成一個虛擬卷1,明確指定的編號作為虛擬卷1的編號631被分配給控制集群71內(nèi)的這些虛擬卷。并且,表示虛擬卷1的RAID配置的RAID等級605和表示虛擬卷1的容量的卷容量601被加到虛擬卷1中。并且,表示哪個卷由哪個協(xié)議轉(zhuǎn)換單元(還稱作協(xié)議轉(zhuǎn)換適配器(PA))10管理的連接適配器號610被加到控制集群71內(nèi)的虛擬卷1中。虛擬卷2的編號632是這樣的編號,其中為了整體管理多個控制集群71的全部虛擬卷1,系統(tǒng)管理單元60為其分配整個存儲系統(tǒng)1中明確指定的編號。
當初始化時在每個控制集群71的高速緩存控制單元21中產(chǎn)生不同于物理設備管理表651的虛擬卷2編號的部分,這些部分被注冊在系統(tǒng)管理單元60中,并且系統(tǒng)管理單元60產(chǎn)生一個表(物理設備管理表651),其中根據(jù)來自所有控制集群71的表來分配虛擬卷2編號632。另外,這個表中涉及每個控制集群71的部分的復本被傳送到相應控制集群71的高速緩存控制單元21,并且每個高速緩存控制單元21將此復本存儲在控制存儲器單元112中。
在硬盤組2的配置已經(jīng)改變的情況下,管理硬盤組2的高速緩存控制單元21改變不同于物理設備管理表651的虛擬卷2編號的部分,并且將其注冊于系統(tǒng)管理單元60中。系統(tǒng)管理單元60根據(jù)注冊的信息改變物理設備管理表651,并且將表中涉及每個控制集群71的部分的復本傳送到相應控制集群71中的高速緩存控制單元21。相應高速緩存控制單元21在控制存儲器單元112中存儲該復本。
這里,如果從高速緩存控制單元21向系統(tǒng)管理單元60傳送產(chǎn)生物理設備管理表651所需的所有信息,并且在系統(tǒng)管理單元60中據(jù)此產(chǎn)生所有物理設備管理表651,則沒有問題。
圖13示出了虛擬卷管理表652。因為虛擬卷1(虛擬卷2)由多個硬盤構(gòu)成,其中容量變得大于數(shù)百GB。于是,為了提高用戶使用的方便程度,虛擬卷1(虛擬卷2)被分成多個具有較小容量的虛擬卷3。虛擬卷管理表652是用于指示虛擬卷3的編號633和虛擬卷1內(nèi)的地址641之間的關系的表。虛擬卷管理表652中還包含表示管理虛擬卷1的高速緩存控制單元21的管理高速緩存控制單元號621。
這里,在硬盤容量較小(若干GB)的情況下,或者在用戶需要的邏輯單元的容量從數(shù)十GB增大到數(shù)百GB的情況下,不需要產(chǎn)生虛擬卷3。
根據(jù)從高速緩存控制單元21傳送的虛擬邏輯卷1的信息,系統(tǒng)管理單元60產(chǎn)生虛擬卷管理表652。
圖14示出了邏輯單元管理表653。這個表示出了虛擬卷3和實際提供給用戶的邏輯單元之間的關系。邏輯單元由一或多個虛擬卷3構(gòu)成。在邏輯單元管理表653中,示出了邏輯單元編號661和構(gòu)成邏輯單元的虛擬卷3編號633之間的關系。對于邏輯單元編號661,分配在整個存儲系統(tǒng)1的位置上確定的編號。并且,還示出邏輯單元所屬的虛擬邏輯卷1的RAID等級605,以指示邏輯單元的可靠性。還示出了表示哪些高速緩存控制單元21管理構(gòu)成邏輯單元的虛擬卷3的管理高速緩存控制單元號621。即使邏輯單元由其中管理高速緩存控制單元不相同的多個虛擬卷3構(gòu)成,也沒有問題。通過如此,高速緩存控制單元21的負載被分散,并且可以提高存儲系統(tǒng)1的性能,因為對一個邏輯單元的訪問被分散到多個高速緩存控制單元21。
圖15示出了邏輯單元分配管理表654。這個表指示連接服務器號670和分配給服務器的邏輯單元之間的關系。在針對服務器分配多個邏輯單元的情況下,有必要從0開始為分配給服務器的相應邏輯單元分配編號。于是,分配從0開始的虛擬邏輯單元編號662,并且針對服務器提供邏輯單元。邏輯單元分配管理表654還指示虛擬邏輯單元編號662和邏輯單元編號661之間的關系。并且,示出了連接適配器號611和表示服務器連接到協(xié)議轉(zhuǎn)換單元10的哪些連接通道的連接通道號615。此外還示出了表示哪些高速緩存控制單元21管理構(gòu)成邏輯單元的虛擬卷3的管理高速緩存控制單元號621。為了在不必請求系統(tǒng)管理單元60的情況下知道服務器連接到的協(xié)議轉(zhuǎn)換單元10針對來自服務器的訪問請求而應當訪問哪些高速緩存控制單元21,需要管理高速緩存控制單元號621。通過如此,可以降低對來自主機的訪問請求的響應時間。
附帶地,系統(tǒng)管理單元60根據(jù)來自服務器3連接到的協(xié)議轉(zhuǎn)換單元10的信息和來自管理控制臺的用戶設置信息,產(chǎn)生/管理邏輯單元分配管理表654。另外,系統(tǒng)管理單元60向相應協(xié)議轉(zhuǎn)換單元10傳送這個表中涉及每個協(xié)議轉(zhuǎn)換單元10的部分的復本,并且每個協(xié)議轉(zhuǎn)換單元10在連接到微處理器102的存儲器中存儲此復本。
在服務器的連接配置或邏輯單元的分配已經(jīng)改變的情況下,系統(tǒng)管理單元60改變邏輯單元分配管理表654并且向相應協(xié)議轉(zhuǎn)換單元10傳送此表內(nèi)涉及每個協(xié)議轉(zhuǎn)換單元10的部分的復本,而協(xié)議轉(zhuǎn)換單元10在連接到微處理器102的存儲器(未示出)中存儲此復本。
在管理控制臺的監(jiān)視器上顯示圖12到15示出的全部或某些表,使得用戶能夠通過管理控制臺設置邏輯單元,虛擬卷和物理設備之間的全部或某些關系。
在本實施例中,多種類型的卷由從物理設備到提供給用戶的邏輯卷和邏輯單元構(gòu)成,但是這只是一個例子,卷不必具有與此相同的配置。必要的是獨立配置/管理控制集群71內(nèi)的卷,在系統(tǒng)管理單元60中整體管理存儲系統(tǒng)1中所有控制集群71提供的卷,以及從那些卷中分出卷并且將其提供給用戶,借以能夠?qū)崿F(xiàn)本發(fā)明的功能。
下面通過圖16示出在存儲系統(tǒng)1的系統(tǒng)初始化時的操作流程的例子。首先,當加電時(701),協(xié)議轉(zhuǎn)換單元10,高速緩存控制單元221和系統(tǒng)管理單元60執(zhí)行自操作檢查(702)。在自操作檢查(702)中,每個單元執(zhí)行內(nèi)部診斷以檢查單元是否正常操作或是否存在錯誤。如果存在錯誤,則單元通過以后的配置信息注冊(706)將此情況通知系統(tǒng)管理單元60。對于不能提供有關通知的錯誤,打開指示單元中出錯的顯示單元。當每個單元在自操作檢查702中確定單元正常操作時,每個單元收集其自身的配置信息(標識單元的ID編號,標識單元中的處理器的處理器編號,處理器類型/規(guī)格,存儲器容量等等)(703)。此時,硬盤組2連接到的協(xié)議轉(zhuǎn)換單元10檢查連接到它們的硬盤組2的配置,并且進行檢查以確定硬盤中是否存在錯誤。在硬盤中存在錯誤的情況下,協(xié)議轉(zhuǎn)換單元10在以后的配置信息注冊706中將此情況通知系統(tǒng)管理單元60。
接著,系統(tǒng)管理單元60中的網(wǎng)絡管理部分503收集互連網(wǎng)絡31的物理鏈路的信息,并且檢查互連網(wǎng)絡31的配置(704)。在自信息收集703之后,協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元(也稱作″CA″)21等待系統(tǒng)管理單元(也稱作″MA″)60執(zhí)行網(wǎng)絡配置信息收集所需的一個時間量(或預定時間量),并且接著建立與系統(tǒng)管理單元60的邏輯路徑(705)。此后,協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21在系統(tǒng)管理單元60中注冊它們已經(jīng)收集的其自身的配置信息(706)。此時,如上所述,還將出錯信息通知系統(tǒng)管理單元60。
接著,系統(tǒng)管理單元60在連接到系統(tǒng)管理終端60的管理控制臺的監(jiān)視器上顯示圖12到15示出的某些或所有配置信息管理表(如附圖所示,需要用戶設置的部分為空表而不是全部設置了相應編號之間的關系的表),并且使用戶在管理控制臺上執(zhí)行物理設備,虛擬卷和邏輯單元之間的某些或所有關系的設置(707)。這里顯示的表不是如附圖所示的那樣設置全部關系的管理表,而是需要用戶對其設置關系的部分被空白顯示,使得能夠通過用戶輸入設置這些部分。接著,系統(tǒng)管理單元60根據(jù)用戶設置完成圖12到15示出的管理表,并且在系統(tǒng)管理單元60的存儲器中存儲這些表(708)。當發(fā)生錯誤時,也在系統(tǒng)管理單元60的非易失存儲器和硬盤組2的硬盤之一或二者中存儲這些管理表。
接著,管理表中分別涉及每個協(xié)議轉(zhuǎn)換單元10和每個高速緩存控制單元21的部分的復本被發(fā)布給每個協(xié)議轉(zhuǎn)換單元10和每個高速緩存控制單元21,并且已經(jīng)分配有復本的每個單元在其自身的存儲器中存儲復本(709)。
接著,協(xié)議轉(zhuǎn)換單元10訪問涉及它們的、已經(jīng)從系統(tǒng)管理單元60發(fā)布的管理表,檢查其需要訪問的高速緩存控制單元21,并且建立與相應高速緩存控制單元21的邏輯路徑(710)。最終,協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21確定全部初始化操作是否已經(jīng)正常結(jié)束,并且將結(jié)果通知系統(tǒng)管理單元60。系統(tǒng)管理單元60確認有關所有協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21的初始化正常完成的通知,并且確認其自身的初始化的正常完成(711)。在確認全部初始化正常完成之后,開始正常讀/寫操作(712)。
下面通過圖17示出系統(tǒng)關閉時存儲系統(tǒng)1的操作流程的例子。首先,當從管理控制臺發(fā)出系統(tǒng)關機的通知時(721),系統(tǒng)管理單元60向協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21發(fā)出指示命令接收終止的控制信息。當單元接收此信息時,每個單元終止命令的接收(722)。
在命令接收終止之后,協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21處理已經(jīng)接收的全部命令(723)。接著,協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21以和初始化時相同的方式收集其自身的配置信息,并且在系統(tǒng)管理單元60中注冊配置信息(724)。接著,協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21在系統(tǒng)管理單元60中注冊有關可以進行關機操作的情況(725)。
此后,協(xié)議轉(zhuǎn)換單元10阻塞與高速緩存控制單元21的邏輯路徑。并且,協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21阻塞與系統(tǒng)管理單元60的邏輯路徑(726)。最終,系統(tǒng)管理單元60在非易失存儲器中保存從協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21注冊的配置信息,以及系統(tǒng)管理單元60內(nèi)的配置信息(727)。此后,在管理控制臺的監(jiān)視器上顯示″系統(tǒng)關機過程完成,能夠關電″,并且關閉電源。
接著參照圖18描述從服務器3讀取存儲系統(tǒng)1記錄的數(shù)據(jù)的情況的例子。
首先,服務器3對存儲系統(tǒng)1發(fā)出數(shù)據(jù)讀取命令。
當協(xié)議轉(zhuǎn)換單元10中的外部IF 100接收命令時,等待命令(741)的微處理器102從外部IF 100讀取命令(742)并且執(zhí)行命令分析(743)。根據(jù)命令分析分配其中記錄服務器3請求的數(shù)據(jù)的邏輯單元(也稱作″LU″)。微處理器102訪問在系統(tǒng)初始化/變化時從系統(tǒng)管理單元60發(fā)布并且涉及微處理器的協(xié)議轉(zhuǎn)換單元10的邏輯單元分配管理表654,并且分配管理虛擬卷的高速緩存控制單元21,其中虛擬卷構(gòu)成其中記錄所請求數(shù)據(jù)的LU(744)。
接著,微處理器102通過互連網(wǎng)絡從其自身的傳送控制單元105向相應高速緩存控制單元21的傳送控制單元105提交數(shù)據(jù)讀取請求(745)。接收讀請求的高速緩存控制單元21中的微處理器101訪問控制存儲器單元112,訪問邏輯單元管理表653,虛擬卷管理表652和物理設備管理表651,并且分配虛擬卷1中的虛擬卷1編號631和地址641(746)。接著,微處理器101訪問控制存儲器單元112,并且根據(jù)虛擬卷1中的虛擬卷1編號631和地址641確定所請求的數(shù)據(jù)是否在其高速緩沖存儲器單元111中(747)。
在所請求的數(shù)據(jù)在其自身的高速緩沖存儲器單元111中(高速緩存命中)的情況下,微處理器101指示其自身的傳送控制單元105從高速緩沖存儲器單元111向提交請求的協(xié)議轉(zhuǎn)換單元10傳送所請求的數(shù)據(jù)(755)。自身的傳送控制單元105通過互連網(wǎng)絡31向提交請求的協(xié)議轉(zhuǎn)換單元10的傳送控制單元105傳送所請求的數(shù)據(jù)(756)。接收所請求的數(shù)據(jù)的協(xié)議轉(zhuǎn)換單元10的傳送控制單元105通過外部IF 100向服務器3發(fā)送數(shù)據(jù)(757)。
在所請求的數(shù)據(jù)不在其自身的高速緩沖存儲器單元111中(高速緩存命中失誤)的情況下,微處理器101在高速緩沖存儲器單元111中保護(secure)其中要存儲所請求的數(shù)據(jù)的區(qū)域(749)。在高速緩存區(qū)保護之后,微處理器101訪問控制存儲器單元112,訪問物理設備管理表651并且分配連接適配器號610(物理設備(這里為硬盤)連接到的協(xié)議轉(zhuǎn)換單元10的編號),從而管理構(gòu)成所請求的虛擬卷1的物理設備(也稱作″PDEV″)(750)。接著,微處理器101將所請求的數(shù)據(jù)從其自身的傳送控制單元105讀取到相應協(xié)議轉(zhuǎn)換單元10的傳送控制單元105,并且向高速緩存控制單元21發(fā)送指示傳送的控制信息(751)。相應協(xié)議轉(zhuǎn)換單元10的微處理器102從其自身的傳送控制單元105接收這個控制信息,訪問在初始化/變化時從系統(tǒng)管理單元60發(fā)送并且涉及自身的物理設備管理表651的復本,確定將從其讀取數(shù)據(jù)的物理設備(PDEV硬盤),并且從相應的硬盤讀取數(shù)據(jù)(752)。通過互連網(wǎng)絡31從自身的傳送控制單元105向提交請求的高速緩存控制單元21的傳送控制單元105傳送這個數(shù)據(jù)(753)。當其自身的傳送控制單元105接收所請求的數(shù)據(jù)時,提交請求的高速緩存控制單元21的微處理器101向高速緩沖存儲器單元111寫入數(shù)據(jù),并且更新控制存儲器單元112中存儲的高速緩沖存儲器的目錄(754)。此后的操作流程與從高速緩存命中情況下的操作流程755開始相同。如上所述,針對來自服務器3的讀請求從硬盤讀取數(shù)據(jù),并且將數(shù)據(jù)發(fā)送到服務器3。
接著參照圖19描述從服務器3向存儲系統(tǒng)1寫入數(shù)據(jù)的情況的例子。
首先,服務器3對存儲系統(tǒng)1發(fā)出數(shù)據(jù)寫入命令。
當協(xié)議轉(zhuǎn)換單元10中的外部IF 100接收命令時,等待命令(761)的微處理器102從外部IF 100讀取命令(762)并且執(zhí)行命令分析(763)。微處理器102根據(jù)命令分析分配其中記錄服務器3請求的數(shù)據(jù)的邏輯單元(LU)。微處理器102訪問在系統(tǒng)初始化/變化時從系統(tǒng)管理單元60發(fā)布并且涉及微處理器的協(xié)議轉(zhuǎn)換單元10的邏輯單元分配管理表654,并且分配管理虛擬卷的高速緩存控制單元21,其中虛擬卷構(gòu)成其中記錄所請求數(shù)據(jù)的LU(764)。
這里,當管理虛擬卷的緩沖存儲器單元21被加倍時,能夠提高存儲系統(tǒng)1的可靠性。也就是說,針對每個虛擬卷確定管理該卷的高速緩存控制單元21和備用(backup-use)高速緩存控制單元(也稱作″BCA″)21,并且向二者寫入數(shù)據(jù)。通過如此,如果主高速緩存控制單元21中出現(xiàn)錯誤,可以繼續(xù)后備高速緩存控制單元21中的操作。在這種情況下,在764的過程中,也在邏輯單元分配管理表654中描述備用管理高速緩存控制單元21,并且也分配其編號。下面描述確定備用管理高速緩存控制單元21的情況。
微處理器102通過互連網(wǎng)絡31從其自身的傳送控制單元105向相應高速緩存控制單元21和備用高速緩存控制單元21的傳送控制單元105提交數(shù)據(jù)寫請求(765)。接收寫請求的高速緩存控制單元21和備用高速緩存控制單元21中的微處理器101訪問控制存儲器單元112,訪問邏輯單元管理表653,虛擬卷管理表652和物理設備管理表651,并且分配虛擬卷1中的虛擬卷1編號631和地址641(766)。接著,微處理器101訪問控制存儲器單元112,并且根據(jù)虛擬卷1中的虛擬卷1編號631和地址641確定所請求的數(shù)據(jù)寫入是否在其高速緩沖存儲器單元111中(767)。
在所請求的數(shù)據(jù)在其自身的高速緩沖存儲器單元111中(高速緩存命中)的情況下,微處理器211通過傳送控制單元105通知發(fā)出寫入準備完成通知(也稱作″寫入準備完成″)的協(xié)議轉(zhuǎn)換單元21(770)。在所請求的數(shù)據(jù)不在其自身的高速緩沖存儲器單元111中(高速緩存命中失誤)的情況下,微處理器101在高速緩沖存儲器單元111中保護其中要存儲所請求的數(shù)據(jù)的區(qū)域(769),并且此后提供寫入準備完成通知(770)。
協(xié)議轉(zhuǎn)換單元10的微處理器102接收寫入準備完成通知,并且通過外部IF 100通知服務器3寫入準備完成。此后,協(xié)議轉(zhuǎn)換單元10通過外部IF 100接收發(fā)送自已經(jīng)接收到寫入準備完成通知的服務器3的數(shù)據(jù)(772)。微處理器102指示其自身的傳送控制單元向相應高速緩存控制單元21和備用高速緩存控制單元21的傳送控制單元105發(fā)送數(shù)據(jù)(773)。接收數(shù)據(jù)的高速緩存控制單元21和備用高速緩存控制單元21的微處理器101在其自身的高速緩沖存儲器單元111中寫入數(shù)據(jù),并且更新控制存儲器單元112中高速緩沖存儲器的目錄(774)。當針對高速緩沖存儲器單元111的數(shù)據(jù)寫入結(jié)束時,高速緩存控制單元21和備用高速緩存控制單元21的微處理器101通過傳送控制單元105向發(fā)出請求的協(xié)議轉(zhuǎn)換單元10發(fā)送寫入完成通知(775)。接收寫入完成通知的協(xié)議轉(zhuǎn)換單元10的微處理器101通過外部IF 100向服務器3發(fā)送寫入完成通知。對于寫入高速緩沖存儲器單元111的數(shù)據(jù),主高速緩存控制單元21的微處理器101確定高速緩沖存儲器單元111的空閑容量,并且與來自服務器3的寫請求相異步地通過硬盤連接到的協(xié)議轉(zhuǎn)換單元10向包含其中記錄數(shù)據(jù)的卷的硬盤寫入數(shù)據(jù)。于是,針對來自服務器3的寫請求執(zhí)行了寫操作。
根據(jù)本實施例,由于針對每個控制集群獨立地執(zhí)行高速緩沖存儲器的控制,降低了高速緩沖存儲器單元和控制存儲器單元的訪問負載。并且,由于通過高速緩存控制單元中的微處理器合并和執(zhí)行高速緩沖存儲器以及服務器和硬盤之間的數(shù)據(jù)傳送的控制,減少了在圖2示出的現(xiàn)有技術中曾經(jīng)需要的處理器間通信處理。于是能夠提高整個存儲系統(tǒng)1的性能。
并且,由于針對每個控制集群獨立地執(zhí)行高速緩沖存儲器的控制,可以針對每個單獨的控制集群操作存儲系統(tǒng)。于是,能夠針對每個控制集群優(yōu)化系統(tǒng)的成本,可以低成本地提供小規(guī)模配置的系統(tǒng),并且可以以滿足系統(tǒng)規(guī)模的成本提供系統(tǒng)。
于是,可以提供其成本/性能滿足從小規(guī)模到大規(guī)模配置的系統(tǒng)規(guī)模的存儲系統(tǒng)。
圖5和7示出了第二實施例。
如圖5所示,存儲系統(tǒng)1的配置與圖4的第一實施例示出的配置相同,例外的是連接服務器3所連接到的高速緩存控制單元21和協(xié)議轉(zhuǎn)換單元10的互連網(wǎng)絡31,和連接硬盤組2所連接到的高速緩存控制單元21和協(xié)議轉(zhuǎn)換單元10的互連網(wǎng)絡35是物理獨立的。
互連網(wǎng)絡31和互連網(wǎng)絡35物理獨立并且不直接連接。
圖7示出了互連網(wǎng)絡31和互連網(wǎng)絡35分別由交換單元51和交換單元52構(gòu)成的情況的例子。相對于圖22示出的交換單元51,交換單元52具有其中路徑IF總數(shù)為4的配置。
通過以這種方式構(gòu)成系統(tǒng),可能因準備2個獨立互連網(wǎng)絡而提高了成本,但是服務器3連接到的高速緩存控制單元21和協(xié)議控制單元10之間的數(shù)據(jù)傳送,和硬盤組2連接到的高速緩存控制單元21和協(xié)議轉(zhuǎn)換單元10之間的數(shù)據(jù)傳送不再象在第一實施例的構(gòu)造中那樣彼此干擾。并且,由于可以構(gòu)成其規(guī)格匹配于相應數(shù)據(jù)傳送的性能要求的互連網(wǎng)絡,提高了存儲系統(tǒng)1的性能。
在本實施例的構(gòu)造中,可以沒有問題地獲得與第一實施例相同的效果,并且可以提供其成本/性能滿足從小規(guī)模到大規(guī)模配置的系統(tǒng)規(guī)模的存儲系統(tǒng)。
如圖24所示,即使高速緩存控制單元21和協(xié)議轉(zhuǎn)換單元10被合并為磁盤控制單元中的單獨控制單元并且安裝在相同的板上,仍然可以沒有問題地實現(xiàn)本發(fā)明。
圖25示出了磁盤控制單元25的具體細節(jié)。
磁盤控制單元25包含至少4個微處理器101,控制與協(xié)議轉(zhuǎn)換單元10或系統(tǒng)管理單元60的數(shù)據(jù)/控制信息傳送的傳送控制單元105,4個與硬盤組2的IF(外部IF)100,臨時存儲與服務器3或硬盤組2交換的數(shù)據(jù)的高速緩沖存儲器單元111,和存儲涉及數(shù)據(jù)傳送,高速緩沖存儲器單元111的管理和硬盤組2的管理的控制信息的控制存儲器單元112。高速緩沖存儲器單元111和控制存儲器單元112中的每個由存儲器模塊122和控制對存儲器模塊122的訪問的存儲器控制器121的構(gòu)成。這里,如果高速緩沖存儲器單元111和控制存儲器單元112均具有相同的存儲器控制器121和存儲器模塊122,并且如果高速緩沖存儲器區(qū)和控制存儲器區(qū)被分配給單個存儲器空間上的不同區(qū)域,則沒有問題。并且,每個微處理器101包含連接到其自身以作為主存儲器的存儲器(未示出)??蛇x地,如果4個微處理器以SMP構(gòu)造以作為其自身的主存儲器,其中它們共享高速緩沖存儲器單元111和控制存儲器單元112,則沒有問題。
通過交換機109連接微處理器101,高速緩沖存儲器單元111,控制存儲器單元112,外部IF 100和傳送控制單元105。微處理器101使用控制存儲器單元中存儲的控制信息控制對高速緩沖存儲器的數(shù)據(jù)讀/寫,高速緩沖存儲器的目錄管理,與協(xié)議轉(zhuǎn)換單元10和硬盤組2的數(shù)據(jù)傳送和與系統(tǒng)管理單元60的系統(tǒng)管理信息交換。微處理器101也對向連接到協(xié)議轉(zhuǎn)換單元10的硬盤組2寫入的數(shù)據(jù)執(zhí)行所謂的RAID處理或冗余處理。
這里,微處理器101,高速緩沖存儲器單元111,控制存儲器單元112,外部IF 100和傳送控制單元105之間的連接構(gòu)造只是一個例子,此構(gòu)造并不限于上述例子。只要其具有使得微處理器101能夠控制高速緩沖存儲器單元111,控制存儲器單元112,外部IF 100和傳送控制單元105的構(gòu)造,便沒有問題。
并且如圖24所示,因為通過連接構(gòu)成控制集群的2個磁盤控制單元25的連接路徑進行數(shù)據(jù)和控制信息的通信,2個內(nèi)部IF 126連接到交換機109。通過將2個磁盤控制單元25的內(nèi)部IF 126與連接路徑互連,通過連接路徑進行數(shù)據(jù)和控制信息的通信。例如,通過連接路徑進行2個磁盤控制單元25的高速緩沖存儲器單元111或控制存儲器單元112中存儲的信息的加倍。于是,在構(gòu)成控制集群72的2個磁盤控制單元25之一中產(chǎn)生差錯的情況下,由于能夠繼續(xù)存儲系統(tǒng)與其它磁盤控制單元進行的操作,所以提高了可靠性。
如上所述,通過使用高速緩存控制單元21和協(xié)議轉(zhuǎn)換單元10作為單獨的控制單元,將它們合并在磁盤控制單元25中并且安裝到單獨的板上,不必使高速緩存控制單元21和協(xié)議轉(zhuǎn)換單元10與交換單元52進行通信,從而提高了數(shù)據(jù)傳送性能。并且,由于減少了構(gòu)成控制集群72的部分的數(shù)量,可以降低存儲系統(tǒng)的成本。
圖3示出了第三實施例。
如圖3所示,存儲系統(tǒng)1的構(gòu)造與圖1示出的第一實施例的構(gòu)造相同,例外的是互連網(wǎng)絡31被分成互連網(wǎng)絡41和互連網(wǎng)絡42,并且系統(tǒng)管理單元60連接到互連網(wǎng)絡42。
互連網(wǎng)絡41是專用于數(shù)據(jù)傳送的互連網(wǎng)絡,互連網(wǎng)絡42是專用于控制信息傳送的互連網(wǎng)絡。于是,執(zhí)行存儲系統(tǒng)1的管理的系統(tǒng)管理單元60連接到互連網(wǎng)絡42。
通過以這種方式構(gòu)成系統(tǒng),數(shù)據(jù)傳送和控制信息傳送不再彼此干擾。并且,由于可以構(gòu)成其規(guī)格匹配于相應數(shù)據(jù)傳送的性能要求的互連網(wǎng)絡,提高了存儲系統(tǒng)1的性能。
即使將本實施例的構(gòu)造應用于圖4示出的第一實施例的構(gòu)造或圖5示出的第二實施例的構(gòu)造,仍然可以沒有問題地實現(xiàn)本發(fā)明。
在本實施例的構(gòu)造中,可以沒有問題地獲得與第一實施例相同的效果,并且可以提供其成本/性能滿足從小規(guī)模到大規(guī)模配置的系統(tǒng)規(guī)模的存儲系統(tǒng)。
圖20示出了具有圖6示出的第一實施例的構(gòu)造或圖7示出的第二實施例的構(gòu)造的存儲系統(tǒng)1被安裝在外殼中的情況下一個構(gòu)造的例子。
協(xié)議轉(zhuǎn)換單元(PU)10,高速緩存控制單元(CU)21,系統(tǒng)管理單元(MU)60和交換單元51/52被安裝在插件上,并且被配置在控制單元機架821中以作為PU板卡802,CU插件801,MU板卡804和SW板卡803。在控制單元機架821的后表面有底板(未示出),并且每個插件和板卡通過連接器連接到底板。導線配置在底板上,從而象在圖6和7示出的連接配置中那樣連接每個插件和板卡。
這里,由于安裝的處理器的數(shù)量和高速緩存控制單元21的存儲器容量與協(xié)議轉(zhuǎn)換單元10和系統(tǒng)管理單元相比變大,CU插件801具有大約是其它板卡的雙倍的面積。并且,插件和板卡可以使用通用/專用板卡服務器,并且執(zhí)行專用軟件。
裝載有硬盤單元811的4個磁盤單元機架822配置在控制單元機架821上,硬盤單元811裝配有硬盤。
并且,裝有向整個存儲系統(tǒng)1供電的供電單元的供電單元機架823配置在控制單元機架821下面。
另外,這些機架被容納在19英寸機柜(未示出)內(nèi)。
應當注意,存儲系統(tǒng)1也可以具有不包含硬盤組的硬件結(jié)構(gòu)。在這種情況下,通過PU 10連接位于和存儲系統(tǒng)1分離的區(qū)域的存儲系統(tǒng)1和硬盤組。
在第一實施例中,針對具有圖1和4示出的構(gòu)造的存儲系統(tǒng)1描述了其中高速緩沖存儲器單元111的管理被封閉在控制集群70和71內(nèi)的系統(tǒng)。也就是說,指定控制集群70或71的高速緩存控制單元21內(nèi)的微處理器101只管理該控制集群70或71內(nèi)的高速緩沖存儲器單元111和控制存儲器單元112,而不管理另一個控制集群70或71內(nèi)的高速緩沖存儲器單元111和控制存儲器單元112。然而在本實施例(第四實施例)中,會描述一個控制方法,其中物理劃分到圖1和4示出的多個控制集群70和71中的高速緩沖存儲器單元111和控制存儲器單元112被整個存儲系統(tǒng)1控制為單個存儲器地址空間,因而多個高速緩沖存儲器單元111和控制存儲器單元112分別被整個存儲系統(tǒng)1的微處理器101和102邏輯共享。
這里,多個高速緩沖存儲器單元111和控制存儲器單元112分別被整個存儲系統(tǒng)1的微處理器101和102邏輯共享意味著,系統(tǒng)中明確指定的全局地址被物理分配給多個存儲器單元,并且每個處理器具有該全局地址映射,因而所有微處理器101和102能夠訪問高速緩沖存儲器單元111或控制存儲器單元112中存儲的數(shù)據(jù)或控制信息。
整個存儲系統(tǒng)的管理配置與圖11示出的配置相同。這里,指示提供給用戶的LU和管理構(gòu)成LU的虛擬卷的高速緩存控制單元21之間的對應關系的邏輯單元分配管理表654被存儲在系統(tǒng)管理單元60的存儲器中。
在第一實施例中,邏輯單元分配管理表654的涉及協(xié)議轉(zhuǎn)換單元10的部分的復本被發(fā)送到相應的協(xié)議轉(zhuǎn)換單元10,并且協(xié)議轉(zhuǎn)換單元10在連接到微處理器102的存儲器中存儲此復本。然而在本實施例中,不執(zhí)行復本的發(fā)布。在本實施例中,針對圖16示出的系統(tǒng)初始化時的操作流程,省略了步驟709的處理中向協(xié)議轉(zhuǎn)換單元10發(fā)布邏輯單元分配管理表654的復本的處理。
這里,在本實施例中,描述從服務器3讀取存儲系統(tǒng)1中記錄的數(shù)據(jù)的情況的例子。
首先,服務器3對存儲系統(tǒng)1發(fā)出數(shù)據(jù)讀取命令。這里結(jié)合圖18描述與第一實施例的方法相同的命令分析處理。此后,請求目的地CA確定處理(744)的方法是不同的。也就是說,微處理器102訪問系統(tǒng)管理單元60,訪問涉及其自身的協(xié)議轉(zhuǎn)換單元10的邏輯單元分配管理表654,并且分配管理構(gòu)成LU的虛擬卷的高速緩存控制單元21,其中LU記錄所請求的數(shù)據(jù)(744)。這里結(jié)合圖18描述與第一實施例的方法相同的后續(xù)處理(745到757)。
接著參照圖19描述從服務器3向存儲系統(tǒng)1寫入數(shù)據(jù)的情況的例子。
首先,服務器3對存儲系統(tǒng)1發(fā)出數(shù)據(jù)寫入命令。
這里結(jié)合圖19描述與第一實施例的方法相同的命令分析處理。此后的請求目的地CA確定處理(764)的方法是不同的。也就是說,微處理器102訪問系統(tǒng)管理單元60,訪問涉及其自身的協(xié)議轉(zhuǎn)換單元10的邏輯單元分配管理表654,并且分配管理構(gòu)成LU的虛擬卷的高速緩存控制單元21,其中LU記錄所請求的數(shù)據(jù)(764)。這里結(jié)合圖19描述與第一實施例的方法相同的后續(xù)處理(765到776)。
在上述說明中,每當數(shù)據(jù)讀取或?qū)懭霑r訪問系統(tǒng)管理單元60,并且分配管理虛擬卷的高速緩存控制單元21,該虛擬卷構(gòu)成變成讀取或?qū)懭肽繕说腖U。然而,即使整個存儲系統(tǒng)的邏輯單元分配管理表654被存儲在高速緩存控制單元21的所有控制存儲器單元112中,仍然可以沒有問題地實現(xiàn)本發(fā)明。在這種情況下,圖18和19示出的請求目的地CA確定處理的方法(744,764)是不同的。
也就是說,每個協(xié)議轉(zhuǎn)換單元10因系統(tǒng)初始化時來自管理終端的設置而預定發(fā)送數(shù)據(jù)讀/寫請求的高速緩存控制單元21。此時,分配給高速緩存控制單元21的協(xié)議轉(zhuǎn)換單元10的數(shù)量被高速緩存控制單元21設置成盡可能相等。通過如此,可以使每個高速緩存控制單元21上的訪問負載相等。在請求目的地CA確定處理(744,764)中,微處理器102訪問預定高速緩存控制單元21,訪問涉及其自身協(xié)議轉(zhuǎn)換單元10的邏輯單元分配管理表654,并且分配管理虛擬卷的高速緩存控制單元21,其中該虛擬卷構(gòu)成其中記錄所請求的數(shù)據(jù)的LU。其余序列與結(jié)合圖18和19描述的序列相同。
即使在圖18和19的處理中的命令接收(742,762)之后命令被傳送到高速緩存控制單元21的微處理器101并且通過微處理器101執(zhí)行命令分析(743,763),仍然可以沒有問題地實現(xiàn)本發(fā)明。在這種情況下,在請求目的地CA確定處理(744,764)中,微處理器101訪問預定高速緩存控制單元21,訪問控制存儲器單元112中存儲的邏輯單元分配管理表654,并且分配管理虛擬卷的高速緩存控制單元21,其中該虛擬卷構(gòu)成其中記錄所請求的數(shù)據(jù)的LU。在相應高速緩存控制單元21不是接收命令的微處理器101所屬的高速緩存控制單元21的情況下,微處理器101訪問相應高速緩存控制單元21中的高速緩沖存儲器單元111和控制存儲器單元112,并且執(zhí)行從745或765開始的處理。
可選地,命令被傳送到相應高速緩存控制單元21中的微處理器101,并且從745或765開始的處理由相應高速緩存控制單元21中的微處理器101,緩沖存儲器單元111和控制存儲器單元112執(zhí)行。
于是,不必在協(xié)議轉(zhuǎn)換單元10中布置微處理器102。
即使本實施例的控制方法被應用于圖6和30示出的第一實施例的構(gòu)造,圖7和24示出的第二實施例的構(gòu)造或圖3示出的第三實施例的構(gòu)造,仍然可以沒有問題地實現(xiàn)本發(fā)明。
在本實施例的構(gòu)造中,可以沒有問題地獲得與第一實施例相同的效果,并且可以提供其成本/性能滿足從小規(guī)模到大規(guī)模配置的系統(tǒng)規(guī)模的存儲系統(tǒng)。
圖28和29示出了第五實施例。
如附圖所示,存儲系統(tǒng)1具有與圖1和圖6示出的第一實施例相同的構(gòu)造,除了沒有系統(tǒng)管理單元60之外。
在本實施例中,類似于第四實施例,物理劃分在多個控制集群70中的高速緩沖存儲器單元111和控制存儲器單元112被整個存儲系統(tǒng)1控制為單個存儲器地址空間。于是,多個高速緩沖存儲器單元111和控制存儲器單元112分別被整個存儲系統(tǒng)1的微處理器101和102邏輯共享。
第一實施例中在系統(tǒng)管理單元60中產(chǎn)生并且存儲在其存儲器中的物理設備管理表651,虛擬卷管理表652,邏輯單元管理表653和邏輯單元分配管理表654由通過互連網(wǎng)絡31或例如局域網(wǎng)(LAN)的專用網(wǎng)絡連接到每個處理器的管理終端65來產(chǎn)生,并且涉及每個協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21的部分的復本被分別存儲在相應協(xié)議轉(zhuǎn)換單元10和高速緩存控制單元21的存儲器中。
在以這種方式在存儲器中存儲管理表的情況下,讀寫數(shù)據(jù)的序列變得與圖18和19示出的序列相同。
并且,整個系統(tǒng)的邏輯單元分配管理表654可以被存儲在高速緩存控制單元21的全部控制存儲器單元112中。在這種情況下,圖18和19示出的請求目的地CA確定處理的方法(744,764)是不同的。也就是說,每個協(xié)議轉(zhuǎn)換單元10因系統(tǒng)初始化時來自管理終端的設置而預定發(fā)送數(shù)據(jù)讀/寫請求的高速緩存控制單元21。此時,分配給高速緩存控制單元21的協(xié)議轉(zhuǎn)換單元10的數(shù)量被高速緩存控制單元21設置成盡可能相等。
通過如此,可以使每個高速緩存控制單元21上的訪問負載相等。在請求目的地CA確定處理(744,764)中,微處理器102訪問預定高速緩存控制單元21,訪問涉及其自身協(xié)議轉(zhuǎn)換單元10的邏輯單元分配管理表654,并且分配管理虛擬卷的高速緩存控制單元21,其中該虛擬卷構(gòu)成其中記錄所請求的數(shù)據(jù)的LU。其余序列與結(jié)合圖18和19描述的序列相同。
即使在圖18和19的處理中的命令接收(742,762)之后命令被傳送到高速緩存控制單元21的微處理器101并且通過微處理器101執(zhí)行命令分析(743,763),仍然可以沒有問題地實現(xiàn)本發(fā)明。在這種情況下,在請求目的地CA確定處理(744,764)中,微處理器101訪問預定高速緩存控制單元21,訪問控制存儲器單元112中存儲的邏輯單元分配管理表654,并且分配管理虛擬卷的高速緩存控制單元21,其中該虛擬卷構(gòu)成其中記錄所請求的數(shù)據(jù)的LU。在相應高速緩存控制單元21不是接收命令的微處理器101所屬的高速緩存控制單元21的情況下,微處理器101訪問相應高速緩存控制單元21中的高速緩沖存儲器單元111和控制存儲器單元112,并且執(zhí)行從745或765開始的處理。
可選地,命令被傳送到相應高速緩存控制單元21中的微處理器101,并且從745或765開始的處理由相應高速緩存控制單元21中的微處理器101,高速緩沖存儲器單元111和控制存儲器單元112執(zhí)行。
于是,不必在協(xié)議轉(zhuǎn)換單元10中布置微處理器102。
在本實施例的構(gòu)造中,可以沒有問題地獲得與第一實施例相同的效果,并且可以提供其成本/性能滿足從小規(guī)模到大規(guī)模配置的系統(tǒng)規(guī)模的存儲系統(tǒng)。
根據(jù)本發(fā)明,可以提供這樣的存儲系統(tǒng),其中消除了存儲系統(tǒng)的共享存儲器的性能瓶頸,能夠降低小規(guī)模配置的成本,并且能夠?qū)崿F(xiàn)從小規(guī)模到大規(guī)模配置的成本和性能的可伸縮性。
權(quán)利要求
1.一種存儲系統(tǒng),包括多個協(xié)議轉(zhuǎn)換單元,包含與外部設備的接口,并且將與外部設備交換的數(shù)據(jù)的讀/寫協(xié)議轉(zhuǎn)換成系統(tǒng)內(nèi)的協(xié)議;存儲與外部設備讀/寫的數(shù)據(jù)的高速緩沖存儲器;控制高速緩沖存儲器的多個高速緩存控制單元;系統(tǒng)管理單元;和連接多個協(xié)議轉(zhuǎn)換單元和多個高速緩存控制單元的互連網(wǎng)絡,其中多個高速緩存控制單元被分成多個控制集群,高速緩沖存儲器的控制在控制集群內(nèi)是獨立的,并且系統(tǒng)管理單元將多個協(xié)議轉(zhuǎn)換單元和多個控制集群作為單個系統(tǒng)進行管理。
2.一種存儲系統(tǒng),包括多個第一協(xié)議轉(zhuǎn)換單元,包含與外部設備的接口,并且將與外部設備交換的數(shù)據(jù)的讀-寫協(xié)議轉(zhuǎn)換成系統(tǒng)內(nèi)的協(xié)議;多個磁盤設備;多個第二協(xié)議轉(zhuǎn)換單元,包含與磁盤設備的接口,并且將與磁盤設備交換的數(shù)據(jù)的讀-寫協(xié)議轉(zhuǎn)換成系統(tǒng)內(nèi)的協(xié)議;多個高速緩存控制單元,包含存儲針對磁盤設備讀/寫的數(shù)據(jù)的高速緩沖存儲器,并且控制高速緩沖存儲器;連接第一協(xié)議轉(zhuǎn)換單元,第二協(xié)議轉(zhuǎn)換單元和高速緩存控制單元的互連網(wǎng)絡;和系統(tǒng)管理單元,其中多個高速緩存控制單元和多個第二協(xié)議轉(zhuǎn)換單元被分成多個控制集群,其中單個控制集群包含可選數(shù)量的高速緩存控制單元和第二協(xié)議轉(zhuǎn)換單元,只有連接到控制集群中第二協(xié)議轉(zhuǎn)換單元的多個磁盤設備中存儲的數(shù)據(jù)被存儲在控制集群中高速緩存控制單元的高速緩沖存儲器中,多個磁盤設備的高速緩沖存儲器的控制和存儲區(qū)的管理在控制集群內(nèi)是獨立的,并且系統(tǒng)管理單元將多個第一協(xié)議轉(zhuǎn)換單元和多個控制集群作為單個系統(tǒng)進行管理。
3.一種存儲系統(tǒng),包括多個第一協(xié)議轉(zhuǎn)換單元,包含與外部設備的接口,并且將與外部設備交換的數(shù)據(jù)的讀-寫協(xié)議轉(zhuǎn)換成系統(tǒng)內(nèi)的協(xié)議;多個磁盤設備;多個第二協(xié)議轉(zhuǎn)換單元,包含與磁盤設備的接口,并且將與磁盤設備交換的數(shù)據(jù)的讀-寫協(xié)議轉(zhuǎn)換成系統(tǒng)內(nèi)的協(xié)議;多個高速緩存控制單元,包含存儲針對磁盤設備讀/寫的數(shù)據(jù)的高速緩沖存儲器,并且控制高速緩沖存儲器;連接第一協(xié)議轉(zhuǎn)換單元和高速緩存控制單元的第一互連網(wǎng)絡;和系統(tǒng)管理單元,其中多個高速緩存控制單元和多個第二協(xié)議轉(zhuǎn)換單元被分成多個控制集群,其中單個控制集群包含可選數(shù)量的高速緩存控制單元和第二協(xié)議轉(zhuǎn)換單元,通過控制集群中的第二互連網(wǎng)絡在控制集群中互連高速緩存控制單元和第二協(xié)議轉(zhuǎn)換單元,只有連接到控制集群中第二協(xié)議轉(zhuǎn)換單元的多個磁盤設備中存儲的數(shù)據(jù)被存儲在控制集群中高速緩存控制單元的高速緩沖存儲器中,多個磁盤設備的高速緩沖存儲器的控制和存儲區(qū)的管理在控制集群內(nèi)是獨立的,并且系統(tǒng)管理單元將多個第一協(xié)議轉(zhuǎn)換單元和多個控制集群作為單個系統(tǒng)進行管理。
4.如權(quán)利要求2所述的存儲系統(tǒng),其中互連網(wǎng)絡或第一互連網(wǎng)絡被分成傳送與外部設備讀/寫的數(shù)據(jù)的第三互連網(wǎng)絡,和傳送用于管理存儲系統(tǒng)的控制信息的第四互連網(wǎng)絡,并且系統(tǒng)管理單元連接到第四互連網(wǎng)絡。
5.如權(quán)利要求2所述的存儲系統(tǒng),其中高速緩存控制單元包含處理器,用于對高速緩沖存儲器和通過高速緩沖存儲器在第一協(xié)議轉(zhuǎn)換單元和第二協(xié)議轉(zhuǎn)換單元之間進行的數(shù)據(jù)傳送執(zhí)行控制。
6.如權(quán)利要求2所述的存儲系統(tǒng),其中高速緩存控制單元和第二協(xié)議轉(zhuǎn)換單元被安裝在相同的板上。
7.如權(quán)利要求2所述的存儲系統(tǒng),其中系統(tǒng)管理單元管理多個第一協(xié)議轉(zhuǎn)換單元之間的數(shù)據(jù)傳送。
8.如權(quán)利要求7所述的存儲系統(tǒng),其中多個第一協(xié)議轉(zhuǎn)換單元之間執(zhí)行的數(shù)據(jù)傳送的數(shù)據(jù)被存儲在高速緩存控制單元的高速緩沖存儲器中。
9.如權(quán)利要求7所述的存儲系統(tǒng),其中系統(tǒng)管理單元包含存儲器,并且多個第一協(xié)議轉(zhuǎn)換單元之間執(zhí)行的數(shù)據(jù)傳送的數(shù)據(jù)被存儲在該存儲器中。
10.如權(quán)利要求7所述的存儲系統(tǒng),其中多個第一協(xié)議轉(zhuǎn)換單元之間執(zhí)行的數(shù)據(jù)傳送通過高速緩存控制單元來執(zhí)行。
11.如權(quán)利要求2所述的存儲系統(tǒng),其中執(zhí)行數(shù)據(jù)處理的至少一個外部設備和至少一個第二存儲系統(tǒng)連接到與多個第一協(xié)議轉(zhuǎn)換單元的外部設備的接口,并且通過經(jīng)由互連網(wǎng)絡在執(zhí)行數(shù)據(jù)處理的外部設備連接到的第一協(xié)議轉(zhuǎn)換單元和第二存儲系統(tǒng)連接到的第一協(xié)議轉(zhuǎn)換單元之間執(zhí)行數(shù)據(jù)傳送,執(zhí)行從外部設備到第二存儲系統(tǒng)的數(shù)據(jù)的輸入/輸出。
12.如權(quán)利要求2所述的存儲系統(tǒng),其中執(zhí)行數(shù)據(jù)處理的至少一個外部設備和至少一個第二存儲系統(tǒng)連接到與多個第一協(xié)議轉(zhuǎn)換單元的外部設備的接口,并且通過經(jīng)由第一互連網(wǎng)絡和高速緩存控制單元在外部設備連接到的第一協(xié)議轉(zhuǎn)換單元和第二存儲系統(tǒng)連接到的第一協(xié)議轉(zhuǎn)換單元之間執(zhí)行數(shù)據(jù)傳送,執(zhí)行從外部設備到第二存儲系統(tǒng)的數(shù)據(jù)的輸入/輸出。
13.如權(quán)利要求11所述的存儲系統(tǒng),其中系統(tǒng)管理單元將第二存儲系統(tǒng)提供的邏輯卷作為存儲系統(tǒng)的卷來管理,并且將邏輯卷提供給執(zhí)行數(shù)據(jù)處理的外部設備。
14.如權(quán)利要求13所述的存儲系統(tǒng),其中系統(tǒng)管理單元被分成管理互連網(wǎng)絡的第一管理單元,和第二管理單元,所述第二管理單元管理存儲系統(tǒng)中的物理存儲區(qū)與多種類型的邏輯存儲區(qū)之間的關系,連接到協(xié)議轉(zhuǎn)換單元的外部設備之間的連接關系和外部設備與邏輯存儲區(qū)之間的關系之一或二者,以及系統(tǒng)中的錯誤。
15.如權(quán)利要求13所述的存儲系統(tǒng),其中系統(tǒng)管理單元被分成管理互連網(wǎng)絡的物理連接的第三管理單元,管理互連網(wǎng)絡上邏輯配置的協(xié)議轉(zhuǎn)換單元,高速緩存控制單元和系統(tǒng)管理單元之間的邏輯路徑的第四管理單元,和第二管理單元,所述第二管理單元管理多個磁盤設備的物理存儲區(qū)和多種類型的邏輯存儲區(qū)之間的關系,連接到協(xié)議轉(zhuǎn)換單元的外部設備之間的連接關系和外部設備與邏輯存儲區(qū)之間的關系之一或二者,以及系統(tǒng)中的錯誤。
16.如權(quán)利要求15所述的存儲系統(tǒng),其中系統(tǒng)管理單元,協(xié)議轉(zhuǎn)換單元和高速緩存控制單元包含存儲控制信息的存儲器,在系統(tǒng)的初始化設置時,至少系統(tǒng)管理單元產(chǎn)生指示多個物理存儲區(qū)和多種類型的邏輯存儲區(qū)之間的關系的第一關系表,以及指示連接到協(xié)議轉(zhuǎn)換單元的外部設備之間的連接關系和外部設備與邏輯存儲區(qū)之間的關系之一或二者的第二關系表,在系統(tǒng)管理單元的存儲器中存儲第一關系表和第二關系表,并且向相關協(xié)議轉(zhuǎn)換單元或高速緩存控制單元發(fā)布第一關系表和第二關系表中涉及協(xié)議轉(zhuǎn)換單元或高速緩存控制單元的部分的復本,并且協(xié)議轉(zhuǎn)換單元或高速緩存控制單元分別在協(xié)議轉(zhuǎn)換單元或高速緩存控制單元的存儲器中存儲所述相關復本。
17.如權(quán)利要求16所述的存儲系統(tǒng),還包括與系統(tǒng)管理單元執(zhí)行通信的管理控制臺,其中在管理控制臺的監(jiān)視器上顯示某些或所有第一關系表和第二關系表,并且管理員在管理控制臺上設置在系統(tǒng)初始化設置時產(chǎn)生的多個物理存儲區(qū)和多種類型邏輯存儲區(qū)之間的關系,以及連接到協(xié)議轉(zhuǎn)換單元的外部設備之間的連接關系和外部設備與邏輯存儲區(qū)之間的關系之一或二者的部分或全部。
18.如權(quán)利要求17所述的存儲系統(tǒng),其中對于來自外部設備的讀/寫請求,協(xié)議轉(zhuǎn)換單元針對該讀/寫請求訪問其自身存儲器中第一關系表和第二關系表的復本,確定傳送讀/寫請求的高速緩存控制單元或協(xié)議轉(zhuǎn)換單元,并且不訪問系統(tǒng)管理單元。
19.一種包括多個集群的存儲系統(tǒng),其中多個集群中的每個包括連接到外部設備的協(xié)議轉(zhuǎn)換單元;硬盤設備;將硬盤設備連接到通信路徑的磁盤適配器;和連接到通信路徑的高速緩存適配器,其中高速緩存適配器配有高速緩沖存儲器和共享存儲器,所述高速緩沖存儲器存儲硬盤設備中存儲的至少某些數(shù)據(jù)的復本,所述共享存儲器存儲用于通過處理器訪問高速緩沖存儲器的命令,其中該處理器訪問高速緩存適配器中的共享存儲器。
20.一種存儲系統(tǒng),包括多個協(xié)議轉(zhuǎn)換單元,包含與外部設備的接口,并且將與外部設備交換的數(shù)據(jù)的讀/寫協(xié)議轉(zhuǎn)換成系統(tǒng)內(nèi)的協(xié)議;多個高速緩存控制單元,包含存儲與外部設備讀/寫的數(shù)據(jù)的高速緩沖存儲器,并且控制高速緩沖存儲器;和連接協(xié)議轉(zhuǎn)換單元和高速緩存控制單元的互連網(wǎng)絡,其中多個高速緩存控制單元被分成多個控制集群,并且多個高速緩存控制單元中的高速緩沖存儲器在存儲系統(tǒng)中被邏輯管理為單個高速緩沖存儲器。
全文摘要
存儲系統(tǒng)(1)包含多個協(xié)議轉(zhuǎn)換單元(10),其將與服務器(3)或硬盤組(2)交換的數(shù)據(jù)的讀/寫協(xié)議轉(zhuǎn)換成系統(tǒng)內(nèi)的協(xié)議;多個高速緩存控制單元(21),包含存儲與服務器(3)或硬盤組(2)讀/寫的數(shù)據(jù)的緩沖存儲器單元(111)并且包含控制緩沖存儲器單元(111)的功能;和連接協(xié)議轉(zhuǎn)換單元(10)與高速緩存控制單元(21)的互連網(wǎng)絡(31)。在這個存儲系統(tǒng)(1)中,多個高速緩存控制單元(21)被分成多個控制集群(70),緩沖存儲器單元(111)的控制在控制集群內(nèi)是獨立的,并且將多個協(xié)議轉(zhuǎn)換單元(10)和多個控制集群(70)管理為單個系統(tǒng)的系統(tǒng)管理單元(60)連接到互連網(wǎng)絡(30)。
文檔編號G06F3/06GK1619478SQ20041004533
公開日2005年5月25日 申請日期2004年5月20日 優(yōu)先權(quán)日2003年11月21日
發(fā)明者藤本和久, 細谷睦, 島田健太郎, 山本彰, 巖見直子, 山本康友 申請人:株式會社日立制作所