存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)以及其存儲(chǔ)裝置壽命監(jiān)控方法
【專利摘要】一種存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)以及其存儲(chǔ)裝置壽命監(jiān)控方法,此方法包括獲取對(duì)應(yīng)這些存儲(chǔ)裝置的運(yùn)作行為信息;存儲(chǔ)多個(gè)具有包括運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值的訓(xùn)練數(shù)據(jù);依據(jù)這些訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型;將這些存儲(chǔ)裝置的運(yùn)作行為信息輸入至存儲(chǔ)裝置壽命預(yù)測(cè)模型以產(chǎn)生對(duì)應(yīng)每一存儲(chǔ)裝置的預(yù)估壽命值;以及依據(jù)每一存儲(chǔ)裝置的運(yùn)作行為信息與預(yù)估壽命值來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。借此,此方法能夠準(zhǔn)確地預(yù)測(cè)存儲(chǔ)裝置的壽命。
【專利說明】
存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)以及其存儲(chǔ)裝置壽命監(jiān)控方法
技術(shù)領(lǐng)域
[0001]本發(fā)明是有關(guān)于一種存儲(chǔ)裝置壽命監(jiān)控系統(tǒng),且特別是用于監(jiān)控?cái)?shù)據(jù)中心的多個(gè)存儲(chǔ)裝置的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)以及其所使用的存儲(chǔ)裝置壽命監(jiān)控方法。
【背景技術(shù)】
[0002]近年來,隨著科技的日新月異,數(shù)據(jù)量的爆炸性發(fā)展已經(jīng)影響科技業(yè)界在數(shù)據(jù)存儲(chǔ)硬件上的需求。因?yàn)楸仨毻ㄟ^諸多非易失性存儲(chǔ)裝置來存儲(chǔ)大量數(shù)據(jù),這些存儲(chǔ)裝置的容量的大小以及管理上的復(fù)雜性也相應(yīng)提高。
[0003]一般來說,為了掌握數(shù)據(jù)中心的運(yùn)作情形以進(jìn)行安全性維護(hù),在開發(fā)與設(shè)計(jì)管理數(shù)據(jù)中心的服務(wù)器系統(tǒng)時(shí),多半會(huì)配置管理模塊對(duì)系統(tǒng)內(nèi)部的風(fēng)扇運(yùn)轉(zhuǎn)狀況、溫度或是電壓等信息進(jìn)行監(jiān)控。藉此,服務(wù)器系統(tǒng)可在接收到系統(tǒng)的存儲(chǔ)裝置的異常狀態(tài)的回報(bào)(例如,接收對(duì)應(yīng)每一存儲(chǔ)裝置的日志檔)之后,被動(dòng)地做出數(shù)據(jù)救援或是硬件替換的處置。
[0004]由于數(shù)據(jù)中心的每一存儲(chǔ)裝置的大容量,故,在存儲(chǔ)裝置毀損(或是發(fā)生嚴(yán)重錯(cuò)誤)之后,對(duì)此毀損的存儲(chǔ)裝置所需要的數(shù)據(jù)回復(fù)時(shí)間,或是數(shù)據(jù)備份時(shí)間也會(huì)對(duì)應(yīng)提高許多,進(jìn)而導(dǎo)致數(shù)據(jù)中心維護(hù)成本的大量增加。然而,隨著高速存取數(shù)據(jù)的趨勢(shì)發(fā)展之下,數(shù)據(jù)中心也逐漸引進(jìn)傳統(tǒng)硬盤(HDD)以外的存儲(chǔ)裝置(例如,可高速存取數(shù)據(jù)的固態(tài)硬盤(SSD))來存儲(chǔ)數(shù)據(jù)。也因?yàn)槿绱耍f有的僅適用于傳統(tǒng)硬盤的自我監(jiān)測(cè)分析及報(bào)告技術(shù)逐漸地不能滿足數(shù)據(jù)中心對(duì)于多種存儲(chǔ)裝置的維護(hù)需求?;耍绾螠?zhǔn)確地預(yù)測(cè)存儲(chǔ)裝置的壽命,主動(dòng)地提早預(yù)測(cè)存儲(chǔ)裝置的壽命來進(jìn)行預(yù)防性的處置,以節(jié)省因?yàn)檠b置毀損所導(dǎo)致的大量維護(hù)成本,為本領(lǐng)域人員所致力的目標(biāo)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供一種存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)以及其所使用的存儲(chǔ)裝置壽命監(jiān)控方法,其能夠有效地預(yù)測(cè)存儲(chǔ)裝置的壽命。
[0006]本發(fā)明的一范例實(shí)施例提出一種用于監(jiān)控多個(gè)存儲(chǔ)裝置的壽命的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)。所述存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)包括存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊、數(shù)據(jù)庫、壽命估計(jì)訓(xùn)練模塊與壽命預(yù)測(cè)模塊。數(shù)據(jù)庫耦接至存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊。壽命估計(jì)訓(xùn)練模塊耦接至存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊。壽命預(yù)測(cè)模塊耦接至存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊與壽命估計(jì)訓(xùn)練模塊。數(shù)據(jù)庫記錄多個(gè)訓(xùn)練數(shù)據(jù),其中每一訓(xùn)練數(shù)據(jù)包括運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值。存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊獲取對(duì)應(yīng)此些存儲(chǔ)裝置的運(yùn)作行為信息。壽命估計(jì)訓(xùn)練模塊依據(jù)此些訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。壽命預(yù)測(cè)模塊將此些存儲(chǔ)裝置的運(yùn)作行為信息輸入至存儲(chǔ)裝置壽命預(yù)測(cè)模型以產(chǎn)生對(duì)應(yīng)每一存儲(chǔ)裝置的預(yù)估壽命值。
[0007]在本發(fā)明的一范例實(shí)施例中,壽命估計(jì)訓(xùn)練模塊依據(jù)每一存儲(chǔ)裝置的運(yùn)作行為信息與預(yù)估壽命值來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0008]在本發(fā)明的一范例實(shí)施例中,其中當(dāng)此些存儲(chǔ)裝置之中的第一存儲(chǔ)裝置損壞時(shí),存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊記錄第一存儲(chǔ)裝置的實(shí)際壽命值,并且壽命估計(jì)訓(xùn)練模塊依據(jù)第一存儲(chǔ)裝置的運(yùn)作行為信息與實(shí)際壽命值來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0009]在本發(fā)明的一范例實(shí)施例中,其中存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊包括日志搜集模塊與運(yùn)作行為識(shí)別模塊,并且在上述存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊獲取對(duì)應(yīng)這些存儲(chǔ)裝置的運(yùn)作行為信息的運(yùn)作中,日志搜集模塊搜集對(duì)應(yīng)每一存儲(chǔ)裝置的至少一個(gè)運(yùn)作日志,并且運(yùn)作行為識(shí)別模塊剖析每一存儲(chǔ)裝置的至少一個(gè)運(yùn)作日志以建立每一存儲(chǔ)裝置的運(yùn)作行為信息。
[0010]在本發(fā)明的一范例實(shí)施例中,上述運(yùn)作日志包括系統(tǒng)日志、應(yīng)用程序日志、數(shù)據(jù)庫日志與自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志。
[0011]在本發(fā)明的一范例實(shí)施例中,運(yùn)作行為識(shí)別模塊識(shí)別對(duì)應(yīng)每一存儲(chǔ)裝置的系統(tǒng)日志中的系統(tǒng)存取錯(cuò)誤、應(yīng)用程序日志中的應(yīng)用程序存取錯(cuò)誤、數(shù)據(jù)庫日志中的數(shù)據(jù)庫存取錯(cuò)誤和自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志中的磁盤存取錯(cuò)誤,計(jì)算系統(tǒng)存取錯(cuò)誤的數(shù)目、應(yīng)用程序存取錯(cuò)誤的數(shù)目、數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與磁盤存取錯(cuò)誤的數(shù)目,并且依據(jù)系統(tǒng)存取錯(cuò)誤的數(shù)目、應(yīng)用程序存取錯(cuò)誤的數(shù)目、數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與磁盤存取錯(cuò)誤的數(shù)目來建立每一存儲(chǔ)裝置的運(yùn)作行為信息。
[0012]在本發(fā)明的一范例實(shí)施例中,在上述壽命估計(jì)訓(xùn)練模塊依據(jù)這些訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作中,壽命估計(jì)訓(xùn)練模塊使用K分群演算法、線性回歸分析或支援向量機(jī)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0013]在本發(fā)明的一范例實(shí)施例中,在上述壽命估計(jì)訓(xùn)練模塊依據(jù)這些訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作中,壽命估計(jì)訓(xùn)練模塊將這些訓(xùn)練數(shù)據(jù)與這些預(yù)測(cè)數(shù)據(jù)分割為多個(gè)數(shù)據(jù)集合,分別地依據(jù)這些數(shù)據(jù)集合來架構(gòu)多個(gè)子預(yù)測(cè)模型,并且合并這些子預(yù)測(cè)模型以形成存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0014]本發(fā)明的一范例實(shí)施例提供一種用于監(jiān)控多個(gè)存儲(chǔ)裝置的壽命的存儲(chǔ)裝置壽命監(jiān)控方法。所述存儲(chǔ)裝置壽命監(jiān)控方法包括建立數(shù)據(jù)庫,其中數(shù)據(jù)庫記錄多個(gè)訓(xùn)練數(shù)據(jù),其中每一訓(xùn)練數(shù)據(jù)包括運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值;以及獲取對(duì)應(yīng)這些存儲(chǔ)裝置的運(yùn)作行為信息。所述存儲(chǔ)裝置壽命監(jiān)控方法還包括依據(jù)這些訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型;將這些存儲(chǔ)裝置的運(yùn)作行為信息輸入至存儲(chǔ)裝置壽命預(yù)測(cè)模型以產(chǎn)生對(duì)應(yīng)每一存儲(chǔ)裝置的預(yù)估壽命值。
[0015]在本發(fā)明的一范例實(shí)施例中,所述存儲(chǔ)裝置壽命監(jiān)控方法還包括依據(jù)每一存儲(chǔ)裝置的運(yùn)作行為信息與預(yù)估壽命值來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0016]在本發(fā)明的一范例實(shí)施例中,所述存儲(chǔ)裝置壽命監(jiān)控方法還包括當(dāng)這些存儲(chǔ)裝置之中的第一存儲(chǔ)裝置損壞時(shí),記錄第一存儲(chǔ)裝置的實(shí)際壽命值;以及依據(jù)第一存儲(chǔ)裝置的運(yùn)作行為信息與實(shí)際壽命值來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0017]在本發(fā)明的一范例實(shí)施例中,上述獲取對(duì)應(yīng)這些存儲(chǔ)裝置的運(yùn)作行為信息的步驟包括搜集對(duì)應(yīng)每一存儲(chǔ)裝置的至少一個(gè)運(yùn)作日志;以及剖析每一存儲(chǔ)裝置的至少一個(gè)運(yùn)作日志以建立每一存儲(chǔ)裝置的運(yùn)作行為信息。
[0018]在本發(fā)明的一范例實(shí)施例中,所述存儲(chǔ)裝置壽命監(jiān)控方法還包括識(shí)別對(duì)應(yīng)每一存儲(chǔ)裝置的系統(tǒng)日志中的系統(tǒng)存取錯(cuò)誤、應(yīng)用程序日志中的應(yīng)用程序存取錯(cuò)誤、數(shù)據(jù)庫日志中的數(shù)據(jù)庫存取錯(cuò)誤和自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志中的磁盤存取錯(cuò)誤;計(jì)算系統(tǒng)存取錯(cuò)誤的數(shù)目、應(yīng)用程序存取錯(cuò)誤的數(shù)目、數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與磁盤存取錯(cuò)誤的數(shù)目;以及依據(jù)系統(tǒng)存取錯(cuò)誤的數(shù)目、應(yīng)用程序存取錯(cuò)誤的數(shù)目、數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與磁盤存取錯(cuò)誤的數(shù)目來建立每一存儲(chǔ)裝置的運(yùn)作行為信息。
[0019]在本發(fā)明的一范例實(shí)施例中,所述依據(jù)這些訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的步驟包括使用K分群演算法、線性回歸分析或支援向量機(jī)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0020]在本發(fā)明的一范例實(shí)施例中,所述依據(jù)這些訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的步驟包括將這些訓(xùn)練數(shù)據(jù)與這些預(yù)測(cè)數(shù)據(jù)分割為多個(gè)數(shù)據(jù)集合;分別地依據(jù)這些數(shù)據(jù)集合來架構(gòu)多個(gè)子預(yù)測(cè)模型;以及合并這些子預(yù)測(cè)模型以形成存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0021]基于上述,本發(fā)明所提供的一種存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)以及其所使用的存儲(chǔ)裝置壽命監(jiān)控方法,可辨識(shí)對(duì)應(yīng)多個(gè)存儲(chǔ)裝置的運(yùn)作行為信息,根據(jù)這些存儲(chǔ)裝置的運(yùn)作行為信息經(jīng)由存儲(chǔ)裝置壽命預(yù)測(cè)模型來預(yù)測(cè)每一存儲(chǔ)裝置的壽命,還依據(jù)每一存儲(chǔ)裝置的運(yùn)作行為信息與所預(yù)測(cè)的壽命所構(gòu)成的多個(gè)預(yù)測(cè)數(shù)據(jù)來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。如此一來,本發(fā)明可產(chǎn)生大量且成本低的訓(xùn)練數(shù)據(jù)來增進(jìn)預(yù)測(cè)存儲(chǔ)裝置的壽命的精確度,進(jìn)而提高管理這些存儲(chǔ)裝置的效率。
【附圖說明】
[0022]圖1是根據(jù)一范例實(shí)施例所繪示的數(shù)據(jù)中心的示意圖。
[0023]圖2是根據(jù)一范例實(shí)施例所繪示的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)的程序的關(guān)系示意圖。
[0024]圖3是根據(jù)一范例實(shí)施例所繪示的使用訓(xùn)練數(shù)據(jù)、預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作示意圖。
[0025]圖4與圖5是根據(jù)一范例實(shí)施例所繪示的自我學(xué)習(xí)方法的示意圖。
[0026]圖6是根據(jù)一范例實(shí)施例所繪示的使用訓(xùn)練數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作示意圖。
[0027]圖7是根據(jù)一范例實(shí)施例所繪示的存儲(chǔ)裝置壽命監(jiān)控方法的流程圖。
[0028]圖8是根據(jù)一范例實(shí)施例所繪示的使用訓(xùn)練數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作示意圖。
[0029]圖9是根據(jù)一范例實(shí)施例所繪示的存儲(chǔ)裝置壽命監(jiān)控方法的流程圖。
[0030]主要元件符號(hào)說明:
[0031]10:數(shù)據(jù)中心100:服務(wù)器
[0032]310:處理單元320:存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)
[0033]330:連接介面單元340:存儲(chǔ)器單元
[0034]200(0)?200 (N):存儲(chǔ)裝置110:存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊
[0035]120:數(shù)據(jù)庫130:壽命估計(jì)訓(xùn)練模塊
[0036]140:壽命預(yù)測(cè)模塊111:日志搜集模塊
[0037]112:運(yùn)作行為識(shí)別模塊
[0038]R301、R303、R305、R307、R309:存儲(chǔ)裝置壽命監(jiān)控的運(yùn)作路徑
[0039]Dl?DlO:訓(xùn)練數(shù)據(jù)A、B、Y:預(yù)測(cè)曲線
[0040]Rl、R2、R3、R4:架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作路徑
[0041]610、620、630、631、632:叢集運(yùn)算服務(wù)器
[0042]S701、S703、S705、S707、S709:存儲(chǔ)裝置壽命監(jiān)控方法的步驟
【具體實(shí)施方式】
[0043]為讓本發(fā)明的上述特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉實(shí)施例,并配合所附圖式作詳細(xì)說明如下。
[0044]圖1是根據(jù)一范例實(shí)施例所繪示的數(shù)據(jù)中心的示意圖。
[0045]請(qǐng)參照?qǐng)D1,在本范例實(shí)施例中,數(shù)據(jù)中心10包括服務(wù)器100與多個(gè)存儲(chǔ)裝置200 (O)?200 (N)。服務(wù)器100是耦接存儲(chǔ)裝置200 (O)?200 (N),并且服務(wù)器100用來監(jiān)控存儲(chǔ)裝置200(0)?200(N)的裝置狀態(tài)。特別是,在本范例實(shí)施例中,服務(wù)器100會(huì)通過存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)(Storage Device Lifetime Monitoring System) 320來監(jiān)控存儲(chǔ)裝置200(0)?200 (N)的裝置狀態(tài)并且預(yù)測(cè)每一存儲(chǔ)裝置200 (O)?200 (N)的壽命。必須了解的是,本發(fā)明并不限定存儲(chǔ)裝置200 (O)?200 (N)的數(shù)量。
[0046]存儲(chǔ)裝置200 (O)?200 (N),用以存儲(chǔ)數(shù)據(jù)中心10的數(shù)據(jù)。例如,所存儲(chǔ)的數(shù)據(jù)包括由使用者傳送至數(shù)據(jù)中心10進(jìn)行存取的使用者數(shù)據(jù)、用于管理的數(shù)據(jù)中心系統(tǒng)數(shù)據(jù),以及對(duì)應(yīng)的使用者數(shù)據(jù)或數(shù)據(jù)中心系統(tǒng)數(shù)據(jù)的備份數(shù)據(jù),或是適于存儲(chǔ)在數(shù)據(jù)中心10的任何型態(tài)的數(shù)據(jù),本發(fā)明不限于此。在本范例實(shí)施例中,存儲(chǔ)裝置200 (O)?200 (N)例如是任何型態(tài)的硬盤驅(qū)動(dòng)器(hard disk drive, HDD)或非易失性存儲(chǔ)器存儲(chǔ)裝置(SSD)。
[0047]在本范例實(shí)施例中,服務(wù)器100除了監(jiān)控存儲(chǔ)裝置200(0)?200 (N)的壽命之外,服務(wù)器100還用以控管數(shù)據(jù)中心10中的存儲(chǔ)裝置200(0)?200(N)的分配。在本范例實(shí)施例中,服務(wù)器100包括處理單元(Processing Unit) 310、存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320、連接介面單元(Connect1n Interface Unit) 330 與存儲(chǔ)器單元(Memory Unit) 340。
[0048]處理單元310用以控制服務(wù)器100的整體運(yùn)作。在本范例實(shí)施例中,處理單元310,例如是中央處理單元(Central Processing Unit, CPU)、微處理器(micro-processor)、或是其他可程序化的處理單元(Microprocessor)、數(shù)字信號(hào)處理器(Digital SignalProcessor, DSP)、可程序化控制器、特殊應(yīng)用集成電路(Applicat1n SpecificIntegrated Circuits,ASIC)、可程序化邏輯裝置(Programmable Logic Device,PLD)或其他類似裝置。在本范例實(shí)施例中,處理單元310為基板管理控制器(Baseboard ManagementController,BMC),除了負(fù)責(zé)服務(wù)器100的整體運(yùn)作之外,處理單元310還可對(duì)數(shù)據(jù)中心10內(nèi)部的風(fēng)扇運(yùn)轉(zhuǎn)狀況、溫度或是電壓等信息進(jìn)行監(jiān)控。一般來說,處理單元310可以直接整合在服務(wù)器100的基板上,亦或是以插卡的形式配置在服務(wù)器100中。
[0049]連接介面單元330是親接于處理單元310,并且處理單元310可通過連接介面單元330連接存儲(chǔ)裝置200 (0)?200 (N)來存取數(shù)據(jù)或是下達(dá)控制指令。連接介面單元330,例如是相容于序列式小型電腦系統(tǒng)介面(Serial Attached SCSI,SAS)標(biāo)準(zhǔn)、雙線介面(TwoWire Interface,TH)標(biāo)準(zhǔn)、序列先進(jìn)附件(Serial Advanced Technology Attachment,SATA)標(biāo)準(zhǔn)、并列先進(jìn)附件(Parallel Advanced Technology Attachment,PATA)標(biāo)準(zhǔn)、電氣和電子工程師協(xié)會(huì)(Institute of Electrical and Electronic Engineers,IEEE) 1394標(biāo)準(zhǔn)、高速周邊零件連接介面(Peripheral Component Interconnect Express,PCI Express)標(biāo)準(zhǔn)、通用序列總線(Universal Serial Bus,USB)標(biāo)準(zhǔn)、整合式驅(qū)動(dòng)電子介面(IntegratedDevice Electronics,IDE)標(biāo)準(zhǔn)或其他適合的標(biāo)準(zhǔn)的實(shí)體介面,本發(fā)明不限于此。
[0050]在本范例實(shí)施例中,存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320用以表示存儲(chǔ)在耦接于處理單元310的存儲(chǔ)單元中的程序或數(shù)據(jù)的組合(亦稱,系統(tǒng)),其用以實(shí)行監(jiān)控?cái)?shù)據(jù)中心10中的多個(gè)存儲(chǔ)裝置200 (O)?200 (N)的功能。在本范例實(shí)施例中,存儲(chǔ)單元例如是硬盤(HardDisk Drive,HDD)、可抹除可編程只讀存儲(chǔ)器(Erasable Programmable Read Only Memory,EPROM)、電子抹除式可復(fù)寫只讀存儲(chǔ)器(Electrically Erasable Programmable Read OnlyMemory, EEPR0M)或快閃存儲(chǔ)器(Flash memory)等可復(fù)寫式非易失性存儲(chǔ)器,或是具有存儲(chǔ)數(shù)據(jù)的功能的電路。應(yīng)注意的是,存儲(chǔ)單元亦存儲(chǔ)服務(wù)器100的其他數(shù)據(jù),例如,用以管理服務(wù)器100本身的軔體或是軟件。
[0051]存儲(chǔ)器單元340是耦接至處理單元310,并且用以暫存服務(wù)器100的數(shù)據(jù)。在本范例實(shí)施例中,存儲(chǔ)器單元340例如是動(dòng)態(tài)隨機(jī)存儲(chǔ)器(Dynamic Random Access Memory,DRAM)、靜態(tài)隨機(jī)存儲(chǔ)器(Static Random Access Memory, SRAM)等易失性存儲(chǔ)器。在本范例實(shí)施例中,為了實(shí)行存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)的功能,當(dāng)服務(wù)器100上電時(shí),處理單元310會(huì)從存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320讀取這些程序,將所讀取的程序載入至存儲(chǔ)器單元340,執(zhí)行這些程序以完成服務(wù)器100的多個(gè)功能。換言之,處理單元310會(huì)執(zhí)行這些程序以實(shí)行服務(wù)器100所使用的存儲(chǔ)裝置壽命監(jiān)控方法。
[0052]圖2是根據(jù)一范例實(shí)施例所繪示的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)的程序的關(guān)系示意圖。以下通過圖2來說明存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320所存儲(chǔ)的這些程序以及數(shù)據(jù)庫的功能與其之間的互動(dòng)關(guān)系。
[0053]請(qǐng)參照?qǐng)D2,存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320包括實(shí)行存儲(chǔ)裝置壽命監(jiān)控方法的這些程序與數(shù)據(jù)庫120。在本范例實(shí)施例中,這些程序包括存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊(Storage Device Status Detecting and Analyzing Module) 110、壽命估計(jì)訓(xùn)練模塊(Lifetime Estimat1n Training Module) 130、壽命預(yù)測(cè)模塊(Lifetime PredictingModule)140。
[0054]存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110用以獲取對(duì)應(yīng)這些存儲(chǔ)裝置200 (0)?200 (N)的運(yùn)作行為信息。在一范例實(shí)施例中,存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊100包括日志搜集模塊(Log Collecting Module) 111 與運(yùn)作行為識(shí)別模塊(Operat1n Activity IdentifyingModule)112。
[0055]日志搜集模塊111會(huì)搜集對(duì)應(yīng)每一存儲(chǔ)裝置的至少一個(gè)運(yùn)作日志(LOG)。具體來說,在本范例實(shí)施例中,每一存儲(chǔ)裝置在進(jìn)行任何運(yùn)作時(shí),都會(huì)將有關(guān)目前運(yùn)作的信息記錄在運(yùn)作日志中。舉例來說,假設(shè)存儲(chǔ)裝置進(jìn)行數(shù)據(jù)讀取運(yùn)作,此存儲(chǔ)裝置便會(huì)記錄此數(shù)據(jù)讀取運(yùn)作的開始時(shí)間、結(jié)束時(shí)間、目標(biāo)數(shù)據(jù)的大小與地址以及在讀取數(shù)據(jù)的運(yùn)作中是否有錯(cuò)誤發(fā)生等任何關(guān)于此數(shù)據(jù)讀取運(yùn)作的信息于對(duì)應(yīng)此數(shù)據(jù)讀取運(yùn)作的運(yùn)作日志中。在本范例實(shí)施例中,日志搜集模塊111搜集對(duì)應(yīng)每一存儲(chǔ)裝置的至少一個(gè)運(yùn)作日志的方式例如是處理單元310從存儲(chǔ)裝置讀取所記錄的運(yùn)作日志,并將運(yùn)作日志輸入至日志搜集模塊,但本發(fā)明不限于此。例如,日志搜集模塊111也可主動(dòng)對(duì)存儲(chǔ)裝置發(fā)出請(qǐng)求來獲得運(yùn)作日志。
[0056]在本范例實(shí)施例中,運(yùn)作日志包括系統(tǒng)日志(System Log)、應(yīng)用程序日志(Applicat1n Log)、數(shù)據(jù)庫日志(Database Log)與自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志(S.M.A.R.T.Log)。系統(tǒng)日志會(huì)記錄關(guān)于存儲(chǔ)裝置200 (O)?200 (N)在處理系統(tǒng)運(yùn)作的相關(guān)信息。應(yīng)用程序日志會(huì)記錄關(guān)于應(yīng)用程序?qū)τ诖鎯?chǔ)裝置200 (O)?200 (N)的存取運(yùn)作的相關(guān)信息。數(shù)據(jù)庫日志會(huì)記錄客戶端對(duì)于存儲(chǔ)裝置200 (O)?200(N)的數(shù)據(jù)庫所進(jìn)行的存取運(yùn)作。自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志是記錄對(duì)應(yīng)在存儲(chǔ)裝置200 (O)?200(N)中屬于硬盤的存儲(chǔ)裝置的自我監(jiān)測(cè)分析及報(bào)告技術(shù)的信息。
[0057]在本范例實(shí)施例中,運(yùn)作行為識(shí)別模塊112用以剖析對(duì)應(yīng)每一存儲(chǔ)裝置的運(yùn)作日志以建立每一存儲(chǔ)裝置的運(yùn)作行為信息。具體來說,運(yùn)作行為識(shí)別模塊112會(huì)識(shí)別對(duì)應(yīng)每一存儲(chǔ)裝置的系統(tǒng)日志中的系統(tǒng)存取錯(cuò)誤、應(yīng)用程序日志中的應(yīng)用程序存取錯(cuò)誤、數(shù)據(jù)庫日志中的數(shù)據(jù)庫存取錯(cuò)誤和自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志中的磁盤存取錯(cuò)誤。此外,運(yùn)作行為識(shí)別模塊112還會(huì)計(jì)算對(duì)應(yīng)每一存儲(chǔ)裝置的系統(tǒng)存取錯(cuò)誤的數(shù)目、應(yīng)用程序存取錯(cuò)誤的數(shù)目、數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與磁盤存取錯(cuò)誤的數(shù)目,并且依據(jù)對(duì)應(yīng)每一存儲(chǔ)裝置的系統(tǒng)存取錯(cuò)誤的數(shù)目、應(yīng)用程序存取錯(cuò)誤的數(shù)目、數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與磁盤存取錯(cuò)誤的數(shù)目來建立每一存儲(chǔ)裝置的運(yùn)作行為信息。
[0058]舉例來說,假設(shè)日志搜集模塊111從存儲(chǔ)裝置200(2)搜集到系統(tǒng)日志、應(yīng)用程序日志、數(shù)據(jù)庫日志與自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志。運(yùn)作行為識(shí)別模塊112從存儲(chǔ)裝置200 (2)的系統(tǒng)日志辨識(shí)到3個(gè)系統(tǒng)存取錯(cuò)誤;從存儲(chǔ)裝置200 (2)的應(yīng)用程序日志辨識(shí)到30個(gè)應(yīng)用程序存取錯(cuò)誤;從存儲(chǔ)裝置200 (2)的數(shù)據(jù)庫日志辨識(shí)到300個(gè)數(shù)據(jù)庫錯(cuò)誤;從存儲(chǔ)裝置200(2)的自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志辨識(shí)到O個(gè)磁盤存取錯(cuò)誤。運(yùn)作行為識(shí)別模塊112會(huì)建立存儲(chǔ)裝置200(2)的運(yùn)作行為信息,例如,運(yùn)作行為識(shí)別模塊112將存儲(chǔ)裝置200(2)的運(yùn)作行為信息記錄為“3,30,300,O”。
[0059]再例如,假設(shè)日志搜集模塊111之后再從存儲(chǔ)裝置200(2)搜集到系統(tǒng)日志、應(yīng)用程序日志、數(shù)據(jù)庫日志與自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志中辨識(shí)到3個(gè)系統(tǒng)存取錯(cuò)誤、30個(gè)應(yīng)用程序存取錯(cuò)誤、300個(gè)數(shù)據(jù)庫錯(cuò)誤以及O個(gè)磁盤存取錯(cuò)誤時(shí),運(yùn)作行為識(shí)別模塊112將存儲(chǔ)裝置200 (2)的運(yùn)作行為信息更新為“6,60,600,O”。也就是說,運(yùn)作行為識(shí)別模塊112會(huì)持續(xù)更新存儲(chǔ)裝置200 (2)的運(yùn)作行為信息。
[0060]在本范例實(shí)施例中,存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320包括數(shù)據(jù)庫120,其中數(shù)據(jù)庫120記錄多個(gè)訓(xùn)練數(shù)據(jù),并且每一訓(xùn)練數(shù)據(jù)包括運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值。在此,訓(xùn)練數(shù)據(jù)為依據(jù)先前所使用的存儲(chǔ)裝置的使用狀態(tài)所記錄的其運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值。每一筆訓(xùn)練數(shù)據(jù)是對(duì)應(yīng)一個(gè)先前所使用的存儲(chǔ)裝置的信息。關(guān)于運(yùn)作行為信息的說明已詳述于上,在此不贅述于此。而對(duì)應(yīng)運(yùn)作壽命值,是指在存儲(chǔ)裝置從出廠后至發(fā)生損壞而無法使用之間運(yùn)作時(shí)間的總和(亦稱存儲(chǔ)裝置的壽命)。但必須了解的是,本發(fā)明不限于此定義。廠商可依據(jù)需求來設(shè)計(jì)對(duì)應(yīng)運(yùn)作壽命值的定義。對(duì)應(yīng)運(yùn)作壽命值的單位,例如是小時(shí)等適用的時(shí)間單位。舉例來說,假設(shè)其中一筆訓(xùn)練數(shù)據(jù)為“0,0,0,100,50000”,則此筆訓(xùn)練數(shù)據(jù)即可用來表示,某個(gè)存儲(chǔ)裝置的運(yùn)作行為信息為“0,0,0,100”,并且其壽命為50000小時(shí)。應(yīng)注意的是,上述訓(xùn)練數(shù)據(jù)的格式僅為說明之用,不限定本發(fā)明。
[0061]壽命估計(jì)訓(xùn)練模塊130用以依據(jù)這些訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來訓(xùn)練(亦稱架構(gòu))存儲(chǔ)裝置壽命預(yù)測(cè)模型。更進(jìn)一步地說,廠商在設(shè)計(jì)存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320時(shí),會(huì)根據(jù)舊有的數(shù)據(jù)中心(或是另一數(shù)據(jù)中心)的每一存儲(chǔ)裝置的(以前發(fā)生的)運(yùn)作行為信息與運(yùn)作壽命來做為多個(gè)訓(xùn)練數(shù)據(jù),并且利用存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320的數(shù)據(jù)庫120來記錄這些訓(xùn)練數(shù)據(jù),以讓壽命估計(jì)訓(xùn)練模塊依據(jù)這些訓(xùn)練數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0062]壽命預(yù)測(cè)模塊140用以將從存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110所接收的存儲(chǔ)裝置200(0)?200 (N)的運(yùn)作行為信息輸入至壽命估計(jì)訓(xùn)練模塊130所架構(gòu)的存儲(chǔ)裝置壽命預(yù)測(cè)模型,并產(chǎn)生每一存儲(chǔ)裝置的預(yù)估壽命值。以下將配合圖3來說明本發(fā)明的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)的整體概念。
[0063]圖3是根據(jù)一范例實(shí)施例所繪示的使用訓(xùn)練數(shù)據(jù)、預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作示意圖。
[0064]首先,在本范例實(shí)施例中,處理單元310會(huì)將存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320的數(shù)據(jù)庫120中的訓(xùn)練數(shù)據(jù)輸入至壽命估計(jì)訓(xùn)練模塊130,以架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型(路徑R301)。壽命估計(jì)訓(xùn)練模塊130會(huì)提供架構(gòu)后的存儲(chǔ)裝置壽命預(yù)測(cè)模型給壽命預(yù)測(cè)模塊140 (路徑303)。架構(gòu)后的存儲(chǔ)裝置壽命預(yù)測(cè)模型可用來預(yù)測(cè)數(shù)據(jù)中心10的存儲(chǔ)裝置200(0)?200 (N)的壽命。
[0065]存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110會(huì)(即時(shí)地)搜集存儲(chǔ)裝置200 (O)?200 (N)的運(yùn)作行為信息,并且將這些運(yùn)作行為信息輸入至壽命預(yù)測(cè)模塊140 (路徑R305)。
[0066]壽命預(yù)測(cè)模塊140將所接收的存儲(chǔ)裝置200 (O)?200 (N)的運(yùn)作行為信息輸入至存儲(chǔ)裝置壽命預(yù)測(cè)模型,并產(chǎn)生每一存儲(chǔ)裝置的預(yù)估壽命值。具體來說,壽命預(yù)測(cè)模塊140將所建立的對(duì)應(yīng)每一存儲(chǔ)裝置的運(yùn)作行為信息輸入至已架構(gòu)的存儲(chǔ)裝置壽命預(yù)測(cè)模型以產(chǎn)生對(duì)應(yīng)每一存儲(chǔ)裝置的預(yù)估壽命值。所述對(duì)應(yīng)每一存儲(chǔ)裝置的預(yù)估壽命值是指示存儲(chǔ)裝置壽命預(yù)測(cè)模型所預(yù)測(cè)的對(duì)應(yīng)每一存儲(chǔ)裝置的可運(yùn)作時(shí)間的總和。舉例來說,假設(shè)存儲(chǔ)裝置200(2)的運(yùn)作行為信息為“6,60,600,0”。壽命預(yù)測(cè)模塊140將存儲(chǔ)裝置200 (2)的運(yùn)作行為信息為“6,60,600,O”輸入至已架構(gòu)的存儲(chǔ)裝置壽命預(yù)測(cè)模型,并且存儲(chǔ)裝置壽命預(yù)測(cè)模型會(huì)對(duì)應(yīng)運(yùn)作行為信息“6,60,600,O”產(chǎn)生“5000” (小時(shí))的預(yù)估壽命值。換言之,在存儲(chǔ)裝置200 (2)目前的對(duì)應(yīng)運(yùn)作行為信息為“6,60,600,O”的狀態(tài)下,存儲(chǔ)裝置壽命預(yù)測(cè)模型會(huì)預(yù)測(cè)存儲(chǔ)裝置200(2)總共可以運(yùn)作的時(shí)間為5000小時(shí)。
[0067]接著,壽命預(yù)測(cè)模塊140還會(huì)將對(duì)應(yīng)每一存儲(chǔ)裝置的運(yùn)作行為信息與預(yù)估壽命值所構(gòu)成的預(yù)測(cè)數(shù)據(jù)傳送至壽命估計(jì)訓(xùn)練模塊130 (路徑R307),以重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。具體來說,存儲(chǔ)裝置壽命預(yù)測(cè)模型可經(jīng)由自我學(xué)習(xí)的方式來被架構(gòu)。例如,壽命預(yù)測(cè)模塊140還會(huì)將每一存儲(chǔ)裝置的運(yùn)作行為信息與預(yù)估壽命值所構(gòu)成的多個(gè)預(yù)測(cè)數(shù)據(jù)傳送至壽命估計(jì)訓(xùn)練模塊130以重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。藉此,壽命預(yù)測(cè)模塊130可以自我學(xué)習(xí)的方式來獲得大量且成本低的數(shù)據(jù)(即,對(duì)應(yīng)每一存儲(chǔ)裝置的預(yù)測(cè)數(shù)據(jù))以架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型,進(jìn)而強(qiáng)化存儲(chǔ)裝置壽命預(yù)測(cè)模型的預(yù)測(cè)能力。本發(fā)明的自我學(xué)習(xí)的機(jī)制將在以下配合圖式做更詳細(xì)的說明。
[0068]此外,當(dāng)存儲(chǔ)裝置200 (O)?200 (N)中有存儲(chǔ)裝置毀損時(shí),存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110會(huì)將此毀損的存儲(chǔ)裝置的當(dāng)前的運(yùn)作行為信息與實(shí)際壽命值所構(gòu)成的實(shí)際數(shù)據(jù)傳送給壽命估計(jì)訓(xùn)練模塊130,以重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型(路徑R309)。例如,當(dāng)這些存儲(chǔ)裝置之中的存儲(chǔ)裝置(以下稱為第一存儲(chǔ)裝置)損壞時(shí),存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110會(huì)記錄第一存儲(chǔ)裝置的實(shí)際壽命值,并且將第一存儲(chǔ)裝置的運(yùn)作行為信息與實(shí)際壽命值所構(gòu)成的實(shí)際數(shù)據(jù)傳送給壽命估計(jì)訓(xùn)練模塊130以重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。換言之,當(dāng)?shù)谝淮鎯?chǔ)裝置損壞時(shí),如上所述,存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110會(huì)將第一存儲(chǔ)裝置的運(yùn)作行為信息與實(shí)際壽命值作為一個(gè)架構(gòu)用的數(shù)據(jù)來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。也就是說,實(shí)際發(fā)生的存儲(chǔ)裝置的運(yùn)作行為信息與對(duì)應(yīng)此運(yùn)作行為信息的存儲(chǔ)裝置的運(yùn)作(實(shí)際)壽命值也可用來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。尤其是,在另一范例實(shí)施例中,實(shí)際數(shù)據(jù)更可被加入至數(shù)據(jù)庫120中成為訓(xùn)練數(shù)據(jù)之一。
[0069]如此一來,本范例實(shí)施例中的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)可自身提供大量且成本低的架構(gòu)用數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型,借此提高本身預(yù)測(cè)壽命的準(zhǔn)確度。值得一提的是,此重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的機(jī)制可以是周期地執(zhí)行或者不定期地執(zhí)行,本發(fā)明不對(duì)此加以限制。以下,配合圖式更詳細(xì)說明每個(gè)構(gòu)件的作用以及互動(dòng)方式。
[0070]值得一提的是,在另一范例實(shí)施例中,服務(wù)器100還可根據(jù)通過存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320獲得的存儲(chǔ)裝置200 (2)的預(yù)估壽命值來進(jìn)行預(yù)防性的操作。舉例來說,假設(shè)存儲(chǔ)裝置200 (2)已經(jīng)操作了 4900小時(shí),并且對(duì)應(yīng)存儲(chǔ)裝置200 (2)的預(yù)估壽命值為5000小時(shí)。由于存儲(chǔ)裝置200(2)的已操作時(shí)間接近預(yù)估壽命值,服務(wù)器100可發(fā)出提醒訊息。數(shù)據(jù)中心10的維護(hù)人員可依據(jù)此提醒訊息來對(duì)存儲(chǔ)裝置200 (2)進(jìn)行預(yù)防性的操作。例如,數(shù)據(jù)中心10的維護(hù)人員可對(duì)存儲(chǔ)裝置200(2)進(jìn)行數(shù)據(jù)備份操作,或是維修/替換操作。特別是,在完成數(shù)據(jù)備份之后,數(shù)據(jù)中心10的維護(hù)人員還可以針對(duì)存儲(chǔ)裝置200 (2)進(jìn)行壓力測(cè)試,以獲得存儲(chǔ)裝置200 (2)的真實(shí)的總運(yùn)作時(shí)間(即,實(shí)際壽命值)。如上所述,在獲得存儲(chǔ)裝置200 (2)的實(shí)際壽命值后,可將存儲(chǔ)裝置200 (2)的實(shí)際壽命值與運(yùn)作行為信息傳送至壽命估計(jì)訓(xùn)練模塊130以重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0071 ] 在本范例實(shí)施例中,壽命估計(jì)訓(xùn)練模塊130是使用線性回歸分析(I inearregress1n)演算法與這些訓(xùn)練數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型,但本發(fā)明不限于此,例如,在其他范例實(shí)施例中,壽命估計(jì)訓(xùn)練模塊130還可使用K分群(K-means)演算法、或支援向量機(jī)(Support Vector Machine,SVM)等適用于機(jī)器學(xué)習(xí)的演算法來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0072]值得一提的是,在另一范例實(shí)施例中,使用者亦可以同時(shí)將訓(xùn)練數(shù)據(jù)輸入至對(duì)應(yīng)多個(gè)演算法的存儲(chǔ)裝置壽命預(yù)測(cè)模型。在架構(gòu)完成之后,通過輸入某個(gè)訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息至這些架構(gòu)后的存儲(chǔ)裝置壽命預(yù)測(cè)模型中來獲得多個(gè)預(yù)測(cè)壽命,并且根據(jù)所獲得的預(yù)測(cè)壽命來挑選出最準(zhǔn)確的存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0073]圖4與圖5是根據(jù)一范例實(shí)施例所繪示的架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的示意圖。
[0074]為了簡(jiǎn)化說明,假設(shè)每一訓(xùn)練數(shù)據(jù)(如圖4、圖5所繪示的圓點(diǎn)D1、D2)包括系統(tǒng)存取錯(cuò)誤的數(shù)目與對(duì)應(yīng)系統(tǒng)存取錯(cuò)誤的數(shù)目的運(yùn)作壽命值。存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110僅收集每一存儲(chǔ)裝置的系統(tǒng)日志,計(jì)算每一存儲(chǔ)裝置的系統(tǒng)存取錯(cuò)誤以建立對(duì)應(yīng)每一存儲(chǔ)裝置的一個(gè)變數(shù)的運(yùn)作行為信息(系統(tǒng)存取錯(cuò)誤的數(shù)目)。存儲(chǔ)裝置壽命預(yù)測(cè)模型使用線性回歸演算法來使用訓(xùn)練數(shù)據(jù)做架構(gòu)。于此范例實(shí)施例中,經(jīng)過架構(gòu)后的存儲(chǔ)裝置壽命預(yù)測(cè)模型會(huì)產(chǎn)生一個(gè)二元一次的預(yù)測(cè)曲線(圖4、圖5中的虛線)來預(yù)測(cè)每一存儲(chǔ)裝置的預(yù)估壽命值。
[0075]請(qǐng)參照?qǐng)D4,水平軸表示系統(tǒng)存取錯(cuò)誤的數(shù)目,縱軸表示存儲(chǔ)裝置的壽命(fulltime lifetime cycle in hours)(以小時(shí)為單位)。舉例來說,假設(shè)存儲(chǔ)裝置壽命預(yù)測(cè)模型使用線性回歸演算法來做架構(gòu),并且一開始輸入了兩個(gè)訓(xùn)練數(shù)據(jù)Dl、D2至存儲(chǔ)裝置壽命預(yù)測(cè)模型。訓(xùn)練數(shù)據(jù)Dl的值為“2,500”,其代表具有2個(gè)系統(tǒng)存取錯(cuò)誤的存儲(chǔ)裝置,其壽命為500小時(shí)。相似地,訓(xùn)練數(shù)據(jù)D2的值為“ 10,100”,其代表具有10個(gè)系統(tǒng)存取錯(cuò)誤的存儲(chǔ)裝置,其壽命為100小時(shí)。根據(jù)線性回歸演算法與訓(xùn)練數(shù)據(jù)D1、D2,存儲(chǔ)裝置壽命預(yù)測(cè)模型產(chǎn)生一個(gè)二元一次的預(yù)測(cè)曲線Y(如圖4所繪示的虛線)。
[0076]請(qǐng)參照?qǐng)D5,舉例來說,假設(shè)在圖4中的存儲(chǔ)裝置壽命預(yù)測(cè)模型又被輸入了其他訓(xùn)練數(shù)據(jù)D3?D10。根據(jù)線性回歸演算法與訓(xùn)練數(shù)據(jù)Dl?D10,存儲(chǔ)裝置壽命預(yù)測(cè)模型會(huì)產(chǎn)生一個(gè)二元一次的預(yù)測(cè)曲線A(如圖5所繪示的虛線)。而上述因?yàn)檩斎氲挠?xùn)練數(shù)據(jù)不同,而產(chǎn)生不同預(yù)測(cè)曲線的過程,即可視為存儲(chǔ)裝置壽命預(yù)測(cè)模型根據(jù)其使用的演算法以及所輸入的訓(xùn)練數(shù)據(jù)持續(xù)地改變其架構(gòu)的過程。此外,廠商可在一個(gè)預(yù)定情況下,判定存儲(chǔ)裝置壽命預(yù)測(cè)模型是否已經(jīng)完成架構(gòu)。例如,如圖5所繪示,廠商可以設(shè)定輸入10個(gè)的訓(xùn)練數(shù)據(jù)Dl?DlO至存儲(chǔ)裝置壽命預(yù)測(cè)模型后,存儲(chǔ)裝置壽命預(yù)測(cè)模型所形成的預(yù)測(cè)曲線A即可表示已經(jīng)完成架構(gòu)的存儲(chǔ)裝置壽命預(yù)測(cè)模型。爾后,此完成架構(gòu)的存儲(chǔ)裝置壽命預(yù)測(cè)模型可被用來預(yù)測(cè)存儲(chǔ)裝置的壽命。
[0077]圖6與圖7是根據(jù)一范例實(shí)施例所繪示的自我學(xué)習(xí)方法的示意圖。為了簡(jiǎn)化說明,圖6與圖7所使用的存儲(chǔ)裝置壽命預(yù)測(cè)模型的架構(gòu)方式與圖4、圖5中的存儲(chǔ)裝置壽命預(yù)測(cè)模型的架構(gòu)方式相同,在此不再贅述。
[0078]請(qǐng)參照?qǐng)D6,舉例來說,假設(shè)完成架構(gòu)后的存儲(chǔ)裝置壽命預(yù)測(cè)模型已產(chǎn)生一個(gè)二元一次的預(yù)測(cè)曲線A (如圖6所繪示的虛線),并且存儲(chǔ)裝置200 (O)、200 (I)、200 (2)各自發(fā)生了第2、5、8次系統(tǒng)存取錯(cuò)誤。存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110會(huì)對(duì)應(yīng)建立存儲(chǔ)裝置200(0)、200(1)、200 (2)的運(yùn)作行為信息為“2”、“5”、“8”。壽命預(yù)測(cè)模塊將這些存儲(chǔ)裝置的運(yùn)作行為信息(系統(tǒng)存取錯(cuò)誤的數(shù)目)輸入至存儲(chǔ)裝置壽命預(yù)測(cè)模型。存儲(chǔ)裝置壽命預(yù)測(cè)模型利用預(yù)測(cè)曲線A與存儲(chǔ)裝置200(0)、200(1)、200(2)的系統(tǒng)存取錯(cuò)誤的數(shù)目(即,“2”、“5”、“8”)來產(chǎn)生“550”、“115”、“40”的預(yù)估壽命值以分別地表示所預(yù)測(cè)的存儲(chǔ)裝置200(0)、200(1)、200 (2)的壽命。也就是說,上述對(duì)應(yīng)存儲(chǔ)裝置200 (O)、200 (I)、200 (2)的運(yùn)作行為信息與預(yù)估壽命值會(huì)分別構(gòu)成對(duì)應(yīng)存儲(chǔ)裝置200(0) ,200(1) ,200(2)的預(yù)測(cè)數(shù)據(jù)“2,550,,、“5,115,,與“8,40”。接著,壽命預(yù)測(cè)模塊140會(huì)將預(yù)測(cè)數(shù)據(jù)(即,“2,550”、“5,115”、與“8,40”)傳送至壽命估計(jì)訓(xùn)練模塊130以重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0079]請(qǐng)參照?qǐng)D7,經(jīng)過使用上述的預(yù)測(cè)數(shù)據(jù)(如圖7所繪示的三角形點(diǎn),“2,550”、“5,115”與“8,40”)來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型后,存儲(chǔ)裝置壽命預(yù)測(cè)模型會(huì)產(chǎn)生新的預(yù)測(cè)曲線B。此經(jīng)過使用預(yù)測(cè)數(shù)據(jù)來重新架構(gòu)(S卩,自我學(xué)習(xí))所產(chǎn)生的新的預(yù)測(cè)曲線B可被用來預(yù)測(cè)存儲(chǔ)裝置的壽命。舉例來說,若存儲(chǔ)裝置200 (N)發(fā)生了第4次系統(tǒng)存取錯(cuò)誤,存儲(chǔ)裝置壽命預(yù)測(cè)模型根據(jù)預(yù)測(cè)曲線B與存儲(chǔ)裝置200 (N)的系統(tǒng)存取錯(cuò)誤的數(shù)目“4”會(huì)得到存儲(chǔ)裝置200 (N)的預(yù)估壽命值為275小時(shí)。
[0080]請(qǐng)?jiān)賲⒄請(qǐng)D6,若存儲(chǔ)裝置200 (N)發(fā)生了第4次系統(tǒng)存取錯(cuò)誤,存儲(chǔ)裝置壽命預(yù)測(cè)模型根據(jù)預(yù)測(cè)曲線A與存儲(chǔ)裝置200 (N)的系統(tǒng)存取錯(cuò)誤的數(shù)目“4”會(huì)得到存儲(chǔ)裝置200 (N)的預(yù)估壽命值為“300”(小時(shí))。由于在訓(xùn)練數(shù)據(jù)中對(duì)應(yīng)系統(tǒng)存取錯(cuò)誤的數(shù)目為“4”的訓(xùn)練數(shù)據(jù),其具有“250” (小時(shí))的對(duì)應(yīng)運(yùn)作壽命值,并且在同樣的對(duì)應(yīng)系統(tǒng)存取錯(cuò)誤的數(shù)目為“4”的情況下,根據(jù)預(yù)測(cè)曲線B所預(yù)測(cè)的預(yù)估壽命值“275”比起根據(jù)預(yù)測(cè)曲線A所預(yù)測(cè)的預(yù)估壽命值“300”更接近訓(xùn)練數(shù)據(jù)(即,“250”)。因此可以得知,預(yù)測(cè)曲線B的準(zhǔn)確度會(huì)高于預(yù)測(cè)曲線A。也就是說,通過使用預(yù)測(cè)數(shù)據(jù)來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的自我學(xué)習(xí)方法的確可以增進(jìn)存儲(chǔ)裝置壽命預(yù)測(cè)模型的預(yù)測(cè)的準(zhǔn)確度。
[0081]在上述圖4至圖7的例子中,存儲(chǔ)裝置壽命預(yù)測(cè)模型是根據(jù)兩個(gè)變數(shù)的訓(xùn)練數(shù)據(jù)(亦稱二維訓(xùn)練數(shù)據(jù))來進(jìn)行架構(gòu)的,其中一個(gè)變數(shù)是存儲(chǔ)裝置的系統(tǒng)存取錯(cuò)誤,并且另一變數(shù)是對(duì)應(yīng)的存儲(chǔ)裝置的壽命。但應(yīng)注意的是,本發(fā)明并不限定訓(xùn)練數(shù)據(jù)、預(yù)測(cè)數(shù)據(jù)或是實(shí)際數(shù)據(jù)等用以架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的數(shù)據(jù)的數(shù)據(jù)維度(亦稱為變數(shù))。例如,在另一范例實(shí)施例中,除了必要的數(shù)據(jù)維度(即,存儲(chǔ)裝置的壽命),用以架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的數(shù)據(jù)的數(shù)據(jù)維度還可包括應(yīng)用程序存取錯(cuò)誤數(shù)目、數(shù)據(jù)庫存取錯(cuò)誤數(shù)目與磁盤存取錯(cuò)誤數(shù)目的其中之一或其組合,或是其他適用的對(duì)應(yīng)存儲(chǔ)裝置運(yùn)作行為的錯(cuò)誤種類。此外,用以架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的數(shù)據(jù)所包含的變數(shù)種類數(shù)量也可等于2個(gè)或多于2個(gè)。換言之,用以架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的數(shù)據(jù)的數(shù)據(jù)維度數(shù)量可為二維或是高于二維的數(shù)量。
[0082]值得一提的是,由于用來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的訓(xùn)練數(shù)據(jù)或預(yù)測(cè)數(shù)據(jù)的數(shù)量很大,在一范例實(shí)施例中,壽命估計(jì)訓(xùn)練模塊130會(huì)使用分割-合并(Split-and-M)的方式(例如,Hadoop MapReduce演算法)來加速對(duì)于存儲(chǔ)裝置壽命預(yù)測(cè)模型的架構(gòu)。
[0083]圖8是根據(jù)一范例實(shí)施例所繪示的使用訓(xùn)練數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作示意圖。
[0084]請(qǐng)參照?qǐng)D8,在本范例實(shí)施例中,壽命估計(jì)訓(xùn)練模塊130會(huì)將訓(xùn)練數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)(亦稱數(shù)據(jù)主集合)分割為多個(gè)數(shù)據(jù)集合(如圖8所繪示的子集合a、b、c),并且將這些子集合a、b、c分別地傳送至多個(gè)叢集運(yùn)算服務(wù)器810、820、830 (路徑Rl)。尤其是,每一叢集運(yùn)算服務(wù)器還可將所接收到的子集合分割成為其他的子集合并傳送這些分割后的其他的子集合至其他叢集運(yùn)算服務(wù)器。例如,叢集運(yùn)算服務(wù)器830將子集合c分割為子集合c-1與子集合c-2,并且將子集合c-1、c-2分別傳送至叢集運(yùn)算服務(wù)器831、832(路徑R2)。應(yīng)注意的是,上述數(shù)據(jù)主集合亦可包含實(shí)際數(shù)據(jù)。
[0085]接著,叢集運(yùn)算服務(wù)器會(huì)分別依據(jù)所接收到的子集合來架構(gòu)多個(gè)子預(yù)測(cè)模型并且將這些子預(yù)測(cè)模型回傳給壽命估計(jì)訓(xùn)練模塊130。如圖8所繪示,叢集運(yùn)算服務(wù)器831、832分別依據(jù)所接收到的子集合c-1、c-2來架構(gòu)多個(gè)子預(yù)測(cè)模型并且將這些子預(yù)測(cè)模型回傳給壽命估計(jì)訓(xùn)練模塊130 (路徑R3),叢集運(yùn)算服務(wù)器830會(huì)等待并接收叢集運(yùn)算服務(wù)器831、832分別回傳至叢集運(yùn)算服務(wù)器830的多個(gè)子預(yù)測(cè)模型。在接收到這些子預(yù)測(cè)模型后,叢集運(yùn)算服務(wù)器830會(huì)合并這些子預(yù)測(cè)模型,并且回傳合并后的子預(yù)測(cè)模型至壽命估計(jì)訓(xùn)練模塊130 (路徑R4)。相似地,叢集運(yùn)算服務(wù)器810、820也會(huì)分別依據(jù)所接收到的子集合a、b來架構(gòu)多個(gè)子預(yù)測(cè)模型并且將這些子預(yù)測(cè)模型回傳給壽命估計(jì)訓(xùn)練模塊130 (路徑R4)。壽命估計(jì)訓(xùn)練模塊130從叢集運(yùn)算服務(wù)器810、820、830接收到訓(xùn)練后的多個(gè)子預(yù)測(cè)模型后,合并這些子預(yù)測(cè)模型以形成存儲(chǔ)裝置壽命預(yù)測(cè)模型。如此一來,通過上述分割-合并的方式,大量的數(shù)據(jù)可以被分割成為較小的數(shù)據(jù)子集合,分別地獨(dú)立運(yùn)算(即,架構(gòu)多個(gè)子預(yù)測(cè)模型),并且在架構(gòu)完成后,將結(jié)果(即,子預(yù)測(cè)模型)合并形成存儲(chǔ)裝置壽命預(yù)測(cè)模型,進(jìn)而減少架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型的資源與架構(gòu)時(shí)間。
[0086]值得一提的是,存儲(chǔ)裝置壽命預(yù)測(cè)模型亦可在出廠時(shí)便已經(jīng)由廠商來完成初步訓(xùn)練。也就是說,在另一范例實(shí)施例中,存儲(chǔ)裝置壽命預(yù)測(cè)模型已經(jīng)在出廠時(shí),并經(jīng)由一個(gè)數(shù)據(jù)庫的訓(xùn)練數(shù)據(jù)初步架構(gòu)完畢。存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320的數(shù)據(jù)庫120并不需要預(yù)先存儲(chǔ)大量的訓(xùn)練數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。但,應(yīng)注意的是,存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320依然可以將從數(shù)據(jù)中心10的存儲(chǔ)裝置200(0)?200 (N)所得到的實(shí)際數(shù)據(jù)(即,存儲(chǔ)裝置200 (O)?200 (N)中毀損的存儲(chǔ)裝置的當(dāng)前的運(yùn)作行為信息與實(shí)際壽命值)來加入至數(shù)據(jù)庫120,并且將所獲得的實(shí)際數(shù)據(jù)輸入至壽命估計(jì)訓(xùn)練模塊130來重新訓(xùn)練存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0087]圖9是根據(jù)一范例實(shí)施例所繪示的存儲(chǔ)裝置壽命監(jiān)控方法的流程圖。
[0088]請(qǐng)同時(shí)參照?qǐng)D2與圖9,在步驟S901中,存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110用以獲取對(duì)應(yīng)這些存儲(chǔ)裝置200 (O)?200 (N)的運(yùn)作行為信息。
[0089]在步驟S903中,存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320存儲(chǔ)數(shù)據(jù)庫,其中數(shù)據(jù)庫記錄多個(gè)訓(xùn)練數(shù)據(jù),其中每一訓(xùn)練數(shù)據(jù)包括運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值。
[0090]在步驟S905中,壽命估計(jì)訓(xùn)練模塊130依據(jù)這些訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。
[0091 ] 在步驟S907中,壽命預(yù)測(cè)模塊140將這些存儲(chǔ)裝置200 (O)?200 (N)的運(yùn)作行為信息輸入至存儲(chǔ)裝置壽命預(yù)測(cè)模型以產(chǎn)生對(duì)應(yīng)每一存儲(chǔ)裝置的預(yù)估壽命值。
[0092]在步驟S909中,所述壽命預(yù)測(cè)模塊還依據(jù)每一存儲(chǔ)裝置的運(yùn)作行為信息與預(yù)估壽命值所構(gòu)成的多個(gè)預(yù)測(cè)數(shù)據(jù)來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。如此一來,本實(shí)施例的存儲(chǔ)裝置壽命監(jiān)控方法除了使用訓(xùn)練數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型之外,還會(huì)使用預(yù)測(cè)數(shù)據(jù)來架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。借此,大大提高存儲(chǔ)裝置壽命預(yù)測(cè)模型的架構(gòu)效率,進(jìn)而提高預(yù)測(cè)的準(zhǔn)確度。
[0093]值得一提的是,在本范例實(shí)施例中,存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110、壽命估計(jì)訓(xùn)練模塊130、壽命預(yù)測(cè)模塊140的功能是以程序或軟件來實(shí)施,但本發(fā)明不限于此。在另一范例實(shí)施例中,存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110、壽命估計(jì)訓(xùn)練模塊130、壽命預(yù)測(cè)模塊140亦可以硬件電路(例如,電路單元)來實(shí)現(xiàn)。例如,存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)320可包括用以實(shí)現(xiàn)存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊110的功能的存儲(chǔ)裝置狀態(tài)檢測(cè)與分析電路單元、用以實(shí)現(xiàn)壽命估計(jì)訓(xùn)練模塊130的功能的壽命估計(jì)訓(xùn)練電路單元、用以實(shí)現(xiàn)壽命預(yù)測(cè)模塊140的功能的壽命預(yù)測(cè)電路單元以及存儲(chǔ)記錄訓(xùn)練數(shù)據(jù)、實(shí)際數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)的數(shù)據(jù)庫的存儲(chǔ)電路單元。
[0094]綜上所述,本發(fā)明所提供的一種存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)以及其所使用的存儲(chǔ)裝置壽命監(jiān)控方法,可辨識(shí)對(duì)應(yīng)多個(gè)存儲(chǔ)裝置的運(yùn)作行為信息,根據(jù)這些存儲(chǔ)裝置的運(yùn)作行為信息經(jīng)由存儲(chǔ)裝置壽命預(yù)測(cè)模型來預(yù)測(cè)每一存儲(chǔ)裝置的壽命,更依據(jù)每一存儲(chǔ)裝置的運(yùn)作行為信息與所預(yù)測(cè)的壽命所構(gòu)成的多個(gè)預(yù)測(cè)數(shù)據(jù)來重新架構(gòu)存儲(chǔ)裝置壽命預(yù)測(cè)模型。如此一來,本發(fā)明可產(chǎn)生大量且成本低的訓(xùn)練數(shù)據(jù)來增進(jìn)預(yù)測(cè)存儲(chǔ)裝置的壽命的精確度,進(jìn)而提高管理這些存儲(chǔ)裝置的效率。
[0095]雖然本發(fā)明已以實(shí)施例揭露如上,然其并非用以限定本發(fā)明,任何所屬技術(shù)領(lǐng)域中具有通常知識(shí)者,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作些許的更動(dòng)與潤飾,故本發(fā)明的保護(hù)范圍當(dāng)視權(quán)利要求所界定者為準(zhǔn)。
【主權(quán)項(xiàng)】
1.一種存儲(chǔ)裝置壽命監(jiān)控系統(tǒng),用于監(jiān)控多個(gè)存儲(chǔ)裝置的壽命,其特征在于,所述存儲(chǔ)裝置壽命監(jiān)控系統(tǒng)包括: 一存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊; 一數(shù)據(jù)庫,耦接至所述存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊; 一壽命估計(jì)訓(xùn)練模塊,耦接至所述存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊;以及 一壽命預(yù)測(cè)模塊,耦接至所述存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊與所述壽命估計(jì)訓(xùn)練模塊, 其中所述數(shù)據(jù)庫記錄多個(gè)訓(xùn)練數(shù)據(jù),其中每一所述訓(xùn)練數(shù)據(jù)包括一運(yùn)作行為信息及一對(duì)應(yīng)運(yùn)作壽命值, 其中所述存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊獲取對(duì)應(yīng)所述存儲(chǔ)裝置的運(yùn)作行為信息,其中所述壽命估計(jì)訓(xùn)練模塊依據(jù)所述訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)一存儲(chǔ)裝置壽命預(yù)測(cè)模型, 其中所述壽命預(yù)測(cè)模塊將所述存儲(chǔ)裝置的運(yùn)作行為信息輸入至所述存儲(chǔ)裝置壽命預(yù)測(cè)模型以產(chǎn)生對(duì)應(yīng)每一所述存儲(chǔ)裝置的一預(yù)估壽命值。2.如權(quán)利要求1所述的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng),其特征在于,所述壽命估計(jì)訓(xùn)練模塊依據(jù)每一所述存儲(chǔ)裝置的運(yùn)作行為信息與預(yù)估壽命值重新架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型。3.如權(quán)利要求1所述的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng),其特征在于,當(dāng)所述存儲(chǔ)裝置之中的一第一存儲(chǔ)裝置損壞時(shí),所述存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊記錄所述第一存儲(chǔ)裝置的一實(shí)際壽命值, 其中所述壽命估計(jì)訓(xùn)練模塊依據(jù)第一存儲(chǔ)裝置的運(yùn)作行為信息與實(shí)際壽命值重新架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型。4.如權(quán)利要求1所述的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng),其特征在于,所述存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊包括一日志搜集模塊與一運(yùn)作行為識(shí)別模塊,并且在上述所述存儲(chǔ)裝置狀態(tài)檢測(cè)與分析模塊獲取對(duì)應(yīng)所述存儲(chǔ)裝置的運(yùn)作行為信息的運(yùn)作中, 所述日志搜集模塊搜集對(duì)應(yīng)每一所述存儲(chǔ)裝置的至少一運(yùn)作日志, 其中所述運(yùn)作行為識(shí)別模塊剖析每一所述存儲(chǔ)裝置的至少一運(yùn)作日志以建立每一所述存儲(chǔ)裝置的運(yùn)作行為信息。5.如權(quán)利要求4所述的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng),其特征在于,所述至少一運(yùn)作日志包括一系統(tǒng)日志、一應(yīng)用程序日志、一數(shù)據(jù)庫日志與一自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志。6.如權(quán)利要求5所述的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng),其特征在于,所述運(yùn)作行為識(shí)別模塊識(shí)別對(duì)應(yīng)每一所述存儲(chǔ)裝置的所述系統(tǒng)日志中的一系統(tǒng)存取錯(cuò)誤、所述應(yīng)用程序日志中的一應(yīng)用程序存取錯(cuò)誤、所述數(shù)據(jù)庫日志中的一數(shù)據(jù)庫存取錯(cuò)誤和所述自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志中的一磁盤存取錯(cuò)誤, 其中所述運(yùn)作行為識(shí)別模塊計(jì)算所述系統(tǒng)存取錯(cuò)誤的數(shù)目、所述應(yīng)用程序存取錯(cuò)誤的數(shù)目、所述數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與所述磁盤存取錯(cuò)誤的數(shù)目, 其中所述運(yùn)作行為識(shí)別模塊依據(jù)所述系統(tǒng)存取錯(cuò)誤的數(shù)目、所述應(yīng)用程序存取錯(cuò)誤的數(shù)目、所述數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與所述磁盤存取錯(cuò)誤的數(shù)目來建立每一所述存儲(chǔ)裝置的運(yùn)作行為信息。7.如權(quán)利要求1所述的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng),其特征在于,在所述壽命估計(jì)訓(xùn)練模塊依據(jù)所述訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作中, 所述壽命估計(jì)訓(xùn)練模塊使用一 K分群演算法、一線性回歸分析或一支援向量機(jī)來架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型。8.如權(quán)利要求1所述的存儲(chǔ)裝置壽命監(jiān)控系統(tǒng),其特征在于,在所述壽命估計(jì)訓(xùn)練模塊依據(jù)所述訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型的運(yùn)作中, 所述壽命估計(jì)訓(xùn)練模塊將所述訓(xùn)練數(shù)據(jù)與所述預(yù)測(cè)數(shù)據(jù)分割為多個(gè)數(shù)據(jù)集合, 其中所述壽命估計(jì)訓(xùn)練模塊分別地依據(jù)所述數(shù)據(jù)集合來架構(gòu)多個(gè)子預(yù)測(cè)模型, 其中所述壽命估計(jì)訓(xùn)練模塊合并所述子預(yù)測(cè)模型以形成所述存儲(chǔ)裝置壽命預(yù)測(cè)模型。9.一種存儲(chǔ)裝置壽命監(jiān)控方法,用于監(jiān)控多個(gè)存儲(chǔ)裝置的壽命,其特征在于,所述存儲(chǔ)裝置壽命監(jiān)控方法包括: 建立一數(shù)據(jù)庫,其中所述數(shù)據(jù)庫記錄多個(gè)訓(xùn)練數(shù)據(jù),其中每一所述訓(xùn)練數(shù)據(jù)包括一運(yùn)作行為信息及一對(duì)應(yīng)運(yùn)作壽命值; 獲取對(duì)應(yīng)所述存儲(chǔ)裝置的運(yùn)作行為信息; 依據(jù)所述訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)一存儲(chǔ)裝置壽命預(yù)測(cè)模型;以及 將所述存儲(chǔ)裝置的運(yùn)作行為信息輸入至所述存儲(chǔ)裝置壽命預(yù)測(cè)模型以產(chǎn)生對(duì)應(yīng)每一所述存儲(chǔ)裝置的一預(yù)估壽命值。10.如權(quán)利要求9所述的存儲(chǔ)裝置壽命監(jiān)控方法,其特征在于,還包括: 依據(jù)每一所述存儲(chǔ)裝置的運(yùn)作行為信息與預(yù)估壽命值來重新架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型。11.如權(quán)利要求9所述的存儲(chǔ)裝置壽命監(jiān)控方法,其特征在于,還包括: 當(dāng)所述存儲(chǔ)裝置之中的一第一存儲(chǔ)裝置損壞時(shí),記錄所述第一存儲(chǔ)裝置的一實(shí)際壽命值;以及 依據(jù)所述第一存儲(chǔ)裝置的運(yùn)作行為信息與實(shí)際壽命值來重新架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型。12.如權(quán)利要求9所述的存儲(chǔ)裝置壽命監(jiān)控方法,其特征在于,所述獲取對(duì)應(yīng)所述存儲(chǔ)裝置的運(yùn)作行為信息的步驟包括: 搜集對(duì)應(yīng)每一所述存儲(chǔ)裝置的至少一運(yùn)作日志;以及 剖析每一所述存儲(chǔ)裝置的至少一運(yùn)作日志以建立每一所述存儲(chǔ)裝置的運(yùn)作行為信息。13.如權(quán)利要求12所述的存儲(chǔ)裝置壽命監(jiān)控方法,其特征在于,所述至少一運(yùn)作日志包括一系統(tǒng)日志、一應(yīng)用程序日志、一數(shù)據(jù)庫日志與一自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志。14.如權(quán)利要求13所述的存儲(chǔ)裝置壽命監(jiān)控方法,其特征在于,還包括: 識(shí)別對(duì)應(yīng)每一所述存儲(chǔ)裝置的所述系統(tǒng)日志中的一系統(tǒng)存取錯(cuò)誤、所述應(yīng)用程序日志中的一應(yīng)用程序存取錯(cuò)誤、所述數(shù)據(jù)庫日志中的一數(shù)據(jù)庫存取錯(cuò)誤和所述自我監(jiān)測(cè)分析及報(bào)告技術(shù)日志中的一磁盤存取錯(cuò)誤; 計(jì)算所述系統(tǒng)存取錯(cuò)誤的數(shù)目、所述應(yīng)用程序存取錯(cuò)誤的數(shù)目、所述數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與所述磁盤存取錯(cuò)誤的數(shù)目;以及 依據(jù)所述系統(tǒng)存取錯(cuò)誤的數(shù)目、所述應(yīng)用程序存取錯(cuò)誤的數(shù)目、所述數(shù)據(jù)庫存取錯(cuò)誤的數(shù)目與所述磁盤存取錯(cuò)誤的數(shù)目來建立每一所述存儲(chǔ)裝置的運(yùn)作行為信息。15.如權(quán)利要求9所述的存儲(chǔ)裝置壽命監(jiān)控方法,其特征在于,依據(jù)所述訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型的步驟包括: 使用一 K分群演算法、一線性回歸分析或一支援向量機(jī)來架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型。16.如權(quán)利要求9所述的存儲(chǔ)裝置壽命監(jiān)控方法,其特征在于,依據(jù)所述訓(xùn)練數(shù)據(jù)的運(yùn)作行為信息及對(duì)應(yīng)運(yùn)作壽命值來架構(gòu)所述存儲(chǔ)裝置壽命預(yù)測(cè)模型的步驟包括: 將所述訓(xùn)練數(shù)據(jù)與所述預(yù)測(cè)數(shù)據(jù)分割為多個(gè)數(shù)據(jù)集合; 分別地依據(jù)所述數(shù)據(jù)集合來架構(gòu)多個(gè)子預(yù)測(cè)模型;以及 合并所述子預(yù)測(cè)模型以形成所述存儲(chǔ)裝置壽命預(yù)測(cè)模型。
【文檔編號(hào)】G06F11/30GK105988910SQ201510092859
【公開日】2016年10月5日
【申請(qǐng)日】2015年3月2日
【發(fā)明人】陳志明, 張承億
【申請(qǐng)人】緯創(chuàng)資通股份有限公司