專(zhuān)利名稱(chēng):磁盤(pán)檢測(cè)系統(tǒng)、磁盤(pán)檢測(cè)方法以及網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)存儲(chǔ)領(lǐng)域,尤其涉及磁盤(pán)檢測(cè)系統(tǒng)、磁盤(pán)檢測(cè)方法以及網(wǎng)絡(luò)存儲(chǔ)系統(tǒng);本發(fā)明利用磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)s. M. A. R. T.檢測(cè)磁盤(pán)。
背景技術(shù):
隨著計(jì)算機(jī)成為了必不可少的工具,產(chǎn)生的數(shù)據(jù)也是越來(lái)越多,雖然單個(gè)磁盤(pán)的容量越來(lái)越大,但是仍然滿(mǎn)足不了用戶(hù)的需求。隨著網(wǎng)絡(luò)技術(shù)的迅速發(fā)展及普及,存儲(chǔ)技術(shù)已經(jīng)進(jìn)入了網(wǎng)絡(luò)存儲(chǔ)時(shí)代,可以使用戶(hù)將大量數(shù)據(jù)通過(guò)網(wǎng)絡(luò)進(jìn)行存儲(chǔ)。在大規(guī)模網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)的應(yīng)用中,越來(lái)越多的人意識(shí)到網(wǎng)絡(luò)數(shù)據(jù)的安全性是極為重要的,一旦重要的數(shù)據(jù)被破壞或丟失,就會(huì)對(duì)日常生產(chǎn)造成重大的影響,甚至是難以彌補(bǔ)的損失。因此,保證網(wǎng)絡(luò)數(shù)據(jù)的安全對(duì)于用戶(hù)而言是極為重要的。磁盤(pán)作為網(wǎng)絡(luò)存儲(chǔ)設(shè)備最重要的部件之一,是數(shù)據(jù)最終存儲(chǔ)的地方。因此,對(duì)數(shù)據(jù)的保護(hù)中,磁盤(pán)的保護(hù)成為了重中之重。如果磁盤(pán)損壞,不僅對(duì)應(yīng)磁盤(pán)上的數(shù)據(jù)會(huì)丟失,甚至可能使得整個(gè)磁盤(pán)陣列上的數(shù)據(jù)遭到破壞,其損失勢(shì)必極為慘重。為了減少損失,業(yè)界也提出了一些解決方案,例如獨(dú)立冗余磁盤(pán)陣列(RAID)技術(shù)。雖然獨(dú)立冗余磁盤(pán)陣列(RAID) 技術(shù)能夠在一定程度上緩解磁盤(pán)損壞對(duì)整個(gè)磁盤(pán)陣列的影響,但是,由于陣列的重建時(shí)間長(zhǎng),多個(gè)磁盤(pán)在此期間損壞的可能性仍然存在。專(zhuān)利文獻(xiàn)CN101866271A公開(kāi)了一種磁盤(pán)檢測(cè)的技術(shù)方案,但是該方案只能實(shí)現(xiàn)對(duì)故障的事后報(bào)警,而不能夠提前預(yù)知故障并報(bào)警。如果能夠及時(shí)的檢查、分析磁盤(pán)狀態(tài), 提前預(yù)測(cè)磁盤(pán)是否即將損壞,及時(shí)更換即將損壞的磁盤(pán),可以大幅提高系統(tǒng)的穩(wěn)定性,但現(xiàn)有技術(shù)中還沒(méi)有這樣的解決方案。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的上述問(wèn)題,本發(fā)明提供了磁盤(pán)檢測(cè)系統(tǒng)和網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)。根據(jù)本發(fā)明的一方面,提供了一種磁盤(pán)檢測(cè)系統(tǒng),包括磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,參數(shù)配置模塊,智能分析模塊和報(bào)警模塊;參數(shù)配置模塊,用于配置磁盤(pán)動(dòng)態(tài)檢測(cè)模塊提取磁盤(pán)狀態(tài)信息的時(shí)間間隔,以及磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值;磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,用于根據(jù)參數(shù)配置模塊配置的時(shí)間間隔提取磁盤(pán)的狀態(tài)信智能分析模塊,用于根據(jù)磁盤(pán)的狀態(tài)信息以及磁盤(pán)S. M. A. R. T.信息閾值判斷磁盤(pán)當(dāng)前健康狀況,并根據(jù)磁盤(pán)當(dāng)前健康狀況判定是否向報(bào)警模塊發(fā)送報(bào)警信息;報(bào)警模塊,用于在接收到智能分析模塊發(fā)送的報(bào)警信息后向用戶(hù)報(bào)警。進(jìn)一步地,該磁盤(pán)檢測(cè)系統(tǒng)還包括顯示模塊和/或日志記錄模塊;智能分析模塊,還用于將處理后的數(shù)據(jù)發(fā)送至顯示模塊和/或日志記錄模塊;顯示模塊,用于顯示智能分析模塊發(fā)送的數(shù)據(jù);
日志記錄模塊,用于記錄智能分析模塊發(fā)送的數(shù)據(jù)。進(jìn)一步地,智能分析模塊,還用于在判定向報(bào)警模塊發(fā)送報(bào)警信息的情況下,讀取日志記錄模塊中記錄的磁盤(pán)歷史狀態(tài)信息并進(jìn)行統(tǒng)計(jì)分析,優(yōu)化磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值。進(jìn)一步地,智能分析模塊,磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A.R.T.信息閾值包括磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A.R.T.信息的上限、分析及報(bào)告技術(shù) S.M.A.R.T.信息的下限或者磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A.R.T.信息的上限和下限。進(jìn)一步地,顯示模塊,用于顯示磁盤(pán)容量、磁盤(pán)型號(hào)和磁盤(pán)健康狀況。進(jìn)一步地,健康狀況包括5個(gè)等級(jí),該5個(gè)等級(jí)分別為NEW、N0RMAL、CAUTI0N、WARN 和BROKEN ;當(dāng)健康狀況為WARN或BROKEN時(shí),智能分析模塊向報(bào)警模塊發(fā)送報(bào)警信息;新加入磁盤(pán)的健康狀況等級(jí)為NEW ;磁盤(pán)讀寫(xiě)正常,并且磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.的值未超出磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息的下限,則磁盤(pán)的健康狀況等級(jí)為NORMAL ;磁盤(pán)讀寫(xiě)正常,并且磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.的值超出磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息的下限,則磁盤(pán)的健康狀況等級(jí)為CAUTION ;磁盤(pán)讀寫(xiě)正常,并且磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.的值超出磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息的上限,則磁盤(pán)的健康狀況等級(jí)為WARN ;磁盤(pán)讀寫(xiě)異?;蛘卟荒茏x寫(xiě),或者磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息無(wú)法識(shí)別或者識(shí)別異常,則磁盤(pán)的健康狀況等級(jí)為BROKEN。進(jìn)一步地,參數(shù)配置模塊,還用于動(dòng)態(tài)配置所述時(shí)間間隔。進(jìn)一步地,參數(shù)配置模塊,還用于為智能分析模塊配置相應(yīng)的觸發(fā)事件,智能分析模塊根據(jù)觸發(fā)事件進(jìn)行自動(dòng)管理。進(jìn)一步地,報(bào)警模塊通過(guò)郵件、短信或者聲音向用戶(hù)報(bào)警。根據(jù)本發(fā)明的一方面,本發(fā)明提供了一種磁盤(pán)檢測(cè)方法,包括步驟10,配置提取磁盤(pán)狀態(tài)信息的時(shí)間間隔,以及磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù) S. M. A. R. T.信息閾值;步驟20,根據(jù)配置的時(shí)間間隔提取磁盤(pán)的狀態(tài)信息;步驟30,根據(jù)磁盤(pán)的狀態(tài)信息以及磁盤(pán)S. M. A. R. T.信息閾值判斷磁盤(pán)當(dāng)前健康狀況,并根據(jù)磁盤(pán)當(dāng)前健康狀況判定是否發(fā)送報(bào)警信息,并在需要發(fā)送報(bào)警信息時(shí)向用戶(hù)報(bào)警。進(jìn)一步地,還包括步驟40,顯示處理后的數(shù)據(jù)并進(jìn)行日志記錄。進(jìn)一步地,還包括步驟50,讀取日志記錄中的磁盤(pán)歷史狀態(tài)信息并進(jìn)行統(tǒng)計(jì)分析, 優(yōu)化磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值。根據(jù)本發(fā)明的一方面,提供了一種網(wǎng)絡(luò)存儲(chǔ)系統(tǒng),包括網(wǎng)絡(luò)存儲(chǔ)設(shè)備和多個(gè)磁盤(pán), 還包括磁盤(pán)檢測(cè)系統(tǒng);磁盤(pán)檢測(cè)系統(tǒng)包括磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,參數(shù)配置模塊,智能分析模塊和報(bào)警模塊;
參數(shù)配置模塊,用于配置磁盤(pán)動(dòng)態(tài)檢測(cè)模塊提取磁盤(pán)狀態(tài)信息的時(shí)間間隔,以及磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值;磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,用于根據(jù)參數(shù)配置模塊配置的時(shí)間間隔提取磁盤(pán)的狀態(tài)信息;智能分析模塊,用于根據(jù)磁盤(pán)的狀態(tài)信息以及磁盤(pán)S. M. A. R. T.信息閾值判斷磁盤(pán)當(dāng)前健康狀況,并根據(jù)磁盤(pán)當(dāng)前健康狀況判定是否向報(bào)警模塊發(fā)送報(bào)警信息;報(bào)警模塊,用于在接收到智能分析模塊發(fā)送的報(bào)警信息后向用戶(hù)報(bào)警。進(jìn)一步地,該磁盤(pán)檢測(cè)系統(tǒng)還包括顯示模塊和/或日志記錄模塊;智能分析模塊,還用于將處理后的數(shù)據(jù)發(fā)送至顯示模塊和/或日志記錄模塊;顯示模塊,用于顯示智能分析模塊發(fā)送的數(shù)據(jù);日志記錄模塊,用于記錄智能分析模塊發(fā)送的數(shù)據(jù)。進(jìn)一步地,智能分析模塊,還用于在判定向報(bào)警模塊發(fā)送報(bào)警信息的情況下,讀取日志記錄模塊中記錄的磁盤(pán)歷史狀態(tài)信息并進(jìn)行統(tǒng)計(jì)分析,優(yōu)化磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值;優(yōu)化磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A.R.T.信息閾值具體包括統(tǒng)計(jì)磁盤(pán)的健康狀況等級(jí)從CAUTION轉(zhuǎn)變?yōu)閃ARN,以及從WARN轉(zhuǎn)變?yōu)锽ROKEN,所經(jīng)歷時(shí)間的平均值tl,t2 ;統(tǒng)計(jì)磁盤(pán)的健康狀況等級(jí)從CAUTION轉(zhuǎn)變?yōu)镹EW,以及從WARN轉(zhuǎn)變?yōu)镹EW,所經(jīng)歷時(shí)間的平均值t3,t4 ;如果t2大于預(yù)定值,并且至少為t4的2倍以上,則提高磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息的上限,反之降低磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A. R. T.信息的上限;如果tl大于預(yù)定值,并且至少t3的2倍以上,則提高磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A.R.T.信息的下限,反之降低磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A.R.T.信息的下限。本發(fā)明能夠?qū)崟r(shí)地分析磁盤(pán)的健康狀況,并且能夠根據(jù)健康狀況的程度向用戶(hù)發(fā)送報(bào)警信息,告知用戶(hù)提前置換即將損壞的磁盤(pán)。本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書(shū)中闡述。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在說(shuō)明書(shū)、權(quán)利要求書(shū)以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。雖然在下文中將結(jié)合一些示例性實(shí)施及使用方法來(lái)描述本發(fā)明,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解為并不旨在將本發(fā)明限制于這些實(shí)施例;反之,旨在覆蓋包含在所附的權(quán)利要求書(shū)所定義的本發(fā)明的精神與范圍內(nèi)的所有替代品、修正及等效物。
附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書(shū)的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,但并不構(gòu)成對(duì)本發(fā)明的限制。圖I是本發(fā)明提供的磁盤(pán)檢測(cè)系統(tǒng)結(jié)構(gòu)圖;圖2是本發(fā)明提供的智能分析模塊自動(dòng)修改正參數(shù)的流程圖;圖3是本發(fā)明提供的磁盤(pán)檢測(cè)方法流程圖。
具體實(shí)施例方式以下將結(jié)合附圖及實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式,借此對(duì)本發(fā)明如何應(yīng)用技術(shù)手段來(lái)解決技術(shù)問(wèn)題,以及達(dá)成技術(shù)效果的實(shí)現(xiàn)過(guò)程能充分理解,并據(jù)以實(shí)施。需要說(shuō)明的是,在不沖突的情況下本發(fā)明實(shí)施例以及實(shí)施例中的各個(gè)特征可以相互結(jié)合,這些均落在本發(fā)明的保護(hù)范圍之內(nèi)。在磁盤(pán)的數(shù)據(jù)保護(hù)系統(tǒng)中,最為大家熟悉是S.M.A.R.T。S. M. A. R. T的全稱(chēng)為 “Self-Monitoring, Analysis and Reporting Technology”,即“自我監(jiān)測(cè)、分析及報(bào)告技術(shù)”。支持S. M. A. R. T技術(shù)的硬盤(pán)可以通過(guò)硬盤(pán)上的監(jiān)測(cè)指令和主機(jī)上的監(jiān)測(cè)軟件對(duì)磁頭、 盤(pán)片、馬達(dá)、電路的運(yùn)行情況、歷史記錄及預(yù)設(shè)的安全值進(jìn)行分析、比較。當(dāng)出現(xiàn)安全值范圍以外的情況時(shí),就會(huì)自動(dòng)向用戶(hù)發(fā)出警告,以便引起系統(tǒng)管理員或用戶(hù)的重視,保證在硬盤(pán)發(fā)生故障前將數(shù)據(jù)備份下來(lái)。本發(fā)明將利用S. M. A. R. T技術(shù)來(lái)實(shí)現(xiàn)磁盤(pán)檢測(cè)。如圖I所示,本發(fā)明提供的磁盤(pán)檢測(cè)系統(tǒng)由磁盤(pán)動(dòng)態(tài)檢測(cè)模塊I、智能分析模塊2、 顯示模塊3、參數(shù)配置模塊4、報(bào)警模塊5和日志記錄模塊6這六個(gè)模塊組成。磁盤(pán)動(dòng)態(tài)檢測(cè)模塊I根據(jù)參數(shù)配置模塊4設(shè)置好的參數(shù),定期檢測(cè)存儲(chǔ)設(shè)備上磁盤(pán)狀態(tài),同時(shí)將數(shù)據(jù)送往智能分析模塊2 ;智能分析模塊對(duì)磁盤(pán)狀態(tài)分析處理,如果磁盤(pán)狀態(tài)良好,將磁盤(pán)狀態(tài)參數(shù)送入顯示模塊3供用戶(hù)查看,同時(shí)記錄入日志記錄模塊,如果磁盤(pán)損壞或者即將損壞,則將警告信息送入報(bào)警模塊5,以便及時(shí)通知管理員更換硬盤(pán)。為了實(shí)現(xiàn)本發(fā)明的目的,即及時(shí)的檢查、分析磁盤(pán)狀態(tài),提前預(yù)測(cè)磁盤(pán)是否即將損壞,及時(shí)自動(dòng)向用戶(hù)發(fā)出警告,以便引起系統(tǒng)管理員或用戶(hù)的重視,保證在硬盤(pán)發(fā)生故障前將數(shù)據(jù)備份下來(lái),上述的磁盤(pán)檢測(cè)系統(tǒng)也可以?xún)H包含磁盤(pán)動(dòng)態(tài)檢測(cè)模塊I、智能分析模塊 2、參數(shù)配置模塊4和報(bào)警模塊5,而顯示模塊3和日志記錄模塊6作為可選模塊存在于磁盤(pán)檢測(cè)系統(tǒng)中。 下面詳細(xì)描述本發(fā)明提供的磁盤(pán)檢測(cè)系統(tǒng)中各個(gè)模塊的工作過(guò)程。磁盤(pán)動(dòng)態(tài)檢測(cè)模塊I :根據(jù)參數(shù)配置模塊4設(shè)置好的時(shí)間間隔,定時(shí)提取網(wǎng)絡(luò)存儲(chǔ)設(shè)備中所有磁盤(pán)的狀態(tài)信息,然后上報(bào)給智能分析模塊2,為整個(gè)磁盤(pán)檢查系統(tǒng)提供原始的基礎(chǔ)數(shù)據(jù)。當(dāng)然,參數(shù)配置模塊4所配置的時(shí)間間隔也可以是浮動(dòng)的,例如根據(jù)用戶(hù)存入數(shù)據(jù)的特性來(lái)調(diào)整在不同時(shí)間段的時(shí)間間隔。其中,磁盤(pán)動(dòng)態(tài)檢查模塊2,支持的磁盤(pán)類(lèi)型有 ATA和SCSI,支持的磁盤(pán)狀態(tài)屬性有磁盤(pán)序列號(hào)、容量等基本信息,以及錯(cuò)誤讀取率、啟動(dòng)/ 停止次數(shù)、重新分配扇區(qū)數(shù)、旋轉(zhuǎn)重試次數(shù)、磁盤(pán)校準(zhǔn)重試次數(shù)、高級(jí)直接內(nèi)存訪(fǎng)問(wèn)(ULTRA DMA)奇偶校驗(yàn)錯(cuò)誤率、多區(qū)域錯(cuò)誤率、廠商特性等S. M. A. R. T.信息。智能分析模塊2 :磁盤(pán)健康度分為5個(gè)等級(jí),S卩NEW、NORMAL、CAUTION、WARN、 BROKEN。其劃分原則如下NEW :磁盤(pán)新加入存儲(chǔ)設(shè)備,并且存留有分區(qū)或其他信息。需要格式化之后才能供存儲(chǔ)系統(tǒng)正常使用;NORMAL :磁盤(pán)讀寫(xiě)正常,S. M. A. R. T狀態(tài)良好;CAUTION :磁盤(pán)讀寫(xiě)正常,但S. M. A. R. T.信息中部分或全部,超過(guò)閾值VAL_ CAUTION,但不超過(guò)VAL_WARN(其中VAL_CAUTI0N和VAL_WARN為事先設(shè)定且可動(dòng)態(tài)調(diào)整的一組門(mén)限值);說(shuō)明磁盤(pán)可能存在安全隱患;
WARN :磁盤(pán)讀寫(xiě)正常,但S. M. A. R. T.信息中部分或全部,超過(guò)閾值VAL_WARN。說(shuō)明磁盤(pán)已十分危險(xiǎn),隨時(shí)都可能壞掉;BROKEN :磁盤(pán)容量、序列號(hào)等基本信息無(wú)法識(shí)別或識(shí)別異常,磁盤(pán)不能讀寫(xiě)或讀寫(xiě)異常。以參數(shù)配置模塊4配置好的磁盤(pán)S. M. A. R. T.信息閾值VAL_CAUTI0N和VAL_WARN 為基準(zhǔn),結(jié)合存儲(chǔ)系統(tǒng)的陣列數(shù)目及當(dāng)前陣列狀態(tài)、內(nèi)存使用量、CPU利用率、系統(tǒng)負(fù)載等信息,動(dòng)態(tài)增加或減少VAL_CAUTION、VAL_WARN,得到最終的磁盤(pán)S. M. A. R. T.信息閾值。根據(jù)磁盤(pán)動(dòng)態(tài)檢測(cè)模塊I上報(bào)的磁盤(pán)基本信息識(shí)別是否正常、是否殘留分區(qū)信息、讀寫(xiě)是否正常以及磁盤(pán)的S. M. A. R. T信息,按照磁盤(pán)健康度的確定原則,確定磁盤(pán)當(dāng)前健康度。然后, 根據(jù)參數(shù)配置模塊4事先設(shè)置好的,與磁盤(pán)ID及磁盤(pán)健康度相關(guān)聯(lián)的策略,觸發(fā)相應(yīng)的事件。同時(shí),將處理后的數(shù)據(jù)上報(bào)給顯示模塊3及日志記錄模塊6,方便用戶(hù)查看及日后統(tǒng)計(jì)分析。如果磁盤(pán)的狀態(tài)為WARN或者BROKEN,則將磁盤(pán)ID號(hào)及相關(guān)信息送往報(bào)警模塊5,以便管理員及時(shí)發(fā)現(xiàn)、解決問(wèn)題。當(dāng)磁盤(pán)狀態(tài)為BROKEN時(shí),從日志記錄模塊6讀取該磁盤(pán)的歷史狀態(tài)信息,統(tǒng)計(jì)分析,修正磁盤(pán)S. M. A. R. T.信息閾值,便于后續(xù)更準(zhǔn)確的判斷磁盤(pán)狀態(tài)。其中,智能分析模塊2中磁盤(pán)S. M. A. R. T.信息閾值,自動(dòng)修正流程如圖2所示,包括步驟201,設(shè)置磁盤(pán)分析處理參數(shù);具體來(lái)說(shuō),參數(shù)配置模塊4為智能分析模塊2 配置初始磁盤(pán)S.M. A. R. T.信息閾值,根據(jù)信息類(lèi)別的不同,閾值可以為上限和下限,或者兩者同時(shí)配置;步驟202,進(jìn)行磁盤(pán)智能分析處理;具體來(lái)說(shuō),智能分析模塊2以參數(shù)配置模塊 4配置好的磁盤(pán)S. M. A. R. T.信息閾值VAL_CAUTION和VAL_WARN為基準(zhǔn),結(jié)合存儲(chǔ)系統(tǒng)的陣列數(shù)目及當(dāng)前狀態(tài)、內(nèi)存使用量、CPU利用率、系統(tǒng)負(fù)載等信息,動(dòng)態(tài)增加或減少VAL_ CAUTION、VAL_WARN,得到最終的磁盤(pán)S. M. A. R. T.信息閾值。根據(jù)磁盤(pán)動(dòng)態(tài)檢測(cè)模塊I上報(bào)的磁盤(pán)基本信息識(shí)別是否正常、是否殘留分區(qū)信息、讀寫(xiě)是否正常以及磁盤(pán)的S. M. A. R. T 信息,按照磁盤(pán)健康度的確定原則,確定磁盤(pán)當(dāng)前健康度;步驟203,判斷磁盤(pán)是否損壞,如果磁盤(pán)沒(méi)有損壞,也就是說(shuō)磁盤(pán)狀態(tài)不為 BROKEN,則跳轉(zhuǎn)到步驟202繼續(xù)下一個(gè)磁盤(pán)的分析處理;如果磁盤(pán)損壞,也就是說(shuō)磁盤(pán)狀態(tài)為BROKEN,跳轉(zhuǎn)到步驟204進(jìn)行參數(shù)修正;步驟204,修正相關(guān)參數(shù);具體來(lái)說(shuō),從日志記錄模塊6讀取磁盤(pán)歷史信息,對(duì)歷史信息進(jìn)行統(tǒng)計(jì)分析,得出新的更優(yōu)的磁盤(pán)S. M. A. R. T.信息閾值。,跳轉(zhuǎn)到步驟202繼續(xù)下一個(gè)磁盤(pán)的分析處理;修正相關(guān)參數(shù)的具體方案為統(tǒng)計(jì)磁盤(pán)從CAUTION狀態(tài)轉(zhuǎn)變?yōu)閃ARN狀態(tài),以及從 WARN狀態(tài)到BROKEN狀態(tài),所需時(shí)間的平均值,分別記為tl,t2(以小時(shí)為單位),計(jì)算磁盤(pán)從CAUTION及WARN狀態(tài)到更換新磁盤(pán)所經(jīng)歷時(shí)間的平均值,分別記為t3,t4(均以小時(shí)為單位)。如果t2大于48,并且遠(yuǎn)大于(至少大2倍以上)t4,則提高WARN狀態(tài)判斷基準(zhǔn)的VAL_WARN閾值,反之降低;如果tl大于48,并且遠(yuǎn)大于(至少大2倍以上)t3,則提高 CAUTION狀態(tài)判斷基準(zhǔn)的VAL_CAUTI0N閾值,反之降低。顯不模塊3 :以一個(gè)圖標(biāo)表不一塊磁盤(pán);優(yōu)選地,圖標(biāo)中內(nèi)嵌磁盤(pán)容量、磁盤(pán)型號(hào)、 磁盤(pán)健康度等信息;優(yōu)選地,根據(jù)磁盤(pán)健康度的不同,使用不同的圖標(biāo)和文字顏色;優(yōu)選地,圖標(biāo)的布局與磁盤(pán)在網(wǎng)絡(luò)存儲(chǔ)設(shè)備中的位置保持一致。上述優(yōu)選的實(shí)施方式,可以非常直觀地查看到磁盤(pán)狀態(tài)。根據(jù)智能分析模塊2的輸入信息,動(dòng)態(tài)實(shí)時(shí)的更新磁盤(pán)信息。參數(shù)配置模塊4:作為主要的輸入控制模塊,通過(guò)參數(shù)的調(diào)節(jié),管理整個(gè)系統(tǒng)的運(yùn)行。為磁盤(pán)動(dòng)態(tài)檢測(cè)模塊I配置磁盤(pán)檢測(cè)時(shí)間間隔,如果系統(tǒng)對(duì)實(shí)時(shí)性要求比較高,可適當(dāng)調(diào)低該參數(shù),如果系統(tǒng)比較繁忙,應(yīng)該調(diào)高該參數(shù),減輕系統(tǒng)負(fù)擔(dān);為智能分析模塊2配置磁盤(pán)S. M. A. R. T.信息的閾值,以此作為磁盤(pán)健康度判斷的重要依據(jù);根據(jù)磁盤(pán)ID及磁盤(pán)健康度為智能分析模塊2配置相應(yīng)的觸發(fā)事件,實(shí)現(xiàn)系統(tǒng)的自動(dòng)管理,而無(wú)需人工干預(yù),提高了系統(tǒng)的健壯性??商砑拥挠|發(fā)事件包括關(guān)閉系統(tǒng)等待管理員備份數(shù)據(jù);將系統(tǒng)設(shè)置為只讀狀態(tài),等待管理員更換磁盤(pán);強(qiáng)制磁盤(pán)下線(xiàn),觸發(fā)帶冗余的陣列自動(dòng)修復(fù)等。報(bào)警模塊5 :將智能分析模塊2送入的磁盤(pán)報(bào)警信息,及時(shí)的報(bào)告給管理員,以便管理員及時(shí)發(fā)現(xiàn)與解決問(wèn)題,提高網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)的穩(wěn)定性和數(shù)據(jù)的安全性。支持的報(bào)警方式有郵件報(bào)警、短信報(bào)警和聲音報(bào)警。報(bào)警消息包括的屬性有網(wǎng)絡(luò)存儲(chǔ)IP地址(或主機(jī)名)、磁盤(pán)ID、磁盤(pán)狀態(tài)(WARN或者BROKEN)、已觸發(fā)的事件、日期、時(shí)間。日志記錄模塊6:將智能分析模塊2送入的磁盤(pán)信息記錄到數(shù)據(jù)庫(kù)中,方便以后查看與分析。單條日志記錄包括的字段有日志等級(jí),日期時(shí)間,磁盤(pán)ID,磁盤(pán)健康度,磁盤(pán)容量、序列號(hào)等基本信息,錯(cuò)誤讀取率、啟動(dòng)/停止次數(shù)、重新分配扇區(qū)數(shù)、旋轉(zhuǎn)重試次數(shù)、磁盤(pán)校準(zhǔn)重試次數(shù)、ULTRA DMA奇偶校驗(yàn)錯(cuò)誤率、多區(qū)域錯(cuò)誤率、廠商特性等S. M. A. R. T.信肩、O本發(fā)明還提供了一種磁盤(pán)檢測(cè)方法,如圖3所示,包括步驟301,配置提取磁盤(pán)狀態(tài)信息的時(shí)間間隔,以及磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值;步驟302,根據(jù)配置的時(shí)間間隔提取磁盤(pán)的狀態(tài)信息;步驟303,根據(jù)磁盤(pán)的狀態(tài)信息以及磁盤(pán)S. M. A. R. T.信息閾值判斷磁盤(pán)當(dāng)前健康狀況,并根據(jù)磁盤(pán)當(dāng)前健康狀況判定是否發(fā)送報(bào)警信息,并在需要發(fā)送報(bào)警信息時(shí)向用戶(hù)報(bào)警;步驟304,顯示處理后的數(shù)據(jù)并進(jìn)行日志記錄;步驟305,讀取日志中記錄的磁盤(pán)歷史狀態(tài)信息并進(jìn)行統(tǒng)計(jì)分析,優(yōu)化磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值。利用本發(fā)明提供的磁盤(pán)檢測(cè)系統(tǒng),本發(fā)明還提供了一種網(wǎng)絡(luò)存儲(chǔ)系統(tǒng),該網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)包括網(wǎng)絡(luò)存儲(chǔ)設(shè)備、磁盤(pán)動(dòng)態(tài)檢測(cè)系統(tǒng)和多個(gè)物理磁盤(pán)。網(wǎng)絡(luò)存儲(chǔ)設(shè)備,安裝有所需操作系統(tǒng),帶有能夠?qū)Χ鄠€(gè)磁盤(pán)進(jìn)行管理的陣列控制器,為用戶(hù)提供完整的數(shù)據(jù)服務(wù)。物理磁盤(pán)通過(guò)線(xiàn)纜或者網(wǎng)絡(luò)存儲(chǔ)設(shè)備上預(yù)留的磁盤(pán)槽位,插入存儲(chǔ)設(shè)備中,為網(wǎng)絡(luò)存儲(chǔ)設(shè)備提供存儲(chǔ)空間。
權(quán)利要求
1.一種磁盤(pán)檢測(cè)系統(tǒng),其特征在于,包括磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,參數(shù)配置模塊,智能分析模塊和報(bào)警模塊;參數(shù)配置模塊,用于配置磁盤(pán)動(dòng)態(tài)檢測(cè)模塊提取磁盤(pán)狀態(tài)信息的時(shí)間間隔,以及磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)s. M. A. R. T.信息閾值;磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,用于根據(jù)參數(shù)配置模塊配置的時(shí)間間隔提取磁盤(pán)的狀態(tài)信息; 智能分析模塊,用于根據(jù)磁盤(pán)的狀態(tài)信息以及磁盤(pán)S. M. A. R. T.信息閾值判斷磁盤(pán)當(dāng)前健康狀況,并根據(jù)磁盤(pán)當(dāng)前健康狀況判定是否向報(bào)警模塊發(fā)送報(bào)警信息;報(bào)警模塊,用于在接收到智能分析模塊發(fā)送的報(bào)警信息后向用戶(hù)報(bào)警。
2.如權(quán)利要求I磁盤(pán)檢測(cè)系統(tǒng),其特征在于,該磁盤(pán)檢測(cè)系統(tǒng)還包括顯示模塊和/或日志記錄模塊;智能分析模塊,還用于將處理后的數(shù)據(jù)發(fā)送至顯示模塊和/或日志記錄模塊;顯示模塊,用于顯示智能分析模塊發(fā)送的數(shù)據(jù);日志記錄模塊,用于記錄智能分析模塊發(fā)送的數(shù)據(jù)。
3.如權(quán)利要求2磁盤(pán)檢測(cè)系統(tǒng),其特征在于,智能分析模塊,還用于在判定向報(bào)警模塊發(fā)送報(bào)警信息的情況下,讀取日志記錄模塊中記錄的磁盤(pán)歷史狀態(tài)信息并進(jìn)行統(tǒng)計(jì)分析, 優(yōu)化磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值。
4.如權(quán)利要求1、2或3磁盤(pán)檢測(cè)系統(tǒng),其特征在于,智能分析模塊,磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A.R.T.信息閾值包括磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A.R.T.信息的上限、分析及報(bào)告技術(shù)S. M. A. R. T.信息的下限或者磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M. A. R. T.信息的上限和下限。
5.如權(quán)利要求2磁盤(pán)檢測(cè)系統(tǒng),其特征在于,顯示模塊,用于顯示磁盤(pán)容量、磁盤(pán)型號(hào)和磁盤(pán)健康狀況。
6.如權(quán)利要求4磁盤(pán)檢測(cè)系統(tǒng),其特征在于,健康狀況包括5個(gè)等級(jí),該5個(gè)等級(jí)分別為NEW、NORMAL、CAUTION、WARN和BROKEN ;當(dāng)健康狀況為WARN或BROKEN時(shí),智能分析模塊向報(bào)警模塊發(fā)送報(bào)警信息;新加入磁盤(pán)的健康狀況等級(jí)為NEW ;磁盤(pán)讀寫(xiě)正常,并且磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.的值未超出磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息的下限,則磁盤(pán)的健康狀況等級(jí)為NORMAL ;磁盤(pán)讀寫(xiě)正常,并且磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M. A. R. T.的值超出磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息的下限,則磁盤(pán)的健康狀況等級(jí)為CAUTION ;磁盤(pán)讀寫(xiě)正常,并且磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.的值超出磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息的上限,則磁盤(pán)的健康狀況等級(jí)為WARN ;磁盤(pán)讀寫(xiě)異?;蛘卟荒茏x寫(xiě),或者磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息無(wú)法識(shí)別或者識(shí)別異常,則磁盤(pán)的健康狀況等級(jí)為BROKEN。
7.如權(quán)利要求1、2、3或5磁盤(pán)檢測(cè)系統(tǒng),其特征在于,參數(shù)配置模塊,還用于動(dòng)態(tài)配置所述時(shí)間間隔。
8.如權(quán)利要求1、2、3或5磁盤(pán)檢測(cè)系統(tǒng),其特征在于,參數(shù)配置模塊,還用于為智能分析模塊配置相應(yīng)的觸發(fā)事件,智能分析模塊根據(jù)觸發(fā)事件進(jìn)行自動(dòng)管理。
9.如權(quán)利要求1、2、3或5磁盤(pán)檢測(cè)系統(tǒng),其特征在于,報(bào)警模塊通過(guò)郵件、短信或者聲音向用戶(hù)報(bào)警。
10.一種磁盤(pán)檢測(cè)方法,其特征在于,包括步驟10,配置提取磁盤(pán)狀態(tài)信息的時(shí)間間隔,以及磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M. A. R. T.信息閾值;步驟20,根據(jù)配置的時(shí)間間隔提取磁盤(pán)的狀態(tài)信息;步驟30,根據(jù)磁盤(pán)的狀態(tài)信息以及磁盤(pán)S. M. A. R. T.信息閾值判斷磁盤(pán)當(dāng)前健康狀況, 并根據(jù)磁盤(pán)當(dāng)前健康狀況判定是否發(fā)送報(bào)警信息,并在需要發(fā)送報(bào)警信息時(shí)向用戶(hù)報(bào)警。
11.如權(quán)利要求10所述的磁盤(pán)檢測(cè)方法,其特征在于,還包括步驟40,顯示處理后的數(shù)據(jù)并進(jìn)行日志記錄。
12.如權(quán)利要求10或11所述的磁盤(pán)檢測(cè)方法,其特征在于,還包括步驟50,讀取日志中記錄的磁盤(pán)歷史狀態(tài)信息并進(jìn)行統(tǒng)計(jì)分析,優(yōu)化磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A. R. T.信息閾值。
13.一種網(wǎng)絡(luò)存儲(chǔ)系統(tǒng),包括網(wǎng)絡(luò)存儲(chǔ)設(shè)備和多個(gè)磁盤(pán),其特征在于,還包括磁盤(pán)檢測(cè)系統(tǒng);磁盤(pán)檢測(cè)系統(tǒng)包括磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,參數(shù)配置模塊,智能分析模塊和報(bào)警模塊; 參數(shù)配置模塊,用于配置磁盤(pán)動(dòng)態(tài)檢測(cè)模塊提取磁盤(pán)狀態(tài)信息的時(shí)間間隔,以及磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值;磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,用于根據(jù)參數(shù)配置模塊配置的時(shí)間間隔提取磁盤(pán)的狀態(tài)信息; 智能分析模塊,用于根據(jù)磁盤(pán)的狀態(tài)信息以及磁盤(pán)S. M. A. R. T.信息閾值判斷磁盤(pán)當(dāng)前健康狀況,并根據(jù)磁盤(pán)當(dāng)前健康狀況判定是否向報(bào)警模塊發(fā)送報(bào)警信息;報(bào)警模塊,用于在接收到智能分析模塊發(fā)送的報(bào)警信息后向用戶(hù)報(bào)警。
14.如權(quán)利要求13所述的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng),其特征在于,該磁盤(pán)檢測(cè)系統(tǒng)還包括顯示模塊和/或日志記錄模塊;智能分析模塊,還用于將處理后的數(shù)據(jù)發(fā)送至顯示模塊和/或日志記錄模塊;顯示模塊,用于顯示智能分析模塊發(fā)送的數(shù)據(jù);日志記錄模塊,用于記錄智能分析模塊發(fā)送的數(shù)據(jù)。
15.如權(quán)利要求14所述的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng),其特征在于,智能分析模塊,還用于在判定向報(bào)警模塊發(fā)送報(bào)警信息的情況下,讀取日志記錄模塊中記錄的磁盤(pán)歷史狀態(tài)信息并進(jìn)行統(tǒng)計(jì)分析,優(yōu)化磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S. M. A. R. T.信息閾值。
全文摘要
本發(fā)明公開(kāi)了磁盤(pán)檢測(cè)系統(tǒng)、磁盤(pán)檢測(cè)方法以及網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)。該磁盤(pán)檢測(cè)系統(tǒng)包括磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,參數(shù)配置模塊,智能分析模塊和報(bào)警模塊;參數(shù)配置模塊,用于配置磁盤(pán)動(dòng)態(tài)檢測(cè)模塊提取磁盤(pán)狀態(tài)信息的時(shí)間間隔,以及磁盤(pán)自我監(jiān)測(cè)、分析及報(bào)告技術(shù)S.M.A.R.T.信息閾值;磁盤(pán)動(dòng)態(tài)檢測(cè)模塊,用于根據(jù)參數(shù)配置模塊配置的時(shí)間間隔提取磁盤(pán)的狀態(tài)信息;智能分析模塊,用于根據(jù)磁盤(pán)的狀態(tài)信息以及磁盤(pán)S.M.A.R.T.信息閾值判斷磁盤(pán)當(dāng)前健康狀況,并根據(jù)磁盤(pán)當(dāng)前健康狀況判定是否向報(bào)警模塊發(fā)送報(bào)警信息;報(bào)警模塊,用于在接收到智能分析模塊發(fā)送的報(bào)警信息后向用戶(hù)報(bào)警。本發(fā)明能夠?qū)崟r(shí)地分析磁盤(pán)的健康狀況,并且能夠根據(jù)健康狀況的程度向用戶(hù)發(fā)送報(bào)警信息。
文檔編號(hào)G06F11/22GK102591591SQ201110426380
公開(kāi)日2012年7月18日 申請(qǐng)日期2011年12月19日 優(yōu)先權(quán)日2011年12月19日
發(fā)明者王建凱, 蔣巨峰 申請(qǐng)人:杭州瑞網(wǎng)廣通信息技術(shù)有限公司