一種磁盤健康信息優(yōu)化管理方法和裝置制造方法
【專利摘要】本發(fā)明涉及一種磁盤健康信息優(yōu)化管理方法,屬于計(jì)算機(jī)存儲(chǔ)【技術(shù)領(lǐng)域】。本方法包括:按磁盤生存周期和故障率的相關(guān)性算法,給處于不同上電時(shí)間的磁盤提出監(jiān)控策略;按監(jiān)控策略,周期性監(jiān)控,獲取磁盤底層反應(yīng)其健康狀況的屬性值;將磁盤健康數(shù)據(jù)用兩級(jí)數(shù)據(jù)庫(kù)的方式存儲(chǔ),減少磁盤訪問次數(shù);內(nèi)存數(shù)據(jù)庫(kù)直接反應(yīng)到圖形界面,供用戶直觀檢測(cè);底層數(shù)據(jù)庫(kù)在后臺(tái)整合數(shù)據(jù),判斷故障,接入報(bào)警機(jī)制。與現(xiàn)有技術(shù)相比,本發(fā)明根據(jù)磁盤使用時(shí)間制定監(jiān)控策略,減少頻繁監(jiān)控帶來(lái)的不必要負(fù)載;通過分級(jí)存儲(chǔ)健康信息,大大節(jié)省存儲(chǔ)空間和額外IO次數(shù);監(jiān)控管理平臺(tái)提供圖形化監(jiān)控機(jī)制,更加直觀;提供數(shù)據(jù)導(dǎo)出機(jī)制,便于對(duì)歷史數(shù)據(jù)進(jìn)行分析。
【專利說明】一種磁盤健康信息優(yōu)化管理方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種貫穿磁盤生命周期的磁盤健康信息優(yōu)化管理方法,屬于計(jì)算機(jī)存儲(chǔ)【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)的日益增多,存儲(chǔ)系統(tǒng)的可靠性和安全性成為業(yè)界共同關(guān)注的課題,這個(gè)課題衍生出一系列對(duì)磁盤健康管理機(jī)制,故障預(yù)警及處理機(jī)制的研究。
[0003]GOOGLE公司在對(duì)其數(shù)據(jù)中心中9個(gè)廠家生產(chǎn)不同類型100,000磁盤進(jìn)行長(zhǎng)達(dá)9個(gè)月的監(jiān)測(cè)分析和跟蹤研究的基礎(chǔ)上,于07年的FAST (File and Storage Technologies)會(huì)議上發(fā)布Failure Trends in a Large Disk Drive Populat1n論文,提出關(guān)于磁盤平均無(wú)故障運(yùn)行時(shí)間、磁盤自我健康管理技術(shù)的作用、磁盤負(fù)載和使用壽命、使用時(shí)間和磁盤故障、溫度和磁盤故障這五個(gè)方面相關(guān)的結(jié)論。其他一些存儲(chǔ)服務(wù)提供商和硬盤提供商也紛紛建立自己的“硬盤庫(kù)”,研發(fā)有效管理磁盤健康的預(yù)警機(jī)制。
[0004]磁盤健康信息是通過SCSI協(xié)議或ATA協(xié)議存儲(chǔ)在磁盤固件區(qū)的能夠反映磁盤當(dāng)前運(yùn)行狀況的信息,比較重要的屬性包括磁盤內(nèi)部溫度,重定位扇區(qū)數(shù),尋道錯(cuò)誤數(shù),上電次數(shù)等。硬盤廠家根據(jù)磁盤的生產(chǎn)規(guī)格指定這些屬性的閾值,用戶可以從底層讀出這些健康信息,和閾值比較來(lái)判斷磁盤的健康狀況。
[0005]在磁盤健康管理中,目前的一種做法是,定期讀取磁盤信息,并不保存,直接通過讀取的信息和廠商規(guī)定的閾值比較來(lái)判斷磁盤的健康,這樣做的弊端在于,在實(shí)際的使用過程中,閾值并不能精確對(duì)磁盤健康進(jìn)行報(bào)警,通常屬性值超過閾值時(shí)為時(shí)已晚。所以更多機(jī)構(gòu)采取保存一段時(shí)期的健康信息的值,通過這些值計(jì)算出磁盤健康的趨勢(shì),做動(dòng)態(tài)預(yù)警,這樣的做法必然能夠更加精確地預(yù)警,但是對(duì)磁盤健康信息的管理產(chǎn)生很大的挑戰(zhàn)。對(duì)于能夠準(zhǔn)確預(yù)警,收集更多的磁盤健康信息對(duì)精確計(jì)算磁盤剩余壽命有很大的幫助,但是作為存儲(chǔ)系統(tǒng)的一部分,磁盤健康信息并不是10業(yè)務(wù)數(shù)據(jù),若占據(jù)龐大的空間,勢(shì)必會(huì)影響系統(tǒng)的運(yùn)行效率,占用過多的底層存儲(chǔ)空間,而且,過于頻繁地監(jiān)控和抓取硬盤底層介質(zhì)數(shù)據(jù),對(duì)擁有大批硬盤的海量存儲(chǔ)系統(tǒng)來(lái)說會(huì)產(chǎn)生巨大額外負(fù)載,產(chǎn)生不必要的帶寬,降低存儲(chǔ)系統(tǒng)的性能。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的是為解決現(xiàn)有存儲(chǔ)技術(shù)中無(wú)法在保證存儲(chǔ)系統(tǒng)業(yè)務(wù)帶寬和容量的前提下保存整個(gè)磁盤生命周期中能夠有效反映和預(yù)測(cè)磁盤使用情況和健康狀況的信息的問題,提供一種貫穿磁盤生命周期的磁盤健康信息優(yōu)化管理方法,應(yīng)用于計(jì)算機(jī)存儲(chǔ)設(shè)備領(lǐng)域。
[0007]本發(fā)明的思想是根據(jù)磁盤的具體情況制定適合的信息監(jiān)控策略抓取信息,利用數(shù)據(jù)庫(kù)分級(jí)存儲(chǔ)健康信息,將臨近故障的信息添加進(jìn)故障集進(jìn)行分析最終準(zhǔn)確預(yù)警。
[0008]本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的:
[0009]一種磁盤健康信息優(yōu)化管理方法,包括以下步驟:
[0010]步驟一、為磁盤貼身制定監(jiān)控計(jì)劃,具體包括以下過程:
[0011](I)獲取磁盤的基本狀況,包括上電時(shí)間,使用年限,ID號(hào)等;
[0012](2)將基本信息輸入系統(tǒng)監(jiān)控策略集,計(jì)算出符合磁盤自身情況的監(jiān)控策略;
[0013](3)根據(jù)(2)所述策略開啟磁盤定期監(jiān)控計(jì)劃任務(wù)程序;
[0014]步驟二、定期監(jiān)控獲取磁盤健康數(shù)據(jù)并監(jiān)控磁盤健康;
[0015]在磁盤運(yùn)行時(shí)間內(nèi),如果監(jiān)控計(jì)劃任務(wù)程序檢查到磁盤的監(jiān)控時(shí)間到達(dá),則開啟信息抓取進(jìn)程,通過SCSI協(xié)議或ATA協(xié)議獲取此刻的健康信息,并以直觀的圖形化方式顯示磁盤自使用至今的健康狀況;
[0016]步驟三、利用分級(jí)存儲(chǔ)的機(jī)制,存儲(chǔ)獲取到的磁盤健康信息;
[0017](I)在磁盤級(jí)存儲(chǔ)中,維護(hù)一個(gè)大的數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)存儲(chǔ)所有磁盤健康信息,這個(gè)大的數(shù)據(jù)庫(kù)在存儲(chǔ)健康信息時(shí)從磁盤讀入,在內(nèi)存中做合并工作,再下刷到每一塊硬盤上,這樣,每一塊磁盤都存有此機(jī)上所有磁盤的健康信息。這樣做的原因是,在一塊磁盤出現(xiàn)故障時(shí),往往無(wú)法讀出信息,但這時(shí)可以通過同一臺(tái)機(jī)器上任何一塊磁盤來(lái)還原此故障盤的信息,這些信息返回原廠能夠迅速還原故障磁盤在整個(gè)生存周期的運(yùn)行狀況,定位問題,并將信息加入故障集,幫助其他同型號(hào)磁盤的健康監(jiān)控。
[0018](2)在內(nèi)存級(jí)存儲(chǔ)中,維護(hù)一個(gè)較小的數(shù)據(jù)庫(kù),用來(lái)存儲(chǔ)關(guān)鍵的信息,這些信息將利用在用戶監(jiān)控平臺(tái)的管理界面構(gòu)建一個(gè)磁盤監(jiān)控圖,圖表描述磁盤健康關(guān)鍵屬性在磁盤整個(gè)生命周期的變化,圖形化反應(yīng)磁盤健康狀況,用戶隨時(shí)可以從監(jiān)控界面看到磁盤的重要屬性值和變化趨勢(shì),清晰地知道磁盤的健康狀況;
[0019](3)重復(fù)數(shù)據(jù)刪減機(jī)制。在沒有出現(xiàn)故障的時(shí)候,磁盤有可能每次獲取的屬性值都一樣,如果把這些值不加篩選地存入數(shù)據(jù)庫(kù),會(huì)浪費(fèi)大量的空間存儲(chǔ)。所以在存儲(chǔ)時(shí),會(huì)檢查新獲得的值和上一次獲取的值,每一個(gè)屬性有一個(gè)差值域,差值在這個(gè)域之內(nèi)的數(shù)據(jù),則視為無(wú)效,不加以存儲(chǔ),這樣能夠大大節(jié)省存儲(chǔ)空間,這個(gè)差值域能夠由用戶根據(jù)自身監(jiān)控的強(qiáng)弱需求和磁盤的空間容量動(dòng)態(tài)指定;
[0020](4)空間清理機(jī)制。由于磁盤空間畢竟有限,五年時(shí)間內(nèi)存儲(chǔ)的健康信息有可能有重復(fù)的情況,這時(shí),在磁盤的信息存儲(chǔ)區(qū)域,有一個(gè)閾值,當(dāng)達(dá)到閾值時(shí),系統(tǒng)會(huì)觸發(fā)自動(dòng)刪減機(jī)制,把長(zhǎng)時(shí)間內(nèi)在同一范圍內(nèi)波動(dòng)又沒有達(dá)到警戒范圍的數(shù)值刪減,直到滿足閾值范圍內(nèi)的數(shù)據(jù)庫(kù)大小,這個(gè)閾值也能夠由用戶根據(jù)自身監(jiān)控的強(qiáng)弱需求和磁盤的空間容量動(dòng)態(tài)指定。同時(shí),內(nèi)存級(jí)的存儲(chǔ)也有一個(gè)閾值,為了不占用過大的內(nèi)存,一旦到達(dá)這個(gè)閾值,則下刷到底層磁盤。如果某一塊磁盤已經(jīng)不再具有監(jiān)控價(jià)值,或已經(jīng)從該系統(tǒng)移除,用戶可以刪除此塊磁盤在所有其他磁盤上和內(nèi)存中存儲(chǔ)的健康信息以達(dá)到進(jìn)一步清理空間的效果;
[0021](5)數(shù)據(jù)合并機(jī)制。當(dāng)磁盤從一臺(tái)機(jī)器遷移到另一臺(tái)機(jī)器,或系統(tǒng)因擴(kuò)容新加入磁盤時(shí),系統(tǒng)需要獲得這塊磁盤的歷史健康信息。這時(shí)在插入新盤時(shí)利用udev規(guī)則讓系統(tǒng)感知并觸發(fā)合并機(jī)制,將新盤中的數(shù)據(jù)導(dǎo)出,解析出新盤自身的歷史健康信息,和從磁盤中導(dǎo)出的數(shù)據(jù)庫(kù)做合并,并選出關(guān)鍵數(shù)據(jù)存入內(nèi)存級(jí)數(shù)據(jù)庫(kù)以供監(jiān)控平臺(tái)圖形化顯示;
[0022]步驟四、磁盤歷史健康信息數(shù)據(jù)導(dǎo)出。
[0023]一種磁盤健康信息優(yōu)化管理裝置,其特征在于,包括監(jiān)控策略制定模塊、監(jiān)控計(jì)劃任務(wù)執(zhí)行模塊、數(shù)據(jù)存儲(chǔ)模塊、監(jiān)控?cái)?shù)據(jù)顯示模塊、歷史監(jiān)控?cái)?shù)據(jù)導(dǎo)出模塊;
[0024]所述監(jiān)控策略制定模塊用于對(duì)磁盤根據(jù)系統(tǒng)預(yù)存的監(jiān)控策略集選擇監(jiān)控策略或根據(jù)用戶需求單獨(dú)制定監(jiān)控策略;
[0025]監(jiān)控計(jì)劃任務(wù)執(zhí)行模塊用于按照監(jiān)控策略制定模塊制定的監(jiān)控監(jiān)控策略定期抓取磁盤健康信息;
[0026]數(shù)據(jù)存儲(chǔ)模塊用于分級(jí)存儲(chǔ)監(jiān)控計(jì)劃任務(wù)執(zhí)行模塊抓取的磁盤健康信息;
[0027]監(jiān)控?cái)?shù)據(jù)顯示模塊用于以直觀的圖形化顯示已存儲(chǔ)的監(jiān)控?cái)?shù)據(jù);
[0028]歷史監(jiān)控?cái)?shù)據(jù)導(dǎo)出模塊用于將存儲(chǔ)的磁盤歷史健康數(shù)據(jù)導(dǎo)出。
[0029]作為優(yōu)選,所述數(shù)據(jù)存儲(chǔ)模塊采用磁盤級(jí)和內(nèi)存級(jí)兩級(jí)存儲(chǔ)模式進(jìn)行數(shù)據(jù)存儲(chǔ);
[0030]作為優(yōu)選,所述數(shù)據(jù)存儲(chǔ)模塊采用重復(fù)數(shù)據(jù)刪減機(jī)制、空間清理機(jī)制和數(shù)據(jù)合并機(jī)制對(duì)采集的磁盤健康數(shù)據(jù)進(jìn)行存儲(chǔ),以減少磁盤1次數(shù)以及磁盤存儲(chǔ)空間。
[0031]有益效果
[0032]本發(fā)明提出了一種貫穿磁盤生存周期的健康信息優(yōu)化管理方法,該方法具有如下有益效果:
[0033](I)根據(jù)磁盤使用時(shí)間制定不同的監(jiān)控策略,減少頻繁監(jiān)控給系統(tǒng)帶來(lái)的不必要的負(fù)載;
[0034](2)通過分級(jí)存儲(chǔ)健康信息同時(shí)將磁盤生命周期中所有有用的健康信息提取出來(lái)并保存,用最小的空間代價(jià)保存信息,大大節(jié)省存儲(chǔ)空間和額外1次數(shù);
[0035](3)監(jiān)控管理平臺(tái)提供圖形化的監(jiān)控機(jī)制,便于用戶通過直觀化的圖形觀測(cè)磁盤的健康狀況;
[0036](4)監(jiān)控管理平臺(tái)提供歷史健康信息數(shù)據(jù)導(dǎo)出機(jī)制,便于通過對(duì)歷史數(shù)據(jù)分析獲得系統(tǒng)改進(jìn)的有益數(shù)據(jù)。
【專利附圖】
【附圖說明】
[0037]圖1為本發(fā)明一種貫穿磁盤生存周期的健康信息管理方法的系統(tǒng)系統(tǒng)結(jié)構(gòu)示意圖;
[0038]圖2為本發(fā)明一種貫穿磁盤生存周期的健康信息管理方法的監(jiān)控策略集示意圖;
[0039]圖3為本發(fā)明一種貫穿磁盤生存周期的健康信息管理方法的監(jiān)控管理平臺(tái)示意圖;
[0040]圖4為本發(fā)明一種貫穿磁盤生存周期的健康信息管理方法的信息分級(jí)保存流程圖;
[0041]圖5為本發(fā)明一種貫穿磁盤生存周期的健康信息管理方法的數(shù)據(jù)庫(kù)設(shè)計(jì)示意圖;
[0042]圖6為本發(fā)明一種貫穿磁盤生存周期的健康信息管理系統(tǒng)的系統(tǒng)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0043]本發(fā)明提供一種貫穿磁盤生存周期的健康信息管理方法,應(yīng)用于存儲(chǔ)設(shè)備,其系統(tǒng)結(jié)構(gòu)圖如圖1所示,具體實(shí)施步驟如下:
[0044]根據(jù)步驟一,利用磁盤自身基本信息從策略集中選擇適合的監(jiān)控策略,策略集有強(qiáng)、中、弱三種策略,分別對(duì)應(yīng)三種不同監(jiān)控模式,具體監(jiān)控策略如圖2所示,滿足自身情況較好的磁盤監(jiān)控頻率小、使用多年的磁盤監(jiān)控頻率大這樣的原則,例如強(qiáng)策略下,使用時(shí)間3個(gè)月以內(nèi)的盤每小時(shí)監(jiān)控一次;使用時(shí)間3個(gè)月到I年的盤每天監(jiān)控一次;使用時(shí)間I年-2年的盤每12小時(shí)監(jiān)控一次;使用時(shí)間2年-3年的盤每6小時(shí)監(jiān)控一次;使用時(shí)間3年以上的盤每I小時(shí)監(jiān)控一次。中策略下,使用時(shí)間3個(gè)月以內(nèi)的盤每6小時(shí)監(jiān)控一次;使用時(shí)間3個(gè)月到I年的盤每?jī)商毂O(jiān)控一次;使用時(shí)間I年-2年的盤每天監(jiān)控一次;使用時(shí)間2年-3年的盤每12小時(shí)監(jiān)控一次;使用時(shí)間3年以上的盤每6小時(shí)監(jiān)控一次。弱策略下,使用時(shí)間3個(gè)月以內(nèi)的盤每12小時(shí)監(jiān)控一次;使用時(shí)間3個(gè)月到I年的盤每3天監(jiān)控一次;使用時(shí)間I年-2年的盤每2天監(jiān)控一次;使用時(shí)間2年-3年的盤每天監(jiān)控一次;使用時(shí)間3年以上的盤每12小時(shí)監(jiān)控一次。具體時(shí)間規(guī)定不限于圖2所示,可以根據(jù)系統(tǒng)監(jiān)控要求自己調(diào)整;
[0045]根據(jù)步驟二,根據(jù)策略定期執(zhí)行計(jì)劃任務(wù)利用SCSI協(xié)議或ATA協(xié)議從底層磁盤固件去獲取特定屬性值,這里所監(jiān)控的屬性有磁盤底層尋道錯(cuò)誤計(jì)數(shù)、重定位扇區(qū)數(shù)、待重定位扇區(qū)數(shù)、溫度,具體實(shí)施時(shí)不限于這些屬性,用戶可根據(jù)自身需求獲取SCSI協(xié)議或ATA協(xié)議規(guī)定的任意磁盤屬性;
[0046]根據(jù)步驟三,將獲取的監(jiān)控信息存到系統(tǒng)中,設(shè)置內(nèi)存級(jí)數(shù)據(jù)庫(kù)路徑為/tmp/smart_smalI/smart, db,磁盤級(jí)數(shù)據(jù)庫(kù)路徑為/tmp/smart_big/smart, db,內(nèi)存容量閾值為6M,磁盤容量閾值為115M,一旦超過閾值,磁盤空間清理至100M以下。smart, db包含兩張表disk表和attr表,具體見圖5,兩張表通過磁盤序列號(hào)關(guān)聯(lián),disk表存儲(chǔ)磁盤的序列號(hào),型號(hào),健康狀況等基本信息,attr表存儲(chǔ)各個(gè)屬性,屬性值,和當(dāng)前屬性值的起始時(shí)間和結(jié)束時(shí)間。具體實(shí)施步驟如圖4所示,包括如下:
[0047](I)將獲取的監(jiān)控信息存到/tmp/smart_smalI/smart, db中,然后檢查/tmp/smart_smal 1/smart, db大小,若超過6M,執(zhí)行(2)?(5);若未超過,執(zhí)行(5);
[0048](2)上傳底層磁盤中的“歷史健康數(shù)據(jù)庫(kù)”數(shù)據(jù)到/tmp/smart_big文件夾;
[0049](3)將 /tmp/smart_smal 1/smart, db 數(shù)據(jù)合并到 /tmp/smart_big/smart, db ;
[0050](4)選取重要的點(diǎn)重構(gòu)數(shù)據(jù)庫(kù) /tmp/smart_smal 1/smart, db,如果 /tmp/smart_big/smart, db大小超過115M,將/tmp/smart_big刪除到100M以下,之后下刷此文件夾到底層磁盤的“歷史數(shù)據(jù)區(qū)域”并在系統(tǒng)內(nèi)存中刪除/tmp/smart_big這個(gè)文件夾以節(jié)省內(nèi)存使用空間;
[0051](5)下刷 /tmp/smart_small ;
[0052](6)信息監(jiān)控管理平臺(tái)顯示/tmp/smart_smal 1/smart, db中解析出的數(shù)據(jù)供用戶查看,界面示意圖如圖3所示。
[0053]當(dāng)插入一個(gè)磁盤時(shí),合并數(shù)據(jù)庫(kù)的具體實(shí)施步驟如下:
[0054](I)將新盤數(shù)據(jù)庫(kù)從磁盤上讀到/tmp/smart_big/smart, db,讀入過程中對(duì)數(shù)據(jù)庫(kù)做選擇操作,按序列號(hào)篩選本盤的信息,其他盤的歷史健康信息不讀入以免多盤遷移時(shí)造成數(shù)據(jù)風(fēng)暴;
[0055](2)將新盤的數(shù)據(jù)庫(kù)信息/tmp/smart_big/smart, db和系統(tǒng)上原先的磁盤健康信息數(shù)據(jù)庫(kù) /tmp/smart_smal 1/smart, db 進(jìn)行合并;
[0056](3)合并這兩個(gè)目錄中的數(shù)據(jù)到/tmp/smart_smal I/smart, db并刪除/tmp/smart_big 目錄;
[0057](4)若新盤沒有數(shù)據(jù)記錄,將新盤的基本信息加入到/tmp/smart_smal 1/smart,db的disk表中;
[0058](5)下刷/tmp/smart_smal 1/smart, db。
[0059]步驟四,磁盤歷史健康信息數(shù)據(jù)導(dǎo)出。采用一定格式,如XML,將磁盤歷史健康信息數(shù)據(jù)導(dǎo)出供分析使用。如傳入故障決策系統(tǒng)。
[0060]本發(fā)明還提供一種貫穿磁盤生存周期的健康信息管理裝置,應(yīng)用于存儲(chǔ)設(shè)備,其系統(tǒng)結(jié)構(gòu)圖如圖6所示,包括監(jiān)控策略制定模塊、監(jiān)控計(jì)劃任務(wù)執(zhí)行模塊、數(shù)據(jù)存儲(chǔ)模塊、監(jiān)控?cái)?shù)據(jù)顯示模塊、歷史監(jiān)控?cái)?shù)據(jù)導(dǎo)出模塊;
[0061]所述監(jiān)控策略制定模塊用于根據(jù)系統(tǒng)預(yù)存的監(jiān)控策略集選擇監(jiān)控策略或根據(jù)用戶需求單獨(dú)制定監(jiān)控策略對(duì)磁盤進(jìn)行定期監(jiān)控,該模塊根據(jù)磁盤生存周期中不同時(shí)期故障率的大小動(dòng)態(tài)制定不同頻率的監(jiān)控周期;
[0062]監(jiān)控計(jì)劃任務(wù)執(zhí)行模塊用于按照監(jiān)控策略制定模塊制定的監(jiān)控策略定期從底層獲取磁盤健康信息;
[0063]數(shù)據(jù)存儲(chǔ)模塊用于分級(jí)存儲(chǔ)監(jiān)控計(jì)劃任務(wù)執(zhí)行模塊從底層獲取的磁盤健康信息。健康信息分兩級(jí)數(shù)據(jù)庫(kù)存放,一級(jí)數(shù)據(jù)庫(kù)和內(nèi)存中存儲(chǔ)的數(shù)據(jù)庫(kù)同步,存儲(chǔ)重要的拐點(diǎn)數(shù)據(jù),作為熱點(diǎn)數(shù)據(jù)能夠快速形成健康曲線圖在監(jiān)控?cái)?shù)據(jù)顯示模塊作直觀地顯示;二級(jí)數(shù)據(jù)庫(kù)作為非熱點(diǎn)數(shù)據(jù)存儲(chǔ)所有的監(jiān)控周期抓取的數(shù)據(jù)存儲(chǔ)在底層磁盤,不常與上層模塊交互減少底層1開銷,在磁盤遷移或返廠維修時(shí)作為信息統(tǒng)計(jì)和問題分析的根據(jù);
[0064]監(jiān)控?cái)?shù)據(jù)顯示模塊用于以直觀的圖形化顯示已存儲(chǔ)的監(jiān)控?cái)?shù)據(jù),使系統(tǒng)管理員能夠隨時(shí)了解系統(tǒng)中磁盤的健康狀況以便在磁盤健康參數(shù)出現(xiàn)問題時(shí)做出防護(hù)措施;
[0065]歷史監(jiān)控?cái)?shù)據(jù)導(dǎo)出模塊用于將存儲(chǔ)的磁盤歷史健康數(shù)據(jù)以日志或表格等形式導(dǎo)出,在磁盤返廠修理時(shí)能根據(jù)導(dǎo)出的整個(gè)生存周期的數(shù)據(jù)更好地定位問題和統(tǒng)計(jì)分析。
[0066]作為優(yōu)選,所述數(shù)據(jù)存儲(chǔ)模塊采用磁盤級(jí)和內(nèi)存級(jí)兩級(jí)存儲(chǔ)模式進(jìn)行數(shù)據(jù)存儲(chǔ)。
[0067]作為優(yōu)選,所述數(shù)據(jù)存儲(chǔ)模塊采用重復(fù)數(shù)據(jù)刪減機(jī)制、空間清理機(jī)制和數(shù)據(jù)合并機(jī)制對(duì)采集的磁盤健康數(shù)據(jù)進(jìn)行存儲(chǔ),以減少磁盤1次數(shù)以及磁盤存儲(chǔ)空間。
[0068]以上所述僅為本發(fā)明的較佳實(shí)施方法而已,并不用以限制本發(fā)明,凡在本發(fā)明的設(shè)計(jì)思路內(nèi),不管所使用何種陣列架構(gòu)、何種RAID級(jí)別,何種類型存儲(chǔ)介質(zhì),對(duì)監(jiān)控策略符合原則的時(shí)間調(diào)整,任何閾值調(diào)整,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【權(quán)利要求】
1.一種磁盤健康信息優(yōu)化管理方法,其特征在于: 步驟一、為磁盤制定監(jiān)控計(jì)劃; 步驟二、根據(jù)監(jiān)控計(jì)劃定期獲取磁盤健康數(shù)據(jù)并監(jiān)控磁盤健康; 步驟三、利用分級(jí)存儲(chǔ)的機(jī)制,存儲(chǔ)獲取到的磁盤健康數(shù)據(jù); 步驟四、將磁盤歷史健康數(shù)據(jù)導(dǎo)出。
2.根據(jù)權(quán)利要求1所述的一種磁盤健康信息優(yōu)化管理方法,其特征在于:所述為磁盤制定監(jiān)控計(jì)劃,包括以下步驟: (1)獲取磁盤的基本信息,包括上電時(shí)間,使用年限,ID號(hào); (2)將基本信息輸入系統(tǒng)監(jiān)控策略集,計(jì)算出符合磁盤自身情況的監(jiān)控策略; (3)根據(jù)(2)所述策略開啟磁盤定期監(jiān)控計(jì)劃任務(wù)程序。
3.根據(jù)權(quán)利要求2所述的一種磁盤健康信息優(yōu)化管理方法,其特征在于:所述系統(tǒng)監(jiān)控策略集為根據(jù)上電時(shí)間和監(jiān)控強(qiáng)度制定。
4.根據(jù)權(quán)利要求1所述的一種磁盤健康信息優(yōu)化管理方法,其特征在于:所述分級(jí)存儲(chǔ)包括磁盤級(jí)和內(nèi)存級(jí)兩級(jí)存儲(chǔ)。
5.根據(jù)權(quán)利要求1所述的一種磁盤健康信息優(yōu)化管理方法,其特征在于:所述存儲(chǔ)磁盤健康數(shù)據(jù)包括采用重復(fù)數(shù)據(jù)刪減機(jī)制、空間清理機(jī)制和數(shù)據(jù)合并機(jī)制進(jìn)行存儲(chǔ),達(dá)到數(shù)據(jù)大小既在可控范圍、數(shù)據(jù)內(nèi)容又包含有關(guān)健康信息的關(guān)鍵數(shù)據(jù)的目的。
6.根據(jù)權(quán)利要求1所述的一種磁盤健康信息優(yōu)化管理方法,其特征在于:所述方法還包括在顯視器上圖形化顯示磁盤健康數(shù)據(jù)。
7.—種磁盤健康信息優(yōu)化管理裝置,其特征在于,包括監(jiān)控策略制定模塊、監(jiān)控計(jì)劃任務(wù)執(zhí)行模塊、數(shù)據(jù)存儲(chǔ)模塊、監(jiān)控?cái)?shù)據(jù)顯示模塊、歷史監(jiān)控?cái)?shù)據(jù)導(dǎo)出模塊; 所述監(jiān)控策略制定模塊用于對(duì)磁盤根據(jù)系統(tǒng)預(yù)存的監(jiān)控策略集選擇監(jiān)控策略或根據(jù)用戶需求單獨(dú)制定監(jiān)控策略; 監(jiān)控計(jì)劃任務(wù)執(zhí)行模塊用于按照監(jiān)控策略制定模塊制定的監(jiān)控策略定期抓取磁盤健康信息; 數(shù)據(jù)存儲(chǔ)模塊用于分級(jí)存儲(chǔ)監(jiān)控計(jì)劃任務(wù)執(zhí)行模塊抓取的磁盤健康信息; 監(jiān)控?cái)?shù)據(jù)顯示模塊用于以直觀的圖形化顯示已存儲(chǔ)的監(jiān)控?cái)?shù)據(jù); 歷史監(jiān)控?cái)?shù)據(jù)導(dǎo)出模塊用于將存儲(chǔ)的磁盤歷史健康數(shù)據(jù)導(dǎo)出。
8.根據(jù)權(quán)利要求7所述的一種磁盤健康信息優(yōu)化管理裝置,其特征在于,所述監(jiān)控策略集是根據(jù)磁盤生存周期中不同時(shí)期故障率的大小動(dòng)態(tài)制定的不同頻率的監(jiān)控周期。
9.根據(jù)權(quán)利要求7所述的一種磁盤健康信息優(yōu)化管理裝置,其特征在于,所述數(shù)據(jù)存儲(chǔ)模塊采用磁盤級(jí)和內(nèi)存級(jí)兩級(jí)存儲(chǔ)模式進(jìn)行數(shù)據(jù)存儲(chǔ)。
10.根據(jù)權(quán)利要求7所述的一種磁盤健康信息優(yōu)化管理裝置,其特征在于,所述數(shù)據(jù)存儲(chǔ)模塊采用重復(fù)數(shù)據(jù)刪減機(jī)制、空間清理機(jī)制和數(shù)據(jù)合并機(jī)制對(duì)采集的磁盤健康數(shù)據(jù)進(jìn)行存儲(chǔ),以減少磁盤1次數(shù)以及磁盤存儲(chǔ)空間。
【文檔編號(hào)】G06F11/30GK104461824SQ201410717946
【公開日】2015年3月25日 申請(qǐng)日期:2014年12月1日 優(yōu)先權(quán)日:2014年12月1日
【發(fā)明者】錢文, 王道邦, 王清翰, 羅華, 周澤湘, 方侖 申請(qǐng)人:北京同有飛驥科技股份有限公司