本發(fā)明涉及計算機技術(shù)領(lǐng)域,具體涉及一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的方法和裝置。
背景技術(shù):
在計算機技術(shù)領(lǐng)域中,為保證數(shù)據(jù)服務系統(tǒng)的正常運行,必須保證服務系統(tǒng)中的各個硬件的狀態(tài)的穩(wěn)定性,特別是磁盤陣列的性能狀態(tài),要防止因硬件出現(xiàn)故障而影響整個服務器系統(tǒng)。磁盤陣列是由很多磁盤組合成一個容量巨大的磁盤組,利用個別磁盤提供數(shù)據(jù)所產(chǎn)生加成效果提升整個磁盤系統(tǒng)性能。磁盤陣列的硬件的狀態(tài)的好壞直接影響到整個數(shù)據(jù)服務系統(tǒng)的讀寫速度和穩(wěn)定性。因此,急需一種能夠監(jiān)控磁盤陣列的方法,防止磁盤陣列的硬件出現(xiàn)故障影響整個服務器系統(tǒng)的情況的出現(xiàn)。
技術(shù)實現(xiàn)要素:
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的方法和裝置。
依據(jù)本發(fā)明的一個方面,提供了一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的方法,其中,該方法包括:
監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列,判斷磁盤陣列是否滿足預設報警條件;
對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息;
將報警信息發(fā)送到預設地址。
可選地,所述判斷磁盤陣列是否滿足預設報警條件包括:判斷磁盤陣列是否缺失電池;
所述對于滿足預設報警條件的磁盤陣列,發(fā)出與所滿足的預設報警條件相應的報警信息包括:對于缺失電池的磁盤陣列,生成磁盤陣列缺失電池需要更換磁盤陣列的報警信息,或者生成磁盤陣列缺失電池需要添加電池的報警信息。
可選地,所述判斷磁盤陣列是否滿足預設報警條件包括:判斷磁盤陣列的讀寫策略是否發(fā)生變化;
所述對于滿足預設報警條件的磁盤陣列,發(fā)出與所滿足的預設報警條件相應的報警信息包括:對于讀寫策略發(fā)生變化的磁盤陣列,生成讀寫策略發(fā)生變化需要重置該磁盤陣列的讀寫策略的報警信息。
可選地,判斷磁盤陣列的讀寫策略是否發(fā)生變化包括:
判斷磁盤陣列的讀寫策略是否從策略二變化為策略一;
其中,策略一為:當數(shù)據(jù)寫入磁盤陣列對應的緩存時即確認數(shù)據(jù)寫入成功;策略二為:當數(shù)據(jù)寫入磁盤陣列對應的緩存,又從緩存寫入磁盤陣列時確認數(shù)據(jù)寫入成功。
可選地,該方法進一步包括:
將讀寫策略從策略二變化為策略一的磁盤陣列的讀寫策略重置為策略二。
可選地,所述判斷磁盤陣列是否滿足預設報警條件包括:判斷磁盤陣列中的各磁盤的磨損率是否大于預設值
所述對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息包括:對于磨損率大于預設值的磁盤,生成磨損率過大需要更換磁盤的報警信息。
可選地,該方法進一步包括:
監(jiān)控各服務器中的磁盤陣列的電池充放電狀態(tài);
當磁盤陣列的電池充電或放電時,如果磁盤陣列的性能產(chǎn)生異常狀況,則在日志中對應記錄電池充電或放電事件與磁盤陣列的性能產(chǎn)生異常狀況的事件。
可選地,
可選地
根據(jù)本發(fā)明的另一方面,提供了一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的裝置,其中,該裝置包括:
監(jiān)控單元,適于監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列,判斷磁盤陣列是否滿足預設報警條件;
報警生成單元,適于對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息;
報警發(fā)送單元,適于將報警信息發(fā)送到預設地址。
可選地,所述監(jiān)控單元,適于判斷磁盤陣列是否缺失電池;
所述報警生成單元,適于對于缺失電池的磁盤陣列,生成磁盤陣列缺失電池需要更換磁盤陣列的報警信息,或者生成磁盤陣列缺失電池需要添加電池的報警信息。
可選地,所述監(jiān)控單元,適于判斷磁盤陣列的讀寫策略是否發(fā)生變化;
所述報警生成單元,適于對于讀寫策略發(fā)生變化的磁盤陣列,生成讀寫策略發(fā)生變化需要重置該磁盤陣列的讀寫策略的報警信息。
可選地,所述監(jiān)控單元,適于判斷磁盤陣列的讀寫策略是否從策略二變化為策略一;
其中,策略一為:當數(shù)據(jù)寫入磁盤陣列對應的緩存時即確認數(shù)據(jù)寫入成功;策略二為:當數(shù)據(jù)寫入磁盤陣列對應的緩存,又從緩存寫入磁盤陣列時確認數(shù)據(jù)寫入成功。
可選地,該裝置進一步包括:
報警處理單元,適于將讀寫策略從策略二變化為策略一的磁盤陣列的讀寫策略重置為策略二。
可選地,所述監(jiān)控單元,適于判斷磁盤陣列中的各磁盤的磨損率是否大于預設值;
所述報警生成單元,適于對于磨損率大于預設值的磁盤,生成磨損率過大需要更換磁盤的報警信息。
可選地,該裝置進一步包括:日志記錄單元;
所述監(jiān)控單元,進一步適于監(jiān)控各服務器中的磁盤陣列的電池充放電狀態(tài);
所述日志記錄單元,適于當磁盤陣列的電池充電或放電時,如果磁盤陣列的性能產(chǎn)生異常狀況,則在日志中對應記錄電池充電或放電事件與磁盤陣列的性能產(chǎn)生異常狀況的事件。
根據(jù)本發(fā)明的技術(shù)方案事先預設有磁盤陣列報警條件,然后實時監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列,并判斷磁盤陣列是否滿足預設報警條件;如果不滿足,則說明磁盤陣列運行狀態(tài)良好;如果滿足,則對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息;將報警信息發(fā)送到預設地址,以便相關(guān)人員及時獲知該報警信息,然后進行相應的處理。可見,本發(fā)明可以實時監(jiān)控磁盤陣列的運行狀態(tài),以便出現(xiàn)問題時得到及時解決,避免影響整個數(shù)據(jù)服務系統(tǒng)的正常運行,保持其運行的穩(wěn)定性。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。
附圖說明
通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1示出了根據(jù)本發(fā)明一個實施例的一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的方法的流程示意圖;
圖2示出了根據(jù)本發(fā)明一個實施例的一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的裝置的結(jié)構(gòu)示意圖;
圖3示出了根據(jù)本發(fā)明另一個實施例的一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
圖1示出了根據(jù)本發(fā)明一個實施例的一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的方法的流程示意圖。如圖1所示,該方法包括:
步驟S110,監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列,判斷磁盤陣列是否滿足預設報警條件。
磁盤陣列使用過程中會出現(xiàn)各種各樣的問題,首先根據(jù)已知的磁盤陣列會出現(xiàn)的問題預設一些報警條件。例如,報警條件中包括缺失電池、磁盤陣列的讀寫策略發(fā)生變化等。然后監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列是否出現(xiàn)了報警條件中所包含的磁盤陣列的狀態(tài)條件。如果沒有出現(xiàn),則說明該磁盤陣列不會出現(xiàn)問題。例如,監(jiān)控發(fā)現(xiàn)磁盤陣列中缺失電池了,那么就屬于滿足預設報警條件的情況。
步驟S120,對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息。
當磁盤陣列出現(xiàn)滿足預設報警條件的狀況的時候,需要進行報警,該報警信息根據(jù)預設報警條件進行生成。例如,磁盤陣列出現(xiàn)的是磁盤陣列缺失電池,那么根據(jù)該報警條件,就生成一個“需要添加電池”的報警信息。該報警信息的形式不作具體的限制,可以對應每種報警條件事先設定報警信息的一種格式或多種格式,當出現(xiàn)滿足報警條件的時候,根據(jù)設定的報警信息的格式進行報警信息的生成。
步驟S130,將報警信息發(fā)送到預設地址。
當報警信息生成后,為了讓相關(guān)人員獲知,以便進行相應的處理操作,需要將報警信息發(fā)送到預設地址中。該預設地址可以是郵件地址、微信號、飛信號等,不作具體限定。
可見,本發(fā)明可以實時監(jiān)控磁盤陣列的運行狀態(tài),以便出現(xiàn)問題時得到及時解決,避免影響整個數(shù)據(jù)服務系統(tǒng)的正常運行,保持其運行的穩(wěn)定性。
磁盤陣列在寫入數(shù)據(jù)的時候,是首先將數(shù)據(jù)寫入其內(nèi)部的緩存中,然后從緩存中根據(jù)數(shù)據(jù)的存儲策略寫入相應的磁盤中。但是這個緩存需要有電源為其供電,這個電源通常是通過系統(tǒng)電源進行供電的,而且會有電池作為備用電源,但是如果電池缺失或者電池沒電,特別是斷電的時候,緩存無法從電池中獲得電量,會導致緩存的數(shù)據(jù)不能寫入磁盤,最終使得數(shù)據(jù)丟失。為了監(jiān)控磁盤陣列中的電池的狀態(tài),在本發(fā)明的一個實施例中,步驟S110中的判斷磁盤陣列是否滿足預設報警條件包括:判斷磁盤陣列是否缺失電池。當判斷磁盤陣列滿足該報警條件中的磁盤陣列缺失電池的情況,那么就會生成相應的報警信息。
這里的電池缺失可能是電池電量耗盡或者沒有電池的情況,那么,步驟S120中的對于滿足預設報警條件的磁盤陣列,發(fā)出與所滿足的預設報警條件相應的報警信息包括:對于缺失電池的磁盤陣列,生成磁盤陣列缺失電池需要更換磁盤陣列的報警信息,或者生成磁盤陣列缺失電池需要添加電池的報警信息。
磁盤陣列在寫入數(shù)據(jù)的時候,首先將數(shù)據(jù)寫入緩存,然后再將數(shù)據(jù)從緩存中寫入磁盤。這就會有兩種讀寫策略,第一種是,當數(shù)據(jù)寫入緩存后就認為該條數(shù)據(jù)寫入成功,就進行下一條數(shù)據(jù)的寫入任務;第二種是,數(shù)據(jù)寫入緩存后,等到數(shù)據(jù)從緩存中寫入磁盤中,才認為數(shù)據(jù)寫入成功,再進行下一條的數(shù)據(jù)的寫入任務。但是,對于第一種策略來說,數(shù)據(jù)容易丟失,如果是非常重要的數(shù)據(jù),在沒有確定數(shù)據(jù)是否寫入磁盤就認為數(shù)據(jù)寫入成功,容易造呈數(shù)據(jù)的丟失。所以針對不同的數(shù)據(jù)使用的額策略是不同的餓,非重要的數(shù)據(jù)使用第一種即可,而對于重要的數(shù)據(jù)需要使用第二種策略。
但是當磁盤陣列出現(xiàn)異常情況后,會導致上述策略發(fā)生變化,重要的數(shù)據(jù)的寫入可能會由第二種策略變成第一種策略。為了防止讀寫策略發(fā)生變化,導致數(shù)據(jù)丟失,在本發(fā)明的一個實施例中,判斷磁盤陣列是否滿足預設報警條件包括:判斷磁盤陣列的讀寫策略是否發(fā)生變化。當判斷磁盤陣列滿足該報警條件中的磁盤陣列的讀寫策略發(fā)生變化的情況,那么就會生成相應的報警信息。
那么步驟S120中的對于滿足預設報警條件的磁盤陣列,發(fā)出與所滿足的預設報警條件相應的報警信息包括:對于讀寫策略發(fā)生變化的磁盤陣列,生成讀寫策略發(fā)生變化需要重置該磁盤陣列的讀寫策略的報警信息。
具體地,上述實施例中判斷磁盤陣列的讀寫策略是否發(fā)生變化包括:
判斷磁盤陣列的讀寫策略是否從策略二變化為策略一;其中,策略一為:當數(shù)據(jù)寫入磁盤陣列對應的緩存時即確認數(shù)據(jù)寫入成功;策略二為:當數(shù)據(jù)寫入磁盤陣列對應的緩存,又從緩存寫入磁盤陣列時確認數(shù)據(jù)寫入成功。
在判斷磁盤陣列的讀寫策略是否發(fā)生變化的時候可以不需要實時進行,可以設定一個預設時段,在該預設時段內(nèi)讀寫數(shù)據(jù)時需要使用策略二,那么就在該預設時段內(nèi)進行判斷磁盤陣列的讀寫策略是否發(fā)生變化的操作,例如,一天中的10:00到15:00。或者,已經(jīng)確定某些重要的數(shù)據(jù)是在固定的時間段內(nèi)進行讀寫的,那么就可以根據(jù)該重要信息的讀寫時間設定一個預設時段;例如,某業(yè)務的重要數(shù)據(jù)是在16:00到18:00進行讀寫的,那么就在設定預設時段為16:00到18:00,在該時段內(nèi)判斷磁盤陣列的讀寫策略是否發(fā)生變化。
當判斷到讀寫策略發(fā)生變化,那么,就可以不需要人工操作處理,直接自動重置讀寫策略的操作。所以,上述方法進一步包括:將讀寫策略從策略二變化為策略一的磁盤陣列的讀寫策略重置為策略二。
磁盤陣列是有很多磁盤組合起來的,當磁盤陣列在讀寫數(shù)據(jù)的時候,磁盤陣列的磁盤中的某些存儲空間會存在失效或不可用的問題(即磨損),雖然磁盤中會有備用的存儲空間,但是一旦備用空間均開始使用,不可用的存儲空間不停的增加,即磨損率不停的增加,那么就會導致磁盤的性能下降,最終使得磁盤陣列整體性能下降,所以,需要進行監(jiān)控磁盤陣列中各磁盤的磨損情況。在本發(fā)明的一個實施例中,判斷磁盤陣列是否滿足預設報警條件包括:判斷磁盤陣列中的各磁盤的磨損率是否大于預設值。這里的磨損率就是磁盤的存儲空間中不可用的占總空間的比例。當判斷磁盤陣列的磁盤滿足該報警條件中的磨損率大于預設值的情況,那么就會生成相應的報警信息。
步驟S130中的對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息包括:對于磨損率大于預設值的磁盤,生成磨損率過大需要更換磁盤的報警信息。
上文中指出磁盤陣列的緩存需要有電源為其供電,這個電源通常是通過系統(tǒng)電源進行供電的,而且會有電池作為備用電源,為了保證電池在突然斷電的情況下可使用性,需要定期的對電池檢測,即對電池進行充電放電的操作。但是,電池的充電或放電會影響磁盤陣列的服務性能。在監(jiān)控到服務器的服務性能突然下降的狀時,為了判斷該狀況是否是電池充電或放電引起的,在本發(fā)明的一個實施例中,該方法進一步包括:
監(jiān)控各服務器中的磁盤陣列的電池充放電狀態(tài)。
當磁盤陣列的電池充電或放電時,如果磁盤陣列的性能產(chǎn)生異常狀況,則在日志中對應記錄電池充電或放電事件與磁盤陣列的性能產(chǎn)生異常狀況的事件。根據(jù)該日志,相關(guān)人員就可以判斷磁盤陣列相應時間的異常狀況是由于電池的充電和放電引起的,避免不必要的盲目的問題排查,提高工作效率。
圖2示出了根據(jù)本發(fā)明一個實施例的一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的裝置的結(jié)構(gòu)示意圖。如圖2所示,該監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的裝置200包括:
監(jiān)控單元210,適于監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列,判斷磁盤陣列是否滿足預設報警條件。
磁盤陣列使用過程中會出現(xiàn)各種各樣的問題,首先根據(jù)已知的磁盤陣列會出現(xiàn)的問題預設一些報警條件。例如,報警條件中包括缺失電池、磁盤陣列的讀寫策略發(fā)生變化等。然后監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列是否出現(xiàn)了報警條件中所包含的磁盤陣列的狀態(tài)條件。如果沒有出現(xiàn),則說明該磁盤陣列不會出現(xiàn)問題。例如,監(jiān)控發(fā)現(xiàn)磁盤陣列中缺失電池了,那么就屬于滿足預設報警條件的情況。
報警生成單元220,適于對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息。
當磁盤陣列出現(xiàn)滿足預設報警條件的狀況的時候,需要進行報警,該報警信息根據(jù)預設報警條件進行生成。例如,磁盤陣列出現(xiàn)的是磁盤陣列缺失電池,那么根據(jù)該報警條件,就生成一個“需要添加電池”的報警信息。該報警信息的形式不作具體的限制,可以對應每種報警條件事先設定報警信息的一種格式或多種格式,當出現(xiàn)滿足報警條件的時候,根據(jù)設定的報警信息的格式進行報警信息的生成。
報警發(fā)送單元230,適于將報警信息發(fā)送到預設地址。
當報警信息生成后,為了讓相關(guān)人員獲知,以便進行相應的處理操作,需要將報警信息發(fā)送到預設地址中。該預設地址可以是郵件地址、微信號、飛信號等,不作具體限定。
可見,本發(fā)明可以實時監(jiān)控磁盤陣列的運行狀態(tài),以便出現(xiàn)問題時得到及時解決,避免影響整個數(shù)據(jù)服務系統(tǒng)的正常運行,保持其運行的穩(wěn)定性。
磁盤陣列在寫入數(shù)據(jù)的時候,是首先將數(shù)據(jù)寫入其內(nèi)部的緩存中,然后從緩存中根據(jù)數(shù)據(jù)的存儲策略寫入相應的磁盤中。但是這個緩存需要有電源為其供電,這個電源通常是通過系統(tǒng)電源進行供電的,而且會有電池作為備用電源,但是如果電池缺失或者電池沒電,特別是斷電的時候,緩存無法從電池中獲得電量,會導致緩存的數(shù)據(jù)不能寫入磁盤,最終使得數(shù)據(jù)丟失。為了監(jiān)控磁盤陣列中的電池的狀態(tài),在本發(fā)明的一個實施例中,監(jiān)控單元210,適于判斷磁盤陣列是否缺失電池。當判斷磁盤陣列滿足該報警條件中的磁盤陣列缺失電池的情況,那么就會生成相應的報警信息。
這里的電池缺失可能是電池電量耗盡或者沒有電池的情況,那么,報警生成單元220,適于對于缺失電池的磁盤陣列,生成磁盤陣列缺失電池需要更換磁盤陣列的報警信息,或者生成磁盤陣列缺失電池需要添加電池的報警信息。
磁盤陣列在寫入數(shù)據(jù)的時候,首先將數(shù)據(jù)寫入緩存,然后再將數(shù)據(jù)從緩存中寫入磁盤。這就會有兩種讀寫策略,第一種是,當數(shù)據(jù)寫入緩存后就認為該條數(shù)據(jù)寫入成功,就進行下一條數(shù)據(jù)的寫入任務;第二種是,數(shù)據(jù)寫入緩存后,等到數(shù)據(jù)從緩存中寫入磁盤中,才認為數(shù)據(jù)寫入成功,再進行下一條的數(shù)據(jù)的寫入任務。但是,對于第一種策略來說,數(shù)據(jù)容易丟失,如果是非常重要的數(shù)據(jù),在沒有確定數(shù)據(jù)是否寫入磁盤就認為數(shù)據(jù)寫入成功,容易造呈數(shù)據(jù)的丟失。所以針對不同的數(shù)據(jù)使用的額策略是不同的餓,非重要的數(shù)據(jù)使用第一種即可,而對于重要的數(shù)據(jù)需要使用第二種策略。
但是當磁盤陣列出現(xiàn)異常情況后,會導致上述策略發(fā)生變化,重要的數(shù)據(jù)的寫入可能會由第二種策略變成第一種策略。為了防止讀寫策略發(fā)生變化,導致數(shù)據(jù)丟失,在本發(fā)明的一個實施例中,監(jiān)控單元210,適于判斷磁盤陣列的讀寫策略是否發(fā)生變化。當判斷磁盤陣列滿足該報警條件中的磁盤陣列的讀寫策略發(fā)生變化的情況,那么就會生成相應的報警信息。
報警生成單元220,適于對于讀寫策略發(fā)生變化的磁盤陣列,生成讀寫策略發(fā)生變化需要重置該磁盤陣列的讀寫策略的報警信息。
具體地,上述實施例中監(jiān)控單元210,適于判斷磁盤陣列的讀寫策略是否從策略二變化為策略一;其中,策略一為:當數(shù)據(jù)寫入磁盤陣列對應的緩存時即確認數(shù)據(jù)寫入成功;策略二為:當數(shù)據(jù)寫入磁盤陣列對應的緩存,又從緩存寫入磁盤陣列時確認數(shù)據(jù)寫入成功。
在判斷磁盤陣列的讀寫策略是否發(fā)生變化的時候可以不需要實時進行,可以設定一個預設時段,在該預設時段內(nèi)讀寫數(shù)據(jù)時需要使用策略二,那么就在該預設時段內(nèi)進行判斷磁盤陣列的讀寫策略是否發(fā)生變化的操作,例如,一天中的10:00到15:00?;蛘撸呀?jīng)確定某些重要的數(shù)據(jù)是在固定的時間段內(nèi)進行讀寫的,那么就可以根據(jù)該重要信息的讀寫時間設定一個預設時段;例如,某業(yè)務的重要數(shù)據(jù)是在16:00到18:00進行讀寫的,那么就在設定預設時段為16:00到18:00,在該時段內(nèi)判斷磁盤陣列的讀寫策略是否發(fā)生變化。
圖3示出了根據(jù)本發(fā)明另一個實施例的一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的裝置的結(jié)構(gòu)示意圖。如圖3所示,該監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的裝置300包括:監(jiān)控單元310、報警生成單元320、報警發(fā)送單元330和報警處理單元340。其中,監(jiān)控單元310、報警生成單元320、報警發(fā)送單元330和圖2所示的監(jiān)控單元210、報警生成單元220、報警發(fā)送單元230具有對應相同的功能,相同的部分在此不再贅述。
當判斷到讀寫策略發(fā)生變化,那么,就可以不需要人工操作處理,直接自動重置讀寫策略的操作。報警處理單元340,適于將讀寫策略從策略二變化為策略一的磁盤陣列的讀寫策略重置為策略二。
磁盤陣列是有很多磁盤組合起來的,當磁盤陣列在讀寫數(shù)據(jù)的時候,磁盤陣列的磁盤中的某些存儲空間會存在失效或不可用的問題(即磨損),雖然磁盤中會有備用的存儲空間,但是一旦備用空間均開始使用,不可用的存儲空間不停的增加,即磨損率不停的增加,那么就會導致磁盤的性能下降,最終使得磁盤陣列整體性能下降,所以,需要進行監(jiān)控磁盤陣列中各磁盤的磨損情況。在本發(fā)明的一個實施例中,監(jiān)控單元310,適于判斷磁盤陣列中的各磁盤的磨損率是否大于預設值。這里的磨損率就是磁盤的存儲空間中不可用的占總空間的比例。當判斷磁盤陣列的磁盤滿足該報警條件中的磨損率大于預設值的情況,那么就會生成相應的報警信息。
報警生成單元320,適于對于磨損率大于預設值的磁盤,生成磨損率過大需要更換磁盤的報警信息。
上文中指出磁盤陣列的緩存需要有電源為其供電,這個電源通常是通過系統(tǒng)電源進行供電的,而且會有電池作為備用電源,為了保證電池在突然斷電的情況下可使用性,需要定期的對電池檢測,即對電池進行充電放電的操作。但是,電池的充電或放電會影響磁盤陣列的服務性能。在監(jiān)控到服務器的服務性能突然下降的狀時,為了判斷該狀況是否是電池充電或放電引起的,在本發(fā)明的一個實施例中,監(jiān)控單元310,進一步適于監(jiān)控各服務器中的磁盤陣列的電池充放電狀態(tài)。
日志記錄單元350,適于當磁盤陣列的電池充電或放電時,如果磁盤陣列的性能產(chǎn)生異常狀況,則在日志中對應記錄電池充電或放電事件與磁盤陣列的性能產(chǎn)生異常狀況的事件。根據(jù)該日志,相關(guān)人員就可以判斷磁盤陣列相應時間的異常狀況是由于電池的充電和放電引起的,避免不必要的盲目的問題排查,提高工作效率。
綜上所述,根據(jù)本發(fā)明的技術(shù)方案事先預設有磁盤陣列報警條件,然后實時監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列,并判斷磁盤陣列是否滿足預設報警條件;如果不滿足,則說明磁盤陣列運行狀態(tài)良好;如果滿足,則對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息;將報警信息發(fā)送到預設地址,以便相關(guān)人員及時獲知該報警信息,然后進行相應的處理??梢?,本發(fā)明可以實時監(jiān)控磁盤陣列的運行狀態(tài),以便出現(xiàn)問題時得到及時解決,避免影響整個數(shù)據(jù)服務系統(tǒng)的正常運行,保持其運行的穩(wěn)定性。
需要說明的是:
在此提供的算法和顯示不與任何特定計算機、虛擬裝置或者其它設備固有相關(guān)。各種通用裝置也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類裝置所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權(quán)利要求書由此明確地并入該具體實施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設備中的模塊進行自適應性地改變并且把它們設置在與該實施例不同的一個或多個設備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設計出替換實施例。在權(quán)利要求中,不應將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
本發(fā)明公開了A1、一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的方法,包括:
監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列,判斷磁盤陣列是否滿足預設報警條件;
對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息;
將報警信息發(fā)送到預設地址。
A2、如A1所述的方法,其中,
所述判斷磁盤陣列是否滿足預設報警條件包括:判斷磁盤陣列是否缺失電池;
所述對于滿足預設報警條件的磁盤陣列,發(fā)出與所滿足的預設報警條件相應的報警信息包括:對于缺失電池的磁盤陣列,生成磁盤陣列缺失電池需要更換磁盤陣列的報警信息,或者生成磁盤陣列缺失電池需要添加電池的報警信息。
A3、如A1所述的方法,其中,
所述判斷磁盤陣列是否滿足預設報警條件包括:判斷磁盤陣列的讀寫策略是否發(fā)生變化;
所述對于滿足預設報警條件的磁盤陣列,發(fā)出與所滿足的預設報警條件相應的報警信息包括:對于讀寫策略發(fā)生變化的磁盤陣列,生成讀寫策略發(fā)生變化需要重置該磁盤陣列的讀寫策略的報警信息。
A4、如A3所述的方法,其中,判斷磁盤陣列的讀寫策略是否發(fā)生變化包括:
判斷磁盤陣列的讀寫策略是否從策略二變化為策略一;
其中,策略一為:當數(shù)據(jù)寫入磁盤陣列對應的緩存時即確認數(shù)據(jù)寫入成功;策略二為:當數(shù)據(jù)寫入磁盤陣列對應的緩存,又從緩存寫入磁盤陣列時確認數(shù)據(jù)寫入成功。
A5、如A4所述的方法,其中,該方法進一步包括:
將讀寫策略從策略二變化為策略一的磁盤陣列的讀寫策略重置為策略二。
A6、如A1所述的方法,其中,
所述判斷磁盤陣列是否滿足預設報警條件包括:判斷磁盤陣列中的各磁盤的磨損率是否大于預設值
所述對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息包括:對于磨損率大于預設值的磁盤,生成磨損率過大需要更換磁盤的報警信息。
A7、如A1-A6中任一項所述的方法,其中,該方法進一步包括:
監(jiān)控各服務器中的磁盤陣列的電池充放電狀態(tài);
當磁盤陣列的電池充電或放電時,如果磁盤陣列的性能產(chǎn)生異常狀況,則在日志中對應記錄電池充電或放電事件與磁盤陣列的性能產(chǎn)生異常狀況的事件。
本發(fā)明公開了B8、一種監(jiān)控數(shù)據(jù)服務系統(tǒng)中磁盤陣列的裝置,包括:
監(jiān)控單元,適于監(jiān)控數(shù)據(jù)服務系統(tǒng)中的各服務器中的磁盤陣列,判斷磁盤陣列是否滿足預設報警條件;
報警生成單元,適于對于滿足預設報警條件的磁盤陣列,生成與其所滿足的預設報警條件相應的報警信息;
報警發(fā)送單元,適于將報警信息發(fā)送到預設地址。
B9、如B8所述的裝置,其中,
所述監(jiān)控單元,適于判斷磁盤陣列是否缺失電池;
所述報警生成單元,適于對于缺失電池的磁盤陣列,生成磁盤陣列缺失電池需要更換磁盤陣列的報警信息,或者生成磁盤陣列缺失電池需要添加電池的報警信息。
B10、如B8所述的裝置,其中,
所述監(jiān)控單元,適于判斷磁盤陣列的讀寫策略是否發(fā)生變化;
所述報警生成單元,適于對于讀寫策略發(fā)生變化的磁盤陣列,生成讀寫策略發(fā)生變化需要重置該磁盤陣列的讀寫策略的報警信息。
B11、如B10所述的裝置,其中,
所述監(jiān)控單元,適于判斷磁盤陣列的讀寫策略是否從策略二變化為策略一;
其中,策略一為:當數(shù)據(jù)寫入磁盤陣列對應的緩存時即確認數(shù)據(jù)寫入成功;策略二為:當數(shù)據(jù)寫入磁盤陣列對應的緩存,又從緩存寫入磁盤陣列時確認數(shù)據(jù)寫入成功。
B12、如B11所述的裝置,其中,該裝置進一步包括:
報警處理單元,適于將讀寫策略從策略二變化為策略一的磁盤陣列的讀寫策略重置為策略二。
B13、如B8所述的裝置,其中,
所述監(jiān)控單元,適于判斷磁盤陣列中的各磁盤的磨損率是否大于預設值;
所述報警生成單元,適于對于磨損率大于預設值的磁盤,生成磨損率過大需要更換磁盤的報警信息。
B14、如B8-B13中任一項所述的裝置,其中,該裝置進一步包括:日志記錄單元;
所述監(jiān)控單元,進一步適于監(jiān)控各服務器中的磁盤陣列的電池充放電狀態(tài);
所述日志記錄單元,適于當磁盤陣列的電池充電或放電時,如果磁盤陣列的性能產(chǎn)生異常狀況,則在日志中對應記錄電池充電或放電事件與磁盤陣列的性能產(chǎn)生異常狀況的事件。