0046]優(yōu)選地,該方法還包括:
[0047]當(dāng)判定磁盤資源故障時,停止出現(xiàn)故障的磁盤資源的全部操作流程,并且在停止出現(xiàn)故障的磁盤資源的全部操作流程之前,清除占用出現(xiàn)故障的磁盤資源的I/o操作。
[0048]當(dāng)清除I/O操作成功之后,將出現(xiàn)故障的磁盤資源置為離線狀態(tài),并將涉及出現(xiàn)故障的磁盤資源上的所有操作切換到未出現(xiàn)故障的磁盤資源所在的節(jié)點上;當(dāng)清除I/O操作未成功時,重新啟動出現(xiàn)故障的磁盤資源所在的節(jié)點。
[0049]為了達(dá)到上述目的,本發(fā)明還提出了一種磁盤資源故障檢測系統(tǒng)01,如圖2所示,該系統(tǒng)包括:確認(rèn)模塊02、執(zhí)行模塊03、比較模塊04和判定模塊05。
[0050]確認(rèn)模塊02,用于每次在對磁盤資源上的物理塊進行輸入/輸出I/O操作之前,檢查虛擬文件系統(tǒng)proc系統(tǒng),確認(rèn)磁盤資源是否已經(jīng)正確掛載在本機。
[0051]執(zhí)行模塊03,用于當(dāng)確認(rèn)磁盤資源已經(jīng)正確掛載在本機以后,執(zhí)行I/O操作。
[0052]優(yōu)選地,執(zhí)行模塊03還用于:
[0053]當(dāng)確認(rèn)磁盤資源沒有正確掛載在本機時,判定磁盤資源沒有在本機當(dāng)中,不執(zhí)行I/O操作。
[0054]比較模塊04,用于將I/O操作的返回時間與預(yù)設(shè)的時間閾值進行比較。
[0055]判定模塊05,用于當(dāng)返回時間小于時間閾值時,判定磁盤資源正常并對下一次I/O操作進行故障檢測;當(dāng)返回時間大于或等于時間閾值時,判定磁盤資源故障并修改磁盤文件系統(tǒng)的自檢參數(shù)。
[0056]優(yōu)選地,判定模塊05修改磁盤文件系統(tǒng)的自檢參數(shù)是指:修改磁盤文件系統(tǒng)的自檢周期及最大掛載次數(shù)。
[0057]優(yōu)選地,該系統(tǒng)還包括觸發(fā)模塊06。
[0058]觸發(fā)模塊06,用于當(dāng)達(dá)到自檢周期或最大掛載次數(shù)時,觸發(fā)磁盤文件系統(tǒng)進入自檢狀態(tài)。
[0059]優(yōu)選地,該系統(tǒng)還包括:清除模塊07和節(jié)點切換模塊08。
[0060]清除模塊07,用于當(dāng)判定磁盤資源故障時,停止出現(xiàn)故障的磁盤資源的全部操作流程,并且在停止出現(xiàn)故障的磁盤資源的全部操作流程之前,清除占用出現(xiàn)故障的磁盤資源的I/o操作。
[0061]節(jié)點切換模塊08,用于當(dāng)清除I/O操作成功之后,將出現(xiàn)故障的磁盤資源置為離線狀態(tài),并將涉及出現(xiàn)故障的磁盤資源上的所有操作切換到未出現(xiàn)故障的磁盤資源所在的節(jié)點上;當(dāng)清除I/o操作未成功時,重新啟動出現(xiàn)故障的所磁盤資源所在的節(jié)點。
[0062]與現(xiàn)有技術(shù)相比,本發(fā)明包括:每次在對磁盤資源上的物理塊進行輸入/輸出I/O操作之前,檢查虛擬文件系統(tǒng)proc系統(tǒng),確認(rèn)磁盤資源是否已經(jīng)正確掛載在本機。當(dāng)確認(rèn)磁盤資源已經(jīng)正確掛載在本機以后,執(zhí)行I/O操作。將I/O操作的返回時間與預(yù)設(shè)的時間閾值進行比較;當(dāng)返回時間小于時間閾值時,判定磁盤資源正常并對下一次I/O操作進行故障檢測;當(dāng)返回時間大于或等于時間閾值時,判定磁盤資源故障并修改磁盤文件系統(tǒng)的自檢參數(shù)。。通過本發(fā)明的方案,能夠精確的反映磁盤的真實狀態(tài),并對潛在故障的磁盤進行處理。
[0063]需要說明的是,以上所述的實施例僅是為了便于本領(lǐng)域的技術(shù)人員理解而已,并不用于限制本發(fā)明的保護范圍,在不脫離本發(fā)明的發(fā)明構(gòu)思的前提下,本領(lǐng)域技術(shù)人員對本發(fā)明所做出的任何顯而易見的替換和改進等均在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1.一種磁盤資源故障檢測方法,其特征在于,所述方法包括: 每次在對所述磁盤資源上的物理塊進行輸入/輸出I/o操作之前,檢查虛擬文件系統(tǒng)proc系統(tǒng),確認(rèn)所述磁盤資源是否已經(jīng)正確掛載在本機; 當(dāng)確認(rèn)所述磁盤資源已經(jīng)正確掛載在本機以后,執(zhí)行所述I/O操作; 將所述I/O操作的返回時間與預(yù)設(shè)的時間閾值進行比較;當(dāng)所述返回時間小于所述時間閾值時,判定磁盤資源正常并對下一次I/O操作進行故障檢測;當(dāng)所述返回時間大于或等于所述時間閾值時,判定所述磁盤資源故障并修改磁盤文件系統(tǒng)的自檢參數(shù)。2.如權(quán)利要求1的故障檢測方法,其特征在于,所述修改磁盤文件系統(tǒng)的自檢參數(shù)包括:修改所述磁盤文件系統(tǒng)的自檢周期及最大掛載次數(shù)。3.如權(quán)利要求2的故障檢測方法,其特征在于,所述方法還包括;當(dāng)達(dá)到所述自檢周期或所述最大掛載次數(shù)時,觸發(fā)所述磁盤文件系統(tǒng)進入自檢狀態(tài)。4.如權(quán)利要求1的故障檢測方法,其特征在于,所述方法還包括: 當(dāng)確認(rèn)所述磁盤資源沒有正確掛載在所述本機時,判定所述磁盤資源沒有在本機當(dāng)中,不執(zhí)行所述I/O操作。5.如權(quán)利要求1的故障檢測方法,其特征在于,所述方法還包括: 當(dāng)判定所述磁盤資源故障時,停止出現(xiàn)故障的所述磁盤資源的全部操作流程,并且在停止所述出現(xiàn)故障的磁盤資源的全部操作流程之前,清除占用所述出現(xiàn)故障的磁盤資源的所述I/o操作; 當(dāng)清除所述I/o操作成功之后,將所述出現(xiàn)故障的磁盤資源置為離線狀態(tài),并將涉及所述出現(xiàn)故障的磁盤資源上的所有操作切換到未出現(xiàn)故障的磁盤資源所在的節(jié)點上;當(dāng)清除所述I/o操作未成功時,重新啟動出現(xiàn)故障的所述磁盤資源所在的節(jié)點。6.一種磁盤資源故障檢測系統(tǒng),其特征在于,所述系統(tǒng)包括:確認(rèn)模塊、執(zhí)行模塊、比較模塊和判定模塊; 所述確認(rèn)模塊,用于每次在對所述磁盤資源上的物理塊進行輸入/輸出I/o操作之前,檢查虛擬文件系統(tǒng)proc系統(tǒng),確認(rèn)所述磁盤資源是否已經(jīng)正確掛載在本機; 所述執(zhí)行模塊,用于當(dāng)確認(rèn)所述磁盤資源已經(jīng)正確掛載在本機以后,執(zhí)行所述I/O操作; 所述比較模塊,用于將所述I/O操作的返回時間與預(yù)設(shè)的時間閾值進行比較; 所述判定模塊,用于當(dāng)所述返回時間小于所述時間閾值時,判定磁盤資源正常并對下一次I/O操作進行故障檢測;當(dāng)所述返回時間大于或等于所述時間閾值時,判定所述磁盤資源故障并修改磁盤文件系統(tǒng)的自檢參數(shù)。7.如權(quán)利要求6的故障檢測系統(tǒng),其特征在于,所述判定模塊修改磁盤文件系統(tǒng)的自檢參數(shù)是指:修改所述磁盤文件系統(tǒng)的自檢周期及最大掛載次數(shù)。8.如權(quán)利要求7的故障檢測系統(tǒng),其特征在于,所述系統(tǒng)還包括觸發(fā)模塊; 所述觸發(fā)模塊,用于當(dāng)達(dá)到所述自檢周期或所述最大掛載次數(shù)時,觸發(fā)所述磁盤文件系統(tǒng)進入自檢狀態(tài)。9.如權(quán)利要求6的故障檢測系統(tǒng),其特征在于,所述執(zhí)行模塊還用于: 當(dāng)確認(rèn)所述磁盤資源沒有正確掛載在所述本機時,判定所述磁盤資源沒有在本機當(dāng)中,不執(zhí)行所述I/O操作。10.如權(quán)利要求6的故障檢測系統(tǒng),其特征在于,所述系統(tǒng)還包括:清除模塊和節(jié)點切換豐吳塊; 所述清除模塊,用于當(dāng)判定所述磁盤資源故障時,停止出現(xiàn)故障的所述磁盤資源的全部操作流程,并且在停止所述出現(xiàn)故障的磁盤資源的全部操作流程之前,清除占用所述出現(xiàn)故障的磁盤資源的所述I/o操作; 所述節(jié)點切換模塊,用于當(dāng)清除所述I/o操作成功之后,將所述出現(xiàn)故障的磁盤資源置為離線狀態(tài),并將涉及所述出現(xiàn)故障的磁盤資源上的所有操作切換到未出現(xiàn)故障的磁盤資源所在的節(jié)點上;當(dāng)清除所述I/o操作未成功時,重新啟動出現(xiàn)故障的所述磁盤資源所在的節(jié)點。
【專利摘要】本發(fā)明公開了一種磁盤資源故障檢測方法和系統(tǒng),包括:每次在對磁盤資源上的物理塊進行輸入/輸出I/O操作之前,檢查虛擬文件系統(tǒng)proc系統(tǒng),確認(rèn)磁盤資源是否已經(jīng)正確掛載在本機。當(dāng)確認(rèn)磁盤資源已經(jīng)正確掛載在本機以后,執(zhí)行I/O操作。將I/O操作的返回時間與預(yù)設(shè)的時間閾值進行比較;當(dāng)返回時間小于時間閾值時,判定磁盤資源正常并對下一次I/O操作進行故障檢測;當(dāng)返回時間大于或等于時間閾值時,判定磁盤資源故障并修改磁盤文件系統(tǒng)的自檢參數(shù)。通過本發(fā)明的方案,能夠精確的反映磁盤的真實狀態(tài),并對潛在故障的磁盤進行處理。
【IPC分類】G06F11/22, G06F3/06
【公開號】CN105045691
【申請?zhí)枴緾N201510419679
【發(fā)明人】成金祥, 李大生, 劉志勇
【申請人】浪潮(北京)電子信息產(chǎn)業(yè)有限公司
【公開日】2015年11月11日
【申請日】2015年7月16日