1.一種內(nèi)存錯(cuò)誤恢復(fù)方法,其特征在于,包括:
對(duì)可糾正內(nèi)存錯(cuò)誤的個(gè)數(shù)進(jìn)行累計(jì);
當(dāng)所述可糾正內(nèi)存錯(cuò)誤的個(gè)數(shù)達(dá)到預(yù)設(shè)閾值時(shí),確定出導(dǎo)致所述可糾正內(nèi)存錯(cuò)誤的損壞內(nèi)存顆粒所影響的物理地址范圍;
殺死當(dāng)前利用到所述物理地址范圍的所有進(jìn)程,釋放相應(yīng)的內(nèi)存地址;
將包含所述內(nèi)存地址的所有page進(jìn)行離線處理;
重啟所有被殺死的進(jìn)程。
2.根據(jù)權(quán)利要求1所述的內(nèi)存錯(cuò)誤恢復(fù)方法,其特征在于,所述當(dāng)所述可糾正內(nèi)存錯(cuò)誤的個(gè)數(shù)達(dá)到預(yù)設(shè)閾值時(shí),確定出導(dǎo)致所述可糾正內(nèi)存錯(cuò)誤的損壞內(nèi)存顆粒所影響的物理地址范圍包括:
當(dāng)所述可糾正內(nèi)存錯(cuò)誤的個(gè)數(shù)達(dá)到預(yù)設(shè)閾值時(shí),通過(guò)觸發(fā)CMCI中斷告知操作系統(tǒng);
所述操作系統(tǒng)觸發(fā)BIOS SMI handler;
所述BIOS收集發(fā)生所述可糾正內(nèi)存錯(cuò)誤的地址所在內(nèi)存條的整個(gè)Rank的地址范圍,確定出導(dǎo)致所述可糾正內(nèi)存錯(cuò)誤的損壞內(nèi)存顆粒所影響的物理地址范圍。
3.根據(jù)權(quán)利要求2所述的內(nèi)存錯(cuò)誤恢復(fù)方法,其特征在于,所述確定出導(dǎo)致所述可糾正內(nèi)存錯(cuò)誤的損壞內(nèi)存顆粒所影響的物理地址范圍之后,還包括:
將所述可糾正內(nèi)存錯(cuò)誤的地址所在內(nèi)存條的整個(gè)Rank地址范圍寫(xiě)入ACPI NVS中的相應(yīng)區(qū)域。
4.根據(jù)權(quán)利要求3所述的內(nèi)存錯(cuò)誤恢復(fù)方法,其特征在于,所述將所述可糾正內(nèi)存錯(cuò)誤的地址所在內(nèi)存條的整個(gè)Rank地址范圍寫(xiě)入ACPI NVS中的相應(yīng)區(qū)域之后,還包括:
所述操作系統(tǒng)讀取所述NVS中的所述整個(gè)Rank地址范圍。
5.根據(jù)權(quán)利要求2所述的內(nèi)存錯(cuò)誤恢復(fù)方法,其特征在于,所述操作系統(tǒng)觸發(fā)BIOS SMI handler為:
所述操作系統(tǒng)利用IO端口0xB2觸發(fā)所述BIOS SMI handler。
6.一種內(nèi)存錯(cuò)誤恢復(fù)裝置,其特征在于,包括:
累計(jì)部件,用于對(duì)可糾正內(nèi)存錯(cuò)誤的個(gè)數(shù)進(jìn)行累計(jì);
確定部件,用于當(dāng)所述可糾正內(nèi)存錯(cuò)誤的個(gè)數(shù)達(dá)到預(yù)設(shè)閾值時(shí),確定出導(dǎo)致所述可糾正內(nèi)存錯(cuò)誤的損壞內(nèi)存顆粒所影響的物理地址范圍;
釋放部件,用于殺死當(dāng)前利用到所述物理地址范圍的所有進(jìn)程,釋放相應(yīng)的內(nèi)存地址;
離線部件,用于將包含所述內(nèi)存地址的所有page進(jìn)行離線處理;
重啟部件,用于重啟所有被殺死的進(jìn)程。
7.根據(jù)權(quán)利要求6所述的內(nèi)存錯(cuò)誤恢復(fù)裝置,其特征在于,所述確定部件包括:
告知單元,用于當(dāng)所述可糾正內(nèi)存錯(cuò)誤的個(gè)數(shù)達(dá)到預(yù)設(shè)閾值時(shí),通過(guò)CMCI中斷告知操作系統(tǒng);
觸發(fā)單元,用于利用所述操作系統(tǒng)觸發(fā)BIOS SMI handler;
確定單元,用于利用所述BIOS收集發(fā)生所述可糾正內(nèi)存錯(cuò)誤的地址所在內(nèi)存條的整個(gè)Rank地址范圍,確定出導(dǎo)致所述可糾正內(nèi)存錯(cuò)誤的損壞內(nèi)存顆粒所影響的物理地址范圍。
8.根據(jù)權(quán)利要求7所述的內(nèi)存錯(cuò)誤恢復(fù)裝置,其特征在于,還包括:
寫(xiě)入單元,用于將所述可糾正內(nèi)存錯(cuò)誤的地址所在內(nèi)存條的整個(gè)Rank地址范圍寫(xiě)入ACPI NVS中的相應(yīng)區(qū)域。
9.根據(jù)權(quán)利要求8所述的內(nèi)存錯(cuò)誤恢復(fù)裝置,其特征在于,還包括:
讀取單元,用于利用所述操作系統(tǒng)讀取所述NVS中的所述整個(gè)Rank地址范圍。
10.根據(jù)權(quán)利要求7所述的內(nèi)存錯(cuò)誤恢復(fù)裝置,其特征在于,所述觸發(fā)單元具體用于利用IO端口0xB2觸發(fā)所述BIOS SMI handler。