本發(fā)明涉及服務(wù)器部件硬件檢測領(lǐng)域,尤其涉及一種可批量通過網(wǎng)絡(luò)進行服務(wù)器內(nèi)存診斷的方法。
背景技術(shù):
內(nèi)存是計算機中重要的部件之一,它是與cpu進行溝通的橋梁。計算機中所有程序的運行都是在內(nèi)存中進行的,因此內(nèi)存的性能對計算機的影響非常大。內(nèi)存(memory)也被稱為內(nèi)存儲器,其作用是用于暫時存放cpu中的運算數(shù)據(jù),以及與硬盤等外部存儲器交換的數(shù)據(jù)。只要計算機在運行中,cpu就會把需要運算的數(shù)據(jù)調(diào)到內(nèi)存中進行運算,當運算完成后cpu再將結(jié)果傳送出來,內(nèi)存的運行也決定了計算機的穩(wěn)定運行。內(nèi)存是由內(nèi)存芯片、電路板、金手指等部分組成的。
內(nèi)存又稱主存,是cpu能直接尋址的存儲空間,由半導體器件制成。內(nèi)存的特點是存取速率快。內(nèi)存是電腦中的主要部件,它是相對于外存而言的。我們平常使用的程序,如windows操作系統(tǒng)、打字軟件、游戲軟件等,一般都是安裝在硬盤等外存上的,但僅此是不能使用其功能的,必須把它們調(diào)入內(nèi)存中運行,才能真正使用其功能。
內(nèi)存是服務(wù)器系統(tǒng)的關(guān)鍵組成部分,內(nèi)存的好壞直接影響服務(wù)器的正常工作,而半導體產(chǎn)品的特性使得內(nèi)存廠家不可能將所有存在風險的內(nèi)存在全部篩選出來,同時內(nèi)存在客戶端經(jīng)過長時間的使用,內(nèi)存產(chǎn)品會逐漸老化,從而產(chǎn)生故障。而當前并不缺乏內(nèi)存檢驗的方法,但是批量通過網(wǎng)絡(luò)的檢驗的方法并不多。
技術(shù)實現(xiàn)要素:
為了解決以上技術(shù)問題,本發(fā)明提出了一種可批量通過網(wǎng)絡(luò)進行服務(wù)器內(nèi)存診斷的方法??梢院Y選出有故障的內(nèi)存,提高服務(wù)器的穩(wěn)定性。
本發(fā)明的技術(shù)方案是
一種可通過網(wǎng)絡(luò)批量對多臺服務(wù)器進行dos環(huán)境下對內(nèi)存進行診斷測試的方法,對90%以上的內(nèi)存地址寫滿數(shù)據(jù),通過對數(shù)據(jù)的復制進行移動復制反轉(zhuǎn)等各種操作,之后與原始數(shù)據(jù)對比,來完成壓力測試發(fā)現(xiàn)內(nèi)存錯誤。
具體步驟如下:
1、搭建多臺服務(wù)器,通過網(wǎng)絡(luò)pxe安裝操作系統(tǒng)(兩個oslinuxanddos),在linux系統(tǒng)下通過scelnx工具設(shè)置ecc閥值為1.修改系統(tǒng)grub進入dos系統(tǒng),執(zhí)行memtest腳本,進行內(nèi)存檢測。
2、通過收集bmcselmemoryerrorlog來判斷是否有不健康的內(nèi)存及獲取故障內(nèi)存具體位置。
3、機器測試結(jié)束后,進入檢驗工站,使用測試程序自動讀取sel日志測試日志,自動判斷測試結(jié)果是否有內(nèi)存錯誤,如果有內(nèi)存錯誤日志或低于標準值,機器需要轉(zhuǎn)維修修復。
本發(fā)明的有益效果是
對90%以上的內(nèi)存地址寫滿數(shù)據(jù),通過對數(shù)據(jù)的復制進行移動復制反轉(zhuǎn)等各種操作,之后與原始數(shù)據(jù)對比,來完成壓力測試發(fā)現(xiàn)內(nèi)存錯誤??捎糜诋a(chǎn)線批量檢測,提高產(chǎn)品內(nèi)存診斷效率。
具體實施方式
下面對本發(fā)明的內(nèi)容進行更加詳細的闡述:
本發(fā)明提供的是一種可通過網(wǎng)絡(luò)批量對多臺服務(wù)器進行dos環(huán)境下對內(nèi)存進行診斷測試的方法,對90%以上的內(nèi)存地址寫滿數(shù)據(jù),通過對數(shù)據(jù)的復制進行移動復制反轉(zhuǎn)等各種操作,之后與原始數(shù)據(jù)對比,來完成壓力測試發(fā)現(xiàn)內(nèi)存錯誤。可用于產(chǎn)線批量檢測。
1)、搭建多臺服務(wù)器,通過網(wǎng)絡(luò)pxe安裝操作系統(tǒng)(兩個oslinuxanddos),在linux系統(tǒng)下通過scelnx工具設(shè)置ecc閥值為1.修改系統(tǒng)grub進入dos系統(tǒng),執(zhí)行memtest腳本,進行內(nèi)存檢測。
2)通過收集bmcselmemoryerrorlog來判斷是否有不健康的內(nèi)存及獲取故障內(nèi)存具體位置。
3)機器測試結(jié)束后,進入檢驗工站,使用測試程序自動讀取sel日志測試日志,自動判斷測試結(jié)果是否有內(nèi)存錯誤,如果有內(nèi)存錯誤日志或低于標準值,機器需要轉(zhuǎn)維修修復。