專利名稱:一種操作系統(tǒng)活動(dòng)狀態(tài)的監(jiān)控方法
技術(shù)領(lǐng)域:
本發(fā)明涉及,具體地說是一種操作系統(tǒng)活動(dòng)狀態(tài)的監(jiān)控方法。
背景技術(shù):
目前很多用戶將自己的服務(wù)器托管在IDC機(jī)房,直接通過電信或連通主干網(wǎng)絡(luò)提供需要的業(yè)務(wù)和服務(wù),服務(wù)器所使用的系統(tǒng)有windows系統(tǒng)和Iinux系統(tǒng)兩大分類,可能承載不同應(yīng)用,當(dāng)發(fā)生機(jī)器故障時(shí),用戶自己獲得的信息只是機(jī)器不能連通,但機(jī)器在確切的什么時(shí)間發(fā)生了宕機(jī)還是斷網(wǎng)故障無法獲知,只能通知機(jī)房管理員直接將機(jī)器強(qiáng)制重啟,后登錄服務(wù)器系統(tǒng),通過系統(tǒng)日志信息進(jìn)行確認(rèn)和判斷,這種判斷方式存在以下問題
1)Iinux系統(tǒng)的日志不能做到實(shí)時(shí)活動(dòng)狀態(tài)監(jiān)控,一般情況下依據(jù)日志記錄只能大概、判斷系統(tǒng)出現(xiàn)故障的時(shí)間,當(dāng)業(yè)務(wù)穩(wěn)定時(shí)甚至幾天都沒有新的日志記錄,只在系統(tǒng)重新啟動(dòng)時(shí)產(chǎn)生新的“syslogd 1.4. I: restart. ”記錄和對(duì)應(yīng)系統(tǒng)啟動(dòng)的時(shí)間點(diǎn),此記錄點(diǎn)之前的信息則是隨機(jī)器運(yùn)行情況生成的日志,所以在管理員不能實(shí)時(shí)對(duì)服務(wù)器運(yùn)行情況進(jìn)行監(jiān)控的情況下,不可明確判斷系統(tǒng)發(fā)生故障的具體時(shí)間windows系統(tǒng)的系統(tǒng)日志可以記錄真實(shí)死機(jī)時(shí)間點(diǎn);
2)對(duì)于遠(yuǎn)程托管的機(jī)器,無論windows系統(tǒng)還是Iinux系統(tǒng)的服務(wù)器當(dāng)發(fā)生死機(jī)、意外斷電或網(wǎng)絡(luò)故障導(dǎo)致網(wǎng)絡(luò)中斷時(shí),遠(yuǎn)程用戶所能得到的故障信息就是Ping不通,無法判斷此時(shí)故障是網(wǎng)絡(luò)故障還是機(jī)器故障,由于不同的故障現(xiàn)象可能隱含不同故障可能,如果無法確定現(xiàn)象就無法明確下一步的解決方案,所以往往對(duì)服務(wù)器的故障定位和快速恢復(fù)帶來很大困難。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種操作系統(tǒng)活動(dòng)狀態(tài)的監(jiān)控方法。本發(fā)明的目的是按以下方式實(shí)現(xiàn)的,系統(tǒng)運(yùn)行后在操作系統(tǒng)下自動(dòng)執(zhí)行監(jiān)控腳本,實(shí)時(shí)檢測系統(tǒng)網(wǎng)絡(luò)和自身活動(dòng)狀態(tài),并將檢測信息定時(shí)記錄在監(jiān)控文本日志中,準(zhǔn)確判斷服務(wù)器出現(xiàn)故障時(shí)的時(shí)間點(diǎn)和大概發(fā)生的故障表現(xiàn),具體步驟如下
1)依據(jù)操作系統(tǒng)類別將自動(dòng)執(zhí)行腳本置入開機(jī)自動(dòng)運(yùn)行,windows將腳本jiankong.cmd拖入啟動(dòng)一運(yùn)行處,Iinux系統(tǒng)將執(zhí)行腳本jiankong. sh寫入rc. local中,保證機(jī)器開機(jī)自動(dòng)運(yùn)行;
2)Windows腳本開機(jī)后系統(tǒng)腳本自動(dòng)執(zhí)行,先記錄系統(tǒng)啟動(dòng)時(shí)間,并生成系統(tǒng)啟動(dòng)信息記錄“system is on”,之后實(shí)時(shí)記錄時(shí)間,并通過ping命令直接ping網(wǎng)絡(luò)內(nèi)一臺(tái)穩(wěn)定固定機(jī)器ip,記錄Ping命令執(zhí)行結(jié)果,循環(huán)執(zhí)行,監(jiān)控系統(tǒng)的活動(dòng)情況和網(wǎng)絡(luò)聯(lián)通情況;
3)Linux腳本開機(jī)后自動(dòng)執(zhí)行,先記錄系統(tǒng)啟動(dòng)信息“systemis on”,然后記錄時(shí)間點(diǎn),通過Ping網(wǎng)絡(luò)內(nèi)一臺(tái)固定ip機(jī)器的方式,判斷網(wǎng)絡(luò)狀態(tài)是否通暢,如可以Ping通,記錄network is up信息,否則記錄network is down信息,循環(huán)執(zhí)行;
4)判斷方法機(jī)器故障出現(xiàn)后依據(jù)搜集的信息進(jìn)行故障情況判斷,每次機(jī)器啟動(dòng)都記錄“system is on”記錄,查看其之前的最后時(shí)間點(diǎn)記錄可以確認(rèn)機(jī)器故障發(fā)生的時(shí)間;如果之前的Ping命令執(zhí)行正常,說明故障情況是死機(jī)或意外斷電、重啟,如果ping命令執(zhí)行異常中斷,但日期還有記錄,說明機(jī)器沒有死機(jī),只是網(wǎng)絡(luò)中斷了。本發(fā)明的有益效果是
1)準(zhǔn)確記錄服務(wù)器運(yùn)行狀態(tài),避免主觀反饋錯(cuò)誤對(duì)故障判斷的影響;
2)可以依據(jù)記錄判斷出故障表現(xiàn)是由于系統(tǒng)死機(jī)、藍(lán)屏、斷電等產(chǎn)生的宕機(jī)故障還是異常內(nèi)外部因素導(dǎo)致的網(wǎng)絡(luò)中斷,便 于采取相應(yīng)的解決方案;
3)實(shí)現(xiàn)方式簡單,將監(jiān)控腳本直接設(shè)置為系統(tǒng)自動(dòng)運(yùn)行,易于操作實(shí)現(xiàn)等優(yōu)點(diǎn)。
圖I是監(jiān)控步驟示意圖。
具體實(shí)施例方式參照說明書附圖對(duì)本發(fā)明的方法作以下詳細(xì)地說明。具體實(shí)現(xiàn)過程如下
1)依據(jù)操作系統(tǒng)類別將自動(dòng)執(zhí)行腳本置入開機(jī)自動(dòng)運(yùn)行,windows將腳本jiankong.cmd拖入啟動(dòng)一運(yùn)行處,Iinux系統(tǒng)將執(zhí)行腳本jiankong. sh寫入rc. local中,保證機(jī)器開機(jī)自動(dòng)運(yùn)行;
2)Windows腳本開機(jī)后系統(tǒng)腳本自動(dòng)執(zhí)行,先記錄系統(tǒng)啟動(dòng)時(shí)間,并生成系統(tǒng)啟動(dòng)信息記錄“system is on”,之后實(shí)時(shí)記錄時(shí)間,并通過ping命令直接ping網(wǎng)絡(luò)內(nèi)一臺(tái)穩(wěn)定固定機(jī)器ip,記錄Ping命令執(zhí)行結(jié)果,循環(huán)執(zhí)行,監(jiān)控系統(tǒng)的活動(dòng)情況和網(wǎng)絡(luò)聯(lián)通情況;
3)Linux腳本開機(jī)后自動(dòng)執(zhí)行,先記錄系統(tǒng)啟動(dòng)信息“system is on”,然后記錄時(shí)間點(diǎn),通過Ping網(wǎng)絡(luò)內(nèi)一臺(tái)固定ip機(jī)器的方式,判斷網(wǎng)絡(luò)狀態(tài)是否通暢,如可以Ping通,記錄network is up信息,否則記錄network is down信息,循環(huán)執(zhí)行;
4)判斷方法機(jī)器故障出現(xiàn)后依據(jù)搜集的信息進(jìn)行故障情況判斷,每次機(jī)器啟動(dòng)都記錄“system is on”記錄,查看其之前的最后時(shí)間點(diǎn)記錄可以確認(rèn)機(jī)器故障發(fā)生的時(shí)間;如果之前的Ping命令執(zhí)行正常,說明故障情況是死機(jī)或意外斷電、重啟等,如果ping命令執(zhí)行異常中斷,但日期還有記錄,說明機(jī)器沒有死機(jī),但網(wǎng)絡(luò)中斷了 ;
5)實(shí)現(xiàn)腳本(注xxx.XXX. XXX. XXX為網(wǎng)絡(luò)內(nèi)一個(gè)穩(wěn)定的ip地址,用來做網(wǎng)絡(luò)監(jiān)控參考點(diǎn))windows ping. cmd Oecho on
echo system is on >>c:\test.txt:ag
echo %date% >>c:\test.txtecho %time% >>c:\test. txt
c:\windows\system32\ping xxx. xxx. xxx. xxx -n 4 >>c:\test. txtgoto ag
linux腳本jiankong. sh(注xxx. xxx. xxx. xxx為網(wǎng)絡(luò)內(nèi)一個(gè)穩(wěn)定的ip地址,用來做網(wǎng)絡(luò)監(jiān)控參考點(diǎn))
#!/bin/bashecho ^system is on〃 >> /test, txtwhile :;do
echo date >>/test, txt
ping -c 2 xxx.xxx.xxx. xxx &>/dev/null
if [ $ = 0 ];then
echo "network is up〃 >>/test, txt
else
echo "network is down" >>/test.txt、fi
sleep 2done
6)實(shí)例樣本執(zhí)行結(jié)果
windows系統(tǒng)c: \test. txt腳本執(zhí)行后顯示內(nèi)容)system is on2011/09/14 周三17:51:02. 69
正在Ping 10. 7. 255. 254具有32字節(jié)的數(shù)據(jù)
來自10. 7. 255. 254的回復(fù)字節(jié)=32時(shí)間=3ms TTL=255來自10. 7. 255. 254的回復(fù):字節(jié)=32時(shí)間〈1ms TTL=255來自10. 7. 255. 254的回復(fù):字節(jié)=32時(shí)間〈1ms TTL=255來自10. 7. 255. 254的回復(fù):字節(jié)=32時(shí)間〈1ms TTL=25510. 7. 255. 254 的 Ping 統(tǒng)計(jì)信息:
數(shù)據(jù)包已發(fā)送=4,已接收=4,丟失=0 (0%丟失),往返行程的估計(jì)時(shí)間(以毫秒為單位)
最短=Oms,最長=3ms,平均=Oms2011/09/14 周三17:51:05. 93
正在Ping 10. 7. 255. 254具有32字節(jié)的數(shù)據(jù)
來自10. 7. 255. 254的回復(fù):字節(jié)=32時(shí)間〈1ms TTL=255來自10. 7. 255. 254的回復(fù):字節(jié)=32時(shí)間〈1ms TTL=255來自10. 7. 255. 254的回復(fù):字節(jié)=32時(shí)間〈1ms TTL=255來自10. 7. 255. 254的回復(fù):字節(jié)=32時(shí)間〈1ms TTL=25510. 7. 255. 254 的 Ping 統(tǒng)計(jì)信息:
數(shù)據(jù)包已發(fā)送=4,已接收=4,丟失=0 (0%丟失),往返行程的估計(jì)時(shí)間(以毫秒為單位)
最短=Oms,最長=Oms,平均=Oms
Linux腳本執(zhí)行結(jié)果除說明書所述的技術(shù)特征外,均為本專業(yè)技術(shù)人員的已知技術(shù)。
權(quán)利要求
1.一種操作系統(tǒng)活動(dòng)狀態(tài)的監(jiān)控方法,其特征在于系統(tǒng)運(yùn)行后在操作系統(tǒng)下自動(dòng)執(zhí)行監(jiān)控腳本,實(shí)時(shí)檢測系統(tǒng)網(wǎng)絡(luò)和自身活動(dòng)狀態(tài),并將檢測信息定時(shí)記錄在監(jiān)控文本日志中,準(zhǔn)確判斷服務(wù)器出現(xiàn)故障時(shí)的時(shí)間點(diǎn)和大概發(fā)生的故障表現(xiàn),具體步驟如下 1)依據(jù)操作系統(tǒng)類別將自動(dòng)執(zhí)行腳本置入開機(jī)自動(dòng)運(yùn)行,windows將腳本jiankong.cmd拖入啟動(dòng)一運(yùn)行處,Iinux系統(tǒng)將執(zhí)行腳本jiankong. sh寫入rc. local中,保證機(jī)器開機(jī)自動(dòng)運(yùn)行; 2)Windows腳本開機(jī)后系統(tǒng)腳本自動(dòng)執(zhí)行,先記錄系統(tǒng)啟動(dòng)時(shí)間,并生成系統(tǒng)啟動(dòng)信息記錄“system is on”,之后實(shí)時(shí)記錄時(shí)間,并通過ping命令直接ping網(wǎng)絡(luò)內(nèi)一臺(tái)穩(wěn)定固定機(jī)器ip,記錄Ping命令執(zhí)行結(jié)果,循環(huán)執(zhí)行,監(jiān)控系統(tǒng)的活動(dòng)情況和網(wǎng)絡(luò)聯(lián)通情況; 3)Linux腳本開機(jī)后自動(dòng)執(zhí)行,先記錄系統(tǒng)啟動(dòng)信息“system is on”,然后記錄時(shí)間點(diǎn),通過Ping網(wǎng)絡(luò)內(nèi)一臺(tái)固定ip機(jī)器的方式,判斷網(wǎng)絡(luò)狀態(tài)是否通暢,如可以Ping通,記錄network is up信息,否則記錄network is down信息,循環(huán)執(zhí)行; 4)判斷方法機(jī)器故障出現(xiàn)后依據(jù)搜集的信息進(jìn)行故障情況判斷,每次機(jī)器啟動(dòng)都記錄“system is on”記錄,查看其之前的最后時(shí)間點(diǎn)記錄可以確認(rèn)機(jī)器故障發(fā)生的時(shí)間;如果之前的Ping命令執(zhí)行正常,說明故障情況是死機(jī)或意外斷電、重啟,如果ping命令執(zhí)行異常中斷,但日期還有記錄,說明機(jī)器沒有死機(jī),只是網(wǎng)絡(luò)中斷了。
全文摘要
本發(fā)明提供一種操作系統(tǒng)活動(dòng)狀態(tài)的監(jiān)控方法,系統(tǒng)運(yùn)行后在操作系統(tǒng)下自動(dòng)執(zhí)行監(jiān)控腳本,實(shí)時(shí)檢測系統(tǒng)網(wǎng)絡(luò)和自身活動(dòng)狀態(tài),并將檢測信息定時(shí)記錄在監(jiān)控文本日志中,準(zhǔn)確判斷服務(wù)器出現(xiàn)故障時(shí)的時(shí)間點(diǎn)和大概發(fā)生的故障表現(xiàn),優(yōu)異效果是1)準(zhǔn)確記錄服務(wù)器運(yùn)行狀態(tài),避免主觀反饋錯(cuò)誤對(duì)故障判斷的影響。2)可以依據(jù)記錄判斷出故障表現(xiàn)是由于系統(tǒng)死機(jī)、藍(lán)屏、斷電等產(chǎn)生的宕機(jī)故障還是異常內(nèi)外部因素導(dǎo)致的網(wǎng)絡(luò)中斷,便于采取相應(yīng)的解決方案。
文檔編號(hào)G06F11/30GK102736970SQ201210220128
公開日2012年10月17日 申請(qǐng)日期2012年6月29日 優(yōu)先權(quán)日2012年6月29日
發(fā)明者任華進(jìn), 劉海濱, 顧春波 申請(qǐng)人:浪潮電子信息產(chǎn)業(yè)股份有限公司