專利名稱:遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,特別涉及一種將遠(yuǎn)程硬件告警信息與遠(yuǎn)程硬件本身緊密結(jié)合,從而準(zhǔn)確定位該遠(yuǎn)程告警的硬件的方法。
背景技術(shù):
隨著計(jì)算機(jī)工業(yè)水平的不斷進(jìn)步,人們對(duì)計(jì)算機(jī)的性能、穩(wěn)定性和可靠性提出了越來越高的要求,特別是對(duì)于服務(wù)器。由于對(duì)計(jì)算機(jī)性能無止境的追求,使得目前計(jì)算機(jī)的核心部件——中央處理器(即CPU)的工作頻率越來越高,與之配套工作的外圍部件如主板、硬盤等的工作速率也不斷增長(zhǎng)。這種技術(shù)趨勢(shì)的必然結(jié)果就是這些部件所消耗的功率在不斷地增長(zhǎng),發(fā)熱量也越來越大,長(zhǎng)期在這種條件下工作的部件的失效率也呈指數(shù)性質(zhì)上升。為保證整機(jī)工作的穩(wěn)定性和可靠性,就要求這些部件以及為這些部件服務(wù)的外圍部件如電源等具有更高的可靠性。
提高部件可靠性的方法有多種,除了提高部件的技術(shù)含量、改進(jìn)生產(chǎn)工藝以外,還可以設(shè)想,如果能夠?qū)@些部件的相關(guān)參數(shù)——電壓、溫度、風(fēng)扇轉(zhuǎn)速等進(jìn)行實(shí)時(shí)監(jiān)控,在這些參數(shù)發(fā)生異常時(shí)能夠及時(shí)準(zhǔn)確的給出報(bào)警,使用戶能夠及時(shí)進(jìn)行干預(yù),毫無疑問能夠在很大程度上防止這些部件由于長(zhǎng)時(shí)間處于非正常工作狀態(tài)而因超出正常工作電壓、正常工作溫度導(dǎo)致的失效,從而能顯著提高整機(jī)的工作穩(wěn)定性和可靠性,延長(zhǎng)部件和整機(jī)的使用壽命。
目前,已經(jīng)存在的計(jì)算機(jī)系統(tǒng)進(jìn)行遠(yuǎn)程監(jiān)控的方法,是通過簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議將監(jiān)控到的信息傳送到監(jiān)控端。著名的Intel軟件ISC就是用了這種方法,但它的缺點(diǎn)是沒有將硬件告警信息與硬件本身緊密結(jié)合,因此不能準(zhǔn)確定位該告警的硬件;同時(shí)該告警信息在用戶界面的顯示不及時(shí)。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,其將硬件告警信息與硬件本身緊密結(jié)合,從而準(zhǔn)確定位告警的硬件。
本發(fā)明的另一目的在于提供一種遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,在準(zhǔn)確定位告警硬件的同時(shí)及時(shí)將該告警信息輸出、顯示。
本發(fā)明的目的是這樣實(shí)現(xiàn)的一種遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,它至少包括步驟1運(yùn)行在被監(jiān)控計(jì)算機(jī)上的代理端獲取硬件基本信息,并通過SNMP協(xié)議的PDU包傳送到控制端;步驟2該信息由監(jiān)控端提取,并由該監(jiān)控端組成各設(shè)備對(duì)象,加入到設(shè)備對(duì)象鏈表中。
步驟3該監(jiān)控端接收代理端發(fā)來的告警信息,并解析并處理其中的數(shù)據(jù)。
代理端獲取并傳送硬件基本信息的方法為步驟11埋藏在主板內(nèi)部的傳感器根據(jù)自定義的門限或事件變化值產(chǎn)生告警事件;并將該告警事件記錄在主板控制器附帶的傳感器事件紀(jì)錄之中;步驟12輪詢事件紀(jì)錄獲取相應(yīng)的告警信息;步驟13通過分析定位在MIB節(jié)點(diǎn)定義的傳感器和及其附帶的信息,獲得告警產(chǎn)生的準(zhǔn)確的硬件信息;步驟14代理端將該信息連同告警描述寫入MIB節(jié)點(diǎn),轉(zhuǎn)化為外部的MIB對(duì)象,并構(gòu)造PDU包;步驟15代理端將該P(yáng)DU包發(fā)送到監(jiān)控端,執(zhí)行步驟11。
代理端獲取被監(jiān)控計(jì)算機(jī)的告警信息的方法還包括代理端根據(jù)與監(jiān)控端共享的MIB節(jié)點(diǎn)定義,解析含有MIB節(jié)點(diǎn)信息的PDU包。
所述的MIB節(jié)點(diǎn)至少包括硬件設(shè)備節(jié)點(diǎn)和告警類型節(jié)點(diǎn);其中,該MIB節(jié)點(diǎn)信息由代理端獲取,通過SNMP協(xié)議的PDU包傳到控制端,并由監(jiān)控端提取,組成各設(shè)備對(duì)象,加入到設(shè)備對(duì)象鏈表中;每個(gè)硬件設(shè)備節(jié)點(diǎn)信息至少包括設(shè)備類型、設(shè)備索引、設(shè)備描述、設(shè)備狀態(tài)信息;每個(gè)告警信息節(jié)點(diǎn)中至少包括設(shè)備類型、設(shè)備索引、事件類型、事件發(fā)生時(shí)的值、事件嚴(yán)重級(jí)別、事件描述、告警處理設(shè)置信息。
代理端通過簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議向監(jiān)控端發(fā)送數(shù)據(jù)。
監(jiān)控端接收、解析并處理代理端發(fā)送數(shù)據(jù)的具體方法為步驟21設(shè)在監(jiān)控端負(fù)責(zé)的PDU包處理進(jìn)程實(shí)時(shí)接收代理端發(fā)送的PDU包步驟22根據(jù)MIB節(jié)點(diǎn)信息,解析該P(yáng)DU包中各數(shù)據(jù),獲得產(chǎn)生告警的設(shè)備名、設(shè)備索引信息;組成用來查詢?cè)O(shè)備鏈表的關(guān)鍵字;步驟23通過查詢?cè)O(shè)備鏈表與具體的設(shè)備對(duì)應(yīng);步驟24輸出、顯示告警信息,執(zhí)行步驟21。
本發(fā)明通過運(yùn)行在被監(jiān)控計(jì)算機(jī)上的代理端實(shí)時(shí)監(jiān)控系統(tǒng)中的告警信息,并將告警轉(zhuǎn)化為外部的MIB對(duì)象,構(gòu)造PDU包,并將該P(yáng)DU包通過簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議包傳到監(jiān)控端。監(jiān)控端實(shí)時(shí)接收、解析代理端發(fā)來的PDU包,獲得產(chǎn)生告警的設(shè)備名、設(shè)備索引信息,通過查詢鏈表與具體的設(shè)備對(duì)應(yīng),并通過顯示提示框、蜂鳴等方式及時(shí)通知用戶;由此,得以將硬件告警信息與硬件本身緊密結(jié)合,實(shí)現(xiàn)了告警硬件的準(zhǔn)確定位,并能及時(shí)將該告警信息輸出、顯示。
圖1為本發(fā)明監(jiān)控端硬件設(shè)備對(duì)象鏈表形成原理框圖。
圖2為本發(fā)明告警信息的獲取與分析原理框圖。
具體實(shí)施例方式
以下結(jié)合附圖和具體的實(shí)施例對(duì)本發(fā)明做進(jìn)一步的詳細(xì)說明。
本發(fā)明的方法分別在被監(jiān)控的計(jì)算機(jī)上設(shè)有代理端;在遠(yuǎn)程設(shè)有監(jiān)控端。
參見圖1、2,代理端運(yùn)行在被監(jiān)控的計(jì)算機(jī)上,它負(fù)責(zé)實(shí)時(shí)監(jiān)控系統(tǒng)中的告警信息,并將告警轉(zhuǎn)化為外部的MIB對(duì)象,構(gòu)造PDU包,通過簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(Simple Network Management Protocol,簡(jiǎn)稱SNMP協(xié)議)將這個(gè)PDU包傳到監(jiān)控端。SNMP協(xié)議中專門定義了用來發(fā)TRAP(告警)的PDU包。
代理端獲取硬件基本信息,通過SNMP協(xié)議的PDU包傳到控制端,并由監(jiān)控端提取,組成各設(shè)備對(duì)象,加入到設(shè)備對(duì)象鏈表中。
監(jiān)控端設(shè)有一實(shí)時(shí)接收代理端發(fā)來的TRAP包的進(jìn)程,該進(jìn)程解析這個(gè)PDU包中各字段,得到產(chǎn)生告警信息的設(shè)備名、設(shè)備索引等信息,通過查詢鏈表與具體的設(shè)備對(duì)應(yīng),并通過顯示提示框、鋒鳴等方式及時(shí)通知用戶。
代理端告警信息是通過埋藏在主板內(nèi)部的傳感器獲得的,該傳感器能夠根據(jù)定義的門限或事件變化值來確定告警事件的產(chǎn)生;當(dāng)告警事件產(chǎn)生以后,重要的事件則被記錄在主板控制器(Baseboard Manager Control,簡(jiǎn)稱為BMC)附帶的傳感器事件紀(jì)錄(SEL Repository)里面,而其他事件,則需要進(jìn)行輪詢讀取。傳感器事件的讀取可通過專用的服務(wù)器控制臺(tái)硬件實(shí)現(xiàn)。
另外,一些告警信息可以由代理端根據(jù)系統(tǒng)的實(shí)際定義情況自主判斷,產(chǎn)生相應(yīng)的告警事件。
代理端告警信息的準(zhǔn)確定位是通過在MIB節(jié)點(diǎn)上定義傳感器節(jié)點(diǎn)實(shí)現(xiàn)的;通過定位傳感器和它所附帶的信息,就可以分析并最終定位該告警產(chǎn)生的硬件名稱和索引以及是哪一種類型的告警(如溫度、電壓、風(fēng)扇等),代理端將這些詳細(xì)信息和其它一些信息(如發(fā)生事件還是結(jié)束事件等)連同告警描述一同寫入MIB節(jié)點(diǎn),轉(zhuǎn)化為外部的MIB對(duì)象,構(gòu)造PDU包。
代理端可通過輪詢的方式獲取告警信息,一旦輪詢到告警信息,代理端就將構(gòu)造好的PDU包通過簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議發(fā)出到監(jiān)控端。
設(shè)在監(jiān)控端負(fù)責(zé)的PDU包處理進(jìn)程實(shí)時(shí)接收代理端發(fā)送的PDU包;然后遵照MIB節(jié)點(diǎn)的定義規(guī)則解析該P(yáng)DU包中各數(shù)據(jù),進(jìn)而獲得產(chǎn)生告警的設(shè)備名、設(shè)備索引信息;再通過查詢鏈表與具體的設(shè)備對(duì)應(yīng);最后輸出、顯示該告警信息,當(dāng)上述過程完成以后,就再次重新執(zhí)行上述的各個(gè)步驟以實(shí)現(xiàn)及時(shí)處理相應(yīng)的PDU包。
最后所應(yīng)說明的是以上實(shí)施例僅用以說明而非限制本發(fā)明的技術(shù)方案,盡管參照上述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解依然可以對(duì)本發(fā)明進(jìn)行修改或者等同替換,而不脫離本發(fā)明的精神和范圍的任何修改或局部替換,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1.一種遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,其特征在于步驟1運(yùn)行在被監(jiān)控計(jì)算機(jī)上的代理端獲取硬件基本信息,并通過SNMP協(xié)議的PDU包傳送到控制端;步驟2該信息由監(jiān)控端提取,并由該監(jiān)控端組成各設(shè)備對(duì)象,加入到設(shè)備對(duì)象鏈表中。步驟3該監(jiān)控端接收代理端發(fā)來的告警信息,并解析并處理其中的數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,其特征在于代理端獲取并傳送硬件基本信息的方法為步驟11埋藏在主板內(nèi)部的傳感器根據(jù)自定義的門限或事件變化值產(chǎn)生告警事件;并將該告警事件記錄在主板控制器附帶的傳感器事件紀(jì)錄之中;步驟12輪詢事件紀(jì)錄獲取相應(yīng)的告警信息;步驟13通過分析定位在MIB節(jié)點(diǎn)定義的傳感器及其附帶的信息,獲得告警產(chǎn)生的準(zhǔn)確的硬件信息;步驟14代理端將該信息連同告警描述寫入MIB節(jié)點(diǎn),轉(zhuǎn)化為外部的MIB對(duì)象,并構(gòu)造PDU包;步驟15代理端將該P(yáng)DU包發(fā)送到監(jiān)控端,執(zhí)行步驟11。
3.根據(jù)權(quán)利要求1或2所述的遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,其特征在于代理端獲取被監(jiān)控計(jì)算機(jī)的告警信息的方法還包括代理端根據(jù)與監(jiān)控端共享的MIB節(jié)點(diǎn)定義,解析含有MIB節(jié)點(diǎn)信息的PDU包。
4.根據(jù)權(quán)利要求2所述的遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,其特征在于所述的MIB節(jié)點(diǎn)至少包括硬件設(shè)備節(jié)點(diǎn)和告警類型節(jié)點(diǎn);其中,該MIB節(jié)點(diǎn)信息由代理端獲取,通過SNMP協(xié)議的PDU包傳到控制端,并由監(jiān)控端提取,組成各設(shè)備對(duì)象,加入到設(shè)備對(duì)象鏈表中;每個(gè)硬件設(shè)備節(jié)點(diǎn)信息至少包括設(shè)備類型、設(shè)備索引、設(shè)備描述、設(shè)備狀態(tài)信息;每個(gè)告警信息節(jié)點(diǎn)中至少包括設(shè)備類型、設(shè)備索引、事件類型、事件發(fā)生時(shí)的值、事件嚴(yán)重級(jí)別、事件描述、告警處理設(shè)置信息。
5.根據(jù)權(quán)利要求1或2所述的遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,其特征在于代理端通過簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議向監(jiān)控端發(fā)送數(shù)據(jù)。
6.根據(jù)權(quán)利要求1或2所述的遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,其特征在于監(jiān)控端接收、解析并處理代理端發(fā)送數(shù)據(jù)的具體方法為步驟21設(shè)在監(jiān)控端負(fù)責(zé)的PDU包處理進(jìn)程實(shí)時(shí)接收代理端發(fā)送的PDU包;步驟22根據(jù)MIB節(jié)點(diǎn)信息,解析該P(yáng)DU包中各數(shù)據(jù),獲得產(chǎn)生告警的設(shè)備名、設(shè)備索引信息;組成用來查詢?cè)O(shè)備鏈表的關(guān)鍵字;步驟23通過查詢?cè)O(shè)備鏈表與具體的設(shè)備對(duì)應(yīng);步驟24輸出、顯示告警信息,執(zhí)行步驟21。
全文摘要
一種遠(yuǎn)程告警信息實(shí)時(shí)和準(zhǔn)確定位的監(jiān)控方法,它由運(yùn)行在被監(jiān)控計(jì)算機(jī)上的代理端獲取被監(jiān)控計(jì)算機(jī)上的硬件告警信息,并將該告警信息發(fā)送到遠(yuǎn)程的監(jiān)控端;該監(jiān)控端接收代理端發(fā)來的告警信息,解析并處理其中的數(shù)據(jù);本發(fā)明通過運(yùn)行在被監(jiān)控計(jì)算機(jī)上的代理端實(shí)時(shí)監(jiān)控系統(tǒng)中的信息,并將信息轉(zhuǎn)化為外部的MIB對(duì)象,構(gòu)造PDU包,最后將該P(yáng)DU包通過SNMP(簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議)數(shù)據(jù)包傳到監(jiān)控端。監(jiān)控端實(shí)時(shí)接收、解析代理端發(fā)來的PDU包,獲得產(chǎn)生告警的設(shè)備名、設(shè)備索引信息,通過查詢鏈表與具體的設(shè)備對(duì)應(yīng),并通過顯示提示框、蜂鳴等方式及時(shí)通知用戶;得以將硬件告警信息與硬件本身緊密結(jié)合,實(shí)現(xiàn)了告警硬件的準(zhǔn)確定位,并能及時(shí)將該告警信息輸出、顯示。
文檔編號(hào)G06F11/30GK1445671SQ02104189
公開日2003年10月1日 申請(qǐng)日期2002年3月15日 優(yōu)先權(quán)日2002年3月15日
發(fā)明者周建, 周謐, 席振新, 王晟, 李勇, 談華芳, 郜遠(yuǎn), 陳光亮, 周建軍 申請(qǐng)人:聯(lián)想(北京)有限公司