本發(fā)明涉及數(shù)據(jù)通信領(lǐng)域,特別涉及一種故障檢測方法及裝置。
背景技術(shù):
簡單網(wǎng)絡(luò)管理協(xié)議(Simple Network Management Protocol,簡稱為SNMP)是一種應(yīng)用層協(xié)議,是傳輸控制協(xié)議/因特網(wǎng)互聯(lián)協(xié)議(Transmission Control Protocol/Internet Protocol,簡稱為TCP/IP)協(xié)議族的一部分。它使網(wǎng)絡(luò)設(shè)備之間能夠方便地交換管理信息。能夠讓網(wǎng)絡(luò)管理員對網(wǎng)絡(luò)進行配置管理,發(fā)現(xiàn)和解決網(wǎng)絡(luò)問題。目前SNMP已成為網(wǎng)絡(luò)管理領(lǐng)域中最重要的標準,并被廣泛支持和應(yīng)用,大多數(shù)網(wǎng)絡(luò)管理系統(tǒng)和平臺都是基于SNMP的。
網(wǎng)管系統(tǒng)管理網(wǎng)元設(shè)備,網(wǎng)元設(shè)備主動上報故障信息,或者網(wǎng)管監(jiān)測網(wǎng)元設(shè)備。如果網(wǎng)元向網(wǎng)管告警的通道出現(xiàn)故障,網(wǎng)管無法實現(xiàn)對網(wǎng)元的監(jiān)管功能,網(wǎng)元也無法成功地上報告警,有網(wǎng)元告警脫管的可能。網(wǎng)管接收不到網(wǎng)元的報文,會認為網(wǎng)元設(shè)備出現(xiàn)故障,但接收不到報文的原因很有可能是告警上報通道出現(xiàn)了故障。因此,目前的網(wǎng)管系統(tǒng)故障檢測方法都未涉及一個問題:即無法確定網(wǎng)元告警上報通道是否正常。
針對相關(guān)技術(shù)中無法確定網(wǎng)元告警上報通道是否正常,導(dǎo)致網(wǎng)管對網(wǎng)元監(jiān)控不可靠的問題,目前尚未提出有效的解決方案。
技術(shù)實現(xiàn)要素:
本發(fā)明提供了一種故障檢測方法及裝置,以至少解決無法確定網(wǎng)元告警上報通道是否正常,導(dǎo)致網(wǎng)管對網(wǎng)元監(jiān)控不可靠的問題。
根據(jù)本發(fā)明的一個方面,提供了一種故障檢測方法,包括:網(wǎng)管向網(wǎng)元設(shè)備發(fā)送告警檢測指令,其中,所述告警檢測指令用于所述網(wǎng)管檢測所述網(wǎng)元設(shè)備上報故障至網(wǎng)管的通道是否出現(xiàn)故障;所述網(wǎng)管判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到所述網(wǎng)元設(shè)備根據(jù)所述告警檢測指令反饋的檢測信息;在判斷結(jié)果為否的情況下,所述網(wǎng)管確定所述通道出現(xiàn)故障。
進一步地,所述方法還包括:在判斷結(jié)果為是的情況下,所述網(wǎng)管確定所述通道正常。
進一步地,在所述網(wǎng)管確定所述通道正常之后,所述方法還包括:所述網(wǎng)管丟棄所述檢測信息。
進一步地,所述方法還包括:所述網(wǎng)管檢測所述網(wǎng)管的告警信息接收功能是否正常。
進一步地,所述網(wǎng)管檢測所述網(wǎng)管的告警信息接收功能是否正常包括:所述網(wǎng)管向網(wǎng)卡發(fā)送檢測指令;所述網(wǎng)管判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到所述網(wǎng)卡發(fā)送的所述檢測指令;在判斷結(jié)果為是的情況下,所述網(wǎng)管確定所述網(wǎng)管的告警信息接收功能正常;在判斷結(jié)果為否的情況下,所述網(wǎng)管確定所述網(wǎng)管的告警信息接收功能出現(xiàn)故障。
進一步地,所述告警檢測指令是SNMP TRAP報文的情況下,所述檢測信息是失敗告警,其中,所述SNMP TRAP報文用于觸發(fā)所述網(wǎng)元設(shè)備認證所述失敗告警。
根據(jù)本發(fā)明的另一方面,提供了一種故障檢測裝置,該裝置包括:發(fā)送模塊,用于向網(wǎng)元設(shè)備發(fā)送告警檢測指令,其中,所述告警檢測指令用于所述網(wǎng)管檢測所述網(wǎng)元設(shè)備上報故障至網(wǎng)管的通道是否出現(xiàn)故障;判斷模塊,用于判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到所述網(wǎng)元設(shè)備根據(jù)所述告警檢測指令反饋的檢測信息;確定模塊,用于在判斷結(jié)果為否的情況下,確定所述通道出現(xiàn)故障。
進一步地,所述確定模塊,還用于在判斷結(jié)果為是的情況下,確定所述通道正常。
進一步地,所述裝置還包括:檢測模塊,用于檢測所述網(wǎng)管的告警信息 接收功能是否正常。
進一步地,所述檢測模塊包括:發(fā)送單元,用于向網(wǎng)卡發(fā)送檢測指令;判斷單元,用于所述網(wǎng)管判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到所述網(wǎng)卡發(fā)送的所述檢測指令;第一確定單元,用于在判斷結(jié)果為是的情況下,確定所述網(wǎng)管的告警信息接收功能正常;第二確定單元,用于在判斷結(jié)果為否的情況下,確定所述網(wǎng)管的告警信息接收功能出現(xiàn)故障。
通過本發(fā)明,采用網(wǎng)管向網(wǎng)元設(shè)備發(fā)送告警檢測指令,其中,所述告警檢測指令用于所述網(wǎng)管檢測所述網(wǎng)元設(shè)備上報故障至網(wǎng)管的通道是否出現(xiàn)故障;所述網(wǎng)管判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到所述網(wǎng)元設(shè)備根據(jù)所述告警檢測指令反饋的檢測信息;在判斷結(jié)果為否的情況下,所述網(wǎng)管確定所述通道出現(xiàn)故障,解決了相關(guān)技術(shù)中無法確定網(wǎng)元告警上報通道是否正常,導(dǎo)致網(wǎng)管對網(wǎng)元監(jiān)控不可靠的問題,實現(xiàn)了網(wǎng)管系統(tǒng)可以檢查網(wǎng)元上報通道,提高工作效率,降低網(wǎng)元告警脫管可能性,提高了網(wǎng)管對設(shè)備監(jiān)控的可靠性。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。在附圖中:
圖1是根據(jù)本發(fā)明實施例的故障檢測方法的流程圖一;
圖2是根據(jù)本發(fā)明實施例的故障檢測方法的流程圖二;
圖3是根據(jù)本發(fā)明實施例的故障檢測方法的流程圖三;
圖4是根據(jù)本發(fā)明實施例的故障檢測裝置的結(jié)構(gòu)框圖一;
圖5是根據(jù)本發(fā)明實施例的故障檢測裝置的結(jié)構(gòu)框圖二;
圖6是根據(jù)本發(fā)明實施例的故障檢測裝置的檢測模塊的結(jié)構(gòu)框圖;
圖7是根據(jù)本發(fā)優(yōu)選實施例的故障檢測裝置的結(jié)構(gòu)框圖;
圖8是根據(jù)本發(fā)明優(yōu)選實施例的故障檢測方法的流程圖一;
圖9是根據(jù)本發(fā)明優(yōu)選實施例的故障檢測方法的流程圖二;
圖10是根據(jù)本發(fā)明優(yōu)選實施例的網(wǎng)管告警接收模塊72收到的檢測忽略消息結(jié)構(gòu)示意圖;
圖11是相關(guān)技術(shù)中RFC1907定義的認證失敗告警(authentication Failure NOTIFICATION-TYPE)的示意圖。
具體實施方式
下文中將參考附圖并結(jié)合實施例來詳細說明本發(fā)明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。
在本實施例中提供了一種故障檢測方法,圖1是根據(jù)本發(fā)明實施例的故障檢測方法的流程圖,如圖1所示,該流程可以包括如下步驟:
步驟S100,網(wǎng)管向網(wǎng)元設(shè)備發(fā)送告警檢測指令,其中,告警檢測指令用于網(wǎng)管檢測所述網(wǎng)元設(shè)備上報故障至網(wǎng)管的通道是否出現(xiàn)故障;
步驟S102,網(wǎng)管判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到所述網(wǎng)元設(shè)備根據(jù)所述告警檢測指令反饋的檢測信息;
步驟S104,在判斷結(jié)果為否的情況下,所述網(wǎng)管確定所述通道出現(xiàn)故障。
通過上述步驟,網(wǎng)管系統(tǒng)主動向網(wǎng)元設(shè)備發(fā)送檢測指令,網(wǎng)元設(shè)備根據(jù)檢測指令反饋檢測信息。如果在預(yù)定時間范圍內(nèi),網(wǎng)管系統(tǒng)未接收到網(wǎng)元設(shè)備反饋的檢測信息,則可以確定網(wǎng)元設(shè)備向網(wǎng)管系統(tǒng)上報故障的通道出現(xiàn)了故障,解決了相關(guān)技術(shù)中無法確定網(wǎng)元告警上報通道是否正常,導(dǎo)致網(wǎng)管對網(wǎng)元監(jiān)控不可靠的問題,實現(xiàn)了網(wǎng)管系統(tǒng)可以檢查網(wǎng)元上報通道,提高工作效率,降低網(wǎng)元告警脫管可能性,提高了網(wǎng)管對設(shè)備監(jiān)控的可靠性。
進一步地,該方法還可以包括步驟S106,在判斷結(jié)果為是的情況下,所述網(wǎng)管確定所述通道正常。如果在預(yù)定時間范圍內(nèi),網(wǎng)管系統(tǒng)接收到網(wǎng)元設(shè)備反饋的檢測信息,則可以認為上報告警通道正常,保障網(wǎng)管系統(tǒng)對網(wǎng)元設(shè)備監(jiān)控的可靠性。
在優(yōu)選的實施方式中,網(wǎng)管系統(tǒng)在確定上報告警通道正常的情況下,該方法還可以包括:所述網(wǎng)管丟棄所述檢測信息。在檢測上報通道是否出現(xiàn)故障期間,不需要對接收到的檢測信息顯示到網(wǎng)管或入庫,否則會給客戶帶來誤解,以為設(shè)備遭到了攻擊,因此網(wǎng)管系統(tǒng)會丟棄并忽略該檢測信息,
在本發(fā)明實施例中還提供了一種故障檢測方法,圖2是根據(jù)本發(fā)明實施例的故障檢測方法的流程圖二,如圖2所示,該流程可以包括如下步驟:
步驟S200,網(wǎng)管檢測網(wǎng)管的告警信息接收功能是否正常;
步驟S202,網(wǎng)管向網(wǎng)元設(shè)備發(fā)送告警檢測指令,其中,告警檢測指令用于網(wǎng)管檢測網(wǎng)元設(shè)備上報故障至網(wǎng)管的通道是否出現(xiàn)故障;
步驟S204,網(wǎng)管判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到網(wǎng)元設(shè)備根據(jù)告警檢測指令反饋的檢測信息;
步驟S206,在判斷結(jié)果為否的情況下,網(wǎng)管確定通道出現(xiàn)故障;
步驟S208,在判斷結(jié)果為是的情況下,網(wǎng)管確定通道正常。
網(wǎng)管系統(tǒng)在確定網(wǎng)元設(shè)備告警上報通道正常的情況下,這個結(jié)論是很明確的,不需要對網(wǎng)管系統(tǒng)的告警接收功能檢測。在網(wǎng)管系統(tǒng)確定網(wǎng)元設(shè)備上報告警通道出現(xiàn)故障的情況下,并不能百分百確定是告警通道出了問題,也有一定的可能性是網(wǎng)管系統(tǒng)告警接收功能出現(xiàn)了故障,導(dǎo)致網(wǎng)管無法及時接收到網(wǎng)元上報的故障檢測信息,使網(wǎng)管誤認為通道出現(xiàn)故障。在該種情況下,還需要對網(wǎng)管的告警接收功能進行檢測。網(wǎng)管告警通道檢測模塊通知網(wǎng)管告警接收測試模塊進行網(wǎng)管告警接收檢測。
進一步地,步驟S200可以在步驟S202之前,也可以在步驟S206或者S208之后。在網(wǎng)管接收功能正常的情況下,檢測告警上報通道的判斷結(jié)果可以是準確的。在確定上報告警通道出現(xiàn)故障的情況下,再對網(wǎng)管接收功能進行檢測。如果網(wǎng)管告警接收功能正常,說明告警通道檢測結(jié)果沒有問題;在告警接收功能出現(xiàn)故障時,就不能確定告警通道是否出現(xiàn)故障。
在本實施例中提供了一種故障檢測方法,圖3是根據(jù)本發(fā)明實施例的故障檢測方法的流程圖三,如圖3所示,該流程可以包括如下步驟:
步驟S300,網(wǎng)管向網(wǎng)卡發(fā)送檢測指令;
步驟S302,網(wǎng)管判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到網(wǎng)卡發(fā)送的檢測指令;
步驟S304,在判斷結(jié)果為否的情況下,網(wǎng)管確定網(wǎng)管的告警信息接收功能出現(xiàn)故障;
步驟S306,在判斷結(jié)果為是的情況下,網(wǎng)管確定網(wǎng)管的告警信息接收功能正常;
通過網(wǎng)管系統(tǒng)內(nèi)部模塊發(fā)送和接收檢測指令,實現(xiàn)檢測網(wǎng)管系統(tǒng)接收功能的可靠性。
步驟S208,網(wǎng)管向網(wǎng)元設(shè)備發(fā)送告警檢測指令,其中,告警檢測指令用于網(wǎng)管檢測網(wǎng)元設(shè)備上報故障至網(wǎng)管的通道是否出現(xiàn)故障;
步驟S310,網(wǎng)管判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到網(wǎng)元設(shè)備根據(jù)告警檢測指令反饋的檢測信息;
步驟S312,在判斷結(jié)果為否的情況下,網(wǎng)管確定通道出現(xiàn)故障;
步驟S314,在判斷結(jié)果為是的情況下,網(wǎng)管確定通道正常。
網(wǎng)管告警接收功能正常是網(wǎng)元告警上報通道檢測的必要條件。只有網(wǎng)管告警接收功能無問題測試設(shè)備上報才有意義。通過該方法,確定網(wǎng)管系統(tǒng)的告警接收功能正常的情況下,再對告警上報通道進行檢測,根據(jù)檢測結(jié)果確定告警上報通道是否正常,解決了相關(guān)技術(shù)中無法確定網(wǎng)元告警上報通道是否正常,導(dǎo)致網(wǎng)管對網(wǎng)元監(jiān)控不可靠的問題,提高了告警管理的可靠性,用戶可以及時的發(fā)現(xiàn)網(wǎng)元告警脫管問題。
在優(yōu)選的實施方式中,上述方法還可以包括:該告警檢測指令是SNMP TRAP報文,其中,所述SNMP TRAP報文用于觸發(fā)所述網(wǎng)元設(shè)備認證失敗告警;該檢測信息是認證失敗告警。SNMP Trap是SNMP的一部分,當被監(jiān)控段出現(xiàn)特定事件或故障,代理端會給網(wǎng)管發(fā)告警事件。在RFC1907中有定義認證失敗告警(authentication Failure NOTIFICATION-TYPE,在該優(yōu)選實施方中利用此告警作為告警上報檢測。可以簡單快速的檢測設(shè)備告警上報通道是否正常,支持所有支持SNMP(簡單網(wǎng)絡(luò)協(xié)議)V1和V2C管理的設(shè)備。測試效 率比手動觸發(fā)端口宕告警和配置檢查的效率高了上百倍。
在本實施例中還提供了一種故障檢測裝置,該裝置用于實現(xiàn)上述實施例及優(yōu)選實施方式,已經(jīng)進行過說明的不再贅述。如以下所使用的,術(shù)語“模塊”可以實現(xiàn)預(yù)定功能的軟件和/或硬件的組合。盡管以下實施例所描述的裝置較佳地以軟件來實現(xiàn),但是硬件,或者軟件和硬件的組合的實現(xiàn)也是可能并被構(gòu)想的。
圖4是根據(jù)本發(fā)明實施例的故障檢測裝置的結(jié)構(gòu)框圖一,如圖4所示,該裝置包括發(fā)送模塊40、判斷模塊42和確定模塊44,下面對該裝置進行說明。
發(fā)送模塊40,用于向網(wǎng)元設(shè)備發(fā)送告警檢測指令,其中,告警檢測指令用于網(wǎng)管檢測所述網(wǎng)元設(shè)備上報故障至網(wǎng)管的通道是否出現(xiàn)故障;
判斷模塊42,用于判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到網(wǎng)元設(shè)備根據(jù)所述告警檢測指令反饋的檢測信息;
確定模塊44,用于在判斷結(jié)果為否的情況下,確定通道出現(xiàn)故障。
進一步地,確定模塊44,還可以用于在判斷結(jié)果為是的情況下,確定所述通道正常。
圖5是根據(jù)本發(fā)明實施例的故障檢測裝置的結(jié)構(gòu)框圖二,結(jié)合圖5對該裝置進行說明。
檢測模塊50,用于檢測所述網(wǎng)管的告警信息接收功能是否正常;
發(fā)送模塊52,用于向網(wǎng)元設(shè)備發(fā)送告警檢測指令,其中,告警檢測指令用于網(wǎng)管檢測所述網(wǎng)元設(shè)備上報故障至網(wǎng)管的通道是否出現(xiàn)故障;
判斷模塊54,用于判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到網(wǎng)元設(shè)備根據(jù)所述告警檢測指令反饋的檢測信息;
確定模塊56,用于在判斷結(jié)果為否的情況下,確定通道出現(xiàn)故障。
進一步地,如附圖6所示,該檢測模塊50還可以包括:
發(fā)送單元501,用于向網(wǎng)卡發(fā)送檢測指令;
判斷單元502,用于判斷在預(yù)設(shè)時間閾值內(nèi)是否接收到所述網(wǎng)卡發(fā)送的所述檢測指令;
第一確定單元503,用于在判斷結(jié)果為是的情況下,確定網(wǎng)管的告警信息接收功能正常;
第二確定單元504,用于在判斷結(jié)果為否的情況下,確定網(wǎng)管的告警信息接收功能出現(xiàn)故障。
通過上述裝置,網(wǎng)管系統(tǒng)主動向網(wǎng)元設(shè)備發(fā)送檢測指令,網(wǎng)元設(shè)備根據(jù)檢測指令反饋檢測信息。如果在預(yù)定時間范圍內(nèi),網(wǎng)管系統(tǒng)未接收到網(wǎng)元設(shè)備反饋的檢測信息,則可以確定網(wǎng)元設(shè)備向網(wǎng)管系統(tǒng)上報故障的通道出現(xiàn)了故障,解決了相關(guān)技術(shù)中無法確定網(wǎng)元告警上報通道是否正常,導(dǎo)致網(wǎng)管對網(wǎng)元監(jiān)控不可靠的問題,實現(xiàn)了網(wǎng)管系統(tǒng)可以檢查網(wǎng)元上報通道,提高工作效率,降低網(wǎng)元告警脫管可能性,提高了網(wǎng)管對設(shè)備監(jiān)控的可靠性。
下面再結(jié)合具體實施例對本發(fā)明進行說明。
圖7是根據(jù)本發(fā)明優(yōu)選實施例的故障檢測的結(jié)構(gòu)框圖;如圖7所示,該裝置可以實現(xiàn)上述圖4至6中所述裝置的功能,可以包括如下模塊:
網(wǎng)管告警通道檢測模塊70:負責(zé)檢測告警上報通道是否正??梢詫崿F(xiàn)上述圖4中的判斷模塊42的功能;
網(wǎng)管告警接收模塊72:主要負責(zé)監(jiān)聽端口,接收trap,可以實現(xiàn)圖4中發(fā)送模塊的功能;
網(wǎng)管告警接收測試模塊74:主要負責(zé)產(chǎn)生并發(fā)送特定的trap到網(wǎng)管告警接收端口,可以實現(xiàn)圖5中的檢測模塊50的功能;
網(wǎng)元告警測試模塊76:主要使設(shè)備產(chǎn)生認證失敗告警,并記錄告警產(chǎn)生時間。將記錄的告警產(chǎn)生時間和設(shè)備信息返回給告警通道檢測模塊,可以實現(xiàn)圖4中確定模塊44的功能;
與現(xiàn)有技術(shù)相比較,本實施例提供一種快速檢測告警上報通道是否正常方法和系統(tǒng),通過實際的測試真實的反映了網(wǎng)管對設(shè)備告警的管理狀況?;跍y試的告警上報檢查方法簡單,便于操作與配置檢查相比可靠性更高,檢 查速度更快,告警測試不需要修改設(shè)備上的業(yè)務(wù),對設(shè)備的影響更小。
在本發(fā)明的優(yōu)選實施例中提供了一種故障檢測方法,圖8是根據(jù)本發(fā)明優(yōu)選實施例的一種故障檢測方法的流程圖一,如圖8所示,該流程可以包括如下步驟:
步驟S800,檢測網(wǎng)管告警接收是否正常;
步驟S802,檢測網(wǎng)元上報告警通道是否正常。
網(wǎng)管告警接收檢測是網(wǎng)元告警上報檢測的前提條件。只有網(wǎng)管告警接收功能無問題測試設(shè)備上報才有意義。目前已知的網(wǎng)管接收問題有很多種類,大概有:服務(wù)器端口被占用,告警接收模塊未啟動;網(wǎng)管上存在防火墻服務(wù)器上的告警被攔截了;網(wǎng)管服務(wù)端沒有獲得足夠的權(quán)限,啟動異常等。網(wǎng)元告警上報異常更加多了,主要原因集中在設(shè)備側(cè)。本優(yōu)選實施例并不關(guān)注設(shè)備的具體配置,只關(guān)注設(shè)備是否可以上報trap到網(wǎng)管。
在本發(fā)明的優(yōu)選實施例中提供了一種故障檢測方法,圖9是根據(jù)本發(fā)明優(yōu)選實施例的一種基于家庭網(wǎng)關(guān)的故障檢測的方法流程圖二,圖9針對圖8中所示的步驟S800/、步驟S802進行了詳細的描述。如圖10所示,該方法可以包括如下步驟:
步驟S900,網(wǎng)管發(fā)送指定TRAP到網(wǎng)絡(luò)上;
網(wǎng)管告警通道檢測模塊70通知網(wǎng)管告警接收測試模塊74進行網(wǎng)管告警接收功能檢測;網(wǎng)管告警接收測試模塊74發(fā)送指定trap(例如:.1.3.6.1.4.1.3902.10.10.10.10)到網(wǎng)絡(luò)上。
步驟S902,監(jiān)聽在指定時間內(nèi)是否接收到指定的TRAP;
網(wǎng)管告警接收模塊70監(jiān)聽網(wǎng)絡(luò)在指定的時間(通常為4秒)內(nèi)是否收到指定trap。
步驟S904,在否的情況下,確定網(wǎng)管接收告警功能出現(xiàn)故障;如果在達到超時時間還沒有收到trap報文,則網(wǎng)管服務(wù)器告警接收出現(xiàn)問題。網(wǎng)管告警通道檢測模塊70記錄檢測結(jié)果。
步驟S906,在是的情況下,確定網(wǎng)管接收告警功能正常;如果網(wǎng)管告警 接收模塊70收到了指定的trap報文:表明網(wǎng)管的trap接收端口是可用了,即Trap監(jiān)聽正常。網(wǎng)管告警通道檢測模塊70記錄檢測結(jié)果。
進一步地,網(wǎng)管告警通道檢測模塊70通知網(wǎng)管告警接收模塊72忽略在指定時間內(nèi)忽略設(shè)備認證失敗告警。如果設(shè)備在測試告警上報期間產(chǎn)生的認證失敗告警顯示到網(wǎng)管或入庫了,會給客戶帶來誤解,認為設(shè)備遭到了攻擊。所以應(yīng)通知告警接收模塊72丟棄該檢測的TRAP報文。
具體地,網(wǎng)管告警接收模塊收到的檢測忽略消息結(jié)構(gòu)可以如圖10所示,主要包括:網(wǎng)元id和開始時間。每個網(wǎng)元trap上報檢測開始的時候,網(wǎng)管告警通道檢測模塊會往檢測隊列中加入一條記錄。當檢測完成或檢測超時會將隊列的相應(yīng)數(shù)據(jù)刪除。如果隊列中的數(shù)據(jù)為非空的時候,告警檢測將會忽略一次檢測報文。并將對應(yīng)的檢測條目從丟列中刪除。
步驟S908,網(wǎng)管向網(wǎng)元發(fā)送檢測報文;
告警通道檢測模塊70通知網(wǎng)元告警測試模塊76發(fā)送檢測報文SBMP Trap;SNMP Trap是SNMP的一部分,當被監(jiān)控段出現(xiàn)特定事件或故障,代理端會給網(wǎng)管發(fā)告警事件。在RFC1907中有定義認證失敗告警(authentication Failure NOTIFICATION-TYPE,具體可以詳見圖11)。
步驟S910,觸發(fā)網(wǎng)元產(chǎn)生認證失敗告警;
網(wǎng)元告警測試模塊76觸發(fā)網(wǎng)元設(shè)備產(chǎn)生認證失敗告警。使用錯誤的團體串取設(shè)備上指定的mib節(jié)點(即snmp get操作),設(shè)備會產(chǎn)生認證失敗告警。如使用errorCommunity作為團體串,使用snmp get方式發(fā)送請求取.iso.org.dod.internet.mgmt.mib-2.system.sysDescr上的值;設(shè)備收到錯誤的團體串后,會產(chǎn)生認證失敗告警(如圖11所示),并將認證失敗告警發(fā)到網(wǎng)管告警接收模塊72。
步驟S912,網(wǎng)管是否在指定的時間內(nèi)接收到認證失敗告警;
使用錯誤的團體串取設(shè)備上指定的mib節(jié)點的時候,通常設(shè)置重試次數(shù)為0,如果設(shè)置為多次重試會影響接收的判斷功能。觸發(fā)命令發(fā)出后,通常等待4秒左右,如果命令發(fā)出4秒網(wǎng)管沒有收到則告警可以確認是無法收到了。在網(wǎng)絡(luò)較差的時候可以加大這個時間。增加時間會降低通道檢測速度,所以 需要按照實際的網(wǎng)絡(luò)情況進行調(diào)整。但是建議不要低于2秒。
步驟S914,在是的情況下,確定網(wǎng)元上報告警通道正常;
步驟S916,在否的情況下,確定網(wǎng)元上報告警通道出現(xiàn)故障。
網(wǎng)管告警接收模塊72,如果在指定時間內(nèi)收到了該測試設(shè)備的認證失敗報文,網(wǎng)管系統(tǒng)可以確定該上報告警通道正常,記錄該網(wǎng)元設(shè)備可以上報告警。為防止網(wǎng)管和維護誤認,可以將該報文丟棄。如果在指定時間內(nèi)未收到了該測試設(shè)備的認證失敗報文,網(wǎng)管系統(tǒng)可以確定該上報告警通道出現(xiàn)了故障,記錄此設(shè)備不能正常地上報告警信息。
進一步地,通過發(fā)送標準的測試報文可以用于所有支持snmpv1和snmpv2C的設(shè)備。被管理設(shè)備不需要特別定制,開發(fā)和應(yīng)用成本低。使用報文測試如果設(shè)備告警可達測試單個設(shè)備的時間少于1秒,高性能設(shè)備測試時間可以少于0.1秒。測試效率比手動觸發(fā)端口宕告警和配置檢查的效率高了上百倍。無論該通道是否正常,該網(wǎng)元設(shè)備是否可以正常上報告警,在檢測結(jié)束后網(wǎng)管系統(tǒng)都會將檢測隊列中的條目刪除,使其不影響正常的認證失敗報文上報。當檢測完成后,可以測試結(jié)果顯示給用戶。
通過本優(yōu)選實施例提供的方法,支持所有支持SNMP(簡單網(wǎng)絡(luò)協(xié)議)V1和V2C管理的設(shè)備??梢钥焖俚貦z測告警上報通道是否正常,可以降低告警無法上報導(dǎo)致的網(wǎng)元告警脫管可能性,提高網(wǎng)管對設(shè)備監(jiān)控的可靠性。
綜上所述,上述實施例、優(yōu)選實施例和實施方式提供了一種上報告警通道的檢測方法及裝置,通過網(wǎng)管發(fā)送檢測報文,判斷在預(yù)設(shè)時間內(nèi)是否接收到根據(jù)檢測報文反饋的檢測故障信息,確定上報告警通道是否出現(xiàn)故障,解決了相關(guān)技術(shù)中無法確定網(wǎng)元告警上報通道是否正常,導(dǎo)致網(wǎng)管對網(wǎng)元監(jiān)控不可靠的問題,實現(xiàn)了用戶可以及時的發(fā)現(xiàn)網(wǎng)元告警脫管,降低網(wǎng)元告警脫管可能性,提高了網(wǎng)管對設(shè)備監(jiān)控的可靠性。
顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,并 且在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
以上該僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。