專利名稱:一種故障信息采集方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基站收發(fā)信機(jī)(Base Transceiver Station, BTS )的信息采集技 術(shù),尤其涉及一種故障信息采集方法及系統(tǒng)。
背景技術(shù):
BTS中的告警和診斷一般由告警單元和診斷單元分別進(jìn)行處理,告警單元 中一般存儲兩份表, 一份表中記錄各故障事件的故障查詢碼、告警碼,另一份 表中記錄各故障事件的故障查詢碼、告警原因碼、告警級別、附加信息,告警 單元獲取關(guān)于故障事件的檢測數(shù)據(jù)后,會對所述檢測數(shù)據(jù)進(jìn)行分析。告警單元 會周期性對第一份表進(jìn)行掃描,根據(jù)掃描結(jié)果判斷是上報告警消息還是恢復(fù)消 息,需要上報告警消息時,根據(jù)所述故障事件的故障查詢碼對第二張表進(jìn)行查 詢,再根據(jù)查詢到的告警原因碼、告警級別、附加信息,生成告警消息并上報 操作維護(hù)中心(Operation Maintain Center, OMC )網(wǎng)管。OMC網(wǎng)管收到告警消 息或恢復(fù)消息后,要判斷告警消息或恢復(fù)消息是否已經(jīng)上報過,如果已經(jīng)上報 了,就對這次上報不做處理。
診斷單元收到OMC網(wǎng)管對某故障事件的診斷請求后,會向檢測單元主動 獲取該故障事件的檢測數(shù)據(jù),經(jīng)過對檢測數(shù)據(jù)的分析,確定該故障事件的錯誤 碼值,并上報OMC網(wǎng)管,OMC網(wǎng)管通過解析錯誤碼即可獲取診斷結(jié)果。
可以看出,現(xiàn)有BTS中的告警單元和診斷單元分別對故障事件進(jìn)行數(shù)據(jù)檢 測及分析,以實(shí)現(xiàn)告警功能和診斷功能,對于檢測數(shù)據(jù)變化較頻繁的故障事件, 很容易出現(xiàn)告警單元和i貪斷單元獲取的^r測數(shù)據(jù)不一致、告警消息與診斷結(jié)果 有偏差的情況,從而影響對故障事件的分析;并且,告警單元每次進(jìn)行掃描時, 都會發(fā)送故障事件的告警消息或恢復(fù)消息,在故障事件的狀態(tài)長時間保持不變的情況下,這種反復(fù)上報會浪費(fèi)系統(tǒng)資源;另外,當(dāng)我們想要屏蔽對某些故障 事件的檢測時,需要分別在告警單元和診斷單元進(jìn)行設(shè)置,操作較繁瑣,且設(shè) 置的一致性也不好保證。
目前還有一些專利對告警單元的告警方法進(jìn)行了改進(jìn),如專利申請?zhí)枮?br>
200410021983.3的中國專利申請"一種數(shù)據(jù)采集與存儲方法"和專利號為 KR20040073220的韓國專利"一種基站告警收集方法(Amethod for collecting alarm in a base station system ),,。
其中,申請?zhí)枮?00410021983.3的中國專利申請,是在采集4企測數(shù)據(jù)的時 候就判斷其是否是需要告警的數(shù)據(jù),并根據(jù)歷史數(shù)據(jù)和告警門限等信息,丟棄 部分采集的檢測數(shù)據(jù),該方法雖然減小了檢測數(shù)據(jù)分析環(huán)節(jié)的工作量,但由于 每一次根據(jù)采集的檢測數(shù)據(jù)判斷狀態(tài)異常時,都需要上報告警消息,處于后一 道流程的告警管理單元對于上報的告警消息,要和眾多的已經(jīng)存在告警消息比 較,看這個告警消息是否已經(jīng)上報過,如果已上報過則丟棄所述告警消息,而 大多數(shù)時候,采集的數(shù)據(jù)是沒有太大變化的,所以,該專利申請同樣存在反復(fù) 上報、浪費(fèi)系統(tǒng)資源的問題。
專利號為KR20040073220的韓國專利通過發(fā)送查詢消息獲取故障事件的 狀態(tài)數(shù)據(jù),故障事件的狀態(tài)為正確,則上報數(shù)據(jù);故障事件的狀態(tài)為錯誤,則 上報告警消息。由于該專利得到故障狀態(tài)數(shù)據(jù)后,不保存數(shù)據(jù),每次都上報告 警或數(shù)據(jù),同樣有反復(fù)上報的問題,另外,當(dāng)故障事件的故障狀態(tài)從錯誤轉(zhuǎn)化 為正確后,該專利沒有相應(yīng)的流程發(fā)送恢復(fù)消息,不利于故障事件的分析。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于提供一種故障信息采集方法及系統(tǒng),能 夠節(jié)約系統(tǒng)資源、4是高系統(tǒng)穩(wěn)定性、且簡化操作。
為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的 一種故障信息采集方法,包括
獲取故障事件的檢測數(shù)據(jù)并對所述故障事件的檢測數(shù)據(jù)進(jìn)行分析;根據(jù)分析結(jié)果對各故障事件的故障信息進(jìn)行統(tǒng)一存儲及修改。 所述獲取故障事件的檢測數(shù)據(jù)為通過函數(shù)調(diào)用方式和/或消息傳遞方式獲取。
所述故障信息包括故障事件類型碼、故障事件編號、故障事件結(jié)果數(shù)據(jù)、 錯誤碼、故障事件結(jié)果數(shù)據(jù)類型、屏蔽標(biāo)記。
設(shè)置故障事件的故障事件類型碼、故障事件編號、緩存次數(shù)閾值、故障事 件的錯誤碼取值范圍,
所述獲取故障事件的檢測數(shù)據(jù)之后包含步驟根據(jù)所述故障事件的故障事 件類型碼及故障事件編號,或僅根據(jù)所述故障事件的故障事件編號,判斷已緩 存的所述故障事件4企測數(shù)據(jù)的組數(shù)是否已達(dá)到所述故障事件的緩存次數(shù)閾值, 如果是,以所述獲取的檢測數(shù)據(jù)更新關(guān)于所述故障事件的緩存最早的一組檢測 數(shù)據(jù);否則,直接緩存所述收到的所述故障事件的檢測數(shù)據(jù);
所述對故障事件的檢測數(shù)據(jù)進(jìn)行分析為對故障事件的檢測數(shù)據(jù)進(jìn)行歷史數(shù) 據(jù)分析,具體為判斷緩存的所述故障事件的檢測數(shù)據(jù)是否一致,如果是,根 據(jù)緩存的檢測數(shù)據(jù)及設(shè)置的故障事件的錯誤碼取值范圍修改所述故障事件的故 障信息;否則,不能對所述故障事件的故障信息進(jìn)行修改。
所述以獲取的檢測數(shù)據(jù)更新緩存最早的一組檢測數(shù)據(jù)為以所述獲取的檢 測數(shù)據(jù)覆蓋關(guān)于所述故障事件的緩存最早的一組檢測數(shù)據(jù)、或通過移位操作來 實(shí)現(xiàn)。
設(shè)置故障事件的故障事件類型碼、故障事件編號、屏蔽標(biāo)記、相關(guān)故障事 件、故障事件與相關(guān)故障事件之間的相關(guān)屏蔽關(guān)系、故障事件的錯誤碼取值范 圍,
在獲取故障事件的檢測數(shù)據(jù)之前,還包含步驟
根據(jù)所述故障事件的故障事件類型碼及故障事件編號,或僅根據(jù)所述故障 事件的故障事件編號,查詢所述故障事件的相關(guān)故障事件及所述故障事件與相 關(guān)故障事件之間的相關(guān)屏蔽關(guān)系;
才艮據(jù)所述相關(guān)屏蔽關(guān)系判斷所述故障事件是否為主控故障事件,所述故障事件是主控故障事件,獲取所述主控故障事件的檢測數(shù)據(jù)并分析后,根據(jù)所述
主控故障事件的狀態(tài),修改與其對應(yīng)的受控故障事件的屏蔽標(biāo)記;
所述故障事件是受控故障事件,則判斷所述受控故障事件的屏蔽標(biāo)記是否為0,如果是,獲取所述受控故障事件的檢測數(shù)據(jù)并分析;否則,根據(jù)設(shè)置的故障事件的錯誤碼取值范圍修改所述受控故障事件的錯誤碼為未知區(qū)間的值,屏蔽4企測。
設(shè)置故障事件的故障事件類型碼、故障事件編號、相關(guān)故障事件、故障事件與相關(guān)故障事件之間的相關(guān)狀態(tài)關(guān)系、故障事件的錯誤碼取值范圍,
所述對故障事件的檢測數(shù)據(jù)進(jìn)行分析為對故障事件的檢測數(shù)據(jù)進(jìn)行相關(guān)性分析,具體為獲取故障事件的檢測數(shù)據(jù)之后,根據(jù)所述故障事件的故障事件類型碼及故障事件編號,或僅根據(jù)所述故障事件的故障事件編號,查詢所述故障事件的相關(guān)故障事件及所述故障事件與相關(guān)故障事件之間的相關(guān)狀態(tài)關(guān)系,然后根據(jù)所述故障事件的相關(guān)故障事件的狀態(tài)、故障事件與相關(guān)故障事件之間的相關(guān)狀態(tài)關(guān)系、以及設(shè)置的故障事件的錯誤碼取值范圍,對所述故障事件或其相關(guān)故障事件的故障信息進(jìn)行修改。
該方法還包才舌
告警單元周期性查詢存儲的故障事件的故障信息,判斷故障信息中的屏蔽標(biāo)記是否為0,如果是,不執(zhí)行任何操作,所述故障事件處于屏蔽狀態(tài);如果不是,將錯誤碼轉(zhuǎn)化為告警或恢復(fù)狀態(tài);
比較錯誤碼轉(zhuǎn)化后的狀態(tài)是否與所述故障事件最近一次上報的狀態(tài)一致,如果一致,不執(zhí)行任何操作;否則,根據(jù)所述故障事件的故障信息,發(fā)送告警消息或恢復(fù)消息到操作維護(hù)中心OMC網(wǎng)管,并更新自身存儲的所述故障事件最近一次上報的狀態(tài)。
該方法還包i舌
診斷單元根據(jù)OMC網(wǎng)管的診斷請求,讀取故障事件的故障信息,直接把故障事件類型碼、故障事件編號、錯誤碼、故障事件結(jié)果數(shù)據(jù)用消息的形式發(fā)
到OMC網(wǎng)管;
10OMC網(wǎng)管根據(jù)故障事件類型碼、故障事件編號給出對應(yīng)的故障描述,解析錯誤碼、故障事件結(jié)果數(shù)據(jù)得出診斷結(jié)果。
一種故障信息采集系統(tǒng),包括檢測數(shù)據(jù)獲取單元、檢測數(shù)據(jù)分析單元、故障信息存儲單元;其中,
所述檢測數(shù)據(jù)獲取單元,用于獲取故障事件的檢測數(shù)據(jù);
所述4企測數(shù)據(jù)分析單元,用于對所述檢測數(shù)據(jù)獲取單元獲取的檢測數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果對故障信息存儲單元存儲的故障信息進(jìn)行修改;
所述故障信息存儲單元,用于存儲各故障事件的故障信息。
所述故障信息采集系統(tǒng)還包括參數(shù)設(shè)置單元、歷史數(shù)據(jù)緩存單元;
所述參數(shù)設(shè)置單元,用于設(shè)置故障事件的故障事件類型碼、故障事件編號、緩存次數(shù)閾值、故障事件的錯誤碼取值范圍;
所述檢測數(shù)據(jù)分析單元,還用于根據(jù)參數(shù)設(shè)置單元設(shè)置的參數(shù),將獲取的檢測數(shù)據(jù)緩存至歷史數(shù)據(jù)緩存單元;以及在將獲取的檢測數(shù)據(jù)緩存至歷史數(shù)據(jù)緩存單元之后,判斷所述歷史數(shù)據(jù)緩存單元中緩存的故障事件的檢測數(shù)據(jù)是否一致,如果一致,根據(jù)參數(shù)設(shè)置單元設(shè)置的故障事件的錯誤碼取值范圍和獲取的檢測數(shù)據(jù),修改故障信息存儲單元中存儲的所述故障事件的故障信息;否貝寸,不對故障信息存儲單元中存儲的所述故障事件的故障信息進(jìn)行修改;
所述歷史數(shù)據(jù)緩存單元,用于在收到來自檢測數(shù)據(jù)分析單元的檢測數(shù)據(jù)之后,根據(jù)參數(shù)設(shè)置單元設(shè)置的參數(shù),判斷自身已緩存故障事件檢測數(shù)據(jù)的組數(shù)是否已達(dá)到所述故障事件的緩存次數(shù)閾值,如果是,以所述獲取的檢測數(shù)據(jù)更新關(guān)于所述故障事件的緩存最早的一組;險測數(shù)據(jù);否則,直接緩存所述收到的所述故障事件的檢測數(shù)據(jù)。
所述故障信息采集系統(tǒng)還包括參數(shù)設(shè)置單元,所述參數(shù)設(shè)置單元用于設(shè)置故障事件類型碼、故障事件編號、屏蔽標(biāo)記、故障事件的相關(guān)故障事件、與相關(guān)故障事件之間的相關(guān)屏蔽關(guān)系、故障事件的錯誤碼取值范圍,
所述檢測數(shù)據(jù)獲取單元在獲取故障事件的檢測數(shù)據(jù)前,還用于根據(jù)所述參數(shù)設(shè)置單元設(shè)置的相關(guān)屏蔽關(guān)系判斷所述故障事件是否為主控故障事件,所述故障事件是主控故障事件,則獲取所述主控故障事件的檢測數(shù)據(jù)并分析后,根據(jù)故障信息存儲單元中存儲的所述主控故障事件的狀態(tài)及參數(shù)設(shè)置單元設(shè)置的屏蔽關(guān)系,修改故障信息存儲單元中存儲的與其對應(yīng)的受控故障事件的屏蔽標(biāo)
記;
所述故障事件是受控故障事件,則檢測數(shù)據(jù)獲取單元判斷故障信息存儲單元中存儲的所述故障事件的屏蔽標(biāo)記是否為o,如果是,檢測數(shù)據(jù)獲取單元獲
取所述故障事件的檢測數(shù)據(jù);否則,檢測數(shù)據(jù)獲取單元根據(jù)參數(shù)設(shè)置單元設(shè)置的參數(shù),修改故障信息存儲單元中所述受控故障事件的錯誤碼為未知區(qū)間的值,屏蔽檢測。
所述故障信息采集系統(tǒng)還包括參數(shù)設(shè)置單元,所述參數(shù)設(shè)置單元用于設(shè)置故障事件類型碼、故障事件編號、故障事件的相關(guān)故障事件、與相關(guān)故障事件之間的相關(guān)狀態(tài)關(guān)系、故障事件的錯誤碼耳又值范圍,
所述檢測數(shù)據(jù)分析單元還用于根據(jù)參數(shù)設(shè)置單元設(shè)置的參數(shù),對故障信息存儲單元中存儲的所述故障事件或其相關(guān)故障事件的故障信息進(jìn)行修改。
該系統(tǒng)還包括告警單元,用于周期性查詢故障信息存儲單元中存儲的故障事件的故障信息,判斷故障信息中的屏蔽標(biāo)記是否為0,如果是,不執(zhí)行任何操作,所述故障事件處于屏蔽狀態(tài);如果不是,將錯誤碼轉(zhuǎn)化為告警或恢復(fù)狀態(tài),并比較錯誤碼轉(zhuǎn)化后的狀態(tài)是否與其中存儲的所述故障事件最近一次上報的狀態(tài)一致,如果一致,不執(zhí)行任何操作;否則,根據(jù)所述故障事件的故障信息,發(fā)送告警消息或恢復(fù)消息到OMC網(wǎng)管,并更新自身存儲的所述故障事件最近一次上報的狀態(tài)。
該系統(tǒng)還包括診斷單元,用于響應(yīng)OMC網(wǎng)管的診斷請求,讀取故障信息存儲單元中存儲的故障事件的故障信息,直接把故障事件類型碼、故障事件編號、錯誤碼、故障事件結(jié)果數(shù)據(jù)用消息的形式發(fā)到OMC網(wǎng)管。
本發(fā)明故障信息采集方法及系統(tǒng),對各種各樣、接口各異的故障事件的檢測數(shù)據(jù)進(jìn)行統(tǒng)一獲取,并根據(jù)歷史數(shù)據(jù)和/或故障事件的相關(guān)狀態(tài)對獲取的檢測數(shù)據(jù)進(jìn)行分析,再將分析得到的故障信息統(tǒng)一進(jìn)行存儲及維護(hù),告警單元和診斷單元需要獲取故障信息時,直接讀取存儲的故障信息即可,不需要通過對檢測數(shù)據(jù)進(jìn)行分析來獲取故障信息。告警單元在掃描故障信息時,可以將故障事件之前上報的故障狀態(tài)與其當(dāng)前的故障狀態(tài)進(jìn)行比較,如果故障狀態(tài)未發(fā)生變化,則不上報告警消息或恢復(fù)消息,所以,本發(fā)明能夠避免重復(fù)上報的問題,節(jié)約系統(tǒng)資源;
并且,本發(fā)明中,告警單元和診斷單元不需要分別對檢測數(shù)據(jù)進(jìn)行釆集并分析,而是直接讀取已分析好的故障信息,從而能很大程度上避免告警消息或
恢復(fù)消息與診斷結(jié)果有偏差的情況,有利于提高系統(tǒng)一致性;
另外,需要對故障事件進(jìn)行屏蔽等操作時,本發(fā)明不需要在告警單元和診斷單元分別進(jìn)行參數(shù)修改,而只需要修改一次參數(shù),所以,本發(fā)明能夠簡化操作;
本發(fā)明還根據(jù)歷史數(shù)據(jù)和/或故障事件的相關(guān)狀態(tài)進(jìn)行故障信息分析,能夠保障故障信息的穩(wěn)定性、準(zhǔn)確性,從而進(jìn)一步提高系統(tǒng)穩(wěn)定性。
圖1為本發(fā)明故障信息采集方法流程圖2為本發(fā)明通過進(jìn)行歷史數(shù)據(jù)分析修改故障事件的故障信息的實(shí)現(xiàn)方法流程圖3為本發(fā)明故障信息采集系統(tǒng)結(jié)構(gòu)圖4為本發(fā)明實(shí)施例1 CPU電源狀態(tài)的故障信息采集方法流程圖;圖5為本發(fā)明實(shí)施例2收到光口相關(guān)數(shù)據(jù)后,根據(jù)故障事件的相關(guān)性修改故障信息的實(shí)現(xiàn)流程圖6為本發(fā)明實(shí)施例3的相關(guān)性屏蔽實(shí)現(xiàn)流程圖。
具體實(shí)施例方式
本發(fā)明的基本思想是對各種各樣、接口各異的故障事件的檢測數(shù)據(jù)進(jìn)行統(tǒng)一獲取,并根據(jù)歷史數(shù)據(jù)和/或故障事件的相關(guān)狀態(tài)對獲取的檢測數(shù)據(jù)進(jìn)行分析,再將分析得到的故障信息統(tǒng)一進(jìn)行存儲及維護(hù),告警單元和診斷單元需要獲取故障信息時,直接讀取存儲的故障信息即可,不需要通過對檢測數(shù)據(jù)進(jìn)行分析來獲取故障信息。
本發(fā)明將各故障事件的故障信息按照規(guī)范統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲,并負(fù)責(zé)對故障事件的檢測數(shù)據(jù)進(jìn)行收集,以及根據(jù)對檢測數(shù)據(jù)的歷史數(shù)據(jù)分析和/或相關(guān)性分析,修改存儲的故障事件的故障信息,以供告警單元或診斷單元查
詢。這里,按照規(guī)范統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)存儲的故障信息一般包括參數(shù)故障事件
類型碼、故障事件編號、故障事件結(jié)果數(shù)據(jù)、錯誤碼、故障事件結(jié)果數(shù)據(jù)類型、
屏蔽標(biāo)記。
其中,故障事件類型碼標(biāo)識故障事件類型,如軟件故障、硬件故障、配置錯誤、預(yù)熱錯誤、運(yùn)行錯誤等。故障事件編號用于標(biāo)識故障事件。
對故障事件編號時,可以對具有相同故障事件類型碼、即屬于同一故障事件類型的故障事件進(jìn)行編號,也可以對各種類型的故障事件統(tǒng)一進(jìn)行編號。對屬于同一故障事件類型內(nèi)的故障事件進(jìn)行編號時,故障事件類型碼和故障事件
編號一起唯一確定一個故障事件;對各種類型的故障事件統(tǒng)一進(jìn)行編號時,故
障事件編號唯一確定一個故障事件。本文中的描述均基于故障事件類型和故障
事件編號一起唯一確定一個故障事件的情況。
故障事件結(jié)果數(shù)據(jù)指明故障事件的細(xì)節(jié)信息, 一般為具體的檢測數(shù)據(jù)。
錯誤碼標(biāo)識當(dāng)前故障事件的狀態(tài),以及表明故障事件結(jié)果數(shù)據(jù)的解析方法。錯誤碼用于表示故障事件的狀態(tài),其取值可以多種多樣, 一般分為正常、
異常、錯誤、未知這4個區(qū)間,異常區(qū)間表示故障事件的故障狀態(tài)由人為操作造成,如配置錯誤等,錯誤區(qū)間表示故障事件的故障狀態(tài)由硬件本身造成,未知區(qū)間表示對故障事件的檢測被屏蔽,或獲取的是一個無法斷定是否為故障的狀態(tài)數(shù)據(jù),錯誤碼在異常區(qū)間或錯誤區(qū)間,表明需要告警。
在實(shí)際應(yīng)用中,不同的故障事件,其在正常、異常、錯誤、未知這四個區(qū)間的具體取值不一定相同,例如,正常區(qū)間內(nèi)的值為1一10,故障事件A對應(yīng)正常區(qū)間的取值為1、故障事件B對應(yīng)正常區(qū)間的取值則可能為8,這是由于
采集的檢測數(shù)據(jù)可能會是真實(shí)運(yùn)行數(shù)據(jù)經(jīng)過一定運(yùn)算后的結(jié)果,例如放大若干倍、縮小若干倍等運(yùn)算,具體經(jīng)過什么運(yùn)算就可以通過錯誤碼進(jìn)行區(qū)分,例如,錯誤碼取正常區(qū)間內(nèi)的值為1時,表明解析故障事件結(jié)果數(shù)據(jù)時,需要對其進(jìn)
行乘十運(yùn)算,誤碼取正常區(qū)間內(nèi)的值為2時,表明解析故障事件結(jié)果數(shù)據(jù)時,需要對其進(jìn)行除10運(yùn)算,不過,每一故障事件在每一區(qū)間的取值是唯一的,是預(yù)先設(shè)置好的。
故障事件結(jié)果數(shù)據(jù)類型表明故障事件結(jié)果數(shù)據(jù)是數(shù)值還是字符。屏蔽標(biāo)記用于標(biāo)識是否獲取故障事件的檢測數(shù)據(jù),初始值一般取0。下面結(jié)合附圖對技術(shù)方案的實(shí)施作進(jìn)一步的詳細(xì)描述。圖1為本發(fā)明故障信息采集方法流程圖,如圖1所示,本發(fā)明故障信息采集方法一般包括以下步驟
步驟ll:設(shè)置故障信息采集參數(shù)。
對于需要進(jìn)行歷史數(shù)據(jù)分析的故障事件,所述故障信息采集參數(shù)一般包括故障事件類型碼、故障事件編號、屏蔽標(biāo)記、故障事件的緩存次數(shù)閾值、故障事件的錯誤碼取值范圍等。
對于需要進(jìn)行相關(guān)性分析的故障事件,所述故障信息采集參數(shù)一般包括故障事件類型碼、故障事件編號、屏蔽標(biāo)記、相關(guān)故障事件、故障事件與相關(guān)故障事件之間的相關(guān)關(guān)系、故障事件的錯誤碼取值范圍等。
這里,屏蔽標(biāo)記的初始值一般為零;故障事件與相關(guān)故障事件之間的相關(guān)關(guān)系指如何根據(jù)相關(guān)故障事件的狀態(tài)調(diào)整自身狀態(tài),或如何根據(jù)自身狀態(tài)調(diào)整相關(guān)故障事件的狀態(tài),可以是相關(guān)性屏蔽關(guān)系和/或相關(guān)性狀態(tài)關(guān)系,相關(guān)屏蔽關(guān)系一般涉及屏蔽標(biāo)識及錯誤碼的修改,相關(guān)性態(tài)關(guān)系一般涉及錯誤碼的修改。
步驟12:獲取故障事件的檢測數(shù)據(jù)。
這里,可以通過函數(shù)調(diào)用方式和/或消息傳遞方式獲取來自外部故障檢測設(shè)備的檢測數(shù)據(jù)。其中,函數(shù)調(diào)用方式為周期調(diào)用,對于不同的故障事件,可以設(shè)定不同的周期,消息傳遞方式則只須等待接收來自外部故障檢測設(shè)備的消息以獲取檢測數(shù)據(jù)。
一般情況下,對硬件故障、環(huán)境條件差、預(yù)熱或運(yùn)行錯誤等故障事件應(yīng)用函數(shù)調(diào)用方式,對軟件故障、配置錯誤等故障事件應(yīng)用消息傳遞方式。
在步驟11中,故障事件與相關(guān)故障事件之間的相關(guān)關(guān)系為相關(guān)屏蔽關(guān)系時,具體的,按照故障事件的狀態(tài)控制其他故障事件的屏蔽標(biāo)記或是自身的屏蔽標(biāo)記受其他故障事件狀態(tài)的控制,可以將故障事件區(qū)分為主控故障事件和受控故障事件,多個主控故障事件屏蔽一個受控故障事件時,只要有一個主控故障事件是故障狀態(tài)(即錯誤碼取錯誤區(qū)間或異常區(qū)間的值),就屏蔽受控故障事件的檢測,及不獲取受控故障事件的檢測數(shù)據(jù),具體通過修改受控故障事件的屏蔽標(biāo)記為一非0的數(shù)來實(shí)現(xiàn),除非所有主控故障事件處于正常狀態(tài)(即錯誤碼取正常區(qū)間的值),才對受控故障事件進(jìn)行檢測,具體通過修改受控故障事件的屏蔽標(biāo)記為0來實(shí)現(xiàn)。
對于主控故障事件,對其進(jìn)行檢測并分析后,需要根據(jù)所述主控故障事件的狀態(tài),修改與其對應(yīng)的受控故障事件的屏蔽標(biāo)記。
對于受控故障事件,如果其屏蔽標(biāo)記為0,則獲取其檢測數(shù)據(jù)并分析,如
果其屏蔽標(biāo)記不為o,則修改所述受控故障事件的錯誤碼為未知區(qū)間的值,屏
蔽檢測。
步驟13:判斷所述故障事件是否需要進(jìn)行歷史數(shù)據(jù)分析,如果是,執(zhí)行步驟14;否則,執(zhí)行步驟15。
對于穩(wěn)定性要求很高的故障事件, 一般會要求連續(xù)幾次采集的結(jié)果都是故障狀態(tài)或都是正常狀態(tài)的時候,才更新其故障信息中的錯誤碼的值為異常區(qū)間、錯誤區(qū)間或正常區(qū)間的值。哪些故障事件要保存歷史數(shù)據(jù),緩存多少次,都是約定好的(具體對應(yīng)步驟11攝制的故障事件的緩存次數(shù)閾值), 一旦確定,在系統(tǒng)運(yùn)行的時候是不可以改的。
這里,判斷所述故障事件是否需要進(jìn)行歷史數(shù)據(jù)分析就是根據(jù)故障事件類型和故障事件編號,查找其是否設(shè)置了緩存次數(shù)閾值。
步驟14:將本次收到的檢測數(shù)據(jù)與所述故障事件的歷史數(shù)據(jù)相結(jié)合進(jìn)行分析,并修改所述故障事件的故障信息,之后轉(zhuǎn)到步驟16。
圖2為本發(fā)明通過進(jìn)行歷史數(shù)據(jù)分析修改故障事件的故障信息的實(shí)現(xiàn)方法流程圖,如圖2所示,本發(fā)明通過進(jìn)行歷史數(shù)據(jù)分析修改故障事件的故障信息一般包括以下步驟
步驟21:判斷所述故障事件的緩存次數(shù)是否已達(dá)到所述故障事件的緩存次數(shù)閾值,如果是,執(zhí)行步驟22;否則,執(zhí)行步驟26。
步驟22:以所述收到的^r測數(shù)據(jù)更新關(guān)于所述故障事件的緩存最早的一組檢測數(shù)據(jù)。
這里,檢測數(shù)據(jù)一般以先進(jìn)先出的方式緩存在歷史數(shù)據(jù)緩存區(qū)中,系統(tǒng)啟動時,會將歷史數(shù)據(jù)緩存區(qū)清零。
以先進(jìn)先出的方式緩存4企測數(shù)據(jù),可以有多種實(shí)現(xiàn)方法,例如,可以通過移位操作來實(shí)現(xiàn),也可以以所述收到的檢測數(shù)據(jù)覆蓋關(guān)于所述故障事件的緩存最早的 一組檢測數(shù)據(jù)來實(shí)現(xiàn)。
例如,步驟11中設(shè)置故障事件A的緩存次數(shù)閾值為3,那么,第一至三次收到故障事件A的檢測數(shù)據(jù)時,分別保存收到的檢測數(shù)據(jù),并分別記錄三次保存位置為故障事件A的第一保存位置AG、第二保存位置A,、第三保存位置A2,則第四次收到故障事件A的4全測數(shù)據(jù)時,以其覆蓋緩存最早的、保存在故障事件A的第一保存位置Ao的檢測數(shù)據(jù);第六次收到故障事件A的檢測數(shù)據(jù)時,以其覆蓋緩存最早的、保存在故障事件A的第三保存位置A2的檢測數(shù)據(jù);第七次收到故障事件A的檢測數(shù)據(jù)時,以其覆蓋緩存最早的、保存在故障事件A的第一保存位置Ao的檢測數(shù)據(jù)……,如此循環(huán)。上述存儲方式具體可以通過公式I=(I++)%N實(shí)現(xiàn),其中,I為故障事件當(dāng)前最新的保存位置的下標(biāo),N為故障事件的緩存次數(shù)閾值,這里,保存位置I+1的下標(biāo)為I。
步驟23:判斷緩存的所述故障事件的檢測數(shù)據(jù)是否一致,如果是,執(zhí)行步驟24;否則,步驟14流程結(jié)束。
這里,看緩存的檢測數(shù)據(jù)是否一致,就是看檢測數(shù)據(jù)是否穩(wěn)定。
步驟24:根據(jù)緩存的檢測數(shù)據(jù)確定是否修改所述故障事件的故障信息,如果是,執(zhí)行步驟25;否則,步驟14流程結(jié)束。
這里,如果檢測數(shù)據(jù)與故障信息中錯誤碼的取值對應(yīng),則不作修改,如果檢測數(shù)據(jù)與故障信息中錯誤碼的取值不對應(yīng),則根據(jù)檢測數(shù)據(jù)修改錯誤碼,并根據(jù)歷史數(shù)據(jù)緩存區(qū)緩存的檢測數(shù)據(jù)修改故障信息中的故障事件結(jié)果數(shù)據(jù)。
步驟25:根據(jù)緩存的檢測數(shù)據(jù)修改所述故障事件的故障信息,步驟14流程結(jié)束。
步驟26:直接緩存所述收到的所述故障事件的檢測數(shù)據(jù),步驟14流程結(jié)束。
這里,保存收到的所述故障事件的檢測數(shù)據(jù)時,還需要根據(jù)已緩存所述故障事件檢測數(shù)據(jù)的組數(shù)n,記錄保存所述收到的檢測數(shù)據(jù)的保存位置為所述故障事件的第n+l個保存位置。
步驟15:根據(jù)所述故障事件的檢測數(shù)據(jù),修改所述故障事件的故障信息。
這里,修改所述故障事件的故障信息一般包括修改所述故障事件的錯誤碼和故障事件結(jié)果數(shù)據(jù),第一次存儲故障事件的故障信息時,還需要修改故障事件的故障事件結(jié)果It據(jù)類型。
步驟16:判斷是否需要對所述故障事件進(jìn)行相關(guān)性分析,如果是,執(zhí)行步驟17,否則,流程結(jié)束。
故障事件錯誤碼的取值并不是單單依賴于所述故障事件的檢測數(shù)據(jù),同時還需要考慮其他因素,綜合判斷得出所述故障事件的錯誤碼的數(shù)值。對于有原因結(jié)果對應(yīng)關(guān)系或必然導(dǎo)致關(guān)系的兩個故障事件,前一個出現(xiàn)問題的時候,后一個一定是異常的,所以,可以根據(jù)前一個故障事件的故障信息,對后一個故障事件的故障信息進(jìn)行修改,另外,對于某些故障事件,如果相關(guān)資源沒有配置,也是不需要進(jìn)行檢測的,例如某個單板沒有配置,就沒有必要對單板CPU的通電狀態(tài)進(jìn)行檢測,哪些故障事件要進(jìn)行相關(guān)處理,如何相關(guān),是預(yù)先約定好的, 一旦確定,在系統(tǒng)運(yùn)行的時候是不可以改的。即這里所述的相關(guān)狀態(tài)可以是配置情況,也可以是相關(guān)故障事件的狀態(tài)。
故障事件的相關(guān)故障事件可能有一個,也可能有多個,根據(jù)故障事件的相關(guān)性,故障事件的故障信息可以被動地受其相關(guān)故障事件的控制,也可以根據(jù)自己的故障信息去主動去修改其相關(guān)故障事件的故障信息(一般為錯誤碼)。
判斷是否需要對所述故障事件進(jìn)行相關(guān)性分析即根據(jù)所述故障事件的故障事件類型碼和故障事件編號進(jìn)行參數(shù)查詢,看是否設(shè)置了所述故障事件的相關(guān)故障事件及與相關(guān)故障事件之間的相關(guān)關(guān)系,以及所述相關(guān)關(guān)系是否為相關(guān)狀態(tài)關(guān)系。
步驟17:根據(jù)所述故障事件的相關(guān)狀態(tài),修改故障事件的故障信息,流程結(jié)束。
這里,具體根據(jù)設(shè)置的所述故障事件的相關(guān)故障事件及與相關(guān)故障事件之間的相關(guān)狀態(tài)關(guān)系,對所述故障事件或其相關(guān)故障事件的故障信息進(jìn)行修改。修改的故障信息 一般為錯誤碼。
告警單元周期性掃描存儲的故障事件的故障信息,以上報告警消息或恢復(fù)消息,診斷單元根據(jù)OMC網(wǎng)管的診斷請求,掃描故障事件的故障信息,以上報診斷消息。
告警單元從公共數(shù)據(jù)層讀取故障事件的故障信息后,包括步驟
判斷故障信息中的屏蔽標(biāo)記是否為0,如果是,不執(zhí)行任何操作,所述故障事件處于屏蔽狀態(tài);如果不是,將錯誤碼轉(zhuǎn)化為告警或恢復(fù)狀態(tài);
比較4昔誤碼轉(zhuǎn)化后的狀態(tài)是否與存儲的所述故障事件的最近一次上報的狀態(tài)是否一致,如果一致,不執(zhí)行任何操作;否則,將故障信息中的故障事件類型碼、故障事件編號轉(zhuǎn)化為告警碼、告警原因碼;將錯誤碼轉(zhuǎn)化為告警或恢復(fù)狀態(tài);將故障事件結(jié)果數(shù)據(jù)轉(zhuǎn)化為告警附加信息,最后發(fā)送攜帶告警碼、告警原因碼、告警或恢復(fù)狀態(tài)、告警附加信息的告警消息或恢復(fù)消息到OMC網(wǎng)管,并更新所述故障事件的最近一次上報的狀態(tài)。
診斷單元從公共數(shù)據(jù)層讀取故障信息,產(chǎn)生診斷測試結(jié)果時,直接把故障事件類型碼、故障事件編號、錯誤碼、故障事件結(jié)果數(shù)據(jù)用消息的形式發(fā)到()MC網(wǎng)管,由OMC網(wǎng)管根據(jù)故障事件類型碼、故障事件編號給出相應(yīng)的故障描述,解析錯誤碼、故障事件結(jié)果數(shù)據(jù)得出診斷結(jié)果。這里,診斷單元也可以將故障事件結(jié)果數(shù)據(jù)替換為歷史數(shù)據(jù)緩存區(qū)中的多組檢測數(shù)據(jù)。
需要說明的是,進(jìn)行故障信息分析時,歷史數(shù)據(jù)分析和相關(guān)性分析可以同時進(jìn)行,也可以擇一進(jìn)行。
圖3為本發(fā)明故障信息采集系統(tǒng)結(jié)構(gòu)圖,如圖3所示,本發(fā)明故障信息采集系統(tǒng)包括檢測數(shù)據(jù)獲取單元31、檢測數(shù)據(jù)分析單元32、故障信息存儲單元33;其中,
檢測數(shù)據(jù)獲取單元31用于獲取故障事件的檢測數(shù)據(jù)。
這里,可以通過函數(shù)調(diào)用方式和/或消息傳遞方式獲耳又來自外部故障;險測設(shè)備的檢測數(shù)據(jù)。其中,函數(shù)調(diào)用方式為周期調(diào)用,對于不同的故障事件,可以設(shè)定不同的周期,消息傳遞方式則只須等待接收來自外部故障檢測設(shè)備的消息,以獲取檢測數(shù)據(jù)。
檢測數(shù)據(jù)分析單元32用于對所述檢測數(shù)據(jù)獲取單元31獲取的檢測數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果對故障信息存儲單元33存儲的故障信息進(jìn)行修改。故障信息存儲單元33用于存儲各故障事件的故障信息。故障信息存儲單元33中,按照規(guī)范統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)對各故障事件進(jìn)行存儲,這里,按照規(guī)范統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)存儲的故障信息一般包括參數(shù)故障事件類型碼、故障事件編號、故障事件結(jié)果數(shù)據(jù)、錯誤碼、故障事件結(jié)果數(shù)據(jù)類型、屏蔽標(biāo)記。
所述故障信息采集系統(tǒng)還包括參數(shù)設(shè)置單元34、歷史數(shù)據(jù)緩存單元35,參數(shù)設(shè)置單元34,用于設(shè)置故障事件的故障事件類型碼、故障事件編號、緩存次數(shù)閾值、故障事件的錯誤碼取值范圍,這里,
檢測數(shù)據(jù)分析單元32,還用于根據(jù)參數(shù)設(shè)置單元34設(shè)置的參數(shù),將獲取的檢測數(shù)據(jù)緩存至歷史數(shù)據(jù)緩存單元35;以及在將獲取的檢測數(shù)據(jù)緩存至歷史數(shù)據(jù)緩存單元35之后,判斷所述歷史數(shù)據(jù)緩存單元35中緩存的故障事件的檢測數(shù)據(jù)是否一致,如果一致,根據(jù)參數(shù)設(shè)置單元34設(shè)置的故障事件的錯誤碼取值范圍和獲取的檢測數(shù)據(jù),修改故障信息存儲單元33中存儲的所述故障事件的故障信息;否則,不對故障信息存儲單元33中存儲的所述故障事件的故障信息進(jìn)行修改。
歷史數(shù)據(jù)緩存單元35,還用于在收到來自4企測數(shù)據(jù)分析單元32的檢測數(shù)據(jù)之后,根據(jù)參數(shù)設(shè)置單元34設(shè)置的參數(shù),判斷自身已緩存故障事件檢測數(shù)據(jù)的組數(shù)是否已達(dá)到所述故障事件的緩存次數(shù)閾值,如果是,以所述獲取的檢測數(shù)據(jù)更新關(guān)于所述故障事件的緩存最早的一組^r測數(shù)據(jù);否則,直接緩存所述收到的所述故障事件的檢測數(shù)據(jù),具體實(shí)現(xiàn)參見步驟22中的描述。
參數(shù)設(shè)置單元34還可以用于設(shè)置故障事件類型碼、故障事件編號、屏蔽標(biāo)記、故障事件的相關(guān)故障事件、與相關(guān)故障事件之間的相關(guān)屏蔽關(guān)系、故障事件的錯誤碼取值范圍,這里,
所述檢測數(shù)據(jù)獲取單元31在獲取故障事件的檢測數(shù)據(jù)前,還用于根據(jù)參數(shù)設(shè)置單元34設(shè)置的相關(guān)屏蔽關(guān)系判斷所述故障事件是否為主控故障事件,所述故障事件是主控故障事件,獲取所述主控故障事件的;^測數(shù)據(jù)并分析后,根據(jù)
故障信息存儲單元33中存儲的所述主控故障事件的狀態(tài)及參數(shù)設(shè)置單元34設(shè)置的參數(shù),修改故障信息存儲單元33中存儲的與其對應(yīng)的受控故障事件的屏蔽標(biāo)記;
所述故障事件是受控故障事件,則檢測數(shù)據(jù)獲取單元31判斷故障信息存儲單元33中存儲的所述故障事件的屏蔽標(biāo)記是否為0,如果是,檢測數(shù)據(jù)獲取單元31獲取所述故障事件的檢測數(shù)據(jù);否則,檢測數(shù)據(jù)獲取單元31根據(jù)參數(shù)設(shè)置單元34設(shè)置的參數(shù),修改故障信息存儲單元33中所述受控故障事件的錯誤碼為未知區(qū)間的值,屏蔽檢測。
參數(shù)設(shè)置單元34還可以用于設(shè)置故障事件類型碼、故障事件編號、故障事件的相關(guān)故障事件、與相關(guān)故障事件之間的相關(guān)狀態(tài)關(guān)系、故障事件的錯誤碼取值范圍,這里,
所述;f企測數(shù)據(jù)分析單元32還用于根據(jù)參數(shù)^沒置單元34設(shè)置的參數(shù),對故障信息存儲單元33中存儲的所述故障事件或其相關(guān)故障事件的故障信息進(jìn)行修改。
另外,本發(fā)明故障信息釆集系統(tǒng)還包括告警單元36,用于周期性查詢故障信息存儲單元33中存儲的故障事件的故障信息,判斷故障信息中的屏蔽標(biāo)記是
否為0,如果是,不執(zhí)行任何操作,所述故障事件處于屏蔽狀態(tài);如果不是,
將錯誤碼轉(zhuǎn)化為告警或恢復(fù)狀態(tài),并比較錯誤碼轉(zhuǎn)化后的狀態(tài)是否與其中存儲
的所述故障事件最近一次上報的狀態(tài)一致,如果一致,不執(zhí)行任何操作;否貝'J,根據(jù)所述故障事件的故障信息,發(fā)送告警消息或恢復(fù)消息到OMC網(wǎng)管,并更新自身存儲的所述故障事件最近一次上才艮的狀態(tài)。
本發(fā)明故障信息釆集系統(tǒng)還包括診斷單元37,用于響應(yīng)OMC網(wǎng)管的診斷請求,讀取故障信息存儲單元33中存儲的故障事件的故障信息,直接把故障事件類型碼、故障事件編號、錯誤碼、故障事件結(jié)果數(shù)據(jù)用消息的形式發(fā)到OMC網(wǎng)管。
這里,歷史數(shù)據(jù)緩存單元35中存儲的數(shù)據(jù)也可供診斷單元使用。實(shí)施例1
以本實(shí)施例中,故障事件為CPU電源狀態(tài),該故障事件的故障信息需要通過歷史數(shù)據(jù)分析獲取,預(yù)設(shè)的緩存次數(shù)閾值為3,且該故障事件沒有相關(guān)性。
圖4為本發(fā)明實(shí)施例1 CPU電源狀態(tài)的故障信息采集方法流程圖,如圖4所示,本發(fā)明實(shí)施例l中,采集CPU電源狀態(tài)的故障信息包括以下步驟;
步驟41:接收CPU電源狀態(tài)的檢測數(shù)據(jù)。
這里,CPU電源狀態(tài)的檢測數(shù)據(jù)是一個數(shù)值,表明CPU是否通電。步驟42:判斷已存儲的關(guān)于CPU電源狀態(tài)的檢測數(shù)據(jù)是否已達(dá)到3組,
如果是,執(zhí)行步驟43;否則,轉(zhuǎn)到步驟46。
步驟43:以所述接收的CPU電源狀態(tài)的檢測數(shù)據(jù)覆蓋已保存的檢測數(shù)據(jù)
中最早的檢測數(shù)據(jù)。
步驟44:判斷保存的3組關(guān)于CPU電源狀態(tài)的檢測數(shù)據(jù)是否一致,如果
是,執(zhí)行步驟45;否則,流程結(jié)束。
步驟45:根據(jù)判斷結(jié)果,修改CPU電源狀態(tài)的故障信息,流程結(jié)束。這里,根據(jù)檢測數(shù)據(jù)修改在當(dāng)前故障事件的錯誤碼的值為正常、異常、錯
誤、未知中的哪一種,并從相應(yīng)區(qū)間中取出對應(yīng)的值作為當(dāng)前故障事件中錯誤
22碼的值。
步驟46:直接緩存所述接收的CPU電源狀態(tài)的檢測數(shù)據(jù),流程結(jié)束。這里,緩存所述接收的CPU電源狀態(tài)的檢測數(shù)據(jù)后,還需要記錄當(dāng)前存儲位置為CPU電源狀態(tài)的第幾個存儲位置。
實(shí)施例2
本實(shí)施例中,收到的檢測數(shù)據(jù)為光口相關(guān)數(shù)據(jù),相關(guān)的故障事件為光口在位狀態(tài)、光口有光檢測、光口反向幀失鎖檢測,上述故障事件的相關(guān)關(guān)系為如果光口不在位,無需檢測光口有無光,以及是否存在光口反向幀失鎖,如果光口無光,無需檢測是否存在光口反向幀失鎖。主要包括以下幾個步驟
圖5為本發(fā)明實(shí)施例2收到光口相關(guān)數(shù)據(jù)后,根據(jù)故障事件的相關(guān)性修改故障信息的實(shí)現(xiàn)流程圖,如圖5所示,收到光口相關(guān)數(shù)據(jù)后,根據(jù)故障事件的相關(guān)性修改故障信息包括步驟
步驟501:接收光口相關(guān)的檢測數(shù)據(jù)。
這里,光口相關(guān)的數(shù)據(jù)攜帶光口是否在位、光口有無光、是否存在光口反向幀失鎖等數(shù)據(jù)。
步驟502:根據(jù)接收到的檢測數(shù)據(jù),判斷光口是否在位,如果是執(zhí)行步驟
503;否則,轉(zhuǎn)到步驟508。
步驟503:修改光口在位狀態(tài)的錯誤碼為正常區(qū)間的值。
步驟504:根據(jù)接收到的檢測數(shù)據(jù),判斷光口是否有光,如果是,執(zhí)行步
驟505;否則,轉(zhuǎn)到步驟509。
步驟505:修改光口有光檢測的錯誤碼為正常區(qū)間的值。
步驟506:根據(jù)接收到的檢測數(shù)據(jù),判斷光口反向幀是否不處于失鎖狀態(tài),
如果是,執(zhí)行步驟507;否則,轉(zhuǎn)到步驟510。
步驟507:修改光口反向幀失鎖檢測的錯誤碼為正常區(qū)間的值,流程結(jié)束。步驟508:修改光口在位狀態(tài)的錯誤碼為異常區(qū)間的值,并修改與其相關(guān)
的故障事件光口有光檢測、光口反向幀失鎖檢測的錯誤碼為未知區(qū)間的值,流程結(jié)束。
光口不在位是需要告警的,所以,故障事件光口在位狀態(tài)錯誤碼修改為異常區(qū)間中的某個數(shù)。
光口不在位的時候不需要檢測光口是否有光,所以,故障事件光口有光檢測的錯誤碼修改為未知區(qū)間中的某個數(shù)。
光口不在位的時候不需要檢測光口反向幀失鎖,所以,故障事件光口反向幀失鎖才企測的錯誤碼修改為未知區(qū)間中的某個數(shù)。
步驟509:修改光口有光檢測的錯誤碼為異常區(qū)間的值,并修改與其相關(guān)
的故障事件光口反向幀失鎖檢測的錯誤碼為未知區(qū)間的值,流程結(jié)束。
光口無光是需要告警的,所以,故障事件光口有光^r測的錯誤碼修改為異常區(qū)間中的某個數(shù)。
光口無光的時候不需要檢測光口反向幀失鎖,所以,故障事件光口反向幀失鎖檢測的錯誤碼^修改為未知區(qū)間中的某個數(shù)。
步驟510:修改光口反向幀失鎖檢測的錯誤碼為異常區(qū)間的值,流程結(jié)束。
因?yàn)楣饪诜聪驇фi是需要告警的,所以,故障事件光口反向幀失鎖檢測的錯誤碼修改為異常區(qū)間中的某個數(shù)。
實(shí)施例3
本實(shí)施例關(guān)于多對一的相關(guān)性屏蔽,即多個主控故障事件屏蔽一個受控故障事件,只要有一個主控故障事件是故障狀態(tài),就屏蔽受控故障事件的檢測??梢酝ㄟ^對屏蔽標(biāo)記的處理來達(dá)到相關(guān)性屏蔽目的。
圖6為本發(fā)明實(shí)施例3的相關(guān)性屏蔽實(shí)現(xiàn)流程圖,如圖6所示,本發(fā)明實(shí)施例3的相關(guān)性屏蔽步驟如下
步驟601:接收故障事件的檢測數(shù)據(jù)。
步驟602:判斷所述故障事件是否為主控故障事件,如果是,執(zhí)行步驟603;否則,轉(zhuǎn)到步驟608。
步驟603:對所述主控故障事件進(jìn)行檢測,并根據(jù)檢測數(shù)據(jù)修改錯誤碼的值。
步驟604:判斷主控故障事件是否處于故障狀態(tài),如果是,執(zhí)行步驟605;否則,轉(zhuǎn)到步驟606。
步驟605:設(shè)置所述主控故障事件對應(yīng)的受控故障事件的屏蔽標(biāo)記值,流程結(jié)束。
這里,具體設(shè)置受控故障事件的屏蔽標(biāo)記值為N,其中,N為與受控故障事件相關(guān)的主控故障事件數(shù)目。
步驟606:判斷其受控故障事件的屏蔽標(biāo)記值是否為0,如果是,流程結(jié)束;否則,執(zhí)行步驟607。
步驟607:將受控故障事件的屏蔽標(biāo)記值減1,流程結(jié)束。
這里,將受控故障事件的屏蔽標(biāo)記值減1,是為了以后檢測所述受控單元的時候,能夠根據(jù)這個值判斷是否屏蔽^^測,由于是N對一的屏蔽,任何一個主控項(xiàng)就可以把屏蔽標(biāo)記設(shè)為N,要所有主控項(xiàng)都不是故障狀態(tài)的時候,屏蔽標(biāo)記才能減為0,受控故障事件的檢測才是不被屏蔽的。
步驟608:判斷所述受控故障事件的屏蔽標(biāo)記值是否為0,如果是,執(zhí)行步驟609;否則,轉(zhuǎn)到步驟610。
步驟609:對所述受控故障事件進(jìn)行檢測,并根據(jù)檢測數(shù)據(jù)修改錯誤碼的值,流程結(jié)束。
步驟610:屏蔽檢測,將所述受控故障事件的錯誤碼的值修改為未知區(qū)間的值,流程結(jié)束。
以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。
權(quán)利要求
1、一種故障信息采集方法,其特征在于,該方法包括獲取故障事件的檢測數(shù)據(jù)并對所述故障事件的檢測數(shù)據(jù)進(jìn)行分析;根據(jù)分析結(jié)果對各故障事件的故障信息進(jìn)行統(tǒng)一存儲及修改。
2、 根據(jù)權(quán)利要求1所述的故障信息采集方法,其特征在于,所述獲取故障 事件的檢測數(shù)據(jù)為通過函數(shù)調(diào)用方式和/或消息傳遞方式獲取。
3、 根據(jù)權(quán)利要求1所述的故障信息采集方法,其特征在于,所述故障信息 包括故障事件類型碼、故障事件編號、故障事件結(jié)果數(shù)據(jù)、錯誤碼、故障事 件結(jié)果lt據(jù)類型、屏蔽標(biāo)記。
4、 根據(jù)權(quán)利要求1至3任一項(xiàng)所述的故障信息采集方法,其特征在于,設(shè) 置故障事件的故障事件類型碼、故障事件編號、緩存次數(shù)閾值、故障事件的錯 誤碼取值范圍,所述獲取故障事件的檢測數(shù)據(jù)之后包含步驟根據(jù)所述故障事件的故障事 件類型碼及故障事件編號,或僅根據(jù)所述故障事件的故障事件編號,判斷已緩 存的所述故障事件檢測數(shù)據(jù)的組數(shù)是否已達(dá)到所述故障事件的緩存次數(shù)閾值, 如果是,以所述獲取的4企測數(shù)據(jù)更新關(guān)于所述故障事件的緩存最早的一組檢測 數(shù)據(jù);否則,直接緩存所述收到的所述故障事件的檢測數(shù)據(jù);所述對故障事件的檢測數(shù)據(jù)進(jìn)行分析為對故障事件的檢測數(shù)據(jù)進(jìn)行歷史數(shù) 據(jù)分析,具體為判斷緩存的所述故障事件的檢測數(shù)據(jù)是否一致,如果是,根 據(jù)緩存的檢測凄t據(jù)及設(shè)置的故障事件的錯誤碼取值范圍修改所述故障事件的故 障信息;否則,不能對所述故障事件的故障信息進(jìn)行修改。
5、 根據(jù)權(quán)利要求4所述的故障信息采集方法,其特征在于,所述以獲取的 檢測數(shù)據(jù)更新緩存最早的一組檢測數(shù)據(jù)為以所述獲取的檢測數(shù)據(jù)覆蓋關(guān)于所 述故障事件的緩存最早的 一組檢測數(shù)據(jù)、或通過移位操作來實(shí)現(xiàn)。
6、 根據(jù)權(quán)利要求1至3任一項(xiàng)所述的故障信息采集方法,其特征在于,設(shè) 置故障事件的故障事件類型碼、故障事件編號、屏蔽標(biāo)記、相關(guān)故障事件、故障事件與相關(guān)故障事件之間的相關(guān)屏蔽關(guān)系、故障事件的錯誤碼取值范圍,在獲取故障事件的檢測數(shù)據(jù)之前,還包含步驟根據(jù)所述故障事件的故障事件類型碼及故障事件編號,或僅根據(jù)所述故障 事件的故障事件編號,查詢所述故障事件的相關(guān)故障事件及所述故障事件與相關(guān)故障事件之間的相關(guān)屏蔽關(guān)系;根據(jù)所述相關(guān)屏蔽關(guān)系判斷所述故障事件是否為主控故障事件,所述故障 事件是主控故障事件,獲取所述主控故障事件的檢測數(shù)據(jù)并分析后,根據(jù)所述主控故障事件的狀態(tài),修改與其對應(yīng)的受控故障事件的屏蔽標(biāo)記;所述故障事件是受控故障事件,則判斷所述受控故障事件的屏蔽標(biāo)記是否為0,如果是,獲取所述受控故障事件的檢測數(shù)據(jù)并分析;否則,根據(jù)設(shè)置的 故障事件的錯誤碼取值范圍修改所述受控故障事件的錯誤碼為未知區(qū)間的值, 屏蔽檢測。
7、 根據(jù)權(quán)利要求1至3任一項(xiàng)所述的故障信息采集方法,其特征在于,設(shè) 置故障事件的故障事件類型碼、故障事件編號、相關(guān)故障事件、故障事件與相 關(guān)故障事件之間的相關(guān)狀態(tài)關(guān)系、故障事件的錯誤碼取值范圍,所述對故障事件的檢測數(shù)據(jù)進(jìn)行分析為對故障事件的檢測數(shù)據(jù)進(jìn)行相關(guān)性 分析,具體為獲取故障事件的檢測數(shù)據(jù)之后,根據(jù)所述故障事件的故障事件 類型碼及故障事件編號,或僅根據(jù)所述故障事件的故障事件編號,查詢所述故 障事件的相關(guān)故障事件及所述故障事件與相關(guān)故障事件之間的相關(guān)狀態(tài)關(guān)系, 然后根據(jù)所述故障事件的相關(guān)故障事件的狀態(tài)、故障事件與相關(guān)故障事件之間 的相關(guān)狀態(tài)關(guān)系、以及設(shè)置的故障事件的錯誤碼取值范圍,對所述故障事件或 其相關(guān)故障事件的故障信息進(jìn)行^修改。
8、 根據(jù)權(quán)利要求3所述的故障信息釆集方法,其特征在于,該方法還包括 告警單元周期性查詢存儲的故障事件的故障信息,判斷故障信息中的屏蔽標(biāo)記是否為0,如果是,不執(zhí)行任何操作,所述故障事件處于屏蔽狀態(tài);如果 不是,將錯誤碼轉(zhuǎn)化為告警或恢復(fù)狀態(tài);比較錯誤碼轉(zhuǎn)化后的狀態(tài)是否與所述故障事件最近一次上報的狀態(tài)一致,如果一致,不執(zhí)行任何操作;否則,根據(jù)所述故障事件的故障信息,發(fā)送告警 消息或恢復(fù)消息到操作維護(hù)中心OMC網(wǎng)管,并更新自身存儲的所述故障事件 最近一次上報的狀態(tài)。
9、 根據(jù)權(quán)利要求3所述的故障信息采集方法,其特征在于,該方法還包括 診斷單元根據(jù)OMC網(wǎng)管的診斷請求,讀取故障事件的故障信息,直接把故障事件類型碼、故障事件編號、錯誤碼、故障事件結(jié)果數(shù)據(jù)用消息的形式發(fā) 到OMC網(wǎng)管;OMC網(wǎng)管才艮據(jù)故障事件類型碼、故障事件編號給出對應(yīng)的故障描述,解析 錯誤碼、故障事件結(jié)果數(shù)據(jù)得出診斷結(jié)果。
10、 一種故障信息釆集系統(tǒng),其特征在于,該系統(tǒng)包括檢測數(shù)據(jù)獲取單 元、檢測數(shù)據(jù)分析單元、故障信息存儲單元;其中,所述檢測數(shù)據(jù)獲取單元,用于獲取故障事件的檢測數(shù)據(jù); 所述檢測數(shù)據(jù)分析單元,用于對所述檢測數(shù)據(jù)獲取單元獲取的檢測數(shù)據(jù)進(jìn) 行分析,并根據(jù)分析結(jié)果對故障信息存儲單元存儲的故障信息進(jìn)行修改; 所述故障信息存儲單元,用于存儲各故障事件的故障信息。
11、 根據(jù)權(quán)利要求IO所述的故障信息采集系統(tǒng),其特征在于,所述故障信 息采集系統(tǒng)還包括參數(shù)設(shè)置單元、歷史數(shù)據(jù)緩存單元;所述參數(shù)設(shè)置單元,用于設(shè)置故障事件的故障事件類型碼、故障事件編號、 緩存次數(shù)閾值、故障事件的錯誤碼取值范圍;所述^r測數(shù)據(jù)分析單元,還用于根據(jù)參數(shù)設(shè)置單元設(shè)置的參數(shù),將獲取的 檢測數(shù)據(jù)緩存至歷史數(shù)據(jù)緩存單元;以及在將獲取的檢測數(shù)據(jù)緩存至歷史數(shù)據(jù) 緩存單元之后,判斷所述歷史數(shù)據(jù)緩存單元中緩存的故障事件的檢測數(shù)據(jù)是否 一致,如果一致,根據(jù)參數(shù)設(shè)置單元設(shè)置的故障事件的錯誤碼取值范圍和獲取 的檢測數(shù)據(jù),修改故障信息存儲單元中存儲的所述故障事件的故障信息;否則, 不對故障信息存儲單元中存儲的所述故障事件的故障信息進(jìn)行修改;所述歷史數(shù)據(jù)緩存單元,用于在收到來自檢測數(shù)據(jù)分析單元的檢測數(shù)據(jù)之 后,根據(jù)參數(shù)設(shè)置單元設(shè)置的參數(shù),判斷自身已緩存故障事件檢測數(shù)據(jù)的組數(shù)是否已達(dá)到所述故障事件的緩存次數(shù)閾值,如果是,以所述獲取的檢測數(shù)據(jù)更新關(guān)于所述故障事件的緩存最早的一組檢測數(shù)據(jù);否則,直接緩存所述收到的 所述故障事件的檢測數(shù)據(jù)。
12、 根據(jù)權(quán)利要求IO所述的故障信息采集系統(tǒng),其特征在于,所述故障信 息采集系統(tǒng)還包括參數(shù)設(shè)置單元,所述參數(shù)設(shè)置單元用于設(shè)置故障事件類型碼、 故障事件編號、屏蔽標(biāo)記、故障事件的相關(guān)故障事件、與相關(guān)故障事件之間的 相關(guān)屏蔽關(guān)系、故障事件的錯誤碼取值范圍,所述檢測數(shù)據(jù)獲取單元在獲取故障事件的檢測數(shù)據(jù)前,還用于根據(jù)所述參 數(shù)設(shè)置單元設(shè)置的相關(guān)屏蔽關(guān)系判斷所述故障事件是否為主控故障事件,所述 故障事件是主控故障事件,則獲取所述主控故障事件的檢測數(shù)據(jù)并分析后,根 據(jù)故障信息存儲單元中存儲的所述主控故障事件的狀態(tài)及參數(shù)設(shè)置單元設(shè)置的 屏蔽關(guān)系,修改故障信息存儲單元中存儲的與其對應(yīng)的受控故障事件的屏蔽標(biāo)記;所述故障事件是受控故障事件,則檢測數(shù)據(jù)獲取單元判斷故障信息存儲單 元中存儲的所述故障事件的屏蔽標(biāo)記是否為o,如果是,檢測數(shù)據(jù)獲取單元獲取所述故障事件的檢測數(shù)據(jù);否則,檢測數(shù)據(jù)獲取單元根據(jù)參數(shù)設(shè)置單元設(shè)置 的參數(shù),修改故障信息存儲單元中所述受控故障事件的錯誤碼為未知區(qū)間的值, 屏蔽4企測。
13、 根據(jù)權(quán)利要求IO所述的故障信息采集系統(tǒng),其特征在于,所述故障信 息采集系統(tǒng)還包括參數(shù)設(shè)置單元,所述參數(shù)設(shè)置單元用于設(shè)置故障事件類型碼、 故障事件編號、故障事件的相關(guān)故障事件、與相關(guān)故障事件之間的相關(guān)狀態(tài)關(guān) 系、故障事件的錯誤碼取值范圍,所述檢測數(shù)據(jù)分析單元還用于根據(jù)參數(shù)設(shè)置單元設(shè)置的參數(shù),對故障信息 存儲單元中存儲的所述故障事件或其相關(guān)故障事件的故障信息進(jìn)行修改。
14、 根據(jù)權(quán)利要求IO所述的故障信息采集系統(tǒng),其特征在于,該系統(tǒng)還包 括告警單元,用于周期性查詢故障信息存儲單元中存儲的故障事件的故障信息, 判斷故障信息中的屏蔽標(biāo)記是否為0,如果是,不執(zhí)行任何操作,所述故障事件處于屏蔽狀態(tài);如果不是,將錯誤碼轉(zhuǎn)化為告警或恢復(fù)狀態(tài),并比較錯誤碼 轉(zhuǎn)化后的狀態(tài)是否與其中存儲的所述故障事件最近一次上報的狀態(tài)一致,如果 一致,不執(zhí)行任何操作;否則,根據(jù)所述故障事件的故障信息,發(fā)送告警消息 或恢復(fù)消息到OMC網(wǎng)管,并更新自身存儲的所述故障事件最近一次上報的狀 態(tài)。
15、根據(jù)權(quán)利要求IO所述的故障信息采集系統(tǒng),其特征在于,該系統(tǒng)還包 括診斷單元,用于響應(yīng)OMC網(wǎng)管的診斷請求,讀取故障信息存儲單元中存儲 的故障事件的故障信息,直接把故障事件類型碼、故障事件編號、錯誤碼、故 障事件結(jié)果數(shù)據(jù)用消息的形式發(fā)到OMC網(wǎng)管。
全文摘要
本發(fā)明公開一種故障信息采集方法,包括獲取故障事件的檢測數(shù)據(jù)并對所述故障事件的檢測數(shù)據(jù)進(jìn)行分析;根據(jù)分析結(jié)果對各故障事件的故障信息進(jìn)行統(tǒng)一存儲及修改。本發(fā)明還相應(yīng)地公開一種故障信息采集系統(tǒng),包括檢測數(shù)據(jù)獲取單元、檢測數(shù)據(jù)分析單元、故障信息存儲單元。采用本發(fā)明的方法及系統(tǒng),對各種各樣、接口各異的故障事件的檢測數(shù)據(jù)進(jìn)行統(tǒng)一獲取,并根據(jù)歷史數(shù)據(jù)和/或故障事件的相關(guān)狀態(tài)對獲取的檢測數(shù)據(jù)進(jìn)行分析,再將分析得到的故障信息統(tǒng)一進(jìn)行存儲及維護(hù),告警單元和診斷單元需要獲取故障信息時,直接讀取存儲的故障信息即可,不需要通過對檢測數(shù)據(jù)進(jìn)行分析來獲取故障信息,所以,能夠節(jié)約系統(tǒng)資源、提高系統(tǒng)穩(wěn)定性、且簡化操作。
文檔編號H04W88/08GK101562827SQ20091008549
公開日2009年10月21日 申請日期2009年5月22日 優(yōu)先權(quán)日2009年5月22日
發(fā)明者青 林 申請人:中興通訊股份有限公司