亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種通信業(yè)務(wù)中的告警監(jiān)控方法及設(shè)備的制作方法

文檔序號(hào):7896049閱讀:295來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):一種通信業(yè)務(wù)中的告警監(jiān)控方法及設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及通信領(lǐng)域,尤其涉及一種通信業(yè)務(wù)中的告警監(jiān)控方法及設(shè)備。
背景技術(shù)
隨著通信技術(shù)的不斷發(fā)展,為確保通信業(yè)務(wù)的正常開(kāi)展,需要對(duì)龐大的業(yè)務(wù)支撐系統(tǒng)的硬件設(shè)備以及各項(xiàng)業(yè)務(wù)的運(yùn)行指標(biāo)進(jìn)行監(jiān)控。目前常用的運(yùn)行指標(biāo)監(jiān)控方式是通過(guò)部署的采集代理(Agent)平臺(tái),對(duì)被測(cè)對(duì)象的單個(gè)運(yùn)行指標(biāo)進(jìn)行監(jiān)控,獲取該運(yùn)行指標(biāo)的采集值。然后根據(jù)預(yù)設(shè)的閥值對(duì)采集值進(jìn)行告警檢測(cè),判斷該運(yùn)行指標(biāo)所表示的操作是否需要告警,在業(yè)需要告警時(shí)產(chǎn)生告警信息,并將產(chǎn)生的告警信息以列表的方式向管理員展示。管理員根據(jù)展示的告警信息對(duì)被測(cè)對(duì)象的運(yùn)行狀態(tài)進(jìn)行檢測(cè),定位產(chǎn)生告警的問(wèn)題所在,進(jìn)而排除產(chǎn)生告警的問(wèn)題,使被測(cè)對(duì)象的運(yùn)行恢復(fù)正常。在目前的告警監(jiān)控方式下,通過(guò)列表的形式將通信業(yè)務(wù)運(yùn)行中產(chǎn)生的大量告警信息展示出來(lái),管理員只能針對(duì)每條告警信息分別對(duì)被告警的設(shè)備、業(yè)務(wù)等被測(cè)對(duì)象進(jìn)行檢測(cè),進(jìn)而定位出產(chǎn)生告警的故障點(diǎn)。但由于告警信息數(shù)量巨大,且告警信息之間沒(méi)有關(guān)聯(lián), 管理員只能根據(jù)各方面獲取的告警信息推斷出故障點(diǎn),導(dǎo)致故障點(diǎn)很難被快速定位,使得故障排除的周期時(shí)間長(zhǎng)。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種通信業(yè)務(wù)中的告警監(jiān)控方法及設(shè)備,用以解決現(xiàn)有技術(shù)中存在的故障點(diǎn)很難快速定位的問(wèn)題。一種通信業(yè)務(wù)中的告警監(jiān)控方法,所述方法包括采集至少一個(gè)被測(cè)對(duì)象的多條告警信息,每條告警信息中包含告警時(shí)間和該告警信息的運(yùn)行指標(biāo);根據(jù)預(yù)先設(shè)定的各運(yùn)行指標(biāo)之間的第一關(guān)聯(lián)關(guān)系,從包含的告警時(shí)間相差小于設(shè)定值的告警信息中,確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息;根據(jù)具有第一關(guān)聯(lián)關(guān)系的告警信息定位通信業(yè)務(wù)中的故障點(diǎn)。一種通信業(yè)務(wù)中的告警監(jiān)控設(shè)備,所述設(shè)備包括采集模塊,用于采集至少一個(gè)被測(cè)對(duì)象的多條告警信息,每條告警信息中包含告警時(shí)間和該告警信息的運(yùn)行指標(biāo);第一關(guān)聯(lián)模塊,用于根據(jù)預(yù)先設(shè)定的各運(yùn)行指標(biāo)之間的第一關(guān)聯(lián)關(guān)系,從包含的告警時(shí)間相差小于設(shè)定值的告警信息中,確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息;定位模塊,用于根據(jù)具有第一關(guān)聯(lián)關(guān)系的告警信息定位通信業(yè)務(wù)中的故障點(diǎn)。本發(fā)明有益效果如下本發(fā)明實(shí)施例將一段時(shí)間內(nèi)生成的告警信息進(jìn)行分析,按照預(yù)先設(shè)定的多項(xiàng)運(yùn)行指標(biāo)之間的關(guān)聯(lián)關(guān)系,提取出包含的運(yùn)行指標(biāo)有關(guān)聯(lián)關(guān)系的多條告警信息,通過(guò)提取出的多條告警信息之間的關(guān)系,可以確定其中的主告警信息和由主告警信息引起的從告警信息,進(jìn)而快速定位出故障點(diǎn),通過(guò)排除該故障點(diǎn),克服了產(chǎn)生告警信息的原因,有效提高了故障排除的效率。


圖1為被測(cè)對(duì)象以及針對(duì)該被測(cè)對(duì)象的告警信息所表示的內(nèi)容之間的關(guān)系示意圖;圖2為本發(fā)明實(shí)施例一中告警監(jiān)控方法示意圖;圖3為具有第一關(guān)聯(lián)關(guān)系的告警信息的樹(shù)形拓?fù)涫疽鈭D;圖4為具有第一關(guān)聯(lián)關(guān)系的告警信息的視窗形式示意圖;圖5為告警信息1的二叉樹(shù)表示示意圖;圖6為告警信息2的二叉樹(shù)表示示意圖;圖7為告警信息1和告警信息2合并的二叉樹(shù)表示示意圖;圖8為本發(fā)明實(shí)施例二中通信業(yè)務(wù)的告警監(jiān)控設(shè)備示意圖。
具體實(shí)施例方式為了實(shí)現(xiàn)根據(jù)告警信息快速定位出通信業(yè)務(wù)中的故障點(diǎn)的目的,本發(fā)明實(shí)施例提出了一種新的告警監(jiān)控方案,將一段時(shí)間內(nèi)生成的告警信息進(jìn)行分析,按照預(yù)先設(shè)定的多項(xiàng)運(yùn)行指標(biāo)之間的關(guān)聯(lián)關(guān)系,提取出包含的運(yùn)行指標(biāo)有關(guān)聯(lián)關(guān)系的多條告警信息,通過(guò)提取出的多條告警信息之間的關(guān)系,可以確定其中的主告警信息和由主告警信息引起的從告警信息,進(jìn)而快速定位出故障點(diǎn),通過(guò)排除該故障點(diǎn),克服了產(chǎn)生告警信息的原因,有效提高了故障排除的效率。下面結(jié)合說(shuō)明書(shū)附圖對(duì)本發(fā)明實(shí)施例進(jìn)行詳細(xì)說(shuō)明。如圖1所示,為被測(cè)對(duì)象以及針對(duì)該被測(cè)對(duì)象的告警信息所表示的內(nèi)容之間的關(guān)系示意圖。本發(fā)明各實(shí)施例中涉及的被測(cè)對(duì)象可以是通信網(wǎng)元(如業(yè)務(wù)服務(wù)器),也可以是通信業(yè)務(wù)(如計(jì)費(fèi)業(yè)務(wù)),還可以是投訴平臺(tái)上接收到的投訴工單,該投訴工單中記載了投訴內(nèi)容。根據(jù)被測(cè)對(duì)象的不同,告警信息所表示的內(nèi)容也不同。在被測(cè)對(duì)象是通信網(wǎng)元時(shí), 告警信息所表示的數(shù)據(jù)是設(shè)備的數(shù)據(jù),如服務(wù)器主機(jī)CPU的使用率,數(shù)據(jù)庫(kù)運(yùn)行指標(biāo)、主機(jī)輸入輸出接口參數(shù)等。在被測(cè)對(duì)象是通信業(yè)務(wù)時(shí),告警信息所表示的數(shù)據(jù)是業(yè)務(wù)進(jìn)程的狀態(tài)數(shù)據(jù),如計(jì)費(fèi)業(yè)務(wù)的A進(jìn)程的運(yùn)行狀態(tài)、業(yè)務(wù)開(kāi)通的B進(jìn)程的運(yùn)行狀態(tài);由于通信業(yè)務(wù)必須由服務(wù)器承載運(yùn)行,因此,被測(cè)對(duì)象是通信業(yè)務(wù)時(shí),告警信息所表示的數(shù)據(jù)也可以是服務(wù)器中硬件設(shè)備數(shù)據(jù)。在被測(cè)對(duì)象是投訴平臺(tái)上的投訴工單時(shí),告警信息所表示的數(shù)據(jù)是對(duì)投訴工單分析后得到的投訴數(shù)據(jù),包括投訴熱點(diǎn)數(shù)據(jù)和預(yù)警數(shù)據(jù),如空口充值業(yè)務(wù)成為投訴熱點(diǎn)。實(shí)施例一如圖2所示,為本發(fā)明實(shí)施例一中告警監(jiān)控方法示意圖,所述方法包括以下步驟步驟101 采集至少一個(gè)被測(cè)對(duì)象的多條告警信息。在本步驟中,可以通過(guò)采集代理(Agent)方式采集被測(cè)對(duì)象的監(jiān)控信息,Agent采集方式是一種基于java的信息采集平臺(tái),部署在承載通信業(yè)務(wù)的服務(wù)器上,通過(guò)定時(shí)輪詢(xún)?cè)L問(wèn)機(jī)制不斷地從各被測(cè)對(duì)象(包括通信業(yè)務(wù)中運(yùn)行的進(jìn)程、承載該業(yè)務(wù)系統(tǒng)的服務(wù)器或針對(duì)該業(yè)務(wù)系統(tǒng)的投訴工單)中獲取監(jiān)控信息,由于采集的監(jiān)控信息所表示的被測(cè)對(duì)象的狀態(tài)可能需要告警,也可能不需要告警,因此,Agent采集方式還對(duì)采集的監(jiān)控信息進(jìn)行分析,判斷是否需要告警。具體地,通過(guò)Agent采集方式中定義的三種機(jī)制來(lái)執(zhí)行本步驟的方案機(jī)制一代理訪(fǎng)問(wèn)(AgentContext)機(jī)制是對(duì)被測(cè)對(duì)象的靜態(tài)屬性和動(dòng)態(tài)屬性的訪(fǎng)問(wèn)機(jī)制,實(shí)時(shí)采集被測(cè)對(duì)象的監(jiān)控信息,并將采集的監(jiān)控信息封裝構(gòu)建為內(nèi)置對(duì)象。采集的監(jiān)控信息可以采用四元組的方式表達(dá),所述四元組包括運(yùn)行指標(biāo)KPI、采集時(shí)間CELL_ ID、被測(cè)對(duì)象標(biāo)識(shí)UNIT_ID、運(yùn)行指標(biāo)的采集值VALUE。所述運(yùn)行指標(biāo)表示針對(duì)被測(cè)對(duì)象采集的目標(biāo),采集值表示該目標(biāo)的取值。例如被測(cè)對(duì)象是某臺(tái)服務(wù)器,運(yùn)行指標(biāo)可以是服務(wù)器的CPU使用率,對(duì)CPU使用率的采集值為95%。針對(duì)該服務(wù)器的監(jiān)控信息四元組為CPU 使用率、2010年12月14日13點(diǎn)31分、10-112-ABC 主機(jī)名稱(chēng)、95%。代理訪(fǎng)問(wèn)(AgentContext)機(jī)制可以按照預(yù)先設(shè)定的告警規(guī)則來(lái)采集監(jiān)控信息, 如以15分鐘為周期采集監(jiān)控信息等。機(jī)制二 代理權(quán)限(Agentfroxy)機(jī)制是在AgentContext構(gòu)建內(nèi)置對(duì)象后,將該內(nèi)置對(duì)象存儲(chǔ)至數(shù)據(jù)庫(kù)中,同時(shí)通過(guò)預(yù)設(shè)的告警條件對(duì)監(jiān)控信息進(jìn)行判斷的機(jī)制,判斷該監(jiān)控信息所表示的被測(cè)對(duì)象是否需要告警的具體方式為將監(jiān)控信息中的采集值與告警條件進(jìn)行比較,若采集值滿(mǎn)足告警條件(如CPU使用率達(dá)到上限值),則根據(jù)滿(mǎn)足告警條件的監(jiān)控信息生成告警信息;否則,不對(duì)監(jiān)控信息進(jìn)行處理。這里生成的告警信息也包括監(jiān)控信息中的四元組內(nèi)容,其中,告警信息中的告警時(shí)間可以是監(jiān)控信息中的采集時(shí)間,也可以生成告警信息的時(shí)刻。機(jī)制三代理事件(AgentEvent)機(jī)制是廣播生成的告警信息,以便于進(jìn)行后續(xù)流程。步驟102 從多條告警信息中確定包含的告警時(shí)間相差小于設(shè)定值的告警信息。通過(guò)步驟101的操作,可以利用采集代理(Agent)方式不斷獲得告警信息,為了找出這些告警信息之間的關(guān)聯(lián)關(guān)系,首先需要確定包含的告警時(shí)間比較接近的告警信息,這是因?yàn)椴杉?Agent)方式通過(guò)輪詢(xún)不斷采集告警信息,而告警時(shí)間相隔較遠(yuǎn)的告警信息之間具有關(guān)聯(lián)系的可能性較小,如上午8點(diǎn)產(chǎn)生的告警信息與晚上8點(diǎn)產(chǎn)生的告警信息有關(guān)聯(lián)性的可能性很小,因此,為了提高運(yùn)算效率,快速確定告警信息之間的關(guān)聯(lián)性,在本步驟中將告警時(shí)間相差較小的告警信息劃分在一起,以便于后續(xù)針對(duì)告警時(shí)間相差較小的告警信息進(jìn)行關(guān)聯(lián)處理。例如在步驟101中生成三條告警信息,其中,告警信息1的告警時(shí)間是2010年12 月14日13點(diǎn)31分,告警信息2的告警時(shí)間是2010年12月14日14點(diǎn)10分,告警信息3 的告警時(shí)間是2010年12月14日15點(diǎn)00分,所述設(shè)定值為60分鐘,則告警信息1和告警信息2是告警時(shí)間相差小于設(shè)定值的告警信息,后續(xù)可以判斷是否需要建立告警信息1和告警信息2的關(guān)聯(lián)關(guān)系;同時(shí),告警信息2和告警信息3也是告警時(shí)間相差小于設(shè)定值的告警信息,后續(xù)可以判斷是否需要建立告警信息2和告警信息3的關(guān)聯(lián)關(guān)系。而告警信息1 和告警信息3的告警時(shí)間相差大于設(shè)定值,因此,可以將告警信息1和告警信息3看作是不相關(guān)聯(lián)的告警信息。步驟103 根據(jù)預(yù)先設(shè)定的各運(yùn)行指標(biāo)之間的第一關(guān)聯(lián)關(guān)系,從步驟102中確定的告警信息中,確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息。步驟104 根據(jù)具有第一關(guān)聯(lián)關(guān)系的告警信息定位通信業(yè)務(wù)中的故障點(diǎn)。在本步驟中,可以將具有第一關(guān)聯(lián)關(guān)系的告警信息以圖3的樹(shù)形拓?fù)湫问秸故荆?或以圖4的視窗形式展示。在圖3所示的樹(shù)形拓?fù)鋱D中,將綜合采集的告警信息分為設(shè)備數(shù)據(jù)、業(yè)務(wù)進(jìn)程的狀態(tài)數(shù)據(jù)和投訴數(shù)據(jù)。設(shè)備數(shù)據(jù)中又分為網(wǎng)元的數(shù)據(jù)、數(shù)據(jù)庫(kù)的數(shù)據(jù)、主機(jī)的數(shù)據(jù);業(yè)務(wù)進(jìn)程的狀態(tài)數(shù)據(jù)中又分為進(jìn)程監(jiān)控?cái)?shù)據(jù)、接口屬性、付費(fèi)業(yè)務(wù)數(shù)據(jù)、短信業(yè)務(wù)數(shù)據(jù)、停復(fù)機(jī)業(yè)務(wù)數(shù)據(jù),其中,進(jìn)程監(jiān)控?cái)?shù)據(jù)下的空文件告警信息和交換機(jī)告警信息具有第一關(guān)聯(lián)關(guān)系。在圖4所示的視窗形式圖中,針對(duì)接口類(lèi)業(yè)務(wù),告警信息被劃分為設(shè)備數(shù)據(jù)和業(yè)務(wù)進(jìn)程的狀態(tài)數(shù)據(jù),業(yè)務(wù)進(jìn)程的狀態(tài)數(shù)據(jù)又分為客服投訴業(yè)務(wù)數(shù)據(jù)和進(jìn)程監(jiān)控的數(shù)據(jù),客服投訴業(yè)務(wù)數(shù)據(jù)中有一條新的針對(duì)主機(jī)的空中充值失敗的告警信息,該告警信息是主告警信息,對(duì)應(yīng)兩條從告警信息a市營(yíng)業(yè)廳空中充值服務(wù)器超時(shí)未響應(yīng)的告警信息和b市營(yíng)業(yè)廳空中充值失敗的告警信息。通過(guò)上述實(shí)施例一的方案,將采集到的大量告警信息進(jìn)行關(guān)聯(lián)處理,得到多條告警信息之間的關(guān)聯(lián)關(guān)系,通過(guò)具有關(guān)聯(lián)關(guān)系的告警信息快速定位出故障點(diǎn),并及時(shí)排除故障,降低故障造成的損失;進(jìn)一步地,還可以根據(jù)已生成的告警信息預(yù)測(cè)可能出現(xiàn)故障的服務(wù)器或進(jìn)程,有效避免故障發(fā)生。本發(fā)明實(shí)施例可以將告警信息之間的關(guān)聯(lián)關(guān)系通過(guò)樹(shù)狀圖或視窗圖的形式展示,避免通信業(yè)務(wù)的監(jiān)控盲點(diǎn)。下面對(duì)本實(shí)施例一的各步驟再進(jìn)行詳細(xì)描述。1、在上述步驟101中,通過(guò)Agent采集方式不斷從被測(cè)對(duì)象中采集告警信息,在此情況下,可能出現(xiàn)針對(duì)某一被測(cè)對(duì)象的運(yùn)行指標(biāo)采集告警信息后,如果產(chǎn)生該告警信息的故障一直未排除,則在設(shè)定時(shí)長(zhǎng)后會(huì)重復(fù)采集到針對(duì)同一被測(cè)對(duì)象的相同運(yùn)行指標(biāo)的告警信息。為此,本實(shí)施例的方案提出一種解決方案,在根據(jù)監(jiān)控信息生成告警信息之前對(duì)監(jiān)控信息是否出現(xiàn)重復(fù)進(jìn)行判斷,以避免出現(xiàn)告警信息重復(fù)的問(wèn)題。解決重復(fù)出現(xiàn)的告警信息的主要內(nèi)容包括在每次采集到包含的采集值滿(mǎn)足告警條件的監(jiān)控信息時(shí),判斷在之前的設(shè)定時(shí)長(zhǎng)內(nèi)是否已采集過(guò)相同的監(jiān)控信息,即針對(duì)同一被測(cè)對(duì)象的相同運(yùn)行指標(biāo)且采集值滿(mǎn)足告警條件的監(jiān)控信息。若存在,則認(rèn)為本次采集的監(jiān)控信息是重復(fù)的監(jiān)控信息,根據(jù)該監(jiān)控信息生成的告警信息也是重復(fù)的告警信息,需要過(guò)濾重復(fù)采集的監(jiān)控信息;否則,認(rèn)為本次采集的監(jiān)控信息是新的監(jiān)控信息,則根據(jù)采集到的監(jiān)控信息生成告警信息,并將生成的告警信息執(zhí)行步驟102 步驟104的操作。具體地,可以使用基于子圖同構(gòu)和結(jié)構(gòu)同構(gòu)的頻繁子圖挖掘(FSM)算法來(lái)解決重復(fù)出現(xiàn)的告警信息的問(wèn)題。在FSM算法中定義一組狀態(tài)集合(states)和狀態(tài)符號(hào)集 (alphabet),在狀態(tài)集合中定義監(jiān)控信息的3種狀態(tài)以及對(duì)應(yīng)的狀態(tài)符號(hào)新生成_符號(hào) 1、待過(guò)濾-符號(hào)2、待存儲(chǔ)-符號(hào)3。當(dāng)采集到一個(gè)監(jiān)控信息后,根據(jù)之前的設(shè)定時(shí)長(zhǎng)內(nèi)是否有相同的監(jiān)控信息來(lái)確定當(dāng)前接收到的監(jiān)控信息的符號(hào)狀態(tài),如果之前的設(shè)定時(shí)長(zhǎng)內(nèi)沒(méi)有相同的監(jiān)控信息,則將當(dāng)前采集的監(jiān)控信息定義為符號(hào)1+符號(hào)3,否則,將當(dāng)前采集的監(jiān)控信息定義為符號(hào)2+符號(hào)3。通過(guò)上述FSM算法,可以過(guò)濾重復(fù)出現(xiàn)的監(jiān)控信息,進(jìn)而避免重復(fù)出現(xiàn)告警信息,使后續(xù)建立告警信息之間的關(guān)聯(lián)關(guān)系時(shí),避免出現(xiàn)冗余信息。2、在步驟101和步驟102之間,根據(jù)AgentContext機(jī)制采集的監(jiān)控信息生成的告警信息是以四元組的列表形式存在的,為了直觀地顯示告警信息的被測(cè)對(duì)象在通信業(yè)務(wù)中的位置,可以將每條告警信息以二叉樹(shù)的形式存儲(chǔ)。二叉樹(shù)中的父節(jié)點(diǎn)是根據(jù)被測(cè)對(duì)象在通信業(yè)務(wù)中的位置確定的,被測(cè)對(duì)象在通信業(yè)務(wù)中的位置越低,告警信息的二叉樹(shù)父節(jié)點(diǎn)就越多,二叉樹(shù)的深度越深。具體地,由于被測(cè)對(duì)象標(biāo)識(shí)能夠唯一確定該被測(cè)對(duì)象在通信業(yè)務(wù)中的位置,因此,可以根據(jù)告警信息中包含的被測(cè)對(duì)象標(biāo)識(shí)將列表形式的告警信息轉(zhuǎn)換為二叉樹(shù)形式。例如假設(shè)告警信息1的被測(cè)對(duì)象是服務(wù)器1,運(yùn)行指標(biāo)是CPU使用率,被測(cè)對(duì)象標(biāo)識(shí)是10-112-ABC 服務(wù)器1,其中,10表示服務(wù)器1所承載的付費(fèi)業(yè)務(wù)系統(tǒng),即圖5中的節(jié)點(diǎn)A,112表示付費(fèi)業(yè)務(wù)系統(tǒng)下進(jìn)程監(jiān)控的數(shù)據(jù),即圖5中的節(jié)點(diǎn)B,ABC表示被測(cè)對(duì)象服務(wù)器1,即圖5中的節(jié)點(diǎn)C。其中,圖5中的父節(jié)點(diǎn)節(jié)點(diǎn)A、節(jié)點(diǎn)B和節(jié)點(diǎn)C是根據(jù)服務(wù)器1 在付費(fèi)業(yè)務(wù)系統(tǒng)中的位置確定的,節(jié)點(diǎn)A、節(jié)點(diǎn)B和節(jié)點(diǎn)C在通信業(yè)務(wù)中的位置高于葉子節(jié)點(diǎn)D,圖5中二叉樹(shù)的深度為3,表示告警信息1的被測(cè)對(duì)象在通信業(yè)務(wù)中的位置。由于節(jié)點(diǎn)A、節(jié)點(diǎn)B和節(jié)點(diǎn)C都是告警信息1的父節(jié)點(diǎn),且節(jié)點(diǎn)A表示的業(yè)務(wù)類(lèi)別為付費(fèi)業(yè)務(wù)系統(tǒng),節(jié)點(diǎn)B表示的業(yè)務(wù)類(lèi)別為付費(fèi)業(yè)務(wù)系統(tǒng)下的進(jìn)程監(jiān)控,節(jié)點(diǎn)C表示的業(yè)務(wù)類(lèi)別為付費(fèi)業(yè)務(wù)系統(tǒng)下的進(jìn)程監(jiān)控的服務(wù)器1,因此,告警信息1分別與節(jié)點(diǎn)A、節(jié)點(diǎn)B和節(jié)點(diǎn)C所表示的業(yè)務(wù)類(lèi)別具有第二關(guān)聯(lián)關(guān)系,即CPU使用率過(guò)高對(duì)付費(fèi)業(yè)務(wù)系統(tǒng)、進(jìn)程監(jiān)控以及服務(wù)器1的性能都有影響。再例如,假設(shè)告警信息2的被測(cè)對(duì)象是付費(fèi)業(yè)務(wù)系統(tǒng)下進(jìn)程監(jiān)控中的A進(jìn)程,被測(cè)對(duì)象標(biāo)識(shí)是10-112 =A進(jìn)程,其中,10和112的含義與告警信息1相同,則告警信息2的二叉樹(shù)表示如圖6所示,葉子節(jié)點(diǎn)E包含告警信息2。由于節(jié)點(diǎn)A、節(jié)點(diǎn)B都是告警信息2的父節(jié)點(diǎn),且節(jié)點(diǎn)A表示的業(yè)務(wù)類(lèi)別為付費(fèi)業(yè)務(wù)系統(tǒng),節(jié)點(diǎn)B表示的業(yè)務(wù)類(lèi)別為付費(fèi)業(yè)務(wù)系統(tǒng)下的進(jìn)程監(jiān)控,因此,告警信息2分別與節(jié)點(diǎn)A、節(jié)點(diǎn)B所表示的業(yè)務(wù)類(lèi)別具有第二關(guān)聯(lián)關(guān)系,即進(jìn)程A的運(yùn)行狀態(tài)對(duì)付費(fèi)業(yè)務(wù)系統(tǒng)、進(jìn)程監(jiān)控的性能都有影響。進(jìn)一步地,圖5和圖6可以合并為圖7所示的二叉樹(shù)形式可以看出,告警信息1和告警信息2有節(jié)點(diǎn)A和節(jié)點(diǎn)B這兩個(gè)相同的父節(jié)點(diǎn),因此,告警信息1和告警信息2都與節(jié)點(diǎn)A和節(jié)點(diǎn)B所表示的業(yè)務(wù)類(lèi)別有第二關(guān)聯(lián)關(guān)系。為了使步驟102和步驟103的告警信息關(guān)聯(lián)過(guò)程更加直觀,可以使用中序遍歷 (LNR)算法將二叉樹(shù)結(jié)構(gòu)的告警信息轉(zhuǎn)換為符號(hào)串結(jié)構(gòu)的告警信息,利用符號(hào)串結(jié)構(gòu)的告警信息執(zhí)行步驟102。3、在步驟103中,預(yù)先設(shè)定的第一關(guān)聯(lián)關(guān)系可以有多種形式,包括但不限于以下兩種形式形式一僅建立運(yùn)行指標(biāo)之間的關(guān)聯(lián)關(guān)系。例如根據(jù)經(jīng)驗(yàn)值發(fā)現(xiàn)當(dāng)A進(jìn)程的重傳次數(shù)過(guò)多時(shí),將會(huì)導(dǎo)致CPU的使用率過(guò)高,進(jìn)而導(dǎo)致B進(jìn)程無(wú)法響應(yīng),因此,可以建立A進(jìn)程重傳次數(shù)一CPU使用率一B進(jìn)程響應(yīng)狀態(tài)之間的關(guān)聯(lián)關(guān)系。其中,引起其他告警信息的A進(jìn)程重傳次數(shù)告警信息稱(chēng)之為主告警信息,被主告警信息引起的CPU使用率告警信息和B進(jìn)程響應(yīng)狀態(tài)告警信息稱(chēng)之為從告警信息。形式二 針對(duì)被測(cè)對(duì)象和運(yùn)行指標(biāo)之間的關(guān)聯(lián)關(guān)系。例如服務(wù)器1承載付費(fèi)業(yè)務(wù)的運(yùn)行,付費(fèi)業(yè)務(wù)中的A進(jìn)程重傳次數(shù)過(guò)多時(shí),將會(huì)導(dǎo)致服務(wù)器1的CPU實(shí)用率過(guò)高,進(jìn)而導(dǎo)致付費(fèi)業(yè)務(wù)的B進(jìn)程無(wú)法響應(yīng),因此,可以建立付費(fèi)業(yè)務(wù)A進(jìn)程重傳次數(shù)一服務(wù)器ICPU 使用率一付費(fèi)業(yè)務(wù)B進(jìn)程響應(yīng)狀態(tài)之間的關(guān)聯(lián)關(guān)系。若預(yù)先設(shè)定的是形式一所示的第一關(guān)聯(lián)關(guān)系,則步驟103中直接根據(jù)告警信息中的運(yùn)行指標(biāo)初步判斷告警信息之間是否具有第一關(guān)聯(lián)關(guān)系。例如步驟102中確定的告警時(shí)間相差小于設(shè)定值的告警信息是告警信息1和告警信息2,其中,告警信息1的運(yùn)行指標(biāo)是CPU使用率,告警信息2的運(yùn)行指標(biāo)是A進(jìn)程重傳次數(shù),則可以初步認(rèn)定告警信息1和告警信息2具有第一關(guān)聯(lián)關(guān)系。為了進(jìn)一步確認(rèn)告警信息1和告警信息2之間是否有第一關(guān)聯(lián)關(guān)系,可以根據(jù)告警信息與業(yè)務(wù)類(lèi)別的第二關(guān)聯(lián)關(guān)系,判斷告警信息1和告警信息2是否關(guān)聯(lián)同一業(yè)務(wù)類(lèi)別, 例如根據(jù)圖7所示的二叉樹(shù)結(jié)構(gòu)可以看出,告警信息1和告警信息2有相同的業(yè)務(wù)類(lèi)別, 則告警信息1和告警信息2具有第一關(guān)聯(lián)關(guān)系;否則,可以認(rèn)為告警信息1和告警信息2不具有第一關(guān)聯(lián)關(guān)系。若預(yù)先設(shè)定的是形式二所示的第一關(guān)聯(lián)關(guān)系,則步驟103中需要根據(jù)告警信息中運(yùn)行指標(biāo)以及被測(cè)對(duì)象之間的關(guān)系來(lái)判斷告警信息之間是否具有第一關(guān)聯(lián)關(guān)系。例如步驟102中告警時(shí)間相差小于設(shè)定值的告警信息是告警信息1和告警信息2,其中,告警信息 1的運(yùn)行指標(biāo)是CPU使用率,被測(cè)對(duì)象是服務(wù)器1,告警信息2的運(yùn)行指標(biāo)是A進(jìn)程重傳次數(shù),被測(cè)對(duì)象是運(yùn)行在服務(wù)器1的進(jìn)程A,則可以直接認(rèn)定告警信息1和告警信息2具有第一關(guān)聯(lián)關(guān)系。若告警信息1和告警信息2之間具有第一關(guān)聯(lián)關(guān)系,且告警信息2是主告警信息, 告警信息1是從告警信息,則在步驟104中可以定位故障點(diǎn)是告警信息2的A進(jìn)程,通過(guò)排除A進(jìn)程的故障,同時(shí)解決告警信息1中CPU使用率過(guò)高的問(wèn)題。實(shí)施例二 如圖8所示,為本發(fā)明實(shí)施例二中通信業(yè)務(wù)的告警監(jiān)控設(shè)備示意圖,從圖8中可以看出告警監(jiān)控設(shè)備包括三層架構(gòu),分別為數(shù)據(jù)接口層、關(guān)聯(lián)層和綜合展示層,下面分別對(duì)這三層架構(gòu)進(jìn)行說(shuō)明。告警監(jiān)控設(shè)備主要包括采集模塊11、第一關(guān)聯(lián)模塊12和定位模塊13,數(shù)據(jù)接口層中的采集模塊11用于采集至少一個(gè)被測(cè)對(duì)象的多條告警信息,每條告警信息中包含告警時(shí)間和該告警信息的運(yùn)行指標(biāo);關(guān)聯(lián)層中的第一關(guān)聯(lián)模塊12用于根據(jù)預(yù)先設(shè)定的各運(yùn)行指標(biāo)之間的第一關(guān)聯(lián)關(guān)系,從包含的告警時(shí)間相差小于設(shè)定值的告警信息中,確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息;綜合展示層中的定位模塊13用于根據(jù)具有第一關(guān)聯(lián)關(guān)系的告警信息定位通信業(yè)務(wù)中的故障點(diǎn)。在定位模塊13定位出故障點(diǎn)后,可以由綜合展示層中的展示模塊14來(lái)展示告警信息以及告警信息之間的關(guān)聯(lián)關(guān)系,具體的展示方式可以是圖3所示的樹(shù)形拓?fù)湫问交驁D4所示的視窗形式。所述采集模塊11包括執(zhí)行子模塊21、確定子模塊22和生成子模塊23,其中執(zhí)行子模塊21用于采集至少一個(gè)被測(cè)對(duì)象的監(jiān)控信息,所述監(jiān)控信息中包含運(yùn)行指標(biāo)的采集值;確定子模塊22用于確定采集值滿(mǎn)足告警條件的監(jiān)控信息;生成子模塊23用于根據(jù)滿(mǎn)足告警條件的監(jiān)控信息生成告警信息。若采集模塊11通過(guò)采集代理(Agent)方式采集信息時(shí),執(zhí)行子模塊21的功能相當(dāng)于代理訪(fǎng)問(wèn)(AgentContext)機(jī)制的功能,通過(guò)統(tǒng)一的數(shù)據(jù)接口采集監(jiān)控信息;確定子模塊22和生成子模塊23的功能相當(dāng)于代理權(quán)限(Agentfroxy)機(jī)制的功能;代理事件 (AgentEvent)機(jī)制的功能可以由生成子模塊23將生成的告警信息廣播給第一關(guān)聯(lián)模塊 12。所述采集模塊還包括判斷子模塊M和過(guò)濾子模塊25,其中判斷子模塊M用于在確定子模塊確定當(dāng)前采集到的監(jiān)控信息滿(mǎn)足告警條件時(shí),判斷之前的設(shè)定時(shí)長(zhǎng)內(nèi)是否已采集到針對(duì)同一被測(cè)對(duì)象的相同運(yùn)行指標(biāo)且采集值滿(mǎn)足告警條件的監(jiān)控信息,若是,則觸發(fā)過(guò)濾子模塊25 ;否則,觸發(fā)生成子模塊23 ;過(guò)濾子模塊25用于過(guò)濾當(dāng)前采集到的監(jiān)控信肩、ο所述設(shè)備還包括存儲(chǔ)模塊15和第二關(guān)聯(lián)模塊16,其中存儲(chǔ)模塊15用于將每條告警信息以二叉樹(shù)的形式存儲(chǔ),其中,根據(jù)被測(cè)對(duì)象標(biāo)識(shí)對(duì)應(yīng)的被測(cè)對(duì)象在通信業(yè)務(wù)中的位置,確定二叉樹(shù)形式告警信息的父節(jié)點(diǎn),并將該告警信息作為葉子節(jié)點(diǎn);第二關(guān)聯(lián)模塊 16用于建立告警信息的父節(jié)點(diǎn)所表示的業(yè)務(wù)類(lèi)別與該告警信息之間的第二關(guān)聯(lián)關(guān)系。所述第一關(guān)聯(lián)模塊12包括業(yè)務(wù)關(guān)聯(lián)子模塊31和運(yùn)行關(guān)聯(lián)子模塊32,其中業(yè)務(wù)關(guān)聯(lián)子模塊31用于根據(jù)告警信息與業(yè)務(wù)類(lèi)別的第二關(guān)聯(lián)關(guān)系,從包含的告警時(shí)間相差小于設(shè)定值的告警信息中,確定關(guān)聯(lián)相同業(yè)務(wù)類(lèi)別的告警信息;運(yùn)行關(guān)聯(lián)子模塊32用于從關(guān)聯(lián)相同業(yè)務(wù)類(lèi)別的告警信息中,確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息。本發(fā)明實(shí)施例二中涉及的告警監(jiān)控設(shè)備還包括能夠?qū)崿F(xiàn)實(shí)施例一各步驟功能的邏輯部件。顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1.一種通信業(yè)務(wù)中的告警監(jiān)控方法,其特征在于,所述方法包括采集至少一個(gè)被測(cè)對(duì)象的多條告警信息,每條告警信息中包含告警時(shí)間和該告警信息的運(yùn)行指標(biāo);根據(jù)預(yù)先設(shè)定的各運(yùn)行指標(biāo)之間的第一關(guān)聯(lián)關(guān)系,從包含的告警時(shí)間相差小于設(shè)定值的告警信息中,確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息; 根據(jù)具有第一關(guān)聯(lián)關(guān)系的告警信息定位通信業(yè)務(wù)中的故障點(diǎn)。
2.如權(quán)利要求1所述的方法,其特征在于,采集至少一個(gè)被測(cè)對(duì)象的多條告警信息,具體包括采集至少一個(gè)被測(cè)對(duì)象的監(jiān)控信息,所述監(jiān)控信息中包含運(yùn)行指標(biāo)的采集值; 確定采集值滿(mǎn)足告警條件的監(jiān)控信息,并根據(jù)滿(mǎn)足告警條件的監(jiān)控信息生成告警信息。
3.如權(quán)利要求2所述的方法,其特征在于,根據(jù)滿(mǎn)足告警條件的監(jiān)控信息生成告警信息之后,所述方法還包括在當(dāng)前采集到包含的采集值滿(mǎn)足告警條件的監(jiān)控信息時(shí),判斷之前的設(shè)定時(shí)長(zhǎng)內(nèi)是否已采集到針對(duì)同一被測(cè)對(duì)象的相同運(yùn)行指標(biāo)且采集值滿(mǎn)足告警條件的監(jiān)控信息; 若是,則過(guò)濾當(dāng)前采集到的監(jiān)控信息; 否則,根據(jù)當(dāng)前采集到的監(jiān)控信息生成告警信息。
4.如權(quán)利要求1所述的方法,其特征在于,所述告警信息還包含被測(cè)對(duì)象標(biāo)識(shí);采集告警信息之后,且確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息之前,所述方法還包括將每條告警信息以二叉樹(shù)的形式存儲(chǔ),其中,根據(jù)被測(cè)對(duì)象標(biāo)識(shí)對(duì)應(yīng)的被測(cè)對(duì)象在通信業(yè)務(wù)中的位置,確定二叉樹(shù)形式告警信息的父節(jié)點(diǎn),并將該告警信息作為葉子節(jié)點(diǎn); 建立告警信息的父節(jié)點(diǎn)所表示的業(yè)務(wù)類(lèi)別與該告警信息之間的第二關(guān)聯(lián)關(guān)系。
5.如權(quán)利要求4所述的方法,其特征在于,確定具有第一關(guān)聯(lián)關(guān)系的告警信息,具體包括根據(jù)告警信息與業(yè)務(wù)類(lèi)別的第二關(guān)聯(lián)關(guān)系,從包含的告警時(shí)間相差小于設(shè)定值的告警信息中,確定關(guān)聯(lián)相同業(yè)務(wù)類(lèi)別的告警信息;從關(guān)聯(lián)相同業(yè)務(wù)類(lèi)別的告警信息中,確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息。
6.一種通信業(yè)務(wù)中的告警監(jiān)控設(shè)備,其特征在于,所述設(shè)備包括采集模塊,用于采集至少一個(gè)被測(cè)對(duì)象的多條告警信息,每條告警信息中包含告警時(shí)間和該告警信息的運(yùn)行指標(biāo);第一關(guān)聯(lián)模塊,用于根據(jù)預(yù)先設(shè)定的各運(yùn)行指標(biāo)之間的第一關(guān)聯(lián)關(guān)系,從包含的告警時(shí)間相差小于設(shè)定值的告警信息中,確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息; 定位模塊,用于根據(jù)具有第一關(guān)聯(lián)關(guān)系的告警信息定位通信業(yè)務(wù)中的故障點(diǎn)。
7.如權(quán)利要求6所述的設(shè)備,其特征在于,所述采集模塊包括執(zhí)行子模塊,用于采集至少一個(gè)被測(cè)對(duì)象的監(jiān)控信息,所述監(jiān)控信息中包含運(yùn)行指標(biāo)的采集值;確定子模塊,用于確定采集值滿(mǎn)足告警條件的監(jiān)控信息;生成子模塊,用于根據(jù)滿(mǎn)足告警條件的監(jiān)控信息生成告警信息。
8.如權(quán)利要求7所述的設(shè)備,其特征在于,所述采集模塊還包括判斷子模塊,用于在確定子模塊確定當(dāng)前采集到的監(jiān)控信息滿(mǎn)足告警條件時(shí),判斷之前的設(shè)定時(shí)長(zhǎng)內(nèi)是否已采集到針對(duì)同一被測(cè)對(duì)象的相同運(yùn)行指標(biāo)且采集值滿(mǎn)足告警條件的監(jiān)控信息,若是,則觸發(fā)過(guò)濾子模塊;否則,觸發(fā)生成子模塊;過(guò)濾子模塊,用于過(guò)濾當(dāng)前采集到的監(jiān)控信息。
9.如權(quán)利要求6所述的設(shè)備,其特征在于,所述設(shè)備還包括存儲(chǔ)模塊,用于將每條告警信息以二叉樹(shù)的形式存儲(chǔ),其中,根據(jù)被測(cè)對(duì)象標(biāo)識(shí)對(duì)應(yīng)的被測(cè)對(duì)象在通信業(yè)務(wù)中的位置,確定二叉樹(shù)形式告警信息的父節(jié)點(diǎn),并將該告警信息作為葉子節(jié)點(diǎn);第二關(guān)聯(lián)模塊,用于建立告警信息的父節(jié)點(diǎn)所表示的業(yè)務(wù)類(lèi)別與該告警信息之間的第二關(guān)聯(lián)關(guān)系。
10.如權(quán)利要求9所述的設(shè)備,其特征在于,所述第一關(guān)聯(lián)模塊包括業(yè)務(wù)關(guān)聯(lián)子模塊,用于根據(jù)告警信息與業(yè)務(wù)類(lèi)別的第二關(guān)聯(lián)關(guān)系,從包含的告警時(shí)間相差小于設(shè)定值的告警信息中,確定關(guān)聯(lián)相同業(yè)務(wù)類(lèi)別的告警信息;運(yùn)行關(guān)聯(lián)子模塊,用于從關(guān)聯(lián)相同業(yè)務(wù)類(lèi)別的告警信息中,確定包含的運(yùn)行指標(biāo)具有第一關(guān)聯(lián)關(guān)系的告警信息。
全文摘要
本發(fā)明公開(kāi)了一種通信業(yè)務(wù)中的告警監(jiān)控方法及設(shè)備,主要內(nèi)容包括將一段時(shí)間內(nèi)生成的告警信息進(jìn)行分析,按照預(yù)先設(shè)定的多項(xiàng)運(yùn)行指標(biāo)之間的關(guān)聯(lián)關(guān)系,提取出包含的運(yùn)行指標(biāo)有關(guān)聯(lián)關(guān)系的多條告警信息,通過(guò)提取出的多條告警信息之間的關(guān)系,可以確定其中的主告警信息和由主告警信息引起的從告警信息,進(jìn)而快速定位出故障點(diǎn),通過(guò)排除該故障點(diǎn),克服了產(chǎn)生告警信息的原因,有效提高了故障排除的效率。
文檔編號(hào)H04L12/24GK102546274SQ201010595429
公開(kāi)日2012年7月4日 申請(qǐng)日期2010年12月20日 優(yōu)先權(quán)日2010年12月20日
發(fā)明者劉曉峰, 徐俊, 甘雯, 陳陽(yáng), 黃靜 申請(qǐng)人:中國(guó)移動(dòng)通信集團(tuán)廣西有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1