本申請涉及虛擬化技術(shù)領(lǐng)域,特別涉及一種故障定位模型的生成方法、故障定位方法和裝置。
背景技術(shù):
虛擬化(virtualization)技術(shù)是一種通過通用硬件以及虛擬化技術(shù)來實現(xiàn)各種不同功能的技術(shù)。應(yīng)用了虛擬化技術(shù)的虛擬化網(wǎng)絡(luò)通??梢园ㄖ鳈C(host)、虛擬機(virtualmachine,vm)和虛擬化網(wǎng)絡(luò)功能模塊(virtualnetworkfunction,vnf)這幾種網(wǎng)元(networkelement,ne),vm運行在主機上,而vnf運行在vm上,vnf可以用于實現(xiàn)各種功能。應(yīng)用了虛擬化技術(shù)的虛擬化網(wǎng)絡(luò)出現(xiàn)故障時,需要對故障進行定位,以確定具體的故障位置。
在一種故障定位方法中,該方法為,首先將虛擬化網(wǎng)絡(luò)中各個網(wǎng)元的日志數(shù)據(jù)分割為多段文字段,并抽取關(guān)鍵詞,然后分析關(guān)鍵詞頻次,再根據(jù)關(guān)鍵詞頻次篩選關(guān)鍵詞并將關(guān)鍵詞轉(zhuǎn)化為日志特征,然后將得到的日志特征作為數(shù)據(jù)挖掘分類算法(classificationalgorithmsindatamining)的訓(xùn)練數(shù)據(jù),以獲得故障定位模型,之后可以根據(jù)該故障定位模型來對虛擬化網(wǎng)絡(luò)出現(xiàn)的故障進行定位。
在實現(xiàn)本申請的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:虛擬化網(wǎng)絡(luò)中各個網(wǎng)元的日志中,大部分是與故障分析無關(guān)的日志,提取其中的關(guān)鍵詞并通過關(guān)鍵詞頻次來篩選關(guān)鍵詞可能會遺漏較多與故障定位有關(guān)的關(guān)鍵詞,由此得到的故障定位模型對于故障的定位的可靠性較差。
技術(shù)實現(xiàn)要素:
為了解決故障定位模型對于故障的定位的可靠性較差的問題,本申請?zhí)峁┝艘环N故障定位模型的生成方法、故障定位方法和裝置。所述技術(shù)方案如下:
本申請的執(zhí)行主體可以是獨立于虛擬化網(wǎng)絡(luò)之外的一個裝置,該裝置可以是一個網(wǎng)絡(luò)設(shè)備。
第一方面,本申請?zhí)峁┝艘环N故障定位模型的生成方法,該方法包括:
網(wǎng)絡(luò)設(shè)備確定虛擬化網(wǎng)絡(luò)中告警信息產(chǎn)生的時間信息。該時間信息可以記錄有當前時刻之前的多個告警信息的產(chǎn)生時刻。
網(wǎng)絡(luò)設(shè)備根據(jù)時間信息獲取虛擬化網(wǎng)絡(luò)中告警信息產(chǎn)生時的日志數(shù)據(jù)。該日志數(shù)據(jù)包括虛擬化網(wǎng)絡(luò)中多個網(wǎng)元的日志,虛擬化網(wǎng)絡(luò)中的網(wǎng)元可以包括host、vm和vnf等。
網(wǎng)絡(luò)設(shè)備從日志數(shù)據(jù)中獲取日志特征。
網(wǎng)絡(luò)設(shè)備根據(jù)日志特征獲取訓(xùn)練數(shù)據(jù),該訓(xùn)練數(shù)據(jù)可以作為數(shù)據(jù)挖掘分類算法(classificationalgorithmsindatamining)的訓(xùn)練數(shù)據(jù)。
網(wǎng)絡(luò)設(shè)備將通過數(shù)據(jù)挖掘分類算法將訓(xùn)練數(shù)據(jù)訓(xùn)練為虛擬化網(wǎng)絡(luò)的故障定位模型。
本申請?zhí)峁┑墓收隙ㄎ荒P偷纳煞椒ㄖ?,通過獲取告警信息產(chǎn)生時的日志數(shù)據(jù),根據(jù)該日志數(shù)據(jù)來逐步獲取訓(xùn)練數(shù)據(jù),并根據(jù)該訓(xùn)練數(shù)據(jù)訓(xùn)練得到故障定位模型,將告警信息和訓(xùn)練數(shù)據(jù)關(guān)聯(lián)了起來,提高了故障定位模型的可靠性。
可選的,根據(jù)時間信息獲取虛擬化網(wǎng)絡(luò)中告警信息產(chǎn)生時的日志數(shù)據(jù)之前,該方法還包括:
網(wǎng)絡(luò)設(shè)備對虛擬化網(wǎng)絡(luò)中產(chǎn)生的告警信息進行壓縮處理,以去除重復(fù)的告警信息。
虛擬化網(wǎng)絡(luò)中的多個網(wǎng)元可能對于同一個故障各自發(fā)出告警信息,這使得重復(fù)的告警信息較多,去除重復(fù)的告警信息能夠減少生成故障定位模型時的計算量。
可選的,根據(jù)時間信息獲取虛擬化網(wǎng)絡(luò)中告警信息產(chǎn)生時的日志數(shù)據(jù),包括:
網(wǎng)絡(luò)設(shè)備根據(jù)時間信息獲取虛擬化網(wǎng)絡(luò)中告警信息產(chǎn)生時各個網(wǎng)元的日志;
網(wǎng)絡(luò)設(shè)備可以將各個網(wǎng)元的日志中相關(guān)聯(lián)的日志進行拼接,得到虛擬化網(wǎng)絡(luò)中告警信息產(chǎn)生時的日志數(shù)據(jù)。
由于虛擬化網(wǎng)絡(luò)中的虛擬機可能存在遷移等情況,同一個vnf可能在不同時間運行于不同的vm上,因而網(wǎng)絡(luò)設(shè)備可以將不同的vm上相關(guān)聯(lián)的日志進行拼接,以提高得到的日志數(shù)據(jù)的完整性與可靠性。
可選的,網(wǎng)絡(luò)設(shè)備從日志數(shù)據(jù)中獲取日志特征,包括:
網(wǎng)絡(luò)設(shè)備獲取日志數(shù)據(jù)中的至少一個關(guān)鍵詞。關(guān)鍵詞(keywords)通常是日志數(shù)據(jù)中較為重要的幾個詞或者短語,作為對日志數(shù)據(jù)主要內(nèi)容的提要。獲取關(guān)鍵詞是快速了解日志數(shù)據(jù)內(nèi)容、把握日志數(shù)據(jù)主題的重要方式。
網(wǎng)絡(luò)設(shè)備可以根據(jù)至少一個關(guān)鍵詞將日志數(shù)據(jù)轉(zhuǎn)換為日志特征。
本申請?zhí)峁┑墓收隙ㄎ荒P偷纳煞椒ㄖ?,網(wǎng)絡(luò)設(shè)備可以根據(jù)日志數(shù)據(jù)中的關(guān)鍵詞來生成日志特征,以對日志數(shù)據(jù)進行精簡,提高故障定位模型的可靠性。
可選的,網(wǎng)絡(luò)設(shè)備獲取日志數(shù)據(jù)中的至少一個關(guān)鍵詞,包括:
網(wǎng)絡(luò)設(shè)備對日志數(shù)據(jù)進行數(shù)據(jù)清洗(datacleaning),數(shù)據(jù)清洗用于去除日志數(shù)據(jù)中與故障定位無關(guān)的數(shù)據(jù)。
網(wǎng)絡(luò)設(shè)備獲取數(shù)據(jù)清洗后的日志數(shù)據(jù)中的至少一個關(guān)鍵詞。
對日志數(shù)據(jù)進行數(shù)據(jù)清洗能夠清楚日志數(shù)據(jù)中與故障定位無關(guān)的數(shù)據(jù),減少生成故障定位模型的計算量。
可選的,網(wǎng)絡(luò)設(shè)備對日志數(shù)據(jù)進行數(shù)據(jù)清洗,包括:
網(wǎng)絡(luò)設(shè)備刪除日志數(shù)據(jù)中的非字母字符、與故障定位無關(guān)的數(shù)字字符、空行、重復(fù)行和高頻詞中的至少一種;
和/或,網(wǎng)絡(luò)設(shè)備將日志數(shù)據(jù)中的多行日志轉(zhuǎn)換為單行日志。
非字母字符、與故障定位無關(guān)的數(shù)字字符、空行、重復(fù)行和高頻詞通常均與故障定位的關(guān)聯(lián)性較小,可以將這些數(shù)據(jù)刪除。
可選的,網(wǎng)絡(luò)設(shè)備獲取數(shù)據(jù)清洗后的日志數(shù)據(jù)中的至少一個關(guān)鍵詞,包括:
網(wǎng)絡(luò)設(shè)備將數(shù)據(jù)清洗后的日志數(shù)據(jù)中,每次告警信息產(chǎn)生告警信息產(chǎn)生時的日志數(shù)據(jù)分割為故障日志數(shù)據(jù)和正常日志數(shù)據(jù),故障日志數(shù)據(jù)為包括告警信息產(chǎn)生時刻的第一預(yù)設(shè)時間段的日志數(shù)據(jù),正常日志數(shù)據(jù)為第一預(yù)設(shè)時間段之前的第二預(yù)設(shè)時間段的日志數(shù)據(jù)。
網(wǎng)絡(luò)設(shè)備判斷數(shù)據(jù)清洗后的日志數(shù)據(jù)中,每次告警信息產(chǎn)生時的日志數(shù)據(jù)中是否同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)。
在數(shù)據(jù)清洗后的日志數(shù)據(jù)中,任一告警信息產(chǎn)生時的日志數(shù)據(jù)中并非同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)時(即日志數(shù)據(jù)中僅包括正常日志數(shù)據(jù)或僅包括故障日志數(shù)據(jù)),網(wǎng)絡(luò)設(shè)備獲取任一告警信息產(chǎn)生時的日志數(shù)據(jù)中的至少一個關(guān)鍵詞。
在數(shù)據(jù)清洗后的日志數(shù)據(jù)中,任一告警信息產(chǎn)生時的日志數(shù)據(jù)中同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)時,判斷正常日志數(shù)據(jù)和故障日志數(shù)據(jù)的相似度是否小于預(yù)設(shè)值。
在相似度小于預(yù)設(shè)值時,網(wǎng)絡(luò)設(shè)備獲取任一告警信息產(chǎn)生時的日志數(shù)據(jù)的至少一個關(guān)鍵詞。
在相似度不小于預(yù)設(shè)值時,說明虛擬化網(wǎng)絡(luò)在發(fā)生故障前后日志數(shù)據(jù)變化不大,為了增加關(guān)鍵詞以分析故障,網(wǎng)絡(luò)設(shè)備可以獲取任一告警信息產(chǎn)生時的日志數(shù)據(jù)的至少一個關(guān)鍵詞,并將任一告警信息產(chǎn)生時的日志數(shù)據(jù)中的數(shù)字字符作為關(guān)鍵詞。
可選的,根據(jù)至少一個關(guān)鍵詞將日志數(shù)據(jù)轉(zhuǎn)換為日志特征,包括:
網(wǎng)絡(luò)設(shè)備根據(jù)第一關(guān)鍵詞將數(shù)據(jù)清洗后的日志數(shù)據(jù)轉(zhuǎn)換為關(guān)于第一關(guān)鍵詞的日志特征,其中,關(guān)于第一關(guān)鍵詞的日志特征用于指示數(shù)據(jù)清洗后的日志數(shù)據(jù)中的每個日志是否包括該第一關(guān)鍵詞,該第一關(guān)鍵詞為至少一個關(guān)鍵詞中的任一關(guān)鍵詞。
本申請?zhí)峁┑墓收隙ㄎ荒P偷纳煞椒ㄖ校梢詫⑹欠癜P(guān)鍵詞來作為日志特征。
可選的,根據(jù)日志特征獲取訓(xùn)練數(shù)據(jù),包括:
網(wǎng)絡(luò)設(shè)備將日志特征作為訓(xùn)練數(shù)據(jù);
或者,
網(wǎng)絡(luò)設(shè)備根據(jù)虛擬化網(wǎng)絡(luò)中任一告警信息與任一告警信息對應(yīng)的日志特征生成日志特征序列,任一告警信息對應(yīng)的日志特征為根據(jù)任一告警信息產(chǎn)生時的日志數(shù)據(jù)獲取的日志特征;
網(wǎng)絡(luò)設(shè)備通過序列模式挖掘算法挖掘日志特征序列,得到至少一個候選序列特征;
網(wǎng)絡(luò)設(shè)備通過序列選擇算法從至少一個候選序列特征挑選出與故障定位相關(guān)的序列特征;
網(wǎng)絡(luò)設(shè)備將序列特征和日志特征作為訓(xùn)練數(shù)據(jù)。
網(wǎng)絡(luò)設(shè)備可以直接將日志特征作為訓(xùn)練數(shù)據(jù),或者也可以根據(jù)日志特征獲取序列特征,并將序列特征和日志特征均作為訓(xùn)練數(shù)據(jù),以增加訓(xùn)練數(shù)據(jù)的可靠性和全面性。
可選的,根據(jù)日志特征獲取訓(xùn)練數(shù)據(jù),包括:
網(wǎng)絡(luò)設(shè)備根據(jù)虛擬化網(wǎng)絡(luò)中的告警信息、性能統(tǒng)計數(shù)據(jù)、虛擬機信息和主機信息中的至少一種信息得到虛擬化網(wǎng)絡(luò)的專家特征;
網(wǎng)絡(luò)設(shè)備將專家特征和日志特征作為訓(xùn)練數(shù)據(jù)。
網(wǎng)絡(luò)設(shè)備可以獲取專家特征,并將專家特征和日志特征一起作為訓(xùn)練數(shù)據(jù),以增加訓(xùn)練數(shù)據(jù)的可靠性和全面性。
根據(jù)本申請的第二方面,提供一種故障定位方法,該方法包括:
在虛擬化網(wǎng)絡(luò)發(fā)生故障時,獲取第一方面提供的方法生成的虛擬化網(wǎng)絡(luò)的故障定位模型;
根據(jù)該故障定位模型對虛擬化網(wǎng)絡(luò)發(fā)生的故障進行定位。
根據(jù)本申請的第三方面,提供一種故障定位模型的生成裝置,該故障定位模型的生成裝置包括至少一個模塊,該至少一個模塊用于實現(xiàn)上述第一方面所提供的故障定位模型的生成方法。
根據(jù)本申請的第四方面,提供一種故障定位裝置,該故障定位裝置包括至少一個模塊,該至少一個模塊用于實現(xiàn)上述第二方面提供的故障定位方法。
根據(jù)本申請的第五方面,提供了一種故障定位模型的生成裝置,該故障定位模型的生成裝置包括:處理器、網(wǎng)絡(luò)接口、存儲器以及總線,存儲器與網(wǎng)絡(luò)接口分別通過總線與處理器相連;處理器被配置為執(zhí)行存儲器中存儲的指令;處理器通過執(zhí)行指令來實現(xiàn)上述第一方面所提供的故障定位模型的生成方法。
根據(jù)本申請的第六方面,提供了一種故障定位裝置,該故障定位裝置包括:處理器、網(wǎng)絡(luò)接口、存儲器以及總線,存儲器與網(wǎng)絡(luò)接口分別通過總線與處理器相連;處理器被配置為執(zhí)行存儲器中存儲的指令;處理器通過執(zhí)行指令來實現(xiàn)上述第二方面所提供的故障定位方法。
根據(jù)本申請的第七方面,提供一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)中存儲有指令,當該計算機可讀存儲介質(zhì)在計算機上運行時,使得計算機執(zhí)行上述第一方面提供的故障定位模型的生成方法。
根據(jù)本申請的第八方面,提供一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)中存儲有指令,當該計算機可讀存儲介質(zhì)在計算機上運行時,使得計算機執(zhí)行上述第二方面提供的故障定位方法。
本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:
通過獲取告警信息產(chǎn)生時的日志數(shù)據(jù),根據(jù)該日志數(shù)據(jù)來逐步獲取訓(xùn)練數(shù)據(jù),并根據(jù)該訓(xùn)練數(shù)據(jù)訓(xùn)練得到故障定位模型,將告警信息和訓(xùn)練數(shù)據(jù)關(guān)聯(lián)了起來,相較于相關(guān)技術(shù)中訓(xùn)練數(shù)據(jù)可能遺漏大量和故障定位有關(guān)的信息,提高了依靠訓(xùn)練數(shù)據(jù)生成的故障定位模型的可靠性。
附圖說明
圖1是本發(fā)明各個實施例所涉及的實施環(huán)境的示意圖;
圖2是本發(fā)明示例性實施例涉及的一種網(wǎng)絡(luò)設(shè)備的結(jié)構(gòu)示意圖;
圖3-1是本發(fā)明實施例提供的一種故障定位模型的生成方法的流程圖;
圖3-2是圖3-1所示實施例中一種nfv網(wǎng)絡(luò)的架構(gòu)圖;
圖3-3是圖3-1所示實施例中另一種nfv網(wǎng)絡(luò)的架構(gòu)圖;
圖3-4是圖3-1所示實施例中一種獲取關(guān)鍵詞的流程圖;
圖3-5是圖3-1所示實施例中一種獲取訓(xùn)練數(shù)據(jù)的流程圖;
圖3-6是圖3-1所示實施例中另一種獲取訓(xùn)練數(shù)據(jù)的流程圖;
圖3-7是圖3-1所示實施例中另一種獲取訓(xùn)練數(shù)據(jù)的流程圖;
圖4-1是本發(fā)明實施例提供的一種故障定位方法的流程圖;
圖4-2是圖4-1所示實施例中一種故障定位的流程圖;
圖5-1是本發(fā)明實施例提供的一種故障定位模型的生成裝置的框圖;
圖5-2是圖5-1所示實施例中一種日志特征獲取模塊的框圖;
圖5-3是本發(fā)明實施例提供的另一種故障定位模型的生成裝置的框圖;
圖5-4是圖5-1所示實施例中一種關(guān)鍵詞獲取子模塊的框圖;
圖6是本發(fā)明實施例提供的一種故障定位裝置的框圖。
具體實施方式
為使本申請的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本申請實施方式作進一步地詳細描述。
請參考圖1,其示出了本發(fā)明各個實施例所涉及的實施環(huán)境的示意圖,該實施環(huán)境可以包括:虛擬化網(wǎng)絡(luò)01、故障定位模型生成裝置02和故障定位裝置03。虛擬化網(wǎng)絡(luò)01可以分別和故障定位模型生成裝置02以及故障定位裝置03建立有連接,故障定位模型生成裝置02可以和故障定位裝置03建立有連接。此外,故障定位模型生成裝置02還可以和故障定位裝置03為同一個裝置。
虛擬化網(wǎng)絡(luò)01為應(yīng)用了虛擬化技術(shù)的網(wǎng)絡(luò),用于實現(xiàn)各種網(wǎng)絡(luò)功能。故障定位模型生成裝置02用于生成針對虛擬化網(wǎng)絡(luò)01的故障定位模型。故障定位裝置03用于根據(jù)故障定位模型生成裝置02生成的故障定位模型對虛擬化網(wǎng)絡(luò)01發(fā)生的故障進行定位。
請參考圖2,其示出了本發(fā)明示例性實施例涉及的一種網(wǎng)絡(luò)設(shè)備的結(jié)構(gòu)示意圖。該網(wǎng)絡(luò)設(shè)備10可以是上述故障定位模型生成裝置02或者故障定位裝置03,該網(wǎng)絡(luò)設(shè)備10包括:處理器12和網(wǎng)絡(luò)接口14。
處理器12包括一個或者一個以上處理核心。處理器12通過運行軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理。
網(wǎng)絡(luò)接口14可以為多個,該網(wǎng)絡(luò)接口14用于與其它存儲設(shè)備或者網(wǎng)絡(luò)設(shè)備進行通信。
可選的,網(wǎng)絡(luò)設(shè)備10還包括存儲器16、總線18等部件。其中,存儲器16與網(wǎng)絡(luò)接口14分別通過總線18與處理器12相連。
存儲器16可用于存儲軟件程序以及模塊。具體的,存儲器16可存儲操作系統(tǒng)162、至少一個功能所需的應(yīng)用程序164。操作系統(tǒng)162可以是實時操作系統(tǒng)(realtimeexecutive,rtx)、林納斯操作系統(tǒng)(linux)、尤尼斯操作系統(tǒng)(unix)或視窗操作系統(tǒng)(windows)。
請參考圖3-1,其為本發(fā)明實施例提供的一種故障定位模型的生成方法的流程圖,該故障定位模型的生成方法可以包括如下幾個步驟:
步驟301、網(wǎng)絡(luò)設(shè)備對虛擬化網(wǎng)絡(luò)中產(chǎn)生的告警信息進行壓縮處理,以去除重復(fù)的告警信息。
告警信息是虛擬化網(wǎng)絡(luò)中某個網(wǎng)元發(fā)生故障時發(fā)出的信息,但由于虛擬化網(wǎng)絡(luò)中的多個網(wǎng)元可能對于同一個故障各自發(fā)出告警信息,這使得重復(fù)的告警信息較多。網(wǎng)絡(luò)設(shè)備在生成故障定位模型時,去除重復(fù)的告警信息能夠減少生成故障定位模型時的計算量。
本發(fā)明實施例可以通過相關(guān)技術(shù)中的告警壓縮(alarmdeduplication)方法來對重復(fù)的告警信息進行壓縮處理。告警壓縮方法可以參考相關(guān)技術(shù),在此不再贅述。
步驟302、網(wǎng)絡(luò)設(shè)備確定虛擬化網(wǎng)絡(luò)中告警信息產(chǎn)生的時間信息。
網(wǎng)絡(luò)設(shè)備可以從虛擬化網(wǎng)絡(luò)中用于管理的網(wǎng)元中獲取告警信息產(chǎn)生的時間信息,該時間信息可以記錄有當前時刻之前的多個告警信息的產(chǎn)生時刻。
步驟303、網(wǎng)絡(luò)設(shè)備根據(jù)時間信息獲取虛擬化網(wǎng)絡(luò)中告警信息產(chǎn)生時各個網(wǎng)元的日志。
虛擬化網(wǎng)絡(luò)中,日志是每個網(wǎng)元的運行記錄,每個日志可以記載著日期、時間、使用者及動作等相關(guān)操作的描述。由于日志的數(shù)據(jù)量較為龐大,為了減少數(shù)據(jù)處理量,網(wǎng)絡(luò)設(shè)備可以在生成故障定位模型時獲取歷史記錄中,告警信息產(chǎn)生時各個網(wǎng)元的日志。這里的告警信息是指去除了重復(fù)告警信息后的告警信息。告警信息產(chǎn)生時可以是指包括告警信息產(chǎn)生時刻在內(nèi)的一個時間段,而告警信息產(chǎn)生時刻可以是記錄在告警信息內(nèi)的一個時刻,也可以是網(wǎng)絡(luò)設(shè)備發(fā)現(xiàn)告警信息的時刻,這兩個時刻的時間差可以忽略不計。
虛擬化網(wǎng)絡(luò)中某些硬件部件的性能可能在一個較長的時間內(nèi)逐漸降低直至失效,在失效的那一刻與失效的前一刻相比,在日志上可能沒有較大的變化,如果僅通過失效那一刻的日志來進行分析的話,可能難以分析出準確的故障位置,因而為了提高日志的全面性和可靠性,網(wǎng)絡(luò)設(shè)備可以分別獲取當前時刻(生成故障定位模型的時刻)之前的多個時間段中告警信息產(chǎn)生時的日志,在這多個時間段的每一時間段中,虛擬化網(wǎng)絡(luò)都可能發(fā)生有多次故障,因而各個時間段的日志中可以包括多次故障時的日志。示例性的,可以獲取當前時刻至當前時刻之前30分鐘的日志,當前時刻之前30分鐘至當前時刻之前60分鐘的日志,當前時刻之前1小時至當前時刻之前2小時的日志,當前時刻之前2小時至當前時刻之前6小時的日志等多個時段的日志,這樣網(wǎng)絡(luò)設(shè)備就能夠在一個較長的時間段來分析虛擬化網(wǎng)絡(luò)中出現(xiàn)的故障。
本發(fā)明實施例中的虛擬化網(wǎng)絡(luò)可以為網(wǎng)絡(luò)功能虛擬化(networkfunctionvirtualization,nfv)網(wǎng)絡(luò),nfv網(wǎng)絡(luò)的結(jié)構(gòu)可以如圖3-2所示,其中,運營支撐系統(tǒng)(operationssupportsystems,oss)/業(yè)務(wù)支撐系統(tǒng)(businesssupportsystem,bss)為nfv網(wǎng)絡(luò)的支撐系統(tǒng);網(wǎng)元管理系統(tǒng)(elementmanagementsystem,ems)用于管理vnf;協(xié)調(diào)器(orchestrator)用于進行網(wǎng)絡(luò)業(yè)務(wù)、vnf與資源(該資源可以包括計算資源、網(wǎng)絡(luò)資源和存儲資源等)的總體管理,是整個nfv架構(gòu)的控制核心;虛擬化網(wǎng)絡(luò)功能管理器(virtualnetworkfunctionmanager,vnfm)用于vnf的資源和生命周期等的管理;網(wǎng)絡(luò)功能虛擬化基礎(chǔ)設(shè)施(networkfunctionsvirtualisationinfrastructure,nfvi)是一種包含網(wǎng)絡(luò)設(shè)備、虛擬化管理程序、操作系統(tǒng)、虛擬機、虛擬交換機和網(wǎng)絡(luò)資源的云數(shù)據(jù)中心;虛擬化的基礎(chǔ)設(shè)施管理器(virtualinfrastructuremanager,vim)用于對nfvi的資源進行管理和監(jiān)控。nfv的架構(gòu)還可以參考相關(guān)技術(shù),在此不再贅述。
本發(fā)明實施例獲取的各個網(wǎng)元的日志等數(shù)據(jù)可以來源于圖3-2中的oss、vnf、vnfm和vim。
在圖3-2所示的架構(gòu)中,vnf是運行于vm中的,而vm又運行于host中,示例性的,該運行方式的結(jié)構(gòu)可以如圖3-3所示,其中,vnf2運行于兩個虛擬機vm2和vm3上,而vm2運行于host1中,vm3運行于host2中,圖3-3中的多個host可以相當于圖3-2中的nfvi。網(wǎng)絡(luò)設(shè)備可以從vnfm中獲取vnf和vm的對應(yīng)關(guān)系,可以從vim中獲取vm和host的對應(yīng)關(guān)系。
本發(fā)明實施例中的vnf可以是各種電信軟件,電信軟件是用于實現(xiàn)各種電信功能的軟件,如歸屬位置寄存器(homelocationregister,hlr)和拜訪位置寄存器(visitorlocationregister,vlr)等。
在獲取日志時,網(wǎng)絡(luò)設(shè)備可以獲取告警信息所對應(yīng)的vnf(一個vnf發(fā)出告警信息,則可以稱該告警信息與該vnf對應(yīng))所在的vm(vnf運行于某個vm時,可以稱該vm為該vnf所在的vm)的影響范圍(vm的影響范圍可以包括運行于其上的vnf,以及運行有該vm的host)內(nèi)的日志,即vnf的日志、vnf所在的vm的日志,vm所在的host(vm運行于某個host時,可以稱該host為該vm所在的host)的日志。
此外,由于一個故障可能會影響多個網(wǎng)元,因而一個故障可以會使網(wǎng)絡(luò)設(shè)備獲取多組日志,示例性的,vnf1存在故障e1,則vnf1會上報告警信息m1,同時該故障e1也會影響到vnf3,則vnf3也會上報一個告警信息m2,這樣網(wǎng)絡(luò)設(shè)備就會獲取兩組日志:1、告警信息m1所對應(yīng)的vnf1的日志,vnf1所在的vm1的日志以及vm1所在的host1的日志;2、告警信息m2所對應(yīng)的vnf3的日志,vnf3所在的vm4的日志以及vm4所在的host2的日志。
為了便于組織數(shù)據(jù),網(wǎng)絡(luò)設(shè)備可以將告警信息和vnf對應(yīng)起來,獲取粒度較為統(tǒng)一的數(shù)據(jù)。告警信息中通常包括告警源信息,多數(shù)的告警源信息用于指示該告警信息是由哪個網(wǎng)元發(fā)出的,對于該類告警源信息,網(wǎng)絡(luò)設(shè)備能夠通過獲取的vnf、vm和host的對應(yīng)關(guān)系(這三者的對應(yīng)關(guān)系可以參考圖3-3及其說明)將該告警源所述的告警信息與vnf對應(yīng),示例性的,告警信息b中的告警源信息指示告警信息b是由host1發(fā)出,則可以根據(jù)host和vm的對應(yīng)關(guān)系將host1和某個vm對應(yīng),再根據(jù)vm和vnf的對應(yīng)關(guān)系將該某個vm和某個vnf對應(yīng)起來,進而可以將告警信息b和該某個vnf對應(yīng)起來,其中host可以與多個vm對應(yīng),vm可以與多個vnf對應(yīng),進而告警信息也可以與多個vnf對應(yīng),本發(fā)明實施例不作出限制。還有部分告警源信息記載了管理對象實體(managementobjectinstance,moi)信息,moi信息是電信軟件標準中定義管理對象類(managementobjectclass,moc)的功能實體,對于這類告警信息,網(wǎng)絡(luò)設(shè)備可以從vnf中導(dǎo)出網(wǎng)元配置信息,遵循電信標準,獲得告警信息和vnf的對應(yīng)關(guān)系。
此外,本發(fā)明實施例中的虛擬化網(wǎng)絡(luò)還可以是云計算(cloudcomputing)數(shù)據(jù)中心網(wǎng)絡(luò)等應(yīng)用了虛擬化技術(shù)的網(wǎng)絡(luò)。
步驟304、網(wǎng)絡(luò)設(shè)備將各個網(wǎng)元的日志中相關(guān)聯(lián)的日志進行拼接,得到虛擬化網(wǎng)絡(luò)中告警信息產(chǎn)生時的日志數(shù)據(jù)。
虛擬化網(wǎng)絡(luò)中可能存在業(yè)務(wù)遷移的可能,即同一個vnf在不同的時間點運行于不同的vm上,相關(guān)聯(lián)的日志可以是指同一個vnf運行于不同的vm上的日志,網(wǎng)絡(luò)設(shè)備可以從圖3-2所示的架構(gòu)中的vnfm中獲取業(yè)務(wù)遷移信息,并根據(jù)該業(yè)務(wù)遷移信息將這些不同的vm中的相關(guān)聯(lián)的日志合并起來作為一個vnf的日志,這樣就能夠獲得較為完整的日志,提高日志數(shù)據(jù)的可靠性。
本步驟所得到的日志數(shù)據(jù)中可以包括各個網(wǎng)元不相關(guān)聯(lián)的日志以及合并后的相關(guān)聯(lián)的日志。
步驟305、網(wǎng)絡(luò)設(shè)備對日志數(shù)據(jù)進行數(shù)據(jù)清洗,去除日志數(shù)據(jù)中與故障定位無關(guān)的數(shù)據(jù)。
由于日志數(shù)據(jù)中存在大量和故障定位無關(guān)的數(shù)據(jù),這些數(shù)據(jù)作為數(shù)據(jù)挖掘分類算法的訓(xùn)練數(shù)據(jù)的價值較低,因而可以通過數(shù)據(jù)清洗來刪除這些數(shù)據(jù)。
在進行數(shù)據(jù)清洗時,網(wǎng)絡(luò)設(shè)備可以刪除日志數(shù)據(jù)中的非字母字符、與故障定位無關(guān)的數(shù)字字符(可以通過數(shù)字字符的上下文來判斷其是否與故障定位有關(guān),示例性的,可以根據(jù)數(shù)字字符在上下文中出現(xiàn)的頻次來確定其是否與故障定位有關(guān),將出現(xiàn)頻次小于預(yù)設(shè)值的數(shù)字字符確定為與故障定位無關(guān)的數(shù)字字符,將出現(xiàn)頻次大于預(yù)設(shè)值的數(shù)字字符確定為與故障定位有關(guān)的數(shù)字字符)、空行、重復(fù)行和高頻詞中的至少一種;和/或,網(wǎng)絡(luò)設(shè)備將日志數(shù)據(jù)中的多行日志轉(zhuǎn)換為單行日志,日志數(shù)據(jù)中一條信息可能占用了多行,將多行日志轉(zhuǎn)換為單行日志能夠提高日志數(shù)據(jù)中信息的完整性。
步驟306、網(wǎng)絡(luò)設(shè)備獲取數(shù)據(jù)清洗后的日志數(shù)據(jù)中的至少一個關(guān)鍵詞。
如圖3-4所示,網(wǎng)絡(luò)設(shè)備獲取數(shù)據(jù)清洗后的日志數(shù)據(jù)中的至少一個關(guān)鍵詞的流程可以包括下面4個子步驟:
子步驟3061、網(wǎng)絡(luò)設(shè)備將數(shù)據(jù)清洗后的日志數(shù)據(jù)中,每次告警信息產(chǎn)生時的日志數(shù)據(jù)分割為故障日志數(shù)據(jù)和正常日志數(shù)據(jù)。
其中,故障日志數(shù)據(jù)為包括告警信息產(chǎn)生時刻的第一預(yù)設(shè)時間段的日志數(shù)據(jù),正常日志數(shù)據(jù)為第一預(yù)設(shè)時間段之前的第二預(yù)設(shè)時間段的日志數(shù)據(jù)。示例性的,第一預(yù)設(shè)時間段可以為告警信息產(chǎn)生時刻之前5分鐘至告警信息產(chǎn)生時刻后的3分鐘的時間段。正常日志數(shù)據(jù)為第一預(yù)設(shè)時間段之前的第二預(yù)設(shè)時間段的日志數(shù)據(jù)。示例性的,第二預(yù)設(shè)時間段可以為告警信息產(chǎn)生前的5分鐘至告警信息產(chǎn)生前12分鐘的時間段。
網(wǎng)絡(luò)設(shè)備將每次告警信息產(chǎn)生時的日志數(shù)據(jù)分為故障日志數(shù)據(jù)和正常日志數(shù)據(jù)能夠便于后續(xù)將這兩種日志數(shù)據(jù)進行比較。
子步驟3062、網(wǎng)絡(luò)設(shè)備判斷數(shù)據(jù)清洗后的日志數(shù)據(jù)中,每次告警信息產(chǎn)生時的日志數(shù)據(jù)中是否同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù);在并非同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)時,執(zhí)行步驟3063,在同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)時,執(zhí)行步驟3064。
對于虛擬化網(wǎng)絡(luò)中任意一個告警信息產(chǎn)生時的日志數(shù)據(jù),數(shù)據(jù)清洗可能會清除掉其中的故障日志數(shù)據(jù)或正常日志數(shù)據(jù),網(wǎng)絡(luò)設(shè)備可以以此做判斷,并分情況進行處理。
在數(shù)據(jù)清洗后的日志數(shù)據(jù)中,任一告警信息產(chǎn)生時的日志數(shù)據(jù)中并非同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)時,說明該任一告警信息產(chǎn)生時的故障日志數(shù)據(jù)和正常日志數(shù)據(jù)的相似度可能較小,在任一告警信息產(chǎn)生時的日志數(shù)據(jù)中同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)時,說明該任一告警信息產(chǎn)生時的故障日志數(shù)據(jù)和正常日志數(shù)據(jù)的相似度可能較大。這是因為數(shù)據(jù)清洗后的故障日志數(shù)據(jù)和正常日志數(shù)據(jù),均是通過數(shù)據(jù)清洗這一個相同的規(guī)則篩選后的剩余數(shù)據(jù),在篩選后的剩余數(shù)據(jù)僅包括其中的一種數(shù)據(jù)時,說明故障日志數(shù)據(jù)和正常日志數(shù)據(jù)的相似度可能較小,而在篩選后的剩余數(shù)據(jù)同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)時,說明故障日志數(shù)據(jù)和正常日志數(shù)據(jù)的相似度可能較大。
子步驟3063、網(wǎng)絡(luò)設(shè)備獲取任一告警信息產(chǎn)生時的日志數(shù)據(jù)中的至少一個關(guān)鍵詞。
在數(shù)據(jù)清洗后的日志數(shù)據(jù)中,任一告警信息產(chǎn)生時的日志數(shù)據(jù)中并非同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)時,該任一告警信息產(chǎn)生時的故障日志數(shù)據(jù)和正常日志數(shù)據(jù)的相似度可能較小,這說明虛擬化網(wǎng)絡(luò)在發(fā)生該任一故障時,日志的變化較大,此時獲取該任一告警信息產(chǎn)生時的日志數(shù)據(jù)中的至少一個關(guān)鍵詞即為與故障定位相關(guān)性較高的關(guān)鍵詞。
本發(fā)明實施例可以通過信息檢索數(shù)據(jù)挖掘的常用加權(quán)(termfrequency–inversedocumentfrequency,tf-idf)算法、主題模型(topicmodel)算法和文本排名(textrank)算法等算法來獲取日志數(shù)據(jù)中的關(guān)鍵詞。此外,本發(fā)明實施例還可以通過其他算法來獲取關(guān)鍵詞,本發(fā)明實施例不作出限制。
子步驟3064、網(wǎng)絡(luò)設(shè)備判斷正常日志數(shù)據(jù)和故障日志數(shù)據(jù)的相似度是否小于預(yù)設(shè)值;在相似度小于預(yù)設(shè)值時,執(zhí)行子步驟3065,在相似度不小于預(yù)設(shè)值時,執(zhí)行子步驟3063。
在數(shù)據(jù)清洗后的日志數(shù)據(jù)中,任一告警信息產(chǎn)生時的日志數(shù)據(jù)中同時包括正常日志數(shù)據(jù)和故障日志數(shù)據(jù)時,說明該任一告警信息產(chǎn)生時的日志數(shù)據(jù)中正常日志數(shù)據(jù)和故障日志數(shù)據(jù)的相似度可能較大,此時可以直接判斷正常日志數(shù)據(jù)和故障日志數(shù)據(jù)的相似度是否小于預(yù)設(shè)值。該預(yù)設(shè)值可以由操作人員預(yù)先通過多次試驗獲得。
網(wǎng)絡(luò)設(shè)備可以通過正常日志數(shù)據(jù)和故障日志數(shù)據(jù)中的共有詞的數(shù)量來獲取正常日志數(shù)據(jù)和故障日志數(shù)據(jù)相似度,或者可以通過漢明距離算法來獲取正常日志數(shù)據(jù)和故障日志數(shù)據(jù)相似度,或者可以通過編輯距離算法來獲取正常日志數(shù)據(jù)和故障日志數(shù)據(jù)相似度。
子步驟3065、網(wǎng)絡(luò)設(shè)備獲取任一告警信息產(chǎn)生時的日志數(shù)據(jù)的至少一個關(guān)鍵詞,并將任一告警信息產(chǎn)生時的日志數(shù)據(jù)中的數(shù)字字符作為關(guān)鍵詞。
在相似度不小于預(yù)設(shè)值時,表明任一告警信息產(chǎn)生時的故障日志數(shù)據(jù)和正常日志數(shù)據(jù)的相似度過高,此時如果僅獲取日志數(shù)據(jù)中的關(guān)鍵詞可能無法較為全面的分析該任一告警信息產(chǎn)生時虛擬化網(wǎng)絡(luò)發(fā)生的故障,因而可以將日志數(shù)據(jù)中的數(shù)字字符也作為關(guān)鍵詞,數(shù)字字符中也有存在與故障定位有關(guān)聯(lián)的數(shù)據(jù)的可能。示例性的,正常日志數(shù)據(jù)中記錄了內(nèi)存使用率為10%,而故障日志數(shù)據(jù)中記錄了內(nèi)存使用率為70%,則用于記錄內(nèi)存占用率的數(shù)字10和70就可能與故障定位存在關(guān)聯(lián)。
步驟307、網(wǎng)絡(luò)設(shè)備根據(jù)至少一個關(guān)鍵詞將日志數(shù)據(jù)轉(zhuǎn)換為日志特征。
日志特征用于后續(xù)作為生成故障定位模型的訓(xùn)練數(shù)據(jù)。而對于網(wǎng)絡(luò)設(shè)備獲取的至少一個關(guān)鍵詞中的第一關(guān)鍵詞(第一關(guān)鍵詞為至少一個關(guān)鍵詞中的任一關(guān)鍵詞),網(wǎng)絡(luò)設(shè)備可以根據(jù)第一關(guān)鍵詞生成關(guān)于第一關(guān)鍵詞的日志特征,該關(guān)于第一關(guān)鍵詞的日志特征用于指示數(shù)據(jù)清洗后的日志數(shù)據(jù)中的每個日志是否包括該第一關(guān)鍵詞。即關(guān)于一個關(guān)鍵詞的日志特征可以為一個判斷條件,用于判斷數(shù)據(jù)清洗后的日志數(shù)據(jù)中的每個日志是否包括該關(guān)鍵詞,并根據(jù)日志中是否包括該關(guān)鍵詞做出不同的評價。示例性的,關(guān)于關(guān)鍵詞k的日志特征,日志a包括關(guān)鍵詞k時,可以將該日志的特征值設(shè)為1,而在日志a不包括該關(guān)鍵詞時,可以將日志a的特征值設(shè)置為0。
步驟301至步驟307為本發(fā)明實施例提供的一種獲取日志特征的流程。通過步驟301至步驟306,網(wǎng)絡(luò)設(shè)備能夠從大量的日志中獲取日志特征。此外,網(wǎng)絡(luò)設(shè)備還可以根據(jù)文檔頻率(documentfrequency,df)算法、交互信息(mutualinformation,mi)、信息增益(informationgain,ig)和卡方(chi-square)算法來生成日志特征,本發(fā)明實施例不作出限制。
步驟308、網(wǎng)絡(luò)設(shè)備根據(jù)日志特征獲取訓(xùn)練數(shù)據(jù)。
本步驟可以包括三種實施方式:
第一種實施方式,如圖3-5所示,本方式可以包括下面1個子步驟:
子步驟3081,網(wǎng)絡(luò)設(shè)備將日志特征作為訓(xùn)練數(shù)據(jù)。
第二種實施方式,如圖3-6所示,本方式可以包括下面4個子步驟:
子步驟3082,網(wǎng)絡(luò)設(shè)備根據(jù)虛擬化網(wǎng)絡(luò)中任一告警信息與該任一告警信息對應(yīng)的日志特征生成日志特征序列。
其中,任一告警信息對應(yīng)的日志特征為根據(jù)該任一告警信息產(chǎn)生時的日志數(shù)據(jù)獲取的日志特征。示例性的,根據(jù)告警信息m1產(chǎn)生時的日志數(shù)據(jù)獲取了日志特征1、日志特征2、日志特征3、日志特征4和日志特征5,則可以生成一個日志特征序列,該日志特征序列中記錄有日志特征1、日志特征2、日志特征3、日志特征4和日志特征5,且該日志特征序列與告警信息m1對應(yīng)。
子步驟3083,網(wǎng)絡(luò)設(shè)備通過序列模式挖掘算法挖掘日志特征序列,得到至少一個候選序列特征。
序列模式挖掘(sequencepatternmining)算法是一種用于處理序列數(shù)據(jù)的算法,該算法能夠根據(jù)序列數(shù)據(jù)得到多種序列的組合模式,網(wǎng)絡(luò)設(shè)備可以將這多種序列的組合模式中每種序列的組合模式作為一個候選序列特征。
本發(fā)明實施例中,網(wǎng)絡(luò)設(shè)備可以通過前綴投影的模式挖掘(prefix-projectedpatterngrowth,prefixspan)算法或廣義序列模式挖掘算法(generalizedsequentialpatternminingalgorithm,gsp)等算法來挖掘日志特征序列。
子步驟3084,網(wǎng)絡(luò)設(shè)備通過序列選擇算法從至少一個候選序列特征挑選出與故障定位相關(guān)的序列特征。
通過序列挖掘算法得到的候選序列特征通常較多,網(wǎng)絡(luò)設(shè)備可以通過序列選擇算法來篩選出可能和故障定位較為相關(guān)的序列特征,以減少所要處理的數(shù)據(jù)量。序列選擇算法可以參考相關(guān)技術(shù),在此不再贅述。
本步驟得到的序列特征能夠反應(yīng)虛擬化網(wǎng)絡(luò)在一個較長周期中的變化。
子步驟3085,網(wǎng)絡(luò)設(shè)備將序列特征和日志特征作為訓(xùn)練數(shù)據(jù)。
將序列特征和日志特征共同作為訓(xùn)練數(shù)據(jù),能夠更為全面的反應(yīng)虛擬化網(wǎng)絡(luò)中的各種特征。
第三種實施方式,如圖3-7所示,本步驟可以包括下面2個子步驟:
子步驟3086、網(wǎng)絡(luò)設(shè)備根據(jù)虛擬化網(wǎng)絡(luò)中的告警信息、性能統(tǒng)計數(shù)據(jù)、虛擬機信息和主機信息中的至少一種信息得到虛擬化網(wǎng)絡(luò)的專家特征。
專家特征(domainknowledgefeatures)是本領(lǐng)域?qū)<腋鶕?jù)各自的經(jīng)驗來獲取的一種特征。不同的專家可能根據(jù)不同的方法獲取不同的專家特征,以圖3-2提供的nfv架構(gòu)為例,其中的性能統(tǒng)計數(shù)據(jù)(performancestatistics)可以來源于oss、虛擬機信息可以來源于vnfm、主機信息可以來源于vim。此外,網(wǎng)絡(luò)設(shè)備還可以根據(jù)其他信息來獲取專家特征,如oss、vnf、vnfm和vim所獲取的其他信息等。
子步驟3087、網(wǎng)絡(luò)設(shè)備將專家特征和日志特征作為訓(xùn)練數(shù)據(jù)。
專家特征和日志特征共同作為訓(xùn)練數(shù)據(jù)可以提高訓(xùn)練數(shù)據(jù)的可靠性。
此外,網(wǎng)絡(luò)設(shè)備在獲取訓(xùn)練數(shù)據(jù)時,還可以將日志特征、序列特征和專家特征這三者共同作為訓(xùn)練數(shù)據(jù),或者將序列特征作為訓(xùn)練數(shù)據(jù),或者將序列特征和專家特征作為訓(xùn)練數(shù)據(jù)等,本發(fā)明實施例不作出限制。
步驟309、網(wǎng)絡(luò)設(shè)備通過數(shù)據(jù)挖掘分類算法將訓(xùn)練數(shù)據(jù)訓(xùn)練為虛擬化網(wǎng)絡(luò)的故障定位模型。
本發(fā)明實施例所使用的數(shù)據(jù)挖掘分類算法可以包括k最鄰近(k-nearestneighbor,knn)算法、支持向量機(supportvectormachine,svm)算法、向量空間模型(vectorspacemodel;,vsm)算法、貝葉斯分類(bayesianclassifier)算法和神經(jīng)網(wǎng)絡(luò)分類算法(neuralnetworkalgorithm)等。通過這些數(shù)據(jù)挖掘分類算法,能夠?qū)⒂?xùn)練數(shù)據(jù)訓(xùn)練為故障定位模型。
步驟310、網(wǎng)絡(luò)設(shè)備對故障定位模型進行調(diào)優(yōu)。
在得到故障定位模型之后,網(wǎng)絡(luò)設(shè)備可以通過各種方式來對故障模型進行調(diào)優(yōu),以提高該故障定位模型的可靠性。示例性的,可以根據(jù)故障定位模型處于過擬合(overfitting)狀態(tài)或欠擬合(underfitting)狀態(tài)來對該故障定位模型進行調(diào)優(yōu)。
本發(fā)明實施例所生成的故障定位模型,可以根據(jù)告警信息與vnf以及vm的對應(yīng)關(guān)系,定位出是哪一個vm發(fā)生了什么故障,之后可以根據(jù)情況進行處理。示例性的,vm1發(fā)生了內(nèi)存故障,則說明vm1所在的host1的內(nèi)存可能存在問題,可以將vm1所在的host1上運行的vm全轉(zhuǎn)移到其它host上,或者定位到vm2運行的軟件故障,那么就可以采取重新初始化vm2,或者以回退軟件版本的方式來解決vm2運行的軟件故障。
綜上所述,本發(fā)明實施例提供的故障定位模型的生成方法,通過獲取告警信息產(chǎn)生時的日志數(shù)據(jù),根據(jù)該日志數(shù)據(jù)來逐步獲取訓(xùn)練數(shù)據(jù),并根據(jù)該訓(xùn)練數(shù)據(jù)訓(xùn)練得到故障定位模型,將告警信息和訓(xùn)練數(shù)據(jù)關(guān)聯(lián)了起來,相較于相關(guān)技術(shù)中訓(xùn)練數(shù)據(jù)可能遺漏大量和故障定位有關(guān)的信息,提高了依靠訓(xùn)練數(shù)據(jù)生成的故障定位模型的可靠性。
請參考圖4-1,其為本發(fā)明實施例提供的一種故障定位方法的流程圖,該故障定位方法可以包括如下幾個步驟:
步驟401、在虛擬化網(wǎng)絡(luò)發(fā)生故障時,網(wǎng)絡(luò)設(shè)備獲取虛擬化網(wǎng)絡(luò)的故障定位模型。
該故障定位模型可以是圖3-1所示實施例提供的方法生成的故障定位模型。該故障定位模型可以是預(yù)先生成的,也可以是在故障發(fā)生后生成的。本發(fā)明實施例所涉及的虛擬化網(wǎng)絡(luò),與圖3-1所示實施例所涉及的虛擬化網(wǎng)絡(luò)為同一個虛擬化網(wǎng)絡(luò)。
步驟402、網(wǎng)絡(luò)設(shè)備根據(jù)該故障定位模型對虛擬化網(wǎng)絡(luò)發(fā)生的故障進行定位。
如圖4-2所示,網(wǎng)絡(luò)設(shè)備根據(jù)故障定位模型對虛擬化網(wǎng)絡(luò)發(fā)生的故障進行定位的流程可以包括下面兩個子步驟:
子步驟4021、網(wǎng)絡(luò)設(shè)備獲取當前故障的訓(xùn)練數(shù)據(jù)。
網(wǎng)絡(luò)設(shè)備可以通過圖3-1所示實施例中的步驟301至步驟308生成當前故障的訓(xùn)練數(shù)據(jù)。本步驟獲取的訓(xùn)練數(shù)據(jù)與圖3-1所示實施例中獲取的訓(xùn)練數(shù)據(jù)的不同之處是本步驟是根據(jù)當前告警信息產(chǎn)生時的數(shù)據(jù)(告警信息產(chǎn)生時的數(shù)據(jù)可以參考圖3-1所示實施例中的步驟3054)生成的訓(xùn)練數(shù)據(jù),而圖3-1所示實施例中是根據(jù)當前時刻之前的一段時間的數(shù)據(jù)生成的訓(xùn)練數(shù)據(jù)。
子步驟4022、網(wǎng)絡(luò)設(shè)備將當前故障的訓(xùn)練數(shù)據(jù)輸入故障定位模型,獲取故障定位結(jié)果。
定位結(jié)果可以是對故障位置的一個預(yù)測結(jié)果,操作人員可以根據(jù)該預(yù)測結(jié)果來對虛擬化網(wǎng)絡(luò)進行修復(fù)。修復(fù)方法可以參考相關(guān)技術(shù),在此不再贅述。
綜上所述,本發(fā)明實施例提供的故障定位方法,通過獲取將訓(xùn)練數(shù)據(jù)中的告警信息和日志數(shù)據(jù)關(guān)聯(lián)起來的故障定位模型,并根據(jù)該故障定位模型來對發(fā)生的故障進行定位,增加了定位結(jié)果的可靠性。
下述為本申請的裝置實施例,可以用于執(zhí)行本申請的方法實施例。對于本申請裝置實施例中未披露的細節(jié),請參照本申請方法實施例。
請參考圖5-1,其為本發(fā)明實施例提供的一種故障定位模型的生成裝置的框圖,該故障定位模型的生成裝置500可以包括:
時間確定模塊510,用于實現(xiàn)上述步驟302的功能。
日志數(shù)據(jù)獲取模塊520,用于實現(xiàn)上述步驟303至步驟305的功能。
日志特征獲取模塊530,用于實現(xiàn)上述步驟305至步驟307的功能。
訓(xùn)練數(shù)據(jù)獲取模塊540,用于實現(xiàn)上述步驟308的功能。
模型訓(xùn)練模塊550,用于實現(xiàn)上述步驟309的功能。
可選的,如圖5-2所示,日志特征獲取模塊530,包括:
關(guān)鍵詞獲取子模塊531,用于實現(xiàn)上述步驟306的功能。
特征生成子模塊532,用于實現(xiàn)上述步驟307的功能。
可選的,如圖5-3所示,故障定位模型的生成裝置500,還包括:
告警壓縮模塊560,用于實現(xiàn)上述步驟301的功能。
可選的,如圖5-4所示,關(guān)鍵詞獲取子模塊531,包括:
清洗單元5311,用于實現(xiàn)上述步驟305的功能。
關(guān)鍵詞獲取單元5312,用于實現(xiàn)上述子步驟3061至子步驟3065的功能。
可選的,訓(xùn)練數(shù)據(jù)獲取模塊,用于實現(xiàn)上述子步驟3081至子步驟3087的功能。
綜上所述,本發(fā)明實施例提供的故障定位模型的生成裝置,通過獲取告警信息產(chǎn)生時的日志數(shù)據(jù),根據(jù)該日志數(shù)據(jù)來逐步獲取訓(xùn)練數(shù)據(jù),并根據(jù)該訓(xùn)練數(shù)據(jù)訓(xùn)練得到故障定位模型,將告警信息和訓(xùn)練數(shù)據(jù)關(guān)聯(lián)了起來,提高了依靠訓(xùn)練數(shù)據(jù)生成的故障定位模型的可靠性。
請參考圖6,其為本發(fā)明實施例提供的一種故障定位裝置的框圖,該故障定位裝置600可以包括:
模型獲取模塊610,用于實現(xiàn)上述步驟401的功能。
定位模塊620,用于實現(xiàn)上述步驟402的功能。
綜上所述,本發(fā)明實施例提供的故障定位裝置,通過獲取將訓(xùn)練數(shù)據(jù)中的告警信息和日志數(shù)據(jù)關(guān)聯(lián)起來的故障定位模型,并根據(jù)該故障定位模型來對發(fā)生的故障進行定位,增加了定位結(jié)果的可靠性。
本發(fā)明中術(shù)語“a和b的至少一種”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,a和b的至少一種,可以表示:單獨存在a,同時存在a和b,單獨存在b這三種情況。同理,“a、b和c的至少一種”表示可以存在七種關(guān)系,可以表示:單獨存在a,單獨存在b,單獨存在c,同時存在a和b,同時存在a和c,同時存在c和b,同時存在a、b和c這七種情況。同理,“a、b、c和d的至少一種”表示可以存在十五種關(guān)系,可以表示:單獨存在a,單獨存在b,單獨存在c,單獨存在d,同時存在a和b,同時存在a和c,同時存在a和d,同時存在c和b,同時存在d和b,同時存在c和d,同時存在a、b和c,同時存在a、b和d,同時存在a、c和d,同時存在b、c和d,同時存在a、b、c和d,這十五種情況。
在上述實施例中,可以全部或部分地通過軟件、硬件、固件或者其任意組合來實現(xiàn)。當使用軟件實現(xiàn)時,可以全部或部分地以計算機程序產(chǎn)品的形式實現(xiàn),所述計算機程序產(chǎn)品包括一個或多個計算機指令。在計算機上加載和執(zhí)行所述計算機程序指令時,全部或部分地產(chǎn)生按照本申請實施例所述的流程或功能。所述計算機可以是通用計算機、計算機網(wǎng)絡(luò)、或者其他可編程裝置。所述計算機指令可以存儲在計算機的可讀存儲介質(zhì)中,或者從一個計算機可讀存儲介質(zhì)向另一個計算機可讀存儲介質(zhì)傳輸,例如,所述計算機指令可以從一個網(wǎng)站站點、計算機、服務(wù)器或數(shù)據(jù)中心通過有線(例如同軸電纜、光纖、數(shù)字用戶線)或無線(例如紅外、無線、微波等)方式向另一個網(wǎng)站站點、計算機、服務(wù)器或數(shù)據(jù)中心傳輸。所述計算機可讀存儲介質(zhì)可以是計算機能夠存取的任何可用介質(zhì)或者包含一個或多個可用介質(zhì)集成的服務(wù)器、數(shù)據(jù)中心等數(shù)據(jù)存儲設(shè)備。所述可用介質(zhì)可以是磁性介質(zhì)(例如,軟盤、硬盤、磁帶)、光介質(zhì),或者半導(dǎo)體介質(zhì)(例如固態(tài)硬盤)等。
在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述模塊的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個模塊或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。以上所述僅為本申請的可選實施例,并不用以限制本申請,凡在本申請的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本申請的保護范圍之內(nèi)。