本發(fā)明涉及計算機技術領域,特別涉及一種關鍵運行日志提取方法及裝置。
背景技術:
在計算機系統(tǒng)中,通常包括有多個功能模塊,每個功能模塊包括多個操作流程,每個操作流程均包括多個操作步驟,通過執(zhí)行各個操作步驟,即可以完成整個操作流程,從而可以實現各種系統(tǒng)業(yè)務。然而,計算機系統(tǒng)在實際運行過程中,可能會出現系統(tǒng)故障等問題,當出現該類問題時,通常需要進行運維分析。其中,在運維分析過程中,為了能夠精確地定位到具體哪個操作流程中的哪個操作步驟出現了故障,需要從各個操作流程執(zhí)行多個操作步驟后生成的系統(tǒng)運行日志中,提取能夠反應該多個操作步驟的多條運行日志,這里將該多條運行日志稱之為關鍵運行日志。
在現有技術中,通常是通過統(tǒng)計的方式提取該關鍵運行日志,其具體實現過程包括:通過遍歷的方式,從各個操作流程執(zhí)行多個操作步驟后生成的系統(tǒng)運行日志中,確定指定分詞,該指定分詞是指在該系統(tǒng)運行日志中出現次數最多的分詞,之后,確定該指定分詞在該系統(tǒng)運行日志包括的每條運行日志中出現的次數,并按照出現次數從大到小的順序,對該系統(tǒng)運行日志包括的多條運行日志進行排序,按照從前至后的順序,從排序后的多條運行日志中選擇指定數量的運行日志,并將所選擇的運行日志確定為關鍵運行日志。
然而,上述提供的關鍵運行日志提取方法中,由于最終得到的關鍵運行日志是根據指定分詞在每條運行日志中出現的次數排序得到,因此,當系統(tǒng)故障出現在系統(tǒng)運行日志中除該關鍵運行日志之外的其它運行日志中時,用戶則無法準確定位該系統(tǒng)故障,即導致影響運維分析效果。
技術實現要素:
為了解決現有技術的問題,本發(fā)明實施例提供了一種關鍵運行日志提取方法及裝置。所述技術方案如下:
第一方面,提供了一種關鍵運行日志提取方法,所述方法包括:
基于目標操作流程標識,從系統(tǒng)運行日志中,獲取多條目標運行日志,所述系統(tǒng)運行日志為執(zhí)行多個操作流程后生成得到,所述多條目標運行日志為多次執(zhí)行目標操作流程后重復出現的運行日志;基于多個指定維度和所述多個指定維度的權重,確定所述多條目標運行日志的評估總分值,各個評估總分值用于評估各條目標運行日志能夠指示一個操作步驟的能力;基于所述多條目標運行日志的評估總分值,從所述多條目標運行日志中確定所述目標操作流程對應的關鍵運行日志。
其中,目標操縱流程可以用于唯一標識一個目標操作流程。在該系統(tǒng)運行日志中,包括了該目標操作流程對應的關鍵運行日志,該關鍵運行日志是指能夠反應該目標操作流程中的多個操作步驟的運行日志,在本發(fā)明實施例中,基于多個指定維度和該多個指定維度的權重,確定該每條目標運行日志的評估總分值,由于該各個評估總分值用于評估各條目標運行日志能夠指示一個操作步驟的能力,因此,基于該評估總分值,即可以確定該目標操作流程對應的關鍵運行日志。
在本發(fā)明實施例中,基于目標操作流程標識,從執(zhí)行多個操作流程后生成的系統(tǒng)運行日志中,獲取多次執(zhí)行目標操作流程后重復出現的多條目標運行日志,之后,基于多個指定維度和該多個指定維度的權重,確定該多條目標運行日志的評估總分值,其中,由于各個評估總分值評估了各條目標運行日志能夠指示一個操作步驟的能力,因此,基于該多條目標運行日志的評估總分值,可以從該多條目標運行日志中確定該目標操作流程對應的關鍵運行日志,即所確定的關鍵運行日志能夠更加精確地反應該目標操作流程中的各個操作步驟,解決了用戶無法準確定位系統(tǒng)故障的問題,提高了運維分析效果。
結合第一方面,在第一方面的第一種可能的實現方式中,所述基于目標操作流程標識,從系統(tǒng)運行日志中,獲取多條目標運行日志,包括:
從所述系統(tǒng)運行日志中,獲取所述目標操作流程標識對應的多條運行日志;將所述多條運行日志中每條運行日志包括的多個指定格式的日志信息替換成多個預設字符,所述多個指定格式與所述多個預設字符一一對應;從替換后的多條運行日志中,選擇在多次執(zhí)行所述目標操作流程后重復出現的多條運行日志;將選擇的多條運行日志確定為所述多條目標運行日志。
其中,該多個指定格式的日志信息可以包括日志生成時間、日志編號等。在獲取的多條運行日志中,當該多條運行日志中包括多個指定格式的日志信息時,容易影響判斷是否是重復出現的日志。因此,在提取關鍵運行日志之前,處理器110需要將該目標操作流程對應的多條運行日志中的多個指定格式的日志信息進行替換處理,即將該多個指定格式的日志信息替換成多個預設字符,例如,將該多條運行日志中的日志生成時間均替換成TIME(時間),將該多條運行日志中的日志編號均統(tǒng)一替換成ID(Identification,身份標識),用VALUE(值)代替其它指定格式的日志信息。之后,處理器110即可從替換后的多條運行日志中,選擇在多次執(zhí)行該目標操作流程后重復出現的多條運行日志,所選擇的多條運行日志即為上述多條目標運行日志。
在本發(fā)明實施例中,為了避免該目標運行日志中的多個指定格式的日志信息影響對重復日志的判定,在從系統(tǒng)運行日志中獲取多條運行日志后,將該多條運行日志中的多個指定格式的日志信息進行統(tǒng)一替換處理,如此,提高了獲取多條目標運行日志的準確性。
結合第一方面和第一方面的第一種可能的實現方式中任一可能的實現方式,在第一方面的第二種可能的實現方式中,所述基于多個指定維度和所述多個指定維度的權重,確定所述多條目標運行日志的評估總分值,包括:
對于所述多條目標運行日志中的每條目標運行日志,確定所述目標運行日志在所述多個指定維度上的維度評估分值;確定所述目標運行日志的多個維度評估分值與所述多個指定維度中對應指定維度的權重之間的乘積;將所述目標運行日志的多個維度評估分值與所述多個指定維度中對應指定維度的權重之間的乘積之和確定為所述目標運行日志的評估總分值。
需要說明的是,該每個指定維度對應的權重可以由用戶根據實際需求自定義設置,在本發(fā)明實施例中,由于日志相似度和前后日志組件變化量衡量一條目標運行日志所占的比重相對比較大一些,因此,可以將日志相似度和前后日志組件變化量對應的權重設置的比較大一些,其它維度對應的權重設置地比較小一些。在確定的多個乘積之后,將該多個乘積相加,即得到該目標運行日志的評估總分值。
在本發(fā)明實施例中,通過多個指定維度和多個指定維度的權重,來確定每條目標運行日志的評估總分值,提高了對目標運行日志評估的全面性,從而間接地提高了提取關鍵運行日志的精確性。
結合第一方面至第一方面的第二種可能的實現方式中任一可能的實現方式,在第一方面的第三種可能的實現方式中,所述多個指定維度包括日志相似度、日志感情色彩、日志動作色彩、前后日志時間差以及前后日志組件變化量中的至少一種。
其中,該日志相似度用于指示該目標運行日志與該多條目標運行日志中的每條目標運行日志之間的相似度,該日志感情色彩用于指示該目標運行日志中所包含的形容詞以及副詞對應的感情色彩,該日志動作色彩用于指示該目標運行日志中包含的動詞、動詞過去時和動詞進行時對應的感情色彩,該前后日志時間差是指該目標運行日志與前一條目標運行日志之間的時間差,該前后日志組件變化量用于指示該目標運行日志與前一條目標運行日志之間組件標識的變化情況。
在本發(fā)明實施例中,上述多個指定維度包括日志相似度、日志感情色彩、日志動作色彩、前后日志時間差以及前后日志組件變化量中的至少一種,提高了對該目標運行日志評估的全面性,從而間接地提高了提取關鍵運行日志的精確性。
結合第一方面的第三種可能的實現方式,在第一方面的第四種可能的實現方式中,所述確定所述目標運行日志在所述多個指定維度上的維度評估分值,包括:
當所述多個指定維度中包括所述日志相似度時,確定所述多條目標運行日志中每條目標運行日志與所述目標運行日志之間的相似度;確定所述多條目標運行日志中與所述目標運行日志之間相似度大于或等于預設閾值的目標運行日志的數量;將所確定的數量與所述日志相似度對應的第一預設分值之間的乘積確定為所述目標運行日志在日志相似度上的維度評估分值。
上述當該多條目標運行日志中的某條目標運行日志與該目標運行日志之間相似度大于或等于預設閾值時,說明該某條目標運行日志與該目標運行日志同屬于同一個操作步驟。
在本發(fā)明實施例中,通過確定該目標運行日志在該日志相似度上的維度評估分值,確定了該目標運行日志所覆蓋的范圍,即間接地確定了關鍵運行日志的覆蓋范圍。
結合第一方面的第三種可能的實現方式,在第一方面的第五種可能的實現方式中,所述確定所述目標運行日志在所述多個指定維度上的維度評估分值,包括:
當所述多個指定維度中包括所述日志感情色彩時,對所述目標運行日志進行分詞處理,得到多個詞語;從所述多個詞語中選擇詞性為形容詞的詞語;確定第一數量,所述第一數量為選擇的詞語的數量;基于所述第一數量與第二預設分值,確定所述目標運行日志在所述日志感情色彩上的維度評估分值,所述第二預設分值為形容詞對應的分值。
上述從該多個詞語中選擇詞性為形容詞的詞語的具體實現過程可以包括:在該終端的存儲器中預先存儲有詞性為形容詞的多個預設詞語,終端的處理器將該目標運行日志進行分詞處理得到該多個詞語后,對于該多個詞語中的每個詞語,該處理器判斷該詞語是否屬于該多個預設詞語,當該詞語屬于該多個預設詞語時,選擇該詞語,當該詞語不屬于該多個預設詞語時,則不選擇該詞語。
在本發(fā)明實施例中,上述通過確定該目標運行日志在該日志感情色彩上的維度評估分值,確定了該目標運行日志所包括的有用信息,即間接地提高了關鍵運行日志的實用性。
結合第一方面的第五種可能的實現方式,在第一方面的第六種可能的實現方式中,所述確定第一數量之后,還包括:
確定第二數量,所述第二數量為所述選擇的詞語中存在與副詞相鄰的詞語的數量;相應地,所述基于所述第一數量與第二預設分值,確定所述目標運行日志在所述日志感情色彩上的維度評估分值,包括:確定所述第一數量與所述第二數量之間的差值;將所述差值與所述第二預設分值相乘,得到第一數值;將所述第二數量、所述第二預設分值和第三預設分值相乘,得到第二數值,所述第三預設分值為副詞對應的分值;將所述第一數值和所述第二數值之和確定為所述目標運行日志在所述日志感情色彩上的維度評估分值。
也即是,針對上述確定的多個詞性為形容詞的詞語中的每個詞語,處理器判斷與該詞語相鄰的詞語的詞性是否為副詞,如果與該詞語相鄰的詞語的詞性為副詞,還需要在形容詞對應的第二預設分值乘上副詞對應的第三預設分值,得到組合分值。
在本發(fā)明實施例中,上述通過確定該目標運行日志在該日志感情色彩上的維度評估分值,且該日志感情色彩中還考慮了詞性為副詞的詞語,如此,進一步確定了該目標運行日志所包括的有用信息,即進一步間接地提高了關鍵運行日志的實用性。
結合第一方面的第三種可能的實現方式,在第一方面的第七種可能的實現方式中,所述確定所述目標運行日志在所述多個指定維度上的維度評估分值,包括:
當所述多個指定維度中包括所述日志動作色彩時,對所述目標運行日志進行分詞處理,得到多個詞語;確定第三數量,所述第三數量為所述多個詞語中詞性為動詞的詞語的數量;確定第四數量,所述第四數量為所述多個詞語中詞性為動詞進行時的詞語的數量;確定第五數量,所述第五數量為所述多個詞語中詞性為動詞過去時的詞語的數量;將所述第三數量與第四預設分值的乘積、所述第四數量與第五預設分值的乘積和所述第五數量與第六預設分值的乘積之和確定為所述目標運行日志在所述日志動作色彩上的維度評估分值,所述第四預設分值為動詞對應的分值,所述第五預設分值為動詞進行時對應的分值,所述第六預設分值為動詞過去時對應的分值。
在本發(fā)明實施例中,上述通過確定該目標運行日志在該日志動詞色彩上的維度評估分值,同樣可以確定該目標運行日志所包括的有用信息,即間接地提高了關鍵運行日志的實用性。
結合第一方面的第三種可能的實現方式,在第一方面的第八種可能的實現方式中,所述確定所述目標運行日志在所述多個指定維度上的維度評估分值,包括:
當所述多個指定維度中包括所述前后日志組件變化量時,確定所述目標運行日志包括的組件標識和指定運行日志包括的組件標識,所述指定運行日志為所述多個目標運行日志中在所述目標運行日志之前生成且生成時間距離所述目標運行日志的生成時間最近的運行日志;確定所述目標運行日志包括的組件標識中與所述指定運行日志包括的組件標識中不相同的標識的數量;將所確定的數量與所述前后日志組件變化量對應的第七預設分值的乘積確定為所述目標運行日志在所述前后日志組件變化量上的維度評估分值。
其中,上述組件標識所對應的組件主要用于輔助或支持系統(tǒng)的運行。若該目標運行日志中的組件標識相對于指定目標運行日志中的組件標識變化較少,說明該目標運行日志與該指定目標運行日志可能屬于同一個操作步驟,因此,在本發(fā)明實施例中,可以確定該目標運行日志包括的組件標識中與該指定運行日志包括的組件標識中不相同的標識的數量后,將確定的數量與該第七預設分值之和確定為該目標運行日志在該前后日志組件變化量上的維度評估分值。
在本發(fā)明實施例中,上述確定該目標運行日志在該前后日志組件變化量上的維度評估分值,可以確定該目標運行日志所覆蓋的組件范圍,即間接地確定了關鍵運行日志覆蓋的組件范圍。
結合第一方面的第三種可能的實現方式,在第一方面的第九種可能的實現方式中,所述確定所述目標運行日志在所述多個指定維度上的維度評估分值,包括:
當所述多個指定維度中包括所述前后日志時間差時,確定所述目標運行日志與指定運行日志之間的時間差,所述指定運行日志為所述多個目標運行日志中在所述目標運行日志之前生成且生成時間距離所述目標運行日志的生成時間最近的運行日志;將所述時間差確定為所述目標運行日志在所述前后日志時間差上的維度評估分值。
通常前后運行日志之間的時間差均在毫秒級別,且在生成每條運行日志時,均會對應有該運行日志的生成時間,因此,可以直接獲取該目標運行日志的日志生成時間,以及該目標運行日志之前的指定運行日志的日志生成時間,以確定該目標運行日志與該指定運行日志之間的時間差。
在本發(fā)明實施例中,上述通過確定該目標運行日志在該前后日志時間差上的維度評估分值,可以確定該目標運行日志所覆蓋的時間范圍,即間接地確定了關鍵運行日志覆蓋的時間范圍。
結合第一方面至第一方面的第九種可能的實現方式,在第一方面的第十種可能的實現方式中,所述基于所述多條目標運行日志的評估總分值,從所述多條目標運行日志中確定所述目標操作流程對應的關鍵運行日志,包括:
基于所述多條目標運行日志的評估總分值,按照評估總分值從大到小的順序,對所述多條目標運行日志進行排序;從排序后的多條目標運行日志中選擇前N條目標運行日志,所述N大于或等于1;將所述前N條目標運行日志確定為所述目標操作流程對應的關鍵運行日志。
由于該各個評估總分值用于評估各條目標運行日志能夠指示一個操作步驟的能力,該評估總分值越大,說明該評估總分值對應的目標運行日志能夠指示一個操作步驟的能力越強,因此,首先按照評估總分值從大到小的順序,對該多條目標運行日志進行排序,之后,從排序后的多條目標運行日志中獲取前N條目標運行日志作為目標操作流程對應的關鍵運行日志,即獲取的該前N條目標運行日志可以用于指示該目標操作流程中包括的多個操作步驟,如此,實現了對關鍵運行日志的提取操作。
在本發(fā)明實施例中,上述按照評估總分值從大到小的順序對該多條目標運行日志進行排序,由于評估總分值越大,該評估總分值對應的目標運行日志指示一個操作步驟的能力越強,因此,在排序后的多條目標運行日志中,可以獲取前N條目標運行日志,并將獲取的前N條目標運行日志確定為該目標操作流程對應的關鍵運行日志,從而實現了關鍵運行日志的提取操作。
第二方面,提供了一種關鍵運行日志提取裝置,所述關鍵運行日志提取裝置具有實現上述第一方面中關鍵運行日志提取方法行為的功能。該關鍵運行日志提取裝置包括至少一個模塊,該至少一個模塊用于實現上述第一方面所提供的關鍵運行日志提取方法。
第三方面,提供了一種關鍵運行日志提取裝置,所述關鍵運行日志提取裝置的結構中包括處理器和存儲器,所述存儲器用于存儲支持關鍵運行日志提取裝置執(zhí)行上述關鍵運行日志提取方法的程序,以及存儲用于實現該關鍵運行日志提取方法所涉及的數據,該數據包括系統(tǒng)運行日志等。所述處理器被配置為用于執(zhí)行所述存儲器中存儲的程序。所述關鍵運行日志提取裝置還可以包括通信總線,該通信總線用于該處理器與存儲器之間建立連接。
第四方面,本發(fā)明實施例提供了一種計算機存儲介質,用于儲存為上述關鍵運行日志提取裝置所用的計算機軟件指令,或存儲用于執(zhí)行上述第二方面和第三方面為關鍵運行日志提取裝置所設計的程序。
上述本發(fā)明實施例第二到第四方面所獲得的技術效果與第一方面中對應的技術手段獲得的技術效果近似,在這里不再贅述。
本發(fā)明實施例提供的技術方案帶來的有益效果是:在本發(fā)明實施例中,基于目標操作流程標識,從執(zhí)行多個操作流程后生成的系統(tǒng)運行日志中,獲取多次執(zhí)行目標操作流程后重復出現的多條目標運行日志,之后,基于多個指定維度和該多個指定維度的權重,確定該多條目標運行日志的評估總分值,其中,由于各個評估總分值評估了各條目標運行日志能夠指示一個操作步驟的能力,因此,基于該多條目標運行日志的評估總分值,可以從該多條目標運行日志中確定該目標操作流程對應的關鍵運行日志,即所確定的關鍵運行日志能夠更加準確地反應該目標操作流程中的各個操作步驟,解決了用戶無法準確定位系統(tǒng)故障的問題,提高了運維分析效果。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是根據一示例性實施例示出的一種終端的結構示意圖;
圖2A是根據一示例性實施例示出的一種關鍵運行日志提取方法的流程圖;
圖2B(1)是圖2A實施例所涉及的一種預設詞庫的示意圖;
圖2B(2)是圖2A實施例所涉及的另一種預設詞庫的示意圖;
圖3A是根據一示例性實施例示出的一種關鍵運行日志提取裝置的結構示意圖;
圖3B是根據一示例性實施例示出的一種獲取模塊310的結構示意圖;
圖3C是根據一示例性實施例示出的一種第一確定模塊320的結構示意圖;
圖3D根據一示例性實施例示出的一種第二確定模塊330的結構示意圖。
具體實施方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明實施方式作進一步地詳細描述。
在本發(fā)明實施例中,可以通過諸如計算機等之類的終端來執(zhí)行該關鍵運行日志提取方法。請參考圖1,該圖1是根據一示例性實施例示出的一種終端的結構示意圖,該終端主要包括有一個或者一個以上處理核心的處理器110、包括有一個或一個以上計算機可讀存儲介質的存儲器120以及通信總線130等。本領域技術人員可以理解,圖1中示出的終端結構并不構成對終端的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置,本發(fā)明實施例對此不做限定。
其中,該處理器110是該終端的控制中心,該處理器110可以一個通用中央處理器(CPU),微處理器,特定應用集成電路(application-specific integratedcircuit,ASIC),或一個或多個用于控制本發(fā)明方案程序執(zhí)行的集成電路。其中,該處理器110可以通過運行或執(zhí)行存儲在存儲器120內的軟件程序和/或模塊,以及調用存儲在存儲器120內的數據,來實現下文圖2A實施例所提供的關鍵運行日志提取方法。
其中,該存儲器120可以是只讀存儲器(read-only memory,ROM)或可存儲靜態(tài)信息和指令的其它類型的靜態(tài)存儲設備,隨機存取存儲器(random accessmemory,RAM))或者可存儲信息和指令的其它類型的動態(tài)存儲設備,也可以是電可擦可編程只讀存儲器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、只讀光盤(Compact Disc Read-Only Memory,CD-ROM)或其它光盤存儲、光碟存儲(包括壓縮光碟、激光碟、光碟、數字通用光碟、藍光光碟等)、磁盤存儲介質或者其它磁存儲設備、或者能夠用于攜帶或存儲具有指令或數據結構形式的期望的程序代碼并能夠由集成電路存取的任何其它介質,但不限于此。存儲器120可以是獨立存在,通過通信總線130與處理器110相連接。存儲器120也可以和處理器110集成在一起。
另外,上述通信總線130可包括一通路,在上述處理器110和存儲器120之間傳送信息。
圖2A是根據一示例性實施例示出的一種關鍵運行日志提取方法的流程圖,本實施例以該關鍵運行日志提取方法應用于終端中進行舉例說明,該關鍵運行日志提取方法可以包括如下幾個步驟:
步驟201:終端基于目標操作流程標識,從系統(tǒng)運行日志中,獲取多條目標運行日志。
在終端系統(tǒng)中,通常包括多個功能模塊,每個功能模塊包括多個操作流程,通過執(zhí)行該多個操作流程中,可以實現各個功能模塊對應的各種功能。目前,為了便于后續(xù)對系統(tǒng)進行運維分析,在系統(tǒng)運行過程中,通常會生成系統(tǒng)運行日志,該系統(tǒng)運行日志為執(zhí)行多個操作流程后生成得到,并且,通常情況下,請參考圖1,該系統(tǒng)運行日志可以存儲在該終端的存儲器120中。
在該系統(tǒng)運行日志中,每個操作流程均對應有自己的操作流程標識,其中,該目標操縱流程可以用于唯一標識一個目標操作流程。因此,基于該目標操作流程標識,請參考圖1,該終端的處理器110可以從存儲器120存儲的系統(tǒng)運行日志中獲取該目標操作流程對應的多條運行日志。
其中,在該多條運行日志中,包括了該目標操作流程對應的關鍵運行日志,該關鍵運行日志是指能夠反應該目標操作流程中的多個操作步驟的運行日志,在本發(fā)明實施例中,為了確定該目標操作流程對應的關鍵運行日志,處理器110基于該多條運行日志中具有共性的運行日志來提取該關鍵運行日志,也即是,該處理器110從該多條運行日志中獲取多條目標運行日志,該多條目標運行日志為多次執(zhí)行目標操作流程后重復出現的運行日志,也即是,具有共性的運行日志。
不難理解,在實際運行過程中,每個操作流程均可能被執(zhí)行多次,該處理器110獲取該多次執(zhí)行目標操作流程后重復出現的運行日志,其中,基于目標操作流程標識,從存儲器120存儲的系統(tǒng)運行日志中,獲取多條目標運行日志的具體實現方式包括:從該系統(tǒng)運行日志中,獲取該目標操作流程標識對應的多條運行日志,將該多條運行日志中每條運行日志包括的多個指定格式的日志信息替換成多個預設字符,該多個指定格式與該多個預設字符一一對應,從替換后的多條運行日志中,選擇在多次執(zhí)行該目標操作流程后重復出現的多條運行日志,將選擇的多條運行日志確定為該多條目標運行日志。
其中,該多個指定格式可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不作限定。
其中,該多個預設字符可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不作限定。
其中,該多個指定格式的日志信息可以包括日志生成時間和日志編號等。在獲取的多條運行日志中,當該多條運行日志中包括多個指定格式的日志信息時,容易影響判斷是否是重復出現的日志。例如,當該日志信息包括日志生成時間和日志編號時,若第一次執(zhí)行該目標操作流程生成運行日志A,該運行日志A的日志生成時間為12:00,第二次執(zhí)行該目標操作流程生成運行日志B,該運行日志B的日志生成時間為12:02,但在該運行日志A和運行日志B中,除了該日志生成時間和日志編號不同,其它日志內容均相同,也就是說,該運行日志B實際上是重復出現的運行日志,但是,若不對該日志信息進行統(tǒng)一替換,則容易將該兩條運行日志判定為不是重復出現的運行日志,從而影響判斷結果。
因此,在提取關鍵運行日志之前,處理器110需要將該目標操作流程對應的多條運行日志中的多個指定格式的日志信息進行替換處理,即將該多個指定格式的日志信息替換成多個預設字符,例如,將該多條運行日志中的日志生成時間均替換成TIME(時間),將該多條運行日志中的日志編號均統(tǒng)一替換成ID(Identification,身份標識),用VALUE(值)代替其它指定格式的日志信息。之后,處理器110即可從替換后的多條運行日志中,選擇在多次執(zhí)行該目標操作流程后重復出現的多條運行日志,所選擇的多條運行日志即為上述多條目標運行日志。
步驟202:終端基于多個指定維度和該多個指定維度的權重,確定該多條目標運行日志的評估總分值。
其中,該各個評估總分值用于評估各條目標運行日志能夠指示一個操作步驟的能力,該評估總分值越大,說明該評估總分值對應的目標運行日志能夠指示一個操作步驟的能力越強。
其中,該多個指定維度的權重可以由用戶根據實際需求自定義設置,在本發(fā)明實施例中,該多個指定維度包括日志相似度、日志感情色彩、日志動作色彩、前后日志時間差以及前后日志組件變化量中的至少一種。
其中,該日志相似度可以用于指示該目標運行日志與該多條目標運行日志中的每條目標運行日志之間的相似度。該日志感情色彩可以用于指示該目標運行日志中所包含的形容詞以及副詞對應的感情色彩。該日志動作色彩可以用于指示該目標運行日志中包含的動詞、動詞過去時和動詞進行時對應的感情色彩。該前后日志時間差是指該目標運行日志與前一條目標運行日志之間的時間差。該前后日志組件變化量可以用于指示該目標運行日志與前一條目標運行日志之間組件標識的變化情況。
其中,基于多個指定維度和該多個指定維度的權重,確定該多條目標運行日志的評估總分值的具體實現過程包括:對于該多條目標運行日志中的每條目標運行日志,確定該目標運行日志在該多個指定維度上的維度評估分值,確定該目標運行日志的多個維度評估分值與該多個指定維度中對應指定維度的權重之間的乘積,將該目標運行日志的多個維度評估分值與該多個指定維度中對應指定維度的權重之間的乘積之和確定為該目標運行日志的評估總分值。
上述指定維度的權重可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不做限定。
其中,根據該多個指定維度不同,確定該目標運行日志在該多個指定維度上的維度評估分值的實現方式不同,具體可以包括如下實現方式:
第一種方式:當該多個指定維度中包括該日志相似度時,確定該多條目標運行日志中每條目標運行日志與該目標運行日志之間的相似度,確定該多條目標運行日志中與該目標運行日志之間相似度大于或等于預設閾值的目標運行日志的數量,將所確定的數量與該日志相似度對應的第一預設分值之間的乘積確定為該目標運行日志在日志相似度上的維度評估分值。
其中,該預設閾值可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不做限定。
其中,該第一預設分值可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不做限定。
其中,確定該多條目標運行日志中每條目標運行日志與該目標運行日志之間的相似度的實現方式,可以采用基于距離的相似度算法,具體實現過程可以參見相關技術,本發(fā)明實施例對此不做限定。
在實際實現過程中,處理器110可以給該目標運行日志的初始相似度賦予一個初始值,例如,處理器110可以將該目標運行日志的初始相似度賦值為“1”。之后,處理器110確定該目標運行日志與該多條目標運行日志中的每條目標運行日志之間的相似度,當該多條目標運行日志中的某條目標運行日志與該目標運行日志之間相似度大于或等于預設閾值時,說明該某條目標運行日志與該目標運行日志可能屬于同一個操作步驟,因此,該處理器110確定該多條目標運行日志中與該目標運行日志屬于同一操作步驟的運行日志的數量,即可得到該目標運行日志在該日志相似度上的維度評估分值。
例如,若該多條目標運行日志中包括10條與該目標運行日志之間的相似度大于或等于該預設閾值的目標運行日志,且上述第一預設分值為0.1,則可以得到該目標運行日志在該日志相似度上是維度評估分值為1+0.1*10,即為2。其中,“+”代表相加,“*”代表相乘。
上述通過確定該目標運行日志在該日志相似度上的維度評估分值,確定了該目標運行日志所覆蓋的范圍,即間接地確定了關鍵運行日志的覆蓋范圍。
第二種方式:當該多個指定維度中包括該日志感情色彩時,對該目標運行日志進行分詞處理,得到多個詞語,從該多個詞語中選擇詞性為形容詞的詞語,確定第一數量,該第一數量為選擇的詞語的數量,基于該第一數量與第二預設分值,確定該目標運行日志在該日志感情色彩上的維度評估分值,該第二預設分值為形容詞對應的分值。
其中,該第二預設分值可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不做限定。
其中,上述從該多個詞語中選擇詞性為形容詞的詞語的具體實現過程可以包括:在該終端的存儲器120中預先存儲有詞性為形容詞的多個預設詞語,終端的處理器110將該目標運行日志進行分詞處理得到該多個詞語后,對于該多個詞語中的每個詞語,該處理器110判斷該詞語是否屬于該多個預設詞語,當該詞語屬于該多個預設詞語時,選擇該詞語,當該詞語不屬于該多個預設詞語時,則不選擇該詞語。
例如,請參考圖2B(1),假設該多個預設詞語包括good,nice等,若上述詞語為good,則可以確定該詞語的詞性為形容詞,因此,處理器110選擇該詞語。反之,若該詞語為phone,由于phone不屬于該多個預設詞語,因此,可以確定該詞語的詞性不是形容詞,處理器110不選擇該詞語。
這里需要說明的是,在本發(fā)明實施例中,僅是以通過上述方式從該多個詞語中選擇詞性為形容詞的詞語為例進行說明,在另一實施例中,還可以通過其它方式從該多個詞語中選擇詞性為形容詞的詞語,本發(fā)明實施例對此不作限定。
按照上述實現方式,處理器110從該多個詞語中,選擇所有詞性為形容詞的詞語,并確定所選擇的詞語的數量。在本發(fā)明實施例中,請繼續(xù)參考圖2B(1),在該終端的存儲器120中預先存儲形容詞對應的第二預設分值,處理器110確定所選擇的詞語的數量后,將該數量與該第二預設分值相乘,即可得到該目標運行日志在該日志感情色彩上的維度評估分值。
另外,需要說明的是,在實際實現過程中,由于在該形容詞之前還可能包括副詞,當該形容詞之前還包括有副詞時,實際上又進一步加強了感情色彩的修飾,因此,在本發(fā)明實施例中,確定第一數量之后還包括如下實現過程。
確定第二數量,該第二數量為該選擇的詞語中存在與副詞相鄰的詞語的數量,在該種情況下,上述基于該第一數量與第二預設分值,確定該目標運行日志在該日志感情色彩上的維度評估分值包括:確定該第一數量與該第二數量之間的差值,將該差值與該第二預設分值相乘,得到第一數值,將該第二數量、該第二預設分值和第三預設分值相乘,得到第二數值,該第三預設分值為副詞對應的分值,將該第一數值和該第二數值之和確定為該目標運行日志在該日志感情色彩上的維度評估分值。
其中,該第三預設分值可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不做限定。
也即是,在該種實現方式中,針對上述確定的多個詞性為形容詞的詞語中的每個詞語,處理器110判斷與該詞語相鄰的詞語的詞性是否為副詞,如果與該詞語相鄰的詞語的詞性為副詞,還需要在形容詞對應的第二預設分值乘上副詞對應的第三預設分值,得到組合分值。
例如,請參考圖2B(2),若形容詞詞語“good”之前的詞語為“very”,則可以確定該“very”的詞性為副詞,且可以獲取到該第三預設分值為0.9,因此,可以得到“good”和“very”的組合分值為0.8*0.9,即為0.72。
在實際實現過程中,若上述第一數量為M,該第二數量為N,說明該第一數量中有N個詞性為形容詞的詞語的相鄰詞語為副詞,并且,該M與N之間的差值即為該多個詞語中詞性為形容詞,且相鄰的詞語不是副詞的詞語個數。確定該M和N后,該處理器110將該M與N之間的差值與形容詞對應的第二預設分值相乘,得到上述第一數值,該N、第二預設分值、和第三預設分值相乘,得到上述第二數值,該第一數值和該第二數值之和實際上即為該目標運行日志在該日志感情色彩上的維度評估分值。
例如,在上述例子中,該第二預設分值為0.8,該第三預設分值為0.9,因此可以確定該第一數值為(M-N)*0.8,該第二數值為N*0.8*0.9,因此,可以確定該目標運行日志在該日志感情色彩上的維度評估分值為(M-N)*0.8+N*0.8*0.9。其中,“-”代表相減。
其中,上述判斷與該詞語相鄰的詞語的詞性是否為副詞的實現過程與上述確定詞語的詞性是否為形容詞的實現過程類似,這里不再詳細描述。
上述通過確定該目標運行日志在該日志感情色彩上的維度評估分值,確定了該目標運行日志所包括的有用信息,即間接地提高了關鍵運行日志的實用性。
需要說明的是,上述確定該目標運行日志在該日志感情色彩上的維度評估分值的實現過程僅是示例性的,在另一實施例中,還可以通過其它方式來確定,例如,在一種可能的實現方式中,當詞性為形容詞的詞語的相鄰詞語的詞性不為副詞時,處理器110可以默認確定形容詞對應的第二預設分值與“1”相乘,并通過如下公式(1),確定該目標運行日志在該日志感情色彩上的維度評估分值,該公式(1)為:
其中,該Y代表該目標運行日志在該日志感情色彩上的維度評估分值,該M代表上述第一數量,該pi代表形容詞對應的第二預設分值,該ci代表副詞對應的第三預設分值。也就是說,在上述實現過程中,當詞性為形容詞的詞語的相鄰詞語的詞性不為副詞時,默認該ci的值為“1”。
第三種方式:當該多個指定維度中包括該日志動作色彩時,對該目標運行日志進行分詞處理,得到多個詞語,確定第三數量,該第三數量為該多個詞語中詞性為動詞的詞語的數量,確定第四數量,該第四數量為該多個詞語中詞性為動詞進行時的詞語的數量,確定第五數量,該第五數量為該多個詞語中詞性為動詞過去時的詞語的數量,將該第三數量與第四預設分值的乘積、該第四數量與第五預設分值的乘積和該第五數量與第六預設分值的乘積之和確定為該目標運行日志在該日志動作色彩上的維度評估分值,該第四預設分值為動詞對應的分值,該第五預設分值為動詞進行時對應的分值,該第六預設分值為動詞過去時對應的分值。
其中,該第四預設分值可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不做限定。
其中,該第五預設分值可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不做限定。
其中,該第六預設分值可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不做限定。
在該種實現方式中,確定該多個詞語中詞性為動詞的詞語的數量,確定該多個詞語中詞性為動詞進行時的詞語的數量,以及確定該多個詞語中詞性為動詞過去時的詞語的數量,之后,基于所確定的數量以及各個詞性對應的預設分值,即可以確定該目標運行日志在動作感情色彩上的維度評估分值。
例如,若該動詞對應的第四預設分值為1,動詞進行時對應的第五預設分值為0.5,以及該動詞過去時對應的第六預設分值為0.5,當該第三數量為2,該第四數量為1,該第五數量為0,則該目標運行日志在動作感情色彩上的維度評估分值為2*1+0.5*1+0*0.5,即為2.5。
上述確定詞語的詞性是否為動詞、動詞進行時或者動詞過去時的實現過程與上述確定詞語的詞性是否為形容詞的實現過程類似,這里不再詳細描述。
上述通過確定該目標運行日志在該日志動詞色彩上的維度評估分值,同樣可以確定該目標運行日志所包括的有用信息,即間接地提高了關鍵運行日志的實用性。
第四種方式:當該多個指定維度中包括該前后日志組件變化量時,確定該目標運行日志包括的組件標識和指定運行日志包括的組件標識,該指定運行日志為該多個目標運行日志中在該目標運行日志之前生成且生成時間距離該目標運行日志的生成時間最近的運行日志,確定該目標運行日志包括的組件標識中與該指定運行日志包括的組件標識中不相同的標識的數量,將所確定的數量與該前后日志組件變化量對應的第七預設分值的乘積確定為該目標運行日志在該前后日志組件變化量上的維度評估分值。
其中,該第七預設分值可以由用戶根據實際需求自定義設置,也可以由該終端默認設置,本發(fā)明實施例對此不做限定。
其中,上述組件標識可以用于唯一標識一個組件,組件通??梢杂糜谳o助或支持終端系統(tǒng)的運行。
在實際實現過程中,若該目標運行日志中的組件標識相對于指定目標運行日志中的組件標識變化較少,說明該目標運行日志與該指定目標運行日志可能屬于同一個操作步驟,因此,在本發(fā)明實施例中,處理器110可以確定該目標運行日志包括的組件標識中與該指定運行日志包括的組件標識中不相同的標識的數量后,將確定的數量與該第七預設分值之和確定為該目標運行日志在該前后日志組件變化量上的維度評估分值。
上述確定該目標運行日志在該前后日志組件變化量上的維度評估分值,可以確定該目標運行日志所覆蓋的組件范圍,即間接地確定了關鍵運行日志覆蓋的組件范圍。
第五種方式:當該多個指定維度中包括該前后日志時間差時,確定該目標運行日志與指定運行日志之間的時間差,該指定運行日志為該多個目標運行日志中在該目標運行日志之前生成且生成時間距離該目標運行日志的生成時間最近的運行日志,將該時間差確定為該目標運行日志在該前后日志時間差上的維度評估分值。
通常前后運行日志之間的時間差均在毫秒級別,且在生成每條運行日志時,均會對應有該運行日志的生成時間,因此,處理器110可以直接獲取該目標運行日志的日志生成時間,以及該目標運行日志之前的指定運行日志的日志生成時間,以確定該目標運行日志與該指定運行日志之間的時間差。
上述通過確定該目標運行日志在該前后日志時間差上的維度評估分值,可以確定該目標運行日志所覆蓋的時間范圍,即間接地提高了關鍵運行日志覆蓋的時間范圍。
上述確定了該目標運行日志在該多個指定維度上的維度評估分值后,處理器110將各個維度評估分值與對應的權重相乘,其中,如上文所述,該每個指定維度對應的權重可以由用戶根據實際需求自定義設置,在本發(fā)明實施例中,由于日志相似度和前后日志組件變化量衡量一條目標運行日志所占的比重相對比較大一些,因此,可以將日志相似度和前后日志組件變化量對應的權重設置的比較大一些,其它維度對應的權重設置地比較小一些。在確定的多個乘積之后,將該多個乘積相加,即得到該目標運行日志的評估總分值。
需要說明的是,在本發(fā)明實施例中,僅是以該多個指定維度包括日志相似度、日志感情色彩、日志動作色彩、前后日志時間差以及前后日志組件變化量中的至少一種為例進行說明,在另一實施例中,該多個指定維度還可以包括其它維度,本發(fā)明實施例對此不做限定。
步驟203:終端基于該多條目標運行日志的評估總分值,從該多條目標運行日志中確定該目標操作流程對應的關鍵運行日志。
具體地,基于該多條目標運行日志的評估總分值,按照評估總分值從大到小的順序,對該多條目標運行日志進行排序,從排序后的多條目標運行日志中選擇前N條目標運行日志,該N大于或等于1,將該前N條目標運行日志確定為該目標操作流程對應的關鍵運行日志。
如前文所述,由于該各個評估總分值用于評估各條目標運行日志能夠指示一個操作步驟的能力,該評估總分值越大,說明該評估總分值對應的目標運行日志能夠指示一個操作步驟的能力越強,因此,處理器110首先按照評估總分值從大到小的順序,對該多條目標運行日志進行排序,之后,從排序后的多條目標運行日志中獲取前N條目標運行日志作為目標操作流程對應的關鍵運行日志,即獲取的該前N條目標運行日志可以用于指示該目標操作流程中包括的多個操作步驟,如此,實現了對關鍵運行日志的提取操作。
在本發(fā)明實施例中,基于目標操作流程標識,從執(zhí)行多個操作流程后生成的系統(tǒng)運行日志中,獲取多次執(zhí)行目標操作流程后重復出現的多條目標運行日志,之后,基于多個指定維度和該多個指定維度的權重,確定該多條目標運行日志的評估總分值,其中,由于各個評估總分值評估了各條目標運行日志能夠指示一個操作步驟的能力,因此,基于該多條目標運行日志的評估總分值,可以從該多條目標運行日志中確定該目標操作流程對應的關鍵運行日志,即所確定的關鍵運行日志能夠更加準確地反應該目標操作流程中的各個操作步驟,解決了用戶無法準確定位系統(tǒng)故障的問題,提高了運維分析效果。
圖3A是根據一示例性實施例示出的一種關鍵運行日志提取裝置的結構示意圖,該關鍵運行日志提取裝置可以由軟件、硬件或者兩者的結合實現成為終端的部分或者全部,該終端可以為圖1所示的終端。該關鍵運行日志提取裝置可以包括:獲取模塊310、第一確定模塊320和第二確定模塊330,該獲取模塊310用于執(zhí)行圖2A實施例中的步驟201,該第一確定模塊320用于執(zhí)行圖2A實施例中的步驟202,以及該第二確定模塊330用于執(zhí)行圖2A實施例中的步驟203。
可選地,請參考圖3B至圖3D,該獲取模塊310包括:
獲取單元310a,用于從該系統(tǒng)運行日志中,獲取該目標操作流程標識對應的多條運行日志;
替換單元310b,用于將該多條運行日志中每條運行日志包括的多個指定格式的日志信息替換成多個預設字符,該多個指定格式與該多個預設字符一一對應;
第一選擇單元310c,用于從替換后的多條運行日志中,選擇在多次執(zhí)行該目標操作流程后重復出現的多條運行日志;
第一確定單元310d,用于將選擇的多條運行日志確定為該多條目標運行日志。
可選地,該第一確定模塊320包括:
第二確定單元320a,用于對于該多條目標運行日志中的每條目標運行日志,確定該目標運行日志在該多個指定維度上的維度評估分值;
第三確定單元320b,用于確定該目標運行日志的多個維度評估分值與該多個指定維度中對應指定維度的權重之間的乘積;
第四確定單元320c,用于將該目標運行日志的多個維度評估分值與該多個指定維度中對應指定維度的權重之間的乘積之和確定為該目標運行日志的評估總分值。
可選地,該第二確定單元320a,還用于執(zhí)行圖2A實施例中步驟202所涉及的第一種方式、第二種方式、第三種方式、第四種方式以及第五種方式。
可選地,該第二確定模塊330包括:
排序單元330a,用于基于該多條目標運行日志的評估總分值,按照評估總分值從大到小的順序,對該多條目標運行日志進行排序;
第二選擇單元330b,用于從排序后的多條目標運行日志中選擇前N條目標運行日志,所述N大于或等于1;
第五確定單元330c,用于將該前N條目標運行日志確定為該目標操作流程對應的關鍵運行日志。
在本發(fā)明實施例中,基于目標操作流程標識,從執(zhí)行多個操作流程后生成的系統(tǒng)運行日志中,獲取多次執(zhí)行目標操作流程后重復出現的多條目標運行日志,之后,基于多個指定維度和該多個指定維度的權重,確定該多條目標運行日志的評估總分值,其中,由于各個評估總分值評估了各條目標運行日志能夠指示一個操作步驟的能力,因此,基于該多條目標運行日志的評估總分值,可以從該多條目標運行日志中確定該目標操作流程對應的關鍵運行日志,即所確定的關鍵運行日志能夠更加準確地反應該目標操作流程中的各個操作步驟,解決了用戶無法準確定位系統(tǒng)故障的問題,提高了運維分析效果。
需要說明的是:上述實施例提供的關鍵運行日志提取裝置在實現關鍵運行日志提取方法時,僅以上述各功能模塊的劃分進行舉例說明,實際應用中,可以根據需要而將上述功能分配由不同的功能模塊完成,即將設備的內部結構劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的關鍵運行日志提取裝置與關鍵運行日志提取方法實施例屬于同一構思,其具體實現過程詳見方法實施例,這里不再贅述。
本領域普通技術人員可以理解實現上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質中,上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。