本申請(qǐng)涉及信息系統(tǒng)業(yè)務(wù)數(shù)據(jù)處理
技術(shù)領(lǐng)域:
,特別是涉及業(yè)務(wù)數(shù)據(jù)的追蹤方法及裝置。
背景技術(shù):
:信息技術(shù)和信息系統(tǒng)在社會(huì)各領(lǐng)域的應(yīng)用越來(lái)越廣泛,提高了產(chǎn)品和服務(wù)的生產(chǎn)和提供效率,在社會(huì)生產(chǎn)生活中扮演著越來(lái)越重要的角色。在眾多應(yīng)用信息技術(shù)的社會(huì)活動(dòng)領(lǐng)域中,不乏很多以信息系統(tǒng)作為重要組成部分的重要行業(yè),如銀行服務(wù)業(yè),證券行業(yè),另外很多重要的公共服務(wù)系統(tǒng),如電力供給,稅收系統(tǒng),社會(huì)保障系統(tǒng)等等,也應(yīng)用了計(jì)算機(jī)控制的信息化技術(shù)手段,向外提供更加高效快捷的公共服務(wù)。在大規(guī)模應(yīng)用信息技術(shù)來(lái)開(kāi)展業(yè)務(wù)的過(guò)程中,有效實(shí)現(xiàn)信息系統(tǒng)的運(yùn)維工作,是保證系統(tǒng)穩(wěn)定運(yùn)行和提供服務(wù)的重要條件,對(duì)于應(yīng)用信息技術(shù)的社會(huì)活動(dòng)和行業(yè)有著非常重要的意義。隨著信息系統(tǒng)的規(guī)模越來(lái)越大,其軟硬件系統(tǒng)構(gòu)成也越來(lái)越復(fù)雜,傳統(tǒng)的運(yùn)維方法和工具已經(jīng)難以適應(yīng)需求,自動(dòng)化的運(yùn)維服務(wù)工具開(kāi)始被各行業(yè)重視起來(lái)。自動(dòng)化的運(yùn)維服務(wù)工具通?;诒O(jiān)控來(lái)實(shí)現(xiàn),例如可以作為服務(wù)組件安裝在系統(tǒng)中,采集特定方面的系統(tǒng)運(yùn)行數(shù)據(jù),并在系統(tǒng)運(yùn)行數(shù)據(jù)反映出系統(tǒng)異常時(shí)進(jìn)行預(yù)警。然而,隨著信息系統(tǒng)組件構(gòu)成的多樣化,以及信息系統(tǒng)用戶關(guān)注點(diǎn)的轉(zhuǎn)移,對(duì)于自動(dòng)化的運(yùn)維服務(wù)工具也提出了更高的要求。例如一個(gè)信息系統(tǒng)可能由各種不同業(yè)務(wù)功能的組件構(gòu)成,組件間具有非常復(fù)雜的異構(gòu)性和多樣性,而對(duì)于一筆業(yè)務(wù)的實(shí)現(xiàn)過(guò)程,可能要跨越信息系統(tǒng)中多個(gè)組件或節(jié)點(diǎn),其間的業(yè)務(wù)數(shù)據(jù)也呈現(xiàn)出非常復(fù)雜多變的特性。而傳統(tǒng)的運(yùn)維監(jiān)測(cè)更多的只能實(shí)現(xiàn)單一節(jié)點(diǎn)或組件中的數(shù)據(jù)采集和分析,當(dāng)信息系統(tǒng)用戶更加關(guān)注業(yè)務(wù)層數(shù)據(jù)的全局性分析時(shí),實(shí)現(xiàn)跨組件,跨業(yè)務(wù),異構(gòu)環(huán)境的多層次業(yè)務(wù)數(shù)據(jù)追蹤的意義就凸顯出來(lái)。有效的業(yè)務(wù)數(shù)據(jù)追蹤對(duì)于還原業(yè)務(wù)的詳細(xì)執(zhí)行過(guò)程,快速進(jìn)行故障診斷和分析,獲得實(shí)時(shí)異常事件警告,提升運(yùn)維響應(yīng)速度等都有著非常重要的意義。綜上,亟需本領(lǐng)域技術(shù)人員解決的問(wèn)題就在于,如何在組成愈加復(fù)雜的信息系統(tǒng)中,有效的進(jìn)行跨組件的多層關(guān)聯(lián)的業(yè)務(wù)數(shù)據(jù)追蹤,為信息系統(tǒng)運(yùn)維工作準(zhǔn)確可靠的依據(jù)。技術(shù)實(shí)現(xiàn)要素:本申請(qǐng)?zhí)峁┝藰I(yè)務(wù)數(shù)據(jù)的追蹤方法及裝置,可以在各相關(guān)節(jié)點(diǎn)中對(duì)同一筆業(yè)務(wù)的業(yè)務(wù)數(shù)據(jù)進(jìn)行準(zhǔn)確的追蹤,為系統(tǒng)運(yùn)維過(guò)程中還原業(yè)務(wù)的詳細(xì)執(zhí)行過(guò)程,快速進(jìn)行故障診斷和分析,獲得實(shí)時(shí)異常事件警告等工作提供準(zhǔn)確且有效的依據(jù)。本申請(qǐng)?zhí)峁┝巳缦路桨福阂环N業(yè)務(wù)數(shù)據(jù)的追蹤方法,包括:確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù);所述被監(jiān)控節(jié)點(diǎn)至少包括信息系統(tǒng)的第一節(jié)點(diǎn)以及第二節(jié)點(diǎn);其中,第一節(jié)點(diǎn)的交互數(shù)據(jù)包括一條或多條業(yè)務(wù)請(qǐng)求數(shù)據(jù),以及第二節(jié)點(diǎn)的交互數(shù)據(jù)包括多條業(yè)務(wù)響應(yīng)數(shù)據(jù);分別對(duì)所述業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及所述業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理,生成一個(gè)或多個(gè)第一有效字符串集合,以及多個(gè)第二有效字符串集合;其中,每個(gè)第一有效字符串集合與一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)對(duì)應(yīng),每個(gè)第二有效字符串集合與一條業(yè)務(wù)響應(yīng)數(shù)據(jù)對(duì)應(yīng);分別確定各第一有效字符串集合與各第二有效字符串集合之間的相似度;根據(jù)相似度計(jì)算結(jié)果,確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系。一種業(yè)務(wù)數(shù)據(jù)的追蹤裝置,包括:交互數(shù)據(jù)確定單元,用于確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù);所述被監(jiān)控節(jié)點(diǎn)至少包括信息系統(tǒng)的第一節(jié)點(diǎn)以及第二節(jié)點(diǎn);其中,第一節(jié)點(diǎn)的交互數(shù)據(jù)包括一條或多條業(yè)務(wù)請(qǐng)求數(shù)據(jù),以及第二節(jié)點(diǎn)的交互數(shù)據(jù)包括多條業(yè)務(wù)響應(yīng)數(shù)據(jù);字符串提取單元,用于分別對(duì)所述業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及所述業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理,生成一個(gè)或多個(gè)第一有效字符串集合,以及多個(gè)第二有效字符串集合;其中,每個(gè)第一有效字符串集合與一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)對(duì)應(yīng),每個(gè)第二有效字符串集合與一條業(yè)務(wù)響應(yīng)數(shù)據(jù)對(duì)應(yīng);相似度計(jì)算單元,用于分別確定各第一有效字符串集合與各第二有效字符串集合之間的相似度;業(yè)務(wù)數(shù)據(jù)關(guān)聯(lián)單元,用于根據(jù)相似度計(jì)算結(jié)果,確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系。根據(jù)本申請(qǐng)?zhí)峁┑木唧w實(shí)施例,本申請(qǐng)公開(kāi)了以下技術(shù)效果:通過(guò)本申請(qǐng),可以確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù),分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理,生成一個(gè)或多個(gè)第一有效字符串集合,以及多個(gè)第二有效字符串集合,通過(guò)各第一有效字符串集合與各第二有效字符串集合之間的相似度,確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)對(duì)同一筆業(yè)務(wù)在不同節(jié)點(diǎn)中的追蹤,該方法基于節(jié)點(diǎn)交互數(shù)據(jù)中提取的有效數(shù)據(jù)進(jìn)行相似性分析實(shí)現(xiàn),可以不依賴統(tǒng)一業(yè)務(wù)流水號(hào)在各相關(guān)節(jié)點(diǎn)中對(duì)同一筆業(yè)務(wù)的業(yè)務(wù)數(shù)據(jù)進(jìn)行準(zhǔn)確的追蹤,為系統(tǒng)運(yùn)維過(guò)程中還原業(yè)務(wù)的詳細(xì)執(zhí)行過(guò)程,快速進(jìn)行故障診斷和分析,獲得實(shí)時(shí)異常事件警告等工作提供準(zhǔn)確且有效的依據(jù),對(duì)提高響應(yīng)速度等,提升運(yùn)維質(zhì)量都有著非常重要的意義。當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。附圖說(shuō)明為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本申請(qǐng)實(shí)施例提供的方法的流程圖;圖2是本申請(qǐng)實(shí)施例提供的在用戶界面中顯示狀態(tài)描述數(shù)據(jù)的示意圖;圖3是本申請(qǐng)實(shí)施例提供的裝置的示意圖。具體實(shí)施方式下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。傳統(tǒng)運(yùn)維服務(wù)方法和工具采集特定方面的系統(tǒng)運(yùn)行數(shù)據(jù),難以適應(yīng)信息系統(tǒng)組件構(gòu)成的多樣化,以及用戶關(guān)注點(diǎn)由基礎(chǔ)設(shè)施層面向業(yè)務(wù)數(shù)據(jù)層面轉(zhuǎn)移的趨勢(shì),通過(guò)大量實(shí)踐證明,在信息系統(tǒng)組件構(gòu)成越來(lái)越多樣化的趨勢(shì)下,實(shí)現(xiàn)一種更加靈活的,面向業(yè)務(wù)層數(shù)據(jù)的,跨組件,跨業(yè)務(wù),異構(gòu)環(huán)境多層次的業(yè)務(wù)數(shù)據(jù)追蹤方法,對(duì)于還原業(yè)務(wù)的詳細(xì)執(zhí)行過(guò)程,快速進(jìn)行故障診斷和分析,獲得實(shí)時(shí)異常事件警告,提升運(yùn)維響應(yīng)速度等都有著非常重要的意義。本方法的基本原理包括基于業(yè)務(wù)數(shù)據(jù)中有效字符串的相似度分析實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)的追蹤,尤其在信息系統(tǒng)業(yè)務(wù)數(shù)據(jù)中缺乏全局的統(tǒng)一業(yè)務(wù)流水號(hào)作為追蹤依據(jù)的情況下,也能夠?qū)崿F(xiàn)在不同節(jié)點(diǎn)中對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行準(zhǔn)確有效的追蹤。下面結(jié)合具體實(shí)施例,對(duì)本申請(qǐng)所提供的業(yè)務(wù)數(shù)據(jù)的追蹤方法進(jìn)行詳細(xì)說(shuō)明。請(qǐng)參見(jiàn)圖1,為本申請(qǐng)實(shí)施例提供的業(yè)務(wù)數(shù)據(jù)的追蹤方法的流程圖,如圖1所示,該方法可以包括以下步驟:S110:確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù);所述被監(jiān)控節(jié)點(diǎn)至少包括信息系統(tǒng)的第一節(jié)點(diǎn)以及第二節(jié)點(diǎn);其中,第一節(jié)點(diǎn)的交互數(shù)據(jù)包括一條或多條業(yè)務(wù)請(qǐng)求數(shù)據(jù),以及第二節(jié)點(diǎn)的交互數(shù)據(jù)包括多條業(yè)務(wù)響應(yīng)數(shù)據(jù);信息系統(tǒng)的結(jié)構(gòu)組成越來(lái)越復(fù)雜,不同的信息系統(tǒng)的部署不盡相同,根據(jù)物理設(shè)備或邏輯布局有不同的定義劃分,例如系統(tǒng)通常包括多個(gè)節(jié)點(diǎn),或完成不同功能的應(yīng)用組件,在以下內(nèi)容中,僅以節(jié)點(diǎn)為組成單位來(lái)介紹該方法的實(shí)現(xiàn),當(dāng)然,以節(jié)點(diǎn)的角度描述該方法不應(yīng)理解為對(duì)本申請(qǐng)的限制。在本申請(qǐng)實(shí)施例中,業(yè)務(wù)數(shù)據(jù)的追蹤方法可以作為自動(dòng)化運(yùn)維服務(wù)工具的一個(gè)功能實(shí)現(xiàn),通過(guò)自動(dòng)化運(yùn)維服務(wù)工具可以實(shí)現(xiàn)對(duì)信息系統(tǒng)多節(jié)點(diǎn)的I/O數(shù)據(jù)進(jìn)行采集,存儲(chǔ),分析等工作,而對(duì)于多個(gè)節(jié)點(diǎn)數(shù)據(jù)的采集,則可以匯總到自動(dòng)化運(yùn)維服務(wù)工具進(jìn)行統(tǒng)一處理。在實(shí)現(xiàn)本業(yè)務(wù)數(shù)據(jù)的追蹤方法時(shí),首先可以確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù),在實(shí)際應(yīng)用中,完成同一業(yè)務(wù)處理過(guò)程可能有業(yè)務(wù)系統(tǒng)的多個(gè)節(jié)點(diǎn)或組件參與,且通常會(huì)由系統(tǒng)輸入輸出角度形成一個(gè)閉環(huán),為了便于理解,以下以被監(jiān)控節(jié)點(diǎn)包括信息系統(tǒng)的第一節(jié)點(diǎn)以及第二節(jié)點(diǎn)為例進(jìn)行介紹,當(dāng)需要對(duì)業(yè)務(wù)系統(tǒng)中多個(gè)節(jié)點(diǎn)中的追蹤同一筆業(yè)務(wù)數(shù)據(jù)時(shí),可以依據(jù)本實(shí)施例提供的步驟,依次在相應(yīng)節(jié)點(diǎn)實(shí)施即可,本實(shí)施例以兩個(gè)節(jié)點(diǎn)為示例對(duì)該方法的介紹,同樣不應(yīng)理解為對(duì)本申請(qǐng)的限制。確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù),其中被監(jiān)控節(jié)點(diǎn)至少可以包括信息系統(tǒng)的第一節(jié)點(diǎn)以及第二節(jié)點(diǎn),第一節(jié)點(diǎn)的交互數(shù)據(jù)包括一條或多條業(yè)務(wù)請(qǐng)求數(shù)據(jù),以及第二節(jié)點(diǎn)的交互數(shù)據(jù)則包括多條業(yè)務(wù)響應(yīng)數(shù)據(jù)。應(yīng)注意,第一節(jié)點(diǎn)的交互數(shù)據(jù)包括的業(yè)務(wù)請(qǐng)求數(shù)據(jù)可以為一條,也可以為多條,兩種情況下,都可以利用本申請(qǐng)實(shí)施例提供的方法進(jìn)行業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)的匹配,以實(shí)現(xiàn)在不同節(jié)點(diǎn)的交互數(shù)據(jù)中對(duì)同筆業(yè)務(wù)的數(shù)據(jù)進(jìn)行追蹤,對(duì)于兩種情形下的實(shí)現(xiàn)以及應(yīng)用,后續(xù)步驟會(huì)有詳細(xì)介紹。在確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù)時(shí),對(duì)于不同的實(shí)際應(yīng)用可以有不同的實(shí)現(xiàn)方式,其中一種實(shí)現(xiàn)方式下,可以實(shí)時(shí)采集第一節(jié)點(diǎn)的業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及第二節(jié)點(diǎn)的業(yè)務(wù)響應(yīng)數(shù)據(jù),另一種實(shí)現(xiàn)方式下,在基于存儲(chǔ)的或具有存儲(chǔ)功能的運(yùn)維服務(wù)工具中,例如采用了分布式數(shù)據(jù)庫(kù)存儲(chǔ)服務(wù)的運(yùn)維服務(wù)工具中,對(duì)于各被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù),都可以進(jìn)行存儲(chǔ),在這種實(shí)現(xiàn)方式下,可以從預(yù)置數(shù)據(jù)庫(kù)中讀取符合預(yù)設(shè)條件的第一節(jié)點(diǎn)的業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及第二節(jié)點(diǎn)的業(yè)務(wù)響應(yīng)數(shù)據(jù)即可。預(yù)置條件例如符合特定的時(shí)間條件,業(yè)務(wù)類型條件,組件條件等等。另外,在進(jìn)行節(jié)點(diǎn)數(shù)據(jù)的采集或抓取時(shí),所采集的數(shù)據(jù)通常會(huì)包括業(yè)務(wù)請(qǐng)求/響應(yīng)數(shù)據(jù)對(duì)應(yīng)的時(shí)間戳,為了使待匹配的業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)在時(shí)間上滿足一定的對(duì)應(yīng)性,可以使待匹配的業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)在時(shí)間上處于一個(gè)相同的大致范圍,這一點(diǎn)可以在確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù)時(shí)實(shí)現(xiàn),具體的,可以確定第一節(jié)點(diǎn)的業(yè)務(wù)請(qǐng)求數(shù)據(jù)的時(shí)間戳,根據(jù)時(shí)間戳以及預(yù)設(shè)時(shí)間范圍,確定滿足時(shí)間條件的第二節(jié)點(diǎn)的業(yè)務(wù)響應(yīng)數(shù)據(jù)。例如確定第一節(jié)點(diǎn)的業(yè)務(wù)請(qǐng)求數(shù)據(jù)的時(shí)間戳為某一時(shí)刻,預(yù)設(shè)時(shí)間范圍為1分鐘,接下來(lái)就可以實(shí)時(shí)抓取,或從預(yù)置數(shù)據(jù)庫(kù)中讀取滿足該時(shí)刻起1分鐘內(nèi)的第二節(jié)點(diǎn)的業(yè)務(wù)響應(yīng)數(shù)據(jù)。通過(guò)這種實(shí)現(xiàn)方式可以過(guò)濾和精確化數(shù)據(jù)范圍,減少計(jì)算量,提高匹配成功率等。S120:分別對(duì)所述業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及所述業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理,生成一個(gè)或多個(gè)第一有效字符串集合,以及多個(gè)第二有效字符串集合;其中,每個(gè)第一有效字符串集合與一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)對(duì)應(yīng),每個(gè)第二有效字符串集合與一條業(yè)務(wù)響應(yīng)數(shù)據(jù)對(duì)應(yīng)。在確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù)后,具體的,可以是確定了第一節(jié)點(diǎn)的交互數(shù)據(jù)包括的一條或多條業(yè)務(wù)請(qǐng)求數(shù)據(jù),以及第二節(jié)點(diǎn)的交互數(shù)據(jù)包括的多條業(yè)務(wù)響應(yīng)數(shù)據(jù)后,可以分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及各業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理,生成一個(gè)或多個(gè)第一有效字符串集合,以及多個(gè)第二有效字符串集合;其中,每個(gè)第一有效字符串集合與一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)對(duì)應(yīng),每個(gè)第二有效字符串集合與一條業(yè)務(wù)響應(yīng)數(shù)據(jù)對(duì)應(yīng)。第一有效字符串集合以及第二有效字符串集合分別包括若干有效字符串,有效字符串包括從業(yè)務(wù)請(qǐng)求數(shù)據(jù)或業(yè)務(wù)響應(yīng)數(shù)據(jù)中提取的、用于相似度分析過(guò)程的字符串。例如,業(yè)務(wù)請(qǐng)求數(shù)據(jù)與第一有效字符串集合的對(duì)應(yīng)關(guān)系如表1所示:表1第j條業(yè)務(wù)請(qǐng)求數(shù)據(jù)第一有效字符串集合Aj其中,j∈N*且j≤m;m為業(yè)務(wù)請(qǐng)求數(shù)據(jù)的總條數(shù);特別的,當(dāng)?shù)谝还?jié)點(diǎn)的交互數(shù)據(jù)僅包括一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)時(shí),m=1。業(yè)務(wù)響應(yīng)數(shù)據(jù)與第二有效字符串集合的對(duì)應(yīng)關(guān)系表2所示:表2第i條業(yè)務(wù)響應(yīng)數(shù)據(jù)第二有效字符串集合Bi其中,i∈N*且i≤l;其中l(wèi)為業(yè)務(wù)響應(yīng)數(shù)據(jù)的總條數(shù),且因?yàn)榈诙?jié)點(diǎn)的交互數(shù)據(jù)包括多條業(yè)務(wù)響應(yīng)數(shù)據(jù),l≥2。下面結(jié)合具體示例詳細(xì)介紹提取有效字符串的處理的過(guò)程。被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù),包括業(yè)務(wù)請(qǐng)求數(shù)據(jù)和業(yè)務(wù)響應(yīng)數(shù)據(jù),通常為被監(jiān)控節(jié)點(diǎn)的I/O數(shù)據(jù),其數(shù)據(jù)表達(dá)形式通常為業(yè)務(wù)請(qǐng)求數(shù)據(jù)或業(yè)務(wù)響應(yīng)數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)塊,數(shù)據(jù)塊未經(jīng)過(guò)分割,且其中通常包含大量對(duì)于相似度分析過(guò)程無(wú)用的字符或字符串,同時(shí),對(duì)于相似度分析過(guò)程有效的字符串中,也包含了一些重復(fù)的字符串。例如,某業(yè)務(wù)請(qǐng)求數(shù)據(jù)的數(shù)據(jù)塊包括如下信息:TTT\u0000\u0000\b?\\u0001?0\\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0001\u0011\u00033\u0000\u0000\u0000\u0000\b?\\u0000\u0000\u0002\u0000\u0000\u0000\u0000\u0000\u0000\u0000QQQpmts\u0003301\\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0006?{H:01403100000004IBPS307584007998IBPS20160422130955XMLibps.101.001.01}……\r\n<?xmlversion=\"1.0\"encoding=\"UTF-8\"?><Documentxmlns=\"urn:iso:std:iso:20022:tech:xsd:pacs.008.001.02\"><FIToFICstmrCdtTrf><GrpHdr><MsgId>11111111111111111111111111</MsgId></GrpHdr><CreDtTm>2016-04-22T13:09:55</CreDtTm><Ctr1Sum>600.00</Ctr1Sum><Nm>張三</Nm><Id>1234567890123456789</Id><Issr>某某銀行</Issr>……<Id>403100000004</Id><Nm>李四</Nm><Othr><Id>2222222222222222</Id></Othr></FIToFICstmrCdtTrf></Document>為了節(jié)約計(jì)算資源,提高計(jì)算效率,以及提高分析結(jié)果的準(zhǔn)確性,分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及各業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理時(shí),可以包括數(shù)據(jù)分割處理,字符串去重處理,以及字符串過(guò)濾處理。字符串過(guò)濾處理,又可以包括濾除無(wú)用字符串以及濾除異常字符串。其中,數(shù)據(jù)分割處理可以依據(jù)業(yè)務(wù)請(qǐng)求數(shù)據(jù)或業(yè)務(wù)響應(yīng)數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)塊的格式采取不同的方法,當(dāng)數(shù)據(jù)塊的格式為html或xml格式時(shí),可以以提取html或xml標(biāo)簽間內(nèi)容的方式進(jìn)行分割,例如上述數(shù)據(jù)塊示例中的數(shù)據(jù):<Id>2222222222222222</Id>可以提取標(biāo)簽中的數(shù)據(jù)“2222222222222222”。而標(biāo)簽本身對(duì)于相似度分析過(guò)程通常是無(wú)用字符串,可以作為無(wú)用字符串予以濾除。對(duì)普通信息記錄格式,可以根據(jù)預(yù)先定義的無(wú)效字符串集合進(jìn)行,無(wú)效字符串集合中可以包括已知的無(wú)效字符和無(wú)效字符串,例如:\f,\r,\b,\n,\u0000-\uFFFF,’<>’\{}()以及空格等字符和字符串;在一個(gè)數(shù)據(jù)塊中,無(wú)效字符和字符串本身也具有分割信息的作用,顯然,在根據(jù)無(wú)效字符串集合對(duì)整個(gè)的數(shù)據(jù)塊進(jìn)行分割的同時(shí),也可以對(duì)根據(jù)無(wú)效字符串集合對(duì)數(shù)據(jù)塊中的無(wú)用字符串進(jìn)行過(guò)濾處理。在實(shí)際應(yīng)用中,根據(jù)業(yè)務(wù)請(qǐng)求數(shù)據(jù)或業(yè)務(wù)響應(yīng)數(shù)據(jù)的數(shù)據(jù)塊的格式特點(diǎn),字符串的分割方式可以靈活確定,例如可以結(jié)合無(wú)效字符串集合中定義的無(wú)效字符(串)以及html標(biāo)簽,來(lái)完成數(shù)據(jù)分割處理。另外,數(shù)據(jù)分割處理也可以與濾除無(wú)用字符串的處理同時(shí)進(jìn)行,例如上述示例中,在根據(jù)無(wú)效字符串集合對(duì)整個(gè)的數(shù)據(jù)塊進(jìn)行分割的同時(shí),也可以對(duì)根據(jù)無(wú)效字符串集合對(duì)數(shù)據(jù)塊中的無(wú)用字符串進(jìn)行過(guò)濾處理。在經(jīng)過(guò)數(shù)據(jù)分割處理和濾除無(wú)用字符串后,每一數(shù)據(jù)塊對(duì)應(yīng)的字符串集合仍常常存在重復(fù)的字符串,此時(shí)可以對(duì)其進(jìn)行進(jìn)一步的字符串去重處理。需要說(shuō)明的是,這里所述的“字符串集合”通常還包含有無(wú)效的或重復(fù)的字符串,因此并不是我們最終想要得到的第一有效字符串集合或第二有效字符串集合,而是數(shù)據(jù)塊到有效字符串集合的一個(gè)中間形態(tài),用于說(shuō)明提取有效字符串的處理過(guò)程。在實(shí)際應(yīng)用中,去重處理可以包括兩個(gè)方面的內(nèi)容,一個(gè)方面是對(duì)字符串集合中的字符串進(jìn)行去重,另一方面也可以包括對(duì)內(nèi)容完全相同的重復(fù)集合進(jìn)行去重,以提高運(yùn)算效率,避免資源浪費(fèi)。第一節(jié)點(diǎn)的一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)分割處理,字符串去重處理,濾除無(wú)用字符串之后得到的字符串集合的示例如下所示:{某某銀行,11111111111111111111111111,403100000004,110106,1234567890123456789,2222222222222222,李四,hS8GiU4,110106,W1Tjv8AoNk052dsFvkbot4A400jqb6qtkoLNCs9gGIK2mZjF2CtOUh5NCIAk3ygikeH2G6u9H2rMwcW4aUFIoj160,ZuER61EbFASKgcy8I9Uxs,張三,600.00,9IbdN5VF8tguw3wyBcC,2016042205082306,H:01403100000004IBPS307584007998IBPS20160422130955XMLibps.101.001.01,3CglOuTD2NxRsPORW12Sw5EPiv9PjVIr}第二節(jié)點(diǎn)的一條業(yè)務(wù)響應(yīng)數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)分割處理,字符串去重處理,濾除無(wú)用字符串之后得到的字符串集合的示例如下所示:{某某銀行,00002016042279912308,11111111111111111111111111,20160422010955388,403100000004,1234567890123456789,2222222222222222,李四,hS8GiU4,110106,ZuER61EbFASKgcy8I9Uxs,9IbdN5VF8tguw3wyBcC,張三,600.00,W1Tjv8AoNk052dsFvkbot4A400jqb6qtkoLNCs9gGIK2mZjF2CtOUh5NCIAk3ygikeH2G6u9H2rMwcW4aUFIoj160,3CglOuTD2NxRsPORW12Sw5EPiv9PjVIr}通過(guò)直觀的觀察可以發(fā)現(xiàn),兩個(gè)集合中的某些字符串具有一定的相似度,甚至有的字符串完全相同。而集合中字符串的相似性經(jīng)過(guò)量化整合,則可以反映出整個(gè)集合之間的相似性,也即各集合分別對(duì)應(yīng)的業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)的相似性,并依據(jù)其進(jìn)行業(yè)務(wù)數(shù)據(jù)的追蹤,這部分內(nèi)容的具體實(shí)現(xiàn)將在后續(xù)的步驟中做具體的闡述。為了進(jìn)一步提高計(jì)算效率和相似性分析結(jié)果的準(zhǔn)確性,提取有效字符串的處理中,字符串過(guò)濾處理還可以包括其中的濾除異常字符串,例如可以對(duì)經(jīng)過(guò)數(shù)據(jù)分割處理,字符串去重處理,以及濾除無(wú)用字符串之后得到的字符串集合,在進(jìn)行濾除異常字符串的處理。異常字符串的定義范圍確定可以根據(jù)實(shí)際應(yīng)用的需要進(jìn)行。例如可以根據(jù)得到的字符串集合中各字符串的長(zhǎng)度分布情況,將長(zhǎng)度過(guò)長(zhǎng)或過(guò)短的字符串確定為異常字符串。具體實(shí)現(xiàn)時(shí),可以通過(guò)盒形圖方法根據(jù)字符串長(zhǎng)度分布確定相關(guān)的觀測(cè)值,將不滿足觀測(cè)值條件的字符串確定為異常字符串并濾除;其中,觀測(cè)值可以包括一最小觀測(cè)值以及一最大觀測(cè)值。盒形圖是分析和確定一批數(shù)據(jù)中的異常值的方法,具體應(yīng)用到本實(shí)施例時(shí),可以首先將字符串集合中各字符串的長(zhǎng)度以一定順序排列,利用盒形圖方法確定下四分位數(shù)Q1,上四分位數(shù)Q3,進(jìn)而確定四分位距IQR=Q3-Q1,最小觀測(cè)值可以?。簃in=Q1–1.5*IQR;最大觀測(cè)值可以?。簃ax=Q3+1.5*IQR;這樣,就可以將字符串集合中長(zhǎng)度小于最小觀測(cè)值的字符串,以及長(zhǎng)度大于最大觀測(cè)值的字符串確定為異常字符串。除了使用盒形圖方法濾除異常字符串之外,還可以考慮計(jì)算字符串最短的占比及最長(zhǎng)的占比,根據(jù)此百分比閾值來(lái)濾除異常字符串,具體實(shí)現(xiàn)時(shí),可以先統(tǒng)計(jì)整個(gè)字符串集合中各個(gè)字符串長(zhǎng)度的百分比分布情況、按照字符串長(zhǎng)度對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行排序,濾除長(zhǎng)度最長(zhǎng)的預(yù)置百分比的字符串與長(zhǎng)度最短的預(yù)置百分比的字符串,例如過(guò)濾掉長(zhǎng)度最長(zhǎng)的10%與長(zhǎng)度最短的10%的字符串。此外,為了保證業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)的有效性,同時(shí)也是為了保證所提取的第一有效字符串集合以及第二有效字符串集合的有效性,在分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理后,對(duì)于各第一有效字符串集合以及各第二有效字符串集合,可以通過(guò)盒形圖方法判斷其中的有效字符串個(gè)數(shù)是否異常;將判斷為有效字符串個(gè)數(shù)存在異常的第一有效字符串集合,以及有效字符串個(gè)數(shù)存在異常的第二有效字符串集合丟棄。在這種實(shí)現(xiàn)方式下,分別確定各第一有效字符串集合與各第二有效字符串集合之間的相似度的過(guò)程中,可以分別確定有效字符串個(gè)數(shù)無(wú)異常的各第一有效字符串集合,與有效字符串個(gè)數(shù)無(wú)異常的各第二有效字符串集合之間的相似度。通過(guò)盒形圖方法判斷有效字符串個(gè)數(shù)是否異常時(shí),輸入為各第一有效字符串集合與各第二有效字符串集合的字符串個(gè)數(shù),進(jìn)而根據(jù)個(gè)數(shù)的分布情況確定最大觀測(cè)值以及最小觀測(cè)值,然后根據(jù)所確定的最大觀測(cè)值以及最小觀測(cè)值,來(lái)確定各第一有效字符串集合與各第二有效字符串集合的字符串個(gè)數(shù)是否存在異常。最大觀測(cè)值以及最小觀測(cè)值的具體確定方式與前述的盒形圖方法應(yīng)用類似,在此就不再贅述了。以上介紹了分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理過(guò)程,具體可以包括數(shù)據(jù)分割處理,字符串去重處理,以及字符串過(guò)濾處理等子過(guò)程,字符串過(guò)濾處理又可以包括濾除無(wú)用字符串以及濾除異常字符串等子過(guò)程,需要說(shuō)明的是,在實(shí)際應(yīng)用中,上述子過(guò)程包括的數(shù)據(jù)分割,以及多種提升對(duì)于相似度分析過(guò)程的字符串有效性的處理,各子過(guò)程可以根據(jù)實(shí)際應(yīng)用需要可選地采用,當(dāng)然如果實(shí)際應(yīng)用中需要加入其它的處理手段也是可以的??傊?jīng)過(guò)提取有效字符串的處理,得到與各條業(yè)務(wù)請(qǐng)求數(shù)據(jù)分別對(duì)應(yīng)第一有效字符串集合,以及與各條業(yè)務(wù)響應(yīng)數(shù)據(jù)分別對(duì)應(yīng)第二有效字符串集合。顯然,第一有效字符串集合的個(gè)數(shù)與業(yè)務(wù)請(qǐng)求數(shù)據(jù)的條數(shù)具有相關(guān)性,同理,第二有效字符串集合的個(gè)數(shù)與業(yè)務(wù)請(qǐng)求數(shù)據(jù)的條數(shù)具有相關(guān)性。S130:分別確定各第一有效字符串集合與各第二有效字符串集合之間的相似度;如前所述,本申請(qǐng)實(shí)施例的基本思想是通過(guò)計(jì)算字符串集合之間的相似度,來(lái)反映不同交互數(shù)據(jù)之間的相似程度,進(jìn)而根據(jù)交互數(shù)據(jù)之間的相似程度來(lái)確定交互數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。在分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理后,得到如表1及表2中所示的與各條交互數(shù)據(jù)(包括業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù))分別對(duì)應(yīng)的有效字符串的集合,接下來(lái),可以確定第一有效字符串集合Aj和第二有效字符串集合Bi的相似度。為了實(shí)現(xiàn)更好的兼容性,以適應(yīng)不同的應(yīng)用需求,本方法被設(shè)計(jì)為可以在業(yè)務(wù)請(qǐng)求數(shù)據(jù)為一條或者多條的條件下,都可以進(jìn)行有效字符串的提取和相似度分析,以為每一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)匹配相應(yīng)的業(yè)務(wù)響應(yīng)數(shù)據(jù)。特別的,當(dāng)?shù)谝还?jié)點(diǎn)的交互數(shù)據(jù)僅包括一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)時(shí),可以僅提取對(duì)應(yīng)的一個(gè)第一有效字符串集合Aj,即此時(shí)j=1,這種實(shí)現(xiàn)方式可以滿足僅確定第一節(jié)點(diǎn)的一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)的業(yè)務(wù)數(shù)據(jù)追蹤需求,例如在系統(tǒng)或用戶指定第一節(jié)點(diǎn)某一筆業(yè)務(wù)請(qǐng)求數(shù)據(jù),并對(duì)其在其他節(jié)點(diǎn)的對(duì)應(yīng)的業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行追蹤時(shí)。當(dāng)?shù)谝还?jié)點(diǎn)的交互數(shù)據(jù)包括多條業(yè)務(wù)請(qǐng)求數(shù)據(jù)時(shí),則可以對(duì)部分或業(yè)務(wù)請(qǐng)求數(shù)據(jù)匹配其相應(yīng)的業(yè)務(wù)響應(yīng)數(shù)據(jù)。顯然,所確定的第二節(jié)點(diǎn)的交互數(shù)據(jù)通常包括多條業(yè)務(wù)響應(yīng)數(shù)據(jù)。當(dāng)然,在不用于業(yè)務(wù)數(shù)據(jù)追蹤的應(yīng)用需求下,如果只有單條的業(yè)務(wù)響應(yīng)數(shù)據(jù),也可以通過(guò)本發(fā)明提供的方法與業(yè)務(wù)請(qǐng)求數(shù)據(jù)進(jìn)行相似度分析,分析結(jié)果可用于其它應(yīng)用需求的參考。在分別確定各第一有效字符串集合與各第二有效字符串集合之間的相似度的過(guò)程中,以下闡述同樣沿用表1以及表2中的條件假設(shè),即:假設(shè)業(yè)務(wù)請(qǐng)求數(shù)據(jù)的總條數(shù)為m,第j條業(yè)務(wù)請(qǐng)求數(shù)據(jù)經(jīng)過(guò)提取有效字符串得到對(duì)應(yīng)的第一有效字符串集合Aj,其中j∈N*且j≤m;特別的,當(dāng)?shù)谝还?jié)點(diǎn)的交互數(shù)據(jù)包括一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)時(shí),m=1,顯然,此時(shí)對(duì)于確定的第一有效字符串集合Aj,j的值為1;對(duì)于集合Aj,其中包括若干有效字符串,可以表示為:Aj{Aj1,Aj2,……,Ajs},其中s為Aj中有效字符串的個(gè)數(shù);以及,業(yè)務(wù)響應(yīng)數(shù)據(jù)的總條數(shù)為l,第i條業(yè)務(wù)響應(yīng)數(shù)據(jù)經(jīng)過(guò)提取有效字符串得到對(duì)應(yīng)的第二有效字符串集合Bi,其中,i∈N*且i≤l;對(duì)于集合Bi,其中包括若干有效字符串,可以表示為:Bi{Bi1,Bi2,……,Bin},其中n為Bi中有效字符串的個(gè)數(shù)。接下來(lái),可以分別確定各第一有效字符串集合Aj與各第二有效字符串集合Bi之間的相似度。對(duì)于第一有效字符串集合中的目標(biāo)集合Aj和第二有效字符串集合中的目標(biāo)集合Bi,可以首先確定目標(biāo)集合Aj中各有效字符串與目標(biāo)集合Bi中各有效字符串之間的字符串相似度,根據(jù)得到的各字符串相似度確定目標(biāo)集合Aj與目標(biāo)集合Bi之間的相似度。具體實(shí)現(xiàn)時(shí),可以通過(guò)如下方法進(jìn)行計(jì)算:其中,n為Bi中有效字符串的個(gè)數(shù),s為Aj中有效字符串的個(gè)數(shù),Similarity(Bi,Aj)為目標(biāo)集合Aj與目標(biāo)集合Bi之間的相似度計(jì)算結(jié)果,Similar()為對(duì)字符串進(jìn)行相似度計(jì)算的預(yù)置算法。預(yù)置算法可以在多種計(jì)算字符串間相似度的算法中進(jìn)行選擇,例如編輯距離算法,最長(zhǎng)公共子串算法,或余弦相距離算法等等。該方法可以描述為:對(duì)于目標(biāo)集合Aj和目標(biāo)集合Bi,以預(yù)置算法依次確定Bi中的各字符串Bik與Aj中所有字符串的相似度的最大值,并將得到的所有最大值的和確定為集合Aj與集合Bi之間的相似度;其中k∈{1,2,……,n},n為Bi中字符串的個(gè)數(shù)。以此類推,可以分別確定出各第一有效字符串集合與各第二有效字符串集合之間的相似度。S140:根據(jù)相似度計(jì)算結(jié)果,確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系。分別確定的各第一有效字符串集合與各第二有效字符串集合之間的相似度,然后,可以根據(jù)相似度計(jì)算結(jié)果,確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,如上述各集合Aj與集合Bi的相似度計(jì)算結(jié)果可以用如下相似度矩陣Sm×l表示:其中,m為第一有效字符串集合Aj的個(gè)數(shù),l為第二有效字符串集合Bi的個(gè)數(shù),sij為集合Aj與集合Bi的相似度。根據(jù)該相似度計(jì)算結(jié)果,即根據(jù)該相似度矩陣Sm×l確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系時(shí),可以遍歷該矩陣的每行,將每行中最大值所在位置(i,j)即為相匹配的集合Bi與集合Aj的編號(hào)。如前所述,業(yè)務(wù)請(qǐng)求數(shù)據(jù)與第一有效字符串集合具有對(duì)應(yīng)關(guān)系,而業(yè)務(wù)響應(yīng)數(shù)據(jù)與第二有效字符串集合具有對(duì)應(yīng)關(guān)系,在某個(gè)第一有效字符串集合與某個(gè)第二有效字符串集合的匹配關(guān)系后,可以確定對(duì)應(yīng)的業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)具有匹配關(guān)系,即確定了同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,從而實(shí)現(xiàn)了業(yè)務(wù)數(shù)據(jù)的追蹤。業(yè)務(wù)請(qǐng)求數(shù)據(jù)和業(yè)務(wù)響應(yīng)數(shù)據(jù)的匹配關(guān)系,可以使用業(yè)務(wù)請(qǐng)求數(shù)據(jù)和業(yè)務(wù)響應(yīng)數(shù)據(jù)各自的消息ID組成的匹配信息進(jìn)行標(biāo)識(shí)、存儲(chǔ)和調(diào)用,例如如下示例:{A:2fa27a66-1344-11e6-a84c-52540092e48e,B:2fa3d9f3-1344-11e6-a84c-52540092e48e}在信息系統(tǒng)處理某業(yè)務(wù)時(shí),完成同一業(yè)務(wù)處理常常由業(yè)務(wù)系統(tǒng)的多個(gè)節(jié)點(diǎn)共同參與,處理過(guò)程可以依時(shí)序形成一個(gè)閉環(huán)的路徑,本申請(qǐng)實(shí)施例提供的方法可以基于提取的有效字符串集合的相似度分析,進(jìn)行不同節(jié)點(diǎn)的交互數(shù)據(jù)的追蹤,因此,可以在部分甚至全部節(jié)點(diǎn)的交互數(shù)據(jù)缺乏統(tǒng)一業(yè)務(wù)流水號(hào)進(jìn)行關(guān)聯(lián)的情況下,也可以對(duì)在各參與節(jié)點(diǎn)中對(duì)同一筆業(yè)務(wù)的業(yè)務(wù)數(shù)據(jù)進(jìn)行準(zhǔn)確的追蹤。在另一種實(shí)現(xiàn)方式下,可以首先判斷業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)中是否存在統(tǒng)一業(yè)務(wù)流水號(hào),若存在,則優(yōu)先根據(jù)統(tǒng)一業(yè)務(wù)流水號(hào)進(jìn)行同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系的確定,從而在存在可進(jìn)行業(yè)務(wù)數(shù)據(jù)關(guān)聯(lián)的統(tǒng)一業(yè)務(wù)流水號(hào)的情況下,減少計(jì)算量和系統(tǒng)壓力,靈活適應(yīng)不同的應(yīng)用場(chǎng)景。在確定了同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系后,還可以為用戶展示該筆業(yè)務(wù)在各路徑節(jié)點(diǎn)中的各種相關(guān)狀態(tài),使用戶可以直觀的了解被查詢業(yè)務(wù)在各節(jié)點(diǎn)處理的各種狀態(tài)信息,可以確定業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)在對(duì)應(yīng)節(jié)點(diǎn)的狀態(tài)描述數(shù)據(jù),并根據(jù)指令在用戶界面中顯示狀態(tài)描述數(shù)據(jù)。狀態(tài)描述數(shù)據(jù)包括以下描述數(shù)據(jù)的任意組合:請(qǐng)求時(shí)間,節(jié)點(diǎn)標(biāo)識(shí),節(jié)點(diǎn)屬性,響應(yīng)時(shí)間,時(shí)間消耗,業(yè)務(wù)類型,返回狀態(tài),以及返回碼等等。如圖2所示,為在用戶界面中顯示狀態(tài)描述數(shù)據(jù)的示意圖,圖中顯示了請(qǐng)求時(shí)間,以IP地址,端口信息等表示的節(jié)點(diǎn)標(biāo)識(shí),響應(yīng)時(shí)間,業(yè)務(wù)類型,返回狀態(tài),以及返回碼等狀態(tài)描述數(shù)據(jù)。以上對(duì)本申請(qǐng)實(shí)施例提供的業(yè)務(wù)數(shù)據(jù)的追蹤方法進(jìn)行了詳細(xì)的介紹,通過(guò)該方法,可以確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù)后,分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理,生成一個(gè)或多個(gè)第一有效字符串集合,以及多個(gè)第二有效字符串集合,通過(guò)各第一有效字符串集合與各第二有效字符串集合之間的相似度,確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)對(duì)同一筆業(yè)務(wù)在不同節(jié)點(diǎn)中的追蹤,該方法基于節(jié)點(diǎn)交互數(shù)據(jù)中提取的有效數(shù)據(jù)進(jìn)行相似性分析實(shí)現(xiàn),可以不依賴統(tǒng)一業(yè)務(wù)流水號(hào)在各相關(guān)節(jié)點(diǎn)中對(duì)同一筆業(yè)務(wù)的業(yè)務(wù)數(shù)據(jù)進(jìn)行準(zhǔn)確的追蹤,為系統(tǒng)運(yùn)維過(guò)程中還原業(yè)務(wù)的詳細(xì)執(zhí)行過(guò)程,快速進(jìn)行故障診斷和分析,獲得實(shí)時(shí)異常事件警告等工作提供準(zhǔn)確且有效的依據(jù),對(duì)提高響應(yīng)速度等,提升運(yùn)維質(zhì)量都有著非常重要的意義。與本申請(qǐng)實(shí)施例提供的業(yè)務(wù)數(shù)據(jù)的追蹤方法相對(duì)應(yīng),還提供了業(yè)務(wù)數(shù)據(jù)的追蹤裝置,如圖3所示,該裝置可以包括:交互數(shù)據(jù)確定單元310,用于確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù);被監(jiān)控節(jié)點(diǎn)至少包括信息系統(tǒng)的第一節(jié)點(diǎn)以及第二節(jié)點(diǎn);其中,第一節(jié)點(diǎn)的交互數(shù)據(jù)包括一條或多條業(yè)務(wù)請(qǐng)求數(shù)據(jù),以及第二節(jié)點(diǎn)的交互數(shù)據(jù)包括多條業(yè)務(wù)響應(yīng)數(shù)據(jù);字符串提取單元320,用于分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理,生成一個(gè)或多個(gè)第一有效字符串集合,以及多個(gè)第二有效字符串集合;其中,每個(gè)第一有效字符串集合與一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)對(duì)應(yīng),每個(gè)第二有效字符串集合與一條業(yè)務(wù)響應(yīng)數(shù)據(jù)對(duì)應(yīng);相似度計(jì)算單元330,用于分別確定各第一有效字符串集合與各第二有效字符串集合之間的相似度;以及,業(yè)務(wù)數(shù)據(jù)關(guān)聯(lián)單元340,用于根據(jù)相似度計(jì)算結(jié)果,確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系。其中,交互數(shù)據(jù)確定單元310具體可以用于:確定第一節(jié)點(diǎn)的業(yè)務(wù)請(qǐng)求數(shù)據(jù)的時(shí)間戳,根據(jù)時(shí)間戳以及預(yù)設(shè)時(shí)間范圍,確定滿足時(shí)間條件的第二節(jié)點(diǎn)的業(yè)務(wù)響應(yīng)數(shù)據(jù)。在另一種實(shí)現(xiàn)方式下,交互數(shù)據(jù)確定單元310可以包括:數(shù)據(jù)實(shí)時(shí)采集子單元,用于實(shí)時(shí)采集第一節(jié)點(diǎn)的業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及第二節(jié)點(diǎn)的業(yè)務(wù)響應(yīng)數(shù)據(jù);或,數(shù)據(jù)庫(kù)讀取子單元,用于從預(yù)置數(shù)據(jù)庫(kù)中讀取符合預(yù)設(shè)條件的第一節(jié)點(diǎn)的業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及第二節(jié)點(diǎn)的業(yè)務(wù)響應(yīng)數(shù)據(jù)。為保證采集到的交互數(shù)據(jù)的有效性,該裝置還可以包括:數(shù)據(jù)有效性判斷單元,用于在分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理后,對(duì)于各第一有效字符串集合以及各第二有效字符串集合,通過(guò)盒形圖方法判斷其中的有效字符串個(gè)數(shù)是否異常;將判斷為有效字符串個(gè)數(shù)存在異常的第一有效字符串集合,以及有效字符串個(gè)數(shù)存在異常的第二有效字符串集合丟棄;在這種實(shí)現(xiàn)方式下,相似度計(jì)算單元330具體用于分別確定有效字符串個(gè)數(shù)無(wú)異常的各第一有效字符串集合,與有效字符串個(gè)數(shù)無(wú)異常的各第二有效字符串集合之間的相似度。字符串提取單元320對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理,具體可以用于:數(shù)據(jù)分割處理,字符串去重處理,以及字符串過(guò)濾處理。在這種實(shí)現(xiàn)方式下,字符串過(guò)濾處理可以包括濾除無(wú)用字符串以及濾除異常字符串。字符串提取單元320可以包括:第一過(guò)濾子單元,用于通過(guò)盒形圖方法根據(jù)字符串長(zhǎng)度分布確定相關(guān)的觀測(cè)值,將不滿足觀測(cè)值條件的字符串確定為異常字符串并濾除;其中,所述觀測(cè)值包括一最小觀測(cè)值以及一最大觀測(cè)值。在另一種實(shí)現(xiàn)方式下,字符串提取單元320可以包括:第二過(guò)濾子單元,用于統(tǒng)計(jì)目標(biāo)集合中字符串各個(gè)字符串長(zhǎng)度的百分比分布情況,按照字符串長(zhǎng)度對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行排序,濾除長(zhǎng)度最長(zhǎng)的預(yù)置百分比的字符串與長(zhǎng)度最短的預(yù)置百分比的字符串。此外,相似度計(jì)算單元330可以包括:相似度計(jì)算子單元,用于對(duì)于第一有效字符串集合中的目標(biāo)集合Aj和第二有效字符串集合中的目標(biāo)集合Bi,確定集合Aj中各有效字符串與集合Bi中各有效字符串之間的字符串相似度,根據(jù)得到的各字符串相似度確定集合Aj與集合Bi之間的相似度。其中,當(dāng)?shù)谝还?jié)點(diǎn)的交互數(shù)據(jù)包括一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)時(shí),對(duì)于確定的第一有效字符串集合Aj,j的值為1。其中,相似度計(jì)算子單元具體可以用于:以預(yù)置算法依次確定Bi中的各字符串Bik與Aj中所有字符串的相似度的最大值,并將得到的所有最大值的和確定為集合Aj與集合Bi之間的相似度;其中k∈{1,2,……,n},n為Bi中字符串的個(gè)數(shù)。其中,當(dāng)?shù)谝还?jié)點(diǎn)的交互數(shù)據(jù)包括一條業(yè)務(wù)請(qǐng)求數(shù)據(jù)時(shí),對(duì)于確定的第一有效字符串集合Aj,j的值為1。其中,預(yù)置算法包括以下算法中的任意一種:編輯距離算法,最長(zhǎng)公共子串算法,或,余弦相距離算法。此外,該業(yè)務(wù)數(shù)據(jù)的追蹤裝置還可以包括:流水號(hào)確定單元,用于判斷業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)中是否存在統(tǒng)一業(yè)務(wù)流水號(hào);業(yè)務(wù)數(shù)據(jù)關(guān)系確定單元,用于在存在統(tǒng)一業(yè)務(wù)流水號(hào)時(shí),優(yōu)先根據(jù)統(tǒng)一業(yè)務(wù)流水號(hào)進(jìn)行同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系的確定。該業(yè)務(wù)數(shù)據(jù)的追蹤裝置還可以包括:業(yè)務(wù)狀態(tài)數(shù)據(jù)提供單元,用于在確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系后,確定業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)在對(duì)應(yīng)節(jié)點(diǎn)的狀態(tài)描述數(shù)據(jù),并根據(jù)指令在用戶界面中顯示所述狀態(tài)描述數(shù)據(jù);所述狀態(tài)描述數(shù)據(jù)包括以下描述數(shù)據(jù)的任意組合:請(qǐng)求時(shí)間,節(jié)點(diǎn)標(biāo)識(shí),節(jié)點(diǎn)屬性,響應(yīng)時(shí)間,時(shí)間消耗,業(yè)務(wù)類型,返回狀態(tài),以及返回碼。以上對(duì)本申請(qǐng)實(shí)施例提供的業(yè)務(wù)數(shù)據(jù)的追蹤裝置進(jìn)行了的介紹,通過(guò)該裝置,可以確定被監(jiān)控節(jié)點(diǎn)的交互數(shù)據(jù)后,分別對(duì)業(yè)務(wù)請(qǐng)求數(shù)據(jù)以及業(yè)務(wù)響應(yīng)數(shù)據(jù)進(jìn)行提取有效字符串的處理,生成一個(gè)或多個(gè)第一有效字符串集合,以及多個(gè)第二有效字符串集合,通過(guò)各第一有效字符串集合與各第二有效字符串集合之間的相似度,確定同一筆業(yè)務(wù)中業(yè)務(wù)請(qǐng)求數(shù)據(jù)與業(yè)務(wù)響應(yīng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)對(duì)同一筆業(yè)務(wù)在不同節(jié)點(diǎn)中的追蹤,該方法基于節(jié)點(diǎn)交互數(shù)據(jù)中提取的有效數(shù)據(jù)進(jìn)行相似性分析實(shí)現(xiàn),可以不依賴統(tǒng)一業(yè)務(wù)流水號(hào)在各相關(guān)節(jié)點(diǎn)中對(duì)同一筆業(yè)務(wù)的業(yè)務(wù)數(shù)據(jù)進(jìn)行準(zhǔn)確的追蹤,為系統(tǒng)運(yùn)維過(guò)程中還原業(yè)務(wù)的詳細(xì)執(zhí)行過(guò)程,快速進(jìn)行故障診斷和分析,獲得實(shí)時(shí)異常事件警告等工作提供準(zhǔn)確且有效的依據(jù)。通過(guò)以上的實(shí)施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本申請(qǐng)可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn)。基于這樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如ROM/RAM、磁碟、光盤(pán)等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)或系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。以上所描述的系統(tǒng)及系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。以上對(duì)本申請(qǐng)所提供的業(yè)務(wù)數(shù)據(jù)的追蹤方法及裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本申請(qǐng)的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本申請(qǐng)的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請(qǐng)的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處。綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本申請(qǐng)的限制。當(dāng)前第1頁(yè)1 2 3