一種業(yè)務(wù)集中監(jiān)控方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種業(yè)務(wù)集中監(jiān)控方法及系統(tǒng),所述方法包括:采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù);根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗,生成預(yù)定格式的監(jiān)控?cái)?shù)據(jù);分析監(jiān)控?cái)?shù)據(jù),判斷是否出現(xiàn)業(yè)務(wù)異常,如果是,則根據(jù)預(yù)設(shè)的異常處理策略確定與業(yè)務(wù)異常相匹配的異常處理流程并執(zhí)行與異常處理流程相對應(yīng)的操作。本發(fā)明的業(yè)務(wù)集中監(jiān)控方法及系統(tǒng),將業(yè)務(wù)系統(tǒng)的業(yè)務(wù)執(zhí)行環(huán)節(jié)與監(jiān)控重試反饋等環(huán)節(jié)進(jìn)行解耦,能夠獨(dú)立地針對不同的業(yè)務(wù)異常情況進(jìn)行監(jiān)控并進(jìn)行異常處理操作,并可以針對不同數(shù)據(jù)來源進(jìn)行不同的異常處理規(guī)則配置,實(shí)現(xiàn)業(yè)務(wù)運(yùn)行的穩(wěn)定性并保證業(yè)務(wù)執(zhí)行環(huán)節(jié)的成功率。
【專利說明】
一種業(yè)務(wù)集中監(jiān)控方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及網(wǎng)絡(luò)監(jiān)控技術(shù)領(lǐng)域,特別涉及一種業(yè)務(wù)集中監(jiān)控方法及系統(tǒng)。
【背景技術(shù)】
[0002]業(yè)務(wù)或生產(chǎn)系統(tǒng),例如視頻播放系統(tǒng)、電子商務(wù)系統(tǒng)等,除了能完成系統(tǒng)應(yīng)有的業(yè)務(wù)功能之外,還需要有針對系統(tǒng)內(nèi)部所有過程進(jìn)行重試、監(jiān)控、報(bào)警、反饋的環(huán)節(jié)。針對失敗環(huán)節(jié)進(jìn)行監(jiān)控,超過閾值報(bào)警;對失敗環(huán)節(jié)數(shù)據(jù)進(jìn)行篩查展示反饋;針對不同的失敗環(huán)節(jié)進(jìn)行最大努力的重試,保證比較高的成功率。目前,在業(yè)務(wù)系統(tǒng)中進(jìn)行有限不可調(diào)控的簡單的重試,最終返回失敗結(jié)果;針對現(xiàn)有環(huán)節(jié)進(jìn)行簡單監(jiān)控報(bào)警,很難做到全面的、全流程的監(jiān)控;重試模塊融合在生產(chǎn)系統(tǒng)中,過多的重試可能會(huì)影響正常生產(chǎn),重試不夠,不能保證比較高的成功率,且不可控。而且生產(chǎn)與監(jiān)控部分融合在一個(gè)系統(tǒng)中,耦合性太高,可擴(kuò)展性差,不可復(fù)用。
【發(fā)明內(nèi)容】
[0003]有鑒于此,本發(fā)明的目的在于提出一種業(yè)務(wù)集中監(jiān)控方法及系統(tǒng),實(shí)現(xiàn)針對不同的業(yè)務(wù)異常情況進(jìn)行監(jiān)控和異常處理操作。
[0004]基于上述目的本發(fā)明提供的一種業(yè)務(wù)集中監(jiān)控方法,包括:采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù);根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗,生成預(yù)定格式的監(jiān)控?cái)?shù)據(jù);分析所述監(jiān)控?cái)?shù)據(jù),判斷是否出現(xiàn)業(yè)務(wù)異常,如果是,則根據(jù)預(yù)設(shè)的異常處理策略確定與所述業(yè)務(wù)異常相匹配的異常處理流程并執(zhí)行與所述異常處理流程相對應(yīng)的操作。
[0005]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù)包括:基于設(shè)置的監(jiān)聽IP地址和監(jiān)聽端口建立套接字Socket連接;對于所述Socket連接啟動(dòng)一個(gè)或多個(gè)監(jiān)聽線程,通過所述Socket連接接收所述業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。
[0006]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù)包括:監(jiān)聽設(shè)置的消息隊(duì)列并從所述消息隊(duì)列中獲取所述業(yè)務(wù)相關(guān)數(shù)據(jù);其中,所述消息隊(duì)列用于存儲(chǔ)所述業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。
[0007]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù)包括:從所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中提取所述業(yè)務(wù)相關(guān)數(shù)據(jù)。
[0008]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗、生成預(yù)定格式的監(jiān)控?cái)?shù)據(jù)包括:配置數(shù)據(jù)清洗規(guī)則文件,所述數(shù)據(jù)清洗規(guī)則文件中至少包括一條數(shù)據(jù)清洗規(guī)則;遍歷全部的數(shù)據(jù)清洗規(guī)則依次對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行篩選處理;將通過所述篩選處理的所述業(yè)務(wù)相關(guān)數(shù)據(jù)基于預(yù)定格式進(jìn)行格式轉(zhuǎn)換,生成所述監(jiān)控?cái)?shù)據(jù);將所述監(jiān)控?cái)?shù)據(jù)存儲(chǔ)在監(jiān)控?cái)?shù)據(jù)庫中。
[0009]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述分析所述監(jiān)控?cái)?shù)據(jù)、判斷是否出現(xiàn)業(yè)務(wù)異常包括:從所述監(jiān)控?cái)?shù)據(jù)中提取業(yè)務(wù)狀態(tài)信息,基于所述業(yè)務(wù)狀態(tài)信息判斷是否出現(xiàn)業(yè)務(wù)異常。
[0010]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述根據(jù)預(yù)設(shè)的異常處理策略確定與所述業(yè)務(wù)異常相匹配的異常處理流程并執(zhí)行與所述異常處理流程相對應(yīng)的操作包括:當(dāng)判斷出現(xiàn)業(yè)務(wù)異常時(shí),則從所述監(jiān)控?cái)?shù)據(jù)中提取與此業(yè)務(wù)異常相關(guān)的業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼,基于所述業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼統(tǒng)計(jì)此業(yè)務(wù)異常發(fā)生的次數(shù);將所述業(yè)務(wù)節(jié)點(diǎn)信息、業(yè)務(wù)狀態(tài)信息、失敗原因碼以及業(yè)務(wù)異常發(fā)生的次數(shù)輸入異常處理規(guī)則引擎進(jìn)行規(guī)則匹配,確定異常處理流程和執(zhí)行的操作,其中,所述執(zhí)行的操作包括:重試、報(bào)警、反饋操作。
[0011]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述確定異常處理流程和執(zhí)行的操作包括:所述規(guī)則包括:報(bào)警次數(shù)閾值;當(dāng)業(yè)務(wù)異常的次數(shù)超過所述報(bào)警次數(shù)閾值時(shí),則向發(fā)送報(bào)警?目息O
[0012]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述確定異常處理流程和異常處理包括:所述規(guī)則包括:第一業(yè)務(wù)狀態(tài)、重傳原因碼、重傳次數(shù)閾值;當(dāng)所述業(yè)務(wù)狀態(tài)信息與所述業(yè)務(wù)狀態(tài)匹配、所述失敗原因碼與所述重傳原因碼匹配并且出現(xiàn)此業(yè)務(wù)異常的次數(shù)未超過預(yù)設(shè)的重傳次數(shù)閾值時(shí),則調(diào)用業(yè)務(wù)系統(tǒng)提供的接口進(jìn)行重試處理。
[0013]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述確定異常處理流程和異常處理包括:所述規(guī)則包括:第二業(yè)務(wù)狀態(tài)、反饋原因碼;當(dāng)所述業(yè)務(wù)狀態(tài)信息與所述業(yè)務(wù)狀態(tài)匹配、所述失敗原因碼與所述反饋原因碼匹配時(shí),則向設(shè)定的反饋接收人或業(yè)務(wù)系統(tǒng)發(fā)送反饋信息,其中,發(fā)送反饋信息的方式包括:郵件、短信。
[0014]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,包括:通過配置管理界面配置異常處理規(guī)則引擎中的規(guī)則,并在所述配置管理界面上顯示信息,包括:異常業(yè)務(wù)信息、報(bào)警信息、重試信息、反饋信息。
[0015]—種業(yè)務(wù)集中監(jiān)控系統(tǒng),包括:數(shù)據(jù)采集模塊,用于采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù);數(shù)據(jù)清洗模塊,用于根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗,生成預(yù)定格式的監(jiān)控?cái)?shù)據(jù);分析適配模塊,用于分析所述監(jiān)控?cái)?shù)據(jù),判斷是否出現(xiàn)業(yè)務(wù)異常,如果是,則根據(jù)預(yù)設(shè)的異常處理策略確定與所述業(yè)務(wù)異常相匹配的異常處理流程;執(zhí)行操作單元,用于所述異常處理流程相對應(yīng)的操作。
[0016]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述數(shù)據(jù)采集模塊,用于基于設(shè)置的監(jiān)聽IP地址和監(jiān)聽端口建立套接字Socket連接;對于所述Socket連接啟動(dòng)一個(gè)或多個(gè)監(jiān)聽線程,通過所述Socket連接接收所述業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。
[0017]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述數(shù)據(jù)采集模塊,用于監(jiān)聽設(shè)置的消息隊(duì)列并從所述消息隊(duì)列中獲取所述業(yè)務(wù)相關(guān)數(shù)據(jù);其中,所述消息隊(duì)列用于存儲(chǔ)所述業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。
[0018]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述數(shù)據(jù)采集模塊,用于從所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中提取所述業(yè)務(wù)相關(guān)數(shù)據(jù)。
[0019]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述數(shù)據(jù)清洗模塊,用于配置數(shù)據(jù)清洗規(guī)則文件,所述數(shù)據(jù)清洗規(guī)則文件中至少包括一條數(shù)據(jù)清洗規(guī)則;遍歷全部的數(shù)據(jù)清洗規(guī)則依次對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行篩選處理;將通過所述篩選處理的所述業(yè)務(wù)相關(guān)數(shù)據(jù)基于預(yù)定格式進(jìn)行格式轉(zhuǎn)換,生成所述監(jiān)控?cái)?shù)據(jù);將所述監(jiān)控?cái)?shù)據(jù)存儲(chǔ)在監(jiān)控?cái)?shù)據(jù)庫中。
[0020]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述分析適配模塊,用于從所述監(jiān)控?cái)?shù)據(jù)中提取業(yè)務(wù)狀態(tài)信息,基于所述業(yè)務(wù)狀態(tài)信息判斷是否出現(xiàn)業(yè)務(wù)異常。
[0021]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述分析適配模塊,還用于當(dāng)判斷出現(xiàn)業(yè)務(wù)異常時(shí),從所述監(jiān)控?cái)?shù)據(jù)中提取與此業(yè)務(wù)異常相關(guān)的業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼,基于所述業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼統(tǒng)計(jì)此業(yè)務(wù)異常發(fā)生的次數(shù);將所述業(yè)務(wù)節(jié)點(diǎn)信息、業(yè)務(wù)狀態(tài)信息、失敗原因碼以及業(yè)務(wù)異常發(fā)生的次數(shù)輸入異常處理規(guī)則引擎進(jìn)行規(guī)則匹配,確定異常處理流程和執(zhí)行的操作,其中,所述執(zhí)行的操作包括:重試、報(bào)警、反饋操作。
[0022]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述規(guī)則包括:報(bào)警次數(shù)閾值;當(dāng)所述分析適配模塊判斷業(yè)務(wù)異常的次數(shù)超過所述報(bào)警次數(shù)閾值時(shí),確定執(zhí)行報(bào)警操作;所述執(zhí)行操作單元包括:報(bào)警模塊,用于發(fā)送報(bào)警信息。
[0023]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述規(guī)則包括:第一業(yè)務(wù)狀態(tài)、重傳原因碼、重傳次數(shù)閾值;當(dāng)所述分析適配模塊判斷所述業(yè)務(wù)狀態(tài)信息與所述業(yè)務(wù)狀態(tài)匹配、所述失敗原因碼與所述重傳原因碼匹配并且出現(xiàn)此業(yè)務(wù)異常的次數(shù)未超過預(yù)設(shè)的重傳次數(shù)閾值時(shí),確定執(zhí)行重試操作;所述執(zhí)行操作單元包括:重試模塊,用于調(diào)用業(yè)務(wù)系統(tǒng)提供的接口進(jìn)行重試處理。
[0024]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,所述規(guī)則包括:第二業(yè)務(wù)狀態(tài)、反饋原因碼;當(dāng)所述分析適配模塊判斷所述業(yè)務(wù)狀態(tài)信息與所述業(yè)務(wù)狀態(tài)匹配、所述失敗原因碼與所述反饋原因碼匹配時(shí),確定執(zhí)行反饋操作;所述執(zhí)行操作單元包括:反饋模塊,用于向設(shè)定的反饋接收人或業(yè)務(wù)系統(tǒng)發(fā)送反饋信息,其中,發(fā)送反饋信息的方式包括:郵件、短信。
[0025]根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步的,配置管理模塊,用于通過配置管理界面配置異常處理規(guī)則引擎中的規(guī)則,并在所述配置管理界面上顯示信息,包括:異常業(yè)務(wù)信息、報(bào)警信息、重試信息、反饋信息。
[0026]本發(fā)明的業(yè)務(wù)集中監(jiān)控方法及系統(tǒng),將業(yè)務(wù)系統(tǒng)的業(yè)務(wù)執(zhí)行環(huán)節(jié)與監(jiān)控重試反饋等環(huán)節(jié)進(jìn)行解耦,能夠獨(dú)立地針對不同的業(yè)務(wù)異常情況進(jìn)行監(jiān)控并進(jìn)行異常處理操作,并可以針對不同數(shù)據(jù)來源進(jìn)行不同的異常處理規(guī)則配置。
【附圖說明】
[0027]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0028]圖1為根據(jù)本發(fā)明的業(yè)務(wù)集中監(jiān)控方法的一個(gè)實(shí)施例的流程示意圖;
[0029]圖2為根據(jù)本發(fā)明的業(yè)務(wù)集中監(jiān)控系統(tǒng)的一個(gè)實(shí)施例的模塊示意圖。
【具體實(shí)施方式】
[0030]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對本發(fā)明進(jìn)一步詳細(xì)說明。
[0031]需要說明的是,本發(fā)明實(shí)施例中所有使用“第一”和“第二”的表述均是為了區(qū)分兩個(gè)相同名稱非相同的實(shí)體或者非相同的參量,可見“第一” “第二”僅為了表述的方便,不應(yīng)理解為對本發(fā)明實(shí)施例的限定,后續(xù)實(shí)施例對此不再一一說明。
[0032]圖1為根據(jù)本發(fā)明的業(yè)務(wù)集中監(jiān)控方法的一個(gè)實(shí)施例的流程示意圖,如圖1所示:
[0033]步驟101,采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù),可以采集多個(gè)業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù),例如,視頻播放系統(tǒng)、電子商務(wù)系統(tǒng)等。
[0034]步驟102,根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗,生成預(yù)定格式的監(jiān)控?cái)?shù)據(jù)。
[0035]步驟103,分析所述監(jiān)控?cái)?shù)據(jù),判斷是否出現(xiàn)業(yè)務(wù)異常。
[0036]步驟104,如果否,則不進(jìn)行處理。如果是,則根據(jù)預(yù)設(shè)的異常處理策略確定與所述業(yè)務(wù)異常相匹配的異常處理流程并執(zhí)行與所述異常處理流程相對應(yīng)的操作,在操作執(zhí)行后,將執(zhí)行的信息存放在監(jiān)控?cái)?shù)據(jù)庫中。
[0037]在一個(gè)實(shí)施例中,基于設(shè)置的監(jiān)聽IP地址和監(jiān)聽端口建立套接字Socket連接,對于所述Socket連接啟動(dòng)一個(gè)或多個(gè)監(jiān)聽線程,通過所述Socket連接接收所述業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。
[0038]例如,在配置文件中配置了業(yè)務(wù)系統(tǒng)中執(zhí)行業(yè)務(wù)的服務(wù)器的IP地址作為監(jiān)聽IP地址,監(jiān)聽IP地址也可以配置為執(zhí)行監(jiān)控功能的服務(wù)器的IP地址,在配置文件中可以配置監(jiān)聽端口,例如,監(jiān)聽端口可以為80端口。監(jiān)聽IP地址和監(jiān)聽端口可以為一對或多對。
[0039]基于監(jiān)聽IP地址和監(jiān)聽端口建立套接字Socket連接,例如,使用JAVA的socket類建立連接。對于Socket連接啟動(dòng)一個(gè)或多個(gè)監(jiān)聽線程,通過建立的Socket連接接收業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù),可以實(shí)現(xiàn)單線程接收或多線程接收業(yè)務(wù)相關(guān)數(shù)據(jù)。
[0040]可以監(jiān)聽設(shè)置的消息隊(duì)列并從消息隊(duì)列中獲取業(yè)務(wù)相關(guān)數(shù)據(jù);消息隊(duì)列用于存儲(chǔ)業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。消息隊(duì)列可以為多種消息隊(duì)列,例如,配置JAVA消息隊(duì)列服務(wù)JMS,業(yè)務(wù)系統(tǒng)中執(zhí)行業(yè)務(wù)的服務(wù)器作為JMS的提供者,業(yè)務(wù)系統(tǒng)中執(zhí)行業(yè)務(wù)的服務(wù)器向消息隊(duì)列中發(fā)送業(yè)務(wù)相關(guān)數(shù)據(jù),執(zhí)行業(yè)務(wù)集中監(jiān)控的服務(wù)器為JMS的消費(fèi)者,從消息隊(duì)列中接收消息。
[0041]從業(yè)務(wù)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中提取業(yè)務(wù)相關(guān)數(shù)據(jù),例如,間隔固定的時(shí)間周期從業(yè)務(wù)數(shù)據(jù)庫中提取業(yè)務(wù)相關(guān)數(shù)據(jù),在下一次提取數(shù)據(jù)時(shí)提取在間隔時(shí)間周期內(nèi)的增量數(shù)據(jù)。上述采集業(yè)務(wù)相關(guān)數(shù)據(jù)的方法可以根據(jù)需要進(jìn)行配置,使用其中的一種或多種,并可以通過去重的方法保證獲取數(shù)據(jù)的唯一性。
[0042]在一個(gè)實(shí)施例中,業(yè)務(wù)相關(guān)數(shù)據(jù)為業(yè)務(wù)系統(tǒng)在執(zhí)行多個(gè)業(yè)務(wù)環(huán)節(jié)時(shí)產(chǎn)生的信息,包括業(yè)務(wù)日志、運(yùn)行狀態(tài)、trace、異常信息、告警信息等等??梢愿鶕?jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗,刪除掉與監(jiān)控關(guān)聯(lián)不大的信息。
[0043]配置數(shù)據(jù)清洗規(guī)則文件,數(shù)據(jù)清洗規(guī)則文件中至少包括一條數(shù)據(jù)清洗規(guī)則。例如,設(shè)置的一條數(shù)據(jù)清洗規(guī)則為數(shù)據(jù)中必須有業(yè)務(wù)狀態(tài)信息,即業(yè)務(wù)執(zhí)行為成功或失敗狀態(tài),業(yè)務(wù)為正?;虍惓顟B(tài)。遍歷全部的數(shù)據(jù)清洗規(guī)則依次對業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行篩選處理,將通過篩選處理的業(yè)務(wù)相關(guān)數(shù)據(jù)基于預(yù)定格式進(jìn)行格式轉(zhuǎn)換,生成監(jiān)控?cái)?shù)據(jù),將監(jiān)控?cái)?shù)據(jù)存儲(chǔ)在監(jiān)控?cái)?shù)據(jù)庫中。監(jiān)控?cái)?shù)據(jù)的格式可以根據(jù)具體的需要進(jìn)行設(shè)置,能夠存儲(chǔ)在監(jiān)控?cái)?shù)據(jù)庫中,監(jiān)控?cái)?shù)據(jù)庫可以為oracle、mysql等數(shù)據(jù)庫。
[0044]從監(jiān)控?cái)?shù)據(jù)中提取業(yè)務(wù)狀態(tài)信息,基于業(yè)務(wù)狀態(tài)信息判斷是否出現(xiàn)業(yè)務(wù)異常。例如,業(yè)務(wù)狀態(tài)信息為下載失敗、轉(zhuǎn)碼失敗等,則判斷出現(xiàn)了業(yè)務(wù)異常。當(dāng)判斷出現(xiàn)業(yè)務(wù)異常時(shí),則從監(jiān)控?cái)?shù)據(jù)中提取與此業(yè)務(wù)異常相關(guān)的業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼,基于業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼統(tǒng)計(jì)此業(yè)務(wù)異常發(fā)生的次數(shù)。
[0045]業(yè)務(wù)節(jié)點(diǎn)可以為執(zhí)行業(yè)務(wù)的服務(wù)器的ID等,業(yè)務(wù)狀態(tài)可以為上載文件、下載文件、轉(zhuǎn)碼等,失敗原因碼標(biāo)識(shí)出現(xiàn)失敗的原因,例如網(wǎng)絡(luò)故障為0001,格式不匹配為0002等??梢詮谋O(jiān)控?cái)?shù)據(jù)庫中統(tǒng)計(jì)針對同一服務(wù)器的ID和失敗原因碼統(tǒng)計(jì)此業(yè)務(wù)異常發(fā)生的次數(shù)。
[0046]將業(yè)務(wù)節(jié)點(diǎn)信息、業(yè)務(wù)狀態(tài)信息、失敗原因碼以及業(yè)務(wù)異常發(fā)生的次數(shù)輸入異常處理規(guī)則引擎進(jìn)行規(guī)則匹配,確定異常處理流程和執(zhí)行的操作,執(zhí)行的操作包括:重試、報(bào)警、反饋等操作,重試、報(bào)警、反饋等操作可以進(jìn)行隨意組合完成不同的異常處理流程。
[0047]異常處理規(guī)則引擎可以是一種嵌入在應(yīng)用程序中的組件,實(shí)現(xiàn)了將業(yè)務(wù)決策從應(yīng)用程序代碼中分離出來,并使用預(yù)定義的語義模塊編寫業(yè)務(wù)決策。接受數(shù)據(jù)輸入,解釋業(yè)務(wù)規(guī)則,并根據(jù)業(yè)務(wù)規(guī)則做出業(yè)務(wù)決策。
[0048]在多個(gè)規(guī)則配置好之后,只需要將相關(guān)的數(shù)據(jù)輸入即可完成異常分析并制訂異常處理的流程??梢詮慕?jīng)過清洗后的數(shù)據(jù)中提取相關(guān)的數(shù)據(jù)輸入到異常處理規(guī)則引擎,也可以從監(jiān)控?cái)?shù)據(jù)庫中提取相關(guān)的數(shù)據(jù)輸入異常處理規(guī)則引擎。
[0049]例如,異常處理規(guī)則引擎中的針對報(bào)警的規(guī)則包括:報(bào)警次數(shù)閾值。當(dāng)業(yè)務(wù)異常的次數(shù)超過報(bào)警次數(shù)閾值時(shí),則向發(fā)送報(bào)警信息。例如,報(bào)警次數(shù)閾值為一小時(shí)內(nèi)某一節(jié)點(diǎn)上傳失敗數(shù)量為100,當(dāng)異常處理規(guī)則引擎判斷在一小時(shí)內(nèi)此節(jié)點(diǎn)上傳失敗數(shù)量大于100時(shí),則進(jìn)行報(bào)警。
[0050]異常處理規(guī)則引擎中的針對重傳的規(guī)則包括:第一業(yè)務(wù)狀態(tài)、重傳原因碼、重傳次數(shù)閾值等。當(dāng)業(yè)務(wù)狀態(tài)信息與業(yè)務(wù)狀態(tài)匹配、失敗原因碼與重傳原因碼匹配并且出現(xiàn)此業(yè)務(wù)異常的次數(shù)未超過預(yù)設(shè)的重傳次數(shù)閾值時(shí),則調(diào)用業(yè)務(wù)系統(tǒng)提供的接口進(jìn)行重試處理。[0051 ] 例如,針對重傳的規(guī)則為:第一業(yè)務(wù)狀態(tài)=40,重傳原因碼=1002010056,重傳次數(shù)閾值=3。當(dāng)異常處理規(guī)則引擎判斷接收某一節(jié)點(diǎn)的業(yè)務(wù)狀態(tài)信息為40,即下載失敗;失敗原因碼= 1002010056,從監(jiān)控?cái)?shù)據(jù)庫中統(tǒng)計(jì)此節(jié)點(diǎn)已經(jīng)進(jìn)行的重傳次數(shù)為3,則不進(jìn)行重傳,并執(zhí)行反饋操作。
[0052]反饋是指將監(jiān)控結(jié)果反饋給目標(biāo)對象進(jìn)行處理,目標(biāo)對象可以是工作人員或其它系統(tǒng)。通過策略配置實(shí)現(xiàn)不同業(yè)務(wù)場景下的信息反饋,如由于片源不規(guī)范導(dǎo)致的轉(zhuǎn)碼失敗視頻,反饋給上傳人員。
[0053]異常處理規(guī)則引擎中的針對反饋的規(guī)則包括:業(yè)務(wù)狀態(tài)、反饋原因碼。當(dāng)業(yè)務(wù)狀態(tài)信息與業(yè)務(wù)狀態(tài)匹配、失敗原因碼與反饋原因碼匹配時(shí),則向設(shè)定的反饋接收人或業(yè)務(wù)系統(tǒng)發(fā)送反饋信息,發(fā)送反饋信息的方式包括:郵件、短信等。例如,當(dāng)異常處理規(guī)則引擎判斷某一節(jié)點(diǎn)的業(yè)務(wù)狀態(tài)為40,下載失敗,而失敗原因碼為1043010056,即片源不規(guī)范,則通過郵件將異常信息反饋給相關(guān)的業(yè)務(wù)人員。
[0054]可以通過配置管理界面配置異常處理規(guī)則引擎中的規(guī)則,并在配置管理界面上顯示信息,包括:異常業(yè)務(wù)信息、報(bào)警信息、重試信息、反饋等信息。
[0055]上述實(shí)施例中的業(yè)務(wù)集中監(jiān)控方法,將業(yè)務(wù)系統(tǒng)的業(yè)務(wù)執(zhí)行環(huán)節(jié)與監(jiān)控重試反饋等環(huán)節(jié)進(jìn)行解耦,能夠獨(dú)立地針對不同的業(yè)務(wù)異常情況進(jìn)行監(jiān)控并進(jìn)行異常處理操作,可以保證業(yè)務(wù)執(zhí)行環(huán)節(jié)的成功率,并且不影響正常的業(yè)務(wù)執(zhí)行環(huán)節(jié),可實(shí)現(xiàn)反饋進(jìn)行友好提醒,針對不同數(shù)據(jù)來源進(jìn)行不同的異常處理規(guī)則配置,對突發(fā)異常做到快速反應(yīng),實(shí)現(xiàn)業(yè)務(wù)運(yùn)行的穩(wěn)定性。
[0056]在一個(gè)實(shí)施例中,本發(fā)明提供一種業(yè)務(wù)集中監(jiān)控系統(tǒng)。如圖2所示,數(shù)據(jù)采集模塊21采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù)。數(shù)據(jù)清洗模塊22根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗,生成預(yù)定格式的監(jiān)控?cái)?shù)據(jù)。分析適配模塊23分析監(jiān)控?cái)?shù)據(jù),判斷是否出現(xiàn)業(yè)務(wù)異常,如果是,則根據(jù)預(yù)設(shè)的異常處理策略確定與業(yè)務(wù)異常相匹配的異常處理流程。執(zhí)行操作單元24異常處理流程相對應(yīng)的操作。
[0057]數(shù)據(jù)采集模塊21可以基于設(shè)置的監(jiān)聽IP地址和監(jiān)聽端口建立套接字Socket連接。對于Socket連接啟動(dòng)一個(gè)或多個(gè)監(jiān)聽線程,通過Socket連接接收業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。數(shù)據(jù)采集模塊21可以監(jiān)聽設(shè)置的消息隊(duì)列并從消息隊(duì)列中獲取業(yè)務(wù)相關(guān)數(shù)據(jù);其中,消息隊(duì)列用于存儲(chǔ)業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。數(shù)據(jù)采集模塊21可以從業(yè)務(wù)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中提取業(yè)務(wù)相關(guān)數(shù)據(jù)。
[0058]數(shù)據(jù)清洗模塊22配置數(shù)據(jù)清洗規(guī)則文件,數(shù)據(jù)清洗規(guī)則文件中至少包括一條數(shù)據(jù)清洗規(guī)則,遍歷全部的數(shù)據(jù)清洗規(guī)則依次對業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行篩選處理。數(shù)據(jù)清洗模塊22將通過篩選處理的業(yè)務(wù)相關(guān)數(shù)據(jù)基于預(yù)定格式進(jìn)行格式轉(zhuǎn)換,生成監(jiān)控?cái)?shù)據(jù),將監(jiān)控?cái)?shù)據(jù)存儲(chǔ)在監(jiān)控?cái)?shù)據(jù)庫25中。
[0059]在一個(gè)實(shí)施例中,分析適配模塊23從監(jiān)控?cái)?shù)據(jù)中提取業(yè)務(wù)狀態(tài)信息,基于業(yè)務(wù)狀態(tài)信息判斷是否出現(xiàn)業(yè)務(wù)異常。當(dāng)判斷出現(xiàn)業(yè)務(wù)異常時(shí),分析適配模塊23從監(jiān)控?cái)?shù)據(jù)中提取與此業(yè)務(wù)異常相關(guān)的業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼,基于業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼統(tǒng)計(jì)此業(yè)務(wù)異常發(fā)生的次數(shù)。
[0060]分析適配模塊23將業(yè)務(wù)節(jié)點(diǎn)信息、業(yè)務(wù)狀態(tài)信息、失敗原因碼以及業(yè)務(wù)異常發(fā)生的次數(shù)輸入異常處理規(guī)則引擎進(jìn)行規(guī)則匹配,確定異常處理流程和執(zhí)行的操作,執(zhí)行的操作包括:重試、報(bào)警、反饋等操作。
[0061 ]異常處理規(guī)則引擎中的規(guī)則包括:報(bào)警次數(shù)閾值。當(dāng)分析適配模塊23判斷業(yè)務(wù)異常的次數(shù)超過報(bào)警次數(shù)閾值時(shí),確定執(zhí)行報(bào)警操作。執(zhí)行操作單元24包括:報(bào)警模塊241,報(bào)警模塊241發(fā)送報(bào)警信息。
[0062]異常處理規(guī)則引擎中的規(guī)則包括:第一業(yè)務(wù)狀態(tài)、重傳原因碼、重傳次數(shù)閾值等。當(dāng)分析適配模塊23判斷業(yè)務(wù)狀態(tài)信息與第一業(yè)務(wù)狀態(tài)匹配、失敗原因碼與重傳原因碼匹配并且出現(xiàn)此業(yè)務(wù)異常的次數(shù)未超過預(yù)設(shè)的重傳次數(shù)閾值時(shí),確定執(zhí)行重試操作。執(zhí)行操作單元24包括:重試模塊242,重試模塊242調(diào)用業(yè)務(wù)系統(tǒng)提供的接口進(jìn)行重試處理。
[0063]異常處理規(guī)則引擎中的規(guī)則包括:第二業(yè)務(wù)狀態(tài)、反饋原因碼等;當(dāng)分析適配模塊23判斷業(yè)務(wù)狀態(tài)信息與第二業(yè)務(wù)狀態(tài)匹配、失敗原因碼與反饋原因碼匹配時(shí),確定執(zhí)行反饋操作。執(zhí)行操作單元24包括:反饋模塊243,反饋模塊243向設(shè)定的反饋接收人或業(yè)務(wù)系統(tǒng)發(fā)送反饋信息,發(fā)送反饋信息的方式包括:郵件、短信等。
[0064]配置管理模塊26通過配置管理界面27配置異常處理規(guī)則引擎中的規(guī)則,并在配置管理界面27上顯示信息,包括:異常業(yè)務(wù)信息、報(bào)警信息、重試信息、反饋信息等。
[0065]上述實(shí)施例提供的業(yè)務(wù)集中監(jiān)控方法及系統(tǒng),將業(yè)務(wù)系統(tǒng)的業(yè)務(wù)執(zhí)行環(huán)節(jié)與監(jiān)控重試反饋等環(huán)節(jié)進(jìn)行解耦,能夠獨(dú)立地針對不同的業(yè)務(wù)異常情況進(jìn)行監(jiān)控并進(jìn)行異常處理操作,并可以針對不同數(shù)據(jù)來源進(jìn)行不同的異常處理規(guī)則配置,實(shí)現(xiàn)業(yè)務(wù)運(yùn)行的穩(wěn)定性并保證業(yè)務(wù)執(zhí)行環(huán)節(jié)的成功率。
[0066]所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:以上任何實(shí)施例的討論僅為示例性的,并非旨在暗示本公開的范圍(包括權(quán)利要求)被限于這些例子;在本發(fā)明的思路下,以上實(shí)施例或者不同實(shí)施例中的技術(shù)特征之間也可以進(jìn)行組合,步驟可以以任意順序?qū)崿F(xiàn),并存在如上所述的本發(fā)明的不同方面的許多其它變化,為了簡明它們沒有在細(xì)節(jié)中提供。
[0067]另外,為簡化說明和討論,并且為了不會(huì)使本發(fā)明難以理解,在所提供的附圖中可以示出或可以不示出與集成電路(IC)芯片和其它部件的公知的電源/接地連接。此外,可以以框圖的形式示出裝置,以便避免使本發(fā)明難以理解,并且這也考慮了以下事實(shí),即關(guān)于這些框圖裝置的實(shí)施方式的細(xì)節(jié)是高度取決于將要實(shí)施本發(fā)明的平臺(tái)的(即,這些細(xì)節(jié)應(yīng)當(dāng)完全處于本領(lǐng)域技術(shù)人員的理解范圍內(nèi))。在闡述了具體細(xì)節(jié)(例如,電路)以描述本發(fā)明的示例性實(shí)施例的情況下,對本領(lǐng)域技術(shù)人員來說顯而易見的是,可以在沒有這些具體細(xì)節(jié)的情況下或者這些具體細(xì)節(jié)有變化的情況下實(shí)施本發(fā)明。因此,這些描述應(yīng)被認(rèn)為是說明性的而不是限制性的。
[0068]盡管已經(jīng)結(jié)合了本發(fā)明的具體實(shí)施例對本發(fā)明進(jìn)行了描述,但是根據(jù)前面的描述,這些實(shí)施例的很多替換、修改和變型對本領(lǐng)域普通技術(shù)人員來說將是顯而易見的。例如,其它存儲(chǔ)器架構(gòu)(例如,動(dòng)態(tài)RAM(DRAM))可以使用所討論的實(shí)施例。
[0069]本發(fā)明的實(shí)施例旨在涵蓋落入所附權(quán)利要求的寬泛范圍之內(nèi)的所有這樣的替換、修改和變型。因此,凡在本發(fā)明的精神和原則之內(nèi),所做的任何省略、修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種業(yè)務(wù)集中監(jiān)控方法,其特征在于,包括: 采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù); 根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗,生成預(yù)定格式的監(jiān)控?cái)?shù)據(jù);分析所述監(jiān)控?cái)?shù)據(jù),判斷是否出現(xiàn)業(yè)務(wù)異常,如果是,則根據(jù)預(yù)設(shè)的異常處理策略確定與所述業(yè)務(wù)異常相匹配的異常處理流程并執(zhí)行與所述異常處理流程相對應(yīng)的操作。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù)包括: 基于設(shè)置的監(jiān)聽IP地址和監(jiān)聽端口建立套接字Socket連接; 對于所述Socket連接啟動(dòng)一個(gè)或多個(gè)監(jiān)聽線程,通過所述Socket連接接收所述業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù)包括: 監(jiān)聽設(shè)置的消息隊(duì)列并從所述消息隊(duì)列中獲取所述業(yè)務(wù)相關(guān)數(shù)據(jù); 其中,所述消息隊(duì)列用于存儲(chǔ)所述業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù)包括: 從所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中提取所述業(yè)務(wù)相關(guān)數(shù)據(jù)。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗、生成預(yù)定格式的監(jiān)控?cái)?shù)據(jù)包括: 配置數(shù)據(jù)清洗規(guī)則文件,所述數(shù)據(jù)清洗規(guī)則文件中至少包括一條數(shù)據(jù)清洗規(guī)則; 遍歷全部的數(shù)據(jù)清洗規(guī)則依次對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行篩選處理; 將通過所述篩選處理的所述業(yè)務(wù)相關(guān)數(shù)據(jù)基于預(yù)定格式進(jìn)行格式轉(zhuǎn)換,生成所述監(jiān)控?cái)?shù)據(jù); 將所述監(jiān)控?cái)?shù)據(jù)存儲(chǔ)在監(jiān)控?cái)?shù)據(jù)庫中。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述分析所述監(jiān)控?cái)?shù)據(jù)、判斷是否出現(xiàn)業(yè)務(wù)異常包括:從所述監(jiān)控?cái)?shù)據(jù)中提取業(yè)務(wù)狀態(tài)信息,基于所述業(yè)務(wù)狀態(tài)信息判斷是否出現(xiàn)業(yè)務(wù)異常。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)預(yù)設(shè)的異常處理策略確定與所述業(yè)務(wù)異常相匹配的異常處理流程并執(zhí)行與所述異常處理流程相對應(yīng)的操作包括: 當(dāng)判斷出現(xiàn)業(yè)務(wù)異常時(shí),則從所述監(jiān)控?cái)?shù)據(jù)中提取與此業(yè)務(wù)異常相關(guān)的業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼,基于所述業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼統(tǒng)計(jì)此業(yè)務(wù)異常發(fā)生的次數(shù); 將所述業(yè)務(wù)節(jié)點(diǎn)信息、業(yè)務(wù)狀態(tài)信息、失敗原因碼以及業(yè)務(wù)異常發(fā)生的次數(shù)輸入異常處理規(guī)則引擎進(jìn)行規(guī)則匹配,確定異常處理流程和執(zhí)行的操作,其中,所述執(zhí)行的操作包括:重試、報(bào)警、反饋操作。8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述確定異常處理流程和執(zhí)行的操作包括:所述規(guī)則包括:報(bào)警次數(shù)閾值;當(dāng)業(yè)務(wù)異常的次數(shù)超過所述報(bào)警次數(shù)閾值時(shí),則向發(fā)送報(bào)警信息。9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述確定異常處理流程和異常處理包括: 所述規(guī)則包括:第一業(yè)務(wù)狀態(tài)、重傳原因碼、重傳次數(shù)閾值;當(dāng)所述業(yè)務(wù)狀態(tài)信息與所述第一業(yè)務(wù)狀態(tài)匹配、所述失敗原因碼與所述重傳原因碼匹配并且出現(xiàn)此業(yè)務(wù)異常的次數(shù)未超過預(yù)設(shè)的重傳次數(shù)閾值時(shí),則調(diào)用業(yè)務(wù)系統(tǒng)提供的接口進(jìn)行重試處理。10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述確定異常處理流程和異常處理包括: 所述規(guī)則包括:第二業(yè)務(wù)狀態(tài)、反饋原因碼; 當(dāng)所述業(yè)務(wù)狀態(tài)信息與所述第二業(yè)務(wù)狀態(tài)匹配、所述失敗原因碼與所述反饋原因碼匹配時(shí),則向設(shè)定的反饋接收人或業(yè)務(wù)系統(tǒng)發(fā)送反饋信息,其中,發(fā)送反饋信息的方式包括:郵件、短ig。11.根據(jù)權(quán)利要求10所述的方法,其特征在于,包括: 通過配置管理界面配置異常處理規(guī)則引擎中的規(guī)則,并在所述配置管理界面上顯示信息,包括:異常業(yè)務(wù)信息、報(bào)警信息、重試信息、反饋信息。12.一種業(yè)務(wù)集中監(jiān)控系統(tǒng),其特征在于,包括: 數(shù)據(jù)采集模塊,用于采集業(yè)務(wù)系統(tǒng)的業(yè)務(wù)相關(guān)數(shù)據(jù); 數(shù)據(jù)清洗模塊,用于根據(jù)預(yù)設(shè)的數(shù)據(jù)清洗規(guī)則對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行清洗,生成預(yù)定格式的監(jiān)控?cái)?shù)據(jù); 分析適配模塊,用于分析所述監(jiān)控?cái)?shù)據(jù),判斷是否出現(xiàn)業(yè)務(wù)異常,如果是,則根據(jù)預(yù)設(shè)的異常處理策略確定與所述業(yè)務(wù)異常相匹配的異常處理流程; 執(zhí)行操作單元,用于所述異常處理流程相對應(yīng)的操作。13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于: 所述數(shù)據(jù)采集模塊,用于基于設(shè)置的監(jiān)聽IP地址和監(jiān)聽端口建立套接字Socket連接;對于所述Socket連接啟動(dòng)一個(gè)或多個(gè)監(jiān)聽線程,通過所述Socket連接接收所述業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。14.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于: 所述數(shù)據(jù)采集模塊,用于監(jiān)聽設(shè)置的消息隊(duì)列并從所述消息隊(duì)列中獲取所述業(yè)務(wù)相關(guān)數(shù)據(jù);其中,所述消息隊(duì)列用于存儲(chǔ)所述業(yè)務(wù)系統(tǒng)發(fā)送的業(yè)務(wù)相關(guān)數(shù)據(jù)。15.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于: 所述數(shù)據(jù)采集模塊,用于從所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中提取所述業(yè)務(wù)相關(guān)數(shù)據(jù)。16.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于: 所述數(shù)據(jù)清洗模塊,用于配置數(shù)據(jù)清洗規(guī)則文件,所述數(shù)據(jù)清洗規(guī)則文件中至少包括一條數(shù)據(jù)清洗規(guī)則;遍歷全部的數(shù)據(jù)清洗規(guī)則依次對所述業(yè)務(wù)相關(guān)數(shù)據(jù)進(jìn)行篩選處理;將通過所述篩選處理的所述業(yè)務(wù)相關(guān)數(shù)據(jù)基于預(yù)定格式進(jìn)行格式轉(zhuǎn)換,生成所述監(jiān)控?cái)?shù)據(jù);將所述監(jiān)控?cái)?shù)據(jù)存儲(chǔ)在監(jiān)控?cái)?shù)據(jù)庫中。17.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于: 所述分析適配模塊,用于從所述監(jiān)控?cái)?shù)據(jù)中提取業(yè)務(wù)狀態(tài)信息,基于所述業(yè)務(wù)狀態(tài)信息判斷是否出現(xiàn)業(yè)務(wù)異常。18.根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于: 所述分析適配模塊,還用于當(dāng)判斷出現(xiàn)業(yè)務(wù)異常時(shí),從所述監(jiān)控?cái)?shù)據(jù)中提取與此業(yè)務(wù)異常相關(guān)的業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼,基于所述業(yè)務(wù)節(jié)點(diǎn)信息和失敗原因碼統(tǒng)計(jì)此業(yè)務(wù)異常發(fā)生的次數(shù);將所述業(yè)務(wù)節(jié)點(diǎn)信息、業(yè)務(wù)狀態(tài)信息、失敗原因碼以及業(yè)務(wù)異常發(fā)生的次數(shù)輸入異常處理規(guī)則引擎進(jìn)行規(guī)則匹配,確定異常處理流程和執(zhí)行的操作,其中,所述執(zhí)行的操作包括:重試、報(bào)警、反饋操作。19.根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于: 所述規(guī)則包括:報(bào)警次數(shù)閾值; 當(dāng)所述分析適配模塊判斷業(yè)務(wù)異常的次數(shù)超過所述報(bào)警次數(shù)閾值時(shí),確定執(zhí)行報(bào)警操作; 所述執(zhí)行操作單元包括: 報(bào)警模塊,用于發(fā)送報(bào)警信息。20.根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于: 所述規(guī)則包括:第一業(yè)務(wù)狀態(tài)、重傳原因碼、重傳次數(shù)閾值; 當(dāng)所述分析適配模塊判斷所述業(yè)務(wù)狀態(tài)信息與所述第一業(yè)務(wù)狀態(tài)匹配、所述失敗原因碼與所述重傳原因碼匹配并且出現(xiàn)此業(yè)務(wù)異常的次數(shù)未超過預(yù)設(shè)的重傳次數(shù)閾值時(shí),確定執(zhí)行重試操作; 所述執(zhí)行操作單元包括: 重試模塊,用于調(diào)用業(yè)務(wù)系統(tǒng)提供的接口進(jìn)行重試處理。21.根據(jù)權(quán)利要求20所述的方法,其特征在于: 所述規(guī)則包括:第二業(yè)務(wù)狀態(tài)、反饋原因碼; 當(dāng)所述分析適配模塊判斷所述業(yè)務(wù)狀態(tài)信息與所述業(yè)務(wù)狀態(tài)匹配、所述失敗原因碼與所述反饋原因碼匹配時(shí),確定執(zhí)行反饋操作; 所述執(zhí)行操作單元包括: 反饋模塊,用于向設(shè)定的反饋接收人或業(yè)務(wù)系統(tǒng)發(fā)送反饋信息,其中,發(fā)送反饋信息的方式包括:郵件、短信。22.根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,包括: 配置管理模塊,用于通過配置管理界面配置異常處理規(guī)則引擎中的規(guī)則,并在所述配置管理界面上顯示信息,包括:異常業(yè)務(wù)信息、報(bào)警信息、重試信息、反饋信息。
【文檔編號(hào)】H04L12/26GK105847083SQ201610166670
【公開日】2016年8月10日
【申請日】2016年3月22日
【發(fā)明人】楊佳浩, 鮑大磊, 王孝慶
【申請人】樂視云計(jì)算有限公司