本發(fā)明涉及數據分析,特別涉及一種基于互聯網的大數據分析方法及系統(tǒng)。
背景技術:
1、隨著互聯網和相關服務業(yè)呈現企穩(wěn)向好發(fā)展的態(tài)勢,所產生的基于互聯網的服務任務也越來越多,服務任務的實現目的是為了提供給用戶更好的服務體驗,但是在任務執(zhí)行之后只會對任務產生的結果按照設定標準進行單一對比判斷來確定存在的缺陷,其判斷方式過于粗略導致不能精準的確定缺陷級別,進而不能對任務產生的缺陷進行合理處理,間接降低服務體驗。
2、因此,本發(fā)明提出一種基于互聯網的大數據分析方法及系統(tǒng)。
技術實現思路
1、本發(fā)明提供一種基于互聯網的大數據分析方法及系統(tǒng),用以從結果分析以及邏輯對比分析兩方面來綜合確定每個位置單元的第一標簽以及第二標簽,進而可以精準的確定出缺陷級別,為后續(xù)對缺陷進行合理處理提供基礎,有效保障用戶的服務體驗。
2、本發(fā)明提供一種基于互聯網的大數據分析方法,包括:
3、步驟1:獲取基于互聯網平臺的目標任務的待分析數據,同時,獲取與所述目標任務匹配的分析指標集;
4、步驟2:基于所述分析指標集中的每個分析指標依次對所述待分析數據進行結果分析,得到基于每個分析指標的結果缺陷數據;
5、步驟3:調取所述目標任務的任務執(zhí)行邏輯,并將所述任務執(zhí)行邏輯的實際日志與標準日志進行對比分析,得到邏輯異常數據;
6、步驟4:依據每個分析指標下的結果缺陷數據在待分析數據中的出現位置,向每個位置單元賦予第一標簽,同時,將所述出現位置與邏輯異常數據的出現時刻進行映射關聯,并向每個位置單元賦予第二標簽;
7、步驟5:依據所有第一標簽以及第二標簽,對所述待分析數據進行缺陷級別判定。
8、優(yōu)選的,獲取與所述目標任務匹配的分析指標集,包括:
9、從所述互聯網平臺獲取所述目標任務的唯一任務標識;
10、從標識-分析對照表中獲取與所述唯一任務標識匹配的分析指標集。
11、優(yōu)選的,基于所述分析指標集中的每個分析指標依次對所述待分析數據進行結果分析,包括:
12、獲取每個分析指標的指標參數集,并依據所述指標參數集與所述待分析數據進行映射提取,得到對應分析指標下每個指標參數的實際分析數據;
13、計算基于每個實際分析數據的基本缺陷比值;
14、;其中,表示對應第i個指標參數的實際分析數據的提取值;表示對應第i個指標參數的參考值;分別表示對應第i個指標參數的左側調節(jié)值、右側調節(jié)值;min表示最小值符號;ln表示對數函數符號;
15、按照基本缺陷比值構建基于對應分析指標的比值序列,并與對應分析指標的標準序列進行對比鎖定異常參數;
16、獲取與所述異常參數一致的實際分析數據,作為結果缺陷數據。
17、優(yōu)選的,調取所述目標任務的任務執(zhí)行邏輯,包括:
18、基于所述目標任務的唯一任務標識,從標識-邏輯對照表中獲取匹配的任務執(zhí)行邏輯。
19、優(yōu)選的,將所述任務執(zhí)行邏輯的實際日志與標準日志進行對比分析,包括:
20、將實際日志輸入到向量構建模型中得到實際指標向量以及實際時間向量,其中,所述實際指標向量中每個元素代表一個執(zhí)行分析指標下涉及到的邏輯執(zhí)行結果,所述實際時間向量中每個元素代表一個邏輯節(jié)點的邏輯執(zhí)行時長;
21、基于所述標準日志從邏輯日志數據庫中調取與所述任務執(zhí)行邏輯一致的指標閾值向量以及時間閾值向量;
22、將所述指標閾值向量與實際指標向量進行對比得到指標差異向量;
23、確定所述任務執(zhí)行邏輯中每個邏輯節(jié)點的邏輯屬性,并從屬性-文件數據庫中得到對應邏輯節(jié)點的代碼文件;
24、根據所述代碼文件的文件轉換時間標準得到標準時間偏量;
25、調取基于所述代碼文件在不同歷史任務下的歷史轉換時間得到誤差偏量;
26、;其中,表示基于對應代碼文件的誤差偏量;表示對應代碼文件在第j3個歷史任務下的歷史轉換時間;表示對應代碼文件的文件轉換時間標準;表示所有中處于正態(tài)分布概率0.8下的數量;表示歷史任務的總數量;表示基于所有的方差;
27、基于所述標準時間偏量以及誤差偏量對時間閾值向量進行雙向調整,得到第一閾值向量以及第二閾值向量,并分別與實際時間向量進行對比分得到時間差異向量,其中,表示第一閾值向量中第i2個元素的第一閾值;表示第二閾值向量中第i2個元素的第二閾值;m1表示基于時間的閾值向量中的元素總個數;表示實際時間向量中第i2個元素的邏輯執(zhí)行時長;表示時間差異向量中第i2個元素的差異時長;
28、其中,表示對應第i2個元素下的誤差偏量;表示對應第i2個元素下的標準時間偏量;分別表示占比系數,且;
29、按照指標排列原則將所述時間差異向量與指標差異向量進行差異映射得到同個排列位置的當下差異值,并確定異常指標來取得到與異常指標匹配的日志數據作為邏輯異常數據。
30、優(yōu)選的,向每個出現位置賦予第一標簽,包括:
31、根據每個分析指標下的結果缺陷數據在待分析數據中的出現位置,統(tǒng)計每個位置單元下涉及到的分析指標,并構建對應位置單元的單元陣列,其中,表示第j1個位置單元涉及到的結果缺陷數據;表示第j1個位置單元下的涉及指標的數量;表示第j1個位置單元的單元排列序號;
32、將單元陣列依次與陣列-標簽對照表進行匹配,得到對應位置單元的第一標簽。
33、優(yōu)選的,向每個位置單元賦予第二標簽,包括:
34、根據所述目標任務與任務執(zhí)行邏輯的標準映射關系,確定每個位置單元的理論子執(zhí)行邏輯以及所述理論子執(zhí)行邏輯的理論執(zhí)行時刻;
35、從所述邏輯異常數據中提取所述理論子執(zhí)行邏輯的子異常數據以及所述子異常數據的出現時刻;
36、將所述理論執(zhí)行時刻與出現時刻進行時刻關聯,向對應位置單元賦予第二標簽。
37、優(yōu)選的,依據所有第一標簽以及第二標簽,對所述待分析數據進行缺陷級別判定,包括:
38、將每個位置單元的第一標簽以及第二標簽依次輸入到標簽分析模型中獲取得到對應位置單元的第一系數;
39、依據每個位置單元的第一系數以及每個位置單元的連續(xù)評判系數,得到對應位置單元的第二系數;
40、基于所有第二系數以及位置單元的單元權重,得到待分析數據的缺陷系數,并與系數-級別對照表進行匹配得到缺陷級別。
41、本發(fā)明提供一種基于互聯網的大數據分析系統(tǒng),包括:
42、指標集獲取模塊,用于獲取基于互聯網平臺的目標任務的待分析數據,同時,獲取與所述目標任務匹配的分析指標集;
43、結果分析模塊,用于基于所述分析指標集中的每個分析指標依次對所述待分析數據進行結果分析,得到基于每個分析指標的結果缺陷數據;
44、邏輯異常獲取模塊,用于調取所述目標任務的任務執(zhí)行邏輯,并將所述任務執(zhí)行邏輯的實際日志與標準日志進行對比分析,得到邏輯異常數據;
45、標簽賦予模塊,用于依據每個分析指標下的結果缺陷數據在待分析數據中的出現位置,向每個位置單元賦予第一標簽,同時,將所述出現位置與邏輯異常數據的出現時刻進行映射關聯,并向每個位置單元賦予第二標簽;
46、級別判定模塊,用于依據所有第一標簽以及第二標簽,對所述待分析數據進行缺陷級別判定。
47、與現有技術相比,本技術的有益效果如下:
48、從結果分析以及邏輯對比分析兩方面來綜合確定每個位置單元的第一標簽以及第二標簽,進而可以精準的確定出缺陷級別,為后續(xù)對缺陷進行合理處理提供基礎,有效保障用戶的服務體驗。
49、本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書以及附圖中所特別指出的結構來實現和獲得。
50、下面通過附圖和實施例,對本發(fā)明的技術方案做進一步的詳細描述。