本發(fā)明涉及區(qū)塊鏈,具體地,涉及針對區(qū)塊鏈特定團(tuán)伙行為的資金智能分析系統(tǒng)。
背景技術(shù):
1、區(qū)塊鏈技術(shù)以其去中心化、不可篡改和透明化的特性在多個行業(yè)中得到應(yīng)用,尤其在金融交易領(lǐng)域表現(xiàn)出巨大潛力。然而,這些特性也使得區(qū)塊鏈成為非法活動的一個熱門工具,比如它可以為賭博資金和詐騙活動提供一種難以追蹤和監(jiān)管的流動途徑。
2、
3、現(xiàn)有的分析和監(jiān)控區(qū)塊鏈賭博資金和詐騙資金的技術(shù),通常為以下幾類:
4、1.交易監(jiān)控和分析技術(shù):主要側(cè)重于監(jiān)控和分析區(qū)塊鏈上的交易,識別與賭博和詐騙相關(guān)的交易行為。通過分析交易數(shù)據(jù)的金額、頻率、時間等信息,識別與其相關(guān)的異常交易模式,從而解釋潛在的非法活動。例如,chainalysis是一種廣泛使用的區(qū)塊鏈分析工具。但由于區(qū)塊鏈每秒都有大量的交易產(chǎn)生,若對每一筆交易都進(jìn)行分析顯然是不現(xiàn)實的,因此,該技術(shù)通常是針對特定條件下的交易,例如特定地址、特定時間等。且在交易者使用復(fù)雜方法來掩蓋其活動的情況下,該方法無法完全區(qū)分合法和非法交易。
5、2.圖分析技術(shù):通過構(gòu)建交易關(guān)系圖,分析資金在不同賬戶之間的流動路徑。圖分析可以幫助研究者理解資金流動的網(wǎng)絡(luò)結(jié)構(gòu),識別中心節(jié)點和關(guān)鍵交易鏈路,這對于揭示復(fù)雜的賭博和詐騙活動尤為有效。但圖分析在處理極大規(guī)模的數(shù)據(jù)時,計算和存儲需求可能非常高。且如果網(wǎng)絡(luò)中的節(jié)點或連接異常復(fù)雜,傳統(tǒng)的圖分析方法可能變得緩慢甚至失準(zhǔn)。
6、3.行為分析與機(jī)器學(xué)習(xí)技術(shù):應(yīng)用機(jī)器學(xué)習(xí)算法對賭博和詐騙行為進(jìn)行建模和預(yù)測,通過分析用戶行為和交易模式,自動識別可能的非法活動。例如,featurespace的aric平臺利用自適應(yīng)行為分析技術(shù),能夠從復(fù)雜的數(shù)據(jù)中學(xué)習(xí)并識別出異常行為模式,這對于預(yù)測和防止在線賭博相關(guān)的行為非常有用。但該模型需要大量的歷史數(shù)據(jù)進(jìn)行訓(xùn)練,對于新興的異常團(tuán)伙行為模式,如果數(shù)據(jù)不足,模型的預(yù)測準(zhǔn)確性可能會受到影響。且該模型需要定期更新以適應(yīng)新的賭博行為,增加維護(hù)成本。
7、為了有效應(yīng)對這一嚴(yán)峻現(xiàn)狀,亟需開發(fā)新的技術(shù)手段進(jìn)行監(jiān)控和管理。
技術(shù)實現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)無法準(zhǔn)確識別和預(yù)測基于區(qū)塊鏈的特定團(tuán)伙行為資金流動和無法適應(yīng)區(qū)塊鏈特性和不斷變化的監(jiān)管需求的問題,本發(fā)明提供了針對區(qū)塊鏈特定團(tuán)伙行為的資金智能分析系統(tǒng),所述系統(tǒng)包括:
2、數(shù)據(jù)收集單元:用于搭建區(qū)塊鏈全節(jié)點和數(shù)據(jù)庫,收集所述區(qū)塊鏈全節(jié)點上的鏈上數(shù)據(jù)和鏈下數(shù)據(jù),對所述鏈上數(shù)據(jù)和所述鏈下數(shù)據(jù)進(jìn)行分類和標(biāo)簽化,獲得若干數(shù)據(jù)點,為每個所述數(shù)據(jù)點創(chuàng)建元數(shù)據(jù);
3、數(shù)據(jù)融合單元:用于將所有所述數(shù)據(jù)點進(jìn)行融合獲得第一數(shù)據(jù);
4、標(biāo)簽單元:用于搭建標(biāo)簽系統(tǒng),基于所述標(biāo)簽系統(tǒng)和所述元數(shù)據(jù),將所述第一數(shù)據(jù)進(jìn)行分類和標(biāo)記,獲得第二數(shù)據(jù),將所述第二數(shù)據(jù)存儲至所述數(shù)據(jù)庫;
5、地址異常分析單元:用于基于所述第二數(shù)據(jù)獲得特定團(tuán)伙行為地址的第一交易數(shù)據(jù),基于所述第一交易數(shù)據(jù)獲得所述特定團(tuán)伙行為地址的第一地址特征,基于所述第一地址特征獲得異常行為模型,基于所述異常行為模型對待識別地址進(jìn)行監(jiān)控分析,判斷是否存在特定團(tuán)伙行為;
6、圖分析單元:用于構(gòu)建資金流動圖,提取所述資金流動圖的圖特征,基于所述圖特征獲得第一關(guān)鍵節(jié)點和第一關(guān)鍵路徑;
7、綜合分析單元:用于基于所述圖特征獲得節(jié)點特征向量;基于所述節(jié)點特征向量獲得圖神經(jīng)網(wǎng)絡(luò)模型,基于所述圖神經(jīng)網(wǎng)絡(luò)模型預(yù)警潛在風(fēng)險行為;
8、結(jié)果單元:用于基于所述地址異常分析單元、所述圖分析單元和所述綜合分析單元獲得分析結(jié)果。
9、特定團(tuán)伙行為是指兩人及兩人以上共同實施的非法活動。
10、本發(fā)明集成鏈上數(shù)據(jù)和鏈下數(shù)據(jù),建立全面的數(shù)據(jù)支持平臺,確保數(shù)據(jù)的一致性和準(zhǔn)確性,以增強(qiáng)整體分析的深度和廣度,關(guān)注鏈下數(shù)據(jù)的重要性,進(jìn)一步增強(qiáng)該系統(tǒng)的數(shù)據(jù)支撐能力,提高系統(tǒng)監(jiān)控的全面性和準(zhǔn)確性,創(chuàng)建元數(shù)據(jù),輔助后續(xù)的數(shù)據(jù)追蹤和質(zhì)量控制;構(gòu)建高效、安全的數(shù)據(jù)庫,確保數(shù)據(jù)的快速訪問和長期保存;標(biāo)簽系統(tǒng)提供標(biāo)簽數(shù)據(jù)支持,幫助決策者理解復(fù)雜的特定團(tuán)伙行為資金流動模式,從而進(jìn)行有效的風(fēng)險評估和決策制定;訓(xùn)練能夠深入分析和學(xué)習(xí)用戶行為模式的異常行為模型,對未知新地址進(jìn)行監(jiān)控分析,提高識別的準(zhǔn)確性和降低誤判率;構(gòu)建資金流動圖,可以幫助理解資金流動的網(wǎng)絡(luò)結(jié)構(gòu),利用其識別重要節(jié)點和關(guān)鍵路徑,可以有效揭示復(fù)雜的特定團(tuán)伙行為活動;利用深度學(xué)習(xí)模型中的圖神經(jīng)網(wǎng)絡(luò)進(jìn)行綜合分析訓(xùn)練獲得圖神經(jīng)網(wǎng)絡(luò)模型,其可以提前預(yù)警潛在風(fēng)險行為,通過新交易數(shù)據(jù),不斷更新圖結(jié)構(gòu)數(shù)據(jù),可以適應(yīng)新興的異常團(tuán)伙行為模式和策略,適應(yīng)區(qū)塊鏈特性和不斷變化的監(jiān)管需求;結(jié)合地址異常分析單元、圖分析單元和綜合分析單元的結(jié)果進(jìn)一步綜合化分析獲得分析結(jié)果,實現(xiàn)有效的多技術(shù)融合機(jī)制,實現(xiàn)從細(xì)節(jié)到整體的全面覆蓋,更準(zhǔn)確識別和預(yù)測基于區(qū)塊鏈的特定團(tuán)伙行為資金流動,分析結(jié)果更全面和準(zhǔn)確。
11、進(jìn)一步地,所述數(shù)據(jù)點包括鏈上數(shù)據(jù)點和鏈下數(shù)據(jù)點;所述數(shù)據(jù)融合單元具體包括:
12、第一融合單元:用于將所有所述鏈下數(shù)據(jù)點中的圖像和預(yù)設(shè)文檔轉(zhuǎn)化為文本數(shù)據(jù),獲得鏈下文本數(shù)據(jù),提取所述鏈下文本數(shù)據(jù)的關(guān)鍵實體和關(guān)鍵語義;
13、第二融合單元:用于將所有所述數(shù)據(jù)點進(jìn)行統(tǒng)一化處理,獲得若干第一數(shù)據(jù)點;
14、第三融合單元:用于基于預(yù)設(shè)匹配規(guī)則、所述元數(shù)據(jù)、所述關(guān)鍵實體和所述關(guān)鍵語義,將所有所述第一數(shù)據(jù)點進(jìn)行融合,獲得初步融合數(shù)據(jù);
15、第四融合單元:用于對所述初步融合數(shù)據(jù)進(jìn)行審核和驗證,獲得所述第一數(shù)據(jù)。
16、進(jìn)一步地,所述地址異常分析單元還包括:
17、追蹤單元:用于獲取所述待識別地址的第二交易數(shù)據(jù),基于所述第二交易數(shù)據(jù)獲得第二地址特征,基于所述第二地址特征判斷所述待識別地址是否為疑似特定團(tuán)伙行為地址,若是則基于預(yù)設(shè)判斷規(guī)則獲得所述待識別地址的地址類型;基于所述地址類型和預(yù)設(shè)地址類型搜索策略,對所述待識別地址的資金流向路徑進(jìn)行分析,獲得第二關(guān)鍵路徑;
18、聚類單元:用于基于所述第二關(guān)鍵路徑獲得追蹤地址,基于所述追蹤地址獲得若干初始簇;獲取所述追蹤地址的第三交易數(shù)據(jù),對所述第三數(shù)據(jù)進(jìn)行特征提取獲得交易行為特征,構(gòu)建所述交易行為特征的地址向量特征;基于所述地址向量特征計算每個所述初始簇的特征向量平均值和相鄰兩個所述初始簇之間的余弦距離;基于預(yù)設(shè)最小平均值和預(yù)設(shè)最小距離,對所有所述初始簇進(jìn)行合并,獲得若干合并簇;基于所有所述余弦距離獲得平均距離,基于所述平均距離繪制曲線圖,基于所述曲線圖獲得平緩度,獲取所述合并簇的數(shù)量;判斷所述平緩度是否大于預(yù)設(shè)平緩值,或所述數(shù)量是否大于預(yù)設(shè)數(shù)量,若是則將所有所述初始簇更新為所有所述合并簇,若否則基于所有所述合并簇獲得若干地址簇,對所述地址簇進(jìn)行可視化整合,獲得樹狀圖,所述樹狀圖用于分析資金流向路徑的關(guān)鍵節(jié)點;
19、語言模型分析單元:用于將所述第二交易數(shù)據(jù)進(jìn)行轉(zhuǎn)化,獲得交易文本數(shù)據(jù),將所述交易文本數(shù)據(jù)輸入至預(yù)訓(xùn)練語言模型,獲得所述待識別地址的異常概率和異常類型;
20、交易分析單元:用于基于所述追蹤單元、所述聚類單元和所述語言模型分析單元對區(qū)塊鏈全節(jié)點交易的資金流動進(jìn)行分析,獲得第一分析結(jié)果。
21、進(jìn)一步地,所述圖分析單元具體包括:
22、構(gòu)建單元:用于預(yù)設(shè)構(gòu)建規(guī)則,基于所述第二數(shù)據(jù)獲得第一地址,將所述第一地址作為初始節(jié)點,構(gòu)建初始圖;
23、擴(kuò)展單元:用于設(shè)定最長路徑長度,基于所述最長路徑長度和預(yù)設(shè)交易規(guī)則對所述初始圖進(jìn)行擴(kuò)展,獲得擴(kuò)展圖;
24、搜索單元:用于基于預(yù)設(shè)異常團(tuán)伙行為模式獲得第一交易特征,基于所述第一交易特征和預(yù)設(shè)搜索規(guī)則,對所述擴(kuò)展圖進(jìn)行搜索,獲得模式節(jié)點,標(biāo)記所述模式節(jié)點,基于預(yù)設(shè)身份類別將所述模式節(jié)點進(jìn)行分類,獲得所述資金流動圖;
25、特征單元:用于獲取所述資金流動圖的若干圖節(jié)點,計算每個所述圖節(jié)點的節(jié)點信息,基于所述節(jié)點信息獲得所述圖特征,基于所述圖特征獲得所述第一關(guān)鍵節(jié)點和所述第一關(guān)鍵路徑;所述節(jié)點信息包括節(jié)點度中心性、介數(shù)中心性、聚類系數(shù)和pagerank值。
26、基于與異常團(tuán)伙行為模式相關(guān)的預(yù)設(shè)構(gòu)建規(guī)則構(gòu)建初始圖,可以確保構(gòu)建的圖能夠準(zhǔn)確反映異常團(tuán)伙行為資金流動。
27、進(jìn)一步地,所述綜合分析單元具體包括:
28、數(shù)據(jù)單元:用于將所述資金流動圖中的所述模式節(jié)點作為正樣本,所述資金流動圖中未標(biāo)記的節(jié)點作為負(fù)樣本;獲取每個所述圖節(jié)點的第二交易特征,基于所述第二交易特征獲得交易特征向量;基于所述圖特征獲得圖結(jié)構(gòu)特征,基于所述圖結(jié)構(gòu)特征獲得圖結(jié)構(gòu)特征向量;將所述交易特征向量和所述圖結(jié)構(gòu)特征向量進(jìn)行拼接和歸一化處理,獲得所述節(jié)點特征向量;獲取所述資金流動圖的連接邊,將所述節(jié)點特征向量和所述連接邊進(jìn)行結(jié)合,獲得圖結(jié)構(gòu)數(shù)據(jù);
29、模型單元:用于基于所述正樣本、所述負(fù)樣本和所述圖結(jié)構(gòu)數(shù)據(jù)對模型進(jìn)行訓(xùn)練獲得所述圖神經(jīng)網(wǎng)絡(luò)模型;
30、預(yù)警單元:用于獲取新交易數(shù)據(jù),基于所述新交易數(shù)據(jù)獲得更新節(jié)點,獲取所述更新節(jié)點的第一更新節(jié)點特征;將所述新交易數(shù)據(jù)和所述第一更新節(jié)點特征輸入所述圖神經(jīng)網(wǎng)絡(luò)模型,基于所述新交易數(shù)據(jù)更新所述圖結(jié)構(gòu)數(shù)據(jù),將所述第一更新節(jié)點特征進(jìn)行歸一化處理,獲得第二更新節(jié)點特征;所述圖神經(jīng)網(wǎng)絡(luò)模型基于所述第二更新節(jié)點特征對所述更新節(jié)點進(jìn)行分類和預(yù)警。
31、進(jìn)一步地,所述系統(tǒng)還包括:
32、第一分類單元:用于基于預(yù)訓(xùn)練第一分類模型計算所述第二交易數(shù)據(jù)的熵,基于預(yù)設(shè)閾值范圍將所述第二地址特征進(jìn)行劃分,獲得不同分類的地址特征集合;計算每個所述地址特征集合的條件熵;基于所述熵和所述條件熵獲得所述第二地址特征的信息增益值和分裂值,基于所述信息增益值和所述分裂值獲得所述第二地址特征的信息增益比;基于最高所述信息增益比獲得分割點;基于所述分割點將所述第二交易數(shù)據(jù)進(jìn)行分割,獲得若干子集;基于分類標(biāo)簽對所有所述子集進(jìn)行計算,獲得類別概率,基于所述類別概率獲得所述待識別地址的第一特定團(tuán)伙行為概率;
33、第二分類單元:用于基于預(yù)訓(xùn)練第二分類模型對所述待識別地址進(jìn)行擴(kuò)充,獲得網(wǎng)絡(luò)表示圖,基于所述網(wǎng)絡(luò)表示圖獲得所述待識別地址的第一表征,更新所述第一表征獲得第二表征,基于所述第二表征獲得所述待識別地址的第二特定團(tuán)伙行為概率;
34、概率單元:用于將所述第一特定團(tuán)伙行為概率和第二特定團(tuán)伙行為概率進(jìn)行融合,獲得總特定團(tuán)伙行為概率,基于所述總特定團(tuán)伙行為概率判斷所述待識別地址是否為特定團(tuán)伙行為地址。
35、進(jìn)一步地,獲得所述特征向量平均值的第一計算公式為:
36、
37、獲得所述余弦距離的第二計算公式為:
38、
39、其中,ci表示第i個初始簇的特征向量平均值,n表示初始簇的數(shù)量,xi表示第i個初始簇的地址向量特征,i表示第i個初始簇,d(ci,cj)表示第i個初始簇和第j個初始簇之間的余弦距離,表示第i個初始簇的平均地址向量特征,表示第j個初始簇的平均地址向量特征。
40、進(jìn)一步地,獲得所述節(jié)點度中心性的第三計算方式為:
41、cd(v)=din(v)+dout(v);
42、其中,v表示圖節(jié)點,cd(v)表示圖節(jié)點v的節(jié)點度中心性,din(v)表示圖節(jié)點v的入邊數(shù),dout(v)表示圖節(jié)點v的出邊數(shù);
43、獲得所述介數(shù)中心性的第四計算方式為:
44、
45、其中,cb(v)表示圖節(jié)點v的介數(shù)中心性,s表示下注節(jié)點,t表示賠付節(jié)點,σst表示從下注節(jié)點到賠付節(jié)點的最短路徑的總數(shù)目,σst(v)表示從下注節(jié)點到賠付節(jié)點的最短路徑中經(jīng)過圖節(jié)點v的最短路徑的數(shù)目;
46、獲得所述聚類系數(shù)的第五計算方式為:
47、
48、其中,c(v)表示圖節(jié)點v的聚類系數(shù),d(v)表示與圖節(jié)點v直接相連的邊的數(shù)量,t(v)表示包含圖節(jié)點v的三角形的數(shù)目;
49、獲得所述pagerank值的第六計算方式為:
50、
51、其中,pr(v)表示圖節(jié)點v的pagerank值,d表示阻尼因子,n表示圖節(jié)點的總數(shù)目,n(v)表示圖節(jié)點v的鄰居節(jié)點集合,u表示鄰居節(jié)點集合中的節(jié)點,pr(u)表示節(jié)點u的pagerank值,d(u)表示與節(jié)點u直接相連的邊的數(shù)量。
52、進(jìn)一步地,獲得所述熵的第七計算公式為:
53、entropy(d)=-p0log2(p0)-p1log2(p1);
54、獲得所述信息增益值的第八計算公式為:
55、
56、獲得所述分裂值的第九計算公式為:
57、
58、獲得所述信息增益比的第十計算公式為:
59、
60、獲得所述類別概率的第十一計算公式為:
61、
62、當(dāng)所述分類標(biāo)簽為特定團(tuán)伙行為標(biāo)簽時,獲得所述第一特定團(tuán)伙行為概率的第十二計算公式為:
63、pcart=ρ(c);
64、當(dāng)所述分類標(biāo)簽為正常行為標(biāo)簽時,獲得所述第一特定團(tuán)伙行為概率的第十三計算公式為:
65、pcart=1-ρ(c);
66、其中,entropy(d)表示熵,d表示第二交易數(shù)據(jù),p0表示正常交易的比例,p1表示特定團(tuán)伙行為交易的比例,gain(d,f1)表示第二地址特征的信息增益值,f1表示第二地址特征,entropy(dhigh)、entropy(dmedium)和entropy(dlow)表示不同地址特征集合的條件熵,dhigh、dmedium和dlow表示不同分類的地址特征集合,splitinfo(d,f1)表示第二地址特征的分裂值,gain?ratio(d,f1)表示第二地址特征的信息增益比,ρ(c)表示類別概率,c表示分類標(biāo)簽,n1表示不同分類的地址特征集合的數(shù)據(jù)點數(shù)量,n2表示第二交易數(shù)據(jù)的數(shù)據(jù)點數(shù)量,pcart表示第一特定團(tuán)伙行為概率。
67、進(jìn)一步地,獲得所述第一表征的第十四計算公式為:
68、
69、獲得所述第二表征的第十五計算公式為:
70、
71、獲得所述第二特定團(tuán)伙行為概率的第十六計算公式為:
72、
73、獲得所述總特定團(tuán)伙行為概率的第十七計算公式為:
74、
75、其中,a表示網(wǎng)絡(luò)表示圖中的節(jié)點,n(a)表示節(jié)點a的采樣鄰居節(jié)點集合,表示預(yù)訓(xùn)練第二分類模型t層的采樣鄰居節(jié)點集合的第一表征,mean()表示聚合函數(shù),表示預(yù)訓(xùn)練第二分類模型t-1層的節(jié)點b的表征,b表示采樣鄰居節(jié)點集合中的節(jié)點,表示預(yù)訓(xùn)練第二分類模型t層的節(jié)點a的第二表征,σ表示激活函數(shù),wt表示預(yù)訓(xùn)練第二分類模型t層的權(quán)重矩陣,concat()表示拼接,表示預(yù)訓(xùn)練第二分類模型t-1層的節(jié)點a的第二表征,pgraphsage表示第二特定團(tuán)伙行為概率,softmax()表示softmax激活函數(shù),w和b均表示學(xué)習(xí)參數(shù),表示預(yù)訓(xùn)練第二分類模型最后一層的節(jié)點a的第二表征,pfinal表示總特定團(tuán)伙行為概率,表示第一特定團(tuán)伙行為概率的權(quán)重,pcart表示第一特定團(tuán)伙行為概率。
76、本發(fā)明提供的一個或多個技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點:
77、1.集成鏈上數(shù)據(jù)和鏈下數(shù)據(jù),建立全面的數(shù)據(jù)支持平臺,確保數(shù)據(jù)的一致性和準(zhǔn)確性,以增強(qiáng)整體分析的深度和廣度,關(guān)注鏈下數(shù)據(jù)的重要性,進(jìn)一步增強(qiáng)該系統(tǒng)的數(shù)據(jù)支撐能力,提高系統(tǒng)監(jiān)控的全面性和準(zhǔn)確性,創(chuàng)建元數(shù)據(jù),輔助后續(xù)的數(shù)據(jù)追蹤和質(zhì)量控制;構(gòu)建高效、安全的數(shù)據(jù)庫,確保數(shù)據(jù)的快速訪問和長期保存。
78、2.標(biāo)簽系統(tǒng)提供標(biāo)簽數(shù)據(jù)支持,幫助決策者理解復(fù)雜的賭博資金流動模式,從而進(jìn)行有效的風(fēng)險評估和決策制定。
79、3.訓(xùn)練能夠深入分析和學(xué)習(xí)用戶行為模式的異常行為模型,對未知新地址進(jìn)行監(jiān)控分析,提高識別的準(zhǔn)確性和降低誤判率。
80、4.構(gòu)建資金流動圖,可以幫助理解資金流動的網(wǎng)絡(luò)結(jié)構(gòu),利用其識別重要節(jié)點和關(guān)鍵路徑,可以有效揭示復(fù)雜的特定團(tuán)伙行為活動。
81、5.利用深度學(xué)習(xí)模型中的圖神經(jīng)網(wǎng)絡(luò)進(jìn)行綜合分析訓(xùn)練獲得圖神經(jīng)網(wǎng)絡(luò)模型,其可以提前預(yù)警潛在風(fēng)險行為,通過新交易數(shù)據(jù),不斷更新圖結(jié)構(gòu)數(shù)據(jù),可以適應(yīng)新興的異常團(tuán)伙行為模式和策略,適應(yīng)區(qū)塊鏈特性和不斷變化的監(jiān)管需求。
82、6.結(jié)合地址異常分析單元、圖分析單元和綜合分析單元的結(jié)果進(jìn)一步綜合化分析獲得分析結(jié)果,實現(xiàn)有效的多技術(shù)融合機(jī)制,實現(xiàn)從細(xì)節(jié)到整體的全面覆蓋,更準(zhǔn)確識別和預(yù)測基于區(qū)塊鏈的特定團(tuán)伙行為資金流動,分析結(jié)果更全面和準(zhǔn)確。
83、7.基于地址類型和預(yù)設(shè)地址類型搜索策略,對待識別地址的資金流向路徑進(jìn)行分析,獲得第二關(guān)鍵路徑,能夠識別復(fù)雜資金流動路徑,從而覆蓋特定團(tuán)伙行為資金網(wǎng)絡(luò);基于第二關(guān)鍵路徑獲得追蹤地址,基于追蹤地址獲得地址簇,對地址簇進(jìn)行可視化整合,獲得樹狀圖,利用樹狀圖,將存在交易的各地址進(jìn)行關(guān)聯(lián),將相似的地址聚為一簇,從而對地址簇進(jìn)行可視化整合,可以識別樹狀圖中資金匯集節(jié)點和分散節(jié)點,通過分析同一簇中的資金匯集點和分散點,有助于分析關(guān)鍵節(jié)點,從而實現(xiàn)資金流動,揭示隱藏的資金流動;將第二交易數(shù)據(jù)進(jìn)行轉(zhuǎn)化,獲得交易文本數(shù)據(jù),將交易文本數(shù)據(jù)輸入至預(yù)訓(xùn)練語言模型,獲得待識別地址的異常概率和異常類型,用語言模型對與地址關(guān)聯(lián)的若干筆交易進(jìn)行分析,從而得到該地址與其他地址的交易模式和交易行為特征,并判斷是否屬于異常交易行為,實現(xiàn)對異常交易的識別。
84、8.基于最高信息增益比獲得分割點;基于分割點將第二交易數(shù)據(jù)進(jìn)行分割,獲得若干子集;基于分類標(biāo)簽對所有子集進(jìn)行計算,獲得類別概率,基于類別概率獲得待識別地址的第一特定團(tuán)伙行為概率,選擇信息增益比最高的交易行為特征作為當(dāng)前分割點,可以確保選擇的特征在區(qū)分正常和詐騙交易方面提供最大的信息;基于網(wǎng)絡(luò)表示圖獲得待識別地址的第一表征,更新第一表征獲得第二表征,基于第二表征獲得待識別地址的第二特定團(tuán)伙行為概率,構(gòu)建網(wǎng)絡(luò)表示圖,有效地整合節(jié)點的局部鄰居信息,不僅提高了分類的準(zhǔn)確性,而且適應(yīng)了大規(guī)模圖數(shù)據(jù)的處理需求,可以有效處理區(qū)塊鏈的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù);將第一特定團(tuán)伙行為概率和第二特定團(tuán)伙行為概率進(jìn)行融合,獲得總特定團(tuán)伙行為概率,基于總特定團(tuán)伙行為概率判斷待識別地址是否為特定團(tuán)伙行為地址,同時兼顧待識別地址、與地址關(guān)聯(lián)的多維交易行為特征和與地址關(guān)聯(lián)的多地址交易,從而能夠?qū)梢傻刂愤M(jìn)行全面分析,提升識別準(zhǔn)確率。