基于社交網(wǎng)絡(luò)分析的犯罪嫌疑人挖掘關(guān)聯(lián)方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種基于社交網(wǎng)絡(luò)分析的犯罪嫌疑人挖掘關(guān)聯(lián)方法及系統(tǒng),其特征在于包括:對(duì)用戶輸入數(shù)據(jù)進(jìn)行預(yù)處理,從輸入數(shù)據(jù)提取關(guān)鍵信息;構(gòu)建社交網(wǎng)絡(luò)圖模型;設(shè)置參數(shù);運(yùn)行社團(tuán)發(fā)現(xiàn)算法;輸出發(fā)現(xiàn)的結(jié)果,列出犯罪嫌疑人員,本發(fā)明與現(xiàn)有技術(shù)相比,具有以下有益效果:能夠從給定的犯罪嫌疑人社交圈內(nèi)發(fā)現(xiàn)潛在的關(guān)聯(lián)犯罪嫌疑人,方法性能好,系統(tǒng)運(yùn)行快,同時(shí)考慮了真實(shí)場(chǎng)景的需求,在用戶指定的范圍進(jìn)行分析,具有良好的擴(kuò)展性。
【專利說明】基于社交網(wǎng)絡(luò)分析的犯罪嫌疑人挖掘關(guān)聯(lián)方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及公安犯罪網(wǎng)絡(luò)分析【技術(shù)領(lǐng)域】,具體地說是一種能夠根據(jù)已知罪犯的 社交網(wǎng)絡(luò)數(shù)據(jù)挖掘相關(guān)聯(lián)犯罪嫌疑人的基于社交網(wǎng)絡(luò)分析的犯罪嫌疑人挖掘關(guān)聯(lián)方法及 系統(tǒng)。
【背景技術(shù)】
[0002] 人類是天然的社會(huì)性生物,因此人類的行為也自然的帶有社會(huì)性。選擇、行動(dòng)等這 些人類的行為都根植于龐大的社會(huì)環(huán)境中。因此,研究社交網(wǎng)絡(luò)在犯罪行為中的作用也成 為了犯罪學(xué)研究領(lǐng)域的一個(gè)重要課題。已有的研究表明,社交網(wǎng)絡(luò)在團(tuán)伙犯罪行為中起到 了重要的輔助作用。此外,犯罪社交網(wǎng)絡(luò)并不是分離的,而是由一系列的社團(tuán)交織而成。對(duì) 于公安部門的決策者來說,從社交網(wǎng)絡(luò)中挖掘犯罪信息變得越來越重要。
[0003] 隨著犯罪網(wǎng)絡(luò)分析的需求不斷增長,社交網(wǎng)絡(luò)分析技術(shù)越來越多的應(yīng)用于犯罪分 析過程。社交網(wǎng)絡(luò)分析是一種社會(huì)科學(xué)方法,包含了一系列的量化準(zhǔn)則和良好的量化展示, 借助這個(gè)方法,辦案人員能夠快速的挖掘發(fā)現(xiàn)隱藏在深處的破案線索。在社交網(wǎng)絡(luò)分析中, 社團(tuán)發(fā)現(xiàn)是一個(gè)至關(guān)重要的問題。社團(tuán)發(fā)現(xiàn)可以幫助發(fā)現(xiàn)一些潛在的組織模塊,這對(duì)公安 部門偵破團(tuán)伙作案可以起到很好的輔助作用。社團(tuán)發(fā)現(xiàn)會(huì)將網(wǎng)絡(luò)分成幾個(gè)子網(wǎng)絡(luò),每個(gè)子 網(wǎng)絡(luò)內(nèi)部的點(diǎn)聯(lián)系緊密,而不同子網(wǎng)絡(luò)之間的點(diǎn)聯(lián)系松散。經(jīng)過社團(tuán)發(fā)現(xiàn)算法處理后,一個(gè) 犯罪團(tuán)伙有很大可能會(huì)被分到同一個(gè)子網(wǎng)絡(luò)里,這為辦案人員排查犯罪嫌疑人提供了極大 的便利。
[0004] 目前學(xué)術(shù)界關(guān)于社團(tuán)發(fā)現(xiàn)已經(jīng)有大量的算法成果,但是這些算法多是過于理論 化,并沒有結(jié)合實(shí)際應(yīng)用場(chǎng)景做特定的優(yōu)化,尤其是針對(duì)警用犯罪分析方面的優(yōu)化更少。公 安部門人力有限,只能在一定人員范圍內(nèi)進(jìn)行嫌犯排查,所以社團(tuán)發(fā)現(xiàn)算法輸出的結(jié)果必 須要滿足現(xiàn)實(shí)需求才能真的起到有益作用。在案件偵破中,初始階段一般會(huì)有特定的幾個(gè) 嫌疑人目標(biāo),所以只需要針對(duì)特定的嫌疑人,關(guān)注局部的社交網(wǎng)絡(luò)分析,將初始確定的嫌疑 人所在的社團(tuán)找出來即可。另外,社交網(wǎng)絡(luò)分析中的社團(tuán)發(fā)現(xiàn)結(jié)果該如何輸出展現(xiàn)才能更 好的輔助辦案人員也沒有很好的解決方案。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明針對(duì)現(xiàn)有技術(shù)中存在的缺點(diǎn)和不足,提出了一種能夠根據(jù)已知罪犯的社交 網(wǎng)絡(luò)數(shù)據(jù)挖掘相關(guān)聯(lián)犯罪嫌疑人的基于社交網(wǎng)絡(luò)分析的犯罪嫌疑人挖掘關(guān)聯(lián)方法及系統(tǒng)。
[0006] 本發(fā)明可以通過以下措施達(dá)到: 一種基于社交網(wǎng)絡(luò)分析的犯罪嫌疑人挖掘關(guān)聯(lián)方法,其特征在于包括以下步驟: 步驟1:對(duì)數(shù)據(jù)中的每個(gè)人分配一個(gè)唯一的id,統(tǒng)計(jì)計(jì)算人與人之間的關(guān)聯(lián)信息,給每 個(gè)關(guān)聯(lián)賦予權(quán)重,然后對(duì)用戶輸入數(shù)據(jù)進(jìn)行預(yù)處理,從輸入數(shù)據(jù)提取關(guān)鍵信息; 步驟2:構(gòu)建社交網(wǎng)絡(luò)圖模型,根據(jù)第一步提取的信息,將每個(gè)人抽象成網(wǎng)絡(luò)圖中的一 個(gè)節(jié)點(diǎn),將人與人之間的關(guān)聯(lián)抽象成網(wǎng)絡(luò)圖中的邊,所述社交網(wǎng)絡(luò)是一個(gè)圖論模型,模型表 達(dá)如下: G = (V1E),其中G表示社交網(wǎng)絡(luò),V表示網(wǎng)絡(luò)中的點(diǎn),E表示網(wǎng)絡(luò)中的邊; 步驟3 :設(shè)置參數(shù),參數(shù)包括兩個(gè),重點(diǎn)目標(biāo)人員對(duì)應(yīng)的網(wǎng)絡(luò)點(diǎn)集合C,社團(tuán)所能包含的 點(diǎn)的個(gè)數(shù)上限閾值A(chǔ),根據(jù)實(shí)際的情況,設(shè)置一個(gè)或者多個(gè)重點(diǎn)目標(biāo)人員,在社交網(wǎng)絡(luò)中找 到這些人對(duì)應(yīng)的節(jié)點(diǎn),還可以選擇設(shè)置一個(gè)閾值,用于控制最終輸出的社團(tuán)大小, 步驟4:運(yùn)行社團(tuán)發(fā)現(xiàn)算法,對(duì)社交網(wǎng)絡(luò)進(jìn)行劃分,根據(jù)用戶預(yù)設(shè)的重點(diǎn)目標(biāo)人員,在 滿足閾值條件的情況下進(jìn)行層次聚類,直到滿足算法的終止條件,其中運(yùn)行的社團(tuán)發(fā)現(xiàn)算 法采用層次聚類的方法,算法過程中使用模塊度作為度量標(biāo)準(zhǔn),模塊度的定義如下:
【權(quán)利要求】
1. 一種基于社交網(wǎng)絡(luò)分析的犯罪嫌疑人挖掘關(guān)聯(lián)方法,其特征在于包括以下步驟: 步驟1:對(duì)數(shù)據(jù)中的每個(gè)人分配一個(gè)唯一的id,統(tǒng)計(jì)計(jì)算人與人之間的關(guān)聯(lián)信息,給每 個(gè)關(guān)聯(lián)賦予權(quán)重,然后對(duì)用戶輸入數(shù)據(jù)進(jìn)行預(yù)處理,從輸入數(shù)據(jù)提取關(guān)鍵信息; 步驟2:構(gòu)建社交網(wǎng)絡(luò)圖模型,根據(jù)第一步提取的信息,將每個(gè)人抽象成網(wǎng)絡(luò)圖中的一 個(gè)節(jié)點(diǎn),將人與人之間的關(guān)聯(lián)抽象成網(wǎng)絡(luò)圖中的邊,所述社交網(wǎng)絡(luò)是一個(gè)圖論模型,模型表 達(dá)如下: G= ,其中G表示社交網(wǎng)絡(luò),v表示網(wǎng)絡(luò)中的點(diǎn),E表示網(wǎng)絡(luò)中的邊; V * ? 步驟3 :設(shè)置參數(shù),參數(shù)包括兩個(gè),重點(diǎn)目標(biāo)人員對(duì)應(yīng)的網(wǎng)絡(luò)點(diǎn)集合C,社團(tuán)所能包含的 點(diǎn)的個(gè)數(shù)上限閾值A(chǔ),根據(jù)實(shí)際的情況,設(shè)置一個(gè)或者多個(gè)重點(diǎn)目標(biāo)人員,在社交網(wǎng)絡(luò)中找 到這些人對(duì)應(yīng)的節(jié)點(diǎn),還可以選擇設(shè)置一個(gè)閾值,用于控制最終輸出的社團(tuán)大小, 步驟4:運(yùn)行社團(tuán)發(fā)現(xiàn)算法,對(duì)社交網(wǎng)絡(luò)進(jìn)行劃分,根據(jù)用戶預(yù)設(shè)的重點(diǎn)目標(biāo)人員,在 滿足閾值條件的情況下進(jìn)行層次聚類,直到滿足算法的終止條件,其中運(yùn)行的社團(tuán)發(fā)現(xiàn)算 法采用層次聚類的方法,算法過程中使用模塊度作為度量標(biāo)準(zhǔn),模塊度的定義如下:
其中表示點(diǎn)i和點(diǎn)j之間的邊的權(quán)重:
是所有與點(diǎn)i相連的 邊的權(quán)重之和,表示點(diǎn)i所屬的社團(tuán),如果
函數(shù)為1,否則
,是歸一化因子; 步驟5 :輸出發(fā)現(xiàn)的結(jié)果,列出犯罪嫌疑人員。
2. 根據(jù)權(quán)利要求1所述的一種基于社交網(wǎng)絡(luò)分析的犯罪嫌疑人挖掘關(guān)聯(lián)方法,其特征 在于步驟4中運(yùn)行社團(tuán)發(fā)現(xiàn)算法具體步驟如下:輸入:社交網(wǎng)絡(luò)圖模型G= (V,E), 重點(diǎn)目標(biāo)人員集合Czlcpc2,c3, ......ck}, 權(quán)重?cái)?shù)組W={wi,w2,w3, ......wm},m為E中邊的條數(shù), 社團(tuán)規(guī)模閾值X; 輸出:社團(tuán)集合P={Pi,p2,p3,......,pn}, 開始 初始時(shí)每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)是一個(gè)單獨(dú)的社團(tuán),即P={PiIViGppViGV}; 定義|P|為集合P包含的社團(tuán)的個(gè)數(shù),定義|v|為集合V包含的點(diǎn)的個(gè)數(shù),循環(huán)開始: 對(duì)于
對(duì)于j= 1 4 |尸|, 如果滿足閾值A(chǔ),算法結(jié)束; 將點(diǎn)Vi從原來的社團(tuán)移除,加入新的社團(tuán)IV計(jì)算模塊度的變化AQ,并記錄,找到找到A Q大于0且值最大的操作并執(zhí)行,如果不存在大于0的A Q,則進(jìn)行下一輪循環(huán); 如果本次循環(huán)沒有任何操作,算法結(jié)束; 對(duì)于本次循環(huán)得到的社團(tuán)集合P={Pl,P2,P3,……,Pt},將P中的每個(gè)社團(tuán)看成一個(gè)點(diǎn), 將不同的社團(tuán)之間的鏈接及權(quán)重統(tǒng)一合并計(jì)算為一條帶權(quán)重的邊,這樣得到了一個(gè)新的社 交網(wǎng)絡(luò)圖'=z 以及一個(gè)新的權(quán)重向量_+y '重新開始循環(huán) 過程。
3. -種基于社交網(wǎng)絡(luò)分析的犯罪嫌疑人挖掘關(guān)聯(lián)系統(tǒng),其特征在于設(shè)有依次串聯(lián)的用 于完成關(guān)鍵信息抽取的數(shù)據(jù)分析和提取模塊;用于將結(jié)構(gòu)化數(shù)據(jù)抽象為網(wǎng)絡(luò)圖模型的社交 網(wǎng)絡(luò)構(gòu)建模塊;用于對(duì)社交網(wǎng)絡(luò)進(jìn)行劃分的社團(tuán)發(fā)現(xiàn)模塊;以及用于將初始指定目標(biāo)所在 的社團(tuán)按照一定的規(guī)則輸出的結(jié)果輸出及展示模塊。
【文檔編號(hào)】G06F17/30GK104408149SQ201410726472
【公開日】2015年3月11日 申請(qǐng)日期:2014年12月4日 優(yōu)先權(quán)日:2014年12月4日
【發(fā)明者】孫圣鵬, 張玉超, 高明, 張友春, 向俊敏, 夏俊玲 申請(qǐng)人:威海北洋電氣集團(tuán)股份有限公司