本發(fā)明涉及復(fù)雜網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種電話通信網(wǎng)絡(luò)中節(jié)點敏感性排序的方法。
背景技術(shù):
隨著移動終端設(shè)備的發(fā)展,手機已成為人們?nèi)粘I罱涣鞯闹匾ㄐ旁O(shè)備,每天有大量的通信數(shù)據(jù)產(chǎn)生,包括短信和電話記錄,如果把通信的雙方看成節(jié)點,一次通信看作一條連邊,那整個通信網(wǎng)絡(luò)就是一個巨大且復(fù)雜的網(wǎng)絡(luò)系統(tǒng)。如何定量分析通信網(wǎng)絡(luò)中節(jié)點的重要程度仍然是一個待解決的問題。
網(wǎng)絡(luò)節(jié)點重要性的評價主要有基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和基于節(jié)點屬性兩個方面。基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的方法有:局部網(wǎng)絡(luò)結(jié)構(gòu)、全局網(wǎng)絡(luò)結(jié)構(gòu)以及基于網(wǎng)絡(luò)位置屬性等指標(biāo)?;诠?jié)點屬性的重要性排序方法有基于個體行為特征,個體基本信息特征等。
局部網(wǎng)絡(luò)結(jié)構(gòu)主要從節(jié)點自身和其鄰居屬性如度來分析,分析局部結(jié)構(gòu)屬性計算復(fù)雜度較低,適用于大型網(wǎng)絡(luò)。
基于個體基本信息特征的有如facebook上用戶的年齡、性別等屬性,這些屬性左右著用戶的影響力。
在犯罪網(wǎng)絡(luò)的研究方法中,有根據(jù)罪犯的通信行為建立社會網(wǎng)絡(luò),通過行為動力學(xué)分析來判斷和挖掘罪犯;也有對已知罪犯進(jìn)行標(biāo)記,根據(jù)邊權(quán)計算其余節(jié)點的相對重要性,來挖掘犯罪可疑分子。
通過以上研究分析發(fā)現(xiàn),目前已經(jīng)有很多關(guān)于網(wǎng)絡(luò)節(jié)點重要性的研究,但是如何提取節(jié)點特征,如何準(zhǔn)確而又高效地提升計算方法,還有待進(jìn)一步研究。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于解決現(xiàn)有技術(shù)存在的缺陷,提供一種電話通信網(wǎng)絡(luò)中節(jié)點敏感性排序的方法,有效挖掘敏感節(jié)點,大大提升了靈活性。
為實現(xiàn)上述發(fā)明目的,本發(fā)明采用如下方案:
一種電話通信網(wǎng)絡(luò)中節(jié)點敏感性排序的方法,包括以下步驟:
(1)建立手機機身碼與號碼映射關(guān)系,同時統(tǒng)計每個機身碼的通話總次數(shù),用于后續(xù)基于結(jié)構(gòu)的分析和號碼間的相似度計算;
(2)構(gòu)建重點關(guān)注手機號碼、重點關(guān)注區(qū)域、重點關(guān)注時間的三張表,表名分別為focusnumberlist、focusarealist、focustimelist,為后續(xù)計算號碼敏感指數(shù)做準(zhǔn)備;
(3)基于結(jié)構(gòu)的敏感性指數(shù)計算方法,分別計算一機多號敏感指數(shù)、一號多機敏感指數(shù)、重點關(guān)注號碼敏感指數(shù)、重點關(guān)注時間敏感指數(shù)、重點關(guān)注區(qū)域敏感指數(shù)、本國通話強度敏感指數(shù)、主叫國外通話強度敏感指數(shù)、接聽國外通話強度敏感指數(shù)和號碼伴隨敏感指數(shù),具體計算方法如下:
①一機多號敏感指數(shù)計算
對一個手機使用多個號碼的機身碼進(jìn)行建模,通過模型計算得到一機多號敏感指數(shù),計算公式如下:
其中i為當(dāng)前機身碼對應(yīng)的第i個號碼,call_sumi為第i個號碼的通話次數(shù)總和,mobilenum_sumi為第i個號碼使用過的手機數(shù)量,k為該機身碼使用過的號碼總數(shù),β為0到1的調(diào)節(jié)參數(shù),取0.5;
②一號多機敏感指數(shù)計算
對多個手機使用同一號碼的號碼進(jìn)行敏感指數(shù)分析建模,通過模型計算得到一號多機敏感指數(shù),具體的計算公式如下:
其中imei_sum為使用過該號碼的手機數(shù)量,call_sum為該號碼的所有通話次數(shù),β為0到1的調(diào)節(jié)參數(shù),取0.5;
③重點關(guān)注區(qū)域敏感指數(shù)計算
首先添加區(qū)域以及關(guān)注指數(shù),通過對通話詳單進(jìn)行分析,統(tǒng)計該區(qū)域內(nèi)的通話記錄,對出現(xiàn)在關(guān)注區(qū)域內(nèi)的通話進(jìn)行建模,通過模型計算得到重點關(guān)注區(qū)域敏感指數(shù),計算公式如下:
其中contact_sumi為第i個區(qū)域內(nèi)的通話次數(shù),importancei為該關(guān)注區(qū)域的重要性值,k為關(guān)注區(qū)域數(shù)。
對數(shù)值進(jìn)行平滑處理,使importancearea介于0至1之間,最終的計算公式如下:
其中importancefocusarea為平滑處理后的重點關(guān)注區(qū)域敏感指數(shù),α、β為一個小于1并且大于0的調(diào)節(jié)參數(shù),α取0.2,β為10-5;
④重點關(guān)注時間敏感指數(shù)計算
首先添加時間區(qū)間以及對應(yīng)的敏感值,通過分析通話詳單,統(tǒng)計該時間段內(nèi)的通話記錄,對出現(xiàn)在關(guān)注時間內(nèi)的通話進(jìn)行敏感指數(shù)分析建模,通過模型計算得到重點關(guān)注時間敏感指數(shù),具體的計算公式如下:
其中contact_sumi為第i個時間區(qū)間內(nèi)的通話次數(shù),importancei為該關(guān)注時間段的敏感值,k為關(guān)注時間區(qū)間個數(shù);
對數(shù)值進(jìn)行平滑處理,使importancetime介于0至1之間,最終的計算公式如下,
其中importancefocustime平滑處理后的重點關(guān)注時間敏感指數(shù),α、β為一個小于1并且大于0的小數(shù),α取0.2,β為10-5;
⑤重點關(guān)注號碼敏感指數(shù)計算
在構(gòu)建全局重點關(guān)注號碼集后,使用相對重要性計算模型分析重點關(guān)注號碼的敏感性對其他號碼的影響;
⑥本國通話強度敏感指數(shù)計算;
通過對通話詳單進(jìn)行分析,統(tǒng)計每個號碼的國內(nèi)通話次數(shù)以及國內(nèi)通話聯(lián)系人數(shù),進(jìn)而利用國內(nèi)通話強度敏感指數(shù)模型進(jìn)行計算,得到這個號碼的國內(nèi)通話強度敏感指數(shù);
具體的計算公式如下:
其中domesticcontact_sum為該號碼的國內(nèi)聯(lián)系人數(shù)量,domesticcall_sum為該號碼的所有通話次數(shù),β為0到1的調(diào)節(jié)參數(shù),這里取0.5;
⑦主叫國外通話強度敏感指數(shù)計算
通過對通話詳單進(jìn)行分析,統(tǒng)計每個號碼的主叫國外通話次數(shù)以及主叫國外的通話聯(lián)系人數(shù),進(jìn)而利用主叫國外通話強度敏感指數(shù)模型進(jìn)行計算,得到這個號碼的主叫國外通話強度敏感指數(shù);
具體的計算公式如下:
其中callforeigncontact_sum為該號碼主叫國外聯(lián)系人數(shù)量,callforeign_sum為該號碼的所有主叫國外的通話次數(shù),β為0到1的調(diào)節(jié)參數(shù),取0.5;
⑧接聽國外通話強度敏感指數(shù)計算
通過對通話詳單進(jìn)行分析,統(tǒng)計每個號碼的被叫國外通話次數(shù)以及被叫國外的通話聯(lián)系人數(shù),進(jìn)而利用被叫國外通話強度敏感指數(shù)模型進(jìn)行計算,得到這個號碼的接聽國外通話強度敏感指數(shù);
具體的計算公式如下:
其中calledforeigncontact_sum為該號碼被叫國外聯(lián)系人數(shù)量,callforeign_sum為該號碼的所有被叫國外的通話次數(shù),β為0到1的調(diào)節(jié)參數(shù),取0.5;
⑨號碼伴隨敏感指數(shù)計算
包括普通號碼伴隨和重點關(guān)注號碼伴隨,通過對通話詳單進(jìn)行分析,統(tǒng)計總是與當(dāng)前號碼在同一時間范圍、同一地點范圍出現(xiàn)的其他號碼,利用伴隨敏感指數(shù)模型進(jìn)行計算,得到號碼的伴隨敏感指數(shù);
具體的計算公式如下:
其中accompany_sumi為該號碼與第i個號碼伴隨的次數(shù),call_sum為該號碼通話次數(shù)總和,β為0到1的調(diào)節(jié)參數(shù),取0.5,k為伴隨號碼數(shù)量;
(4)設(shè)置權(quán)重,計算敏感值
根據(jù)需要設(shè)置不同權(quán)重系數(shù),將步驟(3)中所求得的各項敏感指數(shù)值進(jìn)行加權(quán)求和得到最終的敏感值,計算出各個號碼的敏感值,并對各個號碼的敏感值進(jìn)行排序。由于敏感值與號碼重要性呈正相關(guān),所以敏感值越高,號碼的重要性越高。
進(jìn)一步,步驟(3)中重點關(guān)注號碼敏感值計算過程中,重點關(guān)注號碼集的敏感值計算方法如下:
首先,定義關(guān)注指數(shù)值大于0的號碼為關(guān)注號碼,初始關(guān)注號碼具有兩種來源:
1)手動配置參與計算的重點關(guān)注號碼集,此類型號碼敏感值在擴散過程中不會改變,可定義為importantseednumber;
2)通過關(guān)注區(qū)域和關(guān)注時間計算得到的重點關(guān)注號碼集,此類型號碼重要性在擴散過程中會受到其鄰居節(jié)點的敏感值變化而改變,初始敏感值取關(guān)注區(qū)域和關(guān)注時間敏感值的算術(shù)平均數(shù),計算公式如下:
importancefocusnumber
=(importancefocusarea+importancefocustime)/2
擴散過程中除種子號碼外,其余號碼的敏感值隨著其鄰居節(jié)點敏感值改變,直至擴散到一個極大連通子圖,具體擴散過程如下:
(i)初始,除了標(biāo)記的重點關(guān)注號碼集importantseednumber,還有通過關(guān)注區(qū)域和關(guān)注時間計算得到的;
(ii)由關(guān)注號碼進(jìn)行擴散,其鄰居敏感值的計算公式為:
其中contact_sumi為與第i個關(guān)注號碼的通話次數(shù),importancei為該號碼的敏感值,k為與號碼i通話的號碼數(shù);
對其進(jìn)行平滑處理,得到如下公式:
受鄰居節(jié)點重要性影響,平滑以后的重要性計算公式為:
公式(1)與(2)中α、β為一個小于1并且大于0的小數(shù),而β通常接近于0;公式(2)中k為號碼鄰居中關(guān)注號碼系數(shù)大于0.7的個數(shù);
(iii)更新重要性,取公式(1)、(2)中最大值為該號碼新的敏感值;
importancefocusnumber
=max(importancefocusnumber_1,importancefocusnumber_2)
若無增加新的關(guān)注號碼,則退出,否則回到步驟(ii)。
進(jìn)一步,通過統(tǒng)計分析整個通話詳單,建立機身碼與號碼映射關(guān)系。
進(jìn)一步,步驟(3)中,在進(jìn)行一機多號敏感指數(shù)計算前,通過對通話詳單進(jìn)行分析,統(tǒng)計分析每個號碼的通話次數(shù)以及在此手機上使用過的號碼個數(shù),如果手機使用的號碼個數(shù)超過1個,則認(rèn)為此手機為一機多號,進(jìn)而利用一機多號敏感指數(shù)模型進(jìn)行計算。
進(jìn)一步,步驟(3)中,在進(jìn)行一號多機敏感指數(shù)計算前,通過對通話詳單進(jìn)行分析,統(tǒng)計分析每個號碼的通話次數(shù)以及所持有的手機數(shù)量,進(jìn)而利用一號多機敏感指數(shù)模型進(jìn)行計算。
進(jìn)一步,步驟(1)中,建立手機機身碼與號碼映射關(guān)系,包括一個機身碼對應(yīng)多個號碼和一個號碼對應(yīng)多個機身碼兩種情況。
本發(fā)明的電話通信網(wǎng)絡(luò)中節(jié)點敏感性排序的方法,通過對用戶通信的詳單、基站等數(shù)據(jù),從結(jié)構(gòu)和屬性兩方面進(jìn)行建模,對每個號碼統(tǒng)計其一階、二階鄰居、通話時間序列、基站通話次數(shù)等屬性,從結(jié)構(gòu)和屬性層面分析號碼相應(yīng)的敏感指數(shù)值;對已經(jīng)標(biāo)注的重點關(guān)注號碼,將其敏感值擴散至其鄰居節(jié)點中,直至影響到整個連通子圖;對多個參數(shù)進(jìn)行建模,對電話通信網(wǎng)絡(luò)中節(jié)點的屬性值進(jìn)行加權(quán)求和,得到最終敏感指數(shù)值。這樣不僅從結(jié)構(gòu)上分析敏感節(jié)點的通信傳播,還考慮了各個節(jié)點的通話屬性。這樣,能有效地挖掘敏感節(jié)點,大大提升了靈活性。
附圖說明
圖1是本發(fā)明計算節(jié)點敏感性的流程圖。
圖2是本發(fā)明計算重點號碼敏感值流程圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明的具體實施流程進(jìn)行描述,特別注意的是,敏感數(shù)據(jù)將用變量名代替。
參考圖1和圖2,本發(fā)明電話通信網(wǎng)絡(luò)中節(jié)點敏感性排序的方法,具體步驟如下:
(1)建立手機機身碼與號碼映射關(guān)系(機身碼可能對應(yīng)多個號碼,號碼也可能對應(yīng)多個機身碼),同時統(tǒng)計每個機身碼的通話總次數(shù),用于后續(xù)基于結(jié)構(gòu)的分析和號碼間的相似度計算;
(2)構(gòu)建重點關(guān)注手機號碼、重點關(guān)注區(qū)域、重點關(guān)注時間的三張表,表名分別為focusnumberlist、focusarealist、focustimelist,為后續(xù)計算號碼敏感指數(shù)做準(zhǔn)備;
(3)基于結(jié)構(gòu)的敏感性指數(shù)計算方法,分別計算一機多號敏感指數(shù)、一號多機敏感指數(shù)、重點關(guān)注號碼敏感指數(shù)、重點關(guān)注時間敏感指數(shù)、重點關(guān)注區(qū)域敏感指數(shù)、本國通話強度敏感指數(shù)、主叫國外通話強度敏感指數(shù)、接聽國外通話強度敏感指數(shù)和號碼伴隨敏感指數(shù),具體計算方法如下:
①一機多號敏感指數(shù)計算
對一個手機使用多個號碼的機身碼進(jìn)行建模,通過模型計算得到一機多號敏感指數(shù),計算公式如下:
其中i為當(dāng)前機身碼對應(yīng)的第i個號碼,call_sumi為第i個號碼的通話次數(shù)總和,mobilenum_sumi為第i個號碼使用過的手機數(shù)量,k為該機身碼使用過的號碼總數(shù),β為0到1的調(diào)節(jié)參數(shù),本發(fā)明中β取0.5;
②一號多機敏感指數(shù)計算
對多個手機使用同一號碼的號碼進(jìn)行敏感指數(shù)分析建模,通過模型計算得到一號多機敏感指數(shù),具體的計算公式如下:
其中imei_sum為使用過該號碼的手機數(shù)量,call_sum為該號碼的所有通話次數(shù),β為0到1的調(diào)節(jié)參數(shù),本發(fā)明中β取0.5;
③重點關(guān)注區(qū)域敏感指數(shù)計算
首先添加區(qū)域以及關(guān)注指數(shù),通過對通話詳單進(jìn)行分析,統(tǒng)計該區(qū)域內(nèi)的通話記錄,對出現(xiàn)在關(guān)注區(qū)域內(nèi)的通話進(jìn)行建模,通過模型計算得到重點關(guān)注區(qū)域敏感指數(shù),計算公式如下:
其中contact_sumi為第i個區(qū)域內(nèi)的通話次數(shù),importancei為該關(guān)注區(qū)域的重要性值,k為關(guān)注區(qū)域數(shù)。
對數(shù)值進(jìn)行平滑處理,使importancearea介于0至1之間,最終的計算公式如下:
其中importancefocusarea為平滑處理后的重點關(guān)注區(qū)域敏感指數(shù),α、β為一個小于1并且大于0的調(diào)節(jié)參數(shù),α取0.2,β為10-5;
④重點關(guān)注時間敏感指數(shù)計算
首先添加時間區(qū)間以及對應(yīng)的敏感值,通過分析通話詳單,統(tǒng)計該時間段內(nèi)的通話記錄,對出現(xiàn)在關(guān)注時間內(nèi)的通話進(jìn)行敏感指數(shù)分析建模,通過模型計算得到重點關(guān)注時間敏感指數(shù),具體的計算公式如下:
其中contact_sumi為第i個時間區(qū)間內(nèi)的通話次數(shù),importancei為該關(guān)注時間段的敏感值,k為關(guān)注時間區(qū)間個數(shù);
對數(shù)值進(jìn)行平滑處理,使importancetime介于0至1之間,最終的計算公式如下,
其中importancefocustime平滑處理后的重點關(guān)注時間敏感指數(shù),α、β為一個小于1并且大于0的小數(shù),α取0.2,β為10-5;
⑤重點關(guān)注號碼敏感指數(shù)計算
在構(gòu)建全局重點關(guān)注號碼集后,使用相對重要性計算模型分析重點關(guān)注號碼的敏感性對其他號碼的影響,具體計算方法見權(quán)利要求說明第2部分;
⑥本國通話強度敏感指數(shù)計算;
通過對通話詳單進(jìn)行分析,統(tǒng)計每個號碼的國內(nèi)通話次數(shù)以及國內(nèi)通話聯(lián)系人數(shù),進(jìn)而利用國內(nèi)通話強度敏感指數(shù)模型進(jìn)行計算,得到這個號碼的國內(nèi)通話強度敏感指數(shù);
具體的計算公式如下:
其中domesticcontact_sum為該號碼的國內(nèi)聯(lián)系人數(shù)量,domesticcall_sum為該號碼的所有通話次數(shù),β為0到1的調(diào)節(jié)參數(shù),這里取0.5;
⑦主叫國外通話強度敏感指數(shù)計算
通過對通話詳單進(jìn)行分析,統(tǒng)計每個號碼的主叫國外通話次數(shù)以及主叫國外的通話聯(lián)系人數(shù),進(jìn)而利用主叫國外通話強度敏感指數(shù)模型進(jìn)行計算,得到這個號碼的主叫國外通話強度敏感指數(shù);
具體的計算公式如下:
其中callforeigncontact_sum為該號碼主叫國外聯(lián)系人數(shù)量,callforeign_sum為該號碼的所有主叫國外的通話次數(shù),β的取值同上;
⑧接聽國外通話強度敏感指數(shù)計算
通過對通話詳單進(jìn)行分析,統(tǒng)計每個號碼的被叫國外通話次數(shù)以及被叫國外的通話聯(lián)系人數(shù),進(jìn)而利用被叫國外通話強度敏感指數(shù)模型進(jìn)行計算,得到這個號碼的接聽國外通話強度敏感指數(shù);
具體的計算公式如下:
其中calledforeigncontact_sum為該號碼被叫國外聯(lián)系人數(shù)量,callforeign_sum為該號碼的所有被叫國外的通話次數(shù),β的取值同上;
⑨號碼伴隨敏感指數(shù)計算
包括普通號碼伴隨和重點關(guān)注號碼伴隨,通過對通話詳單進(jìn)行分析,統(tǒng)計總是與當(dāng)前號碼在同一時間范圍、同一地點范圍出現(xiàn)的其他號碼,利用伴隨敏感指數(shù)模型進(jìn)行計算,得到號碼的伴隨敏感指數(shù);
具體的計算公式如下:
其中accompany_sumi為該號碼與第i個號碼伴隨的次數(shù),call_sum為該號碼通話次數(shù)總和,β的取值同上,k為伴隨號碼數(shù)量。
(4)設(shè)置權(quán)重,計算敏感值
根據(jù)需要設(shè)置不同權(quán)重系數(shù),將步驟(3)中所求得的各項敏感指數(shù)值進(jìn)行加權(quán)求和得到最終的敏感值,計算出各個號碼的敏感值,并對各個號碼的敏感值進(jìn)行排序。由于敏感值與號碼重要性呈正相關(guān),所以敏感值越高,號碼的重要性越高。
以下通過具體實施例說明本發(fā)明方法:本實施采用的通話記錄數(shù)65788條,號碼總數(shù)為7787個。
(1)統(tǒng)計機身碼(imei)與號碼映射關(guān)系,統(tǒng)計分析整個通話詳單,建立機身碼與號碼映射關(guān)系。映射關(guān)系可表示為“imei—numberlist”,“numberlist”為號碼數(shù)組。得到6組一機多號關(guān)系。
(2)配置重點關(guān)注號碼、重點關(guān)注區(qū)域、重點關(guān)注時間三張表,分別為focusnumberlist、focusarealist、focustimelist。為后續(xù)計算號碼的敏感值做準(zhǔn)備。
(3)基于結(jié)構(gòu)的敏感指數(shù)計算。主要包括一機多號敏感指數(shù)、一號多機敏感指數(shù)、伴隨影響敏感指數(shù)、重點關(guān)注號碼敏感指數(shù)、重點關(guān)注時間敏感指數(shù)、以及重點關(guān)注區(qū)域敏感指數(shù)等。特別需注意的是,此步驟完成后,根據(jù)重點關(guān)注區(qū)域敏感指數(shù)和重點關(guān)注時間敏感指數(shù)可算出一般號碼(非步驟2中配置的重點關(guān)注號碼)的重點關(guān)注號碼敏感指數(shù)。數(shù)據(jù)樣例如表1所示。
表1結(jié)構(gòu)敏感值計算結(jié)果表
(4)權(quán)重配置。將步驟(3)中所求得的各項指標(biāo)值進(jìn)行加權(quán)求和得到最終敏感指數(shù)值??筛鶕?jù)需要為各指標(biāo)配置不同權(quán)重,對各個號碼計算出不同敏感值如表2所示,假設(shè)各項權(quán)重標(biāo)注在表頭中。
表2敏感性計算結(jié)果表
最后根據(jù)實際數(shù)據(jù),得出的結(jié)果如表3(n1~n5為已知的敏感節(jié)點)所示。
表3計算結(jié)果表
最后應(yīng)說明的是:以上實施例僅用于說明本發(fā)明的技術(shù)方案流程,并非限制此方案的使用范圍;對于本技術(shù)內(nèi)的相關(guān)技術(shù)人員可以對方案中的參數(shù)進(jìn)行替換和對方法進(jìn)行適當(dāng)限制。當(dāng)然,這些替換或者限制若為本發(fā)明的精神和范圍內(nèi),任何發(fā)明都應(yīng)被保護(hù)。