亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于手機數(shù)據(jù)測算城際人信綜合聯(lián)系強度的方法與流程

文檔序號:11207618閱讀:516來源:國知局
一種基于手機數(shù)據(jù)測算城際人信綜合聯(lián)系強度的方法與流程
本發(fā)明屬于數(shù)據(jù)測算
技術(shù)領(lǐng)域
,具體涉及一種基于手機數(shù)據(jù)測算城際人信綜合聯(lián)系強度的方法。
背景技術(shù)
:近年來,隨著我國城市化高速發(fā)展,全國的城市化率已經(jīng)超過了50%。由于現(xiàn)代交通和通訊的便利條件,城市群越來越多,城市之間的聯(lián)系越來越密切,這種密切聯(lián)系尤其反映在城際之間的人流、通訊流的總量不斷增加。因此,如何衡量城市之間的聯(lián)系密切情況,就需要使用聯(lián)系強度的概念,而這一概念一直得不到準(zhǔn)確的衡量和測算。在區(qū)域城市發(fā)展研究、城市規(guī)劃、交通規(guī)劃以及城市管理中,迫切需要衡量與測算出城際聯(lián)系強度,并且這種強度測算最好不是單一指標(biāo),既要有客流聯(lián)系的考量,也要有通訊流聯(lián)系的考量。由此,引入了“城際人信綜合聯(lián)系強度”的概念,具體是指綜合測算兩城市之間的雙向客流量和交互通訊量。技術(shù)實現(xiàn)要素:本發(fā)明的目的是根據(jù)上述現(xiàn)有技術(shù)的不足之處,提供一種基于手機數(shù)據(jù)測算城際人信綜合聯(lián)系強度的方法,該方法根據(jù)兩城市之間的交互通訊量和雙向客流量,識別其與手機網(wǎng)絡(luò)總用戶量的比值,并根據(jù)工作日與休息日的不同情況賦予不同的權(quán)重,進而綜合測算得出兩城之間的人信綜合聯(lián)系強度,即綜合考量了工作日、周末、雙向客流量、交互通訊量四種不同因素。本發(fā)明目的實現(xiàn)由以下技術(shù)方案完成:一種基于手機數(shù)據(jù)測算城際人信綜合聯(lián)系強度的方法,其特征在于所述方法包括以下步驟:(1)獲取任一手機運營商分別在城市a和b中連續(xù)n天的手機信令數(shù)據(jù),n≥28,識別測算所述手機信令數(shù)據(jù)中的每日有效用戶總量,將城市a和b在n天內(nèi)的各工作日有效用戶總量分別拼接成數(shù)列{a(1)}、{b(1)},將城市a和b在n天內(nèi)的各休息日有效用戶總量aj(0)、bj(0)分別拼接成數(shù)列{a(0)}、{b(0)};其中,i表示n天內(nèi)的第i個工作日,j表示n天內(nèi)的第j個休息日;(2)獲取所述手機運營商分別在城市a和b中連續(xù)n天的通訊數(shù)據(jù),n≥28,識別測算所述通訊數(shù)據(jù)中的每日有效用戶總量,將城市a和b在n天內(nèi)的各工作日有效用戶總量分別拼接成數(shù)列{a(1)}、{b(1)},將城市a和b在n天內(nèi)的各休息日有效用戶總量aj(0)、bj(0)分別拼接成數(shù)列{a(0)}、{b(0)};其中,i表示n天內(nèi)的第i個工作日,j表示n天內(nèi)的第j個休息日;(3)對所述手機信令數(shù)據(jù)在n天內(nèi)的有效用戶總量的穩(wěn)定性進行檢驗,剔除其中不符合穩(wěn)定性條件的日期;對所述通訊數(shù)據(jù)在n天內(nèi)的有效用戶總量的穩(wěn)定性進行檢驗,剔除其中不符合穩(wěn)定性條件的日期;經(jīng)過穩(wěn)定性檢驗、剔除不符合穩(wěn)定性條件的日期后,從剩下的日期中挑選,挑選條件必須滿足:a、b兩城日期同步、日期連續(xù)、天數(shù)大于等于7天的數(shù)據(jù),舍棄其余不連續(xù)日期的所有數(shù)據(jù),整理得到如下各組數(shù)據(jù):aj(0)、bj(0)、aj(0)、bj(0);其中,i≥5,j≥2,并且i和j在日歷表上連續(xù);(4)根據(jù)步驟(1)和(3),識別、測算城市a和b之間基于所述手機信令數(shù)據(jù)的工作日和休息日的雙向客流量客流量以人次計;(5)根據(jù)步驟(2)和(3),識別、測算城市a和b之間基于所述通訊數(shù)據(jù)的工作日和休息日的交互通訊量交互通訊量以人次計;(6)基于步驟(4)和(5)所獲得的數(shù)據(jù),進行突發(fā)性檢查:當(dāng)城市a和b同為工作日或同為休息日時的雙向客流量相差大于10%時,或是當(dāng)城市a和b同為工作日或同為休息日時的雙向交互通訊量相差大于15%時,剔除對應(yīng)該日期的所有數(shù)據(jù);之后,從剩下的天數(shù)中挑選,條件須滿足城市a和b時期同步、日期連續(xù)、天數(shù)等于7天的數(shù)據(jù),舍棄其余日期的所有數(shù)據(jù),整理得到如下各組數(shù)據(jù):aj(0)、bj(0)、aj(0)、bj(0)、其中,i=1~5,j=1~2,并且i和j在日歷表上連續(xù);(7)根據(jù)步驟(6),整理城際人信綜合聯(lián)系強度測算的基礎(chǔ)數(shù)據(jù),包括信令數(shù)據(jù)有效用戶總量均值通訊數(shù)據(jù)有效用戶總量均值兩城雙向客流量均值兩城交互通訊量均值其中,分別表示城市a工作日、休息日信令數(shù)據(jù)有效用戶總量均值;分別表示城市b工作日、休息日信令數(shù)據(jù)有效用戶總量均值;分別表示城市a工作日、休息日的通訊數(shù)據(jù)有效用戶總量均值;分別表示城市b工作日、休息日的通訊數(shù)據(jù)有效用戶總量均值;分別表示工作日、休息日的兩城雙向客流量均值;分別表示工作日、休息日的兩城交互通訊量均值;(8)根據(jù)步驟(7),利用信令數(shù)據(jù)有效用戶總量均值和兩城雙向客流量均值分別計算獲得工作日和休息日的城際客流聯(lián)系強度;利用通訊數(shù)據(jù)有效用戶總量均值和兩城交互通訊量均值分別計算工作日和休息日的城際通訊流聯(lián)系強度;依此,計算城際人信綜合聯(lián)系強度。步驟(1)中,識別測算所述手機信令數(shù)據(jù)中的每日有效用戶總量的方法為:所述手機信令數(shù)據(jù)中的每個用戶記錄須滿足駐留時長可靠性條件,才可識別為當(dāng)天所在城市的有效用戶,所述可靠性條件為:tzs-tzr≥120分鐘其中,tzs是指在一天計時周期內(nèi),用戶于所在城市的尾記錄的時間;tzr是指在一天計時周期內(nèi),用戶于所在城市的首記錄的時間。步驟(2)中,識別測算所述通訊數(shù)據(jù)中的每日有效用戶總量的方法為:在一天的計時周期內(nèi),任意用戶在所在城市的所述通訊數(shù)據(jù)中顯示有“打電話、接電話、發(fā)送短信、接收短信”中的任何一個數(shù)據(jù)記錄,才可識別為當(dāng)天所在城市的有效用戶。步驟(3)中,對所述手機信令數(shù)據(jù)在n天內(nèi)的有效用戶總量的穩(wěn)定性進行檢驗的方法為:基于步驟(1),分別對工作日與休息日的四組數(shù)據(jù){a(1)}、{b(1)}、{a(0)}、{b(0)}做環(huán)比2日移動平均:當(dāng)表明城市a的工作日數(shù)據(jù)不穩(wěn)定,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市b的工作日數(shù)據(jù)不穩(wěn)定,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市a的休息日數(shù)據(jù)不穩(wěn)定,剔除第j+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市b的休息日數(shù)據(jù)不穩(wěn)定,剔除第j+1天城市a和b的所有數(shù)據(jù);對所述通訊數(shù)據(jù)在n天內(nèi)的有效用戶總量的穩(wěn)定性進行檢驗的方法為:基于步驟(2),分別對工作日與休息日四組數(shù)據(jù)aj(0)、bj(0)做環(huán)比2日移動平均:當(dāng)表明城市a的工作日數(shù)據(jù)不穩(wěn)定,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市b的工作日數(shù)據(jù)不穩(wěn)定,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市a的休息日數(shù)據(jù)不穩(wěn)定,剔除第j+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市b的休息日數(shù)據(jù)不穩(wěn)定,剔除第j+1天城市a和b的所有數(shù)據(jù)。步驟(4)中所述雙向客流量的測算方法為:在一天的計時周期內(nèi),同一個手機用戶在城市a和b中的所述手機信令數(shù)據(jù)中均有記錄,且每次在城市a或b中的駐留時間均超過1小時以上,則識別該手機用戶為有效停留;手機用戶在城市a和b中停留時間的先后順序分為如下情況,均識別為雙向客流量的有效計次:計為1次的:a→b,或b→a;計為2次的:a→b→a,或b→a→b;…;計為2n-1次的:a→b→…→b,或b→a→…→a;計為2n次的:a→b→…→a,或b→a→…→b;基于上述有效計次,分別測算工作日和休息日每天城市a與城市b之間的雙向客流總量:工作日每天雙向客流量(工作日每天符合有效停留的有效計次);休息日每天雙向客流量(休息日每天符合有效停留的有效計次)。步驟(5)中所述交互通訊量的測算方法為:在滿足打電話雙方或是收發(fā)短信的雙方分別在城市a和城市b內(nèi)的情況下,進行城市a和b之間交互通訊的有效計次,有效計次包括如下情況:城市a和城市b內(nèi)的所有手機呼出電話次數(shù),包括城市a內(nèi)手機呼城市b內(nèi)手機或座機,城市b內(nèi)手機呼城市a內(nèi)手機或座機;城市a和城市b內(nèi)的所有接收非手機打來音訊電話次數(shù);城市a和城市b內(nèi)所有發(fā)出短信的次數(shù);基于上述有效計次,分別測算工作日和休息日每天城市a和b之間的交互通訊總量:工作日每天交互通訊量(工作日每天符合交互通訊的有效計次);休息日每天交互通訊量(休息日每天符合交互通訊的有效計次)。步驟(6)中的所述突發(fā)性檢查分為雙向客流量的突發(fā)性檢查和交互通訊量的突發(fā)性檢查;所述雙向客流量的突發(fā)性檢查的方法為:分別對工作日與休息日兩組數(shù)據(jù){f(1)}、{f(0)}做環(huán)比2日移動平均:當(dāng)表明城市a和b的工作日雙向客流量通不過所述雙向客流量的突發(fā)性檢查,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市a和b的休息日雙向客流量通不過所述雙向客流量的突發(fā)性檢查,剔除第j+1天城市a和b的所有數(shù)據(jù);所述交互通訊量的突發(fā)性檢查的方法為:分別對工作日與休息日兩組數(shù)據(jù){f(1)}、{f(0)}做環(huán)比2日移動平均:當(dāng)表明城市a和b的工作日交互通訊量通不過所述交互通訊量的突發(fā)性檢查,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市a和b的休息日交互通訊量通不過所述交互通訊量的突發(fā)性檢查,剔除第j+1天城市a和b的所有數(shù)據(jù)。步驟(7)中,所述信令數(shù)據(jù)有效用戶總量均值的計算方法如下:所述通訊數(shù)據(jù)有效用戶總量均值的計算方法如下:所述兩城雙向客流量均值的計算方法如下:所述兩城交互通訊量均值的計算方法如下:步驟(8)中城際人信綜合聯(lián)系強度的計算方法如下:(8.1)分別計算工作日和休息日的城際客流聯(lián)系強度:工作日城市a對于城市b的客流聯(lián)系強度休息日城市a對于城市b的客流聯(lián)系強度工作日城市b對于城市a的客流聯(lián)系強度休息日城市b對于城市a的客流聯(lián)系強度(8.2)分別計算工作日和休息日的城際通訊流強度:工作日城市a對于城市b的城際通訊流強度休息日城市a對于城市b的城際通訊流強度工作日城市b對于城市a的城際通訊流強度休息日城市b對于城市a的城際通訊流強度(8.3)計算城際客流聯(lián)系強度:城市a對于城市b的客流聯(lián)系強度城市b對于城市a的客流聯(lián)系強度(8.4)計算城際通訊流強度:城市a對于城市b的城際通訊流強度城市b對于城市a的城際通訊流強度(8.5)分別計算工作日和休息日城際人信綜合聯(lián)系強度:工作日城市a對于城市b的人信綜合聯(lián)系強度休息日城市a對于城市b的人信綜合聯(lián)系強度工作日城市b對于城市a的人信綜合聯(lián)系強度休息日城市b對于城市a的人信綜合聯(lián)系強度(8.6)計算城際人信綜合聯(lián)系強度:城市a對于城市b人信綜合聯(lián)系強度ia~b=ifa~b*80%+ifa~b*20%;城市b對于城市a人信綜合聯(lián)系強度ib~a=ifb~a*80%+ifb~a*20%。本發(fā)明的優(yōu)點是,充分依托現(xiàn)有的無線通信網(wǎng)絡(luò)信息資源,利用已有手機網(wǎng)絡(luò)中的時間、空間數(shù)據(jù),通過對工作日、休息日、兩城市雙向客流量、兩城市交互通訊量等各種維度的綜合測算,取得城際人信綜合聯(lián)系強度,實現(xiàn)低成本、高采樣、低誤測、高實效地獲取城際人信綜合聯(lián)系強度,其測算結(jié)果具有可比性、科學(xué)性、實用性和綜合性。附圖說明圖1為本發(fā)明中基于手機數(shù)據(jù)測算城際人信綜合聯(lián)系強度的方法流程框圖。具體實施方式以下結(jié)合附圖通過實施例對本發(fā)明的特征及其它相關(guān)特征作進一步詳細(xì)說明,以便于同行業(yè)技術(shù)人員的理解:實施例:如圖1所示,本實施例具體涉及一種基于手機數(shù)據(jù)測算城際人信綜合聯(lián)系強度的方法,該方法需要確定兩個待研究的城市,即城市a和b,以測算這兩個城市的人信綜合聯(lián)系強度,具體包括如下步驟:【步驟1】獲取一家手機網(wǎng)絡(luò)運營商分別在城市a和b的手機信令數(shù)據(jù)(簡稱信令數(shù)據(jù)),對于信令數(shù)據(jù)的條件要求為:a)時期相同,連續(xù)n天,n≥28,連續(xù)n天的數(shù)據(jù),必然包含至少20個工作日、4個周六、4個周日;b)信令數(shù)據(jù)必須包含手機用戶id、時間戳、位置戳等字段信息,并包括開關(guān)機、接打電話、收發(fā)短信、切換基站、上網(wǎng)下網(wǎng)、基站定時喚醒等事件類型。(步驟1.1)選取同期數(shù)據(jù)、分組:將兩個城市n天的數(shù)據(jù)分別分成兩組,一組為工作日(周一至周五)的數(shù)據(jù)a(1)、b(1),另一組為休息日(周六、日)的數(shù)據(jù)a(0)、b(0)。例如:城市a獲取數(shù)據(jù)起始日期為2016-11-19、最后日期為2016-12-22;城市b獲取數(shù)據(jù)起始日期為2016-11-18、最后日期為2016-12-20。首先,選取城市a與城市b同期的數(shù)據(jù),即取ab兩城日期同為2016-11-19至2016-12-20共32天的數(shù)據(jù)。然后將工作日與休息日的數(shù)據(jù)分組,分別整理如下:工作日城市a的數(shù)據(jù)日期為:(2016-11-21為周一)a11-21到a11-25、a11-28到a12-02、a12-05到a12-09、a12-12到a12-16、a12-19、a12-20(共22天);工作日城市b的數(shù)據(jù)日期為:b11-21到b11-25、b11-28到b12-02、b12-05到b12-11、b12-14到b12-18;休息日城市a的數(shù)據(jù)日期為:(2016-11-19為周六)a11-19、a11-20、a11-26、a11-27、a12-03、a12-04、a12-10、a12-11、a12-17、a12-18(共10天);休息日城市b的數(shù)據(jù)日期為:b11-19、b11-20、b11-26、b11-27、b12-03、b12-04、b12-10、b12-11、b12-17、b12-18。(步驟1.2)識別信令數(shù)據(jù)有效用戶:信令數(shù)據(jù)中的每個用戶記錄須滿足駐留時長可靠性條件,才可識別為當(dāng)天所在城市的有效用戶,該可靠性條件為:tzs-tzr≥120分鐘其中,tzs是指在一天計時周期內(nèi),用戶于所在城市的尾記錄的時間;tzr是指在一天計時周期內(nèi),用戶于所在城市的首記錄的時間;例如:日期2016-11-30,這一天為周三,是工作日,計算時間從該日凌晨00:00:00到夜里24:00:00。城市a的四個手機用戶分別為路人甲、乙、丙、丁,他們在城市a留下的信令數(shù)據(jù)記錄如下表:表(1):信令數(shù)據(jù)城市a用戶首尾記錄上表中,路人甲、路人乙和路人丁的tzs-tzr均大于或等于120分鐘,被識別為有效用戶,記錄到當(dāng)天有效用戶總量中,而路人丙的tzs-tzr由于小于120分鐘,故不被記錄到當(dāng)天有效用戶總量中。計算城市a當(dāng)日有效用戶總量=∑(所有被識別為有效用戶的數(shù)量)=2389541。(步驟1.3)對每天的信令數(shù)據(jù)有效用戶總量分別按工作日和休息日拼接成數(shù)列:對22個工作日城市a每天的有效用戶總量數(shù)據(jù)將其拼接成數(shù)列{a(1)},按日期進行先后的排列,如下表所示:i=1~22日期星期{a(1)}i=012016-11-21一2408223i=022016-11-22二2397954i=032016-11-23三1851336……i=082016-11-30三2389541……i=222016-12-20二2375648表(2):信令數(shù)據(jù)工作日城市a每天用戶總量同樣地,對10個休息日城市a每天的有效用戶總量數(shù)據(jù)aj(0),將其拼接成連續(xù)數(shù)列{a(0)},按日期先后進行排列,如下表所示:j=1~10日期星期{a(0)}j=012016-11-19六2356678j=022016-11-20日2349924j=032016-11-26六1691376……j=102016-12-18日2275483表(3):信令數(shù)據(jù)休息日城市a每天用戶總量同樣地,將工作日和休息日城市b的有效用戶每天總量也按上述步驟一一整理排序,組成連續(xù)數(shù)列{b(1)}、{b(0)}。【步驟2】獲取該家手機網(wǎng)絡(luò)運營商分別在城市a和b的通訊數(shù)據(jù),對于通訊數(shù)據(jù)的條件要求為:a)與步驟1獲取的信令數(shù)據(jù)的時期相同,連續(xù)n天,n≥28,連續(xù)n天的數(shù),必然包含至少20個工作日、4個周六、4個周日;b)通訊數(shù)據(jù)必須包含手機用戶id、時間戳、位置戳等字段信息,并包括打電話、接電話、發(fā)送短信、接收短信等事件類型。(步驟2.1)選取同期數(shù)據(jù)、分組:將兩個城市n天的數(shù)據(jù)分別分成兩組,一組為工作日(周一至周五)的數(shù)據(jù)a(1)、b(1),另一組為休息日(周六、日)的數(shù)據(jù)a(0)、b(0)。例如:城市a獲取數(shù)據(jù)起始日期為2016-11-15、最后日期為2016-12-28;城市b獲取數(shù)據(jù)起始日期為2016-11-14、最后日期為2016-12-21。對照步驟1.1信令數(shù)據(jù)的日期,選取同期的數(shù)據(jù),即取ab兩城日期同為2016-11-19至2016-12-20共32天的數(shù)據(jù)。其中工作日22個,休息日10個。然后將工作日與休息日的數(shù)據(jù)分組,分別整理如下:工作日城市a的數(shù)據(jù)日期為:(2016-11-21為周一)a11-21到a11-25、a11-28到a12-02、a12-05到a12-09、a12-12到a12-16、a12-19、a12-20(共22天);工作日城市b的數(shù)據(jù)日期為:b11-21到b11-25、b11-28到b12-02、b12-05到b12-11、b12-14到b12-18。休息日城市a的數(shù)據(jù)日期為:(2016-11-19為周六)a11-19、a11-20、a11-26、a11-27、a12-03、a12-04、a12-10、a12-11、a12-17、a12-18(共10天);休息日城市b的數(shù)據(jù)日期為:b11-19、b11-20、b11-26、b11-27、b12-03、b12-04、b12-10、b12-11、b12-17、b12-18。(步驟2.2)識別通訊數(shù)據(jù)有效用戶通訊數(shù)據(jù)中的有效用戶必須滿足通訊活躍性條件,即一個用戶在某一天某個城市的通訊數(shù)據(jù)顯示有“打電話、接電話、發(fā)送短信、接收短信”其中的任何一個數(shù)據(jù)記錄,才識別為當(dāng)天該城市的有效用戶。例如:日期2016-12-17,這一天為周六,是休息日,計算時間從該日凌晨00:00:00到夜里24:00:00。城市b的四個手機用戶分別為路人#1、#2、#3、#4,他們在城市b留下的通訊數(shù)據(jù)記錄如下表:表(4):通訊數(shù)據(jù)城市b用戶記錄上表中,路人#1、路人#3和路人#4當(dāng)天有符合條件的通訊數(shù)據(jù)記錄,被識別為有效用戶,記錄到當(dāng)天有效用戶總量b(0)中。路人#2由于沒有任何記錄,故不被記錄到當(dāng)天用戶總量。計算城市b當(dāng)日有效用戶總量=∑(所有被識別為有效用戶的數(shù)量)=1253216。(步驟2.3)對每天的通訊數(shù)據(jù)有效用戶總量分別按工作日和休息日拼接成數(shù)列:對10個休息日城市b每天的有效用戶總量bj(0),將其拼接成連續(xù)數(shù)列{b(0)},按日期先后進行排列,如下表所示:j=1~10日期星期{b(0)}j=012016-11-19六1262283j=022016-11-20日1260305j=032016-11-26六1257495j=042016-11-27日651373……j=092016-12-17六1253216j=102016-12-18日1251638表(5):通訊數(shù)據(jù)休息日城市b每天用戶總量同樣地,對22個工作日城市b每天的有效用戶總量數(shù)據(jù)將其拼接成連續(xù)數(shù)列{b(1)},按日期先后進行排列,如下表所示:i=1~22日期星期{b(1)}1=012016-11-21一1356656i=022016-11-22二1349938……i=072016-11-29二891344……i=222016-12-20二1375664表(6):通訊數(shù)據(jù)工作日城市b每天用戶總量同樣地,將城市a的有效用戶每天總量也按上述步驟一一整理排序,組成連續(xù)數(shù)列{a(1)}、{a(0)}?!静襟E3】經(jīng)過步驟1、步驟2獲取、識別和測算所得到的數(shù)據(jù),必須檢測手機數(shù)據(jù)的穩(wěn)定性和連續(xù)性。(步驟3.1)信令數(shù)據(jù)有效用戶總量的穩(wěn)定性檢驗:基于步驟1,分別對工作日與休息日的四組數(shù)據(jù){a(1)}、{b(1)}、{a(0)}、{b(0)}做環(huán)比2日移動平均:當(dāng)表明城市a的工作日數(shù)據(jù)不穩(wěn)定,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市b的工作日數(shù)據(jù)不穩(wěn)定,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市a的休息日數(shù)據(jù)不穩(wěn)定,剔除第j+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市b的休息日數(shù)據(jù)不穩(wěn)定,剔除第j+1天城市a和b的所有數(shù)據(jù);由表(2),經(jīng)檢測:表明城市a的11月23日(工作日i=3對應(yīng)日期)的數(shù)據(jù)不穩(wěn)定,因此,對應(yīng)11月23日整天的數(shù)據(jù)應(yīng)當(dāng)剔除。由表(3),經(jīng)檢測:表明城市a的11月26日(休息日j=3對應(yīng)日期)的數(shù)據(jù)不穩(wěn)定,因此,對應(yīng)11月26日整天的數(shù)據(jù)應(yīng)當(dāng)剔除。同理,由于城市b的11月30日、12月17日的數(shù)據(jù)都不符合穩(wěn)定性檢測,應(yīng)當(dāng)剔除。(布置3.2)通訊數(shù)據(jù)有效用戶總量的穩(wěn)定性檢驗:基于步驟2,分別對工作日與休息日四組數(shù)據(jù)aj(0)、bj(0)做環(huán)比2日移動平均:當(dāng)表明城市a的工作日數(shù)據(jù)不穩(wěn)定,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市b的工作日數(shù)據(jù)不穩(wěn)定,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市a的休息日數(shù)據(jù)不穩(wěn)定,剔除第j+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市b的休息日數(shù)據(jù)不穩(wěn)定,剔除第j+1天城市a和b的所有數(shù)據(jù)。由表(5),經(jīng)檢測:表明城市b的11月27日(休息日j=4對應(yīng)日期)的數(shù)據(jù)不穩(wěn)定,因此,對應(yīng)11月27日整天的數(shù)據(jù)應(yīng)當(dāng)剔除。由表(6),經(jīng)檢測:表明城市b的11月29日(工作日j=7對應(yīng)日期)的數(shù)據(jù)不穩(wěn)定,因此,對應(yīng)11月29日整天的數(shù)據(jù)應(yīng)當(dāng)剔除。同理,按以上方法經(jīng)檢測、由于城市a的12月13日、15日的數(shù)據(jù)都不符合穩(wěn)定性檢測,應(yīng)當(dāng)剔除。(步驟3.3)連續(xù)性檢驗:經(jīng)過穩(wěn)定性檢驗、剔除不符合條件的日期后,從剩下的天數(shù)中挑選,挑選條件必須滿足:ab兩城時期同步、日期連續(xù)、天數(shù)大于等于7天的數(shù)據(jù)(舍棄其余不連續(xù)日期的所有數(shù)據(jù))。經(jīng)過步驟3.1和步驟3.2的穩(wěn)定性檢驗,日期2016-11-23、26、27、29、30和2016-12-13、15、17的數(shù)據(jù)被剔除,剩下的日期中2016-11-19、20、21、22和2016-12-14、18、19、20的數(shù)據(jù)雖然通過了穩(wěn)定性檢驗,但是日期連續(xù)都不超過7天,應(yīng)當(dāng)舍棄。最后僅有日期2016-12-01到12-12連續(xù)12天數(shù)據(jù)是符合要求的,整理得到如下各組數(shù)據(jù):aj(0)、bj(0)、aj(0)、bj(0);其中,i≥5,j≥2,并且i和j在日歷表上是連續(xù)的,這種連續(xù)可以從一周的任何一天開始,并保證連續(xù)7天以上,工作日、休息日與對應(yīng)日期連續(xù)排列,詳見下表:i=1~8日期星期i=12016-12-01四i=22016-12-02五i=32016-12-05一……i=72016-12-09五i=82016-12-12一表(7):工作日與對應(yīng)日期連續(xù)排列表j=1~4日期星期j=12016-12-03六j=22016-12-04日j=32016-12-10六j=42016-12-11日表(8):休息日與對應(yīng)日期連續(xù)排列表表(7)和表(8)分別是通過有效性、連續(xù)性檢測后得到的工作日和休息日的連續(xù)12天的數(shù)據(jù),其中,工作日有8個,休息日有4個,且從2016-12-01至2016-12-12日的日期是連續(xù)的?!静襟E4】在步驟1、步驟3的基礎(chǔ)上,進一步識別、測算城市a和城市b之間的(基于信令數(shù)據(jù)的)工作日和休息日的雙向客流量客流量以人次計;其步驟如下:(步驟4.1)識別有效停留:在一天中,同一個手機用戶在城市a和城市b的信令數(shù)據(jù)中均有記錄(表示該手機用戶去過ab兩城),并且每次在城市a或者城市b的駐留時間均超過1小時以上,才識別為有效停留。對于每一用戶的有效停留條件為:tls-tlr≥60分鐘tls:在一次停留城市內(nèi),一個用戶的尾記錄的時間;tlr:在一次停留城市內(nèi),一個用戶的首記錄的時間;例如:日期2016-12-06(工作日),某些手機用戶有甲、丁,他們分別在城市a和城市b留下的數(shù)據(jù)記錄如下表:表(9):2016-12-06用戶甲在ab兩城的有效停留表表(10):2016-12-06用戶丁在ab兩城的有效停留表(步驟4.2)識別雙向客流量的有效計次:滿足上述條件情況,用戶甲和丁被識別為該手機用戶在城市a或b有效停留。按照一個手機用戶在城市a與城市b中停留時間的先后順序有如下排列情況,均識別為雙向客流量的有效計次:計為1次的:a→b,或b→a;計為2次的:a→b→a,或b→a→b;…;計為2n-1次的:a→b→…→b,或b→a→…→a;計為2n次的:a→b→…→a,或b→a→…→b;n≥2;1、2n-1為奇數(shù)次停留計次,2、2n為偶數(shù)次停留計次。因此上述排列情況已經(jīng)涵蓋了所有可能發(fā)生的有效計次,沒有遺漏。)根據(jù)表(9)和表(10),按照上述方法,測算出用戶甲的有效計次為3次、用戶丁的有效計次為2次。(步驟4.3)測算每天ab兩城雙向客流總量:基于上述有效計次,分別測算工作日和休息日每天城市a與城市b之間的雙向客流總量:工作日每天雙向客流量(工作日每天符合有效停留的有效計次)休息日每天雙向客流量(休息日每天符合有效停留的有效計次)經(jīng)過測算工作日、休息日ab兩城雙向客流每天總量如下兩表:表(11):工作日與對應(yīng)日期雙向客流量測算表表(12):休息日與對應(yīng)日期雙向客流量測算表【步驟5】在步驟2、步驟3的基礎(chǔ)上,識別、測算城市a和城市b之間的(基于通訊數(shù)據(jù)的)工作日和休息日的交互通訊量交互通訊量以人次計。(步驟5.1)識別交互通訊:ab兩城之間,每次交互通訊必須滿足以下識別條件:打電話的雙方必須分別在城市a和城市b兩地(包含雙方都是手機用戶或者其中一方是手機用戶的情況),并且每次通話時間在6秒鐘(包含)以上,或者收發(fā)短信的雙方必須分別在城市a和城市b兩地。tch≥6秒鐘,其中,tch為通話時長。例如:日期2016-12-10(休息日),某些手機用戶有#1、#4,在與另一個城市進行點對點通訊留下的通訊數(shù)據(jù)記錄分別如下表:表(13):2016-12-10用戶#1在ab兩城的通訊數(shù)據(jù)記錄表(14):2016-12-10用戶#4在ab兩城的通訊數(shù)據(jù)記錄(步驟5.2)識別有效計次:滿足上述條件情況下,在識別有效計次時應(yīng)當(dāng)剔除重復(fù)計次也不能減漏計次,具體做法是根據(jù)通訊數(shù)據(jù)記錄,對如下情形,均為識別為有效計次:城市a+城市b的所有手機呼出電話次數(shù)(包括a城手機呼b城手機或座機,b城手機呼a城手機或座機);城市a+城市b的所有接收非手機打來音訊電話次數(shù);城市a+城市b的所有發(fā)出短信次數(shù)。(“城市a+城市b的所有接收手機打來電話次數(shù)”和“城市a+城市b的所有接收短信次數(shù)”與前者統(tǒng)計重復(fù),所以不再計次)根據(jù)表(13)和表(14),識別有效計次如下表:表(15):2016-12-10用戶#1在ab兩城的通訊數(shù)據(jù)的有效記錄表(16):2016-12-10用戶#4在ab兩城的通訊數(shù)據(jù)的有效記錄根據(jù)表(15)和表(16),按照上述方法,測算出用戶#1的有效計次為3次、用戶#4的有效計次為1次。步驟(5.3)測算每天ab兩城交互通訊總量:工作日每天交互通訊量(工作日每天符合交互通訊的有效計次);休息日每天交互通訊量(休息日每天符合交互通訊的有效計次)。經(jīng)過測算工作日休息日ab兩城交互通訊每天總量如下兩表:i=1~8日期星期fi(1)i=12016-12-01四72453i=22016-12-02五72756i=32016-12-05一68351……i=72016-12-09五72376i=82016-12-12一112656表(17):工作日與對應(yīng)日期交互通訊量測算表j=1~4日期星期fj(0)j=12016-12-03六66436j=22016-12-04日65376j=32016-12-10六65516j=42016-12-11日65890表(18):休息日與對應(yīng)日期交互通訊量測算表【步驟6】雙向客流量和交互通訊量的突發(fā)性檢測:當(dāng)ab兩城或其中一個城市發(fā)生重大事件(如國際會議、全國比賽等等),數(shù)據(jù)量出現(xiàn)反常,會干擾雙向客流量和交互通訊量的最后結(jié)果。因此要進行突發(fā)性檢驗。當(dāng)同為工作日或同為休息日的雙向客流量相差大于10%,或者當(dāng)同為工作日或同為休息日的交互通訊量相差大于15%,表明數(shù)據(jù)不穩(wěn)定、或者有突發(fā)事件干擾,剔除對應(yīng)這一天的所有數(shù)據(jù)?;诓襟E4、步驟5獲取、識別和測算所得到的數(shù)據(jù),進行突發(fā)性檢驗,具體步驟如下:(步驟6.1)雙向客流量的突發(fā)性檢測:基于步驟4,分別對工作日與休息日兩組數(shù)據(jù){f(1)}、{f(0)}做環(huán)比2日移動平均:當(dāng)表明城市a和b的工作日雙向客流量通不過所述雙向客流量的突發(fā)性檢查,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市a和b的休息日雙向客流量通不過所述雙向客流量的突發(fā)性檢查,剔除第j+1天城市a和b的所有數(shù)據(jù)。由表(11)、表(12),經(jīng)檢測:表明ab兩城市12月2日(工作日第i=2天對應(yīng)日期)的雙向客流量通不過數(shù)據(jù)突發(fā)性檢驗,剔除12月2日a、b兩城的所有數(shù)據(jù)。(步驟6.2)交互通訊量的突發(fā)性檢驗:基于步驟5,分別對工作日與休息日兩組數(shù)據(jù){f(1)}、{f(0)}做環(huán)比2日移動平均:當(dāng)表明城市a和b的工作日交互通訊量通不過所述交互通訊量的突發(fā)性檢查,剔除第i+1天城市a和b的所有數(shù)據(jù);當(dāng)表明城市a和b的休息日交互通訊量通不過所述交互通訊量的突發(fā)性檢查,剔除第j+1天城市a和b的所有數(shù)據(jù)。由表(17)、表(18),經(jīng)檢測:表明ab兩城市12月12日(工作日第i=8天對應(yīng)日期)的交互通訊量通不過數(shù)據(jù)突發(fā)性檢驗,剔除12月12日(工作日第i=8天)a、b兩城的所有數(shù)據(jù)。(步驟6.3)連續(xù)性檢驗和數(shù)據(jù)整理:經(jīng)過突發(fā)性檢驗、剔除不符合條件日期的數(shù)據(jù)后,從剩下的天數(shù)中挑選,條件必須滿足:ab兩城時期同步、日期連續(xù)、天數(shù)等于7天的數(shù)據(jù)(舍棄其余日期的所有數(shù)據(jù)),整理得到如下各組數(shù)據(jù):aj(0)、bj(0)、aj(0)、bj(0)、其中,i=1~5,j=1~2,并且i和j在日歷表上是連續(xù)的7天(5個工作日和2個休息日,也稱為全周期)。經(jīng)過步驟6.1和步驟6.2,現(xiàn)有符合條件的連續(xù)數(shù)據(jù)的共有9天,即2016-12-03至2016-12-11,其中日期12-03、12-04、12-10、12-11為周六、周日,其余為工作日。因此,我們選定2016-12-03至2016-12-09這7天的數(shù)據(jù)做樣本(符合5個工作日和2個休息日,并且7天日期是連續(xù)的要求),也稱為全周期?,F(xiàn)將7天的數(shù)據(jù)整理成下表:表(19):突發(fā)性檢測和連續(xù)性檢測后的7天數(shù)據(jù)【步驟7】整理城際人信綜合聯(lián)系強度測算的基礎(chǔ)數(shù)據(jù),包括信令數(shù)據(jù)有效用戶總量均值通訊數(shù)據(jù)有效用戶總量均值兩城雙向客流量均值兩城交互通訊量均值(步驟7.1)計算整理ab兩城的信令數(shù)據(jù)有效用戶總量均值:根據(jù)步驟1、3、4、6,分別測算城市a和城市b的工作日和休息日的信令數(shù)據(jù)有效用戶總量均值具體如下:(式01)城市a工作日用戶總量均值(式02)城市a休息日用戶總量均值a(0)(式03)城市b工作日用戶總量均值(式04)城市b休息日用戶總量均值(步驟7.2)計算整理ab兩城的通訊數(shù)據(jù)有效用戶總量均值:根據(jù)步驟2、3、5、6,分別測算城市a和城市b的工作日和休息日的通訊數(shù)據(jù)有效用戶總量均值具體如下:(式05)城市a工作日用戶總量均值(式06)城市a休息日用戶總量均值(式07)城市b工作日用戶總量均值(式08)城市b休息日用戶總量均值(步驟7.3)計算整理ab兩城的雙向客流量均值:根據(jù)步驟1、3、4、6,分別測算工作日和休息日的兩城雙向客流量均值具體如下:(式09)工作日雙向客流量均值(式10)休息日雙向客流量均值(步驟7.4)計算整理ab兩城的交互通訊量均值:根據(jù)步驟2、3、5、6,分別測算工作日和休息日的兩城交互通訊量均值具體如下:(式11)工作日交互通訊量均值(式12)休息日交互通訊量均值【步驟8】根據(jù)步驟7,計算各種城際人信綜合聯(lián)系強度,分別如下:(步驟8.1)工作日和休息日的客流聯(lián)系強度:考慮到城際聯(lián)系的復(fù)雜性、研究使用的廣泛性,我們從單一因子的城際聯(lián)系強度到多因子城際聯(lián)系強度,作了詳細(xì)計算。并且,多因子城際聯(lián)系強度更能綜合地、真實地反映城市之間聯(lián)系的密切性如何。單一因子是指僅考慮工作日或者休息日某一種“流”的大小,例如工作日城市a對于城市b的客流聯(lián)系強度,又例如休息日城市b對于城市a的通訊量聯(lián)系強度等等,都是指單一因子的城際聯(lián)系強度。多因子聯(lián)系強度是指綜合考慮工作日與休息日以后的聯(lián)系強度,還有綜合考慮雙向客流與交互通訊流以后的聯(lián)系強度,以及考慮工作日、休息日、雙向客流、交互通訊流所有因子的城際聯(lián)系強度。根據(jù)(式01)~(式04)、(式09)、(式10),分別計算工作日和休息日城際客流聯(lián)系強度,如下:(式13)工作日城市a對于城市b的客流聯(lián)系強度(式14)休息日城市a對于城市b的客流聯(lián)系強度(式15)工作日城市b對于城市a的客流聯(lián)系強度(式16)休息日城市b對于城市a的客流聯(lián)系強度(步驟8.2)根據(jù)(式05)~(式08)、(式11)、(式12),分別計算工作日和休息日城際通訊流聯(lián)系強度,即工作日和休息日的通訊流聯(lián)系強度單獨計算,如下:(式17)工作日城市a對于城市b的通訊流聯(lián)系強度(式18)休息日城市a對于城市b的通訊流聯(lián)系強度(式19)工作日城市b對于城市a的通訊流聯(lián)系強度(式20)休息日城市b對于城市a的通訊流聯(lián)系強度步驟8.1和8.2所計算的城際聯(lián)系強度,是區(qū)分了工作日和休息日以后的單一聯(lián)系強度,因此還有必要綜合考慮工作日與休息日合并起來后的城際聯(lián)系強度。(步驟8.3)工作日和休息日合并在一起計算客流聯(lián)系強度:根據(jù)(式13)~(式16),計算城際客流聯(lián)系強度,如下:(式21)城市a對于城市b的客流聯(lián)系強度ifa~b(式22)城市b對于城市a的客流聯(lián)系強度ifb~a(步驟8.4)工作日和休息日合并在一起計算通訊流聯(lián)系強度:根據(jù)(式17)~(式20),計算城際通訊流聯(lián)系強度,如下:(式23)城市a對于城市b的通訊流聯(lián)系強度ifa~b(式24)城市b對于城市a的通訊流聯(lián)系強度ifb~a(步驟8.5)單獨計算工作日和休息日的客流與通訊流綜合聯(lián)系強度:根據(jù)(式13)~(式20)式,分別計算工作日和休息日城際人信綜合聯(lián)系強度,如下:(式25)工作日城市a對于城市b的人信綜合聯(lián)系強度(式26)休息日城市a對于城市b的人信綜合聯(lián)系強度(式27)工作日城市b對于城市a的人信綜合聯(lián)系強度(式28)休息日城市b對于城市a的人信綜合聯(lián)系強度(步驟8.6)根據(jù)(式21)~(式24),計算城際人信綜合聯(lián)系強度,如下:(式29)城市a對于城市b人信綜合聯(lián)系強度ia~b=ifa~b*80%+ifa~b*20%=0.03636*80%+0.03193*20%=0.0355(式30)城市b對于城市a人信綜合聯(lián)系強度ib~a=ifb~a*80%+ifb~a*20%=0.05756*80%+0.05161*20%=0.0564其中,(式29)就是綜合考慮了工作日、休息日、雙向客流、交互通訊流四個因子的城市a對于城市b的人信綜合聯(lián)系強度。(式30)就是綜合考慮了工作日、休息日、雙向客流、交互通訊流四個因子的城市b對于城市a的人信綜合聯(lián)系強度。聯(lián)系強度越大,表示兩個城市之間的聯(lián)系越緊密。隨著現(xiàn)代城市經(jīng)濟的發(fā)展,城際聯(lián)系是不可或略的研究熱點,通過對城際聯(lián)系強度的描述,研究者可以輕松把握城市之間的聯(lián)系密切性,從而了解城際發(fā)展的內(nèi)在聯(lián)系。有了強度,就可以建立聯(lián)系標(biāo)準(zhǔn)的分類,進而可以幫助研究城際聯(lián)系強度大小數(shù)值的分類標(biāo)準(zhǔn),例如:0<i<0.01為微弱聯(lián)系,0.01≤i<0.03為一般聯(lián)系,0.03≤i<0.06為緊密聯(lián)系,i≥0.06以上為同城化聯(lián)系,等等。i為兩城之間的人信綜合聯(lián)系強度,例如:ia~b=0.028,ib~a=0.056,表明對于城市a來講,兩城的聯(lián)系緊密性為一般聯(lián)系,對于城市b來講,兩城的聯(lián)系緊密性為緊密聯(lián)系,也就是城市b更加依附于城市a。不同性質(zhì)的城市,表現(xiàn)出的城際聯(lián)系強度特征也不一樣。例如旅游城市的休息日聯(lián)系強度會大于工作日的聯(lián)系強度,此時可以用單一因子聯(lián)系強度更有助于分析旅游城市的城際聯(lián)系特征。由于工作日與周末是兩種不同的時期,城際的客流與通訊流會有不同的特征,上述各種強度分別表征了在不同時期的城際客流與通訊流,并依據(jù)這種特點對城際聯(lián)系強度進行綜合考量,最后測算出城際人信綜合聯(lián)系強度。過程中還包括了基于工作日、周末、兩城市雙向客流量、兩城市交互通訊量等四種不同角度測算城際聯(lián)系強度,使得這些強度更廣泛地適用于各種不同領(lǐng)域?qū)Τ请H聯(lián)系的研究。其中,(式13)~(式16)為單因子客流聯(lián)系強度,(式17)~(式20)為單因子通訊流聯(lián)系強度;(式21)、(式22)為全周期客流聯(lián)系強度,(式23)、(式24)為全周期通訊流聯(lián)系強度;(式25)~(式28)為區(qū)分工作日、休息日的城際人信綜合聯(lián)系強度;(式29)為城市a對于城市b人信綜合聯(lián)系強度,(式30)為城市b對于城市a人信綜合聯(lián)系強度。當(dāng)前第1頁12
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1