本發(fā)明屬于信息可視化領(lǐng)域,具體涉及一種針對(duì)手機(jī)基站定位數(shù)據(jù)的可視分析系統(tǒng)及方法,用于觀察城市中人群的空間分布狀況以及人群流動(dòng)情況,以實(shí)現(xiàn)對(duì)某地區(qū)進(jìn)行人流監(jiān)控以及規(guī)律分析。
背景技術(shù):
:我國(guó)是世界上人口最多的國(guó)家,隨著大數(shù)據(jù)時(shí)代的到來(lái)和智慧城市的提出,如何合理的監(jiān)控、引導(dǎo)和預(yù)警大城市或超大城市人口流動(dòng)狀況,提高市民的生活質(zhì)量,預(yù)警特定高密度人口流動(dòng)區(qū)域異常事件的發(fā)生,已成為一個(gè)亟待解決的實(shí)用性課題。隨著手機(jī)等移動(dòng)終端的普及,人們從移動(dòng)通信網(wǎng)絡(luò)中收集了到大量的數(shù)據(jù)。手機(jī)定位數(shù)據(jù)作為移動(dòng)通信網(wǎng)絡(luò)數(shù)據(jù)中的一類,在分析人群移動(dòng)模式、城市功能區(qū)識(shí)別以及交通網(wǎng)絡(luò)規(guī)劃中都提供了很大的幫助。目前,相關(guān)領(lǐng)域的很多專家學(xué)者都在關(guān)注如何利用從移動(dòng)通信網(wǎng)絡(luò)中獲取的數(shù)據(jù)來(lái)進(jìn)行可視化研究。在數(shù)據(jù)可視化中,基于點(diǎn)的可視化重點(diǎn)考慮離散的個(gè)體,可以直接顯示物體在某一時(shí)間點(diǎn)的位置?;邳c(diǎn)的表示方法的優(yōu)勢(shì)是能夠使用戶直接觀察到數(shù)據(jù)中的每一個(gè)個(gè)體,但是當(dāng)數(shù)據(jù)量非常龐大時(shí),過多的點(diǎn)會(huì)造成畫面中相互遮擋和不清楚的問題?,F(xiàn)有的流向圖是表示物體從一個(gè)地方到另一個(gè)地方的移動(dòng),在地圖上的區(qū)域之間直接繪制有向邊,并用邊的寬度或顏色等表示流量大小。傳統(tǒng)的流向圖直接將所有軌跡繪制在地圖上,會(huì)造成軌跡間相互遮擋覆蓋和不清晰問題。selassied等在2011年提出了邊捆綁的方法,通過彎曲邊讓相似的邊相互靠近形成一束,以減少相互遮擋。盡管邊捆綁可以減少混亂問題,但是在兩個(gè)位置之間識(shí)別實(shí)際的連接方向是很困難的?;谑謾C(jī)基站定位的數(shù)據(jù)集紀(jì)錄了每個(gè)手機(jī)用戶在不同時(shí)刻出現(xiàn)的位置,但從個(gè)人的軌跡數(shù)據(jù)中,很難看出整個(gè)城市的整體人群流動(dòng)情況?,F(xiàn)有的一些基于手機(jī)定位數(shù)據(jù)的可視分析系統(tǒng),能夠分析出不同時(shí)間段的人群密度,人群流向等特征,但無(wú)法展示出每個(gè)基站特有的人群流動(dòng)模式,以及人群移動(dòng)模式隨時(shí)間的變化。綜上所述,在對(duì)手機(jī)定位數(shù)據(jù)可視化中,通過有效的聚類算法可以避免大量數(shù)據(jù)造成的畫面不清晰;通過對(duì)數(shù)據(jù)集進(jìn)行基于空間上的簡(jiǎn)化和時(shí)間上的簡(jiǎn)化,可以有針對(duì)性的對(duì)城市中不同區(qū)域、不同時(shí)間段的人群移動(dòng)模式進(jìn)行可視化。技術(shù)實(shí)現(xiàn)要素:本發(fā)明技術(shù)解決問題,克服現(xiàn)有技術(shù)的不足,提供一種針對(duì)手機(jī)基站定位數(shù)據(jù)的可視分析系統(tǒng)及方法,通過采用結(jié)合基于空間簡(jiǎn)化和時(shí)間簡(jiǎn)化的可視化技術(shù),從多個(gè)角度展示手機(jī)基站定位數(shù)據(jù)中包含的大量信息,通過采用結(jié)合基于空間簡(jiǎn)化和時(shí)間簡(jiǎn)化的可視化方法,對(duì)城市中的人群流動(dòng)情況進(jìn)行可視化。本發(fā)明技術(shù)解決方案:一種面向手機(jī)定位數(shù)據(jù)的可視分析系統(tǒng),包括數(shù)據(jù)預(yù)處理模塊和可視化模塊。所述數(shù)據(jù)預(yù)處理模塊:可分為數(shù)據(jù)清洗和數(shù)據(jù)統(tǒng)計(jì)兩個(gè)步驟。數(shù)據(jù)清洗是整套手機(jī)基站定位數(shù)據(jù)的基礎(chǔ),其主要功能為:剔除原始數(shù)據(jù)集中信息不完整有缺失的數(shù)據(jù),例如基站經(jīng)緯度缺失的數(shù)據(jù);同時(shí)清理會(huì)對(duì)后續(xù)可視化有干擾的信息,例如在手機(jī)基站定位數(shù)據(jù)中影響最大的“乒乓效應(yīng)”。數(shù)據(jù)統(tǒng)計(jì)是在數(shù)據(jù)清洗后,為了后續(xù)可視化的需要,對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,根據(jù)信令產(chǎn)生時(shí)間,選擇一段特定時(shí)間作為固定的時(shí)間步,統(tǒng)計(jì)每個(gè)時(shí)間步每個(gè)基站內(nèi)的人數(shù),以及該基站到其他基站的流入、流出人數(shù)。所述可視化模塊:可分為基站可視化、基站間人群流向可視化、基于基站的人群流動(dòng)模式可視化和基于時(shí)間步的人群流動(dòng)模式可視化?;究梢暬歉鶕?jù)數(shù)據(jù)集中基站的經(jīng)緯度,將基站用圖標(biāo)在地圖上展示出來(lái)。由于基站數(shù)量多,直接顯示會(huì)造成地圖上圖標(biāo)過于密集,因此采用一種基于地圖分辨率的層次聚類算法對(duì)基站進(jìn)行聚類后,根據(jù)地圖分辨率直接展示基站聚類后的結(jié)果?;鹃g人群流向可視化采用流向圖展示,該部分用于可視化基站間人群流動(dòng)情況,用線條的粗細(xì)表示人群流量的大小。基于基站的人群流動(dòng)模式可視化,用于展示每個(gè)基站聚類在一天中的人群流動(dòng)情況,用南丁格爾玫瑰圖展示一天中各個(gè)時(shí)間段的人數(shù)變化情況?;跁r(shí)間步的人群流動(dòng)模式可視化,用于展示不同時(shí)間步之間的關(guān)系,對(duì)于每個(gè)時(shí)間步,采用基站間的流量作為特征向量,構(gòu)建每個(gè)時(shí)間步的特征矩陣,并對(duì)此進(jìn)行聚類,聚為一類的時(shí)間步表示這些時(shí)間段內(nèi),城市中人群流動(dòng)的模式較為相似,并采用圓環(huán)圖對(duì)其進(jìn)行可視化。一種針對(duì)手機(jī)基站定位數(shù)據(jù)的可視分析方法,使用基于地圖比例尺的層次聚類算法對(duì)基站進(jìn)行聚類,根據(jù)人群密度或流向分別采用不同的可視化方案。數(shù)據(jù)預(yù)處理模塊實(shí)現(xiàn)過程如下:a對(duì)基于手機(jī)基站定位的原始數(shù)據(jù)集(包括手機(jī)用戶的唯一標(biāo)識(shí)、經(jīng)緯度和時(shí)間信息,由于數(shù)據(jù)量很大往往存儲(chǔ)在分布式數(shù)據(jù)倉(cāng)庫(kù)中,例如hive數(shù)據(jù)倉(cāng)庫(kù)),在取出數(shù)據(jù)導(dǎo)入本地文件時(shí),進(jìn)行數(shù)據(jù)預(yù)處理,包括:a1)針對(duì)基站信息數(shù)據(jù)集,將基站地點(diǎn)經(jīng)緯度缺失的數(shù)據(jù)清除;a2)針對(duì)手機(jī)定位數(shù)據(jù)集,消除數(shù)據(jù)中出現(xiàn)的“乒乓效應(yīng)”。所謂乒乓效應(yīng),在數(shù)據(jù)表中的表現(xiàn)就是同一個(gè)用戶在一段很短的時(shí)間內(nèi)(此處設(shè)定為10分鐘),反復(fù)在兩個(gè)或多個(gè)基站間頻繁切換的現(xiàn)象。得到清理后的數(shù)據(jù)集,根據(jù)后續(xù)可視化的需要,對(duì)其進(jìn)行統(tǒng)計(jì)處理,包括:a3)選擇一個(gè)固定的時(shí)間步,例如60分鐘,計(jì)算每個(gè)時(shí)間步中各個(gè)基站的人數(shù)bn={bn1,bn2,…,bnm}(時(shí)間步個(gè)數(shù)為n,基站個(gè)數(shù)為m);a4)計(jì)算每個(gè)時(shí)間步中,各個(gè)基站的人群流動(dòng)情況,即每個(gè)基站到其他基站的流出人數(shù)bfi,j,例如從基站c1到基站c2的流出人數(shù)為bf1,2,從基站c2到基站c1的流出人數(shù)為bf2,1??梢暬K,具體包括以下步驟:b根據(jù)上述處理后的數(shù)據(jù)集進(jìn)行可視化,包括如下操作:基站可視化具體實(shí)現(xiàn)如下:b1)根據(jù)不同的地圖分辨率r={r1,r2,…,rn},設(shè)置不同的地圖縮放級(jí)別l={l1,l2,…,ln},展示不同分別率的地圖。設(shè)計(jì)一種基于地圖分別率的層次聚類算法,對(duì)基站進(jìn)行聚類。針對(duì)上述基于地圖分辨率的層次聚類算法,該算法是對(duì)凝聚層次聚類算法的擴(kuò)展。所述聚類算法描述如下:step1:有m個(gè)基站,設(shè)b={b1,b2,…,bm}為所有基站的集合。設(shè)置n個(gè)地圖縮放級(jí)別,以下簡(jiǎn)稱為n層,每層對(duì)應(yīng)的分辨率r={r1,r2,…,rn}。設(shè)置一個(gè)常量c,每層的聚類間最小距離di=c*ri,即距離超過di的基站將不聚為一類。設(shè)每層的聚類結(jié)果為h={h1,h2,…,hn},hi是在第i層的聚類結(jié)果。初始化h為空集。step2:計(jì)算第1層的最大相似距離d1=c*r1,采用凝聚層次聚類算法對(duì)b進(jìn)行聚類。對(duì)初始的基站集合b中m個(gè)基站作為m個(gè)簇,將距離小于d1的最近的兩個(gè)簇聚為一類,然后更新集合b,此時(shí)集合內(nèi)簇的個(gè)數(shù)為m-1;對(duì)更新的集合b中繼續(xù)將距離小于d1的最近的兩個(gè)簇聚為一類,再更新集合b,此時(shí)集合內(nèi)簇的個(gè)數(shù)為m-2;重復(fù)上述步驟,直至所有簇間距離均大于d1。最終聚類結(jié)果為h1;step3:計(jì)算第2層的最大相似距離d2=c*r2,采用相同凝聚層次聚類算法算法對(duì)上一層的結(jié)果h1進(jìn)行聚類,結(jié)果為h2;step4:計(jì)算第i層的最大相似距離di=c*ri,采用相同凝聚層次聚類算法算法對(duì)上一層的結(jié)果hi-1進(jìn)行聚類,結(jié)果為hi;step5:重復(fù)step4直到得到所有層的聚類結(jié)果。b2)在地圖上根據(jù)不同的縮放級(jí)別對(duì)基站進(jìn)行可視化,包括如下操作:b21)采用聚類中包含的所有基站的坐標(biāo)平均值作為該基站聚類的坐標(biāo),計(jì)算該聚類所包含的基站數(shù)量,在基站圖標(biāo)上顯示出具體數(shù)值。b22)根據(jù)所選時(shí)段中,該基站聚類(聚類或單個(gè)基站,以下統(tǒng)稱為基站聚類)的流入人數(shù)多于流出人數(shù),或流出人數(shù)多于流入人數(shù),采用不同顏色進(jìn)行區(qū)分。b23)采用多視圖協(xié)同的可視化方法,對(duì)于某個(gè)基站聚類,繪制折線圖表示其流入、流出及當(dāng)前時(shí)刻總?cè)藬?shù)隨時(shí)間的變化。人群流向可視化具體實(shí)現(xiàn)如下:b3)繪制流向圖,對(duì)不同時(shí)刻人群的流動(dòng)方向及流量大小進(jìn)行可視化。包括如下操作:b31)根據(jù)不同的地圖縮放級(jí)別,對(duì)有人群流動(dòng)的基站聚類之間,繪制連接線表示人群的流動(dòng)。若兩個(gè)基站聚類之間有人群流動(dòng),繪制兩條弧線分別表示從一個(gè)基站聚類到另一個(gè)基站聚類的人群流動(dòng)。采用弧線是為了避免流線的相互遮擋造成畫面不清晰,進(jìn)一步的,設(shè)定逆時(shí)針方向的弧線表示人群的流出,并加以箭頭表示。例如,從一個(gè)基站聚類流入到另一個(gè)基站聚類的人群,表示為從一個(gè)基站聚類指向另一個(gè)基站的逆時(shí)針的有箭頭弧線。b32)使用線條粗細(xì)區(qū)分人流大小。具體表示為基站聚類間連接線的粗細(xì)的不同。線條粗細(xì)的設(shè)定采用一種自適應(yīng)的寬度選擇算法。選擇四個(gè)寬度值w1,w2,w3,w4;設(shè)某時(shí)段流量最小時(shí)的人數(shù)為qmin,流量最大時(shí)的人數(shù)為qmax;計(jì)算從qmin到qmax的四分位數(shù)分別為q1,q2,q3,設(shè)q1,q2,q3,qmax每個(gè)值依次對(duì)應(yīng)一個(gè)寬度值w1,w2,w3,w4,當(dāng)流量在qmin至q1之間時(shí),采用寬度w1,當(dāng)流量在qmin至q1之間時(shí),采用寬度w1;當(dāng)流量在q1至q2之間時(shí),采用寬度w2;當(dāng)流量在q2至q3之間時(shí),采用寬度w3;當(dāng)流量在q3至qmax之間時(shí),采用寬度w4。基于基站的人群流動(dòng)模式可視化步驟如下:b4)繪制南丁格爾玫瑰圖,對(duì)每個(gè)基站聚類一天中人群流動(dòng)情況進(jìn)行可視化。具體包括如下操作:b41)在固定的地圖分辨率下,計(jì)算每個(gè)基站聚類每個(gè)小時(shí)的凈流入人數(shù),凈流入人數(shù)=該聚類內(nèi)每個(gè)基站的流入人數(shù)-該聚類內(nèi)每個(gè)基站的流出人數(shù)。b42)繪制圓環(huán),分成24等份,分別表示一天中24個(gè)時(shí)間步。b43)在圓環(huán)內(nèi)側(cè),繪制南丁格爾玫瑰圖,每一個(gè)扇形表示一個(gè)時(shí)間步,扇形面積表示凈流入人數(shù)。若凈流入人數(shù)為正數(shù),表示該基站聚類該時(shí)間步流入人數(shù)大于流出人數(shù),扇形用灰色填充;若凈流入人數(shù)為負(fù)數(shù),表示該基站聚類該時(shí)間步流入人數(shù)小于流出人數(shù),扇形用黑色填充?;跁r(shí)間步的人群流動(dòng)模式可視化步驟如下:b5)根據(jù)每個(gè)時(shí)間步對(duì)應(yīng)的基站聚類間人群流量大小,對(duì)時(shí)間步進(jìn)行聚類,并用圓環(huán)圖進(jìn)行可視化。該圖可以幫助分析不同時(shí)間步之間的關(guān)系,聚為一類的時(shí)間步,所對(duì)應(yīng)的該段時(shí)間的基站聚類間人群流動(dòng)模式較為相似。針對(duì)上述對(duì)時(shí)間步的聚類算法,其具體步驟如下:step1:使用基站間的流量作為特征向量,共有n個(gè)基站聚類,每個(gè)時(shí)間步對(duì)應(yīng)一個(gè)n*n的矩陣l,其中l(wèi)(i,j)表示在該時(shí)間步下,基站聚類i向基站聚類j流出的人數(shù);step2:對(duì)n個(gè)基站聚類的矩陣,采用k-means算法進(jìn)行聚類,人群流動(dòng)模式相似的時(shí)間步被聚為一類。根據(jù)聚類結(jié)果,用圓環(huán)圖對(duì)其進(jìn)行可視化。每個(gè)環(huán)表示一天,分成24等份,分別表示一天中24個(gè)時(shí)間步,并根據(jù)所屬聚類對(duì)各個(gè)單元格進(jìn)行顏色填充。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:采用傳統(tǒng)點(diǎn)數(shù)據(jù)可視化方法對(duì)城市內(nèi)基站進(jìn)行可視化時(shí),由于基站數(shù)量很大,很容易造成基站間相互遮擋的問題。本發(fā)明能夠有效解決遮擋問題,并且采用了多視圖協(xié)同可視化的方法,增加了折線圖,輔助展示各個(gè)層次下基站聚類或基站的詳細(xì)信息。在使用流向圖表示人群移動(dòng)時(shí),采用自適應(yīng)的寬度選擇算法,可以保證切換到任意時(shí)間段都能根據(jù)線條粗細(xì)看出當(dāng)前各處流量大小的區(qū)別。用南丁格爾玫瑰圖對(duì)每個(gè)基站聚類各個(gè)時(shí)間步的凈流入人數(shù)進(jìn)行可視化,可以了解不同區(qū)域的人群流動(dòng)模式的變化。用圓環(huán)圖展示從時(shí)間上的聚類結(jié)果,可以了解人群移動(dòng)模式隨時(shí)間的變化,以及不同時(shí)間段的移動(dòng)模式之間的區(qū)別。附圖說(shuō)明圖1為本發(fā)明一種針對(duì)手機(jī)基站定位數(shù)據(jù)的可視化方法的流程框圖;圖2為本發(fā)明中預(yù)處理模塊的實(shí)現(xiàn)流程圖;圖3為本發(fā)明中可視化模塊的實(shí)現(xiàn)流程圖;圖4為本發(fā)明實(shí)施例中,兩個(gè)不同地圖分辨率對(duì)應(yīng)的基站可視化結(jié)果;圖5為本發(fā)明實(shí)施例中,展示某個(gè)基站聚類,圖上的三條曲線分別表示流入、流出及當(dāng)前時(shí)刻總?cè)藬?shù)隨時(shí)間的變化;圖6為本發(fā)明實(shí)施例中,某個(gè)時(shí)間段對(duì)應(yīng)的人群流向可視化結(jié)果;圖7為本發(fā)明實(shí)施例中,顯示當(dāng)前基站聚類到其他基站聚類的流入/流出情況:其中,(a)顯示當(dāng)前基站聚類到其他基站聚類的人群流出;(b)顯示其他基站聚類到當(dāng)前基站聚類的人群流入;圖8為本發(fā)明實(shí)施例中,基于基站的人群流動(dòng)模式可視化結(jié)果:其中,(a)顯示一個(gè)基站聚類的結(jié)果;(b)在地圖上同時(shí)顯示所有基站聚類的結(jié)果;圖9為本發(fā)明實(shí)施例中,對(duì)168個(gè)時(shí)間步進(jìn)行聚類的結(jié)果,并將聚類結(jié)果進(jìn)行可視化。具體實(shí)施方式下面結(jié)合附圖,通過實(shí)施例進(jìn)一步描述本發(fā)明,但不以任何方式限制本發(fā)明的范圍。圖1為本發(fā)明提供的一種針對(duì)手機(jī)基站定位數(shù)據(jù)的可視化系統(tǒng)的流程圖。本發(fā)明系統(tǒng)包括數(shù)據(jù)預(yù)處理模塊和可視化模塊。本發(fā)明預(yù)處理模塊的實(shí)現(xiàn)流程圖如圖2所示。數(shù)據(jù)預(yù)處理模塊將原始數(shù)據(jù)集中信息有缺失和對(duì)可視化有干擾的數(shù)據(jù)進(jìn)行過濾,并對(duì)過濾后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理。本發(fā)明可視化模塊的實(shí)現(xiàn)流程圖如圖3所示。可視化模塊分為基站可視化、基站間人群流向可視化、基于基站的人群流動(dòng)模式可視化和基于時(shí)間步的人群流動(dòng)模式可視化?;究梢暬稍诓煌直媛实牡貓D上展示基站或基站聚類的位置;基站間人群流向可視化可展示在特定時(shí)間步的人群在基站間流動(dòng)情況;基于基站的人群流動(dòng)模式可視化展示每個(gè)基站聚類一天中各個(gè)時(shí)間段的人數(shù)變化情況;基于時(shí)間步的人群流動(dòng)模式可視化可以分析不同時(shí)間步之間的關(guān)系,聚為一類的時(shí)間步,所對(duì)應(yīng)的該段時(shí)間的基站聚類間人群流動(dòng)模式較為相似。本發(fā)明實(shí)施例中的待可視化數(shù)據(jù)集為上海地區(qū)2015年5月1日-5月7日的手機(jī)移動(dòng)實(shí)時(shí)信令數(shù)據(jù)集和基站地理信息數(shù)據(jù)集,其屬性表如表1和表2所示。移動(dòng)實(shí)時(shí)信令數(shù)據(jù)包含2g/3g/cdma手機(jī)實(shí)時(shí)所處基站位置信息。每次定位(產(chǎn)生記錄)的觸發(fā)條件為短信收發(fā)、去來(lái)電和開關(guān)機(jī)等動(dòng)作、半小時(shí)為周期的心跳定位以及服務(wù)區(qū)切換等。表1移動(dòng)實(shí)時(shí)信令數(shù)據(jù)屬性表表2基站地理位置屬性表字段名字段含義bsid基站編號(hào)longitudegps經(jīng)度latitudegps緯度本發(fā)明提供一種針對(duì)手機(jī)基站定位數(shù)據(jù)的可視分析系統(tǒng)。通過結(jié)合熱力圖、流向圖和圓環(huán)圖等,對(duì)基站、人群流向等進(jìn)行可視化展示。該可視化方法的具體操作步驟為:a對(duì)移動(dòng)實(shí)時(shí)信令數(shù)據(jù)原始數(shù)據(jù)集,進(jìn)行數(shù)據(jù)預(yù)處理:a1)針對(duì)基站地理位置屬性表中的數(shù)據(jù),將基站地點(diǎn)經(jīng)緯度缺失的數(shù)據(jù)清除;a2)針對(duì)移動(dòng)實(shí)時(shí)信令數(shù)據(jù)屬性表中的數(shù)據(jù),使用dartmouth方法消除數(shù)據(jù)中出現(xiàn)的乒乓效應(yīng);得到清理后的數(shù)據(jù)集,對(duì)其進(jìn)行統(tǒng)計(jì)處理:a3)設(shè)置固定的時(shí)間步為一個(gè)小時(shí),計(jì)算每個(gè)小時(shí)中各個(gè)基站的總?cè)藬?shù);a4)計(jì)算每個(gè)小時(shí)各個(gè)基站間的人群流動(dòng)情況,例如,對(duì)于基站c01,統(tǒng)計(jì)c01到c02、c03等其他基站的人員流入/流出次數(shù)。b根據(jù)上述處理后的數(shù)據(jù)集,分別對(duì)基站、人群流向進(jìn)行可視化:b1)設(shè)置地圖縮放級(jí)別為10到19,對(duì)應(yīng)的分辨率為r={152.8741,76.437,38.2185,19.1093,9.5546,4.7773,2.3887,1.1943,0.5972,0.2986}。采用基于地圖比例尺的層次聚類算法,對(duì)基站進(jìn)行聚類,具體步驟如下:step1:設(shè)置常量c=40,每層的聚類間最小距離di=40*ri。設(shè)每層的聚類結(jié)果為h={h1,h2,…,hn},hi是在第i層的聚類結(jié)果。初始化h為空集。step2:計(jì)算第1層的最大相似距離d1=c*r1,采用凝聚層次聚類算法將距離最近的兩個(gè)基站聚為一類,直至所有類間距離均大于d1。聚類結(jié)果為h1;step3:計(jì)算第2層的最大相似距離d2=c*r2,采用凝聚層次聚類算法對(duì)上一層的結(jié)果h1進(jìn)行聚類,結(jié)果為h2;step4:計(jì)算第i層的最大相似距離di=c*ri,采用凝聚層次聚類算法對(duì)上一層的結(jié)果hi-1進(jìn)行聚類,結(jié)果為hi;step5:重復(fù)step4直到得到所有層的聚類結(jié)果。b2)在地圖上根據(jù)不同的縮放級(jí)別對(duì)基站進(jìn)行可視化:b21)采用聚類中包含的所有基站的坐標(biāo)平均值作為該基站聚類的坐標(biāo),計(jì)算該聚類所包含的基站數(shù)量,在基站圖標(biāo)上顯示出具體數(shù)值。b22)根據(jù)所選時(shí)段中,該基站聚類流入及流出人數(shù)的多少,采用不同顏色進(jìn)行區(qū)分。具體設(shè)置如下:當(dāng)流入人數(shù)小于流出人數(shù)時(shí),用白色的圖標(biāo)表示;當(dāng)流入人數(shù)大于流出人數(shù)時(shí),用黑色的圖標(biāo)表示;當(dāng)流入人數(shù)等于流出人數(shù)時(shí),用灰色的圖標(biāo)表示。如圖4所示,由于流入人數(shù)和流出人數(shù)恰好相等的情況并不常見,因此圖中大多為黑色和白色的圖標(biāo)。b23)繪制折線圖展示每個(gè)基站聚類的具體信息。對(duì)于某個(gè)基站聚類,在折線圖上繪制三條折線分別表示流入、流出及當(dāng)前時(shí)刻總?cè)藬?shù)隨時(shí)間的變化。如圖5所示,以某個(gè)基站聚類為例,圓形節(jié)點(diǎn)的折線表示基站聚類總?cè)藬?shù)(crowd),正方形節(jié)點(diǎn)的折線表示基站聚類流入人數(shù)(inflow),三角形節(jié)點(diǎn)的折線表示基站聚類的流出人數(shù)(outflow)。從圖中可以看出,基站每天的人數(shù)變化有著一定的規(guī)律,并且5月4日-5月7日四天工作日的流入、流出人數(shù)有明顯的早晚高峰特點(diǎn)??紤]到手機(jī)基站定位數(shù)據(jù)量的巨大,在顯示時(shí)可能需要過濾掉一些流量較小的線條,此處設(shè)置一個(gè)圖例,通過更改圖例上箭頭的位置,過濾掉箭頭之外對(duì)應(yīng)人數(shù)的流線。b3)繪制流向圖,具體操作如下:b31)根據(jù)不同的地圖縮放級(jí)別,針對(duì)全部的基站聚類,繪制基站聚類間的連接線表示人群的流動(dòng)。為了避免相互遮擋,采用帶箭頭的弧線表示人群流動(dòng),逆時(shí)針方向的箭頭表示該基站聚類的流出人數(shù)。使用線條粗細(xì)區(qū)分人流大小。選擇四個(gè)寬度值1,2,3,4;設(shè)某時(shí)段流量最小時(shí)的人數(shù)為qmin,流量最大時(shí)的人數(shù)為qmax;計(jì)算從qmin到qmax的四分位數(shù)分別為q1,q2,q3,設(shè)q1,q2,q3,qmax每個(gè)值依次對(duì)應(yīng)一個(gè)寬度值1,2,3,4,當(dāng)流量在qmin至q1之間時(shí),寬度為1,當(dāng)流量在q1至q2之間時(shí),寬度為2,當(dāng)流量在q2至q3之間時(shí),寬度為3,當(dāng)流量在q3至qmax之間時(shí),寬度為4。如圖6所示,該圖展示了某個(gè)時(shí)間段的全部基站聚類間流動(dòng)情況,可以看出中心區(qū)域基站間的流動(dòng)人數(shù)要明顯多于周邊區(qū)域。b32)針對(duì)單獨(dú)的某個(gè)基站聚類,繪制其到其他基站聚類間的連接線表示人群的流動(dòng)??紤]到可能需要分別分析該基站聚類的流入和流出情況,設(shè)置單獨(dú)的in/out按鈕,控制在地圖上分別顯示該基站聚類到其他基站聚類的流入和流出情況。如圖7所示,該圖展示了某個(gè)時(shí)間段的某個(gè)基站聚類的人群流動(dòng)情況。圖7中的(a)展示其他基站到該基站的流入情況,圖7中的(b)展示該基站到其他基站的流出情況。b4)繪制南丁格爾玫瑰圖,對(duì)每個(gè)基站聚類一天中人群流動(dòng)情況進(jìn)行可視化。具體步驟如下:b41)選擇一個(gè)固定的地圖分辨率r=76.437,計(jì)算每個(gè)基站聚類每個(gè)小時(shí)的凈流入人數(shù),凈流入人數(shù)=該聚類內(nèi)每個(gè)基站的流入人數(shù)-該聚類內(nèi)每個(gè)基站的流出人數(shù)。b42)繪制圓環(huán),分成24等分,分別表示一天中24個(gè)時(shí)間步。b43)在圓環(huán)內(nèi)側(cè),繪制南丁格爾玫瑰圖,每一個(gè)扇形表示一個(gè)時(shí)間步,扇形面積表示凈流入人數(shù)。若凈流入人數(shù)為正數(shù),表示該基站聚類該時(shí)間步流入人數(shù)大于流出人數(shù),扇形用灰色填充;若凈流入人數(shù)為負(fù)數(shù),表示該基站聚類該時(shí)間步流入人數(shù)小于流出人數(shù),扇形用黑色填充。圖8中的(a)展示了某個(gè)基站聚類一天中人群的流動(dòng)情況,從圖中可以看出從1:00-14:00該基站聚類的人數(shù)一直在增加,15:00過后大部分時(shí)間步的人數(shù)都在減少,其中6:00-10:00人群流入最多,16:00-19:00人群流出最多,由此可以認(rèn)為該基站聚類所在位置可能是類似寫字樓密集的辦公區(qū)域。圖8中的(b)在地圖上做南丁格爾玫瑰圖,可以同時(shí)看到一天中多個(gè)基站聚類的人群流動(dòng)情況,由此分析職住地的分布特征。b5)根據(jù)每個(gè)小時(shí)對(duì)應(yīng)的基站聚類間人群流量大小,對(duì)時(shí)間步進(jìn)行聚類,聚類步驟如下:step1:使用基站間的流量作為特征向量,共有2896個(gè)基站聚類,每個(gè)小時(shí)對(duì)應(yīng)一個(gè)2896*2896的矩陣l,其中l(wèi)(i,j)表示在該時(shí)間步下,基站聚類i向基站聚類j流出的人數(shù)。本實(shí)施例選擇2015年5月1日到2015年5月7日的數(shù)據(jù),即共168個(gè)時(shí)間步。step2:對(duì)2896個(gè)基站聚類的矩陣,采用k-means算法進(jìn)行聚類,設(shè)k=7,最終得到7個(gè)時(shí)間步聚類。b6)繪制圓環(huán)圖。圓環(huán)圖從內(nèi)層到外層分別表示1日-7日,由于時(shí)間步設(shè)置為一個(gè)小時(shí),因此每個(gè)單獨(dú)的環(huán)被劃分為24個(gè)單元格,每個(gè)單元格代表一個(gè)小時(shí)。7個(gè)聚類用7種不同顏色表示,每個(gè)單元格的顏色標(biāo)明了該時(shí)間步屬于哪個(gè)聚類。如圖9所示,能夠看到節(jié)假日(內(nèi)三圈)與工作日(外四圈)的區(qū)別,工作日的人群流動(dòng)模式十分相似,以及工作日有明顯的早晚高峰的特點(diǎn)。b7)為了更好地展示每個(gè)時(shí)間步聚類對(duì)應(yīng)的人群流動(dòng)模式,當(dāng)在圓環(huán)圖上選擇某個(gè)單元格時(shí),地圖上顯示該單元格對(duì)應(yīng)時(shí)間步的流向圖。流向圖的繪制與上述b3步驟相同。提供以上實(shí)施例僅僅是為了描述本發(fā)明的目的,而并非要限制本發(fā)明的范圍。本發(fā)明的范圍由所附權(quán)利要求限定。不脫離本發(fā)明的精神和原理而做出的各種等同替換和修改,均應(yīng)涵蓋在本發(fā)明的范圍之內(nèi)。當(dāng)前第1頁(yè)12