一種基于移動(dòng)無(wú)線網(wǎng)絡(luò)數(shù)據(jù)的異常軌跡檢測(cè)方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種基于移動(dòng)無(wú)線網(wǎng)絡(luò)數(shù)據(jù)的異常軌跡檢測(cè) 方法及裝置。
【背景技術(shù)】
[0002] 隨著通信技術(shù)的發(fā)展,用戶(hù)終端(例如,手機(jī)終端)的普及率越來(lái)越高,用戶(hù)終端 在通信過(guò)程中通常會(huì)產(chǎn)生一些通信數(shù)據(jù)。例如,用戶(hù)使用移動(dòng)終端在移動(dòng)過(guò)程中進(jìn)行通信, 當(dāng)所述終端占用的源基站的信號(hào)強(qiáng)度變差,不足W保證用戶(hù)的通信質(zhì)量時(shí),而此時(shí)目標(biāo)基 站的信號(hào)強(qiáng)度又較強(qiáng)時(shí),終端會(huì)在源基站和目標(biāo)基站之間進(jìn)行切換。終端在切換基站時(shí),會(huì) 向基站上報(bào)測(cè)量報(bào)告(MeasurementR巧ort,MR)數(shù)據(jù),基站收到終端上報(bào)的MR數(shù)據(jù)后,進(jìn) 一步的將所述MR數(shù)據(jù)上報(bào)給無(wú)線網(wǎng)絡(luò)控制器(Radio化tworkCont;rolle;r,RNC),RNC接收 所述MR數(shù)據(jù)并存儲(chǔ)。
[0003] 通過(guò)用戶(hù)終端在通信過(guò)程中產(chǎn)生的通信數(shù)據(jù)可W獲得用戶(hù)的移動(dòng)軌跡。W終端在 通信過(guò)程中產(chǎn)生的MR數(shù)據(jù)為例,利用存儲(chǔ)在RNC中的MR數(shù)據(jù),采用H角定位技術(shù),可W獲 取到與所述MR數(shù)據(jù)對(duì)應(yīng)的終端在某一時(shí)刻的地理位置坐標(biāo),也即終端所屬用戶(hù)在某一時(shí) 刻的地理位置坐標(biāo)(如圖1所示,通過(guò)終端與小區(qū)A、B、C基站間的信號(hào)強(qiáng)度,確定出終端與 小區(qū)A、B、C基站間的距離,進(jìn)而確定出終端的地理位置坐標(biāo))。當(dāng)獲取到用戶(hù)在多個(gè)時(shí)刻 的地理位置坐標(biāo)時(shí),可W用線段將相鄰時(shí)刻的地理位置坐標(biāo)進(jìn)行連接,W得到該用戶(hù)的軌 跡數(shù)據(jù)。
[0004] 由于通信網(wǎng)絡(luò)具有良好的地理覆蓋性,也就是說(shuō)通信過(guò)程中產(chǎn)生的網(wǎng)絡(luò)數(shù)據(jù)(例 女口,MR數(shù)據(jù))具有覆蓋面廣、獲取方便的特點(diǎn)。因此,如何基于通信過(guò)程中產(chǎn)生的網(wǎng)絡(luò)數(shù)據(jù) 對(duì)用戶(hù)的移動(dòng)軌跡進(jìn)行異常檢測(cè)已成為本領(lǐng)域技術(shù)人員研究的重要課題。
[0005] 但基于網(wǎng)絡(luò)數(shù)據(jù)(例如,MR數(shù)據(jù))獲得用戶(hù)軌跡有其獨(dú)有的特點(diǎn),例如:
[0006] 1、用戶(hù)的地理位置坐標(biāo)是根據(jù)MR數(shù)據(jù)采用H角定位技術(shù)確定的,由于MR數(shù)據(jù)的 精度較低,根據(jù)MR數(shù)據(jù)直接確定的用戶(hù)地理位置坐標(biāo)是不準(zhǔn)確的,導(dǎo)致根據(jù)用戶(hù)地理位置 坐標(biāo)形成的用戶(hù)軌跡數(shù)據(jù)精度不高。
[0007] 2、由于終端在通信過(guò)程中產(chǎn)生的MR數(shù)據(jù)多,導(dǎo)致MR數(shù)據(jù)量龐大且數(shù)據(jù)的復(fù)雜性 局。
[0008] 3、由于MR數(shù)據(jù)采樣的頻度較低,且采樣頻度時(shí)常隨著移動(dòng)終端的狀態(tài)發(fā)生變化, 導(dǎo)致根據(jù)MR數(shù)據(jù)形成的用戶(hù)軌跡數(shù)據(jù)具有稀疏性和不均勻性。
[0009]目前,尚沒(méi)有人針對(duì)網(wǎng)絡(luò)數(shù)據(jù)的如上特點(diǎn),提出有效可行的異常軌跡檢測(cè)方法。
【發(fā)明內(nèi)容】
[0010] 本發(fā)明旨在提供一種基于移動(dòng)無(wú)線網(wǎng)絡(luò)數(shù)據(jù)的更精準(zhǔn)的異常軌跡檢測(cè)方法及裝 置。
[0011] 為達(dá)到上述目的,本發(fā)明采用如下技術(shù)方案:
[0012] 本發(fā)明的第一方面,提供一種基于移動(dòng)無(wú)線網(wǎng)絡(luò)數(shù)據(jù)的異常軌跡檢測(cè)方法,包 括:
[0013] 根據(jù)接收到的待測(cè)移動(dòng)終端上報(bào)的網(wǎng)絡(luò)數(shù)據(jù)計(jì)算出所述待測(cè)移動(dòng)終端的軌跡數(shù) 據(jù);其中,所述軌跡數(shù)據(jù)包含多個(gè)軌跡點(diǎn);
[0014] 將所述軌跡數(shù)據(jù)所在的目標(biāo)區(qū)域劃分為不相重合的目標(biāo)子區(qū)域;
[0015] 將所述軌跡數(shù)據(jù)中的各個(gè)軌跡點(diǎn)投射到對(duì)應(yīng)的目標(biāo)子區(qū)域中;
[0016] 根據(jù)軌跡點(diǎn)在目標(biāo)子區(qū)域中的停留時(shí)間,計(jì)算得到所述軌跡數(shù)據(jù)的直方圖特征描 述子;其中,所述直方圖特征描述子表示出目標(biāo)子區(qū)域的個(gè)數(shù)與每個(gè)目標(biāo)子區(qū)域中軌跡點(diǎn) 停留時(shí)間的相互關(guān)系;
[0017] 將各個(gè)軌跡數(shù)據(jù)的直方圖特征描述子,利用高斯混合模型,計(jì)算出每個(gè)軌跡數(shù)據(jù) 的異常度值;其中,所述高斯混合模型的參數(shù)由存儲(chǔ)的訓(xùn)練數(shù)據(jù)集中的樣本軌跡數(shù)據(jù)估計(jì) 得出。
[0018] 結(jié)合本發(fā)明的第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述將所述軌跡數(shù)據(jù)中的 各個(gè)軌跡點(diǎn)投射到對(duì)應(yīng)的目標(biāo)子區(qū)域中包括:
[0019] 計(jì)算一軌跡點(diǎn)到各個(gè)目標(biāo)子區(qū)域中必點(diǎn)的距離;
[0020] 將所述軌跡點(diǎn)投射到距離最短的四個(gè)目標(biāo)子區(qū)域中。
[0021] 結(jié)合本發(fā)明的第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí) 現(xiàn)方式中,所述根據(jù)軌跡點(diǎn)在目標(biāo)子區(qū)域中的停留時(shí)間,計(jì)算得到所述軌跡數(shù)據(jù)的直方圖 特征描述子包括:
[0022] 計(jì)算相鄰軌跡點(diǎn)的停留時(shí)間差值的權(quán)重值;
[0023] 若所述權(quán)重值大于第一闊值,且小于第二闊值,則在所述相鄰軌跡點(diǎn)的軌跡段上 等距離插入至少一個(gè)虛擬軌跡點(diǎn),W使所述相鄰軌跡點(diǎn)的停留時(shí)間差值的權(quán)重值小于或等 于所述第一闊值;
[0024] 將所述虛擬軌跡點(diǎn)投射到對(duì)應(yīng)的目標(biāo)子區(qū)域中;
[00巧]根據(jù)所述軌跡數(shù)據(jù)上的軌跡點(diǎn)和虛擬軌跡點(diǎn),計(jì)算得到直方圖特征描述子。
[0026] 結(jié)合本發(fā)明第一方面的第二種可能的實(shí)現(xiàn)方式,在第H種可能的實(shí)現(xiàn)方式中,計(jì) 算相鄰軌跡點(diǎn)的停留時(shí)間差值的權(quán)重值,具體包括:
[0027] 根據(jù)公式:
計(jì)算相鄰軌跡點(diǎn)的停留時(shí)間差值的權(quán)重值;
[002引其中,q表示相鄰軌跡點(diǎn)的停留時(shí)間差值的權(quán)重值,At表示相鄰軌跡點(diǎn)間的時(shí)間 差,n表示在相鄰軌跡點(diǎn)的軌跡段上插入的虛擬軌跡點(diǎn)的個(gè)數(shù)。
[0029] 結(jié)合本發(fā)明第一方面的第二種可能的實(shí)現(xiàn)方式或第H種可能的實(shí)現(xiàn)方式,在第四 種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述軌跡數(shù)據(jù)上的軌跡點(diǎn)和虛擬軌跡點(diǎn),計(jì)算得到直方圖 特征描述子包括:
[0030] 根據(jù)所述軌跡數(shù)據(jù)上的軌跡點(diǎn)和虛擬軌跡點(diǎn),計(jì)算得到直方圖特征描述子;
[0031] 對(duì)所述直方圖特征描述子進(jìn)行歸一化處理,得到歸一化后的直方圖特征描述子。
[0032] 結(jié)合本發(fā)明第一方面的第二種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,若 所述權(quán)重值大于或等于第二闊值,則將所述相鄰軌跡點(diǎn)中的起始軌跡點(diǎn)作為前一軌跡數(shù)據(jù) 的終點(diǎn)軌跡點(diǎn),將所述相鄰軌跡點(diǎn)中的終止軌跡點(diǎn)作為后一軌跡數(shù)據(jù)的起始軌跡點(diǎn),忽略 所述相鄰軌跡點(diǎn)構(gòu)成的軌跡數(shù)據(jù)。
[0033] 結(jié)合本發(fā)明的第一方面,在第六種可能的實(shí)現(xiàn)方式中,所述高斯混合模型的參數(shù) 估計(jì)過(guò)程包括:
[0034] 計(jì)算存儲(chǔ)的訓(xùn)練數(shù)據(jù)集中的樣本軌跡數(shù)據(jù)的直方圖特征描述子;
[0035] 將所述樣本軌跡數(shù)據(jù)的直方圖特征描述子代入到混合高斯模型中,得到所述混合 高斯模型的參數(shù)的估計(jì)值。
[0036] 本發(fā)明的第二方面,提供一種異常軌跡檢測(cè)裝置,包括:
[0037] 軌跡數(shù)據(jù)計(jì)算模塊,用于根據(jù)接收到的待測(cè)移動(dòng)終端上報(bào)的網(wǎng)絡(luò)數(shù)據(jù)計(jì)算出所述 待測(cè)移動(dòng)終端的軌跡數(shù)據(jù);其中,所述軌跡數(shù)據(jù)包含多個(gè)軌跡點(diǎn);
[0038] 區(qū)域劃分模塊,用于將所述軌跡數(shù)據(jù)所在的目標(biāo)區(qū)域劃分為不相重合的目標(biāo)子區(qū) 域;
[0039] 投射模塊,用于將所述軌跡數(shù)據(jù)中的各個(gè)軌跡點(diǎn)投射到對(duì)應(yīng)的目標(biāo)子區(qū)域中;
[0040] 直方圖特征描述子計(jì)算模塊,用于根據(jù)軌跡點(diǎn)在目標(biāo)子區(qū)域中的停留時(shí)間,計(jì)算 得到所述軌跡數(shù)據(jù)的直方圖特征描述子;其中,所述直方圖特征描述子表示出目標(biāo)子區(qū)域 的個(gè)數(shù)與每個(gè)目標(biāo)子區(qū)域中軌跡點(diǎn)停留時(shí)間的相互關(guān)系;
[0041] 異常度值計(jì)算模塊,將各個(gè)軌跡數(shù)據(jù)的直方圖特征描述子,利用高斯混合模型,計(jì) 算出每個(gè)軌跡數(shù)據(jù)的異常度值;其中,所述高斯混合模型的參數(shù)由存儲(chǔ)的訓(xùn)練數(shù)據(jù)集估計(jì) 得出。
[0042] 結(jié)合本發(fā)明的第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述投射模塊包括:
[0043] 距離計(jì)算單元,用于計(jì)算一軌跡點(diǎn)到各個(gè)目標(biāo)子區(qū)域中必點(diǎn)的距離;
[0044] 投射單元,用于將所述軌跡點(diǎn)投射到距離最短的四個(gè)目標(biāo)子區(qū)域中。
[0045] 結(jié)合本發(fā)明的第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí) 現(xiàn)方式中,所述直方圖特征描述子計(jì)算模塊包括:
[0046] 權(quán)重值計(jì)算單元,用于計(jì)算相鄰軌跡點(diǎn)的停留時(shí)間差值的權(quán)重值;
[0047] 虛擬軌跡點(diǎn)插入單元,用于若所述權(quán)重值大于第一闊值,且小于第二闊值,則在所 述相鄰軌跡點(diǎn)的軌跡段上等距離插入至少一個(gè)虛擬軌跡點(diǎn),W使所述相鄰軌跡點(diǎn)的停留時(shí) 間差值的權(quán)重值小于或等于所述第一闊值;
[0