亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種通信操作分析方法及裝置與流程

文檔序號(hào):11205808閱讀:1099來(lái)源:國(guó)知局
一種通信操作分析方法及裝置與流程

本發(fā)明涉及通信領(lǐng)域中的網(wǎng)絡(luò)管理技術(shù),尤其涉及一種通信操作分析方法及裝置。



背景技術(shù):

近幾年,隨著信息技術(shù)的飛躍發(fā)展,用戶使用數(shù)據(jù)通信網(wǎng)絡(luò)會(huì)出現(xiàn)用戶數(shù)據(jù)信息泄露事件、異常的登陸信息和訪問(wèn)網(wǎng)站信息,直接影響用戶的信譽(yù)度和財(cái)產(chǎn)安全。另外,用戶使用數(shù)據(jù)通信網(wǎng)絡(luò)時(shí),“未上網(wǎng)卻產(chǎn)生流量費(fèi)用”和“實(shí)際流量與預(yù)期流量不符”這兩項(xiàng)帶來(lái)的困擾嚴(yán)重影響了客戶滿意度。

目前,電信運(yùn)營(yíng)商雖然為用戶提供了各種類型的數(shù)據(jù)流量提醒機(jī)制,但上述常用的提醒機(jī)制無(wú)法區(qū)分正常和異常的數(shù)據(jù)流量,且無(wú)法單獨(dú)為異常數(shù)據(jù)流量進(jìn)行預(yù)警。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明的目的在于提供一種通信操作分析方法及裝置,能至少解決現(xiàn)有技術(shù)中存在的上述問(wèn)題。

為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:

本發(fā)明實(shí)施例提供了一種通信操作分析方法,所述方法包括:

獲取到用戶的至少一條歷史上網(wǎng)話單,其中,所述歷史上網(wǎng)話單至少包括有預(yù)設(shè)時(shí)長(zhǎng)內(nèi)與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的操作記錄;

基于所述歷史上網(wǎng)話單進(jìn)行上網(wǎng)特征提取,得到歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子;

基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子確定上網(wǎng)模型;

基于所述上網(wǎng)模型,對(duì)采用移動(dòng)終端與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的 第一話單進(jìn)行分析,并基于分析結(jié)果進(jìn)行處理。

本發(fā)明實(shí)施例提供了一種通信操作分析裝置,所述裝置包括:

信息獲取單元,用于獲取到用戶的至少一條歷史上網(wǎng)話單,其中,所述歷史上網(wǎng)話單至少包括有預(yù)設(shè)時(shí)長(zhǎng)內(nèi)與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的操作記錄;

模型建立單元,用于基于所述歷史上網(wǎng)話單進(jìn)行上網(wǎng)特征提取,得到歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子;基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子確定上網(wǎng)模型;

分析單元,用于基于所述上網(wǎng)模型,對(duì)采用移動(dòng)終端與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的第一話單進(jìn)行分析,并基于分析結(jié)果進(jìn)行處理。

本發(fā)明實(shí)施例提供了通信操作分析方法及裝置,基于用戶的歷史上網(wǎng)話單確定至少一個(gè)基本特征因子,進(jìn)而基于歷史上網(wǎng)話單的至少一個(gè)基本特征因子確定上網(wǎng)模型,并利用上網(wǎng)模型對(duì)用戶產(chǎn)生的第一話單進(jìn)行分析,最終能夠基于分析結(jié)果進(jìn)行處理。首先采用上網(wǎng)話單特征因子進(jìn)行處理的方式能夠降低資源占用率,提高計(jì)算效率;并且通過(guò)上網(wǎng)模型的建立確定出針對(duì)話單的分析結(jié)果,進(jìn)而能夠基于分析結(jié)果進(jìn)行處理,如此減少了用戶不知情產(chǎn)生流量的情況。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例通信操作分析方法流程示意圖;

圖2為本發(fā)明實(shí)施例對(duì)上網(wǎng)話單進(jìn)行特征提取的提示圖;

圖3為本發(fā)明實(shí)施例通信操作分析方法中的建立上網(wǎng)模型流程示意圖;

圖4為本發(fā)明實(shí)施例通信操作分析方法中的基于上網(wǎng)模型進(jìn)行分析流程示意圖;

圖5為本發(fā)明實(shí)施例通信操作分析裝置組成結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明再作進(jìn)一步詳細(xì)的說(shuō)明。

實(shí)施例一、

本發(fā)明實(shí)施例提供了一種通信操作分析方法,如圖1所示,包括:

步驟101:獲取到用戶的至少一條歷史上網(wǎng)話單,其中,所述歷史上網(wǎng)話單至少包括有預(yù)設(shè)時(shí)長(zhǎng)內(nèi)與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的操作記錄;

步驟102:基于所述歷史上網(wǎng)話單進(jìn)行上網(wǎng)特征提取,得到歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子;

步驟103:基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子確定上網(wǎng)模型;

步驟104:基于所述上網(wǎng)模型,對(duì)采用移動(dòng)終端與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的第一話單進(jìn)行分析,并基于分析結(jié)果進(jìn)行處理。

本實(shí)施例可以應(yīng)用于網(wǎng)絡(luò)設(shè)備,比如網(wǎng)絡(luò)側(cè)的服務(wù)器中,也可以有移動(dòng)終端來(lái)對(duì)本終端的操作進(jìn)行分析,也就是說(shuō),本實(shí)施例即能夠使用于網(wǎng)絡(luò)設(shè)備、也能夠使用于移動(dòng)終端,本實(shí)施例中不對(duì)其進(jìn)行限定。

下面本實(shí)施例著重針對(duì)如何建立上網(wǎng)模型進(jìn)行具體說(shuō)明:

所述基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子確定上網(wǎng)模型,包括:

基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子之間的距離值,確定至少一個(gè)類別、以及每一個(gè)類別對(duì)應(yīng)的頻數(shù);其中,每一個(gè)類別中分別對(duì)應(yīng)有n條歷史上網(wǎng)話單,n為大于等于1的整數(shù);

基于所述類別對(duì)應(yīng)的頻數(shù)確定所述類別對(duì)應(yīng)的權(quán)值;

基于每一個(gè)類別對(duì)應(yīng)的權(quán)重、以及每一個(gè)類別對(duì)應(yīng)的中心值,建立上網(wǎng)模型。

其中,所述基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子之間的距離值,確定至少一個(gè)類別、以及每一個(gè)類別對(duì)應(yīng)的頻數(shù),包括:

判斷當(dāng)前輸入的歷史上網(wǎng)話單是否為第一條操作記錄;

若是第一條操作記錄,則設(shè)置當(dāng)前的所述歷史上網(wǎng)話單對(duì)應(yīng)的基本特征 因子作為新建立的類別的中心特征,并將所述類別的頻數(shù)加一;

若不是第一條操作記錄,則計(jì)算當(dāng)前歷史上網(wǎng)話單對(duì)應(yīng)的基本特征因子與當(dāng)前已有的至少一個(gè)類別對(duì)應(yīng)的中心特征之間的距離值,基于所述歷史上網(wǎng)話單與至少一個(gè)類別的中心特征之間的距離值選取對(duì)應(yīng)的類別,基于所述歷史上網(wǎng)話單更新所述對(duì)應(yīng)的類別的中心特征以及所述類別對(duì)應(yīng)的頻數(shù)。

本實(shí)施例中所述歷史上網(wǎng)話單,可以體現(xiàn)為保存在網(wǎng)絡(luò)側(cè)的用戶的上網(wǎng)話單,所述上網(wǎng)特征提取可以采用用戶的上網(wǎng)時(shí)間段、上網(wǎng)頻率和上網(wǎng)流量特征作為用戶上網(wǎng)的基本特征因子。如圖2所示,其中,分別基于三個(gè)上網(wǎng)特征來(lái)進(jìn)行分類,分出來(lái)以下a、b、c三種類別:

a.上網(wǎng)時(shí)間段:指用戶每天上網(wǎng)的時(shí)間段;

b.上網(wǎng)頻率:指用戶單位時(shí)間內(nèi)上網(wǎng)的次數(shù)(次/分);

c.上網(wǎng)流量:指用戶每次上網(wǎng)的流量(kb)。

這樣,對(duì)于每一條歷史上網(wǎng)話單即上網(wǎng)話單在某一時(shí)間區(qū)間內(nèi)的多個(gè)特征因子,可以看成是多模的,我們可以通過(guò)基于聚類的原理將用戶的話單特征提煉為幾個(gè)類來(lái)代表的樣本集,上網(wǎng)話單可以聚類成3類。

具體的上網(wǎng)模型的學(xué)習(xí)過(guò)程可以參見(jiàn)圖3,具體如下:

一、初始化并建立參數(shù)集。對(duì)于每一條話單,令km為最大類別數(shù),td為類間距閾值,當(dāng)前類別數(shù)為0,每一類的頻數(shù)設(shè)為0。

二、輸入話單。

三、如果輸入話單為第一條話單,則令每一話單當(dāng)前的特征量xt(t為第幾條話單)作為第一類的中心,并將該類的頻數(shù)加1,然后回到步驟二;如果輸入不是第一條話單,則轉(zhuǎn)到步驟四。

四、對(duì)每一話單,計(jì)算當(dāng)前話單特征量xt與該話單已有類別的聚類中心ci,t-1的距離,i是聚類中心個(gè)數(shù),令最小距離為dmin:

dmin=min(|ci,t-1-xt|)(1-1)

其中,使得距離最小的類別為第k類:

k=mini(|ci,t-1-xt|)(1-2)

如果dmin<td,則將該特征量歸至最小距離的類中,將該類的頻數(shù)加1,并更新該類的聚類中心為:

ck,t=(1-α)ck,t-1+αxt(1-3)

其中α為學(xué)習(xí)速率,其大小可以根據(jù)具體的情況而定。然后轉(zhuǎn)至步驟五。

如果dmin>td,如果已有的類別數(shù)小于定義的最大類別數(shù)km,則增加一個(gè)新類,將特征量xt作為新類的聚類中心,并將該類的頻數(shù)加1,然后轉(zhuǎn)至五。如果已有類別數(shù)大于km,則找出頻數(shù)最少的類,將其移除,并將特征量xt作為新一類的聚類中心,新類的頻數(shù)設(shè)為1,然后轉(zhuǎn)至步驟五。

五、如果學(xué)習(xí)過(guò)程完成,即所有的n個(gè)樣本話單已完成聚類,則結(jié)束,否則回到二。

其中類間距閾值td可以通過(guò)式1-4進(jìn)行計(jì)算

td=tσ(1-4)

通常td根據(jù)場(chǎng)景的不同取一至兩倍的σ,即t為1或2,σ是類間方差。km通常選取為10至20類,場(chǎng)景越復(fù)雜,所需的類別數(shù)越多。每一類由其聚類中心與出現(xiàn)頻數(shù)表示。顯然,出現(xiàn)頻率高的類別應(yīng)對(duì)話單模型有較多的貢獻(xiàn),而出現(xiàn)頻率低的類別對(duì)話單模型影響小,通過(guò)更新機(jī)制會(huì)被逐漸抑制和取代。

通過(guò)以上的聚類過(guò)程,原本的n個(gè)樣本x1,x2,...,xn可以由m個(gè)新樣本c1,c2,...,cm來(lái)表示,ci表示第i類的聚類中心,從而得到能夠表示全樣本關(guān)鍵特征的小樣本集。新樣本集中的每個(gè)樣本對(duì)概率函數(shù)的貢獻(xiàn)不同,其貢獻(xiàn)度由每類出現(xiàn)的頻數(shù)ni,i=1,2…m表示,則由式(1-4)計(jì)算每類的權(quán)值:

則對(duì)應(yīng)話單的概率函數(shù)通過(guò)下式進(jìn)行計(jì)算:

其中,d為特征因子個(gè)數(shù),t代表轉(zhuǎn)置。

可見(jiàn),通過(guò)采用上述方案,能夠基于用戶的歷史上網(wǎng)話單確定至少一個(gè)基本特征因子,進(jìn)而基于歷史上網(wǎng)話單的至少一個(gè)基本特征因子確定上網(wǎng)模型,并利用上網(wǎng)模型對(duì)用戶產(chǎn)生的第一話單進(jìn)行分析,最終能夠基于分析結(jié)果進(jìn)行處理。首先采用上網(wǎng)話單特征因子進(jìn)行處理的方式能夠降低資源占用率,提高計(jì)算效率;并且通過(guò)上網(wǎng)模型的建立確定出針對(duì)話單的分析結(jié)果,進(jìn)而能夠基于分析結(jié)果進(jìn)行處理,如此減少了用戶不知情產(chǎn)生流量的情況。

實(shí)施例二、

本發(fā)明實(shí)施例提供了一種通信操作分析方法,如圖1所示,包括:

步驟101:獲取到用戶的至少一條歷史上網(wǎng)話單,其中,所述歷史上網(wǎng)話單至少包括有預(yù)設(shè)時(shí)長(zhǎng)內(nèi)與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的操作記錄;

步驟102:基于所述歷史上網(wǎng)話單進(jìn)行上網(wǎng)特征提取,得到歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子;

步驟103:基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子確定上網(wǎng)模型;

步驟104:基于所述上網(wǎng)模型,對(duì)采用移動(dòng)終端與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的第一話單進(jìn)行分析,并基于分析結(jié)果進(jìn)行處理。

本實(shí)施例可以應(yīng)用于網(wǎng)絡(luò)設(shè)備,比如網(wǎng)絡(luò)側(cè)的服務(wù)器中,也可以有移動(dòng)終端來(lái)對(duì)本終端的操作進(jìn)行分析,也就是說(shuō),本實(shí)施例即能夠使用于網(wǎng)絡(luò)設(shè)備、也能夠使用于移動(dòng)終端,本實(shí)施例中不對(duì)其進(jìn)行限定。

下面本實(shí)施例著重針對(duì)如何采用上網(wǎng)模型進(jìn)行分析來(lái)具體說(shuō)明:

所述基于所述上網(wǎng)模型,對(duì)采用移動(dòng)終端與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的第一話單進(jìn)行分析,包括:

獲取到用戶采用移動(dòng)終端與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的第一話單的記錄;

從所述第一話單的記錄中提取得到特征量;

基于所述第一話單的記錄對(duì)應(yīng)的特征量、以及所述上網(wǎng)模型,計(jì)算得到所述第一話單記錄對(duì)應(yīng)的概率值,將所述概率值作為針對(duì)所述第一話單的分析結(jié)果。

相應(yīng)的,所述基于分析結(jié)果進(jìn)行處理,包括:

判斷分析結(jié)果中包含的概率值是否大于預(yù)設(shè)門限值;

若大于,則確定所述第一話單為正常操作;

若不大于,則確定所述第一話單為異常操作,針對(duì)所述第一話單生成提示信息。

結(jié)合圖4,對(duì)話單分析并進(jìn)行處理的具體步驟進(jìn)行說(shuō)明:

步驟401:設(shè)置閾值等參數(shù);

步驟402:輸入樣本話單;

步驟403:若是第一條話單,則直接將該條話單的特征值設(shè)置為聚類中心,若不是第一條話單,則判斷當(dāng)條話單與聚類中心的距離;

步驟404:根據(jù)距離值判斷更新聚類中心;

步驟405:判斷是否完成聚類中心的建立,即所有的n個(gè)樣本話單是否已完成聚類,若是,走到步驟406,否則回到步驟402;

步驟406:輸入用戶產(chǎn)生話單;

步驟407:對(duì)每一話單,根據(jù)已有類別聚類中心ci,t-1,計(jì)算當(dāng)前話單特征量xt對(duì)于第i類中心出現(xiàn)的概率:

則xt出現(xiàn)的總概率為

如果pr(xt)>th,則該話單暫時(shí)被判為正常話單,令b(xt)=1,如果pr(xt)<th,則該話單暫時(shí)被判為異常話單,令b(xt)=0,其中th是設(shè)定的判別閾值,具體可根據(jù)用戶特征話單集波動(dòng)情況來(lái)定義,即波動(dòng)情況越大,該值越大;

步驟408:對(duì)于每一個(gè)話單,如果其b(xt)=1,則需要對(duì)該話單的概率模型進(jìn)行更新,我們使用短時(shí)更新來(lái)對(duì)樣本集進(jìn)行更新。首先需要找出與新進(jìn)的話單特征值xt最相近的類別k:

k=maxi(pri(xt))(1-9)

如果新進(jìn)的話單特征值xt與最接近的聚類中心的距離大于核帶寬的兩倍,即那么引入一個(gè)新類,否則的話將xt加入到類ck,t中,并根據(jù)式1-3更新聚類中心。如果話單的b(xt)=0,則其為異常,轉(zhuǎn)至步驟409。

步驟409:如果b(xt)=0,則判斷為異常,則給用戶發(fā)短信告警。

步驟410:如果所有話單都處理完成,則結(jié)束,沒(méi)有的話則轉(zhuǎn)到步驟406。

通過(guò)上述流程對(duì)話單的計(jì)算和判別,采集用戶手機(jī)終端所產(chǎn)生的每條上網(wǎng)話單,抽取話單中各個(gè)維度,與話單特征庫(kù)里的特征指標(biāo)進(jìn)行匹配;若發(fā)現(xiàn)上網(wǎng)話單中流量是異常流量,則形成危險(xiǎn)提醒短信,向用戶終端發(fā)送,提醒用戶采取措施避免繼續(xù)產(chǎn)生異常上網(wǎng)話單。

采用建立用戶話單概率模型,有效地判斷用戶異常上網(wǎng)話單,降低用戶不知情產(chǎn)生流量的情況,提高公司收入。從本方案實(shí)施后,“未上網(wǎng)卻產(chǎn)生流量費(fèi)用”和“使用量小費(fèi)用很高”兩大類用戶投訴,給用戶退費(fèi)率下降15%,重復(fù)投訴率也下降了10%,凈化了手機(jī)上網(wǎng)環(huán)境,提升了客戶滿意度,維護(hù)了中國(guó)移動(dòng)的良好企業(yè)形象,創(chuàng)造了巨大的社會(huì)效益。

首先提取用戶上網(wǎng)特征進(jìn)行建模,用戶上網(wǎng)特征的主要原理是結(jié)合用戶日常上網(wǎng)習(xí)慣,建立用戶上網(wǎng)特征庫(kù),抽取每次上網(wǎng)特征數(shù)據(jù),與特征庫(kù)里規(guī)則進(jìn)行匹配,根據(jù)規(guī)則匹配的結(jié)果判斷用戶每次上網(wǎng)行為是否存在安全隱患。本文采集用戶終端上網(wǎng)話單進(jìn)行特征分析,并進(jìn)行概率模型建模。因?yàn)樯暇W(wǎng)話單在應(yīng)用領(lǐng)域中適用的范圍比較廣闊,其特征數(shù)據(jù)豐富、特征明顯、結(jié)果可靠、處理及時(shí)性強(qiáng)。

(1)采集用戶終端產(chǎn)生話單中的用戶號(hào)碼、上網(wǎng)時(shí)間、上網(wǎng)流量、上網(wǎng)頻率、用戶imei等各個(gè)維度信息,并對(duì)樣本集信息進(jìn)行聚類分析,降低存儲(chǔ)量,這樣在樣本集極少的情況下,能夠得到與原樣本集相似的概率函數(shù),快速有效地建立用戶上網(wǎng)話單特征模型。匹配用戶上網(wǎng)話單,如果用戶上網(wǎng)話單特征與用戶平時(shí)上網(wǎng)習(xí)慣嚴(yán)重不符,那么這些話單將被定位成疑似異常上網(wǎng)話單。

(2)用戶話單匹配用戶上網(wǎng)話單特征模型,進(jìn)行概率計(jì)算。當(dāng)概率低于一定值時(shí),則判斷用戶上網(wǎng)話單不符合用戶上網(wǎng)習(xí)慣,那么將這些話單判定為疑似異常上網(wǎng)話單,并對(duì)用戶進(jìn)行短信告知。

用戶自主產(chǎn)生的上網(wǎng)流量話單一般具有一定的規(guī)律和特征,本實(shí)施例利用該特性來(lái)判斷用戶話單是否正常,符合以往用戶上網(wǎng)特征的判別為正常話單,差異較大則判別為異常話單,及時(shí)通知用戶,避免損失。本實(shí)施例實(shí)現(xiàn)方案中首先采集用戶終端上網(wǎng)話單進(jìn)行特征分析,并將其重要特征進(jìn)行聚類預(yù)處理,進(jìn)而進(jìn)行概率模型建模,形成上網(wǎng)話單模型,然后匹配用戶的上網(wǎng)話單與話單模型,進(jìn)行概率計(jì)算,通過(guò)其值來(lái)判斷用戶的話單是否正常。

聚類預(yù)處理用戶話單可以解決概率計(jì)算復(fù)雜度大、對(duì)硬件存儲(chǔ)要求較高的問(wèn)題,同時(shí)聚類學(xué)習(xí)過(guò)程還具有以下優(yōu)勢(shì):(1)高度的可伸縮性,即在聚類話單數(shù)據(jù)集合非常大時(shí),仍能夠得到較滿意的聚類分類效果;(2)抗噪聲數(shù)據(jù)的性能強(qiáng),實(shí)際的樣本數(shù)據(jù)庫(kù)中的數(shù)據(jù)可能包含孤立的點(diǎn)甚至是錯(cuò)誤的數(shù)據(jù),聚類算法對(duì)這些類似噪聲的數(shù)據(jù)不敏感,不會(huì)影響聚類的效果。因此,將用戶話單的各個(gè)特征進(jìn)行聚類分析,有助于提高計(jì)算效率。

話單概率模型建立是采用非參數(shù)核密度估計(jì)算法,該算法可以直接從觀測(cè)數(shù)據(jù)中估計(jì)未知密度函數(shù),所以不需要假定模型的參數(shù)或者對(duì)參數(shù)進(jìn)行優(yōu)化的工作,因此該方法已經(jīng)被廣泛應(yīng)用于魯棒的復(fù)雜數(shù)據(jù)建模。在非參數(shù)核密度估計(jì)算法中,取話單序列中連續(xù)的n條話單作為樣本,則沿著時(shí)間軸,每個(gè)話單特征都有n個(gè)樣本值,于是可以為每個(gè)話單特征建立一個(gè)概率模型。當(dāng)話單樣本足夠多時(shí),核密度估計(jì)能夠逐漸的收斂于真實(shí)話單模型。

可見(jiàn),通過(guò)采用上述方案,能夠基于用戶的歷史上網(wǎng)話單確定至少一個(gè)基本特征因子,進(jìn)而基于歷史上網(wǎng)話單的至少一個(gè)姐基本特征因子確定上網(wǎng)模型,并利用上網(wǎng)模型對(duì)用戶產(chǎn)生的第一話單進(jìn)行分析,最終能夠基于分析結(jié)果進(jìn)行處理。首先采用上網(wǎng)話單特征因子進(jìn)行處理的方式能夠降低資源占用率,提高計(jì)算效率;并且通過(guò)上網(wǎng)模型的建立確定出針對(duì)話單的分析結(jié)果,進(jìn)而能夠基于分析結(jié)果進(jìn)行處理,如此減少了用戶不知情產(chǎn)生流量的情況。

實(shí)施例三、

本發(fā)明實(shí)施例提供了一種通信操作分析裝置,如圖5所示,所述裝置包括:

信息獲取單元51,用于獲取到用戶的至少一條歷史上網(wǎng)話單,其中,所述歷史上網(wǎng)話單至少包括有預(yù)設(shè)時(shí)長(zhǎng)內(nèi)與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的操作記錄;

模型建立單元52,用于基于所述歷史上網(wǎng)話單進(jìn)行上網(wǎng)特征提取,得到歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子;基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子確定上網(wǎng)模型;

分析單元53,用于基于所述上網(wǎng)模型,對(duì)采用移動(dòng)終端與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的第一話單進(jìn)行分析,并基于分析結(jié)果進(jìn)行處理。

本實(shí)施例所述通信操作分析裝置可以為網(wǎng)絡(luò)設(shè)備,比如網(wǎng)絡(luò)側(cè)的服務(wù)器,或者還可以為服務(wù)器集群,也就是說(shuō)上述三個(gè)模塊可以設(shè)置于一個(gè)服務(wù)器中,也可以分別設(shè)置在不同的服務(wù)器中;另外,上述通信操作分析裝置也可以為移動(dòng)終端。

下面本實(shí)施例著重針對(duì)如何建立上網(wǎng)模型進(jìn)行具體說(shuō)明:

所述模型建立單元52,用于基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子之間的距離值,確定至少一個(gè)類別、以及每一個(gè)類別對(duì)應(yīng)的頻數(shù);其中,每一個(gè)類別中分別對(duì)應(yīng)有n條歷史上網(wǎng)話單,n為大于等于1的整數(shù);基于所述類別對(duì)應(yīng)的頻數(shù)確定所述類別對(duì)應(yīng)的權(quán)值;基于每一個(gè)類別對(duì)應(yīng)的權(quán)重、以及每一個(gè)類別對(duì)應(yīng)的中心值,建立上網(wǎng)模型。

其中,所述模型建立單元52,用于判斷當(dāng)前輸入的歷史上網(wǎng)話單是否為第一條操作記錄;若是第一條操作記錄,則設(shè)置當(dāng)前的所述歷史上網(wǎng)話單對(duì)應(yīng)的基本特征因子作為新建立的類別的中心特征,并將所述類別的頻數(shù)加一;若不是第一條操作記錄,則計(jì)算當(dāng)前歷史上網(wǎng)話單對(duì)應(yīng)的基本特征因子與當(dāng)前已有的至少一個(gè)類別對(duì)應(yīng)的中心特征之間的距離值,基于所述歷史上網(wǎng)話單與至少一個(gè)類別的中心特征之間的距離值選取對(duì)應(yīng)的類別,基于所述歷史上網(wǎng)話單更新所述對(duì)應(yīng)的類別的中心特征以及所述類別對(duì)應(yīng)的頻數(shù)。

本實(shí)施例中所述歷史上網(wǎng)話單,可以體現(xiàn)為保存在網(wǎng)絡(luò)側(cè)的用戶的上網(wǎng)話單,所述上網(wǎng)特征提取可以采用用戶的上網(wǎng)時(shí)間段、上網(wǎng)頻率和上網(wǎng)流量特征作為用戶上網(wǎng)的基本特征因子。

具體的上網(wǎng)模型的學(xué)習(xí)過(guò)程可以參見(jiàn)圖3,具體如下:

一、初始化并建立參數(shù)集。對(duì)于每一條話單,令km為最大類別數(shù),td為類間距閾值,當(dāng)前類別數(shù)為0,每一類的頻數(shù)設(shè)為0。

二、輸入話單。

三、如果輸入話單為第一條話單,則令每一話單當(dāng)前的特征量xt(t為第幾條話單)作為第一類的中心,并將該類的頻數(shù)加1,然后回到步驟二;如果輸入不是第一條話單,則轉(zhuǎn)到步驟四。

四、對(duì)每一話單,計(jì)算當(dāng)前話單特征量xt與該話單已有類別的聚類中心ci,t-1的距離,i是聚類中心個(gè)數(shù),令最小距離為dmin:

dmin=min(|ci,t-1-xt|)(1-1)

其中,使得距離最小的類別為第k類:

k=mini(|ci,t-1-xt|)(1-2)

如果dmin<td,則將該特征量歸至最小距離的類中,將該類的頻數(shù)加1,并更新該類的聚類中心為:

ck,t=(1-α)ck,t-1+αxt(1-3)

其中α為學(xué)習(xí)速率,其大小可以根據(jù)具體的情況而定。然后轉(zhuǎn)至步驟五。

如果dmin>td,如果已有的類別數(shù)小于定義的最大類別數(shù)km,則增加一個(gè)新類,將特征量xt作為新類的聚類中心,并將該類的頻數(shù)加1,然后轉(zhuǎn)至五。如果已有類別數(shù)大于km,則找出頻數(shù)最少的類,將其移除,并將特征量xt作為新一類的聚類中心,新類的頻數(shù)設(shè)為1,然后轉(zhuǎn)至步驟五。

五、如果學(xué)習(xí)過(guò)程完成,即所有的n個(gè)樣本話單已完成聚類,則結(jié)束,否則回到二。

其中類間距閾值td可以通過(guò)式1-4進(jìn)行計(jì)算

td=tσ(1-4)

通常td根據(jù)場(chǎng)景的不同取一至兩倍的σ,即t為1或2,σ是類間方差。km通常選取為10至20類,場(chǎng)景越復(fù)雜,所需的類別數(shù)越多。每一類由其聚類中心與出現(xiàn)頻數(shù)表示。顯然,出現(xiàn)頻率高的類別應(yīng)對(duì)話單模型有較多的貢獻(xiàn),而出現(xiàn)頻率低的類別對(duì)話單模型影響小,通過(guò)更新機(jī)制會(huì)被逐漸抑制和取代。

通過(guò)以上的聚類過(guò)程,原本的n個(gè)樣本x1,x2,...,xn可以由m個(gè)新樣本c1,c2,...,cm來(lái)表示,ci表示第i類的聚類中心,從而得到能夠表示全樣本關(guān)鍵特征的小樣本集。新樣本集中的每個(gè)樣本對(duì)概率函數(shù)的貢獻(xiàn)不同,其貢獻(xiàn)度由每類出現(xiàn)的頻數(shù)ni,i=1,2…m表示,則由式(1-4)計(jì)算每類的權(quán)值:

則對(duì)應(yīng)話單的概率函數(shù)通過(guò)下式進(jìn)行計(jì)算:

可見(jiàn),通過(guò)采用上述方案,能夠基于用戶的歷史上網(wǎng)話單確定至少一個(gè)基本特征因子,進(jìn)而基于歷史上網(wǎng)話單的至少一個(gè)基本特征因子確定上網(wǎng)模型,并利用上網(wǎng)模型對(duì)用戶產(chǎn)生的第一話單進(jìn)行分析,最終能夠基于分析結(jié)果進(jìn)行處理。首先采用上網(wǎng)話單特征因子進(jìn)行處理的方式能夠降低資源占用率,提高計(jì)算效率;并且通過(guò)上網(wǎng)模型的建立確定出針對(duì)話單的分析結(jié)果,進(jìn)而能夠基于分析結(jié)果進(jìn)行處理,如此減少了用戶不知情產(chǎn)生流量的情況。

實(shí)施例四、

本發(fā)明實(shí)施例提供了一種通信操作分析裝置,如圖5所示,所述裝置包括:

信息獲取單元51,用于獲取到用戶的至少一條歷史上網(wǎng)話單,其中,所述歷史上網(wǎng)話單至少包括有預(yù)設(shè)時(shí)長(zhǎng)內(nèi)與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的操作記錄;

模型建立單元52,用于基于所述歷史上網(wǎng)話單進(jìn)行上網(wǎng)特征提取,得到歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子;基于歷史上網(wǎng)話單對(duì)應(yīng)的至少一個(gè)基本特征因子確定上網(wǎng)模型;

分析單元53,用于基于所述上網(wǎng)模型,對(duì)采用移動(dòng)終端與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的第一話單進(jìn)行分析,并基于分析結(jié)果進(jìn)行處理。

本實(shí)施例所述通信操作分析裝置可以為網(wǎng)絡(luò)設(shè)備,比如網(wǎng)絡(luò)側(cè)的服務(wù)器,或者還可以為服務(wù)器集群,也就是說(shuō)上述三個(gè)模塊可以設(shè)置于一個(gè)服務(wù)器中,也可以分別設(shè)置在不同的服務(wù)器中;另外,上述通信操作分析裝置也可以為移動(dòng)終端。

下面本實(shí)施例著重針對(duì)如何采用上網(wǎng)模型進(jìn)行分析來(lái)具體說(shuō)明:

所述分析單元53,用于獲取到用戶采用移動(dòng)終端與移動(dòng)通信數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)交互的第一話單的記錄;從所述第一話單的記錄中提取得到特征量;基于所述第一話單的記錄對(duì)應(yīng)的特征量、以及所述上網(wǎng)模型,計(jì)算得到所述第一話單記錄對(duì)應(yīng)的概率值,將所述概率值作為針對(duì)所述第一話單的分析結(jié)果。

相應(yīng)的,所述分析單元53,用于判斷分析結(jié)果中包含的概率值是否大于預(yù)設(shè)門限值;若大于,則確定所述第一話單為正常操作;若不大于,則確定所述第一話單為異常操作,針對(duì)所述第一話單生成提示信息。

采用建立用戶話單概率模型,有效地判斷用戶異常上網(wǎng)話單,降低用戶不知情產(chǎn)生流量的情況,提高公司收入。從本方案實(shí)施后,“未上網(wǎng)卻產(chǎn)生流量費(fèi)用”和“使用量小費(fèi)用很高”兩大類用戶投訴,給用戶退費(fèi)率下降15%,重復(fù)投訴率也下降了10%,凈化了手機(jī)上網(wǎng)環(huán)境,提升了客戶滿意度,維護(hù)了中國(guó)移動(dòng)的良好企業(yè)形象,創(chuàng)造了巨大的社會(huì)效益。

首先提取用戶上網(wǎng)特征進(jìn)行建模,用戶上網(wǎng)特征的主要原理是結(jié)合用戶日常上網(wǎng)習(xí)慣,建立用戶上網(wǎng)特征庫(kù),抽取每次上網(wǎng)特征數(shù)據(jù),與特征庫(kù)里規(guī)則進(jìn)行匹配,根據(jù)規(guī)則匹配的結(jié)果判斷用戶每次上網(wǎng)行為是否存在安全隱患。本文采集用戶終端上網(wǎng)話單進(jìn)行特征分析,并進(jìn)行概率模型建模。因?yàn)樯暇W(wǎng)話單在應(yīng)用領(lǐng)域中適用的范圍比較廣闊,其特征數(shù)據(jù)豐富、特征明顯、結(jié)果可靠、處理及時(shí)性強(qiáng)。

(1)采集用戶終端產(chǎn)生話單中的用戶號(hào)碼、上網(wǎng)時(shí)間、上網(wǎng)流量、上網(wǎng)頻率、用戶imei等各個(gè)維度信息,并對(duì)樣本集信息進(jìn)行聚類分析,降低存儲(chǔ)量,這樣在樣本集極少的情況下,能夠得到與原樣本集相似的概率函數(shù),快速有效地建立用戶上網(wǎng)話單特征模型。匹配用戶上網(wǎng)話單,如果用戶上網(wǎng)話單特征與用戶平時(shí)上網(wǎng)習(xí)慣嚴(yán)重不符,那么這些話單將被定位成疑似異常上網(wǎng)話單。

(2)用戶話單匹配用戶上網(wǎng)話單特征模型,進(jìn)行概率計(jì)算。當(dāng)概率低于一定值時(shí),則判斷用戶上網(wǎng)話單不符合用戶上網(wǎng)習(xí)慣,那么將這些話單判定為疑似異常上網(wǎng)話單,并對(duì)用戶進(jìn)行短信告知。

用戶自主產(chǎn)生的上網(wǎng)流量話單一般具有一定的規(guī)律和特征,本實(shí)施例利用該特性來(lái)判斷用戶話單是否正常,符合以往用戶上網(wǎng)特征的判別為正常話單,差異較大則判別為異常話單,及時(shí)通知用戶,避免損失。本實(shí)施例實(shí)現(xiàn)方案中首先采集用戶終端上網(wǎng)話單進(jìn)行特征分析,并將其重要特征進(jìn)行聚類預(yù)處理,進(jìn)而進(jìn)行概率模型建模,形成上網(wǎng)話單模型,然后匹配用戶的上網(wǎng)話單與話單模型,進(jìn)行概率計(jì)算,通過(guò)其值來(lái)判斷用戶的話單是否正常。

聚類預(yù)處理用戶話單可以解決概率計(jì)算復(fù)雜度大、對(duì)硬件存儲(chǔ)要求較高的問(wèn)題,同時(shí)聚類學(xué)習(xí)過(guò)程還具有以下優(yōu)勢(shì):(1)高度的可伸縮性,即在聚類話單數(shù)據(jù)集合非常大時(shí),仍能夠得到較滿意的聚類分類效果;(2)抗噪聲數(shù)據(jù)的性能強(qiáng),實(shí)際的樣本數(shù)據(jù)庫(kù)中的數(shù)據(jù)可能包含孤立的點(diǎn)甚至是錯(cuò)誤的數(shù)據(jù),聚類算法對(duì)這些類似噪聲的數(shù)據(jù)不敏感,不會(huì)影響聚類的效果。因此,將用戶話單的各個(gè)特征進(jìn)行聚類分析,有助于提高計(jì)算效率。

話單概率模型建立是采用非參數(shù)核密度估計(jì)算法,該算法可以直接從觀測(cè)數(shù)據(jù)中估計(jì)未知密度函數(shù),所以不需要假定模型的參數(shù)或者對(duì)參數(shù)進(jìn)行優(yōu)化的工作,因此該方法已經(jīng)被廣泛應(yīng)用于魯棒的復(fù)雜數(shù)據(jù)建模。在非參數(shù)核密度估計(jì)算法中,取話單序列中連續(xù)的n條話單作為樣本,則沿著時(shí)間軸,每個(gè)話單特征都有n個(gè)樣本值,于是可以為每個(gè)話單特征建立一個(gè)概率模型。當(dāng)話單樣本足夠多時(shí),核密度估計(jì)能夠逐漸的收斂于真實(shí)話單模型。

可見(jiàn),通過(guò)采用上述方案,能夠基于用戶的歷史上網(wǎng)話單確定至少一個(gè)基本特征因子,進(jìn)而基于歷史上網(wǎng)話單的至少一個(gè)基本特征因子確定上網(wǎng)模型,并利用上網(wǎng)模型對(duì)用戶產(chǎn)生的第一話單進(jìn)行分析,最終能夠基于分析結(jié)果進(jìn)行處理。首先采用上網(wǎng)話單特征因子進(jìn)行處理的方式能夠降低資源占用率,提高計(jì)算效率;并且通過(guò)上網(wǎng)模型的建立確定出針對(duì)話單的分析結(jié)果,進(jìn)而能夠基于分析結(jié)果進(jìn)行處理,如此減少了用戶不知情產(chǎn)生流量的情況。

本發(fā)明實(shí)施例所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基 于這樣的理解,本發(fā)明實(shí)施例的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī)、網(wǎng)絡(luò)設(shè)備、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分。而前述的存儲(chǔ)介質(zhì)包括:u盤、移動(dòng)硬盤、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。這樣,本發(fā)明實(shí)施例不限制于任何特定的硬件和軟件結(jié)合。

以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1