一種分析通信大數(shù)據(jù)的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種分析通信大數(shù)據(jù)的方法及裝置。
【背景技術(shù)】
[0002]隨著各行業(yè)互聯(lián)網(wǎng)化進(jìn)程的加速,通信大數(shù)據(jù)分析是目前運(yùn)營商積極試水的領(lǐng)域。通信大數(shù)據(jù)分析主要是從用戶入手,通過分析用戶業(yè)務(wù)信息,獲得運(yùn)營商感興趣的價(jià)值
?目息O
[0003]現(xiàn)有技術(shù)中,通信大數(shù)據(jù)的分析主要是對(duì)用戶在移動(dòng)通信網(wǎng)中發(fā)起業(yè)務(wù)時(shí)的原始碼流進(jìn)行分析。具體的,原始碼流經(jīng)過采集、存儲(chǔ)、入庫和分析等過程,產(chǎn)生了運(yùn)營商所需的信息,供運(yùn)營商在網(wǎng)絡(luò)建設(shè)、運(yùn)營分析上進(jìn)行決策。
[0004]采用上述分析通信大數(shù)據(jù)的方法至少存在如下問題:
[0005](1)、從采集到應(yīng)用的環(huán)節(jié)較多,投入成本大。例如需要包括采集所需的采集設(shè)備、存儲(chǔ)海量數(shù)據(jù)的存數(shù)介質(zhì)、部署分布式系統(tǒng)所需的存儲(chǔ)分析設(shè)備、以及各個(gè)環(huán)節(jié)間交換數(shù)據(jù)所需的高帶寬的傳輸設(shè)備。
[0006](2)、經(jīng)過采集、存儲(chǔ)和入庫的一系列過程后才對(duì)庫中的數(shù)據(jù)進(jìn)行分析,導(dǎo)致分析實(shí)時(shí)性查,無法滿足實(shí)時(shí)分析的需求。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的實(shí)施例提供一種分析通信大數(shù)據(jù)的方法及裝置,解決了成本高和分析實(shí)時(shí)性差的冋題。
[0008]為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
[0009]本發(fā)明實(shí)施例提供一種分析通信大數(shù)據(jù)的方法,包括:
[0010]PGW接收原始碼流,所述原始碼流為用戶終端發(fā)起業(yè)務(wù)請(qǐng)求時(shí)生成的碼流;
[0011 ]所述PGW利用深度包檢測(cè)DPI技術(shù)對(duì)所述原始碼流進(jìn)行識(shí)別,獲取業(yè)務(wù)特征數(shù)據(jù),所述業(yè)務(wù)特征數(shù)據(jù)包括業(yè)務(wù)的類別信息、與所述業(yè)務(wù)相匹配的應(yīng)用程序的信息和業(yè)務(wù)占用帶寬信息;
[0012]所述PGW根據(jù)預(yù)設(shè)規(guī)則,從所述業(yè)務(wù)特征數(shù)據(jù)中提取待分析的業(yè)務(wù)特征數(shù)據(jù);
[0013]所述PGW利用預(yù)設(shè)算法對(duì)所述待分析的業(yè)務(wù)特征數(shù)據(jù)進(jìn)行分析,以生成分析結(jié)果;
[0014]所述PGW將所述分析結(jié)果推送至外部平臺(tái)。
[0015]本發(fā)明實(shí)施例提供的分析通信大數(shù)據(jù)的方法是PGW直接對(duì)其接收到的原始碼流進(jìn)行識(shí)別和分析,無需從其他設(shè)備中采集,保證了通信大數(shù)據(jù)分析的實(shí)時(shí)性。通過在PGW上擴(kuò)展并行DPI單元,利用該并行DPI單元從原始碼流中獲取包括業(yè)務(wù)的類別信息、與業(yè)務(wù)相匹配的應(yīng)用程序的信息和業(yè)務(wù)占用帶寬信息的業(yè)務(wù)特征數(shù)據(jù),該業(yè)務(wù)特征數(shù)據(jù)較現(xiàn)有技術(shù)中PGW利用原始DPI單元進(jìn)行數(shù)據(jù)識(shí)別獲取到的數(shù)據(jù)的顆粒度小,因此,本發(fā)明實(shí)施例中PGW獲取到的業(yè)務(wù)特征數(shù)據(jù)的精確度提高。進(jìn)一步地,在PGW中擴(kuò)展大數(shù)據(jù)分析單元,利用該大數(shù)據(jù)分析單元對(duì)并行DPI單元獲取到的業(yè)務(wù)特征數(shù)據(jù)進(jìn)行分析,這樣,只需PGW即可完成對(duì)通信大數(shù)據(jù)的分析,減少了成本。
[0016]進(jìn)一步地,所述PGW利用預(yù)設(shè)算法對(duì)所述待分析的業(yè)務(wù)特征數(shù)據(jù)進(jìn)行分析,以生成分析結(jié)果之前,所述方法還包括:
[0017]所述PGW獲取預(yù)先存儲(chǔ)的所述用戶終端的靜態(tài)信息,所述靜態(tài)信息包括所述用戶終端的標(biāo)識(shí)、所述用戶終端的簽約信息或者所述用戶終端的地理位置信息中的至少一種。
[0018]相應(yīng)的,所述PGW利用預(yù)設(shè)算法對(duì)所述待分析的業(yè)務(wù)特征數(shù)據(jù)進(jìn)行分析,以生成分析結(jié)果,包括:
[0019]所述PGW利用預(yù)設(shè)算法對(duì)所述待分析的業(yè)務(wù)特征數(shù)據(jù)和所述用戶終端的靜態(tài)信息進(jìn)行分析,以生成分析結(jié)果。
[0020]PGW結(jié)合用戶終端的靜態(tài)信息進(jìn)行大數(shù)據(jù)分析,能夠滿足更多維度的大數(shù)據(jù)分析需求。
[0021 ]本發(fā)明的另一實(shí)施例提供一種PGW,包括:
[0022]接收單元,用于接收原始碼流,所述原始碼流為用戶終端發(fā)起業(yè)務(wù)請(qǐng)求時(shí)生成的碼流;
[0023]并行深度包檢測(cè)DPI單元,用于利用深度包檢測(cè)DPI技術(shù)對(duì)所述接收單元接收到的所述原始碼流進(jìn)行識(shí)別,獲取業(yè)務(wù)特征數(shù)據(jù),所述業(yè)務(wù)特征數(shù)據(jù)包括業(yè)務(wù)的類別信息、與所述業(yè)務(wù)相匹配的應(yīng)用程序的信息和業(yè)務(wù)占用帶寬信息;
[0024]提取單元,用于根據(jù)預(yù)設(shè)規(guī)則,從所述并行DPI單元獲取到的所述業(yè)務(wù)特征數(shù)據(jù)中提取待分析的業(yè)務(wù)特征數(shù)據(jù);
[0025]大數(shù)據(jù)分析單元,用于利用預(yù)設(shè)算法對(duì)所述提取單元提取的所述待分析的業(yè)務(wù)特征數(shù)據(jù)進(jìn)行分析,以生成分析結(jié)果;
[0026]發(fā)送單元,用于將所述大數(shù)據(jù)分析單元生成的所述分析結(jié)果推送至外部平臺(tái)。
[0027]進(jìn)一步地,所述PGW還包括獲取單元,
[0028]所述獲取單元,用于在所述大數(shù)據(jù)分析單元利用預(yù)設(shè)算法對(duì)所述待分析的業(yè)務(wù)特征數(shù)據(jù)進(jìn)行分析,以生成分析結(jié)果之前,獲取預(yù)先存儲(chǔ)的所述用戶終端的靜態(tài)信息,所述靜態(tài)信息包括所述用戶終端的標(biāo)識(shí)、所述用戶終端的簽約信息或者所述用戶終端的地理位置信息中的至少一種。
[0029]進(jìn)一步地,所述大數(shù)據(jù)分析單元,具體用于利用預(yù)設(shè)算法對(duì)所述待分析的業(yè)務(wù)特征數(shù)據(jù)和所述獲取單元獲取到的所述用戶終端的靜態(tài)信息進(jìn)行分析,以生成分析結(jié)果。
[0030]本發(fā)明實(shí)施例提供一種分析通信大數(shù)據(jù)的方法及裝置,PGW在接收到用戶終端發(fā)起業(yè)務(wù)請(qǐng)求時(shí)生成的原始碼流后,利用DPI技術(shù)對(duì)該原始碼流進(jìn)行識(shí)別,獲取業(yè)務(wù)特征數(shù)據(jù),然后,PGW根據(jù)預(yù)設(shè)規(guī)則從業(yè)務(wù)特征數(shù)據(jù)中提取待分析的業(yè)務(wù)特征數(shù)據(jù),最后,PGW利用預(yù)設(shè)算法對(duì)待分析的業(yè)務(wù)特征數(shù)據(jù)進(jìn)行分析,生成分析結(jié)果,并將該分析結(jié)果推送至外部-ψ-1 口 O
[0031]本發(fā)明實(shí)施例中的PGW可以直接對(duì)原始碼流進(jìn)行識(shí)別和分析,保證了對(duì)通信大數(shù)據(jù)分析的實(shí)時(shí)性,同時(shí),減少了成本。
【附圖說明】
[0032]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
[0033]圖1為本發(fā)明實(shí)施例的分析通信大數(shù)據(jù)的方法的流程示意圖一;
[0034]圖2為本發(fā)明實(shí)施例的PGW的結(jié)構(gòu)示意圖一;
[0035]圖3為本發(fā)明實(shí)施例的PGW的結(jié)構(gòu)示意圖二;
[0036]圖4為本發(fā)明實(shí)施例的PGW的結(jié)構(gòu)示意圖三。
【具體實(shí)施方式】
[0037]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0038]另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對(duì)象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,六和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另夕卜,本文中字符,一般表示前后關(guān)聯(lián)對(duì)象是一種“或”的關(guān)系。
[0039]當(dāng)本發(fā)明實(shí)施例提及“第一”、“第二”等序數(shù)詞時(shí),除非根據(jù)上下文其確實(shí)表達(dá)順序之意,否則應(yīng)當(dāng)理解為僅僅是起區(qū)分之用。
[°04°] 深度包檢測(cè)(Deep Packet Inspect1n,DPI)技術(shù)是一種基于應(yīng)用層的流量檢測(cè)和控制技術(shù)。當(dāng)網(wǎng)絡(luò)之間互連的協(xié)議(Internet Protocol,IP)數(shù)據(jù)包、傳輸控制協(xié)議(Transmiss1n Control Protocol,TCP)或用戶數(shù)據(jù)報(bào)協(xié)議(User Datagram Protocol,UDP)數(shù)據(jù)流通過基于DPI技術(shù)的帶寬管理系統(tǒng)時(shí),該系統(tǒng)通過深入讀取IP包載荷的內(nèi)容來對(duì)OSI七層協(xié)議中的應(yīng)用層信息進(jìn)行重組,從而得到整個(gè)應(yīng)用程序的內(nèi)容,然后按照系統(tǒng)定義的管理策略對(duì)流量進(jìn)行整形操作。
[0041 ] 實(shí)施例一
[0042]本發(fā)明實(shí)施例提供一種分析通信大數(shù)據(jù)的方法,如圖1所示,包括:
[0043]SlOl、PGW接收用戶終端發(fā)起業(yè)務(wù)請(qǐng)求時(shí)生成的原始碼流。
[0044]S102、PGW利用深度包檢測(cè)DPI技術(shù)對(duì)原始碼流進(jìn)行識(shí)別,獲取業(yè)務(wù)特征數(shù)據(jù)。
[0045]其中,業(yè)務(wù)特征數(shù)據(jù)包括業(yè)務(wù)的類別信息、與業(yè)務(wù)相匹配的應(yīng)用程序的信息和業(yè)務(wù)占用帶寬信息。
[0046]現(xiàn)有技術(shù)中,PGW本身已經(jīng)具備內(nèi)容計(jì)費(fèi)的功能(內(nèi)容計(jì)費(fèi)即根據(jù)用戶上網(wǎng)的業(yè)務(wù)類型,采取相應(yīng)的計(jì)費(fèi)策略進(jìn)行計(jì)費(fèi),例如用戶在使用微信業(yè)務(wù)的時(shí)候,流量費(fèi)用是0.1元/MB),而內(nèi)容計(jì)費(fèi)的基礎(chǔ)是DPI技術(shù),PGW能夠從原始碼流中識(shí)別出用戶使用的什么業(yè)務(wù)(如微信),因此PGW設(shè)備天然具備進(jìn)行通信大數(shù)據(jù)分析的基礎(chǔ)(通信大數(shù)據(jù)分析基礎(chǔ)是DPI解析,了解用戶使用了什么業(yè)務(wù))。
[0047]但是,現(xiàn)有技術(shù)中PGW利用DPI技術(shù)僅僅能夠獲取到業(yè)務(wù)所歸屬的類別信息,而無法獲取到更細(xì)粒度的信息。基于此,本發(fā)明實(shí)施例提供的分析通信大數(shù)據(jù)的方法在現(xiàn)有的PGW中增加了并行DPI單元,該并行DPI單元中存儲(chǔ)有當(dāng)前主流業(yè)務(wù)的標(biāo)識(shí)和當(dāng)前主流搜索關(guān)鍵字的信息。
[0048]具體的,PGW利用并行DPI單元從其接收到的原始碼流中識(shí)別業(yè)務(wù)的類別信息、與業(yè)務(wù)相匹配的應(yīng)用程序的信息和業(yè)務(wù)占用帶寬信息。
[0049]示例性的,用戶A使用屬于流媒體業(yè)務(wù)的應(yīng)用程序A在觀看視頻,則PGW可以通過獲取用戶A的原始碼流,識(shí)別應(yīng)用程序A和流媒體業(yè)務(wù)的信息。
[0050]S103、PGW根據(jù)預(yù)設(shè)規(guī)則,從業(yè)務(wù)特征數(shù)據(jù)中提取待分析的業(yè)務(wù)特征數(shù)據(jù)。
[0051]S104、PGW利用預(yù)設(shè)算法對(duì)待分析的業(yè)務(wù)特征數(shù)據(jù)進(jìn)行分析,以生成分析結(jié)果。
[0052]具體的,PGW在獲取到待分析的業(yè)務(wù)特征數(shù)據(jù)后,可以利用預(yù)設(shè)短發(fā)直接對(duì)該待分析的業(yè)務(wù)特征數(shù)據(jù)進(jìn)行分析。
[0053]可選的,本發(fā)明實(shí)施例中的預(yù)設(shè)算法可以為數(shù)理統(tǒng)計(jì)算法,也可以為聚類分析法,還可以為神經(jīng)網(wǎng)絡(luò)算法,還可以為其他用于大數(shù)據(jù)分析的分析算法,本發(fā)明實(shí)施例對(duì)此不作具體限定。
[0054]需要說明的是,本發(fā)明實(shí)施例中的預(yù)設(shè)算法可以根據(jù)外部平臺(tái)的實(shí)際需求的變化而變化。
[0055]進(jìn)一步地,PGW還可以獲取其預(yù)先存儲(chǔ)的用戶終端的靜態(tài)信息,例如用戶終端的標(biāo)識(shí)、用戶終端的簽約信息或者用戶終端的地理位置信息中的至少一種,然后,PGW利用預(yù)設(shè)算法對(duì)待分析的業(yè)務(wù)特征數(shù)據(jù)和用戶終端的靜態(tài)信息進(jìn)行分析,以生成分析結(jié)果。
[0056]其中,用戶終端的簽約信息是指用戶終端的服務(wù)類型和服務(wù)級(jí)別信息。例如,用戶A的簽約屬性為全球通業(yè)務(wù)、VIP用戶。
[0057]示例性的,PGW獲取用戶終端的標(biāo)識(shí)可以為用戶終端的國際移動(dòng)用戶識(shí)別碼(IMSI,Internat1nal Mobile Subs