本發(fā)明涉及移動互聯(lián)網(wǎng)技術(shù),尤指一種獲取用戶感知速率的方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)應(yīng)用的快速增多,電信運(yùn)營商也開始重視用戶體驗(yàn)。通過對用戶移動上網(wǎng)記錄的數(shù)據(jù)分析,可以觀察用戶上網(wǎng)喜好,并反向指導(dǎo)內(nèi)容提供商及時擴(kuò)容帶寬以及運(yùn)營商進(jìn)行基站優(yōu)化。
通常,移動用戶上網(wǎng)記錄系統(tǒng)是從省分的核心網(wǎng)Gn接口直接進(jìn)行分光采集的,數(shù)據(jù)經(jīng)過深度包檢測(DPI,Deep Packet Inspection)過濾后,上傳至集團(tuán)統(tǒng)一的系統(tǒng)數(shù)據(jù)庫中,由于采集設(shè)備分別部署在全國31省,而數(shù)據(jù)存儲到數(shù)據(jù)庫時并沒有按照省分來區(qū)分,而是按照時間順序進(jìn)行存儲,每一條上網(wǎng)記錄都包含上網(wǎng)的開始時間和截止時間,還包含用戶上網(wǎng)的上行流量/下行流量、訪問統(tǒng)一資源定位符(URL)或者IP地址等。
由于用戶可能同時發(fā)起多個鏈接,例如蘋果手機(jī)在后臺同時運(yùn)行多個程序,因此,如果按照現(xiàn)有獲取用戶感知速率的方法,即單純的以用戶上網(wǎng)總流量除以上網(wǎng)總時長來計算用戶訪問應(yīng)用的速率,忽略了用戶并發(fā)的上網(wǎng)記錄,導(dǎo)致得到的速率比實(shí)際偏小,不能準(zhǔn)確獲知用戶感知速率。其中,用戶感知速率相當(dāng)于用戶使用app或者通過手機(jī)終端訪問某URL時的平均速率,也即用戶在手機(jī)端感受到的訪問應(yīng)用的速率。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述技術(shù)問題,本發(fā)明提供了一種獲取用戶感知速率的方法及裝置,能夠準(zhǔn)確獲得用戶感知速率。
為了達(dá)到本發(fā)明目的,本發(fā)明提供了一種獲取用戶感知速率的方法,其包括:劃定若一個或一個以上時間點(diǎn);
利用劃分的時間點(diǎn)對用戶的所有上網(wǎng)記錄進(jìn)行切片,如果上網(wǎng)的開始時間和截止時間跨過預(yù)先劃定的時間點(diǎn),且上網(wǎng)流量大于預(yù)先設(shè)置的流量閾值,提取滿足上述條件的有效記錄;
分別計算提取出的每條有效記錄對應(yīng)的速率,根據(jù)計算得到的各速率獲取用戶感知速率。
所述分別計算提取出的每條有效記錄對應(yīng)的速率,根據(jù)計算得到的各速率獲取用戶感知速率包括:
將每條所述有效記錄的上網(wǎng)流量除以其對應(yīng)的上網(wǎng)時長,得到所述提取出的每條有效記錄對應(yīng)的速率;
按照不同的位置區(qū)碼和小區(qū)標(biāo)識LAC+CI或者應(yīng)用APP名稱,將提取出的對應(yīng)不同基站或者APP的速率進(jìn)行算數(shù)平均運(yùn)算,獲得所述用戶感知速率。
所述時間點(diǎn)包括兩個或兩個以上;所述根據(jù)計算得到的各速率獲取用戶感知速率包括:
按照不同的位置區(qū)碼和小區(qū)標(biāo)識LAC+CI或者應(yīng)用APP名稱,將提取出的對應(yīng)不同基站或者APP的速率進(jìn)行算數(shù)平均運(yùn)算;
再對計算得到的所有同一基站或訪問同一APP的平均速率求平均值,獲得所述用戶感知速率。
該方法還包括:獲取用戶上網(wǎng)喜好信息;
結(jié)合獲得的用戶上網(wǎng)喜好信息及所述用戶感知速率,獲取所述用戶的總感知得分。
本發(fā)明還提供了一種獲取用戶感知速率的裝置,至少包括切片模塊、計算模塊;其中,
切片模塊,用于利用預(yù)先劃分的一個或一個以上時間點(diǎn)對用戶的所有上網(wǎng)記錄進(jìn)行切片,如果上網(wǎng)的開始時間和截止時間跨過預(yù)先劃定的時間點(diǎn),且上網(wǎng)流量大于預(yù)先設(shè)置的流量閾值,提取滿足上述條件的有效記錄;
計算模塊,用于分別計算提取出的每條有效記錄對應(yīng)的速率,根據(jù)計算得到的各速率獲取用戶感知速率。
所述計算模塊具體用于:將每條所述有效記錄的上網(wǎng)流量除以其對應(yīng)的上網(wǎng)時長,得到提取出的每條有效記錄對應(yīng)的速率;按照不同的LAC+CI或者APP名稱,將不同基站或者APP的速率進(jìn)行算數(shù)平均運(yùn)算,獲得用戶感知速率。
所述預(yù)先劃定的時間點(diǎn)包括兩個或兩個以上;
所述計算模塊還用于:對計算得到的所有同一基站或訪問同一APP的平均速率求平均值,獲得所述用戶感知速率。
所述計算模塊還用于:結(jié)合用戶上網(wǎng)喜好信息和所述計算得到的用戶感知速率,獲取所述用戶的總感知得分。
與現(xiàn)有技術(shù)相比,本發(fā)明包括劃定一個或一個以上時間點(diǎn);利用劃分的時間點(diǎn)對用戶的所有上網(wǎng)記錄進(jìn)行切片,如果上網(wǎng)的開始時間和截止時間跨過預(yù)先劃定的時間點(diǎn),且上網(wǎng)流量大于預(yù)先設(shè)置的流量閾值,提取滿足上述條件的有效記錄;分別計算提取出的每條有效記錄對應(yīng)的速率,根據(jù)計算得到的各速率獲取用戶感知速率。本發(fā)明技術(shù)方案通過對上網(wǎng)記錄的篩選,利用有效記錄進(jìn)行用戶感知速率的計算,準(zhǔn)確獲得了用戶感知速率,客觀地反映了用戶上網(wǎng)時的網(wǎng)絡(luò)狀況。
進(jìn)一步地,本發(fā)明技術(shù)方案結(jié)合用戶喜好信息,得到了用戶實(shí)際使用網(wǎng)絡(luò)的感知情況。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
附圖說明
附圖用來提供對本發(fā)明技術(shù)方案的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本申請的實(shí)施例一起用于解釋本發(fā)明的技術(shù)方案,并不構(gòu)成對本發(fā)明技術(shù)方案的限制。
圖1為本發(fā)明獲取用戶感知速率的方法的流程圖;
圖2為本發(fā)明有效記錄示意圖;
圖3為本發(fā)明獲取用戶感知速率的裝置的組成結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下文中將結(jié)合附圖對本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說明。需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。
在附圖的流程圖示出的步驟可以在諸如一組計算機(jī)可執(zhí)行指令的計算機(jī)系統(tǒng)中執(zhí)行。并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
發(fā)明人發(fā)現(xiàn),用戶通過移動終端如手機(jī)每發(fā)出一個數(shù)據(jù)包,接收到應(yīng)答,就會生成一條上網(wǎng)記錄,以用戶訪問百度網(wǎng)站為例,假設(shè)一個數(shù)據(jù)包需要訪問百度的兩個資源(比如百度的圖片在一個服務(wù)器上,內(nèi)容在另外一個服務(wù)器上),這時,由于用戶發(fā)出一個訪問請求,百度收到后,向不同的后臺服務(wù)器轉(zhuǎn)發(fā)了兩條請求,一個請求圖片,一個請求文字,也就是說生成了兩條不同的上網(wǎng)記錄,但是,事實(shí)上這兩條上網(wǎng)記錄是同時發(fā)生的,也就是說在同一時間點(diǎn)產(chǎn)生了多條上網(wǎng)記錄,這樣按照現(xiàn)有的單純考慮總流量/總時間來確定用戶訪問應(yīng)用的速率是不準(zhǔn)確的,其中,上網(wǎng)詳單中的上網(wǎng)結(jié)束時間減去上網(wǎng)開始時間等于一條記錄的總時間,因?yàn)橥粫r間只考慮了一條上網(wǎng)記錄的流量,因此計算出來的速率小了(因?yàn)樵谟嬎闼俣葧r,必須兩個都得算上,否則總時間變多了即分母變大了)。因此,本文中提出一種利用劃分的時間點(diǎn)對用戶的所有上網(wǎng)記錄進(jìn)行切片,僅提取有效記錄(避免了存在同一時間點(diǎn)存在多條記錄的情況),并根據(jù)每條有效記錄對應(yīng)的速率獲取用戶感知速率,以更加客觀地反映網(wǎng)絡(luò)情況,從而準(zhǔn)確獲得用戶感知速率。
圖1為本發(fā)明獲取用戶感知速率的方法的流程圖,如圖1所示,為了提高用戶感知速率計算的準(zhǔn)確性,本發(fā)明方法包括:
步驟100:劃定一個或一個以上時間點(diǎn)。
其中,時間點(diǎn)的劃分可以1分鐘劃一個時間點(diǎn),比如:08:00:00開始到09:00:00共計可以劃定60個時間點(diǎn)。
本步驟中,時間點(diǎn)的數(shù)量以能夠覆蓋到用戶的上網(wǎng)記錄為準(zhǔn),可以根據(jù) 對以往用戶上網(wǎng)記錄的統(tǒng)計確定,對于本領(lǐng)域技術(shù)人員來講是容易實(shí)現(xiàn)的,這里不再贅述。
步驟101:利用劃分的時間點(diǎn)對用戶的所有上網(wǎng)記錄進(jìn)行切片,如果上網(wǎng)的開始時間和截止時間跨過預(yù)先劃定的時間點(diǎn),且上網(wǎng)流量大于預(yù)先設(shè)置的流量閾值,提取滿足上述條件的有效記錄。
本步驟中,流量閾值可以設(shè)置為如100K,如此處理,可以忽略掉一些因?yàn)樾奶畔⒍a(chǎn)生的無效記錄。這里,對于上網(wǎng)流量小于預(yù)先設(shè)置的流量閾值的記錄,通常都是與用戶無關(guān)的記錄如心跳信息,只是長時間保持在線,通常很小,只要流量閾值設(shè)置合適如幾個KB,就能將這部分記錄剔除掉。
本發(fā)明中通過對開始時間和結(jié)束時間進(jìn)行區(qū)間劃分,將落在目標(biāo)線上的同一網(wǎng)站的記錄的速率進(jìn)行疊加,避免了存在同一時間點(diǎn)存在多條記錄的情況。
步驟102:分別計算提取出的每條有效記錄對應(yīng)的速率,根據(jù)計算得到的各速率獲取用戶感知速率。
提取出的每一條上網(wǎng)記錄都包含有用戶上網(wǎng)的信息,比如開始時間,結(jié)束時間,上行流量,下行流量,訪問URL等參數(shù)。本步驟具體包括:
將每條有效記錄的上網(wǎng)流量除以其對應(yīng)的上網(wǎng)時長,即得到提取出的每條有效記錄對應(yīng)的速率;
按照不同的位置區(qū)碼和小區(qū)標(biāo)識(LAC+CI)或者APP名稱,將提取出的對應(yīng)不同基站或者APP的速率進(jìn)行算數(shù)平均運(yùn)算,即可以獲得用戶感知速率。本發(fā)明中,用戶感知速率可以是針對單個用戶的,也可以是針對群體用戶的,比如經(jīng)常使用騰訊的用戶即訪問APP的速率,或者經(jīng)常使用北京王府井基站的用戶即基站速率等,不同維度,需要根據(jù)具體需求提取用戶群體,但是計算方法是類似的。感知可以是一個應(yīng)用,也可以是一個地方,不同的場景對應(yīng)的原始上網(wǎng)記錄的提取是不一樣的,但是提取出來的算法是一樣的。也就是說,感知是一個概念,用戶在不同場景下的上網(wǎng)速率,或者某個用戶群體,比如經(jīng)常登錄微信的用戶,是用戶感受到的上網(wǎng)速率等。
圖2為本發(fā)明有效記錄示意圖,如圖2所示,假設(shè)選擇時刻1作為時間 標(biāo)記,查詢當(dāng)前上網(wǎng)移動記錄的數(shù)據(jù)庫,對于上網(wǎng)流量大于預(yù)先設(shè)置的流量閾值,且開始時間A小于時刻1,且結(jié)束時間B大于時刻1的記錄,系統(tǒng)即認(rèn)為是當(dāng)前有效記錄,對于所有有效的記錄,再進(jìn)行URL匹配,得到用戶在使用某個APP或者訪問某個網(wǎng)站時的均速。這里,時刻1可以是通過統(tǒng)計選取出的用戶集中上網(wǎng)的時刻,比如晚上6:00~9:00的某一時刻等。
其中,有效記錄是針對不同的需求的,如果要獲取基站的用戶感知速率,有效記錄指的是:LAC+CI相同的、經(jīng)過切片提取出的記錄;如果要獲取APP的用戶感知速率,有效記錄指的是:訪問相同URL的、經(jīng)過切片提取出的記錄;如果是獲取某個用戶的用戶感知速率,有效記錄指的是:用戶號碼相同的、經(jīng)過切片提取出的記錄。
以單個用戶的手機(jī)號碼為統(tǒng)計目標(biāo),網(wǎng)站A的速率為例,可得:
假設(shè)記錄2和記錄4是訪問同一個網(wǎng)站如網(wǎng)站A的速率,則步驟102中的根據(jù)計算得到的各速率獲取用戶感知速率為:用戶訪問網(wǎng)站A的平均速率即訪問該網(wǎng)站的用戶感知速率:平均速率(網(wǎng)站A)=[平均速率(記錄2)+平均速率(記錄4)]。
進(jìn)一步地,如果預(yù)先劃定的時間點(diǎn)包括兩個或兩個以上,那么,步驟102中的根據(jù)計算得到的各速率獲取用戶感知速率包括:對計算得到的所有同一基站或訪問同一APP的平均速率求平均值,最終獲得用戶感知速率。
進(jìn)一步地,通常一個用戶不可能只訪問一個網(wǎng)站,在訪問過程中帶有個人喜好,比如一個不喜歡的網(wǎng)站,無所謂網(wǎng)速快慢,因?yàn)槠綍r訪問的比較少,但是如果一個經(jīng)常訪問的網(wǎng)站,速度較慢就會影響用戶的上網(wǎng)體驗(yàn),影響用戶感知,用戶感知指標(biāo)集就是根據(jù)用戶喜好建立的影響因子,比如愛看視頻,則視頻類網(wǎng)站比重較大,如果愛上網(wǎng),則WEB類網(wǎng)站比重較大。通過結(jié)合用戶上網(wǎng)喜好,得到了用戶實(shí)際使用網(wǎng)絡(luò)的感知情況,有利于運(yùn)營商改善網(wǎng)絡(luò)情況。
用戶感知指標(biāo)集既包括用戶實(shí)際的上網(wǎng)流量,喜好信息,也包括訪問網(wǎng)站或者應(yīng)用的速率,對于每個不同的因素給予不同的權(quán)值(可以根據(jù)實(shí)際經(jīng)驗(yàn)或者大量數(shù)據(jù)統(tǒng)計得到,屬于本領(lǐng)域技術(shù)人員容易得到的,這里不再贅述),可以得到用戶感知的得分,即:Total=A1*B1+A2*B2+...+A10*B10,其中,Ai表示某個應(yīng)用某個用戶的愛好得分,愛好得分按照預(yù)設(shè)數(shù)量x的用戶最常用的應(yīng)用或者網(wǎng)站來排序,如TOP1得10分、TOP2得9分…TOPx等0分等;Bi表示某個應(yīng)用某個用戶的速度得分,速度得分按照預(yù)設(shè)數(shù)量x的接入用戶最常用的應(yīng)用或者網(wǎng)站的平均速度來排序,如TOPx得10分、TOP(x-1)得9分…TOP1得0分等。
舉例來看,假設(shè)通過本發(fā)明圖1所示的方法,統(tǒng)計用戶最常用的應(yīng)用或者網(wǎng)站的前十位即TOP10,通過感知到的平均速率也會相應(yīng)地得到接入某個URL或者APP的平均速度,并對這10個應(yīng)用的接入速度進(jìn)行排序,第一名10分,第二名9分,以此類推,直至最后一名1分,上述公式A1代表最經(jīng)常使用的APP或者網(wǎng)站的愛好得分,TOP1為10分,以此類推,TOP10為1分,分別乘以對應(yīng)的接入速度得分,即得到單個用戶的總感知得分,這個得分越高感知越好。
對于目標(biāo)群體的感知得分求平均,即可得到用戶對于整個網(wǎng)絡(luò)的感知情況。對于單個應(yīng)用的感知評價可以采用如下方法:例如:某個應(yīng)用或者網(wǎng)站有100個用戶,在用戶1的記錄中,速度排名Top2,得9分,最常使用排名Top5,得5分,感知得分為9*5=45分,如果記錄中沒有排進(jìn)前10,則得分為0,將所有的用戶得分求平均,則可以得到該應(yīng)用或者網(wǎng)站的平均得分。TOP10的統(tǒng)計也可以擴(kuò)展為TOP20,TOPN,得分也進(jìn)行相應(yīng)的擴(kuò)展。
圖3為本發(fā)明獲取用戶感知速率的裝置的組成結(jié)構(gòu)示意圖,如圖3所示,至少包括切片模塊、計算模塊;其中,
切片模塊,用于利用預(yù)先劃分的一個或一個以上時間點(diǎn)對用戶的所有上網(wǎng)記錄進(jìn)行切片,如果上網(wǎng)的開始時間和截止時間跨過預(yù)先劃定的時間點(diǎn),且上網(wǎng)流量大于預(yù)先設(shè)置的流量閾值,提取滿足上述條件的有效記錄;
計算模塊,用于分別計算提取出的每條有效記錄對應(yīng)的速率,根據(jù)計算得到的各速率獲取用戶感知速率。
其中,計算模塊具體用于:將每條有效記錄的上網(wǎng)流量除以其對應(yīng)的上網(wǎng)時長,得到提取出的每條有效記錄對應(yīng)的速率;按照不同的LAC+CI或者APP名稱,將不同基站或者APP的速率進(jìn)行算數(shù)平均運(yùn)算,獲得用戶感知速率。
進(jìn)一步地,預(yù)先劃定的時間點(diǎn)包括兩個或兩個以,計算模塊還用于:對計算得到的所有同一基站或訪問同一APP的平均速率求平均值,獲得所述用戶感知速率。
進(jìn)一步地,計算模塊還用于:結(jié)合用戶上網(wǎng)喜好信息和計算得到的用戶感知速率,獲取用戶的總感知得分。
雖然本發(fā)明所揭露的實(shí)施方式如上,但所述的內(nèi)容僅為便于理解本發(fā)明而采用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所揭露的精神和范圍的前提下,可以在實(shí)施的形式及細(xì)節(jié)上進(jìn)行任何的修改與變化,但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。