的所述機器行為流量,獲得所述第一指定時間內(nèi)的用戶行為流量。
[0083]在現(xiàn)有技術(shù)中通常會將電子設(shè)備產(chǎn)生的所有行為流量都視為用戶行為流量,而實質(zhì)上有些電子設(shè)備的行為流量使電子設(shè)備自動行為產(chǎn)生的機器行為流量。顯然這種估算或確定用戶行為流量的確定結(jié)果,極其不精確。在本實施例中在步驟S110中將統(tǒng)計總流量。在步驟S120中將統(tǒng)計機器行為流量,并通過將將確定總流量與機器行為流量的差值等方式,確定出用戶行為流量。當(dāng)然所述步驟S120也可以直接為確定出總流量中哪些行為流量為用戶行為流量,并最終統(tǒng)計出各個用戶行為流量。這里的機器行為流量為機器觸發(fā)導(dǎo)致的流量,用戶行為流量為用戶操作行為觸發(fā)而導(dǎo)致的流量。
[0084]所述第一指定時間為任意一個指定的時長長度,如一天、一周、兩周或一個月等。
[0085]本實施例中所述機器行為流量可包括電子設(shè)備運行過程中的應(yīng)用程序更新、信息自動刷新等機器行為產(chǎn)生的流量。例如,手機中安裝有意炒股軟件,炒股軟件的升級更新可視為本實施例中所述的機器行為流量。所述炒股軟件中的炒股信息的自動刷新可認為所述機器行為流量。電子設(shè)備接收的網(wǎng)絡(luò)服務(wù)器等其他電子設(shè)備自動推送信息產(chǎn)生的流量也可以視為所述機器行為流量。總之所述機器行為流量可認為是所述電子設(shè)備的自動行為觸發(fā)產(chǎn)生的流量。所述電子設(shè)備的自動行為可為電子設(shè)備內(nèi)置指令觸發(fā)產(chǎn)生的流量。所述電子設(shè)備內(nèi)置指令為未基于用戶設(shè)置行為而形成的預(yù)置指令。
[0086]所述用戶行為流量為基于用戶操作行為產(chǎn)生的流量,具體如用戶打開搜索網(wǎng)頁,輸入搜索關(guān)鍵字,產(chǎn)生的上網(wǎng)行為流量。用戶點擊播放視頻,產(chǎn)生的視頻播放流量,用戶利用電子設(shè)備進行社交,產(chǎn)生的社交流量等??傊脩粜袨榱髁渴腔谟脩裟硞€或某一系列被電子設(shè)備檢測到的用戶操作而產(chǎn)生的流量。所述用戶操作可以為手勢操作、語音操作、目艮神示意操作等各種與電子設(shè)備進行交互的用戶交互行為的操作。
[0087]值得注意的是:在進行流量統(tǒng)計時,通常首先對設(shè)備產(chǎn)生的流量進行應(yīng)用識別,進而基于應(yīng)用對流量進行分類。后續(xù)的學(xué)習(xí)和判決都是針對基于同一應(yīng)用流量進行的。一個設(shè)備上可能運行不同應(yīng)用,如果不加以區(qū)分,識別準(zhǔn)確性無法得到保障。故在本實施例所述的用戶行為流量獲取方法中,將總流量中的機器行為流量剔除的過程中,也可以是基于每一個應(yīng)用的流量進行的。
[0088]在步驟S110中可以基于流量日志,統(tǒng)計得到所述第一指定時間內(nèi)的總流量。所述流量日志為記錄了電子設(shè)備各個行為產(chǎn)生的行為流量。
[0089]流量日志體現(xiàn)的可為:上網(wǎng)行為管理設(shè)備基于用戶和應(yīng)用維度對網(wǎng)絡(luò)流量的周期性采樣結(jié)果。流量日志可以描述特定用戶特定應(yīng)用每分鐘上行下行流量的數(shù)值。在流量曰志中,用戶行為流量和機器行為流量混雜在一起。如果希望通過應(yīng)用流量日志準(zhǔn)確的分析用戶行為,需要能夠剔除機器行為流量。通常流量日志記錄的信息可包括流量產(chǎn)生的時間、流量產(chǎn)生的用戶賬號,流量產(chǎn)生的應(yīng)用等信息,這樣的話,顯然可以通過數(shù)據(jù)統(tǒng)計,確定出各個用戶賬號下,特定應(yīng)用每分鐘的上行和下行流量的流量值。
[0090]故步驟S110中可通過流量日志統(tǒng)計出所述總流量。
[0091]當(dāng)然所述步驟S110還可包括利用計數(shù)器統(tǒng)計所述電子設(shè)備通信接口的收發(fā)數(shù)據(jù)量,獲得所述電子設(shè)備在第一指定時間內(nèi)產(chǎn)生的總流量。
[0092]在步驟S120可通過記錄每一個用戶操作及用戶操作的時間,形成用戶操作記錄,將用戶操作記錄與流量日志進行比對,可確定出流量日志中哪些行為流量是基于用戶操作產(chǎn)生的,則其他的部分可認為是機器行為產(chǎn)生的流量,這樣的話,在步驟S130中可通過提剔除機器行為流量確定出總流量中的用戶行為流量。當(dāng)然具體實現(xiàn)方式有很多種,不局限于此處的舉例;以下提供兩種確定總流量中每一個行為流量是否為機器行為流量的可實現(xiàn)方式。
[0093]方式一為流量基線分析法,方式二為流量突變分析法。
[0094]在介紹兩種方式之前,先來分析研究一下機器行為流量和用戶行為的特性。
[0095]機器行為流量的特性:
[0096]第一:機器行為流量具有周期性。應(yīng)用的保持激活狀態(tài)、檢查更新、信息刷新等操作過一般由程序自身的定時器自動觸發(fā),在應(yīng)用的保持激活狀態(tài)、檢查更新、信息刷新時,在流量上也會呈現(xiàn)周期性。如利用流量日志來積極性流量產(chǎn)生的記錄,則在流量日志上體現(xiàn)為流量的周期性波動。
[0097]第二:機器行為流量具有相似性。應(yīng)用的通訊一般由固定的信令所組成。同樣的業(yè)務(wù),每次運行業(yè)務(wù)時通訊信令的內(nèi)容是相似的。在流量日志上體現(xiàn)為,流量在上行或下行方向上產(chǎn)生的流量值具有相似性。
[0098]第三:機器行為流量的持續(xù)時間長,應(yīng)用自動產(chǎn)生的流量往往貫穿應(yīng)用程序運行的始終,其存在時間往往遠遠長于用戶行為流量的時長。
[0099]綜合上述特點,機器行為所產(chǎn)生的流量適于使用流量基線模型進行描述。即在較長的時間范圍來看,上行或下行流量大小的值有絕大部分分布在特定的幾個值域區(qū)間內(nèi)。
[0100]而與此相對,由用戶操作所觸發(fā)的用戶行為流量具有的特征為:時間突發(fā)性,流量大小突變性和持續(xù)時間相對短促。用戶操作所觸發(fā)的用戶行為流量,其每分鐘上行或下行流量的大小,往往分布于機器行為流量的流量基線之外,同時在時序上看,也表現(xiàn)為上行或下行流量大小的突變。
[0101]本實施例方式一和方式二是基于機器行為流量和用戶行為流量的特性而提出的。
[0102]方式一:
[0103]如圖2所示,所述步驟S120可包括:
[0104]步驟S1201:分析所述總流量,確定所述第一指定時間內(nèi)流量基線范圍;
[0105]步驟S1202:確定所述電子設(shè)備各個行為流量是否位于所述流量基線范圍內(nèi);
[0106]步驟S1203:若一個所述行為流量位于所述流量基線范圍外,則確定所述行為流量為所述用戶行為流量。
[0107]由于機器行為流量的持續(xù)時間長,統(tǒng)計一個較長時間內(nèi),該較長時間即為所述第一指定時間。通常所述第一指定時間可為半天以上的時間長度。通過統(tǒng)計該第一指定時間長度的流量基線范圍。所述流量基線范圍至少對應(yīng)有上基線邊界;所述上基線邊界可理解為流量基礎(chǔ)上限值。在步驟S1201中將判斷每個行為流量是否不大于所述上基線邊界,若不大于所述上基線邊界,則該行為流量為機器行為流量。當(dāng)然所述基線流量范圍可包括上基線邊界和下基線邊界。
[0108]譬如手機登陸有QQ,為了確保QQ處于激活狀態(tài),網(wǎng)絡(luò)側(cè)的服務(wù)器通常會與手機中QQ的檢測數(shù)據(jù)包的交互,確定QQ是否處于激活狀態(tài),這個時候產(chǎn)生的為所述機器行為流量。通常所述檢測數(shù)據(jù)包的包長都較小,且呈現(xiàn)周期性。若用戶此時利用QQ與QQ好友進行QQ通話,顯然會產(chǎn)生大量的流量,這個流量就會遠遠大于檢測數(shù)據(jù)包造成的流量。在本實施例中通過對第一指定時間長度的總流量確定出流量基線,由于總流量中包括機器行為流量和用戶行為流量。綜合這兩者每一次用戶行為流量,形成的流量基線范圍可能位于大部分用戶行為流量和機器行為流量的之間,這樣的話,就可以很好的篩選出機器行為流量和用戶行為流量。那QQ通話造成的用戶流量顯然會超過流量基線范圍,檢測數(shù)據(jù)包的流量就位于所述流量基線范圍內(nèi)的機器行為流量。
[0109]采用這種方法能夠即便精確的確定出所述機器行為流量。
[0110]所述總流量包括上行流量和下行流量。所述步驟S1201可包括:分析所述總流量中的上行流量,確定所述第一指定時間內(nèi)上行流量基線范圍;分析所述總流量中的下行流量,確定所述第一指定時間內(nèi)下行流量基線范圍。所述步驟S1202可包括:確定各個上行流量是否位于所述上行流量基線范圍;確定各個下行流量是否位于所述下行流量基線范圍。
[0111]當(dāng)然由于電子設(shè)備的行為流量根據(jù)流量傳輸方向,分為了上行流量和下行流量,在本實施例中為了進一步精確確定出用戶行為流量,將分別確定出上行流量基線范圍和下行基線范圍,分別確定出哪些上行流量為上行的機器行為流量,哪些下行流量為下行的機器行為流量。從而能夠在步驟S1203中精確確定出所述用戶行為流量。
[0112]所述步驟S1201可具體包括:采用聚類算法分析所述上行流量,形成上行流量聚類結(jié)果;基于所述上行流量聚類結(jié)果確定所述上行流量基線范圍。
[0113]所述步驟S1202還可具體包括:采用聚類算法分析所述下行流量,形成下行流量聚類結(jié)果;基于所述下行流量聚類結(jié)果確定所述下行流量基線范圍。
[0114]所述聚類算法可包括劃分法(Partit1ning Methods,PM)、層次法(HierarchicalMethods,HM)、基于密度的方法(Density-based methods)、基于網(wǎng)格的方法(Grid-basedmethods)、基于模型的方法(Model-Based Methods)。這些聚類算法將每一個行為流量視為一個元素,對每一個行為流量的流量值進行聚類,得到聚類結(jié)果。這些聚類算法的具體實現(xiàn)方式可參見現(xiàn)有技術(shù),在此就不一一舉例了。利用聚類算法進行確定基線范圍確定時,充分的利用了機器行為流量的相似性。
[0115]所述基于所述上行流量聚類結(jié)果確定所述上行流量基線范圍,包括:當(dāng)所述上行流量聚類結(jié)果表明至少有一個聚類子集包括的行為流量個數(shù)大于第一個數(shù)門限值,且所述聚類子集中的各個上行流量的標(biāo)準(zhǔn)差小于第一標(biāo)準(zhǔn)差門限時,基于所述聚類子集中的上行流量中的極限值,確定所述上行基線范圍。
[0116]所述基于所述下行流量聚類結(jié)果確定所述下行流量基線范圍,包括:當(dāng)所述下行流量聚類結(jié)果表明至少有一個聚類子集包括的行為流量個數(shù)大于第二個數(shù)門限值,且所述聚類子集中的各個下行流量的標(biāo)準(zhǔn)差小于第二標(biāo)準(zhǔn)差門限時,基于所述聚類子集中的下行流量中的極限值,確定所述下行基線范圍。
[0117]本實施例中所述第一個數(shù)門限值、第二個數(shù)門限值、第一標(biāo)準(zhǔn)差門限和第二標(biāo)準(zhǔn)差門限,都可以預(yù)先設(shè)定的值,也可以動態(tài)確定的值。例如所述第一個數(shù)門限值可為第一比例與上行流量的個數(shù)的乘積,所述第二個數(shù)門限值可為第二比例與下行流量的個數(shù)的乘積。當(dāng)然所述第一個數(shù)門限子涵、第二個數(shù)門限值、第一標(biāo)準(zhǔn)差門限和第二標(biāo)準(zhǔn)差門限都可以為通過對歷史流量信息的統(tǒng)計確定,也可以通過仿真確定的。在具體實現(xiàn)時,所述標(biāo)準(zhǔn)差及標(biāo)準(zhǔn)差門限可以用方差及方差門限來進行等效替換。這里的標(biāo)準(zhǔn)差包括所述上行流量的標(biāo)準(zhǔn)差和下行流量的標(biāo)準(zhǔn)差。所述標(biāo)準(zhǔn)差門限可包括第一標(biāo)準(zhǔn)差門限和第二標(biāo)準(zhǔn)差門限。所述標(biāo)準(zhǔn)差反映的波動性,而機器行為流量因相似性較大,則呈現(xiàn)出較小的波動性。
[0118]基于本方式提供一個具體示例:
[0?19] 步驟