亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種可信行為識別的方法和裝置制造方法

文檔序號:6487925閱讀:122來源:國知局
一種可信行為識別的方法和裝置制造方法
【專利摘要】本申請?zhí)峁┝艘环N可信行為識別的方法和裝置,其中所述方法包括:預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合;獲取特定行為的目標頁面焦點行為數(shù)據(jù);判斷所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合;若歸屬于可信行為數(shù)據(jù)集合,則允許所述特定行為的執(zhí)行;若歸屬于不可信行為數(shù)據(jù)集合,則中止所述特定行為的執(zhí)行。本申請的一種可信行為識別的方法和裝置,用以準確檢測出網(wǎng)上的不可信行為,提高對可信行為識別的準確性,尤其是可信支付行為的準確性,從而提高用戶網(wǎng)上操作的安全性。
【專利說明】—種可信行為識別的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本申請涉及可信計算的【技術(shù)領(lǐng)域】,特別是涉及ー種可信行為識別的方法和ー種可信行為識別的裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)技術(shù)和應(yīng)用的飛速發(fā)展,互聯(lián)網(wǎng)日益呈現(xiàn)出復(fù)雜、異構(gòu)等特點,當(dāng)前的網(wǎng)絡(luò)體系已經(jīng)暴露出嚴重的不足,網(wǎng)絡(luò)正面臨著嚴峻的安全和服務(wù)質(zhì)量保證問題等重大挑戰(zhàn)。例如,在網(wǎng)絡(luò)支付中,用戶賬戶存在大量風(fēng)險。如:賬戶盜用、賬戶欺詐。賬戶欺詐又包含很多種形式,如用戶被網(wǎng)絡(luò)釣魚、客戶端中木馬、被虛假客服欺詐等等。這些威脅嚴重影響了用戶賬戶的資金安全、信息安全。
[0003]目前,網(wǎng)絡(luò)可信問題已得到全世界的重視,保障網(wǎng)絡(luò)的可信成為網(wǎng)絡(luò)進ー步發(fā)展的迫切需求。可信計算是研究網(wǎng)絡(luò)可信的關(guān)鍵,盡管目前尚沒有一個明確的定義,但人們對可信計算的目的都有統(tǒng)ー的認識:提高網(wǎng)絡(luò)和服務(wù)的安全性。在可信計算中,可信信息的來源包括直接經(jīng)驗、推薦信息和用戶的歷史行為數(shù)據(jù)。其中,用戶的歷史行為數(shù)據(jù)是ー個最客觀的重要信息來源,其真實地反映了用戶的行為變化,但要從龐雜的用戶歷史行為數(shù)據(jù)中提取出有用的信息是非常困難的。
[0004]以網(wǎng)絡(luò)支付中的可信行為識別為例,現(xiàn)有技術(shù)中,用戶的行為風(fēng)險分析是根據(jù)用戶的業(yè)務(wù)行為進行判斷的,如針對用戶支付過程中,每個業(yè)務(wù)操作的行為:用戶登錄_》用戶瀏覽商品頁面_》用戶下單購買_》用戶確認支付進行如下分析:
[0005]I)用戶在以上整個支付環(huán)節(jié)中操作環(huán)境的可信度(如是否為異地登陸);
[0006]2)黑白名單可信度判斷(如:付款I(lǐng)P地址是否在黑名單內(nèi));
[0007]3)創(chuàng)建交易的IP地址是否頻率很快等。
[0008]這種現(xiàn)有技術(shù)往往會出現(xiàn)以下問題:
[0009]a)批量CC(ChallengeCollapsar)攻擊引起的異常支付行為,特別是ー些速率較慢的攻擊方式,如:批量創(chuàng)建交易、炒作信用的行為,這些異常交易由于完全在攻擊者控制之下進行,攻擊者即是賬戶的所有者,基于用戶支付行為的可信分析方法無法檢測出異常;
[0010]b)在正常用戶電腦中木馬,木馬在用戶電腦上自動創(chuàng)建交易、自動付款。比如:用戶在中木馬時,木馬會在用戶電腦上自動創(chuàng)建付款交易,如果用戶沒有使用安全認證產(chǎn)品、僅僅使用了數(shù)字證書,或者使用U盾且U盾正好插在電腦上的時候,就會被木馬遠程自動創(chuàng)建交易,造成用戶資金損失。
[0011]c)基于黑白名單、異地登陸等技術(shù)判斷支付過程是否可信,往往會造成較大誤殺。
[0012]d)第三方支付平臺還會遇到批量盜用的事件。黑客利用各種方式獲取用戶認證信息,并且,使用機器爬蟲進行批量登錄,批量付款,批量銷贓,造成支付平臺用戶大量資金損失和信息泄露。
[0013]以上只是列舉了ー些場景,在這些場景中,由于在用戶登錄_》用戶瀏覽商品頁面-》用戶確認購買_》用戶確認支付的過程中,用戶業(yè)務(wù)行為都是正常的,無法檢測出不可信的支付行為。即采用現(xiàn)有技術(shù)很難對可信行為進行準確識別,尤其是很難對可信支付行為進行準確識別。
[0014]因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的ー個技術(shù)問題就是:提出一種可信行為識別的機制,用以準確檢測出網(wǎng)上的不可信行為,提高對可信行為識別的準確性,尤其是可信支付行為的準確性,從而提高用戶網(wǎng)上操作的安全性。

【發(fā)明內(nèi)容】

[0015]本申請的目的是提供一種可信行為識別的方法和裝置,用以準確檢測出網(wǎng)上的不可信行為,提高對可信行為識別的準確性,尤其是可信支付行為的準確性,從而提高用戶網(wǎng)上操作的安全性。
[0016]為了解決上述問題,本申請公開了一種可信行為識別的方法,包括:
[0017]預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合;
[0018]獲取特定行為的目標頁面焦點行為數(shù)據(jù);
[0019]判斷所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合;
[0020]若歸屬于可信行為數(shù)據(jù)集合,則允許所述特定行為的執(zhí)行;
[0021]若歸屬于不可信行為數(shù)據(jù)集合,則中止所述特定行為的執(zhí)行。
[0022]優(yōu)選地,所述預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合的步驟包括:
[0023]采集歷史的頁面焦點行為數(shù)據(jù);
[0024]將所述歷史的頁面焦點行為數(shù)據(jù)按指定格式轉(zhuǎn)換為樣本數(shù)據(jù);
[0025]對所述樣本數(shù)據(jù)進行聚類,形成多個相似樣本數(shù)據(jù)的集合;
[0026]分別確定所述多個相似樣本數(shù)據(jù)的集合的類別,所述類別為可信行為類別或不可信行為類別;
[0027]將可信行為類別的相似樣本數(shù)據(jù)集合組織為可信行為數(shù)據(jù)集合,將不可信行為類別的相似樣本數(shù)據(jù)集合組織為不可信行為數(shù)據(jù)集合。
[0028]優(yōu)選地,所述頁面焦點行為數(shù)據(jù)包括:
[0029]在web頁面上的焦點行為對象;
[0030]失去/獲得焦點行為對象的動作;
[0031]失去/獲得焦點行為對象的時間;
[0032]焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
[0033]優(yōu)選地,所述預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合的步驟還包括;
[0034]將所采集的歷史頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除;
[0035]從刪除過無效數(shù)據(jù)的歷史頁面焦點行為數(shù)據(jù)中抽樣出預(yù)設(shè)數(shù)量的歷史頁面焦點行為數(shù)據(jù)。
[0036]優(yōu)選地,所述每條樣本數(shù)據(jù)包括如下數(shù)據(jù)內(nèi)容:
[0037]焦點移動最小距離al:是指兩兩焦點行為對象操作移動距離的最小值;
[0038]焦點移動最大距離a2:是指兩兩焦點行為對象操作移動距離的最大值;
[0039]焦點移動平均距離a3:是指兩兩焦點行為對象操作移動距離的平均值;[0040]焦點移動最小速度a4:是指兩兩焦點行為對象操作移動速度的最小值;
[0041]焦點移動最大速度a5:是指兩兩焦點行為對象操作移動速度的最大值;
[0042]焦點移動平均速度a6:是指兩兩焦點行為對象操作移動速度的平均值;
[0043]焦點移動總距離a7:是指所有兩兩焦點行為對象操作移動距離的總和。
[0044]優(yōu)選地,所述對樣本數(shù)據(jù)進行聚類,形成多個相似樣本數(shù)據(jù)的集合的步驟進一歩包括:
[0045]若樣本數(shù)據(jù)的集合為D= (X1, X2, , Xn],樣本數(shù)據(jù)的容量為n O Xi, i G [I, n]為某一樣本數(shù)據(jù),X = Ia1, a2,..., a,j};
[0046]使用聚類算法對所述樣本數(shù)據(jù)的集合進行聚類,假設(shè)k表示聚類的樣本數(shù)據(jù)的數(shù)目,Cj, j G [I, k]表示第j個相似樣本數(shù)據(jù)集合,則聚類后的類別相似樣本數(shù)據(jù)集合為:H=(C1, C2, , CJ ;
[0047]其中,所述聚類算法為:
[0048]假設(shè)為聚類C」.,j G [1,k]的聚類中心,Similar (Xi, Hij)為Xi和的相似度,即某條樣本數(shù)據(jù)Xi和某個相似樣本數(shù)據(jù)集合&的相似度;
[0049]定義Similarmin 為類別最小相似度,Similar (Xpmj)≤Similarmin,且 Similar (Xi,mj)是Xi和所有類別聚類中心的最大相似度,為Xi屬于某個相似樣本數(shù)據(jù)集合&的充分必要條件,其中,所述相似度采用歐式距離取倒數(shù)的計算方法。
[0050]優(yōu)選地,所述分別確定多個相似樣本數(shù)據(jù)的集合的類別的步驟進一歩包括:
[0051]獲取所述相似樣本數(shù)據(jù)集合中樣本數(shù)據(jù)的IP地址;
[0052]統(tǒng)計所述相似樣本數(shù)據(jù)集合中各IP地址所占百分比的均值,若高于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;若低于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別。
[0053]優(yōu)選地,所述分別確定多個相似樣本數(shù)據(jù)的集合的類別的步驟進一歩包括:
[0054]獲取所述相似樣本數(shù)據(jù)集合中樣本數(shù)據(jù)的IP地址和/或MAC地址;
[0055]統(tǒng)計所述相似樣本數(shù)據(jù)集合中IP地址和/或MAC地址出現(xiàn)在黑名單中的比率和出現(xiàn)在白名單中的比率;
[0056]若出現(xiàn)在黑名單中的比率高于第二預(yù)設(shè)閾值,且出現(xiàn)在白名單中的比率低于第三預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;
[0057]若出現(xiàn)在白名單中的比率高于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率低于第二預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別;
[0058]若出現(xiàn)在白名單中的比率低于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率低于第二預(yù)設(shè)閾值,或者,若出現(xiàn)在白名單中的比率高于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率高于第二預(yù)設(shè)閾值,則統(tǒng)計所述相似樣本數(shù)據(jù)集合中各IP地址所占百分比的均值,若高于第ー預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;若低于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別。
[0059]優(yōu)選地,所述方法,還包括:
[0060]定期更新所述可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合。
[0061]優(yōu)選地,所述目標頁面焦點行為數(shù)據(jù)包括:
[0062]在web頁面上的焦點行為對象;[0063]失去/獲得焦點行為對象的動作;
[0064]失去/獲得焦點行為對象的時間;
[0065]焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
[0066]優(yōu)選地,所述判斷目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合的步驟包括:
[0067]將所述目標頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除;
[0068]將刪除過無效數(shù)據(jù)的目標頁面焦點行為數(shù)據(jù),轉(zhuǎn)化為所述樣本數(shù)據(jù)的指定格式;
[0069]根據(jù)所述指定格式的目標頁面焦點行為數(shù)據(jù)與可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,以及,所述指定格式的目標頁面焦點行為數(shù)據(jù)與不可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合。
[0070]優(yōu)選地,所述根據(jù)指定格式的目標頁面焦點行為數(shù)據(jù)與可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,以及,所述指定格式的目標頁面焦點行為數(shù)據(jù)與不可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合的步驟進一歩包括:
[0071]分別計算所述指定格式的目標頁面焦點行為數(shù)據(jù)X,與可信行為數(shù)據(jù)集合中Ic1個相似樣本數(shù)據(jù)集合,以及,與不可信行為數(shù)據(jù)集合中k2個相似樣本數(shù)據(jù)集合的相似度:Similar (X, mj), j G [1,k];
[0072]其中,Ic= I^k2;
[0073]從所述k個相似度中提取相似度最大值max(Similar (X, nij)), j G [I, k];
[0074]假設(shè)當(dāng)j = 時,Similar (X, Inj), j G [I, k]獲得最大值,則:
[0075]如果Similar (X, m」)≤Similarmn (j = f),并且Cj (j = jr)為可信行為類別的相似樣本數(shù)據(jù)集合,則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于可信行為數(shù)據(jù)集合;
[0076]如果Similar (X, m」)≤Simlarnin (j = f),并且Cj (j = jr)為不可信行為類別的相似樣本數(shù)據(jù)集合,則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于不可信行為數(shù)據(jù)集合;
[0077]如果Similar (Xmj) < Similarmin (j = _f),則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于不可信行為數(shù)據(jù)集合。
[0078]本申請實施例還公開了一種可信行為識別的裝置,包括:
[0079]聚類模塊,用于預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合;
[0080]行為焦點數(shù)據(jù)獲取模塊,用于獲取特定行為的目標頁面焦點行為數(shù)據(jù);
[0081]可信行為判斷模塊,用于判斷所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合;
[0082]可信行為處理模塊,用于在判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合時,允許所述特定行為的執(zhí)行;
[0083]不可信行為處理模塊,用于在判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合吋,中止所述特定行為的執(zhí)行。
[0084]優(yōu)選地,所述聚類模塊包括:[0085]歷史數(shù)據(jù)采集子模塊,用于采集歷史的頁面焦點行為數(shù)據(jù);
[0086]樣本生成子模塊,用于將所述歷史的頁面焦點行為數(shù)據(jù)按指定格式轉(zhuǎn)換為樣本數(shù)據(jù);
[0087]聚類處理子模塊,用于對所述樣本數(shù)據(jù)進行聚類,形成多個相似樣本數(shù)據(jù)的集合;
[0088]類別確定子模塊,用于分別確定所述多個相似樣本數(shù)據(jù)的集合的類別,所述類別為可信行為類別或不可信行為類別;
[0089]數(shù)據(jù)集合組織子模塊,用于將可信行為類別的相似樣本數(shù)據(jù)集合組織為可信行為數(shù)據(jù)集合,將不可信行為類別的相似樣本數(shù)據(jù)集合組織為不可信行為數(shù)據(jù)集合。
[0090]優(yōu)選地,所述頁面焦點行為數(shù)據(jù)包括:
[0091]在web頁面上的焦點行為對象;
[0092]失去/獲得焦點行為對象的動作;
[0093]失去/獲得焦點行為對象的時間;
[0094]焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
[0095]優(yōu)選地,所述聚類模塊還包括;
[0096]無效數(shù)據(jù)刪除子模塊,與歷史數(shù)據(jù)采集子模塊連接,用于將所采集的歷史頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除;
[0097]抽樣子模塊,用于從刪除過無效數(shù)據(jù)的歷史頁面焦點行為數(shù)據(jù)中抽樣出預(yù)設(shè)數(shù)量的歷史頁面焦點行為數(shù)據(jù),并傳輸至樣本生成子模塊。
[0098]優(yōu)選地,所述每條樣本數(shù)據(jù)包括如下數(shù)據(jù)內(nèi)容:
[0099]焦點移動最小距離al:是指兩兩焦點行為對象操作移動距離的最小值;
[0100]焦點移動最大距離a2:是指兩兩焦點行為對象操作移動距離的最大值;
[0101]焦點移動平均距離a3:是指兩兩焦點行為對象操作移動距離的平均值;
[0102]焦點移動最小速度a4:是指兩兩焦點行為對象操作移動速度的最小值;
[0103]焦點移動最大速度a5:是指兩兩焦點行為對象操作移動速度的最大值;
[0104]焦點移動平均速度a6:是指兩兩焦點行為對象操作移動速度的平均值;
[0105]焦點移動總距離a7:是指所有兩兩焦點行為對象操作移動距離的總和。
[0106]優(yōu)選地,所述裝置,還包括:
[0107]更新模塊,用于定期更新所述可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合。
[0108]優(yōu)選地,所述目標頁面焦點行為數(shù)據(jù)包括:
[0109]在web頁面上的焦點行為對象;
[0110]失去/獲得焦點行為對象的動作;
[0111]失去/獲得焦點行為對象的時間;
[0112]焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
[0113]優(yōu)選地,所述可信行為判斷模塊包括:
[0114]數(shù)據(jù)清洗子模塊,用于將所述目標頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除;
[0115]格式轉(zhuǎn)換子模塊,用于將刪除過無效數(shù)據(jù)的目標頁面焦點行為數(shù)據(jù),轉(zhuǎn)化為所述樣本數(shù)據(jù)的指定格式;
[0116]相似度判定子模塊,用于根據(jù)所述指定格式的目標頁面焦點行為數(shù)據(jù)與可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,以及,所述指定格式的目標頁面焦點行為數(shù)據(jù)與不可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合
[0117]與現(xiàn)有技術(shù)相比,本申請包括以下優(yōu)點:
[0118]現(xiàn)有技術(shù)中,面對真實環(huán)境中的海量數(shù)據(jù),沒有很好的手段能夠?qū)⒂脩粜袨檫M行分類(分類要求用戶類別已知、用戶每ー類別的特征已知),而本申請通過采集用戶的歷史頁面焦點行為數(shù)據(jù),進行建模分析,將用戶行為聚類成不同類別,并標記出可信類別和非可信類別。然后在用戶特定行為過程中,基于頁面焦點行為數(shù)據(jù)進行可信支付行為分析,通過實時采集用戶操作數(shù)據(jù),與預(yù)置的聚類類別進行對比,從而實現(xiàn)對用戶的特定行為實時地可信判斷。本申請能夠更加細致、精確地描述用戶的特定行為,對于不可信的行為,能夠更準確的被發(fā)現(xiàn),并會對不可信行為發(fā)起驗證或阻斷該特定行為的繼續(xù)執(zhí)行,從而可以有效提高用戶網(wǎng)上操作的安全性。
【專利附圖】

【附圖說明】
[0119]圖1是本申請的ー種可信行為識別的方法實施例的步驟流程圖;
[0120]圖2是本申請的ー種可信行為識別的裝置實施例的結(jié)構(gòu)框圖。
【具體實施方式】
[0121]為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和【具體實施方式】對本申請作進一步詳細的說明。
[0122]本申請實施例的核心構(gòu)思之ー在于,采用基于頁面焦點行為的可信分析機制對用戶的特定行為進行可信識別,具體而言,即通過采集用戶在特定業(yè)務(wù)過程中(如網(wǎng)絡(luò)支付業(yè)務(wù)過程中)的頁面焦點行為,使用頁面焦點行為數(shù)據(jù)對用戶行為進行刻畫,對歷史行為進行建模聚類,并對用戶的特定行為進行實時的可信支付判斷。若為可信行為,則允許該特定行為繼續(xù)執(zhí)行,若為不可信行為,則向用戶發(fā)起驗證或阻斷該特定行為的繼續(xù)執(zhí)行。
[0123]參照圖1,其示出了本申請的ー種可信行為識別的方法實施例1的步驟流程圖,具體可以包括如下步驟:
[0124]步驟101,預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合;
[0125]在本申請的ー種優(yōu)選實施例中,所述可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合可以通過對歷史的頁面焦點行為數(shù)據(jù)進行建模聚類生成,具體可以包括如下子步驟:
[0126]子步驟S11,采集歷史的頁面焦點行為數(shù)據(jù);
[0127]頁面焦點行為數(shù)據(jù)是指在web頁面中,用戶正在操作的對象的相關(guān)數(shù)據(jù)。比如,用戶正在輸入用戶名,頁面焦點行為對象就是頁面的用戶名輸入框;用戶正在輸入密碼,頁面焦點行為對象就是頁面的密碼輸入框。頁面焦點行為描述了用戶在頁面上操作的軌跡,可以用于刻畫用戶的行為。
[0128]頁面焦點行為可以包括頁面對象獲得焦點和失去焦點兩種行為。在本申請實施例中,所述頁面焦點行為數(shù)據(jù)可以包括:[0129]在web頁面上的焦點行為對象;
[0130]失去/獲得焦點行為對象的動作;
[0131]失去/獲得焦點行為對象的時間;
[0132]焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
[0133]例如,假設(shè)所采集的歷史頁面焦點行為數(shù)據(jù)包括如下數(shù)據(jù)分組:
[0134][ {’ y’: 118, ’ X’: 182, ’ type’: 1,’ target’: ’ username’ , ’ time’: 125}, src=’ www.abc.com/xxx.htm ,
[0135]{,y': 118, ' x': 182, ’ type,:0,’ target,:,username,, ’ time,: 225},src=,www.abc.com/xxx.htm,},
[0136]{’ y': 356, ’ x’: 678,’ type’: 1,’ target’: ’ password’ , ’ time’: 525}, herf = ’ www.abc.com/yyy.htm,},
[0137]{,y,: 356,,x,: 678,,type,: 0,,target,:,password',,time,:725}], herf=,www.abc.com/yyy.htm,}]
[0138]上述每一條數(shù)據(jù)分組代表一次頁面焦點行為對象的操作。其中,’ X’,’ y’用于標識焦點行為對象在web頁面上的位置,’ type’用于標識當(dāng)前是失去焦點行為對象或獲得焦點行為對象;’ target'用于標識焦點操作當(dāng)前的焦點行為對象;’ time’用于標識當(dāng)前頁面焦點行為對象的操作距離頁面加載的時間差;’ src’、’herf’分別用于標識焦點行為對象的src屬性以及herf屬性。
[0139]在具體實現(xiàn)中,所述歷史頁面焦點行為數(shù)據(jù)可以使用Javascript (JS)腳本或客戶端程序進行采集。還可以進ー步在采集端對歷史頁面焦點行為數(shù)據(jù)進行加密,由服務(wù)端在接收到歷史頁面焦點行為數(shù)據(jù)后進行解密。
[0140]子步驟S12,將所采集的歷史頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除;
[0141]在實際中,所述無效數(shù)據(jù)可以包括數(shù)據(jù)格式不正確,或數(shù)據(jù)解密失敗的數(shù)據(jù)。
[0142]子步驟S13,從刪除過無效數(shù)據(jù)的中抽樣出預(yù)設(shè)數(shù)量的歷史頁面焦點行為數(shù)據(jù);
[0143]在歷史頁面焦點行為數(shù)據(jù)量較大的情況下,可以采用數(shù)據(jù)抽樣算法在海量的歷史頁面焦點行為數(shù)據(jù)中挑選出一部分歷史頁面焦點行為數(shù)據(jù),如10萬條,用于數(shù)據(jù)建摸。
[0144]子步驟S14,將所述歷史的頁面焦點行為數(shù)據(jù)按指定格式轉(zhuǎn)換為樣本數(shù)據(jù);
[0145]作為本申請實施例具體應(yīng)用的ー種示例,每條樣本數(shù)據(jù)可以包括如下數(shù)據(jù)內(nèi)容:
[0146]焦點移動最小距離al:是指兩兩焦點行為對象操作移動距離的最小值;
[0147]焦點移動最大距離a2:是指兩兩焦點行為對象操作移動距離的最大值;
[0148]焦點移動平均距離a3:是指兩兩焦點行為對象操作移動距離的平均值;
[0149]焦點移動最小速度a4:是指兩兩焦點行為對象操作移動速度的最小值;
[0150]焦點移動最大速度a5:是指兩兩焦點行為對象操作移動速度的最大值;
[0151]焦點移動平均速度a6:是指兩兩焦點行為對象操作移動速度的平均值;
[0152]焦點移動總距離a7:是指所有兩兩焦點行為對象操作移動距離的總和。
[0153]其中,上述al—a7每ー維度都可以采用數(shù)字表示,即模型輸入數(shù)據(jù)可以采用向量表不為:X = {o-1 j a2? ? ? ?,aj]。
[0154]需要說明 的是,上述al — a7的設(shè)置僅僅用作示例,在實際中,本領(lǐng)域技術(shù)人員根據(jù)實際情況設(shè)置更多內(nèi)容的樣本數(shù)據(jù),如還有a8,a9,al0等;或者,設(shè)置其它內(nèi)容的樣本數(shù)據(jù)都是可行的,本申請對此無需加以限制。
[0155]子步驟S15,對所述樣本數(shù)據(jù)進行聚類,形成多個相似樣本數(shù)據(jù)的集合;
[0156]在具體實現(xiàn)中,可以對歷史頁面焦點行為數(shù)據(jù)進行建模描述:
[0157]假設(shè)樣本數(shù)據(jù)的集合為D= ?1,も,...411],樣本數(shù)據(jù)的容量為110\,1 G [l,n]為某一樣本數(shù)據(jù),X = {a^ a2,...j a,j]。
[0158]在具體實現(xiàn)中,可以使用聚類算法對所述樣本數(shù)據(jù)的集合進行聚類,假設(shè)k表示聚類的樣本數(shù)據(jù)的數(shù)目,Cp j G [I, k]表示第j個相似樣本數(shù)據(jù)集合(即第j個聚類),則聚類后的類別相似樣本數(shù)據(jù)集合為:H = (C1, C2, , CJ ;
[0159]其中,所述聚類算法可以為:
[0160]假設(shè)Hij.為聚類C」.,j G [1,k]的聚類中心,Similar (Xi, Hij)為Xi和的相似度,即某條樣本數(shù)據(jù)Xi和某個相似樣本數(shù)據(jù)集合(聚類)Cj的相似度;
[0161]定義Similarmin 為類別最小相似度,Similar (Xpmj)≥ Similarmin,且 Similar (Xi,mj)是Xi和所有類別聚類中心的最大相似度,為Xi屬于某個相似樣本數(shù)據(jù)集合C1的充分必要條件,其中,所述相似度可以采用歐式距離取倒數(shù)的計算方法。
[0162]子步驟S16,分 別確定所述多個相似樣本數(shù)據(jù)的集合的類別,所述類別為可信行為類別或不可信行為類別;
[0163]作為本申請實施例具體應(yīng)用的ー種示例,可以采用如下方式分別確定所述多個相似樣本數(shù)據(jù)的集合的類別:
[0164]獲取所述相似樣本數(shù)據(jù)集合中樣本數(shù)據(jù)的IP地址;
[0165]統(tǒng)計所述相似樣本數(shù)據(jù)集合中各IP地址所占百分比的均值,若高于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;若低于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別。
[0166]例如,對于相似樣本數(shù)據(jù)集合C1,假設(shè)其中樣本數(shù)據(jù)的數(shù)量為n,則統(tǒng)計這n個樣本數(shù)據(jù)的IP地址,計算每ー個IP地址對應(yīng)樣本數(shù)據(jù)的個數(shù),將該個數(shù)除以n,則得到每個IP在該類別集合C1中出現(xiàn)的百分比,將所有IP地址百分比求均值,即可得到該類別集合的“IP出現(xiàn)的百分比均值”。一般而言,非可信行為類別的IP地址出現(xiàn)的百分比均值較大,而可信行為類別的IP地址出現(xiàn)的百分比均值比較小。故可將高于第一預(yù)設(shè)閾值的相似樣本數(shù)據(jù)集合的類別判定為不可信行為類別;將低于第一預(yù)設(shè)閾值的相似樣本數(shù)據(jù)集合的類別判定為可信行為類別。
[0167]作為本申請實施例具體應(yīng)用的另ー種示例,可以采用如下方式分別確定所述多個相似樣本數(shù)據(jù)的集合的類別:
[0168]獲取所述相似樣本數(shù)據(jù)集合中樣本數(shù)據(jù)的IP地址和/或MAC地址;
[0169]統(tǒng)計所述相似樣本數(shù)據(jù)集合中IP地址和/或MAC地址出現(xiàn)在黑名單中的比率和出現(xiàn)在白名單中的比率;
[0170]若出現(xiàn)在黑名單中的比率高于第二預(yù)設(shè)閾值,且出現(xiàn)在白名單中的比率低于第三預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;
[0171]若出現(xiàn)在白名單中的比率高于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率低于第二預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別;[0172]若出現(xiàn)在白名單中的比率低于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率低于第二預(yù)設(shè)閾值,或者,若出現(xiàn)在白名單中的比率高于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率高于第二預(yù)設(shè)閾值,則統(tǒng)計所述相似樣本數(shù)據(jù)集合中各IP地址所占百分比的均值,若高于第ー預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;若低于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別。例如,計算ー個相似樣本數(shù)據(jù)集合中樣本數(shù)據(jù)的IP地址、mac地址出現(xiàn)在黑名單和白名單中的比率。出現(xiàn)在黑名單中的比率較高的,則確定為非可信行為類別;出現(xiàn)在白名單中的比率較高的,則確定為可信行為類別。
[0173]當(dāng)然,上述確定相似樣本數(shù)據(jù)集合的類別的方法僅僅用作示例,上述兩種示例也可以結(jié)合使用,本領(lǐng)域技術(shù)人員根據(jù)實際情況采用任一種確定方式都是可行的。需要說明的是,用于確定相似樣本數(shù)據(jù)集合的類別的數(shù)據(jù),不能為樣本數(shù)據(jù)中的數(shù)據(jù),即前述al—a7。
[0174]子步驟S17,將可信行為類別的相似樣本數(shù)據(jù)集合組織為可信行為數(shù)據(jù)集合,將不可信行為類別的相似樣本數(shù)據(jù)集合組織為不可信行為數(shù)據(jù)集合。
[0175]在實際中,所述可信行為數(shù)據(jù)集合及不可信行為數(shù)據(jù)集合可以采用數(shù)據(jù)庫的形式部署在一臺服務(wù)器或多臺服務(wù)器中。在實際應(yīng)用中,若數(shù)據(jù)量較大,所述行為建模聚類過程可以使用hadoop (—個能夠?qū)Υ罅繑?shù)據(jù)進行分布式處理的軟件框架)集群計算可以更好的支持運算。
[0176]在具體實現(xiàn)中,本申請實施例還可以包括如下步驟:
[0177]定期更新所述可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合。
[0178]由于歷史頁面焦點行為數(shù)據(jù)不斷積累,需要定期更新歷史數(shù)據(jù),定期進行抽樣、建模、聚類分析,從而保證數(shù)據(jù)模型和聚類結(jié)果的準確性。
[0179]步驟102,獲取特定行為的目標頁面焦點行為數(shù)據(jù);
[0180]作為本申請實施例具體應(yīng)用的ー種示例,所述特定行為可以包括用戶的網(wǎng)上支付行為,在這種情況下,所述目標頁面焦點行為數(shù)據(jù)可以包括:
[0181]在web頁面上的焦點行為對象;
[0182]失去/獲得焦點行為對象的動作;
[0183]失去/獲得焦點行為對象的時間;
[0184]焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
[0185]例如,一次用戶支付行為涉及用戶登錄頁面,用戶瀏覽商品頁面,用戶下單購買頁面以及用戶確認支付頁面,則目標頁面焦點行為數(shù)據(jù)包括在上述各web頁面上的焦點行為對象;相應(yīng)的失去/獲得焦點行為對象的時間;焦點行為對象在上述各web頁面上的特征イM息;以及失去/獲得焦點行為對象的動作。
[0186]步驟103,判斷所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合;
[0187]與前述對歷史頁面焦點行為數(shù)據(jù)進行抽樣,建模,聚類的處理過程相應(yīng),在本申請的一種優(yōu)選實施例中,所述步驟103可以包括如下子步驟:
[0188]子步驟S21,將所述目標頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除;[0189]在實際中,所述無效數(shù)據(jù)可以包括數(shù)據(jù)格式不正確,或數(shù)據(jù)解密失敗的數(shù)據(jù)。
[0190]子步驟S22,將刪除過無效數(shù)據(jù)的目標頁面焦點行為數(shù)據(jù),轉(zhuǎn)化為所述樣本數(shù)據(jù)的指定格式;
[0191]作為本申請實施例具體應(yīng)用的ー種示例,所述樣本數(shù)據(jù)的指定格式可以包括:
[0192]焦點移動最小距離al:是指兩兩焦點行為對象操作移動距離的最小值;
[0193]焦點移動最大距離a2:是指兩兩焦點行為對象操作移動距離的最大值;
[0194]焦點移動平均距離a3:是指兩兩焦點行為對象操作移動距離的平均值;
[0195]焦點移動最小速度a4:是指兩兩焦點行為對象操作移動速度的最小值;
[0196]焦點移動最大速度a5:是指兩兩焦點行為對象操作移動速度的最大值;
[0197]焦點移動平均速度a6:是指兩兩焦點行為對象操作移動速度的平均值;
[0198]焦點移動總距離a7:是指所有兩兩焦點行為對象操作移動距離的總和。
[0199]其中,上述al—a7每ー維度都可以采用數(shù)字表示,即樣本數(shù)據(jù)可以采用向量表示J''-} IX {cli,&2,? ? ?,3-j J o
[0200]子步驟S23,根據(jù)所述指定格式的目標頁面焦點行為數(shù)據(jù)與可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,以及,所述指定格式的目標頁面焦點行為數(shù)據(jù)與不可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合。
[0201]具體而言,所述子步驟S23可以采用如下計算方式:
[0202]分別計算所述指定格式的目標頁面焦點行為數(shù)據(jù)X,與可信行為數(shù)據(jù)集合中Ic1個相似樣本數(shù)據(jù)集合,以及,與不可信行為數(shù)據(jù)集合中k2個相似樣本數(shù)據(jù)集合的相似度:
[0203]Similar (X, nij), j G [1,k];
[0204]其中,k= k!+k2 ;
[0205]從所述k個相似度中提取相似度最大值max(Similar (X, nij)), j G [I, k];
[0206]假設(shè)當(dāng)j = jr 時,Similar (X, Inj), j G [I, k]獲得最大值,則:
[0207]如果Similar(Xmj)≥Similaffln (j-j1),并且Cj (j_f )為可信行為類別的相似樣本數(shù)據(jù)集合,則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于可信行為數(shù)據(jù)集合;
[0208]如果Similar (X, m」)≥Similarmn (j = f),并且Cj (j = jr)為不可信行為類別的相似樣本數(shù)據(jù)集合,則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于不可信行為數(shù)據(jù)集合;
[0209]如果Similar (Xmj) < Similarmin (j = j1),則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于不可信行為數(shù)據(jù)集合。
[0210]當(dāng)然,上述判斷類別歸屬的方法僅僅用作示例,本領(lǐng)域技術(shù)人員根據(jù)實際情況采用任ー種類別歸屬判斷方法均是可行的,本申請對此無需加以限制。
[0211]步驟104,若歸屬于可信行為數(shù)據(jù)集合,則允許所述特定行為的執(zhí)行;
[0212]步驟105,若歸屬于不可信行為數(shù)據(jù)集合,則中止所述特定行為的執(zhí)行。
[0213]例如,對于用戶支付行為,若判定該次支付行為的目標頁面焦點行為數(shù)據(jù)屬于不可信行為數(shù)據(jù)集合,則中止用戶支付行為的繼續(xù)執(zhí)行,并對此次不可信的支付行為加強認證校驗,或禁止該次支付。
[0214]在實際應(yīng)用中,上述判斷目標頁面焦點行為數(shù)據(jù)歸屬于何種類別的過程可以使用java語言做后臺計算,并提供webservice (系統(tǒng)對外的接ロ)接ロ進行可信判斷服務(wù)。所述頁面焦點行為的可信判斷,可以使用単獨一個頁面的焦點行為進行聚類和判斷,也可以使用多個頁面的焦點行為,組合在一起進行聚類和判斷,本申請對此不作限制。
[0215]需要說明的是,對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請并不受所描述的動作順序的限制,因為依據(jù)本申請,某些步驟可以采用其他順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本申請所必須的。
[0216]參照圖2,示出了本申請的ー種可信行為識別的裝置實施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:
[0217]聚類模塊201,用于預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合;
[0218]行為焦點數(shù)據(jù)獲取模塊202,用于獲取特定行為的目標頁面焦點行為數(shù)據(jù);
[0219]可信行為判斷模塊203,用于判斷所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合;
[0220]可信行為處理模塊204,用于在判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合時,允許所述特定行為的執(zhí)行;
[0221]不可信行為處理模塊205,用于在判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合吋,中止所述特定行為的執(zhí)行。
[0222]在本申請的ー種優(yōu)選實施例中,所述聚類模塊201可以包括如下子模塊:
[0223]歷史數(shù)據(jù)采集子模塊,用于采集歷史的頁面焦點行為數(shù)據(jù);
[0224]樣本生成子模塊,用于將所述歷史的頁面焦點行為數(shù)據(jù)按指定格式轉(zhuǎn)換為樣本數(shù)據(jù);
[0225]聚類處理子模塊,用于對所述樣本數(shù)據(jù)進行聚類,形成多個相似樣本數(shù)據(jù)的集合;
[0226]類別確定子模塊,用于分別確定所述多個相似樣本數(shù)據(jù)的集合的類別,所述類別為可信行為類別或不可信行為類別;
[0227]數(shù)據(jù)集合組織子模塊,用于將可信行為類別的相似樣本數(shù)據(jù)集合組織為可信行為數(shù)據(jù)集合,將不可信行為類別的相似樣本數(shù)據(jù)集合組織為不可信行為數(shù)據(jù)集合。
[0228]在本申請實施例中,所述頁面焦點行為數(shù)據(jù)可以包括:
[0229]在web頁面上的焦點行為對象;
[0230]失去/獲得焦點行為對象的動作;
[0231]失去/獲得焦點行為對象的時間;
[0232]焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
[0233]在具體實現(xiàn)中,所述聚類模塊201還可以包括如下子模塊;
[0234]無效數(shù)據(jù)刪除子模塊,與歷史數(shù)據(jù)采集子模塊連接,用于將所采集的歷史頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除;
[0235]抽樣子模塊,用于從刪除過無效數(shù)據(jù)的歷史頁面焦點行為數(shù)據(jù)中抽樣出預(yù)設(shè)數(shù)量的歷史頁面焦點行為數(shù)據(jù),并傳輸至樣本生成子模塊。
[0236]作為本申請實施例具體應(yīng)用的ー種示例,所述每條樣本數(shù)據(jù)可以包括如下數(shù)據(jù)內(nèi)容:
[0237]焦點移動最小距離al:是指兩兩焦點行為對象操作移動距離的最小值;
[0238]焦點移動最大距離a2:是指兩兩焦點行為對象操作移動距離的最大值;
[0239]焦點移動平均距離a3:是指兩兩焦點行為對象操作移動距離的平均值;
[0240]焦點移動最小速度a4:是指兩兩焦點行為對象操作移動速度的最小值;
[0241]焦點移動最大速度a5:是指兩兩焦點行為對象操作移動速度的最大值;
[0242]焦點移動平均速度a6:是指兩兩焦點行為對象操作移動速度的平均值;
[0243]焦點移動總距離a7:是指所有兩兩焦點行為對象操作移動距離的總和。
[0244]在本申請的ー種優(yōu)選示例中,所述聚類處理子模塊可以采用如下方式對樣本數(shù)據(jù)進行聚類,形成多個相似樣本數(shù)據(jù)的集合:
[0245]若樣本數(shù)據(jù)的集合為D = (X1, X2,...,Xn],樣本數(shù)據(jù)的容量為no Xi, i G [I, n]為某一樣本數(shù)據(jù),X = Ia1, a2,..., aj];
[0246]使用聚類算法對所述樣本數(shù)據(jù)的集合進行聚類,假設(shè)k表示聚類的樣本數(shù)據(jù)的數(shù)目,Cj, j G [I, k]表示第j個相似樣本數(shù)據(jù)集合,則聚類后的類別相似樣本數(shù)據(jù)集合為:H=(C1, C2, , CJ ;
[0247]其中,所述聚類算法為:
[0248]假設(shè)為聚類C」.,j G [1,k]的聚類中心,Similar (Xi, Hij)為Xi和的相似度,即某條樣本數(shù)據(jù)Xi和某個相似樣本數(shù)據(jù)集合&的相似度;
[0249]定義Similarmin 為類別最小相似度,Similar (Xpmj)≥ Similarmin,且 Similar (Xi,mj)是Xi和所有類別聚類中心的最大相似度,為Xi屬于某個相似樣本數(shù)據(jù)集合&的充分必要條件,其中,所述相似度采用歐式距離取倒數(shù)的計算方法。
[0250]在本申請的ー種優(yōu)選示例中,所述類別確定子模塊可以進一歩包括如下単元:
[0251]IP獲取單元,用于獲取所述相似樣本數(shù)據(jù)集合中樣本數(shù)據(jù)的IP地址;
[0252]第一統(tǒng)計單元,用于統(tǒng)計所述相似樣本數(shù)據(jù)集合中各IP地址所占百分比的均值;
[0253]第一可信類別判定単元,用于在高于第一預(yù)設(shè)閾值時,判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;
[0254]第二可信類別判定単元,用于在低于第一預(yù)設(shè)閾值時,判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別。
[0255]在本申請的另一種優(yōu)選示例中,所述類別確定子模塊可以進一歩包括如下単元:
[0256]通信地址獲取単元,用于獲取所述相似樣本數(shù)據(jù)集合中樣本數(shù)據(jù)的IP地址和/或MAC地址;
[0257]第二統(tǒng)計單元,用于統(tǒng)計所述相似樣本數(shù)據(jù)集合中IP地址和/或MAC地址出現(xiàn)在黑名單中的比率和出現(xiàn)在白名單中的比率;
[0258]第三可信類別判定単元,用于在出現(xiàn)在黑名單中的比率高于第二預(yù)設(shè)閾值,且出現(xiàn)在白名單中的比率低于第三預(yù)設(shè)閾值時,判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;
[0259]第四可信類別判定単元,用于在出現(xiàn)在白名單中的比率高于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率低于第二預(yù)設(shè)閾值時,判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別;[0260]第三統(tǒng)計單元,用于在出現(xiàn)在白名單中的比率低于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率低于第二預(yù)設(shè)閾值,或者,在出現(xiàn)在白名單中的比率高于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率高于第二預(yù)設(shè)閾值時,則統(tǒng)計所述相似樣本數(shù)據(jù)集合中各IP地址所占百分比的均值;
[0261]第五可信類別判定単元,用于在所述均值高于第一預(yù)設(shè)閾值時,判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;
[0262]第六可信類別判定単元,用于在所述均值低于第一預(yù)設(shè)閾值時,判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別。
[0263]在申請實施例中,還可以包括更新模塊,用于定期更新所述可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合。
[0264]作為本申請實施例具體應(yīng)用的ー種示例,所述特定行為可以包括用戶支付行為。在這種情況下,所述目標頁面焦點行為數(shù)據(jù)可以包括:
[0265]在web頁面上的焦點行為對象;
[0266]失去/獲得焦點行為對象的動作;
[0267]失去/獲得焦點行為對象的時間; [0268]焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
[0269]在具體實現(xiàn)中,所述可信行為判斷模塊203可以包括如下子模塊:
[0270]數(shù)據(jù)清洗子模塊,用于將所述目標頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除;
[0271]格式轉(zhuǎn)換子模塊,用于將刪除過無效數(shù)據(jù)的目標頁面焦點行為數(shù)據(jù),轉(zhuǎn)化為所述樣本數(shù)據(jù)的指定格式;
[0272]相似度判定子模塊,用于根據(jù)所述指定格式的目標頁面焦點行為數(shù)據(jù)與可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,以及,所述指定格式的目標頁面焦點行為數(shù)據(jù)與不可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合。
[0273]具體而言,所述相似度判定子模塊可以采用如下方式進行歸屬判定:
[0274]分別計算所述指定格式的目標頁面焦點行為數(shù)據(jù)X,與可信行為數(shù)據(jù)集合中Ic1個相似樣本數(shù)據(jù)集合,以及,與不可信行為數(shù)據(jù)集合中k2個相似樣本數(shù)據(jù)集合的相似度:
[0275]Similar (X, mj), j G [1,k];
[0276]其中,Ic= I^k2;
[0277]從所述k個相似度中提取相似度最大值max(Similar (X, nij)), j G [I, k];
[0278]假設(shè)當(dāng)j = 時,Similar (X, Inj), j G [I, k]獲得最大值,則:
[0279]如果Similar (X,nij)≥ Similarmin (j = f),并且 Cj (j = jr)為可信行為類別的相似樣本數(shù)據(jù)集合,則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于可信行為數(shù)據(jù)集合;
[0280]如果Similar (X, m」)≥imilarmn (j = f),并且Cj (j = jr)為不可信行為類別的相似樣本數(shù)據(jù)集合,則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于不可信行為數(shù)據(jù)集合;
[0281]如果Similar (Xmj) < Similarmin (j = _f),則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于不可信行為數(shù)據(jù)集合。[0282]對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。
[0283]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。
[0284]本申請是參照根據(jù)本申請實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每ー流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生ー個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖ー個流程或多個流程和/或方框圖ー個方框或多個方框中指定的功能的裝置。
[0285]這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖ー個流程或多個流程和/或方框圖ー個方框或多個方框中指定的功能。
[0286]這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖ー個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0287]盡管已描述了本申請的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本申請范圍的所有變更和修改。
`[0288]最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另ー個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0289]以上對本申請所提供的一種可信行為識別的方法和一種可信行為識別的裝置進行了詳細介紹,本文中應(yīng)用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思想,在【具體實施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本申請的限制。
【權(quán)利要求】
1.一種可信行為識別的方法,其特征在于,包括: 預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合; 獲取特定行為的目標頁面焦點行為數(shù)據(jù); 判斷所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合; 若歸屬于可信行為數(shù)據(jù)集合,則允許所述特定行為的執(zhí)行; 若歸屬于不可信行為數(shù)據(jù)集合,則中止所述特定行為的執(zhí)行。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合的步驟包括: 采集歷史的頁面焦點行為數(shù)據(jù); 將所述歷史的頁面焦點行為數(shù)據(jù)按指定格式轉(zhuǎn)換為樣本數(shù)據(jù); 對所述樣本數(shù)據(jù)進行聚類,形成多個相似樣本數(shù)據(jù)的集合; 分別確定所述 多個相似樣本數(shù)據(jù)的集合的類別,所述類別為可信行為類別或不可信行為類別; 將可信行為類別的相似樣本數(shù)據(jù)集合組織為可信行為數(shù)據(jù)集合,將不可信行為類別的相似樣本數(shù)據(jù)集合組織為不可信行為數(shù)據(jù)集合。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述頁面焦點行為數(shù)據(jù)包括: 在web頁面上的焦點行為對象; 失去/獲得焦點行為對象的動作; 失去/獲得焦點行為對象的時間; 焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合的步驟還包括; 將所采集的歷史頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除; 從刪除過無效數(shù)據(jù)的歷史頁面焦點行為數(shù)據(jù)中抽樣出預(yù)設(shè)數(shù)量的歷史頁面焦點行為數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述每條樣本數(shù)據(jù)包括如下數(shù)據(jù)內(nèi)容: 焦點移動最小距離al:是指兩兩焦點行為對象操作移動距離的最小值; 焦點移動最大距離a2:是指兩兩焦點行為對象操作移動距離的最大值; 焦點移動平均距離a3:是指兩兩焦點行為對象操作移動距離的平均值; 焦點移動最小速度a4:是指兩兩焦點行為對象操作移動速度的最小值; 焦點移動最大速度a5:是指兩兩焦點行為對象操作移動速度的最大值; 焦點移動平均速度a6:是指兩兩焦點行為對象操作移動速度的平均值; 焦點移動總距離a7:是指所有兩兩焦點行為對象操作移動距離的總和。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對樣本數(shù)據(jù)進行聚類,形成多個相似樣本數(shù)據(jù)的集合的步驟進一歩包括: 若樣本數(shù)據(jù)的集合為D = (X1, X2, , Xn],樣本數(shù)據(jù)的容量為n OXi, i G [I, n]為某ー樣本數(shù)據(jù),X = {a1; a2,..., aj]; 使用聚類算法對所述樣本數(shù)據(jù)的集合進行聚類,假設(shè)k表示聚類的樣本數(shù)據(jù)的數(shù)目,Cj, j G [I, k]表示第j個相似樣本數(shù)據(jù)集合,則聚類后的類別相似樣本數(shù)據(jù)集合為:H =(C1, C2, , CJ ; 其中,所述聚類算法為: 假設(shè)為聚類Cp j G [1,k]的聚類中心,Similar (Xi, Hij)為Xi和的相似度,即某條樣本數(shù)據(jù)Xi和某個相似樣本數(shù)據(jù)集合&的相似度;
定義 Similarmin 為類別最小相似度,Similar (Xi, m」)≥ Similarmin,且 Similar (Xi, m」)是Xi和所有類別聚類中心的最大相似度,為Xi屬于某個相似樣本數(shù)據(jù)集合&的充分必要條件,其中,所述相似度采用歐式距離取倒數(shù)的計算方法。
7.根據(jù)權(quán)利要求6所述的方法,其特征在干,所述分別確定多個相似樣本數(shù)據(jù)的集合的類別的步驟進一歩包括: 獲取所述相似樣本數(shù)據(jù)集合中樣本數(shù)據(jù)的IP地址; 統(tǒng)計所述相似樣本數(shù)據(jù)集合中各IP地址所占百分比的均值,若高于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;若低于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別。
8.根據(jù)權(quán)利要求6所述的方法,其特征在干,所述分別確定多個相似樣本數(shù)據(jù)的集合的類別的步驟進一歩包括: 獲取所述相似樣本數(shù)據(jù)集合中樣本數(shù)據(jù)的IP地址和/或MAC地址; 統(tǒng)計所述相似樣本數(shù)據(jù)集合中IP地址和/或MAC地址出現(xiàn)在黑名單中的比率和出現(xiàn)在白名單中的比率; 若出現(xiàn)在黑名單中的比率高于第二預(yù)設(shè)閾值,且出現(xiàn)在白名單中的比率低于第三預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別; 若出現(xiàn)在白名單中的比率高于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率低于第二預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別; 若出現(xiàn)在白名單中的比率低于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率低于第二預(yù)設(shè)閾值,或者,若出現(xiàn)在白名單中的比率高于第三預(yù)設(shè)閾值,且出現(xiàn)在黑名單中的比率高于第二預(yù)設(shè)閾值,則統(tǒng)計所述相似樣本數(shù)據(jù)集合中各IP地址所占百分比的均值,若高于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為不可信行為類別;若低于第一預(yù)設(shè)閾值,則判定當(dāng)前相似樣本數(shù)據(jù)集合的類別為可信行為類別。
9.根據(jù)權(quán)利要求1或2或3或5或6或7或8所述的方法,其特征在于,還包括: 定期更新所述可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述目標頁面焦點行為數(shù)據(jù)包括: 在web頁面上的焦點行為對象; 失去/獲得焦點行為對象的動作; 失去/獲得焦點行為對象的時間; 焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
11.根據(jù)權(quán)利要求2或4或5或6或7或8所述的方法,其特征在于,所述判斷目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合的步驟包括: 將所述目標頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除;將刪除過無效數(shù)據(jù)的目標頁面焦點行為數(shù)據(jù),轉(zhuǎn)化為所述樣本數(shù)據(jù)的指定格式; 根據(jù)所述指定格式的目標頁面焦點行為數(shù)據(jù)與可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,以及,所述指定格式的目標頁面焦點行為數(shù)據(jù)與不可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述根據(jù)指定格式的目標頁面焦點行為數(shù)據(jù)與可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,以及,所述指定格式的目標頁面焦點行為數(shù)據(jù)與不可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合的步驟進一歩包括: 分別計算所述指定格式的目標頁面焦點行為數(shù)據(jù)X,與可信行為數(shù)據(jù)集合中Ic1個相似樣本數(shù)據(jù)集合,以及,與不可信行為數(shù)據(jù)集合中k2個相似樣本數(shù)據(jù)集合的相似度:Similar (X, iiij), j G [1,k];
其中,k = ki+k2 ; 從所述k個相似度中提取相似度最大值max(Similar (X, nij)), j G [I, k]; 假設(shè)當(dāng)j = j1時,Similar (X, Inj), j G [I, k]獲得最大值,則: 如果Similar (X, Inj)≤Similarmn (j = j1),并且Cj (j = jr)為可信行為類別的相似樣本數(shù)據(jù)集合,則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于可信行為數(shù)據(jù)集合; 如果Similar (X,nij)≤Simlarmn (j = j1),并且Cj (j = j1)為不可信行為類別的相似樣本數(shù)據(jù)集合,則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于不可信行為數(shù)據(jù)集合;如果Similar (Xmj) < Similarmin (j = _f),則判定當(dāng)前目標頁面焦點行為數(shù)據(jù)支付行歸屬于不可信行為數(shù)據(jù)集合。
13.一種可信行為識別的裝置,其特征在于,包括: 聚類模塊,用于預(yù)置可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合; 行為焦點數(shù)據(jù)獲取模塊,用于獲取特定行為的目標頁面焦點行為數(shù)據(jù); 可信行為判斷模塊,用于判斷所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合; 可信行為處理模塊,用于在判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合時,允許所述特定行為的執(zhí)行; 不可信行為處理模塊,用于在判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合吋,中止所述特定行為的執(zhí)行。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述聚類模塊包括: 歷史數(shù)據(jù)采集子模塊,用于采集歷史的頁面焦點行為數(shù)據(jù); 樣本生成子模塊,用于將所述歷史的頁面焦點行為數(shù)據(jù)按指定格式轉(zhuǎn)換為樣本數(shù)據(jù); 聚類處理子模塊,用于對所述樣本數(shù)據(jù)進行聚類,形成多個相似樣本數(shù)據(jù)的集合; 類別確定子模塊,用于分別確定所述多個相似樣本數(shù)據(jù)的集合的類別,所述類別為可信行為類別或不可信行為類別; 數(shù)據(jù)集合組織子模塊,用于將可信行為類別的相似樣本數(shù)據(jù)集合組織為可信行為數(shù)據(jù)集合,將不可信行為類別的相似樣本數(shù)據(jù)集合組織為不可信行為數(shù)據(jù)集合。
15.根據(jù)權(quán)利要求13或14所述的裝置,其特征在于,所述頁面焦點行為數(shù)據(jù)包括:在web頁面上的焦點行為對象; 失去/獲得焦點行為對象的動作; 失去/獲得焦點行為對象的時間; 焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述聚類模塊還包括; 無效數(shù)據(jù)刪除子模塊,與歷史數(shù)據(jù)采集子模塊連接,用于將所采集的歷史頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除; 抽樣子模塊,用于從刪除過無效數(shù)據(jù)的歷史頁面焦點行為數(shù)據(jù)中抽樣出預(yù)設(shè)數(shù)量的歷史頁面焦點行為數(shù)據(jù),并傳輸至樣本生成子模塊。
17.根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述每條樣本數(shù)據(jù)包括如下數(shù)據(jù)內(nèi)容: 焦點移動最小距離al:是指兩兩焦點行為對象操作移動距離的最小值; 焦點移動最大距離a2:是指兩兩焦點行為對象操作移動距離的最大值; 焦點移動平均距離a3:是指兩兩焦點行為對象操作移動距離的平均值; 焦點移動最小速度a4:是指兩兩焦點行為對象操作移動速度的最小值; 焦點移動最大速度a5:是指兩兩焦點行為對象操作移動速度的最大值; 焦點移動平均速度a6:是指兩兩焦點行為對象操作移動速度的平均值; 焦點移動總距離a7:是指所有兩兩焦點行為對象操作移動距離的總和。
18.根據(jù)權(quán)利要求13或14或16或17所述的裝置,其特征在于,還包括: 更新模塊,用于定期更新所述可信行為數(shù)據(jù)集合以及不可信行為數(shù)據(jù)集合。
19.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述目標頁面焦點行為數(shù)據(jù)包括: 在web頁面上的焦點行為對象; 失去/獲得焦點行為對象的動作; 失去/獲得焦點行為對象的時間; 焦點行為對象的特征信息,其中,所述特征信息包括:焦點行為對象在web頁面上的位置;焦點行為對象的src屬性以及herf屬性;焦點行為對象的寬和高。
20.根據(jù)權(quán)利要求13或14或16或17或18或19所述的裝置,其特征在于,所述可信行為判斷模塊包括: 數(shù)據(jù)清洗子模塊,用于將所述目標頁面焦點行為數(shù)據(jù)中的無效數(shù)據(jù)進行刪除; 格式轉(zhuǎn)換子模塊,用于將刪除過無效數(shù)據(jù)的目標頁面焦點行為數(shù)據(jù),轉(zhuǎn)化為所述樣本數(shù)據(jù)的指定格式; 相似度判定子模塊,用于根據(jù)所述指定格式的目標頁面焦點行為數(shù)據(jù)與可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,以及,所述指定格式的目標頁面焦點行為數(shù)據(jù)與不可信行為數(shù)據(jù)集合中相似樣本數(shù)據(jù)集合的相似度,判定所述目標頁面焦點行為數(shù)據(jù)歸屬于可信行為數(shù)據(jù)集合或不可信行為數(shù)據(jù)集合。
【文檔編號】G06F21/55GK103593609SQ201210293487
【公開日】2014年2月19日 申請日期:2012年8月16日 優(yōu)先權(quán)日:2012年8月16日
【發(fā)明者】李劍 申請人:阿里巴巴集團控股有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1