具體 應(yīng)用中,上述步驟101-106并非都是必須的。其中,步驟101和步驟102屬于線下準備階 段,預(yù)先生成所需的可信數(shù)據(jù)和可信識別模型(其中可信數(shù)據(jù)是定期生成的,可信識別模 型可以一次性訓(xùn)練好,也可以定期進行訓(xùn)練),每次獲取用戶行為數(shù)據(jù)后,可以直接執(zhí)行步 驟103-106利用已有的可信數(shù)據(jù)和可信識別模型進行識別,不用重復(fù)執(zhí)行步驟101-步驟 102。此外,本實施例給出了采用兩種方式識別用戶可信行為、并對識別結(jié)果進行合并的實 施方式,在其他實施方式中,可以只采用其中一種方式進行識別也是可以的,例如:僅采用 基于可信數(shù)據(jù)和規(guī)則進行識別的方式,那么就只需要執(zhí)行步驟1〇1、1〇3和104 ;也可以僅采 用基于可信行為識別模型的方式,那么就只需要執(zhí)行步驟102、103和105,同樣可以實現(xiàn)本 申請的技術(shù)方案。
[0209] 綜上所述,本申請?zhí)峁┑挠糜谠诰W(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的方法,在獲 取網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù)后,通過與可信數(shù)據(jù)和預(yù)先設(shè)定的規(guī)則比對、或者采用 預(yù)先生成的可信行為識別模型,識別所述用戶行為是否可信。本申請的技術(shù)方案,提供了 一種識別用戶行為的新思路,摒棄了在海量用戶行為中識別風(fēng)險行為的傳統(tǒng)做法,僅依賴 可信數(shù)據(jù)和原始行為數(shù)據(jù)就可以準確、高效地從海量用戶行為中識別出大部分可信行為。 特別是在本方法的基礎(chǔ)上進行用戶行為的風(fēng)險監(jiān)控和攔截,由于不可信用戶行為(風(fēng)險行 為)的范圍已經(jīng)大幅減少,從而可以有效提高風(fēng)險行為監(jiān)控的執(zhí)行效率和識別準確率,減 少硬件存儲和人工介入核查的成本。
[0210] 在上述的實施例中,提供了一種用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的方 法,與之相對應(yīng)的,本申請還提供一種用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的裝置。請 參看圖8,其為本申請的一種用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的裝置實施例的示 意圖。由于裝置實施例基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實 施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
[0211] 本實施例的一種用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的裝置,包括:可信數(shù) 據(jù)生成單元801,用于預(yù)先生成用于可信行為識別的可信數(shù)據(jù);模型訓(xùn)練生成單元802,用 于預(yù)先訓(xùn)練生成可信行為識別模型;行為數(shù)據(jù)獲取單元803,用于獲取所述網(wǎng)絡(luò)交互系統(tǒng) 中的用戶行為數(shù)據(jù);規(guī)則分析識別單元804,用于通過判斷預(yù)先生成的可信數(shù)據(jù)與所述用 戶行為數(shù)據(jù)的比對結(jié)果是否符合預(yù)先設(shè)定的規(guī)則,識別所述用戶行為是否可信;模型分析 識別單元805,用于根據(jù)所述用戶行為數(shù)據(jù),采用預(yù)先生成的可信行為識別模型計算表征所 述用戶行為可信程度的指標值,通過判斷所述指標值是否滿足預(yù)先設(shè)定的可信閾值,識別 所述用戶行為是否可信。識別結(jié)果合并單元806,用于采用預(yù)先設(shè)置的策略,根據(jù)所述規(guī) 則分析識別單元和所述模型分析識別單元輸出的識別結(jié)果,綜合判斷所述用戶行為是否可 信。
[0212] 可選的,所述行為數(shù)據(jù)獲取單元具體用于通過同步事件觸發(fā)的方式,獲取所述網(wǎng) 絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù);或者,通過接收異步事件通知的方式,獲取所述網(wǎng)絡(luò)交互系 統(tǒng)中的用戶行為數(shù)據(jù)。
[0213] 可選的,所述裝置還包括:
[0214] 數(shù)據(jù)存儲單元,用于當所述規(guī)則分析識別單元完成所述識別操作后,將所述用戶 行為數(shù)據(jù)存儲到數(shù)據(jù)倉庫中。
[0215] 可選的,所述可信數(shù)據(jù)生成單元包括:
[0216] 行為數(shù)據(jù)清洗子單元,用于對所述數(shù)據(jù)倉庫中存儲的用戶行為數(shù)據(jù),進行分類、篩 選、統(tǒng)計;
[0217] 數(shù)據(jù)生成執(zhí)行子單元,用于將所述行為數(shù)據(jù)清洗子單元處理得到的用戶行為數(shù)據(jù) 與預(yù)先設(shè)置的可信條件進行比對,如果滿足所述可信條件的要求,則生成與所述用戶行為 數(shù)據(jù)涉及的主體相關(guān)聯(lián)的可信數(shù)據(jù)。
[0218] 可選的,所述可信數(shù)據(jù)生成單元還包括:
[0219] 可信數(shù)據(jù)合并子單元,用于將已有的可信數(shù)據(jù)、采用上述步驟生成的可信數(shù)據(jù)、以 及人工維護生成的可信數(shù)據(jù)合并;
[0220] 可信數(shù)據(jù)剔除子單元,用于從合并后的可信數(shù)據(jù)中,剔除過期的以及被確認為不 可信的數(shù)據(jù),得到可用于可信行為識別的可信數(shù)據(jù)。
[0221] 可選的,可信數(shù)據(jù)生成單元還包括:
[0222] 可信數(shù)據(jù)存儲子單元,用于將已生成的可信數(shù)據(jù)存儲在采用MySQL數(shù)據(jù)庫技術(shù)構(gòu) 建的數(shù)據(jù)中心,該數(shù)據(jù)中心依據(jù)以可信數(shù)據(jù)的主體類型和主體值為輸入執(zhí)行高可靠哈希操 作得到的哈希值,對所述可信數(shù)據(jù)采用分庫分表的形式存儲。
[0223] 可選的,所述規(guī)則分析識別單元包括:
[0224] 可信數(shù)據(jù)提取子單元,用于根據(jù)所述用戶行為數(shù)據(jù)涉及的主體類型和主體值,從 所述數(shù)據(jù)中心提取與所述主體相關(guān)聯(lián)的可信數(shù)據(jù);
[0225] 可信數(shù)據(jù)比對子單元,用于將已提取的可信數(shù)據(jù)中的可信數(shù)據(jù)項值,與所述用戶 行為數(shù)據(jù)中的相應(yīng)數(shù)據(jù)進行比對,獲取所述用戶行為的可信級別;
[0226] 可信規(guī)則獲取子單元,用于根據(jù)所述已提取的可信數(shù)據(jù)中的規(guī)則標識,獲取預(yù)先 設(shè)定的可信規(guī)則;
[0227] 可信規(guī)則判斷子單元,用于判斷所述可信級別是否符合所述可信規(guī)則的要求;若 符合,則判定所述用戶行為可信。
[0228] 可選的,所述規(guī)則分析識別單元中采用的可信規(guī)則是通過Java動態(tài)編譯的方式 注入的;所述可信規(guī)則判斷子單元具體用于通過groovy技術(shù)進行動態(tài)構(gòu)建以及比較來判 斷所述可信級別是否符合所述可信規(guī)則的要求。
[0229] 可選的,所述模型訓(xùn)練生成單元包括:
[0230] 屬性特征選擇子單元,用于選擇與識別用戶行為相關(guān)的屬性特征;
[0231] 特征值劃分子單元,用于針對每個屬性特征的取值范圍進行劃分,并為每個范圍 設(shè)定一個特征值;
[0232] 訓(xùn)練樣本獲取子單元,用于從所述網(wǎng)絡(luò)交互系統(tǒng)的歷史行為數(shù)據(jù)中獲取可信行為 數(shù)據(jù)和不可信行為數(shù)據(jù)組成訓(xùn)練樣本集合;
[0233] 訓(xùn)練計算子單元,用于計算可信行為和不可信行為在訓(xùn)練樣本集合中出現(xiàn)的概 率、以及每個屬性特征劃分對應(yīng)的特征值在可信行為樣本和不可信行為樣本中出現(xiàn)的條件 概率。
[0234] 可選的,所述模型分析識別單元包括:
[0235] 第一概率值計算子單元,用于根據(jù)所述用戶行為數(shù)據(jù)中的相應(yīng)屬性特征值,采用 預(yù)先訓(xùn)練好的樸素貝葉斯模型,計算所述用戶行為是可信行為的概率值;
[0236] 概率值判斷子單元,用于判斷所述概率值是否大于所述預(yù)先設(shè)定的可信閾值,若 是,則判定所述用戶行為可信。
[0237] 可選的,所述模型分析識別單元包括:
[0238] 第二概率值計算子單元,用于根據(jù)所述用戶行為數(shù)據(jù)中的相應(yīng)屬性特征值,采用 基于所述樸素貝葉斯模型的改進算法robinson-fisher算法,計算所述用戶行為是可信行 為的概率值;
[0239] 概率值判斷子單元,用于判斷所述概率值是否大于所述預(yù)先設(shè)定的可信閾值,若 是,則判定所述用戶行為可信。
[0240] 可選的,所述裝置包括:
[0241] 風(fēng)險行為識別單元,用于當對所述用戶行為的最終識別結(jié)果為"不可信"時,識別 所述用戶行為是否為風(fēng)險行為。
[0242] 可選的,所述風(fēng)險行為識別單元具體用于,采用預(yù)先生成的風(fēng)險行為模型和/或 預(yù)先設(shè)定的風(fēng)險行為規(guī)則識別所述用戶行為是否為風(fēng)險行為。
[0243] 本申請雖然以較佳實施例公開如上,但其并不是用來限定本申請,任何本領(lǐng)域技 術(shù)人員在不脫離本申請的精神和范圍內(nèi),都可以做出可能的變動和修改,因此本申請的保 護范圍應(yīng)當以本申請權(quán)利要求所界定的范圍為準。
[0244] 在一個典型的配置中,計算設(shè)備包括一個或多個處理器(CPU)、輸入/輸出接口、 網(wǎng)絡(luò)接口和內(nèi)存。
[0245] 內(nèi)存可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲器(RAM)和/ 或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內(nèi)存是計算機可讀介質(zhì) 的示例。
[0246] 1、計算機可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體可以由任何 方法或技術(shù)來實現(xiàn)信息存儲。信息可以是計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其 他數(shù)據(jù)。計算機的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機存取存儲 器(SRAM)、動態(tài)隨機存取存儲器(DRAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲器 (ROM)、電可擦除可編程只讀存儲器(EEPR0M)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀 存儲器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁磁盤存儲或 其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可以被計算設(shè)備訪問的信息。按照 本文中的界定,計算機可讀介質(zhì)不包括非暫存電腦可讀媒體(transitory media),如調(diào)制 的數(shù)據(jù)信號和載波。
[0247] 2、本領(lǐng)域技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、系統(tǒng)或計算機程序產(chǎn) 品。因此,本申請可采用完全硬件實施例、完全軟件實施例或結(jié)合軟件和硬件方面的實施例 的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用 存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的 形式。
【主權(quán)項】
1. 一種用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的方法,其特征在于,包括: 獲取所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù); 根據(jù)所述用戶行為數(shù)據(jù),采用下述方式中的任意一種識別所述用戶行為是否可信: 通過判斷預(yù)先生成的可信數(shù)據(jù)與所述用戶行為數(shù)據(jù)的比對結(jié)果是否符合預(yù)先設(shè)定的 規(guī)則,識別所述用戶行為是否可信;所述可信數(shù)據(jù)是指,從網(wǎng)絡(luò)交互系統(tǒng)的用戶歷史行為數(shù) 據(jù)中提取的能夠反映用戶常規(guī)行為規(guī)律的數(shù)據(jù); 或者, 采用預(yù)先生成的可信行為識別模型計算表征所述用戶行為可信程度的指標值,通過判 斷所述指標值是否滿足預(yù)先設(shè)定的可信閾值,識別所述用戶行為是否可信。2. 根據(jù)權(quán)利要求1所述的用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的方法,其特征在 于,在所述通過判斷預(yù)先生成的可信數(shù)據(jù)與所述用戶行為數(shù)據(jù)的比對結(jié)果是否符合預(yù)先設(shè) 定的規(guī)則,識別所述用戶行為是否可信的步驟之前或者之后,執(zhí)行所述采用預(yù)先生成的可 信行為識別模型識別所述用戶行為是否可信的步驟; 相應(yīng)的,采用上述兩種方式分別識別所述用戶行為是否可信后,執(zhí)行下述操作: 采用預(yù)先設(shè)置的策略,根據(jù)上述兩種識別方式的識別結(jié)果,綜合判斷所述用戶行為是 否可信。3. 根據(jù)權(quán)利要求2所述的用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的方法,其特征在 于,采用以下兩種方式獲取所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù): 通過同步事件觸發(fā)的方式,獲取所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù); 或者, 通過接收異步事件通知的方式,獲取所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù)。4. 根據(jù)權(quán)利要求3所述的用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的方法,其特征在 于,當所述網(wǎng)絡(luò)交互系統(tǒng)為在線交易系統(tǒng)時,所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù)包括:賬 戶信息、發(fā)起所述用戶行為的客戶端IP地址、發(fā)起所述用戶行為的客戶端MAC地址、發(fā)起所 述用戶行為的移動終端號碼、所述用戶行為涉及的銀行卡號、交易金額、和/或交易類別。5. 根據(jù)權(quán)利要求1-4任一所述的用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的方法,其 特征在于,采用判斷預(yù)先生成的可信數(shù)據(jù)與所述用戶行為數(shù)據(jù)的比對結(jié)果是否符合預(yù)先設(shè) 定的規(guī)則來識別所述用戶行為是否可信時,在完成所述識別操作后,將所述用戶行為數(shù)據(jù) 存儲到數(shù)據(jù)倉庫中。6. 根據(jù)權(quán)利要求5所述的用于在網(wǎng)絡(luò)交互系統(tǒng)中識別用戶可信行為的方法,其特征在 于,采用如下方式預(yù)先生成所述可信數(shù)據(jù): 對所述數(shù)據(jù)倉庫中存儲的用戶行為數(shù)據(jù),進行分類、篩選、統(tǒng)計; 將經(jīng)過上述處理得到的用戶行為數(shù)據(jù)與預(yù)先設(shè)置的可信條件進行比對,如果滿足所述 可信條件的要求,則生成與所述用戶行為數(shù)據(jù)涉及的主體相關(guān)聯(lián)的可信數(shù)據(jù); 所述可信數(shù)據(jù)包括:主體類型、主體