用于在網(wǎng)絡(luò)交互系統(tǒng)中識(shí)別用戶可信行為的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及用戶行為識(shí)別領(lǐng)域,具體涉及一種用于在網(wǎng)絡(luò)交互系統(tǒng)中識(shí)別用戶可 信行為的方法。本申請(qǐng)同時(shí)提供一種用于在網(wǎng)絡(luò)交互系統(tǒng)中識(shí)別用戶可信行為的裝置。
【背景技術(shù)】
[0002] 隨著網(wǎng)絡(luò)技術(shù)和網(wǎng)絡(luò)應(yīng)用的飛速發(fā)展,互聯(lián)網(wǎng)逐步滲透到人們生活中的每一個(gè)角 落,網(wǎng)上購物、網(wǎng)上閱讀、網(wǎng)絡(luò)視頻、網(wǎng)絡(luò)社交等已經(jīng)成為了人們生活中不可或缺的組成部 分?;ヂ?lián)網(wǎng)給人帶來方便的同時(shí),也給人們?cè)鎏砹诵畔踩系睦_,網(wǎng)絡(luò)安全問題成為人 們長(zhǎng)期以來關(guān)注的焦點(diǎn)問題。
[0003] 采用傳統(tǒng)的身份認(rèn)證等技術(shù)手段雖然可以基本解決網(wǎng)絡(luò)用戶的身份信任問題,但 是卻無法解決用戶網(wǎng)絡(luò)操作行為的安全問題,例如在網(wǎng)絡(luò)交易系統(tǒng)中,大部分用戶的操作 行為都是正常的(通常也稱為可信行為),然而也存在少量黑客或者惡意用戶盜用他人賬 戶、盜用他人銀行卡等欺詐行為,因此有必要對(duì)用戶在網(wǎng)絡(luò)環(huán)境中的操作行為進(jìn)行識(shí)別。通 過識(shí)別,一方面可以通過對(duì)可疑行為(通常也稱為風(fēng)險(xiǎn)行為)的提前識(shí)別避免欺詐行為的 發(fā)生,另一方面可以對(duì)識(shí)別出的欺詐行為做出及時(shí)的處理,避免合法用戶遭受損失、或者盡 可能減少損失。
[0004] 現(xiàn)有技術(shù)對(duì)網(wǎng)絡(luò)環(huán)境下用戶行為的識(shí)別通常采用風(fēng)險(xiǎn)識(shí)別方式,即:獲取與用戶 行為相關(guān)的數(shù)據(jù)后,基于大量的原始?xì)v史行為數(shù)據(jù)、交易數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)、賬戶信息、登錄數(shù) 據(jù)、銀行卡信息、用戶身份信息、歷史風(fēng)險(xiǎn)數(shù)據(jù)、黑名單等數(shù)據(jù),對(duì)所述用戶行為進(jìn)行全規(guī)則 覆蓋分析和/或采用設(shè)定的模型進(jìn)行打分評(píng)估,并根據(jù)分析結(jié)果和/或打分結(jié)果,辨識(shí)當(dāng)前 的用戶行為是否存在風(fēng)險(xiǎn)。對(duì)于在網(wǎng)絡(luò)交互環(huán)境下隨機(jī)發(fā)起的每個(gè)用戶行為都采用上述方 式進(jìn)行識(shí)別,從而從大量用戶行為中識(shí)別出可能的風(fēng)險(xiǎn)行為。
[0005] 通過上面的描述可以看出,傳統(tǒng)的用戶行為識(shí)別模式采用的是類似大海撈針式的 風(fēng)險(xiǎn)防控模式:從大量的用戶行為中識(shí)別出少量的、個(gè)別的風(fēng)險(xiǎn)行為。由于需要對(duì)大量用戶 行為逐一地進(jìn)行風(fēng)險(xiǎn)規(guī)則分析與模型算法計(jì)算,處理過程耗時(shí)、處理效率低下,在用戶行為 規(guī)模達(dá)到海量級(jí)別的一些網(wǎng)絡(luò)交互系統(tǒng)中(例如:支付寶網(wǎng)絡(luò)交互平臺(tái)),上述用戶行為識(shí) 別方式已經(jīng)難以滿足線上的實(shí)時(shí)應(yīng)用需求;此外,由于上述識(shí)別方式需要依賴大量的額外 數(shù)據(jù),增加了整個(gè)系統(tǒng)的硬件存儲(chǔ)成本;而且這種大海撈針的識(shí)別方式識(shí)別準(zhǔn)確率低下,可 能將部分正常操作行為識(shí)別為風(fēng)險(xiǎn)行為,一方面會(huì)造成對(duì)用戶的無為打擾,影響用戶體驗(yàn), 另一方面為了提高準(zhǔn)確率需要人工介入核查,增加人力成本。
【發(fā)明內(nèi)容】
[0006] 本申請(qǐng)?zhí)峁┮环N用于在網(wǎng)絡(luò)交互系統(tǒng)中識(shí)別用戶可信行為的方法,針對(duì)對(duì)用戶行 為進(jìn)行風(fēng)險(xiǎn)識(shí)別的傳統(tǒng)方式,提出一種用戶行為識(shí)別的新思路:從可信的角度進(jìn)行行為識(shí) 另IJ,從而為高效、準(zhǔn)確地進(jìn)行用戶風(fēng)險(xiǎn)行為的監(jiān)控與識(shí)別提供便利。本申請(qǐng)另外提供一種用 于在網(wǎng)絡(luò)交互系統(tǒng)中識(shí)別用戶可信行為的裝置。
[0007] 本申請(qǐng)?zhí)峁┮环N用于在網(wǎng)絡(luò)交互系統(tǒng)中識(shí)別用戶可信行為的方法,包括:
[0008] 獲取所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù);
[0009] 根據(jù)所述用戶行為數(shù)據(jù),采用下述方式中的任意一種識(shí)別所述用戶行為是否可 信:
[0010] 通過判斷預(yù)先生成的可信數(shù)據(jù)與所述用戶行為數(shù)據(jù)的比對(duì)結(jié)果是否符合預(yù)先設(shè) 定的規(guī)則,識(shí)別所述用戶行為是否可信;所述可信數(shù)據(jù)是指,從網(wǎng)絡(luò)交互系統(tǒng)的用戶歷史行 為數(shù)據(jù)中提取的能夠反映用戶常規(guī)行為規(guī)律的數(shù)據(jù);
[0011] 或者,
[0012] 采用預(yù)先生成的可信行為識(shí)別模型計(jì)算表征所述用戶行為可信程度的指標(biāo)值,通 過判斷所述指標(biāo)值是否滿足預(yù)先設(shè)定的可信閾值,識(shí)別所述用戶行為是否可信。
[0013] 可選的,在所述通過判斷預(yù)先生成的可信數(shù)據(jù)與所述用戶行為數(shù)據(jù)的比對(duì)結(jié)果是 否符合預(yù)先設(shè)定的規(guī)則,識(shí)別所述用戶行為是否可信的步驟之前或者之后,執(zhí)行所述采用 預(yù)先生成的可信行為識(shí)別模型識(shí)別所述用戶行為是否可信的步驟;
[0014] 相應(yīng)的,采用上述兩種方式分別識(shí)別所述用戶行為是否可信后,執(zhí)行下述操作:
[0015] 采用預(yù)先設(shè)置的策略,根據(jù)上述兩種識(shí)別方式的識(shí)別結(jié)果,綜合判斷所述用戶行 為是否可{目。
[0016] 可選的,采用以下兩種方式獲取所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù):
[0017] 通過同步事件觸發(fā)的方式,獲取所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù);
[0018] 或者,
[0019] 通過接收異步事件通知的方式,獲取所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù)。
[0020] 可選的,當(dāng)所述網(wǎng)絡(luò)交互系統(tǒng)為在線交易系統(tǒng)時(shí),所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行 為數(shù)據(jù)包括:賬戶信息、發(fā)起所述用戶行為的客戶端IP地址、發(fā)起所述用戶行為的客戶端 MAC地址、發(fā)起所述用戶行為的移動(dòng)終端號(hào)碼、所述用戶行為涉及的銀行卡號(hào)、交易金額、和 /或交易類別。
[0021] 可選的,采用判斷預(yù)先生成的可信數(shù)據(jù)與所述用戶行為數(shù)據(jù)的比對(duì)結(jié)果是否符合 預(yù)先設(shè)定的規(guī)則來識(shí)別所述用戶行為是否可信時(shí),在完成所述識(shí)別操作后,將所述用戶行 為數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)倉庫中。
[0022] 可選的,采用如下方式預(yù)先生成所述可信數(shù)據(jù):
[0023] 對(duì)所述數(shù)據(jù)倉庫中存儲(chǔ)的用戶行為數(shù)據(jù),進(jìn)行分類、篩選、統(tǒng)計(jì);
[0024] 將經(jīng)過上述處理得到的用戶行為數(shù)據(jù)與預(yù)先設(shè)置的可信條件進(jìn)行比對(duì),如果滿足 所述可信條件的要求,則生成與所述用戶行為數(shù)據(jù)涉及的主體相關(guān)聯(lián)的可信數(shù)據(jù);
[0025] 所述可信數(shù)據(jù)包括:主體類型、主體值、可信數(shù)據(jù)項(xiàng)類型、可信數(shù)據(jù)項(xiàng)值、有效時(shí) 間、可信等級(jí)、以及對(duì)應(yīng)的規(guī)則標(biāo)識(shí);
[0026] 當(dāng)所述網(wǎng)絡(luò)交互系統(tǒng)為在線交易系統(tǒng)時(shí),所述主體類型為賬戶或者銀行卡,所述 主體值為對(duì)應(yīng)的賬戶號(hào)碼或者銀行卡號(hào)。
[0027] 可選的,所述預(yù)先生成所述可信數(shù)據(jù)的步驟還包括:
[0028] 將已有的可信數(shù)據(jù)、采用上述步驟生成的可信數(shù)據(jù)、以及人工維護(hù)生成的可信數(shù) 據(jù)合并;
[0029] 從合并后的可信數(shù)據(jù)中,剔除過期的以及被確認(rèn)為不可信的數(shù)據(jù),得到可用于可 信行為識(shí)別的可信數(shù)據(jù)。
[0030] 可選的,將采用上述方式預(yù)先生成的可信數(shù)據(jù)存儲(chǔ)在采用MySQL數(shù)據(jù)庫技術(shù)構(gòu)建 的數(shù)據(jù)中心,該數(shù)據(jù)中心依據(jù)以可信數(shù)據(jù)的主體類型和主體值為輸入執(zhí)行高可靠哈希操作 得到的哈希值,對(duì)所述可信數(shù)據(jù)采用分庫分表的形式存儲(chǔ)。
[0031] 可選的,所述通過判斷預(yù)先生成的可信數(shù)據(jù)與所述用戶行為數(shù)據(jù)的比對(duì)結(jié)果是否 符合預(yù)先設(shè)定的規(guī)則,識(shí)別所述用戶行為是否可信,包括:
[0032] 根據(jù)所述用戶行為數(shù)據(jù)涉及的主體類型和主體值,從所述數(shù)據(jù)中心提取與所述主 體相關(guān)聯(lián)的可信數(shù)據(jù);
[0033] 將已提取的可信數(shù)據(jù)中的可信數(shù)據(jù)項(xiàng)值,與所述用戶行為數(shù)據(jù)中的相應(yīng)數(shù)據(jù)進(jìn)行 比對(duì),獲取所述用戶行為的可信級(jí)別;
[0034] 根據(jù)所述已提取的可信數(shù)據(jù)中的規(guī)則標(biāo)識(shí),獲取預(yù)先設(shè)定的可信規(guī)則;
[0035] 判斷所述可信級(jí)別是否符合所述可信規(guī)則的要求;若符合,則判定所述用戶行為 可信。
[0036] 可選的,所述可信規(guī)則是通過Java動(dòng)態(tài)編譯的方式注入的;所述判斷所述可信級(jí) 別是否符合所述可信規(guī)則的要求,是通過groovy技術(shù)進(jìn)行動(dòng)態(tài)構(gòu)建以及比較來實(shí)現(xiàn)的。
[0037] 可選的,當(dāng)采用預(yù)先生成的可信行為識(shí)別模型計(jì)算表征所述用戶行為可信程度的 指標(biāo)值,通過判斷所述指標(biāo)值是否滿足預(yù)先設(shè)定的可信閾值來識(shí)別所述用戶行為是否可信 時(shí),所述可信行為識(shí)別模型是指樸素貝葉斯模型,所述表征所述用戶行為可信程度的指標(biāo) 值是指,所述用戶行為是可信行為的概率值;
[0038] 相應(yīng)的,所述模型通過如下步驟訓(xùn)練生成:
[0039] 選擇與識(shí)別用戶行為相關(guān)的屬性特征;
[0040] 針對(duì)每個(gè)屬性特征的取值范圍進(jìn)行劃分,并為每個(gè)范圍設(shè)定一個(gè)特征值;
[0041] 從所述網(wǎng)絡(luò)交互系統(tǒng)的歷史行為數(shù)據(jù)中獲取可信行為數(shù)據(jù)和不可信行為數(shù)據(jù)組 成訓(xùn)練樣本集合;
[0042] 計(jì)算可信行為和不可信行為在訓(xùn)練樣本集合中出現(xiàn)的概率、以及每個(gè)屬性特征劃 分對(duì)應(yīng)的特征值在可信行為樣本和不可信行為樣本中出現(xiàn)的條件概率,所述樸素貝葉斯模 型訓(xùn)練完畢。
[0043] 可選的,所述采用預(yù)先生成的可信行為識(shí)別模型計(jì)算表征所述用戶行為可信程度 的指標(biāo)值,通過判斷所述指標(biāo)值是否滿足預(yù)先設(shè)定的可信閾值,識(shí)別所述用戶行為是否可 信,包括:
[0044] 根據(jù)所述用戶行為數(shù)據(jù)中的相應(yīng)屬性特征值,采用預(yù)先訓(xùn)練好的樸素貝葉斯模 型,計(jì)算所述用戶行為是可信行為的概率值;
[0045] 判斷所述概率值是否大于所述預(yù)先設(shè)定的可信閾值,若是,則判定所述用戶行為 可信。
[0046] 可選的,所述采用預(yù)先生成的可信行為識(shí)別模型計(jì)算表征所述用戶行為可信程度 的指標(biāo)值,通過判斷所述指標(biāo)值是否滿足預(yù)先設(shè)定的可信閾值,識(shí)別所述用戶行為是否可 信,包括:
[0047] 根據(jù)所述用戶行為數(shù)據(jù)中的相應(yīng)屬性特征值,采用基于所述樸素貝葉斯模型的改 進(jìn)算法robinson-fisher算法,計(jì)算所述用戶行為是可信行為的概率值;
[0048] 判斷所述概率值是否大于所述預(yù)先設(shè)定的可信閾值,若是,則判定所述用戶行為 可信。
[0049] 可選的,當(dāng)所述網(wǎng)絡(luò)交互系統(tǒng)為在線交易系統(tǒng)時(shí),所述屬性特征包括:交易金額、 時(shí)間、鍵盤行為特征、和/或商品名稱;所述鍵盤行為特征是指執(zhí)行所述用戶行為時(shí)鍵盤按 鍵從被按下到被松開的平均時(shí)間。
[0050] 可選的,當(dāng)對(duì)所述用戶行為的最終識(shí)別結(jié)果為"不可信"時(shí),執(zhí)行下述操作:
[0051] 識(shí)別所述用戶行為是否為風(fēng)險(xiǎn)行為。
[0052] 可選的,所述識(shí)別所述用戶行為是否為風(fēng)險(xiǎn)行為是指,采用預(yù)先生成的風(fēng)險(xiǎn)行為 模型和/或預(yù)先設(shè)定的風(fēng)險(xiǎn)行為規(guī)則進(jìn)行識(shí)別。
[0053] 相應(yīng)的,本申請(qǐng)還提供一種用于在網(wǎng)絡(luò)交互系統(tǒng)中識(shí)別用戶可信行為的裝置,包 括:
[0054] 行為數(shù)據(jù)獲取單元,用于獲取所述網(wǎng)絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù);
[0055] 識(shí)別方式觸發(fā)單元,用于觸發(fā)下述單元中的任意一個(gè)識(shí)別所述用戶行為是否可 信;
[0056] 規(guī)則分析識(shí)別單元,用于通過判斷預(yù)先生成的可信數(shù)據(jù)與所述用戶行為數(shù)據(jù)的比 對(duì)結(jié)果是否符合預(yù)先設(shè)定的規(guī)則,識(shí)別所述用戶行為是否可信;
[0057] 模型分析識(shí)別單元,用于根據(jù)所述用戶行為數(shù)據(jù),采用預(yù)先生成的可信行為識(shí)別 模型計(jì)算表征所述用戶行為可信程度的指標(biāo)值,通過判斷所述指標(biāo)值是否滿足預(yù)先設(shè)定的 可信閾值,識(shí)別所述用戶行為是否可信。
[0058] 可選的,所述識(shí)別方式觸發(fā)單元在觸發(fā)所述規(guī)則分析識(shí)別單元工作之前或者之 后,觸發(fā)所述模型分析識(shí)別單元工作;
[0059] 相應(yīng)的,所述裝置還包括:
[0060] 識(shí)別結(jié)果合并單元,用于采用預(yù)先設(shè)置的策略,根據(jù)所述規(guī)則分析識(shí)別單元和所 述模型分析識(shí)別單元輸出的識(shí)別結(jié)果,綜合判斷所述用戶行為是否可信。
[0061] 可選的,所述行為數(shù)據(jù)獲取單元具體用于通過同步事件觸發(fā)的方式,獲取所述網(wǎng) 絡(luò)交互系統(tǒng)中的用戶行為數(shù)據(jù);或者,通過接收異步事件通知的方式,獲取所述網(wǎng)絡(luò)交互系 統(tǒng)中的用戶行為數(shù)據(jù)。
[0062] 可選的,如果所述識(shí)別方式觸發(fā)單元觸發(fā)所述規(guī)則分析識(shí)別單元工作,所述裝置 還包括:
[0063] 數(shù)據(jù)存儲(chǔ)單元,用于當(dāng)所述規(guī)則分析識(shí)別單元完成所述識(shí)別操作后,將所述用戶 行為數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)倉庫中。
[0064] 可選的,所述裝置包括:
[0065] 可信數(shù)據(jù)生成單元,用于預(yù)先生成所述可信數(shù)據(jù);
[0066] 所述可信數(shù)據(jù)生成單元包括:
[0067] 行為數(shù)據(jù)清洗子單元,用于對(duì)所述數(shù)據(jù)倉庫中存儲(chǔ)的用戶