基于用戶行為模式的身份認(rèn)證系統(tǒng)及其方法
【專利摘要】本發(fā)明涉及一種基于用戶行為模式的身份認(rèn)證系統(tǒng)及其方法,統(tǒng)由運(yùn)行于客戶端的用戶行為監(jiān)控器及運(yùn)行于服務(wù)器端的用戶身份判定系統(tǒng)組成;該方法包括步驟如下:步驟一,收集用戶瀏覽記錄,并采用提取特征向量的方法來為每個(gè)用戶建立統(tǒng)計(jì)模型;步驟二,進(jìn)行判別認(rèn)證;本發(fā)明利用用戶瀏覽記錄,建立了以支持度特征向量為基礎(chǔ)的用戶行為模型。本發(fā)明具有很好的可擴(kuò)展性、可移植性和通用性,對(duì)服務(wù)器造成的負(fù)載小,無需第三方軟件支持。
【專利說明】基于用戶行為模式的身份認(rèn)證系統(tǒng)及其方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于身份認(rèn)證【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]計(jì)算機(jī)網(wǎng)絡(luò)對(duì)人類生活和經(jīng)濟(jì)的沖擊是其他信息載體都無可比擬的,它的高速發(fā)展和全方位滲透,加快了整個(gè)社會(huì)的信息化進(jìn)程。國際互聯(lián)網(wǎng)已經(jīng)從早期小規(guī)模局域互聯(lián)網(wǎng),發(fā)展為全球性的信息服務(wù)平臺(tái),它具有分布廣域性、體系結(jié)構(gòu)開放性、信道共用性和資源共享性等特點(diǎn)。網(wǎng)絡(luò)技術(shù)被廣泛應(yīng)用于社會(huì)生活的各個(gè)領(lǐng)域,促進(jìn)了經(jīng)濟(jì)的繁榮和社會(huì)的進(jìn)步。其中,電子商務(wù)是互聯(lián)網(wǎng)技術(shù)的一項(xiàng)重要應(yīng)用,正在成為一個(gè)全球性的經(jīng)濟(jì)主題,發(fā)展十分迅猛。根據(jù)中國電子商務(wù)研究中心發(fā)布的監(jiān)測(cè)報(bào)告顯示,僅2012年第三季度,中國電子商務(wù)市場(chǎng)交易額就達(dá)2.05萬億元,同比增長(zhǎng)38%。然而,互聯(lián)網(wǎng)的諸多特點(diǎn)也不可避免地帶來了系統(tǒng)的脆弱性,使用戶及網(wǎng)絡(luò)信息本身面臨十分嚴(yán)重的安全問題。在電子商務(wù)領(lǐng)域,安全問題正是其核心問題。任何個(gè)人、企業(yè)或商業(yè)機(jī)構(gòu)以及銀行都不會(huì)通過一個(gè)不安全的網(wǎng)絡(luò)進(jìn)行商務(wù)交易,這樣會(huì)導(dǎo)致商業(yè)機(jī)密信息或個(gè)人隱私的泄漏,從而導(dǎo)致巨大的利益損失。如果網(wǎng)上交易的安全得不到保障,勢(shì)必會(huì)影響用戶利用電子商務(wù)進(jìn)行交易的積極性與信心,進(jìn)而嚴(yán)重影響我國電子商務(wù)的順利發(fā)展。因此,研究如何通過技術(shù)手段保證網(wǎng)絡(luò)環(huán)境中電子交易的安全性有著其十分重要的現(xiàn)實(shí)意義。
【發(fā)明內(nèi)容】
[0003]本發(fā)明面向的情況是當(dāng)前網(wǎng)絡(luò)交易用戶身份可信問題得不到保障,用戶身份盜用頻繁發(fā)生的現(xiàn)狀,提出采用用戶瀏覽記錄建立身份認(rèn)證模型,用以解決認(rèn)證用戶身份可/[目問題。
[0004]本發(fā)明給出的技術(shù)方案為:
一種基于用戶行為模式的身份認(rèn)證系統(tǒng),其特征在于,系統(tǒng)由運(yùn)行于客戶端的用戶行為監(jiān)控器及運(yùn)行于服務(wù)器端的用戶身份判定系統(tǒng)組成。所述用戶行為監(jiān)控器收集用戶瀏覽記錄,并將其存儲(chǔ)于XML文件,并將其上傳到服務(wù)器端的用戶身份判定系統(tǒng)。所述用戶身份判定系統(tǒng)采用從用戶瀏覽記錄中挖掘特征向量的方式,為每一個(gè)用戶建立一個(gè)識(shí)別標(biāo)志。當(dāng)需要認(rèn)證用戶身份時(shí),用戶身份判定系統(tǒng)利用該用戶之前生成的識(shí)別標(biāo)志與該用戶新生成的瀏覽記錄進(jìn)行比對(duì),進(jìn)而判定該用戶身份,并將判定結(jié)果反饋給服務(wù)器端。
[0005]所述基于用戶行為模式的身份認(rèn)證系統(tǒng)的運(yùn)行步驟如下:
步驟一,收集用戶瀏覽記錄,并采用提取特征向量的方法來為每個(gè)用戶建立統(tǒng)計(jì)模
型:
O在用戶瀏覽網(wǎng)頁時(shí),用戶行為監(jiān)控器在后臺(tái)記錄用戶瀏覽信息,保存于XML文件中,并將其提交給用戶身份判定系統(tǒng)。
[0006]2)對(duì)于每個(gè)用戶的瀏覽記錄,首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后按照時(shí)間相似性將其劃分為多個(gè)瀏覽過程。[0007]3)接下來,根據(jù)這些瀏覽過程,為每個(gè)用戶挖掘k個(gè)最能代表該用戶的域名。
[0008]4)將所有用戶挖掘到的所有域名的并集作為特征向量的分量。對(duì)于每個(gè)用戶,計(jì)算特征向量中的每個(gè)域名對(duì)該用戶的支持度,并將其作為該用戶特征向量的值。這樣,就為每個(gè)用戶建立了特征向量,也就是該用戶的行為模型。步驟二,進(jìn)行判別認(rèn)證:
I)當(dāng)需要驗(yàn)證操作者是否屬于某個(gè)用戶時(shí),用戶行為監(jiān)控器收集操作者新生成的瀏覽序列,并將其提交給用戶身份判定系統(tǒng)。
[0009]2)用戶身份判定系統(tǒng)首先按照上述相同的方法為新提交的瀏覽序列求出特征向
量的值。
[0010]3)通過計(jì)算新提交的瀏覽序列特征向量與該用戶特征向量間的距離判斷新的序列是否屬于該用戶。如果距離小于系統(tǒng)設(shè)定的閾值,則判定為通過認(rèn)證,反之則為不通過認(rèn)證。如果新的瀏覽序列通過了認(rèn)證,系統(tǒng)對(duì)用戶特征向量進(jìn)行更新,以反映用戶習(xí)慣的變化;否則系統(tǒng)向服務(wù)器端報(bào)警,提示該用戶存在異常。
[0011]本發(fā)明技術(shù)方案利用用戶瀏覽記錄,建立了以支持度特征向量為基礎(chǔ)的用戶行為模型。本發(fā)明具有很好的可擴(kuò)展性、可移植性和通用性,對(duì)服務(wù)器造成的負(fù)載小,無需第三方軟件支持。
【專利附圖】
【附圖說明】
[0012]圖1用戶身份認(rèn)證系統(tǒng)架構(gòu)圖;
圖2用戶瀏覽記錄XML;
圖3系統(tǒng)整體流程。
【具體實(shí)施方式】
[0013]如圖1所示,系統(tǒng)首先收集用戶的瀏覽記錄,并以XML文件存儲(chǔ)。用戶瀏覽記錄XML文件的格式如圖2所示。
[0014]下面給出用戶身份認(rèn)證系統(tǒng)的具體實(shí)施方案。系統(tǒng)采用提取特征向量的方法來為每個(gè)用戶建立統(tǒng)計(jì)模型。對(duì)于每個(gè)用戶的瀏覽記錄,我們首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后按照時(shí)間相似性將其劃分為多個(gè)瀏覽過程。接下來,我們根據(jù)這些瀏覽過程,為每個(gè)用戶挖掘k個(gè)最能代表該用戶的域名。我們將所有用戶挖掘到的所有域名的并集作為特征向量的分量。所有用戶共享特征向量的分量,因此特征向量的分量本身并不能表示用戶之間的區(qū)別。對(duì)于每個(gè)用戶,我們計(jì)算特征向量中的每個(gè)域名對(duì)該用戶的支持度,并將其作為該用戶特征向量的值。這樣,我們就為每個(gè)用戶建立了特征向量,也就是該用戶的行為模型。當(dāng)我們需要驗(yàn)證一個(gè)新的瀏覽序列是否屬于某個(gè)用戶時(shí),首先按照上文所述的方法為新的瀏覽序列求出特征向量的值,通過計(jì)算新的瀏覽序列特征向量與該用戶特征向量間的距離判斷新的序列是否屬于該用戶。如果距離小于系統(tǒng)設(shè)定的閾值,則判定為通過認(rèn)證,反之則為不通過認(rèn)證。如果新的瀏覽序列通過了認(rèn)證,系統(tǒng)對(duì)用戶特征向量進(jìn)行更新,以反映用戶習(xí)慣的變化;否則系統(tǒng)向服務(wù)器端報(bào)警,提示該用戶存在異常。系統(tǒng)流程由圖3所示。
【權(quán)利要求】
1.一種基于用戶行為模式的身份認(rèn)證系統(tǒng),其特征在于,系統(tǒng)由運(yùn)行于客戶端的用戶行為監(jiān)控器及運(yùn)行于服務(wù)器端的用戶身份判定系統(tǒng)組成;所述用戶行為監(jiān)控器收集用戶瀏覽記錄,并將其存儲(chǔ)于XML文件,并將其上傳到服務(wù)器端的用戶身份判定系統(tǒng);所述用戶身份判定系統(tǒng)采用從用戶瀏覽記錄中挖掘特征向量的方式,為每一個(gè)用戶建立一個(gè)識(shí)別標(biāo)志;當(dāng)需要認(rèn)證用戶身份時(shí),用戶身份判定系統(tǒng)利用該用戶之前生成的識(shí)別標(biāo)志與該用戶新生成的瀏覽記錄進(jìn)行比對(duì),進(jìn)而判定該用戶身份,并將判定結(jié)果反饋給服務(wù)器端。
2.一種基于用戶行為模式的身份認(rèn)證方法,包括步驟如下: 步驟一,收集用戶瀏覽記錄,并采用提取特征向量的方法來為每個(gè)用戶建立統(tǒng)計(jì)模型: O在用戶瀏覽網(wǎng)頁時(shí),用戶行為監(jiān)控器在后臺(tái)記錄用戶瀏覽信息,保存于XML文件中,并將其提交給用戶身份判定系統(tǒng); 2)對(duì)于每個(gè)用戶的瀏覽記錄,首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后按照時(shí)間相似性將其劃分為多個(gè)瀏覽過程; 3)接下來,根據(jù)這些瀏覽過程,為每個(gè)用戶挖掘k個(gè)最能代表該用戶的域名; 4)將所有用戶挖掘到的所有域名的并集作為特征向量的分量;對(duì)于每個(gè)用戶,計(jì)算特征向量中的每個(gè)域名對(duì)該用戶的支持度,并將其作為該用戶特征向量的值;這樣,就為每個(gè)用戶建立了特征向量,也就是該用戶的行為模型; 步驟二,進(jìn)行判別認(rèn)證: 1)當(dāng)需要驗(yàn)證操作者是否屬于某個(gè)用戶時(shí),用戶行為監(jiān)控器收集操作者新生成的瀏覽序列,并將其提交給用戶身份判定系統(tǒng); 2)用戶身份判定系統(tǒng)首先按照上述相同的方法為新提交的瀏覽序列求出特征向量的值; 3)通過計(jì)算新提交的瀏覽序列特征向量與該用戶特征向量間的距離判斷新的序列是否屬于該用戶;如果距離小于系統(tǒng)設(shè)定的閾值,則判定為通過認(rèn)證,反之則為不通過認(rèn)證;如果新的瀏覽序列通過了認(rèn)證,系統(tǒng)對(duì)用戶特征向量進(jìn)行更新,以反映用戶習(xí)慣的變化;否則系統(tǒng)向服務(wù)器端報(bào)警,提示該用戶存在異常。
【文檔編號(hào)】G06F17/30GK103699823SQ201410007997
【公開日】2014年4月2日 申請(qǐng)日期:2014年1月8日 優(yōu)先權(quán)日:2014年1月8日
【發(fā)明者】蔣昌俊, 陳閎中, 閆春鋼, 丁志軍, 張鴻博 申請(qǐng)人:同濟(jì)大學(xué)