亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于擊鍵特征識別的認(rèn)證方法及系統(tǒng)的制作方法

文檔序號:7945229閱讀:284來源:國知局
專利名稱:一種基于擊鍵特征識別的認(rèn)證方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于網(wǎng)絡(luò)的身份認(rèn)證領(lǐng)域,特別涉及一種基于擊鍵特征識別的認(rèn)證方法。

背景技術(shù)
當(dāng)前絕大多數(shù)網(wǎng)絡(luò)和信息系統(tǒng),都是通過用戶名和密碼機(jī)制對訪問者的身份進(jìn)行認(rèn)證。然而,僅僅依靠這種認(rèn)證機(jī)制,會(huì)存在很多安全問題。主要存在的安全問題體現(xiàn)在以下三個(gè)方面 (1)密碼一旦被敵手(黑客、網(wǎng)絡(luò)入侵者、惡意破壞者等)竊取,敵手就可以輕易地以該合法用戶的身份登錄到系統(tǒng)中,進(jìn)而非法使用本來是該合法用戶才可以使用的資源。
(2)用戶為了防止密碼遺忘,通常會(huì)選擇較弱的密碼,如自己的名字、生日或某個(gè)單詞等,這又降低了敵手竊取其密碼的難度。
(3)用戶名密碼機(jī)制,并不能保證用戶身份的唯一性,即任何知道該用戶名和對應(yīng)密碼的人,都可以以該用戶的身份進(jìn)行登錄,訪問系統(tǒng)資源。但在實(shí)際應(yīng)用情況中,許多資源的提供者并不希望這種情況發(fā)生。他們希望每一個(gè)用戶的賬號,只能為該用戶一個(gè)人使用,而不能被其他人使用,即使這種使用是經(jīng)該用戶授權(quán)的。例如,一個(gè)提供在線視頻教學(xué)服務(wù)的提供商,只希望一個(gè)賬號為一人所用,而不希望這個(gè)賬號被許多人使用。針對此種情況,傳統(tǒng)的用戶名密碼認(rèn)證機(jī)制是無能為力的。
利用現(xiàn)代生物認(rèn)證技術(shù),可以有效地解決上述問題。這些技術(shù)包括指紋識別、虹膜識別、語音識別等。然而,這其中的絕大部分技術(shù),存在需要使用專門設(shè)備、實(shí)施成本較高、程序較繁瑣等這樣或那樣的缺陷,因此,在通常的應(yīng)用場合下,并不適用。例如,如果某項(xiàng)服務(wù)需要用戶提供其指紋進(jìn)行認(rèn)證才能使用,那么許多用戶可能會(huì)拒絕使用該服務(wù),因?yàn)橛脩舨幌M渲讣y被隨意記錄。且另一方面,用戶為了使用該服務(wù),還需額外添置一臺指紋識別儀,因此增加了該用戶的開銷。再如,語音識別,雖然成本不高(可能只需一個(gè)麥克風(fēng)),且多數(shù)用戶不介意系統(tǒng)對自己的聲音進(jìn)行記錄。但是,如果用戶每次訪問某種資源時(shí),都需要對著麥克風(fēng)喊話,才可以進(jìn)行認(rèn)證,無論用戶自己,還是用戶周圍的人,都是無法忍受的。大多數(shù)擊鍵動(dòng)態(tài)認(rèn)證系統(tǒng)的研究都不夠完整和充分,往往都是針對某一部分進(jìn)行的,例如僅對數(shù)據(jù)采集、分類器模型或模板庫更新進(jìn)行單一研究。實(shí)際應(yīng)用中,沒有完整的基于擊鍵動(dòng)態(tài)認(rèn)證的方法,目前的研究只是針對擊鍵動(dòng)態(tài)認(rèn)證的某一部分進(jìn)行的,沒有一個(gè)完整的實(shí)現(xiàn)方法。


發(fā)明內(nèi)容
為了克服現(xiàn)有網(wǎng)絡(luò)認(rèn)證方法成本較高、程序較繁瑣等缺陷,以及現(xiàn)有的擊鍵動(dòng)態(tài)認(rèn)證方法沒有一個(gè)完整的實(shí)現(xiàn)方法,本發(fā)明提供了一種基于擊鍵特征識別的認(rèn)證方法及系統(tǒng)。
本發(fā)明采用的技術(shù)方案是 基于擊鍵特征識別的認(rèn)證方法,包括以下步驟 (1)聲稱身份是ID的用戶輸入口令,不正確重新輸入;如果正確判斷用戶樣本數(shù)是否達(dá)到設(shè)定數(shù)量,是,進(jìn)入步驟(2);否,進(jìn)行訓(xùn)練;樣本設(shè)定數(shù)量為7~10。
(2)聲稱身份是ID的用戶輸入指定文本,該文本的擊鍵序列S={s1,s2,...,sm},si表示第i個(gè)字母;包含n字母組G(n)={g1,g2,...,gm-n+1},n字母組時(shí)間特征值T={t1,t2,t3,...,tm-n+1},進(jìn)行標(biāo)準(zhǔn)化處理之后的時(shí)間特征值為

表示n字母組gi的持續(xù)時(shí)間。當(dāng)n=1(單字母組)時(shí),擊鍵持續(xù)時(shí)間即為當(dāng)前按鍵從壓下到彈起之間的時(shí)間間隔。當(dāng)n≥2時(shí),n字母組擊鍵持續(xù)時(shí)間可定義為對n字母組擊鍵時(shí)最后一個(gè)按鍵的彈起時(shí)間

與第一個(gè)按鍵的壓下時(shí)間

之間的時(shí)間間隔,即 用l表示擊鍵時(shí)間間隔。本發(fā)明對n字母組的擊鍵時(shí)間間隔的定義,n字母組中最后一個(gè)字母的按鍵壓下時(shí)間與第一個(gè)字母的按鍵壓下時(shí)間之間的間隔,為擊鍵時(shí)間間隔。用符號表示為 n個(gè)連續(xù)輸入的字母(或n次連續(xù)擊鍵對應(yīng)的鍵碼)的組合,叫做n字母組。根據(jù)這個(gè)定義,當(dāng)n=1時(shí),稱其為單字母組;當(dāng)n=2時(shí),稱其為雙字母組……以此類推。
(3)從用戶擊鍵特征模板中找到用戶ID的HMM λID(Π,A,B),用戶ID的各個(gè)n字母組對應(yīng)的時(shí)間特征值的期望值為{μT(gj)|j=1,2,...,m-n+1},各個(gè)n字母組對應(yīng)的時(shí)間特征值的方差為計(jì)算該用戶ID的HMM λID(Π,A,B)生成指定文本的概率P(Tt|λID),其中計(jì)算閾值概率 聲稱身份是ID的用戶擊鍵時(shí)間特征值T的概率P(T|λID);根據(jù)系統(tǒng)設(shè)定的閾值系數(shù)δ,1<δ<3,計(jì)算ID用戶的閾值概率P1,狀態(tài)輸出概率向量B需要按公式進(jìn)行計(jì)算, 其中μD(gi)表示n字母組gi的期望值,σD(gi)表示n字母組gi的方差; (|gi|表示n字母組gi在擊鍵序列S中出現(xiàn)的次數(shù)) 最后,給定的參數(shù)為λ=(A,η,π)的HMM產(chǎn)生擊鍵序列S且時(shí)間特征值為T的概率如下 π和所有的αi,i+1以及所有的bi相部相乘到一起便可得出Pr[KS,G(n),T|λ]的值。
閾值概率P1=P(Tt|λID)用下面的公式來計(jì)算 計(jì)算閾值概率后,計(jì)算身份為ID的該次輸入文本的擊鍵時(shí)間特征值T的概率P2=P(T|λID),即 (|gi|表示n字母組gi在擊鍵序列S中出現(xiàn)的次數(shù)) 其中 (i=1,2....,m-n+1) (4)比較閾值概率P(Tt|λID)與用戶ID生成指定文本的概率P(T|λID),如果P(T|λID)≥P(Tt|λID),認(rèn)證成功,否則失敗。
步驟(4)中,認(rèn)證成功之后對擊鍵特征模板更新,過程如下按照擊鍵特征采集的時(shí)間先后順序,將該用戶擊鍵特征模板訓(xùn)練時(shí)用到的樣本進(jìn)行排隊(duì);然后,將采集時(shí)間最早的樣本去掉,而將本次認(rèn)證過程中用戶的擊鍵樣本作為隊(duì)尾元素,加入到隊(duì)列中,利用隊(duì)列中現(xiàn)有的所有樣本,重新計(jì)算各個(gè)n字母組的時(shí)間特征值,將其存儲(chǔ)在該用戶的擊鍵特征模板中,替換掉原來的各個(gè)值,當(dāng)閾值大于等于2時(shí),則對各n字母組時(shí)間特征值的期望和方差全部更新;當(dāng)閾值小于2時(shí),則只更新各n字母組時(shí)間特征值的期望值。
其中訓(xùn)練過程,步驟如下 1)用戶輸入指定文本S,轉(zhuǎn)換為n字母組G,設(shè)G={g1,g2,...,gm-n+1},將按鍵的鍵碼、壓下時(shí)間和彈起時(shí)間存入擊鍵特征模板; 2)是否達(dá)到設(shè)定的樣本數(shù)量,是,進(jìn)入步驟3),否,返回步驟1);樣本設(shè)定數(shù)量為7~10。
3)計(jì)算擊鍵特征模板中所有n字母組時(shí)間特征值的期望值μ和方差σ,以及初始狀態(tài)概率Π和相應(yīng)的狀態(tài)轉(zhuǎn)移概率A, 其中u為訓(xùn)練模板所需的擊鍵特征樣本個(gè)數(shù),t1(g)為第i個(gè)樣本中n字母組g的時(shí)間特征值,并對n字母組時(shí)間特征值進(jìn)行標(biāo)準(zhǔn)化處理; 任意的n字母組其初始狀態(tài)概率為 上式中|gi|表示n字母組gi在擊鍵序列S中出現(xiàn)的次數(shù),分母部分則為此擊鍵序列中n字母組的個(gè)數(shù); 一個(gè)n字母組gi(i=1,2,...,m-n+1)向另一個(gè)n字母組gj(j=1,2,...,m-n+1)的狀態(tài)轉(zhuǎn)移概率aij,則通過下式計(jì)算
其中,

表示gi與gj間的一種連接,如果gi的最后n-1個(gè)字母和gj的前n-1個(gè)字母相同,則有

即二者進(jìn)行該連接后,形成的n+1字母組為本擊鍵序列產(chǎn)生的,此時(shí),有
而當(dāng)gi的后n-1個(gè)字母和

的前n-1個(gè)字母不相同時(shí),則有

此時(shí),有
4)將計(jì)算結(jié)果存入該用戶的模板數(shù)據(jù)庫。
對于用戶輸入指定文本,在認(rèn)證的過程中以及訓(xùn)練的過程中,對n字母組時(shí)間特征值之后進(jìn)行標(biāo)準(zhǔn)化處理,可以更好的獲得時(shí)間特征值。步驟如下選擇將每個(gè)時(shí)間特征值標(biāo)準(zhǔn)化為一個(gè)0到N的值,N取700~900,對采集到的每個(gè)擊鍵時(shí)間特征值ti,若完成該次擊鍵樣本采集花費(fèi)的總的時(shí)間為T,設(shè)標(biāo)準(zhǔn)化后的時(shí)間特征值為

則有例如,假設(shè)用戶前后兩次對一個(gè)僅含三個(gè)字母的字符序列S進(jìn)行輸入,其中包含兩個(gè)雙字母組g1,g2,用戶第一次輸入時(shí),其雙字母組持續(xù)時(shí)間分別為用戶第二次輸入時(shí),其雙字母組持續(xù)時(shí)間分別為現(xiàn)在,對其進(jìn)行標(biāo)準(zhǔn)化處理,若取N為800,則對雙字母組g1而言,其前后兩次輸入的標(biāo)準(zhǔn)化后的持續(xù)時(shí)間值為 同理,可求出雙字母組g2的前后兩次標(biāo)準(zhǔn)化后的持續(xù)時(shí)間分別為 由此可見,在用戶的擊鍵特征呈現(xiàn)出一種相對的穩(wěn)定性的時(shí)候,若對其時(shí)間特征值進(jìn)行標(biāo)準(zhǔn)化,則用戶因受其它因素影響而產(chǎn)生的輸入速度上的差異,就會(huì)被屏蔽掉。
對特征值進(jìn)行標(biāo)準(zhǔn)化,不只是在擊鍵動(dòng)態(tài)認(rèn)證中的訓(xùn)練階段求正態(tài)分布中的期望和方差時(shí)被使用,在認(rèn)證階段中,對采集到的擊鍵時(shí)間特征值,也必須采用標(biāo)準(zhǔn)化方法來進(jìn)行處理。只有這樣,才能將認(rèn)證階段與訓(xùn)練階段在整體輸入速度上的差異屏蔽掉。
所述的n字母組采用3字母組。
本發(fā)明設(shè)定的閾值系數(shù)1<δ<3,獲取步驟如下假定輸入序列中的各個(gè)gi對應(yīng)的時(shí)間特征值與其已有的正態(tài)分布的期望值相差若干不同倍的方差σ2,如0.2σ2、0.4σ2、0.6σ2...1σ2、2σ2、4σ2等等,以這些不同倍的方差為自變量,作出FRR(錯(cuò)誤拒絕率合法用戶的登錄請求被當(dāng)作非法用戶(而被拒絕)的比例)曲線和FAR(錯(cuò)誤接受率非法用戶以合法用戶的身份進(jìn)行登錄的請求被系統(tǒng)接受的比例)曲線,兩個(gè)曲線會(huì)有一個(gè)交點(diǎn),則選擇該點(diǎn)周圍作為閾值系數(shù)δ,設(shè)定1<δ<3。(因?yàn)樵擖c(diǎn)是可選取的最優(yōu)點(diǎn),因?yàn)閮蓚€(gè)曲線相交說明,該點(diǎn)的FAR和FRR對系統(tǒng)來說都是可接受的);這點(diǎn)對應(yīng)的自變量是x倍方差,那么我們就以x倍方差為準(zhǔn),即假定輸入序列中的各個(gè)gi對應(yīng)的時(shí)間特征值與其已有的正態(tài)分布的期望值相差x倍的方差σ2,然后計(jì)算出P1就可以了。
本發(fā)明的基于擊鍵特征識別的認(rèn)證方法所采用的系統(tǒng) 該系統(tǒng)包括初始登錄模塊,訓(xùn)練模塊,認(rèn)證模塊和數(shù)據(jù)分析模塊, 初始登錄模塊,包括用戶注冊單元、口令核對單元和用戶樣本數(shù)對比單元,其中用戶樣本比對單元在登錄時(shí),對用戶已經(jīng)輸入的樣本的數(shù)量進(jìn)行查詢,如果用戶的樣本數(shù)已達(dá)到規(guī)定的數(shù)量,則轉(zhuǎn)入認(rèn)證模塊進(jìn)行認(rèn)證;如果用戶的樣本數(shù)尚未達(dá)到規(guī)定數(shù)量,則轉(zhuǎn)入訓(xùn)練模塊繼續(xù)進(jìn)行樣本采集; 訓(xùn)練模塊包括客戶端訓(xùn)練子模塊和服務(wù)器端訓(xùn)練子模塊,其中客戶端訓(xùn)練子模塊在瀏覽器端為用戶提供需輸入內(nèi)容的相關(guān)注意事項(xiàng)說明和具體內(nèi)容提示,用戶根據(jù)提示進(jìn)行輸入,相關(guān)的輸入數(shù)據(jù)之后就被轉(zhuǎn)到擊鍵處理程序處理,擊鍵處理程序記下具體按鍵信息;同時(shí)該子模塊還提供對數(shù)據(jù)的基本預(yù)處理如果取n字母組來分析擊鍵時(shí)間特征值,那么系統(tǒng)首先將此文本序列S轉(zhuǎn)換為n字母組G,設(shè)G={g1,g2,...,gm-n+1},將按鍵的鍵碼、壓下時(shí)間和彈起時(shí)間存入擊鍵特征模板,其次,計(jì)算各個(gè)n字母組的時(shí)間特征值,將其表示為最后,將得到的各個(gè)時(shí)間特征值進(jìn)行標(biāo)準(zhǔn)化處理,設(shè)標(biāo)準(zhǔn)化處理后的時(shí)間特征值為服務(wù)器端訓(xùn)練子模塊是對數(shù)據(jù)進(jìn)行進(jìn)一步處理并將其進(jìn)行保存,客戶端由擊鍵處理程序預(yù)先處理好的擊鍵的具體數(shù)據(jù)信息會(huì)發(fā)到服務(wù)端的接收處理程序處理,接收處理程序試著將這些信息存入擊鍵數(shù)據(jù)樣本數(shù)據(jù)庫和用戶模板數(shù)據(jù)庫,并在成功存入后給用戶以相應(yīng)反饋; 認(rèn)證模塊包括兩個(gè)子模塊,客戶端認(rèn)證子模塊和服務(wù)器認(rèn)證子模塊,客戶端認(rèn)證子模塊在客戶進(jìn)行登錄時(shí)用戶輸入與樣本一樣的內(nèi)容,相關(guān)的數(shù)據(jù)之后就被轉(zhuǎn)到認(rèn)證處理程序處理,根據(jù)系統(tǒng)設(shè)定的閾值系數(shù)σ,1<σ<3,計(jì)算ID用戶的閾值概率P1;之后數(shù)據(jù)信息就被發(fā)到服務(wù)端,服務(wù)器認(rèn)證子模塊根據(jù)本系統(tǒng)的基于統(tǒng)計(jì)學(xué)建立的模型,對接收到的數(shù)據(jù)進(jìn)行驗(yàn)證,比較閾值概率與用戶ID生成指定文本的概率P2=P(T|λID),如果P2=P(T,λID)≥P1=P(Tt|λID),認(rèn)證成功,否則失敗;如果符合該用戶的擊鍵特征,則將其作為新樣本,按照本系統(tǒng)使用的模板庫更新標(biāo)準(zhǔn),對樣本庫進(jìn)行更新; 該系統(tǒng)還可以包括數(shù)據(jù)分析模塊,該模塊的功能主要是通過在瀏覽器端打開實(shí)驗(yàn)結(jié)果分析頁面,進(jìn)行實(shí)驗(yàn)結(jié)果分析。在該頁面中,允許對系統(tǒng)的參數(shù)進(jìn)行設(shè)置,如訓(xùn)練模板采用多少個(gè)輸入樣本、模板是否動(dòng)態(tài)更新、采用的時(shí)間特征值(持續(xù)時(shí)間/時(shí)間間隔)等。用戶設(shè)置各項(xiàng)參數(shù)并提交請求后,服務(wù)器端進(jìn)行計(jì)算,并將結(jié)果返回給瀏覽器端。參數(shù)設(shè)置之后,每次計(jì)算都產(chǎn)生多個(gè)P1閾值概率,就是讓閾值系數(shù)δ分別為0.5,1.0,1.5....0.4,0.8,1.2....;用戶當(dāng)前產(chǎn)生的概率P2與這多個(gè)P1閾值概率都要比較,得到被接受還是被拒絕的結(jié)果。最終,將得到的相應(yīng)結(jié)果數(shù)據(jù)輸出到結(jié)果文件之中,根據(jù)不同的實(shí)驗(yàn)?zāi)康挠眠@些結(jié)果進(jìn)行分析。
本發(fā)明的基于擊鍵特征識別的認(rèn)證方法,擊鍵動(dòng)態(tài)認(rèn)證(keystroke dynamics),也稱作擊鍵特征識別、擊鍵生物認(rèn)證,是指根據(jù)用戶的擊鍵特征來對用戶的身份進(jìn)行認(rèn)證,是一種基于行為特征的生物認(rèn)證技術(shù)。作為生物認(rèn)證技術(shù)的一種,它具有一般生物認(rèn)證技術(shù)的優(yōu)點(diǎn)—安全性較高、不易丟失、標(biāo)識唯一性等。同時(shí),又克服了一般生物認(rèn)證技術(shù)的缺點(diǎn)—需要額外的設(shè)備、實(shí)施復(fù)雜、成本高等。因此,在信息化、網(wǎng)絡(luò)化的時(shí)代,具有廣闊的應(yīng)用前景。
本發(fā)明通過隱馬爾可夫模型(HMM),對擊鍵動(dòng)態(tài)認(rèn)證進(jìn)行建模;并結(jié)合正態(tài)分布、參數(shù)最大似然估計(jì)等統(tǒng)計(jì)學(xué)知識,計(jì)算模型中的參數(shù);最終利用改進(jìn)的前向算法,來解決評估問題,使得建立起的模型能夠?qū)τ脩羯矸莸倪M(jìn)行認(rèn)證。擊鍵特征作為一種行為特征,隨著時(shí)間的推移較易發(fā)生變化。為了解決這個(gè)問題,提高系統(tǒng)性能,本發(fā)明提出對用戶擊鍵特征模板進(jìn)行動(dòng)態(tài)更新的思想,并提出三種更新方法——模板參數(shù)全部更新、模板參數(shù)部分更新及模板參數(shù)全部更新與部分更新相結(jié)合的方法,并進(jìn)行相關(guān)實(shí)驗(yàn)。通過實(shí)驗(yàn),得到結(jié)論,采用參數(shù)部分更新與全部更新相結(jié)合的模板更新方法,系統(tǒng)性能較原來有較大提高。此外,還對樣本數(shù)量、樣本中擊鍵數(shù)、采用的時(shí)間特征值、n字母中的n值的不同等因素對系統(tǒng)性能的影響進(jìn)行實(shí)驗(yàn),通過對實(shí)驗(yàn)結(jié)果進(jìn)行分析后,給出實(shí)際應(yīng)用中這些參數(shù)的參考值。



圖1本發(fā)明的系統(tǒng)結(jié)構(gòu)圖; 圖2本發(fā)明的系統(tǒng)模塊圖; 圖3本發(fā)明的程序流程圖; 圖4本發(fā)明的訓(xùn)練流程圖; 圖5本發(fā)明的認(rèn)證流程圖; 圖6本發(fā)明的擊鍵特征模板更新流程圖; 圖7本發(fā)明的模板不更新時(shí)與模板全部更新時(shí)的FRR與FAR分析對比圖; 圖8本發(fā)明的模板不動(dòng)態(tài)更新與模板動(dòng)態(tài)更新時(shí)FRR與FAR分析對比圖; 圖9本發(fā)明的模板不更新時(shí)與模板全部更新時(shí)的FRR與FAR分析對比圖;
具體實(shí)施例方式 結(jié)合附圖對本發(fā)明做進(jìn)一步描述 系統(tǒng)的認(rèn)證總體業(yè)務(wù)流程主要包括初始登陸,認(rèn)證和訓(xùn)練等,圖3給出了程序流程圖。
首先用戶登錄以及注冊的信息都是通過初始登錄模塊處理的,新注冊的用戶信息被存放于用戶信息數(shù)據(jù)庫中;已注冊用戶的樣本個(gè)數(shù)從用戶模板數(shù)據(jù)庫中提出進(jìn)行下一步流程的判斷。
樣本數(shù)不夠的用戶將進(jìn)入訓(xùn)練模塊進(jìn)行處理。訓(xùn)練模塊從頁面中進(jìn)行數(shù)據(jù)采集,預(yù)處理。之后將成功處理了的新樣本保存入擊鍵數(shù)據(jù)樣本數(shù)據(jù)庫和用戶模板數(shù)據(jù)庫。
樣本數(shù)達(dá)到要求的用戶將進(jìn)入認(rèn)證模塊進(jìn)行處理。認(rèn)證模塊將用戶本次輸入的數(shù)據(jù)采集并暫存。然后從擊鍵數(shù)據(jù)樣本數(shù)據(jù)庫提出之前用戶的樣本信息,用統(tǒng)計(jì)方法處理并與本次采樣比對,將比對結(jié)果放入認(rèn)證信息數(shù)據(jù)庫,之后決定用戶是否合法。對認(rèn)證成功的用戶,還將用本次采樣進(jìn)行用戶模板數(shù)據(jù)庫的更新。
根據(jù)系統(tǒng)的業(yè)務(wù)流程,系統(tǒng)的總體流程(如圖3所示)主要包括以下過程, (1)用戶輸入ID和口令; (2)口令判斷,不下確,轉(zhuǎn)到過程(1);正確,轉(zhuǎn)到過程(3); (3)用戶樣本數(shù)是否達(dá)到規(guī)定數(shù)量判斷,未達(dá)到,轉(zhuǎn)到過程(4),已達(dá)到,轉(zhuǎn)到過程(11); (4)說明采樣時(shí)的注意事項(xiàng); (5)用戶輸入指定樣本; (6)系統(tǒng)采集并存儲(chǔ)數(shù)據(jù); (7)預(yù)處理并存儲(chǔ)結(jié)果; (8)用戶樣本數(shù)是否達(dá)到規(guī)定數(shù)量判斷,未達(dá)到,轉(zhuǎn)到過程(4);已達(dá)到,轉(zhuǎn)到過程(9); (9)計(jì)算n字母組的時(shí)間特征值的期望和方差,初始狀態(tài)概率和相應(yīng)的狀態(tài)轉(zhuǎn)移概率; (10)計(jì)算結(jié)果放入用戶模板數(shù)據(jù)庫,轉(zhuǎn)到過程(19); (11)用戶輸入指定樣本; (12)系統(tǒng)采集并存儲(chǔ)數(shù)據(jù); (13)預(yù)處理并存儲(chǔ)結(jié)果; (14)從用戶擊鍵模板數(shù)據(jù)庫取出此用戶相關(guān)數(shù)據(jù); (15)計(jì)算閾值概率P1和用戶產(chǎn)生當(dāng)前特征值的概率P2; (16)P1是否大于等于P2的判斷,如果是,轉(zhuǎn)到過程(17),不是,轉(zhuǎn)到過程(18); (17)說明認(rèn)證成功,用本次擊鍵樣本對該用戶的擊鍵模板進(jìn)行更新,轉(zhuǎn)到過程(19); (18)提醒用戶認(rèn)證失??; (19)結(jié)束。
用戶在進(jìn)行擊鍵動(dòng)態(tài)身份認(rèn)證之前,必須進(jìn)行訓(xùn)練,這樣才能建立起對應(yīng)該用戶的擊鍵特征模板。訓(xùn)練階段流程的流程,如圖4所示。
在訓(xùn)練階段,要求用戶對某一文本(由系統(tǒng)提供)進(jìn)行若干次的輸入,系統(tǒng)對用戶輸入過程中的擊鍵事件相關(guān)值如鍵碼、壓下時(shí)間、彈起時(shí)間等進(jìn)行記錄,并進(jìn)行預(yù)處理,如得出n字母組及對應(yīng)的擊鍵持續(xù)時(shí)間和擊鍵時(shí)間間隔等。將其存入數(shù)據(jù)庫中,以便在生成擊鍵特征模板時(shí)使用。當(dāng)用戶完成系統(tǒng)規(guī)定次數(shù)的輸入訓(xùn)練后,系統(tǒng)將數(shù)據(jù)庫中存儲(chǔ)的所有關(guān)于該用戶的擊鍵特征樣本中的n字母組及對應(yīng)的時(shí)間特征值提取出來,作為樣本,利用正態(tài)分布的最大似然估計(jì),求出各個(gè)n字母組時(shí)間特征值的期望和方差,將其存儲(chǔ)在用戶的擊鍵特征模板中,用于將來計(jì)算該用戶的HMM的狀態(tài)輸出概率。此外,系統(tǒng)根據(jù)用戶輸入樣本時(shí)的擊鍵序列,計(jì)算出該用戶的HMM λ(Π,A,B)中的初始狀態(tài)概率向量Π及狀態(tài)轉(zhuǎn)移矩陣A,并將其存儲(chǔ)在該用戶的擊鍵特征模板中。至此,訓(xùn)練階段完成。
在認(rèn)證階段,如圖5所示,系統(tǒng)要求用戶對指定的文本序列進(jìn)行一次輸入,將此過程中采集到的用戶的擊鍵信息存儲(chǔ)在數(shù)據(jù)庫中,以便更新模板時(shí)使用。
同時(shí),對擊鍵信息進(jìn)行預(yù)處理,產(chǎn)生相應(yīng)的n字母組及其時(shí)間特征值,并按照訓(xùn)練階段同樣的標(biāo)準(zhǔn),對這兩項(xiàng)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。最后,系統(tǒng)提取用戶擊鍵特征模板中對應(yīng)該用戶的HMM λ(Π,A,B),根據(jù)系統(tǒng)設(shè)定的閾值,計(jì)算出一個(gè)概率閾值P1,另一方面,根據(jù)當(dāng)前用戶擊鍵的標(biāo)準(zhǔn)化后的時(shí)間特征值,計(jì)算出該模板產(chǎn)生當(dāng)前擊鍵時(shí)間特征值的概率P2。最后,比較這兩個(gè)概率值,如果P2≥P1,則系統(tǒng)認(rèn)為當(dāng)前用戶與其聲稱的身份一致,該用戶通過認(rèn)證;否則,系統(tǒng)拒絕該用戶。
初始概率的確定 給定一個(gè)擊鍵序列S={k1,k2,...,km},其中k1,k2,...,km為擊鍵對應(yīng)的字符或鍵碼等,若要對n字母組的時(shí)間特征進(jìn)行提取,則此含有m個(gè)字符的序列中擁有的n字母組的個(gè)數(shù)為m-n+1,設(shè)n字母組的集合為G,G={g1,g2,...,gm-n+1}。同理,含有m個(gè)字符的序列中擁有的n+1字母組的個(gè)數(shù)為m-(n+1)+1=m-n,設(shè)n+1字母組的集合為G,G={g1,g2,...,gm-n}。則對任意的n字母組gi(i=1,2,...,n-m+1),其初始狀態(tài)概率為 上式右端,分子部分|gi|表示n字母組

在擊鍵序列S中出現(xiàn)的次數(shù),分母部分則為此擊鍵序列中n字母組的個(gè)數(shù)。因此,n字母組的初始狀態(tài)概率,即為該n字母組在其所屬的擊鍵序列中出現(xiàn)的頻率。
例如,要輸入的字符序列為“l(fā)eaflet”。則雙字母組的集合為G(2)={le,ea,af,fl,le,et},雙字母組的個(gè)數(shù)為|G(2)|=m-n+1=7-2+1=6,三字母組的集合為G(3)={lea,eaf,afl,fle,let}。則對于雙字母組“l(fā)e”,其在字符序列中出現(xiàn)的次數(shù)|"le"|=2,因此其初始狀態(tài)概率為 同理,可以求出雙字母組“ea”、“af”、“fl”、“et”等的初始狀態(tài)概率皆為
狀態(tài)轉(zhuǎn)移概率的確定 從一個(gè)n字母組gi(i=1,2,...,m-n+1)向另一個(gè)n字母組gj(j=1,2,...,m-n+1)的狀態(tài)轉(zhuǎn)移概率aij,則通過下式計(jì)算
其中,

表示gi與gj間的一種特殊的連接,如果gi的最后n-1個(gè)字母和gj的前n-1個(gè)字母相同,則有

即二者進(jìn)行該連接后,形成的n+1字母組為本擊鍵序列產(chǎn)生的,此時(shí),有
而當(dāng)gi的后n-1個(gè)字母和gj的前n-1個(gè)字母不相同時(shí),則有

此時(shí),有
假設(shè)擊鍵序列為“l(fā)eaflet”,來計(jì)算雙字母組的狀態(tài)轉(zhuǎn)移概率 雙字母組“l(fā)e”的最后一個(gè)字母(“e”)與雙字母組“ea”的第一個(gè)字母(“e”)相同,因此有

且“l(fā)ea”在字符序列“l(fā)eaflet”中出現(xiàn)了1次,“l(fā)e”則出現(xiàn)了2次,所以有
即由雙字母組“l(fā)e”到雙字母組“ea”的狀態(tài)轉(zhuǎn)移概率為0.5。同理,可以求出由“l(fā)e”到“et”的狀態(tài)轉(zhuǎn)移概率為0.5。
而對于雙字母組“l(fā)e”到雙字母組“af”的狀態(tài)轉(zhuǎn)移概率,由于“l(fā)e”的最后一個(gè)字母(e)與“af”的第一個(gè)字母(a)不同,因此有

所以雙字母組“l(fā)e”到雙字母組“af”的狀態(tài)轉(zhuǎn)移概率為0。
正態(tài)分布的參數(shù)計(jì)算 對于采集到的若干擊鍵特征樣本,對其時(shí)間特征值進(jìn)行標(biāo)準(zhǔn)化處理后,就可以使用參數(shù)的最大似然估計(jì),來計(jì)算正態(tài)分布下各特征值的樣本均值μ和方差σ2。公式如下 其中,u為訓(xùn)練模板所需的擊鍵特征樣本個(gè)數(shù),ti(g)為第i個(gè)樣本中n字母組g的時(shí)間特征值。
也就是說,每一個(gè)狀態(tài)gi都會(huì)有u次輸入,每次輸入都會(huì)采集到一個(gè)時(shí)間特征值ti(gi),利用這u個(gè)樣本對應(yīng)的u個(gè)時(shí)間特征值ti(gi),采用公式(5)和公式(6)便可為gi建立一個(gè)正態(tài)分布的模型了。在圖2中有多少個(gè)gi狀態(tài),就要建立多少個(gè)正態(tài)分布模型。
評估問題求解及I-Forward算法 將HMM應(yīng)用到擊鍵動(dòng)態(tài)認(rèn)證中時(shí),主要涉及兩個(gè)問題,其中之一是前面已經(jīng)介紹過的HMM的參數(shù)確定,另一個(gè)問題,是評估問題,即根據(jù)已知的HMM λ(Π,A,B)及一個(gè)觀察序列O(o1,o2,...,oT),求出該λ生成此觀察序列O的概率,即P(O|λ)。本發(fā)明設(shè)計(jì)了I-Forward算法,并最終將其應(yīng)用到本認(rèn)證方法中。
因?yàn)楸痉椒ㄊ褂谜龖B(tài)分布來計(jì)算狀態(tài)(n字母組)到觀察值(n字母組的時(shí)間特征值)之間的輸出概率,且已知用戶輸入的n字母組的精確組合,觀察值只與相應(yīng)的未知狀態(tài)相關(guān),所以,忽略時(shí)間t時(shí)的所有狀態(tài)的部分概率的總和,只需計(jì)算一個(gè)概率。因此,在建立的模型中,使用I-Forward算法來解決評估問題。
以長度為m,包含n字母組G(n)、n字母組時(shí)間特征值為T的擊鍵序列KS的概率計(jì)算為例。
KS={K1,K2,...,Kn} G(n)={g1,g2,...,gm-n+1} T={t1,t2,t3,...,tm-n+1} 通過首先計(jì)算t=1時(shí)前向變量α1,來得到產(chǎn)生擊鍵序列

且時(shí)間特征值為t1時(shí)的概率為 然后t=2,...,k時(shí)的每一時(shí)間步,可以遞歸地為每一狀態(tài)計(jì)算其前向變量α 最后,給定的參數(shù)為λ=(A,η,π)的HMM產(chǎn)生擊鍵序列S且時(shí)間特征值為T的概率如下 π和所有的ai,i+l1以及所有的bi相部相乘到一起便可得出Pr[KS,G(n),T|λ]的值。
在I-Forward算法中,只需要NT次計(jì)算。
訓(xùn)練樣本數(shù)設(shè)置 本系統(tǒng)分別采用不同數(shù)量的樣本進(jìn)行模板訓(xùn)練后,得到認(rèn)證結(jié)果的FRR(錯(cuò)誤拒絕率合法用戶的登錄請求被當(dāng)作非法用戶(而被拒絕)的比例)曲線和FAR(錯(cuò)誤接受率非法用戶以合法用戶的身份進(jìn)行登錄的請求被系統(tǒng)接受的比例)曲線的對比結(jié)果。
當(dāng)訓(xùn)練采用的樣本數(shù)很少(2個(gè))時(shí),F(xiàn)RR值在各閾值下都很高??傮w來說,隨著訓(xùn)練模板所用的樣本數(shù)的增加,各閾值下的FRR值均在減小。但是當(dāng)樣本數(shù)增加到一定數(shù)量(如超過8)時(shí),對FRR值的改善很不明顯。
當(dāng)訓(xùn)練模板采用的樣本很少(2個(gè))時(shí),F(xiàn)AR在閾值小于4時(shí),恒為0,即系統(tǒng)對非法用戶的拒絕率是100%。雖然此FAR是非常理想的,但是由于該參數(shù)下的FRR值也很高——在小于4的閾值內(nèi),高于95%,因此,系統(tǒng)的可用性很差,所以訓(xùn)練模板時(shí)采用的樣本數(shù)不能太少。當(dāng)訓(xùn)練所需樣本數(shù)大于等于4時(shí),隨著訓(xùn)練所用樣本數(shù)的增加,F(xiàn)AR在減小。但是,由于訓(xùn)練模板采用的樣本數(shù)越多,用戶采用系統(tǒng)時(shí)所需的訓(xùn)練時(shí)間就越長,用戶對系統(tǒng)的可接受程度就越低,因此,訓(xùn)練模板所用的樣本數(shù),不能太大。當(dāng)樣本數(shù)大于8時(shí),F(xiàn)RR和FAR值就在一個(gè)比較合理的范圍內(nèi)。因此,本系統(tǒng)建議用戶采用的訓(xùn)練樣本數(shù)為7~10。
訓(xùn)練樣本中擊鍵數(shù)的設(shè)置 n字母組中n值的設(shè)置 當(dāng)采用的模板訓(xùn)練樣本數(shù)為10,擊鍵數(shù)為10時(shí),不同n值的n字母組在采用持續(xù)時(shí)間和時(shí)間間隔時(shí)的FRR、FAR曲線分析情況如下 (1)采用持續(xù)時(shí)間為特征值時(shí) 經(jīng)實(shí)驗(yàn)分析,單字母組時(shí),F(xiàn)RR和FAR都很高,因此相應(yīng)的EER也很高。隨著n字母組中n值的增加,F(xiàn)RR在減少,但FAR的變化卻沒有規(guī)律性——單字母組時(shí),F(xiàn)AR最高,雙字母組時(shí),F(xiàn)AR最低,三字母組與四字母組時(shí)的FAR隨著閾值的增加而忽高忽低。但從圖中可以看到,總體來說,采用持續(xù)時(shí)間為特征值時(shí),雙字母組時(shí)的EER是最低的。
(2)采用時(shí)間間隔為特征值時(shí) 經(jīng)實(shí)驗(yàn)分析,采用時(shí)間間隔為特征值的情況下,雙字母組時(shí),F(xiàn)RR高于其它字母組,F(xiàn)AR明顯低于其它字母組。3字母組時(shí),F(xiàn)RR略高于4字母組、5字母組的情況,但FAR卻明顯低于其余兩種情況。因此,若系統(tǒng)要求的安全程度較高時(shí),采用雙字母組較好,雖然正確用戶被拒絕的概率較高,但非法用戶通過的概率也更低。在系統(tǒng)對安全性要求稍低的情況下,也可以采用3字母組。
系統(tǒng)中特征值的選取 當(dāng)采用雙字母組、擊鍵個(gè)數(shù)為10、模板不動(dòng)態(tài)更新、不進(jìn)行數(shù)值標(biāo)準(zhǔn)化時(shí),不同訓(xùn)練模板所需樣本個(gè)數(shù)的情況下,分別采用持續(xù)時(shí)間和時(shí)間間隔時(shí)的FRR和FAR曲線分析情況如下。當(dāng)采用雙字母組進(jìn)行分析時(shí),若訓(xùn)練采用的樣本數(shù)較少(如4),采用時(shí)間間隔時(shí)系統(tǒng)的FRR明顯低于采用持續(xù)時(shí)間時(shí),但同時(shí)其FAR也明顯高于采用持續(xù)時(shí)間時(shí),因此兩種情況下系統(tǒng)的整體性能不相上下。但是,當(dāng)訓(xùn)練模板所用的樣本數(shù)大于等于8時(shí),采用時(shí)間間隔時(shí)的FRR略低于采用持續(xù)時(shí)間時(shí)的FRR,但其對FAR的影響不明顯。
因此,總體來說,采用持續(xù)時(shí)間和時(shí)間間隔兩種情況下的系統(tǒng)性能差別不大。
動(dòng)態(tài)更新模板對結(jié)果的影響 (1)模板全部更新時(shí) 當(dāng)在某一閾值下的認(rèn)證成功時(shí),就將本次輸入的樣本作為一個(gè)新的訓(xùn)練樣本,而將模板訓(xùn)練樣本中時(shí)間最早的樣本去掉,重新計(jì)算模板參數(shù)—各n字母組的時(shí)間特征值的期望和方差,下次認(rèn)證時(shí),采用本次計(jì)算得到的新的模板作為參考。這就是模板全部更新。當(dāng)訓(xùn)練樣本數(shù)為10,采用的擊鍵數(shù)為10,且以雙字母組的持續(xù)時(shí)間為特征值時(shí),分別得到模板不更新時(shí)與模板全部更新時(shí)的FRR與FAR分析對比圖(圖7)分析如下 當(dāng)閾值低于2時(shí),由于能夠通過認(rèn)證的樣本偏離原模板中特征值期望的程度較小,因此,此時(shí)用該樣本對模板進(jìn)行更新,重新計(jì)算期望和方差,產(chǎn)生了兩方面的結(jié)果。一方面,此時(shí)模板中的特征值期望值,與當(dāng)前用戶輸入特征較為接近,這是好的一方面;另一方面,認(rèn)證過程中對模板的不斷更新,使得模板中n字母組的時(shí)間特征值方差,越來越小了,這實(shí)際上是變相地提高了閾值,所以使得系統(tǒng)對合法用戶認(rèn)證請求的拒絕率(FRR)也越來越高。而當(dāng)閾值大于2時(shí),由于本身能夠通過系統(tǒng)認(rèn)證的樣本數(shù)較多,因此其變化范圍也較大,這就使得重新訓(xùn)練樣本后方差變得小的程度較低,且特征值的平均值與用戶認(rèn)證過程中的特征值接近程度較高,因此系統(tǒng)的FRR增長較低;另一方面,由于攻擊樣本是在用戶的合法樣本全部與模板比較認(rèn)證完成后,才進(jìn)行攻擊測試的,此時(shí),用戶模板已經(jīng)非常接近該用戶的擊鍵特征了,且方差較不更新時(shí)小,因此,最終得到的FAR,較不更新時(shí),明顯降低。
(2)模板部分更新時(shí) 如圖8所示,當(dāng)采用模板部分更新(只更新模板中的特征值期望值,不更新方差)時(shí),當(dāng)閾值小于等于2時(shí),系統(tǒng)性能有明顯提高——FRR降低(閾值1.6處除外)。分析其原因,本發(fā)明作者認(rèn)為,這主要是由于隨著認(rèn)證過程中對模板的不斷更新,模板中的特征值期望與用戶當(dāng)時(shí)的擊鍵特征越來越接近,同時(shí),保持其方差不變,因此,使得系統(tǒng)對合法用戶的拒絕率(FRR)降低了。
但另一方面,當(dāng)閾值大于2時(shí),系統(tǒng)性能卻明顯下降了——FRR基本不變,F(xiàn)AR顯著增長。分析其原因, (3)根據(jù)閾值對模板進(jìn)行更新 本更新策略,是對前述兩種更新策略的結(jié)合,各取它們的長處——當(dāng)閾值小于等于2時(shí),模板更新時(shí)采用部分更新;當(dāng)閾值大于2時(shí),模板更新采用全部更新。使用本策略對模板進(jìn)行更新,使得系統(tǒng)在各閾值下的性能均有所提高。
如圖9所示,采用根據(jù)閾值對模板進(jìn)行更新(全部或部分更新)的方法后,系統(tǒng)的性能得到了提高,與不更新時(shí)相比,F(xiàn)RR與FAR值的和在絕大部分情況下(除0.4和1.6閾值處外)都降低了,因此在各閾值下,采用本更新策略,降低了系統(tǒng)的AFR(平均錯(cuò)誤率)。
權(quán)利要求
1、一種基于擊鍵特征識別的認(rèn)證方法,其特征是包括以下步驟
(1)聲稱身份是ID的用戶輸入口令,如果正確,判斷用戶樣本數(shù)是否達(dá)到設(shè)定數(shù)量,是,進(jìn)入步驟(2);否,進(jìn)行訓(xùn)練;
(2)聲稱身份是ID的用戶輸入指定文本,該文本的擊鍵序列S={s1,s2,...,sm},si表示第i個(gè)字母;長度為m,包含n字母組G(n)={g1,g2,...,gm-n+1},n字母組時(shí)間特征值tgi表示n字母組gi的持續(xù)時(shí)間;
(3)從用戶擊鍵特征模板中找到用戶ID的HMM λID(Π,A,B),用戶ID的各個(gè)n字母組對應(yīng)的時(shí)間特征值的期望值為{μT(gj)|j=1,2,...,m-n+1|},各個(gè)n字母組對應(yīng)的時(shí)間特征值的方差為根據(jù)系統(tǒng)設(shè)定的閾值系數(shù)δ,1<δ<3,計(jì)算ID用戶的閾值概率P1,狀態(tài)輸出概率向量B需要按公式進(jìn)行計(jì)算,n字母組gi的狀態(tài)輸出概率是
其中μD(gi)表示n字母組gi的期望值,σD(gi)表示n字母組gi的方差;|gi|表示n字母組gi在擊鍵序列S中出現(xiàn)的次數(shù),閾值概率P1=P(Tt|λID)用下面的公式來計(jì)算
計(jì)算閾值概率后,計(jì)算身份為ID的用戶該次輸入文本的擊鍵時(shí)間特征值T的概率P2=P(T|λID),即
其中
(i=1,2....,m-n+1)
(4)比較閾值概率P1=P(Tt|λID)與用戶ID生成指定文本的概率P2=P(T|λID),如果P2=P(T,λID)≥P1=P(Tt|ID),認(rèn)證成功,否則失敗。
2、按照權(quán)利要求1所述的基于擊鍵特征識別的認(rèn)證方法,其特征在于步驟(1)中所述的進(jìn)行訓(xùn)練,步驟如下
1)用戶輸入指定文本S,轉(zhuǎn)換為n字母組G,設(shè)G={g1,g2,...,gm-n+1},將按鍵的鍵碼、壓下時(shí)間和彈起時(shí)間存入擊鍵特征模板;
2)是否達(dá)到設(shè)定的樣本數(shù)量,是,進(jìn)入步驟3),否,返回步驟1);
3)計(jì)算擊鍵特征模板中所有n字母組時(shí)間特征值的期望值μ和方差σ,以及初始狀態(tài)概率Π和相應(yīng)的狀態(tài)轉(zhuǎn)移概率A,
其中μ為訓(xùn)練模板所需的擊鍵特征樣本個(gè)數(shù),ti(g)為第i個(gè)樣本中n字母組g的時(shí)間特征值;
任意的n字母組gi(i=1,2,...,n-m+1),其初始狀態(tài)概率為
上式中|gi|表示n字母組gi在擊鍵序列S中出現(xiàn)的次數(shù),分母部分則為此擊鍵序列中n字母組的個(gè)數(shù);
一個(gè)n字母組gi(i=1,2,...,m-n+1)向另一個(gè)n字母組gj(j=1,2,...,m-n+1)的狀態(tài)轉(zhuǎn)移概率aij,則通過下式計(jì)算
其中,
表示gi與gj間的一種連接,如果gi的最后n-1個(gè)字母和gi的前n-1個(gè)字母相同,則有
即二者進(jìn)行該連接后,形成的n+1字母組為本擊鍵序列產(chǎn)生的,此時(shí),有
而當(dāng)gi的后n-1個(gè)字母和gj的前n-1個(gè)字母不相同時(shí),則有
此時(shí),有
4)將步驟3)中計(jì)算結(jié)果存入該用戶的模板數(shù)據(jù)庫。
3、按照權(quán)利要求1所述的基于擊鍵特征識別的認(rèn)證方法,其特征在于步驟(4)中,認(rèn)證成功之后對擊鍵特征模板更新,過程如下按照擊鍵特征采集的時(shí)間先后順序,將該用戶擊鍵特征模板訓(xùn)練時(shí)用到的樣本進(jìn)行排隊(duì);然后,將采集時(shí)間最早的樣本去掉,而將本次認(rèn)證過程中用戶的擊鍵樣本作為隊(duì)尾元素,加入到隊(duì)列中,利用隊(duì)列中現(xiàn)有的所有樣本,重新計(jì)算各個(gè)n字母組的時(shí)間特征值,將其存儲(chǔ)在該用戶的擊鍵特征模板中,替換掉原來的各個(gè)值,當(dāng)設(shè)定的閾值系數(shù)δ大于等于2時(shí),則對各n字母組時(shí)間特征值的期望和方差全部更新;當(dāng)設(shè)定的閾值系數(shù)δ小于2時(shí),則只更新各n字母組時(shí)間特征值的期望值。
4、按照權(quán)利要求1所述的基于擊鍵特征識別的認(rèn)證方法,其特征在于所述的閾值系數(shù)δ1,獲取步驟如下假定輸入序列中的各個(gè)n字母組gi對應(yīng)的時(shí)間特征值與其已有的正態(tài)分布的期望值相差若干不同倍的方差σ2,以這些不同倍的方差為自變量,作出錯(cuò)誤拒絕率FRR曲線和錯(cuò)誤接受率FAR曲線,兩個(gè)曲線會(huì)有一個(gè)交點(diǎn),則選擇該點(diǎn)周圍作為閾值系數(shù)δ,設(shè)定1<δ<3;其中錯(cuò)誤拒絕率FRR合法用戶的登錄請求被當(dāng)作非法用戶而被拒絕的比例,錯(cuò)誤接受率FAR非法用戶以合法用戶的身份進(jìn)行登錄的請求被系統(tǒng)接受的比例。
5、按照權(quán)利要求1或者2所述的基于擊鍵特征識別的認(rèn)證方法,其特征在于n字母組時(shí)間特征值之后進(jìn)行標(biāo)準(zhǔn)化處理,步驟如下選擇將每個(gè)時(shí)間特征值標(biāo)準(zhǔn)化為一個(gè)0到N的值,N取700~900,對采集到的每個(gè)擊鍵時(shí)間特征值ti,若完成該次擊鍵樣本采集花費(fèi)的總的間為T,設(shè)標(biāo)準(zhǔn)化后的時(shí)間特征值為
則有
6、按照權(quán)利要求1或者2所述的基于擊鍵特征識別的認(rèn)證方法,其特征在于所述的n字母組采用3字母組。
7、按照權(quán)利要求1或者2所述的基于擊鍵特征識別的認(rèn)證方法,其特征在于樣本設(shè)定數(shù)量為7~10。
8、一種實(shí)現(xiàn)權(quán)利要求1所述的基于擊鍵特征識別的認(rèn)證方法的系統(tǒng),其特征在于該系統(tǒng)包括初始登錄模塊,訓(xùn)練模塊和認(rèn)證模塊,
初始登錄模塊,包括用戶注冊單元、口令核對單元和用戶樣本數(shù)對比單元,其中用戶樣本比對單元在登錄時(shí),對用戶已經(jīng)輸入的樣本的數(shù)量進(jìn)行查詢,如果用戶的樣本數(shù)已達(dá)到規(guī)定的數(shù)量,則轉(zhuǎn)入認(rèn)證模塊進(jìn)行認(rèn)證;如果用戶的樣本數(shù)尚未達(dá)到規(guī)定數(shù)量,則轉(zhuǎn)入訓(xùn)練模塊繼續(xù)進(jìn)行樣本采集;
訓(xùn)練模塊包括客戶端訓(xùn)練子模塊和服務(wù)器端訓(xùn)練子模塊,其中客戶端訓(xùn)練子模塊在瀏覽器端為用戶提供需輸入內(nèi)容的相關(guān)注意事項(xiàng)說明和具體內(nèi)容提示,用戶根據(jù)提示進(jìn)行輸入,相關(guān)的數(shù)據(jù)之后就被轉(zhuǎn)到擊鍵處理程序處理,擊鍵處理程序記下具體按鍵信息;同時(shí)該子模塊還提供對數(shù)據(jù)的基本預(yù)處理如果取n字母組來分析擊鍵時(shí)間特征值,那么系統(tǒng)首先將此文本序列S轉(zhuǎn)換為n字母組G,設(shè)G={g1,g2,...,gm-n+1},將按鍵的鍵碼、壓下時(shí)間和彈起時(shí)間存入擊鍵特征模板,其次,計(jì)算各個(gè)n字母組的時(shí)間特征值,將其表示為最后,將得到的各個(gè)時(shí)間特征值進(jìn)行標(biāo)準(zhǔn)化處理,設(shè)標(biāo)準(zhǔn)化處理后的時(shí)間特征值為服務(wù)器端訓(xùn)練子模塊是對數(shù)據(jù)進(jìn)行進(jìn)一步處理并將其進(jìn)行保存,客戶端由擊鍵處理程序預(yù)先處理好的擊鍵的具體數(shù)據(jù)信息會(huì)發(fā)到服務(wù)端的接收處理程序處理,接收處理程序試著將這些信息存入擊鍵數(shù)據(jù)樣本數(shù)據(jù)庫和用戶模板數(shù)據(jù)庫,并在成功存入后給用戶以相應(yīng)反饋;
認(rèn)證模塊包括兩個(gè)子模塊,客戶端認(rèn)證子模塊和服務(wù)器認(rèn)證子模塊,客戶端認(rèn)證子模塊在客戶進(jìn)行登錄時(shí)用戶輸入與樣本一樣的內(nèi)容,相關(guān)的數(shù)據(jù)之后就被轉(zhuǎn)到認(rèn)證處理程序處理,根據(jù)系統(tǒng)設(shè)定的閾值系數(shù)σ,1<σ<3,計(jì)算ID用戶的閾值概率P1;之后數(shù)據(jù)信息就被發(fā)到服務(wù)端,服務(wù)器認(rèn)證子模塊根據(jù)本系統(tǒng)的基于統(tǒng)計(jì)學(xué)建立的模型,對接收到的數(shù)據(jù)進(jìn)行驗(yàn)證,比較閾值概率P1=P(Tt|λID)與用戶ID生成指定文本的概率P2=P(T|λID),如果P2=P(T,λID)≥P1=P(Tt|ID),認(rèn)證成功,否則失敗;如果符合該用戶的擊鍵特征,則將其作為新樣本,按照本系統(tǒng)使用的模板庫更新標(biāo)準(zhǔn),對樣本庫進(jìn)行更新。
9、根據(jù)權(quán)利要求8所述的基于擊鍵特征識別的認(rèn)證方法的系統(tǒng),其特征在于該系統(tǒng)還包括數(shù)據(jù)分析模塊,該模塊的通過在瀏覽器端打開實(shí)驗(yàn)結(jié)果分析頁面,進(jìn)行實(shí)驗(yàn)結(jié)果分析,在該頁面中,對系統(tǒng)的參數(shù)進(jìn)行設(shè)置,包括訓(xùn)練模板采用多少個(gè)輸入樣本、模板是否動(dòng)態(tài)更新、采用的時(shí)間特征值,用戶設(shè)置各項(xiàng)參數(shù)并提交請求后,服務(wù)器端進(jìn)行計(jì)算,并將結(jié)果返回給瀏覽器端,參數(shù)設(shè)置之后,每次計(jì)算都產(chǎn)生多個(gè)P1閾值概率,用戶當(dāng)前產(chǎn)生的概率P2與每次計(jì)算產(chǎn)生的多個(gè)P1閾值概率都要進(jìn)行比較,得到被接受還是被拒絕的結(jié)果,將得到的相應(yīng)結(jié)果數(shù)據(jù)輸出到結(jié)果文件之中,根據(jù)不同的實(shí)驗(yàn)?zāi)康挠眠@些結(jié)果進(jìn)行分析。
全文摘要
一種基于擊鍵特征識別的認(rèn)證方法及系統(tǒng),屬于網(wǎng)絡(luò)的身份認(rèn)證領(lǐng)域,包括以下步驟(1)聲稱身份是ID的用戶輸入口令,如果正確,判斷用戶樣本數(shù)是否達(dá)到設(shè)定數(shù)量,是,進(jìn)入步驟(2);否,進(jìn)行訓(xùn)練;(2)聲稱身份是ID的用戶輸入指定文本,(3)從用戶擊鍵特征模板中找到用戶ID的HMM λID(∏,A,B),計(jì)算ID用戶的閾值概率P1,計(jì)算身份為ID的用戶該次輸入文本的擊鍵時(shí)間特征值T的概率P2,(4)比較閾值概率P1與用戶ID生成指定文本的概率P2,如果P2=≥P1,認(rèn)證成功,否則失敗。本發(fā)明對擊鍵動(dòng)態(tài)認(rèn)證進(jìn)行建模;并結(jié)合正態(tài)分布、參數(shù)最大似然估計(jì),計(jì)算模型中的參數(shù);使得建立起的模型能夠?qū)τ脩羯矸莸倪M(jìn)行認(rèn)證。
文檔編號H04L9/32GK101478401SQ200910010200
公開日2009年7月8日 申請日期2009年1月21日 優(yōu)先權(quán)日2009年1月21日
發(fā)明者周福才, 劍 徐, 柳秀梅 申請人:東北大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1