本發(fā)明涉及信息安全技術(shù)、機(jī)器學(xué)習(xí)等多種領(lǐng)域,特別是涉及一種以鍵盤(pán)輸入特征為基礎(chǔ)的用戶識(shí)別方法。
背景技術(shù):
機(jī)器學(xué)習(xí)是在近20多年逐漸興起的一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門(mén)學(xué)科。機(jī)器學(xué)習(xí)理論主要是設(shè)計(jì)、分析一些讓計(jì)算機(jī)可以自動(dòng)進(jìn)行“學(xué)習(xí)”過(guò)程的算法,也就是說(shuō)從數(shù)據(jù)中自動(dòng)分析獲得其中隱含的規(guī)律,并利用該規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行分析預(yù)測(cè)或判別的算法。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,并在其他領(lǐng)域的數(shù)據(jù)處理和分析問(wèn)題上應(yīng)用廣泛。
隨著信息技術(shù)的不斷發(fā)展,現(xiàn)代人在享受到各種信息新興技術(shù)的便捷的同時(shí),自身的信息安全和隱私保護(hù)問(wèn)題也逐漸引起了人們的高度重視。在用戶信息安全問(wèn)題上,現(xiàn)代生活中應(yīng)用最廣的是密碼識(shí)別系統(tǒng),此機(jī)制雖應(yīng)用廣泛效果較好,但在長(zhǎng)期的使用過(guò)程中,一些弊端也不可避免的顯示出來(lái),例如:
對(duì)于大多數(shù)普通用戶來(lái)說(shuō),選擇的密碼總會(huì)有或多或少的疏漏,讓別有用心者抓住可乘之機(jī),例如在不同的平臺(tái)或賬號(hào)中使用相同的密碼,或者設(shè)置的密碼安全性和復(fù)雜度較弱,容易被破解。這種類型的疏漏,很容易在電腦被病毒感染或在被非法監(jiān)控及被盜時(shí),使得用戶的密碼被盜取,威脅用戶的信息安全。一些網(wǎng)站應(yīng)對(duì)此類問(wèn)題的常見(jiàn)方式之一是采用雙重認(rèn)證的方式,但是由于同樣的疏漏問(wèn)題,用戶的密碼還是很有可能被攻擊者獲取,尤其是隨機(jī)顯示PIN值的設(shè)備也有可能被物理獲取,從而使該安全機(jī)制受到威脅;
對(duì)于保密性要求較高的用戶,可能會(huì)使用更加復(fù)雜的密碼機(jī)制,諸如“3thHsdfW^T@dSFks”這樣的密碼,這樣的密碼,雖然可能更加符合對(duì)密碼強(qiáng)度的要求,但是對(duì)于普通人來(lái)說(shuō)記憶的難度和復(fù)雜度是可想而知的,顯然會(huì)給用戶造成相當(dāng)程度的不便;
在密碼之外的新興識(shí)別機(jī)制還有很多,其中比較有代表性的有人臉識(shí)別機(jī)制等。雖然它具有自然性和不易被被測(cè)個(gè)體察覺(jué)的優(yōu)勢(shì),但進(jìn)行人臉識(shí)別的困難是顯然的。人臉之間的相似性給利用人臉區(qū)分人類個(gè)體帶來(lái)了不利因素,人臉的易變性又使得“受類內(nèi)變化干擾的情況下利用類間變化區(qū)分個(gè)體變得異常困難”;等等。
技術(shù)實(shí)現(xiàn)要素:
基于上述的當(dāng)前密碼識(shí)別機(jī)制所存在的問(wèn)題現(xiàn)有技術(shù),本發(fā)明提出了一種基于機(jī)器學(xué)習(xí)的鍵盤(pán)輸入識(shí)別方法,實(shí)現(xiàn)了以鍵盤(pán)輸入輸入特征為基礎(chǔ)的用戶識(shí)別。
本發(fā)明的基于機(jī)器學(xué)習(xí)的鍵盤(pán)輸入識(shí)別方法,包括以下步驟:
第一步、提取用戶通過(guò)鍵盤(pán)輸入的輸入特征,將這些輸入特征整合形成用戶輸入特征樣本庫(kù);
第二步、利用輸入特征樣本庫(kù)中各個(gè)用戶的輸入數(shù)據(jù)進(jìn)行處理,得到各個(gè)用戶的獨(dú)立輸入特征模型;
第三步、對(duì)新的未知輸入特征進(jìn)行提取,與第二步的獨(dú)立輸入特征模型對(duì)比,得到判別結(jié)果,判斷其所屬的用戶。
所述輸入特征包括輸入特征包括按壓每個(gè)字符按鈕時(shí)的時(shí)長(zhǎng)、敲擊不同按鈕間隔的時(shí)間和敲擊鍵盤(pán)的力度。
與現(xiàn)有技術(shù)相比,本發(fā)明適用于密碼以外的用戶輸入初步識(shí)別,具有耗時(shí)少,準(zhǔn)確率高的特點(diǎn)。
附圖說(shuō)明
圖1是本發(fā)明的基于輸入特征的鍵盤(pán)輸入識(shí)別方案流程圖。
具體實(shí)施方式
通俗來(lái)說(shuō),每個(gè)人打字的方式都是有所不同的,這種差異可能在很大程度上用視覺(jué)難以進(jìn)行捕捉和分辨,但是電腦卻可以根據(jù)監(jiān)測(cè)鍵盤(pán)輸入來(lái)達(dá)到區(qū)分不同的用戶的功能,例如用戶按壓每個(gè)字符按鈕時(shí)的時(shí)長(zhǎng),敲擊不同按鈕間隔的時(shí)間,敲擊鍵盤(pán)的力度等等。這些測(cè)量結(jié)果可能對(duì)于大腦來(lái)說(shuō)差別十分細(xì)微,但是對(duì)于電腦檢測(cè)而言,精確度可以達(dá)到毫秒級(jí)別,區(qū)分用戶輸入并非難事。另外,從生理學(xué)角度來(lái)說(shuō),人們平時(shí)就在進(jìn)行的無(wú)數(shù)次的身體動(dòng)作被他人模仿幾乎是不可能的。以上幾點(diǎn),都使得通過(guò)鍵盤(pán)輸入進(jìn)行識(shí)別成為可能。
本發(fā)明的基于機(jī)器學(xué)習(xí)的鍵盤(pán)輸入識(shí)別方法,該方法流程主要通過(guò)以下幾個(gè)主要步驟實(shí)現(xiàn):
第一步、使用鍵盤(pán)輸入監(jiān)測(cè)軟件,對(duì)一定數(shù)量的特定用戶的鍵盤(pán)輸入特征進(jìn)行提取,組成本發(fā)明的樣本庫(kù)(例如用戶按壓每個(gè)字符按鈕時(shí)的時(shí)長(zhǎng)、敲擊不同按鈕間隔的時(shí)間、敲擊鍵盤(pán)的力度等);
第二步、采用機(jī)器學(xué)習(xí)的K-近鄰算法等思想,對(duì)樣本庫(kù)中各個(gè)用戶的輸入數(shù)據(jù)進(jìn)行處理,得到各個(gè)用戶的獨(dú)立輸入模型;
第三步、對(duì)于多個(gè)單獨(dú)的隨機(jī)用戶輸入數(shù)據(jù),根據(jù)樸素貝葉斯(Naive Bayes)、支持向量機(jī)(SVM)、K-近鄰算法等思想,判斷其所屬的用戶,具體包含如下內(nèi)容:
首先輸入訓(xùn)練數(shù)據(jù)集T=(x11,y1),(x12,y1)……,(x1m,y1),(x21,y2),……(xNm,yN)。
其中,為包含第i名用戶輸入特征的第j個(gè)實(shí)例的n維特征向量,yi∈Y={c1,c2…,ck}為實(shí)例相應(yīng)的用戶的類別,i=1,2,...,N;
對(duì)于新輸入的實(shí)例x輸出實(shí)例x所屬的用戶類別y,具體過(guò)程是:
(1)根據(jù)給定的距離度量,在訓(xùn)練集T中找出與x最近鄰的k個(gè)點(diǎn),涵蓋著k個(gè)點(diǎn)的領(lǐng)域,記為Nk(x),距離度量的計(jì)算具體如下:
對(duì)于新輸入的實(shí)例x輸出實(shí)例x所屬的用戶類別y,具體過(guò)程是:
設(shè)特征空間X是n維實(shí)數(shù)向量空間Rn,其中:
則相應(yīng)的xi與xj的Lp距離定義為:
在此處p≥1。當(dāng)p=1時(shí),稱為曼哈頓距離(Manhattan distance),公式為:
當(dāng)p=2時(shí),稱為歐式距離(Euclidean distance),即:
這里分別取p為1,2,3時(shí)的Lp距離作為距離度量,并進(jìn)行比較;
(2)在Nk(x)中根據(jù)分類決策規(guī)則(如多數(shù)表決),決定x的類別y:
在上式中,I為指示函數(shù),即當(dāng)yi=cj時(shí),I為1,否則I為0。
第四步、對(duì)上述分析過(guò)程進(jìn)行分析整合,將在不同p值下的距離度量下,不同的k值取值下,以及在只使用單一特征到使用全部特征的不同特征的組合應(yīng)用條件下的識(shí)別結(jié)果進(jìn)行對(duì)比整合,找到相比而言總體識(shí)別效果最好的識(shí)別方法對(duì)應(yīng)的參數(shù),以構(gòu)造相應(yīng)的初步識(shí)別方案,形成對(duì)整個(gè)過(guò)程的算法實(shí)現(xiàn);
第五步、將上述算法應(yīng)用至更多的隨機(jī)用戶輸入數(shù)據(jù),再次進(jìn)行上述的識(shí)別過(guò)程,對(duì)算法進(jìn)行調(diào)整和優(yōu)化。
本發(fā)明并不局限于前述的具體步驟。本發(fā)明擴(kuò)展到任何本說(shuō)明書(shū)中披露的新特征或任何新的組合,或新的步驟的組合。綜上,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。