一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法
【專利摘要】本發(fā)明公開(kāi)了一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,其通過(guò)對(duì)第三方軟件加載訪問(wèn)接口和使用數(shù)據(jù)進(jìn)行溯源,判斷其內(nèi)爬行為,并對(duì)第三方軟件使用數(shù)據(jù)時(shí)的數(shù)據(jù)量、訪問(wèn)時(shí)長(zhǎng)、訪問(wèn)頻率進(jìn)行檢測(cè),通過(guò)樸素貝葉斯算法獲得其內(nèi)爬數(shù)據(jù)權(quán)值、內(nèi)爬時(shí)間權(quán)值、內(nèi)爬頻率權(quán)值,進(jìn)一步獲得其內(nèi)爬權(quán)值,將內(nèi)爬權(quán)值與安全權(quán)值進(jìn)行比較,根據(jù)第三軟件內(nèi)爬行為風(fēng)險(xiǎn)大小做出針對(duì)性處理,并提供第三方監(jiān)控和誤報(bào)處理,保證了數(shù)據(jù)的安全性,提高對(duì)第三方軟件的監(jiān)控效率,具有較高的分類準(zhǔn)確性和運(yùn)算效率。
【專利說(shuō)明】
一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法
技術(shù)領(lǐng)域
[0001]
本發(fā)明涉及軟件分析技術(shù)領(lǐng)域,特別涉及一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法。
【背景技術(shù)】
[0002]信息資源高度的數(shù)字化,加劇了數(shù)據(jù)竊取、泄密等危害事件的發(fā)生,對(duì)數(shù)據(jù)產(chǎn)權(quán)的保護(hù)帶來(lái)了一定的挑戰(zhàn),為了解決數(shù)據(jù)泄露問(wèn)題,信息安全業(yè)內(nèi)從不同的角度出發(fā),提出了基于訪問(wèn)控制類、數(shù)據(jù)加密類、內(nèi)容監(jiān)控和過(guò)濾類、虛擬化類以及多種技術(shù)相結(jié)合的混合類數(shù)據(jù)泄密防護(hù)解決方案,但是數(shù)據(jù)泄漏事件仍屢禁不止,究其原因,現(xiàn)有的終端平臺(tái)采用開(kāi)放的體系架構(gòu),無(wú)法從根本上避免和杜絕一切可能的安全威脅,且現(xiàn)有的安全解決方案存在缺乏良好的平臺(tái)及安全驗(yàn)證機(jī)制。
[0003]訪問(wèn)控制類技術(shù)是對(duì)訪問(wèn)控制技術(shù)中權(quán)限管理方案的擴(kuò)展,主要通過(guò)對(duì)客體訪問(wèn)權(quán)限的分配,對(duì)終端設(shè)備中數(shù)據(jù)的輸入輸出過(guò)程進(jìn)行集中的控制和管理,并采取監(jiān)控和審計(jì)機(jī)制,防止未經(jīng)授權(quán)的數(shù)據(jù)外泄??刂祁惣夹g(shù)通常不對(duì)數(shù)據(jù)進(jìn)行加/解密保護(hù),而是通過(guò)監(jiān)控?cái)?shù)據(jù)在使用和傳輸過(guò)程中的合法性來(lái)控制數(shù)據(jù)。根據(jù)訪問(wèn)控制技術(shù)的發(fā)展進(jìn)程,主要有自主訪問(wèn)控制機(jī)制、強(qiáng)制訪問(wèn)控制機(jī)制、基于角色的訪問(wèn)控制機(jī)制和基于屬性的訪問(wèn)控制機(jī)制。此技術(shù)存在的不足時(shí)無(wú)法解決被動(dòng)泄密問(wèn)題,如存儲(chǔ)磁盤(pán)丟失、移動(dòng)終端或筆記本被盜等。而且,一旦訪問(wèn)控制機(jī)制被攻擊者繞過(guò),數(shù)據(jù)均將以明文的方式泄露。
[0004]“爬蟲(chóng)”源于web系統(tǒng)中,是搜索引擎抓取系統(tǒng)的重要組成部分。爬蟲(chóng)的主要目的是將互聯(lián)網(wǎng)上的網(wǎng)頁(yè)下載到本地形成一個(gè)活互聯(lián)網(wǎng)內(nèi)容的鏡像備份。通常將web系統(tǒng)的爬蟲(chóng)稱為“外爬”。
[0005]“內(nèi)爬”是相對(duì)應(yīng)于“外爬”而言的,“內(nèi)爬”的主要目的是存儲(chǔ)在磁盤(pán)上的數(shù)據(jù)(如數(shù)據(jù)庫(kù),文件等)下載到指定位置進(jìn)行使用。例如對(duì)于某些應(yīng)用內(nèi)的數(shù)據(jù)庫(kù)文件,該應(yīng)用提供了數(shù)據(jù)庫(kù)訪問(wèn)的接口,某些第三方應(yīng)用卻通過(guò)提供的接口獲得數(shù)據(jù)并存入自己的數(shù)據(jù)中,這就會(huì)產(chǎn)生數(shù)據(jù)泄露及數(shù)據(jù)產(chǎn)權(quán)保護(hù)問(wèn)題。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于克服現(xiàn)有技術(shù)中所存在的上述不足,提供一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,通過(guò)對(duì)第三方軟件加載訪問(wèn)接口和使用數(shù)據(jù)進(jìn)行溯源,判斷其內(nèi)爬行為,并對(duì)第三方軟件使用數(shù)據(jù)時(shí)的數(shù)據(jù)量、訪問(wèn)時(shí)長(zhǎng)、訪問(wèn)頻率進(jìn)行檢測(cè),通過(guò)樸素貝葉斯算法獲得其內(nèi)爬數(shù)據(jù)權(quán)值、內(nèi)爬時(shí)間權(quán)值、內(nèi)爬頻率權(quán)值,進(jìn)一步獲得其內(nèi)爬權(quán)值,將內(nèi)爬權(quán)值與安全權(quán)值進(jìn)行比較,根據(jù)第三軟件內(nèi)爬行為風(fēng)險(xiǎn)大小做出針對(duì)性處理,并提供第三方監(jiān)控和誤報(bào)處理,保證了數(shù)據(jù)的安全性,提高對(duì)第三方軟件的監(jiān)控效率,具有較高的分類準(zhǔn)確性和運(yùn)算效率。
[0007]為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明提供了以下技術(shù)方案:
1.一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,包括以下步驟: A.建立數(shù)據(jù)訪問(wèn)模塊,數(shù)據(jù)訪問(wèn)模塊采用SDK驅(qū)動(dòng)方式保護(hù)數(shù)據(jù),將需要保護(hù)的數(shù)據(jù)放入模塊中,第三方軟件需要使用數(shù)據(jù)時(shí),為其提供訪問(wèn)接口,使用訪問(wèn)接口需安裝相應(yīng)的驅(qū)動(dòng),在第三方軟件使用數(shù)據(jù)時(shí),對(duì)驅(qū)動(dòng)安裝狀態(tài)進(jìn)行檢測(cè),驅(qū)動(dòng)未安裝時(shí),禁止數(shù)據(jù)使用;
B.建立內(nèi)爬行為檢測(cè)模塊,對(duì)第三方軟件的數(shù)據(jù)使用行為進(jìn)行檢測(cè),通過(guò)內(nèi)爬行為特征庫(kù),對(duì)第三方軟件行為進(jìn)行判定;內(nèi)爬行為特征庫(kù)通過(guò)以下幾個(gè)方面構(gòu)建:
(1)對(duì)使用數(shù)據(jù)進(jìn)行驅(qū)動(dòng)層次的追蹤,分別在網(wǎng)絡(luò)層和應(yīng)用層設(shè)置監(jiān)控代碼,采用HOOK或進(jìn)程回調(diào)的方式,對(duì)常見(jiàn)的數(shù)據(jù)操作函數(shù)進(jìn)行監(jiān)控,常見(jiàn)的應(yīng)用層數(shù)據(jù)操作函數(shù)如下:WriteFiIe,OpenFile,CreateFiIe,CopyFile,DeleteFile,Icreat,Iwrite,LZRead,MoveFi Ie,Send(網(wǎng)絡(luò)層socket傳輸)等;數(shù)據(jù)經(jīng)過(guò)模塊時(shí)進(jìn)行標(biāo)注,對(duì)寫(xiě)入到本地或網(wǎng)絡(luò)的數(shù)據(jù)進(jìn)行數(shù)據(jù)溯源,如追蹤到數(shù)據(jù)為模塊內(nèi)數(shù)據(jù)時(shí),直接判定第三方軟件進(jìn)行內(nèi)爬行為;
(2)通過(guò)驅(qū)動(dòng)層監(jiān)控第三方軟件數(shù)據(jù)訪問(wèn)量進(jìn)行監(jiān)控,根據(jù)設(shè)定的一個(gè)或多個(gè)數(shù)據(jù)閾值,獲得內(nèi)爬數(shù)據(jù)權(quán)值,數(shù)據(jù)訪問(wèn)量小的具有低內(nèi)爬數(shù)據(jù)權(quán)值,數(shù)據(jù)訪問(wèn)量大的具有高內(nèi)爬數(shù)據(jù)權(quán)值;
(3)通過(guò)驅(qū)動(dòng)層對(duì)第三方軟件數(shù)據(jù)訪問(wèn)時(shí)間進(jìn)行監(jiān)控,根據(jù)設(shè)定的一個(gè)或多個(gè)時(shí)間閾值,與時(shí)間閾值比較獲得內(nèi)爬時(shí)間權(quán)值,數(shù)據(jù)訪問(wèn)時(shí)間短的具有低內(nèi)爬時(shí)間權(quán)值,數(shù)據(jù)訪問(wèn)時(shí)間長(zhǎng)的具有高內(nèi)爬時(shí)間權(quán)值;
(4)通過(guò)驅(qū)動(dòng)層對(duì)第三方軟件數(shù)據(jù)訪問(wèn)頻率進(jìn)行監(jiān)控,根據(jù)設(shè)定的一個(gè)或多個(gè)頻率閾值,與頻率閾值比較獲得內(nèi)爬頻率權(quán)值,數(shù)據(jù)訪問(wèn)頻率低的具有低內(nèi)爬頻率權(quán)值,數(shù)據(jù)訪問(wèn)頻率高的具有高內(nèi)爬頻率權(quán)值;
C.當(dāng)?shù)谌杰浖ㄟ^(guò)內(nèi)爬行為特征檢測(cè)的第(I)步驗(yàn)證后,其行為內(nèi)爬權(quán)值為內(nèi)爬數(shù)據(jù)權(quán)值、內(nèi)爬時(shí)間權(quán)值、內(nèi)爬頻率權(quán)值的最大值;
D.依據(jù)內(nèi)爬行為檢測(cè)的結(jié)果,通過(guò)內(nèi)爬行為處理模塊對(duì)第三方軟件進(jìn)行處理,將有內(nèi)爬行為的第三方軟件加入黑名單,直接中斷其訪問(wèn)數(shù)據(jù),未有內(nèi)爬行為的第三方軟件將其內(nèi)爬權(quán)值與安全權(quán)值比較,安全等級(jí)由低到高依次采取禁止再次訪問(wèn)、中斷訪問(wèn)并提示、警告、正常運(yùn)行等處理。
[0008]進(jìn)一步的,內(nèi)爬行為檢測(cè)中的內(nèi)爬數(shù)據(jù)權(quán)值、內(nèi)爬時(shí)間權(quán)值、內(nèi)爬頻率權(quán)值分別通過(guò)樸素貝葉斯分類算法獲得,表現(xiàn)出較高的分類準(zhǔn)確性和運(yùn)算性能。
[0009]本發(fā)明中,檢測(cè)到第三方軟件數(shù)據(jù)訪問(wèn)數(shù)據(jù)量后,與一個(gè)或多個(gè)數(shù)據(jù)閾值進(jìn)行比較時(shí),當(dāng)數(shù)據(jù)訪問(wèn)量大于最大數(shù)據(jù)閾值時(shí),則內(nèi)爬數(shù)據(jù)權(quán)值為I,上述步驟C中,可直接忽略數(shù)據(jù)訪問(wèn)時(shí)間和數(shù)據(jù)訪問(wèn)頻率,直接獲得其內(nèi)爬權(quán)值為I,則其第三方軟件進(jìn)行了內(nèi)爬行為,當(dāng)數(shù)據(jù)訪問(wèn)量低于最大數(shù)據(jù)閾值時(shí),內(nèi)爬數(shù)據(jù)權(quán)值通過(guò)樸素貝葉斯分類算法獲得,內(nèi)爬數(shù)據(jù)權(quán)值P (內(nèi)爬I訪問(wèn)數(shù)據(jù)量)=P (訪問(wèn)數(shù)據(jù)量I內(nèi)爬)X P (內(nèi)爬)/P(訪問(wèn)數(shù)據(jù)量),其中P(訪問(wèn)數(shù)據(jù)量I內(nèi)爬)表示統(tǒng)計(jì)樣本中,內(nèi)爬行為發(fā)生時(shí)的訪問(wèn)數(shù)據(jù)量在統(tǒng)計(jì)樣本中所占比例,P(內(nèi)爬)表示統(tǒng)計(jì)樣本中內(nèi)爬行為的概率,P (訪問(wèn)數(shù)據(jù)量)表示訪問(wèn)數(shù)據(jù)量在統(tǒng)計(jì)樣本的所占比例。P (訪問(wèn)數(shù)據(jù)量I內(nèi)爬)、P (內(nèi)爬)、P (訪問(wèn)數(shù)據(jù)量)均可作為統(tǒng)計(jì)樣本中的先驗(yàn)概率獲得。根據(jù)多個(gè)數(shù)據(jù)閾值可劃分出多個(gè)樣本空間,根據(jù)數(shù)據(jù)訪問(wèn)量落入數(shù)據(jù)閾值的區(qū)域的不同,統(tǒng)計(jì)不同的樣本空間,可以更精確地獲得內(nèi)爬數(shù)據(jù)權(quán)值。
[0010]按照獲取內(nèi)爬數(shù)據(jù)權(quán)值的方式,獲得內(nèi)爬時(shí)間權(quán)值和內(nèi)爬頻率權(quán)值,進(jìn)一步獲得內(nèi)爬權(quán)值,根據(jù)內(nèi)爬權(quán)值與安全權(quán)值比較,即可分別第三方軟件行為的內(nèi)爬風(fēng)險(xiǎn),根據(jù)風(fēng)險(xiǎn)大小,采取相應(yīng)的反內(nèi)爬策略。
[0011]進(jìn)一步的,數(shù)據(jù)訪問(wèn)模塊還包括有第三方監(jiān)控驅(qū)動(dòng)方式,通過(guò)可信的第三方機(jī)構(gòu)監(jiān)控?cái)?shù)據(jù),第三方軟件訪問(wèn)數(shù)據(jù)時(shí),需要第三方監(jiān)控進(jìn)行審核,第三方監(jiān)控審核通過(guò)后才能訪問(wèn)數(shù)據(jù),進(jìn)一步提高了檢測(cè)效率。
[0012]進(jìn)一步的,第三方監(jiān)控驅(qū)動(dòng)方式采用黑名單匹配機(jī)制,每一個(gè)軟件對(duì)應(yīng)一個(gè)ID,將判斷出具有內(nèi)爬行為的第三方軟件加入黑名單,下次該第三方軟件再次申請(qǐng)使用時(shí),第三方驅(qū)動(dòng)根據(jù)黑名單匹配機(jī)制會(huì)直接判定該第三方軟件具有內(nèi)爬行為,直接禁止其訪問(wèn)數(shù)據(jù),這樣避免了進(jìn)一步的驗(yàn)證,提高了效率。
[0013]進(jìn)一步的,本發(fā)明還包括有誤報(bào)對(duì)應(yīng)策略處理模塊,當(dāng)?shù)谌杰浖徽`監(jiān)測(cè)到有內(nèi)爬行為或內(nèi)爬風(fēng)險(xiǎn)時(shí),可以申請(qǐng)誤報(bào),如通過(guò)審核,依據(jù)其內(nèi)爬風(fēng)險(xiǎn)的高低采取取消黑名單、解除禁止訪問(wèn)、停止警告等策略處理,防止第三方被誤報(bào)后產(chǎn)生不必要的問(wèn)題。
[0014]進(jìn)一步的,根據(jù)權(quán)利要求1所述的一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,其特征在于,在設(shè)定頻率閾值時(shí),可對(duì)數(shù)據(jù)內(nèi)容進(jìn)行分類,頻率較高的數(shù)據(jù)設(shè)置低權(quán)值,使用頻率低的數(shù)據(jù)設(shè)置高權(quán)值,可以得到更精確的頻率權(quán)值,分類效果更好。
[0015]綜上所述,本發(fā)明有益效果在于,對(duì)第三方軟件內(nèi)爬行為風(fēng)險(xiǎn)大小做出針對(duì)性處理,并提供第三方監(jiān)控和誤報(bào)處理,保證了數(shù)據(jù)的安全性,提高對(duì)第三方軟件的監(jiān)控效率,具有較高的分類準(zhǔn)確性和運(yùn)算效率。
[0016]【附圖說(shuō)明】:
圖1為本發(fā)明總流程圖;
圖2為本發(fā)明具體流程圖。
【具體實(shí)施方式】
[0017]下面結(jié)合試驗(yàn)例及【具體實(shí)施方式】對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。但不應(yīng)將此理解為本發(fā)明上述主題的范圍僅限于以下的實(shí)施例,凡基于本
【發(fā)明內(nèi)容】
所實(shí)現(xiàn)的技術(shù)均屬于本發(fā)明的范圍。
實(shí)施例
[0018]—種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,包括以下步驟:
A.建立數(shù)據(jù)訪問(wèn)模塊,數(shù)據(jù)訪問(wèn)模塊采用SDK驅(qū)動(dòng)方式保護(hù)數(shù)據(jù),將需要保護(hù)的數(shù)據(jù)放入模塊中,第三方軟件需要使用數(shù)據(jù)時(shí),為其提供訪問(wèn)接口,使用訪問(wèn)接口需安裝相應(yīng)的驅(qū)動(dòng),在第三方軟件使用數(shù)據(jù)時(shí),對(duì)驅(qū)動(dòng)安裝狀態(tài)進(jìn)行檢測(cè),驅(qū)動(dòng)未安裝時(shí),禁止數(shù)據(jù)使用。
[0019]B.建立內(nèi)爬行為檢測(cè)模塊,對(duì)第三方軟件的數(shù)據(jù)使用行為進(jìn)行檢測(cè),通過(guò)內(nèi)爬行為特征庫(kù),對(duì)第三方軟件行為進(jìn)行判定;內(nèi)爬行為特征庫(kù)通過(guò)以下幾個(gè)方面構(gòu)建:
(1)對(duì)使用數(shù)據(jù)進(jìn)行驅(qū)動(dòng)層次的追蹤,分別在網(wǎng)絡(luò)層和應(yīng)用層設(shè)置監(jiān)控代碼,采用HOOK或進(jìn)程回調(diào)的方式,對(duì)常見(jiàn)的數(shù)據(jù)操作函數(shù)進(jìn)行監(jiān)控,常見(jiàn)的應(yīng)用層數(shù)據(jù)操作函數(shù)如下:WriteFiIe,OpenFile,CreateFiIe,CopyFile,DeleteFile,Icreat,Iwrite,LZRead,MoveFi Ie,Send(網(wǎng)絡(luò)層socket傳輸)等;數(shù)據(jù)經(jīng)過(guò)模塊時(shí)進(jìn)行標(biāo)注,對(duì)寫(xiě)入到本地或網(wǎng)絡(luò)的數(shù)據(jù)進(jìn)行數(shù)據(jù)溯源,如追蹤到數(shù)據(jù)為模塊內(nèi)數(shù)據(jù)時(shí),直接判定第三方軟件進(jìn)行內(nèi)爬行為;
(2)通過(guò)驅(qū)動(dòng)層監(jiān)控第三方軟件數(shù)據(jù)訪問(wèn)量進(jìn)行監(jiān)控,根據(jù)設(shè)定的一個(gè)或多個(gè)數(shù)據(jù)閾值,獲得內(nèi)爬數(shù)據(jù)權(quán)值,數(shù)據(jù)訪問(wèn)量小的具有低內(nèi)爬數(shù)據(jù)權(quán)值,數(shù)據(jù)訪問(wèn)量大的具有高內(nèi)爬數(shù)據(jù)權(quán)值;
(3)通過(guò)驅(qū)動(dòng)層對(duì)第三方軟件數(shù)據(jù)訪問(wèn)時(shí)間進(jìn)行監(jiān)控,根據(jù)設(shè)定的一個(gè)或多個(gè)時(shí)間閾值,與時(shí)間閾值比較獲得內(nèi)爬時(shí)間權(quán)值,數(shù)據(jù)訪問(wèn)時(shí)間短的具有低內(nèi)爬時(shí)間權(quán)值,數(shù)據(jù)訪問(wèn)時(shí)間長(zhǎng)的具有高內(nèi)爬時(shí)間權(quán)值;
(4)通過(guò)驅(qū)動(dòng)層對(duì)第三方軟件數(shù)據(jù)訪問(wèn)頻率進(jìn)行監(jiān)控,根據(jù)設(shè)定的一個(gè)或多個(gè)頻率閾值,與頻率閾值比較獲得內(nèi)爬頻率權(quán)值,數(shù)據(jù)訪問(wèn)頻率低的具有低內(nèi)爬頻率權(quán)值,數(shù)據(jù)訪問(wèn)頻率高的具有高內(nèi)爬頻率權(quán)值;
C.當(dāng)?shù)谌杰浖ㄟ^(guò)內(nèi)爬行為特征檢測(cè)的第(I)步驗(yàn)證后,其行為內(nèi)爬權(quán)值為內(nèi)爬數(shù)據(jù)權(quán)值、內(nèi)爬時(shí)間權(quán)值、內(nèi)爬頻率權(quán)值的最大值。
[0020]D.依據(jù)內(nèi)爬行為檢測(cè)的結(jié)果,通過(guò)內(nèi)爬行為處理模塊對(duì)第三方軟件進(jìn)行處理,將有內(nèi)爬行為的第三方軟件加入黑名單,直接中斷其訪問(wèn)數(shù)據(jù),未有內(nèi)爬行為的第三方軟件將其內(nèi)爬權(quán)值與安全權(quán)值比較,安全等級(jí)由低到高依次采取禁止再次訪問(wèn)、中斷訪問(wèn)并提示、警告、正常運(yùn)行等處理。
[0021 ]進(jìn)一步的,內(nèi)爬行為檢測(cè)中的內(nèi)爬數(shù)據(jù)權(quán)值、內(nèi)爬時(shí)間權(quán)值、內(nèi)爬頻率權(quán)值分別通過(guò)樸素貝葉斯分類算法獲得,表現(xiàn)出較高的分類準(zhǔn)確性和運(yùn)算性能。
[0022]本發(fā)明中,使用樸素貝葉斯分類算法來(lái)估算“內(nèi)爬”各種行為的權(quán)值,檢測(cè)到第三方軟件數(shù)據(jù)訪問(wèn)數(shù)據(jù)量后,與一個(gè)或多個(gè)數(shù)據(jù)閾值進(jìn)行比較時(shí),當(dāng)數(shù)據(jù)訪問(wèn)量大于最大數(shù)據(jù)閾值時(shí),則內(nèi)爬數(shù)據(jù)權(quán)值為I,上述步驟C中,可直接忽略數(shù)據(jù)訪問(wèn)時(shí)間和數(shù)據(jù)訪問(wèn)頻率,直接獲得其內(nèi)爬權(quán)值為I,則其第三方軟件進(jìn)行了內(nèi)爬行為,當(dāng)數(shù)據(jù)訪問(wèn)量低于最大數(shù)據(jù)閾值時(shí),內(nèi)爬數(shù)據(jù)權(quán)值通過(guò)樸素貝葉斯分類算法獲得,內(nèi)爬數(shù)據(jù)權(quán)值P(內(nèi)爬I訪問(wèn)數(shù)據(jù)量)=P(訪問(wèn)數(shù)據(jù)量I內(nèi)爬)XP(內(nèi)爬)/P(訪問(wèn)數(shù)據(jù)量),其中P(訪問(wèn)數(shù)據(jù)量I內(nèi)爬)表示統(tǒng)計(jì)樣本中,內(nèi)爬行為發(fā)生時(shí)的訪問(wèn)數(shù)據(jù)量在統(tǒng)計(jì)樣本中所占比例,P(內(nèi)爬)表示統(tǒng)計(jì)樣本中內(nèi)爬行為的概率,P(訪問(wèn)數(shù)據(jù)量)表示訪問(wèn)數(shù)據(jù)量在統(tǒng)計(jì)樣本的所占比例C=P(訪問(wèn)數(shù)據(jù)量I內(nèi)爬)、P(內(nèi)爬)、P(訪問(wèn)數(shù)據(jù)量)均可作為統(tǒng)計(jì)樣本中的先驗(yàn)概率獲得。根據(jù)多個(gè)數(shù)據(jù)閾值可劃分出多個(gè)樣本空間,根據(jù)數(shù)據(jù)訪問(wèn)量落入數(shù)據(jù)閾值的區(qū)域的不同,統(tǒng)計(jì)不同的樣本空間,可以更精確地獲得內(nèi)爬數(shù)據(jù)權(quán)值。
[0023]按照獲取內(nèi)爬數(shù)據(jù)權(quán)值的方式,獲得內(nèi)爬時(shí)間權(quán)值和內(nèi)爬頻率權(quán)值,進(jìn)一步獲得內(nèi)爬權(quán)值,根據(jù)內(nèi)爬權(quán)值與安全權(quán)值比較,即可分別第三方軟件行為的內(nèi)爬風(fēng)險(xiǎn),根據(jù)風(fēng)險(xiǎn)大小,采取相應(yīng)的反內(nèi)爬策略。
[0024]數(shù)據(jù)訪問(wèn)模塊還包括有第三方監(jiān)控驅(qū)動(dòng)方式,通過(guò)可信的第三方機(jī)構(gòu)監(jiān)控?cái)?shù)據(jù),第三方軟件訪問(wèn)數(shù)據(jù)時(shí),需要第三方監(jiān)控進(jìn)行審核,第三方監(jiān)控審核通過(guò)后才能訪問(wèn)數(shù)據(jù),進(jìn)一步提尚了檢測(cè)效率。
[0025]第三方監(jiān)控驅(qū)動(dòng)方式采用黑名單匹配機(jī)制,每一個(gè)軟件對(duì)應(yīng)一個(gè)ID,將判斷出具有內(nèi)爬行為的第三方軟件加入黑名單,下次該第三方軟件再次申請(qǐng)使用時(shí),第三方驅(qū)動(dòng)根據(jù)黑名單匹配機(jī)制會(huì)直接判定該第三方軟件具有內(nèi)爬行為,直接禁止其訪問(wèn)數(shù)據(jù),這樣避免了進(jìn)一步的驗(yàn)證,提高了效率。
[0026]本發(fā)明還包括有誤報(bào)對(duì)應(yīng)策略處理模塊,當(dāng)?shù)谌杰浖徽`監(jiān)測(cè)到有內(nèi)爬行為或內(nèi)爬風(fēng)險(xiǎn)時(shí),可以申請(qǐng)誤報(bào),如通過(guò)審核,依據(jù)其內(nèi)爬風(fēng)險(xiǎn)的高低采取取消黑名單、解除禁止訪問(wèn)、停止警告等策略處理,防止第三方被誤報(bào)后產(chǎn)生不必要的問(wèn)題。
[0027]在設(shè)定頻率閾值時(shí),還可對(duì)數(shù)據(jù)內(nèi)容進(jìn)行分類,頻率較高的數(shù)據(jù)設(shè)置低權(quán)值,使用頻率低的數(shù)據(jù)設(shè)置高權(quán)值。
【主權(quán)項(xiàng)】
1.一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,其特征在于,包括以下步驟: A.建立數(shù)據(jù)訪問(wèn)模塊,數(shù)據(jù)訪問(wèn)模塊采用SDK驅(qū)動(dòng)方式保護(hù)數(shù)據(jù),將需要保護(hù)的數(shù)據(jù)放入模塊中,第三方軟件需要使用數(shù)據(jù)時(shí),為其提供訪問(wèn)接口,使用訪問(wèn)接口需安裝相應(yīng)的驅(qū)動(dòng),在第三方軟件使用數(shù)據(jù)時(shí),對(duì)驅(qū)動(dòng)安裝狀態(tài)進(jìn)行檢測(cè),驅(qū)動(dòng)未安裝時(shí),禁止數(shù)據(jù)使用; B.建立內(nèi)爬行為檢測(cè)模塊,對(duì)第三方軟件的數(shù)據(jù)使用行為進(jìn)行檢測(cè),通過(guò)內(nèi)爬行為特征庫(kù),對(duì)第三方軟件行為進(jìn)行判定;內(nèi)爬行為特征庫(kù)通過(guò)以下幾個(gè)方面構(gòu)建: (1)對(duì)使用數(shù)據(jù)進(jìn)行驅(qū)動(dòng)層次的追蹤,分別在網(wǎng)絡(luò)層和應(yīng)用層設(shè)置監(jiān)控代碼,采用HOOK或進(jìn)程回調(diào)的方式,對(duì)常見(jiàn)的數(shù)據(jù)操作函數(shù)進(jìn)行監(jiān)控,數(shù)據(jù)經(jīng)過(guò)模塊時(shí)進(jìn)行標(biāo)注,對(duì)寫(xiě)入到本地或網(wǎng)絡(luò)的數(shù)據(jù)進(jìn)行數(shù)據(jù)溯源,如追蹤到數(shù)據(jù)為模塊內(nèi)數(shù)據(jù)時(shí),直接判定第三方軟件進(jìn)行內(nèi)爬行為; (2)通過(guò)驅(qū)動(dòng)層監(jiān)控第三方軟件數(shù)據(jù)訪問(wèn)量進(jìn)行監(jiān)控,根據(jù)設(shè)定的一個(gè)或多個(gè)數(shù)據(jù)閾值,獲得內(nèi)爬數(shù)據(jù)權(quán)值,數(shù)據(jù)訪問(wèn)量小的具有低內(nèi)爬數(shù)據(jù)權(quán)值,數(shù)據(jù)訪問(wèn)量大的具有高內(nèi)爬數(shù)據(jù)權(quán)值; (3)通過(guò)驅(qū)動(dòng)層對(duì)第三方軟件數(shù)據(jù)訪問(wèn)時(shí)間進(jìn)行監(jiān)控,根據(jù)設(shè)定的一個(gè)或多個(gè)時(shí)間閾值,與時(shí)間閾值比較獲得內(nèi)爬時(shí)間權(quán)值,數(shù)據(jù)訪問(wèn)時(shí)間短的具有低內(nèi)爬時(shí)間權(quán)值,數(shù)據(jù)訪問(wèn)時(shí)間長(zhǎng)的具有高內(nèi)爬時(shí)間權(quán)值; (4)通過(guò)驅(qū)動(dòng)層對(duì)第三方軟件數(shù)據(jù)訪問(wèn)頻率進(jìn)行監(jiān)控,根據(jù)設(shè)定的一個(gè)或多個(gè)頻率閾值,與頻率閾值比較獲得內(nèi)爬頻率權(quán)值,數(shù)據(jù)訪問(wèn)頻率低的具有低內(nèi)爬頻率權(quán)值,數(shù)據(jù)訪問(wèn)頻率高的具有高內(nèi)爬頻率權(quán)值; C.當(dāng)?shù)谌杰浖ㄟ^(guò)內(nèi)爬行為特征檢測(cè)的第(I)步驗(yàn)證后,其行為內(nèi)爬權(quán)值為內(nèi)爬數(shù)據(jù)權(quán)值、內(nèi)爬時(shí)間權(quán)值、內(nèi)爬頻率權(quán)值的最大值; D.依據(jù)內(nèi)爬行為檢測(cè)的結(jié)果,通過(guò)內(nèi)爬行為處理模塊對(duì)第三方軟件進(jìn)行處理,將有內(nèi)爬行為的第三方軟件加入黑名單,直接中斷其訪問(wèn)數(shù)據(jù),未有內(nèi)爬行為的第三方軟件將其內(nèi)爬權(quán)值與安全權(quán)值比較,安全等級(jí)由低到高依次采取禁止再次訪問(wèn)、中斷訪問(wèn)并提示、警告、正常運(yùn)行等處理。2.根據(jù)權(quán)利要求1所述的一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,其特征在于,內(nèi)爬行為檢測(cè)中的內(nèi)爬數(shù)據(jù)權(quán)值、內(nèi)爬時(shí)間權(quán)值、內(nèi)爬頻率權(quán)值分別通過(guò)樸素貝葉斯分類算法獲得。3.根據(jù)權(quán)利要求1所述的一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,其特征在于,數(shù)據(jù)訪問(wèn)模塊還包括有第三方監(jiān)控驅(qū)動(dòng)方式,通過(guò)可信的第三方機(jī)構(gòu)監(jiān)控?cái)?shù)據(jù),第三方軟件訪問(wèn)數(shù)據(jù)時(shí),需要第三方監(jiān)控進(jìn)行審核,第三方監(jiān)控審核通過(guò)后才能訪問(wèn)數(shù)據(jù)。4.根據(jù)權(quán)利要求3所述的一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,其特征在于,第三方監(jiān)控驅(qū)動(dòng)方式采用黑名單匹配機(jī)制。5.根據(jù)權(quán)利要求1所述的一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,其特征在于,還包括有誤報(bào)對(duì)應(yīng)策略處理模塊,當(dāng)?shù)谌杰浖徽`監(jiān)測(cè)到有內(nèi)爬行為或內(nèi)爬風(fēng)險(xiǎn)時(shí),可以申請(qǐng)誤報(bào),如通過(guò)審核,依據(jù)其內(nèi)爬風(fēng)險(xiǎn)的高低采取取消黑名單、解除禁止訪問(wèn)、停止警告等策略處理。6.根據(jù)權(quán)利要求1所述的一種面向數(shù)據(jù)產(chǎn)權(quán)保護(hù)的反內(nèi)爬訪控方法,其特征在于,在設(shè)定頻率閾值時(shí),可對(duì)數(shù)據(jù)內(nèi)容進(jìn)行分類,頻率較高的數(shù)據(jù)設(shè)置低權(quán)值,使用頻率低的數(shù)據(jù)設(shè)置高權(quán)值。
【文檔編號(hào)】G06F21/56GK105912934SQ201610245805
【公開(kāi)日】2016年8月31日
【申請(qǐng)日】2016年4月20日
【發(fā)明人】陳瑞霞, 王貝貝, 楊文浩, 王貝
【申請(qǐng)人】迅鰩成都科技有限公司