一種安全文件的識(shí)別方法及裝置的制造方法

文檔序號(hào)：9417750閱讀：200來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種安全文件的識(shí)別方法及裝置的制造方法
【專利說明】一種安全文件的識(shí)別方法及裝置【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及網(wǎng)絡(luò)安全技術(shù)領(lǐng)域，尤其涉及一種安全文件的識(shí)別方法及裝置。【【背景技術(shù)】】
[0002] 隨著互聯(lián)網(wǎng)和通信技術(shù)在最近幾年的迅速發(fā)展，各種各樣的應(yīng)用在不斷地出現(xiàn)，并快速的迭代更新，每天都會(huì)產(chǎn)生很多應(yīng)用的相關(guān)文件。因此，安全系統(tǒng)會(huì)捕獲到很多未知文件，這些未知文件中既有安全文件，也有惡意文件，因此需要從眾多的未知文件中識(shí)別出安全文件。
[0003] 現(xiàn)有技術(shù)中，是利用未知文件的數(shù)據(jù)簽名，在預(yù)設(shè)的白名單中進(jìn)行查找。如果該未知文件屬于白名單，則識(shí)別出該未知文件是安全文件，反之則識(shí)別出該未知文件是非安全文件。然而，應(yīng)用的新增速度以及更新速度非?？?，使得相關(guān)文件也出現(xiàn)的很快且數(shù)量龐大，因此，利用現(xiàn)有技術(shù)中基于未知文件的數(shù)據(jù)簽名和白名單的方式，實(shí)現(xiàn)的安全文件的識(shí) 別技術(shù)將無法滿足目前安全文件的識(shí)別需求，從而導(dǎo)致安全文件的識(shí)別率比較低。【
【發(fā)明內(nèi)容】
】
[0004] 有鑒于此，本發(fā)明實(shí)施例提供了一種安全文件的識(shí)別方法及裝置，用以解決現(xiàn)有技術(shù)中安全文件的識(shí)別率比較低的問題。
[0005] 本發(fā)明實(shí)施例的一方面，提供一種安全文件的識(shí)別方法，包括：
[0006] 根據(jù)待識(shí)別文件，獲得與所述待識(shí)別文件相匹配的已知安全文件；
[0007] 獲得所述待識(shí)別文件與所述已知安全文件的相似度；
[0008] 根據(jù)所述待識(shí)別文件與所述已知安全文件的相似度，識(shí)別所述待識(shí)別文件是否為安全文件。
[0009] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述根據(jù)待識(shí)別文件，獲得與所述待識(shí)別文件相匹配的已知安全文件，包括：
[0010] 根據(jù)所述待識(shí)別文件的詳細(xì)信息，在數(shù)據(jù)庫中進(jìn)行匹配，以獲得與所述待識(shí)別文件相匹配的已知安全文件；其中，所述數(shù)據(jù)庫包含已知安全文件的詳細(xì)信息。
[0011] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述獲得所述待識(shí)別文件與所述已知安全文件的相似度，包括：
[0012] 獲得所述待識(shí)別文件的代碼塊指紋；
[0013] 根據(jù)所述待識(shí)別文件的代碼塊指紋與所述已知安全文件的代碼塊指紋，獲得所述待識(shí)別文件與所述已知安全文件的相似度。
[0014] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述獲得所述待識(shí)別文件的代碼塊指紋，包括：
[0015] 對所述待識(shí)別文件進(jìn)行反編譯處理，以獲得所述待識(shí)別文件的反編譯代碼；
[0016] 獲得所述反編譯代碼所包含的至少一個(gè)代碼塊；
[0017] 獲得每個(gè)所述代碼塊的指紋信息；
[0018] 根據(jù)每個(gè)所述代碼塊的指紋信息，獲得所述待識(shí)別文件的代碼塊指紋。
[0019] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，每個(gè)所述代碼塊的指紋信息包括：
[0020] 每個(gè)所述代碼塊的指令結(jié)構(gòu)特征；以及，
[0021] 根據(jù)每個(gè)所述代碼塊中部分指令獲得的哈希值。
[0022] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述獲得所述待識(shí)別文件與所述已知安全文件的相似度，包括：
[0023] 利用如下公式獲得所述待識(shí)別文件與所述已知安全文件的相似度：
[0024]
[0025] 該公式中，C表示所述待識(shí)別文件與所述已知安全文件的相似度；所述A表示所述待識(shí)別文件的代碼塊指紋；所述B表示所述已知安全文件的代碼塊指紋；F(A η B)表示所述待識(shí)別文件的代碼塊指紋與所述已知安全文件的代碼塊指紋的交集中代碼塊指紋的步長的累加和；F(Α η Β)表示所述待識(shí)別文件的代碼塊指紋與所述已知安全文件的代碼塊指紋的并集中代碼塊指紋的步長的累加和。
[0026] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述根據(jù)所述待識(shí)別文件與所述已知安全文件的相似度，識(shí)別所述待識(shí)別文件是否為安全文件，包括：
[0027] 若所述待識(shí)別文件與所述已知安全文件的相似度大于預(yù)設(shè)的相似閾值，識(shí)別出所述待識(shí)別文件是安全文件。
[0028] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述方法還包括：
[0029] 若識(shí)別出所述待識(shí)別文件是安全文件，將所述待識(shí)別文件添加到所述數(shù)據(jù)庫。
[0030] 本發(fā)明實(shí)施例的一方面，提供一種安全文件的識(shí)別裝置，包括：
[0031] 文件查找單元，用于根據(jù)待識(shí)別文件，獲得與所述待識(shí)別文件相匹配的已知安全文件；
[0032] 相似統(tǒng)計(jì)單元，用于獲得所述待識(shí)別文件與所述已知安全文件的相似度；
[0033] 文件識(shí)別單元，用于根據(jù)所述待識(shí)別文件與所述已知安全文件的相似度，識(shí)別所述待識(shí)別文件是否為安全文件。
[0034] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述文件查找單元，具體用于：
[0035] 根據(jù)所述待識(shí)別文件的詳細(xì)信息，在數(shù)據(jù)庫中進(jìn)行匹配，以獲得與所述待識(shí)別文件相匹配的已知安全文件；其中，所述數(shù)據(jù)庫包含已知安全文件的詳細(xì)信息。
[0036] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述相似統(tǒng) 計(jì)單元，具體用于：
[0037] 獲得所述待識(shí)別文件的代碼塊指紋；
[0038] 根據(jù)所述待識(shí)別文件的代碼塊指紋與所述已知安全文件的代碼塊指紋，獲得所述待識(shí)別文件與所述已知安全文件的相似度。
[0039] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述相似統(tǒng) 計(jì)單元用于獲得所述待識(shí)別文件的代碼塊指紋時(shí)，具體用于：
[0040] 對所述待識(shí)別文件進(jìn)行反編譯處理，以獲得所述待識(shí)別文件的反編譯代碼；
[0041] 獲得所述反編譯代碼所包含的至少一個(gè)代碼塊；
[0042] 獲得每個(gè)所述代碼塊的指紋信息；
[0043] 根據(jù)每個(gè)所述代碼塊的指紋信息，獲得所述待識(shí)別文件的代碼塊指紋。
[0044] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，每個(gè)所述代碼塊的指紋信息包括：
[0045] 每個(gè)所述代碼塊的指令結(jié)構(gòu)特征；以及，
[0046] 根據(jù)每個(gè)所述代碼塊中部分指令獲得的哈希值。
[0047] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述相似統(tǒng) 計(jì)單元用于獲得所述待識(shí)別文件與所述已知安全文件的相似度時(shí)，具體用于：
[0048] 利用如下公式獲得所述待識(shí)別文件與所述已知安全文件的相似度：
[0049] C=(F(AnB)V(F(AUB))XK)O
[0050] 該公式中，C表示所述待識(shí)別文件與所述已知安全文件的相似度；所述A表示所述待識(shí)別文件的代碼塊指紋；所述B表示所述已知安全文件的代碼塊指紋；F(A η B)表示所述待識(shí)別文件的代碼塊指紋與所述已知安全文件的代碼塊指紋的交集中代碼塊指紋的步長的累加和；F(Α η Β)表示所述待識(shí)別文件的代碼塊指紋與所述已知安全文件的代碼塊指紋的并集中代碼塊指紋的步長的累加和。
[0051] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述文件識(shí) 別單元，具體用于：
[0052] 若所述待識(shí)別文件與所述已知安全文件的相似度大于預(yù)設(shè)的相似閾值，識(shí)別出所述待識(shí)別文件是安全文件。
[0053] 如上所述的方面和任一可能的實(shí)現(xiàn)方式，進(jìn)一步提供一種實(shí)現(xiàn)方式，所述裝置還包括：
[0054] 文件添加單元，用于若識(shí)別出所述待識(shí)別文件是安全文件，將所述待識(shí)別文件添加到所述數(shù)據(jù)庫。
[0055] 由以上技術(shù)方案可以看出，本發(fā)明實(shí)施例具有以下有益效果：
[0056] 本發(fā)明實(shí)施例提供的技術(shù)方案中，利用已知安全文件與待識(shí)別文件的相似度，來識(shí)別待識(shí)別文件是否為安全文件，相當(dāng)于通過對待識(shí)別文件與已知安全文件是否屬于同源文件的判別，來識(shí)別出待識(shí)別文件是否為安全文件，因此，能夠快速識(shí)別出安全文件。與現(xiàn) 有技術(shù)中判斷未知文件是否屬于白名單的識(shí)別方式相比，本發(fā)明實(shí)施例能夠識(shí)別出更多的安全文件，滿足目前安全文件的識(shí)別需求，提高了安全文件的識(shí)別率，因此解決了現(xiàn)有技術(shù) 中安全文件的識(shí)別率比較低的問題，從而可以減少用戶側(cè)不必要的彈窗數(shù)量，提升用戶體驗(yàn)。【【附圖說明】】
[0057] 為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案，下面將對實(shí)施例中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動(dòng)性的前提下，還可以根據(jù)這些附圖獲得其它的附圖。
[0058] 圖1是本發(fā)明實(shí)施例所提供的安全文件的識(shí)別方法的流程示意圖；
[0059] 圖2是本發(fā)明實(shí)施例所提供的利用已知安全文件對待識(shí)別文件進(jìn)行識(shí)別的示例圖；
[0060] 圖3是本發(fā)明實(shí)

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3 4

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黨偉;郭根;鄒榮新;
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司;
我是此專利的發(fā)明人

上一篇：一種基于條件隨機(jī)場模型的指令型硬件木馬檢測方法
上一篇：惡意網(wǎng)頁的防御方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

文檔掃描軟件相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種安全文件的識(shí)別方法及裝置的制造方法