本發(fā)明涉及應用圖標,尤其涉及一種應用圖標的相似性檢測方法、裝置、設備及存儲介質(zhì)。
背景技術:
1、隨著應用程序的普及,市面上出現(xiàn)了越來越多的盜版應用,用于迷惑用戶獲取利益。為及時發(fā)現(xiàn)市面上一些盜版的相似應用,往往通過尋找相似性軟件來識別是否有出現(xiàn)類似的應用,通過提前告知用戶或者進行安全攔截來警醒用戶進行合理選擇。目前進行相似性判斷的方式是通過應用名或者圖標進行相似性檢索,相似性檢索的方式是通過計算圖標之間的海明距離判斷是否相似,如果圖標的數(shù)量較多,計算的過程會比較復雜。因此,如何簡單有效地對應用圖標進行相似性檢測,成為一個亟待解決的問題。
2、上述內(nèi)容僅用于輔助理解本發(fā)明的技術方案,并不代表承認上述內(nèi)容是現(xiàn)有技術。
技術實現(xiàn)思路
1、本發(fā)明的主要目的在于提供了一種應用圖標的相似性檢測方法、裝置、設備及存儲介質(zhì),旨在解決如何簡單有效地對應用圖標進行相似性檢測的技術問題。
2、為實現(xiàn)上述目的,本發(fā)明提供了一種應用圖標的相似性檢測方法,所述應用圖標的相似性檢測方法包括以下步驟:
3、對待檢測應用圖標的哈希特征值進行分段,獲得多段第一特征值;
4、獲取標準應用圖標的標準哈希特征值對應的多段第二特征值;
5、按分段索引方式對所述多段第一特征值和所述多段第二特征值進行特征值匹配;
6、根據(jù)匹配結果對所述待檢測應用圖標和所述標準應用圖標進行相似性檢測。
7、可選地,所述對待檢測應用圖標的哈希特征值進行分段,獲得多段第一特征值的步驟,具體包括:
8、獲取所述待檢測應用圖標對應的哈希特征值;
9、確定所述哈希特征值對應的分段段數(shù);
10、根據(jù)所述分段段數(shù)對所述哈希特征值進行分段,獲得多段后的第一特征值。
11、可選地,所述獲取所述待檢測應用圖標對應的哈希特征值的步驟,具體包括:
12、通過預設靜態(tài)分析工具確定預設數(shù)據(jù)庫中的應用圖標對應的預設圖標文件集合,所述預設數(shù)據(jù)庫中的應用圖標包括:所述待檢測應用圖標和標準應用圖標;
13、通過simhash算法確定所述預設圖標文件集合對應的預設哈希特征值集合;
14、從所述預設哈希特征值集合中選取所述待檢測應用圖標對應的哈希特征值。
15、可選地,所述確定所述哈希特征值對應的分段段數(shù)的步驟,具體包括:
16、確定所述預設哈希特征值集合中的所有預設哈希特征值對應的預設位數(shù)集合;
17、從所述預設位數(shù)集合中選取所述哈希特征值對應的位數(shù);
18、根據(jù)所述預設位數(shù)集合中的各預設位數(shù)和所述位數(shù)確定段落位數(shù);
19、根據(jù)所述段落位數(shù)確定所述哈希特征值對應的分段段數(shù)。
20、可選地,所述確定所述哈希特征值對應的分段段數(shù)的步驟,具體包括:
21、獲取所述預設圖標文件集合中的所有預設圖標文件對應的預設圖標尺寸集合;
22、從所述預設圖標尺寸集合中選取所述待檢測應用圖標對應的圖標尺寸;
23、根據(jù)所述預設圖標尺寸集合中的各預設圖標尺寸和所述圖標尺寸確定分段尺寸;
24、根據(jù)所述分段尺寸確定所述哈希特征值對應的分段段數(shù)。
25、可選地,所述獲取標準應用圖標的標準哈希特征值對應的多段第二特征值的步驟,具體包括:
26、從所述預設哈希特征值集合中選取所述標準應用圖標對應的標準哈希特征值;
27、根據(jù)所述分段段數(shù)和所述標準哈希特征值確定標準分段段數(shù);
28、根據(jù)所述標準分段段數(shù)對所述標準哈希特征值進行分段,獲得多段第二特征值。
29、可選地,所述按分段索引方式對所述多段第一特征值和所述多段第二特征值進行特征值匹配的步驟,具體包括:
30、對所述多段第一特征值分段進行存儲,并對各段存儲的第一特征值創(chuàng)建索引集合;
31、對所述索引集合中的各索引對應的目標第一特征值分別與所述多段第二特征值進行特征值匹配。
32、可選地,所述對所述索引集合中的各索引對應的目標第一特征值分別與所述多段第二特征值進行特征值匹配的步驟,具體包括:
33、在所述索引集合中的各索引對應的目標第一特征值和所述多段第二特征值中存在任一相等的特征值時,判定特征值匹配通過;
34、在所述索引集合中的各索引對應的目標第一特征值和所述多段第二特征值中不存在任一相等的特征值時,判定特征值匹配失敗。
35、可選地,所述根據(jù)匹配結果對所述待檢測應用圖標和所述標準應用圖標進行相似性檢測的步驟,具體包括:
36、在匹配結果為特征值匹配通過時,從所述標準應用圖標中選取對應的目標標準應用圖標;
37、確定所述待檢測應用圖標與所述目標標準應用圖標之間的海明距離集合;
38、根據(jù)所述海明距離集合從所述目標標準應用圖標中選取所述待檢測應用圖標對應的相似應用圖標。
39、可選地,所述確定所述待檢測應用圖標與所述目標標準應用圖標之間的海明距離集合的步驟,具體包括:
40、從所述預設哈希特征值集合中選取所述目標標準應用圖標對應的目標標準哈希特征值;
41、根據(jù)所述哈希特征值和所述目標標準哈希特征值確定所述待檢測應用圖標與所述目標標準應用圖標之間的海明距離集合。
42、可選地,所述根據(jù)所述海明距離集合從所述目標標準應用圖標中選取所述待檢測應用圖標對應的相似應用圖標的步驟,具體包括:
43、確定所述海明距離集合中的最小海明距離,并從所述目標標準應用圖標中選取所述最小海明距離對應的目標應用圖標;
44、在所述目標應用圖標對應的圖標個數(shù)大于預設個數(shù)時,獲取所述目標應用圖標對應的目標應用程序和所述待檢測應用圖標對應的待檢測應用程序;
45、根據(jù)所述目標應用程序和所述待檢測應用程序從所述目標應用圖標中選取所述待檢測應用圖標對應的相似應用圖標。
46、可選地,所述根據(jù)所述目標應用程序和所述待檢測應用程序從所述目標應用圖標中選取所述待檢測應用圖標對應的相似應用圖標的步驟,具體包括:
47、獲取所述目標應用程序與用戶之間的歷史交互次數(shù)和所述目標應用程序?qū)哪繕诉M程;
48、獲取所述待檢測應用程序?qū)拇龣z測進程;
49、在所述歷史交互次數(shù)大于預設次數(shù)時,對所述目標進程和所述待檢測進程進行進程匹配;
50、根據(jù)進程匹配結果從所述目標應用圖標中選取所述待檢測應用圖標對應的相似應用圖標。
51、此外,為實現(xiàn)上述目的,本發(fā)明還提供一種應用圖標的相似性檢測裝置,所述應用圖標的相似性檢測裝置包括:
52、特征值分段模塊,用于對待檢測應用圖標的哈希特征值進行分段,獲得多段第一特征值;
53、所述特征值分段模塊,還用于獲取標準應用圖標的標準哈希特征值對應的多段第二特征值;
54、特征值匹配模塊,用于按分段索引方式對所述多段第一特征值和所述多段第二特征值進行特征值匹配;
55、相似性檢測模塊,用于根據(jù)匹配結果對所述待檢測應用圖標和所述標準應用圖標進行相似性檢測。
56、可選地,所述特征值分段模塊,還用于獲取所述待檢測應用圖標對應的哈希特征值;確定所述哈希特征值對應的分段段數(shù);根據(jù)所述分段段數(shù)對所述哈希特征值進行分段,獲得多段第一特征值。
57、可選地,所述特征值分段模塊,還用于通過預設靜態(tài)分析工具確定預設數(shù)據(jù)庫中的應用圖標對應的預設圖標文件集合,所述預設數(shù)據(jù)庫中的應用圖標包括:所述待檢測應用圖標和標準應用圖標;通過simhash算法確定所述預設圖標文件集合對應的預設哈希特征值集合;從所述預設哈希特征值集合中選取所述待檢測應用圖標對應的哈希特征值。
58、可選地,所述特征值分段模塊,還用于確定所述預設哈希特征值集合中的所有預設哈希特征值對應的預設位數(shù)集合;從所述預設位數(shù)集合中選取所述哈希特征值對應的位數(shù);根據(jù)所述預設位數(shù)集合中的各預設位數(shù)和所述位數(shù)確定段落位數(shù);根據(jù)所述段落位數(shù)確定所述哈希特征值對應的分段段數(shù)。
59、可選地,所述特征值分段模塊,還用于獲取所述預設圖標文件集合中的所有預設圖標文件對應的預設圖標尺寸集合;從所述預設圖標尺寸集合中選取所述待檢測應用圖標對應的圖標尺寸;根據(jù)所述預設圖標尺寸集合中的各預設圖標尺寸和所述圖標尺寸確定分段尺寸;根據(jù)所述分段尺寸確定所述哈希特征值對應的分段段數(shù)。
60、可選地,所述特征值分段模塊,還用于從所述預設哈希特征值集合中選取所述標準應用圖標對應的標準哈希特征值;根據(jù)所述分段段數(shù)和所述標準哈希特征值確定標準分段段數(shù);根據(jù)所述標準分段段數(shù)對所述標準哈希特征值進行分段,獲得多段第二特征值。
61、此外,為實現(xiàn)上述目的,本發(fā)明還提出一種應用圖標的相似性檢測設備,所述應用圖標的相似性檢測設備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的應用圖標的相似性檢測程序,所述應用圖標的相似性檢測程序配置為實現(xiàn)如上文所述的應用圖標的相似性檢測方法的步驟。
62、此外,為實現(xiàn)上述目的,本發(fā)明還提出一種存儲介質(zhì),所述存儲介質(zhì)上存儲有應用圖標的相似性檢測程序,所述應用圖標的相似性檢測程序被處理器執(zhí)行時實現(xiàn)如上文所述的應用圖標的相似性檢測方法的步驟。
63、本發(fā)明通過對待檢測應用圖標的哈希特征值進行分段,獲得多段第一特征值,然后獲取標準應用圖標的標準哈希特征值對應的多段第二特征值,然后按分段索引方式對多段第一特征值和多段第二特征值進行特征值匹配,再根據(jù)匹配結果對待檢測應用圖標和標準應用圖標進行相似性檢測。相較于現(xiàn)有的需要計算待檢測應用圖標和標準應用圖標之間的海明距離,本發(fā)明上述方式通過對待檢測應用圖標的哈希特征值和標準應用圖標的標準哈希特征值分別進行分段,并根據(jù)多段第一特征值和多段第二特征值之間的匹配結果進行相似性檢測,從而簡單有效地對應用圖標進行相似性檢測,提高相似性檢測的效率。