本技術(shù)屬于數(shù)據(jù)處理,尤其涉及一種互聯(lián)網(wǎng)資源信息的識(shí)別方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品。
背景技術(shù):
1、互聯(lián)網(wǎng)資源信息是安全運(yùn)營(yíng)工作開展的重要支撐,隨著互聯(lián)網(wǎng)的快速發(fā)展,不同組織(如企業(yè))的互聯(lián)網(wǎng)資源信息也越來越多,種類也越來越多。很有可能存在不在組織管控范圍內(nèi)的互聯(lián)網(wǎng)資源信息,而對(duì)于這些互聯(lián)網(wǎng)資源信息,面臨著極大地安全威脅,因此如何準(zhǔn)確地識(shí)別出組織的互聯(lián)網(wǎng)資源信息,將互聯(lián)網(wǎng)資源信息納入組織的管控范圍內(nèi)是至關(guān)重要的。
2、現(xiàn)有技術(shù)中,主要利用文本匹配的方式對(duì)組織內(nèi)網(wǎng)或外部的互聯(lián)網(wǎng)資源信息進(jìn)行識(shí)別,對(duì)互聯(lián)網(wǎng)資源信息的識(shí)別不準(zhǔn)確,容易出現(xiàn)遺漏。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供一種互聯(lián)網(wǎng)資源信息的識(shí)別方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品,通過圖片匹配,即通過互聯(lián)網(wǎng)資源信息中的第一圖片和預(yù)設(shè)圖片庫中的第二圖片的相似度,以及互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖和預(yù)設(shè)圖片庫中的第二首頁截圖的相似度,識(shí)別與預(yù)設(shè)圖片庫中的圖片相似度較高的目標(biāo)圖片,目標(biāo)圖片對(duì)應(yīng)的目標(biāo)互聯(lián)網(wǎng)資源信息為識(shí)別出的互聯(lián)網(wǎng)資源信息,避免了通過文本識(shí)別時(shí)識(shí)別不全面、容易出現(xiàn)遺漏的問題,提高了互聯(lián)網(wǎng)資源信息識(shí)別的準(zhǔn)確性。
2、第一方面,本技術(shù)實(shí)施例提供一種互聯(lián)網(wǎng)資源信息的識(shí)別方法,包括:
3、獲取互聯(lián)網(wǎng)資源信息列表,互聯(lián)網(wǎng)資源信息列表包括至少一個(gè)互聯(lián)網(wǎng)資源信息;
4、識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中的第一圖片,并截取目標(biāo)互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖,目標(biāo)互聯(lián)網(wǎng)資源信息為至少一個(gè)互聯(lián)網(wǎng)資源信息中的任意一個(gè);
5、確定預(yù)設(shè)圖片庫中的第二圖片與第一圖片的圖片相似度,以及預(yù)設(shè)圖片庫中的第二首頁截圖與第一首頁截圖的首頁相似度;
6、在圖片相似度大于第一預(yù)設(shè)值,或者首頁相似度大于第二預(yù)設(shè)值的情況下,生成第一識(shí)別結(jié)果,第一識(shí)別結(jié)果包括目標(biāo)互聯(lián)網(wǎng)資源信息的標(biāo)識(shí)、圖片相似度和首頁相似度,以及第二圖片和第二首頁截圖。
7、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,第一識(shí)別結(jié)果還包括第二圖片對(duì)應(yīng)的第一文本信息和第二首頁截圖對(duì)應(yīng)的第二文本信息;在識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中的第一圖片,并截取目標(biāo)互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖之前,方法還包括:
8、識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中第一預(yù)設(shè)位置的第三文本信息和第二預(yù)設(shè)位置的第四文本信息;
9、確定預(yù)設(shè)圖片庫中的第二圖片對(duì)應(yīng)的第一文本信息和第三文本信息的第一文本相似度,以及預(yù)設(shè)圖片庫中的第二首頁截圖對(duì)應(yīng)的第二文本信息和第四文本信息的第二文本相似度;
10、識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中的第一圖片,并截取目標(biāo)互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖,包括:
11、在第一文本相似度小于第三預(yù)設(shè)值,且第二文本相似度小于第四預(yù)設(shè)值的情況下,識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中的第一圖片,并截取目標(biāo)互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖。
12、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,還包括:
13、在第一文本相似度不小于第三預(yù)設(shè)值,或者第二文本相似度不小于第四預(yù)設(shè)值的情況下,生成第二識(shí)別結(jié)果,第二識(shí)別結(jié)果包括目標(biāo)互聯(lián)網(wǎng)資源信息的標(biāo)識(shí)、第一文本相似度和第二文本相似度,以及第一文本信息和第二文本信息。
14、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,在獲取互聯(lián)網(wǎng)資源信息列表之前,方法還包括:
15、獲取預(yù)設(shè)組織的預(yù)設(shè)互聯(lián)網(wǎng)資源信息;
16、識(shí)別預(yù)設(shè)互聯(lián)網(wǎng)資源信息中的第三圖片和預(yù)設(shè)互聯(lián)網(wǎng)資源信息的首頁的第三首頁截圖,第三圖片包括第二圖片,第三首頁截圖包括第二首頁截圖;
17、構(gòu)建預(yù)設(shè)圖片庫,預(yù)設(shè)圖片庫包第三圖片和第三首頁截圖。
18、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,第三圖片包括預(yù)設(shè)組織的徽標(biāo)、預(yù)設(shè)組織的名稱、預(yù)設(shè)組織的子組織的徽標(biāo)和預(yù)設(shè)組織的子組織的名稱中的至少一項(xiàng)。
19、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,在圖片相似度大于第一預(yù)設(shè)值,或者首頁相似度大于第二預(yù)設(shè)值的情況下,生成第一識(shí)別結(jié)果之后,方法還包括:
20、顯示第一識(shí)別結(jié)果。
21、第二方面,本技術(shù)實(shí)施例提供了一種互聯(lián)網(wǎng)資源信息的識(shí)別裝置,包括:
22、獲取模塊,用于獲取互聯(lián)網(wǎng)資源信息列表,互聯(lián)網(wǎng)資源信息列表包括至少一個(gè)互聯(lián)網(wǎng)資源信息;
23、識(shí)別模塊,用于識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中的第一圖片,并截取目標(biāo)互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖,目標(biāo)互聯(lián)網(wǎng)資源信息為至少一個(gè)互聯(lián)網(wǎng)資源信息中的任意一個(gè);
24、確定模塊,用于確定預(yù)設(shè)圖片庫中的第二圖片與第一圖片的圖片相似度,以及預(yù)設(shè)圖片庫中的第二首頁截圖與第一首頁截圖的首頁相似度;
25、生成模塊,用于在圖片相似度大于第一預(yù)設(shè)值,或者首頁相似度大于第二預(yù)設(shè)值的情況下,生成第一識(shí)別結(jié)果,第一識(shí)別結(jié)果包括目標(biāo)互聯(lián)網(wǎng)資源信息的標(biāo)識(shí)、圖片相似度和首頁相似度,以及第二圖片和第二首頁截圖。
26、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,第一識(shí)別結(jié)果還包括第二圖片對(duì)應(yīng)的第一文本信息和第二首頁截圖對(duì)應(yīng)的第二文本信息;裝置還包括:
27、識(shí)別模塊,還用于在識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中的第一圖片,并截取目標(biāo)互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖之前,識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中第一預(yù)設(shè)位置的第三文本信息和第二預(yù)設(shè)位置的第四文本信息;
28、確定模塊,還用于確定預(yù)設(shè)圖片庫中的第二圖片對(duì)應(yīng)的第一文本信息和第三文本信息的第一文本相似度,以及預(yù)設(shè)圖片庫中的第二首頁截圖對(duì)應(yīng)的第二文本信息和第四文本信息的第二文本相似度;
29、識(shí)別模塊具體用于在第一文本相似度小于第三預(yù)設(shè)值,且第二文本相似度小于第四預(yù)設(shè)值的情況下,識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中的第一圖片,并截取目標(biāo)互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖。
30、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,還包括:
31、生成模塊,還用于在第一文本相似度不小于第三預(yù)設(shè)值,或者第二文本相似度不小于第四預(yù)設(shè)值的情況下,生成第二識(shí)別結(jié)果,第二識(shí)別結(jié)果包括目標(biāo)互聯(lián)網(wǎng)資源信息的標(biāo)識(shí)、第一文本相似度和第二文本相似度,以及第一文本信息和第二文本信息。
32、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,裝置還包括:
33、獲取模塊,還用于在獲取互聯(lián)網(wǎng)資源信息列表之前,獲取預(yù)設(shè)組織的預(yù)設(shè)互聯(lián)網(wǎng)資源信息;
34、識(shí)別模塊,還用于識(shí)別預(yù)設(shè)互聯(lián)網(wǎng)資源信息中的第三圖片和預(yù)設(shè)互聯(lián)網(wǎng)資源信息的首頁的第三首頁截圖,第三圖片包括第二圖片,第三首頁截圖包括第二首頁截圖;
35、構(gòu)建模塊,用于構(gòu)建預(yù)設(shè)圖片庫,預(yù)設(shè)圖片庫包第三圖片和第三首頁截圖。
36、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,第三圖片包括預(yù)設(shè)組織的徽標(biāo)、預(yù)設(shè)組織的名稱、預(yù)設(shè)組織的子組織的徽標(biāo)和預(yù)設(shè)組織的子組織的名稱中的至少一項(xiàng)。
37、在一個(gè)可能實(shí)現(xiàn)的實(shí)施例中,裝置還包括:
38、顯示模塊,用于在圖片相似度大于第一預(yù)設(shè)值,或者首頁相似度大于第二預(yù)設(shè)值的情況下,生成第一識(shí)別結(jié)果之后,顯示第一識(shí)別結(jié)果。
39、第三方面,本技術(shù)實(shí)施例提供了一種電子設(shè)備,設(shè)備包括:
40、處理器以及存儲(chǔ)有計(jì)算機(jī)程序指令的存儲(chǔ)器;
41、處理器執(zhí)行計(jì)算機(jī)程序指令時(shí)實(shí)現(xiàn)上述任意一項(xiàng)的互聯(lián)網(wǎng)資源信息的識(shí)別方法。
42、第四方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序指令,計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任意一項(xiàng)的互聯(lián)網(wǎng)資源信息的識(shí)別方法。
43、第五方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,計(jì)算機(jī)程序產(chǎn)品中的指令由電子設(shè)備的處理器執(zhí)行時(shí),使得電子設(shè)備能夠執(zhí)行上述任意一項(xiàng)的互聯(lián)網(wǎng)資源信息的識(shí)別方法。
44、本技術(shù)實(shí)施例的互聯(lián)網(wǎng)資源信息的識(shí)別方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品,該方法包括:獲取互聯(lián)網(wǎng)資源信息列表,互聯(lián)網(wǎng)資源信息列表包括至少一個(gè)互聯(lián)網(wǎng)資源信息;識(shí)別目標(biāo)互聯(lián)網(wǎng)資源信息中的第一圖片,并截取目標(biāo)互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖,目標(biāo)互聯(lián)網(wǎng)資源信息為至少一個(gè)互聯(lián)網(wǎng)資源信息中的任意一個(gè);確定預(yù)設(shè)圖片庫中的第二圖片與第一圖片的圖片相似度,以及預(yù)設(shè)圖片庫中的第二首頁截圖與第一首頁截圖的首頁相似度;在圖片相似度大于第一預(yù)設(shè)值,或者首頁相似度大于第二預(yù)設(shè)值的情況下,生成第一識(shí)別結(jié)果,第一識(shí)別結(jié)果包括目標(biāo)互聯(lián)網(wǎng)資源信息的標(biāo)識(shí)、圖片相似度和首頁相似度,以及第二圖片和第二首頁截圖。這樣,通過圖片匹配,即通過互聯(lián)網(wǎng)資源信息中的第一圖片和預(yù)設(shè)圖片庫中的第二圖片的相似度,以及互聯(lián)網(wǎng)資源信息的首頁的第一首頁截圖和預(yù)設(shè)圖片庫中的第二首頁截圖的相似度,識(shí)別與預(yù)設(shè)圖片庫中的圖片相似度較高的目標(biāo)圖片,目標(biāo)圖片對(duì)應(yīng)的目標(biāo)互聯(lián)網(wǎng)資源信息為識(shí)別出的互聯(lián)網(wǎng)資源信息,避免了通過文本識(shí)別時(shí)識(shí)別不全面、容易出現(xiàn)遺漏的問題,提高了互聯(lián)網(wǎng)資源信息識(shí)別的準(zhǔn)確性。