亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

網(wǎng)頁視覺相似度識別方法與流程

文檔序號:11865197閱讀:來源:國知局

技術(shù)特征:

1.一種網(wǎng)頁視覺相似度識別方法,其特征在于,所述網(wǎng)頁視覺相似度識別方法包括如下步驟:

S1、確認目標(biāo)網(wǎng)站是否存在,如存在,執(zhí)行步驟S2;

S2、根據(jù)網(wǎng)站的網(wǎng)頁生成快照,并將快照數(shù)據(jù)保存于數(shù)據(jù)庫中;

S3、對所述快照數(shù)據(jù)中的文字數(shù)據(jù)和圖像數(shù)據(jù)進行分離,根據(jù)分離的文字數(shù)據(jù)和圖像數(shù)據(jù)分別生成文字數(shù)據(jù)的特征向量和和圖像數(shù)據(jù)的特征向量;

S4、將得到的文字數(shù)據(jù)的特征向量和和圖像數(shù)據(jù)的特征向量,與數(shù)據(jù)庫中的已保存的頁面圖片的特征向量進行兩兩對比,獲得兩張圖片之間的相似度信息。

2.根據(jù)權(quán)利要求1所述的網(wǎng)頁視覺相似度識別方法,其特征在于,步驟S1中,通過網(wǎng)址或ip的掃描方式確認目標(biāo)網(wǎng)站是否存在。

3.根據(jù)權(quán)利要求1所述的網(wǎng)頁視覺相似度識別方法,其特征在于,步驟S2中,通過網(wǎng)站的網(wǎng)頁url,獲得網(wǎng)頁的頁面,對頁面生成快照,并將快照數(shù)據(jù)保存于數(shù)據(jù)庫中。

4.根據(jù)權(quán)利要求1所述的網(wǎng)頁視覺相似度識別方法,其特征在于,步驟S3中,對所述快照數(shù)據(jù)進行ocr文字識別,根據(jù)文字識別的結(jié)果,將文字數(shù)據(jù)提取出來。

5.根據(jù)權(quán)利要求4所述的網(wǎng)頁視覺相似度識別方法,其特征在于,所述文字數(shù)據(jù)包括文字內(nèi)容和位置信息。

6.根據(jù)權(quán)利要求1所述的網(wǎng)頁視覺相似度識別方法,其特征在于,步驟S3中,根據(jù)網(wǎng)頁頁面的特征,對快照進行切割,根據(jù)切割后的子圖片,生成圖像數(shù)據(jù)的特征向量。

7.根據(jù)權(quán)利要求6所述的網(wǎng)頁視覺相似度識別方法,其特征在于,根據(jù)網(wǎng)頁頁面的特征,對快照進行切割,針對切割后的任一子圖片,獲得其像素點信息以及其與相鄰子圖片之間的邊界變化信息組成的數(shù)組,根據(jù)所述像素點信息和邊界變化信息組成的數(shù)組,生成圖像數(shù)據(jù)的特征向量。

8.根據(jù)權(quán)利要求1所述的網(wǎng)頁視覺相似度識別方法,其特征在于,步驟S4中,將得到的文字數(shù)據(jù)的特征向量和和圖像數(shù)據(jù)的特征向量,與數(shù)據(jù)庫中的已保存的頁面圖片的特征向量進行兩兩對比,判斷二者特征向量差的模是否大于閾值,根據(jù)判斷結(jié)果,獲得兩張圖片之間的相似度信息。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1