網絡爬蟲識別方法和裝置與流程

文檔序號：12363799閱讀：來源：國知局

技術總結
本申請?zhí)岢鲆环N網絡爬蟲識別方法和裝置，該網絡爬蟲識別方法包括：接收客戶端在網頁渲染完畢后發(fā)送的所述網頁的圖片和所述網頁的URL；根據所述URL獲取樣本圖片；根據相似度與預設閾值的比較，識別所述客戶端是否為網絡爬蟲，所述相似度為所述網頁的圖片與所述樣本圖片的相似度。本申請對網絡爬蟲識別的可靠性較高，不影響正常用戶瀏覽網頁的流暢性，并且即便網絡爬蟲破解了上述識別方法，也會極大的消耗網絡爬蟲自身的資源，降低網絡爬蟲訪問網頁的頻率。

技術研發(fā)人員：周高明
受保護的技術使用者：阿里巴巴集團控股有限公司
文檔號碼：201510250481
技術研發(fā)日：2015.05.15
技術公布日：2017.01.04

完整全部詳細技術資料下載

當前第3頁1 2 3

相關技術