技術總結
本申請?zhí)岢鲆环N網絡爬蟲識別方法和裝置,該網絡爬蟲識別方法包括:接收客戶端在網頁渲染完畢后發(fā)送的所述網頁的圖片和所述網頁的URL;根據所述URL獲取樣本圖片;根據相似度與預設閾值的比較,識別所述客戶端是否為網絡爬蟲,所述相似度為所述網頁的圖片與所述樣本圖片的相似度。本申請對網絡爬蟲識別的可靠性較高,不影響正常用戶瀏覽網頁的流暢性,并且即便網絡爬蟲破解了上述識別方法,也會極大的消耗網絡爬蟲自身的資源,降低網絡爬蟲訪問網頁的頻率。
技術研發(fā)人員:周高明
受保護的技術使用者:阿里巴巴集團控股有限公司
文檔號碼:201510250481
技術研發(fā)日:2015.05.15
技術公布日:2017.01.04