技術編號:11458665
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明屬于計算機網(wǎng)絡技術領域,特別是涉及一種基于內(nèi)嵌瀏覽器的可視化網(wǎng)絡爬蟲系統(tǒng)及分析方法。背景技術網(wǎng)絡爬蟲是一種高效的信息抓取工具,它集成了搜索引擎技術,并通過技術手段進行優(yōu)化,用以從互聯(lián)網(wǎng)搜索、抓取并保存任何通過HTML超文本標記語言進行標準化的網(wǎng)頁信息。網(wǎng)絡爬蟲分為通用網(wǎng)絡爬蟲如谷歌、百度瀏覽器和主題網(wǎng)絡爬蟲等。由于通用網(wǎng)絡爬蟲的檢索效果不理想,準確率和召回率都很低,所以主題網(wǎng)絡爬蟲逐漸成為專業(yè)用戶及研究人員的首選。主題網(wǎng)絡爬蟲主要采用最佳優(yōu)先抓取策略,即按照一定的網(wǎng)頁評價算法,計算網(wǎng)頁與主...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。