技術(shù)編號(hào):6483232
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明屬于計(jì)算機(jī)互聯(lián)網(wǎng)信息檢索和分析技術(shù),具體涉及一種基于并 行編程模式的相似網(wǎng)頁去重系統(tǒng),該系統(tǒng)是對(duì)現(xiàn)有的相似網(wǎng)頁去重系統(tǒng)的 改進(jìn),結(jié)合現(xiàn)有的網(wǎng)頁結(jié)構(gòu)與主題內(nèi)容分析技術(shù),提取網(wǎng)頁的特征向量, 使用基于并行模式的網(wǎng)頁指紋去重算法,在分布式系統(tǒng)環(huán)境中完成相似網(wǎng) 頁的去重功能,提高搜索引擎索引模塊和檢索模塊的效率。背景技術(shù)隨著近年來互聯(lián)網(wǎng)技術(shù)和規(guī)模的空前發(fā)展,越來越多的傳統(tǒng)資源正在向Internet上遷移,搜索引擎因其強(qiáng)大而不失方便的檢索功能成為當(dāng)今用戶 進(jìn)行...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請(qǐng)注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。