技術(shù)編號:11514787
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及數(shù)據(jù)處理方法、裝置及終端。背景技術(shù)隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,互聯(lián)網(wǎng)中的數(shù)據(jù)呈爆發(fā)式增長,為了提升數(shù)據(jù)處理速度,可以采用多線程技術(shù)進(jìn)行數(shù)據(jù)處理。以網(wǎng)絡(luò)爬蟲為例,網(wǎng)絡(luò)爬蟲是一個自動提取網(wǎng)頁的程序,它為搜索引擎從萬維網(wǎng)上下載網(wǎng)頁,是搜索引擎的重要組成。在傳統(tǒng)網(wǎng)頁爬取技術(shù)中,為了提升網(wǎng)頁爬取速度,往往采用多線程技術(shù)進(jìn)行爬取。其中每個線程各自負(fù)責(zé)網(wǎng)頁數(shù)據(jù)的解析和持久化,例如采用三個線程進(jìn)行網(wǎng)頁爬取,第一線程對網(wǎng)頁數(shù)據(jù)進(jìn)行解析,并將解析得到的網(wǎng)頁數(shù)據(jù)寫入數(shù)據(jù)庫之后才可以釋放占用...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。