技術(shù)總結(jié)
本發(fā)明公開一種網(wǎng)頁信息抽取方法,所述網(wǎng)頁信息抽取方法包括以下步驟:接收到信息抽取請求時,根據(jù)網(wǎng)頁中HTML元素建立節(jié)點樹;根據(jù)所述信息抽取請求中預(yù)設(shè)的配置信息在所述節(jié)點樹中確定待抽取信息的目標(biāo)位置;抽取所述目標(biāo)位置對應(yīng)的信息。本發(fā)明還公開一種網(wǎng)頁信息抽取裝置。本發(fā)明降低了信息抽取的操作難度。
技術(shù)研發(fā)人員:馬莘權(quán)
受保護(hù)的技術(shù)使用者:騰訊科技(深圳)有限公司
文檔號碼:201510395013
技術(shù)研發(fā)日:2015.07.07
技術(shù)公布日:2017.01.11