技術(shù)編號:6463280
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明涉及,特別涉及一種使用正則表達(dá)式 來智能解析互聯(lián)網(wǎng)內(nèi)容的方法。 背景技術(shù)互聯(lián)網(wǎng)內(nèi)容通常都以HTML的形式存在,如何從不規(guī)范的HTML中獲取我們 想要的規(guī)范化內(nèi)容一直是困擾很多IT技術(shù)人員的問題。 發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種采用正則表達(dá)式來解析互聯(lián)網(wǎng)內(nèi)容 的方法。本發(fā)明所述的,該方法至少包括如下的步驟步驟1添加抓取任務(wù),需要指定任務(wù)要抓取的條目列表所在Web頁面的 Url,并指定抓取的周期。步驟2針對每個抓取任務(wù),通過一種易擴(kuò)展的語法,...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。