技術編號:6354330
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。網(wǎng)頁分塊標注方法與系統(tǒng)本發(fā)明涉及一種網(wǎng)頁分塊標注方法與系統(tǒng),特別涉及一種基于機器訓練的網(wǎng)頁分塊標注方法與系統(tǒng)。背景技術目前,互聯(lián)網(wǎng)不斷發(fā)展,信息量劇增,對信息進行篩選時耗時費力,搜索引擎對于主題網(wǎng)頁分類的要求也日趨迫切。一般而言,各個網(wǎng)頁總是包含豐富而復雜的信息,例如導航、標題、翻頁、廣告、版權(quán)等等。當用戶為了獲取所需信息而通過搜索引擎抓取網(wǎng)頁或建立索引時,需要對網(wǎng)頁進行較為精細的分析。通過對網(wǎng)頁進行分塊標注的方法,可以實現(xiàn)對網(wǎng)頁分類。傳統(tǒng)地,對網(wǎng)頁進行分...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權(quán),增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。