技術(shù)編號:6430436
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明屬于互聯(lián)網(wǎng)文本處理/數(shù)據(jù)挖掘領(lǐng)域,涉及利用數(shù)據(jù)挖掘相關(guān)技術(shù)分析網(wǎng)絡(luò)中主題文章與針對這些文章提出的眾多評論內(nèi)容之間相關(guān)度等方面。具體包含了利用向量空間模型,概率模型與語言模型進(jìn)行的針對主題文章與評論內(nèi)容相似性分析,以及評論內(nèi)容本身之間相關(guān)性的分析。背景技術(shù)Web2. 0時代是一個信息急速增長的時代,網(wǎng)民們能夠自由針對各種網(wǎng)絡(luò)新聞和博客做出各種評論,近幾年這些評論數(shù)據(jù)已經(jīng)達(dá)到了一個海量的規(guī)模。針對這些數(shù)據(jù)現(xiàn)在已經(jīng)有諸多數(shù)據(jù)挖掘方面的研究,如用戶評論提取與...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。