技術(shù)編號(hào):12733658
提示:您尚未登錄,請點(diǎn) 登 陸 后下載,如果您還沒有賬戶請點(diǎn) 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明屬于數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其涉及一種互聯(lián)網(wǎng)文本數(shù)據(jù)聚類方法及系統(tǒng)。背景技術(shù)隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)挖掘領(lǐng)域中面臨的數(shù)據(jù)變得越來越復(fù)雜。尤其是互聯(lián)網(wǎng)文本數(shù)據(jù),除了數(shù)量巨大之外,由矢量空間模型(VectorSpaceModel)構(gòu)建的文本數(shù)據(jù)還具有超高的維度和稀疏度,現(xiàn)有的數(shù)據(jù)挖掘聚類算法,如k-means、層次聚類、普聚類等應(yīng)用于文本聚類時(shí),普遍存在不足和局限。針對(duì)高維稀疏數(shù)據(jù)的子空間聚類問題,學(xué)術(shù)界提出了許多相關(guān)的子空間聚類算法(SubspaceClustering),軟子空間聚類算法是其...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。