技術(shù)總結(jié)
本發(fā)明涉及一種基于稀疏均值的模糊聚類方法,將待聚類的文檔用向量空間模型表示為高維稀疏向量,設(shè)置參數(shù),初始化均值,基于當(dāng)前均值更新所有隸屬度的值,更新權(quán)重,然后基于隸屬度更新對應(yīng)的均值,當(dāng)對應(yīng)的均值不再變化或迭代次數(shù)最大時迭代結(jié)束,輸出聚類結(jié)果,否則重復(fù)。本發(fā)明通過稀疏均值使得均值也就是類中心點和樣本點一樣具有局域稀疏特性,增加基于樣本點和均值歐氏距離來描述樣本點和類相似性的有效性,在時間上更加高效,產(chǎn)生具有稀疏特性的均值使得類中心點更加自然地代表稀疏樣本點的特性,同時為了增加對均值的稀疏性的控制,還在目標(biāo)函數(shù)中加入均值范數(shù)的正則項以得到新的最小化目標(biāo)函數(shù),使得可以更加快速的求解。
技術(shù)研發(fā)人員:梅建萍
受保護的技術(shù)使用者:浙江工業(yè)大學(xué)
文檔號碼:201610629774
技術(shù)研發(fā)日:2016.08.02
技術(shù)公布日:2017.01.04