技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明涉及一種基于密度和擴(kuò)展網(wǎng)格的數(shù)據(jù)流聚類方法,利用Spark并行計(jì)算平臺,對傳統(tǒng)的數(shù)據(jù)流聚類算法進(jìn)行了分析和改進(jìn),提出了基于密度和擴(kuò)展網(wǎng)格的數(shù)據(jù)流聚類算法,改進(jìn)了人工設(shè)置聚類參數(shù)的缺陷,可以得到任何形狀的聚類,算法基本步驟如下:1、采用每個采樣點(diǎn)的局部密度和與其他采樣點(diǎn)的距離,確定了網(wǎng)格中的聚類中心數(shù),自動確定聚類中心,避免了初始質(zhì)心選取不當(dāng)對聚類結(jié)果的影響;2、網(wǎng)格聚類以外的數(shù)據(jù)點(diǎn),通過擴(kuò)展網(wǎng)格,擴(kuò)展了網(wǎng)格內(nèi)的聚類,確保了聚類的準(zhǔn)確性;3、引入相鄰密度估計(jì)與網(wǎng)格邊界實(shí)現(xiàn)網(wǎng)格的合并,節(jié)省內(nèi)存消耗;4、采用衰減因子實(shí)時更新網(wǎng)格密度,反應(yīng)空間數(shù)據(jù)流的演變過程。
技術(shù)研發(fā)人員:杜韜;華崢;牟國棟;曲守寧;張坤;朱連江;王欽
受保護(hù)的技術(shù)使用者:濟(jì)南大學(xué)
技術(shù)研發(fā)日:2017.06.28
技術(shù)公布日:2017.10.20