技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了分析新增企業(yè)與區(qū)域經(jīng)濟(jì)活躍度關(guān)聯(lián)性的數(shù)據(jù)挖掘方法,首先數(shù)據(jù)收集,采集某年地區(qū)注冊企業(yè)的注冊資金數(shù)據(jù)、注冊企業(yè)的數(shù)量數(shù)據(jù)、以及該地區(qū)該年份的GDP數(shù)據(jù)和新增就業(yè)情況數(shù)據(jù),每一個地區(qū)作為一個數(shù)據(jù)對象;數(shù)據(jù)預(yù)處理,用分箱法對數(shù)據(jù)進(jìn)行預(yù)處理,使數(shù)據(jù)為平滑數(shù)據(jù);再采用K?means算法進(jìn)行聚類分析;最后根據(jù)聚類將數(shù)據(jù)集分為k個類,按照所給企業(yè)數(shù)據(jù)對各個地方的經(jīng)濟(jì)進(jìn)行預(yù)測最終結(jié)果。通過指定k個初始聚類中心而不是隨機(jī)選取,消除了隨機(jī)選取初始聚類中心導(dǎo)致分組的不確定性;通過給予不同的數(shù)據(jù)維度一定的權(quán)重值,更好體現(xiàn)各維度對分組的影響,使分組更加準(zhǔn)確;加快算法的收斂程度,更快地得到分組結(jié)果。
技術(shù)研發(fā)人員:胡夏禹;施陽;劉培彬;陳建明;殷姚吉
受保護(hù)的技術(shù)使用者:蘇州朗動網(wǎng)絡(luò)科技有限公司
技術(shù)研發(fā)日:2017.06.08
技術(shù)公布日:2017.08.22