技術總結
本發(fā)明公開了一種項集挖掘方法及裝置,屬于數(shù)據(jù)挖掘領域。所述方法包括:獲取自定義的多重最低效用閾值MMU表;MMU表中包括數(shù)據(jù)庫D中各個數(shù)據(jù)項與最低效用閾值的對應關系;計算數(shù)據(jù)庫D中項集的項集效用值;根據(jù)MMU表,計算數(shù)據(jù)庫D中各個項集各自對應的項集最低效用閾值MIU;項集中包含至少一個數(shù)據(jù)項;當項集效用值≥MIU時,將該項集確定為高效用項集HUI。本發(fā)明解決了現(xiàn)有的基于HUIM的算法中,都是將項集的項集效用值是否大于唯一的最低效用閾值作為衡量標準,導致挖掘出的HUI不準確的問題,達到了根據(jù)不同項集制定不同的HUI衡量標準,從而提高挖掘出的HUI準確性的效果。
技術研發(fā)人員:林?,|;王巨宏;管剛;陳偉;甘文生
受保護的技術使用者:哈爾濱工業(yè)大學深圳研究生院;騰訊科技(深圳)有限公司
文檔號碼:201510493081
技術研發(fā)日:2015.08.12
技術公布日:2017.02.22