1.一種數(shù)據(jù)挖掘隱私保護方法,其特征在于,包括:
獲取原始數(shù)據(jù)集;
對所述原始數(shù)據(jù)集中的連續(xù)屬性進行離散化,得到第一處理后數(shù)據(jù)集;
對所述第一處理后數(shù)據(jù)集中的屬性進行約簡處理,得到第二處理后數(shù)據(jù)集;
對所述第二處理后數(shù)據(jù)集中的屬性進行完全泛化處理,得到相應(yīng)的細分方案集;
對所述細分方案集展開相應(yīng)的決策樹構(gòu)建操作,得到相應(yīng)的目標決策樹;
利用所述目標決策樹,對數(shù)據(jù)挖掘過程展開隱私保護。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)挖掘隱私保護方法,其特征在于,所述對所述原始數(shù)據(jù)集中的連續(xù)屬性進行離散化的過程,包括:
利用斷點法,對所述原始數(shù)據(jù)集中的連續(xù)屬性進行離散化處理,得到所述第一處理后數(shù)據(jù)集。
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)挖掘隱私保護方法,其特征在于,所述對所述第一處理后數(shù)據(jù)集中的屬性進行約簡處理的過程,包括:
創(chuàng)建與所述第一處理后數(shù)據(jù)集對應(yīng)的可辨識矩陣;
基于所述可辨識矩陣,對所述第一處理后數(shù)據(jù)集中的屬性展開約簡處理,得到所述第二處理后數(shù)據(jù)集。
4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)挖掘隱私保護方法,其特征在于,所述對所述第二處理后數(shù)據(jù)集中的屬性進行完全泛化處理的過程,包括:
對所述第二處理后數(shù)據(jù)集中數(shù)值型的離散屬性進行直接泛化,并對所述第二處理后數(shù)據(jù)集中非數(shù)值型的離散屬性進行逐級泛化,得到所述細分方案集。
5.根據(jù)權(quán)利要求4所述的數(shù)據(jù)挖掘隱私保護方法,其特征在于,所述對所述細分方案集展開相應(yīng)的決策樹構(gòu)建操作的過程,包括:
利用差分隱私的指數(shù)機制,對所述細分方案集展開相應(yīng)的決策樹構(gòu)建操作,得到所述目標決策樹。
6.一種數(shù)據(jù)挖掘隱私保護系統(tǒng),其特征在于,包括:
數(shù)據(jù)集獲取模塊,用于獲取原始數(shù)據(jù)集;
屬性離散化模塊,用于對所述原始數(shù)據(jù)集中的連續(xù)屬性進行離散化,得到第一處理后數(shù)據(jù)集;
屬性約簡模塊,用于對所述第一處理后數(shù)據(jù)集中的屬性進行約簡處理,得到第二處理后數(shù)據(jù)集;
屬性泛化模塊,用于對所述第二處理后數(shù)據(jù)集中的屬性進行完全泛化處理,得到相應(yīng)的細分方案集;
決策樹構(gòu)建模塊,用于對所述細分方案集展開相應(yīng)的決策樹構(gòu)建操作,得到相應(yīng)的目標決策樹;
隱私保護模塊,用于利用所述目標決策樹,對數(shù)據(jù)挖掘過程展開隱私保護。
7.根據(jù)權(quán)利要求6所述的數(shù)據(jù)挖掘隱私保護系統(tǒng),其特征在于,
所述屬性離散化模塊,具體用于利用斷點法,對所述原始數(shù)據(jù)集中的連續(xù)屬性進行離散化處理,得到所述第一處理后數(shù)據(jù)集。
8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)挖掘隱私保護系統(tǒng),其特征在于,
所述屬性約簡模塊,具體用于創(chuàng)建與所述第一處理后數(shù)據(jù)集對應(yīng)的可辨識矩陣,然后基于所述可辨識矩陣,對所述第一處理后數(shù)據(jù)集中的屬性展開約簡處理,得到所述第二處理后數(shù)據(jù)集。
9.根據(jù)權(quán)利要求8所述的數(shù)據(jù)挖掘隱私保護系統(tǒng),其特征在于,
所述屬性泛化模塊,具體用于對所述第二處理后數(shù)據(jù)集中數(shù)值型的離散屬性進行直接泛化,并對所述第二處理后數(shù)據(jù)集中非數(shù)值型的離散屬性進行逐級泛化,得到所述細分方案集。
10.根據(jù)權(quán)利要求9所述的數(shù)據(jù)挖掘隱私保護系統(tǒng),其特征在于,
所述決策樹構(gòu)建模塊,具體用于利用差分隱私的指數(shù)機制,對所述細分方案集展開相應(yīng)的決策樹構(gòu)建操作,得到所述目標決策樹。