1.一種基于頻繁稠密模式對圖數(shù)據(jù)進行分類的方法,其特征在于,包括如下步驟:
步驟一、從圖數(shù)據(jù)集中挖掘頻繁稠密模式;
步驟二、從眾多的頻繁稠密模式中選擇出擁有較高判別性的頻繁稠密模式,作為判別性頻繁稠密模式;
步驟三、基于判別性頻繁稠密模式構(gòu)建特征矩陣,然后使用支持向量機訓練分類器。訓練出的分類器可用于對圖進行分類;
步驟四、對未知類型的圖,使用步驟四訓練出的分類器對其進行分類。
2.如權利要求1所述的一種基于頻繁稠密模式對圖數(shù)據(jù)進行分類的方法,其特征在于:所述步驟一中,在頻繁稠密模式的挖掘過程中,構(gòu)建出一棵深度優(yōu)先搜索樹對所有的頻繁稠密模式進行搜索,判斷其是否滿足頻繁度條件。在搜索過程中,使用頻繁稠密模式的Apriori性質(zhì),也就是一個頻繁稠密模式的頻繁度不低于基于它衍生出的任意頻繁稠密模式的頻繁度。這樣,如果已經(jīng)判斷一個頻繁稠密模式不是頻繁稠密模式,則可以判斷它的衍生的任意頻繁稠密模式都不是頻繁稠密模式,也就可以直接將這些頻繁稠密模式進行剪枝,不需要再對它們進行搜索。這可以大大加快頻繁稠密模式的搜索過程。
3.如權利要求1所述的一種基于頻繁稠密模式對圖數(shù)據(jù)進行分類的方法,其特征在于:所述步驟二中,從數(shù)量眾多的頻繁稠密模式中挑選出判別性較高的頻繁稠密模式時,使用Ratio Score函數(shù)來衡量頻繁稠密模式的判別性。一個頻繁稠密模式的Ratio Score得分越高,證明它的判別性越強,反之亦然。然后,挑選出Ratio Score得分最高的前n個頻繁稠密模式做為判別性頻繁稠密模式。
4.如權利要求1所述的一種基于頻繁稠密模式對圖數(shù)據(jù)進行分類的方法,其特征在于:所述步驟三中,利用步驟四挑選出的判別性頻繁稠密模式,為每一個圖數(shù)據(jù)構(gòu)建出一個特征向量,最后將所有圖數(shù)據(jù)的特征向量結(jié)合在一起,構(gòu)建出特征矩陣。然后,使用支持向量機(SVM)訓練出分類器。訓練好的分類器可以實現(xiàn)對圖數(shù)據(jù)的分類。
5.如權利要求1所述的一種基于頻繁稠密模式對圖數(shù)據(jù)進行分類的方法,其特征在于:所述步驟四中,對于一個未知類別的圖數(shù)據(jù),在構(gòu)建好圖數(shù)據(jù)之后,使用步驟三選擇出的判別性圖數(shù)據(jù)構(gòu)建特征向量。然后使用步驟四訓練好的分類器,對其進行分類,預測出該圖數(shù)據(jù)的類別。