1.一種基于非易失性存儲(chǔ)器的頻繁模式挖掘方法,其特征是,包括以下步驟:
步驟1、利用多核系統(tǒng)對(duì)頻繁模式樹進(jìn)行并行構(gòu)建
先將數(shù)據(jù)庫中的多條交易記錄大致均勻地分配到每個(gè)核中,利用CN106250549A記載的方法,在每一個(gè)核上構(gòu)建一棵本地頻繁模式樹;
步驟2、對(duì)步驟1所構(gòu)建的頻繁模式樹進(jìn)行合并
將本地頻繁模式樹的信息搜集起來,合并成一棵大的全局頻繁模式樹。
2.根據(jù)權(quán)利要求1所述的基于非易失性存儲(chǔ)器的頻繁模式挖掘方法,其特征是:在所述步驟1中,構(gòu)建本地頻繁模式樹時(shí),采用左孩子右兄弟鏈表結(jié)構(gòu);在所述步驟2中,包括以下步驟:
步驟(1)、從根結(jié)點(diǎn)出發(fā),將樹1的根結(jié)點(diǎn)的最末孩子結(jié)點(diǎn)的兄弟指針指向樹2的根結(jié)點(diǎn)的第一個(gè)孩子結(jié)點(diǎn);
步驟(2)、利用所建立的哈希表查找樹1和樹2根結(jié)點(diǎn)的孩子結(jié)點(diǎn)中是否存在相同結(jié)點(diǎn),如存在,用T1和T2分別表示樹1和樹2中相同的結(jié)點(diǎn),然后執(zhí)行步驟(3);如不存在,則執(zhí)行步驟(5);
步驟(3)、T1計(jì)數(shù)域的值=T1計(jì)數(shù)域的值+T2計(jì)數(shù)域的值,并將T2結(jié)點(diǎn)從該鏈表中刪除;
步驟(4)、將T1和T2分別作為樹1和樹2的根結(jié)點(diǎn),返回步驟(1);
步驟(5)、結(jié)束程序。
3.根據(jù)權(quán)利要求1或2所述的基于非易失性存儲(chǔ)器的頻繁模式挖掘方法,其特征是:在所述步驟1中,在構(gòu)建頻繁模式初始樹過程中創(chuàng)建新節(jié)點(diǎn)時(shí),為根結(jié)點(diǎn)T以下的孩子結(jié)點(diǎn)建立了哈希表。