1.一種基于自適應(yīng)動態(tài)信息素的快速收斂蟻群分類方法,其特征在于,包括:
在蟻群搜索之前,設(shè)置指導(dǎo)所述蟻群的搜索行為的啟動因子;
在所述蟻群的路徑搜索過程中留置信息素信息,基于所述信息素信息通過設(shè)定的概率轉(zhuǎn)移函數(shù)搜索所述蟻群的下一步路徑;
在所述蟻群的全部路徑搜索完畢后,將整體距離最短的路徑確定為所述蟻群的最佳路徑。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的在蟻群搜索之前,設(shè)置指導(dǎo)所述蟻群的搜索行為的啟動因子,包括:
在蟻群搜索之前,設(shè)置指導(dǎo)所述蟻群的搜索行為的啟動因子為:
公式1中,|termij|表示目標(biāo)類別中第i個特征屬性取第j個值的樣例數(shù)目;|trainingsetij|表示所有分類類別,即整個訓(xùn)練集中第i個特征屬性取第j個值的樣例總數(shù)目。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的在所述蟻群的路徑搜索過程中留置信息素信息,包括:
1:在所述蟻群進(jìn)行路徑搜索之前,對信息素進(jìn)行初始化設(shè)置:
λij(0)表示在初始時刻,第i個特征屬性的第j個值的數(shù)據(jù)點上的信息素濃度,Mi和N分別代表第i個特征屬性的取值個數(shù)、特征屬性的個數(shù)
2:所述蟻群在一個路徑的搜索過程完成后,搜索下一個路徑之前,進(jìn)行動態(tài)的自適應(yīng)信息素更新,更新函數(shù)為:
所述表示原有信息素,所述Δλij表示新增信息素,所述表示更新后的信息素,α是信息素的揮發(fā)率,β表示信息留存率;
式中,x為螞蟻k走過的邊數(shù),d為螞蟻k走過的邊長,m為構(gòu)成蟻群的螞蟻總數(shù),Q為常數(shù)參量,p(i|1,2,...j)為通過引入路徑留存率模型來表示蟻群從屬性i選擇至位置j時的留存概率;
d(i,j)為本步蟻群走過的路徑長度,D(d(1,2,...i),d(1,2,3...j))為蟻群走過的歷史總長度的和;
對更新后的信息素進(jìn)行平滑處理,該平滑處理的公式如下:
所述表示第k+1次迭代時,平滑化之后的初始化新的信息素,所述代表第k次迭代后,特征屬性數(shù)據(jù)空間的老的信息素,上一次規(guī)則挖掘的結(jié)果對本次挖掘的影響由參數(shù)ε決定。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的基于所述信息素信息通過設(shè)定的概率轉(zhuǎn)移函數(shù)搜索所述蟻群的下一步路徑,包括:
設(shè)置轉(zhuǎn)移概率函數(shù)為指導(dǎo)螞蟻進(jìn)行路徑選擇的函數(shù),所述轉(zhuǎn)移概率函數(shù)的計算公式如下:
Pij(t)表示第i個屬性選擇第j個值的概率轉(zhuǎn)移值,其中,a、b表示在這個轉(zhuǎn)移過程中對于某條路徑的側(cè)重值,λij(t)表示t時刻的信息素,γij(t)表示啟動因子;
當(dāng)滿足給定的隨機(jī)數(shù)q<qm時,j=argmax{[λij(t)][γij(t)]}j∈allowd(t),當(dāng)滿足給定的隨機(jī)數(shù)q>qm的時候,按照概率轉(zhuǎn)移函數(shù)選擇j,將j加入列表,即按最大的轉(zhuǎn)移概率選擇下一步的路徑。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述的在所述蟻群的全部路徑搜索完畢后,將整體距離最短的路徑確定為所述蟻群的最佳路徑,包括:
在所述蟻群的全部路徑搜索完畢,即都完成了規(guī)則的構(gòu)建之后,將整體路徑長度最短的路徑確定為所述蟻群的最佳路徑,所述整體路徑長度l的計算公式如下:
d為螞蟻k走過的邊長,m為螞蟻總數(shù);
當(dāng)螞蟻選擇了最佳路徑之后,最后的信息素的全局更新為:
6.根據(jù)權(quán)利要求1至5任一項所述的方法,其特征在于,所述的方法還包括:
當(dāng)螞蟻完成一條規(guī)則的構(gòu)建后,要進(jìn)行規(guī)則的評價修剪,在進(jìn)行規(guī)則選取時,螞蟻對規(guī)則的評價函數(shù)值進(jìn)行排序,排序越靠前的規(guī)則分類能力越強(qiáng),反之越弱;將衡量分類質(zhì)量的規(guī)則的評價函數(shù)設(shè)計為如下公式:
TP表示規(guī)則前后都符合條件的樣本數(shù);FP表示符合分類規(guī)則不符合規(guī)則對應(yīng)條件的樣本數(shù);TN表示規(guī)則前后都不符合條件的樣本數(shù);FN表示不符合分類規(guī)則但滿足規(guī)則對應(yīng)條件的樣本數(shù),Q值越大代表規(guī)則的質(zhì)量越高。