1.一種基于BFBA和ELM的乳腺X射線圖像特征選擇方法,其特征在于,包括以下步驟:
第一步,收集所用數(shù)據(jù)集MIAS,即the Mammographic Image Analysis Society,提取乳腺X光圖像特征,并將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于訓(xùn)練極限學(xué)習(xí)機(jī)ELM,即Extreme Learning Machine,以設(shè)計(jì)ELM分類(lèi)器,測(cè)試集用于檢驗(yàn)ELM分類(lèi)器的有效性;
所述提取乳腺X光圖像特征采用的方法是灰度共生矩陣,提取四種統(tǒng)計(jì)參數(shù):角二階矩、熵、慣性矩、相關(guān)系數(shù),灰度共生矩陣的方向取0°,45°,90°,135°四個(gè)方向;首先計(jì)算四個(gè)方向上的灰度共生矩陣,取像素間距離為1,其次由每個(gè)灰度共生矩陣計(jì)算四個(gè)統(tǒng)計(jì)參數(shù);把每幅圖像分成四塊,對(duì)每塊子圖像提取上述16個(gè)特征作為原始樣本數(shù)據(jù),共獲得64個(gè)統(tǒng)計(jì)特征;特征提取所得的樣本數(shù)據(jù)庫(kù)分成10份,選擇其中90%做訓(xùn)練,其余10%做測(cè)試;
第二步,設(shè)置BFBA參數(shù);
初始參數(shù)包括蝙蝠群體大小20≤N≤100,每個(gè)蝙蝠個(gè)體的維數(shù)D=64,脈沖音量A=0.5,脈沖率R=0.5,搜索脈沖頻率范圍[Qmin,Qmax],其中Qmin=0,Qmax=2,最大迭代次數(shù)iter_max=1000,停滯計(jì)數(shù)器stagnant_count=0,最大停滯次數(shù)stagnant_max=4;
第三步,蝙蝠種群初始化,蝙蝠位置向量由第一步給出的64個(gè)統(tǒng)計(jì)特征組成,使用二進(jìn)制編碼標(biāo)記特征組合并隨機(jī)初始化蝙蝠個(gè)體位置及速度,形成樣本集;
蝙蝠位置編碼采用二進(jìn)制,原始特征有64個(gè),即個(gè)體的長(zhǎng)度L=64,個(gè)體的每一個(gè)基因?qū)?yīng)相應(yīng)次序的特征,即當(dāng)個(gè)體中的某一個(gè)基因?yàn)椤?”時(shí),表示該基因?qū)?yīng)的特征項(xiàng)被選用;反之,為“0”時(shí),表示該特征項(xiàng)未被選用。使用X={x1,x2,x3……xi……xN}表示蝙蝠群體的位置,使用V={v1,v2,v3……vi……vN}表示速度,其中xi表示第i個(gè)蝙蝠個(gè)體的位置,vi表示第i個(gè)蝙蝠個(gè)體的速度,xi和vi是64維的行向量,一共有N個(gè)蝙蝠個(gè)體,20≤N≤100。
基因值隨機(jī)產(chǎn)生的公式為:
式中,rand()為[0,1]區(qū)間獨(dú)立同分布的隨機(jī)數(shù);
第四步、根據(jù)每個(gè)蝙蝠位置編碼生成相應(yīng)的特征子集,使用該特征子集生成訓(xùn)練集和測(cè)試集,訓(xùn)練集用于設(shè)計(jì)ELM分類(lèi)器,測(cè)試集用于測(cè)試分類(lèi)器,根據(jù)測(cè)試結(jié)果計(jì)算相應(yīng)蝙蝠的適應(yīng)度值fiti;
適應(yīng)度值的計(jì)算過(guò)程如下:
其中,
式中,ωA式表示分類(lèi)準(zhǔn)確權(quán)值,ωF表示特征選擇數(shù)權(quán)值,fj表示基因的特征值:0或1,acci表示分類(lèi)準(zhǔn)確率,cc表示正確分類(lèi)數(shù),uc表示不正確分類(lèi)數(shù);
第五步、更新每一個(gè)蝙蝠的搜索脈沖頻率、速度和位置;
搜索脈沖頻率、速度和位置通過(guò)以下公式進(jìn)行更新:
Qi=Qmin+(Qmax-Qmin)×β (11)
vi(t)=vi(t-1)+(xi(t)-xbest)×Qi (12)
xi(t)=xi(t-1)+vi(t) (13)
式中:β屬于[0,1],是均勻分布的隨機(jī)數(shù);Qi是蝙蝠i的搜索脈沖頻率,Qi屬于[Qmin,Qmax];vi(t)、vi(t-1)分別表示蝙蝠i在t和t-1時(shí)刻的速度;xi(t)、xi(t-1)分別表示蝙蝠i在t和t-1時(shí)刻的位置;xbest表示當(dāng)前所有蝙蝠的最優(yōu)解;
第六步、生成均勻分布隨機(jī)數(shù)rand,如果rand>R,R為第二步中所述的脈沖率,則對(duì)當(dāng)前最優(yōu)解進(jìn)行隨機(jī)擾動(dòng),產(chǎn)生一個(gè)新的解:
xnew=xbest+0.001×randn(1,64); (14)
其中,xnew表示新產(chǎn)生的新解,xbest表示當(dāng)時(shí)最優(yōu)解。
第七步、生成均勻分布隨機(jī)數(shù)rand,如果rand符合rand<A且fit(xi(t))<fit(xi(t-1)),A為第二步中所述的脈沖音量,則接受步驟六產(chǎn)生的新解:
xi(t)=xnew (15)
其中,fit(xi(t))表示求個(gè)體xi的適應(yīng)度值,xnew表示第六步產(chǎn)生的新解;
如果rand不符合上述條件,則跳過(guò)此步,進(jìn)入下一步;
第八步、對(duì)所有蝙蝠的適應(yīng)度值進(jìn)行排序,找出當(dāng)前的最優(yōu)解和最優(yōu)值;
第九步、判斷最優(yōu)解是否發(fā)生了變化,如果沒(méi)有發(fā)生變化,則
stagnant_count=stagnant_count+1,否則,stagnant_count=0
其中stagnant_count為第二步中所述的停滯計(jì)數(shù)器;
第十步、判斷stagnant_count是否等于stagnant_max,如果相等,則所有的蝙蝠發(fā)生群體響應(yīng);
即如果經(jīng)過(guò)一定次數(shù)的迭代,最佳全局適應(yīng)值不再發(fā)生變化,則發(fā)生鳥(niǎo)類(lèi)群體響應(yīng)的重新定位,使用公式(16)和(17)來(lái)重新更新每個(gè)蝙蝠的速度和位置,在公式(16)中,是蝙蝠經(jīng)過(guò)群體響應(yīng)重新定位之后的新位置,新位置通過(guò)計(jì)算它的七個(gè)最近鄰近對(duì)象的位置平均值獲得,的最近鄰近蝙蝠即和其它蝙蝠的最小歐氏距離,randx是[-1,1]區(qū)間的一個(gè)隨機(jī)實(shí)數(shù),在公式(17)中,是蝙蝠經(jīng)過(guò)速度調(diào)整后的新速度,是蝙蝠原來(lái)的速度,新速度通過(guò)計(jì)算它的七個(gè)最近鄰近蝙蝠的速度平均值獲得,randv是[0,1]區(qū)間的一個(gè)隨機(jī)實(shí)數(shù),Ni包含的七個(gè)鄰近蝙蝠的索引值;
第十一步、重復(fù)第四步到第十步直至滿足設(shè)定的最優(yōu)解條件或者達(dá)到最大迭代次數(shù);
第十二步、輸出全局最優(yōu)值和最優(yōu)解。
2.根據(jù)權(quán)利要求1所述的一種基于BFBA和ELM的乳腺X射線圖像特征選擇方法,其特征在于:所述第一步中,數(shù)據(jù)集MIAS,是研究乳腺X光圖像的標(biāo)準(zhǔn)數(shù)據(jù)集,圖像均為1024×1024的灰度圖。