基于群智能算法的投影尋蹤分類建模軟件及實(shí)現(xiàn)的制作方法
【專利摘要】本發(fā)明屬于計(jì)算機(jī)應(yīng)用【技術(shù)領(lǐng)域】,提供了基于群智能算法的投影尋蹤分類建模軟件及實(shí)現(xiàn),包括:樣本數(shù)據(jù)模塊,歸一化方法模塊,PPC建模模塊,全局最優(yōu)解模塊;樣本數(shù)據(jù)歸一化預(yù)處理,建立PPC模型的目標(biāo)函數(shù);對(duì)PPC模型的目標(biāo)函數(shù)進(jìn)行計(jì)算,提出了一種值的取值范圍;應(yīng)用群智能最優(yōu)化算法求解PPC模型的目標(biāo)函數(shù),即得最優(yōu)投影向量;提出如何判斷最優(yōu)化過程是否求得真正全局最優(yōu)解的準(zhǔn)則;對(duì)三種不同群智能算法求得的最優(yōu)解進(jìn)行判斷,進(jìn)而求得全局最優(yōu)解。本發(fā)明提出了如何確定合理的值范圍,進(jìn)而提出如何判斷求得的結(jié)果是全局最優(yōu)解的準(zhǔn)則,計(jì)算結(jié)果便于比較驗(yàn)證,提高了PPC建模的可靠性、合理性和正確性。
【專利說明】基于群智能算法的投影尋蹤分類建模軟件及實(shí)現(xiàn)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)應(yīng)用【技術(shù)領(lǐng)域】,特別涉及一種解決高維數(shù)據(jù)的分類和排序問題的基于群智能算法的投影尋蹤分類建模軟件及實(shí)現(xiàn)。
【背景技術(shù)】[0002]在處理高維、非線性、非正態(tài)分布的數(shù)據(jù)時(shí),傳統(tǒng)統(tǒng)計(jì)方法的效果較差。1974年,F(xiàn)riedman提出了可有效解決這一問題的投影尋蹤分類(Pro jection Pursuit Clustering,簡稱PPC)模型,隨后該模型被引入國內(nèi),并在眾多領(lǐng)域內(nèi)廣泛使用,也取得了很好的效果。PPC建模的基本思想是:尋找一個(gè)投影向量,將原始高維數(shù)據(jù)映射到低維子空間上,并通過研究子空間上的數(shù)據(jù)規(guī)律來揭示原始數(shù)據(jù)的結(jié)構(gòu)特性,以達(dá)到研究高維數(shù)據(jù)的目的。Friedman提出的一維PPC模型目標(biāo)函數(shù)Q(b) =max(Sy*Dy)應(yīng)用最廣,本發(fā)明以該目標(biāo)函數(shù)為研究對(duì)象。
[0003]在PPC建模過程中,首先要消除樣本數(shù)據(jù)之間由于量綱不同而帶來的不利影響,即必須對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理。常用的歸一化處理方法有極差歸一法、最大值歸一法和零均值歸一法,三種不同歸一化方法對(duì)PPC建模結(jié)果具有不同的影響,應(yīng)用者應(yīng)該針對(duì)樣本數(shù)據(jù)的分布特點(diǎn)選擇合理的歸一化方法。
[0004]從PPC模型目標(biāo)函數(shù)可以看出,局部密度窗口半徑R是唯一影響投影向量的參數(shù),因此選取合理的R值是PPC建模的關(guān)鍵之一。Friedman提出確定合理的R值需要滿足兩個(gè)要求:①要求投影點(diǎn)在整體上盡可能分散,局部上盡可能密集投影窗口內(nèi)的投影點(diǎn)個(gè)數(shù)既不能太少,以免樣本滑動(dòng)平均時(shí)偏差太大,同時(shí)又不能隨著樣本個(gè)數(shù)η的增大而增加太大。國內(nèi)學(xué)者根據(jù)選取R值的要求,提出了確定R值的三種方案:①較小值方案,即R≤0.1Sz 較大值方案,即rmax≤R≤2p ;③中間適度值方案,即rmax5≤R≤rmax3。
[0005]目前,沒有任何一款軟件能夠提供PPC建模,采用原始方法實(shí)現(xiàn)的PPC建模求得的全局最優(yōu)解的可靠性、合理性以及正確性都很低。
[0006]因此,計(jì)算機(jī)應(yīng)用【技術(shù)領(lǐng)域】急需一款能夠?qū)Ρ热N不同歸一化方法的結(jié)果,提出如何確定合理的R值范圍,進(jìn)而提出如何判斷求得的結(jié)果是全局最優(yōu)解的準(zhǔn)則,計(jì)算結(jié)果便于比較驗(yàn)證,提高了 PPC建模求得的全局最優(yōu)解的可靠性、合理性和正確性的基于群智能算法的投影尋蹤分類建模軟件。
【發(fā)明內(nèi)容】
[0007]本發(fā)明提供了一種基于群智能算法的投影尋蹤分類建模軟件及實(shí)現(xiàn),技術(shù)方案如下:
[0008]基于群智能算法的投影尋蹤分類建模軟件,包括:
[0009]樣本數(shù)據(jù)模塊,用于對(duì)樣本數(shù)據(jù)進(jìn)行采集;
[0010]歸一化方法模塊,與樣本數(shù)據(jù)模塊相連接,用于對(duì)采集到的樣本數(shù)據(jù)進(jìn)行預(yù)處理;[0011]PPC建模模塊,與歸一化方法模塊相連接,用經(jīng)過預(yù)處理的樣本數(shù)據(jù)建立PPC模型;
[0012]全局最優(yōu)解模塊,與PPC建模模塊相連接,設(shè)定合理的R值,通過群智能最優(yōu)化算法進(jìn)行求得全局最優(yōu)解,并且根據(jù)是否求得真正全局最優(yōu)解的準(zhǔn)則判斷最優(yōu)化過程求得的全局最優(yōu)解是否正確,從而求得最優(yōu)投影向量和樣本投影值。
[0013]如上的基于群智能算法的投影尋蹤分類建模軟件,其中,歸一化方法模塊,還包括:極差歸一法模塊、最大值歸一法模塊、零均值歸一法模塊。
[0014]如上的基于群智能算法的投影尋蹤分類建模軟件,其中,全局最優(yōu)解模塊,還包括:粒子群算法模塊、多智能體遺傳算法模塊、混沌蜂群算法模塊。
[0015]基于群智能算法的投影尋蹤分類建模軟件的實(shí)現(xiàn)方法,其中,包括如下步驟:
[0016]步驟一:樣本數(shù)據(jù)歸一化預(yù)處理;
[0017]首先通過樣本數(shù)據(jù)采集模塊采集樣本數(shù)據(jù),由于樣本數(shù)據(jù)各指標(biāo)之間的單位、評(píng)價(jià)標(biāo)準(zhǔn)、數(shù)值大小的變化范圍等均存在較大的差異,為了盡可能保留原始樣本數(shù)據(jù)中評(píng)價(jià)指標(biāo)值之間的相對(duì)變化信息和規(guī)律,必須對(duì)原始樣本數(shù)據(jù)進(jìn)行預(yù)處理,通過歸一化方法模塊提供了三種不同的歸一化方法對(duì)原始樣本數(shù)據(jù)進(jìn)行預(yù)處理,求出正向指標(biāo)和逆向指標(biāo),具體方法為:
[0018]①采用極差歸一法,求出正向指標(biāo)和逆向指標(biāo)值,具體為:
[0019]正向指標(biāo)
【權(quán)利要求】
1.基于群智能算法的投影尋蹤分類建模軟件,其特征在于,包括: 樣本數(shù)據(jù)模塊,用于對(duì)樣本數(shù)據(jù)進(jìn)行采集; 歸一化方法模塊,與所述樣本數(shù)據(jù)模塊相連接,用于對(duì)采集到的樣本數(shù)據(jù)進(jìn)行預(yù)處理; PPC建模模塊,與所述歸一化方法模塊相連接,用經(jīng)過預(yù)處理的樣本數(shù)據(jù)建立PPC模型;全局最優(yōu)解模塊,與所述PPC建模模塊相連接,設(shè)定合理的R值,通過群智能最優(yōu)化算法進(jìn)行求得全局最優(yōu)解 ,并且根據(jù)是否求得真正全局最優(yōu)解的準(zhǔn)則判斷最優(yōu)化過程求得的全局最優(yōu)解是否正確,從而求得最優(yōu)投影向量和樣本投影值。
2.根據(jù)權(quán)利要求1所述的基于群智能算法的投影尋蹤分類建模軟件,其特征在于,所述歸一化方法模塊,還包括:極差歸一法模塊、最大值歸一法模塊、零均值歸一法模塊。
3.根據(jù)權(quán)利要求1所述的基于群智能算法的投影尋蹤分類建模軟件,其特征在于,所述全局最優(yōu)解模塊,還包括:粒子群算法模塊、多智能體遺傳算法模塊、混沌蜂群算法模塊。
4.基于群智能算法的投影尋蹤分類建模軟件的實(shí)現(xiàn)方法,其特征在于,包括如下步驟:步驟一:樣本數(shù)據(jù)歸一化預(yù)處理; 首先通過所述樣本數(shù)據(jù)采集模塊采集樣本數(shù)據(jù),由于樣本數(shù)據(jù)各指標(biāo)之間的單位、評(píng)價(jià)標(biāo)準(zhǔn)、數(shù)值大小的變化范圍等均存在較大的差異,為了盡可能保留原始樣本數(shù)據(jù)中評(píng)價(jià)指標(biāo)值之間的相對(duì)變化信息和規(guī)律,必須對(duì)原始樣本數(shù)據(jù)進(jìn)行預(yù)處理,通過歸一化方法模塊提供了三種不同的歸一化方法對(duì)原始樣本數(shù)據(jù)進(jìn)行預(yù)處理,求出正向指標(biāo)和逆向指標(biāo),具體方法為: ①采用極差歸一法,求出正向指標(biāo)和逆向指標(biāo)值,具體為:
正向指標(biāo):
【文檔編號(hào)】G06F17/30GK103902737SQ201410160986
【公開日】2014年7月2日 申請(qǐng)日期:2014年4月22日 優(yōu)先權(quán)日:2014年4月22日
【發(fā)明者】熊聘, 樓文高, 喬龍, 樓際通, 陳冬露, 熊輝, 陳鵬輝, 代輝 申請(qǐng)人:上海理工大學(xué), 上海商學(xué)院, 上海大學(xué)