1.一種基于多元多項(xiàng)式擬合的支持向量機(jī)模型近似方法,其特征在于,包括以下步驟:
步驟一:給定訓(xùn)練數(shù)據(jù)集T={(xi,yi)|i=1,2,…,l},其中,l為訓(xùn)練數(shù)據(jù)集T中樣本數(shù)據(jù)的個(gè)數(shù),xi是n維樣本數(shù)據(jù),yi是與xi對(duì)應(yīng)的類別標(biāo)簽,yi∈{-1,1};利用訓(xùn)練數(shù)據(jù)集中數(shù)據(jù)訓(xùn)練支持向量機(jī),得到傳統(tǒng)的支持向量機(jī)模型其中,αi*和b*分別是拉格朗日系數(shù)和偏置量;K(xi,x0)為核函數(shù);x0為未知類別標(biāo)簽的n維輸入數(shù)據(jù),x0=[x01,x02,…,x0n],其中,x0k為x0的第k維分量,k=1,…,n;y是模型輸出的與x0對(duì)應(yīng)的類別標(biāo)簽;
步驟二:將訓(xùn)練數(shù)據(jù)集T中的樣本數(shù)據(jù)xj(j=1,2,…,l)依次代入支持向量機(jī)模型y,計(jì)算核函數(shù)部分的輸出將得到的l個(gè)函數(shù)值記為數(shù)值序列F=[f(x1),f(x2),…,f(xl)];
步驟三:采用多元多項(xiàng)式擬合方法,利用訓(xùn)練數(shù)據(jù)集T中樣本數(shù)據(jù)和步驟二所得數(shù)值序列F建立超定方程組,求解超定方程組得到多元多項(xiàng)式的系數(shù)α;
步驟四:利用步驟三中求解得到的多元多項(xiàng)式的系數(shù)α與未知類別標(biāo)簽的n維輸入數(shù)據(jù)x0構(gòu)建多項(xiàng)式,替代支持向量機(jī)模型y的核函數(shù)部分,得到近似的支持向量機(jī)模型y'=sgn[X'α+b*];其中,
d為多元多項(xiàng)式的次數(shù),
α=(α0,α11,…,α1n,…,αd1,…,αdn)T為多元多項(xiàng)式的系數(shù)。
2.根據(jù)權(quán)利要求1所述的基于多元多項(xiàng)式擬合的支持向量機(jī)模型近似方法,其特征在于,所述步驟一中傳統(tǒng)的支持向量機(jī)模型y的訓(xùn)練方法如下:
對(duì)訓(xùn)練數(shù)據(jù)集T,求解最優(yōu)分類超平面(ω·x)+b=0,使得不同類別的樣本數(shù)據(jù)分開(kāi)并保證分類間隔最大;其中,ω為分類超平面的法向量,b是分類超平面的偏移量;
當(dāng)樣本數(shù)據(jù)線性可分時(shí),將求解最優(yōu)分類超平面的問(wèn)題轉(zhuǎn)化為求解如下二次規(guī)劃問(wèn)題:
其中,<xi,xj>為兩個(gè)n維樣本數(shù)據(jù)xi和xj的內(nèi)積,即<xi,xj>=xi·xj;αi為引入的拉格朗日系數(shù),C是一個(gè)正常數(shù),稱為懲罰因子,用來(lái)權(quán)衡最大化分類間隔和最小誤差;
解式(1)得到最終的決策函數(shù),即支持向量機(jī)模型y為:
其中,αi*和b*通過(guò)(1)式求解;αi*為使min后的函數(shù)值最小的αi的取值;選取正的支持向量xj,則這種情況下xi與x0的內(nèi)積<xi,x0>視為核函數(shù)K(xi,x0);
當(dāng)樣本數(shù)據(jù)線性不可分時(shí),支持向量機(jī)通過(guò)引入核函數(shù)K將樣本數(shù)據(jù)映射到高維特征空間,然后在高維特征空間內(nèi)進(jìn)行分類;將其最優(yōu)分類超平面的求解問(wèn)題轉(zhuǎn)化為求解如下二次規(guī)劃問(wèn)題:
由式(2)得到最終的決策函數(shù),即支持向量機(jī)模型y為:
其中,αi*和b*通過(guò)(2)式求解;αi*為使得min后函數(shù)值最小的αi的取值;選取正的支持向量xj,則
3.根據(jù)權(quán)利要求2所述的基于多元多項(xiàng)式擬合的支持向量機(jī)模型近似方法,其特征在于,在步驟一中訓(xùn)練支持向量機(jī)時(shí),需選擇使得支持向量機(jī)性能最佳的核函數(shù)類型,選擇方法如下:
應(yīng)用驗(yàn)證方法,從支持向量機(jī)中常用的支持核函數(shù)中選取核函數(shù),即將核函數(shù)分別帶入進(jìn)行實(shí)驗(yàn)找到使支持向量機(jī)性能最優(yōu)的核函數(shù)。
4.根據(jù)權(quán)利要求3所述的基于多元多項(xiàng)式擬合的支持向量機(jī)模型近似方法,其特征在于,在步驟一中訓(xùn)練支持向量機(jī)時(shí),需選擇使得支持向量機(jī)性能最優(yōu)的支持向量機(jī)參數(shù),包括核函數(shù)參數(shù)及懲罰因子C,其選擇方法如下:
采用網(wǎng)格搜索的參數(shù)尋優(yōu)方法對(duì)核函數(shù)參數(shù)及懲罰因子C進(jìn)行選擇,讓支持向量機(jī)參數(shù)在一定范圍內(nèi)取值變化;對(duì)于取定的參數(shù),利用K-CV方法得到該組參數(shù)的分類準(zhǔn)確率,最終選擇使得測(cè)試集分類準(zhǔn)確率最高的那組參數(shù)作為模型的參數(shù)。
5.根據(jù)權(quán)利要求4所述的基于多元多項(xiàng)式擬合的支持向量機(jī)模型近似方法,其特征在于,步驟三中關(guān)于超定方程組的建立方法如下:
設(shè)n維數(shù)據(jù)xj=(xj1,…,xjn),則xjd=(xj1d,…,xjnd);由訓(xùn)練數(shù)據(jù)集T中n維樣本數(shù)據(jù)xj和由步驟二得到的f(xj)構(gòu)造多元多項(xiàng)式方程:
其中,xj1,…,xjn分別為xj的n個(gè)元素的值;d為多元多項(xiàng)式次數(shù),l>>dn;
由訓(xùn)練數(shù)據(jù)集T的l個(gè)樣本數(shù)據(jù)得到l個(gè)多元多項(xiàng)式方程;將l個(gè)多元多項(xiàng)式方程組成超定方程組,并寫(xiě)作矩陣形式,有:
F=X·α
其中,是以l個(gè)n維樣本數(shù)據(jù)的各維分量的各次冪為元素組成的矩陣。
6.根據(jù)權(quán)利要求5所述的基于多元多項(xiàng)式擬合的支持向量機(jī)模型近似方法,其特征在于,步驟三中多元多項(xiàng)式次數(shù)是可變的;對(duì)同一訓(xùn)練數(shù)據(jù)集,根據(jù)選擇的多項(xiàng)式次數(shù)的不同,構(gòu)造不同的超定方程組,利用最小二乘法求出超定方程組的解,即多元多項(xiàng)式系數(shù)α的值。
7.一種基于多元多項(xiàng)式擬合的支持向量機(jī)模型近似方法的應(yīng)用,其特征在于,將步驟四得到的近似的支持向量機(jī)模型y’應(yīng)用于基于經(jīng)濟(jì)型CPU平臺(tái)的系統(tǒng),對(duì)未知類別標(biāo)簽的輸入數(shù)據(jù)進(jìn)行在線分類,得到其類別標(biāo)簽。
8.根據(jù)權(quán)利要求7所述的基于多元多項(xiàng)式擬合的支持向量機(jī)模型近似方法的應(yīng)用,其特征在于,在基于經(jīng)濟(jì)型CPU平臺(tái)的系統(tǒng)上使用近似的支持向量機(jī)模型時(shí),近似模型中多項(xiàng)式函數(shù)的階次的選擇方法如下:
首先選擇使得測(cè)試集分類準(zhǔn)確率最高的近似支持向量機(jī)模型,利用與具體硬件對(duì)應(yīng)的系統(tǒng)仿真器或仿真軟件檢測(cè)系統(tǒng)硬件所能提供的資源是否滿足該模型計(jì)算所需條件;若其所需超過(guò)了系統(tǒng)硬件所能提供的資源,則將近似的支持向量機(jī)模型中的多元多項(xiàng)式的次數(shù)降低一次,直至近似模型的計(jì)算資源需求小于系統(tǒng)可提供的資源。