亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

改進(jìn)的直推式支持向量機(jī)的大型高爐故障分類算法及應(yīng)用的制作方法

文檔序號(hào):12365707閱讀:233來源:國知局
本發(fā)明屬于工業(yè)過程監(jiān)控與故障診斷領(lǐng)域,特別涉及一種改進(jìn)的基于直推式支持向量機(jī)的大型高爐系統(tǒng)故障分類算法。
背景技術(shù)
:工業(yè)生產(chǎn)是國家重要的經(jīng)濟(jì)發(fā)展內(nèi)容,針對(duì)工業(yè)過程的故障分類研究,對(duì)保證安全高效的生產(chǎn)具有十分重要的意義。目前常見的故障分類方法包括定性與定量的分析方法。其中定性分析方法包括圖論方法、專家系統(tǒng)、定性仿真。定量的方法又包括基于解析模型的方法與數(shù)據(jù)驅(qū)動(dòng)的方法。而目前研究的熱門領(lǐng)域包括機(jī)器學(xué)習(xí)、多元統(tǒng)計(jì)分析、信號(hào)處理等都屬于數(shù)據(jù)驅(qū)動(dòng)的方法。對(duì)于復(fù)雜的工業(yè)過程而言,很難構(gòu)建精確的機(jī)理模型,也很難收集全面的專家系統(tǒng)知識(shí),因此基于數(shù)據(jù)的方法具有很好的應(yīng)用前景。工業(yè)生產(chǎn)過程中,各種傳感器可以獲取大量的數(shù)據(jù),通過計(jì)算機(jī)的運(yùn)算存儲(chǔ)功能,數(shù)據(jù)以海量的規(guī)模進(jìn)行增長,為數(shù)據(jù)分析提供了充足的資源。目前應(yīng)用較多的數(shù)據(jù)驅(qū)動(dòng)方法,如主元分析(PCA)、偏最小二乘(PLS)、支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等。很多學(xué)者對(duì)這些方法進(jìn)行了改進(jìn),也對(duì)一些方法進(jìn)行融合,從而大大提高了故障診斷的效果。對(duì)于半監(jiān)督支持向量機(jī)算法,最早是由創(chuàng)始者Vapnik等人提出的直推式學(xué)習(xí)方法,后來又引入了局部組合搜索、梯度下降、連續(xù)優(yōu)化技術(shù)、凸凹過程、半正定編程、不可微方法、決定退火、分支定界等方法。其中直推式學(xué)習(xí)假定未標(biāo)記示例就是測(cè)試?yán)?,即學(xué)習(xí)的目的就是在這些未標(biāo)記示例上取得最佳泛化能力。直推式支持向量機(jī)(transductiveSVM,TSVM)很好地利用了這部分?jǐn)?shù)據(jù),在有標(biāo)簽數(shù)據(jù)的運(yùn)算基礎(chǔ)上加入無標(biāo)簽數(shù)據(jù),通過一些列算法將無標(biāo)簽的數(shù)據(jù)進(jìn)行分類,從而有效的解決學(xué)習(xí)過程中產(chǎn)生的模型的準(zhǔn)確問題。技術(shù)實(shí)現(xiàn)要素:為了克服現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于針對(duì)直推式支持向量機(jī)算法的特點(diǎn),提供一種基于改進(jìn)的直推式支持向量機(jī)的大型高爐故障分類方法,并將這種方法應(yīng)用在大型高爐系統(tǒng)的故障分類應(yīng)用中。一種改進(jìn)的基于直推式支持向量機(jī)的大型高爐系統(tǒng)故障分類算法,主要采用對(duì)N個(gè)點(diǎn)的數(shù)據(jù)采取隨機(jī)選擇的策略,通過L次的選擇,分別計(jì)算出L次的準(zhǔn)確率,選取準(zhǔn)確率最高的一次即作為該模型的分類器,步驟如下:步驟一:初始化懲罰因子C,利用訓(xùn)練數(shù)據(jù)中包含的正負(fù)標(biāo)簽的數(shù)據(jù)進(jìn)行歸納式學(xué)習(xí),得到一個(gè)原始的樣本分類器。對(duì)于支持向量機(jī),給定數(shù)據(jù)樣本集:(x1,y1),(x2,y2),…,(xl,yl)(1)y∈{-1,1}代表不同類。分類的任務(wù)是構(gòu)建最優(yōu)超平面f(x)=<w,φ(x)>+b,把屬于不同類的向量xi分開。其中w為參數(shù)向量,φ(·)為輸入空間到特征空間的映射函數(shù)。定義損失函數(shù)如下:minR(w,b)=12<w,w>+c·Remp---(2)]]>第一部分定義了模型的結(jié)構(gòu)復(fù)雜度;第二部分Remp為經(jīng)驗(yàn)風(fēng)險(xiǎn);c為調(diào)節(jié)常數(shù),用于控制模型復(fù)雜度與逼近誤差的折中。當(dāng)經(jīng)驗(yàn)風(fēng)險(xiǎn)取不同的函數(shù)時(shí),得到不同的SVM分類器。當(dāng)經(jīng)驗(yàn)風(fēng)險(xiǎn)Remp=0,即僅僅考慮分類器的模型復(fù)雜度時(shí),損失函數(shù)變?yōu)椋篟(w·b)=12<w,w>---(3)]]>優(yōu)化問題描述為:minR(w,b)=12<w,w>subjecttoyi(<w,xi>-b)≥1,i=1,2,...,l---(4)]]>為了得到對(duì)偶的優(yōu)化問題,引入拉格朗日乘子,得到拉格朗日方程:L=12<w,w>-Σi=1lai(yi(<w,xi>-b)-1)---(5)]]>求該函數(shù)關(guān)于原始變量的微分:∂L∂w=w-Σi=1laiyixi=0---(6)]]>∂L∂b=Σi=1laiyi=0---(7)]]>將公式(6)(7)帶入拉格朗日方程:L=Σi=1lai-12Σi=1laiajyiyj<xi,xj>---(8)]]>得到對(duì)偶的優(yōu)化問題:maxW(a)=Σi=1lai-12Σi=1laiajyiyj<xi,xj>subjecttoΣi=1laiyi=0,ai≥0,i=1,2,...,l---(9)]]>為了容忍訓(xùn)練集中噪聲和異常數(shù)據(jù),定義間隔松弛向量,以其1范數(shù)作為經(jīng)驗(yàn)風(fēng)險(xiǎn),即得到1范數(shù)軟間隔分類器。優(yōu)化問題描述為:minR(w,b)=12<w,w>+cΣi=1lξisubjecttoyi(<w,xi>-b)≥1-ξi,i=1,2,...,l---(10)]]>其中,ξi為松弛變量,它使得可以容忍訓(xùn)練數(shù)據(jù)的錯(cuò)誤分類。當(dāng)取ξi=0,i=1,2,…,l時(shí),軟間隔分類器退化成為硬間隔分類器。該優(yōu)化問題的對(duì)偶問題為:maxW(a)=Σi=1lai-12Σi=1j=1laiajyiyj<xi,xj>subjecttoΣi=1laiyi=0,0≤ai≤C---(11)]]>步驟二:初始化懲罰因子C*,用原始的樣本分類器對(duì)無標(biāo)簽樣本進(jìn)行分類?;诘惴ǖ闹蓖剖街С窒蛄繖C(jī)給定一組獨(dú)立同分布的有標(biāo)簽訓(xùn)練樣本點(diǎn)(x1,y1),(x2,y2),..,(xl,yl),x∈Rm,y∈{-1,1}和另一組來自同一分布的無標(biāo)簽樣本點(diǎn)x1*,x2*,x3*,..,xk*。在一般的線性不可分條件下,TSVM的訓(xùn)練過程可以描述為以下的優(yōu)化問題:(y1*,...,yk*,w,b,ξ1,...,ξm,ξ1*,...,ξk*)min12||w||2+CΣi=1lξi+C*Σj=1kξj*subjectto∀i=1l:yi[w·xi+b]≥1-ξi∀j=1k:yj[w·xj*+b]≥1-ξj*∀i=1l:ξi≥0∀j=1k:ξj*≥0---(12)]]>其中參數(shù)C和C*為用戶指定和調(diào)節(jié)的參數(shù),參數(shù)C*是未標(biāo)識(shí)樣本在訓(xùn)練過程中的影響因子,C*與ξj*稱為未標(biāo)識(shí)樣本xj在目標(biāo)函數(shù)中的影響項(xiàng)。步驟三:迭代計(jì)算。1)計(jì)算每一個(gè)樣本到超平面的距離|f(x)|,選取N個(gè)距離|f(x)|≤d的樣本點(diǎn),在N個(gè)樣本點(diǎn)中隨機(jī)取出M個(gè)樣本點(diǎn)。2)假定訓(xùn)練集中M個(gè)無標(biāo)記樣本中正負(fù)樣本的比例為1:1,并指定一個(gè)訓(xùn)練集中無標(biāo)簽樣本的臨時(shí)懲罰因子C*temp。3)用得到的樣本分類器對(duì)訓(xùn)練集中的無標(biāo)簽樣本進(jìn)行重新分類,根據(jù)分類器對(duì)無標(biāo)簽數(shù)據(jù)記錄的判別結(jié)果,對(duì)無標(biāo)簽數(shù)據(jù)做出正負(fù)分類判決,并將判決值較大的一半樣本標(biāo)記為正標(biāo)簽,另外一半標(biāo)記為負(fù)樣本。4)用得到的經(jīng)過重新標(biāo)記的訓(xùn)練集數(shù)據(jù)對(duì)TSVM學(xué)習(xí)機(jī)進(jìn)行重新訓(xùn)練,得到新的分類器。然后,按一定的規(guī)則交換一對(duì)標(biāo)簽值不同的訓(xùn)練樣本的標(biāo)簽符號(hào),即把起初標(biāo)記為正樣本的未標(biāo)記樣本中標(biāo)記為負(fù)樣本,起初標(biāo)記為負(fù)樣本的標(biāo)記為正樣本,計(jì)算式(3)的值,使得問題(3)的值獲得最大下降。反復(fù)執(zhí)行訓(xùn)練樣本標(biāo)簽的變換,直到找不出滿足交換條件的樣本為止。5)均勻地增加未標(biāo)記樣本的懲罰因子C*temp的值,并重新執(zhí)行步驟(4),直到C*temp≥C時(shí),TSVM的學(xué)習(xí)結(jié)束。6)測(cè)試分類器的效果,并重復(fù)(1)至(5)的操作L次,選擇具有最優(yōu)正確率的分類器。所述的工業(yè)故障為高爐冶煉過程故障。一種所述的方法用于高爐冶煉過程故障分類。本發(fā)明具有以下有益效果:1.本發(fā)明首次提出一種應(yīng)用于高爐冶煉過程故障的改進(jìn)直推式支持向量機(jī)算法,并且基于這個(gè)改進(jìn)方法利用了大量的無標(biāo)簽數(shù)據(jù),利用樣本的多次迭代篩選的方法,實(shí)現(xiàn)了對(duì)復(fù)雜過程的故障分類;2.本發(fā)明能夠針對(duì)改進(jìn)的直推式支持向量機(jī)算法,通過平衡數(shù)據(jù)樣本類別的數(shù)量入手,對(duì)無標(biāo)簽的樣本進(jìn)行了初步的預(yù)測(cè),并對(duì)該過程進(jìn)行了優(yōu)化。本算法采用的篩選機(jī)制能夠比較有效的利用無標(biāo)簽樣本對(duì)原始模型進(jìn)行正確修正,使得分類準(zhǔn)確率得到提高,有效提高算法的學(xué)習(xí)精度。具體實(shí)施方式本發(fā)明首先,針對(duì)工業(yè)采集數(shù)據(jù),利用訓(xùn)練數(shù)據(jù)中包含的正負(fù)標(biāo)簽的數(shù)據(jù)進(jìn)行歸納式學(xué)習(xí),得到一個(gè)原始的樣本分類器。其次,利用原始的樣本分類器對(duì)無標(biāo)簽樣本進(jìn)行分類。最后,通過迭代計(jì)算的方法獲得最優(yōu)的樣本分類器。本發(fā)明提出了一種改進(jìn)的基于直推式支持向量機(jī)的故障分類算法,從平衡數(shù)據(jù)樣本類別的數(shù)量入手,對(duì)無標(biāo)簽的樣本進(jìn)行了初步的預(yù)測(cè),并對(duì)該過程進(jìn)行了優(yōu)化。一種改進(jìn)的基于直推式支持向量機(jī)的大型高爐系統(tǒng)故障分類算法,主要采用對(duì)N個(gè)點(diǎn)的數(shù)據(jù)采取隨機(jī)選擇的策略,通過L次的選擇,分別計(jì)算出L次的準(zhǔn)確率,選取準(zhǔn)確率最高的一次即作為該模型的分類器,步驟如下:步驟一:初始化懲罰因子C,利用訓(xùn)練數(shù)據(jù)中包含的正負(fù)標(biāo)簽的數(shù)據(jù)進(jìn)行歸納式學(xué)習(xí),得到一個(gè)原始的樣本分類器。對(duì)于支持向量機(jī),利用工業(yè)過程采集的離線數(shù)據(jù)集:(x1,y1),(x2,y2),..,(xl,yl)(1)y∈{-1,1}代表不同類。分類的任務(wù)是構(gòu)建最優(yōu)超平面f(x)=<w,φ(x)>+b,把屬于不同類的向量xi分開。其中w為參數(shù)向量,φ(·)為輸入空間到特征空間的映射函數(shù)。定義損失函數(shù)如下:minR(w,b)=12<w,w>+c·Remp---(2)]]>第一部分定義了模型的結(jié)構(gòu)復(fù)雜度;第二部分Remp為經(jīng)驗(yàn)風(fēng)險(xiǎn);c為調(diào)節(jié)常數(shù),用于控制模型復(fù)雜度與逼近誤差的折中。當(dāng)經(jīng)驗(yàn)風(fēng)險(xiǎn)取不同的函數(shù)時(shí),得到不同的SVM分類器。當(dāng)經(jīng)驗(yàn)風(fēng)險(xiǎn)Remp=0,即僅僅考慮分類器的模型復(fù)雜度時(shí),損失函數(shù)變?yōu)椋篟(w·b)=12<w,w>---(3)]]>優(yōu)化問題描述為:minR(w,b)=12<w,w>subjecttoyi(<w,xi>-b)≥1,i=1,2,...,l---(4)]]>為了得到對(duì)偶的優(yōu)化問題,引入拉格朗日乘子,得到拉格朗日方程:L=12<w,w>-Σi=1lai(yi(<w,xi>-b)-1)---(5)]]>求該函數(shù)關(guān)于原始變量的微分:∂L∂w=w-Σi=1laiyixi=0---(6)]]>∂L∂b=Σi=1laiyi=0---(7)]]>將公式(6)(7)帶入拉格朗日方程:L=Σi=1lai-12Σi=1laiajyiyj<xi,xj>---(8)]]>得到對(duì)偶的優(yōu)化問題:maxW(a)=Σi=1lai-12Σi=1laiajyiyj<xi,xj>subjecttoΣi=1laiyi=0,ai≥0,i=1,2,...,l---(9)]]>為了容忍訓(xùn)練集中噪聲和異常數(shù)據(jù),定義間隔松弛向量,以其1范數(shù)作為經(jīng)驗(yàn)風(fēng)險(xiǎn),即得到1范數(shù)軟間隔分類器。優(yōu)化問題描述為:minR(w,b)=12<w,w>+cΣi=1lξisubjecttoyi(<w,xi>-b)≥1-ξi,i=1,2,...,l---(10)]]>其中,ξi為松弛變量,它使得可以容忍訓(xùn)練數(shù)據(jù)的錯(cuò)誤分類。當(dāng)取ξi=0,i=1,2,…,l時(shí),軟間隔分類器退化成為硬間隔分類器。該優(yōu)化問題的對(duì)偶問題為:maxW(a)=Σi=1lai-12Σi=1j=1laiajyiyj<xi,xj>subjecttoΣi=1laiyi=0,0≤ai≤C---(11)]]>步驟二:初始化懲罰因子C*,用原始的樣本分類器對(duì)無標(biāo)簽樣本進(jìn)行分類?;诘惴ǖ闹蓖剖街С窒蛄繖C(jī)給定一組獨(dú)立同分布的有標(biāo)簽訓(xùn)練樣本點(diǎn)(x1,y1),(x2,y2),...,(xl,yl),x∈Rm,y∈{-1,1}和另一組來自同一分布的無標(biāo)簽樣本點(diǎn)x1*,x2*,x3*,...,xk*。在一般的線性不可分條件下,TSVM的訓(xùn)練過程可以描述為以下的優(yōu)化問題:(y1*,...,yk*,w,b,ξ1,...,ξm,ξ1*,...,ξk*)min12||w||2+CΣi=1lξi+C*Σj=1kξj*---(12)]]>subjectto∀i=1l:yi[w·xi+b]≥1-ξi∀j=1k:yj[w·xj*+b]≥1-ξj*∀i=1l:ξi≥0∀j=1k:ξj*≥0]]>其中參數(shù)C和C*為用戶指定和調(diào)節(jié)的參數(shù),參數(shù)C*是未標(biāo)識(shí)樣本在訓(xùn)練過程中的影響因子,C*與ξj*稱為未標(biāo)識(shí)樣本xj在目標(biāo)函數(shù)中的影響項(xiàng)。步驟三:迭代計(jì)算。1)計(jì)算每一個(gè)樣本到超平面的距離|f(x)|,選取N個(gè)距離|f(x)|≤d的樣本點(diǎn),在N個(gè)樣本點(diǎn)中隨機(jī)取出M個(gè)樣本點(diǎn)。2)假定訓(xùn)練集中M個(gè)無標(biāo)記樣本中正負(fù)樣本的比例為1:1,并指定一個(gè)訓(xùn)練集中無標(biāo)簽樣本的臨時(shí)懲罰因子C*temp。3)用得到的樣本分類器對(duì)訓(xùn)練集中的無標(biāo)簽樣本進(jìn)行重新分類,根據(jù)分類器對(duì)無標(biāo)簽數(shù)據(jù)記錄的判別結(jié)果,對(duì)無標(biāo)簽數(shù)據(jù)做出正負(fù)分類判決,并將判決值較大的一半樣本標(biāo)記為正標(biāo)簽,另外一半標(biāo)記為負(fù)樣本。4)用得到的經(jīng)過重新標(biāo)記的訓(xùn)練集數(shù)據(jù)對(duì)TSVM學(xué)習(xí)機(jī)進(jìn)行重新訓(xùn)練,得到新的分類器。然后,按一定的規(guī)則交換一對(duì)標(biāo)簽值不同的訓(xùn)練樣本的標(biāo)簽符號(hào),即把起初標(biāo)記為正樣本的未標(biāo)記樣本中標(biāo)記為負(fù)樣本,起初標(biāo)記為負(fù)樣本的標(biāo)記為正樣本,計(jì)算式(3)的值,使得問題(3)的值獲得最大下降。反復(fù)執(zhí)行訓(xùn)練樣本標(biāo)簽的變換,直到找不出滿足交換條件的樣本為止。5)均勻地增加未標(biāo)記樣本的懲罰因子C*temp的值,并重新執(zhí)行步驟(4),直到C*temp≥C時(shí),TSVM的學(xué)習(xí)結(jié)束。6)測(cè)試分類器的效果,并重復(fù)(1)至(5)的操作L次,選擇具有最優(yōu)正確率的分類器。上述實(shí)施例用來解釋說明本發(fā)明,而不是對(duì)本發(fā)明進(jìn)行限制,在本發(fā)明的精神和權(quán)利要求的保護(hù)范圍內(nèi),對(duì)本發(fā)明做出的任何修改和改變,都落入本發(fā)明的保護(hù)范圍。實(shí)施例高爐煉鐵是鋼鐵生產(chǎn)中的重要環(huán)節(jié),是衡量一個(gè)國家的經(jīng)濟(jì)水平和綜合國力的重要指標(biāo)。保證大型高爐系統(tǒng)安全穩(wěn)定的運(yùn)行在經(jīng)濟(jì)和安全上都是十分必要的,所以對(duì)大型高爐非正常工況診斷與安全運(yùn)行方法進(jìn)行研究具有重要意義。高爐冶煉是一個(gè)連續(xù)的生產(chǎn)過程,全過程在爐料自上而下,煤氣自下而上的相互接觸過程中完成。爐料按一定批料從爐頂裝入爐內(nèi),從風(fēng)口鼓入由熱風(fēng)爐加熱到1000-1300℃熱風(fēng),爐料中焦炭在風(fēng)口前燃燒,產(chǎn)生高溫和還原性氣體,在爐內(nèi)上升過程中加熱緩慢下降的爐料,并還原鐵礦石中的氧化物為金屬鐵。礦石升至一定溫度后軟化,熔融滴落,礦山中未被還原的物質(zhì)形成熔渣,實(shí)現(xiàn)渣鐵分離。渣鐵聚集于爐缸內(nèi),發(fā)生諸多反應(yīng),最后調(diào)整成分和溫度達(dá)到終點(diǎn),定期從爐內(nèi)排放爐渣和鐵水。上升的煤氣流將能量傳給爐料而使溫度降低,最終形成高爐煤氣從爐頂導(dǎo)出管排出,進(jìn)入除塵系統(tǒng)。成立于1958年的某鋼煉鐵廠,是一個(gè)有著56年輝煌歷史的設(shè)備先進(jìn)、裝備水平較高的大型冶煉企業(yè),主要產(chǎn)品為生鐵,副產(chǎn)品有爐塵、爐渣、高爐煤氣等。它擁有7座現(xiàn)代化高爐,高爐整體有效容積為11750立方米,其中2號(hào)高爐有效容積為2000立方米,是目前該省最大的高爐。新高爐投產(chǎn)后,煉鐵廠將具備年產(chǎn)生鐵1000萬噸以上的綜合能力。接下來結(jié)合該具體過程對(duì)本發(fā)明的實(shí)施步驟進(jìn)行詳細(xì)地闡述:步驟一:初始化懲罰因子C,利用訓(xùn)練數(shù)據(jù)中包含的正負(fù)標(biāo)簽的數(shù)據(jù)進(jìn)行歸納式學(xué)習(xí),得到一個(gè)原始的樣本分類器。對(duì)于支持向量機(jī),利用工業(yè)過程采集的離線數(shù)據(jù)集:(x1,y1),(x2,y2),...,(xl,yl)(1)y∈{-1,1}代表不同類。分類的任務(wù)是構(gòu)建最優(yōu)超平面f(x)=<w,φ(x)>+b,把屬于不同類的向量xi分開。其中w為參數(shù)向量,φ(·)為輸入空間到特征空間的映射函數(shù)。定義損失函數(shù)如下:minR(w,b)=12<w,w>+c·Remp---(2)]]>第一部分定義了模型的結(jié)構(gòu)復(fù)雜度;第二部分Remp為經(jīng)驗(yàn)風(fēng)險(xiǎn);c為調(diào)節(jié)常數(shù),用于控制模型復(fù)雜度與逼近誤差的折中。當(dāng)經(jīng)驗(yàn)風(fēng)險(xiǎn)取不同的函數(shù)時(shí),得到不同的SVM分類器。當(dāng)經(jīng)驗(yàn)風(fēng)險(xiǎn)Remp=0,即僅僅考慮分類器的模型復(fù)雜度時(shí),損失函數(shù)變?yōu)椋篟(w·b)=12<w,w>---(3)]]>優(yōu)化問題描述為:minR(w,b)=12<w,w>subjecttoyi(<w,xi>-b)≥1,i=1,2,...,l---(4)]]>為了得到對(duì)偶的優(yōu)化問題,引入拉格朗日乘子,得到拉格朗日方程:L=12<w,w>-Σi=1lai(yi(<w,xi>-b)-1)---(5)]]>求該函數(shù)關(guān)于原始變量的微分:∂L∂w=w-Σi=1laiyixi=0---(6)]]>∂L∂b=Σi=1laiyi=0---(7)]]>將公式(6)(7)帶入拉格朗日方程:L=Σi=1lai-12Σi=1laiajyiyj<xi,xj>---(8)]]>得到對(duì)偶的優(yōu)化問題:maxW(a)=Σi=1lai-12Σi=1laiajyiyj<xi,xj>subjecttoΣi=1laiyi=0,ai≥0,i=1,2,...,l---(9)]]>為了容忍訓(xùn)練集中噪聲和異常數(shù)據(jù),定義間隔松弛向量,以其1范數(shù)作為經(jīng)驗(yàn)風(fēng)險(xiǎn),即得到1范數(shù)軟間隔分類器。優(yōu)化問題描述為:minR(w,b)=12<w,w>+cΣi=1lξisubjecttoyi(<w,xi>-b)≥1-ξi,i=1,2,...,l---(10)]]>其中,ξi為松弛變量,它使得可以容忍訓(xùn)練數(shù)據(jù)的錯(cuò)誤分類。當(dāng)取ξi=0,i=1,2,…,l時(shí),軟間隔分類器退化成為硬間隔分類器。該優(yōu)化問題的對(duì)偶問題為:maxW(a)=Σi=1lai-12Σi=1j=1laiajyiyj<xi,xj>subjecttoΣi=1laiyi=0,0≤ai≤C---(11)]]>步驟二:初始化懲罰因子C*,用原始的樣本分類器對(duì)無標(biāo)簽樣本進(jìn)行分類。基于迭代算法的直推式支持向量機(jī)給定一組獨(dú)立同分布的有標(biāo)簽訓(xùn)練樣本點(diǎn)(x1,y1),(x2,y2),..,(xl,yl),x∈Rm,y∈{-1,1}和另一組來自同一分布的無標(biāo)簽樣本點(diǎn)x1*,x2*,x3*,..,xk*。在一般的線性不可分條件下,TSVM的訓(xùn)練過程可以描述為以下的優(yōu)化問題:其中參數(shù)C和C*為用戶指定和調(diào)節(jié)的參數(shù),參數(shù)C*是未標(biāo)識(shí)樣本在訓(xùn)練過程中的影響因子,C*與ξj*稱為未標(biāo)識(shí)樣本xj在目標(biāo)函數(shù)中的影響項(xiàng)。步驟三:迭代計(jì)算。1)計(jì)算每一個(gè)樣本到超平面的距離|f(x)|,選取N個(gè)距離|f(x)|≤d的樣本點(diǎn),在N個(gè)樣本點(diǎn)中隨機(jī)取出M個(gè)樣本點(diǎn)。2)假定訓(xùn)練集中M個(gè)無標(biāo)記樣本中正負(fù)樣本的比例為1:1,并指定一個(gè)訓(xùn)練集中無標(biāo)簽樣本的臨時(shí)懲罰因子C*temp。3)用得到的樣本分類器對(duì)訓(xùn)練集中的無標(biāo)簽樣本進(jìn)行重新分類,根據(jù)分類器對(duì)無標(biāo)簽數(shù)據(jù)記錄的判別結(jié)果,對(duì)無標(biāo)簽數(shù)據(jù)做出正負(fù)分類判決,并將判決值較大的一半樣本標(biāo)記為正標(biāo)簽,另外一半標(biāo)記為負(fù)樣本。4)用得到的經(jīng)過重新標(biāo)記的訓(xùn)練集數(shù)據(jù)對(duì)TSVM學(xué)習(xí)機(jī)進(jìn)行重新訓(xùn)練,得到新的分類器。然后,按一定的規(guī)則交換一對(duì)標(biāo)簽值不同的訓(xùn)練樣本的標(biāo)簽符號(hào),即把起初標(biāo)記為正樣本的未標(biāo)記樣本中標(biāo)記為負(fù)樣本,起初標(biāo)記為負(fù)樣本的標(biāo)記為正樣本,計(jì)算式(3)的值,使得問題(3)的值獲得最大下降。反復(fù)執(zhí)行訓(xùn)練樣本標(biāo)簽的變換,直到找不出滿足交換條件的樣本為止。5)均勻地增加未標(biāo)記樣本的懲罰因子C*temp的值,并重新執(zhí)行步驟(4),直到C*temp≥C時(shí),TSVM的學(xué)習(xí)結(jié)束。6)測(cè)試分類器的效果,并重復(fù)(1)至(5)的操作L次,選擇具有最優(yōu)正確率的分類器。上述實(shí)施例用來解釋說明本發(fā)明,而不是對(duì)本發(fā)明進(jìn)行限制,在本發(fā)明的精神和權(quán)利要求的保護(hù)范圍內(nèi),對(duì)本發(fā)明做出的任何修改和改變,都落入本發(fā)明的保護(hù)范圍。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1