一種基于支持向量機(jī)的高鐵電能質(zhì)量數(shù)據(jù)的分類方法
【專利摘要】本發(fā)明涉及一種基于支持向量機(jī)(SVM)的高速鐵路電能質(zhì)量數(shù)據(jù)的分類方法,包括如下步驟:(1)將高鐵電能質(zhì)量監(jiān)測(cè)數(shù)據(jù)進(jìn)行預(yù)處理后作為訓(xùn)練和測(cè)試樣本集;(2)進(jìn)行支持向量機(jī)訓(xùn)練;(3)基于支持向量機(jī)的回歸特征消去法(SVM_RFE)進(jìn)行高鐵負(fù)荷電能質(zhì)量的特征選擇;(4)綜合分類正確率和特征子集的個(gè)數(shù)對(duì)特征子集進(jìn)行優(yōu)劣評(píng)估,確定最優(yōu)的特征子集;(5)利用最優(yōu)特征子集訓(xùn)練支持向量機(jī)SVM;(6)利用最終的支持向量機(jī)模型對(duì)高鐵電能質(zhì)量的樣本數(shù)據(jù)進(jìn)行識(shí)別,獲得高鐵電能質(zhì)量數(shù)據(jù)的分類。該發(fā)明從海量監(jiān)測(cè)數(shù)據(jù)中提取高鐵運(yùn)行時(shí)的數(shù)據(jù),并能選擇出能反映高鐵運(yùn)行時(shí)的電能質(zhì)量特征,為電能質(zhì)量數(shù)據(jù)的挖掘分類提供了一種思路和方法。
【專利說(shuō)明】—種基于支持向量機(jī)的高鐵電能質(zhì)量數(shù)據(jù)的分類方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及電能質(zhì)量數(shù)據(jù)分類方法,具體涉及一種基于支持向量機(jī)的高鐵電能質(zhì)量數(shù)據(jù)的分類方法。
【背景技術(shù)】
[0002]隨著以特高壓電網(wǎng)為骨干網(wǎng)架、各級(jí)電網(wǎng)協(xié)調(diào)發(fā)展的堅(jiān)強(qiáng)智能電網(wǎng)建設(shè)加快,電網(wǎng)中產(chǎn)生電能質(zhì)量擾動(dòng)的因素不斷增加,使得電網(wǎng)所遭受的電能質(zhì)量問(wèn)題也日趨嚴(yán)重。為加強(qiáng)電網(wǎng)電能質(zhì)量管理,我國(guó)部分省(市)電力公司如上海、江蘇、福建、山西、遼寧、江西、河南、湖南等先后建立了全省(市)的電能質(zhì)量監(jiān)測(cè)系統(tǒng),部分省公司也建立了省內(nèi)的多個(gè)地市級(jí)電能質(zhì)量監(jiān)測(cè)系統(tǒng)。目前各省(市)電能質(zhì)量監(jiān)測(cè)系統(tǒng)基本達(dá)到了電能質(zhì)量基本數(shù)據(jù)采集、報(bào)表生成等功能,但在電能質(zhì)量信息挖掘方面,還缺乏高級(jí)分析技術(shù),致使采集到的海量電能質(zhì)量監(jiān)測(cè)數(shù)據(jù)得不到充分利用,造成了嚴(yán)重的數(shù)據(jù)浪費(fèi)。針對(duì)這種情況,亟需開(kāi)展電能質(zhì)量數(shù)據(jù)挖掘技術(shù),從電能質(zhì)量數(shù)據(jù)中提取有用的信息,從而使電能質(zhì)量監(jiān)測(cè)系統(tǒng)更好地服務(wù)于電網(wǎng)規(guī)劃、運(yùn)行和檢修等。然而,電能質(zhì)量監(jiān)測(cè)數(shù)據(jù)是一種多維海量數(shù)據(jù)集,其包括有效值數(shù)據(jù)和波形數(shù)據(jù),并且包括電壓偏差、頻率偏差、諧波、間諧波、電壓波動(dòng)與閃變、三相不平衡度、電壓暫升、電壓暫降和電壓短時(shí)中斷等多種指標(biāo),使得電能質(zhì)量監(jiān)測(cè)數(shù)據(jù)挖掘面臨巨大挑戰(zhàn)。
[0003]目前,數(shù)據(jù)挖掘在電能質(zhì)量分析中尚處于初級(jí)階段。針對(duì)電能質(zhì)量的擾動(dòng)識(shí)別分類問(wèn)題的研究比較多,實(shí)用性比較強(qiáng)。而針對(duì)干擾源特性分析,從海量監(jiān)測(cè)數(shù)據(jù)中提取干擾源運(yùn)行時(shí)的數(shù)據(jù)并根據(jù)監(jiān)測(cè)數(shù)據(jù)特征判斷干擾源類型識(shí)別的研究還較少。
【發(fā)明內(nèi)容】
[0004]針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明的目的是提供一種基于支持向量機(jī)的高鐵電能質(zhì)量數(shù)據(jù)的分類方法,基于支持向量機(jī)的回歸特征消去法(SVM-RFE)進(jìn)行高鐵負(fù)荷的電能質(zhì)量特征識(shí)別方法,進(jìn)行高鐵負(fù)荷電能質(zhì)量的特征選擇,利用最優(yōu)的特征子集訓(xùn)練支持向量機(jī),最后完成對(duì)有無(wú)高鐵負(fù)荷運(yùn)行的電能質(zhì)量數(shù)據(jù)分類。該發(fā)明從海量監(jiān)測(cè)數(shù)據(jù)中提取高鐵運(yùn)行時(shí)的數(shù)據(jù),并能選擇出反映高鐵運(yùn)行時(shí)的電能質(zhì)量特征,為電能質(zhì)量數(shù)據(jù)的挖掘分類提供了一種思路和方法。
[0005]本發(fā)明的目的是采用下述技術(shù)方案實(shí)現(xiàn)的:
[0006]本發(fā)明提供一種基于支持向量機(jī)的高鐵電能質(zhì)量數(shù)據(jù)的分類方法,其改進(jìn)之處在于,所述方法包括下述步驟:
[0007](I)通過(guò)在線的電能質(zhì)量監(jiān)測(cè)儀獲取高鐵電能質(zhì)量監(jiān)測(cè)數(shù)據(jù),進(jìn)行預(yù)處理后作為訓(xùn)練樣本集;
[0008](2)利用訓(xùn)練樣本集訓(xùn)練支持向量機(jī)SVM,獲得SVM模型、訓(xùn)練樣本集及測(cè)試樣本集的分類正確率;
[0009](3)基于支持向量機(jī)的回歸特征消去法進(jìn)行高鐵負(fù)荷電能質(zhì)量的特征選擇;[0010](4)綜合分類正確率和特征子集的個(gè)數(shù)對(duì)特征子集進(jìn)行優(yōu)劣評(píng)估,確定最優(yōu)特征子集;
[0011](5)利用最優(yōu)特征子集訓(xùn)練支持向量機(jī)SVM,獲得最終的支持向量機(jī)模型;
[0012](6)利用最終的支持向量機(jī)模型對(duì)高鐵電能質(zhì)量的樣本數(shù)據(jù)進(jìn)行識(shí)別,獲得高鐵電能質(zhì)量數(shù)據(jù)的分類。
[0013]進(jìn)一步地,所述步驟(1)中,高鐵電能質(zhì)量監(jiān)測(cè)數(shù)據(jù)包括電壓偏差、電流有效值、頻率偏差、有功功率、無(wú)功功率,視在功率、電量、諧波、間諧波、電壓波動(dòng)與閃變、三相不平衡度、電壓暫升、電壓暫降和電壓短時(shí)中斷;
[0014]所述諧波為0-50次的諧波。
[0015]進(jìn)一步地,所述步驟(1)中,預(yù)處理包括:
[0016]①將每3秒采樣的高鐵電能質(zhì)量監(jiān)測(cè)數(shù)據(jù),每20個(gè)采樣數(shù)據(jù)進(jìn)行平均處理,轉(zhuǎn)化為每分鐘I個(gè)樣本數(shù)據(jù)X' i ;
[0017]②將樣本數(shù)據(jù)按照每個(gè)特征進(jìn)行歸一化處理。假設(shè)X ' i =(X' U,X' i,2...., i,m)是第i個(gè)原始數(shù)據(jù)樣本,有m個(gè)特征,其中X' i,j為第i個(gè)樣本的第j個(gè)特征的值;歸一化的表達(dá)式如下:
【權(quán)利要求】
1.一種基于支持向量機(jī)的高鐵電能質(zhì)量數(shù)據(jù)的分類方法,其特征在于,所述方法包括下述步驟: (1)通過(guò)在線的電能質(zhì)量監(jiān)測(cè)儀獲取高鐵電能質(zhì)量監(jiān)測(cè)數(shù)據(jù),進(jìn)行預(yù)處理后作為訓(xùn)練樣本集; (2)利用訓(xùn)練樣本集訓(xùn)練支持向量機(jī)SVM,獲得SVM模型、訓(xùn)練樣本集及測(cè)試樣本集的分類正確率; (3)基于支持向量機(jī)的回歸特征消去法進(jìn)行高鐵負(fù)荷電能質(zhì)量的特征選擇; (4)綜合分類正確率和特征子集的個(gè)數(shù)對(duì)特征子集進(jìn)行優(yōu)劣評(píng)估,確定最優(yōu)特征子集; (5)利用最優(yōu)特征子集訓(xùn)練支持向量機(jī)SVM,獲得最終的支持向量機(jī)模型; (6)利用最終的支持向量機(jī)模型對(duì)高鐵電能質(zhì)量的樣本數(shù)據(jù)進(jìn)行識(shí)別,獲得高鐵電能質(zhì)量數(shù)據(jù)的分類。
2.如權(quán)利要求1所述的數(shù)據(jù)的分類方法,其特征在于,所述步驟(1)中,高鐵電能質(zhì)量監(jiān)測(cè)數(shù)據(jù)包括電壓偏差、電流有效值、頻率偏差、有功功率、無(wú)功功率,視在功率、電量、諧波、間諧波、電壓波動(dòng)與閃變、三相不平衡度、電壓暫升、電壓暫降和電壓短時(shí)中斷; 所述諧波為0-50次的諧波。
3.如權(quán)利要求1所述的數(shù)據(jù)的分類方法,其特征在于,所述步驟(1)中,預(yù)處理包括: ①將每3秒采樣的高鐵電能質(zhì)量監(jiān)測(cè)數(shù)據(jù),每20個(gè)采樣數(shù)據(jù)進(jìn)行平均處理,轉(zhuǎn)化為每分鐘I個(gè)樣本數(shù)據(jù); ②將樣本數(shù)據(jù)按照每個(gè)特征進(jìn)行歸一化處理。假設(shè)X'i=(x'i,2,...,x' i,m)是第i個(gè)原始數(shù)據(jù)樣本,具有m個(gè)特征,X, ,j為第i個(gè)樣本的第j個(gè)特征的值;歸一化的表達(dá)式如下:
4.如權(quán)利要求1所述的數(shù)據(jù)的分類方法,其特征在于,所述步驟(1)中,所述訓(xùn)練樣本集是將樣本數(shù)據(jù)xi和高鐵運(yùn)行狀態(tài)Ii = [+1,-1]相對(duì)應(yīng),即將有高鐵運(yùn)行狀態(tài)的電能質(zhì)量數(shù)據(jù)樣本判為標(biāo)識(shí)“+I”的類別;將其余數(shù)據(jù)樣本判為標(biāo)識(shí)“-1”的類別,最終形成歸一化后的樣本集為?.ν ,η為樣本數(shù)量。
5.如權(quán)利要求1所述的數(shù)據(jù)的分類方法,其特征在于,所述步驟(2)中,所述支持向量機(jī)SVM,是一個(gè)二分模式的分類器;建立支持向量機(jī)SVM模型指的是尋找最優(yōu)分類面,其表達(dá)式如下:
6.如權(quán)利要求1所述的數(shù)據(jù)的分類方法,其特征在于,所述步驟(3)中,基于支持向量機(jī)的回歸特征消去法進(jìn)行高鐵負(fù)荷電能質(zhì)量的特征選擇包括下述步驟: a、根據(jù)支持向量機(jī)SVM模型的最優(yōu)分類面即公式(2)中的支持向量及權(quán)值系數(shù)制定特征排序準(zhǔn)則,計(jì)算訓(xùn)練樣本特征子集中每個(gè)特征在該準(zhǔn)則下的排序準(zhǔn)則分?jǐn)?shù); b、對(duì)特征的排序準(zhǔn)則分?jǐn)?shù)按從大到小順序?qū)ζ鋵?duì)應(yīng)的特征進(jìn)行排序,選擇排在前面的特征,并消除掉排在最后的I個(gè)特征,形成新的特征子集; C、根據(jù)新的特征子集更新訓(xùn)練樣本集; d、使用更新后的訓(xùn)練樣本集,返回步驟(2)重新訓(xùn)練支持向量機(jī); e、重復(fù)迭代步驟(a)_(d),直到特征子集中剩余最后一個(gè)特征時(shí)結(jié)束。
7.如權(quán)利要求6所述的數(shù)據(jù)的分類方法,其特征在于,所述步驟(a)中,根據(jù)支持向量機(jī)SVM模型中的信息來(lái)制定特征排序準(zhǔn)則,是依據(jù)各特征對(duì)分類的貢獻(xiàn)來(lái)定義排序準(zhǔn)則;其排序準(zhǔn)則如下:對(duì)于線性支持向量機(jī)SVM,第i個(gè)特征的排序準(zhǔn)則分?jǐn)?shù)定義為DJ(i)=(Wi)2,其中=
8.如權(quán)利要求1所述的數(shù)據(jù)的分類方法,其特征在于,所述步驟(4)中,選擇分類正確率最大的特征子集作為最優(yōu)的特征子集;若特征子集對(duì)應(yīng)的分類正確率相同或相近,則取維數(shù)最小的特征子集作為最優(yōu)的特征子集。
9.如權(quán)利要求1所述的數(shù)據(jù)的分類方法,其特征在于,所述步驟(6)中,高鐵電能質(zhì)量的樣本數(shù)據(jù)是指將高鐵的電能質(zhì)量數(shù)據(jù)按照最優(yōu)的特征子集進(jìn)行組合歸一化后的數(shù)據(jù),組合歸一化后的數(shù)據(jù)作為樣本數(shù)據(jù)輸入最終的支持向量機(jī)模型。
【文檔編號(hào)】G06F17/30GK103605757SQ201310601083
【公開(kāi)日】2014年2月26日 申請(qǐng)日期:2013年11月25日 優(yōu)先權(quán)日:2013年11月25日
【發(fā)明者】楊岑玉, 王同勛, 周勝軍 申請(qǐng)人:國(guó)家電網(wǎng)公司, 國(guó)網(wǎng)智能電網(wǎng)研究院