亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法及系統(tǒng)與流程

文檔序號(hào):12470224閱讀:來源:國知局

技術(shù)特征:

1.一種網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法,其特征在于,包括下述步驟:

步驟S110:構(gòu)建KDDCUP99數(shù)據(jù)集,并對(duì)所述數(shù)據(jù)集進(jìn)行處理,得到高維向量組;

步驟S120:基于Re-ReliefF算法剔除所述高維向量組中無關(guān)特征,構(gòu)成候選特征集;

步驟S130:基于改進(jìn)的Re-ReliefF算法獲得一個(gè)與所述候選特征集具有最小相關(guān)性的特征。

2.如權(quán)利要求1所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法,其特征在于,步驟S110中,構(gòu)建KDDCUP99數(shù)據(jù)集,并對(duì)所述數(shù)據(jù)集進(jìn)行處理,得到高維向量組,包括下述步驟:

將所述KDDCUP99數(shù)據(jù)集分為連續(xù)型數(shù)據(jù)及非數(shù)值型數(shù)據(jù);

對(duì)所述連續(xù)型數(shù)據(jù)對(duì)連續(xù)型變量進(jìn)行預(yù)處理,將其數(shù)據(jù)取值從[min,max]映射到[0,1]區(qū)間;

對(duì)于所述非數(shù)值型數(shù)據(jù)離散化處理,利用編碼映射成數(shù)值;

用連續(xù)型變量的方法將所述數(shù)值從[min,max]映射到[0,1]區(qū)間。

3.如權(quán)利要求2所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法,其特征在于,步驟S120中,基于Re-ReliefF算法剔除所述高維向量組中無關(guān)特征,構(gòu)成候選特征集,包括下述步驟:

將所述高維向量組的原始特征個(gè)數(shù)記為N,Re-ReliefF階段設(shè)定迭代次數(shù)m,最近鄰樣本個(gè)數(shù)k,初始化權(quán)重W[A]=0;

循環(huán)遍歷所述高維向量組中的樣本集,通過以下的權(quán)重公式計(jì)算并更新W[A],權(quán)重公式如下:

<mrow> <mi>w</mi> <mo>&lsqb;</mo> <mi>A</mi> <mo>&rsqb;</mo> <mo>=</mo> <mfrac> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <munder> <mi>&Sigma;</mi> <mrow> <mi>C</mi> <mo>&NotEqual;</mo> <mi>c</mi> <mi>l</mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </munder> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mn>1</mn> <mo>-</mo> <mi>P</mi> <mrow> <mo>(</mo> <mi>c</mi> <mi>l</mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mo>(</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> </mfrac> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mi>d</mi> <mi>i</mi> <mi>f</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>,</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>M</mi> <mi>j</mi> </msub> <mo>(</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mi>d</mi> <mi>i</mi> <mi>f</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>,</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>H</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

其中,m代表樣本抽樣次數(shù),Mj(C)代表不同類別C中的第j個(gè)最近鄰樣本,P(C)代表C類目標(biāo)樣本數(shù)占樣本總數(shù)的比例,class(Ri)表示Ri所屬的類別,函數(shù)diff(A,Ri,Rj)是用來計(jì)算樣本實(shí)例Ri和Rj關(guān)于某個(gè)特征A之間的距離大?。?/p>

將所有的特征按照W[A]從大到小排序,按照特征權(quán)值最低大于0.001,選出候選特征集。

4.如權(quán)利要求1所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法,其特征在于,步驟S130中,基于改進(jìn)的Re-ReliefF算法獲得一個(gè)與所述候選特征集具有最小相關(guān)性的特征,包括下述步驟:

通過改進(jìn)的Re-ReliefF計(jì)算出所述選特征集中每個(gè)特征的權(quán)重,選擇其中最大的特征,構(gòu)成候選特征子集;

進(jìn)行遍歷,計(jì)算所述候選特征子集與類之間的皮爾遜相關(guān)系數(shù)c(fj,si);

根據(jù)以下的選擇準(zhǔn)則,選擇出特征子集,其中,m-1個(gè)特征,要從F-Sm-1的特征集中選出第m個(gè)特征,c(fj,fi)是特征間的皮爾遜相關(guān)系數(shù),代表兩個(gè)特征間相關(guān)性大小的度量,其絕對(duì)值在[0,1]區(qū)間內(nèi),

<mrow> <munder> <mrow> <mi>M</mi> <mi>A</mi> <mi>X</mi> </mrow> <mrow> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <mi>F</mi> <mo>-</mo> <msub> <mi>S</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </munder> <mo>&lsqb;</mo> <msub> <mi>F</mi> <mi>j</mi> </msub> <mo>&divide;</mo> <mfrac> <mn>1</mn> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <munder> <mo>&Sigma;</mo> <mrow> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msub> <mi>S</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </munder> <mo>|</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <mo>&rsqb;</mo> <mo>;</mo> </mrow>

使用SVM確定與所述候選特征集具有最小相關(guān)性的特征,形成特征子集。

5.一種網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇系統(tǒng),其特征在于,包括:

數(shù)據(jù)采集模塊,用于構(gòu)建KDDCUP99數(shù)據(jù)集,并對(duì)所述數(shù)據(jù)集進(jìn)行處理,得到高維向量組;

第一數(shù)據(jù)處理模塊,用于基于Re-ReliefF算法剔除所述高維向量組中無關(guān)特征,構(gòu)成候選特征集;

第二數(shù)據(jù)處理模塊,基于改進(jìn)的Re-ReliefF算法獲得一個(gè)與所述候選特征集具有最小相關(guān)性的特征。

6.如權(quán)利要求5所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇系統(tǒng),其特征在于,數(shù)據(jù)采集模塊包括:

數(shù)據(jù)分類單元,將所述KDDCUP99數(shù)據(jù)集分為連續(xù)型數(shù)據(jù)及非數(shù)值型數(shù)據(jù);

數(shù)據(jù)處理單元,對(duì)所述連續(xù)型數(shù)據(jù)對(duì)連續(xù)型變量進(jìn)行預(yù)處理,將其數(shù)據(jù)取值從[min,max]映射到[0,1]區(qū)間;

數(shù)據(jù)離散單元,對(duì)于所述非數(shù)值型數(shù)據(jù)離散化處理,利用編碼映射成數(shù)值;及

數(shù)據(jù)映射單元,用連續(xù)型變量的方法將所述數(shù)值從[min,max]映射到[0,1]區(qū)間。

7.如權(quán)利要求5所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇系統(tǒng),其特征在于,所述第一數(shù)據(jù)處理模塊包括:

初始化單元,用于將所述高維向量組的原始特征個(gè)數(shù)記為N,Re-ReliefF階段設(shè)定迭代次數(shù)m,最近鄰樣本個(gè)數(shù)k,初始化權(quán)重W[A]=0;

第一計(jì)算單元,循環(huán)遍歷所述高維向量組中的樣本集,通過以下的權(quán)重公式計(jì)算并更新W[A],權(quán)重公式如下:

<mrow> <mi>w</mi> <mo>&lsqb;</mo> <mi>A</mi> <mo>&rsqb;</mo> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <munder> <mo>&Sigma;</mo> <mrow> <mi>C</mi> <mo>&NotEqual;</mo> <mi>c</mi> <mi>l</mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </munder> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mn>1</mn> <mo>-</mo> <mi>P</mi> <mrow> <mo>(</mo> <mi>c</mi> <mi>l</mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mo>(</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mi>d</mi> <mi>i</mi> <mi>f</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>,</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>M</mi> <mi>j</mi> </msub> <mo>(</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mi>d</mi> <mi>i</mi> <mi>f</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>,</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>H</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

其中,m代表樣本抽樣次數(shù),Mj(C)代表不同類別C中的第j個(gè)最近鄰樣本,P(C)代表C類目標(biāo)樣本數(shù)占樣本總數(shù)的比例,class(Ri)表示Ri所屬的類別,函數(shù)diff(A,Ri,Rj)是用來計(jì)算樣本實(shí)例Ri和Rj關(guān)于某個(gè)特征A之間的距離大小;

排序單元,用于將所有的特征按照W[A]從大到小排序,按照特征權(quán)值最低大于0.001,選出候選特征集。

8.如權(quán)利要求5所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇系統(tǒng),其特征在于,所述第二數(shù)據(jù)處理模塊包括:

特征子集候選單元,通過Re-ReliefF計(jì)算出所述選特征集中每個(gè)特征的權(quán)重,選擇其中最大的特征,構(gòu)成候選特征子集;

第二計(jì)算單元,用于進(jìn)行遍歷,計(jì)算所述候選特征子集與類之間的皮爾遜相關(guān)系數(shù)c(fj,si);

特征選擇單元,根據(jù)以下的選擇準(zhǔn)則,選擇出特征子集,其中,c(fj,fi)是特征間的皮爾遜相關(guān)系數(shù),代表兩個(gè)特征間相關(guān)性大小的度量,其絕對(duì)值在[0,1]區(qū)間內(nèi),

<mrow> <munder> <mrow> <mi>M</mi> <mi>A</mi> <mi>X</mi> </mrow> <mrow> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <mi>F</mi> <mo>-</mo> <msub> <mi>S</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </munder> <mo>&lsqb;</mo> <msub> <mi>F</mi> <mi>j</mi> </msub> <mo>&divide;</mo> <mfrac> <mn>1</mn> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <munder> <mo>&Sigma;</mo> <mrow> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msub> <mi>S</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </munder> <mo>|</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <mo>&rsqb;</mo> <mo>;</mo> </mrow>

SVM單元,使用SVM確定與所述候選特征集具有最小相關(guān)性的特征,形成特征子集。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1