一種網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法及系統(tǒng)與流程

文檔序號(hào)：12470224閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法及系統(tǒng)與流程

技術(shù)特征：

1.一種網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法，其特征在于，包括下述步驟：

步驟S110：構(gòu)建KDDCUP99數(shù)據(jù)集，并對(duì)所述數(shù)據(jù)集進(jìn)行處理，得到高維向量組；

步驟S120：基于Re-ReliefF算法剔除所述高維向量組中無關(guān)特征，構(gòu)成候選特征集；

步驟S130：基于改進(jìn)的Re-ReliefF算法獲得一個(gè)與所述候選特征集具有最小相關(guān)性的特征。

2.如權(quán)利要求1所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法，其特征在于，步驟S110中，構(gòu)建KDDCUP99數(shù)據(jù)集，并對(duì)所述數(shù)據(jù)集進(jìn)行處理，得到高維向量組，包括下述步驟：

將所述KDDCUP99數(shù)據(jù)集分為連續(xù)型數(shù)據(jù)及非數(shù)值型數(shù)據(jù)；

對(duì)所述連續(xù)型數(shù)據(jù)對(duì)連續(xù)型變量進(jìn)行預(yù)處理，將其數(shù)據(jù)取值從[min，max]映射到[0，1]區(qū)間；

對(duì)于所述非數(shù)值型數(shù)據(jù)離散化處理，利用編碼映射成數(shù)值；

用連續(xù)型變量的方法將所述數(shù)值從[min，max]映射到[0，1]區(qū)間。

3.如權(quán)利要求2所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法，其特征在于，步驟S120中，基于Re-ReliefF算法剔除所述高維向量組中無關(guān)特征，構(gòu)成候選特征集，包括下述步驟：

將所述高維向量組的原始特征個(gè)數(shù)記為N，Re-ReliefF階段設(shè)定迭代次數(shù)m，最近鄰樣本個(gè)數(shù)k，初始化權(quán)重W[A]＝0；

循環(huán)遍歷所述高維向量組中的樣本集，通過以下的權(quán)重公式計(jì)算并更新W[A]，權(quán)重公式如下：

$<mrow> <mi>w</mi> <mo>[</mo> <mi>A</mi> <mo>]</mo> <mo>=</mo> <mfrac> <mrow> <munderover> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <munder> <mi>Σ</mi> <mrow> <mi>C</mi> <mo>&NotEqual;</mo> <mi>c</mi> <mi>l</mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </munder> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mn>1</mn> <mo>-</mo> <mi>P</mi> <mrow> <mo>(</mo> <mi>c</mi> <mi>l</mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mo>(</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> </mfrac> <munderover> <mi>Σ</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mi>d</mi> <mi>i</mi> <mi>f</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>,</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>M</mi> <mi>j</mi> </msub> <mo>(</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mrow> <munderover> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <munderover> <mi>Σ</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mi>d</mi> <mi>i</mi> <mi>f</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>,</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>H</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>$

其中，m代表樣本抽樣次數(shù)，Mj(C)代表不同類別C中的第j個(gè)最近鄰樣本，P(C)代表C類目標(biāo)樣本數(shù)占樣本總數(shù)的比例，class(Ri)表示Ri所屬的類別，函數(shù)diff(A，R_i，R_j)是用來計(jì)算樣本實(shí)例R_i和R_j關(guān)于某個(gè)特征A之間的距離大?。?/p>

將所有的特征按照W[A]從大到小排序，按照特征權(quán)值最低大于0.001，選出候選特征集。

4.如權(quán)利要求1所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法，其特征在于，步驟S130中，基于改進(jìn)的Re-ReliefF算法獲得一個(gè)與所述候選特征集具有最小相關(guān)性的特征，包括下述步驟：

通過改進(jìn)的Re-ReliefF計(jì)算出所述選特征集中每個(gè)特征的權(quán)重，選擇其中最大的特征，構(gòu)成候選特征子集；

進(jìn)行遍歷，計(jì)算所述候選特征子集與類之間的皮爾遜相關(guān)系數(shù)c(f_j,s_i)；

根據(jù)以下的選擇準(zhǔn)則，選擇出特征子集，其中，m-1個(gè)特征，要從F-S_m-1的特征集中選出第m個(gè)特征，c(f_j,f_i)是特征間的皮爾遜相關(guān)系數(shù)，代表兩個(gè)特征間相關(guān)性大小的度量，其絕對(duì)值在[0,1]區(qū)間內(nèi)，

$<mrow> <munder> <mrow> <mi>M</mi> <mi>A</mi> <mi>X</mi> </mrow> <mrow> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <mi>F</mi> <mo>-</mo> <msub> <mi>S</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </munder> <mo>[</mo> <msub> <mi>F</mi> <mi>j</mi> </msub> <mo>÷</mo> <mfrac> <mn>1</mn> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> <munder> <mo>Σ</mo> <mrow> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msub> <mi>S</mi> <mrow> <mi>m</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </munder> <mo>|</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <mo>]</mo> <mo>;</mo> </mrow>$

使用SVM確定與所述候選特征集具有最小相關(guān)性的特征，形成特征子集。

5.一種網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇系統(tǒng)，其特征在于，包括：

數(shù)據(jù)采集模塊，用于構(gòu)建KDDCUP99數(shù)據(jù)集，并對(duì)所述數(shù)據(jù)集進(jìn)行處理，得到高維向量組；

第一數(shù)據(jù)處理模塊，用于基于Re-ReliefF算法剔除所述高維向量組中無關(guān)特征，構(gòu)成候選特征集；

第二數(shù)據(jù)處理模塊，基于改進(jìn)的Re-ReliefF算法獲得一個(gè)與所述候選特征集具有最小相關(guān)性的特征。

6.如權(quán)利要求5所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇系統(tǒng)，其特征在于，數(shù)據(jù)采集模塊包括：

數(shù)據(jù)分類單元，將所述KDDCUP99數(shù)據(jù)集分為連續(xù)型數(shù)據(jù)及非數(shù)值型數(shù)據(jù)；

數(shù)據(jù)處理單元，對(duì)所述連續(xù)型數(shù)據(jù)對(duì)連續(xù)型變量進(jìn)行預(yù)處理，將其數(shù)據(jù)取值從[min，max]映射到[0，1]區(qū)間；

數(shù)據(jù)離散單元，對(duì)于所述非數(shù)值型數(shù)據(jù)離散化處理，利用編碼映射成數(shù)值；及

數(shù)據(jù)映射單元，用連續(xù)型變量的方法將所述數(shù)值從[min，max]映射到[0，1]區(qū)間。

7.如權(quán)利要求5所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇系統(tǒng)，其特征在于，所述第一數(shù)據(jù)處理模塊包括：

初始化單元，用于將所述高維向量組的原始特征個(gè)數(shù)記為N，Re-ReliefF階段設(shè)定迭代次數(shù)m，最近鄰樣本個(gè)數(shù)k，初始化權(quán)重W[A]＝0；

第一計(jì)算單元，循環(huán)遍歷所述高維向量組中的樣本集，通過以下的權(quán)重公式計(jì)算并更新W[A]，權(quán)重公式如下：

$<mrow> <mi>w</mi> <mo>[</mo> <mi>A</mi> <mo>]</mo> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <munder> <mo>Σ</mo> <mrow> <mi>C</mi> <mo>&NotEqual;</mo> <mi>c</mi> <mi>l</mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </munder> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mn>1</mn> <mo>-</mo> <mi>P</mi> <mrow> <mo>(</mo> <mi>c</mi> <mi>l</mi> <mi>a</mi> <mi>s</mi> <mi>s</mi> <mo>(</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> </mfrac> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mi>d</mi> <mi>i</mi> <mi>f</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>,</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>M</mi> <mi>j</mi> </msub> <mo>(</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mi>d</mi> <mi>i</mi> <mi>f</mi> <mi>f</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>,</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>H</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>$

排序單元，用于將所有的特征按照W[A]從大到小排序，按照特征權(quán)值最低大于0.001，選出候選特征集。

8.如權(quán)利要求5所述的網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇系統(tǒng)，其特征在于，所述第二數(shù)據(jù)處理模塊包括：

特征子集候選單元，通過Re-ReliefF計(jì)算出所述選特征集中每個(gè)特征的權(quán)重，選擇其中最大的特征，構(gòu)成候選特征子集；

第二計(jì)算單元，用于進(jìn)行遍歷，計(jì)算所述候選特征子集與類之間的皮爾遜相關(guān)系數(shù)c(f_j,s_i)；

特征選擇單元，根據(jù)以下的選擇準(zhǔn)則，選擇出特征子集，其中，c(f_j,f_i)是特征間的皮爾遜相關(guān)系數(shù)，代表兩個(gè)特征間相關(guān)性大小的度量，其絕對(duì)值在[0,1]區(qū)間內(nèi)，

SVM單元，使用SVM確定與所述候選特征集具有最小相關(guān)性的特征，形成特征子集。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

網(wǎng)絡(luò)安全的特征相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種網(wǎng)絡(luò)安全數(shù)據(jù)的特征選擇方法及系統(tǒng)與流程