1.一種攻擊檢測(cè)方法,其特征在于,包括:
獲取gzip壓縮的待檢測(cè)web文本;
將所述待檢測(cè)web文本轉(zhuǎn)換為特征向量;
根據(jù)訓(xùn)練得到的分類器,以及所述特征向量,對(duì)所述待檢測(cè)web文本進(jìn)行攻擊檢測(cè)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
獲取初始特征詞集合,所述初始特征詞集合中包括一個(gè)或多個(gè)特征詞;
確定訓(xùn)練樣本和類別集合,所述類別集合包括:攻擊類別和非攻擊類別;
根據(jù)所述訓(xùn)練樣本中屬于攻擊類別的文本數(shù)、所述訓(xùn)練樣本中屬于非攻擊類別的文本數(shù)和所述訓(xùn)練樣本中出現(xiàn)每個(gè)特征詞的文本數(shù),獲取攻擊類別對(duì)應(yīng)的第一先驗(yàn)概率、非攻擊類別對(duì)應(yīng)的第二先驗(yàn)概率,以及每個(gè)特征詞在攻擊類別下的第一條件概率和在非攻擊類別下的第二條件概率;
將所述第一先驗(yàn)概率、所述第二先驗(yàn)概率、所述第一條件概率和所述第二條件概率作為所述分類器的分類參數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括:
對(duì)于所述初始特征詞集合中的每個(gè)特征詞,生成字節(jié)長(zhǎng)度大于預(yù)設(shè)長(zhǎng)度的一個(gè)或多個(gè)子串,得到所述初始特征詞集合的子串矩陣;
獲取所述子串矩陣中每個(gè)子串對(duì)應(yīng)的概率,得到子串概率矩陣。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)以下公式獲取所述子串矩陣中每個(gè)子串對(duì)應(yīng)的概率:
Pij=T0ij/T1ij
其中,i∈[1,n],j∈[1,m],n為所述特征詞的個(gè)數(shù),m為所述初始特征詞集合中具有最多子串的特征詞的子串個(gè)數(shù);T0ij為子串Wij在gzip壓縮的訓(xùn)練樣本中出現(xiàn)且所述子串Wij與一替換信息相鄰,則在gzip解碼后的訓(xùn)練樣本中,所述子串Wij對(duì)應(yīng)的特征詞Wi出現(xiàn)的次數(shù);T1ij為在gzip壓縮的訓(xùn)練樣本中,所述子串Wij出現(xiàn)且所述子串Wij與替換信息相鄰的次數(shù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,將所述待檢測(cè)web文本轉(zhuǎn)換為的特征向量的步驟包括:
若所述初始特征詞集合中的一特征詞Wj在所述待檢測(cè)web文本中出現(xiàn),將與所述特征詞Wj對(duì)應(yīng)的特征向量中的元素Vj的值設(shè)為1;
若所述初始特征詞集合中的所述特征詞Wj未在所述待檢測(cè)web文本中出現(xiàn),將所述元素Vj的值設(shè)為所述特征詞Wj的最長(zhǎng)子串在所述子串概率矩陣中的對(duì)應(yīng)值。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,將所述待檢測(cè)web文本轉(zhuǎn)換為的特征向量的步驟包括:
實(shí)時(shí)獲取待檢測(cè)web文本的目標(biāo)數(shù)據(jù)塊;
當(dāng)塊結(jié)束標(biāo)志不為1時(shí),檢測(cè)所述目標(biāo)數(shù)據(jù)塊的編碼標(biāo)志位;
若所述目標(biāo)數(shù)據(jù)塊的編碼標(biāo)志位為0,則根據(jù)所述初始特征詞集合和所述子串概率矩陣,對(duì)所述目標(biāo)數(shù)據(jù)塊進(jìn)行匹配獲得所述目標(biāo)數(shù)據(jù)塊對(duì)應(yīng)的特征向量;
若所述目標(biāo)數(shù)據(jù)塊的編碼標(biāo)志位為1,則進(jìn)行靜態(tài)huffman解碼,并根據(jù)所述初始特征詞集合和所述子串概率矩陣,對(duì)解碼后的數(shù)據(jù)塊進(jìn)行匹配獲得所述目標(biāo)數(shù)據(jù)塊對(duì)應(yīng)的特征向量;
若所述目標(biāo)數(shù)據(jù)塊的編碼標(biāo)志位為2,則進(jìn)行動(dòng)態(tài)huffman解碼,并根據(jù)所述初始特征詞集合和所述子串概率矩陣,對(duì)解碼后的數(shù)據(jù)塊進(jìn)行匹配獲得所述目標(biāo)數(shù)據(jù)塊對(duì)應(yīng)的特征向量;
將所述待檢測(cè)web文本所包括的所有目標(biāo)數(shù)據(jù)塊的特征向量疊加以得到所述待檢測(cè)web文本的特征向量。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)訓(xùn)練得到的分類器,以及所述特征向量,對(duì)所述待檢測(cè)web文本進(jìn)行分類攻擊檢測(cè)的步驟包括:
根據(jù)所述特征向量、所述第一先驗(yàn)概率、所述第二先驗(yàn)概率、所述第一條件概率和所述第二條件概率,獲取所述待檢測(cè)web文本屬于攻擊類別的第一后驗(yàn)概率和屬于非攻擊類別的第二后驗(yàn)概率;
根據(jù)所述第一后驗(yàn)概率和所述第二后驗(yàn)概率,將所述待檢測(cè)web文本歸屬于攻擊類別或非攻擊類別。
8.一種攻擊檢測(cè)裝置,其特征在于,包括:
第一獲取模塊,用于獲取gzip壓縮的待檢測(cè)web文本;
轉(zhuǎn)換模塊,用于將所述待檢測(cè)web文本轉(zhuǎn)換為特征向量;
檢測(cè)模塊,用于根據(jù)訓(xùn)練得到的分類器,以及所述特征向量,對(duì)所述待檢測(cè)web文本進(jìn)行攻擊檢測(cè)。
9.一種網(wǎng)絡(luò)設(shè)備,其特征在于,包括上述權(quán)利要求8所述的攻擊檢測(cè)裝置。
10.一種終端設(shè)備,其特征在于,包括上述權(quán)利要求8所述的攻擊檢測(cè)裝置。