基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)方法

文檔序號(hào)：7786907閱讀：127來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)方法
技術(shù)領(lǐng)域：
本發(fā)明是一種入侵檢測(cè)技術(shù)方案，主要將數(shù)據(jù)挖掘技術(shù)應(yīng)用到實(shí)時(shí)入侵檢測(cè)應(yīng)用中，屬于計(jì)算機(jī)網(wǎng)絡(luò)安全技術(shù)領(lǐng)域。
背景技術(shù)：
隨著信息技術(shù)的高速發(fā)展，網(wǎng)絡(luò)入侵的風(fēng)險(xiǎn)性和機(jī)會(huì)也相應(yīng)地急劇增多，設(shè)計(jì)安全措施來(lái)防范未經(jīng)授權(quán)訪(fǎng)問(wèn)系統(tǒng)的資源和數(shù)據(jù)或惡意的攻擊和入侵，成為當(dāng)前網(wǎng)絡(luò)安全領(lǐng)域的一個(gè)十分重要而迫切的問(wèn)題。作為信息安全的重要支撐技術(shù)之一的入侵檢測(cè)技術(shù)獲得了顯著發(fā)展，成為安全保護(hù)體系結(jié)構(gòu)中的一個(gè)重要的組成部分。入侵檢測(cè)是指在特定的網(wǎng)絡(luò)環(huán)境中發(fā)現(xiàn)和識(shí)別未經(jīng)授權(quán)的訪(fǎng)問(wèn)或惡意的攻擊和入侵，并對(duì)此做出反應(yīng)的過(guò)程。入侵檢測(cè)作為一種動(dòng)態(tài)的安全防護(hù)手段，它能主動(dòng)尋找入侵信號(hào)，提供系統(tǒng)對(duì)外部攻擊、內(nèi)部攻擊以及誤操作的抵御能力，對(duì)系統(tǒng)進(jìn)行保護(hù)。在入侵檢測(cè)的方法中，統(tǒng)計(jì)方法的應(yīng)用最為廣泛。統(tǒng)計(jì)方法通過(guò)收集長(zhǎng)時(shí)間的合法用戶(hù)的相關(guān)數(shù)據(jù)來(lái)定義正常的行為，當(dāng)前行為如果與正常行為發(fā)生偏離，并大于某一閾值則被視為攻擊。目前，對(duì)入侵檢測(cè)的研究主要有以下幾個(gè)方面基于神經(jīng)網(wǎng)絡(luò)的入侵檢測(cè)的研究；基于序列分析的網(wǎng)絡(luò)入侵檢測(cè)方法的研究；基于機(jī)器學(xué)習(xí)的入侵檢測(cè)；異類(lèi)檢測(cè)；基于生物免疫系統(tǒng)原理基礎(chǔ)設(shè)計(jì)的入侵檢測(cè)。但是現(xiàn)在的大多數(shù)入侵檢測(cè)系統(tǒng)存在各種各樣的問(wèn)題，主要包括
(1)缺乏有效性現(xiàn)存的規(guī)則庫(kù)和知識(shí)庫(kù)以及統(tǒng)計(jì)的方法都是基于專(zhuān)家知識(shí)的手工編碼，面對(duì)復(fù)雜的網(wǎng)絡(luò)環(huán)境，專(zhuān)家知識(shí)往往不全面不精確；
(2)缺乏適應(yīng)性編寫(xiě)檢測(cè)代碼時(shí)，專(zhuān)家一般著眼于分析目前己知的系統(tǒng)漏洞或攻擊模式，對(duì)未知的攻擊手段缺乏檢測(cè)能力。(3)有限的擴(kuò)展性由于專(zhuān)家根據(jù)經(jīng)驗(yàn)設(shè)計(jì)檢測(cè)模型，往往導(dǎo)致這樣的模型只針對(duì)某一特定的檢測(cè)環(huán)境，原有的檢測(cè)規(guī)則和檢測(cè)模型一般很難修改或與新的合并。我們需要找到一種提高入侵檢測(cè)系統(tǒng)有效性、適用性和擴(kuò)展性的方法。由此，產(chǎn)生了在傳統(tǒng)入侵檢測(cè)技術(shù)基礎(chǔ)上利用數(shù)據(jù)挖掘技術(shù)，分析多個(gè)檢測(cè)引擎提交的審計(jì)數(shù)據(jù)以發(fā)現(xiàn)更為復(fù)雜的入侵行為的檢測(cè)方法。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中識(shí)別出有效的、新穎的、潛在有用的，以及最終可以理解的知識(shí)和模式的高級(jí)操作過(guò)程，其目的就是從海量的數(shù)據(jù)集合中提取隱含的、先前未知的、對(duì)決策有潛在價(jià)值的規(guī)則。把數(shù)據(jù)挖掘應(yīng)用于入侵檢測(cè)系統(tǒng)的優(yōu)點(diǎn)在于系統(tǒng)能夠從大量的審計(jì)數(shù)據(jù)中自動(dòng)產(chǎn)生精確適用的檢測(cè)模型，使入侵檢測(cè)系統(tǒng)適用于任何計(jì)算環(huán)境。

發(fā)明內(nèi)容
技術(shù)問(wèn)題本發(fā)明的目的是提出一種基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)方法，在實(shí)施檢測(cè)方法的分布式實(shí)時(shí)系統(tǒng)架構(gòu)中，增加兩個(gè)自適應(yīng)管理模塊自適應(yīng)策略管理模塊，簡(jiǎn)稱(chēng) ASM ；自適應(yīng)模式管理模塊，簡(jiǎn)稱(chēng)AMM。本發(fā)明采用關(guān)聯(lián)規(guī)則及頻繁模式算法構(gòu)造檢測(cè)模型，以減少人工編碼，提高入侵檢測(cè)系統(tǒng)的自動(dòng)化能力和高效性。技術(shù)方案本發(fā)明的實(shí)現(xiàn)是將數(shù)據(jù)挖掘技術(shù)應(yīng)用到入侵檢測(cè)中以提供一種有效實(shí)時(shí)的檢測(cè)方法。該方法在分布式實(shí)時(shí)系統(tǒng)架構(gòu)中，增加了兩個(gè)自適應(yīng)管理模塊自適應(yīng)策略管理模塊(ASM)和自適應(yīng)模式管理模塊(AMM)。這兩個(gè)模塊用于實(shí)現(xiàn)基于數(shù)據(jù)挖掘的入侵檢測(cè)系統(tǒng)檢測(cè)策略及檢測(cè)模型的自動(dòng)生成與分發(fā)。這個(gè)結(jié)構(gòu)可以解決有關(guān)數(shù)據(jù)收集的自動(dòng)化，檢測(cè)模型和策略的自動(dòng)生成與配置以及數(shù)據(jù)的實(shí)時(shí)評(píng)估方面的問(wèn)題。它是一個(gè)由一些組件類(lèi)構(gòu)成的分布式系統(tǒng)，而且這些組件類(lèi)可以在系統(tǒng)框架內(nèi)進(jìn)行靈活的改變，以適應(yīng)不同的環(huán)境變化和用戶(hù)需求。基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)方法的步驟如下
1).感應(yīng)器從系統(tǒng)環(huán)境或者網(wǎng)絡(luò)環(huán)境里面收集信息并格式化，然后發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)起來(lái)，所有的感應(yīng)器實(shí)現(xiàn)一個(gè)基本審計(jì)模塊框架，它在可擴(kuò)展標(biāo)記語(yǔ)言XML中編碼，由原始數(shù)據(jù)計(jì)算特征；
2).數(shù)據(jù)分析引擎實(shí)時(shí)的從數(shù)據(jù)倉(cāng)庫(kù)提取信息，將數(shù)據(jù)分成異常數(shù)據(jù)集與正常數(shù)據(jù)集，并利用標(biāo)記工具做相應(yīng)的標(biāo)記，對(duì)己標(biāo)記的信息進(jìn)行特征提取，并將標(biāo)記的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中，以便模式生成器進(jìn)行模式挖掘；
3).檢測(cè)器接收由感應(yīng)器處理過(guò)的數(shù)據(jù)，用一個(gè)檢測(cè)模型來(lái)檢查數(shù)據(jù)，判斷是否有攻擊，檢測(cè)器也把結(jié)果發(fā)送給數(shù)據(jù)倉(cāng)庫(kù)去做進(jìn)一步的分析；
4).自適應(yīng)模式管理器訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)里面標(biāo)記的及未被標(biāo)記過(guò)的異常的數(shù)據(jù)，經(jīng)模式生成器生成新的檢測(cè)模式后，存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中備用，當(dāng)生成一種新的模式后，模式分發(fā)器負(fù)責(zé)將檢測(cè)器的模式更新；
5).自適應(yīng)策略管理器提取數(shù)據(jù)倉(cāng)庫(kù)中的入侵特征，經(jīng)過(guò)分類(lèi)器分類(lèi)后，策略生成器生成一種新的檢測(cè)策略，將這些數(shù)據(jù)分類(lèi)為可疑的或者是正常的，一旦一個(gè)策略產(chǎn)生出來(lái)，它就會(huì)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中的策略庫(kù)中，策略分發(fā)器將產(chǎn)生的新的策略配置到檢測(cè)器上。自適應(yīng)模式管理器的實(shí)現(xiàn)步驟包括
1).模式生成器查詢(xún)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)，開(kāi)始運(yùn)行并且產(chǎn)生出一個(gè)模式；
2).將該模式編碼為XML格式并且發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)中去；
3).模式生成器給模式分發(fā)器發(fā)出信號(hào)表明一個(gè)新的模式己經(jīng)生效；
4).模式分發(fā)器收到信號(hào)后自動(dòng)的發(fā)送該模式來(lái)更新檢測(cè)器模塊的模式庫(kù)。自適應(yīng)策略管理器的實(shí)現(xiàn)步驟包括
1).對(duì)數(shù)據(jù)倉(cāng)庫(kù)中被標(biāo)記成正常和異常的數(shù)據(jù)進(jìn)行比較，提取出與正常數(shù)據(jù)集相差較大的入侵?jǐn)?shù)據(jù)集，形成入侵模式；
2).提取入侵模式的特征屬性，使用分類(lèi)器生成新的分類(lèi)規(guī)則；
3).根據(jù)新的分類(lèi)規(guī)則，策略生成器生成一種新的檢測(cè)策略并存儲(chǔ)到策略庫(kù)；
4).策略分發(fā)器將生成的檢測(cè)策略配置到檢測(cè)器上。有益效果和傳統(tǒng)的入侵檢測(cè)方法相比，本發(fā)明有許多的優(yōu)點(diǎn) 一是由感應(yīng)器和檢測(cè)器提供實(shí)時(shí)檢測(cè)能力；
二是該系統(tǒng)的分布式架構(gòu)允許數(shù)據(jù)收集和數(shù)據(jù)存儲(chǔ)自動(dòng)化。通過(guò)對(duì)感應(yīng)器進(jìn)行一定的配置就可以自動(dòng)的實(shí)現(xiàn)數(shù)據(jù)的收集和存儲(chǔ)；
三是該系統(tǒng)的分布式架構(gòu)允許入侵檢測(cè)系統(tǒng)從異構(gòu)系統(tǒng)中收集數(shù)據(jù)，因?yàn)楦袘?yīng)器將數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)的格式。將所有收集上來(lái)的數(shù)據(jù)通過(guò)使用XML標(biāo)記語(yǔ)言來(lái)存放到數(shù)據(jù)倉(cāng)庫(kù)中，數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)可以靈活的存儲(chǔ)各種類(lèi)型的信息。四是采用數(shù)據(jù)標(biāo)簽工具免除了系統(tǒng)管理員費(fèi)時(shí)和費(fèi)力的手工標(biāo)記勞動(dòng)；
五是典型的網(wǎng)絡(luò)環(huán)境里，有著大量的模式需要通過(guò)網(wǎng)絡(luò)來(lái)配置，因此模式的管理是一個(gè)艱巨的任務(wù)。本發(fā)明通過(guò)AMM模塊解決了檢測(cè)模式的配置和管理問(wèn)題。通過(guò)使用檢測(cè)模式生成器來(lái)生成模式。并且將這些模式存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中。數(shù)據(jù)倉(cāng)庫(kù)具有足夠的能力來(lái)處理各種類(lèi)型的模式，因此該系統(tǒng)對(duì)于各種各樣的模式都是適用的。通過(guò)模式分發(fā)器，系統(tǒng)可以很靈活的更新檢測(cè)器中的模式；
六是該系統(tǒng)提供給用戶(hù)一些功能來(lái)實(shí)現(xiàn)對(duì)于不同數(shù)據(jù)的分析能力。數(shù)據(jù)分析工具可以從數(shù)據(jù)倉(cāng)庫(kù)中檢索數(shù)據(jù)，對(duì)這些數(shù)據(jù)執(zhí)行某一類(lèi)計(jì)算，然后將計(jì)算所得到的新的數(shù)據(jù)發(fā)送給數(shù)據(jù)倉(cāng)庫(kù)，或者通過(guò)其他方式來(lái)使用這些新的信息。數(shù)據(jù)分析工具包括三種類(lèi)型，分別是數(shù)據(jù)辨別，特征提取和可視化。數(shù)據(jù)辨別是一個(gè)非常重要的領(lǐng)域。以前數(shù)據(jù)的辨別分析主要還是手工來(lái)完成。計(jì)算機(jī)安全專(zhuān)家們不得不在大量的數(shù)據(jù)中進(jìn)行搜尋，甚至是上百萬(wàn)條記錄中來(lái)查找可疑的行為。效率很低，而且昂貴。該系統(tǒng)提供了相應(yīng)的組件來(lái)實(shí)現(xiàn)數(shù)據(jù)分析判斷過(guò)程的自動(dòng)化；
七是現(xiàn)在很多入侵檢測(cè)系統(tǒng)只有一種檢測(cè)策略，對(duì)任何環(huán)境都用這個(gè)策略來(lái)檢測(cè)，而本發(fā)明采用自動(dòng)生成與分發(fā)策略，擴(kuò)展了檢測(cè)強(qiáng)度與范圍，系統(tǒng)的誤報(bào)與漏報(bào)率降低，可信度得到了提高。

圖1是基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)體系結(jié)構(gòu)圖。圖2是體系結(jié)構(gòu)各組件間工作關(guān)系圖。圖3是數(shù)據(jù)分析引擎體系結(jié)構(gòu)圖。
具體實(shí)施例方式圖1是本發(fā)明的一個(gè)體系結(jié)構(gòu)，其中包括多個(gè)感應(yīng)器、多個(gè)檢測(cè)器、一個(gè)數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)分析引擎、自適應(yīng)策略管理器和自適應(yīng)模式管理器。該系統(tǒng)采用一種分布式架構(gòu)，由一系列的自動(dòng)化組件來(lái)組成，這里的組件在設(shè)計(jì)上是獨(dú)立的，不過(guò)都可以通過(guò)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行集中管理。組件之間通過(guò)公共協(xié)議來(lái)互相訪(fǎng)問(wèn)，此處的公共協(xié)議采用可擴(kuò)展標(biāo)記語(yǔ)言 (XML)。各種組件之間的基本工作關(guān)系如圖2所示。下面是本發(fā)明的主要工作流程
感應(yīng)器從系統(tǒng)環(huán)境或者網(wǎng)絡(luò)環(huán)境里面收集信息并格式化，然后發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)起來(lái)，數(shù)據(jù)分析引擎實(shí)時(shí)的從數(shù)據(jù)倉(cāng)庫(kù)提取信息，利用標(biāo)記工具對(duì)數(shù)據(jù)進(jìn)行標(biāo)記，對(duì)己標(biāo)記的信息進(jìn)行特征提取。感應(yīng)器是與其他部分隔離開(kāi)來(lái)的。所有的感應(yīng)器來(lái)實(shí)現(xiàn)一個(gè)基本審計(jì)模塊框架，它在XML中編碼，由原始數(shù)據(jù)計(jì)算特征。分析引擎將數(shù)據(jù)分成異常數(shù)據(jù)集與正常數(shù)據(jù)集，并做相應(yīng)的標(biāo)記，然后存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中，以便模式生成器進(jìn)行模式挖掘。用戶(hù)可以通過(guò)客戶(hù)端實(shí)時(shí)的檢測(cè)分析結(jié)果。檢測(cè)器接收由感應(yīng)器處理過(guò)的數(shù)據(jù)，用一個(gè)檢測(cè)模型來(lái)檢查數(shù)據(jù)，判斷是否有攻擊。檢測(cè)器也把結(jié)果發(fā)送給數(shù)據(jù)倉(cāng)庫(kù)去做進(jìn)一步的分析。自適應(yīng)模式管理器訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)里面標(biāo)記的及未被標(biāo)記過(guò)的異常的數(shù)據(jù)，經(jīng)模式生成器生成新的檢測(cè)模式后，存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中備用。當(dāng)生成一種新的模式后，模式分發(fā)器負(fù)責(zé)將檢測(cè)器的模式更新。自適應(yīng)策略管理器，提取數(shù)據(jù)倉(cāng)庫(kù)中的入侵特征，經(jīng)過(guò)分類(lèi)器分類(lèi)后，策略生成器生成一種新的檢測(cè)策略。將這些數(shù)據(jù)分類(lèi)為可疑的或者是正常的。一旦一個(gè)策略產(chǎn)生出來(lái)，它就會(huì)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中的策略庫(kù)中。策略分發(fā)器將產(chǎn)生的新的策略配置到實(shí)時(shí)檢測(cè)器上。檢測(cè)器從ASM及AMM上接收到新的檢測(cè)策略及模式的同時(shí)也要從感應(yīng)器上接受審計(jì)數(shù)據(jù)。檢測(cè)器可以采用這些新的策略及模式來(lái)評(píng)估從感應(yīng)器上得來(lái)的數(shù)據(jù)。從而判斷是否發(fā)生了入侵。因?yàn)樵撓到y(tǒng)由數(shù)據(jù)倉(cāng)庫(kù)集中式管理，因此將來(lái)開(kāi)發(fā)的新的模塊可以很容易的集成到入侵檢測(cè)系統(tǒng)中來(lái)。數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)和模型存儲(chǔ)的中心，這樣集中存儲(chǔ)數(shù)據(jù)的好處是不同組件可以異步控制同一部分?jǐn)?shù)據(jù)，也使得綜合多個(gè)感應(yīng)器的數(shù)據(jù)變得容易。通過(guò)聯(lián)系從不同入侵檢測(cè)系統(tǒng)處理的數(shù)據(jù)結(jié)果或一段時(shí)間內(nèi)收集的數(shù)據(jù)，就有可能檢測(cè)出復(fù)雜的、大規(guī)模的入侵攻
擊ο1.實(shí)時(shí)組件
本發(fā)明使用兩種基本的組件來(lái)提供實(shí)時(shí)檢測(cè)的能力感應(yīng)器和檢測(cè)器。感應(yīng)器從審計(jì)流中收集數(shù)據(jù)并且使用XML標(biāo)記語(yǔ)言將數(shù)據(jù)格式化。然后這些數(shù)據(jù)被發(fā)送到檢測(cè)器中進(jìn)行檢測(cè)。檢測(cè)器使用檢測(cè)策略和模式來(lái)判斷這些數(shù)據(jù)是否包含入侵。如果包含，檢測(cè)器就會(huì)產(chǎn)生告警。傳統(tǒng)的入侵檢測(cè)系統(tǒng)大多是把感應(yīng)器和檢測(cè)器集成到一起的。在本發(fā)明架構(gòu)中將它們分離開(kāi)，這樣就使得在不同的環(huán)境中配置起來(lái)更為靈活。該系統(tǒng)將感應(yīng)器，檢測(cè)器和其他的分析器和分布式子系統(tǒng)通過(guò)數(shù)據(jù)倉(cāng)庫(kù)集成起來(lái)。感應(yīng)器除了將數(shù)據(jù)發(fā)送到檢測(cè)器之外，還將數(shù)據(jù)發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)中去。檢測(cè)器從ASM和AMM獲得它的檢測(cè)策略和模式。(1).感應(yīng)器
感應(yīng)器處理的進(jìn)程包括從實(shí)時(shí)審計(jì)數(shù)據(jù)流中收集信息，將信息格式化成為XML格式，將數(shù)據(jù)發(fā)送到檢測(cè)器，同時(shí)也將數(shù)據(jù)發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)。它可以從各種各樣的數(shù)據(jù)源收集信息。感應(yīng)器本身由兩個(gè)主要的組件來(lái)構(gòu)成，基本審計(jì)模塊(BAM)和連接引擎。BAM從審計(jì)資源中提取信息。連接引擎將數(shù)據(jù)編碼成一定的格式然后發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)并發(fā)送到檢測(cè)器。BAM可以看作是被監(jiān)控系統(tǒng)的一個(gè)接口，需要處理系統(tǒng)監(jiān)控到的所有數(shù)據(jù)流。它能夠抓取到網(wǎng)絡(luò)上的數(shù)據(jù)信息，并且將數(shù)據(jù)流傳送給連接引擎。連接引擎從BAM那里獲得數(shù)據(jù)，然后將數(shù)據(jù)編碼成XML格式，接著發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)中。連同數(shù)據(jù)本身，BAM還要向連接引擎發(fā)送一些元數(shù)據(jù)。這些數(shù)據(jù)是連接引擎在編碼過(guò)程中要用到的。同時(shí)，連接引擎也需要知道感應(yīng)器的類(lèi)型，這樣就可以將數(shù)據(jù)發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)中相應(yīng)的位置。(2).檢測(cè)器
檢測(cè)器運(yùn)用檢測(cè)模式和策略，分析從感應(yīng)器收集到的審計(jì)數(shù)據(jù)，并對(duì)它們進(jìn)行入侵檢測(cè)。檢測(cè)器對(duì)于來(lái)自感應(yīng)器的每一條記錄執(zhí)行模式和策略評(píng)估。它的工作方式取決于被評(píng)估的模式和策略類(lèi)型。每種不同的模式和策略類(lèi)型有相應(yīng)的檢測(cè)器來(lái)實(shí)現(xiàn)模式和策略評(píng)估?？梢园褭z測(cè)器看作這樣一個(gè)函數(shù)，以數(shù)據(jù)記錄作為輸入，當(dāng)這些數(shù)據(jù)被檢測(cè)出包含入侵企圖的時(shí)候，就以告警作為輸出。該檢測(cè)模式包含一系列與已知的入侵類(lèi)型相匹配的特征集及若干策略，它將數(shù)據(jù)記錄和模式特征相匹配組成了模式評(píng)估，并動(dòng)態(tài)的更換檢測(cè)策略。如果任意一個(gè)特征匹配成功，檢測(cè)器將產(chǎn)生告警。如果沒(méi)有匹配成功，就更換檢測(cè)策略繼續(xù)檢測(cè)。檢測(cè)器從數(shù)據(jù)倉(cāng)庫(kù)中的模式庫(kù)和策略庫(kù)中得到檢測(cè)模式和檢測(cè)策略，這些檢測(cè)模式和策略可以通過(guò)ASM和AMM進(jìn)行實(shí)時(shí)的更新。只有新的模式和策略得到應(yīng)用，檢測(cè)模式和策略才會(huì)得到更新。2.數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)可以看作數(shù)據(jù)與模型的中央存儲(chǔ)倉(cāng)庫(kù)。數(shù)據(jù)中央存儲(chǔ)倉(cāng)庫(kù)的一個(gè)優(yōu)點(diǎn)是不同的組件可以異步的處理數(shù)據(jù)庫(kù)里的同一組數(shù)據(jù)。同一類(lèi)型的組件，如多級(jí)感應(yīng)器等可以并行的處理數(shù)據(jù)。關(guān)系型特征數(shù)據(jù)庫(kù)支持存貯的程序調(diào)用，這就使得復(fù)雜的計(jì)算執(zhí)行變得比較容易，如高效的數(shù)據(jù)取樣可以在服務(wù)器上自動(dòng)的執(zhí)行。任意數(shù)量的傳感器數(shù)據(jù)可以通過(guò)一條結(jié)構(gòu)化查詢(xún)語(yǔ)句(SQL)就可以重新找回。分布式檢測(cè)模型也用來(lái)推動(dòng)這一技術(shù)。數(shù)據(jù)倉(cāng)庫(kù)也使得來(lái)自多級(jí)傳感器的數(shù)據(jù)完整性變得容易。通過(guò)來(lái)自來(lái)不同的入侵檢測(cè)系統(tǒng)的相關(guān)的數(shù)據(jù)與結(jié)果或者在一段時(shí)間內(nèi)收集的數(shù)據(jù)，使得復(fù)雜的和大范圍的攻擊檢測(cè)變得有可能了。本發(fā)明中，ASM和AMM訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)里面的數(shù)據(jù)并且利用這些數(shù)據(jù)來(lái)產(chǎn)生檢測(cè)策略和模式，同時(shí)存貯在數(shù)據(jù)倉(cāng)庫(kù)中。分析引擎也要訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)采用 SQL數(shù)據(jù)庫(kù)，這樣使得數(shù)據(jù)操作較為容易，同時(shí)通過(guò)生成訓(xùn)練數(shù)據(jù)集來(lái)建立基于數(shù)據(jù)挖掘的檢測(cè)策略。由于我們能夠通過(guò)SQL語(yǔ)句來(lái)檢索任意的數(shù)據(jù)集合，所以數(shù)據(jù)倉(cāng)庫(kù)可以將手動(dòng)生成數(shù)據(jù)集的過(guò)程自動(dòng)化。3.數(shù)據(jù)分析引擎
數(shù)據(jù)分析引擎組件以數(shù)據(jù)庫(kù)中的數(shù)據(jù)集作為它的輸入，并且對(duì)這些數(shù)據(jù)執(zhí)行某種操作。分析引擎能夠向數(shù)據(jù)庫(kù)中插入分析結(jié)果。在我們的框架結(jié)構(gòu)中，分析引擎訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)，得到一個(gè)數(shù)據(jù)集，然后使用SQL接口向數(shù)據(jù)倉(cāng)庫(kù)中插入一些新的信息。數(shù)據(jù)分析引擎同樣使用XML格式。數(shù)據(jù)分析引擎集成了四類(lèi)引擎，分為特征提取引擎，分析引擎，自動(dòng)標(biāo)簽工具及可視化分析引擎(客戶(hù)端)。其體系結(jié)構(gòu)如圖3所示?？蛻?hù)端是整個(gè)入侵檢測(cè)系統(tǒng)和用戶(hù)交互的界面，是系統(tǒng)中不可缺少的重要組成部分。它提供了系統(tǒng)和用戶(hù)之間進(jìn)行交流的平臺(tái)。它給系統(tǒng)管理員提供了兩種機(jī)制一是可以實(shí)時(shí)顯示檢測(cè)器的報(bào)警信息，二是可以查詢(xún)數(shù)據(jù)倉(cāng)庫(kù)中的所有數(shù)據(jù)，它與數(shù)據(jù)庫(kù)集成到一起，允許用戶(hù)過(guò)濾和有選擇的觀(guān)察數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)集。分析引擎是數(shù)據(jù)分析中最為重要的類(lèi)型之一。分析引擎從數(shù)據(jù)倉(cāng)庫(kù)中檢索一個(gè)歷史數(shù)據(jù)集，并運(yùn)用某種檢測(cè)算法在數(shù)據(jù)集中發(fā)現(xiàn)可疑的活動(dòng)，然后將可疑的活動(dòng)打上標(biāo)簽。使用SQL語(yǔ)句將它標(biāo)識(shí)成為適當(dāng)?shù)臄?shù)據(jù)，要么是異常的，要么是正常的。這里要求在數(shù)據(jù)庫(kù)表中加入一列來(lái)存儲(chǔ)標(biāo)簽。自動(dòng)標(biāo)簽工具是數(shù)據(jù)分析引擎的一種。自動(dòng)標(biāo)簽工具遍歷已知的攻擊特征列表，并且利用這些信息去為數(shù)據(jù)庫(kù)中的所有記錄打標(biāo)簽。標(biāo)簽工具用來(lái)生成打了標(biāo)記的訓(xùn)練數(shù)據(jù)。己知的攻擊特征列表可以是進(jìn)程名稱(chēng)，時(shí)間戳，或者是其他的。這些都包含在數(shù)據(jù)記錄里面，并且與己知的攻擊相匹配。標(biāo)記工具與手工標(biāo)記相比是一個(gè)巨大的提高。手工標(biāo)記數(shù)據(jù)在配置一個(gè)基于數(shù)據(jù)挖掘的入侵檢測(cè)系統(tǒng)中代價(jià)比較昂貴，花費(fèi)巨大。通過(guò)使用標(biāo)記工具可以將費(fèi)用大大的削減下來(lái)。特征提取引擎是以原始審計(jì)數(shù)據(jù)作為輸入，輸出一些附加的信息，這些附加信息是由這些原始數(shù)據(jù)計(jì)算出來(lái)的。這些新的特征加入到原始的記錄當(dāng)中。數(shù)據(jù)記錄中的許多特征，在計(jì)算過(guò)程中所使用的信息橫跨了數(shù)據(jù)庫(kù)中的好多個(gè)獨(dú)立的記錄。這主要是因?yàn)橛行┆?dú)立的記錄本身沒(méi)有意思，但是當(dāng)和其他的記錄合并起來(lái)之后，才能夠反映出入侵行為。數(shù)據(jù)倉(cāng)庫(kù)能夠?yàn)樘卣魈崛∫嫣峁┧仨毜娜我庾蛹?。入侵檢測(cè)系統(tǒng)的靈活性允許使用任意數(shù)據(jù)子集來(lái)生成特征。4.自適應(yīng)策略生成器
本發(fā)明中的ASM管理模塊，通過(guò)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)生成檢測(cè)策略，并存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中，供檢測(cè)器使用。ASM采用數(shù)據(jù)挖掘中的分類(lèi)技術(shù)生成入侵規(guī)則，分類(lèi)效果取決于學(xué)習(xí)集與屬性集的質(zhì)量。從龐大的審計(jì)數(shù)據(jù)庫(kù)中用人工建立學(xué)習(xí)集是一件非常耗時(shí)耗力的事情，這里我們采用的方法是用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘算法與序列規(guī)則挖掘算法從大量的審計(jì)數(shù)據(jù)中得到大量模式，根據(jù)模式指導(dǎo)學(xué)習(xí)集與屬性集的構(gòu)造。然后再使用分類(lèi)器生成分類(lèi)規(guī)則。5.檢測(cè)模式管理器
AMM模塊，管理檢測(cè)模式的生成和分發(fā)。檢測(cè)模式是使用數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的數(shù)據(jù)來(lái)生成的。它們通過(guò)模式分發(fā)器分發(fā)到各個(gè)檢測(cè)器上去的。(1).檢測(cè)模式生成器
模型生成器的主要目的是，使新的入侵檢測(cè)模型的分布與快速發(fā)展變得容易。該體系結(jié)構(gòu)，攻擊第一次被作為異常檢測(cè)到時(shí)，可能被模型生成器當(dāng)作典型數(shù)據(jù)來(lái)處理。依次的，用來(lái)自數(shù)據(jù)倉(cāng)庫(kù)已經(jīng)存檔的正常的和異常的數(shù)據(jù)集合，自動(dòng)生成能夠檢測(cè)新的入侵模型，并把它分配給探測(cè)器。模型生成器被設(shè)計(jì)成能夠工作在任何一種模式產(chǎn)生算法之上。這樣，模式生成組件就可以被看作是黑箱子，可以容易的插入到我們的架構(gòu)中去。這些組件以一系列的訓(xùn)練數(shù)據(jù)集作為自己的輸入，以可疑的行為模式作為輸出。不同類(lèi)型的模式生成算法要求不同類(lèi)型的數(shù)據(jù)集。在我們所設(shè)計(jì)的架構(gòu)中，允許模式生成器通過(guò)使用總體的或者特定的查詢(xún)來(lái)選擇它所需要的任意數(shù)據(jù)。這使得我們的架構(gòu)能夠處理任意類(lèi)型的模式生成算法。當(dāng)模式生成器需要產(chǎn)生一個(gè)模式的時(shí)候，它就會(huì)查詢(xún)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)。他們所要進(jìn)行的查詢(xún)是建立在模式訓(xùn)練所需的信息之上的。然后生成器開(kāi)始運(yùn)行并且產(chǎn)生出一個(gè)模式來(lái)。接著模式被編碼為XML格式并且發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)中去。同時(shí)，模式生成器也給模式分發(fā)器發(fā)出信號(hào)，讓它知道一個(gè)新的模式己經(jīng)生效了。(2).檢測(cè)模式分發(fā)器
許多的模式生成算法能夠被用在實(shí)時(shí)環(huán)境當(dāng)中。這就需要一個(gè)模式分發(fā)器以保證所有的檢測(cè)器能夠擁有最近最新的模式。檢測(cè)器如果不能不斷的通過(guò)檢測(cè)數(shù)據(jù)倉(cāng)庫(kù)來(lái)更新自己的模式庫(kù)，那么檢測(cè)模式比較單一，漏報(bào)率與誤報(bào)率偏高。作為一個(gè)整體，系統(tǒng)有實(shí)時(shí)性的要求。檢測(cè)器模塊是一個(gè)輕量級(jí)的組件。只要模式產(chǎn)生器產(chǎn)生了新的模式，模式分發(fā)器便會(huì)自動(dòng)的發(fā)送模式來(lái)更新檢測(cè)器模塊的模式庫(kù)。
實(shí)現(xiàn)本方法的步驟如下
1).感應(yīng)器從系統(tǒng)環(huán)境或者網(wǎng)絡(luò)環(huán)境里面收集信息并格式化，然后發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)起來(lái)，所有的感應(yīng)器實(shí)現(xiàn)一個(gè)基本審計(jì)模塊框架，它在可擴(kuò)展標(biāo)記語(yǔ)言XML中編碼，由原始數(shù)據(jù)計(jì)算特征；
2).數(shù)據(jù)分析引擎實(shí)時(shí)的從數(shù)據(jù)倉(cāng)庫(kù)提取信息，將數(shù)據(jù)分成異常數(shù)據(jù)集與正常數(shù)據(jù)集，并利用標(biāo)記工具做相應(yīng)的標(biāo)記，對(duì)己標(biāo)記的信息進(jìn)行特征提取，并將標(biāo)記的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中，以便模式生成器進(jìn)行模式挖掘；
3).檢測(cè)器接收由感應(yīng)器處理過(guò)的數(shù)據(jù)，用一個(gè)檢測(cè)模型來(lái)檢查數(shù)據(jù)，判斷是否有攻擊，檢測(cè)器也把結(jié)果發(fā)送給數(shù)據(jù)倉(cāng)庫(kù)去做進(jìn)一步的分析；
4).自適應(yīng)模式管理器訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)里面標(biāo)記的及未被標(biāo)記過(guò)的異常的數(shù)據(jù)，經(jīng)模式生成器生成新的檢測(cè)模式后，存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中備用，當(dāng)生成一種新的模式后，模式分發(fā)器負(fù)責(zé)將檢測(cè)器的模式更新；
5).自適應(yīng)策略管理器提取數(shù)據(jù)倉(cāng)庫(kù)中的入侵特征，經(jīng)過(guò)分類(lèi)器分類(lèi)后，策略生成器生成一種新的檢測(cè)策略，將這些數(shù)據(jù)分類(lèi)為可疑的或者是正常的，一旦一個(gè)策略產(chǎn)生出來(lái)，它就會(huì)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中的策略庫(kù)中，策略分發(fā)器將產(chǎn)生的新的策略配置到檢測(cè)器上。自適應(yīng)模式管理器的實(shí)現(xiàn)步驟包括
1).模式生成器查詢(xún)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)，開(kāi)始運(yùn)行并且產(chǎn)生出一個(gè)模式；
2).將該模式編碼為XML格式并且發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)中去；
3).模式生成器給模式分發(fā)器發(fā)出信號(hào)表明一個(gè)新的模式己經(jīng)生效；
4).模式分發(fā)器收到信號(hào)后自動(dòng)的發(fā)送該模式來(lái)更新檢測(cè)器模塊的模式庫(kù)。自適應(yīng)策略管理器的實(shí)現(xiàn)步驟包括
1).對(duì)數(shù)據(jù)倉(cāng)庫(kù)中被標(biāo)記成正常和異常的數(shù)據(jù)進(jìn)行比較，提取出與正常數(shù)據(jù)集相差較大的入侵?jǐn)?shù)據(jù)集，形成入侵模式；
2).提取入侵模式的特征屬性，使用分類(lèi)器生成新的分類(lèi)規(guī)則；
3).根據(jù)新的分類(lèi)規(guī)則，策略生成器生成一種新的檢測(cè)策略并存儲(chǔ)到策略庫(kù)；
4).策略分發(fā)器將生成的檢測(cè)策略配置到檢測(cè)器上。
權(quán)利要求
1.一種基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)方法，其特征在于實(shí)現(xiàn)本方法的步驟如下1).感應(yīng)器從系統(tǒng)環(huán)境或者網(wǎng)絡(luò)環(huán)境里面收集信息并格式化，然后發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)起來(lái)，所有的感應(yīng)器實(shí)現(xiàn)一個(gè)基本審計(jì)模塊框架，它在可擴(kuò)展標(biāo)記語(yǔ)言XML中編碼，由原始數(shù)據(jù)計(jì)算特征；2).數(shù)據(jù)分析引擎實(shí)時(shí)的從數(shù)據(jù)倉(cāng)庫(kù)提取信息，將數(shù)據(jù)分成異常數(shù)據(jù)集與正常數(shù)據(jù)集，并利用標(biāo)記工具做相應(yīng)的標(biāo)記，對(duì)己標(biāo)記的信息進(jìn)行特征提取，并將標(biāo)記的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中，以便模式生成器進(jìn)行模式挖掘；3).檢測(cè)器接收由感應(yīng)器處理過(guò)的數(shù)據(jù)，用一個(gè)檢測(cè)模型來(lái)檢查數(shù)據(jù)，判斷是否有攻擊，檢測(cè)器也把結(jié)果發(fā)送給數(shù)據(jù)倉(cāng)庫(kù)去做進(jìn)一步的分析；4).自適應(yīng)模式管理器訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)里面標(biāo)記的及未被標(biāo)記過(guò)的異常的數(shù)據(jù)，經(jīng)模式生成器生成新的檢測(cè)模式后，存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中備用，當(dāng)生成一種新的模式后，模式分發(fā)器負(fù)責(zé)將檢測(cè)器的模式更新；5).自適應(yīng)策略管理器提取數(shù)據(jù)倉(cāng)庫(kù)中的入侵特征，經(jīng)過(guò)分類(lèi)器分類(lèi)后，策略生成器生成一種新的檢測(cè)策略，將這些數(shù)據(jù)分類(lèi)為可疑的或者是正常的，一旦一個(gè)策略產(chǎn)生出來(lái)，它就會(huì)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中的策略庫(kù)中，策略分發(fā)器將產(chǎn)生的新的策略配置到檢測(cè)器上。
2.根據(jù)權(quán)利要求1所述的基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)方法，其特征在于自適應(yīng)模式管理器的實(shí)現(xiàn)步驟包括1).模式生成器查詢(xún)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)，開(kāi)始運(yùn)行并且產(chǎn)生出一個(gè)模式；2).將該模式編碼為XML格式并且發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)中去；3).模式生成器給模式分發(fā)器發(fā)出信號(hào)表明一個(gè)新的模式己經(jīng)生效；4).模式分發(fā)器收到信號(hào)后自動(dòng)的發(fā)送該模式來(lái)更新檢測(cè)器模塊的模式庫(kù)。
3.根據(jù)權(quán)利要求1所述的基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)方法，其特征在于自適應(yīng)策略管理器的實(shí)現(xiàn)步驟包括1).對(duì)數(shù)據(jù)倉(cāng)庫(kù)中被標(biāo)記成正常和異常的數(shù)據(jù)進(jìn)行比較，提取出與正常數(shù)據(jù)集相差較大的入侵?jǐn)?shù)據(jù)集，形成入侵模式；2).提取入侵模式的特征屬性，使用分類(lèi)器生成新的分類(lèi)規(guī)則；3).根據(jù)新的分類(lèi)規(guī)則，策略生成器生成一種新的檢測(cè)策略并存儲(chǔ)到策略庫(kù)；4).策略分發(fā)器將生成的檢測(cè)策略配置到檢測(cè)器上。
全文摘要
本發(fā)明的實(shí)現(xiàn)是基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)方法。該方法在分布式實(shí)時(shí)系統(tǒng)架構(gòu)中，增加了兩個(gè)自適應(yīng)管理模塊:自適應(yīng)策略管理模塊(ASM)和自適應(yīng)模式管理模塊(AMM)。這兩個(gè)模塊用于實(shí)現(xiàn)基于數(shù)據(jù)挖掘的入侵檢測(cè)系統(tǒng)檢測(cè)策略及檢測(cè)模型的自動(dòng)生成與分發(fā)。這個(gè)結(jié)構(gòu)可以解決有關(guān)數(shù)據(jù)收集的自動(dòng)化，檢測(cè)模型和策略的自動(dòng)生成與配置以及數(shù)據(jù)的實(shí)時(shí)評(píng)估方面的問(wèn)題。它是一個(gè)由一些組件類(lèi)構(gòu)成的分布式系統(tǒng)，而且這些組件類(lèi)可以在系統(tǒng)框架內(nèi)進(jìn)行靈活的改變，以適應(yīng)不同的環(huán)境變化和用戶(hù)需求。
文檔編號(hào)H04L29/08GK102521378SQ201110428600
公開(kāi)日2012年6月27日申請(qǐng)日期2011年12月20日優(yōu)先權(quán)日2011年12月20日
發(fā)明者任勛益, 余洋, 張俊鋒, 祁正華, 陳丹偉申請(qǐng)人:南京郵電大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：任勛益;陳丹偉;祁正華;余洋;張俊鋒
技術(shù)所有人：南京郵電大學(xué)
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

數(shù)據(jù)挖掘方法相關(guān)技術(shù)

數(shù)據(jù)挖掘中的研究方法相關(guān)技術(shù)

數(shù)據(jù)挖掘的方法相關(guān)技術(shù)

數(shù)據(jù)挖掘方法論相關(guān)技術(shù)

大數(shù)據(jù)挖掘方法相關(guān)技術(shù)

數(shù)據(jù)挖掘分類(lèi)方法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于數(shù)據(jù)挖掘的實(shí)時(shí)入侵檢測(cè)方法