1.一種基于本體的并行網(wǎng)絡(luò)流量分類方法,其特征在于,包括如下步驟:
(1)參數(shù)的設(shè)定
令Ni(1≤i≤n)表示第i個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)ID,IPi表示第i個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的IP,Ii表示第i個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的相關(guān)信息,F(xiàn)j(1≤j≤m)表示第j條網(wǎng)絡(luò)流量標(biāo)識,Oj表示第j條網(wǎng)絡(luò)流量的本體,MNF表示從網(wǎng)絡(luò)節(jié)點(diǎn)流量數(shù)據(jù)到網(wǎng)絡(luò)流量的映射,RFO表示從網(wǎng)絡(luò)流量到網(wǎng)絡(luò)流量本體的映射;
(2)啟動(dòng)對應(yīng)函數(shù)
根據(jù)每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)啟動(dòng)對應(yīng)的Map函數(shù),其中,每個(gè)Map函數(shù)以鍵值對<Ni, IPi>作為輸入;
(3)傳入結(jié)果
Map函數(shù)根據(jù)IPi操作網(wǎng)絡(luò)節(jié)點(diǎn),收集網(wǎng)絡(luò)節(jié)點(diǎn)相關(guān)信息Ii,并調(diào)用網(wǎng)絡(luò)流量采集工具捕獲網(wǎng)絡(luò)數(shù)據(jù)包,然后將采集到的所有資源傳入Combiner中間結(jié)果;
(4)信息整合成網(wǎng)絡(luò)流量
Combiner根據(jù)過濾規(guī)則提取所需網(wǎng)絡(luò)流量信息,并將數(shù)據(jù)包整合成網(wǎng)絡(luò)流量Fj,以鍵值對<Ii,F(xiàn)j>的形式傳給Reduce函數(shù),此時(shí),傳向Reduce函數(shù)的每個(gè)鍵值對就對應(yīng)著一條完整的網(wǎng)絡(luò)流量信息;
(5)自定位
Reduce函數(shù)根據(jù)接收到的鍵值對計(jì)算流量統(tǒng)計(jì)特征,并用本體語言O(shè)WL做統(tǒng)一資源描述,借助本體建模工具Protégé的API,完成網(wǎng)絡(luò)流量本體的構(gòu)建;
(6)流量分類
接著分析網(wǎng)絡(luò)流量本體的內(nèi)部結(jié)構(gòu),將其轉(zhuǎn)換成知識推理的規(guī)則集形式,然后將本體流量實(shí)例和規(guī)則集一并輸入并行知識推理引擎,得出分類結(jié)果。
2.按照權(quán)利要求1所述的一種基于本體的并行網(wǎng)絡(luò)流量分類方法,其特征在于:所述步驟(6)中并行知識推理引擎是采用Map Reduce作為并行處理技術(shù)。
3.按照權(quán)利要求2所述的一種基于本體的并行網(wǎng)絡(luò)流量分類方法,其特征在于:所述Map Reduce作為并行處理技術(shù)構(gòu)建了基于Map Reduce的網(wǎng)絡(luò)流量本體構(gòu)建模型。
4.按照權(quán)利要求1所述的一種基于本體的并行網(wǎng)絡(luò)流量分類方法,其特征在于:所述步驟(6)中并行知識推理的實(shí)現(xiàn)步驟為:
①根據(jù)每個(gè)計(jì)算節(jié)點(diǎn)的性能以及網(wǎng)絡(luò)流量本體中所描述的網(wǎng)絡(luò)流量實(shí)例的數(shù)據(jù)規(guī)模,對已構(gòu)建好的網(wǎng)絡(luò)流量本體進(jìn)行分割,得到多個(gè)網(wǎng)絡(luò)流量本體分片Oj,將網(wǎng)絡(luò)流量本體分片上傳至Hadoop分布式文件系統(tǒng),并對每一個(gè)網(wǎng)絡(luò)流量本體分片中描述的網(wǎng)絡(luò)流量實(shí)例標(biāo)記為FIl,以鍵值對<FIl,Oj>作為Map函數(shù)的輸入;
②啟動(dòng)多個(gè)Map函數(shù)并行地調(diào)用Jena推理機(jī),利用規(guī)則集S
中的各條規(guī)則對網(wǎng)絡(luò)流量本體分片Oj中描述的與網(wǎng)絡(luò)流量實(shí)例FIl有關(guān)的各種信息進(jìn)行知識推理,得出FIl的類標(biāo)簽Lk,將<Lk,F(xiàn)Il>作為鍵值對輸出到Reduce函數(shù);
③Reduce函數(shù)根據(jù)Lk按類型合并Fj,形成已分類流量集Ck,至此完成流量本體集到已分類流量集的映射MROC。
5.按照權(quán)利要求4所述的一種基于本體的并行網(wǎng)絡(luò)流量分類方法,其特征在于:所述并行知識推理的實(shí)現(xiàn)步驟的前提是參數(shù)的設(shè)定。
6.按照權(quán)利要求5所述的一種基于本體的并行網(wǎng)絡(luò)流量分類方法,其特征在于:所述參數(shù)的設(shè)定為令Oj(1≤j≤n)表示第j個(gè)網(wǎng)絡(luò)流量本體分片,F(xiàn)Il(1≤l≤p)表示第l個(gè)網(wǎng)絡(luò)流量實(shí)例標(biāo)識(對應(yīng)于第l條網(wǎng)絡(luò)流量Fl),S表示推理引擎中的規(guī)則集,Lk(1≤k≤m)表示第k類
(指應(yīng)用類別)流量標(biāo)簽,Ck表示第k類已分類流量集。