海洋網(wǎng)絡安全風險防御系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了海洋網(wǎng)絡安全風險防御系統(tǒng),包括海洋網(wǎng)絡數(shù)據(jù)采集設備、海洋網(wǎng)絡數(shù)據(jù)存儲設備、風險實時分析服務器、顯示設備和預警設備,其中所述海洋網(wǎng)絡數(shù)據(jù)存儲設備與海洋網(wǎng)絡數(shù)據(jù)采集設備連接,用于將海洋網(wǎng)絡數(shù)據(jù)采集設備采集的信息數(shù)據(jù)經過機密性篩選與整理后存儲到海洋網(wǎng)絡數(shù)據(jù)庫中,海洋網(wǎng)絡數(shù)據(jù)庫對存儲的信息數(shù)據(jù)進行實時更新與監(jiān)測;所述風險實時分析服務器用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù)據(jù)進行風險分析并輸出反饋信息;所述預警設備根據(jù)反饋信息進行選擇性防御和報警。本發(fā)明通過對信息數(shù)據(jù)進行分析得出用戶潛在的風險操作,并進行選擇性防御和報警,保證了系統(tǒng)的安全,又避免了系統(tǒng)資源的閑置。
【專利說明】
海洋網(wǎng)絡安全風險防御系統(tǒng)
技術領域
[0001] 本發(fā)明涉及網(wǎng)絡安全技術領域,具體涉及海洋網(wǎng)絡安全風險防御系統(tǒng)。
【背景技術】
[0002] 海洋領域事關國計民生,尤其是部分涉海數(shù)據(jù),成為國家的秘密級、甚至機密級保 護數(shù)據(jù)。海洋網(wǎng)絡,即各地海洋局內傳輸海洋業(yè)務數(shù)據(jù)的網(wǎng)絡的安全性受到了各地海洋局 相關部門的密切關注。因此,有必要設計一種海洋網(wǎng)絡安全風險防御系統(tǒng)。
[0003] 大數(shù)據(jù)分析是指對規(guī)模巨大的數(shù)據(jù)進行分析。大數(shù)據(jù)分析基于數(shù)據(jù)可視化可以直 觀的展示數(shù)據(jù),基于數(shù)據(jù)挖掘可讓我們深入數(shù)據(jù)內部去挖掘價值,而基于數(shù)據(jù)預測性分析 可以根據(jù)可視化分析和數(shù)據(jù)挖掘的結果做出一些預測性的判斷。如何將大數(shù)據(jù)分析應用到 海洋網(wǎng)絡的安全防護,已是學術研究的熱點。相關技術中,常使用k-means算法對數(shù)據(jù)進行 聚類分析。k-means算法也稱為k-均值算法或者k-平均算法,是一種使用廣泛的迭代型劃分 聚類算法。其算法思想是將一個給定的數(shù)據(jù)集分為用戶指定的k個聚簇(類),將每個類的平 均值再作為聚類的中心從而來表示該類數(shù)據(jù),再通過迭代求出每個聚簇(類)之內誤差平方 和最小化時的劃分。該算法對于連續(xù)型屬性可以取得較好的聚類效果,但對于離散型屬性 處理效果不理想。
【發(fā)明內容】
[0004] 針對上述問題,本發(fā)明提供海洋網(wǎng)絡安全風險防御系統(tǒng)。
[0005] 本發(fā)明的目的采用以下技術方案來實現(xiàn):
[0006] 海洋網(wǎng)絡安全風險防御系統(tǒng),包括海洋網(wǎng)絡數(shù)據(jù)采集設備、海洋網(wǎng)絡數(shù)據(jù)存儲設 備、風險實時分析服務器、顯示設備和預警設備;所述海洋網(wǎng)絡數(shù)據(jù)采集設備,用于采集各 種與海洋網(wǎng)絡安全相關的信息數(shù)據(jù);所述海洋網(wǎng)絡數(shù)據(jù)存儲設備,與海洋網(wǎng)絡數(shù)據(jù)采集設 備連接,用于將海洋網(wǎng)絡數(shù)據(jù)采集設備采集的信息數(shù)據(jù)經過機密性篩選與整理后存儲到海 洋網(wǎng)絡數(shù)據(jù)庫中,海洋網(wǎng)絡數(shù)據(jù)庫對存儲的信息數(shù)據(jù)進行實時更新與監(jiān)測;所述風險實時 分析服務器,與海洋網(wǎng)絡數(shù)據(jù)庫連接,用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù)據(jù)進行風 險分析并輸出反饋信息;所述顯示設備,與風險實時分析服務器連接,用于顯示風險實時分 析服務器輸出的反饋信息,并形成日志文件;所述預警設備根據(jù)反饋信息進行選擇性防御 和報警。
[0007]優(yōu)選地,所述海洋網(wǎng)絡數(shù)據(jù)采集設備包括視頻采集模塊、控制模塊和通信模塊,所 述視頻采集模塊用于采集與信息數(shù)據(jù)相關的視頻;所述控制模塊,與視頻采集模塊連接,用 于通過所述通信模塊控制所述視頻采集的視頻信息的無線發(fā)送。
[0008] 其中,所述海洋網(wǎng)絡數(shù)據(jù)庫中預先存儲有針對用戶行為風險操作的安全策略。
[0009] 其中,所述風險實時分析服務器包括:
[0010] (1)數(shù)據(jù)預處理模塊,用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù)據(jù)進行數(shù)據(jù)清理 和清洗,過濾掉包含噪音和異常的數(shù)據(jù),形成用戶行為分析的有效數(shù)據(jù)集;
[0011] (2)基于改進K-means聚類方法的數(shù)據(jù)分析模塊,用于對所述有效數(shù)據(jù)集進行分類 整理和分析,并對用戶的行為進行分析,輸出用戶行為分析結果;
[0012] (3)反饋模塊,用于根據(jù)用戶行為分析結果,識別用戶行為風險操作,并從海洋網(wǎng) 絡數(shù)據(jù)庫中提取相應的安全策略,再匯總風險操作和相應的安全策略打包成反饋信息。
[0013] 其中,所述基于改進K-means聚類方法的數(shù)據(jù)分析模塊包括依次連接的數(shù)據(jù)準備 單元、數(shù)據(jù)挖掘單元和用戶行為分析單元;
[0014] 所述數(shù)據(jù)準備單元用于剔除有效數(shù)據(jù)集中的缺失值和異常值,并進一步進行歸一 化處理;
[0015] 所述數(shù)據(jù)挖掘單元用于采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的有 效數(shù)據(jù)集進行聚類,并建立用戶分群模型;
[0016] 所述用戶行為分析單元用于采用決策樹算法對所述分群模型進行標識區(qū)分,識別 用戶身份,并根據(jù)標識區(qū)分識別結果建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測并 輸出用戶行為分析結果。
[0017] 其中,所述數(shù)據(jù)挖掘單元采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的 有效數(shù)據(jù)集進行聚類,具體為:
[0018] 1)設所述有效數(shù)據(jù)集具有η個樣本,對η個樣本進行向量化,通過夾角余弦函數(shù)計 算所有樣本兩兩之間的相似度,得到相似度矩陣XS;
[0019] 2)對相似度矩陣XS的每一行進行求和,計算出每一個樣本與整個有效數(shù)據(jù)集的相 似度,設XS = [ sim(ai,aj) ]ηχη,i,j = 1,…,η,其中sim(ai,aj)表示樣本ai,aj間的相似度,求 和公式為:
[0021] 3)按降序排列XSP,p = 1,…,η,設XSP按從大到小排列的前4個值為XSmax,XSmax-i,
,選擇與最大值xsmajg對應的樣本作 為第一個初始的聚簇中心,否則選擇與xsmax,XSmtl·,XSmax-2,XS max-3對應的四個樣本的均值 作為第一個初始的簇中心,T為設定的比例值;
[0022] 4)將最大值為XSmax對應的矩陣中行向量的元素進行升序排列,假設前k-Ι個最小 的元素為乂3 [)(1,(1=1,一,1^-1,選擇前1^-1個最小的元素乂5[)(1相對應的樣本作為剩余的1^-1個 初始的聚簇中心,其中所述k值的設定方法為:設定k值可能取值的區(qū)間,通過測試k的不同 取值,并對區(qū)間內的各個值進行聚類,通過比較協(xié)方差,確定聚類之間的顯著性差異,從而 來探査聚類的類型信息,并最終確定合適的HI;
[0023] 5)計算剩余樣本與各初始的聚簇中心之間的相似度,將剩余樣本分發(fā)到相似度最 高的聚簇中,形成變化后的k個聚簇;
[0024] 6)計算變化后的聚簇中各樣本的均值,將其作為更新后的聚簇中心代替更新前的 聚簇中心;
[0025] 7)若更新前的聚簇中心與更新后的聚簇中心相同,或者目標函數(shù)達到了最小值, 停止更新,所述目標函數(shù)為:
[0027] 其中,C4表示k個聚簇中的第1個聚簇,ax為第1個聚簇中的樣本,S5為第1個聚簇的 中心。
[0028] 其中,所述設定的比例值T的取值范圍為[1.4,1.6]。
[0029] 本發(fā)明的有益效果為:
[0030] 1、設置風險實時分析服務器和預警設備,對與海洋網(wǎng)絡安全相關的信息數(shù)據(jù)進行 分析,得出用戶潛在的風險操作,并針對風險實時分析服務器輸出的反饋信息進行選擇性 防御和報警,保證了系統(tǒng)的安全,又避免了系統(tǒng)資源的閑置;
[0031] 2、設置基于改進K-means聚類方法的數(shù)據(jù)分析模塊,采用改進K-means聚類方法對 由數(shù)據(jù)準備單元處理過的有效數(shù)據(jù)集進行聚類,有效避免單一采取隨機抽樣方法所帶來的 偶然性,解決原有算法在選取k值以及初始化聚類中心時所存在的問題,提高了聚類穩(wěn)定 性,進一步提高了數(shù)據(jù)分析的準確度;
[0032] 3、設置的用戶行為分析單元采用決策樹算法對分群模型進行標識區(qū)分,識別用戶 身份,并根據(jù)標識區(qū)分識別結果建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測,識別效 果好,預測精度較高。
【附圖說明】
[0033]利用附圖對本發(fā)明作進一步說明,但附圖中的實施例不構成對本發(fā)明的任何限 制,對于本領域的普通技術人員,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)以下附圖獲得 其它的附圖。
[0034]圖1是本發(fā)明的結構連接示意圖;
[0035] 圖2是本發(fā)明海洋網(wǎng)絡數(shù)據(jù)采集設備中各模塊的連接示意圖。
[0036] 附圖標記:
[0037]海洋網(wǎng)絡數(shù)據(jù)采集設備1、海洋網(wǎng)絡數(shù)據(jù)存儲設備2、風險實時分析服務器3、顯示 設備4、預警設備5。
【具體實施方式】
[0038]結合以下實施例對本發(fā)明作進一步描述。
[0039] 實施例1
[0040]參見圖1、圖2,本實施例海洋網(wǎng)絡安全風險防御系統(tǒng),包括海洋網(wǎng)絡數(shù)據(jù)采集設備 1、海洋網(wǎng)絡數(shù)據(jù)存儲設備2、風險實時分析服務器3、顯示設備4和預警設備5;所述海洋網(wǎng)絡 數(shù)據(jù)采集設備1,用于采集各種與海洋網(wǎng)絡安全相關的信息數(shù)據(jù);所述海洋網(wǎng)絡數(shù)據(jù)存儲設 備2,與海洋網(wǎng)絡數(shù)據(jù)采集設備1連接,用于將海洋網(wǎng)絡數(shù)據(jù)采集設備1采集的信息數(shù)據(jù)經過 機密性篩選與整理后存儲到海洋網(wǎng)絡數(shù)據(jù)庫中,海洋網(wǎng)絡數(shù)據(jù)庫對存儲的信息數(shù)據(jù)進行實 時更新與監(jiān)測;所述風險實時分析服務器3,與海洋網(wǎng)絡數(shù)據(jù)庫連接,用于對海洋網(wǎng)絡數(shù)據(jù) 庫實時更新的信息數(shù)據(jù)進行風險分析并輸出反饋信息;所述顯示設備4,與風險實時分析服 務器3連接,用于顯示風險實時分析服務器輸出的反饋信息,并形成日志文件;所述預警設 備5根據(jù)反饋信息進行選擇性防御和報警。
[0041] 其中,所述海洋網(wǎng)絡數(shù)據(jù)采集設備1包括視頻采集模塊、控制模塊和通信模塊,所 述視頻采集模塊用于采集與信息數(shù)據(jù)相關的視頻;所述控制模塊,與視頻采集模塊連接,用 于通過所述通信模塊控制所述視頻采集的視頻信息的無線發(fā)送。
[0042] 其中,所述海洋網(wǎng)絡數(shù)據(jù)庫中預先存儲有針對用戶行為風險操作的安全策略。
[0043] 其中,所述風險實時分析服務器3包括:
[0044] (1)數(shù)據(jù)預處理模塊,用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù)據(jù)進行數(shù)據(jù)清理 和清洗,過濾掉包含噪音和異常的數(shù)據(jù),形成用戶行為分析的有效數(shù)據(jù)集;
[0045] (2)基于改進K-means聚類方法的數(shù)據(jù)分析模塊,用于對所述有效數(shù)據(jù)集進行分類 整理和分析,并對用戶的行為進行分析,輸出用戶行為分析結果;
[0046] (3)反饋模塊,用于根據(jù)用戶行為分析結果,識別用戶行為風險操作,并從海洋網(wǎng) 絡數(shù)據(jù)庫中提取相應的安全策略,再匯總風險操作和相應的安全策略打包成反饋信息。
[0047] 其中,所述基于改進K-means聚類方法的數(shù)據(jù)分析模塊包括依次連接的數(shù)據(jù)準備 單元、數(shù)據(jù)挖掘單元和用戶行為分析單元;
[0048] 所述數(shù)據(jù)準備單元用于剔除有效數(shù)據(jù)集中的缺失值和異常值,并進一步進行歸一 化處理;
[0049] 所述數(shù)據(jù)挖掘單元用于采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的有 效數(shù)據(jù)集進行聚類,并建立用戶分群模型;
[0050] 所述用戶行為分析單元用于采用決策樹算法對所述分群模型進行標識區(qū)分,識別 用戶身份,并根據(jù)標識區(qū)分識別結果建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測并 輸出用戶行為分析結果。
[0051] 其中,所述數(shù)據(jù)挖掘單元采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的 有效數(shù)據(jù)集進行聚類,具體為:
[0052] 1)設所述有效數(shù)據(jù)集具有η個樣本,對η個樣本進行向量化,通過夾角余弦函數(shù)計 算所有樣本兩兩之間的相似度,得到相似度矩陣XS;
[0053] 2)對相似度矩陣XS的每一行進行求和,計算出每一個樣本與整個有效數(shù)據(jù)集的相 似度,設XS = [ sim(ai,aj) ]ηχη,i,j = 1,…,η,其中sim(ai,aj)表示樣本ai,aj間的相似度,求 和公式為:
[0055] 3)按降序排列XSP,p = 1,…,η,設XSP按從大到小排列的前4個值為XSmax,XSmd,
選擇與最大值XSmajg對應的樣本作 為第一個初始的聚簇中心,否則選擇與XSmax,XSmti,XSmax-2,XS max-3對應的四個樣本的均值 作為第一個初始的簇中心,T為設定的比例值;
[0056] 4)將最大值為XSmax對應的矩陣中行向量的元素進行升序排列,假設前k-Ι個最小 的元素為乂3 [)(1,(1=1,一,1^-1,選擇前1^-1個最小的元素乂5[)(1相對應的樣本作為剩余的1^-1個 初始的聚簇中心,其中所述k值的設定方法為:設定k值可能取值的區(qū)間,通過測試k的不同 取值,并對區(qū)間內的各個值進行聚類,通過比較協(xié)方差,確定聚類之間的顯著性差異,從而 來探査聚類的類型信息,并最終確定合適的HI;
[0057] 5)計算剩余樣本與各初始的聚簇中心之間的相似度,將剩余樣本分發(fā)到相似度最 高的聚簇中,形成變化后的k個聚簇;
[0058] 6)計算變化后的聚簇中各樣本的均值,將其作為更新后的聚簇中心代替更新前的 聚簇中心;
[0059] 7)若更新前的聚簇中心與更新后的聚簇中心相同,或者目標函數(shù)達到了最小值, 停止更新,所述目標函數(shù)為:
[0061] 其中,C4表示k個聚簇中的第1個聚簇,ax為第1個聚簇中的樣本,lil為第1個聚簇的 中心。
[0062] 本實施例設置風險實時分析服務器3和預警設備5,對與海洋網(wǎng)絡安全相關的信息 數(shù)據(jù)進行分析,得出用戶潛在的風險操作,并針對風險實時分析服務器3輸出的反饋信息進 行選擇性防御和報警,保證了系統(tǒng)的安全,又避免了系統(tǒng)資源的閑置;設置的用戶行為分析 單元采用決策樹算法對分群模型進行標識區(qū)分,識別用戶身份,并根據(jù)標識區(qū)分識別結果 建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測,識別效果好,預測精度較高;設置基于 改進K-means聚類方法的數(shù)據(jù)分析模塊,采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理 過的有效數(shù)據(jù)集進行聚類,有效避免單一采取隨機抽樣方法所帶來的偶然性,解決原有算 法在選取k值以及初始化聚類中心時所存在的問題,提高了聚類穩(wěn)定性,進一步提高了數(shù)據(jù) 分析的準確度,其中定的比例值T的取值為1.4,數(shù)據(jù)分析的準確度提高了4.5%。
[0063] 實施例2
[0064] 參見圖1、圖2,本實施例海洋網(wǎng)絡安全風險防御系統(tǒng),包括海洋網(wǎng)絡數(shù)據(jù)采集設備 1、海洋網(wǎng)絡數(shù)據(jù)存儲設備2、風險實時分析服務器3、顯示設備4和預警設備5;所述海洋網(wǎng)絡 數(shù)據(jù)采集設備1,用于采集各種與海洋網(wǎng)絡安全相關的信息數(shù)據(jù);所述海洋網(wǎng)絡數(shù)據(jù)存儲設 備2,與海洋網(wǎng)絡數(shù)據(jù)采集設備1連接,用于將海洋網(wǎng)絡數(shù)據(jù)采集設備1采集的信息數(shù)據(jù)經過 機密性篩選與整理后存儲到海洋網(wǎng)絡數(shù)據(jù)庫中,海洋網(wǎng)絡數(shù)據(jù)庫對存儲的信息數(shù)據(jù)進行實 時更新與監(jiān)測;所述風險實時分析服務器3,與海洋網(wǎng)絡數(shù)據(jù)庫連接,用于對海洋網(wǎng)絡數(shù)據(jù) 庫實時更新的信息數(shù)據(jù)進行風險分析并輸出反饋信息;所述顯示設備4,與風險實時分析服 務器3連接,用于顯示風險實時分析服務器輸出的反饋信息,并形成日志文件;所述預警設 備5根據(jù)反饋信息進行選擇性防御和報警。
[0065] 其中,所述海洋網(wǎng)絡數(shù)據(jù)采集設備1包括視頻采集模塊、控制模塊和通信模塊,所 述視頻采集模塊用于采集與信息數(shù)據(jù)相關的視頻;所述控制模塊,與視頻采集模塊連接,用 于通過所述通信模塊控制所述視頻采集的視頻信息的無線發(fā)送。
[0066] 其中,所述海洋網(wǎng)絡數(shù)據(jù)庫中預先存儲有針對用戶行為風險操作的安全策略。
[0067] 其中,所述風險實時分析服務器3包括:
[0068] (1)數(shù)據(jù)預處理模塊,用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù)據(jù)進行數(shù)據(jù)清理 和清洗,過濾掉包含噪音和異常的數(shù)據(jù),形成用戶行為分析的有效數(shù)據(jù)集;
[0069] (2)基于改進K-means聚類方法的數(shù)據(jù)分析模塊,用于對所述有效數(shù)據(jù)集進行分類 整理和分析,并對用戶的行為進行分析,輸出用戶行為分析結果;
[0070] (3)反饋模塊,用于根據(jù)用戶行為分析結果,識別用戶行為風險操作,并從海洋網(wǎng) 絡數(shù)據(jù)庫中提取相應的安全策略,再匯總風險操作和相應的安全策略打包成反饋信息。
[0071] 其中,所述基于改進K-means聚類方法的數(shù)據(jù)分析模塊包括依次連接的數(shù)據(jù)準備 單元、數(shù)據(jù)挖掘單元和用戶行為分析單元;
[0072] 所述數(shù)據(jù)準備單元用于剔除有效數(shù)據(jù)集中的缺失值和異常值,并進一步進行歸一 化處理;
[0073] 所述數(shù)據(jù)挖掘單元用于采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的有 效數(shù)據(jù)集進行聚類,并建立用戶分群模型;
[0074]所述用戶行為分析單元用于采用決策樹算法對所述分群模型進行標識區(qū)分,識別 用戶身份,并根據(jù)標識區(qū)分識別結果建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測并 輸出用戶行為分析結果。
[0075] 其中,所述數(shù)據(jù)挖掘單元采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的 有效數(shù)據(jù)集進行聚類,具體為:
[0076] 1)設所述有效數(shù)據(jù)集具有η個樣本,對η個樣本進行向量化,通過夾角余弦函數(shù)計 算所有樣本兩兩之間的相似度,得到相似度矩陣XS;
[0077] 2)對相似度矩陣XS的每一行進行求和,計算出每一個樣本與整個有效數(shù)據(jù)集的相 似度,設XS = [ sim(ai,aj) ]ηχη,i,j = 1,…,η,其中sim(ai,aj)表示樣本ai,aj間的相似度,求 和公式為:
[0079] 3)按降序排列XSP,p = l,…,n,設XSP按從大到小排列的前4個值為XSmax,XSmax-i,
,選擇與最大值xsmajg對應的樣本作 為第一個初始的聚簇中心,否則選擇與xsmax,XSmtl·,XSmax-2,XS max-3對應的四個樣本的均值 作為第一個初始的簇中心,T為設定的比例值;
[0080] 4)將最大值為XSmax對應的矩陣中行向量的元素進行升序排列,假設前k-i個最小 的元素為乂3 [)(1,(1=1,一,1^-1,選擇前1^-1個最小的元素乂5[)(1相對應的樣本作為剩余的1^-1個 初始的聚簇中心,其中所述k值的設定方法為:設定k值可能取值的區(qū)間,通過測試k的不同 取值,并對區(qū)間內的各個值進行聚類,通過比較協(xié)方差,確定聚類之間的顯著性差異,從而 來探査聚類的類型信息,并最終確定合適的HI;
[0081] 5)計算剩余樣本與各初始的聚簇中心之間的相似度,將剩余樣本分發(fā)到相似度最 高的聚簇中,形成變化后的k個聚簇;
[0082] 6)計算變化后的聚簇中各樣本的均值,將其作為更新后的聚簇中心代替更新前的 聚簇中心;
[0083] 7)若更新前的聚簇中心與更新后的聚簇中心相同,或者目標函數(shù)達到了最小值, 停止更新,所述目標函數(shù)為:
[0085] 其中,Q表示k個聚簇中的第1個聚簇,ax為第1個聚簇中的樣本,S5為第1個聚簇的 中心。
[0086] 本實施例設置風險實時分析服務器3和預警設備5,對與海洋網(wǎng)絡安全相關的信息 數(shù)據(jù)進行分析,得出用戶潛在的風險操作,并針對風險實時分析服務器3輸出的反饋信息進 行選擇性防御和報警,保證了系統(tǒng)的安全,又避免了系統(tǒng)資源的閑置;設置的用戶行為分析 單元采用決策樹算法對分群模型進行標識區(qū)分,識別用戶身份,并根據(jù)標識區(qū)分識別結果 建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測,識別效果好,預測精度較高;設置基于 改進K-means聚類方法的數(shù)據(jù)分析模塊,采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理 過的有效數(shù)據(jù)集進行聚類,有效避免單一采取隨機抽樣方法所帶來的偶然性,解決原有算 法在選取k值以及初始化聚類中心時所存在的問題,提高了聚類穩(wěn)定性,進一步提高了數(shù)據(jù) 分析的準確度,其中定的比例值T的取值為1.45,數(shù)據(jù)分析的準確度提高了4.6%。
[0087] 實施例3
[0088] 參見圖1、圖2,本實施例海洋網(wǎng)絡安全風險防御系統(tǒng),包括海洋網(wǎng)絡數(shù)據(jù)采集設備 1、海洋網(wǎng)絡數(shù)據(jù)存儲設備2、風險實時分析服務器3、顯示設備4和預警設備5;所述海洋網(wǎng)絡 數(shù)據(jù)采集設備1,用于采集各種與海洋網(wǎng)絡安全相關的信息數(shù)據(jù);所述海洋網(wǎng)絡數(shù)據(jù)存儲設 備2,與海洋網(wǎng)絡數(shù)據(jù)采集設備1連接,用于將海洋網(wǎng)絡數(shù)據(jù)采集設備1采集的信息數(shù)據(jù)經過 機密性篩選與整理后存儲到海洋網(wǎng)絡數(shù)據(jù)庫中,海洋網(wǎng)絡數(shù)據(jù)庫對存儲的信息數(shù)據(jù)進行實 時更新與監(jiān)測;所述風險實時分析服務器3,與海洋網(wǎng)絡數(shù)據(jù)庫連接,用于對海洋網(wǎng)絡數(shù)據(jù) 庫實時更新的信息數(shù)據(jù)進行風險分析并輸出反饋信息;所述顯示設備4,與風險實時分析服 務器3連接,用于顯示風險實時分析服務器輸出的反饋信息,并形成日志文件;所述預警設 備5根據(jù)反饋信息進行選擇性防御和報警。
[0089] 其中,所述海洋網(wǎng)絡數(shù)據(jù)采集設備1包括視頻采集模塊、控制模塊和通信模塊,所 述視頻采集模塊用于采集與信息數(shù)據(jù)相關的視頻;所述控制模塊,與視頻采集模塊連接,用 于通過所述通信模塊控制所述視頻采集的視頻信息的無線發(fā)送。
[0090] 其中,所述海洋網(wǎng)絡數(shù)據(jù)庫中預先存儲有針對用戶行為風險操作的安全策略。
[0091 ]其中,所述風險實時分析服務器3包括:
[0092] (1)數(shù)據(jù)預處理模塊,用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù)據(jù)進行數(shù)據(jù)清理 和清洗,過濾掉包含噪音和異常的數(shù)據(jù),形成用戶行為分析的有效數(shù)據(jù)集;
[0093] (2)基于改進K-means聚類方法的數(shù)據(jù)分析模塊,用于對所述有效數(shù)據(jù)集進行分類 整理和分析,并對用戶的行為進行分析,輸出用戶行為分析結果;
[0094] (3)反饋模塊,用于根據(jù)用戶行為分析結果,識別用戶行為風險操作,并從海洋網(wǎng) 絡數(shù)據(jù)庫中提取相應的安全策略,再匯總風險操作和相應的安全策略打包成反饋信息。
[0095] 其中,所述基于改進K-means聚類方法的數(shù)據(jù)分析模塊包括依次連接的數(shù)據(jù)準備 單元、數(shù)據(jù)挖掘單元和用戶行為分析單元;
[0096] 所述數(shù)據(jù)準備單元用于剔除有效數(shù)據(jù)集中的缺失值和異常值,并進一步進行歸一 化處理;
[0097] 所述數(shù)據(jù)挖掘單元用于采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的有 效數(shù)據(jù)集進行聚類,并建立用戶分群模型;
[0098] 所述用戶行為分析單元用于采用決策樹算法對所述分群模型進行標識區(qū)分,識別 用戶身份,并根據(jù)標識區(qū)分識別結果建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測并 輸出用戶行為分析結果。
[0099] 其中,所述數(shù)據(jù)挖掘單元采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的 有效數(shù)據(jù)集進行聚類,具體為:
[0100] 1)設所述有效數(shù)據(jù)集具有η個樣本,對η個樣本進行向量化,通過夾角余弦函數(shù)計 算所有樣本兩兩之間的相似度,得到相似度矩陣XS;
[0101] 2)對相似度矩陣XS的每一行進行求和,計算出每一個樣本與整個有效數(shù)據(jù)集的相 似度,設XS = [ sim(ai,aj) ]ηχη,i,j = 1,…,η,其中sim(ai,aj)表示樣本ai,aj間的相似度,求 和公式為:
[0103] 3)按降序排列XSP,p = l,…,n,設XSP按從大到小排列的前4個值為XSmax,XSmax-i,
選擇與最大值XSma4S對應的樣本作 為第一個初始的聚簇中心,否則選擇與xsmax,XSmtl·,XSmax-2,XS max-3對應的四個樣本的均值 作為第一個初始的簇中心,T為設定的比例值;
[0104] 4)將最大值為XSmax對應的矩陣中行向量的元素進行升序排列,假設前k-Ι個最小 的元素為乂3 [)(1,(1=1,一,1^-1,選擇前1^-1個最小的元素乂5[)(1相對應的樣本作為剩余的1^-1個 初始的聚簇中心,其中所述k值的設定方法為:設定k值可能取值的區(qū)間,通過測試k的不同 取值,并對區(qū)間內的各個值進行聚類,通過比較協(xié)方差,確定聚類之間的顯著性差異,從而 來探査聚類的類型信息,并最終確定合適的HI;
[0105] 5)計算剩余樣本與各初始的聚簇中心之間的相似度,將剩余樣本分發(fā)到相似度最 高的聚簇中,形成變化后的k個聚簇;
[0106] 6)計算變化后的聚簇中各樣本的均值,將其作為更新后的聚簇中心代替更新前的 聚簇中心;
[0107] 7)若更新前的聚簇中心與更新后的聚簇中心相同,或者目標函數(shù)達到了最小值, 停止更新,所述目標函數(shù)為:
[0109] 其中,Q表示k個聚簇中的第1個聚簇,ax為第1個聚簇中的樣本,應:為第1個聚簇的 中心。
[0110] 本實施例設置風險實時分析服務器3和預警設備5,對與海洋網(wǎng)絡安全相關的信息 數(shù)據(jù)進行分析,得出用戶潛在的風險操作,并針對風險實時分析服務器3輸出的反饋信息進 行選擇性防御和報警,保證了系統(tǒng)的安全,又避免了系統(tǒng)資源的閑置;設置的用戶行為分析 單元采用決策樹算法對分群模型進行標識區(qū)分,識別用戶身份,并根據(jù)標識區(qū)分識別結果 建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測,識別效果好,預測精度較高;設置基于 改進K-means聚類方法的數(shù)據(jù)分析模塊,采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理 過的有效數(shù)據(jù)集進行聚類,有效避免單一采取隨機抽樣方法所帶來的偶然性,解決原有算 法在選取k值以及初始化聚類中心時所存在的問題,提高了聚類穩(wěn)定性,進一步提高了數(shù)據(jù) 分析的準確度,其中定的比例值T的取值為1.5,數(shù)據(jù)分析的準確度提高了5%。
[0111] 實施例4
[0112] 參見圖1、圖2,本實施例海洋網(wǎng)絡安全風險防御系統(tǒng),包括海洋網(wǎng)絡數(shù)據(jù)采集設備 1、海洋網(wǎng)絡數(shù)據(jù)存儲設備2、風險實時分析服務器3、顯示設備4和預警設備5;所述海洋網(wǎng)絡 數(shù)據(jù)采集設備1,用于采集各種與海洋網(wǎng)絡安全相關的信息數(shù)據(jù);所述海洋網(wǎng)絡數(shù)據(jù)存儲設 備2,與海洋網(wǎng)絡數(shù)據(jù)采集設備1連接,用于將海洋網(wǎng)絡數(shù)據(jù)采集設備1采集的信息數(shù)據(jù)經過 機密性篩選與整理后存儲到海洋網(wǎng)絡數(shù)據(jù)庫中,海洋網(wǎng)絡數(shù)據(jù)庫對存儲的信息數(shù)據(jù)進行實 時更新與監(jiān)測;所述風險實時分析服務器3,與海洋網(wǎng)絡數(shù)據(jù)庫連接,用于對海洋網(wǎng)絡數(shù)據(jù) 庫實時更新的信息數(shù)據(jù)進行風險分析并輸出反饋信息;所述顯示設備4,與風險實時分析服 務器3連接,用于顯示風險實時分析服務器輸出的反饋信息,并形成日志文件;所述預警設 備5根據(jù)反饋信息進行選擇性防御和報警。
[0113]其中,所述海洋網(wǎng)絡數(shù)據(jù)采集設備1包括視頻采集模塊、控制模塊和通信模塊,所 述視頻采集模塊用于采集與信息數(shù)據(jù)相關的視頻;所述控制模塊,與視頻采集模塊連接,用 于通過所述通信模塊控制所述視頻采集的視頻信息的無線發(fā)送。
[0114] 其中,所述海洋網(wǎng)絡數(shù)據(jù)庫中預先存儲有針對用戶行為風險操作的安全策略。
[0115] 其中,所述風險實時分析服務器3包括:
[0116] (1)數(shù)據(jù)預處理模塊,用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù)據(jù)進行數(shù)據(jù)清理 和清洗,過濾掉包含噪音和異常的數(shù)據(jù),形成用戶行為分析的有效數(shù)據(jù)集;
[0117] (2)基于改進K-means聚類方法的數(shù)據(jù)分析模塊,用于對所述有效數(shù)據(jù)集進行分類 整理和分析,并對用戶的行為進行分析,輸出用戶行為分析結果;
[0118] (3)反饋模塊,用于根據(jù)用戶行為分析結果,識別用戶行為風險操作,并從海洋網(wǎng) 絡數(shù)據(jù)庫中提取相應的安全策略,再匯總風險操作和相應的安全策略打包成反饋信息。
[0119] 其中,所述基于改進K-means聚類方法的數(shù)據(jù)分析模塊包括依次連接的數(shù)據(jù)準備 單元、數(shù)據(jù)挖掘單元和用戶行為分析單元;
[0120] 所述數(shù)據(jù)準備單元用于剔除有效數(shù)據(jù)集中的缺失值和異常值,并進一步進行歸一 化處理;
[0121] 所述數(shù)據(jù)挖掘單元用于采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的有 效數(shù)據(jù)集進行聚類,并建立用戶分群模型;
[0122] 所述用戶行為分析單元用于采用決策樹算法對所述分群模型進行標識區(qū)分,識別 用戶身份,并根據(jù)標識區(qū)分識別結果建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測并 輸出用戶行為分析結果。
[0123] 其中,所述數(shù)據(jù)挖掘單元采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的 有效數(shù)據(jù)集進行聚類,具體為:
[0124] 1)設所述有效數(shù)據(jù)集具有η個樣本,對η個樣本進行向量化,通過夾角余弦函數(shù)計 算所有樣本兩兩之間的相似度,得到相似度矩陣XS;
[0125] 2)對相似度矩陣XS的每一行進行求和,計算出每一個樣本與整個有效數(shù)據(jù)集的相 似度,設XS = [ sim(ai,aj) ]ηχη,i,j = 1,…,η,其中sim(ai,aj)表示樣本ai,aj間的相似度,求 和公式為:
[0127] 3)按降序排列XSP,p = 1,…,η,設XSP按從大到小排列的前4個值為XSmax,XSmax-i,
'選擇與最大值XSma4S對應的樣本作 為第一個初始的聚簇中心,否則選擇與xsmax,XSmtl·,XSmax-2,XS max-3對應的四個樣本的均值 作為第一個初始的簇中心,T為設定的比例值;
[0128] 4)將最大值為XSmax對應的矩陣中行向量的元素進行升序排列,假設前k-Ι個最小 的元素為乂3 [)(1,(1=1,一,1^-1,選擇前1^-1個最小的元素乂5[)(1相對應的樣本作為剩余的1^-1個 初始的聚簇中心,其中所述k值的設定方法為:設定k值可能取值的區(qū)間,通過測試k的不同 取值,并對區(qū)間內的各個值進行聚類,通過比較協(xié)方差,確定聚類之間的顯著性差異,從而 來探査聚類的類型信息,并最終確定合適的HI;
[0129] 5)計算剩余樣本與各初始的聚簇中心之間的相似度,將剩余樣本分發(fā)到相似度最 高的聚簇中,形成變化后的k個聚簇;
[0130] 6)計算變化后的聚簇中各樣本的均值,將其作為更新后的聚簇中心代替更新前的 聚簇中心;
[0131] 7)若更新前的聚簇中心與更新后的聚簇中心相同,或者目標函數(shù)達到了最小值, 停止更新,所述目標函數(shù)為:
[0133] 其中,Q表示k個聚簇中的第1個聚簇,ax為第1個聚簇中的樣本,.為第1個聚簇的 中心。
[0134] 本實施例設置風險實時分析服務器3和預警設備5,對與海洋網(wǎng)絡安全相關的信息 數(shù)據(jù)進行分析,得出用戶潛在的風險操作,并針對風險實時分析服務器3輸出的反饋信息進 行選擇性防御和報警,保證了系統(tǒng)的安全,又避免了系統(tǒng)資源的閑置;設置的用戶行為分析 單元采用決策樹算法對分群模型進行標識區(qū)分,識別用戶身份,并根據(jù)標識區(qū)分識別結果 建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測,識別效果好,預測精度較高;設置基于 改進K-means聚類方法的數(shù)據(jù)分析模塊,采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理 過的有效數(shù)據(jù)集進行聚類,有效避免單一采取隨機抽樣方法所帶來的偶然性,解決原有算 法在選取k值以及初始化聚類中心時所存在的問題,提高了聚類穩(wěn)定性,進一步提高了數(shù)據(jù) 分析的準確度,其中定的比例值T的取值為1.55,數(shù)據(jù)分析的準確度提高了4.7%。
[0135] 實施例5
[0136] 參見圖1、圖2,本實施例海洋網(wǎng)絡安全風險防御系統(tǒng),包括海洋網(wǎng)絡數(shù)據(jù)采集設備 1、海洋網(wǎng)絡數(shù)據(jù)存儲設備2、風險實時分析服務器3、顯示設備4和預警設備5;所述海洋網(wǎng)絡 數(shù)據(jù)采集設備1,用于采集各種與海洋網(wǎng)絡安全相關的信息數(shù)據(jù);所述海洋網(wǎng)絡數(shù)據(jù)存儲設 備2,與海洋網(wǎng)絡數(shù)據(jù)采集設備1連接,用于將海洋網(wǎng)絡數(shù)據(jù)采集設備1采集的信息數(shù)據(jù)經過 機密性篩選與整理后存儲到海洋網(wǎng)絡數(shù)據(jù)庫中,海洋網(wǎng)絡數(shù)據(jù)庫對存儲的信息數(shù)據(jù)進行實 時更新與監(jiān)測;所述風險實時分析服務器3,與海洋網(wǎng)絡數(shù)據(jù)庫連接,用于對海洋網(wǎng)絡數(shù)據(jù) 庫實時更新的信息數(shù)據(jù)進行風險分析并輸出反饋信息;所述顯示設備4,與風險實時分析服 務器3連接,用于顯示風險實時分析服務器輸出的反饋信息,并形成日志文件;所述預警設 備5根據(jù)反饋信息進行選擇性防御和報警。
[0137] 其中,所述海洋網(wǎng)絡數(shù)據(jù)采集設備1包括視頻采集模塊、控制模塊和通信模塊,所 述視頻采集模塊用于采集與信息數(shù)據(jù)相關的視頻;所述控制模塊,與視頻采集模塊連接,用 于通過所述通信模塊控制所述視頻采集的視頻信息的無線發(fā)送。
[0138] 其中,所述海洋網(wǎng)絡數(shù)據(jù)庫中預先存儲有針對用戶行為風險操作的安全策略。
[0139] 其中,所述風險實時分析服務器3包括:
[0140] (1)數(shù)據(jù)預處理模塊,用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù)據(jù)進行數(shù)據(jù)清理 和清洗,過濾掉包含噪音和異常的數(shù)據(jù),形成用戶行為分析的有效數(shù)據(jù)集;
[0141] (2)基于改進K-means聚類方法的數(shù)據(jù)分析模塊,用于對所述有效數(shù)據(jù)集進行分類 整理和分析,并對用戶的行為進行分析,輸出用戶行為分析結果;
[0142] (3)反饋模塊,用于根據(jù)用戶行為分析結果,識別用戶行為風險操作,并從海洋網(wǎng) 絡數(shù)據(jù)庫中提取相應的安全策略,再匯總風險操作和相應的安全策略打包成反饋信息。
[0143] 其中,所述基于改進K-means聚類方法的數(shù)據(jù)分析模塊包括依次連接的數(shù)據(jù)準備 單元、數(shù)據(jù)挖掘單元和用戶行為分析單元;
[0144] 所述數(shù)據(jù)準備單元用于剔除有效數(shù)據(jù)集中的缺失值和異常值,并進一步進行歸一 化處理;
[0145] 所述數(shù)據(jù)挖掘單元用于采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的有 效數(shù)據(jù)集進行聚類,并建立用戶分群模型;
[0146] 所述用戶行為分析單元用于采用決策樹算法對所述分群模型進行標識區(qū)分,識別 用戶身份,并根據(jù)標識區(qū)分識別結果建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測并 輸出用戶行為分析結果。
[0147] 其中,所述數(shù)據(jù)挖掘單元采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的 有效數(shù)據(jù)集進行聚類,具體為:
[0148] 1)設所述有效數(shù)據(jù)集具有η個樣本,對η個樣本進行向量化,通過夾角余弦函數(shù)計 算所有樣本兩兩之間的相似度,得到相似度矩陣XS;
[0149] 2)對相似度矩陣XS的每一行進行求和,計算出每一個樣本與整個有效數(shù)據(jù)集的相 似度,設XS = [ sim(ai,aj) ]ηχη,i,j = 1,…,η,其中sim(ai,aj)表示樣本ai,aj間的相似度,求 和公式為:
[0151] 3)按降序排列XSP,p = 1,…,η,設XSP按從大到小排列的前4個值為XSmax,XSmax-i,
選擇與最大值xsmajg對應的樣本作 為第一個初始的聚簇中心,否則選擇與xsmax,XSmtl·,XSmax-2,XS max-3對應的四個樣本的均值 作為第一個初始的簇中心,T為設定的比例值;
[0152] 4)將最大值為XSmax對應的矩陣中行向量的元素進行升序排列,假設前k-Ι個最小 的元素為乂3 [)(1,(1=1,一,1^-1,選擇前1^-1個最小的元素乂5[)(1相對應的樣本作為剩余的1^-1個 初始的聚簇中心,其中所述k值的設定方法為:設定k值可能取值的區(qū)間,通過測試k的不同 取值,并對區(qū)間內的各個值進行聚類,通過比較協(xié)方差,確定聚類之間的顯著性差異,從而 來探査聚類的類型信息,并最終確定合適的HI;
[0153] 5)計算剩余樣本與各初始的聚簇中心之間的相似度,將剩余樣本分發(fā)到相似度最 高的聚簇中,形成變化后的k個聚簇;
[0154] 6)計算變化后的聚簇中各樣本的均值,將其作為更新后的聚簇中心代替更新前的 聚簇中心;
[0155] 7)若更新前的聚簇中心與更新后的聚簇中心相同,或者目標函數(shù)達到了最小值, 停止更新,所述目標函數(shù)為:
[0157] 其中,Q表示k個聚簇中的第1個聚簇,ax為第1個聚簇中的樣本,%:為第1個聚簇的 中心。
[0158] 本實施例設置風險實時分析服務器3和預警設備5,對與海洋網(wǎng)絡安全相關的信息 數(shù)據(jù)進行分析,得出用戶潛在的風險操作,并針對風險實時分析服務器3輸出的反饋信息進 行選擇性防御和報警,保證了系統(tǒng)的安全,又避免了系統(tǒng)資源的閑置;設置的用戶行為分析 單元采用決策樹算法對分群模型進行標識區(qū)分,識別用戶身份,并根據(jù)標識區(qū)分識別結果 建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測,識別效果好,預測精度較高;設置基于 改進K-means聚類方法的數(shù)據(jù)分析模塊,采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理 過的有效數(shù)據(jù)集進行聚類,有效避免單一采取隨機抽樣方法所帶來的偶然性,解決原有算 法在選取k值以及初始化聚類中心時所存在的問題,提高了聚類穩(wěn)定性,進一步提高了數(shù)據(jù) 分析的準確度,其中定的比例值T的取值為1.6,數(shù)據(jù)分析的準確度提高了3%。
[0159]最后應當說明的是,以上實施例僅用以說明本發(fā)明的技術方案,而非對本發(fā)明保 護范圍的限制,盡管參照較佳實施例對本發(fā)明作了詳細地說明,本領域的普通技術人員應 當理解,可以對本發(fā)明的技術方案進行修改或者等同替換,而不脫離本發(fā)明技術方案的實 質和范圍。
【主權項】
1. 海洋網(wǎng)絡安全風險防御系統(tǒng),其特征在于,包括海洋網(wǎng)絡數(shù)據(jù)采集設備、海洋網(wǎng)絡數(shù) 據(jù)存儲設備、風險實時分析服務器、顯示設備和預警設備;所述海洋網(wǎng)絡數(shù)據(jù)采集設備,用 于采集各種與海洋網(wǎng)絡安全相關的信息數(shù)據(jù);所述海洋網(wǎng)絡數(shù)據(jù)存儲設備,與海洋網(wǎng)絡數(shù) 據(jù)采集設備連接,用于將海洋網(wǎng)絡數(shù)據(jù)采集設備采集的信息數(shù)據(jù)經過機密性篩選與整理后 存儲到海洋網(wǎng)絡數(shù)據(jù)庫中,海洋網(wǎng)絡數(shù)據(jù)庫對存儲的信息數(shù)據(jù)進行實時更新與監(jiān)測;所述 風險實時分析服務器,與海洋網(wǎng)絡數(shù)據(jù)庫連接,用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù) 據(jù)進行風險分析并輸出反饋信息;所述顯示設備,與風險實時分析服務器連接,用于顯示風 險實時分析服務器輸出的反饋信息,并形成日志文件;所述預警設備根據(jù)反饋信息進行選 擇性防御和報警。2. 根據(jù)權利要求1所述的海洋網(wǎng)絡安全風險防御系統(tǒng),其特征在于,所述海洋網(wǎng)絡數(shù)據(jù) 采集設備包括視頻采集模塊、控制模塊和通信模塊,所述視頻采集模塊用于采集與信息數(shù) 據(jù)相關的視頻;所述控制模塊,與視頻采集模塊連接,用于通過所述通信模塊控制所述視頻 采集的視頻信息的無線發(fā)送。3. 根據(jù)權利要求1所述的海洋網(wǎng)絡安全風險防御系統(tǒng),其特征在于,所述海洋網(wǎng)絡數(shù)據(jù) 庫中預先存儲有針對用戶行為風險操作的安全策略。4. 根據(jù)權利要求1所述的海洋網(wǎng)絡安全風險防御系統(tǒng),其特征在于,所述風險實時分析 服務器包括: (1) 數(shù)據(jù)預處理模塊,用于對海洋網(wǎng)絡數(shù)據(jù)庫實時更新的信息數(shù)據(jù)進行數(shù)據(jù)清理和清 洗,過濾掉包含噪音和異常的數(shù)據(jù),形成用戶行為分析的有效數(shù)據(jù)集; (2) 基于改進K-means聚類方法的數(shù)據(jù)分析模塊,用于對所述有效數(shù)據(jù)集進行分類整理 和分析,并對用戶的行為進行分析,輸出用戶行為分析結果; (3) 反饋模塊,用于根據(jù)用戶行為分析結果,識別用戶行為風險操作,并從海洋網(wǎng)絡數(shù) 據(jù)庫中提取相應的安全策略,再匯總風險操作和相應的安全策略打包成反饋信息。5. 根據(jù)權利要求1所述的海洋網(wǎng)絡安全風險防御系統(tǒng),其特征在于,所述基于改進K- means聚類方法的數(shù)據(jù)分析模塊包括依次連接的數(shù)據(jù)準備單元、數(shù)據(jù)挖掘單元和用戶行為 分析單元; 所述數(shù)據(jù)準備單元用于剔除有效數(shù)據(jù)集中的缺失值和異常值,并進一步進行歸一化處 理; 所述數(shù)據(jù)挖掘單元用于采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的有效數(shù) 據(jù)集進行聚類,并建立用戶分群模型; 所述用戶行為分析單元用于采用決策樹算法對所述分群模型進行標識區(qū)分,識別用戶 身份,并根據(jù)標識區(qū)分識別結果建立人工神經網(wǎng)絡模型,進而對用戶行為進行預測并輸出 用戶行為分析結果。6. 根據(jù)權利要求1所述的海洋網(wǎng)絡安全風險防御系統(tǒng),其特征在于,所述數(shù)據(jù)挖掘單元 采用改進K-means聚類方法對由數(shù)據(jù)準備單元處理過的有效數(shù)據(jù)集進行聚類,具體為: 1) 設所述有效數(shù)據(jù)集具有η個樣本,對η個樣本進行向量化,通過夾角余弦函數(shù)計算所 有樣本兩兩之間的相似度,得到相似度矩陣XS; 2) 對相似度矩陣XS的每一行進行求和,計算出每一個樣本與整個有效數(shù)據(jù)集的相似 度,設XS= [sim(ai,aj) ]ηΧη,i,j = l,…,η,其中sim(ai,aj)表示樣本ai,aj間的相似度,求和 公式為:3 )按降序排列XSp,P = 1,…,η,設XSp按從大到小排列的前4個值為XSmax,XSmax-1,XSmax-2, XSmax-3,若選擇與最大值XSmax相對應的樣本作為第一 個初始的聚簇中屯、,否則選擇與XSmax,XSmax-1,XSmax-2,XSmax-3對應的四個樣本的均值作為第 一個初始的簇中屯、,T為設定的比例值; 4) 將最大值為XSmax對應的矩陣中行向量的元素進行升序排列,假設前k-1個最小的元 素為XSpq,q=l,···,k-l,選擇前k-1個最小的元素 XSpq相對應的樣本作為剩余的k-1個初始 的聚簇中屯、,其中所述k值的設定方法為:設定k值可能取值的區(qū)間,通過測試k的不同取值, 并對區(qū)間內的各個值進行聚類,通過比較協(xié)方差,確定聚類之間的顯著性差異,從而來探査 聚類的類型信息,并最終確定合適的HI; 5) 計算剩余樣本與各初始的聚簇中屯、之間的相似度,將剩余樣本分發(fā)到相似度最高的 聚簇中,形成變化后的k個聚簇; 6) 計算變化后的聚簇中各樣本的均值,將其作為更新后的聚簇中屯、代替更新前的聚簇 中屯、; 7) 若更新前的聚簇中屯、與更新后的聚簇中屯、相同,或者目標函數(shù)達到了最小值,停止 更新,所述目標函數(shù)為:其中,Cl表示k個聚簇中的第1個聚簇,ax為第1個聚簇中的樣本,馬^為第1個聚簇的中 屯、。7.根據(jù)權利要求1所述的海洋網(wǎng)絡安全風險防御系統(tǒng),其特征在于,所述設定的比例值 T的取值范圍為[1.4,1.6]。
【文檔編號】H04L29/06GK106096060SQ201610540831
【公開日】2016年11月9日
【申請日】2016年7月6日
【發(fā)明人】不公告發(fā)明人
【申請人】吳本剛