本發(fā)明涉及數(shù)據(jù)處理,具體涉及ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法及系統(tǒng)。
背景技術(shù):
1、大數(shù)據(jù)平臺處理海量數(shù)據(jù),涉及多個敏感行業(yè),安全保護是大數(shù)據(jù)平臺中至關(guān)重要的環(huán)節(jié),包括防止數(shù)據(jù)泄露、未經(jīng)授權(quán)的訪問、數(shù)據(jù)篡改,以及各類網(wǎng)絡(luò)攻擊。然而,在大數(shù)據(jù)平臺的安全防護中,正常的訪問行為數(shù)據(jù)遠遠多于異常入侵數(shù)據(jù),這種數(shù)據(jù)的不平衡會導(dǎo)致傳統(tǒng)的機器學(xué)習(xí)和深度學(xué)習(xí)模型在訓(xùn)練過程中更加偏向于多數(shù)類數(shù)據(jù),而忽視了少數(shù)類數(shù)據(jù)的特征,結(jié)果是模型在實際應(yīng)用中容易漏檢異常行為,導(dǎo)致安全防護效果不佳。
技術(shù)實現(xiàn)思路
1、本申請通過提供了ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法及系統(tǒng),旨在解決現(xiàn)有技術(shù)的入侵檢測無法應(yīng)對相關(guān)數(shù)據(jù)集的不平衡,導(dǎo)致模型偏向于學(xué)習(xí)多數(shù)類數(shù)據(jù)的特征而忽視少數(shù)類數(shù)據(jù)的特征,影響檢測準確率的技術(shù)問題。
2、本申請公開的第一個方面,提供了ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,所述方法包括:獲取大數(shù)據(jù)平臺的歷史安全保護記錄,所述歷史安全保護記錄包括m條正常訪問保護和n條異常入侵保護,其中m遠大于n;讀取預(yù)定采樣策略,所述預(yù)定采樣策略包括第一采樣策略和第二采樣策略;根據(jù)所述第一采樣策略對所述m條正常訪問保護進行采樣,得到多數(shù)類數(shù)據(jù)集,根據(jù)所述第二采樣策略對所述n條異常入侵保護進行采樣,得到少數(shù)類數(shù)據(jù)集;利用所述多數(shù)類數(shù)據(jù)集與所述少數(shù)類數(shù)據(jù)集組建平衡數(shù)據(jù)集,并對所述平衡數(shù)據(jù)集進行更新,得到目標數(shù)據(jù)集;利用支持向量機原理對分析所述目標數(shù)據(jù)集得到的訓(xùn)練數(shù)據(jù)集進行監(jiān)督訓(xùn)練,得到異常入侵識別器;通過所述異常入侵識別器對所述大數(shù)據(jù)平臺進行安全保護。
3、本申請公開的第二個方面,提供了ai驅(qū)動的大數(shù)據(jù)平臺安全保護系統(tǒng),所述系統(tǒng)用于上述ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,所述系統(tǒng)包括:歷史記錄獲取模塊,所述歷史記錄獲取模塊用于獲取大數(shù)據(jù)平臺的歷史安全保護記錄,所述歷史安全保護記錄包括m條正常訪問保護和n條異常入侵保護,其中m遠大于n;預(yù)定策略讀取模塊,所述預(yù)定策略讀取模塊用于讀取預(yù)定采樣策略,所述預(yù)定采樣策略包括第一采樣策略和第二采樣策略;數(shù)據(jù)采樣模塊,所述數(shù)據(jù)采樣模塊用于根據(jù)所述第一采樣策略對所述m條正常訪問保護進行采樣,得到多數(shù)類數(shù)據(jù)集,根據(jù)所述第二采樣策略對所述n條異常入侵保護進行采樣,得到少數(shù)類數(shù)據(jù)集;數(shù)據(jù)更新模塊,所述數(shù)據(jù)更新模塊用于利用所述多數(shù)類數(shù)據(jù)集與所述少數(shù)類數(shù)據(jù)集組建平衡數(shù)據(jù)集,并對所述平衡數(shù)據(jù)集進行更新,得到目標數(shù)據(jù)集;監(jiān)督訓(xùn)練模塊,所述監(jiān)督訓(xùn)練模塊用于利用支持向量機原理對分析所述目標數(shù)據(jù)集得到的訓(xùn)練數(shù)據(jù)集進行監(jiān)督訓(xùn)練,得到異常入侵識別器;安全保護模塊,所述安全保護模塊用于通過所述異常入侵識別器對所述大數(shù)據(jù)平臺進行安全保護。
4、本申請中提供的一個或多個技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點:
5、通過預(yù)定采樣策略,對多數(shù)類的正常訪問和少數(shù)類的異常入侵記錄進行不同的采樣,通過第一采樣策略對m條正常訪問記錄進行采樣,避免過度依賴多數(shù)類;同時,通過第二采樣策略對n條異常入侵記錄進行采樣,使得少數(shù)類數(shù)據(jù)被充分代表,這種方法確保了兩類數(shù)據(jù)的平衡,有效減輕了數(shù)據(jù)不平衡問題對模型訓(xùn)練的影響;通過組建平衡數(shù)據(jù)集,進一步確保了多數(shù)類和少數(shù)類數(shù)據(jù)在模型訓(xùn)練中的均衡貢獻,平衡數(shù)據(jù)集的創(chuàng)建和更新可以有效提高少數(shù)類異常入侵行為在數(shù)據(jù)中的權(quán)重,從而增強模型對異常行為的學(xué)習(xí)能力;利用支持向量機原理,對目標數(shù)據(jù)集進行監(jiān)督訓(xùn)練,生成異常入侵識別器,支持向量機以最大化分類邊界為目標,具有較強的泛化能力,能夠有效應(yīng)對二分類問題,最大化區(qū)分正常訪問與異常入侵的特征;通過異常入侵識別器對大數(shù)據(jù)平臺進行實時安全保護,一旦識別到異常行為,能夠迅速做出反應(yīng),阻止?jié)撛诘娜肭中袨?,實現(xiàn)實時監(jiān)控和快速響應(yīng)。
6、上述說明僅是本申請技術(shù)方案的概述,為了能夠更清楚了解本申請的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本申請的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本申請的具體實施方式。
1.ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,其特征在于,包括:
3.根據(jù)權(quán)利要求2所述ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,其特征在于,包括:
4.根據(jù)權(quán)利要求3所述ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,其特征在于,包括:
5.根據(jù)權(quán)利要求4所述ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,其特征在于,當所述第一采樣數(shù)據(jù)量達到所述采樣門限值時,對所述多個鄰域正常訪問保護進行第二指標維度的采樣,所述第二指標維度是指所述預(yù)定指標維度中的任意一個不同于所述第一指標維度的指標維度。
6.根據(jù)權(quán)利要求1所述ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,其特征在于,包括:
7.根據(jù)權(quán)利要求6所述ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,其特征在于,包括:
8.ai驅(qū)動的大數(shù)據(jù)平臺安全保護系統(tǒng),其特征在于,用于實施權(quán)利要求1-7任一項所述的ai驅(qū)動的大數(shù)據(jù)平臺安全保護方法,所述系統(tǒng)包括: