專利名稱:網(wǎng)絡(luò)數(shù)據(jù)安全管理方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種網(wǎng)絡(luò)數(shù)據(jù)安全管理技術(shù),特別是涉及一種網(wǎng)絡(luò)數(shù)據(jù)安全管理方法和設(shè)備。
背景技術(shù):
隨著計(jì)算機(jī)等具有互連特性的終端設(shè)備的廣泛應(yīng)用,網(wǎng)絡(luò)(如互聯(lián)網(wǎng)或者局域網(wǎng)或者移動(dòng)通信網(wǎng)絡(luò)等)已經(jīng)深入的普及到社會(huì)的各行各業(yè)之中。網(wǎng)絡(luò)的迅速發(fā)展在為人們的工作、學(xué)習(xí)、以及娛樂等多方面提供了諸多便利的同時(shí),也為人們帶來了新的問題,而其中的網(wǎng)絡(luò)數(shù)據(jù)管理問題尤其是網(wǎng)絡(luò)數(shù)據(jù)安全問題已經(jīng)成為諸多行業(yè)非常關(guān)注的焦點(diǎn)問題。例如,國(guó)家電網(wǎng)公司大力推進(jìn)“SG186”工程和電力通信等建設(shè),數(shù)字化電網(wǎng)、信息化企業(yè)的藍(lán)圖正在逐步實(shí)現(xiàn),但是,國(guó)家電網(wǎng)公司擁有大量的 商業(yè)秘密數(shù)據(jù)、企業(yè)敏感數(shù)據(jù)以及個(gè)人敏感數(shù)據(jù)等需要進(jìn)行安全保護(hù)的數(shù)據(jù),這些數(shù)據(jù)一旦外泄,將會(huì)造成極大的安全隱患?,F(xiàn)有的網(wǎng)絡(luò)數(shù)據(jù)安全管理技術(shù)通常為網(wǎng)絡(luò)數(shù)據(jù)分析過濾技術(shù)。網(wǎng)絡(luò)數(shù)據(jù)分析過濾技術(shù)通常是基于關(guān)鍵字過濾或者基于IP地址過濾來實(shí)現(xiàn)的,例如,IP地址是否與IP黑名單中的IP地址匹配、以及關(guān)鍵字是否與預(yù)設(shè)的關(guān)鍵字匹配等。在安全管理的后續(xù)操作中,可以通過采用告警、屏蔽等安全防護(hù)措施來保護(hù)網(wǎng)絡(luò)數(shù)據(jù)的安全。發(fā)明人在實(shí)現(xiàn)本發(fā)明過程中發(fā)現(xiàn)由于文字存在同音變?cè)~、以及不同詞同義等現(xiàn)象,因此,現(xiàn)有的網(wǎng)絡(luò)數(shù)據(jù)安全管理方式在采用關(guān)鍵字匹配過濾的情況下,并不能夠?qū)γ舾袛?shù)據(jù)進(jìn)行準(zhǔn)確的過濾和預(yù)警,從而會(huì)造成非法內(nèi)容欺騙過濾器而成功外泄的現(xiàn)象。另外,由于網(wǎng)絡(luò)數(shù)據(jù)安全管理方式忽略了文本中的語義約束,因此,會(huì)產(chǎn)生大量的假匹配現(xiàn)象,從而將合法的內(nèi)容過濾掉。有鑒于上述現(xiàn)有的網(wǎng)絡(luò)數(shù)據(jù)安全管理方式存在的問題,本發(fā)明人基于從事此類產(chǎn)品設(shè)計(jì)制造多年豐富的實(shí)務(wù)經(jīng)驗(yàn)及專業(yè)知識(shí),并配合學(xué)理的運(yùn)用,積極加以研究創(chuàng)新,以期創(chuàng)設(shè)一種新型結(jié)構(gòu)的網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備以及一種新的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,能夠克服現(xiàn)有的網(wǎng)絡(luò)數(shù)據(jù)安全管理方式存在的問題,使其更具有實(shí)用性。經(jīng)過不斷的研究、設(shè)計(jì),并經(jīng)過反復(fù)試作樣品及改進(jìn)后,終于創(chuàng)設(shè)出確具實(shí)用價(jià)值的本發(fā)明。
發(fā)明內(nèi)容
本發(fā)明的目的之一在于,克服現(xiàn)有的網(wǎng)絡(luò)數(shù)據(jù)安全管理方式存在的缺陷,而提供一種新的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法和設(shè)備,所要解決的技術(shù)問題是,對(duì)敏感數(shù)據(jù)進(jìn)行準(zhǔn)確的過濾和預(yù)警,避免假匹配現(xiàn)象,增強(qiáng)網(wǎng)絡(luò)數(shù)據(jù)的安全性,非常適于實(shí)用。本發(fā)明的目的以及解決其技術(shù)問題可以采用以下的技術(shù)方案來實(shí)現(xiàn)。依據(jù)本發(fā)明提出的一種網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,所述方法包括獲取網(wǎng)絡(luò)數(shù)據(jù);從所述網(wǎng)絡(luò)數(shù)據(jù)中提取待匹配樣本;根據(jù)距離算法計(jì)算所述待匹配樣本與預(yù)先存儲(chǔ)的至少一個(gè)關(guān)鍵字的語音距離和/或語義距離;獲取所述距離超過模糊度門限值的關(guān)鍵字對(duì)應(yīng)的權(quán)重值;根據(jù)所述權(quán)重值計(jì)算所述網(wǎng)絡(luò)數(shù)據(jù)的安全值;如果所述安全值不超過預(yù)定安全值,則所述網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,所述網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。本發(fā)明的目的以及解決其技術(shù)問題還可以采用以下的技術(shù)措施來進(jìn)一步實(shí)現(xiàn)。較佳的,前述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其中所述從所述網(wǎng)絡(luò)數(shù)據(jù)中獲取待匹配樣本包括基于去除無效字符算法從所述網(wǎng)絡(luò)數(shù)據(jù)中獲取待匹配樣本。較佳的,前述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其中所述方法包括預(yù)先存儲(chǔ)有關(guān)鍵字、模糊度門限值、和權(quán)重值的對(duì)應(yīng)關(guān)系信息;所述模糊度門限值包括語義模糊度門限值和/或語音模糊度門限值。較佳的,前述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其中所述對(duì)應(yīng)關(guān)系信息中還包括關(guān)鍵字出現(xiàn)頻率概率門限值。
較佳的,前述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其中所述方法還包括計(jì)算所述距離超過模糊度門限值的匹配樣本在所述網(wǎng)絡(luò)數(shù)據(jù)的全文中的出現(xiàn)頻率;如果所述出現(xiàn)頻率不超過所述關(guān)鍵字出現(xiàn)頻率概率門限值,則所述網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,所述網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。較佳的,前述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其中所述方法還包括針對(duì)不安全網(wǎng)絡(luò)數(shù)據(jù)輸出警告信息;和/或屏蔽不安全網(wǎng)絡(luò)數(shù)據(jù)。依據(jù)本發(fā)明提出的一種網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備,所述設(shè)備包括獲取模塊,用于獲取網(wǎng)絡(luò)數(shù)據(jù);提取模塊,用于從所述網(wǎng)絡(luò)數(shù)據(jù)中提取待匹配樣本;距離模塊,用于根據(jù)距離算法計(jì)算所述待匹配樣本與預(yù)先存儲(chǔ)的至少一個(gè)關(guān)鍵字的語音距離和/或語義距離;第一預(yù)判模塊,用于獲取所述距離超過模糊度門限值的關(guān)鍵字對(duì)應(yīng)的權(quán)重值,并根據(jù)所述權(quán)重值計(jì)算所述網(wǎng)絡(luò)數(shù)據(jù)的安全值,如果所述安全值不超過預(yù)定安全值,則所述網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,所述網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。較佳的,前述的網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備,其中所述設(shè)備包括存儲(chǔ)模塊,用于預(yù)先存儲(chǔ)關(guān)鍵字、模糊度門限值、和權(quán)重值的對(duì)應(yīng)關(guān)系信息;所述模糊度門限值包括語義模糊度門限值和/或語音模糊度門限值。較佳的,前述的網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備,其中所述存儲(chǔ)模塊中存儲(chǔ)的對(duì)應(yīng)關(guān)系信息中還包括關(guān)鍵字出現(xiàn)頻率概率門限值;且所述設(shè)備還包括第二預(yù)判模塊,用于計(jì)算所述距離超過模糊度門限值的匹配樣本在所述網(wǎng)絡(luò)數(shù)據(jù)的全文中的出現(xiàn)頻率,如果所述出現(xiàn)頻率不超過所述關(guān)鍵字出現(xiàn)頻率概率門限值,則所述網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,所述網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。較佳的,前述的網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備,其中所述設(shè)備還包括警示模塊,用于針對(duì)不安全網(wǎng)絡(luò)數(shù)據(jù)輸出警告信息;和/或屏蔽模塊,用于屏蔽不安全網(wǎng)絡(luò)數(shù)據(jù)。借由上述技術(shù)方案,本發(fā)明的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法和設(shè)備至少具有下列優(yōu)點(diǎn)及有益效果本發(fā)明通過計(jì)算從網(wǎng)絡(luò)數(shù)據(jù)中提取出的待匹配樣本與預(yù)先存儲(chǔ)的各關(guān)鍵字的語音距離和/或語義距離,針對(duì)距離超過門限值的關(guān)鍵字對(duì)應(yīng)的權(quán)重值進(jìn)行安全值計(jì)算,并基于該計(jì)算結(jié)果進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)是否安全的判斷,從而可以基于語音和/或語義進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)安全管理,實(shí)現(xiàn)了對(duì)敏感數(shù)據(jù)的準(zhǔn)確的過濾和預(yù)警,避免假匹配現(xiàn)象,提高了網(wǎng)絡(luò)數(shù)據(jù)的安全性,非常適于實(shí)用。綜上所述,本發(fā)明在技術(shù)上有顯著的進(jìn)步,并具有明顯的積極效果,誠(chéng)為一新穎、進(jìn)步、實(shí)用的新設(shè)計(jì)。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其他目的、特征以及優(yōu)點(diǎn)能夠更明顯易懂,以下特舉較佳實(shí)施例,并配合附圖,詳細(xì)說明如下。
圖I為本發(fā)明實(shí)施例一的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法示意圖。圖2為本發(fā)明實(shí)施例三的網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備示意具體實(shí)施例方式為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實(shí)施例,對(duì)依據(jù)本發(fā)明提出的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法和設(shè)備其具體實(shí)施方式
、 結(jié)構(gòu)、特征、步驟及其功效,詳細(xì)說明如后。實(shí)施例一、網(wǎng)絡(luò)數(shù)據(jù)安全管理方法。該方法的流程如圖I所示。圖I中示出的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法的具體流程包括下述步驟S100、獲取網(wǎng)絡(luò)數(shù)據(jù)。具體的,本發(fā)明可以在網(wǎng)絡(luò)中的某個(gè)節(jié)點(diǎn)處截取流經(jīng)該節(jié)點(diǎn)并需要繼續(xù)在網(wǎng)絡(luò)中傳輸?shù)木W(wǎng)絡(luò)數(shù)據(jù),該節(jié)點(diǎn)可以為網(wǎng)絡(luò)數(shù)據(jù)傳輸路徑的源節(jié)點(diǎn)或者中間節(jié)點(diǎn),例如,該節(jié)點(diǎn)可以為交換機(jī)或者路由器或者服務(wù)器等網(wǎng)絡(luò)設(shè)備。該網(wǎng)絡(luò)數(shù)據(jù)可以為一個(gè)數(shù)據(jù)包中攜帶的所有有效負(fù)荷,也可以為一個(gè)數(shù)據(jù)包中攜帶的部分有效負(fù)荷。本發(fā)明不限制獲取網(wǎng)絡(luò)數(shù)據(jù)的網(wǎng)絡(luò)設(shè)備的具體位置、以及該網(wǎng)絡(luò)設(shè)備的具體表現(xiàn)形式等。S110、從獲取的網(wǎng)絡(luò)數(shù)據(jù)中提取待匹配樣本。具體的,本發(fā)明可以采用去除無效字符算法從上述截取的網(wǎng)絡(luò)數(shù)據(jù)中獲取待匹配樣本。本發(fā)明所采用的去除無效字算法可以采用現(xiàn)有的去除無效字符算法。一個(gè)具體的例子采用去除無效字符算法從“電力XXXX設(shè)備”中去除四個(gè)“X”而提取出“電力設(shè)備”這一待匹配樣本。從網(wǎng)絡(luò)數(shù)據(jù)中提取的待匹配樣本可以為至少一個(gè)字、詞、短語、和/或短句等。本發(fā)明不限制所采用的去除無效字符算法的具體實(shí)現(xiàn)方式、以及待匹配樣本的具體表現(xiàn)形式。S120、根據(jù)距離算法計(jì)算上述待匹配樣本與預(yù)先存儲(chǔ)的至少一個(gè)關(guān)鍵字的語音距離和/或語義距離。具體的,上述預(yù)先存儲(chǔ)的關(guān)鍵字可以以關(guān)鍵字、模糊度門限值(語義模糊度門限值和/或語音模糊度門限值)、以及權(quán)重值的對(duì)應(yīng)關(guān)系信息的形式存儲(chǔ)。該對(duì)應(yīng)關(guān)系信息可以以表、數(shù)據(jù)庫(kù)、或者文本等格式存儲(chǔ)。存儲(chǔ)的對(duì)應(yīng)關(guān)系信息的一個(gè)具體的例子預(yù)先存儲(chǔ)的表中包括有至少三個(gè)字段,其中一個(gè)字段為關(guān)鍵字字段,另一個(gè)字段為語義模糊度門限值字段,還有一個(gè)字段為權(quán)重值字段。存儲(chǔ)的對(duì)應(yīng)關(guān)系信息的另一個(gè)具體的例子預(yù)先存儲(chǔ)的表中包括有至少三個(gè)字段,其中一個(gè)字段為關(guān)鍵字字段,另一個(gè)字段為語音模糊度門限值字段,還有一個(gè)字段為權(quán)
重值字段。
存儲(chǔ)的對(duì)應(yīng)關(guān)系信息的第三個(gè)具體的例子預(yù)先存儲(chǔ)的表中包括有至少四個(gè)字段,其中一個(gè)字段為關(guān)鍵字字段,另一個(gè)字段為語義模糊度門限值字段,還有一個(gè)字段為語音模糊度門限值字段,第四個(gè)字段為權(quán)重值字段。本發(fā)明中的一個(gè)關(guān)鍵字中存儲(chǔ)的內(nèi)容并不是專指單個(gè)字,一個(gè)關(guān)鍵字中存儲(chǔ)的內(nèi)容可以具體為一個(gè)字、詞、短語、或者短句等等,本發(fā)明不限制關(guān)鍵字的具體表現(xiàn)形式。在S120中,針對(duì)一個(gè)待匹配樣本而言,根據(jù)距離算法對(duì)該待匹配樣本與預(yù)先存儲(chǔ)的至少一個(gè)關(guān)鍵字(如所有的關(guān)鍵字)均進(jìn)行距離運(yùn)算,以計(jì)算出該待匹配樣本與至少一個(gè)關(guān)鍵字的距離。該距離算法可以為語音距離算法,也可以為語義距離算法,還可以為語音距離算法和語義距離算法。計(jì)算出的距離可以為語音距離,也可以為語義距離,還可以為語義距離和語音距離。上述語音距離算法即針對(duì)語音相似度的計(jì)算算法,上述語義距離算法即針對(duì)語義相似度的計(jì)算算法。本發(fā)明可以采用現(xiàn)有的語音距離算法和語義距離算法。S130、獲取計(jì)算出的距離超過模糊度門限值的關(guān)鍵字對(duì)應(yīng)的權(quán)重值。 具體的,由于每個(gè)關(guān)鍵字的對(duì)應(yīng)關(guān)系中均設(shè)置有語義模糊度門限值字段和/或語音模糊度門限值字段,因此,本發(fā)明針對(duì)一個(gè)關(guān)鍵字計(jì)算出的待匹配樣本與該關(guān)鍵字的語義距離可以和該關(guān)鍵字對(duì)應(yīng)關(guān)系中的語義模糊度門限值進(jìn)行比較,本發(fā)明針對(duì)一個(gè)關(guān)鍵字計(jì)算出的待匹配樣本與該關(guān)鍵字的語音距離可以和該關(guān)鍵字對(duì)應(yīng)關(guān)系中的語音模糊度門限值進(jìn)行比較。不論是計(jì)算出的語音距離超過對(duì)應(yīng)關(guān)系中的語音模糊度門限值,還是計(jì)算出的語義距離超過對(duì)應(yīng)關(guān)系中的語義模糊度門限值,只要其中一個(gè)距離超過模糊度門限值,則獲取該關(guān)鍵字的對(duì)應(yīng)關(guān)系中的權(quán)重值。權(quán)重值可以表現(xiàn)出該關(guān)鍵字的重要程度,如權(quán)重值越大則該關(guān)鍵字越重要。本發(fā)明可以按照進(jìn)行一個(gè)距離計(jì)算再進(jìn)行一次比較的順序依次執(zhí)行操作,并在比較結(jié)果為計(jì)算出的距離超過模糊度門限值時(shí),不再進(jìn)行下一次的距離計(jì)算過程,即針對(duì)關(guān)鍵字依次計(jì)算直到找到超過模糊度門限值的關(guān)鍵字為止。本發(fā)明也可以按照進(jìn)行一個(gè)距離計(jì)算再進(jìn)行一次比較的順序依次執(zhí)行操作,并在比較結(jié)果為計(jì)算出的距離超過模糊度門限值時(shí),提取相應(yīng)的權(quán)重值,之后繼續(xù)進(jìn)行下一次的距離計(jì)算過程,即針對(duì)所有關(guān)鍵字依次計(jì)算直到找到所有的超過模糊度門限值的關(guān)鍵字為止。針對(duì)一個(gè)待匹配樣本而言,如果計(jì)算出的該待匹配樣本與多個(gè)關(guān)鍵字的距離均超過關(guān)鍵字對(duì)應(yīng)的模糊度門限值,則會(huì)出現(xiàn)多個(gè)關(guān)鍵字對(duì)應(yīng)的權(quán)重值均被獲取到的現(xiàn)象,本發(fā)明可以選取多個(gè)權(quán)重值中最大的一個(gè),以進(jìn)行后續(xù)的安全值計(jì)算,本發(fā)明也可以選取多個(gè)權(quán)重值中任一個(gè)權(quán)重值,以進(jìn)行后續(xù)的安全值計(jì)算,本發(fā)明還可以對(duì)多個(gè)權(quán)重值進(jìn)行均值計(jì)算,以利用計(jì)算出的權(quán)重值的均值進(jìn)行后續(xù)的安全值計(jì)算。S140、根據(jù)上述權(quán)重值計(jì)算網(wǎng)絡(luò)數(shù)據(jù)的安全值。具體的,針對(duì)該網(wǎng)絡(luò)數(shù)據(jù)中的多個(gè)待匹配樣本可能會(huì)獲取到一個(gè)或者多個(gè)權(quán)重值,權(quán)重值的數(shù)量可以小于等于待匹配樣本的數(shù)量;本發(fā)明可以根據(jù)該一個(gè)或多個(gè)權(quán)重值采用預(yù)定的算法計(jì)算出該網(wǎng)絡(luò)數(shù)據(jù)的安全值。該安全值是基于權(quán)重值的一個(gè)綜合評(píng)價(jià)數(shù)值,本發(fā)明中的計(jì)算安全值的預(yù)定的算法可以根據(jù)具體應(yīng)用來設(shè)置,本發(fā)明不限制該算法的具體實(shí)現(xiàn)方式。
S150、判斷計(jì)算出的安全值是否超過預(yù)先設(shè)定的預(yù)定安全值,如果不超過,到S160,否則,到 S170。需要說明的是,S150中的超過也可以替換為不小于,此時(shí),如果不小于,則到S170,否則,到 S160。S160、確定該網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù)S170、確定該網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。本發(fā)明可以針對(duì)不安全網(wǎng)絡(luò)數(shù)據(jù)輸出警告信息,也可以針對(duì)不安全網(wǎng)絡(luò)數(shù)據(jù)執(zhí)行屏蔽操作,該屏蔽操作如刪除該網(wǎng)絡(luò)數(shù)據(jù)或者將該網(wǎng)絡(luò)數(shù)據(jù)引向黑洞等,以保證不安全的網(wǎng)絡(luò)數(shù)據(jù)不能夠在網(wǎng)絡(luò)中順利傳輸。實(shí)施例二、網(wǎng)絡(luò)數(shù)據(jù)安全管理方法。 該方法的流程與上述實(shí)施例一的流程基本相同,只是還需要額外增加出現(xiàn)頻率判斷步驟。為實(shí)現(xiàn)該判斷步驟,對(duì)應(yīng)關(guān)系信息中還包含有關(guān)鍵字出現(xiàn)頻率概率門限值這一字段,而且,還需要計(jì)算S120計(jì)算出的距離超過模糊度門限值的匹配樣本在網(wǎng)絡(luò)數(shù)據(jù)的全文中的出現(xiàn)頻率,如果該出現(xiàn)頻率不超過該匹配樣本對(duì)應(yīng)的關(guān)鍵字出現(xiàn)頻率概率門限值,則確定該網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,確定該網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。實(shí)施例二中新增加的判斷步驟應(yīng)該在S120之后,且該新增加的判斷步驟可以和S130之間沒有先后執(zhí)行順序。實(shí)施例三、網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備。該設(shè)備的結(jié)構(gòu)如附圖2所示。圖2中示出的網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備具體包括獲取模塊I、提取模塊2、距離模塊3、以及第一預(yù)判模塊4??蛇x的,該設(shè)備還可以包括存儲(chǔ)模塊5、第二預(yù)判模塊6、警示模塊7、以及屏蔽模塊8中的至少一個(gè)。該網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備可以為網(wǎng)絡(luò)數(shù)據(jù)傳輸路徑的源節(jié)點(diǎn)或者中間節(jié)點(diǎn),例如,該網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備可以為交換機(jī)或者路由器或者服務(wù)器等網(wǎng)絡(luò)設(shè)備。本發(fā)明不限制該網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備的具體位置、以及該設(shè)備的具體表現(xiàn)形式等。獲取模塊I主要用于獲取網(wǎng)絡(luò)數(shù)據(jù)。具體的,獲取模塊I可以截取流經(jīng)其所在設(shè)備并需要繼續(xù)在網(wǎng)絡(luò)中傳輸?shù)木W(wǎng)絡(luò)數(shù)據(jù);獲取模塊I獲取的網(wǎng)絡(luò)數(shù)據(jù)可以為一個(gè)數(shù)據(jù)包中攜帶的所有有效負(fù)荷,也可以為一個(gè)數(shù)據(jù)包中攜帶的部分有效負(fù)荷。提取模塊2與獲取模塊I連接。提取模塊2主要用于從獲取模塊I獲取的網(wǎng)絡(luò)數(shù)據(jù)中提取待匹配樣本。具體的,提取模塊2可以采用去除無效字符算法從獲取模塊I截取的網(wǎng)絡(luò)數(shù)據(jù)中獲取待匹配樣本。提取模塊2所采用的去除無效字算法可以采用現(xiàn)有的去除無效字符算法。一個(gè)具體的例子提取模塊2采用去除無效字符算法從“電力X X X X設(shè)備”中去除四個(gè)“ X ”而提取出“電力設(shè)備”這一待匹配樣本。提取模塊2從網(wǎng)絡(luò)數(shù)據(jù)中提取的待匹配樣本可以為至少一個(gè)字、詞、短語、和/或短句等。本發(fā)明不限制提取模塊2所采用的去除無效字符算法的具體實(shí)現(xiàn)方式、以及待匹配樣本的具體表現(xiàn)形式。距離模塊3分別與提取模塊2、第一預(yù)判模塊4、存儲(chǔ)模塊5、以及第二預(yù)判模塊6均連接。距離模塊3主要用于根據(jù)預(yù)先設(shè)定的距離算法計(jì)算提取模塊2提取的待匹配樣本與預(yù)先存儲(chǔ)的至少一個(gè)關(guān)鍵字的語音距離和/或語義距離。具體的,距離模塊3使用到的預(yù)先存儲(chǔ)的關(guān)鍵字可以以關(guān)鍵字、模糊度門限值(語義模糊度門限值和/或語音模糊度門限值)、以及權(quán)重值的對(duì)應(yīng)關(guān)系信息的形式存儲(chǔ)在存儲(chǔ)模塊5中。該對(duì)應(yīng)關(guān)系信息可以以表、數(shù)據(jù)庫(kù)、或者文本等格式存儲(chǔ)在存儲(chǔ)模塊5中。針對(duì)一個(gè)待匹配樣本而言,距離模塊3根據(jù)距離算法對(duì)該待匹配樣本與預(yù)先存儲(chǔ)的至少一個(gè)關(guān)鍵字(如所有關(guān)鍵字或者部分關(guān)鍵字)進(jìn)行距離運(yùn)算,以計(jì)算出該待匹配樣本與至少一個(gè)關(guān)鍵字的距離。距離模塊3所采用的距離算法可以為語音距離算法,也可以為語義距離算法,還可以為語音距離算法和語義距離算法。由此,距離模塊3計(jì)算出的距離可以為語音距離,也可以為語義距離,還可以為語義距離和語音距離。距離模塊3所采用的語音距離算法即針對(duì)語音相似度的計(jì)算算法,距離模塊3所采用的語義距離算法即針對(duì)語義相似度的計(jì)算算法。具體如上述方法實(shí)施例中的描述。第一預(yù)判模塊4分別與距離模塊3、存儲(chǔ)模塊5、警示模塊7、以及屏蔽模塊8均連接。第一預(yù)判模塊4主要用于獲取距離模塊3計(jì)算出的距離超過模糊度門限值的關(guān)鍵字對(duì)應(yīng)的權(quán)重值,并根據(jù)該權(quán)重值計(jì)算網(wǎng)絡(luò)數(shù)據(jù)的安全值,如果第一預(yù)判模塊4判斷出該安全值不超過預(yù)定安全值,則該網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,該網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。 具體的,由于每個(gè)關(guān)鍵字的對(duì)應(yīng)關(guān)系中均設(shè)置有語義模糊度門限值字段和/或語音模糊度門限值字段,因此,針對(duì)一個(gè)關(guān)鍵字計(jì)算出的待匹配樣本與該關(guān)鍵字的語義距離可以和該關(guān)鍵字對(duì)應(yīng)關(guān)系中的語義模糊度門限值進(jìn)行比較,針對(duì)一個(gè)關(guān)鍵字計(jì)算出的待匹配樣本與該關(guān)鍵字的語音距離可以和該關(guān)鍵字對(duì)應(yīng)關(guān)系中的語音模糊度門限值進(jìn)行比較。不論是距離模塊3計(jì)算出的語音距離超過對(duì)應(yīng)關(guān)系中的語音模糊度門限值,還是距離模塊3計(jì)算出的語義距離超過對(duì)應(yīng)關(guān)系中的語義模糊度門限值,只要其中一個(gè)距離超過模糊度門限值,則第一預(yù)判模塊4獲取該關(guān)鍵字的對(duì)應(yīng)關(guān)系中的權(quán)重值。權(quán)重值可以表現(xiàn)出該關(guān)鍵字的重要程度,如權(quán)重值越大則該關(guān)鍵字越重要。本發(fā)明中的距離模塊3和第一預(yù)判模塊4可以按照距離模塊3進(jìn)行一個(gè)距離計(jì)算、第一預(yù)判模塊4進(jìn)行一次比較的順序依次執(zhí)行操作,在第一預(yù)判模塊4的比較結(jié)果為計(jì)算出的距離超過模糊度門限值時(shí),距離模塊3不再進(jìn)行下一次的距離計(jì)算過程,即針對(duì)關(guān)鍵字依次計(jì)算直到找到超過模糊度門限值的關(guān)鍵字為止。本發(fā)明中的距離模塊3和第一預(yù)判模塊4也可以按照距離模塊3進(jìn)行一個(gè)距離計(jì)算、第一預(yù)判模塊4進(jìn)行一次比較的順序依次執(zhí)行操作,在第一預(yù)判模塊4的比較結(jié)果為計(jì)算出的距離超過模糊度門限值時(shí),第一預(yù)判模塊4提取相應(yīng)的權(quán)重值,之后距離模塊3繼續(xù)進(jìn)行下一次的距離計(jì)算過程,即針對(duì)所有關(guān)鍵字依次計(jì)算直到找到所有的超過模糊度門限值的關(guān)鍵字為止。針對(duì)一個(gè)待匹配樣本而言,如果距離模塊3計(jì)算出的該待匹配樣本與多個(gè)關(guān)鍵字的距離均超過關(guān)鍵字對(duì)應(yīng)的模糊度門限值,則會(huì)出現(xiàn)多個(gè)關(guān)鍵字對(duì)應(yīng)的權(quán)重值均被第一預(yù)判模塊4獲取到的現(xiàn)象,第一預(yù)判模塊4可以選取多個(gè)權(quán)重值中最大的一個(gè),以進(jìn)行后續(xù)的安全值計(jì)算,第一預(yù)判模塊4也可以選取多個(gè)權(quán)重值中任一個(gè)權(quán)重值,以進(jìn)行后續(xù)的安全值計(jì)算,第一預(yù)判模塊4還可以對(duì)多個(gè)權(quán)重值進(jìn)行均值計(jì)算,以利用計(jì)算出的權(quán)重值的均值進(jìn)行后續(xù)的安全值計(jì)算。針對(duì)該網(wǎng)絡(luò)數(shù)據(jù)中的多個(gè)待匹配樣本,第一預(yù)判模塊4可能會(huì)獲取到一個(gè)或者多個(gè)權(quán)重值,權(quán)重值的數(shù)量可以小于等于待匹配樣本的數(shù)量;第一預(yù)判模塊4可以根據(jù)獲取到的一個(gè)或多個(gè)權(quán)重值采用預(yù)定的算法計(jì)算出該網(wǎng)絡(luò)數(shù)據(jù)的安全值。該安全值是基于權(quán)重值的一個(gè)綜合評(píng)價(jià)數(shù)值,第一預(yù)判模塊4所采用的計(jì)算安全值的預(yù)定的算法可以根據(jù)具體應(yīng)用來設(shè)置,本發(fā)明不限制第一預(yù)判模塊4所采用的算法的具體實(shí)現(xiàn)方式。存儲(chǔ)模塊5主要用于預(yù)先存儲(chǔ)關(guān)鍵字、模糊度門限值、和權(quán)重值的對(duì)應(yīng)關(guān)系信息。該模糊度門限值包括語義模糊度門限值、語音模糊度門限值中的至少一個(gè)。存儲(chǔ)模塊5存儲(chǔ)的對(duì)應(yīng)關(guān)系信息的一個(gè)具體的例子存儲(chǔ)模塊5預(yù)先存儲(chǔ)的表中包括有至少三個(gè)字段,其中一個(gè)字段為關(guān)鍵字字段,另一個(gè)字段為語義模糊度門限值字段,還有一個(gè)字段為權(quán)重值字段。存儲(chǔ)模塊5存儲(chǔ)的對(duì)應(yīng)關(guān)系信息的另一個(gè)具體的例子存儲(chǔ)模塊5預(yù)先存儲(chǔ)的表中包括有至少三個(gè)字段,其中一個(gè)字段為關(guān)鍵字字段,另一個(gè)字段為語音模糊度門限值字段,還有一個(gè)字段為權(quán)重值字段。存儲(chǔ)模塊5存儲(chǔ)的對(duì)應(yīng)關(guān)系信息的第三個(gè)具體的例子存儲(chǔ)模塊5預(yù)先存儲(chǔ)的表中包括有至少四個(gè)字段,其中一個(gè)字段為關(guān)鍵字字段,另一個(gè)字段為語義模糊度門限值字 段,還有一個(gè)字段為語音模糊度門限值字段,第四個(gè)字段為權(quán)重值字段。存儲(chǔ)模塊5中的一個(gè)關(guān)鍵字中存儲(chǔ)的內(nèi)容并不是專指單個(gè)字,一個(gè)關(guān)鍵字中存儲(chǔ)的內(nèi)容可以具體為一個(gè)字、詞、短語、或者短句等等。存儲(chǔ)模塊5中存儲(chǔ)的對(duì)應(yīng)關(guān)系信息中還可以包含有關(guān)鍵字出現(xiàn)頻率概率門限值
這一字段。第二預(yù)判模塊6分別與距離模塊3、以及存儲(chǔ)模塊5均連接。第二預(yù)判模塊6主要用于計(jì)算距離模塊3計(jì)算出的距離超過模糊度門限值的匹配樣本在網(wǎng)絡(luò)數(shù)據(jù)的全文中的出現(xiàn)頻率,如果該出現(xiàn)頻率不超過對(duì)應(yīng)關(guān)鍵字出現(xiàn)頻率概率門限值,則第二預(yù)判模塊6確定該網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,第二預(yù)判模塊6確定該網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。第一預(yù)判模塊4執(zhí)行的操作與第二預(yù)判模塊6執(zhí)行的操作之間沒有先后執(zhí)行順序。警示模塊7分別與第一預(yù)判模塊4和第二預(yù)判模塊6均連接。警示模塊7主要用于針對(duì)不安全網(wǎng)絡(luò)數(shù)據(jù)輸出警告信息。屏蔽模塊8分別與第一預(yù)判模塊4和第二預(yù)判模塊6均連接。屏蔽模塊8主要用于屏蔽不安全網(wǎng)絡(luò)數(shù)據(jù),該屏蔽操作如刪除該網(wǎng)絡(luò)數(shù)據(jù)或者將該網(wǎng)絡(luò)數(shù)據(jù)引向黑洞等,以保證不安全的網(wǎng)絡(luò)數(shù)據(jù)不能在網(wǎng)絡(luò)中順利傳輸。以上所述僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實(shí)施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容作出些許更動(dòng)或修飾為等同變化的等效實(shí)施例,但凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其特征在于,所述方法包括 獲取網(wǎng)絡(luò)數(shù)據(jù); 從所述網(wǎng)絡(luò)數(shù)據(jù)中提取待匹配樣本; 根據(jù)距離算法計(jì)算所述待匹配樣本與預(yù)先存儲(chǔ)的至少一個(gè)關(guān)鍵字的語音距離和/或語義距離; 獲取所述距離超過模糊度門限值的關(guān)鍵字對(duì)應(yīng)的權(quán)重值; 根據(jù)所述權(quán)重值計(jì)算所述網(wǎng)絡(luò)數(shù)據(jù)的安全值; 如果所述安全值不超過預(yù)定安全值,則所述網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,所述網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。
2.如權(quán)利要求I所述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其特征在于,所述從所述網(wǎng)絡(luò)數(shù)據(jù)中獲取待匹配樣本包括 基于去除無效字符算法從所述網(wǎng)絡(luò)數(shù)據(jù)中獲取待匹配樣本。
3.如權(quán)利要求I所述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其特征在于,所述方法包括預(yù)先存儲(chǔ)有關(guān)鍵字、模糊度門限值、和權(quán)重值的對(duì)應(yīng)關(guān)系信息; 所述模糊度門限值包括語義模糊度門限值和/或語音模糊度門限值。
4.如權(quán)利要求4所述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其特征在于,所述對(duì)應(yīng)關(guān)系信息中還包括 關(guān)鍵字出現(xiàn)頻率概率門限值。
5.如權(quán)利要求4所述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其特征在于,所述方法還包括 計(jì)算所述距離超過模糊度門限值的匹配樣本在所述網(wǎng)絡(luò)數(shù)據(jù)的全文中的出現(xiàn)頻率; 如果所述出現(xiàn)頻率不超過所述關(guān)鍵字出現(xiàn)頻率概率門限值,則所述網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,所述網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。
6.如權(quán)利要求I至5中任一權(quán)利要求所述的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法,其特征在于,所述方法還包括 針對(duì)不安全網(wǎng)絡(luò)數(shù)據(jù)輸出警告信息;和/或 屏蔽不安全網(wǎng)絡(luò)數(shù)據(jù)。
7.—種網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備,其特征在于,所述設(shè)備包括 獲取模塊,用于獲取網(wǎng)絡(luò)數(shù)據(jù); 提取模塊,用于從所述網(wǎng)絡(luò)數(shù)據(jù)中提取待匹配樣本; 距離模塊,用于根據(jù)距離算法計(jì)算所述待匹配樣本與預(yù)先存儲(chǔ)的至少一個(gè)關(guān)鍵字的語音距離和/或語義距離; 第一預(yù)判模塊,用于獲取所述距離超過模糊度門限值的關(guān)鍵字對(duì)應(yīng)的權(quán)重值,并根據(jù)所述權(quán)重值計(jì)算所述網(wǎng)絡(luò)數(shù)據(jù)的安全值,如果所述安全值不超過預(yù)定安全值,則所述網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,所述網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。
8.如權(quán)利要求7所述的網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備,其特征在于,所述設(shè)備包括存儲(chǔ)模塊,用于預(yù)先存儲(chǔ)關(guān)鍵字、模糊度門限值、和權(quán)重值的對(duì)應(yīng)關(guān)系信息; 所述模糊度門限值包括語義模糊度門限值和/或語音模糊度門限值。
9.如權(quán)利要求8所述的網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備,其特征在于,所述存儲(chǔ)模塊中存儲(chǔ)的對(duì)應(yīng)關(guān)系信息中還包括關(guān)鍵字出現(xiàn)頻率概率門限值;且所述設(shè)備還包括 第二預(yù)判模塊,用于計(jì)算所述距離超過模糊度門限值的匹配樣本在所述網(wǎng)絡(luò)數(shù)據(jù)的全文中的出現(xiàn)頻率,如果所述出現(xiàn)頻率不超過所述關(guān)鍵字出現(xiàn)頻率概率門限值,則所述網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,所述網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。
10.如權(quán)利要求7或者8或者9所述的網(wǎng)絡(luò)數(shù)據(jù)安全管理設(shè)備,其特征在于,所述設(shè)備還包括 警示模塊,用于針對(duì)不安全網(wǎng)絡(luò)數(shù)據(jù)輸出警告信息;和/或 屏蔽模塊,用于屏蔽不安全網(wǎng)絡(luò)數(shù)據(jù)。
全文摘要
本發(fā)明是有關(guān)于一種網(wǎng)絡(luò)數(shù)據(jù)安全管理方法和設(shè)備。其中的網(wǎng)絡(luò)數(shù)據(jù)安全管理方法包括獲取網(wǎng)絡(luò)數(shù)據(jù);從該網(wǎng)絡(luò)數(shù)據(jù)中提取待匹配樣本;根據(jù)距離算法計(jì)算所述待匹配樣本與預(yù)先存儲(chǔ)的至少一個(gè)關(guān)鍵字的語音距離和/或語義距離;獲取距離超過模糊度門限值的關(guān)鍵字對(duì)應(yīng)的權(quán)重值;根據(jù)所述權(quán)重值計(jì)算所述網(wǎng)絡(luò)數(shù)據(jù)的安全值;如果所述安全值不超過預(yù)定安全值,則所述網(wǎng)絡(luò)數(shù)據(jù)為安全網(wǎng)絡(luò)數(shù)據(jù),否則,所述網(wǎng)絡(luò)數(shù)據(jù)為不安全網(wǎng)絡(luò)數(shù)據(jù)。本發(fā)明提供的技術(shù)方案能夠?qū)γ舾袛?shù)據(jù)進(jìn)行準(zhǔn)確的過濾和預(yù)警,避免假匹配現(xiàn)象,從而增強(qiáng)了網(wǎng)絡(luò)數(shù)據(jù)的安全性,非常適于實(shí)用。
文檔編號(hào)H04L29/06GK102801546SQ20111013811
公開日2012年11月28日 申請(qǐng)日期2011年5月26日 優(yōu)先權(quán)日2011年5月26日
發(fā)明者張翼英, 李寶林 申請(qǐng)人:北京天億電聯(lián)科技有限公司