文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法及裝置的制造方法
【專(zhuān)利摘要】本發(fā)明實(shí)施例公開(kāi)了一種文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法及裝置,其中,該方法包括:遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取關(guān)于文件內(nèi)容的數(shù)據(jù);判斷所述文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù),所述N為整數(shù);如果存在,確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù);根據(jù)所述預(yù)設(shè)敏感規(guī)則,從所述索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù);采用本發(fā)明的方法及裝置,可提高識(shí)別文件類(lèi)型敏感數(shù)據(jù)的效率和準(zhǔn)確率。
【專(zhuān)利說(shuō)明】
文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及信息安全技術(shù)領(lǐng)域,特別是涉及一種文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法及裝置。
【背景技術(shù)】
[0002]隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)安全問(wèn)題日益突出,如何確保涉及個(gè)人隱私或商業(yè)秘密等敏感數(shù)據(jù)的安全已成為全社會(huì)重點(diǎn)關(guān)注的問(wèn)題。由于敏感數(shù)據(jù)通常煙沒(méi)于大量數(shù)據(jù)中,因此,若要確保敏感數(shù)據(jù)的安全,首先要從大量信息數(shù)據(jù)中識(shí)別出敏感數(shù)據(jù),然后再對(duì)敏感數(shù)據(jù)進(jìn)行安全處理。
[0003]目前,數(shù)據(jù)的存儲(chǔ)形式主要有兩種,一種為文件類(lèi)型的存儲(chǔ)形式,另一種為數(shù)據(jù)庫(kù)類(lèi)型的存儲(chǔ)形式。對(duì)于文件類(lèi)型存儲(chǔ)形式的數(shù)據(jù),一般采用如下方法識(shí)別其中的敏感數(shù)據(jù):首先對(duì)數(shù)據(jù)的工作場(chǎng)景和當(dāng)前的政策法規(guī)進(jìn)行分析,確定數(shù)據(jù)中可能存在的敏感數(shù)據(jù)類(lèi)型;然后,根據(jù)敏感數(shù)據(jù)類(lèi)型,確定可能存在敏感數(shù)據(jù)的文件;最后,人工對(duì)可能存在敏感數(shù)據(jù)的文件,進(jìn)行查詢(xún),確定敏感數(shù)據(jù)。
[0004]由上可見(jiàn),采用上述人工方法,識(shí)別敏感數(shù)據(jù),當(dāng)處理的文件類(lèi)型數(shù)據(jù)的數(shù)據(jù)量較大時(shí),識(shí)別敏感數(shù)據(jù)的效率較低、準(zhǔn)確率較差。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實(shí)施例中提供了一種文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法及裝置,以提高識(shí)別文件類(lèi)型敏感數(shù)據(jù)的效率和準(zhǔn)確率。
[0006]為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例公開(kāi)了如下技術(shù)方案:
[0007]—方面,提供一種文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法,包括:
[0008]遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取關(guān)于文件內(nèi)容的數(shù)據(jù);
[0009]判斷所述文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù),所述N為整數(shù);
[0010]如果存在,確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù);
[0011 ] 根據(jù)所述預(yù)設(shè)敏感規(guī)則,從所述索弓I數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù)。
[0012]優(yōu)選的,所述N個(gè)預(yù)設(shè)敏感規(guī)則分別為第一預(yù)設(shè)敏感規(guī)則、第二預(yù)設(shè)敏感規(guī)則直至第N預(yù)設(shè)敏感規(guī)則;判斷所述文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù),包括:
[0013]判斷關(guān)于文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);
[0014]如果存在,將與滿(mǎn)足第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第一索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù);
[0015]如果不存在,將當(dāng)前所有數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù);
[0016]判斷所述第一非索引數(shù)據(jù)中,是否存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);
[0017]如果存在,將與滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第二索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第二非索引數(shù)據(jù);
[0018]如果不存在,將所述第一非索引數(shù)據(jù),標(biāo)記為第二非索引數(shù)據(jù);
[0019]直至判斷至第N預(yù)設(shè)敏感規(guī)則。
[0020]優(yōu)選的,所述索引數(shù)據(jù)包括第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù),所述P為小于等于N的整數(shù);根據(jù)所述預(yù)設(shè)敏感規(guī)則,從所述索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù),包括:
[0021]依次判斷所述第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù)中,是否存在滿(mǎn)足M個(gè)預(yù)設(shè)組合敏感規(guī)則之一的數(shù)據(jù),所述M為整數(shù);所述預(yù)設(shè)組合敏感規(guī)則,為由N個(gè)預(yù)設(shè)敏感規(guī)則中的至少兩個(gè)預(yù)設(shè)敏感規(guī)則生成;
[0022]如果存在,將所述滿(mǎn)足一預(yù)設(shè)組合敏感規(guī)則的數(shù)據(jù),判定為敏感數(shù)據(jù)。
[0023]優(yōu)選的,所述方法還包括:
[0024]根據(jù)組合敏感規(guī)則所預(yù)設(shè)的敏感級(jí)別和敏感類(lèi)型,確定所述敏感數(shù)據(jù)的敏感級(jí)別和敏感類(lèi)型。
[0025]優(yōu)選的,所述方法還包括:
[0026]遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取所有文件的文件名稱(chēng);
[0027]判斷所述文件名稱(chēng)中,是否存在滿(mǎn)足預(yù)設(shè)名稱(chēng)敏感規(guī)則的文件名稱(chēng);
[0028]如果存在,將所述文件名稱(chēng)所對(duì)應(yīng)的文件作為敏感文件,且執(zhí)行從所述敏感文件的數(shù)據(jù)中,提取關(guān)于文件內(nèi)容的數(shù)據(jù)。
[0029]另一方面,提供一種文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別裝置,其特征在于,包括:
[0030]文件內(nèi)容提取模塊,用于遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取關(guān)于文件內(nèi)容的數(shù)據(jù);
[0031]第一敏感判斷模塊,用于判斷所述文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù),所述N為整數(shù);
[0032]確定模塊,用于當(dāng)存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù)時(shí),確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù);
[0033]識(shí)別模塊,用于根據(jù)所述預(yù)設(shè)敏感規(guī)則,從所述索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù)。
[0034]優(yōu)選的,所述N個(gè)預(yù)設(shè)敏感規(guī)則分別為第一預(yù)設(shè)敏感規(guī)則、第二預(yù)設(shè)敏感規(guī)則直至第N預(yù)設(shè)敏感規(guī)則;所述第一敏感判斷模塊,包括:
[0035]第一判斷單元,用于判斷關(guān)于文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);
[0036]第一標(biāo)記單元,用于當(dāng)存在滿(mǎn)足所述第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)標(biāo)記為第一索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù);或當(dāng)不存在滿(mǎn)足所述第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將當(dāng)前所有數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù);
[0037]第二判斷單元,用于判斷所述第一非索引數(shù)據(jù)中,是否存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);
[0038]第二標(biāo)記單元,用于當(dāng)存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第二索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第二非索引數(shù)據(jù);或當(dāng)不存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將所述第一非索引數(shù)據(jù),標(biāo)記為第二非索引數(shù)據(jù);
[0039]直至第N判斷單元,用于判斷第N-1非索引數(shù)據(jù)中,是否存在滿(mǎn)足第N預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);
[0040]第N標(biāo)記單元,用于當(dāng)存在滿(mǎn)足第N預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第N索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第N非索引數(shù)據(jù);或當(dāng)不存在滿(mǎn)足第N預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將所述第N-1非索引數(shù)據(jù),標(biāo)記為第N非索引數(shù)據(jù)。
[0041]優(yōu)選的,所述索引數(shù)據(jù)包括第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù)中,所述P為小于等于N的整數(shù);所述識(shí)別模塊,包括:
[0042]組合敏感規(guī)則判斷單元,用于依次判斷所述第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù)中,是否存在滿(mǎn)足M個(gè)預(yù)設(shè)組合敏感規(guī)則之一的數(shù)據(jù),所述M為整數(shù);所述預(yù)設(shè)組合敏感規(guī)則,為由N個(gè)預(yù)設(shè)敏感規(guī)則中的至少兩個(gè)預(yù)設(shè)敏感規(guī)則成;
[0043]判定單元,用于當(dāng)存在滿(mǎn)足M個(gè)預(yù)設(shè)組合敏感規(guī)則之一的數(shù)據(jù)時(shí),將所述滿(mǎn)足一預(yù)設(shè)組合敏感規(guī)則的數(shù)據(jù),判定為敏感數(shù)據(jù)。
[0044]優(yōu)選的,所述裝置還包括:
[0045]敏感級(jí)別確定模塊,用于根據(jù)組合敏感規(guī)則所預(yù)設(shè)的敏感級(jí)別,確定所述敏感數(shù)據(jù)的敏感級(jí)別;
[0046]敏感類(lèi)型確定模塊,用于根據(jù)組合敏感規(guī)則所預(yù)設(shè)的敏感類(lèi)型,確定所述敏感數(shù)據(jù)的敏感類(lèi)型。
[0047]優(yōu)選的,所述裝置還包括:
[0048]文件名稱(chēng)提取模塊,用于遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取所有文件的文件名稱(chēng);
[0049]第二敏感判斷模塊,用于判斷所述文件名稱(chēng)中,是否存在滿(mǎn)足預(yù)設(shè)名稱(chēng)敏感規(guī)則的文件名稱(chēng);
[0050]敏感文件獲取模塊,用于當(dāng)存在滿(mǎn)足預(yù)設(shè)名稱(chēng)敏感規(guī)則的文件名稱(chēng)時(shí),將所述文件
[0051]名稱(chēng)所對(duì)應(yīng)的文件作為敏感文件。
[0052]本發(fā)明的有益效果包括:首先從文件類(lèi)型數(shù)據(jù)中,自動(dòng)提取關(guān)于文件內(nèi)容的數(shù)據(jù);然后自動(dòng)判斷文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù);如果存在,確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù);最后,根據(jù)所述預(yù)設(shè)敏感規(guī)則,自動(dòng)從索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù)。采用本發(fā)明的方法及裝置,可自動(dòng)從文件類(lèi)型數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù),提高了識(shí)別文件類(lèi)型敏感數(shù)據(jù)的效率和準(zhǔn)確率。
【附圖說(shuō)明】
[0053]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,對(duì)于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0054]圖1為本發(fā)明實(shí)施例提供的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法的一流程示意圖;
[0055]圖2為本發(fā)明實(shí)施例提供的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法的另一流程示意圖;
[0056]圖3為本發(fā)明實(shí)施例提供的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法的又一流程示意圖;
[0057]圖4為本發(fā)明實(shí)施例提供的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法的另一流程示意圖;
[0058]圖5為本發(fā)明實(shí)施例提供的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法的又一流程示意圖;
[0059]圖6為本發(fā)明實(shí)施例提供的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別裝置的一結(jié)構(gòu)示意圖;
[0060]圖7為本發(fā)明實(shí)施例提供的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別裝置的另一結(jié)構(gòu)示意圖;
[0061]圖8為本發(fā)明實(shí)施例提供的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別裝置的又一結(jié)構(gòu)示意圖;
[0062]圖9為本發(fā)明實(shí)施例提供的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別裝置的另一結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0063]本發(fā)明實(shí)施例提供一種文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法及裝置,以提高識(shí)別文件類(lèi)型敏感數(shù)據(jù)的準(zhǔn)確率和效率。
[0064]首先對(duì)本發(fā)明實(shí)施例的文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法進(jìn)行說(shuō)明,如圖1所示,至少包括以下步驟:
[0065]步驟Sll:遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取關(guān)于文件內(nèi)容的數(shù)據(jù);
[0066]在本申請(qǐng)實(shí)施例中,文件類(lèi)型數(shù)據(jù)是指以文件類(lèi)型的存儲(chǔ)形式進(jìn)行存儲(chǔ)的數(shù)據(jù),比如:以文件類(lèi)型存儲(chǔ)的Word文檔和Excel表格等。
[0067]在本申請(qǐng)實(shí)施例中,由于文件類(lèi)型的數(shù)據(jù)中,可包括文件名稱(chēng)數(shù)據(jù)、文件內(nèi)容數(shù)據(jù)和文件存儲(chǔ)數(shù)據(jù);在本申請(qǐng)實(shí)施例中,可采用以下方法,提取關(guān)于文件內(nèi)容的數(shù)據(jù):基于爬蟲(chóng)原理,提取文件類(lèi)型數(shù)據(jù);然后遍歷文件類(lèi)型數(shù)據(jù)的所有存儲(chǔ)路徑,得到文件列表;所述文件列表中,包括:文件名稱(chēng)、文件類(lèi)型、文件屬主和文件存儲(chǔ)路徑等信息;然后在相應(yīng)文件存儲(chǔ)路徑中,提取文件內(nèi)容數(shù)據(jù)。
[0068]步驟S12:判斷所述文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù),N為整數(shù);
[0069]在本申請(qǐng)實(shí)施例中,預(yù)設(shè)敏感規(guī)則可由本領(lǐng)域技術(shù)人員,根據(jù)數(shù)據(jù)的工作場(chǎng)景和當(dāng)前的政策法規(guī)自行設(shè)定。比如:當(dāng)前數(shù)據(jù)為某單位員工的個(gè)人信息數(shù)據(jù),則預(yù)設(shè)敏感規(guī)則可包括“姓名”規(guī)則、“身份證號(hào)”規(guī)則、“手機(jī)號(hào)碼”規(guī)則和“家庭地址”規(guī)則等。
[0070]在本申請(qǐng)實(shí)施例中,“姓名”規(guī)則可具體為“姓氏+字符”的組合,“身份證號(hào)”規(guī)則可具體為“18位連續(xù)的阿拉伯?dāng)?shù)字”,“手機(jī)號(hào)碼”可具體為“連續(xù)的11位阿拉伯?dāng)?shù)字”,“家庭地址”規(guī)則可具體為“字符+區(qū)+字符+街+字符+小區(qū)”的組合。
[0071]步驟S13:如果存在,確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù);
[0072]由于在本申請(qǐng)實(shí)施例中,僅僅根據(jù)預(yù)設(shè)規(guī)則,并不能確定文件內(nèi)容的數(shù)據(jù)是否為敏感數(shù)據(jù)。例如:根據(jù)“手機(jī)號(hào)碼”規(guī)則“11位連續(xù)的阿拉伯號(hào)碼”,所確定的連續(xù)的11位阿拉伯號(hào)碼,并不能確定該11位連續(xù)的阿拉伯號(hào)碼是否為員工的手機(jī)號(hào)碼,可能僅為一系統(tǒng)無(wú)意義的數(shù)字,因此,需根據(jù)與該數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),進(jìn)一步進(jìn)行判斷。
[0073]在本申請(qǐng)實(shí)施例中,與滿(mǎn)足一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)相關(guān)的數(shù)據(jù),可具體為在位置上與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),如:與所述數(shù)據(jù)在同一段落的數(shù)據(jù)或與所述數(shù)據(jù)在同一頁(yè)面的數(shù)據(jù)。
[0074]步驟S14:根據(jù)所述預(yù)設(shè)敏感規(guī)則,從索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù)。
[0075]由上可見(jiàn),在本發(fā)明實(shí)施例中,首先從文件類(lèi)型數(shù)據(jù)中,自動(dòng)提取關(guān)于文件內(nèi)容的數(shù)據(jù);然后自動(dòng)判斷文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù);如果存在,確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù);最后,根據(jù)所述預(yù)設(shè)敏感規(guī)則,自動(dòng)從索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù)。采用上述方法,可自動(dòng)從文件類(lèi)型數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù),提高了識(shí)別文件類(lèi)型敏感數(shù)據(jù)的效率和準(zhǔn)確率。
[0076]在本發(fā)明的另一可行實(shí)施例中,N個(gè)預(yù)設(shè)敏感規(guī)則可分別為第一預(yù)設(shè)敏感規(guī)則、第二預(yù)設(shè)敏感規(guī)則直至第N預(yù)設(shè)敏感規(guī)則;如圖2所示,上述所有實(shí)施例中的步驟S12可具體包括:
[0077]步驟S21:判斷文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);如果存在,進(jìn)入步驟S22 ;如果不存在,進(jìn)入步驟S23 ;
[0078]步驟S22:將與滿(mǎn)足第一預(yù)設(shè)規(guī)則的數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第一索引數(shù)據(jù),當(dāng)前數(shù)據(jù)中的剩余數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù);
[0079]在本發(fā)明實(shí)施例中,第一索引數(shù)據(jù)可具體為:與滿(mǎn)足第一預(yù)設(shè)規(guī)則的數(shù)據(jù)在同一段落的數(shù)據(jù);而第一非索引數(shù)據(jù)可具體為:在當(dāng)前數(shù)據(jù)中,與滿(mǎn)足第一預(yù)設(shè)規(guī)則的數(shù)據(jù)不在同一段落的數(shù)據(jù)。
[0080]步驟S23:將當(dāng)前所有數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù);
[0081]步驟S24:判斷第一非索引數(shù)據(jù)中,是否存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);如果存在,進(jìn)入步驟S25 ;如果不存在,進(jìn)入步驟S26 ;
[0082]步驟S25:將與滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第二索引數(shù)據(jù),第一非索引數(shù)據(jù)中的剩余數(shù)據(jù)標(biāo)記為第二非索引數(shù)據(jù);
[0083]在本發(fā)明實(shí)施例中,第二索引數(shù)據(jù)可具體為:與滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)在同一段落的數(shù)據(jù);而第二非索引數(shù)據(jù)可具體為:與滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)不在同一段落的數(shù)據(jù)。
[0084]步驟S26:將第一非索引數(shù)據(jù),標(biāo)記為第二非索引數(shù)據(jù);
[0085]步驟S27:依次類(lèi)推,直至判斷至第N預(yù)設(shè)敏感規(guī)則。
[0086]在本發(fā)明實(shí)施例中,首先在文件類(lèi)型的數(shù)據(jù)中,查詢(xún)出滿(mǎn)足預(yù)設(shè)敏感規(guī)則的數(shù)據(jù),然后確定與該數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù);然后,在該數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)中,再查找敏感數(shù)據(jù),這樣可縮小敏感數(shù)據(jù)的查找范圍,提高識(shí)別速度。
[0087]在本發(fā)明的又一可行實(shí)施例中,索引數(shù)據(jù)可具體包括第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù),所述P為小于等于N的整數(shù);如圖3所示,上述所有實(shí)施例中的步驟S14,可具體包括:
[0088]步驟S31:依次判斷第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù)中,是否存在滿(mǎn)足M個(gè)預(yù)設(shè)組合敏感規(guī)則之一的數(shù)據(jù),所述M為整數(shù);如果滿(mǎn)足,進(jìn)入步驟S32 ;
[0089]在本發(fā)明實(shí)施例中,索引數(shù)據(jù)為可能存在敏感數(shù)據(jù)的數(shù)據(jù)。由于,僅僅依靠一個(gè)預(yù)設(shè)敏感規(guī)則很可能出現(xiàn)敏感數(shù)據(jù)誤判的情況,因此,還需進(jìn)一步根據(jù)預(yù)設(shè)組合敏感規(guī)則判定敏感數(shù)據(jù)。
[0090]在本發(fā)明實(shí)施例中,預(yù)設(shè)組合敏感規(guī)則可由本領(lǐng)域技術(shù)人員,根據(jù)當(dāng)前數(shù)據(jù)的工作情況以及當(dāng)前的政策法規(guī),對(duì)預(yù)設(shè)敏感規(guī)則進(jìn)行組合獲得。比如,當(dāng)一組合敏感規(guī)則為涉及個(gè)人信息的敏感規(guī)則時(shí),其可由“姓名”敏感規(guī)則+ “身份證號(hào)碼”敏感規(guī)則+ “手機(jī)號(hào)碼”敏感規(guī)則+ “家庭地址”敏感規(guī)則組成。
[0091]步驟S32:將滿(mǎn)足一預(yù)設(shè)組合敏感規(guī)則的數(shù)據(jù),判定為敏感數(shù)據(jù);
[0092]由上可見(jiàn),采用上述方法,可精準(zhǔn)的從文件類(lèi)型數(shù)據(jù)中,識(shí)別出敏感數(shù)據(jù)。
[0093]在本發(fā)明的又一可行實(shí)施例中,如圖4所示,上述所有實(shí)施例中的方法,還包括:
[0094]S15:根據(jù)組合敏感規(guī)則所預(yù)設(shè)的敏感級(jí)別和敏感類(lèi)型,確定敏感數(shù)據(jù)的敏感級(jí)別和敏感類(lèi)型。
[0095]在本發(fā)明實(shí)施例中,可具體設(shè)置一敏感類(lèi)型和敏感級(jí)別字典,在該字典中,記錄了每一預(yù)設(shè)組合敏感規(guī)則所對(duì)應(yīng)的敏感類(lèi)型和敏感級(jí)別;因此根據(jù)該敏感類(lèi)型和敏感級(jí)別字典,可查詢(xún)出所有預(yù)設(shè)組合敏感規(guī)則所對(duì)應(yīng)的敏感級(jí)別以及敏感類(lèi)型;而敏感數(shù)據(jù)所滿(mǎn)足的預(yù)設(shè)組合敏感規(guī)則的敏感級(jí)別以及敏感類(lèi)型,即為該敏感數(shù)據(jù)的敏感級(jí)別和敏感類(lèi)型。
[0096]由上可見(jiàn),在本發(fā)明實(shí)施例中,不但可識(shí)別出敏感數(shù)據(jù),還可進(jìn)一步判定敏感數(shù)據(jù)的敏感級(jí)別和敏感類(lèi)型,從而方便后續(xù)根據(jù)敏感數(shù)據(jù)的敏感級(jí)別和敏感類(lèi)型對(duì)敏感數(shù)據(jù)進(jìn)行安全處理。
[0097]在本發(fā)明的另一可行實(shí)施例中,如圖5所示,上述所有實(shí)施例中的方法,還可包括:
[0098]步驟S51:遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取所有文件的文件名稱(chēng);
[0099]步驟S52:判斷所述文件名稱(chēng)中,是否存在滿(mǎn)足預(yù)設(shè)名稱(chēng)敏感規(guī)則的文件名稱(chēng);如果存在,進(jìn)入步驟S53 ;
[0100]在本發(fā)明實(shí)施例中,文件名稱(chēng)敏感規(guī)則為本領(lǐng)域技術(shù)人員,根據(jù)文件類(lèi)型數(shù)據(jù)的工作環(huán)境和當(dāng)前政策法規(guī)所預(yù)先設(shè)定的,比如,文件名稱(chēng)敏感規(guī)則可具體為涉及“財(cái)物”的名稱(chēng)敏感規(guī)則、涉及“個(gè)人信息”的名稱(chēng)敏感規(guī)則以及涉及“商業(yè)秘密”的名稱(chēng)敏感規(guī)則等。
[0101]步驟S53:將所述文件名稱(chēng)所對(duì)應(yīng)的文件作為敏感文件,且執(zhí)行步驟Sll從所述敏感文件的數(shù)據(jù)中,提取關(guān)于文件內(nèi)容的數(shù)據(jù)。
[0102]由上可見(jiàn),采用上述方法,可首先確定包括敏感數(shù)據(jù)的文件,即敏感文件;然后,再在敏感文件中進(jìn)一步識(shí)別敏感數(shù)據(jù),如此,可縮小查找敏感數(shù)據(jù)的范圍,提高識(shí)別敏感數(shù)據(jù)的效率。
[0103]通過(guò)以上的方法實(shí)施例的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本申請(qǐng)可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0104]與上述方法相對(duì)應(yīng)的,本申請(qǐng)還公開(kāi)了一種文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別裝置,如圖6所示,至少包括:
[0105]文件內(nèi)容提取模塊61,用于遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取關(guān)于文件內(nèi)容的數(shù)據(jù);
[0106]第一敏感判斷模塊62,用于判斷所述文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù),所述N為整數(shù);
[0107]確定模塊63,用于當(dāng)存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù)時(shí),確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù);
[0108]識(shí)別模塊64,用于根據(jù)所述預(yù)設(shè)敏感規(guī)則,從所述索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù)。
[0109]由上可見(jiàn),在本發(fā)明實(shí)施例中,首先文件內(nèi)容提取模塊61,可在文件類(lèi)型數(shù)據(jù)中,自動(dòng)提取關(guān)于文件內(nèi)容的數(shù)據(jù);然后第一敏感判斷模塊62,可自動(dòng)判斷文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù);再然后確定模塊63,可當(dāng)存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù)時(shí),自動(dòng)確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù);最后識(shí)別模塊64,用于根據(jù)所述預(yù)設(shè)敏感規(guī)則,自動(dòng)從索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù)。采用上述裝置,可自動(dòng)從文件類(lèi)型數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù),提高了識(shí)別敏感數(shù)據(jù)的效率和準(zhǔn)確率。
[0110]在本發(fā)明的另一可行實(shí)施例中,上述所有實(shí)施例中的N個(gè)預(yù)設(shè)敏感規(guī)則可分別為第一預(yù)設(shè)敏感規(guī)則、第二預(yù)設(shè)敏感規(guī)則直至第N預(yù)設(shè)敏感規(guī)則;第一敏感判斷模塊62,可包括:
[0111]第一判斷單元,用于判斷關(guān)于文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);
[0112]第一標(biāo)記單元,用于當(dāng)存在滿(mǎn)足所述第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)標(biāo)記為第一索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù);或當(dāng)不存在滿(mǎn)足所述第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將當(dāng)前所有數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù);
[0113]第二判斷單元,用于判斷所述第一非索引數(shù)據(jù)中,是否存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);
[0114]第二標(biāo)記單元,用于當(dāng)存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第二索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第二非索引數(shù)據(jù);或當(dāng)不存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將所述第一非索引數(shù)據(jù),標(biāo)記為第二非索引數(shù)據(jù);
[0115]直至第N判斷單元,用于判斷第N-1非索引數(shù)據(jù)中,是否存在滿(mǎn)足第N預(yù)設(shè)敏感規(guī)則的數(shù)據(jù);
[0116]第N標(biāo)記單元,用于當(dāng)存在滿(mǎn)足第N預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第N索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第N非索引數(shù)據(jù);或當(dāng)不存在滿(mǎn)足第N預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將所述第N-1非索引數(shù)據(jù),標(biāo)記為第N非索引數(shù)據(jù)。
[0117]在本發(fā)明實(shí)施例中,首先在文件類(lèi)型的數(shù)據(jù)中,查詢(xún)出滿(mǎn)足預(yù)設(shè)敏感規(guī)則的數(shù)據(jù),然后確定與該數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù);再然后,在該數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)中,查找敏感數(shù)據(jù),這樣可縮小敏感數(shù)據(jù)的查找范圍,提高識(shí)別速度。
[0118]在本發(fā)明的又一可行實(shí)施例中,上述所有實(shí)施例中的索引數(shù)據(jù)包括第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù)中,所述P為小于等于N的整數(shù);如圖7所示,識(shí)別模塊64,可包括:
[0119]組合敏感規(guī)則判斷單元71,用于依次判斷所述第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù)中,是否存在滿(mǎn)足M個(gè)預(yù)設(shè)組合敏感規(guī)則之一的數(shù)據(jù),所述M為整數(shù);所述預(yù)設(shè)組合敏感規(guī)則,為由N個(gè)預(yù)設(shè)敏感規(guī)則中的至少兩個(gè)預(yù)設(shè)敏感規(guī)則組成;
[0120]判定單元72,用于當(dāng)存在滿(mǎn)足M個(gè)預(yù)設(shè)組合敏感規(guī)則之一的數(shù)據(jù)時(shí),將所述滿(mǎn)足一預(yù)設(shè)組合敏感規(guī)則的數(shù)據(jù),判定為敏感數(shù)據(jù)。
[0121]采用上述裝置,可精準(zhǔn)的從文件類(lèi)型數(shù)據(jù)中,識(shí)別出敏感數(shù)據(jù)。
[0122]在本發(fā)明的另一可行實(shí)施例中,如圖8所示,上述所有實(shí)施例的裝置,還可包括:
[0123]敏感級(jí)別確定模塊81,用于根據(jù)組合敏感規(guī)則所預(yù)設(shè)的敏感級(jí)別,確定敏感數(shù)據(jù)的敏感級(jí)別;
[0124]敏感類(lèi)型確定模塊82,用于根據(jù)組合敏感規(guī)則所預(yù)設(shè)的敏感類(lèi)型,確定敏感數(shù)據(jù)的敏感類(lèi)型。
[0125]由上可見(jiàn),在本發(fā)明實(shí)施例中,采用上述裝置,不但可識(shí)別出敏感數(shù)據(jù),還可進(jìn)一步判定敏感數(shù)據(jù)的敏感級(jí)別和敏感類(lèi)型,從而方便后續(xù)根據(jù)敏感數(shù)據(jù)的敏感級(jí)別和敏感類(lèi)型對(duì)敏感數(shù)據(jù)進(jìn)行安全處理。
[0126]在本發(fā)明的又一可行實(shí)施例中,如圖9所示,上述所有實(shí)施例中的裝置還可包括:
[0127]文件名稱(chēng)提取模塊91,用于遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取所有文件的文件名稱(chēng);
[0128]第二敏感判斷模塊92,用于判斷所述文件名稱(chēng)中,是否存在滿(mǎn)足預(yù)設(shè)名稱(chēng)敏感規(guī)則的文件名稱(chēng);
[0129]敏感文件獲取模塊93,用于當(dāng)存在滿(mǎn)足預(yù)設(shè)名稱(chēng)敏感規(guī)則的文件名稱(chēng)時(shí),將所述文件名稱(chēng)作為敏感文件。
[0130]由上可見(jiàn),采用上述裝置,可首先確定包括敏感數(shù)據(jù)的文件,即敏感文件;然后再在敏感文件中進(jìn)一步識(shí)別敏感數(shù)據(jù),如此,可縮小查找敏感數(shù)據(jù)的范圍,提高識(shí)別敏感數(shù)據(jù)的效率。
[0131 ] 需要說(shuō)明的是,在本文中,諸如“第一”和“第二”等之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0132] 以上所述僅是本申請(qǐng)的【具體實(shí)施方式】,使本領(lǐng)域技術(shù)人員能夠理解或?qū)崿F(xiàn)本申請(qǐng)。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的,本文中所定義的一般原理可以在不脫離本申請(qǐng)的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本申請(qǐng)將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一致的最寬的范圍。
【主權(quán)項(xiàng)】
1.一種文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別方法,其特征在于,包括: 遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取關(guān)于文件內(nèi)容的數(shù)據(jù); 判斷所述文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù),所述N為整數(shù); 如果存在,確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù); 根據(jù)所述預(yù)設(shè)敏感規(guī)則,從所述索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述N個(gè)預(yù)設(shè)敏感規(guī)則分別為第一預(yù)設(shè)敏感規(guī)則、第二預(yù)設(shè)敏感規(guī)則直至第N預(yù)設(shè)敏感規(guī)則;判斷所述文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù),包括: 判斷關(guān)于文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù); 如果存在,將與滿(mǎn)足第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第一索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù); 如果不存在,將當(dāng)前所有數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù); 判斷所述第一非索引數(shù)據(jù)中,是否存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù); 如果存在,將與滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第二索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第二非索引數(shù)據(jù); 如果不存在,將所述第一非索引數(shù)據(jù),標(biāo)記為第二非索引數(shù)據(jù); 直至判斷至第N預(yù)設(shè)敏感規(guī)則。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述索引數(shù)據(jù)包括第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù),所述P為小于等于N的整數(shù);根據(jù)所述預(yù)設(shè)敏感規(guī)則,從所述索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù),包括: 依次判斷所述第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù)中,是否存在滿(mǎn)足M個(gè)預(yù)設(shè)組合敏感規(guī)則之一的數(shù)據(jù),所述M為整數(shù);所述預(yù)設(shè)組合敏感規(guī)則,為由N個(gè)預(yù)設(shè)敏感規(guī)則中的至少兩個(gè)預(yù)設(shè)敏感規(guī)則生成; 如果存在,將所述滿(mǎn)足一預(yù)設(shè)組合敏感規(guī)則的數(shù)據(jù),判定為敏感數(shù)據(jù)。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 根據(jù)組合敏感規(guī)則所預(yù)設(shè)的敏感級(jí)別和敏感類(lèi)型,確定所述敏感數(shù)據(jù)的敏感級(jí)別和敏感類(lèi)型。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取所有文件的文件名稱(chēng); 判斷所述文件名稱(chēng)中,是否存在滿(mǎn)足預(yù)設(shè)名稱(chēng)敏感規(guī)則的文件名稱(chēng); 如果存在,將所述文件名稱(chēng)所對(duì)應(yīng)的文件作為敏感文件,且執(zhí)行從所述敏感文件的數(shù)據(jù)中,提取關(guān)于文件內(nèi)容的數(shù)據(jù)。6.一種文件類(lèi)型敏感數(shù)據(jù)的自動(dòng)識(shí)別裝置,其特征在于,包括: 文件內(nèi)容提取模塊,用于遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取關(guān)于文件內(nèi)容的數(shù)據(jù); 第一敏感判斷模塊,用于判斷所述文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù),所述N為整數(shù); 確定模塊,用于當(dāng)存在滿(mǎn)足N個(gè)預(yù)設(shè)敏感規(guī)則之一的數(shù)據(jù)時(shí),確定與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),作為索引數(shù)據(jù); 識(shí)別模塊,用于根據(jù)所述預(yù)設(shè)敏感規(guī)則,從所述索引數(shù)據(jù)中,識(shí)別敏感數(shù)據(jù)。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述N個(gè)預(yù)設(shè)敏感規(guī)則分別為第一預(yù)設(shè)敏感規(guī)則、第二預(yù)設(shè)敏感規(guī)則直至第N預(yù)設(shè)敏感規(guī)則;所述第一敏感判斷模塊,包括: 第一判斷單元,用于判斷關(guān)于文件內(nèi)容的數(shù)據(jù)中,是否存在滿(mǎn)足第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù); 第一標(biāo)記單元,用于當(dāng)存在滿(mǎn)足所述第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)標(biāo)記為第一索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù);或當(dāng)不存在滿(mǎn)足所述第一預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將當(dāng)前所有數(shù)據(jù)標(biāo)記為第一非索引數(shù)據(jù); 第二判斷單元,用于判斷所述第一非索引數(shù)據(jù)中,是否存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù); 第二標(biāo)記單元,用于當(dāng)存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第二索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第二非索引數(shù)據(jù);或當(dāng)不存在滿(mǎn)足第二預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將所述第一非索引數(shù)據(jù),標(biāo)記為第二非索引數(shù)據(jù); 直至第N判斷單元,用于判斷第N-1非索引數(shù)據(jù)中,是否存在滿(mǎn)足第N預(yù)設(shè)敏感規(guī)則的數(shù)據(jù); 第N標(biāo)記單元,用于當(dāng)存在滿(mǎn)足第N預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將與所述數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù),標(biāo)記為第N索引數(shù)據(jù),剩余數(shù)據(jù)標(biāo)記為第N非索引數(shù)據(jù);或當(dāng)不存在滿(mǎn)足第N預(yù)設(shè)敏感規(guī)則的數(shù)據(jù)時(shí),將所述第N-1非索引數(shù)據(jù),標(biāo)記為第N非索引數(shù)據(jù)。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述索引數(shù)據(jù)包括第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù)中,所述P為小于等于N的整數(shù);所述識(shí)別模塊,包括: 組合敏感規(guī)則判斷單元,用于依次判斷所述第一索引數(shù)據(jù)、第二索引數(shù)據(jù)直至第P索引數(shù)據(jù)中,是否存在滿(mǎn)足M個(gè)預(yù)設(shè)組合敏感規(guī)則之一的數(shù)據(jù),所述M為整數(shù);所述預(yù)設(shè)組合敏感規(guī)則,為由N個(gè)預(yù)設(shè)敏感規(guī)則中的至少兩個(gè)預(yù)設(shè)敏感規(guī)則生成; 判定單元,用于當(dāng)存在滿(mǎn)足M個(gè)預(yù)設(shè)組合敏感規(guī)則之一的數(shù)據(jù)時(shí),將所述滿(mǎn)足一預(yù)設(shè)組合敏感規(guī)則的數(shù)據(jù),判定為敏感數(shù)據(jù)。9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 敏感級(jí)別確定模塊,用于根據(jù)組合敏感規(guī)則所預(yù)設(shè)的敏感級(jí)別,確定所述敏感數(shù)據(jù)的敏感級(jí)別; 敏感類(lèi)型確定模塊,用于根據(jù)組合敏感規(guī)則所預(yù)設(shè)的敏感類(lèi)型,確定所述敏感數(shù)據(jù)的敏感類(lèi)型。10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 文件名稱(chēng)提取模塊,用于遍歷存儲(chǔ)空間中的文件類(lèi)型數(shù)據(jù),提取所有文件的文件名稱(chēng); 第二敏感判斷模塊,用于判斷所述文件名稱(chēng)中,是否存在滿(mǎn)足預(yù)設(shè)名稱(chēng)敏感規(guī)則的文件名稱(chēng); 敏感文件獲取模塊,用于當(dāng)存在滿(mǎn)足預(yù)設(shè)名稱(chēng)敏感規(guī)則的文件名稱(chēng)時(shí),將所述文件名稱(chēng)所對(duì)應(yīng)的文件作為敏感文件。
【文檔編號(hào)】G06F17/30GK105824812SQ201510002218
【公開(kāi)日】2016年8月3日
【申請(qǐng)日】2015年1月4日
【發(fā)明人】蘇砫, 李騰, 付宗源, 白利軍, 高峰, 張建軍, 王明漪, 李然
【申請(qǐng)人】北京神州泰岳信息安全技術(shù)有限公司