本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種基于人工智能的數(shù)據(jù)安全處理方法。
背景技術(shù):
1、在數(shù)據(jù)處理與安全保護(hù)的交叉領(lǐng)域,特別是針對(duì)敏感信息的編碼策略,傳統(tǒng)方法多依賴于靜態(tài)的編碼框架與規(guī)則,例如基礎(chǔ)的替換密碼、哈希運(yùn)算及標(biāo)準(zhǔn)化編碼算法。然而,這些傳統(tǒng)手段在應(yīng)對(duì)當(dāng)前復(fù)雜的數(shù)據(jù)解析與破解技術(shù)時(shí),展現(xiàn)出了一定的局限性,這一局限性主要源于其固有的靜態(tài)特性。具體而言,通過分析編碼文本的模式與統(tǒng)計(jì)特性,攻擊者可能揭示出原始數(shù)據(jù)的蛛絲馬跡,從而加劇了數(shù)據(jù)泄露的風(fēng)險(xiǎn)。傳統(tǒng)編碼方式未能充分考量數(shù)據(jù)隨時(shí)間而變化的動(dòng)態(tài)性。在實(shí)際場(chǎng)景中,敏感數(shù)據(jù)往往處于不斷變動(dòng)之中,而靜態(tài)編碼規(guī)則難以適應(yīng)這種變化,導(dǎo)致編碼的安全防護(hù)能力隨時(shí)間推移而減弱。更為嚴(yán)重的是,對(duì)于那些長(zhǎng)期保持穩(wěn)定的字符串內(nèi)容,傳統(tǒng)編碼方法往往無法有效掩蓋其統(tǒng)計(jì)規(guī)律性,使得這些字符串易于被識(shí)別并追溯至其原始意義,進(jìn)一步加劇了數(shù)據(jù)隱私泄露的風(fēng)險(xiǎn)。
2、如中國(guó)專利公告號(hào)cn116933297?b公開了一種金融敏感風(fēng)險(xiǎn)數(shù)據(jù)安全保護(hù)方法,所述方法包括:采集得到敏感風(fēng)險(xiǎn)數(shù)據(jù)序列,根據(jù)敏感風(fēng)險(xiǎn)數(shù)據(jù)序列得到特征字符串,獲取各特征字符串的所有后綴字符,確定所述后綴字符的出現(xiàn)可能性,進(jìn)而得到各特征字符串的長(zhǎng)字符串;根據(jù)各特征字符串的長(zhǎng)字符串完成各特征字符串處的字典更新,完成對(duì)敏感風(fēng)險(xiǎn)數(shù)據(jù)序列的加密得到密文數(shù)據(jù)。進(jìn)而隱藏敏感風(fēng)險(xiǎn)數(shù)據(jù)序列中統(tǒng)計(jì)信息,提高加密安全性。
3、對(duì)比文件中特征字符串中的后綴字符,攻擊者可能會(huì)通過分析后綴字符發(fā)現(xiàn)其中的模式,從而增加破解的風(fēng)險(xiǎn),對(duì)比文件中靜態(tài)編碼規(guī)則因其固定不變的結(jié)構(gòu),易成為破解者分析的目標(biāo)。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)提供一種基于人工智能的數(shù)據(jù)安全處理方法,通過采用了等長(zhǎng)編碼和補(bǔ)償編碼,使得原始字符串的統(tǒng)計(jì)特征被隱匿,增加了破解的難度,補(bǔ)償編碼的隨機(jī)填充進(jìn)一步提高了編碼的復(fù)雜性和不可預(yù)測(cè)性。
2、本技術(shù)提供了一種基于人工智能的數(shù)據(jù)安全處理方法,包括:
3、s101,采集敏感數(shù)據(jù)序列,將采集到的敏感數(shù)據(jù)序列拆分成若干個(gè)可行性字符串;
4、s102,根據(jù)得到的可行性字符串生成特征字符串,獲取各特征字符串的后綴字符,計(jì)算各特征字符串的各后綴字符的出現(xiàn)可能性;
5、s103,根據(jù)出現(xiàn)可能性得到各特征字符串的長(zhǎng)字符串;
6、s104,選擇字符集和編碼長(zhǎng)度,對(duì)編碼結(jié)構(gòu)進(jìn)行定義;
7、s105,根據(jù)步驟s104中選定的字符集,生成補(bǔ)償編碼,將生成的補(bǔ)償編碼存儲(chǔ)到補(bǔ)償編碼庫中;
8、s106,基于得到的長(zhǎng)字符串,根據(jù)編碼規(guī)則生成等長(zhǎng)編碼,若生成的等長(zhǎng)編碼中有多余位置,從補(bǔ)償編碼庫中選擇補(bǔ)償編碼進(jìn)行填充;在等長(zhǎng)編碼的隨機(jī)位置處插入字符;
9、s107,將生成的長(zhǎng)字符串及其對(duì)應(yīng)的等長(zhǎng)編碼存儲(chǔ)在字典中,根據(jù)字典對(duì)敏感風(fēng)險(xiǎn)數(shù)據(jù)序列進(jìn)行加密和解密。
10、優(yōu)選地,所述將敏感數(shù)據(jù)序列拆分成若干個(gè)可行性字符串,預(yù)設(shè)滑窗,所述滑窗為具有固定長(zhǎng)度的窗口,將預(yù)設(shè)滑窗的左側(cè)與敏感數(shù)據(jù)序列的第一個(gè)字符對(duì)齊,以一個(gè)字符為滑動(dòng)步長(zhǎng),將預(yù)設(shè)滑窗從左向右滑動(dòng),直到滑窗的右側(cè)與敏感數(shù)據(jù)序列的最后一個(gè)字符對(duì)齊,記錄預(yù)設(shè)滑窗每次滑動(dòng)時(shí)在敏感數(shù)據(jù)序列上對(duì)應(yīng)的子序列。
11、優(yōu)選地,將可行性字符串出現(xiàn)頻數(shù)大于預(yù)設(shè)頻數(shù)閾值的字符串作為固定字符串,計(jì)算固定字符串相鄰位置之間的間隔,生成一個(gè)包含所有間隔的列表,計(jì)算所有間隔的均值和標(biāo)準(zhǔn)差,周期分布程度=。
12、優(yōu)選地,等長(zhǎng)編碼的隨機(jī)位置處插入字符的具體步驟為:
13、s201,基于步驟s106中生成的等長(zhǎng)編碼,使用隨機(jī)數(shù)生成器選擇若干個(gè)隨機(jī)位置;
14、s202,根據(jù)選擇的隨機(jī)位置,從補(bǔ)償編碼庫中選取補(bǔ)償編碼,將選取補(bǔ)償編碼插入到等長(zhǎng)編碼的隨機(jī)位置中;
15、s203,對(duì)生成的等長(zhǎng)編碼進(jìn)行驗(yàn)證,將編碼及其對(duì)應(yīng)的字符串、分配時(shí)間和有效期限記錄在數(shù)據(jù)庫中;
16、s204,根據(jù)字典和等長(zhǎng)編碼還原出原始的字符串。
17、優(yōu)選地,所述字典為一個(gè)預(yù)先定義好的映射表,字典存儲(chǔ)等長(zhǎng)編碼與原始字符串之間的對(duì)應(yīng)關(guān)系,每個(gè)等長(zhǎng)編碼在字典中都有一個(gè)唯一的鍵,與之對(duì)應(yīng)的值則是原始的字符串,將獲取的等長(zhǎng)編碼對(duì)應(yīng)的鍵輸入到字典中,在字典中進(jìn)行查找,字典查找到與鍵相對(duì)應(yīng)的原始的字符串。
18、優(yōu)選地,所述字典為一個(gè)一段時(shí)間內(nèi)根據(jù)字符串內(nèi)容的變化而被動(dòng)更新的數(shù)據(jù)庫,插接字符指在原始編碼中插入的額外字符,對(duì)插接字符進(jìn)行轉(zhuǎn)換的步驟為:
19、s301,設(shè)置一個(gè)魔方,所述魔方至少具有26個(gè)面,每個(gè)面包含一個(gè)小塊,代表一個(gè)英文字母或符號(hào),創(chuàng)建字符表;
20、s302,基于隨機(jī)算法生成打亂路徑,根據(jù)打亂路徑上字符在主面上的位置,確定每個(gè)字符從主面到調(diào)節(jié)面的單次移動(dòng)路徑;
21、s303,根據(jù)單次移動(dòng)路徑和字符表中的預(yù)設(shè)方向,將字符轉(zhuǎn)換為新的字符;
22、s304,將轉(zhuǎn)換后的字符插入到等長(zhǎng)編碼中,形成組合編碼;
23、s305,使用相同的魔方和字符表,根據(jù)接收到的打亂路徑,逆向應(yīng)用轉(zhuǎn)換規(guī)則,將組合編碼還原為原始編碼。
24、優(yōu)選地,所述預(yù)設(shè)方向?yàn)楸容^路徑中的第一個(gè)坐標(biāo)和第二個(gè)坐標(biāo)。
25、優(yōu)選地,在原始編碼和補(bǔ)償編碼中增加一種動(dòng)態(tài)編碼。
26、優(yōu)選地,增加動(dòng)態(tài)編碼的步驟:
27、s401,根據(jù)打亂路徑的哈希值,判斷使用原始編碼還是補(bǔ)償編碼;
28、s402,若步驟s401中選擇的是補(bǔ)償編碼,根據(jù)打亂路徑和轉(zhuǎn)換規(guī)則,將原始編碼中的字符轉(zhuǎn)換為補(bǔ)償編碼;若步驟s401中選擇的是原始編碼,根據(jù)打亂路徑和轉(zhuǎn)換規(guī)則,將補(bǔ)償編碼中的字符轉(zhuǎn)換為原始編碼;
29、s403,根據(jù)選擇好的編碼與其余部分組合成最終的組合編碼;
30、s404,用相同的魔方結(jié)構(gòu)、字符表和轉(zhuǎn)換規(guī)則,根據(jù)接收到的打亂路徑和編碼類型選擇,逆向應(yīng)用轉(zhuǎn)換規(guī)則,如果使用了補(bǔ)償編碼,將組合編碼還原為原始編碼;如果使用了原始編碼,將組合編碼還原為補(bǔ)償編碼。
31、優(yōu)選地,所述打亂路徑為每次轉(zhuǎn)換前魔方隨機(jī)打亂的狀態(tài),每個(gè)打亂狀態(tài)對(duì)應(yīng)一個(gè)唯一的路徑,用于確定字符的轉(zhuǎn)換結(jié)果。
32、本技術(shù)中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):采用了等長(zhǎng)編碼和補(bǔ)償編碼,使得原始字符串的統(tǒng)計(jì)特征被隱匿,增加了破解的難度,補(bǔ)償編碼的隨機(jī)填充進(jìn)一步提高了編碼的復(fù)雜性和不可預(yù)測(cè)性;
33、通過隨機(jī)位置的生成,使得補(bǔ)償編碼的分布變得難以預(yù)測(cè),即使攻擊者知道編碼的存在和可能的作用,他們也難以準(zhǔn)確定位這些編碼,從而增加了數(shù)據(jù)保護(hù)和安全傳輸?shù)碾y度,隨機(jī)位置選擇和補(bǔ)償編碼插入相結(jié)合,可以顯著提高數(shù)據(jù)編碼的安全性,在數(shù)據(jù)傳輸中,該機(jī)制能夠有效抵抗數(shù)據(jù)篡改和中間人攻擊;
34、通過插接額外字符,并應(yīng)用基于魔方狀態(tài)和字符表的轉(zhuǎn)換規(guī)則,原始編碼的復(fù)雜性顯著增加,這使得編碼更難以被破解或預(yù)測(cè),每次轉(zhuǎn)換前,魔方都會(huì)隨機(jī)打亂到一個(gè)新的狀態(tài),確保每次編碼都是唯一的,這消除了統(tǒng)計(jì)規(guī)律,使得編碼更難以被分析或模式識(shí)別。