本技術(shù)涉及數(shù)據(jù)安全保護(hù),具體涉及一種建筑工程造價(jià)數(shù)據(jù)安全保護(hù)方法、系統(tǒng)及介質(zhì)。
背景技術(shù):
1、在建筑工程造價(jià)數(shù)據(jù)管理中,由于價(jià)格信息直接關(guān)聯(lián)到一個(gè)企業(yè)的商業(yè)機(jī)密以及競(jìng)爭(zhēng)優(yōu)勢(shì),所以在工程造價(jià)數(shù)據(jù)文件內(nèi)部中與價(jià)格有關(guān)的信息尤其重要。一般對(duì)工程文件或者文檔中的安全保護(hù),是使用隱藏加密的形式,將文件中與價(jià)格有關(guān)的信息直接隱藏。雖然可以在一定程度上保護(hù)數(shù)據(jù),但一旦加密被破解,數(shù)據(jù)就可能被泄露。而現(xiàn)有的加密算法通常是直接對(duì)數(shù)據(jù)進(jìn)行加密,不進(jìn)行偽裝,加密后的數(shù)據(jù)與原本文檔中的數(shù)據(jù)差異過(guò)大,雖具有加密能力,但是不具備偽裝能力,容易被人暴力破解,加密效果較差。因此本技術(shù)通過(guò)以往造價(jià)數(shù)據(jù)對(duì)當(dāng)前文檔造價(jià)數(shù)據(jù)進(jìn)行加密,使得加密后的密文的數(shù)值和正常數(shù)值合理,具有相應(yīng)的真實(shí)性,從而保護(hù)更真實(shí)的造價(jià)數(shù)據(jù)。
技術(shù)實(shí)現(xiàn)思路
1、為了解決加密效果較差的技術(shù)問(wèn)題,本技術(shù)提供了一種建筑工程造價(jià)數(shù)據(jù)安全保護(hù)方法、系統(tǒng)及介質(zhì),所采用的技術(shù)方案具體如下:
2、本技術(shù)提出了一種建筑工程造價(jià)數(shù)據(jù)安全保護(hù)方法、系統(tǒng)及介質(zhì),該方法包括以下步驟:
3、獲取歷史文檔、當(dāng)前文檔以及當(dāng)前文檔的所有數(shù)據(jù)值;
4、將歷史文檔和當(dāng)前文檔根據(jù)標(biāo)點(diǎn)進(jìn)行分割獲取若干語(yǔ)句;將每個(gè)語(yǔ)句進(jìn)行分詞,對(duì)于每個(gè)歷史文檔和當(dāng)前文檔分別獲取歷史分詞集合和當(dāng)前分詞集合;將當(dāng)前分詞集合和歷史分詞集合相同的分詞構(gòu)成分詞集合交集;根據(jù)分詞集合交集與當(dāng)前分詞集合的分詞數(shù)量差異獲取語(yǔ)句相似性;根據(jù)分詞集合交集中每個(gè)分詞在歷史分詞集合與當(dāng)前分詞集合中的序號(hào)差異獲取語(yǔ)序差異;根據(jù)語(yǔ)序差異對(duì)語(yǔ)句相似性進(jìn)行修正獲取修正后的語(yǔ)句相似性;并以此確定當(dāng)前文檔語(yǔ)句的相似語(yǔ)句;
5、將當(dāng)前文檔句子的數(shù)據(jù)值與其所有相似語(yǔ)句的數(shù)據(jù)值聚類獲取當(dāng)前簇和鄰域簇;若當(dāng)前文檔句子存在一個(gè)數(shù)據(jù)值,根據(jù)當(dāng)前簇和鄰域簇的距離以及當(dāng)前文檔句子的數(shù)據(jù)值與鄰域簇的距離獲取鄰域簇的異常值;根據(jù)異常值和預(yù)設(shè)異常閾值的比較刪除部分鄰域簇內(nèi)的數(shù)據(jù)值獲取最終數(shù)值集合;若當(dāng)前文檔句子存在多個(gè)數(shù)據(jù)值,當(dāng)前簇為最終數(shù)值集合,根據(jù)最終數(shù)值集合的最大值和最小值獲取替換范圍;
6、根據(jù)當(dāng)前文檔每個(gè)數(shù)據(jù)值與其替換范圍內(nèi)每個(gè)數(shù)據(jù)值的差異確定替換值,根據(jù)當(dāng)前文檔所有數(shù)據(jù)值與其替換值確定當(dāng)前文檔的密鑰;
7、根據(jù)密鑰對(duì)工程造價(jià)數(shù)據(jù)進(jìn)行加密保護(hù)。
8、在上述方案中,本技術(shù)提出了一種基于數(shù)值亂序的造價(jià)數(shù)據(jù)保護(hù)方法。通過(guò)根據(jù)歷史工程中相似語(yǔ)句段的數(shù)據(jù)范圍,以及文檔中可替換數(shù)據(jù)與當(dāng)前數(shù)據(jù)的差異情況確定當(dāng)前文檔中數(shù)值中的可替換數(shù)據(jù)值,使得加密過(guò)后的文檔與真實(shí)文檔中數(shù)據(jù)指標(biāo)顯示合理,并且存在較大的差異,很難被識(shí)別,從而可以保護(hù)真實(shí)的造價(jià)文件。
9、在一個(gè)實(shí)施例中,所述根據(jù)分詞集合交集與當(dāng)前分詞集合的分詞數(shù)量差異獲取語(yǔ)句相似性的方法為:
10、將分詞集合交集與當(dāng)前分詞集合的分詞數(shù)量的比值作為當(dāng)前文檔的語(yǔ)句與歷史文檔語(yǔ)句的語(yǔ)句相似性。
11、在一個(gè)實(shí)施例中,所述根據(jù)分詞集合交集中每個(gè)分詞在歷史分詞集合與當(dāng)前分詞集合中的序號(hào)差異獲取語(yǔ)序差異的方法為:
12、將當(dāng)前分詞集合和歷史分詞集合中所有分詞按照順序進(jìn)行標(biāo)號(hào),計(jì)算分詞集合交集中每個(gè)分詞在當(dāng)前分詞集合和歷史分詞集合的序號(hào)的差值絕對(duì)值,將分詞集合交集中所有分詞的差值絕對(duì)值的累加和記為語(yǔ)序差異。
13、在一個(gè)實(shí)施例中,所述根據(jù)語(yǔ)序差異對(duì)語(yǔ)句相似性進(jìn)行修正獲取修正后的語(yǔ)句相似性;并以此確定當(dāng)前文檔語(yǔ)句的相似語(yǔ)句的方法為:
14、修正后的語(yǔ)句相似性的表達(dá)式為:
15、,表示當(dāng)前文檔的語(yǔ)句與歷史文檔語(yǔ)句的語(yǔ)句相似性,表示當(dāng)前文檔的語(yǔ)句與歷史文檔語(yǔ)句的語(yǔ)序差異,為歸一化函數(shù),表示修正后的語(yǔ)句相似度;
16、對(duì)于當(dāng)前文檔的任意一個(gè)語(yǔ)句,將其余歷史文檔中所有語(yǔ)句的最大的語(yǔ)句相似度作為當(dāng)前文檔的語(yǔ)句的相似語(yǔ)句。
17、在一個(gè)實(shí)施例中,所述將當(dāng)前文檔句子的數(shù)據(jù)值與其所有相似語(yǔ)句的數(shù)據(jù)值聚類獲取當(dāng)前簇和鄰域簇的方法為:
18、將當(dāng)前文檔句子的數(shù)據(jù)值與其所有相似語(yǔ)句的數(shù)據(jù)值聚類;聚類距離為數(shù)據(jù)值之間的差值絕對(duì)值;
19、將當(dāng)前文檔句子的數(shù)據(jù)值所在的簇記為當(dāng)前簇;將除了當(dāng)前簇外的簇記為鄰域簇。
20、在一個(gè)實(shí)施例中,所述根據(jù)當(dāng)前簇和鄰域簇的距離以及當(dāng)前文檔句子的數(shù)據(jù)值與鄰域簇的距離獲取鄰域簇的異常值的方法為:
21、,表示當(dāng)前簇b的簇心的數(shù)據(jù)值,表示第v個(gè)鄰域簇的簇心的數(shù)據(jù)值,表示當(dāng)前文檔語(yǔ)句的數(shù)據(jù)值,表示歸一化函數(shù),表示第v個(gè)鄰域簇的異常值。
22、在一個(gè)實(shí)施例中,所述根據(jù)異常值和預(yù)設(shè)異常閾值的比較刪除部分鄰域簇內(nèi)的數(shù)據(jù)值獲取最終數(shù)值集合的方法為:
23、若鄰域簇的異常值大于預(yù)設(shè)異常閾值,則說(shuō)明當(dāng)前鄰域簇的數(shù)據(jù)異常,將鄰域簇中的數(shù)據(jù)值在數(shù)值集合中刪除;
24、將所有數(shù)據(jù)異常的鄰域簇的數(shù)據(jù)值在數(shù)值集合中刪除,獲取最終數(shù)值集合。
25、在一個(gè)實(shí)施例中,所述根據(jù)當(dāng)前文檔每個(gè)數(shù)據(jù)值與其替換范圍內(nèi)每個(gè)數(shù)據(jù)值的差異確定替換值,根據(jù)當(dāng)前文檔所有數(shù)據(jù)值與其替換值確定當(dāng)前文檔的密鑰的方法為:
26、將當(dāng)前文檔語(yǔ)句的數(shù)據(jù)值記為當(dāng)前數(shù)據(jù)值,計(jì)算當(dāng)前數(shù)據(jù)值與其替換范圍內(nèi)的每個(gè)數(shù)據(jù)值的差值絕對(duì)值,將差值絕對(duì)值最大的值記為當(dāng)前數(shù)據(jù)值的替換值。保存替換值在最終數(shù)值集合的序號(hào)位置;
27、獲取當(dāng)前數(shù)據(jù)值在當(dāng)前文檔的數(shù)值集合中的序號(hào)位置,將當(dāng)前數(shù)據(jù)值的序號(hào)位置和其對(duì)應(yīng)的替換值的序號(hào)位置作為一個(gè)二維點(diǎn);
28、當(dāng)前文檔中所有二維點(diǎn)組成密鑰。
29、第二方面,本技術(shù)還提供了一種建筑工程造價(jià)數(shù)據(jù)安全保護(hù)系統(tǒng),所述系統(tǒng)包括:
30、數(shù)據(jù)采集模塊,用于獲取歷史文檔、當(dāng)前文檔以及當(dāng)前文檔的數(shù)值集合;
31、相似語(yǔ)句獲取模塊,用于將歷史文檔和當(dāng)前文檔根據(jù)標(biāo)點(diǎn)進(jìn)行分割獲取若干語(yǔ)句;將每個(gè)語(yǔ)句分詞,對(duì)于每個(gè)歷史文檔和當(dāng)前文檔分別獲取歷史分詞集合和當(dāng)前分詞集合;將當(dāng)前分詞集合和歷史分詞集合相同的分詞構(gòu)成分詞集合交集;根據(jù)分詞集合交集與當(dāng)前分詞集合的分詞數(shù)量差異獲取語(yǔ)句相似性;根據(jù)分詞集合交集中每個(gè)分詞在歷史分詞集合與當(dāng)前分詞集合中的序號(hào)差異獲取語(yǔ)序差異;根據(jù)語(yǔ)序差異對(duì)語(yǔ)句相似性進(jìn)行修正獲取修正后的語(yǔ)句相似性;并以此確定相似語(yǔ)句;
32、替換范圍獲取模塊,用于將當(dāng)前文檔句子的數(shù)據(jù)值與其所有相似語(yǔ)句的數(shù)據(jù)值聚類獲取當(dāng)前簇和鄰域簇;根據(jù)當(dāng)前簇和鄰域簇的距離以及當(dāng)前文檔句子的數(shù)據(jù)值與鄰域簇的距離獲取鄰域簇的異常值;根據(jù)異常值和預(yù)設(shè)異常閾值的比較刪除部分鄰域簇內(nèi)的數(shù)據(jù)值獲取最終數(shù)值集合;根據(jù)最終數(shù)值集合的最大值和最小值獲取替換范圍;
33、密鑰確定模塊,根據(jù)當(dāng)前文檔每個(gè)數(shù)據(jù)值與其替換范圍內(nèi)每個(gè)數(shù)據(jù)值的差異確定替換值,根據(jù)當(dāng)前文檔所有數(shù)據(jù)值與其替換值確定當(dāng)前文檔的密鑰;
34、保護(hù)模塊,根據(jù)密鑰對(duì)工程造價(jià)數(shù)據(jù)進(jìn)行加密保護(hù)。
35、第三方面,本技術(shù)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的一種建筑工程造價(jià)數(shù)據(jù)安全保護(hù)方法。
36、本技術(shù)的有益效果如下:
37、本技術(shù)提出了一種基于數(shù)值亂序的造價(jià)數(shù)據(jù)保護(hù)方法。通過(guò)根據(jù)歷史工程中相似語(yǔ)句段的數(shù)據(jù)范圍,以及文檔中可替換數(shù)據(jù)與當(dāng)前數(shù)據(jù)的差異情況確定當(dāng)前文檔中數(shù)值中的可替換數(shù)據(jù)值,使得加密過(guò)后的文檔與真實(shí)文檔中數(shù)據(jù)指標(biāo)顯示合理,并且存在較大的差異,很難被識(shí)別,從而可以保護(hù)真實(shí)的造價(jià)文件。