本發(fā)明涉及隱私保護(hù),具體為基于增加數(shù)據(jù)噪音保護(hù)隱私的方法和系統(tǒng)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)的普及和技術(shù)的發(fā)展,數(shù)據(jù)的收集和處理已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠郑欢@也帶來(lái)了許多安全和隱私問(wèn)題,黑客可以通過(guò)各種手段來(lái)獲取、竊取或破壞敏感數(shù)據(jù),這使得保護(hù)個(gè)人隱私和安全變得至關(guān)重要。
2、其中,隨著技術(shù)的進(jìn)步,越來(lái)越多的投資者選擇在網(wǎng)上進(jìn)行證券交易,然而,這也帶來(lái)了許多安全問(wèn)題和隱私泄露的風(fēng)險(xiǎn),如黑客可能會(huì)通過(guò)各種手段(如釣魚(yú)郵件、惡意軟件等)入侵投資者的電子設(shè)備并竊取他們的個(gè)人信息和敏感數(shù)據(jù),公司員工或管理層可能會(huì)利用獲得的個(gè)人信息進(jìn)行非法活動(dòng),敵對(duì)的公司可能會(huì)試圖竊取其他公司的商業(yè)機(jī)密或個(gè)人信息以獲得競(jìng)爭(zhēng)優(yōu)勢(shì),投資者自己的行為可能會(huì)泄露個(gè)人信息,如在社交媒體上發(fā)布個(gè)人信息或在公共場(chǎng)合討論投資決策,因此,保護(hù)隱私安全的重要性極為重要。
3、公開(kāi)號(hào)為cn113282955b的中國(guó)專利公開(kāi)了一種隱私政策中隱私信息提取方法及系統(tǒng),基于自然語(yǔ)言處理,首先將原始的隱私政策處理成文本,繼而對(duì)隱私文本進(jìn)行分段分句,并且使用預(yù)訓(xùn)練得到的自然語(yǔ)言處理模型對(duì)句子進(jìn)行詞性標(biāo)注與命名實(shí)體識(shí)別得到數(shù)據(jù)對(duì)象,最后利用同義詞詞典與模糊匹配得到歸一化的數(shù)據(jù)對(duì)象,再將數(shù)據(jù)對(duì)象映射到對(duì)應(yīng)的隱私信息分類中,得到隱私政策收集的隱私信息的類別,以便于用戶、應(yīng)用市場(chǎng)平臺(tái)或監(jiān)管機(jī)構(gòu)了解應(yīng)用的隱私政策的隱私信息收集情況,幫助他們進(jìn)行下一步的決策。同時(shí)提供了一種相應(yīng)的終端及介質(zhì);通過(guò)利用自然語(yǔ)言處理技術(shù)對(duì)隱私政策中的隱私信息進(jìn)行提取,不需人工進(jìn)行標(biāo)注,能夠?qū)崿F(xiàn)更加高效、快速、靈活的隱私分析,滿足相關(guān)行業(yè)的需求;但是,該專利存在以下缺陷:
4、現(xiàn)有的不能基于增加數(shù)據(jù)噪音來(lái)保護(hù)隱私,使得用戶隱私易泄露,導(dǎo)致用戶隱私保護(hù)效果差,安全性低下。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供基于增加數(shù)據(jù)噪音保護(hù)隱私的方法和系統(tǒng),可基于增加數(shù)據(jù)噪音來(lái)保護(hù)隱私,避免用戶隱私泄露,可提升用戶隱私保護(hù)效果及安全性,解決了上述背景技術(shù)中提出的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、基于增加數(shù)據(jù)噪音保護(hù)隱私的方法,包括如下步驟:
4、s1:實(shí)時(shí)采集用戶身份數(shù)據(jù)、用戶行為數(shù)據(jù)及用戶偏好數(shù)據(jù),確定出用戶隱私實(shí)時(shí)數(shù)據(jù);
5、s2:對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行無(wú)線傳輸,使用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行加噪保護(hù);
6、s3:對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行處理、加噪保護(hù)及存儲(chǔ)管控,使用戶隱私保護(hù)聚合數(shù)據(jù)安全。
7、根據(jù)本發(fā)明的另一個(gè)方面,提供了基于增加數(shù)據(jù)噪音保護(hù)隱私的系統(tǒng),用于實(shí)現(xiàn)如上述的基于增加數(shù)據(jù)噪音保護(hù)隱私的方法,包括:
8、數(shù)據(jù)采集模塊,用于對(duì)用戶身份數(shù)據(jù)、用戶行為數(shù)據(jù)及用戶偏好數(shù)據(jù)進(jìn)行實(shí)時(shí)采集,確定出用戶隱私實(shí)時(shí)數(shù)據(jù);
9、數(shù)據(jù)傳輸模塊,用于對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行無(wú)線傳輸,便于后續(xù)對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行加噪保護(hù);
10、加噪保護(hù)平臺(tái),用于對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行處理、加噪保護(hù)及存儲(chǔ)管控,使用戶隱私保護(hù)聚合數(shù)據(jù)安全。
11、優(yōu)選的,所述數(shù)據(jù)采集模塊包括:
12、身份采集單元,用于對(duì)用戶的姓名、性別、年齡、身高、體重、地址、電話、郵箱、學(xué)歷、婚姻狀況及職業(yè)進(jìn)行實(shí)時(shí)采集,確定出用戶身份數(shù)據(jù);
13、行為采集單元,用于對(duì)用戶的互聯(lián)網(wǎng)瀏覽行為、購(gòu)買行為及互動(dòng)行為進(jìn)行實(shí)時(shí)采集,確定出用戶行為數(shù)據(jù);
14、偏好采集單元,用于對(duì)用戶的習(xí)慣需求及偏愛(ài)喜好進(jìn)行實(shí)時(shí)采集,確定出用戶偏好數(shù)據(jù);
15、其中,基于用戶身份數(shù)據(jù)、用戶行為數(shù)據(jù)及用戶偏好數(shù)據(jù),確定出用戶隱私實(shí)時(shí)數(shù)據(jù)。
16、優(yōu)選的,所述數(shù)據(jù)傳輸模塊包括:
17、數(shù)據(jù)發(fā)射單元,用于發(fā)射用戶隱私實(shí)時(shí)數(shù)據(jù);
18、數(shù)據(jù)接收單元,用于接收用戶隱私實(shí)時(shí)數(shù)據(jù);
19、基于增加數(shù)據(jù)噪音保護(hù)隱私的需求,建立數(shù)據(jù)發(fā)射單元與數(shù)據(jù)接收單元之間的數(shù)據(jù)傳輸鏈路;
20、其中,數(shù)據(jù)發(fā)射單元向數(shù)據(jù)接收單元傳輸請(qǐng)求建立數(shù)據(jù)傳輸鏈路的指令;
21、數(shù)據(jù)接收單元接收到數(shù)據(jù)發(fā)射單元傳輸?shù)恼?qǐng)求建立數(shù)據(jù)傳輸鏈路的指令,數(shù)據(jù)接收單元檢查自身是否存在空閑的數(shù)據(jù)傳輸端口;
22、當(dāng)數(shù)據(jù)接收單元存在空閑的數(shù)據(jù)傳輸端口時(shí),數(shù)據(jù)接收單元向數(shù)據(jù)發(fā)射單元傳輸同意建立數(shù)據(jù)傳輸鏈路的指令;
23、數(shù)據(jù)發(fā)射單元接收到數(shù)據(jù)接收單元傳輸?shù)耐饨?shù)據(jù)傳輸鏈路的指令,數(shù)據(jù)發(fā)射單元與數(shù)據(jù)接收單元建立數(shù)據(jù)傳輸鏈路;
24、其中,數(shù)據(jù)發(fā)射單元將用戶隱私實(shí)時(shí)數(shù)據(jù)發(fā)射給數(shù)據(jù)接收單元;
25、數(shù)據(jù)接收單元接收到用戶隱私實(shí)時(shí)數(shù)據(jù)后,數(shù)據(jù)接收單元將用戶隱私實(shí)時(shí)數(shù)據(jù)傳輸給加噪保護(hù)平臺(tái)。
26、優(yōu)選的,所述數(shù)據(jù)傳輸模塊,還包括:
27、數(shù)據(jù)發(fā)送時(shí)刻實(shí)時(shí)監(jiān)測(cè)模塊,用于實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)發(fā)射單元的每個(gè)數(shù)據(jù)的數(shù)據(jù)發(fā)送時(shí)刻;
28、數(shù)據(jù)接收時(shí)刻實(shí)時(shí)監(jiān)測(cè)模塊,用于實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)接收單元的每個(gè)數(shù)據(jù)的數(shù)據(jù)接收時(shí)刻;
29、數(shù)據(jù)傳輸時(shí)長(zhǎng)獲取模塊,用于利用所述數(shù)據(jù)發(fā)送時(shí)刻和數(shù)據(jù)接收時(shí)刻獲取每個(gè)數(shù)據(jù)的數(shù)據(jù)傳輸時(shí)長(zhǎng);
30、數(shù)據(jù)傳輸參數(shù)獲取模塊,用于利用所述每個(gè)數(shù)據(jù)的數(shù)據(jù)傳輸時(shí)長(zhǎng)獲取數(shù)據(jù)傳輸參數(shù),其中,所述數(shù)據(jù)傳輸參數(shù)通過(guò)如下公式獲?。?/p>
31、
32、其中,k表示數(shù)據(jù)傳輸參數(shù);n表示數(shù)據(jù)傳輸次數(shù);ti表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的實(shí)際數(shù)據(jù)傳輸時(shí)長(zhǎng);tci表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的理論數(shù)據(jù)傳輸時(shí)長(zhǎng);ci表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸量;cyi表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸線程的通信剩余容量;
33、運(yùn)行參數(shù)提取模塊,用于當(dāng)所述數(shù)據(jù)傳輸參數(shù)未超過(guò)預(yù)設(shè)的數(shù)據(jù)參數(shù)閾值時(shí),則提取所述數(shù)據(jù)發(fā)射單元與所述數(shù)據(jù)接收單元之間的通信線程的運(yùn)行參數(shù),其中,所述運(yùn)行參數(shù)包括數(shù)據(jù)傳輸速率和數(shù)據(jù)傳輸剩余容量;
34、數(shù)據(jù)傳輸線程啟動(dòng)判定模塊,用于根據(jù)所述數(shù)據(jù)發(fā)射單元與所述數(shù)據(jù)接收單元之間的通信線程的運(yùn)行參數(shù)判斷是否啟動(dòng)新的數(shù)據(jù)傳輸線程。
35、優(yōu)選的,數(shù)據(jù)傳輸線程啟動(dòng)判定模塊,包括:
36、第一傳輸參數(shù)因子獲取模塊,用于利用所述數(shù)據(jù)傳輸速率獲取第一傳輸參數(shù)因子,其中,所述第一傳輸參數(shù)因子通過(guò)如下公式獲取:
37、
38、其中,d01表示第一傳輸參數(shù)因子;n表示數(shù)據(jù)傳輸次數(shù);vi表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸速率;ve表示數(shù)據(jù)傳輸線程正常運(yùn)行狀態(tài)下所允許的最大數(shù)據(jù)傳輸速率;ci表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸量;cyi表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸線程的通信剩余容量;
39、第二傳輸參數(shù)因子獲取模塊,用于利用所述數(shù)據(jù)傳輸剩余容量獲取第二傳輸參數(shù)因子,其中,所述第二傳輸參數(shù)因子通過(guò)如下公式獲?。?/p>
40、
41、其中,d02表示第二傳輸參數(shù)因子;n表示數(shù)據(jù)傳輸次數(shù);ci表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸量;cyi表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸線程的通信剩余容量;k表示調(diào)節(jié)系數(shù),并且,所述調(diào)節(jié)系數(shù)通過(guò)如下公式獲取:
42、
43、其中,n表示數(shù)據(jù)傳輸次數(shù);ci表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸量;cyi表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸線程的通信剩余容量;vi表示第i次數(shù)據(jù)傳輸對(duì)應(yīng)的數(shù)據(jù)傳輸速率;ve表示數(shù)據(jù)傳輸線程正常運(yùn)行狀態(tài)下所允許的最大數(shù)據(jù)傳輸速率;
44、比較模塊,用于將所述第一傳輸參數(shù)因子和第二傳輸參數(shù)因子分別與預(yù)設(shè)的第一評(píng)價(jià)因子閾值和第二評(píng)價(jià)因子閾值進(jìn)行比較,獲得比較結(jié)果;
45、第一數(shù)據(jù)傳輸線程啟動(dòng)判定模塊,用于當(dāng)所述比較結(jié)果表明第一傳輸參數(shù)因子和第二傳輸參數(shù)因子中任一一個(gè)參數(shù)因子超過(guò)其對(duì)應(yīng)的評(píng)價(jià)因子閾值時(shí),則判定需要啟動(dòng)新的數(shù)據(jù)傳輸線程;
46、傳輸評(píng)價(jià)參數(shù)獲取模塊,用于當(dāng)所述比較結(jié)果表明第一傳輸參數(shù)因子和第二傳輸參數(shù)因子均低于其對(duì)應(yīng)的評(píng)價(jià)因子閾值時(shí),則利用所述第一傳輸參數(shù)因子和第二傳輸參數(shù)因子獲取傳輸評(píng)價(jià)參數(shù),其中,所述傳輸評(píng)價(jià)參數(shù)通過(guò)如下公式獲?。?/p>
47、
48、其中,d表示傳輸評(píng)價(jià)參數(shù);d01表示第一傳輸參數(shù)因子;d02表示第二傳輸參數(shù)因子;
49、第二數(shù)據(jù)傳輸線程啟動(dòng)判定模塊,用于當(dāng)所述傳輸評(píng)價(jià)參數(shù)超過(guò)預(yù)設(shè)的參數(shù)閾值時(shí),則判定需要啟動(dòng)新的數(shù)據(jù)傳輸線程;當(dāng)所述傳輸評(píng)價(jià)參數(shù)未超過(guò)預(yù)設(shè)的參數(shù)閾值時(shí),則判定不需要啟動(dòng)新的數(shù)據(jù)傳輸線程。
50、優(yōu)選的,所述加噪保護(hù)平臺(tái)包括:
51、數(shù)據(jù)處理模塊,用于對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行檢索、排序及特征提取,確定出用戶隱私特征數(shù)據(jù);
52、加噪保護(hù)模塊,用于對(duì)用戶隱私特征數(shù)據(jù)進(jìn)行拆分及增加數(shù)據(jù)噪音,確定出多個(gè)不能被直接識(shí)別的用戶隱私特征子集;
53、存儲(chǔ)管控模塊,用于對(duì)噪音增加后的多個(gè)用戶隱私特征子集進(jìn)行安全聚合、加密存儲(chǔ)及數(shù)據(jù)監(jiān)控,使用戶隱私保護(hù)聚合數(shù)據(jù)安全。
54、優(yōu)選的,所述數(shù)據(jù)處理模塊包括:
55、數(shù)據(jù)檢索單元,用于對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行檢索;
56、獲取用戶隱私實(shí)時(shí)數(shù)據(jù);
57、基于順序檢索方法,對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行檢索;
58、檢查用戶隱私實(shí)時(shí)數(shù)據(jù)的一致性;
59、根據(jù)用戶隱私實(shí)時(shí)數(shù)據(jù)中每個(gè)變量的合理取值范圍和相互關(guān)系,檢查用戶隱私實(shí)時(shí)數(shù)據(jù)是否合乎要求;
60、去除用戶隱私實(shí)時(shí)數(shù)據(jù)中含有的超出正常范圍、邏輯上不合理或相互矛盾的不一致數(shù)據(jù);
61、對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行無(wú)效值及缺失值處理;
62、去除用戶隱私實(shí)時(shí)數(shù)據(jù)中含有的對(duì)增加數(shù)據(jù)噪音保護(hù)隱私無(wú)價(jià)值的無(wú)效數(shù)據(jù)及缺失數(shù)據(jù);
63、確定出對(duì)增加數(shù)據(jù)噪音保護(hù)隱私有價(jià)值的用戶隱私實(shí)時(shí)數(shù)據(jù);
64、數(shù)據(jù)排序單元,用于對(duì)檢索后的用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行排序;
65、獲取檢索后對(duì)增加數(shù)據(jù)噪音保護(hù)隱私有價(jià)值的用戶隱私實(shí)時(shí)數(shù)據(jù);
66、基于內(nèi)部排序方法,對(duì)檢索后對(duì)增加數(shù)據(jù)噪音保護(hù)隱私有價(jià)值的用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行排序;
67、確定出具有排列次序的用戶隱私實(shí)時(shí)數(shù)據(jù);
68、特征提取單元,用于對(duì)排序后的用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行特征提??;
69、獲取排序后具有排列次序的用戶隱私實(shí)時(shí)數(shù)據(jù);
70、對(duì)排序后具有排列次序的用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行特征提??;
71、確定出用戶隱私特征數(shù)據(jù)。
72、優(yōu)選的,所述加噪保護(hù)模塊包括:
73、數(shù)據(jù)拆分單元,用于對(duì)用戶隱私特征數(shù)據(jù)進(jìn)行拆分;
74、獲取用戶隱私特征數(shù)據(jù);
75、對(duì)用戶隱私特征數(shù)據(jù)進(jìn)行深入挖掘及相關(guān)分析;
76、確定用戶隱私特征數(shù)據(jù)類型;
77、基于用戶隱私特征數(shù)據(jù)類型,對(duì)用戶隱私特征數(shù)據(jù)進(jìn)行拆分;
78、確定出多個(gè)用戶隱私特征子集;
79、噪音增加單元,用于在拆分后的用戶隱私特征數(shù)據(jù)中增加數(shù)據(jù)噪音;
80、獲取拆分后的多個(gè)用戶隱私特征子集;
81、采用隨機(jī)數(shù)生成器生成數(shù)據(jù)噪音;
82、將生成的數(shù)據(jù)噪音增加至多個(gè)用戶隱私特征子集中;
83、確定出多個(gè)不能被直接識(shí)別的用戶隱私特征子集。
84、優(yōu)選的,所述存儲(chǔ)管控模塊包括:
85、安全聚合單元,用于對(duì)噪音增加后的多個(gè)用戶隱私特征子集進(jìn)行聚合;
86、獲取多個(gè)不能被直接識(shí)別的用戶隱私特征子集;
87、對(duì)多個(gè)不能被直接識(shí)別的用戶隱私特征子集進(jìn)行安全聚合;
88、使多個(gè)不能被直接識(shí)別的用戶隱私特征子集進(jìn)行重新組合;
89、確定出基于增加數(shù)據(jù)噪音的用戶隱私保護(hù)聚合數(shù)據(jù);
90、加密存儲(chǔ)單元,用于對(duì)用戶隱私保護(hù)聚合數(shù)據(jù)進(jìn)行加密存儲(chǔ);
91、獲取基于增加數(shù)據(jù)噪音的用戶隱私保護(hù)聚合數(shù)據(jù);
92、對(duì)用戶隱私保護(hù)聚合數(shù)據(jù)進(jìn)行加密處理;
93、確定出加密后的用戶隱私保護(hù)聚合數(shù)據(jù);
94、且對(duì)加密后的用戶隱私保護(hù)聚合數(shù)據(jù)進(jìn)行安全存儲(chǔ);
95、數(shù)據(jù)監(jiān)控單元,用于對(duì)安全存儲(chǔ)的用戶隱私保護(hù)聚合數(shù)據(jù)進(jìn)行監(jiān)控;
96、對(duì)安全存儲(chǔ)的用戶隱私保護(hù)聚合數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)測(cè);
97、確定出用戶隱私保護(hù)聚合數(shù)據(jù)監(jiān)測(cè)結(jié)果;
98、對(duì)用戶隱私保護(hù)聚合數(shù)據(jù)監(jiān)測(cè)結(jié)果進(jìn)行深入挖掘及相關(guān)分析;
99、確定出用戶隱私保護(hù)聚合數(shù)據(jù)智能化管控方案;
100、基于用戶隱私保護(hù)聚合數(shù)據(jù)智能化管控方案對(duì)用戶隱私保護(hù)聚合數(shù)據(jù)進(jìn)行智能化管控。
101、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
102、本發(fā)明通過(guò)實(shí)時(shí)采集用戶身份數(shù)據(jù)、用戶行為數(shù)據(jù)及用戶偏好數(shù)據(jù),確定用戶隱私實(shí)時(shí)數(shù)據(jù),通過(guò)對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行無(wú)線傳輸,可便于對(duì)用戶隱私實(shí)時(shí)數(shù)據(jù)進(jìn)行處理,確定用戶隱私特征數(shù)據(jù),通過(guò)對(duì)用戶隱私特征數(shù)據(jù)進(jìn)行拆分及增加數(shù)據(jù)噪音,可確定多個(gè)不能被直接識(shí)別的用戶隱私特征子集,通過(guò)對(duì)噪音增加后的多個(gè)用戶隱私特征子集進(jìn)行安全聚合,可確定基于增加數(shù)據(jù)噪音的用戶隱私保護(hù)聚合數(shù)據(jù),通過(guò)對(duì)用戶隱私保護(hù)聚合數(shù)據(jù)加密存儲(chǔ)及數(shù)據(jù)監(jiān)控,可使用戶隱私保護(hù)聚合數(shù)據(jù)安全,可基于增加數(shù)據(jù)噪音來(lái)保護(hù)隱私,避免用戶隱私泄露,可提升用戶隱私保護(hù)效果及安全性。