本技術(shù)涉及計(jì)算機(jī)數(shù)據(jù)處理,尤其涉及一種在線取證方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著云技術(shù)的飛速發(fā)展,云平臺(tái)已成為企業(yè)數(shù)據(jù)存儲(chǔ)、處理與分析的重要基礎(chǔ)設(shè)施。然而,在云環(huán)境下,數(shù)據(jù)孤島與隱私性保護(hù)問(wèn)題日益凸顯,成為制約云進(jìn)一步發(fā)展的關(guān)鍵因素。一方面,數(shù)據(jù)孤島現(xiàn)象普遍存在于不同組織或企業(yè)之間。由于數(shù)據(jù)格式、存儲(chǔ)方式及法律法規(guī)的限制,各組織間的數(shù)據(jù)難以有效共享,導(dǎo)致數(shù)據(jù)資源無(wú)法充分發(fā)揮其潛在價(jià)值。這種數(shù)據(jù)隔離狀態(tài)不僅限制了數(shù)據(jù)驅(qū)動(dòng)的決策能力,還阻礙了創(chuàng)新應(yīng)用的開發(fā)。另一方面,隱私性保護(hù)是云應(yīng)用中不可忽視的重要問(wèn)題。隨著數(shù)據(jù)泄露事件的頻發(fā),用戶對(duì)于數(shù)據(jù)隱私的關(guān)注度不斷提升。如何在保證數(shù)據(jù)共享與利用的同時(shí),確保用戶數(shù)據(jù)的隱私安全,成為云技術(shù)面臨的重要挑戰(zhàn)。在云計(jì)算環(huán)境中,數(shù)據(jù)被分布在多個(gè)虛擬機(jī)和服務(wù)器上,甚至可能跨越不同的地理位置和司法管轄區(qū)域。這種分布式存儲(chǔ)方式使得數(shù)據(jù)的集中取證變得極為困難。云計(jì)算系統(tǒng)中的數(shù)據(jù)是實(shí)時(shí)更新的,包括用戶數(shù)據(jù)、應(yīng)用程序數(shù)據(jù)、系統(tǒng)日志等。這種動(dòng)態(tài)性要求取證技術(shù)必須能夠快速響應(yīng)并捕獲變化中的證據(jù),而傳統(tǒng)的靜態(tài)取證方法無(wú)法滿足這一需求。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)提供一種在線取證方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),用以解決在云環(huán)境下的數(shù)據(jù)孤島與隱私性保護(hù)問(wèn)題,為取證工作提供更為及時(shí)、準(zhǔn)確的線索以及提高云平臺(tái)的整體安全性和穩(wěn)定性。
2、第一方面,本技術(shù)提供一種在線取證方法,包括:
3、在得到各個(gè)目標(biāo)區(qū)域的授權(quán)許可的情況下,在云平臺(tái)中的各個(gè)目標(biāo)區(qū)域布設(shè)至少一個(gè)監(jiān)聽傳感器;其中,各個(gè)目標(biāo)區(qū)域分別對(duì)應(yīng)一個(gè)目標(biāo)終端,所述監(jiān)聽傳感器基于數(shù)據(jù)傳輸加密協(xié)議將監(jiān)聽到的數(shù)據(jù)饋送至目標(biāo)終端;
4、基于目標(biāo)函數(shù)建立聯(lián)邦學(xué)習(xí)模型,將所述聯(lián)邦學(xué)習(xí)模型傳輸至各個(gè)目標(biāo)終端;
5、基于設(shè)定迭代次數(shù)或收斂條件,進(jìn)行聯(lián)邦學(xué)習(xí)模型的迭代訓(xùn)練,直至達(dá)到設(shè)定迭代次數(shù)或收斂條件,得到訓(xùn)練好的聯(lián)邦學(xué)習(xí)模型,每次迭代訓(xùn)練包括:獲取由各個(gè)目標(biāo)終端傳輸?shù)哪P吞荻群湍P蛽p失,并對(duì)各個(gè)目標(biāo)終端傳輸?shù)哪P吞荻群湍P蛽p失進(jìn)行聚合,得到權(quán)重矩陣并分別傳輸至各個(gè)目標(biāo)終端,各個(gè)目標(biāo)終端基于所述權(quán)重矩陣對(duì)所述聯(lián)邦學(xué)習(xí)模型進(jìn)行更新;其中,所述目標(biāo)終端傳輸?shù)哪P吞荻群湍P蛽p失是利用數(shù)據(jù)集對(duì)聯(lián)邦學(xué)習(xí)模型進(jìn)行訓(xùn)練得到,所述數(shù)據(jù)集為所述目標(biāo)終端根據(jù)監(jiān)聽傳感器饋送的數(shù)據(jù)構(gòu)建得到;
6、基于所述訓(xùn)練好的聯(lián)邦學(xué)習(xí)模型,以所述監(jiān)聽傳感器的輸出數(shù)據(jù)作為輸入,對(duì)所述云平臺(tái)行為進(jìn)行實(shí)時(shí)監(jiān)測(cè)和分析,識(shí)別異常行為并生成取證報(bào)告;
7、對(duì)所述取證報(bào)告進(jìn)行哈希校驗(yàn)和數(shù)字簽名,并存儲(chǔ)于區(qū)塊鏈上。
8、進(jìn)一步地,所述數(shù)據(jù)傳輸加密協(xié)議通過(guò)如下公式(1)表示:
9、c?=?e(m,?k)??????????????????????(1)
10、式中,c?代表加密后的數(shù)據(jù);e?代表加密函數(shù);m?代表原始數(shù)據(jù);k?代表加密密鑰。
11、進(jìn)一步地,所述目標(biāo)函數(shù)表示為:
12、(2)
13、式中, y是目標(biāo)變量, x1, x2,…, x n表示不同的特征變量, β0, β1,…, β n表示聯(lián)邦學(xué)習(xí)模型的權(quán)重參數(shù),?表示誤差項(xiàng)。
14、進(jìn)一步地,所述目標(biāo)終端通過(guò)如下方法對(duì)聯(lián)邦學(xué)習(xí)模型進(jìn)行訓(xùn)練得到模型梯度和模型損失:
15、基于監(jiān)聽傳感器獲取云平臺(tái)上實(shí)時(shí)生成的數(shù)據(jù)流,采用流式處理技術(shù)進(jìn)行實(shí)時(shí)清洗,得到數(shù)據(jù)樣本;
16、利用隱私集合交集方案來(lái)實(shí)現(xiàn)所述數(shù)據(jù)樣本與其他目標(biāo)終端的數(shù)據(jù)樣本的對(duì)比,得到數(shù)據(jù)集;
17、利用所述數(shù)據(jù)集對(duì)所述目標(biāo)終端上配置的聯(lián)邦學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到模型梯度和模型損失。
18、進(jìn)一步地,利用所述數(shù)據(jù)集對(duì)所述目標(biāo)終端上配置的聯(lián)邦學(xué)習(xí)模型進(jìn)行訓(xùn)練,通過(guò)如下公式(3)或公式(4)計(jì)算得到模型損失:
19、?????????????????(3)
20、?????????????(4)
21、式中,表示第 i個(gè)目標(biāo)終端的模型損失,表示第 i個(gè)目標(biāo)終端的數(shù)據(jù)集大小,表示第 j個(gè)數(shù)據(jù)樣本的真實(shí)值,表示模型參數(shù),表示第 i個(gè)目標(biāo)終端中第 j個(gè)數(shù)據(jù)樣本,表示模型在參數(shù)下對(duì)的預(yù)測(cè)值,表示正則化參數(shù)。
22、進(jìn)一步地,利用所述數(shù)據(jù)集對(duì)所述目標(biāo)終端上配置的聯(lián)邦學(xué)習(xí)模型進(jìn)行訓(xùn)練,通過(guò)如下公式(5)計(jì)算模型梯度:
23、?????????????(5)
24、式中,表示模型梯度。
25、第二方面,本技術(shù)提供一種在線取證裝置,包括:
26、所述監(jiān)聽傳感器在得到各個(gè)目標(biāo)區(qū)域的授權(quán)許可的情況下,布設(shè)于云平臺(tái)中的各個(gè)目標(biāo)區(qū)域中;
27、一個(gè)所述目標(biāo)終端對(duì)應(yīng)一個(gè)所述目標(biāo)區(qū)域,所述目標(biāo)終端與對(duì)應(yīng)的目標(biāo)區(qū)域中的監(jiān)聽傳感器連接,以基于數(shù)據(jù)傳輸加密協(xié)議從所述監(jiān)聽傳感器中獲取監(jiān)聽到的數(shù)據(jù);
28、所述中心服務(wù)器與所述目標(biāo)終端信號(hào)連接,所述中心服務(wù)器用于基于目標(biāo)函數(shù)建立聯(lián)邦學(xué)習(xí)模型,將所述聯(lián)邦學(xué)習(xí)模型傳輸至各個(gè)目標(biāo)終端;基于設(shè)定迭代次數(shù)或收斂條件,進(jìn)行聯(lián)邦學(xué)習(xí)模型的迭代訓(xùn)練,直至達(dá)到設(shè)定迭代次數(shù)或收斂條件,得到訓(xùn)練好的聯(lián)邦學(xué)習(xí)模型,每次迭代訓(xùn)練包括:獲取由各個(gè)目標(biāo)終端傳輸?shù)哪P吞荻群湍P蛽p失,并對(duì)各個(gè)目標(biāo)終端傳輸?shù)哪P吞荻群湍P蛽p失進(jìn)行聚合,得到權(quán)重矩陣并分別傳輸至各個(gè)目標(biāo)終端;所述目標(biāo)終端基于所述權(quán)重矩陣對(duì)所述聯(lián)邦學(xué)習(xí)模型進(jìn)行更新;其中,所述目標(biāo)終端傳輸?shù)哪P吞荻群湍P蛽p失是利用數(shù)據(jù)集對(duì)聯(lián)邦學(xué)習(xí)模型進(jìn)行訓(xùn)練得到,所述數(shù)據(jù)集為所述目標(biāo)終端根據(jù)監(jiān)聽傳感器饋送的數(shù)據(jù)構(gòu)建得到;
29、所述中心服務(wù)器還用于基于所述訓(xùn)練好的聯(lián)邦學(xué)習(xí)模型,以所述監(jiān)聽傳感器的輸出數(shù)據(jù)作為輸入,對(duì)所述云平臺(tái)行為進(jìn)行實(shí)時(shí)監(jiān)測(cè)和分析,識(shí)別異常行為并生成取證報(bào)告;對(duì)所述取證報(bào)告進(jìn)行哈希校驗(yàn)和數(shù)字簽名,并存儲(chǔ)于區(qū)塊鏈上。
30、第三方面,本技術(shù)提供一種電子設(shè)備,電子設(shè)備包括:處理器、存儲(chǔ)器;所述存儲(chǔ)器用于存儲(chǔ)指令;所述處理器用于執(zhí)行所述存儲(chǔ)器中的指令,使得所述電子設(shè)備執(zhí)行如第一方面所述的方法。
31、第四方面,本技術(shù)提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)執(zhí)行指令,所述計(jì)算機(jī)執(zhí)行指令被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如第一方面所述的方法。
32、第五方面,本技術(shù)提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的方法。
33、本技術(shù)提供的在線取證方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),具有如下有益效果:
34、1)通過(guò)去中心化訓(xùn)練以及數(shù)據(jù)的加密傳輸實(shí)現(xiàn)數(shù)據(jù)的隱私保護(hù):
35、去中心化訓(xùn)練:聯(lián)邦學(xué)習(xí)允許各個(gè)參與方在本地進(jìn)行模型訓(xùn)練,僅將模型參數(shù)(而非原始數(shù)據(jù))上傳至中心服務(wù)器或進(jìn)行點(diǎn)對(duì)點(diǎn)傳輸。這種方式從根本上減少了數(shù)據(jù)泄露的風(fēng)險(xiǎn),保護(hù)了隱私。
36、加密傳輸:在數(shù)據(jù)傳輸過(guò)程中,可以采用加密技術(shù)確保模型參數(shù)的安全性,防止在傳輸過(guò)程中被截獲或篡改。
37、2)通過(guò)聯(lián)邦聚合提高取證效率:
38、云環(huán)境下的聯(lián)邦學(xué)習(xí)可以利用云的分布式資源,實(shí)現(xiàn)大規(guī)模并行訓(xùn)練。各個(gè)參與方可以利用自身的資源獨(dú)立進(jìn)行模型訓(xùn)練,加速模型收斂速度。此外,通過(guò)中心服務(wù)器的聯(lián)邦聚合,各個(gè)參與方可以實(shí)時(shí)獲得最新的模型參數(shù),并快速部署到本地模型上,進(jìn)行新一輪的訓(xùn)練。這種實(shí)時(shí)更新的機(jī)制使得取證過(guò)程更加高效。
39、3)通過(guò)多源數(shù)據(jù)融合以及協(xié)同訓(xùn)練增強(qiáng)取證精度
40、多源數(shù)據(jù)融合:聯(lián)邦學(xué)習(xí)能夠融合來(lái)自不同參與方的多源數(shù)據(jù)(通過(guò)模型參數(shù)間接融合),從而捕捉到更加全面和豐富的信息。在電子取證中,這有助于發(fā)現(xiàn)潛在的異常行為和隱藏的證據(jù)。
41、協(xié)同訓(xùn)練:通過(guò)反復(fù)迭代訓(xùn)練,聯(lián)邦學(xué)習(xí)能夠不斷優(yōu)化模型性能,提高取證分析的準(zhǔn)確性。
42、4)過(guò)減少數(shù)據(jù)傳輸量降低取證成本:
43、減少數(shù)據(jù)傳輸量:相比于傳統(tǒng)的集中式訓(xùn)練方式,聯(lián)邦學(xué)習(xí)減少了數(shù)據(jù)傳輸?shù)男枨?。各個(gè)參與方只需上傳模型參數(shù)而非整個(gè)數(shù)據(jù)集,從而降低了數(shù)據(jù)傳輸成本和存儲(chǔ)成本。
44、5)適應(yīng)性強(qiáng):
45、支持異構(gòu)數(shù)據(jù):聯(lián)邦學(xué)習(xí)能夠處理來(lái)自不同企業(yè)和不同應(yīng)用場(chǎng)景的異構(gòu)數(shù)據(jù)。在電子取證中,這有助于應(yīng)對(duì)復(fù)雜多變的取證場(chǎng)景和數(shù)據(jù)類型。
46、動(dòng)態(tài)參與:企業(yè)可以根據(jù)自身需求和實(shí)際情況選擇參與或退出聯(lián)邦學(xué)習(xí)過(guò)程。這種靈活性使得聯(lián)邦學(xué)習(xí)在云環(huán)境下更加適應(yīng)動(dòng)態(tài)變化的取證需求。