亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法與流程

文檔序號(hào):11388753閱讀:352來(lái)源:國(guó)知局
一種5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法與流程

本發(fā)明涉及信息安全技術(shù)領(lǐng)域,特別是指一種5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法。



背景技術(shù):

隨著機(jī)器學(xué)習(xí)的出現(xiàn)與不斷完善,使得我們有機(jī)會(huì)從海量數(shù)據(jù)集中提取潛在有用的信息和規(guī)律,彰顯數(shù)據(jù)背后的真實(shí)意義。比如機(jī)器學(xué)習(xí)在醫(yī)學(xué)方面用來(lái)做臨床診斷決策支持系統(tǒng),幫助分析醫(yī)學(xué)圖像;在金融行業(yè),銀行用機(jī)器學(xué)習(xí)來(lái)組織運(yùn)作,金融投資和資產(chǎn)管理;機(jī)器學(xué)習(xí)與人工智能相結(jié)合,生產(chǎn)可以自動(dòng)學(xué)習(xí)的機(jī)器人幫助人們工作。

第五代(5g)移動(dòng)通信技術(shù)的提出吸引了大眾的注意力,隨后多個(gè)國(guó)家加速了對(duì)5g網(wǎng)絡(luò)技術(shù)的研究,5g是一種全新的技術(shù),5g是特指?jìng)鬏斔俾蔬_(dá)到10gb/s的新一代移動(dòng)通信技術(shù),相比于4g技術(shù),5g網(wǎng)絡(luò)技術(shù)有更多的創(chuàng)新,4g是對(duì)3g網(wǎng)絡(luò)技術(shù)的擴(kuò)展,提高了網(wǎng)絡(luò)帶寬的利用率,增強(qiáng)了網(wǎng)絡(luò)傳輸速率,4g網(wǎng)絡(luò)是以通信設(shè)備為核心的格局,5g是以功能為核心的網(wǎng)絡(luò),并結(jié)合了網(wǎng)絡(luò)功能虛擬化、定義網(wǎng)絡(luò)等關(guān)鍵技術(shù),體現(xiàn)出了高靈活性和高動(dòng)態(tài)擴(kuò)展等特性。

綜上分析,如何在5g通信標(biāo)準(zhǔn)下還能夠在各個(gè)站點(diǎn)(例如,客戶端)之間通過數(shù)據(jù)共享的方式得到有效的機(jī)器學(xué)習(xí)結(jié)果,已成為當(dāng)前的熱門研究方向之一,但是,在各個(gè)站點(diǎn)協(xié)同工作過程中,沒有保護(hù)原始數(shù)據(jù)隱私及保證數(shù)據(jù)在傳輸過程中的安全。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明要解決的技術(shù)問題是提供一種5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法,以解決現(xiàn)有技術(shù)所存在的沒有保護(hù)原始數(shù)據(jù)隱私及保證數(shù)據(jù)在傳輸過程中的安全的問題。

為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供一種5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法,包括:

s1,在計(jì)算器端,利用同態(tài)加密算法生成公鑰和私鑰,并將私鑰發(fā)送到服務(wù)器端保存,同時(shí)將公鑰發(fā)布給各個(gè)客戶端,每個(gè)客戶端包括從原始數(shù)據(jù)中選取的樣本集和服務(wù)器端中發(fā)送至客戶端的多個(gè)屬性;

s2,在各個(gè)客戶端,利用接收到的公鑰對(duì)各屬性的局部信息增益進(jìn)行同態(tài)加密,并將加密后的局部信息增益發(fā)送至計(jì)算器端,其中,各屬性的局部信息增益由相應(yīng)客戶端樣本集中的數(shù)據(jù)確定;

s3,計(jì)算器端將接收到的各個(gè)客戶端發(fā)送的加密后的局部信息增益進(jìn)行求和,得到全局信息增益,并將所述全局信息增益發(fā)送至服務(wù)器端;

s4,服務(wù)器端利用接收到私鑰對(duì)所述全局信息增益進(jìn)行解密,獲取解密結(jié)果中的最大值,所述最大值對(duì)應(yīng)的屬性為最佳分裂屬性,將所述最佳分裂屬性發(fā)送至各個(gè)客戶端;

s5,各個(gè)客戶端根據(jù)接收到的最佳分裂屬性進(jìn)行決策樹的分裂,直至完成一顆決策樹的構(gòu)建。

進(jìn)一步地,所述原始數(shù)據(jù)通過hash取模的方式水平分布在各個(gè)客戶端。

進(jìn)一步地,所述利用同態(tài)加密算法生成公鑰和私鑰包括:

利用paillier公鑰同態(tài)加密體制,生成公鑰和私鑰。

進(jìn)一步地,所述在各個(gè)客戶端,利用接收到的公鑰對(duì)各屬性的局部信息增益進(jìn)行同態(tài)加密,并將加密后的局部信息增益發(fā)送至計(jì)算器端包括:

s21,在第一客戶端,分別計(jì)算各屬性所產(chǎn)生的局部信息增益ta={ta1,ta2,...,tam},其中,m表示第一客戶端屬性的數(shù)目;

s22,利用接收到的公鑰對(duì)各屬性所產(chǎn)生的局部信息增益ta進(jìn)行同態(tài)加密,得到加密后的局部信息增益ta'={ta1',ta2',...,tam'};

s23,重復(fù)執(zhí)行s21、s22,得到各個(gè)客戶端對(duì)應(yīng)的加密后的局部信息增益ta',tb',…,tn',其中,n表示客戶端的數(shù)目;

s24,各個(gè)客戶端將加密后的局部信息增益ta',tb',…,tn'發(fā)送至計(jì)算器端。

進(jìn)一步地,所述計(jì)算器端將接收到的各個(gè)客戶端發(fā)送的加密后的局部信息增益進(jìn)行求和,得到全局信息增益,并將所述全局信息增益發(fā)送至服務(wù)器端包括:

計(jì)算器端接收各個(gè)客戶端發(fā)送的加密后的局部信息增益ta',tb',…,tn';

對(duì)加密后的局部信息增益ta',tb',…,tn'中各個(gè)元素進(jìn)行統(tǒng)計(jì)之和,得到全局信息增益t'={t1',t2',…,tm'};

將得到的所述全局信息增益t'={t1',t2',…,tm'}發(fā)送至服務(wù)器端;

其中,m表示每個(gè)客戶端屬性的數(shù)目,n表示客戶端的數(shù)目。

進(jìn)一步地,所述服務(wù)器端利用接收到私鑰對(duì)所述全局信息增益進(jìn)行解密,獲取解密結(jié)果中的最大值,所述最大值對(duì)應(yīng)的屬性為最佳分裂屬性,將所述最佳分裂屬性發(fā)送至各個(gè)客戶端包括:

通過私鑰對(duì)全局信息增益t'={t1',t2',…,tm'}進(jìn)行解密,得到明文t={t1,t2,…,tm},其中,明文中的元素t1、t2、…、tm為各個(gè)屬性所產(chǎn)生的全局信息增益;

對(duì)明文中的元素t1、t2、…、tm進(jìn)行排序,取出最大值,所述最大值對(duì)應(yīng)的屬性為最佳分裂屬性;

將所述最佳分裂屬性發(fā)送至各個(gè)客戶端。

進(jìn)一步地,在各個(gè)客戶端根據(jù)接收到的最佳分裂屬性進(jìn)行決策樹的分裂,直至完成一顆決策樹的構(gòu)建之后,所述方法還包括:

在各個(gè)客戶端各生成一棵決策樹后,通過隨機(jī)抽樣bagging思想從原始數(shù)據(jù)中重新選擇樣本集,并通過特征子空間思想重新選擇屬性;

根據(jù)重新選擇的樣本集和屬性,重復(fù)執(zhí)行s1-s5進(jìn)行另外一棵決策樹的構(gòu)建,直到生成k棵決策樹,其中,k大于1。

進(jìn)一步地,所述通過特征子空間思想重新選擇屬性包括:

服務(wù)器端隨機(jī)選取m個(gè)屬性傳回各個(gè)客戶端,作為下一次決策樹分裂所需要的屬性,其中,m小于m,m為服務(wù)器端屬性總數(shù)。

進(jìn)一步地,m=[(log2m)+1]。

進(jìn)一步地,在生成k棵決策樹后,所述方法還包括:

輸入待分類樣本,通過生成的k棵決策樹分別預(yù)測(cè)所述待分類樣本的類別;

根據(jù)k棵決策樹分別預(yù)測(cè)的所述待分類樣本的類別,利用投票表決法,確定待分類樣本最終所屬的類別。

本發(fā)明的上述技術(shù)方案的有益效果如下:

上述方案中,在各個(gè)客戶端,利用接收到的公鑰對(duì)樣本集中數(shù)據(jù)的各個(gè)屬性的局部信息增益進(jìn)行同態(tài)加密,基于同態(tài)加密算法的同態(tài)特性,在密文情況下,計(jì)算器端能夠?qū)ν瑧B(tài)加密后得到的局部信息增益進(jìn)行求和計(jì)算,得到全局信息增益,服務(wù)器端利用私鑰對(duì)全局信息增益進(jìn)行解密,確定最佳分裂屬性;客戶端根據(jù)確定的最佳分裂屬性進(jìn)行決策樹的分裂,完成決策樹的構(gòu)建;這樣,通過對(duì)各個(gè)屬性的局部信息增益進(jìn)行同態(tài)加密,使得各個(gè)客戶端得到有效的機(jī)器學(xué)習(xí)結(jié)果的同時(shí),又不泄露客戶端用戶的原始數(shù)據(jù)信息,同時(shí)還能保證傳輸過程中數(shù)據(jù)的安全性。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例提供的5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的流程示意圖;

圖2為本發(fā)明實(shí)施例提供的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的模型示意圖;

圖3為本發(fā)明實(shí)施例提供的5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的詳細(xì)流程示意圖;

圖4為本發(fā)明實(shí)施例提供的多棵決策樹決策流程示意圖。

具體實(shí)施方式

為使本發(fā)明要解決的技術(shù)問題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例進(jìn)行詳細(xì)描述。

本發(fā)明針對(duì)現(xiàn)有的沒有保護(hù)原始數(shù)據(jù)隱私及保證數(shù)據(jù)在傳輸過程中的安全的問題,提供一種5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法。

參看圖1所示,本發(fā)明實(shí)施例提供的5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法,包括:

s1,在計(jì)算器端,利用同態(tài)加密算法生成公鑰和私鑰,并將私鑰發(fā)送到服務(wù)器端保存,同時(shí)將公鑰發(fā)布給各個(gè)客戶端,每個(gè)客戶端包括從原始數(shù)據(jù)中選取的樣本集和服務(wù)器端中發(fā)送至客戶端的多個(gè)屬性;

s2,在各個(gè)客戶端,利用接收到的公鑰對(duì)各屬性的局部信息增益進(jìn)行同態(tài)加密,并將加密后的局部信息增益發(fā)送至計(jì)算器端,其中,各屬性的局部信息增益由相應(yīng)客戶端樣本集中的數(shù)據(jù)確定;

s3,計(jì)算器端將接收到的各個(gè)客戶端發(fā)送的加密后的局部信息增益進(jìn)行求和,得到全局信息增益,并將所述全局信息增益發(fā)送至服務(wù)器端;

s4,服務(wù)器端利用接收到私鑰對(duì)所述全局信息增益進(jìn)行解密,獲取解密結(jié)果中的最大值,所述最大值對(duì)應(yīng)的屬性為最佳分裂屬性,將所述最佳分裂屬性發(fā)送至各個(gè)客戶端;

s5,各個(gè)客戶端根據(jù)接收到的最佳分裂屬性進(jìn)行決策樹的分裂,直至完成一顆決策樹的構(gòu)建。

本發(fā)明實(shí)施例所述的5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法,在各個(gè)客戶端,利用接收到的公鑰對(duì)樣本集中數(shù)據(jù)的各個(gè)屬性的局部信息增益進(jìn)行同態(tài)加密,基于同態(tài)加密算法的同態(tài)特性,在密文情況下,計(jì)算器端能夠?qū)ν瑧B(tài)加密后得到的局部信息增益進(jìn)行求和計(jì)算,得到全局信息增益,服務(wù)器端利用私鑰對(duì)全局信息增益進(jìn)行解密,確定最佳分裂屬性;客戶端根據(jù)確定的最佳分裂屬性進(jìn)行決策樹的分裂,完成決策樹的構(gòu)建;這樣,通過對(duì)各個(gè)屬性的局部信息增益進(jìn)行同態(tài)加密,使得各個(gè)客戶端得到有效的機(jī)器學(xué)習(xí)結(jié)果的同時(shí),又不泄露客戶端用戶的原始數(shù)據(jù)信息,同時(shí)還能保證傳輸過程中數(shù)據(jù)的安全性。

為了實(shí)現(xiàn)本實(shí)施例所述的5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法,需要一套相應(yīng)的系統(tǒng),如圖2所示,所述系統(tǒng)包括:客戶端、計(jì)算器端、服務(wù)器端;各客戶端根據(jù)各自樣本集中的數(shù)據(jù),計(jì)算各個(gè)屬性所產(chǎn)生的局部信息增益,并對(duì)計(jì)算得到的局部信息增益進(jìn)行同態(tài)加密,將同態(tài)加密得到的局部信息增益提交到計(jì)算器端;計(jì)算器端負(fù)責(zé)對(duì)各個(gè)客戶端加密后的局部信息增益進(jìn)行匯總計(jì)算,得到全局信息增益并將得到的全局信息增益發(fā)送至服務(wù)器端;服務(wù)器端對(duì)接收到的全局信息增益進(jìn)行解密分析,選取最佳分裂屬性,將選取的最佳分裂屬性傳遞給各個(gè)客戶端,各個(gè)客戶端根據(jù)接收到的最佳分裂屬性進(jìn)行決策樹的分裂,直至完成一顆決策樹的構(gòu)建。

在前述5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的具體實(shí)施方式中,進(jìn)一步地,所述原始數(shù)據(jù)通過hash取模的方式水平分布在各個(gè)客戶端。

如圖3所示,原始數(shù)據(jù)可以以水平分布的形式存儲(chǔ)在各個(gè)客戶端(db1,db2,…,dbn)中,其中,n表示客戶端的數(shù)目;優(yōu)選地,所述原始數(shù)據(jù)通過hash取模的方式水平分布在各個(gè)客戶端。

在前述5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的具體實(shí)施方式中,進(jìn)一步地,所述利用同態(tài)加密算法生成公鑰和私鑰包括:

利用paillier公鑰同態(tài)加密體制,生成公鑰和私鑰。

本實(shí)施例中,在計(jì)算器端,利用paillier公鑰同態(tài)加密體制,通過隨機(jī)數(shù)發(fā)送器以及隨機(jī)選取的兩個(gè)大素?cái)?shù)p,q,生成公鑰pk和對(duì)應(yīng)的私鑰sk,其中,大素?cái)?shù)是指超過預(yù)定閾值的素?cái)?shù);并將私鑰sk發(fā)送至服務(wù)器端保存,將公鑰pk發(fā)布給各個(gè)客戶端執(zhí)行同態(tài)加密操作。

在前述5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的具體實(shí)施方式中,進(jìn)一步地,所述在各個(gè)客戶端,利用接收到的公鑰對(duì)各屬性的局部信息增益進(jìn)行同態(tài)加密,并將加密后的局部信息增益發(fā)送至計(jì)算器端包括:

s21,在第一客戶端,分別計(jì)算各屬性所產(chǎn)生的局部信息增益ta={ta1,ta2,...,tam},其中,m表示第一客戶端屬性的數(shù)目;

s22,利用接收到的公鑰對(duì)各屬性所產(chǎn)生的局部信息增益ta進(jìn)行同態(tài)加密,得到加密后的局部信息增益ta'={ta1',ta2',...,tam'};

s23,重復(fù)執(zhí)行s21、s22,得到各個(gè)客戶端對(duì)應(yīng)的加密后的局部信息增益ta',tb',…,tn',其中,n表示客戶端的數(shù)目;

s24,各個(gè)客戶端將加密后的局部信息增益ta',tb',…,tn'發(fā)送至計(jì)算器端。

本實(shí)施例中,客戶端以db1為例,hek代表對(duì)db1中的樣本集數(shù)據(jù)經(jīng)過k次隨機(jī)化后分別經(jīng)過同態(tài)加密過后生成的局部數(shù)據(jù),這里局部數(shù)據(jù)是指客戶端db1的屬性產(chǎn)生的局部信息增益,k=1,2,…,k,k表示決策樹的數(shù)目。

本實(shí)施例中的客戶端為各個(gè)樣本集擁有方,各個(gè)客戶端中的樣本集記作rsa,rsb,...,rsn,其中,db1中的樣本集為rsa,db2中的樣本集為rsb,以此類推;客戶端具體執(zhí)行步驟包括:首先輸入本地樣本集rsa,rsb,...,rsn,然后計(jì)算各屬性產(chǎn)生的局部信息增益;以樣本集rsa為例,對(duì)樣本集rsa經(jīng)過有放回抽取形成一個(gè)與原始樣本集相同大小的新的樣本集rsa';保存經(jīng)服務(wù)器端隨機(jī)選取的m個(gè)屬性作為一個(gè)屬性子集,其中,m=[(log2m)+1],m為服務(wù)器端屬性總數(shù);根據(jù)新的樣本集rsa',計(jì)算m個(gè)屬性所產(chǎn)生的局部信息增益ta={ta1,ta2,...,tam};利用paillier同態(tài)加密體制中給定的公鑰pk對(duì)ta中的各個(gè)元素進(jìn)行同態(tài)加密,得到加密后的局部信息增益ta'={ta1',ta2',...,tam'};按照上述方法得到n個(gè)客戶端加密后的局部信息增益ta',tb',…,tn',n個(gè)客戶端將加密后的局部信息增益?zhèn)鬟f給計(jì)算器端進(jìn)行匯總計(jì)算,其中,db1對(duì)應(yīng)的加密后的局部信息增益為ta',db2對(duì)應(yīng)的加密后的局部信息增益為tb',以此類推。

在前述5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的具體實(shí)施方式中,進(jìn)一步地,所述計(jì)算器端將接收到的各個(gè)客戶端發(fā)送的加密后的局部信息增益進(jìn)行求和,得到全局信息增益,并將所述全局信息增益發(fā)送至服務(wù)器端包括:

計(jì)算器端接收各個(gè)客戶端發(fā)送的加密后的局部信息增益ta',tb',…,tn';

對(duì)加密后的局部信息增益ta',tb',…,tn'中各個(gè)元素進(jìn)行統(tǒng)計(jì)之和,得到全局信息增益t'={t1',t2',…,tm'};

將得到的所述全局信息增益t'={t1',t2',…,tm'}發(fā)送至服務(wù)器端;

其中,m表示每個(gè)客戶端屬性的數(shù)目,n表示客戶端的數(shù)目。

本實(shí)施例中,計(jì)算器端首先接收n個(gè)客戶端經(jīng)過同態(tài)加密得到的局部信息增益,然后求各局部信息增益統(tǒng)計(jì)之和,將n個(gè)客戶端的局部信息增益轉(zhuǎn)換為全局信息增益;具體步驟包括:計(jì)算器端首先接收n個(gè)客戶端經(jīng)過同態(tài)加密得到的局部信息增益ta',tb',…,tn';利用同態(tài)加密可以直接對(duì)密文進(jìn)行計(jì)算的特性,計(jì)算同態(tài)加密后的局部信息增益ta',tb',…,tn'中各個(gè)元素的統(tǒng)計(jì)之和,得到全局信息增益t'={t1',t2',…,tm'},其中,m表示每個(gè)客戶端屬性的數(shù)目,tk'=tak'+tbk'+...+tnk',tak'表示客戶端db1中第k屬性對(duì)應(yīng)的局部信息增益,tbk'表示客戶端db2中第k屬性對(duì)應(yīng)的局部信息增益,以此類推,tnk'表示表示客戶端dbndb1中第k屬性對(duì)應(yīng)的局部信息增益;基于同態(tài)加密可以直接對(duì)密文進(jìn)行操作的特性,對(duì)加密前后的數(shù)據(jù)運(yùn)算能得到一致的結(jié)果,將計(jì)算得到的t'={t1',t2',…,tm'}傳輸給服務(wù)器端,由服務(wù)器端對(duì)t'={t1',t2',…,tm'}進(jìn)行解密分析。

本實(shí)施例中,計(jì)算器端根據(jù)公式tk'=tak'+tbk'+...+tnk'對(duì)同態(tài)加密得到的ta',tb',…,tn'進(jìn)行統(tǒng)計(jì)計(jì)算,計(jì)算器端對(duì)各個(gè)客戶端的原始數(shù)據(jù)信息、屬性信息及同態(tài)加密結(jié)果所代表的含義都一無(wú)所知,在保證客戶端用戶隱私的前提下,還能夠有效保證數(shù)據(jù)傳輸過程中的隱私信息。

在前述5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的具體實(shí)施方式中,進(jìn)一步地,所述服務(wù)器端利用接收到私鑰對(duì)所述全局信息增益進(jìn)行解密,獲取解密結(jié)果中的最大值,所述最大值對(duì)應(yīng)的屬性為最佳分裂屬性,將所述最佳分裂屬性發(fā)送至各個(gè)客戶端包括:

通過私鑰對(duì)全局信息增益t'={t1',t2',…,tm'}進(jìn)行解密,得到明文t={t1,t2,…,tm},其中,明文中的元素t1、t2、…、tm為各個(gè)屬性所產(chǎn)生的全局信息增益;

對(duì)明文中的元素t1、t2、…、tm進(jìn)行排序,取出最大值,所述最大值對(duì)應(yīng)的屬性為最佳分裂屬性;

將所述最佳分裂屬性發(fā)送至各個(gè)客戶端。

本實(shí)施例中,決策樹的生成可以采用id3算法,id3采取具有最大信息增益的屬性作為最佳分裂屬性。

本實(shí)施例中,服務(wù)器端為半可信的第三方,服務(wù)器端負(fù)責(zé)數(shù)據(jù)結(jié)果對(duì)比整理,確定最佳分裂屬性,并將確定的最佳分裂屬性傳回給各個(gè)客戶端,各個(gè)客戶端根據(jù)接收到的最佳分裂屬性進(jìn)行決策樹的分裂,直到完成一顆決策樹的構(gòu)建完成為止。服務(wù)器端只知道樣本集中屬性信息和經(jīng)計(jì)算器端傳過來(lái)的全局信息增益,對(duì)各客戶端中的原始數(shù)據(jù)信息一無(wú)所知。

本實(shí)施例中,服務(wù)器端確定最佳分裂屬性的步驟可以包括:首先接收由計(jì)算器端傳來(lái)的全局信息增益t'={t1',t2',…,tm'},通過私鑰sk對(duì)全局信息增益t'={t1',t2',…,tm'}進(jìn)行解密,得到明文t={t1,t2,…,tm},明文里面的元素即為各個(gè)屬性所產(chǎn)生的全局信息增益,對(duì)明文t={t1,t2,…,tm}里面元素進(jìn)行排序(例如,升序排序,)取出最大值選取明文t={t1,t2,…,tm}里面的最大值,該最大值對(duì)應(yīng)的屬性即為具有最大信息增益的屬性,具有最大信息增益的屬性為最佳分裂屬性。

在前述5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的具體實(shí)施方式中,進(jìn)一步地,在各個(gè)客戶端根據(jù)接收到的最佳分裂屬性進(jìn)行決策樹的分裂,直至完成一顆決策樹的構(gòu)建之后,所述方法還包括:

在各個(gè)客戶端各生成一棵決策樹后,通過隨機(jī)抽樣bagging思想從原始數(shù)據(jù)中重新選擇樣本集,并通過特征子空間思想重新選擇屬性;

根據(jù)重新選擇的樣本集和屬性,重復(fù)執(zhí)行s1-s5進(jìn)行另外一棵決策樹的構(gòu)建,直到生成k棵決策樹,其中,k大于1。

本實(shí)施例中,為了提高該分布式環(huán)境下的決策樹分類準(zhǔn)確率,采用隨機(jī)森林思想生成多棵決策樹共同預(yù)測(cè)最終的分類結(jié)果,假設(shè)隨機(jī)森林由k棵決策樹{h(x,θk),k=1,2,…,k}組成,其中,k為大于1的預(yù)設(shè)值,x代表原始樣本集中的數(shù)據(jù),{θk,k=1,2,…,k}是一個(gè)隨機(jī)變量序列,該隨機(jī)變量序列由隨機(jī)森林的兩大思想決定:特征子空間思想以及bagging思想;也就是說(shuō),當(dāng)輸入待分類的樣本時(shí),決策結(jié)果由這k個(gè)決策樹的分類結(jié)果共同決定,為了降低生成的每一棵決策樹之間的關(guān)聯(lián)性,提高分類準(zhǔn)確率,生成每一棵決策樹時(shí),采用特征子空間思想以及bagging思想。

本實(shí)施例中,特征子空間思想具體體現(xiàn)為:當(dāng)隨機(jī)森林中的每個(gè)決策樹生成時(shí),并不使用全部的屬性,而是從全部屬性中隨機(jī)等概率抽取一個(gè)屬性子集。為了降低每個(gè)決策樹之間的關(guān)聯(lián)性,在服務(wù)器端,通常抽取[(log2m)+1]個(gè)屬性作為屬性子集,其中,m為服務(wù)器端屬性總數(shù)。決策樹的分裂結(jié)點(diǎn)從這些屬性子集中選取,通過特征子空間思想,可以有效降低計(jì)算所需的特征維度,進(jìn)而降低每棵決策樹生成時(shí)的時(shí)間復(fù)雜度。

本實(shí)施例中,bagging思想表現(xiàn)為:從原始樣本集x中有放回的抽取k個(gè)與原始樣本集相同大小的樣本集{θk,k=1,2,…,k},為每一個(gè)抽取出來(lái)的樣本集θk分別生成一個(gè)決策樹。通過bagging思想的隨機(jī)選取策略,有效的降低了數(shù)據(jù)源中因數(shù)據(jù)分布不均勻造成決策樹分類準(zhǔn)確率降低的問題。

本實(shí)施例中,綜上,在各個(gè)客戶端各生成一棵決策樹后,通過隨機(jī)抽樣bagging思想從原始數(shù)據(jù)中重新選擇樣本集,并通過特征子空間思想重新選取m=[(log2m)+1]個(gè)屬性傳回給各個(gè)客戶端,作為下一次決策樹分裂所需要的屬性子集;根據(jù)重新選擇的樣本集和屬性,重復(fù)執(zhí)行s1-s5進(jìn)行另外一棵決策樹的構(gòu)建,直到生成k棵決策樹。

在前述5g通信標(biāo)準(zhǔn)下的分布式隱私保護(hù)機(jī)器學(xué)習(xí)方法的具體實(shí)施方式中,進(jìn)一步地,在生成k棵決策樹后,所述方法還包括:

輸入待分類樣本,通過生成的k棵決策樹分別預(yù)測(cè)所述待分類樣本的類別;

根據(jù)k棵決策樹分別預(yù)測(cè)的所述待分類樣本的類別,利用投票表決法,確定待分類樣本最終所屬的類別。

如圖4所示,生成多棵決策樹后,為了提高分類準(zhǔn)確率,通過生成的k棵決策樹分別預(yù)測(cè)所述待分類樣本的類別,根據(jù)k棵決策樹分別預(yù)測(cè)的所述待分類樣本的類別,利用投票表決法,確定待分類樣本最終所屬的類別,從而通過同態(tài)加密、決策樹分類以及隨機(jī)森林思想,在保證傳輸過程中客戶端用戶隱私的同時(shí),實(shí)現(xiàn)在數(shù)據(jù)分布式環(huán)境中隱私保護(hù)的機(jī)器學(xué)習(xí)。

需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。

以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明所述原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1