亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于隱私保護(hù)的大模型微調(diào)的方法及裝置與流程

文檔序號:40453415發(fā)布日期:2024-12-27 09:18閱讀:9來源:國知局
基于隱私保護(hù)的大模型微調(diào)的方法及裝置與流程

本說明書一個(gè)或多個(gè)實(shí)施例涉及大模型領(lǐng)域,特別涉及一種基于隱私保護(hù)的大模型微調(diào)的方法及裝置。


背景技術(shù):

1、在人工智能領(lǐng)域,大基座模型指的是規(guī)模龐大,被設(shè)計(jì)為可擴(kuò)展、可適應(yīng)多種應(yīng)用場景的基礎(chǔ)性模型。這類模型可以視為ai技術(shù)棧的基石,其他更專門化的模型或應(yīng)用可以通過在大基座模型的基礎(chǔ)上進(jìn)行微調(diào)(fine-tuning)來快速獲得針對特定領(lǐng)域的高性能,而無需從頭開始訓(xùn)練大規(guī)模模型。大基座模型的一個(gè)重要優(yōu)勢在于它們能夠促進(jìn)資源和計(jì)算的高效復(fù)用,降低下游任務(wù)的成本與難度。目前來說,需要一種對大基座模型進(jìn)行微調(diào)的方案。


技術(shù)實(shí)現(xiàn)思路

1、本說明書一個(gè)或多個(gè)實(shí)施例提供一種基于隱私保護(hù)的大模型微調(diào)的方法及裝置。

2、根據(jù)第一方面,提供一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法包括:

3、第一平臺采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型,得到適用于所述第一領(lǐng)域的第二小模型,并將所述第二小模型發(fā)送給第二平臺;

4、所述第二平臺以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域的大模型。

5、根據(jù)第二方面,提供一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法由第一平臺執(zhí)行,所述方法包括:

6、獲取第一小模型;

7、采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型,得到適用于所述第一領(lǐng)域的第二小模型;

8、將所述第二小模型發(fā)送給第二平臺,使所述第二平臺以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域的大模型。

9、根據(jù)第三方面,提供一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法由第二平臺執(zhí)行,所述方法包括:

10、接收第一平臺發(fā)送的適用于第一領(lǐng)域的第二小模型;所述第二小模型由所述第一平臺采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型而得到;

11、以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),得到適用于所述第一領(lǐng)域的大模型。

12、根據(jù)第四方面,提供一種基于隱私保護(hù)的大模型微調(diào)的裝置,所述裝置部署于第一平臺,所述裝置包括:

13、獲取模塊,用于獲取第一小模型;

14、訓(xùn)練模塊,用于采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型,得到適用于所述第一領(lǐng)域的第二小模型;

15、發(fā)送模塊,用于將所述第二小模型發(fā)送給第二平臺,使所述第二平臺以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域的大模型。

16、根據(jù)第五方面,提供一種基于隱私保護(hù)的大模型微調(diào)的裝置,所述裝置部署于第二平臺,所述裝置包括:

17、第一接收模塊,用于接收第一平臺發(fā)送的適用于第一領(lǐng)域的第二小模型;所述第二小模型由所述第一平臺采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型而得到;

18、蒸餾模塊,用于以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),得到適用于所述第一領(lǐng)域的大模型。

19、根據(jù)第六方面,提供一種計(jì)算機(jī)可讀存儲介質(zhì),所述存儲介質(zhì)存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面或第二方面或第三方面中任一項(xiàng)所述的方法。

20、根據(jù)第七方面,提供一種計(jì)算設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)上述第一方面或第二方面或第三方面中任一項(xiàng)所述的方法。

21、本說明書的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:

22、本說明書的實(shí)施例提供的基于隱私保護(hù)的大模型微調(diào)的方法和裝置,通過由第一設(shè)備采用差分隱私的方式,利用本地持有的、包括特定領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型,得到適用于特定領(lǐng)域的第二小模型,并將第二小模型發(fā)送給第二設(shè)備,由第二設(shè)備以第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),以得到適用于特定領(lǐng)域的大模型。從而實(shí)現(xiàn)了在不泄露隱私數(shù)據(jù)的前提下,能夠利用涉及隱私的訓(xùn)練數(shù)據(jù)對大模型進(jìn)行微調(diào),提高了數(shù)據(jù)的安全性,并保證了對大模型微調(diào)的精度。

23、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本申請。



技術(shù)特征:

1.一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其中,所述第一小模型通過以下方式獲?。?/p>

3.根據(jù)權(quán)利要求2所述的方法,其中,所述對所述大模型進(jìn)行壓縮處理,得到所述第一小模型,包括:

4.根據(jù)權(quán)利要求2所述的方法,其中,所述第一小模型的獲取還包括:

5.根據(jù)權(quán)利要求4所述的方法,其中,所述確定所述第一小模型的參數(shù)量信息,包括:

6.根據(jù)權(quán)利要求1所述的方法,其中,所述差分隱私的方式包括以下任意一項(xiàng):

7.根據(jù)權(quán)利要求2所述的方法,其中,所述第一小模型中包括多個(gè)目標(biāo)參數(shù);所述訓(xùn)練所述第一小模型包括,將所述第一小模型中的所述目標(biāo)參數(shù)更新為目標(biāo)數(shù)值,以得到所述第二小模型;

8.根據(jù)權(quán)利要求1所述的方法,其中,所述對大模型進(jìn)行微調(diào),包括:

9.根據(jù)權(quán)利要求8所述的方法,其中,所述第一數(shù)據(jù)基于所述第一領(lǐng)域的提示詞而生成。

10.根據(jù)權(quán)利要求9所述的方法,其中,所述方法還包括:

11.根據(jù)權(quán)利要求1所述的方法,其中,所述方法還包括,所述第二平臺從第三平臺接收適用于第二領(lǐng)域的第四小模型,以所述第四小模型為老師模型,通過蒸餾學(xué)習(xí)的方式對所述大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域和第二領(lǐng)域的大模型。

12.一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法由第一平臺執(zhí)行,所述方法包括:

13.根據(jù)權(quán)利要求12所述的方法,其中,所述獲取第一小模型,包括:

14.根據(jù)權(quán)利要求13所述的方法,其中,所述獲取第一小模型,還包括:

15.根據(jù)權(quán)利要求14所述的方法,其中,所述確定所述第一小模型的參數(shù)量信息,包括:

16.根據(jù)權(quán)利要求12所述的方法,其中,所述差分隱私的方式包括以下任意一項(xiàng):

17.根據(jù)權(quán)利要求12所述的方法,其中,所述方法還包括:

18.一種基于隱私保護(hù)的大模型微調(diào)的方法,所述方法由第二平臺執(zhí)行,所述方法包括:

19.根據(jù)權(quán)利要求18所述的方法,其中,在接收所述第二小模型之前,所述方法還包括:

20.根據(jù)權(quán)利要求19所述的方法,其中,所述對所述大模型進(jìn)行壓縮處理,得到所述第一小模型,包括:

21.根據(jù)權(quán)利要求19所述的方法,其中,在對所述大模型進(jìn)行壓縮處理之前,還包括:

22.根據(jù)權(quán)利要求19所述的方法,其中,所述第一小模型中包括多個(gè)目標(biāo)參數(shù);所述第二小模型為將所述第一小模型中的所述目標(biāo)參數(shù)更新為目標(biāo)數(shù)值而得到;

23.根據(jù)權(quán)利要求18所述的方法,其中,所述對大模型進(jìn)行微調(diào),包括:

24.根據(jù)權(quán)利要求23所述的方法,其中,所述第一數(shù)據(jù)基于所述第一領(lǐng)域的提示詞而生成;其中,所述方法還包括:

25.根據(jù)權(quán)利要求18所述的方法,其中,所述方法還包括,從第三平臺接收適用于第二領(lǐng)域的第四小模型,以所述第四小模型為老師模型,通過蒸餾學(xué)習(xí)的方式對所述大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域和第二領(lǐng)域的大模型。

26.一種基于隱私保護(hù)的大模型微調(diào)的裝置,所述裝置部署于第一平臺,所述裝置包括:

27.一種基于隱私保護(hù)的大模型微調(diào)的裝置,所述裝置部署于第二平臺,所述裝置包括:

28.一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)中執(zhí)行時(shí),令所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-25中任一項(xiàng)所述的方法。

29.一種計(jì)算設(shè)備,包括存儲器和處理器,所述存儲器中存儲有可執(zhí)行代碼,所述處理器執(zhí)行所述可執(zhí)行代碼時(shí),實(shí)現(xiàn)權(quán)利要求1-25中任一項(xiàng)所述的方法。


技術(shù)總結(jié)
本說明書提供一種基于隱私保護(hù)的大模型微調(diào)的方法及裝置,所述方法包括:第一平臺采用差分隱私的方式,利用本地持有的、包括第一領(lǐng)域中隱私數(shù)據(jù)的目標(biāo)數(shù)據(jù)集,訓(xùn)練第一小模型,得到適用于所述第一領(lǐng)域的第二小模型,并將所述第二小模型發(fā)送給第二平臺;所述第二平臺以所述第二小模型為老師模型,通過蒸餾學(xué)習(xí)的方式,對本地持有的大模型進(jìn)行微調(diào),以得到適用于所述第一領(lǐng)域的大模型。

技術(shù)研發(fā)人員:劉文炎,殷山
受保護(hù)的技術(shù)使用者:螞蟻區(qū)塊鏈科技(上海)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/26
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1