亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

模型微調(diào)方法、文本處理方法、介質(zhì)、設(shè)備及程序產(chǎn)品與流程

文檔序號:40385150發(fā)布日期:2024-12-20 12:07閱讀:6來源:國知局
模型微調(diào)方法、文本處理方法、介質(zhì)、設(shè)備及程序產(chǎn)品與流程

本公開涉及隱私保護(hù)領(lǐng)域,具體地,涉及一種模型微調(diào)方法、文本處理方法、介質(zhì)、設(shè)備及程序產(chǎn)品。


背景技術(shù):

1、大語言模型(large?language?models,llm)應(yīng)用變得越來越廣泛,許多客戶想要使用云服務(wù)平臺提供的llm服務(wù)??蛻敉ǔ褂胠lm服務(wù)提供的兩種典型功能:微調(diào)和推理(即預(yù)測)。首先,客戶會將私有的數(shù)據(jù)集上傳到云服務(wù)平臺用于微調(diào)部署在平臺上的預(yù)訓(xùn)練模型,以提升模型在特定領(lǐng)域的任務(wù)效果。之后,客戶會通過平臺調(diào)用微調(diào)后所得的模型的推理功能,輸入推理文本來獲取預(yù)測結(jié)果。

2、然而,上述方案在為客戶提供高效、可定制的llm服務(wù)的同時,也帶來了客戶數(shù)據(jù)泄露的風(fēng)險。


技術(shù)實現(xiàn)思路

1、提供該
技術(shù)實現(xiàn)要素:
部分以便以簡要的形式介紹構(gòu)思,這些構(gòu)思將在后面的具體實施方式部分被詳細(xì)描述。該發(fā)明內(nèi)容部分并不旨在標(biāo)識要求保護(hù)的技術(shù)方案的關(guān)鍵特征或必要特征,也不旨在用于限制所要求的保護(hù)的技術(shù)方案的范圍。

2、第一方面,本公開提供一種大語言模型微調(diào)方法,包括:從服務(wù)端獲取大語言模型的詞表和嵌入層參數(shù),其中,預(yù)訓(xùn)練好的所述大語言模型部署于所述服務(wù)端;對所述詞表和所述嵌入層參數(shù)分別進(jìn)行混淆處理,得到目標(biāo)詞表和目標(biāo)嵌入層參數(shù);將所述目標(biāo)嵌入層參數(shù)發(fā)送至所述服務(wù)端,以由所述服務(wù)端將所述大語言模型的嵌入層參數(shù)更新為所述目標(biāo)嵌入層參數(shù),以得到新的大語言模型;利用所述目標(biāo)詞表,對文本樣本進(jìn)行分詞和轉(zhuǎn)索引操作,得到所述文本樣本對應(yīng)的第一詞元索引;將所述第一詞元索引發(fā)送至所述服務(wù)端,以由所述服務(wù)端基于所述第一詞元索引對所述新的大語言模型進(jìn)行微調(diào)。

3、第二方面,本公開提供一種大語言模型微調(diào)方法,應(yīng)用于服務(wù)端,包括:響應(yīng)于接收到服務(wù)端使用方發(fā)送的目標(biāo)嵌入?yún)?shù),將所述服務(wù)端的大語言模型的嵌入層參數(shù)更新為所述目標(biāo)嵌入層參數(shù),得到新的大語言模型,其中,所述目標(biāo)嵌入層參數(shù)由所述服務(wù)端使用方對所述嵌入層參數(shù)進(jìn)行混淆處理得到;響應(yīng)于接收到所述服務(wù)端使用方發(fā)送的第一詞元索引,基于所述第一詞元索引對所述新的大語言模型進(jìn)行微調(diào),其中,所述第一詞元索引由所述服務(wù)端使用方基于目標(biāo)詞表和文本樣本生成,所述目標(biāo)詞表由所述服務(wù)端使用方對所述大語言模型的詞表進(jìn)行混淆處理得到。

4、第三方面,本公開提供一種文本處理方法,應(yīng)用于服務(wù)端使用方,包括:獲取待處理文本;利用目標(biāo)詞表對所述待處理文本進(jìn)行分詞和轉(zhuǎn)索引操作,得到所述待處理文本對應(yīng)的第二詞元索引;將所述第二詞元索引發(fā)送至服務(wù)端,以由所述服務(wù)端通過預(yù)先微調(diào)好的大語言模型基于所述第二詞元索引,生成所述待處理文本的文本處理結(jié)果,并將所述文本處理結(jié)果發(fā)送至所述服務(wù)端使用方,其中,所述大語言模型是根據(jù)本公開第一方面和第二方面提供的所述大語言模型微調(diào)方法得到的;接收所述文本處理結(jié)果。

5、第四方面,本公開提供一種計算機可讀介質(zhì),其上存儲有計算機程序,該計算機程序被處理裝置執(zhí)行時實現(xiàn)本公開第一方面和第二方面提供的所述大語言模型微調(diào)方法的步驟或者本公開第三方面提供的所述文本處理方法的步驟。

6、第五方面,本公開提供一種電子設(shè)備,包括:存儲裝置,其上存儲有計算機程序;處理裝置,用于執(zhí)行所述存儲裝置中的所述計算機程序,以實現(xiàn)本公開第一方面和第二方面提供的所述大語言模型微調(diào)方法的步驟或者本公開第三方面提供的所述文本處理方法的步驟。

7、第六方面,本公開提供一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)本公開第一方面和第二方面提供的所述大語言模型微調(diào)方法的步驟或者本公開第三方面提供的所述文本處理方法的步驟。

8、在上述技術(shù)方案中,在利用服務(wù)端使用方的文本樣本對服務(wù)端預(yù)訓(xùn)練好的大語言模型進(jìn)行微調(diào)之前,服務(wù)端使用方首先通過與服務(wù)端交互獲取大語言模型的詞表和嵌入層參數(shù);之后,服務(wù)端使用方對大語言模型的詞表和嵌入層參數(shù)分別進(jìn)行混淆處理,得到目標(biāo)詞表和目標(biāo)嵌入層參數(shù),并將目標(biāo)嵌入層參數(shù)發(fā)送至服務(wù)端,以由服務(wù)端將大語言模型的嵌入層參數(shù)更新為目標(biāo)嵌入層參數(shù),以得到新的大語言模型;服務(wù)端使用方利用目標(biāo)詞表,對文本樣本進(jìn)行分詞和轉(zhuǎn)索引操作,得到文本樣本對應(yīng)的第一詞元索引;接下來,服務(wù)端使用方將第一詞元索引發(fā)送至服務(wù)端,以由服務(wù)端基于第一詞元索引對新的大語言模型進(jìn)行微調(diào)。其中,將預(yù)訓(xùn)練好的大語言模型中的詞表和嵌入層參數(shù)分別進(jìn)行混淆,并且,只將混淆后的嵌入層參數(shù)(即目標(biāo)嵌入層參數(shù))發(fā)送至服務(wù)端,而將混淆后的詞表(即目標(biāo)詞表)保留在服務(wù)端使用方,這樣,可以避免服務(wù)端獲取到嵌入向量和詞元之間的對應(yīng)關(guān)系,從而能夠在有效保護(hù)服務(wù)端使用方數(shù)據(jù)的前提下,通過微調(diào)操作更好地保障模型效果。另外,目標(biāo)詞表保留在服務(wù)端使用方,在模型微調(diào)階段和推理階段,服務(wù)端使用方根據(jù)目標(biāo)詞表進(jìn)行文本分詞,使得服務(wù)端不直接接觸服務(wù)端使用方私有數(shù)據(jù),僅能獲取到文本詞元對應(yīng)的索引,能夠更好的保護(hù)服務(wù)端使用方數(shù)據(jù)。此外,僅需服務(wù)端使用方承擔(dān)一次性的嵌入擾動開銷(即對大語言模型的詞表和嵌入層參數(shù)進(jìn)行混淆),以及在微調(diào)和推理階段中的文本分詞開銷,這樣,服務(wù)端使用方在執(zhí)行文本處理任務(wù)時不需要占用大量的cpu、內(nèi)存或電池電量等資源,使得文本處理任務(wù)更容易在不同類型的服務(wù)端使用方上運行,讓更多用戶享受到這項技術(shù)的便利。

9、本公開的其他特征和優(yōu)點將在隨后的具體實施方式部分予以詳細(xì)說明。



技術(shù)特征:

1.一種大語言模型微調(diào)方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述詞表和所述嵌入層參數(shù)分別進(jìn)行混淆處理,得到目標(biāo)詞表和目標(biāo)嵌入層參數(shù),包括:

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述目標(biāo)詞表,對所述置換嵌入層參數(shù)進(jìn)行噪聲擾動處理,得到目標(biāo)嵌入層參數(shù),包括:

4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)聚類結(jié)果,對所述置換嵌入層參數(shù)進(jìn)行噪聲擾動處理,得到目標(biāo)嵌入層參數(shù),包括:

5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述利用差分隱私機制對所述嵌入向量集進(jìn)行噪聲擾動處理,得到該聚類簇對應(yīng)的擾動向量集,包括:

6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述置換嵌入層參數(shù),對所述目標(biāo)詞表中的詞元進(jìn)行聚類,包括:

7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述置換嵌入層參數(shù),分別計算所述當(dāng)前詞元與所述目標(biāo)詞表中每一未被聚類的其他詞元之間的第二相似度,包括:

8.根據(jù)權(quán)利要求1-7中任一項所述的方法,其特征在于,所述大語言模型為文本分類模型;

9.根據(jù)權(quán)利要求1-7中任一項所述的方法,其特征在于,所述大語言模型為文本生成模型,其中,所述嵌入層參數(shù)包括輸入嵌入層參數(shù)和輸出嵌入層參數(shù)。

10.一種大語言模型微調(diào)方法,其特征在于,應(yīng)用于服務(wù)端,包括:

11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述大語言模型為文本分類模型;

12.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述大語言模型為文本生成模型,其中,所述嵌入層參數(shù)包括輸入嵌入層參數(shù)和輸出嵌入層參數(shù)。

13.一種文本處理方法,其特征在于,應(yīng)用于服務(wù)端使用方,包括:

14.根據(jù)權(quán)利要求13所述的方法,其特征在于,所述大語言模型為文本分類模型,所述文本處理結(jié)果為所述待處理文本的類別。

15.根據(jù)權(quán)利要求13所述的方法,其特征在于,所述大語言模型為文本生成模型,所述文本處理結(jié)果為所述待處理文本對應(yīng)的預(yù)測詞元索引;

16.一種計算機可讀介質(zhì),其上存儲有計算機程序,其特征在于,該計算機程序被處理裝置執(zhí)行時實現(xiàn)權(quán)利要求1-15中任一項所述方法的步驟。

17.一種電子設(shè)備,其特征在于,包括:

18.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-15中任一項所述的方法的步驟。


技術(shù)總結(jié)
本公開涉及一種模型微調(diào)方法、文本處理方法、介質(zhì)、設(shè)備及程序產(chǎn)品。方法包括:從服務(wù)端獲取大語言模型的詞表和嵌入層參數(shù);對詞表和嵌入層參數(shù)分別進(jìn)行混淆處理,得到目標(biāo)詞表和目標(biāo)嵌入層參數(shù);將目標(biāo)嵌入層參數(shù)發(fā)送至服務(wù)端,以由服務(wù)端將大語言模型的嵌入層參數(shù)更新為目標(biāo)嵌入層參數(shù),以得到新的大語言模型;利用目標(biāo)詞表,對文本樣本進(jìn)行分詞和轉(zhuǎn)索引操作,得到文本樣本對應(yīng)的第一詞元索引;將第一詞元索引發(fā)送至服務(wù)端,以由服務(wù)端基于第一詞元索引對新的大語言模型進(jìn)行微調(diào)。這樣,可避免服務(wù)端獲取到嵌入向量和詞元之間的對應(yīng)關(guān)系,從而能在有效保護(hù)服務(wù)端使用方數(shù)據(jù)的前提下,通過微調(diào)操作更好地保障模型效果。

技術(shù)研發(fā)人員:林宇,張祺智,蔡權(quán)偉,洪爵,吳燁
受保護(hù)的技術(shù)使用者:北京火山引擎科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/19
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1