一種網(wǎng)絡(luò)模型的訓(xùn)練方法及裝置與流程

文檔序號：40385053發(fā)布日期：2024-12-20 12:07閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種網(wǎng)絡(luò)模型的訓(xùn)練方法及裝置與流程

技術(shù)特征：

1.一種網(wǎng)絡(luò)模型的訓(xùn)練方法，其特征在于，包括：

2.如權(quán)利要求1所述的方法，其特征在于，基于預(yù)訓(xùn)練過程中網(wǎng)絡(luò)模型的損失值變化，確定待訓(xùn)練的初始網(wǎng)絡(luò)模型和訓(xùn)練次數(shù)n，包括：

3.如權(quán)利要求1所述的方法，其特征在于，所述通過所述樣本數(shù)據(jù)集對所述中間網(wǎng)絡(luò)模型進(jìn)行第二階段的訓(xùn)練，直至第二階段的訓(xùn)練次數(shù)滿足所述訓(xùn)練次數(shù)n，包括：

4.如權(quán)利要求1所述的方法，其特征在于，所述通過所述第二樣本集對所述初始網(wǎng)絡(luò)模型進(jìn)行第一階段的訓(xùn)練，直至第一階段的訓(xùn)練次數(shù)滿足所述訓(xùn)練次數(shù)n，得到中間網(wǎng)絡(luò)模型，包括：

5.如權(quán)利要求4所述的方法，其特征在于，所述通過所述第二樣本集對所述初始網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練，得到目標(biāo)損失值，包括：

6.一種網(wǎng)絡(luò)模型的訓(xùn)練裝置，其特征在于，包括：

7.如權(quán)利要求6所述的裝置，其特征在于，所述確定模塊，在基于預(yù)訓(xùn)練過程中網(wǎng)絡(luò)模型的損失值變化，確定待訓(xùn)練的初始網(wǎng)絡(luò)模型和訓(xùn)練次數(shù)n時，具體用于：

8.如權(quán)利要求6所述的裝置，其特征在于，所述訓(xùn)練模塊，在通過所述樣本數(shù)據(jù)集對所述中間網(wǎng)絡(luò)模型進(jìn)行第二階段的訓(xùn)練，直至第二階段的訓(xùn)練次數(shù)滿足所述訓(xùn)練次數(shù)n時，具體用于：

9.一種執(zhí)行設(shè)備，其特征在于，包括：

10.一種計(jì)算機(jī)可讀存儲介質(zhì)，其特征在于，所述計(jì)算機(jī)可讀存儲介質(zhì)包括計(jì)算機(jī)指令，當(dāng)所述計(jì)算機(jī)指令被計(jì)算機(jī)執(zhí)行時，實(shí)現(xiàn)如權(quán)利要求1-5任一項(xiàng)所述的方法。

技術(shù)總結(jié)
本申請?zhí)峁┝艘环N網(wǎng)絡(luò)模型的訓(xùn)練方法及裝置，用以提高通過網(wǎng)絡(luò)模型對數(shù)據(jù)集蒸餾的有效性。該方法包括：基于預(yù)訓(xùn)練過程中網(wǎng)絡(luò)模型的損失值變化，確定待訓(xùn)練的初始網(wǎng)絡(luò)模型和訓(xùn)練次數(shù)N；通過初始網(wǎng)絡(luò)模型對樣本數(shù)據(jù)集進(jìn)行識別，確定第一樣本集和第二樣本集，第一樣本集包括樣本數(shù)據(jù)集中初始網(wǎng)絡(luò)模型正確識別的樣本，第二樣本集包括樣本數(shù)據(jù)集中除第一樣本集之外的樣本；通過第二樣本集對初始網(wǎng)絡(luò)模型進(jìn)行第一階段的訓(xùn)練，直至第一階段的訓(xùn)練次數(shù)滿足訓(xùn)練次數(shù)N，得到中間網(wǎng)絡(luò)模型；通過樣本數(shù)據(jù)集對中間網(wǎng)絡(luò)模型進(jìn)行第二階段的訓(xùn)練，直至第二階段的訓(xùn)練次數(shù)滿足訓(xùn)練次數(shù)N，得到用于數(shù)據(jù)集蒸餾的目標(biāo)網(wǎng)絡(luò)模型。

技術(shù)研發(fā)人員：高毅昂
受保護(hù)的技術(shù)使用者：中國電信股份有限公司技術(shù)創(chuàng)新中心
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種網(wǎng)絡(luò)模型的訓(xùn)練方法及裝置與流程