亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種網(wǎng)絡(luò)模型的訓(xùn)練方法及裝置與流程

文檔序號:40385053發(fā)布日期:2024-12-20 12:07閱讀:來源:國知局

技術(shù)特征:

1.一種網(wǎng)絡(luò)模型的訓(xùn)練方法,其特征在于,包括:

2.如權(quán)利要求1所述的方法,其特征在于,基于預(yù)訓(xùn)練過程中網(wǎng)絡(luò)模型的損失值變化,確定待訓(xùn)練的初始網(wǎng)絡(luò)模型和訓(xùn)練次數(shù)n,包括:

3.如權(quán)利要求1所述的方法,其特征在于,所述通過所述樣本數(shù)據(jù)集對所述中間網(wǎng)絡(luò)模型進(jìn)行第二階段的訓(xùn)練,直至第二階段的訓(xùn)練次數(shù)滿足所述訓(xùn)練次數(shù)n,包括:

4.如權(quán)利要求1所述的方法,其特征在于,所述通過所述第二樣本集對所述初始網(wǎng)絡(luò)模型進(jìn)行第一階段的訓(xùn)練,直至第一階段的訓(xùn)練次數(shù)滿足所述訓(xùn)練次數(shù)n,得到中間網(wǎng)絡(luò)模型,包括:

5.如權(quán)利要求4所述的方法,其特征在于,所述通過所述第二樣本集對所述初始網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到目標(biāo)損失值,包括:

6.一種網(wǎng)絡(luò)模型的訓(xùn)練裝置,其特征在于,包括:

7.如權(quán)利要求6所述的裝置,其特征在于,所述確定模塊,在基于預(yù)訓(xùn)練過程中網(wǎng)絡(luò)模型的損失值變化,確定待訓(xùn)練的初始網(wǎng)絡(luò)模型和訓(xùn)練次數(shù)n時,具體用于:

8.如權(quán)利要求6所述的裝置,其特征在于,所述訓(xùn)練模塊,在通過所述樣本數(shù)據(jù)集對所述中間網(wǎng)絡(luò)模型進(jìn)行第二階段的訓(xùn)練,直至第二階段的訓(xùn)練次數(shù)滿足所述訓(xùn)練次數(shù)n時,具體用于:

9.一種執(zhí)行設(shè)備,其特征在于,包括:

10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲介質(zhì)包括計(jì)算機(jī)指令,當(dāng)所述計(jì)算機(jī)指令被計(jì)算機(jī)執(zhí)行時,實(shí)現(xiàn)如權(quán)利要求1-5任一項(xiàng)所述的方法。


技術(shù)總結(jié)
本申請?zhí)峁┝艘环N網(wǎng)絡(luò)模型的訓(xùn)練方法及裝置,用以提高通過網(wǎng)絡(luò)模型對數(shù)據(jù)集蒸餾的有效性。該方法包括:基于預(yù)訓(xùn)練過程中網(wǎng)絡(luò)模型的損失值變化,確定待訓(xùn)練的初始網(wǎng)絡(luò)模型和訓(xùn)練次數(shù)N;通過初始網(wǎng)絡(luò)模型對樣本數(shù)據(jù)集進(jìn)行識別,確定第一樣本集和第二樣本集,第一樣本集包括樣本數(shù)據(jù)集中初始網(wǎng)絡(luò)模型正確識別的樣本,第二樣本集包括樣本數(shù)據(jù)集中除第一樣本集之外的樣本;通過第二樣本集對初始網(wǎng)絡(luò)模型進(jìn)行第一階段的訓(xùn)練,直至第一階段的訓(xùn)練次數(shù)滿足訓(xùn)練次數(shù)N,得到中間網(wǎng)絡(luò)模型;通過樣本數(shù)據(jù)集對中間網(wǎng)絡(luò)模型進(jìn)行第二階段的訓(xùn)練,直至第二階段的訓(xùn)練次數(shù)滿足訓(xùn)練次數(shù)N,得到用于數(shù)據(jù)集蒸餾的目標(biāo)網(wǎng)絡(luò)模型。

技術(shù)研發(fā)人員:高毅昂
受保護(hù)的技術(shù)使用者:中國電信股份有限公司技術(shù)創(chuàng)新中心
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/19
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1