技術(shù)特征:
技術(shù)總結(jié)
本申請(qǐng)實(shí)施例提供了一種類Alexnet網(wǎng)絡(luò)的模型訓(xùn)練方法和裝置,所述方法包括:采用第一圖形處理單元GPU計(jì)算在類Alexnet網(wǎng)絡(luò)下的第一梯度值和第二梯度值;接收第二圖形處理單元GPU發(fā)送的在所述類Alexnet網(wǎng)絡(luò)下的第三梯度值;依據(jù)所述第一梯度值和第三梯度值計(jì)算所述類Alexnet網(wǎng)絡(luò)的第一模型參數(shù);接收所述第二圖形處理單元GPU發(fā)送的在所述類Alexnet網(wǎng)絡(luò)下的第四梯度值;依據(jù)所述第二梯度值和第四梯度值計(jì)算所述類Alexnet網(wǎng)絡(luò)的第二模型參數(shù);采用所述第一模型參數(shù)和第二模型參數(shù)訓(xùn)練所述類Alexnet網(wǎng)絡(luò)的模型,使計(jì)算和通信兩個(gè)過(guò)程分開進(jìn)行,進(jìn)一步使類Alexnet網(wǎng)絡(luò)的卷積層的計(jì)算和全連接參數(shù)通信并行,有效地減少了模型訓(xùn)練過(guò)程耗費(fèi)的時(shí)間,提高了模型訓(xùn)練的運(yùn)行效率。
技術(shù)研發(fā)人員:王思宇
受保護(hù)的技術(shù)使用者:阿里巴巴集團(tuán)控股有限公司
技術(shù)研發(fā)日:2016.03.31
技術(shù)公布日:2017.10.24