實(shí)施方案整體涉及機(jī)器學(xué)習(xí)系統(tǒng),并且更具體地涉及用于通過經(jīng)預(yù)訓(xùn)練的模型和深度強(qiáng)化學(xué)習(xí)進(jìn)行程序合成的系統(tǒng)和方法。背景技術(shù)、程序合成,通常也稱為代碼生成,是生成滿足問題規(guī)范的計算機(jī)代碼程序的任務(wù),例如,對列表進(jìn)行排序、合并兩個數(shù)據(jù)表等。當(dāng)程序合成被視為序列到序列任務(wù)時,一些經(jīng)預(yù)訓(xùn)練的語言模型可以適于接收...