技術(shù)總結(jié)
本申請公開一種針對不平衡樣本集的模型訓(xùn)練方法及裝置,對不平衡樣本集進行樣本平衡后再訓(xùn)練模型,從而提高模型的性能。該方法包括:獲取不平衡樣本集,所述不平衡樣本集中包含負(fù)樣本和正樣本,且負(fù)樣本與正樣本的樣本數(shù)量比大于不平衡閾值,所述不平衡閾值大于1;根據(jù)所述不平衡樣本集中的正樣本,以及與所述正樣本相鄰的樣本,建立合成正樣本,所述與所述正樣本相鄰的樣本包含負(fù)樣本和/或正樣本;當(dāng)合成正樣本與正樣本的數(shù)量之和與負(fù)樣本數(shù)量的比值在平衡閾值區(qū)間內(nèi)時,將合成正樣本修改為正樣本,生成平衡樣本集;根據(jù)所述平衡樣本集進行模型訓(xùn)練。本申請還公開一種針對不平衡樣本集的樣本平衡方法及裝置以及一種個人信用評分系統(tǒng)。
技術(shù)研發(fā)人員:席炎;王曉光;趙科科;張柯;毛旭東;楊旭;蔡寧
受保護的技術(shù)使用者:阿里巴巴集團控股有限公司
文檔號碼:201510981091
技術(shù)研發(fā)日:2015.12.23
技術(shù)公布日:2017.06.30