技術(shù)總結(jié)
本發(fā)明公開了一種樣本標簽缺失數(shù)據(jù)的分類器訓練方法,適于處理具有兩類樣本的分類數(shù)據(jù),其中一類樣本的標簽數(shù)據(jù)全部缺失.本發(fā)明提供一種優(yōu)化求解技術(shù),將未標記樣本的標簽可靠性作為待求解的決策變量,基于結(jié)構(gòu)風險最小化原理建立最優(yōu)化模型.該模型在中小規(guī)模數(shù)據(jù)集上可直接調(diào)用非線性規(guī)劃的工具包予以求解,在大規(guī)模數(shù)據(jù)集上,可用交替搜索算法分別求解兩個凸規(guī)劃子問題,迭代求解模型的兩部分變量.本發(fā)明在不同數(shù)據(jù)集上通用性強,在獨立的測試集上具有良好的推廣性能。
技術(shù)研發(fā)人員:梁錫軍;夏重杭
受保護的技術(shù)使用者:中國石油大學(華東)
文檔號碼:201610818737
技術(shù)研發(fā)日:2016.09.12
技術(shù)公布日:2016.11.23