技術特征:
技術總結(jié)
本發(fā)明請求保護一種基于主動學習的數(shù)據(jù)自動標注方法,屬于主動學習領域,包括以下步驟:101對已標記和未標記數(shù)據(jù)進行處理;102利用多個不同分類器對未標記數(shù)據(jù)進行分類;103選出分歧熵低的數(shù)據(jù);104對分歧熵低的數(shù)據(jù)進行人工標記;105對人工標記結(jié)果進行自檢。本發(fā)明針對如何在減少人工標注數(shù)據(jù)的數(shù)量的同時,盡量保證人工標注數(shù)據(jù)的準確性問題,通過結(jié)合主動學習方法發(fā)明一個附帶自檢功能的數(shù)據(jù)自動標注系統(tǒng),達到縮減工作量且提高人工標注數(shù)據(jù)準確性的目的。
技術研發(fā)人員:王進;張登峰;卜亞楠;李穎;范磊;李智星;歐陽衛(wèi)華;孫開偉;陳喬松;鄧欣;胡峰;雷大江
受保護的技術使用者:重慶郵電大學
技術研發(fā)日:2017.02.15
技術公布日:2017.08.18