基于knn的置信回歸算法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于機器學習領(lǐng)域,尤其涉及一種基于腳W的置信回歸算法及裝置。
【背景技術(shù)】
[0002] 機器學習的研究領(lǐng)域除了對分類問題進行研究外,還有一個重要研究領(lǐng)域就是回 歸預測的研究。所W對應著置信機器學習研究,也應該包括置信分類研究和置信回歸研究。 目前對置信機器學習的研究主要集中在分類問題上,目前多數(shù)的置信機器研究也主要集中 在置信分類問題上,對置信回歸的研究卻比較少;但是置信回歸在醫(yī)療診斷預測等高風險 的應用領(lǐng)域有著重要的現(xiàn)實意義。
[0003] 現(xiàn)有技術(shù)提供的一種用支持向量機方法做置信回歸,如文獻《支持向量機 回歸在線建模及應用》(王定成等,控制與決策,2003. 1);文獻狂idelmal Z,Amirou A,Belouc虹ani A. HEARTBEAT CLASSIFICATION USING SUPPORT VECTOR MACHI肥S(SVMs) WITH AN EMB邸DED RE巧CT OPTIONAL INTERNATIONAL JOURNAL OF PATTERN RECOGNITION AND ARTIFICIAL INTCLLIGENCE,2012, 26(1))對對帶有拒絕選項的分類器進行了研究,根 據(jù)貝葉斯學習方法,對于兩類分類問題,提出了優(yōu)化分類器和拒絕規(guī)則,并據(jù)此設(shè)置闊值。
[0004] 在實現(xiàn)現(xiàn)有技術(shù)的方案中,發(fā)現(xiàn)現(xiàn)有技術(shù)存在如下技術(shù)問題:
[0005] 現(xiàn)有技術(shù)提供的技術(shù)方案沒有進行分類預處理,置信回歸不準確。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明實施例的目的在于提供一種基于腳W的置信回歸算法,其解決現(xiàn)有技術(shù)的 置信回歸不準確的問題。
[0007] 本發(fā)明實施例是該樣實現(xiàn)的,一方面,一種基于腳W的置信回歸算法,所述方法包 括如下步驟:
[0008] 101、確定樣本集,該樣本集包括:已知回歸樣本集和未知回歸樣本集;
[0009] 102、在未知回歸樣本集中選出未知樣本yP;
[0010] 103、計算出xP與已知回歸樣本集中每個樣本之間的歐式距離De狂,口;
[0011] 其中,
【主權(quán)項】
1. 一種基于KNN的置信回歸算法,其特征在于,所述方法包括如下步驟: 101、 確定樣本集,該樣本集包括:已知回歸樣本集和未知回歸樣本集; 102、 在未知回歸樣本集中選出未知樣本xp; 103、 計算出xp與已知回歸樣本集中每個樣本之間的歐式距離D E(X,Z);
De (Χρ,Γ)表示未知樣本xp與已知樣本Z q之間的歐式距離,其中,樣本
JC./;表示樣本xP的第i個元素;表示樣本Ztl的第i個元素; I I 104、 在已知樣本集中查詢出與Xp的歐式距離最近的K個樣本;計算K個樣本的回歸值 的平均值f .
105、 回歸模型預測未知樣本?的回歸值p .計算J7x ^與y的差值T,設(shè) 定一個劃分閾值t ;如-t < T < t,則將Xp劃分到回歸接受域,并確定x P .如TH或 , T〈_t則將Xp劃分到回歸拒絕域,并不確定37x P 〇
2. -種基于KNN的置信回歸裝置,其特征在于,所述裝置包括: 確定單元,用于確定樣本集,該樣本集包括:已知回歸樣本集和未知回歸樣本集; 采樣單元,用于在未知回歸樣本集中選出未知樣本xp; 計算單元,用于計算出xP與已知回歸樣本集中每個樣本之間的歐式距離D Ε(Χ,Ζ); 其中:
De (Χρ,Γ)表示未知樣本Xp與已知樣本Z q之間的歐式距離,其中,樣本
表示樣本xP的第i個元素;表示樣本Z tl的第i個元素;在已知樣本集中查詢出 與Xp的歐式距離最近的K個樣本;計算K個樣本的回歸值的平均值J;,
劃分單元,用于采用回歸模型預測未知樣本妙的回歸值y " 計算];"與 yXp > yXp y的差值T,設(shè)定一個劃分閾值t ;如-t < T < t,則將Xp劃分到回歸接受域,并確定 37 γ P _如TH或T〈-t則將Xp劃分到回歸拒絕域,并不確定y x P 5 〇
【專利摘要】本發(fā)明適用機器學習領(lǐng)域,提供了一種基于KNN的置信回歸算法,包括:確定樣本集,該樣本集包括:已知回歸樣本集和未知回歸樣本集;在未知回歸樣本集中選出未知樣本,計算出未知樣本與已知回歸樣本集中每個樣本之間的歐式距離;在已知樣本集中查詢出與未知樣本的歐式距離最近的K個樣本;計算K個樣本的回歸值的平均值;回歸模型預測未知樣本的回歸值;計算回歸值與平均值的差值T,依據(jù)差值T劃分接受域和拒絕域。本發(fā)明具有回歸值準確的優(yōu)點。
【IPC分類】G06F17-50, G06F19-24
【公開號】CN104537157
【申請?zhí)枴緾N201410767787
【發(fā)明人】蔣方純, 田盛豐
【申請人】深圳信息職業(yè)技術(shù)學院
【公開日】2015年4月22日
【申請日】2014年12月12日