樣本和測 試樣本輸入分類器前,必須進行特征選擇;利用步驟4設計的SparseBoost算法進行特征選 擇,其與AdaBoost算法的最大區(qū)別在于,前者是在每一次迭代過程中僅選取一個最優(yōu)的特 征,而后者通常利用整個特征集;這樣降低了訓練樣本的特征維數(shù),有效地減少了分類器訓 練的計算復雜度; 步驟4.將Boost算法與稀疏核密度估計算法RSDE-WL1結(jié)合,設計了稀疏提升集成分 類器,以實現(xiàn)對基于圖像的隕石坑的快速檢測; 根據(jù)所選擇的候選隕石坑紋理特征,為了區(qū)分其中隕石坑和非隕石坑,設計了SparseBoost算法來監(jiān)督學習分類;該方法結(jié)合Boost算法和一種改進的稀疏核密度估計 算法RSDE-WL1,在選擇特征子集的同時,構(gòu)造若干稀疏核密度估計器用于相應基分類器的 設計,通過基分類器的加權(quán)組合,最終實現(xiàn)集成分類器; 給定n個候選隕石坑(Xi,y), (x2,y2), . . .,(xn,yn),其中yi= 0, 1,i= 1,2, . ..,n分 別對應著非隕石坑(C(l)和隕石坑(Cl)實例,%和1^分別對應著非隕石坑和隕石坑實例的 數(shù)目,rid+nfn;每一個候選隕石坑表示為一個特征向量x=(f^f2,. . .,fm)T,其中每一個 特征fi,i= 1,...,m是由候選隕石坑上某一特定位置的方形遮蓋產(chǎn)生,m為抽取的特征總 數(shù);利用SparseBoost算法構(gòu)建一系列弱分類器ht (x),并通過加權(quán)集成方法將弱分類器進 行組合建立最終的強分類器H(x):
(1) 其中T是迭代次數(shù)(T<n),at是學習的弱分類器ht (x)的權(quán)重; 在每次的迭代過程中,需要實現(xiàn)以下三個核心的步驟:弱分類器學習、最優(yōu)特征選擇 和下一次迭代過程樣本權(quán)重更新;其中,在弱分類器學習過程中,對壓縮集密度估計算法RSDE加入懲罰項,得到改進的稀疏核密度估計算法RSDE-WL1 ;利用RSDE-WL1算法對每一種 類別屬性估計其概率密度函數(shù),根據(jù)貝葉斯決策規(guī)則對輸入的樣本進行分類,得到弱分類 器;
(1)弱分類器學習 在第t次迭代過程中,針對選取的單個最優(yōu)特征fe{f\,f2,...,fj構(gòu)建的弱分類器ht(x),通過構(gòu)建貝葉斯分類器來實現(xiàn);在討論關于隕石坑和非隕石坑分類的二類分類問題 前,首先介紹貝葉斯分類器;對于貝葉斯分類問題,期望估計給定輸入樣本x下類別的后驗 概率密度;為了獲得一個關于密度估計的概率分類器,首先為每一種類別屬性C訓練一個 概率密度估計器A(x;P) =MvP|c),其中x為用于表示單個候選隕石坑的特征向量,為核 權(quán)值向量,C為候選隕石坑的類別屬性,ce{C(l,Cl},C(l表示非隕石坑類別,ci表示隕石坑 類別;然后運用貝葉斯規(guī)則(2)計算后驗概率,最終測試樣本被分配給具有最大后驗概率 的類別屬性;
(2) 對于分類問題,首先估計兩個在給定類別下的條件概率密度戶(x;P?"Ak〇)和 戶(xU/Jq),這兩個密度通過后續(xù)的稀疏核密度估計RSDE-WL1得到;然后根據(jù)公式(2), 分別計算相應的后驗概率和iXqlx^A);根據(jù)每一種類別屬性的樣本數(shù)量, 計算兩種類別的先驗概率P(CQ)和ph) :p(cQ)zna/r^pf^)ziVr^pf^cd+pf^) =1 ;最 后利用貝葉斯決策規(guī)則(3)對輸入的樣本進行分類:
其中兩種類別屬性下概率密度沉A|cQ)和與x;pni,/? |q)的稀疏估計表達分別為:
(5) (6) mjPm:分別對應著兩種類別屬性下稀疏核密度估計RSDE-WL1表達式中非零核權(quán)值的 個數(shù),%和n汾別對應著非隕石坑和隕石坑實例的數(shù)目,n3mn1;P?。和P?,為核 權(quán)值向量,為核權(quán)值系數(shù),〇彡Pk彡1AjPhi為核帶寬,hp0,hp0 ; '(W)和 '(x,x*)為核函數(shù); 其中,改進的稀疏核密度估計RSDE-WL1的實現(xiàn)過程如下: 首先介紹壓縮集密度估計算法RSDE;RSDE基于經(jīng)驗積分平方誤差準則ISE,以全回歸 矩陣cl' = [乂, ]efu為基礎,使核權(quán)值趨于〇,從而得到密度p (x)的稀疏表達式,其中Kik =Kh(Xi,xk)為的第i行k列元素;帶有高斯核的RSDE估計,其核權(quán)值向量P能夠通 過最小化積分平方誤差得到,如下所示:其中,貨VxJV代表NXN維矩陣空間; (7) 式(7)中參數(shù)0與公式(2)中的參數(shù)含義一致,dx表示微分項,EpW表示期望值; 其中,項由于其與參數(shù)@無關,不用考慮,EpW{>}表示關于密度p(x)的期 望值;將核密度估計表達式= 代入式(7),經(jīng)過系列變換,得到帶約束 的非負二次優(yōu)化問題
(8) 約束條件P〇,1 <k<N和g爲=1;其中,矩陣C. =「CXx.x ,兀 素定義為
Gh( ?,?)是高斯核函數(shù),h 為核帶3
]T是每一個樣本點的Parzen窗 估計值向量,3n= [3d旦2,...,3n]t; 為了降低權(quán)值系數(shù)在某些區(qū)域的聚集程度和提高密度估計的稀疏度,引入權(quán)值系 數(shù)的加權(quán)h范數(shù)||#P.y1作為懲罰項,得到改進的稀疏核密度估計算法RSDE-WL1 ;iWp.j 也叫做正則化項,其中WzdiagO^,!^,...,!%)為對角矩陣;定義=S;=i|1v4| =wTPAr,w= [W1,W2,...,WN]T, 3n= [3 1,旦2,...,3n]T,加入懲罰項后的新的二次優(yōu)化問題為
(9)注意到問題(9)是非凸 的,利用相應的迭代算法求解上述問題得到權(quán)值系數(shù)的稀疏解; (2) 最優(yōu)特征選擇 計算弱分類器ht (x)的加權(quán)誤差總和,選擇滿足最小誤差的單個最優(yōu)特征f"用于構(gòu)建 當前迭代的最優(yōu)弱分類器
(10) ht(x)=h(X,產(chǎn))(11) (3) 下一次迭代過程樣本權(quán)重更新 SparseBoost算法結(jié)合了AdaBoost算法中當前樣本權(quán)重與過去所選特征的分類結(jié)果 有關這一信息,而這一信息有助于選擇當前最優(yōu)特征;實現(xiàn)過程中,加大被錯誤分類的樣本 權(quán)重,而減小被正確分類的樣本權(quán)重;在計算加權(quán)誤差總和時,被錯誤分類的樣本能在下一 次迭代過程被選中;權(quán)重更新表達式如下 (12) 〇
【專利摘要】本發(fā)明一種基于稀疏提升集成分類器的火星探測器軟著陸過程中隕石坑的檢測方法,它有四大步驟:步驟1.確定候選隕石坑;步驟2.候選隕石坑紋理特征抽?。徊襟E3.對抽取的紋理特征進行特征選擇;步驟4.將Boost算法與稀疏核密度估計算法RSDE-WL1結(jié)合,設計了稀疏提升集成分類器,以實現(xiàn)對基于圖像的隕石坑的快速檢測。本發(fā)明主要是利用所設計的稀疏提升集成分類器具有稀疏解和降低計算復雜度的優(yōu)點,對基于圖像的隕石坑紋理特征進行特征抽取和選擇后,實現(xiàn)對隕石坑和非隕石坑的分類,以達到隕石坑的快速檢測。其分類準確度能近似達到85%及以上,對實際的火星探測器軟著陸過程中隕石坑的檢測具有一定的參考價值。
【IPC分類】G06K9-62
【公開號】CN104700115
【申請?zhí)枴緾N201510089099
【發(fā)明人】王巖, 楊剛, 郭雷
【申請人】北京航空航天大學
【公開日】2015年6月10日
【申請日】2015年2月27日