本發(fā)明屬于模式識別領(lǐng)域,涉及多核學(xué)習(xí)模型求解。
背景技術(shù):
:現(xiàn)有的多核學(xué)習(xí)方法可以歸納為三類。第一類是基于固定準(zhǔn)則的多核學(xué)習(xí)方法,該類方法在多核學(xué)習(xí)過程中利用加、乘等固定準(zhǔn)則對基核進(jìn)行組合,沒有考慮各個(gè)基核自身相似性度量特性和沒有利用任何優(yōu)化準(zhǔn)則,因此分類性能較低。第二類是單步優(yōu)化多核學(xué)習(xí)方法,該類方法將多核模型中的基核權(quán)重參數(shù)和分類器中參數(shù)同時(shí)求解,因此計(jì)算量非常大,學(xué)習(xí)效率非常低,其分類性能相對較強(qiáng)。第三類是兩步優(yōu)化多核學(xué)習(xí)方法,該類方法將多核模型中的基核權(quán)重與分類器參數(shù)分開獨(dú)立求解,因此相對第二類方法往往能提高計(jì)算效率。通常在基核規(guī)模較小情況下,第二類多核學(xué)習(xí)方法分類性能優(yōu)于第三類多核學(xué)習(xí)方法;但在基核規(guī)模較大情況下,第三類多核學(xué)習(xí)方法分類性能優(yōu)于第二類多核學(xué)習(xí)方法?,F(xiàn)有的多核學(xué)習(xí)方法在模型求解過程中沒有考慮后續(xù)應(yīng)用(如分類,目標(biāo)檢測、識別等)自身特點(diǎn);同時(shí)現(xiàn)有的多核學(xué)習(xí)方法通常將優(yōu)化問題轉(zhuǎn)化為半定規(guī)劃問題來求解,由于在參數(shù)求解過程中涉及多核矩陣的快速求解、高維核矩陣分解、迭代次數(shù)高等問題使得多核學(xué)習(xí)效率非常低。目前已有的多核學(xué)習(xí)方法存在,多核模型求解沒有與后續(xù)應(yīng)用相結(jié)合,以及優(yōu)化問題復(fù)雜,求解效率低的問題。技術(shù)實(shí)現(xiàn)要素:本發(fā)明為解決現(xiàn)有應(yīng)用于高光譜圖像分類的多核學(xué)習(xí)方法中,存在沒有考慮將多核模型求解與后續(xù)分類應(yīng)用相結(jié)合以及求解效率低的問題,而提出一種基于最大化類別可分性準(zhǔn)則的多核學(xué)習(xí)方法。一種基于最大化類別可分性準(zhǔn)則的多核學(xué)習(xí)方法,按以下步驟進(jìn)行:步驟一、從給定的輸入高光譜圖像數(shù)據(jù)集中獲取訓(xùn)練樣本和測試樣本;步驟二、利用訓(xùn)練樣本集構(gòu)造多核學(xué)習(xí)模型中的基核矩陣Km,得到基核矩陣集合步驟三、利用基核矩陣集合在希爾伯特核空間度量高光譜圖像數(shù)據(jù)集類內(nèi)離散度和類間離散度;步驟四、在類內(nèi)離散度和類間離散度基礎(chǔ)上以最大類別間隔準(zhǔn)則度量類別可分性,以類別可分性最大為多核學(xué)習(xí)模型求解準(zhǔn)則,求解基核權(quán)重。本發(fā)明包括以下有益效果:本發(fā)明將多核學(xué)習(xí)模型求解與后續(xù)分類應(yīng)用相結(jié)合,因此能改善分類性能,同時(shí)由于獲得閉合解,不需要進(jìn)行迭代求解,因此算法效率高。1、由于是以后續(xù)分類應(yīng)用為目的對多核學(xué)習(xí)模型進(jìn)行求解,即在多核學(xué)習(xí)模型求解過程中以最大類別可分為準(zhǔn)則,因此能改善分類性能,比單核方法分類精度提高2%左右,比主流的多核學(xué)習(xí)方法分類精度提高1%左右;2、由于可以直接獲得多核學(xué)習(xí)模型的閉合解,不需要對多核模型進(jìn)行迭代求解,因此能提高算法運(yùn)算效率。附圖說明圖1為本發(fā)明所述方法流程示意圖;圖2a為UniversityofHouston高光譜圖像數(shù)據(jù)集RGB假彩色合成圖;圖2b為UniversityofHouston高光譜圖像數(shù)據(jù)集地物分布真實(shí)圖。具體實(shí)施方式具體實(shí)施方式一、結(jié)合圖1說明本實(shí)施方式,本實(shí)施方式所述的一種基于最大化類別可分性準(zhǔn)則的多核學(xué)習(xí)方法,按以下步驟進(jìn)行:步驟一、從給定的輸入高光譜圖像數(shù)據(jù)集中獲取訓(xùn)練樣本和測試樣本;步驟二、利用訓(xùn)練樣本集構(gòu)造多核學(xué)習(xí)模型中的基核矩陣Km,得到基核矩陣集步驟三、利用基核矩陣集在希爾伯特核空間度量高光譜圖像數(shù)據(jù)集類內(nèi)離散度和類間離散度;步驟四、在類內(nèi)離散度和類間離散度基礎(chǔ)上以最大類別間隔準(zhǔn)則度量類別可分性,以類別可分性最大為多核學(xué)習(xí)模型求解準(zhǔn)則,求解基核權(quán)重。本實(shí)施方式包括以下有益效果:1、由于是以后續(xù)分類應(yīng)用為目的對多核學(xué)習(xí)模型進(jìn)行求解,即在多核學(xué)習(xí)模型求解過程中以最大類別可分為準(zhǔn)則,因此能改善分類性能,比單核方法分類精度提高2%左右,比主流的多核學(xué)習(xí)方法分類精度提高1%左右;2、由于可以直接獲得多核學(xué)習(xí)模型的閉合解,不需要對多核模型進(jìn)行迭代求解,因此能提高算法運(yùn)算效率。具體實(shí)施方式二:本實(shí)施方式與具體實(shí)施方式一不同的是:所述步驟一中從給定的輸入高光譜圖像數(shù)據(jù)集中獲取訓(xùn)練樣本和測試樣本;具體過程為:步驟一一、給定的輸入高光譜圖像數(shù)據(jù)集為:xi∈RF其中,T代表輸入高光譜圖像數(shù)據(jù)集中的樣本總數(shù),輸入高光譜圖像數(shù)據(jù)集Xinput中包含C類樣本,第l類樣本數(shù)為Nl;1≤l≤C;xi為輸入高光譜圖像數(shù)據(jù)集中第i個(gè)樣本,RF為代表維數(shù)為F的空間,F(xiàn)為輸入高光譜圖像數(shù)據(jù)集的特征維數(shù),i為正整數(shù);步驟一二、從輸入高光譜圖像數(shù)據(jù)集Xinput中按每類p%隨機(jī)選取出樣本組成訓(xùn)練樣本集:其中,p由輸入數(shù)據(jù)復(fù)雜度和后續(xù)應(yīng)用要求共同決定,p為0.5-10,N為訓(xùn)練樣本總數(shù),用余下1-p%樣本組成測試樣本集測試樣本總數(shù)為T-N,T、N、C、F為正整數(shù)。其它步驟及參數(shù)與具體實(shí)施方式一相同。具體實(shí)施方式三:本實(shí)施方式與具體實(shí)施方式一或二不同的是:所述步驟二中利用訓(xùn)練樣本集構(gòu)造多核學(xué)習(xí)模型中的基核矩陣Km,得到基核矩陣集合基核矩陣構(gòu)造方式如下:將訓(xùn)練樣本集中樣本依次成對輸入到高斯核函數(shù)計(jì)算基核矩陣其中σm是高斯核尺度參數(shù),xj為訓(xùn)練樣本集中第j個(gè)樣本,i、j為正整數(shù)。其它步驟及參數(shù)與具體實(shí)施方式一或二相同。具體實(shí)施方式四:本實(shí)施方式與具體實(shí)施方式一至三之一不同的是:所述步驟二中多核學(xué)習(xí)模型為如下線性模型:s.t.dm≥0,and||d||p=c,其中,dm是第m個(gè)基核矩陣Km的權(quán)重系數(shù),1≤m≤M,M是基核矩陣總數(shù),M為正整數(shù),||·||p是向量或矩陣的p范數(shù),K(xi,xj)為經(jīng)過多核學(xué)習(xí)得到的組合核矩陣,d為多核學(xué)習(xí)模型中的基核權(quán)重向量,c為權(quán)重向量d的約束值,Km(xi,xj)為第m個(gè)基核矩陣。其它步驟及參數(shù)與具體實(shí)施方式一至三之一相同。具體實(shí)施方式五:本實(shí)施方式與具體實(shí)施方式一至四之一不同的是:所述高斯核尺度參數(shù)σm為[0.05:0.05:2],M=40。其它步驟及參數(shù)與具體實(shí)施方式一至四之一相同。具體實(shí)施方式六:本實(shí)施方式與具體實(shí)施方式一至五之一不同的是:所述步驟三中利用基核矩陣集合在希爾伯特核空間度量高光譜圖像數(shù)據(jù)集類內(nèi)離散度和類間離散度;具體過程為:希爾伯特核空間中高光譜圖像數(shù)據(jù)集類內(nèi)離散度和類間離散度分別用類內(nèi)離散度矩陣的跡和類間離散度矩陣的跡來量化;類內(nèi)離散度矩陣的跡Tr(Sw)計(jì)算公式為:其中,Kjk為經(jīng)過多核學(xué)習(xí)得到的組合核矩陣中第j行第k列元素,為訓(xùn)練樣本集,為希爾伯特核空間中訓(xùn)練樣本集,為第i類訓(xùn)練樣本在核空間中的平均向量,表示基核矩陣Km中第i行第j列元素,ei表示單位矩陣的第i列,δj,k為克羅內(nèi)克符號,N為訓(xùn)練樣本總數(shù),C為數(shù)據(jù)集中樣本類別數(shù),Km為第m個(gè)基核矩陣;ni為第i類訓(xùn)練樣本數(shù),yj為第j個(gè)訓(xùn)練樣本的類別標(biāo)簽,為第i類訓(xùn)練樣本集標(biāo)簽,dm為第m個(gè)基核矩陣Km的權(quán)重;φ(xj)為希爾伯特核空間中第j個(gè)訓(xùn)練樣本,ek為表示單位矩陣的第k列,K為經(jīng)過多核學(xué)習(xí)得到的組合核矩陣,ej表示單位矩陣的第j列,sm、S為中間變量;i、k、j為正整數(shù);T為轉(zhuǎn)置;S=diag(s1,s2,...sm,...,sM),類間離散度矩陣的跡Tr(Sb)計(jì)算公式為:Tr(Sb)用來量化數(shù)據(jù)集類間離散度;其中是所有訓(xùn)練樣本的平均向量,B=diag(b1,b2,...bm,...,bM),bm、B為中間變量。其它步驟及參數(shù)與具體實(shí)施方式一至五之一相同。具體實(shí)施方式七、本實(shí)施方式與具體實(shí)施方式一至六之一不同的是:所述步驟四中在類內(nèi)離散度和類間離散度基礎(chǔ)上以最大類別間隔準(zhǔn)則度量類別可分性,以類別可分性最大為多核學(xué)習(xí)模型求解準(zhǔn)則,求解基核權(quán)重;具體過程為:所述的最大類別間隔準(zhǔn)則為:其中,λ>0是一個(gè)平衡參數(shù);利用1/2范數(shù)對基核權(quán)重向量d進(jìn)行約束,即最大化上述類別間隔準(zhǔn)則,得如下優(yōu)化問題:dm是d中第m個(gè)元素;利用拉格朗日乘子法對上訴最大值問題進(jìn)行求解,得如下解:其它步驟及參數(shù)與具體實(shí)施方式一至六之一相同。具體實(shí)施方式八、本實(shí)施方式與具體實(shí)施方式一至七之一不同的是:所述通過經(jīng)驗(yàn)確定,λ=0.5。其它步驟及參數(shù)與具體實(shí)施方式一至七之一相同。采用以下實(shí)施例驗(yàn)證本發(fā)明的有益效果:實(shí)施例一:本實(shí)施例一種最大化類別可分性的高光譜圖像分類多核學(xué)習(xí)方法具體是按照以下步驟制備的:1、實(shí)驗(yàn)數(shù)據(jù)UniversityofHouston高光譜圖像數(shù)據(jù)集,該數(shù)據(jù)集場景來源于美國休斯頓大學(xué),于2012年6月23日17:37:10到17:39:50間收集。傳感器平臺距地面平均高度為5500英尺,具有2.5米空間分辨率。包含144個(gè)波段,光譜范圍從380nm到1050nm,包括可見光和近紅外波段。觀測場景內(nèi)地物被劃分為15類,分別是:健康的草、衰敗的草、人工草、樹、裸地、水、居民樓、商業(yè)樓、道路、高速公路、鐵路、停車場1、停車場2、網(wǎng)球場和跑道。RGB假彩色合成圖和地物分布真實(shí)圖如圖2a、圖2b所示。對原始高光譜圖像進(jìn)行主成分分析,保留累計(jì)方差為99.78%的主成分。再在主成分基礎(chǔ)上利用尺度為[3,5,7,9,11,13,15,17,18,21]的菱形結(jié)構(gòu)元素進(jìn)行形態(tài)學(xué)特征提取。最終利用所提取的形態(tài)學(xué)特征進(jìn)行分類實(shí)驗(yàn)。2、實(shí)驗(yàn)內(nèi)容在實(shí)驗(yàn)中,采用本發(fā)明和已有四種方法對以上數(shù)據(jù)集進(jìn)行分類。已有四種方法包括單核方法(SK)、簡單多核學(xué)習(xí)(SimpleMKL)、代表性多核學(xué)習(xí)(RMKL)和平均多核學(xué)習(xí)(MeanMKL)。所有多核學(xué)習(xí)算法的核尺度范圍設(shè)置為[0.05:0.05:2]。使用支持向量機(jī)分類器,懲罰系數(shù)C和松弛變量ξ由交叉驗(yàn)證得到。選擇每類訓(xùn)練樣本數(shù)分別按10、30、50進(jìn)行分類實(shí)驗(yàn)。記錄十次運(yùn)行結(jié)果均值作為最終結(jié)果,并統(tǒng)計(jì)十次運(yùn)行結(jié)果方差。使用總體精度評估分類結(jié)果。表1為不同方法在不同訓(xùn)練樣本下的總體分類精度及其方差。表1不同方法在不同訓(xùn)練樣本下的總體分類精度及其方差分類方法103050SK83.80±1.8789.08±0.6689.36±0.36SimpleMKL79.47±1.3883.97±0.6084.52±0.28MeanMKL84.52±1.5289.94±0.7390.81±0.41RMKL84.59±1.6790.37±0.5691.19±0.39本發(fā)明方法85.15±1.5191.61±0.5792.40±0.31從實(shí)驗(yàn)結(jié)果可以看出本發(fā)明能明顯提高分類精度,改善分類性能。本發(fā)明還可有其它多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,本領(lǐng)域技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。當(dāng)前第1頁1 2 3