專利名稱:拉普拉斯正則化最小二乘合成孔徑雷達自動目標識別方法
技術領域:
本發(fā)明屬于雷達技術領域,涉及一種模式識別技術的具體應用,具體地說是一種拉普拉斯Laplacian正則化最小二乘合成孔徑雷達SAR自動目標識別方法。該方法可用于解決基于二維SAR圖像的識別問題。
背景技術:
SAR技術在對地面目標,特別是對靜止目標探測方面的獨特優(yōu)勢,以及其在現(xiàn)代戰(zhàn)場感知、對地面打擊等領域的良好應用前景,使得基于SAR圖像的自動目標識別技術ATR受到了越來越多的重視。目前針對SAR圖像的自動目標識別學者們已經(jīng)進行了多方面的研究,提出了各種方法,這些方法都是基于目標模型的識別方法。目標模型的描述方法通常分為兩類基于模板的目標描述方法和基于模型的目標描述方法。基于模板的目標描述方法通過一些典型的目標特征樣本來描述每一類目標,基于模型的目標描述方法利用隱馬爾可夫模型或神經(jīng)網(wǎng)絡模型來描述每一類目標特征,這些方法都存在一定的不足和缺陷。
1998年,美國的Timothy Ross等人提出一種基于模板匹配的SAR自動目標識別方法,并以此結果作為標準,向該領域征集更優(yōu)的ATR方法。該方法是在圖像域內(nèi),將樣本按10°方位間隔分組,在每一個方位單元內(nèi)利用樣本均值作為模板,用最小距離分類法進行分類。由于模板匹配法是利用樣本的均值作為模板,其與樣本圖像的幾何形狀有直接關系,同時SAR目標圖像對方位比較敏感,所以方位間隔越小,形成的模板質(zhì)量越高,匹配效果越好,但是需要對方位有較好的估計,并且隨著模板數(shù)量的增加,所需存儲空間增大。
同樣在1998年,Theera-Umpon提出利用形態(tài)學權值共享神經(jīng)網(wǎng)絡來解決SAR圖像中軍用車輛的檢測和識別問題。這種處理方法基于如下事實異類神經(jīng)網(wǎng)絡能夠同時學習特征提取和分類。權值共享神經(jīng)網(wǎng)絡和形態(tài)學權值共享神經(jīng)網(wǎng)絡是異類神經(jīng)網(wǎng)絡的一種。這些神經(jīng)網(wǎng)絡由兩個階段組成特征提取階段和分類階段。此方法只能對兩類目標進行分類識別,由于神經(jīng)網(wǎng)絡的輸入是一塊圖像,因此網(wǎng)絡的訓練計算量較大。在目標類較多的情況下,可能導致網(wǎng)絡訓練無法收斂。
2001年,Qun Zhao對樣本不做任何特征提取,將樣本按30°方位分組,在每一個方位單元內(nèi)建立支撐矢量機SVM分類器,識別時利用目標的方位信息選出相應方位單元的分類器進行分類。雖然SVM適合解決小樣本高維模式分類問題,但在按10°方位間隔分組時,樣本數(shù)目過于少,每類目標在每個方位單元內(nèi)只有6~7個訓練樣本,訓練性能較差,在此情況下達不到較高的識別率。另外,該方法沒有經(jīng)過特征提取的預處理,一方面會因為噪聲的存在降低識別率,另一方面達不到降維的目的,給計算帶來負擔。
目前,已經(jīng)有學者將核主成分分析KPCA的特征提取方法對SAR目標進行預處理,然后用SVM進行目標識別,與上述的方法相比該方法的識別率有一定的提高,但在訓練樣本過于少的情況下,比如按10°方位間隔分組,訓練性能同樣會較差。
發(fā)明內(nèi)容
本發(fā)明的目的在于為了克服現(xiàn)有技術的不足,提出了一種拉普拉斯正則化最小二乘合成孔徑雷達自動目標識別方法,以提高SAR圖像的目標識別率,并且對方位不需要精確的估計,在小樣本情況下仍然可以獲得很好的識別效果。
本發(fā)明的技術方案是將待識別的SAR目標圖像看作是半監(jiān)督學習中訓練集的無標識樣本,通過轉導推理得到標識。首先將運動、靜止目標獲取與識別MSTAR數(shù)據(jù)庫中的全部樣本采用KPCA進行特征提取,再將訓練集數(shù)據(jù)全部作為有標識樣本,測試集數(shù)據(jù)全部作為無標識樣本來建立一個無向加權圖G=(V,E),將數(shù)據(jù)點看作G的頂點V,并定義成對數(shù)據(jù)點的相似度為無向加權圖的邊,然后用圖的方法逼近流形,在全局上要求滿足光滑性的假設,并將它作為一個正則項,添加到正則化最小二乘分類RLSC中,稱為拉普拉斯正則化最小二乘分類LapRLSC,求解對應的優(yōu)化問題,最后用訓練得到的分類函數(shù)對無標識樣本進行分類。該方法的具體實現(xiàn)步驟如下 (1)輸入l個有標識樣本{(xi,yi)i=1l,l是訓練集樣本的個數(shù),xi表示第i個樣本,用一個行向量表示,yi是該樣本所屬的類別標號,輸入u個無標識樣本{xj}j=l+1l+u,u是測試集樣本的個數(shù),xj表示第j個樣本,也用一個行向量表示,用l+u個數(shù)據(jù)點建立一個鄰接圖,數(shù)據(jù)點看作鄰接圖的頂點,定義Wij為鄰接圖的邊,是成對數(shù)據(jù)點的相似性度量,上述的鄰接圖可以選擇n近鄰或者圖核,n為近鄰個數(shù),邊的權值選擇0或1的二值權; (2)計算第(1)步得到的鄰接圖的Laplacian矩陣L=D-W,其中L表示Laplacian矩陣,D是一個對角矩陣,即第i個點到其它各點的權值之和,其值越大表示該點越重要; (3)采用一個核函數(shù)K(xi,xj)對第(1)步所說的l+u個數(shù)據(jù)點,計算核矩陣K,Kij=K(xi,xj),Kij表示樣本i和樣本j的相似性; (4)選擇正則化參數(shù)γA和γI;它們分別控制周圍空間函數(shù)的復雜性和邊緣分布的內(nèi)在幾何函數(shù)的復雜性,該兩參數(shù)的確定可以采用簡單的網(wǎng)格搜索方法來實現(xiàn); (5)采用上述(1)~(4)步得到的結果,計算向量α*,其計算公式如下 其中J是一個(l+u)×(l+u)的對角矩陣,J=diag(1,...1,0,...,0),Y是一個(l+u)維的標識向量,Y=[y1,...yl,0,...0]; (6)輸出分類函數(shù)x表示一個測試集樣本,即待識別目標,對于兩類的分類問題,根據(jù)分類函數(shù)的正負來分類,對于多類的分類問題,則采用“一對多“的策略,把有標識的當前類作為+1類,有標識的剩余樣本作為-1類,無標識的樣本全部標為0。當有C類時,得到C個分類函數(shù),對無標識的每一個樣本都有C個函數(shù)值,取其中最大的一個所對應的類別作為該樣本所屬的類別。
上述的拉普拉斯正則化最小二乘SAR自動目標識別方法,第(3)步所說的核函數(shù)的計算,可以選用以下幾種核函數(shù)來進行計算 ①多項式核函數(shù)k(x,y)=(a(x·y)+b)d,x,y表示兩個樣本,每個樣本用一個向量表示,a,b,d均表示多項式核函數(shù)的參數(shù); ②高斯核函數(shù)σ2表示高斯核函數(shù)的參數(shù); ③Sigmoid核函數(shù)k(x,y)=tanh(α(x·y)+β),α,β表示Sigmoid核函數(shù)的參數(shù)。
本發(fā)明采用了高斯核函數(shù),參數(shù)σ2通過核-目標配準方法,在某個參數(shù)范圍上搜索,找到使得到最大值的σ2,其中K′是關于有標識樣本的核矩陣,y是有標識樣本的標號列向量,yT表示y的轉置。
上述的Laplacian正則化最小二乘SAR自動目標識別方法,所說的通過表達式得到α*,其實現(xiàn)過程如下 根據(jù)再生核希爾伯特空間RKHS的兩個重要事實 第一,正則化最小二乘問題可以用來表示,其中H表示再生核希爾伯特空間。該問題的解存在并且唯一,由“表示理論”給出解的表達形式 第二,‖f‖K2可以表示成下面的式子 α是待優(yōu)化的列向量。
那么將其擴展到拉普拉斯正則化最小二乘法,它需要解決下式所表示的優(yōu)化問題 其解可以表達為將和代入中得到
對它求關于α的偏導數(shù),并令該偏導數(shù)等于零,即求解則得到解的表達式 本發(fā)明通過上述步驟,拉普拉斯正則化最小二乘SAR自動目標識別方法最終輸出識別結果。
本發(fā)明與現(xiàn)有技術相比具有如下優(yōu)點 1.識別率高,對方位具有較好的魯棒性,實現(xiàn)簡單 為了驗證拉普拉斯正則化最小二乘SAR自動目標識別方法的優(yōu)越性,我們將其與模板匹配法和SVM進行了比較。仿真實驗表明,與模板匹配法相比,拉普拉斯正則化最小二乘SAR自動目標識別方法不需要對方位估計有較高的精度,并且不需要大量的空間來存儲模板,與SVM相比,拉普拉斯正則化最小二乘SAR自動目標識別方法實現(xiàn)簡單,僅僅需要求解一個線性方程系統(tǒng),復雜度的計算很明確,需要O((l+u)3),l+u為訓練集和測試集樣本的總個數(shù)。針對SAR自身的特點,其在360°方位范圍內(nèi)對目標的成像數(shù)目有限,數(shù)據(jù)量不大,該方法依然可以很快地求解。而SVM需要求解一個凸的二次規(guī)劃問題,它通常對解有個稀疏的表示,實現(xiàn)起來比較復雜,對資源的需求也不能通過簡單的分析得到。此外拉普拉斯正則化最小二乘SAR自動目標識別方法在10°、30°、90°、180°、和360°方位間隔分組內(nèi)均比模板匹配法和SVM的識別率要高。盡管在10°方位間隔分組時,樣本數(shù)目很少,每類目標在每個方位單元內(nèi)只有6~7個樣本,識別率仍然可以達到95%左右,說明該方法對小樣本問題仍然可行。
2.理論上具有合理性 拉普拉斯正則化最小二乘分類問題可以用下面的式子來表示 它是在正則化最小二乘分類上加了有關無標識樣本的一個正則化項,可以證明 其中L=D-W,L是一個有限半正定的矩陣,可以看成定義在圖上的算子,根據(jù)譜圖理論-如果數(shù)據(jù)均勻取樣自高維空間中的低維流形,流形上的Laplacian-Beltrami算子可以由圖的Laplacian逼近,其最前面的幾個特征向量就是流形上的Laplacian-Beltrami算子特征函數(shù)的離散逼近,那么L就相當于流形學習中的Laplacian-Beltrami算子。
圖1是本發(fā)明實現(xiàn)步驟的流程原理框圖 圖2是本發(fā)明針對的SAR目標圖像,其中圖2(a)是BMP2裝甲車;圖2(b)是RTR70裝甲車;圖2(c)是T72坦克 圖3是10°方位間隔分組時各方法的性能比較圖 圖4是30°方位間隔分組時各方法的性能比較圖 圖5是90°方位間隔分組時各方法的性能比較圖 圖6是180°方位間隔分組時各方法的性能比較圖 圖7是360°方位間隔分組時各方法的性能比較圖 圖8是正則化最小二乘和Laplacian正則化最小二乘的性能比較圖 圖9是在測試集樣本不參與訓練的情況下,識別誤差率隨訓練集中有標識樣本的個數(shù)變化的曲線圖 圖10是在測試集樣本參與訓練的情況下,識別誤差率隨訓練集中有標識樣本的個數(shù)變化的曲線圖
具體實施例方式 參照圖1和圖2,圖1是本發(fā)明實現(xiàn)步驟的流程原理框圖,圖2是本發(fā)明的主要針對的目標圖像,訓練集是MSTAR數(shù)據(jù)中17°俯視角的圖像,測試集是MSTAR數(shù)據(jù)中15°俯視角的圖像。
針對SAR自動目標識別的具體問題,對本發(fā)明設計的基于KPCA特征提取和Laplacian正則化最小二乘SAR自動目標識別方法具體描述如下 先進行預處理,從原始128×128的圖像中心截取60×60的區(qū)域,該區(qū)域包含了整個目標,而去除了多余的背景區(qū)域。在此基礎上利用KPCA提取各自目標圖像35維特征,并進行歸一化到[-1,1]。
將每一類訓練樣本在0°~360°方位范圍內(nèi),按等方位間隔分為P組,比如方位間隔為10°,則分為36組,在每一組上進行測試,將36組得到的測試結果做平均。其中P為分成的組數(shù)。
結合圖1可以看出本發(fā)明的具體實現(xiàn)步驟如下 (1)輸入l個有標識樣本{(xi,yi)}i=1l,l是訓練集樣本的個數(shù),xi表示第i個樣本,用一個行向量表示,yi是該樣本所屬的類別標號,輸入u個無標識樣本{xj}j=l+1l+u,u是測試集樣本的個數(shù),xj表示第j個樣本,也用一個行向量表示,用l+u個數(shù)據(jù)點建立一個鄰接圖,數(shù)據(jù)點看作鄰接圖的頂點,定義Wij為鄰接圖的邊,是成對數(shù)據(jù)點的相似性度量,上述的鄰接圖可以選擇n近鄰或者圖核,n為近鄰個數(shù),邊的權值選擇0或1的二值權; (2)計算第(1)步得到的鄰接圖的Laplacian矩陣L=D-W,其中L表示Laplacian矩陣,D是一個對角矩陣,即第i個點到其它各點的權值之和,其值越大表示該點越重要; (3)選擇一個核函數(shù)計算(l+u)×(l+u)的核矩陣K,Kij=K(xi,xj),Kij表示樣本i和樣本j的相似性; (4)選擇正則化參數(shù)γA和γI;它們分別控制周圍空間函數(shù)的復雜性和邊緣分布的內(nèi)在幾何函數(shù)的復雜性,該兩參數(shù)的確定可以采用簡單的網(wǎng)格搜索方法來實現(xiàn); (5)采用上述(1)~(4)步得到的結果,計算向量α*,其計算公式如下 其中J是一個(l+u)×(l+u)的對角矩陣,J=diag(1,...1,0,...,0),Y是一個(l+u)維的標識向量,Y=[y1,...yl,0,...0]; (6)輸出分類函數(shù)x表示一個測試集樣本,即待識別目標,對于兩類的分類問題,根據(jù)分類函數(shù)的正負來分類,對于多類的分類問題,則采用“一對多“的策略,把有標識的當前類作為+1類,有標識的剩余樣本作為-1類,無標識的樣本全部標為0。當有C類時,得到C個分類函數(shù),對無標識的每一個樣本都有C個函數(shù)值,取其中最大的一個所對應的類別作為該樣本所屬的類別。
本發(fā)明采用了高斯核函數(shù),參數(shù)σ2通過核-目標配準方法,在參數(shù)范圍lnσ2={-10∶1∶10}上搜索,找到使得到最大值的σ2,其中K′是關于有標識樣本的核矩陣,y是有標識樣本的標號列向量,yT表示y的轉置。
為了驗證在KPCA提取特征的基礎上用拉普拉斯正則化最小二乘SAR自動目標識別方法的優(yōu)越性,我們將其與模板匹配法和SVM,以及線性主成分分析PCA+SVM,KPCA+SVM,KPCA+RLSC的方法通過以下仿真實驗進行了比較。以下仿真實驗中用KPCA提取目標圖像的35維特征,并歸一化到[-1,1]。采用的近鄰個數(shù)是6,高斯核函數(shù)的σ2在1~e2范圍內(nèi)取值,γA和
分別取0.005和0.045。
Laplacian正則化最小二乘在不同方位間隔分組內(nèi)的識別率與其它方法的比較 (1)Laplacian正則化最小二乘在10°方位間隔分組的識別率與其它方法的比較 參照圖3,它是10°方位間隔分組時各方法的性能比較圖。本實驗是將每一類訓練樣本在0°~360°方位范圍內(nèi),按等方位間隔10°分為36組,在每一組上進行測試,將36組得到的測試結果做平均。在每一組上,σ2通過核-目標配準方法,在參數(shù)范圍lnσ2={-10∶1∶10}上搜索,找到使得到最大值的σ2,此時K′為有標識樣本的核矩陣,y是有標識樣本的標號列向量,也就是說核參數(shù)σ2的確定只用到有標識的樣本。10°方位間隔分組內(nèi)各識別方法模板匹配法、SVM、線性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的識別結果分別用1、2、3、4、5、6所標注。
(2)Laplacian正則化最小二乘在30°方位間隔分組的識別率與其它方法的比較 參照圖4,它是30°方位間隔分組時各方法的性能比較圖。本實驗是將每一類訓練樣本在0°~360°方位范圍內(nèi),按等方位間隔30°分為12組,在每一組上進行測試,將12組得到的測試結果做平均。在每一組上,σ2與上述(1)一樣,用核-目標配準方法得到,搜索范圍為lnσ2={-10∶1∶10}。30°方位間隔分組內(nèi)各識別方法模板匹配法、SVM、線性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的識別結果分別用1、2、3、4、5、6所標注。
(3)Laplacian正則化最小二乘在90°方位間隔分組的識別率與其它方法的比較 參照圖5,它是90°方位間隔分組時各方法的性能比較圖。本實驗是將每一類訓練樣本在0°~360°方位范圍內(nèi),按等方位間隔90°分為4組,在每一組上進行測試,將4組得到的測試結果做平均。在每一組上,σ2與上述(1)一樣,用核-目標配準方法得到,搜索范圍為lnσ2={-10∶1∶10}。90°方位間隔分組內(nèi)各識別方法線性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的識別結果分別用1、2、3、4所標注。
(4)Laplacian正則化最小二乘在180°方位間隔分組的識別率與其它方法的比較 參照圖6,它是180°方位間隔分組時各方法的性能比較圖。本實驗是將每一類訓練樣本在0°~360°方位范圍內(nèi),按等方位間隔180°分為2組,在每一組上進行測試,將2組得到的測試結果做平均。在每一組上,σ2與上述(1)一樣,用核-目標配準方法得到,搜索范圍為lnσ2={-10∶1∶10}。180°方位間隔分組內(nèi)各識別方法線性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的識別結果分別用1、2、3、4所標注。
(5)Laplacian正則化最小二乘在360°方位范圍內(nèi)的識別率與其它方法的比較 參照圖7,它是360°方位間隔分組時各方法的性能比較圖。本實驗是將每一類訓練樣本在0°~360°方位范圍內(nèi),按方位間隔360°,成為一組,在這一組上進行測試。σ2與上述(1)一樣,用核-目標配準方法得到,搜索范圍為lnσ2={-10∶1∶10}。最后將該方位范圍的測試結果作為最終結果。360°方位范圍內(nèi)各識別方法線性PCA+SVM、KPCA+SVM、KPCA+RLSC以及KPCA+LapRLSC的識別結果分別用1、2、3、4所標注。
正則化最小二乘和Laplacian正則化最小二乘的性能比較 參照圖8,它是正則化最小二乘和Laplacian正則化最小二乘的性能比較圖,圖中識別方法中的1和2分別表示用RLSC對訓練集中無標識樣本和測試集樣本進行分類的結果,識別方法3和4分別表示用LapRLSC對訓練集中無標識樣本和測試集樣本進行分類的結果。訓練集中隨機取150個有標識的樣本。訓練集中有不同個數(shù)的有標識樣本時,用LapRLSC方法的識別誤差率 (1)訓練過程只包含訓練集中有標識和無標識樣本,測試集不參與訓練 從訓練集的每類中隨機取出個數(shù)相同的有標識樣本,依次為20~100個,用轉導推理對無標識樣本進行標識,即LapRLSC-U(transductive),用只包含訓練集樣本信息的分類函數(shù),對測試集樣本分類,即LapRLSC-T(out-of-sample),做10次實驗取平均,識別結果如圖9所示。
(2)訓練過程包含訓練集中的有標識樣本,訓練集剩余無標識樣本和測試集樣本全部作為無標識樣本 從訓練集的每類中隨機取出個數(shù)相同的有標識樣本,依次為20~100個,對所有的無標識樣本通過轉導推理transductive賦予標識,即LapRLSC-U(transductive)表示用LapRLSC通過轉導推理對訓練集中無標識樣本進行標識,LapRLSC-U(transductive)表示用LapRLSC通過轉導推理對測試集樣本進行標識,做10次實驗取平均,識別結果如圖10所示。
仿真實驗結果分析 SVM是沒有做任何特征提取,將樣本按10°或30°方位間隔分組,在每一個方位單元內(nèi)建立SVM分類器。從圖3和圖4可以看到,KPCA+LapRLSC在各個方位間隔分組內(nèi)均比模板匹配法,SVM,線性PCA+SVM,KPCA+SVM和KPCA+RLSC的識別率要高,給出KPCA+RLSC的仿真結果是為了說明它可以獲得與其它方法相比的結果,進而將其擴展成為半監(jiān)督的LapRLSC。
從圖5~圖7可以看到,KPCA+LapRLSC在90°、180°和360°方位間隔分組內(nèi)比線性PCA+SVM、KPCA+SVM以及KPCA+RLSC的識別率都要高,并且都達到了98%以上。
圖8說明在只有150個有標識的樣本參與訓練的情況下,RLSC對訓練集中無標識樣本的正確率95.77%要高于RLSC對測試樣本集的正確率91.86%,而在有150個有標識的樣本和548個無標識樣本參與訓練的情況下,LapRLSC對訓練集中無標識樣本的正確率98.69%要高于LapRLSC對測試樣本集的正確率95.13%,LapRLSC不論是對無標識樣本還是對測試集樣本的識別率都要高于RLSC。原因分析對于RLSC,它是一個全監(jiān)督的方法,只有150個有標識的樣本參與訓練,548個無標識樣本相當于測試集中的樣本,對訓練集中無標識樣本的正確率95.77%要高于對測試樣本集的正確率91.86%,是因為無標識的548個樣本與有標識的150個樣本同屬于17°俯視角下的樣本集中,相似性較高,而測試集的1169個樣本是15°俯視角下的圖像。對于LapRLSC,它是一個半監(jiān)督的方法,有150個有標識和548個無標識樣本參與訓練,參與了鄰接圖的建立和對鄰接圖求Laplacian的過程,通過挖掘有標識樣本和無標識樣本的相對位置再對548個無標識樣本進行標識,而測試集的樣本沒有參與這一過程,所以對訓練集中無標識樣本的正確率98.69%要高于對測試樣本集的正確率95.13%。
LapRLSC無論是對訓練集中的無標識樣本進行標識,還是對測試集樣本進行分類的結果都比RLSC要好,因為RLSC僅僅利用了150個有標識的訓練樣本得到分類函數(shù),對無標識和測試樣本進行分類,而LapRLSC對150個有標識樣本和548個無標識樣本進行學習,再用學習得到的分類函數(shù)對測試集樣本進行分類。主要區(qū)別是LapRLSC用了有標識樣本和無標識樣本共同來建立鄰接圖,求鄰接圖的Laplacian,RLSC沒有這一步。
圖9說明隨著訓練集中有標識樣本數(shù)目的增加,對無標識樣本和測試集樣本的識別誤差率都會下降,圖10也能說明同樣的問題。所不同的是,圖9的結果是在只有訓練集的有標識和無標識樣本參與訓練,測試集樣本沒有當作無標識樣本參與訓練的情況下得到的,而圖10的結果是除了訓練集的有標識樣本和無標識樣本參與訓練以外,測試集樣本也全部作為無標識樣本參與訓練的情況下得到的,可以看到,圖10所示的情況下對無標識樣本LapRLSC-U(transductive)和測試集樣本LapRLSC-T(transductive)的誤差率都比圖9所示的情況下對無標識樣本LapRLSC-U(transductive)和測試集樣本LapRLSC-T(out-of-sample)要低。原因是測試樣本參與了訓練,通過轉導推理得到標識的正確率要比其不參與訓練直接用分類函數(shù)得到的正確率要高。
總之,本發(fā)明在基于KPCA特征提取的基礎上用Laplacian正則化最小二乘SAR自動目標識別方法達到了較高的識別率,與傳統(tǒng)的模板匹配法、有特征提取和沒有特征提取的基于SVM的方法相比,對方位具有更好的魯棒性,降低了對目標方位信息估計的精度要求,并且不像模板匹配法需要大量的空間存儲模板,在小樣本的情況下也可以獲得較高的識別率。
算法參數(shù)影響分析 用于SAR自動目標識別的Laplacian正則化最小二乘方法主要有5個設定的初始參數(shù),即鄰接圖的近鄰個數(shù)n,訓練集中有標識樣本的個數(shù)l,高斯核函數(shù)K(xi,xj)=exp(-‖xi-xj‖2/2σ2)的寬度σ2,控制周圍空間中函數(shù)的復雜性γA,和控制分布的內(nèi)在幾何結構函數(shù)的復雜性
其中鄰接圖的近鄰個數(shù)n,在此算法中不敏感,實驗中設為6不變,在其它參數(shù)不變的情況下,訓練集中有標識樣本的個數(shù)l越大,越有利于提高識別率,因此本發(fā)明提出利用全部的有標識的樣本,只將測試集樣本作為無標識樣本。所以主要考慮核函數(shù)的寬度σ2,以及γA和
對識別率的影響。
1.核函數(shù)的寬度σ2對識別率算法性能的影響 基于核的學習算法將數(shù)據(jù)嵌入在核的核矩陣中。核的寬度σ2過大或者過小都會使識別率下降。如果能建立起目標與核函數(shù)之間的匹配程度的一種度量,則可為確定最優(yōu)核參數(shù)提供依據(jù)。配準的一個關鍵特性是它的實際值可以通過經(jīng)驗值有效估計,因此為每一個σ2計算核矩陣K′,只要找到使最大的σ2即為最優(yōu)的σ2。本發(fā)明中在參數(shù)范圍lnσ2={-10∶1∶10}上搜索,得到在不同的目標方位范圍內(nèi)高斯核函數(shù)的σ2有較小的不同,都在1~e2的范圍內(nèi)。
2.γA和
對識別率的影響 γA和
分別控制周圍空間中函數(shù)的復雜性和控制分布的內(nèi)在幾何結構函數(shù)的復雜性,針對不同的有標識樣本和無標識樣本的比例有所不同,從圖9可以看到在有標識樣本數(shù)目改變時,曲線不是嚴格下降的,就是因為有標識和無標識樣本數(shù)目的比例變了,而兩個參數(shù)保持不變。所以本發(fā)明針對全部訓練集作為有標識樣本,全部測試集作為無標識樣本的樣本數(shù)目比例固定的情況下,采用網(wǎng)格搜索法找到最佳的參數(shù)組合,分別設置為0.005和0.045。
權利要求
1.一種拉普拉斯正則化最小二乘SAR自動目標識別方法,其具體實現(xiàn)步驟如下
(1)輸入l個有標識樣本{(xi,yi)}i=1l,l是訓練集樣本的個數(shù),xi表示第i個樣本,用一個行向量表示,yi是該樣本所屬的類別標號,輸入u個無標識樣本{xj}j=l+1l+u,u是測試集樣本的個數(shù),xj表示第j個樣本,也用一個行向量表示,用l+u個數(shù)據(jù)點建立一個鄰接圖,數(shù)據(jù)點看作鄰接圖的頂點,定義Wij為鄰接圖的邊,是成對數(shù)據(jù)點的相似性度量,上述的鄰接圖可以選擇n近鄰或者圖核,n為近鄰個數(shù),邊的權值選擇0或1的二值權;
(2)計算第(1)步得到的鄰接圖的Laplacian矩陣L=D-W,其中L表示Laplacian矩陣,D是一個對角矩陣,即第i個點到其它各點的權值之和,其值越大表示該點越重要;
(3)采用一個核函數(shù)K(xi,xj)對第(1)步所說的l+u個數(shù)據(jù)點,計算核矩陣K,Kij=K(xi,xj),Kij表示樣本i和樣本j的相似性;
(4)選擇正則化參數(shù)γA和γI;它們分別控制周圍空間函數(shù)的復雜性和邊緣分布的內(nèi)在幾何函數(shù)的復雜性,該兩參數(shù)的確定可以采用簡單的網(wǎng)格搜索方法來實現(xiàn);
(5)采用上述(1)~(4)步得到的結果,計算向量α*,其計算公式如下
其中J是一個(l+u)×(l+u)的對角矩陣,J=diag(1,...1,0,...,0),Y是一個(l+u)維的標識向量,Y=[y1,...yl,0,...0];
(6)輸出分類函數(shù)x表示一個測試集樣本,即待識別目標,對于兩類的分類問題,根據(jù)分類函數(shù)的正負來分類,對于多類的分類問題,則采用“一對多“的策略,把有標識的當前類作為+1類,有標識的剩余樣本作為-1類,無標識的樣本全部標為0。當有C類時,得到C個分類函數(shù),對無標識的每一個樣本都有C個函數(shù)值,取其中最大的一個所對應的類別作為該樣本所屬的類別。
2.根據(jù)權利要求1所述的拉普拉斯正則化最小二乘SAR自動目標識別方法,所說的核函數(shù)的計算,可以選用以下幾種核函數(shù)來進行計算
①多項式核函數(shù)k(x,y)=(a(x·y)+b)d,x,y表示兩個樣本,每個樣本用一個向量表示,a,b,d均表示多項式核函數(shù)的參數(shù);
②高斯核函數(shù)σ2表示高斯核函數(shù)的參數(shù);
③Sigmoid核函數(shù)k(x,y)=tanh(α(x·y)+β),α,β表示Sigmoid核函數(shù)的參數(shù)。
本方法采用了高斯核函數(shù),參數(shù)σ2通過核-目標配準方法,在某個參數(shù)范圍上搜索,找到使得到最大值的σ2,其中K′是關于有標識樣本的核矩陣,y是有標識樣本的標號列向量,yT表示y的轉置。
3.根據(jù)權利要求1所述的Laplacian正則化最小二乘SAR自動目標識別方法,所說的通過得到α*,其實現(xiàn)過程如下
根據(jù)再生核希爾伯特空間RKHS的兩個重要事實
第一,正則化最小二乘問題可以用來表示,其中H表示再生核希爾伯特空間。該問題的解存在并且唯一,由“表示理論”給出解的表達形式
第二,‖f‖K2可以表示成下面的式子
α是待優(yōu)化的列向量。
那么將其擴展到拉普拉斯正則化最小二乘法,它需要解決下式所表示的優(yōu)化問題
其解可以表達為將和代入中得到
對它求關于α的偏導數(shù),并令該偏導數(shù)等于零,即求解則得到解的表達式
全文摘要
本發(fā)明公開了一種拉普拉斯正則化最小二乘合成孔徑雷達自動目標識別方法,它涉及雷達技術領域,其目的在于采用該方法以提高SAR目標圖像的識別率,對方位具有較好的魯棒性。該方法的實現(xiàn)步驟為首先將MSTAR數(shù)據(jù)庫中的全部樣本采用KPCA進行特征提取,再將訓練集數(shù)據(jù)全部作為有標識樣本,測試集數(shù)據(jù)全部作為無標識樣本來建立一個無向加權圖G=(V,E),將數(shù)據(jù)點看作G的頂點V,并定義成對數(shù)據(jù)點的相似度為該圖的邊,然后求該圖的Laplacian,將它作為一個正則項,添加到正則化最小二乘分類中,稱為拉普拉斯正則化最小二乘分類,求解對應的優(yōu)化問題,最后用訓練得到的分類函數(shù)對無標識樣本進行分類。該方法可用于解決基于二維SAR圖像的識別問題。
文檔編號G01S13/90GK101196564SQ20071019927
公開日2008年6月11日 申請日期2007年12月18日 優(yōu)先權日2007年12月18日
發(fā)明者張向榮, 焦李成, 春 陽, 公茂果, 芳 劉 申請人:西安電子科技大學