本發(fā)明涉及目標識別技術(shù),特別是一種基于概率閾值的logistic-svm目標識別算法。
背景技術(shù):
以坦克為主要代表的各式裝甲目標在現(xiàn)代戰(zhàn)場上占據(jù)越來越重要的地位,并開始主導陸地戰(zhàn)場,所以對此類裝甲目標實施準確有效的打擊成為目前彈藥武器的主要發(fā)展方向。毫米波技術(shù)與微波技術(shù)相比,具有精度高、抗干擾能力強、低仰角探測性能好、體積小、重量輕等優(yōu)勢;與紅外和激光技術(shù)相比,具有抗煙塵能力強、可有效識別環(huán)境中的金屬目標等優(yōu)勢。國內(nèi)外開展了大量有關智能彈藥毫米波探測器的干擾技術(shù)研究,因此抗波形干擾的信號特征提取與識別技術(shù)變得格外重要。
信號特征識別問題屬于單分類問題,logistic回歸算法和svm算法都是常見的分類算法。論文“一種基于logistic回歸模型的atr算法性能評估方法”中介紹了一種基于logistic回歸的分類方法;logistic回歸相對來說模型更簡單,好理解,實現(xiàn)起來,特別是大規(guī)模線性分類時比較方便,但是針對非線性可分問題時,易引入更多的冗余高次項,導致模型復雜度大幅提高。論文“trackingofobjectwithsvmregression”中介紹了一種基于svm分類的追蹤方法;這種方法復雜度高,支持數(shù)量較多時計算法較大,導致了分類速度必然較慢。且在處理非線性可分問題時,采用核函數(shù)方法,嚴重依賴樣本數(shù)據(jù),而樣本數(shù)據(jù)往往存在一定偏差,導致結(jié)果出現(xiàn)誤差。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種基于概率閾值的logistic-svm目標識別算法,有效降低算法整體復雜度的同時,取得較高的識別性能。
實現(xiàn)本發(fā)明目的的技術(shù)解決方案為:一種基于概率閾值的logistic-svm目標識別算法,步驟如下:
步驟1、選定樣本集的特征參量;
步驟2、仿真獲取訓練樣本集、交叉驗證集和測試集,訓練樣本集、交叉驗證集和測試集中均含有目標仿真信號和波形誘騙假目標仿真信號;
步驟3、利用步驟1和步驟2中的特征參量、訓練樣本集、交叉驗證集和測試集對logistic回歸模型和svm進行訓練、驗證和測試;
步驟4、輸入待分類信號樣本;
步驟5、利用logistic回歸算法獲得p(y=1|x)和p(y=0|x),其中,p(y|x)為二階邏輯斯諦回歸模型的條件概率分布,
步驟6、進行判定,當p(y=1|x)和p(y=0|x)的差值絕對值超過概率判別閾值pt,將實例x劃分到概率值較大的一類;
當p(y=1|x)和p(y=0|x)的差值低于概率判別閾值pt,忽略logistic回歸的判定結(jié)果,利用svm對目標信號重新分類;
步驟7、綜合步驟6中的結(jié)果,當目標信號屬于目標信號類,則識別該目標;當目標信號屬于波形誘騙假目標仿真信號類,則屏蔽該信號。
本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點為:(1)本發(fā)明對誤差較大的樣本形成樣本集時具有較好的容錯能力;(2)比較已有的logistic分類算法,本發(fā)明具有更高的分類精度;(3)比較已有的svm分類算法,本發(fā)明具有更簡單的系統(tǒng)結(jié)構(gòu),需要的計算量大大減少。
附圖說明
圖1是本發(fā)明基于概率閾值的logistic-svm目標識別算法流程圖。
圖2是訓練選擇特征參數(shù)示意圖。
圖3是logistic識別結(jié)果圖。
圖4是logistic識別結(jié)果的概率分布圖。
圖5是svm識別結(jié)果圖。
圖6是基于概率閾值的logistic-svm探測概率p和f1示意圖。
圖7是基于概率閾值的logistic-svm平均識別時間示意圖。
具體實施方式
結(jié)合圖1,一種基于概率閾值的logistic-svm目標識別算法,步驟如下:
步驟1、選定樣本集的特征參量[c1,c2,c3,...,cn];
步驟2、仿真獲取訓練樣本集ttr、交叉驗證集tcv、測試集tte,訓練樣本集ttr、交叉驗證集tcv和測試集tte中均含有目標仿真信號和波形誘騙假目標仿真信號;
步驟3、利用步驟1和步驟2中的特征參量[c1,c2,c3,...,cn]、訓練樣本集ttr、交叉驗證集tcv和測試集tte對logistic回歸模型和svm進行訓練、驗證和測試;
步驟4、輸入待分類信號樣本t;
步驟5、利用logistic回歸算法獲得p(y=1|x)和p(y=0|x),其中,p(y|x)為二階邏輯斯諦回歸模型的條件概率分布,
步驟6、進行判定,當p(y=1|x)和p(y=0|x)的差值絕對值超過概率判別閾值pt,將實例x劃分到概率值較大的一類;
當p(y=1|x)和p(y=0|x)的差值低于概率判別閾值pt,忽略logistic回歸的判定結(jié)果,利用svm對目標信號重新分類;
步驟7、綜合步驟6中的結(jié)果,當目標信號屬于目標信號類,則識別該目標;當目標信號屬于波形誘騙假目標仿真信號類,則屏蔽該信號。
進一步的,步驟3中svm分類過程中采用了fcsvm算法,具體為:
設sj為訓練后產(chǎn)生的n個支持向量,構(gòu)成向量集s={sj|sj∈s,j=1,...n},將s分解為2個支持向量子集p和q,p={sk|sk∈s,l=1,...,m},q={sk|sk∈s,l=m+1,...,n};將所有樣本xi和支持向量sj通過非線性函數(shù)φ映射到一個高維特征空間h,則x關于p和q在特征空間h中的內(nèi)積矩陣為km和kn,定義一個變換矩陣wt,滿足kn=wtkm,其中
取滿足mercer條件的核函數(shù)k(xi,sj)=φ(xi)φ(sj),令kij=φ(xi)φ(sj)則
設svm的分類函數(shù)為符號函數(shù)f(x),其具體形式如下:
其中,αj為lagrange乘子,且滿足αj>0,yj為sj的類標示,且yj∈{+1,-1},c是類標示閾值;則改進后的精簡的分類函數(shù)為
其中,
kt=(kt,1,kt,2,...,kt,m)t
下面結(jié)合具體實施例和附圖對本發(fā)明進行詳細說明。
實施例
結(jié)合圖1,一種基于概率閾值的logistic-svm末敏彈被動探測器目標識別算法,步驟如下:
步驟1、信號特征的提取。如圖2所示,受干擾源發(fā)射功率的影響,波形誘騙有源假目標干擾信號的峰值、脈寬、最大斜率、全局斜率(即信號從最小值點上升至最大值點的斜率)、積分值(信號從最小值點至最大值點的積分)均有可能出現(xiàn)變形,故選擇特征參數(shù)[pe,t,kv,kw],其中,pe為峰值、t為脈寬、kv為最大斜率、kw為全局斜率??紤]到應用在智能彈藥領域,所有的信號判決結(jié)果都需在信號峰值附近得到,這樣才能對裝甲目標中心實施有效打擊,所以此處的脈寬t修改為門限pe'上升到峰值pe處的時間寬度,門限pe'為峰值的一半。
步驟2、仿真生成裝甲目標和波形誘騙干擾信號的訓練集ttr、交叉驗證集tcv、測試集tte,其中一類為裝甲目標仿真信號類,另一類為波形誘騙假目標仿真信號類。
步驟3、利用步驟1和步驟2中的特征參量、訓練樣本集、交叉驗證集和測試集對logistic回歸模型和svm進行訓練、驗證和測試;
步驟4、輸入待分類信號樣本t。
步驟5、利用logistic回歸算法獲得識別結(jié)果。輸入待分類信號樣本t后,logistic得到的識別結(jié)果如圖3所示,識別時間為0.02200007s,已知測試集所含樣本個數(shù)為2000個,所以單個識別時間約為11μs,f1為0.83,f1為性能評價指標,探測概率為0.87。識別結(jié)果的概率分布如圖4所示。為了對結(jié)果進行比對,仿真svm識別結(jié)果如圖5所示,單個樣本識別時間月約為15.5μs,f1為0.894,若準確率為p,召回率為r,那么
步驟6、進行判定,當p(y=1|x)和p(y=0|x)的差值絕對值超過概率判別閾值pt,將目標信號劃分到概率值較大的一類。
當p(y=1|x)和p(y=0|x)的差值低于概率判別閾值pt,忽略logistic回歸的判定結(jié)果,利用svm對目標信號重新分類。根據(jù)logistic識別結(jié)果的概率分布,從0到1依次選擇判決閾值pt,對低于該值的樣本進行svm再判別,獲得的模型的訓練時間為4.239s。輸入待分類信號樣本t后,不同閾值pt下的探測概率如圖6所示,運行時間如圖7所示。
由圖6可知,隨著概率閾值的增大,探測概率p和f1均增大,但是又由圖7可知平均單個樣本的識別時間也變長。當概率閾值取0時,則所有數(shù)據(jù)均只進行l(wèi)ogistic分類,所以探測概率p、f1和平均識別時間均和logistic的結(jié)果近似一致;當概率閾值取1時,則所有數(shù)據(jù)都進行了logistic和svm分類,所以最終的探測概率p和f1近似svm分類結(jié)果,甚至高于svm的分類結(jié)果,但是平均識別時間則達到兩者的平均識別時間之和;當概率閾值取0.5時,此時f1為0.873,探測概率p為0.896,而平均識別時間僅為13.12μs。綜上,選取0.5作為閾值。
步驟7、根據(jù)步驟6的識別結(jié)果,判別目標。