基于變分濾波的粒子優(yōu)化概率假設密度多目標跟蹤方法
【專利摘要】本發(fā)明提供了一種基于變分濾波的粒子優(yōu)化概率假設密度多目標跟蹤方法。將目標狀態(tài)變量的分布參數(shù)視作隨機變量,并用變分貝葉斯方法求解它們的后驗分布,在確定這些參數(shù)的估計值后得到優(yōu)化了的濾波狀態(tài)分布,再以該狀態(tài)分布函數(shù)作為逼近真實后驗PHD函數(shù)的重要性函數(shù)進行隨機粒子采樣,從而能使大部分采樣粒子分布在高似然概率處,合理利用觀測信息,避免傳統(tǒng)粒子概率密度假設方法由于粒子采樣于低似然概率處而造成的粒子退化現(xiàn)象,最終提高粒子概率假設密度多目標跟蹤算法的性能。
【專利說明】基于變分濾波的粒子優(yōu)化概率假設密度多目標跟蹤方法
【技術領域】
[0001]本發(fā)明涉及一種利用變分貝葉斯方法及粒子概率假設密度濾波方法進行多目標跟蹤的方法。
【背景技術】
[0002]目標跟蹤問題在如今人類許多生產(chǎn)與應用領域都有著廣泛的應用,根據(jù)目標屬性,通??煞譃閱文繕烁櫤投嗄繕烁檭纱箢?。而在實際應用環(huán)境中,對于雷達、聲納以及紅外線探測等傳感器而言,多以多目標跟蹤的情形更為常見,處理手段較單目標跟蹤問題自然也更加復雜。所謂多目標跟蹤就是要從混有雜波的觀測值中進行當前時刻目標個數(shù)與各個目標狀態(tài)的估計。目前主流的多目標跟蹤的處理方法主要有:領域法、數(shù)據(jù)關聯(lián)法、多假設跟蹤法等,而這些算法由于涉及對多個目標的關聯(lián)問題,計算復雜度會隨著目標的增多、目標數(shù)目的聚集或虛警個數(shù)的增加而呈指數(shù)增長,難以應用于工程之中。近年來,許多學者提出的基于隨機有限集(Random Finite Sets, RFS)的概率假設密度(ProbabilityHypothesis Density, PHD)濾波算法,完全避開了傳統(tǒng)多目標跟蹤方法中涉及的數(shù)據(jù)關聯(lián)問題,它具有計算量小、估計精度高、實時性好等特點。正因為如此,PHD濾波也成為了當前多目標跟蹤問題的一個研究熱點,目前主要實現(xiàn)形式有基于高斯混合的高斯混合PHD濾波器與基于蒙特卡羅方法的粒子PHD濾波器。
[0003]變分貝葉斯(VariationalBayes)方法,也叫集成學習(Ensemble Learning),是當前較為流行的一種參數(shù)估計方法,它起源于機器學習領域,最早用于針對圖模型(Graphical Models)的參數(shù)估計與模型選擇問題。該方法的核心思想是針對一個復雜的原版本問題,提出用另一個簡化的、易處理的新版本,該簡化版本要保證與原版本盡可能的相似,并引入Kullback-Leibler(KL)散度來衡量兩者的差異性,通過調(diào)節(jié)變分參數(shù)(Variational Parameters)使新版本與原版本的差異最小。變分貝葉斯方法的一大優(yōu)勢在于,相比于傳統(tǒng)的極大似然與最大后驗估計方法,它有著更高的估計精度并且能夠避免過擬合現(xiàn)象;而相比于近年來同樣受關注的馬爾可夫鏈蒙特卡羅(Markov Chain MonteCarlo)方法,在保證估計精度相差不大的情況下,有著更快的收斂與計算速度,更有實際應用的研究價值。于是,進入21世紀后,學者們極大地拓展了變分貝葉斯方法的應用領域,逐漸將其從固定模型的參數(shù)推理延伸到以狀態(tài)空間模型為基礎的實時應用領域中,并動態(tài)估計變化的系統(tǒng)狀態(tài)、系統(tǒng)結構參數(shù)以及噪聲參數(shù)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種更具高效性和自適應性,能提高多目標的狀態(tài)估計效果的基于變分濾波的粒子優(yōu)化概率假設密度多目標跟蹤方法。
[0005]本發(fā)明的目的是這樣實現(xiàn)的:
[0006]步驟一:對于在某監(jiān)控區(qū)域內(nèi)的未知數(shù)目、未知狀態(tài)(位置、速度、加速度)的多目標,通過傳感器測量得到所有目標包括位置、方向在內(nèi)的觀測信息;[0007]步驟二:初始化目標的PHD函數(shù),并獲得相應的粒子集;
[0008]步驟三:利用變分貝葉斯方法對上一步驟中的粒子集進行更新,獲得變分濾波后的目標后驗狀態(tài)分布;
[0009]步驟四:以變分濾波后得到的后驗狀態(tài)分布作為重要性函數(shù)進行采樣,預測目標的PHD函數(shù);
[0010]步驟五:對預測的目標PHD函數(shù)進行更新;
[0011]步驟六:獲得更新的目標PHD函數(shù)后,若有效粒子數(shù)量低于設定閾值,則對粒子進行重采樣再回到步驟三,否則直接回到步驟三,如此反復直至到達濾波最終時刻;
[0012]步驟七:濾波結束后輸出最終估計結果,確定監(jiān)控區(qū)域內(nèi)目標個數(shù)以及每個目標包括位置、速度和加速度等在內(nèi)的狀態(tài)信息。
[0013]本發(fā)明是為了提高雜波環(huán)境下多目標跟蹤濾波器的性能,提出的一種基于變分濾波的粒子優(yōu)化的概率假設密度多目標跟蹤方法。本發(fā)明將目標狀態(tài)變量的分布參數(shù)視作隨機變量,并用變分貝葉斯方法求解它們的后驗分布,在確定這些參數(shù)的估計值后得到優(yōu)化了的濾波狀態(tài)分布,再以該狀態(tài)分布函數(shù)作為逼近真實后驗PHD函數(shù)的重要性函數(shù)進行隨機粒子采樣,從而能使大部分采樣粒子分布在高似然概率處,合理利用觀測信息,避免傳統(tǒng)粒子概率密度假設方法由于粒子采樣于低似然概率處而造成的粒子退化現(xiàn)象,最終提高粒子概率假設密度多目標跟蹤算法的性能。
[0014]本發(fā)明的優(yōu)點在于:
[0015](I)本發(fā)明采用層次式模型對每個目標的狀態(tài)參數(shù)進行建模,相比傳統(tǒng)目標狀態(tài)的建模方法只把目標狀態(tài)本身視作隨機變量而忽略狀態(tài)分布的參數(shù)的不確定性,它充分考慮了其狀態(tài)分布參數(shù)的不確定性以及潛在的內(nèi)在聯(lián)系;
[0016](2)本發(fā)明用變分貝葉斯方法對上述層次式模型進行估計,從而形成變分濾波,得到了用于優(yōu)化的重要性采樣的粒子集。傳統(tǒng)粒子概率假設密度多目標跟蹤算法中的粒子采樣是從固定重要性函數(shù)分布中選取的,無法進行更新,當觀測似然函數(shù)具有顯著尖峰特性時會使目標跟蹤效果退化,而本發(fā)明中的粒子集是通過變分貝葉斯方法估計得到的,可以動態(tài)地地根據(jù)觀測調(diào)整重要性分布,相比于傳統(tǒng)方法更具高效性和自適應性,從而最終提高多目標的狀態(tài)估計效果。
【專利附圖】
【附圖說明】
[0017]圖1是貝葉斯濾波意義下粒子PHD濾波實現(xiàn)的示意圖;
[0018]圖2是本發(fā)明的方法流程圖;
[0019]圖3是每個目標的狀態(tài)的層次式模型結構指示圖;
[0020]圖4是變分濾波后用于重要性采樣的近似分布結構示意圖。
【具體實施方式】
[0021]下面將結合附圖和實例對本發(fā)明作進一步的詳細說明。
[0022]PHD濾波算法在隨機集理論框架下,把當前時刻的所有目標的狀態(tài)值集合作為一個狀態(tài)RFS變量,把當前時刻的觀測值集合也作為一個觀測RFS變量,并把多目標跟蹤問題放在貝葉斯濾波框架下加以解決。與貝葉斯最優(yōu)濾波唯一區(qū)別的是,貝葉斯濾波傳遞的是單目標狀態(tài)的后驗概率密度函數(shù),而PHD濾波傳遞的是多目標狀態(tài)的PHD,也就是多目標后驗密度的一階矩。圖1顯示了其蒙特卡羅方法下的實現(xiàn)原理,即粒子PHD濾波原理,圖中)和Dk(.)分別代表目標在k-Ι和k時刻的PHD函數(shù)。該算法基本思想是利用一組帶有相應權值的隨機樣本(粒子)逼近PHD函數(shù)分布,其意義在于解決PHD重積分沒有閉式解的難題。在濾波過程中,PHD函數(shù)被一系列離散的帶權值的樣本近似,隨著樣本粒子數(shù)量的增加,PHD濾波接近于最優(yōu)貝葉斯估計。這是一種基于仿真的統(tǒng)計濾波方法,不受模型線性和高斯假設的限制,可以適用于非線性非高斯的隨機系統(tǒng)。由于在粒子的采樣過程中,通常選取單目標的系統(tǒng)狀態(tài)轉移函數(shù)為重要性分布,但它沒有考慮最新觀測數(shù)據(jù)對估計值的修正,嚴重依賴模型本身,當觀測似然函數(shù)概率密度曲線具有顯著尖峰特性而嚴重偏離系統(tǒng)狀態(tài)轉移函數(shù)的峰值時,會使采樣粒子與真實PHD函數(shù)的樣本粒子差異較大,有效粒子個數(shù)急劇減少,最終造成濾波精度的下降,嚴重時甚至發(fā)散失效,使多目標跟蹤濾波器性能退化。
[0023]本發(fā)明是一種基于變分濾波的粒子優(yōu)化概率假設密度濾波跟蹤方法,流程如圖2所示,包括以下幾個主要步驟:
[0024]步驟一:對于在某監(jiān)控區(qū)域內(nèi)的未知數(shù)目、未知狀態(tài)(位置、速度、加速度)的多目標,通過傳感器測量得到所有目標包括位置、方向在內(nèi)的觀測信息;
[0025]考慮k時刻在某一監(jiān)控區(qū)域內(nèi),假設有Nk個目標,多目標狀態(tài)為
【權利要求】
1.一種基于變分濾波的粒子優(yōu)化概率假設密度多目標跟蹤方法,其特征是: 步驟一:對于在某監(jiān)控區(qū)域內(nèi)的未知數(shù)目、未知狀態(tài)的多目標,通過傳感器測量得到所有目標包括位置、方向在內(nèi)的觀測信息; 步驟二:初始化目標的PHD函數(shù),并獲得相應的粒子集; 步驟三:利用變分貝葉斯方法對上一步驟中的粒子集進行更新,獲得變分濾波后的目標后驗狀態(tài)分布; 步驟四:以變分濾波后得到的后驗狀態(tài)分布作為重要性函數(shù)進行采樣,預測目標的PHD函數(shù); 步驟五:對預測的目標PHD函數(shù)進行更新; 步驟六:獲得更新的目標PHD函數(shù)后,若有效粒子數(shù)量低于設定閾值,則對粒子進行重采樣再回到步驟三,否則直接回到步驟三,如此反復直至到達濾波最終時刻; 步驟七:濾波結束后輸出最終估計結果,確定監(jiān)控區(qū)域內(nèi)目標個數(shù)以及每個目標包括位置、速度和加速 度等在內(nèi)的狀態(tài)信息。
【文檔編號】G06F19/00GK103902819SQ201410105378
【公開日】2014年7月2日 申請日期:2014年3月21日 優(yōu)先權日:2014年3月21日
【發(fā)明者】周衛(wèi)東, 沈忱, 黃蔚, 金詩宇, 劉學敏, 蔡佳楠 申請人:哈爾濱工程大學