本發(fā)明屬于計(jì)算機(jī)視覺處理
技術(shù)領(lǐng)域:
,具體涉及一種基于2DPCA的運(yùn)動(dòng)目標(biāo)跟蹤方法。
背景技術(shù):
:運(yùn)動(dòng)目標(biāo)跟蹤技術(shù)在計(jì)算機(jī)視覺領(lǐng)域具有廣泛的實(shí)際應(yīng)用,例如在視覺監(jiān)控、實(shí)時(shí)交通流量監(jiān)測、人機(jī)交互等方面,運(yùn)動(dòng)目標(biāo)跟蹤技術(shù)都起著至關(guān)重要的作用。運(yùn)動(dòng)目標(biāo)跟蹤技術(shù)的關(guān)鍵在于解決兩個(gè)問題:目標(biāo)特征模型的建立和目標(biāo)的穩(wěn)定跟蹤。PCA(PrincipalComponentAnalysis,主成分分析)方法作為一種特征提取和分析方法,經(jīng)常被用于目標(biāo)特征模型的建立。采用PCA方法對(duì)運(yùn)動(dòng)目標(biāo)特征進(jìn)行建模,雖然能夠較完整的保留運(yùn)動(dòng)目標(biāo)的主要成分特征,但是PCA方法基于一維向量,在提取主成分之前需要先將輸入的二維圖像序列轉(zhuǎn)換成一維行向量或者一維列向量。由于輸入的圖像分辨率一般較大而且視頻序列幀數(shù)較多,在將二維圖像轉(zhuǎn)換為一維向量時(shí),通常需要一個(gè)巨大的向量空間,因此往往會(huì)占用目標(biāo)跟蹤系統(tǒng)較多的存儲(chǔ)空間。此外,由于該矩陣的秩較大,而可供訓(xùn)練的樣本數(shù)量卻很少,因此計(jì)算PCA特征提取時(shí)所需的協(xié)方差矩陣十分困難,在得到協(xié)方差矩陣后進(jìn)行特征向量和特征值運(yùn)算時(shí)也需要花費(fèi)大量的時(shí)間,從而增加了運(yùn)動(dòng)目標(biāo)跟蹤時(shí)間。為了克服PCA方法出現(xiàn)的這些問題,2DPCA(Two-dimensionalPrincipalComponentAnalysis,二維主成分分析)方法被提出。該方法的運(yùn)算直接基于二維圖像矩陣,在提取特征向量時(shí)不需要將二維圖像轉(zhuǎn)化為一維向量,因此圖像的協(xié)方差矩陣大小與圖像的寬度相同。與PCA方法相比,協(xié)方差矩陣減小了很多,最終獲得的特征向量也比PCA方法得到的更加準(zhǔn)確,運(yùn)算時(shí)間也大大減少。將2DPCA應(yīng)用于運(yùn)動(dòng)目標(biāo)跟蹤,能夠減少計(jì)算量,提高跟蹤的準(zhǔn)確性。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于提出一種基于2DPCA的運(yùn)動(dòng)目標(biāo)跟蹤方法,克服了傳統(tǒng)PCA方法提取協(xié)方差矩陣?yán)щy、計(jì)算量大的問題,提高了運(yùn)動(dòng)目標(biāo)特征提取的 精度,減少了運(yùn)動(dòng)目標(biāo)跟蹤時(shí)間,提高了跟蹤的準(zhǔn)確性,具有較強(qiáng)的魯棒性。為了解決上述技術(shù)問題,本發(fā)明提供一種基于2DPCA的運(yùn)動(dòng)目標(biāo)跟蹤方法,使用如公式(1)所示的方法計(jì)算運(yùn)動(dòng)目標(biāo)跟蹤過程中所需的運(yùn)動(dòng)目標(biāo)后驗(yàn)概率,從而實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)跟蹤,式(1)中,p(At|Zt)是在粒子濾波理論框架下計(jì)算獲得的運(yùn)動(dòng)目標(biāo)后驗(yàn)概率;At為t時(shí)刻的子圖像矩陣;Zt=(xt,yt,st,rt,θt,λt)是用于表示t時(shí)刻的目標(biāo)狀態(tài)的二維仿射參數(shù),其中xt為x方向偏移量,yt為y方向偏移量,st為目標(biāo)縮放尺度,rt為目標(biāo)縱橫比,θt為目標(biāo)旋轉(zhuǎn)角度,λt為目標(biāo)傾斜角度;為權(quán)重因子;||·||F表示Frobenius范數(shù);式(1)中,Xt={Xi,i=1,...,d}是一個(gè)在t時(shí)刻大小為w×d的圖像矩陣,Xi表示一個(gè)w維的列向量;At為t時(shí)刻大小為h×w的子圖像矩陣,該子圖像矩陣由Xt圖像矩陣獲得;(·)T表示矩陣的轉(zhuǎn)置;為投影中心,其中為子圖像序列的平均值,其定義如公式(2)所示:A‾=1mΣi=1mAi---(2)]]>式(2)中,Ai為子圖像序列中的任意幀圖像,m為子圖像序列幀數(shù);式(1)中,部分可以用dt代表,用于表示子空間距離。對(duì)于距離dt,子圖像At關(guān)于dt的后驗(yàn)概率服從高斯分布模型,其定義如公式(3)所示:pdt(At|Zt)=N(At;uXtT,XtXtT+ϵI)---(3)]]>式(3)中,I為一個(gè)單位矩陣,ε為高斯噪聲;N(·)表示高斯分布模型;式(1)中,部分可以用dw代表,用于表示子空間的投影 到子空間中心的距離。對(duì)于距離dw,子圖像At關(guān)于dw的后驗(yàn)概率服從高斯分布模型,其定義如公式(4)所示:pdw(At|Zt)=N(At;uXtT,XtΣ-1XtT)---(4)]]>式(4)中,N(·)表示高斯分布模型;Σ表示Xt的特征矩陣;矩陣Σ中的對(duì)角元素是矩陣Xt的特征值;進(jìn)一步,在目標(biāo)跟蹤過程中,跟蹤到的子圖像累計(jì)到一定數(shù)量時(shí),需要對(duì)子圖像進(jìn)行更新。設(shè)原始的子圖像集合為Ut={Ai,i=1,...,m},累積的子圖像集合為Ot={Bi,i=1,...,5},則更新后的子圖像集合本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn)在于:(1)本發(fā)明采用2DPCA方法對(duì)圖像的子空間特征向量進(jìn)行提取,由于2DPCA基于二維圖像矩陣,因而在提取特征向量時(shí)不需要預(yù)先將圖像轉(zhuǎn)化為一個(gè)向量,而是直接使用原始圖像矩陣來構(gòu)建圖像協(xié)方差矩陣,原始圖像矩陣的特征向量用來提取特征,從而減少了運(yùn)算量;此外,采用2DPCA獲取協(xié)方差矩陣比PCA方法更加準(zhǔn)確,提取特征向量的時(shí)間也大大減少;(2)本發(fā)明采用粒子濾波方法獲得運(yùn)動(dòng)目標(biāo)的動(dòng)態(tài)模型,運(yùn)動(dòng)目標(biāo)的后驗(yàn)概率通過2DPCA方法獲得,基于2DPCA的運(yùn)動(dòng)目標(biāo)特征模型定義的每個(gè)時(shí)刻目標(biāo)的二維仿射參數(shù),能夠較好的克服目標(biāo)形變等問題,確保了目標(biāo)跟蹤的準(zhǔn)確性。附圖說明圖1是本發(fā)明基于2DPCA的運(yùn)動(dòng)目標(biāo)跟蹤方法流程簡圖。圖2是本發(fā)明基于2DPCA的運(yùn)動(dòng)目標(biāo)跟蹤方法流程詳細(xì)圖。。圖3是本發(fā)明方法與IVT方法、L1T方法以及VTD方法的比較結(jié)果圖。具體實(shí)施方式一、本發(fā)明基本思想本發(fā)明在粒子濾波理論框架下提出了一種基于2DPCA的運(yùn)動(dòng)目標(biāo)跟蹤方法,其基本原理是:首先,利用2DPCA建立運(yùn)動(dòng)目標(biāo)特征模型;然后,獲得運(yùn)動(dòng)目標(biāo)跟蹤所需要的后驗(yàn)概率;最后,根據(jù)獲得的運(yùn)動(dòng)目標(biāo)后驗(yàn)概率實(shí)現(xiàn)對(duì)運(yùn)動(dòng)目標(biāo)的跟蹤。二、2DPCA(二維主成分分析)的概念定義Xt={Xi,i=1,...,d}為一個(gè)在時(shí)刻t的w×d圖像矩陣,w為矩陣的行數(shù),d為矩陣的列數(shù),該矩陣中Xi表示一個(gè)w維的列向量;定義At為一個(gè)在時(shí)刻t的h×w子圖像矩陣,h為矩陣的行數(shù),d為矩陣的列數(shù);定義Yt表示子圖像矩陣At的投影特征矩陣,則關(guān)于Xt的線性變換如公式(1)所示:Yt=AtXt(1)定義Yt的協(xié)方差矩陣Sx的跡為總散度J(Xt),通過最大化這個(gè)總散度準(zhǔn)則,就能夠找到最優(yōu)的投影方向Xt使得投影后的向量Yt分開??偵⒍菾(Xt)如公式(2)所示:J(Xt)=tr(Sx)(2)式(2)中,Sx為Yt的協(xié)方差矩陣,其定義如公式(3)所示:Sx=E[(Yt-E(Yt))(Yt-E(Yt))T]=E[(AtXt-E(AtXt))(AtXt-E(AtXt))T](3)=E[[(At-E(At))Xt][(At-E(At))Xt]T]式(3)中,E(·)表示期望,(·)T表示矩陣的轉(zhuǎn)置;式(2)中,tr(Sx)表示矩陣Sx的跡,其定義如公式(4)所示:tr(Sx)=XtT[E[(At-E(At))T(At-E(At))]]Xt---(4)]]>定義Ut={Ai,i=1,...,m}為m幀子圖像Ai組成的序列,則子圖像的協(xié)方差矩陣Gt如公式(5)所示:Gt=E[(At-E(At))T(At-E(At))](5)式(5)中,Gt是一個(gè)w×w的非負(fù)矩陣。定義子圖像序列Ut={Ai,i=1,...,m}的平均值A(chǔ)如公式(6)所示:A‾=1mΣi=1mAi---(6)]]>根據(jù)公式(5)和公式(6),得到子圖像的協(xié)方差矩陣Gt的等價(jià)表示如公式(7)所示:Gt=1mΣi=1m(Ai-A‾)T(Ai-A‾)---(7)]]>準(zhǔn)則化公式(7),得到公式(8)和公式(9):J(Xt)=XtTGtXt---(8)]]>XtTXt=1---(9)]]>根據(jù)公式(8)和公式(9),令:F=XtTGtXt-λ(XtTX-1)---(10)]]>對(duì)公式(10)中的Xt求偏導(dǎo)數(shù),得到公式(11):∂F∂Xt=2GtXt-2λXt=0---(11)]]>式(11)中,表示F對(duì)Xt的偏導(dǎo);解式(11)得到公式(12):GtXt=λXt(12)式(12)中,Xt表示最優(yōu)投影軸,λ表示特征值。由式(12)可知,最優(yōu)投影軸是協(xié)方差矩陣Gt的最大特征值λ對(duì)應(yīng)的特征向量。通常,一個(gè)最優(yōu)投影軸是不夠的,因此,選擇對(duì)應(yīng)著特征值最大的前d個(gè)相互正交的單位特征向量作為最優(yōu)投影軸,其表示如公式(13)所示:{{X1,...,Xd}=argmaxJ(Xt)XiTXj=0,i≠j,i,j=1,...,d---(13)]]>式(13)中,max(·)表示取最大值;arg(·)表示正交。三、基于IVT算法的運(yùn)動(dòng)目標(biāo)跟蹤的相關(guān)概念對(duì)于目標(biāo)在t時(shí)刻的運(yùn)動(dòng)狀態(tài),可以采用二維仿射參數(shù)Ζt=(xt,yt,st,rt,θt,λt)表示;其中xt為x方向偏移量,yt為y方向偏移量,st為目標(biāo)縮放尺度,rt為目標(biāo)縱橫比,θt為目標(biāo)旋轉(zhuǎn)角度,λt為目標(biāo)傾斜角度。所述二維仿射參數(shù)Xt=(xt,yt,st,rt,θt,λt)詳見文獻(xiàn)(R.Szeliski:ComputerVision:AlgorithmsandApplications.Springer.(2010))。采用IVT算法(IncrementalLearningforRobustVisualTrackingAlgorithm,基于增量學(xué)習(xí)的魯棒性視覺跟蹤算法)跟蹤運(yùn)動(dòng)目標(biāo),其所需的運(yùn)動(dòng)目標(biāo)后驗(yàn)概率如公式(14)所示:p(At|Zt)=exp(-1σ2||At-At-1||2)---(14)]]>式(14)中,為權(quán)重因子;||·||F表示Frobenius范數(shù);At為在時(shí)刻t子圖像矩陣。所述IVT算法(IncrementalLearningforRobustVisualTrackingAlgorithm,基于增量學(xué)習(xí)的魯棒性視覺跟蹤算法)詳見文獻(xiàn)([RossDA,LimJ,LinRS,etal.:Incrementallearningforrobustvisualtracking[J].InternationalJournalofComputerVision.(2008)77(1-3):125-141.])。四、基于粒子濾波的2DPCA運(yùn)動(dòng)目標(biāo)跟蹤的相關(guān)概念目標(biāo)跟蹤問題可以認(rèn)為是一個(gè)隱式馬爾科夫鏈問題,對(duì)于子圖像序列Ut={Ai,i=1,...,m},目標(biāo)在t時(shí)刻的運(yùn)動(dòng)狀態(tài)Zt通過貝葉斯理論有以下結(jié)論:p(Zt|At)∝p(At|Zt)∫p(Zt|Zt-1)p(Zt-1|At-1)dZt-1(15)式(15)中,p(At|Zt)為觀測模型,p(Zt|Zt-1)為動(dòng)態(tài)模型。1、動(dòng)態(tài)模型p(Zt|Zt-1)動(dòng)態(tài)模型p(Zt|Zt-1)在空間上采用布朗運(yùn)動(dòng)模型,目標(biāo)在t時(shí)刻的運(yùn)動(dòng)狀態(tài)Zt通過目標(biāo)在t-1時(shí)刻的運(yùn)動(dòng)狀態(tài)Zt-1的高斯分布得到,其表示如式(16)所示:式(16)中,N(·)表示高斯分布模型;為一個(gè)對(duì)角 協(xié)方差矩陣,其對(duì)角元素為各二維仿射參數(shù)Ζt=(xt,yt,st,rt,θt,λt)的方差。2、觀測模型p(At|Zt)定義子圖像序列Ut={Ai,i=1,...,m}的平均值A(chǔ)如公式(17)所示:A‾=1mΣi=1mAi---(17)]]>對(duì)于根據(jù)目標(biāo)在t時(shí)刻的運(yùn)動(dòng)狀態(tài)Zt確定的一個(gè)子圖像At,定義其通過投影向量矩陣Xt投影后的投影中心為其中子圖像At的后驗(yàn)概率p(At|Zt)可以表示為該子圖像At到子圖像空間參考點(diǎn)的距離,該距離可以分解為子空間距離dt和子空間的投影到子空間中心的距離dw。對(duì)于子空間距離dt,子圖像At關(guān)于dt的后驗(yàn)概率服從高斯分布模型,其定義如公式(18)所示:pdt(At|Zt)=N(At;uXtT,XtXtT+ϵI)---(18)]]>式(18)中,I為一個(gè)單位矩陣,ε為高斯噪聲;N(·)表示高斯分布模型;對(duì)于距離dw,子圖像At關(guān)于dw的后驗(yàn)概率服從高斯分布模型,其定義如公式(19)所示:pdw(At|Zt)=N(At;uXtT,XtΣ-1XtT)---(19)]]>式(19)中,N(·)表示高斯分布模型;Σ表示Xt的特征矩陣;矩陣Σ中的對(duì)角元素是矩陣Xt的特征值。結(jié)合式(18)和式(19),得到子圖像At的后驗(yàn)概率p(At|Zt),其表示如公式(20)所示:p(At|Zt)=pdt(At|Zt)pdw(At|Zt)=N(At;uXtT,XtXtT+ϵI)N(At;uXtT,XtΣ-1XtT)---(20)]]>五、運(yùn)動(dòng)目標(biāo)特征模型的概念定義yt=AtXt表示子圖像At通過Xt映射得到y(tǒng)t,且yt服從高斯分布,即yt~N(u,L),其中,L為對(duì)角矩陣。則子空間圖像At可以表示為:式(21)中,為高斯噪聲,滿足I為一個(gè)單位矩陣。結(jié)合式(20)和式(21),則子圖像At的運(yùn)動(dòng)目標(biāo)特征模型p(At)可以表示為:p(At)=N(At;uXtT,XtLXtT+σ2I)---(22)]]>六、基于粒子濾波的2DPCA運(yùn)動(dòng)目標(biāo)跟蹤的后驗(yàn)概率的概念對(duì)式(22)等號(hào)兩邊同時(shí)取對(duì)數(shù)得到式(23):式(23)中,多項(xiàng)式部分用c表示,多項(xiàng)式部分用l表示,多項(xiàng)式c是一個(gè)常數(shù),因此log[p(At)]的值由多項(xiàng)式l決定。式(23)等價(jià)為式(24):log(p(At))∝(At-uXtT)T(At-uXtT)(XtLXtT+σ2I)-1---(24)]]>Sherman-Morrison-Woodbury公式如式(25)所示:(A-uvT)-1=A-1+A-1u(1-vTA-1u)-1vTA-1(25)根據(jù)式(25),式(24)中的可以等價(jià)表示為:又因?yàn)椋?L-1+1σ2I)-1=σ2(I-D-1σ2)---(27)]]>式(27)中,D為一個(gè)對(duì)角矩陣,Dii=Lii+σ2,則式(26)可等價(jià)為:(XtLXtT+σ2I)-1=1σ2I-1σ2Xtσ2(I-D-1σ2)XtT1σ2=1σ2I-1σ2(XtXtT)+(XtD-1XtT)=1σ2(I-XtXtT)+(XtD-1XtT)---(28)]]>將式(28)代入式(23),可以得到:式(29)中,多項(xiàng)式c是一個(gè)常數(shù),因此log[p(At)]由多項(xiàng)式l1決定,則:log[p(At)]∝(At-uXtT)T(At-uXtT)(1σ2(I-XtXtT)+(XtD-1XtT))---(30)]]>因此得到運(yùn)動(dòng)目標(biāo)特征模型p(At)的后驗(yàn)概率p(At|Zt)為:七、執(zhí)行本發(fā)明方法的一個(gè)流程步驟一,手動(dòng)選取圖像序列中第一幀圖像中的運(yùn)動(dòng)目標(biāo),并用表示符號(hào)標(biāo)識(shí)出來,例如用紅色長方形框?qū)⒌谝粠瑘D像中的運(yùn)動(dòng)目標(biāo)框出,作為參考目標(biāo)。步驟二,初始化并且置空子圖像序列Ut={Ai,i=1,...,m}。步驟三,對(duì)于輸入的第n幀圖像,判斷n>nth(nth為設(shè)定的幀數(shù)閾值)。若滿足n>nth,則執(zhí)行步驟五,否則執(zhí)行步驟四。步驟四,采用IVT方法(IncrementalLearningforRobustVisualTrackingAlgorithm,基于增量學(xué)習(xí)的魯棒性視覺跟蹤算法)跟蹤運(yùn)動(dòng)目標(biāo)[RossDA,LimJ,LinRS,etal.:Incrementallearningforrobustvisualtracking[J].InternationalJournalofComputerVision.(2008)77(1-3):125-141.]。步驟五,使用公式(31)所示的方法計(jì)算運(yùn)動(dòng)目標(biāo)跟蹤過程中所需要的運(yùn)動(dòng)目標(biāo)后驗(yàn)概率,從而實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的跟蹤。步驟六,返回步驟三。本發(fā)明的有益效果可以通過以下實(shí)驗(yàn)進(jìn)一步說明:本發(fā)明實(shí)施例以Matlab2012b為實(shí)驗(yàn)平臺(tái),輸入圖像序列為“dudek”,每幀圖像大小為480×720,共計(jì)150幀。選取人臉為運(yùn)動(dòng)目標(biāo)進(jìn)行跟蹤,從第100幀到第110幀,運(yùn)動(dòng)目標(biāo)被遮擋,第110幀后對(duì)運(yùn)動(dòng)目標(biāo)的遮擋消失。本實(shí)驗(yàn)將本發(fā)明方法與現(xiàn)有的IVT方法、L1T方法和VTD方法進(jìn)行了比較。采用均方根誤差(RMS)作為比較依據(jù),其計(jì)算公式如公式(32)所示:RMS=|RD-TD|TD×100%---(32)]]>其中,RD表示跟蹤結(jié)果像素值,TD表示真實(shí)像素值。比較結(jié)果如圖3所示。從圖3中可以看出,在跟蹤初始階段,IVT方法,L1T方法和本發(fā)明所述方法跟蹤得到的實(shí)際值與真實(shí)值的均方根誤差小于5個(gè)像素,但是局部遮擋后,本發(fā)明所述方法的均方根誤差要小于現(xiàn)有的其他算法,可見采用本方法進(jìn)行運(yùn)動(dòng)目標(biāo)跟蹤具有一定的優(yōu)勢。所述L1T方法詳見文獻(xiàn)(MeiX,andLingH:RobustvisualtrackingusingL1 minimization[C].ComputerVision,2009IEEE12thInternationalConferenceon.IEEE.(2009):1436-1443.)。所述VTD方法詳見文獻(xiàn)(J.KwonandK.Lee.Visualtrackingdecomposition.InCVPR,pages1269–1276,2010.)。當(dāng)前第1頁1 2 3