亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

頻域高斯核函數(shù)圖像追蹤方法與流程

文檔序號:12064779閱讀:1806來源:國知局

本發(fā)明屬于圖像采集,圖像處理領(lǐng)域,特別的涉及一種頻域高斯核函數(shù)圖像追蹤方法。



背景技術(shù):

隨著追蹤在視頻監(jiān)督,人機界面和計算機感知方面的應(yīng)用,追蹤在計算機視覺方面已經(jīng)成為了一個基本難題。盡管目前的一些設(shè)備允許對目標有很強的假設(shè),有少許先驗條件下去跟蹤一個物體結(jié)果是非常令人滿意的。其中非常成功的追蹤途徑就是偵查探測,這種方法直接來源于在機器學(xué)習(xí)識別方法的快速發(fā)展以及在單機探測方面的應(yīng)用。許多這方面的算法被應(yīng)用到在線訓(xùn)練過程中,在每一個成功的在線訓(xùn)練過程中,探測都提供了非常多的關(guān)于目標的信息。所有目前可以使用的方法都有一個共同點,那就是稀疏取樣法。在每一個畫面中,許多樣本在目標周圍被采集,每個樣本的特征和目標的尺寸是一樣的。很明顯,這會有很多多余,因為樣本有很多是重疊的,這種重疊結(jié)構(gòu)通常被忽視。進而大多數(shù)方法只簡單的收集很少數(shù)目的樣本,因為不這樣做的話采樣花費的時間就會過長,但這樣做會使追蹤的精確度降低。實際上,如果訓(xùn)練數(shù)據(jù)有如此多的多余樣本就意味著不可能有效利用它的結(jié)構(gòu)。這就造成了問題,如果采用稀疏取樣法會造成追蹤過程中精度不夠,而如果采用密集取樣的話由于樣本數(shù)量的增加就會造成運算速度的下降。另一方面?zhèn)鹘y(tǒng)的跟蹤運算是在時域上對兩幀圖像在時域上做卷積,而在時域上做卷積運算量很大,同樣會降低運算速度。



技術(shù)實現(xiàn)要素:

本發(fā)明要解決的技術(shù)問題為克服現(xiàn)有技術(shù)中的不足之處,提供一種新的快速、準確的頻域高斯核函數(shù)圖像追蹤方法。

為解決本發(fā)明的技術(shù)問題,所采用的技術(shù)方案為:頻域高斯核函數(shù)圖像追蹤方法,特別是主要步驟如下:

步驟1,對包含目標的當(dāng)前一幀圖像進行目標輸入,確定目標窗口,將追蹤窗口通過Hann窗口進行預(yù)處理;

步驟2,采集追蹤窗口的某一特征,采用密集采樣的方法進行樣本采集,同時通過每一個樣本的位置信息對樣本進行貼標簽,將采集的樣本采用循環(huán)矩陣進行處理;

步驟3采用高斯核函數(shù)作為追蹤函數(shù)的核心,利用循環(huán)矩陣在頻域中計算高斯核函數(shù);

步驟4,通過頻域計算密集采樣樣本和新的一幀圖像的追蹤窗口最大相應(yīng)值,確定新的一幀圖像中目標窗口的中心位置,選取與步驟1同樣大小的目標窗口重復(fù)步驟1,2,3,4,完成圖像追蹤。

步驟1中所述追蹤窗口與所述目標窗口具有相同的中心位置,所述追蹤區(qū)域大小為所述目標窗口區(qū)域大小的1.5~10倍,步驟1中所述單一圖像特征為圖像灰度特征或HOG特征或SIFT特征;步驟2中所述圖像密集采樣中樣本中心在目標中心的樣本為正樣本,在目標中心以外的樣本為負樣本,處理樣本過程中處理所有采集的樣本,所述的負樣本由正樣本x=[x0,x1,x2,...,xn-1]T循環(huán)移位得到xi=Pix其中P為使向量整體向下移動一個元素,最后的一個元素移動到第一個元素的位置的置換矩陣,步驟2中所述對圖像進行的標簽采用yi=exp(-(i-i′)2/s2)方式對每個樣本進行概率分布標簽,其中i為負樣本中心位置,i′為正樣本中心,s為帶寬,步驟2中所述循環(huán)矩陣為由向量x循環(huán)移位得到;步驟3中高斯核函數(shù)的計算通過傅里葉變換在頻域當(dāng)中進行;步驟4中所述訓(xùn)練樣本與目標圖像的追蹤窗口的響應(yīng)值計算通過傅里葉變換在頻域當(dāng)中進行。

相對于現(xiàn)有技術(shù)的有益效果是:

其一,利用密集采樣法對樣本進行采集,增加了追蹤過程中的精確性,這對圖像追蹤有極大的意義,同時密集采樣的結(jié)果是循環(huán)矩陣。

其二,循環(huán)矩陣的性質(zhì)特別適合計算機運算操作,因為循環(huán)矩陣的和、積以及逆都是循環(huán)的,這些操作通常包括向量x的快速傅里葉變換,這樣就不需要詳細的計算和儲存一個循環(huán)矩陣C(x),因為C(x)由x而決定,儲存時只需要儲存x降低所需儲存的數(shù)據(jù)。

其三,在密集采樣過程中利用循環(huán)矩陣的性質(zhì),在數(shù)據(jù)處理過程中將數(shù)據(jù)處理由時域的向量卷積通過傅里葉變換轉(zhuǎn)化到頻域的點積上面去,減少運算的次數(shù),增加處理器處理樣本的速度,從而提高追蹤效率。

附圖說明

圖1是整個具體實施案例的流程圖

具體實施方式

下面結(jié)合附圖對本發(fā)明的優(yōu)選方式作進一步詳細的描述。

如圖1所示,一種頻域高斯核函數(shù)圖像追蹤方法,包括以下步驟:

步驟1,對包含目標的當(dāng)前一幀圖像進行目標輸入,確定目標窗口,將追蹤窗口通過Hann窗口進行預(yù)處理;更具體地,讀取視頻文件第一幀圖像,由鼠標、鍵盤、語音或者程序自動輸入確定所要選取的目標區(qū)域的大小、位置,同時確定目標區(qū)域的中心位置;以此中心位置為中心取目標窗口區(qū)域大小1.5-10倍區(qū)域作為追蹤窗口區(qū)域;對追蹤窗口進行Hann窗口處理,降低邊緣效應(yīng)。

步驟2,采集追蹤窗口的某一特征,采用密集采樣的方法進行樣本采集,同時通過每一個樣本的位置信息對樣本進行貼標簽,將采集的樣本采用循環(huán)矩陣進行處理;更具體地,對目標進行密集采樣:對追蹤區(qū)域提取單一的圖像特征,如灰度特征,HOG特征,SIFT特征,采集到的圖像追蹤區(qū)域特征向量為x,作為正樣本,x=[x0,x1,x2,...,xn-1]T,定義向量xi

其中P為使向量整體向下移動一個元素的置換矩陣,最后的一個元素移動到第一個元素的位置得來,使用循環(huán)移位進行向量處理,每循環(huán)移位一次就等于訓(xùn)練時進行了一次采樣,循環(huán)移位得到的向量xi為采集到的負樣本;由追蹤區(qū)域可以確定標簽的參數(shù)y,其中y為n階向量y=[y0,y1,y2,...,yn-1]T,其中的元素為yi,為了處理目標的區(qū)域的邊界,不同于正常情況下的標簽表為0或者1,給每一個標簽y給予一定的值,yi=exp(-(i-i′)2/s2),和目標最近的地方為1,遠離樣本的地方為0;通過密集采樣和循環(huán)矩陣將向量x與向量y的向量卷積轉(zhuǎn)化為頻域的點積,使卷積運算轉(zhuǎn)化為頻域點積運算:對于循環(huán)矩陣C(x),這個循環(huán)矩陣是由向量x=[x0,x1,x2,...,xn-1]T循環(huán)移位得到,

整個C(x)矩陣的第一行就是向量x,第二行是向量x整體向右移動一個元素,最后一個元素移動到第一個元素的位置,依次類推,同樣由于C(x)結(jié)構(gòu)特性,C(x)的元素定義為Cij=u(j-i)mod n,如果矩陣的元素僅僅依賴于(j-i)mod n,mod是求余操作,矩陣是循環(huán)矩陣。向量x和向量y的向量卷積,可以轉(zhuǎn)化為C(x)y。由于循環(huán)矩陣的性質(zhì),將C(x)y轉(zhuǎn)化為頻域計算C(x)y=F-1(F*(x)⊙F(y)),其中F與F-1分別是傅里葉變換與傅里葉逆變換,⊙向量的點積,*是復(fù)共軛。

步驟3采用高斯核函數(shù)作為追蹤函數(shù)的核心,利用循環(huán)矩陣在頻域中計算高斯核函數(shù);更具體的,采用高斯核函數(shù)κ,作為追蹤方法的核心函數(shù),κ是幺正的核函數(shù),對于任意的幺正矩陣U來說,κ(x,x')=κ(Ux,Ux'),因為置換矩陣是幺正的,對于矩陣P,矩陣K其中的元素為Kij=κ(Pix,Pjx),Kij=κ(Pix,Pjx)=κ(P-iPix,P-iPjx)=κ(x,Pj-ix),由此可以看出,Kij僅依賴于(j-i)mod n,所以K是循環(huán)的;將矩陣K轉(zhuǎn)化為循環(huán)矩陣模式:定義向量k,k=[k1,k2,k3,...,kn]T,向量k的元素ki

核函數(shù)矩陣K可以變換為K=C(k),k是n×1階矩陣,K是n×n階矩陣。當(dāng)被轉(zhuǎn)化到頻域中時,在C(k)模式的矩陣中運行,矩陣乘法和矩陣求逆,都可以在k向量基礎(chǔ)上按元素進行,計算時只需要存儲k向量;將對向量k的計算轉(zhuǎn)化到頻域當(dāng)中,對于高斯核函數(shù)有

由于||x||2是與P無關(guān)的常數(shù),再由C(x)y=F-1(F*(x)⊙F(y)),可以得到

步驟4,通過頻域計算密集采樣樣本和新的一幀圖像的追蹤窗口最大相應(yīng)值,確定新的一幀圖像中目標窗口的中心位置,選取與步驟1同樣大小的目標窗口重復(fù)步驟1,2,3,4,完成圖像追蹤;更具體的,通過核嶺回歸得出最小化判別函數(shù)封閉解α=(K+λI)-1y。對于最小化判別函數(shù)f(x)=<w,x>,通過

函數(shù)來判別,利用核嶺回歸來計算函數(shù),L(y,f(x))=(y-f(x))2,并且將分類器應(yīng)用到更高維度的特征空間中,其中投影空間利用高斯核函數(shù)K來進行投影由f(x)一般定義,f(x)=wTx=∑iαiκ(x,xi)帶入到上述的最小化判別函數(shù)當(dāng)中去,求導(dǎo),可以得到判別函數(shù)的封閉解

α=(K+λI)-1y

只和輸入有關(guān),K是核函數(shù)矩陣,其中的元素為Kij=K(xi,xj),I是單位矩陣,向量α的元素是αi,求解出來最小決策函數(shù)的解α,就避免決策函數(shù)的最小化決策;將封閉解α的運算轉(zhuǎn)換到傅里葉域當(dāng)中進行。由于矩陣K以及任意一個單位矩陣I是循環(huán)的,I=C(δ),δ=[1,0,0,...,0]T,ki=κ(x,Pix),α=(K+λI)-1y,可以得到α=(C(k)+λC(δ))-1y=(C(k+λδ))-1y,在傅里葉域中,循環(huán)矩陣可以進行智能元素相乘,以及矩陣反演;由于這些性質(zhì)以及是二進制反碼的n×1階向量,其中的除法是元素的智能相除,有C(x)y=F-1(F*(x)⊙F(y))可以得到,向量α包含了所有的系數(shù)αi,α的解僅僅使用快速傅里葉變換和按元素智能操作,同時α的解利用傅里葉變換將計算轉(zhuǎn)化到頻域當(dāng)中進行,其中的k可以通過快速傅里葉變換計算出來;對新的一幀圖像,在圖像中取第一幀圖像目標的中心位置相同位置取與第一幀圖像追蹤窗口同樣大小的追蹤窗口,將追蹤窗口的輸入記為z,z=[z0,z1,z2,...,zn-1]T,對于輸入的響應(yīng)y′=∑iαiκ(xi,z),這個公式是輸入特性的一般表示由xi=Pix,zi=Piz得到,定義是一個向量其中的向量元素由矩陣概念可以得到由C(u)v=F-1(F*(u)⊙F(v))得到,由以上公式可知,以上運算都通過傅里葉變換轉(zhuǎn)化到頻域中進行,并且都具有循環(huán)結(jié)構(gòu),利用循環(huán)結(jié)構(gòu)可以同時高效的計算所有響應(yīng),找出響應(yīng)的最大值;通過找到循環(huán)移位的最大相應(yīng)值,確定為第二幀圖像中的目標中心位置,同時以第二幀圖像中心取上一幀目標區(qū)域大小作為新的目標區(qū)域,在設(shè)備上輸出圖像;將第二幀圖像作為新的第一幀圖像,將選中的目標區(qū)域作為目標區(qū)域,依次對第二幀對以上參數(shù)進行更新,繼續(xù)步驟1,2,3,4操作,完成整個視頻圖像追蹤。

顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明的頻域高斯核函數(shù)追蹤方法進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若對本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1