本發(fā)明涉及一種基于球空間的三維目標(biāo)識別方法,屬于形狀匹配技術(shù)領(lǐng)域。
背景技術(shù):
目標(biāo)識別是計算機視覺中的熱門話題,在人機交互中起著關(guān)鍵作用,其研究和發(fā)展使人機交互更為靈活,使智能設(shè)備與目標(biāo)對象的結(jié)合更加緊密。這些智能設(shè)備已經(jīng)被應(yīng)用到人類生活以及工業(yè)發(fā)展的各個方面,因此目標(biāo)識別算法被廣泛研究。
目標(biāo)識別算法的發(fā)展經(jīng)歷了三個主要時期。第一個時期是二維靜態(tài)目標(biāo)識別,也是最簡單的目標(biāo)識別,通過獲取二維信息來識別一些簡單的目標(biāo)。這種技術(shù)只能識別靜態(tài)的目標(biāo),不能察覺目標(biāo)的持續(xù)變化。第二個時期是二維動態(tài)目標(biāo)識別,通過獲取動態(tài)目標(biāo)的信息,可以進行更有效的人機交互。隨著深度相機的出現(xiàn),如微軟的kinect傳感器,目標(biāo)的三維信息可以被很好地獲取,因此三維目標(biāo)識別已被廣泛研究。
已經(jīng)有許多不同的三維目標(biāo)識別算法被提出,基于它們所使用的特征的類型,三維目標(biāo)識別方法可以分為兩類:基于全局特征的方法和基于局部特征的方法。尺度不變特征變換算法是形狀匹配中的一種經(jīng)典算法,可以用于目標(biāo)識別。然而,這種方法過于依賴局部區(qū)域像素的梯度,因此缺乏穩(wěn)定性。隱馬爾科夫模型是另一種廣泛使用的目標(biāo)識別方法,這種方法有效但計算十分復(fù)雜。能夠同時保證效率和準(zhǔn)確率的目標(biāo)識別方法仍有待研究。
因此,針對上述技術(shù)問題,有必要提供一種基于球空間的三維目標(biāo)識別方法。
技術(shù)實現(xiàn)要素:
本發(fā)明的發(fā)明目的是提供一種基于球空間的三維目標(biāo)識別方法。
為達到上述發(fā)明目的,本發(fā)明采用的技術(shù)方案是:一種基于球空間的三維目標(biāo)識別方法,其特征在于,所述方法包括如下步驟:
s1、利用深度傳感器獲取目標(biāo)深度圖像,得到目標(biāo)三維信息,如圖2所示;
s2、對深度圖像進行預(yù)處理,濾除深度圖像中的部分噪聲;
s3、求出目標(biāo)圖像各點的三維坐標(biāo)參數(shù);
s4、構(gòu)建球空間,根據(jù)目標(biāo)點云坐標(biāo)構(gòu)建對數(shù)極坐標(biāo)直方圖,形成三維特征描述符,如圖3所示,從左至右分別為目標(biāo)三維信息圖、球空間劃分示意圖以及對數(shù)極坐標(biāo)直方圖;
s5、通過計算匹配度,獲得目標(biāo)圖像與每個模版圖像之間的匹配度值,匹配度值越小則相似度越大。
優(yōu)選地,步驟s4具體包括:
s41、將目標(biāo)圖像上某一點與其余所有點有向連接形成向量,計算向量的歐式距離和相對于水平線及垂直線的角度;
s42、將相對于水平線及垂直線的角度分別平均分成12份,每30°一個單位,并求出最大距離的對數(shù),并將其等分為5份,以角度為行,距離的對數(shù)為列,形成一個12×12×5維的球空間矩陣;
s43、計算每個點與其余所有點之間的角度和距離的對數(shù),并將其落在對應(yīng)的球空間矩陣格中;
s44、統(tǒng)計落在每一個球空間矩陣格的點數(shù),即可得到此點的對數(shù)極坐標(biāo)直方圖,即該點的特征向量。
優(yōu)選地,所述步驟s5具體包括:
s51、將由步驟s4得到的每個目標(biāo)點的特征向量進行組合,共計n個輪廓點,即可得到一個n×720維特征矩陣;
s52、計算目標(biāo)圖像中某一點與模版圖像中某一點的匹配度值;
s53、計算兩張圖像間的最小匹配總成本;
s54、使用t變換計算圖像間的匹配度,匹配度值越小則目標(biāo)圖像與模版圖像越相似。
由于上述技術(shù)方案運用,本發(fā)明與現(xiàn)有技術(shù)相比具有下列優(yōu)點:
本發(fā)明基于球空間的三維目標(biāo)識別方法在自動匹配和識別系統(tǒng)中,可以對目標(biāo)形狀以及深度信息進行特征的提取和有效表示,具有尺度不變性、旋轉(zhuǎn)不變性和平移不變性,提高了識別的準(zhǔn)確率。
附圖說明
圖1為本發(fā)明基于球空間的三維目標(biāo)識別方法的具體流程圖;
圖2為利用深度傳感器獲取包含三維信息的圖示意圖,從左至右分別為目標(biāo)原圖以及目標(biāo)三維信息圖;
圖3為本發(fā)明一具體實施方式中的三維信息圖中的特征提取示意圖,從左至右分別為目標(biāo)三維信息圖、球空間劃分示意圖以及對數(shù)極坐標(biāo)直方圖。
具體實施方式
下面結(jié)合附圖及實施例對本發(fā)明作進一步描述:
實施例一:參見圖1所示,一種基于球空間的三維目標(biāo)識別方法,所述方法包括如下步驟:
s1、利用深度傳感器獲取目標(biāo)深度圖像,得到目標(biāo)三維信息,如圖2所示;
s2、對深度圖像進行預(yù)處理,濾除深度圖像中的部分噪聲;
s3、求出目標(biāo)圖像各點的三維坐標(biāo)參數(shù);
s4、構(gòu)建球空間,根據(jù)目標(biāo)點云坐標(biāo)構(gòu)建對數(shù)極坐標(biāo)直方圖,形成三維特征描述符,如圖3所示,從左至右分別為目標(biāo)三維信息圖、球空間劃分示意圖以及對數(shù)極坐標(biāo)直方圖;
步驟s4具體包括:
s41、將目標(biāo)圖像上某一點與其余所有點有向連接形成向量,計算向量的歐式距離和相對于水平線及垂直線的角度;
s42、將相對于水平線及垂直線的角度分別平均分成12份,每30°一個單位,并求出最大距離的對數(shù),并將其等分為5份,以角度為行,距離的對數(shù)為列,形成一個12×12×5維的球空間矩陣;
s43、計算每個點與其余所有點之間的角度和距離的對數(shù),并將其落在對應(yīng)的球空間矩陣格中;
s44、統(tǒng)計落在每一個球空間矩陣格的點數(shù),即可得到此點的對數(shù)極坐標(biāo)直方圖,即該點的特征向量。
s5、通過計算匹配度,獲得目標(biāo)圖像與每個模版圖像之間的匹配度值,匹配度值越小則相似度越大。
上述步驟s5具體包括:
s51、將由步驟s4得到的每個目標(biāo)點的特征向量進行組合,共計n個輪廓點,即可得到一個n×720維特征矩陣;
s52、計算目標(biāo)圖像中某一點與模版圖像中某一點的匹配度值;
s53、計算兩張圖像間的最小匹配總成本;
s54、使用t變換計算圖像間的匹配度,匹配度值越小則目標(biāo)圖像與模版圖像越相似
步驟s5中匹配度值d計算方式為:
假設(shè)目標(biāo)圖像點數(shù)為n,模版圖像點數(shù)為m。將目標(biāo)圖像上pi點和模版圖像上qj點進行匹配,公式cij=c(pi,qj)表示這兩個點之間的匹配度:
其中hi(k)和hj(k)分別為pi點和qj點對應(yīng)的直方圖值,k=60。
給定所有成對的匹配度c的集合,計算匹配的最小總成本,表示為:
已經(jīng)找到了一個對應(yīng)關(guān)系,之后使用t變換來衡量不同圖像的變化。
圖像間的匹配度計算如下:
匹配度值越小,目標(biāo)圖像與模版圖像相似度越大。
由以上技術(shù)方案可以看出,本發(fā)明提供的基于球空間的三維目標(biāo)識別方法在自動匹配和識別中,不僅僅對圖像的形狀,還對其深度信息進行特征的提取和有效表示,形成三維特征描述符,具有尺度不變性、旋轉(zhuǎn)不變性和平移不變性,提高了識別的準(zhǔn)確率。
對所公開的實施例的上述說明,使本領(lǐng)域技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域技術(shù)人員來說將是顯而易見的,本實施例中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。