專(zhuān)利名稱(chēng):一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像檢測(cè)方法,尤其涉及一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法。
背景技術(shù):
圖像目標(biāo)的匹配和檢測(cè)一直是計(jì)算機(jī)視覺(jué)中一個(gè)非常重要的領(lǐng)域。在圖像目標(biāo)的檢測(cè)中,檢測(cè)方法主要有基于圖像局部特征的檢測(cè)方法和基于滑動(dòng)窗口的檢測(cè)方法。其中,基于圖像局部特征的檢測(cè)方法包括以下步驟特征檢測(cè),特征識(shí)別,以及模型匹配。然而,基于滑動(dòng)窗口的檢測(cè)方法則是通過(guò)不同大小的窗口對(duì)輸入圖像進(jìn)行掃描,并判斷所掃描的圖像塊之中是否含有目標(biāo)對(duì)象。這些算法已經(jīng)比較成熟并且可以達(dá)到實(shí)時(shí)檢測(cè),但是這些方法在應(yīng)用到多目標(biāo)檢
測(cè)的時(shí)候存在擴(kuò)展性問(wèn)題?;趫D像局部特征的檢測(cè)方法在檢測(cè)多個(gè)目標(biāo)時(shí),需要分別將每個(gè)目標(biāo)圖像的特征點(diǎn)與待檢測(cè)圖像的特征點(diǎn)進(jìn)行匹配,分別找到每個(gè)目標(biāo)匹配的位置,這樣會(huì)導(dǎo)致匹配時(shí)間隨目標(biāo)數(shù)量的增加呈線性增加的趨勢(shì);基于滑動(dòng)窗口的檢測(cè)方法在檢測(cè)多個(gè)目標(biāo)時(shí),需要將待檢測(cè)圖像子塊分別與每個(gè)目標(biāo)圖像進(jìn)行匹配,分別判斷是否是目標(biāo)位置,這樣匹配時(shí)間也會(huì)隨目標(biāo)數(shù)量的增加線性增加。由上所述,現(xiàn)有基于圖像局部特征的檢測(cè)方法和基于滑動(dòng)窗口的檢測(cè)方法的檢測(cè)時(shí)間會(huì)隨著待檢測(cè)樣本目標(biāo)數(shù)量的增加線性增加。對(duì)于大量的圖像目標(biāo),檢測(cè)效率很低,不適合應(yīng)用以上方法。在檢測(cè)的過(guò)程中,用戶(hù)希望系統(tǒng)能夠具有很好的檢測(cè)速度,能夠在大規(guī)模的目標(biāo)圖像數(shù)據(jù)里很快的檢測(cè)到目標(biāo)。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法,該方法可一次檢測(cè)多個(gè)目標(biāo),且效率高,快速、準(zhǔn)確。本發(fā)明解決上述技術(shù)問(wèn)題的技術(shù)方案如下一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法,其特征在于,該方法具體步驟如下步驟一提取目標(biāo)樣本庫(kù)中每幅圖像的特征點(diǎn),計(jì)算出每幅圖像的BOF詞袋向量,從而構(gòu)成所述目標(biāo)樣本庫(kù)的BOF向量集合;步驟二 利用所述目標(biāo)樣本庫(kù)的BOF向量集合構(gòu)建所述目標(biāo)樣本庫(kù)的M — Tree索弓I ;步驟三將待檢測(cè)圖像在所述M-Tree索引中進(jìn)行多目標(biāo)檢測(cè),并將檢測(cè)果返回給用戶(hù)。本發(fā)明的有益效果是本發(fā)明所述的一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法,該方法利用BOF向量構(gòu)建M-Tree索引進(jìn)行目標(biāo)檢測(cè),具有很好的魯棒性,對(duì)目標(biāo)形變,遮擋,光照變化不敏感;可以一次檢測(cè)多個(gè)目標(biāo),不需要重復(fù)檢測(cè),可以實(shí)現(xiàn)高效的在線多目標(biāo)檢測(cè);該方法可廣泛用于網(wǎng)絡(luò)信息安全、圖像多目標(biāo)檢測(cè),視頻多目標(biāo)跟蹤等多個(gè)領(lǐng)域。在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進(jìn)。進(jìn)ー步,所述圖像特征點(diǎn)的提取是利用sift尺度不變特征變換算法進(jìn)行的。進(jìn)ー步,所述計(jì)算每幅圖像的BOF向量,步驟如下I)選取ー個(gè)具有代表性的圖 像庫(kù),并計(jì)算該圖像庫(kù)的所有特征點(diǎn)的聚類(lèi)類(lèi)中心,即特征詞典;2)計(jì)算待計(jì)算BOF向量的圖像的特征點(diǎn)和步驟I)中所述的聚類(lèi)類(lèi)中心之間的歐幾里得距離;3)找到離待計(jì)算BOF向量的圖像的特征點(diǎn)最近的類(lèi)中心,計(jì)算該類(lèi)中心的頻數(shù),并將頻數(shù)加I ;4)重復(fù)步驟2)、3),直到完成待生成BOF向量的圖像的所有的特征點(diǎn)的頻數(shù)計(jì)算,得到該圖像的頻數(shù)直方圖,將所述頻數(shù)直方圖向量化即得到該圖像的BOF向量。進(jìn)ー步,所述將待檢測(cè)圖像在M-tree索引中進(jìn)行多目標(biāo)檢測(cè),步驟如下I)根據(jù)需要定義ー個(gè)固定尺寸的滑動(dòng)窗ロ ;2)所述滑動(dòng)窗ロ在待檢測(cè)圖像上按照一定規(guī)則進(jìn)行滑動(dòng),得到待檢測(cè)圖像塊;3)計(jì)算所述待檢測(cè)圖像塊的BOF向量;4)將所述待檢測(cè)圖像塊的BOF向量在所述M-Tree索引中進(jìn)行匹配;5)利用相似性度量方法檢測(cè)所述M-Tree索引中是否存在與所述待檢測(cè)圖像塊相似的目標(biāo),如果存在,執(zhí)行步驟6),否則,返回步驟2);6)將檢測(cè)到的相似目標(biāo)圖像以及其在待檢測(cè)大圖像中的位置返回給用戶(hù)。進(jìn)ー步,所述一定規(guī)則是按照自左向右,自上而下的方向滑動(dòng),每次向右或者向下滑動(dòng)的距離為ー個(gè)常量。
圖I為本發(fā)明涉及的一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法的總流程圖;圖2為本發(fā)明涉及的計(jì)算每幅圖像BOF向量步驟的流程圖;圖3為本發(fā)明涉及的待檢測(cè)圖像在M-tree索引中進(jìn)行多目標(biāo)檢測(cè)步驟的流程圖;圖4為本發(fā)明涉及的滑動(dòng)窗ロ在待檢測(cè)圖像上滑動(dòng)的示意圖。附圖中,各標(biāo)號(hào)所代表的部件列表如下I、待檢測(cè)圖像,2、滑動(dòng)窗ロ。
具體實(shí)施例方式以下結(jié)合附圖對(duì)本發(fā)明的原理和特征進(jìn)行描述,所舉實(shí)例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。如圖I所示為本發(fā)明涉及的一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法的總流程圖;圖2為本發(fā)明涉及的計(jì)算每幅圖像BOF向量步驟的流程圖;圖3為本發(fā)明涉及的待檢測(cè)圖像在M-tree索引中進(jìn)行多目標(biāo)檢測(cè)步驟的流程圖;圖4是為本發(fā)明涉及的滑動(dòng)窗ロ在待檢測(cè)圖像上滑動(dòng)的示意圖。如圖1、2、3、4所示,一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法的具體步驟如下由用戶(hù)提供目標(biāo)樣本庫(kù)和待檢測(cè)圖像。步驟ー提取目標(biāo)樣本庫(kù)中每幅圖像的特征點(diǎn),計(jì)算出每幅圖像的BOF詞袋向量,從而構(gòu)成所述目標(biāo)樣本庫(kù)的BOF向量集合;計(jì)算每幅圖像的BOF向量的步驟如下I)選取ー個(gè)具有代表性的圖像庫(kù),并計(jì)算該圖像庫(kù)的所有特征點(diǎn)的聚類(lèi)類(lèi)中心,即特征詞典;2)計(jì)算待計(jì)算BOF向量的圖像的特征點(diǎn)和步驟I)中所述的聚類(lèi)類(lèi)中心之間的歐幾里得距離;3)找到離待計(jì)算BOF向量的圖像的特征點(diǎn)最近的類(lèi)中心,計(jì)算該類(lèi)中心的頻數(shù),
并將頻數(shù)加I ;4)重復(fù)步驟2)、3),直到完成待生成BOF向量的圖像的所有的特征點(diǎn)的頻數(shù)計(jì)算,得到該圖像的頻數(shù)直方圖,將所述頻數(shù)直方圖向量化即得到該圖像的BOF向量。步驟ニ 利用所述目標(biāo)樣本庫(kù)的BOF向量集合構(gòu)建所述目標(biāo)樣本庫(kù)的M — Tree索弓I ;步驟三將待檢測(cè)圖像在所述M-tree索引中進(jìn)行多目標(biāo)檢測(cè),并將檢測(cè)果返回給用戶(hù);檢測(cè)具體步驟如下I)根據(jù)需要定義ー個(gè)固定尺寸的滑動(dòng)窗ロ 2 ;2)所述滑動(dòng)窗ロ 2在待檢測(cè)圖像I上按照一定規(guī)則進(jìn)行滑動(dòng),得到待檢測(cè)圖像塊;3)計(jì)算所述待檢測(cè)圖像塊的BOF向量;4)將所述待檢測(cè)圖像塊的BOF向量在所述M-Tree索引中進(jìn)行匹配;5)利用相似性度量方法檢測(cè)所述M-Tree索引中是否存在與所述待檢測(cè)圖像塊相似的目標(biāo),如果存在,執(zhí)行步驟6),否則,返回步驟2);6)將檢測(cè)到的相似目標(biāo)圖像以及其在待檢測(cè)大圖像中的位置返回給用戶(hù)。其中,所述一定規(guī)則是按照自左向右,自上而下的方向滑動(dòng),每次向右或者向下滑動(dòng)的距離為ー個(gè)常量。以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法,其特征在于,該方法具體步驟如下 步驟一提取目標(biāo)樣本庫(kù)中每幅圖像的特征點(diǎn),計(jì)算出每幅圖像的BOF詞袋向量,從而構(gòu)成所述目標(biāo)樣本庫(kù)的BOF向量集合; 步驟二 利用所述目標(biāo)樣本庫(kù)的BOF向量集合構(gòu)建所述目標(biāo)樣本庫(kù)的M — Tree索引; 步驟三將待檢測(cè)圖像在M-tree索引中進(jìn)行多目標(biāo)檢測(cè),并將檢測(cè)果返回給用戶(hù)。
2.根據(jù)權(quán)利要求I所述一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法,其特征在于,所述圖像特征點(diǎn)的提取是利用sift尺度不變特征變換算法進(jìn)行的。
3.根據(jù)權(quán)利要求I所述一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法,其特征在于,所述計(jì)算每幅圖像的BOF向量,步驟如下 1)選取一個(gè)具有代表性的圖像庫(kù),并計(jì)算該圖像庫(kù)的所有特征點(diǎn)的聚類(lèi)類(lèi)中心,即特征詞典; 2)計(jì)算待計(jì)算BOF向量的圖像的特征點(diǎn)和步驟I)中所述的聚類(lèi)類(lèi)中心之間的歐幾里得距離; 3)找到離待計(jì)算BOF向量的圖像的特征點(diǎn)最近的類(lèi)中心,計(jì)算該類(lèi)中心的頻數(shù),并將頻數(shù)加I ; 4)重復(fù)步驟2)、3),直到完成待生成BOF向量的圖像的所有的特征點(diǎn)的頻數(shù)計(jì)算,得到該圖像的頻數(shù)直方圖,將所述頻數(shù)直方圖向量化即得到該圖像的BOF向量。
4.根據(jù)權(quán)利要求I所述一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法,其特征在于,所述將待檢測(cè)圖像在M-tree索引中進(jìn)行多目標(biāo)檢測(cè),步驟如下 1)根據(jù)需要定義一個(gè)固定尺寸的滑動(dòng)窗口; 2)所述滑動(dòng)窗口在待檢測(cè)圖像上按照一定規(guī)則進(jìn)行滑動(dòng),得到待檢測(cè)圖像塊; 3)計(jì)算所述待檢測(cè)圖像塊的BOF向量; 4)將所述待檢測(cè)圖像塊的BOF向量在所述M-Tree索引中進(jìn)行匹配; 5)利用相似性度量方法檢測(cè)所述M-Tree索引中是否存在與所述待檢測(cè)圖像塊相似的目標(biāo),如果存在,執(zhí)行步驟6 ),否則,返回步驟2 ); 6)將檢測(cè)到的相似目標(biāo)圖像以及其在待檢測(cè)大圖像中的位置返回給用戶(hù)。
5.根據(jù)權(quán)利要求4所述一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法,其特征在于,所述一定規(guī)則是按照自左向右,自上而下的方向滑動(dòng),每次向右或者向下滑動(dòng)的距離為一個(gè)常量。
全文摘要
本發(fā)明涉及一種基于相似性度量的圖像多目標(biāo)檢測(cè)方法,該方法具體步驟步驟一提取目標(biāo)樣本庫(kù)中每幅圖像的特征點(diǎn),計(jì)算出每幅圖像的BOF詞袋向量,從而構(gòu)成所述目標(biāo)樣本庫(kù)的BOF向量集合;步驟二利用目標(biāo)樣本庫(kù)的BOF向量集合構(gòu)建所述目標(biāo)樣本庫(kù)的M—Tree索引;步驟三將待檢測(cè)圖像在M-t ree索引中進(jìn)行多目標(biāo)檢測(cè),并將檢測(cè)果返回給用戶(hù);該方法利用BOF向量進(jìn)行目標(biāo)檢測(cè),具有很好的魯棒性,對(duì)目標(biāo)形變,遮擋,光照變化不敏感;可以一次檢測(cè)多個(gè)目標(biāo),不需要重復(fù)檢測(cè),可以實(shí)現(xiàn)高效的在線多目標(biāo)檢測(cè);該方法可廣泛用于網(wǎng)絡(luò)信息安全、圖像多目標(biāo)檢測(cè),視頻多目標(biāo)跟蹤等多個(gè)領(lǐng)域。
文檔編號(hào)G06T7/00GK102855473SQ20121029941
公開(kāi)日2013年1月2日 申請(qǐng)日期2012年8月21日 優(yōu)先權(quán)日2012年8月21日
發(fā)明者徐克付, 張闖, 譚建龍, 郭莉 申請(qǐng)人:中國(guó)科學(xué)院信息工程研究所