一種基于局部特征學(xué)習(xí)的快速物體檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于模式識別中的目標檢測領(lǐng)域,以范例支撐向量機為學(xué)習(xí)框架,在快速 物體粗檢測的基礎(chǔ)上,采用線性支撐向量機訓(xùn)練范例模板并優(yōu)化局部特征。由于對待檢測 圖像采用了粗檢測處理,故本發(fā)明能夠有效減少物體檢測的搜索空間,在有效提高物體檢 測準確率的同時加快了物體檢測的速度。
【背景技術(shù)】
[0002] 近年來,服務(wù)機器人技術(shù)的研究取得了很大進展,各種類型的服務(wù)機器人已在家 政、娛樂、安保等多個領(lǐng)域?qū)崿F(xiàn)了功能豐富的應(yīng)用。物體的操作與搬運是服務(wù)機器人最重要 的基本功能之一,支撐起了復(fù)雜環(huán)境中機器人的各類高級應(yīng)用。而一個功能完善的物體操 作過程的實現(xiàn)離不開實時、準確的物體檢測。為了準確地執(zhí)行手臂規(guī)劃和抓取操作,服務(wù)機 器人的視覺感知系統(tǒng)不僅需要識別出目標物體,還需要提供目標物體及其附近障礙物的準 確空間位置信息。而環(huán)境的復(fù)雜性,如光照變化、局部遮擋、旋轉(zhuǎn)變化等因素的存在,導(dǎo)致物 體檢測任務(wù)具有很高的難度。
[0003] 研究表明,人類所感知的外界信息80%都是由視覺獲取。計算機視覺就是用成像 系統(tǒng)代替人類視覺器官作為輸入敏感手段,并由計算機來代替大腦完成處理和解釋。在研 究計算機視覺的眾多問題中,物體檢測是其核心的問題之一。即使圖像中的物體的存在形 狀、視角、尺寸等變化,甚至存在局部遮擋,人類也可以毫不費力地識別圖像中的眾多物體。 然而,要準確檢測和識別圖像中的物體,對機器人而言則是個極具挑戰(zhàn)的任務(wù)。
[0004] 目前,傳統(tǒng)的物體檢測大多是用訓(xùn)練樣本中標記好的含有物體的圖像塊進行分類 器訓(xùn)練,測試時,采用窗口遍歷測試樣本進行分類從而檢測出物體的位置以及類別。由于這 種方法在測試時需要遍歷,因此,非常消耗計算資源。而從生物視覺系統(tǒng)的角度,人類在觀 察一幅場景中的物體時,無需像計算機一樣遍歷整幅圖像,就能夠快速直接鎖定可能存在 物體的圖像區(qū)域。本發(fā)明旨在提出一種基于局部特征學(xué)習(xí)的快速物體檢測方法:在訓(xùn)練階 段,以范例-支撐向量機 [1]為學(xué)習(xí)框架,利用線性支撐向量機訓(xùn)練范例模板。在檢測階段,首 先利用快速物體粗檢測提取出可能存在物體的區(qū)域(近似物體區(qū)域),然后利用訓(xùn)練得到的 范例模板在近似物體區(qū)域進行物體細檢測,并利用物體形狀的先驗知識對檢測結(jié)果進行優(yōu) 化,可以有效提高物體檢測準確率,并加快物體檢測的速度。
[0005] 參考文獻:
[0006] [1]Malisiewicz T,Gupta A,Efros A A.Ensemble of exemplar-svms for object detection and beyond[C]. In proc. of 2011 IEEE International Conference on Computer Vision(ICCV2011)?:89-96.
[0007] [2]Cheng M M,Zhang Z,Lin W Y,et al·BING:Binarized normed gradients for objectness estimation at 300fps[C].In Proc.ofIEEE CVPR(2014).
[0008] [3]Felzenszwalb P F,Girshick R B,McAllester D,et al.Object detection with discriminatively trained part-based models[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(9):1627-1645.
【發(fā)明內(nèi)容】
[0009]由于基于范例模版的物體檢測方法,是用傳統(tǒng)的滑動窗口掃描技術(shù),算法較為耗 時,不能快速的完成物體檢測任務(wù)。針對上述問題,本發(fā)明提出利用快速物體粗檢測的思 想,提取出可能存在物體的圖像區(qū)域,在此基礎(chǔ)上,利用線性支撐向量機訓(xùn)練范例模板,最 終實現(xiàn)物體的快速檢測。由于粗檢測階段能夠快速檢測可能存在物體的區(qū)域,同時過濾掉 非物體區(qū)域,因此能夠有效提高檢測速度的同時,提高物體檢測的精度。本發(fā)明是采用以下 技術(shù)手段實現(xiàn)的:
[0010] 一種基于局部特征學(xué)習(xí)的快速物體檢測方法,其特征在于包括如下步驟:
[0011] 步驟1:訓(xùn)練范例模板
[0012] 步驟1.1 :訓(xùn)練集圖像的獲取
[0013] 利用安裝在移動機器人平臺上的攝像機,采集物體圖像,并根據(jù)訓(xùn)練集中的標簽 信息確定需要訓(xùn)練的物體模版的正樣本集P以及負樣本集N,其中含有特定物體的樣本稱為 正樣本,反之稱為負樣本。訓(xùn)練集中的每一個正樣本都需要單獨與全部的負樣本一起訓(xùn)練。
[0014] 步驟1.2:模板訓(xùn)練
[0015]對每個正樣本和全部的負樣本,利用支撐向量機進行訓(xùn)練,得到每個正樣本相對 應(yīng)的范例模板。其中SVM的優(yōu)化函數(shù)為:
[0017] 其中,&,(:2為懲罰項,h(x)為損失函數(shù),ω表示使分類間隔最大的劃分直線的法向 量,ω τ表示ω的轉(zhuǎn)置運算,b表示偏移量,χε表示某個正樣本,X表示負樣本,Ν表示負樣本集, 當I I ω I I2取得最小值時,ΩΕ( ω,b)即表示最佳分類面。
[0018] 步驟1.3:模板標定
[0019]由于不同的SVM分類器的得分不能直接進行比較,需要對不同的SVM分類器進行標 定:使用擬合的s igmo id函數(shù)將分類器輸出統(tǒng)一到[0,1 ],即可得到對應(yīng)的概率。Sigmo id映 射函數(shù)如下:
[0021]其中,αΕ,βΕ是sigmoid函數(shù)的參數(shù),通過最大似然估計得到。
[0022]步驟2:物體的粗檢測 [0023]步驟2.1:物體模板ω的建立
[0024] 步驟2.1.1:在低像素的條件下,雖然不容易分清圖像中具體包含的物體,但是人 們卻容易分辨出是否含有物體?;谶@種思想,將訓(xùn)練數(shù)據(jù)集中的圖像縮放成36種不同的 尺寸的圖像,構(gòu)成圖像集合{(1〇,出)},其中1〇,!1(^{1〇,20,40,80,160,320},利用下式表 示:
[0025] l = (i,x,y)
[0026] 其中1表示含有物體的窗口,i是表示圖像的大小,(x,y)表示位置。
[0027] 步驟2.1.2:計算圖像的梯度范數(shù)(NormedGradients,NG)特征,即圖像中某區(qū)域的 梯度范數(shù)值。如在一個8*8區(qū)域內(nèi),可以根據(jù)梯度算子計算得到一個64維的梯度范數(shù)特征。 具體計算方法是:利用一個一維梯度算子[_1,0,1]來計算圖像中水平和垂直方向上的梯度 gx和gy,并通過計算min{ I gx| + | gy I ,255}得到圖像的梯度范數(shù)特征。這樣計算的優(yōu)勢在于將 這一特征歸一化到[0,255 ]之間,進而可以轉(zhuǎn)換為8位二進制數(shù),便于后面的二值化處理。 [0028]步驟2.1.3:利用線性支持向量機訓(xùn)練物體模版ω :以已標注物體的窗口的梯度范 數(shù)特征作為正樣本,隨機抽取背景窗口的梯度范數(shù)特征作為負樣本,利用線性SVM訓(xùn)練得到 物體模板ω。依據(jù)公式(3),并利用ω和在36種尺寸圖像上滑動掃描得到每個窗口的得分:
[0029] si = < ω ,gi> (3)
[0030] 其中g(shù)i是每個窗口的梯度范數(shù)特征。
[0031]步驟2.1.4:利用窗口大小、匹配得分以及最終窗口是否含有目標三者之間的關(guān)系 進行建模,利用公式(4)計算得到最終匹配的得分,并在每種窗口尺寸大小選擇Μ個得分最 高的作為目標輸出:
[0032] 0i = vi · si+ti (4)
[0033] 上式中的^,1為線性模型的參數(shù),^為誤差項。這兩個參數(shù)可用線性支持向量機 學(xué)習(xí)得到。即用36種不同尺寸圖像中在位置1處的二值化梯度范數(shù)與模板匹配得分作為訓(xùn) 練樣本,利用線性支持向量機的方法訓(xùn)練得到 Vl,^。
[0034] 步驟2.2:物體模板ω的二值化
[0035] 為了進一步加速運算,利