是:對(duì)于某類物體的范例模板&,由于另一個(gè)與其存在互信息的范例模板^對(duì)于同一片區(qū)域 心的檢測(cè)影響,因此對(duì)于ei檢測(cè)到的區(qū)域&其新的得分可以通過公式矣=?</'(/〇得到,其 中以1^) = [&,5, . . .,fN],灼為范例模板61與范例模板幻的互信息特征,mel表示同時(shí)檢測(cè)正 確的概率,可以通過直接統(tǒng)計(jì)訓(xùn)練集得到。
[0082]最后應(yīng)說明的是:以上示例僅用于說明本發(fā)明而并非限制本發(fā)明所描述的技術(shù)方 案;因此,盡管本說明書參照上述的示例對(duì)本發(fā)明已進(jìn)行了詳細(xì)的說明,但是本領(lǐng)域的普通 技術(shù)人員應(yīng)當(dāng)理解,仍然可以對(duì)本發(fā)明進(jìn)行修改或等同替換;而一切不脫離發(fā)明的精神和 范圍的技術(shù)方案及其改進(jìn),其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
【主權(quán)項(xiàng)】
1. 一種基于局部特征學(xué)習(xí)的快速物體檢測(cè)方法,其特征在于:該方法包括如下步驟, 步驟1:訓(xùn)練范例模板 步驟1.1:訓(xùn)練集圖像的獲取 利用安裝在移動(dòng)機(jī)器人平臺(tái)上的攝像機(jī),采集物體圖像,并根據(jù)訓(xùn)練集中的標(biāo)簽信息 確定需要訓(xùn)練的物體模版的正樣本集PW及負(fù)樣本集N,其中含有特定物體的樣本稱為正樣 本,反之稱為負(fù)樣本。訓(xùn)練集中的每一個(gè)正樣本都需要單獨(dú)與全部的負(fù)樣本一起訓(xùn)練。 步驟1.2:模板訓(xùn)練 對(duì)每個(gè)正樣本和全部的負(fù)樣本,利用支撐向量機(jī)進(jìn)行訓(xùn)練,得到每個(gè)正樣本相對(duì)應(yīng)的 范例模板。其中SVM的優(yōu)化函數(shù)為:(1) 其中,Cl,C2為懲罰項(xiàng),h(x)為損失函數(shù),ω表示使分類間隔最大的劃分直線的法向量, ω Τ表示ω的轉(zhuǎn)置運(yùn)算,b表示偏移量,ΧΕ表示某個(gè)正樣本,X表示負(fù)樣本,Ν表示負(fù)樣本集,當(dāng)II ω 112取得最小值時(shí),Ω E ( ω,b)即表示最佳分類面。 步驟1.3:模板標(biāo)定 由于不同的SVM分類器的得分不能直接進(jìn)行比較,需要對(duì)不同的SVM分類器進(jìn)行標(biāo)定: 使用擬合的sigmoid函數(shù)將分類器輸出統(tǒng)一到[0,1],即可得到對(duì)應(yīng)的概率。Sigmoid映射函 數(shù)如下:(2) 其中,啡,陸是sigmoid函數(shù)的參數(shù),通過最大似然估計(jì)得到。 步驟2:物體的粗檢測(cè) 步驟2.1:物體模板ω的建立 步驟2.1.1:在低像素的條件下,雖然不容易分清圖像中具體包含的物體,但是人們卻 容易分辨出是否含有物體?;谶\(yùn)種思想,將訓(xùn)練數(shù)據(jù)集中的圖像縮放成36種不同的尺寸 的圖像,構(gòu)成圖像集合{(Wo,曲)},其中胖〇,化£{10,20,40,80,160,320},利用下式表示: l = (i,x,y) 其中1表示含有物體的窗口,i是表示圖像的大小,(x,y)表示位置。 步驟2.1.2:計(jì)算圖像的梯度范數(shù)(NormedGrad i en t S,NG)特征,即圖像中某區(qū)域的梯度 范數(shù)值。如在一個(gè)8*8區(qū)域內(nèi),可W根據(jù)梯度算子計(jì)算得到一個(gè)64維的梯度范數(shù)特征。具體 計(jì)算方法是:利用一個(gè)一維梯度算子[-1,0,1]來計(jì)算圖像中水平和垂直方向上的梯度gx和 gy,并通過計(jì)算min{|gx| + |gy|,255}得到圖像的梯度范數(shù)特征。運(yùn)樣計(jì)算的優(yōu)勢(shì)在于可W將 運(yùn)一特征歸一化到[〇,25引之間,進(jìn)而可W轉(zhuǎn)換為8位二進(jìn)制數(shù),便于后面的二值化處理。 步驟2.1.3:利用線性支持向量機(jī)訓(xùn)練物體模版ω : W已標(biāo)注物體的窗口的梯度范數(shù)特 征作為正樣本,隨機(jī)抽取背景窗口的梯度范數(shù)特征作為負(fù)樣本,利用線性SVM訓(xùn)練得到物體 模板ω。依據(jù)公式(3),并利用ω和在36種尺寸圖像上滑動(dòng)掃描得到每個(gè)窗口的得分: si = < ω ,gi> (3) 其中g(shù)i是每個(gè)窗口的梯度范數(shù)特征。 步驟2.1.4:利用窗口大小、匹配得分W及最終窗口是否含有目標(biāo)Ξ者之間的關(guān)系進(jìn)行 建模,利用公式(4)計(jì)算得到最終匹配的得分,并在每種窗口尺寸大小選擇Μ個(gè)得分最高的 作為目標(biāo)輸出: Oi = Vi · si+ti (4) 上式中的Vi,ti為線性模型的參數(shù),ti為誤差項(xiàng)。運(yùn)兩個(gè)參數(shù)可用線性支持向量機(jī)學(xué)習(xí) 得到。即用36種不同尺寸圖像中在位置1處的二值化梯度范數(shù)與模板匹配得分作為訓(xùn)練樣 本,利用線性支持向量機(jī)的方法訓(xùn)練得到Vi,ti。 步驟2.2:物體模板ω的二值化 為了進(jìn)一步加速運(yùn)算,利用公式巧)對(duì)ω進(jìn)行二值化:。) 其中,Qj表示基向量,表示相應(yīng)的系數(shù),Νω為基向量的個(gè)數(shù)。 進(jìn)一步將每個(gè)Qj表示成:α,' - α;"。其中,α: e{(),:I)M。 則一個(gè)二進(jìn)制的向量b滿足下式:㈱ 由于一個(gè)十進(jìn)制數(shù)可W由其二進(jìn)制數(shù)的最高幾位來近似,則二值化64維的梯度范數(shù)特 征近似表示為:口) 其中Ng為十進(jìn)制數(shù)所對(duì)應(yīng)的二進(jìn)制數(shù)高位個(gè)數(shù),k表示二進(jìn)制的位數(shù),bk,i表示位置1處 位數(shù)k對(duì)應(yīng)的二進(jìn)制向量。 由公式巧)、(6)和(7)得到位置1處的二值化梯度范數(shù)與模板匹配得分最終可表示為:(8) 其中:為簡化起見,用Cj,k表示。 步驟2.3物體的粗檢測(cè) 利用步驟2.1訓(xùn)練得到的物體模板ω,在36種不同尺寸下的測(cè)試圖像滑動(dòng)掃描并計(jì)算 每個(gè)窗口存在物體可能性的得分,然后排序,將得分靠前的區(qū)域坐標(biāo)作為物體粗檢測(cè)的結(jié) 果。 步驟2.4優(yōu)化粗檢測(cè)結(jié)果 物體粗檢測(cè)得到的結(jié)果中往往含有較多冗余項(xiàng),需要對(duì)粗檢測(cè)結(jié)果進(jìn)行優(yōu)化,W去除 幾余: 1) 根據(jù)真實(shí)物體外觀形狀的先驗(yàn)知識(shí),在粗檢測(cè)結(jié)果中濾掉尺寸較小的近似物體區(qū)域 和細(xì)長的近似物體區(qū)域; 2) 計(jì)算剩余近似物體區(qū)域內(nèi)像素點(diǎn)的梯度,并設(shè)定闊值,將梯度值較小的區(qū)域剔除,進(jìn) 一步縮小物體檢測(cè)范圍; 3) 對(duì)剩余近似物體區(qū)域圖像塊進(jìn)行聚類,計(jì)算聚類中屯、幾何坐標(biāo),并W本聚類近似物 體區(qū)域的最外側(cè)作為邊界,確定可能存在物體的顯著區(qū)域。 步驟3;基于范例模版的物體檢測(cè) 步驟3.1:基于HOG特征滑動(dòng)窗口的物體檢測(cè) W步驟2檢測(cè)得到的可能存在物體區(qū)域(近似物體區(qū)域)作為范例模板物體檢測(cè)器的輸 入,采用固定大小的滑動(dòng)窗口的方法,提取每個(gè)滑動(dòng)窗口的冊(cè)G特征,并根據(jù)步驟1訓(xùn)練得到 的模板,計(jì)算輸入圖像區(qū)域的得分。定義權(quán)值曰,表示區(qū)域內(nèi)像素點(diǎn)到聚類中屯、點(diǎn)平均距離 的倒數(shù)。將每個(gè)輸入圖像區(qū)域的得分乘W權(quán)值a作積,作為該區(qū)域的最終得分。 步驟3.2:基于共生矩陣互信息的優(yōu)化 由于滑動(dòng)窗口捜索是一種過捜索策略,會(huì)導(dǎo)致冗余檢測(cè)區(qū)域,一般的對(duì)策是采用非極 大值抑制。非極大值抑制是一種貪屯、算法,即先將所有的候選目標(biāo)區(qū)域依據(jù)其得分從大到 小排序,然后,依次選擇得分最高的區(qū)域保留下來,同時(shí)將重合面積的候選目標(biāo)區(qū)域刪掉。 本發(fā)明同樣利用非極大值抑制,但是不同點(diǎn)在于:沒有直接使用范例分類器的得分,而 是先綜合各個(gè)范例模板的得分W及互信息之后得到新的得分,再進(jìn)行非極大值抑制。具體 的實(shí)現(xiàn)方式是:對(duì)于某類物體的范例模板e(cuò)i,由于另一個(gè)與其存在互信息的范例模板e(cuò)苗?于 同一片區(qū)域Ri的檢測(cè)影響,因此對(duì)于ei檢測(cè)到的區(qū)域Ri其新的得分可W通過下式得到:巧) 其中,f(Ri) = [fi,f2, . . .,fN],。為范例模板e(cuò)i與范例模板e(cuò)j的互信息特征,me康示同 時(shí)檢測(cè)正確的概率,微?表示mei的轉(zhuǎn)置運(yùn)算。mei(i = l,2, . . .,N)可W通過直接統(tǒng)計(jì)訓(xùn)練集 得到。M=[mei,me2,. . .,meN]是一個(gè)N*N矩陣,即為共生矩陣,它表示不同的范例模板如ei和ej 檢測(cè)到共同區(qū)域的可能程度,是通過直接統(tǒng)計(jì)訓(xùn)練集得到的。
【專利摘要】一種基于局部特征學(xué)習(xí)的快速物體檢測(cè)方法,在測(cè)試階段采用窗口遍歷測(cè)試樣本進(jìn)行分類從而檢測(cè)出物體的位置以及類別。由于需要遍歷,因此傳統(tǒng)物體檢測(cè)方法的計(jì)算代價(jià)較大。本發(fā)明提出一種基于局部特征學(xué)習(xí)快速的物體檢測(cè)方法:在訓(xùn)練階段,以范例支撐向量機(jī)為學(xué)習(xí)框架,利用線性支撐向量機(jī)訓(xùn)練范例模板。在檢測(cè)階段,首先利用快速物體粗檢測(cè),提取出可能存在物體的區(qū)域,再利用訓(xùn)練得到的范例模板進(jìn)行物體細(xì)檢測(cè)。本發(fā)明方法不僅可以有效提高物體檢測(cè)準(zhǔn)確率,而且能夠有效提高物體檢測(cè)的速度。
【IPC分類】G06K9/62, G06K9/32
【公開號(hào)】CN105574527
【申請(qǐng)?zhí)枴緾N201510927756
【發(fā)明人】楊金福, 陳浩, 張珊珊, 張強(qiáng)
【申請(qǐng)人】北京工業(yè)大學(xué)
【公開日】2016年5月11日
【申請(qǐng)日】2015年12月14日