用公式(5)對(duì)ω進(jìn)行二值化:
[0037]其中,a」表示基向量,β」表示相應(yīng)的系數(shù),Νω為基向量的個(gè)數(shù)。
[0038] 進(jìn)一步將每個(gè)a」表不成:orj -《。其中,(?丨e .{0 J丨.〇
[0039]則一個(gè)二進(jìn)制的向量b滿足下式:
[0041]由于一個(gè)十進(jìn)制數(shù)可以由其二進(jìn)制數(shù)的最高幾位來近似,則二值化64維的梯度范 數(shù)特征可以近似表示為:
[0043] 其中Ng為十進(jìn)制數(shù)所對(duì)應(yīng)的二進(jìn)制數(shù)高位個(gè)數(shù),k表示二進(jìn)制的位數(shù),bk,i表示位 置1處位數(shù)k對(duì)應(yīng)的二進(jìn)制向量。
[0044] 由公式(5)、(6)和(7)得到位置1處的二值化梯度范數(shù)與模板匹配得分最終可表示 為:
[0047]步驟2.3物體的粗檢測(cè)
[0048]利用步驟2.1訓(xùn)練得到的物體模板ω,在36種不同尺寸下的測(cè)試圖像滑動(dòng)掃描并 計(jì)算每個(gè)窗口存在物體可能性的得分,然后排序,將得分靠前的區(qū)域坐標(biāo)作為物體粗檢測(cè) 的結(jié)果。
[0049]步驟2.4優(yōu)化粗檢測(cè)結(jié)果
[0050]物體粗檢測(cè)得到的結(jié)果中往往含有較多冗余項(xiàng),需要對(duì)粗檢測(cè)結(jié)果進(jìn)行優(yōu)化,以 去除冗余:
[0051] 1)根據(jù)真實(shí)物體外觀形狀的先驗(yàn)知識(shí),在粗檢測(cè)結(jié)果中濾掉尺寸較小的近似物體 區(qū)域和細(xì)長(zhǎng)的近似物體區(qū)域;
[0052] 2)計(jì)算剩余近似物體區(qū)域內(nèi)像素點(diǎn)的梯度,并設(shè)定閾值,將梯度值較小的區(qū)域剔 除,進(jìn)一步縮小物體檢測(cè)范圍;
[0053] 3)對(duì)剩余近似物體區(qū)域圖像塊進(jìn)行聚類,計(jì)算聚類中心幾何坐標(biāo),并以本聚類近 似物體區(qū)域的最外側(cè)作為邊界,確定可能存在物體的顯著區(qū)域。
[0054]步驟3;基于范例模版的物體檢測(cè)
[0055] 步驟3.1:基于H0G特征滑動(dòng)窗口的物體檢測(cè)
[0056] 以步驟2檢測(cè)得到的可能存在物體區(qū)域(近似物體區(qū)域)作為范例模板物體檢測(cè)器 的輸入,采用固定大小的滑動(dòng)窗口的方法,提取每個(gè)滑動(dòng)窗口的H0G特征,并根據(jù)步驟1訓(xùn)練 得到的模板,計(jì)算輸入圖像區(qū)域的得分。定義權(quán)值a,表示區(qū)域內(nèi)像素點(diǎn)到聚類中心點(diǎn)平均 距離的倒數(shù)。將每個(gè)輸入圖像區(qū)域的得分乘以權(quán)值a作積,作為該區(qū)域的最終得分。
[0057]步驟3.2:基于共生矩陣互信息的優(yōu)化
[0058]由于滑動(dòng)窗口搜索是一種過搜索策略,會(huì)導(dǎo)致冗余檢測(cè)區(qū)域,一般的對(duì)策是采用 非極大值抑制。非極大值抑制是一種貪心算法,即先將所有的候選目標(biāo)區(qū)域依據(jù)其得分從 大到小排序,然后,依次選擇得分最高的區(qū)域保留下來,同時(shí)將重合面積的候選目標(biāo)區(qū)域刪 掉。
[0059]本發(fā)明同樣利用非極大值抑制,但是不同點(diǎn)在于:沒有直接使用范例分類器的得 分,而是先綜合各個(gè)范例模板的得分以及互信息之后得到新的得分,再進(jìn)行非極大值抑制。 具體的實(shí)現(xiàn)方式是:對(duì)于某類物體的范例模板Μ,由于另一個(gè)與其存在互信息的范例模板W 對(duì)于同一片區(qū)域心的檢測(cè)影響,因此對(duì)于ei檢測(cè)到的區(qū)域心其新的得分可以通過下式得到:
[0061 ]其中,fUiXfhft,…,fN],fj為范例模板e(cuò)i與范例模板e(cuò)j的互信息特征,mei表 示同時(shí)檢測(cè)正確的概率,7<表示mel的轉(zhuǎn)置運(yùn)算。mel(i = l,2, · · ·,N)可以通過直接統(tǒng)計(jì)訓(xùn)練 集得到。M=[mel,me2, . . .,meN]是一個(gè)N*N矩陣,即為共生矩陣,它表示不同的范例模板如ei 和W檢測(cè)到共同區(qū)域的可能程度,是通過直接統(tǒng)計(jì)訓(xùn)練集得到的。
[0062] 本發(fā)明與現(xiàn)有技術(shù)相比,具有以下的優(yōu)勢(shì)和有益效果:
[0063] 本發(fā)明提出利用快速物體粗檢測(cè)的思想,提取出可能存在物體的圖像區(qū)域,在此 基礎(chǔ)上,利用線性支撐向量機(jī)訓(xùn)練范例模板,最終實(shí)現(xiàn)物體的快速檢測(cè)。由于粗檢測(cè)階段能 夠快速檢測(cè)可能存在物體的區(qū)域,同時(shí)過濾掉非物體區(qū)域,因此能夠有效提高檢測(cè)速度的 同時(shí),提高物體檢測(cè)精度。
【附圖說明】
[0064]圖1物體檢測(cè)總流程圖;
[0065]圖2范例模板訓(xùn)練示意圖;
[0066]圖3物體粗檢測(cè)流程圖;
[0067]圖4滑動(dòng)窗口檢測(cè)流程圖;
【具體實(shí)施方式】
[0068] 為了使本領(lǐng)域的人員能夠更好的理解和使用本發(fā)明,下面將結(jié)合附圖和具體實(shí)驗(yàn) 案例對(duì)本發(fā)明的技術(shù)方案進(jìn)行進(jìn)一步描述:
[0069] 1.首先訓(xùn)練范例模板。利用安裝在移動(dòng)機(jī)器人平臺(tái)上的攝像機(jī)來采集物體圖像, 準(zhǔn)備圖片訓(xùn)練集,選取圖片,根據(jù)圖片提供的標(biāo)簽信息,包括每張圖片包含何種物體以及各 個(gè)物體所在的位置的包圍盒坐標(biāo),根據(jù)訓(xùn)練集中的標(biāo)簽信息確定需要訓(xùn)練的物體模型的正 樣本集以及負(fù)樣本集,其中含有特定物體的樣本稱為正樣本,反之稱為負(fù)樣本;訓(xùn)練集中的 每一個(gè)正樣本都需要單獨(dú)與全部的負(fù)樣本一起訓(xùn)練,整個(gè)范例模板訓(xùn)練過程如說明書附圖 2所示。
[0070] 2.利用支撐向量機(jī)對(duì)每個(gè)正樣本和全部的負(fù)樣本進(jìn)行訓(xùn)練,從而得到每個(gè)正樣本 相對(duì)應(yīng)的范例模板。其中SVM的優(yōu)化函數(shù)為:
[0072]其中,(^,(:2為懲罰項(xiàng),損失函數(shù)為h(x)。由于本發(fā)明的訓(xùn)練過程只有一個(gè)正樣本, 正樣本和負(fù)樣本數(shù)目極不平衡,因此需要Ci>>C2,我們?nèi)?amp; = 0.5,(:2 = 0.01。
[0073] 3.進(jìn)行模板標(biāo)定。由于不同的SVM分類器的得分不能直接進(jìn)行比較,需要對(duì)不同的 SVM分類器進(jìn)行標(biāo)定:使用擬合的sigmoid函數(shù)將分類器輸出統(tǒng)一到[0,1],即可得到對(duì)應(yīng)的 概率。
[0074] 4.在低像素的條件下,雖然不容易分清圖像中具體包含的物體,但是人們卻容易 分辨出是否含有物體?;谶@種思想,首先對(duì)圖像進(jìn)行物體粗檢測(cè),詳細(xì)流程如說明書附圖 3所示。將訓(xùn)練數(shù)據(jù)集中的圖像縮放成36種不同的尺寸的圖像,構(gòu)成圖像集合{(W Q,HQ)},其 中恥,出[{10,20,40,80,160,320},利用1 =(丨4,7)表示,其中1表示含有物體的窗口,1表 示圖像的大小,(x,y)表示位置。
[0075] 5.計(jì)算圖像的梯度范數(shù)特征,即圖像中某區(qū)域的梯度范數(shù)值。利用一個(gè)一維梯度 算子[-1,0,1 ]來計(jì)算圖像中水平和垂直方向上的梯度gx和gy,并通過計(jì)算min{ I gx I + I gy I, 255}得到圖像的梯度范數(shù)特征。
[0076] 6.利用線性支持向量機(jī)訓(xùn)練物體模版ω:以已標(biāo)注物體的窗口的梯度范數(shù)特征作 為正樣本,隨機(jī)抽取背景窗口的梯度范數(shù)特征作為負(fù)樣本,利用線性SVM訓(xùn)練得到物體模板 ω。跟據(jù)公式81 =〈 ω,gl>,并利用ω和在36種尺寸圖像上滑動(dòng)掃描得到每個(gè)窗口的得分。 [0077] 7.利用窗口大小、匹配得分以及最終窗口是否含有目標(biāo)三者之間的關(guān)系進(jìn)行建 模,利用公式〇i = Vl · sdt計(jì)算得到最終匹配的得分,并在每種窗口尺寸大小選擇Μ個(gè)得分 最高的作為目標(biāo)輸出。為了進(jìn)一步加速運(yùn)算,對(duì)ω進(jìn)行二值化,并更新模板匹配得分公式。
[0078] 8.利用步驟4-7訓(xùn)練得到的物體模板ω,在36種不同尺寸下的測(cè)試圖像滑動(dòng)掃描 并計(jì)算每個(gè)窗口存在物體可能性的得分,然后排序,將得分靠前的區(qū)域坐標(biāo)作為物體粗檢 測(cè)的結(jié)果。
[0079] 9.對(duì)粗檢測(cè)結(jié)果進(jìn)行優(yōu)化,以去除物體粗檢測(cè)得到的結(jié)果中含有的冗余項(xiàng):首先 根據(jù)真實(shí)物體外觀形狀的先驗(yàn)知識(shí),在粗檢測(cè)結(jié)果中濾掉尺寸較小的近似物體區(qū)域和細(xì)長(zhǎng) 的近似物體區(qū)域;然后計(jì)算剩余近似物體區(qū)域內(nèi)像素點(diǎn)的梯度,并設(shè)定閾值,將梯度值較小 的區(qū)域剔除,進(jìn)一步縮小物體檢測(cè)范圍;最后對(duì)剩余近似物體區(qū)域圖像塊進(jìn)行聚類,計(jì)算聚 類中心幾何坐標(biāo),并以本聚類近似物體區(qū)域的最外側(cè)作為邊界,確定可能存在物體的顯著 區(qū)域。
[0080] 10.以步驟4-9檢測(cè)得到的可能存在物體區(qū)域(近似物體區(qū)域)作為范例模板物體 檢測(cè)器的輸入,采用固定大小的滑動(dòng)窗口的方法,提取每個(gè)滑動(dòng)窗口的H0G特征,并根據(jù)步 驟1-3訓(xùn)練得到的模板,計(jì)算輸入圖像區(qū)域的得分。
[0081] 11.由于滑動(dòng)窗口搜索是一種過搜索策略,會(huì)導(dǎo)致冗余檢測(cè)區(qū)域。本發(fā)明先綜合各 個(gè)范例模板的得分以及互信息之后得到新的得分,再進(jìn)行非極大值抑制。具體的實(shí)現(xiàn)方式