基于似物性估計(jì)的快速行人檢測方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)視覺和模式識別領(lǐng)域,具體而言涉及一種基于似物性估計(jì)的快速行人檢測方法。
【背景技術(shù)】
[0002]計(jì)算機(jī)視覺近幾年來一直是研究的熱點(diǎn)和難點(diǎn),而行人檢測作為高層視覺任務(wù)的基礎(chǔ),已成為計(jì)算機(jī)視覺領(lǐng)域中至關(guān)重要的研究問題。
[0003]計(jì)算機(jī)視覺即通過機(jī)器視覺來模仿人眼的視覺系統(tǒng),認(rèn)知心理學(xué)和神經(jīng)生物學(xué)的研究發(fā)現(xiàn),人類在識別一個(gè)具體的物體是什么之前具有一種很強(qiáng)的感知物體的能力。對一幅復(fù)雜的圖像來說,人類的視覺系統(tǒng)在一開始的反應(yīng)時(shí)間內(nèi)只會關(guān)注其中的某些部分,并忽略圖像中其余不顯著的部分。這進(jìn)一步說明在識別一個(gè)具體事物之前,在人類的視覺系統(tǒng)中存在一個(gè)簡單的視覺注意機(jī)制,該機(jī)制用來篩選出最有可能含有物體的區(qū)域。
[0004]近年來大部分比較前沿的行人檢測方法都是基于滑動窗口方法來產(chǎn)生候選目標(biāo)窗口,再將這些大量的候選目標(biāo)窗口直接送去分類器計(jì)算得到檢測結(jié)果。這種傳統(tǒng)的滑動窗口行人檢測方法不僅違背了人類視覺注意機(jī)制,而且相當(dāng)耗時(shí)。本文引入似物性(Objectness)的概念,似物性即是對一個(gè)檢測窗口中包含物體的可能性的描述,本發(fā)明通過建立一個(gè)似物性估計(jì)模型,對滑動窗口產(chǎn)生的候選窗口做了初篩選,并預(yù)測得到候選目標(biāo)區(qū)域,大大縮小了行人檢測的搜索范圍,同時(shí)我們選用簡單高效的固定窗口大小下梯度幅值特征(Normed gradients)來描述檢測窗口的似物性,使得整個(gè)似物性估計(jì)流程在確保目標(biāo)覆蓋率不降低的前提下速度比同類算法的執(zhí)行速度快很多。
【發(fā)明內(nèi)容】
[0005]本發(fā)明目的在于提供一種基于似物性估計(jì)的快速行人檢測方法,以克服現(xiàn)有基于滑動窗口的行人檢測方法檢測速度過慢的問題。
[0006]本發(fā)明的上述目的通過獨(dú)立權(quán)利要求的技術(shù)特征實(shí)現(xiàn),從屬權(quán)利要求以另選或有利的方式發(fā)展獨(dú)立權(quán)利要求的技術(shù)特征。
[0007]為達(dá)成上述目的,本發(fā)明提出一種基于似物性估計(jì)的快速行人檢測方法,包括以下步驟:
[0008]1)準(zhǔn)備似物性估計(jì)所需的檢測窗口正負(fù)樣本集,并歸一化到同一尺度;
[0009]2)設(shè)置似物性估計(jì)函數(shù),利用正負(fù)樣本訓(xùn)練得到判別模型;
[0010]3)對輸入圖像進(jìn)行多尺度縮放,并用固定大小的滑動窗口產(chǎn)生大量的檢測窗口 ;
[0011]4)利用步驟2)中訓(xùn)練好的模型對所有檢測窗口進(jìn)行似物性估計(jì),根據(jù)估分結(jié)果,篩選得到一個(gè)最有可能包含行人目標(biāo)的候選窗口集;
[0012]5)根據(jù)候選目標(biāo)窗口集預(yù)測得到候選目標(biāo)區(qū)域;
[0013]6)在目標(biāo)區(qū)域內(nèi)使用行人H0G特征和SVM分類器完成行人檢測。
[0014]應(yīng)當(dāng)理解,前述構(gòu)思以及在下面更加詳細(xì)地描述的額外構(gòu)思的所有組合只要在這樣的構(gòu)思不相互矛盾的情況下都可以被視為本公開的發(fā)明主題的一部分。另外,所要求保護(hù)的主題的所有組合都被視為本公開的發(fā)明主題的一部分。
[0015]結(jié)合附圖從下面的描述中可以更加全面地理解本發(fā)明教導(dǎo)的前述和其他方面、實(shí)施例和特征。本發(fā)明的其他附加方面例如示例性實(shí)施方式的特征和/或有益效果將在下面的描述中顯見,或通過根據(jù)本發(fā)明教導(dǎo)的【具體實(shí)施方式】的實(shí)踐中得知。
【附圖說明】
[0016]附圖不意在按比例繪制。在附圖中,在各個(gè)圖中示出的每個(gè)相同或近似相同的組成部分可以用相同的標(biāo)號表示。為了清晰起見,在每個(gè)圖中,并非每個(gè)組成部分均被標(biāo)記。現(xiàn)在,將通過例子并參考附圖來描述本發(fā)明的各個(gè)方面的實(shí)施例,其中:
[0017]圖1是基于似物性估計(jì)的行人檢測流程圖。
[0018]圖2是模型w的訓(xùn)練流程圖。
[0019]圖3是窗口合并結(jié)果示意圖。
[0020]圖4是窗口合并規(guī)則中不同參數(shù)α的性能比較示意圖。
【具體實(shí)施方式】
[0021]為了更了解本發(fā)明的技術(shù)內(nèi)容,特舉具體實(shí)施例并配合所附圖式說明如下。
[0022]在本公開中參照附圖來描述本發(fā)明的各方面,附圖中示出了許多說明的實(shí)施例。本公開的實(shí)施例不必定意在包括本發(fā)明的所有方面。應(yīng)當(dāng)理解,上面介紹的多種構(gòu)思和實(shí)施例,以及下面更加詳細(xì)地描述的那些構(gòu)思和實(shí)施方式可以以很多方式中任意一種來實(shí)施,這是因?yàn)楸景l(fā)明所公開的構(gòu)思和實(shí)施例并不限于任何實(shí)施方式。另外,本發(fā)明公開的一些方面可以單獨(dú)使用,或者與本發(fā)明公開的其他方面的任何適當(dāng)組合來使用。
[0023]本發(fā)明所提出的基于似物性估計(jì)的行人檢測方法,主要包括基于NG特征的似物性估計(jì)模型的建立、根據(jù)似物性估計(jì)的結(jié)果預(yù)測得到候選目標(biāo)區(qū)域、在候選目標(biāo)區(qū)域內(nèi)使用行人H0G特征和SVM分類器完成行人檢測三個(gè)主要部分。這里的似物性估計(jì)即是對檢測窗口中包含行人目標(biāo)的可能性進(jìn)行評估打分。
[0024]下面結(jié)合附圖,對本發(fā)明的一些示范性實(shí)施例加以說明。
[0025]根據(jù)本發(fā)明的實(shí)施例,提出一種基于似物性估計(jì)的快速行人檢測方法,以克服現(xiàn)有基于滑動窗口的行人檢測方法檢測速度過慢的問題。結(jié)合圖1所示,該方法的實(shí)現(xiàn)大致包括以下6個(gè)步驟:
[0026]1)準(zhǔn)備似物性估計(jì)所需的檢測窗口正負(fù)樣本集,并歸一化到同一尺度;
[0027]2)設(shè)置似物性估計(jì)函數(shù),利用正負(fù)樣本訓(xùn)練得到判別模型;
[0028]3)對輸入圖像進(jìn)行多尺度縮放,并用固定大小的滑動窗口產(chǎn)生大量的檢測窗口 ;
[0029]4)利用步驟2)中訓(xùn)練好的模型對所有檢測窗口進(jìn)行似物性估計(jì),根據(jù)估分結(jié)果,篩選得到一個(gè)很小的最有可能包含行人目標(biāo)的候選窗口集;
[0030]5)根據(jù)候選目標(biāo)窗口集預(yù)測得到候選目標(biāo)區(qū)域;
[0031]6)在目標(biāo)區(qū)域內(nèi)使用行人H0G特征和SVM分類器完成行人檢測。
[0032]上述方法中,所述步驟1)具體為:
[0033]11)將行人數(shù)據(jù)庫中包含行人目標(biāo)的窗口和隨機(jī)采集的背景窗口分別作為行人窗口數(shù)據(jù)集和背景窗口數(shù)據(jù)集;
[0034]12)將行人窗口數(shù)據(jù)集和背景窗口數(shù)據(jù)集中的所有窗口 resize到8*8的尺度大??;
[0035]13)計(jì)算所有resize后的窗口的梯度幅值特征(NG),即每個(gè)窗口對應(yīng)一個(gè)64 (8*8)維的NG特征,最終得到NG特征的正負(fù)樣本集。
[0036]對于NG特征的解釋:NG (Normed Gradients)特征即是將檢測窗口歸一化到統(tǒng)一的一個(gè)很小的尺寸(8*8)時(shí),提取得到的梯度幅值特征,一個(gè)檢測窗口即對應(yīng)一個(gè)64維的NG特征。
[0037]本發(fā)明選擇NG特征來描述一個(gè)待檢測窗口的似物性的原因:由于一般物體都具有輪廓閉合性的特征,當(dāng)把檢測窗口 resize到一個(gè)很小的尺寸時(shí),物體的梯度分布呈現(xiàn)出較為雜亂的模式,而背景的較為單一和清楚,因此選用簡單高效的NG特征來描述一個(gè)檢測窗口的似物性。
[0038]如圖2的流程圖所示,上述方法中,所述步驟2)具體為:
[0039]21)設(shè)置得分函數(shù),利用正負(fù)樣本集訓(xùn)練一個(gè)線性分類的支持向量機(jī)SVM,得到判別豐吳型;
[0040]22)由于不同尺寸窗口包含行人目標(biāo)的可能性不同,針對每一種預(yù)定的窗口尺寸,設(shè)置重計(jì)算線性得分函數(shù),并單獨(dú)訓(xùn)練得到其對應(yīng)的系數(shù)和偏移量;
[0041]這里預(yù)定的窗口尺寸,我們根據(jù)行人尺寸范圍,預(yù)定檢測窗口尺寸{(Η。)},ff0, H0e {10,20,40,80,160,320},W。,H。分別表示檢測窗口的寬和高。
[0042]上述方法中,所述步驟21)具體為:
[0043]211)將正負(fù)樣本的標(biāo)簽分別設(shè)為1和-1 ;
[0044]212)利用帶有標(biāo)簽的正負(fù)樣本訓(xùn)練一個(gè)線性分類的支持向量機(jī)SVM,得到判別模型w。設(shè)置得分函數(shù)如下:
[0045]Sl= <w, gl>(1)
[0046]1 = (i, x, y)(2)
[0047]其中別表不窗口的得分,64維的NG特征。1表不窗口位置,(x, y)表不窗口位置坐標(biāo),i表示窗口尺寸。
[0048]上述方法中,所述步驟22)具體為:
[0049]221)構(gòu)建窗口尺寸i下的子正負(fù)樣本集:對于每一種窗口尺寸i,在步驟11)中生成的正負(fù)樣本集中提取出窗口大小為i子正負(fù)樣本集;
[0050]222)對于每一種窗口尺寸i,利用該尺寸下的子正負(fù)樣本集以步驟11)中計(jì)算得到的得分作為一維特征輸入,通過一個(gè)線性SVM訓(xùn)練得到重計(jì)算得分函數(shù)中對應(yīng)系數(shù)與偏移量V1、tl,如下公式(3),其中81表示輸入的窗口得分,ο:表示重計(jì)算后的最終似物性估分。
[0051]Oj= V ;.Sj+t;(3)
[0052]上述方法中,所述步驟3)具體為:
[0053]31)根據(jù)預(yù)定檢測窗口尺寸{(ff0, H0)}, ff0,H0e {10,20,40,80,160,320},對輸入圖片進(jìn)行36個(gè)(6*6)尺度的縮放。例如:原圖片大小為500*500,為了使得8*8的滑動窗口在縮放以后的圖片中滑動產(chǎn)生的檢測窗口實(shí)際尺寸為10*10,則需要將原圖片縮放到400*400 ;
[0054]32)用8*8的滑動窗口在步驟31)中生成的每一個(gè)縮放尺度下滑動產(chǎn)生大量8*8的檢測窗口。這里檢測窗口對應(yīng)的實(shí)際尺寸都是我們預(yù)定的大小:KW。,H。)},W。,H0e {10,20,40,80,160,320}。
[0055]上述方法中,所述步驟4)具體為:
[0056]41)計(jì)算所有待檢測窗口的NG特征;
[0057]42)用公式⑴計(jì)算得到所有待檢測窗口的估分s1;
[0058]43)根據(jù)待檢測窗口對應(yīng)于原圖的實(shí)際尺寸,用公式(3)計(jì)算