本發(fā)明提供一種基于FHOG-LBPH特征的圖像行人識別方法,屬于計算機視覺監(jiān)控技術領域。
二、
背景技術:
:
行人檢測是計算機視覺和模式識別領域中的重要研究方向,它在智能交通、視頻監(jiān)控、人群安全預測與管理、機器人與高級人機交互等領域有著很好的應用價值。由于人體是非剛性目標,容易受到姿態(tài)、衣著、視覺、光照等方面的影響,加之復雜的背景環(huán)境,這些都將影響到行人檢測的精度,因此,如何快速準確地將行人從視頻圖像中檢測出來,仍然是目前的研究熱點。
在眾多行人檢測的技術方法中,基于機器學的檢測方法是目前較為主流的方法。該方法包括兩個重要方面:特征提取和分類器學習。在特征提取過程中,常用的行人特征有HOG特征和LBP特征等。在分類器學習中應用最多的是用SVM對樣本特征進行訓練得到較高性能的分類器。但目前,針對梯度方向直方圖(HOG)和局部二值模式(LBP)的檢測,存在特征維數高、冗余信息多、影響視頻圖像中行人檢測速度等問題。
為此,本發(fā)明提出一種基于FHOG-LBPH特征的圖像行人識別方法。通過對融合HOG特征(FHOG)進行統計平均,結合單獨最優(yōu)特征組合和巴氏距離可分性判據選出最優(yōu)特征,并與LBPH特征融合得到改進的FHOG-LBPH特征,從根本上降低特征維數;利用支持向量機(SVM)對樣本特征進行訓練獲得分類器,達到對測試樣本進行分類的目的。實驗結果表明,該方法使得行人檢測的準確率和實時性都有一定的提高,并用自行拍攝的圖像驗證了該方法的有效性,在實際行人識別中具有一定的應用價值。
三、
技術實現要素:
:
(1)目的:本發(fā)明的目的在于提供一種基于FHOG-LBPH特征的圖像行人識別方法,即通過對融合HOG特征(FHOG)進行統計平均,選出最優(yōu)特征,并與LBPH特征融合得到改進的FHOG-LBPH特征,利用支持向量機(SVM)對樣本特征進行訓練獲得分類器,在提高準確率和實時性的同時達到對測試樣本分類的目的。
(2)本發(fā)明提出一種基于FHOG-LBPH特征的圖像行人識別方法,具體包括如下步驟:
步驟一:FHOG特征提取。計算FHOG描述子是一個將區(qū)域特征相互疊加的過程,目標區(qū)域通過細胞單元劃分為各個小區(qū)域,各個小區(qū)域組合成一個塊單元,FHOG特征即各個區(qū)域特征的組合。
FHOG描述子用來計算局部圖像梯度的方向信息的統計值,描述局部目標的表象和形狀,表征出行人的輪廓信息。FHOG特征提取包括:灰度空間歸一化、梯度計算、梯度方向直方圖、重疊塊直方圖歸一化、生成FHOG特征。
步驟二:LBPH特征提取。由于步驟一的特征描述是行人輪廓邊緣信息,較多地忽略了平坦的表面,導致分類器對于嘈雜的邊緣信息的處理能力和魯棒性較差。由此引入一種有效的紋理描述子(LBPH),它提取和度量了灰度圖中局部鄰近區(qū)域的紋理特征。LBPH特征提取包括:LBP特征圖像計算、LBP特征圖像分塊、直方圖歸一化、計算LBPH特征向量。
由于紋理特征比較穩(wěn)定,不易受背景顏色和光照的影響,有助于圖像的區(qū)分,從而提高行人檢測的準確率。
步驟三:FHOG-LBPH特征融合。將步驟一與步驟二得到的FHOG特征與LBPH特征串聯起來形成一幅圖像的特征來檢測行人。FHOG-LBPH融合特征整體提高了分類器的魯棒性。
步驟四:行人識別。利用SVM對步驟三提取的訓練樣本特征進行訓練獲得分類器,通過該分類器對測試數據集進行檢測,從而判斷圖像是否是行人。
本發(fā)明的優(yōu)點和積極效果在于:本發(fā)明在圖像行人識別方面,基于FHOG特征對行人輪廓邊緣信息的描述和LBPH特征對灰度圖中局部鄰近區(qū)域紋理信息的描述,將FHOG+LBPH的圖像特征進行聯合,更加有助于圖像的區(qū)分,增強分類器對于嘈雜邊緣信息的處理能力和魯棒性,提高行人檢測的效率,在實際行人識別中具有一定的應用價值。
四、附圖說明:
圖1為本發(fā)明一種基于FHOG-LBPH特征的圖像行人識別方法的整體步驟流程圖;
圖2為本發(fā)明一種基于FHOG-LBPH特征的圖像行人識別方法的實驗效果。
五、具體實施方式:
下面結合圖1、2對本發(fā)明一種基于FHOG-LBPH特征的圖像行人識別方法作進一步的說明:
步驟一:FHOG特征提取;計算局部圖像梯度的方向信息的統計值,表征出行人的輪廓信息。
步驟1.1,采用Gamma法對輸入圖像進行歸一化。
其中,I(x,y)表示當前像素的灰度值。目的在于調節(jié)圖像的對比度,降低圖像局部的陰影和光照變化所造成的影響,同時可以抑制噪聲的干擾。
步驟1.2,像素梯度計算。
FHOG特征的計算對模板算子非常敏感,經過對比發(fā)現,最簡單的一維離散微分模板(-1,0,+1)及其轉置在水平和垂直兩個方向上對圖像各個像素進行梯度計算取得的檢測效果最好。計算過程如下:
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
ω(x,y)=tan-1(Gy(x,y)/Gx(x,y))
Gx(x,y),Gy(x,y)分別為當前像素點的水平梯度和垂直梯度;G(x,y)為當前像素點的梯度幅值;ω(x,y)為當前像素點的梯度方向。
將梯度方向限定在[0,π]的范圍內,并將梯度方向等分成9個區(qū)間,然后利用該方向上的幅值對每一個區(qū)間做加權統計直方圖。
步驟1.3,塊內歸一化。把圖像分為相同大小的cell和Block;與HOG每個cell提取36維特征不同,FHOG每個cell提取31維特征并對31維特征向量進行歸一化。
歸一化的目的是進一步消除光照、陰影的影響:
其中,和vi分別表示初始和歸一化后的每個像素的梯度值,ε是一個常量,取值為0.001。
步驟1.4,獲取FHOG特征。采用滑動窗口搜索法,按照步驟1.3中的歸一化方法對每個Block進行歸一化,把每個歸一化后Block內的特征向量串聯起來,從而得到最終的特征向量。
步驟二:LBPH特征提取。LBPH是一種有效的紋理描述子,它提取和度量了灰度圖中局部鄰近區(qū)域的紋理特征,其特征相對穩(wěn)定,不易受背景顏色和光照的影響。
步驟2.1,計算圖像的LBP特征圖像(旋轉不變等價模式的LBP值);
步驟2.2,將LBP特征圖像進行分塊;
步驟2.3,計算每塊區(qū)域特征圖像的直方圖,將直方圖進行歸一化;
步驟2.4,將上面計算的每塊區(qū)域特征圖像的直方圖按分塊的空間順序依次排列成一行,形成LBPH特征向量;
步驟三:FHOG-LBPH特征融合。由于到FHOG特征維數較高,忽略了平坦的表面,使得分類器的魯棒性較差,因此用選擇后的FHOG特征與LBPH特征進行融合的方法來檢測行人,融合方法如下所述:
將步驟一與步驟二得到的FHOG特征與LBPH特征串聯起來形成一幅圖像的特征來檢測行人。其中,提取FHOG特征時cell大小為8×8,padding大小為1×1,整幅圖像的FHOG特征為10×18×31維;提取LBPH特征時cell大小為8×8,每塊區(qū)域統計9個直方圖,整幅圖像提取12×20×9維特征。
步驟四:行人識別。利用SVM對步驟三提取的訓練樣本特征進行訓練獲得分類器,通過該分類器對測試數據集進行檢測,從而判斷圖像是否是行人。
最終,通過試驗進行行人識別的驗證;實驗使用了INRIA的行人圖像庫并添加了一部分行人圖片做為正樣本用于分類器的訓練。把數據集按照9:1的比例劃分訓練集和測試集,用訓練集訓練線性SVM分類器,測試集測試分類器的分類效果。結果表明,FHOG-LBPH特征堅固了圖像的形狀和紋理兩個方面的特征,增強分類器對于嘈雜邊緣信息的處理能力和魯棒性;經過SVM的分類訓練能夠很好的識別行人和非行人,提高行人檢測的效率,在實際行人識別中具有一定的應用價值。
應當指出,本實例僅列示性說明本發(fā)明的應用方法,而非用于限制本發(fā)明。任何熟悉此種使用技術的人員,均可在不違背本發(fā)明的精神及范圍下,對上述實施例進行修改。因此,本發(fā)明的權利保護范圍,應如權利要求書所列。