1.一種基于卷積神經(jīng)網(wǎng)絡(luò)的人群密度估算方法,其特征在于,包括有如下步驟:
步驟S1,建立訓(xùn)練樣本集:獲取視頻監(jiān)控幀圖像,對所獲取的圖像進(jìn)行多種預(yù)處理,同時采用人工方式確定圖像范圍內(nèi)的人群數(shù)量;
步驟S2,構(gòu)建基于Mixed-Pooling的卷積神經(jīng)網(wǎng)絡(luò)模型:卷積神經(jīng)網(wǎng)絡(luò)模型包含兩個卷積層、兩個Mixed-Pooling層、兩個全連接層、兩個ReLU層以及Dropout層;
步驟S3,訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型:初始化后,采用隨機(jī)梯度下降法對步驟S2中構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,每迭代一次檢測一次梯度以及損失函數(shù)的值,以獲得網(wǎng)絡(luò)模型結(jié)構(gòu)中各權(quán)重值W和偏置值b的最優(yōu)解,迭代多次后得到本次訓(xùn)練的最優(yōu)卷積神經(jīng)網(wǎng)絡(luò)模型;
步驟S4,人群密度估計檢測:將通過步驟S3獲得的關(guān)于遠(yuǎn)近兩個分區(qū)的卷積神經(jīng)網(wǎng)絡(luò)分類模型,按照檢測分類策略對整體區(qū)域的人群密度進(jìn)行估計。
2.如權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的人群密度估算方法,其特征在于,所述步驟S1包括如下步驟:
步驟S10,首先劃定場景的興趣區(qū)域,然后針對監(jiān)控幀圖像中不動景部分添加Mask處理,并按照行人所占像素與區(qū)域面積比相等的原則進(jìn)行遠(yuǎn)近分塊,然后采用人工方式分別確定遠(yuǎn)近兩塊區(qū)域的人數(shù),將兩個區(qū)域按照規(guī)定的人數(shù)范圍分為五個級別:非常稀疏、稀疏、中等密度、密集、非常密集;
步驟S11,對所有樣本圖片進(jìn)行去噪圖像增強(qiáng)預(yù)處理,然后將圖像大小統(tǒng)一為256*144,利用所有訓(xùn)練圖像的均值對圖像進(jìn)行歸一化處理。
3.如權(quán)利要求2所述的基于卷積神經(jīng)網(wǎng)絡(luò)的人群密度估算方法,其特征在于,所述步驟S10中,進(jìn)行遠(yuǎn)近兩個區(qū)域的分塊后,其按照如下公式確定分界位置:
h=h1+h2
其中,AB和CD是場景邊界處最近端與最遠(yuǎn)端的長度,二者可通過測量得出,S1和S2表示同一行人處于近端和遠(yuǎn)端時所占的像素大小,h表示場景區(qū)域的高度,EF為需要確定的分界線位置,S3表示行人在EF處所占像素大小,通過對遠(yuǎn)近兩個區(qū)域進(jìn)行人工計數(shù),確定區(qū)域內(nèi)最大容納人數(shù)N。
4.如權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的人群密度估算方法,其特征在于,所述步驟S2中:
卷積層與池化層交替鏈接,并將ReLU層連接于卷積層頂端,在最后一個池化層后依次連接兩個全連接層,并利用Dropout層防止其訓(xùn)練過擬合;
卷積層中:每個卷積層的特征映射圖都可以使用多個卷積核,通過對前一層得到的特征映射圖進(jìn)行卷積操作,然后組合得出;
池化層中:池化層中輸出的N個特征圖譜與其輸入的N個特征圖譜相對應(yīng)。
5.如權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的人群密度估算方法,其特征在于,所述步驟S2中,卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中采用池化層,其中池化層常用的池化方法為Max-Pooling和Average-Pooling,該兩種池化方法如下公式:
其中,ykij表示根據(jù)第kth個特征映射圖進(jìn)行池化操作后的輸出結(jié)果,xkpq表示在卷積核覆蓋的區(qū)域(p,q)內(nèi)的特征映射圖的特征元素值;
Mixed-Pooling表示為:
ykij=λave-pooling+(1-λ)max-pooling
其中,λ為隨機(jī)取值,其值可取0或1。
6.如權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的人群密度估算方法,其特征在于,所述步驟S3中,卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法包括兩個階段:
第一階段是前向傳播階段,訓(xùn)練樣本經(jīng)過預(yù)處理直接輸入到網(wǎng)絡(luò)的數(shù)據(jù)層,經(jīng)過網(wǎng)絡(luò)中各種隱含層進(jìn)行逐層變換、逐層映射,直到輸出層;
第二階段是反向傳播階段,用帶有標(biāo)簽的原始數(shù)據(jù)進(jìn)一步對整個卷積神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行監(jiān)督優(yōu)化。
7.如權(quán)利要求6所述的基于卷積神經(jīng)網(wǎng)絡(luò)的人群密度估算方法,其特征在于,反向傳播過程包括:在卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的反向傳播過程中進(jìn)行權(quán)值更新,由i到i+1次,卷積層更新神經(jīng)元權(quán)值如以下公式:
下采樣層神經(jīng)元更新權(quán)值為:
其中,α表示卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)定的學(xué)習(xí)速率,E表示在多分類問題中,存在c類共N個訓(xùn)練樣本時的平方誤差代價函數(shù),如以下公式:
其中:表示第n個樣本對應(yīng)的標(biāo)簽的第k維,表示第n個樣本對應(yīng)的網(wǎng)絡(luò)輸出的第k個輸出。
8.如權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的人群密度估算方法,其特征在于,所述步驟S4中,人群密度估計檢測過程中,首先將獲取的監(jiān)控視頻按照場景情況對不動景部分添加Mask掩模,然后利用按照遠(yuǎn)近分別訓(xùn)練得到的密度估計分類器,對兩區(qū)域進(jìn)行分別檢測。