1.一種行人標(biāo)志物識(shí)別方法,其特征在于,所述方法包括:
對(duì)監(jiān)控圖像進(jìn)行分割,獲得若干ROI區(qū)域;
將監(jiān)控圖像輸入Fast RCNN的ZF網(wǎng)絡(luò),獲得所述監(jiān)控圖像的圖像特征;
將所述ROI區(qū)域和圖像特征作為輸入,依次經(jīng)ROI池化層、兩個(gè)第一全連接層、ROI卷積層、第二全連接層以及RNN隱藏層,獲得各ROI區(qū)域中待檢測(cè)標(biāo)志物的占比;
根據(jù)各ROI區(qū)域中所述待檢測(cè)標(biāo)志物的占比以及預(yù)設(shè)占比閾值,獲得待檢測(cè)標(biāo)志物對(duì)應(yīng)的區(qū)域標(biāo)識(shí);
將當(dāng)前RNN隱藏層輸出的各ROI區(qū)域中所述待檢測(cè)標(biāo)志物的占比作為下一RNN隱藏層的一個(gè)輸入,并對(duì)當(dāng)前獲得的待檢測(cè)標(biāo)志物的區(qū)域標(biāo)識(shí)分別進(jìn)行粗粒度和細(xì)粒度合并,并將粗粒度合并后的區(qū)域標(biāo)識(shí)與所述圖像特征、細(xì)粒度合并后的區(qū)域標(biāo)識(shí)與所述圖像特征分別作為新的輸入,依次經(jīng)ROI池化層、兩個(gè)第一全連接層、ROI卷積層、第二全連接層以及所述下一RNN隱藏層;
將每一RNN隱藏層輸出的所述待檢測(cè)標(biāo)志物對(duì)應(yīng)的區(qū)域標(biāo)識(shí)輸入至第三全連接層,學(xué)習(xí)獲得所述待檢測(cè)標(biāo)志物對(duì)應(yīng)的比例值,若所述比例值大于等于預(yù)設(shè)比例閾值,則判斷存在該待檢測(cè)標(biāo)志物。
2.如權(quán)利要求1所述的行人標(biāo)志物識(shí)別方法,其特征在于,所述將監(jiān)控圖像輸入Fast RCNN的ZF網(wǎng)絡(luò),獲得所述監(jiān)控圖像的圖像特征,具體包括:
將所述監(jiān)控圖像依次經(jīng)所述ZF網(wǎng)絡(luò)的前四個(gè)卷積層,獲得所述監(jiān)控圖像的圖像特征。
3.如權(quán)利要求1所述的行人標(biāo)志物識(shí)別方法,其特征在于,所述RNN隱藏層包括代價(jià)函數(shù),所述代價(jià)函數(shù)由當(dāng)前RNN隱藏層的輸出和標(biāo)志物的真值比例而生成,且所述代價(jià)函數(shù)的輸出用于反向傳遞給所述當(dāng)前RNN隱藏層。
4.如權(quán)利要求1所述的行人標(biāo)志物識(shí)別方法,其特征在于,所述待檢測(cè)標(biāo)志物對(duì)應(yīng)的區(qū)域標(biāo)識(shí)的獲取過程包括:
當(dāng)ROI區(qū)域中所述待檢測(cè)標(biāo)志物的占比超過預(yù)設(shè)占比閾值,則認(rèn)為該ROI區(qū)域存在所述待檢測(cè)標(biāo)志物,該ROI區(qū)域被設(shè)定為預(yù)設(shè)標(biāo)識(shí)值,該ROI區(qū)域?yàn)槟繕?biāo)區(qū)域;否則,該ROI區(qū)域不存在所述待檢測(cè)標(biāo)志物,該ROI區(qū)域被設(shè)定為非所述預(yù)設(shè)標(biāo)識(shí)值的另一值,該ROI區(qū)域?yàn)榉悄繕?biāo)區(qū)域。
5.如權(quán)利要求4所述的行人標(biāo)志物識(shí)別方法,其特征在于,所述細(xì)粒度合并和粗粒度合并包括:對(duì)各標(biāo)志物的區(qū)域標(biāo)識(shí)進(jìn)行掃描,所述掃描包括交替進(jìn)行的行掃描和列掃描,且所述行掃描的行數(shù)以及列掃描的列數(shù)是逐漸遞增的;
每次行掃描或列掃描后的區(qū)域標(biāo)識(shí)與所述圖像特征作為新的輸入,依次經(jīng)ROI池化層、兩個(gè)第一全連接層、ROI卷積層、第二全連接層以及RNN隱藏層,并將當(dāng)前RNN隱藏層的輸出作為下一次掃描的RNN隱藏層的一個(gè)輸入,將當(dāng)前RNN隱藏層的輸出與預(yù)設(shè)占比閾值比較所獲得的待檢測(cè)標(biāo)志物的區(qū)域標(biāo)識(shí)作為下一次掃描的對(duì)象,將當(dāng)前掃描后的區(qū)域標(biāo)識(shí)與所述圖像特征作為下一次新的輸入,直至所述行掃描或列掃描的次數(shù)均為預(yù)設(shè)次數(shù)。
6.如權(quán)利要求5所述的行人標(biāo)志物識(shí)別方法,其特征在于,對(duì)于細(xì)粒度合并,單行或單列掃描時(shí),則在掃描方向上合并相鄰兩個(gè)目標(biāo)區(qū)域;
多行掃描時(shí),當(dāng)多行ROI區(qū)域的同一列上的目標(biāo)區(qū)域占比超過預(yù)設(shè)占比閾值,則合并該列;
多列掃描時(shí),當(dāng)多列ROI區(qū)域的同一行上的目標(biāo)區(qū)域占比超過預(yù)設(shè)占比閾值,則合并該行;
對(duì)于粗粒度合并,在細(xì)粒度合并的基礎(chǔ)上,將細(xì)粒度合并區(qū)域前后兩個(gè)非目標(biāo)區(qū)域也合并,若在將細(xì)粒度合并區(qū)域與前后兩個(gè)非目標(biāo)區(qū)域合并之后,發(fā)現(xiàn)新的相鄰目標(biāo)區(qū)域,則合并該新的相鄰目標(biāo)區(qū)域。
7.一種行人標(biāo)志物識(shí)別裝置,其特征在于,所述裝置包括:
分割模塊,對(duì)監(jiān)控圖像進(jìn)行分割,獲得若干ROI區(qū)域;
特征提取模塊,將監(jiān)控圖像輸入Fast RCNN的ZF網(wǎng)絡(luò),獲得所述監(jiān)控圖像的圖像特征;
第一處理模塊,將所述ROI區(qū)域和圖像特征作為輸入,依次經(jīng)ROI池化層、兩個(gè)第一全連接層、ROI卷積層、第二全連接層以及RNN隱藏層,獲得各ROI區(qū)域中待檢測(cè)標(biāo)志物的占比;
第二處理模塊,根據(jù)各ROI區(qū)域中所述待檢測(cè)標(biāo)志物的占比以及預(yù)設(shè)占比閾值,獲得待檢測(cè)標(biāo)志物對(duì)應(yīng)的區(qū)域標(biāo)識(shí)
第三處理模塊,將當(dāng)前RNN隱藏層輸出的各ROI區(qū)域中所述待檢測(cè)標(biāo)志物的占比作為下一RNN隱藏層的一個(gè)輸入,并對(duì)當(dāng)前獲得的待檢測(cè)標(biāo)志物的區(qū)域標(biāo)識(shí)分別進(jìn)行粗粒度和細(xì)粒度合并,并將粗粒度合并后的區(qū)域標(biāo)識(shí)與所述圖像特征、細(xì)粒度合并后的區(qū)域標(biāo)識(shí)與所述圖像特征分別作為新的輸入,依次經(jīng)ROI池化層、兩個(gè)第一全連接層、ROI卷積層、第二全連接層以及所述下一RNN隱藏層;
學(xué)習(xí)模塊,將每一RNN隱藏層輸出的所述待檢測(cè)標(biāo)志物對(duì)應(yīng)的區(qū)域標(biāo)識(shí)輸入至第三全連接層,學(xué)習(xí)獲得所述待檢測(cè)標(biāo)志物對(duì)應(yīng)的比例值,若所述比例值大于等于預(yù)設(shè)比例閾值,則判斷存在該待檢測(cè)標(biāo)志物。
8.如權(quán)利要求7所述的行人標(biāo)志物識(shí)別裝置,其特征在于,所述特征提取模塊包括:將所述監(jiān)控圖像依次經(jīng)所述ZF網(wǎng)絡(luò)的前四個(gè)卷積層,獲得所述監(jiān)控圖像的圖像特征。
9.如權(quán)利要求7所述的行人標(biāo)志物識(shí)別裝置,其特征在于,所述RNN隱藏層包括代價(jià)函數(shù),所述代價(jià)函數(shù)由當(dāng)前RNN隱藏層的輸出和標(biāo)志物的真值比例而生成,且所述代價(jià)函數(shù)的輸出用于反向傳遞給所述當(dāng)前RNN隱藏層。
10.如權(quán)利要求7所述的行人標(biāo)志物識(shí)別裝置,其特征在于,所述第二處理模塊包括:
當(dāng)ROI區(qū)域中所述待檢測(cè)標(biāo)志物的占比超過預(yù)設(shè)占比閾值,則認(rèn)為該ROI區(qū)域存在所述待檢測(cè)標(biāo)志物,該ROI區(qū)域被設(shè)定為預(yù)設(shè)標(biāo)識(shí)值,該ROI區(qū)域?yàn)槟繕?biāo)區(qū)域;否則,該ROI區(qū)域不存在所述待檢測(cè)標(biāo)志物,該ROI區(qū)域被設(shè)定為非所述預(yù)設(shè)標(biāo)識(shí)值的另一值,該ROI區(qū)域?yàn)榉悄繕?biāo)區(qū)域。
11.如權(quán)利要求10所述的行人標(biāo)志物識(shí)別裝置,其特征在于,所述細(xì)粒度合并和粗粒度合并包括:對(duì)各標(biāo)志物的區(qū)域標(biāo)識(shí)進(jìn)行掃描,所述掃描包括交替進(jìn)行的行掃描和列掃描,且所述行掃描的行數(shù)以及列掃描的列數(shù)是逐漸遞增的;
每次行掃描或列掃描后的區(qū)域標(biāo)識(shí)與所述圖像特征作為新的輸入,依次經(jīng)ROI池化層、兩個(gè)第一全連接層、ROI卷積層、第二全連接層以及RNN隱藏層,并將當(dāng)前RNN隱藏層的輸出作為下一次掃描的RNN隱藏層的一個(gè)輸入,將當(dāng)前RNN隱藏層的輸出與預(yù)設(shè)占比閾值比較所獲得的待檢測(cè)標(biāo)志物的區(qū)域標(biāo)識(shí)作為下一次掃描的對(duì)象,將當(dāng)前掃描后的區(qū)域標(biāo)識(shí)與所述圖像特征作為下一次新的輸入,直至所述行掃描或列掃描的次數(shù)均為預(yù)設(shè)次數(shù)。
12.如權(quán)利要求11所述的行人標(biāo)志物識(shí)別裝置,其特征在于,對(duì)于細(xì)粒度合并,單行或單列掃描時(shí),則在掃描方向上合并相鄰兩個(gè)目標(biāo)區(qū)域;
多行掃描時(shí),當(dāng)多行ROI區(qū)域的同一列上的目標(biāo)區(qū)域占比超過預(yù)設(shè)占比閾值,則合并該列;
多列掃描時(shí),當(dāng)多列ROI區(qū)域的同一行上的目標(biāo)區(qū)域占比超過預(yù)設(shè)占比閾值,則合并該行;
對(duì)于粗粒度合并,在細(xì)粒度合并的基礎(chǔ)上,將細(xì)粒度合并區(qū)域前后兩個(gè)非目標(biāo)區(qū)域也合并,若在將細(xì)粒度合并區(qū)域與前后兩個(gè)非目標(biāo)區(qū)域合并之后,發(fā)現(xiàn)新的相鄰目標(biāo)區(qū)域,則合并該新的相鄰目標(biāo)區(qū)域。