1.一種基于深度學習的行人精細化識別方法,其特征在于,包括以下步驟:
采集歷史的行人圖像數(shù)據(jù)構(gòu)建行人圖像數(shù)據(jù)庫,并利用行人圖像數(shù)據(jù)庫制作包含行人特征的訓練數(shù)據(jù)集,將訓練數(shù)據(jù)集輸入到SSD網(wǎng)絡進行訓練;
根據(jù)SSD網(wǎng)絡的訓練結(jié)果構(gòu)建行人精細化圖像數(shù)據(jù)庫,并利用行人精細化圖像數(shù)據(jù)庫制作包含行人各個部位特征的訓練數(shù)據(jù)集,將訓練數(shù)據(jù)集輸入到卷積神經(jīng)網(wǎng)絡進行訓練;
利用訓練好的SSD網(wǎng)絡提取來自流媒體服務器的實時視頻流中的行人特征,根據(jù)SSD網(wǎng)絡提取到的行人特征,利用訓練好的卷積神經(jīng)網(wǎng)絡提取行人各個部位的特征;
利用SVM分類器將提取到的行人各個部位的特征與行人精細化圖像數(shù)據(jù)庫的每個行人相應部位的特征進行匹配,并將匹配結(jié)果進行組合,得到行人精細化識別結(jié)果。
2.如權(quán)利要求1所述的基于深度學習的行人精細化識別方法,其特征在于,提取行人特征、行人各個部位的特征以及進行特征匹配,具體包括以下步驟:
采集來自流媒體服務器的實時視頻流,將實時視頻流解析為幀圖像,并通過分布式實時處理框架Storm的數(shù)據(jù)采集接口,將幀圖像輸入到分布式實時處理框架Storm的消息源;
在分布式實時處理框架Storm上,利用設有SSD網(wǎng)絡的消息處理組件提取數(shù)據(jù)源中的行人特征,根據(jù)提取到的行人特征,再利用設有卷積神經(jīng)網(wǎng)絡的消息處理組件提取行人各個部位的特征;
最后通過設有SVM分類器的消息處理組件將提取到的行人各個部位的特征與行人精細化圖像數(shù)據(jù)庫的每個行人相應部位的特征進行匹配。
3.如權(quán)利要求1所述的基于深度學習的行人精細化識別方法,其特征在于,將訓練數(shù)據(jù)集輸入到SSD網(wǎng)絡進行訓練,具體包括以下步驟:
所述SSD網(wǎng)絡首先使用默認參數(shù)進行訓練,根據(jù)訓練中間結(jié)果,對初始權(quán)值、訓練速率和迭代次數(shù)不斷進行調(diào)整,直到得到的參數(shù)使得訓練后的所述SSD網(wǎng)絡以預設的處理速度達到預設的識別準確率。
4.如權(quán)利要求3所述的基于深度學習的行人精細化識別方法,其特征在于,根據(jù)SSD網(wǎng)絡的訓練結(jié)果構(gòu)建行人精細化圖像數(shù)據(jù)庫,具體包括以下步驟:
根據(jù)SSD網(wǎng)絡的訓練結(jié)果得到行人圖像數(shù)據(jù)庫中的行人圖像,根據(jù)行人各個部位特征對行人圖像進行切分,并按照行人的不同部位對切分好的行人圖像進行分類,得到行人精細化圖像數(shù)據(jù)庫。
5.如權(quán)利要求4所述的基于深度學習的行人精細化識別方法,其特征在于,將訓練數(shù)據(jù)集輸入到卷積神經(jīng)網(wǎng)絡進行訓練,具體包括以下步驟:
將所述行人精細化圖像數(shù)據(jù)庫中不同種類的行人圖像輸入到對應的所述卷積神經(jīng)網(wǎng)絡中,所述卷積神經(jīng)網(wǎng)絡首先使用默認參數(shù)進行訓練,根據(jù)訓練中間結(jié)果,對初始權(quán)值、訓練速率和迭代次數(shù)不斷進行調(diào)整,直到得到的參數(shù)使得訓練后的所述卷積神經(jīng)網(wǎng)絡以預設的處理速度達到預設的識別準確率。
6.如權(quán)利要求3或5所述的基于深度學習的行人精細化識別方法,其特征在于,預設的處理速度為每秒25幀,預設的識別準確率為90%。
7.如權(quán)利要求1所述的基于深度學習的行人精細化識別方法,其特征在于,所述卷積神經(jīng)網(wǎng)絡包括三層卷積層、三層池化層、三層全連接層以及位于最后的softmax回歸分類器層。
8.一種基于深度學習的行人精細化識別裝置,其特征在于,包括:
行人圖像數(shù)據(jù)庫構(gòu)建模塊,采集歷史的行人圖像數(shù)據(jù)構(gòu)建行人圖像數(shù)據(jù)庫;
SSD網(wǎng)絡訓練模塊,利用所述行人圖像數(shù)據(jù)庫制作包含行人特征的訓練數(shù)據(jù)集,將所述訓練數(shù)據(jù)集輸入到SSD網(wǎng)絡進行訓練;
行人精細化圖像數(shù)據(jù)庫構(gòu)建模塊,根據(jù)所述SSD網(wǎng)絡的訓練結(jié)果構(gòu)建行人精細化圖像數(shù)據(jù)庫;
卷積神經(jīng)網(wǎng)絡訓練模塊,利用所述行人精細化圖像數(shù)據(jù)庫制作包含行人各個部位特征的訓練數(shù)據(jù)集,將所述訓練數(shù)據(jù)集輸入到卷積神經(jīng)網(wǎng)絡進行訓練;
行人特征提取模塊,利用訓練好的SSD網(wǎng)絡提取來自流媒體服務器的實時視頻流中的行人特征;
行人各個部位的特征提取模塊,根據(jù)所述SSD網(wǎng)絡提取到的行人特征,利用訓練好的所述卷積神經(jīng)網(wǎng)絡提取行人各個部位的特征;
特征匹配模塊,利用SVM分類器將所述行人各個部位的特征提取模塊提取到的行人各個部位的特征,與所述行人精細化圖像數(shù)據(jù)庫的每個行人相應部位的特征進行匹配;
行人精細化識別模塊,將所述特征匹配模塊的匹配結(jié)果進行組合,得到行人精細化識別結(jié)果。
9.如權(quán)利要求8所述的基于深度學習的行人精細化識別裝置,其特征在于,
所述行人特征提取模塊、行人各個部位的特征提取模塊、特征匹配模塊以及行人精細化識別模塊搭建在分布式實時處理框架Storm上,且各模塊并行運行;
所述行人特征提取模塊,利用設有SSD網(wǎng)絡的消息處理組件提取所述分布式實時處理框架Storm的消息源中的行人特征,所述消息源中包括所述分布式實時處理框架Storm的數(shù)據(jù)采集接口接收到的幀圖像,所述幀圖像由來自流媒體服務器的實時視頻流解析而成;
所述行人各個部位的特征提取模塊,根據(jù)所述行人特征提取模塊提取到的行人特征,利用設有卷積神經(jīng)網(wǎng)絡的消息處理組件提取行人各個部位的特征;
所述特征匹配模塊,通過設有SVM分類器的消息處理組件將所述行人各個部位的特征提取模塊提取到的行人各個部位的特征與行人精細化圖像數(shù)據(jù)庫的每個行人相應部位的特征進行匹配。