一種基于深度學習的車輛自動檢測方法
【技術領域】
[0001] 本發(fā)明屬于模式識別技術領域和交通監(jiān)控系統(tǒng)技術領域,特別涉及一種高清圖像 中基于深度學習的車輛自動檢測的方法。
【背景技術】
[0002] 目前我國城市化水平已經(jīng)超過50%,汽車保有量達1. 4億輛,隨之而來的交通擁 堵,環(huán)境污染,交通安全等問題日益突出。為解決現(xiàn)存交通系統(tǒng)中人,車,路之間的矛盾,智 能交通系統(tǒng)成為首選的理想方案。其中,智能視頻監(jiān)控系統(tǒng)是智能交通系統(tǒng)中必不可少的 部分。基于智能視頻監(jiān)控系統(tǒng)的車輛檢測,是利用模式識別技術對經(jīng)過特定路段和路口的 車輛進行自動檢測,獲取車輛基本信息,如車牌,速度,車型等,為之后的車輛行為分析,違 章車輛圖像抓拍,和違章取證等奠定基礎。傳統(tǒng)的智能監(jiān)控系統(tǒng)通常將車輛檢測視為一個 二分類問題來處理,無法自動判定車輛的類型信息,而常見的車型識別方法也只是根據(jù)尺 寸將車分為大型車、中型車,和小型車,無法滿足現(xiàn)代監(jiān)控的需求。另外,當前的智能視頻監(jiān) 控系統(tǒng)主要通過人工提取車輛特征,如顏色特征、紋理特征,輪廓特征、幾何特征等,來識別 車輛。手工標記車輛特征的方法耗時費力,且不能的充分利用車輛信息,無法覆蓋較多的行 車環(huán)境,在遇到車輛遮擋,或車輛陰影時,無法達到較高檢測的準確性。
[0003] 深度學習通過學習一種深層的非線性網(wǎng)絡結構,實現(xiàn)復雜函數(shù)逼近和輸入數(shù)據(jù)表 征,展現(xiàn)出強大的數(shù)據(jù)集本質(zhì)特征的學習能力。卷積神經(jīng)網(wǎng)絡,作為一種典型的深度學習方 法,是為二維圖像處理而特別設計的一個多層感知器。卷積神經(jīng)網(wǎng)絡不需要人為參與特征 的選取過程,可以自動地學習大量數(shù)據(jù)集中的目標特征。其權值共享和局部連接機制使得 它具備優(yōu)于傳統(tǒng)技術的優(yōu)點:對幾何變換、形變、光照具有一定程度的不變性,同時具有良 好的容錯能力、并行處理能力和自學習能力。這些優(yōu)點使得卷積神經(jīng)網(wǎng)絡在處理環(huán)境信息 復制,推理規(guī)則不明確情況下的問題時具有較大優(yōu)勢,并能容忍車輛的尺度變化,旋轉(zhuǎn)變形 等問題。因此,卷積神經(jīng)網(wǎng)絡可以用于解決智能視頻監(jiān)控系統(tǒng)中車輛的自動檢測和車型識 另Ij,保證智能監(jiān)控系統(tǒng)準確地、穩(wěn)定地獲取車輛信息。
【發(fā)明內(nèi)容】
[0004] (一)要解決的技術問題
[0005] 本發(fā)明的目的在于,提供一種基于深度學習的車輛自動檢測方法,可以自動學習 車輛特征,實現(xiàn)更高精度的車輛自動檢測,和車輛類型識別。
[0006] (二)技術方案
[0007] 本發(fā)明提供一種基于深度學習的車輛自動檢測的方法,包括:
[0008] S1,米集真實交通視頻,獲得原始米樣圖像;
[0009] S2,對原始采樣圖像進行候選區(qū)域提取,并將候選區(qū)域轉(zhuǎn)化為固定尺寸的圖像;
[0010] S3,利用卷積神經(jīng)網(wǎng)絡對固定尺寸的圖像進行特征學習,并對學習到的特征進行 分類,得到深度學習模型;
[0011] S4,利用深度學習模型對真實場景中的車輛進行自動檢測,并自動識別車輛類型 (小汽車/出租車/公交車)。
[0012] (三)有益效果
[0013] 本發(fā)明具以下優(yōu)點:
[0014] (1)可以自動逐層抽象出輸入卷積神經(jīng)網(wǎng)絡的圖像特征,減少人為標記特征的工 作量,節(jié)約人工成本和時間成本;
[0015] (2)快速實現(xiàn)車輛目標定位,并能識別出車輛類型(小汽車/出租車/公交車);
[0016] (3)對不同環(huán)境,光照強度,和天氣情況,均具有良好的適應性;
[0017] (4)對大流量車輛的擁擠環(huán)境,可以在一定程度上處理遮擋問題,保證較高的檢測 準確率。
【附圖說明】
[0018] 圖1是本發(fā)明實施例提供的基于深度學習的車輛自動檢測方法的流程圖。
[0019] 圖2是本發(fā)明實施例中訓練樣本的典型圖像。
[0020] 圖3是本實施例中最終檢測結果的示意圖。
【具體實施方式】
[0021] 本發(fā)明提供一種高清圖像中基于深度學習的車輛自動檢測方法,利用卷積神經(jīng)網(wǎng) 絡自動提取交通環(huán)境中的車輛特征,最終實現(xiàn)車輛目標的自動檢測。本發(fā)明可用于不同環(huán) 境、光照強度及天氣情況,對于復雜交通環(huán)境中的車輛,可以保證較高的檢測準確性,可為 后續(xù)視頻監(jiān)控中車輛目標的識別與跟蹤提供一種新的實時可靠的預處理步驟。
[0022] 根據(jù)本發(fā)明的一種實施方式,車輛自動檢測方法包括:
[0023] S1,采集真實交通視頻,獲得原始采樣圖像;
[0024] S2,對原始采樣圖像進行候選區(qū)域提取,并將候選區(qū)域轉(zhuǎn)化為固定尺寸的圖像;
[0025] S3,利用卷積神經(jīng)網(wǎng)絡對固定尺寸的圖像進行特征學習,并對學習到的特征進行 分類,得到深度學習模型;
[0026] S4,利用深度學習模型對真實場景中的車輛進行自動檢測。
[0027] 根據(jù)本發(fā)明的一種實施方式,步驟S2包括:
[0028] 對原始采樣圖像,利用訓練后的二值正則梯度(BING:Binarized Normed Gradients)通用目標檢測器,快速生成多尺度的、可能包含車輛目標的候選區(qū)域,并從候選 區(qū)域中提取出多個目標子區(qū)域,根據(jù)目標子區(qū)域與車輛目標的重復部分的比重,決定其為 車輛樣本或背景樣本,通過圖像歸一化將目標子區(qū)域轉(zhuǎn)化為固定大小的圖像,優(yōu)選地,圖像 大小可選為32X32像素。
[0029] 根據(jù)本發(fā)明的一種實施方式,卷積神經(jīng)網(wǎng)絡包括1個輸入層、4個卷積層、4個池化 層、2個全連接層和1個輸出層,其整體結構為:輸入層一卷積層一池化層一卷積層一池化 層一卷積層一卷積層一全連接層一全連接層一輸出層,其中:
[0030] 輸入層用于將所述固定尺寸的圖像輸入至所述卷積神經(jīng)網(wǎng)絡;
[0031] 卷積層用于采用多個卷積核得到圖像特征;
[0032] 池化層用于對所述圖像特征進行均值池化操作,將所述圖像特征的數(shù)據(jù)量降維原 來的四分之一;
[0033] 全連接層用于連接當層神經(jīng)元與前一層神經(jīng)元;
[0034] 輸出層用于計算分類結果。
[0035] 根據(jù)本發(fā)明的一種實施方式,卷積層對輸入圖像進行二維卷積和偏置的操作后, 再使用非線性激活函數(shù),獲得一個卷積結果,即圖像特征OJ1,其表達式為:
[0037] 其中,η代表網(wǎng)絡層數(shù),U代表第η層的神經(jīng)元個數(shù),Wl]表示第i個輸入圖像和第 j個輸出圖像的卷積權重,b,代表第j個輸出圖像的偏置,f( ·)為神經(jīng)元激活函數(shù),f(x) -ITlclX (Oj χ) ο
[0038] 根據(jù)本發(fā)明的一種實施方式,輸出層通過softmax函數(shù)計算分類結果:
[0040] 其中,k代表輸出層的類別數(shù),M為最后一個全連接層的神經(jīng)元數(shù)目,N代表網(wǎng)絡的 總層數(shù),f (·)為softmax函數(shù),
[0041] 根據(jù)本發(fā)明的一種實施方式,在進行特征學習時,采用梯度下降法調(diào)整所述卷積 核的權重和偏置,并對池化層的誤差進行上采樣操作。
[0042] 為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白,以下結合具體實施例,并參照 附圖,對本發(fā)明進一步詳細說明。
[0043] 圖1是本發(fā)明實施例提供的基于深度學習的車輛自動檢測方法的流程圖,如圖1 所示,方法包括:
[0044] S1,利用尚清相機米集真實交通視頻,獲得原始米樣圖像;
[0045] 本發(fā)明實例中,相機以一定高度和角度對車輛流進行拍攝,盡量模擬真實的交通 監(jiān)控系統(tǒng)的視角,獲取盡可能多的交通圖像樣本。
[0046] S2,對原始采樣圖像進行候選區(qū)域提取,并將候選區(qū)域轉(zhuǎn)化為固