一種基于深度費舍爾網(wǎng)絡(luò)的車型識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于模式分類技術(shù)領(lǐng)域,特別涉及一種基于深度費舍爾網(wǎng)絡(luò)的車型識別方 法。
[0002] 發(fā)明背景
[0003] 交通信息采集是構(gòu)建智能交通系統(tǒng)動態(tài)交通信息平臺的基礎(chǔ),而車型是交通信息 的重要組成部分。路橋、停車場收費系統(tǒng)、路橋管理和監(jiān)控系統(tǒng)等都需要進行車型識別。在 智能交通管理系統(tǒng)中,車型識別系統(tǒng)能夠自動、實時地檢測經(jīng)過車輛并識別汽車的車型、車 牌、車標的交通管理系統(tǒng),可以被廣泛應(yīng)用于道路通行車輛信息記錄、高速公路自動收費、 電子警察監(jiān)控、停車場安全管理、肇事、嫌疑、被盜車輛的追蹤、定位等。
[0004] 在車型識別中應(yīng)用較多的方法有:(1)基于感應(yīng)線圈的車型識別,該方法僅能對 車型進行粗粒度的分類,且對車輛的速度較為敏感,當車輛的速度突然改變時,會造成誤 判;(2)基于波頻感應(yīng)的車型識別,該技術(shù)發(fā)展的較為成熟,但也僅能進行粗粒度分類,且 受外界環(huán)境的影響較大,需事先斷定車輛的行駛速度才能準確計算車輛的外形;(3)基于 圖像的車型識別,通過對攝像機采集的車輛圖像進行分析獲得車輛的類型信息,與其他方 法相比,該技術(shù)一方面可以從圖像中獲得更加豐富的車輛信息,另一方面又可以直接利用 現(xiàn)有的城市卡口系統(tǒng)提供的圖像數(shù)據(jù),建設(shè)和使用成本低。
[0005] 基于圖像的車型識別涉及圖像處理、模式識別、計算機視覺等相關(guān)技術(shù)領(lǐng)域,目前 國內(nèi)外對于該技術(shù)的研究可以分為三個方向:(1)基于牌照的車型識別,該方法僅從圖像 中識別出牌照信息,并沒有直接分析獲得車輛的類型,分類粒度粗,且對于套牌車輛更是無 法辨別;(2)基于車標的車型識別,在實際應(yīng)用中,由于車標過小、光線、遮擋等客觀因素的 存在,無法達到理想的效果;(3)基于外觀特征的車型識別,該技術(shù)相比前兩種方法具有較 好的魯棒性,識別的類型也更加的細化,可以精確到車輛的品牌、系列、型號、年款等。
[0006] 目前在車型識別中應(yīng)用較多的方法是模糊神經(jīng)網(wǎng)絡(luò)和BP網(wǎng)絡(luò)等方法,神經(jīng)網(wǎng)絡(luò) 是一種模擬動物神經(jīng)網(wǎng)絡(luò)行為特征,進行分布式并行信息處理的算法數(shù)學模型。但這些方 法難以解決模式識別中存在的復(fù)雜性和推廣性的矛盾,神經(jīng)網(wǎng)絡(luò)雖然有強大的建模能力, 但對大規(guī)模圖像進行分類,其巨大的參數(shù)空間使尋找優(yōu)良的優(yōu)化初始值較為困難。
[0007] 在圖像分類領(lǐng)域,對數(shù)量龐大的圖像分類主要有兩種方法:一種為提取每張照片 的局部特征,將提取的特征進行聚類和編碼得到一個高維向量,然后將其用分類器分類。其 中編碼的方法有視覺詞袋模型編碼,稀疏編碼和費舍爾向量編碼等,而費舍爾向量編碼的 性能較其他幾種編碼方式要好。另一種應(yīng)用很廣的圖像分類方法是深度神經(jīng)網(wǎng)絡(luò),深度學 習是神經(jīng)網(wǎng)絡(luò)研究中的一個新的熱點,其目的在于通過非監(jiān)督的預(yù)訓(xùn)練為神經(jīng)網(wǎng)絡(luò)提供優(yōu) 良的參數(shù)初始值,通過貪婪的方式,一層一層的訓(xùn)練,對大規(guī)模圖像分類取得非常好的效 果。
[0008] 在此基礎(chǔ)之上,本專利結(jié)合費舍爾向量編碼和深度網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)點,提出一種基 于深度費舍爾網(wǎng)絡(luò)的車型識別方法來解決上述問題。本專利能夠?qū)崿F(xiàn)大規(guī)模車輛圖像的車 型識別,且識別準確率較高,具有較高的適用性和魯棒性。
【發(fā)明內(nèi)容】
[0009] 本發(fā)明中所述方法是為了克服上述現(xiàn)有技術(shù)的缺點,主要針對已經(jīng)提取的車輛特 征對車型進行細分識別的問題,提出了一種基于深度費舍爾網(wǎng)絡(luò)算法的車型識別方法。具 體的技術(shù)方案如下所述。
[0010] 一種基于深度費舍爾網(wǎng)絡(luò)的車型識別方法,包括以下步驟:
[0011] 步驟1 :對車型數(shù)據(jù)庫的圖像進行SIFT特征提取,作為費舍爾網(wǎng)絡(luò)的第0層;
[0012] 步驟2 :構(gòu)建費舍爾網(wǎng)絡(luò)的第1層,將提取到的SIFT特征進行費舍爾向量編碼,將 編碼后的向量在空間進行堆疊,進行L2歸一化和PCA降維;
[0013] 步驟3 :將第1層得到的特征向量表示進行費舍爾向量編碼,通過符號平方根和L2 歸一化處理,形成費舍爾網(wǎng)絡(luò)的第2層;
[0014] 步驟4:將費舍爾網(wǎng)絡(luò)第2層得到的輸出特征表示進行onevsrest線性支持向 量機訓(xùn)練,得到一個具有K種車型類別的車型識別系統(tǒng);
[0015] 步驟5 :對待識別車型的車輛圖像,通過費舍爾網(wǎng)絡(luò)得到測試特征向量;
[0016] 步驟6:將得到的測試特征向量導(dǎo)入車型識別系統(tǒng)進行識別,識別出測試車輛車 型。
[0017] 上述技術(shù)方案中,所述步驟1對車型數(shù)據(jù)庫的圖像進行SIFT特征提取包括以下步 驟:
[0018] 步驟1. 1 :尺度空間極值檢測:針對構(gòu)建的高斯金字塔圖像,利用差分函數(shù)在所有 尺度上檢測候選極值點。
[0019] 步驟1. 2 :關(guān)鍵點定位:通過函數(shù)擬合來定位極值點的準確位置和尺度,同時過濾 掉候選極值點集合中的邊緣點。
[0020] 步驟1. 3 :方向確定:結(jié)合關(guān)鍵點鄰域像素的梯度信息,給每個關(guān)鍵點賦予一個主 方向。
[0021] 步驟1. 4 :特征描述子生成:對關(guān)鍵點鄰域像素的梯度幅值和方向進行統(tǒng)計,得到 關(guān)鍵點的特征描述。
[0022] 上述技術(shù)方案中,所述步驟2中構(gòu)建費舍爾網(wǎng)絡(luò)的第1層,將提取到的SIFT特征 進行費舍爾向量編碼,將編碼后的向量在空間進行堆疊,進行L2歸一化和PCA降維,包括以 下幾個步驟:
[0023] 步驟2. 1 :對步驟1中獲取的SIFT特征,進行費舍爾向量編碼;
[0024] 步驟2. 2 :對步驟2. 1中編碼后的向量在空間進行堆疊;
[0025] 步驟2. 3 :將步驟2. 2中堆疊后的向量進行L2歸一化和PCA降維,得到的向量作 為費舍爾網(wǎng)絡(luò)的第2層的輸入。
[0026] 上述技術(shù)方案中,所述步驟2中構(gòu)建費舍爾網(wǎng)絡(luò)第1層的具體過程是:費舍爾網(wǎng) 絡(luò)第1層分成3個子層,第1個子層為從上層接收到山維,d10 2的特征,進行費舍爾向 量編碼,費舍爾向量編碼使用I個高斯混合模型組成,編碼后的每個費舍爾向量的維數(shù)為 2KA,使用判別式訓(xùn)練的線性映射%e 將其降到匕維,其中R為實數(shù)域,W為實數(shù)域 上的hX2KA維的映射矩陣,形成第1個子層;在第2個子層中,對上個子層得到的結(jié)果進 行以步長為h個像素的疊加抽取,形成大小為qiXqi的半局部區(qū)域,空間中相鄰的半局部 區(qū)域特征被堆疊在一個2X2的窗口,最終形成了一個4b維的密集特征表示;最后,在第3 個子層中,將這些特征進行L2歸一化和PCA降維至d1+1維,作為費舍爾網(wǎng)絡(luò)下一層的輸入 特征表示。
[0027] 上述技術(shù)方案中,所述步驟4中的onevsrest線性支持向量機訓(xùn)練的具體過程 是:在原始訓(xùn)練時有K種車型類別需要劃分,在抽取訓(xùn)練集時,分別抽取每一個單獨類作為 訓(xùn)練集的正樣本集,余下所有樣本作為負樣本集,通過訓(xùn)練得到K個二分類的線性支持向 量機分類器,測試時,將對應(yīng)的測試向量分別用這K個訓(xùn)練結(jié)果文件進行測試,每一個測試 都有一個評分(Si,…,SK),最終的識別結(jié)果就是得分值最高的那個類別,也即將待識別車型 分類為具有最大分類函數(shù)值的那一類。
[0028] 本專利基于費舍爾向量構(gòu)建深度網(wǎng)絡(luò)來建立模型,并將該模型運用到車型識別當 中。
[0029] 因為本發(fā)明采用上述技術(shù)方案,因此具備以下有益效果:
[0030] 本發(fā)明的目的在于公開一種基于費舍爾向量和深度網(wǎng)絡(luò)的車型識別方法,費舍爾 向量編碼能夠降低車輛圖像的特征向量的維數(shù),可以加快識別速度,減少內(nèi)存消耗,而使用 深度網(wǎng)絡(luò)結(jié)構(gòu),可以更全面地提取車輛圖像的特征,大大提高識別率。
【附圖說明】
[0031] 圖1為費舍爾向量構(gòu)建深度網(wǎng)絡(luò)算法的示意圖;
[0032] 圖2為費舍爾網(wǎng)絡(luò)示意圖;
[0033] 圖3為構(gòu)建費舍爾網(wǎng)絡(luò)第一層示意圖;
[0034] 圖4為空間堆疊示意圖。
【具體實施方式】
[0035] 為詳細說明本發(fā)明的技術(shù)內(nèi)容、構(gòu)造特征、所實現(xiàn)目的及效果,以下結(jié)合實施方式 并配合附圖詳予說明。
[0036] 本專利提出了一種基于深度費舍爾網(wǎng)絡(luò)的車型識別方法,在車輛車型識別上取得 良好的效果。整個算法實現(xiàn)示意圖如圖1所示,包括步驟:
[0037] 步驟1 :對車型數(shù)據(jù)庫的圖像進行SIFT特征提取,作為費舍爾網(wǎng)絡(luò)的第0層,示意 圖如圖2(0)所示;
[0038] SIFT是DavidLowe提出的局部特征描述子,得到了快速發(fā)展和廣泛應(yīng)用。由于 SIFT特征點是在尺度空間通過極值檢測提取出來的,所以具有平移尺度不變性;同時給每 個特征點賦予了一個主方向,所以在一定范圍內(nèi)保持旋轉(zhuǎn)不變性;另外最后對提取的特征 向量進行了歸一化處理,所以也具有良好的光照不變性。提取SIFT特征描述子可以由以下 步驟完成:
[0039] 步驟1. 1 :尺度空間極值檢測:針對構(gòu)建的高斯金字塔圖像,利用差分函數(shù)在所有 尺度上檢測候選極值點。
[0040] 步驟1. 2 :關(guān)鍵點定位:通過函數(shù)擬合來定位極值點的準確位置和尺度,同時過濾 掉候選極值點集合中的邊緣點。
[0041] 步驟1. 3 :方向確定:結(jié)合關(guān)鍵點鄰域像素的梯度信息,給每個關(guān)鍵點賦予一個主 方向。
[0042] 步驟1. 4 :特征描述子生