一種基于視頻費舍爾向量描述符的車型識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于模式分類技術(shù)領(lǐng)域,特別涉及一種基于視頻費舍爾向量描述符的車型 識別方法。
【背景技術(shù)】
[0002] 最近10多年來,中國的公路交通基礎(chǔ)設(shè)施取得了巨大的建設(shè)成就,并持續(xù)高速的 發(fā)展著。隨著國民經(jīng)濟的快速增長以及中國的城市化進程的持續(xù)深化,中國的車輛數(shù)量增 加迅猛,給環(huán)境帶來了巨大的壓力,也給城市發(fā)展和經(jīng)濟增長帶來了很多問題??傮w上,中 國的公路運輸事業(yè)面臨如下挑戰(zhàn):(1)不斷擴大的人口規(guī)模和持續(xù)快速增長的汽車數(shù)量使 道路交通的壓力越來越大;(2)公路交通運輸?shù)哪芎氖志薮螅茉蠢貌怀浞?;?)交通 事故高發(fā)、交通擁堵狀況嚴重;(4)大氣環(huán)境污染十分嚴重。為了提高交通效率,改善交通 狀況,現(xiàn)在全世界范圍都在興起使用智能交通系統(tǒng)來管理交通。
[0003] 智能交通系統(tǒng)中的核心功能是對過往車輛的準確檢測和正確的車型識別。當前對 車輛檢測分類技術(shù)的研究主要有兩個技術(shù)流派:車輛自動識別和車輛自動分類。前者是利 用車載設(shè)備與地面基站設(shè)備互識進行,該技術(shù)主要用于收費系統(tǒng)中,在發(fā)達國家使用范圍 較廣,如美國的AE-PASS系統(tǒng)、日本的ETC系統(tǒng),全球衛(wèi)星GPS定位等。后者是通過檢測車 輛本身固有的參數(shù),在一定車輛分類標準下運用適當?shù)姆诸愖R別算法,主動地對車輛進行 分型,這一類技術(shù)應用比較廣泛,己經(jīng)有很多成熟的系統(tǒng)應用在實際生活中,該類技術(shù)可以 通過射頻微波、紅光、激光、聲表面波等方式來自動識別車輛信息,也可以使用視頻圖像處 理的方式來識別車牌、車型等車輛信息。比較成熟技術(shù)有環(huán)形線圈檢測、激為紅外線檢測、 超聲波/微波檢測、地磁檢測等,但這幾種方法各有優(yōu)劣,優(yōu)點是識別精確比較高,但缺點 也很明顯,主要缺點有施工和安裝過程十分復雜,影響正常交通秩序,維護困難,主要設(shè)備 易損壞,花費較大等。
[0004] 近年來隨著計算機多媒體技術(shù)和圖像處理技術(shù)的發(fā)展,基于視頻的車輛自動分類 識別技術(shù)在現(xiàn)代交通控制系統(tǒng)中占的分量也越來越大,社會各界投入的研究力量也越來越 多。該類技術(shù)可以適應動態(tài)交通狀況的變化,通過實時采集大量的交通流量數(shù)據(jù)并將其傳 輸?shù)浇煌ü芾碇行模行耐ㄟ^系統(tǒng)提供的數(shù)據(jù)可以迅速做出控制決策,解決交通擁堵等問 題。同時,利用該技術(shù)可以分析道路的車流量信息,有利于公路網(wǎng)的總體規(guī)劃及道路建設(shè)。 視頻檢測技術(shù)的優(yōu)越性體現(xiàn)在:(1)采用非接觸檢測方式,安裝維護不必破開路面,不影響 路面壽命,不影響交通;(2)可以檢測更大范圍內(nèi)的交通流信息,從而減少設(shè)備數(shù)量,節(jié)約 資金;(3)可以在采集交通流信息的同時提供交通的實時視頻圖像,便于監(jiān)察;(4)對于某 些應用,比如交通量調(diào)查等,可以把視頻圖像采集存儲后,離線進行分析處理;(5)當環(huán)境 發(fā)生變化,或系統(tǒng)移動到他處使用時,只需簡單設(shè)置,系統(tǒng)即可重新投入使用。(6)可以綜合 提供交通數(shù)據(jù)信息和視頻圖像,便于對現(xiàn)場的全面、直觀檢測。
[0005] 在圖像分類領(lǐng)域,對大規(guī)模圖像處理一種應用很廣的方法是為提取每張照片的局 部特征,將提取的特征進行聚類和編碼得到一個高維向量,然后將其用分類器分類或者使 用最近鄰算法進行匹配。其中編碼的方法有視覺詞袋模型編碼,稀疏編碼和費舍爾向量編 碼等。而費舍爾向量編碼的性能較其他幾種編碼方式要好,結(jié)合了視覺詞袋模型編碼和統(tǒng) 計模型的優(yōu)點,能夠降低計算量,減小內(nèi)存消耗,且搜索精度較高。
[0006] 在此基礎(chǔ)之上,本專利結(jié)合費舍爾向量編碼和視頻檢測技術(shù)的優(yōu)點,提出一種基 于視頻費舍爾向量描述符的車型識別方法來解決上述問題。本發(fā)明能夠?qū)崿F(xiàn)在視頻中進行 車輛圖像的車型識別,且識別準確率高,運行速度快,消耗內(nèi)存少,具有較高的實用性和魯 棒性。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明中所述方法是為了克服上述現(xiàn)有技術(shù)的缺點,主要針對已經(jīng)檢測到的車輛 視頻,提取其車輛特征對車型進行細分識別的問題,提出了一種基于視頻費舍爾向量描述 符的車型識別方法。具體的技術(shù)方案如下所述。
[0008] 為解決上述技術(shù)問題,本發(fā)明采用以下技術(shù)方案:
[0009] 一種基于視頻費舍爾向量描述符的車型識別方法,包括以下步驟:
[0010] 步驟1:對用于訓練的車輛視頻,跟蹤視頻中每一種車型的圖像,提取該車型每一 幀圖像的SIFT特征;
[0011] 步驟2 :對提取的車型圖像的所有SIFT特征進行費舍爾向量編碼計算,得到費舍 爾向量;
[0012] 步驟3 :對得到的費舍爾向量描述符進行降維;
[0013] 步驟4:對降維后的得到的費舍爾向量描述符進行二值化處理,得到該車型的視 頻費舍爾向量描述符;
[0014] 步驟5 :將得到的所有視頻費舍爾向量描述符進行SVM訓練,得到一個具有N個車 型類別的識別系統(tǒng);
[0015] 步驟6 :對測試車輛視頻,同樣提取視頻中車輛圖像的視頻費舍爾向量描述符,將 其導入步驟5中訓練好的車型識別系統(tǒng)進行測試,識別出測試車輛視頻的車型。
[0016] 上述技術(shù)方案中,所述步驟1中對用于訓練的車輛視頻,跟蹤視頻中每一種車型 的圖像,提取該車型每一幀圖像的SIFT特征,包括以下幾個步驟:
[0017] 步驟1. 1 :跟蹤訓練視頻中每一種車型圖像;
[0018] 步驟1. 2 :對跟蹤到的車型的每一幀圖像進行數(shù)據(jù)增強,得到每種車型的圖像數(shù) 據(jù)集;
[0019] 步驟1. 3 :提取每種車型的圖像數(shù)據(jù)集的SIFT特征。
[0020] 上述技術(shù)方案中,所述步驟2中對提取的車型圖像的所有SIFT特征進行快速費舍 爾向量編碼計算,包括以下幾個步驟:
[0021] 步驟2. 1 :對提取的車型圖像數(shù)據(jù)集的所有SIFT特征進行費舍爾向量編碼計算, 其中車型圖像數(shù)據(jù)集中的一幀圖像1的費舍爾編碼向量表示為Φ(1);
[0022] 步驟2. 2 :對每幀圖像1的費舍爾編碼向量Φ⑴進行符號平方根處理:
[0023]
[0024] 再對符號平方根處理后的向量進行L2歸一化。
[0025] 上述技術(shù)方案中,所述步驟3對編碼得到的費舍爾向量描述符進行PCA降維,包括 學習一個投影矩陣W,將費舍爾向量描述符從RD維降至Rm維。
[0026] 上述技術(shù)方案中,所述步驟4對降維后的費舍爾向量描述符進行二值化處理,得 到該車型的視頻費舍爾向量描述符,包括以下幾個步驟:
[0027] 步驟4. 1 :步驟3中計算得到的費舍爾向量描述符,構(gòu)成一個矩陣:UeRqXm;
[0028] 步驟4· 2 :通過符號函數(shù),sign(a) = 1,iffa> 0進行二值化,得到一個二值化 向量:
[0029] β=sign(UΦ-w)
[0030] 其中Φ是降維后的費舍爾向量描述符,w是所選閾值,當υφ>w,β= 1,反之 β= 0 ;
[0031] 步驟4. 3:得到一個q位的二值化編碼描述符β= {0,1}'也即該車型的視頻費 舍爾向量描述符。
[0032] 上述技術(shù)方案中,所述步驟5將得到的所有描述符進行SVM訓練,得到一個具有Ν 個車型類別的識別系統(tǒng),包括使用onevsrestSVM訓練一個多類分類器,得到具有Ν類類 別的識別系統(tǒng)。
[0033] 綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
[0034] 本發(fā)明公開了一種直接對車輛視頻處理的車型識別方法,可以快速檢測出待識別 車輛,采取了費舍爾向量編碼來表示視頻中的車輛圖像,能夠降低計算量,減小內(nèi)存消耗, 且搜索精度較高,提高了車型識別率。
【附圖說明】
[0035] 本發(fā)明將通過例子并參照附圖的方式說明,其中:
[0036] 圖1為視頻費舍爾向量算法實現(xiàn)示意圖。
【具體實施方式】
[0037] 為詳細說明本發(fā)明的技術(shù)內(nèi)容、構(gòu)造特征、所實現(xiàn)目的及效果,以下結(jié)合實施方式 并配合附圖詳予說明。
[0038] 本發(fā)明提出了一種基于視頻費舍爾向量描述符的車型識別方法,在車輛車型識別 上取得良好的效果。整個算法實現(xiàn)示意圖如圖1所示,包括步驟:
[0039] 步驟1 :對用于訓練的車輛視頻,跟蹤視頻中每一種車型的圖像,提取該車型每一 幀圖像的SIFT特征;
[0040] 主要包括以下幾個步驟:
[0041] 步驟1. 1 :跟蹤訓練視頻中每一種車型圖像,由于本發(fā)明主要針對于車型識別,在 跟蹤模塊上采取的是基本的粒子濾波技術(shù)跟蹤視頻中的每一種車型的圖像,在此不做深 入;
[0042] 步驟1. 2 :對跟蹤到的車型的每一幀圖像進行數(shù)據(jù)增強,得到每種車型的圖像數(shù) 據(jù)集;
[0043] 步驟1. 3 :提取每種車型的圖像數(shù)據(jù)集的SIFT特征。
[0044] 目前跟蹤技術(shù)有很多種,本發(fā)明采取基本的粒子濾波技術(shù)跟蹤視頻中的每一種車 型的圖像,提取該車型每一幀圖像的SIFT特征;提取SIFT特征包括以下幾個步驟:
[0045] 步驟1. 4:尺度空間極值檢測:針對構(gòu)建的高斯金字塔圖像,利用差分函數(shù)在所有 尺度上檢測候選極值點。