基于極限學(xué)習(xí)機的交通標志識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理,機器學(xué)習(xí),計算機視覺技術(shù)領(lǐng)域,特別是基于極限學(xué)習(xí)機的 交通標志識別方法。
【背景技術(shù)】
[0002] 交通標志識別(TrafficSignRecognition,TSR)是未來智能交通系統(tǒng) (IntelligentTransportationSystem,ITS)的重要組成部分之一,是無人駕駛和駕駛員 輔助駕駛OriverAssistanceSystem,DAS)技術(shù)的一個重要的模塊。在自然場景下,由于 道路交通環(huán)境的復(fù)雜性等原因,給交通標志的實時自動檢測和識別帶來了巨大的挑戰(zhàn),目 前交通標志識別技術(shù)尚不成熟,因此,高效的道路交通標志識別技術(shù)還需要進行深入的研 宄。
[0003] 1993 年美國研制的ADIS(AdvancedDriverInformationSystem)系統(tǒng)[1]針 對停車標志,采用顏色聚類和幾何形狀進行特征判別目標,通過不同的神經(jīng)網(wǎng)絡(luò)進行分割 和分類,在486的個人計算機上,其平均識別率為75%,但該系統(tǒng)不是實時系統(tǒng),平均每 幅圖像的識別時間為2. 5秒。1994年德國的Koblenz?Landau大學(xué)與奔馳公司合作開 發(fā)了實時交通標志識別系統(tǒng)[2],該系統(tǒng)是歐洲普羅米修斯計劃關(guān)鍵的組成部分。其采 用顏色分割、形狀識別、字符識別和神經(jīng)網(wǎng)絡(luò)等方法,識別的速度達到0. 3秒/幅,對于約 40000幅圖像的實驗數(shù)據(jù)庫,識別準確率為98%,但是它只是針對警告標志進行識別,隨著 待識別標志的增多,識別精度和實時性都有很大程度下降。2011年,Ciresan和Meier提 出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetworks,CNNs)和多層感知技術(shù) (multi-layerperceptions,MLP)的識別算法[3]。該算法通過進一步訓(xùn)練多列深層神經(jīng)網(wǎng) 絡(luò)(multicolumndeepneuralnetwork,MCDNN)甚至得到了 99. 15%的識別率。但是該算 法對于MCDNN的訓(xùn)練時間達到了 50小時,計算復(fù)雜度特別高。2011年,Boi和Gagliardini 設(shè)計了一種基于梯度方向直方圖(HistogramsofOrientedGradients,H0G)特征和支持 向量機(SupportVectorMachines,SVM)的識別算法[4]。該算法分為兩個階段,預(yù)處理階 段提取出交通標志的H0G特征和色調(diào)直方圖(HueHistogram,HH)特征,訓(xùn)練階段采用SVM 的一對多選舉策略進行訓(xùn)練識別,該算法的識別率為96. 89%,但也同樣存在計算復(fù)雜度高 的問題。
[0004] 總之,現(xiàn)有技術(shù)的交通標志識別算法,它們要么識別率低不能滿足要求,要么有著 很高的計算復(fù)雜度而不能滿足實時性需求??紤]到自然環(huán)境下車輛的高速安全行駛,交通 標志的實時識別不僅要求做到準確識別而且要求快速識別,這對計算復(fù)雜度、實時性和識 別率要求很高。
[0005] 參考文獻
[0006] [l]KehtarnavazN,GriswoldNC,KangDS.Stop-signrecognitionbasedon color/shapeprocessing[J].MachineVision&Applications, 1993,6(4):206-208.
[0007] [2]L.Priese,J.Klieber,R.Lakrnann,V.Rehrmann,R.Schian.NewResultsOn TrafficSignRecognition,InIEEEProc.IntelligentVehicle'94Symposium,1994 : 249-253.
[0008] [3]Ciresan,Dan,MeierU,MasciJ,etal.Acommitteeofneuralnetworksfor trafficsignclassification[C]//ININTERNATIONALJOINTCONFERENCEONNEURAL NETWORKS. 2011:1918-1921.
[0009] [4]BoiF,GagliardiniL.ASupportVectorMachinesNetworkForTraffic SignRecognition[C]//ProceedingsoftheInternationalJointConferenceon NeuralNetworks. 2011:2210-2216.。
【發(fā)明內(nèi)容】
[0010] 為克服技術(shù)的不足,提供一種使用簡便的基于極限學(xué)習(xí)機的交通標志識別方法, 該方法能在很大程度上減少計算復(fù)雜度,還能獲得較高識別率。為此,本發(fā)明采取的技術(shù) 方案是,基于極限學(xué)習(xí)機的交通標志識別方法,采用德國交通標志數(shù)據(jù)庫(GermanTraffic SignRecognitionBenchmark,GTSRB)作為數(shù)據(jù)源;訓(xùn)練階段首先提取出GTSRB中訓(xùn)練 樣本集中每一張交通標志的基于梯度方向直方圖(HistogramsofOrientedGradients, HOG)特征,然后使用基于主成分分析PCA方法對提取出的HOG特征進行降維,降維后的特征 X與樣本的期望識別輸出Y組成訓(xùn)練用特征[Y,X],然后把[Y,X]作為極限學(xué)習(xí)機(Extreme LearningMachine,ELM)模型的輸入進行訓(xùn)練,得到測試用的訓(xùn)練好的ELM模型;測試階段 同樣首先提取出測試用交通標志的H0G特征,然后PCA降維得到測試樣本特征矩陣Z,最后 用Z作為訓(xùn)練好的ELM模型的輸入進而對測試圖片進行識別。
[0011] PCA的貢獻率閾值選為0. 99,即保留了 99%以上的H0G特征,PCA-ELM算法降維前 H0G特征為1764維,使用PCA降維后為441維。
[0012] 所用的ELM模型是一種基于單隱層前向反饋神經(jīng)網(wǎng)絡(luò)(SingleHiddenLayer FeedForwardNeuralNetworks,SLFNs)的監(jiān)督型學(xué)習(xí)算法,假如輸入為N個不同的訓(xùn)練 樣本(Xi,t),i= 1,2, . . .,N,其中Xi=(xn,xi2,…,xin)TGRn為第i個樣本的特征向量, ti=(tti2,. . .,tim)TGRm為第i個樣本的期望輸出目標向量,n和m分別為輸入和輸出 神經(jīng)元的個數(shù);標準的SLFNs模型為
[0013] (1)
[0014]其中力=(wn,wi2,. ..,win)T為第i個隱藏層神經(jīng)元與輸入神經(jīng)元之間的權(quán)重向 量,13i= (0 n, 13 i2, . . .,13im)T為第i個隱藏神經(jīng)元與輸出神經(jīng)元之間的權(quán)重向量,w^Xj 為&和xj的內(nèi)積,b篇i個隱藏神經(jīng)元的閾值;選用sigmoidal函數(shù)激活方程: _5]
(2)
[0016] 標準的SLFNs模型能夠做到零誤差的逼近上述N個樣本,即
[0017] (3)
[0018] 艮P
[0019]
⑷
[0020] 上式可進一步簡化為
[0021] H0 =T. (5)
[0022] 其中H為隱藏層神經(jīng)元的輸出矩陣,0為隱藏層與輸出神經(jīng)元之間的輸出權(quán)重,T 為期望輸出矩陣,如式(6)和(7)所示
[0023]
[0024]
[0025] 其中當(dāng)w和0確定以后,H也就相應(yīng)的確定了,因此訓(xùn)練SLFNs就轉(zhuǎn)換成了求解 一個線性系統(tǒng)Hf3 =T,最終,最小范數(shù)二乘解0由下式確定
[0026] (8)
[0027] 其中#為H的Moore-Penrose(彭羅斯穆爾)廣義逆矩陣;訓(xùn)練后,計算出輸入權(quán) 重w和輸出權(quán)重0以及隱藏層神經(jīng)元閾值匕,由此計算出H和目標輸出向量〇1
[0028] 〇i=(on, . . . ,oim) (9)
[0029] 在ELM模型訓(xùn)練中,輸出神經(jīng)元的個數(shù)與交通標志的類別數(shù)一致,假定交通標志 共有m類,且第i個訓(xùn)練樣本Xi屬于第k類,則輸出向量〇 ,是一個二進制目標向量,其中第 k個元素為1,其它的為0。然后,測試樣本的類別可以通過對〇i取最大值得到,如果〇 ^勺 第k個元素為1,則說明測試樣本屬于第k類。
[0030] PCA-ELM算法中,隱元個數(shù)L選取為7000。
[0031] 與已有技術(shù)相比,本發(fā)明的技術(shù)特點與效果:
[0032] 與現(xiàn)有的識別算法相比,本發(fā)明的有益效果是在保證了一個高識別準確率的同 時,也提高了模型訓(xùn)練速度即減小了計算復(fù)雜度,此外,本發(fā)明提出的PCA-ELM算法在其學(xué) 習(xí)過程中只需要設(shè)置網(wǎng)絡(luò)的隱藏層神經(jīng)元個數(shù)L,并且其輸入層與隱藏層之間的權(quán)值向量 參數(shù)以及隱藏層上的偏置向量參數(shù)不需要像其他的大多數(shù)學(xué)習(xí)算法那樣通過迭代反復(fù)進 行調(diào)整刷新,PCA-ELM算法可以產(chǎn)生唯一的最優(yōu)解,最終的實驗結(jié)果表明該算法能獲得一個 97. 69 %的高識別率,且僅僅只需要0. 16毫秒就能識別一張交通標志,能夠滿足交通標志 的實時性要求。
【附圖說明】
[0033] 圖1PCA-ELM算法流程圖;
[0034] 圖 2ELM模型;
[0035] 圖3PCA-ELM算法中隱元個數(shù)L與分類識別率之間關(guān)系;
[0036] 圖4PCA-ELM算法中隱元個數(shù)L與計算復(fù)雜度之間關(guān)系;
[0037] 圖5不同隱元個數(shù)L下ELM算法與PCA-ELM算法分類識別率比較;
[0038] 圖6不同隱元個數(shù)L下ELM算法與PCA-ELM算法計算復(fù)雜度比較;
[0039] 圖7GTSRB中交通標志分類。
【具體實施方式】
[0040] 針對計算復(fù)雜度和識別率,本發(fā)明提出了 一種基于主成分分析(Principal ComponentsAnalysis,PCA)和極限學(xué)習(xí)機(ExtremeLearningMachine,ELM)模型的交通 標志識別算法,簡稱為PCA-ELM算法,該算法與現(xiàn)有的絕大部分識別算法相比,僅僅需要設(shè) 置一個參數(shù),并且能在很大程度上減少計算復(fù)雜度,除此之外還能獲得較高識別率。
[0041] 本發(fā)明提出的一種新型的交通標志識別算法,即PCA-ELM算法,其技術(shù)方案流程 圖如圖1所示。
[0042] 實驗所用的數(shù)據(jù)庫是著名的德國交通標志數(shù)據(jù)庫(GermanTrafficSign RecognitionBenchmark,GTSRB),GTSRB中有 43 類交通標志共 51839 張,包括 39209 張訓(xùn) 練用交通標志和12630張測試用交通標志。圖1中矩形代表訓(xùn)練階段,橢圓代表測試階段。 訓(xùn)練階段首先提取出GTSRB中訓(xùn)練樣本集中每一張交通標志的H0G特征,然后使用PCA方 法對提取出的H0G特征進行降維,降維后的特征X與樣本的期望識別輸出Y組成訓(xùn)練用特 征[Y,X],然后把[Y,X]作為ELM模型的輸入進行訓(xùn)練,得