本發(fā)明涉及車輛識別技術(shù)領(lǐng)域,特別涉及一種車標(biāo)識別方法及裝置。
背景技術(shù):
車標(biāo)是車輛的一個重要的、很難改變的屬性。車輛車標(biāo)的識別在現(xiàn)實(shí)生活中有很重要的意義,例如,針對涉及違法犯罪行為的車輛,車輛車標(biāo)的識別在卡口及電子警察系統(tǒng)中的應(yīng)用,在一定程度上遏制了各種違法行為的發(fā)生;在視頻監(jiān)控領(lǐng)域,車標(biāo)的識別在車輛道路安全防范上也起到了很大的推進(jìn)作用。
現(xiàn)有的車標(biāo)識別過程,通常采用基于AdaBoost框架訓(xùn)練后的分類模型進(jìn)行識別?;贏daBoost框架進(jìn)行模型訓(xùn)練時,需要先對各樣本進(jìn)行歸一化,然后,計(jì)算各樣本的梯度直方圖(Histogram of Oriented Gradient,HOG),并將各樣本的梯度直方圖輸入支持向量機(jī)(Support Vector Machine,SVM)學(xué)習(xí),得到分類模型。
采用基于AdaBoost框架訓(xùn)練后的分類模型進(jìn)行車標(biāo)識別時,需要提取待識別車標(biāo)圖像的HOG,然后把HOG輸入分類模型中,得到識別結(jié)果。其中,分類模型中保存有車標(biāo)類別與HOG之間的對應(yīng)關(guān)系,將待識別車標(biāo)圖像的HOG輸入分類模型中后,分類模型會在自身保存的對應(yīng)關(guān)系中查找待識別車標(biāo)圖像的HOG對應(yīng)的車標(biāo)類別。
然而,HOG的生成過程耗時較長,這樣就導(dǎo)致了車標(biāo)識別時的識別速度很慢,所以實(shí)時性差。另外,由于梯度的性質(zhì),HOG對噪聲相當(dāng)敏感,對于噪聲環(huán)境下的車標(biāo)識別正確率低。再有,對于由于天氣或光線干擾導(dǎo)致的模糊圖像內(nèi)的車標(biāo)進(jìn)行識別時,識別準(zhǔn)確率也較低??梢?,現(xiàn)有技術(shù)中的車標(biāo)識別方法存在識別速度慢以及識別準(zhǔn)確率低的問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例公開了一種車標(biāo)識別方法及裝置,用于提高車輛車標(biāo)識別的速度和準(zhǔn)確率。
為達(dá)到上述目的,本發(fā)明實(shí)施例公開了一種車標(biāo)識別方法,包括:
在包含待識別車標(biāo)的第一圖像中識別所述第一圖像的特征區(qū)域,其中,所述特征區(qū)域?yàn)樗龃R別車標(biāo)所在的區(qū)域;
生成包含所述特征區(qū)域的預(yù)定大小的第二圖像;
將所述第二圖像輸入預(yù)先訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型中,得到所述待識別車標(biāo)對應(yīng)的類別信息。
較佳地,所述在包含待識別車標(biāo)的第一圖像中識別所述第一圖像的特征區(qū)域包括:
對所述第一圖像進(jìn)行平滑處理,獲得車牌位置信息;
根據(jù)所述車牌位置信息以及車牌和車標(biāo)之間的位置關(guān)系,確定所述第一圖像的特征區(qū)域。
較佳地,所述生成包含所述特征區(qū)域的預(yù)定大小的第二圖像包括:
生成包含所述特征區(qū)域的第三圖像;
對所述第三圖像進(jìn)行邊緣檢測、均衡化、閾值過濾、圖像開閉運(yùn)算、和縮放處理,確定處理后的圖像為第二圖像。
較佳地,所述深度神經(jīng)網(wǎng)絡(luò)模型為AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型,所述AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型的訓(xùn)練過程包括:
獲取樣本車輛圖像,并確定包含各樣本車輛圖像內(nèi)的車標(biāo)的第一樣本車標(biāo)圖像;
將所述第一樣本車標(biāo)圖像處理成所述預(yù)定大小的第二樣本車標(biāo)圖像;
將所述第二樣本車標(biāo)圖像,以及與各第二樣本車標(biāo)圖像對應(yīng)的車標(biāo)類別信息作為訓(xùn)練樣本,訓(xùn)練得到所述AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型。
較佳地,所述方法還包括:
獲得所述待識別車標(biāo)對應(yīng)的類別信息的置信度;
所述得到所述待識別車標(biāo)對應(yīng)的類別信息包括:
根據(jù)所述待識別車標(biāo)對應(yīng)的各類別信息的置信度,按照置信度從大到小的順序,得到預(yù)定數(shù)量的所述待識別車標(biāo)對應(yīng)的類別信息。
為達(dá)到上述目的,本發(fā)明實(shí)施例還公開了一種車標(biāo)識別裝置,包括:
識別模塊,用于在包含待識別車標(biāo)的第一圖像中識別所述第一圖像的特征區(qū)域,其中,所述特征區(qū)域?yàn)樗龃R別車標(biāo)所在的區(qū)域;
生成模塊,用于生成包含所述特征區(qū)域的預(yù)定大小的第二圖像;
第一處理模塊,用于將所述第二圖像輸入預(yù)先訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型中,得到所述待識別車標(biāo)對應(yīng)的類別信息。
較佳地,所述識別模塊具體用于:
對所述第一圖像進(jìn)行平滑處理,獲得車牌位置信息;
根據(jù)所述車牌位置信息以及車牌和車標(biāo)之間的位置關(guān)系,確定所述第一圖像的特征區(qū)域。
較佳地,所述生成模塊具體用于:
生成包含所述特征區(qū)域的第三圖像;
所述第三圖像進(jìn)行邊緣檢測、均衡化、閾值過濾、圖像開閉運(yùn)算、和縮放處理,確定處理后的圖像為第二圖像。
較佳地,所述深度神經(jīng)網(wǎng)絡(luò)模型為AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型,所述裝置還包括:
確定模塊,用于獲取樣本車輛圖像,并確定包含各樣本車輛圖像內(nèi)的車標(biāo)的第一樣本車標(biāo)圖像;
第二處理模塊,用于將所述第一樣本車標(biāo)圖像處理成所述預(yù)定大小的第二樣本車標(biāo)圖像;
訓(xùn)練模塊,用于將所述第二樣本車標(biāo)圖像,以及與各第二樣本車標(biāo)圖像對應(yīng)的車標(biāo)類別信息作為訓(xùn)練樣本,訓(xùn)練得到所述AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型。
較佳地,所述裝置還包括:
獲得模塊,用于獲得所述待識別車標(biāo)對應(yīng)的類別信息的置信度;
所述第一處理模塊,具體用于根據(jù)所述待識別車標(biāo)對應(yīng)的各類別信息的置信度,按照置信度從大到小的順序,得到預(yù)定數(shù)量的所述待識別車標(biāo)對應(yīng)的類別信息。
由上述技術(shù)方案可知,本發(fā)明實(shí)施例公開了一種車標(biāo)識別方法及裝置,方法包括:在包含待識別車標(biāo)的第一圖像中識別所述第一圖像的特征區(qū)域,其中,所述特征區(qū)域?yàn)樗龃R別車標(biāo)所在的區(qū)域;生成包含所述特征區(qū)域的預(yù)定大小的第二圖像;將所述第二圖像輸入預(yù)先訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型中,得到所述待識別車標(biāo)對應(yīng)的類別信息。
相比于現(xiàn)有技術(shù),應(yīng)用本發(fā)明實(shí)施例,利用預(yù)先訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型對車標(biāo)直接進(jìn)行識別,由于深度神經(jīng)網(wǎng)絡(luò)模型對圖像的識別速度快、識別準(zhǔn)確率高,因此在車標(biāo)識別過程中能快速準(zhǔn)確的識別出車標(biāo)圖像內(nèi)的車標(biāo),提高了車標(biāo)識別的速度和準(zhǔn)確率。并且,在車標(biāo)識別過程中,無需生成車標(biāo)圖像的HOG,進(jìn)一步提高了車標(biāo)識別的速度。
當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品或方法必不一定需要同時達(dá)到以上所述的所有優(yōu)點(diǎn)。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例所提供的一種車標(biāo)識別方法的流程示意圖;
圖2為本發(fā)明實(shí)施例所提供的一種車標(biāo)識別方法中識別待識別車標(biāo)所在區(qū)域的流程示意圖;
圖3為本發(fā)明實(shí)施例所提供的一種車標(biāo)識別方法中Canny邊緣檢測的工作原理示意圖;
圖4為本發(fā)明實(shí)施例所提供的一種車標(biāo)識別方法中生成包含特征區(qū)域的預(yù)定大小的第二圖像的流程示意圖;
圖5為本發(fā)明實(shí)施例所提供的一種車標(biāo)識別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了提高車輛車標(biāo)識別的速度和準(zhǔn)確率,本發(fā)明實(shí)施例提供了一種車標(biāo)識別方法及裝置。
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
需要說明的是,在不沖突的情況下,本發(fā)明中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。
為了提高車輛車標(biāo)識別的速度和準(zhǔn)確率,本發(fā)明實(shí)施例提供了一種車標(biāo)識別方法過程,如圖1所示,該過程可以包括以下步驟:
S110,在包含待識別車標(biāo)的第一圖像中識別所述第一圖像的特征區(qū)域,其中,所述特征區(qū)域?yàn)樗龃R別車標(biāo)所在的區(qū)域;
本發(fā)明實(shí)施例所提供的車標(biāo)識別方法可以應(yīng)用于電子設(shè)備。具體地,該電子設(shè)備可以為臺式計(jì)算機(jī)、便攜式計(jì)算機(jī)、智能移動終端等。
在本發(fā)明實(shí)施例中,電子設(shè)備可以根據(jù)包含待識別車標(biāo)的第一圖像,識別該待識別車標(biāo)的類別信息。其中,電子設(shè)備可以首先獲取包含待識別車標(biāo)的第一圖像,進(jìn)而根據(jù)該第一圖像,識別待識別車標(biāo)的類別信息。
需要說明的是,在本發(fā)明實(shí)施例中,電子設(shè)備獲取包含待識別車標(biāo)的第一圖像的過程可以采用現(xiàn)有技術(shù),例如,在視頻監(jiān)控領(lǐng)域,該包含待識別車標(biāo)的第一圖像可以由監(jiān)控設(shè)備采集并發(fā)送給電子設(shè)備,本發(fā)明實(shí)施例對此過程不進(jìn)行贅述。
獲取到包含待識別車標(biāo)的第一圖像后,電子設(shè)備就可以根據(jù)該第一圖像,識別該待識別車標(biāo)的類別信息。具體地,電子設(shè)備可以在第一圖像中識別該第一圖像的特征區(qū)域,其中,該特征區(qū)域?yàn)樵摯R別車標(biāo)所在的區(qū)域。
例如,電子設(shè)備可以采用圖像識別方法,識別第一圖像中包括的車標(biāo),并將車標(biāo)所在區(qū)域確定為第一圖像的特征區(qū)域?;蛘?,電子設(shè)備可以識別第一圖像中包括的車輛的車牌,進(jìn)而,確定根據(jù)車牌與車標(biāo)之間的位置關(guān)系,確定待識別車標(biāo)所在的區(qū)域?yàn)榈谝粓D像的特征區(qū)域。
S120,生成包含所述特征區(qū)域的預(yù)定大小的第二圖像;
電子設(shè)備識別出第一圖像的特征區(qū)域,即識別出第一圖像中包括的車輛車標(biāo)后,可以進(jìn)一步根據(jù)該第一圖像的特征區(qū)域,生成包含特征區(qū)域的預(yù)定大小的第二圖像。
在實(shí)際應(yīng)用中,輸入深度神經(jīng)網(wǎng)絡(luò)模型中的輸入的圖片的大小通常為固定大小,如可以為227像素*227像素。因此,在本發(fā)明實(shí)施例中,為滿足深度神經(jīng)網(wǎng)絡(luò)模型的圖片輸入格式,可以將第二圖像的預(yù)定大小設(shè)置為預(yù)定大小,如為227像素*227像素。
需要說明的是,生成的包含特征區(qū)域的預(yù)定大小的第二圖像應(yīng)該盡可能全面的把待識別車標(biāo)包含在內(nèi)。因此,生成的包含特征區(qū)域的預(yù)定大小的第二圖像中包括的區(qū)域可以比特征區(qū)域大一定比例。比如,確定出特征區(qū)域后,以特征區(qū)域?yàn)橹行?,上下左右向外擴(kuò)充,確定擴(kuò)充后的區(qū)域?yàn)榈诙D像。
例如,在實(shí)際應(yīng)用中,電子設(shè)備可以以第一圖像的特征區(qū)域?yàn)橹行?,上下左右向外擴(kuò)充,獲取227像素*227像素大小的區(qū)域,并將包含該區(qū)域的圖像確定為第二圖像。
S130,將所述第二圖像輸入預(yù)先訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型中,得到所述待識別車標(biāo)對應(yīng)的類別信息。
在本發(fā)明實(shí)施例中,電子設(shè)備可以預(yù)先訓(xùn)練得到分類模型。使用該分類模型,當(dāng)輸入第二圖像時,該分類模型可以輸出與該第二圖像中包括的車標(biāo)對應(yīng)的類別信息。
在一種實(shí)現(xiàn)方式中,分類模型可以為根據(jù)各車標(biāo)圖像與其對應(yīng)的車標(biāo)類型信息之間的對應(yīng)關(guān)系訓(xùn)練得到的。在這種實(shí)現(xiàn)方式中,分類模型可以直接根據(jù)各車標(biāo)圖像與其對應(yīng)的車標(biāo)類型信息之間的對應(yīng)關(guān)系確定輸入的第二圖像中包括的車標(biāo)對應(yīng)的類別信息,進(jìn)而輸出第二圖像中包括的車標(biāo)對應(yīng)的類別信息。
在另一種實(shí)現(xiàn)方式中,分類模型可以為根據(jù)各車標(biāo)圖像與各車標(biāo)類別號之間的對應(yīng)關(guān)系,以及各車標(biāo)類別號與各車標(biāo)類型信息之間的對應(yīng)關(guān)系訓(xùn)練得到的。在這種實(shí)現(xiàn)方式中,分類模型可以根據(jù)各車標(biāo)圖像與各車標(biāo)類別號的對應(yīng)關(guān)系確定出第二圖像中包括的車標(biāo)的類別號,再根據(jù)各車標(biāo)類別號與各車標(biāo)類型信息之間的對應(yīng)關(guān)系確定輸入的第二圖像中包括的車標(biāo)的類別號對應(yīng)的類別信息,進(jìn)而輸出第二圖像中包括的車標(biāo)對應(yīng)的類別信息。
因此,在本發(fā)明實(shí)施例中,在進(jìn)行車標(biāo)識別時,當(dāng)電子設(shè)備獲得第二圖像后,其可以將該第二圖像輸入預(yù)先訓(xùn)練的分類模型中,得到該第二圖像中待識別車標(biāo)的類別信息。
應(yīng)用本發(fā)明實(shí)施例,利用預(yù)先訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型對車標(biāo)直接進(jìn)行識別,由于深度神經(jīng)網(wǎng)絡(luò)模型對圖像的識別速度快、識別準(zhǔn)確率高,因此在車標(biāo)識別過程中能快速準(zhǔn)確的識別出車標(biāo)圖像內(nèi)的車標(biāo),提高了車標(biāo)識別的速度和準(zhǔn)確率。并且,相比于現(xiàn)有技術(shù),在車標(biāo)識別過程中,無需生成車標(biāo)圖像的HOG,進(jìn)一步提高了車標(biāo)識別的速度。
進(jìn)一步地,作為本發(fā)明實(shí)施例的一種實(shí)現(xiàn)方式,本發(fā)明實(shí)施例中的在包含待識別車標(biāo)的第一圖像中識別所述第一圖像的特征區(qū)域的過程,可以包括:對第一圖像進(jìn)行平滑處理,獲得車牌位置信息;根據(jù)所述車牌位置信息以及車牌和車標(biāo)之間的位置關(guān)系,確定所述第一圖像的特征區(qū)域。
具體地,對第一圖像進(jìn)行的平滑處理可以包括均值濾波、中值濾波和高斯濾波等操作。對第一圖像進(jìn)行平滑處理后,可以采用現(xiàn)有技術(shù)中識別車牌的方法獲得車牌位置信息,這里不再贅述。
然后,根據(jù)車牌位置信息以及車牌和車標(biāo)之間的位置關(guān)系,確定第一圖像的特征區(qū)域。具體地,車牌與車標(biāo)之間的位置關(guān)系可以預(yù)先設(shè)置并保存在電子設(shè)備中。其中,車牌與車標(biāo)之間的位置關(guān)系可以包括但不限于以下關(guān)系:車標(biāo)位于車牌位置之上一定距離處、車標(biāo)關(guān)于車牌的中間軸線對稱等。當(dāng)然,車牌與車標(biāo)之間的位置關(guān)系也可以包括車標(biāo)比車牌小。
設(shè)置好車標(biāo)與車牌之間的位置關(guān)系后,電子設(shè)備在確定第一圖像的特征區(qū)域時,即可結(jié)合獲得的車牌位置信息,確定出第一圖像的特征區(qū)域,即確定出待識別車標(biāo)所在的區(qū)域。
例如,在實(shí)際應(yīng)用中,采用本實(shí)施例方案中的方法識別待識別車標(biāo)所在區(qū)域的流程可以如圖2所示。在圖2中,對第一圖像進(jìn)行平滑處理后獲得的車牌位置信息為車輛車牌為圖2中長度為w0、高度為h0的矩形區(qū)域。根據(jù)車牌位置信息以及車牌和車標(biāo)之間的位置關(guān)系,確定第一圖像的特征區(qū)域可以為圖2中長度為w1、高度為h1的矩形區(qū)域。
應(yīng)用本實(shí)施例方案,利用車牌特征顯著、易于定位的特點(diǎn)先確定車牌位置信息,再結(jié)合車標(biāo)與車牌之間的位置關(guān)系,確定出待識別車標(biāo)所在的區(qū)域,這樣比在第一圖像上直接確定待識別車標(biāo)所在的區(qū)域的速度快,準(zhǔn)確率高。
進(jìn)一步地,作為本實(shí)施例的另一種實(shí)現(xiàn)方式,本發(fā)明實(shí)施例中,在包含待識別車標(biāo)的第一圖像中識別第一圖像的特征區(qū)域之后,生成包含特征區(qū)域的預(yù)定大小的第二圖像的過程可以包括:先生成包含特征區(qū)域的第三圖像;然后對生成的第三圖像進(jìn)行邊緣檢測、均衡化、閾值過濾、圖像開閉運(yùn)算、和縮放處理,確定處理后的圖像為第二圖像。
具體地,可以采用上述實(shí)施例方案中生成包含特征區(qū)域的第二圖像的方法生成包含特征區(qū)域的第三圖像,本實(shí)施例不進(jìn)行贅述。
由于上述實(shí)施例方案中生成的包含特征區(qū)域的第二圖像,也就是本實(shí)施例方案中生成的第三圖像包括的區(qū)域要比特征區(qū)域大,為了更精確的確定包含特征區(qū)域的圖像,即精確的確定包含待識別車標(biāo)所在區(qū)域的圖像,還可以對生成的包含特征區(qū)域的第三圖像作進(jìn)一步處理。
也就是說,在生成包含特征區(qū)域的第三圖像以后,可以對生成的第三圖像進(jìn)行邊緣檢測、均衡化、閾值過濾、圖像開閉運(yùn)算、和縮放處理。
具體地,本實(shí)施例中可以采用Canny邊緣檢測方法對第三圖像進(jìn)行邊緣檢測,Canny邊緣檢測方法屬于先平滑后求導(dǎo)的方法。
具體地,進(jìn)行Canny邊緣檢測時,本實(shí)施例中采用的Canny卷積算子為:
使用一階有限差分計(jì)算的x方向一階偏導(dǎo)數(shù)矩陣P[x,y]、y方向的一階偏導(dǎo)數(shù)矩陣Q[x,y]、以及梯度幅值M[i,j]和梯度方向α[i,j]的數(shù)學(xué)表達(dá)式為:
P[x,y]=(f[i,j+1]-f[i,j]+f[i+1,j+1]-f[i+1],j])/2
Q[x,y]=(f[i,j]-f[i+1,j]+f[i,j+1]-f[i+1],j+1])/2
α[i,j]=arctan(Q[i,j]/P[i,j])
進(jìn)行Canny邊緣檢測時,圖像梯度幅值矩陣M[i,j]中的元素值越大,說明圖像中該點(diǎn)的梯度值越大,但這不能說明該點(diǎn)就是邊緣。因此在進(jìn)行Canny邊緣檢測過程中,非極大值抑制是很重要的一步。非極大值抑制在通俗意義上是指尋找像素點(diǎn)局部極大值,將非極大值點(diǎn)所對應(yīng)的灰度值置為0,這樣可以剔除掉一大部分非邊緣的點(diǎn)。
非極大值抑制的具體工作原理可以如圖3所示,在圖3中,要進(jìn)行非極大值抑制,就首先要確定像素點(diǎn)C的灰度值在其鄰域內(nèi)是否為極大值,即像素點(diǎn)C的灰度值是否為局部極大值。圖3中假設(shè)直線1方向?yàn)镃點(diǎn)的梯度方向,則C點(diǎn)的局部極大值肯定分布在直線1上,也即除了C點(diǎn)外,梯度方向的交點(diǎn)dTmp1和dTmp2這兩個點(diǎn)的灰度值也可能會是局部極大值。因此,判斷C點(diǎn)灰度值與這兩個點(diǎn)的灰度值的大小即可判斷C點(diǎn)灰度值是否為其鄰域內(nèi)的局部極大值。如果經(jīng)過判斷,C點(diǎn)灰度值小于這兩個點(diǎn)灰度值中的任意一個灰度值,那就說明C點(diǎn)灰度值不是局部極大值,那么則可以排除C點(diǎn)為邊緣,則C點(diǎn)所對應(yīng)的灰度值需要置為0。
對生成的第三圖像進(jìn)行Canny邊緣檢測后,還可以對生成的第三圖像進(jìn)行均衡化、閾值過濾、圖像開閉運(yùn)算、和縮放處理。
具體地,圖像均衡化處理可以利用線性或非線性的方法來實(shí)現(xiàn)均衡化,或通過使用累積函數(shù)對灰度值進(jìn)行“調(diào)整”以實(shí)現(xiàn)對比度的增強(qiáng)。通過均衡化處理,可以“擴(kuò)大”前景和背景灰度的差別,達(dá)到增強(qiáng)對比度的目的。
閾值過濾處理即將圖像上的點(diǎn)的灰度值設(shè)置為0或255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果,這樣就可以凸現(xiàn)出待識別車標(biāo)的輪廓。
通常,由于噪聲的影響,圖像在閾值過濾后所得到邊界往往是很不平滑的,物體區(qū)域具有一些噪聲孔,背景區(qū)域上散布著一些小的噪聲物體。而連續(xù)的開和閉運(yùn)算可以有效地改善這種情況。因此對閾值過濾處理后的第三圖像還可以進(jìn)行開閉運(yùn)算處理。開運(yùn)算為先腐蝕后膨脹的過程,用來消除小物體、在纖細(xì)點(diǎn)處分離物體、平滑較大物體的邊界,并且同時并不明顯改變圖像面積。閉運(yùn)算為先膨脹后腐蝕的過程,用來填充物體內(nèi)細(xì)小空洞、連接鄰近物體、平滑其邊界,且同時并不明顯改變圖像面積。
對第三圖像進(jìn)行處理,確定第二圖像的流程以及處理結(jié)果可以如圖4所示。在圖4中,對生成的第三圖像進(jìn)行了邊緣檢測、均衡化、閾值過濾、圖像開閉運(yùn)算處理以及縮放處理。其中,對第三圖像的邊緣檢測包括了X方向邊緣檢測、Y方向邊緣檢測以及聯(lián)合邊緣檢測。
應(yīng)用本實(shí)施例方案,通過對包含待識別車標(biāo)的第一圖像進(jìn)行邊緣檢測、均衡化、閾值過濾、圖像開閉運(yùn)算、和縮放處理處理,可以獲得包含準(zhǔn)確車標(biāo)區(qū)域的車標(biāo)圖像,采用該車標(biāo)圖像進(jìn)行車輛車標(biāo)識別,可以提高車標(biāo)識別的準(zhǔn)確率。
進(jìn)一步地,作為本實(shí)施例的另一種實(shí)現(xiàn)方式,本實(shí)施例中的深度神經(jīng)網(wǎng)絡(luò)模型可以為AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型。AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型進(jìn)行圖像識別時,識別速度快,識別準(zhǔn)確率高。在AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型中,主要網(wǎng)絡(luò)結(jié)構(gòu)包括:InputImage、Layer1~Layer8,其中,Layer8層也就是輸出Softmax函數(shù)層;Input Image就是輸入圖像層,每個輸入的圖像的大小227像素*227像素,輸入維度為RGB三個顏色維度;Layer1~Layer5是卷積層;Layer6~Layer8是全連接層。
以Layer1為例,本層的卷積濾波器的大小可以是11像素*11像素,卷積步幅為4,本層共有96個卷積濾波器,則本層的輸出是96個55像素*55像素大小的圖片。在Layer1層,卷積濾波后,還可以包括ReLUs操作和max-pooling操作。以Layer6為例,本層的神經(jīng)元個數(shù)可以為4096個。Layer8的神經(jīng)元個數(shù)可以為1000個,相當(dāng)于訓(xùn)練目標(biāo)的1000個圖片類別信息。
具體地,AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型的訓(xùn)練過程可以包括:
首先,獲取樣本車輛圖像,并確定包含各樣本車輛圖像內(nèi)的車標(biāo)的第一樣本車標(biāo)圖像;然后,將第一樣本車標(biāo)圖像處理成預(yù)定大小的第二樣本車標(biāo)圖像;最后,將第二樣本車標(biāo)圖像,以及與各第二樣本車標(biāo)圖像對應(yīng)的車標(biāo)類別信息作為訓(xùn)練樣本,訓(xùn)練得到所述AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型。
具體地,在本發(fā)明實(shí)施例中,電子設(shè)備在訓(xùn)練AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型時,可以首先獲取樣本車輛圖像。例如,電子設(shè)備可以獲取盡可能多的樣本車輛圖像,該樣本車輛圖像可以包含每種車標(biāo)的車輛。
進(jìn)一步地,當(dāng)電子設(shè)備獲取到樣本車輛圖像后,還可以確定包含各樣本車輛圖像內(nèi)的車標(biāo)的第一樣本車標(biāo)圖像。例如,電子設(shè)備可以采用上述實(shí)施例方案中識別待識別車標(biāo)所在的區(qū)域的方法,確定包含各樣本車輛圖像內(nèi)的車標(biāo)的第一樣本車標(biāo)圖像。
可以理解的是,電子設(shè)備在確定出第一樣本車標(biāo)圖像后,可以對第一樣本車標(biāo)圖像進(jìn)行邊緣檢測、均衡化、閾值過濾、圖像開閉運(yùn)算處理以及縮放處理,將第一樣本車標(biāo)圖像處理成227像素*227像素大小的圖像,并將該圖像確定為第二樣本車標(biāo)圖像。
得到各第二樣本車標(biāo)圖像后,電子設(shè)備可以將各第二樣本車標(biāo)圖像,以及與各第二樣本車標(biāo)圖像對應(yīng)的車標(biāo)類別信息作為訓(xùn)練樣本,訓(xùn)練得到AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型。
在一種實(shí)現(xiàn)方式中,得到各第二樣本車標(biāo)圖像后,可以將各車標(biāo)圖像與其對應(yīng)的車標(biāo)類型信息輸入到模型中進(jìn)行訓(xùn)練。
在另一種實(shí)現(xiàn)方式中,得到各第二樣本車標(biāo)圖像后,也可以將各車標(biāo)圖像與各車標(biāo)類別號的對應(yīng)關(guān)系,以及各車標(biāo)類別號與各車標(biāo)類型信息之間的對應(yīng)關(guān)系,輸入到模型中進(jìn)行訓(xùn)練。
需要說明的是,在本發(fā)明實(shí)施例中,AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型的訓(xùn)練過程可以采用現(xiàn)有技術(shù),本發(fā)明實(shí)施例對此過程不進(jìn)行贅述。
應(yīng)用本實(shí)施例方案,可以預(yù)先訓(xùn)練得到AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型。進(jìn)而,在進(jìn)行車標(biāo)識別時,利用訓(xùn)練好的AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型對車標(biāo)直接進(jìn)行識別,由于AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型對圖像的識別速度快、識別準(zhǔn)確率高,因此在車標(biāo)識別過程中能快速準(zhǔn)確的識別出車標(biāo)圖像內(nèi)的車標(biāo),提高了車標(biāo)識別的速度和準(zhǔn)確率。而且,在車標(biāo)識別過程中,無需生成車標(biāo)圖像的HOG,進(jìn)一步提高了車標(biāo)識別的速度。
進(jìn)一步地,作為本實(shí)施例的另一種實(shí)現(xiàn)方式,本發(fā)明實(shí)施例中,電子設(shè)備識別待識別車標(biāo)對應(yīng)的類別信息時,還可以獲得該待識別車標(biāo)對應(yīng)的類別信息的置信度。如,根據(jù)用戶設(shè)置,待識別車標(biāo)對應(yīng)的類別信息的置信度可以為0-1之間的任一數(shù),如0.11、0.35、0.90、0.98等。置信度較高時,表明該待識別車標(biāo)與其對應(yīng)的類別信息的可信度較高;置信度較低時,表明該待識別車標(biāo)與其對應(yīng)的類別信息的可信度較低。
可以理解的是,當(dāng)電子設(shè)備可以獲得待識別車標(biāo)與其對應(yīng)的類別信息的置信度時,電子設(shè)備在得到待識別車標(biāo)對應(yīng)的類別信息時,可以根據(jù)待識別車標(biāo)對應(yīng)的各類別信息的置信度,按照置信度從大到小的順序,得到預(yù)定數(shù)量的待識別車標(biāo)對應(yīng)的類別信息。
例如,用戶可以預(yù)先進(jìn)行設(shè)置,使電子設(shè)備輸出預(yù)定數(shù)量的待識別車標(biāo)對應(yīng)的類別信息,如3個、4個、7個等。電子設(shè)備在獲得待識別車標(biāo)對應(yīng)的類別信息時,可以根據(jù)用戶設(shè)置,根據(jù)待識別車標(biāo)對應(yīng)的各類別信息的置信度,按照置信度從大到小的順序,得到用戶設(shè)置的預(yù)定數(shù)量的待識別車標(biāo)對應(yīng)的品牌信息。
應(yīng)用本實(shí)施例方案,通過得到待識別車標(biāo)對應(yīng)的類別信息的置信度,用戶可以通過該置信度來判斷該待識別車標(biāo)對應(yīng)的類別信息是否可信,因此,能夠提高車標(biāo)識別的可信度,提高用戶體驗(yàn)。
如圖5所示,本發(fā)明實(shí)施例所提供的一種車標(biāo)識別裝置,可以包括:識別模塊510、生成模塊520、第一處理模塊530,其中,
識別模塊510,用于在包含待識別車標(biāo)的第一圖像中識別所述第一圖像的特征區(qū)域,其中,所述特征區(qū)域?yàn)樗龃R別車標(biāo)所在的區(qū)域;
生成模塊520,用于生成包含所述特征區(qū)域的預(yù)定大小的第二圖像;
第一處理模塊530,用于將所述第二圖像輸入預(yù)先訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型中,得到所述待識別車標(biāo)對應(yīng)的類別信息。
應(yīng)用本實(shí)施例,利用預(yù)先訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型對車標(biāo)直接進(jìn)行識別,由于深度神經(jīng)網(wǎng)絡(luò)模型對圖像的識別速度快、識別準(zhǔn)確率高,因此在車標(biāo)識別過程中能快速準(zhǔn)確的識別出車標(biāo)圖像內(nèi)的車標(biāo),提高了車標(biāo)識別的速度和準(zhǔn)確率。并且,相比于現(xiàn)有技術(shù),在車標(biāo)識別過程中,無需生成車標(biāo)圖像的HOG,進(jìn)一步提高了車標(biāo)識別的速度。
具體地,識別模塊510可以用于:
對所述第一圖像進(jìn)行平滑處理,獲得車牌位置信息;
根據(jù)所述車牌位置信息以及車牌和車標(biāo)之間的位置關(guān)系,確定所述第一圖像的特征區(qū)域。
具體地,生成模塊520可以用于:
生成包含所述特征區(qū)域的第三圖像;
對所述第三圖像進(jìn)行邊緣檢測、均衡化、閾值過濾、圖像開閉運(yùn)算、和縮放處理,確定處理后的圖像為第二圖像。
具體地,第一處理模塊530中的深度神經(jīng)網(wǎng)絡(luò)模型可以為AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型,則所述裝置還可以包括:
確定模塊(圖5中未示出),用于獲取樣本車輛圖像,并確定包含各樣本車輛圖像內(nèi)的車標(biāo)的第一樣本車標(biāo)圖像;
第二處理模塊(圖5中未示出),用于將所述第一樣本車標(biāo)圖像處理成所述預(yù)定大小的第二樣本車標(biāo)圖像;
訓(xùn)練模塊(圖5中未示出),用于將所述第二樣本車標(biāo)圖像,以及與各第二樣本車標(biāo)圖像對應(yīng)的車標(biāo)類別信息作為訓(xùn)練樣本,訓(xùn)練得到所述AlexNet網(wǎng)絡(luò)結(jié)構(gòu)模型。
具體地,所述裝置還可以包括:
獲得模塊(圖5中未示出),用于獲得所述待識別車標(biāo)對應(yīng)的類別信息的置信度;
第一處理模塊530,具體用于根據(jù)所述待識別車標(biāo)對應(yīng)的各類別信息的置信度,按照置信度從大到小的順序,得到預(yù)定數(shù)量的所述待識別車標(biāo)對應(yīng)的類別信息。
對于裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實(shí)體或者操作與另一個實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施方式中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,所述的程序可以存儲于計(jì)算機(jī)可讀取存儲介質(zhì)中,這里所稱得的存儲介質(zhì),如:ROM/RAM、磁碟、光盤等。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。