亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于多目標函數(shù)深度學習的車輛重識別方法及裝置與流程

文檔序號:12064373閱讀:239來源:國知局
基于多目標函數(shù)深度學習的車輛重識別方法及裝置與流程

本發(fā)明涉及車輛識別領(lǐng)域,尤其涉及一種基于多目標函數(shù)深度學習的車輛重識別方法及裝置。



背景技術(shù):

交通車輛作為交通監(jiān)控視頻中的重要組成部分,已經(jīng)被用于研究車輛分類、車輛檢測、車輛跟蹤等相關(guān)問題,但是對于車輛重識別這個問題還是缺乏相應(yīng)的研究。車輛重識別是指從不同的時間與地點所采集的監(jiān)控視頻中,識別出同一個目標車輛。在城市范圍內(nèi),車輛重識別對于研究智能交通與智慧城市等領(lǐng)域有著重要的意義。

研究車輛重識別問題主要存在下列難點:

1)從監(jiān)控系統(tǒng)中采集的圖像與視頻,其質(zhì)量較差,從而會使采集的圖像具有動態(tài)模糊、光照變化等噪聲。

2)在監(jiān)控視頻下,車輛圖像之間的相似度太高。

由于上述兩個難點,只能使用手工設(shè)置的圖像特征的設(shè)置車輛的特征,以便進行重識別,然而,通過手工設(shè)置的圖像特征圖通常是方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征、尺度不變特征變換(Scale-invariant feature transform,SIFT)特征等,這些圖像特征無法滿足監(jiān)控視頻下的車輛重識別需求。



技術(shù)實現(xiàn)要素:

本發(fā)明的主要目的在于提供一種基于多目標函數(shù)深度學習的車輛重識別方法及裝置,旨在解決現(xiàn)有技術(shù)中通過手工設(shè)置圖像特征的方式無法滿足監(jiān)控視頻下的車輛重識別的需求的技術(shù)問題。

為實現(xiàn)上述目的,本發(fā)明第一方面提供一種基于多目標函數(shù)深度學習的車輛重識別方法,該方法包括:

利用基于車輛圖像數(shù)據(jù)集生成的第一類車輛訓練數(shù)據(jù)及預(yù)置的Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架;

利用基于所述車輛圖像數(shù)據(jù)集生成的第二類車輛訓練數(shù)據(jù)及預(yù)置的Triplet Loss三元目標函數(shù)對所述優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到目標深度學習網(wǎng)絡(luò)框架;

根據(jù)所述目標深度學習網(wǎng)絡(luò)框架對待識別的車輛圖像進行重識別。

為實現(xiàn)上述目的,本發(fā)明第二方面提供一種基于多目標函數(shù)深度學習的車輛重識別裝置,該裝置包括:

第一訓練模塊,用于利用基于車輛圖像數(shù)據(jù)集生成的第一類車輛訓練數(shù)據(jù)及預(yù)置的Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架;

第二訓練模塊,用于利用基于所述車輛圖像數(shù)據(jù)集生成的第二類車輛訓練數(shù)據(jù)及預(yù)置的Triplet Loss三元目標函數(shù)對所述優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到目標深度學習網(wǎng)絡(luò)框架;

重識別模塊,用于根據(jù)所述目標深度學習網(wǎng)絡(luò)框架對待識別的車輛圖像進行重識別。

本發(fā)明提供一種基于多目標函數(shù)深度學習的車輛重識別方法,該方法包括:利用基于車輛圖像數(shù)據(jù)集生成的第一類車輛訓練數(shù)據(jù)及預(yù)置的Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架,利用基于車輛圖像數(shù)據(jù)集生成的第二類車輛訓練數(shù)據(jù)及預(yù)置的Triplet Loss三元目標函數(shù)對優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到目標深度學習網(wǎng)絡(luò)框架,根據(jù)該目標深度學習網(wǎng)絡(luò)框架對待識別的車輛圖像進行重識別。相對于現(xiàn)有技術(shù),本發(fā)明使用Softmax目標函數(shù)及Triplet Loss三元目標函數(shù)對深度學習網(wǎng)絡(luò)框架進行訓練,其中,利用Softmax目標函數(shù)對深度學習網(wǎng)絡(luò)框架進行訓練,能夠得到高魯棒性的圖像特征,且考慮到由于Softmax目標函數(shù)是分析類間關(guān)系,而忽略了類內(nèi)關(guān)系,因此使用Triplet Loss三元目標函數(shù)進行學習,可以有效加大類間距離及縮小類內(nèi)距離,使得利用目標深度學習網(wǎng)絡(luò)框架能夠得到具有高魯棒性及高可靠性的圖像特征,以便于進行車輛重識別,提高重識別的效率及準確性,有效滿足監(jiān)控視頻下的車輛重識別的需求。

附圖說明

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明第一實施例中基于多目標函數(shù)深度學習的車輛重識別方法的流程示意圖;

圖2為本發(fā)明第一實施例中步驟103的細化步驟的流程示意圖;

圖3為本發(fā)明第二實施例中基于多目標函數(shù)深度學習的車輛重識別裝置的功能模塊的示意圖;

圖4為本發(fā)明第二實施例中重識別模塊303的細化功能模塊的示意圖。

具體實施方式

為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而非全部實施例?;诒景l(fā)明中的實施例,本領(lǐng)域技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

由于現(xiàn)有技術(shù)中通過手工設(shè)置圖像特征的方式無法滿足監(jiān)控視頻下的車輛重識別的需求的技術(shù)問題。

為了解決上述技術(shù)問題,本發(fā)明提出一種基于多目標函數(shù)深度學習的車輛重識別方法,本發(fā)明使用Softmax目標函數(shù)及Triplet Loss三元目標函數(shù)依次對深度學習網(wǎng)絡(luò)框架進行訓練,其中,利用Softmax目標函數(shù)對深度學習網(wǎng)絡(luò)框架進行訓練,能夠得到高魯棒性的圖像特征,且考慮到由于Softmax目標函數(shù)是分析類間關(guān)系,而忽略了類內(nèi)關(guān)系,因此使用Triplet Loss三元目標函數(shù)進行學習,可以有效加大類間距離及縮小類內(nèi)距離,使得利用二次訓練后的深度學習網(wǎng)絡(luò)框架能夠得到具有高魯棒性及高可靠性的圖像特征,以便于進行車輛重識別,提高重識別的效率及準確性。

請參閱圖1,為本發(fā)明第一實施例中一種基于多目標函數(shù)深度學習的車輛重識別方法的流程示意圖,該方法包括:

步驟101、利用基于車輛圖像數(shù)據(jù)集生成的第一類車輛訓練數(shù)據(jù)及預(yù)置的Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架;

步驟102、利用基于所述車輛圖像數(shù)據(jù)集生成的第二類車輛訓練數(shù)據(jù)及預(yù)置的Triplet Loss三元目標函數(shù)對優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到目標深度學習網(wǎng)絡(luò)框架;

步驟103、根據(jù)所述目標深度學習網(wǎng)絡(luò)框架對待識別的車輛圖像進行重識別。

在本發(fā)明實施例中,深度學習網(wǎng)絡(luò)框架屬于神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)中的一種,其中,網(wǎng)絡(luò)結(jié)構(gòu)中包含多層結(jié)構(gòu)層,層與層之間依次連接,且每一層都有輸入及輸出,從而構(gòu)成一個端到端的結(jié)構(gòu)。其中,該深度學習網(wǎng)絡(luò)框架可以使用Caffe實現(xiàn),或者使用Torch、TensorFlow等框架實現(xiàn)。

在本發(fā)明實施例中,運用Softmax目標函數(shù)優(yōu)化深度學習網(wǎng)絡(luò)框架,使得能夠利用優(yōu)化后的深度學習網(wǎng)絡(luò)框架得到高魯棒性的圖像特征,同時,考慮到車輛重識別并不是典型的分類問題,且Softmax目標函數(shù)是分析類間關(guān)系,而在一定程序上忽略了類內(nèi)關(guān)系。而學習類別之間度量方式的度量學習可以很好的解決這一問題。在度量學習中,其深度學習網(wǎng)絡(luò)框架中含有三個相同前饋網(wǎng)絡(luò)的三元組,并使用Triplet Loss三元目標函數(shù)進行訓練,且在使用Triplet Loss三元目標函數(shù)進行迭代的過程中,能夠同時實現(xiàn)加大類間距離和縮小類內(nèi)距離的目的,本發(fā)明即使用上述Softmax目標函數(shù)及Triplet Loss三元目標函數(shù)對深度學習網(wǎng)絡(luò)框架進行訓練,以便利用訓練后的深度學習網(wǎng)絡(luò)框架得到高魯棒性及高可靠性的圖像特征,便于進行車輛重識別。

由于在深度學習網(wǎng)絡(luò)框架中,需要使用到兩個不同的目標函數(shù),因此,需要分別針對相應(yīng)的目標函數(shù)準備訓練數(shù)據(jù),其中,對于Softmax目標函數(shù),需要準備第一類車輛訓練數(shù)據(jù),該第一類車輛訓練數(shù)據(jù)中包含多組車輛圖像,每一組車輛圖像包含同一車輛的N張不同角度和/或場景下的車輛圖像,該N為正整數(shù)??梢岳斫獾氖?,不同組的車輛圖像使用的標記是不相同的,且屬于同一組的N張車輛圖像的標記是相同的,例如,多組車輛圖像的標記分別為label(0)、label(1)、label(2)、label(3)、……、label(i),i為正整數(shù)。對于Triplet Loss三元目標函數(shù),則需要準備第二類車輛訓練數(shù)據(jù),該第二類車輛訓練數(shù)據(jù)包含多組三元組車輛圖像,且每一組三元組車輛圖像中包含一張目標圖像、具有與所述目標圖像相同標記的正樣本圖像,及具有與所述目標圖像相異的負樣本圖像。

其中,第一類車輛訓練數(shù)據(jù)和第二類車輛訓練數(shù)據(jù)都是基于數(shù)據(jù)庫中已保存的車輛圖像數(shù)據(jù)集生成的,即,車輛重識別裝置能夠利用該車輛圖像數(shù)據(jù)集生成該第一類車輛訓練數(shù)據(jù)及第二類車輛訓練數(shù)據(jù)。

可以預(yù)先保存在數(shù)據(jù)庫中,以便在需要使用的時候獲取。

在本發(fā)明實施例中,上述基于多目標函數(shù)深度學習的車輛重識別方法由對應(yīng)的車輛重識別裝置實現(xiàn),該車輛重識別裝置將利用基于車輛圖像數(shù)據(jù)集生成的第一類車輛訓練數(shù)據(jù)及預(yù)置的Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架。其中,訓練方法可以是卷積神經(jīng)網(wǎng)絡(luò)的訓練方法。

可以理解的是,該預(yù)置的深度學習網(wǎng)絡(luò)框架是初始深度學習網(wǎng)絡(luò)框架,該深度學習網(wǎng)絡(luò)框架中有多層,層與層之間依次連接,且每一層中都有用于進行運算的網(wǎng)絡(luò)參數(shù)。其中,初始深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)的初始值為0。

需要說明的是,在使用Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架進行優(yōu)化訓練時,需要調(diào)整該深度學習網(wǎng)絡(luò)框架的神經(jīng)元的個數(shù),其中,神經(jīng)元的個數(shù)與第一類車輛訓練數(shù)據(jù)包含的車輛圖像的組數(shù)相同。例如,第一類車輛訓練數(shù)據(jù)中包含100組車輛圖像,每一組車輛圖像中包含同一車輛不同角度和/或場景下的8張圖像,則神經(jīng)元的個數(shù)需要調(diào)整為100個。此外,神經(jīng)元是深度學習網(wǎng)絡(luò)框架的網(wǎng)絡(luò)層中的小單元,神經(jīng)元表示輸出向量的維數(shù),例如,若在深度學習網(wǎng)絡(luò)框架中神經(jīng)元的個數(shù)為100,則該深度學習網(wǎng)絡(luò)框架輸出向量的維度為100維。

在本發(fā)明實施例中,在得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架之后,將保持該優(yōu)化后的深度學習網(wǎng)絡(luò)框架的網(wǎng)絡(luò)結(jié)構(gòu)與優(yōu)化后的網(wǎng)絡(luò)參數(shù)不變,再利用基于車輛圖像數(shù)據(jù)集生成的第二類車輛訓練數(shù)據(jù)及預(yù)置的Triplet Loss三元目標函數(shù)對該優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到目標深度學習網(wǎng)絡(luò)框架。

需要說明的是,上述深度學習網(wǎng)絡(luò)框架中包含正則化層,即是該框架中的一個網(wǎng)絡(luò)層,通過該正則化層對優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行歸一化處理,使得能夠有效加快網(wǎng)絡(luò)收斂速度。

其中,通過利用第一類車輛訓練數(shù)據(jù)、Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架進行優(yōu)化訓練,并利用第二類車輛訓練數(shù)據(jù)、Triplet Loss三元目標函數(shù)對優(yōu)化訓練后的深度學習網(wǎng)絡(luò)框架進行訓練,得到目標深度學習網(wǎng)絡(luò)框架,使得利用該目標深度學習網(wǎng)絡(luò)框架處理圖像,能夠得到高魯棒性及高可靠性的圖像特征。

在本發(fā)明實施例中,在得到目標深度學習網(wǎng)絡(luò)框架之后,將根據(jù)該目標深度學習網(wǎng)絡(luò)框架對待識別的車輛圖像進行重識別。

進一步的,請參閱圖2,為本發(fā)明第一實施例中步驟103的細化步驟的流程示意圖,該步驟103的細化步驟包括:

步驟201、將待識別的車輛圖像輸入所述目標深度學習網(wǎng)絡(luò)框架,獲取所述待識別的車輛圖像包含的車輛的圖像特征;

步驟202、利用所述車輛的圖像特征進行重識別。

在本發(fā)明實施例中,車輛重識別裝置將待識別的車輛圖像輸入訓練得到的目標深度學習網(wǎng)絡(luò)框架,該目標深度學習網(wǎng)絡(luò)框架將基于其內(nèi)各層訓練得到的網(wǎng)絡(luò)參數(shù)對該車輛圖像進行處理,并輸出處理得到的圖像特征,以便車輛重識別裝置獲取到該圖像特征,并利用該圖像特征進行重識別。其中,重識別是指利用該圖像特征與其他的車輛圖像特征進行匹配,將圖像特征匹配的車輛圖像作為同一車輛的車輛圖像。

本發(fā)明實施例中,車輛重識別裝置利用基于車輛圖像數(shù)據(jù)集生成的第一類車輛訓練數(shù)據(jù)及預(yù)置的Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架,利用基于所述車輛圖像數(shù)據(jù)集生成的第二類車輛訓練數(shù)據(jù)及預(yù)置的Triplet Loss三元目標函數(shù)對優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到目標深度學習網(wǎng)絡(luò)框架,根據(jù)該目標深度學習網(wǎng)絡(luò)框架對待識別的車輛圖像進行重識別。相對于現(xiàn)有技術(shù),本發(fā)明使用Softmax目標函數(shù)及Triplet Loss三元目標函數(shù)對深度學習網(wǎng)絡(luò)框架進行訓練,其中,利用Softmax目標函數(shù)對深度學習網(wǎng)絡(luò)框架進行訓練,能夠得到高魯棒性的圖像特征,且考慮到由于Softmax目標函數(shù)是分析類間關(guān)系,而忽略了類內(nèi)關(guān)系,因此使用Triplet Loss三元目標函數(shù)進行學習,可以有效加大類間距離及縮小類內(nèi)距離,使得利用目標深度學習網(wǎng)絡(luò)框架能夠得到具有高魯棒性及高可靠性的圖像特征,以便于進行車輛重識別,提高重識別的效率及準確性,有效滿足監(jiān)控視頻下的車輛重識別的需求。

請參閱圖3,為本發(fā)明第二實施例中基于多目標函數(shù)深度學習的車輛重識別裝置的功能模塊的示意圖,該裝置包括:

第一訓練模塊301,用于利用基于車輛圖像數(shù)據(jù)集生成的第一類車輛訓練數(shù)據(jù)及預(yù)置的Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架;

第二訓練模塊302,用于利用基于所述車輛圖像數(shù)據(jù)集生成的第二類車輛訓練數(shù)據(jù)及預(yù)置的Triplet Loss三元目標函數(shù)對所述優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到目標深度學習網(wǎng)絡(luò)框架;

重識別模塊303,用于根據(jù)所述目標深度學習網(wǎng)絡(luò)框架對待識別的車輛圖像進行重識別。

在本發(fā)明實施例中,深度學習網(wǎng)絡(luò)框架屬于神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)中的一種,其中,網(wǎng)絡(luò)結(jié)構(gòu)中包含多層結(jié)構(gòu)層,層與層之間依次連接,且每一層都有輸入及輸出,從而構(gòu)成一個端到端的結(jié)構(gòu)。其中,該深度學習網(wǎng)絡(luò)框架可以使用Caffe實現(xiàn),或者使用Torch、TensorFlow等框架實現(xiàn)。

在本發(fā)明實施例中,運用Softmax目標函數(shù)優(yōu)化深度學習網(wǎng)絡(luò)框架,使得能夠利用優(yōu)化后的深度學習網(wǎng)絡(luò)框架得到高魯棒性的圖像特征,同時,考慮到車輛重識別并不是典型的分類問題,且Softmax目標函數(shù)是分析類間關(guān)系,而在一定程序上忽略了類內(nèi)關(guān)系。而學習類別之間度量方式的度量學習可以很好的解決這一問題。在度量學習中,其深度學習網(wǎng)絡(luò)框架中含有三個相同前饋網(wǎng)絡(luò)的三元組,并使用Triplet Loss三元目標函數(shù)進行訓練,且在使用Triplet Loss三元目標函數(shù)進行迭代的過程中,能夠同時實現(xiàn)加大類間距離和縮小類內(nèi)距離的目的,本發(fā)明即使用上述Softmax目標函數(shù)及Triplet Loss三元目標函數(shù)對深度學習網(wǎng)絡(luò)框架進行訓練,以便利用訓練后的深度學習網(wǎng)絡(luò)框架得到高魯棒性及高可靠性的圖像特征,便于進行車輛重識別。

由于在深度學習網(wǎng)絡(luò)框架中,需要使用到兩個不同的目標函數(shù),因此,需要分別針對相應(yīng)的目標函數(shù)準備訓練數(shù)據(jù),其中,對于Softmax目標函數(shù),需要準備第一類車輛訓練數(shù)據(jù),該第一類車輛訓練數(shù)據(jù)中包含多組車輛圖像,每一組車輛圖像包含同一車輛的N張不同角度和/或場景下的車輛圖像,該N為正整數(shù)??梢岳斫獾氖牵煌M的車輛圖像使用的標記是不相同的,且屬于同一組的N張車輛圖像的標記是相同的,例如,多組車輛圖像的標記分別為label(0)、label(1)、label(2)、label(3)、……、label(i),i為正整數(shù)。對于Triplet Loss三元目標函數(shù),則需要準備第二類車輛訓練數(shù)據(jù),該第二類車輛訓練數(shù)據(jù)包含多組三元組車輛圖像,且每一組三元組車輛圖像中包含一張目標圖像、具有與所述目標圖像相同標記的正樣本圖像,及具有與所述目標圖像相異的負樣本圖像。

在本發(fā)明實施例中,第一訓練模塊301將利用基于車輛圖像數(shù)據(jù)集生成的第一類車輛訓練數(shù)據(jù)及預(yù)置的Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架。其中,訓練方法可以是卷積神經(jīng)網(wǎng)絡(luò)的訓練方法。

可以理解的是,該預(yù)置的深度學習網(wǎng)絡(luò)框架是初始深度學習網(wǎng)絡(luò)框架,該深度學習網(wǎng)絡(luò)框架中有多層,層與層之間依次連接,且每一層中都有用于進行運算的網(wǎng)絡(luò)參數(shù)。其中,初始深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)的初始值為0。

需要說明的是,在使用Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架進行優(yōu)化訓練時,需要調(diào)整該深度學習網(wǎng)絡(luò)框架的神經(jīng)元的個數(shù),其中,神經(jīng)元的個數(shù)與第一類車輛訓練數(shù)據(jù)包含的車輛圖像的組數(shù)相同。例如,第一類車輛訓練數(shù)據(jù)中包含100組車輛圖像,每一組車輛圖像中包含同一車輛不同角度和/或場景下的8張圖像,則神經(jīng)元的個數(shù)需要調(diào)整為100個。此外,神經(jīng)元是深度學習網(wǎng)絡(luò)框架的網(wǎng)絡(luò)層中的小單元,神經(jīng)元表示輸出向量的維數(shù),例如,若在深度學習網(wǎng)絡(luò)框架中神經(jīng)元的個數(shù)為100,則該深度學習網(wǎng)絡(luò)框架輸出向量的維度為100維。

在本發(fā)明實施例中,在得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架之后,將保持該優(yōu)化后的深度學習網(wǎng)絡(luò)框架的網(wǎng)絡(luò)結(jié)構(gòu)與優(yōu)化后的網(wǎng)絡(luò)參數(shù)不變,第二訓練模塊302利用基于車輛圖像數(shù)據(jù)集生成的第二類車輛訓練數(shù)據(jù)及預(yù)置的Triplet Loss三元目標函數(shù)對該優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到目標深度學習網(wǎng)絡(luò)框架。

需要說明的是,上述深度學習網(wǎng)絡(luò)框架中包含正則化層,即是該框架中的一個網(wǎng)絡(luò)層,通過該正則化層對優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行歸一化處理,使得能夠有效加快網(wǎng)絡(luò)收斂速度。

其中,通過利用第一類車輛訓練數(shù)據(jù)、Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架進行優(yōu)化訓練,并利用第二類車輛訓練數(shù)據(jù)、Triplet Loss三元目標函數(shù)對優(yōu)化訓練后的深度學習網(wǎng)絡(luò)框架進行訓練,得到目標深度學習網(wǎng)絡(luò)框架,使得利用該目標深度學習網(wǎng)絡(luò)框架處理圖像,能夠得到高魯棒性及高可靠性的圖像特征。

在本發(fā)明實施例中,在得到目標深度學習網(wǎng)絡(luò)框架之后,重識別模塊303將根據(jù)該目標深度學習網(wǎng)絡(luò)框架對待識別的車輛圖像進行重識別。

請參閱圖4,為本發(fā)明第二實施例中重識別模塊303的細化功能模塊的示意圖,該重識別模塊303包括:

特征提取模塊401,用于將待識別的車輛圖像輸入所述目標深度學習網(wǎng)絡(luò)框架,獲取所述待識別的車輛圖像包含的車輛的圖像特征;

子重識別模塊402,用于利用所述車輛的圖像特征進行重識別。

在本發(fā)明實施例中,特征提取模塊401將待識別的車輛圖像輸入訓練得到的目標深度學習網(wǎng)絡(luò)框架,該目標深度學習網(wǎng)絡(luò)框架將基于其內(nèi)各層訓練得到的網(wǎng)絡(luò)參數(shù)對該車輛圖像進行處理,并輸出處理得到的圖像特征,以便特征提取模塊401獲取到該圖像特征,并由子重識別模塊402利用該圖像特征進行重識別。其中,重識別是指利用該圖像特征與其他的車輛圖像特征進行匹配,將圖像特征匹配的車輛圖像作為同一車輛的車輛圖像。

本發(fā)明實施例中,車輛重識別裝置利用基于車輛圖像數(shù)據(jù)集生成的第一類車輛訓練數(shù)據(jù)及預(yù)置的Softmax目標函數(shù)對預(yù)置的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到優(yōu)化后的深度學習網(wǎng)絡(luò)框架,利用基于所述車輛圖像數(shù)據(jù)集生成的第二類車輛訓練數(shù)據(jù)及預(yù)置的Triplet Loss三元目標函數(shù)對優(yōu)化后的深度學習網(wǎng)絡(luò)框架中的網(wǎng)絡(luò)參數(shù)進行訓練,得到目標深度學習網(wǎng)絡(luò)框架,根據(jù)該目標深度學習網(wǎng)絡(luò)框架對待識別的車輛圖像進行重識別。相對于現(xiàn)有技術(shù),本發(fā)明使用Softmax目標函數(shù)及Triplet Loss三元目標函數(shù)對深度學習網(wǎng)絡(luò)框架進行訓練,其中,利用Softmax目標函數(shù)對深度學習網(wǎng)絡(luò)框架進行訓練,能夠得到高魯棒性的圖像特征,且考慮到由于Softmax目標函數(shù)是分析類間關(guān)系,而忽略了類內(nèi)關(guān)系,因此使用Triplet Loss三元目標函數(shù)進行學習,可以有效加大類間距離及縮小類內(nèi)距離,使得利用目標深度學習網(wǎng)絡(luò)框架能夠得到具有高魯棒性及高可靠性的圖像特征,以便于進行車輛重識別,提高重識別的效率及準確性,有效滿足監(jiān)控視頻下的車輛重識別的需求。

可以理解的是,相對于現(xiàn)有技術(shù),本發(fā)明實施例中將三元度量學習的方法(Triplet Loss三元目標函數(shù))引入到車輛重識別領(lǐng)域中,并結(jié)合Softmax目標函數(shù),以便可以得到高魯棒性及高可靠性的圖像特征,應(yīng)用在車輛重識別中,能夠有效的提高重識別的準確率,滿足視頻監(jiān)控中車輛重識別的需求。

在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述模塊的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個模塊或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或模塊的間接耦合或通信連接,可以是電性,機械或其它的形式。

所述作為分離部件說明的模塊可以是或者也可以不是物理上分開的,作為模塊顯示的部件可以是或者也可以不是物理模塊,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)模塊上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。

另外,在本發(fā)明各個實施例中的各功能模塊可以集成在一個處理模塊中,也可以是各個模塊單獨物理存在,也可以兩個或兩個以上模塊集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。

所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

需要說明的是,對于前述的各方法實施例,為了簡便描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其它順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定都是本發(fā)明所必須的。

在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其它實施例的相關(guān)描述。

以上為對本發(fā)明所提供的一種基于多目標函數(shù)深度學習的車輛重識別方法及裝置的描述,對于本領(lǐng)域的技術(shù)人員,依據(jù)本發(fā)明實施例的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處,綜上,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1