1.一種基于卷積神經(jīng)網(wǎng)絡(luò)的目標跟蹤方法,其特征在于,包括:
S1,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),該卷積神經(jīng)網(wǎng)絡(luò)包括多個特征共享層和一個特定分類層;
S2,進行離線訓(xùn)練,對于不同的帶有目標標注的視頻序列,采用不同的特定分類層與特征共享層進行訓(xùn)練并更新網(wǎng)絡(luò)的參數(shù),該網(wǎng)絡(luò)的參數(shù)包括特定分類層的參數(shù)以及特征共享層的參數(shù),直到網(wǎng)絡(luò)收斂或者達到預(yù)先設(shè)定的迭代次數(shù);
S3,對卷積神經(jīng)網(wǎng)絡(luò)更新并使用卷積神經(jīng)網(wǎng)絡(luò)從視頻幀中獲取最優(yōu)的區(qū)域設(shè)為跟蹤區(qū)域,具體步驟包括:
S31,以當前目標位置作為輸入,保持特征共享層的參數(shù)不變,使用新的特定分類層與特征共享層組成新的卷積神經(jīng)網(wǎng)絡(luò);
S32,在當前目標位置周圍區(qū)域隨機選取多個區(qū)域作為正樣本,另外的多個區(qū)域作為負樣本,保持部分特征共享層的參數(shù)不變進行訓(xùn)練更新,調(diào)整部分特征共享層的參數(shù)以及新的特定分類層的參數(shù);
S33,從視頻幀中根據(jù)高斯分布隨機生成多個跟蹤候選區(qū)域;
S34,使用卷積神經(jīng)網(wǎng)絡(luò)對多個跟蹤候選區(qū)域評分,從中獲取最優(yōu)候選區(qū)域;
S35,若最優(yōu)候選區(qū)域的評分大于一閾值,則將該最優(yōu)候選區(qū)域設(shè)為跟蹤區(qū)域,對跟蹤區(qū)域進行標注,否則跳轉(zhuǎn)至步驟S32,直至滿足最優(yōu)候選區(qū)域的評分大于一閾值,則將該最優(yōu)候選區(qū)域設(shè)為跟蹤區(qū)域,對跟蹤區(qū)域進行標注。
2.根據(jù)權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的目標跟蹤方法,其特征在于,所述的步驟S31還包括分別設(shè)定新的卷積神經(jīng)網(wǎng)絡(luò)的更新時間以及更新周期,設(shè)當前的時間為t,該更新時間包括短更新時間ts以及長更新時間tl,該更新周期包括短更新周期Ts以及長更新周期Tl,并在執(zhí)行所述的步驟S34后,執(zhí)行如下步驟:
S36,若最優(yōu)候選區(qū)域的評分大于一閾值,則將該最優(yōu)候選區(qū)域設(shè)為跟蹤區(qū)域,并且當前時間t=t+1,否則跳轉(zhuǎn)至步驟S32,直至滿足最優(yōu)候選區(qū)域的評分大于一閾值,則將該最優(yōu)候選區(qū)域設(shè)為跟蹤區(qū)域,對跟蹤區(qū)域進行標注;
S37,如果ts>TS,則ts=1,tl=tl+1,并跳轉(zhuǎn)至步驟S32,如果tl>Tl,則ts=ts+1,tl=1,并跳轉(zhuǎn)至步驟S32,否則ts=ts+1,tl=tl+1,并跳轉(zhuǎn)至步驟S33。
3.根據(jù)權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的目標跟蹤方法,其特征在于,所述的特征共享層包括卷積層和前兩個全連接層,所述的特定分類層為作為卷積神經(jīng)網(wǎng)絡(luò)輸出的第三個全連接層。
4.根據(jù)權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的目標跟蹤方法,其特征在于,所述的步驟S32中在當前目標位置周圍區(qū)域隨機選取多個區(qū)域作為正樣本,另外的多個區(qū)域作為負樣本具體指的是:在視頻序列中每一幀的標注目標矩形框周圍區(qū)域,選取若干IoU≥0.8的區(qū)域作為正樣本,選取若干IoU≤0.5的區(qū)域作為負樣本。
5.一種基于卷積神經(jīng)網(wǎng)絡(luò)的目標跟蹤裝置,包括:
處理器以及存儲器;
所述存儲器用于存儲程序;
所述處理器用于執(zhí)行所述存儲器中的程序,使得所述目標跟蹤裝置執(zhí)行上述權(quán)利要求1至4任意一項所述的基于卷積神經(jīng)網(wǎng)絡(luò)的目標跟蹤方法。