基于上下文信息特征融合更新目標(biāo)圖像的數(shù)據(jù)處理方法與流程

文檔序號：40398570發(fā)布日期：2024-12-20 12:22閱讀：6來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于上下文信息特征融合更新目標(biāo)圖像的數(shù)據(jù)處理方法與流程

本發(fā)明涉及計算機(jī)視覺，尤其涉及一種基于上下文信息特征融合更新目標(biāo)圖像的數(shù)據(jù)處理方法。

背景技術(shù)：

1、單目標(biāo)跟蹤是計算機(jī)視覺中一個被廣泛研究的話題，其核心概念是僅利用目標(biāo)的初始位置信息，在后續(xù)視頻序列中準(zhǔn)確估計物體在任何給定時刻的位置。目標(biāo)跟蹤廣泛應(yīng)用于自動駕駛、機(jī)器人和視頻監(jiān)控等領(lǐng)域，隨著深度學(xué)習(xí)技術(shù)的引入，其性能得到了顯著提升，促進(jìn)了其在現(xiàn)實場景中的廣泛應(yīng)用。

2、近年來，基于深度學(xué)習(xí)的目標(biāo)跟蹤取得了重大進(jìn)展，其中孿生網(wǎng)絡(luò)是最成功的追蹤框架之一。它將視覺對象跟蹤任務(wù)定義為目標(biāo)匹配問題，旨在學(xué)習(xí)目標(biāo)模板與搜索區(qū)域之間的一般相似性圖。孿生網(wǎng)絡(luò)跟蹤器由模板分支和檢測分支組成。模板分支輸入初始目標(biāo)圖像，檢測分支輸入當(dāng)前幀圖像面片。這兩個分支共享卷積神經(jīng)網(wǎng)絡(luò)(cnn)參數(shù)，相同的變換擬合來查找搜索區(qū)域中的目標(biāo)。

3、但當(dāng)前大多數(shù)孿生網(wǎng)絡(luò)都是離線學(xué)習(xí)的，在第一幀中選擇目標(biāo)圖像作為跟蹤模版，并且在跟蹤過程中不會更新模板。當(dāng)跟蹤目標(biāo)的外觀發(fā)生重大變化時，諸如：處于運動、變形、遮擋等變化和復(fù)雜的環(huán)境之中，容易造成跟蹤目標(biāo)丟失。即目標(biāo)外觀或特征的變化會嚴(yán)重影響算法的跟蹤效果。

技術(shù)實現(xiàn)思路

1、鑒于上述的分析，本發(fā)明實施例旨在提供一種基于上下文信息特征融合更新目標(biāo)圖像的數(shù)據(jù)處理方法，用以解決現(xiàn)有當(dāng)跟蹤目標(biāo)的外觀發(fā)生重大變化時造成跟蹤目標(biāo)丟失的問題。

2、本發(fā)明的目的主要是通過以下技術(shù)方案實現(xiàn)的：

3、本發(fā)明提供了一種基于上下文信息特征融合更新目標(biāo)圖像的數(shù)據(jù)處理方法，其特征在于，包括如下步驟：

4、獲取包括待跟蹤目標(biāo)的視頻圖像序列和待跟蹤目標(biāo)圖像；

5、將所述待跟蹤目標(biāo)圖像和所述視頻圖像序列輸入訓(xùn)練好的目標(biāo)跟蹤模型，得到目標(biāo)跟蹤結(jié)果；其中，所述目標(biāo)跟蹤模型用于利用目標(biāo)模板特征跟蹤視頻圖像序列中每幀圖像得到待跟蹤目標(biāo)；所述目標(biāo)模板特征根據(jù)所述視頻圖像序列中各幀圖像識別的目標(biāo)區(qū)域的置信分?jǐn)?shù)動態(tài)更新。

6、進(jìn)一步的，基于所述待跟蹤目標(biāo)圖像與目標(biāo)模板特征集生成所述目標(biāo)模板特征；其中，所述目標(biāo)模板特征集的初始值為若干所述待跟蹤目標(biāo)圖像的特征副本；

7、根據(jù)所述視頻圖像序列中各幀圖像識別的目標(biāo)區(qū)域的置信分?jǐn)?shù)動態(tài)更新目標(biāo)模板特征，包括：

8、基于當(dāng)前的目標(biāo)模板特征識別得到當(dāng)前幀圖像的目標(biāo)區(qū)域，及當(dāng)前幀圖像的目標(biāo)區(qū)域的置信分?jǐn)?shù)；

9、當(dāng)所述置信分?jǐn)?shù)大于歷史幀的目標(biāo)區(qū)域的置信分?jǐn)?shù)的均值時，用所述目標(biāo)區(qū)域中的目標(biāo)圖像特征替換其中的一個特征副本以更新所述目標(biāo)模板特征集。

10、進(jìn)一步的，基于所述待跟蹤目標(biāo)圖像與目標(biāo)模板特征集生成所述目標(biāo)模板特征，包括：

11、提取所述待跟蹤目標(biāo)圖像的特征；

12、將所述待跟蹤目標(biāo)圖像的特征與目標(biāo)模板特征集中的目標(biāo)模板特征進(jìn)行特征拼接，得到拼接后特征；

13、所述拼接后特征依次通過兩個二維卷積層，對所述拼接后特征進(jìn)行降維操作，得到降維后特征；

14、基于所述降維后特征，通過動態(tài)卷積方法得到動態(tài)卷積層的各卷積核的網(wǎng)絡(luò)權(quán)重，計算得到動態(tài)卷積層中卷積核的加權(quán)和；

15、所述動態(tài)卷積層中卷積核的加權(quán)和與所述降維后特征進(jìn)行卷積操作，得到卷積后特征；

16、所述卷積后特征通過批歸一化和激活函數(shù)得到目標(biāo)模板特征。

17、進(jìn)一步的，基于所述降維后特征，通過動態(tài)卷積方法得到動態(tài)卷積層的各卷積核的網(wǎng)絡(luò)權(quán)重，包括：

18、對所述降維后特征進(jìn)行平均池化操作，進(jìn)一步降低特征的空間維度；

19、平均池化操作后的特征通過全連接層，得到動態(tài)卷積層的各卷積核的權(quán)重系數(shù)；

20、將動態(tài)卷積層的各卷積核的權(quán)重系數(shù)通過sigmoid激活函數(shù)進(jìn)行權(quán)重歸一化，得到動態(tài)卷積層的各卷積核的網(wǎng)絡(luò)權(quán)重。

21、進(jìn)一步的，利用目標(biāo)模板特征跟蹤視頻圖像序列中每幀圖像中的待跟蹤目標(biāo)，包括:

22、以前一幀圖像的目標(biāo)區(qū)域為中心裁剪預(yù)設(shè)尺寸得到當(dāng)前幀圖像的搜索區(qū)域；

23、提取所述當(dāng)前幀圖像搜索區(qū)域的圖像特征后與所述目標(biāo)模板特征進(jìn)行互操作得到當(dāng)前幀圖像搜索區(qū)域的特征響應(yīng)圖；

24、基于所述當(dāng)前幀圖像搜索區(qū)域的特征響應(yīng)圖和目標(biāo)區(qū)域尺寸，使用分類回歸預(yù)測出當(dāng)前幀圖像的目標(biāo)邊界框，標(biāo)識預(yù)測的目標(biāo)區(qū)域；其中，所述目標(biāo)區(qū)域的信息包括目標(biāo)區(qū)域位置、目標(biāo)區(qū)域響應(yīng)分?jǐn)?shù)和平均峰值相關(guān)能量。

25、進(jìn)一步的，使用下式計算所述目標(biāo)區(qū)域的平均峰值相關(guān)能量：

26、

27、其中，fmax表示當(dāng)前幀圖像搜索區(qū)域的特征響應(yīng)圖中最高響應(yīng)值；fmin表示當(dāng)前幀圖像搜索區(qū)域的特征響應(yīng)圖中最低響應(yīng)值；nanchors表示當(dāng)前幀圖像搜索區(qū)域的候選錨點框的個數(shù)；fi表示第i個候選錨點框的響應(yīng)值；

28、所述候選錨點框為以當(dāng)前幀圖像搜索區(qū)域的各像素為中心，預(yù)設(shè)尺寸的窗口；

29、所述候選錨點框的響應(yīng)值為所述候選錨點框與所述目標(biāo)區(qū)域的交并比。

30、進(jìn)一步的，所述得到當(dāng)前幀圖像的目標(biāo)區(qū)域的置信分?jǐn)?shù)，包括：將當(dāng)前幀圖像的目標(biāo)區(qū)域的位置、目標(biāo)區(qū)域響應(yīng)分?jǐn)?shù)、平均峰值相關(guān)能量與前一幀圖像的目標(biāo)區(qū)域的位置、前一幀圖像的目標(biāo)區(qū)域位置與當(dāng)前幀圖像目標(biāo)區(qū)域位置的交并比依次通過3個包含激活函數(shù)的全連接層，得到當(dāng)前幀圖像的目標(biāo)區(qū)域的置信分?jǐn)?shù)。

31、進(jìn)一步的，所述待跟蹤目標(biāo)的圖像由所述包括待跟蹤目標(biāo)的視頻圖像序列的第一幀圖像截取得到。

32、進(jìn)一步的，所述目標(biāo)跟蹤模型包括目標(biāo)模板特征生成模塊、目標(biāo)跟蹤模塊和置信度評估模塊，通過下述方法訓(xùn)練得到：

33、分別構(gòu)建目標(biāo)模板特征生成模塊、目標(biāo)跟蹤模塊和置信度評估模塊的訓(xùn)練數(shù)據(jù)集；其中，所述目標(biāo)模板特征生成模塊的訓(xùn)練數(shù)據(jù)集包括樣本視頻圖像和各幀圖像對應(yīng)的實際目標(biāo)圖像；所述目標(biāo)跟蹤模塊的訓(xùn)練數(shù)據(jù)集包括與所述目標(biāo)模板特征生成模塊的訓(xùn)練數(shù)據(jù)集相同的樣本視頻圖像和標(biāo)注好的各幀圖像的目標(biāo)區(qū)域；所述置信度評估模塊的訓(xùn)練數(shù)據(jù)集包括各幀圖像的目標(biāo)區(qū)域和標(biāo)注好的置信度分?jǐn)?shù)；

34、加載所述目標(biāo)模板特征生成模塊的訓(xùn)練數(shù)據(jù)集，利用改進(jìn)的結(jié)構(gòu)相似性指數(shù)度量函數(shù)訓(xùn)練所述目標(biāo)模板特征生成模塊，使用隨機(jī)梯度下降法進(jìn)行反向傳播更新所述目標(biāo)模板特征生成模塊的參數(shù)，得到訓(xùn)練好的目標(biāo)模板特征生成模塊；

35、加載所述目標(biāo)跟蹤模塊的訓(xùn)練數(shù)據(jù)集，利用交叉熵?fù)p失函數(shù)訓(xùn)練所述目標(biāo)跟蹤模塊，使用隨機(jī)梯度下降法進(jìn)行反向傳播更新所述目標(biāo)跟蹤模塊的參數(shù)，得到訓(xùn)練好的目標(biāo)跟蹤模塊；

36、加載所述置信度評估模塊的訓(xùn)練數(shù)據(jù)集，利用交叉熵?fù)p失函數(shù)訓(xùn)練所述置信度評估模塊，使用隨機(jī)梯度下降法進(jìn)行反向傳播更新所述置信度評估模塊的參數(shù)，得到訓(xùn)練好的置信度評估模塊；

37、基于所述訓(xùn)練好的目標(biāo)模板特征生成模塊、所述訓(xùn)練好的目標(biāo)跟蹤模塊和所述訓(xùn)練好的置信度評估模塊，得到訓(xùn)練好的目標(biāo)跟蹤模型。

38、進(jìn)一步的，所述改進(jìn)的結(jié)構(gòu)相似性指數(shù)度量函數(shù)，其公式如下：

39、

40、

41、其中，tx表示目標(biāo)模板特征生成模塊生成的目標(biāo)模板特征圖；ty表示實際目標(biāo)圖像的特征圖；c表示特征圖的通道數(shù)；m表示特征圖的第m個通道；n表示特征值數(shù)量；n表示第n個特征值。

42、與現(xiàn)有技術(shù)相比，本發(fā)明至少可實現(xiàn)如下有益效果之一：

43、1、本發(fā)明通過使用目標(biāo)特征值和最新且可靠的特征模板集來生成預(yù)測目標(biāo)模板特征，融合了最近的目標(biāo)變化信息，可以獲得更準(zhǔn)確的更新模板，初始目標(biāo)和多個包含目標(biāo)圖像的特征進(jìn)行融合有助于得到更準(zhǔn)確的目標(biāo)描述。

44、2、本發(fā)明通過不斷更新目標(biāo)模板特征，當(dāng)跟蹤目標(biāo)的外觀發(fā)生重大變化時，諸如：處于運動、變形、遮擋等變化和復(fù)雜的環(huán)境之中，不容易造成跟蹤目標(biāo)丟失，即目標(biāo)外觀或特征的變化時依舊可以跟蹤。

45、3、本發(fā)明通過跟蹤目標(biāo)的置信度分?jǐn)?shù)來判斷是否更新特征模板集，從而確保使用高質(zhì)量的目標(biāo)特征進(jìn)行更新，并減少因添加不可靠目標(biāo)而引起的噪聲，從而增強(qiáng)模型的抗漂移能力。

46、4、本發(fā)明通過目標(biāo)模板特征生成模塊，使用動態(tài)卷積學(xué)習(xí)每組時空信息的特定卷積核參數(shù)，可以增加模型的大小和容量，同時保障跟蹤過程的效率和實時性。

47、5、本發(fā)明通過最小化改進(jìn)的結(jié)構(gòu)相似性指數(shù)度量(ssim)作為損失函數(shù)，增強(qiáng)了模型對目標(biāo)特征和搜索幀圖像特征之間相似度的敏感性，有助于提高跟蹤的穩(wěn)定性。

48、本發(fā)明中，上述各技術(shù)方案之間還可以相互組合，以實現(xiàn)更多的優(yōu)選組合方案。本發(fā)明的其他特征和優(yōu)點將在隨后的說明書中闡述，并且，部分優(yōu)點可從說明書中變得顯而易見，或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過說明書以及附圖中所特別指出的內(nèi)容中來實現(xiàn)和獲得。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：姜尚東,段正軒,吳志成,周少磊,韓偉,馬語菡
技術(shù)所有人：北京京航計算通訊研究所
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于上下文信息特征融合更新目標(biāo)圖像的數(shù)據(jù)處理方法與流程