基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法、裝置及設(shè)備與流程

文檔序號(hào)：40388026發(fā)布日期：2024-12-20 12:10閱讀：5來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法、裝置及設(shè)備與流程

本公開屬于圖像處理，本公開尤其涉及一種基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法、裝置及設(shè)備。

背景技術(shù)：

1、行人重識(shí)別是指對(duì)于同一個(gè)人在不同畫面中的影像進(jìn)行匹配，從而識(shí)別畫面中目標(biāo)的身份和行進(jìn)路線，其廣泛應(yīng)用于自動(dòng)化人員追蹤場(chǎng)景，在安全監(jiān)控、人流分析、智能交通等領(lǐng)域扮演著日益重要的角色。在目前的技術(shù)方案中，部分行人重識(shí)別方法通過(guò)結(jié)合行人的多種特征（如顏色、紋理、運(yùn)動(dòng)等信息）以進(jìn)行行人識(shí)別。然而，上述方式往往需要復(fù)雜的數(shù)據(jù)預(yù)處理和特征工程，且在融合不同模態(tài)信息時(shí)容易面臨信息丟失或不一致的問(wèn)題。由此，如何在提高行人重識(shí)別的效率的同時(shí)，保證行人重識(shí)別的準(zhǔn)確性成為了亟待解決的技術(shù)問(wèn)題。

技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)的實(shí)施例提供了一種基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法、裝置及設(shè)備，進(jìn)而至少在一定程度上可以在提高行人重識(shí)別的效率的同時(shí)，保證行人重識(shí)別的準(zhǔn)確性。

2、本申請(qǐng)的其他特性和優(yōu)點(diǎn)將通過(guò)下面的詳細(xì)描述變得顯然，或部分地通過(guò)本申請(qǐng)的實(shí)踐而習(xí)得。

3、根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面，提供了一種基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法，包括：

4、獲取針對(duì)目標(biāo)區(qū)域進(jìn)行拍攝得到的若干監(jiān)控畫面；

5、將若干所述監(jiān)控畫面作為預(yù)先訓(xùn)練完成的多模態(tài)目標(biāo)檢測(cè)模型的輸入，以使所述多模態(tài)目標(biāo)檢測(cè)模型根據(jù)各所述監(jiān)控畫面進(jìn)行檢測(cè)，確定其所包含的行人以及提取各所述行人對(duì)應(yīng)的深度特征集合，根據(jù)每一所述行人對(duì)應(yīng)的深度特征集合進(jìn)行識(shí)別，確定各所述行人對(duì)應(yīng)的外貌特征標(biāo)簽以及各所述外貌特征標(biāo)簽對(duì)應(yīng)的深度特征；

6、將與目標(biāo)檢索對(duì)象的外貌特征標(biāo)簽全部相同的行人確定為待識(shí)別人員，所述目標(biāo)檢索對(duì)象為從任一所述監(jiān)控畫面包含的行人中指定得到；

7、基于目標(biāo)跟蹤算法，確定所述目標(biāo)檢索對(duì)象以及各所述待識(shí)別人員在各自監(jiān)控畫面中的運(yùn)動(dòng)軌跡；

8、根據(jù)所述目標(biāo)檢索對(duì)象在其運(yùn)動(dòng)軌跡上的所有外貌特征標(biāo)簽和深度特征，以及各所述待識(shí)別人員在其運(yùn)動(dòng)軌跡上的所有外貌特征標(biāo)簽和深度特征，確定所述目標(biāo)檢索對(duì)象與各所述待識(shí)別人員之間的軌跡相似度；

9、將所述軌跡相似度大于或等于預(yù)定閾值的待識(shí)別人員確定為目標(biāo)檢索對(duì)象。

10、根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面，提供了一種基于多模態(tài)語(yǔ)義信息的行人重識(shí)別裝置，包括：

11、獲取模塊，用于獲取針對(duì)目標(biāo)區(qū)域進(jìn)行拍攝得到的若干監(jiān)控畫面；

12、提取模塊，用于將若干所述監(jiān)控畫面作為預(yù)先訓(xùn)練完成的多模態(tài)目標(biāo)檢測(cè)模型的輸入，以使所述多模態(tài)目標(biāo)檢測(cè)模型根據(jù)各所述監(jiān)控畫面進(jìn)行檢測(cè)，確定其所包含的行人以及提取各所述行人對(duì)應(yīng)的深度特征集合，根據(jù)每一所述行人對(duì)應(yīng)的深度特征集合進(jìn)行識(shí)別，確定各所述行人對(duì)應(yīng)的外貌特征標(biāo)簽以及各所述外貌特征標(biāo)簽對(duì)應(yīng)的深度特征；

13、篩選模塊，用于將與目標(biāo)檢索對(duì)象的外貌特征標(biāo)簽全部相同的行人確定為待識(shí)別人員，所述目標(biāo)檢索對(duì)象為從任一所述監(jiān)控畫面包含的行人中指定得到；

14、跟蹤模塊，用于基于目標(biāo)跟蹤算法，確定所述目標(biāo)檢索對(duì)象以及各所述待識(shí)別人員在各自監(jiān)控畫面中的運(yùn)動(dòng)軌跡；

15、計(jì)算模塊，用于根據(jù)所述目標(biāo)檢索對(duì)象在其運(yùn)動(dòng)軌跡上的所有外貌特征標(biāo)簽和深度特征，以及各所述待識(shí)別人員在其運(yùn)動(dòng)軌跡上的所有外貌特征標(biāo)簽和深度特征，確定所述目標(biāo)檢索對(duì)象與各所述待識(shí)別人員之間的軌跡相似度；

16、處理模塊，用于將所述軌跡相似度大于或等于預(yù)定閾值的待識(shí)別人員確定為目標(biāo)檢索對(duì)象。

17、根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面，提供了一種計(jì)算機(jī)可讀介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述實(shí)施例中所述的基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法。

18、根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面，提供了一種電子設(shè)備，包括：一個(gè)或多個(gè)處理器；存儲(chǔ)裝置，用于存儲(chǔ)一個(gè)或多個(gè)程序，當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行時(shí)，使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如上述實(shí)施例中所述的基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法。

19、根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面，提供了一種計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序，該計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序包括計(jì)算機(jī)指令，該計(jì)算機(jī)指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。計(jì)算機(jī)設(shè)備的處理器從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取該計(jì)算機(jī)指令，處理器執(zhí)行該計(jì)算機(jī)指令，使得該計(jì)算機(jī)設(shè)備執(zhí)行上述實(shí)施例中提供的基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法。

20、在本申請(qǐng)的一些實(shí)施例所提供的技術(shù)方案中，通過(guò)獲取針對(duì)目標(biāo)區(qū)域進(jìn)行拍攝得到的若干監(jiān)控畫面，將若干監(jiān)控畫面作為預(yù)先訓(xùn)練完成的多模態(tài)目標(biāo)檢測(cè)模型的輸入，以使多模態(tài)目標(biāo)檢測(cè)目標(biāo)模型根據(jù)各監(jiān)控畫面進(jìn)行檢測(cè)，確定其所包含的行人以及提取各行人對(duì)應(yīng)的深度特征集合，接著，根據(jù)每一行人對(duì)應(yīng)的深度特征集合進(jìn)行識(shí)別，確定各行人對(duì)應(yīng)的外貌特征標(biāo)簽以及各外貌特征標(biāo)簽對(duì)應(yīng)的深度特征；先從任一監(jiān)控畫面包含的行人中指定目標(biāo)檢索對(duì)象，將與目標(biāo)檢索對(duì)象的外貌特征標(biāo)簽全部相同的行人確定為待識(shí)別人員，再基于目標(biāo)跟蹤算法，確定目標(biāo)檢索對(duì)象以及各待識(shí)別人員在各自監(jiān)控畫面中的運(yùn)動(dòng)軌跡，根據(jù)目標(biāo)檢索對(duì)象在其運(yùn)動(dòng)軌跡上的所有外貌特征標(biāo)簽和深度特征，以及各待識(shí)別人員在其運(yùn)動(dòng)軌跡上的所有外貌特征標(biāo)簽和深度特征，確定目標(biāo)檢索對(duì)象與各待識(shí)別人員之間的軌跡相似度，將軌跡相似度大于或等于預(yù)定閾值的待識(shí)別人員確定為目標(biāo)檢索對(duì)象，如此，基于多模態(tài)檢測(cè)模型，經(jīng)過(guò)一次檢測(cè)即可提取所有行人的外貌特征標(biāo)簽及對(duì)應(yīng)的深度特征，并以此進(jìn)行初步篩選以及最終行人重識(shí)別的確定，無(wú)需復(fù)雜的數(shù)據(jù)預(yù)處理和特征工程，在提高行人重識(shí)別的效率的同時(shí)還保證了行人重識(shí)別的準(zhǔn)確性。

21、應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的，并不能限制本申請(qǐng)。

技術(shù)特征：

1.一種基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，根據(jù)所述目標(biāo)檢索對(duì)象在其運(yùn)動(dòng)軌跡上的所有外貌特征標(biāo)簽和深度特征，以及各所述待識(shí)別人員在其運(yùn)動(dòng)軌跡上的所有外貌特征標(biāo)簽和深度特征，確定所述目標(biāo)檢索對(duì)象與各所述待識(shí)別人員之間的軌跡相似度，包括：

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，在訓(xùn)練所述多模態(tài)目標(biāo)檢測(cè)模型時(shí)，包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，對(duì)不同組中對(duì)應(yīng)于相同提示詞的數(shù)據(jù)采用三元組學(xué)習(xí)方式進(jìn)行模型訓(xùn)練，以使組內(nèi)特征距離拉近的同時(shí)組間特征的距離拉遠(yuǎn)，包括：

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，根據(jù)以下公式構(gòu)建所述目標(biāo)損失函數(shù)：

6.根據(jù)權(quán)利要求5所述的方法，其特征在于，根據(jù)以下公式構(gòu)建三元組損失函數(shù)：

7.根據(jù)權(quán)利要求5所述的方法，其特征在于，根據(jù)以下公式構(gòu)建infonce損失函數(shù)：

8.一種基于多模態(tài)語(yǔ)義信息的行人重識(shí)別裝置，其特征在于，包括：

9.一種計(jì)算機(jī)可讀介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法。

10.一種電子設(shè)備，其特征在于，包括：

技術(shù)總結(jié)
本公開提供了一種基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法、裝置及設(shè)備，該方法包括：獲取若干監(jiān)控畫面；將若干監(jiān)控畫面作為預(yù)先訓(xùn)練完成的多模態(tài)目標(biāo)檢測(cè)模型的輸入，以使多模態(tài)目標(biāo)檢測(cè)模型根據(jù)各監(jiān)控畫面進(jìn)行檢測(cè)，確定各行人對(duì)應(yīng)的外貌特征標(biāo)簽以及各外貌特征標(biāo)簽對(duì)應(yīng)的深度特征；將與目標(biāo)檢索對(duì)象的外貌特征標(biāo)簽全部相同的行人確定為待識(shí)別人員；基于目標(biāo)跟蹤算法，確定目標(biāo)檢索對(duì)象以及各待識(shí)別人員在各自監(jiān)控畫面中的運(yùn)動(dòng)軌跡，并確定目標(biāo)檢索對(duì)象與各待識(shí)別人員之間的軌跡相似度；將軌跡相似度大于或等于預(yù)定閾值的待識(shí)別人員確定為目標(biāo)檢索對(duì)象。本申請(qǐng)實(shí)施例的技術(shù)方案可以在提高行人重識(shí)別的效率的同時(shí)，保證行人重識(shí)別的準(zhǔn)確性。

技術(shù)研發(fā)人員：葉維晶,連桄雷,盧天發(fā),李仁杰
受保護(hù)的技術(shù)使用者：羅普特科技集團(tuán)股份有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：葉維晶,連桄雷,盧天發(fā),李仁杰
技術(shù)所有人：羅普特科技集團(tuán)股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法、裝置及設(shè)備與流程

基于多模態(tài)語(yǔ)義信息的行人重識(shí)別方法、裝置及設(shè)備與流程