一種圖像主要目標(biāo)的定位與識別方法

文檔序號：6540946閱讀：345來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種圖像主要目標(biāo)的定位與識別方法
【專利摘要】本發(fā)明涉及一種圖像主要目標(biāo)定位與識別方法，屬于數(shù)字圖像處理領(lǐng)域。其具體操作步驟為：①從待識別圖像中識別單體目標(biāo)；②從待識別圖像中識別關(guān)系目標(biāo)；③確定候選主要目標(biāo)區(qū)域；④從候選主要目標(biāo)區(qū)域中確定主要目標(biāo)。本發(fā)明提出的一種圖像主要目標(biāo)定位與識別方法，可以在待識別圖像中快速識別圖像主要目標(biāo)，該方法適用于計(jì)算機(jī)快速自動發(fā)現(xiàn)、定位冗長視頻中包含犯罪活動或犯罪分子的關(guān)鍵幀。
【專利說明】一種圖像主要目標(biāo)的定位與識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像主要目標(biāo)定位與識別方法，屬于數(shù)字圖像處理領(lǐng)域。
【背景技術(shù)】
[0002]隨著人工智能技術(shù)的不斷發(fā)展，如何實(shí)現(xiàn)計(jì)算機(jī)自主認(rèn)識周圍環(huán)境、模仿人類自主理解周圍世界，已成為當(dāng)前以及今后很長一段時間計(jì)算機(jī)、人工智能技術(shù)的主要研究目標(biāo)。實(shí)現(xiàn)計(jì)算機(jī)自主認(rèn)識周圍環(huán)境、自主理解周圍世界的關(guān)鍵環(huán)節(jié)一實(shí)現(xiàn)圖像主要目標(biāo)定位與識別。圖像主要目標(biāo)是指處于原始圖像中央?yún)^(qū)域內(nèi)，處于較淺深度的目標(biāo)。圖像主要目標(biāo)定位與識別技術(shù)是目前圖像處理研究領(lǐng)域的一個熱點(diǎn)、難點(diǎn)，其具有很寬廣的應(yīng)用前景。例如:在反恐維安等警方調(diào)查活動中，實(shí)現(xiàn)計(jì)算機(jī)自動發(fā)現(xiàn)、定位犯罪份子等。隨著監(jiān)控視頻探頭的普及與應(yīng)用，越來越成為輔助警方分析犯罪活動，抓捕罪犯的有力幫手。由于監(jiān)控視頻拍攝的視頻圖像一般都幾個小時，甚至幾天的時長，而犯罪活動一般只有短短的幾分鐘。想要從冗長的視頻錄像中發(fā)現(xiàn)、定位犯罪活動的時間，分析犯罪過程，目前只能完全依靠警員長時間的觀看視頻錄像來確定。這不僅耗費(fèi)了大量的人力，而且花費(fèi)時間也比較長，降低了第一時間抓捕罪犯的機(jī)率。
[0003]目前，圖像主要目標(biāo)定位與識別研究仍處于初期階段。大部分的研究工作仍處于單個目標(biāo)的識別與定位，并不能有效的確認(rèn)圖像中的主要目標(biāo)。
[0004]美國伊利諾伊州大學(xué)香檳分校的Pedro F.Felzenszwalb博士和他的團(tuán)隊(duì)開創(chuàng)性的提出了輪廓模型(Deformable Part Model)較好的實(shí)現(xiàn)了圖像中各種目標(biāo)的定位與識另O。開啟了圖像目標(biāo)識別研究領(lǐng)域的新時代，但是輪廓模型并不能分析、定位圖像的主要目標(biāo)。
[0005]美國普林斯頓大學(xué)的L1.L.J博士和Fe1-Fe1.L博士的研究團(tuán)隊(duì)長期致力于圖像分割與目標(biāo)識別的研究工作，在數(shù)字圖像的場景識別與目標(biāo)定位研究中取得了很好的效果。他們通過構(gòu)建聯(lián)合概率模型，實(shí)現(xiàn)了計(jì)算機(jī)自動定位與識別圖像中的各種目標(biāo)，實(shí)現(xiàn)各種目標(biāo)的簡單文字標(biāo)注，但是沒能找出圖像的主要目標(biāo)。
[0006]美國卡內(nèi)基.梅隆大學(xué)的A.Gupta教授領(lǐng)導(dǎo)的研究團(tuán)隊(duì)和美國伊利諾伊州大學(xué)香檳分校的Ali Farhadi博士的研究團(tuán)隊(duì)以概率模型為基礎(chǔ)，進(jìn)行了大量關(guān)于圖像目標(biāo)定位與識別的研究。A.Gupta教授領(lǐng)導(dǎo)的研究團(tuán)隊(duì)提出一種基于貝葉斯方法的概率模型，通過計(jì)算各種類型的圖像中不同目標(biāo)出現(xiàn)的概率，來提高圖像中的各種目標(biāo)定位與識別的準(zhǔn)確性。Ali Farhadi博士的研究團(tuán)隊(duì)通過采用改進(jìn)的輪廓模型,提高圖像中各種目標(biāo)的定位與識別的準(zhǔn)確性。而且他們還開創(chuàng)性的提出了圖像語言短語(Visual Phrases)來發(fā)現(xiàn)圖像中的各種目標(biāo)之間的特定關(guān)系，并通過統(tǒng)計(jì)的方法試圖找出圖像中的主要目標(biāo)。
[0007]因此，需要設(shè)計(jì)一種更符合人類認(rèn)知過程的、更加高效的計(jì)算機(jī)圖像識別方法，實(shí)現(xiàn)計(jì)算機(jī)快速自動發(fā)現(xiàn)、定位冗長視頻中包含犯罪活動或犯罪分子的關(guān)鍵幀。

【發(fā)明內(nèi)容】
[0008]本發(fā)明的目的是為了提供一種圖像主要目標(biāo)的定位與識別方法，實(shí)現(xiàn)計(jì)算機(jī)快速自動發(fā)現(xiàn)、定位冗長視頻中包含犯罪活動或犯罪分子的關(guān)鍵幀。
[0009]本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的。
[0010]一種圖像主要目標(biāo)的定位與識別方法，其具體操作步驟為:
[0011]步驟一、從待識別圖像中識別單體目標(biāo)，操作步驟包括:
[0012]步驟1.1:輪廓模型(Deformable Part Models)集合中包含單體輪廓模型和關(guān)系輪廓模型。單體輪廓模型和關(guān)系輪廓模型均為mXn的矩陣模型，其中，m、n e (0，300)，且m、η均為正整數(shù)。依次使用輪廓模型集合中的每個單體輪廓模型對待識別圖像進(jìn)行步驟
1.2的操作。
[0013]步驟1.2:使用當(dāng)前單體輪廓模型，以逐像素的方法遍歷待識別圖像，將完全匹配成功的像素區(qū)域，用正好能覆蓋的矩形框標(biāo)記出來。
[0014]經(jīng)過步驟一的操作，可以得到待識別圖像中的單體目標(biāo)。
[0015]步驟二、從待識別圖像中識別關(guān)系目標(biāo)，操作步驟包括:
[0016]步驟2.1:依據(jù)搜索關(guān)鍵詞，從輪廓模型集合中的關(guān)系模型子集中找到含有關(guān)鍵詞的關(guān)系1?型。
[0017]步驟2.2:依次使用步驟2.1得到的關(guān)系輪廓模型對待識別圖像進(jìn)行步驟2.3的操作。
[0018]步驟2.3:使用當(dāng)前關(guān)系輪廓模型，以逐像素的方法遍歷待識別圖像，將完全匹配成功的像素區(qū)域，用正好能覆蓋的矩形框標(biāo)記出來，得到關(guān)系目標(biāo)。
[0019]經(jīng)過步驟二的操作，可以得到待識別圖像中的關(guān)系目標(biāo)。
[0020]步驟三、確定候選主要目標(biāo)區(qū)域。
[0021]依次查看步驟二得到的每個關(guān)系目標(biāo)是否包含步驟一得到的某個單體目標(biāo)，如包含，則將該關(guān)系目標(biāo)設(shè)定為候選主要目標(biāo)區(qū)域。候選主要目標(biāo)區(qū)域構(gòu)成候選主要目標(biāo)區(qū)域集合，用符號W表示，W= Iw1, W2,……，Wj，其中，r為候選主要目標(biāo)區(qū)域的數(shù)量，Wi為候選主要目標(biāo)區(qū)域，I≤i≤r。
[0022]步驟四、從候選主要目標(biāo)區(qū)域中確定主要目標(biāo)，操作步驟包括:
[0023]步驟4.1:對步驟三得到的候選主要目標(biāo)區(qū)域集合W中的候選主要目標(biāo)區(qū)域Wi依次進(jìn)行步驟4.2至步驟4.5的操作。
[0024]步驟4.2:對候選主要目標(biāo)區(qū)域Wi使用17種不同的濾波器進(jìn)行濾波，提取34維特征向量。所述17種不同的濾波器為9種遮罩(Law’s Masks)濾波器、2種顏色通道濾波器和6種紋理梯度濾波器。
[0025]所述對候選主要目標(biāo)區(qū)域Wi使用17種不同的濾波器進(jìn)行濾波，提取34維特征向量的具體方法是:通過公式(I)在兩種不同的維度下，計(jì)算候選主要目標(biāo)區(qū)域和濾波器的卷積，獲得34維的特征向量。
[0026]
【權(quán)利要求】
1.一種圖像主要目標(biāo)的定位與識別方法，其特征在于:其具體操作步驟為: 步驟一、從待識別圖像中識別單體目標(biāo)，操作步驟包括: 步驟1.1:輪廓模型集合中包含單體輪廓模型和關(guān)系輪廓模型；單體輪廓模型和關(guān)系輪廓模型均為mXη的矩陣模型，其中，m、n e (0，300)，且m、η均為正整數(shù)；依次使用輪廓模型集合中的每個單體輪廓模型對待識別圖像進(jìn)行步驟1.2的操作；步驟1.2:使用當(dāng)前單體輪廓模型，以逐像素的方法遍歷待識別圖像，將完全匹配成功的像素區(qū)域，用正好能覆蓋的矩形框標(biāo)記出來；經(jīng)過步驟一的操作，可以得到待識別圖像中的單體目標(biāo)；步驟二、從待識別圖像中識別關(guān)系目標(biāo)，操作步驟包括: 步驟2.1:依據(jù)搜索關(guān)鍵詞，從輪廓模型集合中的關(guān)系模型子集中找到含有關(guān)鍵詞的關(guān)系1吳型；步驟2.2:依次使用步驟2.1得到的關(guān)系輪廓模型對待識別圖像進(jìn)行步驟2.3的操作；步驟2.3:使用當(dāng)前關(guān)系輪廓模型，以逐像素的方法遍歷待識別圖像，將完全匹配成功的像素區(qū)域，用正好能覆蓋的矩形框標(biāo)記出來，得到關(guān)系目標(biāo)；經(jīng)過步驟二的操作，可以得到待識別圖像中的關(guān)系目標(biāo)；步驟三、確定候選主要目標(biāo)區(qū)域；依次查看步驟二得到的每個關(guān)系目標(biāo)是否包含步驟一得到的某個單體目標(biāo)，如包含，則將該關(guān)系目標(biāo)設(shè)定為候選主要目標(biāo)區(qū)域；候選主要目標(biāo)區(qū)域構(gòu)成候選主要目標(biāo)區(qū)域集合，用符號W表示，W= (W1, W2,......，wj ,其中，r為候選主要目標(biāo)區(qū)域的數(shù)量，Wi為候選主要目標(biāo)區(qū)域，KiSr; 步驟四、從候選主要目標(biāo)區(qū)域中確定主要目標(biāo)，操作步驟包括: 步驟4.1:對步驟三得到的候選主要目標(biāo)區(qū)域集合W中的候選主要目標(biāo)區(qū)域Wi依次進(jìn)行步驟4.2至步驟4.5的操作；步驟4.2:對候選主要目標(biāo)區(qū)域Wi使用17種不同的濾波器進(jìn)行濾波，提取34維特征向量; 步驟4.3:將候選主要目標(biāo)區(qū)域Wi分割為K個大小為3X3像素的圖像塊，K是候選主要目標(biāo)區(qū)域Wi能夠分成的圖像塊的個數(shù)；步驟4.4:遍歷候選主要目標(biāo)區(qū)域Wi中的3X3像素的圖像塊，用符號1^.表示當(dāng)前3X3像素的圖像塊，將圖像塊h擴(kuò)展為3種不同分辨率的圖像，非別是原始分辨率圖像、1/3原始分辨率圖像和1/9原始分辨率圖像；步驟4.5:使用聯(lián)合高斯馬爾科夫隨機(jī)場，求解公式(2)的最大似然概率計(jì)算候選主要目標(biāo)區(qū)域Wi的絕對深度值；
2.如權(quán)利要求1所述的一種圖像主要目標(biāo)的定位與識別方法，其特征在于:步驟四步驟4.2中所述17種不同的濾波器為采用9種遮罩濾波器、2種顏色通道濾波器和6種紋理梯度濾波器。
3.如權(quán)利要求1或2所述的一種圖像主要目標(biāo)的定位與識別方法，其特征在于:步驟四步驟4.2中所述對候選主要目標(biāo)區(qū)域Wi使用17種不同的濾波器進(jìn)行濾波，提取34維特征向量的具體方法是:通過公式(I)在兩種不同的維度下，計(jì)算候選主要目標(biāo)區(qū)域和濾波器的卷積，獲得34維的特征向量；
【文檔編號】G06K9/32GK103824067SQ201410100575
【公開日】2014年5月28日申請日期:2014年3月18日優(yōu)先權(quán)日:2014年3月18日
【發(fā)明者】李侃, 白琳, 徐琛申請人:北京理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李侃;白琳;徐琛
技術(shù)所有人：北京理工大學(xué)
我是此專利的發(fā)明人

上一篇：一種面向網(wǎng)盤分享服務(wù)的盜版視頻資源發(fā)現(xiàn)方法
上一篇：數(shù)據(jù)處理方法及裝置制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

圖像目標(biāo)識別相關(guān)技術(shù)

遙感圖像目標(biāo)識別相關(guān)技術(shù)

衛(wèi)星定位圖相關(guān)技術(shù)

sar圖像目標(biāo)識別相關(guān)技術(shù)

無人機(jī)圖像目標(biāo)識別相關(guān)技術(shù)

遙感圖像目標(biāo)識別代碼相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種圖像主要目標(biāo)的定位與識別方法