一種圖像主要目標(biāo)的定位與識別方法
【專利摘要】本發(fā)明涉及一種圖像主要目標(biāo)定位與識別方法,屬于數(shù)字圖像處理領(lǐng)域。其具體操作步驟為:①從待識別圖像中識別單體目標(biāo);②從待識別圖像中識別關(guān)系目標(biāo);③確定候選主要目標(biāo)區(qū)域;④從候選主要目標(biāo)區(qū)域中確定主要目標(biāo)。本發(fā)明提出的一種圖像主要目標(biāo)定位與識別方法,可以在待識別圖像中快速識別圖像主要目標(biāo),該方法適用于計(jì)算機(jī)快速自動發(fā)現(xiàn)、定位冗長視頻中包含犯罪活動或犯罪分子的關(guān)鍵幀。
【專利說明】一種圖像主要目標(biāo)的定位與識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像主要目標(biāo)定位與識別方法,屬于數(shù)字圖像處理領(lǐng)域。
【背景技術(shù)】
[0002]隨著人工智能技術(shù)的不斷發(fā)展,如何實(shí)現(xiàn)計(jì)算機(jī)自主認(rèn)識周圍環(huán)境、模仿人類自主理解周圍世界,已成為當(dāng)前以及今后很長一段時間計(jì)算機(jī)、人工智能技術(shù)的主要研究目標(biāo)。實(shí)現(xiàn)計(jì)算機(jī)自主認(rèn)識周圍環(huán)境、自主理解周圍世界的關(guān)鍵環(huán)節(jié)一實(shí)現(xiàn)圖像主要目標(biāo)定位與識別。圖像主要目標(biāo)是指處于原始圖像中央?yún)^(qū)域內(nèi),處于較淺深度的目標(biāo)。圖像主要目標(biāo)定位與識別技術(shù)是目前圖像處理研究領(lǐng)域的一個熱點(diǎn)、難點(diǎn),其具有很寬廣的應(yīng)用前景。例如:在反恐維安等警方調(diào)查活動中,實(shí)現(xiàn)計(jì)算機(jī)自動發(fā)現(xiàn)、定位犯罪份子等。隨著監(jiān)控視頻探頭的普及與應(yīng)用,越來越成為輔助警方分析犯罪活動,抓捕罪犯的有力幫手。由于監(jiān)控視頻拍攝的視頻圖像一般都幾個小時,甚至幾天的時長,而犯罪活動一般只有短短的幾分鐘。想要從冗長的視頻錄像中發(fā)現(xiàn)、定位犯罪活動的時間,分析犯罪過程,目前只能完全依靠警員長時間的觀看視頻錄像來確定。這不僅耗費(fèi)了大量的人力,而且花費(fèi)時間也比較長,降低了第一時間抓捕罪犯的機(jī)率。
[0003]目前,圖像主要目標(biāo)定位與識別研究仍處于初期階段。大部分的研究工作仍處于單個目標(biāo)的識別與定位,并不能有效的確認(rèn)圖像中的主要目標(biāo)。
[0004]美國伊利諾伊州大學(xué)香檳分校的Pedro F.Felzenszwalb博士和他的團(tuán)隊(duì)開創(chuàng)性的提出了輪廓模型(Deformable Part Model)較好的實(shí)現(xiàn)了圖像中各種目標(biāo)的定位與識另O。開啟了圖像目標(biāo)識別研究領(lǐng)域的新時代,但是輪廓模型并不能分析、定位圖像的主要目標(biāo)。
[0005]美國普林斯頓大學(xué)的L1.L.J博士和Fe1-Fe1.L博士的研究團(tuán)隊(duì)長期致力于圖像分割與目標(biāo)識別的研究工作,在數(shù)字圖像的場景識別與目標(biāo)定位研究中取得了很好的效果。他們通過構(gòu)建聯(lián)合概率模型,實(shí)現(xiàn)了計(jì)算機(jī)自動定位與識別圖像中的各種目標(biāo),實(shí)現(xiàn)各種目標(biāo)的簡單文字標(biāo)注,但是沒能找出圖像的主要目標(biāo)。
[0006]美國卡內(nèi)基.梅隆大學(xué)的A.Gupta教授領(lǐng)導(dǎo)的研究團(tuán)隊(duì)和美國伊利諾伊州大學(xué)香檳分校的Ali Farhadi博士的研究團(tuán)隊(duì)以概率模型為基礎(chǔ),進(jìn)行了大量關(guān)于圖像目標(biāo)定位與識別的研究。A.Gupta教授領(lǐng)導(dǎo)的研究團(tuán)隊(duì)提出一種基于貝葉斯方法的概率模型,通過計(jì)算各種類型的圖像中不同目標(biāo)出現(xiàn)的概率,來提高圖像中的各種目標(biāo)定位與識別的準(zhǔn)確性。Ali Farhadi博士的研究團(tuán)隊(duì)通過采用改進(jìn)的輪廓模型,提高圖像中各種目標(biāo)的定位與識別的準(zhǔn)確性。而且他們還開創(chuàng)性的提出了圖像語言短語(Visual Phrases)來發(fā)現(xiàn)圖像中的各種目標(biāo)之間的特定關(guān)系,并通過統(tǒng)計(jì)的方法試圖找出圖像中的主要目標(biāo)。
[0007]因此,需要設(shè)計(jì)一種更符合人類認(rèn)知過程的、更加高效的計(jì)算機(jī)圖像識別方法,實(shí)現(xiàn)計(jì)算機(jī)快速自動發(fā)現(xiàn)、定位冗長視頻中包含犯罪活動或犯罪分子的關(guān)鍵幀。
【發(fā)明內(nèi)容】
[0008]本發(fā)明的目的是為了提供一種圖像主要目標(biāo)的定位與識別方法,實(shí)現(xiàn)計(jì)算機(jī)快速自動發(fā)現(xiàn)、定位冗長視頻中包含犯罪活動或犯罪分子的關(guān)鍵幀。
[0009]本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的。
[0010]一種圖像主要目標(biāo)的定位與識別方法,其具體操作步驟為:
[0011]步驟一、從待識別圖像中識別單體目標(biāo),操作步驟包括:
[0012]步驟1.1:輪廓模型(Deformable Part Models)集合中包含單體輪廓模型和關(guān)系輪廓模型。單體輪廓模型和關(guān)系輪廓模型均為mXn的矩陣模型,其中,m、n e (0,300),且m、η均為正整數(shù)。依次使用輪廓模型集合中的每個單體輪廓模型對待識別圖像進(jìn)行步驟
1.2的操作。
[0013]步驟1.2:使用當(dāng)前單體輪廓模型,以逐像素的方法遍歷待識別圖像,將完全匹配成功的像素區(qū)域,用正好能覆蓋的矩形框標(biāo)記出來。
[0014]經(jīng)過步驟一的操作,可以得到待識別圖像中的單體目標(biāo)。
[0015]步驟二、從待識別圖像中識別關(guān)系目標(biāo),操作步驟包括:
[0016]步驟2.1:依據(jù)搜索關(guān)鍵詞,從輪廓模型集合中的關(guān)系模型子集中找到含有關(guān)鍵詞的關(guān)系1?型。
[0017]步驟2.2:依次使用步驟2.1得到的關(guān)系輪廓模型對待識別圖像進(jìn)行步驟2.3的操作。
[0018]步驟2.3:使用當(dāng)前關(guān)系輪廓模型,以逐像素的方法遍歷待識別圖像,將完全匹配成功的像素區(qū)域,用正好能覆蓋的矩形框標(biāo)記出來,得到關(guān)系目標(biāo)。
[0019]經(jīng)過步驟二的操作,可以得到待識別圖像中的關(guān)系目標(biāo)。
[0020]步驟三、確定候選主要目標(biāo)區(qū)域。
[0021]依次查看步驟二得到的每個關(guān)系目標(biāo)是否包含步驟一得到的某個單體目標(biāo),如包含,則將該關(guān)系目標(biāo)設(shè)定為候選主要目標(biāo)區(qū)域。候選主要目標(biāo)區(qū)域構(gòu)成候選主要目標(biāo)區(qū)域集合,用符號W表示,W= Iw1, W2,……,Wj,其中,r為候選主要目標(biāo)區(qū)域的數(shù)量,Wi為候選主要目標(biāo)區(qū)域,I≤i≤r。
[0022]步驟四、從候選主要目標(biāo)區(qū)域中確定主要目標(biāo),操作步驟包括:
[0023]步驟4.1:對步驟三得到的候選主要目標(biāo)區(qū)域集合W中的候選主要目標(biāo)區(qū)域Wi依次進(jìn)行步驟4.2至步驟4.5的操作。
[0024]步驟4.2:對候選主要目標(biāo)區(qū)域Wi使用17種不同的濾波器進(jìn)行濾波,提取34維特征向量。所述17種不同的濾波器為9種遮罩(Law’s Masks)濾波器、2種顏色通道濾波器和6種紋理梯度濾波器。
[0025]所述對候選主要目標(biāo)區(qū)域Wi使用17種不同的濾波器進(jìn)行濾波,提取34維特征向量的具體方法是:通過公式(I)在兩種不同的維度下,計(jì)算候選主要目標(biāo)區(qū)域和濾波器的卷積,獲得34維的特征向量。
[0026]
【權(quán)利要求】
1.一種圖像主要目標(biāo)的定位與識別方法,其特征在于:其具體操作步驟為: 步驟一、從待識別圖像中識別單體目標(biāo),操作步驟包括: 步驟1.1:輪廓模型集合中包含單體輪廓模型和關(guān)系輪廓模型;單體輪廓模型和關(guān)系輪廓模型均為mXη的矩陣模型,其中,m、n e (0,300),且m、η均為正整數(shù);依次使用輪廓模型集合中的每個單體輪廓模型對待識別圖像進(jìn)行步驟1.2的操作; 步驟1.2:使用當(dāng)前單體輪廓模型,以逐像素的方法遍歷待識別圖像,將完全匹配成功的像素區(qū)域,用正好能覆蓋的矩形框標(biāo)記出來; 經(jīng)過步驟一的操作,可以得到待識別圖像中的單體目標(biāo); 步驟二、從待識別圖像中識別關(guān)系目標(biāo),操作步驟包括: 步驟2.1:依據(jù)搜索關(guān)鍵詞,從輪廓模型集合中的關(guān)系模型子集中找到含有關(guān)鍵詞的關(guān)系1吳型; 步驟2.2:依次使用步驟2.1得到的關(guān)系輪廓模型對待識別圖像進(jìn)行步驟2.3的操作;步驟2.3:使用當(dāng)前關(guān)系輪廓模型,以逐像素的方法遍歷待識別圖像,將完全匹配成功的像素區(qū)域,用正好能覆蓋的矩形框標(biāo)記出來,得到關(guān)系目標(biāo); 經(jīng)過步驟二的操作,可以得到待識別圖像中的關(guān)系目標(biāo); 步驟三、確定候選主要目標(biāo)區(qū)域; 依次查看步驟二得到的每個關(guān)系目標(biāo)是否包含步驟一得到的某個單體目標(biāo),如包含,則將該關(guān)系目標(biāo)設(shè)定為候選主要目標(biāo)區(qū)域;候選主要目標(biāo)區(qū)域構(gòu)成候選主要目標(biāo)區(qū)域集合,用符號W表示,W= (W1, W2,......,wj ,其中,r為候選主要目標(biāo)區(qū)域的數(shù)量,Wi為候選主要目標(biāo)區(qū)域,KiSr; 步驟四、從候選主要目標(biāo)區(qū)域中確定主要目標(biāo),操作步驟包括: 步驟4.1:對步驟三得到的候選主要目標(biāo)區(qū)域集合W中的候選主要目標(biāo)區(qū)域Wi依次進(jìn)行步驟4.2至步驟4.5的操作; 步驟4.2:對候選主要目標(biāo)區(qū)域Wi使用17種不同的濾波器進(jìn)行濾波,提取34維特征向量; 步驟4.3:將候選主要目標(biāo)區(qū)域Wi分割為K個大小為3X3像素的圖像塊,K是候選主要目標(biāo)區(qū)域Wi能夠分成的圖像塊的個數(shù); 步驟4.4:遍歷候選主要目標(biāo)區(qū)域Wi中的3X3像素的圖像塊,用符號1^.表示當(dāng)前3X3像素的圖像塊,將圖像塊h擴(kuò)展為3種不同分辨率的圖像,非別是原始分辨率圖像、1/3原始分辨率圖像和1/9原始分辨率圖像; 步驟4.5:使用聯(lián)合高斯馬爾科夫隨機(jī)場,求解公式(2)的最大似然概率計(jì)算候選主要目標(biāo)區(qū)域Wi的絕對深度值;
2.如權(quán)利要求1所述的一種圖像主要目標(biāo)的定位與識別方法,其特征在于:步驟四步驟4.2中所述17種不同的濾波器為采用9種遮罩濾波器、2種顏色通道濾波器和6種紋理梯度濾波器。
3.如權(quán)利要求1或2所述的一種圖像主要目標(biāo)的定位與識別方法,其特征在于:步驟四步驟4.2中所述對候選主要目標(biāo)區(qū)域Wi使用17種不同的濾波器進(jìn)行濾波,提取34維特征向量的具體方法是:通過公式(I)在兩種不同的維度下,計(jì)算候選主要目標(biāo)區(qū)域和濾波器的卷積,獲得34維的特征向量;
【文檔編號】G06K9/32GK103824067SQ201410100575
【公開日】2014年5月28日 申請日期:2014年3月18日 優(yōu)先權(quán)日:2014年3月18日
【發(fā)明者】李侃, 白琳, 徐琛 申請人:北京理工大學(xué)