本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,特別地涉及一種基于正則風(fēng)險(xiǎn)最小化的圖像目標(biāo)計(jì)數(shù)方法。
背景技術(shù):
目標(biāo)計(jì)數(shù)旨在得到某一場景中目標(biāo)數(shù)目的估計(jì)。目標(biāo)計(jì)數(shù)具有廣泛的應(yīng)用,如估計(jì)監(jiān)控視頻中的人群密度以對高密度情況進(jìn)行警報(bào),預(yù)防事故;估計(jì)血檢、尿檢圖片中的細(xì)胞個(gè)數(shù)以診斷被試者是否患有疾病等。該領(lǐng)域目前的主要難點(diǎn)在于解決高密度群體和復(fù)雜場景下的目標(biāo)計(jì)數(shù)?,F(xiàn)有的目標(biāo)計(jì)數(shù)方法主要可分為兩類:基于目標(biāo)檢測的方法和基于回歸分析的方法。基于目標(biāo)檢測的方法需要檢測出圖像中的每個(gè)目標(biāo),比如利用哈爾Haar小波變換尋找具有類似人頭邊緣的物體,確定場景中的個(gè)體數(shù)目。這類方法的問題在于無法處理遮擋、黏連等帶來的檢測困難,不適用于高密度群體和復(fù)雜場景。基于回歸分析的方法旨在找出某個(gè)圖像區(qū)域的全局特征描述與該區(qū)域中的目標(biāo)個(gè)數(shù)之間的關(guān)系。這種關(guān)系可以通過各種機(jī)器學(xué)習(xí)方法得到。由于不同密度群體的特征差異較大,根據(jù)群體密度的不同,常采用不同的特征描述,這又將此類方法分為基于像素的方法和基于紋理的方法。對于中低密度的群體,由于前景像素的面積與目標(biāo)個(gè)數(shù)成近似的線性關(guān)系,多采用基于像素的方法,利用減背景、馬爾科夫隨機(jī)場和光流法等分割出前景像素,然后采用最小二乘擬合、卡爾曼濾波器和神經(jīng)網(wǎng)絡(luò)等得到模型的參數(shù)。但是對于高密度群體,由于遮擋、黏連等問題,前景像素的面積與目標(biāo)個(gè)數(shù)不再具有可靠的相關(guān)性,這時(shí)多采用基于紋理的方法,如采用灰度共生矩陣及其改進(jìn)、小波分解系數(shù)矩陣的能量、切比雪夫Chebyshev矩等描述紋理特征,利用神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SupportVectorMachine,SVM)等學(xué)習(xí)得到特征描述到目標(biāo)個(gè)數(shù)的映射關(guān)系。而在考慮中高密度群體時(shí),現(xiàn)有方法基本都無法得到目標(biāo)個(gè)數(shù)的精確估計(jì),而是估計(jì)目標(biāo)密度的等級(通常將密度分為由低到高的5個(gè)等級),即密度估計(jì)(densityestimation)。基于回歸分析的方法雖然避免了目標(biāo)檢測的困難,但是仍很難找到一種普遍適用于不同密度群體的特征描述和學(xué)習(xí)方法。由于現(xiàn)有方法使用的訓(xùn)練圖像僅僅是已知目標(biāo)個(gè)數(shù)或密度等級的圖像集,而目標(biāo)在圖像上的空間分布是未知的,所以經(jīng)過學(xué)習(xí)后,對于一張輸入圖像只能得到整張圖像的目標(biāo)個(gè)數(shù)或密度等級,而無法得到該圖像中任意區(qū)域內(nèi)的目標(biāo)個(gè)數(shù)。最后,由于神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法的計(jì)算復(fù)雜較高,基本還無法做到實(shí)時(shí)處理。
技術(shù)實(shí)現(xiàn)要素:
為解決上述問題,本發(fā)明的目的在于提供一種基于正則風(fēng)險(xiǎn)最小化的圖像目標(biāo)計(jì)數(shù)方法,將目標(biāo)位置標(biāo)注加入到訓(xùn)練集中,使用監(jiān)督式學(xué)習(xí)框架,直接利用正則化風(fēng)險(xiǎn)最小化原理,通過各種簡化最后歸結(jié)為一個(gè)線性規(guī)劃問題,以一種簡單的模型來描述空間信息,得到一個(gè)可以適用于不同密集程度的群體,且可以給出圖像中任意區(qū)域內(nèi)的目標(biāo)個(gè)數(shù)的計(jì)數(shù)方法。為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:一種基于正則風(fēng)險(xiǎn)最小化的圖像目標(biāo)計(jì)數(shù)方法,包括以下步驟:S10,使用的每張訓(xùn)練圖像設(shè)置有相應(yīng)的對目標(biāo)進(jìn)行人工標(biāo)注的標(biāo)記點(diǎn)圖像,所述標(biāo)記點(diǎn)圖像以像素點(diǎn)標(biāo)記的方式給出每個(gè)目標(biāo)的位置;S20,對所述訓(xùn)練圖像定義密度函數(shù),其中所述密度函數(shù)為定義在圖像像素集上的實(shí)值函數(shù),且所述密度函數(shù)在任意圖像區(qū)域上的積分為該區(qū)域內(nèi)的目標(biāo)個(gè)數(shù);S30,根據(jù)密度函數(shù)的定義,將訓(xùn)練圖像對應(yīng)的標(biāo)記點(diǎn)圖像與一個(gè)高斯模板卷積即得到真實(shí)密度函數(shù);S40,由密度函數(shù)的定義構(gòu)造密度函數(shù)的參數(shù)化模型,進(jìn)行圖像分割后,對于前景像素點(diǎn)將對應(yīng)的特征向量做線性變換得到一個(gè)正實(shí)數(shù),對于背景像素點(diǎn)直接賦零即得到該點(diǎn)的密度函數(shù)值;S50,由正則化風(fēng)險(xiǎn)最小化求取密度函數(shù)模型的參數(shù)w:參數(shù)w為與特征向量xp維數(shù)相同的變換向量,其中項(xiàng)稱為復(fù)雜度懲罰項(xiàng)或正則化懲罰項(xiàng),為參數(shù)w的復(fù)雜度測度,λ為正則化常量,Remp(w)為經(jīng)驗(yàn)風(fēng)險(xiǎn),近似地描述了使用參數(shù)估計(jì)w密度函數(shù)時(shí)的誤差的期望;S60,將正則化風(fēng)險(xiǎn)最小化問題轉(zhuǎn)化為一個(gè)線性規(guī)劃問題,求得密度函數(shù)模型的參數(shù)w。確定了密度函數(shù)的模型,可以估計(jì)圖像上任意區(qū)域中的目標(biāo)個(gè)數(shù)。優(yōu)選地,S20中密度函數(shù)的定義為,對訓(xùn)練圖像I,有密度函數(shù)將任意圖像像素點(diǎn)映射至一個(gè)實(shí)數(shù)(R是實(shí)數(shù)集的符號(hào)),滿足:其中S為訓(xùn)練圖像I的子區(qū)域,p為像素點(diǎn),c為S內(nèi)的目標(biāo)個(gè)數(shù)。優(yōu)選地,S30中真實(shí)密度函數(shù)為:其中為均值取在目標(biāo)點(diǎn)P處,協(xié)方差矩陣為σ2I的歸一化高斯核函數(shù)。優(yōu)選地,S40中密度函數(shù)參數(shù)化模型為:其中xp為像素點(diǎn)p的特征向量,其中T=T1∪T2∪…∪TC為所有目標(biāo)區(qū)域的總和,Ti,i=1,...C為第i個(gè)目標(biāo)區(qū)域。優(yōu)選地,特征向量xp為對每個(gè)像素點(diǎn)提取尺度不變特征變換描述子SIFTdescriptor,用戶可以設(shè)置是否分割圖像,如果是,則分割圖像后對目標(biāo)像素提取稠密尺度不變特征變換描述子DSIFT特征;如果否,則對整張圖像的所有像素提取DSIFT特征。優(yōu)選地,對特征向量xp進(jìn)行特征降維:選取一些圖片,提取DSIFT特征,對得到的特征集進(jìn)行K均值聚類,保存K個(gè)聚類中心,作為一個(gè)映射碼表,之后的訓(xùn)練和預(yù)測中,以其所屬的類來表示每個(gè)SIFT特征向量xp:優(yōu)選地,S50中取為w的l1范數(shù),優(yōu)選地,S50中引入了兩個(gè)密度函數(shù)的差異度量:將每張訓(xùn)練圖像上真實(shí)密度函數(shù)與密度函數(shù)的參數(shù)模型差異度的平均作為經(jīng)驗(yàn)風(fēng)險(xiǎn):此時(shí)訓(xùn)練樣本為每張訓(xùn)練圖像所對應(yīng)的真實(shí)密度函數(shù)。優(yōu)選地,S50中使用MESA距離作為密度函數(shù)的差異度量,MESA距離定義為,兩個(gè)密度函數(shù)的積分之差的絕對值在圖像的所有矩形子區(qū)域B上的最大值:其中為圖像I的所有矩形子區(qū)域B的集合。優(yōu)選地,S60中求解的線性規(guī)劃問題為:最小化括號(hào)中的表達(dá)式,并使下面條件得到滿足:w≥0其中ξi,i=1,...,N為松弛變量。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果如下:(1)在目標(biāo)計(jì)數(shù)問題中加入了目標(biāo)位置信息,并且引入了密度函數(shù)的概念,對目標(biāo)位置信息進(jìn)行簡單有效的描述;(2)直接利用正則化風(fēng)險(xiǎn)最小化原理,且通過各種簡化最后歸結(jié)為一個(gè)線性規(guī)劃問題,計(jì)算復(fù)雜度低,能很快地得到計(jì)數(shù)結(jié)果;(3)利用圖像分割提高估計(jì)精度和處理速度;(4)由于加入了目標(biāo)位置信息,能給出圖像中任意區(qū)域內(nèi)的目標(biāo)個(gè)數(shù),而不僅是整張圖像上的目標(biāo)個(gè)數(shù);(5)對于高密度群體,也能給出目標(biāo)計(jì)數(shù),而不僅是密度等級估計(jì)。附圖說明圖1為本發(fā)明實(shí)施例的基于正則風(fēng)險(xiǎn)最小化的圖像目標(biāo)計(jì)數(shù)方法的步驟流程圖。具體實(shí)施方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。相反,本發(fā)明涵蓋任何由權(quán)利要求定義的在本發(fā)明的精髓和范圍上做的替代、修改、等效方法以及方案。進(jìn)一步,為了使公眾對本發(fā)明有更好的了解,在下文對本發(fā)明的細(xì)節(jié)描述中,詳盡描述了一些特定的細(xì)節(jié)部分。對本領(lǐng)域技術(shù)人員來說沒有這些細(xì)節(jié)部分的描述也可以完全理解本發(fā)明。參見圖1,所示為本發(fā)明實(shí)施例的一種基于正則風(fēng)險(xiǎn)最小化的圖像目標(biāo)計(jì)數(shù)方法的步驟流程圖,包括以下步驟:S10,使用的每張訓(xùn)練圖像設(shè)置有相應(yīng)的對目標(biāo)進(jìn)行人工標(biāo)注的標(biāo)記點(diǎn)圖像,標(biāo)記點(diǎn)圖像以像素點(diǎn)標(biāo)記的方式給出每個(gè)目標(biāo)的位置。S20,對訓(xùn)練圖像定義密度函數(shù),其中密度函數(shù)為定義在圖像像素集上的實(shí)值函數(shù),且密度函數(shù)在任意圖像區(qū)域上的積分為該區(qū)域內(nèi)的目標(biāo)個(gè)數(shù)。密度函數(shù)的定義為,對訓(xùn)練圖像I,有密度函數(shù)將任意圖像像素點(diǎn)映射至一個(gè)實(shí)數(shù)(R是實(shí)數(shù)集的符號(hào)),滿足:其中S為訓(xùn)練圖像I的子區(qū)域,p為像素點(diǎn),c為S內(nèi)的目標(biāo)個(gè)數(shù)。S30,根據(jù)密度函數(shù)的定義,將訓(xùn)練圖像對應(yīng)的標(biāo)記點(diǎn)圖像與一個(gè)高斯模板卷積即得到真實(shí)密度函數(shù);真實(shí)密度函數(shù)為:其中為均值取在目標(biāo)點(diǎn)P處,協(xié)方差矩陣為σ2I的歸一化高斯核函數(shù)。S40,由密度函數(shù)的定義構(gòu)造密度函數(shù)的參數(shù)化模型,進(jìn)行圖像分割后,對于前景像素點(diǎn)將對應(yīng)的特征向量做線性變換得到一個(gè)正實(shí)數(shù),對于背景像素點(diǎn)直接賦零即得到該點(diǎn)的密度函數(shù)值;密度函數(shù)參數(shù)化模型為:其中xp為像素點(diǎn)p的特征向量,其中T=T1∪T2∪…∪TC為所有目標(biāo)區(qū)域的總和,Ti,i=1,...C為第i個(gè)目標(biāo)區(qū)域。尺度不變特征變換描述子(scaleinvariantfeaturetransformdescriptor,SIFTdescriptor)具有對形變、光照和對比度變化的不變性,又能保留空間信息,因而本發(fā)明實(shí)施例對每個(gè)像素點(diǎn)提取SIFT描述子作為每個(gè)像素點(diǎn)的特征xp(即DSIFT描述子(DenseSIFTdescriptor,稠密尺度不變特征變換描述子))。用戶可以設(shè)置是否分割圖像,如果是,則分割圖像后對目標(biāo)像素提取DSIFT特征;如果否,則對整張圖像的所有像素提取DSIFT特征。進(jìn)一步的,由于SIFT描述子為一個(gè)128維特征向量,又需要對每個(gè)像素點(diǎn)提取,這將導(dǎo)致在訓(xùn)練和預(yù)測中遇到很大的內(nèi)存瓶頸。采用如下方法進(jìn)行特征降維:選取一些圖片,提取DSIFT特征,對得到的特征集進(jìn)行K均值聚類(K-meansclustering),保存K個(gè)聚類中心,作為一個(gè)映射碼表。之后的訓(xùn)練和預(yù)測中,以其所屬的類來表示每個(gè)SIFT特征向量xp:S50,由正則化風(fēng)險(xiǎn)最小化求取密度函數(shù)模型的參數(shù)w:參數(shù)w為與特征向量xp維數(shù)相同的變換向量,其中項(xiàng)稱為復(fù)雜度懲罰項(xiàng)或正則化懲罰項(xiàng),為參數(shù)w的復(fù)雜度測度,λ為正則化常量,控制正則化強(qiáng)度,可通過實(shí)驗(yàn)選取。Remp(w)為經(jīng)驗(yàn)風(fēng)險(xiǎn),近似地描述了使用參數(shù)估計(jì)w密度函數(shù)時(shí)的誤差的期望。具體應(yīng)用實(shí)例中,取為w的l1范數(shù),為了計(jì)算經(jīng)驗(yàn)風(fēng)險(xiǎn)Remp(w),引入了兩個(gè)密度函數(shù)的差異度量:將每張訓(xùn)練圖像上真實(shí)密度函數(shù)與密度函數(shù)的參數(shù)模型差異度的平均作為經(jīng)驗(yàn)風(fēng)險(xiǎn):此時(shí)訓(xùn)練樣本為每張訓(xùn)練圖像所對應(yīng)的真實(shí)密度函數(shù)。使用MESA距離作為密度函數(shù)的差異度量,MESA(MaximumExcessoverSubArrays,子數(shù)組最大超量)距離定義為,兩個(gè)密度函數(shù)的積分之差的絕對值在圖像的所有矩形子區(qū)域B上的最大值:其中為圖像I的所有矩形子區(qū)域B的集合。S60,將正則化風(fēng)險(xiǎn)最小化問題轉(zhuǎn)化為一個(gè)線性規(guī)劃問題,求得密度函數(shù)模型的參數(shù)w。確定了密度函數(shù)的模型,可以估計(jì)圖像上任意區(qū)域中的目標(biāo)個(gè)數(shù)。求解的線性規(guī)劃問題為:最小化括號(hào)中的表達(dá)式,并使下面條件得到滿足:w≥0其中ξi,i=1,...,N為松弛變量。該問題的約束集中對應(yīng)所有可能的矩形子區(qū)域B有無限多個(gè)約束,導(dǎo)致上述線性規(guī)劃問題無法直接求解??梢允褂妙愃朴诟钇矫娣椒?cutting-planemethod)的迭代過程解決這個(gè)問題,每次迭代都只取約束集的一個(gè)子集為活動(dòng)約束(activeconstraint)求解,并在迭代過程中逐步增加約束,最終得到收斂解。在首次迭代,隨機(jī)取一些訓(xùn)練圖片再在這些圖片上取一些隨機(jī)的矩形子區(qū)域,以這些子區(qū)域?qū)?yīng)的約束求解,這是一個(gè)標(biāo)準(zhǔn)的線性規(guī)劃問題。設(shè)每次迭代得到解已有wj,可以計(jì)算并得到對應(yīng)的最大子數(shù)組,即為一個(gè)矩形子區(qū)域并判斷是否滿足其中0<ε<<1,若不滿足,則將對應(yīng)的約束加入活動(dòng)約束集中,進(jìn)入下一次迭代。如果滿足,則說明已經(jīng)求得了問題的收斂解,迭代結(jié)束。ε越小,得到的解越接近真實(shí)解,但需要的迭代次數(shù)也越多。通過以上技術(shù)方案,對每張測試圖像同樣做預(yù)處理后,帶入訓(xùn)練模塊求得的模型參數(shù),就可得到測試圖像密度函數(shù)的估計(jì)。而對密度函數(shù)的估計(jì)在任意圖像區(qū)域上積分,就得到該區(qū)域上目標(biāo)數(shù)目的估計(jì)。對于高密度群體,也能給出目標(biāo)計(jì)數(shù),而不僅是密度等級估計(jì)。避免了現(xiàn)有技術(shù)中,對于高密度群體,只能給出密度等級估計(jì),而不能給出目標(biāo)計(jì)數(shù)的問題。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。