本發(fā)明屬于計(jì)算機(jī)圖像處理領(lǐng)域,特別涉及一種基于視覺顯著性的人體區(qū)域檢測(cè)方法。
背景技術(shù):
視覺顯著性可直觀地理解為視覺場(chǎng)景中語(yǔ)義元素所能引起視覺注意的能力,這種能力依賴于目標(biāo)元素所擁有的顯著屬性,諸如特殊性及稀有性等。在對(duì)圖像場(chǎng)景信息進(jìn)行處理時(shí),可以通過顯著性區(qū)域檢測(cè)獲取優(yōu)先處理對(duì)象,以便于合理分配計(jì)算資源,降低計(jì)算量節(jié)約成本消耗。因此,檢測(cè)圖像顯著性區(qū)域具有較高的應(yīng)用價(jià)值。
Itti等人為代表的視覺注意理論提出者們,從人類視覺認(rèn)知的角度提議將視覺注意機(jī)制分為兩個(gè)類型:自上而下的目標(biāo)驅(qū)動(dòng)型顯著性檢測(cè),以及自下而上的數(shù)據(jù)驅(qū)動(dòng)型顯著性檢測(cè)。自上而下的方法融入了更多的人類語(yǔ)義感知及模型訓(xùn)練,而自下而上的方法更注重于從諸如對(duì)比度、空間分布等圖像底層特征中檢測(cè)顯著性區(qū)域。
當(dāng)前的顯著性檢測(cè)多采用自下而上的方法,由底層數(shù)據(jù)出發(fā)計(jì)算分析顯著目標(biāo)或背景區(qū)域所具有的特征屬性,并將此屬性作為一種先驗(yàn)知識(shí)用其區(qū)分場(chǎng)景中的顯著目標(biāo)及背景。其中,對(duì)比度先驗(yàn)知識(shí)賴于其優(yōu)良的區(qū)分能力被大量的顯著性檢測(cè)算法所采用,并且衍生出諸如基于局部對(duì)比度及基于全局對(duì)比度的檢測(cè)算法。
近年來基于超像素的顯著性區(qū)域檢測(cè)算法得到廣泛使用。Yang等人以超像素為節(jié)點(diǎn)構(gòu)建連通圖同時(shí)結(jié)合邊界先驗(yàn)知識(shí),采用基于圖的流形排序方法進(jìn)行顯著檢測(cè)。Yan等提出一種基于多尺度分割的顯著性區(qū)域檢測(cè)算法,在樹圖模型上融合三種尺度下顯著圖進(jìn)而得到最終顯著圖,該算法取得了良好的效果。Wei等人以各超像素到達(dá)圖像邊界的最短測(cè)地線距離來衡量其顯著性,測(cè)地線距離越長(zhǎng)超像素作為前景目標(biāo)的可能性越大。Zhu等對(duì)Wei的測(cè)地線先驗(yàn)知識(shí)進(jìn)一步優(yōu)化提出了具有更強(qiáng)魯棒性的邊界連通性先驗(yàn)知識(shí),借助于該先驗(yàn)知識(shí)偵測(cè)背景區(qū)域進(jìn)而逆向獲取顯著前景目標(biāo)?;谶吔邕B通先驗(yàn)知識(shí)的顯著性區(qū)域檢測(cè)算法對(duì)圖像邊界上超像素的依賴程度較高,當(dāng)圖像邊界上超像素不含圖像內(nèi)部任何背景信息時(shí),會(huì)嚴(yán)重影響顯著檢測(cè)效果。
有鑒于此,有必要對(duì)現(xiàn)有技術(shù)中的基于視覺顯著性的人體區(qū)域檢測(cè)方法予以改進(jìn),以解決上述問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于公開一種基于視覺顯著性的人體區(qū)域檢測(cè)方法,用以提高對(duì)輸入圖像中的人體區(qū)域的顯著性檢測(cè),以確定優(yōu)先處理對(duì)象,并合理分配計(jì)算資源,降低計(jì)算開銷。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于視覺顯著性的人體區(qū)域檢測(cè)方法,該方法包括以下步驟:
S1、獲取監(jiān)控區(qū)域的視頻流圖像作為輸入圖像;
S2、對(duì)輸入圖像執(zhí)行預(yù)分割以形成超像素區(qū)域單元;
S3、統(tǒng)計(jì)超像素區(qū)域單元在多個(gè)顏色通道內(nèi)的灰度值概率分布,使用灰度值概率分布間的KL散度的調(diào)和平均值度量相鄰超像素區(qū)域單元間的顏色差異性;
S4、以超像素區(qū)域單元為節(jié)點(diǎn)構(gòu)建初始閉環(huán)連通圖,并對(duì)初始閉環(huán)連通圖作若干次鄰接擴(kuò)展,以構(gòu)建若干鄰接擴(kuò)展閉環(huán)連通圖,使用KL散度的調(diào)和平均值對(duì)初始閉環(huán)連通圖及鄰接擴(kuò)展閉環(huán)連通圖的邊作加權(quán)處理;
S5、基于超像素區(qū)域單元間的顏色差異性,同時(shí)結(jié)合空間距離權(quán)重及背景概率權(quán)重,在初始閉環(huán)連通圖及鄰接擴(kuò)展閉環(huán)連通圖上計(jì)算各超像素區(qū)域單元的顯著值,并使用顯著值為超像素區(qū)域單元賦值,以獲取初始人體顯著圖;
S6、平均融合初始人體顯著圖,并進(jìn)行引導(dǎo)圖濾波處理。
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S1具體為:通過攝像機(jī)獲取監(jiān)控區(qū)域的視頻流圖像作為輸入圖像,所述監(jiān)控區(qū)域位于攝像機(jī)的正下方。
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S2具體為:采用簡(jiǎn)單線性迭代聚類算法,自適應(yīng)選擇緊湊度因子u,保持搜索步長(zhǎng)為常量將輸入圖像執(zhí)行預(yù)分割以形成超像素區(qū)域單元,所述超像素區(qū)域單元的內(nèi)部顏色與大小均一致;
其中,u為簡(jiǎn)單線性迭代聚類算法在種子點(diǎn)周圍完成一次迭代聚類后,類內(nèi)像素顏色的最大差值,Num為輸入圖像中的總像素?cái)?shù),K為預(yù)分割的超像素區(qū)域單元的數(shù)量。
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S2還包括:在輸入圖像中選取若干種子點(diǎn),并在種子點(diǎn)周圍以2S×2S的區(qū)域內(nèi)進(jìn)行迭代聚類。
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S3中,超像素區(qū)域單元的灰度值概率分布間的KL散度的調(diào)和平均值的計(jì)算公式為:
其中,為超像素區(qū)域單元p所包含的像素在對(duì)應(yīng)顏色通道內(nèi)的灰度值概率分布,γ為超像素區(qū)域單元q所包含的像素在對(duì)應(yīng)顏色通道內(nèi)的灰度值概率分布,表示超像素區(qū)域單元p在對(duì)應(yīng)顏色通道內(nèi)灰度值取i的像素所占的概率,γ(i)表示超像素區(qū)域單元q在對(duì)應(yīng)顏色通道內(nèi)灰度值取i的像素所占的概率,i∈[0,255],為超像素區(qū)域單元p的灰度值概率分布相對(duì)于超像素區(qū)域單元q的灰度值概率分布的KL散度,為超像素區(qū)域單元q的灰度值概率分布相對(duì)于超像素區(qū)域單元p的灰度值概率分布的KL散度。
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S4中,以各超像素區(qū)域單元為節(jié)點(diǎn)構(gòu)建初始閉環(huán)連通圖,然后對(duì)初始閉環(huán)連通圖進(jìn)行兩次鄰接擴(kuò)展,以形成初始閉環(huán)連通圖及兩幅鄰接擴(kuò)展閉環(huán)連通圖,并使用灰度值概率分布間KL散度的調(diào)和平均值對(duì)初始閉環(huán)連通圖及兩幅鄰接擴(kuò)展閉環(huán)連通圖的邊作加權(quán)處理。
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S5中超像素區(qū)域單元的顯著值的計(jì)算公式為:
其中,DHM(p,pi)為相鄰超像素區(qū)域單元p與超像素區(qū)域單元pi間的KL散度的調(diào)和平均值,Dsp(p,pi)為歸一化處理后的相鄰超像素區(qū)域單元p與超像素區(qū)域單元pt間的空間歐氏距離,常數(shù)σsp設(shè)置為0.25,為超像素區(qū)域單元pi的背景概率權(quán)重,常數(shù)σE設(shè)置為2.5,E(pi)為超像素區(qū)域單元pi的邊界連通性度量值。
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S5中的“使用顯著值為超像素區(qū)域單元賦值”具體為:對(duì)初始閉環(huán)連通圖及鄰接擴(kuò)展閉環(huán)連通圖中的各超像素區(qū)域單元分別進(jìn)行賦值。
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S6具體包括以下子步驟:
S61、平均融合若干初始人體顯著圖,以產(chǎn)生融合顯著圖;
S62、將融合顯著圖作為引導(dǎo)圖,對(duì)融合顯著圖進(jìn)行引導(dǎo)濾波處理;
S63、采用OTSU算法對(duì)經(jīng)過引導(dǎo)濾波處理后的融合顯著圖進(jìn)行圖像二值化處理,以得到二值化圖像;
S64、將二值化圖像作為引導(dǎo)圖,對(duì)經(jīng)過引導(dǎo)濾波處理后的融合顯著圖進(jìn)行引導(dǎo)濾波處理,以獲取顯著的人體區(qū)域。
作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟S3中的“顏色通道”包括:R顏色通道、G顏色通道、B顏色通道。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:在本發(fā)明中,有效的降低了超像素區(qū)域單元間顏色差異性對(duì)其顯著一致性的過度影響,提高了對(duì)輸入圖像中具有顯著性特征的人體區(qū)域的檢測(cè)效果,從而獲得了更加精確且視覺效果也更加平滑的人體顯著圖,從而實(shí)現(xiàn)了高效的確定優(yōu)先處理對(duì)象,并合理分配計(jì)算資源,降低了后期對(duì)輸入圖像中對(duì)行人目標(biāo)進(jìn)行跟蹤和/或計(jì)數(shù)的計(jì)算開銷。
附圖說明
圖1為本發(fā)明一種基于視覺顯著性的人體區(qū)域檢測(cè)方法具體實(shí)施方式的流程示意圖;
圖2為圖1所示的獲取監(jiān)控區(qū)域的視頻流圖像的工作原理示意圖;
圖3為本發(fā)明所示的超像素區(qū)域在種子點(diǎn)周圍迭代聚類的搜索步長(zhǎng)及搜索區(qū)域設(shè)置的示意圖;
圖4為本發(fā)明所示的邊界連通性的一種幾何圖形解釋。
具體實(shí)施方式
下面結(jié)合附圖所示的各實(shí)施方式對(duì)本發(fā)明進(jìn)行詳細(xì)說明,但應(yīng)當(dāng)說明的是,這些實(shí)施方式并非對(duì)本發(fā)明的限制,本領(lǐng)域普通技術(shù)人員根據(jù)這些實(shí)施方式所作的功能、方法、或者結(jié)構(gòu)上的等效變換或替代,均屬于本發(fā)明的保護(hù)范圍之內(nèi)。
請(qǐng)參圖1至圖4所示出的本發(fā)明一種基于視覺顯著性的人體區(qū)域檢測(cè)方法的一種具體實(shí)施方式。
參圖1所示,通過本實(shí)施方式所示出的一種基于視覺顯著性的人體區(qū)域檢測(cè)方法可對(duì)包含行人目標(biāo)(或者行人區(qū)域)的原始圖像或者輸入圖像進(jìn)行行人目標(biāo)的顯著性進(jìn)行檢測(cè),得到包含行人目標(biāo)的顯著圖,降低后期行人檢測(cè)或者行人跟蹤技術(shù)的計(jì)算開銷。
具體的,在本實(shí)施方式中,該基于視覺顯著性的人體區(qū)域檢測(cè)方法包括以下步驟。
首先,執(zhí)行步驟S1、獲取監(jiān)控區(qū)域的視頻流圖像作為輸入圖像。
參圖2所示,本發(fā)明一種基于視覺顯著性的人體區(qū)域檢測(cè)方法是基于攝像機(jī)垂直拍攝并適用于室外情況和室內(nèi)情況。在本實(shí)施方式中,該步驟S1具體為:通過攝像機(jī)10獲取監(jiān)控區(qū)域30的視頻流圖像作為輸入圖像,所述監(jiān)控區(qū)域30位于攝像機(jī)10的正下方。
攝像機(jī)10設(shè)置在出入口20附近的正上方,行人可沿著箭頭201的方向上在出入口20中來回走動(dòng)。攝像機(jī)10所獲取的監(jiān)控區(qū)域30可完全覆蓋出入口20的全部區(qū)域。
在本實(shí)施方式中,該監(jiān)控區(qū)域30為矩形,當(dāng)然也可以為正方形或圓形或者其他形狀。攝像機(jī)10位于監(jiān)控區(qū)域30的中心點(diǎn)301的正上方,由此我們可以推導(dǎo)出,該監(jiān)控區(qū)域30位于攝像機(jī)10的正下方。
然后,執(zhí)行步驟S2、對(duì)輸入圖像執(zhí)行預(yù)分割形成超像素區(qū)域單元。
超像素預(yù)分割通常作為圖像分割算法的預(yù)處理步驟。所謂“超像素區(qū)域單元”或者“超像素”是指,具有相似紋理、顏色、亮度等特征的相鄰像素構(gòu)成的有一定視覺意義的不規(guī)則像素塊,其利用像素之間特征的相似性將輸入圖像中的像素進(jìn)行分組,用少量的超像素區(qū)域單元來代替大量的像素來表達(dá)輸入圖像中的特征,很大程度上降低了輸入圖像后期處理的復(fù)雜度。超像素預(yù)分割已經(jīng)廣泛用于圖像分割、目標(biāo)識(shí)別等計(jì)算機(jī)視覺領(lǐng)域。
簡(jiǎn)單線性迭代聚類算法(Simple LinearIterative Clustering,SLIC)算法,是K-means算法的拓展開發(fā)。在SLIC算法中,對(duì)于輸入圖像中對(duì)應(yīng)每個(gè)像素的(L,a,b)顏色值和(x,y)坐標(biāo)組成一個(gè)5維向量V[L,a,b,x,y],兩個(gè)像素的相似性即可由它們的向量距離來度量,距離越大,相似性越小。
SLIC算法采用CIELab顏色空間歐式距離度量顏色差異,即對(duì)于灰度圖像顏色距離為:采用像素空間坐標(biāo)的歐式距離,即:度量空間距離。然后結(jié)合顏色距離及空間距離,取來計(jì)算像素間差異,并使用緊湊度因子u用來控制空間距離相對(duì)于顏色距離的權(quán)重,緊湊度因子u取值區(qū)間為[1,40]。緊湊度因子u為簡(jiǎn)單線性迭代聚類算法在種子點(diǎn)周圍完成一次迭代聚類后,類內(nèi)像素顏色的最大差值。
如圖3所示,SLIC算法將步長(zhǎng)近似為其中,Num為輸入圖像中的總像素?cái)?shù),K為預(yù)分割的超像素區(qū)域單元的數(shù)量。優(yōu)選的,在本實(shí)施方式中,可在輸入圖像中選取若干種子點(diǎn),并在種子點(diǎn)周圍以2S×2S的區(qū)域范圍內(nèi)進(jìn)行迭代聚類。
出于構(gòu)建連通圖的需要,超像素區(qū)域單元的外形越規(guī)則,所構(gòu)建的初始閉環(huán)連通圖及鄰接擴(kuò)展連通圖的效果越好。因此,在本實(shí)施方式中,在采用SLIC算法預(yù)分割輸入圖像時(shí),本方法不在原固定區(qū)間[1,40]內(nèi)取u值而是自適應(yīng)選擇緊湊度因子u,即取為種子點(diǎn)周圍完成一次迭代聚類后,類內(nèi)像素顏色的最大差值,且隨迭代聚類的繼續(xù),緊湊度因子u不斷更新。另外,保持搜索步長(zhǎng)為常量,以確保產(chǎn)生大小一致的超像素區(qū)域單元。
接下來,執(zhí)行步驟S3、統(tǒng)計(jì)超像素區(qū)域單元在多個(gè)顏色通道內(nèi)的灰度值概率分布,使用灰度值概率分布間的KL散度的調(diào)和平均值度量超像素區(qū)域單元間的顏色差異性。
在本實(shí)施方式中,對(duì)兩個(gè)超像素區(qū)域單元p及q作就步驟S3的具體過程作示范性說明。
假設(shè)兩超像素區(qū)域單元p及q所包含像素在相應(yīng)顏色通道內(nèi)的灰度值概率分布分別為和γ,則超像素區(qū)域單元的灰度值概率分布間的KL散度的調(diào)和平均值的計(jì)算公式為:
其中,
在本實(shí)施方式中,DHM(p,q)為兩超像素區(qū)域單元p及q的灰度值概率分布間的KL散度的調(diào)和平均值,為超像素區(qū)域單元p所包含的像素在對(duì)應(yīng)顏色通道內(nèi)的灰度值概率分布,γ為超像素區(qū)域單元q所包含的像素在對(duì)應(yīng)顏色通道內(nèi)的灰度值概率分布,表示超像素區(qū)域單元p在對(duì)應(yīng)顏色通道內(nèi)灰度值取i的像素所占的概率,γ(i)表示超像素區(qū)域單元q在對(duì)應(yīng)顏色通道內(nèi)灰度值取i的像素所占的概率,i∈[0,255],為超像素區(qū)域單元p的灰度值概率分布相對(duì)于超像素區(qū)域單元q的灰度值概率分布的KL散度,為超像素區(qū)域單元q的灰度值概率分布相對(duì)于超像素區(qū)域單元p的灰度值概率分布的KL散度。由于故采用二者的調(diào)和平均值作為一種有效的差異度量。
對(duì)于單通道灰度圖像,本發(fā)明直接采用上述方式計(jì)算KL散度調(diào)和平均值,然后用其度量相鄰超像素區(qū)域單元p及q間的顏色差異性。對(duì)于三通道RGB的輸入圖像,可分別求超像素區(qū)域單元p及q在R顏色通道、G顏色通道及B顏色通道內(nèi)的KL散度調(diào)和平均值,最后對(duì)三者求平均,以度量超像素區(qū)域單元p及q間的顏色差異性。當(dāng)然,可在上述三個(gè)顏色通道內(nèi)進(jìn)行適當(dāng)?shù)念伾疲詫?shí)現(xiàn)對(duì)輸入圖像中的主要顏色或者主要顏色區(qū)域有更好的適應(yīng)性,減低計(jì)算開銷。
然后,執(zhí)行步驟S4、以超像素區(qū)域單元為節(jié)點(diǎn)構(gòu)建初始閉環(huán)連通圖,并對(duì)初始閉環(huán)連通圖作若干次鄰接擴(kuò)展,以構(gòu)建若干鄰接擴(kuò)展閉環(huán)連通圖,使用KL散度的調(diào)和平均值對(duì)初始閉環(huán)連通圖及鄰接擴(kuò)展閉環(huán)連通圖的邊作加權(quán)處理。
在經(jīng)過預(yù)分割處理的輸入圖像上,以各超像素區(qū)域單元為節(jié)點(diǎn)構(gòu)建鄰接連通圖,同時(shí)對(duì)圖像邊界上的超像素區(qū)域單元兩兩直接鄰接連通形成初始的閉環(huán)連通圖G1,并用鄰接矩陣A描述初始閉環(huán)連通圖節(jié)點(diǎn)間鄰接情況。采用公式Bn=(A+E)n計(jì)算鄰接矩陣A與單位矩陣E之和的n階乘冪運(yùn)算獲取矩陣Bn,再將Bn的非零元素置為1,對(duì)角元素取為零,得到n步可達(dá)矩陣An。
具體的,在本實(shí)施方式中,鄰接擴(kuò)展步長(zhǎng)n=2或3(單位:超像素單元),從而計(jì)算得到兩個(gè)鄰接擴(kuò)展矩陣A2及A3,二者分別對(duì)應(yīng)鄰接擴(kuò)展閉環(huán)連通圖G2與鄰接擴(kuò)展閉環(huán)連通圖G3,然后用KL散度調(diào)和平均值為G1、G2、G3的邊作加權(quán)處理。本實(shí)施方式中,對(duì)初始閉環(huán)連通圖G1僅進(jìn)行兩次鄰接擴(kuò)展,具體操作時(shí)可適當(dāng)增加次數(shù),可對(duì)初始閉環(huán)連通圖G1作三次或者次數(shù)更多的鄰接擴(kuò)展,以形成數(shù)量更多的鄰接擴(kuò)展閉環(huán)連通圖。進(jìn)一步的,鄰接擴(kuò)展步長(zhǎng)n的單位也可為像素點(diǎn),也可設(shè)定擴(kuò)展方向的區(qū)域,該區(qū)域包含多個(gè)像素點(diǎn)。例如,向分別向左上、右下、左下,右下分別進(jìn)行以兩個(gè)像素點(diǎn)區(qū)域?yàn)閱卧泥徑訑U(kuò)展。
然后,執(zhí)行步驟S5、基于超像素區(qū)域單元間的顏色差異性,同時(shí)結(jié)合空間距離權(quán)重及背景概率權(quán)重,在初始閉環(huán)連通圖及鄰接擴(kuò)展閉環(huán)連通圖上計(jì)算各超像素區(qū)域單元的顯著值,并使用顯著值為超像素區(qū)域單元賦值,以獲取初始人體顯著圖。
在本實(shí)施方式中,基于超像素區(qū)域單元間的顏色對(duì)比度計(jì)算各超像素區(qū)域單元的顯著值。在本發(fā)明中各超像素區(qū)域單元間的顏色對(duì)比度,采用超像素區(qū)域單元內(nèi)像素灰度值概率分布間KL散度的調(diào)和平均值進(jìn)行度量,而非傳統(tǒng)意義上的兩超像素區(qū)域單元間的平均色差,因此可進(jìn)一步提高對(duì)輸入圖像中具有視覺顯著性的行人區(qū)域的檢測(cè)與獲取。
通常,人們會(huì)更加注意到輸入圖像中行人目標(biāo)與周圍顏色對(duì)比度非常大的區(qū)域。因?yàn)榭臻g關(guān)系上相鄰區(qū)域的高對(duì)比度比很遠(yuǎn)區(qū)域的高對(duì)比度更容易突顯某一區(qū)域的視覺注意力。為此,本發(fā)明結(jié)合超像素區(qū)域單元間的空間距離權(quán)重計(jì)算各超像素區(qū)域單元的顯著值。
具體的,本發(fā)明通過計(jì)算各超像素區(qū)域單元和其它所有超像素區(qū)域單元間顏色對(duì)比度加權(quán)和來定義其顯著性值,權(quán)值由空間距離決定,較遠(yuǎn)的區(qū)域單元設(shè)定較小的權(quán)值。另外,考慮到計(jì)算顏色對(duì)比度加權(quán)和時(shí),求和項(xiàng)中背景概率取值高的超像素區(qū)域單元應(yīng)當(dāng)提供較高的顏色對(duì)比度權(quán)重。故而,本發(fā)明同時(shí)考慮結(jié)合背景概率權(quán)重計(jì)算各超像素區(qū)域單元的顯著值。為此,本發(fā)明各超像素區(qū)域單元p的顯著值S(p),按如下計(jì)算公式定義:
上述公式中,DHM(p,pi)為超像素區(qū)域單元p及超像素區(qū)域單元pi間的KL散度的調(diào)和平均值,具體計(jì)算如前文所述。上述公式中,Wsp(p,pi)為超像素區(qū)域單元p及超像素區(qū)域單元pi之間空間距離權(quán)重。
具體的,其中Dsp(p,pi)為相鄰超像素區(qū)域單元中心的空間歐氏距離且已經(jīng)過歸一化處理,σsp設(shè)置為0.25。上述公式中,表示超像素區(qū)域單元pi的背景概率權(quán)重。
本發(fā)明以表示各超像素區(qū)域單元的背景概率權(quán)重,定義σE在本發(fā)明中取值為2.5。上述公式中,E(p)為超像素區(qū)域單元p的邊界連通性度量值,E(p)越大背景概率權(quán)重越大,漸趨于概率值1,反之則漸趨于0。
在本實(shí)施方式中,對(duì)E(p)采用公式計(jì)算,其中L(p)為超像素區(qū)域單元p與邊界的接觸長(zhǎng)度,R(p)為超像素區(qū)域單元p的擴(kuò)展區(qū)域面積。
如圖4所示,A、B、C、D為相應(yīng)四個(gè)超像素區(qū)域單元所能擴(kuò)展的區(qū)域,區(qū)域A的邊界接觸長(zhǎng)度為2,區(qū)域面積為40,邊界連通性度量值為0.32,相對(duì)與區(qū)域B、C、D,區(qū)域A更有可能作為前景區(qū)域,即相應(yīng)超像素區(qū)域單元的顯著值越高。本發(fā)明中,R(p)的計(jì)算公式如下:
其中,為相應(yīng)初始閉環(huán)連通圖或鄰接擴(kuò)展閉環(huán)連通圖上兩個(gè)不同超像素區(qū)域單元間的最短路徑長(zhǎng)度,其值經(jīng)過離差標(biāo)準(zhǔn)化方式歸一化處理,且D(p,p)=0,DHM(pj,pj+1)為超像素區(qū)域單元間KL散度的調(diào)和平均值。上述公式中超像素區(qū)域單元pi對(duì)超像素區(qū)域單元p擴(kuò)展區(qū)域面積的貢獻(xiàn)值被限制在(0,1]內(nèi),所以R(p)的取值區(qū)間為[1,N]。其中,N為超像素區(qū)域單元數(shù)量。σ(p)為計(jì)算超像素區(qū)域單元p擴(kuò)展區(qū)域面積時(shí)采用的控制參數(shù),對(duì)于不同的p其取值不同,在本實(shí)施方式中,將σ(p)自適應(yīng)設(shè)置為對(duì)所有超像素區(qū)域單元p與其它超像素區(qū)域單元節(jié)點(diǎn)間最短路徑長(zhǎng)度值進(jìn)行二值化分割所需閾值的1/3,該閾值采用OTSU算法(即最大類間方差法)計(jì)算得到。
采用OTSU算法將一組數(shù)據(jù)分割為兩類時(shí)可以確保類間方差足夠大,而類內(nèi)差異較小。因此,該分割意味著錯(cuò)分概率最小。
超像素區(qū)域單元p與邊界的接觸長(zhǎng)度L(p)采用如下公式計(jì)算,其中δ函數(shù)在超像素區(qū)域單元pi為邊界節(jié)點(diǎn)時(shí),δ的值為1;否則,δ的值為0。
在本實(shí)施方式中,可根據(jù)各超像素區(qū)域單元p的顯著值S(p)為各超像素區(qū)域單元賦值,由于是在初始閉環(huán)連通圖及若干鄰接擴(kuò)展閉環(huán)連通圖上分別進(jìn)行計(jì)算,從而能夠獲得不同的若干初始人體顯著圖。
最后,執(zhí)行步驟S6、平均融合初始人體顯著圖,并進(jìn)行引導(dǎo)圖濾波處理。
平均融合獲得的若干初始人體顯著圖,產(chǎn)生融合顯著圖,然后對(duì)其進(jìn)行引導(dǎo)圖濾波優(yōu)化處理。引導(dǎo)圖濾波是一種快速的邊界保持平滑濾波算法,能夠在引導(dǎo)圖的導(dǎo)引下進(jìn)行濾波操作同時(shí)保持原圖的主要輪廓。本發(fā)明采用引導(dǎo)圖濾波方法對(duì)融合顯著圖進(jìn)行進(jìn)一步優(yōu)化處理。
該步驟S6具體包括以下子步驟。
子步驟S61、平均融合若干初始人體顯著圖,以產(chǎn)生融合顯著圖;
子步驟S62、將融合顯著圖作為引導(dǎo)圖,對(duì)融合顯著圖進(jìn)行引導(dǎo)濾波處理;
子步驟S63、采用OTSU算法對(duì)經(jīng)過引導(dǎo)濾波處理后的融合顯著圖進(jìn)行圖像二值化處理,以得到二值化圖像;
子步驟S64、將二值化圖像作為引導(dǎo)圖,對(duì)經(jīng)過引導(dǎo)濾波處理后的融合顯著圖進(jìn)行引導(dǎo)濾波處理,以獲取顯著的人體區(qū)域。
在本實(shí)施方式中,為解決單純用平均顏色差值度量各超像素區(qū)域單元間顏色差異的局限性,本發(fā)明提出采用超像素區(qū)域單元內(nèi)部相應(yīng)顏色通道內(nèi)灰度值概率分布間的KL散度的調(diào)和平均值對(duì)顏色差異進(jìn)行更有效的度量;為更好地反映超像素區(qū)域單元在空間上的鄰接關(guān)系及彼此間的相似度,本發(fā)明用超像素區(qū)域單元作節(jié)點(diǎn)構(gòu)建閉環(huán)連通圖,用KL散度的調(diào)和平均值為閉環(huán)連通圖的邊進(jìn)行加權(quán)。
同時(shí),為避免由于空間距離累加而對(duì)超像素區(qū)域單元間顏色差異度量產(chǎn)生的過度影響,本發(fā)明提出對(duì)超像素區(qū)域單元間的鄰接區(qū)域進(jìn)行一定程度的擴(kuò)展;為提高顯著檢測(cè)的可靠性,降低單尺度顯著檢測(cè)易產(chǎn)生的顯著區(qū)域誤判幾率,本發(fā)明在若干經(jīng)過鄰接擴(kuò)展的閉環(huán)連通圖上計(jì)算各超像素區(qū)域單元的顯著值,從而得到若干幅顯著圖并進(jìn)行平均融合增強(qiáng),而后進(jìn)一步采用引導(dǎo)濾波方式優(yōu)化顯著檢測(cè)效果。
上文所列出的一系列的詳細(xì)說明僅僅是針對(duì)本發(fā)明的可行性實(shí)施方式的具體說明,它們并非用以限制本發(fā)明的保護(hù)范圍,凡未脫離本發(fā)明技藝精神所作的等效實(shí)施方式或變更均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無(wú)論從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。
此外,應(yīng)當(dāng)理解,雖然本說明書按照實(shí)施方式加以描述,但并非每個(gè)實(shí)施方式僅包含一個(gè)獨(dú)立的技術(shù)方案,說明書的這種敘述方式僅僅是為清楚起見,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)將說明書作為一個(gè)整體,各實(shí)施例中的技術(shù)方案也可以經(jīng)適當(dāng)組合,形成本領(lǐng)域技術(shù)人員可以理解的其他實(shí)施方式。