本發(fā)明屬于計(jì)算機(jī)圖像處理領(lǐng)域,涉及一種基于被包圍狀態(tài)和貝葉斯模型的圖像顯著性檢測(cè)方法。
背景技術(shù):
近年來(lái),圖像的顯著性檢測(cè)作為計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要方向受到國(guó)內(nèi)外研究人員的普遍關(guān)注。當(dāng)前的方法主要發(fā)展為兩個(gè)方向:自底向上(非監(jiān)督)和自頂向下(監(jiān)督)。
目前的自底向上的顯著性檢測(cè)方法主要有:基于超像素的聚類的顯著性檢測(cè),它主要利用超像素之間的相似性進(jìn)行聚類得到顯著圖;基于圖割的多層自適應(yīng)區(qū)域融合方法,在這個(gè)方法中,利用超像素對(duì)圖像建立圖割模型,初始化自適應(yīng)參數(shù),通過(guò)自適應(yīng)參數(shù)的逐層調(diào)整得到多層初始顯著圖,最后融合所有的初始顯著圖得到最終的顯著圖;基于貝葉斯框架的顯著性檢測(cè),它通過(guò)處理基于像素為單位每一個(gè)像素,結(jié)合凸包和貝葉斯模型計(jì)算每個(gè)像素的顯著值得到顯著圖;基于背景先驗(yàn)和吸收馬爾可夫鏈的顯著性檢測(cè)方法,它主要是把圖像的四周邊界作為背景先驗(yàn),利用吸收馬爾可夫鏈進(jìn)行吸收處理得到每個(gè)超像素的顯著值,從而計(jì)算得到顯著圖。
自底向上的顯著性檢測(cè)方法還有很多,分析上面提到的幾種方法我們可以得出自底向上的顯著性檢測(cè)的幾個(gè)主要特征。自底向上的顯著性檢測(cè)方法需要先驗(yàn)知識(shí)的挖掘、基于圖像的圖模型的建立以及對(duì)應(yīng)數(shù)學(xué)模型的建立等。比如對(duì)比度先驗(yàn)、背景先驗(yàn)和貝葉斯框架的建立等。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)存在的問(wèn)題,本發(fā)明提出一種基于被包圍狀態(tài)和貝葉斯模型的圖像顯著性檢測(cè)方法,目的在于更加準(zhǔn)確、高效、快速的檢測(cè)出圖像中的顯著性物體。
本發(fā)明的技術(shù)方案為:
一種基于被包圍狀態(tài)和貝葉斯模型的圖像顯著性檢測(cè)方法,包括以下步驟:
第一步,計(jì)算包括顯著物體的注視區(qū)域
1.1)采用公式(1)計(jì)算得到一組二值圖;
其中,fφ是用于特征通道采樣的先驗(yàn)分布函數(shù);
1.2)基于步驟1.1)得到的二值圖,對(duì)二值圖進(jìn)行激活,激活二值圖中的被包圍區(qū)域;
m+(b)=m(b)∧b,(2)
二值圖中包含多個(gè)連通分支,當(dāng)一個(gè)像素被包含于邊界連通分支中時(shí),那么這個(gè)像素是沒(méi)有被包圍的?;谶@一準(zhǔn)則,以二值圖的邊界像素節(jié)點(diǎn)作為種子,利用注入填充算法(floodfillalgorithm)高效的覆蓋沒(méi)有被包圍的像素,從而得到激活圖m(b);激活圖m(b)把所有被包圍的像素值設(shè)為1,沒(méi)有被包圍的值設(shè)為0;最后利用公式(2)和公式(3)對(duì)激活圖m(b)進(jìn)行處理得到兩個(gè)子激活圖m+(b)、m-(b)。
1.3)計(jì)算得到包括顯著物體的注視區(qū)域
根據(jù)步驟1.2)得到的兩個(gè)子激活圖,利用公式(4)計(jì)算得到每一個(gè)二值圖的初始注視圖,再利用公式(5)對(duì)得到的二值圖的初始注視圖進(jìn)行歸一化處理,得到最終的注視圖,所述的注視圖為得到的包括顯著物體的注視區(qū)域;
其中,m+(b)和m-(b)為步驟1.2)得到的子激活圖;a(b)是經(jīng)計(jì)算得到的初始注視圖,i=1,2,…..,16;
第二步,建立超像素圖的模型
2.1)利用簡(jiǎn)單線性迭代聚類(slic)算法對(duì)初始圖像進(jìn)行圖像處理,得到一幅圖像的超像素圖。
2.2)超像素節(jié)點(diǎn)之間邊的建立以及邊的權(quán)重的計(jì)算
基于步驟2.1)得到的超像素圖,以每一個(gè)超像素作為節(jié)點(diǎn),在相鄰超像素之間建立邊的連接關(guān)系;如果不相鄰的兩個(gè)超像素與同一超像素連接,那么對(duì)這兩個(gè)超像素建立邊的連接關(guān)系。
利用公式(6)計(jì)算超像素圖中連接的兩個(gè)超像素節(jié)點(diǎn)之間的權(quán)重wi,j。
其中,ci和cj表示兩個(gè)超像素的特性均值;σ2是一個(gè)平衡參數(shù),在實(shí)驗(yàn)中設(shè)置為0.1。
2.3)建立超像素圖的模型g=(v,e);其中,v是超像素節(jié)點(diǎn)的集合,e是建立的邊的集合。
第三步,基于ncut對(duì)超像素進(jìn)行聚類得到三層聚類結(jié)果
3.1)ncut模型的建立
基于第二步得到的超像素圖的模型g,定義w=(ωij)mm作為超像素圖的模型g的鄰接矩陣,其中m=200,表示超像素的數(shù)量;
定義
由于公式(8)是一個(gè)np問(wèn)題,可以為每一個(gè)ai定義一個(gè)指示向量,這個(gè)指示向量可以通過(guò)求d-1l的前q個(gè)最小的特征向量得到,從而可以求解公式(8),其中,q=9。
3.2)利用ncut得到聚類信息
定義求解d-1l的前q個(gè)最小的特征向量為v1,v2,...,vq,對(duì)應(yīng)的特征值為λ1,λ2,...,λq。在圖g中,如果超像素si和sj是鄰接的,利用公式(10)重新構(gòu)建它們之間關(guān)系權(quán)重。
3.3)計(jì)算得到三層聚類結(jié)果
定義三個(gè)閾值t1,t2和t3,其中t1<t2<t3。對(duì)于兩個(gè)不同的區(qū)域,如果區(qū)域i和區(qū)域j之間的dij≤t1,那么合并這兩個(gè)區(qū)域?yàn)橐粋€(gè)區(qū)域,經(jīng)過(guò)計(jì)算可得到第一層聚類結(jié)果
第四步,利用貝葉斯模型對(duì)每一層聚類結(jié)果進(jìn)行處理,得到圖像的三層初始顯著圖。
4.1)先驗(yàn)圖的計(jì)算
對(duì)于聚類集中每個(gè)像素的先驗(yàn)顯著性概率有如下定義
其中,cluster定義一個(gè)聚類集合,att定義第一步(1.3)計(jì)算得到的注視圖區(qū)域。
4.2)觀測(cè)似然度的計(jì)算
在第一步中計(jì)算出的注視區(qū)域?qū)D像分割為不相交兩部分,定義注視區(qū)域?yàn)閕,其余部分為o。觀測(cè)似然概率的計(jì)算有如下定義
其中,ni定義了區(qū)域i中像素的數(shù)量,no定義了區(qū)域o中像素的數(shù)量,f(v)定義了像素v在cielab顏色空間的呈現(xiàn),ni(f(v))和no(f(v))定義了ni包含f(v)以及no包含f(v)的數(shù)量。
4.3)初始顯著圖的計(jì)算
利用貝葉斯框架,可以計(jì)算出圖像中每一個(gè)像素的顯著概率,從而得到初始的顯著圖,通過(guò)如下公式定義可計(jì)算出初始顯著圖
p(bk)=1-p(sal)(15)
對(duì)于三層聚類結(jié)果,經(jīng)過(guò)以上步驟的計(jì)算可得到三層初始顯著圖
第五步,融合三層初始顯著圖,計(jì)算得到最終的顯著圖。
5.1)最終顯著圖的計(jì)算
通過(guò)融合以上步驟所計(jì)算出的三層初始顯著圖,利用公式(16)可計(jì)算出最終的顯著圖
本發(fā)明的有益效果為:該方法區(qū)別于已有方法的特色在于,利用被包圍狀態(tài)預(yù)測(cè)人眼的注視區(qū)域,檢測(cè)出顯著物體的大致區(qū)域。接著用ncut對(duì)超像素進(jìn)行三層聚類得到三層聚類結(jié)果?;谧⒁晠^(qū)域和三層聚類結(jié)果,利用貝葉斯模型計(jì)算出三層初始顯著圖,最后融合三個(gè)初始顯著圖得到最終的顯著圖。該方法的顯著性檢測(cè)結(jié)果更接近真值。
附圖說(shuō)明
圖1是本發(fā)明方法的流程示意圖。
圖2是幾種不同方法的顯著性檢測(cè)結(jié)果對(duì)比圖。(a)待檢測(cè)圖片;(b)xl方法檢測(cè)結(jié)果;(c)mr方法檢測(cè)結(jié)果;(d)hs方法檢測(cè)結(jié)果;(e)ms方法檢測(cè)結(jié)果;(f)本發(fā)明的檢測(cè)結(jié)果;(g)真值。
圖3是本發(fā)明與其他顯著性檢測(cè)方法在msra標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)上的mae(平均絕對(duì)誤差)對(duì)比。
具體實(shí)施方法
下面結(jié)合附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行詳細(xì)說(shuō)明。本實(shí)施例以本發(fā)明技術(shù)方案為前提進(jìn)行實(shí)施,給出了詳細(xì)的實(shí)施方式和具體的操作過(guò)程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。
在msra標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)上對(duì)提出的算法進(jìn)行測(cè)試,其中msra數(shù)據(jù)庫(kù)中包含了1000張圖片,圖片中包含了各種背景復(fù)雜場(chǎng)景,數(shù)據(jù)庫(kù)復(fù)雜度較高,目標(biāo)大小、形狀、位置各異,對(duì)顯著性檢測(cè)具有很大的挑戰(zhàn)性。這個(gè)數(shù)據(jù)庫(kù)都有對(duì)應(yīng)的人工標(biāo)定的顯著性目標(biāo)區(qū)域圖。
圖1是本發(fā)明的流程示意圖;圖2是本發(fā)明與其他不同算法的顯著性檢測(cè)結(jié)果對(duì)比圖;圖3是本發(fā)明與其他不同顯著性檢測(cè)算法在msra標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)上的mae(平均絕對(duì)誤差)對(duì)比圖。實(shí)現(xiàn)本算法的具體步驟為:
步驟1,計(jì)算顯著物體的大致區(qū)域
1.1:二值圖的計(jì)算如下所示
其中fφ是用于特征通道采樣的先驗(yàn)分布函數(shù),
1.2:激活圖的計(jì)算
基于先前計(jì)算得到的二值圖,對(duì)二值圖進(jìn)行處理激活二值圖中的被包圍區(qū)域。
m+(b)=m(b)∧b,(2)
二值圖中包含多個(gè)連通分支,當(dāng)一個(gè)像素被包含于邊界連通分支中時(shí),那么這個(gè)像素是沒(méi)有被包圍的?;谶@一準(zhǔn)則,以邊界節(jié)點(diǎn)作為種子,利用注入填充算法(floodfillalgorithm)可以高效的覆蓋掉沒(méi)有被包圍的像素,從而得到激活圖m(b),它把所有被包圍的像素值設(shè)為1,沒(méi)有被包圍的值設(shè)為0。接著利用公式(2)(3)對(duì)激活圖進(jìn)行處理得到兩個(gè)子激活圖。
1.3:計(jì)算得到顯著物體的大致區(qū)域
其中,基于上一步得到的子激活圖,利用公式(4)計(jì)算出每一個(gè)二值圖的注視圖,基于得到的每一個(gè)二值圖的注視圖,利用公式(5)進(jìn)行歸一化處理得到最終的注視圖,這個(gè)注視圖就是我們要得到的顯著物體的大致區(qū)域。
步驟2,建立圖像的圖模型
2.1:計(jì)算得到初始超像素
利用簡(jiǎn)單線性迭代聚類(slic)算法對(duì)圖像處理,得到一幅圖像的超像素圖。slic算法是基于兩個(gè)像素的顏色相似性和坐標(biāo)距離進(jìn)行聚類得到最終的超像素。
2.2:圖模型中節(jié)點(diǎn)和邊的構(gòu)建
基于2.1中得到的超像素圖,以每一個(gè)超像素作為圖中節(jié)點(diǎn),相鄰超像素之間建立連接關(guān)系。如果不相鄰的兩個(gè)超像素和同一超像素鄰接,那么對(duì)這兩個(gè)超像素建立鄰接關(guān)系。
利用公式(6)可計(jì)算圖中連接的兩個(gè)節(jié)點(diǎn)之間的權(quán)重,其中ci和cj表示兩個(gè)超像素的特性均值,σ2是一個(gè)平衡參數(shù),在實(shí)驗(yàn)中設(shè)置為0.1。
最后,我們建立了圖的模型g=(v,e),其中,v是超像素節(jié)點(diǎn)的集合,e是建立的邊的集合。
步驟3:基于ncut對(duì)超像素進(jìn)行聚類得到三層聚類結(jié)果
3.1:歸一化割模型的建立
基于步驟2得到的圖g,定義w=(ωij)mm是它的鄰接矩陣,其中m=200,是超像素的數(shù)量;
定義
由于公式(8)是一個(gè)np問(wèn)題,可以為每一個(gè)ai定義一個(gè)指示向量,這個(gè)指示向量可以通過(guò)求d-1l的前q個(gè)最小的特征向量得到,從而可以求解公式(8),其中,q=9。
3.2:利用歸一化割得到聚類信息
定義求解d-1l的前q個(gè)最小的特征向量為v1,v2,...,vq,對(duì)應(yīng)的特征值為λ1,λ2,...,λq。在圖g中,如果超像素si和sj是鄰接的,利用公式(10)重新構(gòu)建它們之間關(guān)系權(quán)重。
3.3:計(jì)算得到三層聚類結(jié)果
定義三個(gè)閾值t1,t2和t3,它們的值分別為0.04,0.09和0.15。對(duì)于兩個(gè)不同的區(qū)域,如果區(qū)域i和區(qū)域j之間的dij≤0.04,那么合并這兩個(gè)區(qū)域?yàn)橐粋€(gè)區(qū)域,經(jīng)過(guò)計(jì)算可得到第一層聚類結(jié)果
步驟4:利用貝葉斯模型對(duì)每一層聚類結(jié)果進(jìn)行處理,得到圖像的三層初始顯著圖
4.1:先驗(yàn)圖的計(jì)算
對(duì)于聚類集中每個(gè)像素的先驗(yàn)顯著性概率有如下定義
其中,cluster定義了一個(gè)聚類集合,att定義了第一步(1.3)計(jì)算得到的注視圖區(qū)域。
4.2:觀測(cè)似然度的計(jì)算
在第一步中計(jì)算出的注視區(qū)域?qū)D像分割為不相交兩部分,定義注視區(qū)域?yàn)閕,其余部分為o。觀測(cè)似然概率的計(jì)算有如下定義
其中,ni定義了區(qū)域i中像素的數(shù)量,no定義了區(qū)域o中像素的數(shù)量,f(v)定義了像素v在cielab顏色空間的呈現(xiàn),ni(f(v))和no(f(v))定義了ni包含f(v)以及no包含f(v)的數(shù)量。
4.3:初始顯著圖的計(jì)算
利用貝葉斯框架,可以計(jì)算出圖像中每一個(gè)像素的顯著概率,從而得到初始的顯著圖,通過(guò)如下公式定義可計(jì)算出初始顯著圖
p(bk)=1-p(sal)(15)
對(duì)于三層聚類結(jié)果,經(jīng)過(guò)以上的計(jì)算可得到三層初始顯著圖
步驟5:融合三層初始顯著圖,計(jì)算得到最終的顯著圖
5.1:最終顯著圖的計(jì)算
通過(guò)融合以上步驟所計(jì)算出的三層初始顯著圖,利用公式(16)可計(jì)算出最終的顯著圖