本發(fā)明屬于圖像處理技術(shù),具體涉及一種基于多人眼感知分組特性的圖構(gòu)造方法。
背景技術(shù):
:對(duì)于計(jì)算機(jī)視覺(jué)和圖像處理而言,圖能夠直觀描述圖像中各區(qū)域之間的關(guān)系,是一種有效的信息表示方法。此外,圖作為一個(gè)數(shù)學(xué)分支,有著深厚的數(shù)學(xué)理論背景和概括力強(qiáng)的優(yōu)點(diǎn)?,F(xiàn)有很多研究工作基于圖對(duì)計(jì)算機(jī)視覺(jué)和圖像進(jìn)行處理,包括半監(jiān)督的分類和降維方法,以及無(wú)監(jiān)督的譜聚類算法等。盡管圖是基于圖的算法的核心,但是對(duì)于圖構(gòu)造的問(wèn)題確相對(duì)較少地受到研究和關(guān)注。大部分工作基于k近鄰的方法對(duì)圖進(jìn)行構(gòu)造。這些圖構(gòu)造方法的性能非常依賴于所選取的k值。此外,這些圖構(gòu)造方法認(rèn)為每種特征(比如說(shuō)顏色、位置和紋理特征)的作用是相同的,按這種特征作用相同的方式來(lái)計(jì)算邊權(quán)使得在復(fù)雜圖像中的檢測(cè)效果不佳。另外,一部分用于圖像處理的方法通過(guò)連接空間相鄰的圖像區(qū)域來(lái)對(duì)圖進(jìn)行構(gòu)造,這種圖構(gòu)造方法僅僅考慮了人眼感知分組特性中的空間鄰近特性,在處理復(fù)雜圖像時(shí)性能有待提高。技術(shù)實(shí)現(xiàn)要素:發(fā)明目的:本發(fā)明的目的在于解決現(xiàn)有技術(shù)中存在的不足,提供一種基于多人眼感知分組特性的圖構(gòu)造方法。技術(shù)方案:本發(fā)明的一種基于多人眼感知分組特性的圖構(gòu)造方法,依次包括以下步驟:s1:基于現(xiàn)有的simplelineariterativeclustering(slic)算法,將待處理圖像過(guò)分割成多個(gè)超像素,并將超像素定義為所構(gòu)造圖的頂點(diǎn);s2:基于人眼感知分組特性中的空間鄰近特性,將在圖像空間中相鄰的超像素相連,作為圖的一部分邊;空間鄰近特性表示在空間上相近的區(qū)域很有可能被感知分組到同一個(gè)物體之內(nèi);s3:基于人眼感知分組特性中的顏色相似特性,將圖像中顏色特征相似的超像素相連,作為圖的另一部分邊;顏色相似特性是指具有相似顏色特征的區(qū)域更有可能被感知分組為同一物體;s4:基于人眼感知分組特性的紋理相似特性,將圖像中紋理特征相似的超像素相連,作為圖的又一部分邊;紋理相似特性是指具有相似紋理特征的區(qū)域更有可能被感知分組為同一物體;s5:基于prsvm算法,學(xué)習(xí)頂點(diǎn)間的空間鄰近度、顏色相似度和紋理相似度對(duì)相連頂點(diǎn)間邊權(quán)的作用大??;根據(jù)空間鄰近度、顏色相似度和紋理相似度對(duì)邊權(quán)的作用大小,將頂點(diǎn)間的不同感知分組特性進(jìn)行加權(quán)求和,獲得圖的邊權(quán)。進(jìn)一步的,所述步驟s1中,將待處理的圖像過(guò)分割成300個(gè)同質(zhì)的超像素,用r表示這些超像素集合,將這些超像素定義為所構(gòu)造圖的頂點(diǎn);其中,各超像素的空間特征、顏色特征和紋理特征分別定義為對(duì)應(yīng)超像素中各像素點(diǎn)在圖像坐標(biāo)位置、cielab顏色空間和lbp紋理空間中的平均值,每一個(gè)圖像都將其各超像素的空間特征、顏色特征和紋理特征歸一化到[0,1]之間。進(jìn)一步的,所述步驟s2中,將圖像空間中相鄰的超像素定義為在圖像中存在共享輪廓線的超像素;用大小為300*300的鄰接矩陣a記錄兩兩超像素在圖像中是否具有共享輪廓線,用ri和rj(i和j是對(duì)應(yīng)超像素下標(biāo),1≤i,j≤300)代表兩個(gè)超像素:如果aij=1,那么兩個(gè)超像素ri和rj在圖像中具有共享輪廓線即邊(ri,rj)∈e;否則,這兩個(gè)超像素在圖像中不具有共享輪廓線,e代表所構(gòu)造圖中邊的集合。進(jìn)一步的,所述步驟s3中,將顏色距離dcolor小于0.15的超像素定義為顏色特征相似的超像素,即:如果兩個(gè)超像素ri和rj的顏色距離dcolor(ri,rj)小于0.15,那么這兩個(gè)超像素進(jìn)行相連獲得圖的一條邊,即邊(ri,rj)∈e,e代表所構(gòu)造圖中邊的集合;其中,兩個(gè)超像素之間的顏色距離dcolor是指這兩個(gè)超像素顏色特征的歐幾里得距離。進(jìn)一步的,所述步驟s4中,將紋理距離dtexture小于0.15的超像素定義為紋理特征相似的超像素,即:如果兩個(gè)超像素ri和rj的紋理距離dtexture(ri,rj)小于0.15,那么將這兩個(gè)超像素進(jìn)行相連獲得圖的一條邊,即邊(ri,rj)∈e;其中,兩個(gè)超像素之間的紋理距離dtexture是指這兩個(gè)超像素紋理特征的歐幾里得距離。進(jìn)一步的,在所述步驟s5中:兩個(gè)超像素ri和rj之間的空間相近度sspace(ri,rj)、顏色相似度scolor(ri,rj)和紋理相似度stexture(ri,rj)根據(jù)高斯核函數(shù)進(jìn)行計(jì)算,如下式所示:在上式中,尺度參數(shù)σ2是控制距離對(duì)相似度影響的一個(gè)常數(shù),設(shè)置為0.1,dspace、dcolor和dtexture分別表示兩個(gè)超像素之間的空間距離、顏色距離和紋理距離,分別定義為兩個(gè)超像素空間位置特征、顏色特征和紋理特征的歐幾里得距離。進(jìn)一步的,所述步驟s5中,將邊的權(quán)重定義為兩個(gè)超像素之間空間鄰近度、顏色相似度和紋理相似度的加權(quán)和,如下式所示:w(ri,rj)=α1sspace(ri,rj)+α2scolor(ri,rj)+α2stexture(ri,rj)α=[α1;α2;α3]是相似度對(duì)邊權(quán)的作用大小向量,其中α1、α2和α3分別表示空間鄰近度、顏色相似度和紋理相似度對(duì)邊權(quán)的作用大小。進(jìn)一步的,基于prsvm算法,學(xué)習(xí)頂點(diǎn)間的空間鄰近度、顏色相似度和紋理相似度對(duì)相連頂點(diǎn)間邊權(quán)的作用大小。目標(biāo)是學(xué)習(xí)得到一個(gè)邊權(quán)函數(shù),使得對(duì)于任一超像素rk,如果超像素ri比超像素rj更有可能與rk感知分組到一起,那么ri和rk之間邊的權(quán)重應(yīng)該大于rj和rk之間邊的權(quán)重。為了學(xué)習(xí)得到最終的邊權(quán),獲得適用于顯著目標(biāo)檢測(cè)問(wèn)題的圖像感知分組結(jié)果,在顯著目標(biāo)檢測(cè)數(shù)據(jù)庫(kù)上進(jìn)行訓(xùn)練,而訓(xùn)練所需的正負(fù)樣本選取方式如下所述。將屬于同一類別(顯著目標(biāo)或圖像背景)的超像素對(duì)作為正樣本,記為v+,正樣本的特征x(v+)由對(duì)應(yīng)超像素對(duì)的空間鄰近度、顏色相似度和紋理相似度組成:x(v+)=[sspace(v+);scolor(v+);stexture(v+)];將不屬于同一類別(一個(gè)屬于顯著目標(biāo)而另一個(gè)屬于圖像背景)的超像素對(duì)作為負(fù)樣本,記為v-,負(fù)樣本的特征x(v-)由對(duì)應(yīng)超像素對(duì)的空間鄰近度、顏色相似度和紋理相似度組成:x(v-)=[sspace(v-);scolor(v-);stexture(v-)]。通過(guò)解決如下的優(yōu)化問(wèn)題計(jì)算空間鄰近度、顏色相似度和紋理相似度對(duì)邊權(quán)的重要性;在上式中,p中包含了所有的正負(fù)樣本對(duì),c>0是一個(gè)懲罰系數(shù),表示對(duì)誤差的寬容度。有益效果:本發(fā)明從人眼有效的感知分組認(rèn)知特性出發(fā),結(jié)合多種感知分組認(rèn)知特性選取圖的邊,并且基于prsvm算法解決多種感知分組認(rèn)知特性的整合問(wèn)題得到圖的邊權(quán);充分考慮人眼有效的先驗(yàn)認(rèn)知特性,有助于提高基于圖的算法的性能;而且本發(fā)明將該圖構(gòu)造方法應(yīng)用于圖像中的顯著目標(biāo)檢測(cè)算法研究中,能夠提高顯著目標(biāo)檢測(cè)的檢測(cè)準(zhǔn)確率(precision)和召回率(recall)。附圖說(shuō)明圖1為實(shí)施例的整體流程示意圖;圖2為本發(fā)明應(yīng)用于顯著目標(biāo)檢測(cè)問(wèn)題時(shí),與九種顯著目標(biāo)檢測(cè)方法的視覺(jué)比較圖。具體實(shí)施方式下面對(duì)本發(fā)明技術(shù)方案進(jìn)行詳細(xì)說(shuō)明,但是本發(fā)明的保護(hù)范圍不局限于所述實(shí)施例。如圖1所示,本實(shí)施例的基于多人眼感知分組特性的圖構(gòu)造方法,依次包括以下步驟:s1:基于現(xiàn)有的simplelineariterativeclustering(slic)算法,將待處理圖像過(guò)分割成多個(gè)超像素,并將超像素定義為所構(gòu)造圖的頂點(diǎn)。在本實(shí)施例中,將待處理的圖像過(guò)分割成300個(gè)同質(zhì)的超像素(用r表示這些超像素集合),將這些超像素定義為所構(gòu)造圖的頂點(diǎn)。各超像素的空間特征、顏色特征和紋理特征分別定義為對(duì)應(yīng)超像素中各像素點(diǎn)在圖像坐標(biāo)位置、cielab顏色空間和lbp紋理空間中的平均值。每一個(gè)圖像都將其各超像素的空間特征、顏色特征和紋理特征歸一化到[0,1]之間。s2:基于人眼感知分組特性中的空間鄰近特性,將在圖像空間中相鄰的超像素相連,作為圖的一部分邊??臻g鄰近特性表示在空間上相近的區(qū)域很有可能被感知分組到同一個(gè)物體之內(nèi)。在本實(shí)施例中,用大小為300*300的鄰接矩陣a記錄兩兩超像素在圖像中是否具有共享輪廓線,用ri和rj(i和j是超像素下標(biāo),1≤i,j≤300)代表兩個(gè)超像素:如果aij=1,那么兩個(gè)超像素ri和rj在圖像中具有共享輪廓線;否則,這兩個(gè)超像素在圖像中不具有共享輪廓線。用e代表所構(gòu)造圖中邊的集合。將圖像空間中相鄰的超像素定義為在圖像中存在共享輪廓線的超像素。如果兩個(gè)超像素ri和rj在圖像中具有共享輪廓線(即aij=1),那么這兩個(gè)超像素進(jìn)行相連獲得圖的一條邊(即邊(ri,rj)∈e)。s3:基于人眼感知分組特性中的顏色相似特性,將圖像中顏色特征相似的超像素相連,作為圖的一部分邊;顏色相似特性是指具有相似顏色特征的區(qū)域更有可能被感知分組為同一物體;在本實(shí)施例中,將顏色距離dcolor小于0.15的超像素定義為顏色特征相似的超像素。也就是說(shuō),如果兩個(gè)超像素ri和rj的顏色距離dcolor(ri,rj)小于0.15,那么這兩個(gè)超像素進(jìn)行相連獲得圖的一條邊(即邊(ri,rj)∈e)。其中,兩個(gè)超像素之間的顏色距離dcolor定義為這兩個(gè)超像素顏色特征的歐幾里得距離。s4:基于人眼感知分組特性的紋理相似特性,將圖像中紋理特征相似的超像素相連,作為圖的一部分邊;紋理相似特性是指具有相似紋理特征的區(qū)域更有可能被感知分組為同一物體;在本實(shí)施例中,將紋理距離dtexture小于0.15的超像素定義為紋理特征相似的超像素。也就是說(shuō),如果兩個(gè)超像素ri和rj的紋理距離dtexture(ri,rj)小于0.15,那么將這兩個(gè)超像素進(jìn)行相連獲得圖的一條邊(即邊(ri,rj)∈e)。其中,兩個(gè)超像素之間的紋理距離dtexture定義為這兩個(gè)超像素紋理特征的歐幾里得距離。s5:將邊的權(quán)重定義為兩個(gè)超像素之間空間鄰近度、顏色相似度和紋理相似度的加權(quán)和,如下式所示。w(ri,rj)=α1sspace(ri,rj)+α2scolor(ri,rj)+α2stexture(ri,rj)α=[α1;α2;α3]是相似度對(duì)邊權(quán)的作用大小向量。其中α1、α2和α3分別表示空間鄰近度、顏色相似度和紋理相似度對(duì)邊權(quán)的作用大小。兩個(gè)超像素ri和rj之間的空間相近度sspace(ri,rj)、顏色相似度scolor(ri,rj)和紋理相似度stexture(ri,rj)根據(jù)高斯核函數(shù)進(jìn)行計(jì)算,如下式所示:在上式中,尺度參數(shù)σ2是控制距離對(duì)相似度影響的一個(gè)常數(shù)。在本發(fā)明中設(shè)置為0.1。dspace、dcolor和dtexture分別表示兩個(gè)超像素之間的空間距離、顏色距離和紋理距離,分別定義為兩個(gè)超像素空間位置特征、顏色特征和紋理特征的歐幾里得距離?;趐rsvm算法,學(xué)習(xí)頂點(diǎn)間的空間鄰近度、顏色相似度和紋理相似度對(duì)相連頂點(diǎn)間邊權(quán)的作用大小。目標(biāo)是學(xué)習(xí)得到一個(gè)邊權(quán)函數(shù),使得對(duì)于任一超像素rk,如果超像素ri比超像素rj更有可能與rk感知分組到一起,那么ri和rk之間邊的權(quán)重應(yīng)該大于rj和rk之間邊的權(quán)重。為了學(xué)習(xí)得到最終的邊權(quán),獲得適用于顯著目標(biāo)檢測(cè)問(wèn)題的圖像感知分組結(jié)果,在顯著目標(biāo)檢測(cè)數(shù)據(jù)庫(kù)上進(jìn)行訓(xùn)練,而訓(xùn)練所需的正負(fù)樣本選取方式如下所述。將屬于同一類別(顯著目標(biāo)或圖像背景)的超像素對(duì)作為正樣本,記為v+。正樣本的特征x(v+)由對(duì)應(yīng)超像素對(duì)的空間鄰近度、顏色相似度和紋理相似度組成:x(v+)=[sspace(v+);scolor(v+);stexture(v+)]。將不屬于同一類別(一個(gè)屬于顯著目標(biāo)而另一個(gè)屬于圖像背景)的超像素對(duì)作為負(fù)樣本,記為v-。負(fù)樣本的特征x(v-)由對(duì)應(yīng)超像素對(duì)的空間鄰近度、顏色相似度和紋理相似度組成:x(v-)=[sspace(v-);scolor(v-);stexture(v-)]。本發(fā)明通過(guò)解決如下的優(yōu)化問(wèn)題計(jì)算空間鄰近度、顏色相似度和紋理相似度對(duì)邊權(quán)的重要性。在上式中,p中包含了所有的正負(fù)樣本對(duì)。c>0是一個(gè)懲罰系數(shù),表示對(duì)誤差的寬容度。為驗(yàn)證本發(fā)明提供的圖構(gòu)造方法的有效性,下面使用該方法構(gòu)造圖并應(yīng)用于顯著目標(biāo)檢測(cè)問(wèn)題:基于所構(gòu)造的圖,使用下述函數(shù)對(duì)圖像中的顯著目標(biāo)進(jìn)行檢測(cè):f*=(d-αw)-1q上式中,矩陣w記錄了根據(jù)本發(fā)明方法所得的邊權(quán)。d是一個(gè)對(duì)角矩陣,記錄所構(gòu)造圖中各頂點(diǎn)的度:第i個(gè)頂點(diǎn)的度d(i,i)等于鄰接矩陣w中第i行的所有元素之和。α是[0,1)之間的參數(shù),表明了在計(jì)算某超像素的顯著值時(shí),與該超像素相連的其他超像素的顯著值和該超像素的初始值之間的相對(duì)貢獻(xiàn)。在實(shí)驗(yàn)中,將α設(shè)置為0.99。q是初始狀態(tài)向量,表明所構(gòu)造圖中哪些頂點(diǎn)為查詢頂點(diǎn)。實(shí)驗(yàn)中,首先分別使用位于圖像四條邊上的超像素作為背景查詢頂點(diǎn)得到四個(gè)相應(yīng)的臨時(shí)結(jié)果,將這四個(gè)臨時(shí)結(jié)果相乘得到初始顯著圖,然后使用這個(gè)初始顯著圖的平均值作為閾值將該圖進(jìn)行分割得到前景和背景,最后使用前景區(qū)域作為前景查詢頂點(diǎn)計(jì)算得到最終的顯著圖。此處,使用平均準(zhǔn)確率map在msra10k和ecssd數(shù)據(jù)庫(kù)上進(jìn)行了實(shí)驗(yàn),并將基于所構(gòu)造圖的顯著目標(biāo)檢測(cè)方法和9種當(dāng)前最好的顯著目標(biāo)檢測(cè)方法進(jìn)行了對(duì)比。這9種方法分別是:mst方法、gp方法、cl方法、bd方法、gr方法、hm方法、cb方法、rc方法、ft方法。本發(fā)明的方法則簡(jiǎn)稱為ours。msra10k數(shù)據(jù)庫(kù)包含了10000幅測(cè)試圖像,每張圖像對(duì)應(yīng)有人工的像素級(jí)的顯著性標(biāo)注。各種方法產(chǎn)生的顯著圖在msra10k數(shù)據(jù)庫(kù)上的平均準(zhǔn)確率map評(píng)測(cè)結(jié)果如下表所示。在比較的9種方法種,gp、cl、bd、gr和hm方法都是基于圖的顯著目標(biāo)檢測(cè)方法。從表中可見(jiàn),本發(fā)明提供的圖構(gòu)造方法使得顯著目標(biāo)檢測(cè)的性能優(yōu)于其他基于圖的方法。表1.多種顯著目標(biāo)檢測(cè)方法在msra10k數(shù)據(jù)庫(kù)上的性能比較方法名稱oursmstgpclbdmap0.92360.87250.91220.87430.9053方法名稱grhmcbrcftmap0.89630.87570.86100.81740.5976ecssd數(shù)據(jù)庫(kù)包含了1000張前景和背景均比較復(fù)雜的圖像,每張圖像對(duì)應(yīng)有人工的像素級(jí)的顯著性標(biāo)注。各種方法產(chǎn)生的顯著圖在ecssd數(shù)據(jù)庫(kù)上的平均準(zhǔn)確率map評(píng)測(cè)結(jié)果如下表所示。從表中可見(jiàn),各種方法在該數(shù)據(jù)庫(kù)上的性能都低于在msra10k數(shù)據(jù)庫(kù)上的性能,說(shuō)明復(fù)雜的自然場(chǎng)景圖像更難檢測(cè)出顯著目標(biāo)。本發(fā)明優(yōu)于其他顯著目標(biāo)檢測(cè)方法,說(shuō)明本發(fā)明提供的圖構(gòu)造方法有利于在復(fù)雜自然場(chǎng)景圖像中檢測(cè)出顯著目標(biāo)。表2多種顯著目標(biāo)檢測(cè)方法在ecssd數(shù)據(jù)庫(kù)上的性能比較方法名稱oursmstgpclbdmap0.80150.74750.78630.75680.7659方法名稱grhmcbrcftmap0.78650.76350.75140.68420.4526為進(jìn)一步說(shuō)明本發(fā)明的有效性,本發(fā)明與其他九種不同顯著目標(biāo)檢測(cè)方法的檢測(cè)結(jié)果進(jìn)行了視覺(jué)比較,如圖2所示,第a列是輸入的原圖,第b列是人工標(biāo)注的真值圖,第c列是本發(fā)明的檢測(cè)結(jié)果,其他各列是其余不同方法的檢測(cè)結(jié)果。比較的第一幅圖中包含了復(fù)雜的前景,其他方法只檢測(cè)出了顯著前景目標(biāo)的一部分,而本發(fā)明能夠更統(tǒng)一地高亮出顯著前景目標(biāo)。比較的第二幅圖中包含了復(fù)雜的背景,其他方法容易錯(cuò)誤地高亮背景區(qū)域,而本發(fā)明能夠更好地抑制圖像背景區(qū)域。可見(jiàn),本發(fā)明有助于在復(fù)雜自然場(chǎng)景圖像中檢測(cè)出顯著目標(biāo),使得檢測(cè)結(jié)果與人工標(biāo)注的真值圖更加一致。當(dāng)前第1頁(yè)12