本發(fā)明圖像處理技術(shù)領(lǐng)域,具體是一種對自然圖像無監(jiān)督分割法,可用于視頻目標(biāo)跟蹤識(shí)別和基于內(nèi)容的圖像檢索中。
背景技術(shù):
近年來,隨著科學(xué)技術(shù)與計(jì)算機(jī)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,數(shù)字圖像在各行各業(yè)中使用的越來越廣泛。在海量圖像中,如何能夠快速識(shí)別出一幅圖像,一直成為計(jì)算機(jī)視覺與模式識(shí)別熱門討論的話題。自從20世紀(jì)90年代初,基于內(nèi)容的圖像檢索技術(shù)被提出以來,它一直是研究者的研究熱點(diǎn),其主要通過提取圖像的紋理、顏色、目標(biāo)的形狀以及它們的空間位置信息等特征,計(jì)算被檢索圖像與數(shù)據(jù)集中的圖像的相似度距離,來實(shí)現(xiàn)圖像的識(shí)別與檢索。經(jīng)過近20年的研究與發(fā)展,在應(yīng)用方面也已經(jīng)比較成熟,像google、百度、bing等收索引擎公司都開發(fā)了屬于自己的基于內(nèi)容的圖像搜索產(chǎn)品。比如:googlesimilarimages,百度識(shí)圖等。
在大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)媒介上存在三種大數(shù)據(jù),即靜態(tài)網(wǎng)頁的文本、語音、圖像和視頻,其中視頻和圖像的比重最大。對這些圖像或視頻幀進(jìn)行快速準(zhǔn)確、無監(jiān)督地分割,能產(chǎn)生巨大的經(jīng)濟(jì)效益。比如,圖像分割用于圖像檢索、圖像和視頻編輯、基于圖像和視頻內(nèi)容的廣告投放。在人工智能時(shí)代,計(jì)算機(jī)視覺是人工智能的重要組成部分,圖像分割尤其是自動(dòng)分割技術(shù)是機(jī)器視覺的關(guān)鍵技術(shù),在圖像識(shí)別、目標(biāo)跟蹤、場景分析識(shí)別等方面,圖像分割都起著關(guān)鍵的作用。
自動(dòng)確定圖像的分割類別數(shù)一直是學(xué)術(shù)界和工業(yè)界研究的熱點(diǎn)和難點(diǎn),目前還沒有十分有效的算法來精確地確定每一幅圖像的類別數(shù)。對于結(jié)構(gòu)簡單的自然圖像,比較好的方法能準(zhǔn)確確定類別數(shù),但對于結(jié)構(gòu)比較復(fù)雜的圖像,一般會(huì)存在誤差?,F(xiàn)有的自然圖像無監(jiān)督分割方法不穩(wěn)定,容易造成圖像的過分割或欠分割。由于自然圖像場景比較復(fù)雜,目前還沒有比較好的方法準(zhǔn)確確定自然圖像的類別數(shù)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于針對上述現(xiàn)有技術(shù)的不足,提出一種基于均值漂移和模糊聚類的自然圖像無監(jiān)督分割方法,以準(zhǔn)確地確定圖像的類別數(shù),提高分割精度。
本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
一.技術(shù)原理:
自然圖像中的每個(gè)目標(biāo)區(qū)域的像素點(diǎn)在rgb特征空間上會(huì)有一定的密度分布形式,且每個(gè)類別的像素點(diǎn)在rgb特征空間分布中有一個(gè)密度最大點(diǎn),在圖像上就是類別的主色彩。圖像像素分布的密度最大點(diǎn)簡稱為密度峰值,它實(shí)際上就是分割區(qū)域中像素的聚類中心,找到了密度峰值,就確定了分割區(qū)域的聚類中心,同時(shí)根據(jù)密度峰值的數(shù)目就可以確定圖像的分割區(qū)域數(shù)。根據(jù)這一思路,本發(fā)明采用均值漂移算法來搜索自然圖像在rgb彩色空間的密度峰值,可以同時(shí)確定圖像的分割類別數(shù)和聚類中心,然后用改進(jìn)的模糊聚類算法實(shí)現(xiàn)自然圖像的分割,該發(fā)明方法能實(shí)現(xiàn)自然圖像的自動(dòng)分割。
二.技術(shù)方案
根據(jù)上述原理,本發(fā)明的實(shí)現(xiàn)技術(shù)方案包括如下:
(1)讀取待分割自然圖像it,并對自然圖像it所有像素的rgb值除以255進(jìn)行歸一化處理,使得每個(gè)像素rgb值的范圍在[0,1]之間,其中t=1,2,…,n,n表示待分割圖像數(shù)量;
(2)對歸一化后的自然圖像進(jìn)行平滑,得到平滑圖像i′t;
(3)在平滑后自然圖像的rgb彩色空間中均勻初始化64個(gè)搜索初始點(diǎn)即初始聚類中心,對應(yīng)的初始聚類中心數(shù)目c=64,這些起始點(diǎn)構(gòu)成的初始點(diǎn)集合表示為v={v1,v2,…,vp,…,v64},其中,vp表示第p個(gè)起始點(diǎn),p=1,2,…,64;
(4)使用均值漂移迭代公式,以64個(gè)初始點(diǎn)為起點(diǎn)進(jìn)行迭代搜索,得到收斂點(diǎn)集合v′={v′1,v′2,…,v′k,…,v′64},其中,v′k表示第k個(gè)收斂點(diǎn);
(5)在rgb彩色空間中,設(shè)置收斂點(diǎn)v′k的下標(biāo)初始值k=1,設(shè)置閾值m=100,刪除周圍像素點(diǎn)分布密度比較小的收斂點(diǎn):
(5a)計(jì)算以收斂點(diǎn)v′k為球心,以h為半徑的高維球包含的像素點(diǎn)數(shù)目nk,比較nk和m的大小:若nk<m,則從收斂點(diǎn)集合v′中刪除收斂點(diǎn)v′k,并令c=c-1,否則,不刪除v′k;
(5b)令k=k+1,判斷k≤64是否成立:若成立,返回(5a),否則進(jìn)入步驟(6);
(6)合并收斂點(diǎn)集合v′={v′1,v′2,…,v′p,…,v′q,…,v′c}中任意兩個(gè)收斂點(diǎn)間的歐氏距離小于閾值h的收斂點(diǎn),得到聚類中心集合v″,其中,v′p表示第p個(gè)收斂點(diǎn),v′q表示第q個(gè)收斂點(diǎn),p≠q;
(7)根據(jù)步驟(6)計(jì)算得出的聚類中心集合v″,計(jì)算平滑后的自然圖像i′t的像素點(diǎn)隸屬度矩陣u,矩陣u的第k行,第i列元素uki的計(jì)算公式如下:;
(8)對隸屬度矩陣u進(jìn)行平滑,得到像素的平滑隸屬度矩陣u′,矩陣u′的第k行,第i列元素u′ki的計(jì)算公式如下:
其中,u′ki∈[0,1],i=1,2,…,n,n表示平滑圖像i′t中像素的總數(shù),k=1,2,…,c,c表示聚類中心的總數(shù),ni表示以第i個(gè)像素為中心的平滑窗口內(nèi)的鄰域像素集合,sj和si表示平滑窗口內(nèi)像素的空間坐標(biāo),xi表示平滑窗口中心像素的值,xj表示鄰域像素的值,設(shè)置平滑窗口的大小為5×5,σs表示平滑窗口的空間核帶寬,在整個(gè)平滑過程中,σs的大小是固定不變的,設(shè)置σs=1,σir表示第i個(gè)像素對應(yīng)的自適應(yīng)值域核帶寬,nr表示鄰域窗口內(nèi)鄰域像素的數(shù)目;
(9)采用最大隸屬度規(guī)則對每個(gè)像素點(diǎn)的平滑隸屬度u′ki進(jìn)行去模糊化,得到圖像it中第i個(gè)像素的類標(biāo)簽li:
(10)重復(fù)步驟(9),對圖像it中的所有像素點(diǎn)進(jìn)行去模糊化,得到分割圖像,分割圖像中每個(gè)分割區(qū)域的像素具有相同的類標(biāo)簽。
本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點(diǎn):
1.本發(fā)明對圖像進(jìn)行平滑處理,能有效抑制噪聲和離群值對分割結(jié)果的影響。
2.本發(fā)明采用局部密度梯度上升的方法搜索像素的密度峰值,不僅能發(fā)現(xiàn)像素的分布模式,而且能確定出全局最優(yōu)的聚類中心和分割類別數(shù)。
3.本發(fā)明通過對像素隸屬度矩陣進(jìn)行平滑,既提高了對噪聲和離群值的抑制能力,又提高分割區(qū)域內(nèi)部的一致性。
附圖說明
圖1是本發(fā)明的實(shí)現(xiàn)總流程圖;
圖2是本發(fā)明在實(shí)現(xiàn)過程中像素點(diǎn)及均值漂移迭代點(diǎn)在rgb空間的分布形式圖;
圖3是用本發(fā)明方法對編號為a的自然圖像的分割結(jié)果與人工分割結(jié)果的對比圖。
圖4是用本發(fā)明方法對編號為b的自然圖像的分割結(jié)果與人工分割結(jié)果的對比圖。
圖5是用本發(fā)明方法對編號為c的自然圖像的分割結(jié)果與人工分割結(jié)果的對比圖。
圖6是用本發(fā)明方法對編號為d的自然圖像的分割結(jié)果與人工分割結(jié)果的對比圖。
具體實(shí)施方式
參照圖1,本發(fā)明的實(shí)現(xiàn)步驟如下:
步驟一:對待分割圖像進(jìn)行歸一化處理。
輸入如圖2(a)所示的自然圖像it,i=1,2,…,n,n表示圖像數(shù)據(jù)集中待分割圖像的數(shù)量;對圖像ii像素的rgb值進(jìn)行歸一化處理,使每個(gè)彩色通道的值在[0,1]范圍之間,圖2(a)圖像像素點(diǎn)在歸一化rgb彩色空間中分布如圖2(b)所示;
步驟二:利用如下平滑公式對圖像it進(jìn)行平滑:
其中,
其中,nr表示滑動(dòng)窗口內(nèi)像素的總數(shù),ni表示第i個(gè)滑動(dòng)窗口內(nèi)所有像素點(diǎn)的集合,xj表示滑動(dòng)窗口內(nèi)的像素點(diǎn)的值,
步驟三:在rgb彩色空間中均勻初始化均值漂移迭代起始點(diǎn)。
在單位彩色立方體空間均勻初始化64個(gè)密度峰值搜索初始點(diǎn),每個(gè)初始點(diǎn)是一個(gè)小立方體的中心,單位立方體被64個(gè)小立方體均勻分割,每個(gè)小立方體的體積是1/64,小立方體外接球的半徑為
由于64個(gè)小立方體的外接球能完全覆蓋單位彩色立方體的空間,利用這種初始化方式保證了彩色立方體內(nèi)的所有像素在第一次迭代時(shí)都被搜索到,64個(gè)均值漂移迭代初始點(diǎn)在歸一化rgb彩色空間中的分布如圖2(d)所示;
步驟四:在平滑圖像的歸一化rgb彩色空間中,使用均值漂移迭代公式迭代搜索像素點(diǎn)密度峰值。
均值漂移在彩色空間中的迭代公式如下所示:
其中,
其中,x表示集合sh(yk)內(nèi)的像素點(diǎn),設(shè)置均值漂移迭代終止閾值ε2=0.001,第m個(gè)迭代點(diǎn)收斂的條件為:
以64個(gè)初始點(diǎn)為迭代搜索起始點(diǎn),使用均值漂移迭代公式在整個(gè)彩色空間內(nèi)搜索密度峰值,均值漂移向量會(huì)逐漸向像素分布密度大的方向移動(dòng),直至收斂到局部密度峰值點(diǎn),由于在均值漂移迭代搜索過程中,64個(gè)均值漂移迭代中心點(diǎn)之間互不影響,且不同時(shí)收斂,且在rgb彩色空間中,部分均值漂移迭代搜索起始點(diǎn)周圍無像素點(diǎn)分布,故這些迭代搜索起始點(diǎn)在第一次迭代后即收斂,64個(gè)收斂點(diǎn)在歸一化rgb彩色空間中分布如圖2(e)所示。
步驟五:在64個(gè)收斂點(diǎn)中,刪除滿足閾值條件的收斂點(diǎn)。
設(shè)置收斂點(diǎn)總數(shù)c=64,設(shè)置刪除閾值m=100,并將其與集合sh(yk)內(nèi)像素點(diǎn)的數(shù)目nk進(jìn)行比較:若nk<m,則從收斂點(diǎn)集合中刪除收斂點(diǎn)
所述收斂點(diǎn)yk+1,是沿著密度梯度增大的方向迭代搜索得到的,它是局部密度極大值點(diǎn),對應(yīng)的像素集合sh(yk)內(nèi)像素?cái)?shù)量nk應(yīng)該是局部最大的,如果nk小于一定的閾值,說明此收斂點(diǎn)并不是真正的局部像素密度峰值,并不能代表一個(gè)類別的像素特征,應(yīng)該刪除這些密度比較小的收斂點(diǎn),該刪除方法能有效避免圖像的過度分割,刪除滿足條件的收斂點(diǎn)后得到的的集合表示為:v′={v′1,v′2,…,v′p,…,v′q,…,v′c}。
步驟六:合并歐式距離小于合并閾值的收斂點(diǎn)。
設(shè)置合并閾值
(6a)設(shè)置左收斂點(diǎn)v′p下標(biāo)初始值p=1;
(6b)設(shè)置右收斂點(diǎn)v′q下標(biāo)初始值q=p+1;
(6c)判斷q≤c是否成立:若成立,則執(zhí)行(6d),否則,執(zhí)行(6f);
(6d)計(jì)算d=||v′p-v′q||,判斷d<h是否成立:若成立,則令vq′=(v′p+v′q)/2,c=c-1,p=p+1,返回(6b),否則,執(zhí)行(6e);
(6e)令q=q+1,判斷q≤c是否成立:若成立,則返回(6d),否則,執(zhí)行(6f);
(6f)令p=p+1,判斷p≤c-1是否成立:若成立,則返回(6b),否則,結(jié)束計(jì)算。
上述過程最終計(jì)算得出聚類中心集合,表示為:v″={v1,v2,…,vc},刪除合并收斂點(diǎn)后得到的聚類中心在歸一化rgb彩色空間中分布如圖2(f)所示;
步驟七:根據(jù)步驟六獲得的聚類中心集合v″,計(jì)算平滑圖像的像素核模糊隸屬度。
(7a)計(jì)算每個(gè)聚類中心對應(yīng)的核帶寬σk:
其中,n表示圖像像素的總數(shù),xj表示圖像第j個(gè)像素,vk表示第k個(gè)聚類中心;
(7b)根據(jù)式<9>計(jì)算得出的σk,利用式<10>計(jì)算高斯核距離k(xi,vk):
其中,xi表示圖像中第i個(gè)像素;
(7c)利用式<11>計(jì)算圖像像素的隸屬度矩陣u,uki為u中第k行,第i列的隸屬度:
步驟八:利用式<11>計(jì)算得出的隸屬度矩陣u,根據(jù)式<12>計(jì)算圖像像素的平滑隸屬度矩陣u′中第k行,第i列的平滑隸屬度u′ki:
其中,ni表示以像素i為中心的平滑窗口內(nèi)像素的集合,nr表示平滑窗口內(nèi)像素的總數(shù),sj和si表示窗口內(nèi)像素的平面空間坐標(biāo),xi表示平滑窗口中心像素,xj表示鄰域像素,ukj表示平滑窗口內(nèi)第j個(gè)像素的隸屬度,σs′表示平滑窗口的空間核帶寬,σs′在整個(gè)平滑過程中是固定的,取σs′=1,σir表示第i個(gè)平滑窗口對應(yīng)的值域核帶寬,對像素隸屬平滑的好處是增強(qiáng)對噪聲和離群值的魯棒性,并更好地保護(hù)圖像細(xì)節(jié)和分割區(qū)域內(nèi)部的連續(xù)性。
步驟九:采用最大隸屬度規(guī)則對每個(gè)像素點(diǎn)的平滑隸屬度u′ki進(jìn)行去模糊化,得到圖像中第i個(gè)像素的類標(biāo)簽li:
步驟十:輸出分割圖像,輸入下一幅待分割圖像,重復(fù)上述步驟,直到所有圖像分割完畢。
本發(fā)明的效果可以通過以下實(shí)驗(yàn)進(jìn)一步說明:
1.仿真實(shí)驗(yàn)采用的圖像:
實(shí)驗(yàn)采用伯克利大學(xué)自然圖像分割數(shù)據(jù)集bsd300,該數(shù)據(jù)集有300幅自然圖像,本發(fā)明對這300幅自然圖像進(jìn)行無監(jiān)督分割,在300幅分割圖像中選取4幅分割圖像在說明書附圖中進(jìn)行展示,這四幅圖像編號分別為a、b、c和d。
2.仿真實(shí)驗(yàn)的參數(shù)設(shè)定:
設(shè)用于圖像平滑的滑動(dòng)窗口迭代收斂閾值ε1=0.001,滑動(dòng)窗口空間核帶寬σs=1,滑動(dòng)窗口大小為5×5,均值漂移值域帶寬
3.仿真實(shí)驗(yàn)環(huán)境:
cpu為core33.2ghz、程序運(yùn)行內(nèi)存為4gb、操作系統(tǒng)為windows7系統(tǒng),程序運(yùn)行環(huán)境為opencv+visualstudio2010。
4.仿真內(nèi)容:
仿真1,用本發(fā)明方法對編號為a自然圖像進(jìn)行分割,并與人工分割的標(biāo)準(zhǔn)結(jié)果進(jìn)行對比,分割結(jié)果如圖3,其中:
圖3(a)是在圖像a上進(jìn)行人工分割的標(biāo)準(zhǔn)參照結(jié)果,
圖3(b)是人工對圖像a的二值邊界分割結(jié)果,
圖3(c)是本發(fā)明對圖像a的直接分割結(jié)果,
圖3(d)是本發(fā)明對圖像a的二值邊界分割結(jié)果;
仿真2,用本發(fā)明方法對編號為b自然圖像進(jìn)行分割,并與人工分割的標(biāo)準(zhǔn)結(jié)果進(jìn)行對比,分割結(jié)果如圖4,其中:
圖4(a)是在圖像b上進(jìn)行人工分割的標(biāo)準(zhǔn)參照結(jié)果,
圖4(b)是人工對圖像b的二值邊界分割結(jié)果,
圖4(c)是本發(fā)明對圖像b的直接分割結(jié)果,
圖4(d)是本發(fā)明對圖像b的二值邊界分割結(jié)果;
仿真3,用本發(fā)明方法對編號為c自然圖像進(jìn)行分割,并與人工分割的標(biāo)準(zhǔn)結(jié)果進(jìn)行對比,分割結(jié)果如圖5,其中:
圖5(a)是在圖像c上進(jìn)行人工分割的標(biāo)準(zhǔn)參照結(jié)果,
圖5(b)是人工對圖像c的二值邊界分割結(jié)果,
圖5(c)是本發(fā)明對圖像c的直接分割結(jié)果,
圖5(d)是本發(fā)明對圖像c的二值邊界分割結(jié)果;
仿真4,用本發(fā)明方法對編號為d自然圖像進(jìn)行分割,并與人工分割的標(biāo)準(zhǔn)結(jié)果進(jìn)行對比,分割結(jié)果如圖6,其中:
圖6(a)是在圖像d上進(jìn)行人工分割的標(biāo)準(zhǔn)參照結(jié)果,
圖6(b)是人工對圖像d的二值邊界分割結(jié)果,
圖6(c)是本發(fā)明對圖像d的直接分割結(jié)果,
圖6(d)是本發(fā)明對圖像d的二值邊界分割結(jié)果;
本發(fā)明方法能準(zhǔn)確地確定自然圖像的分割類別數(shù),本發(fā)明分的自然圖像的分割結(jié)果與人工分割結(jié)果很相似,說明本發(fā)明方法具有較高的分割準(zhǔn)確率,本發(fā)明分割結(jié)果與人工分割結(jié)果相比,能分割出圖像的細(xì)節(jié)區(qū)域,具有較好的細(xì)節(jié)保護(hù)能力。