本發(fā)明涉及機器視覺中的圖像分割領(lǐng)域,具體是指一種基于灰度圖像直方圖信息的算術(shù)-幾何散度實現(xiàn)對基于機器視覺的無損檢測等工業(yè)圖像快速、準(zhǔn)確分割的閾值分割方法。
背景技術(shù):
圖像分割是圖像處理中最為基本,但又是最為困難和最具挑戰(zhàn)性的問題之一。圖像分割的目的是把圖像分成互不重疊的多個區(qū)域,各區(qū)域內(nèi)部目標(biāo)同質(zhì),從而為實現(xiàn)圖像的后續(xù)處理奠定基礎(chǔ)。因圖像成像過程中受多種因素影響,其復(fù)雜性也致使用于分割的方法不能普適于不同的分割任務(wù),因此研究新的方法用于實踐中的特定分割任務(wù)也成為研究人員在圖像處理工作中必須努力的方向之一。
在很多圖像處理應(yīng)用場景中,如基于機器視覺的產(chǎn)品質(zhì)量檢測、基于機器視覺的安全監(jiān)測,對圖像處理任務(wù)的完成一般需要較高的實時性,因此在多種圖像分割技術(shù)中,有著很高實時性能、而且也具有較高分割精確性的直方圖閾值分割技術(shù)成為圖像分割領(lǐng)域中相當(dāng)流行的技術(shù)之一。在苛刻的工作環(huán)境下,如工業(yè)流水線上的工件質(zhì)量無損檢測、產(chǎn)品表面缺陷檢測等,這些場景得到的成像圖像往往會受到噪聲、不均勻光照等很多因素的干擾,因此成像質(zhì)量一般較差,因此如何選取最佳分割閾值成為分割的關(guān)鍵。針對這一問題,國內(nèi)外學(xué)者進行了廣泛的研究,提出了很多種分割方法。
基于信息論中熵概念(如Shannon熵、交叉熵、Tsallis交叉熵等)的方法是圖像閾值化技術(shù)中得到最為廣泛應(yīng)用的閾值化方法之一。熵方法有著堅實的物理學(xué)背景,且在圖像分割中也有著很高的效能故其得到了研究人員和工業(yè)實踐的極度青睞,因此基于熵概念的方法或改進方案在研究或應(yīng)用中紛呈疊出。其中基于交叉熵概念的方法是在生產(chǎn)實踐中得到最為廣泛應(yīng)用的著名熵閾值分割方法之一,該方法最初由Li和Lee提出。交叉熵,在信息論中又被稱為信息散度、相對熵,它是用于度量信息系統(tǒng)間信息距離差異的測度。在圖像閾值化中,交叉熵用作度量圖像分割前后像素信息丟失率的工具,圖像閾值化前后信息丟失越少,則它們間的交叉熵也就越小,則分割后得到的分割圖像的質(zhì)量越高。Li和Lee提出的最小交叉熵閾值化方法是最為著名的基于交叉熵(也即信息散度、相對熵)概念的圖像閾值分割方法,除了該方法外,與交叉熵概念相關(guān)的其它著名閾值化方法還有Kittler和Illingworth提出的最小誤差閾值化方法,該方法本質(zhì)上是一種基于歐氏距離的均方誤差概念的相對熵方法,均方誤差并不能完全有效把圖像像素間關(guān)系區(qū)分開,因此在對圖像實施分割時也存在不足。另外我國學(xué)者唐英干等人基于Tsallis交叉熵,在采用均勻分布的基礎(chǔ)上提出一種最小Tsallis交叉熵方法,然而在真實環(huán)境中圖像的像素分布并不總是服從均勻分布,因此該方法的分割性能也有待提高;基于卡方散度(χ2-divergence)的方法是相關(guān)學(xué)者提出的另外一種基于散度概念的圖像閾值化方法,該方法對直方圖的分布非常敏感,當(dāng)直方圖分布不均時得不到好的閾值。
信息論中的算術(shù)-幾何散度(Arithmetic-Geometric divergence)是學(xué)者Taneja在分析傳統(tǒng)信息散度(交叉熵)測度的基礎(chǔ)上提出的用于度量信息系統(tǒng)間相似性(或非相似性)的一種高效信息距離測度,該測度克服了傳統(tǒng)散度(交叉熵、卡方散度等)測度存在的不足,能更好的把系統(tǒng)間的相似或不相似性反映出來。圖像是一復(fù)雜的物理系統(tǒng),其內(nèi)部像素信息的分布根據(jù)成像方式、過程的不同而千差萬別,因此在分割過程中,圖像像素間的信息差異度量方式也嚴(yán)重影響著分割性能?;谒阈g(shù)-幾何散度,本發(fā)明提出一種區(qū)別于傳統(tǒng)交叉熵(或信息散度、相對熵)概念的灰度圖像閾值化方法用以提高圖像分割性能。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于為應(yīng)對復(fù)雜的圖像分割任務(wù),針對現(xiàn)有方法中存在的分割精度不足、普適性不強等特點,提出基于算術(shù)-幾何散度的圖像灰度級直方圖閾值分割技術(shù),開發(fā)出一種分割性能優(yōu)越、適用于實時性要求高的工業(yè)生產(chǎn)場景,如工業(yè)無損檢測等場景的閾值分割方法。
為達到上述目的,本發(fā)明的構(gòu)思是:
本發(fā)明的基于算術(shù)-幾何散度的灰度圖像直方圖閾值分割方法包括:輸入待分割圖像并求取其歸一化的灰度級直方圖,構(gòu)建分割前后圖像算術(shù)-幾何散度表達式,通過在圖像灰度級范圍內(nèi)求取使該表達式獲得最小值的灰度級值,然后用該灰度級值對圖像實施閾值分割并輸出分割圖像。
用于構(gòu)建圖像閾值分割準(zhǔn)則函數(shù)的算術(shù)-幾何散度的表達式為:
其中P,Q表示離散有限概率分布向量,D(P|Q)用于度量P、Q之間信息差異值,D(P|Q)值越小,說明概率分布P、Q越相似。
本發(fā)明應(yīng)用算術(shù)-幾何散度,在圖像灰度級直方圖空間構(gòu)建閾值化前后圖像的算術(shù)-幾何散度和,并通過在灰度級范圍內(nèi)最小化閾值化前后圖像算術(shù)-幾何散度和獲取最佳分割閾值,從而實現(xiàn)圖像分割。
基于上述發(fā)明構(gòu)思,本發(fā)明采用以下技術(shù)方案:
一種基于算術(shù)-幾何散度的灰度圖像直方圖閾值分割方法,其特征在于操作步驟如下:
(1)讀取待分割的灰度圖像,并將其存入一個大小為M×N的二維圖像數(shù)組I中;
(2)遍歷圖像數(shù)組I,計算得到圖像最大灰度級L-1及灰度級集合G={0,1,…,L-1},通過公式hi=ni/(M×N)計算得到歸一化的灰度直方圖H(H={h0,h1,…,hL-1}),這里ni表示待分割圖像內(nèi)灰度級為i的像素數(shù),L-1表示圖像內(nèi)最大灰度級數(shù);
(3)假定t為分割閾值,則閾值化時t將圖像像素分為歸屬于兩個不同類的灰度級集合C0與C1,其中C0={0,1,2,…,t},C1={t+1,t+2,…,L-1};
(4)用H做為圖像灰度級的概率密度函數(shù)估計,基于公式一計算關(guān)于C0與C1的先驗概率P0及P1;
公式一:;
(5)基于公式二計算關(guān)于C0與C1的灰度均值m0與m1:
公式二:;
(6)通過公式三和公式四計算關(guān)于圖像灰度級類C0與C1的算術(shù)-幾何散度D0和D1:
公式三:;
公式四:;
(7)閾值化前后圖像總的算術(shù)-幾何散度用公式五定義,此式即為圖像閾值化準(zhǔn)則函數(shù):
公式五:;
(8)在G={0,1,…,L-1}范圍內(nèi)搜索使公式六獲得最小值的灰度級t*,t*即最優(yōu)分割閾值:
公式六:;
(9)假設(shè)用f(x,y)表示原始圖像I坐標(biāo)(x,y)處的像素灰度值,s(x,y)表示分割后圖像坐標(biāo)(x,y)處的像素灰度值,則求得最佳分割閾值t*后,s(x,y)可用公式七計算得到;
公式七:;
(10)輸出分割后的圖像。
本發(fā)明的有益效果:1、本發(fā)明采用信息論中彌補了傳統(tǒng)散度在度量信息系統(tǒng)間信息差異不足的算術(shù)-幾何散度做為圖像閾值分割的準(zhǔn)則函數(shù),使本發(fā)明與其它方法相比提升了圖像分割質(zhì)量;2、本發(fā)明采用的算術(shù)-幾何散度在度量閾值化前后圖像間的信息損失率時,能使閾值分割圖像盡量多的保留原始圖像的細節(jié)信息,因此分割圖像邊緣輪廓精確,紋理細節(jié)清晰;3、采用在灰度直方圖空間求取最佳閾值,使本發(fā)明具有高的計算效率,適用于實時性要求高的圖像處理任務(wù)。實驗表明,對于具有8位256級灰度的多幅測試圖像,在一臺CPU為Intel(R) Core(TM)2 Duo CPU T8100 @ 2.10GHz,操作系統(tǒng)為Window XP,編程環(huán)境為MATLAB R2007b的條件下執(zhí)行相應(yīng)的圖像分割任務(wù),應(yīng)用本發(fā)明得到的分割圖像區(qū)域內(nèi)部均勻,輪廓邊界準(zhǔn)確,計算耗時小于0.03秒,適用于實時性要求高的工業(yè)應(yīng)用圖像處理任務(wù)需求。
附圖說明
圖1是本發(fā)明的流程框圖;
圖2是用于測試的3幅NDT圖像原圖,即img1、img2和img3原圖;
圖3是本發(fā)明對于img1圖像分割結(jié)果與現(xiàn)有三種方法分割結(jié)果比較圖;
圖4是本發(fā)明對于img2圖像分割結(jié)果與現(xiàn)有三種方法分割結(jié)果比較圖;
圖5是本發(fā)明對于img3圖像分割結(jié)果與現(xiàn)有三種方法分割結(jié)果比較圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,下面結(jié)合具體實例,并參照附圖,對本發(fā)明的具體實施方式作詳細說明,本發(fā)明包含但不限于所舉實例。
如圖1所示,為本發(fā)明的整體流程圖,具體步驟如下:
步驟1:設(shè)置算法運行時用于臨時存放圖像算術(shù)-幾何散度值的變量MAGD為一無窮大初值,讀取待分割的灰度圖像,并將其存入一個大小為M×N的二維圖像數(shù)組I中;
步驟2:遍歷圖像數(shù)組I,計算得到圖像最大灰度級L-1及灰度級集合G={0,1,…,L-1},通過公式hi=ni/(M×N)計算得到歸一化的灰度直方圖H(H={h0,h1,…,hL-1}),這里ni表示待分割圖像內(nèi)灰度級為i的像素數(shù),L-1表示圖像內(nèi)最大灰度級數(shù),對于8位數(shù)字圖像而言L=256;
步驟3: 假定t為分割閾值,則閾值化時t將圖像像素分為歸屬于兩個不同類的灰度級集合C0與C1,其中C0={0,1,2,…,t},C1={t+1,t+2,…,L-1};
步驟4:用H做為圖像灰度級的概率密度函數(shù)估計,基于公式一計算關(guān)于C0與C1的先驗概率P0及P1:
公式一:;
步驟5:基于公式二計算關(guān)于C0與C1的灰度均值m0與m1:
公式二:;
步驟6:通過公式三和公式四計算關(guān)于圖像灰度級類C0與C1的算術(shù)-幾何散度D0和D1:
公式三:,
公式四:;
步驟7:用公式五定義閾值化前后圖像總的算術(shù)-幾何散度,此式即為圖像閾值化準(zhǔn)則函數(shù):
公式五:;
步驟8:在G={0,1,…,L-1}范圍內(nèi)搜索使公式六獲得最小值的灰度級t*,t*即最優(yōu)分割閾值:
公式六:;
步驟9:假設(shè)用f(x,y)表示原始圖像I坐標(biāo)(x,y)處的像素灰度值,s(x,y)表示分割后圖像坐標(biāo)(x,y)處的像素灰度值,則求得最佳分割閾值t*后,s(x,y)可用公式七計算得到:
公式七:;
步驟10:輸出分割后的圖像。
本發(fā)明的效果可以通過以下實驗進一步說明:
1)實驗條件
實驗仿真環(huán)境為:一臺CPU為Intel(R) Core(TM)2 Duo CPU T8100 @ 2.10GHz,操作系統(tǒng)為Window XP,編程環(huán)境為MATLAB R2007b的PC機;現(xiàn)代工業(yè)生產(chǎn)中,圖像分割是實現(xiàn)基于機器視覺的無損檢測(NDT)的關(guān)鍵基礎(chǔ),在無損檢測中因常涉及到工業(yè)流水線的高實時性處理需求,因此閾值分割技術(shù)在無損檢測中應(yīng)用非常廣泛。為考察本發(fā)明方法性能,應(yīng)用本發(fā)明方法與相比較的其它方法在三幅NDT圖像上進行對比實驗;為敘述方便,在實驗中把這三幅圖像簡稱為img1,img2和img3,這三幅圖像的大小分別為107×92,100×70和171×58;這三幅圖像如圖2所示,其中圖(2a)是img1,圖(2b)是img2,圖(2c)是img3。
2)實驗內(nèi)容
用本發(fā)明和一些基于交叉熵、相對熵等與散度概念相關(guān)的,并在工業(yè)實踐中得到廣泛應(yīng)用的著名圖像閾值化方法,即最小誤差閾值化方法(MET),最小交叉熵法(MCE),最小Tsallis交叉熵法(MTCE)對img1,img2,img3進行了實驗比較。每幅實驗圖像的4種方法分割結(jié)果如圖3,圖4及圖5所示;其中圖(3a)、圖(4a)及圖(5a)是MET方法對測試圖像進行分割得到的結(jié)果;圖(3b)、圖(4b)及圖(5b)是MCE方法對測試圖像進行分割得到的結(jié)果;圖(3c)、圖(4c)及圖(5c)是MTCE方法的分割結(jié)果;圖(3d)、圖(4d)及圖(5d)是應(yīng)用本發(fā)明方法對測試圖像實施分割獲得的結(jié)果。
3)實驗結(jié)果分析
從圖3、圖4及圖5展示的分割結(jié)果可以看出,本發(fā)明方法獲得的結(jié)果(圖(3d),(4d),(5d))與MCE方法獲得的結(jié)果(圖(3b),(4b),(5b))類似,但明顯優(yōu)于MTE方法(圖(3a),(4a),(5a))及MTCE方法(圖(3c),(4c),(5c))獲得的結(jié)果;本發(fā)明方獲得的分割結(jié)果圖像中分離出的要關(guān)注的NDT圖像目標(biāo)更完整、準(zhǔn)確,而且分割結(jié)果圖像殘留的噪聲像素點也少于相比較的MET和MTCE方法。
表1結(jié)出了相比較的4種方法對img1、img2、img3實施分割時的計算耗時。
表1. 對測試圖像實施分割的計算耗時比較(單位:秒)
從表1可以看出,本發(fā)明方法的計算耗時小于相比較的其它三種方法,對三幅測試圖像的分割所耗時間均小于0.03秒,從這點可以看出,本發(fā)明方法可以很好地適應(yīng)實時性要求高的圖像處理任務(wù)。