圖像二值化方法和裝置、視頻分析系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻智能分析技術(shù)領(lǐng)域,尤其涉及一種圖像二值化方法和裝置、以及一種視頻分析系統(tǒng)。
【背景技術(shù)】
[0002]在數(shù)字圖像處理中,二值圖像占有非常重要的地位。圖像的二值化有利于圖像的進一步處理,使圖像變得簡單,而且數(shù)據(jù)量減少,能凸顯出感興趣的目標的輪廓。很多相關(guān)技術(shù)必須使用二值化后的圖像,例如字符識別、文檔圖像分析、目標檢測等。
[0003]已經(jīng)開發(fā)各種算法用來二值化圖像,例如最大類間方差法(又叫大津算法,簡稱OTSU)、Bernsen算法(一種典型的局部閾值法)等。但這些算法各具有一定的局限性,因為其所依據(jù)的原理并不一定適合所有不同的復(fù)雜的情況,例如由于環(huán)境變化導(dǎo)致的圖像目標與背景對比度不高、泛白、光照不均勻等情況。以O(shè)TSU為例,它僅對類間方差為單峰的圖像產(chǎn)生較好的分割效果,當目標與背景的大小比例懸殊時,類間方差準則函數(shù)可能呈現(xiàn)雙峰或多峰,難以獲得滿意的分割效果。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種智能的圖像二值化方法及裝置。
[0005]根據(jù)本發(fā)明的第一方面,提供一種圖像二值化方法,包括:對待處理區(qū)域或圖像進行二值化處理,并獲得二值化處理的閾值;對待處理區(qū)域或圖像中像素值處于閾值偏移范圍之外的像素采用神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,并根據(jù)訓(xùn)練結(jié)果進行二值化,其中,閾值偏移范圍的下限為所述閾值減去預(yù)定偏移值,閾值偏移范圍的上限為所述閾值加上所述預(yù)定偏移值。
[0006]根據(jù)本發(fā)明的第二方面,提供一種圖像二值化裝置,包括:閾值獲取模塊,用于對待處理區(qū)域或圖像進行二值化處理,并獲得二值化處理的閾值;訓(xùn)練模塊,用于對待處理區(qū)域或圖像中像素值處于閾值偏移范圍之外的像素采用神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,其中,閾值偏移范圍的下限為所述閾值減去預(yù)定偏移值,閾值偏移范圍的上限為所述閾值加上所述預(yù)定偏移值;二值化模塊,用于根據(jù)訓(xùn)練結(jié)果進行二值化。
[0007]根據(jù)本發(fā)明的第三方面,提供一種視頻分析系統(tǒng),其包括如上所述的圖像二值化
>J-U ρ?α裝直。
[0008]通過本發(fā)明的圖像二值化方法,首先實現(xiàn)基本二值化處理,對明顯高于或低于基本二值化處理所用閾值(即像素值在閾值偏移范圍外)的像素采用神經(jīng)網(wǎng)絡(luò)算法進行訓(xùn)練,利用神經(jīng)網(wǎng)絡(luò)的自學(xué)習特點,使得圖像的二值化更為智能。
【附圖說明】
[0009]圖1為本發(fā)明一種實施例的圖像二值化方法的流程示意圖;
圖2為本發(fā)明一種實施例的圖像二值化裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0010]本發(fā)明提出的圖像二值化方法的基本原理是,利用現(xiàn)有的二值化算法,對待處理區(qū)域或圖像實現(xiàn)基本的二值化處理,對于明顯高于或低于該基本二值化處理所用閾值的像素,將其作為學(xué)習的樣本來訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對像素值靠近該閾值的像素進行二值化,從而實現(xiàn)智能化的二值化。
[0011]下面通過【具體實施方式】結(jié)合附圖對本發(fā)明作進一步詳細說明。
[0012]如圖1所示,本發(fā)明一種實施例的圖像二值化方法包括如下步驟S1-S3。
[0013]步驟S1:對待處理區(qū)域或圖像進行二值化處理,并獲得二值化處理的閾值。
[0014]步驟S2:對待處理區(qū)域或圖像中像素值處于閾值偏移范圍之外的像素采用神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,其中,閾值偏移范圍的下限為步驟Si得到的閾值減去預(yù)定偏移值,閾值偏移范圍的上限為該閾值加上預(yù)定偏移值。
[0015]步驟S3:根據(jù)訓(xùn)練結(jié)果進行二值化。
[0016]對于步驟SI,實施例中涉及的基本的二值化處理是采用OTSU算法,其它實施例中還可以采用已有的其它二值化算法,例如Bernsen算法、最大熵閾值法等。
[0017]OTSU算法是由日本學(xué)者大津展之提出的,是一種自適應(yīng)的閾值確定方法。它是按圖像的灰度特性,將圖像分成背景和目標兩部分,背景和目標之間的類間方差越大,說明構(gòu)成圖像的兩部分的差別越大,當部分目標錯分為背景或部分背景錯分為目標都會導(dǎo)致兩部分差別變小。因此,使類間方差最大的分割算法意味著錯分概率最小。對于圖像I(x,y),前景(即目標)和背景的分割閾值記作T,屬于前景的像素點數(shù)占整幅圖像的比例記為Coci,其平均灰度記為μ ο;背景像素點數(shù)占整幅圖像的比例記為O1,其平均灰度記為μι。圖像的總平均灰度記為μ,類間方差記為4。假設(shè)圖像的背景較暗,并且圖像的大小為ΜΧΝ,圖像中像素的灰度值小于閾值T的像素個數(shù)記作Ntl,像素灰度大于閾值T的像素個數(shù)記作N1,則有:
ω O=Nci/(MX N)(I)
ω ^N1/(ΜXN)(2)
NfN1=MXN(3)
ο ο+ ^ ι—1(4 )
μ=ω0ΧU1(5)
ζ=ω0Χ(μ0-μ) Wco1X(UrU)2(6)
將式(5)代入式(6),得到如下等價公式:
ζ=ω0Χω1Χ(μ0-μ1)2(7)
采用遍歷的方法得到使類間方差最大的閾值Τ,即為所求的分割圖像的最佳閾值。
[0018]在步驟SI中,首先利用OTSU等二值化算法獲得二值化的閾值Τ,利用該閾值T可以對待處理區(qū)域或圖像I進行二值化,即
P,(i,j)=255,如果 P(i,j)>T ;P’ (i,j)=0,如果 P(i,j)〈T;(8)
上式(8)中,P(i, j)為待處理區(qū)域或圖像I中坐標位置(i,j)處像素點P的像素值,P’ (i, j)為二值化后待處理區(qū)域或圖像I中坐標位置(i,j)處像素點P的像素值。
[0019]對于步驟S2,通過設(shè)定一閾值偏移范圍來對像素值處在該范圍外的像素進行學(xué)習。假設(shè)預(yù)定偏移值為d (又稱閾值偏移),閾值偏移范圍即為(T-d,T+d)。另外還假設(shè)待處理區(qū)域或圖像I中坐標位置(i, j)處像素點P的N (N彡I)像素鄰域為D(i, j), N像素鄰域是指距離像素點P最近的N個像素所構(gòu)成的集合,例如3X3鄰域、5X5鄰域等。
[0020]在步驟S2中,采用神經(jīng)網(wǎng)絡(luò)y=f (D)來學(xué)習明顯可以實現(xiàn)的分類(目標和背景),所謂明顯可以實現(xiàn)的分類是指像素值大于T+d和小于T-d的像素,例如,可以認為像素值大于T+d的像素為目標,像素值小于T-d的像素為背景。實施例中神經(jīng)網(wǎng)絡(luò)算法采用一個M個輸入、一個輸出的三層前向神經(jīng)網(wǎng)絡(luò),其它實施例中還可以采用其它類型的神經(jīng)網(wǎng)絡(luò)。在采