亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

磁碼字符區(qū)域的二值化方法及其應(yīng)用的制作方法

文檔序號:6470667閱讀:160來源:國知局
專利名稱:磁碼字符區(qū)域的二值化方法及其應(yīng)用的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種磁碼光學(xué)字符識別技術(shù),特別涉及一種磁碼字符區(qū)域 的二值化方法及其應(yīng)用。
背景技術(shù)
目前, 一個完整的票據(jù)磁碼光學(xué)字符識別(OCR)系統(tǒng)的實現(xiàn)方法如圖
1所示,通常包括磁碼字符區(qū)域二值化、定位、切分、特征提取、識別 等幾個重要步驟。磁碼字符區(qū)域二值化是整個識別系統(tǒng)中最具決定性的一 步,對后續(xù)的定位、切分、特征提取乃至識別的精度都有著至關(guān)重要的影 響。
傳統(tǒng)的圖像二值化方法主要包括兩種全局閾值方法與局部閾值方 法。其中,全局閾值方法的思路是基于某種最優(yōu)化準(zhǔn)則,對圖像中的每個 像素使用一個全局閾值來分離出目標(biāo)區(qū)域;其特點在于實現(xiàn)簡單,速度快,
對前景(目標(biāo))與背景有較大區(qū)分度的圖像有良好的分割效果。全局閾值
方法中最著名也應(yīng)用最為廣泛的是上世界七十年代提出的大津法(Otsu) (N. Otsu, A threshold selection method from gray-level histograms, IEEE Transactions on Systems, Man, and Cybernetics, vol. 9, no. 1, pp. 62-66,1979.),該方法是基于直方圖最大類伺方差的判別準(zhǔn)則,計算出最 優(yōu)的全局閾值。但全局閾值方法由于沒有考慮到目標(biāo)區(qū)域的空間紋理分布 等特點,所以當(dāng)前景和背景的可分性不佳時,不能有效地把前景從復(fù)雜的 背景中剝離出來。票據(jù)磁碼字符區(qū)域中往往不僅有磁碼和票據(jù)底紋,而且 還可能存在大量灰度值相近的干擾字符與背景圖案。這些因素都嚴(yán)重限制 了全局閾值方法的使用。
局部閾值方法采用考察像素鄰域的思路,基于鄰域內(nèi)的最值、均值、 方差等統(tǒng)計信息,為每個像素估算閾值。著名的方法有Niblack方法(An introduction to digital image processing .W Niblack畫1985)、 Bernsen方 法(丄 Bernsen, "Dynamic thresholding of gray level images,"ICPR'86:Proc. Intl. Conf. Patt. Recog., pp. 1251-1255 (1986))、 Gatos方 法(B. Gatos, I. Pratikakis, and S.丄Perantonis, Adaptive degraded document image binarization, Pattern Recognition 39 (2006), 317-327)、 Stroke Mode方法(Stroke-model-based character extraction from gray-level document images, by Xiangyun Ye, Mohamed Cheriet' Senior Member, Ching Y. Suen IEEE Trans. Image Process)等,局部 閾值方法的優(yōu)勢在于能較準(zhǔn)確地把握目標(biāo)區(qū)域的空間分布特點,對前景與 背景的區(qū)分能力較全局閾值方法有了很大提高。但不足之處在于局部窗口 的大小較難把握,參數(shù)難調(diào)節(jié),且計算量非常大。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺點與不足,提供一種運算速度 快,計算量小,具有較強的抗背景干擾能力,穩(wěn)定性好的磁碼字符區(qū)域的
二值化方法。
本發(fā)明的另一目的在于提供上述磁碼字符區(qū)域的二值化方法的應(yīng)用。
本發(fā)明的目的通過下述技術(shù)方案實現(xiàn) 一種磁碼字符區(qū)域的二值化方 法,包括下述步驟
(1) 輸入磁碼字符區(qū)域(2) 對所述磁碼字符區(qū)域圖中所有像素的灰度值或色彩值進(jìn)行量化, 然后作直方圖統(tǒng)計;
(3) 基于直方圖統(tǒng)計信息尋找目標(biāo)像素的種子點;
(4) 基于種子點自身的灰度或色彩信息,在種子點空間鄰域內(nèi)尋找 目標(biāo)像素,并將新發(fā)現(xiàn)的目標(biāo)像素也視為種子點像素;
(5) 將找到的所有種子點像素視為前景像素,非種子點像素視為背 景像素,完成二值化。
步驟(1)中,所述磁碼字符區(qū)域圖可為灰度磁碼字符區(qū)域圖或彩色 磁碼字符區(qū)域圖。
步驟(2)具體可為對灰度磁碼字符區(qū)域圖中所有像素的灰度值進(jìn) 行量化,并計算灰度分布數(shù)組;或?qū)Σ噬糯a字符區(qū)域所有像素的RGB (紅、綠、藍(lán))三個通道的色彩值進(jìn)行量化,并計算三通道的色彩聯(lián)合分 布數(shù)組。
步驟(2)中,對于灰度磁碼字符區(qū)域圖的情況,所述灰度值量化的系數(shù)5&值取2的冪次方,如2、 4、 8、 16、 32等;但實驗證明, 一般取8、 16、 32較為理想;所述量化的過程是將輸入像素的灰度值整除量化系數(shù)
5/",得到量化結(jié)果;量化后的灰度分布區(qū)間為
其中,= 256/5/";
對量化后的區(qū)域所有像素灰度值作直方圖分析,得到灰度分布數(shù)組 W對/],/= 0,1,2... 15 (/2/W[/],/ = 0,l,2...iV-l );其中/值表示量化后的灰度級別,
to,[/]為對應(yīng)灰度級別上像素的個數(shù)。
步驟(2)中,對于彩色磁碼字符區(qū)域的情況,所述色彩值量化系數(shù)5/w 值取2的冪次方,如2、 4、 8、 16、 32等; 一般取8、 16、 32較為理想; 分別對紅綠藍(lán)(RGB)三個色彩通道進(jìn)行量化,量化后的色彩聯(lián)合分布區(qū) 間為
u
u[O,yV-l], 色彩聯(lián)合分布數(shù)組為 /n'W[/][乂][/t],其中/J,A: = 0,1,2,…7V-1 。
步驟(3)具體可為對灰度分布數(shù)組或色彩聯(lián)合分布數(shù)組進(jìn)行聚類 分析,在聚類分析結(jié)果中尋找種子點。
步驟(3)中,對灰度分布數(shù)組進(jìn)行聚類分析具體可包括下述步驟 對灰度分布數(shù)組進(jìn)行聚類。令C(/)為第/個灰度級別所隸屬的類別, 那么對每個灰度級別/,考察其鄰近灰度級別卜1與/ + 1,比較to"-l], 順/],闊"l]三者的值。若l]最大,貝U C(/) = C(/_1);若/z帥.+ l] 最大,則C(/)H ;若to収最大,則說明灰度級別/是波峰,此時產(chǎn) 生一個新的類別。
步驟(3)中,對色彩聯(lián)合分布數(shù)組進(jìn)行聚類分析具體可包括下述步 驟對色彩聯(lián)合分布數(shù)組to収[/P]進(jìn)行聚類。我們稱(/,/力為一個色彩 級別。令C(/,y^)為第(/,,"個色彩級別所隸屬的類別,那么對每個色彩級 別(/J,Q,考察其鄰域內(nèi)的色彩級別集合
①={(/,w,") I / = / —+ = /-1,_/,_/ + 1;" = + ,
找出色彩級另U (/',/,/T) 使得對任意(/,,") eO ,有 /j帥'][/]lV]) 2WW[/][附]["];
若(/',/,)恰巧等于(/,_/,",則當(dāng)前級別在直方圖上對應(yīng)波峰,此時
產(chǎn)生一個新的類別。否則,令c(/,_M) = c(/W)。
不難看出,對色彩分布數(shù)組的聚類處理是對灰度情況的高維拓展。
步驟(3)中,對于灰度分布數(shù)組的情況,在聚類分析結(jié)果中尋找種 子點具體可包括下述步驟經(jīng)過處理得到的類別中所包含的灰度級別是逐 級上升的;絕大部分情況下,大部分磁碼字符像素均處于第一類所包含的灰度級別中,即灰度級別集合{/}={/^(/) = 1},少數(shù)情況下,由于噪聲的影 響,在灰度級別"O上會形成一個干擾波峰,此時糾={/|^/)-1},因此需
要設(shè)定 一 個判別條件,若第 一 個類別包含的灰度級別個數(shù) iVWm({/1 C(/) = 1}) > 1 ,則取灰度級別范圍1 C(i) = 1}中的像素作為磁碼字符的 種子點,否則,種子點的設(shè)定范圍擴(kuò)大到{/|0(^2}。
步驟(3)中,對于色彩聯(lián)合分布數(shù)組的情況,在聚類分析結(jié)果中尋 找種子點具體可包括下述步驟經(jīng)過處理得到的類別中所包含的色彩級別
是逐級上升的;絕大部分情況下,大部分磁碼字符像素均處于第一類所包
含的色彩級別中,即色彩級別集合= {(/,yu)|c(/,y," = i},少數(shù)情
況下,由于噪聲的影響,在色彩級別(0,0,0)上會形成一個干擾波峰,此時 {(0,0,0)} = {(/,,"|C(,W," = l},因此需要設(shè)定一個判別條件,若第一個類別
包含的色彩級別個數(shù)iv"附(他M) I c(/,M) = 1}) > i ,則取色彩級別范圍 他乂,"ic(/,,yt)4中的像素作為磁碼字符的種子點,否則,種子點的設(shè)定
范圍擴(kuò)大到I C(/,./,"《2}。
步驟(4)具體可為對磁碼字符區(qū)域圖作二值化,所有的種子點像 素置黑,其它的點置白,得到初始二值圖,在初始二值圖上作基于種子點 的區(qū)域生長,更新,得到生長后的二值圖。
步驟(4)中,更新初始二值圖具體步驟可為在初始二值圖上作基 于種子點的區(qū)域生長對于每個種子點,考察其鄰域內(nèi)的像素點,若該點 為種子點,則不作處理;否則,從初始二值圖上獲取其灰度值或者色彩值
其中附和分別是磁碼字符區(qū)
域種子點像素灰度值或色彩值的均值和方差;則將該點視為種子點,像素 置黑(r為控制系數(shù)值, 一般取值為1.0 1.5之間)。這樣生長下去, 一直 到所有的種子點鄰域中沒有符合種子條件的像素點為止。
所述區(qū)域生長的方式亦可為考察每個種子點像素固定尺寸大小的鄰 域窗口內(nèi)所有像素,若其像素灰度與種子點像素灰度偏差小于某個固定閾 值T,則認(rèn)為該像素也是種子點像素。
上述磁碼字符區(qū)域的二值化方法可應(yīng)用于票據(jù)磁碼識別系統(tǒng)、鈔票金 額識別系統(tǒng)等領(lǐng)域。
本發(fā)明的作用原理是從視覺感官上看,磁碼字符行在其鄰近區(qū)域中 一般是亮度值"最低"的那部分;反映在灰度直方圖上看,磁碼行字符像 素大部分均集中在原點附近第一個波段內(nèi),分別如圖2和圖3所示?;谝陨咸攸c,本發(fā)明提出了一種基于直方圖聚類來尋找磁碼字符種子點,并 結(jié)合區(qū)域生長分離出磁碼行字符的二值化方法。本發(fā)明方法也同樣適用于
彩色區(qū)域,與灰度區(qū)域不同的是,聚類的空間為三維(RGB)色彩空間, 其它操作與灰度區(qū)域的情況類似。 .
本發(fā)明相對于現(xiàn)有技術(shù)具有如下的優(yōu)點及效果
(1) 本發(fā)明基于目標(biāo)(磁碼字符)像素在灰度空間或RGB色彩空間 整體分布特點,即總存在一定數(shù)量的目標(biāo)像素,與背景像素在灰度空間或 RGB色彩空間上具有良好的可分離性,通過直方圖統(tǒng)計的方法先將這些與 背景分離程度較高的目標(biāo)像素提取出來作為種子點,由于剩余的目標(biāo)像素 在空間上與種子點鄰近,因此結(jié)合鄰域分析的方法可完整地提取出剩余的 目標(biāo)像素。在背景干擾程度較大的情況下,上述方法仍然能夠有效地提取 出目標(biāo)像素,具有極佳的抗背景干擾能力。
(2) 本發(fā)明方法具有良好的可操控性,僅需設(shè)定的參數(shù)為控制區(qū)域 增長的條件系數(shù)r (r取值越高,則區(qū)域增長的程度越大,反之則越小)。
(3) 本發(fā)明方法計算量小,處理速度快,可較好地適用于票據(jù)磁碼 識別系統(tǒng)、鈔票金額識別系統(tǒng)等識別精度要求較高的技術(shù)鄰域。


圖1是票據(jù)磁碼光學(xué)字符識別(OCR)系統(tǒng)實現(xiàn)方法的流程圖。
圖2是磁碼字符行區(qū)域示例圖。
圖3是對應(yīng)圖2的區(qū)域灰度直方圖。
圖4是本發(fā)明方法對于灰度磁碼字符區(qū)域圖情況的流程框圖。
圖5是圖4所示方法的效果圖;其中,(A)是原圖;(B)是生長前
的種子點圖;(C)是生長后的種子點圖。
圖6是圖4所示方法與其它方法的效果比較圖;其中(A)是原圖; (B)是Otsu方法的效果圖;(C)是Bemsen方法的效果圖;(D)是Stroke
Mode方法的效果圖;(E)是Gatos方法的效果圖;(F)是本發(fā)明方法的
效果圖。
圖7是本發(fā)明方法對于彩色磁碼字符區(qū)域圖情況的處理效果與其它方 法的效果比較圖。
具體實施方式
下面結(jié)合實施例及附圖對本發(fā)明作進(jìn)一步詳細(xì)的描述,但本發(fā)明的實 施方式不限于此。 實施例1
本發(fā)明磁碼字符區(qū)域的灰度二值化方法具體步驟如圖4所示,包括下 述步驟
(1) 對輸入的灰度磁碼字符區(qū)域圖F0 (即圖5 (A)的原圖)所有像 素的灰度值進(jìn)行量化,量化系數(shù)量化系數(shù)歷"值取歷"=16,量化后原灰度
分布區(qū)間
轉(zhuǎn)化為[O, 15〗。
(2) 對量化后的區(qū)域所有像素灰度值作直方圖分析,得到灰度分布 數(shù)組/ 對/],/ = 0,1,2...15 。其中/值表示量化后的灰度級別,/^[/]為對應(yīng)灰度
級別上像素的個數(shù)。
(3) 對灰度分布數(shù)組進(jìn)行聚類。令C(/)為第/個灰度級別所隸
屬的類別,那么對每個灰度級別/,考察其鄰近灰度級別/-1與/ + 1,比較 河/-1], /7/,, /z縛+ l]三者的值。若l]最大,貝U C(/) = C(/-1); 若toW + l]最大,則C(/)zC(f + l);若to収最大,則說明灰度級別/是波峰, 此時產(chǎn)生一個新的類別。
(4) 在聚類結(jié)果尋找種子點。顯然經(jīng)過步驟(3)聚類得到的類別中 所包含的灰度級別是逐級上升的。絕大部分情況下,大部分磁碼字符像素 均處于第一類所包含的灰度級別中,即灰度級別集合{/} = {/|C(/) = l},少 數(shù)情況下,由于噪聲的影響,在灰度級別,、0上會形成一個干擾波峰,此 時糾={/^(/) = 1},因此需要設(shè)定一個判別條件,若第一個類別包含的灰 度級別個數(shù)麵 })>1,則取灰度級別范圍{/|0(/) = 1}中的像素作 為磁碼字符的種子點,否則,種子點的搜索范圍擴(kuò)大到WC(/)S2)。
(5) 統(tǒng)計所有種子點在FO圖上像素灰度值的均值附和方差cr,然后 對FO圖作二值化,所有的種子點像素置黑,其它的點置白,得到F1圖(如 圖5 (B)所示)。在F1圖上作基于種子點的區(qū)域生長對于每個種子點, 考察其鄰域內(nèi)的像素點,若該點為種子點,不變;否則,從FO圖上獲取 其灰度值/, 若滿足/</w + rxcr 且 />/w-rxo"; 其中^和a分別是所
有種子點在灰度磁碼字符區(qū)域圖上像素值的均值和方差;則將該點視為種 子點,并置黑(r為一系數(shù)值, 一般取值為L0 1.5之間)。這樣生長下去, 一直到所有的種子點鄰域中沒有符合種子條件的像素點為止。(6)輸出中值濾波去噪后的Fl圖作為二值化結(jié)果,如圖5 (C)所示。
將本實施例處理結(jié)果與現(xiàn)有多種方法的處理結(jié)果作比較,如圖6所示, 圖6 (B) — (F)中顯示了對圖6 (A)采用不同二值化方法的算法對比 效果。
(1) 圖6 (B)采用的是Otsu方法,Otsu法是在灰度空間把待處理 圖像整體上簡單看作是兩類對象(目標(biāo)和背景)的分離問題。
(2) 圖6 (C)采用的是Bersen方法,Bersen法通過計算圖像中每個 像素的窗口鄰域內(nèi)的統(tǒng)計量(最大值max與最小值min),自適應(yīng)決定該 像素位置的閾值T。
(3) 圖6 (D)采用的是基于Stroke Mode的方法,該方法較適合提
取具有筆劃特征的目標(biāo)。 '
(4) 圖6 (E)采用的是基于Gatos的方法,該方法基于某種初始二 值化方法的結(jié)果(一般用Niblack法)估計背景平面,進(jìn)而自適應(yīng)確定閾 值平面。
(5) 圖6 (F)采用的是本發(fā)明給出的基于種子點提取的方法。不難看 出,雖然圖6 (A)的背景圖案相當(dāng)復(fù)雜,但待提取的目標(biāo)對象(磁碼字 符),大部分像素在原圖中屬于"偏暗"的部分,通過將這些"偏暗"的 目標(biāo)像素提取出來作為種子點,然后結(jié)合鄰域分析"補充"上剩余的目標(biāo) 像素,即可提取出"完整"、"干凈"的目標(biāo)對象。
上述磁碼字符區(qū)域的二值化方法可較好地適用于票據(jù)磁碼識別系統(tǒng)、 鈔票金額識別系統(tǒng)等識別精度要求較高的技術(shù)鄰域。
實施例2
本發(fā)明磁碼字符區(qū)域的色彩二值化方法具體包括下述步驟 (O輸入彩色磁碼字符區(qū)域圖,對彩色磁碼字符區(qū)域圖所有像素的 RGB三個通道的色彩值進(jìn)行量化,量化系數(shù)所"值(歷"=8或說>7 = 16),量 化后的色彩聯(lián)合分布區(qū)間為
u
u
,其中TV = 256 /歷"。 色彩聯(lián)合分布數(shù)組為to/[/]L/]W,其中U^ = 0,1,2,…W-l 。
(2)對色彩聯(lián)合分布數(shù)組進(jìn)行聚類分析具體可包括下述步驟對色 彩聯(lián)合分布數(shù)組to収U'P]進(jìn)行聚類。我們稱(W,"為一個色彩級別。令
11c(/,y,Q為第a/,yt)個色彩級別所隸屬的類別,那么對每個色彩級別a/,",
考察其鄰域內(nèi)的色彩級別集合
d) = {(/,《 ,") I / = + = / —1,7,y + l;" = + ,
找出色彩級別 (/',/,*') 使得對任意(/,w,")eO ,有 /2帥'* ][/,*]) 2 ]["〗;
若(/',/,;0恰巧等于(/,y'A),則當(dāng)前級別在直方圖上對應(yīng)波峰,此時
產(chǎn)生一個新的類別。否則,令c(/,_/," = c(r,/,);
(3) 在聚類結(jié)果尋找種子點。顯然經(jīng)過處理得到的類別中所包含的 色彩級別是逐級上升的;絕大部分情況下,大部分磁碼字符像素均處于第 一類所包含的色彩級別中,即色彩級別集合{(/,M)} = /,M)|C(/,M) = i}, 少數(shù)情況下,由于噪聲的影響,在色彩級別(o,o,o)上會形成一個干擾波峰,
此時{(0,0,0)} = {(/,#)|^/,#) = 1},因此需要設(shè)定一個判別條件,若第一個 類別包含的色彩級別個數(shù)^謂(他,"|^/,,*) = 1})>1 ,則取色彩級別范圍
K/,/,A)lc(/,,/t)")中的像素作為磁碼字符的種子點,否則,種子點的設(shè)定
范圍擴(kuò)大到I C(/,,A:) S 2}。
(4) 對磁碼字符區(qū)域圖作二值化,所有的種子點像素置黑,其它的 點置白,得到初始二值圖,在初始二值圖上作基于種子點的區(qū)域生長,更 新,得到生長后的二值圖;更新初始二值圖具體步驟為在初始二值圖上 作基于種子點的區(qū)域生長對于每個種子點,考察其鄰域內(nèi)的像素點,若 該點為種子點,則不作處理;否則,從初始二值圖上獲取其色彩值/,若
其中m和分別是磁碼字符區(qū)域種子點
像素色彩值的均值和方差;則將該點視為種子點,像素置黑(/"為控制系 數(shù)值, 一般取值為1.0~1.5之間)。這樣生長下去, 一直到所有的種子點鄰 域中沒有符合種子條件的像素點為止。
(5) 輸出中值濾波去噪后的二值化圖作為二值化結(jié)果,如圖7 (F)所示。
將本實施例處理結(jié)果與現(xiàn)有多種方法的處理結(jié)果作比較,如圖7所示, 比較結(jié)果與實施例1相類似。
上述磁碼字符區(qū)域的二值化方法可較好地適用于票據(jù)磁碼識別系統(tǒng)、 鈔票金額識別系統(tǒng)等識別精度要求較高的技術(shù)鄰域。上述實施例為本發(fā)明較佳的實施方式,但本發(fā)明的實施方式并不受上 述實施例的限制,其他的任何未背離本發(fā)明的精神實質(zhì)與原理下所作的改 變、修飾、替代、組合、簡化,均應(yīng)為等效的置換方式,都包含在本發(fā)明
的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種磁碼字符區(qū)域的二值化方法,其特征在于包括下述步驟(1)輸入磁碼字符區(qū)域圖;(2)對所述磁碼字符區(qū)域圖中所有像素的灰度值或色彩值進(jìn)行量化,然后作直方圖統(tǒng)計;(3)基于直方圖統(tǒng)計信息尋找目標(biāo)像素的種子點;(4)基于種子點自身的灰度或色彩信息,在種子點空間鄰域內(nèi)尋找目標(biāo)像素,并將新發(fā)現(xiàn)的目標(biāo)像素也視為種子點像素;(5)將找到的所有種子點像素視為前景像素,非種子點像素視為背景像素,完成二值化。
2、 根據(jù)權(quán)利要求1所述的磁碼字符區(qū)域的二值化方法,其特征在于: 步驟(1)中,所述磁碼字符區(qū)域圖為灰度磁碼字符區(qū)域圖或彩色磁碼字 符區(qū)域圖。
3、 根據(jù)權(quán)利要求1所述的磁碼字符區(qū)域的二值化方法,其特征在于 步驟(2)具體為對灰度磁碼字符區(qū)域圖中所有像素的灰度值進(jìn)行量化, 并計算灰度分布數(shù)組;或?qū)Σ噬糯a字符區(qū)域所有像素的RGB三個通道 的色彩值進(jìn)行量化,并計算三通道的色彩聯(lián)合分布數(shù)組。
4、 根據(jù)權(quán)利要求3所述的磁碼字符區(qū)域的二值化方法,其特征在于 步驟(2)中,對于灰度磁碼字符區(qū)域圖的情況,所述灰度值量化的系數(shù)歷w 值取2的冪次方;所述量化的過程是將輸入像素的灰度值整除量化系數(shù) S/",得到量化結(jié)果;量化后的灰度分布區(qū)間為[O,iV-1]其中,iV = 256/5/";對量化后的區(qū)域所有像素灰度值作直方圖分析,得到灰度分布數(shù)組 to肌/ = 0,1,2…15 ( to肌/ = 0,1,2.』-1 );其中/值表示量化后的灰度級另U,to^l為對應(yīng)灰度級別上像素的個數(shù);對于彩色磁碼字符區(qū)域的情況,所述 色彩值量化系數(shù)5/"值取2的冪次方;分別對RGB三個色彩通道進(jìn)行量化, 量化后的色彩聯(lián)合分布區(qū)間為
u
u [O.,iV -1],色彩聯(lián)合分布數(shù) 組為[刀[A:],其中/, j', A: = 0,1,2,... iV -1 。
5、 根據(jù)權(quán)利要求1所述的磁碼字符區(qū)域的二值化方法,其特征在于: 步驟(3)具體為對灰度分布數(shù)組或色彩聯(lián)合分布數(shù)組進(jìn)行聚類分析, 在聚類分析結(jié)果中尋找種子點。
6、 根據(jù)權(quán)利要求5所述的磁碼字符區(qū)域的二值化方法,其特征在于:步驟(3)中,對灰度分布數(shù)組進(jìn)行聚類分析具體包括下述步驟對灰度 分布數(shù)組/2W[/]進(jìn)行聚類;令C(0為第/個灰度級別所隸屬的類別,那么對每個灰度級別/,考察其鄰近灰度級別/-1與/ + 1,比較to屮-i], to,[/],W對,+ l]三者的值;若&對/-1]最大,貝lj C(/) = C(/-1);若/ '對/ + 1〗最大, 則C(/^C("1);若/^[/]最大,則說明灰度級別z'是波峰,此時產(chǎn)生一個 新的類別;對色彩聯(lián)合分布數(shù)組進(jìn)行聚類分析具體包括下述步驟對色彩 聯(lián)合分布數(shù)組fe'沖][7'P]進(jìn)行聚類;為一個色彩級別;令C(/,力Q為 第(/,,"個色彩級別所隸屬的類別,那么對每個色彩級別考察其鄰 域內(nèi)的色彩級別集合<formula>formula see original document page 3</formula>若(/',/,F)恰巧等于(/J,",則當(dāng)前級別在直方圖上對應(yīng)波峰,此時 產(chǎn)生一個新的類別;否則,令C(/,#) = C(/*,/,)。
7、 根據(jù)權(quán)利要求5所述的磁碼字符區(qū)域的二值化方法,其特征在于 步驟(3)中,對于灰度分布數(shù)組的情況,在聚類分析結(jié)果中尋找種子點 具體包括下述步驟經(jīng)過處理得到的類別中所包含的灰度級別是逐級上升 的;絕大部分情況下,大部分磁碼字符像素均處于第一類所包含的灰度級 別中,即灰度級別集合{/} = {/^(0 = 1},少數(shù)情況下,由于噪聲的影響,在 灰度級別/ = 0上會形成一個干擾波峰,此時糾={/^(/) = 1},設(shè)定一個判別 條件,若第一個類別包含的灰度級別個數(shù)^"附({/^(/) = 1})>1,則取灰度級 別范圍WC(0"》中的像素作為磁碼字符的種子點,否則,種子點的設(shè)定范 圍擴(kuò)大到(/IC(/)^2》;對于色彩聯(lián)合分布數(shù)組的情況,在聚類分析結(jié)果中尋找種子點具體包括下述步驟經(jīng)過處理得到的類別中所包含的色彩級別 是逐級上升的;絕大部分情況下,大部分磁碼字符像素均處于第一類所包 含的色彩級別中,即色彩級別集合{aM)}={(/,M)|C(/,M) = l},少數(shù)情 況下,由于噪聲的影響,在色彩級別(0,0,0)上會形成一個干擾波峰,此時 {(0,0,0)} = {(zW,"|C(/,," = l},設(shè)定一個判別條件,若第一個類別包含的色 彩級另U個數(shù)M^({(/J,"|C(/,y'," = l})>l ,貝U取色彩級另U范圍 {(/,,&)|(^(/,_/," = 1}中的像素作為磁碼字符的種子點,否則,種子點的設(shè)定 范圍擴(kuò)大到I C(/,M) S 2}。
8、 根據(jù)權(quán)利要求1所述的磁碼字符區(qū)域的二值化方法,其特征在于步驟(4)具體為對磁碼字符區(qū)域圖作二值化,所有的種子點像素置黑, 其它的點置白,得到初始二值圖,在初始二值圖上作基于種子點的區(qū)域生 長,更新,得到生長后的二值圖。
9、 根據(jù)權(quán)利要求8所述的磁碼字符區(qū)域的二值化方法,其特征在于: 步驟(4)中,更新初始二值圖具體步驟為:在初始二值圖上作基于種子 點的區(qū)域生長對于每個種子點,考察其鄰域內(nèi)的像素點,若該點為種子 點,則不作處理;否則,從初始二值圖上獲取其灰度值或者色彩值/,若 滿足 /〈附+ 7-xct 且/〉附一rxcr; 其中m和7分別是磁碼字符區(qū)域種子點像素灰度值或色彩值的均值和方差;則將該點視為種子點,像素置黑; r為控制系數(shù)值;這樣生長下去, 一直到所有的種子點鄰域中沒有符合種 子條件的像素點為止;所述區(qū)域生長的方式為考察每個種子點像素固定 尺寸大小的鄰域窗口內(nèi)所有像素,若其像素灰度與種子點像素灰度偏差小 于某個固定閾值T,則認(rèn)為該像素也是種子點像素。
10、 根據(jù)權(quán)利要求1 9任一項所述磁碼字符區(qū)域的二值化方法的應(yīng) 用,其特征在于用于票據(jù)磁碼識別系統(tǒng)、鈔票金額識別系統(tǒng)對票據(jù)或鈔票進(jìn)行識別。
全文摘要
本發(fā)明公開一種磁碼字符區(qū)域的二值化方法,包括下述步驟(1)輸入磁碼字符區(qū)域圖;(2)對所述磁碼字符區(qū)域圖中所有像素的灰度值或色彩值進(jìn)行量化,然后作直方圖統(tǒng)計;(3)基于直方圖統(tǒng)計信息尋找目標(biāo)像素的種子點;(4)基于種子點自身的灰度或色彩信息,在種子點空間鄰域內(nèi)尋找目標(biāo)像素,并將新發(fā)現(xiàn)的目標(biāo)像素也視為種子點像素;(5)將找到的所有種子點像素視為前景像素,非種子點像素視為背景像素,完成二值化。本發(fā)明具有極佳的抗背景干擾能力,穩(wěn)定性好,手動設(shè)定的參數(shù)少,方便控制,速度快,計算量小等優(yōu)點,可較好地應(yīng)用于票據(jù)磁碼識別系統(tǒng)、鈔票金額識別系統(tǒng)。
文檔編號G06K9/38GK101447027SQ20081022038
公開日2009年6月3日 申請日期2008年12月25日 優(yōu)先權(quán)日2008年12月25日
發(fā)明者郭曉威, 陳友斌 申請人:東莞市微模式軟件有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1