一種圖片ocr識別系統(tǒng)的字符與背景粘連噪聲消除方法
【技術領域】
[0001] 本發(fā)明設及自然場景圖片OCR識別系統(tǒng),尤其設及一種圖片OCR識別系統(tǒng)的字符與 背景粘連噪聲消除方法。
【背景技術】
[0002] 在人工智能領域,光學字符識別OCR是一項十分重要的技術,由于智能手機的普及 W及云存儲中海量圖片的分類與捜索的需要,使得自然場景圖片OCR識別成為近年來研究 的一個熱點,OCR技術一般包括字符定位,字符切割,字符識別等幾個過程,其中字符定位的 速度與精度,直接影響OCR識別技術的好壞,是整個OCR系統(tǒng)的關鍵。
[0003] OCR字符定位通常利用字符串的結構信息,通過全局捜索的方式對字符串所在區(qū) 域進行定位,而字符串結構信息的提取,最常用也是較有效的方法是通過二值化技術來提 取字符串圖像的邊緣,常用的二值化方法有固定闊值法、自適應闊值法、全局闊值法W及局 部闊值法等,無論哪一種算法,當面對復雜多變的環(huán)境,如不同季節(jié)、不同天氣環(huán)境等復雜 情況,都會或多或少的引入各種各樣的噪聲,運些噪聲將很容易導致定位失敗,或產生大量 虛假字符信息,從而使得后續(xù)處理的計算量大大增加。
[0004] 對二值化所引入的噪聲,現有的做法通常是采用一些濾波方法去濾除噪聲,例如 中值濾波、數學形態(tài)學、二維小波分析等,運些不同的方法對不同的圖像有不同的效果,常 用的線性低通濾波器和鄰域平均的方法雖然可W去除部分噪聲,但它們具有圖像模糊的負 作用,中值濾波的方法可W消除孤立的噪聲點,而且產生的模糊比較少,但是它對二值圖像 去除噪聲的效果并不好,數學形態(tài)學在一定程度上可W將部分黑色斑塊腐蝕掉,但運樣往 往會導致原圖像變形加劇,不利于后續(xù)的計算。
[0005] 另外,在自然場景圖片OCR識別中,由于光照、天氣、雜物等因素的影響,使得二值 化噪聲更多,實際工程應用中,獨立的、離散的噪聲往往比較容易區(qū)分,而與字符或者待識 別對象發(fā)生了粘連的噪聲往往難W處理,粘連噪聲帶來的結果就是相應的字符位置范圍受 到了干擾,導致字符的準確定位失敗,從而影響了系統(tǒng)的整體識別率,如何消除自然場景中 的字符粘連噪聲成了OCR識別中的一個關鍵問題,因此,提出一種能夠滿足實際應用需要 的、實現各種復雜環(huán)境下的實時字符粘連噪聲消除技術顯得十分重要,通過消除粘連噪聲, 可減少非字符區(qū)域的干擾,從而提供OCR字符定位的準確性。
【發(fā)明內容】
[0006] 本發(fā)明的目的在于提供一種圖片OCR識別系統(tǒng)的字符與背景粘連噪聲消除方法, 針對現有自然場景圖片的OCR技術,在噪聲處理方面存在的不足,提出了一種新的粘連噪聲 消除方法,在復雜多變的自然環(huán)境中,該方法解決了現有OCR應用系統(tǒng)對具有粘連噪聲字符 定位困難的問題,實現字符位置的準確提取,并能滿足工程應用的實時性要求。
[0007] 為了達到上述目的,本發(fā)明提供的技術方案是:所述的自然場景圖片OCR識別系統(tǒng) 的字符與背景粘連噪聲消除方法包括按順序執(zhí)行的下列步驟:
[000引一種圖片OCR識別系統(tǒng)的字符與背景粘連噪聲消除方法,所述的圖片OCR識別系統(tǒng) 的字符與背景粘連噪聲消除方法包括按如下步驟:
[0009] 1)根據OCR系統(tǒng)所應用的工程環(huán)境的先驗知識,設置待識別字符的筆劃長度 StrokeLen的有效范圍;
[0010] 2)選取自然環(huán)境下的含有待識別字符的圖像,并W均值差分模板的方式計算圖像 差分邊界圖,所述差分邊界圖包含字符區(qū)域和背景區(qū)域;
[0011] 3)將上述得到的待識別圖像的差分邊界圖進行闊值化,形成待識別圖像的Ξ值化 邊界圖,所述Ξ值化邊界圖包含待識別區(qū)域和背景區(qū)域;
[0012] 4)在上述得到的待識別圖像的Ξ值化邊界圖中,按照傾斜角度范圍內、直線型邊 界進行捜索,檢查該邊界是否超出了筆劃長度的有效范圍,當沒有超出筆劃長度的有效范 圍,則認為是有效的邊界點,并給予保留,當超出筆劃長度的有效范圍,則該邊界判定為噪 聲,將其從Ξ值邊界圖像中清除。
[0013] 所述步驟3)中,將所述待識別圖像的差分邊界圖進行闊值化的公式如下:
[0014] 其中,P(x,y)是差分圖中像素點(x,y)的差分值,ParamA和ParamB是預先設置的闊 值,cl,c2和c3是無符號整數,取值范圍是[0,255];其中cl表示當前像素點的亮度比周圍更 亮的邊界,c2表示當前像素點的亮度比較周圍更暗的邊界,c3表示非邊界的取值。
[0015] 所述的cl顏色為黑色,取值為C1 = 0;所述的c2顏色為白色,取值為c2 = 255,所述 的c3顏色為灰色,取值為c3 = 128,差分邊界像素點的值分別為0、255,而非邊界像素點的值 為128,即所述的黑色和白色的像素點為邊界像素點,所述的灰色的像素點是非邊界像素 點。
[0016] 所述步驟4)中,將所述待識別圖像的Ξ值化圖像按照傾斜角度范圍內、直線型邊 界進行捜索的算法步驟如下:
[0017] 4.1)計算傾斜角度在[α,β]范圍內的直線傾斜偏移量檢測模版;
[0018] 4.2)對Ξ值化圖像中每一個邊界點,利用步驟a)中得到的直線檢測模版,檢查從 該邊界點出發(fā)、邊界值相同,并且與模版匹配的連續(xù)邊界線;
[0019] 4.3)對匹配的連續(xù)邊界線,檢查其長度是否屬于有效范圍,當屬于有效范圍,則保 留,否則該邊界線為噪聲邊界,并將邊界線上所有邊界點所包含的邊界像素值設置為c3。
[0020] 所述步驟4-1)中,所述計算傾斜角度在[α,β]范圍內的直線檢測模版的算法步驟 如下:
[0021] 4.1.1)根據步驟1)所設置的最長筆劃長度StrokeLen,按照工程實際情況計算直 線模版數量Num、直線模版線條的長度Len W及該模版在y方向上的最大偏移值MaxOf f Y,計 算公式分別如下;
[0022]
[0023] 4.1.2)對每一個直線傾斜偏移量模版,按如下公式計算y方向的偏移值。
[0024]
xe [(Κ U叫,(')於'e [―Max'O們、Maxom'l
[0025] 所述步驟4.2)中將待識別圖像的Ξ值化圖像進行直線型邊界的捜索算法,判斷從 某邊界點出發(fā)、邊界值相同,并且與直線傾斜偏移量模版匹配的連續(xù)邊界線的方法如下: [00%] 4.2.1)當所述直線的線寬為1的普通直線,該方法從出發(fā)點開始,從左到右檢查是 否有直接相鄰的等值邊界點,當存在,則該直線上所有邊界點都屬于匹配點,否則就屬于不 匹配點;
[0027] 4.2.2)當所述的直線線寬為Ν,基于八連通的廣義直線,該方法從出發(fā)點開始,檢 測八連通意義下的等值邊界點,當存在運樣的廣義直線,則該廣義直線上所有邊界點都屬 于匹配點,否則就屬于不匹配點。
[0028] 本發(fā)明的有益效果是:本發(fā)明的一種圖片OCR識別系統(tǒng)的字符與背景粘連噪聲消 除方法,針對現有自然場景圖片的OCR技術,在噪聲處理方面存在的不足,提出了一種新的 粘連噪聲消除方法,在復雜多變的自然環(huán)境中,該方法解決了現有OCR應用系統(tǒng)對具有粘連 噪聲字符定位困難的問題,實現字符位置的準確提取,并能滿足工程應用的實時性要求。
【附圖說明】
[0029] 圖1為本發(fā)明實施例的一種圖片OCR識別系統(tǒng)的字符與背景粘連噪聲消除方法的 流程圖;
[0030] 圖2為本發(fā)明