一種圖片ocr識別系統(tǒng)的字符與背景粘連噪聲消除方法

文檔序號：9687950閱讀：2531來源：國知局

一種圖片ocr識別系統(tǒng)的字符與背景粘連噪聲消除方法
【技術領域】
[0001] 本發(fā)明設及自然場景圖片OCR識別系統(tǒng)，尤其設及一種圖片OCR識別系統(tǒng)的字符與背景粘連噪聲消除方法。
【背景技術】
[0002] 在人工智能領域，光學字符識別OCR是一項十分重要的技術，由于智能手機的普及 W及云存儲中海量圖片的分類與捜索的需要，使得自然場景圖片OCR識別成為近年來研究的一個熱點，OCR技術一般包括字符定位，字符切割，字符識別等幾個過程，其中字符定位的速度與精度，直接影響OCR識別技術的好壞，是整個OCR系統(tǒng)的關鍵。
[0003] OCR字符定位通常利用字符串的結構信息，通過全局捜索的方式對字符串所在區(qū) 域進行定位，而字符串結構信息的提取，最常用也是較有效的方法是通過二值化技術來提取字符串圖像的邊緣，常用的二值化方法有固定闊值法、自適應闊值法、全局闊值法W及局部闊值法等，無論哪一種算法，當面對復雜多變的環(huán)境，如不同季節(jié)、不同天氣環(huán)境等復雜情況，都會或多或少的引入各種各樣的噪聲，運些噪聲將很容易導致定位失敗，或產生大量虛假字符信息，從而使得后續(xù)處理的計算量大大增加。
[0004] 對二值化所引入的噪聲，現有的做法通常是采用一些濾波方法去濾除噪聲，例如中值濾波、數學形態(tài)學、二維小波分析等，運些不同的方法對不同的圖像有不同的效果，常用的線性低通濾波器和鄰域平均的方法雖然可W去除部分噪聲，但它們具有圖像模糊的負作用，中值濾波的方法可W消除孤立的噪聲點，而且產生的模糊比較少，但是它對二值圖像去除噪聲的效果并不好，數學形態(tài)學在一定程度上可W將部分黑色斑塊腐蝕掉，但運樣往往會導致原圖像變形加劇，不利于后續(xù)的計算。
[0005] 另外，在自然場景圖片OCR識別中，由于光照、天氣、雜物等因素的影響，使得二值化噪聲更多，實際工程應用中，獨立的、離散的噪聲往往比較容易區(qū)分，而與字符或者待識別對象發(fā)生了粘連的噪聲往往難W處理，粘連噪聲帶來的結果就是相應的字符位置范圍受到了干擾，導致字符的準確定位失敗，從而影響了系統(tǒng)的整體識別率，如何消除自然場景中的字符粘連噪聲成了OCR識別中的一個關鍵問題，因此，提出一種能夠滿足實際應用需要的、實現各種復雜環(huán)境下的實時字符粘連噪聲消除技術顯得十分重要，通過消除粘連噪聲，可減少非字符區(qū)域的干擾，從而提供OCR字符定位的準確性。

【發(fā)明內容】

[0006] 本發(fā)明的目的在于提供一種圖片OCR識別系統(tǒng)的字符與背景粘連噪聲消除方法，針對現有自然場景圖片的OCR技術，在噪聲處理方面存在的不足，提出了一種新的粘連噪聲消除方法，在復雜多變的自然環(huán)境中，該方法解決了現有OCR應用系統(tǒng)對具有粘連噪聲字符定位困難的問題，實現字符位置的準確提取，并能滿足工程應用的實時性要求。
[0007] 為了達到上述目的，本發(fā)明提供的技術方案是:所述的自然場景圖片OCR識別系統(tǒng) 的字符與背景粘連噪聲消除方法包括按順序執(zhí)行的下列步驟：
[000引一種圖片OCR識別系統(tǒng)的字符與背景粘連噪聲消除方法，所述的圖片OCR識別系統(tǒng) 的字符與背景粘連噪聲消除方法包括按如下步驟：
[0009] 1)根據OCR系統(tǒng)所應用的工程環(huán)境的先驗知識，設置待識別字符的筆劃長度 StrokeLen的有效范圍；
[0010] 2)選取自然環(huán)境下的含有待識別字符的圖像，并W均值差分模板的方式計算圖像差分邊界圖，所述差分邊界圖包含字符區(qū)域和背景區(qū)域；
[0011] 3)將上述得到的待識別圖像的差分邊界圖進行闊值化，形成待識別圖像的Ξ值化邊界圖，所述Ξ值化邊界圖包含待識別區(qū)域和背景區(qū)域；
[0012] 4)在上述得到的待識別圖像的Ξ值化邊界圖中，按照傾斜角度范圍內、直線型邊界進行捜索，檢查該邊界是否超出了筆劃長度的有效范圍，當沒有超出筆劃長度的有效范圍，則認為是有效的邊界點，并給予保留，當超出筆劃長度的有效范圍，則該邊界判定為噪聲，將其從Ξ值邊界圖像中清除。
[0013] 所述步驟3)中，將所述待識別圖像的差分邊界圖進行闊值化的公式如下：
[0014] 其中，P(x，y)是差分圖中像素點（x，y)的差分值，ParamA和ParamB是預先設置的闊值，cl，c2和c3是無符號整數，取值范圍是[0,255];其中cl表示當前像素點的亮度比周圍更亮的邊界，c2表示當前像素點的亮度比較周圍更暗的邊界，c3表示非邊界的取值。
[0015] 所述的cl顏色為黑色，取值為C1 = 0;所述的c2顏色為白色，取值為c2 = 255，所述的c3顏色為灰色，取值為c3 = 128,差分邊界像素點的值分別為0、255,而非邊界像素點的值為128,即所述的黑色和白色的像素點為邊界像素點，所述的灰色的像素點是非邊界像素點。
[0016] 所述步驟4)中，將所述待識別圖像的Ξ值化圖像按照傾斜角度范圍內、直線型邊界進行捜索的算法步驟如下：
[0017] 4.1)計算傾斜角度在[α，β]范圍內的直線傾斜偏移量檢測模版；
[0018] 4.2)對Ξ值化圖像中每一個邊界點，利用步驟a)中得到的直線檢測模版，檢查從該邊界點出發(fā)、邊界值相同，并且與模版匹配的連續(xù)邊界線；
[0019] 4.3)對匹配的連續(xù)邊界線，檢查其長度是否屬于有效范圍，當屬于有效范圍，則保留，否則該邊界線為噪聲邊界，并將邊界線上所有邊界點所包含的邊界像素值設置為c3。
[0020] 所述步驟4-1)中，所述計算傾斜角度在[α，β]范圍內的直線檢測模版的算法步驟如下：
[0021] 4.1.1)根據步驟1)所設置的最長筆劃長度StrokeLen,按照工程實際情況計算直線模版數量Num、直線模版線條的長度Len W及該模版在y方向上的最大偏移值MaxOf f Y，計算公式分別如下；
[0022]
[0023] 4.1.2)對每一個直線傾斜偏移量模版，按如下公式計算y方向的偏移值。
[0024]
xe [(Κ U叫，（')於'e [―Max'O們、Maxom'l
[0025] 所述步驟4.2)中將待識別圖像的Ξ值化圖像進行直線型邊界的捜索算法，判斷從某邊界點出發(fā)、邊界值相同，并且與直線傾斜偏移量模版匹配的連續(xù)邊界線的方法如下： [00%] 4.2.1)當所述直線的線寬為1的普通直線，該方法從出發(fā)點開始，從左到右檢查是否有直接相鄰的等值邊界點，當存在，則該直線上所有邊界點都屬于匹配點，否則就屬于不匹配點；
[0027] 4.2.2)當所述的直線線寬為Ν，基于八連通的廣義直線，該方法從出發(fā)點開始，檢測八連通意義下的等值邊界點，當存在運樣的廣義直線，則該廣義直線上所有邊界點都屬于匹配點，否則就屬于不匹配點。
[0028] 本發(fā)明的有益效果是:本發(fā)明的一種圖片OCR識別系統(tǒng)的字符與背景粘連噪聲消除方法，針對現有自然場景圖片的OCR技術，在噪聲處理方面存在的不足，提出了一種新的粘連噪聲消除方法，在復雜多變的自然環(huán)境中，該方法解決了現有OCR應用系統(tǒng)對具有粘連噪聲字符定位困難的問題，實現字符位置的準確提取，并能滿足工程應用的實時性要求。
【附圖說明】
[0029] 圖1為本發(fā)明實施例的一種圖片OCR識別系統(tǒng)的字符與背景粘連噪聲消除方法的流程圖；
[0030] 圖2為本發(fā)明

完整全部詳細技術資料下載

當前第1頁1 2 3

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯系技術所有人。
技術研發(fā)人員：王忠;周慶標;覃方穎;
技術所有人：浙江傳媒學院;
我是此專利的發(fā)明人

上一篇：基于梯度回歸樹的車輛關鍵點檢測方法及裝置的制造方法
上一篇：基于素描線段拓撲結構的sar圖像目標檢測方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯網安全、大數據安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

票據ocr掃描識別系統(tǒng)相關技術

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種圖片ocr識別系統(tǒng)的字符與背景粘連噪聲消除方法