實(shí)施例的均值差分模板;
[0031] 圖3為本發(fā)明實(shí)施例的一種掃描差分邊界廣義直線(xiàn)的示意圖,圖中空白的矩形塊 表示非邊界像素點(diǎn),圖中非空白矩形塊表示邊界像素點(diǎn);
[0032] 圖4為本發(fā)明實(shí)施例對(duì)所述Ξ值化圖像進(jìn)行直線(xiàn)型廣義直線(xiàn)邊界進(jìn)行捜索的流程 圖;
[0033] 圖5為本發(fā)明計(jì)算傾斜角度在[α,β]范圍內(nèi)的直線(xiàn)檢測(cè)模版流程圖;
[0034] 圖6為本發(fā)明實(shí)施例中由差分邊界像素組成的普通直線(xiàn)示意圖;
[0035] 圖7為本發(fā)明為廣義直線(xiàn)判斷中用到的、基于八連通意義下的相鄰像素示意圖;
[0036] 圖8為本發(fā)明寬度為2的廣義直線(xiàn)示意圖;
[0037] 圖9為本發(fā)明寬度為3的廣義直線(xiàn)示意圖;
[0038] 圖10為本發(fā)明實(shí)施例應(yīng)用到第1張有粘連的車(chē)牌處理前的圖片;
[0039] 圖11為本發(fā)明實(shí)施例應(yīng)用到第1張車(chē)牌處理后的效果圖;
[0040] 圖12為本發(fā)明實(shí)施例應(yīng)用到第2張有粘連的車(chē)牌處理前的圖片;
[0041 ]圖13為本發(fā)明實(shí)施例應(yīng)用到第2張車(chē)牌處理后的效果圖;
[0042] 圖14為本發(fā)明實(shí)施例應(yīng)用到第3張有粘連的車(chē)牌處理前的圖片;
[0043] 圖15為本發(fā)明實(shí)施例應(yīng)用到第3張車(chē)牌處理后的效果圖;
[0044] 圖16為本發(fā)明實(shí)施例應(yīng)用到第4張有粘連的車(chē)牌處理前的圖片;
[0045] 圖17為本發(fā)明實(shí)施例應(yīng)用到第4張車(chē)牌處理后的效果圖;
[0046] 圖18為本發(fā)明實(shí)施例應(yīng)用到第5張有粘連的車(chē)牌處理前的圖片;
[0047] 圖19為本發(fā)明實(shí)施例應(yīng)用到第5張車(chē)牌處理后的效果圖。
【具體實(shí)施方式】
[0048] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
[0049] 如圖1所示,為本發(fā)明實(shí)施例一種圖片OCR識(shí)別系統(tǒng)的字符與背景粘連噪聲消除方 法的流程圖,所述方法包括:
[0050] 1)根據(jù)OCR系統(tǒng)所應(yīng)用的工程環(huán)境的先驗(yàn)知識(shí),設(shè)置待識(shí)別字符的筆劃長(zhǎng)度 StrokeLen的有效范圍。該參數(shù)與實(shí)際的工程有密切的關(guān)系,實(shí)際應(yīng)用過(guò)程中要設(shè)置為可配 置的參數(shù)。當(dāng)該方法應(yīng)用到卡口車(chē)牌圖像的OCR識(shí)別時(shí),該參數(shù)選擇為35個(gè)像素。在交通電 子警察圖片的OCR識(shí)別過(guò)程中,該參數(shù)選擇為30個(gè)像素。
[0051] 2)選取自然環(huán)境下的含有待識(shí)別字符的圖像,并W如圖2所示的均值差分模板的 方式計(jì)算圖像差分邊界圖,所述差分邊界圖包含字符區(qū)域和背景區(qū)域。
[0052] 3)將所述待識(shí)別圖像的差分邊界圖進(jìn)行闊值化,形成待識(shí)別圖像的Ξ值化邊界 圖,所述待識(shí)別圖像包含待識(shí)別區(qū)域和背景區(qū)域,將所述待識(shí)別圖像的差分圖按照如下公 式進(jìn)行Ξ值化:
[0化3]
[0054] 其中,P (X,y)是差分圖中像素點(diǎn)(X,y)的差分值,ParamA和化ramB是預(yù)先設(shè)置的闊 值,cl,c2和c3的取值范圍是[0,255],其中cl表示當(dāng)前像素點(diǎn)的亮度比周?chē)恋倪吔?,c2 表示當(dāng)前像素點(diǎn)的亮度比較周?chē)档倪吔纾琧3表示非邊界的取值。在工程中,為了方便調(diào) 試,Ξ個(gè)常量的取值應(yīng)該盡可能有比較大的差異性,所述的cl顏色為黑色,取值為cl=0;所 述的c2顏色為白色,取值為c2 = 255,所述的c3顏色為灰色,取值為c3 = 128,差分邊界像素 點(diǎn)的值分別為〇、255,而非邊界像素點(diǎn)的值為128,即所述的黑色和白色的像素點(diǎn)為邊界像 素點(diǎn),所述的灰色的像素點(diǎn)是非邊界像素點(diǎn)。
[0055] 4)在上述得到的待識(shí)別圖像的Ξ值化邊界圖中,按照傾斜角度范圍內(nèi)、直線(xiàn)型邊 界進(jìn)行捜索,檢查該邊界是否超出了筆劃長(zhǎng)度的有效范圍,如果沒(méi)有超出筆劃長(zhǎng)度的有效 范圍,則認(rèn)為是有效的邊界點(diǎn)并給予保留,如果超出筆劃長(zhǎng)度的有效范圍,則該邊界判定為 噪聲邊界,將其從Ξ值邊界圖像中清除,如圖3所示,其中表示出了 Ξ次檢測(cè)過(guò)程,分別是從 差分邊界像素點(diǎn)A、C和E出發(fā),檢測(cè)了Num個(gè)方向的直線(xiàn)型邊界,在圖3中,有兩條直線(xiàn)型差分 邊界,分別是AB和CD,而E則是一個(gè)孤立的邊界點(diǎn),如果AB和CD超出筆劃長(zhǎng)度的有效范圍,就 將其顏色值設(shè)置為非邊界值c2,運(yùn)樣就清除了該直線(xiàn)型邊界。
[0056] 經(jīng)過(guò)上述步驟處理后的差分圖,就是消除了粘連噪聲的圖像,此時(shí)就可W將其應(yīng) 用到OCR字符識(shí)別的后續(xù)流程中。
[0057] 在上述過(guò)程中,直線(xiàn)型邊界的捜索尤其重要,如圖4所示,為本發(fā)明對(duì)Ξ值化圖像 進(jìn)行直線(xiàn)型邊界捜索的流程圖,所述流程如下:
[005引步驟4.1)計(jì)算傾斜角度在[α,β]范圍內(nèi)的直線(xiàn)傾斜偏移量檢測(cè)模版,運(yùn)里所設(shè)及 的兩個(gè)參數(shù)實(shí)際上表示了OCR字符的傾斜角度范圍,最小傾斜角度是α,最大傾斜角度是β, 它們的選擇對(duì)噪聲的清除效果W及性能有重要的影響,實(shí)際應(yīng)用過(guò)程中要設(shè)置為可配置的 參數(shù),當(dāng)該方法應(yīng)用到卡口車(chē)牌圖像的OCR識(shí)別時(shí),參數(shù)選擇可W為α = -15°,β=15°,當(dāng)應(yīng) 用到交通電子警察圖片的OCR識(shí)別時(shí),建議參數(shù)選擇為α = -25°,β = 25°,當(dāng)應(yīng)用到交通違停 取證圖片的OCR識(shí)別時(shí),由于違停車(chē)牌傾斜角度往往比較大,參數(shù)建議選擇為α = -45°,β = 45。;
[0059] 步驟4.2)對(duì)Ξ值化圖像中每一個(gè)邊界點(diǎn),利用步驟4.1)中所述的直線(xiàn)檢測(cè)模版, 檢查從該邊界點(diǎn)出發(fā)、邊界值相同,并且與模版匹配的連續(xù)邊界線(xiàn);
[0060] 步驟4.3)對(duì)匹配的連續(xù)邊界線(xiàn),檢查其長(zhǎng)度是否屬于有效范圍。如果屬于有效范 圍,則保留,否則該邊界線(xiàn)為噪聲邊界,并將邊界線(xiàn)上所有邊界點(diǎn)所包含的邊界像素值設(shè)置 為c3,運(yùn)里所述的連續(xù)邊界線(xiàn)的長(zhǎng)度有效范圍,指的是筆劃長(zhǎng)度的有效范圍。
[0061] 對(duì)前述直線(xiàn)檢測(cè)模版,其目的是為了加快捜索的速度,使得整個(gè)算法滿(mǎn)足實(shí)際應(yīng) 用中對(duì)實(shí)時(shí)性的要求,直線(xiàn)檢測(cè)模版有若干個(gè),每一個(gè)模版針對(duì)應(yīng)某一個(gè)特定的傾斜角,其 中所保存信息是傾斜直線(xiàn)上每個(gè)y坐標(biāo)與水平線(xiàn)之間的偏移量,圖5是直線(xiàn)檢測(cè)算法的流程 圖,具體操作如下:
[0062] 步驟4.1.1)根據(jù)所述步驟1)中所設(shè)置的最長(zhǎng)筆劃長(zhǎng)度5化〇1?31^日11,按照工程實(shí)際 情況計(jì)算直線(xiàn)模版數(shù)量Num、直線(xiàn)模版線(xiàn)條的長(zhǎng)度LenW及y的最大偏移值MaxOffY。計(jì)算公 式如下:
[0063]
[0064] 步驟4.1.2)對(duì)每一個(gè)直線(xiàn)傾斜偏移量模版,按如下公式計(jì)算y方向的偏移值。
[00化]
X 6 |()、Le!小 0價(jià) e [―Mi化om'. MaxOffYj
[0066] Ξ值化圖像中直線(xiàn)型邊界的捜索是本方法的關(guān)鍵,對(duì)每一個(gè)差分邊界點(diǎn),從該點(diǎn) 出發(fā),用直線(xiàn)檢測(cè)模版去匹配,檢查是否存在連續(xù)差分邊界像素點(diǎn)構(gòu)成的廣義直線(xiàn)型邊界, 對(duì)廣義直線(xiàn)檢測(cè),按如下方法:
[0067] 4.2.1)當(dāng)所述直線(xiàn)的線(xiàn)寬為1的普通直線(xiàn),該方法從出發(fā)點(diǎn)開(kāi)始,從左到右檢查是 否有直接相鄰的等值邊界點(diǎn),如果存在,則該邊界點(diǎn)屬于匹配點(diǎn),否則就屬于不匹配點(diǎn),如 圖6所示,在普通直線(xiàn)的定義下,該圖中有兩條邊界直線(xiàn),分別是ΑΒ和CD。
[0068] 4.2.2)當(dāng)所述直線(xiàn)的線(xiàn)寬為N、基于八連通的廣義直線(xiàn)(如圖7所示),該方法從出 發(fā)點(diǎn)開(kāi)始,檢測(cè)八連通范圍內(nèi)的等值差分邊界點(diǎn),如果存在運(yùn)樣的邊界點(diǎn),則該邊界點(diǎn)屬于 匹配點(diǎn),否則就屬于不匹配點(diǎn)。運(yùn)里所述的八連通的含義如圖7所示,如果兩個(gè)差分邊界點(diǎn) 滿(mǎn)足其中所示