亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種字符區(qū)域提取方法及系統(tǒng)的制作方法

文檔序號:8512778閱讀:169來源:國知局
一種字符區(qū)域提取方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像文檔處理技術(shù)領(lǐng)域,具體涉及一種字符區(qū)域提取方法及系統(tǒng)。
【背景技術(shù)】
[0002] 自然場景中的文字檢測具有非常重要的應(yīng)用,比如抽取文檔圖像中的文字信息、 抽取名片中的文字信息、身份證掃描件中的信息,以及自然場景中的盲人語言理解、機(jī)器人 導(dǎo)航、汽車牌照的抽取等。因此高效的字符區(qū)域抽取方法具有廣泛而重要的應(yīng)用與意義。
[0003] 目前,有許多研宄及專利公開文件利用各種方式以提取圖像中的字符信息,比如 申請?zhí)枮?01410143919. 6的中國發(fā)明專利申請公開了一種針對早期專利文檔掃描件中圖 文信息的智能處理方法,該方法將掃描圖像轉(zhuǎn)化為二值二維矩陣后去噪,切割成粗塊后再 綜合坐標(biāo)、直方圖和大小判斷的分類器判定文本塊,并且通過多次切割、識別和匹配對模糊 或復(fù)雜的內(nèi)容進(jìn)行判定。該方法通過多重切割、識別和匹配提高了圖文匹配準(zhǔn)確性,但需要 計算的要素多,步驟復(fù)雜,效率低。
[0004] 專利號為201210178001. 6的中國發(fā)明公開了一種車牌類型識別中的車牌字符序 列識別方法及裝置,該方法對車牌所在候選區(qū)域進(jìn)行二值化處理后,再進(jìn)行預(yù)處理過程,將 車牌所在候選區(qū)域中的干擾去除,然后根據(jù)每一列在垂直方向的投影值之和與投影閾值之 間的關(guān)系,確定每個字符的左右邊界,為了提高識別的準(zhǔn)確性,在本發(fā)明中還根據(jù)字符所在 的區(qū)域的寬度將字符區(qū)域進(jìn)行合并,并通過字符之間的高度,去除偽字符對字符識別過程 的干擾,在減少干擾后的車牌所在候選區(qū)域中,根據(jù)字符的數(shù)目,以及字符之間的距離確定 車牌字符序列。上述方法采用線性邏輯實現(xiàn),實現(xiàn)程序較簡單,但由于依然是基于垂直投影 方法,不能完全解決字符粘連無法準(zhǔn)確分割的問題,且提取速度較慢。
[0005] 專利號ZL200880131943. 0的中國專利公開了字符區(qū)域提取裝置、具備字符區(qū)域 提取功能的攝像裝置以及字符區(qū)域提取程序,字符區(qū)域提取裝置接收對被攝體進(jìn)行攝像而 得到的圖像數(shù)據(jù),利用第1閾值將圖像數(shù)據(jù)整體二值化,并分離成像素飽和的反射區(qū)域和 像素值不飽和的非反射區(qū)域;接著,利用第2閾值將反射區(qū)域二值化并分離成字符區(qū)域和 背景區(qū)域;同樣地,利用第3閾值將非反射區(qū)域二值化并分離成字符區(qū)域或背景區(qū)域;合并 反射區(qū)域和非反射區(qū)域各自的字符區(qū)域,并確定圖像數(shù)據(jù)中的字符區(qū)域的位置信息。該方 法定位精確,但處理速度慢。

【發(fā)明內(nèi)容】

[0006] 為了克服現(xiàn)有技術(shù)的缺點與不足,本發(fā)明的首要目的在于提供一種高效的字符區(qū) 域提取方法,以提高自然場景中文字檢測的快速性與魯棒性。
[0007] 本發(fā)明的首要目的通過下述技術(shù)方案實現(xiàn):
[0008] 一種字符區(qū)域提取方法,包括以下步驟:
[0009] SI.獲取場景圖片并進(jìn)行灰度處理得到灰度圖像;
[0010] S2.對所得灰度圖像利用增強(qiáng)濾波算子對字符區(qū)域增強(qiáng),得到增強(qiáng)圖片;
[0011] S3.利用線密度濾波器對所述增強(qiáng)圖片進(jìn)行濾波處理,得到候選聯(lián)通區(qū)域;
[0012] S4.利用條件濾波器對所述候選聯(lián)通區(qū)域進(jìn)行篩選得到字符區(qū)域。
[0013] 優(yōu)選的,步驟S2中所述增強(qiáng)濾波算子具體為:
[0014] S21、首先利用邊緣檢測算子對灰度圖像求取邊緣點;
[0015] S22、遍歷邊緣點,對每個邊緣點在灰度圖像上求取其LBP向量;
[0016] LBP,即為局部二值模式(Local Binary Patterns);
[0017] S23、在灰度圖像上對每個邊緣點在R領(lǐng)域內(nèi)尋找其匹配的LBP對,即滿足匹配函 數(shù)為最大的LBP,其中R領(lǐng)域滿足:最大字符寬度< R < (2 X最大字符寬度);
[0018] S24、找到LBP對后將這兩點間的所有像素點置為255,再經(jīng)過二值化處理得到增 強(qiáng)圖片。
[0019] 優(yōu)選的,步驟S21所述邊緣檢測算子為:Roberts算子、Sobel算子、Kirsch算子、 Prewitt算子、Laplacian算子、LoG算子或Canny算子;更優(yōu)選的,所述邊緣檢測算子為 Canny算子;
[0020] 優(yōu)選的,步驟S23中所述匹配函數(shù)為:
【主權(quán)項】
1. 一種字符區(qū)域提取方法,其特征在于:包括以下步驟:
51. 獲取場景圖片并進(jìn)行灰度處理得到灰度圖像;
52. 對所得灰度圖像利用增強(qiáng)濾波算子對字符區(qū)域增強(qiáng),得到增強(qiáng)圖片;
53. 利用線密度濾波器對所述增強(qiáng)圖片進(jìn)行濾波處理,得到候選聯(lián)通區(qū)域;
54. 利用條件濾波器對所述候選聯(lián)通區(qū)域進(jìn)行篩選得到字符區(qū)域。
2. 根據(jù)權(quán)利要求1所述的字符區(qū)域提取方法,其特征在于:步驟S2中所述增強(qiáng)濾波算 子具體為: 521、 首先利用邊緣檢測算子對灰度圖像求取邊緣點; 522、 遍歷邊緣點,對每個邊緣點在灰度圖像上求取其LBP向量; 523、 在灰度圖像上對每個邊緣點在R領(lǐng)域內(nèi)尋找其匹配的LBP對,即滿足匹配函數(shù)為 最大的LBP,其中R領(lǐng)域滿足:最大字符寬度< R < (2 X最大字符寬度); 524、 找到LBP對后將這兩點間的所有像素點置為255,再經(jīng)過二值化處理得到增強(qiáng)圖 片。
3. 根據(jù)權(quán)利要求2所述的字符區(qū)域提取方法,其特征在于:步驟S21所述邊緣檢測算 子為:Roberts算子、Sobel算子、Kirsch算子、Prewitt算子、Laplacian算子、LoG算子或 Canny算子; 步驟S23中所述匹配函數(shù)為:又〇尺[仲2)。
4. 根據(jù)權(quán)利要求1所述的字符區(qū)域提取方法,其特征在于:步驟S3中所述線密度濾波 器分為橫向濾波器和縱向濾波器; 所述橫向濾波器進(jìn)行濾波處理的具體操作為:首先設(shè)定線段長度閾值IenThresh和 線密度閾值desityThresh,接著循環(huán)每一行,尋找到兩個黑色線段長度都大于IenThresh 的線段,計算這兩個線段中間的線密度;線密度的計算公式為白色點的數(shù)目除以這兩 個線段中間的長度,白色點是圖像值為255的點;如果線密度大于設(shè)定的線密度閾值 densityThresh,則把中間所有的點置為白色255 ;遍歷所有的行,各行之間互不干擾; 所述縱向濾波器進(jìn)行濾波處理的具體操作為將圖像進(jìn)行轉(zhuǎn)置后利用橫向濾波器的操 作進(jìn)行濾波處理。
5. 根據(jù)權(quán)利要求1所述的字符區(qū)域提取方法,其特征在于:步驟S4所述條件濾波器 為:首先求取候選聯(lián)通區(qū)域的MSER塊,然后根據(jù)所得MSER塊的中心坐標(biāo)進(jìn)行能量計算,能 量達(dá)到較小者就是字符區(qū)域。
6. 根據(jù)權(quán)利要求5所述的字符區(qū)域提取方法,其特征在于:所述能量計算的具體公式 為··
,其中η為MESR區(qū)域的數(shù)目,n> = 3 ;i> = 2 ;x,y為 MSER區(qū)域的中心坐標(biāo)。
7. -種字符區(qū)域提取系統(tǒng),其特征在于,包括: 圖像預(yù)處理單元,用于獲取場景圖片并進(jìn)行灰度處理得到灰度圖像; 圖像增強(qiáng)濾波單元,用于對所得灰度圖像利用增強(qiáng)濾波算子對字符區(qū)域增強(qiáng),得到增 強(qiáng)圖片; 候選聯(lián)通區(qū)域定位單元,用于利用線密度濾波器對所述增強(qiáng)圖片進(jìn)行濾波處理,得到 候選聯(lián)通區(qū)域; 字符區(qū)域判決單元,用于利用條件濾波器對所述候選聯(lián)通區(qū)域進(jìn)行篩選得到字符區(qū) 域。
8. 根據(jù)權(quán)利要求7所述的字符區(qū)域提取方法,其特征在于,所述圖像增強(qiáng)濾波單元包 括: 邊緣點檢測模塊,用于利用邊緣檢測算子對灰度圖像求取邊緣點; LBP向量求取模塊,用于對每個邊緣點在灰度圖像上求取其LBP向量; LBP對匹配模塊,用于在灰度圖像上對每個邊緣點在R領(lǐng)域內(nèi)尋找其匹配的LBP對,即 滿足匹配函數(shù)為最大的LBP,其中R領(lǐng)域滿足:最大字符寬度< R < (2 X最大字符寬度); 二值化處理模塊,用于找到LBP對后將這兩點間的所有像素點置為255,再經(jīng)過二值化 處理得到增強(qiáng)圖片。
9. 根據(jù)權(quán)利要求8所述的字符區(qū)域提取方法,其特征在于:所述邊緣點檢測模塊中采 用的邊緣檢測算子為:R〇berts算子、Sobel算子、Kirsch算子、Prewitt算子、Laplacian算 子、LoG算子或Canny算子; 所述LBP對匹配模塊采用的匹配函數(shù)為:XOi? L/^2)。
10. 根據(jù)權(quán)利要求7所述的字符區(qū)域提取方法,其特征在于,所述候選聯(lián)通區(qū)域定位單 元中采用的線密度濾波器分為橫向濾波器和縱向濾波器; 所述橫向濾波器具體用于對增強(qiáng)圖片進(jìn)行橫向線密度濾波處理;首先設(shè)定線段長度閾 值IenThresh和線密度閾值desityThresh,接著循環(huán)每一行,尋找到兩個黑色線段長度都 大于IenThresh的線段,計算這兩個線段中間的線密度;線密度的計算公式為白色點的數(shù) 目除以這兩個線段中間的長度,白色點是圖像值為255的點;如果線密度大于設(shè)定的線密 度閾值densityThresh,則把中間所有的點置為白色255 ;遍歷所有的行,各行之間互不干 擾; 所述縱向濾波器具體用于對增強(qiáng)圖片的縱向進(jìn)行線密度濾波處理;縱向濾波器將圖像 進(jìn)行轉(zhuǎn)置后利用橫向濾波器的操作進(jìn)行濾波處理; 所述字符區(qū)域判決單元中的條件濾波器具體用于根據(jù)能量計算公式求取候選聯(lián)通區(qū) 域的MSER塊的能量,判定能量達(dá)到較小者為字符區(qū)域; 所述能量計算公式為:
I,其中η為MESR區(qū)域的數(shù)目, n> = 3 ;i> = 2 ;x, y為MSER區(qū)域的中心坐標(biāo)。
【專利摘要】本發(fā)明屬于圖像文檔處理技術(shù)領(lǐng)域,具體涉及一種字符區(qū)域提取方法及系統(tǒng)。所述方法包括獲取場景圖片并進(jìn)行灰度處理得到灰度圖像;對所得灰度圖像利用增強(qiáng)濾波算子對字符區(qū)域增強(qiáng),得到增強(qiáng)圖片;利用線密度濾波器對所述增強(qiáng)圖片進(jìn)行濾波處理,得到候選聯(lián)通區(qū)域;利用條件濾波器對所述候選聯(lián)通區(qū)域進(jìn)行篩選得到字符區(qū)域。所述系統(tǒng)包括圖像預(yù)處理單元、圖像增強(qiáng)濾波單元、候選聯(lián)通區(qū)域定位單元及字符區(qū)域判決單元。本發(fā)明對字符區(qū)域的提取方面非??焖亵敯?,并且計算性能很低、功耗很小,可以廣泛的應(yīng)用在文檔字符提取、車牌提取、自然場景中的文字提取等領(lǐng)域,具有廣泛的社會和經(jīng)濟(jì)效益。
【IPC分類】G06K9-20, G06K9-54, G06K9-34
【公開號】CN104834926
【申請?zhí)枴緾N201510166790
【發(fā)明人】孫曉航
【申請人】孫曉航
【公開日】2015年8月12日
【申請日】2015年4月9日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1