亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于布局信息分析的郵件圖像方向辨別方法

文檔序號:6548877閱讀:148來源:國知局
一種基于布局信息分析的郵件圖像方向辨別方法
【專利摘要】本發(fā)明公開了一種基于布局信息分析的郵件圖像方向辨別方法,包括以下步驟:步驟1:標(biāo)記圖像中的連通元;步驟2:將各個連通元劃分至文本塊中;步驟3:提取文本塊的特征向量;步驟4:通過特征向量訓(xùn)練分類器;步驟5:通過分類器辨別圖像的方向。本發(fā)明方法通過分析郵件圖像上文本的布局信息來實(shí)現(xiàn)郵件圖像的方向辨別,本發(fā)明方法充分分析利用郵件圖像自身的布局信息,不再依賴于預(yù)先印制的郵政編碼框,適應(yīng)性強(qiáng)。
【專利說明】一種基于布局信息分析的郵件圖像方向辨別方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像分析與識別技術(shù),尤其涉及一種基于布局信息分析的郵件圖像方 向辨別方法。

【背景技術(shù)】
[0002] 郵件的自動分揀是郵政自動化的一個重要組成部分。有一種郵件分揀技術(shù)是通過 采集分揀對象的圖像,分割出收信人地址區(qū)域,對分割結(jié)果進(jìn)行字符識別,從而根據(jù)識別結(jié) 果實(shí)現(xiàn)自動分揀。而在分割收信人地址區(qū)域之前,需要將郵件位置矯正,以保證后續(xù)的地址 區(qū)域分割和字符識別等操作可以更得到準(zhǔn)確的結(jié)果。將圖像中的郵件矯正,包括消除傾斜 角度和辨別出正負(fù)方向兩步操作,如圖la和lb所示,分別為一個郵件的正、負(fù)兩個方向的 圖像。
[0003] 由于郵件在郵寄時基本都用信封來包覆,并且信封上都有位置比較固定的郵政編 碼框。因此現(xiàn)有的郵件自動分揀系統(tǒng)中,方向辨別主要通過郵政編碼框的定位來完成。然 而,隨著郵件制作橫的不斷提高,采用窗口信和貼條信等手段自動打印和制作郵件的數(shù)量 占大部分比例,原本要求在信封上預(yù)先印制的郵政編碼紅框所起的作用只是在分揀機(jī)上為 自動辨別郵件方向提供依據(jù)。如果分揀機(jī)能在沒有紅框的情況下自動辨別方向,則可以取 消六個紅框的印刷,這將減少信封的制作成本。
[0004] 因此,市場上亟需尋找一種不依賴于紅框的方法來實(shí)現(xiàn)郵件圖像方向的自動辨 別。


【發(fā)明內(nèi)容】

[0005] 本發(fā)明的目的是提供一種不依賴信封紅框,能根據(jù)郵件上文本的布局信息自動實(shí) 現(xiàn)郵件方向辨別的方法,以解決在郵件在自動分揀中的自動識別方向問題。
[0006] 本發(fā)明提出了一種基于布局信息分析的郵件圖像方向辨別方法,包括以下步驟:
[0007] 步驟1 :標(biāo)記圖像中的連通元;
[0008] 步驟2 :將各個連通元劃分至文本塊中;
[0009] 步驟3 :提取所述文本塊的特征向量;
[0010] 步驟4 :通過所述特征向量訓(xùn)練分類器;
[0011] 步驟5 :通過所述分類器辨別圖像的方向。
[0012] 本發(fā)明中,進(jìn)一步包括對圖像進(jìn)行預(yù)處理;所述預(yù)處理包括:將所述圖像進(jìn)行二 值化和去噪。
[0013] 本發(fā)明中,所述步驟1中,進(jìn)一步包括:對所述連通元進(jìn)行過濾。
[0014] 本發(fā)明中,過濾的所述連通元包括以下:
[0015] 靠近圖像邊界位置的所述連通元;
[0016] 圖像中由折痕形成的所述連通元;
[0017] 小區(qū)域內(nèi)密集噪聲點(diǎn)構(gòu)成的所述連通元;
[0018] 地址貼或郵資貼的邊緣形成的所述連通元;
[0019] 前景像素點(diǎn)個數(shù)與面積之比大于閾值的所述連通元,所述閾值大于0且小于或等 于1 ;
[0020] 前景像素點(diǎn)個數(shù)與面積之比小于閾值的所述連通元,所述閾值大于0且小于1 ;
[0021] 前景像素點(diǎn)小于閾值的連通元,所述閾值大于等于0。
[0022] 本發(fā)明中,所述步驟2中,包括以下步驟:
[0023] 步驟2a :設(shè)定所述文本塊的初始位置及數(shù)量;
[0024] 步驟2b :將所述各個連通元劃分至與其縱方向值距離最小的文本塊中;
[0025] 步驟2c :重新計算所述文本塊中心的縱方向值;
[0026] 步驟2d :計算所述文本塊中心的縱方向位置變化值,并判斷變化值是否大于閾值 并且迭代次數(shù)是否小于最大迭代次數(shù),結(jié)果為是,則重復(fù)步驟2b,否則進(jìn)入步驟2e ;
[0027] 步驟2e :刪除不含有所述連通元的所述文本塊并計算保留文本塊的邊界信息。
[0028] 本發(fā)明中,所述步驟2中,進(jìn)一步包括以下步驟:
[0029] 步驟2f :將所述文本塊排序;
[0030] 步驟2g :若相鄰的所述文本塊在縱方向的重合度大于所述文本塊高度的二分之 一,則合并所述文本塊;
[0031] 步驟2h :若相鄰的所述文本塊在縱方向重合度大于所述文本塊高度的三分之一, 且在橫方向重合度大于所述文本塊寬度的四分之三,則合并所述文本塊。
[0032] 本發(fā)明中,所述步驟3中,所述特征向量由所述文本塊結(jié)點(diǎn)的長度特征向量、相鄰 所述文本塊結(jié)點(diǎn)間的縱方向距離特征向量和所述文本塊結(jié)點(diǎn)到圖像中軸線橫方向距離特 征向量依次連接組成。
[0033] 本發(fā)明中,所述長度特征提取包括以下步驟:
[0034] 步驟31a :根據(jù)所述文本塊的左右邊界值計算得到所述文本塊鏈上每個結(jié)點(diǎn)的長 度值;
[0035] 步驟31b :將所述結(jié)點(diǎn)的長度值歸一化,得到所述文本塊鏈的觀察序列;
[0036] 步驟31c :通過Baum-Wech算法訓(xùn)練得到隱含狀態(tài)轉(zhuǎn)移概率矩陣、觀測狀態(tài)轉(zhuǎn)移概 率矩陣和初始隱含狀態(tài)概率矩陣;
[0037] 步驟31d :根據(jù)所述隱含狀態(tài)轉(zhuǎn)移概率矩陣、所述觀測狀態(tài)轉(zhuǎn)移概率矩陣和所述 初始隱含狀態(tài)概率矩陣,利用Viterbi算法求得所述觀察序列的隱含狀態(tài)序列;
[0038] 步驟31e :通過所述隱含狀態(tài)序列得到所述文本塊結(jié)點(diǎn)的長度特征向量。
[0039] 本發(fā)明中,所述縱方向距離特征提取包括以下步驟:
[0040] 步驟32a :根據(jù)所述文本塊結(jié)點(diǎn)的中心位置計算得到相鄰所述文本塊鏈之間的縱 方向距離值;
[0041] 步驟32b :將所述縱方向的距離值歸一化;
[0042] 步驟32c :通過所述歸一化后的距離值得到相鄰所述文本塊結(jié)點(diǎn)之間縱方向距離 特征向量。
[0043] 本發(fā)明中,所述橫方向距離特征提取包括以下步驟:
[0044] 步驟33a :計算所述文本塊鏈上每個結(jié)點(diǎn)到圖像中軸線橫方向的距離值;
[0045] 步驟33b :將所述橫方向的距離值歸一化;
[0046] 步驟33c :通過所述歸一化后的距離值得到所述橫方向距離特征向量。
[0047] 本發(fā)明中,所述步驟4中,采用SVM模型的多項式核函數(shù)和徑向基函數(shù)分別訓(xùn)練兩 個所述分類器;若兩個所述分類器識別的結(jié)果一致,則輸出識別結(jié)果;若兩個所述分類器 識別結(jié)果不一致,則輸出圖像中郵件方向無法辨別。
[0048] 本發(fā)明提出的基于布局信息分析的郵件圖像方向辨別方法,通過分析郵件圖像上 文本的布局信息來實(shí)現(xiàn)郵件圖像的方向辨別,本發(fā)明方法充分分析利用郵件圖像自身的布 局信息,不再依賴于預(yù)先印制的郵政編碼框,適應(yīng)性強(qiáng)。

【專利附圖】

【附圖說明】
[0049] 圖la為郵件正方向的圖像。
[0050] 圖lb為郵件負(fù)方向的圖像。
[0051] 圖2為本發(fā)明方法的流程圖。
[0052] 圖3為實(shí)施例1中的流程圖。
[0053] 圖4為標(biāo)記連通元后的圖像。
[0054] 圖5為過濾連通元后的圖像。
[0055] 圖6為實(shí)施例3的流程圖。
[0056] 圖7為文本塊初始化后的圖像。
[0057] 圖8為文本塊第一次分割后的圖像
[0058] 圖9為文本塊分割完成后的圖像。
[0059] 圖10為實(shí)施例4的流程圖。
[0060] 圖11為文本塊合并后的圖像。
[0061] 圖12為實(shí)施例6的流程圖。

【具體實(shí)施方式】
[0062] 結(jié)合以下具體實(shí)施例和附圖,對發(fā)明作進(jìn)一步的詳細(xì)說明。實(shí)施本發(fā)明的過程、條 件、實(shí)驗方法等,除以下專門提及的內(nèi)容之外,均為本領(lǐng)域的普遍知識和公知常識,本發(fā)明 沒有特別限制內(nèi)容。
[0063] 本發(fā)明中:
[0064] Height為輸入的郵件圖像的高度,Width為輸入的郵件圖像的寬度;
[0065] X方向為郵件圖像的橫方向,圖像的上邊界為X方向的坐標(biāo)軸,圖像的左上角為X 坐標(biāo)軸的零點(diǎn),從左向右為X坐標(biāo)軸的正向;
[0066] Y方向為郵件圖像的縱方向,圖像的左邊界為Y方向的坐標(biāo)軸,圖像的左上角為Y 坐標(biāo)軸的零點(diǎn),從上向下為Y坐標(biāo)軸的正向;
[0067] cc_minx為連通元的左邊界的X坐標(biāo)值;
[0068] cc_miny為連通元的上邊界的y坐標(biāo)值;
[0069] cc_maxx為連通元的右邊界的X坐標(biāo)值;
[0070] cc_maxy為連通元的下邊界的y坐標(biāo)值;
[0071] cc_height為連通元的高度,cc_width為連通元的寬度;
[0072] cc_pixelnum為連通元中前景像素點(diǎn)的個數(shù);
[0073] threshold_cc_ratio_x為過濾太靠近圖像左右邊界的連通元時使用的閾值, 0 ^ threshold_cc_ratio_x ^ 1/5 ;
[0074] threshold_cc_ratio_y為過濾太靠近圖像上下邊界的連通元時使用的閾值, 0 ^ threshold_cc_ratio_x ^ 1/5 ;
[0075] threshold_cc_ratio_h為過濾形狀特殊的連通兀時使用的閾值, 1/3 ^ threshold_cc_ratio_h ^ 1 ;
[0076] threshold_cc_ratio_w為過濾形狀特殊的連通元時使用的閾值, 1/3 ^ threshold_cc_ratio_w ^ 1 ;
[0077] cc_WHRatio 為連通兀的寬度與高度之比,cc_WHRatio = cc_width/cc_height ;
[0078] thresholcLcc^WHI^為過濾貼條邊緣的噪聲連通元時使用的最小閾值, 0 ^ threshold_cc_WHRL ^ 1 ;
[0079] threshold_cc_WHRK為過濾貼條邊緣的噪聲連通元時使用的最大閾值, threshold_cc_WHRE ^ 1 ;
[0080] threshold_cc_min_h為過濾高度太小的連通兀時使用的閾值,threshold_cc_ min_h ^ 0 ;
[0081] threshold_cc_min_w為過濾寬度太小的連通兀時使用的閾值,threshold_cc_ min_w ^ 0 ;
[0082] threshold_cc_min_pmun為過濾前景像素點(diǎn)個數(shù)太少的連通元時使用的閾值, threshold_cc_min_pnum ^ 0 ;
[0083] thrreshold_cc_ratio_rps為過濾前景像素點(diǎn)個數(shù)與面積之比太大的連通元時使 用的閾值,〇 < threshold_cc_ratio_rps < 1 ;
[0084] threshold_cc_ratio_lps為過濾前景像素點(diǎn)個數(shù)與面積之比太小的連通元時使 用的閾值,〇 < threshold_cc_ratio_lps < 1 ;
[0085] k為初始的文本塊個數(shù);
[0086] max_iterations為算法的最大迭代次數(shù);
[0087] overlap_w為兩個文本塊的X方向重合度,overlap_h為兩個文本塊的Y方向重合 度;
[0088] Length為文本塊的長度值;
[0089] L0 0A,L02, L03, L04, L05)為文本塊結(jié)點(diǎn)的長度特征的標(biāo)簽值集合;
[0090] S(S" S2, S3, S4, S5)為文本塊結(jié)點(diǎn)的長度特征的隱含狀態(tài)集合;
[0091] λ為HMM模型的參數(shù)λ = [Α,Β,π ],其中A為隱含狀態(tài)轉(zhuǎn)移概率矩陣、B為觀測 狀態(tài)轉(zhuǎn)移概率矩陣和η為初始隱含狀態(tài)概率矩陣;
[0092] Distance_y為相鄰文本塊結(jié)點(diǎn)間的Υ方向距離值;
[0093] DyCKDyOp Dy02, Dy03)為相鄰文本塊結(jié)點(diǎn)間的Y方向距離特征的標(biāo)簽值集合;
[0094] Distance_x為文本塊結(jié)點(diǎn)到圖像中軸線的X方向距離值;
[0095] DxCKDxOpDxO^DxC^DxCVDxC^)為文本塊結(jié)點(diǎn)到圖像中軸線的X方向距離特征的 標(biāo)簽值集合;
[0096] Resultl為分類器P的識別結(jié)果,Result2為分類器R的識別結(jié)果。
[0097] 本發(fā)明提出了一種基于布局信息分析的郵件圖像方向辨別方法,如圖2所示,包 括以下步驟:
[0098] 步驟1 :標(biāo)記圖像中的連通元;
[0099] 步驟2 :將各個連通元劃分至文本塊中;
[0100] 步驟3 :提取文本塊的特征向量;
[0101] 步驟4 :通過特征向量訓(xùn)練分類器;
[0102] 步驟5 :通過分類器識別圖像的方向。
[0103] 實(shí)施例1
[0104] 本實(shí)施例中的基于布局信息分析的郵件圖像方向辨別方法,如圖3所示,包括以 下步驟:
[0105] 步驟1 :將信封圖像進(jìn)行預(yù)處理,包括二值化和去除噪聲等操作;
[0106] 步驟2 :對預(yù)處理后的圖像進(jìn)行連通元標(biāo)記,然后過濾掉無效的連通元;
[0107] 步驟3 :利用標(biāo)記好的連通元進(jìn)行文本塊分割,并記錄每個文本塊的上、下、左、右 的邊界位置信息;
[0108] 步驟4:根據(jù)文本塊的中心位置值,從小到大對文本塊進(jìn)行排序,然后根據(jù)己記錄 的邊界信息對文本塊進(jìn)行合并調(diào)整,得到文本塊鏈;
[0109] 步驟5 :得到文本塊鏈后,提取特征向量,包括文本塊結(jié)點(diǎn)的長度特征向量、相鄰 文本塊結(jié)點(diǎn)之間的Y方向的距離特征向量、文本塊結(jié)點(diǎn)到中軸線的X方向距離特征向量,若 圖像為訓(xùn)練樣本圖像,則進(jìn)入步驟6 ;若為待識別圖像則進(jìn)入步驟7 ;
[0110] 步驟6 :得到所有訓(xùn)練樣本圖像的特征向量后,利用SVM模型訓(xùn)練分類器,得到用 于識別信封圖像方向識的分類器;
[0111] 步驟7 :利用訓(xùn)練得到的SVM分類器進(jìn)行方向識別并輸出判別結(jié)果。
[0112] 實(shí)施例2
[0113] 本發(fā)明基于布局信息分析的郵件圖像方向辨別方法中,為了進(jìn)行布局分析,需將 郵件圖像中的連通元標(biāo)記出來。由于郵件圖像上難免存在一些噪聲,這些噪聲可能被當(dāng)作 連通元標(biāo)記出來,對布局信息分析造成干擾。因此,本實(shí)施例中對連通元進(jìn)行了過濾。
[0114] 本實(shí)施例中,若連通元滿足以下任意一條,貝U過濾掉該連通元:
[0115] a.在輸入圖像的背景信息(如傳送皮帶)沒有完全去除的情況下,圖像邊界經(jīng)過 預(yù)處理會殘留一些噪聲,這些噪聲可能被標(biāo)記為連通元,因此將靠近圖像邊界位置的連通 元過濾,包括:
[0116] 連通兀的上邊界 cc_miny < Height*threshold_cc_ratio_y ;
[0117] 連通兀的下邊界 cc_maxy > Hrifht* (l_threshold_cc_ratio_y);
[0118] 連通兀的左邊界 cc_minx < Width*threshold_cc_ratio_x。
[0119] b.在輸入圖像有較長的折痕時,會形成狹長的噪聲,這些噪聲可能被標(biāo)記為連通 元,這些噪聲滿足以下條件:
[0120] 連通兀的高度 cc_height > Height*threshold_cc_ratio_h ;
[0121] 或連通兀的寬度 cc_width > Width*threshold_cc_ratio_w。
[0122] c.在小區(qū)域內(nèi)密集的噪聲點(diǎn)可能會被標(biāo)記為連通元,這些連通元滿足以下條件:
[0123] 連通兀的高度 cc_height < threshold_cc_min_h ;
[0124] 或連通兀的寬度 cc_width < threshold_cc_min_w。
[0125] d.貼有地址貼或者郵資貼的郵件圖像中,經(jīng)過預(yù)處理,貼條的邊緣會形成噪聲且 被標(biāo)記為連通元,這些噪聲滿足以下條件:
[0126] 連通元的寬度與高度之比cc_WHRatio > threshold_cc_WHRR或
[0127] cc-WHRatio < threshold-cc-WHRl。
[0128] e.由集中的少量噪聲點(diǎn)構(gòu)成的連通元,這些噪聲滿足以下條件:
[0129] 連通兀中的前景像素點(diǎn)個數(shù) cc_pixelnum < threshold_cc_mim_pnum。
[0130] f.連通元的前景像素點(diǎn)個數(shù)與面積之比為
[0131] cc-pixelnum/ (cc-height*cc-width) > threshold-cc-ratio-rps 或
[0132] cc-pixelnum/ (cc-height*cc-width) < threshold-cc-ratio_lps〇
[0133] 本發(fā)明中的閾值都是經(jīng)驗值,在編程實(shí)現(xiàn)的過程中,使用者根據(jù)自己需要處理的 圖像的特征來確定,沒有推演公式或者系統(tǒng)的確定方法。
[0134] 本實(shí)施例中,threshold_ _cc-ratio_y、threshold-cc-ratio_x、threshold-cc_ ratio-h、threshold-cc-ratio-w、threshold-cc-min-h、threshold-cc-min-w、threshold- cc_WHRr、 threshold_cc_WHRL、 threshold_cc_min_pnun、 threshold_cc_ratio_rps、 threshold-cc-ratio-lps 分別設(shè)為 0· 05、0. 05、0. 25、0. 25、10、10、4、0. 25、150、0. 7、0. 10。
[0135] 如圖4所示的信封圖像經(jīng)過連通元標(biāo)記以后的結(jié)果,圖4中黑色矩形框為被標(biāo)記 的連通元邊界。圖4中第1、2、3、4、8、11、12、13、14號連通元滿足連通元過濾規(guī)則d ;圖4中 第5、6、7、8、10號連通元滿足連通元過濾規(guī)則f,因此將上述連通元過濾掉。圖5為圖4連 通元過濾后的結(jié)果。
[0136] 實(shí)施例3
[0137] 本發(fā)明中,文本塊定義為在Y方向上距離相近的連通元組成的集合,因此需將標(biāo) 記出來的連通元劃分至文本塊中,即文本塊的分割。
[0138] 本實(shí)施例中,將位置相鄰的連通元將被劃分到一個文本塊中,所述位置相鄰是指 連通元中心Y方向上位置接近,如圖6所示,其包括以下步驟:
[0139] 步驟2a :設(shè)置初始文本塊個數(shù)k(k > 0),初始化k個文本塊中心的Y方向位置。
[0140] 步驟2b :在Y方向上,對每一個連通元,計算它的中心到每個文本塊中心的距離 值,選取最小的距離值對應(yīng)的文本塊,將這個連通元劃分到此文本塊中。
[0141] 步驟2c :對每一個文本塊,重新計算其中心的Y方向位置,使得經(jīng)過步驟2b劃分 后屬于該文本塊的所有連通元中心到該文本塊中心的Y方向距離的算術(shù)平均值最小。
[0142] 步驟2d :判斷是否所有文本塊中心的位置變化值小于給定的閾值或者迭代次數(shù) 是否大于max_iterations次,若判斷結(jié)果為是,則執(zhí)行步驟2e,否則再次執(zhí)行步驟2b。
[0143] 步驟2e :刪除不含有連通元的文本塊,然后計算出剩下文本塊中的所有連通元的 最小上邊界值、最大下邊界值、最小左邊界值和最大右邊界值,即得到該文本塊的上下左右 邊界信息。
[0144] 本實(shí)施例中,閾值和最大迭代次數(shù)沒有具體的推演公式或者系統(tǒng)的確定方法。理 論上,閾值越小、迭代次數(shù)越大分割的結(jié)果越好,但閾值太小或迭代次數(shù)太大,會消耗大量 的時間,并且分割效果不會取得明顯的改進(jìn)。
[0145] 本實(shí)施例中,閾值和最大迭代次數(shù)分別設(shè)為10和20。
[0146] 本實(shí)施例中,設(shè)置的初始文本塊個數(shù)k = 20, 20個文本塊的Y方向初始位置如圖7 所示,圖中橫向的直線即為初始的文本塊Y方向的中軸線,初始規(guī)則:第一個文本塊(即最 上方的)的中心的Υ方向初始位置為Height/?ο,從第二個文本塊開始,與上面一個文本塊 的中心的Y方向間距均為(9*Height/10-Height/10)/19,則最后一個文本塊的中心的Y方 向的位置為9*Height/10。
[0147] 文本塊初始化后,對經(jīng)過連通元過濾處理過后保留下來的每一個連通元(即圖5 中標(biāo)記的連通元)計算到每一個文本塊中心的Y方向距離,即圖7中每個連通元中心到每 條直線的距離,比較得到其中最短的距離值,對應(yīng)的直線即為連通元將劃入的文本塊。將每 個連通元都劃分完之后,對每一個文本塊,計算所有屬于該文本塊的連通元的中心y值的 代數(shù)平均值,作為此文本塊中心的新y值,此時文本塊Y方向中軸線的位置如圖8中橫向直 線所示,對比圖7,圖8中6條直線的位置變化大于10,且此時迭代次數(shù)為1。
[0148] 繼續(xù)重復(fù)上述步驟:計算連通元中心到文本塊中心距離,選最短距離將連通元劃 分,重新計算文本塊位置,此時迭代次數(shù)為2,所有直線的位置變化小于10,迭代結(jié)束。刪除 不包含連通元的文本塊,計算保留文本塊的上下左右邊界信息并用矩形框標(biāo)記,結(jié)果如圖9 所示。
[0149] 實(shí)施例4
[0150] 本發(fā)明中,文本塊分割后,有些文本塊會有大面積的重合,這些重合的文本塊中所 包含的連通元在位置上非常相近,有些甚至是同一個漢字中的不同部分,因此需要將它們 重新劃分,合并到一個文本塊中,
[0151] 如圖10所示,本實(shí)施例中對文本塊的合并包括以下步驟:
[0152] 步驟2f :利用冒泡排序算法,根據(jù)文本塊中心的Y方向值,從小到大對文本塊進(jìn)行 排序,即將文本塊在空間位置上從上到下進(jìn)行排序。
[0153] 步驟2g :將標(biāo)號i指向第一個文本塊,即空間上位于圖像最上邊的文本塊。
[0154] 步驟2h :計算第i個文本塊與第i+Ι個文本塊的X方向的重合度overlap_w和Y 方向的重合度overlap_h。
[0155] 步驟2i :判斷overlap_h是否大于0,若是轉(zhuǎn)入步驟2j,否則轉(zhuǎn)入步驟2n。
[0156] 步驟2j :判斷overlap_h是否大于第i個文本塊高度的1/2或者第i+1個文本塊 高度的1/2,若是則轉(zhuǎn)入步驟2m,否則轉(zhuǎn)入步驟2k。
[0157] 步驟2k :判斷overlap_h是否大于第i個文本塊高度的1/3或者第i+1個文本塊 高度的1/3,若是則轉(zhuǎn)入步驟21,否則轉(zhuǎn)入步驟2n。
[0158] 步驟21 :判斷overlap_w是否大于第i個文本塊寬度的3/4或者第i+1個文本塊 寬度的3/4,若是則轉(zhuǎn)入步驟2m,否則轉(zhuǎn)入步驟2n。
[0159] 步驟2m :合并第i個文本塊與第i+1個文本塊,重新計算第i+1個文本塊的邊界 信息,將第i個文本塊標(biāo)記為舍棄。
[0160] 步驟2n :將標(biāo)號i增加1,即由原來的標(biāo)號i變?yōu)闃?biāo)號i+1。
[0161] 步驟2〇 :檢查標(biāo)號是否指向最后一個文本塊,如果檢查結(jié)果為否,則返回步驟2h。
[0162] 步驟2p :如果檢查結(jié)果為是,則輸出保留的文本塊組成的文本塊鏈。
[0163] 以圖9為例,文本塊的排序結(jié)果即圖9中從上至下12個文本塊。將i指向第1個 文本塊,第2個文本塊的右邊界值減去第1個文本塊的左邊界值即為兩個文本塊的X方向 的重合度〇velap_w,第1個文本塊的下邊界值減去第2個文本塊的上邊界值即為兩個文本 塊的Y方向的重合度over lap _h,但over lap_h小于第1個文本塊高度的1/3和第2個文本 塊高度的1/3,不滿足合并條件,所以標(biāo)號i指向第二個文本塊,同樣的第2個文本塊和第 3個文本塊也不符合合并條件,標(biāo)號i繼續(xù)增加,直至標(biāo)號i指向第6個文本塊(即a文本 塊)時,計算〇verlap_w和overlap_h,此時overlap_h大于第7個文本塊(即b文本塊) 高度的1/3,且overlap_w大于第6個文本塊寬度的3/4,滿足合并條件,此時新的第7個文 本塊的邊界信息為:上邊界為第6個文本塊的上邊界、下邊界為第7個文本塊的下邊界、左 邊界為第6個文本塊的左邊界、右邊界為第6個文本塊的右邊界,將第6個文本塊標(biāo)記為舍 棄,標(biāo)號i繼續(xù)增加,當(dāng)標(biāo)號i指向第8個文本塊時,c、d文本塊也滿足了合并條件,合并完 文本塊后,標(biāo)號i繼續(xù)增加,當(dāng)標(biāo)號i指向第12個文本塊時,合并結(jié)束。將標(biāo)記為舍棄的文 本塊刪除,得到圖11所示的結(jié)果。
[0164] 實(shí)施例5
[0165] 本發(fā)明中,訓(xùn)練樣本及待識別圖像的特征向量都由三部分組成:文本塊結(jié)點(diǎn)的長 度特征(k維)、相鄰文本塊結(jié)點(diǎn)間的Y方向距離特征(k+Ι維)、和文本塊結(jié)點(diǎn)到圖像中軸 線的X方向距離特征(k維)。因此本發(fā)明中的特征向量為3k+l維。
[0166] 本實(shí)施例中,文本塊結(jié)點(diǎn)的長度特征提取包括以下步驟:
[0167] 步驟31a :根據(jù)每個文本塊的左右邊界值,依次計算得到文本塊鏈上每個結(jié)點(diǎn)的 長度值Length ;
[0168] 步驟31b :將每個結(jié)點(diǎn)的長度值Length歸一化:
[0169]

【權(quán)利要求】
1. 一種基于布局信息分析的郵件圖像方向辨別方法,其特征在于,包括以下步驟: 步驟1 :標(biāo)記圖像中的連通元; 步驟2 :將各個連通元劃分至文本塊中; 步驟3 :提取所述文本塊的特征向量; 步驟4 :通過所述特征向量訓(xùn)練分類器; 步驟5 :通過所述分類器辨別圖像的方向。
2. 如權(quán)利要求1所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,進(jìn) 一步包括對圖像進(jìn)行預(yù)處理;所述預(yù)處理包括:將所述圖像進(jìn)行二值化和去噪。
3. 如權(quán)利要求1所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,所 述步驟1中,進(jìn)一步包括:對所述連通元進(jìn)行過濾。
4. 如權(quán)利要求3所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,過 濾的所述連通元包括以下: 靠近圖像邊界位置的所述連通元; 圖像中由折痕形成的所述連通元; 小區(qū)域內(nèi)密集噪聲點(diǎn)構(gòu)成的所述連通元; 地址貼或郵資貼的邊緣形成的所述連通元; 前景像素點(diǎn)個數(shù)與面積之比大于閾值的所述連通元,所述閾值大于〇且小于或等于1 ; 前景像素點(diǎn)個數(shù)與面積之比小于閾值的所述連通元,所述閾值大于〇且小于1 ; 前景像素點(diǎn)小于閾值的連通元,所述閾值大于等于0。
5. 如權(quán)利要求1所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,所 述步驟2中,包括以下步驟: 步驟2a :設(shè)定所述文本塊的初始位置及數(shù)量; 步驟2b :將所述各個連通元劃分至與其縱方向值距離最小的文本塊中; 步驟2c :重新計算所述文本塊中心的縱方向值; 步驟2d :計算所述文本塊中心的縱方向位置變化值,并判斷變化值是否大于閾值并且 迭代次數(shù)是否小于最大迭代次數(shù),結(jié)果為是,則重復(fù)步驟2b,否則進(jìn)入步驟2e ; 步驟2e :刪除不含有所述連通元的所述文本塊并計算保留文本塊的邊界信息。
6. 如權(quán)利要求1所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,所 述步驟2中,進(jìn)一步包括以下步驟: 步驟2f :將所述文本塊排序; 步驟2g :若相鄰的所述文本塊在縱方向的重合度大于所述文本塊高度的二分之一,則 合并所述文本塊; 步驟2h :若相鄰的所述文本塊在縱方向重合度大于所述文本塊高度的三分之一,且在 橫方向重合度大于所述文本塊寬度的四分之三,則合并所述文本塊。
7. 如權(quán)利要求1所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,所 述步驟3中,所述特征向量由所述文本塊結(jié)點(diǎn)的長度特征向量、相鄰所述文本塊結(jié)點(diǎn)間的 縱方向距離特征向量和所述文本塊結(jié)點(diǎn)到圖像中軸線橫方向距離特征向量依次連接組成。
8. 如權(quán)利要求7所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,所 述長度特征提取包括以下步驟: 步驟31a :根據(jù)所述文本塊的左右邊界值計算得到所述文本塊鏈上每個結(jié)點(diǎn)的長度 值; 步驟31b :將所述長度值歸一化,得到所述文本塊鏈的觀察序列; 步驟31c :通過Baum-Wech算法訓(xùn)練得到隱含狀態(tài)轉(zhuǎn)移概率矩陣、觀測狀態(tài)轉(zhuǎn)移概率矩 陣和初始隱含狀態(tài)概率矩陣; 步驟31d :根據(jù)所述隱含狀態(tài)轉(zhuǎn)移概率矩陣、所述觀測狀態(tài)轉(zhuǎn)移概率矩陣和所述初始 隱含狀態(tài)概率矩陣,利用Viterbi算法求得所述觀察序列的隱含狀態(tài)序列; 步驟31e :通過所述隱含狀態(tài)序列得到所述文本塊結(jié)點(diǎn)的長度特征向量。
9. 如權(quán)利要求7所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,所 述縱方向距離特征提取包括以下步驟: 步驟32a :根據(jù)所述文本塊結(jié)點(diǎn)的中心位置計算得到相鄰所述文本塊鏈之間的縱方向 距離值; 步驟32b :將所述縱方向的距離值歸一化; 步驟32c :通過所述歸一化后的距離值得到相鄰所述文本塊結(jié)點(diǎn)之間縱方向距離特征 向量。
10. 如權(quán)利要求7所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,所 述橫方向距離特征提取包括以下步驟: 步驟33a :計算所述文本塊鏈上每個結(jié)點(diǎn)到圖像中軸線橫方向的距離值; 步驟33b :將所述橫方向的距離值歸一化; 步驟33c :通過所述歸一化后的距離值得到所述橫方向距離特征向量。
11. 如權(quán)利要求1所述的基于布局信息分析的郵件圖像方向辨別方法,其特征在于,所 述步驟4中,采用SVM模型的多項式核函數(shù)和徑向基函數(shù)分別訓(xùn)練兩個所述分類器;若兩個 所述分類器識別的結(jié)果一致,則輸出識別結(jié)果;若兩個所述分類器識別結(jié)果不一致,則輸出 圖像無法識別。
【文檔編號】G06K9/66GK104050487SQ201410250620
【公開日】2014年9月17日 申請日期:2014年6月6日 優(yōu)先權(quán)日:2014年6月6日
【發(fā)明者】呂岳, 吳瓊, 呂淑靜 申請人:華東師范大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1