專利名稱:一種基于文本邊界的中文文檔圖像畸變校正方法
技術(shù)領(lǐng)域:
本發(fā)明屬于文檔圖像處理技術(shù),尤其涉及基于文本邊界的文檔圖像畸變校正方法,具體涉及到了經(jīng)掃描獲取的中文文檔圖像的線性畸變和非線性畸變的校正方法。
背景技術(shù):
隨著信息技術(shù)的發(fā)展和辦公自動(dòng)化的普及,越來(lái)越多的文檔需要轉(zhuǎn)成電子形式, 掃描是一種基本的方式。在這個(gè)過(guò)程中,由于裝訂的影響,難以避免地會(huì)造成圖像存在一定程度上的畸變,這種畸變往往是線性畸變和非線性畸變的疊加。加之,現(xiàn)在的文檔經(jīng)常是包含大量表格、圖像等非文本內(nèi)容的復(fù)雜結(jié)構(gòu)文檔,使得文檔圖像的畸變校正變得十分困難?,F(xiàn)有的文檔圖像畸變校正方法主要分為兩類(lèi),一類(lèi)是依賴于3D的掃描設(shè)備,通過(guò)三維掃描儀獲取的圖像帶有深度信息,可以建立原始文本的畸變模型,通過(guò)幾何變換來(lái)校正圖像。由于三維掃描儀價(jià)格昂貴,目前還沒(méi)有被廣泛使用,限制了此類(lèi)方法的應(yīng)用。另外一類(lèi)是基于文本的方法,單純從掃描獲取的2D圖像獲取信息進(jìn)行畸變校正。這類(lèi)方法通常是針對(duì)特定文字設(shè)計(jì)的,如英文等。校正過(guò)程大致分為兩步,首先得到各個(gè)字母的重心,然后同一單詞的各個(gè)字母的重心相連得到中心線。然后,校正的過(guò)程就是改變各個(gè)字母的位置使得同一單詞的字母重心處于同一水平線上。由于中文是由字而非單詞組成,每個(gè)字由交錯(cuò)的筆畫(huà)組成而非孤立的字母組成;另外,由于很多中文字由左右或上下兩個(gè)不相連的部分組成,不同于英文字母,主體部分都是連通的,可以找到每個(gè)字母的重心,并且根據(jù)字母之間的距離可以準(zhǔn)確劃分出單詞。對(duì)于中文來(lái)講,并不能通過(guò)連通性來(lái)獲得單個(gè)字的重心。因此,這類(lèi)方法對(duì)中文文檔圖像的校正得不到較好的效果,甚至失效。在這種背景下, 為適應(yīng)現(xiàn)代化文檔圖像處理系統(tǒng)的需要,研究和開(kāi)發(fā)適合中文復(fù)雜結(jié)構(gòu)文檔圖像特點(diǎn)的畸變校正方法就成了一項(xiàng)意義重大并富有挑戰(zhàn)性的工作。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)存在的缺點(diǎn)以及中文文檔的特點(diǎn),我們提出了一種基于文本邊界線的中文文檔圖像畸變校正方法,克服了現(xiàn)有技術(shù)中的缺點(diǎn),不依賴于三維的掃描設(shè)備且能處理復(fù)雜結(jié)構(gòu)文檔圖像,并取得了良好的效果。我們首先對(duì)文檔圖像進(jìn)行預(yù)處理,然后提取文檔圖像的上下兩條文本邊界線,最后根據(jù)提取的文本邊界線進(jìn)行畸變的校正。具體步驟包括1.對(duì)掃描獲取的文檔圖像進(jìn)行預(yù)處理,去除頁(yè)面邊界及邊界以外區(qū)域(即當(dāng)被掃描文檔小于掃描儀器平面時(shí),獲取的非文檔之外的信息)的干擾,即刪除非文檔之外的信肩、ο2.判斷圖像的畸變方向,確定畸變區(qū)域。3.對(duì)文檔圖像進(jìn)行二值化。4.提取二值化后的文檔圖像的上下文本邊界線。5.根據(jù)上下文本邊界線,采用線性插值方法對(duì)文檔圖像中畸變區(qū)域進(jìn)行變換,得到校正的圖像。所述判斷圖像畸變方向的方法為A、對(duì)文檔圖像中灰度值小于閾值Tl的像素點(diǎn)p(i,j)進(jìn)行垂直方向的統(tǒng)計(jì)
權(quán)利要求
1.一種基于文本邊界的中文文檔圖像畸變校正方法,包括如下步驟1)對(duì)掃描獲取的文檔圖像進(jìn)行預(yù)處理,去除頁(yè)面邊界及邊界以外區(qū)域的干擾;2)判斷文檔圖像的畸變方向,確定畸變區(qū)域;3)對(duì)文檔圖像進(jìn)行二值化;4)提取經(jīng)二值化處理的文檔圖像的上下文本邊界線;5)根據(jù)上下文本邊界線,采用線性插值方法對(duì)文檔圖像中畸變區(qū)域進(jìn)行變換,得到校正的圖像。
2.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法,其特征在于,所述判斷圖像畸變方向的方法為A、對(duì)文檔圖像中灰度值小于閾值Tl的像素點(diǎn)p(i,j)進(jìn)行垂直方向的統(tǒng)計(jì) 眷她二 n,V(i,j)為像素點(diǎn)p(i,j)的灰度值,i,j分別為橫縱坐標(biāo),Length為圖像的高度,V(i) 為第i列像素的灰度值之和;B、根據(jù)V(i)判斷畸變方向,V(i)最大值所在的一側(cè)即為發(fā)生畸變的一側(cè)。
3.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法,其特征在于,所述對(duì)文檔圖像進(jìn)行二值化的方法為A、計(jì)算出每個(gè)像素點(diǎn)p(i,j)的N*N鄰域窗口的局部閾值T(i,j)T{iJ) = m{iJ).[\ + k{\-S-^-)}其中,m(i,j)和s(i,j)分別是像素點(diǎn)p(i,j)的N*N鄰域窗口的灰度均值和方差,i, j分別為橫縱坐標(biāo),N, K,R是常數(shù);il v(ij) > T(iJ)為B、設(shè)定每個(gè)像素點(diǎn)ρ (i,j),其灰度值v(/,_/)= nτ ,得到二值化后的文[O v(ij)< T(Ij)本圖像。
4.根據(jù)權(quán)利要求3所述的中文文檔圖像畸變校正方法,其特征在于,Tl為文檔圖像中灰度最大值的1/3。
5.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法,其特征在于,所述文本邊界線的提取方法為A、對(duì)二值化后的文檔圖像進(jìn)行水平方向的膨脹,使得同一行中的內(nèi)容產(chǎn)生粘連,形成一個(gè)連通區(qū)域,所述連通區(qū)域?yàn)槲臋n圖像的主文本區(qū)域;B、對(duì)主文本區(qū)域中首行的上線和最后一行的下線采用線段擬合方法,獲得文本上下邊界線;C、對(duì)文本上下邊界線進(jìn)行平滑修正,得到修正后的文本上下邊界線。
6.根據(jù)權(quán)利要求5所述的中文文檔圖像畸變校正方法,其特征在于,線段擬合方法為a、采用長(zhǎng)度為L(zhǎng)= K*h的水平線段初始描述上下線,其中,h為文本行的高度,K為系數(shù);b、連接各線段中點(diǎn),連接線構(gòu)成文本上下邊界線當(dāng)線段Ii與其左右線段Ih和li+1的高度存在如下關(guān)系=H(Ii^1)彡H(Ii)彡H(li+1)或者HD彡H(Ii)彡H(li+1)時(shí),連接H1和li+1的中點(diǎn);當(dāng)Ii與其左右線段Ip1和li+1的高度不符合所述關(guān)系時(shí),采用下述公式調(diào)整線段Ii的高度H(Ii) = Η(1η)+0/2,其中,D = H(Iw)-H(Ii),連接調(diào)整后的 1” Ii^1 和 li+1 的中點(diǎn)。
7.根據(jù)權(quán)利要求6所述的中文文檔圖像畸變校正方法,其特征在于,所述對(duì)文本上下邊界線進(jìn)行平滑修正的方法為a)對(duì)邊界線局部修正在線段擬合獲得的文本上下邊界線中,若上邊界線的兩條邊界段順時(shí)針夾角小于180 度;或者下邊界線兩條邊界段間順時(shí)針夾角大于180度,分別在兩條邊界段加入一標(biāo)記點(diǎn), 連接標(biāo)記點(diǎn),標(biāo)記點(diǎn)連接線為局部修正后的文本邊界線;b)對(duì)局部修正后的文本上下邊界線進(jìn)行基于曲率的全局約束,獲得修正后的文本上下邊界線。
8.根據(jù)權(quán)利要求5所述的中文文檔圖像畸變校正方法,其特征在于,所述當(dāng)前主文本區(qū)域的首行或最后一行不是文字時(shí),首先提取相鄰頁(yè)N±2的文本區(qū)域的文本上下邊界線, N為當(dāng)前文本區(qū)域所在的頁(yè)面的頁(yè)碼;然后根據(jù)相鄰頁(yè)的文本上下邊界線和畸變相似性確定當(dāng)前主文本區(qū)域的文本上下邊界線。
9.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法,其特征在于,所述文檔圖像是書(shū)脊方向垂直于掃描儀的掃描線方向獲得的文檔圖像。
10.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法,其特征在于,所述對(duì)畸變區(qū)域進(jìn)行變換的方法為a)計(jì)算每一列像素的成像畸變系數(shù)Iii = disybase其中,diSi為上下文本邊界線的距離,base是文檔圖像中未畸變區(qū)域上下文本邊界線的距離;b)根據(jù)成像畸變系數(shù)ki;將上下文本邊界線畸變區(qū)域上的點(diǎn)p(i,j)進(jìn)行變換得q
全文摘要
本發(fā)明公開(kāi)了一種基于文本邊界的中文文檔圖像畸變校正方法,包括1)對(duì)掃描獲取的文檔圖像進(jìn)行預(yù)處理,去除頁(yè)面邊界及邊界以外區(qū)域的干擾;2)判斷文檔圖像的畸變方向,確定畸變區(qū)域;3)對(duì)文檔圖像進(jìn)行二值化;4)提取經(jīng)二值化的文檔圖像的上下文本邊界線;5)根據(jù)上下文本邊界線,采用線性插值方法對(duì)文檔圖像中畸變區(qū)域進(jìn)行變換,得到校正的圖像;本發(fā)明解決了掃描獲取的中文文檔圖像的畸變校正問(wèn)題,根據(jù)中文特征提取文本邊界線進(jìn)行校正的方法,降低了計(jì)算復(fù)雜度的同時(shí),有效解決了復(fù)雜結(jié)構(gòu)文檔圖像的校正。同時(shí)本方法與采集設(shè)備無(wú)關(guān),不依賴于設(shè)備參數(shù),具有廣泛的應(yīng)用價(jià)值。
文檔編號(hào)G06K9/32GK102254171SQ201110196399
公開(kāi)日2011年11月23日 申請(qǐng)日期2011年7月13日 優(yōu)先權(quán)日2011年7月13日
發(fā)明者丁潤(rùn)偉, 劉宏 申請(qǐng)人:北京大學(xué)