一種基于文本邊界的中文文檔圖像畸變校正方法

文檔序號(hào)：6559440閱讀：338來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種基于文本邊界的中文文檔圖像畸變校正方法
技術(shù)領(lǐng)域：
本發(fā)明屬于文檔圖像處理技術(shù)，尤其涉及基于文本邊界的文檔圖像畸變校正方法，具體涉及到了經(jīng)掃描獲取的中文文檔圖像的線性畸變和非線性畸變的校正方法。
背景技術(shù)：
隨著信息技術(shù)的發(fā)展和辦公自動(dòng)化的普及，越來(lái)越多的文檔需要轉(zhuǎn)成電子形式，掃描是一種基本的方式。在這個(gè)過(guò)程中，由于裝訂的影響，難以避免地會(huì)造成圖像存在一定程度上的畸變，這種畸變往往是線性畸變和非線性畸變的疊加。加之，現(xiàn)在的文檔經(jīng)常是包含大量表格、圖像等非文本內(nèi)容的復(fù)雜結(jié)構(gòu)文檔，使得文檔圖像的畸變校正變得十分困難?，F(xiàn)有的文檔圖像畸變校正方法主要分為兩類(lèi)，一類(lèi)是依賴于3D的掃描設(shè)備，通過(guò)三維掃描儀獲取的圖像帶有深度信息，可以建立原始文本的畸變模型，通過(guò)幾何變換來(lái)校正圖像。由于三維掃描儀價(jià)格昂貴，目前還沒(méi)有被廣泛使用，限制了此類(lèi)方法的應(yīng)用。另外一類(lèi)是基于文本的方法，單純從掃描獲取的2D圖像獲取信息進(jìn)行畸變校正。這類(lèi)方法通常是針對(duì)特定文字設(shè)計(jì)的，如英文等。校正過(guò)程大致分為兩步，首先得到各個(gè)字母的重心，然后同一單詞的各個(gè)字母的重心相連得到中心線。然后，校正的過(guò)程就是改變各個(gè)字母的位置使得同一單詞的字母重心處于同一水平線上。由于中文是由字而非單詞組成，每個(gè)字由交錯(cuò)的筆畫(huà)組成而非孤立的字母組成；另外，由于很多中文字由左右或上下兩個(gè)不相連的部分組成，不同于英文字母，主體部分都是連通的，可以找到每個(gè)字母的重心，并且根據(jù)字母之間的距離可以準(zhǔn)確劃分出單詞。對(duì)于中文來(lái)講，并不能通過(guò)連通性來(lái)獲得單個(gè)字的重心。因此，這類(lèi)方法對(duì)中文文檔圖像的校正得不到較好的效果，甚至失效。在這種背景下，為適應(yīng)現(xiàn)代化文檔圖像處理系統(tǒng)的需要，研究和開(kāi)發(fā)適合中文復(fù)雜結(jié)構(gòu)文檔圖像特點(diǎn)的畸變校正方法就成了一項(xiàng)意義重大并富有挑戰(zhàn)性的工作。

發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)存在的缺點(diǎn)以及中文文檔的特點(diǎn)，我們提出了一種基于文本邊界線的中文文檔圖像畸變校正方法，克服了現(xiàn)有技術(shù)中的缺點(diǎn)，不依賴于三維的掃描設(shè)備且能處理復(fù)雜結(jié)構(gòu)文檔圖像，并取得了良好的效果。我們首先對(duì)文檔圖像進(jìn)行預(yù)處理，然后提取文檔圖像的上下兩條文本邊界線，最后根據(jù)提取的文本邊界線進(jìn)行畸變的校正。具體步驟包括1.對(duì)掃描獲取的文檔圖像進(jìn)行預(yù)處理，去除頁(yè)面邊界及邊界以外區(qū)域(即當(dāng)被掃描文檔小于掃描儀器平面時(shí)，獲取的非文檔之外的信息)的干擾，即刪除非文檔之外的信肩、ο2.判斷圖像的畸變方向，確定畸變區(qū)域。3.對(duì)文檔圖像進(jìn)行二值化。4.提取二值化后的文檔圖像的上下文本邊界線。5.根據(jù)上下文本邊界線，采用線性插值方法對(duì)文檔圖像中畸變區(qū)域進(jìn)行變換，得到校正的圖像。所述判斷圖像畸變方向的方法為A、對(duì)文檔圖像中灰度值小于閾值Tl的像素點(diǎn)p(i，j)進(jìn)行垂直方向的統(tǒng)計(jì)
權(quán)利要求
1.一種基于文本邊界的中文文檔圖像畸變校正方法，包括如下步驟1)對(duì)掃描獲取的文檔圖像進(jìn)行預(yù)處理，去除頁(yè)面邊界及邊界以外區(qū)域的干擾；2)判斷文檔圖像的畸變方向，確定畸變區(qū)域；3)對(duì)文檔圖像進(jìn)行二值化；4)提取經(jīng)二值化處理的文檔圖像的上下文本邊界線；5)根據(jù)上下文本邊界線，采用線性插值方法對(duì)文檔圖像中畸變區(qū)域進(jìn)行變換，得到校正的圖像。
2.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法，其特征在于，所述判斷圖像畸變方向的方法為A、對(duì)文檔圖像中灰度值小于閾值Tl的像素點(diǎn)p(i，j)進(jìn)行垂直方向的統(tǒng)計(jì) 眷她二 n，V(i，j)為像素點(diǎn)p(i，j)的灰度值，i，j分別為橫縱坐標(biāo)，Length為圖像的高度，V(i) 為第i列像素的灰度值之和；B、根據(jù)V(i)判斷畸變方向，V(i)最大值所在的一側(cè)即為發(fā)生畸變的一側(cè)。
3.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法，其特征在于，所述對(duì)文檔圖像進(jìn)行二值化的方法為A、計(jì)算出每個(gè)像素點(diǎn)p(i，j)的N*N鄰域窗口的局部閾值T(i，j)T{iJ) = m{iJ).[\ + k{\-S-^-)}其中，m(i，j)和s(i，j)分別是像素點(diǎn)p(i，j)的N*N鄰域窗口的灰度均值和方差，i， j分別為橫縱坐標(biāo)，N, K，R是常數(shù)；il v(ij) > T(iJ)為B、設(shè)定每個(gè)像素點(diǎn)ρ (i，j)，其灰度值v(/,_/)= nτ ，得到二值化后的文[O v(ij)< T(Ij)本圖像。
4.根據(jù)權(quán)利要求3所述的中文文檔圖像畸變校正方法，其特征在于，Tl為文檔圖像中灰度最大值的1/3。
5.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法，其特征在于，所述文本邊界線的提取方法為A、對(duì)二值化后的文檔圖像進(jìn)行水平方向的膨脹，使得同一行中的內(nèi)容產(chǎn)生粘連，形成一個(gè)連通區(qū)域，所述連通區(qū)域?yàn)槲臋n圖像的主文本區(qū)域；B、對(duì)主文本區(qū)域中首行的上線和最后一行的下線采用線段擬合方法，獲得文本上下邊界線；C、對(duì)文本上下邊界線進(jìn)行平滑修正，得到修正后的文本上下邊界線。
6.根據(jù)權(quán)利要求5所述的中文文檔圖像畸變校正方法，其特征在于，線段擬合方法為a、采用長(zhǎng)度為L(zhǎng)= K*h的水平線段初始描述上下線，其中，h為文本行的高度，K為系數(shù)；b、連接各線段中點(diǎn)，連接線構(gòu)成文本上下邊界線當(dāng)線段Ii與其左右線段Ih和li+1的高度存在如下關(guān)系=H(Ii^1)彡H(Ii)彡H(li+1)或者HD彡H(Ii)彡H(li+1)時(shí)，連接H1和li+1的中點(diǎn)；當(dāng)Ii與其左右線段Ip1和li+1的高度不符合所述關(guān)系時(shí)，采用下述公式調(diào)整線段Ii的高度H(Ii) = Η(1η)+0/2，其中，D = H(Iw)-H(Ii)，連接調(diào)整后的 1” Ii^1 和 li+1 的中點(diǎn)。
7.根據(jù)權(quán)利要求6所述的中文文檔圖像畸變校正方法，其特征在于，所述對(duì)文本上下邊界線進(jìn)行平滑修正的方法為a)對(duì)邊界線局部修正在線段擬合獲得的文本上下邊界線中，若上邊界線的兩條邊界段順時(shí)針夾角小于180 度；或者下邊界線兩條邊界段間順時(shí)針夾角大于180度，分別在兩條邊界段加入一標(biāo)記點(diǎn)，連接標(biāo)記點(diǎn)，標(biāo)記點(diǎn)連接線為局部修正后的文本邊界線；b)對(duì)局部修正后的文本上下邊界線進(jìn)行基于曲率的全局約束，獲得修正后的文本上下邊界線。
8.根據(jù)權(quán)利要求5所述的中文文檔圖像畸變校正方法，其特征在于，所述當(dāng)前主文本區(qū)域的首行或最后一行不是文字時(shí)，首先提取相鄰頁(yè)N±2的文本區(qū)域的文本上下邊界線， N為當(dāng)前文本區(qū)域所在的頁(yè)面的頁(yè)碼；然后根據(jù)相鄰頁(yè)的文本上下邊界線和畸變相似性確定當(dāng)前主文本區(qū)域的文本上下邊界線。
9.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法，其特征在于，所述文檔圖像是書(shū)脊方向垂直于掃描儀的掃描線方向獲得的文檔圖像。
10.根據(jù)權(quán)利要求1所述的中文文檔圖像畸變校正方法，其特征在于，所述對(duì)畸變區(qū)域進(jìn)行變換的方法為a)計(jì)算每一列像素的成像畸變系數(shù)Iii = disybase其中，diSi為上下文本邊界線的距離，base是文檔圖像中未畸變區(qū)域上下文本邊界線的距離；b)根據(jù)成像畸變系數(shù)ki;將上下文本邊界線畸變區(qū)域上的點(diǎn)p(i，j)進(jìn)行變換得q
全文摘要
本發(fā)明公開(kāi)了一種基于文本邊界的中文文檔圖像畸變校正方法，包括1)對(duì)掃描獲取的文檔圖像進(jìn)行預(yù)處理，去除頁(yè)面邊界及邊界以外區(qū)域的干擾；2)判斷文檔圖像的畸變方向，確定畸變區(qū)域；3)對(duì)文檔圖像進(jìn)行二值化；4)提取經(jīng)二值化的文檔圖像的上下文本邊界線；5)根據(jù)上下文本邊界線，采用線性插值方法對(duì)文檔圖像中畸變區(qū)域進(jìn)行變換，得到校正的圖像；本發(fā)明解決了掃描獲取的中文文檔圖像的畸變校正問(wèn)題，根據(jù)中文特征提取文本邊界線進(jìn)行校正的方法，降低了計(jì)算復(fù)雜度的同時(shí)，有效解決了復(fù)雜結(jié)構(gòu)文檔圖像的校正。同時(shí)本方法與采集設(shè)備無(wú)關(guān)，不依賴于設(shè)備參數(shù)，具有廣泛的應(yīng)用價(jià)值。
文檔編號(hào)G06K9/32GK102254171SQ201110196399
公開(kāi)日2011年11月23日申請(qǐng)日期2011年7月13日優(yōu)先權(quán)日2011年7月13日
發(fā)明者丁潤(rùn)偉, 劉宏申請(qǐng)人:北京大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉宏;丁潤(rùn)偉
技術(shù)所有人：北京大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像畸變校正相關(guān)技術(shù)

圖像畸變相關(guān)技術(shù)

圖像畸變校正算法相關(guān)技術(shù)

魚(yú)眼圖像畸變校正代碼相關(guān)技術(shù)

圖像幾何畸變校正相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于文本邊界的中文文檔圖像畸變校正方法