基于結(jié)構(gòu)激光線的文檔圖像畸變矯正方法

文檔序號：9397503閱讀：657來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于結(jié)構(gòu)激光線的文檔圖像畸變矯正方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明實施例涉及數(shù)字圖像處理和計算機(jī)視覺技術(shù)領(lǐng)域，尤其是涉及基于結(jié)構(gòu)激光線的文檔圖像畸變矯正方法。
【背景技術(shù)】
[0002] 傳統(tǒng)的平板式掃描儀在掃描積厚文檔（如書刊）時，由于文檔的書脊區(qū)域無法完全平展緊貼掃描儀的玻璃平板表面，最終導(dǎo)致得到的文本圖像在書脊區(qū)域出現(xiàn)顯著的圖像畸變、非均勻陰影等掃描缺陷。這些掃描缺陷會嚴(yán)重影響后續(xù)的文檔圖像分析工作（如文檔圖像的版面分割、字符識別等）。因此，作為常用的文檔掃描工具，傳統(tǒng)的平板式掃描儀通常不適用于非平面文檔的高質(zhì)量掃描工作。
[0003] 為實現(xiàn)書籍等文檔的高質(zhì)量掃描，人們先后提出了一系列技術(shù)來試圖解決具有彎曲表面形狀的文檔圖像高質(zhì)量掃描問題。這些技術(shù)可大致分為兩大類：基于軟件的方法和基于硬件輔助的方法。前者通常對獲取的畸變圖像利用算法首先估計得到圖像的畸變函數(shù)，然后通過圖像變換矯正圖像中的畸變失真；而后者則通常在圖像采集過程中，借助某種硬件設(shè)備來輔助實現(xiàn)文檔圖像的高質(zhì)量采集。
[0004] 基于軟件的方法關(guān)鍵在于正確的估計文檔圖像的畸變函數(shù)，常用的方法包括基于圖像局部形變的技術(shù)、基于Shape-from-X的技術(shù)、基于頁面曲面模型化的技術(shù)、基于多視點圖像的技術(shù)等?；趫D像局部形變的技術(shù)注意到文檔圖像中通常存在大量的文本行。而對于無畸變的圖像，這些文本行通常都是水平方向、平行排列的。因此，該方法首先分割并提取文檔圖像中文本行，并估計每條文本行對應(yīng)的文本行基線，然后將彎曲的文本行基線拉成一條水平直線，并將文本行中的單詞逐個旋轉(zhuǎn)并沿矯正的基線重新排列，從而矯正文本行的彎曲。利用這種方法矯正后的圖像，文字識別精度能夠得到顯著提升，然而該方法矯正后的圖像視覺質(zhì)量不高，圖像中仍存在大量的畸變，且無法矯正非文本區(qū)域的圖像畸變。
[0005] 基于shape-from-X的技術(shù)利用圖像中的某種視覺線索來恢復(fù)文檔頁面的3D形狀，從而構(gòu)造圖像的畸變矯正函數(shù)。這些視覺線索包括陰影、輪廓、紋理等。在現(xiàn)有技術(shù)中，以頁面的陰影曲面最為常用。該技術(shù)通過分析頁面陰影與頁面形狀之間的約束關(guān)系，得到二者所滿足的約束方程，求解該方程得到頁面的3D曲面。最后利用該曲面完成圖像幾何畸變的矯正。該技術(shù)對頁面陰影要求較高，僅適用于光源受控環(huán)境下的圖像采集。
[0006] 基于頁面曲面模型化的技術(shù)則假設(shè)頁面的彎曲形狀為某種特定類型的曲面，如柱面或可展曲面，從而利用該假設(shè)來約束頁面曲面的估計。這其中，柱面假設(shè)是最為常用的一種假設(shè)。為估計透視變換下的柱面模型的參數(shù)，該技術(shù)通常進(jìn)一步限定相機(jī)拍攝的視角、距離、姿態(tài)等，且還需預(yù)先知道文檔頁面的尺寸等額外物理信息。這些苛刻條件為實際應(yīng)用造成了很多不便。此外，為準(zhǔn)確估計柱面模型的參數(shù)，需要精確的分割并提取文檔圖像中水平文本行，在對尚不成熟的文本行精確提取和擬合技術(shù)提出了很高的要求。由于文檔版面類型的多樣性以及圖像獲取過程中引入的畸變、噪聲等影響，精確的分割并提取水平文本行基線在實際中非常困難，從而嚴(yán)重制約了該方法的實際應(yīng)用。
[0007] 可展曲面假設(shè)是另一種常用的頁面形狀假設(shè)。由于文檔頁面總可以展開至平面上，因此，與柱面假設(shè)相比，該假設(shè)更具一般性。注意到可展曲面可由逐條平面片很好逼近，有研究者最新提出采用分片薄板樣條曲面來近似可展曲面，用于圖像幾何畸變的矯正。該技術(shù)利用目前成熟的平面透視失真矯正技術(shù)，對薄板樣條曲面逐片矯正，最后對這些矯正后的結(jié)果拼接完成圖像的矯正。然而，由于無可避免的估計誤差，拼接后的圖像中常存在裂縫、重疊等缺陷。這些缺陷大大影響了圖像矯正后的視覺效果。此外，由于透視失真與非線性幾何形變失真的復(fù)合，該技術(shù)無法徹底矯正圖像中存在的幾何畸變，存在矯正殘留誤差大、算法復(fù)雜等缺點。
[0008] 近來，有研究者還提出了基于多視點圖像的文檔圖像畸變矯正技術(shù)。該技術(shù)通過獲取同一文檔不同視點下的多幅圖像，從中提取圖像特征進(jìn)行配準(zhǔn)，進(jìn)而利用多視幾何和極線約束估計頁面的3D形狀。為了精確估計頁面的3D形狀，該技術(shù)需要對不同視點下拍攝的圖像進(jìn)行精確的特征點配準(zhǔn)。然而，由于圖像畸變的影響，在畸變嚴(yán)重的地方特征點匹配精度很差，從而導(dǎo)致該區(qū)域的形狀估計誤差大，得到的形變函數(shù)無法有效的矯正該區(qū)域的圖像畸變。
[0009] 與基于軟件的方法不同，基于硬件輔助的技術(shù)在圖像采集階段就引入特定的硬件裝備來輔助書籍文檔圖像的采集。代表性的技術(shù)包括基于3D掃描儀的技術(shù)、基于V-bed的書籍掃描技術(shù)和基于V-head的書籍掃描技術(shù)?；?D掃描儀的技術(shù)利用3D掃描儀直接獲取文檔頁面的3D深度信息，基于這些信息重構(gòu)頁面曲面的3D形狀，最后通過一個保角映射和紋理映射將扭曲的圖像映射至平面上，來矯正圖像的幾何扭曲。這類方法通常對圖像的幾何形變類型不加限制，能夠適用于圖像中多種類型的幾何畸變的矯正。然而，由于額外需要價格昂貴的3D掃描儀輔助圖像矯正，這類方法在實際中并不常用。并且，由于深度數(shù) 據(jù)中幾何拓?fù)潢P(guān)系的缺失，3D頁面形狀的重構(gòu)還存在計算量大、數(shù)值不穩(wěn)定等缺點，這些進(jìn) 一步限制的這類方法在實際中的應(yīng)用。
[0010] 基于V-bed的掃描技術(shù)設(shè)計了一種V形的底座來方便地放置打開的書頁。放置在 V形底座上的書頁，通過手指輕壓或借助于透明的玻璃平板覆壓可防止頁面出現(xiàn)顯著的形變。在采集頁面圖像時，該技術(shù)通常利用兩部高分辨率相機(jī)分別拍攝書籍的左右頁面。該技術(shù)能夠防止書籍圖像采集過程中產(chǎn)生顯著畸變，然而為了得到高質(zhì)量的頁面圖像，在掃描一本書不同厚度部分時，常需要不斷調(diào)整V形底座張開的角度。此外，該技術(shù)利用按壓來防止書籍頁面出現(xiàn)變形，這種技術(shù)屬于接觸式掃描方法，不適用于易損古籍的掃描。
[0011] 基于V-head的書籍掃描技術(shù)利用專門設(shè)計的V形掃描頭，并結(jié)合V形底座對書籍進(jìn)行掃描。這種掃描技術(shù)專門用于對積厚書籍的圖像掃描。掃描的時候，將一本厚書打開向上放置于V形底座上，然后將V形掃描頭插入頁面并調(diào)整高度將書籍頁面壓緊，防止頁面出現(xiàn)彎曲變形。該技術(shù)與基于V-bed的掃描技術(shù)類似，屬于一種接觸式的掃描技術(shù)，不適用于易損古籍的掃描。此外，基于V-head的掃描技術(shù)是專門針對書籍文檔的掃描而設(shè)計的，不能用于其他文檔的掃描，因此，其應(yīng)用范圍在實際中受到很大限制。
[0012] 有鑒于此，特提出本發(fā)明。

【發(fā)明內(nèi)容】

[0013] 本發(fā)明實施例的主要目的在于提供一種基于結(jié)構(gòu)激光線的文檔圖像畸變矯正方法，其至少部分地解決了如何矯正非平面文檔圖像的幾何畸變的技術(shù)問題。
[0014] 為了實現(xiàn)上述目的，根據(jù)本發(fā)明的一個方面，提供了以下技術(shù)方案：
[0015] -種基于結(jié)構(gòu)激光線的文檔圖像畸變矯正方法，該方法至少可以包括：
[0016] 對相機(jī)內(nèi)、外參數(shù)進(jìn)行標(biāo)定，并計算結(jié)構(gòu)激光線所在的平面方程；
[0017] 獲取文檔圖像；
[0018] 提取激光線；
[0019] 根據(jù)標(biāo)定的相機(jī)內(nèi)、外參數(shù)、所述結(jié)構(gòu)激光線所在的平面方程以及所述提取的激光線，估計所述文檔圖像的3D頁面準(zhǔn)線；
[0020] 根據(jù)所述3D頁面準(zhǔn)線，對可展曲面進(jìn)行插值；
[0021] 對所述插值的可展曲面進(jìn)行展開；
[0022] 根據(jù)所述展開的可展曲面，對圖像畸變進(jìn)行矯正。
[0023] 進(jìn)一步地，所述對相機(jī)內(nèi)、外參數(shù)進(jìn)行標(biāo)定，具體包括：
[0024] 根據(jù)棋盤格圖案標(biāo)定塊，得到標(biāo)定塊圖像，根據(jù)相機(jī)標(biāo)定算法計算相機(jī)的內(nèi)參數(shù)；
[0025] 在所述標(biāo)定塊圖像上建立世界坐標(biāo)系，根據(jù)所述相機(jī)標(biāo)定算法計算相機(jī)對應(yīng)的外參數(shù)。
[0026] 進(jìn)一步地，所述計算結(jié)構(gòu)激光線所在的平面方程，具體包括：
[0027] 根據(jù)所述相機(jī)外參數(shù)和內(nèi)參數(shù)，計算所述激光線上的點在世界坐標(biāo)系下的3D坐標(biāo)，利用最小二乘算法對同一激光線上的3D坐標(biāo)點進(jìn)行平面擬合。
[0028] 進(jìn)一步地，所述獲取文檔圖像具體包括：
[0029] 利用兩條一字線激光器照射文檔，開啟和關(guān)閉激光器電源，同時利用相機(jī)拍攝文檔頁面圖像。
[0030] 進(jìn)一步地，所述提取激光線，具體包括：
[0031] 提取所述文檔圖像的紅色通道圖像，

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3 4

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：孟高峰;潘春洪;向世明;王穎;汪凌峰;
技術(shù)所有人：中國科學(xué)院自動化研究所;
我是此專利的發(fā)明人

上一篇：一種基于光照分離模型的數(shù)字圖像去霧方法
上一篇：實現(xiàn)錐束ct圖像重建的方法及系統(tǒng)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

圖像畸變矯正相關(guān)技術(shù)

圖像畸變校正相關(guān)技術(shù)

圖像畸變相關(guān)技術(shù)

圖像畸變校正算法相關(guān)技術(shù)

魚眼圖像畸變校正代碼相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于結(jié)構(gòu)激光線的文檔圖像畸變矯正方法