文本圖像背面滲透的移除方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種文本圖像背面滲透的移除方法。
【背景技術(shù)】
[0002]由于古籍文本稀少珍貴,現(xiàn)代的保護(hù)方法往往是把這些古籍?dāng)?shù)字化,以掃描圖像的方式供研究人員翻閱。由于古籍紙張質(zhì)量或者長(zhǎng)時(shí)間保存的問(wèn)題,許多雙面書(shū)寫(xiě)或印刷的古籍都發(fā)生了背面滲透的現(xiàn)象,即墨水從紙張的另一面滲出的另一面的現(xiàn)象。這種現(xiàn)象會(huì)使古籍文本的內(nèi)容難以閱讀,同時(shí),也影響了某些珍貴手稿的視覺(jué)美感。
[0003]為了解決這個(gè)問(wèn)題,現(xiàn)已提出很多背面滲透移除的方法。這些方法基于圖像中像素點(diǎn)的信息把像素歸類為前景,背透和背景三類。但是僅僅利用一面的信息無(wú)法完全區(qū)分背透和正面淺色文字,而且這類方法計(jì)算速度很慢,所以無(wú)法達(dá)到實(shí)用的要求。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供一種文本圖像背面滲透的移除方法解決現(xiàn)有技術(shù)中存在的僅利用一面的信息無(wú)法完全區(qū)分背透和正面淺色文字的問(wèn)題。
[0005]本發(fā)明的技術(shù)解決方案是:
[0006]—種文本圖像背面滲透的移除方法,包括以下步驟:
[0007]步驟1、從兩張對(duì)齊的正面圖像與反面圖像中得到相除圖像,并對(duì)所得相除圖像求灰度直方圖;
[0008]步驟2、對(duì)所得相除圖像的直方圖通過(guò)預(yù)設(shè)定的第一閾值和第二閾值得到正面筆畫(huà)的第一模板圖和背面筆畫(huà)的第一模板圖;
[0009]步驟3、對(duì)正面圖像求灰度直方圖,從正面圖像的直方圖中利用二值化算法得到正面筆畫(huà)的第二模板圖;
[0010]步驟4、對(duì)反面圖像求灰度直方圖,從對(duì)齊的背面圖像的直方圖中利用二值化算法得到背面筆畫(huà)的第二模板圖;
[0011]步驟5、根據(jù)正面筆畫(huà)的第一模板圖和正面筆畫(huà)的第二模板圖以及背面筆畫(huà)的第一模板圖和背面筆畫(huà)的第二模板圖得到共同前景像素種子、共同背景像素種子、正面背透像素種子、反面背透像素四類像素種子;
[0012]步驟6、對(duì)步驟5所得共同前景像素種子、共同背景像素種子、正面背透像素種子、反面背透像素四類種子像素圖像,求每一類像素點(diǎn)灰度值的均值和方差進(jìn)行聚類,然后對(duì)正面圖像和反面圖像中其余沒(méi)有被歸類到這四類的像素點(diǎn)進(jìn)行分類,最后組合為正面前景圖像和反面前景圖像;
[0013]步驟7、最后分別對(duì)正面前景圖像和反面前景圖像采用隨機(jī)填充算法修復(fù)背面滲透部分,得到正面無(wú)背透圖像、反面無(wú)背透圖像。
[0014]進(jìn)一步地,從正面圖像和反面圖像得到相除圖像的公式為:
[0015]相除圖像的像素灰度值=正面圖像的像素灰度值/反面圖像的像素灰度值。
[0016]進(jìn)一步地,步驟2中,對(duì)所得相除圖像的直方圖,通過(guò)預(yù)先設(shè)定的第一閾值,得到所有像素值小于第一閾值的點(diǎn),組成正面圖像的第一模板圖;通過(guò)預(yù)先設(shè)定的第二閾值,得到所有像素值大于第二閾值的點(diǎn),組成反面圖像的第一模板圖。
[0017]進(jìn)一步地,步驟3和步驟4中,利用的二值化算法均為基于整體的Otsu二值化方法。
[0018]進(jìn)一步地,步驟5中,對(duì)正面筆畫(huà)的第一模板圖和正面筆畫(huà)的第二模板圖以及背面筆畫(huà)的第一模板圖和背面筆畫(huà)的第二模板圖,求出滿足以下要求的點(diǎn),作為共同前景像素種子:正面第一模板圖像素值為255,反面第一模板圖像素值為255;求出滿足以下要求的點(diǎn),作為共同背景像素種子:正面第二模板圖像素值為O,反面第二模板圖像素值為O;求出滿足以下要求的點(diǎn),作為正面背透像素種子:正面第二模板圖像素值為0,反面第一模板圖像素值為255;求出滿足以下要求的點(diǎn),作為背面背透像素種子:正面第一模板圖像素值為255,反面第二模板圖像素值為O。
[0019]進(jìn)一步地,步驟6中,對(duì)正面圖像和反面圖像中其余沒(méi)有被歸類到這四類的像素點(diǎn)進(jìn)行分類,具體為:把每一個(gè)像素點(diǎn)根據(jù)離四類中任意一類像素點(diǎn)灰度值的均值中心的距離遠(yuǎn)近分到距該像素點(diǎn)的距離最小的一類,得到四個(gè)圖像:正面前景/反面背透、正面前景/反面前景、反面前景/正面背透、正面背景/反面背景;把正面前景/反面背透和正面前景/反面前景組合為正面前景圖;把正面前景/反面前景和反面前景/正面背透組合為反面前景圖。
[0020]本發(fā)明的有益效果是:該種文本圖像背面滲透的移除方法,能有效的去除文本掃描圖像中的背面滲透部分同時(shí)較好的保證文本前景部分的完整性,提高文本圖像的可讀性,因此可用于解決古籍掃描圖像的數(shù)字化修復(fù)問(wèn)題。
【附圖說(shuō)明】
[0021]圖1是本發(fā)明實(shí)施例文本圖像背面滲透的移除方法的流程說(shuō)明示意圖。
[0022]圖2為實(shí)施例中正面圖像的示意圖。
[0023]圖3為實(shí)施例中反面圖像的示意圖。
[0024]圖4為圖2與圖3所得相除圖像的示意圖。
[0025]圖5為圖2與圖3所得相除圖像對(duì)應(yīng)的直方圖的示意圖。
[0026]圖6為實(shí)施例中正面筆畫(huà)的第一模板圖的不意圖。
[0027]圖7為實(shí)施例中反面筆畫(huà)的第一模板圖的示意圖。
[0028]圖8為實(shí)施例中正面圖像的灰度直方圖的的示意圖。
[0029]圖9為實(shí)施例中正面圖像的第二模板圖的示意圖。
[0030]圖10為實(shí)施例中反面圖像的直方圖的示意圖。
[0031]圖11為實(shí)施例中反面圖像的第二模板圖的示意圖。
【具體實(shí)施方式】
[0032 ]下面結(jié)合附圖詳細(xì)說(shuō)明本發(fā)明的優(yōu)選實(shí)施例。
[0033]實(shí)施例
[0034]—種文本圖像背面滲透的移除方法,包括以下步驟,如圖1:
[0035]步驟1、從兩張對(duì)齊的正面圖像與反面圖像中得到相除圖像,如圖2、圖3、圖4,并對(duì)所得相除圖像求灰度直方圖,如圖5;從正面圖像和反面圖像得到相除圖像的公式為:
[0036]相除圖像的像素灰度值=正面圖像的像素灰度值/反面圖像的像素灰度值。
[0037]步驟2、對(duì)所得相除圖像的直方圖通過(guò)預(yù)設(shè)定的第一閾值和第二閾值得到正面筆畫(huà)的第一模板圖和背面筆畫(huà)的第一模板圖,如圖6和圖7;
[0038]對(duì)所得相除圖像的直方圖,通過(guò)預(yù)先設(shè)定的第一閾值,得到所有像素值小于第一閾值的點(diǎn),組成正面圖像的第一模板圖,如圖6;通過(guò)預(yù)先設(shè)定的第二閾值,得到所有像素值大于第二閾值的點(diǎn),組成反面圖像的第一模板圖,如圖7。
[0039]步驟3、對(duì)正面圖像求灰度直方圖,如圖8,從正面圖像的直方圖中利用二值化算法得到正面筆畫(huà)的第二模板圖,如圖9;二值化算法采用基于整體的Otsu二值化方法。
[0040]步驟4、對(duì)反面圖像求灰度直方圖,如圖1O,從對(duì)齊的背面圖像的直方圖中利用二值化算法得到背面筆畫(huà)的第二模板圖,如圖11;二值化算法采用基于整體的Otsu二值化方法。
[0041]步驟5、根據(jù)正面筆畫(huà)的第一模板圖和正面筆畫(huà)的第二模板圖以及背面筆畫(huà)的第一模板圖和背面筆畫(huà)的第二模板圖得到共同前景像素種子、共同背景像素種子、正面背透像素種子、反面背透像素四類像素種子;
[0042]對(duì)正面筆畫(huà)的第一模板圖和正面筆畫(huà)的第二模板圖以及背面筆