文檔圖像壓縮方法及其在文檔認證中的應(yīng)用的制作方法
【專利摘要】本發(fā)明涉及文檔圖像壓縮方法及其在文檔認證中的應(yīng)用。公開了一種用于對包含文本的二值文檔圖像進行壓縮的方法。將文檔圖像分割為分別表示文檔中的字母、數(shù)字等的符號圖像。將符號圖像分類為多個類別,每個類別與模板圖像和類別索引相關(guān)聯(lián)。通過使用包括分區(qū)輪廓、側(cè)面輪廓、拓撲統(tǒng)計和低階圖像矩的多個圖像特征將待分類的每個符號與現(xiàn)有類別的模板進行比較來進行分類。使用基于容差的方法來對這些圖像特征進行比較以確定符號是否與模板匹配。在分類之后,其中分類有較少符號的某些類別可與其它類別合并。另外,對類別的模板圖像進行下采樣,其中,模板圖像的最終大小與模板和其它模板的混淆可能性有關(guān)。
【專利說明】文檔圖像壓縮方法及其在文檔認證中的應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像壓縮方法,具體地,涉及對包含文本的文檔圖像進行壓縮的方法以及該方法在文檔認證中的應(yīng)用。
【背景技術(shù)】
[0002]經(jīng)常打印可包括文本、圖形、圖片等的原始數(shù)字文檔,并且分發(fā)、復(fù)制所打印的硬拷貝等,然后經(jīng)常將所分發(fā)、復(fù)制的硬拷貝掃描回數(shù)字形式。認證掃描的數(shù)字文檔是指,確定掃描的文檔是否是原始數(shù)字文檔的認證拷貝,即,確定文檔在硬拷貝形式下是否被更改。更改可能是蓄意而為或因意外事件而發(fā)生。閉環(huán)處理中的文檔認證是指,生成在文檔本身上攜帶有認證數(shù)據(jù)的打印文檔以及使用從掃描的文檔提取的認證數(shù)據(jù)來對掃描回的文檔進行認證。這樣的打印文檔被稱為是自認證的,這是由于不需要除打印文檔上的信息之外的信息來對其內(nèi)容進行認證。
[0003]已提出了使用條形碼(特別是二維(2d)條形碼)來生成自認證文檔的方法。具體地,這樣的方法包括:對文檔的內(nèi)容(文本、圖形、圖片等)進行處理并將其轉(zhuǎn)換成作為文檔內(nèi)容的表示的認證數(shù)據(jù)、以2d條形碼(認證條形碼)對認證數(shù)據(jù)進行編碼以及將條形碼打印在與原始文檔內(nèi)容相同的記錄介質(zhì)上。這產(chǎn)生了自認證文檔。為了對這樣的打印文檔進行認證,對文檔進行掃描以獲得掃描圖像。還對認證條形碼進行掃描并提取其中包含的認證數(shù)據(jù)。然后,對掃描圖像進行處理并與認證數(shù)據(jù)進行比較,以確定打印文檔的任意部分是否已被更改,即,文檔是否可靠。一些認證技術(shù)能夠確定什么被更改和/或哪里被更改,一些認證技術(shù)僅能確定是否發(fā)生了任何更改。
[0004]JBIG2是用于二值圖像(特別是包含文本的文檔圖像)的壓縮的國際標準。JBIG2利用模式匹配和替換方法,通過該方法,將圖像分割為多個符號并且開發(fā)符號字典;使得文檔圖像中的每個符號與字典中的符號匹配,并且根據(jù)字典條目的索引以及圖像中的符號的位置和大小對每個符號進行編碼。
【發(fā)明內(nèi)容】
[0005]本發(fā)明涉及一種用于壓縮二值圖像(特別是包含文本的文檔圖像)的改進的壓縮方法。
[0006]本發(fā)明的目的是提供一種用于包含文本的文檔的高效圖像壓縮方法。
[0007]本發(fā)明的另一目的是提供一種用于生成攜帶認證信息的自認證打印文檔的方法。
[0008]將在隨后的描述中闡述本發(fā)明的附加特征和優(yōu)點,并且部分特征和優(yōu)點根據(jù)該描述將變得明顯,或者可通過實踐本發(fā)明來學習。將通過在書面說明書及其權(quán)利要求書以及附圖中具體指出的結(jié)構(gòu)來實現(xiàn)和獲得本發(fā)明的目的和其它優(yōu)點。
[0009]為了實現(xiàn)所實施的以及寬泛地描述的這些和/或其它目的,本發(fā)明提供了一種用于對表示包含文本區(qū)域的文檔的二值圖像進行壓縮的方法,該方法包括:(a)將文本區(qū)域分割為多個符號圖像,每個符號圖像表示文本的符號,每個符號圖像以具有位置和大小的邊界框為界;(b)將在步驟(a)中獲得的每個符號圖像分類為多個類別之一,每個類別由模板圖像和類別索引來表示,對于所分類的每個符號圖像,步驟(b)包括:(bl)將符號圖像與每個模板圖像進行比較以確定它們是否彼此匹配,包括將符號圖像的多個特征與模板圖像的對應(yīng)的多個特征進行比較,該多個特征包括密度統(tǒng)計特征、側(cè)面輪廓特征、拓撲統(tǒng)計特征和形狀特征;(b2)如果在步驟(bl)中找到匹配,則與所分類的符號圖像相關(guān)聯(lián)地記錄與所匹配的模板對應(yīng)的類別索引;以及(b3)如果在步驟(bl)中沒有找到匹配,則通過使用所分類的符號圖像的圖像作為新類別的模板圖像并為新類別分配類別索引而將新類別添加到多個類別,以及與所分類的符號圖像相關(guān)聯(lián)地記錄類別索引;(c)將每個類別的模板圖像的大小調(diào)整為最終大小;以及(d)將多個類別中的每個的經(jīng)大小調(diào)整后的模板圖像連同其類別索引、在步驟(a)中獲得的每個符號圖像的邊界框的位置和大小以及在步驟(b2)或(b3)中獲得的每個符號圖像的類別索引存儲作為壓縮的圖像數(shù)據(jù)。
[0010]在一些實施例中,密度統(tǒng)計特征包括分區(qū)輪廓特征,并且形狀特征包括低階矩特征。
[0011]在另一方面,本發(fā)明提供了一種用于對表示包含文本區(qū)域的文檔的二值圖像進行壓縮的方法,該方法包括:(a)將文本區(qū)域分割為多個符號圖像,每個符號圖像表示文本的符號,每個符號圖像以具有位置和大小的邊界框為界;(b)將在步驟(a)中獲得的每個符號圖像分類為多個類別之一,每個類別由模板圖像和類別索引來表示,對于所分類的每個符號圖像,步驟(b)包括:(bl)將符號圖像與每個模板圖像進行比較以確定它們是否彼此匹配;(b2)如果在步驟(bl)中找到匹配,則與所分類的符號圖像相關(guān)聯(lián)地記錄與所匹配的模板對應(yīng)的類別索引;以及(b3)如果在步驟(bl)中沒有找到匹配,則通過使用所分類的符號圖像的圖像作為新類別的模板圖像以及為新類別分配類別索引而將新類別添加到多個類另IJ,并且與所分類的符號圖像相關(guān)聯(lián)地記錄類別索引;(C)將每個類別的模板圖像的大小調(diào)整為最終大小,其中,至少一些模板圖像的最終大小是彼此不同的,步驟(C)包括:(Cl)計算每個模板圖像與每個其它模板圖像的相似度度量;(c2)基于算出的與其它模板圖像的相似度度量而確定每個模板圖像的最終大小;以及(c3)將每個模板圖像的大小調(diào)整為在步驟(c2)中確定的最終大小;以及(d)將多個類別中的每個的經(jīng)大小調(diào)整后的模板圖像連同其類別索引、在步驟(a)中獲得的每個符號圖像的邊界框的位置和大小、以及在步驟(b2)或(b3)中獲得的每個符號圖像的類別索引存儲作為壓縮的圖像數(shù)據(jù)。
[0012]在另一方面,本發(fā)明提供了 一種包括計算機可用非暫態(tài)介質(zhì)(例如,存儲器或存儲裝置)的計算機程序產(chǎn)品,該計算機可用非暫態(tài)介質(zhì)中嵌入有用于控制數(shù)據(jù)處理設(shè)備的計算機可讀程序代碼,該計算機可讀程序代碼被配置成使得數(shù)據(jù)處理設(shè)備執(zhí)行上述方法。
[0013]應(yīng)理解,以上的概括描述和以下的詳細描述均是示例性和說明性的,并且旨在提供要求保護的本發(fā)明的進一步說明。
【專利附圖】
【附圖說明】
[0014]圖1示意性地示出了根據(jù)本發(fā)明的實施例的用于對包含文本的文檔圖像進行壓縮的圖像壓縮方法。
[0015]圖2示意性地示出了根據(jù)本發(fā)明的實施例的用于使用各種圖像特征對兩個符號圖像進行比較的處理。[0016]圖3A和圖3B示意性地示出了用于生成和認證打印文檔的處理,其中,可應(yīng)用根據(jù)本發(fā)明的實施例的圖像壓縮方法。圖3A示出了對文檔圖像進行處理以生成壓縮的圖像數(shù)據(jù)以及打印具有對認證數(shù)據(jù)編碼的條形碼的文檔的方法;圖3B示出了使用以條形碼編碼的壓縮圖像來對掃描文檔進行認證的方法。
[0017]圖4繪出了可用在符號比較中的兩個符號的示例性側(cè)面輪廓。
【具體實施方式】
[0018]這里描述的方法可以在包括處理器、存儲器和存儲裝置的數(shù)據(jù)處理系統(tǒng)中實現(xiàn)。該數(shù)據(jù)處理系統(tǒng)可以是連接到打印機、掃描儀、復(fù)印機和/或多功能裝置的獨立計算機,或者可包含在打印機、掃描儀、復(fù)印機或多功能裝置中。該數(shù)據(jù)處理系統(tǒng)通過由處理器執(zhí)行存儲在存儲裝置中的計算機程序來執(zhí)行該方法。在一方面,本發(fā)明是由數(shù)據(jù)處理系統(tǒng)執(zhí)行的方法。在另一方面,本發(fā)明是在其中嵌入有用于控制數(shù)據(jù)處理設(shè)備的計算機可讀程序代碼的計算機可用非暫態(tài)介質(zhì)(存儲裝置)中實施的計算機程序產(chǎn)品。在另一方面,本發(fā)明在數(shù)據(jù)處理系統(tǒng)中來實施。
[0019]圖1示意性地示出了根據(jù)本發(fā)明的實施例的用于對包含文本的文檔圖像進行壓縮的圖像壓縮方法。首先,獲得電子文檔圖像(步驟S101)。這里,術(shù)語“圖像”是指位圖圖像,其中,每個圖像像素可具有二進制值、灰度級值或顏色值。文檔圖像是指在其內(nèi)容中包含大量文本的圖像,但是其也可包含諸如圖形和圖片的非文本內(nèi)容。文檔圖像可通過掃描硬拷貝文檔、利用攝像裝置拍攝硬拷貝文檔的照片、從另一電子文檔電子地生成圖像、從外部源接收等來獲得??蛇x地,可對文檔圖像進行預(yù)處理(步驟S102),這可包括去噪(B卩,去除小的、孤立的黑點)、去偏斜和/或?qū)υ趫D像是由攝像裝置生成的情況下的透視失真的校正?;谌缦录僭O(shè)來執(zhí)行這些處理:文檔圖像通常應(yīng)具有均勻且干凈的背景,文本行通常是水平或垂直的優(yōu)選朝向及從無限遠的正透視。可使用任意適當?shù)募夹g(shù)來實現(xiàn)這些預(yù)處理步驟。
[0020]分離文檔圖像的文本區(qū)域和非文本(例如,圖片、圖形)區(qū)域(步驟S103),然后對文本區(qū)域進行二值化以生成二值圖像(步驟S104)??墒褂萌我膺m當?shù)奈谋痉蛛x方法和二值化方法。將二值化后的文本區(qū)域分割為文本行(步驟S105),將這些行分割為詞(步驟S106),并且將詞進一步分割為符號(步驟S107)。每個符號是諸如字母、數(shù)字或某種其它符號的字符,并且被表示為圖像片。應(yīng)注意,在本公開中,術(shù)語“詞”和“符號”是指與詞或符號對應(yīng)的圖像片,而不是ASCII表示中的詞或符號。行分割可通過例如分析文本區(qū)域的圖像的水平投影輪廓或連通區(qū)域或者其它適當方法來執(zhí)行。詞和符號的分割可通過例如語形學操作和連通區(qū)域分析或者其它適當方法來執(zhí)行。作為分割的結(jié)果,獲得每個文本行、詞和符號的邊界框。邊界框是界定文本行、詞或符號的框。每個邊界框由其位置和大小限定。
[0021]然后,將每個符號分類為由模板表示的多個類別之一(步驟S108至S111)。模板是文檔圖像中的特有符號的圖像。針對文檔圖像建立模板集(有時稱為字典),其中,如以稍后將描述的特征的組合所衡量的,字典中的每個模板與其它模板不同。字典中的每個模板具有相應(yīng)的類別索引。在分類處理中,將待分類的符號與字典中已有的每個模板進行比較,以確定待分類的符號是否與任意模板匹配(步驟S108)。如果找到一個匹配(步驟S109中為“是”),則將該符號分類為由所匹配的模板表示的類別,并且記錄相應(yīng)的類別索引以及該待分類的符號的邊界框(位置和大小)(步驟S110)。如果通過比較步驟找到多個匹配,則將該符號分類為得到最佳匹配的類別。如果沒有找到匹配(步驟S109中為“否”),則將該符號作為分配有新的類別索引的新模板添加到字典(步驟S111),并且記錄新添加的類別的類別索引和符號的邊界框(步驟S110)。文檔的字典最初是空的,并且在對文檔圖像中的符號進行處理時這樣建立。重復(fù)步驟S108至S111,直到處理了文檔圖像的所有符號。
[0022]比較步驟S108使用符號的多個圖像特征的組合。特征包括例如分區(qū)輪廓、側(cè)面輪廓、拓撲統(tǒng)計、低階圖像矩等。
[0023]通過將符號的像素塊(例如,100X100的像素塊)劃分為多個分區(qū)(諸如mXn個分區(qū)(垂直方向m個分區(qū)和水平方向η個分區(qū)))來生成分區(qū)輪廓。分區(qū)的平均密度構(gòu)成被稱為分區(qū)輪廓的mXn矩陣。
[0024]符號的側(cè)面輪廓是從符號的邊界框的一側(cè)(諸如左側(cè)、右側(cè)、頂部和底部)觀看的符號的輪廓。圖4繪出了兩個符號“a”和“A”及其四個側(cè)面輪廓。為了進行比較,可以將側(cè)面輪廓歸一化(例如,歸一化為O與I之間);通過將原始側(cè)面輪廓除以符號的高度(對于左側(cè)輪廓和右側(cè)輪廓)或者除以符號的寬度(對于頂部輪廓和底部輪廓)來進行歸一化。側(cè)面輪廓也可以被置于數(shù)量比符號的高度或?qū)挾鹊南袼財?shù)量小的窗口(bin)中。
[0025]符號的拓撲統(tǒng)計可包括例如符號中的孔的數(shù)量、分支點的數(shù)量、端點的數(shù)量等。符號的分支點是如下點:該點在符號骨干上,并且其相鄰點中的至少三個也在骨干上。符號的端點是如下點:該點在符號骨干上,并且相鄰點中的一個且僅一個也在骨干上。例如,符號“6”具有一個孔、一個分支點和一個端點;符號“a”具有一個孔、兩個分支點和兩個端點等。
[0026]通用圖像矩被定義為:
【權(quán)利要求】
1.一種用于對表示包含文本區(qū)域的文檔的二值圖像進行壓縮的方法,所述方法包括: (a)將所述文本區(qū)域分割為多個符號圖像,每個符號圖像表示文本的符號,每個符號圖像以具有位置和大小的邊界框來界定; (b)將在步驟(a)中所獲得的每個符號圖像分類為多個類別之一,每個類別由模板圖像和類別索引來表示,對于所分類的每個符號圖像,步驟(b)包括: (bl)將所述符號圖像與每個模板圖像進行比較以確定它們是否彼此匹配,包括將所述符號圖像的多個特征與所述模板圖像的相應(yīng)多個特征進行比較,所述多個特征包括密度統(tǒng)計特征、側(cè)面輪廓特征、拓撲統(tǒng)計特征及形狀特征; (b2)如果在步驟(bl)中找到匹配,則與所分類的符號圖像相關(guān)聯(lián)地記錄與所匹配的模板對應(yīng)的類別索引;以及 (b3)如果在步驟(bl)中沒有找到匹配,則通過使用所分類的符號圖像的圖像作為新類別的模板圖像并為所述新類別分配類別索引,來將所述新類別添加到所述多個類別,并且與所分類的符號圖像相關(guān)聯(lián)地記錄所述類別索引; (C)將每個類別的模板圖像的大小調(diào)整為最終大??;以及 (d)將所述多個類別中的每個類別的經(jīng)大小調(diào)整后的模板圖像連同其類別索引、在步驟(a)中所獲得的每個符號圖像的邊界框的位置和大小、以及在步驟(b2)或(b3)中所獲得的每個符號圖像的類別索引存儲為壓縮的圖像數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其中,步驟(a)包括:將所述文本區(qū)域分割為多個行,將所述多個行分割為多個詞,以及將所述多個詞分割為所述多個符號圖像。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述密度統(tǒng)計特征包括分區(qū)輪廓特征,其中,所述形狀特征包括低階矩特征,以及 其中,對于所比較的每個模板圖像,步驟(bl)包括: 計算第一差別數(shù)量、第二差別數(shù)量、第三差別數(shù)量和第四差別數(shù)量,所述第一差別數(shù)量、第二差別數(shù)量、第三差別數(shù)量和第四差別數(shù)量分別表示所述符號圖像的、與所述模板圖像的相應(yīng)特征不同的分區(qū)輪廓特征的數(shù)量、側(cè)面輪廓特征的數(shù)量、拓撲統(tǒng)計特征的數(shù)量和低階矩特征的數(shù)量;以及 其中,如果所述第一差別數(shù)量小于或等于第一閾值,所述第二差別數(shù)量小于或等于第二閾值,所述第三差別數(shù)量小于或等于第三閾值,以及所述第四差別數(shù)量小于或等于第四閾值,則確定所述符號圖像和所述模板圖像彼此匹配。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述密度統(tǒng)計特征包括分區(qū)輪廓特征,其中,所述形狀特征包括低階矩特征,以及 其中,對于每個所比較的模板圖像,步驟(bl)包括: 計算第一差別數(shù)量、第二差別數(shù)量、第三差別數(shù)量和第四差別數(shù)量,所述第一差別數(shù)量、第二差別數(shù)量、第三差別數(shù)量和第四差別數(shù)量分別表示所述符號圖像的、與所述模板圖像的相應(yīng)特征不同的分區(qū)輪廓特征的數(shù)量、側(cè)面輪廓特征的數(shù)量、拓撲統(tǒng)計特征的數(shù)量和低階矩特征的數(shù)量;以及 其中,如果所述第一差別數(shù)量至所述第四差別數(shù)量的和小于或等于閾值,則確定所述符號圖像和所述模板圖像彼此匹配。
5.根據(jù)權(quán)利要求1所述的方法,在步驟(b)之后以及在步驟(c)之前還包括如下步驟:如果在步驟(b)中被分類為第一類別的符號圖像的總數(shù)低于閾值并且所述第一類別的分類置信度的度量低于另一閾值,則將所述多個類別中的所述第一類別合并到所述多個類別中的第二類別中。
6.根據(jù)權(quán)利要求1所述的方法,其中,在步驟(c)中,至少一些模板圖像的最終大小是彼此不同的,其中,步驟(C)包括: (Cl)計算每個模板圖像與每個其它模板圖像的相似度度量; (c2)基于算出的與其它模板圖像的相似度度量,確定每個模板圖像的最終大?。灰约? (c3)將每個模板圖像的大小調(diào)整為在步驟(c2)中所確定的最終大小。
7.根據(jù)權(quán)利要求6所述的方法,其中,對于每對模板圖像,步驟(Cl)包括: 計算第一差別數(shù)量、第二差別數(shù)量、第三差別數(shù)量和第四差別數(shù)量,所述第一差別數(shù)量、第二差別數(shù)量、第三差別數(shù)量和第四差別數(shù)量分別表示該對模板圖像的彼此不同的分區(qū)輪廓特征的數(shù)量、側(cè)面輪廓特征的數(shù)量、拓撲統(tǒng)計特征的數(shù)量和低階矩特征的數(shù)量;以及對所述第一差別數(shù)量至所述第四差別數(shù)量求和作為所述相似度度量。
8.一種用于對表示包含文本區(qū)域的文檔的二進制圖像進行壓縮的方法,所述方法包括: (a)將所述文本區(qū)域分割為多個符號圖像,每個符號圖像表示文本的符號,每個符號圖像以具有位置和大小的邊界框來界定; (b)將在步驟(a)中所獲得的每個符號圖像分類為多個類別之一,每個類別由模板圖像和類別索引來表示,對于所分類的每個符號圖像,步驟(b)包括: (bl)將所述符號圖像與每個模板圖像進行比較,以確定它們是否彼此匹配; (b2)如果在步驟(bl)中找到匹配,則與所分類的符號圖像相關(guān)聯(lián)地記錄與所匹配的模板對應(yīng)的類別索引;以及 (b3)如果在步驟(bl)中沒有找到匹配,則通過使用所分類的符號圖像的圖像作為新類別的模板圖像并為所述新類別分配類別索引,來將所述新類別添加到所述多個類別,以及與所分類的符號圖像相關(guān)聯(lián)地記錄所述類別索引; (C)將每個類別的模板圖像的大小調(diào)整為最終大小,其中,至少一些模板圖像的最終大小是彼此不同的,步驟(C 包括: (Cl)計算每個模板圖像與每個其它模板圖像的相似度度量; (c2)基于算出的與其它模板圖像的相似度度量,確定每個模板圖像的最終大?。灰约?c3)將每個模板圖像的大小調(diào)整為在步驟(c2)中所確定的最終大?。灰约?d)將所述多個類別中的每個類別的經(jīng)大小調(diào)整后的模板圖像連同其類別索引、在步驟(a)中所獲得的每個符號圖像的邊界框的位置和大小以及在步驟(b2)或(b3)中所獲得的每個符號圖像的類別索引存儲為壓縮的圖像數(shù)據(jù)。
9.根據(jù)權(quán)利要求8所述的方法,其中,對于每對模板圖像,步驟(Cl)包括: 計算第一差別數(shù)量、第二差別數(shù)量、第三差別數(shù)量和第四差別數(shù)量,所述第一差別數(shù)量、第二差別數(shù)量、第三差別數(shù)量和第四差別數(shù)量分別表示該對模板圖像的彼此不同的分區(qū)輪廓特征的數(shù)量、側(cè)面輪廓特征的數(shù)量、拓撲統(tǒng)計特征的數(shù)量和低階矩特征的數(shù)量;以及對所述第一差別數(shù)量至所述第四差別數(shù)量求和作為所述相似度度量。
10.根據(jù)權(quán)利要求8所述的方法,在步驟(b)之后以及在步驟(c)之前還包括如下步驟: 如果在步驟(b)中被分類為第一類別的符號圖像的總數(shù)低于閾值并且所述第一類別的分類置信度的度量低 于另一閾值,則將所述多個類別中的所述第一類別合并到所述多個類別中的第二類別中。
【文檔編號】G06T9/00GK103914858SQ201310740957
【公開日】2014年7月9日 申請日期:2013年12月27日 優(yōu)先權(quán)日:2012年12月28日
【發(fā)明者】田宜彬, 明偉 申請人:柯尼卡美能達美國研究所有限公司