專利名稱:文檔圖像二值化方法及其裝置,以及文檔圖像處理器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理與模式識(shí)別的技術(shù)領(lǐng)域,更具體地說(shuō),涉及對(duì)文檔圖像進(jìn)行
二值化的方法及其裝置,以及包括該圖像二值化裝置的圖像處理器。
背景技術(shù):
文檔圖像的二值化,是指將彩色或灰度文檔圖像轉(zhuǎn)化為二值圖像。通常的二值化 方法在二值化處理過(guò)程中,由于只利用單幅圖像的信息盡量做到最優(yōu)二值化,因此往往存 在二值化效果不夠優(yōu)化的缺陷,尤其在二值化質(zhì)量的穩(wěn)定性上表現(xiàn)不佳。即使對(duì)于同一文 檔的不同圖像副本,使用通常的二值化方法所獲得的二值文檔圖像也往往存在明顯的差異 性。 在文檔圖像的二值化處理中,尤其重要的是提高同類型文檔圖像的二值化效果和 二值化質(zhì)量穩(wěn)定性。 同類型文檔是指在某應(yīng)用中針對(duì)某一任務(wù)或目的服務(wù)的文檔。 一般而言,同類型 文檔具有相同或類似的特性,諸如相同或類似的字體字號(hào),相同或類似的排版方式,相同或 類似的內(nèi)容構(gòu)成等。例如,一本論文集里的各個(gè)頁(yè)面文檔就屬于同類型文檔。對(duì)于一些辦 公表格文檔,各文檔間存在部分完全相同的內(nèi)容,如預(yù)先印制內(nèi)容和表格線等,而僅僅是在 填寫的內(nèi)容上存在差別。這種相同或類似性也反映到圖像上,在理想情況下,同類型文檔的 圖像屬性在不同圖像實(shí)例之間是能保持一致的。因此,理想的二值化方法能使同類型文檔 的二值圖像在圖像屬性上保持一致。但是,在真實(shí)環(huán)境中,圖像采集方式和參數(shù)千差萬(wàn)別, 采集過(guò)程中降質(zhì)因素(如噪聲、光照變化、傾斜、變形、色差等)無(wú)法預(yù)測(cè),無(wú)法實(shí)現(xiàn)上述的 理想采集方式。這是導(dǎo)致同類型文檔的不同圖像實(shí)例之間存在差異性的本質(zhì)原因。以最常 使用的平板掃描儀采集灰度文檔圖像為例,亮度變化、噪聲、傾斜等都是常見的降質(zhì)因素, 它們會(huì)導(dǎo)致即使相同文檔的兩次掃描中所得的圖像都會(huì)存在較大差異。從圖像二值化的角 度來(lái)看,用同一二值化方法對(duì)同類型文檔圖像進(jìn)行二值化所得到的結(jié)果中存在的差異性, 其源頭還是在于圖像采集過(guò)程中降質(zhì)因素的差異性。 現(xiàn)有的局部自適應(yīng)的二值化方法在一定程度上改善了上述問(wèn)題,但對(duì)方法參數(shù)的 設(shè)定存在一定的依賴性,二值化效果也不盡如人意。例如,局部閾值法能處理較為復(fù)雜的情 況,但往往忽略了圖像的邊緣特征,容易出現(xiàn)偽影現(xiàn)象。再如,動(dòng)態(tài)閾值法充分考慮了像元 的鄰域特征,能夠根據(jù)圖像的不同背景情況自適應(yīng)地改變閾值,可較精確地提取出二值圖 像,但它過(guò)渡地夸大了像元的鄰域灰度的變化,會(huì)把不均勻灰度分布的背景分割到目標(biāo)中 去,帶來(lái)許多不應(yīng)出現(xiàn)的假目標(biāo)。
發(fā)明內(nèi)容
鑒于上述現(xiàn)有技術(shù)中的缺陷,需要提供一種可改善同類型文檔圖像的二值化效果 以及提高二值化質(zhì)量穩(wěn)定性的文檔圖像二值化技術(shù)。 根據(jù)本發(fā)明的第一方面,提供一種對(duì)文檔圖像進(jìn)行二值化的方法,包括學(xué)習(xí)步驟,用于通過(guò)預(yù)定的第一二值化算法,從類型相同的至少一個(gè)待二值化的文檔圖像中選取 預(yù)定數(shù)量的文檔圖像作為訓(xùn)練樣本進(jìn)行學(xué)習(xí),以獲得所述訓(xùn)練樣本所對(duì)應(yīng)的二值圖像的屬 性,作為所述至少一個(gè)待二值化的文檔圖像所對(duì)應(yīng)的二值圖像的公共參考屬性;和二值化 優(yōu)化處理步驟,用于通過(guò)預(yù)定的第二二值化算法,根據(jù)獲得的所述公共參考屬性對(duì)所述至 少一個(gè)待二值化的文檔圖像中的每一個(gè)進(jìn)行二值化優(yōu)化處理,以使得每一個(gè)所得到的最終 二值圖像的屬性與所述公共參考屬性相一致。 根據(jù)本發(fā)明的第二方面,提供一種對(duì)文檔圖像進(jìn)行二值化的裝置,包括文檔圖像 學(xué)習(xí)單元,其被配置成通過(guò)預(yù)定的第一二值化算法,對(duì)于從類型相同的至少一個(gè)待二值化
的文檔圖像中選取的預(yù)定數(shù)量的訓(xùn)練樣本進(jìn)行學(xué)習(xí),以獲得所述訓(xùn)練樣本所對(duì)應(yīng)的二值圖 像的屬性,作為所述至少一個(gè)待二值化的文檔圖像所對(duì)應(yīng)的二值圖像的公共參考屬性;和 二值化優(yōu)化處理單元,其被配置成通過(guò)預(yù)定的第二二值化算法,根據(jù)所述公共參考屬性對(duì) 所述至少一個(gè)待二值化的文檔圖像中的每一個(gè)進(jìn)行二值化優(yōu)化處理,以使得每一個(gè)所得到 的最終二值圖像的屬性與所述公共參考屬性相一致。 根據(jù)本發(fā)明的第三方面,提供一種文檔圖像處理器,其具有如上述本發(fā)明第二方 面所述的對(duì)文檔圖像進(jìn)行二值化的裝置。 通過(guò)本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的方法和裝置,在對(duì)同類型的文檔進(jìn)行二值 化處理的過(guò)程中,在獲得更加優(yōu)化的二值化效果的同時(shí),對(duì)于二值化質(zhì)量穩(wěn)定性具有較明 顯的提高。
通過(guò)結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施方式
的描述,本發(fā)明的以上的和其它目的、特
點(diǎn)和優(yōu)點(diǎn)將變得清楚。在各附圖中,相同或類似的附圖標(biāo)記表示相同或者類似的功能部件 或步驟。在附圖中 圖1是示出了根據(jù)本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的方法的一個(gè)實(shí)施例的流程 簡(jiǎn)圖; 圖2是示出了圖1中的二值化優(yōu)化處理步驟的一種具體實(shí)現(xiàn)方式的流程簡(jiǎn)圖;
圖3是示出了根據(jù)本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的裝置的一個(gè)實(shí)施例的簡(jiǎn)化 框圖;和 圖4是示出了圖3中的文檔圖像學(xué)習(xí)單元和二值化優(yōu)化處理單元的一種具體實(shí)現(xiàn) 方式的簡(jiǎn)化框圖。
具體實(shí)施例方式
圖1示出了根據(jù)本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的方法的一個(gè)實(shí)施例的流程簡(jiǎn) 圖。如圖1所示,在步驟S100,輸入類型相同的至少一個(gè)待二值化的文檔圖像。在步驟S110, 通過(guò)預(yù)定的第一二值化算法,從所輸入的文檔圖像中選取預(yù)定數(shù)量的文檔圖像作為訓(xùn)練樣 本進(jìn)行學(xué)習(xí),以獲得所述訓(xùn)練樣本所對(duì)應(yīng)的二值圖像的屬性,作為所述至少一個(gè)待二值化 的文檔圖像所對(duì)應(yīng)的二值圖像的公共參考屬性。在步驟S120,通過(guò)預(yù)定的第二二值化算法, 根據(jù)獲得的所述公共參考屬性對(duì)所輸入的至少一個(gè)待二值化的文檔圖像中的每一個(gè)進(jìn)行 二值化優(yōu)化處理,以使得每一個(gè)所得到的二值圖像的屬性與所述公共參考屬性相一致。在步驟S130,輸出所得到的最終二值圖像。 在此需要說(shuō)明,圖1中的輸入待二值化文檔圖像的步驟SIOO以及輸出優(yōu)化的最終二值圖像的步驟S130是現(xiàn)有的二值化方法都具有的通常的處理步驟,而并非實(shí)現(xiàn)本發(fā)明的目的所必要的。最終二值圖像的屬性與所述公共參考屬性一致,既可以指兩者相同,也可以指兩者之間非常接近,例如,兩者之間的差異小于某個(gè)預(yù)定值。下面將會(huì)對(duì)此詳細(xì)描述。
本發(fā)明人經(jīng)研究發(fā)現(xiàn),通過(guò)將某類型文檔圖像進(jìn)二值化后得到的二值圖像的屬性與該類型文檔圖像所對(duì)應(yīng)的二值圖像的公共參考屬性進(jìn)行比較,可以評(píng)估二值化效果。艮P,如果該文檔圖像經(jīng)過(guò)二值化處理后的二值圖像的屬性偏離公共參考屬性較多,則表明二值化效果較差或未達(dá)到較優(yōu)的狀態(tài)。將這種差異狀態(tài)反饋到二值化處理中,對(duì)二值化處理的參數(shù)進(jìn)行調(diào)整,就可能獲得更優(yōu)的二值化處理參數(shù)。利用這種更優(yōu)的參數(shù)進(jìn)行二值化處理,能夠得到更加優(yōu)化合理的二值化結(jié)果。由于在這種反饋機(jī)制中以所得到的公共參考屬性作為基準(zhǔn)屬性,該類型文檔圖像經(jīng)過(guò)二值化處理后的二值圖像的屬性都與該公共參考屬性相一致,即,相同或差異很小,因此降低了該類型文檔圖像在二值圖像模式上的差異性,增強(qiáng)了二值化處理的二值化質(zhì)量穩(wěn)定性。 圖2示出了圖1中的二值化優(yōu)化處理步驟S120的一種具體實(shí)現(xiàn)方式的流程簡(jiǎn)圖,其中就是通過(guò)上述的反饋機(jī)制來(lái)對(duì)待二值化文檔圖像進(jìn)行二值化優(yōu)化處理的。如圖2所示,在步驟S210,輸入待二值化的文檔圖像。在步驟S220,通過(guò)預(yù)定的第二二值化算法對(duì)該待二值化文檔圖像進(jìn)行處理,以獲得與該二值化文檔圖像相應(yīng)的初始二值化參數(shù)。在步驟S230,使用該初始二值化參數(shù)對(duì)該文檔圖像進(jìn)行二值化。在步驟S240,將所得到的二值圖像的屬性與學(xué)習(xí)步驟中所獲得的公共參考屬性進(jìn)行比較以獲得兩者的差異,以便對(duì)該二值圖像進(jìn)行二值化質(zhì)量評(píng)估。在步驟S250,判定所述差異是否大于或等于預(yù)定值,即,是否需要進(jìn)行二值化優(yōu)化。如果該差異大于或等于預(yù)定值(步驟S250的判定結(jié)果為"是"),則判定需要進(jìn)行二值化優(yōu)化,處理流程進(jìn)行到步驟S260,調(diào)整在步驟S220獲得的初始二值化參數(shù)。然后,將所述經(jīng)調(diào)整的二值化參數(shù)取代該初始二值化參數(shù)來(lái)對(duì)該文檔圖像重復(fù)執(zhí)行所述步驟S2310, S240, S250和S260的處理,直至所述差異小于所述預(yù)定值,從而結(jié)束所述二值化優(yōu)化處理步驟并獲得該文檔圖像的最終二值圖像。如果所述差異小于預(yù)定值(步驟S250的判定結(jié)果為"否"),判定對(duì)該待二值化文檔圖像的二值化處理已經(jīng)得到最優(yōu)結(jié)果,不需要再進(jìn)行二值化優(yōu)化,則處理流程進(jìn)行到步驟S270,輸出二值圖像作為與該文檔圖像對(duì)應(yīng)的優(yōu)化的最終二值圖像。容易理解,圖2中步驟S230-S260的處理構(gòu)成反饋機(jī)制。
上述圖2中是以所述至少一個(gè)待二值化的文檔圖像中的一個(gè)文檔圖像為例描述了本發(fā)明的通過(guò)學(xué)習(xí)和反饋機(jī)制對(duì)文檔圖像進(jìn)行二值化的方法。容易理解,對(duì)于待二值化的文檔圖像中的其他每一個(gè)文檔圖像,可進(jìn)行類似的處理,以便獲得每個(gè)待二值化文檔圖像的優(yōu)化的最終二值圖像。 作為一種優(yōu)選方案,在根據(jù)本發(fā)明的上述對(duì)同類型文檔圖像進(jìn)行二值化的方法中,學(xué)習(xí)步驟SllO中使用的預(yù)定的第一二值化算法和二值化優(yōu)化處理步驟S120中使用的預(yù)定的第二二值化算法是相同的二值化算法。但是,由于可通過(guò)學(xué)習(xí)機(jī)制以及反饋機(jī)制獲得二值化質(zhì)量?jī)?yōu)異和穩(wěn)定的二值圖像,因此,所述預(yù)定的第一二值化算法和預(yù)定的第二二值化算法也可以是不同的,例如,只要這些二值化算法進(jìn)行二值化處理的原理相同或者類似,且二值化處理結(jié)果差異不大即可。此外,對(duì)這些二值化算法的選擇也無(wú)需特別限制,其可以是任意一種能對(duì)文檔圖像進(jìn)行二值化處理的方法。 本領(lǐng)域技術(shù)人員理解,在根據(jù)本發(fā)明的上述對(duì)文檔圖像進(jìn)行二值化的方法中,待二值化的同類型文檔圖像的數(shù)量可以是一個(gè)或一個(gè)以上。如果只需要對(duì)一個(gè)文檔圖像進(jìn)行本發(fā)明的二值化優(yōu)化處理,則可在學(xué)習(xí)步驟中利用兩個(gè)或者更多個(gè)該文檔圖像的副本作為訓(xùn)練樣本進(jìn)行學(xué)習(xí)。正如上述,由于現(xiàn)有的二值化方法甚至對(duì)于同一文檔圖像進(jìn)行若干次二值化處理所得到的二值圖像在屬性方面都存在差異,因此,通過(guò)對(duì)同一文檔圖像的多個(gè)副本進(jìn)行學(xué)習(xí),以及根據(jù)學(xué)習(xí)所得到的公共參考屬性,利用反饋機(jī)制對(duì)該文檔圖像進(jìn)行二值化優(yōu)化處理,就可得到優(yōu)化的二值圖像。 訓(xùn)練樣本的數(shù)量可以小于或等于待二值化的文檔圖像的數(shù)量。容易理解,當(dāng)待二值化的同類型文檔圖像較多時(shí),可按照預(yù)定的規(guī)則選擇其中具有代表性的文檔圖像作為訓(xùn)練樣本進(jìn)行學(xué)習(xí)。所述預(yù)定規(guī)則例如可以是論文集每一章的首篇文檔等。當(dāng)然,任意選擇訓(xùn)練樣本亦無(wú)不可。當(dāng)待二值化的同類型文檔圖像很少時(shí),也可把所有待二值化文檔圖像作為訓(xùn)練樣本進(jìn)行學(xué)習(xí)。 文檔圖像的主體元素是文字字符,其也是二值化的主要對(duì)象。字符筆劃寬度是與圖像二值化效果最相關(guān)的屬性。圖像二值化的過(guò)分割與欠分割分別導(dǎo)致字符筆劃過(guò)細(xì)和過(guò)粗,它們分別表明二值化閾值偏低或偏高(以灰度級(jí)0代表前景,灰度級(jí)255代表背景)。好的圖像二值化使筆劃寬度盡可能接近真實(shí)寬度。因此,筆劃寬度可以用來(lái)充當(dāng)二值化質(zhì)量評(píng)估的指標(biāo)。二值圖像的筆劃寬度偏離真實(shí)筆劃寬度越小,則二值化效果越好。通過(guò)筆劃寬度偏差,能夠判斷二值化結(jié)果是否為過(guò)分割或欠分割狀態(tài),以及過(guò)分割或欠分割的程度,這可被稱為分割度,也就是二值化效果評(píng)估。雖然字符筆劃寬度在不同文檔的區(qū)域往往存在變化,但在總體上,對(duì)于同類型文檔,文檔平均筆劃寬度具有較好的穩(wěn)定性。因此對(duì)于同類型的待二值化文檔圖像,可通過(guò)學(xué)習(xí)預(yù)定數(shù)量的樣本來(lái)獲得與這些待二值化文檔圖像相應(yīng)的平均筆劃寬度的期望值,作為所述的公共參考屬性。 于是,通過(guò)利用學(xué)習(xí)機(jī)制來(lái)獲得平均筆劃寬度的期望值的信息,使得二值化質(zhì)量
評(píng)估成為可能。通過(guò)在反饋機(jī)制中根據(jù)該二值化質(zhì)量評(píng)估結(jié)果來(lái)調(diào)節(jié)二值化參數(shù),可將二
值化分割狀態(tài)調(diào)整到一個(gè)更優(yōu)化的狀態(tài),從而能夠?qū)崿F(xiàn)二值化優(yōu)化處理。 下面分別對(duì)圖1中所示的學(xué)習(xí)步驟S110和二值化優(yōu)化處理步驟S120的處理進(jìn)行
詳細(xì)描述。為了簡(jiǎn)潔起見,以下將以文檔圖像對(duì)應(yīng)的二值圖像的字符筆劃寬度作為需要進(jìn)
行學(xué)習(xí)和二值化優(yōu)化處理的二值圖像屬性的例子來(lái)進(jìn)行描述。但是,本領(lǐng)域技術(shù)人員理解,
取決于待二值化的文檔圖像的特性,也可利用不同于字符筆劃寬度的、與圖像二值化效果
相關(guān)的其他屬性作為進(jìn)行學(xué)習(xí)和二值化質(zhì)量評(píng)估的對(duì)象。例如,如果待二值化的圖像中存
在較多的圖元是圖片,則在學(xué)習(xí)過(guò)程中可將與這種圖像對(duì)應(yīng)的二值圖像的連通域等作為需
要學(xué)習(xí)的屬性以得到公共參考屬性,并在二值化優(yōu)化處理過(guò)程中根據(jù)所得到的這種公共參
考屬性來(lái)進(jìn)行二值化優(yōu)化處理。學(xué)習(xí)步驟110的任務(wù)在于通過(guò)對(duì)訓(xùn)練樣本的學(xué)習(xí),獲得二
值化優(yōu)化處理步驟S120所需的知識(shí)。具體地說(shuō),該知識(shí)包括在圖2的步驟S240中進(jìn)行二
值化質(zhì)量評(píng)估需要使用的、文檔平均筆劃寬度的期望值。 通過(guò)掃描二值文檔圖像的筆劃游程并進(jìn)行分析,可獲得該平均筆劃寬度的期望值。其具體步驟如下 首先,計(jì)算一個(gè)訓(xùn)練樣本的文檔平均筆劃寬度。文檔平均筆劃寬度通過(guò)分析二值文檔圖像的筆劃寬度直方圖得到。使用預(yù)定的第二二值化算法對(duì)該訓(xùn)練樣本進(jìn)行二值化,獲得二值圖像。水平方向掃描豎直筆劃對(duì)應(yīng)的游程長(zhǎng)度即為豎直筆劃的寬度。豎直方向掃描水平筆劃對(duì)應(yīng)的游程長(zhǎng)度即為水平筆劃的寬度。二值筆劃寬度直方圖可通過(guò)掃描二值游程長(zhǎng)度來(lái)構(gòu)建。在水平掃描中水平筆劃和豎直掃描中豎直筆劃是筆劃寬度計(jì)算中的噪聲,應(yīng)該剔除掉。這些游程往往表現(xiàn)出較大的長(zhǎng)度。因此,將長(zhǎng)度大于一定數(shù)值的游程從直方圖中拋棄。剩下的游程即可視為筆劃游程,其游程長(zhǎng)度即代表筆劃寬度,游長(zhǎng)均值即為文檔平均筆劃寬度。如,先對(duì)初始的游程長(zhǎng)度直方圖求取初始平均值,長(zhǎng)度大于初始平均值的游程從直方圖中剔除。然后,在剩下的游程中取長(zhǎng)度均值即為文檔平均筆劃寬度。
接著,計(jì)算文檔平均筆劃寬度期望值。對(duì)所有訓(xùn)練樣本重復(fù)上一步的處理,得到各訓(xùn)練文檔的文檔平均筆劃寬度,對(duì)所得到的這些訓(xùn)練樣本的文檔平均筆劃寬度求取平均值,即為該同類型文檔圖像的文檔平均筆劃寬度的期望值,記為^ 。 下面以文檔平均筆劃寬度的期望值作為所述公共參考屬性,結(jié)合圖2對(duì)圖1中所示的二值化優(yōu)化處理步驟S120的處理進(jìn)行詳細(xì)描述。 如上所述,文檔筆劃寬度與文檔圖像二值化質(zhì)量緊密相關(guān)。當(dāng)文檔筆劃寬度低于文檔平均筆劃寬度期望值,則表明筆劃過(guò)細(xì),存在過(guò)分割現(xiàn)象;反之,當(dāng)文檔筆劃寬度高于文檔平均筆劃寬度期望值,則表明筆劃過(guò)粗,存在欠分割現(xiàn)象。文檔筆劃寬度和文檔平均筆劃寬度期望值之間的差異大小則反映了過(guò)分割或欠分割的程度。將文檔平均筆劃寬度期望值與文檔平均筆劃寬度之間的比值定義為分割度Y,即
文檔平均筆劃寬度期望值一 文檔筆劃寬度 分割度Y表明了二值文檔圖像的分割程度,當(dāng)Y〉 1的時(shí)候表明發(fā)生了過(guò)分割,當(dāng)Y < 1的時(shí)候表明發(fā)生了欠分割。Y與1之間的差值則用來(lái)衡量文檔圖像的二值化結(jié)果的效果或質(zhì)量,即為二值化質(zhì)量評(píng)估值d(Y)。因此,利用上述文檔圖像二值化質(zhì)量評(píng)估方法可以獲得文檔二值化的分割度Y和質(zhì)量評(píng)估值d(Y)。這即是圖2中的步驟S240所進(jìn)行的處理。 在步驟S250中,當(dāng)確定質(zhì)量評(píng)估值不滿足要求的時(shí)候需要進(jìn)行二值化質(zhì)量的優(yōu)化。質(zhì)量評(píng)估值不滿足要求是指質(zhì)量評(píng)估值過(guò)大,分割度Y與1的差異過(guò)大,表明二值化質(zhì)量不夠優(yōu)化。 在步驟S260中,將二值化評(píng)估結(jié)果反饋到二值化優(yōu)化處理中,調(diào)節(jié)二值化參數(shù),就可以調(diào)整二值化結(jié)果,促使其向更優(yōu)的方向轉(zhuǎn)化,從而實(shí)現(xiàn)文檔圖像二值化質(zhì)量的優(yōu)化。由于分割度與二值化閾值存在本質(zhì)聯(lián)系。當(dāng)過(guò)分割發(fā)生的時(shí)候,表明閾值偏低;當(dāng)欠分割發(fā)生的時(shí)候,表明閾值偏高。將閾值調(diào)高或調(diào)低可以改變圖像二值化的過(guò)分割或欠分割狀態(tài),促使其向優(yōu)化狀態(tài)轉(zhuǎn)化。本方法使用二值化參數(shù)X來(lái)對(duì)二值化閾值進(jìn)行調(diào)節(jié),該二值化參數(shù)例如可以是二值化閾值調(diào)節(jié)系數(shù),該二值化閾值用來(lái)對(duì)文檔圖像執(zhí)行二值化。用當(dāng)前的二值化閾值與經(jīng)調(diào)整的二值化參數(shù)X相乘得到新的二值化閾值,從而實(shí)現(xiàn)對(duì)二值化閾值的調(diào)整。當(dāng)二值化質(zhì)量評(píng)估結(jié)果表明二值化閾值偏低的時(shí)候提高二值化參數(shù)X的值,當(dāng)二值化質(zhì)量評(píng)估結(jié)果表明二值化閾值偏高的時(shí)候降低二值化參數(shù)X的值。 利用經(jīng)過(guò)調(diào)整的二值化閾值重復(fù)地進(jìn)行步驟S230, S240, S250, S260的處理,直至
11質(zhì)量評(píng)估值表明二值化質(zhì)量足夠優(yōu)化,由此得到經(jīng)優(yōu)化的最終二值圖像。從而通過(guò)反饋機(jī)制實(shí)現(xiàn)了二值化優(yōu)化處理。 令I(lǐng)表示二值圖像,T代表二值化閾值,則Y與X之間的關(guān)系可表示為 Y = f(X,I,T) (1) 則二值化質(zhì)量評(píng)估值可表示為下列的二值化質(zhì)量評(píng)估函數(shù) d(Y) =d(f) = |f(X,I,T)_l| (2) 二值化優(yōu)化處理的目標(biāo)就在于尋找X的值滿足Y — 1或d(Y) — 0,即
i = arg min d(F) = arg min|/(JT, /, 77) —1| (3) 上述公式(3)表示使得d(Y)為最小的X的值,即X的期望值f 。 由于圖像是Y-X函數(shù)關(guān)系中的參數(shù)之一,根據(jù)本發(fā)明的通過(guò)上述反饋機(jī)制進(jìn)行二
值化優(yōu)化處理的過(guò)程可以采用迭代的方式來(lái)實(shí)現(xiàn)。具體地,利用迭代方式來(lái)對(duì)待二值化的
文檔圖像中的每一個(gè)實(shí)現(xiàn)的二值化優(yōu)化處理可包括以下步驟 第一步獲得待二值化文檔圖像的初始二值化參數(shù) 采用預(yù)定的二值化算法(即上述的預(yù)定的第二二值化算法)對(duì)待二值化文檔圖像
進(jìn)行處理以得到初始二值化參數(shù)。 第二步文檔圖像二值化 采用該預(yù)定的二值化算法,根據(jù)所述初始二值化參數(shù)文檔圖像進(jìn)行二值化,獲得二值文檔圖像。
第三步對(duì)第二步中所獲得的二值圖像進(jìn)行二值化質(zhì)量評(píng)估 采用上述基于文檔平均筆劃寬度期望值的二值化質(zhì)量評(píng)估方法獲得二值文檔圖像的分割度Y和二值化質(zhì)量評(píng)估值d(Y)。若d(Y)小于預(yù)定值,則表明二值化質(zhì)量足夠優(yōu)化,不需要進(jìn)行后續(xù)步驟,直接輸出二值圖像作為優(yōu)化的最終二值圖像。否則,表明需要進(jìn)行后續(xù)優(yōu)化處理。 第四步調(diào)整二值化參數(shù)X 根據(jù)二值化質(zhì)量評(píng)估結(jié)果調(diào)整二值化參數(shù)X,即修改閾值調(diào)節(jié)系數(shù),從而得到新的二值化閾值。當(dāng)Y〈 1時(shí)減小X的值以降低二值化閾值,從而減弱欠分割程度。當(dāng)Y〉1時(shí)增大X以提高閾值,從而降低過(guò)分割程度。 通過(guò)經(jīng)調(diào)整的二值化參數(shù)X得到新的二值化閾值,重復(fù)地進(jìn)行上述第二到第四步的處理,重復(fù)修改X值,調(diào)節(jié)二值化結(jié)果,使d(Y)變小,直到找到X值使所得到的二值文檔圖像的二值化質(zhì)量評(píng)估值d(Y)小于所述預(yù)定值,則表明得到該文檔圖像的優(yōu)化二值圖像。于是,通過(guò)迭代的方式完成了 二值化優(yōu)化處理。 根據(jù)一種優(yōu)選實(shí)施方案,在上述的二值化優(yōu)化處理過(guò)程中,可以通過(guò)對(duì)X值的不斷嘗試逼近,獲得最佳值,即二值化參數(shù)X的期望值i ??衫迷趯W(xué)習(xí)步驟中獲得的閾值調(diào)節(jié)參數(shù)X與二值化質(zhì)量評(píng)估結(jié)果之間的關(guān)系,即Y-X關(guān)系,根據(jù)Y值與優(yōu)化目標(biāo)值1. 0之間差值,對(duì)X值的修改量進(jìn)行預(yù)測(cè),以便加快二值化優(yōu)化處理過(guò)程中迭代優(yōu)化的速度。為此,在學(xué)習(xí)步驟中還可以通過(guò)對(duì)訓(xùn)練樣本的學(xué)習(xí),獲得與待二值化的同類型文檔相應(yīng)的閾值調(diào)節(jié)參數(shù)X與二值化質(zhì)量評(píng)估結(jié)果之間的關(guān)系,該關(guān)系表示為Y-X關(guān)系。對(duì)于每個(gè)訓(xùn)練樣本圖像進(jìn)行(X, Y)數(shù)據(jù)點(diǎn)采樣,對(duì)X進(jìn)行采樣,計(jì)算對(duì)應(yīng)的分割度Y值,構(gòu)成(X, Y)數(shù)據(jù)點(diǎn)。然后,用曲線關(guān)系對(duì)Y-X關(guān)系進(jìn)行擬合。具體由以下步驟實(shí)現(xiàn)
第一步文檔(X, Y)數(shù)據(jù)點(diǎn)獲取 對(duì)X值進(jìn)行采樣,可采用與上述預(yù)定的第一二值化算法或者預(yù)定的第二二值化算 法,獲得不同的X值對(duì)應(yīng)的二值文檔圖像。再利用與上述二值化優(yōu)化處理中第三步的二值 化質(zhì)量評(píng)估方法相同的方法計(jì)算不同X值對(duì)應(yīng)的二值化質(zhì)量評(píng)估Y值,構(gòu)建(X,Y)數(shù)據(jù)點(diǎn)。 需要關(guān)注的是Y = 1. 0附近的數(shù)據(jù)點(diǎn),而此時(shí)對(duì)應(yīng)的X —般也在1. 0附近。因此,以X為自 變量,求Y的曲線函數(shù),可在X二 l.O附近進(jìn)行采樣??梢粤钌鲜鰧W(xué)習(xí)步驟中對(duì)訓(xùn)練樣本進(jìn) 行學(xué)習(xí)時(shí)首次獲得的二值圖像所對(duì)應(yīng)的X為l.O,在此基礎(chǔ)上進(jìn)行二值化參數(shù)調(diào)節(jié)。例如, 以0. 1為采樣間隔,在X = 1. 0附近,各取5個(gè)采樣點(diǎn)共11個(gè)采樣點(diǎn),則可計(jì)算出這11個(gè) 采樣點(diǎn)對(duì)應(yīng)的Y值。 第二步閾值調(diào)節(jié)參數(shù)與二值化質(zhì)量評(píng)估結(jié)果關(guān)系學(xué)習(xí) 對(duì)每一個(gè)訓(xùn)練樣本執(zhí)行上述的(X,Y)數(shù)據(jù)點(diǎn)獲取。在獲得每個(gè)訓(xùn)練樣本的(X,Y) 數(shù)據(jù)點(diǎn)后,構(gòu)建一個(gè)大的數(shù)據(jù)點(diǎn)集合?;谠摂?shù)據(jù)點(diǎn)集合,采用曲線擬合方式逼近Y-X關(guān) 系。以下將會(huì)對(duì)此詳細(xì)描述。 根據(jù)一個(gè)優(yōu)選實(shí)施例,在所述學(xué)習(xí)步驟中,根據(jù)所述至少一個(gè)待二值化的文檔圖 像的特性以及這些文檔圖像所對(duì)應(yīng)的期望筆劃寬度、所對(duì)應(yīng)的二值圖像的分割度與進(jìn)行二 值化所根據(jù)的二值化參數(shù)之間的關(guān)系,構(gòu)建二值化關(guān)系數(shù)據(jù)庫(kù)。在執(zhí)行二值化優(yōu)化處理步 驟的過(guò)程中,在所述初始二值化參數(shù)獲取步驟之前,判定待二值化的文檔圖像的特性是否 與所述二值化關(guān)系數(shù)據(jù)庫(kù)中的某特性匹配,響應(yīng)于特性匹配的判定結(jié)果,直接利用所述數(shù) 據(jù)庫(kù)中與所述匹配特性相對(duì)應(yīng)的期望筆劃寬度以及二值圖像的分割度與進(jìn)行二值化所根 據(jù)的二值化參數(shù)之間的關(guān)系來(lái)對(duì)所述待二值化的文檔圖像進(jìn)行二值化,以得到該待二值化 的文檔圖像的最終二值圖像。以此方式,如果待二值化的文檔圖像的類型已經(jīng)存儲(chǔ)在所述 二值化關(guān)系數(shù)據(jù)庫(kù)中,則可以利用已經(jīng)存儲(chǔ)的與該文檔圖像類型對(duì)應(yīng)的、所學(xué)習(xí)到的期望 筆劃寬度以及所對(duì)應(yīng)的二值圖像的分割度與進(jìn)行二值化所根據(jù)的二值化參數(shù)之間的關(guān)系 來(lái)進(jìn)行后續(xù)的二值化優(yōu)化處理,省卻了選取訓(xùn)練樣本進(jìn)行學(xué)習(xí)的時(shí)間和成本,提高了二值 化速度和效率。這里所說(shuō)的特性例如可以是相同或類似的字體字號(hào),相同或類似的排版方 式,相同或類似的內(nèi)容構(gòu)成等。 應(yīng)當(dāng)理解,學(xué)習(xí)步驟對(duì)訓(xùn)練樣本所進(jìn)行的學(xué)習(xí)既可以在實(shí)際執(zhí)行二值化處理時(shí)進(jìn) 行,也可以預(yù)先進(jìn)行。例如,可以在系統(tǒng)空閑時(shí)進(jìn)行所述的學(xué)習(xí),這樣在實(shí)際執(zhí)行二值化優(yōu) 化處理時(shí),就可以直接利用已學(xué)習(xí)到的知識(shí)進(jìn)行基于反饋機(jī)制的二值化優(yōu)化,提高了二值 化效率。 為了更加深刻地理解本發(fā)明,下面通過(guò)一個(gè)具體例子來(lái)對(duì)本發(fā)明的方法進(jìn)行詳細(xì) 描述。 在本例中,以數(shù)字圖書館中的論文集掃描為例,描述本發(fā)明的基于學(xué)習(xí)機(jī)制和反 饋機(jī)制增強(qiáng)文檔圖像二值化質(zhì)量的方法。論文集正文部分的各頁(yè)面文檔視為同類型文檔圖 像,用掃描儀將論文集全部頁(yè)面掃描成文檔圖像。在本例中,二值化算法選用0tsu全局二 值化方法。本發(fā)明的基于學(xué)習(xí)機(jī)制和反饋機(jī)制的二值化優(yōu)化方法包括兩大階段學(xué)習(xí)階段 和二值化優(yōu)化處理階段。
學(xué)習(xí)階段
從論文集的文檔圖像中取部分頁(yè)面文檔作為學(xué)習(xí)階段的訓(xùn)練樣本。本例中取正文 部分的前5頁(yè)的文檔圖像,分別用Pi,i = 1 5來(lái)表示。對(duì)訓(xùn)練樣本進(jìn)行學(xué)習(xí)要實(shí)現(xiàn)以下 兩項(xiàng)任務(wù) 1.學(xué)習(xí)文檔類型平均筆劃寬度期望值 獲取各訓(xùn)練樣本的文檔平均筆劃寬度值,在此基礎(chǔ)上計(jì)算文檔平均筆劃寬度期望 值。文檔平均筆劃寬度通過(guò)掃描二值文檔的筆劃游程并進(jìn)行分析得到。其具體步驟如下
1. 1文檔平均筆劃寬度計(jì)算 調(diào)用預(yù)定的第一二值化算法,在本例中為0tsu方法,對(duì)各訓(xùn)練樣本進(jìn)行二值化獲 得二值文檔圖像Pi, i = 1 5。對(duì)二值文檔圖像進(jìn)行水平和豎直方向的游程長(zhǎng)度掃描,統(tǒng) 計(jì)游程長(zhǎng)度直方圖為Rj,平均游程長(zhǎng)度為M,長(zhǎng)度大于M的游程視為水平掃描中的水平筆劃 或豎直掃描中的豎直筆劃游程,需要剔除掉。剩下的游程長(zhǎng)度的平均值即可視為筆劃游程, 其游程長(zhǎng)度即代表平均筆劃寬度,如公式(4)所示 W=^£/,. (4)
1. 2文檔平均筆劃寬度期望值計(jì)算 對(duì)所有訓(xùn)練樣本重復(fù)上一步,得到各訓(xùn)練樣本的平均筆劃寬度,其平均值即為該 類型文檔的平均筆劃寬度期望值,記為^。如公式(5)所示 ^=^i>^ (5) 2.學(xué)習(xí)二值化參數(shù)與二值化質(zhì)量評(píng)估結(jié)果的關(guān)系 通過(guò)訓(xùn)練樣本的學(xué)習(xí)獲得二值化參數(shù)X,本例中即為二值化閾值調(diào)節(jié)參數(shù),與分割 度Y之間的關(guān)系,用于在二值化優(yōu)化處理過(guò)程中調(diào)節(jié)二值化參數(shù)。對(duì)于每個(gè)訓(xùn)練樣本進(jìn)行 (X, Y)數(shù)據(jù)對(duì)采樣,對(duì)X進(jìn)行采樣,利用二值化質(zhì)量評(píng)估方法計(jì)算對(duì)應(yīng)的分割度Y值,構(gòu)成 (X,Y)數(shù)據(jù)點(diǎn)。然后,用線性關(guān)系對(duì)Y-X關(guān)系進(jìn)行擬合。具體由以下步驟實(shí)現(xiàn)
2. 1文檔(X, Y)數(shù)據(jù)點(diǎn)獲取 對(duì)X值進(jìn)行采樣,獲得不同的X值對(duì)應(yīng)的二值文檔圖像。再利用上述的二值化質(zhì) 量評(píng)估方法計(jì)算不同X值對(duì)應(yīng)的分割度Y值,構(gòu)建(X, Y)數(shù)據(jù)點(diǎn)??稍谏鲜霾襟E1. 1中首 次獲得的初始二值化文檔圖像基礎(chǔ)上進(jìn)行參數(shù)調(diào)節(jié),初始二值化對(duì)應(yīng)的X值為1. 0, 二值化 閾值參數(shù)為T。假設(shè)以O(shè). 1為采樣間隔,在X二 1.0兩側(cè),各取5個(gè)采樣點(diǎn),則11個(gè)采樣點(diǎn), 分別表示為Xi G {0. 5,0. 6,0. 7,0. 8,0. 9, 1. 0, 1. 1, 1. 2, 1. 3, 1. 4, 1. 5} , i = 1. 11。各X丄
值對(duì)應(yīng)的新二值化閾值為 1\ = T*Xi (6) 利用Ti值生成新的二值文檔圖像,并利用二值化質(zhì)量評(píng)估方法計(jì)算對(duì)應(yīng)的分割度
1值,則可構(gòu)建該文檔數(shù)據(jù)點(diǎn)集。 Rk= KXi,Yi) |i = l,... ,11} (7) 2. 2 二值化閾值調(diào)節(jié)參數(shù)與二值化評(píng)估關(guān)系擬合 對(duì)每個(gè)訓(xùn)練樣本文檔圖像獲取其(X, Y)數(shù)據(jù)點(diǎn),組合起來(lái)構(gòu)建一個(gè)大的數(shù)據(jù)點(diǎn)集 合R。<formula>formula see original document page 15</formula> 觀察Y = 1. 0附近區(qū)域的Y-X數(shù)據(jù)分布,即在該類型文檔的平均筆劃寬度期望值 附近區(qū)域,Y-X關(guān)系近似于線性關(guān)系。在本例中,用線性關(guān)系來(lái)近似表示文檔類型的Y-X關(guān) 系。通過(guò)采用最小二乘線性擬合方法在該數(shù)據(jù)點(diǎn)集合上獲得如下公式(9)所示的線性關(guān) 系。<formula>formula see original document page 15</formula>
當(dāng)然,本領(lǐng)域技術(shù)人員理解,Y-X關(guān)系也可能是非線性的。只要獲得關(guān)于Y-X的足 夠的數(shù)據(jù)點(diǎn),總是可利用曲線擬合方法或者其他任何合適的方法得到兩者的關(guān)系表達(dá)式。
二艦優(yōu)層適, 在本發(fā)明的二值化優(yōu)化處理中,利用學(xué)習(xí)階段獲得的知識(shí),基于二值化質(zhì)量評(píng)估 與反饋機(jī)制執(zhí)行文檔圖像的二值化優(yōu)化,實(shí)現(xiàn)二值化優(yōu)化處理過(guò)程。這種基于反饋機(jī)制的 二值化優(yōu)化處理例如可采用迭代的方式實(shí)現(xiàn),在迭代中不斷調(diào)整二值化閾值參數(shù),直到二 值化質(zhì)量評(píng)估結(jié)果達(dá)到最優(yōu)。該階段具體實(shí)施步驟如下
1.獲得初始二值化參數(shù) 采用預(yù)定的第二二值化算法,在本例中為Otsu方法,對(duì)文檔圖像進(jìn)行處理,獲得 初始二值圖像對(duì)應(yīng)的初始二值化閾值參數(shù)T。
2. 二值文檔圖像二值化質(zhì)量評(píng)估 采用上述的二值化質(zhì)量評(píng)估方法獲得初始二值文檔圖像的分割度Y和二值化質(zhì) 量評(píng)估值d(Y)。若d(Y)小于預(yù)定值e ,則表明二值化質(zhì)量足夠優(yōu)化,不需要進(jìn)行后續(xù)步 驟,直接輸出二值文檔圖像結(jié)果。在本例中e被設(shè)為0.05。若二值化質(zhì)量評(píng)估滿足要求, 則直接輸出二值文檔圖像,否則進(jìn)行后續(xù)二值化優(yōu)化處理。本領(lǐng)域技術(shù)人員理解,二值化質(zhì) 量評(píng)估中使用的預(yù)定值e可以根據(jù)實(shí)際需要確定。
3.初始迭代參數(shù)設(shè)置 迭代優(yōu)化中涉及閾值調(diào)節(jié)參數(shù)X,分割度Y和X改變量S三個(gè)參數(shù),令各次迭代 的參數(shù)為(Xk,Yk, S k)。初始二值化參數(shù)X的值為1. O,對(duì)應(yīng)的迭代參數(shù)設(shè)為(X。 = 1. 0, Y。, S。 = O),利用學(xué)習(xí)階段獲得的Y-X關(guān)系對(duì)X的優(yōu)化修改幅度進(jìn)行預(yù)測(cè)有助于減少迭代次 根據(jù)上述公式(9),采用線性預(yù)測(cè)方法,目標(biāo)為使Y1 = l.O,聯(lián)立方程 <formula>formula see original document page 15</formula>
于是得到如下的初始迭代參數(shù)<formula>formula see original document page 15</formula>
其中W工為&對(duì)應(yīng)的二值文檔圖像的平均筆劃寬度。
于是,初始迭代參數(shù)被設(shè)置為(&, S》。 在此需要說(shuō)明,如果只利用學(xué)習(xí)階段中得到的平均筆劃寬度期望值步來(lái)執(zhí)行基于反饋機(jī)制的二值化優(yōu)化處理,而不使用學(xué)習(xí)機(jī)制中得到的Y-X關(guān)系優(yōu)化初始迭代參數(shù),也 可以實(shí)現(xiàn)對(duì)文檔圖像二值化的優(yōu)化處理。利用公式(10)設(shè)置初始迭代參數(shù)只是一種優(yōu)選 的方案,可使得迭代優(yōu)化過(guò)程快速高效地實(shí)現(xiàn)。
4.通過(guò)迭代優(yōu)化文檔圖像二值化質(zhì)量 二值化質(zhì)量?jī)?yōu)化的目標(biāo)就在于尋找二值化參數(shù),即閾值調(diào)節(jié)系數(shù)X值使得滿足分 割度Y — 1或二值化質(zhì)量評(píng)估值d(Y) — 0。 根據(jù)二值化質(zhì)量評(píng)估結(jié)果修改閾值調(diào)節(jié)系數(shù)X,即調(diào)整二值化閾值T,根據(jù)該調(diào)整 二值化閾值T生成新的二值文檔圖像,使二值化質(zhì)量向優(yōu)化方向轉(zhuǎn)化。當(dāng)Y〈 1的時(shí)候,減 小X值可降低二值化閾值,減弱欠分割程度。當(dāng)Y〉 1的時(shí)候,增大X值則可提高二值化閾 值,從而降低過(guò)分割程度。采用迭代的方式調(diào)整X值,直到達(dá)到優(yōu)化目標(biāo)。令第K次迭代中 X的改變量為Sk,則在第K+l次迭代中,X被修改為 , 新的二值化閾值調(diào)整為
Tk+1 = Xk+1*Tk 使用新的二值化閾值所得到的新的二值文檔圖像為Iw,在新的二值文檔圖像上 進(jìn)行二值化質(zhì)量評(píng)估獲得新的分割度^+1和質(zhì)量評(píng)估值4+1。當(dāng)4< e表明迭代達(dá)到收 斂,完成二值化優(yōu)化處理過(guò)程,輸出最終二值文檔圖像。如上所述,這時(shí)表明最終二值圖像 的平均筆劃寬度與平均筆劃寬度期望值# ,即所述公共參考屬性達(dá)到一致。
Sk代表X的調(diào)整幅度,大的Sk值有助于快速收斂,但不利于提高收斂精度。在 一種優(yōu)選實(shí)施方案中,為了防止陷入局部最優(yōu)以至震蕩發(fā)生,可使Sk在迭代中逐漸減小, 按以下方式在迭代中進(jìn)行調(diào)整
化+1=&/2; z/lv《l/H卜o.5^v《》0 n"
i義義 , "AT 其中^4=4-4-l,當(dāng)V^^0時(shí),表明可能陷入局部最優(yōu),需要減少sk。當(dāng) |V《|/|Vd| < 0.5時(shí),表明收斂速度較快,故應(yīng)該減小步長(zhǎng),提高精度。 本領(lǐng)域技術(shù)人員理解,除了本例中的二值化閾值調(diào)節(jié)系數(shù)X以外,本發(fā)明的方法 還可以對(duì)與文檔圖像二值化有關(guān)的其他二值化參數(shù)進(jìn)行基于學(xué)習(xí)機(jī)制和反饋機(jī)制的調(diào)節(jié)。 例如,直接對(duì)二值化閾值本身進(jìn)行調(diào)節(jié)亦無(wú)不可。 從上述描述可看出,與傳統(tǒng)的二值化方法單階段處理方相比,本發(fā)明的該方法特
點(diǎn)在于分學(xué)習(xí)和二值化優(yōu)化處理兩個(gè)階段進(jìn)行,學(xué)習(xí)階段獲取同類型文檔圖像屬性知識(shí),
例如同類型文檔圖像的二值圖像平均筆劃寬度期望值,二值圖像質(zhì)量評(píng)估結(jié)果與二值化參
數(shù)的關(guān)系等等。二值化優(yōu)化處理階段利用所獲得的屬性知識(shí)指導(dǎo)二值化優(yōu)化處理過(guò)程?;?br>
于學(xué)習(xí)階段獲得的屬性知識(shí),有效的二值化效果或質(zhì)量評(píng)估成為可能。在二值化優(yōu)化處理
階段將二值化質(zhì)量評(píng)估結(jié)果反饋到二值化方法中,調(diào)整二值化參數(shù),從而實(shí)現(xiàn)了優(yōu)化的二
值化質(zhì)量。本發(fā)明的這種方法例如可應(yīng)用于數(shù)字圖書館、辦公自動(dòng)化等。 本領(lǐng)域技術(shù)人員理解,在上述實(shí)施例中,同類型的待二值化文檔圖像中也可能存
在例如圖片等非字符圖元,在對(duì)訓(xùn)練樣本學(xué)習(xí)的階段可不對(duì)這些圖元進(jìn)行學(xué)習(xí)。在對(duì)文檔圖像進(jìn)行二值化優(yōu)化處理過(guò)程中,可以按照所使用的預(yù)定的第二二值化算法中通常的處理 模式對(duì)這些非字符圖元進(jìn)行二值化處理。容易理解,如果某類型的多個(gè)待處理文檔圖像中 大部分相同或者類似的特性不是字符而是例如圖片、表格等,則可將與圖片、表格等相關(guān)的 屬性作為學(xué)習(xí)階段的學(xué)習(xí)對(duì)象,獲得相關(guān)公共參考屬性。因此,同樣可以利用本發(fā)明上述的 方法對(duì)該類型的文檔圖像進(jìn)行二值化優(yōu)化處理。 本發(fā)明還提出了一種可實(shí)現(xiàn)上述本發(fā)明的基于學(xué)習(xí)機(jī)制和反饋機(jī)制的二值化方 法的裝置。圖3是示出了根據(jù)本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的裝置300的實(shí)施例的簡(jiǎn) 化框圖。如圖3所示,本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的裝置300包括文檔圖像學(xué)習(xí)單元 320和二值化優(yōu)化處理單元310。文檔圖像學(xué)習(xí)單元320通過(guò)預(yù)定的第一二值化算法對(duì)所 輸入的類型相同的至少一個(gè)待二值化的文檔圖像中選取的預(yù)定數(shù)量的訓(xùn)練樣本進(jìn)行學(xué)習(xí), 以獲得這些訓(xùn)練樣本所對(duì)應(yīng)的二值圖像的屬性,作為輸入的所述至少一個(gè)待二值化的文檔 圖像所對(duì)應(yīng)的二值圖像的公共參考屬性。二值化優(yōu)化處理單元310通過(guò)預(yù)定的第二二值化 算法,根據(jù)所述公共參考屬性對(duì)所述至少一個(gè)待二值化的文檔圖像中的每一個(gè)進(jìn)行二值化 處理,以使得每一個(gè)所得到的最終二值圖像的屬性與所述公共參考屬性相一致。
圖4是示出了圖3中的二值化優(yōu)化處理單元的一種具體實(shí)現(xiàn)方式的簡(jiǎn)化框圖。如 圖4所示,在該例中,本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的裝置400包括文檔圖像學(xué)習(xí)單元 420和二值化優(yōu)化處理單元410。其中二值化優(yōu)化處理單元410用點(diǎn)劃線框出,其包括初始 二值化參數(shù)獲取子單元412、二值化子單元414、二值化質(zhì)量評(píng)估子單元416和二值化參數(shù) 調(diào)整子單元418。對(duì)于所輸入的至少一個(gè)待二值化的文檔圖像中的每一個(gè),初始二值化參數(shù) 獲取子單元412通過(guò)預(yù)定的第二二值化算法對(duì)該文檔圖像進(jìn)行處理以獲得與之相應(yīng)的初 始二值化參數(shù)。二值化子單元414通過(guò)該預(yù)定的第二二值化算法,根據(jù)該初始二值化參數(shù) 對(duì)該文檔圖像進(jìn)行二值化。二值化質(zhì)量評(píng)估子單元416將來(lái)自二值化子單元414的二值圖 像的屬性與所述公共參考屬性進(jìn)行比較以獲得兩者的差異,以便對(duì)該二值圖像進(jìn)行二值化 質(zhì)量評(píng)估。二值化參數(shù)調(diào)整子單元418響應(yīng)于所述差異大于或等于預(yù)定值,調(diào)整所述相應(yīng) 的二值化參數(shù)。其中,二值化子單元414、二值化質(zhì)量評(píng)估子單元416和二值化參數(shù)調(diào)整子 單元418以所述經(jīng)調(diào)整的二值化參數(shù)取代所述初始二值化參數(shù)對(duì)該文檔圖像重復(fù)進(jìn)行相 應(yīng)的處理,直至所述差異小于所述預(yù)定值,從而結(jié)束所述二值化優(yōu)化處理并輸出該文檔圖 像的最終二值圖像。 根據(jù)本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的裝置的一個(gè)實(shí)施例,文檔圖像學(xué)習(xí)單元 420可通過(guò)如上本發(fā)明的二值化優(yōu)化處理方法中學(xué)習(xí)步驟的處理方式來(lái)對(duì)訓(xùn)練樣本進(jìn)行學(xué) 習(xí),以獲得有關(guān)同類型文檔圖像的二值圖像的公共參考屬性、二值圖像質(zhì)量評(píng)估結(jié)果與二 值化參數(shù)的關(guān)系等等知識(shí)。具體處理方式不再贅述。 根據(jù)本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的裝置的另一個(gè)實(shí)施例,二值化優(yōu)化處理單 元410中包括的初始二值化參數(shù)獲取子單元412、二值化子單元414、二值化質(zhì)量評(píng)估子單 元416和二值化參數(shù)調(diào)整子單元418可通過(guò)如上本發(fā)明的二值化優(yōu)化處理方法中二值化優(yōu) 化處理步驟的處理方式來(lái)對(duì)待二值化的同類型文檔圖像進(jìn)行二值化優(yōu)化處理。具體處理方 式不再贅述。 此外,需要說(shuō)明,在圖4中,文檔圖像學(xué)習(xí)單元420通過(guò)對(duì)訓(xùn)練樣本進(jìn)行學(xué)習(xí)所獲 得的有關(guān)同類型文檔圖像的二值圖像的公共參考屬性的知識(shí)被提供給二值化質(zhì)量評(píng)估子單元416,以供二值化優(yōu)化處理單元410在通過(guò)反饋機(jī)制執(zhí)行二值化優(yōu)化處理時(shí)使用。而 文檔圖像學(xué)習(xí)單元420獲得的有關(guān)二值圖像質(zhì)量評(píng)估結(jié)果與二值化參數(shù)的關(guān)系知識(shí)被提 供給二值化參數(shù)調(diào)整子單元418,以供二值化優(yōu)化處理單元410在以迭代方式實(shí)現(xiàn)二值化 參數(shù)調(diào)整時(shí)使用。正如上述,即使不提供有關(guān)二值圖像質(zhì)量評(píng)估結(jié)果與二值化參數(shù)的關(guān)系 知識(shí),二值化優(yōu)化處理單元410也可完成對(duì)待二值化的文檔圖像的二值化優(yōu)化處理,而這 種知識(shí)的提供可使得在迭代操作的收斂速度較快,精度較高,因此是一種優(yōu)選的方案,在圖 4中用虛線箭頭線示出。 本領(lǐng)域技術(shù)人員理解,上述本發(fā)明的對(duì)文檔圖像進(jìn)行二值化的方法和裝置可以通 過(guò)僅軟件、僅硬件和/或軟件與硬件相結(jié)合的方式來(lái)實(shí)現(xiàn)。因此,其實(shí)現(xiàn)方式不對(duì)本發(fā)明的 技術(shù)范圍構(gòu)成限制。 此外,本發(fā)明的方法不限于按照說(shuō)明書中描述的時(shí)間順序來(lái)執(zhí)行,也可以按照其 他的時(shí)間順序地、并行地或獨(dú)立地執(zhí)行。因此,本說(shuō)明書中描述的方法的執(zhí)行順序不對(duì)本發(fā) 明的技術(shù)范圍構(gòu)成限制。 本發(fā)明還提出一種文檔處理器,其可配置如上述本發(fā)明的對(duì)文檔圖像進(jìn)行二值化
的裝置。這種文檔處理器例如包括但不限于掃描儀、具有掃描功能的多功能機(jī)等。 本發(fā)明的對(duì)同類型文檔圖像進(jìn)行二值化的方法和裝置中的學(xué)習(xí)功能和二值化優(yōu)
化處理功能可以都在本地實(shí)現(xiàn),或者,當(dāng)采用分布式配置例如主機(jī)客戶機(jī)模式時(shí),也可以在
主機(jī)執(zhí)端行文檔圖像學(xué)習(xí)處理,將學(xué)習(xí)所獲得知識(shí)提供給客戶機(jī)以供其在對(duì)同類型文檔圖
像進(jìn)行二值化優(yōu)化處時(shí)使用。 本發(fā)明還提出一種機(jī)器可讀程序,當(dāng)該程序安裝到機(jī)器,例如文檔圖像二值化裝
置中并運(yùn)行時(shí),可執(zhí)行上述本發(fā)明的對(duì)同類型文檔圖像進(jìn)行二值化的方法。 用于承載上述機(jī)器可讀程序的存儲(chǔ)介質(zhì)也包括在本發(fā)明的公開中。所述存儲(chǔ)介質(zhì)
包括但不限于軟盤、光盤、磁光盤、存儲(chǔ)卡、存儲(chǔ)棒,等等。 盡管上面已經(jīng)通過(guò)對(duì)本發(fā)明的具體實(shí)施例的描述對(duì)本發(fā)明進(jìn)行了披露,但是,應(yīng) 該理解,本領(lǐng)域的技術(shù)人員可在所附權(quán)利要求的精神和范圍內(nèi)設(shè)計(jì)對(duì)本發(fā)明的各種修改、
改進(jìn)或者等同物。這些修改、改進(jìn)或者等同物也應(yīng)當(dāng)被認(rèn)為包括在本發(fā)明的保護(hù)范圍內(nèi)。
權(quán)利要求
一種對(duì)文檔圖像進(jìn)行二值化的方法,包括學(xué)習(xí)步驟,用于通過(guò)預(yù)定的第一二值化算法,從類型相同的至少一個(gè)待二值化的文檔圖像中選取預(yù)定數(shù)量的文檔圖像作為訓(xùn)練樣本進(jìn)行學(xué)習(xí),以獲得所述訓(xùn)練樣本所對(duì)應(yīng)的二值圖像的屬性,作為所述至少一個(gè)待二值化的文檔圖像所對(duì)應(yīng)的二值圖像的公共參考屬性;和二值化優(yōu)化處理步驟,用于通過(guò)預(yù)定的第二二值化算法,根據(jù)獲得的所述公共參考屬性對(duì)所述至少一個(gè)待二值化的文檔圖像中的每一個(gè)進(jìn)行二值化優(yōu)化處理,以使得每一個(gè)所得到的最終二值圖像的屬性與所述公共參考屬性相一致。
2. 如權(quán)利要求1所述的對(duì)文檔圖像進(jìn)行二值化的方法,其中,對(duì)于所述至少一個(gè)待二 值化的文檔圖像中的每一個(gè),所述二值化優(yōu)化處理步驟包括以下子步驟初始二值化參數(shù)獲取子步驟,用于通過(guò)所述預(yù)定的第二二值化算法對(duì)該文檔圖像進(jìn)行 處理,以獲得與該文檔圖像相應(yīng)的初始二值化參數(shù);二值化子步驟,用于通過(guò)所述預(yù)定的第二二值化算法,根據(jù)所述初始二值化參數(shù)對(duì)該 文檔圖像進(jìn)行二值化;二值化質(zhì)量評(píng)估子步驟,用于將所得到的二值圖像的屬性與所述公共參考屬性進(jìn)行比 較以獲得兩者的差異,從而得到該二值圖像的二值化質(zhì)量評(píng)估結(jié)果;二值化參數(shù)調(diào)整子步驟,用于響應(yīng)于所述差異大于或等于預(yù)定值,調(diào)整所述相應(yīng)的二 值化參數(shù);其中以所述經(jīng)調(diào)整的二值化參數(shù)代替所述初始二值化參數(shù)對(duì)該文檔圖像重復(fù)執(zhí)行所述的 二值化子步驟、二值化質(zhì)量評(píng)估子步驟和二值化參數(shù)子調(diào)整步驟,直至所述差異小于所述 預(yù)定值,從而結(jié)束所述二值化優(yōu)化處理步驟并獲得該文檔圖像的最終二值圖像。
3. 如權(quán)利要求2所述的對(duì)文檔圖像進(jìn)行二值化的方法,其中,所述屬性是所述至少一 個(gè)待二值化的文檔圖像對(duì)應(yīng)的二值圖像的文檔平均筆劃寬度,所述學(xué)習(xí)步驟包括計(jì)算所述訓(xùn)練樣本中每一個(gè)所對(duì)應(yīng)的二值圖像的文檔平均筆劃寬度;以及 對(duì)所獲得的與所有訓(xùn)練樣本相關(guān)的文檔平均筆劃寬度求取平均值,以得到作為所述公 共參考屬性的期望筆劃寬度。
4. 如權(quán)利要求3所述的對(duì)文檔圖像進(jìn)行二值化的方法,其中 對(duì)于所述訓(xùn)練樣本中每一個(gè),所述的計(jì)算文檔平均筆劃寬度的步驟包括 在該訓(xùn)練樣本所對(duì)應(yīng)的二值圖像中,將水平方向掃描豎直筆劃對(duì)應(yīng)的游程長(zhǎng)度作為豎直筆劃的寬度,將豎直方向掃描水平筆劃對(duì)應(yīng)的游程長(zhǎng)度作為水平筆劃的寬度;對(duì)初始的游程長(zhǎng)度直方圖求取初始平均值,長(zhǎng)度大于所述初始平均值的游程從直方圖 中去除;和對(duì)剩下的游程求取游程長(zhǎng)度平均值,作為該訓(xùn)練樣本所對(duì)應(yīng)的二值圖像的文檔平均筆 劃寬度;其中,所述二值化優(yōu)化處理步驟通過(guò)與計(jì)算所述訓(xùn)練樣本中每一個(gè)所對(duì)應(yīng)的二值圖像 的文檔平均筆劃寬度的步驟相同的方式,計(jì)算所述至少一個(gè)待二值化的文檔圖像中的每一 個(gè)所對(duì)應(yīng)的二值圖像的文檔平均筆劃寬度。
5. 如權(quán)利要求4所述的對(duì)文檔圖像進(jìn)行二值化的方法,其中,對(duì)于所述至少一個(gè)待二 值化的文檔圖像中的每一個(gè)所述的二值化質(zhì)量評(píng)估子步驟包括獲得該文檔圖像的、根據(jù)二值化參數(shù)X得到的對(duì)應(yīng)的二值圖像的文檔平均筆劃寬度與 所述期望筆劃寬度的比值作為該二值圖像的分割度Y,獲得該分割度與"1"之差的絕對(duì)值 作為該二值圖像的二值化質(zhì)量評(píng)估值d,所述的二值化參數(shù)調(diào)整子步驟包括響應(yīng)于所述二值化質(zhì)量評(píng)估值d大于或等于所述預(yù)定值,調(diào)整與該文檔圖像相應(yīng)的所述二值化參數(shù),當(dāng)所述分割度Y < 1時(shí)減小所述二值化參數(shù)X,當(dāng)所述分割度Y > 1時(shí)增大所述二值化參數(shù)X;其中,根據(jù)所述經(jīng)調(diào)整的二值化參數(shù)x、以迭代的方式對(duì)該文檔圖像重復(fù)執(zhí)行所述的二值化子步驟、二值化質(zhì)量評(píng)估子步驟和二值化參數(shù)調(diào)整子步驟,直至所述二值化質(zhì)量評(píng)估 值d小于所述預(yù)定值,從而獲得該文檔圖像的最終二值圖像。
6.如權(quán)利要求5所述的對(duì)文檔圖像進(jìn)行二值化的方法,其中,所述二值化質(zhì)量評(píng)估子步驟和所述二值化參數(shù)調(diào)整子步驟按照以下公式進(jìn)行所述迭代其中,XK和Xw分別是第K次迭代和第K+l次迭代中的二值化參數(shù),TK+1和TK分別是 第K次迭代和第K+l次迭代中所述二值化子步驟進(jìn)行二值化所使用的二值化閾值,YK是第 K次迭代中二值圖像的分割度,S k是第K次迭代中二值化參數(shù)X的改變量,Vdk是第K次 迭代與第K-l次迭代中二值化質(zhì)量評(píng)估值d之差,K是大于或等于1的整數(shù)。
7. 如權(quán)利要求6所述的對(duì)文檔圖像進(jìn)行二值化的方法,其中所述學(xué)習(xí)步驟還包括通過(guò)與所述二值化質(zhì)量評(píng)估子步驟中相同的方式獲得所述訓(xùn)練 樣本所對(duì)應(yīng)的二值圖像的二值化質(zhì)量評(píng)估結(jié)果,從而得到所述二值化質(zhì)量評(píng)估結(jié)果與進(jìn)行 二值化所根據(jù)的二值化參數(shù)之間的關(guān)系;以及所述二值化質(zhì)量評(píng)估子步驟和所述二值化參數(shù)調(diào)整子步驟還根據(jù)所述獲得的關(guān)系進(jìn) 行二值化優(yōu)化處理。
8. 如權(quán)利要求7所述的對(duì)文檔圖像進(jìn)行二值化的方法,其中,所述的得到所述二值化 質(zhì)量評(píng)估結(jié)果與進(jìn)行二值化所根據(jù)的二值化參數(shù)之間的關(guān)系包括對(duì)于所述訓(xùn)練樣本中的每一個(gè),獲得包括多個(gè)二值化參數(shù)以及與所述多個(gè)二值化參數(shù) 對(duì)應(yīng)的多個(gè)二值圖像的分割度的數(shù)據(jù);獲得包括與所有訓(xùn)練樣本相關(guān)的所述數(shù)據(jù)的數(shù)據(jù)集合,對(duì)所獲得的數(shù)據(jù)集合進(jìn)行曲線 擬合以獲得下列的關(guān)系,作為所述至少一個(gè)待二值化的文檔圖像所對(duì)應(yīng)的二值圖像的分割 度與進(jìn)行二值化所根據(jù)的二值化參數(shù)之間的關(guān)系;Y = y X+b其中,Y是比例系數(shù),b是比例常數(shù);以及=義* — 如果^ < 1如果IV《1 /|Vd| <: 0.5或V《2 0其他情形通過(guò)所述關(guān)系設(shè)置所述迭代操作的初始迭代參數(shù)如下 & =Z0 + (1-70)〃<formula>formula see original document page 4</formula>其中,X。二 1.0, S。二0,Y。是與X。對(duì)應(yīng)的二值圉像的分割度,^是所述期望筆劃寬度, Wl是與XI對(duì)應(yīng)的文檔平均筆劃寬度。
9. 如權(quán)利要求1-8中任一項(xiàng)所述的對(duì)文檔圖像進(jìn)行二值化的方法,其中 所述預(yù)定的第一二值化算法和所述預(yù)定的第二二值化算法相同,以及,所述相同類型的至少一個(gè)待二值化的文檔圖像具有相同或者類似的特性。
10. —種對(duì)文檔圖像進(jìn)行二值化的裝置,包括文檔圖像學(xué)習(xí)單元,其被配置成通過(guò)預(yù)定的第一二值化算法,對(duì)于從類型相同的至少 一個(gè)待二值化的文檔圖像中選取的預(yù)定數(shù)量的訓(xùn)練樣本進(jìn)行學(xué)習(xí),以獲得所述訓(xùn)練樣本所對(duì)應(yīng)的二值圖像的屬性,作為所述至少一個(gè)待二值化的文檔圖像所對(duì)應(yīng)的二值圖像的公共 參考屬性;禾口二值化優(yōu)化處理單元,其被配置成通過(guò)預(yù)定的第二二值化算法,根據(jù)所述公共參考屬 性對(duì)所述至少一個(gè)待二值化的文檔圖像中的每一個(gè)進(jìn)行二值化優(yōu)化處理,以使得每一個(gè)所 得到的最終二值圖像的屬性與所述公共參考屬性相一致。
11. 如權(quán)利要求io所述的對(duì)文檔圖像進(jìn)行二值化的裝置,其中,所述二值化優(yōu)化處理單元包括初始二值化參數(shù)獲取子單元、二值化子單元、二值化質(zhì)量評(píng)估子單元和二值化參 數(shù)調(diào)整子單元,以及,對(duì)于所述至少一個(gè)待二值化的文檔圖像中的每一個(gè)所述初始二值化參數(shù)獲取子單元被配置成通過(guò)所述預(yù)定的第二二值化算法對(duì)該文檔 圖像進(jìn)行處理,以獲得與該文檔圖像相應(yīng)的初始二值化參數(shù);所述二值化子單元被配置成通過(guò)所述預(yù)定的第二二值化算法,根據(jù)所述初始二值化參 數(shù)對(duì)該文檔圖像進(jìn)行二值化;所述二值化質(zhì)量評(píng)估子單元被配置成將來(lái)自所述二值化子單元的二值圖像的屬性與 所述公共參考屬性進(jìn)行比較以獲得兩者的差異,以便對(duì)該二值圖像進(jìn)行二值化質(zhì)量評(píng)估; 禾口所述二值化參數(shù)調(diào)整子單元被配置成響應(yīng)于所述差異大于或等于預(yù)定值,調(diào)整所述相 應(yīng)的二值化參數(shù);其中,所述二值化子單元、二值化質(zhì)量評(píng)估子單元和二值化參數(shù)調(diào)整子單元被配置成 以所述經(jīng)調(diào)整的二值化參數(shù)代替所述初始二值化參數(shù)來(lái)對(duì)該文檔圖像重復(fù)進(jìn)行處理,直至 所述差異小于所述預(yù)定值,從而結(jié)束所述二值化優(yōu)化處理并獲得該文檔圖像的最終二值圖 像。
12. 如權(quán)利要求11所述的對(duì)文檔圖像進(jìn)行二值化的裝置,其中,所述屬性是所述至少 一個(gè)待二值化的文檔圖像對(duì)應(yīng)的二值圖像的文檔平均筆劃寬度,以及,所述文檔圖像學(xué)習(xí) 單元被配置成計(jì)算所述訓(xùn)練樣本中每一個(gè)所對(duì)應(yīng)的二值圖像的文檔平均筆劃寬度,以及, 對(duì)所獲得的與所有訓(xùn)練樣本相關(guān)的文檔平均筆劃寬度求取平均值,以獲得作為所述公共參 考屬性的期望筆劃寬度。
13. 如權(quán)利要求12所述的對(duì)文檔圖像進(jìn)行二值化的裝置,其中對(duì)于所述訓(xùn)練樣本中的每一個(gè),所述文檔圖像學(xué)習(xí)單元被配置成在該訓(xùn)練樣本所對(duì)應(yīng)的二值圖像中,將水平方向掃描豎直筆劃對(duì)應(yīng)的游程長(zhǎng)度作為豎 直筆劃的寬度,將豎直方向掃描水平筆劃對(duì)應(yīng)的游程長(zhǎng)度作為水平筆劃的寬度;對(duì)初始的游程長(zhǎng)度直方圖求取初始平均值,長(zhǎng)度大于所述初始平均值的游程從直方圖 中去除;和對(duì)剩下的游程求取游程長(zhǎng)度平均值,作為該訓(xùn)練樣本所對(duì)應(yīng)的二值圖像的文檔平均筆 劃寬度;其中,所述二值化優(yōu)化處理單元被配置成通過(guò)與所述文檔圖像學(xué)習(xí)單元相同的方式計(jì) 算所述至少一個(gè)待二值化的文檔圖像中的每一個(gè)所對(duì)應(yīng)的二值圖像的文檔平均筆劃寬度。
14. 如權(quán)利要求13所述的對(duì)文檔圖像進(jìn)行二值化的裝置,其中,對(duì)于所述至少一個(gè)待 二值化的文檔圖像中的每一個(gè)所述二值化質(zhì)量評(píng)估子單元被配置成獲得該文檔圖像的、根據(jù)所述二值化參數(shù)X得到 的對(duì)應(yīng)的二值圖像的文檔平均筆劃寬度與所述期望筆劃寬度的比值,作為該二值圖像的分 割度Y,獲得該分割度與"1"之差的絕對(duì)值作為該二值圖像的二值化質(zhì)量評(píng)估值d,所述二值化參數(shù)調(diào)整子單元被配置成響應(yīng)于所述二值化質(zhì)量評(píng)估值d大于或等于所 述預(yù)定值,調(diào)整與該文檔圖像相應(yīng)的所述二值化參數(shù),當(dāng)所述分割度Y < 1時(shí)減小二值化參 數(shù)X,當(dāng)所述分割度Y > 1時(shí)增大二值化參數(shù);其中,所述二值化子單元、二值化質(zhì)量評(píng)估子單元和所述二值化參數(shù)調(diào)整子單元被配 置成根據(jù)所述經(jīng)調(diào)整的二值化參數(shù)X、以迭代的方式對(duì)該文檔圖像進(jìn)行所述二值化優(yōu)化處 理,直至所述二值化質(zhì)量評(píng)估值d小于所述預(yù)定值,從而獲得該文檔圖像的最終二值圖像。
15. 如權(quán)利要求14所述的對(duì)文檔圖像進(jìn)行二值化的裝置,其中,所述二值化質(zhì)量評(píng)估 子單元和所述二值化參數(shù)調(diào)整子單元被配置成按照以下公式進(jìn)行所述迭代 <formula>formula see original document page 5</formula>如果|V《I /|V《—,I < 0.5或V《2 0其他情形TK+i — TK * XK+i其中,XK和XK+1分別是第K次迭代和第K+l次迭代中的二值化調(diào)節(jié)系數(shù)參數(shù),所述二值 化參數(shù)TK+1 = TK * XK+1, TK+1和TK分別是第K次迭代和第K+l次迭代中所述二值化子單元 進(jìn)行二值化所使用的二值化參數(shù)閾值,YK是第K次迭代中二值圖像的分割度,S k是本第K 次迭代中二值化參數(shù)調(diào)節(jié)系數(shù)X的改變量,Vdk是第K次迭代與第K-l次迭代中二值化質(zhì) 量評(píng)估值d之差,K是大于或等于1的整數(shù)。
16. 如權(quán)利要求15所述的對(duì)文檔圖像進(jìn)行二值化的裝置,其中所述文檔圖像學(xué)習(xí)單元還被配置成通過(guò)與所述二值化質(zhì)量評(píng)估子單元相同的方式對(duì) 所述訓(xùn)練樣本進(jìn)行學(xué)習(xí)以獲得所述訓(xùn)練樣本所對(duì)應(yīng)的二值圖像的二值化質(zhì)量評(píng)估結(jié)果,從 而得到所述二值化質(zhì)量評(píng)估結(jié)果與進(jìn)行二值化所根據(jù)的二值化參數(shù)之間的關(guān)系;以及所述二值化質(zhì)量評(píng)估子單元和所述二值化參數(shù)調(diào)整子單元被配置成還根據(jù)所述獲得的關(guān)系進(jìn)行二值化優(yōu)化處理。
17. 如權(quán)利要求16所述的對(duì)文檔圖像進(jìn)行二值化的裝置,其中,所述文檔圖像學(xué)習(xí)單 元被配置成按以下方式得到所述二值化質(zhì)量評(píng)估結(jié)果與進(jìn)行二值化所根據(jù)的二值化參數(shù)之間的關(guān)系對(duì)于所述訓(xùn)練樣本中的每一個(gè),獲得包括多個(gè)二值化參數(shù)以及與所述多個(gè)二值化參數(shù) 對(duì)應(yīng)的多個(gè)二值圖像的分割度的數(shù)據(jù);獲得包括與所有訓(xùn)練樣本相關(guān)的所述數(shù)據(jù)的數(shù)據(jù)集合,對(duì)所獲得的數(shù)據(jù)集合進(jìn)行曲線 擬合以獲得下列的關(guān)系,作為所述至少一個(gè)待二值化的文檔圖像所對(duì)應(yīng)的二值圖像的分割 度與進(jìn)行二值化所根據(jù)的二值化參數(shù)之間的關(guān)系;Y = y X+b其中,Y是比例系數(shù),b是比例常數(shù);以及所述二值化參數(shù)調(diào)整子單元通過(guò)所述關(guān)系來(lái) 設(shè)置所述迭代操作的初始迭代參數(shù)如下<formula>formula see original document page 6</formula>其中,&= 1.0, S。二0,Y。是與X。對(duì)應(yīng)的二值圉像的分割度,氽是所述期望筆劃寬度, W工是與&對(duì)應(yīng)的文檔平均筆劃寬度。
18. 如權(quán)利要求10-17中任一項(xiàng)所述的對(duì)文檔圖像進(jìn)行二值化的裝置,其中 所述第一二值化算法和所述第二二值化算法相同,以及,所述相同類型的至少一個(gè)待二值化的文檔圖像具有相同或者類似的特性。
19. 一種文檔圖像處理器,其具有如權(quán)利要求10-18中任一項(xiàng)所述的對(duì)文檔圖像進(jìn)行 二值化的裝置。
全文摘要
一種對(duì)文檔圖像進(jìn)行二值化的方法,包括學(xué)習(xí)步驟,通過(guò)預(yù)定的第一二值化算法從類型相同的至少一個(gè)待二值化的文檔圖像中選取預(yù)定數(shù)量的文檔圖像作為訓(xùn)練樣本進(jìn)行學(xué)習(xí),以獲得訓(xùn)練樣本所對(duì)應(yīng)的二值圖像的屬性,作為所述至少一個(gè)待二值化的文檔圖像所對(duì)應(yīng)的二值圖像的公共參考屬性;和二值化優(yōu)化處理步驟,通過(guò)預(yù)定的第二二值化算法,根據(jù)公共參考屬性對(duì)至少一個(gè)待二值化的文檔圖像中的每一個(gè)進(jìn)行二值化優(yōu)化處理,以使得每一個(gè)所得到的最終二值圖像的屬性與所述公共參考屬性相一致。還提供一種可執(zhí)行上述方法的對(duì)文檔圖像二值化裝置,及配備有該裝置的文檔圖像處理器。本發(fā)明的方法和裝置可獲得更加優(yōu)化的二值化效果并提高二值化質(zhì)量穩(wěn)定性。
文檔編號(hào)G06K9/38GK101727582SQ20081017118
公開日2010年6月9日 申請(qǐng)日期2008年10月22日 優(yōu)先權(quán)日2008年10月22日
發(fā)明者朱遠(yuǎn)平 申請(qǐng)人:富士通株式會(huì)社