專利名稱:圖像二值化方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理領(lǐng)域,具體來說涉及一種對文檔圖像進行二值化的圖像二值化方法和裝置。
背景技術(shù):
文檔是當(dāng)前社會的主要信息載體。文檔圖像一般由文本、表格、線條以及圖片構(gòu)成,并且由于文檔圖像的信息本質(zhì)上是二值信息,因此理想條件下,可以將其用單一的前景和背景來表示,比如用白色表示背景,黑色表示有用信息,即前景。然而,實際應(yīng)用中,由于打印過程、不均勻的反光、文檔本身內(nèi)容的多樣化以及各種豐富的藝術(shù)效果,圖像通常前景和背景都是變化的。文檔圖像二值化的目的就是從無用信息中將有用信息分離出來,并將結(jié)果表示為一幅二值圖像。
圖像二值化在諸如文檔圖像處理、文檔管理以及文檔的分析和識別等很多應(yīng)用中是必要的步驟,并且在現(xiàn)有技術(shù)中已經(jīng)提出了各種圖像二值化方法。例如,美國專利5,452,107提出了一種根據(jù)原始圖像局部區(qū)域的密度,包括目標(biāo)像素和周圍像素的平均值,來確定二值化閾值的方法。該方法的缺陷是局部只能提供有限的信息。
另外,美國專利6,587,576提出了一種圖像分割方法,根據(jù)圖像的二維直方圖對輸入文檔圖像的灰度進行量化。該方法假定圖像的背景灰度在直方圖中可聚類為一個類別。然而,該假定并不對所有的文檔圖像都成立。
美國專利6,738,496提出了一種結(jié)合局部背景的分割和拉普拉斯邊緣增強的二值化方法。只有當(dāng)當(dāng)前像素超過兩個閾值的時候才將該像素設(shè)為“on”。這種方法在大字符、低對比度和反色字的情況下將會失效。
美國專利6,842,541利用顏色信息來輔助二值化過程。不同顏色通道內(nèi)的多個分割結(jié)果最終被結(jié)合為一個全局的更好的二值化結(jié)果。
另外,請參閱以下文獻,以獲得相關(guān)圖像二值化技術(shù)的信息N.Otsu,“A threshold selection method from grey-level histograms,”IEEETrans.Syst.,Man,Cybern.,vol.SMC-1,pp.62-66,Jan.1979;和J.Sauvola,M.Pietkinen,“Adaptive document image binarization”,PatternRecognition,Vol.33,pp.225-236,2000。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對圖像,特別是文檔圖像的二值化進行改進。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種對文檔圖像進行二值化的圖像二值化方法,其包括以下步驟a)針對所述文檔圖像的灰度圖像數(shù)據(jù),計算所述文檔圖像的圖像復(fù)雜度,并且根據(jù)算出的圖像復(fù)雜度,將所述文檔圖像分為簡單類別或復(fù)雜類別;以及b)當(dāng)所述文檔圖像為簡單類別時,通過全局分割方法二值化所述灰度圖像數(shù)據(jù),而當(dāng)所述文檔圖像為復(fù)雜類別時,通過復(fù)合分割方法二值化所述灰度圖像數(shù)據(jù),從而生成二值化圖像數(shù)據(jù)。
根據(jù)本發(fā)明的另一方面,提供了一種用于對文檔圖像進行二值化的圖像二值化裝置,包括圖像分類單元,用于針對所述文檔圖像的灰度圖像數(shù)據(jù),計算所述文檔圖像的圖像復(fù)雜度,并且根據(jù)算出的圖像復(fù)雜度,將所述文檔圖像分為簡單類別或復(fù)雜類別;全局分割單元,用于當(dāng)所述文檔圖像為簡單類別時,通過全局分割方法二值化所述灰度圖像數(shù)據(jù),從而生成二值化圖像數(shù)據(jù);以及復(fù)合分割單元,用于當(dāng)所述文檔圖像為復(fù)雜類別時,通過復(fù)合分割方法二值化所述灰度圖像數(shù)據(jù),從而生成所述二值化圖像數(shù)據(jù)。
在本發(fā)明中,首先利用圖像的復(fù)雜度度量將輸入圖像分為簡單和復(fù)雜兩種類別。對于簡單圖像,使用全局化的方法進行分割;對于復(fù)雜圖像,則結(jié)合全局以及局部信息、使用復(fù)合分割方法為每個像素確定各自的分割閾值,從而達到更好的圖像二值化結(jié)果。
通過結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行詳細描述,本發(fā)明的上述和其它目的、特性、優(yōu)點將會變得更加清楚,其中圖1示出了根據(jù)本發(fā)明的圖像二值化方法的流程圖;圖2示出了圖1中的預(yù)處理步驟的示例性流程圖;圖3示出了圖1中的復(fù)合分割步驟的示例性流程圖;
圖4示出了一個文檔圖像直方圖以及對應(yīng)的全局分割閾值A(chǔ)、A’、B、C和C’;圖5描述了在圖1的復(fù)合分割步驟中使用的局部自適應(yīng)分割方法的示例性流程圖;圖6示出了圖1中的后處理單元的示例性流程圖;圖7給出了一個文檔圖像的例子以及分別使用全局分割方法和局部自適應(yīng)分割方法的二值化結(jié)果;圖8描述了整個圖像二值化系統(tǒng)的結(jié)構(gòu);以及圖9示意性地示出了根據(jù)本發(fā)明的圖像二值化裝置的方框圖。
具體實施例方式
在本文中,全局分割方法是指利用相同的閾值分割整幅圖像,而局部自適應(yīng)分割方法是指對圖像中的每個像素確定單獨的分割閾值。如果整個圖像中的文字以及其他有用信息的灰度都是一致的,則可以使用全局分割方法對整個圖像進行分割。然而,由于許多圖像中存在不同區(qū)域之間的不一致性,單一的分割閾值難以取得好的分割結(jié)果。在這種情況下需要使用局部自適應(yīng)分割方法對不同的像素確定不同的分割閾值。
下面參考附圖來詳細描述根據(jù)本發(fā)明的圖像二值化方法和圖像二值化裝置。
參考圖1,本發(fā)明提出的圖像二值化方法的流程圖以原始文檔10為輸入,并且以最終的二值圖像16為輸出。首先,在可選的預(yù)處理步驟11中,完成二值化處理所需的數(shù)據(jù)準(zhǔn)備工作,例如在需要的情況下對文檔10進行數(shù)字化,如果文檔圖像為彩色圖像,還需將其轉(zhuǎn)換為灰度圖像,以及對灰度圖像數(shù)據(jù)進行低通濾波、背景的去除。然后,在圖像分類步驟12中,針對灰度圖像數(shù)據(jù),計算文檔圖像的圖像復(fù)雜度例如Otsu判據(jù)(OC)和Fisher判據(jù)(d’)等,并且根據(jù)算出的圖像復(fù)雜度,將文檔圖像分為“簡單”和“復(fù)雜”兩種類別,其中“簡單”意味著圖像基本是由黑色的文字和白色背景構(gòu)成,否則圖像被認為是復(fù)雜的。每一類圖像使用不同的二值化方法來處理。對于簡單圖像,在全局分割步驟13中采用全局分割方法(例如,Otsu方法,Kittler方法,基于熵的分割方法,以及任何其它基于直方圖的分割方法)進行二值化;另一方面,對于復(fù)雜圖像,則在復(fù)合分割步驟14中使用一種更精細的方法即組合全局分割方法和局部自適應(yīng)方法的復(fù)合分割方法進行處理。最后,在可選的后處理步驟15中,對在步驟13或14中輸出的二值圖像進行噪聲的去除。通常來說有三種噪聲相鄰字符(筆畫)的相連、字符(筆畫)的斷裂以及單獨的噪聲點。通過后處理可以去除大量的此類噪聲。經(jīng)過這些處理,文檔10中的基本信息被保存在二值圖像16中。此二值圖像可以用于多種應(yīng)用,例如字符的顏色檢測、文檔版面分析,光學(xué)字符識別等。具體每個步驟處理的細節(jié)將在下文中進行詳細的介紹。
參考圖2,預(yù)處理步驟11完成對文檔圖像的一系列圖像處理操作。由于原始文檔10可以是一個電子文檔或者是一個物理的紙質(zhì)文檔。對于后一種情況需要使用光學(xué)掃描設(shè)備,例如掃描儀、傳真機,或者是數(shù)碼相機將物理文檔轉(zhuǎn)換為電子文檔圖像(步驟111)。根據(jù)具體使用的掃描設(shè)備不同,數(shù)字化后的圖像可能是彩色的也可能是灰度的。對于彩色圖像,需要在步驟112中將其轉(zhuǎn)換為灰度圖像以便后續(xù)處理。該灰度信息可能是自原始彩色圖像的亮度,也可以是某個指定的顏色通道。此外,根據(jù)具體的應(yīng)用環(huán)境不同,有時需要在步驟113中使用低通濾波來去除圖像中的噪聲,以便提高輸入圖像的質(zhì)量,然后在步驟114中將輸入圖像分為固定大小的方塊,根據(jù)每個方塊內(nèi)圖像灰度的變化判斷其是否為背景。例如,如果方塊內(nèi)像素的最大和最小灰度值之差小于一個很小的閾值,這意味著該塊內(nèi)的像素灰度非常均勻,則將該塊認為是背景并從輸入圖像中去除。剩下的區(qū)域構(gòu)成的子圖像成為二值化操作的目標(biāo)區(qū)域。此方法保證了對分割閾值的更準(zhǔn)確估計。這一步中,也可以根據(jù)方塊內(nèi)的方差作為背景的判據(jù)。顯然地,在預(yù)處理步驟11中,步驟111、112、113均為可選的。
在圖像分類步驟12中,針對文檔圖像的灰度圖像數(shù)據(jù),計算文檔圖像的圖像復(fù)雜度,其中優(yōu)選地采用以下兩種圖像復(fù)雜度度量一個是Otsu判據(jù)(OC),另一個是Fisher判據(jù)(d’)。下面詳細描述計算這兩種度量的具體過程。
首先,根據(jù)圖像的灰度分布確定分割閾值T,其中閾值T優(yōu)選地由Otsu算法計算得到。但是原則上,它可以用任何全局分割算法獲得。
然后,根據(jù)閾值T按下面公式(1)和(2)計算Otsu判據(jù)和Fisher判據(jù)OC=argmaxTP(T)[1-P(T)][mb(T)-mf(T)]P(T)σb2(T)+[1-P(T)]σf2(T)---(1)]]>
d′=mb(T)-mf(T)σ2b(T)+σ2f(T)---(2)]]>其中將圖像中灰度小于或等于T的像素子集標(biāo)記為SetA,將灰度高于T的像素子集標(biāo)記為SetB,P(T)為給定一個像素屬于SetA的概率,mf(T)為SetA中像素的灰度均值,mb(T)為SetB中像素的灰度均值,σf(T)為SetA中像素的標(biāo)準(zhǔn)差,σb(T)為SetB中像素的標(biāo)準(zhǔn)差。
接下來,如果OC大于預(yù)設(shè)閾值TOC或者d’大于預(yù)設(shè)閾值Td’,則圖像被認為是簡單的,否則被認為是復(fù)雜的。
如果輸入圖像被認為是簡單圖像,在全局分割步驟13中采用全局分割方法對文檔圖像的灰度圖像數(shù)據(jù)進行二值化,從而得到一個較快的分割速度。這里,步驟13中使用的優(yōu)選地是步驟12中給出的Otsu分割閾值T,但是根據(jù)具體應(yīng)用可以換為任何其他的全局分割方法。
如果輸入圖像被認為是復(fù)雜圖像,則在復(fù)合分割步驟14中采用組合全局分割方法和局部自適應(yīng)分割方法的復(fù)合分割方法進行分割,具體地說,首先,采用全局分割方法,將像素分為三種類別黑色(0)、白色(255)和未確定。通常圖像中的大部分像素將被劃入黑色和白色兩種類別,剩下的未確定的像素將用局部自適應(yīng)分割方法進行分割。由于通常局部自適應(yīng)分割方法的計算量遠大于全局分割方法,因此這種復(fù)合分割策略在保證分割質(zhì)量的同時將大大提高二值化的速度。下面將結(jié)合圖3的流程圖詳細描述復(fù)合分割步驟14的處理的一個優(yōu)選實施例。
首先,在步驟140中,從文檔圖像的灰度圖像數(shù)據(jù)當(dāng)中選擇一個位于圖像最大和最小灰度之間的閾值B,然后在最小灰度和B之間選擇一個小于B的閾值A(chǔ),同時在B和最大灰度之間選擇一個大于B的閾值C。根據(jù)本發(fā)明的一個可能實現(xiàn)是重復(fù)使用基于直方圖的方法如Otsu方法選擇A,B,C,其中A≤B≤C。
由于文檔圖像處理系統(tǒng)常常需要處理掃描的打印文檔,此類文檔通常會有半調(diào)效果。我們注意到半調(diào)效果在直方圖上通常表現(xiàn)出一種類似高斯的分布。受此啟發(fā),在步驟141中調(diào)整閾值A(chǔ)和C,確保其落在直方圖中相鄰的波谷中。圖4給出了最后的全局分割閾值的示例,其中調(diào)整后的閾值A(chǔ)和C用A’和C’表示。顯然地,在復(fù)合分割步驟14中,步驟141是優(yōu)選的,而不是必需的。
在步驟142中,所有灰度小于A’的像素均被標(biāo)記為黑色(0),同樣灰度大于C’的像素均被標(biāo)記為白色(255)。
需要指出的是,這里我們并不區(qū)分前景和背景(前景指圖像中承載信息的部分,例如字符、表格等,背景指用戶并不關(guān)心其內(nèi)容的部分)。這提供了我們的方法處理反色字符或表格區(qū)域的能力。
所有灰度位于閾值A(chǔ)’和C’之間的像素被認為是未確定像素。由于難以通過分析圖像的直方圖來確定此類像素的類別屬性,因此這里使用了一種局部自適應(yīng)分割方法。在局部自適應(yīng)分割步驟143中,通過提取局部信息并結(jié)合相鄰像素的歷史分割閾值信息確定該像素的最優(yōu)分割閾值。在本發(fā)明中,歷史分割閾值信息是非常重要的,使用該信息可使二值化的效果得到大幅的提升。
通常說來,根據(jù)前景和背景的灰度分布可將文字區(qū)域分割正常文字和反色字。在理想情況下,對于正常文字,分割閾值應(yīng)該大于文字筆畫的最高灰度,同時小于背景像素的最小灰度;同樣地,對于反色字的最優(yōu)分割閾值應(yīng)該小于文字筆畫的最低灰度同時高于背景的最大灰度。然而在低對比度同時有噪聲出現(xiàn)的情況下上面的規(guī)則一般不成立。因此,在自適應(yīng)分割過程中,以當(dāng)前像素為中心確定一個局部窗口,局部窗口被分為三種情況正常文字、反色字和低對比度區(qū)域,對三種情況采用不同的方法計算閾值作為當(dāng)前像素的分割閾值。在圖5中給出了局部自適應(yīng)分割處理的流程。首先,在步驟1430中,使用與步驟140相同的方法作用于當(dāng)前窗口獲得三個閾值A(chǔ)1,B1和C1,并且在步驟1431中,計算局部窗口內(nèi)的均值m和標(biāo)準(zhǔn)差std。然后,在步驟1432中,根據(jù)算出的均值m、標(biāo)準(zhǔn)差std和所獲得的A1,B1和C1,將該窗口分為上述的三種類別,具體地說,若均值m小于B1,則是反色字;若標(biāo)準(zhǔn)差std小于一個閾值,且當(dāng)前局部窗口內(nèi)小于A1和大于C1的像素數(shù)目大于另一個閾值,則屬于低對比度;其他情況,屬于正常文字。最后,在步驟1433中,使用下面的公式計算像素(x,y)的分割閾值T(x,y)T(x,y)=m*[1-(k1*std+k2*T(x-1,y))/R](3)這里的k1、k2和R根據(jù)類別的不同而選用不同的參數(shù)。
閾值化過程從全局分割步驟142的結(jié)果開始,依次確定每個像素的分割閾值。當(dāng)前處理的像素成為目標(biāo)像素。如果目標(biāo)像素已經(jīng)是二值的,即已經(jīng)被前面的步驟給出了標(biāo)記0或255,則繼續(xù)處理下面的像素。否則利用公式(3)計算目標(biāo)像素的閾值。此外,如果當(dāng)前像素為該行的第一個像素且并非二值的,由于這里并沒有歷史閾值信息,此時令k2=0。
在公式(3)中,目標(biāo)像素的閾值由局部灰度信息以及上一個像素的閾值共同確定,并且其中的參數(shù)可以針對具體的應(yīng)用進行優(yōu)化。例如,如果二值圖像用于OCR應(yīng)用場合,則參數(shù)需要選擇來使OCR的字符識別率達到最高。閾值選定后,如果目標(biāo)像素的灰度值高于閾值,則標(biāo)記為255,否則標(biāo)記為0。
然后,下一個像素被選為目標(biāo)像素并重復(fù)上述的過程,直至所有像素均被二值化。
圖6給出了可選的后處理步驟15的示例性流程,其中的處理包含若干個循環(huán)。是否要繼續(xù)循環(huán)取決于當(dāng)前循環(huán)的結(jié)果。該后處理方法可以有效地消除噪聲。后處理單元從全局分割步驟13或復(fù)合分割步驟14得到的二值化圖像開始。在每次循環(huán)中,統(tǒng)計在以當(dāng)前像素為中心的局部窗口內(nèi)與該像素標(biāo)記(0或255)相同的像素個數(shù)N(步驟151,152),這里局部窗口大小可以由圖像的分辨率決定。如果N小于一個設(shè)定的閾值TN,則改變當(dāng)前像素類別(0變?yōu)?55或255變?yōu)?)(步驟153,154),其中閾值TN也可以由圖像的分辨率決定,另外,閾值TN可以隨每次循環(huán)而變化。如果在當(dāng)前循環(huán)中改變類別的像素數(shù)目足夠小,即小于一個設(shè)定的閾值TC,這意味著圖像中已經(jīng)沒有明顯的噪聲點,這時循環(huán)停止?;蛘撸绻h(huán)的次數(shù)超過了指定的數(shù)值,同樣要將該循環(huán)停止以阻止過度的平滑(步驟155)。作為一種可能變形,后處理步驟15中的循環(huán)次數(shù)也可以是固定的,而與在當(dāng)前循環(huán)中改變類別的像素數(shù)目無關(guān)。
圖7給出了通過復(fù)合分割方法進行二值化的一個例子,其中A是原始圖像,B是經(jīng)過步驟142后的結(jié)果,其中灰色像素代表未確定類別的像素,而C是后處理后的最終輸出的二值化圖像。
圖8示出了整個二值化系統(tǒng)的結(jié)構(gòu)。單元1是根據(jù)本發(fā)明的圖像二值化模塊;單元2是編輯模塊,其用于在不同的應(yīng)用情況下編輯二值化的處理流程和參數(shù);處理器用于完成二值化的計算工作;內(nèi)存用于存儲圖像數(shù)據(jù)和處理的中間數(shù)據(jù)。
下面參考附圖描述根據(jù)本發(fā)明的圖像二值化裝置。
圖9示意性地示出了根據(jù)本發(fā)明的圖像二值化裝置的方框圖。如圖9所示,根據(jù)本發(fā)明的圖像二值化裝置可以包括預(yù)處理單元91(可選)、圖像分類單元92、全局分割單元93、復(fù)合分割單元94、以及后處理單元95(可選)。預(yù)處理單元91用于完成二值化處理所需的數(shù)據(jù)準(zhǔn)備工作,例如在需要的情況下對文檔90進行數(shù)字化,如果文檔圖像為彩色圖像,則需將其轉(zhuǎn)換為灰度圖像,以及對灰度圖像數(shù)據(jù)進行低通濾波、背景的去除。圖像分類單元92用于針對灰度圖像數(shù)據(jù),計算文檔圖像的圖像復(fù)雜度例如Otsu判據(jù)(OC)和Fisher判據(jù)(d’)等,并且根據(jù)算出的圖像復(fù)雜度,將文檔圖像分為“簡單”和“復(fù)雜”兩種類別。全局分割單元93用于當(dāng)文檔圖像為簡單類別時,通過全局分割方法二值化文檔圖像的灰度圖像數(shù)據(jù)。復(fù)合分割單元94用于當(dāng)文檔圖像為復(fù)雜類別時,通過復(fù)合分割方法二值化文檔圖像的灰度圖像數(shù)據(jù)。后處理單元95用于對由全局分割單元93或復(fù)合分割單元94輸出的二值圖像進行噪聲的去除,以生成最終的二值圖像96。
本領(lǐng)域的技術(shù)人員知道,本發(fā)明的圖像二值化裝置和方法可以通過僅軟件、僅硬件和/或軟件與硬件相結(jié)合的方式來實現(xiàn),因此,其實現(xiàn)方式不對本發(fā)明的技術(shù)范圍構(gòu)成限制。
另外,本發(fā)明的方法不限于按照說明書中所描述的時間順序來執(zhí)行,也可以按照其它的時間循序,或并行或獨立地執(zhí)行,因此,本發(fā)明中描述的方法的執(zhí)行順序不對本發(fā)明的技術(shù)范圍構(gòu)成限制。
盡管以上參照具體實施例對本發(fā)明進行了詳細的描述,但是本領(lǐng)域的技術(shù)人員知道,在不脫離本發(fā)明的精神和范圍的情況下,可以對本發(fā)明的實施例做出各種修改、替換和變更。
權(quán)利要求
1.一種對文檔圖像進行二值化的圖像二值化方法,包括以下步驟a)針對所述文檔圖像的灰度圖像數(shù)據(jù),計算所述文檔圖像的圖像復(fù)雜度,并且根據(jù)算出的圖像復(fù)雜度,將所述文檔圖像分為簡單類別或復(fù)雜類別;b)當(dāng)所述文檔圖像為簡單類別時,通過全局分割方法二值化所述灰度圖像數(shù)據(jù),而當(dāng)所述文檔圖像為復(fù)雜類別時,通過復(fù)合分割方法二值化所述灰度圖像數(shù)據(jù),從而生成二值化圖像數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的圖像二值化方法,其中在步驟a)之前還包括以下步驟對物理文檔進行數(shù)字化,以獲得所述文檔圖像。
3.根據(jù)權(quán)利要求1所述的圖像二值化方法,其中在步驟a)之前還包括以下步驟如果所述文檔圖像為彩色圖像,則將其轉(zhuǎn)換為灰度圖像,以獲得所述灰度圖像數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的圖像二值化方法,其中在步驟a)之前還包括以下步驟對所述灰度圖像數(shù)據(jù)進行低通濾波,以去除其中的圖像噪聲。
5.根據(jù)權(quán)利要求1所述的圖像二值化方法,其中在步驟a)之前還包括以下步驟通過將所述灰度圖像數(shù)據(jù)分為固定大小的方塊,并且根據(jù)每個方塊內(nèi)的圖像灰度變化判斷其是否為背景,然后對所述灰度圖像數(shù)據(jù)進行圖像背景去除。
6.根據(jù)權(quán)利要求1所述的圖像二值化方法,其中步驟a)包括以下步驟根據(jù)所述灰度圖像數(shù)據(jù)的灰度分布,確定分割閾值T;根據(jù)所述分割閾值T,計算Otsu判據(jù)和Fisher判據(jù);如果算出的Otsu判據(jù)值大于預(yù)設(shè)閾值TO,或者算出的Fisher判據(jù)值大于預(yù)設(shè)閾值TD,則所述文檔圖像被認為屬于簡單類別,否則認為屬于復(fù)雜類別。
7.根據(jù)權(quán)利要求6所述的圖像二值化方法,其中所述分割閾值T由基于直方圖的全局分割方法得到。
8.根據(jù)權(quán)利要求1所述的圖像二值化方法,其中所述全局分割方法為基于直方圖的全局分割方法。
9.根據(jù)權(quán)利要求1所述的圖像二值化方法,其中通過復(fù)合分割方法二值化所述灰度圖像數(shù)據(jù)包括以下步驟通過全局分割方法,將所述灰度圖像數(shù)據(jù)中的每個像素分為3類黑色、白色和未確定;通過局部自適應(yīng)分割方法,為每個屬于未確定類別的像素計算最優(yōu)分割閾值,從而二值化所述像素。
10.根據(jù)權(quán)利要求9所述的圖像二值化方法,其中通過全局分割方法將所述灰度圖像數(shù)據(jù)中的每個像素分為3類包括以下步驟通過基于直方圖的方法,在所述灰度圖像數(shù)據(jù)中的最小灰度值和最大灰度值之間確定分割閾值B;通過基于直方圖的方法,在所述最小灰度值和所述分割閾值B之間確定分割閾值A(chǔ);通過基于直方圖的方法,在所述分割閾值B和所述最大灰度值之間確定分割閾值C;以及將灰度小于等于所述分割閾值A(chǔ)的像素標(biāo)記為黑色,將灰度大于所述分割閾值C的像素標(biāo)記為白色,將灰度位于所述分割閾值A(chǔ)和所述分割閾值C之間的像素標(biāo)記為未確定;
11.根據(jù)權(quán)利要求10所述的圖像二值化方法,其中在所述灰度圖像數(shù)據(jù)的直方圖中,分別在所述分割閾值A(chǔ)和所述分割閾值C的附近尋找波谷,并且將所述分割閾值A(chǔ)和所述分割閾值C分別調(diào)整為所述波谷對應(yīng)的灰度值。
12.根據(jù)權(quán)利要求9所述的圖像二值化方法,其中通過局部自適應(yīng)分割方法為每個屬于未確定類別的像素計算最優(yōu)分割閾值包括以下步驟根據(jù)所述像素的局部特征,將所述像素所屬的局部區(qū)域進一步分為正常文字、反色字和低對比度區(qū)域三類;根據(jù)所述局部區(qū)域的分類結(jié)果、以及所述像素所在行的前一像素的已確定的閾值,計算所述像素的分割閾值。
13.根據(jù)權(quán)利要求9所述的圖像二值化方法,其中通過局部自適應(yīng)方法為每個屬于未確定類別的像素計算最優(yōu)分割閾值還基于具體應(yīng)用而不同。
14.根據(jù)權(quán)利要求1所述的圖像二值化方法,其中在步驟b)之后還包括以下步驟c)對所述二值化圖像數(shù)據(jù)進行后處理,以去除其中的噪聲。
15.根據(jù)權(quán)利要求14所述的圖像二值化方法,其中對所述二值化圖像數(shù)據(jù)進行后處理包括以下步驟d1)針對所述二值化圖像數(shù)據(jù)中的每個像素,統(tǒng)計所述像素的局部窗口內(nèi)具有相同標(biāo)記的像素數(shù)目N,如果該數(shù)目N小于設(shè)定閾值TN,則將所述像素的標(biāo)記取反,否則不變;d2)重復(fù)執(zhí)行步驟d1),直至循環(huán)次數(shù)達到指定的數(shù)值或者在當(dāng)前循環(huán)中其標(biāo)記被改變的像素數(shù)小于設(shè)定閾值TC。
16.根據(jù)權(quán)利要求14所述的圖像二值化方法,其中對所述二值化圖像數(shù)據(jù)進行后處理包括以下步驟d1)針對所述二值化圖像數(shù)據(jù)中的每個像素,統(tǒng)計所述像素的局部窗口內(nèi)具有相同標(biāo)記的像素數(shù)目N,如果該數(shù)目N小于設(shè)定閾值TN,則將所述像素的標(biāo)記取反,否則不變;d2)重復(fù)執(zhí)行步驟d1),直至循環(huán)次數(shù)達到固定的數(shù)值。
17.根據(jù)權(quán)利要求15或16所述的圖像二值化方法,其中所述局部窗口和所述設(shè)定閾值TN由所述二值化圖像數(shù)據(jù)的圖像分辨率決定。
18.一種用于對文檔圖像進行二值化的圖像二值化裝置,包括圖像分類單元,用于針對所述文檔圖像的灰度圖像數(shù)據(jù),計算所述文檔圖像的圖像復(fù)雜度,并且根據(jù)算出的圖像復(fù)雜度,將所述文檔圖像分為簡單類別或復(fù)雜類別;全局分割單元,用于當(dāng)所述文檔圖像為簡單類別時,通過全局分割方法二值化所述灰度圖像數(shù)據(jù),從而生成二值化圖像數(shù)據(jù);以及復(fù)合分割單元,用于當(dāng)所述文檔圖像為復(fù)雜類別時,通過復(fù)合分割方法二值化所述灰度圖像數(shù)據(jù),從而生成所述二值化圖像數(shù)據(jù)。
19.根據(jù)權(quán)利要求18所述的圖像二值化裝置,還包括預(yù)處理單元,用于對物理文檔進行數(shù)字化,以獲得所述文檔圖像。
20.根據(jù)權(quán)利要求18所述的圖像二值化裝置,還包括預(yù)處理單元,用于如果所述文檔圖像為彩色圖像,則將其轉(zhuǎn)換為灰度圖像,以獲得所述灰度圖像數(shù)據(jù)。
21.根據(jù)權(quán)利要求18所述的圖像二值化裝置,還包括預(yù)處理單元,用于對所述灰度圖像數(shù)據(jù)進行低通濾波,以去除其中的圖像噪聲。
22.根據(jù)權(quán)利要求18所述的圖像二值化裝置,還包括預(yù)處理單元,用于通過將所述灰度圖像數(shù)據(jù)分為固定大小的方塊,并且根據(jù)每個方塊內(nèi)的圖像灰度變化判斷其是否為背景,然后對所述灰度圖像數(shù)據(jù)進行圖像背景去除。
23.根據(jù)權(quán)利要求18所述的圖像二值化裝置,還包括后處理單元,用于對所述二值化圖像數(shù)據(jù)進行后處理,以去除其中的噪聲。
全文摘要
本發(fā)明提供了一種用于對文檔圖像進行二值化的圖像二值化方法和裝置。該圖像二值化方法包括以下步驟a)針對所述文檔圖像的灰度圖像數(shù)據(jù),計算所述文檔圖像的圖像復(fù)雜度,并且根據(jù)算出的圖像復(fù)雜度,將所述文檔圖像分為簡單類別或復(fù)雜類別;以及b)當(dāng)所述文檔圖像為簡單類別時,通過全局分割方法二值化所述灰度圖像數(shù)據(jù),而當(dāng)所述文檔圖像為復(fù)雜類別時,通過復(fù)合分割方法二值化所述灰度圖像數(shù)據(jù),從而生成二值化圖像數(shù)據(jù)。通過該圖像二值化方法,可以達到更好的圖像二值化結(jié)果。
文檔編號G06K9/38GK101042735SQ20061006801
公開日2007年9月26日 申請日期2006年3月23日 優(yōu)先權(quán)日2006年3月23日
發(fā)明者郝英, 李滔 申請人:株式會社理光