專利名稱:影像的資料與背景分離的方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種影像資料的資料與背景分離方法,特別是關(guān)于在照明不理想的環(huán)境下,利用靜態(tài)或動(dòng)態(tài)的分界值,將文件影像中的資料成分與背景成分分離的方法。
利用電腦做光學(xué)影像處理(例如光學(xué)字元辨識(shí)OCR)時(shí),必須先將文件中的資料成分(例如文字部分)與背景成分區(qū)分開,然后針對(duì)資料成分加以處理。所以若能做好資料與背景的分離,則可簡(jiǎn)化其后的處理,并提高處理效率。尤其近來(lái)對(duì)影像處理應(yīng)用上的須求,已發(fā)展到能在任意自然的照明環(huán)境下,也就是不需要刻意制造理想的照明環(huán)境下,也能做好正確的影像處理。這種要求與現(xiàn)有技術(shù)利用一封閉的理想照明環(huán)境,以取得理想的資料/背景灰度比,完全不同。如何在自然的照明環(huán)境下,取得合用的資料/背景辨認(rèn),或制造合用的資料/背景灰度比,已成為本領(lǐng)域?qū)<业囊淮笳n題。
從取像設(shè)備,如CCD(ChargeCoupledDevice)攝影機(jī),所得到之影像,可視為一個(gè)二維平面。賦于直角座標(biāo)系統(tǒng),水平方向?yàn)閄軸,垂直方向?yàn)閅軸,原點(diǎn)位于影像的左上角,如第1圖所示。
影像中,位于座標(biāo)值(x,y)上的像素的灰角值,用g(x,y)來(lái)表示。令i(x,y)代表照明因子,而r(x,y)代表反射因子。則g(x,y)=i(x,y)×r(x,y)……(1)
其中0<i(x,y)<∞0<r(x,y)<1在任意自然的照明條件下,即使文件的紙張平滑,印刷清晰精美,也就是r(x,y)不會(huì)在g(x,y)上造成雜訊,當(dāng)照明的條件不理想,即i(x,y)在整個(gè)影像上并不一致時(shí),則g(x,y)會(huì)受其影響,其結(jié)果如第2(b)圖及第3(b)圖所示。圖中,(a)均表示在任意自然的照明條件下,由取像設(shè)備取得的影像資料,(b)則分別表示在其第180條及第120條水平掃描線上測(cè)得各點(diǎn)的灰度值。如第2(a)圖及第3(a)圖所示,取像設(shè)備取得的影像,其背景成分有部分較暗(灰值較低)。雖然各圖的(b)均是代表背景成分的掃描灰度值,但其值變化幅度頗大。如以現(xiàn)有技術(shù),利用單一分界值的方法,取一特定值作為判斷資料/背景的依據(jù),則此特定值將無(wú)法適用整個(gè)影像資料,而造成錯(cuò)誤的結(jié)果。
所以目前必須有一種方法,以在照明不理想的情形下,能隨時(shí)調(diào)整分界值,并求消除照明不均勻所造成的影響。
本發(fā)明的目的即在提供一種文件影像的資料與背景分離方法,以在照明不均勻的環(huán)境下,取得正確影像資料。
本發(fā)明另一目的在提供一種消除照明條件不佳,對(duì)影像資料造成的劣化的方法。
本發(fā)明另一目的,也在提供一種動(dòng)態(tài)的影像資料/背景分離值的決定方法。
根據(jù)照明設(shè)備的特性,在不加以刻意遮掩的情況下,其對(duì)影像灰度值所造成的影響,是接近平滑的及漸進(jìn)的圖不會(huì)有突然的大的差值。其情形亦如第2圖及第3圖所示。圖中,顯示兩個(gè)在不理想的照明情況下取得的文件影像,以及一條不通過(guò)文字筆劃的水平線上(也就是該水平線上的像素皆為背景,皆不屬于文字),灰度值相對(duì)于x軸座標(biāo)的變化曲線。由于該水平線不通過(guò)任何文字,其上的像素完全是屬于背景,也就是白紙,所以其灰度值完全是由不理想的照明所產(chǎn)生。曲線由于受電子取像設(shè)備,光源入射角及紙張表面粗糙度影響,并非完全平滑,但仍可認(rèn)為其變化是近似平滑且連續(xù)。
根據(jù)“由不理想之照明,在灰度值上所造成之變化是近似平滑且連續(xù)”的結(jié)論,可以得知不理想的照明,為相鄰兩像素的灰度值所造成的差值是有限,且可以加以預(yù)估的。利用上述現(xiàn)象可以尋求以靜態(tài)分界值或動(dòng)態(tài)的分界值,將影像中的資料成分與背景成分加以分離,并據(jù)以處理。
以下依據(jù)圖式說(shuō)明本發(fā)明之實(shí)施例。
第1圖表示由取像設(shè)備取得的二維影像座標(biāo)系圖。
第2圖表示不理想照明環(huán)境下取得文件影像及其特定掃描線上的灰度值變化曲線圖。
第3圖表示不理想照明環(huán)境下取得另一文件影像及其特定掃描線上的灰度值變化曲線圖。
第4圖表示文件影像資料及其文字資料筆劃邊緣的示意圖。
第5圖表示本發(fā)明較佳實(shí)施例中f函數(shù)與R函數(shù)的關(guān)系圖。
第6圖表示不理想照明環(huán)境下取得文件影像及其特定掃描線上所取得的灰度值與分界值曲線圖。
第7圖表示不理想照明環(huán)境下取得另一文件及其特定掃描線上所取得的灰度值與分界值曲線圖。
第8圖表示不理想照明環(huán)境下取得另一文件影像及其特定掃描線上所取得的灰度值與分界值曲線圖。
第9圖表示利用本發(fā)明的方法處理不理想照明環(huán)境下取得的文件影像之結(jié)果。
第10圖表示利用本發(fā)明的方法處理不理想照明環(huán)境下取得的另一文件影像的結(jié)果。
第11圖表示利用本發(fā)明的方法處理不理想照明環(huán)境下取得的另一文件影像的結(jié)果。
第12圖表示利用本發(fā)明的方法處理不理想照明環(huán)境下取得的另一文件影像的結(jié)果。
(A)將像素區(qū)分為“穩(wěn)定態(tài)”與“轉(zhuǎn)變態(tài)”的方法假設(shè)由取像設(shè)備取得之影像大小為N(pixel)×N(pixel)對(duì)于x方向上,相鄰的兩個(gè)像素的灰度值,定義一個(gè)差值的絕對(duì)值函數(shù)如下X_GDIF(x,y)=|g(x,y)-g(x-1,y)|-(2)X1,2,3,....,N-1Y0,2,3,....,N-1相同的,在y軸方向,也定義一個(gè)相同的函數(shù)如下Y_GDIF(x,y)=|g(x,y)-g(x,y-1)|-(3)X0,1,2,....,N-1Y1,2,3,....,N-1假設(shè)NX(i)表示X_GDIF(x,y)=i的像素的數(shù)目,
NY(i)表示Y_GDIF(x,y)=i的像素的數(shù)目。
M=N×(N-1)表示X_GDIF(x,y)或Y_GDIF(x,y)有定義的像素的數(shù)目。則X_GDIF(x,y)小于或等于i的像素總數(shù),在整個(gè)文件像素中所占的比例,寫成i的函數(shù)如下X-CFD(i)=k = 0iNX(k)/M]]>若在電腦中,以8bits來(lái)代表一個(gè)像素的灰度值,則i=0,1,2,…,255。同理,在y軸方向也有一個(gè)相對(duì)的函數(shù)Y-CFD(i)=k=0iNY(k)/M,i = 0,1,2,....,255]]>在一張文件影像中,屬于文字筆劃邊緣的像素,在整張影像中所占的比例較小,如第4圖所示。圖中(a)是一個(gè)文件影像,(b)中,白色部分是文字筆劃邊緣的像素。根據(jù)統(tǒng)計(jì)的結(jié)果,可以得到一張文件影像中,屬于文字筆劃邊緣的像素,在整張文件中所占的百分比不超過(guò)25%。換句話說(shuō),屬于背景及非文字筆劃邊緣的像素,不少于75%,所以不理想之照明對(duì)文件影像中,兩相鄰像素號(hào)灰度值所造成之影響可以對(duì)X_GDIF(x,y)<i(或Y_GDIF(x,y)<=i),0<=i<=255,找到一個(gè)i,使得X_CFD(i)=75%(或Y_CFD(i)=75%)。換言之,對(duì)X_CFD(i)=75%(或Y_CFD(i)=75%)之部分做一統(tǒng)計(jì)分析,可得到灰度值變化的統(tǒng)計(jì)量。實(shí)驗(yàn)中,對(duì)18張文件影像做上述的統(tǒng)計(jì),求得平均值,標(biāo)準(zhǔn)差,平均值加3倍標(biāo)準(zhǔn)差(取四舍五入值成整數(shù)),以及利用該平均值加3倍標(biāo)準(zhǔn)差調(diào)整而得的X_CFD(i)與Y_CFD(i)的值,如表一與表二所示。
+i是平均值加三倍標(biāo)準(zhǔn)差后取四舍五入值到整數(shù)
++i是平均值加三倍標(biāo)準(zhǔn)差后取四舍五入值到整數(shù)在這些統(tǒng)計(jì)量中,平均值的平均值,標(biāo)準(zhǔn)差的平均值及平均值加3倍標(biāo)準(zhǔn)差的平均值,列于表中的最下面一列。從這個(gè)結(jié)果可以獲得對(duì)某些特定樣本適用的i值。
令i=平均值加3倍標(biāo)準(zhǔn)差,則通常75%<=X_CFD(i)<=79%,75%<=Y(jié)_CFD(i)<=79%。前面已得知,屬于背景與非文字筆劃邊緣的像素所占的比例不少于75%,所以可以將依統(tǒng)計(jì)所得之平均值加3倍標(biāo)準(zhǔn)差當(dāng)做是不理想的照明對(duì)灰度值影響的估計(jì)值,而在上述實(shí)例中則可將6當(dāng)做是廣域的估計(jì)值。接下來(lái)定義一個(gè)名詞稱為“最大穩(wěn)定態(tài)灰度值差”簡(jiǎn)寫為L(zhǎng)SSD,且LSSD≡平均值+3×標(biāo)準(zhǔn)差。
根據(jù)LSSD,我們將像素區(qū)分成兩類第一類稱之為處于“穩(wěn)定態(tài)”;第二類則是處于“轉(zhuǎn)變態(tài)”,其判斷條件如下1、若X_GDIF(x,y)<=LSSD(或Y_GDIF(x,y)<=LSSD),則認(rèn)為位于(x,y)之像素處于“穩(wěn)定態(tài)”。
2、若X_GDIF(x,y)>LSSD(或Y_GDIF(x,y)>LSSD),則認(rèn)為位于(x,y)之像素處于“轉(zhuǎn)變態(tài)”。
決定某像素究處于穩(wěn)定態(tài)或標(biāo)準(zhǔn)態(tài)后,即可據(jù)以對(duì)之作不同的處理。
(B)對(duì)“穩(wěn)定態(tài)”像素調(diào)整分界值的方法LSSD是一個(gè)統(tǒng)計(jì)的量,理論上,必須將整個(gè)影像做計(jì)算后才能得到其確切的值。但是在實(shí)際應(yīng)用上,為了避免造成處理的瓶頸,可以設(shè)計(jì)以掃描式(rasterscan)輸入,管線式(pipeline處理的方式,來(lái)達(dá)到即時(shí)處理的目標(biāo)。但在這種方式下,LSSD的確實(shí)值就需法預(yù)先求得。然而也因?yàn)長(zhǎng)SSD是一個(gè)統(tǒng)計(jì)的量,所以僅需采取足夠的樣本,而不必全部的樣本,就能表現(xiàn)出同樣的特性。例如在決定某一條掃描線上(通常是水平或垂直方向)的LSSD時(shí),由于小范圍中,像素灰度值受不理想照明的影響下,其差距并不會(huì)太大。所以可以由該掃描線上一段連續(xù)的像素的灰度值,計(jì)算出一個(gè)區(qū)域性的LSSD,而將此LSSD當(dāng)做是下一段像素的LSSD。至于掃描線起頭一段像素的LSSD,可以利用一定值,(在某些實(shí)例中可定為6)也就是廣域的LSSD作為起始值。
如前所示,假設(shè)在某條掃描線上(一般是水平方向的掃描線),位置為n的像素的灰度值為g(n),若|g(n)-g(n-1)|<=區(qū)域LSSD,則認(rèn)定該像素處于穩(wěn)定態(tài)。為了要克服不理想的照明在灰度值上造成不均勻分布的影響,當(dāng)像素是穩(wěn)定態(tài)時(shí),分界值應(yīng)該跟著灰度值一起變化,因?yàn)檫@時(shí)灰度值上的變化是由不理想的照明所引起的。所以若用t(n)來(lái)代表適用于位置為n的像素的分界值,且該像素是穩(wěn)定態(tài)的話,則可以利用t(n)=t(n-1)+〔g(n)-g(n-1)〕來(lái)修正(或調(diào)整)n像素之分界值。
(C)對(duì)“轉(zhuǎn)變態(tài)”像素調(diào)整分界值的方法如前所示,當(dāng)|g(n)-g(n-1)|>區(qū)域LSSD時(shí),認(rèn)定該像素是處于轉(zhuǎn)變態(tài)。但在取得之影像資料中,除了文字筆劃的邊緣之外,還有許多因素會(huì)使一個(gè)像素成為轉(zhuǎn)變態(tài),例如雜訊的干擾,文件印刷的品質(zhì),紙張的品質(zhì)……等。在掃描及管線處理的方式中,處理位置為n的像素時(shí),立即可用的資料有
1、g(n)該像素的灰度值。
2、g(n-1)前一像素的灰度值。
3、t(n-1)前一像素的分界值。
因此分界值的計(jì)算,可以利用下列的式子決定t(n)=t(n-1)+f(g(n),g(n-1),t(n-1)×|g(n)-g(n-1)|為了要偵測(cè)到文字筆劃邊緣上,像素灰度值的劇烈變化,分界值在這些像素上的變化值就不能跟著灰度值變化,而其改變量必須比灰度值改變量小,以便能檢測(cè)到該灰度值上的劇烈變化。由于受到照明不理想的影響,而相鄰文字筆劃的灰度值與背景的灰度值變化,可能會(huì)有很大的差異。為了能在偵測(cè)到一個(gè)對(duì)比較強(qiáng)的筆劃之后,亦能偵測(cè)到一個(gè)對(duì)比不明顯的筆劃,所以函數(shù)f最好正比例于g(n)-g(n-1),且反比于|g(n-1)-t(n-1)|,因此令R(n)= (g(n)-g(n-1))/(|g(n-1)-t(n-1)|)則f∞R(n),且0<|f(·,·,·)|<1。
另外,為了去除一些小的雜訊,f函數(shù)最好具有下列的特性若|R(n1)|<|R(n2)|
則 | (df)/(dR) |n=n1|>| (df)/(dR) |n=n2|綜合f函數(shù)應(yīng)有的特性,f函數(shù)的曲線度可如第5圖所示。
這是一個(gè)與反正切函數(shù)曲線相似的曲線,因此f(g(n),g(n-1),t(n-1))=S×tan-1R(n)t(n)=t(n-1)+S×〔tan-1R(n)〕×|g(n)-g(n-1)|S是一個(gè)正規(guī)化因子(normalize fartor),使得|S×tan-1R(n)|<1第6圖、第7圖、第8圖所示為利用本方法處理所得到的結(jié)果,其中(a)是原始的文件影像,(b)、(c)及(d)是沿著某條水平或垂直掃描線上灰度值與分界值的變化情況,圖中實(shí)線代表灰度值,虛線代表分界值。由圖中可知,利用本方法的確可以正確地將文字與背景區(qū)分開來(lái)。
(D)從水平與垂直兩個(gè)掃描方向共同決定分界值的方法前面說(shuō)明了由某單一掃描方向,如何來(lái)調(diào)節(jié)分界值的方法,由于影像是二維的資料,所以若能從水平與垂直兩個(gè)方向的資料,共同來(lái)決定分界值的話,將更有助于處理的結(jié)果。
假設(shè)依照前兩節(jié)所述的方法,對(duì)位置座標(biāo)在(x,y)的像素,由水平方向處理所得的分界值為TH(x,y),由垂直方向處理所得之分界值為TV(x,y),該像素的灰度值為g(x,y),b(x,y)為區(qū)分后的結(jié)果,則在本發(fā)明中判定該像素為文字或背景的方法可以如下1、g(x,y)≤TH(x,y)且g(x,y)≤TV(x,y)則b(x,y)=0,即該像素為文字部分。
2、g(x,y)>TH(x,y)且g(x,y)>TV(x,y)則b(x,y)=1,即該像素為背景部分。
3、g(x,y)≤TH(x,y)且g(x,y)>TV(x,y)若TH(x,y)-g(x,y)<g(x,y)-TV(x,y),則b(x,y)=1。
若TH(x,y)-g(x,y)≥g(x,y)-TV(x,y),則b(x,y)=0。
4、g(x,y)>TH(x,y)且g(x,y)≤TV(x,y)若TV(x,y)-g(x,y)≤g(x,y)-TH(x,y),則b(x,y)=1。
若TV(x,y)-g(x,y)>g(x,y)-TH(x,y),則b(x,y)=0。
對(duì)于文件影像中第一個(gè)像素,也就是最在上角像素的分界值,因?yàn)槲募跋駲C(jī)幾乎都是白紙黑字,且文件影像的第一個(gè)像素大多是背景,所以通常假設(shè)第一個(gè)像素為背景,并令TV(0,0)=TH(0,0)=0.8×g(0,0),b(0,0)=1。
第9圖、第10圖、第11圖及第12圖顯示利用本發(fā)明中的方法,對(duì)于取自于照明不理想環(huán)境下的文件影像(a),分別從左上(b),右上(c),左下(d),右下(e)四個(gè)角落為輸入之起始點(diǎn)開始處理,所得到之結(jié)果。因此同一張影像就可模擬四種不同的照明條件,可看出利用本發(fā)明的方法,確實(shí)可以克服不理想照明所產(chǎn)生的影響,并得到正確的處理結(jié)果。
此外,本發(fā)明之方法不僅可以應(yīng)用在文字影像資料,于其他影像資料之處理,亦具優(yōu)異的效果。第13-15圖顯示以本發(fā)明之方法,處理照明狀況不佳之指紋影像資料之結(jié)果。如圖所示,以本發(fā)明處理指紋之灰度值影像,亦可獲得極佳之影像/背景分離效果。
以上是對(duì)本發(fā)明方法的說(shuō)明。唯上述說(shuō)明僅在例示本發(fā)明之精神,本領(lǐng)域技術(shù)人員,均易于在本發(fā)明所揭示的技術(shù)上,作出不同之引申。無(wú)論如何,仍在本發(fā)明范圍之內(nèi)。
權(quán)利要求
1.一種辨認(rèn)影像資料的方法,系用以決定數(shù)位化影像資料為背景或影像的方法,包括將影像資料的第1像素假設(shè)為“背景”的步驟,由第1方向參考前像素的灰度值,辨別影像資料的像素系屬穩(wěn)定態(tài)或轉(zhuǎn)變態(tài)的步驟,如該像素系屬穩(wěn)定態(tài),則以穩(wěn)定態(tài)像素分界值設(shè)定法設(shè)定的分界值判斷該像素為背景或影像像素的步驟,及如該像素系屬轉(zhuǎn)變態(tài),則以轉(zhuǎn)變態(tài)像素分界值設(shè)定法設(shè)定的分界值判斷該像素為背景或影像像素的步驟。
2.如權(quán)利要求1的方法,其中辨別像素屬穩(wěn)定態(tài)或轉(zhuǎn)變態(tài)的步驟包含設(shè)定相鄰兩同為背景及/或影像像素的灰度值差值為穩(wěn)定態(tài)的上限(LSSD)的步驟比較兩水平或垂直相鄰像素的灰度值差值與上述LSSD的步驟,及在該相鄰像素灰度值差值大于該LSSD時(shí)判斷該像素系屬轉(zhuǎn)變態(tài),小于該LSSD時(shí)判斷為屬于穩(wěn)定態(tài)的步驟。
3.如權(quán)利要求2的方法,其中的LSSD在將像素灰度分為256階時(shí)系為6。
4.如權(quán)利要求1的方法,其中穩(wěn)定態(tài)像素分界值設(shè)定法包含設(shè)定相鄰兩像素均為背景或影像時(shí)之灰度值差值上限的步驟,以該上限作為決定像素為背景或影像的分界值之步驟,及依像素與其前一像素之灰度值差值調(diào)整該分界值的步驟。
5.如權(quán)利要求4的方法,其中調(diào)整分界值的方法包含將該像素的灰度值與其前一像素的灰度值的差值加上前一像素的分界值作為該像素的分界值的步驟。
6.如權(quán)利要求1的方法,其中轉(zhuǎn)變態(tài)像素分界值設(shè)定法包含設(shè)定相鄰兩像素均為背景或影像時(shí)的灰度值差值上限的步驟,以該上限作為決定像素為背景或影像的分界值的步驟,及依像素與其前一像素的灰度值差值調(diào)整該分界值的步驟。
7.如權(quán)利要求6的方法,其中調(diào)整分界值的方法包括將該像素的灰度值與其前一像素的灰度值差值的絕對(duì)值,乘以一調(diào)整因子,而加到前一像素的分界值,作該像素的分界值的步驟。
8.如權(quán)利要求7的方法,其中調(diào)整因子包括-f函數(shù)f(n)=S×tan-1R(n)其中R(n)=| (g(n)-g(n-1))/(g(n-1)-t(n-1)) |其中g(shù)(n)代表第n像素的灰度值,t(n-1)代表第n-1像素的分界值,S為一正規(guī)化因子,使得|S×tan-1R(n)|<1。
9.如權(quán)利要求1的方法,還包括一由第2方向設(shè)定影像資料為背景或影像的分界值的步驟,以及依據(jù)該第1及第2方向所設(shè)定的分界值決定像素為背景或影像的步驟。
10.如權(quán)利要求9的方法,其判斷像素為背景或影像的方法包括A、像素灰度值〔g(x,y)〕低于或等于第1方向分界值〔T1(x,y)〕及第二方向分界值〔T2(x,y)〕時(shí),判斷為影像像素;B、像素灰度值〔g(x,y)〕高于第1方向分界值〔T1(x,y)〕及第二方向分界值〔T2(x,y)〕時(shí),判斷為背景像素;C、像素灰度值低于或等于第1方向分界值但高于第2方向分界值時(shí),若T1(x,y)-g(x,y)<g(x,y)-T2(x,y),則判斷為影像像素,若T1(x,y)-g(x,y)≥g(x,y)-T2(x,y),則判斷為影像像素;D、像素灰度值高于第1方向分界值但低于或等于第2方向分界值時(shí),若T2(x,y)-g(x,y)≤g(x,y)-T1(x,y),則判斷為背景像素,若T2(x,y)-g(x,y)>g(x,y)-T1(x,y),則判斷為影像像素。
11.如權(quán)利要求10的方法,其中第1方向?yàn)橛跋褓Y料在直角角座標(biāo)系的水平方向,第2方向?yàn)橛跋褓Y料在直角座標(biāo)系的垂直方向。
全文摘要
利用照明特性與文件特性,在照明不理想的環(huán)境下,以掃描的處理方式,利用動(dòng)態(tài)調(diào)整分界值將文件影像中的資料成分與背景成分分離,以獲取文件中的資訊。本發(fā)明包括將影像中的像素(pixel)區(qū)分為“穩(wěn)定態(tài)”與“轉(zhuǎn)變態(tài)”的方法;對(duì)“穩(wěn)定態(tài)”像素調(diào)整分界值的方法;對(duì)“轉(zhuǎn)變態(tài)”像素調(diào)整分界值的方法;從水平、垂直兩方向共同決定分界值的方法。
文檔編號(hào)G06K9/36GK1081516SQ9210868
公開日1994年2月2日 申請(qǐng)日期1992年7月22日 優(yōu)先權(quán)日1992年7月22日
發(fā)明者許文星, 楊政道 申請(qǐng)人:星友科技股份有限公司