專利名稱:彩色圖象處理裝置及圖案抽取裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及彩色圖象處理裝置及圖案抽取裝置,特別涉及適于從彩色圖象抽取標(biāo)題等的這類裝置。
近年來,由于計算機及其外圍裝置諸如打印機的普及,以及它們的價格的降低,彩色圖象已經(jīng)用于各個領(lǐng)域。于是,希望有一種技術(shù),用來把彩色圖象劃分為幾個區(qū)域并只抽取特定區(qū)域。例如,希望有一種技術(shù),用來從彩色圖象抽取相同顏色的區(qū)域。當(dāng)由CCD像機拍攝的彩色風(fēng)景圖象用作為待處理的輸入圖象時,在很多應(yīng)用中已經(jīng)廣泛需要這種技術(shù),用來選擇果實和觀察汽車及人以為安全。
當(dāng)彩色文件圖象用作為輸入圖象時,希望這種技術(shù)能從圖象自動抽取文檔的名稱和關(guān)鍵字。這種技術(shù)的例子有數(shù)據(jù)檢索系統(tǒng),諸如圖書館中的圖書分類系統(tǒng),和自動管理系統(tǒng)。此外,這種技術(shù)在用于作為數(shù)據(jù)庫而存儲和共享圖象數(shù)據(jù)的群件中,用來自動設(shè)定關(guān)鍵字和文件名。這種信息能夠用來從大量彩色文檔圖象中檢索所需的數(shù)據(jù)。
作為用于從彩色圖象抽取特定區(qū)域的技術(shù),已經(jīng)提出以下方法。
(1)RGB彩色空間聚類(clustering)方法在RGB彩色空間聚類方法中,產(chǎn)生彩色分離的圖象。換言之,由CCD相機拍攝的RGB圖象的象素在RGB空間中被聚類。使用一個聚類中的象素,產(chǎn)生每一顏色的圖象。這樣就抽取了相同顏色的區(qū)域。這種方法中產(chǎn)生的區(qū)域被組合以便抽取新的區(qū)域。
圖1是用來說明傳統(tǒng)的RGB彩色空間聚類方法的示意圖。
圖1中,假設(shè)彩色文檔圖象501被輸入,相同顏色的圖案被抽取并被聚類。例如,假設(shè)圖案502和507是藍(lán)色的分組顏色,圖案503是綠色的分組顏色,而圖案504到506是紅色的分組顏色,則在RGB空間中產(chǎn)生包含藍(lán)色的分組顏色圖案502和507的集群508、包含綠色分組顏色圖案503的集群509、以及包含紅色的分組顏色圖案504到506的集群510。
當(dāng)產(chǎn)生了集群508到510時,則產(chǎn)生了具有包含在其中的象素的集群508到510的圖象。這樣,對于集群508,產(chǎn)生了由圖案502′和507′組成的顏色分開的圖象501a。對于集群509,產(chǎn)生了由圖案503′組成的顏色分開的圖象501b。對于集群510,產(chǎn)生了由圖案504′到506′組成的顏色分開的圖象501c。
(2)非RGB彩色空間聚類方法所有RGB空間中表示的RGB圖象的象素被轉(zhuǎn)換為另一彩色空間,諸如HSV。象素在彩色空間中按特定的方式被聚類。使用包含在每一集群中的象素產(chǎn)生圖象,以便抽取相同顏色的區(qū)域。對獲得的區(qū)域進(jìn)行組合以便抽取新的區(qū)域。
已知有以下描述用于從彩色文檔圖象抽取字符區(qū)域的技術(shù)的技術(shù)文章。
Senda et.al.,“Method for extracting a character pattern from acolor image due to a single color of characters”,The Institute ofElectronics,Information and Communication Engineers,Japan,PRU94-04,pp17-24,Uehane et.al.,“Extracting a character area from a color imageusing iso-color line process”,The Institute of Electronics,Informationand Communication Engineers,Japan,PRU1594-09,pp9-16,Matsuo et.al.,“Extracting a single color character area from acolor document image”,1997 Annual Convention,The Institute ofElectronics,Information and Communication Engineers,Japan,D-12-19,Matsuo et.al.,“Extracting a character string from a scenery imagewith gradation and color information”,The Institute of Electronics,Information and Communication Engineers,Japan,PRU92-121,pp25-32。
(3)區(qū)域擴展法在區(qū)域擴展法中,對相鄰的象素設(shè)定只對應(yīng)于色彩相似性的標(biāo)號。換言之,獲得以RGB表示的象素的每一(R,G,B)顏色要素最大值(max)并正規(guī)化為(R/max,G/max,B/max)。這樣,就產(chǎn)生了正規(guī)化的圖象。
圖2是表示傳統(tǒng)的區(qū)域擴展法的示意圖。
圖2中,圖象中的象素P1、P2等以顏色要素RGB表示為P1(R1,G1,B1),P2(R2,G2,B2)等[1]。然后,獲得每一顏色要素的最大值。例如,象素P1的R1,G1,B1的最大值由max1表示。類似地,象素P2的R2,G2,B2的最大值由max2表示。使用最大值對每一顏色要素進(jìn)行正規(guī)化。這樣就獲得正規(guī)化的象素P1′(R1/max1,G1/max1,B1/max1),P2′(R2/max2,G2/max2,B2/max2)[2]。
獲得正規(guī)化象素P1′和P2′的每一顏色要素的方差。累計其結(jié)果以便獲得相鄰象素P1′和P2′之間的距離,如d=(R1/max1-R2/max2)2+(G1/max1-G2/max2)2+(B1/max1-B2/max2)2[3]。
這樣,當(dāng)距離d小于預(yù)定的閾值THO時,把象素P1和P2當(dāng)作相同顏色的象素處理并設(shè)定相同的標(biāo)號。在對所有的圖象設(shè)定了標(biāo)號之后,抽取具有相同標(biāo)號的相同顏色的區(qū)域。
在區(qū)域擴展法中,由于只處理相鄰的象素,這種方法的處理時間比RGB彩色空間聚類方法要短。
對于區(qū)域擴展法的細(xì)節(jié),請參見日本專利公報No.5-298443。
此外,作為從色彩分離圖象抽取字符區(qū)域的一種方法,已知上面提及的方法(Uehane et.al.,“Extracting a character area from a color imageusing iso-color line process”,The Institute of Electronics,Informationand Communication Engineers,Japan,PRU1594-09,pp9-16)。在這一方法中,使用以下步驟從彩色圖象抽取字符區(qū)域。
-從單色分離的圖象獲得連接區(qū)域中的包圍矩形。
-把包圍矩形限制在其尺寸和形狀預(yù)定范圍內(nèi)。
-設(shè)定每一矩形的相鄰矩形搜索范圍。在每一搜索范圍將矩形作為一個組來搜索。
-具有重心高線性的矩形保持在每一組中。
-獲得每一組的包圍矩形,并抽取與組成該組的區(qū)域顏色相同顏色的圖案。
然而,用于對彩色圖象的相同顏色區(qū)域進(jìn)行聚類的傳統(tǒng)聚類方法有以下問題。
在RGB彩色空間聚類方法或其它彩色空間聚類方法中(例如,HSV空間聚類方法),聚類圖象的所有象素。這樣,即使圖案502的顏色不同于圖案507的顏色,當(dāng)它們的顏色彼此類似時,圖案502和507也可能被分類為相同的集群508。這種情形下,由于圖案507的顏色,改變圖案502的顏色的集群形狀。這樣使圖案502的顏色集群的色彩范圍畸變。于是,圖案502不能被精確地抽取。例如,當(dāng)要被抽取的圖案同與其顏色類似的圖案507分開時,如果它們作為一個集群508被抽取,則集群508的顏色成為圖案502的顏色與聚類507的顏色的混合顏色。集群508的顏色不能覆蓋圖案502的顏色范圍和圖案507的顏色范圍。這樣,作為抽取的結(jié)果可能在圖案502′和圖案507′中發(fā)生孔洞511和512。另外,圖案502′和507′的輪廓可能不能被清晰地抽取。
在RGB彩色空間聚類方法或其它彩色空間聚類方法中(例如,HSV彩色空間聚類方法),由于要聚類所有圖象的很多象素,故用于聚類處理的計算時間變長。
另一方面,在區(qū)域擴展方法中,為了如圖2中所示正規(guī)化象素,由于要對每一象素進(jìn)行劃分,故檢索的數(shù)目變得很大。對于所有的象素劃分的結(jié)果應(yīng)當(dāng)作為浮點數(shù)據(jù)存儲。這樣,由于該處理所需要的存儲器資源變得很大。而且,在象素正規(guī)化后,與這些象素的顏色的相似性的定義有關(guān),就觀察者所見相同的相鄰象素可能對固定的閾值有很大偏差。這樣,在一區(qū)域中可能發(fā)生孔洞。另外,區(qū)域的輪廓可能不能被正確地抽取。此外,由于僅考慮相鄰象素的關(guān)系,當(dāng)在字符區(qū)和背景區(qū)的邊界處顏色逐漸變化時,字符區(qū)和背景區(qū)就被設(shè)定相同的標(biāo)號。
在傳統(tǒng)的字符區(qū)抽取方法,對應(yīng)于整個圖象的顏色數(shù)產(chǎn)生顏色分離的圖象。這樣,要用很長的時間產(chǎn)生顏色分離的圖象。例如,當(dāng)從圖象抽取標(biāo)題時,標(biāo)題可能受到其它顏色的不利的影響。這樣,降低了標(biāo)題抽取的精確性。當(dāng)獲得連接區(qū)域的包圍矩形時,要對每一被抽取的顏色分離的圖象的整個圖象進(jìn)行處理。于是,對于一種顏色的圖象需要相同尺寸的多個圖象(對應(yīng)于抽取的顏色數(shù))。這樣,需要用很長的時間處理彩色圖象。
此外,由于包圍矩形對應(yīng)于整個彩色圖象的各個顏色分離的圖象被分組,故要花很長的時間處理彩色圖象。當(dāng)要抽取的字符聚類為不同的顏色分離的圖象時,它們就不能被正確地抽取。
當(dāng)圖案被分組時,僅抽取相關(guān)搜索范圍內(nèi)的矩形。這樣,小的部分可能從相關(guān)的分組中漏掉。為了恢復(fù)漏掉的部分,最后要抽取類似顏色的圖案。然而這時,可能被抽取的是類似顏色的干擾。
本發(fā)明的第一個目的是要提供一種彩色圖象處理裝置,該裝置對圖象區(qū)域的部分進(jìn)行距離計算處理,而無需進(jìn)行正規(guī)化處理。
本發(fā)明的第二個目的是要提供一種圖案抽取裝置,該裝置在抑制圖案被漏掉的同時能以高速抽取圖案。
本發(fā)明的第三個目的是要提供一種圖案抽取裝置,該裝置允許圖案即使在其邊界不清的情形下也能被精確地抽取。
為了解決上述的問題,本發(fā)明的一個方面是一種彩色圖象處理裝置,該裝置具有用于輸入彩色圖象并輸出彩色圖象信號的彩色圖象輸入單元、用于保持彩色圖象信號的保持單元、以及用于處理彩色圖象信號的計算單元,包括用于對應(yīng)于所考慮的象素的顏色信息設(shè)定閾值的閾值設(shè)定單元、以及用于比較相鄰象素的顏色信息并當(dāng)它們的距離為閾值或更小時為象素設(shè)定相同標(biāo)號的標(biāo)號單元。
這樣,用于確定是否為相鄰的象素設(shè)定相同的標(biāo)號的距離閾值能夠?qū)?yīng)于所考慮的象素的顏色信息被設(shè)定,而不是一個固定的值。這樣,就可精確地確定象素是否在相同的區(qū)域中。于是,能夠從所希望的區(qū)域中精確地抽取象素。
本發(fā)明的一個方面是一種彩色圖象處理裝置,該裝置還包括用于獲得設(shè)定了相同標(biāo)號的象素的平均顏色的平均顏色計算單元,以及用于比較與所考慮的象素相鄰的象素的顏色與平均顏色的平均顏色比較單元,其中只有當(dāng)比較的結(jié)果處于預(yù)定的范圍時,標(biāo)號單元才為象素設(shè)定相同的標(biāo)號。
這樣,即使一個要被抽取的區(qū)域的顏色逐漸變化而且其邊界不清,也能區(qū)分開要抽取的區(qū)域及其背景區(qū)域。于是,能夠改進(jìn)區(qū)域抽取的精確性。
本發(fā)明的一個方面是一種彩色圖象處理裝置,該裝置具有用于輸入彩色圖象并輸出彩色圖象信號的彩色圖象輸入單元、用于保持彩色圖象信號的保持單元、以及用于處理彩色圖象信號的計算單元,包括用于縮小彩色圖象信號并產(chǎn)生縮小圖象的圖象縮小單元,其中從縮小的圖象獲得相同顏色的區(qū)域,并且只對應(yīng)于從縮小圖象抽取的顏色抽取對應(yīng)于所獲得的區(qū)域的區(qū)域。
這樣,使用縮小圖象可獲得看作為相同顏色的區(qū)域。于是,用于抽取被認(rèn)為是相同顏色的區(qū)域的處理處理能夠以高速進(jìn)行。
本發(fā)明的一個方面是一種彩色圖象處理裝置,其中標(biāo)號單元獲取標(biāo)號圖象和縮小圖象的標(biāo)號區(qū)域的包圍矩形、其代表性顏色、每一標(biāo)號區(qū)域中的顏色數(shù)、及來自縮小圖象的顏色,獲取與之對應(yīng)的原始圖象的矩形,搜索與矩形中的代表性顏色具有類似顏色的象素,并從被搜索的象素開始進(jìn)行標(biāo)號處理。
這樣,從縮小圖象獲得了標(biāo)號圖象的包圍矩形和標(biāo)號、其代表性顏色、相同標(biāo)號區(qū)域中的顏色數(shù)、及顏色。對應(yīng)于所獲得的結(jié)果,獲得了原始圖象的矩形。能夠在矩形中執(zhí)行標(biāo)號處理。這樣,標(biāo)號處理可以高速進(jìn)行。
本發(fā)明的一個方面是一種彩色圖象處理裝置,其中標(biāo)號單元確定縮小圖象的區(qū)域的所有的顏色和相似性,并當(dāng)區(qū)域顏色的相似性小于閾值時,為區(qū)域設(shè)定相同的標(biāo)號。
這樣,確定了從縮小圖象獲得的所有顏色及其相似性、以及縮小圖象的區(qū)域的相似性。當(dāng)區(qū)域顏色的相似性小于預(yù)定的閾值時,可以為這些區(qū)域設(shè)定相同的標(biāo)號。這樣,可以按肉眼的觀察抽取所需的區(qū)域。
本發(fā)明的一個方面是一種彩色圖象處理裝置,其中閾值設(shè)定單元以可變的三種顏色要素的閾值確定區(qū)域顏色的相似性,當(dāng)區(qū)域的三種顏色要素的色差距小于可變的閾值時,確定區(qū)域的顏色相似性為0,并當(dāng)區(qū)域的三顏色要素的色差距等于或大于該閾值時,確定區(qū)域的顏色相似性為大于閾值。
這樣,分別對三種顏色要素設(shè)定閾值元素。當(dāng)兩種顏色的所有的三顏色要素小于各自的閾值(元素)時,這些顏色作為相同的顏色對待。于是,可以降低閾值表的容量。此外,可以很精確地進(jìn)行標(biāo)號處理。
本發(fā)明的一個方面是一種圖案抽取單元,包括用于對應(yīng)于輸入圖象圖案的顏色信息和幾何信息對輸入圖象的圖案進(jìn)行分類的分類單元。
這樣,當(dāng)從彩色輸入圖象抽取相同顏色的標(biāo)題區(qū)域時,輸入圖象的顏色部分限制為標(biāo)題區(qū)域。圖案對應(yīng)于顏色信息被分類。從被分類的對象中除去與標(biāo)題區(qū)域相分離的圖案。此外,可從對應(yīng)于顏色信息被分類的對象中除去不是標(biāo)題字符的小圖案和大圖案。
本發(fā)明的一個方面是一種圖案抽取裝置,包括用于對應(yīng)于相鄰象素的顏色信息把輸入圖象的象素進(jìn)行聚類的聚類單元,以及用于對應(yīng)于通過聚類單元獲得的集群的顏色信息和幾何信息,把集群分類為組的分組單元。
這樣,為了對輸入圖象的象素進(jìn)行聚類,對所考慮的象素的顏色信息及其相鄰象素的顏色信息進(jìn)行比較。當(dāng)比較了輸入圖象的所有象素時,相鄰象素顏色信息的比較處理的次數(shù)變?yōu)檩斎雸D象的象素數(shù)的平方。反之,當(dāng)對所考慮的象素的顏色信息與其相鄰象素的顏色信息進(jìn)行比較時,比較處理的次數(shù)變?yōu)檩斎雸D象象素數(shù)。這樣,聚類處理能夠以高速進(jìn)行。
由于集群被分類為組,故可對相同集群中的象素進(jìn)行整體處理。這樣,不必處理個別的象素。于是,分組處理能夠以高速進(jìn)行。此外,在輸入?yún)^(qū)域的限定范圍內(nèi),可把類似顏色的集群分類為相同的組。這樣,分組處理進(jìn)而也能以高速進(jìn)行。
本發(fā)明的一個方面是一種圖案抽取裝置,用于在按第一分辨率確定區(qū)域為相同顏色、而按第二分辨率確定為不同顏色的情形下,在按第二分辨率確定的顏色變化范圍內(nèi)抽取區(qū)域作為相同顏色的區(qū)域。
這樣,由于輸入圖象圖案的顏色是以基色的點的大小的組合表示的,故即使輸入圖象中表示為相同顏色的區(qū)域被檢測為與讀取分辨率相關(guān)的不同顏色的集合,當(dāng)讀取輸入圖象時,也可以精確抽取區(qū)域的相同顏色范圍。于是,能夠防止漏掉或丟失輸入圖象中表示為相同顏色圖案的部分。
本發(fā)明的一個方面是一種圖案抽取裝置,包括用于產(chǎn)生標(biāo)號圖象的包圍矩形的單元、用于從所抽取的包圍矩形抽取具有預(yù)定范圍內(nèi)的尺寸的包圍矩形的單元、用于在抽取的包圍矩形預(yù)定區(qū)域內(nèi)設(shè)定搜索區(qū)域的單元、以及用于設(shè)定在搜索區(qū)域中、或在搜索區(qū)域中局部配置的包圍矩形作為被抽出的包圍矩形待分類為組的選擇對象的單元。
這樣,在所產(chǎn)生的具有標(biāo)號圖象的包圍矩形中,成為用于設(shè)定搜索區(qū)域的參照的包圍矩形可被限制為預(yù)定尺寸的包圍矩形。這樣,當(dāng)從輸入圖象抽取字符區(qū)域時,能夠防止把諸如干擾這樣的小圖案及諸如背景或邊框這樣的大圖案的包圍矩形,選擇為用于搜索字符串的搜索區(qū)域的參照。于是,能夠抑制把非字符串的圖案分類為組。這樣,只有字符串被有效地抽取。
由于在所考慮的包圍矩形的預(yù)定范圍內(nèi)設(shè)定了用于搜索字符串的搜索區(qū)域,故只能夠搜索在所考慮的包圍矩形的鄰域中的字符串。當(dāng)從輸入圖象抽取標(biāo)題等時,能夠防止把與標(biāo)題相分離的以及不構(gòu)成標(biāo)題的字符串抽取為標(biāo)題組。這樣,只有標(biāo)題字符串可被有效地抽取。
本發(fā)明的一個方面是一種圖案抽取裝置,包括用于比較輸入圖象相鄰象素的顏色信息的第一顏色信息比較單元、用于對由第一顏色信息比較單元比較過的象素的顏色信息與同其相鄰的標(biāo)號圖象的顏色信息進(jìn)行比較的第二顏色信息比較單元、以及用于對應(yīng)于第一顏色信息比較單元的比較結(jié)果和第二顏色信息比較單元的比較結(jié)果為象素設(shè)定標(biāo)號的標(biāo)號單元。
這樣,在顏色逐漸變化的情形下,只有當(dāng)相鄰象素的顏色類似時,對這些象素設(shè)定相同的標(biāo)號。當(dāng)這些象素被追蹤時,色差積累。這樣,不同顏色的象素可能被設(shè)定相同的標(biāo)號。然而,根據(jù)本發(fā)明,由于能夠?qū)σ呀?jīng)設(shè)定了標(biāo)號的圖案的顏色信息進(jìn)行比較,標(biāo)號處理能夠?qū)?yīng)于色差的累計值進(jìn)行。這樣,當(dāng)為其顏色逐漸變化的區(qū)域設(shè)定對應(yīng)于相鄰象素的顏色信息的比較結(jié)果的標(biāo)號時,能夠防止對具有不同顏色的象素設(shè)定相同的標(biāo)號。
本發(fā)明的一個方面是一種圖案抽取裝置,包括用于計算以特定顏色表示的區(qū)域的相鄰象素之間的色差的色差計算單元、用于對應(yīng)于色差設(shè)定閾值的閾值設(shè)定單元、以及用于為與使用對應(yīng)于閾值的預(yù)定顏色表示的象素相鄰的象素設(shè)定標(biāo)號的標(biāo)號單元。
這樣,由于輸入圖象是通過半色調(diào)打印方法打印的,即使輸入圖象以相同顏色表示,也能依靠讀取分辨率將其檢測為不同顏色的集合。這種情形下,能夠精確地抽取相同顏色的區(qū)域。這樣,能夠防止圖案的一部分從輸入圖象中表示為相同顏色的區(qū)域漏掉或丟失。
本發(fā)明的一個方面是一種圖案抽取裝置,該裝置還包括具有基色網(wǎng)格的打印模型產(chǎn)生單元,基色點配置在網(wǎng)格的網(wǎng)格點處,網(wǎng)格被旋轉(zhuǎn)并彼此疊加,基色點的尺寸是變化的,以便產(chǎn)生作為打印模型的顏色。
這樣,由半色調(diào)打印方法產(chǎn)生的顏色在計算機上虛擬產(chǎn)生。無需使用實際打印文檔分析半色調(diào)打印方法的顏色變化,就能夠區(qū)分半色調(diào)打印方法產(chǎn)生的顏色變化。
本發(fā)明的一個方面是一種圖案抽取裝置,該裝置還包括用于產(chǎn)生色差表的色差表產(chǎn)生單元,色差表存儲由打印模型產(chǎn)生單元產(chǎn)生的顏色的亮度值以及對應(yīng)于打印模型每一讀取分辨率中的亮度值的相鄰象素之間的色差。
這樣,不論從實際打印文檔讀取數(shù)據(jù)的裝置的分辨率如何,都能夠易于獲得用來確定從實際打印文檔讀取的顏色是否相同的閾值。
本發(fā)明的一個方面是一種圖案抽取裝置,該裝置還包括模型分辨率的估計處理單元,用于對于輸入圖象估計打印圖案的讀取分辨率。
這樣,能夠使用在計算機上虛擬產(chǎn)生的打印模型處理由一裝置讀取的實際打印文檔。能夠使用以打印模型產(chǎn)生的一閾值對由一裝置讀取的實際打印文檔執(zhí)行標(biāo)號處理。
本發(fā)明的一個方面是一種圖案抽取裝置,其中模型分辨率估計處理單元估計一分辨率作為輸入圖象的打印模型的讀取分辨率,記錄在色差表中的該分辨率的顏色亮度值和色差對整個輸入圖象最優(yōu)確認(rèn)。
這樣,對于由裝置讀取的實際打印文檔,由打印模型產(chǎn)生的最優(yōu)閾值用于整個輸入圖象,以便進(jìn)行標(biāo)號處理。
本發(fā)明的一個方面是一種圖案抽取裝置,其中模型分辨率估計處理單元估計一分辨率作為輸入圖象的局部區(qū)域的打印模型的讀取分辨率,記錄在色差表中的該分辨率的顏色亮度值和色差對輸入圖象的該局部區(qū)域最優(yōu)確認(rèn)。
這樣,在由裝置從實際打印文檔讀取的輸入圖象中,對于超過整個輸入圖象的預(yù)定閾值的區(qū)域,能夠使用對該區(qū)域最優(yōu)的閾值對該區(qū)域執(zhí)行標(biāo)號處理。于是,能夠改進(jìn)標(biāo)號處理的精確性。
本發(fā)明的一個方面是一種圖案抽取裝置,其中模型分辨率估計處理單元使打印模型的讀取分辨率成為一固定值。
這樣,能夠省去實際打印文檔的模型分辨率估計處理。于是該處理能夠以高速進(jìn)行。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括用于對由標(biāo)號單元標(biāo)號的標(biāo)號圖象分類為組的分組單元。
這樣,通過標(biāo)號處理抽取的字符區(qū)域能夠分類為字符串區(qū)域。于是,能夠有效地抽取標(biāo)題。
本發(fā)明的一個方面是一種圖案抽取裝置,其中分組單元確定是否把標(biāo)號的圖象分類為對應(yīng)于標(biāo)號圖象包圍矩形的顏色信息和幾何信息的相同的組。
這樣,當(dāng)從輸入的彩色圖象抽取相同顏色的標(biāo)題區(qū)域時,從輸入的彩色圖象的限定區(qū)域抽取一圖案。與標(biāo)題區(qū)域相分離的圖案能夠從被分類的對象中除去。此外,可以從待處理的對象中略去非標(biāo)題字符的諸如干擾的小區(qū)域和諸如背景的大區(qū)域。于是,能夠改進(jìn)對于標(biāo)題區(qū)域抽取處理的速度。由于標(biāo)號的圖案由包圍矩形表示,故組成字符等的復(fù)雜圖案能夠以簡單的形狀表示。這樣,能夠降低用于圖案的存儲容量。此外,當(dāng)獲得了圖案的位置關(guān)系時,能夠簡化處理處理。
本發(fā)明的一個方面是一種圖案抽取裝置,其中顏色信息是包含在包圍矩形中的圖案的代表性顏色。
這樣,能夠把標(biāo)號的圖案作為包圍矩形。當(dāng)把圖案分類為對應(yīng)于顏色信息的組時,不必比較組成圖案的每一象素。這樣,由于能夠降低被比較的元素數(shù)目,故處理處理能夠以高速進(jìn)行。
本發(fā)明的一個方面是一種圖案抽取裝置,其中幾何信息是出現(xiàn)在所考慮的包圍矩形的預(yù)定范圍中的另一包圍矩形。
這樣,當(dāng)從輸入圖象抽取標(biāo)題區(qū)域等時,能夠把要被分類為一組的包圍矩形的范圍限定為適合于標(biāo)題區(qū)域的范圍。對于從標(biāo)題區(qū)域伸出的區(qū)域可以省去分組處理。這樣處理處理能夠以高速進(jìn)行。
本發(fā)明的一個方面是一種圖案抽取裝置,其中幾何信息計算單元具有用于存儲對應(yīng)于每一包圍矩形的垂直和水平坐標(biāo)的矩形號碼的矩形號碼存儲單元、用于抽取包含在所考慮的包圍矩形的預(yù)定范圍內(nèi)每一垂直和水平坐標(biāo)中的矩形號碼的矩形號碼抽取單元、以及相鄰矩形抽取單元,用于抽取作為所考慮的包圍矩形預(yù)定范圍內(nèi)另一矩形包含在垂直和水平坐標(biāo)兩者內(nèi)的矩形號碼。
這樣,能夠有效地搜索所考慮的包圍矩形預(yù)定范圍內(nèi)的另一包圍矩形。
本發(fā)明的一個方面是一種圖案抽取裝置,其中矩形號碼存儲單元按坐標(biāo)值順序存儲包圍矩形的矩形號碼,且其中矩形號碼抽取單元按坐標(biāo)值升序搜索矩形號碼并抽取每一坐標(biāo)值中的矩形號碼。
這樣,當(dāng)為每一坐標(biāo)值準(zhǔn)備用于存儲包圍矩形的矩形號碼的區(qū)域時,則需要對應(yīng)于預(yù)期出現(xiàn)在所考慮的包圍矩形的預(yù)定范圍內(nèi)的包圍矩形的存儲容量。反之,根據(jù)本發(fā)明,由于存儲了對應(yīng)于實際包圍矩形的坐標(biāo)值,故能夠降低存儲量。
本發(fā)明的一個方面是一種圖案抽取裝置,其中當(dāng)兩個包圍矩形出現(xiàn)在所考慮的包圍矩形的預(yù)定范圍內(nèi),且兩個包圍矩形的代表性元素的色差小于從色差表獲得的色差時,確定單元把兩個包圍矩形分類為相同組。
這樣,當(dāng)從輸入圖象抽取標(biāo)題區(qū)域等時,能夠把待分類的包圍矩形的范圍限制為適合于標(biāo)題區(qū)域的范圍。當(dāng)對包圍矩形進(jìn)行比較并使用顏色信息把圖案分類為一組時,能夠考慮到實際打印文件的讀操作中顏色的變化。這樣,處理處理能夠以高速進(jìn)行。此外,改進(jìn)了讀取的精確性。
本發(fā)明的一個方面是一種圖案抽取裝置,其中分組單元把標(biāo)號圖象分類為對應(yīng)于標(biāo)號圖象圖案粗度的一組。這樣,由于能夠把不同粗度的字符分類為不同的組,當(dāng)從輸入圖象抽取標(biāo)題等時,只有以具有相同粗度的字符組成的字符串能夠被抽取為標(biāo)題。這樣,能夠改進(jìn)抽取標(biāo)題的精確性。
本發(fā)明的一個方面是一種圖案抽取裝置,其中分組單元具有用于獲得圖案輪廓長度的輪廓追蹤單元、用于獲得圖案區(qū)域的區(qū)域計算單元、以及用于獲得對應(yīng)于圖案區(qū)域與圖案輪廓長度之比的圖案粗度的粗度計算單元。
這樣,能夠精確地獲得圖案的粗度。
本發(fā)明的一個方面是一種圖案抽取裝置,其中輪廓追蹤單元以作為圖案輪廓的第一象素搜索作為圖案輪廓的第二象素,其搜索方式是,第二象素從與第一象素相鄰并與第一象素的源象素相鄰的八個象素中搜索。
這樣,為了從變?yōu)閳D案輪廓的第一象素搜索變?yōu)閳D案輪廓的第二象素,在預(yù)定的方向搜索與第一象素相鄰的八個象素。當(dāng)其象素的級別從背景級別變?yōu)閳D案級別的點為第二象素時,能夠防止已經(jīng)抽取的第一象素再次作為輪廓的圖案點被抽取。這樣,能夠提高輪廓追蹤處理的速度。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括用于估計對應(yīng)于分類為一組的包圍矩形尺寸的字符尺寸的字符尺寸估計單元、以及用于從包圍矩形組中刪除超出字符尺寸預(yù)定范圍的包圍矩形的矩形刪除單元。
這樣,即使圖片的圖案等出現(xiàn)在標(biāo)題鄰域內(nèi),且圖片的圖案被分類為構(gòu)成標(biāo)題的字符組,也能夠把圖片的該圖案從組中除去。這樣,能夠改進(jìn)抽取標(biāo)題的精確性。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括字符串方向估計單元,該單元用于對應(yīng)于由分組單元分類為一組的包圍矩形的配置估計字符串的方向,以及字符串抽取單元,該單元用于對應(yīng)于由分組單元分類為一組的包圍矩形的配置抽取字符串。
這樣,能夠區(qū)分其包圍矩形不規(guī)則配置的區(qū)域和其包圍矩形規(guī)則配置的區(qū)域。這樣,能夠把其包圍矩形規(guī)則配置的區(qū)域作為標(biāo)題區(qū)域處理。這樣,只能夠有效抽取標(biāo)題區(qū)域。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括再分組單元,用于對應(yīng)于分類為一組的包圍矩形的尺寸把一組中的包圍矩形再分組。
這樣,不同尺寸的字符能夠分類為不同的組。因而,當(dāng)從輸入圖象抽取標(biāo)題等時,只有由相同尺寸的字符組成的字符串能夠作為一個標(biāo)題處理。這樣,能夠改進(jìn)對標(biāo)題的抽取精確性。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括用于從由分組單元分類為一組的包圍矩形中抽取預(yù)定尺寸的包圍矩形的包圍矩形抽取單元、用于為被抽取為相鄰包圍矩形且其上邊緣或下邊緣封閉的包圍矩形設(shè)定水平配置標(biāo)記的水平配置標(biāo)記設(shè)定單元、用于為被抽取為相鄰包圍矩形且其左邊緣或右邊緣封閉的包圍矩形設(shè)定垂直配置標(biāo)記的垂直配置標(biāo)記設(shè)定單元、用于確定對應(yīng)于水平配置標(biāo)記和垂直配置標(biāo)記的組的字符串方向的字符串方向確定單元、以及字符串確定單元,用于對應(yīng)于分組的包圍矩形數(shù)與對應(yīng)于確定了字符串方向的標(biāo)記數(shù)的比率,確定分組的包圍矩形是否為字符串包圍矩形。
這樣,能夠確定一組中的包圍矩形是否配置在一行。配置在一行中的一組包圍矩形能夠作為一個標(biāo)題區(qū)域處理。這樣,能夠從輸入圖象有效地抽取標(biāo)題。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括用于產(chǎn)生由分組單元分類為一組的包圍矩形的包圍矩形產(chǎn)生單元、以及用于計算對應(yīng)于由分組單元分類為組的圖案的代表性顏色的組的代表作顏色的代表性顏色計算單元。
這樣,對應(yīng)于標(biāo)題區(qū)域的所有顏色,能夠計算標(biāo)題的顏色。能夠減輕色差在標(biāo)題區(qū)域的局部區(qū)域中的影響。因而,能夠改進(jìn)標(biāo)題區(qū)域的抽取精確性。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括用于組合對應(yīng)于組的代表性顏色的組的相鄰包圍矩形的分組組合單元。
這樣,即使由于輕微的色差組成同一標(biāo)題的字符被分類為不同的組,但這些字符能夠分類為相同的組。這樣,就能夠有效地抽取標(biāo)題區(qū)域。
本發(fā)明的一個方面是一種圖案抽取裝置,其中當(dāng)相鄰的包圍矩形在預(yù)定的范圍且組的代表性顏色的差別在預(yù)定范圍時,分組組合單元組合分組的相鄰包圍矩形。
這樣,當(dāng)組合分組的包圍矩形時,只能有效地組合組成同一標(biāo)題的字符。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括用于對應(yīng)于分組的代表性顏色在分組的包圍矩形范圍內(nèi)再抽取原始圖象的象素的再抽取裝置。
這樣,即使組成標(biāo)題的字符包含濁音符號或半濁音符號且由于標(biāo)題區(qū)域的局部色差濁音符號或半濁音符號從標(biāo)題的分組中漏掉,能夠?qū)嵋舴柣虬霛嵋舴柕念伾c整個標(biāo)題區(qū)域的顏色進(jìn)行比較,以便再抽取濁音符號或半濁音符號。于是,能夠改進(jìn)對標(biāo)題的抽取精確性。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括用于對已經(jīng)抽取的象素數(shù)字化的數(shù)字化單元、用于為數(shù)字化的圖象設(shè)定標(biāo)號的第二標(biāo)號單元、以及用于把已經(jīng)由第二標(biāo)號單元設(shè)定了標(biāo)號且大于預(yù)定閾值的包圍矩形添加到分組的添加單元。
這樣,當(dāng)從標(biāo)題區(qū)域再抽取濁音符號或半濁音符號時,即使與標(biāo)題相同顏色的細(xì)小的干擾出現(xiàn)在標(biāo)題區(qū)域,只能把干擾刪除。于是,能夠改進(jìn)對標(biāo)題的抽取精確性。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括用于對應(yīng)于分類為組的包圍矩形的區(qū)域、其位置、及它們的位置關(guān)系確定分組中圖案的輸出順序的輸出順序確定單元。
這樣,即使從輸入圖象抽取多個標(biāo)題選擇對象,也可以評估標(biāo)題的似然性。于是,能夠按標(biāo)題的最大似然性的順序輸出標(biāo)題選擇對象。
本發(fā)明的一個方面是一種圖案抽取裝置,還包括用于產(chǎn)生對其包圍矩形分類為組的標(biāo)號圖象設(shè)定了級別1的二進(jìn)制圖案的二進(jìn)制圖案產(chǎn)生單元。
這樣,能夠使用標(biāo)以顏色信息的標(biāo)號圖象產(chǎn)生二進(jìn)制圖象。于是,能夠有效地識別從彩色圖象抽取的圖案。
借助于如附圖中所示其最佳圖案實施例的以下詳細(xì)說明,本發(fā)明的這些和其它目的、特點和優(yōu)點將更為明顯。
圖1是表示用于產(chǎn)生傳統(tǒng)顏色分離圖象方法的示意圖;圖2是表示傳統(tǒng)區(qū)域擴展方法的示意圖;圖3是表示根據(jù)本發(fā)明第一實施例的圖案抽取裝置的結(jié)構(gòu)框圖;圖4是表示根據(jù)本發(fā)明第二實施例的圖案抽取裝置的結(jié)構(gòu)框圖;圖5是表示根據(jù)本發(fā)明第三實施例的圖案抽取裝置的結(jié)構(gòu)框圖;圖6是表示根據(jù)本發(fā)明第四實施例的圖案抽取裝置的結(jié)構(gòu)框圖;圖7是表示根據(jù)本發(fā)明的一實施例的圖案抽取裝置的系統(tǒng)結(jié)構(gòu)框圖;圖8是表示根據(jù)本發(fā)明第五實施例的圖案抽取裝置的結(jié)構(gòu)框圖;圖9是表示根據(jù)本發(fā)明第六實施例的圖案抽取裝置的結(jié)構(gòu)框圖;圖10是表示圖9中所示圖案抽取裝置的操作的流程圖;圖11A和11B是用于解釋規(guī)根據(jù)本發(fā)明的一個實施例縮小圖象產(chǎn)生方法的示意圖;圖12A和12B是用于解釋規(guī)根據(jù)本發(fā)明的一個實施例標(biāo)號方法的示意圖;圖13A和13B是表示根據(jù)本發(fā)明一個實施例的閾值參照表的結(jié)構(gòu)一例的示意圖;圖14是表示根據(jù)本發(fā)明一個實施例的閾值參照表的結(jié)構(gòu)另一例的示意圖15A、15B和15C是用于解釋根據(jù)本發(fā)明的一個實施例的包圍矩形產(chǎn)生處理和原始圖象標(biāo)號設(shè)定處理的示意圖;圖16A和16B是用于解釋半色調(diào)打印方法中彩色圖象表示方法的示意圖;圖17是表示半色調(diào)打印方法中彩色圖象的放大圖示;圖18A是表示通過半色調(diào)打印方法以單色打印的區(qū)域的示意圖;圖18B是表示圖18A中所示區(qū)域中讀取網(wǎng)格的示意圖;圖18C是表示個別象素讀結(jié)果的示意圖;圖19A到19D是表示根據(jù)本發(fā)明一實施例打印模型產(chǎn)生方法的示意圖;圖20是表示根據(jù)本發(fā)明一實施例色差表結(jié)構(gòu)的示意圖;圖21是表示根據(jù)本發(fā)明的一實施例色差表產(chǎn)生裝置結(jié)構(gòu)的框圖;圖22是表示根據(jù)本發(fā)明的第七實施例圖案抽取裝置結(jié)構(gòu)的框圖;圖23是表示圖9中所示圖案抽取裝置的操作的流程圖;圖24是用于解釋根據(jù)本發(fā)明的一實施例模型分辨率估計處理的示意圖;圖25是用于解釋根據(jù)本發(fā)明的一實施例顏色標(biāo)號處理的示意圖;圖26是用于解釋根據(jù)本發(fā)明的一實施例對于所考慮的矩形的鄰域中搜索范圍設(shè)定方法的示意圖;圖27是用于解釋根據(jù)本發(fā)明的一實施例所考慮的矩形鄰域中搜索范圍內(nèi)矩形抽取方法的示意圖;圖28A、28B和28C是用于說明根據(jù)本發(fā)明的一實施例所考慮的矩形鄰域中搜索范圍內(nèi)矩形信息存儲方法的示意圖;圖29A和29B是用于說明根據(jù)本發(fā)明的一實施例字符線粗度計算方法的示意圖;圖30是用于說明根據(jù)本發(fā)明的一實施例對應(yīng)于字符線粗度再分組處理的示意圖;圖31A、31B、31C和31D是用于說明根據(jù)本發(fā)明的一實施例在輪廓跟蹤處理中象素搜索開始點的設(shè)定方法的示意圖;圖32是表示根據(jù)本發(fā)明的一實施例從當(dāng)前象素所看到的方向代碼的示意圖;圖33A和33B用于說明根據(jù)本發(fā)明的一實施例從一個分組刪除大矩形的處理的示意圖;圖34A和34B用于說明根據(jù)本發(fā)明的一實施例用于計算矩形高度最大頻率值的方法的示意圖;圖35A和35B用于說明根據(jù)本發(fā)明的一實施例用于組合分組中重疊矩形的處理的示意圖;圖36A和36B用于說明根據(jù)本發(fā)明的一實施例用于從一分組中抽取字符串的處理的示意圖;圖37A和37B用于說明根據(jù)本發(fā)明的一實施例用于組合字符串的分離字符處理的示意圖;圖38A和38B用于說明根據(jù)本發(fā)明的一實施例對應(yīng)于分組中字符的尺寸再分組處理的示意圖;圖39A和39B用于說明根據(jù)本發(fā)明的一實施例分組的組合處理的示意圖;圖40A和40B用于說明根據(jù)本發(fā)明的一實施例對作為字符串似然的矩形和分組的抽取處理的示意圖;圖41用于說明根據(jù)本發(fā)明的一實施例對干擾分組刪除處理的示意圖;圖42A和42B用于說明根據(jù)本發(fā)明的一實施例用于從分組抽取相同顏色圖案的處理的示意圖;圖43A是表示根據(jù)本發(fā)明的一實施例原始圖象的示意圖;圖43B是表示圖43A的標(biāo)號圖象的示意圖;圖43C是表示圖43B所示標(biāo)號圖象中設(shè)定的所考慮的矩形的示意圖;圖43D是表示分組抽取結(jié)果的示意圖;圖44A是表示圖43D中所示分組抽取結(jié)果以字符線的粗度被再分組的結(jié)果的示意圖;圖44B是表示圖44A中所示重疊矩形被組合的結(jié)果的示意圖;圖44C是表示從圖44B中所示的圖象抽取作為字符串似然的矩形和分組的結(jié)果的示意圖;圖44D是表示從圖44C所示的圖象抽取分組中的圖案的結(jié)果的示意圖;圖45A是表示從圖43A所示的圖象抽取的標(biāo)題的第一可替代圖案的示意圖;以及圖45B是表示從圖43A所示的圖象抽取的標(biāo)題的第二可替代圖案的示意圖。
以下將參照
根據(jù)本發(fā)明的一實施例的圖案抽取裝置。
圖3是表示根據(jù)本發(fā)明的第一實施例的圖案抽取裝置的結(jié)構(gòu)的框圖。圖3中,顏色信息計算單元1計算輸入圖象的圖案的顏色信息。幾何信息計算單元2計算輸入圖象的圖案的幾何信息。對應(yīng)于由顏色信息計算單元1計算的顏色信息和由幾何信息計算單元2計算的幾何信息,分類單元3對輸入圖象的圖案進(jìn)行分類。例如顏色信息是在彩色空間中圖案的顏色。幾何信息例如是特定圖案的尺寸、特定圖案在輸入圖象中的位置、或特定圖案與其它圖案位置之間的關(guān)系。
當(dāng)輸入圖象的圖案被分類時,圖案的幾何信息也與其顏色信息一同被使用。這樣,在從彩色輸入圖象抽取具有相同顏色的標(biāo)題區(qū)域的情形下,在彩色輸入圖象被限制的范圍中,相同顏色和不同標(biāo)號的圖案能夠被分類為一組。特定位置的圖案或特定尺寸的圖案,即使對它們設(shè)定了不同的標(biāo)號,也可能被分類為一組。
這樣,只有在標(biāo)題區(qū)域以高概率出現(xiàn)的區(qū)域的范圍內(nèi),能夠進(jìn)行標(biāo)號處理。此外,諸如干擾等不是標(biāo)題區(qū)域的小圖案以及諸如背景等大圖案可以從被處理的對象中除去。這樣,能夠改進(jìn)對標(biāo)題區(qū)域抽取處理的速度。此外,能夠降低非標(biāo)題區(qū)域的顏色的影響。于是,能夠改進(jìn)標(biāo)題區(qū)域抽取的精確性。
圖4是表示根據(jù)本發(fā)明的第二實施例圖案抽取裝置的結(jié)構(gòu)的框圖。
圖4中,聚類單元11對應(yīng)于相鄰象素的顏色信息對輸入圖象的象素進(jìn)行聚類。對應(yīng)于通過聚類單元11所獲得的每一集群的顏色信息和幾何信息,分組單元12對集群進(jìn)行分組。
于是,當(dāng)對輸入圖象的象素進(jìn)行聚類時,對所考慮的象素的顏色信息與每一相鄰象素的顏色信息進(jìn)行比較。這樣,就不必對輸入圖象的所有象素的顏色信息進(jìn)行比較。
當(dāng)對輸入圖象的所有象素的顏色信息彼此進(jìn)行比較時,每一象素顏色信息的比較處理的次數(shù)數(shù)量達(dá)輸入圖象的象素數(shù)的平方。反之,當(dāng)特定象素的顏色信息與每一相鄰象素的顏色信息進(jìn)行比較時,每一象素顏色信息的比較處理次數(shù)變?yōu)檩斎雸D象的象素數(shù)。這樣,能夠以高速進(jìn)行聚類處理。
當(dāng)聚類的象素被分組時,同一集群中的象素能夠被整體處理。這樣,就不必處理個別象素。于是,能夠以高速進(jìn)行分組處理。此外,集群的象素能夠在輸入圖象的限制范圍內(nèi)被分組。而且,作為干擾的小圖案能夠在分組處理中被排除。這樣,能夠以很高速度進(jìn)行分組處理。特別地,當(dāng)標(biāo)號的數(shù)目如彩色圖象這樣大時,能夠獲得顯著的效果。
圖5是表示根據(jù)本發(fā)明的第三實施例圖案抽取裝置的結(jié)構(gòu)的框圖。
圖5中,色差計算單元21計算在由預(yù)定顏色表示的一區(qū)域中相鄰象素的色差。對應(yīng)于由色差計算單元21所計算的色差,閾值設(shè)定單元22設(shè)定一閾值。對應(yīng)于由閾值設(shè)定單元22所設(shè)定的閾值,標(biāo)號單元23對與由預(yù)定顏色表示的象素相鄰的象素進(jìn)行標(biāo)號。
假設(shè)輸入圖象是從通過半色調(diào)打印方法打印的文檔獲得的,并假設(shè)輸入圖象的圖案顏色是以基色點的尺寸的組合表示的。由于基色點的尺寸很小,當(dāng)一種顏色以基色點的尺寸的組合表示時,即使點的色差不能由肉眼區(qū)分,并被看作為單獨一個點,當(dāng)裝置的讀取分辨率很高而使得每一點的顏色能夠被區(qū)分時,被肉眼看作為單色的區(qū)域可能被裝置確定為非單色區(qū)域。
這樣,當(dāng)對裝置的讀取結(jié)果進(jìn)行標(biāo)號時,被肉眼看作為單色的圖案被設(shè)定不同的標(biāo)號。當(dāng)對應(yīng)于不同的標(biāo)號所抽取的圖案由肉眼觀看時,在以肉眼識別為一圖案的區(qū)域中出現(xiàn)孔洞或斷開。這樣,圖案抽取精確性變壞。
為了避免這種問題,對于以肉眼看作為單色的區(qū)域,獲取由裝置讀取的顏色的變化。對顏色變化的范圍中的象素設(shè)定相同的標(biāo)號。這樣,能夠?qū)τ扇庋劭醋鳛閱紊囊粓D案設(shè)定相同的標(biāo)號。于是,能夠避免在由肉眼看作為一個圖案的區(qū)域中出現(xiàn)孔洞或斷開。
圖6是表示根據(jù)本發(fā)明第四實施例圖案抽取裝置的結(jié)構(gòu)的框圖。
圖6中,第一顏色信息比較單元31比較輸入圖象相鄰象素的顏色信息。第二顏色信息比較單元32對由第一顏色信息比較單元31比較過的象素的顏色信息及與該象素相鄰的標(biāo)號圖象的顏色信息進(jìn)行比較。對應(yīng)于第一顏色信息比較單元31的比較結(jié)果和第二顏色信息比較單元32的比較結(jié)果,標(biāo)號單元33對象素進(jìn)行標(biāo)號。標(biāo)號圖象的顏色信息例如是有相同標(biāo)號的象素的顏色信息的平均值。
假設(shè)輸入圖象標(biāo)題區(qū)域的顏色是逐漸變化的,從而標(biāo)題的字符串及其背景的邊界不清晰。這種情形下,如果比較相鄰象素的顏色信息,由于相鄰象素顏色的相似,故這些象素被設(shè)定相同的標(biāo)號。當(dāng)這些象素被順序地跟蹤時,在標(biāo)題區(qū)域讀取了背景圖案。這樣,來自標(biāo)題的不同顏色的象素可能被設(shè)定相同的標(biāo)號。
不是比較相鄰象素的顏色信息,而是對標(biāo)號圖案的顏色信息與每一象素的顏色信息進(jìn)行比較。此外,對象素設(shè)定標(biāo)號。這樣,即使顏色逐漸變化,也能夠檢測出標(biāo)題區(qū)域和背景之間的邊界。
圖7是表示根據(jù)本發(fā)明的一個實施例圖案抽取裝置的系統(tǒng)結(jié)構(gòu)的框圖。
圖7中,圖案抽取裝置包括中央處理器(CPU)41、只讀存儲器(ROM)42、隨機存取存儲器(RAM)43、通信接口44、通信網(wǎng)絡(luò)45、總線46、輸入/輸出接口47、顯示諸如標(biāo)題字符串等識別結(jié)果的顯示單元48、打印諸如標(biāo)題字符串等識別結(jié)果的打印機49、暫時存儲由掃描儀51等讀取的數(shù)據(jù)的存儲器50、讀取輸入圖象等的掃描儀51、鍵盤52、驅(qū)動存儲介質(zhì)的驅(qū)動器53、硬盤54、IC存儲卡55、磁帶56、軟盤57、及光盤58(諸如CD-ROM或DVD-ROM)。
引起系統(tǒng)執(zhí)行圖案抽取處理的程序存儲在諸如硬盤54、IC存儲卡55、磁帶56、軟盤57、或光盤58等存儲介質(zhì)中。當(dāng)系統(tǒng)從這種存儲介質(zhì)把用于圖案抽取處理的程序讀取到RAM43時,系統(tǒng)執(zhí)行圖案抽取處理。用于圖案抽取處理的程序可存儲在ROM42中。
可以從通信網(wǎng)絡(luò)45通過通信接口44獲得用于圖案抽取處理的程序。連接到通信接口44的通信網(wǎng)絡(luò)45的例子有LAN(局域網(wǎng))、WAN(廣域網(wǎng))、因特網(wǎng)、模擬電話網(wǎng)、數(shù)字電話網(wǎng)(ISDN綜合業(yè)務(wù)數(shù)字網(wǎng))、PHS(個人便用系統(tǒng))、及無線通信網(wǎng)(諸如衛(wèi)星通信)。
當(dāng)用于圖案抽取處理的程序啟動時,CPU41設(shè)定一閾值,由掃描儀51讀取的輸入圖象標(biāo)以該閾值,并產(chǎn)生對應(yīng)于由掃描儀51讀取的輸入圖象的標(biāo)號圖象。在產(chǎn)生了標(biāo)號圖象之后,CPU41產(chǎn)生對應(yīng)于其標(biāo)號的輸入圖象的圖案的包圍矩形。對應(yīng)于其區(qū)域中的顏色信息及其幾何信息CPU41對包圍矩形進(jìn)行分組。對應(yīng)于被分組的包圍矩形的配置狀態(tài)和尺寸,CPU41抽取標(biāo)題區(qū)域等。當(dāng)CPU41抽取標(biāo)題區(qū)域時,它向顯示單元48和打印機49輸出標(biāo)題區(qū)域中的圖案作為從輸入圖象抽取的標(biāo)題。CPU41識別標(biāo)題區(qū)域中的圖案的字符,并自動檢索對應(yīng)于識別結(jié)果的文檔。
圖8是表示根據(jù)本發(fā)明的第五實施例的圖案抽取裝置結(jié)構(gòu)的框圖。
圖8中,圖案抽取裝置包括彩色圖象輸入單元61、外部輸出單元62、存儲器63、中央處理器(CPU)64、圖象縮小單元65、可變閾值設(shè)定單元66、及標(biāo)號單元67。
當(dāng)圖象縮小單元65從彩色圖象輸入單元61輸入一彩色圖象的信號時,圖象縮小單元65產(chǎn)生一縮小圖象,其原始圖象象素數(shù)降低到1/9倍。標(biāo)號單元67使用諸如區(qū)域擴展方法的技術(shù)對縮小圖象標(biāo)以某種程度的色差,并獲得表示相同標(biāo)號區(qū)域的標(biāo)號圖象和圍繞同一標(biāo)號區(qū)域的包圍矩形。
這里,作為相鄰象素具有相同標(biāo)號的色差值的閾值不是固定的(與區(qū)域擴張方法不同),而是依賴于相關(guān)顏色可變的。閾值是對應(yīng)于相關(guān)顏色通過可變閾值設(shè)定單元66獲得的。可變閾值設(shè)定單元66參照對應(yīng)于相關(guān)顏色的特定的表格。
從縮小圖象搜索表示具有相同標(biāo)號的區(qū)域的顏色的所有數(shù)字串如(R,G,B)。所獲得的數(shù)字串作為標(biāo)號的屬性存儲。此外,標(biāo)號的代表性顏色是對應(yīng)于各顏色獲得的。
然后,從縮小圖象獲得的包圍矩形反映給原始圖象。只掃描矩形的內(nèi)部以檢測與代表性顏色相似的顏色。對與相關(guān)象素相鄰的象素設(shè)定標(biāo)號。這種情形下,當(dāng)作相同顏色的各顏色是已經(jīng)由上述處理作為相同顏色處理的那些顏色。
從原始圖象獲得的標(biāo)號圖象抽取預(yù)定的區(qū)域。當(dāng)從彩色文檔抽取諸如由大字符或關(guān)鍵字組成的標(biāo)題的字符區(qū)域時,使用字符串抽取技術(shù)對應(yīng)于包圍矩形的尺寸和配置信息只抽取相關(guān)字符串區(qū)域。
圖9是表示根據(jù)本發(fā)明第六實施例的圖案抽取裝置的結(jié)構(gòu)的框圖。
圖9中,圖案抽取裝置包括彩色圖象輸入單元71、外部輸出單元72、存儲器73、及中央處理器74。
彩色圖象輸入單元71輸入外部彩色圖象作為RGB信號。彩色圖象輸入單元71的例子有CCD相機或掃描儀。
外部輸出單元72輸出由中央處理器74處理的各種結(jié)果。外部輸出單元72的例子有顯示單元。
存儲器73存儲圖象信息和閾值信息。例如,存儲器73存儲從彩色圖象輸入單元71輸入的彩色圖象信號及由中央處理器74對存儲的彩色圖象信號處理的結(jié)果。
中央處理器74產(chǎn)生對應(yīng)于從彩色圖象輸入單元71輸入的彩色圖象信號的縮小圖象,并執(zhí)行各種處理,諸如標(biāo)號處理和特定的區(qū)域抽取處理。中央處理器74包括圖象縮小單元75、可變閾值設(shè)定單元76、標(biāo)號單元77、包圍矩形處理78、原始圖象標(biāo)號單元79、及特定區(qū)域抽取單元80。
圖10是表示圖7中所示彩色圖象處理裝置的操作的流程圖。
圖10中,諸如彩色文檔等對象由諸如CCD相機或掃描儀等攝相單元這樣的彩色圖象單元71輸入。被攝相的彩色圖象存儲在存儲器73中(步驟S1)。
然后,圖象縮小單元75對存儲在存儲器73中的彩色圖象,以固定的縮小比率或所希望獲得的圖象尺寸的特定縮小比率進(jìn)行縮小。被縮小的圖象存儲在存儲器73中(步驟S2)??s小比率也被存儲。作為縮小方法,如圖111A所示,當(dāng)彩色圖象被縮小到1/3倍時,由(R,G,B)表示的原始圖象的區(qū)域(3×3)設(shè)定為縮小圖象(1×1)。這種情形下,以原始圖象的區(qū)域(3×3)的九個象素的顏色的(R,G,B),產(chǎn)生一圖11B所示的直方圖。把最頻值設(shè)定為縮小圖象的相關(guān)象素值。
如果有多個值作為最頻值,對應(yīng)于預(yù)定算法選擇多個值之一作為縮小圖象相關(guān)象素值。
一般來說,當(dāng)設(shè)定原始圖象的區(qū)域(n×n)為縮小圖象(1×1)時(即原始圖象被縮小為1/n倍),則以原始圖象的區(qū)域(n×n)的象素的顏色的(R,G,B)產(chǎn)生一直方圖。例如,直方圖的中間值或最頻值用作為縮小圖象的相關(guān)象素值。
設(shè)定給縮小圖象的值不是諸如原始圖象的區(qū)域(n×n)象素顏色的平均值這樣的生成值,而是原始圖象的一個值。
然后,標(biāo)號單元77對縮小圖象進(jìn)行標(biāo)號處理。即,標(biāo)號單元77對具有與縮小圖象具有類似顏色的相鄰象素設(shè)定相同的標(biāo)號(在步驟S3)。換言之,標(biāo)號單元77對縮小圖象從左上位置進(jìn)行光柵掃描,并對非標(biāo)號象素設(shè)定一最大標(biāo)號值加1的標(biāo)號值。
例如,圖12A所示,假設(shè)所考慮的象素C的色值為(Rc,Gc,Bc),所考慮的象素C的八個相鄰象素以1到8標(biāo)記,,且八個相鄰象素的色值標(biāo)以(Ri,Gi,Bi)(其中i=1到8),則獲得這些象素的色值(Ri,Gi,Bi)。換言之,獲得象素1,2,…8的色值(R1,G1,B1)、(R2,G2,B2),…(R8,G8,B8)。
獲得所考慮的象素的色值(Rc,Gc,Bc)和每一相鄰象素的色值(Ri,Gi,Bi)之間的距離dci(其中i=1到8)。當(dāng)對于(R,G,B)的距離dci小于閾值(Rth,Gth,Bth)時,對相關(guān)的象素分配與所考慮的象素相同的標(biāo)號。例如,當(dāng)獲得了象素1與所考慮的象素C之間的距離dc1時,分別確定象素1的R,G,B是否小于Rth,Gth,Bth。當(dāng)三個顏色的值小于三色的閾值(即,象素1的顏色所考慮的象素C的顏色)時,為距離dci設(shè)定小的值,以便為象素i設(shè)定與C相同的級別。然而,當(dāng)象素1的三色至少之一大于三色的閾值時,則為距離dc1設(shè)定大的值(大于閾值th),以便設(shè)定不同于所考慮的象素C的一標(biāo)號。距離dc1是通過如下獲得的。
dc1=|Rc-R1|<Rth且|Gc-G1|<Gth以及|Bc-B1|<Bth……(1)當(dāng)公式(1)被滿足時,作為dc1=0而設(shè)定相同的標(biāo)號。當(dāng)公式(1)不滿足時,作為dc1=1000設(shè)定大于閾值的一個值。一般來說,如圖12B所示,距離dci(這里i=1到8)可以由以下公式表示。
如果|Rc-Ri|<Rth且|Gc-Gi|<Gth以及|Bc-Bi|<Bth,則為0否則為1000
注意,設(shè)定的值不限于1000。而是可以使用任何大于閾值的值。
從與輸入單元(諸如CCD相機或掃描儀)和對象相關(guān)的樣本所獲得的表格而獲取三色的閾值(Rth,Gth,Bth)。此外,使用所考慮的象素的色值(R,G,B)的關(guān)鍵值,對應(yīng)于它們預(yù)先設(shè)定閾值。
例如,如圖13A所示,參照具有輸入圖象可預(yù)測的所考慮象素色值(R,G,B)的所有組合項的表格,獲得三色的閾值(Rth,Gth,Bth)。在圖13A所示的表中,當(dāng)所考慮的象素的色為值(R1,G1,B1)時,R,G,B的閾值為(Rth1,Gth1,Bth1)。當(dāng)所考慮的象素的色值為值(R2,G2,B2)時,其閾值為(Rth2,Gth2,Bth2)。
在圖13A所示的情形下,使用了閾值的參照表。閾值的參照表具有從樣本分布預(yù)測的所考慮象素的所有色值的組合關(guān)鍵項。使用所考慮象素的顏色組合,參照閾值參照表。這樣,表的大小取決于各個顏色的組合數(shù)。換言之,表的大小可以很大。
為了防止閾值參照表變大,可以使用只有以(R,G,B)聚類的代表性項的表。這種情形下,就獲得了所考慮的象素的色值與代表性項的色值之間的距離值(換言之,獲得了所考慮的象素與代表性項之間的相似性)。抽取最近的代表性項。使用最近的代表性項的關(guān)鍵字,能夠獲得三色的閾值(Rth,Gth,Bth)。
另外,為了防止閾值參照表變大,以N個級別表示各顏色的值(例如,N=256)。為各個顏色準(zhǔn)備好閾值參照表。從各個閾值參照表獲得各個顏色的閾值。這種情形下,閾值參照表的大小變?yōu)?56×3項這樣小。例如,當(dāng)所考慮的象素的色值為(R1,G2,B2)時,如圖13B所示,作為對于R1的閾值,參照閾值參照表R從而獲得Rth1。作為對于G2的閾值,參照閾值參照表G從而獲得Gth2。作為對于B2的閾值,參照閾值參照表B從而獲得Bth2。
作為用于獲得閾值的閾值參照表的格式,如圖14所示,把色值分類為多個組,并對每一組獲得閾值,而不是如圖13A所示所有的(R,G,B)的組合。圖14中,一個閾值設(shè)定給每種顏色的各四個值。對R1到R4設(shè)定相同的閾值Rt1。對R5到R8設(shè)定相同的閾值Rt2。類似地,對G1到G4設(shè)定相同的閾值Gth1。對BN-3到BN設(shè)定相同的閾值BtM。
當(dāng)對象是打印文檔且由掃描儀輸入時,這種閾值參照表能夠使用打印文檔的模型自動產(chǎn)生。
然后,包圍矩形處理單元78對作過標(biāo)號的縮小圖象(即標(biāo)號圖象)執(zhí)行包圍矩形處理處理(在步驟S4)。換言之,在步驟S3,作為對縮小圖象的標(biāo)號處理的結(jié)果,對相同的區(qū)域設(shè)定了相同的標(biāo)號值。對于相同的區(qū)域,獲得一包圍矩形。
例如,如圖15A所示,當(dāng)彩色圖象具有字符區(qū)域93到95和另外的區(qū)域92時(字符區(qū)域93到95的顏色與區(qū)域92的顏色不同),產(chǎn)生了如圖15B所示的縮小標(biāo)號圖象96。這樣,使用縮小的標(biāo)號圖象96,能夠獲得包圍矩形98到100。
圖15B中,矩形區(qū)域97對應(yīng)于圖15A中所示的背景區(qū)域92。矩形區(qū)域98到100分別對應(yīng)于圖15A中所示的字符區(qū)域93到95。
在標(biāo)號圖象中,掃描以相同標(biāo)號記錄的象素。象素的所有顏色作為各個包圍矩形的屬性信息被記錄。從在標(biāo)號圖象中以相同標(biāo)號記錄的所有象素獲得每一標(biāo)號的代表性顏色。能夠按以下方式獲得代表性顏色。獲得每一顏色的頻率分布。具有最高頻率的顏色當(dāng)作為代表性顏色。代表性顏色信息作為相關(guān)包圍矩形的屬性信息被記錄。
作為標(biāo)號處理的結(jié)果標(biāo)號單元77產(chǎn)生以下輸出信息。
作為每象素兩字節(jié)信息的標(biāo)號圖象,表示出縮小圖象的高度、寬度和縮小比。此外,表示出縮小圖象區(qū)域中矩形數(shù)(nr)和矩形信息。作為矩形信息,輸出區(qū)域中的矩形數(shù)(nr)、矩形號碼、矩形中的標(biāo)號圖象的標(biāo)號、矩形左上坐標(biāo)(x1,y1)、矩形的右下坐標(biāo)(x2,y2)、矩形中的代表性顏色(Rs,Gs,Bs)、顏色數(shù)(nc)、顏色(R0,G0,B0),(R1,G1,B1),…(Rn-1,Gn-1,Bn-1)。
原始圖象標(biāo)號單元79接收輸出信息,把矩形信息的左上坐標(biāo)值和右下坐標(biāo)值以縮小比分割,并獲得原始圖象中的相對坐標(biāo)。當(dāng)縮小比為1/n時,原始圖象矩形的左上坐標(biāo)和右下坐標(biāo)分別為(x1*n,y1*n)和{(x2*n)-1,(y2*n)-1}(這里*表示乘法,而“-1”是各從右下坐標(biāo)的x軸和軸y減)。
原始圖象標(biāo)號單元79對由坐標(biāo)表示的矩形的內(nèi)部進(jìn)行光柵掃描,并搜索具有與代表性顏色(Rs,Gs,Bs)類似顏色的象素。當(dāng)特定象素的顏色與代表性顏色類似時,滿足以下條件。
|Rs-Ri|<Rth和|Gs-Gi|<Gth以及|Bs-Bi|<Bth這種情形下,閾值Rth,Gth和Bth是固定的。
當(dāng)原始圖象標(biāo)號單元79檢測到滿足上述條件的象素時,它對該象素設(shè)定最大標(biāo)號值加1的標(biāo)號值。
然后,原始圖象標(biāo)號單元79掃描與所考慮的象素相鄰的八個象素,并獲得每一相鄰象素的色值(Ri,Gi,Bi)。當(dāng)每一相鄰象素的色值(Ri,Gi,Bi)和所考慮的象素的色值(Rc,Gc,Bc)滿足以下條件時,原始圖象標(biāo)號單元79對相關(guān)象素設(shè)定與所考慮的象素相同的標(biāo)號(在步驟S4)。
|Rc-Ri|<Rth和|Gc-Gi|<Gth以及|Bc-Bi|<Bth當(dāng)原始圖象標(biāo)號單元79不為相關(guān)象素設(shè)定相同標(biāo)號時,它對相關(guān)象素的顏色與作為所考慮的矩形的屬性信息的所有顏色進(jìn)行比較,并獲得它們的距離。當(dāng)距離小于閾值時,原始圖象標(biāo)號單元79為相關(guān)象素設(shè)定與所考慮的象素相同的標(biāo)號。
這樣,如圖15C所示,原始圖象標(biāo)號單元79為具有類似于矩形97到100中的代表性顏色的顏色的象素設(shè)定標(biāo)號,并抽取具有與矩形97到100相同色值的矩形102到105。在實際的彩色文檔中,與圖15A的情形(即,圖象區(qū)域具有背景和各種尺寸的彩色字符)不同當(dāng)圖象區(qū)域并不粗糙時,與圖15C所示的情形不同,相同的標(biāo)號區(qū)域變得復(fù)雜。
特定區(qū)域抽取單元80從由原始圖象獲得的標(biāo)號區(qū)域101抽取特定區(qū)域(在步驟S6)。當(dāng)從彩色文檔抽取作為諸如摘要或標(biāo)題的關(guān)鍵字的字符區(qū)域時,對應(yīng)于使用給定的包圍矩形的尺寸和配置信息的傳統(tǒng)的字符串抽取方法,特定區(qū)域抽取單元80能夠抽取相關(guān)字符串區(qū)域。
例如,特定區(qū)域抽取單元80獲得具有抽取的矩形的信息的相鄰矩形的關(guān)系,并抽取其坐標(biāo)值彼此接近(即坐標(biāo)值之間的差小于閾值)且其(R,G,B)的色差小于閾值的相鄰矩形作為字符串。外部輸出單元72顯示抽取的字符串。
當(dāng)從彩色景色圖象抽取一個對象時,標(biāo)號圖象相鄰區(qū)域的代表性顏色被轉(zhuǎn)換為諸如HSV(色調(diào),飽和度,能見度)信息。對相似色調(diào)的區(qū)域進(jìn)行組合。這樣,由于陰影而被分離的區(qū)域能夠被組合為一個區(qū)域。具有特定尺寸的區(qū)域能夠被作為對象的可選擇區(qū)域輸出。
這樣,根據(jù)本發(fā)明的第六實施例,從縮小圖象獲得了相似顏色的區(qū)域。所獲得的區(qū)域是從原始圖象被精確地抽取的。因而,能夠顯著減少處理的時間。此外,只有相鄰的象素標(biāo)以對應(yīng)于象素顏色的閾值。于是,能夠?qū)ο笏鼐植康夭⒕_地進(jìn)行顏色聚類。于是,即使待抽取的區(qū)域的顏色類似于其背景顏色,它們也能被區(qū)分。這樣,能夠精確地抽取區(qū)域。
當(dāng)獲取對應(yīng)于所考慮的象素顏色的閾值時,參照具有所考慮的象素的三種顏色要素的關(guān)鍵值的表。這樣,降低了為獲得閾值的所需計算數(shù)目。
當(dāng)獲取對應(yīng)于所考慮的象素顏色的閾值時,就獲得了所考慮的象素的三種顏色要素與表的項的特定顏色的三種顏色要素之間的距離的相似性。使用與所考慮的象素的顏色最相似的項,獲取表的項的閾值。這樣,能夠降低存儲閾值的表的大小。
此外,三種顏色要素的閾值是從存儲了樣本分布的表獲得的,樣本分布與諸如CCD相機或掃描儀等輸入單元及對象都有關(guān)。這樣,由于表存儲了與輸入單元相關(guān)的閾值,故輸入圖象被精確地標(biāo)號。
以下將說明按根據(jù)本發(fā)明的一實施例的標(biāo)號處理設(shè)定閾值的方法。
彩色圖象是以各種不同的方法打印的,諸如凹版方法。然而,大多數(shù)彩色圖象是以半色調(diào)打印方法打印的。當(dāng)放大由半色調(diào)打印方法打印的文檔時,在肉眼看來是相等顏色的區(qū)域中發(fā)生彩色波紋圖案。
圖16A和16B是表示發(fā)生在由半色調(diào)打印方法打印的文檔中彩色波紋圖案的示意圖。
圖16A中,原始圖象111區(qū)域“の”(日語中的“の”)是以橙色單色打印的。然而,如圖16B所示,當(dāng)區(qū)域“の”的部分被放大時,很明顯該區(qū)域是由各種顏色組成。
這樣,當(dāng)對相鄰象素的色差(RGB的亮度差)與固定閾值進(jìn)行比較并確定是否對這些象素設(shè)定相同的標(biāo)號時,可能不能抽取特定的區(qū)域。例如,對圖16B中所示區(qū)域“の”中的象素112到115設(shè)定不同于其它象素的標(biāo)號。這樣,當(dāng)從原始圖象111抽取字符“の”時,由于象素112到114漏掉,抽取的精確性變差。
使用打印模型,獲取對于每一掃描儀的讀取分辨率的相鄰象素的RGB平均亮度值和RGB亮度差并存儲在色差表中。參照色差表,控制每一顏色的閾值,以便進(jìn)行標(biāo)號處理。
例如,當(dāng)區(qū)域“の”中的象素114和115之間的色差為最大時,設(shè)定其色差為用于抽取橙色區(qū)域的閾值。這樣,當(dāng)從原始圖象111抽取字符“の”時,能夠?qū)ο笏?12到114設(shè)定與區(qū)域“の”中其它象素相同的標(biāo)號。于是,能夠防止象素112到114漏掉。
以下將說明用于生成存儲顏色平均值、相鄰象素色差、及掃描儀讀取分辨率的色差表的方法。色差表是以根據(jù)本發(fā)明的一個實施例的彩色打印模型和掃描儀讀取模型生成的。
圖17是表示通過半色調(diào)打印方法打印的文檔的放大視圖。
圖17中,按半色調(diào)打印方法,其大小在每一位置變化的青色(天藍(lán)色)、品紅色(紫紅色)、和黃色點121到123規(guī)則地配置在網(wǎng)格圖案中。
按半色調(diào)打印方法,在預(yù)定的網(wǎng)格區(qū)間打印三原色(或包括黑色的四原色)的第一色著色圓圈,使獲得所需的濃度。然后,隨著轉(zhuǎn)動的網(wǎng)格,在與第一色相同的網(wǎng)格區(qū)間以不同的尺寸打印第二色的著色圓圈。然后,再次轉(zhuǎn)動網(wǎng)格,在與第一色相同的網(wǎng)格區(qū)間以不同的尺寸打印第三色的著色圓圈。在這一打印方法,打印的圓圈以肉眼可看作是相等的顏色。
圖18A,18B和18C是用于說明,在以半色調(diào)打印方法以一個網(wǎng)格點打印一種顏色的情形下,為什么各象素的亮度值彼此不同的原因。
圖18A中,當(dāng)以半色調(diào)打印方法打印一種顏色時,半徑為r1的著色圓圈D1被打印在打印網(wǎng)格M1的網(wǎng)格點處。當(dāng)在半色調(diào)打印方法中打印顏色改變時,著色圓圈D1的半徑r1改變。這樣,在通過半色調(diào)打印方法打印另一顏色的區(qū)域中,半徑r1的著色圓圈D1被分散配置。
當(dāng)圖18A所示的打印文檔由掃描儀等讀取時,打印文檔的圖象以掃描儀等固定的分辨率讀取。這樣,如圖18B所示,著色的圓圈D1被讀取為按對應(yīng)于掃描儀等的分辨率讀取網(wǎng)格M2分段的象素。由于著色的圓圈D1是分散分布的,故包含在以讀取網(wǎng)格M2分段的象素中的著色圓圈D1的區(qū)域不相等。這樣,如圖18C所示,在網(wǎng)格M2中心所考慮的象素的亮度不同于與所考慮的象素相鄰的八個象素P1到P8的平均亮度。
另一方面,當(dāng)從圖18A所示的打印文檔抽取相同顏色的區(qū)域時,由于圖18A所示的文檔通過半色調(diào)打印方法以單色打印,故與所考慮的象素相鄰的八個象素P1到P8應(yīng)當(dāng)抽取為與所考慮的象素相同顏色的象素。這樣,就獲得了所考慮的象素與每一象素P1到P8之間的亮度差,并記錄亮度差的最大值(在圖18C所示的例子中,即所考慮的象素與象素P4之間的亮度差)。當(dāng)從輸入圖象抽取相同顏色的區(qū)域時,所考慮的象素與其每一相鄰象素之間的亮度差的最大值用作為閾值。具有不大于閾值亮度差的相鄰象素作為與所考慮的象素相同顏色的象素被抽取。
以下,將說明用于構(gòu)成精確對應(yīng)于半色調(diào)打印方法的掃描儀讀取模型的一種方法。
圖19A,19B,19C和19D是表示對應(yīng)于半色調(diào)打印方法的掃描儀讀取模型的示意圖。
圖19A,19B,19C和19D中,對于青色、品紅色、和黃色的打印網(wǎng)格M11、M12和M13被旋轉(zhuǎn)并組合為一打印模型。為了調(diào)節(jié)青色、品紅色、和黃色的濃度,要調(diào)節(jié)打印網(wǎng)格M11、M12和M13的網(wǎng)格點處的著色圓圈D11、D12和D13的大小。
這里,掃描儀讀取模型的參數(shù)如下。
-打印網(wǎng)格M11、M12和M13的網(wǎng)格距離md(然而,網(wǎng)格距離md對黃色、青色、品紅色是共用的)-黃色網(wǎng)格M11相對于水平線的角度θ11-品紅色網(wǎng)格M12相對于水平線的角度θ12-青色網(wǎng)格M13相對于水平線的角度θ13-黃色著色圓圈D11的半徑r11-品紅色著色圓圈D12的半徑r12
-青色著色圓圈D13的半徑r13然而,本實施例中,為了避免復(fù)雜,轉(zhuǎn)動參數(shù)為以下非變量值。
-黃色網(wǎng)格M11相對于水平線的角度θ11=15度-品紅色網(wǎng)格M12相對于水平線的角度θ12=30度-青色網(wǎng)格M13相對于水平線的角度θ13=45度-網(wǎng)格距離md=20個點使用打印模型,對受顏色、品紅色、和青色的著色圓圈D11、D12、D13的半徑R11、r12和r13影響的平均RGB值(Rm,Gm,Bm)進(jìn)行仿真。實際中,對比打印網(wǎng)格M11、M12、M13的網(wǎng)格距離md大得多的單位區(qū)域考慮如下。
Rm=255-單位面積中青色面積×255/單位面積Gm=255-單位面積中品紅色面積×255/單位面積Bm=255-單位面積中黃色面積×255/單位面積以下將說明,由掃描儀讀取以一種顏色(Rm,Gm,Bm)均一打印的圖象的掃描儀讀取模型。在這模型中,引入具有與打印網(wǎng)格M11、M12、M13的網(wǎng)格距離不同的距離sd的讀取網(wǎng)格M14。獲得讀取網(wǎng)格M4(即,各顏色的區(qū)域)中的RGB亮度。
這種情形下,讀取網(wǎng)格M14的距離sd等價于掃描儀的讀取分辨率。當(dāng)讀取具有平均顏色(Rm,Gm,Bm)的圖象時,如果掃描儀的讀取分辨率高,則相鄰象素的RGB亮度值變化大。反之,當(dāng)掃描儀的讀取分辨率低時,讀取的象素的顏色接近平均顏色(Rm,Gm,Bm)。相鄰象素的RGB亮度差接近0。
讀取網(wǎng)格M14中的RGB(Rc,Gc,Bc)亮度值如下。
Rc=255-讀取網(wǎng)格面積中青色面積×255/讀取網(wǎng)格面積Gc=255-讀取網(wǎng)格面積中品紅色面積×255/讀取網(wǎng)格面積Bc=255-讀取網(wǎng)格面積中黃色面積×255/讀取網(wǎng)格面積獲得了具有網(wǎng)格距離sd的讀取網(wǎng)格M14的RGB(Rc,Gc,Bc)亮度值。獲得了亮度值(Rc,Gc,Bc)與每一相鄰象素的亮度值之間的亮度差。一適當(dāng)?shù)闹?例如,最大值)記錄到色差表中。
在一打印模型中,網(wǎng)格點處的著色圓圈對每一種RGB顏色重疊。這樣,這些著色圓圈對應(yīng)于RGB的亮度值相互彼此影響。于是,嚴(yán)格來說,不能說打印模型的RGB是獨立的。然而,在掃描儀讀取模型中,為了簡單,假設(shè)模型RGB是獨立的。
這樣,RGB亮度值、讀取分辨率、和所考慮的象素與每一相鄰象素之間的亮度差存儲到RGB獨立的表中。
圖20是表示對于R的表的一例的一個表。
圖20中,對應(yīng)于亮度值(0到255)和掃描儀的讀取分辨率(14到35)列出相鄰象素亮度差的最大值。在圖20所示的表中,R亮度值以3為間隔進(jìn)行記錄。通過插值處理能夠獲得從0到255范圍的任何R亮度值。
圖20中所示對于R的表適用于對于G和B的表。
當(dāng)生成對于半色調(diào)打印方法的打印模型時,能夠通過計算機再現(xiàn)在半色調(diào)打印方法中生成的顏色。這樣,不必分析以半色調(diào)打印方法打印的文檔,就能夠生成對于RGB的表。
參照對于RGB表,能夠獲得從輸入圖象檢測相同顏色范圍所必須的閾值。
圖21是表示根據(jù)本發(fā)明的一實施例的色差表產(chǎn)生裝置結(jié)構(gòu)的框圖。
在圖21中,色差表產(chǎn)生裝置包括彩色圖象輸入單元111、外部輸出裝置112、存儲器113、及中央處理器(CPU)114。中央處理器(CPU)114具有打印模型產(chǎn)生單元115和色差表產(chǎn)生單元116。打印模型產(chǎn)生單元115按圖19中所示的方法產(chǎn)生打印模型,并在計算機上再現(xiàn)半色調(diào)打印方法中產(chǎn)生的顏色。色差表產(chǎn)生單元116使用對應(yīng)于半色調(diào)打印方法的打印模型產(chǎn)生掃描儀讀取模型,并產(chǎn)生如圖20所示對于RGB各顏色的色差表。
圖22是表示根據(jù)本發(fā)明第七實施例圖案抽取裝置的結(jié)構(gòu)的框圖。
圖22中,根據(jù)第七實施例的圖案抽取裝置包括彩色圖象輸入單元131、存儲器133、及中央處理器(CPU)134。中央處理器(CPU)134具有色差表135、顏色分離圖象產(chǎn)生單元136、及字符區(qū)抽取單元137。
色差表135是圖20所示的表。色差表135存儲亮度值、讀取分辨率、及每一RGB顏色的相鄰象素的亮度差。
顏色分離圖象產(chǎn)生單元136對應(yīng)于輸入圖象的讀取分辨率和RGB亮度值搜索色差表,并對應(yīng)于輸入圖象的讀取分辨率和RGB亮度值獲得相鄰象素的亮度差。相鄰象素的亮度差用作為對相鄰象素進(jìn)行標(biāo)號的閾值。當(dāng)輸入圖象的讀取分辨率和RGB亮度值變化時,參照色差表135更新用于對相鄰象素進(jìn)行標(biāo)號的閾值。
使用所考慮的象素的顏色(R,G,B)的關(guān)鍵信息,搜索色差表135獲取作為相同顏色處理的相鄰象素的亮度差閾值。所獲得的閾值用于所考慮的象素的相鄰象素。當(dāng)對每一顏色RGB相鄰象素和所考慮的象素之間的亮度值不大于閾值時,則為所考慮的象素和相鄰象素設(shè)定相同的標(biāo)號。
在進(jìn)行標(biāo)號處理中,只處理與所考慮的象素相鄰的象素。此外,為象素設(shè)定具有對應(yīng)于象素的顏色的閾值的標(biāo)號。這樣,能夠?qū)斎雸D象局部地精確地進(jìn)行色聚類。于是,能夠產(chǎn)生無孔洞的且具有平滑輪廓的標(biāo)號圖象。
此外,能夠快速且精確地從彩色文檔圖象抽取具有均一顏色的字符區(qū)域。
從具有背景及顏色局部相似的對象、并具有其顏色與另一區(qū)域顏色相似的區(qū)域的圖象,能夠抽取其顏色局部地且精確地相同的區(qū)域。
在其顏色作為相同顏色處理的區(qū)域中,即使象素的色值與其相鄰象素的色值稍微不同,也能夠防止區(qū)域抽取成為孔洞和不平滑的輪廓。這樣,能夠精確地抽取區(qū)域。
當(dāng)產(chǎn)生了標(biāo)號圖象時,對應(yīng)于圖案的標(biāo)號而產(chǎn)生輸入圖象圖案的包圍矩形。對應(yīng)于包圍矩形的顏色信息及其幾何信息包圍矩形被分組。
對應(yīng)于由色分離圖象產(chǎn)生單元136分組的包圍矩形的布局和尺寸,字符區(qū)域抽取單元137從由原始圖象獲得的標(biāo)號圖象抽取字符串區(qū)域。
當(dāng)從彩色文檔抽取作為諸如以大字模描述的摘要和標(biāo)題的關(guān)鍵字的字符區(qū)域時,使用包圍矩形的尺寸和布局信息抽取的只是字符區(qū)域。
圖23是表示圖22所示的圖案抽取單元操作的流程圖。
圖23中,執(zhí)行圖象的輸入處理(在步驟S11)。在圖象輸入處理中,使用諸如CCD相機或掃描儀等輸入彩色圖象并存儲在存儲器中。
然后,進(jìn)行模型分辨率估計處理(在步驟S12)。在模型分辨率估計處理中,將從表示彩色打印文檔的紋波圖案的打印模型和掃描讀取模型獲得的色差表中的平均亮度值和相鄰象素的亮度差值的最大值,與輸入圖象的平均亮度值和亮度差值的最大值進(jìn)行比較。這樣,就獲得了對整個輸入圖象的掃描儀讀取分辨率。
圖24是用于說明根據(jù)本發(fā)明的一個實施例模型分辨率估計處理的示意圖。
圖24中,輸入圖象被分為對應(yīng)于網(wǎng)格142的(3×3)象素塊。對整個輸入圖象141的每一塊求出(3×3)象素a到i的平均RGB亮度值(Rm,Gm,Bm)和相鄰象素的亮度差值的最大值(Rd,Gd,Bd)。在(3×3)象素a到i中有20個相鄰方向。求出象素的20個相鄰方向中的亮度差值。使用亮度差值的最大值(Rd,Gd,Bd)。
使用平均RGB亮度值(Rm,Gm,Bm)和相鄰象素的亮度差值的最大值(Rd,Gd,Bd)的關(guān)鍵信息,搜索色差表,求出對于記錄在色差表中的平均亮度值和相鄰象素的亮度差值最大值是最優(yōu)的掃描儀讀取分辨率值。當(dāng)從輸入圖象141獲得的相鄰象素的亮度差值的最大值(Rd,Gd,Bd)與具有色差表中最優(yōu)的掃描儀讀取分辨率的相鄰象素的亮度差值的最大值之間的差不在預(yù)定范圍內(nèi)時,向(3×3)象素a到i返回拒絕代碼(-1)。否則,返回確認(rèn)代碼(0)。
這種處理是對整個輸入圖象141進(jìn)行的。這樣,為網(wǎng)格142的所有塊的所有(3×3)象素a到i設(shè)定拒絕代碼(-1)或確認(rèn)代碼(0)。對于在(3×3)象素a到i中設(shè)定了確認(rèn)代碼(0)的象素,獲得其掃描儀讀取分辨率的平均值。該平均值是作為輸入圖象141的掃描儀讀取分辨率對待的。
以下將示例說明對R的處理。
對R表的分辨率值固定在特定的值。搜索R表的R亮度值以查找滿足Ri<Rm<Ri+1的R亮度值Ri(其中Rm是平均亮度值)。在這里,假設(shè)對于R亮度值Ri相鄰象素亮度值的最大值為Rdi,且對于R亮度值Ri+1相鄰象素亮度值的最大值為Rdi+1,則平均亮度值Rm是通過對R亮度值Ri和R亮度值Ri+1線性插值獲得的。該關(guān)系用于相鄰象素亮度值的最大值,以便獲得對于被估計的相鄰象素亮度值的最大值infered delta。換言之,滿足以下關(guān)系。
rl=Ri-Rirm=Rm-Ri
rn=Ri+1-Rminfered_delta=Rri*rn/rl+Rri+1*rm/rl對相鄰象素亮度值的估計最大值infered_delta與從圖象獲得的亮度值的最大值Rd之間的差delta_r是如下獲得的。
delta_r=|Rd-infered_delta|對R和G執(zhí)行相同的處理以便獲得delta_g和delta_b。和delta如按下公式獲得。
delta=delta_r+delta_g+delta_b對分辨率參數(shù)進(jìn)行搜索以獲得具有最小delta值的分辨率resol及delta值delta_min。當(dāng)delta_min滿足以下條件時delta_min>TH_SUB(其中TH_SUB是固定的閾值),確定相關(guān)的(3×3)塊不符合模型。這樣,返回拒絕代碼(-1)。否則,返回確認(rèn)代碼(0)。只對設(shè)定了確認(rèn)代碼的塊,獲得其分辨率值resol的平均值作為輸入圖象的分辨率。
分辨率=(∑設(shè)定了確認(rèn)代碼的塊的分辨率)/設(shè)定了確認(rèn)代碼的塊數(shù)目在說明中所使用的術(shù)語“分辨率”表示在輸入圖象施加到準(zhǔn)備的模型的情形下的讀取分辨率,而不是由掃描儀讀取的輸入圖象的讀取分辨率。
然后,進(jìn)行顏色標(biāo)號處理(在步驟S13)。在顏色標(biāo)號處理中,為具有類似顏色的相鄰象素設(shè)定相同的標(biāo)號。獲得作為具有與標(biāo)號圖象相同標(biāo)號的連接區(qū)域的包圍矩形。作為包圍矩形的信息,存儲包圍矩形的坐標(biāo)值、包圍矩形連接區(qū)域的平均顏色(R,G,B),包圍矩形連接區(qū)域的標(biāo)號號碼、及連接區(qū)域的面積(連接區(qū)域的象素數(shù))。
實際上,是從左上位置對輸入圖象進(jìn)行掃描??紤]非標(biāo)號象素。使用象素的RGB亮度值和估計分辨率,搜索色差表以對每一RGB尋找相鄰象素的亮度值的最大值。該最大值作為用于對所考慮的象素進(jìn)行標(biāo)號的閾值。
在標(biāo)號處理中,對于從一個象素擴展的具有相同標(biāo)號的區(qū)域,只要添加一個象素,就獲得標(biāo)號區(qū)域中的平均顏色(R,G,B)。確定是否為標(biāo)號區(qū)域中相鄰的象素設(shè)定與標(biāo)號區(qū)域相同的標(biāo)號。當(dāng)要被新標(biāo)號的相鄰象素的顏色不同于已經(jīng)由閾值標(biāo)號的標(biāo)號區(qū)域的平均顏色時,即使相鄰象素的色差不大于閾值,也為要被新標(biāo)號的相鄰象素設(shè)定不同于已經(jīng)標(biāo)號的標(biāo)號區(qū)域的標(biāo)號。這樣,即使字符區(qū)域和背景區(qū)域的邊界顏色逐漸變化,也能正確地抽取字符區(qū)域。
圖25是用于說明根據(jù)本發(fā)明的一實施例進(jìn)行顏色標(biāo)號處理的示意圖。
圖25中,假設(shè)象素e的顏色為黑色,且與象素e分離開的象素的顏色從黑色變?yōu)榧t色。當(dāng)象素e和除了象素e之外相鄰象素a到i之間的色差為閾值或更小時,對象素e和相鄰象素a到i(除了象素e)設(shè)定相同的標(biāo)號。
當(dāng)為象素j設(shè)定一標(biāo)號時,確定象素f和j之間的色差是否為閾值或更小,以及象素a到i的顏色平均值與象素j的顏色之間的色差是否為閾值或更小。即使象素f和j之間的色差為閾值或更小,當(dāng)象素a到i的顏色平均值與象素j的顏色之間的色差超過閾值時,對象素j設(shè)定與象素f的標(biāo)號不同的一標(biāo)號。
當(dāng)與象素e分離的象素的顏色從象素e的顏色逐漸變化時,雖然象素j的顏色類似于象素f的顏色,但是象素j和e之間的色差是顯著的。這樣,當(dāng)已經(jīng)設(shè)定了標(biāo)號的象素a到i的顏色平均值與象素j的顏色比較時,象素a到i的顏色平均值受到象素e的顏色的影響。這樣,這一色差大于象素f和j之間的色差。
這樣,即使顏色逐漸變化,在象素f和j之間也能形成邊界。于是,能夠防止對黑色區(qū)域和紅色區(qū)域設(shè)定相同的標(biāo)號。
以下說明對R亮度值的實際方法。
將R表的分辨率值固定在估計的分辨率值。掃描R表以獲得滿足條件Ri≤R≤Ri+1的所考慮象素的亮度值。這里,假設(shè)相對于R亮度值Ri的相鄰象素的亮度值的最大值為Rdi,且相對于R亮度值Ri+1的相鄰象素亮度值的最大值為Rdi+1,則所考慮的象素的亮度值R是通過對R表的R亮度值Ri和R表R亮度值Ri+1進(jìn)行線性插值獲得的。這一關(guān)系用于相鄰象素亮度值的最大值,以便獲得相鄰象素亮度值的估計最大值delta_r。換言之,最大值delta_r是如下獲得的。
rl=Rl-Ri+1rm=R-Rirn=Ri+1-R
delta_r=Rri*rn/rl+Rri+1*rm/rl這關(guān)系適用于G和B。
這樣,使用尚未處理的所考慮的象素的色值(R,G,B),獲取所考慮的象素與相鄰象素之間的亮度差的最大值(delta_r,delta_g,delta_b)作為用于對相鄰象素進(jìn)行標(biāo)號的閾值。
假設(shè)掃描與尚未處理的所考慮的象素相鄰的八個象素,已經(jīng)設(shè)定了標(biāo)號的一象素與所考慮的象素相鄰出現(xiàn),以及標(biāo)號的象素的RGB亮度值(Rs,Gs,Bs)滿足以下條件|R-Rs|<=delta_r和|G-Gs|<=delta_g以及|B-Bs|<=delta_b由于所考慮的象素的顏色類似于相鄰象素的顏色,故相鄰象素的標(biāo)號作為當(dāng)前標(biāo)號區(qū)存儲。對所考慮的象素設(shè)定當(dāng)前標(biāo)號區(qū)。此外,作為設(shè)定了當(dāng)前標(biāo)號區(qū)的區(qū)域的平均顏色(Rm,Gm,Bm),獲得所考慮的象素的顏色添加到相鄰標(biāo)號的平均顏色的新的平均顏色。
否則,對所考慮的象素設(shè)定最大標(biāo)號值加1的新標(biāo)號值作為當(dāng)前標(biāo)號。這種情形下,作為區(qū)域的平均值(Rm,Gm,Bm),設(shè)定所考慮的象素的RGB值。
任何情形下,所考慮的象素的坐標(biāo)值存儲在處理坐標(biāo)陣列中。
然后,執(zhí)行以相同的顏色圍繞所考慮的象素擴展區(qū)域的處理。這一處理中,頂部坐標(biāo)值是從處理坐標(biāo)陣列抽取的。具有頂部坐標(biāo)值的象素作為所考慮的象素對待。獲得作為與所考慮的象素的RGB亮度值和相鄰象素的亮度值之間的差的估計閾值(delta_r,delta_g,delta_b)。
平均顏色的每一RGB信號的亮度差的閾值(delta_rm,delta_gm,delta_bm)是使用區(qū)域中的平均顏色(Rm,Gm,Bm)和估計的分辨率獲得的。
然后,如圖12A所示,掃描與所考慮的象素相鄰的八個象素,以便獲得與所考慮的象素相鄰象素的(Ri,Gi,Bi)值(其中i=1到8)。對于RGB值獲得所考慮的象素的顏色(Rc,Gc,Bc)與相鄰象素的平均顏色的(Rm,Gm,Bm)值之間的亮度差。當(dāng)該亮度差值滿足以下條件時|Ri-Rc|<=delta_r和|Gi-Gc|<=delta_g以及|Bi-Bc|<=delta_b|Ri-Rm|<=delta_rm和|Gi-Gm|<=delta_gm以及|Bi-Bm|<=delta_bm對相鄰象素設(shè)定與所考慮的象素相同的標(biāo)號,且相鄰象素的坐標(biāo)值存儲在處理坐標(biāo)陣列中。從處理坐標(biāo)陣列中刪除所考慮的象素。
然后,獲得處理坐標(biāo)(x,y)的最大值和最小值并作為標(biāo)號區(qū)域的包圍矩形與作為包圍矩形屬性的標(biāo)號區(qū)域的平均顏色一同存儲。
重復(fù)這一處理直到處理坐標(biāo)陣列中沒有點為止。
作為標(biāo)號處理的結(jié)果,獲得了圍繞具有與標(biāo)號圖象相同標(biāo)號的區(qū)域的一包圍矩形。
標(biāo)號處理的輸出信息如下。
-標(biāo)號圖象4字節(jié)/象素-包圍矩形矩形數(shù)maxcount矩形信息lbtbl內(nèi)含標(biāo)號圖象的標(biāo)號號碼Label矩形的左上坐標(biāo)(xmin,ymin)矩形的右下坐標(biāo)(xmax,ymax)矩形中的代表性顏色(r,g,b)相關(guān)組號碼string_label輪廓長度contour
然后,進(jìn)行所考慮的矩形的抽取處理(在步驟所S14)。在所考慮的矩形抽取處理中,從具有所有顏色的包圍矩形抽取預(yù)定尺寸范圍內(nèi)的包圍矩形作為所考慮的矩形。
實際上,抽取其x長度為23個點或更多(在100 dpi)且圖象寬度的1/2或更小、以及其y長度為23個點或更多(在100 dpi)且圖象高度的1/2或更小的包圍矩形作為所考慮的矩形。
在所考慮的矩形抽取處理中,包圍矩形的尺寸可限制為用于對它們分組的參照。例如,當(dāng)抽取標(biāo)題時,參照對應(yīng)于標(biāo)題字符尺寸的包圍矩形,能夠?qū)Π鼑匦芜M(jìn)行分組。這樣,能夠防止在分組處理中參照諸如在標(biāo)題中沒用的干擾和背景等的包圍矩形。于是,能夠防止不必要的處理,能夠提高處理的速度。
然后,進(jìn)行抽取圍繞所考慮象素的搜索范圍的處理(在步驟S15)。在該處理中,所考慮的矩形周圍設(shè)定預(yù)定尺寸的搜索范圍,以便在該搜索范圍內(nèi)抽取矩形。
圖26是用于說明根據(jù)本發(fā)明的一實施例用于設(shè)定圍繞所考慮矩形的搜索范圍的方法的示意圖。
圖26中,抽取具有矩形號碼1到30的包圍矩形。假設(shè)矩形號碼1的包圍矩形151為所考慮的矩形。此外,還假設(shè)圍繞包圍矩形151設(shè)定一搜索范圍152。作為相對于包圍矩形151待分組的對象,只選擇搜索范圍內(nèi)具有矩形號碼2到24的包圍矩形。反之,不選擇不在搜索范圍152內(nèi)的具有矩形號碼25到30的包圍矩形作為相對于包圍矩形151待分組的對象。
在對包圍矩形進(jìn)行分組的情形下,當(dāng)包圍矩形的搜索范圍限制在圍繞所考慮的矩形時,則只能抽取出現(xiàn)在預(yù)定范圍內(nèi)的字符串。例如,當(dāng)抽取標(biāo)題區(qū)域時,不必考慮與標(biāo)題分離的字符。這樣,就能夠有效地抽取標(biāo)題區(qū)域。
實際上,假設(shè)所考慮的矩形151較長的邊以len標(biāo)記,而其較小的邊為100 dpi的30個點,并且圍繞所考慮矩形的搜索范圍以range_size標(biāo)記。
為了獲得圍繞所考慮矩形的搜索范圍range_size的包圍矩形,使用以下方法。
圖27是用于說明根據(jù)本發(fā)明的一實施例用來抽取圍繞所考慮矩形的搜索范圍中的矩形的方法。
圖27中,假設(shè)已經(jīng)抽取矩形號碼為1到4的包圍矩形161到164,則獲得矩形號碼和矩形數(shù)并對應(yīng)于各XY坐標(biāo)值記錄。
由于包圍矩形161到164在X坐標(biāo)值1到4的位置沒有出現(xiàn),故記錄矩形數(shù)n=0及矩形號碼=零。由于具有矩形號碼4的包圍矩形164出現(xiàn)在X坐標(biāo)值5到13的位置,故記錄矩形數(shù)n=1和矩形號碼=4。由于具有矩形號碼3的包圍矩形163和具有矩形號碼4的包圍矩形164出現(xiàn)在X坐標(biāo)值14的位置,故記錄矩形數(shù)n=2和矩形號碼=3和4。由于具有矩形號碼4的包圍矩形164出現(xiàn)在X坐標(biāo)值15到16的位置,故記錄矩形數(shù)n=1和矩形號碼=4。在所有XY坐標(biāo)值的位置進(jìn)行類型的操作。
然后,假設(shè)具有矩形號碼3的包圍矩形163為所考慮的矩形,并圍繞包圍矩形163設(shè)定搜索范圍165,則獲得包含在搜索范圍165中的XY坐標(biāo)值。獲得在各個XY坐標(biāo)值位置的矩形號碼。出現(xiàn)在XY坐標(biāo)值兩個位置的矩形號碼是在搜索范圍165的那些包圍矩形號碼。例如,在搜索范圍165中的X坐標(biāo)值位置的包圍矩形的矩形號碼是2到4。在搜索范圍165中的Y坐標(biāo)值位置的包圍矩形的矩形號碼是1到4。這樣,在XY坐標(biāo)值的兩個位置的矩形號碼是2到4。于是,作為搜索范圍165中的矩形獲得具有矩形號碼2到4的包圍矩形162到164。
實際上,執(zhí)行以下步驟a)到d)。
a)矩形號碼被投影到整個圖象的XY軸。
對于整個圖象的XY軸上的每一象素記錄矩形數(shù)和矩形號碼的集合。例如,假設(shè)矩形號碼i出現(xiàn)在X軸上范圍(x1,x2)內(nèi),則號碼i包含在X軸上從坐標(biāo)值x1到x2的范圍內(nèi)的矩形號碼集合中。對XY坐標(biāo)上的所有矩形執(zhí)行相同的操作。
b)圍繞所考慮的矩形設(shè)定范圍range_size。
c)在范圍range_size中的X軸上的坐標(biāo)值部分的矩形為ORed,以便抽取矩形號碼集合。
在Y軸上執(zhí)行相同的操作。
d)X軸上的矩形號碼集合與Y軸上的矩形號碼集合為ANDed,以便獲得圍繞所考慮的矩形的矩形集合。
圖27中所示的矩形號碼存儲方法中,對每一坐標(biāo)值需要存儲整個圖象所有矩形號碼的存儲容量。這樣,就需要大的存儲容量。
為了不增加存儲器的存儲容量而以高速獲得各個坐標(biāo)處的矩形數(shù)及矩形號碼,使用以下方法。
圖28A、28B、28C是簡化的圖示,用于說明根據(jù)本發(fā)明的一實施例用來存儲在搜索范圍內(nèi)、或者在圍繞所考慮的矩形的區(qū)域中局部配置的矩形信息的方法。
在圖28A中,假設(shè)已經(jīng)分別抽取了具有矩形號碼1和2的包圍矩形171和172,包圍矩形171出現(xiàn)在X坐標(biāo)值155到165的位置,而包圍矩形172出現(xiàn)在X坐標(biāo)值160到163的位置。這樣,如圖28B所示,對于包圍矩形171,矩形號碼1記錄在X坐標(biāo)值155到165的位置。對于包圍矩形172,矩形號碼2記錄在X坐標(biāo)值160到163的位置。
然后,如圖28C所示,矩形號碼1和2按其順序并按X坐標(biāo)值155到165的升序配置。這樣,能夠獲得具有相等坐標(biāo)值矩形號碼。
實際上,執(zhí)行以下步驟ⅰ)到ⅴ)。
ⅰ)所有矩形的水平長度相加。對應(yīng)于矩形的整個水平長度準(zhǔn)備具有矩形號碼和坐標(biāo)信息的數(shù)據(jù)結(jié)構(gòu)。
ⅱ)對該數(shù)據(jù)結(jié)構(gòu)設(shè)定矩形的坐標(biāo)值和矩形號碼。
ⅲ)按坐標(biāo)值存儲數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)。
ⅳ)在每一坐標(biāo)值對矩形數(shù)計數(shù)。對應(yīng)于每一坐標(biāo)值準(zhǔn)備用于矩形數(shù)的存儲區(qū)域。從開頭掃描存儲的數(shù)據(jù)結(jié)構(gòu)。當(dāng)坐標(biāo)值不變時,對矩形數(shù)計數(shù)。當(dāng)坐標(biāo)值變化時,設(shè)定并存儲矩形數(shù)。
ⅴ)在準(zhǔn)備的區(qū)域中把具有相同坐標(biāo)值的矩形號碼存儲所存儲的數(shù)據(jù)結(jié)構(gòu)中。從開頭掃描存儲的數(shù)據(jù)結(jié)構(gòu)。當(dāng)坐標(biāo)值不變時,把矩形號碼存儲在存儲區(qū)域。
然后,執(zhí)行相同的彩色分組抽取處理(在步驟S16)。在相同的彩色分組抽取處理中,如標(biāo)號處理,使用所考慮的矩形中的圖案的平均顏色獲得RGB亮度差值的閾值。抽取其對所考慮的矩形的RGB亮度差值不大于閾值的矩形作為相同組中的矩形,并存儲在分組信息中。然后,使用新添加到分組中的包圍矩形,執(zhí)行相同的操作直到?jīng)]有被添加的矩形。
實際上,一個所考慮的矩形的值(Rc,Gc,Bc)與圍繞所考慮的矩形的矩形集合的包圍矩形i在RGB空間中的值之間的距離定義如下。
dist=|Rc-Ri|+|Gc-Gi|+|Bc-Bi|此外,假設(shè)使用所考慮的矩形與分辨率的色值(Rc,Gc,Bc)獲得的RBG亮度差由delta_r、delta_g、delta_b標(biāo)記。當(dāng)所考慮的矩形的值(Rc,Gc,Bc)與圍繞所考慮的包圍矩形集合的一個包圍矩形i的值(Ri,Gi,Bi)滿足以下條件時,確定圍繞所考慮的矩形的包圍矩形包含在所考慮的矩形的分組中。圍繞所考慮的矩形的包圍矩形存儲在所考慮的矩形的分組中。
dist<TH_RGB(TH_RGB=20)或者(|Rc-Ri|<delta_r以及|Gc-Gi|<delta_g以及|Bc-Bi|<delta_b)此外,新添加到分組中的矩形號碼存儲到新添加的矩形區(qū)域中。
然后,從新添加的矩形區(qū)域抽取頂部矩形號碼作為新的所考慮矩形。獲得圍繞新的所考慮矩形的包圍矩形。通過重復(fù)這些步驟,獲得包含在分組中的包圍矩形,直到?jīng)]有添加到分組中的矩形為止。
在上述處理中,獲得了被抽取的分組信息的以下數(shù)據(jù)結(jié)構(gòu)。
分組中的矩形數(shù)num組成分組的矩形號碼child重疊矩形被組合之后的矩形數(shù)overlap num重疊矩形被組合之后的矩形信息overlap(數(shù)據(jù)類型矩形信息lbtbl類型)分組中的字符串方向代碼orient分組中的字符串?dāng)?shù)gyou_num字符串的矩形信息gyou然后,進(jìn)行抽取分組中的字符線平均粗度的處理(在步驟S17)。在該處理中,對于對應(yīng)于分組中的包圍矩形的標(biāo)號圖象的圖案,進(jìn)行輪廓跟蹤處理。換言之,包含在分組中的一個包圍矩形的矩形范圍內(nèi),對對應(yīng)于包圍矩形的標(biāo)號號碼的標(biāo)號圖象進(jìn)行輪廓跟蹤處理。把輪廓的抽取長度設(shè)定為矩形的輪廓的長度屬性。按輪廓的長度劃分圖案的區(qū)域,以便獲得字符線的平均厚。所獲得的平均粗度作為矩形的屬性記錄到矩形信息。
圖29A和29B是用于說明根據(jù)本發(fā)明的一實施例用于計算字符線粗度方法的示意圖。
圖29A中,假設(shè)抽取了圖案“フ”。通過對包含在圖案“フ”中的象素象素數(shù)計數(shù),計算圖案“フ”的面積S。然后,如圖28B所示,抽取圖案“フ”的輪廓。計算輪廓的長度L。圖案“フ”的面積S除以輪廓的長度,以便得出圖案“フ”的平均粗度W。
然后,進(jìn)行對應(yīng)于字符線的粗度對包圍矩形重新分組的處理(在步驟S18)。在該處理中,分組中的包圍矩形對應(yīng)于字符線的平均粗度被重新分組,以便構(gòu)成新的分組信息。換言之,對于分組中的包圍矩形重復(fù)圖23中所示的步驟S14到S16。當(dāng)在步驟S16進(jìn)行相同的顏色分組抽取處理時,除了在步驟S15處所使用的顏色信息外還使用估計的字符線粗度(=矩形中的圖案的面積/圖案的輪廓長度)。
圖30是用于說明根據(jù)本發(fā)明的一個實施例用于對應(yīng)于字符線的粗度對包圍矩形重新分組的處理。
圖30中,假設(shè)以相同的顏色描述并靠近配置字符串“グル-プ1”(分組1)及字符串“グル-プ2”(分組2)。于是,假設(shè)字符串“グル-プ1”及字符串“グル-プ2”被分在相同的分組181。
計算字符串“グル-プ1”的粗度及字符串“グル-プ2”的粗度。不同粗度的字符分類為不同組。這樣,字符串“グル-プ1”被分類為分組182。字符串“グル-プ2”被分類為分組183。
在該處理中,能夠把已被分類為相同組的背景和字符圖案分類為不同組。此外,具有不同字模或不同字符規(guī)格的字符串可分類為不同組。
實際上,使用第一包圍矩形的字符線的根據(jù)粗度(thick1)和第二包圍矩形的字符線的根據(jù)粗度(thick2),字符線的粗度比(thick rate)可如下獲得。
thick_rate=max(thick1,thick2)/min(thick1,thick2)正如步驟S15的情形,當(dāng)滿足以下條件時,把兩個包圍矩形記錄為相同組。
thick_rate<TH_THICK_RATE以及(dist<TH_RGB或(|Rc-Ri|<delta_r以及|Gc-Gi|<delta_g以及|Bc-Bi|<delta_b)假設(shè)TH_THICK_RATE為2.5。
對原始分組中的所有矩形執(zhí)行這一處理,以便把包圍矩形分組為新的分組。
當(dāng)獲得字符線的粗度時,必須獲得圖案的輪廓。然而,為了高速跟蹤輪廓,要執(zhí)行以下處理。
圖31A、31B、31C、和31D是示意圖,用于說明根據(jù)本發(fā)明的一實施例用于設(shè)定象素的搜索開始點以跟蹤輪廓的方法。
圖31A中,假設(shè)獲得了象素a到i構(gòu)成的圖案的輪廓,從左上位置對標(biāo)號圖象進(jìn)行光柵掃描。這樣,獲得象素。在獲得象素之后,使用與該象素相鄰的八個象素之一并已經(jīng)搜索了象素a之前的兩個象素的象素a′的搜索開始點,順時針?biāo)阉髋c該象素相鄰的八個象素。當(dāng)使用作為與象素e相鄰的八個象素之一并且是作為輪廓在象素e之前剛被搜索過的象素的下一個象素的象素e′的搜索開始點,如圖31B所示,獲得象素e時,順時針?biāo)阉髋c象素e相鄰的八個象素。當(dāng)使用作為與象素i相鄰的八個象素之一并且是作為輪廓在象素i之前剛被搜索過的象素e的下一個象素的象素i′的搜索開始點,如圖31C所示,獲得象素i時,順時針?biāo)阉髋c象素i相鄰的八個象素。類似地,如圖31D所示,抽取象素a→象素e→象素i→象素h→象素g→象素f→象素b→象素c作為象素a到i組成的圖案的輪廓。
實際上,執(zhí)行以下步驟a)到f)。
a)準(zhǔn)備矩形尺寸處理完成標(biāo)記。作為初始值,所有的矩形尺寸處理完成標(biāo)記設(shè)置為“0”。
b)用處理完成標(biāo)記和標(biāo)號圖象左上位置搜索矩形范圍,以便搜索具有處理完成標(biāo)記=0和標(biāo)號號碼=當(dāng)前矩形的標(biāo)號號碼的象素i。輪廓長度設(shè)置為0。
c)如圖32所示從象素0順時針?biāo)阉髋c象素i相鄰的八個象素。當(dāng)有一個象素具有處理完成標(biāo)記=0和標(biāo)號號碼=當(dāng)前矩形的標(biāo)號號碼時,抽取象素的方向代碼DC。
圖32是表示根據(jù)本發(fā)明的一實施例從當(dāng)前象素所看見的方向代碼的示意圖。
圖32中,象素C是當(dāng)前象素。象素0到7是與當(dāng)前象素C相鄰的象素。方向代碼DC是從當(dāng)前象素所見。從象素i,按順序搜索八個象素。
d)作為組成輪廓的下一個象素,搜索從當(dāng)前象素C檢測到的方向代碼DC的方向中的一象素。這時,已經(jīng)計算出的輪廓長度增加1。對新的當(dāng)前象素C′設(shè)定下一個待搜索的象素。從與當(dāng)前象素C′相鄰的八個象素搜索具有處理完成標(biāo)記=0和標(biāo)號號碼=當(dāng)前矩形的標(biāo)號號碼的象素。這時,用于搜索與新的當(dāng)前象素C′相鄰的八個象素的開始方向代碼是DC′,這是從先前的方向代碼(DC+5)除以8的余數(shù)。在方向DC′順時針?biāo)阉飨噜彽南笏亍?br>
這樣,由于防止了象素被冗余地搜索,故能夠以高度進(jìn)行輪廓跟蹤處理。
e)輪廓跟蹤處理繼續(xù)直到搜索到開始坐標(biāo)處的一個象素。以矩形中標(biāo)號值抽取這點輪廓的長度作為圖案的一個輪廓的輪廓長度。
f)對同一圖案的其它輪廓執(zhí)行步驟c)到e)。使所有的輪廓長度相加并最后抽取為圖案的輪廓長度。
然后,執(zhí)行從分組中刪除大矩形的處理(在步驟S19)。在該處理中,為了消除干擾,獲得分組中的矩形的平均尺寸。對應(yīng)于平均尺寸,刪除過大的矩形。
圖33A和33B是用于說明根據(jù)本發(fā)明的一實施例從分組中刪除大矩形的處理的示意圖。
圖33A中,假設(shè)包圍矩形192到201分類為組191,獲得分組191中的包圍矩形192到201的尺寸。假設(shè)包圍矩形192的尺寸遠(yuǎn)遠(yuǎn)大于包圍矩形193到201的尺寸,如圖33B中所示,則從分組191中刪除包圍矩形192,從而產(chǎn)生由包圍矩形193到201組成的分組202。
實際上執(zhí)行以下步驟a)到d)。
a)生成分組中的包圍矩形高度的直方圖。按以下方法獲得表示最大頻率值的矩形高度freq_height。
ⅰ)使用分級窗口,對直方圖進(jìn)行卷積計算(即獲得它們的移動和)。實際上,例如分級窗口是由“11111”五個象素組成的。
ⅱ)事先獲得最小高度值(實際上在100 dpi情形下是23個點)。獲得大于最小高度值并表示最大頻率的矩形高度freq_height。
圖34A和34B是用于說明根據(jù)本發(fā)明的一個實施例用來計算表示最大頻率值的矩形高度的方法的示意圖。
圖34A中,當(dāng)獲得圖33A所示包圍矩形192到201的高度的頻率時,使用分級窗口205,如圖34B所示,計算圖34A中所獲得的矩形高度的頻率移動和。在獲得了矩形高度的頻率移動和之后,從包圍矩形192到201的高度獲得表示最大頻率的矩形高度freq_height。
b)當(dāng)表示最大頻率值的矩形高度freq_height小于最小高度值(實際上在100 dpi情形下是23個點)時,把最小高度值作為表示最大頻率值的矩形高度freq_height對待。
c)獲得確定大矩形的閾值th_large為th_large=freq_height*10。
d)垂直和水平尺寸小于th_large的包圍矩形被保留在分組中。其余的包圍矩形作為干擾從分組中刪除。
然后,進(jìn)行組合分組中的重疊矩形的處理(在步驟S20)。在該處理中,新生成一個圍繞重疊的包圍矩形的矩形并記錄到分組信息中。
換言之,重疊的包圍矩形(即使包圍矩形部分地重疊)被組合。生成圍繞被組合的包圍矩形的包圍矩形。
圖35A和35B是用于說明根據(jù)本發(fā)明的一實施例用于組合分組中的重疊矩形處理的示意圖。
圖35A中,一包圍矩形211包含在包圍矩形212中。包圍矩形212與包圍矩形213重疊。這種情形下,包圍矩形211到213被組合。這樣,除了包圍矩形211到213以外,生成包圍矩形214。
在這個處理中,當(dāng)一個字符由多個分開的圖案諸如“畫”(日語的意思是圖片)及“関”(日語的意思是檢查站)等組合時,這種圖案可被集體處理,并能夠有效地執(zhí)行相繼的處理。
然后,進(jìn)行從分組中抽取字符串的處理(在步驟S21)。在該處理中,估計分組中的字符串的方向。抽取該方向中的字符串。對每一分組存儲所抽取的字符串的方向和坐標(biāo)信息。
圖36A和36B用于說明根據(jù)本發(fā)明的一實施例用于從分組中抽取字符串的處理的簡略圖示。
圖36A中,假設(shè)包圍矩形1到29被分類為分組221,在右側(cè)搜索與包圍矩形1在最左位置相鄰的包圍矩形。當(dāng)獲得了與包圍矩形1相鄰的包圍矩形2時,對所獲得的包圍矩形分配矩形號碼1。所獲得的包圍矩形的矩形號碼2變?yōu)樘柎a1。類似地,在右側(cè)搜索與所獲得的具有矩形號碼1的包圍矩形相鄰的一包圍矩形。當(dāng)獲得一包圍矩形時,把左側(cè)的包圍矩形的矩形號碼賦予給右側(cè)的包圍矩形。
當(dāng)沒有包圍矩形在右側(cè)與具有矩形號碼的包圍矩形相鄰時,在右側(cè)搜索與具有矩形號碼15的包圍矩形相鄰的一包圍矩形。當(dāng)獲得了與具有矩形號碼15的包圍矩形相鄰的一包圍矩形時,矩形號碼15賦予所獲得的包圍矩形。
在這種處理中,如圖36B所示,矩形號碼1賦予與具有矩形號碼1的包圍矩形在右側(cè)相鄰的包圍矩形。類似地,矩形號碼15賦予與具有矩形號碼15的包圍矩形在右側(cè)相鄰的包圍矩形。在矩形號碼轉(zhuǎn)移完之后,生成圍繞具有同一設(shè)定的矩形號碼1的包圍矩形的包圍矩形222。類似地,生成圍繞具有同一設(shè)定的矩形號碼15的包圍矩形的包圍矩形223。
實際上,執(zhí)行以下步驟a)到e)。
a)對應(yīng)于分組中的包圍矩形估計字符串的方向。
b)獲得對包圍矩形在向里和向外方向最接近(上、下、左、右位置)的矩形的相鄰關(guān)系。
c)當(dāng)字符串配置在水平方向時,從最左位置的一矩形,把開始的矩形號碼轉(zhuǎn)移給右側(cè)的矩形,直到右側(cè)沒有矩形為止。這一處理施加于垂直方向。
d)向與一矩形在最左位置相鄰的矩形轉(zhuǎn)移其矩形號碼。所設(shè)定的矩形號碼被轉(zhuǎn)移給與其在右側(cè)相鄰的矩形,直到?jīng)]有矩形關(guān)系。
e)在對分組中所有的矩形進(jìn)行了上述處理之后,獲得了具有相同設(shè)定的矩形號碼的矩形。抽取圍繞具有設(shè)定的相同的矩形號碼的矩形的包圍矩形作為字符串。
然后,執(zhí)行對字符串的分開的字符進(jìn)行組合的處理(在步驟S22)。這一處理中,用于組合水平字符串垂直地分開的字符的處理施加于字符串的矩形(在垂直字符串的情形下,用于組合水平分開的字符的處理施加于字符串的矩形)。被組合的矩形以一包圍矩形代替。這種情形下,字符串矩形被垂直組合。換言之,在水平字符串的情形下,圍繞字符(例如“て”)的上筆畫和下筆畫的各矩形被組合并作為一個矩形處理。
圖37A和37B是用于說明根據(jù)本發(fā)明的一實施例用于組合字符串分開的字符的處理的示意圖。
圖37A中,產(chǎn)生圍繞在分組221中水平相鄰的多個包圍矩形的包圍矩形222和223。在包圍矩形222中,出現(xiàn)了垂直相鄰的包圍矩形224和225,以及垂直相鄰的包圍矩形226和227。在包圍矩形223中,出現(xiàn)了垂直相鄰的包圍矩形228和229,以及垂直相鄰的包圍矩形230和231。
這種情形下,如圖37B所示,產(chǎn)生了圍繞包圍矩形224和225的包圍矩形232。產(chǎn)生了圍繞包圍矩形226和227的包圍矩形233。包圍矩形226和227被組合。產(chǎn)生了圍繞包圍矩形228和229的包圍矩形234。包圍矩形228和229被組合。產(chǎn)生了圍繞包圍矩形230和231的包圍矩形235。包圍矩形230和231被組合。
實際上,執(zhí)行以下步驟a)到c)。在以下的例子中,將說明水平字符串的情形。然而,這些步驟適用于垂直字符串的情形。
a)字符串中的矩形按X坐標(biāo)值的升序存儲。
b)設(shè)定第一個矩形為當(dāng)前矩形。當(dāng)下一個矩形與當(dāng)前矩形在當(dāng)前矩形的X坐標(biāo)值范圍內(nèi)重疊時,這些矩形被組合。當(dāng)前矩形的X坐標(biāo)值的范圍變?yōu)楸唤M合的矩形的X坐標(biāo)值的范圍。重復(fù)這一處理,直到?jīng)]有要組合的矩形為止。當(dāng)沒有矩形要組合時,存儲已被組合的矩形。
c)在沒有要組合的矩形之后,設(shè)定下一個矩形為新的當(dāng)前矩形。使用新的當(dāng)前矩形,重復(fù)步驟b)。
然后,對應(yīng)于字符串的字符的尺寸執(zhí)行用于對矩形重新分組的處理(在步驟23)。在該處理中,對應(yīng)于分組中的字符串的字符的垂直尺寸,對矩形重新分組。結(jié)果存儲在新的分組信息中。
這樣,具有相同顏色和不同字符尺寸的字符串能夠分為不同的組。此外,干擾和字符串能夠被分為不同的組。
圖38A和38B是用于說明根據(jù)本發(fā)明的一實施例用于對應(yīng)于字符串的字符的尺寸對矩形重新分組的處理的示意圖。
在圖38A中,假設(shè)已經(jīng)產(chǎn)生圍繞在分組221中水平相鄰的包圍矩形的包圍矩形222和223,計算出包圍矩形222的高度H1和包圍矩形223的高度H2。當(dāng)包圍矩形222的高度H1和包圍矩形223的高度H2之間的差大于預(yù)定閾值時,包圍矩形222和包圍矩形223被分到不同的組。
實際上,當(dāng)水平字符串的兩個矩形的高度差(垂直字符串的兩個矩形的寬度差)小于預(yù)定的閾值,并且兩個矩形彼此重疊,或兩個矩形彼此之間的距離小于預(yù)定的閾值時,這兩個矩形被分到相同的組并被設(shè)定相同的分組號碼。對所有的分組進(jìn)行這一處理。
然后,使用具有相同的分組號碼的字符串產(chǎn)生新的分組。這一處理中,具有不同字符尺寸而在圖23所示的步驟S18被分為相同分組的字符串,可能被分到不同的組。
然后,執(zhí)行從分組中刪除大矩形的處理(在步驟S24)。在該處理中,為了消除干擾,獲得分組中的矩形的平均尺寸。參照這平均尺寸,再次刪除大尺寸矩形。換言之,對于在上述處理中已經(jīng)改變的分組,再次執(zhí)行圖21所示步驟S19的處理,以便消除分組中的干擾。
然后,矩形分組的組合處理(在步驟S25)。在該處理中,水平或垂直相鄰并具有相同顏色的分組被組合。換言之,在兩個分組的顏色類似、相鄰、且分組的包圍矩形在一行的情形下,這兩個分組被組合為一個分組。進(jìn)行這一處理,以便對應(yīng)于稍后所要描述的矩形配置確定分組的字符串的相似性。
圖39A和39B是用于說明根據(jù)本發(fā)明的一實施例用于對分組進(jìn)行組合的處理的示意圖。圖39A中,假設(shè)分組1的包圍矩形241和分組2的包圍矩形242為水平配置,獲得包圍矩形241和242之間的距離L1,包圍矩形241的上邊緣和包圍矩形242的上邊緣之間的坐標(biāo)差E1,包圍矩形241的下邊緣和包圍矩形242的下邊緣之間的坐標(biāo)差E2。在矩形241和242之間的距離L1、包圍矩形241的上邊緣和包圍矩形242的上邊緣之間的坐標(biāo)差E1、包圍矩形241的下邊緣和包圍矩形242的下邊緣之間的坐標(biāo)差E2小于各自的閾值,并且分組1的代表性顏色和分組2的代表性顏色之間的差不大于預(yù)定的閾值的情形下,包圍矩形241和242被組合,并產(chǎn)生圍繞包圍矩形241和242的包圍矩形243。
實際上,在兩個分組的包圍矩形的坐標(biāo)接近,且其距離短,并假設(shè)兩個包圍矩形能夠被組合為一個字符串的情形下,包圍矩形按以下條件被分為一個組。
-兩個分組的平均RGB值的亮度差值小于預(yù)定閾值。
-當(dāng)兩個分組水平配置時,其水平距離小于固定的閾值(當(dāng)兩個分組垂直配置時,其垂直距離小于固定的閾值)。
-當(dāng)兩個分組水平配置時,兩個分組的包圍矩形的上邊緣之間的坐標(biāo)差小于固定的閾值,且兩個分組的包圍矩形的下邊緣之間的坐標(biāo)差小于固定的閾值(當(dāng)兩個分組垂直配置時,兩個分組的包圍矩形的右邊緣之間的坐標(biāo)差小于固定的閾值,且兩個分組的包圍矩形的左邊緣之間的坐標(biāo)差小于固定的閾值)。
重復(fù)這一處理直到?jīng)]有要被組合的分組。
然后,執(zhí)行用于抽取對應(yīng)于矩形配置可能為字符的分組的處理(在步驟S26)。在該處理中,對于滿足尺寸和形狀這種特定條件的矩形,當(dāng)一個矩形的上邊緣或下邊緣靠近相鄰矩形的上邊緣或下邊緣時,確定矩形是在同一行。這種情形下,設(shè)置一行標(biāo)志。獲得表示滿足預(yù)定條件的分組的矩形一行中矩形數(shù)的行矩形比率。抽取具有超過預(yù)定閾值的行矩形比率的分組作為字符串。
圖40A和40B是用于說明根據(jù)本發(fā)明的一實施例用于抽取可能是對應(yīng)于矩形配置的字符串的分組的處理的示意圖。
圖40A中,使用輸入圖象產(chǎn)生了包圍矩形252到256以及包圍矩形258到269。包圍矩形252到256被分為一組。這樣,產(chǎn)生了圍繞包圍矩形252到256的包圍矩形251。類似地,包圍矩形258到269被分到另一組。這樣,產(chǎn)生了圍繞包圍矩形252到269的包圍矩形257。
然后,確定分組的包圍矩形的尺寸和位置。對水平配置的包圍矩形設(shè)定水平配置標(biāo)志1。對垂直配置的包圍矩形設(shè)定垂直配置標(biāo)志2。由于包圍矩形252到256是隨機配置在包圍矩形251中,故對包圍矩形252到256既不設(shè)定水平配置標(biāo)志1也不設(shè)定垂直標(biāo)志2。另一方面,由于包圍矩形258到269是水平配置在包圍矩形257中的,故對包圍矩形258到269設(shè)定水平配置標(biāo)志1。
在完成了對包圍矩形252到256和包圍矩形258到269的標(biāo)志設(shè)定處理之后,在每一分組計算所有矩形中的設(shè)定了標(biāo)志的矩形的比率。抽取具有高矩形比率的分組作為字符串。作為干擾除去具有低矩形比率的分組。
這樣,如圖40B所示,由于包圍矩形252到256沒有被設(shè)定標(biāo)志,其分組作為干擾被除去。反之,由于已經(jīng)對包圍矩形258到269設(shè)定了水平配置標(biāo)志1,故其分組被抽取為字符串。
實際上,執(zhí)行以下標(biāo)志a)到e)。
a)當(dāng)分組中兩個相鄰矩形滿足尺寸和形狀的預(yù)定條件、并且兩個矩形的上邊緣之間的坐標(biāo)差小于預(yù)定的閾值(高度WID_RATE(=0.2)倍)時,對兩個矩形設(shè)定水平配置標(biāo)志1。
當(dāng)兩個矩形為相鄰矩形時,它們應(yīng)當(dāng)出現(xiàn)在參照矩形的寬度乘以WID_RATE_DIST(=0.5)的范圍內(nèi)。
b)當(dāng)分組中兩個相鄰矩形滿足尺寸和形狀的預(yù)定條件、并且一個矩形的左邊緣和另一矩形的右邊緣之間的坐標(biāo)差小于預(yù)定的閾值(寬度的WID_RATE倍)時,對兩個矩形設(shè)定垂直配置標(biāo)志2。
當(dāng)兩個矩形為相鄰矩形時,它們應(yīng)當(dāng)出現(xiàn)在參照矩形的高度乘以WID_RATE_DIST倍的范圍內(nèi)。
c)在分組中比較設(shè)定了水平配置標(biāo)志的矩形數(shù)和設(shè)定了垂直配置標(biāo)志的矩形數(shù)。字符串的方向?qū)?yīng)于比較的結(jié)果。
d)通過“分組中配置的矩形數(shù)/滿足諸如尺寸或形狀的預(yù)定條件的所有矩形數(shù)”獲得分組中配置的矩形比率作為分組中矩形的條件,通過圖34中所示的方法獲得表示分組中矩形最高(most)頻率值的高度。由large_rect標(biāo)記高度×3。矩形的高度大于固定尺寸(在100dpi下為23個點)并小于large_rect。
e)當(dāng)配置在分組中的矩形的比率大于預(yù)定的閾值NUM_RATE(0.8)時,保持該分組為字符串似然的分組。否則,分組作為干擾被除去。
分組中的點“·”和破折號“——”作為字符保持。
然后,執(zhí)行干擾分組的刪除處理(在標(biāo)志S27)。在該處理中,抽取并刪除由兩個矩形組成并作為對應(yīng)于形狀或坐標(biāo)作為干擾對待的分組。換言之,由兩個矩形組成并且兩個矩形的上邊緣和下邊緣(或左邊緣與右邊緣)之間的距離小的分組作為干擾被刪除,除非確定這兩個矩形在一行。
圖41是用于說明根據(jù)本發(fā)明的一實施例用來刪除干擾分組的處理的示意圖。
圖41中,假設(shè)抽取兩個包圍矩形272和273作為一個分組,并產(chǎn)生圍繞兩個包圍矩形272和273的包圍矩形271。這種情形下,包圍矩形272的下邊緣與包圍矩形273的下邊緣一致。然而,由于包圍矩形272的上邊緣大大不同于包圍矩形273的上邊緣,故包圍矩形272和273作為干擾對待,并從作為字符串的似然的分組中刪除其分組。
實際上,執(zhí)行以下的處理。
假設(shè)分組的兩個矩形的平均高度由hei表示,其平均寬度由wid表示,用于設(shè)定閾值的比率DEL_RATE為0.1,則保留滿足以下條件的分組。不滿足以下條件的分組作為干擾被刪除。
(|第一矩形的上邊緣坐標(biāo)-第二矩形的上邊緣坐標(biāo)|<hei×DEL_RATE以及|第一矩形的下邊緣坐標(biāo)-第二矩形的下邊緣坐標(biāo)|<hei×DEL_RATE或者(|第一矩形的左邊緣坐標(biāo)-第二矩形的左邊緣坐標(biāo)|<wid×DEL_RATE以及第一矩形的右邊緣坐標(biāo)-第二矩形的右邊緣坐標(biāo)|<wid×DEL_RATE)然后,執(zhí)行從分組中抽取具有相同顏色的圖案的處理(在步驟S28)。在該處理中,獲得分組的代表性顏色作為分組中矩形的代表性顏色的平均顏色。還沒有被抽取并且具有類似于原始圖象的顏色的圖案被抽取為分組范圍中的二值圖象。對抽取的圖案設(shè)定用于二值圖象的標(biāo)號,以便獲得連接部分的包圍矩形。當(dāng)獲得的包圍矩形大于預(yù)定的閾值時,把包圍矩形作為字符圖案的一部分添加到分組中。
例如,獲得分組中的圖案的平均顏色(RGB)。在分組的包圍矩形范圍內(nèi)獲得具有與平均顏色類似的顏色的象素。從二值圖象中除去圖案部分。對保留的二值圖象設(shè)定用于二值圖象的標(biāo)號,以便獲得新的包圍矩形。當(dāng)新的包圍矩形的尺寸和形狀超過預(yù)定的閾值時,把新的包圍矩形中的圖案添加到分組中。
在該處理中,由于字符寬度信息、顏色偏移等等在以上處理中失去并作為字符的一部分的圖案能夠被重新抽取。這種圖案的一例是字符“ぱ”的濁音符號“″”圖42A和42B是用于說明根據(jù)本發(fā)明的一實施例用于從分組中抽取具有相同顏色的圖案的處理的示意圖。
圖42A中,使用圖23所示從步驟S11到S27的處理,假設(shè)從輸入圖象抽取了字符串“クロ-ハル化ヘの3つの成功モデル”,并產(chǎn)生了圍繞該字符串的包圍矩形280。這例子中,濁音“″”從“ク”和“ハ”中除去。
這種情形下,由于濁音符號“″”的顏色與“ク”的顏色之間的差超過預(yù)定的閾值,故濁音符號“″”被分為不同于“ク”的組的一個組。
此外,由于濁音符號“″”的顏色與“ハ”的顏色之間的差超過預(yù)定的閾值,故濁音符號“″”被分為不同于“ハ”的組的一個組。
在步驟S16的處理中,由于對待抽取的字符串局部顏色進(jìn)行比較,當(dāng)由于顏色剪裁字符串的顏色局部變化時,字符的一部分丟失。
這樣,重新抽取“グ”的濁音符號“””和“バ”的濁音符號“″”。當(dāng)這些濁音符號被重新抽取時,對應(yīng)于整個字符串“クロ-ハル化ヘの3つの成功モデル”,獲得其代表性顏色。從標(biāo)號圖象抽取具有代表性顏色的類似顏色的圖案。濁音,減輕了字符串局部顏色的變化的影響。于是,能夠抽取“グ”和“バ”的濁音符號“″”。當(dāng)重新抽取濁音符號“″”時,濁音符號“″”的抽取范圍限制在包圍矩形280。當(dāng)限制了抽取范圍時,能夠避免被抽取的字符的濁音符號“″”從范圍伸出。這樣,由于被處理的圖案的范圍變得狹窄,在不破壞抽取精確性的情形下能夠以高速執(zhí)行處理處理。
于是,如圖42B所示,這樣“グ”和“バ”的符號“″”被正確地抽取,從而能夠從輸入圖象抽取字符串“グロ-バル化ヘの3つの成功モデル”。
作為重新抽取的結(jié)果,當(dāng)字符串“グロ-バル化ヘの3つの成功モデル”和相同顏色的干擾在包圍矩形280的范圍內(nèi)時,由于干擾也被抽取,故作為干擾除去被重新抽取的小圖案。
實際上,執(zhí)行以下步驟a)到h)。
a)存儲在分組矩形信息中的代表性顏色信息對分組中的所有的矩形求平均,以便獲得分組的代表性顏色(Rm,Gm,Bm)。
b)作為mfw和mfh分別獲得分組的矩形的高度和寬度最頻值。當(dāng)最頻值的寬度mfw和高度mfh大于最小矩形的尺寸的閾值minsize(=2)時,以minsize代替最頻值的寬度mfw和高度mfh。
c)獲得分組的包圍矩形。在包圍矩形的范圍內(nèi),產(chǎn)生一個二值圖象。該二值圖象的所有象素設(shè)置為“0”。
d)檢驗分組的包圍矩形范圍內(nèi)原始圖象的象素的顏色。當(dāng)原始圖象象素的顏色(R,G,B)和分組的代表性顏色滿足以下關(guān)系時,記錄原始圖象的象素位置。把二值圖象的相同的位置處的象素設(shè)置為“1”。
|Rm-R|+|Gm-G|+|Bm-B|<THR×10(THR=10)e)從二值圖象抽取分組的矩形。只有在先前處理中被漏下并具有與代表性顏色類似的顏色的圖案保留在二值圖象中。
f)對二值圖象設(shè)定用于二值圖象的標(biāo)號,以便獲得連接區(qū)域的包圍矩形。
g)保留滿足以下條件的矩形。刪除其余的矩形。
w<mfw/2以及h<mfh/2
h)組成其余矩形的連接矩形的圖案被添加到分組中。
然后,執(zhí)行用于確定分組的輸出順序的處理(在步驟S29)。在該處理中,當(dāng)抽取了包含字符串的多個分組時,計算分組的包圍矩形的面積。按最大面積的順序存儲分組。所存儲的結(jié)果成為輸出的順序。
然后,執(zhí)行用于產(chǎn)生二值圖案的處理(在步驟S30)。在該處理中,作為二值圖象產(chǎn)生組成分組的圖案,以便能夠把圖案識別為字符。
實際上,執(zhí)行以下步驟a)到c)。
a)產(chǎn)生具有分組的包圍矩形的尺寸的二值圖象。把二值圖象所有的象素設(shè)置為“0”。
b)抽取分組中矩形的標(biāo)號。在相關(guān)矩形中搜索標(biāo)號圖象,抽取具有標(biāo)號的一象素。把在二值圖象中坐標(biāo)處的象素設(shè)置為“1”。
c)對于所有的矩形執(zhí)行步驟b)。作為二值圖象產(chǎn)生組成分組的圖案。
以下將以實際的彩色圖象為例說明上述處理。
圖43A是表示輸入的原始圖象一例的示意圖。在原始圖象中,標(biāo)題字符301和302、圖片303、文本字符304、框305等以彩色打印。標(biāo)題字符301和302作為標(biāo)題抽取。此外,標(biāo)題字符是以一種顏色打印的。
圖43B是表示圖43A中所示的標(biāo)號圖象的示意圖。
在圖43中,標(biāo)號圖象是通過圖23所示步驟13處的顏色標(biāo)號處理獲得的。在顏色標(biāo)號處理中,對相同顏色的連接區(qū)域設(shè)定相同的標(biāo)號。產(chǎn)生具有相同標(biāo)號的圖案的包圍矩形。這里,包圍矩形的數(shù)量計有大約幾千到幾萬個。
圖43C是表示從圖43B所示的標(biāo)號圖象獲得的所考慮的矩形的示意圖。
圖43C中,通過圖23中所示步驟S14處的所考慮的矩形抽取處理獲得所考慮的矩形。在圖43C中所示的例子中,抽取了具有矩形號碼1到64的所考慮的矩形。
在步驟S14所考慮的矩形抽取處理中,在從標(biāo)號圖象獲得的包圍矩形之中,具有預(yù)定尺寸的包圍矩形作為所考慮的矩形對待。這樣,應(yīng)當(dāng)被抽取的標(biāo)題字符301和302的包圍矩形從圖43C所示的區(qū)域311和312漏掉。在這例子中,應(yīng)當(dāng)在圖43C中所示的區(qū)域312中被抽取的標(biāo)題字符302是對應(yīng)于圖43A中所示的字符“に”然而,在圖43B所示的標(biāo)號圖象中,對組成字符“に”的三個筆畫設(shè)定了不同的標(biāo)號。這樣,筆畫的包圍矩形的尺寸變小。
在所考慮的矩形抽取處理中,當(dāng)把包圍矩形分類為組時,對應(yīng)于文本字符304的包圍矩形313(未示出)、干擾的包圍矩形、和框305的包圍矩形能夠從搜索區(qū)域中的參照包圍矩形中被除去。這樣,能夠以高速執(zhí)行該處理。在圖43B所示的狀態(tài)中,包圍矩形的數(shù)目計有幾千到幾萬個。另一方面,在圖43C中,包圍矩形的數(shù)目降低到幾十個。
圖43D是表示分組抽取的結(jié)果的示意圖。
在圖43D中,通過圖23中所示步驟S16處用于抽取具有相同顏色的分組的處理獲得分組抽取的結(jié)果。在圖43D中,產(chǎn)生具有矩形號碼1到21的包圍矩形。在該處理中,從圖43B所示的標(biāo)號矩形獲得的包圍矩形被分類為相同的分組,這些矩形在圖43C所考慮的矩形的預(yù)定范圍內(nèi)并具有類似的代表性顏色。產(chǎn)生出圍繞分類為相同組的包圍矩形的一個包圍矩形。
這樣,產(chǎn)生對應(yīng)于圖43A所示標(biāo)題字符301“日經(jīng)400社經(jīng)營者アンケ-ト”的分組的包圍矩形321。此外,產(chǎn)生對應(yīng)于標(biāo)題字符302“貿(mào)易不均衡の要因に微妙な差”的分組的包圍矩形322。在分組處理中,組成標(biāo)題字符301和302各個字符串可被組合成一個字符串。此外,應(yīng)當(dāng)在圖43C所示的區(qū)域311和312中被抽取的標(biāo)題字符301和302的包圍矩形323和324能夠被正確地抽取。
當(dāng)具有類似的代表性顏色的另一包圍矩形的標(biāo)號圖象不能在圖43C中所示的所考慮的矩形的預(yù)定區(qū)域中獲得時,由于所考慮的矩形不組成分組,故所考慮的矩形被除去。
圖44A是表示重新分組的結(jié)果的示意圖,其中圖43D所示分組抽取結(jié)果對應(yīng)于字符線的粗度被重新分組。
圖44A中,通過圖23所示步驟S18處用于對應(yīng)于字符線粗度對包圍矩形重新分組的處理而獲得重新分組的結(jié)果。作為一分組產(chǎn)生具有矩形號碼0到12的包圍矩形。在該處理中,產(chǎn)生對應(yīng)于圖43A所示標(biāo)題字符“日經(jīng)400社經(jīng)營者アンケ-ト”的分組的包圍矩形331。此外,產(chǎn)生對應(yīng)于圖43A所示標(biāo)題字符“貿(mào)易不均衡の要因に微妙な差”的分組的包圍矩形332。
在圖43D所示的包圍矩形之中,不能被分組為對應(yīng)于字符線粗度的那些包圍矩形被除去。
圖44D是表示重疊的矩形被組合的結(jié)果的示意圖。
圖44D中,通過圖23所示步驟S20處用于組合重疊矩形的處理獲得矩形的組合結(jié)果。產(chǎn)生了具有矩形號碼0到12的包圍矩形。在該處理中,對應(yīng)于圖片303的區(qū)域333中的大部分包圍矩形是重疊的,故它們被組合并被除去。在組合處理中,減少了被處理的包圍矩形的數(shù)目。這樣,處理能夠以高速進(jìn)行。
圖44C是表示從輸入圖象中抽取可能是字符串的分組的結(jié)果的示意圖。
圖44C中,通過圖23所示步驟S26處的用于對應(yīng)于矩形配置抽取可能是字符串的分組的處理而獲得可能是字符串的分組。圖44C中,具有矩形號碼0和1的包圍矩形被抽取為一個分組。在該處理中,用于圖44B所示區(qū)域342中的分組的包圍矩形是隨機配置的,故它們被刪除。這樣,只抽取圖44B中所示區(qū)域341中的包圍矩形。
圖44D是表示從圖44C所示的圖象中抽取分組的圖案的結(jié)果的示意圖。
圖44D中,通過圖23中所示步驟S28處用于從分組中抽取具有相同顏色的圖案的處理獲得分組的圖案。抽取圖44C中獲得的分組的包圍矩形的區(qū)域中的一個圖案。這樣,獲得了圖43A所示的標(biāo)題字符301“日經(jīng)400社經(jīng)営者アンケ-ト”和標(biāo)題字符302“貿(mào)易不均衡の要因に微妙な差”。
圖45A是表示從圖43A中所示的圖象抽取的標(biāo)題第一選擇對象的圖案的示意圖。圖48B是表示從圖43A中所示的圖象抽取的標(biāo)題第二選擇對象的圖案的示意圖。
在圖45A和45B所示的例子中,對應(yīng)于所抽取的圖案的包圍矩形401和402的區(qū)域尺寸,設(shè)定從圖43A所示的原始圖象抽取的標(biāo)題的輸出順序。
這樣,圖43A所示的標(biāo)題字符302“貿(mào)易不均衡の要因に微妙な差”作為標(biāo)題的第一選擇對象而出現(xiàn)。圖43A所示的標(biāo)題字符302“日經(jīng)400社經(jīng)営者アンケ-ト”作為標(biāo)題的第二選擇對象而出現(xiàn)。
如上所述,根據(jù)本發(fā)明,能夠?qū)?yīng)于所考慮的象素的顏色信息設(shè)定用于確定是否為相鄰的象素設(shè)定相同標(biāo)號的距離閾值而不是固定值。這樣,就能夠精確地確定象素是否在相同的范圍。于是,能夠從所希望的區(qū)域精確地抽取象素。
這樣,根據(jù)本發(fā)明的一個方面,使用縮小圖象能夠獲得看作為相同顏色的區(qū)域。于是,能夠以高速執(zhí)行用于抽取看作為相同顏色的區(qū)域的處理。
這樣,根據(jù)本發(fā)明的一個方面,從縮小圖象獲得了標(biāo)號圖象的包圍矩形和標(biāo)號、其代表性顏色、相同標(biāo)號區(qū)域中的顏色數(shù)、及顏色。對應(yīng)于獲得的結(jié)果,獲得了原始圖象的矩形。標(biāo)號處理能夠在矩形中進(jìn)行。這樣,標(biāo)號處理能夠以高速進(jìn)行。
于是,根據(jù)本發(fā)明的一個方面,從縮小圖象獲得了所有顏色和相似性,并確定了縮小圖象的區(qū)域的相似性。當(dāng)區(qū)域的顏色的相似性小于預(yù)定的閾值時,能夠為區(qū)域設(shè)定相同的標(biāo)號。這樣,能夠按肉眼所見抽取所需的矩形。
這樣,對各個閾值元素設(shè)定三個顏色要素。當(dāng)兩個顏色的所有三個顏色要素小于各個閾值時,這些顏色可被當(dāng)作相同的顏色對待。于是,能夠降低閾值表的容量。此外,標(biāo)號處理能夠非常精確地進(jìn)行。
根據(jù)本發(fā)明的一個方面,對應(yīng)于其圖案的顏色信息和幾何信息,把輸入圖象的圖案分類。這樣,當(dāng)從彩色輸入圖象抽取顏色相同的標(biāo)題區(qū)域時,限制了彩色輸入圖象的部分作為標(biāo)題區(qū)域。抽取的是具有相同顏色的圖案。與標(biāo)題區(qū)域分離的相同顏色圖案從被分類的對象中除去。此外,對應(yīng)于顏色信息,可能從被分類的對象中除去不是標(biāo)題字符的小圖案和大圖案。這樣,能夠改進(jìn)標(biāo)題區(qū)域抽取處理的速度。
根據(jù)本發(fā)明的一個方面,為了聚類輸入圖象的象素,對所考慮的象素的顏色信息與同它相鄰的象素的顏色信息進(jìn)行比較。當(dāng)比較輸入圖象的所有象素時,相鄰象素顏色信息的比較處理的次數(shù)成為輸入圖象的象素數(shù)的平方。反之,當(dāng)所考慮的象素的顏色信息與同它相鄰的象素的顏色信息進(jìn)行比較時,比較處理的次數(shù)變?yōu)檩斎雸D象的象素數(shù)。這樣,聚類處理能夠以高速進(jìn)行。
此外,當(dāng)輸入圖象的象素被分類為組時,預(yù)定范圍內(nèi)的集群被分類為組。這樣,相同集群中的象素能夠被集成處理。這樣,就不必處理單個象素。于是,分組處理能夠以高速進(jìn)行。此外,在輸入?yún)^(qū)域被限制的范圍內(nèi),相同顏色的集群能夠被分類為相同的分組。這樣,分組處理能夠以更高的速度進(jìn)行。
根據(jù)本發(fā)明的一個方面,抽取對應(yīng)于預(yù)定的分辨率被確定為顏色偏移范圍內(nèi)的區(qū)域作為相同顏色的區(qū)域。這樣,由于輸入圖象的圖案的顏色是以基色的點的尺寸的組合表示的,即使與讀取分辨率相關(guān)作為不同顏色的集合檢測到輸入圖象中表示為相同顏色的區(qū)域,當(dāng)讀取輸入圖象時,能夠精確地抽取相同顏色的范圍的區(qū)域。于是,能夠防止輸入圖象中表示為相同顏色的圖案的部分漏掉或丟失。
根據(jù)本發(fā)明的一個方面,在使用標(biāo)號圖象所產(chǎn)生的包圍矩形之中,能夠把成為用于設(shè)定搜索區(qū)域參照的包圍矩形限制在預(yù)定尺寸范圍內(nèi)的包圍矩形。這樣,當(dāng)從輸入圖象抽取字符區(qū)域時,能夠防止把諸如干擾的小圖案和諸如背景或框架的大圖案的包圍矩形,選擇為用于搜索字符串的搜索區(qū)域的參照。于是,能夠抑制把非字符串的圖案分類為組。這樣,只有字符串能夠被有效地抽取。
由于在從所考慮的包圍矩形的預(yù)定范圍內(nèi)設(shè)定用于搜索字符串的搜索區(qū)域,故被搜索的只能是所考慮的包圍矩形的鄰近區(qū)域內(nèi)的字符。當(dāng)從輸入圖象抽取標(biāo)題等時,能夠防止把與標(biāo)題分離的以及不組成標(biāo)題的字符抽取為標(biāo)題的分組。這樣,被有效地抽取的只能是標(biāo)題字符。
根據(jù)本發(fā)明的一個方面,在顏色逐漸變化的情形下,只有當(dāng)比較相鄰象素的顏色信息時,由于相鄰象素的顏色相似,這些相似被設(shè)定相同的顏色。當(dāng)跟蹤這些相似時,色差累計。這樣,可能對不同顏色的象素設(shè)定相同的標(biāo)號。然而,根據(jù)本發(fā)明,由于能夠比較已經(jīng)設(shè)定了標(biāo)號的圖案的顏色信息,故能夠?qū)?yīng)于累計的色差值執(zhí)行標(biāo)號處理。這樣,當(dāng)對應(yīng)于相鄰象素的顏色信息的比較結(jié)果對其顏色逐漸變化的區(qū)域設(shè)定標(biāo)號時,能夠防止對不同顏色的象素設(shè)定相同的顏色。
根據(jù)本發(fā)明的一個方面,對應(yīng)于由特定顏色表示的區(qū)域中相鄰象素之間的色差,對標(biāo)號處理設(shè)定閾值。這樣,由于輸入圖象是通過半色調(diào)打印方法打印的,故即使輸入圖象以相同顏色表示,與讀取分辨率相關(guān)可以作為不同顏色的集合檢測出該圖象。這種情形下,能夠精確地抽取相同顏色的區(qū)域。這樣,能夠防止圖案的一部分從輸入圖象中表示為相同顏色的區(qū)域漏掉或丟失。
根據(jù)本發(fā)明的一個方面,通過半色調(diào)打印方法產(chǎn)生的顏色是在計算機上虛擬產(chǎn)生的。無需通過使用實際打印的文檔分析通過半色調(diào)打印方法顏色的變化,即可區(qū)分出通過半色調(diào)打印方法顏色的變化。
根據(jù)本發(fā)明的一個方面,產(chǎn)生了存儲顏色的亮度值和對應(yīng)于打印模型的每一讀取分辨率的相鄰象素之間色差的色差表。這樣,不論從實際打印文檔讀取數(shù)據(jù)的裝置的分辨率如何,能夠易于獲得用于確定從實際打印文檔讀取的顏色是否相同的閾值。
根據(jù)本發(fā)明的一個方面,對輸入圖象估計打印模型的讀取分辨率。這樣,能夠使用計算機上虛擬產(chǎn)生的打印模型處理由裝置讀取的實際打印的文檔。使用由打印模型產(chǎn)生的閾值能夠?qū)τ裳b置讀取的實際的打印文檔進(jìn)行標(biāo)號處理。
根據(jù)本發(fā)明的一個方面,估計一種分辨率作為輸入圖象的打印模型的讀取分辨率,該分辨率使記錄在色差表中的顏色的亮度值和色差對整個輸入圖象是最優(yōu)確認(rèn)的。這樣,對于由裝置讀取的實際的打印文檔,由打印模型產(chǎn)生的最優(yōu)閾值用于整個輸入圖象,以便進(jìn)行標(biāo)號處理。
根據(jù)本發(fā)明的一個方面,估計一種分辨率作為輸入圖象的局部區(qū)域的打印模型的讀取分辨率,該分辨率使記錄在色差表中的顏色的亮度值和色差對輸入圖象的局部區(qū)域是最優(yōu)確認(rèn)的。這樣,在由裝置從實際打印文檔讀取的輸入圖象中,對于超過整個輸入圖象的預(yù)定閾值的區(qū)域,標(biāo)號處理能夠?qū)哂袑υ搮^(qū)域最優(yōu)的閾值的區(qū)域進(jìn)行。于是,能夠改進(jìn)標(biāo)號處理的精確性。
根據(jù)本發(fā)明的一個方面,打印模型的讀取分辨率是一固定值。這樣,能夠省略實際打印文檔的模型分辨率估計處理。因而,能夠以高速執(zhí)行該處理。
根據(jù)本發(fā)明的一個方面,能夠把標(biāo)號圖象分類為組。這樣,能夠把通過標(biāo)號處理抽取的字符區(qū)域分類為字符串區(qū)域。因而,能夠有效地抽取標(biāo)題。
根據(jù)本發(fā)明的一個方面,對應(yīng)于標(biāo)號圖象的包圍矩形的顏色信息和幾何信息把標(biāo)號區(qū)域分類為相同組。這樣,當(dāng)從輸入的彩色圖象抽取具有相同顏色的標(biāo)題區(qū)域時,從輸入的彩色圖象的限制區(qū)域抽取了圖案。能夠從被分類的對象除去與標(biāo)題區(qū)域分離的圖案。此外,能夠從被處理的對象刪除非標(biāo)題字符的諸如干擾的小圖案及諸如背景的大圖案。于是,能夠改進(jìn)對標(biāo)題區(qū)域抽取處理的速度。由于標(biāo)號圖案由包圍矩形表示,故包含字符等的復(fù)雜圖案能夠以簡單的形狀表示。這樣,能夠降低用于圖案的存儲量。此外,當(dāng)獲得圖案的位置關(guān)系時,能夠簡化處理處理。
根據(jù)本發(fā)明的一個方面,對包含在包圍矩形中的圖案的代表性顏色進(jìn)行比較并分類為組。這樣,能夠把標(biāo)號的圖案作為包圍矩形進(jìn)行比較。當(dāng)對應(yīng)于顏色信息圖案被分類為組時,不必比較組成圖案的每一象素。這樣,能夠降低被比較的元素數(shù),故處理能夠以高速進(jìn)行。
根據(jù)本發(fā)明的一個方面,在所考慮的包圍矩形的預(yù)定范圍內(nèi)出現(xiàn)的另一包圍矩形被分類為組。這樣,當(dāng)從輸入圖象抽取標(biāo)題區(qū)域等時,能夠把被分類為組包圍矩形的范圍限制在適合于標(biāo)題區(qū)域的范圍。能夠省略對從標(biāo)題區(qū)域伸出的區(qū)域的分組處理。于是,處理能夠以高速進(jìn)行。
根據(jù)本發(fā)明的一個方面,抽取包含在所考慮的包圍矩形的預(yù)定范圍內(nèi)每一垂直和水平坐標(biāo)中的包圍矩形。這樣,能夠有效地搜索在所考慮的包圍矩形的預(yù)定范圍內(nèi)的另一包圍矩形。
根據(jù)本發(fā)明的一個方面,包圍矩形的矩形號碼按坐標(biāo)值的順序存儲。按坐標(biāo)值的升序搜索矩形號碼。使具有相等的坐標(biāo)值的矩形號碼與坐標(biāo)值相關(guān)。這樣,當(dāng)為每一坐標(biāo)值準(zhǔn)備用于存儲包圍矩形的矩形號碼的區(qū)域時,需要對應(yīng)于出現(xiàn)在所考慮的包圍矩形預(yù)定范圍的包圍矩形的存儲量。反之,根據(jù)本發(fā)明,由于存儲了對應(yīng)于實際包圍矩形的坐標(biāo)值,故能夠降低存儲量。
根據(jù)本發(fā)明的一個方面,當(dāng)兩個包圍矩形出現(xiàn)在所考慮的包圍矩形的預(yù)定范圍內(nèi),且兩個包圍矩形的代表性顏色的色差小于從色差表獲得的色差時,這兩個包圍矩形被分類為相同組。這樣,當(dāng)從輸入圖象抽取標(biāo)題區(qū)域等時,能夠把要被分類的包圍矩形限制在適用于標(biāo)題區(qū)域的范圍。當(dāng)對包圍矩形進(jìn)行比較且使用顏色信息把圖案分類為組時,能夠考慮實際打印文檔的讀取操作中顏色的變化。這樣,能夠以高速執(zhí)行處理。而且,改進(jìn)了讀取精確性。
根據(jù)本發(fā)明的一個方面,對應(yīng)于標(biāo)號圖象的圖案粗度標(biāo)號圖象分類為組。這樣,由于能夠把具有不同粗度的字符分類為不同的組,當(dāng)從輸入圖象抽取標(biāo)題等時,故只能把由具有相同粗度的字符組成的字符串抽取為標(biāo)題。這樣,能夠改進(jìn)標(biāo)題的抽取精確性。
根據(jù)本發(fā)明的一個方面,對應(yīng)于圖案的面積和圖案的輪廓長度的比率獲得圖案的粗度。這樣,能夠精確地獲得圖案的粗度。
根據(jù)本發(fā)明的一個方面,不搜索已經(jīng)作為圖案輪廓被搜索過的象素。這樣,防止了成為圖案輪廓的象素被重新抽取。于是,能夠改進(jìn)輪廓跟蹤處理的速度。
根據(jù)本發(fā)明的一個方面,從包圍矩形的分組中刪除超過字符尺寸預(yù)定范圍的包圍矩形。這樣,即使圖形、圖片等的圖案出現(xiàn)在標(biāo)題的鄰域內(nèi),且圖形或圖片的圖案被分類為組成標(biāo)題的字符的分組,也能夠從分組中除去圖形或圖片的圖案。這樣,能夠改進(jìn)抽取標(biāo)題的精確性。
根據(jù)本發(fā)明的一個方面,對應(yīng)于包圍矩形的配置抽取字符串。這樣,能夠區(qū)分開其包圍矩形無規(guī)則分布的區(qū)域以及其包圍矩形規(guī)則分布的區(qū)域。于是,能夠把其包圍矩形規(guī)則分布的區(qū)域作為標(biāo)題區(qū)域?qū)Υ?。這樣,被有效抽取的只能是標(biāo)題區(qū)域。
根據(jù)本發(fā)明的一個方面,不同尺寸的字符被分類為不同的組。于是,當(dāng)從輸入圖形抽取標(biāo)題等時,只把由相同尺寸的字符組成的字符串作為標(biāo)題對待。這樣,能夠改進(jìn)對標(biāo)題抽取的精確性。
根據(jù)本發(fā)明的一個方面,能夠確定分組中的包圍矩形是否配置在一行。配置在一行中的包圍矩形能夠作為標(biāo)題區(qū)域?qū)Υ?。這樣,能夠有效地從輸入圖形抽取標(biāo)題。
根據(jù)本發(fā)明的一個方面,對應(yīng)于分組的圖案的代表性顏色計算分組的代表性顏色。這樣,對應(yīng)于標(biāo)題區(qū)域的所有顏色,能夠計算標(biāo)題的顏色。能夠減輕標(biāo)題區(qū)域局部區(qū)域中色差的影響。于是,能夠改進(jìn)對標(biāo)題區(qū)域的抽取精確性。
根據(jù)本發(fā)明的一個方面,能夠?qū)?yīng)于分組的代表性顏色組合分組的相鄰的包圍矩形。這樣,即使由于輕微的色差組成同一標(biāo)題的字符被分為不同的分組,這些字符也能夠被分類到相同的組。于是,能夠有效地抽取標(biāo)題區(qū)域。
根據(jù)本發(fā)明的一個方面,當(dāng)包圍矩形的尺寸差在預(yù)定范圍且分組中的包圍矩形的代表性顏色差在預(yù)定范圍時,分組的相鄰的包圍矩形被組合。這樣,當(dāng)分組的包圍矩形被組合時,能夠被有效地抽取的只是組成同一標(biāo)題的字符。
根據(jù)本發(fā)明的一個方面,對應(yīng)于分組的代表性顏色,在分組的包圍矩形范圍內(nèi)重新抽取原始圖象的象素。這樣,即使組成標(biāo)題的字符包含濁音符號或半濁音符號,且由于標(biāo)題區(qū)域的局部色差致使?jié)嵋舴柣虬霛嵋舴枏臉?biāo)題的分組中漏掉,能夠?qū)嵋舴柣虬霛嵋舴柕念伾c標(biāo)題區(qū)域的整個顏色進(jìn)行比較,以便重新抽取濁音符號或半濁音符號。于是,能夠改進(jìn)對標(biāo)題抽取的精確性。
根據(jù)本發(fā)明的一個方面,已經(jīng)被重新抽取的且大于預(yù)定閾值的圖案的包圍矩形被添加到分組中。這樣,當(dāng)從標(biāo)題區(qū)域重新抽取濁音符號或半濁音符號時,即使與標(biāo)題顏色相同的輕微的干擾出現(xiàn)在標(biāo)題區(qū)域,被刪除的只能是干擾。于是,能夠改進(jìn)對標(biāo)題的抽取精確性。
根據(jù)本發(fā)明的一個方面,對應(yīng)于分類為組的包圍矩形的區(qū)域、其位置、以及其位置的關(guān)系,確定分組中圖案的輸出順序。這樣,即使從輸入圖象抽取多個標(biāo)題選擇對象,能夠估計標(biāo)題的相似性。于是,可按標(biāo)題最大性相似性的順序輸出標(biāo)題選擇對象。
根據(jù)本發(fā)明的一個方面,使用分類為組的包圍矩形中的標(biāo)號圖象產(chǎn)生二值圖案。能夠有效地識別從彩色圖象抽取的圖案。
雖然對本發(fā)明就其優(yōu)選實施例進(jìn)行了展示和說明,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明白,在不背離本發(fā)明的精神和范圍的情形下,可以在其中作出在其形式及細(xì)節(jié)上以上和其它各種改變、省略、和增加。
權(quán)利要求
1.一種彩色圖象處理裝置,該裝置包括用于輸入彩色圖象并輸出彩色圖象信號的彩色圖象輸入裝置;用于保持彩色圖象信號的保持裝置;用于處理彩色圖象信號的計算裝置;用于設(shè)定對應(yīng)于所考慮的象素的顏色信息的閾值的閾值設(shè)定裝置;以及用于比較相鄰象素的顏色信息并當(dāng)它們的距離為閾值或更小時為象素設(shè)定相同標(biāo)號的標(biāo)號裝置。
2.如權(quán)利要求1所述的一種彩色圖象處理裝置,還包括用于獲得設(shè)定了相同標(biāo)號的象素的平均顏色的平均顏色計算裝置;以及用于比較與所考慮的象素相鄰的象素的顏色和平均顏色的平均顏色比較裝置,其中只有當(dāng)比較的結(jié)果處于預(yù)定的范圍時,所述標(biāo)號裝置才為象素設(shè)定相同的標(biāo)號。
3.一種彩色圖象處理裝置,該裝置包括用于輸入彩色圖象并輸出彩色圖象信號的彩色圖象輸入裝置;用于保持彩色圖象信號的保持裝置;用于處理彩色圖象信號的計算裝置;用于縮小彩色圖象信號并產(chǎn)生縮小圖象的圖象縮小裝置,其中從縮小的圖象獲得相同顏色的區(qū)域,并且只對應(yīng)于從縮小圖象抽取的顏色從原始圖象抽取對應(yīng)于所獲得的區(qū)域的區(qū)域。
4.如權(quán)利要求3所述的一種彩色圖象處理裝置,還包括標(biāo)號裝置,該裝置用于獲取縮小圖象的標(biāo)號圖象和標(biāo)號區(qū)域的包圍矩形、其代表性顏色、每一標(biāo)號區(qū)域中的顏色數(shù)、及顏色,獲取與之對應(yīng)的原始圖象的矩形,搜索與矩形中的代表性顏色具有類似顏色的象素,并從被搜索的象素開始進(jìn)行標(biāo)號處理。
5.如權(quán)利要求3所述的一種彩色圖象處理裝置,還包括標(biāo)號裝置,該裝置用于確定縮小圖象的區(qū)域的所有的顏色和相似性,并且當(dāng)區(qū)域顏色的相似性小于閾值時,為區(qū)域設(shè)定相同的標(biāo)號。
6.如權(quán)利要求1所述的一種彩色圖象處理裝置,其中所述閾值設(shè)定裝置以可變的三種顏色要素閾值的各要素確定區(qū)域顏色的相似性,當(dāng)區(qū)域的三種顏色要素的色差距小于可變的閾值時,確定區(qū)域的顏色相似性為0,當(dāng)區(qū)域的三種顏色要素的色差距等于或大于該閾值時,確定區(qū)域的顏色相似性為大于閾值。
7.一種圖案抽取裝置,包括對組成彩色圖象的第一顏色設(shè)定第一閾值的第一閾值設(shè)定裝置;對組成彩色圖象的第二顏色設(shè)定第二閾值的第二閾值設(shè)定裝置;用于設(shè)定第一顏色的象素為彩色圖象第一考慮的象素的第一考慮的象素設(shè)定裝置;用于設(shè)定第二顏色的象素為彩色圖象第二考慮的象素的第二考慮的象素設(shè)定裝置;用于檢測與第一考慮的象素相鄰的第一相鄰象素的第一相鄰象素檢測裝置;用于檢測與第二考慮的象素相鄰的第二相鄰象素的第二相鄰象素檢測裝置;第一標(biāo)號裝置,用于當(dāng)?shù)谝豢紤]的象素的顏色與第一相鄰的象素的顏色之間的差小于第一閾值時,為第一相鄰的象素設(shè)定與第一考慮的象素相同的標(biāo)號;以及第二標(biāo)號裝置,用于當(dāng)?shù)诙紤]的象素的顏色與第二相鄰的象素的顏色之間的差小于第二閾值時,為第二相鄰的象素設(shè)定與第二考慮的象素相同的標(biāo)號。
8.一種圖案抽取裝置,包括用于計算輸入圖象圖案的顏色信息的顏色信息計算裝置;用于計算圖案的幾何信息的幾何信息計算裝置;用于對應(yīng)于顏色信息和幾何信息對圖案進(jìn)行分類的分類裝置。
9.一種圖案抽取裝置,包括用于對應(yīng)于相鄰象素的顏色信息對輸入圖象的象素進(jìn)行聚類的聚類裝置;以及用于對應(yīng)于通過所述聚類裝置獲得的聚類的顏色信息和幾何信息,把集群分類為組的分組裝置。
10.一種圖案抽取裝置,用于在按第一分辨率確定區(qū)域為相同顏色、而按第二分辨率確定為不同顏色的情形下,從按第二分辨率確定的顏色變化范圍內(nèi)抽取區(qū)域作為具有相同顏色的區(qū)域。
11.一種圖案抽取裝置,包括用于對應(yīng)于輸入圖象的彩色信息產(chǎn)生標(biāo)號圖象的標(biāo)號圖象產(chǎn)生裝置;用于產(chǎn)生標(biāo)號圖象的包圍矩形的包圍矩形產(chǎn)生裝置;用于從由所述包圍矩形產(chǎn)生裝置產(chǎn)生的包圍矩形,抽取具有預(yù)定范圍尺寸的包圍矩形的第一包圍矩形抽取裝置;用于從所述第一包圍矩形抽取裝置抽取的包圍矩形設(shè)定預(yù)定范圍的搜索區(qū)域的搜索區(qū)域設(shè)定裝置;第二包圍矩形抽取裝置,用于從由所述包圍矩形產(chǎn)生裝置產(chǎn)生的包圍矩形抽取在搜索區(qū)域中、或局部配置在搜索區(qū)域中的包圍矩形;分組裝置,用于對應(yīng)于由所述第一包圍矩形抽取裝置抽取的包圍矩形的區(qū)域的顏色信息及由所述第二包圍矩形抽取裝置抽取的包圍矩形的區(qū)域的顏色信息,把由所述第一包圍矩形抽取裝置抽取的包圍矩形及由所述第二包圍矩形抽取裝置抽取的包圍矩形分類為組;以及用于對應(yīng)于由所述分組裝置分類的組抽取字符串的字符串抽取裝置。
12.一種圖案抽取裝置,包括用于比較輸入圖象相鄰象素的顏色信息的第一顏色比較裝置;用于對由第一顏色信息比較裝置比較過的象素的顏色信息與同其相鄰的標(biāo)號圖象的顏色信息進(jìn)行比較的第二顏色信息比較裝置;以及用于對應(yīng)于所述第一顏色信息比較裝置的比較結(jié)果和所述第二顏色信息比較裝置的比較結(jié)果為象素設(shè)定標(biāo)號的標(biāo)號裝置。
13.如權(quán)利要求12所述的圖案抽取裝置,其中標(biāo)號圖象的顏色信息是設(shè)定了相同標(biāo)號的象素的顏色信息的平均值。
14.一種圖案抽取裝置,包括用于計算以預(yù)定顏色表示的區(qū)域的相鄰象素之間的色差的色差計算裝置;用于設(shè)定對應(yīng)于色差的閾值的閾值設(shè)定裝置;以及用于為與使用對應(yīng)于閾值的預(yù)定顏色表示的象素相鄰的象素設(shè)定標(biāo)號的標(biāo)號裝置。
15.如權(quán)利要求14所述的一種圖案抽取裝置,該裝置還包括具有基色網(wǎng)格的打印模型產(chǎn)生裝置,基色點配置在網(wǎng)格的格子點處,網(wǎng)格被旋轉(zhuǎn)并彼此疊加,基色點的尺寸是變化的,以便產(chǎn)生作為打印模型的顏色。
16.如權(quán)利要求15所述的一種圖案抽取裝置,該裝置還包括用于產(chǎn)生色差表的色差表產(chǎn)生裝置,色差表存儲由所述打印模型產(chǎn)生裝置產(chǎn)生的顏色的亮度值以及對應(yīng)于打印模型每一讀取分辨率中的亮度值的相鄰象素之間的色差。
17.如權(quán)利要求16所述的一種圖案抽取裝置,該裝置還包括模型分辨率的估計處理單元,用于對于輸入圖象估計打印圖案的讀取分辨率。
18.如權(quán)利要求17所述的一種圖案抽取裝置,其中所述模型分辨率估計處理裝置估計一分辨率作為輸入圖象的打印模型的讀取分辨率,記錄在色差表中的該分辨率的顏色亮度值和色差對整個輸入圖象最優(yōu)確認(rèn)。
19.如權(quán)利要求17所述的一種圖案抽取裝置,其中所述模型分辨率估計處理裝置估計一分辨率作為輸入圖象的局部區(qū)域的打印模型的讀取分辨率,記錄在色差表中的該分辨率的顏色亮度值和色差對輸入圖象的局部區(qū)域最優(yōu)確認(rèn)。
20.如權(quán)利要求14所述的一種圖案抽取裝置,其中所述模型分辨率估計處理單元使打印模型的讀取分辨率成為一固定值。
21.如權(quán)利要求17所述的一種圖案抽取裝置,還包括用于對由標(biāo)號裝置標(biāo)號的標(biāo)號圖象分類為組的分組裝置。
22.如權(quán)利要求21所述的一種圖案抽取裝置,其中所述分組裝置具有用于計算由所述標(biāo)號裝置標(biāo)號的標(biāo)號圖象圖案的包圍矩形的包圍矩形計算裝置;用于計算標(biāo)號圖象圖案的顏色信息的顏色信息計算裝置;用于計算包圍矩形的幾何信息的幾何信息計算裝置;以及用于確定是否把標(biāo)號圖象圖案分類為對應(yīng)于顏色信息和幾何信息的相同的組的確定裝置。
23.如權(quán)利要求22所述的一種圖案抽取裝置,其中顏色信息是包含在包圍矩形中的圖案的代表性顏色。
24.如權(quán)利要求22所述的一種圖案抽取裝置,其中幾何信息是出現(xiàn)在所考慮的包圍矩形的預(yù)定范圍中的另一包圍矩形。
25.如權(quán)利要求24所述的一種圖案抽取裝置,其中所述幾何信息計算裝置具有用于存儲對應(yīng)于每一包圍矩形的垂直和水平坐標(biāo)的矩形號碼的矩形號碼存儲裝置;用于抽取包含在所考慮的包圍矩形的預(yù)定范圍內(nèi)每一垂直和水平坐標(biāo)中的矩形號碼的矩形號碼抽取裝置;以及相鄰矩形抽取裝置,用于抽取作為所考慮的包圍矩形預(yù)定范圍內(nèi)另一矩形包含在垂直和水平坐標(biāo)兩者內(nèi)的矩形號碼。
26.如權(quán)利要求25所述的一種圖案抽取裝置,其中所述矩形號碼存儲裝置按坐標(biāo)值順序存儲包圍矩形的矩形號碼,且其中矩形號碼抽取裝置按坐標(biāo)值升序搜索矩形號碼并抽取具有相等坐標(biāo)值的矩形號碼。
27.如權(quán)利要求23所述的一種圖案抽取裝置,其中當(dāng)兩個包圍矩形出現(xiàn)在所考慮的包圍矩形的預(yù)定范圍內(nèi),且兩個包圍矩形的代表性元素的色差小于從色差表獲得的色差時,所述確定裝置把兩個包圍矩形分類到相同組。
28.如權(quán)利要求21所述的一種圖案抽取裝置,其中所述分組裝置把標(biāo)號圖象分類為對應(yīng)于標(biāo)號圖象圖案粗度的一組。
29.如權(quán)利要求28所述的一種圖案抽取裝置,其中分組裝置具有用于獲得圖案輪廓長度的輪廓追蹤裝置;用于獲得圖案區(qū)域的區(qū)域計算裝置;以及用于獲得對應(yīng)于圖案區(qū)域與圖案輪廓長度之比的圖案粗度的粗度計算裝置。
30.如權(quán)利要求29所述的一種圖案抽取裝置,其中所述輪廓追蹤裝置從作為圖案輪廓的第一象素搜索作為圖案輪廓的第二象素,其搜索方式是,第二象素從與第一象素相鄰并與第一象素的源象素相鄰的八個象素中搜索。
31.如權(quán)利要求22所述的一種圖案抽取裝置,還包括用于估計對應(yīng)于由所述分組裝置分類為一組的包圍矩形尺寸的字符尺寸的字符尺寸估計裝置;以及用于從包圍矩形組中刪除超出字符尺寸預(yù)定范圍的包圍矩形的矩形刪除裝置。
32.如權(quán)利要求22所述的一種圖案抽取裝置,還包括字符串方向估計裝置,該裝置用于對應(yīng)于由分組裝置分類為一組的包圍矩形的配置估計字符串的方向;以及字符串抽取裝置,該裝置用于對應(yīng)于由分組裝置分類為一組的包圍矩形的配置抽取字符串。
33.如權(quán)利要求22所述的一種圖案抽取裝置,還包括再分組裝置,用于對應(yīng)于由所述分組裝置分類為一組的包圍矩形的尺寸把一組中的包圍矩形再分組。
34.如權(quán)利要求22所述的一種圖案抽取裝置,還包括用于從由所述分組裝置分類為一組的包圍矩形中抽取預(yù)定尺寸的包圍矩形的包圍矩形抽取裝置;用于為被抽取為相鄰包圍矩形且其上邊緣或下邊緣封閉的包圍矩形設(shè)定水平配置標(biāo)記的水平配置標(biāo)記設(shè)定裝置;用于為被抽取為相鄰包圍矩形且其左邊緣或右邊緣封閉的包圍矩形設(shè)定垂直配置標(biāo)記的垂直配置標(biāo)記設(shè)定裝置;用于對應(yīng)于水平配置標(biāo)記和垂直配置標(biāo)記確定分組的字符串方向的字符串方向確定裝置;以及字符串確定裝置,用于對應(yīng)于分組的包圍矩形數(shù)與對應(yīng)于確定了字符串方向的標(biāo)記數(shù)的比率,確定分組的包圍矩形是否為字符串包圍矩形。
35.如權(quán)利要求22所述的一種圖案抽取裝置,還包括用于產(chǎn)生由所述分組裝置分類為一組的包圍矩形的包圍矩形產(chǎn)生裝置;以及用于對應(yīng)于由所述分組裝置分類為組的圖案的代表性顏色,計算分組的代表作顏色的代表性顏色計算裝置。
36.如權(quán)利要求35所述的一種圖案抽取裝置,還包括用于對應(yīng)于組的代表性顏色組合分組的相鄰包圍矩形的分組組合裝置。
37.如權(quán)利要求36所述的一種圖案抽取裝置,其中當(dāng)包圍矩形的尺寸差在預(yù)定的范圍且分組的代表性顏色的差別在預(yù)定范圍時,所述分組組合裝置組合分組的相鄰包圍矩形。
38.如權(quán)利要求35所述的一種圖案抽取裝置,還包括用于對應(yīng)于分組的代表性顏色在分組的包圍矩形范圍內(nèi)再抽取原始圖象的象素的再抽取裝置。
39.如權(quán)利要求38所述的一種圖案抽取裝置,還包括用于對再抽取的象素進(jìn)行數(shù)字化的數(shù)字化裝置;用于為數(shù)字化的圖象設(shè)定標(biāo)號的第二標(biāo)號裝置;以及用于把已經(jīng)由所述第二標(biāo)號裝置設(shè)定了標(biāo)號且大于預(yù)定閾值的包圍矩形添加到分組的添加裝置。
40.如權(quán)利要求22所述的一種圖案抽取裝置,還包括用于對應(yīng)于由所述分組裝置分類為組的包圍矩形的區(qū)域、其位置、及它們的位置關(guān)系,確定分組中圖案的輸出順序的輸出順序確定裝置。
41.如權(quán)利要求22所述的一種圖案抽取裝置,還包括用于產(chǎn)生二進(jìn)制圖案的二進(jìn)制圖案產(chǎn)生裝置,對包圍矩形分類為組的標(biāo)號圖象設(shè)定為級別1。
42.一種圖案抽取裝置,它包括用于產(chǎn)生對應(yīng)于包含在輸入圖象中的圖案的包圍矩形的包圍矩形產(chǎn)生裝置;第一包圍矩形抽取裝置,用于從由所述包圍矩形產(chǎn)生裝置產(chǎn)生的包圍矩形,抽取預(yù)定范圍尺寸內(nèi)或預(yù)定范圍位置處的包圍矩形;搜索區(qū)域設(shè)定裝置,用于從所述第一包圍矩形抽取裝置抽取的包圍矩形設(shè)定預(yù)定區(qū)域內(nèi)一搜索區(qū)域;第二包圍矩形抽取裝置,用于從由所述包圍矩形產(chǎn)生裝置產(chǎn)生的包圍矩形抽取在搜索區(qū)域中、或局部配置在搜索區(qū)域中的包圍矩形;以及圖案抽取裝置,用于對應(yīng)于所述包圍矩形抽取裝置的抽取結(jié)果從輸入圖象抽取特定圖案。
43.如權(quán)利要求42所述的圖案抽取裝置,其中所述第二包圍矩形抽取裝置具有矩形號碼存儲裝置,用于存儲對應(yīng)于由所述包圍矩形產(chǎn)生裝置產(chǎn)生的包圍矩形的垂直和水平坐標(biāo)的矩形號碼;矩形號碼抽取裝置,用于從由所述第一包圍矩形抽取裝置抽取的包圍矩形,抽取包含在預(yù)定區(qū)域中的垂直和水平坐標(biāo)中的矩形號碼;以及相鄰矩形抽取裝置,用于將矩形號碼是由所述矩形號碼抽取裝置抽取的,且包含在包圍在其垂直和水平坐標(biāo)兩者中的矩形作為搜索區(qū)域中或局部配置在搜索區(qū)域中的包圍矩形抽出。
44.如權(quán)利要求43中所述的圖案抽取裝置,其中所述矩形號碼存儲裝置按坐標(biāo)值的順序存儲包圍矩形的矩形號碼,以及其中所述矩形號碼抽取裝置按坐標(biāo)值的升序搜索矩形號碼,并抽取具有相等坐標(biāo)值的矩形號碼。
45.一種圖案抽取方法,該方法包括以下步驟計算所考慮的彩色圖象的象素的顏色信息;以及控制閾值,用于對應(yīng)于所述顏色信息確定是否為與所考慮的象素相鄰的象素設(shè)定與所考慮的象素相同的標(biāo)號。
46.一種圖案抽取方法,包括以下步驟當(dāng)彩色圖象的顏色以顏色要素點的組合表示時,在對應(yīng)于彩色圖象的讀取分辨率的相鄰象素之間的色差范圍內(nèi)抽取一區(qū)域作為相同顏色的區(qū)域。
47.一種圖案抽取方法,包括以下步驟以基色點的組合組成一彩色圖象;以預(yù)定的分辨率讀取象素圖象;對于彩色圖象的顏色計算以預(yù)定分辨率讀取的相鄰象素之間的亮度差;以及對應(yīng)于亮度差抽取輸入圖象相同顏色的范圍。
48.一種圖案抽取方法,包括以下步驟當(dāng)區(qū)域被放大時,即使區(qū)域看上去具有不同顏色,如果以肉眼觀看區(qū)域為相同顏色,則把區(qū)域作為相同的區(qū)域抽取。
49.一種圖案抽取方法,包括以下步驟按第二分辨率檢測區(qū)域中的色差,該色差按第一分辨率確定為相同顏色;設(shè)定一閾值用于確定對應(yīng)于按第二分辨率檢測的色差區(qū)域的顏色是否為相同;以及對應(yīng)于閾值抽取按第一分辨率確定為相同顏色的區(qū)域。
50.一種圖案抽取方法,包括以下步驟產(chǎn)生對應(yīng)于輸入圖象顏色信息的標(biāo)號圖象;從標(biāo)號圖象抽取預(yù)定范圍尺寸的第一圖案;從第一圖案抽取預(yù)定范圍內(nèi)的第二圖案;對應(yīng)于第一圖案的顏色信息和第二圖案的顏色信息把第一圖案和第二圖案分類為組;以及從分類為組的圖案抽取字符串。
51.一種圖案抽取方法,包括以下步驟為具有預(yù)定范圍色差的連接象素設(shè)定相同的標(biāo)號;抽取具有預(yù)定范圍尺寸的圖案,為該圖案設(shè)定第一標(biāo)號;從設(shè)定了第一標(biāo)號的圖案抽取在預(yù)定范圍中設(shè)定了第二標(biāo)號的圖案;對設(shè)定了第一標(biāo)號的圖案顏色與設(shè)定了第二標(biāo)號的圖案的顏色進(jìn)行比較;當(dāng)設(shè)定了第一標(biāo)號的圖案和設(shè)定了第二標(biāo)號的圖案之間的色差處于預(yù)定范圍時,把設(shè)定了第一標(biāo)號的圖案和設(shè)定了第二標(biāo)號的圖案分類為相同組。
52.一種存儲介質(zhì),計算機從其讀取使計算機執(zhí)行以下步驟的程序?qū)?yīng)于所考慮的彩色圖象的象素的顏色信息設(shè)定閾值;以及比較相鄰象素的顏色信息,并當(dāng)顏色信息的距離小于閾值時為相鄰象素設(shè)定相同的標(biāo)號。
53.一種存儲介質(zhì),計算機從其讀取使計算機執(zhí)行以下步驟的程序計算輸入圖象圖案的顏色信息;計算圖案的幾何信息;以及對應(yīng)于顏色信息和幾何信息對圖案分類。
54.一種存儲介質(zhì),計算機從其讀取使計算機執(zhí)行以下步驟的程序按第二分辨率檢測區(qū)域中的色差,該色差按第一分辨率確定為相同顏色;設(shè)定一閾值用于確定對應(yīng)于按第二分辨率檢測的色差區(qū)域的顏色是否為相同;以及對應(yīng)于閾值抽取按第一分辨率確定為相同顏色的區(qū)域。
全文摘要
閾值設(shè)定單元設(shè)定對應(yīng)于所考慮的象素的顏色信息的閾值。標(biāo)號單元比較相鄰象素的顏色信息,并當(dāng)象素的顏色信息之間的距離小于由閾值設(shè)定單元設(shè)定的閾值時,對象素設(shè)定相同的標(biāo)號。
文檔編號G06T5/00GK1234569SQ99101770
公開日1999年11月10日 申請日期1999年2月5日 優(yōu)先權(quán)日1998年2月6日
發(fā)明者勝山裕 申請人:富士通株式會社