亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

圖像積累設(shè)備與方法

文檔序號:6362149閱讀:97來源:國知局
專利名稱:圖像積累設(shè)備與方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種系統(tǒng),用于通過例如掃描器之類的輸入裝置等將文件與圖樣轉(zhuǎn)換為圖像數(shù)據(jù),給圖像數(shù)據(jù)增加處理信息并積累結(jié)果數(shù)據(jù);同時涉及一種設(shè)備,用在圖像識別中來識別圖像中的分格線的結(jié)構(gòu),還涉及到進(jìn)行上述處理的方法。
背景技術(shù)
近來,將信息存儲于紙上的傳統(tǒng)方法已轉(zhuǎn)換為將數(shù)據(jù)存儲于電子媒體上的方法。例如,電子文件編排系統(tǒng)可以用如圖像掃描器等光電轉(zhuǎn)換器等將紙上存儲的文件轉(zhuǎn)換為光盤,磁盤上的經(jīng)過轉(zhuǎn)換文件圖像,同時將檢索用關(guān)鍵字之類的管理信息添加到此已轉(zhuǎn)換的文件圖像上。
由于在上述方法中是把文件作為圖像數(shù)據(jù)存儲,與在字符識別技術(shù)中編碼好來存儲文件所有字符的方法相比,就需有較大的盤存儲容量。但是上述方法易配合以高的處理速度,同時還可以原樣地存儲含有異于字符的數(shù)據(jù)的圖像與表。另一方面,所存儲的信息則要利用附加的管理信息如關(guān)鍵字、序號等與文件圖像在一起檢索。這類常規(guī)的系統(tǒng)需要耗費很大的氣力與時間來指派關(guān)鍵字,不能提供用戶友好工藝。
為了解決上述傳統(tǒng)系統(tǒng)的這一棘手問題,可將文件的標(biāo)題設(shè)定為關(guān)鍵字,自動地提取,作為字符識別,并編碼用于和文件圖像一同存儲。
當(dāng)前,識別字符的速度達(dá)每秒幾十個字符,處理一張標(biāo)準(zhǔn)的文件頁(約21cm×29.5cm)需約30秒至數(shù)分鐘。為此,建議不要去識別整個文件的所有字符,而首先是從文件的圖像中提取必要的標(biāo)題,然后去識別它們。
通過光電轉(zhuǎn)換器來讀取文件從獲得的文件圖像來提取文件的一部分例如文件標(biāo)題的傳統(tǒng)技術(shù),已描述于本發(fā)明申請人提出的美國專利申請08/694503與日本專利申請H7-341983中,題名為“用于從文件圖像中提取標(biāo)題的標(biāo)題提取設(shè)備及其相應(yīng)方法”。圖1A表明了這種標(biāo)題提取設(shè)備的原理。
圖1A所示的標(biāo)題提取設(shè)備包括字符區(qū)生成單元1、字符串區(qū)生成單元2以及標(biāo)題提取單元3。字符區(qū)生成單元1通過標(biāo)記圖像元素的連接成份而提取通過掃描器等從文件圖像輸入的例如作為字符一部分的部分圖案。然后通過組合若干個部分圖案而提取(生成)一字符區(qū)。字符串區(qū)生成單元2組合一批字符區(qū)而提取(生成)一字符串區(qū)。標(biāo)題提取單元3則提取作為一標(biāo)題區(qū)的可能是一標(biāo)題的字符串區(qū)。
此時,標(biāo)題提取單元3則利用一些顯著的點,例如頂部與中心位置、比文件主體字符大小大的字符大小、字下劃線的表示,等等,作為標(biāo)題區(qū)的概率。此概率表示為各個字符串區(qū)的分?jǐn)?shù),用來依照從最高分到最低分的秩序獲得標(biāo)題區(qū)的一批候選者。在上面所述的方法中,能夠從不含表的文件中提取標(biāo)題區(qū)。
而當(dāng)文件含有表時,標(biāo)題提取單元3則在字符中區(qū)生成單元2于該表中提取一字符串后,在考慮到字符數(shù)的條件下來提取標(biāo)題區(qū)。例如,表明隱含標(biāo)題存在性的項目名稱的字符數(shù),如“Subject”、“Name”等等是比較小的。構(gòu)成表示標(biāo)題本身的字符串的字符數(shù)則可能較大,例如“...relatiug to...”。這樣,可能是一個標(biāo)題的字符串便能夠從相鄰的字符串利用其中的字符數(shù)探測出。
但是,存在著許多使用分格線的表格式文件,例如單據(jù)票證等。于是,上述傳統(tǒng)的技術(shù)就有著很少可能從表中成功地提取出標(biāo)題的問題。
例如當(dāng)標(biāo)題是寫在表的中心或底部周圍時,僅僅依靠優(yōu)先從頂部提取字符串是不可能正確地提取標(biāo)題的。此外,如圖1B所示,批準(zhǔn)欄11位于表的頂部。要是在此批準(zhǔn)欄11中存在有許多過量的字符串,如“general monager”(總經(jīng)理)、“manager”(經(jīng)理)“sub-manager”(副經(jīng)理)、“person in charge”(負(fù)責(zé)人)等,則這些字符串將被優(yōu)先提取,從而就不能正確地提取標(biāo)題。
如項目名稱12與標(biāo)題13相組合的結(jié)果所表示,標(biāo)題可以寫于項目名稱12之下而不是在其右側(cè)。此時項目名稱與標(biāo)題便只能根據(jù)相鄰字符串字符數(shù)的信息來識別。此外,在日文中,項目名稱不僅寫作水平的而且也有寫成垂直的。于是就很難明確項目名稱的位置。當(dāng)一個文件包含兩個表時,標(biāo)題有可能位于較小表上的某處。
由于包含表的文件可以寫作不同格式,表的前述概率便取決于各個文件,因而便降低了從表中提取標(biāo)題的精確性。要是輸入文件圖像的狀態(tài)不佳,則提取的精確性將進(jìn)一步降低。
在電子文件編排系統(tǒng)中,提取的標(biāo)題區(qū)通過光學(xué)字符閱讀器(OCR)進(jìn)行字符識別生成字符碼,并將其作為管理信息添加到圖像上。這樣便可以用字符碼來檢索數(shù)據(jù)庫的圖像。
這時,要是可由OCR讀取標(biāo)題區(qū)中的字符串就不會有問題。但要是背景顯示紋理圖形或字符是設(shè)計的字型,則當(dāng)前的OCR不能識別字符串。于是這時不能將管理信息添加到圖像上。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供設(shè)備與方法以提取合適的管理信息,用來管理各種格式下的文件圖像,同時提供根據(jù)此管理信息來累積圖像的設(shè)備與方法。
具有本發(fā)明的管理信息提取設(shè)備與圖像累積設(shè)備的圖像管理系統(tǒng)包括用戶入口單元、計算單元、詞典單元、比較單元、提取單元、存儲單元、組生成單元與檢索單元。
根據(jù)本發(fā)明的第一方面,在此提供一種圖像積累設(shè)備,此設(shè)備包括存儲裝置,用來存儲作為積累的圖像的管理信息的圖像信息;以及檢索裝置,用來檢索上述圖像信息。
根據(jù)本發(fā)明的第二方面,在此提供一種圖像積累方法,此方法包括下述步驟存儲用作積累圖像管理信息的圖像信息;以及檢索此圖像信息。


圖1A示明根據(jù)提出的專利申請的標(biāo)題提取設(shè)備的配置;圖1B示明表格式的文件;圖2A示明管理信息提取設(shè)備的原理;圖2B示明管理信息提取過程;圖3是表明在學(xué)習(xí)一種表格形式時所進(jìn)行的過程的第一流程圖;圖4是表明在作業(yè)中所進(jìn)行的過程的第一流程圖;圖5示明信息處理設(shè)備的配置;圖6是表明在學(xué)習(xí)一種表格形式時所進(jìn)行的過程的第二流程圖;圖7示明分格線結(jié)構(gòu)提取過程;圖8表明管理信息位置的確定過程;圖9表明粗分類中第一分格線的特征;圖10表明粗分類中第二分格線的特征;圖11表明粗分類中第三分格線的特征;圖12表明粗分類中第四分格線的特征;圖13表明提取相交字符串的方法;圖14表明相交字符串;圖15是表明交比計算過程的流程圖;圖16表明采用交比指示輪廓的分格線的特征;圖17是表明作業(yè)中所進(jìn)行過程的第二流程圖;圖18表明DP(動態(tài)程序設(shè)計)匹配;
圖19是表明DP匹配過程的流程圖;圖20是表明管理信息位置計算過程流程圖(1);圖21是表明管理信息位置計算過程流程圖(2);圖22是表明管理信息位置計算過程流程圖(3);圖23表明應(yīng)用用戶輸入方式與自動學(xué)習(xí)方式提取管理信息的過程;圖24是表明表內(nèi)管理信息提取過程流程圖;圖25是表明無分格線的文件圖像的管理信息提取過程的流程圖;圖26是表明管理信息存儲過程的流程圖;圖27是管理信息存儲表;圖28是表明管理信息檢索過程的流程圖;圖29是相關(guān)曲線圖;圖30是表明形式識別過程的流程圖;圖31表明基準(zhǔn)寬度、基準(zhǔn)高度與基準(zhǔn)點;圖32表明水平分格線;圖33表明垂直分格線;圖34表明有關(guān)水平分格線的細(xì)節(jié)信息;圖35表明有關(guān)垂直分格線的細(xì)節(jié)信息;圖36表明模型匹配過程的流程圖;圖37是匹配表;圖38表明閾的功能;圖39表明順序反轉(zhuǎn)的情形;圖40表明指定兩組相對應(yīng)的分格線的情形;圖41表明由最佳路徑集表示的分格線的對應(yīng)關(guān)系;圖42是表明節(jié)點布置過程的流程圖;圖43是表明路徑生成過程的流程圖(1);圖44是表明路徑生成過程的流程圖(2);圖45表明存儲單元的節(jié)點串;
圖46表明應(yīng)用細(xì)節(jié)信息的確定過程;圖47是表明最佳路徑集確定過程的流程圖;圖48是表明節(jié)點數(shù)更新過程的流程圖;具體實施方式
下面參考附圖詳述本發(fā)明的最佳實施例。
圖2A表明包括本發(fā)明的管理信息提取設(shè)備與信息積累設(shè)備的圖像管理系統(tǒng)的原理。此系統(tǒng)包括本發(fā)明的第一、第二、第三與第四組成部分且包括用戶輸入單元21、計算單元22、詞典單元23、比較單元24、提取單元25、存儲單元26、組生成單元27與檢索單元28。
根據(jù)本發(fā)明的第一組成部分,計算單元22根據(jù)有關(guān)相對于包含輸入圖像的表區(qū)輪廓部的分格線位置的信息,來計算此輸入圖像中所含管理信息的位置。提取單元25則根據(jù)計算單元22計算出的位置從輸入圖像中提取管理信息。
例如,作為關(guān)于表區(qū)輪廓部的信息,應(yīng)用了表區(qū)的參考尺寸或是接近此表區(qū)輪廓部的參考點的位置。計算單元22將從表區(qū)提取的分格線的位置表示為有關(guān)相對參考點的位置的信息,同時據(jù)包含管理信息的分格線的位置信息來求出管理信息的位置。提取單元25提取對應(yīng)于作為管理信息的位置的圖像數(shù)據(jù)并在必要時識別字符。
通過對于表的輪廓部中或一批方向中的一批參考點獲得了包含管理信息的分格線的相對位置后,即使輸入圖像因中斷或噪聲等而處于劣態(tài)時,也能以良好的精度等提取管理信息。
依據(jù)本發(fā)明的第二組成部分,詞典單元23存儲著一或多個表格形式中分格線結(jié)構(gòu)的特征以及各個表格形式中的管理信息。比較單元24比較輸入圖像中分格線結(jié)構(gòu)特征與詞典單元23中存儲的分格線結(jié)構(gòu)特征。提取單元25根據(jù)比較單元24得到的比較結(jié)果,參考關(guān)于存儲于詞典單元23中管理信息的位置信息,同時提取輸入圖像的管理信息。用戶入口單元21則進(jìn)行詞典單元23中由用戶確定的管理信息位置。
表格形式指形成此表格的分格線的布局結(jié)構(gòu)。詞典單元23預(yù)存儲有分格線結(jié)構(gòu)特征以及用戶入口單元21所確定的管理信息。比較單元24則求得一種表格形式,后者具有的分格線結(jié)構(gòu)特征與輸入圖像中的類似。提取單元25從上述表格形式中所明確的位置提取管理信息。
這樣,即使是輸入有各種表格形式的圖像時,通過預(yù)先輸入用戶所要求的管理信息的位置并在此確定的位置從輸入圖像提取管理信息,就能從各個圖像中精確地提取管理信息。
根據(jù)本發(fā)明的第三組成部分,存儲單元26存儲作為積累圖像的管理信息的圖像信息,檢索單元28則檢索此圖像信息。
例如在用于積累許多圖像的電子文件編排設(shè)備中,從各個圖像中提取出的圖像碼的作為管理信息存儲于存儲單元26中。檢索單元28通過例如模板匹配使給定的圖像碼與存儲單元26中的圖像碼比較,檢索圖像信息。
于是,本發(fā)明不僅能存儲/檢索字符碼的管理信息的字符串,而且還能存儲/檢索作為圖像本身的字符串。這樣,例如有紋理的字符、設(shè)計字型、徽標(biāo)等難以正確識別的字符,可以作為管理信息處理。
依據(jù)本發(fā)明的第四組成部分,存儲單元26存儲有關(guān)表格形式的分格線信息。組生成單元27獲得從輸入圖像中提取出的分格線與存儲單元26的分格線信息中所含分格線間一批可能的組合,并從這批組合中提取包含可相互匹配的兩種或多種組合的組,但所提取的組中不得包含另一個組中的組合。比較單元24將輸入的圖像與根據(jù)有關(guān)含于一個或多個提取組中組合的信息作比較。
組生成單元27獲得輸入圖像中的分格線與表格形式中分格線的可能組合,用存儲單元26中存儲的表格形式來識別輸入圖像中的表格形式。與此同時,例如相對于整個表格在尺寸與位置上相互類似的規(guī)格線便作為可能的組合而被檢索。
然后,通過使輸入圖像中所含分格線間的關(guān)系與一表格形式中的分格線間的關(guān)系比較,來確定兩種組合是否匹配。此時,作匹配性檢驗的對象數(shù)可以減少,而通過這樣地形成一個新組,使得它不包括其它組中業(yè)已含有的組合時,就能有效地進(jìn)行這個過程。
比較單元24考慮到各組的最佳集之中含有較多個數(shù)的組合時,就表明輸入圖像與表格形式間有較高的相似性,而確定出具有最高相似性的表格形式作為對應(yīng)于輸入圖形的表格形式。
這樣就能很快地識別輸入的圖像并有效地執(zhí)行管理信息提取過程。
例如,圖2A所示出的用戶輸入單元21對應(yīng)于后述圖5所示的輸入單元43,而詞典單元23與存儲單元26則對應(yīng)于圖5中的外存儲單元45。此外,計算單元22、組生成單元27與檢索單元28則對應(yīng)于圖5中的中央處理機(CPU)41與存儲器42。
根據(jù)本發(fā)明,可以學(xué)習(xí)熟知的表格中的分格線的布局結(jié)構(gòu)供各種應(yīng)用。學(xué)得的信息可用來從未知的表格格式中精確地提取標(biāo)題。為此設(shè)定了表格形式學(xué)習(xí)方式與作業(yè)方式。上述布局結(jié)構(gòu)以后稱作格式結(jié)構(gòu)或表格形式。
圖2B概示了管理信息提取過程。管理信息提取設(shè)備首先在學(xué)習(xí)過程中學(xué)習(xí)已知格式的文件A、B、...中分格線的布局以及正確標(biāo)題區(qū)等之中的用戶明確的位置。然后生成一包括上列信息的布局詞典(格式詞典)31。
上述用戶明確標(biāo)題位置的方式可以是未對文件A與B作出格式識別的用戶輸入方式,或是格式已識別的自動學(xué)習(xí)方式。各種方式中的作業(yè)描述于后。
作業(yè)中,管理信息提取設(shè)備從輸入的未知文件32中提取分格線布局,使此布局與布局詞典31匹配。這樣就能識別格式上與布局詞典中存儲的布局匹配的文件。在這一例子中,文件32的布局與文件A的布局匹配。
然后,管理信息提取設(shè)備參考有關(guān)由對應(yīng)文件A所明確的標(biāo)題位置的信息,并高精確地從文件32的字符串區(qū)提取標(biāo)題。此外,通過指示用戶去明確不僅是標(biāo)題而且是例如日期等的其它標(biāo)記區(qū)作為管理信息,就能高精度地提取有關(guān)各種文件的管理信息。
由于管理信息應(yīng)在用戶于作業(yè)中用掃描器輸入文件時快速而自動地提取,本發(fā)明中采用了以交互操作為特征的高速算法。在這種算法中,首先按粗的分類,通過給輸入文件的相應(yīng)形式明確候選者,高速地進(jìn)行分類過程,然后再進(jìn)行細(xì)分類(識別)。在格式學(xué)習(xí)過程中還進(jìn)行相應(yīng)的過程。
圖3是概示表格形式學(xué)習(xí)方式中過程的流程圖。過程開始時,管理信息提取設(shè)備首先輸入擬學(xué)習(xí)的文件圖像(步驟S1)并提取分格式結(jié)構(gòu)(步驟S2)。然后,管理信息提取設(shè)備詢問用戶有關(guān)管理信息的位置,并指示用戶明確此位置(步驟S3)。
隨后,管理信息提取設(shè)備通過在提取的分格線結(jié)構(gòu)中區(qū)別實線與虛線,而提取用于粗分類的分格線特征(步驟S4),同時提取指明用于詳細(xì)識別的外形(輪廓)的分格線結(jié)構(gòu)(步驟S5)。例如,對數(shù)據(jù)轉(zhuǎn)換穩(wěn)定的分格線結(jié)構(gòu)的特征即用作為粗分類的特征。作為詳細(xì)識別的特征,當(dāng)考慮到高速過程時,則采用與表的輪廓有關(guān)的交比。
之后,管理信息提取設(shè)備在布局詞典31中存儲提取的分格線特征與管理信息所明確的位置步驟S6,而中止此過程。所存儲的信息在作業(yè)方式中作為參考,并用來從未知文件中提取管理信息。
圖4是概示作業(yè)方式中過程的流程圖。當(dāng)過程開始,管理信息提取設(shè)備首先輸入待處理的文件圖像(步驟S11),并提取分格線結(jié)構(gòu)(步驟S12)。
接著,管理信息提取設(shè)備從分格線結(jié)構(gòu)提取粗分類的分格線特征(步驟S13),使它們與布局詞典31中的相應(yīng)信息比較,并進(jìn)行分格線結(jié)構(gòu)的粗分類(步驟S14)。結(jié)果,能與布局詞典31的分格線結(jié)構(gòu)相匹配的布局詞典31中的分格線結(jié)構(gòu)便被提取作候補者。
隨后,管理信息提取設(shè)備從分格線結(jié)構(gòu)中提取指明詳細(xì)識別輪廓的分格線特征(步驟S15),使它們與有關(guān)粗分類中提取出的候補者的對應(yīng)信息比較,并識別分格線結(jié)構(gòu)的細(xì)節(jié)(步驟S16)。在此步驟中,例如對交比進(jìn)行一維匹配過程以明確與輸入文件相對應(yīng)的候補者。
之后,管理信息提取設(shè)備根據(jù)以候補者形式明確的管理信息位置計算輸入文件圖像中管理信息的位置(步驟S17),并中止此過程。這樣,根據(jù)已知文件中由用戶明確的位置信息,就能高精度地從輸入文件圖像中提取管理信息。由于這種表格形式比較過程是在操作中于粗分類和細(xì)節(jié)識別兩個步驟中進(jìn)行的,因而詳細(xì)區(qū)分的候補者是有限的,從而能加速提取過程。
本實施例的管理信息提取設(shè)備可以由圖5所示的信息處理裝置(計算機)來實現(xiàn)。圖5所示的信息處理裝置包括CPU 41、存儲器42、輸入單元43、輸出單元44、外存儲單元45、媒體驅(qū)動單元46、網(wǎng)絡(luò)連接單元47、光電轉(zhuǎn)換單元48,而各個單元通過總線互連。
CPU 41執(zhí)行應(yīng)用存儲器42的程序,并進(jìn)行圖3與4所示的各過程。存儲器42可以是只讀存儲器(ROM)、隨機存儲器(RAM)等。必要的數(shù)據(jù)例如布局詞典31等則暫存于RAM中。
輸入單元43例如可以是鍵盤、定點裝置等,用在用戶輸入請求或指令時。輸出單元44例如可以是顯示裝置、打印機等,用于給用戶發(fā)出詢問或輸出處理結(jié)果時。
外存儲單元45例如可以是磁盤裝置、光盤裝置、磁光盤裝置等,存儲程序與數(shù)據(jù),它也可用作存儲圖像與布局詞典31的數(shù)據(jù)庫。
媒體驅(qū)動單元46驅(qū)動便攜式存儲媒體50并存取其中內(nèi)容。便攜式存儲媒體50可以是任意的計算機可讀的存儲媒體,例如存儲插件、軟磁盤、致密盤只讀存儲器CD-ROM、光盤、磁光盤等。便攜式存儲媒體50不僅存儲數(shù)據(jù)還存儲執(zhí)行各個上述過程的程序。
網(wǎng)絡(luò)連接單元47連到任意的通信網(wǎng)絡(luò)例如局域網(wǎng)(LAN)等,執(zhí)行與通信有關(guān)的數(shù)據(jù)轉(zhuǎn)換。上述處理信息提取設(shè)備通過網(wǎng)絡(luò)連接單元47從外數(shù)據(jù)庫等接收必要的數(shù)據(jù)與程序。光電轉(zhuǎn)換單元48例如可以是圖像掃描器,接收待處理的文件圖像、圖樣等。
下面參看圖6至16說明表格形式學(xué)習(xí)過程中所進(jìn)行的各個步驟。
圖6是流程圖,表明表格形式學(xué)習(xí)過程中執(zhí)行的各個步驟的細(xì)節(jié)。圖6中與圖3中過程步驟上對應(yīng)的步驟采用相同的標(biāo)號。在步驟2的分格線提取過程中,管理信息提取設(shè)備從輸入的文件圖像中提取垂直與水平虛線(步驟S2-1)和垂直與水平實線(步驟S2-2),如圖7所示,然后提取由垂直與水平分格線所包圍的矩形網(wǎng)目(矩形區(qū))(步驟S2-3)。
在提取分格線與矩形網(wǎng)目時,用到了本發(fā)明申請者所公開的工藝設(shè)備,如圖像提取設(shè)備(日本專利(公開)H7-28937)、字符框提取設(shè)備與矩形提取設(shè)備(日本專利申請H7-203259)等。根據(jù)上述工藝設(shè)備,可以不需輸入有關(guān)一格中分格線的位置等信息而從圖像中提取或去掉字符框。下面概述分格線結(jié)構(gòu)的提取過程。
(1)減薄過程、于屏蔽過程減薄垂直與水平線,消除字符與框之間的厚度差。
(2)線段提取過程用相鄰?fù)队胺ㄌ崛≥^長的線段。相鄰?fù)队胺▽⒛繕?biāo)行或列中所含圖像元素的投影值以及周圍的行或列的投影值的和定義為目標(biāo)行或列的投影值。根據(jù)此投影法,圍繞特定的行或列的圖像元素分布可從全局觀點加以識別。
(3)直線提取過程順序地檢索提取出的線段,檢驗等于或大于線段間預(yù)定距離的距離中是否有間斷性。然后將不存在這種間斷性的線段順次組合以提取長的直線。
(4)直線組合過程重新組合提取出的線段。將斷開的兩或多個線段重組成直線。
(5)直線延伸過程因斷裂而縮短的直線只當(dāng)文件寫作為正規(guī)表格式才延伸并復(fù)原至原長。
(6)確定形成部分框的水平線;根據(jù)“字符框提取設(shè)備與矩形提取設(shè)備”(日本專利申請H7-203259)中指出的規(guī)則,形成一排輸入框的一對水平直線,是從表的上部順序地作為形成部分字符框架的水平線按雙線單元提取的。
(7)確定形成部分框的垂直線對于上述輸入框的各行確定形成部分字符框架的垂直線。兩端夠到形成目標(biāo)行的兩條水平線的垂直線定義為形成部分行的垂直線。
(8)矩形網(wǎng)目提取過程形成一框的兩條水平線與兩條垂直線所包圍的矩形網(wǎng)目作為一個字符區(qū)提取。
然后,在步驟S3的管理信息位置的確定過程中,管理信息提取設(shè)備于顯示單元的屏幕上顯示輸入的文件圖像,并指示用戶用鼠標(biāo)去指點表明標(biāo)題的字符串中的任何點,并存儲包含有已點明位置的矩形網(wǎng)目51的位置信息。
有關(guān)矩形網(wǎng)目51的位置信息是根據(jù)表的輪廓上任意交點而確定的,并對應(yīng)于有關(guān)從此交點到矩形網(wǎng)目51的位置的矢量的信息。例如,要是左上頂點52、左下頂點53、右上頂點54、右下頂點55為一矢量的起點,則存儲從各個頂點分別到左上頂點56、左下頂點57、右上頂點58、右下頂點59的差向量A、B、C與D的數(shù)據(jù)。同時還存儲表的高度ho與寬度wo及矩形網(wǎng)目的高度H1與寬度W。
在步驟S4的粗分類分格線特征的提取過程中,管理信息提取設(shè)備首先計數(shù)水平與垂直分格線的交點(步驟S4-1)。然后提取各交點的交叉狀態(tài)以獲得頻率分布(步驟S4-2)。此交叉態(tài)由碼(K1、K2、K3與K4)表示,指明從交點引伸出的垂直或水平分格線的存在性以及分格線的類型。
元素K1指交點上方的分格線。元素K2指交點下方的分格線。元素K3指交點左方的分格線。元素K4指交點右方的分格線。當(dāng)無分格線存在時,各元素的值為0,當(dāng)存在實線時此值為1,當(dāng)存在虛線時此值為2。例如圖9所示交點的交叉態(tài)表示為(1,1,1,1),圖10所示交點的交叉態(tài)表示為(1,1,1,0)。圖11所示交點的交叉態(tài)表示為(0,2,2,2)。圖12所示交點的交叉態(tài)表示為(1,1,2,2)。由于(K1,K2,K3,K4)中的每個元素可以指派三個值中的任一個,可能的碼數(shù)是34(=81)。在步驟S4-2,對81種碼的各個碼求得其發(fā)生數(shù)(頻率)并加以存儲。
下面計算各矩形網(wǎng)目的寬-高比,并計算其頻率分布作為矩形網(wǎng)目的頻率分布(步驟S4-3)。當(dāng)矩形網(wǎng)目的高為H1而且寬為W1時,此寬-高比表示為W1/H1。通過使W1/H1的值從0開始依次增加5,并計算具有對應(yīng)于各個值的寬-高比的矩形網(wǎng)目,可求得此寬-高比的頻率分布。在此同時,超過某個閾值(例如10)的矩形網(wǎng)目則匯點計數(shù)。
在步驟S5的細(xì)節(jié)識別輪廓分格線特征的提取過程中,管理信息提取設(shè)備首先依序地從包括有交點的各行或各列中,在水平與垂直方向上從外部檢索包括四個交點的交點串。
例如在圖13所示分格線結(jié)構(gòu)的情形,當(dāng)從第二行的左端依次檢索四個交點時,檢索到交點65、64、63與62。當(dāng)順序地于第三列從上起檢索四個交點時,檢索到交點66、63、67與68,當(dāng)從這列底部起依序檢索四個交點時,則檢索到交點70、69、68與67。
計算與所檢索的交點串有關(guān)的維堆投影不變量的交比。例如,要是如圖14所示檢索到包括四個交點X1、X2、X3與X4的交點串時,此交比表示為 式中|xi-xj|指交點xi與xj(i,j=1,2,3或4)之間的寬度(距離)。式(1)中的交比例如是依據(jù)圖15所示的流程圖計算的。在交比計算過程開始時,管理信息提取設(shè)備輸入四個交點X1、X2、X3、X4的坐標(biāo)數(shù)據(jù)(步驟S21)。
然后,計算交點X1與X2間的距離而輸入變量a(步驟S22),計算交點X3與X4間的距離而輸入變量b(步驟23),計算交點X1與X3間的距離而輸入變量c(步驟S24),再計算交點X2與X4間的距離輸入變量d(步驟S25)。隨即計算ab/cd,將此結(jié)果作為交比存儲(步驟S26),至此結(jié)束此過程。
這樣,通過計算所有交點串的交比,能夠使圍繞表的輪廓的一系列交點的特征定量化。結(jié)果,此表輪廓的二維特點便為一列一維數(shù)值表示,如圖16所示。這一列交比值以后將稱作交比串。
圖16中,在交比串R〔1〕、R〔2〕、R〔3〕、...R〔n〕對應(yīng)于表明各行最右部特征的交比。在交比中L〔1〕、L〔2〕、L〔3〕、...L〔M〕對應(yīng)于表明各行最左部特征的交比。上交比串U〔1〕、U〔2〕、U〔3〕、...U〔W〕對應(yīng)于指明各行頂點特征的交比。下交比串D〔1〕、D〔2〕、D〔3〕、...D〔V〕對應(yīng)于表明各行底部特征的交比。
一般情況下,由于分格線結(jié)構(gòu)并非在表的最左與最右部分對稱,或是在部分圖像中的線道有可能斷裂或變形,n就并不常常與M匹配。類似地,W也未必與V一致。
將四個方向上的這些交比串組合成一串,就可生成一以各交比的值為元素的特征向量(R〔1〕、...、R〔n〕、L〔1〕、...、L〔m〕,U〔1〕、...、U〔w〕,D〔1〕、...、D〔v〕)。
上例中是把四個交點間距離的比作為表明用于細(xì)節(jié)識別的輪廓的分格線特征。但是也可采用任意多個(至少四個)交點間的距離比。這種情形下,同樣可將這些比排成一維序列來表示上述輪廓特征。
在步驟S6的過程中,管理信息提取設(shè)備于布局詞典31中存儲步驟S3中明確的管理信息位置,以及步驟S4與S5中求得的分格線特征,作為有關(guān)表格式文件的識別信息(表格形式信息)。
下面參看圖17~22描述上述作業(yè)中的各個過程。
圖17是表明學(xué)習(xí)一表格形式中所進(jìn)行的過程的細(xì)節(jié)。圖17中,對應(yīng)于圖4所示步驟的過程步驟賦以相同的標(biāo)號。首先,在步驟S12的分格線結(jié)構(gòu)提取過程中,管理信息提取設(shè)備從輸入的文件圖像中提取垂直與水平虛線(步驟S12-1)、垂直與水平實線(步驟S12-2)以及為垂直與水平分格線所圍成的矩形網(wǎng)目,這和步驟2中學(xué)習(xí)表格形式中進(jìn)行的過程相同。
在步驟S13中粗分類分格線特征提取過程中,管理信息提取設(shè)備計算水平與垂直分格線網(wǎng)的交點數(shù)(步驟13-1),求出各交叉態(tài)的頻率分布,同時計算各矩形網(wǎng)孔的寬-高比的頻率分布,這和步驟4中學(xué)習(xí)表格形式中的過程相同。
在步驟S14的粗分類過程中,管理信息提取設(shè)備應(yīng)用交點數(shù)、交叉態(tài)頻率分布以及矩形網(wǎng)目寬-高比的頻率分布,將獲得的數(shù)據(jù)與有關(guān)布局詞典31中許多表的表格形式信息相比較,用以限制相應(yīng)的表的候選者數(shù)。本例中,考慮到圖像中線道的斷裂或變形,對于交點數(shù)、交叉態(tài)的頻率與矩形網(wǎng)目的寬-高比的頻率的相應(yīng)特征,均設(shè)定了適當(dāng)?shù)念A(yù)定閾值。要是布局詞典31的表格形式信息與預(yù)定允限內(nèi)有關(guān)輸入圖像的信息匹配,則它就被確定為表的候選者。
例如,假定輸入的文件圖像的交點數(shù)是Ki而存儲于布局詞典31中表格形式t的交點數(shù)是kt,則當(dāng)這兩個值之間差的絕對值|ki-kt|在閾值THk內(nèi)時,便將此表格形式t定作候選者。這樣,要是輸入文件圖像的元素與布局詞典31中的表格形式相應(yīng)信息間的差都在各有關(guān)閾值內(nèi),則此表格形式便規(guī)定為與輸入文件對應(yīng)的表格形式的候選者。
由于交點數(shù)、交叉態(tài)、矩形網(wǎng)目頻率分布等特征通常相對于圖像數(shù)據(jù)的波動是穩(wěn)定的,它們可以用作與文件圖像精確比較的數(shù)據(jù)來表明此圖像線道的斷裂或變形情形。
在步驟S15中細(xì)致識別輪廓分格線特征的提取過程中,管理信息提取設(shè)備如同在學(xué)習(xí)表格形式中進(jìn)行的步驟S5的過程中一樣從四個方向計算一維投影不變量。
在步驟S16的細(xì)致識別過程中,管理信息提取設(shè)備只對依據(jù)粗分類的表就候選者比較交比串。在此過程中,這些交比串分別是在四個方向中在輸入的表格形式和所學(xué)習(xí)的表格形式之間相關(guān)聯(lián)的。由于目標(biāo)的表格形式的結(jié)構(gòu)是一種表,分格線的序列在行或列之間是不反轉(zhuǎn)的。因此,只就因考慮到斷裂或變形的分格線的部分損失進(jìn)行動態(tài)程序設(shè)計(DP)匹配。
DP匹配是周知的作為匹配時間序列數(shù)據(jù)如聲音等的一種方法,例如詳述于Kyoritsu出版社出版的,Noboru Funakubo著“圖像識別”p62~67中。在此方法中,給數(shù)據(jù)的局部特征指派了相似性,并在比較兩個數(shù)據(jù)組時,用指派的相似性定義了表明整個對應(yīng)關(guān)系可接受性的評價函數(shù)。確定數(shù)據(jù)的對應(yīng)關(guān)系來獲得此評價函數(shù)的最高值。
圖18表明用DP匹配的右交比串的比較過程。圖18中,輸入表格形式的右交比串R〔1〕、R〔2〕、R〔3〕、...、R〔n〕對應(yīng)于布局詞典31中學(xué)習(xí)的表格形式的右交比串R’〔1〕、R’〔2〕、R’〔3〕、...R’〔n’〕。
在上述比較過程中,考慮了分格線的可靠性,因而由可靠的分格線求得的交點中的交比與由其它分格線求得的交比,它們之間評價函數(shù)的對應(yīng)權(quán)值是不同的。例如,對由可靠的分格線求得的交比的相似性賦予較高的權(quán)值。
圖19是示明用DP匹配的右交比串比較過程的例子的流程圖。過程開始時,管理信息提取設(shè)備首先將輸入表格形式的右交比串存儲于陣列R〔i〕(i=1,2...,n)中,同時將學(xué)習(xí)到的表格形式的存交比串存儲于陣列R’〔k〕(k=1,2,...,n’)中(步驟S31)。
然后,初始化誤差陣列E〔i,k〕(步驟S32),并通過下述遞歸公式(i=1,...,n,k=1,...,n’)進(jìn)行計算(步驟S33)。
E〔i,h〕=min{E〔i-1,k〕+d〔i,k〕,E〔i-1,k-1〕+λ·d〔i,k〕,E〔i,k-1〕+d〔i,k〕} (2)式中E〔i,k〕指,當(dāng)一部分交比串(R〔1〕,...,R〔i〕)與(R’〔1〕,...,R’〔k〕)相關(guān)聯(lián)時,累積誤差的最小值。于是,在計算作業(yè)中將累積誤差用作評價函數(shù)時,E〔i,k〕就提供它的最小值。d〔i,k〕則R〔i〕與R’〔k〕關(guān)聯(lián)時的誤差,例如可由下式計算。
d(i,k)-|R〔i〕-R’〔k〕| (3)前一式中的λ指d〔i,k〕的權(quán)值,而min{}指{}中各元素的最小值。
接著計算包括用來確定E〔n,n’〕值的正交比對應(yīng)關(guān)系的E{n,n’}路徑(步驟S34)。然后將此結(jié)果作為交比串(R〔1〕,...,R〔2〕與(R’〔1〕,...,R’〔n’〕)間的對應(yīng)關(guān)系存儲(步驟S35),而結(jié)束此過程。這樣便確定了為獲得評價函數(shù)的最小值的交比間的對應(yīng)關(guān)系。類似地,對左、頂部與底部的交比串進(jìn)行了比較過程。
在步驟S16中,對由粗分類獲得的所有學(xué)習(xí)的表格形式進(jìn)行了上述一維DP匹配,并將表明最小(最佳)評價函數(shù)的表格形式確定為對應(yīng)于輸入的表格形式的表格形式。這樣,在此細(xì)節(jié)識別中,就能通過一維匹配由利用表結(jié)構(gòu)的外形(輪廓)特征的識別,進(jìn)行高速處理。
在步驟S17的管理信息位置計算過程中,管理信息提取設(shè)備參考布局詞典31檢索細(xì)節(jié)區(qū)別中明確的有關(guān)學(xué)習(xí)表格形式的位置信息,并根據(jù)檢索出的位置信息從輸入的圖像中提取管理信息。
在此過程中,利用上述DP匹配中交比串的對應(yīng)結(jié)果,于各行和各列的兩端的交點(端點)處檢驗匹配水平,以確定這些端點是否為穩(wěn)定的。在一端點處的匹配水平是指輸入表格形式的交比與學(xué)習(xí)形式中交比間對應(yīng)的概率。
例如,由于R〔1〕與R〔1’〕在圖18中是一一對應(yīng),就可確定第一行的右端點不是穩(wěn)定的。由于R〔3〕與R’〔4〕也是一一對應(yīng),因而相應(yīng)行的右端點同樣是穩(wěn)定的。但由于R〔2〕對應(yīng)于R’〔2〕和R’〔3〕兩者,即它們之間不是一一對應(yīng),故可斷定相應(yīng)行的右端點是穩(wěn)定的。這樣,對于各左上、左下、右上、右下頂點求得了穩(wěn)定端點,并以之為所述輪廓上的穩(wěn)定點。
然后根據(jù)上述穩(wěn)定的輪廓點來求出輸入表格形式與學(xué)習(xí)表格形式表中的高度ho與寬度wo,并使它的相互比較而求出學(xué)習(xí)表格形式和輸入表格形式中高度與寬度間的相對比。再據(jù)圖8所示差向量A、B、C與D以及矩形網(wǎng)目的高H1與寬W1計算管理信息的位置。
上述相對比表明了輸入表格形式的表對學(xué)習(xí)表格形式表的放大比或縮小比,并用來使兩表之間的變動標(biāo)準(zhǔn)化。
例如,當(dāng)輸入表格形式的高與寬對圖8所示表的高與寬之比是α?xí)r,則將差向量A、B、C和D乘以α。然后在輸入表格形式的表中,便求得了包含著管理信息的矩形網(wǎng)目中左上頂點的近似位置。類似地,利用差向量B、C與D乘以α所獲得的向量,可以求出矩形網(wǎng)目的右上、左下與右下的頂點,而以右上、左下和右下頂點處的穩(wěn)定輪廓點為起始點。
其次,尋求出位于求得的結(jié)果鄰邊并具有分別近似于H1*α與W1*α的高與寬的矩形網(wǎng)目。然后提取此矩形網(wǎng)目的數(shù)據(jù)作為所需的管理信息。
圖20、21與22是流程圖,表明管理信息位置計算過程的例子。過程開始時,管理信息提取裝置首先輸入DP匹配中與四個方向中交比串相關(guān)聯(lián)的結(jié)果(步驟S41)。
在上述過程中,輸入右交比串(R〔1〕,...,R〔n〕)與R’〔1〕,...,R’〔n’〕的相關(guān)結(jié)果、左交比串(L〔1〕,...,L〔m〕與(L’〔1〕,...,L’〔m’〕)的相關(guān)結(jié)果、上交比串(U〔1〕,...U〔W〕)與U’〔1〕,...,U’〔w’〕)的相關(guān)結(jié)果、以及下交比串(D〔1〕,...,D〔v〕)與(D’〔1〕,...,D’〔v’〕的相關(guān)結(jié)果。
然后,根據(jù)上述數(shù)據(jù)計算出輸入表格形式的穩(wěn)定端點,并把它們確定為穩(wěn)定輪廓點的候選者(步驟S42)。對應(yīng)于這些候選者的交比分別表示為R〔nmin〕、R〔nmax〕、L〔mmin〕、L〔mmax〕,U〔wmin〕、U〔wmax〕、D〔vmin〕與D〔vmax〕。
“nmin指對應(yīng)于表中所有穩(wěn)定的右上點的最小Y坐標(biāo)值的最上點的行數(shù)。“nmax”指對應(yīng)于表中所有穩(wěn)定的最右點的最大Y坐標(biāo)的行數(shù)?!癿min”指表中所有穩(wěn)定的最左點是最高點的行數(shù)?!皀max”指表中所有穩(wěn)定的最左點中最低點的行數(shù)。
“wmin”指對應(yīng)于表中所有穩(wěn)定的最上點中最小x坐標(biāo)值的最左點的列數(shù)?!皐max”指對應(yīng)于表中所有穩(wěn)定的最上點中最大x坐標(biāo)值的最右點的列數(shù)?!皏min”指表中所有穩(wěn)定的最低點中最左點的列數(shù)?!皏max”指表中所有穩(wěn)定的最低點中最右點的列數(shù)。
然后根據(jù)求得的候選者的數(shù)據(jù)計算穩(wěn)定的輪廓點的位置(步驟S43)。求出各個候選者的x與y坐標(biāo)的最大與最小值,而把這些值用作穩(wěn)定的輪廓點的坐標(biāo)元素。
圖20中,例如XMIN{R〔nmin〕,R〔nmax〕,L〔mmin〕,L〔mmax〕,U〔wmin〕,U〔wmax〕,D〔vmin〕與D〔vmax〕}指對應(yīng)于{}中各交比值的端點中x坐標(biāo)的最小值。類似地,XMAX{}指各端點x坐標(biāo)的最大值,YMIN{}指各端點的y坐標(biāo)的最小值,而YMAX{}指各端點的y坐標(biāo)的最大值為簡單起見,這些值XMIN{}、XMAX{}、YMIN{}與YMAX{}分別由XMIN、XMAX、YMIN與YMAX表示。同時,這些穩(wěn)定的輪廓點在左上、右上、右下與右下部的坐標(biāo),分別由(XMIN,YMIN)、(XMAX,YMIN),(XMIN,YMAX)與(XMAX,YMAX)表示。
然后計算詞典表格形式即學(xué)習(xí)表格形式中的穩(wěn)定端點,并把它們規(guī)定為穩(wěn)定輪廓點的候選者(圖21中的步驟S44)。對應(yīng)于這些候選者的交比分別表示為R’〔nmin’〕,R’〔nmax’〕,L’〔mmin’〕,L’〔mmax’〕,U’〔wmin’〕,U’〔wmax’〕,D’〔vmin’〕與D’〔vmax’〕。
nmin’、nmax’、mmin’、mmax’、wmin’、wmax’、vmin’與vmax’的意義與前述nmin、nmax、mmin、mmax、wmin、wmax、vmin與vmax的意義相同。
應(yīng)用獲得的候選者的數(shù)據(jù),按步驟S43中相同過程計算詞典表格形式中穩(wěn)定輪廓點的位置(步驟S45)。在圖21中,XMIN’{}、XMAX’{}、YMIN’{}與YMAX’{}的意義與上述XMIN{}、XMAX{}、YMIN{}與YMAX{}的意義相同。
為簡便見,這些值XMIN’{}、XMAX’{}、YMIN’{}與YMAX’{}分別表示為XMIN’、XMAX’、YMIN’與YMAX’。同時,左上、右上、左下、與右下部處穩(wěn)定輪廓點的坐標(biāo)則分別表示為(XMIN’、YMIN’)、(XMAX’,YMIN’)、(XZMIN’、YMAX’)與(XMAX’,YMAX’)。
根據(jù)步驟S43中獲得的有關(guān)穩(wěn)定輪廓點的坐標(biāo)信息,輸入表格形式中的高h(yuǎn)o與wo可由下式計算(圖22中步驟S46)。
wo=XMAZ-XMIN (4)ho=Y(jié)MAZ-YMIN (5)根據(jù)步驟S45中獲得的有關(guān)穩(wěn)定輪廓點的坐標(biāo)信息,詞典表格形式的高h(yuǎn)o’與寬wo’則按下式計算(步驟S47)。
wo’=XMAZ’-XMIN’ (6)ho’=Y(jié)MAZ’-YMIN’ (7)
應(yīng)用高h(yuǎn)o與ho’和寬wo與wo’。計算了輸入表格形式的大小對詞典表格形式的大小之比Sw與Sh(放大比或縮小比)(步驟S48)。
Sw=wo/wo’ (8)Sh=ho/ho’ (9)獲得了作為始點的,具有詞典表格形式的表中穩(wěn)定輪廓點的差向量中元素的大小,以此作為表明管理信息位置的相對坐標(biāo)值(步驟S49)。這時,來自一批鄰近對應(yīng)于交比R’〔1〕,...,R’〔n’〕、L’〔1〕,...,L’〔m’〕、U’〔1〕,...,U’〔w’〕與D’〔1〕,...,D’〔v’〕的輪廓點中各頂點的差向量作為位置信息預(yù)存儲于詞典31中。
來自上左、上右、下左與下右穩(wěn)定點的相對坐標(biāo)值則分別設(shè)定為(fxm1,fymin1),(fxmaf1,fymin2)、f(xmin2,fymax1)以及(fxmax2,fymax2(。
然后,根據(jù)上述相對坐標(biāo)值以及輸入表格形式的大小對詞典表格形式的大小之比Sw與Sh,對輸入表格形式中管理信息的位置進(jìn)行粗估(步驟S50)。在此過程中,求出具有下述坐標(biāo)值的四個點作為管理信息的位置。
(XMIN+Sw·fxmin1,YMIN+Sh·fymin1)(XMAX-Sw·fxmaz1,YMIN+Sh·fymin2)(ZMIN+Sw·fxmin2,YMAX-sh·fymax1)(XMAX-Sw·fxmax2,YMAX-sb·fymax2)隨即提取包含這些候選者位置的輸入表格形式的矩形網(wǎng)目(步驟S51)。要是此網(wǎng)目的高近似于Sh乘詞典表格形式中明確的矩形網(wǎng)目的高H1,而寬近似于Sw乘詞典表格形式中明確的矩形網(wǎng)目的寬W1,則確定這一矩形網(wǎng)目中含有管理信息。
這時將該矩形網(wǎng)目中的字符串圖像數(shù)據(jù)等作為管理信息輸出(步驟S52),至此結(jié)束此過程。于是,根據(jù)細(xì)節(jié)識別的結(jié)果從輸入圖像中提取出管理信息。
本例中,詞典31將對應(yīng)于此詞典表格形式中交比的一批輪廓點的一部分的差向量作為始點存儲。但是,可將來自所有輪廓點的差向量預(yù)先存儲,來把不僅是近似表的頂點的輪廓點而且是周邊上任意的輪廓點選擇作為穩(wěn)定的輪廓點。
并不是常常需要提取四個穩(wěn)定的輪廓點。具體地說,根據(jù)作為基準(zhǔn)點的任意一個穩(wěn)定的輪廓點,應(yīng)用此參考點位置的相對坐標(biāo)值可以求得管理信息的位置來快速進(jìn)行此過程。一般地說,用于這一過程的穩(wěn)定輪廓點的個數(shù)是任意確定的。
在步驟S51,提取包含四個候選位置的矩形網(wǎng)目。但是可以提取包含一或多個候選位置的矩形網(wǎng)目,或也可以選取這樣的矩形網(wǎng)目,它與一或多個候選位置的距離是在預(yù)定值的范圍內(nèi)。
在上述管理信息提取過程中,輸入文件的表格形式以及管理信息的位置可以在布局詞典31中學(xué)習(xí)并存儲于其中。根據(jù)這種信息,可以處理各種表格形式的文件并能高精度地計算此管理信息的位置。
下面詳述圖6所示步驟S3中確定管理信息位置的方法。在本實施例中,由用戶確定管理信息位置的方法能夠依隨用戶被指示來明白地確定這一位置的用戶輸入方式,或是自動提取管理信息候選者的自動學(xué)習(xí)方式。
在用戶輸入方式中,管理信息提取設(shè)備指令用戶從構(gòu)成圖8所示一中的一批矩形網(wǎng)目中直接確定管理信息的位置。例如,當(dāng)存在大量的具有相同形式設(shè)計圖樣等的文件且在第一個文件中確定了管理信息位置時,則只需從第二個和后續(xù)的文件中讀出位置信息,然后應(yīng)用自動文件輸送裝置來實現(xiàn)批輸入。
在自動學(xué)習(xí)方式中,用前述申請08/684503中所述的標(biāo)題提取技術(shù)來提取作為含有管理信息的區(qū)域的一批候選區(qū)域,由用戶從一批區(qū)域中選取一區(qū)域的一位置是自動學(xué)習(xí)的,而這一位置則確定為繼后作業(yè)的第一候選者。要是用戶不選擇任何候選者但卻任意地確定了一個新位置,則這一位置的信息自動地輸入用戶的交互操作中。
另一方面,前述申請公開的標(biāo)題提取技術(shù)也可應(yīng)用于用戶輸入方式,以從一批候選者中選取管理信息。這時,在圖4所示的過程中于學(xué)習(xí)方式中去識別或區(qū)別一種表格形式,以檢驗輸入圖像是否與詞典31中的表格形式匹配。要是此輸入圖像與詞典31中任一表格形式匹配,則檢索其位置信息并提供給用戶。除非此輸入圖像與詞典31中的任一形式匹配,就應(yīng)通過前述申請的標(biāo)題提取技術(shù)來提取管理信息的候選者。
圖23表明了用上述兩種方式的管理信息提取過程。在圖23所示用戶輸入方式中,管理信息提取設(shè)備根據(jù)前述申請中的技術(shù),于表內(nèi)標(biāo)題提取過程中,從表格形式文件的輸入圖像71中提取管理信息的一批候選者。
圖24是表明表內(nèi)管理信息提取過程的流程圖。過程開始時,管理信息提取設(shè)備讀取文件71并將其作為文件圖像存儲于存儲器中(步驟S61)。本例中,原始圖像是在轉(zhuǎn)換為壓縮圖像之后存儲的。
然后對此文件圖像標(biāo)號,根據(jù)矩形高度的最高頻率值提取大的矩形(步驟S62),從已提出的大的矩形中提取包圍有表的矩形(表矩形)(步驟S63),再從表矩形中選擇包含管理信息的矩形。本例中,例如選擇了占據(jù)最大區(qū)域的表矩形。
隨即,從選擇的表矩形中提取字符串,獲得包圍有字符串的矩形(字符串矩形),并將其坐標(biāo)存儲于存儲器中(步驟S65)。隨即從所存儲的字符串矩形中將具有短寬度或即長大于寬的矩形作為噪聲矩形除去(步驟S66),并將兩或更多個字符串矩形組合成一個矩形(步驟67)。
于上述過程中獲得了從表中提取的字符串矩形。這些字符串矩形可以包含表中的一部分分格線。于是從字符串矩形內(nèi)提取這些規(guī)格線部分并把它們用作分開字符串矩形的邊界(步驟S68)。
再對字符串矩形中的字符計數(shù)以提取與管理信息相對應(yīng)的字符串矩形(步驟S69)。獲得的字符數(shù)用于步驟S72中作為此字符串矩形的一種屬性。
在步驟S68中,對為表中分格線包圍成的各個框提取字符串矩形。如果原表的輪廓不是矩形的,則表外可能存在字符串矩形。于是,當(dāng)搜索上部分界線而字符串矩形沒有表的上部分界分界線時,則可認(rèn)為此字符串矩形是在表外而將其除去(步驟S70)。
然后對表中的字符串矩形依照從最接近左上角的坐標(biāo)的一個矩形的程序開始重排(步驟S71)。當(dāng)此字符串矩表中的字符數(shù)滿足一預(yù)定條件時,則提取此字符串矩形作為管理信息(步驟S72),至此結(jié)束該過程。要是有一批字符串矩形滿足此條件,則可以將它們依照從最接近表矩形在上角的那一個開始的順序確定為候選者。
本例中,于圖像77內(nèi)提取了用于管理信息的三個候選者C1,C2與C3,而管理信息提取設(shè)備的用戶界面78則依照最高優(yōu)先程序的順序把它們提供給用戶。用戶當(dāng)有適當(dāng)?shù)暮蜻x者作為管理信息提供時,即由鼠標(biāo)指點它而將其選出。要是沒有適當(dāng)?shù)暮蜻x者出現(xiàn),則用戶可以用鼠標(biāo)指點另一矩形網(wǎng)目,而把它明確地規(guī)定為管理信息的候選者以對原先的候選者進(jìn)行修正。
管理信息提取設(shè)備學(xué)習(xí)用戶選擇/修正的管理信息的位置,并將此位置信息與分格線結(jié)構(gòu)存儲于詞典31中作為用戶詞典73。這樣,管理信息提取設(shè)備就能在繼后的過程中應(yīng)用由用戶直接確定的位置信息。
在圖23所示自動學(xué)習(xí)方式中,管理信息提取設(shè)備首先參考一批用戶詞典73并識別輸入圖像71、72等的表格形式。
要是表格式的輸入圖像71輸入,并作為參考粗分類與細(xì)節(jié)識別的結(jié)果已然確定它與用戶詞典73的任一表格形式匹配,則將最終表格形式74中明確的位置處的管理信息C1輸出并提供給用戶。要是用戶接受此管理信息C1,就原樣地采用此信息。要是用戶不接受此管理信息,便指令用戶從其它位置信息C2、C3等來選取適當(dāng)?shù)男畔ⅰ?br> 要是輸入圖像71不與用戶詞典73中任一表格形式匹配,則進(jìn)行上述表面管理信息提取過程,并從最終的圖像75中提取管理信息的候選者C1、C2、C3等。用戶界面78將上述候選者按照最高優(yōu)選程序的順序提供給用戶,然后用戶從提供的候選者中選取適當(dāng)?shù)暮蜻x者作為管理信息。要是沒有出現(xiàn)適當(dāng)?shù)暮蜻x者,則可以通過明確另一矩形網(wǎng)目來修正管理信息的候選者。
管理信息提取設(shè)備于輸入圖像71中學(xué)習(xí)用戶選擇的/修正的管理信息位置,并將此位置信息與分格式結(jié)構(gòu)作為用戶詞典73而存儲于詞典31中供給后續(xù)過程之用。
要是輸入通常的非表格式文件圖像72,則由于識別表格形式的結(jié)果可以確定其中不存在分格線。然后依據(jù)前述申請中的工藝,從無分格線的文件圖像中,于標(biāo)題提取過程中提取管理信息的一批候選者。
圖25是表明上述管理信息提取過程的流程圖。過程開始時,管理信息提取設(shè)備讀取文件72并將其作為文件圖像存儲于存儲器中(步驟S81)。在此過程中,原圖像是在轉(zhuǎn)換為壓縮圖像后存儲的。
然后標(biāo)記上述文件圖像,作為標(biāo)記過程結(jié)果提取一字符串,此字符串矩形的坐標(biāo)則存儲于存儲器中(步驟S82)。再從存儲的字符串矩形中將短寬度的即高度大于寬度的矩形作為噪聲矩形除去(步驟S83),此外還除去不似字符串的矩形。此時可確定出文件區(qū)(步驟S84)。
于垂直方向(y坐標(biāo)方向)重排其余的字符串矩形(步驟S85)。提取包含字符框圖像的矩形(字符框矩形),然后將此字符框矩形中的字符串矩形標(biāo)記為常字符框的矩形(步驟S86)。此外,提取包含底線圖像的矩形,并將在此提取的矩形右上方的字符串矩形標(biāo)記為底線矩形(步驟S87)。
隨即進(jìn)行分?jǐn)?shù)計數(shù)過程,根據(jù)例如字符串矩形在文件中的位置、字符大小、以及它是否是帶有字符框的矩形或是底線矩形等,來決定標(biāo)題的概率,來提取一或多個高分?jǐn)?shù)的字符串矩形作為標(biāo)題的候選者(步驟S88)。根據(jù)此結(jié)果,提取有關(guān)此文件的源信息與終點信息(步驟S89與S96)。這樣便提取了標(biāo)題、終點信息與源信息作為管理信息的候選者。
上例中于圖像76內(nèi)提取了三個候選者C4、C5與C6用作標(biāo)題、終點與源信息。用戶界面按照最高的優(yōu)先程序順序輸出這些數(shù)據(jù)并把它們提供給用戶。用戶在有適當(dāng)候選者提供作管理信息時,即用鼠標(biāo)指點它而將其選出。當(dāng)沒有適當(dāng)?shù)暮蜻x者出現(xiàn)時,管理信息的候選者就可以在此指點過程中通過明確另一字符串矩形來修正。
下面參考圖26~28說明所提取的管理信息的用途。通常在處理圖像時只是把文件名稱的關(guān)鍵字或字符碼等用作管理信息。但是,設(shè)有本發(fā)明的管理信息提取設(shè)備的電子文件編排系統(tǒng)則具有將部分文件圖像作為字符碼之外的索引存儲的功能。這樣,當(dāng)字符碼的可靠性低時,應(yīng)用圖像檢索就會是有效的。
本發(fā)明的系統(tǒng)允許用戶選擇采用字符碼或圖像碼作為存儲管理信息的方法。根據(jù)選擇的結(jié)果,把選擇的數(shù)據(jù)存儲為管理信息。在檢索圖像時,此系統(tǒng)指令用戶選擇一種檢索管理信息的方法,并根據(jù)選擇結(jié)果用字符碼或圖像碼來檢索此管理信息。此系統(tǒng)還具有只是瀏覽存儲的字符碼或圖像的功能。
圖26是示明圖像信息存儲過程的流程圖。過程開始時,電子文件編排系統(tǒng)首先接收文件圖像(步驟S101),于圖4所示過程中計算管理信息的位置,同時提取管理信息的字符串(步驟S102)。然后,此系統(tǒng)指令用戶對于所提取的字符串選擇一種存儲管理信息的方法。
此存儲方法繼隨一字符識別方式,其中的字符串是字符識別的并轉(zhuǎn)換為字符碼;或繼隨一圖像方式,其中的字符串不是字符識別的而是作為圖像存儲的。要是用戶選擇字符識別方式,則字符是識別的(步驟S109),而存儲方法的選擇取決于識別結(jié)果的可靠性(步驟S105)。
計算字符識別可靠性的方法例如可采用前述申請(日本專利申請H8-223720)“字符識別方法與設(shè)備”中所公開的技術(shù)。依據(jù)這項技術(shù),上述系統(tǒng)首先根據(jù)作為識別結(jié)果求得的字符碼與輸入字符模式間的距離值來計算概率參數(shù),同時應(yīng)用一組字形和正確識別的碼來生成一種轉(zhuǎn)換表,用以將上述概率參數(shù)轉(zhuǎn)換為正確識別概率。根據(jù)此轉(zhuǎn)換表,可以求得相對于概率的正確識別概率,而把后者用作識別結(jié)果的可靠性的測度。
要是字符識別的可靠性低于預(yù)定的閾值,則通知用戶存儲了一幅圖像,并已將字符串的圖像以及其字符碼作為管理信息存儲(步驟S106),至此終止該過程。要是可靠性等于或高于預(yù)定的閾值,則將字符碼作為管理信息存儲而終止此過程。
要是用戶選擇圖像方式,則將字符串的圖像作為管理信息存儲(步驟S108)而結(jié)束此過程。在步驟S103中,能夠進(jìn)入這樣一種方式,其中作為一種替換的存儲方法既存儲字符碼也存儲圖像碼。假定作為識別結(jié)果求得的字符碼與輸出字形間的距離值表示在步驟S105中的可靠性,則能斷定此距離值越小時,可靠性就越高。
圖27表明用于存儲管理信息的存儲表的例子。此管理信息存儲表具有字符碼存儲區(qū)、圖像存儲區(qū)、以及表明信息是以字符碼還是以圖像碼存儲的類型標(biāo)志區(qū)。
例如類型標(biāo)志O指只存儲字符碼。類型標(biāo)志1指只存儲圖像碼。類型標(biāo)志2指既存儲字符碼又存儲圖像。
圖28是表明用于檢索這種管理信息的信息檢索過程的流程圖。過程開始時,電子文件編排系統(tǒng)首先指令用戶選擇一種檢索管理信息的方法(步驟S111)。此檢索方法繼隨三種方式,即采用字符碼的方式、采用圖像的方式、以及顯示一供用戶瀏覽的字符碼與圖像的列表的方式。
當(dāng)用戶選擇字符碼檢索時,則用字符碼檢索管理信息(步驟S112)。當(dāng)用戶選擇圖像檢索時,則用圖像檢索管理信息(步驟S113)。當(dāng)用戶選擇瀏覽時,則顯示存儲于管理信息存儲表中的一個字符碼與圖像的列表(步驟S114)。在選擇之后即結(jié)束此過程。
當(dāng)于步驟S113中用圖像檢索信息時,指令用戶去指定具體的圖像文件或是去選擇和顯示適當(dāng)?shù)膱D像。然后指令用戶去指定具體的矩形部分作為檢索鍵,并將用戶指定的部分圖像與管理信息存儲表中存儲的信息作比較。圖像間的比較例如用shokodo出版的Jun’ichiroToriwaki著的“Digital Image Process for Recognizing Image〔I〕”中所述的周知的模板匹配法進(jìn)行。
在這種模板匹配中,將指定的部分圖像用作模型(模板),而使其與各個管理信息存儲表中的圖像比較以計算它們之間的相似性,來獲取表明最高相似性或表明高于一預(yù)定值的相似性的管理信息。所獲得的對應(yīng)于這一管理信息的文件圖像則作為檢索結(jié)果顯示。
根據(jù)上述電子文件編排系統(tǒng),管理信息的字符串不僅可用字符碼而且還能用圖像存儲/檢索。于是,例如有紋理的字符、設(shè)計的字型以及徽標(biāo)等難以正確識別的字符,可以作為管理信息處理。
在圖17中的步驟S15與S16中,采用交比DP匹配來識別表格式文件形式(格式結(jié)構(gòu))。但是可以用任何其它方法來進(jìn)行細(xì)節(jié)識別。
在另一種周知的自動表格形式識別方法中,已知的表格式文件的特征是作為一種模型輸入詞典31中的。當(dāng)把未知的表格式文件的圖像輸入時,即根據(jù)此圖像計算上述特征,并用模型匹配法與詞典中的模型比較,而求得表明最高相似性的模型。
在模型匹配法中,首先將整個表標(biāo)準(zhǔn)化,計算各矩形網(wǎng)目中心點的位置,然后表決這樣的模型,它所具有的中心點所在位置與上述矩形網(wǎng)目的基本上相同。將獲得了最高表決票數(shù)的模型規(guī)定作最佳模型。模型的標(biāo)準(zhǔn)化是指一種調(diào)節(jié)過程,例如使整個圖像按照寬-高比為一比一的轉(zhuǎn)換。
另一種進(jìn)行匹配過程的方法是采用連通圖。在這種方法中,提取分格線,使整個表標(biāo)準(zhǔn)化,然后在輸入的未知文件與各個模型間求出長度與位置近似等同的分格線的組合。如圖29所示,表明分格線組合的節(jié)點排列在一個平面上,通過路徑連接滿足預(yù)定幾何限制的節(jié)點便生成連通網(wǎng)。
上述幾何限制指一種限制條件,即未知文件與比較模型間分格線的順序是保持的,或這樣的限制條件,即禁止一個表中的一條分格線對應(yīng)于另一個表的一批分格線。在圖29所示的包括四個節(jié)點的結(jié)合圖中,未知文件的分格線a1、a2、a3與a4分別對應(yīng)于模型的分格線b1、b2、b3與b4。
當(dāng)所有的節(jié)點能通過連通圖一部分的子圖中的路徑與所有其它節(jié)點連接時,則此子圖稱之為小集團(tuán)。圖29所示的連通圖本身便是一個小集團(tuán)。通過于結(jié)合圖中求出具有最多節(jié)點數(shù)的小集團(tuán)便可求出未知文件與模型間的相似性,然后取出表明最高相似性的模型作為最佳模型。
在上述模型匹配法中,先將輸入文件標(biāo)準(zhǔn)化然后與一模型作特征比較。但要是表的輪廓的提取精度低或是表格形式由于增加了行等而略有修正時,則全部特征會受影響將使識別不穩(wěn)定。特別是,所述以矩形網(wǎng)目中心位置為基礎(chǔ)的方法會受到上述這種結(jié)果的較大影響。
在采用連通圖的上述方法中,生成節(jié)點的條件可以減弱,但連通圖的大小則會增大,特別是為了獲得最大小集團(tuán)時需用很長的時間。
為此,說明本發(fā)明的下述實施例,適應(yīng)因表格形式中的殘條斷裂或是噪聲與變化等導(dǎo)致分格線提取誤差的高速而牢靠的匹配方法。所謂牢靠是指匹配結(jié)果不易受誤差或變化的影響。
在這種匹配法中,分格線相對于整個表的尺寸與位置視作為檢驗未知文件與各模型間分格線對應(yīng)可能性的特征,以求得對應(yīng)分格線的組合。本例中,通過設(shè)定一種寬可能性的條件,能夠讓一批分格線對應(yīng)于一條分格線。此外,當(dāng)未能正確地提取出表的輪廓時,要是失誤是在允許范圍內(nèi)時,則允許冗余對應(yīng)可防止漏掉分格線之間的正確對應(yīng)。
然后,將可匹配的對應(yīng)關(guān)系集總到所獲得的對應(yīng)關(guān)系集的一個組中,并把分格線的每個對應(yīng)關(guān)系分配到一個組中。此時,分格線的位置與分格線間的距離用作為特征。利用了分格線間的這種相對關(guān)系作為特征,就能防止線條的斷裂或噪聲影響分格線的全部特征。
此外,當(dāng)對應(yīng)關(guān)系分組后,與通過設(shè)定可使兼容性性能夠成為過渡的嚴(yán)格兼容性條件來生成連能圖的情形相比,就能顯著地減少檢驗兼容性的步驟。由于各組的對應(yīng)關(guān)系可用一個平面上的單一路徑表示,就只需很短的時間來計數(shù)對應(yīng)關(guān)系的數(shù)目。
上述過渡的兼容性是指,例如當(dāng)對應(yīng)A與對應(yīng)B兼容性而對應(yīng)B與對應(yīng)C兼容性時,對應(yīng)A總能與對應(yīng)C兼容性。這時,由于不必檢驗對應(yīng)A與對應(yīng)C間的兼容性,便可以高速地進(jìn)行這一過程。
最后,從一致組合的組中求出包括有最大對應(yīng)數(shù)的所獲的組的組合。這樣,即使在文件中有了少量的修正,例如在一個表中只添加了一行時,只要一個模型中的絕大多數(shù)分格線能同輸入文件中的正確對應(yīng)時,就可以提取出這一模型。
圖30是表明上述匹配法中表格形式識別過程的流程圖。此過程相當(dāng)于圖4中所示的步驟S11、S12、S15與S16,并具體涉及到輸入圖像的細(xì)節(jié)識別。過程開始時,管理信息提取設(shè)備首先接收一圖像(步驟S121)并從其中提取分格線(步驟S122)。
使各分格線依包括此分格線的矩形(分格線矩形)的左上頂點的坐標(biāo)按這樣的順序重排對于水平分格線從最小的y坐標(biāo)值開始,而對于垂直分格線從最小的x坐標(biāo)值開始(步驟S123)。如果水平分格線顯示出相同的y坐標(biāo),它們就按x坐標(biāo)的遞增順序分類。
然后相對于各水平與垂直分格線提取概略的信息(步驟S124)。概略信息是指分格線的長度與位置對于整個表的相對值,由三個整數(shù)所成的集表示。同時,考慮到兩條分格線于垂直和水平的各方向上的組合,可提取與各個組合有關(guān)的細(xì)節(jié)信息(步驟S125)。這種細(xì)節(jié)信息表明了兩條分隔線間長度與位置的相對關(guān)系。
預(yù)先提取有關(guān)將與輸入圖像比較的模型的概略信息和細(xì)節(jié)信息,并存儲于布局詞典31中。這樣,有關(guān)輸入圖像的概略信息和細(xì)節(jié)信息便同有關(guān)用于模型匹配的模型的進(jìn)行比較(步驟S126)。將最佳模型作為識別結(jié)果輸出而終止此過程(步驟S127)。
下面參看圖31至41詳述步驟S124、S125、S126與S127的過程。
在步驟S124中,在獲得概略信息前進(jìn)行預(yù)處理而求出基準(zhǔn)寬度W、基準(zhǔn)高度H、基準(zhǔn)x坐標(biāo)x0與基準(zhǔn)y坐標(biāo)y0。首先對水平分格線求出最大長度。從顯示出長度比高于或等于一預(yù)定閾值(例如0.8)的水平分格線中求出最先和最后的分格線作為基準(zhǔn)輪廓水平分格線。
對于垂直分格線也同樣求出最大長度。與水平分格線的情形相同,求出兩條基準(zhǔn)輪廓垂直分格線。然后,相對于所求得的四條基準(zhǔn)輪廓分格線所圍成的矩形,定出了基準(zhǔn)寬度W、基準(zhǔn)高度H、以及在具有基準(zhǔn)坐標(biāo)(x0、y0)的左上頂點處的基準(zhǔn)點。
例如在圖31所示的表格式文件中,提取水平分格線81與82作為基準(zhǔn)輪廓水平分格線,同時提取垂直分格線83與84作為基準(zhǔn)輪廓垂直分格線。這些基準(zhǔn)輪廓分格線所圍成的矩形的寬度與高度分別作為基準(zhǔn)寬度W與基準(zhǔn)高度H。此圍成的矩形的左上頂點85的坐標(biāo)作為基準(zhǔn)坐標(biāo)(x0,y0)。
通過從比根據(jù)最大長度計算出的長度要長的一批分格線中選取基準(zhǔn)輪廓分格線,可以從基準(zhǔn)輪廓分隔線的候選者中除去例如水平分格線86與87這樣的短的分格線。
上述的基準(zhǔn)寬度W、高度H與坐標(biāo)(x0,y0)也能夠依下述方式求得。首先將坐標(biāo)值Vmaxx、Vminx、Vmaxy、Vminy、hmaxx、hminx、hmaxy、hminy規(guī)定為基準(zhǔn)坐標(biāo)的候選者如下。
Vmaxx=垂直分格線矩形右下頂點x坐標(biāo)的最大值。
Vminx=垂直分格線矩形左上頂點x坐標(biāo)的最小值。
Vmaxy=垂直分格線矩形右下頂點y坐標(biāo)的最大值。
Vminy=垂直分格線矩形左上頂點y坐標(biāo)的最小值。
hmaxx=水平分格線矩形右下頂點x坐標(biāo)的最大值。
hminx=水平分格線矩形左上頂點x坐標(biāo)的最小值。
hmaxy=水平分格線矩形右下頂點y坐標(biāo)的最大值。
hminy=水平分格線矩形左上頂點y坐標(biāo)的最小值。
然后根據(jù)這些坐標(biāo)值由下式求出基準(zhǔn)寬度與基準(zhǔn)高度的候選者W1=Vmaxx-VminxW2=hmaxx-hminxH1=hmaxy-hminyH2=Vmaxy-vminy (11)基準(zhǔn)寬度W求得為W=max{W1,W2} (12)在x0=Vminx當(dāng)W=W1而x0=hminx當(dāng)W=W2。
基準(zhǔn)高度H求得為
H=min{H1,H2} (13)在此y0=hminy當(dāng)H=H1而y0=vminy當(dāng)H=H2。
這樣便求出了基準(zhǔn)寬度W、基準(zhǔn)高度H與基準(zhǔn)坐標(biāo)(x0,y0)。但是,這種方法與上述方法相比會受到噪聲等影響,而且牢靠性也較差。
四條基準(zhǔn)輪廓分格線圍成的矩形的左上頂點選作為基準(zhǔn)點。此外,也可把此圍成的矩形周邊上的任意點例如左上頂點、右上頂點、右下頂點等選作為基準(zhǔn)點。任何情形下,一般要進(jìn)行下述過程。
根據(jù)所求得的大小與基準(zhǔn)坐標(biāo),從各分格線矩形的長度與中心位置求得三個特征(概略信息)長度1、卷曲度與位置。在水平分格線情形,通過下式,根據(jù)圖32所示的分格線矩形91的長度L1及其中心坐標(biāo)(x1,y1),計算出以上特征長度1=〔(L1/W)×100〕的整數(shù)部分卷曲度=〔((x1-x0)/W)×100〕的整數(shù)部分 (14)位置=〔((y1-y0)/H)×100〕的整數(shù)部分在垂直分格線情形,通過下式,根據(jù)圖33所示的分格線矩形92的長度L1以及中心坐標(biāo)(x1,y1),計算以上特征長度1=〔(L1/H)×100〕的整數(shù)部分卷曲度=〔((y1-y0)/H)×100〕的整數(shù)部分位置=〔((x1-x0)/W×100〕的整數(shù)部分(15)在所計算的特征中,長度1指分格線的長度相對于表的尺寸的相對比,而卷曲率與位置則指分格線對表的基準(zhǔn)點的相對位置。
隨后,在步驟S125中,求出表中兩條分格線間的相對關(guān)系的細(xì)節(jié)信息。這種細(xì)節(jié)信息可以由三個值表示,具體地說,假定一個分格線矩形的長度是1,則這三個值是另一個分格線矩形的長度2、兩分格線矩形中心間沿x方向上的位移長度差、以及在兩分格線矩形中心間沿y方向上的位移長度高度。
首先,提取兩條水平分格線的所有組合。在各個組合中,一個分格線矩形93的長度(較高的分類階)是L1,矩形93的中心坐標(biāo)是(x1,y1),另一分格線矩形94的長度(較低的分類階)是L2,而矩形94的中心坐標(biāo)是(x2,y2),如圖34所示,此時,兩分格線矩形中心間在x方向上的位移dw和y方向上的位移dh,是根據(jù)分格線矩形93的中心由下式計算的。
dw=x2-x1dh=y(tǒng)2-y1 (16)根據(jù)上述規(guī)定,要是分格線矩形94的中心位于分格線矩形93的中心之右,則dw為正值。要是分格線矩線94的中心位于分格線矩形的中心之左,則dw是負(fù)值。類似地,要在分格線矩形94的中心位于分格線矩形93的中心之下,則dh是正值。要是分格線矩形94的中心位于分格線矩形93之上,則dh是負(fù)值。
上述三個特征長度2、差與高是由下式計算長度2=L2/L1差=dw/L1 (17-1)高=dh/L1類似地,提取兩條垂直分格線的所有組合。在各個組合中,一個分格線矩形95的長度(較高的分類階)是L1,矩形95的中心坐標(biāo)是(x1,y1),另一分格線96的長度(較低的分類階)是L2。然后可由式(16)求出dw與dh,并由下式計算出長度2、差與高。
長度2=L2/L1差=dh/L1 (17-2)高=dw/L1在式(17-2)中,與式(17-1)比較,差與高的定義相反。然后在步驟S126中,通過將有關(guān)輸入圖像的概略信息與細(xì)節(jié)信息與有關(guān)各模型的加以比較,計算一種表格形式的相似性。對于水平分格線與垂直分格線分別進(jìn)行上述比較。
圖36是表明這種模型匹配過程的流程圖。過程開始時,管理信息提取設(shè)備首先生成圖37中所示的PXM表,其中P是一未知文件的輸入圖像的水平分格線的數(shù),而M是一模型的水平分格線的數(shù)(步驟S131)。
在此例子中,p=12,m=15,而表的行數(shù)與列數(shù)自0開始。表中i行內(nèi)j列的元(項)是表明輸入圖像的i分格線與模型的j分格線的對應(yīng)關(guān)系的數(shù)據(jù)。這種表以后稱之為匹配表。
然后根據(jù)概略信息確定輸入圖像的i水平分格線IP(i)是否對應(yīng)于模型的j水平分格線MO(j)。要是存在它們相互對應(yīng)的可能性,就將一個節(jié)點指派給匹配表中i行中的j列處的元素。這樣,在匹配表上就描述了水平分格線IP(i)與水平分格線MO(j)的一種組合。此時并未嚴(yán)格地設(shè)定對應(yīng)可能性的條件,而是允許一條分格線能與一批分格線對應(yīng)。
本例中,分格線IP(i)的概略信息(長度1,卷曲度與位置)分別設(shè)定為(ip1,ipt與ipp),而分格線MO(j)的概略信息分別設(shè)定為(mol,mot與mop)。當(dāng)對應(yīng)值之間的差小于一預(yù)定值時,就可確定分格線IP(i)能對應(yīng)于分格線MO(j)上述可能性的具體條件由下式設(shè)定|ip1-mol|<β|ipt-mot|<β (18)|ipp-mop|<α式中參數(shù)α與β是閾值,各取決于表中的水平分格線數(shù)與垂直分格線數(shù)。
這些取決于表中分格線數(shù)的參數(shù)α與β是正數(shù)。分格線數(shù)愈小,則它們所指的這種值就越大。此時,不等式(18)的條件在表中分格線的密度低時便擴(kuò)充了匹配過程中的搜索范圍,而在分格線的密度高時便縮小了匹配過程中的搜索范圍。參數(shù)α與β例如可以定義為如圖38所示的,取決于水平與垂直分格線的數(shù)的單純下降的函數(shù)。
這樣,通過用節(jié)點來表示在概略信息中相似的分格線之間的對應(yīng)關(guān)系,就能提取輸入圖像與模型之間對于表的輪廓部有關(guān)特征中的相似性。
隨后,根據(jù)細(xì)節(jié)信息搜索能滿足預(yù)定關(guān)系的組合的排列節(jié)點,即那些能相互兼容的節(jié)點(步驟S133),而這種可兼容的節(jié)點則視之為屬于同一組并通過路徑使其互連。
當(dāng)i行中j列處的節(jié)點n(i,j)與k行中1列處的節(jié)點n(k,1)滿足預(yù)定關(guān)系時,就表明輸入圖像中i分格線與k分格線間的關(guān)系正比于模型中j分格線與1分格線間的關(guān)系。這就是說,當(dāng)輸入圖像的i分格線重疊于模型中的j分格線上時,輸入圖像的k分格線便與模型的1分格線重疊。
通過路徑連接這些節(jié)點就能將它們分成幾個組。一個組中所含的節(jié)點數(shù)越多,這個組所表示的輸入文件與模型間的相似性就越高。于是,在模型兼容過程中能在這種包含較多節(jié)點數(shù)的組中有效地進(jìn)行相似性的計算。
當(dāng)搜索一能與一具體節(jié)點相匹配的節(jié)點時,為了提高這一過程的效率,通常是在此具體節(jié)點右斜下方的區(qū)域中的節(jié)點中進(jìn)行搜索。這樣不會生成圖29中所示的小集團(tuán),同時能高速度地求得連接多數(shù)節(jié)點的路徑。下面描述生成一路徑的實際過程。
此時,從所獲得的路徑集中求出路徑的一致性的組合,并搜索包含最多節(jié)點的路徑(步驟S134)。探測出的路徑組合定義為最優(yōu)路徑集。路徑的一致性的組合表明了對應(yīng)于各路徑中節(jié)點的分格線集的范圍并不相互重疊。
在圖37所示的匹配表中,考慮了兩個分格線集相互重疊范圍的兩種情形。一種情形如圖39所示,輸入圖像與模型間的順序關(guān)系反轉(zhuǎn)。另一種情形如圖49所示,有兩或更多的分格線對應(yīng)于一條分格線。
在圖39所示的匹配表中,屬于由實線表明的組中在模型一側(cè)分格線的范圍視作為包括從第0至第9條分格線。屬于由虛線表明的組中在模型一側(cè)的分格線范圍視作為包括從第7至第8條分格線。于是,這兩個分格線集的范圍便相互重疊。類似地,于圖40中,由實線與虛線表明的這些組中分格線集的范圍在模型側(cè)重疊。
在不含有不一致路徑組合的最佳路徑集中,分格線集的范圍并不相互重疊于輸入圖像或模型的任一側(cè),如圖41所示。這樣,由最佳路徑集中包含的節(jié)點所表示的分格線中的對應(yīng)關(guān)系便稱之為最佳對應(yīng)。
下面假定輸入圖像中水平分格線數(shù)為ph,模型中水平分格線數(shù)是mh,而水平分格線的最佳路徑集之中所含節(jié)點數(shù)是maxh,則輸入圖像與模型兩者中水平分格線間的相似性可由下式計算(步驟S135)SH=maxh/ph+maxh/mh (19)相似性SH表明了對應(yīng)于輸入圖像分格線中最佳路徑集的分格線比與對應(yīng)于模型的分格線中最佳路徑集的分格線比之和。通常,輸入圖像的特征對模型的特征愈相似,則上述和也愈大。
管理信息提取設(shè)備如在步驟S131至S135對水平分格線所進(jìn)行的處理那樣處理垂直分格線。假定輸入圖像的垂直分格線數(shù)是pv,模型的垂直分格線數(shù)是mv,而垂直分格線的最佳路徑集中所含節(jié)點數(shù)是maxv,則輸入圖像與模型兩者的垂直分格線間的相似性SV可由下式計算SV=maxv/pv+maxv/mv (20)最后,用SH和SV計算輸入圖像與模型間分格線的相似性,結(jié)束此模型匹配過程。
S=SH+SV(21)例如,利用粗分類中求得的表的各個候選者作為模型來進(jìn)行上述匹配過程以計算模型與輸入圖像間的相似性。在步驟S127,將顯示出最高相似性的模型作為最佳模型輸出。這樣可以求得對應(yīng)于輸入圖像的詞典形式。
下面參看圖42至48詳述圖36所示的節(jié)點排列過程、路徑生成過程以及最佳路徑設(shè)定過程。
圖42是表明圖36所示步驟S132中的節(jié)點排列過程。在圖42中,輸入圖像的i分格線的概略信息長度1、卷曲度與位置分別用ip1(i)、ipt(i)與ipp(i)表示,而有關(guān)模型的j分格線的概略信息則由mol(j)、mot(j)與mop(j)表示。
表明匹配表中i行內(nèi)j列處的元素的數(shù)據(jù)表示為符號(i,j)。當(dāng)符號(i,j)=0,則不把節(jié)點設(shè)于對應(yīng)元素處。當(dāng)符號(i,j)=1,則于對應(yīng)元素處設(shè)定一節(jié)點。
過程開始時,管理信息提取設(shè)備首先確定是否滿足條件|ipp(i)-mop(j))|<α(步驟S141)。要是不滿足上述條件,則將符號(i,j)設(shè)定為0(步驟S142),從而結(jié)束此過程。
要是步驟S141中的條件滿足,則管理信息提取設(shè)備確定是否滿足條件|ipt(i)-mot(j)|<β(步驟S143)。要是不滿足此條件,則將符號(i,j)設(shè)定為0(步驟S144),而結(jié)束此過程。
要是步驟S143中的條件滿足,則管理信息提取設(shè)備確定是否滿足條件|ip1(i)-mol(j)|<β(步驟S145)。要是不滿足上述條件則將符號(i,j)設(shè)定到0(步驟S146),則結(jié)束此過程。要是步驟S145的條件滿足,則將記號(i,j)設(shè)定為1,同時將節(jié)點設(shè)定于i行內(nèi)j列處的位置而終結(jié)此過程。
對匹配表中所有位置(i,j)執(zhí)行上述過程,使得表明概略信息相互類似的兩分格線間對應(yīng)的節(jié)點設(shè)定于與分格線對應(yīng)的位置處。
圖43與44是表明圖36中所示步驟S133的路徑生成過程的流程圖。過程開始時,管理信息提取設(shè)備首先進(jìn)行初始化過程(圖43中所示步驟S151)。在此過程中,匹配表中設(shè)定節(jié)點處的元素的位置(i,j)作為字符串存儲于存儲器的存儲中區(qū)中。在此存儲區(qū)中,節(jié)點依行的序數(shù)i按增序排列。當(dāng)節(jié)點被指定同一行數(shù)i時,它們就按列數(shù)j的增序排列。給節(jié)點串中的各節(jié)點指派一表明它是否通過路徑連通的標(biāo)志。
例如,對應(yīng)于圖37中所示匹配表的存儲區(qū)中的節(jié)點串即如圖45中所示。在圖45所示的存儲區(qū)中,于匹配表上順序地存儲著節(jié)點的位置(0,0)、(1,0)、(1,1)、(2,0)、...、(11,14),而標(biāo)志的值初始化為1。如果標(biāo)志的值是1,則表明對應(yīng)的節(jié)點仍未經(jīng)路徑連通。
隨即存取此存儲區(qū)中的前導(dǎo)數(shù)據(jù)(步驟S152),并從存儲點讀出(i,j),于匹配表上標(biāo)明與相應(yīng)位置對應(yīng)的元素(步驟S153)。標(biāo)明元素的節(jié)點規(guī)定為基準(zhǔn)節(jié)點而將此元素的“符號”設(shè)定為0,同時將存儲區(qū)中對應(yīng)的標(biāo)志設(shè)定為0(步驟S154)。
然后,將控制變量“計數(shù)”設(shè)置為0(步驟S155),并且檢驗此已標(biāo)明的元素是否已對應(yīng)匹配表中的最后一列,或者“計數(shù)”值是否已達(dá)到預(yù)定常數(shù)h(步驟S156)。要是不滿足上述條件,則使標(biāo)明的位置向右移過一列(步驟S157),并且檢驗上述標(biāo)明位置是否對應(yīng)于最后一行(步驟S158)。
要是上述標(biāo)明位置對應(yīng)于最后一行,則給“計數(shù)”的值加1(步驟S159),并重復(fù)步驟S156中及其以后的過程。要是此標(biāo)明位置不對應(yīng)于最后一行,則使此標(biāo)明位置下移一行(步驟S160),同時檢驗此已標(biāo)明的元素是0或1(步驟S161)。
如果此值是0,則在此標(biāo)明的位置處不設(shè)置節(jié)點。于是重復(fù)步驟S158中的及其以后的過程。要是“符號”表明的是1,則將節(jié)點設(shè)于此標(biāo)明的位置,并且確定此節(jié)點是否能通過路徑與所述基準(zhǔn)節(jié)點連接(步驟S162)。利用對應(yīng)于這些節(jié)點的分格線之間的長度2、差與高度等細(xì)節(jié)信息,確定這兩個節(jié)點是否能由路徑連接。
例如,如圖46所示,表明對應(yīng)于基準(zhǔn)節(jié)點的分格線101和對應(yīng)于輸入圖像中待確定的節(jié)點的分格線102之間的關(guān)系的細(xì)節(jié)信息經(jīng)設(shè)定為長度2=L2/L1,差=dw/L1而高=dh/L1。
在此模型中,表明對應(yīng)于基準(zhǔn)節(jié)點的分格線103和對應(yīng)于待確定的節(jié)點的分格線104之間關(guān)系的細(xì)節(jié)信息經(jīng)設(shè)定為長度2=L2’/L1’,差=dw’/L1’和高=dh’/L1’。
此時,要是用經(jīng)驗閾值ε1、ε2與ε3能滿足下述不等式,則基準(zhǔn)節(jié)點能與待確定的節(jié)點兼容并能通過路徑互連|L2/L1-L2’/L1’|<ε1|dw/L1-dw’/L1’|<ε2|dh/L1-dh’/L1’|<ε3 (22)通過將閾值ε1、ε2和ε3設(shè)定得充分小,不等式(22)即表明包括分格線101與102的圖形與包括分格線103與104的圖形相似。要是這些分格線圖形相互相似,則在分格線101對應(yīng)于分格線103時,分格線103就有很高的可能性對應(yīng)于分格線104。這時,這兩個節(jié)點就視為可相互兼容。
于是,在設(shè)定路徑的相似性條件下,可以減少節(jié)點間可兼容性的判定次數(shù)。例如,如果節(jié)點97是圖37所示匹配表中的基準(zhǔn)節(jié)點,則當(dāng)此節(jié)點97可與節(jié)點98兼容且能同時與節(jié)點99兼容時,可以認(rèn)為節(jié)點98與節(jié)點99是可兼容的。
要是確定了節(jié)點99能經(jīng)一路徑與基準(zhǔn)節(jié)點97相連接時,則可以確定節(jié)點99也能通過一路徑與業(yè)已經(jīng)路徑與基準(zhǔn)節(jié)點97相連的節(jié)點98相連。
當(dāng)位于前述標(biāo)明位置處的節(jié)點不能經(jīng)路徑與基準(zhǔn)節(jié)點相連時,則重復(fù)步驟S158中及其后的過程去檢驗同一列中的另一節(jié)點。如果這兩個節(jié)點能經(jīng)一路徑相互連接,則對應(yīng)于標(biāo)明位置處的接點的存儲區(qū)中的標(biāo)志即改寫為0(步驟S163)。這樣就記錄下與基準(zhǔn)節(jié)點連接的節(jié)點或在路徑上緊鄰此節(jié)點前的節(jié)點,然后重復(fù)步驟S156中及其后的過程去檢驗下一列中的節(jié)點。
在步驟S156中及其后的過程中,將標(biāo)明的位置前移一列然后再前移一行去搜索右斜下方的元素。通過重復(fù)上述過程,可于匹配表中將一路徑沿朝斜下方順序地右延。
要是步驟S156中的條件滿足,則去檢驗從基準(zhǔn)節(jié)點延伸出的路徑的命中數(shù)是否為二或更多(圖44中所示步驟S164)。命中數(shù)是指此路徑上的節(jié)點數(shù)。要是此路徑上的結(jié)點數(shù)是二或更多,就將此路徑正式寄存同時存儲有關(guān)此路徑上節(jié)點的信息(步驟S165)。要是此路徑上的節(jié)點數(shù)是1,則它表明從基準(zhǔn)節(jié)點沒有路徑延伸到任何其它節(jié)點。結(jié)果就不寄存此路徑。
隨后檢驗存儲區(qū)中是否余留有數(shù)據(jù)未存取(步驟S166)。要是有這樣的數(shù)據(jù),則將存儲區(qū)中的存取點前移一(步驟S167),然后檢驗此位置的標(biāo)志值(步驟S168)。要是此標(biāo)志表示0,則在此位置的節(jié)點業(yè)已加到該路徑上,而重復(fù)步驟S166中及其后的過程去檢驗下一個數(shù)據(jù)。
要是此標(biāo)志指1,則此位置上的節(jié)點未增加到路徑上。于是重復(fù)步驟S153中及其后的過程。這樣,將此節(jié)點規(guī)定為一新的節(jié)點而生成一新的路徑。在S166的步驟中,要是此存取區(qū)中的存取點到達(dá)了結(jié)尾點,則結(jié)束此過程。
圖47是表明圖36所示步驟S134中的最佳路徑集的確定過程。在此過程中,應(yīng)用表明供最佳路徑集用的暫定路徑集中節(jié)點數(shù)的陣列分?jǐn)?shù)(i)(i=0,1,2,...,m),來處理p行與i列的水平分格線或垂直分格線的匹配表。
過程開始時,管理信息提取設(shè)備首先設(shè)表示最佳路徑集的節(jié)點數(shù)的的初始值的分?jǐn)?shù)為0,并將表明行數(shù)初始值的rireki(m)設(shè)定為p-1(步驟S171)。
其次將表明列數(shù)的變數(shù)i設(shè)定為m-1(步驟S172),同時在寄存的路徑中,將包括對應(yīng)于列數(shù)i的作為起始點的左上點的路徑集設(shè)定作路徑(i)(步驟S173)。然后將分?jǐn)?shù)(i)設(shè)定等于分?jǐn)?shù)(i+1),并將rireki(i)設(shè)定等于rireki(i+1)(步驟S174)。分?jǐn)?shù)(i)指從第i列到最后一列(第m-1列)范圍內(nèi)的暫定路徑集的節(jié)點數(shù)。
然后從路徑集(i)中求出一條路徑并根據(jù)有關(guān)其節(jié)點的信息更新分?jǐn)?shù)(i)(步驟S175)。此時檢驗路徑集(i)中是否尚留有路徑。如果尚有,則求出下一個路徑并重復(fù)分?jǐn)?shù)(i)的計算。
在完成了路徑集(i)中所有的路徑計算時,確定此i是否到達(dá)0(步驟S177)。要是i等于或大于1,則將i設(shè)定為i-1(步驟S178),并重復(fù)步驟S173之中和其后的過程。當(dāng)i達(dá)到0時,則將所求得分?jǐn)?shù)(0)的值定作為最終最佳路徑集的節(jié)點數(shù)(步驟S179),并結(jié)束此過程。
據(jù)水平分格線匹配表求得的分?jǐn)?shù)(0)的值用作式(19)中的maxh去計算相似性。由垂直分格線的匹配表求得的分?jǐn)?shù)(0)的值用作式(20)中的maxv去計算相似性。
下面參看圖48描述圖47中所示步驟S175的節(jié)點數(shù)更新過程。當(dāng)此節(jié)點數(shù)更新過程開始時,管理信息提取設(shè)備首先從路徑集(i)中檢索一條路徑。此路徑起點的行數(shù)設(shè)定為sg,此路徑右下終點處的節(jié)點的列數(shù)與行數(shù)分別設(shè)定為er與eg。此路徑中所含節(jié)點數(shù)設(shè)定為“命中數(shù)”(步驟S181)。
例如在圖37所示的匹配表中,路徑集(11)在i=11時于右斜下方斜區(qū)包括路徑p1與p2。對于路徑p1,值sg、er與eg分別為8、14與11。對于路徑p2,值sq、er與eg分別為6、12與7。
其次將表明列數(shù)的變數(shù)j設(shè)定為er+1(步驟S182),并將eg的值與rireki(j)比較(步驟S183)。這時,如果eg的值大于rireki(j),則要確定是否滿足分?jǐn)?shù)(j)+命中數(shù)>分?jǐn)?shù)(i),或是滿足分?jǐn)?shù)(j)+命中數(shù)=分?jǐn)?shù)(i)以及eg<rireki(i)(步驟S184)。
要是上述任一項條件滿足,則將分?jǐn)?shù)(i)設(shè)定為分?jǐn)?shù)(j)+命中數(shù),將rireki(i)設(shè)定為eg(步驟S185),而結(jié)束此過程。
要是于步驟S183中eg等于或小于rireki(j)或是步驟S84中任何條件都不能滿足,則將j設(shè)定到j(luò)+1(步驟S186),并將j與m比較(步驟S187)。要是j等于或小于m,則重復(fù)步驟S183中和其后的過程。如果j超過m,則終止此過程。
這樣,在緊接前述過程之后,從各由增加一條路徑給暫定路徑集所獲得的一批集中。提取用于最佳路徑集的新的暫定集,并將它的節(jié)點記錄于分?jǐn)?shù)(i)中,用于最佳路徑集的暫定路徑集中在第i列至最后一列范圍內(nèi)的節(jié)點數(shù),可以通過對路徑集(i)中所有路徑重復(fù)上述過程而求得。
例如在圖37中,從第11列至最后一列范圍內(nèi),有兩種組合即只是路徑p1以及路徑p2與p3的組合可以看作是一致路徑的組合。由于這些組合在任一情形下的節(jié)點數(shù)是4,所以分?jǐn)?shù)(11)等于4。
上述表格形式識別方法不僅可以用于管理信息提取設(shè)備,還可以用于任何圖像識別設(shè)備如文件識別設(shè)備、圖樣閱讀設(shè)備等,還能有效地用于識別任意圖像中分格線的結(jié)構(gòu)。
在本實施例的表格形式識別過程中是把分格線間的關(guān)系用作特征。于是,在從輸入的表格式文件中提取分格線結(jié)構(gòu)并使其與輸入的表格式文件的表格形式相匹配時,即使是由于線道斷裂或噪聲等使一部分操作不能提取時,也能獲得穩(wěn)定的正確的識別。特別是在由于噪聲影響可能成為不穩(wěn)定的提取輪廓線的過程中,通過給節(jié)點的排列設(shè)置寬廣的條件來減少對精度的破壞,能達(dá)到很高的牢靠度。
要是將最佳路徑集作為一或多條路徑的組合來求出時,通過增加或減少一行來變更表格形式時,可以實現(xiàn)穩(wěn)定和正確的識別。此外,通過設(shè)定有關(guān)兩個節(jié)點的過渡性相容條件,可以減少相容性檢驗過程數(shù),從而能進(jìn)行高速的識別處理。
根據(jù)本發(fā)明,表格式文件等的圖像形式以及管理信息的位置能夠自動學(xué)習(xí)并存儲于詞典中。于是,根據(jù)所存儲的信息,可以高精度地計算任意輸入圖像中管理信息的位置。
特別是,由于應(yīng)用了對圖像信息的波動為穩(wěn)定的特征,便可以成功地從破碎的或變形的文件圖像中提取管理信息。再者,由于在進(jìn)行表格形式學(xué)習(xí)和比較過程的同時,是把候選者漸次地限制于粗分類和細(xì)節(jié)識別的兩個步驟中,而且細(xì)節(jié)識別又是利用表的輪廓形式特征于一維匹配方式下進(jìn)行,故能高速度地提取管理信息。
此外,由于管理信息不僅是用字符碼而且還用圖像本身進(jìn)行存儲與檢索,因而即使是一些難以識別的字符如帶紋理的字符等,也能作為管理信息處理。
權(quán)利要求
1.圖像積累設(shè)備,此設(shè)備包括存儲裝置,用來存儲作為積累的圖像的管理信息的圖像信息;以及檢索裝置,用來檢索上述圖像信息。
2.權(quán)利要求1所述的圖像積累設(shè)備,其中此設(shè)備還包括計算裝置,用來根據(jù)任意輸入圖像所含表區(qū)中分格線對輪廓部的相對位置信息,計算此輸入圖像中所含管理信息的位置;以及輸入裝置,用來從上述輸入圖像中提取圖像信息,并將此圖像信息輸入所述存儲裝置中。
3.權(quán)利要求1所述的圖像積累設(shè)備,此設(shè)備還包括用來選擇圖像信息與字符碼兩者中至少一種的選擇裝置,其中前述存儲裝置存儲所選擇的信息作為管理信息。
4.權(quán)利要求3所述的圖像積累設(shè)備,其中所述存儲裝置當(dāng)所述選擇裝置選擇了對應(yīng)于管理信息的字符碼時,取決于用于管理信息的字符識別的可靠性,存儲由管理信息獲得的的圖像作為圖像信息。
5.圖像積累方法,此方法包括下述步驟存儲用作積累圖像管理信息的圖像信息;以及檢索此圖像信息。
全文摘要
管理信息提取設(shè)備,它在表格形式學(xué)習(xí)過程中學(xué)習(xí)文件的分格線結(jié)構(gòu)以及用戶明確的管理信息如標(biāo)題等的位置,并將它們存儲于布局詞典中。作業(yè)中,使從輸入文件的圖像中提取出的分格線結(jié)構(gòu)與上述布局詞典中文件內(nèi)的分格線結(jié)構(gòu)匹配。然后參考此布局詞典中的位置信息而從輸入文件中提取管理信息。
文檔編號G06K9/20GK1534542SQ0313285
公開日2004年10月6日 申請日期1997年12月26日 優(yōu)先權(quán)日1996年12月27日
發(fā)明者直井聰, 明, 勝山裕, 武部浩明 申請人:富士通株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1