專利名稱:文書檢索裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子保存并檢索·閱覽文書或圖面等圖像的文書檢索裝置,特別是涉及從通過識別記載在文書圖像或者圖面上的字符而生成·存儲的文書圖面數(shù)據(jù),使用任意的關(guān)鍵字進行全文檢索的文書檢索裝置。
背景技術(shù):
為了把紙文書作為計算機可讀取的文書圖像進行電子登錄·保存,檢索·顯示,以往,有在文書登錄時,對于文書圖像人工添加關(guān)鍵字信息的方法,或者使OCR(光學文書讀取裝置)識別文書圖像中的字符,把所生成的文書文本與文書圖像一起保存的方法。
前者的方法在文書登錄時的關(guān)鍵字添加方面需要極多的勞力和時間。另一方面,后者的方法由于字符識別性能不完全因此不能避免誤識別,如果不修正通過字符識別得到的字符代碼,則在關(guān)鍵字檢索時具有作為檢索結(jié)果將發(fā)生不顯示所希望文書的「檢索遺落」,或者作為檢索結(jié)果顯示與檢索關(guān)鍵字不同的字符行的「檢索噪聲」這樣的問題。在用人工進行的誤識別的修正方面與前者的方法一樣需要極多的勞力。
解決后者方法的問題的方法之一,有即使存在字符分割錯誤·字符識別錯誤,也能夠降低「字符遺落」,實現(xiàn)高精度的字符檢索的方法(特開2000-057315號公報)。該方法是除去用字符行處理得到的字符代碼以外,從字符圖像生成·保持表現(xiàn)各字符形狀的特征量(形狀特征),在檢索時并用字符代碼與形狀特征進行對照的方法。
參照
以往的文書檢索裝置。圖18示出例如在特開2000-057315號公報中示出的以往的文書檢索裝置的結(jié)構(gòu)。
圖18中,101是輸入裝置,102是控制裝置,103是字符識別裝置,104是特征生成裝置,105是顯示裝置,106是檢索裝置,107是特征對照判定裝置,108是檢索特征生成裝置,109是識別辭典,110是檢索數(shù)據(jù)存儲單元,111是形狀特征辭典。
下面,參照
以往的文書檢索裝置的動作。
首先說明文書登錄。圖19(a)是登錄的文書圖像,把字符識別裝置103識別了圖19(a)的結(jié)果示于圖19(b)中。
然后,特征生成裝置104生成識別了的各字符的形狀特征。形狀特征如圖20所示,通過抽取把各文書圖像8分割了的各區(qū)域中的字符外部輪廓部分的水平,垂直,右上,右下的各方向成分而生成。其結(jié)果示與圖21中。
然后,使用圖22,說明關(guān)鍵字「字符識別」與檢索數(shù)據(jù)[文宇識別」的對照處理。
檢索裝置106首先進行使用了字符代碼的對照。在圖22中,雖然輸入的關(guān)鍵字中的字符「文」「識」「別」與檢索數(shù)據(jù)一致,但是「字」不一致。
接著,檢索裝置106進行基于不一致的字符之間的形狀特征的對照。具體地講,進行不一致的關(guān)鍵字中的「字」的形狀特征122與輸出了檢索數(shù)據(jù)中的「宇」的識別結(jié)果的字符圖像的形狀特征123的對照。對于關(guān)鍵字中的字符「字」中的形狀特征,使用存儲在形狀特征辭典111中的標準圖形的特征值。
如果把字符代碼之間的距離記為C,把形狀特征之間的距離記為D,則用公式(1)表示關(guān)鍵字與檢索數(shù)據(jù)之間的距離。
Dist=(∑D+∑C)/關(guān)鍵字字符數(shù)公式(1)其中,在Cij=α(α常數(shù))時,關(guān)鍵字的第i個字符與檢索數(shù)據(jù)的第j個字符的字符代碼不一致。在Cij=0時,關(guān)鍵字的第i個字符與檢索數(shù)據(jù)的第j個字符的字符代碼一致。
D[dic(i),img(j)]=∑∑|Fdic(k1)-Fimg(k1)|公式(2)式中,第1個∑的范圍是k=1~K,第2個∑的范圍是1=1~L。
這里,F(xiàn)dic是存儲在形狀特征辭典111中的關(guān)鍵字的第i個字符的特征值,F(xiàn)img是檢索數(shù)據(jù)的第i個字符的特征值,K是方向成分數(shù),L是每個方向成分的特征數(shù)。在滿足Dist<TH(TH閾值)的情況下,視為字符行與關(guān)鍵字一致,輸出為檢索結(jié)果。
進行形狀特征對照的字符書在關(guān)鍵字與檢索數(shù)據(jù)不同的情況下,能夠通過使用動態(tài)設(shè)計法進行對照。由此,實現(xiàn)具有允許字符分割錯誤·字符識別錯誤的模糊性的對照。
在上述那樣的以往的文書檢索裝置中,為了實現(xiàn)允許字符識別錯誤·字符分割錯誤的檢索,進行具有模糊性的對照。因此,例如如果對于在具有每個單字符的字符框(以下記為單字符框)的記入欄中寫入的字符等的不存在字符分割錯誤的字符行進行檢索,則與不允許字符分割錯誤的檢索相比較存在著增加誤抽取(檢索噪聲)這樣的問題點。
另外,在沒有單字符框的字段中寫入的手寫字符與鉛字相比較,字符的大小或者字符間隔的分散性大,在字符識別中難以正確檢測1行中的字符的間隔。因此,手寫字符與鉛字相比較,增加了字符分割錯誤,降低了識別率。其結(jié)果,如果從識別手寫字符生成的文書數(shù)據(jù)進行檢索,則存在著檢索遺落增多的問題點。
這樣,根據(jù)有無字符框或者所寫的字符是鉛字還是手寫字符,字符識別中的錯誤傾向不同,在文書檢索時如果不考慮這些方面則存在著不能夠?qū)崿F(xiàn)高精度的檢索這樣的問題。
發(fā)明內(nèi)容
本發(fā)明是為解決以上的問題點而產(chǎn)生的,目的在于獲得文書檢索裝置,該文書檢索裝置在文書登錄時與識別結(jié)果一起保存檢索輔助信息,在檢索時根據(jù)檢索輔助信息進行對照,對應于各文書數(shù)據(jù)能夠進行高精度的檢索處理,由此,與不使用檢索輔助信息的情況相比較能夠削減檢索遺落·檢索噪聲。
本發(fā)明方案1的文書檢索裝置具備輸入文書的文書輸入裝置;識別由上述文書輸入裝置輸入的文書中所記載的字符的同時,作為檢索輔助信息從輸入文書的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識別裝置;存儲字符的標準圖形的特征的字符辭典;作為檢索用文書數(shù)據(jù)存儲上述字符識別裝置的字符識別結(jié)果和檢索輔助信息的文書存儲裝置;存儲上述檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)庫中的檢索用文書數(shù)據(jù)與關(guān)鍵字字符的對照時,實施對應于上述字符識別裝置抽取出的上述檢索輔助信息的對照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置。
本發(fā)明方案2的文書檢索裝置把上述檢索輔助信息作為判斷上述輸入文書中記載的字符是手寫還是鉛字的信息。
本發(fā)明方案3的文書檢索裝置中,上述文書存儲裝置在對應于上述檢索輔助信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置按照在每個檢索用文書數(shù)據(jù)庫中所指定的對照方法進行對照。
本發(fā)明方案4的文書檢索裝置具備輸入文書的輸入文書輸入裝置;保持對于文書的區(qū)域信息以及區(qū)域的屬性信息所記述的字段信息的格式定義文件;使用上述格式定義文件識別由上述文書輸入裝置輸入的文書中記載的字符的同時,作為檢索輔助信息從文書輸入的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識別裝置;存儲字符的標準圖形的特征的字符辭典;存儲上述字符識別裝置的字符識別結(jié)果,檢索輔助信息以及在上述格式定義文件中記述的字段信息的文書存儲裝置;存儲上述文書存儲裝置存儲的檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)與關(guān)鍵字的對照時,按照對應于上述檢索輔助信息以及上述字段信息的對照方法實施對照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置。
本發(fā)明方案5的文書檢索裝置把上述檢索輔助信息作為判斷上述輸入文書中記載的字符是手寫還是鉛字的信息。
本發(fā)明方案6的文書檢索裝置中,上述文書檢索裝置使用上述格式定義文件中的有無單字符框的信息進行檢索處理,在與來自存在單字符框的字段的識別結(jié)果字符的對照時進行不允許字符分割錯誤的對照,在與來自不存在單字符框的字段的識別結(jié)果字符的對照時進行允許字符分割錯誤的對照。
本發(fā)明方案7的文書檢索裝置中,上述文書存儲裝置在對應于上述檢索輔助信息以及上述字段信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置通過上述每個檢索輔助信息以及字段信息的對照輸出檢索結(jié)果。
附圖的簡單說明圖1示出本發(fā)明實施形態(tài)1的文書檢索裝置的結(jié)構(gòu)。
圖2是示出本發(fā)明實施形態(tài)1的文書檢索裝置的文書登錄動作的流程圖。
圖3是示出本發(fā)明實施形態(tài)1的文書檢索裝置的文書檢索動作的流程圖。
圖4是示出本發(fā)明實施形態(tài)1的文書檢索裝置的文書檢索動作的流程圖。
圖5示出本發(fā)明實施形態(tài)1的文書檢索裝置的檢索輔助信息與對照方式的對應關(guān)系。
圖6示出本發(fā)明實施形態(tài)1的文書檢索裝置的文書登錄用紙。
圖7示出本發(fā)明實施形態(tài)1的文書檢索裝置的文書登錄用紙的格式信息。
圖8示出由本發(fā)明實施形態(tài)1的文書檢索裝置的手寫字符的記入例。
圖9示出本發(fā)明實施形態(tài)1的文書檢索裝置的鉛字的記入例。
圖10示出圖8的文書數(shù)據(jù)。
圖11示出圖9的文書數(shù)據(jù)。
圖12示出本發(fā)明實施形態(tài)1的文書檢索裝置的檢索輔助信息,字段信息與對照方式的對應關(guān)系。
圖13示出圖8的字符數(shù)據(jù)的其它例子。
圖14示出圖9的字符數(shù)據(jù)的其它例子圖15示出本發(fā)明實施形態(tài)1的文書檢索裝置的手寫文書的字符索引的例子。
圖16示出本發(fā)明實施形態(tài)1的文書檢索裝置的印刷文書的沒有單字符框的字段的字符索引的例子。
圖17示出本發(fā)明實施形態(tài)1的文書檢索裝置的印刷文書的具有單字符框的字段的字符索引的例子。
圖18示出以往的文書檢索裝置的結(jié)構(gòu)。
圖19示出以往的文書檢索裝置的字符圖形和字符識別結(jié)果。
圖20示出以往的文書檢索裝置中的生成形狀特征的區(qū)域。
圖21示出以往的文書檢索裝置的字符識別結(jié)果和形狀特征。
圖22用于說明以往的文書檢索裝置中的對照動作。
發(fā)明的
具體實施例方式
實施形態(tài)1參照
本發(fā)明實施形態(tài)1的文書檢索裝置。圖1示出本發(fā)明實施形1的文書檢索裝置的結(jié)構(gòu)。另外,在各個圖中,相同的符號表示相同或者相當?shù)牟糠帧?br>
圖1中,1是字符輸入裝置,2是識別文書輸入裝置1輸入的文書圖像中的字符并從字符代碼和字符圖形抽取出檢索輔助信息的字符識別裝置,3是存儲字符標準圖形的圖像特征的字符辭典,4是存儲字符識別裝置2輸出的字符識別結(jié)果和檢索輔助信息的文書存儲裝置,5是關(guān)鍵字輸入裝置,6是文書檢索裝置,7是存儲由字符存儲裝置4輸出的檢索文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫,8是檢索結(jié)果輸出裝置,9是格式定義文件。
接著,參照
本發(fā)明實施形態(tài)1的文書檢索裝置的動作。
首先說明文書登錄處理。這里,使用圖6所示的定型紙進行登錄。圖6中,202示出姓名字段,203示出住址字段,204示出電話號碼字段,205示出商品名字段。
圖7示出在圖6所示的表格紙的讀取時使用的格式定義文件的例子。圖7中,示出有無每個字段的單字符框,以及字段矩形坐標。圖7所示的格式定義文件用人工生成。
圖2示出本實施形態(tài)1的文書檢索裝置的登錄處理的流程圖。
使用該圖2說明登錄處理。首先,在圖2的步驟S100中,文書輸入裝置1輸入文書圖像。該文書輸入裝置1能夠通過使用掃描儀把紙文書進行光電變換而實現(xiàn)。另外,還能夠把已經(jīng)光電變換了的圖像經(jīng)過網(wǎng)絡(luò)的讀取而實現(xiàn)。圖8以及圖9示出由文書輸入裝置1讀入的文書圖像的例子。
接著,在圖2的步驟S200中,進行字符識別。字符識別裝置2從文書輸入裝置1輸入的文書圖像出取出字符圖形,輸出對應于各字符圖像的字符代碼。在本實施形態(tài)1中,字符識別裝置2使用眾所周知的圖像處理技術(shù)實現(xiàn)。首先,根據(jù)格式定義文件9的字段矩形坐標和字符框信息,從文書圖像抽取出每個單字符的圖像。對于具有單字符框的字段,從圖像的直線成分進行字符框抽取,把各字符框內(nèi)圖像分割為單字符進行識別。對于沒有單字符框的字段,從矩形坐標內(nèi)進行字符行抽取,使用字符行的周邊分布按照每個單字符進行分割。
接著,從各個單字符圖像抽取出字符識別中使用的特征,計算與字符辭典3內(nèi)各字符的標準圖形的圖像特征的距離,按照距離減小的順序把單字符以上輸出為識別候選字符。
具體地講,從具有單字符框的字段的字符框檢測從字段矩形區(qū)域檢測水平,垂直方向成分數(shù)為一定值以上的直線成分,把在其交點被包圍的矩形作為單字符框。直線成分檢測使用眾所周知的圖像處理技術(shù)進行。其結(jié)果把所得到的單字符框內(nèi)的字符作為單字符。對于沒有單字符框的字段進行字符行抽取和字符分割。字符行抽取首先對于輸入圖像(白像素值=0,黑像素值=1的二值圖像)進行歐幾里德距離為一定值以內(nèi)的黑像素之間的耦合處理。接著,進行作為圖像處理方法的標示處理,把各標記的形狀是長方形的部分決定為字符行。
接著,從水平方向和垂直方向掃描各字符行,求黑像素數(shù)的周邊分布,把黑體像素數(shù)為極小的位置作為字符分割候選點,把字符行分割到單字符圖像中。
字符識別處理,對于單字符圖像,作為字符的特征,例如使用縱8維×橫8維的網(wǎng)孔特征。具體地講,計算在8×8的圍棋盤網(wǎng)孔形的各小區(qū)域中存在的黑像素數(shù),從字符辭典3內(nèi)的標準圖形特征與各維的差分的絕對值和求距離,按照其減小的順序,把1個或者多個字符輸出為識別候選字符。
接著,字符識別裝置2從識別的字符行的圖像特征抽取出檢索輔助信息。這里,判斷字符是鉛字還是手寫字符。其判斷方法,例如利用「1行中的手寫字符與鉛字相比較單字符的大小具有分散性,其分散性較大」這樣的知識,計算1行內(nèi)的各字符的字符外接矩形大小的平均以及分散,與從學習用鉛字數(shù)據(jù)以及手寫字符數(shù)據(jù)預先計算出的分散的閾值相比較,在分散比閾值大時,判斷為是手寫字符,在閾值以下時判斷為是鉛字。另外,字符辭典3中保持鉛字和手寫字符的標準圖形,進行從字符圖像抽取出的特征與手寫字符以及鉛字的標準圖形特征的距離計算,還能夠判斷與字符圖形距離最近的字符標準圖形是手寫字符還是鉛字。
最后,在步驟S300中,文書存儲裝置4保存識別候選字符并結(jié)束。這里,除去字符識別裝置2輸出的字符代碼以外還保存判斷手寫/印刷的檢索輔助信息。
圖10示出對于圖8所示的文書圖像的檢索用文書數(shù)據(jù),圖11示出對于圖9所示的文書圖像的檢索用文書數(shù)據(jù)。在圖10以及圖11的識別候選字符中用[ ]包圍的字符示出從單字符圖像輸出的多個識別候選字符。通過保持多個識別候選字符,使包含在字符行中的正解字符數(shù)增加,其結(jié)果能夠降低檢索遺落。把圖10,圖11所示的檢索用文書數(shù)據(jù)登錄在檢索用文書數(shù)據(jù)庫7中后結(jié)束。
其次,根據(jù)圖3,圖4的流程圖說明檢索處理的順序。
這里,在檢索關(guān)鍵字中使用「一郎」以及「一朗」進行說明。首先,在圖3的步驟S1100中,關(guān)鍵字輸入裝置5輸入檢索關(guān)鍵字。該關(guān)鍵字輸入裝置5能夠用鍵盤或鼠標,筆或者復制品等實現(xiàn)。首先,作為檢索關(guān)鍵字輸入「一郎」。
接著,在步驟S1200中,文書檢索裝置6進行檢索用文書數(shù)據(jù)庫7與輸入關(guān)鍵字的對照處理。使用圖4的流程圖說明對照處理的順序。
在圖4的步驟S1210中,從檢索用文書數(shù)據(jù)庫7抽取出1個檢索用文書數(shù)據(jù),把其檢索輔助信息和識別候選字符裝載到未圖示緩沖器中?,F(xiàn)在,在檢索用文書數(shù)據(jù)庫7中,存儲著圖10,圖11所示的2個文書。首先,把圖10所示的檢索用文書數(shù)據(jù)裝載到緩沖器中。
接著,在步驟S1220中,文書檢索裝置6進行字段內(nèi)檢索。
字段內(nèi)檢索,如圖5所示那樣,進行對應于檢索輔助信息的檢索。在圖5中,在檢索輔助信息是手寫時,進行字符分割·識別錯誤對應檢索151,是鉛字時,進行字符分割錯誤對應檢索152。
首先,從圖10獲得字段號碼1(姓名)的檢索輔助信息。這里由于是「手寫」,因此進行字符切割·識別錯誤對應檢索151。為實現(xiàn)字符切割·識別錯誤對應檢索151,既可以是通過并用以往例中所示的字符代碼和形狀特征允許字符切割·識別錯誤的方法,也可以是把輸入關(guān)鍵字的字符代碼的部分一致視為對照成功,輸出為檢索結(jié)果,允許字符切割·識別錯誤的方法。
這里示出后者的例子。在后者的情況下,從連續(xù)的字符行,計算出一致度=(關(guān)鍵字字符與檢索用文書數(shù)據(jù)中字符的一致字符數(shù))/(關(guān)鍵字字符數(shù)),在其為一定值(這里取為0.5)以上時輸出為檢索結(jié)果。識別候選字符「川上一[朗郎]」與關(guān)鍵字「一郎」的第1位識別候選字符「郎」與「朗」雖然相互不一致,但由于在第2位候選中有「郎」因此一致。這時的一致度由于是2/2=1.0,因此作為檢索結(jié)果輸出候選。
接著,進入到步驟S1230,判斷是否處理了所有的字段。由于在圖10中還存在沒有進行對照的字段因此進入到步驟S1220,進行與字段號碼2(住址)的字段內(nèi)對照。由于沒有字段號碼2的字符識別結(jié)果與關(guān)鍵字字符的一致字符,因此不存在輸出的檢索結(jié)果。
以下同樣反復進行以上處理,如果全部字段內(nèi)檢索結(jié)束則進入到步驟S1240,檢查在檢索用文書數(shù)據(jù)庫7中是否還存在沒有進行對照處理的檢索文書數(shù)據(jù)?,F(xiàn)在,由于圖11所示的檢索用文書數(shù)據(jù)存在于檢索用文書數(shù)據(jù)庫7中,因此進入到步驟S1210,同樣進行上述處理。
圖5所示的檢索用文書數(shù)據(jù)的檢索輔助信息由于是「鉛字」,因此進行字符分割錯誤對應檢索152。所謂該字符分割錯誤對應檢索152,在這里限定為字符識別的結(jié)果錯誤指的是錯誤地分割了字符的情況,在關(guān)鍵字字符與檢索用文書數(shù)據(jù)中的識別候選第1位字符中進行對照,設(shè)為即使在對照中存在部分不一致的字符,在相對應的字符數(shù)不同時也視為對照成功的對照。
例如,在關(guān)鍵字「○×電機」與字符行「○酸機」的對照中,「○」以及「機」雖然相互一致,但是「×電」與「酸」不一致,字符數(shù)分別是「2」和「1」而不同。這種情況下,在字符分割錯誤對應檢索152中字符識別裝置2解釋為「×電」錯誤,識別為「酸」而對照成功。進而為了提高精度,也可以與以往例相同,通過對照「×電」與「酸」的形狀特征,檢測不一致字符的形狀,在判斷為形狀類似時作為對照成功。
圖11中,作為輸入關(guān)鍵字「一郎」和姓名字段的識別候選字符的「山田一[郎朗]」中,「一」以及「郎」由于相互一致因此輸出為檢索結(jié)果。以下直到?jīng)]有未對照的字段為止反復進行步驟S1220到步驟S1240,如果與所有數(shù)據(jù)的對照結(jié)束則進入到步驟S1250,進行輸出結(jié)果生成。檢索結(jié)果輸出裝置8把圖10,圖11的檢索用文書數(shù)據(jù)的任一個輸出為檢索結(jié)果。最后,在圖3中進入到步驟S1300,輸出檢索結(jié)果。
其次,用本方式使用關(guān)鍵字「一朗」進行檢索。在使用了「一朗」的檢索中,圖10,11的檢索用文書數(shù)據(jù)的任一個都沒有輸出為檢索結(jié)果是理想的結(jié)果。首先,進行圖10和字符分割·識別錯誤對應檢索151。圖10的「川上一[朗郎]」由于與關(guān)鍵字的某單字符一致因此對照成功。其結(jié)果,圖10的檢索用文書數(shù)據(jù)輸出為檢索結(jié)果,成為檢索噪聲。
其次,進行圖11與字符切割錯誤對應檢索152。圖11的「山田一[郎朗]」雖然與關(guān)鍵字字符「一」一致,但是關(guān)鍵字字符「朗」與字符行中的第1位候選字符「郎」不一致,而且不一致字符數(shù)都同為「1」,因此與關(guān)鍵字的對照失敗。其結(jié)果,圖11的檢索用文書數(shù)據(jù)不作為檢索結(jié)果輸出。
根據(jù)以上處理,在本方法中,在關(guān)鍵字「一郎」中沒有檢索遺落,在關(guān)鍵字「一郎」中,檢索噪聲成為1個文書。
為了比較,對于圖10,11,考慮不使用檢索輔助條件,而用同一個方法進行檢索的情況。如使用字符分割·識別錯誤對應檢索151,在關(guān)鍵字「一郎」中進行檢索,則由于與圖10,11的任一個關(guān)鍵字字符都一致,因此對照成功。
同樣,如果使用關(guān)鍵字「一朗」進行檢索,則圖10,圖11的任一個都與關(guān)鍵字字符一致,因此對照成功,成為檢索噪聲。其結(jié)果,在由字符分割·識別錯誤對應檢索151進行的檢索中,雖然在關(guān)鍵字「一郎」中沒有檢索遺落,但是在「一朗」中檢索噪聲成為2個文書。
同樣,考慮不使用檢索輔助條件,而進行字符分割錯誤對應檢索152的情況。在與關(guān)鍵字「一郎」的對照中,雖然與圖11對照成功,但是在與圖10的對照中,關(guān)鍵字字符「郎」與檢索用文書數(shù)據(jù)中的「朗」不一致,而且由于不一致字符數(shù)相同,因此對照不成功,成為檢索遺落。
另一方面,在基于關(guān)鍵字「一朗」的檢索中,雖然圖10對照成功成為檢索噪聲,然而在與圖11的對照中,關(guān)鍵字字符「一」一致,但是「朗」不一致,不作為檢索結(jié)果輸出。其結(jié)果,在字符分割錯誤對應檢索152中,在關(guān)鍵字「一郎」中檢索遺落成為1個文書,在關(guān)鍵字組「一朗」中檢索噪聲成為1個文書。
在使用了關(guān)鍵字「一郎」「一朗」的檢索中,本方法與僅用字符分割·識別錯誤對應檢索151的情況相比較,檢索噪聲減少到1個文書。另外,與僅用字符分割錯誤對應檢索152的情況相比較,字符遺落減少到1個文書。這樣,通過使用檢索輔助信息切換檢索方法,能夠減少檢索噪聲,實現(xiàn)高精度的檢索。
作為本實施形態(tài)1的第2實現(xiàn)方法,除去文書檢索裝置6進行輔助檢索信息是「手寫」還是「鉛字」的不同對照以外,通過把格式定義文件中的字段信息也用作為檢索輔助信息,能夠進行對應于更詳細的條件的對照。
使用圖12,13,14示出其例子。在圖2的步驟S300中,文書存儲裝置4除去字符識別裝置2輸出的識別候選字符和檢索輔助信息以外,還把圖7的格式定義文件9中的有/無單字符框信息也作為檢索輔助信息加入到檢索用文書數(shù)據(jù)中,存儲到檢索用文書數(shù)據(jù)庫7中。
圖13,14示出其例子。在圖13,圖14中,檢索輔助信息1指的是手寫/鉛字信息,檢索輔助信息2指的是有/無單字符框信息。
在關(guān)鍵字與檢索用文書數(shù)據(jù)庫7的對照中,從印刷/手寫信息和有無單字符框信息的組合設(shè)定4種方法。圖12示出其例子。在與是鉛字而且具有單字符框的字段的文書數(shù)據(jù)的對照中,由于幾乎不存在字符識別錯誤·字符分割錯誤,因此設(shè)定為完全一致檢索154。這是僅在輸入關(guān)鍵字與檢索用文書數(shù)據(jù)中的字符行完全一致時作為檢索結(jié)果進行輸出的方法。
在是鉛字但是沒有單字符框的情況下,采用與本發(fā)明實施形態(tài)1的第1實現(xiàn)方式相同的字符分割錯誤對應檢索152。
另外,在是手寫字符而且沒有單字符框的情況下,也采取與本實施情態(tài)1的第1實現(xiàn)方法相同的字符分割·識別錯誤對應檢索151。
在是手寫字符而且具有單字符框的情況下,實施字符識別錯誤對應檢索153。該字符識別錯誤對應檢索153是允許輸入關(guān)鍵字與檢索用文書數(shù)據(jù)中的字符行中部分一致的檢索,在相互對應的不一致字符的字符數(shù)相同時作為檢索成功。
例如,如果考慮輸入關(guān)鍵字「○×電機」與字符行「○×雷機」的對照,則「○」「×」「機」相互一致,對應的「電」「雷」不一致。這時不一致的字符由于同為單字符,因此把「○×雷機」輸出為檢索結(jié)果。這樣,通過準備對應于檢索輔助信息的檢索方式,能夠?qū)崿F(xiàn)最佳地對應了各個識別錯誤的檢索方式。
在本實施形態(tài)1的第2實現(xiàn)方式中,在檢索中使用了檢索輔助信息與格式定義文件中的字段信息,然而并不限定于此,例如也能夠僅登錄格式信息在檢索中使用。
另外,在本實施形態(tài)1中,在輔助檢索輔助信息中使用了印刷·手寫的判斷,而檢索輔助信息并不限定于此,例如也能夠使用文書圖像的品質(zhì)(噪聲的多少),豎寫·橫寫,字體的種類,字符尺寸等。
另外,在本實施形態(tài)1中,在1個檢索用文書數(shù)據(jù)庫7中混合保持著手寫字符和鉛字等檢索用文書數(shù)據(jù),然而并不限定于此,也能夠按照手寫字符,鉛字等檢索輔助信息的不同獨立地生成檢索用文書數(shù)據(jù)庫7,以各個特定的檢索方式進行檢索。在本實施形態(tài)1的第2實現(xiàn)方式中,在圖12中,在每個檢索輔助信息中示出4種檢索方式,而通過在各個檢索方式生成最佳的檢索用索引(字符位置索引信息)能夠?qū)崿F(xiàn)檢索的高速化。
這里,圖15,圖16,圖17示出檢索用索引。在各個索引中,作為索引信息保持字符代碼,字段號碼,字符位置。由此,能夠不把字符識別結(jié)果與關(guān)鍵字直接對照,高速地搜索存在于文書內(nèi)的關(guān)鍵字。
圖17是完全一致搜索154的檢索用索引,從檢索輔助信息是「鉛字」而且是「具有單字符框」的字段,即圖14的字段號碼3,4生成。例如,從作為字段號碼「4」的識別結(jié)果的「 」,「 」的字段號碼為4,字符位置從字段的起始數(shù)起,由于是單字符,因此成為「1」。同樣,「 」的字段號碼是4,字符位置是2。以下同樣地生成。另外,還生成與「 」的字符號碼4,字符位置1,「 」的字符號碼4,字符位置號碼2連接的2個字符的索引。由于越增加連接字符數(shù),越減少輸入關(guān)鍵字字符的索引的讀入和對照次數(shù),因此能夠?qū)崿F(xiàn)完全一致檢索154的高速化。
圖15是字符識別錯誤對應檢索153,以及字符分割·字符識別錯誤對應檢索151的檢索索引,從圖13的字符識別結(jié)果生成。同樣,圖16是字符分割對應檢索152的檢索用索引的例子,從圖14的字段號碼1,2生成。圖15,圖16是具有模糊性的檢索方式的索引,為了防止起因于字符分割錯誤·字符識別錯誤的檢索遺落,僅使用單字符索引進行檢索。由此,如圖17那樣與保持連接字符索引的情況相比較,能夠削減索引容量,而且實現(xiàn)高速檢索。在手寫·印刷中進行同一檢索時,還能夠把圖15,圖16所示的檢索用索引匯總為1個。
如以上所說明的那樣,如果依據(jù)本實施形態(tài)1,則在文書登錄時與識別結(jié)果一起保存檢索輔助信息,在檢索時通過根據(jù)檢索輔助信息進行對照,能夠?qū)诟魑臅鴶?shù)據(jù)進行高精度的檢索處理。由此,與不使用檢索輔助信息的情況相比較能夠削減檢索遺落·檢索噪聲。
本發(fā)明方案1的文書檢索裝置如以上說明的那樣,由于具備輸入文書的文書輸入裝置;識別由上述文書輸入裝置輸入的文書中所記載的字符的同時,作為檢索輔助信息從輸入文書的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識別裝置;存儲字符的標準圖形的特征的字符辭典;作為檢索用文書數(shù)據(jù)存儲上述字符識別裝置的字符識別結(jié)果和檢索輔助信息的文書存儲裝置;存儲上述檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)庫中的檢索用文書數(shù)據(jù)與關(guān)鍵字字符的對照時,實施對應于上述字符識別裝置抽取出的上述檢索輔助信息的對照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置,因此具有能夠進行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案2的文書檢索裝置以上所說明的那樣,由于把上述檢索輔助信息作為判斷上述輸入文書中記載的字符是手寫還是鉛字的信息,因此具有能夠進行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案3的文書檢索裝置以上所說明的那樣,由于上述文書存儲裝置在對應于上述檢索輔助信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置按照在每個檢索用文書數(shù)據(jù)庫中所指定的對照方法進行對照,因此具有能夠進行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案4的文書檢索裝置以上所說明的那樣,由于具備輸入文書的輸入文書輸入裝置;保持對于文書的區(qū)域信息以及區(qū)域的屬性信息所記述的字段信息的格式定義文件;使用上述格式定義文件識別由上述文書輸入裝置輸入的文書中記載的字符的同時,作為檢索輔助信息從文書輸入的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識別裝置;存儲字符的標準圖形的特征的字符辭典;存儲上述字符識別裝置的字符識別結(jié)果,檢索輔助信息以及在上述格式定義文件中記述的字段信息的文書存儲裝置;存儲上述文書存儲裝置存儲的檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)與關(guān)鍵字的對照時,按照對應于上述檢索輔助信息以及上述字段信息的對照方法實施對照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置,因此具有能夠進行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案5的文書檢索裝置以上所說明的那樣,由于把上述檢索輔助信息作為判斷上述輸入文書中記載的字符是手寫還是鉛字的信息,因此具有能夠進行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案6的文書檢索裝置以上所說明的那樣,由于上述文書檢索裝置使用上述格式定義文件中的有無單字符框的信息進行檢索處理,在與來自存在單字符框的字段的識別結(jié)果字符的對照時進行不允許字符分割錯誤的對照,在與來自不存在單字符框的字段的識別結(jié)果字符的對照時進行允許字符分割錯誤的對照,因此具有能夠進行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案7的文書檢索裝置以上所說明的那樣,由于上述文書存儲裝置在對應于上述檢索輔助信息以及上述字段信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置通過上述每個檢索輔助信息以及字段信息的對照輸出檢索結(jié)果,因此具有能夠進行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
權(quán)利要求
1.一種文書檢索裝置,其特征在于具備輸入文書的文書輸入裝置;識別由上述文書輸入裝置輸入的文書中所記載的字符的同時,作為檢索輔助信息從輸入文書的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識別裝置;存儲字符的標準圖形的特征的字符辭典;作為檢索用文書數(shù)據(jù)存儲上述字符識別裝置的字符識別結(jié)果和檢索輔助信息的文書存儲裝置;存儲上述檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)庫中的檢索用文書數(shù)據(jù)與關(guān)鍵字字符的對照時,實施對應于上述字符識別裝置抽取出的上述檢索輔助信息的對照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置。
2.根據(jù)權(quán)利要求1所述的文書檢索裝置,其特征在于上述檢索輔助信息是判斷上述輸入文書中記載的字符是手寫還是鉛字的信息。
3.根據(jù)權(quán)利要求1所述的文書檢索裝置,其特征在于上述文書存儲裝置在對應于上述檢索輔助信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置按照在每個檢索用文書數(shù)據(jù)庫中所指定的對照方法進行對照。
4.一種文書檢索裝置,其特征在于具備輸入文書的輸入文書輸入裝置;保持對于文書的區(qū)域信息以及區(qū)域的屬性信息所記述的字段信息的格式定義文件;使用上述格式定義文件識別由上述文書輸入裝置輸入的文書中記載的字符的同時,作為檢索輔助信息從文書輸入的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識別裝置;存儲字符的標準圖形的特征的字符辭典;存儲上述字符識別裝置的字符識別結(jié)果,檢索輔助信息以及在上述格式定義文件中記述的字段信息的文書存儲裝置;存儲上述文書存儲裝置存儲的檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)與關(guān)鍵字的對照時,按照對應于上述檢索輔助信息以及上述字段信息的對照方法實施對照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置。
5.根據(jù)權(quán)利要求4所述的文書檢索裝置,其特征在于上述檢索輔助信息是判斷上述輸入文書中記載的字符是手寫還是鉛字的信息。
6.根據(jù)權(quán)利要求4所述的文書檢索裝置,其特征在于上述文書檢索裝置使用上述格式定義文件中的有無單字符框的信息進行檢索處理,在與來自存在單字符框的字段的識別結(jié)果字符的對照時進行不允許字符分割錯誤的對照,在與來自不存在單字符框的字段的識別結(jié)果字符的對照時進行允許字符分割錯誤的對照。
7.根據(jù)權(quán)利要求4所述的文書檢索裝置,其特征在于上述文書存儲裝置在對應于上述檢索輔助信息以及上述字段信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置通過上述每個檢索輔助信息以及字段信息的對照輸出檢索結(jié)果。
全文摘要
以往,由于書寫的字符沒有考慮是鉛字還是手寫字符,因此存在著不能夠?qū)崿F(xiàn)高精度的檢測這樣的課題,本發(fā)明具備識別由文書輸入裝置1輸入的文書中記載的字符,從輸入文書的圖像作為檢索輔助信息抽取出有關(guān)字符的品質(zhì),狀態(tài)的信息的字符識別裝置2;存儲字符的標準圖形的特征的字符辭典3;作為檢索用文書數(shù)據(jù)存儲字符識別結(jié)果和檢索輔助信息的文書存儲裝置4;存儲上述檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫7;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置5;在上述檢索用文書數(shù)據(jù)與關(guān)鍵字字符的對照時,實施對應于上述字符識別裝置抽取出的上述檢索輔助信息的對照的文書檢索裝置6;輸出上述檢索結(jié)果的檢索結(jié)果輸出裝置8,由此能夠?qū)崿F(xiàn)高精度的檢索處理,能夠削減檢索遺落、檢索噪聲。
文檔編號G06K9/62GK1381799SQ0210571
公開日2002年11月27日 申請日期2002年4月15日 優(yōu)先權(quán)日2001年4月16日
發(fā)明者龜代泰三 申請人:三菱電機株式會社