圖像辨別裝置及圖像檢索裝置的制作方法

文檔序號：6462108閱讀：145來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：圖像辨別裝置及圖像檢索裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別的圖像辨別裝置及具有該裝置的圖4象檢索裝置。
背景技術(shù)：
在復(fù)印機、傳真裝置、打印機及兼有多個上述功能的復(fù)合機等的圖
像形成裝置中，有具備如下功能的裝置，即將所輸入的原稿圖像等的圖像數(shù)據(jù)存儲在大容量的存儲裝置中，且只要是曾經(jīng)輸入并登記過的圖像數(shù)據(jù)，則隨時能夠?qū)⑵渥x出并再次輸出的功能。
可再次輸出的功能雖然便利，但如果登記的數(shù)據(jù)量增多，則搜索欲再次輸出的數(shù)據(jù)的操作會變得較困難，因此，從多個圖像數(shù)據(jù)之中檢索所需的圖像數(shù)據(jù)的圖像檢索技術(shù)變得尤為重要。
在檢索圖像數(shù)據(jù)時，需要對已登記的圖像數(shù)據(jù)和所輸入的圖像數(shù)據(jù) 進行比較，并算出相似性，但是已登記的圖像數(shù)據(jù)中，文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù)(照片、圖形、圖解等)混在一起。
在以往的技術(shù)中，例如，在中國專利第200510005334.9號i兌明書中所記載的圖^M^r索裝置中，對文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù)這兩種圖像數(shù)據(jù)使用相同的算法來算出特征量，而沒有如對文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù)進行辨別的處理步驟。
另一方面，作為辨別圖像數(shù)據(jù)中所應(yīng)用的技術(shù)，有區(qū)域分離技術(shù). 區(qū)域分離技術(shù)是為實施下述處理而預(yù)先進行的處理步驟，即例如，將一個圖像數(shù)據(jù)分離為文字區(qū)域、照片區(qū)域、點狀區(qū)域、基底區(qū)域等多個區(qū)域，并針對每個區(qū)域?qū)嵤┻m當?shù)奶幚?過濾處理、中間色調(diào)處理)。
這種區(qū)域分離技術(shù)，公開在美國專利第5465304號說明書、美國專利第7085420號說明書、中國專利第200510063768.4號說明書等中。
此外，日本專利特開平4-309191號公報記載的區(qū)域?qū)傩宰R別裝置，檢測黑條和黑條的連結(jié)部位，完成連結(jié)后就檢測出黑像素群的外接矩形。制作以該外接矩形的高度或?qū)挾葹榇螖?shù)的柱狀圖，并當微小矩形的出現(xiàn)次數(shù)在閾值以上時看作照片區(qū)域，在偏差比柱狀圖的標準偏差小時看作文字區(qū)域，而當偏差比柱狀圖的標準偏差大時看作圖形區(qū)域。
在以往的技術(shù)中，因為對文檔圖像數(shù)據(jù)和非文檔圖《象數(shù)據(jù)這兩種圖像數(shù)據(jù)使用相同的算法來算出特征量，所以不能充分提高檢索精度。需要將檢索時所輸入的數(shù)據(jù)和全部的登記圖像數(shù)據(jù)進行比較，因此，登記圖像數(shù)據(jù)越多檢索處理所花費的時間就多。
此外，關(guān)于文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù)的任意一個進行辨別的辨別精度，利用以往技術(shù)是得不到充分的精度的。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種可提高辨別精度的圖像辨別裝置，另一目的是提供可縮短檢索處理所需要的時間，且可提高檢索精度的圖像檢索裝置。
本發(fā)明為一種圖像辨別裝置，其對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)
據(jù)還是非文檔圖像數(shù)據(jù)進行辨別，其特征在于，具有
2值化處理部，其對所輸入的圖像數(shù)據(jù)進行2值化，而轉(zhuǎn)換成2值圖像數(shù)據(jù)，并算出黑像素數(shù)在構(gòu)成圖像數(shù)據(jù)的全部像素數(shù)中的比例即整體黑像素比例；
特征抽出部，其檢測上述2值圖像數(shù)據(jù)中所包含的、相同顏色的像素連結(jié)并集合而成的像素群即連通區(qū)域，并檢測出外接于該連通區(qū)域的外接矩形，生成以級別為外接矩形的大小，且以次數(shù)為連通區(qū)域數(shù)的柱狀圖像辨別部，其基于與所生成的柱狀圖相關(guān)聯(lián)的信息、和上述整體黑像素比例，對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù) 進行辨別。
根據(jù)本發(fā)明，首先利用2值化處理部，對所輸入的圖像數(shù)據(jù)進行2 值化，并算出整體黑像素比例。在特征抽出部中，檢索出上述2值圖像數(shù)據(jù)中所包含的、相同顏色的像素連結(jié)并集合而成的像素群即連通區(qū)域，并檢測出外接于該連通區(qū) 域的外接矩形，生成以級別為外接矩形的大小、且以次數(shù)為連通區(qū)域數(shù) 的柱狀圖。
圖像辨別部基于與所生成的柱狀圖相關(guān)聯(lián)的信息、和上述整體黑像素比例，對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別。
通過基于與柱狀圖相關(guān)聯(lián)的信息、和上述整體黑像素比例，可以縮短辨別處理所需要的時間，并可以提高辨別精度。
此外，本發(fā)明的特征還在于，上述特征抽出部，基于外接矩形的大小、和構(gòu)成連通區(qū)域的像素數(shù)在外接矩形內(nèi)的全部^^素中的比例，即矩形黑像素比例，從全部連通區(qū)域中去除外接矩形的大小比規(guī)定的大小小的連通區(qū)域，進而去除上述矩形黑像素比例在規(guī)定范圍之外的連通區(qū) 域，使用剩余的連通區(qū)域來生成柱狀圖。
根據(jù)本發(fā)明，上述特征抽出部，作為第1階段，去除外接矩形的大小比規(guī)定大小小的連通區(qū)域，作為第2階段，去除上述矩形黑像素比例在規(guī)定范圍以外的連通區(qū)域。使用去除這種不需要的連通區(qū)域之后剩余的連通區(qū)域來制作柱狀圖。
當外接矩形的大小極端小的情況下，4艮多為點或線條，并且在辨別是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)時，對辨別精度的影響小，因此，通過預(yù)先去除這些連通區(qū)域，可以抑制生成柱狀圖時的運算量。
矩形黑像素比例極端大的情況，例如為油墨污點，若不能預(yù)先去除單純的污點等時，則如果污點部分類似于文字的外接矩形，則盡管不是文字卻傾向于辨別為文檔圖像數(shù)據(jù)，如果污點部分類似于圖形的外接矩形，則盡管不是圖像卻傾向于辨別為非文檔圖像數(shù)據(jù)，結(jié)果就引起誤辨別，從而成為降低辨別精度的原因。
通過這樣地去除連通區(qū)域，可以抑制柱狀圖處理中的運算量，并且可以提高辨別精度。
此外，本發(fā)明中，上述圖像辨別部，當設(shè)外接矩形的大小最小的等級的連通區(qū)域數(shù)為rl、設(shè)上述結(jié)合像素數(shù)rl在全部結(jié)合像素數(shù)中的比例為r2、設(shè)上述整體黑《象素比例為r0時，以F=rl xr2/r0的方式求出辨別特征量F，并基于辨別特征量F來辨別所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)。
根據(jù)本發(fā)明，在文檔圖像數(shù)據(jù)的柱狀圖中，在外接矩形的大小最小級別的連通區(qū)域數(shù)上出現(xiàn)顯著的峰值，因此，rl和r2比較大，整體的黑像素少，所以r0小。從而，F(xiàn)有可能傾向于大值。相反，在非文檔圖像數(shù)據(jù)的柱狀圖中，各級別的的連通區(qū)域數(shù)平坦，未出現(xiàn)顯著的峰值，所以，rl和r2比較小，整體的黑像素多，因此r0大。從而，F(xiàn)有可能傾向于小值。
通過使用辨別特征量F來進行辨別，可以進一步提高辨別精度。此外，本發(fā)明為一種從預(yù)先登記的圖4象數(shù)據(jù)中檢索類似于所輸入的
技術(shù)方案1所記栽的圖像辨別裝置；
特征數(shù)據(jù)生成部，其基于上述圖像辨別裝置的辨別結(jié)果，如果所輸入的圖像數(shù)據(jù)為文檔圖像數(shù)據(jù)，則生成文檔圖像數(shù)據(jù)用的特征數(shù)據(jù)，如果是非文檔圖像數(shù)據(jù)，則生成非文檔圖像數(shù)據(jù)用的特征數(shù)據(jù)；
檢索部，其基于預(yù)先登記的圖像數(shù)據(jù)的特征數(shù)據(jù)、和利用上述特征數(shù)據(jù)生成部生成的特征數(shù)據(jù)，從預(yù)先登記的圖像數(shù)據(jù)中檢索類似于所輸入的圖像數(shù)據(jù)的圖像數(shù)據(jù)；
顯示部，其基于檢索部的檢索結(jié)果，對預(yù)先登記的圖像數(shù)據(jù)之中的、類似于所輸入的圖像數(shù)據(jù)的圖像數(shù)據(jù)進行顯示。
根據(jù)本發(fā)明，特征數(shù)據(jù)生成部，基于上述圖像辨別裝置的辨別結(jié)果，如果所輸入的圖像數(shù)據(jù)為文檔圖像數(shù)據(jù)，則生成文檔圖4象數(shù)據(jù)用的特征數(shù)據(jù)，如果是非文檔圖像數(shù)據(jù)，則生成非文檔圖像數(shù)據(jù)用的特征數(shù)據(jù)。在檢索部，基于預(yù)先登記的圖像數(shù)據(jù)的特征數(shù)據(jù)、和利用上述特征數(shù)據(jù) 生成部生成的特征數(shù)據(jù)，檢索到類似于所輸入的圖像數(shù)據(jù)的圖像數(shù)據(jù) 后，顯示部對預(yù)先登記的圖像數(shù)據(jù)之中的、類似于所輸入的圖像數(shù)據(jù)的圖像數(shù)據(jù)進行顯示。通過在檢索處理之前辨別所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)，可以算出最佳的特征量，并可以提高檢索精度。
此外，本發(fā)明的特征為，
將預(yù)先登記的圖像數(shù)據(jù)分類為文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù)，并
進行登記；
上述檢索部，基于上述圖像辨別裝置的辨別結(jié)果，如果所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)，則以作為文檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對象，如果所輸入的圖像數(shù)據(jù)為非文檔圖像數(shù)據(jù)，則以作為非文檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對象。
根據(jù)本發(fā)明，如果所輸入的圖像數(shù)據(jù)為文檔圖像數(shù)據(jù)，則以作為文檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對象，如果所輸入的圖像數(shù)據(jù)為非文檔圖像數(shù)據(jù)，則以作為非文檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對象。
由此，在檢索部中可以對作為比較特征量的對象的圖像數(shù)據(jù)數(shù)進行限定，所以可以縮短檢索處理所需要的時間。
本發(fā)明的目的、特點、以及優(yōu)點，通過下述的詳細說明和附圖而變得更加明確。

圖1是表示圖像檢索裝置10的機械性構(gòu)成的框圖. 圖2是表示圖像檢索裝置10的功能性構(gòu)成的框圖。圖3是表示辨別部12的功能性構(gòu)成的框圖。圖4是表示由圖像辨別部12進行的辨別處理的流程圖。圖5是表示由預(yù)處理部120進行的預(yù)處理的流程圖。圖6是表示特征抽出部121的特征抽出處理的流程圖。圖7是將柱狀圖可視化了的曲線圖。圖8是表示由辨別部122進行的辨別處理的流程圖。
具體實施例方式
以下，參照附圖對本發(fā)明的優(yōu)選實施方式詳細地進行"^兌明。
圖1是表示圖像檢索裝置10的機械性構(gòu)成的框圖。圖4象檢索裝置 IO包括處理器4;存儲處理器4進行實際處理用的軟件等的外部存儲裝置5。
處理器4進行辨別處理，即，對所輸入的圖像數(shù)據(jù)(以下稱作"輸入圖像數(shù)據(jù)")是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別，并進一步基于該辨別結(jié)果對輸入圖像數(shù)據(jù)和預(yù)先登記的多個圖像數(shù)據(jù)(以下稱作"登記圖像數(shù)據(jù)")進行對照，從而實際進行檢索并顯示類似于輸入圖像數(shù)據(jù)的登記圖像數(shù)據(jù)的圖像檢索處理等。處理器4中的實際處理，利用存儲于外部存儲裝置5中的軟件來執(zhí)行。處理器4，例如，利用通常的計算機主機等來構(gòu)成。
外部存儲裝置5，例如可以利用可進行高速處理的硬件等構(gòu)成。外部存儲裝置5，也可以是為大量保存登記圖像數(shù)據(jù)而使用光盤等大容量器件的構(gòu)成。此外，在辨別處理中和檢索處理中，在各處理步驟階段中生成的臨時數(shù)據(jù)等，可以存儲在外部存儲裝置5中，也可以存儲于內(nèi)置于處理器4中的半導(dǎo)體存儲器中。
在文檔處理裝置10上連接有鍵盤1，并且還連接有顯示裝置3。鍵盤1用于輸入執(zhí)行各種軟件用的指示等。
顯示裝置3進行基于輸入圖像數(shù)據(jù)和登記圖像數(shù)據(jù)的圖像顯示和檢索結(jié)果的顯示等。
圖像檢索裝置10上還連接有圖像掃描儀2。圖像掃描儀2用于讀取打印有圖像的原稿，并讀入輸入圖像數(shù)據(jù)。
輸入圖像數(shù)據(jù)的取得，除來自圖像掃描儀2的輸入之外，還可以經(jīng) 由通信I/F(接口 )6，通過數(shù)據(jù)通信從網(wǎng)絡(luò)上的其它裝置取得。通信I/F6, 可以利用連接于LAN ( Local Area Network)用的LAN卡、和連接于公共交換電話網(wǎng)以進行數(shù)據(jù)通信用的調(diào)制解調(diào)器卡等來實現(xiàn)。圖2是表示圖像檢索裝置10的功能性構(gòu)成的框圖。
圖像檢索裝置10的構(gòu)成包括輸入部ll、圖像辨別部12、檢索部 13、顯示部14以及登記圖4象存儲部15。
輸入部11輸入輸入圖像數(shù)據(jù)、登記圖像數(shù)據(jù)。在圖1所示的硬件構(gòu) 成中，圖像掃描儀2、通信I/F6等在功能上相當于輸入部11。登記圖像數(shù)據(jù)是在輸入輸入圖像數(shù)據(jù)之前預(yù)先輸入的圖像數(shù)據(jù)，存儲在登記圖像存儲部17中。
圖3是表示辨別部12的功能性構(gòu)成的框圖。
圖像辨別部12的構(gòu)成包括預(yù)處理部120、特征抽出部121、辨別部122。
圖像辨別部12，對利用輸入部11而輸入的圖像數(shù)據(jù)是文檔圖像數(shù) 據(jù)還是非文檔圖像數(shù)據(jù)進行辨別，并向后續(xù)的檢索部13輸出其辨別結(jié) 果。在檢索部13中，根據(jù)輸入圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)，來變更檢索處理所需的特征量，并算出適于圖像數(shù)據(jù)的特征量。
圖4是表示由圖像辨別部12進行的辨別處理的流程圖。在步驟Al 中，預(yù)處理部120，作為對所輸入的圖4象數(shù)據(jù)的預(yù)處理而實施2值化處理。在步驟A2中，特征抽出部121，基于2值化后的圖像數(shù)據(jù)，進行結(jié)合像素的外接矩形的檢索以及外接矩形的統(tǒng)計處理(生成柱狀圖)。在步驟A3中，辨別部122，基于統(tǒng)計處理結(jié)果，對輸入圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別，并在步驟A4中，向檢索部 13輸出辨別結(jié)果。
以下，對各步驟詳細說明。
由預(yù)處理部120進行的步驟Al的預(yù)處理，例如示于圖5的流程圖。
輸入圖像數(shù)據(jù)后，在步驟B1中，判斷所輸入的圖像數(shù)據(jù)是否是彩色圖像數(shù)據(jù)。如果是彩色圖像數(shù)據(jù)，則進入步驟B2,進行基于明度成分的灰度化，而轉(zhuǎn)換成灰度圖像數(shù)據(jù)。如果不是彩色圖像，則進入步驟 B3，判斷是否是灰度圖像數(shù)據(jù)。如果是灰度圖像數(shù)據(jù)則進入步驟B4，并使用預(yù)先確定的閾值來進行2值化，而將灰度圖像數(shù)據(jù)轉(zhuǎn)換成2值圖像數(shù)據(jù)。如果不是灰度圖像數(shù)據(jù)，則即是2值圖像數(shù)據(jù)，所以結(jié)束處理。2值圖像數(shù)據(jù)，是將構(gòu)成圖像數(shù)據(jù)的各像素的像素值設(shè)為0或l(白像素或黑像素)的任意一個、即所謂灰度圖像數(shù)據(jù)，就是對灰度圖像數(shù) 據(jù)的各像素的灰度(濃度)進行閾值處理，而將全部像素分類為黑像素和白像素。
此外，在步驟B4中，算出黑像素在構(gòu)成作為辨別對象的圖像數(shù)據(jù) 的全部像素數(shù)中的比例，即算出整體黑像素比例。
由特征抽出部121進行的步驟A2的特征抽出處理，例如示于圖6 的流程圖。
在輸入由預(yù)處理部120進行2值化處理后的2值圖像數(shù)據(jù)后，在步驟C1中，檢測出2值圖像數(shù)據(jù)中的全部連通區(qū)域。
所謂連通區(qū)域是指將連結(jié)的相同顏色的像素集合起來的像素群。檢測黑像素的連通區(qū)域還是檢測白像素的連通區(qū)域，取決于所輸入的圖像數(shù)據(jù)n的基底是黑像素還是白像素。一般情況下基底為白像素較多，并用黑像素來描繪文字圖像或圖形圖像，因此，在本實施方式中，對檢測黑像素的連通區(qū)域的情況進行說明。當基底為黑像素的情況下，利用白像素來描繪文字圖像和圖形圖像，即為空白文字或空白圖形，在此情況下，檢測白像素的連通區(qū)域。
并且，可以利用公知的基底辨別處理來辨別基底是黑像素還是白像素，例如，當上述的整體黑像素比例小于規(guī)定比例時，辨別為基底是白像素，當比規(guī)定比例大時，辨別為基底是黑像素。
連通區(qū)域的檢測，可以利用公知的檢測方法來進行檢測。例如，對于1行而言，檢測在該行中相互鄰接的黑像素的連續(xù)部分(黑條)，并按每一行存儲黑條的掃描寬度和黑條兩端的黑像素的坐標。坐標，例如，預(yù)先將平行于行的方向設(shè)為x軸，將正交于行的方向設(shè)為y軸。
對在y方向上隔著一個關(guān)注行的上下行的黑條而言，如果其兩端的黑像素的x坐標在關(guān)注行的各黑條兩端的黑像素坐標的x坐標范圍內(nèi)，則可以將關(guān)注行的該黑條、與以x坐標在范圍內(nèi)的黑像素為端部像素的黑條，看作在y方向上連結(jié)。
這樣一來，一邊依次挪動關(guān)注行，一邊對所有圖像數(shù)據(jù)檢測x方向的連結(jié)部分和y方向的連結(jié)部分，從而檢測出黑像素的連通區(qū)域。
在檢測出黑像素的連通區(qū)域后，生成外接于所檢測出的全部連通區(qū) 域的外接矩形。外接矩形是由平行于x方向的邊和平行于y方向的邊構(gòu) 成的矩形，且設(shè)x方向的邊長為矩形寬度，設(shè)y方向的邊長為矩形高度。
外接矩形的生成，可以利用公知的生成方法來生成。例如，在檢測出連通區(qū)域時，因為已經(jīng)檢測出各黑條兩端的黑像素的坐標，所以，以全部黑條為對象，抽出x坐標的最小值和最大值，并將最大值和最小值的差值作為矩形的寬度(像素數(shù))來算出。此外，以構(gòu)成連通區(qū)域的全部黑條為對象，抽出y坐標的最小值和最大值，并將最大值和最小值的差值作為矩形的高度(像素數(shù))來算出。
在本發(fā)明中，進一步對全部結(jié)合像素，算出在外接矩形內(nèi)的像素中黑像素所占的比例，亦即算出矩形黑像素比例。如上所述，由于算出作為外接矩形的尺寸信息的矩形的寬度和矩形的高度，所以，使用這些信息來算出外接矩形內(nèi)的全部像素數(shù)，并根據(jù)構(gòu)成連通區(qū)域的全部黑條的掃描寬度的總和來算出黑像素數(shù)。
因此，可以利用(構(gòu)成連通區(qū)域的黑像素數(shù))/ (外接矩形內(nèi)的全部像素數(shù))的計算式來算出矩形黑像素比例。
如以上所述，在步驟C1中，與各連通區(qū)域相關(guān)聯(lián)地在規(guī)定存儲區(qū) 域中，存儲相對于2值圖〗象數(shù)據(jù)中的全部的連通區(qū)域而言，構(gòu)成連通區(qū) 域的黑像素的位置(坐標)、外接矩形的位置(坐標)、外接矩形的矩形寬度、矩形高度以及矩形黑像素比例。
接下來，在步驟C2中，在進行統(tǒng)計處理之前進行連通區(qū)域的挑選。這里的挑選，以去除統(tǒng)計處理中不使用的連通區(qū)域為目的。步驟C2中的挑選，即連通區(qū)域的去除經(jīng)兩個階段進行。
第1階段的挑選為基于外接矩形的尺寸的挑選。
對外接矩形的矩形寬度和矩形高度預(yù)先設(shè)定閾值(例如，0.4)，對閾值和矩形寬度及矩形高度進行比較，當矩形寬度及矩形高度的任意一個小于閾值的情況下，去除該外接矩形的連通區(qū)域。
矩形寬度或矩形高度極端小的情況下，很多為點或線條，在辨別是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)時，對辨別精度的影響小，因此，通過去除該連通區(qū)域，可以抑制統(tǒng)計處理中的運算量。
第2階段的挑選為基于矩形黑像素比例的挑選。
針對矩形黑像素比例預(yù)先設(shè)定規(guī)定范圍(例如0.05 ~ 0.8)，對規(guī)定范圍和矩形黑像素比例進行比較，在矩形黑像素比例在規(guī)定范圍以外的情況下，去除該外接矩形的連通區(qū)域。
矩形黑像素比例極端小的情況，例如為斜線的線條等，對辨別精度的影響小，所以，通過去除該連通區(qū)域，可以抑制后續(xù)的統(tǒng)計處理中的運算量。
矩形黑像素比例極端大的情況，例如為油墨污點，若不能預(yù)先去除單純的污點等，則如果污點部分類似于文字的外接矩形，則盡管不是文字卻傾向于辨別為文檔圖像數(shù)據(jù)，如果污點部分類似于圖形的外接矩形，則盡管不是圖形卻傾向于辨別為非文檔圖像，其結(jié)果是引起誤辨別，從而成為降低辨別精度的原因。
通過基于矩形黑像素比例來進行挑選，可以抑制后續(xù)的統(tǒng)計處理的運算量，并且能提高辨別精度。
如以上所述，在步驟C2中，進行2階段的挑選，在統(tǒng)計處理之前預(yù)先刪除不需要的連通區(qū)域，在統(tǒng)計處理中僅使用挑選后剩余的連通區(qū) 域。
在步驟C3中，使用挑選后的連通區(qū)域進行統(tǒng)計處理。
統(tǒng)計處理具體地講是柱狀圖的生成。全部的連通區(qū)域，因為具有矩形寬度和矩形高度的尺寸信息，所以，使用這些尺寸信息來生成柱狀圖。
在這里生成的柱狀圖，是以外接矩形的尺寸(矩形寬度或矩形高度) 為級別、并以級別所包含的連通區(qū)域數(shù)為次數(shù)而生成的。
生成的柱狀圖的級別，由圖像數(shù)據(jù)整體的寬度W或高度H來決定。設(shè)級別數(shù)為N時，矩形寬度比1 x W/N小的連通區(qū)域，以第1級別所包含的連通區(qū)域為次數(shù)進行計數(shù)。從而，矩形寬度為kxW/N (k+l) xW/N的范圍內(nèi)包含的連通區(qū)域，以第k級別中所包含的連通區(qū)域為次數(shù)進行計數(shù)。
若將所制作的柱狀圖可視化為曲線圖，則例如，如圖7所示橫軸為尺寸，縱軸為連通區(qū)域數(shù)的次數(shù)分布曲線圖。
圖7 (a)表示文檔圖像數(shù)據(jù)的柱狀圖的例子，圖7 (b)表示非文檔圖像數(shù)據(jù)的柱狀圖的例子。當連通區(qū)域是文字的情況下，外接矩形近似于正方形，且包含多個相同尺寸的連通區(qū)域，因此，作為柱狀圖，特征在于，主要在小尺寸級別的連通區(qū)域數(shù)上出現(xiàn)顯著的峰值。此外，當連通區(qū)域是非文字的情況下，連通區(qū)域為點狀、線狀、塊兒狀等，形狀沒有規(guī)則性，大小也比較零散。因此，作為柱狀圖，特征在于，各級別的連通區(qū)域數(shù)平坦，未出現(xiàn)顯著的峰值。
并且，在本發(fā)明中，即使不對柱狀圖進行曲線化并顯示，也可以完成后續(xù)的處理，不過，也可以構(gòu)成為利用顯示部14來顯示進行曲線化后的柱狀圖。
辨別部122可以基于如上述的柱狀圖的特征，來辨別輸入圖像數(shù)據(jù) 是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)。
作為與從特征抽出部121向辨別部122輸出的柱狀圖相關(guān)聯(lián)的倌息，例如，有整體黑像素比例r0、第1級別連通區(qū)域數(shù)rl，第1級別的連通區(qū)域數(shù)相對于全部連通區(qū)域數(shù)的比例r2、以及辨別處理中所使用的特征量(辨別特征量)F。辨別特征量F利用F = rl x r2/r0來算出。
根據(jù)柱狀圖的特征，文檔圖像數(shù)據(jù)，由于在第l級別連通區(qū)域數(shù)上出現(xiàn)顯著的峰值，所以rl和r2較大，整體的黑像素少，因此r0小。從而，F(xiàn)有可能為大值。
相反，非文檔圖像數(shù)據(jù)，由于各級別的連通區(qū)域數(shù)平坦，未出現(xiàn)顯著的峰值，所以rl和r2較小，整體的黑像素多，因此r0大。從而，F(xiàn) 有可能為小值。
由辨別部122進行的步驟A3中的辨別處理，例如，示于圖8的流程圖。在辨別處理中，對辨別特征量F和兩個閾值TH1及TH2( > TH1) 進行比較，并進行閾值處理。
作為與利用特征抽出部121所生成的柱狀圖相關(guān)聯(lián)的信息，輸入特征量F后，在步驟Dl中，對F和TH2進行比較，判斷F是否大于TH2。如果F大于TH2 ，則在步驟D2中判斷為輸入圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)。如果F小于等于TH2,則在步驟D3中，對F和TH1進行比較，判斷F 是否小于TH1。如果F小于TH1，則在步驟D4中判斷為輸入圖像數(shù)據(jù) 是非文檔圖像數(shù)據(jù)。如果F大于等于TH1，即如果F為TH1和TH2 之間的值，則判斷為不能辨別。
由辨別部122進行的步驟A4中的輸出處理，向檢索部13輸出在步驟A3的辨別結(jié)果。
在檢索部13中，在檢索輸入圖像數(shù)據(jù)時，生成輸入圖像數(shù)據(jù)的檢索用的特征數(shù)據(jù)，并與登記圖像數(shù)據(jù)的特征數(shù)據(jù)進行比較。由于在文檔圖像數(shù)據(jù)的情況下和在非文檔圖像數(shù)據(jù)的情況下應(yīng)生成的輸入圖像數(shù) 據(jù)的特征數(shù)據(jù)的種類不同，所以，可以基于從圖像辨別部12輸入的辨別結(jié)果，來生成適當?shù)奶卣鲾?shù)據(jù)。
作為文檔圖像數(shù)據(jù)的特征數(shù)據(jù)，例如，可以使用對文檔圖像數(shù)據(jù)進行文字識別所得到的文本數(shù)據(jù)。作為非文檔圖像數(shù)據(jù)的特征數(shù)據(jù)，例如，如果非文檔圖像數(shù)據(jù)是灰度圖像，則可以使用利用柱狀圖生成處理而得到的亮度柱狀圖，如果非文檔圖像數(shù)據(jù)是彩色圖像，則可以使用利用與 RGB的各顏色成分對應(yīng)的柱狀圖生成處理所得到的亮度柱狀圖。
將針對輸入圖像數(shù)據(jù)生成的特征數(shù)據(jù)、和預(yù)先生成的針對登記圖像數(shù)據(jù)的特征數(shù)據(jù)進行比較，求出兩個特征數(shù)據(jù)的類似度，并選擇類似度最高的登記圖像數(shù)據(jù)作為檢索結(jié)果。
作為檢索結(jié)果，不僅可以是類似度最高的登記圖像數(shù)據(jù)，也可以從類似度高的順序選擇規(guī)定數(shù)的登記圖像數(shù)據(jù)來作為檢索結(jié)果。
在由檢索部13輸出檢索結(jié)果后，顯示部14對作為檢索結(jié)果而選擇的登記圖像數(shù)據(jù)進行可視化的圖像進行顯示。
關(guān)于登記圖像數(shù)據(jù)，優(yōu)選為在登記時實施如上述的圖像辨別處理，并與表示是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)的類別信息建立關(guān)聯(lián)，并存儲到登記圖像存儲部15中。
如果預(yù)先與類別信息建立關(guān)聯(lián)，則對輸入圖像數(shù)據(jù)進行辨別的結(jié)果是，只要將與輸入圖像數(shù)據(jù)相同類別的登記圖像數(shù)據(jù)作為檢索對象即可，因此，可以不進行與全部登記圖像數(shù)據(jù)的比較，從而可以縮短檢索處理所需要的時間。
根據(jù)本發(fā)明，可以得到以下效果。
通過進行連通區(qū)域的挑選，預(yù)先去除不需要的要素，可以減少統(tǒng)計處理中的運算量，可以縮短辨別處理、檢索處理中所需要的時間。此外，通過預(yù)先去除成為誤辨別的原因的連通區(qū)域，可以提高辨別精度。
本發(fā)明，在不脫離其宗旨和主要特征的情況下，可以通過各種方式來實施。因此，上述實施方式只不過是在所有點上的單純例示，本發(fā)明的范圍表示在權(quán)利要求書中，而不受說明書正文的任何約束。并且，屬于權(quán)利要求書的變形和變更也全部為本發(fā)明范圍內(nèi)的技術(shù)。
權(quán)利要求
1.一種圖像辨別裝置，對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別，其特征在于，具有2值化處理部，其對所輸入的圖像數(shù)據(jù)進行2值化，而轉(zhuǎn)換為2值圖像數(shù)據(jù)，并算出黑像素數(shù)在構(gòu)成圖像數(shù)據(jù)的全部像素數(shù)中的比例即整體黑像素比例；特征抽出部，其檢索上述2值圖像數(shù)據(jù)中所包含的、相同顏色的像素連結(jié)并集合而成的像素群即連通區(qū)域，并檢索出外接于該連通區(qū)域的外接矩形，生成以級別為外接矩形的大小、且以次數(shù)為連通區(qū)域數(shù)的柱狀圖；辨別部，其基于與所生成的柱狀圖相關(guān)聯(lián)的信息、和上述整體黑像素比例，對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別。
2. 根據(jù)權(quán)利要求l所述的圖像辨別裝置，其特征在于，上述特征抽出部，基于外接矩形的大小、和構(gòu)成連通區(qū)域的像素數(shù)在外接矩形內(nèi)的全部像素數(shù)中的比例即矩形黑像素比例，從全部連通區(qū) 域中去除外接矩形的大小小于規(guī)定大小的連通區(qū)域，進而去除上述矩形黑像素比例在規(guī)定范圍之外的連通區(qū)域，使用剩余的連通區(qū)域來生成柱狀圖。
3. 根據(jù)權(quán)利要求l所述的圖像辨別裝置，其特征在于，上述辨別部，在設(shè)外接矩形的大小最小的級別的連通區(qū)域數(shù)為rl、設(shè)上述連通區(qū)域數(shù)rl在全部連通區(qū)域數(shù)中的比例為r2、設(shè)上述整體黑像素比例為r0時，以F-rlxr2/rO來算出辨別特征量F，并基于辨別特征量F來辨別所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù) 據(jù)。
4. 一種圖像檢索裝置，從預(yù)先登記的圖像數(shù)據(jù)中檢索類似于所輸入的圖像數(shù)據(jù)的圖像數(shù)據(jù)，其特征在于，具有權(quán)利要求1所述的圖像辨別裝置；特征數(shù)據(jù)生成部，其基于上述圖像辨別裝置的辨別結(jié)果，如果所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)，則生成文檔圖像數(shù)據(jù)用的特征數(shù)據(jù)，如果是非文檔圖像數(shù)據(jù)，則生成非文檔圖像數(shù)據(jù)用的特征數(shù)據(jù)；檢索部，其基于預(yù)先登記的圖像數(shù)據(jù)的特征數(shù)據(jù)、和在上述特征數(shù) 據(jù)生成部生成的特征數(shù)據(jù)，從預(yù)先登記的圖像數(shù)據(jù)中檢索類似于所輸入顯示部，其基于檢索部的檢索結(jié)果，對預(yù)先登記的圖像數(shù)據(jù)中類似于所輸入的圖像數(shù)據(jù)的圖像數(shù)據(jù)進行顯示。
5.根據(jù)權(quán)利要求4所述的圖像檢索裝置，其特征在于，將預(yù)先登記的圖像數(shù)據(jù)，分類為文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù)來進行登記；上述檢索部，基于上述圖像辨別裝置的辨別結(jié)果，如果所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)，則以作為文檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對象，如果所輸入的圖像數(shù)據(jù)是非文檔圖像數(shù)據(jù)，則以作為非文檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對象.
全文摘要
本發(fā)明提供一種圖像辨別裝置及圖像檢索裝置。預(yù)處理部(120)對所輸入的圖像數(shù)據(jù)進行2值化，算出整體黑像素比例。在特征抽出部(121)中，檢索2值圖像數(shù)據(jù)中所包含的連通區(qū)域，并檢索外接于該連通區(qū)域的外接矩形。對于所檢測到的外接矩形，基于外接矩形的大小和矩形黑像素比例，從全部的連通區(qū)域中去除規(guī)定的連通區(qū)域。使用去除了不需要的結(jié)合像素之后的剩余的連通區(qū)域，來生成以外接矩形的大小為級別、以連通區(qū)域數(shù)為次數(shù)的柱狀圖。辨別部(122)，基于與所生成的柱狀圖相關(guān)聯(lián)的信息、和上述整體黑像素比例，來辨別所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)。
文檔編號G06F17/30GK101551859SQ20081009040
公開日2009年10月7日申請日期2008年3月31日優(yōu)先權(quán)日2008年3月31日
發(fā)明者寧樂, 波吳, 吳亞棟, 李季檁, 范志剛申請人:夏普株式會社

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李季檁;范志剛;吳亞棟;吳波;樂寧
技術(shù)所有人：夏普株式會社
我是此專利的發(fā)明人

上一篇：可變形對象識別系統(tǒng)和方法
上一篇：保護閃存儲存裝置存取的系統(tǒng)及其方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

圖像檢索相關(guān)技術(shù)

圖像檢索技術(shù)相關(guān)技術(shù)

基于內(nèi)容的圖像檢索相關(guān)技術(shù)

基于文本的圖像檢索相關(guān)技術(shù)

圖像檢索算法相關(guān)技術(shù)

原寸圖像檢索相關(guān)技術(shù)

圖像檢索系統(tǒng)相關(guān)技術(shù)

基于語義的圖像檢索相關(guān)技術(shù)

基于內(nèi)容圖像檢索技術(shù)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

圖像辨別裝置及圖像檢索裝置的制作方法