亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

圖像辨別裝置及圖像檢索裝置的制作方法

文檔序號:6462108閱讀:145來源:國知局
專利名稱:圖像辨別裝置及圖像檢索裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像 數(shù)據(jù)進行辨別的圖像辨別裝置及具有該裝置的圖4象檢索裝置。
背景技術(shù)
在復(fù)印機、傳真裝置、打印機及兼有多個上述功能的復(fù)合機等的圖
像形成裝置中,有具備如下功能的裝置,即將所輸入的原稿圖像等的 圖像數(shù)據(jù)存儲在大容量的存儲裝置中,且只要是曾經(jīng)輸入并登記過的圖 像數(shù)據(jù),則隨時能夠?qū)⑵渥x出并再次輸出的功能。
可再次輸出的功能雖然便利,但如果登記的數(shù)據(jù)量增多,則搜索欲 再次輸出的數(shù)據(jù)的操作會變得較困難,因此,從多個圖像數(shù)據(jù)之中檢索 所需的圖像數(shù)據(jù)的圖像檢索技術(shù)變得尤為重要。
在檢索圖像數(shù)據(jù)時,需要對已登記的圖像數(shù)據(jù)和所輸入的圖像數(shù)據(jù) 進行比較,并算出相似性,但是已登記的圖像數(shù)據(jù)中,文檔圖像數(shù)據(jù)和 非文檔圖像數(shù)據(jù)(照片、圖形、圖解等)混在一起。
在以往的技術(shù)中,例如,在中國專利第200510005334.9號i兌明書中 所記載的圖^M^r索裝置中,對文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù)這兩種圖 像數(shù)據(jù)使用相同的算法來算出特征量,而沒有如對文檔圖像數(shù)據(jù)和非文 檔圖像數(shù)據(jù)進行辨別的處理步驟。
另一方面,作為辨別圖像數(shù)據(jù)中所應(yīng)用的技術(shù),有區(qū)域分離技術(shù). 區(qū)域分離技術(shù)是為實施下述處理而預(yù)先進行的處理步驟,即例如,將 一個圖像數(shù)據(jù)分離為文字區(qū)域、照片區(qū)域、點狀區(qū)域、基底區(qū)域等多個 區(qū)域,并針對每個區(qū)域?qū)嵤┻m當?shù)奶幚?過濾處理、中間色調(diào)處理)。
這種區(qū)域分離技術(shù),公開在美國專利第5465304號說明書、美國專 利第7085420號說明書、中國專利第200510063768.4號說明書等中。
此外,日本專利特開平4-309191號公報記載的區(qū)域?qū)傩宰R別裝置,檢測黑條和黑條的連結(jié)部位,完成連結(jié)后就檢測出黑像素群的外接矩 形。制作以該外接矩形的高度或?qū)挾葹榇螖?shù)的柱狀圖,并當微小矩形的 出現(xiàn)次數(shù)在閾值以上時看作照片區(qū)域,在偏差比柱狀圖的標準偏差小時 看作文字區(qū)域,而當偏差比柱狀圖的標準偏差大時看作圖形區(qū)域。
在以往的技術(shù)中,因為對文檔圖像數(shù)據(jù)和非文檔圖《象數(shù)據(jù)這兩種圖 像數(shù)據(jù)使用相同的算法來算出特征量,所以不能充分提高檢索精度。需 要將檢索時所輸入的數(shù)據(jù)和全部的登記圖像數(shù)據(jù)進行比較,因此,登記 圖像數(shù)據(jù)越多檢索處理所花費的時間就多。
此外,關(guān)于文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù)的任意一個進行辨別的 辨別精度,利用以往技術(shù)是得不到充分的精度的。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種可提高辨別精度的圖像辨別裝置,另一目 的是提供可縮短檢索處理所需要的時間,且可提高檢索精度的圖像檢索 裝置。
本發(fā)明為 一種圖像辨別裝置,其對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)
據(jù)還是非文檔圖像數(shù)據(jù)進行辨別,其特征在于,具有
2值化處理部,其對所輸入的圖像數(shù)據(jù)進行2值化,而轉(zhuǎn)換成2值 圖像數(shù)據(jù),并算出黑像素數(shù)在構(gòu)成圖像數(shù)據(jù)的全部像素數(shù)中的比例即整 體黑像素比例;
特征抽出部,其檢測上述2值圖像數(shù)據(jù)中所包含的、相同顏色的像 素連結(jié)并集合而成的像素群即連通區(qū)域,并檢測出外接于該連通區(qū)域的 外接矩形,生成以級別為外接矩形的大小,且以次數(shù)為連通區(qū)域數(shù)的柱 狀圖像辨別部,其基于與所生成的柱狀圖相關(guān)聯(lián)的信息、和上述整體 黑像素比例,對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù) 進行辨別。
根據(jù)本發(fā)明,首先利用2值化處理部,對所輸入的圖像數(shù)據(jù)進行2 值化,并算出整體黑像素比例。在特征抽出部中,檢索出上述2值圖像數(shù)據(jù)中所包含的、相同顏色 的像素連結(jié)并集合而成的像素群即連通區(qū)域,并檢測出外接于該連通區(qū) 域的外接矩形,生成以級別為外接矩形的大小、且以次數(shù)為連通區(qū)域數(shù) 的柱狀圖。
圖像辨別部基于與所生成的柱狀圖相關(guān)聯(lián)的信息、和上述整體黑像 素比例,對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行 辨別。
通過基于與柱狀圖相關(guān)聯(lián)的信息、和上述整體黑像素比例,可以縮 短辨別處理所需要的時間,并可以提高辨別精度。
此外,本發(fā)明的特征還在于,上述特征抽出部,基于外接矩形的大 小、和構(gòu)成連通區(qū)域的像素數(shù)在外接矩形內(nèi)的全部^^素中的比例,即矩 形黑像素比例,從全部連通區(qū)域中去除外接矩形的大小比規(guī)定的大小小 的連通區(qū)域,進而去除上述矩形黑像素比例在規(guī)定范圍之外的連通區(qū) 域,使用剩余的連通區(qū)域來生成柱狀圖。
根據(jù)本發(fā)明,上述特征抽出部,作為第1階段,去除外接矩形的大 小比規(guī)定大小小的連通區(qū)域,作為第2階段,去除上述矩形黑像素比例 在規(guī)定范圍以外的連通區(qū)域。使用去除這種不需要的連通區(qū)域之后剩余 的連通區(qū)域來制作柱狀圖。
當外接矩形的大小極端小的情況下,4艮多為點或線條,并且在辨別 是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)時,對辨別精度的影響小,因此, 通過預(yù)先去除這些連通區(qū)域,可以抑制生成柱狀圖時的運算量。
矩形黑像素比例極端大的情況,例如為油墨污點,若不能預(yù)先去除 單純的污點等時,則如果污點部分類似于文字的外接矩形,則盡管不是 文字卻傾向于辨別為文檔圖像數(shù)據(jù),如果污點部分類似于圖形的外接矩 形,則盡管不是圖像卻傾向于辨別為非文檔圖像數(shù)據(jù),結(jié)果就引起誤辨 別,從而成為降低辨別精度的原因。
通過這樣地去除連通區(qū)域,可以抑制柱狀圖處理中的運算量,并且 可以提高辨別精度。
此外,本發(fā)明中,上述圖像辨別部,當設(shè)外接矩形的大小最小的等級的連通區(qū)域數(shù)為rl、設(shè)上述結(jié)合像素數(shù)rl在全部結(jié)合像素數(shù)中的比 例為r2、設(shè)上述整體黑《象素比例為r0時,以F=rl xr2/r0的方式求出 辨別特征量F,并基于辨別特征量F來辨別所輸入的圖像數(shù)據(jù)是文檔圖 像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)。
根據(jù)本發(fā)明,在文檔圖像數(shù)據(jù)的柱狀圖中,在外接矩形的大小最小 級別的連通區(qū)域數(shù)上出現(xiàn)顯著的峰值,因此,rl和r2比較大,整體的 黑像素少,所以r0小。從而,F(xiàn)有可能傾向于大值。相反,在非文檔 圖像數(shù)據(jù)的柱狀圖中,各級別的的連通區(qū)域數(shù)平坦,未出現(xiàn)顯著的峰值, 所以,rl和r2比較小,整體的黑像素多,因此r0大。從而,F(xiàn)有可能 傾向于小值。
通過使用辨別特征量F來進行辨別,可以進一步提高辨別精度。 此外,本發(fā)明為一種從預(yù)先登記的圖4象數(shù)據(jù)中檢索類似于所輸入的
技術(shù)方案1所記栽的圖像辨別裝置;
特征數(shù)據(jù)生成部,其基于上述圖像辨別裝置的辨別結(jié)果,如果所輸 入的圖像數(shù)據(jù)為文檔圖像數(shù)據(jù),則生成文檔圖像數(shù)據(jù)用的特征數(shù)據(jù),如 果是非文檔圖像數(shù)據(jù),則生成非文檔圖像數(shù)據(jù)用的特征數(shù)據(jù);
檢索部,其基于預(yù)先登記的圖像數(shù)據(jù)的特征數(shù)據(jù)、和利用上述特征 數(shù)據(jù)生成部生成的特征數(shù)據(jù),從預(yù)先登記的圖像數(shù)據(jù)中檢索類似于所輸 入的圖像數(shù)據(jù)的圖像數(shù)據(jù);
顯示部,其基于檢索部的檢索結(jié)果,對預(yù)先登記的圖像數(shù)據(jù)之中的、 類似于所輸入的圖像數(shù)據(jù)的圖像數(shù)據(jù)進行顯示。
根據(jù)本發(fā)明,特征數(shù)據(jù)生成部,基于上述圖像辨別裝置的辨別結(jié)果, 如果所輸入的圖像數(shù)據(jù)為文檔圖像數(shù)據(jù),則生成文檔圖4象數(shù)據(jù)用的特征 數(shù)據(jù),如果是非文檔圖像數(shù)據(jù),則生成非文檔圖像數(shù)據(jù)用的特征數(shù)據(jù)。 在檢索部,基于預(yù)先登記的圖像數(shù)據(jù)的特征數(shù)據(jù)、和利用上述特征數(shù)據(jù) 生成部生成的特征數(shù)據(jù),檢索到類似于所輸入的圖像數(shù)據(jù)的圖像數(shù)據(jù) 后,顯示部對預(yù)先登記的圖像數(shù)據(jù)之中的、類似于所輸入的圖像數(shù)據(jù)的 圖像數(shù)據(jù)進行顯示。通過在檢索處理之前辨別所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是 非文檔圖像數(shù)據(jù),可以算出最佳的特征量,并可以提高檢索精度。
此外,本發(fā)明的特征為,
將預(yù)先登記的圖像數(shù)據(jù)分類為文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù),并
進行登記;
上述檢索部,基于上述圖像辨別裝置的辨別結(jié)果,如果所輸入的圖 像數(shù)據(jù)是文檔圖像數(shù)據(jù),則以作為文檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢 索對象,如果所輸入的圖像數(shù)據(jù)為非文檔圖像數(shù)據(jù),則以作為非文檔圖 像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對象。
根據(jù)本發(fā)明,如果所輸入的圖像數(shù)據(jù)為文檔圖像數(shù)據(jù),則以作為文 檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對象,如果所輸入的圖像數(shù)據(jù)為非 文檔圖像數(shù)據(jù),則以作為非文檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對 象。
由此,在檢索部中可以對作為比較特征量的對象的圖像數(shù)據(jù)數(shù)進行 限定,所以可以縮短檢索處理所需要的時間。
本發(fā)明的目的、特點、以及優(yōu)點,通過下述的詳細說明和附圖而變 得更加明確。


圖1是表示圖像檢索裝置10的機械性構(gòu)成的框圖. 圖2是表示圖像檢索裝置10的功能性構(gòu)成的框圖。 圖3是表示辨別部12的功能性構(gòu)成的框圖。 圖4是表示由圖像辨別部12進行的辨別處理的流程圖。 圖5是表示由預(yù)處理部120進行的預(yù)處理的流程圖。 圖6是表示特征抽出部121的特征抽出處理的流程圖。 圖7是將柱狀圖可視化了的曲線圖。圖8是表示由辨別部122進行的辨別處理的流程圖。
具體實施例方式
以下,參照附圖對本發(fā)明的優(yōu)選實施方式詳細地進行"^兌明。
圖1是表示圖像檢索裝置10的機械性構(gòu)成的框圖。圖4象檢索裝置 IO包括處理器4;存儲處理器4進行實際處理用的軟件等的外部存儲 裝置5。
處理器4進行辨別處理,即,對所輸入的圖像數(shù)據(jù)(以下稱作"輸 入圖像數(shù)據(jù)")是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別,并進一 步基于該辨別結(jié)果對輸入圖像數(shù)據(jù)和預(yù)先登記的多個圖像數(shù)據(jù)(以下稱 作"登記圖像數(shù)據(jù)")進行對照,從而實際進行檢索并顯示類似于輸入 圖像數(shù)據(jù)的登記圖像數(shù)據(jù)的圖像檢索處理等。處理器4中的實際處理, 利用存儲于外部存儲裝置5中的軟件來執(zhí)行。處理器4,例如,利用通 常的計算機主機等來構(gòu)成。
外部存儲裝置5,例如可以利用可進行高速處理的硬件等構(gòu)成。外 部存儲裝置5,也可以是為大量保存登記圖像數(shù)據(jù)而使用光盤等大容量 器件的構(gòu)成。此外,在辨別處理中和檢索處理中,在各處理步驟階段中 生成的臨時數(shù)據(jù)等,可以存儲在外部存儲裝置5中,也可以存儲于內(nèi)置 于處理器4中的半導(dǎo)體存儲器中。
在文檔處理裝置10上連接有鍵盤1,并且還連接有顯示裝置3。鍵 盤1用于輸入執(zhí)行各種軟件用的指示等。
顯示裝置3進行基于輸入圖像數(shù)據(jù)和登記圖像數(shù)據(jù)的圖像顯示和檢 索結(jié)果的顯示等。
圖像檢索裝置10上還連接有圖像掃描儀2。圖像掃描儀2用于讀取 打印有圖像的原稿,并讀入輸入圖像數(shù)據(jù)。
輸入圖像數(shù)據(jù)的取得,除來自圖像掃描儀2的輸入之外,還可以經(jīng) 由通信I/F(接口 )6,通過數(shù)據(jù)通信從網(wǎng)絡(luò)上的其它裝置取得。通信I/F6, 可以利用連接于LAN ( Local Area Network)用的LAN卡、和連接于 公共交換電話網(wǎng)以進行數(shù)據(jù)通信用的調(diào)制解調(diào)器卡等來實現(xiàn)。圖2是表示圖像檢索裝置10的功能性構(gòu)成的框圖。
圖像檢索裝置10的構(gòu)成包括輸入部ll、圖像辨別部12、檢索部 13、顯示部14以及登記圖4象存儲部15。
輸入部11輸入輸入圖像數(shù)據(jù)、登記圖像數(shù)據(jù)。在圖1所示的硬件構(gòu) 成中,圖像掃描儀2、通信I/F6等在功能上相當于輸入部11。登記圖像 數(shù)據(jù)是在輸入輸入圖像數(shù)據(jù)之前預(yù)先輸入的圖像數(shù)據(jù),存儲在登記圖像 存儲部17中。
圖3是表示辨別部12的功能性構(gòu)成的框圖。
圖像辨別部12的構(gòu)成包括預(yù)處理部120、特征抽出部121、辨別 部122。
圖像辨別部12,對利用輸入部11而輸入的圖像數(shù)據(jù)是文檔圖像數(shù) 據(jù)還是非文檔圖像數(shù)據(jù)進行辨別,并向后續(xù)的檢索部13輸出其辨別結(jié) 果。在檢索部13中,根據(jù)輸入圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖 像數(shù)據(jù),來變更檢索處理所需的特征量,并算出適于圖像數(shù)據(jù)的特征量。
圖4是表示由圖像辨別部12進行的辨別處理的流程圖。在步驟Al 中,預(yù)處理部120,作為對所輸入的圖4象數(shù)據(jù)的預(yù)處理而實施2值化處 理。在步驟A2中,特征抽出部121,基于2值化后的圖像數(shù)據(jù),進行 結(jié)合像素的外接矩形的檢索以及外接矩形的統(tǒng)計處理(生成柱狀圖)。 在步驟A3中,辨別部122,基于統(tǒng)計處理結(jié)果,對輸入圖像數(shù)據(jù)是文 檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別,并在步驟A4中,向檢索部 13輸出辨別結(jié)果。
以下,對各步驟詳細說明。
由預(yù)處理部120進行的步驟Al的預(yù)處理,例如示于圖5的流程圖。
輸入圖像數(shù)據(jù)后,在步驟B1中,判斷所輸入的圖像數(shù)據(jù)是否是彩 色圖像數(shù)據(jù)。如果是彩色圖像數(shù)據(jù),則進入步驟B2,進行基于明度成 分的灰度化,而轉(zhuǎn)換成灰度圖像數(shù)據(jù)。如果不是彩色圖像,則進入步驟 B3,判斷是否是灰度圖像數(shù)據(jù)。如果是灰度圖像數(shù)據(jù)則進入步驟B4, 并使用預(yù)先確定的閾值來進行2值化,而將灰度圖像數(shù)據(jù)轉(zhuǎn)換成2值圖 像數(shù)據(jù)。如果不是灰度圖像數(shù)據(jù),則即是2值圖像數(shù)據(jù),所以結(jié)束處理。2值圖像數(shù)據(jù),是將構(gòu)成圖像數(shù)據(jù)的各像素的像素值設(shè)為0或l(白 像素或黑像素)的任意一個、即所謂灰度圖像數(shù)據(jù),就是對灰度圖像數(shù) 據(jù)的各像素的灰度(濃度)進行閾值處理,而將全部像素分類為黑像素 和白像素。
此外,在步驟B4中,算出黑像素在構(gòu)成作為辨別對象的圖像數(shù)據(jù) 的全部像素數(shù)中的比例,即算出整體黑像素比例。
由特征抽出部121進行的步驟A2的特征抽出處理,例如示于圖6 的流程圖。
在輸入由預(yù)處理部120進行2值化處理后的2值圖像數(shù)據(jù)后,在步 驟C1中,檢測出2值圖像數(shù)據(jù)中的全部連通區(qū)域。
所謂連通區(qū)域是指將連結(jié)的相同顏色的像素集合起來的像素群。檢 測黑像素的連通區(qū)域還是檢測白像素的連通區(qū)域,取決于所輸入的圖像 數(shù)據(jù)n的基底是黑像素還是白像素。 一般情況下基底為白像素較多,并 用黑像素來描繪文字圖像或圖形圖像,因此,在本實施方式中,對檢測 黑像素的連通區(qū)域的情況進行說明。當基底為黑像素的情況下,利用白 像素來描繪文字圖像和圖形圖像,即為空白文字或空白圖形,在此情況 下,檢測白像素的連通區(qū)域。
并且,可以利用公知的基底辨別處理來辨別基底是黑像素還是白像 素,例如,當上述的整體黑像素比例小于規(guī)定比例時,辨別為基底是白 像素,當比規(guī)定比例大時,辨別為基底是黑像素。
連通區(qū)域的檢測,可以利用公知的檢測方法來進行檢測。例如,對 于1行而言,檢測在該行中相互鄰接的黑像素的連續(xù)部分(黑條),并 按每一行存儲黑條的掃描寬度和黑條兩端的黑像素的坐標。坐標,例如, 預(yù)先將平行于行的方向設(shè)為x軸,將正交于行的方向設(shè)為y軸。
對在y方向上隔著一個關(guān)注行的上下行的黑條而言,如果其兩端的 黑像素的x坐標在關(guān)注行的各黑條兩端的黑像素坐標的x坐標范圍內(nèi), 則可以將關(guān)注行的該黑條、與以x坐標在范圍內(nèi)的黑像素為端部像素的 黑條,看作在y方向上連結(jié)。
這樣一來, 一邊依次挪動關(guān)注行, 一邊對所有圖像數(shù)據(jù)檢測x方向的連結(jié)部分和y方向的連結(jié)部分,從而檢測出黑像素的連通區(qū)域。
在檢測出黑像素的連通區(qū)域后,生成外接于所檢測出的全部連通區(qū) 域的外接矩形。外接矩形是由平行于x方向的邊和平行于y方向的邊構(gòu) 成的矩形,且設(shè)x方向的邊長為矩形寬度,設(shè)y方向的邊長為矩形高度。
外接矩形的生成,可以利用公知的生成方法來生成。例如,在檢測 出連通區(qū)域時,因為已經(jīng)檢測出各黑條兩端的黑像素的坐標,所以,以 全部黑條為對象,抽出x坐標的最小值和最大值,并將最大值和最小值 的差值作為矩形的寬度(像素數(shù))來算出。此外,以構(gòu)成連通區(qū)域的全 部黑條為對象,抽出y坐標的最小值和最大值,并將最大值和最小值的 差值作為矩形的高度(像素數(shù))來算出。
在本發(fā)明中,進一步對全部結(jié)合像素,算出在外接矩形內(nèi)的像素中 黑像素所占的比例,亦即算出矩形黑像素比例。如上所述,由于算出作 為外接矩形的尺寸信息的矩形的寬度和矩形的高度,所以,使用這些信 息來算出外接矩形內(nèi)的全部像素數(shù),并根據(jù)構(gòu)成連通區(qū)域的全部黑條的 掃描寬度的總和來算出黑像素數(shù)。
因此,可以利用(構(gòu)成連通區(qū)域的黑像素數(shù))/ (外接矩形內(nèi)的全部 像素數(shù))的計算式來算出矩形黑像素比例。
如以上所述,在步驟C1中,與各連通區(qū)域相關(guān)聯(lián)地在規(guī)定存儲區(qū) 域中,存儲相對于2值圖〗象數(shù)據(jù)中的全部的連通區(qū)域而言,構(gòu)成連通區(qū) 域的黑像素的位置(坐標)、外接矩形的位置(坐標)、外接矩形的矩形 寬度、矩形高度以及矩形黑像素比例。
接下來,在步驟C2中,在進行統(tǒng)計處理之前進行連通區(qū)域的挑選。 這里的挑選,以去除統(tǒng)計處理中不使用的連通區(qū)域為目的。步驟C2中 的挑選,即連通區(qū)域的去除經(jīng)兩個階段進行。
第1階段的挑選為基于外接矩形的尺寸的挑選。
對外接矩形的矩形寬度和矩形高度預(yù)先設(shè)定閾值(例如,0.4),對 閾值和矩形寬度及矩形高度進行比較,當矩形寬度及矩形高度的任意一 個小于閾值的情況下,去除該外接矩形的連通區(qū)域。
矩形寬度或矩形高度極端小的情況下,很多為點或線條,在辨別是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)時,對辨別精度的影響小,因此,通 過去除該連通區(qū)域,可以抑制統(tǒng)計處理中的運算量。
第2階段的挑選為基于矩形黑像素比例的挑選。
針對矩形黑像素比例預(yù)先設(shè)定規(guī)定范圍(例如0.05 ~ 0.8),對規(guī)定 范圍和矩形黑像素比例進行比較,在矩形黑像素比例在規(guī)定范圍以外的 情況下,去除該外接矩形的連通區(qū)域。
矩形黑像素比例極端小的情況,例如為斜線的線條等,對辨別精度 的影響小,所以,通過去除該連通區(qū)域,可以抑制后續(xù)的統(tǒng)計處理中的 運算量。
矩形黑像素比例極端大的情況,例如為油墨污點,若不能預(yù)先去除 單純的污點等,則如果污點部分類似于文字的外接矩形,則盡管不是文 字卻傾向于辨別為文檔圖像數(shù)據(jù),如果污點部分類似于圖形的外接矩 形,則盡管不是圖形卻傾向于辨別為非文檔圖像,其結(jié)果是引起誤辨別, 從而成為降低辨別精度的原因。
通過基于矩形黑像素比例來進行挑選,可以抑制后續(xù)的統(tǒng)計處理的 運算量,并且能提高辨別精度。
如以上所述,在步驟C2中,進行2階段的挑選,在統(tǒng)計處理之前 預(yù)先刪除不需要的連通區(qū)域,在統(tǒng)計處理中僅使用挑選后剩余的連通區(qū) 域。
在步驟C3中,使用挑選后的連通區(qū)域進行統(tǒng)計處理。
統(tǒng)計處理具體地講是柱狀圖的生成。全部的連通區(qū)域,因為具有矩 形寬度和矩形高度的尺寸信息,所以,使用這些尺寸信息來生成柱狀圖。
在這里生成的柱狀圖,是以外接矩形的尺寸(矩形寬度或矩形高度) 為級別、并以級別所包含的連通區(qū)域數(shù)為次數(shù)而生成的。
生成的柱狀圖的級別,由圖像數(shù)據(jù)整體的寬度W或高度H來決定。 設(shè)級別數(shù)為N時,矩形寬度比1 x W/N小的連通區(qū)域,以第1級別所包 含的連通區(qū)域為次數(shù)進行計數(shù)。從而,矩形寬度為kxW/N (k+l) xW/N的范圍內(nèi)包含的連通區(qū)域,以第k級別中所包含的連通區(qū)域為次數(shù)進行計數(shù)。
若將所制作的柱狀圖可視化為曲線圖,則例如,如圖7所示橫軸為 尺寸,縱軸為連通區(qū)域數(shù)的次數(shù)分布曲線圖。
圖7 (a)表示文檔圖像數(shù)據(jù)的柱狀圖的例子,圖7 (b)表示非文 檔圖像數(shù)據(jù)的柱狀圖的例子。當連通區(qū)域是文字的情況下,外接矩形近 似于正方形,且包含多個相同尺寸的連通區(qū)域,因此,作為柱狀圖,特 征在于,主要在小尺寸級別的連通區(qū)域數(shù)上出現(xiàn)顯著的峰值。此外,當 連通區(qū)域是非文字的情況下,連通區(qū)域為點狀、線狀、塊兒狀等,形狀 沒有規(guī)則性,大小也比較零散。因此,作為柱狀圖,特征在于,各級別 的連通區(qū)域數(shù)平坦,未出現(xiàn)顯著的峰值。
并且,在本發(fā)明中,即使不對柱狀圖進行曲線化并顯示,也可以完 成后續(xù)的處理,不過,也可以構(gòu)成為利用顯示部14來顯示進行曲線化 后的柱狀圖。
辨別部122可以基于如上述的柱狀圖的特征,來辨別輸入圖像數(shù)據(jù) 是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)。
作為與從特征抽出部121向辨別部122輸出的柱狀圖相關(guān)聯(lián)的倌 息,例如,有整體黑像素比例r0、第1級別連通區(qū)域數(shù)rl,第1級別 的連通區(qū)域數(shù)相對于全部連通區(qū)域數(shù)的比例r2、以及辨別處理中所使用 的特征量(辨別特征量)F。辨別特征量F利用F = rl x r2/r0來算出。
根據(jù)柱狀圖的特征,文檔圖像數(shù)據(jù),由于在第l級別連通區(qū)域數(shù)上 出現(xiàn)顯著的峰值,所以rl和r2較大,整體的黑像素少,因此r0小。 從而,F(xiàn)有可能為大值。
相反,非文檔圖像數(shù)據(jù),由于各級別的連通區(qū)域數(shù)平坦,未出現(xiàn)顯 著的峰值,所以rl和r2較小,整體的黑像素多,因此r0大。從而,F(xiàn) 有可能為小值。
由辨別部122進行的步驟A3中的辨別處理,例如,示于圖8的流 程圖。在辨別處理中,對辨別特征量F和兩個閾值TH1及TH2( > TH1) 進行比較,并進行閾值處理。
作為與利用特征抽出部121所生成的柱狀圖相關(guān)聯(lián)的信息,輸入特征量F后,在步驟Dl中,對F和TH2進行比較,判斷F是否大于TH2。 如果F大于TH2 ,則在步驟D2中判斷為輸入圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)。 如果F小于等于TH2,則在步驟D3中,對F和TH1進行比較,判斷F 是否小于TH1。如果F小于TH1,則在步驟D4中判斷為輸入圖像數(shù)據(jù) 是非文檔圖像數(shù)據(jù)。如果F大于等于TH1,即如果F為TH1和TH2 之間的值,則判斷為不能辨別。
由辨別部122進行的步驟A4中的輸出處理,向檢索部13輸出在步 驟A3的辨別結(jié)果。
在檢索部13中,在檢索輸入圖像數(shù)據(jù)時,生成輸入圖像數(shù)據(jù)的檢 索用的特征數(shù)據(jù),并與登記圖像數(shù)據(jù)的特征數(shù)據(jù)進行比較。由于在文檔 圖像數(shù)據(jù)的情況下和在非文檔圖像數(shù)據(jù)的情況下應(yīng)生成的輸入圖像數(shù) 據(jù)的特征數(shù)據(jù)的種類不同,所以,可以基于從圖像辨別部12輸入的辨 別結(jié)果,來生成適當?shù)奶卣鲾?shù)據(jù)。
作為文檔圖像數(shù)據(jù)的特征數(shù)據(jù),例如,可以使用對文檔圖像數(shù)據(jù)進 行文字識別所得到的文本數(shù)據(jù)。作為非文檔圖像數(shù)據(jù)的特征數(shù)據(jù),例如, 如果非文檔圖像數(shù)據(jù)是灰度圖像,則可以使用利用柱狀圖生成處理而得 到的亮度柱狀圖,如果非文檔圖像數(shù)據(jù)是彩色圖像,則可以使用利用與 RGB的各顏色成分對應(yīng)的柱狀圖生成處理所得到的亮度柱狀圖。
將針對輸入圖像數(shù)據(jù)生成的特征數(shù)據(jù)、和預(yù)先生成的針對登記圖像 數(shù)據(jù)的特征數(shù)據(jù)進行比較,求出兩個特征數(shù)據(jù)的類似度,并選擇類似度 最高的登記圖像數(shù)據(jù)作為檢索結(jié)果。
作為檢索結(jié)果,不僅可以是類似度最高的登記圖像數(shù)據(jù),也可以從 類似度高的順序選擇規(guī)定數(shù)的登記圖像數(shù)據(jù)來作為檢索結(jié)果。
在由檢索部13輸出檢索結(jié)果后,顯示部14對作為檢索結(jié)果而選擇 的登記圖像數(shù)據(jù)進行可視化的圖像進行顯示。
關(guān)于登記圖像數(shù)據(jù),優(yōu)選為在登記時實施如上述的圖像辨別處理, 并與表示是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)的類別信息建立關(guān)聯(lián),并 存儲到登記圖像存儲部15中。
如果預(yù)先與類別信息建立關(guān)聯(lián),則對輸入圖像數(shù)據(jù)進行辨別的結(jié)果是,只要將與輸入圖像數(shù)據(jù)相同類別的登記圖像數(shù)據(jù)作為檢索對象即 可,因此,可以不進行與全部登記圖像數(shù)據(jù)的比較,從而可以縮短檢索 處理所需要的時間。
根據(jù)本發(fā)明,可以得到以下效果。
通過進行連通區(qū)域的挑選,預(yù)先去除不需要的要素,可以減少統(tǒng)計 處理中的運算量,可以縮短辨別處理、檢索處理中所需要的時間。此外, 通過預(yù)先去除成為誤辨別的原因的連通區(qū)域,可以提高辨別精度。
本發(fā)明,在不脫離其宗旨和主要特征的情況下,可以通過各種方式 來實施。因此,上述實施方式只不過是在所有點上的單純例示,本發(fā)明 的范圍表示在權(quán)利要求書中,而不受說明書正文的任何約束。并且,屬 于權(quán)利要求書的變形和變更也全部為本發(fā)明范圍內(nèi)的技術(shù)。
權(quán)利要求
1.一種圖像辨別裝置,對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別,其特征在于,具有2值化處理部,其對所輸入的圖像數(shù)據(jù)進行2值化,而轉(zhuǎn)換為2值圖像數(shù)據(jù),并算出黑像素數(shù)在構(gòu)成圖像數(shù)據(jù)的全部像素數(shù)中的比例即整體黑像素比例;特征抽出部,其檢索上述2值圖像數(shù)據(jù)中所包含的、相同顏色的像素連結(jié)并集合而成的像素群即連通區(qū)域,并檢索出外接于該連通區(qū)域的外接矩形,生成以級別為外接矩形的大小、且以次數(shù)為連通區(qū)域數(shù)的柱狀圖;辨別部,其基于與所生成的柱狀圖相關(guān)聯(lián)的信息、和上述整體黑像素比例,對所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)進行辨別。
2. 根據(jù)權(quán)利要求l所述的圖像辨別裝置,其特征在于, 上述特征抽出部,基于外接矩形的大小、和構(gòu)成連通區(qū)域的像素數(shù)在外接矩形內(nèi)的全部像素數(shù)中的比例即矩形黑像素比例,從全部連通區(qū) 域中去除外接矩形的大小小于規(guī)定大小的連通區(qū)域,進而去除上述矩形 黑像素比例在規(guī)定范圍之外的連通區(qū)域,使用剩余的連通區(qū)域來生成柱 狀圖。
3. 根據(jù)權(quán)利要求l所述的圖像辨別裝置,其特征在于, 上述辨別部,在設(shè)外接矩形的大小最小的級別的連通區(qū)域數(shù)為rl、設(shè)上述連通區(qū)域數(shù)rl在全部連通區(qū)域數(shù)中的比例為r2、設(shè)上述整體黑 像素比例為r0時,以F-rlxr2/rO來算出辨別特征量F,并基于辨別 特征量F來辨別所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù) 據(jù)。
4. 一種圖像檢索裝置,從預(yù)先登記的圖像數(shù)據(jù)中檢索類似于所輸 入的圖像數(shù)據(jù)的圖像數(shù)據(jù),其特征在于,具有權(quán)利要求1所述的圖像辨別裝置;特征數(shù)據(jù)生成部,其基于上述圖像辨別裝置的辨別結(jié)果,如果所輸 入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù),則生成文檔圖像數(shù)據(jù)用的特征數(shù)據(jù),如 果是非文檔圖像數(shù)據(jù),則生成非文檔圖像數(shù)據(jù)用的特征數(shù)據(jù);檢索部,其基于預(yù)先登記的圖像數(shù)據(jù)的特征數(shù)據(jù)、和在上述特征數(shù) 據(jù)生成部生成的特征數(shù)據(jù),從預(yù)先登記的圖像數(shù)據(jù)中檢索類似于所輸入顯示部,其基于檢索部的檢索結(jié)果,對預(yù)先登記的圖像數(shù)據(jù)中類似 于所輸入的圖像數(shù)據(jù)的圖像數(shù)據(jù)進行顯示。
5.根據(jù)權(quán)利要求4所述的圖像檢索裝置,其特征在于, 將預(yù)先登記的圖像數(shù)據(jù),分類為文檔圖像數(shù)據(jù)和非文檔圖像數(shù)據(jù)來 進行登記;上述檢索部,基于上述圖像辨別裝置的辨別結(jié)果,如果所輸入的圖 像數(shù)據(jù)是文檔圖像數(shù)據(jù),則以作為文檔圖像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢 索對象,如果所輸入的圖像數(shù)據(jù)是非文檔圖像數(shù)據(jù),則以作為非文檔圖 像數(shù)據(jù)而登記的圖像數(shù)據(jù)為檢索對象.
全文摘要
本發(fā)明提供一種圖像辨別裝置及圖像檢索裝置。預(yù)處理部(120)對所輸入的圖像數(shù)據(jù)進行2值化,算出整體黑像素比例。在特征抽出部(121)中,檢索2值圖像數(shù)據(jù)中所包含的連通區(qū)域,并檢索外接于該連通區(qū)域的外接矩形。對于所檢測到的外接矩形,基于外接矩形的大小和矩形黑像素比例,從全部的連通區(qū)域中去除規(guī)定的連通區(qū)域。使用去除了不需要的結(jié)合像素之后的剩余的連通區(qū)域,來生成以外接矩形的大小為級別、以連通區(qū)域數(shù)為次數(shù)的柱狀圖。辨別部(122),基于與所生成的柱狀圖相關(guān)聯(lián)的信息、和上述整體黑像素比例,來辨別所輸入的圖像數(shù)據(jù)是文檔圖像數(shù)據(jù)還是非文檔圖像數(shù)據(jù)。
文檔編號G06F17/30GK101551859SQ20081009040
公開日2009年10月7日 申請日期2008年3月31日 優(yōu)先權(quán)日2008年3月31日
發(fā)明者寧 樂, 波 吳, 吳亞棟, 李季檁, 范志剛 申請人:夏普株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1