專利名稱:圖像處理裝置及其控制方法、程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在復(fù)印機(jī)等的圖像輸入裝置中,可以從讀取的紙文檔檢索對應(yīng)的原始電子數(shù)據(jù),將原始電子數(shù)據(jù)活用于打印、分配、存儲、編輯等的圖像處理技術(shù)。
背景技術(shù):
近年來,正在進(jìn)行復(fù)印機(jī)的數(shù)字化和網(wǎng)絡(luò)化。打印功能也在多樣化,可以將包含在同一或多個文檔中的多個頁布局在1張打印紙上進(jìn)行打印。
例如,因?yàn)樵跁h等中用的很多的散發(fā)資料等是作為參照用的,所以在1張打印紙上,使1個文檔與2頁相當(dāng)、與4頁相當(dāng)?shù)?,將與N頁相當(dāng)?shù)奈臋n布局在1張打印紙上進(jìn)行打印的情形是很多的(以后,稱為N頁打印)。又,當(dāng)需要一次參照多個文檔的頁時,也存在結(jié)合打印的情形(以后,稱為結(jié)合打印)。進(jìn)一步,也存在著為了打印后能夠2折疊裝訂成冊,按照裝訂成冊時的順序打印頁號碼的情形(以后,稱為裝訂打印)。
又,以后,我們將與N頁相當(dāng)?shù)奈臋n布局在N頁打印、結(jié)合打印、裝訂打印等的1張打印紙上進(jìn)行打印的打印總稱為Nup打印。
另一方面,開始提出可以用掃描器讀取紙文檔,檢索該讀取的紙文檔圖像的原始電子數(shù)據(jù),從原始電子數(shù)據(jù)本身進(jìn)行打印,或分配給網(wǎng)絡(luò)內(nèi)所要的PC(個人計(jì)算機(jī))等的終端,保存在網(wǎng)絡(luò)內(nèi)的所要的存儲媒體中,或進(jìn)行編輯的系統(tǒng)。
作為用于實(shí)現(xiàn)它的方法,例如,在日本第3017851號專利中,通過以比特為單元比較掃描紙文檔得到的掃描電子數(shù)據(jù)和存儲媒體中的電子數(shù)據(jù),可以檢索掃描電子數(shù)據(jù)的原始電子數(shù)據(jù)。
又,例如,在日本特開2001-257862號專利公報中,當(dāng)將文檔制成電子數(shù)據(jù)時,將識別碼賦予該電子數(shù)據(jù),生成包含該識別碼的打印物。因此,另外,當(dāng)檢索并打印與打印物對應(yīng)的電子數(shù)據(jù)時,讀入該打印物,識別打印出來的識別碼,可以檢索和打印所要的電子數(shù)據(jù)。
但是,在上述文獻(xiàn)中,因?yàn)閷up打印的文檔沒有任何考慮,所以在使用Nup打印的環(huán)境中,發(fā)生下列那樣的問題。
例如,在日本第3017851號專利中,將通過掃描Nup打印的文檔得到的電子數(shù)據(jù)解釋成與1頁相當(dāng)。對此,因?yàn)樵茧娮訑?shù)據(jù)是將1頁作為單位的電子數(shù)據(jù)由存儲媒體進(jìn)行管理,所以即便與哪個電子數(shù)據(jù)比較也不能夠得到高的類似度。因此,不能夠檢索原始電子數(shù)據(jù)。
又,例如,在日本特開2001-257862號專利公報中,因?yàn)樽R別碼對于各個頁決定打印位置,所以當(dāng)進(jìn)行Nup打印時打印位置發(fā)生偏離,不能夠讀取各識別碼,所以還是不能夠檢索原始電子數(shù)據(jù)。
發(fā)明內(nèi)容
本發(fā)明就是鑒于上述課題提出的,本發(fā)明的目的是提供可以從經(jīng)過Nup打印的紙文檔,檢索并活用原始電子數(shù)據(jù)的圖像處理裝置及其控制方法、程序。
為了達(dá)到上述目的根據(jù)本發(fā)明的圖像處理裝置備有下列構(gòu)成。即,將多個電子數(shù)據(jù)作為比較目的圖像存儲起來的存儲部件;電子地讀取打印物,將該打印物的電子數(shù)據(jù)作為比較源圖像輸入的輸入部件;根據(jù)包含在上述比較源圖像中的頁圖像的數(shù)量,提取包含在上述比較源圖像中的頁圖像的處理對象區(qū)域的特征量的提取部件;和用由上述提取部件提取的特征量,從上述存儲部件檢索與上述比較源圖像對應(yīng)的比較目的圖像的檢索部件,又,最好,進(jìn)一步備有對作為上述檢索部件的檢索結(jié)果的圖像進(jìn)行處理的處理部件。
又,最好,進(jìn)一步備有指定包含在上述比較源圖像中的頁圖像的頁數(shù)的指定部件,上述提取部件,對于每個根據(jù)上述指定部件指定的頁數(shù)決定的處理對象區(qū)域,提取該處理對象區(qū)域的特征量。
又,最好,上述提取部件提取上述處理對象區(qū)域的圖像特征量和文字特征量中的某一個或兩者。
又,最好,上述圖像特征量是色特征量、亮度特征量、結(jié)構(gòu)特征量、形狀特征量中的某一個或?qū)⑺鼈內(nèi)我舛鄠€組合起來的特征量。
又,最好,上述文字特征量是文字碼。
又,最好,進(jìn)一步備有顯示上述檢測部件的檢測結(jié)果的顯示部件;和當(dāng)作為上述檢測部件的檢測結(jié)果,在上述顯示部件上顯示多個比較目的圖像時,從該多個比較目的圖像選擇所要圖像的選擇部件。
又,最好,進(jìn)一步備有當(dāng)從多個頁圖像構(gòu)成上述比較源圖像時,從該多個頁圖像指定所要的頁圖像的指定部件,上述提取部件提取包含由上述指定部件指定的頁圖像的處理對象區(qū)域的特征量。
又,最好,上述處理部件在指定的打印條件下打印由上述檢測部件檢測到的圖像。
又,最好,進(jìn)一步備有指示對上述檢測結(jié)果的圖像的處理種類的指示部件,上述處理的種類是打印、分配、存儲、編輯中的某一種。
又,最好,進(jìn)一步備有判定在上述比較源圖像中是否存在多個頁圖像的第1判定部件;和當(dāng)作為上述第1判定部件的判定結(jié)果,在上述比較源圖像中存在多個頁圖像時,判定包含在上述比較源圖像中的頁圖像的頁數(shù)的第2判定部件,上述提取部件,對于每個根據(jù)由上述第2判定部件判定的頁數(shù)決定的處理對象區(qū)域,提取該處理對象區(qū)域的特征量。
又,最好,上述第1判定部件檢測包含在上述比較源圖像中的頁號碼,判定上述頁號碼是否等間隔地存在于預(yù)定區(qū)域內(nèi),判定在上述比較源圖像中是否存在多個頁圖像。
又,最好,上述第1判定部件通過檢測上述比較源圖像的最右端空白或最左端空白和除此以外的中間空白,判定檢測出的中間空白是否比上述最右端空白或上述最左端空白大,判定在上述比較源圖像中是否存在多個頁圖像。
又,最好,進(jìn)一步備有顯示上述第1判定部件的第1判定結(jié)果的顯示部件;和修正上述判定結(jié)果的修正部件。
又,最好,進(jìn)一步備有輸入上述比較源圖像的輸入部件;指定包含在由上述輸入部件輸入的比較源圖像中的頁圖像的頁數(shù)的指定部件,上述提取部件,對于每個根據(jù)由上述指定部件指定的頁數(shù)決定的處理對象區(qū)域,提取該處理對象區(qū)域的特征量。
上述存儲部件對應(yīng)地存儲上述比較目的圖像和由上述提取部件提取的特征量。
又,最好,進(jìn)一步備有輸入上述比較目的圖像的輸入部件;判定在上述比較目的圖像中是否存在多個頁圖像的第1判定部件;和當(dāng)作為上述第1判定部件的判定結(jié)果,在上述比較源圖像中存在多個頁圖像時,判定包含在上述比較源圖像中的頁圖像的頁數(shù)的第2判定部件,上述提取部件,對于每個根據(jù)由上述第2判定部件判定的頁數(shù)決定的處理對象區(qū)域,提取該處理對象區(qū)域的特征量,上述存儲部件對應(yīng)地存儲上述比較目的圖像和上述提取部件提取的特征量。
為了達(dá)到上述目的根據(jù)本發(fā)明的圖像處理裝置的控制方法備有下列構(gòu)成。即,輸入通過電子地讀取打印物得到的電子數(shù)據(jù)作為比較源圖像的輸入步驟;根據(jù)包含在上述比較源圖像中的頁圖像的數(shù)量,提取包含在上述比較源圖像中包含的頁圖像的處理對象區(qū)域的特征量的提取步驟;和用由上述提取步驟提取的特征量,從作為比較目的圖像存儲在存儲媒體中的多個電子數(shù)據(jù),檢索與上述比較源圖像對應(yīng)的比較目的圖像的檢索步驟。
為了達(dá)到上述目的根據(jù)本發(fā)明的程序備有下列構(gòu)成。即,作為用計(jì)算機(jī)實(shí)現(xiàn)圖像處理控制的程序,備有輸入通過電子地讀取打印物得到的電子數(shù)據(jù)作為比較源圖像的輸入步驟的程序碼;根據(jù)包含在上述比較源圖像中的頁圖像的數(shù)量,提取包含在上述比較源圖像中包含的頁圖像的處理對象區(qū)域的特征量的提取步驟的程序碼;和用由上述提取步驟提取的特征量,從作為比較目的圖像存儲在存儲媒體中的多個電子數(shù)據(jù),檢索與上述比較源圖像對應(yīng)的比較目的圖像的檢索步驟的程序碼。
本發(fā)明的其它特點(diǎn)和優(yōu)點(diǎn)將從結(jié)合附圖的下列描述變得很明顯,其中在全部附圖中相同的參照標(biāo)號表示相同或類似的部件。
與說明書結(jié)合并形成說明書一部分的附圖與描述一起闡明本發(fā)明的實(shí)施方式,并用于解釋本發(fā)明的原理。
圖1是表示本發(fā)明的實(shí)施方式1的圖像處理系統(tǒng)的構(gòu)成的方框圖。
圖2是表示本發(fā)明的實(shí)施方式1的MFP的詳細(xì)構(gòu)成的方框圖。
圖3A是表示本發(fā)明的實(shí)施方式1的登記處理的操作程序圖。
圖3B是表示本發(fā)明的實(shí)施方式1的檢索處理的操作程序圖。
圖4是表示本發(fā)明的實(shí)施方式1的地址信息的一個例子的圖。
圖5是表示本發(fā)明的實(shí)施方式1的塊信息的一個例子的圖。
圖6是表示本發(fā)明的實(shí)施方式1的特征量信息的一個例子的圖。
圖7是表示本發(fā)明的實(shí)施方式1的特征量信息的一個例子的圖。
圖8是表示本發(fā)明的實(shí)施方式1的Nup打印與2頁相當(dāng)?shù)奈臋n例子的圖。
圖9A、9B是表示本發(fā)明的實(shí)施方式1的圖像塊提取的一個例子的圖。
圖10是表示本發(fā)明的實(shí)施方式1的色特征量信息提取處理的詳細(xì)情形的操作程序圖。
圖11是表示本發(fā)明的實(shí)施方式1的分割圖像網(wǎng)格塊的一個例子的圖。
圖12是表示本發(fā)明的實(shí)施方式1的順序決定表的一個例子的圖。
圖13是表示本發(fā)明的實(shí)施方式1的色空間上的色貯藏室的構(gòu)成的一個例子的圖。
圖14是表示本發(fā)明的實(shí)施方式1的用戶接口的一個例子的圖。
圖15是表示本發(fā)明的實(shí)施方式1的比較處理的詳細(xì)情形的操作程序圖。
圖16是表示本發(fā)明的實(shí)施方式1的頁比較處理的詳細(xì)情形的操作程序圖。
圖17是表示本發(fā)明的實(shí)施方式1的色特征量信息比較處理的詳細(xì)情形的操作程序圖。
圖18是表示本發(fā)明的實(shí)施方式1的色貯藏室懲罰矩陣的構(gòu)成的一個例子的圖。
圖19是表示本發(fā)明的實(shí)施方式1的用戶接口的一個例子的圖。
圖20是表示本發(fā)明的實(shí)施方式2的檢索處理的操作程序圖。
圖21是表示本發(fā)明的實(shí)施方式2的在1張打印紙上Nup打印與4頁相當(dāng)?shù)奈臋n的例子的圖。
圖22是表示本發(fā)明的實(shí)施方式2的Nup打印判定處理的詳細(xì)情形的操作程序圖。
圖23是表示本發(fā)明的實(shí)施方式3的在1張打印紙上Nup打印與4頁相當(dāng)?shù)奈臋n例子的圖。
圖24是用于說明本發(fā)明的實(shí)施方式3的Nup打印判定處理的圖。
圖25是表示本發(fā)明的實(shí)施方式4的登記處理的操作程序圖。
圖26是表示本發(fā)明的實(shí)施方式5的登記處理的操作程序圖。
具體實(shí)施例方式
下面,我們用附圖詳細(xì)說明本發(fā)明的實(shí)施方式。
《實(shí)施方式1》圖1是表示本發(fā)明的實(shí)施方式1的圖像處理系統(tǒng)的構(gòu)成的方框圖。
該圖像處理系統(tǒng)是在用因特網(wǎng)等的網(wǎng)絡(luò)104連接辦公處所10和辦公處所20的環(huán)境中實(shí)現(xiàn)的。
作為實(shí)現(xiàn)多種功能的復(fù)合機(jī)的MFP(Multi Function Peripheral(多功能外圍設(shè)備))100、控制MFP100的管理PC101、客戶PC102、文檔管理服務(wù)器106及其數(shù)據(jù)庫105和代理服務(wù)器103與構(gòu)筑在辦公處所10內(nèi)的LAN107連接。
辦公處所10內(nèi)的LAN107和辦公處所20內(nèi)的LAN108通過雙方辦公處所的代理服務(wù)器103與網(wǎng)絡(luò)104連接。
MFP100,特別,具有電子地讀取紙文檔的圖像讀取單元和對從圖像讀取單元得到的圖像信號實(shí)施圖像處理的圖像處理單元,能夠通過LAN109將該圖像信號發(fā)送到管理PC101。
管理PC101是通常的PC,在內(nèi)部具有圖像存儲單元、圖像處理單元、顯示單元、輸入單元等的各種構(gòu)成要素,而且這些構(gòu)成要素的一部分具有與MFP100形成一體化的構(gòu)成。
又,網(wǎng)絡(luò)104典型地是通過因特網(wǎng)、LAN、WAN和電話線路、專用數(shù)字線路、ATM和幀中繼線路、通信衛(wèi)星線路、電纜電視線路、數(shù)字廣播用無線電線路等中的某一個或它們的組合實(shí)現(xiàn)的所謂的通信網(wǎng)絡(luò),最好可以進(jìn)行數(shù)據(jù)的發(fā)送接收。
又,管理PC101、客戶PC102、文檔管理服務(wù)器等的各種終端分別具有搭載在通用計(jì)算機(jī)中的標(biāo)準(zhǔn)的構(gòu)成要素(例如,CPU、RAM、ROM、硬盤、外部存儲裝置、網(wǎng)絡(luò)接口、顯示器、鍵盤、鼠標(biāo)等)。
其次,我們用圖2說明MFP100的詳細(xì)構(gòu)成。
圖2是表示本發(fā)明的實(shí)施方式1的MFP的詳細(xì)構(gòu)成的方框圖。
在圖2中,包含原稿臺和自動文檔供給器(ADF)的圖像讀取單元110用光源(圖中未畫出)照射束狀或1張的原稿圖像,由透鏡將原稿反射像成像在固體攝像元件上,從固體攝像元件得到光柵狀的圖像讀取信號作為預(yù)定密度(例如,600DPI)的光柵圖像。
又,MFP100具有用打印單元112將與圖像讀取信號對應(yīng)的圖像打印在記錄媒體上的復(fù)印功能,當(dāng)復(fù)印1個原稿圖像時,用數(shù)據(jù)處理單元115對該圖像讀取信號進(jìn)行圖像處理生成記錄信號,由打印單元112將它打印在記錄媒體上。另一方面,當(dāng)復(fù)印多個原稿圖像時,在臨時將與一個原稿圖像相當(dāng)?shù)挠涗浶盘柎鎯Ρ3衷诖鎯卧?11中后,將它順次地輸出到打印單元112,打印在記錄媒體上。
又,當(dāng)進(jìn)行Nup打印時,縮小與用數(shù)據(jù)處理單元115指定的頁相當(dāng)?shù)膱D像信號,為了可以在一張打印紙上打印出來而布局各頁的圖像信號。此后,輸出到打印單元112打印在記錄媒體上。
另一方面,數(shù)據(jù)處理單元115通過LAN107和網(wǎng)絡(luò)IF114接收從客戶PC102輸出的記錄信號,數(shù)據(jù)處理單元115在將該記錄信號變換成可以記錄在打印單元112中的光柵數(shù)據(jù)后,由打印單元112打印在記錄媒體上。
操作者對MFP100的指示是通過由與裝備在MFP100中的鍵操作單元和管理PC101連接的鍵盤和鼠標(biāo)構(gòu)成的輸入單元113進(jìn)行的,由數(shù)據(jù)處理單元115內(nèi)的控制單元(圖中未畫出)對這一連串的工作進(jìn)行控制。又,由顯示單元116進(jìn)行操作輸入的狀態(tài)顯示和處理中的圖像數(shù)據(jù)的顯示。
存儲單元111也由管理PC101進(jìn)行控制,通過網(wǎng)絡(luò)IF117和LAN109進(jìn)行MFP100和管理PC101的數(shù)據(jù)的發(fā)送接收和控制。
又,在MFP100中,由顯示單元116和輸入單元113實(shí)現(xiàn)將用于實(shí)施后述的各種處理的各種操作/顯示提供給用戶的用戶接口。
作為由根據(jù)本發(fā)明的圖像處理系統(tǒng)實(shí)施的處理,大致分成登記圖像數(shù)據(jù)的登記處理和檢索所要的圖像數(shù)據(jù)的檢索處理這樣2種處理。
又,在實(shí)施形態(tài)1中,為了提高圖像處理系統(tǒng)整體的處理效率,將下面說明的各種處理分散到構(gòu)成圖像處理系統(tǒng)的各種終端加以實(shí)施,但是也可以在1個終端(例如MFP100)上加以實(shí)施。
首先,我們說明登記處理[登記處理的概要]作為登記對象的圖像數(shù)據(jù)的登記方法,是登記掃描輸入紙文檔生成的圖像數(shù)據(jù)的情形、和登記將由文檔作成應(yīng)用程序等作成的電子文檔展開成光柵圖像的圖像數(shù)據(jù)的情形。
因此,我們用圖3A說明登記原始文檔的登記處理的概要。
圖3A是表示本發(fā)明的實(shí)施方式1的登記處理的操作程序圖。
又,該處理是在將作為登記對象的紙文檔設(shè)置在圖像讀取單元110的ADF中,操作輸入單元113的登記按鈕的時刻開始的。又,登記對象的紙文檔既可以是1張也可以是多張,但是當(dāng)是多張時,將從該紙文檔得到的圖像數(shù)據(jù)組(頁圖像組)作為1個文檔進(jìn)行管理。
首先,在步驟S3010,輸入作為登記對象的原始文檔。又,伴隨著該輸入,生成用于管理原始文檔的各種信息,存儲在存儲單元111中。
又,關(guān)于登記原始文檔時的原始文檔輸入方法,存在著2種方法。
當(dāng)原始文檔是電子數(shù)據(jù)時,存儲在客戶PC102內(nèi)的硬盤內(nèi),或辦公處所10和20內(nèi)的文檔管理服務(wù)器106內(nèi)的數(shù)據(jù)庫105內(nèi),或MFP100的存儲單元111中的某一個內(nèi),從這些存儲源讀出作為登記對象的原始文檔的電子數(shù)據(jù),通過網(wǎng)絡(luò)IF114輸入到數(shù)據(jù)處理單元115,由數(shù)據(jù)處理單元115將該電子數(shù)據(jù)變換成光柵圖像。
另一方面,當(dāng)原始文檔是紙文檔時,在MFP100的圖像讀取單元110中,光柵狀地掃描該紙文檔得到光柵圖像。
這樣,在實(shí)施方式1中,在作為登記對象的原始文檔中,也可以處理電子數(shù)據(jù)或紙文檔中的某一個。此后,由數(shù)據(jù)處理單元115對光柵圖像實(shí)施前處理,保存在存儲單元111中(又,此后,當(dāng)是紙文檔時光柵圖像成為原始文檔的電子數(shù)據(jù))。這時,對每個作為登記對象的原始文檔發(fā)行固有的文檔ID,對應(yīng)地附加原始文檔的電子數(shù)據(jù)的地址作為地址信息保存在存儲單元111中。
這里,所謂的地址指的是表示由URL、服務(wù)器名和目錄、文檔名構(gòu)成的電子數(shù)據(jù)的存儲目的地的總線信息。又,當(dāng)表示地址信息的一個例子時,如圖4所示。又,地址信息的存儲目的地可以舉出數(shù)據(jù)庫105和存儲單元111等。
又,令當(dāng)原始文檔是紙文檔時的電子數(shù)據(jù)的文檔形式,例如,為BMP形式,但是不限定于此,如果是可以保存色信息的文檔形式(例如,GIF、JPEG)則也可以是任何形式。
另一方面,當(dāng)原始文檔是電子數(shù)據(jù)時該電子數(shù)據(jù)的文檔形式成為由作成該電子數(shù)據(jù)的應(yīng)用程序(例如,微軟(注冊商標(biāo))公司的MS-Word和Adobe系統(tǒng)(注冊商標(biāo))的Acrobat等)作成的文檔形式(*.doc和*.pdf)。
其次,在步驟S3011,將在步驟S3010輸入的文檔的數(shù)量設(shè)定為文檔輸入數(shù)P。其次,在步驟S3012,分別在表示處理文檔數(shù)的變量a和表示處理對象的1個文檔中的處理頁數(shù)的變量b中設(shè)定1作為初始值。其次,在步驟S3013,將第a個的文檔中的頁數(shù)設(shè)定為1個文檔的頁數(shù)Q。
其次,作為結(jié)束判定,判定P是否大于等于a。當(dāng)不到a時(步驟S3014中“否”),結(jié)束處理。另一方面,當(dāng)大于等于a時(步驟S3014中“是”),因?yàn)榇嬖谖刺幚淼奈臋n,所以繼續(xù)處理。
其次,在步驟S3015,作為文檔單位的結(jié)束判定,判定Q是否大于等于b。當(dāng)不到b時(步驟S3015中“否”),行進(jìn)到步驟S3032,使a增加1,回到步驟S3014,將處理對象移動到下一個文檔。另一方面,當(dāng)大于等于b時(步驟S3015中“是”),因?yàn)榇嬖谖刺幚淼捻摚岳^續(xù)處理。
其次,關(guān)于第P個文檔的Q頁,進(jìn)行塊選擇(BS)處理。該處理是通過管理PC101的控制實(shí)施的。
具體地說,管理PC101的CPU,首先,將存儲在存儲單元111中的處理對象的原始文檔的光柵圖像,區(qū)域分割成文字/線圖像部分和半色調(diào)圖像部分,進(jìn)一步將文字/線圖像部分分割成在段落中作為塊匯集的每個塊或由線構(gòu)成的每個表、圖形。
另一方面,將半色調(diào)圖像部分分割成分離成矩形的塊的圖像部分、背景部分等的塊。
而且,發(fā)行作為處理對象的頁的頁號碼、和特定該頁中的各塊的塊ID,使各塊的屬性(圖像、文字等)、大小和原始文檔內(nèi)的位置(頁內(nèi)的坐標(biāo))與各塊關(guān)聯(lián)起來,作為塊信息存儲在存儲單元111中。當(dāng)表示該塊信息的一個例子時,如圖5所示。
其次,在步驟S3030,在數(shù)據(jù)處理單元115中,與各塊的種類相應(yīng),進(jìn)行提取各塊的特征量信息的特征量信息提取處理。
特別是,關(guān)于文字塊,實(shí)施OCR處理提取文字碼,將它作為文字特征量。又,關(guān)于圖像塊,提取關(guān)于色的圖像特征量。這時,將與各個塊對應(yīng)的特征量匯集成原始文檔單位,與文檔ID、頁號碼、塊ID關(guān)聯(lián)地作為特征量信息存儲在存儲單元111中。當(dāng)表示該特征量信息的一個例子時,如圖6和圖7所示。
其次,在步驟S3031,使b增加1,回到步驟S3014,移動到處理對象的下一頁。
我們用圖3B說明檢索原始文檔的電子數(shù)據(jù)的檢索處理的概要。
圖3B是表示本發(fā)明的實(shí)施方式1的檢索處理的操作程序圖。
首先,在步驟S3110,輸入成為檢索條件的紙文檔。因?yàn)樵撎幚砼c步驟S3010的處理相同,所以省略對它的說明。但是,只暫時保存由該處理生成的光柵圖像,不需要將對于該紙文檔的地址信息保存在存儲單元111中。
其次,在步驟S3111,判定有無由用戶指定的Nup打印。當(dāng)存在Nup打印的指定時(步驟S3111中“是”),行進(jìn)到步驟S3112,將用戶指定的1張中的頁數(shù)設(shè)定為頁數(shù)L。另一方面,當(dāng)不存在Nup打印的指定時(步驟S3111中“否”),行進(jìn)到步驟S3115,看作1張中的1頁,將頁數(shù)L1設(shè)定為1。
其次,在步驟S3113,將表示處理對象的1個文檔中的處理頁數(shù)的變量b設(shè)定為1作為初始值。其次,作為比較處理的結(jié)束判定,判定L是否大于等于b。當(dāng)不到b時(步驟S3116中“否”),行進(jìn)到步驟S3150。另一方面,當(dāng)大于等于b時(步驟S3116中“是”),因?yàn)榇嬖谖刺幚淼捻摚詾榱死^續(xù)處理,行進(jìn)到步驟S3120。
其次,在步驟S3120,對于光柵圖像中的第b頁的圖像區(qū)域,進(jìn)行塊選擇(BS)處理。
我們用圖8說明這時的塊選擇處理的具體例子。
在圖8中,表示了Nup打印與2頁相當(dāng)?shù)牟糠值睦?。在圖8中,810是1張紙整體的區(qū)域,811和812表示各頁的頁圖像。813和814表示各頁的頁號碼。這里,當(dāng)b=1時,只對包含第1頁的頁圖像811的處理對象區(qū)域815,進(jìn)行塊選擇處理。而且,在圖8的例子中,當(dāng)b=2時,對包含第2頁的頁圖像812的處理對象區(qū)域進(jìn)行塊選擇處理。
又,因?yàn)樵搲K選擇處理自身與步驟S3020的塊選擇處理相同所以省略對它的說明。但是只暫時保存由該塊選擇處理生成的各塊的屬性、大小、位置,不需要將對于該紙文檔的塊信息保存在存儲單元111中。
又,根據(jù)L的值和紙文檔的方向,將1張紙文檔分割成L個區(qū)域,進(jìn)一步根據(jù)預(yù)定的處理順序決定處理對象區(qū)域。
其次,在步驟S3130,進(jìn)行提取各塊的特征量信息的特征量信息提取處理。因?yàn)樵撎幚砼c步驟S3030的處理相同,所以省略對它的說明。但是,只暫時保存由該處理生成的各塊的特征量,不需要將對于該紙文檔的特征量信息保存在存儲單元111中。
其次,在步驟S3140,比較對于輸入的紙文檔中的第b頁的圖像(比較源圖像)的特征量信息與存儲在客戶PC102內(nèi)的硬盤內(nèi)、或辦公處所10和辦公處所20內(nèi)的文檔管理服務(wù)器106內(nèi)的數(shù)據(jù)庫105內(nèi)、或MFP100的存儲單元111中的某一個內(nèi)的電子數(shù)據(jù)(比較目的圖像)的特征量信息,算出它們的類似度,根據(jù)該類似度,決定作為檢索結(jié)果的原始文檔候補(bǔ)。
其次,在步驟S3141,使b增加1,回到步驟S3116,使處理對象移動到下一頁。
而且,在步驟S3116,當(dāng)L不到b時(步驟S3116中“否”),行進(jìn)到步驟S3150,判定是否是用戶確認(rèn)模式。
又,所謂的用戶確認(rèn)模式指的是從由比較結(jié)果得到的原始文檔候補(bǔ)中,確認(rèn)是否檢索用戶所要的原始文檔的模式。具體地說,是由顯示單元116/輸入單元113實(shí)現(xiàn)包含原始文檔候補(bǔ)組的用戶接口,通過該用戶接口,用戶能夠確認(rèn)原始文檔候補(bǔ)組的內(nèi)容的模式。又,我們將在后面述說該用戶接口的構(gòu)成的詳細(xì)情形。
在步驟S3150,當(dāng)不是用戶確認(rèn)模式時(步驟S3150中“否”),自動選擇在比較處理中判斷為最類似的文檔,行進(jìn)到步驟S3170。另一方面,當(dāng)是用戶確認(rèn)模式時(步驟S3150中“是”),行進(jìn)到步驟S3160,顯示/選擇原始文檔候補(bǔ)。特別是,在顯示單元116中顯示出原始文檔候補(bǔ)的縮略圖像,從多個原始文檔候補(bǔ)中用戶選擇所要的原始文檔候補(bǔ)的縮略圖像來實(shí)現(xiàn)該選擇。
其次,在步驟S3170,根據(jù)通過由顯示單元106/輸入單元114實(shí)現(xiàn)的用戶接口的來自用戶的操作,對選出的原始文檔,實(shí)施該原始文檔的打印、分配、存儲、編輯中的某一種處理。
如以上說明的那樣,當(dāng)Nup打印時,對于1個文檔中包含的各頁中的每一頁,進(jìn)行塊選擇處理和特征量信息提取處理,用它們對每一頁順序地實(shí)施類似圖像檢索,能夠全部檢索并活用與各頁對應(yīng)的電子數(shù)據(jù)。
下面,我們說明各處理的詳細(xì)情形。
首先,我們說明步驟S3020和步驟S3120的塊選擇處理的詳細(xì)情形。
所謂的塊選擇處理指的是,例如,將圖9A的光柵圖像,如圖9B那樣,作為具有意義的每個塊進(jìn)行識別,判定該塊的各個屬性(文字(TEXT))/圖像(PICTURE))/照片(PHOTO)/線(LINE)/表(TABLE)等),分割成具有不同屬性的塊的處理。
下面,我們說明塊選擇處理的實(shí)施方式。
首先,使輸入圖像二值化為黑白,進(jìn)行輪廓線追蹤提取由黑像素輪廓包圍的像素塊。關(guān)于面積大的黑像素塊,即便對于處于內(nèi)部的白像素,也進(jìn)行輪廓線追蹤提取白像素塊,進(jìn)一步從大于等于一定面積的白像素塊的內(nèi)部遞歸地提取黑像素塊。
用大小和形狀對這樣得到的黑像素塊進(jìn)行分類,分類成持有不同屬性的塊。例如,將縱橫比接近于1,大小在一定范圍內(nèi)的塊作為與文字相當(dāng)?shù)南袼貕K,進(jìn)一步將接近的文字可以整列地分組化的部分作為文字塊,將扁平的像素塊作為線塊,將整列地內(nèi)包大于等于一定大小并且矩形的白像素塊的黑像素塊的占據(jù)范圍作為表塊,將不定形的像素塊散布的區(qū)域作為照片塊,將除此以外的任意形狀的像素作為圖畫塊。
其次,我們說明步驟S3030和步驟S3130的特征量信息提取處理的詳細(xì)情形。
又,因?yàn)樵趫D像塊和文字塊中處理方法是不同的,所以我們分別說明各自的特征量信息提取處理。
這里,在圖9B的例子中,將圖像塊作為照片塊和圖畫塊,但是與用途和目的相應(yīng),也可以將圖像塊作為照片塊和圖畫塊中的至少一方。
首先,我們說明對于圖像塊的特征量信息提取處理。
又,當(dāng)1個文檔中存在多個圖像塊時,與它的總數(shù)相當(dāng),反復(fù)進(jìn)行下列的處理。
在實(shí)施方式1中,作為一個例子,進(jìn)行提取關(guān)于圖像顏色的色特征量的色特征量信息提取處理。
我們用圖10說明該色特征量信息提取處理的詳細(xì)情形。
圖10是表示本發(fā)明的實(shí)施方式1的色特征量信息提取處理的詳細(xì)情形的操作程序圖。
又,在該處理中,提取具有將處理對象圖像分割成多個網(wǎng)格塊的各網(wǎng)格塊的色直方圖中的最常出現(xiàn)的顏色的顏色和與各網(wǎng)格塊的位置信息對應(yīng)的信息作為色特征信息。
首先,在步驟S1020,將圖像分割成多個網(wǎng)格塊。在實(shí)施方式1中,如圖11所示,將圖像分割成縱橫各9個網(wǎng)格塊。特別是,在實(shí)施方式1中,為了示例的方便表示分割成9×9=81個網(wǎng)格塊的例子,但是實(shí)際上最好分割成約15×15=225個網(wǎng)格塊。
其次,在步驟S1030,將成為處理對象的注目網(wǎng)格塊設(shè)定在左上端的塊中。又,例如,如圖12所示,參照預(yù)先決定處理順序的順序決定表設(shè)定該注目網(wǎng)格塊。
在步驟S1040,判定有無未處理的注目網(wǎng)格塊。當(dāng)沒有未處理的注目網(wǎng)格塊時(步驟S1040中“否”),結(jié)束處理。另一方面,當(dāng)具有未處理的注目網(wǎng)格塊時(步驟S1040中“是”),行進(jìn)到步驟S1050。
在步驟S1050,將注目網(wǎng)格塊的全部像素的各濃度值投影到作為分割圖13的色空間作成的部分空間的色貯藏室(bin),生成對于色貯藏室的色直方圖。
又,在實(shí)施方式1中,如圖13所示,表示將注目網(wǎng)格塊的全部像素的濃度值投影到將RGB色空間分割成3×3×3=27的色貯藏室的情形,但是實(shí)際上,最好將注目網(wǎng)格塊的全部像素的濃度值投影到將RGB色空間分割成6×6×6=216的色貯藏室。
在步驟S1060,將色直方圖的最常出現(xiàn)的色貯藏室的色貯藏室ID決定為該注目網(wǎng)格塊的代表色,將該注目網(wǎng)格塊及其位置對應(yīng)地存儲在存儲單元111中。
在步驟S1070,參照圖12的順序決定表,設(shè)定成為下一個處理對象的注目網(wǎng)格塊。此后,回到步驟S1040,遞歸地反復(fù)進(jìn)行步驟S1040~步驟S1070的處理,直到?jīng)]有未處理的注目網(wǎng)格塊為止。
通過以上的處理,能夠提取每個處理對象圖像(畫像塊)的網(wǎng)格塊的代表色和與各網(wǎng)格塊的位置信息對應(yīng)的信息作為色特征量信息。
其次,我們說明對于文字塊的特征量信息提取處理。
又,當(dāng)1個文檔中存在多個文字塊時,與它的總數(shù)相當(dāng),反復(fù)進(jìn)行下列的處理。
將對于文字塊的文字特征量信息作為在該文字塊中實(shí)施OCR(文字識別)處理得到的文字碼。
OCR(文字識別)處理,對于從文字塊以文字為單位切出的文字畫像,用圖案匹配的方法進(jìn)行文字識別,取得對應(yīng)的文字碼。
該文字識別處理比較將從文字畫像得到的特征變換成數(shù)十維數(shù)值列的觀測特征矢量和預(yù)先對于每個字符類型求得的字典特征矢量,將距離最近的字符類型作為識別結(jié)果。
關(guān)于特征矢量的提取具有種種眾所周知的方法,例如,具有將文字分割成網(wǎng)格狀,以將各網(wǎng)格塊內(nèi)的文字線作為不同方向上的線素進(jìn)行計(jì)數(shù)的網(wǎng)格數(shù)維矢量為特征的方法。
當(dāng)對由塊選擇處理(步驟S3020或步驟S3120)提取的文字塊進(jìn)行文字識別時,首先,對該文字塊判定橫寫/縱寫,在各各對應(yīng)的方向上切出文字列,此后,從文字列切出文字取得文字畫像。
橫寫/縱寫的判定是在相應(yīng)的文字塊內(nèi)取對于畫素值的水平/垂直的投影,當(dāng)水平投影的分散大時判定為橫寫,當(dāng)垂直投影的分散大時判定為縱寫。到文字列和文字的分解,當(dāng)是橫寫文字塊時,利用它的水平方向的投影切出行,進(jìn)一步從對于切出行的垂直方向的投影,切出文字。另一方面,對于縱寫的文字塊,最好使水平和垂直相反。
其次,我們說明圖3B的步驟S3111的Nup打印的指定方法的詳細(xì)情形。
Nup打印指定是通過MFP100的用戶接口,判定是否是Nup打印,進(jìn)一步,當(dāng)是Nup打印,指定在1張文檔中包含的頁數(shù)。
我們用圖14說明該用戶接口的一個例子。
圖14是表示本發(fā)明的實(shí)施方式1的用戶接口的一個例子的圖。
1411是顯示/操作面板。1412~1415是各種功能按鈕,各個功能按鈕1412~1415是用于進(jìn)行處理對象的畫像的打印指示、分配指示、存儲指示和編輯指示的按鈕。
1416是開始按鈕,通過按下它,能夠?qū)嵤┯晒δ馨粹o選擇的功能。1425是數(shù)碼鍵,可以進(jìn)行打印時的張數(shù)指定和Nup打印時的1張打印紙中包含的頁數(shù)指定。
1417是顯示區(qū)域,由觸摸面板構(gòu)成,用戶通過直接觸摸畫面可以選擇指示。1418是紙文檔確認(rèn)用區(qū)域,將由畫像讀取單元110讀取的紙文檔畫像縮小到收入?yún)^(qū)域內(nèi)的大小進(jìn)行顯示。用戶可以在該區(qū)域1418中確認(rèn)紙文檔畫像的狀態(tài)。
1419是確認(rèn)輸入原稿的種類的區(qū)域,能夠確認(rèn)讀取的紙文檔的種類的內(nèi)容。在該區(qū)域1419內(nèi),1420是指定Nup打印的指定區(qū)域。又,當(dāng)指定Nup打印時,為了顯示該指定的狀態(tài),將它的顯示形態(tài)變更到例如,附有顏色的顯示、閃爍顯示、高亮度顯示等的顯示形態(tài)。
1424是當(dāng)指定Nup打印時,顯示1張打印紙中包含的頁數(shù)的區(qū)域,特別是,當(dāng)不指定Nup打印時,設(shè)定為1。使用數(shù)碼鍵1425指定頁數(shù)。
通過構(gòu)成這樣的用戶接口,當(dāng)對于讀取的紙文檔指定Nup打印,是Nup打印時,能夠一面顯示該狀態(tài)一面指定在1張打印紙中包含與哪一頁相當(dāng)?shù)奈臋n。
其次,我們用圖15說明步驟S3140的比較處理的詳細(xì)情形。
圖15是表示本發(fā)明的實(shí)施方式1的比較處理的詳細(xì)情形的操作程序圖。
首先,在步驟S1510,參照地址信息,判定有無未比較的原始文檔。當(dāng)沒有未比較的原始文檔時(步驟S1510中“否”),行進(jìn)到步驟S1550。另一方面,當(dāng)具有未比較的原始文檔時(步驟S1510中“是”),行進(jìn)到步驟S1520。
其次,進(jìn)行布局比較。這里,所謂的布局指的是塊信息中的塊的屬性、大小、位置。當(dāng)比較源圖像(紙文檔)和比較目的圖像(電子數(shù)據(jù))的布局相同時(步驟S1520中“是”),行進(jìn)到步驟S1530。另一方面,當(dāng)比較源圖像和比較目的圖像的布局不同時(步驟S1520中“否”),回到步驟S1510。
其次,在步驟S1530,實(shí)施比較源圖像(紙文檔)和比較目的圖像(電子數(shù)據(jù))的頁的頁比較處理。該比較用與塊屬性一致,與各個文字、圖像相應(yīng)的特征量,復(fù)合地進(jìn)行比較,算出類似度。我們將在后面述說該處理的詳細(xì)情形。
其次,在步驟S1540,將比較目的的文檔ID、與頁號碼對應(yīng)的文檔的類似度暫時存儲在存儲單元111中。
在步驟S1510,當(dāng)與全部文檔的比較結(jié)束時(步驟S1510中“否”),行進(jìn)到步驟S1550,以類似度下降的順序選擇并輸出文檔ID和頁號碼。
其次,我們用圖16說明步驟S1530的頁比較處理的詳細(xì)情形。
圖16是表示本發(fā)明的實(shí)施方式1的頁比較處理的詳細(xì)情形的操作程序圖。
首先,在步驟S1610,參照塊信息,判定在與成為處理對象的文檔ID和頁號碼對應(yīng)的電子數(shù)據(jù)中,有無未比較的塊。當(dāng)沒有未比較的塊時(步驟S1610中“否”),行進(jìn)到步驟S1670。另一方面,當(dāng)具有未比較的塊時(步驟S1610中“是”),行進(jìn)到步驟S1620。
其次,在步驟S1620判定比較對象的塊屬性。當(dāng)屬性是圖像塊時,行進(jìn)到步驟S1640。另一方面,當(dāng)屬性是文字塊時,行進(jìn)到步驟S1660。
當(dāng)屬性是圖像塊時,在步驟S1640,用關(guān)于色的特征量信息進(jìn)行作為與比較目的塊的類似比較的色特征量信息比較處理。我們將在后面述說該處理的詳細(xì)情形。又,將由此得到的類似度,與比較目的的文檔ID、頁號碼、與塊ID對應(yīng)地暫時存儲在存儲單元111中。
另一方面,當(dāng)屬性是文字塊時,在步驟S1660,進(jìn)行作為文字特征量信息中比較原塊和比較目的塊的類似比較的文字特征量信息比較處理。我們將在后面述說該處理的詳細(xì)情形。又,將由此得到的類似度,與比較目的的文檔ID、頁號碼、與塊ID對應(yīng)地暫時存儲在存儲單元111中。
其次,在步驟S1610,當(dāng)與全部塊的比較結(jié)束時(步驟S1610中“否”),行進(jìn)到步驟S1670,通過步驟S1640和步驟S1660的處理,存儲在存儲單元111中。整合在比較目的文檔(電子數(shù)據(jù))的頁中包含的全部塊的類似度,進(jìn)行算出與作為檢索條件的紙文檔和原始文檔中的頁的類似度的整合處理。我們將在后面述說該處理的詳細(xì)情形。
其次,我們用圖17說明步驟S1640的色特征量信息比較處理的詳細(xì)情形。
圖17是表示本發(fā)明的實(shí)施方式1的色特征量信息比較處理的詳細(xì)情形的操作程序圖。
首先,在步驟S1710,從色特征量信息讀出比較源圖像塊和比較目的圖像塊的色特征量。
其次,在步驟S1720,在前頭設(shè)定作為處理對象的圖像塊中的注目網(wǎng)格塊。在步驟S173,將表示比較源圖像塊的色特征量和比較對象的色特征量的類似度的類似距離設(shè)置為0。
在步驟S1740,判定有無未比較的注目網(wǎng)格塊。當(dāng)沒有未比較的注目網(wǎng)格塊時(步驟S1740中“否”),行進(jìn)到步驟S1780。另一方面,當(dāng)具有未比較的注目網(wǎng)格塊時(步驟S1740中“是”),行進(jìn)到步驟S1750。
在步驟S1750,從比較源圖像和比較目的圖像的各個色特征量,取得各個注目網(wǎng)格塊的色貯藏室ID。
在步驟S1760,參照圖18的色貯藏室懲罰矩陣,取得與取得的色貯藏室ID間對應(yīng)的注目網(wǎng)格塊的局域類似距離,將它累計(jì)地加到前一個處理中取得的類似距離上。而且,將該類似距離存儲在存儲單元111中。
這里,我們用圖18說明色貯藏室懲罰矩陣。
圖18是表示本發(fā)明的實(shí)施方式1的色貯藏室懲罰矩陣的構(gòu)成的圖。
色貯藏室懲罰矩陣是管理色貯藏室ID的局域類似距離的矩陣。如果根據(jù)圖18,則色貯藏室懲罰矩陣具有在同一個色貯藏室ID,它的類似距離成為0,色貯藏室ID之差越大,即,類似度越低,它的類似距離就越大的構(gòu)成。又,同一個色貯藏室ID的對角位置全部,其類似距離為0,對于類似距離為0色貯藏室ID是對稱的。
這樣,在實(shí)施方式1中,因?yàn)橹粎⒄丈A藏室懲罰矩陣,就能夠取得色貯藏室ID的類似距離,所以能夠達(dá)到使處理高速化的目的。
而且,在步驟S1770,參照圖12的順序決定表,設(shè)定成為下一個處理對象的注目網(wǎng)格塊。此后,回到步驟S1740。
而且,在步驟S1740,當(dāng)沒有未比較的注目網(wǎng)格塊時(步驟S1740中“否”),行進(jìn)到步驟S1780,將存儲在存儲單元111中的類似距離變換成類似度,與塊ID成對地輸出。
又,到類似度的變換,例如,當(dāng)類似距離為最小值時使類似度為100%,當(dāng)類似距離為最大值時使類似度為0%,可以根據(jù)對于最小值或最大值的差算出對于該范圍內(nèi)的類似距離的類似度。
其次,我們說明步驟S1660的文字特征量信息比較處理的詳細(xì)情形。
在該處理中,進(jìn)行比較源圖像和比較目的圖像中的各個文字塊內(nèi)的各文字碼的比較,從它們的一致度算出類似度。
又,當(dāng)比較作為檢索條件的紙文檔和原始文檔時,類似度成為100%是理想的,但是因?yàn)閷?shí)際上,存在著在對于作為檢索條件的紙文檔的文字塊的OCR處理中發(fā)生誤識別的情形,所以即便可以與原始文檔比較,類似度也不成為100%,而是成為相當(dāng)接近100%的值。
其次,我們說明步驟S1670的整合處理的詳細(xì)情形。
在該整合處理中,為了更大反映在作為比較目的圖像的原始文檔內(nèi)占據(jù)的比例大的塊的類似度,作為原始文檔整體的類似度,整合算出的每一個塊的類似度。
例如,對于原始文檔中的塊B1~B6,算出每個塊的類似率為n1~n6,這時原始文檔整體的總合類似率N由下列公式表現(xiàn)出來。
N=w1*n1+w2*n2+w3*n3+…+w6*n6 (1)這里,w1~w6是評價各塊的類似率的權(quán)重系數(shù)。權(quán)重系數(shù)w1~w6是從塊的原始文檔內(nèi)的占有率算出的。例如,當(dāng)令塊1~6的大小為S1~S6時,能夠算出塊1的占有率w1為w1=S1/(S1+S2+…+S6)(2)通過用這種占有率進(jìn)行加權(quán)處理,能夠?qū)⒃谠嘉臋n內(nèi)占據(jù)大的區(qū)域的塊的類似度更好地在原始文檔整體的類似度中反映出來。
其次,我們說明當(dāng)步驟S3150和步驟3160中表示的確認(rèn)模式時的處理的詳細(xì)情形。
既可以用戶預(yù)先從用戶接口指定確認(rèn)模式,也可以自動判定是否要決定確認(rèn)模式。作為自動判定方法,具有下列的方法。例如,當(dāng)檢索到的原始文檔候補(bǔ)為1時,或者,當(dāng)1位的原始文檔候補(bǔ)和2位以后的原始文檔候補(bǔ)的各個類似度之差大于等于預(yù)定值,1位的原始文檔候補(bǔ)是所要的原始文檔的可能性高時,作為“非確認(rèn)模式”行進(jìn)到步驟S3170,當(dāng)不是這種情形時,作為“確認(rèn)模式”。
但是,當(dāng)掃描Nup打印的紙文檔時,關(guān)于與掃描圖像中的各頁對應(yīng)的各個候補(bǔ),1個都不滿足上述條件時,成為“確認(rèn)模式”,只確認(rèn)不滿足上述條件的頁。
當(dāng)“確認(rèn)模式”時,在由MFP100的顯示單元110和輸入單元113實(shí)現(xiàn)的用戶接口中,以類似度高的順序顯示原始文檔候補(bǔ)組,讓用戶從中選擇所要的原始文檔。
這樣,當(dāng)自動判定有無實(shí)施確認(rèn)模式時,因?yàn)椴恍枰捎脩暨M(jìn)行選擇原始文檔的操作,所以能夠減少操作步驟。
這里,我們用圖19說明確認(rèn)模式時的用戶接口的一個例子。
圖19是表示本發(fā)明的實(shí)施方式1的用戶接口的一個例子的圖。
1917是顯示區(qū)域,由觸摸面板構(gòu)成,用戶通過直接觸摸畫面可以選擇指示。又,該顯示區(qū)域1917與圖14的顯示區(qū)域1417相同。
1918是模式顯示區(qū)域,在圖19中,表示為確定模式。通常顯示自動判定的模式。又,通過觸摸它,用戶能夠循環(huán)地指定“確認(rèn)模式”和“非確認(rèn)模式”。1919~1928是作為檢索結(jié)果輸出的原始文檔候補(bǔ)的縮略圖像組。該縮略圖像的顯示以從1919開始的號碼順序以類似度高的順序進(jìn)行顯示。
在本例中,當(dāng)顯示最大為10個的縮略圖像,原始文檔候補(bǔ)大于等于10時,顯示直到10個縮略圖像。而且,通過從該縮略圖像組1919~1928,選擇所要的縮略圖像,可以選擇所要的原始文檔,可以對該選出的原始文檔實(shí)施各種處理。
1929表示當(dāng)掃描Nup打印的紙文檔時顯示的是否顯示文檔中第哪一頁的候補(bǔ)。又,通過選擇它,也可以切換其它頁的候補(bǔ)進(jìn)行顯示。
其次,我們說明步驟S3170的打印/分配/存儲/編輯處理的詳細(xì)情形。
例如,當(dāng)掃描Nup打印的紙文檔,用它進(jìn)行類似圖像檢索時,能夠得到對于該文檔中的各頁的與多個頁相當(dāng)?shù)臋z索結(jié)果(原始文檔)。
而且,當(dāng)用這些與多個頁相當(dāng)?shù)臋z索結(jié)果進(jìn)行打印時,作為它的打印條件,例如,既可以在1張打印紙上打印1頁,原來的Nup打印也可以進(jìn)行變更了布局的Nup打印,也可以在1張打印紙的兩面上打印各頁,既可以將各頁重疊在1張打印紙上進(jìn)行打印,也可以改變順序進(jìn)行裝訂打印。又,當(dāng)然,也可以只將用戶指定的頁打印在1張打印紙上。
又,除了打印處理以外,既可以對于全部檢索結(jié)果,進(jìn)行分配、存儲、編輯等的處理,也可以只對用戶指定的頁進(jìn)行分配、存儲、編輯等的處理。
如以上說明的那樣,如果根據(jù)實(shí)施方式1,則對于在Nup打印的紙文檔中包含的全部頁,能夠檢索原始的電子數(shù)據(jù),并且能夠?qū)崿F(xiàn)用該檢索到的電子數(shù)據(jù)的種種活用。
《實(shí)施方式2》在實(shí)施方式1中,具有判定輸入的紙文檔是否是Nup打印,進(jìn)一步,當(dāng)是Nup打印時,用戶指定在1張文檔中包含的頁數(shù)的構(gòu)成,但是在實(shí)施方式2中,我們說明具有解析輸入的紙文檔的內(nèi)容,根據(jù)該解析結(jié)果,判定紙文檔是否是Nup打印,進(jìn)一步,當(dāng)是Nup打印時,自動判定在1張文檔中包含的頁數(shù)的構(gòu)成。又,在實(shí)施方式1的圖3B的步驟S3110輸入紙文檔后實(shí)施該自動判定的定時。
下面,我們用圖20說明實(shí)施方式2的檢索處理。
圖20是表示本發(fā)明的實(shí)施方式2的檢索處理的操作程序圖。
又,在圖20中,在與實(shí)施方式1的圖3B的檢索處理相同的處理步驟上附加相同的步驟號碼,并省略對它們的詳細(xì)情形的說明。
在步驟S3110,輸入紙文檔后,在步驟S2011,進(jìn)行判定輸入的掃描圖像是否是Nup打印的Nup打印判定處理。而且,根據(jù)該判定結(jié)果,實(shí)施步驟S3111的處理。
這里,在紙文檔上打印與1頁相當(dāng)?shù)奈臋n的通常打印的情形中,在紙文檔的上端或下端打印頁號碼。另一方面,在Nup打印的情形中,在紙文檔內(nèi)等間隔地打印多個頁號碼。因此,在實(shí)施方式2中,利用這點(diǎn),判定處理對象的掃描圖像是否是Nup打印。
作為一個例子,我們說明圖21所示的在1張打印紙上Nup打印與4頁相當(dāng)?shù)奈臋n的情形。
圖21是表示本發(fā)明的實(shí)施方式2的在1張打印紙上Nup打印與4頁相當(dāng)?shù)奈臋n的例子的圖。
在圖21中,2110表示Nup打印時的紙整體的區(qū)域。2111~2114表示各頁的頁圖像。2115~2118是賦予各頁的號碼。2119和2120的粗線框內(nèi)是后面述說的頁號碼探索區(qū)域。
我們用圖21和圖22說明步驟S2011的Nup打印判定處理的詳細(xì)情形。
圖22是表示本發(fā)明的實(shí)施方式2的Nup打印判定處理的詳細(xì)情形的操作程序圖。
首先,在步驟S2210,對打印紙整體的區(qū)域2110的上端和下端的區(qū)域,實(shí)施OCR處理。其次,在步驟S2220,作為OCR處理的處理結(jié)果,判定頁號碼(例如,阿拉伯?dāng)?shù)字或英文數(shù)字)是否大于等于2個,是否等間隔地存在于上端區(qū)域或下端區(qū)域的同一個區(qū)域內(nèi)。當(dāng)不存在頁號碼大于等于2個時(步驟S2220中“否”),行進(jìn)到步驟S2260,判定是通常打印。另一方面,當(dāng)存在頁號碼大于等于2個時(步驟S2220中“是”),行進(jìn)到步驟S2230。
在圖21的例子中,在下端區(qū)域在2個地方檢測出頁號碼2117(“3”)和2118(“4”)。
在步驟S2230,根據(jù)檢測出的頁號碼,設(shè)定用于探索其它頁號碼的頁號碼探索區(qū)域,對該設(shè)定的頁號碼探索區(qū)域?qū)嵤㎡CR處理。
在圖21的例子中,在頁號碼圖像2117和2118中,在包含各個頁號碼的打印紙整體的垂直方向上,設(shè)定頁號碼探索區(qū)域2119和2120。而且,對各頁號碼探索區(qū)域2119和2120實(shí)施OCR處理。
其次,在步驟S2240,在各頁號碼探索區(qū)域中檢測頁號碼,判定各頁號碼探索區(qū)域中的各頁號碼的間隔是否相同。當(dāng)不相同時(步驟S2240中“否”),行進(jìn)到步驟S2260,判定是通常打印。另一方面,當(dāng)相同時(步驟S2240中“是”),行進(jìn)到步驟S2250,判定是Nup打印。
又,這里的間隔是否相同的判定是對包含考慮到某種程度的誤差范圍的頁號碼之間的間隔實(shí)施的。即,當(dāng)頁號碼之間的間隔包含在該誤差范圍內(nèi)時,判定頁號碼之間的間隔相同。
在圖21的例子中,在頁號碼探索區(qū)域2119中檢測出頁號碼2115(“1”)和2117(“3”),在頁號碼探索區(qū)域2120中檢測出頁號碼2116(“2”)和2118(“4”)。而且,頁號碼探索區(qū)域2119和頁號碼探索區(qū)域2120中的頁號碼間隔成為相同的間隔。因此,這時,判定Nup打印。
又,這時,使在步驟S2210檢測出的頁號碼數(shù)與在步驟S2230的1個頁號碼探索區(qū)域中檢測出的頁號碼數(shù)相乘,能夠算出1張打印紙中包含的頁數(shù),將該頁數(shù)暫時保存在存儲單元111中。
如以上說明的那樣,如果根據(jù)實(shí)施方式2,則除了實(shí)施方式1中說明的效果外,自動地判定掃描圖像是否是Nup打印,可以不用麻煩用戶動手,判定是否是Nup打印,又,當(dāng)是Nup打印時判定與哪一頁相當(dāng)?shù)匕瑨呙鑸D像。
又,在實(shí)施方式2中,也可以具有臨時向用戶提示步驟S2011的Nup打印判定處理的處理結(jié)果使用戶確認(rèn)的構(gòu)成。這時,如圖14的紙文檔確認(rèn)用區(qū)域1418那樣最好將判定結(jié)果作為縮小圖像顯示出來。又,作為確認(rèn)的結(jié)果,當(dāng)誤判定時,可以給予用區(qū)域1419修正判定內(nèi)容的機(jī)會。
根據(jù)這種構(gòu)成,即便在Nup打印判定處理中是誤判定,也能夠修正該判定內(nèi)容,防止輸出錯誤的原始電子數(shù)據(jù)。
《實(shí)施方式3》在實(shí)施方式2中,我們說明了在步驟S2011的Nup打印判定處理中,用OCR處理,檢測頁號碼的方法,但是不限定于此。例如,也可以如下那樣地檢測頁號碼。
這里,我們說明如圖23所示,在1張打印紙上Nup打印與4頁相當(dāng)?shù)奈臋n的情形。
又,因?yàn)?310與圖21的2110對應(yīng),下面同樣地,2311與2111對應(yīng),2312與2112對應(yīng),2313與2113對應(yīng),2314與2114對應(yīng),2315與2115對應(yīng),2316與2116對應(yīng),2317與2117對應(yīng),2318與2118對應(yīng),所以省略對它們的說明。
在圖23中,2320是左側(cè)的2個頁的左邊緣(最左端空白)。2321是右側(cè)的2個頁的右邊緣(最右端空白)。2319是左側(cè)的2個頁和右側(cè)的2個頁的中間邊緣(中間空白)。這里,因?yàn)橹虚g邊緣2319與左側(cè)的2個頁的右邊緣和右側(cè)的2個頁的左邊緣連續(xù),所以比左邊緣2320和右邊緣2321長。
而且,當(dāng)檢測出中間邊緣2319時,能夠判定是Nup頁打印。
又,在圖23中,我們注目于橫方向的邊緣進(jìn)行說明,但是關(guān)于縱方向也是同樣的。
其次,我們用圖24說明更詳細(xì)的具體例。
2410表示紙整體的區(qū)域。首先,對它進(jìn)行塊選擇處理,得到塊2411~2421作為塊選擇處理結(jié)果。首先,檢測檢出的塊組的最左端,算出作為紙整體區(qū)域的左端的差分的左邊緣2422。而且,該左邊緣2422與圖23的左邊緣2320相當(dāng)。
同樣,檢測塊組的最右端,算出作為紙整體區(qū)域的右端的差分的右邊緣2423。而且,該右邊緣2423與圖23的右邊緣2321相當(dāng)。
此后,算出各塊組的橫方向的間隔,算出中間邊緣2319的中間邊緣候補(bǔ)2424、2425。在中間邊緣候補(bǔ)2424、2425中,將比左邊緣2422、右邊緣2423長的中間邊緣候補(bǔ)2424作為中間邊緣。
這樣檢測出的中間邊緣的數(shù)+1成為橫方向的頁數(shù)。在縱方向也進(jìn)行同樣的處理,將各個結(jié)果乘起來,能夠算出頁的總數(shù)。
如以上說明的那樣,如果根據(jù)實(shí)施方式3,則與實(shí)施方式2中說明的效果相同,自動地判定掃描圖像是否是Nup打印,可以不用麻煩用戶動手,判定是否是Nup打印,又,當(dāng)是Nup打印時判定與哪一頁相當(dāng)?shù)匕瑨呙鑸D像。
又,在實(shí)施方式1中,也可以在圖14的紙文檔確認(rèn)用區(qū)域1418中,用戶觸摸顯示所要的頁的范圍,指定頁,選擇處理對象的頁。這時,從步驟S3120到步驟S3140的處理,進(jìn)行只對指定的頁區(qū)域的處理。
又,即便在實(shí)施方式2、3中,也可以向用戶提示Nup打印判定結(jié)果,通過進(jìn)行同樣的手續(xù),也可以進(jìn)行只對指定的頁區(qū)域的處理。通過這樣做,用戶能夠只對Nup打印的紙文檔中的特定的頁進(jìn)行打印等處理。
又,我們說明了在圖10的色特征量信息提取處理中,提取處理對象圖像的最常出現(xiàn)的顏色作為色特征信息的例子,但是不限定于此,例如,也可以提取平均色作為色特征信息。
又,用色特征量作為圖像特征量,但是不限定于此,例如,也可以用最經(jīng)常出現(xiàn)的亮度、平均亮度等的亮度特征量、共同出現(xiàn)矩陣、對比度、熵、Gabor變換等表現(xiàn)的紋理特征量、邊緣、傅里葉描述符等表現(xiàn)的形狀特征量等多個種類的圖像特征量中的一個或?qū)⑺鼈內(nèi)我舛鄠€組合起來得到的圖像特征量。
又,進(jìn)行塊選擇處理,將處理對象的文檔分割成文字塊和圖像塊,復(fù)合地使用這些各塊的特征量進(jìn)行檢索,但是也可以將文檔整體看作1個圖像,進(jìn)行原始文檔的檢索。又,如果在精度允許的范圍內(nèi),則也可以只利用文檔中的圖像塊,進(jìn)行原始文檔的檢索。
又,將電子數(shù)據(jù)臨時變換成光柵圖像,但是當(dāng)然也可以從電子數(shù)據(jù)直接選出文字碼和圖像進(jìn)行比較。
又,采用文字碼作為文字特征量,但是也可以例如,預(yù)先進(jìn)行與單詞字典的匹配,提取單詞的品詞,將是名詞的單詞作為文字特征量。
《實(shí)施方式4》在上述實(shí)施方式1中,作為登記對象的原始文檔不是Nup打印的紙文檔(或者它的電子數(shù)據(jù)),而作為通常打印的紙文檔(或者它的電子數(shù)據(jù)),但是也能夠?qū)up打印的紙文檔(或者它的電子數(shù)據(jù))作為登記對象的原始文檔。這時,與實(shí)施方式1的檢索處理同樣,當(dāng)?shù)怯浱幚頃r,最好用戶指定Nup打印和指定包含在1張文檔(或者它的電子數(shù)據(jù))中的頁數(shù)。
這時的登記處理,例如,成為如圖25那樣。但是,在圖25中,為了使說明簡單起見,表示登記1張的Nup打印的紙文檔時的登記處理。
又,圖25的各步驟是通過將與實(shí)施方式1的圖3A和圖3B的一部分步驟大致相同的步驟組合起來實(shí)現(xiàn)的。
當(dāng)簡單地進(jìn)行說明時,在步驟S3010,輸入作為登記對象的原始文檔。在步驟S3111,判定是否由用戶指定原始文檔是否是Nup打印文檔。
而且,當(dāng)判定指定Nup打印的紙文檔時(步驟S3111中“是”),在步驟S3112,將用戶指定的1張打印紙中的頁數(shù)設(shè)定為頁數(shù)L。另一方面,當(dāng)判定不指定Nup打印文檔時(步驟S3111中“否”),在步驟S3115,將頁數(shù)L設(shè)定為1。
其次,在步驟S3113,作為初始值將表示處理對象的1個文檔中的處理頁數(shù)的變量b設(shè)定為1。其次,作為比較處理的結(jié)束判定,判定L是否大于等于b。當(dāng)L不到b時(步驟S3116中“否”),結(jié)束登記處理。
另一方面,當(dāng)L大于等于b時(步驟S3116中“是”),因?yàn)榇嬖谥刺幚淼捻摚孕羞M(jìn)到步驟S3120,對Nup的原始文檔中的第b頁的區(qū)域進(jìn)行塊選擇處理。其次,在步驟S3130,提取各塊的特征量信息存儲在存儲單元111中。而且,在步驟S3141,使b增加1,回到步驟S3116。
當(dāng)然,也可以登記多張Nup打印的紙文檔,這時,能夠通過將實(shí)施方式1的圖3A和圖3B的步驟內(nèi)的必要的步驟組合起來實(shí)現(xiàn)。
又,當(dāng)?shù)怯汵up打印的紙文檔時,既可以對登記對象的文檔圖像中包含的各個頁圖像,與在1張打印紙上打印1頁時相同地進(jìn)行圖像分辨率變換,將它作為在1張打印紙上打印1頁的文檔圖像進(jìn)行登記,也可以原封不動地登記與Nup打印的紙文檔對應(yīng)的文檔圖像《實(shí)施方式5》也可以代替實(shí)施方式3的指定Nup打印,自動判定是否是Nup打印,進(jìn)一步當(dāng)是Nup打印時,自動判定包含在1張文檔中的頁數(shù),進(jìn)行登記處理。
這時的登記處理,例如,成為如圖26那樣。但是,在圖26中,為了使說明簡單起見,表示登記1張的Nup打印的紙文檔時的登記處理。
又,圖26的各步驟是通過將與實(shí)施方式1的圖3A和實(shí)施方式2的圖20的一部分步驟大致相同的步驟組合起來實(shí)現(xiàn)的。
當(dāng)簡單地進(jìn)行說明時,在步驟S3010,輸入作為登記對象的原始文檔。在步驟S2011,自動判定原始文檔是否是Nup打印文檔。而且,當(dāng)判定是Nup打印文檔時,在步驟S3112中,將判定的頁數(shù)設(shè)定為頁數(shù)L。另一方面,當(dāng)判定不是Nup打印文檔時,在步驟S3115,將頁數(shù)L設(shè)定為1。
其次,在步驟S3113,作為初始值將表示處理對象的1個文檔中的處理頁數(shù)的變量b設(shè)定為1。其次,作為比較處理的結(jié)束判定,判定L是否大于等于b。當(dāng)L不到b時(步驟S3116中“否”),結(jié)束登記處理。
另一方面,當(dāng)L大于等于b時(步驟S3116中“是”),因?yàn)榇嬖谥刺幚淼捻?,所以行進(jìn)到步驟S3120,對Nup的原始文檔中的第b頁的區(qū)域進(jìn)行塊選擇處理。其次,在步驟S3130,提取各塊的特征量信息存儲在存儲單元111中。而且,在步驟S3141,使b增加1,回到步驟S3116。
當(dāng)然,也可以登記多張Nup打印的紙文檔,這時,也能夠通過將實(shí)施方式1的圖3A和實(shí)施方式2的圖20的步驟內(nèi)的必要的步驟組合起來實(shí)現(xiàn)。
以上,我們詳細(xì)述說了實(shí)施方式例,但是本發(fā)明可以取例如作為系統(tǒng)、裝置、方法、程序或存儲媒體等的實(shí)施方式,具體地說,既可以適用于由多個設(shè)備構(gòu)成的系統(tǒng),又,也可以適用于由一個設(shè)備構(gòu)成的裝置。
又,本發(fā)明也包含通過直接或從遠(yuǎn)距離將實(shí)現(xiàn)上述實(shí)施方式的功能的軟件的程序(在實(shí)施方式中與圖示的操作程序圖對應(yīng)的程序)供給系統(tǒng)或裝置,該系統(tǒng)或裝置的計(jì)算機(jī)讀出并實(shí)施該供給的程序碼,實(shí)現(xiàn)本發(fā)明的情形。
從而,因?yàn)橛糜?jì)算機(jī)實(shí)現(xiàn)本發(fā)明的功能處理,所以安裝在該計(jì)算機(jī)中的程序碼自身也實(shí)現(xiàn)本發(fā)明。即,本發(fā)明也包含用于實(shí)現(xiàn)本發(fā)明的功能處理的計(jì)算機(jī)程序自身。
這時,如果具有程序的功能,則也可以是目標(biāo)碼、由翻譯機(jī)實(shí)施的程序、供給OS的屏幕顯示數(shù)據(jù)等的方式。
作為用于供給程序的記錄媒體,例如,是軟盤(floppy(注冊商標(biāo))disc)、硬盤、光盤、光磁盤、MO、CD-ROM、CD-R、CD-RW、磁帶、非易失性存儲卡、ROM、DVD(DVD-ROM、DVD-R)等。
其它,作為供給程序的方法,也能夠通過用客戶計(jì)算機(jī)的瀏覽器與因特網(wǎng)的主頁連接,從該主頁將本發(fā)明的計(jì)算機(jī)程序本身或者經(jīng)過壓縮包含自動安裝功能的文檔下載到硬盤等的記錄媒體上進(jìn)行供給。又,也可以通過將構(gòu)成本發(fā)明的程序的程序碼分割成多個文檔,從不同的主頁下載各個文檔來實(shí)現(xiàn)。即,對多位用戶下載為了用計(jì)算機(jī)實(shí)現(xiàn)本發(fā)明的功能處理的程序文檔的WWW服務(wù)器也包含在本發(fā)明內(nèi)。
又,也可以通過對本發(fā)明的程序進(jìn)行密碼化,存儲在CD-ROM等的存儲媒體中分發(fā)給用戶,對于清除了預(yù)定條件的用戶,經(jīng)過因特網(wǎng)從主頁下載解除密碼化的鍵信息,使用該鍵信息,實(shí)施經(jīng)過密碼化的程序并安裝在計(jì)算機(jī)中來實(shí)現(xiàn)。
又,除了通過計(jì)算機(jī)實(shí)施讀出的程序,實(shí)現(xiàn)上述實(shí)施方式的功能外,根據(jù)該程序的指示,在計(jì)算機(jī)上工作的OS等進(jìn)行實(shí)際處理的一部分或全部,通過這些處理也能夠?qū)崿F(xiàn)上述實(shí)施方式的功能。
進(jìn)一步,將從記錄媒體讀出的程序?qū)懭朐诓迦胗?jì)算機(jī)的功能擴(kuò)展板和與計(jì)算機(jī)連接的功能擴(kuò)展單元中備有的存儲器后,根據(jù)該程序的指示,該功能擴(kuò)展板和功能擴(kuò)展單元中備有CPU等進(jìn)行實(shí)際處理的一部分或全部,通過這些處理也能夠?qū)崿F(xiàn)上述實(shí)施方式的功能。
本發(fā)明不限于上述實(shí)施方式,在本發(fā)明的精神和范圍內(nèi)能夠進(jìn)行各種不同的變化和修改。所以,為了向公眾報告本發(fā)明的范圍,我們制訂了下列權(quán)利要求書。
權(quán)利要求
1.一種圖像處理裝置,其特征在于它備有將多個電子數(shù)據(jù)作為比較目的圖像存儲起來的存儲部件;電子地讀取打印物,將該打印物的電子數(shù)據(jù)作為比較源圖像輸入的輸入部件;根據(jù)包含在上述比較源圖像中的頁圖像的數(shù)量,提取包含在上述比較源圖像中的頁圖像的處理對象區(qū)域的特征量的提取部件;和用由上述提取部件提取出的特征量,從上述存儲部件檢索與上述比較源圖像相對應(yīng)的比較目的圖像的檢索部件。
2.權(quán)利要求1所述的圖像處理裝置,其特征在于它進(jìn)一步備有對作為上述檢索部件的檢索結(jié)果的圖像進(jìn)行處理的處理部件。
3.權(quán)利要求1所述的圖像處理裝置,其特征在于它進(jìn)一步備有指定包含在上述比較源圖像中的頁圖像的頁數(shù)的指定部件;上述提取部件,對于每個根據(jù)上述指定部件所指定的頁數(shù)決定的處理對象區(qū)域,提取該處理對象區(qū)域的特征量。
4.權(quán)利要求1所述的圖像處理裝置,其特征在于上述提取部件提取上述處理對象區(qū)域的圖像特征量和文字特征量中的一個或兩個。
5.權(quán)利要求4所述的圖像處理裝置,其特征在于上述圖像特征量是色特征量、亮度特征量、紋理特征量、形狀特征量中的某一個或?qū)⑺鼈內(nèi)我舛鄠€組合起來的特征量。
6.權(quán)利要求4所述的圖像處理裝置,其特征在于上述文字特征量是文字碼。
7.權(quán)利要求1所述的圖像處理裝置,其特征在于它進(jìn)一步備有顯示上述檢測部件的檢測結(jié)果的顯示部件、和當(dāng)作為上述檢測部件的檢測結(jié)果,在上述顯示部件上顯示多個比較目的圖像時,從該多個比較目的圖像選擇所要圖像的選擇部件。
8.權(quán)利要求1所述的圖像處理裝置,其特征在于它進(jìn)一步備有當(dāng)由多個頁圖像構(gòu)成上述比較源圖像時,從該多個頁圖像指定所要的頁圖像的指定部件;上述提取部件提取包含由上述指定部件所指定的頁圖像的處理對象區(qū)域的特征量。
9.權(quán)利要求2所述的圖像處理裝置,其特征在于上述處理部件在指定的打印條件下打印由上述檢索部件檢索到的圖像。
10.權(quán)利要求1所述的圖像處理裝置,其特征在于它進(jìn)一步備有指示對上述檢索結(jié)果的圖像的處理種類的指示部件;上述處理的種類是打印、分配、存儲、編輯中的某一種。
11.權(quán)利要求1所述的圖像處理裝置,其特征在于它進(jìn)一步備有判定在上述比較源圖像中是否存在多個頁圖像的第1判定部件;和當(dāng)作為上述第1判定部件的判定結(jié)果,在上述比較源圖像中存在多個頁圖像時,判定包含在上述比較源圖像中的頁圖像的頁數(shù)的第2判定部件;上述提取部件,對于每個根據(jù)由上述第2判定部件判定的頁數(shù)決定的處理對象區(qū)域,提取該處理對象區(qū)域的特征量。
12.權(quán)利要求11所述的圖像處理裝置,其特征在于上述第1判定部件檢測包含在上述比較源圖像中的頁號碼,判定上述頁號碼是否等間隔地存在于預(yù)定區(qū)域內(nèi),來判定在上述比較源圖像中是否存在多個頁圖像。
13.權(quán)利要求11所述的圖像處理裝置,其特征在于上述第1判定部件通過檢測上述比較源圖像的最右端空白或最左端空白和除此以外的中間空白,判定檢測出的中間空白是否比上述最右端空白或上述最左端空白大,來判定在上述比較源圖像中是否存在多個頁圖像。
14.權(quán)利要求11所述的圖像處理裝置,其特征在于它進(jìn)一步備有顯示上述第1判定部件的判定結(jié)果的顯示部件、和修正上述判定結(jié)果的修正部件。
15.權(quán)利要求1所述的圖像處理裝置,其特征在于它進(jìn)一步備有輸入上述比較源圖像的輸入部件;和指定由上述輸入部件輸入的包含在比較源圖像中的頁圖像的頁數(shù)的指定部件,上述提取部件,對于每個根據(jù)由上述指定部件指定的頁數(shù)所決定的處理對象區(qū)域,提取該處理對象區(qū)域的特征量,上述存儲部件對應(yīng)地存儲上述比較目的圖像和由上述提取部件提取的特征量。
16.權(quán)利要求1所述的圖像處理裝置,其特征在于它進(jìn)一步備有輸入上述比較目的圖像的輸入部件;判定在上述比較目的圖像中是否存在多個頁圖像的第1判定部件;和當(dāng)作為上述第1判定部件的判定結(jié)果,在上述比較目的圖像中存在多個頁圖像時,判定包含在上述比較源圖像中的頁圖像的頁數(shù)的第2判定部件;上述提取部件,對于每個根據(jù)由上述第2判定部件判定的頁數(shù)決定的處理對象區(qū)域,提取該處理對象區(qū)域的特征量;上述存儲部件對應(yīng)地存儲上述比較目的圖像和上述提取部件提取的特征量。
17.一種圖像處理裝置的控制方法,其特征在于它備有輸入通過電子地讀取打印物得到的電子數(shù)據(jù)作為比較源圖像的輸入步驟;根據(jù)包含在上述比較源圖像中的頁圖像的數(shù)量,提取包含在上述比較源圖像中包含的頁圖像的處理對象區(qū)域的特征量的提取步驟;和用由上述提取步驟提取出的特征量,從作為比較目的圖像存儲在存儲媒體中的多個電子數(shù)據(jù),檢索與上述比較源圖像相對應(yīng)的比較目的圖像的檢索步驟。
18.一種用計(jì)算機(jī)實(shí)現(xiàn)圖像處理控制的程序,其特征在于它備有輸入通過電子地讀取打印物得到的電子數(shù)據(jù)作為比較源圖像的輸入步驟的程序碼;根據(jù)包含在上述比較源圖像中的頁圖像的數(shù)量,提取包含在上述比較源圖像中所包含的頁圖像的處理對象區(qū)域的特征量的提取步驟的程序碼;和用由上述提取步驟提取的特征量,從作為比較目的圖像存儲在存儲媒體中的多個電子數(shù)據(jù),檢索與上述比較源圖像相對應(yīng)的比較目的圖像的檢索步驟的程序碼。
全文摘要
本發(fā)明提供圖像處理裝置及其控制方法、程序。其中電子地讀取打印物,輸入該打印物的電子數(shù)據(jù)作為比較源圖像。提取包含在比較源圖像中包含的頁圖像的處理對象區(qū)域的特征量。用提取的特征量,從存儲媒體檢索與上述比較源圖像對應(yīng)的比較目的圖像。而且,對作為檢索結(jié)果的圖象進(jìn)行處理。
文檔編號H04N1/32GK1550971SQ20041004533
公開日2004年12月1日 申請日期2004年5月20日 優(yōu)先權(quán)日2003年5月20日
發(fā)明者東條洋 申請人:佳能株式會社