專利名稱:文檔圖像數(shù)據(jù)提供系統(tǒng)、裝置和方法,及信息處理裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明總的涉及文檔圖像數(shù)據(jù)的處理,更特別地,涉及文檔圖像數(shù)據(jù)提供 系統(tǒng)、文檔圖像數(shù)據(jù)提供裝置、信息處理裝置、文檔圖像數(shù)據(jù)提供方法、信息 處理方法、文檔圖像數(shù)據(jù)提供程序以及信息處理程序
背景技術(shù):
近些年,通過計算機(jī)相關(guān)技術(shù)的改善和辦公室網(wǎng)絡(luò)環(huán)境的維護(hù),文檔數(shù)據(jù) 的電子化得到顯著地發(fā)展。通常,當(dāng)重新使用文檔圖像的電子數(shù)據(jù)時,可以想 象到編輯應(yīng)用程序的使用可以允許文檔的需要部分的數(shù)據(jù)被從文檔圖像數(shù)據(jù)
中切除,并且OCR (光學(xué)字符讀出器)應(yīng)用程序的使用允許文檔圖像數(shù)據(jù)被 轉(zhuǎn)換為用于重新使用文檔圖像數(shù)據(jù)的字符代碼。
日本公開專利申請第2007-200014號公開了一種信息處理裝置,其被布置 為接收構(gòu)成電子文檔圖像數(shù)據(jù)的兩個或多個對象的選擇,將選擇的對象統(tǒng)一為 一個對象,并且將該統(tǒng)一的對象與電子文檔圖像數(shù)據(jù)相關(guān)聯(lián)以對其進(jìn)行管理。
然而,當(dāng)打算僅重新使用文檔圖像數(shù)據(jù)的需要的部分的數(shù)據(jù)時,日本公開 專利申請第2007-200014號中的信息處理裝置需要通過執(zhí)行手動操作來切除用 于重新使用的需要的部分的數(shù)據(jù),該手動操作是復(fù)雜的。
發(fā)明內(nèi)容
在本發(fā)明的一個方面,本發(fā)明提供了一種文檔圖像數(shù)據(jù)提供系統(tǒng)、文檔圖 像數(shù)據(jù)提供裝置、信息處理裝置、文檔圖像數(shù)據(jù)提供方法、信息處理方法、文 檔圖像數(shù)據(jù)提供程序以及信息處理程序,其可以容易地重新使用文檔圖像數(shù) 據(jù)。
在解決或減少一個或多個上述問題的本發(fā)明的實(shí)施例中,本發(fā)明提供了一 種文檔圖像數(shù)據(jù)提供裝置,其向信息處理裝置提供文檔圖像數(shù)據(jù),該文檔圖像 數(shù)據(jù)提供裝置包括文檔圖像輸入單元,配置用于輸入文檔圖像數(shù)據(jù);區(qū)域識別單元,配置用于識別在構(gòu)成輸入的文檔圖像數(shù)據(jù)的文檔圖像要素中包含文本 數(shù)據(jù)的文檔圖像要素的文本區(qū)域,以及包含除了文本數(shù)據(jù)之外的數(shù)據(jù)的文檔圖 像要素的另一區(qū)域;文本數(shù)據(jù)獲取單元,配置用于獲取在由區(qū)域識別單元識別
的文本區(qū)域中包含的文本數(shù)據(jù);以及提供單元,配置用于響應(yīng)于從信息處理裝 置接收到的文檔圖像數(shù)據(jù)請求,向信息處理裝置提供從輸入的文檔圖像數(shù)據(jù)生 成的、具有比輸入的文檔圖像數(shù)據(jù)的分辨率更低的分辨率的圖像數(shù)據(jù),以及由 文本數(shù)據(jù)獲取單元獲取的文本數(shù)據(jù)。
在解決或減少一個或多個上述問題的本發(fā)明的實(shí)施例中,本發(fā)明提供了 一 種信息處理裝置,其連接至文檔圖像數(shù)據(jù)提供裝置,該信息處理裝置包括獲 取單元,配置用于從文檔圖像數(shù)據(jù)提供裝置獲取輸入的文檔圖像數(shù)據(jù)和在識別 的文本區(qū)域中包含的文本數(shù)據(jù);文檔圖像要素選擇單元,配置用于從輸入的文 檔圖像數(shù)據(jù)中選擇構(gòu)成輸入的文檔圖像數(shù)據(jù)的文檔圖像要素;以及顯示控制單 元,配置用于當(dāng)由文檔圖像要素選擇單元選擇的文檔圖像要素的要素數(shù)據(jù)是文 本數(shù)據(jù)時,在顯示裝置上顯示對應(yīng)于由獲取單元獲取的文本數(shù)據(jù)中的要素數(shù)據(jù) 的文本數(shù)據(jù)。
本發(fā)明的其他目的、特征和優(yōu)點(diǎn)將通過結(jié)合附圖讀取下面的詳細(xì)描述而變 得更加明顯。
圖1是表示本發(fā)明的實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)的組成的圖表。
圖2是表示本發(fā)明的實(shí)施例的多功能外圍設(shè)備(MFP)的硬件組成的方框圖。
圖3是表示本發(fā)明的實(shí)施例的信息處理裝置的硬件組成的方框圖。 圖4是表示本發(fā)明的第一實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)中的多功能外 圍設(shè)備(MFP)和信息處理設(shè)備的每一個的功能組成的方框圖。 圖5是表示文檔表的數(shù)據(jù)結(jié)構(gòu)的例子的圖表。 圖6是表示頁面表的數(shù)據(jù)結(jié)構(gòu)的例子的圖表。 圖7是表示要素表的數(shù)據(jù)結(jié)構(gòu)的例子的圖表。
圖8是用于說明第一實(shí)施例的由文檔圖像數(shù)據(jù)提供系統(tǒng)進(jìn)行的文檔圖像 數(shù)據(jù)的注冊的流程圖。
圖9是用于說明第一實(shí)施例的由文檔圖像數(shù)據(jù)提供系統(tǒng)進(jìn)行的文檔圖像 數(shù)據(jù)的顯示的流程圖。
圖IO是表示顯示屏幕的例子的圖表,其中在顯示裝置上顯示文檔圖像數(shù) 據(jù)的列表。
圖ll是表示顯示屏幕的例子的圖表,其中在顯示裝置上顯示預(yù)覽圖像。 圖12是用于說明第一實(shí)施例的由信息處理裝置進(jìn)行的文檔圖像的編輯的 流程圖。
圖13是表示顯示屏幕的例子的圖表,其中顯示預(yù)覽圖像和編輯屏幕。 圖14是表示本發(fā)明的第二實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)的組成的方框圖。
具體實(shí)施例方式
下面參考附圖描述本發(fā)明的實(shí)施例。
在本發(fā)明的實(shí)施例的文檔圖^象數(shù)據(jù)提供系統(tǒng)中,如果輸入文檔圖像數(shù)據(jù), 文檔圖像數(shù)據(jù)提供裝置識別構(gòu)成文檔圖像數(shù)據(jù)的文檔圖像要素的各個區(qū)域。并 且如果在通過網(wǎng)絡(luò)連接至文檔圖像數(shù)據(jù)提供裝置的信息處理裝置中從文檔圖 像選擇了文檔圖像要素,文檔圖像數(shù)據(jù)提供裝置從文檔圖像數(shù)據(jù)中提取選擇的 文檔圖像要素的要素數(shù)據(jù),并且將要素數(shù)據(jù)提供給信息處理裝置。
圖1表示本發(fā)明的實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)100的組成。在這個實(shí) 施例中,文檔圖像數(shù)據(jù)提供裝置由作為圖像處理裝置的多功能外圍設(shè)備(MFP) 構(gòu)成,其能夠存儲文檔圖像數(shù)據(jù)并且具有多重功能,包括掃描儀功能、復(fù)印機(jī) 功能以及傳真機(jī)功能,并且信息處理裝置由具有處理單元和存儲單元的通用計 算機(jī)構(gòu)成。
圖1的文檔圖像數(shù)據(jù)提供系統(tǒng)100由通過網(wǎng)絡(luò)400相互連接的多功能外圍 設(shè)備(MFP ) 200和信息處理裝置300構(gòu)成。
在文檔圖像數(shù)據(jù)提供系統(tǒng)100中,如果文檔圖像數(shù)據(jù)IO被輸入并被讀出 為文檔圖像數(shù)據(jù)10A, MFP 200識別構(gòu)成文檔圖像數(shù)據(jù)10A的文檔圖像要素 11、 12和13的各自區(qū)域。在這個時候,MFP200識別包含文本數(shù)據(jù)的文檔圖 《象要素的區(qū)域和包括除了文本數(shù)據(jù)之外的圖像數(shù)據(jù)的文檔圖像要素的區(qū)域。
上述文本數(shù)據(jù)表示包含在文檔圖像數(shù)據(jù)10A中的一套字符代碼。在圖1
的例子中,MFP200識別構(gòu)成文檔圖像數(shù)據(jù)IOA的文檔圖像要素11、 12和13 的各自區(qū)域。此外,MFP200將文檔圖像數(shù)據(jù)IOA和文檔圖像要素11、 12和 13相關(guān)聯(lián),并且在MFP200中存儲它們。
當(dāng)在信息處理裝置300中從文檔圖4象要素11、 12和13之中選擇除了包含 文本數(shù)據(jù)的文檔圖像要素之外的文檔圖像要素時,MFP 200從文檔圖像數(shù)據(jù) 10A中提取對應(yīng)于所選擇的文檔圖像要素的要素數(shù)據(jù),并且將其提供給信息處 理裝置300 (輸出)。
另一方面,稍后將描述當(dāng)在信息處理裝置300中選擇包含文本數(shù)據(jù)的文檔 圖像要素時MFP 300執(zhí)行的過程。
信息處理裝置300獲取MFP 200提供的要素數(shù)據(jù),使得信息處理裝置300 可以使用獲取的要素數(shù)據(jù)來編輯文檔圖像數(shù)據(jù)IOA。
在這個實(shí)施例中,當(dāng)文檔圖像要素的區(qū)域是矩形的形式時,可以通過獲取 該區(qū)域(矩形)的左上角的點(diǎn)的位置信息以及該區(qū)域(矩形)的右下角的點(diǎn)的 位置信息來執(zhí)行文檔圖像要素的區(qū)域的識別。另一方面,當(dāng)文檔圖像要素的區(qū) 域不是矩形的形式時,可以通過獲取圍繞文檔圖像要素的矩形的左上角和右下 角的位置信息來執(zhí)行區(qū)域的識別。
在這個實(shí)施例中,可以通過生成從文檔圖像數(shù)據(jù)IO選擇的文檔圖像要素 的要素數(shù)據(jù)的復(fù)本數(shù)據(jù)并傳遞該復(fù)本數(shù)據(jù)來執(zhí)行要素數(shù)據(jù)的提取。
文檔圖像要素可以是包含在文檔圖像中的圖像、文本、圖形、表格等。要 素數(shù)據(jù)可以是對應(yīng)于每個文檔圖像要素的數(shù)據(jù)。例如,當(dāng)在文檔圖像數(shù)據(jù)中包 含圖像和文本時,文檔圖像要素是圖像和文本。當(dāng)文檔圖像要素是圖像時,對 應(yīng)的要素數(shù)據(jù)被獲取為圖像數(shù)據(jù)。當(dāng)文檔圖像要素是文本時,對應(yīng)的要素數(shù)據(jù) 被獲取為文本數(shù)據(jù)。例如,當(dāng)文檔圖像要素是圖形和表格時,圖形和表格被識 別為圖像,在這種情況下的要素數(shù)據(jù)被獲取為指示圖形和表格的圖像數(shù)據(jù)。
表1表示文檔圖像要素的種類和被獲取的對應(yīng)的要素數(shù)據(jù)之間的關(guān)系。如 表1所示,當(dāng)文檔圖像要素是圖像、圖形或表格時,在這個實(shí)施例中要素數(shù)據(jù) 被獲取為圖像數(shù)據(jù)。當(dāng)文檔圖像要素是文本時,在這個實(shí)施例中要素數(shù)據(jù)被獲 取為文本數(shù)據(jù)。
表l
文檔圖〗象要素的種類 要素數(shù)據(jù)
圖像 圖像數(shù)據(jù)
圖形 圖像數(shù)據(jù)
表格 圖像數(shù)據(jù)
文本 文本數(shù)據(jù)
圖2表示本發(fā)明的實(shí)施例的多功能外圍設(shè)備(MFP) 200的硬件組成。 MFP200包括掃描儀21、繪圖儀22、驅(qū)動裝置23、輔助存儲器24、存儲
器裝置25、處理單元26、接口裝置27以及操作面板28,其通過總線B分別
相互連接。
掃描儀21包括掃描儀引擎和引擎控制部,并且這個掃描儀21被用于通過 讀取其上打印了文檔圖像的打印介質(zhì)(例如,打印頁)來獲得文檔圖像數(shù)據(jù)。
繪圖儀22包括繪圖儀引擎和引擎控制部,并且這個繪圖儀22被用于輸出 圖像數(shù)據(jù)至打印介質(zhì),例如打印頁。
接口裝置27包括調(diào)制解調(diào)器或LAN卡,并且這個接口裝置27被用于以 網(wǎng)絡(luò)400連接MFP 200。
操作面板28是用于操作MFP 200的器件,并且這個操作面板28包括觸 摸板,其提供有顯示功能和輸入功能。
本發(fā)明的實(shí)施例的圖像處理程序由用于控制MFP 200的各種程序的至少 一部分構(gòu)成。例如,通過將記錄介質(zhì)29分配給MFP 200或者從網(wǎng)絡(luò)400向 MFP 200下載程序來提供圖像處理程序。
其上存儲圖像處理程序的記錄介質(zhì)29的例子可以包括各種類型的記錄介 質(zhì)其上光學(xué)、電學(xué)和磁性記錄信息的記錄介質(zhì),例如CD-ROM、軟盤或磁 光盤,或者其上電學(xué)記錄信息的半導(dǎo)體存儲器,例如ROM或閃存存儲器。
當(dāng)在驅(qū)動裝置23中設(shè)置其上存儲圖像處理程序的記錄介質(zhì)29時,來自記 錄介質(zhì)29的圖像處理程序通過驅(qū)動裝置23被安裝在輔助存儲器24中。從網(wǎng) 絡(luò)400下載的圖像處理程序通過接口裝置27被安裝在輔助存儲器24中。
MFP 200中的輔助存儲器24存儲安裝的圖像處理程序、必要的文件和數(shù) 據(jù)。存儲器裝置25從輔助存儲器24讀取圖像處理程序,并且在啟動MFP200 的時候?qū)D像處理程序存儲在MFP 200中。處理單元26根據(jù)存儲在存儲器裝
置25中的圖像處理程序來執(zhí)行各種將在稍后描述的過程。
圖3表示本發(fā)明的實(shí)施例的信息處理裝置300的硬件組成。如圖3所示, 信息處理裝置300包括輸入裝置31、輸出裝置32、驅(qū)動裝置33、輔助存^f渚器 34、存儲器裝置35、處理單元36以及接口裝置37,其通過總線B分別相互 連接。
輸入裝置31包括鍵盤、鼠標(biāo)等,并且這個輸入裝置31被用于輸入各種信 號。顯示裝置32包括顯示單元等,并且這個顯示裝置32被用于顯示各種窗口 、 數(shù)據(jù)等。接口裝置37包括調(diào)制解調(diào)器或LAN卡,并且這個接口裝置37被用 于以網(wǎng)絡(luò)400連接信息處理裝置300。
本發(fā)明的實(shí)施例的信息處理程序由用于控制信息處理裝置300的各種程 序的至少一部分構(gòu)成。例如,例如,通過將記錄介質(zhì)38分配給信息處理裝置 300或者從網(wǎng)絡(luò)400向信息處理裝置300下載程序來提供信息處理程序。
其上存儲信息處理程序的記錄介質(zhì)38的例子可以包括各種類型的記錄介 質(zhì)其上光學(xué)、電學(xué)和磁性記錄信息的記錄介質(zhì),例如CD-ROM、軟盤或不茲 光盤,或者其上電學(xué)記錄信息的半導(dǎo)體存儲器,例如ROM或閃存存儲器。
當(dāng)在驅(qū)動裝置33中設(shè)置其上存儲信息處理程序的記錄介質(zhì)38時,來自記 錄介質(zhì)38的信息處理程序通過驅(qū)動裝置33被安裝在輔助存儲器34中。從網(wǎng) 絡(luò)400下載的信息處理程序通過接口裝置37被安裝在輔助存儲器34中。
信息處理裝置300中的輔助存儲器34存儲安裝的信息處理程序、必要的 文件和數(shù)據(jù)。存儲器裝置35從輔助存儲器34讀取信息處理程序,并且在啟動 信息處理裝置300的時候?qū)⑿畔⑻幚沓绦虼鎯υ谛畔⑻幚硌b置300中。處理單 元36根據(jù)存儲在存儲器裝置35中的信息處理程序來執(zhí)行各種將在稍后描述的 過程。
圖4表示本發(fā)明的第一實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)中的多功能外圍 設(shè)備(MFP)和信息處理裝置的每一個的功能組成。
這個實(shí)施例的MFP 200包括文檔圖像輸入單元205 、區(qū)域識別單元210、 文本數(shù)據(jù)獲取單元215、圖像生成單元220、存儲控制單元230、列表提供單 元240、預(yù)覽圖像提供單元250、要素數(shù)據(jù)提取單元260以及要素數(shù)據(jù)提供單 元270。 MFP 200進(jìn)一步包括數(shù)據(jù)庫280,其被布置在輔助存儲器240中。
文檔圖像輸入單元205掃描文檔圖像(原始文檔)并且將對應(yīng)的文檔圖像
輸入到MFP200中作為文檔圖像數(shù)據(jù)。
文檔圖像識別單元210識別構(gòu)成文檔圖像數(shù)據(jù)的文檔圖像要素的各自區(qū) 域。詳細(xì)地,區(qū)域識別單元210基于包含在輸入的文檔圖像數(shù)據(jù)中的數(shù)據(jù)的特 征來確定各自區(qū)域的每一個中包含文本數(shù)據(jù)、圖形數(shù)據(jù)、表格數(shù)據(jù)、照片數(shù)據(jù) 等的哪一個,并且基于在那個區(qū)域中的數(shù)據(jù)的特征來確定每個區(qū)域中的數(shù)據(jù)的 種類,使得識別文檔圖像要素。
這個實(shí)施例的區(qū)域識別單元210將包含文本數(shù)據(jù)的文檔圖像要素的區(qū)域 識別為文本區(qū)域,并且將除了包含文本數(shù)據(jù)的文檔圖像要素之外的文檔圖像要 素的區(qū)域識別為圖像區(qū)域。在這個實(shí)施例的區(qū)域識別單元210中,文檔圖像要 素的區(qū)域信息可以基于文檔圖像數(shù)據(jù)中的文檔圖像要素的坐標(biāo)信息來獲得。在 相關(guān)技術(shù)中已知區(qū)域識別的方法,將省略其詳細(xì)描述。
文本數(shù)據(jù)獲取單元215從由區(qū)域識別單元210識別為文本區(qū)域的區(qū)域的文 檔圖像要素中獲取文本數(shù)據(jù)。例如,通過使用MFP 200的OCR (光學(xué)字符識 別)功能來提供文檔數(shù)據(jù)獲取單元215。由文檔數(shù)據(jù)獲取單元215獲取的文本 數(shù)據(jù)被存儲在稍后將描述的數(shù)據(jù)庫280中。
圖像生成單元220通過使用來自文檔圖像輸入單元205的輸入的文檔圖像 數(shù)據(jù)來生成具有分辨率低于輸入的文檔圖像數(shù)據(jù)的文檔圖像數(shù)據(jù)。
這個實(shí)施例的圖像生成單元220第一文檔圖像數(shù)據(jù)和第二文檔圖像數(shù)據(jù), 第一文檔圖像數(shù)據(jù)的分辨率低于輸入的文檔圖像數(shù)據(jù)的分辨率,第二文檔圖像 數(shù)據(jù)的分辨率低于第一文檔圖像數(shù)據(jù)的分辨率。稍后將描述第一文檔圖像數(shù)據(jù) 和第二文檔圖像數(shù)據(jù)的細(xì)節(jié)。
存儲控制單元230控制向稍后描述的數(shù)據(jù)庫280中存儲文檔圖像數(shù)據(jù)。列 表提供單元240從數(shù)據(jù)庫280獲取存儲在數(shù)據(jù)庫280中的文檔圖像數(shù)據(jù)的列 表,并且將該列表提供(輸出)給信息處理裝置300。
預(yù)覽圖像提供單元250從數(shù)據(jù)庫280獲取選擇的預(yù)覽圖像的數(shù)據(jù),并且將 該選擇的預(yù)覽圖像數(shù)據(jù)提供(輸出)給信息處理裝置300。預(yù)覽圖像提供單元 250與預(yù)覽圖像數(shù)據(jù)一起向信息處理裝置300提供包含在文檔圖像數(shù)據(jù)(其為 預(yù)覽圖像的源)中的文本數(shù)據(jù)以及在文檔圖像數(shù)據(jù)中識別的文檔圖像要素的區(qū) 域信息。
要素數(shù)據(jù)提取單元260從輸入的文檔圖像數(shù)據(jù)中提取對應(yīng)于選擇的文檔 圖像要素的要素數(shù)據(jù)。要素數(shù)據(jù)提供單元270向信息處理裝置300提供(輸出) 由要素數(shù)據(jù)提取單元260提取的要素數(shù)據(jù)。
數(shù)據(jù)庫280包括元數(shù)據(jù)部281,其中存儲文檔圖像數(shù)據(jù)的元數(shù)據(jù),以及文 檔圖像數(shù)據(jù)部282 ,其中存儲文檔圖像數(shù)據(jù)。
元數(shù)據(jù)部281包括文檔表283,其中存儲指示文檔圖像數(shù)據(jù)的屬性的信息 (目錄信息);頁面表284,其中存儲指示包含在文檔圖像數(shù)據(jù)中的頁面的信 息;以及要素表285,其中存儲每個文檔圖像要素的信息。
圖5表示文檔表283的數(shù)據(jù)結(jié)構(gòu)的例子。在圖5的文檔表283中,存儲輸 入的文檔圖像數(shù)據(jù)的目錄信息。詳細(xì)地,用于識別文檔圖像數(shù)據(jù)的文檔ID、 廠家文檔圖像數(shù)據(jù)的日期、文檔圖像數(shù)據(jù)的頁數(shù)以及文檔圖像數(shù)據(jù)的標(biāo)題被相 關(guān)聯(lián)并存儲在文檔表283中。
在這個實(shí)施例的文檔表283中,當(dāng)從例如存儲器卡的記錄介質(zhì)直接輸入文 檔圖像數(shù)據(jù)時,文檔圖像數(shù)據(jù)被直接存儲在文檔表283中。
在這個實(shí)施例中,當(dāng)掃描儀21使用ADF (自動文檔饋送器)功能來共同 地讀取兩頁或多頁文檔圖像時,可以將兩頁或多頁文檔圖像轉(zhuǎn)換為允許多個圖 像作為一個文件被處理的格式的文檔圖像數(shù)據(jù),并且隨后可以將該文檔圖像數(shù) 據(jù)存儲在文檔表283中。
在頁面表284中,存儲用于管理各自頁面的每一個的文檔圖像數(shù)據(jù)的信 息。圖6表示頁面表284的數(shù)據(jù)結(jié)構(gòu)的例子。
在圖6的頁面表284中,頁面ID、文檔ID、頁碼、縮略圖像、預(yù)覽圖像 和文本數(shù)據(jù)(由文本數(shù)據(jù)獲取單元215獲取)被相關(guān)聯(lián)并存儲。頁碼ID是用 于識別文檔圖像數(shù)據(jù)的每頁的標(biāo)識符。文檔ID是用于識別包含由頁碼ID指定 的頁碼的文檔圖像數(shù)據(jù)的標(biāo)識符。頁碼是在由文檔ID指定的文檔圖像數(shù)據(jù)中 的對應(yīng)頁的號碼。縮略圖像是對應(yīng)頁的縮略圖像。預(yù)覽圖像是對應(yīng)頁的預(yù)覽圖 像。
下面將給出縮略圖像和預(yù)覽圖像的描述。在這個實(shí)施例中,如果文檔圖l象 數(shù)據(jù)被輸入,圖像生成單元220生成文檔圖像數(shù)據(jù)(預(yù)覽圖像數(shù)據(jù)),用于預(yù)
覽圖像,預(yù)覽圖像的分辨率低于包含在文檔圖像數(shù)據(jù)中的各自頁面的每一個的 文檔圖像數(shù)據(jù)的分辨率。這個預(yù)覽圖像數(shù)據(jù)被稱為第 一文檔圖像數(shù)據(jù)。
此外,圖像生成單元220生成文檔圖像數(shù)據(jù)(縮略圖像數(shù)據(jù)),用于縮略 圖像,該縮略圖像的分辨率還低于用于預(yù)覽圖像的文檔圖像數(shù)據(jù)的分辨率。這 個縮略圖像數(shù)據(jù)被稱為第二文檔圖像數(shù)據(jù)。
在這個實(shí)施例的MFP 200中,如果文檔圖像數(shù)據(jù)被輸入并且生成預(yù)覽圖 像數(shù)據(jù)和縮略圖像數(shù)據(jù),存儲控制單元230在頁面表284的對應(yīng)位置存儲預(yù)覽 圖像數(shù)據(jù)和縮略圖像數(shù)據(jù)。
當(dāng)掃描儀21掃描文檔圖像時獲得的文檔圖像數(shù)據(jù)被存儲在數(shù)據(jù)庫280的 文檔圖像數(shù)據(jù)部282。在文檔圖像數(shù)據(jù)部282中,該文檔圖像數(shù)據(jù)通過包含在 文檔圖像數(shù)據(jù)中的頁碼ID與元數(shù)據(jù)部281的頁面表284相關(guān)聯(lián)。
這個實(shí)施例的存儲在文檔圖像數(shù)據(jù)部282的文檔圖像數(shù)據(jù)以當(dāng)掃描儀21 掃描文檔圖像時獲得的分辨率相同的分辨率存儲。由此,即使在文檔圖像數(shù)據(jù) 被復(fù)制到另 一個應(yīng)用之后,存儲在文檔圖像數(shù)據(jù)部282中的文檔圖像數(shù)據(jù)允許 以足夠的可重用的分辨率來再現(xiàn)圖像。
在這個實(shí)施例中,當(dāng)存儲在文檔圖像數(shù)據(jù)部282中的文檔圖像數(shù)據(jù)的分辨 率等于600dpi時,優(yōu)選地預(yù)覽圖像數(shù)據(jù)的分辨率被設(shè)置為大約100dpi,并且 縮略圖像數(shù)據(jù)的圖像尺寸被統(tǒng)一并被設(shè)置為大約100像素xl00像素,以改善 列表特性。
此外,除了縮略圖像數(shù)據(jù)和預(yù)覽圖像數(shù)據(jù)之外,具有不同分辨率的頁面圖 像數(shù)據(jù)可以被進(jìn)一步存儲在頁面表284中。在這種情況下頁面圖像數(shù)據(jù)的分辨 率可以被文檔圖像數(shù)據(jù)提供系統(tǒng)的系統(tǒng)管理員預(yù)先設(shè)置。在這種情況下,如果 文檔圖像數(shù)據(jù)被輸入,除了縮略圖像數(shù)據(jù)和預(yù)覽圖像數(shù)據(jù)之外,圖像生成單元 220生成具有設(shè)置的分辨率的頁面圖像數(shù)據(jù)。存儲控制單元230將生成的頁面 圖像數(shù)據(jù)與頁面ID相關(guān)4關(guān),并且將其存儲頁面表284中。
圖7表示要素表285的數(shù)據(jù)結(jié)構(gòu)的例子。
在要素表285中存儲基于文檔圖像輸入單元205輸入的文檔圖像數(shù)據(jù),通 過區(qū)域識別單元210識別文檔圖像要素而獲得的各自文檔圖像要素的每一個 的信息。200810213147.3
說明書第10/19頁
在圖7的要素表285中,作為用于識別文檔圖像要素的區(qū)域的標(biāo)識符的區(qū) 域ID、識別包含文檔圖像要素的文檔圖像數(shù)據(jù)的文檔ID、識別包含文檔圖像 要素的頁面的頁面ID 、指示文檔圖像數(shù)據(jù)中的文檔圖像要素的位置的信息(坐 標(biāo)信息)以及文檔圖像要素的種類被相關(guān)聯(lián)并存儲在要素表285中。
參考圖4,將描述這個實(shí)施例的構(gòu)成文檔圖像數(shù)據(jù)提供系統(tǒng)100的一部分 的信息處理裝置300。
信息處理裝置300包括列表獲取單元310、預(yù)覽圖像獲取單元320、區(qū)域 顯示單元325、文檔圖像要素選擇單元330、要素數(shù)據(jù)獲取單元340、范圍選 擇單元342、選擇的范圍提取單元344、顯示控制單元350以及編輯單元360。
列表獲耳又單元310獲取存儲在MFP 200的數(shù)據(jù)庫280中的文檔圖像數(shù)據(jù) 的列表。預(yù)覽圖像獲取單元320獲取預(yù)覽圖像數(shù)據(jù),對應(yīng)于從列表獲取單元 310獲取的文檔圖像數(shù)據(jù)的列表中選擇的預(yù)覽圖像。此外,預(yù)覽圖像獲取單元 320獲取包含在對應(yīng)于預(yù)覽圖像數(shù)據(jù)的文檔圖像數(shù)據(jù)中的文本數(shù)據(jù),以及在文 檔圖像數(shù)據(jù)中識別的文檔圖像要素的區(qū)域信息。
區(qū)域顯示單元325當(dāng)顯示獲取的預(yù)覽圖像數(shù)據(jù)時執(zhí)行各自的文檔圖像要 素的每一個的區(qū)域的顯示。文檔圖像要素選擇單元330從文檔圖像中選擇文檔 圖像要素。要素數(shù)據(jù)獲取單元340獲取對應(yīng)于由文檔圖像要素選擇單元330 選擇的文檔圖像要素的文檔數(shù)據(jù)。
范圍選擇單元342選擇要被從文本數(shù)據(jù)中提取的文本數(shù)據(jù)的范圍,該文本 數(shù)據(jù)是由預(yù)覽圖像獲取單元320與預(yù)覽圖像同步獲得的。稍后描述提取文本數(shù) 據(jù)的細(xì)節(jié)。
選擇的范圍提取單元344從預(yù)覽圖像獲取單元320獲取的文本數(shù)據(jù)中提取 由范圍選擇單元342選擇的范圍的文本數(shù)據(jù)。
顯示控制單元350控制在顯示裝置32上顯示圖像。編輯單元360對于有 要素數(shù)據(jù)獲取單元340獲取的要素數(shù)據(jù)執(zhí)行編輯操作。
例如,編輯單元360可以由安裝在信息處理裝置300中的編輯應(yīng)用構(gòu)成, 以允許編輯單元360編輯要素數(shù)據(jù)。
在這個實(shí)施例中,列表獲取單元310、預(yù)覽圖像獲取單元320、文檔圖像 要素選擇單元330、要素數(shù)據(jù)獲取單元340、范圍選擇單元342、選擇的范圍
提取單元344以及顯示控制單元350由在信息處理裝置300中布置的Web瀏 覽器370構(gòu)成。
下面將參考圖8和圖9描述這個實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)100的操作。
圖8是用于說明第 一 實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)100的文檔圖像數(shù)據(jù) 的注冊(累積)的流程圖。
當(dāng)文檔圖像數(shù)據(jù)由MFP 200的文檔圖^象輸入單元205輸入時,區(qū)域識別 單元210識別每個文檔圖像要素的區(qū)域(步驟S801)。在步驟S801中,在文 檔圖像要素的各自區(qū)域被識別之后,存儲控制單元230將包含在文檔圖像數(shù)據(jù) 中的文檔圖像數(shù)據(jù)的目錄(bibliographic )消息存儲到文檔表283中。
此外,在步驟S801中,存儲控制單元230將包含在文檔圖像數(shù)據(jù)中的各 自頁面的每一個的信息存儲在頁面表284中。存儲控制單元230將各自識別的 文檔圖像要素的每一個的信息存儲在要素表285中。此外,存儲控制單元230 將文檔圖像數(shù)據(jù)存儲在文檔圖像數(shù)據(jù)部282中。
在步驟S801之后進(jìn)行步驟S802, MFP 200使得文本數(shù)據(jù)獲取單元215獲 取文本數(shù)據(jù),其為對應(yīng)于在步驟S801中從文檔圖像要素中被識別為文本區(qū)域 的文檔圖像要素的要素數(shù)據(jù)。在步驟S802之后進(jìn)行步驟S803,存儲控制單元 230將由文本數(shù)據(jù)獲取單元215獲取的文本數(shù)據(jù)存儲到頁面表284中。
在步驟S803之后進(jìn)行步驟S804,圖像生成單元220基于在步驟S801輸 入的文檔圖像數(shù)據(jù)來生成預(yù)覽圖像數(shù)據(jù)和縮略圖像數(shù)據(jù)。詳細(xì)地,圖像生成單 元220壓縮文檔圖像數(shù)據(jù)并且生成預(yù)覽圖像數(shù)據(jù)和縮略圖像數(shù)據(jù)。
在步驟S802之后進(jìn)行步驟S803,存儲控制單元230將生成的預(yù)覽圖像數(shù) 據(jù)和縮略圖像數(shù)據(jù)存儲到頁面表284中。
以這種方式,文檔圖像數(shù)據(jù)被注冊和存儲在這個實(shí)施例的MFP200中。
然后將描述由這個實(shí)施例的信息處理裝置300進(jìn)行文檔圖像數(shù)據(jù)的顯示。
圖9是用于說明由第 一實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)100進(jìn)行文檔圖像 數(shù)據(jù)的顯示的流程圖。
在步驟S901中,信息處理裝置300接收文檔圖像數(shù)據(jù)的列表的獲取的命 令,并且控制進(jìn)行至步驟S902。
在步驟S902中,響應(yīng)于從信息處理裝置300接收的列表獲取命令,MFP 200使得列表提供單元240將存儲在數(shù)據(jù)庫280中的文檔圖像數(shù)據(jù)的列表提供 給信息處理裝置300。在這個時候,列表提供單元240獲取存儲在頁面表284 中的縮略圖像數(shù)據(jù)的列表作為文檔圖像數(shù)據(jù)的列表,并且將其輸出給信息處理 裝置300。
在步驟S902之后進(jìn)行步驟S903,信息處理裝置300使得列表獲取單元 310獲取從MFP200輸出的縮略圖像數(shù)據(jù)的列表。此外,在步驟S903中,信 息處理裝置300使得顯示控制單元350在顯示裝置32上顯示獲取的列表。
圖IO表示顯示屏幕的例子,其中縮略圖像的列表顯示在顯示裝置32上。 如圖IO所示,在顯示裝置32上顯示的列表由文檔圖像的縮略圖像表示。
在圖10的顯示屏幕32A中,四個縮略圖像81-84被顯示為文檔圖像^:據(jù) 的列表。每個文檔圖像數(shù)據(jù)的標(biāo)題顯示在每個縮略圖像的下面。
例如,當(dāng)以要被處理為一個文件的格式提供兩頁或多頁文檔圖像數(shù)據(jù)時, 在顯示屏幕32A可以僅顯示第一頁的文檔圖像數(shù)據(jù)的縮略圖像。
參考圖9,在步驟S903之后,控制進(jìn)行至步驟S904。在步驟S卯4中, 從信息處理裝置300中的顯示屏幕32A中的縮略圖像的列表中選擇縮略圖像。 這個實(shí)施例的信息處理裝置300可以被配置使得當(dāng)例如鼠標(biāo)的點(diǎn)擊裝置點(diǎn)擊 顯示屏幕32A中的縮略圖像時,選擇縮略圖像。
在步驟S904之后進(jìn)行步驟S905,在選擇縮略圖像之后,MFP200使得預(yù) 覽圖像提供單元250從數(shù)據(jù)庫280獲取對應(yīng)于選擇的縮略圖像的預(yù)覽圖像。此 夕卜,在步驟S905中,MFP 200使得預(yù)覽圖像提供單元250向信息處理裝置300 提供獲取的預(yù)覽圖像數(shù)據(jù)。
在這個時候,MFP200使得預(yù)覽圖像提供單元250與預(yù)覽圖像數(shù)據(jù)一起向 信息處理裝置300提供文檔圖像要素的區(qū)域信息和存儲在頁面表284中的文本 數(shù)據(jù)。
在步驟S905之后進(jìn)行步驟S906,信息處理裝置300使得預(yù)覽圖像獲取單 元320從MFP 200獲取預(yù)覽圖像數(shù)據(jù)和文檔圖〗象要素的位置信息。此外,在 步驟S906中,信息處理裝置300使得顯示控制單元350基于該獲取的預(yù)覽圖 像數(shù)據(jù)在顯示裝置32上顯示預(yù)覽圖像。
在步驟S906之后進(jìn)行步驟S907,信息處理裝置300基于文檔圖像要素的 位置信息使得區(qū)域顯示單元325顯示預(yù)覽圖像之內(nèi)的矩形,其分別表示文檔圖 像要素的區(qū)域。
在執(zhí)行了步驟S907之后,終止文檔圖像數(shù)據(jù)的顯示。
然后將描述矩形的顯示。圖11表示顯示屏幕32B的例子,其中預(yù)覽圖像 被顯示在顯示裝置32上。
圖11的顯示屏幕32B是當(dāng)從圖10的文檔圖像數(shù)據(jù)的列表中選擇縮略圖 像82時的顯示屏幕。
假設(shè)從其中生成顯示在顯示屏幕32B上的預(yù)覽圖像90的源文檔圖像包含 文檔圖像要素91、 92和93。因此,在預(yù)覽圖像90之中顯示用于表示文檔圖 像要素91的區(qū)域的矩形94A、用于表示文檔圖像要素92的區(qū)域的矩形94B 以及用于表示文檔圖4象要素93的區(qū)域的矩形94C。
為了顯示預(yù)覽圖像90,基于與預(yù)覽圖像數(shù)據(jù)一起獲取的文檔圖像要素91、 92和93的位置信息來顯示矩形94A、 94B和94C。
在這個實(shí)施例中,在預(yù)覽圖像90中文檔圖像要素91、 92和93的布局與 提供文檔圖像數(shù)據(jù)的源文檔圖像中的文檔圖像要素的布局相同。
在這個實(shí)施例中,可能根據(jù)文檔圖像要素的種類來改變由區(qū)域顯示單元 325顯示的矩形94A、 94B和94C的顏色。例如,當(dāng)文檔圖Y象要素91的種類 是圖像時,可以將矩形94A的顏色改變?yōu)樗{(lán)色,并且當(dāng)文檔圖像要素92的類 型是文本時,可以將矩形94B的顏色改變?yōu)榧t色。
如上所述,在這個實(shí)施例中,在MFP 200中注冊文檔圖像數(shù)據(jù),并且該 注冊的文檔圖fjt據(jù)顯示在信息處理裝置300上。
在這個實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)100中,使用MFP 200和信息處 理裝置300的上述功能,并且可以重新-使用存儲在MFP 200中的文檔圖傳4t 據(jù)的要素數(shù)據(jù),使得可以執(zhí)行文檔圖像的編輯。
下面將描述這個實(shí)施例中的文檔圖像的編輯。
在這個實(shí)施例的信息處理裝置300中,當(dāng)編輯單元360在顯示裝置32上 顯示文檔圖像的編輯屏幕時,可以使用要素數(shù)據(jù)來編輯文檔圖像。
在這個實(shí)施例的信息處理裝置300中,在顯示裝置32上顯示預(yù)覽圖像和
編輯屏幕。如果使用鼠標(biāo)將預(yù)覽圖像的文檔圖像要素拖放到編輯屏幕,選擇的 文檔圖像要素的要素數(shù)據(jù)可以被附在編輯屏幕上。
圖12是用于說明由第一實(shí)施例的信息處理裝置300進(jìn)行的文檔圖像的編 輯的流程圖。
在步驟S1201中,信息處理裝置300獲取文檔圖像數(shù)據(jù)的預(yù)覽圖像數(shù)據(jù)。 預(yù)覽圖像數(shù)據(jù)的獲取和上面所述相同。
在步驟S1201之后進(jìn)行至步驟S1202,顯示控制單元350基于獲取的預(yù)覽 圖像數(shù)據(jù)在顯示裝置32上顯示預(yù)覽圖像。在這個顯示的預(yù)覽圖像中,也顯示 分別表示文檔圖像要素的區(qū)域的矩形。編輯單元360在顯示裝置32上顯示文 檔圖像的編輯屏幕。
在步驟S1202之后進(jìn)行步驟S1203,文檔圖像要素選擇單元330選擇在預(yù) 覽圖像中的文檔圖《象要素。
在這個實(shí)施例的預(yù)覽圖像90中,如果將光標(biāo)放置在由矩形94A、 94B和 94C的一個圍成的區(qū)域中的點(diǎn)上并且由例如鼠標(biāo)的點(diǎn)擊裝置來點(diǎn)擊,選#^巨形 94A、 94B和94C中的點(diǎn)擊的一個對應(yīng)的文檔圖像要素91、 92和93中的一個。 因此,這個實(shí)施例的文檔圖像要素選擇單元330被布置來接收輸入單元31的 輸出信號。
如果在信息處理裝置300中選擇文檔圖像要素,選擇命令和選擇的文檔圖 像要素的位置信息纟皮發(fā)送至MFP 200。
在步驟S1203之后進(jìn)行步驟S1204,信息處理裝置300獲取對應(yīng)于選擇的 文檔圖像要素的要素數(shù)據(jù)。此外,在步驟S1204中,確定對應(yīng)于在步驟S1203 中選擇的文檔圖像要素的要素數(shù)據(jù)是否是文本數(shù)據(jù)。
當(dāng)對應(yīng)于在步驟S1203中選擇的文檔圖像要素的要素數(shù)據(jù)是文本數(shù)據(jù)時, 控制進(jìn)行至步驟S1205。在步驟S1205中,信息處理裝置300使得要素數(shù)據(jù)獲 取單元340基于與預(yù)覽圖像數(shù)據(jù)一起獲取的區(qū)域信息和文本數(shù)據(jù)來獲取對應(yīng) 于選擇的文檔圖像要素的文本數(shù)據(jù)作為要素數(shù)據(jù)。詳細(xì)地,要素數(shù)據(jù)獲取單元 340從與預(yù)覽圖像數(shù)據(jù)一起獲取的文本數(shù)據(jù)中提取在由區(qū)域信息表示的區(qū)域 中的文本數(shù)據(jù),并將獲得的文本數(shù)據(jù)作為要素數(shù)據(jù)。
在步驟S1205之后進(jìn)行步驟S1206,信息處理裝置300使得顯示控制單元
350在預(yù)覽圖像中顯示在步驟S1205獲取的文本數(shù)據(jù)(要素數(shù)據(jù))。
可選地,顯示控制單元350可以被布置來預(yù)覽圖像中顯示選擇的文檔圖像 要素附近的窗口,并且在窗口中顯示對應(yīng)的文本數(shù)據(jù)。
在上面的實(shí)施例中,在使用鼠標(biāo)等點(diǎn)擊矩形區(qū)域的內(nèi)部的時候執(zhí)行文檔圖 像要素的選擇。本發(fā)明不局限于這個實(shí)施例。例如,上面的實(shí)施例可以被修改 使得當(dāng)光標(biāo)位于矩形區(qū)域中時,顯示窗口并在窗口中顯示對應(yīng)的文本數(shù)據(jù)。
在步驟S1206之后進(jìn)行步驟S1207,信息處理裝置300使得范圍選擇單元 342從顯示的文本數(shù)據(jù)中選擇的要被拖放的文本數(shù)據(jù)的范圍。詳細(xì)地,通過使 用例如鼠標(biāo)的點(diǎn)擊裝置,從其中顯示文本數(shù)據(jù)的窗口中的文本數(shù)據(jù)中選擇要被 拖放的文本數(shù)據(jù)。因此,這個實(shí)施例的范圍選擇單元342可以由提供在信息處 理裝置300中的輸入單元31構(gòu)成。
在步驟S1207之后進(jìn)行步驟S1208,執(zhí)行被選為編輯對象的文本數(shù)據(jù)的拖 放操作。此后,信息處理裝置300使得選擇的范圍提取單元344從要素數(shù)據(jù)獲 取單元340獲取的文本數(shù)據(jù)中提取選擇的范圍中的文本數(shù)據(jù)。
最終,進(jìn)行至步驟S1209,在編輯顯示中顯示由編輯單元360提取的文本 數(shù)據(jù)。
另一方面,當(dāng)對應(yīng)于在步驟S1203中選擇的文檔圖像要素的要素數(shù)據(jù)不是 在步驟S1204中的文本數(shù)據(jù)時,控制進(jìn)行至步驟S1210。在步驟S1210中,對 編輯屏幕執(zhí)行選擇的文檔圖像要素的拖放。在步驟S1210中拖放選擇的文檔圖 像要素之后,控制進(jìn)行至步驟S1211。在步驟S1211中,信息處理裝置300使 得要素數(shù)據(jù)獲取單元340獲取選擇的文檔圖像要素的要素數(shù)據(jù)。
下面將給出要素數(shù)據(jù)的獲取的描述。響應(yīng)于從信息處理裝置300接收的選 擇命令和位置信息,MFP 200使得要素數(shù)據(jù)提取單元260從文檔圖像數(shù)據(jù)部 282獲取包含選擇的文檔圖像要素的文檔圖像數(shù)據(jù)。使得要素數(shù)據(jù)提取單元 260基于位置信息從獲取的文檔圖像數(shù)據(jù)中切除并提取對應(yīng)于文檔圖像要素 的要素數(shù)據(jù)。被切除的要素數(shù)據(jù)是具有分辨率高于預(yù)覽圖像的分辨率的文檔圖 像數(shù)據(jù)的數(shù)據(jù)。信息處理裝置300的要素數(shù)據(jù)獲取單元350獲取由MFP 200 的要素數(shù)據(jù)提供單元270輸出的要素數(shù)據(jù)。
在步驟S1211之后進(jìn)行步驟S1209,信息處理裝置300使得編輯單元360
在編輯屏幕上顯示獲取的要素數(shù)據(jù)。
以這種方式,在這個實(shí)施例的信息處理裝置300中,可以任意布置在編輯
屏幕上顯示的要素數(shù)據(jù)。
如上所述,在這個實(shí)施例中,每次從文檔圖像數(shù)據(jù)選擇文檔圖像要素時, 從文檔圖像數(shù)據(jù)中切除并提取對應(yīng)于選擇的文檔圖像要素的要素數(shù)據(jù)。因此, 對于這個實(shí)施例可能將文檔圖像數(shù)據(jù)劃分成前述的文檔圖像要素而不需要保 存每個文檔圖像要素的數(shù)據(jù)。因此,可能減少累積文檔圖像要素所需要的存儲 器空間。
在這個實(shí)施例中,如果在預(yù)覽圖像中選擇文檔圖像要素,從具有分辨率高 于預(yù)覽圖像的分辨率的文檔圖像數(shù)據(jù)中提取對應(yīng)于選擇的文檔圖像要素的要 素數(shù)據(jù)。因此,如果對于這個實(shí)施例可能將重新使用的圖像的質(zhì)量維持在高水 平上。
下面參考圖13描述文檔圖像的編輯。圖13表示顯示屏幕的例子,其中顯 示預(yù)覽圖像和編輯屏幕。
在圖13的顯示屏幕32C中顯示預(yù)覽圖像90和編輯屏幕111。顯示在顯示 屏幕32C中的預(yù)覽圖像90包括文檔圖像要素91、 92和93,以及分別表示文 檔圖像要素91-93的區(qū)域的矩形94A-94C。
首先將描述當(dāng)在圖12的步驟S1203中選擇的文檔圖像要素的要素數(shù)據(jù)是 文本數(shù)據(jù)時的文檔圖像的編輯。
在顯示屏幕32C中,在預(yù)覽圖像90中的文檔圖像要素92被選為要被重 新使用的要素數(shù)據(jù)。在顯示屏幕32C的例子中,文檔圖像要素92是文本數(shù)據(jù)。 例如,如果光標(biāo)K被放置在預(yù)覽圖像90中的文檔圖像要素92的區(qū)域中的點(diǎn) 上并且通過使用鼠標(biāo)來選擇文檔圖像要素92,那么在文檔圖像要素92下面的 位置中顯示用于顯示文本數(shù)據(jù)的窗口 W。在窗口 W中顯示包含在由矩形94B 指示的區(qū)域中的文本數(shù)據(jù)。
例如,如果通過使用光標(biāo)K將窗口 W中的文本數(shù)據(jù)的范圍M選擇為編輯 對象,并且范圍M被拖放到編輯屏幕111上,然后在編輯屏幕111中顯示范 圍M中的文本數(shù)據(jù)92A。在這個實(shí)施例中,窗口 W中的范圍M中的文本數(shù) 據(jù)可以被復(fù)制使得其附在編輯屏幕111上。
然后將描述當(dāng)在圖12的步驟S1203中選擇的文檔圖像要素的要素數(shù)據(jù)不 是文本數(shù)據(jù)時的文檔圖像的編輯。
在顯示屏幕32C中,在預(yù)覽圖像90中的文檔圖^象要素91被選為要被重 新使用的要素數(shù)據(jù)。如果光標(biāo)被放置在預(yù)覽圖像90中的文檔圖像要素91的區(qū) 域中的點(diǎn)上并且矩形94A中的文檔圖像要素91被拖放到這個實(shí)施例的信息處 理裝置300中的編輯屏幕111,然后從MFP 200將文檔圖像要素91的要素數(shù) 據(jù)提供給信息處理裝置300。與上述相同的方式執(zhí)行來自MFP 200的要素數(shù)據(jù) 的提供。
文檔圖像要素91的提供的要素數(shù)據(jù)91A被附在編輯屏幕111上。要素數(shù) 據(jù)91A可以被附在拖放時由光標(biāo)在編輯屏幕111中指定的位置。假設(shè)顯示屏 幕32C的例子中文檔圖像要素91構(gòu)成圖像。因此,要素數(shù)據(jù)91A是從文檔圖 像數(shù)據(jù)提取的圖像數(shù)據(jù)。
因此,在這個實(shí)施例中,當(dāng)要素數(shù)據(jù)是文本數(shù)據(jù)時,文本數(shù)據(jù)可以在編輯 屏幕111中執(zhí)行編輯之前被顯示在預(yù)覽圖像90中?;谶@個原因,在這個實(shí) 施例中,可以在編輯之前檢查是否在輸入的文檔圖像數(shù)據(jù)時文本數(shù)據(jù)獲取單元 215正確獲取了文本^t據(jù)。
此外,在這個實(shí)施例中,僅從預(yù)覽圖像中顯示的文本數(shù)據(jù)中選擇部分文本 數(shù)據(jù)作為編輯對象,并且選擇的文本數(shù)據(jù)可以被重新使用。因此,在這個實(shí)施 例中,當(dāng)重新使用文本數(shù)據(jù)時,不再必須執(zhí)行刪除曾經(jīng)獲取的不必要數(shù)據(jù)的復(fù) 雜操作。
根據(jù)這個實(shí)施例,可以通過重新使用存儲在MFP 200中的文檔圖像數(shù)據(jù) 的要素數(shù)據(jù)來編輯文檔圖像,并且構(gòu)成文檔圖像數(shù)據(jù)的文檔圖<象要素可以被容 易地重新使用。
可以修改上述實(shí)施例使得從文檔圖像數(shù)據(jù)中提取的并被重新使用的要素 數(shù)據(jù)被存儲在頁面表284中。此時,要素數(shù)據(jù)可以和通過頁面ID與包含要素 數(shù)據(jù)的文檔圖像數(shù)據(jù)的頁面相關(guān)聯(lián)并且被存儲。
在上述實(shí)施例中,當(dāng)文檔圖像要素構(gòu)成圖像時,要素數(shù)據(jù)被獲取為圖像數(shù) 據(jù),并且當(dāng)文檔圖像要素構(gòu)成文本時,要素數(shù)據(jù)被獲取為文本數(shù)據(jù)。然而,本 發(fā)明不僅僅局限于上述實(shí)施例。
可選地,上述實(shí)施例的信息處理裝置300可以被布置使得當(dāng)在選擇文檔圖 像要素中執(zhí)行預(yù)定的操作時,可以執(zhí)行關(guān)于對應(yīng)的要素數(shù)據(jù)識別被獲取為圖像
數(shù)據(jù)或文本數(shù)據(jù)的確定。在這樣的可選實(shí)施例中,MFP 200必須能夠執(zhí)行用于 文檔圖像數(shù)據(jù)的OCR (光學(xué)字符識別)處理,并且獲取對應(yīng)于構(gòu)成文檔圖像 數(shù)據(jù)的所有文檔圖像要素的文本數(shù)據(jù)的字符代碼。
由此,當(dāng)文檔圖像輸入單元205輸入文檔圖像數(shù)據(jù)時,可選實(shí)施例的MFP 200可以執(zhí)行用于文檔圖像數(shù)據(jù)的OCR處理,獲取被獲得作為OCR處理的結(jié) 果的文本數(shù)據(jù)的字符代碼,并且通過頁面ID將獲取的文檔數(shù)據(jù)與文檔圖像數(shù) 據(jù)的頁面相關(guān)聯(lián)來將獲得的文本數(shù)據(jù)存儲在頁面表284中。
可選地,當(dāng)在選擇構(gòu)成圖像的文檔圖像要素中在信息處理裝置300上執(zhí)行 預(yù)定l喿作時,這個實(shí)施例的MFP 200可以被布置以確定從信息處理裝置300 接收了文本數(shù)據(jù)獲取命令。在這種情況下,MFP200將向信息處理裝置300提 供文本數(shù)據(jù)作為OCR處理的結(jié)果(替代要素數(shù)據(jù)),而不從文檔圖像數(shù)據(jù)提取 要素數(shù)據(jù)。
可選地,當(dāng)在選擇構(gòu)成文本的文檔圖像要素中在信息處理裝置300上執(zhí)行 預(yù)定操作時,這個實(shí)施例的MFP 200可以被布置以確定從信息處理裝置300 接收了文本數(shù)據(jù)獲取命令。在這種情況下,MFP200將向信息處理裝置300提 供要素數(shù)據(jù)作為圖像數(shù)據(jù)(而不是作為文本數(shù)據(jù)的要素數(shù)據(jù))。在這種情況下 被提供的要素數(shù)據(jù)是從文檔圖像數(shù)據(jù)中提取的圖像數(shù)據(jù)。
例如,上述預(yù)定操作是由鼠標(biāo)(選擇)點(diǎn)擊文檔圖像要素(顯示在信息處 理裝置300中)的操作,同時壓下鍵盤的確定鍵,這是由用戶執(zhí)行的。
下面將描述本發(fā)明的第二實(shí)施例。在本發(fā)明的第二實(shí)施例中,布置在第一 實(shí)施例的信息處理裝置300中的Web瀏覽器370和編輯單元360的功能被布 置在MFP200中。
在第二實(shí)施例中,使用相同的參考號代表與第 一 實(shí)施例中的對應(yīng)的元件相
同的元件,并且省略其描述。
圖14表示第二實(shí)施例的文檔圖像數(shù)據(jù)提供系統(tǒng)IOOA的組成。
圖14的文檔圖像數(shù)據(jù)提供系統(tǒng)100A由多功能外圍設(shè)備(MFP) 200A和
信息處理裝置300構(gòu)成,二者通過網(wǎng)絡(luò)400連接在一起。
如圖14所示,這個實(shí)施例的MFP200A除了在第一實(shí)施例的MFP200中 布置的單元之外還包括Web瀏覽器370和編輯單元360(其與第一實(shí)施例的信 息處理裝置300的對應(yīng)單元相同)。
在第二實(shí)施例中Web瀏覽器370和編輯單元360的功能與上述第一實(shí)施 例中的相同。第二實(shí)施例的MFP 200A被布置使得可以在MFP 200A的操作面 板28上顯示預(yù)覽圖像,其中矩形(rectangle)分別指示文檔圖像要素的區(qū)域, 并且允許MFP200A的用戶從顯示的文檔圖像要素中選擇文檔圖像要素??梢?使用選擇的文檔圖像要素的要素數(shù)據(jù)來由MFP200A執(zhí)行文檔圖像的編輯。因 此,根據(jù)第二實(shí)施例,文檔圖像數(shù)據(jù)可以被容易地重新使用。
本發(fā)明不局限于特定公開的實(shí)施例,可以進(jìn)行變型和修改而不偏離本發(fā)明 的范圍。
權(quán)利要求
1. 一種文檔圖像數(shù)據(jù)提供裝置,其向信息處理裝置提供文檔圖像數(shù)據(jù),該文檔圖像數(shù)據(jù)提供裝置包括文檔圖像輸入單元,配置用于輸入文檔圖像數(shù)據(jù);區(qū)域識別單元,配置用于識別在構(gòu)成輸入的文檔圖像數(shù)據(jù)的文檔圖像要素中包含文本數(shù)據(jù)的文檔圖像要素的文本區(qū)域,以及包含除了文本數(shù)據(jù)之外的數(shù)據(jù)的文檔圖像要素的另一區(qū)域;文本數(shù)據(jù)獲取單元,配置用于獲取在由區(qū)域識別單元識別的文本區(qū)域中包含的文本數(shù)據(jù);以及提供單元,配置用于響應(yīng)于從信息處理裝置接收到的文檔圖像數(shù)據(jù)請求,向信息處理裝置提供從輸入的文檔圖像數(shù)據(jù)生成的、具有比輸入的文檔圖像數(shù)據(jù)的分辨率更低的分辨率的圖像數(shù)據(jù),以及由文本數(shù)據(jù)獲取單元獲取的文本數(shù)據(jù)。
2. 根據(jù)權(quán)利要求1所述的文檔圖像數(shù)據(jù)提供裝置,進(jìn)一步包括圖像生成 單元,配置用于生成具有比輸入的文檔圖像數(shù)據(jù)的分辨率更低的分辨率的文檔 圖像數(shù)據(jù),以允許在信息處理裝置中的文檔圖像要素的選擇。
3. 根據(jù)權(quán)利要求2所述的文檔圖像數(shù)據(jù)提供裝置,其中圖像生成單元被 配置用于生成具有比輸入的文檔圖像數(shù)據(jù)的分辨率更低的第 一分辨率的第一 文檔圖像數(shù)據(jù),以及具有比第 一文檔圖像數(shù)據(jù)的第 一分辨率更低的第二分辨率 的第二文檔圖像數(shù)據(jù)。
4. 根據(jù)權(quán)利要求1到3中的任一項(xiàng)所述的文檔圖像數(shù)據(jù)提供裝置,進(jìn)一 步包括要素數(shù)據(jù)提取單元,配置用于在信息處理裝置中選擇了輸入的文檔圖像 數(shù)據(jù)的文檔圖像要素時,從輸入的文檔圖像數(shù)據(jù)提取選擇的文檔圖像要素的要 素數(shù)據(jù),其中所述提供單元配置為向信息處理裝置提供要素數(shù)據(jù)提取單元所提取的要 素數(shù)據(jù)。
5. —種信息處理裝置,其連接至文檔圖像數(shù)據(jù)提供裝置,該文檔圖像數(shù) 據(jù)提供裝置提供文檔圖像數(shù)據(jù)至信息處理裝置并包括文檔圖像輸入單元,配 置用于輸入文檔圖像數(shù)據(jù);區(qū)域識別單元,配置用于識別在構(gòu)成輸入的文檔圖像數(shù)據(jù)的文檔圖像要素中包含文本數(shù)據(jù)的文檔圖像要素的文本區(qū)域,以及包含除了文本數(shù)據(jù)之外的數(shù)據(jù)的文檔圖像要素的另一區(qū)域;文本數(shù)據(jù)獲取單元,配 置用于獲取在由區(qū)域識別單元識別的文本區(qū)域中包含的文本數(shù)據(jù);以及提供單 元,配置用于響應(yīng)于從信息處理裝置接收到的文檔圖像數(shù)據(jù)請求,向信息處理 裝置提供從輸入的文檔圖像數(shù)據(jù)生成的、具有比輸入的文檔圖像數(shù)據(jù)的分辨率 更低的分辨率的圖像數(shù)據(jù),以及由文本數(shù)據(jù)獲取單元獲取的文本數(shù)據(jù),該信息 處理裝置包括獲取單元,配置用于從文檔圖像數(shù)據(jù)提供裝置獲取輸入的文檔圖像數(shù)據(jù)和 在識別的文本區(qū)域中包含的文本數(shù)據(jù);文檔圖像要素選擇單元,配置用于從輸入的文檔圖像數(shù)據(jù)中選擇構(gòu)成輸入 的文檔圖像數(shù)據(jù)的文檔圖像要素;以及顯示控制單元,配置用于當(dāng)由文檔圖像要素選擇單元選擇的文檔圖像要素 的要素數(shù)據(jù)是文本數(shù)據(jù)時,在顯示裝置上顯示與由獲取單元獲取的文本數(shù)據(jù)中 的要素數(shù)據(jù)對應(yīng)的文本數(shù)據(jù)。
6. 根據(jù)權(quán)利要求5所述的信息處理裝置,進(jìn)一步包括 范圍選擇單元,配置用于選擇要被從顯示在顯示裝置上的文本數(shù)據(jù)中提取文本數(shù)據(jù)的范圍;以及選擇的范圍提取單元,配置用于從顯示在顯示裝置上的文本數(shù)據(jù)中提取在 由范圍選擇單元選擇的范圍中的文本數(shù)據(jù)。
7. 根據(jù)權(quán)利要求5或6的信息處理裝置,進(jìn)一步包括要素數(shù)據(jù)獲取單元, 配置用于獲取由文檔圖像要素選擇單元選擇的文檔圖像要素的要素數(shù)據(jù)。
8. —種文檔圖像數(shù)據(jù)提供系統(tǒng),在該文檔圖像數(shù)據(jù)提供系統(tǒng)中文檔圖像 數(shù)據(jù)提供裝置和信息處理裝置通過網(wǎng)絡(luò)連接,文檔圖像數(shù)據(jù)提供裝置提供文檔圖像數(shù)據(jù)至信息處理裝置并包括文檔圖 像輸入單元,配置用于輸入文檔圖像數(shù)據(jù);區(qū)域識別單元,配置用于識別在構(gòu) 成輸入的文檔圖像數(shù)據(jù)的文檔圖像要素中包含文本數(shù)據(jù)的文檔圖像要素的文 本區(qū)域,以及包含除了文本數(shù)據(jù)之外的數(shù)據(jù)的文檔圖像要素的另一區(qū)域;文本 數(shù)據(jù)獲取單元,配置用于獲取在由區(qū)域識別單元識別的文本區(qū)域中包含的文本 數(shù)據(jù);以及提供單元,配置用于響應(yīng)于從信息處理裝置接收到的文檔圖像數(shù)據(jù) 請求,向信息處理裝置提供從輸入的文檔圖像數(shù)據(jù)生成的、具有比輸入的文檔 圖像數(shù)據(jù)的分辨率更低的分辨率的圖像數(shù)據(jù),以及由文本數(shù)據(jù)獲取單元獲取的 文本數(shù)據(jù),信息處理裝置包括獲取單元,配置用于從文檔圖像數(shù)據(jù)提供裝置獲取輸 入的文檔圖像數(shù)據(jù)和在識別的文本區(qū)域中包含的文本數(shù)據(jù);文檔圖像要素選擇 單元,配置用于從輸入的文檔圖像數(shù)據(jù)中選擇構(gòu)成輸入的文檔圖像數(shù)據(jù)的文檔 圖像要素;以及顯示控制單元,配置用于當(dāng)由文檔圖像要素選擇單元選擇的文 檔圖像要素的要素數(shù)據(jù)是文本數(shù)據(jù)時,在顯示裝置上顯示與由獲取單元獲取的 文本數(shù)據(jù)中的要素數(shù)據(jù)對應(yīng)的文本數(shù)據(jù)。
9. 一種文檔圖像數(shù)據(jù)提供方法,由向信息處理裝置提供文檔圖像數(shù)據(jù)的 文檔圖像數(shù)據(jù)提供裝置執(zhí)行,該文檔圖像數(shù)據(jù)提供方法包括文檔圖像輸入步驟,輸入文檔圖像數(shù)據(jù);區(qū)域識別步驟,識別在構(gòu)成輸入的文檔圖像數(shù)據(jù)的文檔圖像要素中包含文 本數(shù)據(jù)的文檔圖像要素的文本區(qū)域,以及包含除了文本數(shù)據(jù)之外的數(shù)據(jù)的文檔 圖像要素的另一區(qū)域;文本數(shù)據(jù)獲取步驟,獲取在區(qū)域識別步驟識別的文本區(qū)域中包含的文本數(shù) 據(jù);以及提供步驟,響應(yīng)于從信息處理裝置接收到的文檔圖像數(shù)據(jù)請求,向信息處 理裝置提供從輸入的文檔圖像數(shù)據(jù)生成的、具有比輸入的文檔圖像數(shù)據(jù)的分辨 率更低的分辨率的圖像數(shù)據(jù),以及在文本數(shù)據(jù)獲取步驟獲取的文本數(shù)據(jù)。
10. —種信息處理方法,由信息處理裝置執(zhí)行、并與文檔圖像數(shù)據(jù)提供裝 置執(zhí)行的權(quán)利要求9的文檔圖像數(shù)據(jù)提供方法同時被執(zhí)行,該信息處理裝置連 接至文檔圖像數(shù)據(jù)提供裝置,該信息處理方法包括獲取步驟,從文檔圖像數(shù)據(jù)提供裝置獲取輸入的文檔圖像數(shù)據(jù)和在識別的 文本區(qū)域中包含的文本數(shù)據(jù);文檔圖像要素選擇步驟,從輸入的文檔圖像數(shù)據(jù)中選擇構(gòu)成輸入的文檔圖 像數(shù)據(jù)的文檔圖像要素;以及顯示控制步驟,當(dāng)在文檔圖像要素選擇步驟選擇的文檔圖像要素的要素數(shù) 據(jù)是文本數(shù)據(jù)時,在顯示裝置上顯示與在獲取步驟獲取的文本數(shù)據(jù)中的要素數(shù) 據(jù)對應(yīng)的文本數(shù)據(jù)。
11. 一種計算機(jī)可讀記錄介質(zhì),存儲計算機(jī)可讀程序,當(dāng)文檔圖像數(shù)據(jù)提供裝置的計算機(jī)執(zhí)行該計算機(jī)可讀程序時,使得該計算機(jī)執(zhí)行根據(jù)權(quán)利要求9的文檔圖像數(shù)據(jù)提供方法。
12. —種計算機(jī)可讀記錄介質(zhì),存儲計算機(jī)可讀程序,當(dāng)信息處理裝置的 計算機(jī)執(zhí)行該計算機(jī)可讀程序時,使得該計算機(jī)執(zhí)行根據(jù)權(quán)利要求IO的信息 處理方法。
全文摘要
本發(fā)明提供了文檔圖像數(shù)據(jù)提供系統(tǒng)、裝置和方法,及信息處理裝置和方法。在文檔圖像數(shù)據(jù)提供裝置中,文檔圖像輸入單元被配置用于輸入文檔圖像數(shù)據(jù)。區(qū)域識別單元被配置用于識別在構(gòu)成輸入的文檔圖像數(shù)據(jù)的文檔圖像要素中包含文本數(shù)據(jù)的文檔圖像要素的文本區(qū)域,以及包含除了文本數(shù)據(jù)之外的數(shù)據(jù)的文檔圖像要素的另一區(qū)域。文本數(shù)據(jù)獲取單元被配置用于獲取包含在識別的文本區(qū)域中的文本數(shù)據(jù)。提供單元被配置用于響應(yīng)于從信息處理裝置接收到的文檔圖像數(shù)據(jù)請求,向信息處理裝置提供從輸入的文檔圖像數(shù)據(jù)生成的、具有比輸入的文檔圖像數(shù)據(jù)的分辨率更低的分辨率的圖像數(shù)據(jù),以及由文本數(shù)據(jù)獲取單元獲取的文本數(shù)據(jù)。
文檔編號H04N1/00GK101393564SQ20081021314
公開日2009年3月25日 申請日期2008年9月18日 優(yōu)先權(quán)日2007年9月18日
發(fā)明者巖崎雅二郎 申請人:株式會社理光