專利名稱:圖像處理裝置及其控制方法
技術領域:
本發(fā)明涉及對讀取原稿所得到的原稿圖像進行圖像處理的圖像處理裝置及其控制方法。
背景技術:
近年來,在環(huán)境問題呼吁中,辦公場所中的無紙化急速進展。作為實現(xiàn)無紙化的技術,歷來提議的是利用掃描儀讀取存儲于文件夾等之中的紙質(zhì)文檔,將該讀取的圖像,比如,變換為可移植文檔格式(以下稱其為PDF)等的圖像文件并存儲于圖像存儲裝置進行管理的文檔管理系統(tǒng)。
另一方面,在擴展功能的復合機中,在存儲管理與紙質(zhì)文檔相對應的圖像文件時,可以將存在該圖像文件的圖像存儲裝置內(nèi)的指針信息作為紙質(zhì)文檔的封皮或記載信息中的附加信息進行記錄。于是,再次,在通過復制該紙質(zhì)文檔等方式進行再利用之時,從該指針信息檢出與該紙質(zhì)文檔相對應的原始電子文件(圖像文件)的存放場所,通過直接再利用該原始電子文件,可削減整個紙質(zhì)文檔的保存,生成畫質(zhì)良好的印刷品(比如,日本特開平10-143414號公報)。
此處,在前一種的文檔管理系統(tǒng)中,可以將紙質(zhì)文檔作為壓縮信息量的PDF文件進行保存,但因為PDF文件本身是圖像信息,所以在該PDF文件中存在的一部分對象(比如,字符塊、圖形塊、表格塊等)是不能以電子方式進行再利用的。因此,在想要對這一紙質(zhì)文檔中存在的對象進行再利用時,必須實施重新利用應用軟件再次重新生成必需的對象或從PDF文件中將必需的對象抽出等等編輯操作。
另一方面,在后一種復合機中,比如,在同一組織內(nèi)生成的紙質(zhì)文檔,由于通常處于可以直接訪問與其相對應的原始電子文件的環(huán)境,可以很容易進行再利用,但對于來自外部的紙質(zhì)文檔或原始電子文件的所在不明的紙質(zhì)文檔就不能對應。
于是,在不能在系統(tǒng)內(nèi)確定紙質(zhì)文檔的原始電子文件的場合,一般考慮將讀取該紙質(zhì)文檔所得到的圖像(圖像信息)通過矢量化處理變換為矢量數(shù)據(jù)作為原始電子文件保存,無論是何種紙質(zhì)文檔都可以將讀取的圖像信息作為可以再利用的電子文件進行處理。
可是,在考慮以上述方式進行矢量化處理時,根據(jù)該處理內(nèi)容的不同,由所得到的矢量數(shù)據(jù)(原始電子文件)生成的圖像的內(nèi)容,有時會出現(xiàn)由于對讀取本來的紙質(zhì)文檔所得到的圖像(圖像信息)的內(nèi)容的誤判等的影響而差別很大的情況。
因此,在對與紙質(zhì)文檔相對應的原始電子文件進行再利用時,根據(jù)其目的的不同,有時不能執(zhí)行用戶打算進行的處理。
比如,在對由字符塊構成的紙質(zhì)文檔的圖像信息進行矢量化處理生成矢量數(shù)據(jù)時,對該字符塊進行字符識別并予以編碼。可是,在系統(tǒng)側,在與該字符塊相對應的字體不存在時,有時要使用不同的字體進行編碼(矢量化),此時,就不能實現(xiàn)用戶所希望的字體的字符矢量化。
發(fā)明內(nèi)容
本發(fā)明系為解決上述問題而完成的發(fā)明,其目的在于提供一種可以實現(xiàn)將用戶所希望的內(nèi)容的電子文件作為與讀取原稿圖像相對應的電子文件而加以利用的圖像處理裝置及其控制方法。
為達到上述目的的本發(fā)明的圖像處理裝置的構成如下。即,是一種對讀取原稿所得到的原稿圖像進行圖像處理的圖像處理裝置,其構成包括讀取原稿的讀取單元;將利用上述讀取單元讀取的原稿圖像變換為矢量數(shù)據(jù)的第一變換單元;將上述矢量數(shù)據(jù)變換為圖像數(shù)據(jù)的第二變換單元;
將上述原稿圖像的第一圖像數(shù)據(jù)與利用上述第二變換單元生成的第二圖像數(shù)據(jù)進行比較的比較單元;以及根據(jù)上述比較單元的比較結果,選擇上述第一圖像數(shù)據(jù)或第二圖像數(shù)據(jù)中的一個作為與上述原稿圖像相對應的電子文件的選擇單元。
另外,優(yōu)選是還包括根據(jù)由上述讀取單元讀取的原稿圖像,確定與上述原稿圖像相對應的電子文件的確定單元;并且上述第一變換單元在利用上述確定單元不能確定與上述原稿圖像相對應的電子文件時,將上述原稿圖像變換為矢量數(shù)據(jù)。
另外,優(yōu)選是上述選擇單元,在上述比較單元的比較結果為在上述第一圖像數(shù)據(jù)和上述第二圖像數(shù)據(jù)之間存在不同部分時,將上述第一圖像數(shù)據(jù)作為與原稿圖像相對應的電子文件。
另外,優(yōu)選是上述選擇單元,在上述比較單元的比較結果為在上述第一圖像數(shù)據(jù)和上述第二圖像數(shù)據(jù)之間存在不同部分的比例小于等于閾值時,選擇上述第二圖像數(shù)據(jù)作為與上述原稿圖像相對應的電子文件。
另外,優(yōu)選是其構成還包括在由顯示部提示上述第一圖像數(shù)據(jù)和上述第二圖像數(shù)據(jù)作為上述比較單元的比較結果的提示單元;指定在上述顯示部上提示的上述第一圖像數(shù)據(jù)和上述第二圖像數(shù)據(jù)中的一個的指定單元;并且上述選擇單元,將由上述指定單元指定的上述第一圖像數(shù)據(jù)或上述第二圖像數(shù)據(jù)作為與上述原稿圖像相對應的電子文件。
另外,優(yōu)選是在由上述確定單元確定的電子文件是圖像數(shù)據(jù)時,上述第一變換單元將該圖像數(shù)據(jù)變換為矢量數(shù)據(jù)。
另外,優(yōu)選是上述確定單元具有識別附加于原稿圖像用來表示與該原稿圖像相對應的電子文件的存放目的地的指針信息的識別單元;根據(jù)由上述識別單元識別的指針信息確定與上述原稿圖像相對應的電子文件。
另外,優(yōu)選是其構成還包括
在上述確定單元不能確定與上述原稿圖像相對應的電子文件并且上述識別單元不能識別上述指針信息時,從存儲裝置檢索與上述原稿圖像相對應的電子文件的檢索單元;將由上述檢索單元檢索到的電子文件作為與上述原稿圖像相對應的電子文件候選輸出的輸出單元;以及從上述輸出單元輸出的電子文件候選中選擇所要求的電子文件的選擇單元;并且在由上述選擇單元所選擇的電子文件是圖像數(shù)據(jù)時,上述第一變換單元將該圖像數(shù)據(jù)變換為矢量數(shù)據(jù)。
另外,優(yōu)選是其構成還包括將上述原稿圖像按照每個屬性分割為多個塊的分割單元,并且上述第一變換單元將由上述分割單元分割上述原稿圖像產(chǎn)生的各塊中的每一個都變換為矢量數(shù)據(jù)。
另外,優(yōu)選是上述第二變換單元將由上述第一變換單元對上述各塊中的每一個生成的矢量數(shù)據(jù)都對該各塊變換為圖像數(shù)據(jù)。
另外,優(yōu)選是上述比較單元將由上述分割單元分割上述原稿圖像產(chǎn)生的各塊中的每一個的第一圖像數(shù)據(jù)和由上述第二變換單元生成的對上述各塊有區(qū)別的第二圖像數(shù)據(jù)進行比較。
另外,優(yōu)選是其構成還包括將上述矢量數(shù)據(jù)變換為可由能夠在終端上工作的文檔生成應用程序處理的規(guī)定形式的數(shù)據(jù)的變換單元。
另外,優(yōu)選是其構成還包括將由上述選擇單元所選擇的上述第一圖像數(shù)據(jù)或上述矢量數(shù)據(jù)作為與上述原稿圖像相對應的電子文件存放于規(guī)定的存儲裝置的存放單元;以及生成表示上述電子文件的存放地址的指針信息并附加到該電子文件的附加單元。
另外,優(yōu)選是其構成還包括將上述原稿圖像按照每個屬性分割為多個塊的分割單元,以及在不能由上述確定單元確定與上述原稿圖像相對應的電子文件時,從存儲裝置檢索與由上述分割單元分割的各塊相對應的矢量數(shù)據(jù)的檢索單元;并且上述第一變換單元,利用由上述檢索單元所檢索的矢量數(shù)據(jù),將上述圖像數(shù)據(jù)變換為矢量數(shù)據(jù)。
另外,優(yōu)選是其構成還包括將上述原稿圖像按照每個屬性分割為多個塊的分割單元,以及對由上述分割單元分割的每個塊執(zhí)行上述第一變換單元、上述第二變換單元、上述比較單元及上述選擇單元的控制單元。
另外,優(yōu)選是其構成還包括將上述原稿圖像按照每個屬性分割為多個塊的分割單元,以及根據(jù)由上述分割單元分割的塊的種類,執(zhí)行上述第一變換單元、上述第二變換單元、上述比較單元及上述選擇單元的控制單元。
為達到上述目的的本發(fā)明的圖像處理裝置的控制方法的構成如下。即,是一種對讀取原稿所得到的原稿圖像進行圖像處理的圖像處理裝置的控制方法,其構成包括讀取原稿的讀取步驟;將利用上述讀取單元讀取的原稿圖像變換為矢量數(shù)據(jù)的第一變換步驟;將上述矢量數(shù)據(jù)變換為圖像數(shù)據(jù)的第二變換步驟;將上述原稿圖像的第一圖像數(shù)據(jù)與利用上述第二變換單元生成的第二圖像數(shù)據(jù)進行比較的比較步驟;以及根據(jù)上述比較步驟的比較結果,選擇上述第一圖像數(shù)據(jù)或上述矢量數(shù)據(jù)中的某一個作為與上述原稿圖像相對應的電子文件的選擇步驟。
從下面結合附圖的描述,很容易了解本發(fā)明的上述特點和優(yōu)點,附圖中同樣的標號在全部附圖中表示同一或類似的部件。
包含于本說明書并構成其一部分的附圖示出本發(fā)明的實施方式并與描述一起用來說明本發(fā)明的原理。
圖1為示出本發(fā)明的實施方式1的圖像處理系統(tǒng)的構成的框圖。
圖2為示出本發(fā)明的實施方式1的MFP的詳細結構的框圖。
圖3為示出由本發(fā)明的實施方式1的圖像處理系統(tǒng)執(zhí)行的整個處理的概要的流程圖。
圖4A為用來說明本發(fā)明的實施方式1的塊選擇處理的概念的示圖。
圖4B為用來說明本發(fā)明的實施方式1的塊選擇處理的概念的示圖。
圖5為示出本發(fā)明的實施方式1塊信息的一例的示圖。
圖6為示出本發(fā)明的實施方式1步驟S122的處理的細節(jié)的流程圖。
圖7為示出本發(fā)明的實施方式的原稿圖像的一例的示圖。
圖8為示出本發(fā)明的實施方式1的原始電子文件的檢索處理的流程圖。
圖9為示出本發(fā)明的實施方式1的原始電子文件的檢索處理的應用例流程圖。
圖10為示出本發(fā)明的實施方式1步驟S126的處理的細節(jié)的流程圖。
圖11為用來說明本發(fā)明的實施方式1的矢量化處理的示圖。
圖12為用來說明本發(fā)明的實施方式1的矢量化處理的示圖。
圖13為用來說明本發(fā)明的實施方式1的矢量數(shù)據(jù)的成組化處理的流程圖。
圖14為示出本發(fā)明的實施方式1步驟S701的處理的細節(jié)的流程圖。
圖15為示出本發(fā)明的實施方式1的DAOF的數(shù)據(jù)結構的示圖。
圖16為示出本發(fā)明的實施方式1步驟S130的處理的細節(jié)的流程圖。
圖17為示出本發(fā)明的實施方式1步驟S8002的處理的細節(jié)的流程圖。
圖18A為本發(fā)明的實施方式1的文檔結構樹的說明圖。
圖18B為本發(fā)明的實施方式1的文檔結構樹的說明圖。
圖19為示出本發(fā)明的實施方式1步驟S135的處理的細節(jié)的流程圖。
圖20為用來說明本發(fā)明的實施方式1的光柵化/比較/選擇處理的概念的示圖。
圖21為用來說明本發(fā)明的實施方式2的矢量化處理及光柵化/比較/選擇處理的概念的示圖。
圖22為用來說明本發(fā)明的實施方式3的矢量化處理及光柵化/比較/選擇處理的概念的示圖。
具體實施例方式
下面參照附圖對本發(fā)明的優(yōu)選實施方式予以詳細描述。
<實施方式1>
圖1為示出本發(fā)明的實施方式1的圖像處理系統(tǒng)的構成的框圖。
此圖像處理系統(tǒng),利用因特網(wǎng)等的網(wǎng)絡104將辦公場所10及辦公場所20相連接的環(huán)境而實現(xiàn)。
在辦公場所10內(nèi)構筑的LAN107上連接有實現(xiàn)多種功能(復制功能、印刷功能、發(fā)送功能等)的復合機的MFP(多功能外圍設備)100、控制MFP100的管理PC101、利用MFP100的客戶機PC102、文檔管理服務器106及其數(shù)據(jù)庫105以及代理服務器103。
在辦公場所20內(nèi)構筑的LAN108上連接有代理服務器103、文檔管理服務器106及其數(shù)據(jù)庫105。
辦公場所10內(nèi)的LAN107及辦公場所20內(nèi)的LAN108,經(jīng)過各自的代理服務器103與網(wǎng)絡104相連接。
MFP100,特別是,具有以電子方式讀取作為原稿的紙質(zhì)文檔的圖像讀取部和對從圖像讀取部得到的圖像信號執(zhí)行圖像處理裝置的圖像處理部,此圖像信號可經(jīng)過LAN109發(fā)送到管理PC101。
管理PC101是通常的PC(個人計算機),在內(nèi)部具有圖像存儲部、圖像處理部、顯示部、輸入部等各種結構部件,該結構部件的一部分與MFP100構成一體。
另外,圖1的結構是一例,但也可以沒有具有文檔管理服務器106的辦公場所20,或存在更多的也可以,或辦公場所10和辦公場所20連接在同一LAN上也可以。
另外,網(wǎng)絡104,在典型情況下是因特網(wǎng)或LAN或WAN或電話線路、專用數(shù)字線路、ATM或幀中繼線路、通信衛(wèi)星線路、有線電視線路、數(shù)據(jù)廣播用無線線路等任何一個,或利用這些線路的組合實現(xiàn)的所謂的通信網(wǎng)絡,只要可以進行數(shù)據(jù)收發(fā)即可。
另外,管理PC101、客戶機PC102、文檔管理服務器106等各種終端分別具有裝載于通用計算機上的標準結構部件(如CPU、RAM、ROM、硬盤、外部存儲裝置、網(wǎng)絡接口、顯示器、鍵盤、鼠標等)。
下面利用圖2對MFP100的詳細結構予以說明。
圖2為示出本發(fā)明的實施方式1的MFP的詳細結構的框圖。
在圖2中,包含自動文檔送紙器(ADF)的圖像讀取部110,對扎狀或一張的原稿圖像以光源(未圖示)進行照射,利用透鏡使原稿反射像在固體攝像元件上成像,將獲得的發(fā)自固體攝像元件的光柵狀的圖像讀取信號作為規(guī)定密度(600DPI等)的光柵圖像。
另外,MFP100,具有由印刷部112將與圖像讀取信號相對應的圖像印刷到記錄媒體上的復制功能,并且在對原稿圖像進行一次復制時,就由數(shù)據(jù)處理部115對此圖像讀取信號進行圖像處理而生成記錄信號,由印刷部112將其印刷到記錄媒體上。另一方面,在對原稿圖像進行多次復制時,在由存儲部111臨時存儲保持一頁大小的記錄信號之后,由印刷部112將其順序輸出印刷到記錄媒體上。
另外,經(jīng)過網(wǎng)絡I/F114的發(fā)送功能,是將從圖像讀取部110得到的光柵圖像變換為TIFF或JPEG等壓縮圖像文件形式或PDF等的矢量數(shù)據(jù)文件形式的圖像文件,從網(wǎng)絡I/F114輸出。輸出的圖像文件,經(jīng)LAN107發(fā)送到文檔管理服務器106或客戶機PC102,再經(jīng)過網(wǎng)絡104傳送到辦公場所20內(nèi)的另外的文檔管理服務器106。
另外,印刷部112的印刷功能,比如,是使客戶機PC102輸出的印刷數(shù)據(jù)經(jīng)過網(wǎng)絡I/F114為數(shù)據(jù)處理部115所接收,數(shù)據(jù)處理部115,將該印刷數(shù)據(jù)變換為可在印刷部112上印刷的光柵數(shù)據(jù)之后,由印刷部112在印刷媒體上形成圖像。
操作人員對MFP100的指示由裝設于MFP100上的鍵操作部和由連接到管理PC101的鍵盤及鼠標組成的輸入部113進行,這一系列的動作由數(shù)據(jù)處理部115內(nèi)的控制部(未圖示)控制。另外,操作輸入的狀態(tài)形式及處理中的圖像數(shù)據(jù)顯示,由顯示部116進行。
存儲部111,也由管理PC101控制,MFP100和管理PC101的數(shù)據(jù)的收發(fā)及控制,經(jīng)網(wǎng)絡I/F117及LAN109進行。
這些MFP100和管理PC101的數(shù)據(jù)的收發(fā)及控制,在構成LAN109的場合,經(jīng)網(wǎng)絡I/F117將MFP100和管理PC101直連而實現(xiàn),而在不構成LAN109的場合,經(jīng)連接到網(wǎng)絡I/F114的LAN107而實現(xiàn)。
下面利用圖3對利用實施方式1的圖像處理系統(tǒng)執(zhí)行的整個處理的概要予以說明。
圖3為示出由本發(fā)明的實施方式1的圖像處理系統(tǒng)執(zhí)行的整個處理的概要的流程圖。
首先,在步驟S120,由MFP100的圖像讀取部110,以光柵方式掃描并讀取原稿,比如,得到600DPI-8位的圖像信號。由數(shù)據(jù)處理部115對此圖像信號實施前處理,并作為一頁大小的圖像數(shù)據(jù)保存到存儲部111。
之后,在步驟S121,在數(shù)據(jù)處理部115中進行塊選擇處理。此處理通過管理PC101的控制來執(zhí)行。
具體言之,管理PC101的CPU,對存放于存儲部111的作為處理對象的圖像信號,首先進行區(qū)域分割而成為文字/線畫部分和半色調(diào)圖像部分,再將文字/線畫部分以段落作為塊分割為各個塊,或分割為以線構成的各個表格、圖形。
另一方面,將半色調(diào)圖像部分分割為矩形的分離塊的圖像部分、背景部分等所謂各個塊獨立的對象(塊)。
另外,細節(jié)見后述,對由此BS處理生成的各塊,生成作為有關各個塊的信息的塊信息。
之后,在步驟S122,檢測與作為原稿圖像中的附加信息而記錄的二維條形碼或URL(或URI(通用資源標識符))相符的對象(塊)。在附加信息是URL圖像時,則利用OCR對該URL圖像進行字符識別。另一方面,在附加信息二維條形碼時,則利用OMR(光學標記閱讀器)對該二維條形碼圖像進行譯碼。
另外,在步驟S122,利用OCR對經(jīng)過步驟S121中的BS處理而得到的字符塊進行字符識別。
之后,在步驟S123,根據(jù)步驟S122的處理結果,檢測示出存放讀取原稿圖像的原始電子文件的存放地址的指針信息。
之后,在步驟S124,判定是否檢測到指針信息。在未檢測到指針信息時(在步驟S124中的“否”),就進入步驟S126。另一方面,在檢測到指針信息時(在步驟S124中的“是”),就進入步驟S125,判定在指針信息示出的存放地址是否存在原始電子文件。
另外,原始電子文件,比如,是存放于圖1的客戶機PC102內(nèi)的硬盤、數(shù)據(jù)庫105或MFP100本身具有的存儲部111之中的任何一個之內(nèi),就可以按照在步驟S123中檢測到的指針信息對這些存儲裝置進行檢索。
在步驟S125中未檢索到原始電子文件時(在步驟S125中的“否”),就進入到步驟S126。另一方面,在步驟S125中檢索到原始電子文件時(在步驟S125中的“是”),就進入到步驟S133。
另外,在步驟S125中,即使是檢索到原始電子文件,在該原始電子文件是以PDF或TIFF為代表的圖像數(shù)據(jù)時,則進入步驟S126。反之,在該原始電子文件是以前由本處理生成的矢量數(shù)據(jù)時,則進入步驟S133。
在步驟S126,根據(jù)在步驟S120中輸入的讀取原稿圖像,執(zhí)行檢索與其類似的電子文件的文件檢索處理。
在此文件檢索處理中,從在步驟S122中對各字符塊進行的OCR結果中抽取單詞,執(zhí)行對具有該單詞的電子文件進行檢索的全文檢索?;蛘?,執(zhí)行對具有由圖像信號中的各塊的排列和各塊的屬性(圖像、字符等)確定的布局(或類似布局)的電子文件進行檢索的布局檢索。
之后,在步驟S127,將作為文件檢索處理所得到的檢索結果電子文件(組)作為與讀取原稿圖像相對應的電子文件(或其索引圖像(代表圖像))的候選顯示于顯示部116,從該候選接受作為處理對象的電子文件的選擇。
另外,在候選為一個時,自動地從步驟S128進入到步驟S133。
在步驟S128,判定是否已經(jīng)從顯示于顯示部116上的電子文件的候選中選擇了電子文件。在已經(jīng)選擇電子文件時(步驟S128中的“是”),就進入到步驟S133。另一方面,在未選擇電子文件時(步驟S128中的“否”),則進入到步驟S129。
另外,在步驟S128中,即使是選擇了電子文件,在該電子文件是PDF或TIFF為代表的圖像信息時,就進入到步驟S129。
在步驟S129,執(zhí)行將圖像數(shù)據(jù)(在步驟S120中輸入的讀取原稿圖像(圖像數(shù)據(jù))或在步驟S127中選擇的圖像數(shù)據(jù)的電子文件)變換為矢量數(shù)據(jù)的矢量化處理。
在此矢量化處理中,首先,對在步驟S122中結果OCR處理的字符塊再識別字符的大小、字形、字體(Font),變換為與掃描原稿所得到的字符在外觀上忠實的字體數(shù)據(jù)。另一方面,對于由線構成的表格、圖形塊則進行輪廓化。另外,對于圖像塊,則作為圖像數(shù)據(jù)變換為單個的JPEG文件。
對這些各種塊的矢量化處理,是在各塊每一個的塊信息基礎上進行的,并且保存各塊的布局信息。
在步驟S137,執(zhí)行光柵化/比較/選擇處理。這是將由矢量化處理所得到的矢量數(shù)據(jù)經(jīng)光柵化而得到的光柵圖像的內(nèi)容和讀取原稿圖像進行比較并根據(jù)該比較內(nèi)容,作為與讀取原稿圖像相對應的電子文件,選擇讀取原稿圖像本身的圖像信息或相對應的矢量數(shù)據(jù)中的一個,比如,保存到存儲部111。另外,關于這一處理的細節(jié)見后述。
另外,在此處理中,最終成為保存對象的圖像信息或相對應的矢量數(shù)據(jù)的選擇,既可以由系統(tǒng)根據(jù)比較內(nèi)容自動選擇,也可以在顯示部116上提示兩者的圖像而由用戶進行選擇。
由此,在設想對與讀取原稿圖像相對應的電子文件進行再利用時,就可以以用戶希望的形態(tài)(圖像信息/矢量數(shù)據(jù))的電子文件進行保存管理。
之后,在步驟S130,執(zhí)行應用數(shù)據(jù)變換處理將在步驟S129中得到的矢量數(shù)據(jù)變換為可由文檔生成應用程序處理的規(guī)定形式(比如,rtf形式)的應用數(shù)據(jù)。于是,在步驟S131,將生成的該應用數(shù)據(jù)作為與在步驟S120中輸入的圖像數(shù)據(jù)相對應的電子文件,存放到存儲部111或文檔管理服務器106等。
之后,在步驟S132,為了以下在進行同樣處理之時,可以直接從讀取原稿圖像作為與其相對應的電子文件進行檢索,執(zhí)行生成電子文件的檢索用的索引信息的索引生成處理。于是,將所生成的索引信息,比如,添加到由存儲部111管理的檢索用索引文件。
在步驟S133,將在S125中檢索出的原始電子文件的存放地址、或在步驟S128中選擇的電子文件的存放地址或在步驟S131中存放的電子文件的存放地址通知顯示部116。
在步驟S134,判定來自輸入部113的操作指示是否是讀取原稿圖像的登記指示。在不是登記指示時(在步驟S134中的“否”),就進入到步驟S136。另一方面,在是登記指示時(在步驟S134中的“是”),就進入到步驟S135。
還有,步驟S134的處理,是為了使該圖像處理系統(tǒng)對不存在指針信息的讀取原稿圖像進行再利用,判定有無用戶意欲將該讀取原稿圖像的圖像信息/矢量數(shù)據(jù)/在步驟S128中所選擇的電子文件作為原始電子文件進行登記操作的執(zhí)行指示。
因此,在存在指針信息的讀取原稿圖像的場合,通常設想不執(zhí)行這一登記操作。但是,因為即使是存在指針信息并且與讀取原稿圖像相對應的原始電子文件已經(jīng)存在時,根據(jù)用途及目的,也存在要重新將此讀取原稿圖像進行登記的場合,所以此登記操作并不一定是對不存在指針信息的讀取原稿圖像執(zhí)行。
另外,在指示不進行登記操作而進行讀取原稿圖像的復制操作(印刷裝置)時,也可以在對原始電子文件進行登記的同時,將該原始電子文件作為對讀取原稿圖像的印刷品進行復制(印刷)。
在步驟S135,執(zhí)行生成對登記對象的讀取原稿圖像的指針信息并作為圖像數(shù)據(jù)附加到與該讀取原稿圖像相對應的原始電子文件的指針信息附加處理。于是,將附加有此指針信息的原始電子文件存放到,比如,圖1的客戶機PC102內(nèi)的硬盤、數(shù)據(jù)庫105、或MFP100本身具有的存儲部111之中的每一個內(nèi)。另外,也可以在存放的同時,由印刷部112將該原始電子文件進行印刷。
在步驟S136,在顯示部116上提示為了對與讀取原稿圖像相對應的原始電子文件執(zhí)行各種處理(編輯/貯存/傳送(發(fā)送FAX、發(fā)送電子信函、發(fā)送文件)/印刷)的操作畫面,并且可以通過該操作畫面執(zhí)行對原始電子文件的各種處理。
此處,作為各種處理,比如,在印刷(復制)的場合,在對各對象實施最優(yōu)色處理、空間頻率校正等圖像處理之后,由印刷部112進行印刷。另外,在貯存時,存儲保持于存儲部111。另外,在傳送(文件發(fā)送)時,作為通用的形式,比如,變換為RTF(多平臺文本格式)形式,或變換為SVG形式,變換為可由發(fā)送目的的地址再利用的文件形式,經(jīng)網(wǎng)絡I/F114向文件發(fā)送目的的地址(比如,客戶機PC102)進行發(fā)送。
這樣,在本圖像處理系統(tǒng)中,因為通常將矢量數(shù)據(jù)作為與原稿圖像相對應的電子文件進行管理,可以執(zhí)行利用該矢量數(shù)據(jù)的各種處理,所以可以削減作為處理對象的數(shù)據(jù)的信息量,并且提高貯存效率,縮短傳送時間,并且在輸出(顯示/印刷)時可以輸出高品質(zhì)的圖像。
下面對各處理的細節(jié)予以說明。
首先,對步驟121的BS處理的細節(jié)予以說明。
所謂BS處理,比如,是將圖4A的光柵圖像,如圖4B所示,作為有意義的各個塊進行識別,判定該塊的各個屬性(文字(TEXT)/圖片(PICTURE)/照相(PHOTO)/線(LINE)/表格(TABLE)等),分割為具有不同屬性的塊的處理。
下面對BS處理的實施方式進行說明。
首先,將輸入圖像二值化成為黑白圖像,進行輪廓線追蹤抽取由黑像素輪廓圍成的像素的塊。對于面積大的黑像素的塊,也對位于內(nèi)部的白像素進行輪廓線追蹤而抽取白像素的塊,并且再從大于等于一定面積的白像素的塊的內(nèi)部循環(huán)地抽取黑像素的塊。
將這樣得到的黑像素的塊以大小和形狀進行分類,分類為具有不同屬性的塊。比如,將縱橫比接近1,大小為一定范圍的塊作為與字符相當?shù)南袼貕K,將更接近的字符排列整齊可以成組的部分作為字符塊,將扁平的像素塊作為線塊,將大于等于一定大小并且是矩形的白像素塊排列整齊的內(nèi)包黑像素塊占據(jù)的范圍作為表格塊,將不定形的像素塊散在的區(qū)域作為照片塊,其以外的任意形狀的像素塊作為圖片塊。
于是,在BS處理中,發(fā)行確定各塊的塊ID,將各塊的屬性(圖像、字符等)、大小及原始文檔內(nèi)的位置(坐標)和各塊相關聯(lián)地存儲到存儲部111作為塊信息。另外,這些塊信息,將在以下詳細說明的步驟S129的矢量化處理及步驟S132的索引生成處理中予以利用。
下面利用圖5對塊信息的一例予以說明。
圖5為示出本發(fā)明的實施方式1塊信息的一例的示圖。
如圖5所示,塊信息是由表示各塊的屬性的(1文字、2圖片、3表格、4線、5照片)塊屬性;塊的位置坐標(X、Y);塊的寬度W及高度H;塊的OCR信息(文字數(shù)據(jù))有無構成的。
其中,所謂塊的位置坐標(X、Y),比如,是以原稿圖像的左上角作為原點(0,0)時的位置坐標。另外,寬度W及高度H,比如,以像素數(shù)表示。另外,在此塊信息之外,在BS處理中,還生成表示在原稿圖像(輸入文件)中存在的塊數(shù)N的文件信息。在圖5的示例的場合,輸入文件信息N=6。
下面利用圖6對圖3的步驟S122的處理予以詳細說明。
圖6為示出本發(fā)明的實施方式1步驟S122的處理的細節(jié)的流程圖。
另外,在圖6中,比如,對附加到如圖7所示的原稿圖像310中的二維條形碼(比如,QR編碼符號)311進行譯碼,輸出數(shù)據(jù)字符串的處理予以說明。
首先,在步驟S300,由CPU(未圖示)對表示存放于數(shù)據(jù)處理部115內(nèi)的頁存儲器中的原稿圖像310的圖像進行掃描,根據(jù)上述的BS處理的處理結果,檢測規(guī)定的二維條形碼符號311(塊)的位置。
特別是,在實施方式1的場合,作為二維條形碼符號311的QR碼的位置檢測模式,由配置于二維條形碼符號311的四個角部內(nèi)的三個角部的同樣的位置檢測模式構成。因此,在實施方式1中,通過檢測此位置檢測模式,檢測出二維條形碼符號311的位置。
之后,在步驟S301,將與位置檢測模式鄰接的形式信息復原,取得應用于符號的糾錯級及屏蔽模式。
之后,在步驟S302,決定確定二維條形碼符號311的型號。其后,在步驟S303,使用由形式信息取得的屏蔽模式,通過對編碼區(qū)域位模式進行XOR運算解除屏蔽處理。
之后,在步驟S304,按照與模型相對應的配置規(guī)則,讀取符號字符,復原二維條形碼符號311的數(shù)據(jù)碼字及糾錯碼字。
之后,在步驟S305,在復原的糾錯碼字方面,判定有無錯誤。在沒有錯誤時(在步驟S305中的“否”),就進入到步驟S307,而在判定有錯誤時(在步驟S305中的“是”),就進入到步驟S306進行糾錯。
在步驟S307,由進行了糾錯的數(shù)據(jù),根據(jù)模式指示器及字符數(shù)指示器,將數(shù)據(jù)碼字分割為段。
最后,在步驟S308,根據(jù)使用模式,將數(shù)據(jù)字符譯碼,并將該譯碼結果輸出。
另外,組合到二維條形碼內(nèi)的信息,表示對應的電子文件的地址信息(指針信息)。此處所謂的地址信息表示的是由服務器名和目錄、文件名組成的電子文件的存放地址的全稱路徑信息。
另外,在實施方式1中,是對指針信息作為二維條形碼附加的原稿圖像310的示例進行說明的,但指針信息也可以作為直接字符串印刷到原稿圖像310上。此時,按照規(guī)定的規(guī)則的字符塊在前面的BS處理中檢測,通過對顯示指針信息的字符圖像的各字符進行文字識別,可以直接得到原始電子文件的地址信息。
另外,也可以針對圖7的原稿圖像310的字符塊312或字符塊313,對鄰接的字符和字符的字符間隔認識的困難程度加以調(diào)制,通過在此字符間隔中嵌入信息而將指針信息嵌入原稿圖像310中。此時,通過在進行后述的字符識別處理之際檢測各字符的字符間隔,可以獲得指針信息。此外,在自然畫314中,也可以附加指針信息作為電子水印信息。
下面利用圖8的流程圖對圖3的步驟S125中的利用指針信息進行原始電子文件的檢索處理予以說明。
圖8為示出本發(fā)明的實施方式1的原始電子文件的檢索處理的流程圖。
首先,在步驟S400,MFP100,根據(jù)包含于指針信息中的地址信息,確定成為電子文件的存放地址的文件服務器。
此處,所謂的文件服務器指的是客戶機PC102、管理數(shù)據(jù)庫105的文檔管理服務器106或內(nèi)置存儲部111的MFP100本身。
之后,在步驟S401,MFP100,對確定的文件服務器傳送地址信息。
在步驟S402,文件服務器,在接收到地址信息時,檢索與該地址信息相對應的原始電子文件。在步驟S403,判定原始電子文件是否存在。在原始電子文件不存在時(步驟S403中的“否”),就將這一點通知MFP100。
另一方面,在原始電子文件存在時(步驟S403中的“是”),就將進入到步驟S408,并且在通知原始電子文件的地址的同時,將該讀取原稿圖像傳輸給MFP100。
另外,在圖8的處理中,在意欲更加提高安全性時,比如,如圖9所示,也可以對要求原始電子文件的用戶進行鑒別。就是說,在作為處理對象的原始電子文件之中,有限制第三者再利用的,在圖8的處理中,貯存于文件服務器中的原始電子文件全部可以是自由訪問的,這是以原始電子文件整體或原始電子文件的一部分可以再利用為前提。
下面利用圖9就關于對各用戶訪問原始電子文件有限制時的處理予以說明。
圖9為示出本發(fā)明的實施方式1的原始電子文件的檢索處理的應用例流程圖。
另外,在圖9的處理中,對于與圖8的處理的同一處理附加同一步驟S編號,其說明則省略。
在圖9中,在步驟S403,在存在原始電子文件時,就在步驟S404中,判定對該原始電子文件的訪問是否有限制。在對訪問沒有限制時(步驟S404中的“否”),就進入到步驟S408。另一方面,在對訪問有限制時(步驟S404中的“是”),就進入到步驟S405,MFP100,在顯示部116上提示口令輸入畫面,要求操作MFP100的用戶輸入口令。
在步驟S406,在MFP100輸入口令時,就將其傳送到文件服務器。在步驟S407,判定由文件服務器進行的基于口令的認證是否通過。在認證失敗時(步驟S407中的“否”),就進入到步驟S405。另一方面,在認證通過時(步驟S407中的“是”),就進入到步驟S408。
另外,其構成是在步驟S407中,在認證失敗時,要求再次輸入口令,也可以在認證失敗次數(shù)超過規(guī)定次數(shù)時,判斷其為非法用戶操作而將處理本身中止。
另外,在步驟S407中的認證方法,并不限定于使用口令的認證方法,比如,也可以使用指紋認證等廣泛使用的生物認證、卡片認證等所有一切認證方法實現(xiàn)。
另外,這一認證,也可以在以下的文件檢索處理中應用。
另外,在不能從文件服務器中檢索原始電子文件時,就是說,對于圖3的步驟S129~步驟S132的一系列處理,也可以應用同樣的認證。就是說,在檢測到對讀取原稿圖像的訪問權存在限制時,就只有在該訪問權的認證通過時,通過執(zhí)行步驟S129以下的處理,可以限制可由圖像處理系統(tǒng)執(zhí)行區(qū)別用戶和區(qū)別讀取原稿圖像的處理,可以進一步提高保密性。
下面利用圖5及圖10對圖3的步驟S126的處理予以詳細說明。
圖10為示出本發(fā)明的實施方式1步驟S126的處理的細節(jié)的流程圖。
另外,步驟S126的處理,是在步驟S124中不存在對讀取原稿圖像(輸入文件)的指針信息,或者存在指針信息但找不到原始電子文件,或者原始電子文件是圖像文件時執(zhí)行。
另外,步驟S126的處理,可以利用步驟S122的處理所得到的塊信息及輸入信息,下面作為具體示例,利用圖5所示的塊信息及輸入信息進行說明。另外,在圖5的塊信息中,各塊是按照X坐標從小到大的順序,即按照X1<X2<X3<X4<X5<X6對塊1、塊2、塊3、塊4、塊5、塊6進行管理。
下面利用圖10對使用這些塊信息及輸入文件信息,從文件服務器管理的數(shù)據(jù)庫內(nèi)通過布局檢索處理來檢索與輸入文件類似的電子文件的處理予以說明。此處,是以對于由數(shù)據(jù)庫管理的各電子文件賦予與圖5同樣的文件信息及塊信息為前提。另外,布局檢索處理,是通過執(zhí)行順序比較輸入文件和數(shù)據(jù)庫中的電子文件進行的。
首先,在步驟S510,設定用來計算后述的相似率的各種初始值。之后,在步驟S511,進行塊總數(shù)的比較。此處,在假設輸入文件的總塊數(shù)為n,數(shù)據(jù)庫中的作為比較對象的電子文件的總塊數(shù)為N,誤差為ΔN時,此處的比較將判定條件式N-ΔN<n<N+ΔN是否滿足。
在步驟S511中,在不滿足條件式時(在步驟S511中的“否”),就進入到步驟S526,將作為處理對象的電子文件設定為下一個電子文件,返回到步驟S510。另一方面,在滿足條件式時(在步驟S511中的“是”),通過步驟S512以下的處理,根據(jù)輸入文件和作為比較對象的電子文件內(nèi)的塊信息執(zhí)行比較。
首先,在步驟S512,根據(jù)塊信息,比較輸入文件和作為比較對象的電子文件各個作為處理對象的塊的塊屬性。在塊屬性不一致時,就進入到步驟S521,在作為比較對象的電子文件的總塊數(shù)N≥輸入文件的塊數(shù)n時,作為作為處理對象的塊,設定為輸入文件的下一個塊。另一方面,在作為比較對象的電子文件的總塊數(shù)N<輸入文件的塊數(shù)n時,作為作為處理對象的塊,設定為作為比較對象的電子文件的下一個塊。
另一方面,在步驟S512中,在塊屬性一致時,就進入到步驟S513,計算出屬性相似率,將該值更新。
在步驟S514,根據(jù)塊信息,對輸入文件和作為比較對象的電子文件的各自的作為處理對象的塊的大小(寬度及高度)進行比較。此處,在設定輸入文件中的作為處理對象的寬度為w,高度為h,作為比較對象的電子文件中的作為處理對象的塊的寬度為W,其誤差為ΔW,高度為H,其誤差為ΔH時,此處的比較可判定條件式W-ΔW<w<W+ΔW及H-ΔH<h<H+ΔH是否滿足。
另外,在此條件式之外,也可進行塊的位置(X,Y)的比較。
在步驟S514中,在不滿足條件式時(步驟S514中的“否”),就進入到步驟S521。另一方面,在滿足條件式時(步驟S514中的“是”),就進入到步驟S515,計算出大小相似率,將該值更新。
在步驟S516,根據(jù)塊信息,判定有無輸入文件和作為比較對象的電子文件的各自的作為處理對象的塊的OCR信息。在不存在OCR信息時(步驟S516中的“否”),就進入到步驟S521。另一方面,在存在OCR信息時(步驟S516中的“是”),就進入到步驟S517,比較OCR信息。
在步驟S518,計算出OCR相似率,將該值更新。在步驟S519,判定對輸入文件中的全部塊的比較處理是否結束。在比較處理未結束時(步驟S519中的“否”),就進入到步驟S520,在作為比較對象的電子文件的總塊數(shù)N≤輸入文件的塊數(shù)n時,作為作為處理對象的塊,設定為輸入文件的下一個塊。另一方面,在作為比較對象的電子文件的總塊數(shù)N>輸入文件的塊數(shù)n時,作為作為處理對象的塊,設定為作為比較對象的電子文件的下一個塊。
另一方面,在步驟S519中,比較處理結束時(步驟S519中的“是”),就進入到步驟S522。
在步驟S522中,根據(jù)在步驟S513、步驟S515、步驟S518中計算出的各種相似率,計算出總和相似率。
另外,關于步驟S513、步驟S515、步驟S518的各種相似率的計算方法,因為可以利用現(xiàn)有公知的技術算出,所以此處將該計算方法的細節(jié)予以省略。
在步驟S523,判定總和相似率是否大于規(guī)定閾值Th。在總和相似率不到規(guī)定閾值Th時(步驟S523中的“否”),就進入到步驟S526。另一方面,在總和相似率大于規(guī)定閾值Th時(步驟S523中的“是”),就進入到步驟S524,將該電子文件作為輸入文件的相似候選進行保存。
之后,在步驟S525,判定對數(shù)據(jù)庫中的全部電子文件的比較處理是否結束。在比較處理未結束時(步驟S525中的“否”),就進入到步驟S526。另一方面,在比較處理結束時(步驟S525中的“是”),就結束處理。
通過以上的處理,在存在總和相似率大于規(guī)定閾值Th的電子文件時,就確定該電子文件是與輸入文件相似的電子文件候選。于是,通過將此電子文件候選在圖3的步驟S127中輸出,用戶可以選擇所希望的電子文件。
下面對圖3的步驟S129的矢量化處理的細節(jié)予以說明。
在矢量化處理中,對于字符塊,首先,進行各字符的字符識別處理。
在此字符識別處理中,對于從字符塊以字符為單位切出的字符圖像,利用模式匹配的方法進行字符識別,取得對應字符編碼。特別是,此字符識別處理,是將從字符圖像所得到的特征變換為數(shù)十維的數(shù)值列的觀測特征矢量和預先對每個字符類型求出的詞典特征矢量進行比較并將距離最近的字符類型作為識別結果。
特征矢量的抽取有多種公知的方法,比如,有一種方法的特征是將字符分割為網(wǎng)格狀,將各網(wǎng)格塊內(nèi)的字符線按照方向區(qū)分作為線素進行計數(shù)的網(wǎng)格數(shù)維矢量。
于是,在字符塊進行字符識別處理時,首先,對該字符塊進行橫寫/豎寫判定,在各個相對應的方向上切出字符串,之后,從字符串切出字符而取得字符圖像。
橫寫/豎寫的判定,是在該字符塊內(nèi)取像素值的水平/垂直的射影,并且在水平射影的差異大時判斷為橫寫,而在垂直射影的差異大時判定為豎寫。分解為字符串及字符,在橫寫的字符塊的場合,是利用其水平方向的射影將行進行切出,再對求出的行從垂直方向的射影切出字符。另一方面,對于豎寫的字符塊將水平和垂直倒過來即可。
另外,利用這種字符識別處理可以檢測字符的大小。
此外,通過對在字符識別處理中使用的字符類型數(shù)多少的詞典特征矢量在字符形狀種類,即字體種類方面準備多種,在匹配時通過與字符編碼一起輸出字體種類,可進行字符的字體識別。
利用通過以上的字符識別處理得到的字符編碼及字體信息,利用各個預先準備的輪廓數(shù)據(jù),可將字符部分的信息變換為矢量數(shù)據(jù)。另外,在原稿圖像為彩色圖像時,從該彩色圖像抽取各字符的顏色與矢量數(shù)據(jù)一起進行記錄。
通過以上的處理,就可以將屬于字符塊的圖像信息變換為在形狀、大小、顏色上大致忠實的矢量數(shù)據(jù)。
之后,對于字符塊以外的圖片及或線、表格塊,將從該塊中抽取的像素塊的輪廓變換為矢量數(shù)據(jù)。
具體言之,在將構成輪廓的像素的點序列(點列)看作是角的點進行劃分而對各區(qū)間以部分直線或曲線近似。所謂的角是曲率極大的點,曲率極大的點,如圖11所示,可以作為在相對任意點Pi左右k個分離的點Pi-k、Pi+k之間引出一條弦時,此弦和PI的距離為極大的點而求出。
另外,以Pi-k、Pi+k之間的弦的長度/弧長為R,可以將R值小于等于閾值的點看作是角。由角分割后的各區(qū)間,是直線時可利用對點列的最小二乘法等計算式,是曲線時可利用三維樣條函數(shù)等函數(shù)進行矢量化。
另外,在對象具有內(nèi)輪廓時,利用在BS處理中抽取的白像素輪廓點,同樣以部分直線或曲線進行近似。
如上所述,在采用輪廓區(qū)分線近似時,可以將任意形狀的圖形的輪廓矢量化。另外,在原稿圖像為彩色圖像時,也可從該彩色圖像抽取圖形顏色與矢量化數(shù)據(jù)一起記錄。
另外,如圖12所示,在某一區(qū)間中外輪廓和內(nèi)輪廓或別的外輪廓接近時,兩個輪廓線可合二而一而表現(xiàn)為粗線。
具體言之,從某一輪廓的各點Pi引一根距離最短的線到另一輪廓上的點Qi時,各距離PQi平均小于等于一定長度時,給定的區(qū)間以PQi中點為點列,以直線或曲線近似,其粗度為PQi的平均值。作為線和線的集合體的表格線,作為具有這種粗度的線的集合體可以效率更高地以矢量表示。
另外,前面說明的是利用對字符塊字符識別處理進行矢量化,并將該字符識別處理的結果作為詞典上的距離最近的字符的識別結果使用,在此距離大于等于規(guī)定值時,不一定與本來的字符一致,常常認錯形狀類似的字符。
因此,在本發(fā)明中,對于這種字符塊,進行與一般線畫同樣的處理,將該字符塊輪廓化。就是說,對于以線移動字符識別處理會引起誤認的字符不矢量化為錯誤的字符,而是以忠實的輪廓化的方法矢量化為可視圖像數(shù)據(jù)。
另外,對于照片塊,作為圖像數(shù)據(jù)保持原樣不變,不執(zhí)行矢量化。
之后,利用圖13對于將經(jīng)過矢量化處理所得到的矢量數(shù)據(jù)對每個圖像塊實行成組化的成組處理予以說明。
圖13為用來說明本發(fā)明的實施方式1的矢量數(shù)據(jù)的成組化處理的流程圖。
特別是,在圖13中,對于將矢量數(shù)據(jù)對每個圖像塊進行的成組化處理進行說明。
首先,在步驟S700,算出各矢量數(shù)據(jù)的始點和終點。之后,在步驟S701,利用各矢量數(shù)據(jù)的始點、終點信息檢測圖形元素。
此處,所謂的圖形元素檢測,是對由區(qū)分線構成的封閉圖形進行的檢測。在檢測時,是應用構成封閉形狀的各矢量其兩端上分別連接有矢量這一原理進行檢測。
之后,在步驟S702,將存在于圖形元素內(nèi)的其他圖形元素或區(qū)分線成組化,作為一個圖形對象。另外,在圖形元素內(nèi)不存在其他圖形元素、區(qū)分線時,就將圖形元素作為圖形對象。
下面利用圖14對圖13的步驟S701的處理予以詳細說明。
圖14為示出本發(fā)明的實施方式1步驟S701的處理的細節(jié)的流程圖。
首先,在步驟S710,從矢量數(shù)據(jù)中將兩端不連接的不要的矢量去掉,抽出封閉圖形構成矢量。
之后,在步驟S711中,將封閉圖形構成矢量中的始點作為開始點,按照順時鐘方向追蹤矢量。于是,將這一追蹤進行到返回開始點,將通過的矢量全部作為構成一個圖形元素的封閉圖形進行成組化。并且,將還未成組化的矢量的始點作為開始點,重復進行同樣的處理。
最后,在步驟S712,檢測出將在步驟S710中去掉的不要的矢量內(nèi)的在步驟S711中作為封閉圖形進行成組化的矢量所連接的矢量(封閉圖形連接矢量),并作為一個圖形元素進行成組化。
通過以上的處理,就可以將圖像塊作為可以個別利用的個別圖形對象進行處理。
下面對圖3的步驟S130的應用數(shù)據(jù)變換處理予以詳細說明。
此處,圖3的步驟S121的BS處理和步驟S129的矢量化處理的處理結果是變換為圖15所示的中間數(shù)據(jù)形式的文件,這種數(shù)據(jù)形式稱為文檔分析輸出格式(DAOF)。
下面利用圖15對DAOF的數(shù)據(jù)結構予以說明。
圖15為示出本發(fā)明的實施方式1的DAOF的數(shù)據(jù)結構的示圖。
在圖15中,在Header791中保持有關作為處理對象的原稿圖像的信息。在布局描述數(shù)據(jù)部792中保持原稿圖像中的TEXT(文字)、TITLE(標題)、CAPTION(標注)、LINEART(線畫)、PICTURE(自然畫)、FRAME(框格)、TABLE(表格)等的每個屬性了解到的各塊的屬性信息及其矩形地址信息。
在字符識別描述數(shù)據(jù)部793中,保持對TEXT、TITLE、CAPTION等的TEXT塊進行字符識別而得到的字符識別結果。
在表格描述部794中存儲TABLE塊的結構的細節(jié)。圖像描述數(shù)據(jù)部795,將PICTURE及LINEART等的塊的圖像數(shù)據(jù)從文檔圖像數(shù)據(jù)中切出保持。
這種DAOF,不僅作為中間數(shù)據(jù),也有將其本身文件化進行保存的場合,在此文件狀態(tài)中,一般所謂的文檔生成應用程序不能對各個對象(塊)進行再利用。
下面利用圖16對在實施方式1中,從此DAOF變換為可由文檔生成應用程序利用的應用數(shù)據(jù)的應用數(shù)據(jù)變換處理(步驟S130)的細節(jié)予以說明。
圖16為示出本發(fā)明的實施方式1步驟S130的處理的細節(jié)的流程圖。
首先,在步驟S8000,進行DAOF數(shù)據(jù)的輸入。之后,在步驟S8002,生成成為應用數(shù)據(jù)的基礎的文檔結構樹。于是,在步驟S8004中,以文檔結構樹為基礎,使DAOF內(nèi)的實數(shù)據(jù)流入而生成實際的應用數(shù)據(jù)。
下面利用圖17對圖16的步驟S8002的處理的細節(jié)予以說明。
圖17為示出本發(fā)明的實施方式1步驟S8002的處理的細節(jié)的流程圖。另外,圖18為本發(fā)明的實施方式1的文檔結構樹的說明圖。
另外,在圖17的處理中,作為整體控制的基本規(guī)則,處理的流程,從微塊(單一塊)轉移到宏塊(塊的集合體)。
以后,所謂的塊,指的是微塊和宏塊全體。
首先,在步驟S8100,以塊為單位,以縱向的關聯(lián)性為基礎進行再成組化。在開始之后立即成為以微塊為單位的判定。
此處,所謂的關聯(lián)性,可以定義為距離、塊寬度(在橫向時為高度)為大致相同的意思。另外,距離、寬度、高度等的信息參照DAOF抽出。
比如,圖18A為實際的原稿圖像的頁結構,圖18B為其文檔結構樹。通過步驟S8100的處理,塊T3、T4、T5作為一個組V1,塊T6、T7作為一個組V2首先作為同層次組生成。
在步驟S8102中,檢查有無縱向的分隔塊。所謂分隔塊指的是,比如,物理上在DAOF中具有線屬性的塊。另外,作為邏輯意義,是在文檔生成應用程序中明示對塊進行分割的元素。此處,在檢測到分隔塊時,在同一層次進行再分割。
在步驟S8104中,利用縱向的組長度判定此外是否不能存在分割。具體言之,是判定縱向的組長度是否是原稿圖像的頁高度。在縱向的組長度是頁高度時(步驟S8104中的“是”),處理結束。另一方面,在縱向的組長度不是頁高度時(步驟S8104中的“否”),就進入到步驟S8106。
在圖18A的原稿圖像的場合,因為既沒有分隔塊,組長度也不是頁高度,就進入到步驟S8106。
在步驟S8106,以塊為單位,以橫向的關聯(lián)性為基礎進行再成組化。此處也是在開始之后第一次立即成為以微塊為單位的判定。
在圖18A的原稿圖像的場合,以塊T1、T2作為組H1,以組V1、V2作為組H2作為組V1、V2的層次上一個同層次組生成。
在步驟S8108中,檢查有無橫向的分隔塊。在圖18A中,因為S1成為橫向分隔塊,將其登記到文檔結構樹,生成H1、S1、H2轉移到層次。
在步驟S8110中,利用橫向的組長度判定此外是否不能存在分割。具體言之,是判定橫向的組長度是否是頁寬度。在橫向的組長度是頁寬度時(步驟S8110中的“是”),處理結束。另一方面,在橫向的組長度不是頁寬度時(步驟S8110中的“否”),就返回到步驟S8102,再次在更高一個層次上執(zhí)行步驟S8100以下的處理。
在圖18A的場合,因為橫向的組長度成為頁寬度,在標準S8110中處理結束,最后,表示整個頁的最上位層次的V0附加到文檔結構樹。
在文檔結構樹完成之后,根據(jù)該文檔結構樹,在圖16的步驟S8004中,生成應用數(shù)據(jù)。
在圖18A的場合,具體言之,是以以下的方式生成應用數(shù)據(jù)。
就是說,因為在橫向上H1有兩個塊T1和T2,作為兩個列輸出,輸出塊T1的內(nèi)部信息(參照DAOF,字符識別的結果的文章、圖像等),其后,改變列,輸出塊T2的內(nèi)部信息,其后,輸出S1。
之后,因為在橫向上H2有兩個塊V1和V2,作為兩個列輸出,塊V1以T3、T4、T5的順序輸出其內(nèi)部信息,其后,改變列,輸出塊V2的T6、T7的內(nèi)部信息。
如上所述,執(zhí)行從DAOF到應用數(shù)據(jù)的變換處理。
下面利用圖19對圖3的步驟S135的處理的細節(jié)予以說明。
圖19為示出本發(fā)明的實施方式1步驟S135的處理的細節(jié)的流程圖。
另外,在圖19中,比如,對作為指針信息的數(shù)據(jù)字符串以二維條形碼(QR編碼符號JIS X0510)311進行編碼,附加到圖像中的處理予以說明。
另外,組合到二維條形碼中的數(shù)據(jù),表示對應的電子文件的地址信息,比如,由文件服務器的名字及文件名組成的路徑信息所構成?;蛘撸蓪亩S條形碼內(nèi)的URL(URI)及在存放對應的電子文件的數(shù)據(jù)庫105內(nèi)或在MFP100本身具有的存儲部111內(nèi)進行管理的文件ID等構成。
首先,在步驟S900,為了識別編碼的種種的不同字符,對輸入的數(shù)據(jù)串進行分析。另外,選擇檢錯及糾錯級,選擇可以收容輸入數(shù)據(jù)的最小型號。
在步驟S901,將輸入數(shù)據(jù)串變換為規(guī)定的位串,按照需要附加表示數(shù)據(jù)的模式(數(shù)字、英數(shù)字、8位字節(jié)、漢字等等)的指示器及終端模式。另外,變換為規(guī)定的位代碼字。
此時,為了進行糾錯,在步驟S902,將代碼字串與型號就糾錯級相對應地分割為規(guī)定的塊數(shù),對每個塊生成糾錯代碼字,附加到數(shù)據(jù)代碼字串之后。
在步驟S903,將在步驟S902中得到的各塊的數(shù)據(jù)代碼字連接,將各塊的糾錯代碼字,需要時將剩余代碼字后續(xù)。
在步驟S904,在矩陣中與位置檢測模式、分離模式、定時模式及定位模式等等一起配置代碼字模塊。
在步驟S905,選擇對符號編碼區(qū)域最優(yōu)的屏蔽模式,對屏蔽模式利用在步驟S904中得到的模塊執(zhí)行通過XOR運算處理進行變換的屏蔽處理。
在步驟S906,利用在步驟S905中得到的模塊生成形式信息及型號信息,完成二維編碼符號。
通過以上的處理,組合了地址信息的二維條形碼,比如,在從客戶機PC102將對應的電子文件作為印刷數(shù)據(jù)在印刷部112中印刷時,在數(shù)據(jù)處理部115內(nèi),變換為可記錄的光柵數(shù)據(jù)之后,附加到該電子文件的光柵數(shù)據(jù)上的固定地點進行印刷。此處,通過在圖像讀取部110中讀取印刷二維條形碼(指針信息)的印刷品(原稿),可以檢測到由該指針信息確定的原始電子文件的存放場所。
另外,為了同樣的目的,除了將指針信息在二維條形碼中表現(xiàn)之外,也可應用,比如,利用直接字符串附加到電子文件的方法、通過調(diào)制電子文件上的字符串,特別是,調(diào)制字符和字符的間隔嵌入信息的方法、嵌入到在電子文件的中間色調(diào)圖像(索引圖像)中的方法等等一般稱為電子水印的方法。
下面對步驟S137的光柵化/比較/選擇處理予以說明。
這一處理的光柵化處理,是將利用步驟S129中的光柵化處理所得到的矢量化數(shù)據(jù),比如,再次在存儲部111中展開而變換為光柵數(shù)據(jù)。
之后,在比較處理中,在實施方式1中,如圖20所示,對在步驟120中得到的讀取原稿圖像的圖像信息(第一圖像信息)和經(jīng)過光柵化處理從矢量數(shù)據(jù)再變換為光柵數(shù)據(jù)的圖像信息(第二圖像信息)進行XOR運算,導出兩者不同的部分。
之后,在選擇處理中,根據(jù)比較處理的處理結果,將在步驟S120中得到的讀取原稿圖像的圖像信息,或通過步驟S129的矢量化處理所得到的矢量數(shù)據(jù)中的任何一個,為了作為與讀取原稿圖像的電子文件進行登記而進行選擇。
作為這一選擇的方法,比如,有以下的方法。
(1)在第一及第二圖像信息兩者之間存在不同部分時,選擇第一圖像數(shù)據(jù)作為與讀取原稿圖像相對應的電子文件。
(2)在第一及第二圖像信息兩者之間的不同部分的比例小于等于閾值時,選擇與第二圖像信息相對應的矢量數(shù)據(jù)。
此選擇,比如,可由數(shù)據(jù)處理部115自動執(zhí)行。另外,作為其他的選擇方法有(3)由顯示部116提示比較處理結果(第一圖像數(shù)據(jù)和第二圖像數(shù)據(jù)),根據(jù)用戶的操作,選擇(1)或(2)。
(4)對通過塊選擇處理所得到的塊的每一個種類選擇(1)或(2)。
另外的別的選擇方法有(5)也是在(1)的場合,在用戶指示的操作內(nèi)容是圖像編輯時,選擇與第二圖像信息相對應的矢量數(shù)據(jù)。
(6)在構成為(2)的閾值可通過用戶的操作改變時,根據(jù)用戶操作所設定的閾值選擇(2)。
除此之外,也可以根據(jù)用途及目的,可將(1)~(6)或其以外的選擇方法任意組合,決定選擇第一圖像信息或選擇與第二圖像信息相對應的矢量數(shù)據(jù)作為電子文件的選擇條件。
在實施方式1中,與讀取原稿圖像相對應的原始電子文件(電子文件)的檢索,其構成為根據(jù)該讀取原稿圖像中的指針信息或讀取原稿圖像中的各對象的對象信息(屬性信息、布局、OCR信息等)執(zhí)行的,在更準確檢索原始電子文件時,其構成也可為根據(jù)指針信息和對象信息兩者執(zhí)行。
就是說,假使從讀取原稿圖像的指針信息可以檢索到原始電子文件,并且在對從讀取原稿圖像的指針信息檢索到的原始電子文件進行基于讀取原稿圖像中的對象信息的檢索(比如,按照布局的布局檢索、利用OCR信息的全文檢索等)可以獲得很高符合率時,就可以將該原始電子文件確定為正式的原始電子文件。
特別是,藉助這種構成,比如,對于由于指針信息的檢測精度可疑而檢出多個原始電子文件候選的場合,由于通過進行基于對象信息的檢索,可進一步地縮小原始電子文件候選的范圍,是以可以實現(xiàn)更高速并且精度高的原始電子文件確定。
在實施方式1中,其構成為在不能確定與讀取原稿圖像相對應的原始電子文件或電子文件時,對該讀取原稿圖像整個藉助矢量化處理,比如,在作為處理對象的讀取原稿圖像中有時該圖像中的對象并非全部都是新生成的,一部分對象是從現(xiàn)有的其他電子文件流傳過來而生成的。
比如,背景對象(壁紙),通常是由文檔生成應用程序預先生成幾個模式,可從中選擇使用。所以,這種背景對象,在文件服務器中的已有電子文件中存在的可能性很高,并且,作為可以再利用的矢量數(shù)據(jù)存在的可能性很高。
所以,作為圖3的步驟S129的矢量化處理的另一實施方式,也可以對通過塊選擇處理分割為個別的對象的各對象,以該對象單位從文件服務器中檢索包含作為處理對象的對象,并且在檢索時,對于該對象,可以從個別檢索到的電子文件以對象單位取得矢量數(shù)據(jù)。
藉助這樣的構成,不需要對整個讀取原稿圖像實施矢量化處理,所以可以在更高速地實施矢量化處理的同時,防止由于矢量化處理引起的畫質(zhì)劣化。
另一方面,在利用圖3的步驟檢索處理檢索到的電子文件是PDF文件時,有時候?qū)τ谠揚DF文件中的字符對象已經(jīng)存在附加有經(jīng)過字符識別的字符代碼的文件。于是,對于這種PDF文件,在應用矢量化處理的場合,如果使用該附加文件(字符代碼文件),就可以省略作為步驟S129的處理的一部分執(zhí)行的字符識別處理,可以使矢量化處理以更高的速度執(zhí)行。
如上所述,根據(jù)實施方式1,通過將讀取原稿圖像的第一圖像信息和從作為與讀取原稿圖像相對應的電子文件而臨時生成的矢量數(shù)據(jù)所得到的第二圖像信息進行比較,并且相應于該比較內(nèi)容選擇最終利用的數(shù)據(jù)形態(tài)的數(shù)據(jù)(圖像數(shù)據(jù)或矢量數(shù)據(jù))作為與讀取原稿圖像相對應的電子文件,可以防止利用與讀取原稿圖像的內(nèi)容顯著不同的電子文件。
另外,在進行矢量化處理時,通過以讀取原稿圖像中的對象單位檢索與該對象相對應的矢量數(shù)據(jù),在檢索時用作與該對象相對應的矢量數(shù)據(jù),可以實現(xiàn)高精度高速矢量化處理。
<實施方式2>
實施方式2,對在實施方式1的“矢量化的應用例”中,由對象選擇處理分割的每個個別的對象進行矢量化處理及光柵化/比較/選擇處理的構成予以說明。
下面利用圖21對實施方式2的矢量化處理及光柵化/比較/選擇處理的概念予以說明。
圖21為用來說明本發(fā)明的實施方式2的矢量化處理及光柵化/比較/選擇處理的概念的示圖。
如圖21所示,在實施方式2中,通過進行實施方式1的圖3的步驟S121的塊選擇,比如,得到塊BS1、BS2、...、BSN(N正整數(shù))。之后,經(jīng)過圖3的步驟S122~步驟S128的處理,在進行步驟S129的矢量化處理時,對塊BS1、BS2、...、BSN分別執(zhí)行矢量化處理而得到矢量數(shù)據(jù)VBS1、VBS2、...、VBSN。
之后,在進行圖3的步驟S137的光柵化/比較/選擇處理的光柵化時,對矢量數(shù)據(jù)VBS1、VBS2、...、VBSN分別執(zhí)行光柵化處理而得到光柵數(shù)據(jù)RBS1、RBS2、...、RBSN。
之后,在進行圖3的步驟S137的光柵化/比較/選擇處理時,將塊BS1、BS2、...、BSN和光柵數(shù)據(jù)RBS1、RBS2、...、RBSN分別進行比較,并根據(jù)該比較結果,選擇塊(圖像)或矢量數(shù)據(jù)的任何一個作為最終選擇的對象的電子文件。在圖21中示出的是選擇BS1、VBS2、...、VBSN的狀態(tài)。
如上所述,根據(jù)實施方式2,在實施方式1中說明的效果之外,通過以讀取原稿圖像的對象單位,選擇該讀取原稿圖像的各對象的圖像信息或矢量數(shù)據(jù)作為與該讀取原稿圖像相對應的電子文件,可以更進一步地利用與由用戶所希望的內(nèi)容構成的讀取原稿圖像相對應的電子文件。
<實施方式3>
在實施方式2中,其構成是由對象選擇處理分割的每個對象(塊)進行矢量化處理及光柵化/比較/選擇處理,但也可以是根據(jù)對象選擇處理分割的各對象(塊)的屬性,進行光柵化/比較/選擇處理。
下面利用圖22對實施方式3的矢量化處理及光柵化/比較/選擇處理的概念予以說明。
圖22為用來說明本發(fā)明的實施方式3的矢量化處理及光柵化/比較/選擇處理的概念的示圖。
如圖22所示,在實施方式3中,通過進行實施方式1的圖3的步驟S121的塊選擇,比如,得到塊BS1(TEXT屬性)、BS2(PHOTO屬性)、...、BSN(TABLE屬性)(N正整數(shù))。之后,經(jīng)過圖3的步驟S122~步驟S128的處理,在進行步驟S129的矢量化處理時,比如,通過圖像處理系統(tǒng)的初始設定或用戶操作,在矢量化處理的對象,指定為TEXT屬性的對象時,在矢量化處理中,只對TEXT屬性的塊BS1執(zhí)行矢量化處理而得到矢量數(shù)據(jù)VBS1。
之后,在進行圖3的步驟S137的光柵化/比較/選擇處理的光柵化時,只對矢量數(shù)據(jù)VBS1執(zhí)行光柵化處理而得到光柵數(shù)據(jù)RBS1。
之后,在進行圖3的步驟S137的光柵化/比較/選擇處理時,將塊BS1和光柵數(shù)據(jù)RBS1進行比較,并根據(jù)該比較結果,選擇塊(圖像)或矢量數(shù)據(jù)的任何一個作為最終選擇的對象的電子文件。在圖22中示出的是選擇VBS1的狀態(tài)。另外,不執(zhí)行矢量化處理及光柵化/比較/選擇處理的PHOTO屬性的BS2和TABLE屬性的BSN,選擇原樣不變的BS2和BSN。
如上所述,根據(jù)實施方式3,在實施方式1中說明的效果之外,通過對讀取原稿圖像的對象的屬性指定是否執(zhí)行矢量化處理及光柵化/比較/選擇處理,只對指定的屬性的對象應用矢量化處理及光柵化/比較/選擇處理,可以效率更高地生成和利用與由用戶所希望的內(nèi)容構成的讀取原稿圖像相對應的電子文件。
另外,在按照對象的屬性進行光柵化/比較/選擇處理之際,也可以使各個屬性每一個的判定基準(用來采用作為電子文件的容許閾值)不同。
另外,在進行光柵化/比較/選擇處理中進行矢量化處理的數(shù)據(jù)不超過容許閾值時,也可以不僅保留圖像數(shù)據(jù),而是將進行矢量化處理的數(shù)據(jù)兩者都保留。
另外,在不超過容許閾值時,也可以通過增加作為圖像進行處理的對象,再次重復光柵化/比較/選擇處理以使采用進行過矢量化處理的數(shù)據(jù)更容易。
另外,在進行擴大處理后進行光柵化/比較/選擇處理時,由于在矢量化處理中存在錯誤的場合的差分變大,可以防止發(fā)生只有實施錯誤的矢量化處理的數(shù)據(jù)保留的缺點。
以上的處理(光柵化/比較/選擇處理、及此處理及緩慢增加作為圖像處理的對象的處理)既可以自動地進行,也可以通過對話方式進行。
以上,是對實施方式例進行了詳細描述,而本發(fā)明可以采用作為,比如,系統(tǒng)、方法、程序或存儲媒體等的實施方式,具體言之,既可以應用于由多個機器構成的系統(tǒng),也可以應用于由一個機器構成的裝置。
另外,本發(fā)明也包含通過將實現(xiàn)上述實施方式的功能的軟件的程序(在實施方式中與圖示的流程圖相對應的程序)直接或遠距離供給系統(tǒng)或裝置,由該系統(tǒng)或裝置的計算機讀出該供給的程序代碼并執(zhí)行而達到的場合。
所以,為了利用計算機實現(xiàn)本發(fā)明的功能處理,安裝于該計算機的程序代碼本身也是實現(xiàn)本發(fā)明的工具。就是說,本發(fā)明也包含用來實現(xiàn)本發(fā)明的功能處理的計算機程序。
在此場合,只要具有程序的功能,也可以是目標代碼、由解釋程序執(zhí)行的程序、供給OS的腳本數(shù)據(jù)等形態(tài)。
作為用來供給程序的記錄媒體,比如,有軟盤(注冊商標)、硬盤、光盤、磁光盤、MO、CD-ROM、CD-R、CD-RW、磁帶、非易失性存儲卡、ROM、DVD(DVD-ROM、DVD-R)等。
除此之外,作為程序的供給方法,也可以是通過利用客戶計算機的瀏覽器連接到因特網(wǎng)的主頁,從該主頁將本發(fā)明的計算機程序本身或經(jīng)過壓縮并包含自動安裝功能的文件下載到硬盤等記錄媒體而供給。另外,也可通過將構成本發(fā)明的程序的程序代碼分割為多個文件,將各個文件從不同的主頁下載而實現(xiàn)。就是說,用來將由計算機實現(xiàn)本發(fā)明的功能處理的程序文件對多個用戶下載的WWW服務器也包含在本發(fā)明中。
另外,也可以通過將本發(fā)明的程序加密存放于CD-ROM等存儲媒體向用戶發(fā)行,對于滿足規(guī)定條件的用戶可使其經(jīng)因特網(wǎng)從主頁下載用于解密的密鑰信息,并且利用該密鑰信息可執(zhí)行加密程序而安裝于計算機而實現(xiàn)。
另外,計算機,通過執(zhí)行讀出的程序,除了實現(xiàn)上述的實施方式的功能之外,可以根據(jù)該程序的指示,由在計算機上運行的OS等進行實際處理一部分和全部,通過該處理也可以實現(xiàn)上述的實施方式的功能。
此外,從記錄媒體讀出的程序,在寫入到插入到計算機中的功能擴展板及與計算機相連接的功能擴展單元中設置的存儲器之后,根據(jù)該程序的指示,由設置于該功能擴展板及功能擴展單元中的CPU等進行實際的處理的一部分或全部,藉助該處理也可實現(xiàn)上述的實施方式的功能。
本發(fā)明并不受限于上述實施方式,并且在本發(fā)明的精神和范圍的情況下可以實現(xiàn)各種改變和變型。因此,為了向公眾通報本發(fā)明的范圍,特提出下面的權利要求。
權利要求
1.一種圖像處理裝置,是一種對讀取原稿所得到的原稿圖像進行圖像處理的圖像處理裝置,其特征在于其構成包括讀取原稿的讀取單元;將利用上述讀取單元讀取的原稿圖像變換為矢量數(shù)據(jù)的第一變換單元;將上述矢量數(shù)據(jù)變換為圖像數(shù)據(jù)的第二變換單元;將上述原稿圖像的第一圖像數(shù)據(jù)與利用上述第二變換單元生成的第二圖像數(shù)據(jù)進行比較的比較單元;以及根據(jù)上述比較單元的比較結果,選擇上述第一圖像數(shù)據(jù)或第二圖像數(shù)據(jù)中的一個作為與上述原稿圖像相對應的電子文件的選擇單元。
2.如權利要求1所述的圖像處理裝置,其特征在于其構成還包括根據(jù)由上述讀取單元讀取的原稿圖像,確定與上述原稿圖像相對應的電子文件的確定單元;并且在利用上述確定單元不能確定與上述原稿圖像相對應的電子文件時,上述第一變換單元將上述原稿圖像變換為矢量數(shù)據(jù)。
3.如權利要求1所述的圖像處理裝置,其特征在于在上述比較單元的比較結果為在上述第一圖像數(shù)據(jù)和上述第二圖像數(shù)據(jù)之間存在不同部分時,上述選擇單元將上述第一圖像數(shù)據(jù)選擇作為與上述原稿圖像相對應的電子文件。
4.如權利要求1所述的圖像處理裝置,其特征在于在上述比較單元的比較結果為在上述第一圖像數(shù)據(jù)和上述第二圖像數(shù)據(jù)之間存在不同部分的比例小于等于閾值時,上述選擇單元選擇上述第二圖像數(shù)據(jù)作為與上述原稿圖像相對應的電子文件。
5.如權利要求1所述的圖像處理裝置,其特征在于其構成還包括在顯示部提示上述第一圖像數(shù)據(jù)和上述第二圖像數(shù)據(jù)作為上述比較單元的比較結果的提示單元;指定在上述顯示部上提示的上述第一圖像數(shù)據(jù)和上述第二圖像數(shù)據(jù)中的某一個的指定單元;上述選擇單元將由上述指定單元指定的上述第一圖像數(shù)據(jù)或上述第二圖像數(shù)據(jù)作為與上述原稿圖像相對應的電子文件進行選擇。
6.如權利要求2所述的圖像處理裝置,其特征在于在由上述確定單元確定的電子文件是圖像數(shù)據(jù)時,上述第一變換單元將該圖像數(shù)據(jù)變換為矢量數(shù)據(jù)。
7.如權利要求2所述的圖像處理裝置,其特征在于上述確定單元具有識別附加于原稿圖像上用來表示與該原稿圖像相對應的電子文件的存放目的地的指針信息的識別單元;根據(jù)由上述識別單元識別的指針信息確定與上述原稿圖像相對應的電子文件。
8.如權利要求2所述的圖像處理裝置,其特征在于其構成還包括由上述確定單元不能確定與上述原稿圖像相對應的電子文件并且由上述識別單元不能識別上述指針信息時,從存儲裝置檢索與上述原稿圖像相對應的電子文件的檢索單元;將由上述檢索單元檢索到的電子文件作為與上述原稿圖像相對應的電子文件候選進行輸出的輸出單元;以及從上述輸出單元輸出的電子文件候選中選擇所要求的電子文件的選擇單元;并且在由上述選擇單元所選擇的電子文件是圖像數(shù)據(jù)時,上述第一變換單元將該圖像數(shù)據(jù)變換為矢量數(shù)據(jù)。
9.如權利要求1所述的圖像處理裝置,其特征在于其構成還包括將上述原稿圖像按照每個屬性分割為多個塊的分割單元,并且上述第一變換單元將由上述分割單元分割上述原稿圖像產(chǎn)生的各塊中的每一個都變換為矢量數(shù)據(jù)。
10.如權利要求9所述的圖像處理裝置,其特征在于上述第二變換單元將由上述第一變換單元對上述各塊中的每一個生成的矢量數(shù)據(jù)都對該塊變換為圖像數(shù)據(jù)。
11.如權利要求10所述的圖像處理裝置,其特征在于上述比較單元將由上述分割單元分割上述原稿圖像產(chǎn)生的各塊中的每一個的第一圖像數(shù)據(jù)和由上述第二變換單元對其生成的第二圖像數(shù)據(jù)進行比較。
12.如權利要求1所述的圖像處理裝置,其特征在于其構成還包括將上述矢量數(shù)據(jù)變換為可由能夠在終端上工作的文檔生成應用程序處理的規(guī)定形式的數(shù)據(jù)的變換單元。
13.如權利要求1所述的圖像處理裝置,其特征在于其構成還包括將由上述選擇單元所選擇的上述第一圖像數(shù)據(jù)或上述矢量數(shù)據(jù)作為與上述原稿圖像相對應的電子文件存放于規(guī)定的存儲裝置的存放單元;以及生成表示上述電子文件的存放目的地的指針信息并附加到該電子文件的附加單元。
14.如權利要求1所述的圖像處理裝置,其特征在于其構成還包括將上述原稿圖像按照每個屬性分割為多個塊的分割單元,以及在上述確定單元不能確定與上述原稿圖像相對應的電子文件時,從存儲裝置檢索與由上述分割單元分割的各塊相對應的矢量數(shù)據(jù)的檢索單元;并且上述第一變換單元,利用由上述檢索單元所檢索的矢量數(shù)據(jù),將上述圖像數(shù)據(jù)變換為矢量數(shù)據(jù)。
15.如權利要求1所述的圖像處理裝置,其特征在于其構成還包括將上述原稿圖像按照每個屬性分割為多個塊的分割單元,以及對由上述分割單元分割的每個塊執(zhí)行上述第一變換單元、上述第二變換單元、上述比較單元及上述選擇單元的控制單元。
16.如權利要求1所述的圖像處理裝置,其特征在于其構成還包括將上述原稿圖像按照每個屬性分割為多個塊的分割單元,以及根據(jù)由上述分割單元分割的塊的種類,執(zhí)行上述第一變換單元、上述第二變換單元、上述比較單元及上述選擇單元的控制單元。
17.一種圖像處理裝置的控制方法,是一種對讀取原稿所得到的原稿圖像進行圖像處理的圖像處理裝置的控制方法,其構成包括讀取原稿的讀取步驟;將利用上述讀取單元讀取的原稿圖像變換為矢量數(shù)據(jù)的第一變換步驟;將上述矢量數(shù)據(jù)變換為圖像數(shù)據(jù)的第二變換步驟;將上述原稿圖像的第一圖像數(shù)據(jù)與利用上述第二變換單元生成的第二圖像數(shù)據(jù)進行比較的比較步驟;以及根據(jù)上述比較步驟的比較結果,選擇上述第一圖像數(shù)據(jù)或上述矢量數(shù)據(jù)中的某一個作為與上述原稿圖像相對應的電子文件的選擇步驟。
全文摘要
根據(jù)讀取的原稿圖像,確定與該原稿圖像相對應的電子文件。在不能確定與該原稿圖像相對應的電子文件時,將該原稿圖像變換為矢量數(shù)據(jù)。該矢量數(shù)據(jù)變換為圖像數(shù)據(jù)。之后,將原稿圖像的第一圖像數(shù)據(jù)和由上述第二變換單元生成的第二圖像數(shù)據(jù)進行比較。于是,根據(jù)該比較結果,選擇第一圖像數(shù)據(jù)或矢量數(shù)據(jù)中的一個作為與原稿圖像相對應的電子文件。
文檔編號G06T1/00GK1625206SQ20041009500
公開日2005年6月8日 申請日期2004年11月18日 優(yōu)先權日2003年11月20日
發(fā)明者西川英一, 松久保勇志, 矢口博之, 辻博之, 加藤進一, 木虎正和, 關口賢三, 吉田廣義 申請人:佳能株式會社