圖像讀取裝置及文件管理系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種圖像讀取裝置及文件管理系統(tǒng)。本發(fā)明所涉及的圖像讀取裝置具備圖像讀取部、接受文字圖章輸入信息的輸入的文字圖章輸入信息接受部、原稿文字信息提取部和附信息圖像數(shù)據(jù)生成部。附信息圖像數(shù)據(jù)生成部生成作為使元信息與已蓋圖章圖像為一組的數(shù)據(jù)的附信息圖像數(shù)據(jù)。元信息為將通過文字圖章輸入信息接受部接受的文字圖章輸入信息附加到通過原稿文字信息提取部提取的原稿文字信息而成的信息。根據(jù)本發(fā)明,在使已蓋圖章圖像與已蓋圖章圖像中包含的與字符串對應(yīng)的信息為一組來輸出的情況下,能夠可靠地輸出與圖章文字圖像對應(yīng)的文字,所述已蓋圖章圖像為將作為表示文字的圖像的圖章文字圖像重疊到原稿的圖像而成的圖像。
【專利說明】圖像讀取裝置及文件管理系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像讀取裝置及文件管理系統(tǒng),特別地,涉及一種使表示文字的圖像重疊到原稿的圖像而成的圖像與該被重疊的圖像中包含的與字符串有關(guān)的信息為一組輸出的技術(shù)。
【背景技術(shù)】
[0002]近年來,已知有如下技術(shù),即將利用MFP (Multi Function Peripherals:復(fù)合機(jī))的掃描部讀取的表示原稿圖像的圖像數(shù)據(jù)變換為PDF數(shù)據(jù),并且進(jìn)行該圖像數(shù)據(jù)的文字識別以制作文本數(shù)據(jù),并將該文本數(shù)據(jù)作為透明文本數(shù)據(jù)粘貼到PDF數(shù)據(jù)中,從而制作所謂能夠檢索的PDF并輸出。另外,已知有將由用戶輸入的表示文字的位圖重疊到利用讀取單元(掃描部)讀取的原稿的圖像的技術(shù)。
[0003]通過使用這些技術(shù),生成將作為由用戶輸入的表示“對外機(jī)密”或“機(jī)密”等的文字的圖像的圖章文字圖像重疊到原稿的圖像而成的圖像,并且提取生成的圖像中包含的與字符串有關(guān)的信息(原稿文字信息),從而能夠?qū)⑸傻膱D像與提取的原稿文字信息作為一組輸出。
[0004]然而,在從圖章文字圖像重疊到原稿的圖像而成的圖像提取字符串時(shí),由于因圖章文字圖像的分辨率低而通過圖章文字圖像表示的文字作為圖案被識別,因此不能提取通過圖章文字圖像表示的文字?;蛘?,當(dāng)通過圖章文字圖像表示的文字與原稿的圖像中包含的文字重疊時(shí),由于未能作為文字適當(dāng)?shù)刈R別,因此不能提取通過圖章文字圖像表示的文字。
[0005]這樣做的結(jié)果,當(dāng)使圖章文字圖像重疊到原稿的圖像而成的圖像(已蓋圖章圖像)與從已蓋圖章圖像提取的原稿文字信息為一組來輸出時(shí),在輸出的原稿文字信息中,有可能不包含通過用戶應(yīng)明確輸入的通過圖章文字圖像表示的文本信息。
【發(fā)明內(nèi)容】
[0006]本發(fā)明是鑒于這種情況提出的,目的在于提供一種圖像讀取裝置及文件管理系統(tǒng),當(dāng)使已蓋圖章圖像與已蓋圖章圖像中包含的與字符串對應(yīng)的信息為一組來輸出的情況下,能夠可靠地輸出與圖章文字圖像對應(yīng)的文本信息,所述已蓋圖章圖像為將作為表示文字的圖像的圖章文字圖像重疊到原稿的圖像而成的圖像。
[0007]本發(fā)明的一方案所涉及的圖像讀取裝置具備:圖像讀取部,讀取原稿的圖像;文字圖章輸入信息接受部,接受文字圖章輸入信息的輸入,文字圖章輸入信息為與圖章文字有關(guān)的信息,所述圖章文字為作為圖像重疊到原稿圖像的文字,所述原稿圖像為通過所述圖像讀取部讀取的圖像;原稿文字信息提取部,提取原稿文字信息,所述原稿文字信息為與所述原稿圖像中包含的字符串有關(guān)的信息;已蓋圖章圖像生成部,生成圖章文字圖像,并通過將生成的圖章文字圖像重疊到所述原稿圖像,從而生成已蓋圖章圖像,所述已蓋圖章圖像為所述圖章文字圖像重疊到所述原稿圖像而成的圖像,所述圖章文字圖像為表示與通過所述文字圖章輸入信息接受部接受的文字圖章輸入信息對應(yīng)的圖章文字的圖像;附信息圖像數(shù)據(jù)生成部,生成附信息圖像數(shù)據(jù),所述附信息圖像數(shù)據(jù)為以元信息與所述已蓋圖章圖像為一組的數(shù)據(jù),所述元信息為將通過文字圖章輸入信息接受部接受的文字圖章輸入信息附加到通過原稿文字信息提取部提取的原稿文字信息而成的信息。
[0008]本發(fā)明的一方案的方案所涉及的文件管理系統(tǒng),具備上述的圖像讀取裝置、附信息圖像數(shù)據(jù)存儲部和檢索服務(wù)器。所述附信息圖像數(shù)據(jù)存儲部存儲通過所述附信息圖像數(shù)據(jù)生成部被生成的附信息圖像數(shù)據(jù)。所述檢索服務(wù)器從被存儲在所述附信息圖像數(shù)據(jù)存儲部的附信息圖像數(shù)據(jù)中,檢索將由用戶指定的檢索關(guān)鍵詞包含在元信息中的附信息圖像數(shù)據(jù)。
【專利附圖】
【附圖說明】
[0009]圖1是表示本發(fā)明所涉及的文件管理系統(tǒng)的一例的系統(tǒng)結(jié)構(gòu)圖。
[0010]圖2是表示具備本發(fā)明所涉及的圖像讀取裝置的復(fù)合機(jī)的一例的概要結(jié)構(gòu)圖。
[0011]圖3是表示復(fù)合機(jī)的電氣結(jié)構(gòu)的一例的框圖。
[0012]圖4是表示生成附信息圖像數(shù)據(jù)的動作的一例的流程圖。
[0013]圖5是表示文字圖章功能的設(shè)定畫面的一例的說明圖。
[0014]圖6是表不文字圖章輸入信息的一例的說明圖。
[0015]圖7是表示原稿圖像的一例的說明圖。
[0016]圖8是表示原稿圖像與提取用圖像的關(guān)系的一例的說明圖。
[0017]圖9是表示提取用圖像的一例的說明圖。
[0018]圖10是表示從提取用圖像提取的與字符串有關(guān)的信息的一例的說明圖。
[0019]圖11是表不原稿文字信息的一例的說明圖。
[0020]圖12是表示已蓋圖章圖像的一例的說明圖。
[0021]圖13是表示元信息的一例的說明圖。
【具體實(shí)施方式】
[0022]下面,基于附圖,說明本發(fā)明所涉及的實(shí)施方式。
[0023]圖1是表示本發(fā)明所涉及的文件管理系統(tǒng)900的一例的系統(tǒng)結(jié)構(gòu)圖。
[0024]如圖1所示,在LAN (Local Area Network)等的網(wǎng)絡(luò)90,連接有本發(fā)明所涉及的圖像讀取裝置的一例的復(fù)合機(jī)1、檢索服務(wù)器2及個(gè)人計(jì)算機(jī)(以下簡稱PC) 3。復(fù)合機(jī)1、檢索服務(wù)器2及PC3經(jīng)由網(wǎng)絡(luò)90能夠互相發(fā)送和接收各種數(shù)據(jù)。
[0025]復(fù)合機(jī)I進(jìn)行通過后述的圖像讀取部5讀取的原稿的圖像的打印。另外,復(fù)合機(jī)I經(jīng)由網(wǎng)絡(luò)90接收由檢索服務(wù)器2和PC3發(fā)送的圖像數(shù)據(jù),并基于接收到的圖像數(shù)據(jù)進(jìn)行圖像的打印。
[0026]另外,復(fù)合機(jī)I將附信息圖像數(shù)據(jù)經(jīng)由網(wǎng)絡(luò)90發(fā)送到檢索服務(wù)器2,所述附信息圖像數(shù)據(jù)為通過后述的附信息圖像數(shù)據(jù)生成部84生成的、以圖像和作為該圖像中包含的與字符串有關(guān)的信息的元信息為一組的數(shù)據(jù)。
[0027]檢索服務(wù)器2將接收到的附信息圖像數(shù)據(jù)存儲在檢索服務(wù)器2中具備的附信息圖像數(shù)據(jù)存儲部21。[0028]若檢索服務(wù)器2經(jīng)由網(wǎng)絡(luò)90接收由用戶對復(fù)合機(jī)I及個(gè)人計(jì)算機(jī)3的操作指定的檢索關(guān)鍵詞,則從存儲在附信息圖像數(shù)據(jù)存儲部21的附信息圖像數(shù)據(jù)中,檢索將接收到的檢索關(guān)鍵詞包含在元信息的附信息圖像數(shù)據(jù)。
[0029]于是,檢索服務(wù)器2朝向檢索關(guān)鍵詞的發(fā)送源回復(fù)將作為檢索結(jié)果的檢索關(guān)鍵詞包含在元信息的附信息圖像數(shù)據(jù)。
[0030]如此,構(gòu)成具備復(fù)合機(jī)1、檢索服務(wù)器2和PC3的文件管理系統(tǒng)900。
[0031]此外,文件管理系統(tǒng)900的結(jié)構(gòu)并不限定于此,還可以是不具備PC3的簡化的結(jié)構(gòu)。
[0032]下面,對復(fù)合機(jī)I進(jìn)行詳細(xì)說明。
[0033]圖2是表示具備本發(fā)明所涉及的圖像讀取裝置的復(fù)合機(jī)I的一例的概要結(jié)構(gòu)圖。
[0034]圖3是表示復(fù)合機(jī)I的電氣結(jié)構(gòu)的一例的框圖。
[0035]如圖2所示,復(fù)合機(jī)I具備主體部10、圖像讀取部5和原稿供給部6。
[0036]在復(fù)合機(jī)I的前面部具備操作面板部7。
[0037]操作板部7具備顯示部73和操作鍵部76。
[0038]主體部10具備網(wǎng)絡(luò)通信部9和管理裝置整體的動作控制的控制部8。
[0039]圖像形成部4具備紙張運(yùn)送部41、光掃描裝置42、感光鼓43、顯影部44、轉(zhuǎn)印部45和定影部46。
[0040]網(wǎng)絡(luò)通信部9為用于在連接于網(wǎng)絡(luò)90的檢索服務(wù)器2和PC3之間發(fā)送和接收各種數(shù)據(jù)的通信接口電路。
[0041]控制部8 由 CPU (Central Processing Unit)、ROM (Read Only Memory)和 RAM(Random Access Memory)等的存儲器、作為構(gòu)成為能夠高速處理圖像處理等的規(guī)定的處理的專用硬件的ASIC (Application Specific Integrated Circuits)及具備這些的外圍電路等的微型計(jì)算機(jī)(計(jì)算機(jī))構(gòu)成。
[0042]控制部8通過由CPU執(zhí)行存儲在ROM等的控制程序,執(zhí)行各種處理,并控制復(fù)合機(jī)I內(nèi)各部的動作。
[0043]由此,控制部8分別執(zhí)行復(fù)合機(jī)I具備的多個(gè)功能。
[0044]在本實(shí)施方式中,控制部8作為執(zhí)行多個(gè)功能的處理部,特別是構(gòu)成文字圖章輸入信息接受部81、原稿文字信息提取部82、已蓋圖章圖像生成部83及附信息圖像數(shù)據(jù)生成部84。
[0045]下面,通過文字圖章輸入信息接受部81、原稿文字信息提取部82、已蓋圖章圖像生成部83及附信息圖像數(shù)據(jù)生成部84,對生成附信息圖像數(shù)據(jù)的操作進(jìn)行說明。在該說明中,對各處理部進(jìn)行詳細(xì)說明。圖4是表示生成附信息圖像數(shù)據(jù)的操作的一例的流程圖。
[0046]如圖4所示,首先,文字圖章輸入信息接受部81通過執(zhí)行步驟SI至步驟S3,接受文字圖章輸入信息L的輸入,所述文字圖章輸入信息L為作為在原稿圖像DB上作為圖像重疊的文字的、與圖章文字CS有關(guān)的信息。
[0047]具體來講,當(dāng)用戶操作操作面板部7 (圖3),選擇圖章功能時(shí),顯示圖5所示的畫面。在此,控制部8作為圖章文字CS的選擇項(xiàng)目,將“機(jī)密”、“加急”及“復(fù)制”等的選擇菜單顯示在顯示部7中。于是,當(dāng)用戶選擇“機(jī)密”的選擇菜單時(shí),文字圖章輸入信息接受部81將由文本數(shù)據(jù)表示的“機(jī)密”的文字信息作為表示圖章文字CS的信息的圖章文字信息LS接受(步驟SI)。此外,與各選擇菜單對應(yīng)的文本數(shù)據(jù)預(yù)先存儲在ROM等中。
[0048]接著,控制部8將選擇菜單顯示在顯示部73中,所述選擇菜單表示作為使文字圖像DS重疊到原稿圖像DB時(shí)的位置預(yù)先規(guī)定的“左上”、“右上”、“左下”及“右下”等的多個(gè)位置,所述文字圖像DS為在步驟SI接受的與圖章文字信息LS對應(yīng)的圖章文字CS的圖像。(參照圖5的“位置”下的鍵顯示)于是,當(dāng)用戶選擇“右下”的選擇菜單時(shí),文字圖章輸入信息接受部81將顯示“右下”的位置的信息作為圖章位置信息LP接受,所述圖章位置信息LP為表示原稿圖像DB中使圖章文字圖像DS重疊的位置的信息(步驟S2)。
[0049]圖6是表不文字圖章輸入信息L的一例的說明圖。而且,如圖6所不,文字圖章輸入信息接受部81生成作為使圖章文字信息LS與圖章位置信息LP對應(yīng)的信息的文字圖章輸入信息L,并存儲在RAM中,所述圖章文字信息LS為表示在步驟SI接受的圖章文字CS的信息,所述圖章位置信息LP為表示在步驟S2接受的原稿圖像DB中使圖章文字圖像DS重疊的位置的信息(步驟3)。
[0050]而且,當(dāng)用戶按下操作面板部7 (圖3)具備的開始鍵,輸入附信息圖像數(shù)據(jù)的發(fā)送功能的開始指示時(shí),控制部8接受該輸入,開始生成附信息圖像數(shù)據(jù)的操作。 [0051]若開始生成附信息圖像數(shù)據(jù)的操作,則控制部8通過圖像讀取部5讀取原稿的圖像,生成表示作為被讀取的圖像的原稿圖像DB的圖像數(shù)據(jù)(步驟4)。
[0052]在此,對下面的說明中作為具體例而使用的原稿圖像DB進(jìn)行說明。圖7是表示原稿圖像DB的一例的說明圖。如圖7所示,在原稿圖像DB中,在通過左上角的像素的坐標(biāo)SI和右下角的像素的坐標(biāo)El確定的矩形區(qū)域中,包含有被記載為“ABO"EFG”的字符串Cl。另外,在原稿圖像DB中,在通過左上角的像素的坐標(biāo)S2和右下角的像素的坐標(biāo)E2確定的矩形區(qū)域中,包含有被記載為“HIJ…LMN.”的字符串C2。另外,在原稿圖像DB中,在通過左上角的像素的坐標(biāo)S3和右下角的像素的坐標(biāo)E3確定的矩形區(qū)域中,包含有被記載為“0PQ"?XYZ.”的字符串C3。此外,在原稿圖像DB還包含有符號Gl所表示的圖像。
[0053]接著,返回圖4,原稿文字信息提取部82通過執(zhí)行OCR (Optical CharacterRecognition,光學(xué)字符識別)等公知的文字識別處理,提取在步驟S4生成的通過圖像數(shù)據(jù)表示的原稿圖像DB中包含的與字符串有關(guān)的信息(步驟S5)。
[0054]具體來講,在步驟S5中,原稿文字信息提取部82將在步驟S4生成的通過圖像數(shù)據(jù)表示的原稿圖像DB的分辨率變換為預(yù)先規(guī)定的分辯率,使得能夠提高原稿圖像DB中包含的與字符串有關(guān)的信息的提取精度。
[0055]由此,原稿文字信息提取部82將原稿圖像變換為提取用圖像DT,所述提取用圖像DT為所述預(yù)先規(guī)定的分辨率的圖像。
[0056]圖8是表示原稿圖像DB與提取用圖像DT的關(guān)系的一例的說明圖。如圖8所示,原稿文字信息提取部82將在步驟S4生成的且通過在水平方向上的Wb個(gè)像素與垂直方向上的Hb個(gè)像素表示的分辨率的原稿圖像DB,變換為通過預(yù)先規(guī)定的在水平方向上的Wt個(gè)像素與垂直方向上的Ht個(gè)像素表示的分辨率的提取用圖像DT,使得能夠提高原稿圖像DB中包含的與字符串有關(guān)的信息的提取精度。
[0057]此外,在圖8中,為說明的方便,使原稿圖像DB的大小與提取用圖像DT的大小不同地圖示。
[0058]下面,將在水平方向上從左第X個(gè)且在垂直方向上從上第Y個(gè)的像素的坐標(biāo)表示為(X,Y)。即,與提取用圖像DT中的坐標(biāo)(Xt,Yt)對應(yīng)的原稿圖像DB中的坐標(biāo)(Xb,Yb),能夠使用提取用圖像DT的水平方向的像素?cái)?shù)Wt及垂直方向的像素?cái)?shù)Ht和提取用圖像DT中的坐標(biāo)(Xt,Yt),通過下面的式(I)、(2)算出。
[0059]Xb = Xt*Wb / Wt...(I)[0060]Yb = Yt*Hb / Ht...(2)
[0061]此外,表示乘法運(yùn)算(乘法),“ / ”表示除法運(yùn)算(除法)。即,原稿圖像DB的坐標(biāo)位置和提取用圖像DT的坐標(biāo)位置通過式(I)、(2)對應(yīng)。
[0062]接著,原稿文字信息提取部82對提取用圖像DT執(zhí)行OCR等公知的文字識別處理,提取提取用圖像DT中包含的與字符串有關(guān)的信息。
[0063]圖9是表不提取用圖像DT的一例的說明圖。圖10是表不從提取用圖像DT提取的與字符串有關(guān)的信息的一例的說明圖。如圖9所示,原稿文字信息提取部82對提取用圖像DT執(zhí)行文字識別處理,并識別通過左上角的坐標(biāo)(SXtl,SYtl)和右下角的坐標(biāo)(EXtl,EYtl)確定的在矩形區(qū)域被記載為“ABC...EFG”的字符串Ctl的存在。而且,如圖10所示,原稿文字信息提取部82使表示字符串Ctl的信息與表示確定配置有字符串Ctl的區(qū)域的左上角的坐標(biāo)(SXtl,SYtl)和右下角的坐標(biāo)(EXtl,EYtl)的信息對應(yīng),并存儲在RAM中。
[0064]與此相同,原稿文字信息提取部82使表示被記載為“這次是……”的字符串Ct2的信息與表示確定配置有字符串Ct2的區(qū)域的左上角的坐標(biāo)(SXt2,SYt2)和右下角的坐標(biāo)(Ext2, EYt2)的信息對應(yīng),并存儲在RAM中。另外,原稿文字信息提取部82使表示被記載為“如右圖所示,……”的字符串Ct3的信息與表示確定配置有字符串Ct3的區(qū)域的左上角的坐標(biāo)(SXt3,SYt3)和右下角的坐標(biāo)(Ext3,EYt3)的信息對應(yīng),并存儲在RAM中。
[0065]而且,原稿文字信息提取部82將存儲在RAM中的表示提取用圖像DT中包含的字符串Ctl至Ct3的信息作為文本數(shù)據(jù)獲取,并設(shè)為字符串信息MS,所述字符串信息MS為原稿圖像DB中包含的表示字符串Cl至C3的信息。
[0066]另外,原稿文字信息提取部82獲取存儲在RAM中的表示確定提取用圖像DT中字符串Ctl至Ct3各自配置的區(qū)域的左上角的坐標(biāo)和右下角的坐標(biāo)的信息,并使用上述式
(1)、(2),將獲取的信息表示的坐標(biāo)分別變換為與原稿圖像DB對應(yīng)的坐標(biāo)。而且,原稿文字信息提取部82將表示該變更后的坐標(biāo)的信息設(shè)為位置信息MP,所述位置信息MP表示原稿圖像DB中包含的字符串Cl至C3各自配置的位置。
[0067]具體來講,原稿文字信息提取部82使用上述的式(1),將確定提取用圖像DT中配置有字符串Ctl的區(qū)域的左上角的坐標(biāo)(SXtl、SYtl)變換為原稿圖像DB中的坐標(biāo)(SXtl*ffb / fft, SYtl*Hb / Ht)。然后,將該變換后的坐標(biāo)設(shè)為原稿圖像DB中配置有字符串Cl的區(qū)域的左上角的坐標(biāo)SI (圖7)。另外,原稿文字信息提取部82使用上述的式(2),將確定提取用圖像DT中配置有字符串Ctl的區(qū)域的右下角的坐標(biāo)(EXtl、EYtl)變換為原稿圖像DB中的坐標(biāo)(EXtl*Wb / fft, EYtl*Hb / Ht)。然后,將該變換后的坐標(biāo)設(shè)為原稿圖像DB中配置有字符串Cl的區(qū)域的右下角的坐標(biāo)El。此外,Wb表示原稿圖像DB的水平方向的像素?cái)?shù),Wt表示提取用圖像DT的水平方向的像素?cái)?shù)。另外,Hb表示原稿圖像DB的垂直方向的像素?cái)?shù),Ht表示提取用圖像DT的垂直方向的像素?cái)?shù)。
[0068]與此相同,原稿文字信息提取部82將確定配置有字符串Ct2的區(qū)域的左上角的坐標(biāo)(SXt2、SYt2)變換為原稿圖像DB中的坐標(biāo)(SXt2*Wb / fft, SYt2*Hb / Ht),將右下角的坐標(biāo)(EXt2、EYt2)變換為原稿圖像DB中的坐標(biāo)(Ext2*Wb / fft, EYt2*Hb / Ht)。
[0069]而且,原稿文字信息提取部82將該變換后的坐標(biāo)設(shè)為原稿圖像DB中配置有字符串C2的區(qū)域的左上角的坐標(biāo)S2和右下角的坐標(biāo)E2 (圖7)。
[0070]另外,原稿文字信息提取部82將確定配置有字符串Ct3的區(qū)域的左上角的坐標(biāo)(SXt3、SYt3)變換為與原稿圖像DB對應(yīng)的坐標(biāo)(SXt3*Wb / fft, SYt3*Hb / Ht),將右下角的坐標(biāo)(EXt3、EYt3)變換為坐標(biāo)(EXt3*Wb / fft, EYt3*Hb / Ht)。
[0071]而且,原稿文字信息提取部82將該變換后的坐標(biāo)設(shè)為原稿圖像DB中配置有字符串C3的區(qū)域的左上角的坐標(biāo)S3和右下角的坐標(biāo)E3 (圖7)。
[0072]如此,在步驟S5中,原稿文字信息提取部82從原稿圖像DB提取字符串信息MS和位置信息MP,所述字符串信息MS為表示原稿圖像DB中包含的字符串Cl至C3的信息,所述位置信息MP表示原稿圖像DB中包含的配置有字符串Cl至C3的位置。
[0073]圖11是表不原稿文字/[目息M的一例的說明圖。而且,如圖11所不,原稿文字/[目息提取部82生成原稿文字信息M并存儲在RAM中,所述原稿文字信息M為使字符串信息MS和位置信息MP對應(yīng)的信息,其中所述字符串信息MS為表示在步驟S5提取的原稿圖像DB中包含的字符串Cl至C3的信息,所述位置信息MP表示原稿圖像DB中包含的配置有字符串Cl至C3的位置(步驟6)。
[0074]返回圖4,已蓋圖章圖像生成部83生成圖章文字圖像DS,所述圖章文字圖像DS為表示與在步驟SI接受的圖章文字信息LS對應(yīng)的圖章文字CS (圖6中的“機(jī)密”)的、與原稿圖像DB相同的分辨率的圖像。然后,已蓋圖章圖像生成部83將生成的圖章文字圖像DS重疊到原稿圖像DB中與在步驟SI接受的圖章位置信息LP對應(yīng)的位置(圖6中的“右下”)。由此,已蓋圖章圖像生成部83生成已蓋圖章圖像DA,所述已蓋圖章圖像DA為在原稿圖像DB重疊有表示圖章文字CS的圖章文字圖像DS的圖像(步驟S7)。
[0075]圖12是表示已蓋圖章圖像DA的一例的說明圖。具體來講,如圖12所示,在步驟S7中,已蓋圖章圖像生成部83在與圖章位置信息LP對應(yīng)的位置表示原稿圖像DB中的“右下”的位置時(shí),通過將圖章文字圖像DS與原稿圖像DB重疊,生成已蓋圖章圖像DA,使得生成的圖章文字圖像DS的右下角的像素的坐標(biāo)Z4與原稿圖像DB的右下角的像素的坐標(biāo)Q4重疊。此外,所謂右下角的像素表示作為水平方向的結(jié)尾的像素的、垂直方向的結(jié)尾的像素。
[0076]同樣,在步驟S7中,已蓋圖章圖像生成部83在與圖章位置信息LP對應(yīng)的位置表示原稿圖像DB中的“左上”的位置時(shí),將圖章文字圖像DS與原稿圖像DB重疊,使得生成的圖章文字圖像DS的左上角的像素的坐標(biāo)Zl與原稿圖像DB的左上角的像素的坐標(biāo)Ql重疊。此外,所謂左上角的像素表示作為水平方向的起始的像素的、垂直方向的起始的像素。
[0077]另外,在步驟S7中,已蓋圖章圖像生成部83在與圖章位置信息LP對應(yīng)的位置表示原稿圖像DB中的“右上”的位置時(shí),將圖章文字圖像DS與原稿圖像DB重疊,使得生成的圖章文字圖像DS的右上角的像素的坐標(biāo)Z2與原稿圖像DB的右上角的像素的坐標(biāo)Q2重疊。此外,所謂右上角的像素表示作為水平方向的結(jié)尾的像素的、垂直方向的起始的像素。
[0078]另外,在步驟S7中,已蓋圖章圖像生成部83在與圖章位置信息LP對應(yīng)的位置表示原稿圖像DB中的“左下”的位置時(shí),將圖章文字圖像DS與原稿圖像DB重疊,使得生成的圖章文字圖像DS的左下角的像素的坐標(biāo)Z3與原稿圖像DB的左下角的像素的坐標(biāo)Q3重疊。此外,所謂左下角的像素表示作為水平方向的起始的像素的、表示垂直方向的結(jié)尾的像素。[0079]返回圖4,附信息圖像數(shù)據(jù)生成部84將在步驟S3生成的文字圖章輸入信息L (圖6)附加到在步驟S6中通過原稿文字信息提取部82生成的原稿文字信息M (圖11),并生成元信息N (步驟S8)。
[0080]圖13是表示元信息N的一例的說明圖。如圖13所示,在圖章位置信息LP (圖6)為表示在原稿圖像DB中的“右下”的位置的信息的情況下,附信息圖像數(shù)據(jù)生成部84將圖章位置信息LP變換為表示確定圖章文字圖像DS在原稿圖像DB中重疊的區(qū)域的左上角的坐標(biāo)Zl (圖12)和右下角的坐標(biāo)Z4 (圖12)的信息。具體來講,當(dāng)設(shè)為圖章文字圖像DS的水平方向的像素?cái)?shù)Wd及垂直方向的像素?cái)?shù)Hd時(shí),且設(shè)為原稿圖像DB的水平方向的像素?cái)?shù)Wb及垂直方向的像素?cái)?shù)Hb時(shí),坐標(biāo)Zl由(Wb-Wd+l,Hb-Hd+l)表示,坐標(biāo)Z4由(Wb,Hb)表
/Jn ο
[0081]同樣,在圖章位置信息LP為表示在原稿圖像DB中的“左上”的位置的信息的情況下,附信息圖像數(shù)據(jù)生成部84將圖章位置信息LP變換為表示確定圖章文字圖像DS在原稿圖像DB中重疊的區(qū)域的左上角的坐標(biāo)(1,I)和右下角的坐標(biāo)(Wd,Hd)的信息。另外,在圖章位置信息LP為表示在原稿圖像DB中的“右上”的位置的信息的情況下,附信息圖像數(shù)據(jù)生成部84將圖章位置信息LP變換為表示確定圖章文字圖像DS在原稿圖像DB中重疊的區(qū)域的左上角的坐標(biāo)(Wb-Wd+l,l)和右下角的坐標(biāo)(Wd,Hd)的信息。另外,在圖章位置信息LP為表示在原稿圖像DB中的“左下”的位置的信息的情況下,附信息圖像數(shù)據(jù)生成部84將圖章位置信息LP變換為表示確定圖章文字圖像DS在原稿圖像DB中重疊的區(qū)域的左上角的坐標(biāo)(1,Hb-Hd+Ι)和右下角的坐標(biāo)(Wd,Hd)的信息。
[0082]此外,附信息圖像數(shù)據(jù)生成部84代替將上述的圖章位置信息LP變換為表示在原稿圖像DB中的坐標(biāo)的信息,還可以將圖章位置信息LP變換為表示在原稿圖像DB中的預(yù)先規(guī)定的位置(例如,“右下”)的文本數(shù)據(jù)。
[0083]而且,附信息圖像數(shù)據(jù)生成部84生成元信息N,所述元信息N為將圖章位置信息LP附加到在步驟S6中通過原稿文字信息提取部82生成的、原稿圖像DB中包含的與字符串Cl至C3有關(guān)的信息的原稿文字信息M (圖11)。
[0084]返回圖4,附信息圖像數(shù)據(jù)生成部84生成附信息圖像數(shù)據(jù),所述附信息圖像數(shù)據(jù)為將在步驟8中生成的元信息N與在步驟S7中通過已蓋圖章圖像生成部83生成的已蓋圖章圖像DA為一組的數(shù)據(jù)(步驟9)。
[0085]具體來講,在步驟S9中,附信息圖像數(shù)據(jù)生成部84生成表示與元信息N中包含的原稿文字信息M對應(yīng)的字符串Cl至C3的文本數(shù)據(jù)(所謂透明文本),和表示與元信息N中包含的文字圖章輸入信息L對應(yīng)的圖章文字CS的文本數(shù)據(jù)(所謂透明文本)。而且,附信息圖像數(shù)據(jù)生成部84通過將生成的文本數(shù)據(jù)與已蓋圖章圖像DA重合,將元信息N與已蓋圖章圖像DA為一組的所謂能夠檢索的PDF格式的數(shù)據(jù)作為附信息圖像數(shù)據(jù)生成。
[0086]然后,附信息圖像數(shù)據(jù)生成部84通過網(wǎng)絡(luò)通信部9將在步驟S9中生成的附信息圖像數(shù)據(jù)發(fā)送到與網(wǎng)絡(luò)90連接的檢索服務(wù)器2 (步驟S10)。
[0087]S卩,通過圖像讀取部5及控制部8,構(gòu)成本發(fā)明所涉及的圖像讀取裝置的一例。
[0088]根據(jù)上述實(shí)施方式的結(jié)構(gòu),在附信息圖像數(shù)據(jù)中包含的元信息N中包含原稿文字信息M和文字圖章輸入信息L,原稿文字信息M為原稿信息圖像DB中包含的與字符串有關(guān)的信息,文字圖章輸入信息L是通過文字圖章輸入信息接受部81接受的。從而,即使不通過OCR等文字識別處理提取已蓋圖章圖像DA中包含的字符串,也可以在元信息N中包含輸入的文字圖章輸入信息L,即,與輸入的圖章文字CS有關(guān)的信息。為此,在從已蓋圖章圖像DA提取與字符串有關(guān)的信息的情況下,回避無法提取與圖章文字CS有關(guān)的信息的危險(xiǎn),能夠可靠地輸出包含與圖章文字CS有關(guān)的信息的附信息圖像數(shù)據(jù)。
[0089]另外,根據(jù)上述實(shí)施方式的結(jié)構(gòu),在附信息圖像數(shù)據(jù)中包含的元信息N (圖13沖,作為原稿文字信息M包含字符串信息MS和位置信息MP,所述字符串信息MS表示原稿圖像DB中包含的字符串,所述位置信息MP表示在原稿圖像DB中配置有所述字符串的位置。另夕卜,在元信息N中,作為文字圖章輸入信息L (圖6)包含圖章文字信息LS和圖章位置信息LP,所述圖章文字信息LS為表不圖章文字CS的信息,所述圖章位置信息LP為表不在原稿圖像DB中使與圖章文字CS對應(yīng)的圖章文字圖像DS重疊的位置的信息。
[0090]為此,使用附信息圖像數(shù)據(jù)中包含的元信息N (圖13),能夠掌握原稿圖像DB中包含的字符串和圖章文字CS。進(jìn)一步,使用附信息圖像數(shù)據(jù)中包含的元信息N,能夠掌握原稿圖像DB中包含的字符串及圖章文字CS分別配置在原稿圖像DB中的哪個(gè)位置。另外,由于圖章文字圖像DS為與原稿圖像DB相同的分辨率,因此能夠易于重疊到通過圖章位置信息LP表示的原稿圖像DB中的位置。
[0091]另外,根據(jù)上述實(shí)施方式的結(jié)構(gòu),使用預(yù)先規(guī)定的分辨率的提取用圖像DT,能夠以良好的精度提取表示提取用圖像DT中包含的字符串的信息(圖10)和表示在提取用圖像DT中提取的字符串存在的位置的信息(圖10),使得能夠提高原稿文字信息M的提取精度。即,通過使用該提取的信息生成原稿文字信息M (步驟S6),能夠提高從原稿圖像DB提取原稿文字信息M的精度。
[0092]另外,根據(jù)上述實(shí)施方式的結(jié)構(gòu),由于附信息圖像數(shù)據(jù)為以元信息N與已蓋圖章圖像DA為一組的所謂能夠檢索的PDF格式的數(shù)據(jù),因此在安裝有各種操作系統(tǒng)(OS)的多種計(jì)算機(jī)中,使用能夠利用能夠檢索的PDF格式的數(shù)據(jù)的軟件,能夠以相同布局顯示已蓋圖章圖像DA。另外,能夠檢索通過重合在已蓋圖章圖像DA中的數(shù)據(jù)顯示的文字。
[0093]另外,根據(jù)上述實(shí)施方式的結(jié)構(gòu),通過將表示“嚴(yán)守機(jī)密”等的機(jī)密信息的文字指定為檢索關(guān)鍵詞,能夠使檢索服務(wù)器2檢索附信息圖像數(shù)據(jù),所述附信息圖像數(shù)據(jù)包含重疊有與圖章文字CS對應(yīng)的圖章文字圖像DS的已蓋圖章圖像DA,其中將表示“嚴(yán)守機(jī)密”等的機(jī)密信息的文字作為圖章文字CS。即,能夠?qū)⑼ㄟ^圖章文字圖像DS表示的圖章文字CS指定為檢索關(guān)鍵詞,并能夠提高已蓋圖章圖像DA的便利性。
[0094]此外,在上述實(shí)施方式中圖1至圖13所表示的結(jié)構(gòu)僅為一例,并不意圖將本發(fā)明限定于該實(shí)施方式。
[0095]例如,還可以以不執(zhí)行步驟SlO的方式簡化而構(gòu)成。同時(shí),還可以構(gòu)成為將通過附信息圖像數(shù)據(jù)生成部84生成的附信息圖像數(shù)據(jù)存儲在復(fù)合機(jī)I的RAM中,從而只在復(fù)合機(jī)I中能夠利用附信息圖像數(shù)據(jù)。
[0096]另外,在步驟S9中通過附信息圖像數(shù)據(jù)生成部84生成的附信息圖像數(shù)據(jù)的格式,設(shè)為以元信息N與已蓋圖章圖像DA為一組的所謂能夠檢索的PDF格式,但并不意圖限定于此。附信息圖像數(shù)據(jù)生成部84還可以針對一個(gè)數(shù)據(jù)文件登載表示元信息N的字符串和已蓋圖章圖像DA,并將其作為附信息圖像數(shù)據(jù)生成。
[0097]另外,在步驟S7中,已蓋圖章圖像生成部83生成與原稿圖像DB相同分辨率的圖章文字圖像DS,并將生成的圖章文字圖像DS重疊到原稿圖像DB中與圖章位置信息LP對應(yīng)的位置(例如,在圖6中的“右下”),從而生成已蓋圖章圖像DA。
[0098]然而,代替此,在步驟S7中,已蓋圖章圖像生成部83還可以構(gòu)成為在生成與原稿圖像DB相同分辨率的圖章文字圖像DS后,將其變換為臨時(shí)圖章文字圖像,所述臨時(shí)圖章文字圖像為與在步驟S5通過原稿文字信息提取部82使用的提取用圖像DT相同分辨率的圖像。而且,已蓋圖章圖像生成部83還可以構(gòu)成為將臨時(shí)圖章文字圖像重疊到提取用圖像DT中與圖章位置信息LP對應(yīng)的位置(在圖章位置信息LP為表示原稿圖像DB中的“右下”的位置的信息的情況下,提取用圖像DT的右下角的像素與臨時(shí)圖章文字圖像的右下角的像素重疊的位置),生成重疊有臨時(shí)圖章文字圖像的提取用圖像DT。而且,已蓋圖章圖像生成部83還可以構(gòu)成為通過將重疊有該生成的臨時(shí)圖章文字圖像的提取用圖像DT變換為與原稿圖像DB相同分辨率的圖像,生成已蓋圖章圖像DA。
[0099]另外,在步驟S5中,原稿文字信息提取部82將在步驟S4生成的原稿圖像DB變換為提取用圖像DT,并對提取用圖像DT執(zhí)行文字識別處理,提取提取用圖像DT中包含的與字符串有關(guān)的信息(圖10)。然而,代替此,還可以構(gòu)成為在步驟S5中原稿文字信息提取部82不將原稿圖像DB變換為提取用圖像DT,而是對原稿圖像DB執(zhí)行文字識別處理,從而直接提取字符串信息MS和位置信息MP,所述字符串信息MS表示原稿圖像DB中包含的字符串,所述位置信息MP由確定該字符串在原稿圖像DB中配置的區(qū)域的左上角的坐標(biāo)和右下角的坐標(biāo)構(gòu)成。
[0100]另外,在上述結(jié)構(gòu)中,文字圖章輸入信息L作為使圖章文字信息LS和圖章位置信息LP對應(yīng)的信息而構(gòu)成,但代替此,還可以是,僅由圖章文字信息LS構(gòu)成文字圖章輸入信息L。但是,同時(shí),需要按照原稿圖像DB的分辨率固定地預(yù)先規(guī)定使圖章文字圖像DS重疊到原稿圖像DB的位置。
[0101]另外,原稿文字信息M作為使字符串信息MS和位置信息MP對應(yīng)的信息而構(gòu)成,所述字符串信息MS表示原稿圖像DB中包含的字符串,所述位置信息MP表示在原稿圖像DB中配置有所述字符串的位置,但代替此,還可以是,僅由表示在原稿圖像DB中包含的字符串的字符串信息MS構(gòu)成。
[0102]另外,在上述的結(jié)構(gòu)中,對本發(fā)明所涉及的圖像讀取裝置適用于復(fù)合機(jī)I的例進(jìn)行了說明,但并不限于此,還可以適用于復(fù)印機(jī)或掃描裝置等。
【權(quán)利要求】
1.一種圖像讀取裝置,具有: 圖像讀取部,讀取原稿的圖像; 文字圖章輸入信息接受部,接受文字圖章輸入信息的輸入,所述文字圖章輸入信息為與圖章文字有關(guān)的信息,所述圖章文字為作為圖像重疊到原稿圖像的文字,所述原稿圖像為通過所述圖像讀取部讀取的圖像; 原稿文字信息提取部,提取原稿文字信息,所述原稿文字信息為與所述原稿圖像中包含的字符串有關(guān)的信息;和 已蓋圖章圖像生成部,生成圖章文字圖像,并通過將生成的圖章文字圖像重疊到所述原稿圖像,從而 生成已蓋圖章圖像,所述圖章文字圖像為表示與通過所述文字圖章輸入信息接受部接受的文字圖章輸入信息對應(yīng)的圖章文字的圖像,所述已蓋圖章圖像為所述圖章文字圖像重疊到所述原稿圖像而成的圖像; 所述圖像讀取裝置的特征在于,進(jìn)一步具有:附信息圖像數(shù)據(jù)生成部,生成附信息圖像數(shù)據(jù),所述附信息圖像數(shù)據(jù)為以元信息與所述已蓋圖章圖像為一組的數(shù)據(jù),所述元信息為將通過所述文字圖章輸入信息接受部接受的文字圖章輸入信息附加到通過所述原稿文字信息提取部提取的原稿文字信息而成的信息。
2.根據(jù)權(quán)利要求1所述的圖像讀取裝置,其特征在于, 所述文字圖章輸入信息為使圖章文字信息與圖章位置信息對應(yīng)的信息,所述圖章文字信息為表示所述圖章文字的信息,所述圖章位置信息為表示在所述原稿圖像中使與所述圖章文字對應(yīng)的所述圖章文字圖像重疊的位置的信息, 所述原稿文字信息為使字符串信息與字符串位置信息對應(yīng)的信息,所述字符串信息表示所述原稿圖像中包含的字符串,所述字符串位置信息表示在所述原稿圖像中配置有所述字符串的位置, 所述已蓋圖章圖像生成部將表示與所述文字圖章輸入信息中包含的圖章文字信息對應(yīng)的圖章文字并且與所述原稿圖像相同分辨率的圖像作為所述圖章文字圖像生成,并將使該生成的所述圖章文字圖像重疊到所述原稿圖像中與所述圖章位置信息對應(yīng)的位置而成的圖像作為所述已蓋圖章圖像生成。
3.根據(jù)權(quán)利要求1所述的圖像讀取裝置,其特征在于, 所述附信息圖像數(shù)據(jù)為通過使表示與所述元信息中包含的所述原稿文字信息對應(yīng)的字符串的數(shù)據(jù)及表示與所述元信息中包含的所述文字圖章輸入信息對應(yīng)的圖章文字的數(shù)據(jù)重合到所述已蓋圖章圖像而使所述元信息與所述已蓋圖章圖像為一組的、能夠檢索的PDF格式的數(shù)據(jù)。
4.根據(jù)權(quán)利要求2所述的圖像讀取裝置,其特征在于, 所述文字圖章輸入信息接受部通過表示是所述原稿圖像中預(yù)先規(guī)定的多個(gè)位置中的哪個(gè)位置的信息的輸入,接受所述圖章位置信息的輸入, 所述原稿文字信息提取部執(zhí)行以下處理: 將所述原稿圖像變換為提取用圖像,所述提取用圖像為以能夠提高所述原稿文字信息的提取精度的方式預(yù)先規(guī)定的分辨率的圖像; 從所述提取用圖像提取字符串; 生成表示被提取的所述字符串的信息作為所述字符串信息;將表示與提取所述字符串的所述提取用圖像上的位置對應(yīng)的所述原稿圖像上的位置的信息作為所述字符串位置信息獲??;和 使所述字符串信息與所述字符串位置信息對應(yīng),生成所述原稿文字信息。
5.根據(jù)權(quán)利要求2所述的圖像讀取裝置,其特征在于, 所述附信息圖像數(shù)據(jù)為通過使表示與所述元信息中包含的所述原稿文字信息對應(yīng)的字符串的數(shù)據(jù)及表示與所述元信息中包含的所述文字圖章輸入信息對應(yīng)的圖章文字的數(shù)據(jù)重合到所述已蓋圖章圖像而使所述元信息與所述已蓋圖章圖像為一組的、能夠檢索的PDF格式的數(shù)據(jù)。
6.一種文件管理系統(tǒng),其特征在于,具有: 圖像讀取部,讀取原稿的圖像; 文字圖章輸入信息接受部,接受文字圖章輸入信息的輸入,所述文字圖章輸入信息為與圖章文字有關(guān)的信息,所述圖章文字為作為圖像重疊到原稿圖像的文字,所述原稿圖像為通過所述圖像讀取部讀取的圖像; 原稿文字信息提取部,提取原稿文字信息,所述原稿文字信息為與所述原稿圖像中包含的字符串有關(guān)的信息; 已蓋圖章圖像生成部,生成圖章文字圖像,并通過將生成的圖章文字圖像重疊到所述原稿圖像,從而生成已蓋圖章圖像,所述圖章文字圖像為表示與通過所述文字圖章輸入信息接受部接受的文字圖章輸入信息對應(yīng)的圖章文字的圖像,所述已蓋圖章圖像為所述圖章文字圖像重疊到所述原稿圖像而成的圖像; 附信息圖像數(shù)據(jù)生成部,`生成附信息圖像數(shù)據(jù),所述附信息圖像數(shù)據(jù)為以元信息與所述已蓋圖章圖像為一組的數(shù)據(jù),所述元信息為將通過所述文字圖章輸入信息接受部接受的文字圖章輸入信息附加到通過所述原稿文字信息提取部提取的原稿文字信息而成的信息; 附信息圖像數(shù)據(jù)存儲部,存儲通過所述附信息圖像數(shù)據(jù)生成部生成的附信息圖像數(shù)據(jù);和 檢索服務(wù)器,從存儲在所述附信息圖像數(shù)據(jù)存儲部的附信息圖像數(shù)據(jù)中,檢索將由用戶指定的檢索關(guān)鍵詞包含在元信息中的附信息圖像數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的文件管理系統(tǒng),其特征在于, 所述文字圖章輸入信息為使圖章文字信息與圖章位置信息對應(yīng)的信息,所述圖章文字信息為表示所述圖章文字的信息,所述圖章位置信息為表示在所述原稿圖像中使與所述圖章文字對應(yīng)的所述圖章文字圖像重疊的位置的信息, 所述原稿文字信息為使字符串信息與字符串位置信息對應(yīng)的信息,所述字符串信息表示所述原稿圖像中包含的字符串,所述字符串位置信息表示在所述原稿圖像中配置有所述字符串的位置, 所述已蓋圖章圖像生成部將表示與所述文字圖章輸入信息中包含的圖章文字信息對應(yīng)的圖章文字并且與所述原稿圖像相同分辨率的圖像作為所述圖章文字圖像生成,并將使該生成的所述圖章文字圖像重疊到所述原稿圖像中與所述圖章位置信息對應(yīng)的位置而成的圖像作為所述已蓋圖章圖像生成。
8.根據(jù)權(quán)利要求6所述的文件管理系統(tǒng),其特征在于,所述附信息圖像數(shù)據(jù)為通過使表示與所述元信息中包含的所述原稿文字信息對應(yīng)的字符串的數(shù)據(jù)及表示與所述元信息中包含的所述文字圖章輸入信息對應(yīng)的圖章文字的數(shù)據(jù)重合到所述已蓋圖章圖像而使所述元信息與所述已蓋圖章圖像為一組的、能夠檢索的PDF格式的數(shù)據(jù)。
9.根據(jù)權(quán)利要求7所述的文件管理系統(tǒng),其特征在于, 所述文字圖章輸入信息接受部通過表示是所述原稿圖像中預(yù)先規(guī)定的多個(gè)位置中的哪個(gè)位置的信息的輸入,接受所述圖章位置信息的輸入, 所述原稿文字信息提取部執(zhí)行以下處理: 將所述原稿圖像變換為提取用圖像,所述提取用圖像為以能夠提高所述原稿文字信息的提取精度的方式預(yù)先規(guī)定的分辨率的圖像; 從所述提取用圖像提取字符串; 生成表示被提取的所述字符串的信息作為所述字符串信息; 將表示與提取所述字符串的所述提取用圖像上的位置對應(yīng)的所述原稿圖像上的位置的信息作為所述字符串位置信息獲??;和 使所述字符串信息與所述字符串位置信息對應(yīng),生成所述原稿文字信息。
10.根據(jù)權(quán)利要 求7所述的文件管理系統(tǒng),其特征在于, 所述附信息圖像數(shù)據(jù)為通過使表示與所述元信息中包含的所述原稿文字信息對應(yīng)的字符串的數(shù)據(jù)及表示與所述元信息中包含的所述文字圖章輸入信息對應(yīng)的圖章文字的數(shù)據(jù)重合到所述已蓋圖章圖像而使所述元信息與所述已蓋圖章圖像為一組的、能夠檢索的PDF格式的數(shù)據(jù)。
【文檔編號】H04N1/00GK103685834SQ201310336698
【公開日】2014年3月26日 申請日期:2013年8月5日 優(yōu)先權(quán)日:2012年8月29日
【發(fā)明者】南貴博, 山下修二 申請人:京瓷辦公信息系統(tǒng)株式會社