專利名稱:圖像處理裝置及方法、圖像讀取裝置、圖像發(fā)送裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及生成使從原稿讀取得到的圖像數(shù)據(jù)、與通過對(duì)該圖像數(shù)據(jù)進(jìn)行文字識(shí)
別處理而獲得的文本數(shù)據(jù)相互對(duì)應(yīng)的圖像文件的圖像處理裝置、圖像讀取裝置、圖像發(fā)送 裝置、圖像形成裝置以及圖像處理方法。
背景技術(shù):
以往,有一種利用掃描儀讀取被記載在紙介質(zhì)的原稿上的信息,來取得圖像數(shù)據(jù), 然后對(duì)該圖像數(shù)據(jù)實(shí)施文字識(shí)別處理,生成與該圖像數(shù)據(jù)中包含的文字相關(guān)的文本數(shù)據(jù), 并生成使上述圖像數(shù)據(jù)與上述文本數(shù)據(jù)對(duì)應(yīng)的圖像文件的技術(shù)。 例如,在專利文獻(xiàn)1中公開了一種利用掃描儀讀取被記載在紙介質(zhì)上的信息,來 取得PDF圖像數(shù)據(jù),然后對(duì)該P(yáng)DF圖像數(shù)據(jù)實(shí)施文字識(shí)別處理,生成文本數(shù)據(jù),并檢測(cè)出該 PDF圖像數(shù)據(jù)的余白區(qū)域及余白區(qū)域的顏色,將上述文本數(shù)據(jù)以和余白區(qū)域相同的顏色嵌 入到上述PDF圖像數(shù)據(jù)的余白區(qū)域中的技術(shù)。根據(jù)該技術(shù),可在不降低圖像品質(zhì)的情況下, 進(jìn)行使用了文本數(shù)據(jù)的檢索處理等。即,由于文本數(shù)據(jù)被以和余白區(qū)域相同的顏色嵌入到 余白區(qū)域中,所以,不會(huì)被用戶看到,圖像品質(zhì)不會(huì)降低。而且,通過根據(jù)被嵌入在余白區(qū)域 中的文本數(shù)據(jù)進(jìn)行關(guān)鍵字檢索等,可抽出在原稿中記載的信息。[專利文獻(xiàn)1]日本國(guó)公開專利公報(bào)"特開2004-280514號(hào)公報(bào)(平成16年10月 7曰),,[專利文獻(xiàn)2]日本國(guó)公開專利公報(bào)"特開平7-192086號(hào)公報(bào)(平成7年7月28 日公開)" 但是,在上述專利文獻(xiàn)1的技術(shù)中,使用了針對(duì)1個(gè)文字只對(duì)應(yīng)1個(gè)文字識(shí)別結(jié)果 的文本數(shù)據(jù)。因此,例如在不知道圖像數(shù)據(jù)中的文字書寫方向是縱書還是橫書的情況、和針 對(duì)1個(gè)文字存在多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況下等,如果使用上述文本數(shù)據(jù)進(jìn)行檢索處 理,則有時(shí)會(huì)發(fā)生漏檢索。
發(fā)明內(nèi)容
本發(fā)明鑒于上述問題提出,其目的是,在生成使從原稿讀取得到的圖像數(shù)據(jù)、與通 過對(duì)該圖像數(shù)據(jù)進(jìn)行文字識(shí)別處理而獲得的文本數(shù)據(jù)相互對(duì)應(yīng)的圖像文件的圖像處理裝 置中,當(dāng)進(jìn)行基于上述文本數(shù)據(jù)的關(guān)鍵字檢索時(shí),抑制漏檢索的發(fā)生。 為了解決上述問題,本發(fā)明的圖像處理裝置具有文字識(shí)別部,其根據(jù)從原稿讀取 而取得的圖像數(shù)據(jù),對(duì)上述原稿中包含的文字進(jìn)行文字識(shí)別處理;和圖像文件生成部,其生 成使通過文字識(shí)別處理而獲得的文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng)的圖像文件;其特征在 于,在檢測(cè)出多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況下,上述文字識(shí)別部分別生成與這些各候補(bǔ) 對(duì)應(yīng)的文本數(shù)據(jù),上述圖像文件生成部使上述文字識(shí)別部生成的各文本數(shù)據(jù)與上述圖像數(shù) 據(jù)相互對(duì)應(yīng),生成上述圖像文件。 另外,為了解決上述問題,本發(fā)明的圖像處理方法包括文字識(shí)別步驟,根據(jù)從原稿讀取而取得的圖像數(shù)據(jù),對(duì)上述原稿中包含的文字進(jìn)行文字識(shí)別處理;和圖像文件生成 步驟,生成使通過文字識(shí)別處理而獲得的文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng)的圖像文件; 其特征在于,當(dāng)在上述文字識(shí)別步驟中檢測(cè)出多個(gè)文字識(shí)別結(jié)果的候補(bǔ)時(shí),分別生成與這 些各候補(bǔ)對(duì)應(yīng)的文本數(shù)據(jù),在上述圖像文件生成步驟中,將在上述文字識(shí)別步驟中生成的 各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng),生成上述圖像文件。 根據(jù)上述的圖像處理裝置及圖像處理方法,在檢測(cè)出多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的 情況下,分別生成與這些各候補(bǔ)對(duì)應(yīng)的文本數(shù)據(jù),并且使生成的各文本數(shù)據(jù)與上述圖像數(shù) 據(jù)對(duì)應(yīng),生成上述圖像文件。由此,在使用生成的圖像文件進(jìn)行關(guān)鍵字檢索時(shí),即使是存在 多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況,也能夠?qū)⑦@些各候補(bǔ)包含在檢索對(duì)象中。從而,可抑制漏 檢索的發(fā)生。 如上所述,本發(fā)明的圖像處理裝置及圖像處理方法,在檢測(cè)出多個(gè)文字識(shí)別結(jié)果 的候補(bǔ)的情況下,分別生成與這些各候補(bǔ)對(duì)應(yīng)的文本數(shù)據(jù),并且使生成的各文本數(shù)據(jù)與上 述圖像數(shù)據(jù)對(duì)應(yīng),生成上述圖像文件。 由此,在使用生成的圖像文件進(jìn)行關(guān)鍵字檢索時(shí),即使是存在多個(gè)文字識(shí)別結(jié)果 的候補(bǔ)的情況,也能夠?qū)⑦@些各候補(bǔ)包含在檢索對(duì)象中。從而,可抑制漏檢索的發(fā)生。
圖1是表示本發(fā)明的一個(gè)實(shí)施方式涉及的圖像處理裝置中的處理流程的流程圖。
圖2是表示本發(fā)明的一個(gè)實(shí)施方式涉及的圖像處理裝置的概略結(jié)構(gòu)、以及圖像形 成模式下的數(shù)據(jù)流的框圖。 圖3是表示圖2所示的圖像處理裝置中的圖像發(fā)送模式下的數(shù)據(jù)流的框圖。
圖4是表示圖2所示的圖像處理裝置所具備的圖像輸入裝置的結(jié)構(gòu)例的剖面圖。
圖5是表示圖2所示的圖像處理裝置所具備的原稿檢測(cè)部的概略結(jié)構(gòu)的框圖。
圖6是表示圖4所示的圖像輸入裝置中的掃描范圍與掃描時(shí)的原稿位置的關(guān)系的 一例的說明圖。 圖7是用于對(duì)圖5所示的原稿檢測(cè)部中的布局解析處理進(jìn)行說明的說明圖。
圖8是表示在圖2所示的圖像處理裝置中,中間調(diào)修正處理所使用的伽瑪曲線的 一例的曲線圖。 圖9是表示由圖4所示的圖像輸入裝置讀取的原稿的一例的說明圖。 圖10是表示在圖2所示的圖像處理裝置中,在圖像發(fā)送模式時(shí)發(fā)送的圖像文件的
結(jié)構(gòu)的說明圖。 圖11是表示在圖2所示的圖像處理裝置中,用于透明文本數(shù)據(jù)嵌入到圖像數(shù)據(jù)中 的指令的一例的說明圖。 圖12(a)是表示針對(duì)在圖2所示的圖像處理裝置中生成的圖像文件的關(guān)鍵字檢索 結(jié)果的一例的說明圖。 圖12(b)是表示針對(duì)在圖2所示的圖像處理裝置中生成的圖像文件的關(guān)鍵字檢索 結(jié)果的一例的說明圖。 圖12(c)是表示針對(duì)在圖2所示的圖像處理裝置中生成的圖像文件的關(guān)鍵字檢索 結(jié)果的一例的說明圖。
5
圖12(d)是表示針對(duì)在圖2所示的圖像處理裝置中生成的圖像文件的關(guān)鍵字檢索 結(jié)果的一例的說明圖。 圖12(e)是表示針對(duì)在圖2所示的圖像處理裝置中生成的圖像文件的關(guān)鍵字檢索 結(jié)果的一例的說明圖。 圖12(f)是表示針對(duì)在圖2所示的圖像處理裝置中生成的圖像文件的關(guān)鍵字檢索 結(jié)果的一例的說明圖。 圖13是表示圖2所示的圖像處理裝置的變形例的框圖。
圖14是表示圖2所示的圖像處理裝置的變形例的框圖。
圖15是表示圖2所示的圖像處理裝置的變形例的框圖。 圖中l(wèi)-數(shù)字彩色復(fù)合機(jī)(圖像處理裝置、圖像讀取裝置、圖像發(fā)送裝置);2-圖 像輸入裝置;3、3b_圖像處理裝置;4-圖像輸出裝置;5-通信裝置;6-操作面板;14-原稿 檢測(cè)部;15-原稿修正部;21-區(qū)域分離部;22-圖像文件生成部;23-存儲(chǔ)部;24-控制部; 31-信號(hào)轉(zhuǎn)換部;32-2值化處理部;33-分辨率轉(zhuǎn)換部;34-原稿傾斜檢測(cè)部;35-布局解析 部;41-文字識(shí)別部;42-描畫指令生成部;43-格式化處理部;100-圖像讀取裝置(圖像處
理裝置、圖像讀取裝置)。
具體實(shí)施例方式
下面,對(duì)本發(fā)明的一個(gè)實(shí)施方式進(jìn)行說明。其中,在本實(shí)施方式中,主要是對(duì)將本
發(fā)明應(yīng)用到數(shù)字彩色復(fù)合機(jī)的情況的一例進(jìn)行說明。
(1)數(shù)字彩色復(fù)合機(jī)的整體結(jié)構(gòu) 圖2及圖3是表示本實(shí)施方式涉及的數(shù)字彩色復(fù)合機(jī)1的概略結(jié)構(gòu)的框圖。其 中,數(shù)字彩色復(fù)合機(jī)1具備下述2種模式(1)將與圖像輸入裝置2讀取的圖像數(shù)據(jù)對(duì)應(yīng)的 圖像,利用圖像輸出裝置4形成到記錄材料上的圖像形成模式;及(2)將包含對(duì)圖像輸入裝 置2讀取的圖像數(shù)據(jù)實(shí)施了傾斜修正等處理后的圖像數(shù)據(jù)、和對(duì)該圖像數(shù)據(jù)實(shí)施文字識(shí)別 處理而取得的文本數(shù)據(jù)的圖像文件,利用通信裝置5向外部裝置發(fā)送的圖像發(fā)送模式。而 且,圖2表示圖像形成模式下的數(shù)據(jù)流、圖3表示圖像發(fā)送模式下的數(shù)據(jù)流。
如圖2及圖3所示,數(shù)字彩色復(fù)合機(jī)1具有圖像輸入裝置2、圖像處理裝置3、圖 像輸出裝置4、通信裝置5和操作面板6。 圖像輸入裝置2用于讀取原稿的圖像,生成圖像數(shù)據(jù),例如由具有CCD(Charge Coupled Device)等將光學(xué)信息轉(zhuǎn)換成電信號(hào)的器件的掃描部(未圖示)構(gòu)成。在本實(shí)施 方式中,圖像輸入裝置2將來自原稿的反射光像轉(zhuǎn)換成RGB(R :紅、G :綠、B :藍(lán))的模擬信 號(hào),并輸出到圖像處理裝置3。 圖4是表示圖像輸入裝置2的一例的剖面圖。該圖所示的圖像輸入裝置2具有 上部框體60和下部框體61。上部框體(原稿蓋)60具有原稿按壓墊57、調(diào)整輥對(duì)55、原 稿搬送路56、圖像傳感部53、上側(cè)原稿搬送導(dǎo)向件58等,下部框體61具有第1接觸玻璃 (原稿臺(tái))51、第2接觸玻璃52、讀取部70、和遮光部件59等。而且,上部框體60構(gòu)成為可 相對(duì)下部框體61開閉。 其中,圖像輸入裝置2具有下述3種模式(1)由讀取部70對(duì)被載置在第1接觸 玻璃51上的原稿的下面?zhèn)冗M(jìn)行讀取的靜止讀取模式;(2)由讀取部70對(duì)在第2接觸玻璃
652上行進(jìn)(移動(dòng))的原稿的下面?zhèn)冗M(jìn)行讀取的行進(jìn)讀取模式;和(3)由讀取部70對(duì)在第2 接觸玻璃52上行進(jìn)(移動(dòng))的原稿的下面?zhèn)冗M(jìn)行讀取,同時(shí)利用圖像傳感部53讀取上面 側(cè)的雙面讀取模式。 調(diào)整輥對(duì)55用于在行進(jìn)讀取模式及雙面讀取模式下,進(jìn)行原稿角度的調(diào)整,使被 搬送來的原稿的前端與搬送方向垂直。通過使被搬送來的原稿的前端頂靠在旋轉(zhuǎn)停止?fàn)顟B(tài) 的調(diào)整輥對(duì)55的夾合(nip)部,使該原稿形成規(guī)定的翹曲,然后,通過使調(diào)整輥對(duì)55旋轉(zhuǎn), 來調(diào)整上述原稿的方向,將其搬送到調(diào)整輥對(duì)55的下游側(cè)。 圖像傳感部53用于在選擇了雙面模式時(shí),讀取在第2接觸玻璃52上被搬送的原 稿的上面?zhèn)鹊膱D像。 原稿按壓墊57用于在選擇了靜止讀取模式時(shí),將被載置在第1接觸玻璃51上的 原稿向第1接觸玻璃51側(cè)按壓,使原稿的位置固定。 讀取部70具有第1掃描單元63、第2掃描單元64、成像透鏡65和CCD (Charge Coupled Device)66。 第1掃描單元63具有對(duì)原稿的讀取面進(jìn)行曝光的光源(曝光燈)62、和將來自 原稿的反射光向第2掃描單元64反射的第1反射鏡67。 其中,第1掃描單元63在靜止讀取模式時(shí),一邊從圖中的P位置向右,平行于第1 接觸玻璃51以一定的速度V移動(dòng)與原稿尺寸對(duì)應(yīng)的距離, 一邊利用從光源62射出的光對(duì) 載置在第1接觸玻璃51上的原稿進(jìn)行曝光,并利用第1反射鏡67反射來自原稿的反射光, 將其導(dǎo)入到第2掃描單元64。上述原稿尺寸可以是由未圖示的原稿尺寸檢測(cè)機(jī)構(gòu)(例如 由光電晶體管等光電轉(zhuǎn)換元件構(gòu)成的原稿尺寸檢測(cè)單元)對(duì)被載置在第1接觸玻璃51上 的原稿尺寸進(jìn)行檢測(cè)的結(jié)果,也可以是用戶通過操作面板輸入的尺寸。另外,在本實(shí)施方式 中,第1接觸玻璃51形成為能夠讀取最大為A3尺寸的原稿的大小。 而且,第1掃描單元63在行進(jìn)讀取模式時(shí)及雙面讀取模式時(shí),在與第2接觸玻璃 52對(duì)置的規(guī)定位置,利用從光源62射出的光對(duì)在第2接觸玻璃52上被搬送的原稿進(jìn)行曝 光,并利用第1反射鏡67反射來自原稿的反射光,將其導(dǎo)入到第2掃描單元64。
第2掃描單元64具有第2反射鏡68和第3反射鏡69,構(gòu)成為由這兩個(gè)反射鏡將 從第1反射鏡67入射的光導(dǎo)入到成像透鏡65及CCD66。其中,第2掃描單元64在靜止讀 取模式下,追隨第1掃描單元63,以V/2的速度移動(dòng)。 遮光部件59用于防止因讀取部54的光源62的光入射到圖像傳感部53而造成圖 像傳感部53不能以恰當(dāng)?shù)臐舛茸x取圖像的情況。 成像透鏡65用于將從第3反射鏡69射入的來自原稿的反射光,成像到CCD66上
CCD66用于將經(jīng)由成像透鏡65射入的光轉(zhuǎn)換成模擬的電信號(hào)。其中,該電信號(hào)由 后述的圖像處理裝置3轉(zhuǎn)換成數(shù)字的圖像數(shù)據(jù)。另外,在雙面讀取模式的情況下,由讀取部 70讀取的原稿下面?zhèn)鹊膱D像數(shù)據(jù)被輸入到圖像處理裝置3中進(jìn)行處理,然后,由圖像傳感 部53讀取的原稿上面?zhèn)鹊膱D像數(shù)據(jù)被輸入到圖像處理裝置3中進(jìn)行處理。在圖像處理裝 置3中原稿下面?zhèn)鹊膱D像數(shù)據(jù)被處理的期間,由圖像傳感部53讀取的原稿上面?zhèn)鹊膱D像數(shù)
據(jù)被暫時(shí)保存到未圖示的存儲(chǔ)器中,當(dāng)對(duì)原稿上面?zhèn)鹊膱D像數(shù)據(jù)的處理結(jié)束時(shí),將其從該 存儲(chǔ)器中讀出,送到圖像處理裝置3中進(jìn)行處理。 圖像處理裝置3如圖2及圖4所示,具有A/D轉(zhuǎn)換部11、陰影修正部12、輸入處理部13、原稿檢測(cè)部14、原稿修正部15、色修正部16、黑生成底色除去部17、空間濾波處理部18、輸出灰度修正部19、中間調(diào)生成部(中間色調(diào)生成部)20、區(qū)域分離部21、圖像文件生成部22、存儲(chǔ)部23及控制部24。存儲(chǔ)部23是對(duì)圖像處理裝置3所處理的各種數(shù)據(jù)(圖像數(shù)據(jù)等)進(jìn)行存儲(chǔ)的存儲(chǔ)機(jī)構(gòu)。對(duì)存儲(chǔ)部23的結(jié)構(gòu)沒有特殊限定,例如可使用硬盤等。而控制部24是控制圖像處理裝置3所具備的各部的動(dòng)作的控制機(jī)構(gòu)。該控制部24可以是設(shè)置在數(shù)字彩色復(fù)合機(jī)1的主控制部(未圖示)中的控制機(jī)構(gòu),也可以是獨(dú)立于主控制部設(shè)置,與主控制部相互配合進(jìn)行處理的控制機(jī)構(gòu)。 圖像處理裝置3在圖像形成模式下,將對(duì)從圖像輸入裝置2輸入的圖像數(shù)據(jù)實(shí)施各種圖像處理而獲得的CMYK圖像數(shù)據(jù)輸出到圖像輸出裝置4。另外,在圖像發(fā)送模式下,對(duì)從圖像輸入裝置2輸入的圖像數(shù)據(jù)實(shí)施傾斜修正處理、圖像區(qū)域抽出處理、變倍處理、旋轉(zhuǎn)處理等圖像處理,并且對(duì)圖像數(shù)據(jù)實(shí)施文字識(shí)別處理,取得文本數(shù)據(jù),生成包含圖像數(shù)據(jù)和文本數(shù)據(jù)的圖像文件,并輸出到通信裝置5。其中,關(guān)于圖像處理裝置3的詳細(xì)內(nèi)容將在后面說明。 圖像輸出裝置4用于將從圖像處理裝置3輸入的圖像數(shù)據(jù)輸出到記錄材料(例如紙等)上。圖像輸出裝置4的結(jié)構(gòu)沒有特殊限定,例如可以使用采用了電子照片方式或噴墨方式的圖像輸出裝置。 通信裝置5例如由調(diào)制解調(diào)器和網(wǎng)卡構(gòu)成。通信裝置5通過網(wǎng)卡、LAN線纜等與和網(wǎng)絡(luò)連接的其他裝置(例如個(gè)人計(jì)算機(jī)、服務(wù)器裝置、顯示裝置、其他數(shù)字復(fù)合機(jī)、傳真裝置等)進(jìn)行數(shù)據(jù)通信。通信裝置5在發(fā)送圖像數(shù)據(jù)的情況下,進(jìn)行與對(duì)方地址的發(fā)送聯(lián)絡(luò),在確保了可發(fā)送的狀態(tài)時(shí),從存儲(chǔ)器中讀出以規(guī)定格式壓縮的圖像數(shù)據(jù),實(shí)施壓縮格式的變更等必要的處理,通過通信線路,依次發(fā)送給對(duì)方。另外,通信裝置5在接收?qǐng)D像數(shù)據(jù)的情況下,在進(jìn)行通信聯(lián)絡(luò)的同時(shí),接收從對(duì)方發(fā)送來的圖像數(shù)據(jù),并輸入到圖像處理裝置3中。接收到的圖像數(shù)據(jù)在圖像處理裝置3中被實(shí)施解壓縮處理、旋轉(zhuǎn)處理、分辨率轉(zhuǎn)換處理、輸出灰度修正、灰度再現(xiàn)處理等規(guī)定的處理,然后由圖像輸出裝置4輸出。另外,也可以將接收到的圖像數(shù)據(jù)保存到存儲(chǔ)裝置(未圖示)中,圖像處理裝置3根據(jù)需要將其讀出,實(shí)施上述規(guī)定的處理。 操作面板6例如由液晶顯示器等顯示部和設(shè)定按鈕等構(gòu)成(均未圖示),在上述顯示部上顯示與數(shù)字彩色復(fù)合機(jī)1的主控制部(未圖示)的指示對(duì)應(yīng)的信息,并且將用戶通過上述設(shè)定按鈕輸入的信息傳達(dá)給上述主控制部。用戶可以通過操作面板6,輸入對(duì)于輸入圖像數(shù)據(jù)的處理模式、打印枚數(shù)、紙尺寸、發(fā)送對(duì)方地址等各種信息。 上述主控制部例如由CPU (Central Processing Unit)等構(gòu)成,根據(jù)在未圖示的ROM等中存儲(chǔ)的程序和各種數(shù)據(jù)、以及從操作面板6輸入的信息等,控制數(shù)字彩色復(fù)合機(jī)1的各部的工作。 下面,對(duì)圖像處理裝置3中具備的各部在上述各模式下的處理進(jìn)行說明。
(2)圖像處理裝置3的結(jié)構(gòu)及動(dòng)作
(2-1)圖像形成模式 下面,對(duì)圖像處理裝置3的結(jié)構(gòu)、及在圖像形成模式下的圖像處理裝置3的動(dòng)作進(jìn)行詳細(xì)說明。在圖像形成模式的情況下,如圖2所示,首先,A/D轉(zhuǎn)換部ll將從圖像輸入裝置2輸入的RGB模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),并輸出到陰影修正部12。
陰影修正部12對(duì)從A/D轉(zhuǎn)換部ll送來的數(shù)字RGB信號(hào),實(shí)施除去在圖像輸入裝置2的照明系統(tǒng)、成像系統(tǒng)、攝像系統(tǒng)中產(chǎn)生的各種失真的處理,然后輸出到輸入處理部13。
輸入處理部(輸入灰度修正部)13對(duì)被陰影修正部12被除去了各種失真后的RGB信號(hào)調(diào)整彩色平衡,同時(shí)進(jìn)行轉(zhuǎn)換成濃度信號(hào)等圖像處理裝置3中采用的圖像處理系統(tǒng)容易處理的信號(hào)的處理。而且,進(jìn)行底色濃度的除去和對(duì)比度等畫質(zhì)調(diào)整處理。并且,輸入處理部13將實(shí)施了上述各種處理的圖像數(shù)據(jù)存儲(chǔ)到存儲(chǔ)部23中。 原稿檢測(cè)部(條件檢測(cè)部)14根據(jù)圖像數(shù)據(jù)檢測(cè)出原稿圖像的傾斜角度、上下方向、圖像數(shù)據(jù)中的作為存在圖像的區(qū)域的圖像區(qū)域等。而且,原稿修正部15根據(jù)原稿檢測(cè)部14的檢測(cè)結(jié)果,對(duì)圖像數(shù)據(jù)進(jìn)行傾斜修正處理、上下修正處理、和圖像抽出處理等。
圖5是表示原稿檢測(cè)部14的概略結(jié)構(gòu)的框圖。如該圖所示,原稿檢測(cè)部14具有信號(hào)轉(zhuǎn)換部31、2值化處理部32、分辨率轉(zhuǎn)換部33、原稿傾斜檢測(cè)部34及布局解析部35。
信號(hào)轉(zhuǎn)換部31用于在由輸入處理部13實(shí)施了上述各種處理的圖像數(shù)據(jù)是彩色圖像的情況下,將該圖像數(shù)據(jù)無彩化,轉(zhuǎn)換成明度信號(hào)或輝度信號(hào)。 例如,信號(hào)轉(zhuǎn)換部31通過運(yùn)算Yi = 0. 30Ri+0. 59Gi+0. 11Bi,將RGB信號(hào)轉(zhuǎn)換成輝度信號(hào)Y。這里,Y是各像素的輝度信號(hào),R、G、B是各像素的RGB信號(hào)中的各色成分,下標(biāo)i是對(duì)每個(gè)像素賦予的值(i是1以上的整數(shù))。 或者,也可以將RGB信號(hào)轉(zhuǎn)換成CIE1976L*a*b*信號(hào)(CIE -CommissionInternational de 1 , Eclairage、:明度、a*、 b* :色度)。 2值化處理部32通過將無彩化后的圖像數(shù)據(jù)(輝度值(輝度信號(hào))或明度值(明度信號(hào)))與預(yù)先設(shè)定的閾值進(jìn)行比較,將圖像數(shù)據(jù)2值化。例如,在圖像數(shù)據(jù)為8比特的情況下,將上述閾值設(shè)定為128?;蛘撸部梢詫⒂啥鄠€(gè)像素(例如5像素X5像素)構(gòu)成的區(qū)塊的濃度(像素值)的平均值作為閾值。 分辨率轉(zhuǎn)換部33將2值化后的圖像數(shù)據(jù)的分辨率轉(zhuǎn)換成低分辨率。例如,將以1200dpi、750dpi或600dpi讀取的圖像數(shù)據(jù)轉(zhuǎn)換成300dpi。分辨率轉(zhuǎn)換方法沒有特殊的限定,例如可使用公知的近鄰取樣(NearestNeighbor)法、雙線性法、雙三次法(bicubic)等。而且,分辨率轉(zhuǎn)換部33將低分辨率化后的圖像數(shù)據(jù)(在本實(shí)施方式中是300dpi的圖像數(shù)據(jù))輸出到原稿傾斜檢測(cè)部34。其中,分辨率轉(zhuǎn)換部33在圖像發(fā)送模式的情況下,將被低分辨率化為第l分辨率(在本實(shí)施方式中是300dpi)的圖像數(shù)據(jù)輸出到原稿傾斜檢測(cè)部34和布局解析部35中,并且將被低分辨率化為第2分辨率(在本實(shí)施方式中是75dpi)的圖像數(shù)據(jù)輸出到布局解析部35。 原稿傾斜檢測(cè)部34根據(jù)由分辨率轉(zhuǎn)換部33轉(zhuǎn)換成低分辨率的圖像數(shù)據(jù),檢測(cè)圖像讀取時(shí)原稿相對(duì)掃描范圍(正確的原稿位置)的傾斜角度,將檢測(cè)結(jié)果輸出到原稿修正部15。 S卩,如圖6所示,在相對(duì)圖像輸入裝置2中的掃描范圍(正確的原稿位置),圖像讀取時(shí)的原稿位置發(fā)生了傾斜的情況下,檢測(cè)該傾斜角度。 傾斜角度的檢測(cè)方法沒有特殊的限定,可使用以往公知的各種方法。例如,可以使用專利文獻(xiàn)2中記載的方法。在該方法中,從2值化后的圖像數(shù)據(jù)中抽出多個(gè)黑像素與白像素的交界點(diǎn)(例如各文字上端的白/黑交界點(diǎn)的坐標(biāo)),求出各交界點(diǎn)的點(diǎn)列的坐標(biāo)數(shù)據(jù)。然后,根據(jù)該點(diǎn)列的坐標(biāo)數(shù)據(jù)求出回歸直線,根據(jù)下式(1)計(jì)算出其回歸系數(shù)b。
b = Sxy/Sx ... (1)
其中,Sx、Sy分別是變量x、y的殘差平方和,Sxy是x的殘差與y的殘差之積的和'即,Sx、Sy、Sxy可用下式(2) (4)來表示。
[算式1]<formula>formula see original document page 10</formula>
然后,利用如上述那樣計(jì)算出的回歸系數(shù)b,根據(jù)下式(5),計(jì)算出傾斜角度e 。
<formula>formula see original document page 10</formula>
布局解析部35在圖像形成模式下不動(dòng)作。關(guān)于布局解析部35的動(dòng)作將在后面說明。 原稿修正部15根據(jù)原稿傾斜檢測(cè)部34的傾斜角度檢測(cè)結(jié)果,對(duì)圖像數(shù)據(jù)實(shí)施傾斜修正處理。而且,原稿修正部15將被實(shí)施了傾斜修正處理后的圖像數(shù)據(jù),輸出到色修正部16及區(qū)域分離部21。 另外,也可以將由原稿修正部15實(shí)施了傾斜修正處理后的圖像數(shù)據(jù)作為歸檔數(shù)據(jù)進(jìn)行管理。該情況下,例如將上述圖像數(shù)據(jù)根據(jù)JPEG壓縮算法壓縮成JPEG代碼,保存到存儲(chǔ)部23中。然后,在被指示了對(duì)該圖像數(shù)據(jù)的復(fù)印輸出動(dòng)作、打印輸出動(dòng)作的情況下,從存儲(chǔ)部23中取出JPEG代碼,送到未圖示的JPEG解壓縮部,實(shí)施解壓縮處理,轉(zhuǎn)換成RGB數(shù)據(jù)。另外,在對(duì)上述圖像數(shù)據(jù)指示了發(fā)送動(dòng)作的情況下,從存儲(chǔ)部23中取出JPEG代碼,通過網(wǎng)絡(luò)和通信線路,從通信裝置5向外部裝置發(fā)送。 色修正部16為了實(shí)現(xiàn)色再現(xiàn)的忠實(shí)化,進(jìn)行根據(jù)包含不需要吸收成分的CMY(C :青、M :洋紅、Y :黃)色材料的分光特性除去色濁的處理。 黑生成底色除去部17進(jìn)行根據(jù)色修正后的CMY三色信號(hào)生成黑(K)信號(hào)的黑生成、和從原來的CMY信號(hào)減去通過黑生成得到的K信號(hào)而生成新的CMY信號(hào)的處理。由此,將CMY三色信號(hào)被轉(zhuǎn)換成CMYK四色信號(hào)。 空間濾波處理部18對(duì)由黑生成底色除去部17輸入的CMYK信號(hào)的圖像數(shù)據(jù),根據(jù)區(qū)域識(shí)別信號(hào)進(jìn)行基于數(shù)字濾波器的空間濾波處理(強(qiáng)調(diào)處理和/或平滑化處理),來修正空間頻率特性。由此,可減輕輸出圖像的模糊和顆粒狀劣化。 中間調(diào)生成部20與空間濾波處理部18同樣,對(duì)CMYK信號(hào)的圖像數(shù)據(jù),根據(jù)區(qū)域識(shí)別信號(hào)實(shí)施規(guī)定的處理。例如,對(duì)于由區(qū)域分離部21分離為文字的區(qū)域,為了提高特別是黑文字或彩色文字的再現(xiàn)性,在空間濾波處理部18的空間濾波處理下的鮮銳強(qiáng)調(diào)處理中,增加高頻的強(qiáng)調(diào)量。同時(shí),在中間調(diào)生成部20中,可選擇適合高頻再現(xiàn)的利用高分辨率篩選(screen)的二值化或多值化處理。而對(duì)于由區(qū)域分離部21分離為網(wǎng)點(diǎn)區(qū)域的區(qū)域,在空間濾波處理部18中,實(shí)施用于除去輸入網(wǎng)點(diǎn)成分的低通濾波處理。而且,在輸出灰度修正部19中進(jìn)行了將濃度信號(hào)等信號(hào),轉(zhuǎn)換成作為圖像輸出裝置4的特性值的網(wǎng)點(diǎn)面積率的輸出灰度修正處理后,在中間調(diào)生成部20中,實(shí)施最終將圖像分離成像素,并按照能夠再現(xiàn)各自的灰度的方式進(jìn)行處理的灰度再現(xiàn)處理(中間調(diào)生成)。關(guān)于由區(qū)域分離部21分離成照片的區(qū)域,進(jìn)行重視灰度再現(xiàn)性的利用篩選的二值化或多值化處理。
區(qū)域分離部21根據(jù)RGB信號(hào)將輸入圖像中的各像素,分離成黑文字區(qū)域、彩色文字區(qū)域、網(wǎng)點(diǎn)區(qū)域、相紙照片(連續(xù)灰度區(qū)域)區(qū)域的任意一種區(qū)域。區(qū)域分離部21根據(jù)分離結(jié)果,將表示像素屬于哪個(gè)區(qū)域的區(qū)域分離信號(hào)輸出到黑生成底色除去部17、空間濾波處理部18及中間調(diào)生成部20。 圖像文件生成部22在圖像形成模式下不動(dòng)作。關(guān)于圖像文件生成部22的詳細(xì)內(nèi)容,將在后面說明。 被實(shí)施了上述各處理的圖像數(shù)據(jù)在被暫時(shí)保存到未圖示的存儲(chǔ)器中之后,在規(guī)定
的時(shí)刻被讀出、輸入到圖像輸出裝置4。(2-2)圖像發(fā)送模式 下面,參照?qǐng)D3,對(duì)圖像發(fā)送模式下的圖像處理裝置3的動(dòng)作進(jìn)行詳細(xì)說明。其中,通常發(fā)送模式下的A/D轉(zhuǎn)換部11、陰影修正部12、輸入處理部13、原稿修正部15及區(qū)域分離部21的處理,與圖像形成模式時(shí)相同。 原稿檢測(cè)部14中的信號(hào)轉(zhuǎn)換部31、二值化處理部32、分辨率轉(zhuǎn)換部33及原稿傾斜檢測(cè)部34的動(dòng)作,與圖像形成模式的情況大致相同。 原稿檢測(cè)部14中具備的布局解析部35在圖像發(fā)送模式的情況下,如圖7所示,抽出從分辨率轉(zhuǎn)換部33輸入的第2分辨率的圖像數(shù)據(jù)中包含的文字,求出各文字的外接矩形,計(jì)算出相鄰的外接矩形之間的距離。然后,根據(jù)該相鄰的外接矩形之間的距離,判定圖像數(shù)據(jù)的文字是縱書還是橫書。而且,布局解析部35將表示判定結(jié)果的信號(hào)、和第1分辨率的圖像數(shù)據(jù)輸出到圖像文件生成部22所具備的文字識(shí)別部41。另外,在難以明確判定是縱書還是橫書的情況下,布局解析部35將表示該情況的信息作為判定結(jié)果輸出。
具體而言,布局解析部35按每個(gè)像素判斷圖像數(shù)據(jù)中的沿著副掃描方向延伸的最初的行中所包含的各像素是否是黑像素,對(duì)被判定為是黑像素的像素分配規(guī)定的標(biāo)記(label)。 然后,對(duì)與被附加了標(biāo)記的上述行在主掃描方向上鄰接的行,按每個(gè)像素判斷該行中包含的各像素是否是黑像素,對(duì)被判斷為是黑像素的像素分配與在完成了標(biāo)記附加的上述行中使用的標(biāo)記不同的標(biāo)記。然后,對(duì)被判斷為是黑像素的各像素,判斷與該像素鄰接的附加了標(biāo)記的上述行的像素是否是黑文字,在判斷為是黑文字的情況下,判斷為黑像素相互連結(jié),將該像素的標(biāo)記變更成與鄰接的附加了標(biāo)記的上述行的像素相同的標(biāo)記(與上一行的標(biāo)記相同的標(biāo)記)。 然后,對(duì)在主掃描方向排列的各行反復(fù)進(jìn)行上述的處理,抽出被附加了相同標(biāo)記的像素,由此進(jìn)行文字的抽出。 然后,計(jì)算被抽出的各文字的外接矩形。其中,各文字及各外接矩形的坐標(biāo),例如將圖像數(shù)據(jù)的左上端的位置作為原點(diǎn),來進(jìn)行計(jì)算。 另外,布局解析部35也可以對(duì)原稿內(nèi)的每個(gè)區(qū)域進(jìn)行布局識(shí)別處理。例如,布局解析部35可以抽出由外接矩形之間的距離大致均等的文字組構(gòu)成的區(qū)域,對(duì)抽出的每個(gè)區(qū)域進(jìn)行布局識(shí)別處理,由此來判斷是縱書還是橫書。 色修正部16將從原稿修正部15輸入的RGB圖像數(shù)據(jù),轉(zhuǎn)換成適合于一般普及的 顯示裝置的顯示特性的R' G'B'的圖像數(shù)據(jù)(例如sRGB數(shù)據(jù)),并輸出到黑生成底色除去 部17。黑生成底色除去部17在通常發(fā)送模式下,將從色修正部16輸入的圖像數(shù)據(jù)直接輸 出(直通)到空間濾波處理部18。 空間濾波處理部18對(duì)從黑生成底色除去部17輸入的R' G' B'圖像數(shù)據(jù),根據(jù)區(qū) 域識(shí)別信號(hào),進(jìn)行基于數(shù)字濾波器的空間濾波處理(強(qiáng)調(diào)處理和/或平滑處理),并輸出到 輸出灰度修正部19。輸出灰度修正部19在通常發(fā)送模式下,將從空間濾波處理部18輸入 的圖像數(shù)據(jù)直接輸出(直通)到中間調(diào)生成部20。 中間調(diào)生成部20對(duì)從輸出灰度修正部19輸入的R' G' B'圖像數(shù)據(jù),根據(jù)區(qū)域識(shí) 別信號(hào)實(shí)施規(guī)定的處理,并輸出到圖像文件生成部22。例如,中間調(diào)生成部20對(duì)文字區(qū)域 進(jìn)行使用了圖8中用實(shí)線表示的伽瑪曲線的修正,對(duì)文字區(qū)域以外的區(qū)域,進(jìn)行使用了圖8 中用虛線表示的伽瑪曲線的修正。其中,作為針對(duì)文字區(qū)域以外的區(qū)域的伽瑪曲線,優(yōu)選例 如預(yù)先設(shè)定與發(fā)送對(duì)方的外部裝置中具備的顯示裝置的顯示特性對(duì)應(yīng)的曲線,將文字區(qū)域 的伽瑪曲線設(shè)定成能夠清楚顯示文字。 從中間調(diào)生成部20輸出的R' G' B'圖像數(shù)據(jù),被輸入到圖像文件生成部22的格 式化處理部43。 圖像文件生成部22具有文字識(shí)別部41、描畫指令生成部42及格式化處理部43。 文字識(shí)別部41根據(jù)從原稿檢測(cè)部14輸入的第2分辨率的圖像數(shù)據(jù),抽出圖像數(shù)
據(jù)中包含的文字的特征量,將抽出結(jié)果與字典數(shù)據(jù)中包含的文字的特征量比較,來進(jìn)行文
字識(shí)別,檢測(cè)出與類似的文字對(duì)應(yīng)的文字代碼。而且,根據(jù)布局解析部35的判定結(jié)果(縱
書還是橫書),進(jìn)行由鄰接的文字構(gòu)成的單詞的識(shí)別處理。即,通過進(jìn)行鄰接的文字的組合、
與字典數(shù)據(jù)中包含的單詞數(shù)據(jù)的匹配,來進(jìn)行原稿中記載的單詞的識(shí)別處理。然后,將各文
字及各單詞的識(shí)別結(jié)果,作為文字識(shí)別結(jié)果輸出到描畫指令生成部42。 其中,在本實(shí)施方式中,文字識(shí)別部41將從圖像數(shù)據(jù)中包含的文字抽出的特征
量、與字典數(shù)據(jù)中包含的文字的特征量進(jìn)行比較,判定兩者的相似度。然后,在字典數(shù)據(jù)包
含的文字中存在多個(gè)與圖像數(shù)據(jù)中包含的文字的相似度為規(guī)定值以上的文字的情況下,將
這些多個(gè)文字的文字代碼作為文字識(shí)別結(jié)果,輸出到描畫指令生成部42。 例如,相似度的取得值是從O到1的范圍,在上述規(guī)定值被設(shè)定為0.8的情況
下,即在字典數(shù)據(jù)所包含的文字中,包含相對(duì)圖像數(shù)據(jù)中包含的文字的相似度為(0.726)、
(0. 891) 、 (0. 931) 、 (0. 776) 、 (0. 722)的文字的情況下,與相似度(0. 891)即(0. 931)對(duì)應(yīng)
的各文字被作為文字識(shí)別結(jié)果檢測(cè)出來。 另外,也可以在字典數(shù)據(jù)所包含的文字中,存在相對(duì)于與圖像數(shù)據(jù)中包含的文字 最類似的文字的相似度(最高最大值)的相似度之差小于規(guī)定值的文字的情況下,將這些 各文字的文字代碼作為文字識(shí)別結(jié)果輸出到描畫指令生成部42。 例如,在相似度的取得值是從O到1的范圍、上述規(guī)定值被設(shè)定為0.2的情況 下,即在字典數(shù)據(jù)所包含的文字中,包括與圖像數(shù)據(jù)中包含的文字的相似度為(0.726)、 (0. 891) 、 (0. 931) 、 (0. 776) 、 (0. 722)的文字的情況下,與最高相似度的(0. 931)對(duì)應(yīng)的文 字、及與最高相似度之差小于0. 2的(0. 891)所對(duì)應(yīng)的文字,被作為文字識(shí)別結(jié)果檢測(cè)出。
由此,例如圖9所示,在原稿中包含"開口部"這一字符串的情況下,針對(duì)文字 "口 ",檢測(cè)出漢字的"口 "、和片假名的"口 "這2種文字識(shí)別結(jié)果。另外,如圖9所示,在原 稿中包含文字")^一y"的情況下,針對(duì)文字"一",檢測(cè)出長(zhǎng)音符號(hào)"一"、和漢字的"一" 這2種文字識(shí)別結(jié)果。 而且,文字識(shí)別部41根據(jù)布局解析部35的判定結(jié)果(縱書還是橫書),進(jìn)行由相 鄰的文字構(gòu)成的單詞的識(shí)別處理。 例如,在布局解析部35的判定結(jié)果表示是橫書,并且如圖9所示那樣,在原稿中包 含了"開口部"這一字符串的情況下,可檢測(cè)出"開口部(力>^ : 3 ^ )"和"開口部(力> ^
口 ^ )"這2個(gè)單詞。同樣,在布局解析部35的判定結(jié)果表示是橫書,并且如圖9所示那樣, 在原稿中包含了 " * ^ 一 7° "這一字符串的情況下,可檢測(cè)出"L々一 A "和"L々1> 6 A " 這2個(gè)單詞。 另一方面,在布局解析部35的判定結(jié)果表示難以明確判定是縱書還是橫書的情 況下,文字識(shí)別部41對(duì)縱書的情況和橫書的情況這2種情況進(jìn)行單詞的檢測(cè)。例如,如圖9 所示,在原稿中包含"畫面像中"這一文字的情況下,文字識(shí)別部41檢測(cè)出"畫面"、"像中" 的單詞(認(rèn)為是橫書的情況下檢測(cè)出的單詞)、和"畫像"、"面中"的單詞(認(rèn)為是縱書的情 況下檢測(cè)出的單詞)這2組單詞。 其中,相似度的計(jì)算方法沒有特別的限定,可以使用以往公知的各種方法。
描畫指令生成部42生成用于將基于文字識(shí)別部41的文字識(shí)別結(jié)果的透明文本配 置到圖像文件內(nèi)的指令。這里,透明文本是用于將被識(shí)別的文字及單詞,作為文本信息以視 覺看不到的形式重疊(或嵌入)到圖像數(shù)據(jù)中的數(shù)據(jù)。例如,在PDF文件中,一般使用在圖 像數(shù)據(jù)中附加了透明文本的圖像文件。 格式化處理部43根據(jù)從描畫指令生成部42輸入的指令,將透明文本嵌入到從中
間調(diào)生成部20輸入的圖像數(shù)據(jù)中,生成規(guī)定格式的圖像文件。然后,將生成的圖像文件輸
出到通信裝置5。其中,在本實(shí)施方式中,格式化處理部43生成PDF格式的圖像文件。但圖
像文件的格式不限于此,只要是能夠在圖像數(shù)據(jù)中嵌入透明文本的格式即可。 圖10是表示由格式化處理部43生成的PDF格式的圖像文件的結(jié)構(gòu)的說明圖。如
該圖所示,上述圖像文件由報(bào)頭部、主體部、相互參照表及尾部構(gòu)成。 在報(bào)頭部中,包含對(duì)該文件是PDF文件進(jìn)行表示的字符串和版本編號(hào)。在主體部 中包含所顯示的信息和頁信息等。在相互參照表中,記述有用于訪問主體部的內(nèi)容的地址 信息。在尾部中,記述有表示首先從哪里進(jìn)行讀取的信息等。 主體部由記述了針對(duì)由各頁構(gòu)成的對(duì)象的參照信息等的文書目錄記述部、記述了 每頁的顯示范圍等信息的頁記述部、記述了圖像數(shù)據(jù)的圖像數(shù)據(jù)記述部、和記述了在描畫 對(duì)應(yīng)的頁時(shí)所應(yīng)用的條件的圖像描畫記述部構(gòu)成。其中,頁記述部、圖像數(shù)據(jù)記述部及圖像 描畫記述部與各頁對(duì)應(yīng)設(shè)置。 圖11表示了將從圖9所示的原稿檢測(cè)出的文字識(shí)別結(jié)果,作為透明文本嵌入到圖 像數(shù)據(jù)的情況下,針對(duì)圖像數(shù)據(jù)記述部的記述的一例。如該圖所示,在對(duì)1個(gè)文字檢測(cè)出多 個(gè)文字識(shí)別結(jié)果的情況下,與對(duì)應(yīng)于該文字的坐標(biāo)建立對(duì)應(yīng)關(guān)系地記述上述多個(gè)文字識(shí)別 結(jié)果(文字代碼)。另外,在不能判明是縱書還是橫書的情況下,將被視為縱書而檢測(cè)出的 單詞、和視為橫書而檢測(cè)出的單詞雙方,與對(duì)應(yīng)的字符串的坐標(biāo)建立對(duì)應(yīng)關(guān)系地記述。
13
通信裝置5將從格式化處理部43輸入的圖像文件,發(fā)送給通過網(wǎng)絡(luò)構(gòu)成可通信連
接的外部裝置。例如,通信裝置5利用未圖示的郵件處理部(任務(wù)裝置)將上述圖像文件
附加在電子郵件中進(jìn)行發(fā)送。 (2-3)圖像處理裝置3中的處理的概要 圖l是表示圖像處理裝置3中的概略處理的流程的流程圖。如該圖所示,首先,控 制部24受理通過操作面板6輸入的來自用戶的處理模式選擇指示(Sl)。而且,從圖像輸入 裝置2取得通過讀取原稿而獲得的圖像數(shù)據(jù)(S2)。 然后,控制部24使原稿檢測(cè)部14進(jìn)行傾斜角度的檢測(cè)(S3),并根據(jù)該檢測(cè)結(jié)果使 原稿修正部15進(jìn)行傾斜修正處理(S4)。 隨后,控制部24判斷在Sl中選擇指示的處理模式是否是圖像形成模式(S5)。然 后,在判斷為選擇了圖像形成模式的情況下,對(duì)被實(shí)施了傾斜修正處理的圖像數(shù)據(jù)實(shí)施規(guī) 定的處理,并輸出到圖像輸出裝置4(S6),然后結(jié)束處理。 另一方面,在S5中判斷為不是圖像形成模式的情況下,控制部24判斷為在S1中 選擇指示的處理模式是圖像發(fā)送模式,使原稿檢測(cè)部14的布局解析部35進(jìn)行布局解析 (解析原稿圖像中的文字方向是縱書還是橫書的處理)(S7)。然后,控制部24判斷是否能 夠確定布局(縱書還是橫書)(S8)。 在S8中判斷為能夠確定布局的情況下,控制部24使文字識(shí)別部41根據(jù)基于與 布局解析部35的解析結(jié)果對(duì)應(yīng)的文字方向,進(jìn)行文字識(shí)別處理(S9)。而在S8中判斷為不 能確定布局的情況下,控制部24使文字識(shí)別部41針對(duì)縱向及橫向雙方進(jìn)行文字識(shí)別處理
(510) 。 隨后,控制部24對(duì)于原稿中包含的各文字,判斷是否檢測(cè)出了多個(gè)文字識(shí)別結(jié)果
(511) 。然后,在只有l(wèi)個(gè)文字識(shí)別結(jié)果的情況下,采用該識(shí)別結(jié)果(S12);在存在多個(gè)文字 識(shí)別結(jié)果的情況下,采用這些多個(gè)文字識(shí)別結(jié)果(S13)。 隨后,控制部24使描畫指令生成部42生成用于將基于文字識(shí)別結(jié)果的透明文本 嵌入到圖像數(shù)據(jù)中的透明文本的配置指令(S14),使格式化處理部43生成針對(duì)被嵌入了透 明文本的圖像數(shù)據(jù)的規(guī)定形式的圖像文件(格式化)(S15)。然后,控制部24將格式化后的 圖像文件通過通信裝置5發(fā)送到外部裝置(S16),并結(jié)束處理。 如上所述,本實(shí)施方式涉及的數(shù)字彩色復(fù)合機(jī)1根據(jù)從原稿讀取的圖像數(shù)據(jù)進(jìn)行 文字識(shí)別處理,在檢測(cè)出多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況下,分別生成與這些各候補(bǔ)對(duì)應(yīng) 的文本數(shù)據(jù),將生成的各文本數(shù)據(jù)作為透明文本嵌入到圖像數(shù)據(jù)中。 由此,在根據(jù)被嵌入到圖像數(shù)據(jù)中的透明文本進(jìn)行關(guān)鍵字檢索的情況下,可抑制 關(guān)鍵字漏檢索的發(fā)生。 圖12(a) 圖12(f)是表示對(duì)根據(jù)從圖9所示的原稿讀取的圖像數(shù)據(jù)生成的圖像 文件,進(jìn)行了關(guān)鍵字檢索處理時(shí)的檢索結(jié)果的一例的說明圖。 在本實(shí)施方式中,由于將在視為橫書的情況下檢測(cè)出的單詞、和在視為縱書的情 況下檢測(cè)出的單詞雙方作為透明文本,嵌入到圖像數(shù)據(jù)中,所以,如圖12(a)及圖12(b)所 示,在將關(guān)鍵字設(shè)為"畫面"的情況、和設(shè)為"畫像"的情況雙方中,抽出對(duì)應(yīng)的字符串。
而且,在本實(shí)施方式中,由于在對(duì)1個(gè)文字檢測(cè)出多個(gè)文字識(shí)別結(jié)果的情況下,將 這些多個(gè)文字識(shí)別結(jié)果作為透明文本嵌入到圖像數(shù)據(jù)中,所以,如圖12(c)及圖12(d)所
14示,對(duì)于"開口部"這一字符串,無論是在將關(guān)鍵字作為"開口部(力…3 ;)"的情況下,
還是作為"開口部(力> 0 口^ )"的情況下,都抽出該"開口部"這一字符串。同樣,如圖
12(e)及圖12(f)所示,對(duì)于")^一y"這一字符串,無論是在將關(guān)鍵字設(shè)為"L々一A" 的情況下、還是設(shè)為"L々^ 6 ^ "的情況下,都抽出該"* ^ 一 :/ "這一字符串。
另外,在本實(shí)施方式中,構(gòu)成為原稿檢測(cè)部14將被二值化及低分辨率化后的圖像 數(shù)據(jù)輸出到圖像文件生成部22,但不限于此,例如,也可以構(gòu)成為如圖3的虛線所示,原稿 修正部15將對(duì)上述的被二值化及低分辨率化后的圖像數(shù)據(jù)實(shí)施了傾斜修正處理的圖像數(shù) 據(jù)輸出到圖像文件生成部22,由圖像文件生成部22的文字識(shí)別部41使用傾斜修正后的上 述圖像數(shù)據(jù),進(jìn)行文字識(shí)別處理。由此,與根據(jù)傾斜修正前的圖像數(shù)據(jù)進(jìn)行文字識(shí)別的情況 相比,可提高文字識(shí)別的精度。 而且,在本實(shí)施方式中,由原稿檢測(cè)部14根據(jù)被轉(zhuǎn)換成黑白二值(輝度信號(hào)),并 且被轉(zhuǎn)換成低分辨率(例如300dpi)的圖像數(shù)據(jù)進(jìn)行了文字識(shí)別。由此,即使在文字尺寸 比較大的情況下,也能夠可靠地進(jìn)行文字識(shí)別處理。但是,文字識(shí)別處理中使用的圖像的分 辨率不限于上述的例子。 并且,在本實(shí)施方式中,說明了格式化處理部43生成PDF格式的圖像文件時(shí)的實(shí) 施例,但不限于此,只要是圖像數(shù)據(jù)與文本數(shù)據(jù)能夠相互對(duì)應(yīng)的格式的圖像文件即可。例 如,也可以在以演示軟件(presentation soft)等格式配置了文本數(shù)據(jù)的基礎(chǔ)上,重疊配置 圖像數(shù)據(jù),生成使文本數(shù)據(jù)處于不可視狀態(tài),而只使圖像數(shù)據(jù)處于可視狀態(tài)的圖像文件。
另外,在本實(shí)施方式中,說明了將嵌入了透明文本的圖像數(shù)據(jù)通過通信裝置5發(fā) 送到外部裝置的情況,但不限于此。例如,也可以將嵌入了透明文本的圖像數(shù)據(jù)保存到數(shù)字 彩色復(fù)合機(jī)1所具備的存儲(chǔ)部、或可插拔安裝在數(shù)字彩色復(fù)合機(jī)1的存儲(chǔ)部中。
此外,在本實(shí)施方式中,文字識(shí)別部41根據(jù)從原稿檢測(cè)部14或原稿修正部15輸 入的被實(shí)施了二值化及低分辨率化的圖像數(shù)據(jù),實(shí)施文字識(shí)別處理,但不限于此。例如,也 可以如圖13所示,將從區(qū)域分離部21輸出的區(qū)域分離信號(hào)輸入給文字識(shí)別部41,由文字識(shí) 別部41根據(jù)該區(qū)域分離信號(hào),生成表示文字區(qū)域(由被判定為文字邊緣的像素構(gòu)成的圖像 區(qū)域)的文本位圖,只對(duì)文字區(qū)域進(jìn)行文字識(shí)別處理。 或者,也可以如圖14所示,設(shè)置根據(jù)圖像數(shù)據(jù)來判別原稿種類的原稿種類自動(dòng)判 別部25,將從該原稿種類自動(dòng)判別部25輸出的原稿種類判別信號(hào)輸入到文字識(shí)別部41 ,只 在原稿種類判別信號(hào)表示是包含文字的原稿(例如文字原稿、文字打印照片原稿、文字照 片紙照片原稿等)的情況下,由文字識(shí)別部41根據(jù)從原稿檢測(cè)部14或原稿修正部15輸入 的被實(shí)施了二值化及低分辨率化的圖像數(shù)據(jù),進(jìn)行文字識(shí)別處理。原稿種類自動(dòng)判別部25 中的原稿種類判別方法,只要是至少能夠判別出包含文字的原稿和不包含文字的原稿的方 法即可,沒有特殊的限定,可以使用以往公知的各種方法。 另外,在本實(shí)施方式中,說明了將本發(fā)明應(yīng)用到數(shù)字彩色復(fù)合機(jī)中的情況,但不限 于此,也可以應(yīng)用到黑白復(fù)合機(jī)中,而且,不限于復(fù)合機(jī),例如也可以應(yīng)用到單獨(dú)的圖像讀 取裝置中。 圖15是表示將本發(fā)明應(yīng)用到圖像讀取裝置時(shí)的結(jié)構(gòu)例的框圖。該圖所示的圖像 讀取裝置100具有圖像輸入裝置2、圖像處理裝置3b、通信裝置5和操作面板6。由于圖 像輸入裝置2、通信裝置5及操作面板6的結(jié)構(gòu)和功能,與上述的數(shù)字彩色復(fù)合機(jī)1的情況大致相同,所以這里省略其說明。 圖像處理裝置3b具有A/D轉(zhuǎn)換部11、陰影修正部12、輸入處理部13、原稿檢測(cè)部 14、原稿修正部15、色修正部16、圖像文件生成部22、存儲(chǔ)部23以及控制部24。而且,圖像 文件生成部22具有文字識(shí)別部41、描畫指令生成部42和格式化處理部43。
其中,除了不具備圖像形成模式這一點(diǎn);和色修正部16將色修正處理后的圖像數(shù) 據(jù)輸出到格式化處理部43,由格式化處理部43根據(jù)從色修正部16輸入的圖像數(shù)據(jù)生成向 外部裝置發(fā)送的圖像文件這一點(diǎn)以外,圖像處理裝置3b所具備的各部的功能與上述數(shù)字 彩色復(fù)合機(jī)1的情況大致相同。在圖像處理裝置3b中被實(shí)施上述各處理而生成的圖像文 件,被通信裝置5被發(fā)送給通過網(wǎng)絡(luò)構(gòu)成可通信連接的計(jì)算機(jī)或服務(wù)器等。
另外,在上述各實(shí)施方式中,也可以使用CPU等處理器,通過軟件來實(shí)現(xiàn)數(shù)字彩色 復(fù)合機(jī)1、圖像讀取裝置100所具備的各部(各個(gè)單元)。該情況下,數(shù)字彩色復(fù)合機(jī)1、圖 像讀取裝置100具有執(zhí)行實(shí)現(xiàn)各種功能的控制程序的指令的CPU (central processing unit)、儲(chǔ)存了上述程序的ROM (read only memory)、展開上述程序的RAM(randomaccess memory)、和儲(chǔ)存上述程序及各種數(shù)據(jù)的存儲(chǔ)器等存儲(chǔ)裝置(記錄介質(zhì))等。而且,本發(fā)明 的目的可通過將記錄了實(shí)現(xiàn)上述功能的軟件、即數(shù)字彩色復(fù)合機(jī)1、圖像讀取裝置100的控 制程序的程序代碼(執(zhí)行形式程序、中間代碼程序、源程序)的計(jì)算機(jī)可讀取記錄介質(zhì),提 供給數(shù)字彩色復(fù)合機(jī)1、圖像讀取裝置100,由其計(jì)算機(jī)(或CPU、MPU)讀出并執(zhí)行該記錄介 質(zhì)中記錄的程序代碼來實(shí)現(xiàn)。 作為上述記錄介質(zhì),例如可以使用磁帶與盒式磁帶等帶類、包括軟盤(注冊(cè)商 標(biāo))/硬盤等磁盤和CD-R0M/M0/MD/DVD/CD-R等光盤的盤類、IC卡(包括存儲(chǔ)卡)/光卡等 卡類、或者掩模R0M/EPR0M/EEPR0M/閃存ROM等半導(dǎo)體存儲(chǔ)器類等。 另外,也可以將數(shù)字彩色復(fù)合機(jī)1、圖像讀取裝置100構(gòu)成為能夠與通信網(wǎng)絡(luò)連 接,借助通信網(wǎng)絡(luò)供給上述程序。作為該通信網(wǎng)絡(luò),沒有特殊的限定,例如可以利用互聯(lián)網(wǎng)、 內(nèi)部網(wǎng)、擴(kuò)展網(wǎng)、LAN、ISDN、VAN、CATV通信網(wǎng)、虛擬專用網(wǎng)(virtual private network)、電 話線路網(wǎng)、移動(dòng)體通信網(wǎng)、衛(wèi)星通信網(wǎng)等。而且,作為構(gòu)成通信網(wǎng)絡(luò)的傳送介質(zhì),沒有特殊的 限定,例如可以利用IEEE1394、 USB、電力線傳送、有線TV線路、電話線、ADSL線路等有線方 式,也可以利用IrDA和遠(yuǎn)程控制那樣的紅外線、Bluetooth(注冊(cè)商標(biāo))、802. 11無線、移動(dòng) 電話網(wǎng)、衛(wèi)星線路、地表波數(shù)字網(wǎng)等無線方式。此外,本發(fā)明也能夠以通過電子傳送將上述 程序代碼具體化的被嵌入到載波中的計(jì)算機(jī)數(shù)據(jù)信號(hào)的形式實(shí)現(xiàn)。 而且,數(shù)字彩色復(fù)合機(jī)1、圖像讀取裝置100的各單元不限于使用軟件來實(shí)現(xiàn),也 可以由硬件邏輯電路構(gòu)成,還可以將進(jìn)行處理的一部分的硬件、與執(zhí)行該硬件的控制和進(jìn) 行其余處理的軟件的運(yùn)算機(jī)構(gòu)組合。 如上所述,本發(fā)明的圖像處理裝置具有文字識(shí)別部,其根據(jù)從原稿讀取而取得的 圖像數(shù)據(jù),對(duì)上述原稿中包含的文字進(jìn)行文字識(shí)別處理;和圖像文件生成部,其生成使通 過文字識(shí)別處理而獲得的文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng)的圖像文件;其中,在檢測(cè)出 多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況下,上述文字識(shí)別部分別生成與這些各候補(bǔ)對(duì)應(yīng)的文本數(shù) 據(jù),上述圖像文件生成部使上述文字識(shí)別部生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng), 生成上述圖像文件。
0150] 而本發(fā)明的圖像處理方法包括文字識(shí)別步驟,根據(jù)從原稿讀取而取得的圖像數(shù)據(jù),對(duì)上述原稿中包含的文字進(jìn)行文字識(shí)別處理;和圖像文件生成步驟,生成使通過文字識(shí)別處理而獲得的文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng)的圖像文件;其中,當(dāng)在上述文字識(shí)別步驟中檢測(cè)出多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況下,分別生成與這些各候補(bǔ)對(duì)應(yīng)的文本數(shù)據(jù),在上述圖像文件生成步驟中,使在上述文字識(shí)別步驟中生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng),生成上述圖像文件。 根據(jù)上述的圖像處理裝置及圖像處理方法,在檢測(cè)出多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況下,分別生成與這些各候補(bǔ)對(duì)應(yīng)的文本數(shù)據(jù),并使生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)對(duì)應(yīng),生成上述圖像文件。由此,在使用生成的圖像文件進(jìn)行關(guān)鍵字檢索時(shí),即使是存在多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況,也能夠使這些各候補(bǔ)包含在檢索對(duì)象中。從而,可抑制漏檢索的發(fā)生。 而且,也可以構(gòu)成為,在作為針對(duì)1個(gè)文字的文字識(shí)別結(jié)果的候補(bǔ),檢測(cè)出多個(gè)文字的情況下,上述文字識(shí)別部分別生成與這些多個(gè)文字對(duì)應(yīng)的文本數(shù)據(jù),上述圖像文件生成部使上述文字識(shí)別部生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng),生成上述圖像文件。
根據(jù)上述結(jié)構(gòu),在作為針對(duì)1個(gè)文字的文字識(shí)別結(jié)果的候補(bǔ)而檢測(cè)出了多個(gè)文字的情況下,使與這些多個(gè)文字對(duì)應(yīng)的各文本數(shù)據(jù)分別與上述圖像數(shù)據(jù)對(duì)應(yīng),生成上述圖像文件。由此,在使用生成的圖像文件進(jìn)行關(guān)鍵字檢索時(shí),能夠?qū)Υ嬖诙鄠€(gè)文字識(shí)別結(jié)果的候補(bǔ)的文字,包含這些各候補(bǔ)在內(nèi)進(jìn)行檢索。從而,可抑制漏檢索的發(fā)生。 并且,也可以構(gòu)成為,具有根據(jù)上述圖像數(shù)據(jù),對(duì)上述原稿中記載的單詞或文章是縱書還是橫書進(jìn)行解析的布局解析部,上述文字識(shí)別部在上述布局解析部不能確定上述原稿中記載的單詞或文章是縱書還是橫書的情況下,進(jìn)行對(duì)應(yīng)于縱書的文字識(shí)別處理和對(duì)應(yīng)于橫書的文字識(shí)別處理雙方,分別生成與這兩方的文字識(shí)別處理的結(jié)果對(duì)應(yīng)的文本數(shù)據(jù),上述圖像文件生成部使上述文字識(shí)別部生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng),生成上述圖像文件。 根據(jù)上述結(jié)構(gòu),在不能確定原稿上記載的單詞或文章是縱書還是橫書的情況下,使對(duì)應(yīng)于縱書的文字識(shí)別處理、和對(duì)應(yīng)于橫書的文字識(shí)別處理的雙方結(jié)果所對(duì)應(yīng)的文本數(shù)據(jù),分別與圖像數(shù)據(jù)對(duì)應(yīng),生成圖像文件。由此,即使在不能確定原稿上記載的單詞或文章是縱書還是橫書的情況下,也能夠在使用生成的圖像文件進(jìn)行關(guān)鍵字檢索時(shí),抑制漏檢索的發(fā)生。 另外,也可以構(gòu)成為,上述文字識(shí)別部根據(jù)針對(duì)上述圖像數(shù)據(jù)中包含的各文字的文字識(shí)別結(jié)果、和上述布局解析部的解析結(jié)果,進(jìn)行上述原稿中包含的單詞的識(shí)別處理,在上述布局解析部不能確定上述原稿中記載的單詞或文章是縱書還是橫書的情況下,分別生成由對(duì)應(yīng)于縱書的單詞的識(shí)別處理檢測(cè)出的單詞、和由對(duì)應(yīng)于橫書的單詞的識(shí)別處理檢測(cè)出的單詞雙方所對(duì)應(yīng)的文本數(shù)據(jù),上述圖像文件生成部使上述文字識(shí)別部生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng),生成上述圖像文件。 根據(jù)上述結(jié)構(gòu),在不能確定原稿上記載的單詞或文章是縱書還是橫書的情況下,使由對(duì)應(yīng)于縱書的文字識(shí)別處理檢測(cè)出的單詞、和由對(duì)應(yīng)于橫書的文字識(shí)別處理檢測(cè)出的單詞雙方所對(duì)應(yīng)的各文本數(shù)據(jù),分別與圖像數(shù)據(jù)對(duì)應(yīng),生成圖像文件。由此,即使在不能確定原稿上記載的單詞或文章是縱書還是橫書的情況下,也能夠在使用生成的圖像文件進(jìn)行關(guān)鍵字檢索時(shí),抑制漏檢索的發(fā)生。
而且,也可以構(gòu)成為,上述圖像文件生成部在上述圖像文件中,使上述文本數(shù)據(jù)與上述圖像數(shù)據(jù)中的與該文本數(shù)據(jù)對(duì)應(yīng)的文字在上述原稿上的位置相互對(duì)應(yīng)。例如,上述圖像文件生成部可以將上述文本數(shù)據(jù)作為透明文本,配置在上述圖像數(shù)據(jù)中的與對(duì)應(yīng)于該文本數(shù)據(jù)的文字在上述原稿上的位置對(duì)應(yīng)的位置。 根據(jù)上述結(jié)構(gòu),能夠確定與在使用生成的圖像文件的關(guān)鍵字檢索中檢測(cè)出的文字對(duì)應(yīng)的文字圖像。 本發(fā)明的圖像讀取裝置具有讀取原稿來取得原稿圖像的圖像數(shù)據(jù)的圖像讀取部、和上述任意一種圖像處理裝置。而本發(fā)明的圖像發(fā)送裝置具有上述任意一種圖像處理裝置、和將由上述圖像文件生成部生成的圖像文件發(fā)送給構(gòu)成為可通信連接的其他裝置的通信部。另外,本發(fā)明的圖像形成裝置具有上述任意一種圖像處理裝置、和將與圖像數(shù)據(jù)對(duì)應(yīng)的圖像形成在記錄材料上的圖像形成部。 根據(jù)上述各結(jié)構(gòu),在使用生成的圖像文件進(jìn)行關(guān)鍵字檢索時(shí),能夠?qū)Υ嬖诙鄠€(gè)文字識(shí)別結(jié)果的候補(bǔ)的文字,包含這些各候補(bǔ)在內(nèi)進(jìn)行檢索。從而,可抑制漏檢索的發(fā)生。
另外,上述圖像處理裝置也可以由計(jì)算機(jī)實(shí)現(xiàn),該情況下,通過使計(jì)算機(jī)作為上述各部動(dòng)作,從而由計(jì)算機(jī)實(shí)現(xiàn)上述圖像處理裝置的圖像處理程序、以及記錄了該程序的計(jì)算機(jī)可讀取記錄介質(zhì),也屬于本發(fā)明的范疇。 在具體實(shí)施方式
章節(jié)中說明的具體的實(shí)施方式或?qū)嵤├皇菫榱嗣鞔_說明本發(fā)明的技術(shù)內(nèi)容的示例,不應(yīng)被狹義地解釋為只限于這樣的具體例,在本發(fā)明的技術(shù)思想和技術(shù)方案所定義的范圍內(nèi),可以進(jìn)行各種變更實(shí)施。
工業(yè)上的可利用性 本發(fā)明可以應(yīng)用到生成使從原稿讀取而取得的圖像數(shù)據(jù)、和通過對(duì)該圖像數(shù)據(jù)實(shí)施文字識(shí)別處理而得到的文本數(shù)據(jù)相互對(duì)應(yīng)的圖像文件的圖像處理裝置、圖像讀取裝置及圖像發(fā)送裝置。
18
權(quán)利要求
一種圖像處理裝置,具有文字識(shí)別部,其根據(jù)從原稿讀取而取得的圖像數(shù)據(jù),對(duì)上述原稿中包含的文字進(jìn)行文字識(shí)別處理;和圖像文件生成部,其生成使通過文字識(shí)別處理而獲得的文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng)的圖像文件;其特征在于,在檢測(cè)出多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況下,上述文字識(shí)別部分別生成與這些各候補(bǔ)對(duì)應(yīng)的文本數(shù)據(jù),上述圖像文件生成部使上述文字識(shí)別部生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng),生成上述圖像文件。
2. 根據(jù)權(quán)利要求l所述的圖像處理裝置,其特征在于,在作為針對(duì)1個(gè)文字的文字識(shí)別結(jié)果的候補(bǔ),檢測(cè)出多個(gè)文字的情況下,上述文字識(shí) 別部分別生成與這些多個(gè)文字對(duì)應(yīng)的文本數(shù)據(jù),上述圖像文件生成部使上述文字識(shí)別部生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng), 生成上述圖像文件。
3. 根據(jù)權(quán)利要求l所述的圖像處理裝置,其特征在于,具有根據(jù)上述圖像數(shù)據(jù),對(duì)上述原稿中記載的單詞或文章是縱書還是橫書進(jìn)行解析的 布局解析部,在上述布局解析部不能確定上述原稿中記載的單詞或文章是縱書還是橫書的情況下, 上述文字識(shí)別部進(jìn)行與縱書對(duì)應(yīng)的文字識(shí)別處理和與橫書對(duì)應(yīng)的文字識(shí)別處理雙方,分別 生成與這兩方的文字識(shí)別處理的結(jié)果對(duì)應(yīng)的文本數(shù)據(jù),上述圖像文件生成部使上述文字識(shí)別部生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng), 生成上述圖像文件。
4. 根據(jù)權(quán)利要求3所述的圖像處理裝置,其特征在于,上述文字識(shí)別部根據(jù)針對(duì)上述圖像數(shù)據(jù)中包含的各文字的文字識(shí)別結(jié)果、和上述布局 解析部的解析結(jié)果,對(duì)上述原稿中包含的單詞進(jìn)行識(shí)別處理,在上述布局解析部不能確定上述原稿中記載的單詞或文章是縱書還是橫書的情況下, 分別生成由與縱書對(duì)應(yīng)的單詞的識(shí)別處理檢測(cè)出的單詞、和由與橫書對(duì)應(yīng)的單詞的識(shí)別處 理檢測(cè)出的單詞雙方所對(duì)應(yīng)的文本數(shù)據(jù),上述圖像文件生成部使上述文字識(shí)別部生成的各文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng), 生成上述圖像文件。
5. 根據(jù)權(quán)利要求l所述的圖像處理裝置,其特征在于,上述圖像文件生成部在上述圖像文件中,使上述文本數(shù)據(jù)與上述圖像數(shù)據(jù)中的與該文 本數(shù)據(jù)對(duì)應(yīng)的文字在上述原稿上的位置相互對(duì)應(yīng)。
6. 根據(jù)權(quán)利要求5所述的圖像處理裝置,其特征在于,上述圖像文件生成部將上述文本數(shù)據(jù)作為透明文本,配置在上述圖像數(shù)據(jù)中的與該文 本數(shù)據(jù)對(duì)應(yīng)的文字在上述原稿上的位置所對(duì)應(yīng)的位置。
7. —種圖像讀取裝置,其特征在于,具有 讀取原稿來取得原稿圖像的圖像數(shù)據(jù)的圖像讀取部;禾口 權(quán)利要求1所述的圖像處理裝置。
8. —種圖像發(fā)送裝置,其特征在于,具有 權(quán)利要求1所述的圖像處理裝置;禾口將由上述圖像文件生成部生成的圖像文件,發(fā)送給構(gòu)成為可通信連接的其他裝置的通 信部。
9. 一種圖像形成裝置,其特征在于,具有 權(quán)利要求1所述的圖像處理裝置;禾口將與圖像數(shù)據(jù)對(duì)應(yīng)的圖像形成在記錄材料上的圖像形成部。
10. —種圖像處理方法,包括文字識(shí)別步驟,根據(jù)從原稿讀取而取得的圖像數(shù)據(jù),對(duì) 上述原稿中包含的文字進(jìn)行文字識(shí)別處理;和圖像文件生成步驟,生成使通過文字識(shí)別處 理而獲得的文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng)的圖像文件;其特征在于,當(dāng)在上述文字識(shí)別步驟中檢測(cè)出多個(gè)文字識(shí)別結(jié)果的候補(bǔ)時(shí),分別生成與這些各候補(bǔ) 對(duì)應(yīng)的文本數(shù)據(jù),在上述圖像文件生成步驟中,使在上述文字識(shí)別步驟中生成的各文本數(shù)據(jù)與上述圖像 數(shù)據(jù)相互對(duì)應(yīng),生成上述圖像文件。
全文摘要
本發(fā)明涉及圖像處理裝置及方法、圖像讀取裝置、圖像發(fā)送裝置,具有文字識(shí)別部,根據(jù)從原稿讀取而取得的圖像數(shù)據(jù),對(duì)上述原稿中包含的文字進(jìn)行文字識(shí)別處理;和格式化處理部,生成使通過文字識(shí)別處理而獲得的文本數(shù)據(jù)與上述圖像數(shù)據(jù)相互對(duì)應(yīng)的圖像文件。在檢測(cè)出多個(gè)文字識(shí)別結(jié)果的候補(bǔ)的情況下,文字識(shí)別部分別生成與這些各候補(bǔ)對(duì)應(yīng)的文本數(shù)據(jù),格式化處理部將文字識(shí)別部生成的各文本數(shù)據(jù)分別與圖像數(shù)據(jù)相互對(duì)應(yīng),生成圖像文件。由此,在生成使從原稿讀取而取得的圖像數(shù)據(jù)、與通過對(duì)該圖像數(shù)據(jù)進(jìn)行文字識(shí)別處理而獲得的文本數(shù)據(jù)相互對(duì)應(yīng)的圖像文件的圖像處理裝置中,當(dāng)進(jìn)行基于上述文本數(shù)據(jù)的關(guān)鍵字檢索時(shí),可抑制漏檢索的發(fā)生。
文檔編號(hào)G06K9/00GK101753764SQ20091025912
公開日2010年6月23日 申請(qǐng)日期2009年12月11日 優(yōu)先權(quán)日2008年12月17日
發(fā)明者吉田章人 申請(qǐng)人:夏普株式會(huì)社