本發(fā)明涉及作為具備復印功能、打印功能、傳真功能、掃描功能等的多功能數(shù)字圖像形成裝置的MFP(MultiFunctionPeripherals,多功能外設)等圖像處理裝置、以及該裝置中的電子文件生成方法。
背景技術:
::如果將例如通過掃描儀讀取字符原稿而得到的圖像數(shù)據(jù)那樣的包含字符的圖像數(shù)據(jù)變換為JPEG(JointPhotographicExpertsGroup,聯(lián)合圖像專家組)、PDF(PortableDocumentFormat,可移植文檔格式)等電子文件來輸出,則文件尺寸(文件大小)變大。因此,在專利文獻1或者專利文獻2中,公開了根據(jù)包含字符的圖像數(shù)據(jù)而生成尺寸(大小)小的電子文件的被稱為緊湊PDF(compactPDF)的技術。該技術是指如下技術:將圖像數(shù)據(jù)分離為字符區(qū)域和非字符區(qū)域,關于字符區(qū)域,在結合相同的字符顏色彼此的區(qū)域而構成1個層(layer)之后進行二值化,并且對頭部信息分配一個顏色來減小字符的信息量,關于非字符區(qū)域,在刪除字符之后進行JPEG壓縮從而提高JPEG壓縮率,減小文件尺寸。另外,在專利文獻3中,提出了以收斂于規(guī)定的文件尺寸的方式使分辨率變動的方法?!緦@墨I1】日本特開2007-318520號公報【專利文獻2】日本特開2008-42325號公報【專利文獻3】日本特開2010-278948號公報技術實現(xiàn)要素:但是,在上述專利文獻1以及2記載的技術中,如果用戶為了減小文件尺寸而進行低分辨率設定,則存在小尺寸的字符、復雜的字符(漢字等)發(fā)生變形而可讀性變差這樣的問題。相反地,如果設定為高分辨率,則發(fā)生雖然能夠確保字符的可讀性但文件尺寸變龐大這樣的其他問題。此外,通過組合各種畫質校正處理、例如背景去除水平校正、字符清晰度水平校正、邊緣強調水平校正等,從而具有即便是相同的分辨率也能夠提高字符品質的可能性,但需要圖像處理的知識和反復試驗,并不現(xiàn)實。另外,在有多個頁面的圖像數(shù)據(jù)的情況下,例如如果能夠以使大尺寸的字符、字母的頁面成為低分辨率、并使小尺寸的字符、日語成為高分辨率的方式改變設定則是較好的,但一般無法進行這樣的設定變更。另外,通過專利文獻3記載的方法,也仍無法解決如果降低分辨率則小尺寸的字符、復雜的字符(漢字等)的可讀性變差這樣的上述問題。本發(fā)明是鑒于這樣的技術背景而完成的,其課題在于提供一種能夠自動地生成將文件尺寸維持得較小的同時即便是小尺寸的字符、復雜的字符也能夠確保充分的可讀性的電子文件的圖像處理裝置以及電子文件生成方法。上述課題通過以下的方案來解決。(1)一種圖像處理裝置,其特征在于,具備:字符區(qū)域抽出單元,從包含字符的圖像數(shù)據(jù)抽出多個字符區(qū)域;字符尺寸計算單元,計算由所述字符區(qū)域抽出單元抽出的所述字符區(qū)域中的字符尺寸;復雜度計算單元,計算由所述字符區(qū)域抽出單元抽出的所述字符區(qū)域中的字符的復雜度;必要分辨率計算單元,根據(jù)由所述字符尺寸計算單元計算出的字符尺寸和由所述復雜度計算單元計算出的字符的復雜度,計算每個所述字符區(qū)域的必要分辨率;分辨率決定單元,將由所述必要分辨率計算單元計算出的必要分辨率的差為規(guī)定值以內的字符區(qū)域進行結合而構成為1個層,并且根據(jù)各層中包含的各字符區(qū)域的所述必要分辨率,來決定各層中的每一層的必要分辨率;以及分辨率變換單元,針對所述各層中的每一層,將該層中包含的字符區(qū)域的字符的分辨率變換為由所述分辨率決定單元所決定的該層的必要分辨率。(2)根據(jù)前項(1)所述的圖像處理裝置,其中,所述分辨率決定單元結合所述字符區(qū)域之間的空間距離或者字符顏色空間距離中的至少某一個為規(guī)定值以內的字符區(qū)域。(3)根據(jù)前項(1)或者(2)所述的圖像處理裝置,其中,具備判定單元,該判定單元判定由所述分辨率決定單元結合字符區(qū)域而構成的層的數(shù)量是否超過預先設定的閾值,所述分辨率決定單元在由所述判定單元判定為層的數(shù)量超過預先設定的閾值的情況下,增大所述字符區(qū)域的必要分辨率的差的規(guī)定值,結合必要分辨率的差為該規(guī)定值以內的字符區(qū)域。(4)根據(jù)前項(2)或者(3)所述的圖像處理裝置,其中,具備判定單元,該判定單元判定由所述分辨率決定單元結合字符區(qū)域而構成的層的數(shù)量是否超過預先設定的閾值,所述分辨率決定單元在由所述判定單元判定為層的數(shù)量超過預先設定的閾值的情況下,增大所述字符區(qū)域之間的空間距離或者字符顏色空間距離中的至少某一個的規(guī)定值,結合字符區(qū)域之間的空間距離或者顏色空間距離中的至少某一個為該規(guī)定值以內的字符區(qū)域。(5)根據(jù)前項(1)~(4)中的任意一項所述的圖像處理裝置,其中,所述復雜度是字符的邊緣比例。(6)根據(jù)前項(1)~(4)中的任意一項所述的圖像處理裝置,其中,所述復雜度是字符的分支點的數(shù)量。(7)根據(jù)前項(1)~(6)中的任意一項所述的圖像處理裝置,其中,所述分辨率決定單元將在構成1個層的字符區(qū)域中最高的必要分辨率決定為該層的必要分辨率。(8)根據(jù)前項(2)~(7)中的任意一項所述的圖像處理裝置,其中,所述字符區(qū)域的必要分辨率的差的規(guī)定值隨著字符區(qū)域之間的空間距離變大而被設定為小的值。(9)根據(jù)前項(2)~(8)中的任意一項所述的圖像處理裝置,其中,所述字符區(qū)域的必要分辨率的差的規(guī)定值隨著字符區(qū)域之間的字符顏色空間距離變大而被設定為小的值。(10)根據(jù)前項(1)~(9)中的任意一項所述的圖像處理裝置,其中,所述字符區(qū)域抽出單元根據(jù)所抽出的字符區(qū)域中的字符的邊緣比例的計算結果,從所述字符區(qū)域分離邊緣比例相對高的區(qū)域或者相對低的區(qū)域,將所分離的各區(qū)域設為不同的字符區(qū)域。(11)根據(jù)前項(1)~(10)中的任意一項所述的圖像處理裝置,其中,所述必要分辨率計算單元根據(jù)作為輸出設定的原稿模式設定,調整所述字符區(qū)域的必要分辨率。(12)根據(jù)前項(1)~(10)中的任意一項所述的圖像處理裝置,其中,所述必要分辨率計算單元根據(jù)作為輸出設定的字符品質模式設定,調整所述字符區(qū)域的必要分辨率。(13)一種電子文件生成方法,是圖像處理裝置中的電子文件生成方法,其特征在于,具備:字符區(qū)域抽出步驟,從包含字符的圖像數(shù)據(jù)抽出多個字符區(qū)域;字符尺寸計算步驟,計算通過所述字符區(qū)域抽出步驟抽出的所述字符區(qū)域中的字符尺寸;復雜度計算步驟,計算通過所述字符區(qū)域抽出步驟抽出的所述字符區(qū)域中的字符的復雜度;必要分辨率計算步驟,根據(jù)通過所述字符尺寸計算步驟計算出的字符尺寸和通過所述復雜度計算步驟計算出的字符的復雜度,計算每個所述字符區(qū)域的必要分辨率;分辨率決定步驟,將通過所述必要分辨率計算步驟計算出的必要分辨率的差為規(guī)定值以內的字符區(qū)域進行結合而構成為1個層,并且根據(jù)各層中包含的各字符區(qū)域的所述必要分辨率,來決定各層中的每一層的必要分辨率;以及分辨率變換步驟,針對所述各層中的每一層,將該層中包含的字符區(qū)域的字符的分辨率變換為通過所述分辨率決定步驟所決定的該層的必要分辨率。(14)根據(jù)前項(13)所述的電子文件生成方法,其中,在所述分辨率決定步驟中,結合所述字符區(qū)域之間的空間距離或者字符顏色空間距離中的至少某一個為規(guī)定值以內的字符區(qū)域。(15)根據(jù)前項(13)或者(14)所述的電子文件生成方法,其中,具備判定步驟,在該判定步驟中,判定通過所述分辨率決定步驟來結合字符區(qū)域而構成的層的數(shù)量是否超過預先設定的閾值,在所述分辨率決定步驟中,在通過所述判定步驟判定為層的數(shù)量超過預先設定的閾值的情況下,增大所述字符區(qū)域的必要分辨率的差的規(guī)定值,結合必要分辨率的差為該規(guī)定值以內的字符區(qū)域。(16)根據(jù)前項(14)或者(15)所述的電子文件生成方法,其中,具備判定步驟,在該判定步驟中,判定通過所述分辨率決定步驟來結合字符區(qū)域而構成的層的數(shù)量是否超過預先設定的閾值,在所述分辨率決定步驟中,在通過所述判定步驟判定為層的數(shù)量超過預先設定的閾值的情況下,增大所述字符區(qū)域之間的空間距離或者字符顏色空間距離中的至少某一個的規(guī)定值,結合字符區(qū)域之間的空間距離或者顏色空間距離中的至少某一個為該規(guī)定值以內的字符區(qū)域。根據(jù)前項(1)以及(13)記載的發(fā)明,從包含字符的圖像數(shù)據(jù)抽出多個字符區(qū)域,并且計算所抽出的字符區(qū)域中的字符尺寸和字符的復雜度,進而根據(jù)字符尺寸和字符的復雜度來計算每個字符區(qū)域的必要分辨率。結合計算出的必要分辨率的差為規(guī)定值以內的字符區(qū)域而構成為1個層,根據(jù)各層中包含的各字符區(qū)域的必要分辨率,來決定各層中的每一層的必要分辨率。然后,將各層中包含的字符區(qū)域的字符的分辨率變換為所述決定的該層的必要分辨率。即,根據(jù)字符尺寸和字符的復雜度來決定字符區(qū)域的必要分辨率,所以通過將即便是包括小尺寸的字符、復雜的字符的字符區(qū)域也能夠確??勺x性的分辨率決定為必要分辨率,從而各層中包含的字符被變換為能夠確??勺x性的分辨率,因此能夠防止小尺寸的字符、復雜的字符變形而無法讀取,能夠自動地生成具有充分的可讀性的電子文件。而且,結合必要分辨率的差為規(guī)定值以內的字符區(qū)域而構成1個層,所以能夠將電子文件的整體尺寸維持為小尺寸。根據(jù)前項(2)記載的發(fā)明,在字符區(qū)域之間的空間距離大的情況下,結合時的區(qū)域變大而使各層之間的重疊區(qū)域變大,在文件的印刷時的柵格化處理中花費時間。另外,如果字符顏色空間距離大,則無法進行如下處理:如上述緊湊PDF那樣結合相同的字符顏色彼此的區(qū)域來構成1個層,進行二值化并對頭部信息分配一個顏色來減小字符的信息量。因此,通過結合字符區(qū)域之間的空間距離或者字符顏色空間距離中的至少某一個為規(guī)定值以內的字符區(qū)域,能夠解決上述那樣的問題。根據(jù)前項(3)記載的發(fā)明,判定結合字符區(qū)域而構成的層的數(shù)量是否超過預先設定的閾值,在判定為超過閾值的情況下,放寬增大字符區(qū)域的必要分辨率的差的規(guī)定值而將字符區(qū)域結合為1個層時的基準,所以能夠將更多的字符區(qū)域結合為1個層,其結果能夠抑制層的數(shù)量的增加以及文件尺寸的擴大。根據(jù)前項(4)記載的發(fā)明,判定結合字符區(qū)域而構成的層的數(shù)量是否超過預先設定的閾值,在判定為超過閾值的情況下,放寬增大字符區(qū)域之間的空間距離或者字符顏色空間距離中的至少某一個的規(guī)定值而結合字符區(qū)域時的基準,所以能夠將更多的字符區(qū)域結合為1個層,其結果能夠抑制層的數(shù)量的增加以及文件尺寸的擴大。根據(jù)前項(5)記載的發(fā)明,能夠根據(jù)字符的邊緣比例和字符尺寸而高精度地計算字符的復雜度。根據(jù)前項(6)記載的發(fā)明,能夠根據(jù)字符的分支點的數(shù)量和字符尺寸而高精度地計算字符的復雜度。根據(jù)前項(7)記載的發(fā)明,將在構成1個層的字符區(qū)域中最高的必要分辨率決定為該層的必要分辨率,所以能夠可靠地確保層中包含的字符的可讀性。根據(jù)前項(8)記載的發(fā)明,字符區(qū)域的必要分辨率的差的規(guī)定值隨著字符區(qū)域之間的空間距離變大而被設定為小的值,所以隨著字符區(qū)域之間的空間距離變大而使所結合的字符區(qū)域的基準變得嚴格,從而能夠在防止層的數(shù)量的增加的同時,防止空間距離大的字符區(qū)域被結合為1個層。根據(jù)前項(9)記載的發(fā)明,字符區(qū)域的必要分辨率的差的規(guī)定值隨著字符區(qū)域之間的字符顏色空間距離變大而被設定為小的值,所以隨著字符區(qū)域之間的字符顏色空間距離變大而使所結合的字符區(qū)域的基準變得嚴格,從而能夠在防止層的數(shù)量的增加的同時,防止不是近似顏色的字符區(qū)域被結合為1個層。根據(jù)前項(10)記載的發(fā)明,從字符區(qū)域分離邊緣比例相對高的區(qū)域、相對低的區(qū)域,并處理為不同的字符區(qū)域,所以能夠抽出與字符的復雜度對應的字符區(qū)域。根據(jù)前項(11)記載的發(fā)明,根據(jù)作為輸出設定的原稿模式設定來調整字符區(qū)域的必要分辨率,所以能夠使各層中的字符的分辨率與原稿模式設定匹配而成為最佳的分辨率。根據(jù)前項(12)記載的發(fā)明,根據(jù)作為輸出設定的字符品質模式設定來調整字符區(qū)域的必要分辨率,所以能夠使各層中的字符的分辨率與字符品質模式設定匹配而成為最佳的分辨率。附圖說明圖1是示出本發(fā)明的一個實施方式的圖像形成裝置的基本結構的框圖。圖2是示出由圖像處理裝置的CPU實現(xiàn)的功能結構的框圖。圖3的(A)~(D)是比較將4個字符區(qū)域的字符串分別變換為300dpi、200dpi、100dpi、50dpi這樣的不同的4個分辨率之后進行了二值化時的字符可讀性的圖。圖4是關于漢字“覆”的邊緣比例的說明圖,該圖的(A)是字符尺寸15pt的狀態(tài),該圖的(B)是僅抽出了其邊緣的邊緣圖像。圖5是關于字母“A”的邊緣比例的說明圖,該圖的(A)是字符尺寸15pt的狀態(tài),該圖的(B)是僅抽出了其邊緣的邊緣圖像。圖6是關于漢字“覆”的邊緣比例的說明圖,該圖的(A)是字符尺寸6pt的狀態(tài),該圖的(B)是僅抽出了其邊緣的邊緣圖像。圖7是關于字母“A”的邊緣比例的說明圖,該圖的(A)是字符尺寸6pt的狀態(tài),該圖的(B)是僅抽出了其邊緣的邊緣圖像。圖8是示出關于漢字“覆”和字母“A”將字符尺寸與邊緣比例進行相乘得到的值的表。圖9是示出1/字符尺寸^1.25的圖表的圖。圖10是關于漢字“覆”和字母“A”根據(jù)從圖9所示的圖表求出的字符尺寸系數(shù)來求出字符尺寸×邊緣比例×字符尺寸系數(shù)的表。圖11是示出關于漢字“覆”針對每個其字符尺寸通過運算來求出的必要分辨率的表。圖12是示出關于字母“A”針對每個其字符尺寸通過運算來求出的必要分辨率的表。圖13的(A)是示出關于漢字“覆”的分支點的圖,(B)是示出關于字母“A”的分支點的圖。圖14是示出具有字符串的原稿的一個例子的圖。圖15是示出生成以往的緊湊PDF文件時的對多個字符區(qū)域進行了分組的狀態(tài)的圖。圖16是示出通過本發(fā)明的實施方式所示的處理來生成緊湊PDF文件時的對多個字符區(qū)域進行了分組的狀態(tài)的圖。圖17是示出圖像處理裝置的動作的流程圖。(符號說明)1:圖像處理裝置;11:CPU;12:ROM;14:掃描部;19:字符識別部;20:圖像處理部;21:字符區(qū)域抽出部;22:字符尺寸/復雜度計算部;23:字符區(qū)域必要分辨率計算部;24:分辨率決定部;25:分辨率變換部;301~310:字符區(qū)域;501~506:組(group)。具體實施方式以下,根據(jù)附圖,說明本發(fā)明的實施方式。圖1是示出本發(fā)明的一個實施方式的圖像處理裝置1的基本結構的框圖。在本實施方式中,作為圖像處理裝置,使用具備復印功能、打印功能、掃描功能等的上述MFP。圖像處理裝置1具備CPU11、ROM12、RAM13、掃描部14、存儲部15、打印部16、操作面板17、網(wǎng)絡控制器18、字符識別處理部19、以及圖像處理部20等。所述CPU11對圖像處理裝置1的整體進行總體控制,控制為可使用復印功能、打印功能、掃描功能、傳真功能等基本功能。另外,進行如下處理等,即,對于由掃描部14讀取的從包含字符的原稿得到的圖像數(shù)據(jù),通過字符識別處理部19來實施字符識別處理,并且通過圖像處理部20抽出作為字符串的區(qū)域的字符區(qū)域,或者抽出字符的尺寸、復雜度,或者決定必要的分辨率,在后面進行詳細的說明。所述ROM12是儲存CPU11的動作程序等的存儲器。所述RAM13是提供CPU11根據(jù)動作程序進行動作時的作業(yè)區(qū)域的存儲器。所述掃描部14是讀取放置于原稿臺(未圖示)的原稿的圖像,并變換為作為電子數(shù)據(jù)的圖像數(shù)據(jù)的讀取單元。所述存儲部15由例如硬盤驅動器(HDD)等非易失性的存儲設備構成,存儲有由掃描部24讀取的原稿的圖像數(shù)據(jù)、對該圖像數(shù)據(jù)進行分辨率變換而生成的電子文件、從其他圖像處理裝置或者用戶終端等發(fā)送來的數(shù)據(jù)、各種應用等。所述打印部16依照所指示的模式,印刷由所述掃描部14讀取的原稿的圖像數(shù)據(jù)、根據(jù)該圖像數(shù)據(jù)生成的電子文件、來自用戶終端的打印數(shù)據(jù)等。所述操作面板17被用于各種輸入操作等,具備:由對消息、操作畫面等進行顯示的觸摸面板式液晶等構成的顯示部17a、以及具有數(shù)字鍵、啟動鍵、停止鍵等的硬鍵部17b。所述網(wǎng)絡控制器18通過控制與網(wǎng)絡上的其他圖像形成裝置、其他外部機器例如用戶終端等之間的通信,進行數(shù)據(jù)的發(fā)送接收。所述字符識別處理部19進行如下處理:對由掃描部14讀取的從包含字符的原稿得到的圖像數(shù)據(jù)進行字符識別處理(OCR),將字符圖像變換為文本數(shù)據(jù)。該字符識別處理部19構成為CPU11的功能的一部分。所述圖像處理部20針對由掃描部14讀取的從包含字符的原稿得到的圖像數(shù)據(jù),抽出字符區(qū)域。圖2是示出通過圖像處理裝置1的CPU11而實現(xiàn)的功能結構的框圖,包括字符區(qū)域抽出部21、字符尺寸/復雜度計算部22、字符區(qū)域必要分辨率計算部23、分辨率決定部24、以及分辨率變換部25等。字符區(qū)域抽出部21基于公知的字符區(qū)域的抽出方法,從圖像數(shù)據(jù)抽出多個組的字符區(qū)域。例如,在1行中無間隔地存在字符串的情況下,將該字符串設為1個字符區(qū)域,在1行中隔著間隔而存在多個字符串的情況下,針對多個字符串的每一個,設為多個字符區(qū)域。另外,在1行中存在字符顏色不同的字符串的情況下,將該字符顏色不同的字符串設為1個字符區(qū)域。字符尺寸/復雜度計算部22計算由字符區(qū)域抽出部21抽出的各字符區(qū)域中的字符的尺寸和復雜度。字符尺寸的計算方法是公知的,所以說明省略。關于字符的復雜度,在后面敘述。字符區(qū)域必要分辨率計算部23根據(jù)由字符尺寸/復雜度計算部22計算出的字符尺寸和字符的復雜度,計算各字符區(qū)域的每一個的必要分辨率。此處,說明字符的復雜度和字符區(qū)域的必要分辨率。圖3的(A)~(D)是比較將4個字符區(qū)域的字符串分別變換為300dpi、200dpi、100dpi、50dpi這樣的不同的4個分辨率之后進行了二值化時的字符可讀性的圖。在任意圖中,都在各字符串的左側標注了該字符串的字符尺寸。具體而言,最上位的字符串是字符尺寸為15pt的漢字,其下方的字符串是字符尺寸為15pt的字母,其下方的字符串是字符尺寸為6pt的漢字,最下位的字符串是字符尺寸為6pt的字母。各圖的右旁示出的記號分別表示對應的左側的字符串的可讀性,○表示可讀性沒有問題,△表示在一部分中有字符變形/破壞,×表示無法讀取字符。關于字符尺寸為15pt的漢字,在分辨率300dpi、200dpi、100dpi中的任一種情況下可讀性都沒有問題,但在分辨率50dpi的情況下成為無法讀取字符的狀態(tài)。關于字符尺寸為15pt的字母,在分辨率300dpi、200dpi、100dpi、50dpi中的任一種情況下可讀性都沒有問題。關于字符尺寸為6pt的漢字,如果分辨率是300dpi則可讀性沒有問題,但在分辨率200dpi、100dpi以及50dpi的情況下,成為無法讀取字符的狀態(tài)。關于字符尺寸為6pt的字母,如果分辨率是300dpi以及200dpi則可讀性沒有問題,在分辨率100dpi下,在一部分中發(fā)生字符變形、破壞。如果成為50dpi,則成為無法讀取字符的狀態(tài)。從圖3的結果可知,字符由于(1)字符尺寸小、(2)字符的復雜度高(漢字的復雜度比字母更高),在分辨率下降時可讀性變差。即,能夠根據(jù)字符尺寸和字符的復雜度這2個指標,決定能夠保持字符的可讀性的最低分辨率。字符尺寸是針對每個字符或者每個字符串而檢測出的縱、橫尺寸,能夠通過公知的方法來計算。另外,認為邊緣、各邊的分支越多則字符越復雜,所以在本實施方式中,將字符的復雜度設為每1個字符的邊緣比例或者每1個字符的分支數(shù)。圖4是關于漢字“覆”的邊緣比例的說明圖,該圖的(A)是字符尺寸15pt的狀態(tài),該圖的(B)是僅抽出了其邊緣的邊緣圖像。字符的邊緣比例是字符的邊緣區(qū)域像素比例,如果定義為邊緣比例=字符的外切矩形內邊緣像素數(shù)/外切矩形像素數(shù),則邊緣比例是15.53%。另外,能夠確??勺x性的最低分辨率是100dpi。圖5是關于字母“A”的邊緣比例的說明圖,該圖的(A)是字符尺寸15pt的狀態(tài),該圖的(B)是僅抽出了其邊緣的邊緣圖像。邊緣比例是7.24%,能夠確保可讀性的最低分辨率是50dpi。圖6是關于漢字“覆”的邊緣比例的說明圖,該圖的(A)是字符尺寸6pt的狀態(tài),該圖的(B)是僅抽出了其邊緣的邊緣圖像。邊緣比例是38.81%,能夠確??勺x性的最低分辨率是300dpi。圖7是關于字母“A”的邊緣比例的說明圖,該圖的(A)是字符尺寸6pt的狀態(tài),該圖的(B)是僅抽出了其邊緣的邊緣圖像。邊緣比例是17.85%,能夠確??勺x性的最低分辨率是150dpi??紤]如下方法:根據(jù)在圖4~圖7中得到的結果,通過運算來求出用于確保針對漢字“覆”和字母“A”的各字符的可讀性的必要分辨率。圖8是關于漢字“覆”和字母“A”示出將字符尺寸(X)和邊緣比例(Y)相乘得到的值(X*Y)的表。從圖8可知,對于相同的字符,字符尺寸*邊緣比例是大致相同的值。即,邊緣比例和字符尺寸處于反比例的關系。但是,可知即便是相同的字符,如果字符尺寸不同則必要分辨率不同,所以還考慮用于計算必要分辨率的相乘系數(shù)。作為其一個例子,使用作為以實驗方式可得到正確的必要分辨率的相乘系數(shù)而求出的1/(字符尺寸的1.25乘方)。圖9示出了1/(字符尺寸的1.25乘方)的圖表。圖9的圖表表示存在如下特性:在字符尺寸小的情況下需要高分辨率,但隨著字符尺寸變大,必要分辨率急劇地降低。如果根據(jù)從圖9所示的圖表求出的字符尺寸系數(shù),針對漢字“覆”和字母“A”,求出將字符尺寸(X)、邊緣比例(Y)以及字符尺寸系數(shù)(Z)相乘得到的值(X*Y*Z),則成為如圖10所示。此外,在圖10中,還一并示出了從圖像求出的必要分辨率。在圖10的表中,可知如果將字符尺寸15pt的“覆”中的X*Y*Z的值設為1,將其必要分辨率設為100dpi,并根據(jù)其他字符中的X*Y*Z的值而通過運算來計算必要分辨率,則成為15pt的“覆”1:100dpi15pt的“A”0.47:47dpi6pt的“覆”3.14:314dpi6pt的“A”1.44:144dpi,得到從圖像求出的必要分辨率的近似值。在圖11的表中,示出關于漢字“覆”針對其每個字符尺寸通過運算而求出的必要分辨率,在圖12的表中,示出關于字母“A”針對其每個字符尺寸通過運算而求出的必要分辨率??芍@樣關于各字符,通過字符尺寸和邊緣比例以及適合的系數(shù)的選擇,可得到能夠確??勺x性的必要分辨率。如上所述,字符的復雜度也可以并非是邊緣比例,而是字符的分支數(shù)、換言之是構成字符的邊的交點之中的在至少3個方向上分支的交點(分支點)的數(shù)量。在圖13的(A)中,用白圈表示關于漢字“覆”的分支點,在該圖的(B)中,用白圈表示關于字母“A”的分支點。關于漢字“覆”的分支點數(shù)是13,關于字母“A”的分支點數(shù)是2。一般,關于復雜的字符,與邊緣比例同樣地具有分支點數(shù)增加的傾向,所以與字符尺寸和邊緣比例的情況同樣地,決定適合的相乘系數(shù),從而能夠通過運算來計算能夠確保最低限的可讀性的必要分辨率。圖2所示的字符區(qū)域必要分辨率計算部23在計算出關于上述字符的必要分辨率之后,針對各字符區(qū)域的每一個而計算必要分辨率。在本實施方式中,也可以針對字符區(qū)域中的代表字符、例如字符區(qū)域中的字符串的開頭的字符而計算必要分辨率,并將其決定為該字符區(qū)域的必要分辨率?;蛘?,也可以針對字符串中的所有字符而計算必要分辨率,并將其中最高的必要分辨率、平均值等決定為該字符區(qū)域的必要分辨率。另外,也可以構成為在1個字符區(qū)域的字符串中包括不同的尺寸的字符串的情況下,將不同的尺寸的字符串作為不同的字符區(qū)域來分離,分別決定必要分辨率。另外,也可以構成為根據(jù)1個字符區(qū)域中的各字符的邊緣比例的計算結果,從所述字符區(qū)域中將邊緣比例相對高的區(qū)域或相對低的區(qū)域從其他區(qū)域分離,將所分離的區(qū)域作為不同的字符區(qū)域來決定必要分辨率。例如是在由1行的字符串構成的1個字符串中部分地包含復雜的字符串那樣的情況、且是通過將復雜的字符串部分作為1個字符串來分離從而將1行的字符串分割為2個以上的字符串那樣的情況。另外,也可以根據(jù)作為文件印刷時等的輸出設定的原稿模式設定、字符品質模式設定等,調整字符區(qū)域的必要分辨率。例如,在由用戶并非設定照片優(yōu)先模式而是設定字符優(yōu)先模式作為原稿模式那樣的情況、設定高品質模式作為字符品質模式那樣的情況下,也可以將各字符區(qū)域的必要分辨率設為比根據(jù)各字符的尺寸和復雜度計算出的值更高的值。分辨率決定部24根據(jù)由字符區(qū)域必要分辨率計算部23計算出的各字符區(qū)域的必要分辨率,將具有相同程度的必要分辨率的字符區(qū)域彼此匯總到相同的組。換言之,結合必要分辨率的差在預先設定的規(guī)定值以內的字符區(qū)域彼此來構成1個層。此時,在作為字符區(qū)域之間的最小距離的空間距離大的情況下,進行了結合時的區(qū)域變大而使各層之間的重疊區(qū)域變大,在文件的印刷時的柵格化處理中花費時間。因此,也可以構成為在不僅是必要分辨率的差在預先設定的規(guī)定值以內,而且字符區(qū)域之間的空間距離在規(guī)定值以內的情況下,結合字符區(qū)域。作為成為向1個層的結合對象的字符區(qū)域的判定條件,在除了必要分辨率的差以外還加上字符區(qū)域之間的空間距離的情況下,字符區(qū)域之間的必要分辨率的差的規(guī)定值優(yōu)選為隨著字符區(qū)域之間的空間距離變大而被設定為小的值。隨著字符區(qū)域之間的空間距離變大,使結合為1個層的字符區(qū)域的基準變得嚴格,從而能夠在防止層的數(shù)量的增加的同時,防止空間距離大的字符區(qū)域被結合為1個層。另外,在與以往的緊湊PDF同樣地生成彩色電子文件的情況下,需要在1個層中用一個顏色來構成字符。因此,也可以是除了必要分辨率的差為預先設定的規(guī)定值以內這樣的條件以外,還在各字符區(qū)域的字符顏色空間距離是規(guī)定值以內的情況下,結合字符區(qū)域彼此來設為1個層。另外,也可以構成為除了必要分辨率的差為預先設定的規(guī)定值以內的條件以外,還在字符區(qū)域之間的空間距離以及字符顏色空間距離中的任意一個都分別是規(guī)定值以內的字符區(qū)域的情況下,結合為1個層。作為成為向1個層的結合對象的字符區(qū)域的判定條件,在除了必要分辨率的差以外還加上字符區(qū)域之間的字符顏色空間距離的情況下,字符區(qū)域之間的必要分辨率的差的規(guī)定值優(yōu)選為隨著字符區(qū)域之間的字符顏色空間距離變大而被設定為小的值。隨著字符區(qū)域之間的字符顏色空間距離變大,使結合為1個層的字符區(qū)域的基準變得嚴格,從而能夠在防止層的數(shù)量的增加的同時,防止不是近似顏色的字符區(qū)域被結合為1個層。這樣,對多個字符區(qū)域進行分組,針對各組的每一個,結合字符區(qū)域來構成各個層,但在本實施方式中,判定組的數(shù)量換言之層的數(shù)量是否超過預先設定的閾值,在判定為超過閾值的情況下,增大字符區(qū)域的必要分辨率的差的規(guī)定值而增加在1個組中包含的字符區(qū)域的數(shù)量。由此,防止因層的數(shù)量過度增加所致的文件尺寸的擴大。此外,也可以構成為如下:作為成為向1個層的結合對象的字符區(qū)域的判定條件,在除了必要分辨率的差以外還加上字符區(qū)域之間的空間距離和/或字符顏色空間距離的情況下,在層的數(shù)量超過預先設定的閾值時,通過增大字符區(qū)域之間的空間距離或者字符顏色空間距離中的至少某一個的規(guī)定值,從而增加在1個組中包含的字符區(qū)域的數(shù)量。在針對各組的每一組結合多個字符區(qū)域而構成層之后,分辨率決定部24針對各層而決定必要分辨率。關于層的必要分辨率,從能夠可靠地確??勺x性的觀點出發(fā),優(yōu)選將構成該層的字符區(qū)域的必要分辨率之中的最高的必要分辨率決定為該層的必要分辨率,但也可以利用各字符區(qū)域的必要分辨率的平均值等來決定。分辨率變換部25將各層中包含的字符區(qū)域的分辨率變換為由分辨率決定部24所決定的各層的必要分辨率。以使用了具有圖14所示那樣的字符串的原稿的情況為例,具體地說明針對每個組結合字符區(qū)域而構成各層、并且決定各層的必要分辨率并對分辨率進行變換的處理。圖14所示的原稿300被掃描部14所讀取,并由字符識別處理部19進行字符識別處理,通過字符區(qū)域抽出部21抽出到各個字符區(qū)域301~310。在各字符區(qū)域的左側,示出其字符區(qū)域的字符尺寸。字符區(qū)域301的字符尺寸為20pt,字符區(qū)域302~305以及310的字符尺寸為10pt,字符區(qū)域306、307以及309的字符尺寸為6pt,字符區(qū)域308的字符尺寸為5.5pt。另外,字符區(qū)域305以及309的字符是紅色,其他字符串的字符是黑色。另外,圖14示出由字符區(qū)域必要分辨率計算部23計算出的各字符區(qū)域301~310的必要分辨率。字符區(qū)域301的必要分辨率為70dpi,字符區(qū)域302~305以及310的必要分辨率為166dpi,字符區(qū)域306、307以及309的必要分辨率為314dpi,字符區(qū)域308的必要分辨率為112dpi。此處,在以往的緊湊PDF文件中,根據(jù)字符顏色以及空間距離來決定結合為1個層的字符區(qū)域的組。因此,如圖15所示,將空間距離近且字符顏色是黑色的字符區(qū)域301~304、306~308設為1個組401,將空間距離近且字符顏色是紅色的字符區(qū)域305以及309設為另一個組402,將剩余的字符區(qū)域310設為又一個組403,對組401以及403的層分配黑色,對組402的層分配紅色。另外,對于任意組,都將字符區(qū)域的分辨率變換為例如200dpi、300dpi并進行了二值化。相對于此,在本實施方式中,在必要分辨率相同或者接近的字符區(qū)域中進行分組,更優(yōu)選為將字符區(qū)域的空間距離、字符顏色空間距離追加到判定要素來進行分組,從而例如如圖16所示,由字符區(qū)域301構成1個組501,由字符區(qū)域302~304以及308構成組502,由字符區(qū)域306以及307構成組503,由字符區(qū)域305構成組504,由字符區(qū)域309構成組505,由字符區(qū)域310構成組506。此外,關于組502,字符尺寸10pt的字符區(qū)域302~304和字符尺寸5.5pt的字符區(qū)域308的必要分辨率分別與166dpi、162dpi大致相同,所以成為相同的結合對象。這樣,在將各字符區(qū)域分為各組之后,針對各組的每一組,將字符區(qū)域變換為各層的必要分辨率之后進行二值化。在本實施方式中,關于各層的必要分辨率,組501是70dpi,組502是166dpi,組503是314dpi,組504是166dpi,組505是314dpi,組506是166dpi。這樣,能夠自動地生成針對預定的每個字符區(qū)域按照最佳分辨率進行了變換的緊湊PDF文件。這樣,在本實施方式中,根據(jù)字符尺寸和字符的復雜度來決定字符區(qū)域301~310的必要分辨率,所以通過將即便是包括小尺寸的字符、復雜的字符的字符區(qū)域也能夠確??勺x性的分辨率決定為必要分辨率,從而各層501~506中包含的字符被變換為能夠確??勺x性的分辨率,其結果,能夠防止小尺寸的字符、復雜的字符變形而無法讀取,能夠自動地生成具有充分的可讀性的電子文件。而且,結合必要分辨率的差在規(guī)定值以內的字符區(qū)域而構成1個層,所以能夠將電子文件的整體尺寸維持為小尺寸。圖17是示出圖像處理裝置1的動作的流程圖。該動作是通過圖像處理裝置的CPU11依照儲存在ROM12等中的動作程序進行動作而執(zhí)行的。在步驟S01中從讀取原稿而得到的圖像數(shù)據(jù)中抽出第1個字符區(qū)域之后,在步驟S02中檢測字符區(qū)域的字符尺寸。接下來,在步驟S03中檢測字符區(qū)域的字符顏色,在步驟S04中計算各字符的邊緣比例,在步驟S05中計算各字符的復雜度之后,在步驟S06中計算該字符區(qū)域的必要分辨率。對于所有的字符區(qū)域,直至計算出必要分辨率為止反復進行以上的步驟S01~S06的處理(步驟S00、S07)。接下來,在步驟S11中,生成字符區(qū)域的組合(組)。具體而言,在步驟S12中,針對第1個字符區(qū)域,判定與其他第1個字符區(qū)域之間的字符顏色空間距離的差是否為規(guī)定值以下。如果不是規(guī)定值以下(在步驟S12中“否”),則進入到步驟S16。如果是規(guī)定值以下(在步驟S12中“是”),則在步驟S13中判定字符區(qū)域的空間距離的差是否為規(guī)定值以下。如果不是規(guī)定值以下(在步驟S13中“否”),則進入到步驟S16。如果是規(guī)定值以下(在步驟S13中“是”),則在步驟S14中判定字符區(qū)域的必要分辨率的差是否為規(guī)定值以下。如果不是規(guī)定值以下(在步驟S14中“否”),則進入到步驟S16。如果是規(guī)定值以下(在步驟S14中“是”),則在步驟S15中設定了表示是同一組的結合標志之后,進入到步驟S16。針對1個字符區(qū)域,直至在與其他所有字符區(qū)域之間的關系中判定結束為止反復進行以上的步驟S11~S15的處理,而且,針對其他各字符區(qū)域,直至在與其他所有字符區(qū)域之間的關系中判定結束為止反復進行以上的步驟S11~S15的處理。這樣,如果生成字符區(qū)域的組合,則在步驟S17中將設定有同一結合標志的字符區(qū)域彼此分別作為1個組來結合而構成各層。接下來,在步驟S18中,針對各層中的每一層而決定必要分辨率,并且將各字符串的分辨率變換為所決定的各層的必要分辨率,進而在步驟S19中執(zhí)行二值化處理,結束處理。當前第1頁1 2 3 當前第1頁1 2 3