專利名稱:自動(dòng)創(chuàng)建索引的圖像形成裝置及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像形成裝置,以及一種在圖像形成裝置中自動(dòng)創(chuàng)建索引的方法。更具體地講,本發(fā)明涉及一種圖像形成裝置,其在復(fù)制多張文檔頁時(shí),通過提取與其它一般文本不同的特殊文本作為索引來創(chuàng)建包括頁信息的索引頁,本發(fā)明還涉及一種自動(dòng)創(chuàng)建該索引頁的方法。
背景技術(shù):
一般,圖像形成裝置能夠通過掃描放置在文檔托盤上的文檔頁來復(fù)制文檔的圖像,并能夠打印與該文檔的復(fù)制圖像相同的圖像。典型地,圖像形成裝置可以包括掃描儀、復(fù)印機(jī)、打印機(jī)、傳真機(jī)以及在其中組合了其它裝置的功能的多功能外設(shè)(MFP)。
通常,圖像形成裝置掃描文檔以便將讀取的數(shù)據(jù)傳輸?shù)酵獠吭O(shè)備,諸如主機(jī)設(shè)備或另一個(gè)圖像形成裝置。圖像形成裝置還能夠在打印紙上打印出從外部設(shè)備接收的圖像或自己掃描的圖像。當(dāng)文檔有很多頁時(shí),圖像形成裝置仍以相同的方式處理該文檔。
然而,當(dāng)傳統(tǒng)圖像形成裝置處理具有多頁的文檔時(shí),為了確定傳輸?shù)酵獠吭O(shè)備或打印的文檔的內(nèi)容,用戶需要閱讀整個(gè)文檔。而且,可能需要用戶使用主機(jī)設(shè)備或應(yīng)用程序來手工創(chuàng)建索引頁。在這種情況下,就需要一個(gè)在主機(jī)設(shè)備上運(yùn)行的應(yīng)用程序。并且,創(chuàng)建索引頁所需的額外工作會(huì)給用戶帶來不便。
發(fā)明內(nèi)容
因此,本發(fā)明提供了一種圖像形成裝置,其能夠在復(fù)制多張文檔頁時(shí),通過從文檔頁提取與一般文本不同的特殊文本作為索引對(duì)象來自動(dòng)創(chuàng)建包括頁信息的索引頁,本發(fā)明還提供了相應(yīng)的方法。
本發(fā)明的其它方面將在下面的說明中進(jìn)行部分地闡述,并且將從說明中部分地變得明顯,或可以通過對(duì)本發(fā)明的實(shí)踐而學(xué)到。
本發(fā)明的前述和/或其它方面可以通過提供一種圖像形成裝置來實(shí)現(xiàn),所述圖像形成裝置包括掃描單元,用于掃描文檔;文本/圖像分離單元,用于將所掃描的文檔分離為文本區(qū)域和圖像區(qū)域,并用于將文本區(qū)域中的文本分離為符號(hào);索引確定單元,用于提取所分離的符號(hào)的一個(gè)或多個(gè)特性(property),并用于將所提取的符號(hào)特性與一個(gè)或多個(gè)索引閾值進(jìn)行比較,以確定包括該符號(hào)的文本是否是索引對(duì)象;以及索引頁創(chuàng)建單元,用于創(chuàng)建索引頁,該索引頁包括被確定為索引對(duì)象的文本以及關(guān)于包括對(duì)應(yīng)于所述索引對(duì)象的文本的頁的信息。
所提取的符號(hào)特性可以包括符號(hào)寬度、符號(hào)高度以及筆劃寬度中的一個(gè)或多個(gè)。
所述索引閾值可以是用于確定索引對(duì)象符號(hào)的參考值,包括符號(hào)寬度閾值、符號(hào)高度閾值和筆劃寬度閾值中的一個(gè)或多個(gè)。所述索引閾值可以被設(shè)置為基于預(yù)先設(shè)置的符號(hào)特性的變化而計(jì)算的預(yù)先設(shè)置的符號(hào)特性的平均值,或者所述索引閾值可以由用戶來設(shè)置。
索引確定單元可以在所提取的符號(hào)特性大于索引閾值時(shí),將所述符號(hào)確定為索引對(duì)象符號(hào)、將索引對(duì)象符號(hào)分類為組、并將由索引對(duì)象符號(hào)的組形成的文本確定為索引對(duì)象。
索引頁創(chuàng)建單元可以將所確定的索引對(duì)象鏈接到包括對(duì)應(yīng)于該索引對(duì)象的文本的頁。
本發(fā)明的前述和/或其它方面還可以通過提供一種圖像形成裝置來實(shí)現(xiàn),所述圖像形成裝置包括文本/圖像分離單元,用于接收與具有一頁或多頁的文檔相關(guān)的數(shù)據(jù),并用于確定在所述一頁或多頁中的文本區(qū)域;索引確定單元,用于從所述一頁或多頁的文本區(qū)域中確定一個(gè)或多個(gè)內(nèi)容指示文本;以及索引頁創(chuàng)建單元,用于創(chuàng)建包括所述一個(gè)或多個(gè)內(nèi)容指示文本的文檔的索引頁。
本發(fā)明的前述和/或其它方面還可以通過提供一種圖像形成裝置來實(shí)現(xiàn),所述圖像形成裝置包括索引確定單元,用于在與具有一頁或多頁的文檔相關(guān)的數(shù)據(jù)中區(qū)分特殊內(nèi)容和一般內(nèi)容;以及索引頁創(chuàng)建單元,用于創(chuàng)建包括作為一般內(nèi)容的內(nèi)容指示符的特殊內(nèi)容的索引。
本發(fā)明的前述和/或其它方面還可以通過提供一種在圖像形成裝置中自動(dòng)創(chuàng)建索引的方法來實(shí)現(xiàn),所述方法包括掃描文檔;將所掃描的文檔分離為文本區(qū)域和圖像區(qū)域,并將所述文本區(qū)域中的文本分離為符號(hào);提取所分離的符號(hào)的一個(gè)或多個(gè)特性,并比較所提取的符號(hào)特性與一個(gè)或多個(gè)索引閾值以確定包括所述符號(hào)的文本是否是索引對(duì)象;以及創(chuàng)建索引頁,該索引頁包括被確定為索引對(duì)象的文本和關(guān)于包括對(duì)應(yīng)于索引對(duì)象的文本的頁的信息。
所提取的符號(hào)特性可以包括符號(hào)寬度、符號(hào)高度和筆劃寬度中的一個(gè)或多個(gè)。
所述索引閾值可以是用于確定索引對(duì)象符號(hào)的參考值,包括符號(hào)寬度閾值、符號(hào)高度閾值和筆劃寬度閾值中的一個(gè)或多個(gè)。所述索引閾值可以被設(shè)置為基于預(yù)先設(shè)置的符號(hào)特性的變化計(jì)算的預(yù)先設(shè)置的符號(hào)特性的平均值,或者所述索引閾值可以由用戶來設(shè)置。
當(dāng)所提取的符號(hào)特性大于索引閾值時(shí),所述符號(hào)可以被確定為索引對(duì)象符號(hào),所述索引對(duì)象符號(hào)可以被分類為組,并且由所述組形成的文本可以被確定為索引對(duì)象。
所述索引頁的創(chuàng)建可以包括將所確定的索引對(duì)象鏈接到包括對(duì)應(yīng)于所述索引對(duì)象的文本的頁。
本發(fā)明的前述和/或其它方面還可以通過提供一種在圖像形成裝置中自動(dòng)創(chuàng)建索引頁的方法來實(shí)現(xiàn),所述方法包括接收與具有一頁或多頁的文檔相關(guān)的數(shù)據(jù),并確定在所述一頁或多頁中的文本區(qū)域;從所述一頁或多頁的文本區(qū)域中確定一個(gè)或多個(gè)內(nèi)容指示文本;以及自動(dòng)生成包括所述一個(gè)或多個(gè)內(nèi)容指示文本的文檔的索引頁。
本發(fā)明的前述和/或其它方面還可以通過提供一種在圖像形成裝置中自動(dòng)創(chuàng)建索引頁的方法來實(shí)現(xiàn),所述方法包括在與具有一頁或多頁的文檔相關(guān)的數(shù)據(jù)中區(qū)分特殊內(nèi)容和一般內(nèi)容;以及自動(dòng)生成包括作為一般內(nèi)容的內(nèi)容指示符的特殊內(nèi)容的索引頁。
本發(fā)明的前述和/或其它方面還可以通過提供一種含有可執(zhí)行代碼的計(jì)算機(jī)可讀介質(zhì)來實(shí)現(xiàn),所述可執(zhí)行代碼用于執(zhí)行在圖像形成裝置中自動(dòng)創(chuàng)建索引頁的方法的,所述介質(zhì)包括用于掃描文檔的可執(zhí)行代碼;用于將所掃描的文檔分離為文本區(qū)域和圖像區(qū)域、并將所述文本區(qū)域中的文本分離為符號(hào)的可執(zhí)行代碼;用于提取所分離的符號(hào)的一個(gè)或多個(gè)特性、并比較所提取的符號(hào)特性與一個(gè)或多個(gè)索引閾值以確定包括所述符號(hào)的文本是否是索引對(duì)象的可執(zhí)行代碼;以及用于創(chuàng)建索引頁的可執(zhí)行代碼,該索引頁包括被確定為索引對(duì)象的文本和關(guān)于包括對(duì)應(yīng)于索引對(duì)象的文本的頁的信息。
通過以下結(jié)合附圖對(duì)實(shí)施例進(jìn)行描述,本發(fā)明的這些和/或其它方面將變得清楚和更容易理解,其中圖1是圖示根據(jù)本發(fā)明的實(shí)施例的圖像形成裝置的框圖;圖2是圖示圖1的圖像形成裝置的文本/圖像分離單元的操作的視圖;圖3是圖示圖1的圖像形成裝置的索引確定單元的操作的視圖;圖4是圖示圖1的圖像形成裝置的索引頁創(chuàng)建單元的視圖;以及圖5是圖示根據(jù)本發(fā)明的實(shí)施例,在圖像形成裝置中自動(dòng)創(chuàng)建索引的方法的流程圖。
具體實(shí)施例方式
現(xiàn)在將詳細(xì)參考本發(fā)明的實(shí)施例,其示例被圖示在附圖中,其中相同的參考標(biāo)號(hào)總是指代相同的元件。以下描述實(shí)施例以便通過參考附圖對(duì)本發(fā)明進(jìn)行解釋。
圖1是圖示根據(jù)本發(fā)明的實(shí)施例的圖像形成裝置的框圖。
當(dāng)復(fù)制多張文檔頁時(shí),本實(shí)施例的圖像形成裝置從包括在每張文檔頁的文本區(qū)域中提取與一般文本不同的一個(gè)或多個(gè)特殊文本,并自動(dòng)創(chuàng)建包括所提取的文本以及相應(yīng)的頁信息的索引頁。由于文檔的題目、標(biāo)題或主要內(nèi)容通常比一般文本要大,因此在特殊文本與一般文本之間的辨別可以基于特殊文本的尺寸來執(zhí)行。特殊文本可以從文檔中的每頁提取,或者從文檔中有題目、標(biāo)題或主要內(nèi)容的頁提取。
參考圖1,圖像形成裝置包括掃描單元110、文本/圖像分離單元120、索引確定單元130、索引頁創(chuàng)建單元140、存儲(chǔ)單元150和控制單元160。
掃描單元110逐頁掃描多張文檔頁。文本/圖像分離單元120將掃描單元110掃描的文檔劃分為(1)包括字母、數(shù)字和記號(hào)的文本區(qū)域和(2)包括圖片、照片和圖表的圖像區(qū)域。此外,文本/圖像分離單元120還將文本區(qū)域的各個(gè)文本分離為符號(hào)(例如,字符)。
索引確定單元130提取由文本/圖像分離單元120分離的各個(gè)符號(hào)的特性,并利用所提取的符號(hào)的特性確定索引對(duì)象符號(hào)。即,索引確定單元130將所提取的構(gòu)成文檔的主要內(nèi)容、題目或標(biāo)題的符號(hào)確定為索引對(duì)象符號(hào)。而且,索引確定單元130將所確定的在最小距離內(nèi)的索引對(duì)象符號(hào)分類為組,并將分組的索引對(duì)象符號(hào),即文本,確定為索引對(duì)象。這里,索引確定單元130將靠近的索引對(duì)象符號(hào)分組在一起,這樣每組索引對(duì)象符號(hào)就構(gòu)成了單個(gè)索引對(duì)象。
索引頁創(chuàng)建單元140通過排列被索引確定單元130確定為索引對(duì)象的文本以及關(guān)于包括對(duì)應(yīng)于索引對(duì)象的文本的頁的信息來創(chuàng)建索引頁。索引頁創(chuàng)建單元140還將創(chuàng)建的索引頁插入到文檔中作為文檔的第一頁。這里,索引頁創(chuàng)建單元140將索引頁鏈接到文檔中的其它原始頁。例如,索引頁創(chuàng)建單元140能夠?qū)⑺饕撝械奶囟▽?duì)象鏈接到文檔中的特定標(biāo)題或題目。
存儲(chǔ)單元150存儲(chǔ)由掃描單元110掃描的文檔和由索引頁創(chuàng)建單元140創(chuàng)建的索引頁。
控制單元160控制文本/圖像分離單元120、索引確定單元130和索引頁創(chuàng)建單元140,以便基于所掃描的文檔自動(dòng)創(chuàng)建索引頁。
圖2是圖示圖1的圖像形成裝置的文本/圖像分離單元120的操作的視圖。
參考圖1和2,將被復(fù)制的文檔的第一頁200包括文本區(qū)域210和圖像區(qū)域220。
在掃描單元110掃描文檔的第一頁200之后,文本/圖像分離單元120將所掃描的第一頁200分離為文本區(qū)域210和圖像區(qū)域220。
文本/圖像分離單元120二進(jìn)制化(binarize)所分離的文本區(qū)域210(即,通過轉(zhuǎn)換為具有位于特定像素的點(diǎn)的二進(jìn)制圖像),并利用8鄰域連通分量(8-neighborhood connected component)將二選制化的文本分離為各個(gè)符號(hào)。更具體地講,文本/圖像分離單元120確定在存在點(diǎn)的特定像素周圍連通的8個(gè)像素中是否存在點(diǎn),并將具有連通性的一個(gè)獨(dú)立的個(gè)體分離為符號(hào)。換句話說,文本/圖像分離單元120檢查在文本區(qū)域210中具有點(diǎn)的特定像素的8個(gè)相鄰像素,以便分離文本區(qū)域210的各個(gè)符號(hào)(例如,字符)。例如,文本/圖像分離單元120將文本區(qū)域210中所示的“What”分別分離為字母“W”、“h”、“a”和“t”。
圖3是圖示圖1的圖像形成裝置的索引確定單元130的操作的視圖。
參考圖1、2和3,“H”是從第一頁200的文本區(qū)域210的第二段中的“How”中分離出的符號(hào)。
索引確定單元130提取該符號(hào)的特性,例如,符號(hào)寬度、符號(hào)高度和筆劃寬度。更具體地講,索引確定單元130通過從最大X軸坐標(biāo)值(X_max)減去最小X軸坐標(biāo)值(X_min)來提取符號(hào)寬度,并通過從最大Y軸坐標(biāo)值(Y_max)減去最小Y軸坐標(biāo)值(Y_min)來提取符號(hào)高度。而且,索引確定單元130確定在X軸方向上連續(xù)的像素中是否存在點(diǎn),由此來提取最高出現(xiàn)頻率(occurrence frequency)的點(diǎn)的數(shù)量作為筆劃寬度。例如,在圖3中,由于在符號(hào)“H”中由“筆劃寬度”所指示的部分出現(xiàn)頻率最高,因此索引確定單元130將該部分的寬度提取為筆劃寬度。
此外,索引確定單元130分別將所提取的符號(hào)特性與預(yù)先設(shè)置的索引閾值Th進(jìn)行比較。索引閾值Th是用于確定一個(gè)符號(hào)是否是索引對(duì)象符號(hào)的參考值,其包括符號(hào)寬度閾值、符號(hào)高度閾值和/或筆劃寬度閾值。索引閾值Th可以是基于符號(hào)特性的變化而計(jì)算的符號(hào)特性的平均值,或者可以由用戶來設(shè)置。索引閾值Th可以被預(yù)先設(shè)置。當(dāng)所提取的符號(hào)特性之一等于或大于相應(yīng)的預(yù)先設(shè)置的索引閾值時(shí),索引確定單元130將該符號(hào)確定為索引對(duì)象符號(hào)。換句話說,如果符號(hào)足夠大,索引確定單元130就將該符號(hào)確定為索引對(duì)象符號(hào)。
同樣地,索引確定單元130針對(duì)所有符號(hào)來確定索引對(duì)象符號(hào),基于接近度將被確定為索引對(duì)象符號(hào)的符號(hào)分成組,并將索引對(duì)象符號(hào)的組確認(rèn)為索引的對(duì)象。這里,例如,索引確定單元130可以通過考慮索引對(duì)象符號(hào)之間的最小距離來進(jìn)行分組。結(jié)果,文檔第一頁200的文本“How we got here”可以被確定為索引中的對(duì)象。
圖4圖示了根據(jù)本發(fā)明的實(shí)施例的索引頁創(chuàng)建單元140的操作。
索引頁創(chuàng)建單元140通過排列被索引確定單元130確定為索引中的對(duì)象的文本以及關(guān)于包括對(duì)應(yīng)于該索引對(duì)象的文本的頁信息的信息來創(chuàng)建索引頁400。索引頁創(chuàng)建單元140還將索引頁400插入到文檔中作為文檔的第一頁?;蛘?,索引頁400可以被插入到文檔的其它部分(例如,題目頁后的第二頁、最后一頁等)。在這個(gè)階段,索引頁創(chuàng)建單元140將索引頁400鏈接到文檔中的原始頁,以便當(dāng)用戶從索引頁400選擇索引對(duì)象(例如,通過選擇特定文本)時(shí),文檔中的相應(yīng)原始頁可以被選擇和/或展現(xiàn)。
如圖4所示,索引頁400包括被確定為索引中的對(duì)象的文本以及包括對(duì)應(yīng)于該索引對(duì)象的文本的頁信息。在文檔的第2頁中,“Our ManagementPhilosophy”是被確定為索引中的第二個(gè)索引對(duì)象的文本。在文檔的第3頁中,“CEO message”是被確定為索引中的第三個(gè)對(duì)象的文本。
因此,使用所創(chuàng)建的索引頁400可以容易地選擇文檔中每個(gè)原始頁的主要內(nèi)容。而且,由于索引頁400被鏈接到原始頁,因此能夠便利對(duì)期望內(nèi)容的搜索。
圖5是圖示根據(jù)本發(fā)明的實(shí)施例,在圖像形成裝置中自動(dòng)創(chuàng)建索引的方法的流程圖。例如,圖5的方法可以由圖1的圖像形成裝置來執(zhí)行。因此,出于舉例說明的目的,下面將參考圖1到圖5來描述圖5的方法。
參考圖5,掃描單元110逐頁掃描文檔(操作S510)。
文本/圖像分離單元120將由掃描單元110掃描的文檔分離為文本區(qū)域和圖像區(qū)域(操作S520)。此外,文本/圖像分離單元120將文本區(qū)域的文本分離為符號(hào)(操作S530)。
索引確定單元130提取由文本/圖像分離單元120分離的符號(hào)的特性(操作S540)。此外,索引確定單元130確定每個(gè)提取的符號(hào)特性是否大于預(yù)先設(shè)置的索引閾值Th(操作S550)。這里,索引確定單元130分別比較所提取的符號(hào)特性與相應(yīng)的索引閾值Th(例如,符號(hào)寬度閾值、符號(hào)高度閾值和筆劃寬度閾值)。當(dāng)所提取的任何一個(gè)符號(hào)特性大于相應(yīng)的索引閾值時(shí),索引確定單元130將該符號(hào)確定為索引對(duì)象符號(hào)。
當(dāng)所提取的符號(hào)特性大于索引閾值時(shí)(操作S550-是),索引確定單元130臨時(shí)存儲(chǔ)該索引對(duì)象符號(hào)(操作S560)。索引確定單元130對(duì)臨時(shí)存儲(chǔ)的索引對(duì)象符號(hào)進(jìn)行分組,由此從分組的符號(hào)形成文本對(duì)象。
控制單元160確定正在處理的頁是否是文檔的最后一頁(操作S570)。當(dāng)確定正在處理的頁是文檔的最后一頁時(shí)(操作S570-是),控制單元160控制索引頁創(chuàng)建單元140排列由索引確定單元130確定為索引中的對(duì)象的文本以及關(guān)于包括該文本對(duì)象的頁的信息,由此來創(chuàng)建索引頁(操作S580)。操作S520到S580可以在文檔在操作S510被掃描期間或之后執(zhí)行。
控制單元160可以控制圖像形成裝置,以使得由索引頁創(chuàng)建單元140創(chuàng)建的索引頁被打印輸出在打印紙上或被輸出到外部顯示設(shè)備,從而展示給用戶。
雖然本發(fā)明的實(shí)施例描述了在掃描文檔時(shí)創(chuàng)建索引頁,但是應(yīng)當(dāng)理解,本發(fā)明也可以在從外部設(shè)備接收文檔時(shí)實(shí)施。例如,本發(fā)明可以應(yīng)用到從外部設(shè)備接收的文檔數(shù)據(jù)。
本發(fā)明的實(shí)施例可以實(shí)施為一種計(jì)算機(jī)可讀記錄介質(zhì)上的計(jì)算機(jī)可讀代碼。所述計(jì)算機(jī)可讀記錄介質(zhì)可以包括任何能夠存儲(chǔ)數(shù)據(jù)、且該數(shù)據(jù)隨后可以被計(jì)算機(jī)系統(tǒng)讀取的數(shù)據(jù)存儲(chǔ)設(shè)備。計(jì)算機(jī)可讀記錄介質(zhì)的例子包括只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤、光數(shù)據(jù)存儲(chǔ)設(shè)備和載波(諸如通過因特網(wǎng)的數(shù)據(jù)傳輸)。計(jì)算機(jī)可讀記錄介質(zhì)還能夠分布在與計(jì)算機(jī)系統(tǒng)相連接的網(wǎng)絡(luò)上,從而以分布式方式存儲(chǔ)和執(zhí)行計(jì)算機(jī)可讀代碼。本發(fā)明的實(shí)施例還可以以硬件或硬件與軟件的組合來實(shí)現(xiàn)。
根據(jù)對(duì)本發(fā)明實(shí)施例的上述說明,由于索引頁被自動(dòng)創(chuàng)建,因此文檔的原始頁的主要內(nèi)容可以被容易地選擇和/或展示。而且,通過在索引頁與原始頁的內(nèi)容之間的鏈接,給搜索期望的內(nèi)容帶來了便利,從而提高了用戶的便利性。
雖然示出和描述了本發(fā)明的一些實(shí)施例,但是本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,在不脫離本發(fā)明的原理和精神的情況下,可以對(duì)這些實(shí)施例進(jìn)行改變,而本發(fā)明的范圍由所附權(quán)利要求書及其等效物來定義。
權(quán)利要求
1.一種圖像形成裝置,包括掃描單元,用于掃描文檔;文本/圖像分離單元,用于將所掃描的文檔分離為文本區(qū)域和圖像區(qū)域,并用于將文本區(qū)域中的文本分離為符號(hào);索引確定單元,用于提取所分離的符號(hào)的一個(gè)或多個(gè)特性,并用于將所提取的符號(hào)特性與一個(gè)或多個(gè)索引閾值進(jìn)行比較,由此確定包括所述符號(hào)的文本是否是索引對(duì)象;以及索引頁創(chuàng)建單元,用于創(chuàng)建索引頁,該索引頁包括被確定為索引對(duì)象的文本以及關(guān)于包括該文本的頁的信息。
2.權(quán)利要求1的圖像形成裝置,其中所述提取的符號(hào)特性包括符號(hào)寬度、符號(hào)高度和筆劃寬度中的一個(gè)或多個(gè)。
3.權(quán)利要求1的圖像形成裝置,其中所述索引閾值是用于確定索引對(duì)象符號(hào)的參考值,該索引閾值包括符號(hào)寬度閾值、符號(hào)高度閾值和筆劃寬度閾值中的一個(gè)或多個(gè),并且所述索引閾值被設(shè)置為基于預(yù)先設(shè)置的符號(hào)特性的變化而計(jì)算的預(yù)先設(shè)置的符號(hào)特性的平均值,或者所述索引閾值由用戶來設(shè)置。
4.權(quán)利要求1的圖像形成裝置,其中所述索引確定單元在所提取的符號(hào)特性大于所述索引閾值時(shí),將所述符號(hào)確定為索引對(duì)象符號(hào)、對(duì)所述索引對(duì)象符號(hào)進(jìn)行分組、并將包括所述索引對(duì)象符號(hào)的組的文本確定為索引中的對(duì)象。
5.權(quán)利要求1的圖像形成裝置,其中所述索引頁創(chuàng)建單元將所確定的索引對(duì)象鏈接到包括對(duì)應(yīng)于所述索引對(duì)象的文本的頁。
6.一種圖像形成裝置,包括文本/圖像分離單元,用于接收與具有一頁或多頁的文檔相關(guān)的數(shù)據(jù),并用于確定在所述一頁或多頁中的文本區(qū)域;索引確定單元,用于從所述一頁或多頁的文本區(qū)域中確定一個(gè)或多個(gè)內(nèi)容指示文本;以及索引頁創(chuàng)建單元,用于創(chuàng)建包括所述一個(gè)或多個(gè)內(nèi)容指示文本的文檔的索引頁。
7.權(quán)利要求6的圖像形成裝置,還包括打印單元,用于打印具有一頁或多頁的文檔以及由所述索引頁創(chuàng)建單元?jiǎng)?chuàng)建的索引頁。
8.權(quán)利要求6的圖像形成裝置,其中所述文本/圖像分離單元將具有圖像、圖片或圖表的區(qū)域分離為圖像區(qū)域,并將具有字母、數(shù)字或符號(hào)的區(qū)域分離為文本區(qū)域。
9.權(quán)利要求6的圖像形成裝置,其中所述文本/圖像分離單元對(duì)所述文本區(qū)域進(jìn)行二進(jìn)制化,并分離所述文本區(qū)域中的每一個(gè)符號(hào),并且將分離的符號(hào)提供給索引確定單元。
10.權(quán)利要求9的圖像形成裝置,其中所述文本/圖像分離單元通過檢查每個(gè)像素點(diǎn)和相鄰的像素來分離所述文本區(qū)域中的每個(gè)符號(hào)。
11.權(quán)利要求6的圖像形成裝置,其中所述索引確定單元基于文本尺寸比較來確定一個(gè)或多個(gè)內(nèi)容指示文本。
12.權(quán)利要求6的圖像形成裝置,其中所述索引確定單元基于對(duì)所述文本區(qū)域中的字符的尺寸和預(yù)定尺寸閾值的比較、通過選擇內(nèi)容指示文本的字符來確定內(nèi)容指示文本,并基于相互之間的相對(duì)接近度來將所選擇的字符分組在一起。
13.權(quán)利要求6的圖像形成裝置,其中所述索引確定單元從所述文本/圖像分離單元接收文本區(qū)域的分離的符號(hào),并將所分離的符號(hào)與一個(gè)或多個(gè)預(yù)定尺寸參數(shù)進(jìn)行比較,以確定所述分離的符號(hào)是否是內(nèi)容指示符號(hào)。
14.權(quán)利要求13的圖像形成裝置,其中所述索引確定單元將相鄰的內(nèi)容指示符號(hào)分組在一起,并將分組的內(nèi)容指示符號(hào)確定為索引頁的內(nèi)容指示文本。
15.權(quán)利要求13的圖像形成裝置,其中所述一個(gè)或多個(gè)預(yù)定尺寸參數(shù)包括所分離的符號(hào)的筆劃寬度、所分離的符號(hào)的符號(hào)寬度以及所分離的符號(hào)的符號(hào)高度。
16.權(quán)利要求13的圖像形成裝置,還包括存儲(chǔ)單元,用于存儲(chǔ)由索引確定單元確定的每個(gè)內(nèi)容指示符號(hào),以便索引頁創(chuàng)建單元訪問該存儲(chǔ)單元以創(chuàng)建索引頁。
17.權(quán)利要求6的圖像形成裝置,其中所述索引頁創(chuàng)建單元?jiǎng)?chuàng)建包括內(nèi)容指示文本的索引頁,所述內(nèi)容指示文本與包括該內(nèi)容指示文本的文檔頁的頁指示符相關(guān)聯(lián)。
18.權(quán)利要求6的圖像形成裝置,其中所述索引頁創(chuàng)建單元將所述索引頁添加到所述文檔。
19.權(quán)利要求6的圖像形成裝置,其中所述索引頁創(chuàng)建單元將索引頁中的內(nèi)容指示文本鏈接到與該內(nèi)容指示文本相關(guān)聯(lián)的頁。
20.一種圖像形成裝置,包括索引確定單元,用于在與具有一頁或多頁的文檔相關(guān)的數(shù)據(jù)中區(qū)分特殊內(nèi)容和一般內(nèi)容;以及索引頁創(chuàng)建單元,用于創(chuàng)建包括作為一般內(nèi)容的內(nèi)容指示符的特殊內(nèi)容的索引。
21.權(quán)利要求20的圖像形成裝置,其中所述特殊文本包括標(biāo)題和題目之一。
22.權(quán)利要求20的圖像形成裝置,其中所述索引包括特殊文本和文檔的相應(yīng)頁碼。
23.一種在圖像形成裝置中自動(dòng)創(chuàng)建索引的方法,所述方法包括掃描文檔;將所掃描的文檔分離為文本區(qū)域和圖像區(qū)域,并將文本區(qū)域中的文本分離為符號(hào);提取所分離的符號(hào)的一個(gè)或多個(gè)特性,并將所提取的符號(hào)特性與一個(gè)或多個(gè)索引閾值進(jìn)行比較,以確定包括所述符號(hào)的文本是否是索引對(duì)象;以及創(chuàng)建索引頁,該索引頁包括被確定為索引對(duì)象的文本以及關(guān)于包括對(duì)應(yīng)于該索引對(duì)象的文本的頁的信息。
24.權(quán)利要求23的方法,其中所述所提取的符號(hào)特性包括符號(hào)寬度、符號(hào)高度和筆劃寬度中的一個(gè)或多個(gè)。
25.權(quán)利要求23的方法,其中所述索引閾值包括用于確定索引對(duì)象符號(hào)的參考值,其包括符號(hào)寬度閾值、符號(hào)高度閾值和筆劃寬度閾值中的一個(gè)或多個(gè),并且所述索引閾值被設(shè)置為基于預(yù)先設(shè)置的符號(hào)特性的變化而計(jì)算的預(yù)先設(shè)置的符號(hào)特性的平均值,或者所述索引閾值由用戶來設(shè)置。
26.權(quán)利要求23的方法,其中在所提取的符號(hào)特性大于所述索引閾值時(shí),所述符號(hào)被確定為索引對(duì)象符號(hào),所述索引對(duì)象符號(hào)被分組,并且包括所述索引對(duì)象符號(hào)的組的文本被確定為索引中的對(duì)象。
27.權(quán)利要求23的方法,其中創(chuàng)建索引頁包括將所確定的索引對(duì)象鏈接到包括對(duì)應(yīng)于所述索引對(duì)象的文本的頁。
28.一種在圖像形成裝置中自動(dòng)生成索引頁的方法,所述方法包括接收與具有一頁或多頁的文檔相關(guān)的數(shù)據(jù),并確定在所述一頁或多頁中的文本區(qū)域;從所述一頁或多頁的文本區(qū)域中確定一個(gè)或多個(gè)內(nèi)容指示文本;以及自動(dòng)生成包括所述一個(gè)或多個(gè)內(nèi)容指示文本的文檔的索引頁。
29.權(quán)利要求28的方法,還包括打印所述具有一頁或多頁的文檔以及所生成的索引頁。
30.權(quán)利要求28的方法,其中確定在所述一頁或多頁中的文本區(qū)域包括將具有圖像、圖片或圖表的區(qū)域分離為圖像區(qū)域,并將具有字母、數(shù)字或符號(hào)的區(qū)域分離為文本區(qū)域。
31.權(quán)利要求28的方法,其中確定在所述一頁或多頁中的文本區(qū)域包括對(duì)所述文本區(qū)域進(jìn)行二進(jìn)制化,并分離所述文本區(qū)域中的每一個(gè)符號(hào)。
32.權(quán)利要求31的方法,其中從所述一頁或多頁的文本區(qū)域中確定一個(gè)或多個(gè)內(nèi)容指示文本包括通過檢查每個(gè)像素點(diǎn)以及相鄰的像素來分離文本區(qū)域中的每個(gè)符號(hào)。
33.權(quán)利要求28的方法,其中從所述一頁或多頁的文本區(qū)域中確定一個(gè)或多個(gè)內(nèi)容指示文本包括基于文本尺寸比較來確定一個(gè)或多個(gè)內(nèi)容指示文本。
34.權(quán)利要求28的方法,其中從所述一頁或多頁的文本區(qū)域中確定一個(gè)或多個(gè)內(nèi)容指示文本包括基于對(duì)所述文本區(qū)域中的字符的尺寸與預(yù)定尺寸閾值的比較,通過選擇內(nèi)容指示文本的字符來確定內(nèi)容指示文本;以及基于相互之間的相對(duì)接近度來將所選擇的字符分組在一起。
35.權(quán)利要求28的方法,其中從所述一頁或多頁的文本區(qū)域中確定一個(gè)或多個(gè)內(nèi)容指示文本包括接收文本區(qū)域的分離的符號(hào);以及將所分離的符號(hào)與一個(gè)或多個(gè)預(yù)定尺寸參數(shù)進(jìn)行比較,以確定所述分離的符號(hào)是否是內(nèi)容指示符號(hào)。
36.權(quán)利要求35的方法,其中從所述一頁或多頁的文本區(qū)域中確定一個(gè)或多個(gè)內(nèi)容指示文本還包括將相鄰的內(nèi)容指示符號(hào)分組在一起;以及將分組的內(nèi)容指示符號(hào)確定為索引頁的內(nèi)容指示文本。
37.權(quán)利要求35的方法,其中所述一個(gè)或多個(gè)預(yù)定尺寸參數(shù)包括所分離的符號(hào)的筆劃寬度、所分離的符號(hào)的符號(hào)寬度以及所分離的符號(hào)的符號(hào)高度。
38.權(quán)利要求35的方法,還包括存儲(chǔ)每個(gè)所確定的內(nèi)容指示符號(hào),以便索引頁生成操作訪問所存儲(chǔ)的內(nèi)容指示符號(hào)以自動(dòng)生成索引頁。
39.權(quán)利要求28的方法,其中生成包括一個(gè)或多個(gè)內(nèi)容指示文本的文檔的索引頁包括生成包括內(nèi)容指示文本的索引頁,所述內(nèi)容指示文本與包括該內(nèi)容指示文本的文檔頁的頁指示符相關(guān)聯(lián)。
40.權(quán)利要求28的方法,還包括將所生成的索引頁添加到所述文檔。
41.權(quán)利要求28的方法,還包括將索引頁中的內(nèi)容指示文本鏈接到與該內(nèi)容指示文本相關(guān)聯(lián)的頁。
42.一種在圖像形成裝置中自動(dòng)創(chuàng)建索引頁的方法,所述方法包括在與具有一頁或多頁的文檔相關(guān)的數(shù)據(jù)中區(qū)分特殊內(nèi)容和一般內(nèi)容;以及自動(dòng)生成索引頁,該索引頁包括作為一般內(nèi)容的內(nèi)容指示符的特殊內(nèi)容。
43.權(quán)利要求42的方法,還包括將所述索引頁插入到所述文檔;以及展示包括所述索引的文檔。
44.權(quán)利要求43的方法,其中展示所述文檔包括以下一個(gè)或多個(gè)步驟在顯示單元上顯示該文檔;以及使用圖像形成單元打印該文檔。
45.一種計(jì)算機(jī)可讀介質(zhì),含有用于執(zhí)行在圖像形成裝置中自動(dòng)創(chuàng)建索引的方法的可執(zhí)行代碼,所述介質(zhì)包括用于掃描文檔的可執(zhí)行代碼;用于將所掃描的文檔分離為文本區(qū)域和圖像區(qū)域、并將文本區(qū)域中的文本分離為符號(hào)的可執(zhí)行代碼;用于提取所分離的符號(hào)的一個(gè)或多個(gè)特性、并將所提取的符號(hào)特性與一個(gè)或多個(gè)索引閾值進(jìn)行比較以確定包括所述符號(hào)的文本是否是索引對(duì)象的可執(zhí)行代碼;以及用于創(chuàng)建索引頁的可執(zhí)行代碼,該索引頁包括被確定為索引對(duì)象的文本和關(guān)于包括對(duì)應(yīng)于該索引對(duì)象的文本的頁的信息。
全文摘要
一種能夠自動(dòng)創(chuàng)建索引的圖像形成裝置及其方法。該圖像形成裝置包括掃描單元,用于掃描文檔;文本/圖像分離單元,用于將所掃描的文檔分離為文本區(qū)域和圖像區(qū)域,并用于將文本區(qū)域中的文本分離為符號(hào);索引確定單元,用于提取所分離的符號(hào)的一個(gè)或多個(gè)特性,并用于將所提取的符號(hào)特性與一個(gè)或多個(gè)索引閾值進(jìn)行比較,由此確定包括該符號(hào)的文本是否是索引對(duì)象;以及索引頁創(chuàng)建單元,用于創(chuàng)建索引頁,該索引頁包括被確定為索引對(duì)象的文本以及關(guān)于包括對(duì)應(yīng)于該索引對(duì)象的文本的頁的信息。因此,由于索引頁被自動(dòng)地創(chuàng)建,文檔每一頁的主要內(nèi)容可以被容易地選擇和/或展示。而且,通過鏈接索引頁與文檔頁中的原始內(nèi)容,給搜索文檔中的期望的內(nèi)容帶來了便利,從而提高了用戶的便利性。
文檔編號(hào)G06K9/20GK1967567SQ200610149429
公開日2007年5月23日 申請(qǐng)日期2006年11月20日 優(yōu)先權(quán)日2005年11月18日
發(fā)明者玉炯洙 申請(qǐng)人:三星電子株式會(huì)社