亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

著重號列表的制作方法

文檔序號:11590992閱讀:193來源:國知局



背景技術(shù):

著重號列表是表示數(shù)據(jù)集合的非常普遍的方式。例如,在組織或者計(jì)劃會議期間在白板上列出行項(xiàng)目(line-item)是十分常見的。如果需要電子形式的這樣的信息用于歸檔或者稍后發(fā)布(例如,經(jīng)由電子郵件),則能夠根據(jù)所述白板的圖像(例如,照片)創(chuàng)建電子文檔是有用的。

字符識別技術(shù)相當(dāng)普遍地用于將這樣的信息轉(zhuǎn)換為電子形式。然而,簡單地識別字符沒有保持著重號列表的實(shí)際結(jié)構(gòu)。如果用戶日后希望修改內(nèi)容(例如,添加附加的行項(xiàng)目、去除現(xiàn)存的行項(xiàng)目等),則首先手動地將數(shù)據(jù)格式化為列表將是必須的。這會因這樣的事實(shí)使其變得復(fù)雜:文本可能呈自由形式,而且行項(xiàng)目之間的間隔可能缺失。最后,如果字符識別不可靠(特別是手寫文本產(chǎn)生的問題),則文本的圖像可散布在電子文本中,或者可跳過文本的某些部分。無論如何,用戶仍希望捕獲著重號列表,并且將它們轉(zhuǎn)換為電子格式。



技術(shù)實(shí)現(xiàn)要素:

一般而言,在一個方面,本發(fā)明涉及一種用于圖像處理的方法。所述方法包含:獲得包含著重號列表的原始圖像;確定包圍該著重號列表的列表界定框;確定在包圍著重號列表的多個行的列表界定框中嵌套的多個行界定框;基于所述多個行界定框標(biāo)識多個著重號;基于所述多個著重號標(biāo)識多個縮格;以及基于所述多個縮格,生成原始圖像中著重號列表的著重號列表對象。

一般而言,在一個方面,本發(fā)明涉及計(jì)算機(jī)程序和包含存儲在其中的計(jì)算機(jī)程序的非瞬時計(jì)算機(jī)可讀介質(zhì)(crm)。將計(jì)算機(jī)程序配置為促使計(jì)算機(jī)獲得包含著重號列表的原始圖像;確定包圍該著重號列表的列表界定框;確定在包圍著重號列表的多個行的列表界定框中嵌套的多個行界定框;基于所述多個行界定框標(biāo)識多個著重號;基于所述多個著重號標(biāo)識多個縮格;以及基于所述多個縮格,生成原始圖像中著重號列表的著重號列表對象。

一般而言,在一個方面,本發(fā)明涉及用于圖像處理的系統(tǒng)。所述系統(tǒng)包含:界定框生成器,用于:確定包圍著重號列表的列表界定框;并且確定在包圍著重號列表的多個行的列表界定框中嵌套的多個行界定框;著重號定位器,用于基于所述多個行界定框標(biāo)識多個著重號;列表層次結(jié)構(gòu)引擎,用于基于所述多個著重號,標(biāo)識多個縮格;以及列表對象生成器,用于基于所述多個縮格,生成原始圖像中著重號列表的著重號列表對象。

通過以下描述以及所附權(quán)利要求,本發(fā)明的其它方面將會變得明顯。

附圖說明

圖1示出了根據(jù)本發(fā)明一個或多個實(shí)施例的系統(tǒng)。

圖2~6示出了根據(jù)本發(fā)明一個或多個實(shí)施例的流程圖。

圖7a~7d示出了根據(jù)本發(fā)明一個或多個實(shí)施例的實(shí)現(xiàn)示例。

圖8示出了根據(jù)本發(fā)明一個或多個實(shí)施例的計(jì)算機(jī)系統(tǒng)。

具體實(shí)施方式

現(xiàn)在將參照附圖詳細(xì)描述本發(fā)明的具體實(shí)施例。為了保持一致,以相同的附圖標(biāo)記表示各圖中相同的元件。

在本發(fā)明的實(shí)施例的以下的詳細(xì)描述中,為了提供對本發(fā)明的更全面的了解,闡述了諸多具體的細(xì)節(jié)。然而,本領(lǐng)域技術(shù)人員將清楚的是,可以在無需這些具體細(xì)節(jié)的情況下實(shí)踐本發(fā)明。在其它實(shí)例中,還沒有詳細(xì)描述公知特征,以避免使得描述不必要的復(fù)雜。

一般而言,本發(fā)明的實(shí)施例提供了一種方法、一種計(jì)算機(jī)程序和一種其中包含所存儲的計(jì)算機(jī)程序的非瞬時計(jì)算機(jī)可讀介質(zhì)(crm)、以及一種用于圖像處理的系統(tǒng)。獲得包括著重號列表的原始圖像,并且使用膨脹和腐蝕(de)操作確定包圍著重號列表的列表界定框。也確定在列表界定框中嵌套的多個行界定框。在每一行界定框中,可以使用膨脹迭代多于腐蝕迭代的de操作,來標(biāo)識開始行內(nèi)界定框和一個或多個中間行內(nèi)界定框。可以基于開始行內(nèi)界定框的維度,在行界定框中標(biāo)識著重號。另外,基于所標(biāo)識的著重號的水平位置,來標(biāo)識著重號列表的縮格,并由此標(biāo)識著重號列表的層次結(jié)構(gòu)。最后,可以生成代表著重號列表的著重號列表對象,用于包含在電子文檔(ed)中??梢允褂镁哂卸x著重號列表的層次結(jié)構(gòu)(例如,縮格)以及著重號列表的內(nèi)容(例如,文本字符)的屬性的標(biāo)記符(tag),來指定著重號列表對象。

圖1示出了根據(jù)本發(fā)明一個或多個實(shí)施例的系統(tǒng)(100)。如圖1中所示,系統(tǒng)(100)具有多個部件,包括緩沖器(104)、界定框生成器(114)、列表層次結(jié)構(gòu)引擎(110)、列表對象生成器(108)、以及著重號定位器(116)??梢詫⑦@些部件(104、108、110、114、116)中的每一個定位在同一計(jì)算設(shè)備(例如,個人計(jì)算機(jī)(pc)、膝上計(jì)算機(jī)、平板pc、智能電話、服務(wù)器、大型機(jī)、電纜箱、信息站等)上,或者可以將它們定位在通過任何尺寸和具有有線與/或無線片段的拓?fù)涞木W(wǎng)絡(luò)所連接的不同的計(jì)算設(shè)備上。

在本發(fā)明的一個或多個實(shí)施例中,系統(tǒng)(100)包括緩沖器(104)。可以按硬件(即,電路)、軟件、或者它們的任何組合實(shí)現(xiàn)緩沖器(104)。緩沖器(104)存儲具有一個或多個著重號列表的原始圖像(106)。著重號列表可以是手工繪制的或者機(jī)器打印的。原始圖像(106)可以是硬拷貝文檔的掃描。原始圖像(106)可以是硬拷貝文檔或者白板的數(shù)字照片。另外或者作為選擇,可以從任何源(例如網(wǎng)站)下載原始圖像(106)。而且,原始圖像(106)可以是任何尺寸和任何格式(例如,jpeg、gif、bmp等)。

受益于這一詳細(xì)的描述的本領(lǐng)域技術(shù)人員將會意識到,著重號列表是這樣一種列表,其使用著重號(即,符號或者諸如星號、連字號、數(shù)字、句號、填充的圓圈等的圖示符(glyph))引入列表的項(xiàng)目。列表中的每一項(xiàng)目可以占據(jù)一個或多個行。著重號列表可以具有這樣層次結(jié)構(gòu),著重號列表的不同級別使用位于不同縮格處的不同類型的著重號。

在本發(fā)明的一個或多個實(shí)施例中,系統(tǒng)(100)包括界定框生成器(114)??梢园从布?即,電路)、軟件、或者它們的任何組合實(shí)現(xiàn)界定框生成器(114)。將界定框生成器(114)配置為確定用于原始圖像(106)中的每一著重號列表的列表界定框。列表界定框是包圍著重號列表的矩形周界。因此,列表界定框具有位置(例如,坐標(biāo))和維度。為了確定列表界定框,界定框生成器(114)可以利用梯度、de操作、以及輪廓線閾值(下面討論)。

在本發(fā)明的一個或多個實(shí)施例中,將界定框生成器(114)配置為確定用于著重號列表的每一行的行界定框。行界定框是包圍著重號列表的行的矩形周界。因此,每一行界定框具有位置(例如,坐標(biāo))和維度。由于著重號列表中存在多個行,所以可以將多個行界定框嵌套在單一的列表界定框中。為了確定行界定框,界定框生成器(114)可以利用梯度、de操作、以及輪廓線閾值(下面討論)。

在本發(fā)明的一個或多個實(shí)施例中,系統(tǒng)(100)包括著重號定位器(116)。可以按硬件(即,電路)、軟件、或者它們的任何組合實(shí)現(xiàn)著重號定位器(116)。將著重號定位器(116)配置為標(biāo)識著重號列表的一行中的著重號。具體地講,著重號定位器(116)可以首先標(biāo)識用于每一行界定框的開始行內(nèi)界定框和一個或多個中間行內(nèi)界定框。標(biāo)識行內(nèi)界定框可以包括使用模糊(blur)功能和de操作(下面討論)。然后,著重號定位器(116)可以基于開始行內(nèi)界定框的維度與/或開始行內(nèi)界定框和相鄰中間界定框(以下也將對其加以討論)之間的間隔,來標(biāo)識著重號。如上面討論的,著重號列表的單一項(xiàng)目可占用多個行。因此,某些行可以不具有著重號。

在本發(fā)明的一個或多個實(shí)施例中,系統(tǒng)(100)包括列表層次結(jié)構(gòu)引擎(110)。可以按硬件(即,電路)、軟件、或者它們的任何組合實(shí)現(xiàn)列表層次結(jié)構(gòu)引擎(110)。將列表層次結(jié)構(gòu)引擎(110)配置為標(biāo)識著重號列表中的著重號的縮格,并由此標(biāo)識著重號列表的層次結(jié)構(gòu)/等級。如以上所討論的,著重號列表可以具有這樣層次結(jié)構(gòu),著重號列表的不同的等級使用位于不同縮格處的不同類型的著重號。列表層次結(jié)構(gòu)引擎(110)可以使用開始行內(nèi)界定框的水平位置來標(biāo)識著重號的縮格。在一個或多個實(shí)施例中,間隔引擎(110)可以將彼此的預(yù)定距離內(nèi)的多個水平位置合并(即,歸并、組合、折疊等)為單一的縮格(以下將對其加以討論)。

在本發(fā)明的一個或多個實(shí)施例中,系統(tǒng)(100)包括列表對象生成器(110)??梢园从布?即,電路)、軟件、或者它們的任何組合實(shí)現(xiàn)列表對象生成器(110)。將列表對象生成器(108)配置為生成代表著重號列表的著重號列表對象??梢陨芍靥柫斜韺ο?,以將其包含在使用標(biāo)記語言(例如,officeopenxml)所指定的電子文檔(ed)中。因此,可以使用具有基于文本字符、著重號、縮格、層次結(jié)構(gòu)等所設(shè)置的屬性的標(biāo)記符,定義著重號列表對象,其中,所述文本字符、著重號、縮格、層次結(jié)構(gòu)等是根據(jù)原始圖像(106)中的著重號列表加以標(biāo)識的。著重號列表對象保持著重號列表的結(jié)構(gòu),并且還使得著重號列表可以由接下來的用戶加以編輯(例如,添加/去除項(xiàng)目、行、等級等)。

盡管圖1將系統(tǒng)(100)示出為具有5個部件(104、108、110、114、116),然而,在其它實(shí)施例中,系統(tǒng)(100)可以具有更多或者更少的部件。例如,系統(tǒng)(100)可以包括掃描儀或者具有數(shù)字相機(jī)的智能電話,以捕獲原始圖像(106)。又例如,系統(tǒng)(100)可以包括對原始圖像(106)執(zhí)行附加處理(例如,ocr)的附加引擎,以提取著重號列表的行中的內(nèi)容(例如,文本字符)。

圖2示出了根據(jù)本發(fā)明一個或多個實(shí)施例的流程圖。所述流程圖描繪了用于圖像處理的過程??梢杂梢陨蠀⒄請D1所討論的系統(tǒng)(100)的部件(108、110、114、116)執(zhí)行圖2的一個或多個步驟。在本發(fā)明的一個或多個實(shí)施例中,圖2中所示的一個或多個步驟可以省略、重復(fù)和/或按與圖2中所示次序不同的次序執(zhí)行。因此,不應(yīng)將本發(fā)明的范圍視為限于圖2中所示步驟的特定安排。

最初,獲得原始圖像(步驟205)??梢詮臄?shù)字相機(jī)或者從掃描儀獲得原始圖像??梢詮姆?wù)器下載原始圖像。原始圖像可以包括一個或多個著重號列表。每以著重號列表可以是手工繪制的或者機(jī)器打印的。如以上所討論的,著重號列表是這樣的一種列表,其使用著重號(即,符號或者圖示符)來引入列表的項(xiàng)目。著重號列表可以具有這樣層次結(jié)構(gòu),即著重號列表的不同等級具有位于不同縮格處的不同類型的著重號。

在步驟210中,為原始圖像中的每一著重號列表確定列表界定框。每一列表界定框?yàn)榘鼑靥柫斜淼木匦沃芙?。因此,每一列表界定框具有位?例如,坐標(biāo))和維度。以下參照圖3討論用于確定列表界定框的過程。

在步驟215中,為著重號中的每行確定行界定框。每一列表界定框?yàn)榘鼑靥柫斜碇械男械木匦沃芙?。取決于所述行是否包括著重號,行界定框可以包括著重號。可以將多個行界定框嵌套在單一的列表界定框中。每一行界定框具有位置(例如,坐標(biāo))和維度。以下針對圖4討論用于確定行界定框的過程。

在步驟220中,基于行界定框標(biāo)識多個著重號。使用每一著重號(即,符號或者圖示符)來引入列表的項(xiàng)目。標(biāo)識著重號可以包括首先針對每一行界定框標(biāo)識開始行內(nèi)界定框和一個或多個中間行內(nèi)界定框。然后,可基于開始行內(nèi)界定框的維度和/或開始行內(nèi)界定框和相鄰中間行內(nèi)界定框之間的間隔,來標(biāo)識著重號。以下參照圖5討論用于標(biāo)識著重號的過程。

在步驟225中,標(biāo)識列表的縮格。如以上所討論的,著重號列表可以具有這樣的層次結(jié)構(gòu),即著重號列表的不同等級具有位于不同縮格處的不同類型的著重號??梢允褂瞄_始行內(nèi)界定框的水平位置來標(biāo)識著重號的縮格,并從而標(biāo)識著重號列表的等級。在一個或多個實(shí)施例中,可以將接近的多個水平位置(即,彼此的預(yù)定距離內(nèi))歸并成單一的縮格。以下參照圖6討論用于標(biāo)識縮格、并從而標(biāo)識著重號列表的等級的過程。

在步驟230中,生成著重號列表對象。著重號列表對象代表原始圖像中的著重號列表??梢詫⒅靥柫斜韺ο蟀ㄔ趀d中,用于分布、容易的編輯(例如,添加或者去除項(xiàng)目、添加或者去除層次結(jié)構(gòu)等級等)、以及渲染(即,打印、顯示等)??梢允褂镁哂谢谛薪缍虻闹靥枴⒖s格、層次結(jié)構(gòu)、以及內(nèi)容(即,文本字符)所設(shè)置的屬性的標(biāo)記符,來指定著重號列表對象。著重號列表對象保持著重號列表的結(jié)構(gòu)(例如,層次結(jié)構(gòu))。

在一個或多個實(shí)施例中,生成著重號列表對象可以包括對行界定框所包圍的原始圖像的區(qū)域執(zhí)行光學(xué)字符識別(ocr)或者附加的圖像處理,一遍提取著重號列表的內(nèi)容(即,文本字符)。在一個或多個實(shí)施例中,在難以提取著重號列表的一行中的文本字符的情況下,可以只將一行的內(nèi)容的圖像(“行圖像”)包括在著重號列表對象中。當(dāng)渲染著重號列表對象時,可以顯示或者打印這一行圖像。而且,行圖像可以被定位以維持著重號列表的結(jié)構(gòu)。

圖3示出了根據(jù)本發(fā)明一個或多個實(shí)施例的流程圖。該流程圖描繪了用于確定原始圖像中一個或多個列表界定框的過程??梢杂梢陨蠀⒄請D1所討論的界定框生成器(114)執(zhí)行圖3中的一個或多個步驟。另外,圖3中的一個或多個步驟可以對應(yīng)于圖2中的步驟210。在本發(fā)明的一個或多個實(shí)施例中,圖3中所示的一個或多個步驟可以省略、重復(fù)和/或按與圖3中所示次序不同的次序執(zhí)行。因此,不應(yīng)將本發(fā)明的范圍視為限于圖3中所示步驟的特定安排。

最初,基于原始圖像生成二進(jìn)制圖像(步驟205)。這一步驟可以包括將原始圖像轉(zhuǎn)換為灰度級圖像。另外,這一步驟可以包括通過向灰度級圖像應(yīng)用蘇貝爾(sobel)算子生成梯度圖像。受益于這一詳細(xì)描述的本領(lǐng)域技術(shù)人員將會意識到,通過向灰度級圖像應(yīng)用蘇貝爾算子,可以確定灰度級圖像的水平和垂直梯度。另外,這一步驟也可以包括向梯度圖像應(yīng)用取閾值操作,以生成二進(jìn)制圖像。

在步驟310中,通過向二進(jìn)制圖像應(yīng)用膨脹和腐蝕(de)操作,來生成變換的圖像,以包圍圖像中相近組分(例如,文本字符)之間的區(qū)域。受益于這一詳細(xì)的描述,本領(lǐng)域技術(shù)人員將會意識到,de操作是形態(tài)(morphological)操作的示例。de操作將用戶指定的構(gòu)造元件應(yīng)用于二進(jìn)制圖像,這創(chuàng)建了同樣大小的變換的圖像。變換的圖像中的每像素的值基于二進(jìn)制圖像中的對應(yīng)像素與其相鄰像素的比較。

受益于這一詳細(xì)的描述,本領(lǐng)域技術(shù)人員還將會意識到,膨脹向二進(jìn)制圖像中的對象的邊界添加了像素,而腐蝕去除了對象邊界上的像素。添加于二進(jìn)制圖像中的對象的像素的數(shù)目或者從二進(jìn)制圖像中的對象去除的像素的數(shù)目取決于用于處理二進(jìn)制圖像的構(gòu)造元件的大小和形狀、膨脹迭代的數(shù)目、以及腐蝕迭代的數(shù)目。

在步驟315中,標(biāo)識變換的圖像中的輪廓線??梢允褂酶鞣N技術(shù)來標(biāo)識變換的圖像的輪廓線,包括例如,差分輪廓線檢測器、相位迭合輪廓線檢測器、突起輪廓線檢測器等。

在步驟320中,標(biāo)識具有超出輪廓線閾值的輪廓線基數(shù)的變換的圖像中的至少一個區(qū)域。例如,輪廓線閾值可以是1000條輪廓線。而且,所述區(qū)域可以呈矩形形狀。所述區(qū)域的周界對應(yīng)于列表界定框。

受益于這一詳細(xì)的描述,本領(lǐng)域技術(shù)人員將會意識到,遵循圖3中的過程的執(zhí)行,確定一個或多個列表界定框。每一列表界定框包圍原始圖像中的著重號列表。

圖4示出了根據(jù)本發(fā)明一個或多個實(shí)施例的流程圖。該流程圖描繪了用于確定一個或多個行界定框的過程??梢杂梢陨蠀⒄請D1所討論的界定框生成器(114)執(zhí)行圖4中的一個或多個步驟。另外,圖4中的一個或多個步驟可以對應(yīng)于圖2中的步驟215。在本發(fā)明的一個或多個實(shí)施例中,圖4中所示的一個或多個步驟可以省略、重復(fù)和/或按與圖4中所示次序不同的次序執(zhí)行。因此,不應(yīng)將本發(fā)明的范圍視為限于圖4中所示步驟的特定安排。

最初,通過向二進(jìn)制圖像應(yīng)用de操作,而生成變換的圖像(步驟405)。基于原始圖像生成二進(jìn)制圖像。所述二進(jìn)制圖像可以與步驟305中的二進(jìn)制圖像相同。作為選擇,也可以使用不同的梯度算子與/或不同的取閾值操作,來生成步驟405中的二進(jìn)制圖像。另外,步驟405中的de操作可以類似于步驟310中的de操作,除了使用了較小的構(gòu)造元件之外??梢詫⒉襟E405中的de操作應(yīng)用于整個二進(jìn)制圖像。另外或者作為選擇,可以僅將de操作應(yīng)用于所確定的列表界定框所包圍的二進(jìn)制圖像的部分。與以上描述相同,de操作包圍二進(jìn)制圖像中相近組分(文本字符)之間的區(qū)域。

在步驟410中,標(biāo)識變換的圖像中的輪廓線。具體地講,標(biāo)識所確定的列表界定框所包圍的變換的圖像的部分中的輪廓線。所述輪廓線檢測技術(shù)可以與步驟315中所使用的輪廓線檢測技術(shù)相同或不同。

在步驟415中,在列表界定框所包圍的每一區(qū)域中標(biāo)識至少一個區(qū)(area)。具體地講,所述區(qū)可以呈矩形形狀,并且包括超出輪廓線閾值的輪廓線的基數(shù)。輪廓線閾值可以是100條輪廓線。而且,所述區(qū)的周界對應(yīng)于行界定框。

受益于這一詳細(xì)的描述,本領(lǐng)域技術(shù)人員將會意識到,遵循圖4中的過程的執(zhí)行,已經(jīng)確定了與每一列表界定框嵌套的多個行界定框。而且,每一行界定框?qū)?yīng)于原始圖像中著重號列表的一行。

圖5示出了根據(jù)本發(fā)明一個或多個實(shí)施例的流程圖。該流程圖描繪了用于標(biāo)識著重號列表中的著重號的過程。可以由以上參照圖1所討論的著重號定位器(116)執(zhí)行圖5中的一個或多個步驟。另外,圖5中的一個或多個步驟可以對應(yīng)于圖2中的步驟220。在本發(fā)明的一個或多個實(shí)施例中,圖5中所示的一個或多個步驟可以省略、重復(fù)和/或按與圖5中所示次序不同的次序執(zhí)行。因此,不應(yīng)將本發(fā)明的范圍視為限于圖5中所示步驟的特定安排。

最初,根據(jù)原始圖像生成二進(jìn)制圖像(步驟505)??梢酝ㄟ^首先將原始圖像轉(zhuǎn)換為灰度級圖像,來生成二進(jìn)制圖像。然后,可以將模糊操作應(yīng)用于灰度級圖像,接下來應(yīng)用取閾值操作,以生成二進(jìn)制圖像??梢詫⒛:僮鲬?yīng)用于整個灰度級圖像。另外或者作為選擇,也可以僅將模糊操作應(yīng)用于行界定框所包圍的灰度級圖像的部分。

在步驟510中,通過將de操作應(yīng)用于二進(jìn)制圖像,來生成變換的圖像。步驟510中的de操作可以類似于步驟405中的de操作。然而,步驟510中的de操作具有多于腐蝕迭代的膨脹迭代。例如,可存在兩倍于腐蝕迭代的膨脹迭代。這一de操作可以有效地將字符歸并于單一的字中。

在步驟515中,選擇先前所確定的行界定框之一??梢噪S機(jī)地選擇行界定框。另外或者作為選擇,所選擇的行界定框可以對應(yīng)于針對所述圖像所確定的第一行界定框或者最后行界定框。

在步驟520中,為所選擇的行界定框標(biāo)識開始行內(nèi)界定框和一個或多個中間行內(nèi)界定框。開始和中間行內(nèi)界定框兩者對應(yīng)于具有超出輪廓線閾值的輪廓線的基數(shù)的所選擇的行界定框中的區(qū)。如果基于水平位置對所述區(qū)進(jìn)行分類,則分類之后的第一區(qū)是開始行內(nèi)界定框。其余區(qū)為中間行內(nèi)界定框。如果著重號存在,則開始行內(nèi)界定框可以包含針對所選擇的行界定框的著重號。作為選擇,開始行內(nèi)界定框可以包含所選擇的行界定框中的第一字。

在步驟525中,基于涉及開始行內(nèi)界定框的維度的比較,將開始行內(nèi)界定框中的內(nèi)容指定為著重號。例如,如果開始行內(nèi)界定框的高度小于所選擇的行界定框的高度的一半,則開始行內(nèi)界定框中的內(nèi)容被視為著重號。又例如,如果開始行內(nèi)界定框和相鄰中間界定框之間的水平間隔至少為開始行內(nèi)界定框的寬度的兩倍,則開始行內(nèi)界定框的內(nèi)容被視為著重號。如以上所討論的,某些行可以不具有著重號。在這樣的情況下,開始行內(nèi)界定框包圍所選擇的行界定框中的第一字(即,純文本)。

在步驟530中,確定是否存在尚未被選擇的附加行界定框。當(dāng)存在這樣的行界定框時,所述過程返回至步驟515。作為選擇,所述過程可以結(jié)束。

受益于這一詳細(xì)的描述,本領(lǐng)域技術(shù)人員將會意識到,遵循圖5中的過程的執(zhí)行,已經(jīng)標(biāo)識了包含著重號的開始行內(nèi)界定框。而且,這些開始行內(nèi)界定框中的每一開始行內(nèi)界定框具有位置(即,坐標(biāo))。并且,在不執(zhí)行文本字符識別(例如,ocr)的情況下或者在執(zhí)行文本字符識別之前,已經(jīng)標(biāo)識了著重號。

圖6示出了根據(jù)本發(fā)明一個或多個實(shí)施例的流程圖。該流程圖描繪了用于標(biāo)識著重號列表中的縮格、并從而標(biāo)識著重號列表的等級的過程??梢杂梢陨蠀⒄請D1所討論的列表層次結(jié)構(gòu)引擎(110)來執(zhí)行圖6中的一個或多個步驟。另外,圖6中的一個或多個步驟可以對應(yīng)于圖2中的步驟225。在本發(fā)明的一個或多個實(shí)施例中,圖6中所示的一個或多個步驟可以省略、重復(fù)和/或按與圖6中所示次序不同的次序執(zhí)行。因此,不應(yīng)將本發(fā)明的范圍視為限于圖6中所示步驟的特定安排。

最初,獲得被視為包含著重號的每一開始行內(nèi)界定框(步驟605)。如以上所討論的,可以存在針對著重號列表中的每一行界定框的開始行內(nèi)界定框。某些開始行內(nèi)界定框的內(nèi)容可以是著重號。也如以上所討論的,每一開始行內(nèi)界定框具有位置(即,坐標(biāo))。每一著重號的水平位置(即,包含著重號的開始行內(nèi)界定框的水平位置)可以對應(yīng)于著重號列表的縮格。

在步驟610中,確定具有類似水平位置的開始行內(nèi)界定框的子集。如以上所討論的,著重號列表可以具有這樣的層次結(jié)構(gòu),即著重號列表的不同等級使用位于不同縮格處的不同類型的著重號。理論上講,如果兩個著重號具有不同的水平位置,則每一著重號對應(yīng)于著重號列表的不同等級。然而,由于可以手工繪制著重號列表,所以在實(shí)際上屬于同一等級的著重號之間可能存在微小的水平偏移。在一個或多個實(shí)施例中,類似的水平位置意味著兩個著重號處于彼此的預(yù)定距離內(nèi)。在一個或多個實(shí)施例中,預(yù)定距離為與列表界定框嵌套的行界定框的平均高度的一半。

在步驟615中,合并類似的水平位置。換句話說,將緊密間隔的縮格歸并/折疊成單一的縮格值。例如,所述單一的縮格值可以是類似的水平位置的平均值。又例如,單一的縮格值可以是類似的水平位置的最小值或者最大值。使用縮格的存在和縮格值,來確定著重號列表的結(jié)構(gòu),并由此可以使用它們生成著重號列表對象。

圖7a~7d示出了根據(jù)本發(fā)明一個或多個實(shí)施例的實(shí)現(xiàn)示例。如圖7a中所示,存在原始圖像(702)。原始圖像(702)具有手工繪制的著重號列表。使用著重號引入每一項(xiàng)目或者子項(xiàng)目。同樣如圖7a中所示,著重號列表具有這樣的層次結(jié)構(gòu),即著重號列表的不同等級使用位于不同縮格處的不同類型的著重號。

圖7b示出了針對著重號列表所確定的列表界定框(704)??梢允褂媒缍蛏善?114)和圖3中所示的過程,來確定列表界定框(704)。如圖7b中所示,列表界定框(704)包圍著重號列表。

圖7c示出了多個行界定框(706)??梢允褂媒缍蛏善?114)和圖4中所示的過程,來確定行界定框(704)。將所有行界定框(706)與列表界定框(704)嵌套。如圖7c中所示,某些行界定框包括著重號。然而,某些行界定框不具有著重號。

圖7d示出了所選擇的行界定框(708)。在所選擇的行界定框(708)中,已經(jīng)標(biāo)識了開始行內(nèi)界定框(710)和多個中間行內(nèi)界定框(712)??梢允褂弥靥柖ㄎ黄?116)和圖5中所示的過程,來標(biāo)識行內(nèi)界定框(710,712)。開始行內(nèi)界定框(710)包括著重號。中間行內(nèi)界定框(712,714)包含文本字符。

本發(fā)明的一個或多個實(shí)施例可具有以下優(yōu)點(diǎn):標(biāo)識原始圖像中的著重號列表的能力;標(biāo)識著重號列表中的行的能力;標(biāo)識著重號列表中的著重號和縮格(即,等級)的能力;在不首先執(zhí)行文本字符識別(例如,ocr)的情況下標(biāo)識著重號和縮格的能力;處理手工繪制的著重號列表、和不管是否具有水平偏移、合并實(shí)際上屬于同一等級的著重號的能力;生成能包括在ed中用于分布的著重號列表對象的能力;生成保持著重號列表的結(jié)構(gòu)并且能夠容易地加以修改的著重號列表對象的能力等。

實(shí)際上,可以在任何類型的計(jì)算系統(tǒng)上實(shí)現(xiàn)本發(fā)明的實(shí)施例,而不管所使用的平臺。例如,所述計(jì)算系統(tǒng)可以為一個或多個移動設(shè)備(例如,膝上計(jì)算機(jī)、智能電話、個人數(shù)字助理、平板計(jì)算機(jī)、或者其它移動設(shè)備)、桌面計(jì)算機(jī)、服務(wù)器、服務(wù)器機(jī)架中的刀片式服務(wù)器(blades)、或者至少包括執(zhí)行本發(fā)明的一個或多個實(shí)施例的最小處理功率、存儲器、以及(多個)輸入和輸出設(shè)備的任何其它類型的(多個)計(jì)算設(shè)備。例如,如圖8中所示,計(jì)算系統(tǒng)(800)可以包括一個或多個計(jì)算機(jī)處理器(802)、相關(guān)聯(lián)的存儲器(804)(例如,隨機(jī)存取存儲器(ram)、高速緩沖存儲器、閃存等)、一個或多個儲存器設(shè)備(806)(例如,硬盤、諸如致密盤(cd)驅(qū)動器或者數(shù)字通用盤(dvd)驅(qū)動器的光驅(qū)動器、閃存棒等)、以及諸多其它部件與功能。(多個)計(jì)算機(jī)處理器(802)可以是用于處理指令的集成電路。例如,(多個)計(jì)算機(jī)處理器可以為處理器的一個或多個內(nèi)核、或者微內(nèi)核。計(jì)算系統(tǒng)(800)也可以包括一個或多個輸入設(shè)備(810),例如,觸摸屏、鍵盤、鼠標(biāo)、麥克風(fēng)、觸摸板、電子筆、或者任何其它類型的輸入設(shè)備。另外,計(jì)算系統(tǒng)(800)還可以包括一個或多個輸出設(shè)備(808),例如,屏幕(例如,液晶顯示器(lcd)、等離子顯示器、觸摸屏、陰極射線管(crt)監(jiān)視器、投影儀、或者其它顯示設(shè)備)、打印機(jī)、外部儲存器、或者任何其它類型的輸出設(shè)備。一個或多個輸出設(shè)備可以與(多個)輸入設(shè)備相同或不同??梢越?jīng)由網(wǎng)絡(luò)連接接口連接(未加以描述)將計(jì)算系統(tǒng)(800)連接于網(wǎng)絡(luò)(812)(例如,局域網(wǎng)(lan)、諸如因特網(wǎng)的廣域網(wǎng)(wan)、移動網(wǎng)絡(luò)、或者其它任何類型的網(wǎng)絡(luò))。可以本地地或者遠(yuǎn)程地將(多個)輸入和輸出設(shè)備連接于(多個)計(jì)算機(jī)處理器(802)、存儲器(804)、以及(多個)儲存設(shè)備(806)。存在許多不同類型的計(jì)算系統(tǒng),而且以上所提到的(多個)輸入和輸出設(shè)備也可以采取其它形式。

可以將采取計(jì)算機(jī)程序的形式、促使計(jì)算機(jī)執(zhí)行本發(fā)明的實(shí)施例的軟件指令整體或者部分地、臨時或者永久地存儲在非瞬時計(jì)算機(jī)可讀介質(zhì)上,例如,cd、dvd、儲存設(shè)備、軟盤、帶、閃存、物理存儲器、或者任何其它計(jì)算機(jī)可讀儲存介質(zhì)。具體地講,軟件指令可以對應(yīng)于計(jì)算機(jī)程序,當(dāng)處理器執(zhí)行該程序時,將其配置為能夠執(zhí)行本發(fā)明的實(shí)施例。

另外,可以將前述計(jì)算系統(tǒng)(800)的一個或多個元件定位在遠(yuǎn)程位置,并且將其連接于網(wǎng)絡(luò)(812)上的其它部件。而且,也可以在具有多個節(jié)點(diǎn)的分布系統(tǒng)上實(shí)現(xiàn)本發(fā)明的一個或多個實(shí)施例,其中,可以將本發(fā)明的每部分定位在分布系統(tǒng)中的不同的節(jié)點(diǎn)上。在本發(fā)明的一個實(shí)施例中,節(jié)點(diǎn)對應(yīng)于不同的計(jì)算設(shè)備。作為選擇,節(jié)點(diǎn)可以對應(yīng)于具有相關(guān)聯(lián)的物理存儲器的計(jì)算機(jī)處理器。作為選擇,節(jié)點(diǎn)可以對應(yīng)于具有共享存儲器和/或資源的計(jì)算機(jī)處理器或者計(jì)算機(jī)處理器的微內(nèi)核。

盡管已經(jīng)針對有限數(shù)目的實(shí)施例描述了本發(fā)明,但是受益于本公開的本領(lǐng)域技術(shù)人員將會意識到,在不背離此處所公開的本發(fā)明的范圍的情況下,能設(shè)計(jì)其他實(shí)施例。因此,本發(fā)明的范圍應(yīng)僅由所附權(quán)利要求加以限定。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1