專利名稱:用于識別圖像信息中的邊界線的方法和裝置的制作方法
技術領域:
本發(fā)明涉及一種用于提取文檔圖像所包含的表格中的格線(ruled line)的表格識別方法。
背景技術:
諸如OCR (光學字符讀取器或光學字符識別)技術的文檔圖像識別 技術可用于對已經(jīng)在紙文檔上操作的作業(yè)進行數(shù)字化并且將以紙張形式 發(fā)布的文檔轉換成電子文檔。因為文檔可能包含表格,所以用于表格識 別的技術非常重要。表格一般由垂直和水平格線的組合來表示。表格識 別是通過從文檔圖像提取表格格線的布局信息并基于提取的格線布局信 息分析表格結構來執(zhí)行的。因而,為準確識別表格,需要用于提取格線 的技術。提取表格格線的方法的一個示例是從文檔圖像中的連續(xù)像素中檢測 格線的方法。從連續(xù)像素中檢測格線的方法在實線的檢測中具有高準確 度,但是不能檢測除實線以外的其它線段。另一種方法是通過使用提取 圖像中的邊緣的技術來檢測格線。當使用提取邊緣的技術來檢測格線時, 從實線產(chǎn)生兩個候選格線,因此需要在后續(xù)處理中將所述兩個候選格線 集成到一起。與從連續(xù)像素檢測格線的方法相比,該方法具有較低準確 度。當通過這兩種方法檢測格線且隨后將由此獲得的結果集成在一起時, 同樣需要后續(xù)處理。如上所述,僅結合從連續(xù)像素檢測格線的方法和使 用邊緣提取技術檢測格線的方法,難以從多種類型的格線并存的圖像中 提取格線。從連續(xù)像素檢測格線的方法不能檢測到紋理形成的邊界格線。另一方面,當通過使用邊緣提取技術的格線檢測方法來檢測由紋理形成的邊 界格線時,增加了對非格線(例如圖像中的字符)的誤提取量。在日本特開平第10-40333號公報和日本特開平第01-217583號公報 中公開了相關技術。發(fā)明內(nèi)容根據(jù)本發(fā)明的一個方面,提供一種檢測包含在圖像信息中的邊界線 信息的方法,所述圖像信息包括處于第一狀態(tài)和第二狀態(tài)中的任意一個狀態(tài)下的多個像素,所述方法包括以下步驟檢測連續(xù)布置在所述圖像 信息中的第一狀態(tài)下的第一組像素以判定第一線信息,并檢測彼此相鄰 布置并被第二狀態(tài)下的像素環(huán)繞的第一狀態(tài)下的第二組像素,以基于該 第二組像素的輪廓來判定邊緣信息;以及基于所述線信息和所述邊緣信 息的相對位置與第一組像素和第二組像素的尺寸的關系的信息,來判定 邊界線信息。
圖1是示出根據(jù)本發(fā)明的實施方式的原理的框圖; 圖2是本實施方式中的表格識別裝置的硬件的框圖; 圖3是本實施方式中輸入的文檔圖像數(shù)據(jù)的表格; 圖4是根據(jù)本實施方式從圖3的表格輸出的表格;圖5是示出了延伸長度處理(run-lengthprocessing)的原理的示圖;圖6是延伸線段檢測模塊執(zhí)行的處理的流程圖; 圖7是示出其中刪除了候選延伸線段的狀態(tài)的示圖; 圖8是示出其中對黑像素進行了分組的狀態(tài)的示圖; 圖9是設置邊界區(qū)域的候選格線的示例; 圖IO是例示了邊緣提取的示圖;圖11是例示了紋理區(qū)域94的邊界的示圖,所述邊界在邊緣提取中 被檢測出;圖12是使用Canny方法的邊緣線段提取模塊執(zhí)行的處理的流程圖; 圖13是例示了圖12的流程圖中的步驟中的處理的狀態(tài)的示圖; 圖14是高斯濾波器的系數(shù)的示例;圖15示出了用于檢測水平方向邊緣的Sobel濾波器;圖16示出了用于檢測垂直方向邊緣的S0bd濾波器;圖17是例示了其中通過滯后(hysteresis)處理來識別邊緣中包括的 像素的情況的示圖;圖18是通過候選格線提取模塊執(zhí)行的處理的流程圖;圖19例示了從候選格線的位置判定的格線信息位置與格線信息的 類型之間的關系;圖20是格線信息產(chǎn)生模塊執(zhí)行的處理的流程圖;圖21是例示了候選格線的集成的第一示圖;圖22是例示了候選格線的集成的第二示圖;圖23是例示了候選格線的集成的第三示圖;圖24是例示了紋理邊界的判定的示圖;圖25是示出了表格和表格中的字段中的字符串的尺寸之間的關系 的示圖;圖26是刪除模塊執(zhí)行的處理的流程圖; 圖27示出了設置格線判定區(qū)域的示例;圖28是例示了其中文檔圖像數(shù)據(jù)中的確認格線部分地彼此平行的 狀態(tài)的示圖;圖29是刪除模塊指定格線判定區(qū)域的處理的流程圖;以及 圖30是例示了刪除模塊刪除不合適的格線的情況的示圖。
具體實施方式
下面將描述本發(fā)明的實施方式。圖1是示出了本發(fā)明的實施方式的原理的框圖。響應于文檔圖像數(shù) 據(jù),表格識別裝置10對文檔圖像數(shù)據(jù)執(zhí)行下列處理并輸出表格格線(邊 界線)信息。圖像輸入模塊21獲得輸入文檔圖像數(shù)據(jù)。延伸線段檢測模 塊22執(zhí)行延伸長度處理以檢測文檔圖像數(shù)據(jù)中的候選格線。邊緣線段檢 測模塊23執(zhí)行邊緣檢測處理以檢測文檔圖像數(shù)據(jù)中的候選格線。候選格線提取模塊24疊加由延伸線段檢測模塊22檢測到的候選格線和通過邊緣線段檢測模塊23獲得的候選格線,以根據(jù)預定條件判斷候選格線的類型。依照候選格線的類型,格線信息產(chǎn)生模塊25判定該候選 格線是否是格線信息。刪除模塊26在表格中的項目中刪除不合適的格線 信息。輸出模塊27輸出最終從文檔圖像數(shù)據(jù)檢測的表格格線信息。圖2是本實施方式的表格識別裝置10的硬件框圖。表格識別裝置 10包括控制單元11、輸入單元12、輸出單元13、存儲單元14以及存儲 器15。各個單元通過總線16互連??刂茊卧?1用作控制整個表格識別 裝置10的中央處理裝置??刂茊卧?1例如是CPU (中央處理單元)???制單元11通過使用存儲器15中加載的表格識別程序1、數(shù)據(jù)等來執(zhí)行圖 1所示的處理。輸入單元12具有接收需要處理的文檔圖像數(shù)據(jù)的功能。輸入單元 12例如是掃描儀、網(wǎng)絡接口、鍵盤、鼠標、觸摸板等。網(wǎng)絡接口允許控 制單元11通過網(wǎng)絡(例如因特網(wǎng)或LAN)而與外部計算機裝置之間發(fā)送 /接收數(shù)據(jù)。輸出單元13具有輸出文檔圖像數(shù)據(jù)中的表格格線的功能。輸 出單元13例如是監(jiān)控器、打印機以及諸如網(wǎng)絡接口的顯示裝置。存儲單元14存儲表格識別程序1。存儲單元14例如是磁盤裝置或 ROM (只讀存儲器)。存儲器15是用于臨時存儲在存儲單元14中存儲的 表格識別程序1、計算結果數(shù)據(jù)等以允許控制單元11執(zhí)行表格識別程序 1的區(qū)域。存儲器15例如是RAM (隨機存取存儲器)。控制單元11將存儲在存儲單元14中的表格識別程序1加載到存儲 器15中。基于表格識別程序1,控制單元11用作圖像輸入模塊21、延 伸線段檢測模塊22、邊緣線段檢測模塊23、候選格線提取模塊24、格線 信息產(chǎn)生模塊25、刪除模塊25以及輸出模塊27。本實施方式中輸入的文檔圖像數(shù)據(jù)包含表格。表格識別裝置10提取 表格中的格線。例如,當輸入到表格識別裝置10的文檔圖像是賬目報表 數(shù)據(jù)時,表格識別裝置IO識別帳目報表中的表格。現(xiàn)在將描述圖像輸入模塊21。圖像輸入模塊21實現(xiàn)將文檔圖像數(shù) 據(jù)讀入裝置中的功能。例如,為了從紙件文檔讀取圖像,輸入模塊21獲 得通過光學掃描儀數(shù)字化的文檔圖像數(shù)據(jù)。例如,當文檔圖像數(shù)據(jù)已經(jīng)存儲在存儲單元14等中時,圖像輸入模塊21從中獲得所述文檔圖像數(shù) 據(jù)。圖3是本實施方式中輸入的文檔圖像數(shù)據(jù)的表格30。表格30具有 各種形式的格線。格線由形狀、圖形或顏色,或者由形狀、圖形和顏色 的組合表達。表格格線包括由區(qū)域的邊界形成的邊界格線31和32,由紋 理區(qū)域的邊界形成的紋理邊界格線33和34,以及由實線形成的實線格線35、 36、 37以及38。圖4示出了從本實施方式的表格30輸出的表格40。表格格線41、 42、 43、 44、 45、 46、 47以及48被提取為實線。由實線形成的格線35、36、 37和38以及邊界格線31和32由填充了相同類型的像素的區(qū)域(即, 完全著色區(qū)域)的邊界線形成,因而能夠被延伸線段檢測模塊22和邊緣 線段提取模塊23檢測到。另一方面,延伸線段檢測模塊22不能提取紋 理邊界格線33和34。因而,需要使用邊緣提取技術來從多種格線并存的 表格30中提取如表格40中的格線,如圖3所示。將使用Canny方法對 本實施方式進行說明,Canny方法是邊緣提取技術的一個示例。現(xiàn)在將描述延伸線段檢測模塊22執(zhí)行的處理。本實施方式中的延伸 線段檢測模塊22基于文檔圖像數(shù)據(jù)中的像素是白色還是黑色來對像素進 行數(shù)字化。此后,白色的數(shù)字化像素被稱為"白像素",而黑色的數(shù)字化 像素被稱為"黑像素"。延伸線段檢測一般被稱為"延伸長度處理"。在延伸 長度處理中,提取其中在垂直方向或者水平方向上連續(xù)有預定數(shù)目或者 更多的黑像素的區(qū)域作為延伸線段區(qū)域。因而,在延伸長度處理中提取 了其中黑像素線性連續(xù)的區(qū)域。圖5是示出了延伸長度處理的原理的示圖。在延伸長度處理中,對 圖像數(shù)據(jù)中的像素6進行數(shù)字化,并且提取相同類型的像素組,從而獲 得了相同類型的像素組形成的線段的線寬50、起點51以及終點52。圖6是延伸線段檢測模塊22執(zhí)行的處理的流程圖。延伸線段檢測模 塊22將通過圖像輸入模塊21獲得的文檔圖像數(shù)據(jù)轉換成二進制圖像(步 驟S01 )。延伸線段檢測模塊22檢測黑像素線性連續(xù)的區(qū)域作為候選延伸 線段(步驟S02)。延伸線段檢測模塊22針對由像素組成的每一行對連續(xù)像素進行分組,以檢測水平候選延伸線段。延伸線段檢測模塊22刪除長 度小于或等于預定值的線段(步驟S03)。圖7是示出了其中刪除候選延伸線段的狀態(tài)的示圖。在圖7的上部 71示出其中延伸線段檢測模塊22從步驟S02中的文檔圖像數(shù)據(jù)提取候選 延伸線段的狀態(tài)。下部72示出了其中延伸線段檢測模塊22在步驟S03 中從候選延伸線段中刪除延伸線段的狀態(tài)。圖7中的圓圈表示像素6。處 于黑色的像素6由黑像素601表示,而處于白色的像素由白像素602表 示。延伸線段檢測模塊22刪除候選延伸線段61中的具有在水平方向63 上連續(xù)的三個像素或者更少像素的候選延伸線段。因此,在圖7的下部 狀態(tài)圖中的中央附近存在的并對應于具有3個像素長度的候選延伸線段 的像素組64被刪除。下面返回圖6進行描述。接下來,延伸線段檢測模塊22執(zhí)行對黑像素的分組(步驟S04)。 圖8是例示了對黑像素進行分組的狀態(tài)的示圖。延伸線段檢測模塊22將 文檔圖像數(shù)據(jù)中的相鄰候選延伸線段61分成組,以檢測其中候選延伸線 段61相耦接的矩形區(qū)域62。延伸線段檢測模塊22將其中候選延伸線段 61相耦接的矩形區(qū)域62視為候選格線。作為上述處理的結果,提取了實 線格線。接下來,延伸線段檢測模塊22判定受關注的線段是否是允許從邊界 格線中檢測到候選格線的區(qū)域邊界(步驟S05)。具體而言,當黑像素的 矩形區(qū)域的寬度超過了預定閾值時,延伸線段檢測模塊22判定受關注的 矩形線段是區(qū)域邊界。區(qū)域邊界的候選格線對應于矩形區(qū)域的相對兩端 處的邊界部分。對于區(qū)域邊界(步驟S05中為是),延伸線段檢測模塊22 將矩形區(qū)域的相對兩端視為候選格線(步驟S06)。圖9是設置區(qū)域邊界的候選格線的示例。圖9中的上部示出了分組 的黑像素矩形區(qū)域。黑像素線段的寬度66由6個像素組成。延伸線段檢 測模塊22根據(jù)該黑像素組生成區(qū)域邊界。假設延伸線段檢測模塊22具 有預定值,例如"4",作為判定線段是否是區(qū)域邊界的閾值信息。當用作 黑像素線段的寬度的像素數(shù)目為4或更大時,延伸線段檢測模塊22判定 該線段是區(qū)域邊界。在判定線段是區(qū)域邊界后,延伸線段檢測模塊22判定矩形區(qū)域的上邊緣處的白像素和黑像素之間的邊界是候選格線67,并 判定矩形區(qū)域的下邊緣處的白像素和黑像素之間的邊界是候選格線68,如圖9的下部所示。在上述處理中,延伸線段檢測模塊22檢測水平候選格線。延伸線段 檢測模塊22還檢測垂直候選格線。在后一種情況下,延伸線段檢測模塊 22改變垂直格線和水平格線的方向以執(zhí)行處理。作為上述處理的結果, 延伸線段檢測模塊22提取了實線格線和邊界格線的延伸線段的候選格 線?,F(xiàn)在描述邊緣線段檢測模塊23執(zhí)行的處理。圖10是例示了邊緣提 取的示圖。在邊緣提取中,提取黑像素形成的直線92的相對兩側處的像素邊界 91作為線段。換句話說,在邊緣提取中,提取由一系列像素形成的直線 92的相對兩側的兩條線段。邊緣線段檢測模塊23需要具有提取紋理區(qū)域邊界的功能。圖11是 例示了在邊緣提取中檢測到的紋理區(qū)域94的邊界的示圖。需要從黑像素 不連續(xù)的紋理區(qū)域94檢測邊界線95。在本實施方式中,使用被稱為Canny 方法的邊緣提取方法。在Canny方法中,紋理區(qū)域中的精細圖形導致的 像素值的變化被視為疊加在整個著色區(qū)域上的噪聲。首先,通過高斯濾 波器對輸入圖像進行平滑化,并且將得到的精細圖形展開到一定程度上 均勻的區(qū)域上。此后,通過Sobd濾波器等判定像素值的變化值,且將判 定值的最大值視為邊緣像素。最后,連接在邊緣像素附近具有大梯度值 的像素并且獲得的邊緣形成連續(xù)的繪線圖。圖12是使用Canny方法的邊緣線段提取模塊23執(zhí)行的處理的流程 圖。圖13是例示了 12的流程圖中的步驟中的處理的狀態(tài)的示圖。在本 實施方式中,假設圖像輸入模塊21獲得的文檔圖像數(shù)據(jù)包含最小密度為 0且最大密度為255的圖像。表格1107示出了狀態(tài)1101、 1102、 1103、 1105、 1106以及1107中的每個像素的顏色。邊緣線段檢測模塊23對圖13中的狀態(tài)1101中示出的且通過圖像輸 入模塊21獲得的文檔圖像數(shù)據(jù)中的像素進行平滑化(步驟Sll)。例如,高斯濾波器被用作對圖像進行平滑化的模塊,且能夠通過輸入圖像和高 斯濾波器的巻積和獲得經(jīng)平滑的圖像。圖14是高斯濾波器的系數(shù)1201 的示例。平滑圖像I'(i,j)能夠通過(等式1)表達的計算獲得,其中I(i,j)表示輸入圖像,F(xiàn)(i,j)表示濾波器系數(shù),且C表示規(guī)一化常數(shù)。<formula>formula see original document page 11</formula> (等式l)當濾波器的高度和寬度由W表示時,w通過下面的(等式2)來確定<formula>formula see original document page 11</formula> (等式2)在這種情況下,"W"是5。當"W"是5時,w被確定為"2"。在這種情況下,將通過疊加圖14中所示的濾波元素的系數(shù)的所有值 而獲得的值(C = 159)用作規(guī)一化常數(shù)C。圖13中示出的狀態(tài)1102代 表狀態(tài)1101經(jīng)平滑化后的狀態(tài)。邊緣線段檢測模塊23判定梯度值(步驟S12)。當相對于兩個相對 邊的相鄰像素的數(shù)值差異很大時,受關注的像素的梯度值也很大。例如, 通過例如Sobel濾波器獲得梯度值。圖15示出了用于檢測水平方向中的 邊緣的Sobd濾波器1301。圖16示出了用于檢測垂直方向中的邊緣的 Sobel濾波器1401。例如,為了水平候選格線的提取,使用用于檢測垂直 方向中的邊緣的Sobel濾波器1401(圖16所示)。另一方面,為了垂直候 選格線的提取,使用用于檢測水平方向中的邊緣的Sobd濾波器1301(圖 15所示)。具體而言,邊緣線段檢測模塊23使用圖15或16中示出的系 數(shù)作為等式(1)中的濾波器系數(shù),并使用'T'作為常數(shù)C以執(zhí)行像素的 計算。使用拉普拉斯濾波器來獲得邊緣的方法也是可行的。圖13所示的 狀態(tài)1103代表從狀態(tài)1102獲得的梯度值的狀態(tài)。當從側面觀看狀態(tài)1103 時,獲得狀態(tài)1104。邊緣線段檢測模塊23獲得梯度值的最大點(步驟S13)。例如,當最大點的梯度值大于預定閾值(例如任意數(shù)值,如"r)時,邊緣線段檢測模塊23確認該最大點是被包括在邊緣中的像素。另選的是,邊緣線段 檢測模塊23例如通過判定比相鄰點具有更大梯度值的點來執(zhí)行確認。圖13中的狀態(tài)1105代表了其中從狀態(tài)1103獲得梯度值的最大點的狀態(tài)。邊緣線段檢測模塊23檢測連續(xù)邊緣(步驟S14)。例如,邊緣線段 檢測模塊23通過執(zhí)行一般稱為滯后處理的處理來檢測連續(xù)邊緣。更具體 而言,當未確認像素與包括在邊緣中的確認像素相鄰并且該未確認像素 的梯度值大于預定閾值(例如"2")時,邊緣線段檢測模塊23確認該相 鄰的未確認像素是包括在邊緣中的像素。圖17是例示了其中通過滯后處理確認包括在邊緣中的像素的情況。 在滯后處理中,狀態(tài)1701依次轉換成狀態(tài)1702、狀態(tài)1703以及狀態(tài)1704。 在每個狀態(tài)下,黑像素1705是被確認為包括在邊緣中的像素,且陰影像 素1706是未確認像素且具有比預定閾值大的梯度值。邊緣線段檢測模塊 23相繼確認與黑像素1705相鄰的陰影像素1706。在狀態(tài)1701中,黑像 素1705和陰影像素1706在區(qū)域1707和區(qū)域1708中彼此相鄰。當黑像 素1705和陰影像素1706彼此相鄰時,邊緣線段檢測模塊23將陰影像素 1706視為黑像素1705。在狀態(tài)1702中,黑像素1705和陰影像素1706 在區(qū)域1709中彼此相鄰。邊緣線段檢測模塊23將陰影像素1706視為黑 像素1705。在狀態(tài)1703中,陰影像素1706存在于區(qū)域1710和1711中。 因為區(qū)域1710和1711不與任何黑像素1705相鄰,所以邊緣線段檢測模 塊23刪除區(qū)域1710和1711中的陰影像素1706。上述處理一直繼續(xù)到在 包括在邊緣中的像素附近不存在梯度值大于或等于預定值的像素為止。 當處理結束時,邊緣線段檢測模塊23檢測到1704中示出的邊緣。圖13 中示出的狀態(tài)1106代表其中從狀態(tài)1105檢測到連續(xù)邊緣的狀態(tài)?;旧?,在使用Canny方法的邊緣檢測中,在判定梯度最大點的過 程中,檢查梯度傾斜方向,且沿著正交于梯度的方向,檢查相鄰像素的 梯度值是否超過預定閾值。然而,本實施方式意在判定包括在表格中的垂直和水平格線。因而, 在提取水平候選格線的處理中,邊緣線段檢測模塊23相繼檢測垂直相鄰 像素的梯度的最大值,此后,相繼檢查水平相鄰像素的梯度的最大值。 提取垂直格線的處理與提取水平格線的上述處理相反。邊緣線段檢測模塊23將上述處理中確定的邊緣像素視為黑像素,并執(zhí)行對黑像素的分組(步驟S15)。接著,邊緣線段檢測模塊23判定受關注的線段是否是允許從邊界格線中檢測候選格線的區(qū)域邊界(步驟S16)。 當線段是區(qū)域邊界時(步驟S15為是),邊緣線段檢測模塊23將矩形區(qū) 域的相對兩端視為候選格線(步驟S17)。由于從S15到S17的處理與延 伸線段檢測模塊22執(zhí)行的處理相同,所以省略其描述?,F(xiàn)在將描述候選格線提取模塊24。圖18是候選格線提取模塊24執(zhí) 行的處理的流程圖。基于由延伸線段檢測模塊22檢測的候選延伸線段格線和由邊緣線 段檢測模塊23檢測的候選邊緣線段格線之間的位置關系,候選格線提取 模塊24從這些候選格線中提取能夠被判定為格線的格線信息。候選格線 提取模塊24疊加通過延伸線段檢測模塊22獲得的候選延伸線段格線和 通過邊緣線段檢測模塊23獲得的候選格線,以獲得由此獲得的候選格線 之間的位置關系(步驟S21)。候選格線提取模塊24判定在步驟S21獲得的位置關系是否滿足預定 的位置關系條件(步驟S22)。當該位置關系滿足所述位置關系條件(步 驟S22中為是)時,候選格線提取模塊24將候選格線分成一類格線信息 (步驟S23)?,F(xiàn)在將描述位置關系條件。圖19例示了從候選格線的位置確定的格 線信息位置與格線信息類型之間的關系。假設原始文檔圖像數(shù)據(jù)中的格線為實線格線1901。對于實線格線 1901,延伸線段檢測模塊22檢測到候選格線1902。邊緣線段檢測模塊 23檢測到兩個候選格線1903和1904。候選格線1902、 1903和1904的 疊加提供了其中由邊緣線段檢測模塊23獲得的候選格線1903和1904夾 著由延伸線段檢測模塊22獲得的候選格線1902的位置關系。當位置關 系是邊緣線段夾著延伸線段時,即當邊緣線段與延伸線段的兩個相對邊 相鄰時,候選格線提取模塊24將受關注的候選格線識別為實線格線。接下來,假設原始文檔圖像數(shù)據(jù)中的格線是邊界格線1905。對于邊 界格線1905,延伸線段檢測模塊22檢測出候選格線1906。邊緣線段檢 測模塊23檢測出候選格線1907。候選格線1906和1907的疊加提供了如下位置關系,其中由邊緣線段檢測模塊23獲得的候選格線1907和由延 伸線段檢測模塊22獲得的候選格線l卯6彼此相鄰。對于一條邊緣線段 和一條延伸線段彼此相鄰的位置關系,候選格線提取模塊24將受關注的 候選格線識別為邊界格線。接下來,假設原始文檔圖像數(shù)據(jù)中的格線是紋理邊界格線1908。對 于紋理邊界格線1908,延伸線段檢測模塊22未檢測到候選格線。另一方 面,邊緣線段檢測模塊23檢測到候選格線1909。候選格線1909的疊加 提供了如下位置關系,其中存在通過邊緣線段檢測模塊23獲得的候選格 線1909。對于僅存在邊緣線段的位置關系,候選格線提取模塊24將受關 注的候選格線識別為紋理邊界格線。在這種情況下,當由延伸線段檢測模塊22獲得的候選格線的延伸線 段長度和由邊緣線段檢測模塊23獲得的候選格線的邊緣線段長度彼此不 同時,候選格線提取模塊24例如執(zhí)行下面的判定。當延伸線段檢測模塊 22和邊緣線段檢測模塊23中的一個檢測到的線段的長度大于或等于延伸 線段檢測模塊22和邊緣線段檢測模塊23中的另一個檢測出的線段的長 度的一半時,執(zhí)行步驟S22中的位置關系判定。另選的是,當延伸線段 檢測模塊22和邊緣線段檢測模塊23中的一個檢測出的線段的長度小于 延伸線段檢測模塊22和邊緣線段檢測模塊23中的另一個檢測出的線段 的長度的一半時,僅使用較長的線段作為有效線段。另外,存在位置關系不滿足圖19所示的條件的情況,例如,兩條延伸線段和兩條邊緣線段彼此相鄰的情況。在這種情況下,當相鄰線段包 括延伸線段時,候選格線提取模塊24能夠通過識別受關注的線段為實線 格線來檢測格線,而當所有的延伸線段都是邊緣線段時,候選格線提取 模塊24能夠通過識別受關注的線段為從紋理邊界獲得的候選格線來檢測 格線。除了上述的那些線型,也可釆用其它各種類型的格線,例如點線和 復線。因而,候選格線類型的判定不限于上述處理。例如,當三條候選 邊緣線段格線和兩條候選延伸線段格線在文檔圖像中交替相鄰存在時, 候選格線提取模塊24能夠將格線識別為復線。而且,傾向于從點線提取邊緣線段。因而,當單邊緣線段被提取,并且候選格線附近區(qū)域是平坦 區(qū)域時,候選格線提取模塊24也能夠判定該線段傾向于是點線。下面將描述格線信息產(chǎn)生模塊25。圖20是格線信息產(chǎn)生模塊25執(zhí) 行的處理的流程圖。格線信息產(chǎn)生模塊25根據(jù)候選格線生成格線信息。 更具體而言,格線信息產(chǎn)生模塊25刪除不合適的候選格線,集成候選格 線,并且校正候選格線。當輸入文檔圖像本身被損壞時,表格中的格線 可能受退色、變色等影響。當原始文檔圖像中的表格中的格線被不正確 地顯示時,包括在格線中的直線的提取結果可能不連續(xù)或者變形。因而, 格線信息產(chǎn)生模塊25執(zhí)行如下處理,如用于提取代表部分或全部包括在 格線中的直線的線段并且將提取的線段視為候選格線的處理、去除多余 候選格線的處理,以及集成相鄰的候選格線的處理,以產(chǎn)生格線信息作 為格線提取的最終結果。格線信息產(chǎn)生模塊25依照候選格線提取模塊24提取的候選格線的 類型設置預定參數(shù)(步驟S31)。所述參數(shù)被用于根據(jù)候選格線產(chǎn)生格線 信息。例如,當兩條候選格線彼此平行地存在時,所述參數(shù)用作判定是 否將這兩條候選格線視為集成的一條格線的閾值。所述參數(shù)的最佳值隨 候選格線的類型而不同。因而,格線信息產(chǎn)生模塊25依照候選格線的類 型而具有不同的參數(shù)值?,F(xiàn)在將描述格線信息產(chǎn)生模塊25的參數(shù)的示例。格線信息產(chǎn)生模塊 25適于基于候選格線長度信息和閾值的關系來判定是否可從格線獲得候 選格線。在所述參數(shù)中,用于將從紋理邊界獲得的候選格線識別為格線 的閾值被設置為用于將從實線格線和邊界格線獲得的候選格線判定為格 線的閾值的兩倍。當用于將紋理邊界識別為格線的閾值增大時,紋理邊 界格線需要是比實線格線或邊界格線更長的直線,才能被識別為紋理邊 界格線。增大閾值的原因在于,與實線格線和邊界格線相比,紋理邊界格線 更傾向于位置不明確且更傾向于產(chǎn)生噪聲。增大閾值的另一原因在于, 與實線格線和邊界格線的情況相比,另一格線較不傾向于在紋理邊界的 鄰近區(qū)域中存在。格線信息產(chǎn)生模塊25依照候選格線的類型來改變檢測參數(shù),由此能 夠防止錯誤格線的提取和格線的斷開。格線信息產(chǎn)生模塊25判定是否滿足預定條件(步驟S32)。當判定滿足預定條件時(步驟S32為是),格線 信息產(chǎn)生模塊25執(zhí)行對應于該條件的處理(步驟S33)。下面將描述格線 信息產(chǎn)生模塊25執(zhí)行的集成處理、刪除處理以及修正處理?,F(xiàn)在給出對格線信息產(chǎn)生模塊25將相鄰候選格線集成到一起以產(chǎn) 生單格線信息的處理的描述。格線信息產(chǎn)生模塊25判定是否將候選格線集成在一起以產(chǎn)生新的 候選格線。當部分候選格線變形時,格線信息產(chǎn)生模塊25重新計算整個 格線信息的格線寬度和長度。不管坐標值的重新計算的結果如何,格線 信息產(chǎn)生模塊25將諸如格線的坐標和類型之類的屬性轉換成最佳值。作 為最佳值的一個示例,當候選格線中的至少一條是紋理邊界格線時,格 線信息產(chǎn)生模塊25用以判定在候選格線之間的距離較小時將相鄰候選格 線集成為一個格線的閾值增大。使用這種結構,格線信息產(chǎn)生模塊25能 夠執(zhí)行調(diào)節(jié),從而有利于候選實線格線或候選邊界格線的集成。圖21是例示了候選格線的集成的第一示圖。當候選格線的部分彼此 部分重疊時,候選格線被集成在一起。當兩條候選格線231和232之間 的距離d 234小于閾值Thl時,候選格線231和232被集成在一起且被轉 換成單格線信息235。圖22是例示了候選格線的集成的第二示圖。圖22示出了其中候選 格線241和242沿著直線排列而非彼此平行的位置關系。當兩條候選格 線241和242之間的距離d 243小于閾值Th2時,候選格線241和242 被集成到一起且被轉換成單格線信息244。圖23是例示了候選格線的集成的第三示圖。圖23示出了其中短候 選格線251和長候選格線252彼此平行排列的位置關系。在本實施方式 中,使用兩種類型的閾值Th3和Th4。短候選格線251具有長度L1且長 候選格線252具有長度L2。當兩條候選格線251和252之間的距離d 253 小于閾值Th3,并且候選格線252的長度L2與候選格線251的長度Ll 的比大于閾值Th4時,兩條候選格線251和252被集成到一起且被轉換成單格線信息254。更具體而言,格線信息產(chǎn)生模塊25刪除候選格線251 。 在這種情況下,候選格線251的長度Ll和候選格線252的長度L2具有 如下關系,其中L2比L1大到使得可將L1視為L2的噪聲的程度。例如,當輸入圖像具有大約200dpi的分辨率時,執(zhí)行如下設置Thl =8點(約0.1mm), Th2二16點(約0.2mm), Th3 = 8點(約0.1mm), Th4=5點(約0.06 mm)。另選的是,格線信息產(chǎn)生模塊25還能夠刪除長度比閾值小的候選格 線。即使當受關注的候選格線并不與另一候選格線相鄰,格線信息產(chǎn)生 模塊25也刪除長度小于預定閾值的候選格線。例如,當閾值被設置為20 點時,針對200 dpi,格線信息產(chǎn)生模塊25刪除長度小于約2.54 mm的候 選格線。因為包括在文檔圖像數(shù)據(jù)的表格中的格線的長度典型地具有特 定下限,所以利用上述閾值使得能夠區(qū)分從字符錯誤提取的候選格線與 從格線提取的候選格線。格線信息產(chǎn)生模塊25基于候選格線來改變諸如格線信息的位置和 大小的屬性。為執(zhí)行這種改變,格線信息產(chǎn)生模塊25具有判定是否根據(jù) 候選格線的類型(即,實線格線、邊界格線或紋理邊界格線)來改變屬 性的功能。例如,對于紋理邊界候選格線,格線信息產(chǎn)生模塊25檢査與 紋理邊界候選格線接觸的區(qū)域是否是紋理區(qū)域。僅當與紋理邊界候選格 線接觸的區(qū)域之一是紋理區(qū)域時,或者僅當與紋理邊界候選格線相接觸 的兩個相對區(qū)域是兩個不同類型的紋理區(qū)域時,格線信息產(chǎn)生模塊25才 能夠執(zhí)行設置,從而判定受關注的線段是候選格線。下面將詳細描述該 處理。圖24是例示了紋理邊界的判定的示圖。在狀態(tài)2601中,存在紋理 區(qū)域2603和白色區(qū)域2604。狀態(tài)2601對應于如下狀態(tài),其中候選格線 提取模塊24檢測紋理邊界的候選格線2602。在狀態(tài)2605中,字符串2607存在于白色區(qū)域中。狀態(tài)2605對應于 如下狀態(tài),其中邊緣線段檢測模塊23錯誤地檢測字符串2607的下邊緣 作為紋理邊界格線的候選格線2606。檢測錯誤的原因在于水平書寫的連 續(xù)字符串的下邊緣在水平軸上對準,因而被邊緣線段檢測模塊23錯誤地識別為紋理邊界。即,原因在于,盡管字符串的包絡不是紋理邊界,但 字符串的包絡部分的圖像特征與代表紋理邊界的圖像特征極為相似。
因此,格線信息產(chǎn)生模塊25檢查被格線夾著的區(qū)域是否是紋理區(qū)域 以判定候選格線是從紋理區(qū)域獲得的還是從字符串的包絡獲得的。
通過判定區(qū)域是否是紋理區(qū)域,當實線位于候選格線的位置處時, 不可能僅通過檢查候選格線附近的區(qū)域來判定沒有格線存在。然而,在 本實施方式中,因為候選格線提取模塊24判定候選格線是實線格線、邊 界格線以及紋理邊界格線中的任意一個,所以執(zhí)行相鄰區(qū)域的判定使得 能夠判斷格線的存在/不存在。
一種對候選格線的兩個相對邊的區(qū)域中的黑像素進行分組并且獲得 黑像素組的尺寸的平均值的方法可用于判定區(qū)域是否是紋理區(qū)域。紋理 區(qū)域中的黑像素組的尺寸小于字符串中黑像素組的尺寸。因而,用于字 符的黑像素組的尺寸的預測量統(tǒng)計和設置用于分離字符串和紋理的黑像
素組尺寸閾值使得能夠區(qū)分字符串與紋理區(qū)域。在圖24中,狀態(tài)2601 中的紋理區(qū)域2603的黑像素組的尺寸2609的平均值是8點,狀態(tài)2601 中的白色區(qū)域2604中的黑像素組的尺寸2610的平均值是0點,狀態(tài)2605 中包括字符串的白色區(qū)域中的黑像素組的尺寸2611的平均值是100點, 且狀態(tài)2605中的紋理區(qū)域的黑像素組的尺寸2612的平均值是2點。在 這種情況下,假設黑像素組的尺寸被預置為"50"作為用于判定區(qū)域是否 是紋理區(qū)域的閾值。
格線信息產(chǎn)生模塊25將包含在區(qū)域2603和2604中的黑像素組的尺 寸與閾值"50"進行比較,所述區(qū)域2603和2604夾著狀態(tài)2601中的紋理邊 界格線的候選格線2602。尺寸2609和2610具有小于該閾值的值。因而, 格線信息產(chǎn)生模塊25判定候選格線2602是紋理邊界格線。格線信息產(chǎn) 生模塊25還將包含在字符串包含區(qū)域2607和2608中的黑像素組的尺寸 與閎值"50"進行比較,所述字符串包含區(qū)域2607和2608夾著狀態(tài)2605 中的紋理邊界格線的候選格線2606。尺寸2611具有大于該閾值的值。因 而,格線信息產(chǎn)生模塊25判定候選格線2606是從字符串的下邊緣錯誤 檢測出的線?,F(xiàn)在將提供對格線信息產(chǎn)生模塊25執(zhí)行的修正處理的描述。當格線 的寬度和高度滿足預定條件時還能夠修正候選格線。這里,術語"修正" 表示如下處理,其中例如格線信息產(chǎn)生模塊25將變成邊界格線的候選格 線或者變成紋理邊界格線的候選格線的寬度設置為最小值(例如1點)。
現(xiàn)在將描述預定條件的示例。作為一個示例,理論上從區(qū)域邊界獲 得的格線沒有寬度,但是在實際格線提取處理中給予寬度。因而,可以 執(zhí)行用于對已經(jīng)被判定為邊界格線的候選格線進行修正的處理。作為另
一示例,在延伸線段檢測模塊22執(zhí)行的黑像素分組處理過程中,存在格 線的寬度(例如圖8中所示的黑像素矩形區(qū)域62的寬度)增大的情況。 因而,可以執(zhí)行用于對寬度增大的格線的寬度進行修正的處理。
如上所述,在將候選格線轉換成格線信息之前,格線信息產(chǎn)生模塊 25基于候選格線的位置關系判定格線信息,并且通過使用對應于候選格 線的類型的參數(shù)來判定格線信息。
現(xiàn)在將給出對刪除錯誤提取的候選格線的方法的描述。錯誤提取意 味著從圖像中錯誤地提取了非格線(例如,字符)的線段信息。各種類 型的格線(諸如實線格線、邊界格線以及紋理邊界格線)的提取,增加 了錯誤提取的影響。
刪除模塊26需要判定從非格線錯誤檢測的候選格線是錯誤的候選 格線。錯誤提取的候選格線例如包括從表格的字段中的字符提取的候選 格線。圖25是示出了表格283和表格字段中的字符串的尺寸之間關系的 示圖。表格283中的字符串280 —般填充在表格283所包括的字段區(qū)域 內(nèi)。從表格283的字段中的字符串280錯誤提取的候選格線的垂直長度 284小于相應行中的字段區(qū)域的高度281。表格283中的格線一般連接到 行的頂部邊緣和底部邊緣,因而大于行中的區(qū)域的高度。對于表格283 中的字段的水平長度288情況也相同。這種關系例如適用于表格283中 的其他字段285、 286以及287的區(qū)域尺寸與寫在字段285、 286以及287 中的字符串尺寸的關系。字段區(qū)域的高度具有大于字符串的高度的值。 因而,在表格283中規(guī)定每個字段區(qū)域允許基于字段的高度信息或寬度 信息來判定用于刪除項目中的候選格線的合適長度閾值。在下面的描述中,對其執(zhí)行關于是否刪除候選格線的判定的區(qū)域被稱為"格線判定區(qū) 域"。
現(xiàn)在將描述刪除模塊26執(zhí)行的處理。圖26是刪除模塊26執(zhí)行的處 理的流程圖。刪除模塊26設置對其執(zhí)行關于是否刪除格線的判定的區(qū)域 (步驟S41)。
刪除模塊26檢測文檔圖像數(shù)據(jù)中的確認格線?;谟糜谧R別確認格 線的判定標準,例如,將長度大于預定閾值的格線識別為確認格線。例 如,當輸入文檔圖像數(shù)據(jù)具有200dpi的分辨率時,用作確認格線判定標 準的閾值可能約為100點(約12.7mm)。利用更長格線作為確認格線, 使得可以防止使用不合適的格線信息來設置格線判定區(qū)域。不合適的格 線信息的示例包括從非格線提取的格線信息,如從字符錯誤檢測出的格 線狀信息。刪除模塊26從確認格線的集合中檢測出一組平行并相鄰的確 認格線,并生成格線判定區(qū)域。
圖27示出了設置格線判定區(qū)域的示例。假設本實施方式中的格線判 定區(qū)域是被彼此相鄰的長格線夾著的矩形區(qū)域。在下面的描述中,假設 用于指定格線判定區(qū)域的格線是確認格線。圖27的上部中的表格2900 具有長水平格線信息2901、 2902、 2903以及2904。表格2900還具有垂 直格線2905。表格2900中的水平格線的格線信息中,平行并相鄰的格線 信息組是格線信息2901和2902的組,格線信息2902和2903的組以及 格線信息2903和2904的組。被這些組夾著的區(qū)域用作格線判定區(qū)域 2907、 2908以及2909,如圖27的下部所示。
確認格線組不必具有與圖27中相同的長度。例如, 一組確認格線可 以彼此部分地平行。
圖28是例示了其中文檔圖像數(shù)據(jù)中的確認格線部分地彼此平行的 狀態(tài)。圖28示出了確認格線311、 312以及313。確認格線311、 312以 及313彼此部分地平行。確認格線311和312在區(qū)域316中彼此平行并 相鄰。確認格線311和313在區(qū)域317中彼此平行并相鄰。區(qū)域316中 的確認格線311和312定義的矩形區(qū)域是格線判定區(qū)域314。區(qū)域317中 的確認格線311和313定義的矩形區(qū)域是格線判定區(qū)域315。當確認格線彼此部分平行時,刪除模塊25僅將通過平行且相鄰的部分定義的區(qū)域視 為格線判定區(qū)域并且登記該格線判定區(qū)域。
現(xiàn)在描述刪除模塊26執(zhí)行的處理。圖29是例示了其中刪除模塊26 指定格線判定區(qū)域的處理的流程圖。刪除模塊26指定任意的確認格線為 檢測目標(步驟S51)。在圖28中,刪除模塊26指定確認格線311作為 檢測目標。刪除模塊26檢測位于文檔圖像數(shù)據(jù)中檢測目標確認格線之下 并與檢測目標確認格線水平平行并相鄰的確認格線(步驟S52)。在圖28 中,刪除模塊26檢測到位于確認格線311之下并與其水平平行并相鄰的 確認格線312。當檢測到相鄰的確認格線時(步驟S52中為是),刪除模 塊26指定檢測目標確認格線和相鄰確認格線定義的區(qū)域中的格線判定區(qū) 域(步驟S53)。在圖28中,當檢測到確認格線312時(步驟S53為是), 刪除模塊26指定由區(qū)域316形成的格線判定區(qū)域341 (步驟S53)。
當尚未對沿著步驟S51中指定的檢測目標確認格線的所有水平區(qū)域 執(zhí)行檢測處理時(在步驟S54為否),刪除模塊26沿著檢測目標確認格 線對剩余水平區(qū)域繼續(xù)執(zhí)行檢測處理。在圖28中,當尚未對沿著確認格 線311的所有水平區(qū)域執(zhí)行檢測處理時(步驟S54中為否),刪除模塊26 沿著確認格線311對剩余水平區(qū)域繼續(xù)執(zhí)行檢測處理。在圖28中,相對 于區(qū)域317,刪除模塊26檢測位于確認格線311之下且與其水平平行并 相鄰的確認格線313。在圖28中,刪除模塊26指定由區(qū)域317形成的格 線判定區(qū)域。
當對沿著檢測目標確認格線的所有水平區(qū)域執(zhí)行了檢測處理時(步 驟S54為是),刪除模塊26判定對于文檔圖像數(shù)據(jù)中的所有確認格線, 是否完成了相鄰確認格線的檢測(步驟S55)。在圖28中,當已經(jīng)對沿著 確認格線311的所有水平區(qū)域執(zhí)行了檢測處理時,刪除模塊26判定對于 文檔圖像數(shù)據(jù)的所有確認格線,是否完成了相鄰確認格線的檢測。當已 經(jīng)對文檔圖像數(shù)據(jù)中指定的所有確認格線執(zhí)行了上述處理時(步驟S55 中為是),刪除模塊26登記得出的格線判定區(qū)域,由此完成處理。
返回圖26,刪除模塊26計算對應于格線判定區(qū)域的格線判定值(步 驟S42)。格線判定值是用于判定包含在格線判定區(qū)域中的格線是否是真的格線信息的閾值。在本實施方式中,格線判定值是格線的長度信息。 基于用于判定格線的長度信息,刪除模塊26刪除不合適的格線。
刪除模塊26為每個格線判定區(qū)域設置了長度閾值。例如,刪除模塊
26獲得格線判定區(qū)域的高度信息,并將該閾值設置為略微大于該高度信 息的長度。例如,對于分辨率為200dpi的圖像,將閾值設置為比格線判 定區(qū)域的高度的點數(shù)約少20點。例如,存在一種方法,其用于在格線判 定區(qū)域中判定候選格線的長度的頻率分布,并將閾值設置為頻率分布的 最大值或將閾值設置為與頻率分布的最大值相對應的候選格線的長度的 兩倍。
接下來,刪除模塊26刪除不合適格線信息(步驟S43)。更具體而 言,刪除模塊26刪除平行確認格線所定義的格線判定區(qū)域中的不合適格 線信息。不合適的格線信息是長度比步驟S42中判定的格線判定長度信 息小的格線信息。在本實施方式中,刪除模塊26刪除水平方向上的一組 確認格線信息所定義的格線判定區(qū)域中的不合適的垂直格線信息。在步 驟S43的處理中,不僅可以刪除垂格線信息而且可以刪除水平格線信息。 很多條不合適格線信息是從對字符信息的錯誤檢測中產(chǎn)生的。這是因為 被錯誤檢測的字符的水平長度和垂直長度幾乎相等。
圖30是例示了其中刪除模塊26刪除了不合適格線的情況的示圖。 圖30中的上部中的表格3401示出了文檔圖像數(shù)據(jù)的表格中的格線信息, 該格線信息通過格線信息產(chǎn)生模塊25產(chǎn)生。表格3401具有確認格線 3402、 3403、 3404、 3405、 3406以及3407。表格3401具有通過確認格 線3402和3403所定義的格線判定區(qū)域3408、通過確認格線3403和3404 所定義的格線判定區(qū)域3409、通過確認格線3404和3405所定義的格線 判定區(qū)域3410、通過確認格線3403和3406所定義的格線判定區(qū)域3411、 通過確認格線3406和3407所定義的格線判定區(qū)域3412,以及通過確認 格線3407和3405所定義的格線判定區(qū)域3413。圖30的中部處的表格 3420進一步指示了用于指定針對每個格線判定區(qū)域來刪除不合適格線信 息的長度的區(qū)域高度。刪除模塊26基于下列處理確定用于針對每個格線 判定區(qū)域刪除不合適格線信息的長度信息。即,對于格線判定區(qū)域3408,刪除模塊26基于格線判定區(qū)域3408的高度3414來確定長度信息。對于 格線判定區(qū)域3409,刪除模塊26基于格線判定區(qū)域3409的高度3415來 確定長度信息。對于格線判定區(qū)域3410,刪除模塊26基于格線判斷區(qū)域 3410的高度3416來確定長度信息。對于格線判定區(qū)域3411,刪除模塊 26基于格線判定區(qū)域3411的高度3417來確定長度信息。對于格線判定 區(qū)域3412,刪除模塊26基于格線判斷區(qū)域3412的高度3418來確定長度 信息。對于格線判定區(qū)域3413,刪除模塊26基于格線判定區(qū)域3413的 高度3419來確定長度信息。
根據(jù)針對每個格線判定區(qū)域判定的格線判定長度信息,刪除模塊26 判定格線判定區(qū)域中的格線信息是合適還是不合適。更具體而言,刪除 模塊26刪除長度小于針對每個格線判定區(qū)域判定的格線判定長度信息的 格線信息。圖30下部的表格3421示出了其中刪除了表3401中的區(qū)域中 的格線信息的狀態(tài)。.
當格線信息產(chǎn)生模塊25設置參數(shù)時,能夠通過指定格線判定區(qū)域并
為每個格線判定區(qū)域設置合適的參數(shù),來執(zhí)行高準確度的格線提取。例 如,對于紋理區(qū)域,可將用于格線判定的閾值設置為較大值。
輸出模塊27輸出通過上述處理獲得的格線信息。
根據(jù)上述實施方式,即使當包括實線、邊界格線以及紋理邊界格線 的多種類型的格線存在于輸入圖像中時,也能夠根據(jù)每種類型的格線來 執(zhí)行合適的格線提取處理。因此,能夠提高格線提取的準確度。因而, 能夠減小用于格線提取的錯誤校正作業(yè)的負擔,從而能夠減少用戶的工 作時間。
另外,由于能夠針對包括在表格中的每個區(qū)域,來改變用于刪除不 合適格線的閾值信息,所以即使當表格中的字段的尺寸彼此不同時,也 能夠最小化檢測的錯誤。
通常,提取延伸線段和邊緣線段兩者來產(chǎn)生候選格線,隨后對這些 候選格線進行噪聲消除以產(chǎn)生相應的格線信息,并且將得出的信息集成 到一起。即,并不直接對延伸線段和邊緣線段進行相互比較。當使用邊 緣提取來檢測紋理區(qū)域和實線邊界時,檢測全部的三種候選格線,即一個用于紋理區(qū)域的候選格線和兩個用于實線邊界的候選格線,作為候選 線段。然而,當紋理邊界和實線邊界彼此相鄰時,因為邊緣線段之間的 距離彼此靠近,所以難以對形成實線的一組線段進行關聯(lián)。因而,根據(jù) 現(xiàn)有技術,不能判定要將三個檢測出的邊緣線段中的哪些集成在一起并 轉換成實線。作為另一現(xiàn)有技術,并行地執(zhí)行延伸線段提取模塊和邊緣 線段提取模塊并且將得出的格線提取結果集成在一起的方法也是可行 的。然而,該方法還需要諸如當從相同區(qū)域提取競爭候選格線時選擇一 個候選格線之類的困難判定。如上所述,僅組合現(xiàn)有技術不能實現(xiàn)從多 種類型的格線共存的圖像精確地提取格線。
另一方面,根據(jù)本實施方式,作為延伸線段和邊緣線段的疊加的結 果,延伸線段被夾在兩個邊緣線段之間以被集成到一條實線格線中。因 而,能夠恰當?shù)禺a(chǎn)生實線格線和邊界格線。如上所述,在從候選格線產(chǎn) 生格線信息之前,將延伸線段和邊緣線段相互比較,使得能夠高準確度 地提取多種類型的格線。另外,由于格線產(chǎn)生參數(shù)依照格線類型變化, 所以能夠高準確度地提取格線。
因此,本實施方式的一個目的是準確地檢測由包含在文檔圖像中的 形狀、圖案以及顏色所表達的表格格線。
本實施方式提供用于表格識別裝置的第一表格識別程序,所述表格 識別裝置讀取包含表格的文檔圖像并提取格線。
根據(jù)本實施方式,基于從延伸檢測得出的候選格線與從邊緣檢測得 出的候選格線之間的位置關系來識別格線類型,并且基于對應于格線類 型的條件來檢測格線。因而,能夠準確地檢測由包含在文檔圖像中的形 狀、圖案以及顏色所表達的表格格線。
權利要求
1、一種檢測包含在圖像信息中的邊界線信息的方法,所述圖像信息包括第一狀態(tài)和第二狀態(tài)中的任何一種狀態(tài)下的多個像素,所述方法包括以下步驟檢測連續(xù)布置在所述圖像信息中的第一狀態(tài)下的第一組像素以判定第一線信息,并檢測彼此相鄰布置且由第二狀態(tài)下的像素包圍的第一狀態(tài)下的第二組像素以基于該第二組像素的輪廓來判定邊緣信息;以及基于所述線信息和所述邊緣信息的相對位置與第一組像素和第二組像素的尺寸之間的關系的信息,來判定所述邊界線信息。
2、 根據(jù)權利要求1所述的方法,其中,在所述第一線信息指示長度大于預定值且由所述邊緣信息指示的一對邊緣夾著的線的情況下,判定 所述邊界線信息包括有效邊界線。
3、 根據(jù)權利要求1所述的方法,其中,在所述邊緣信息指示長度大 于預定值且與寬度大于預定值的所述第二組像素相鄰布置的邊緣的情況 下,判定所述邊界線信息指示有效邊界線。
4、 根據(jù)權利要求1所述的方法,其中,在所述邊緣信息指示長度大 于預定值的邊緣的情況下,判定所述邊界線信息包括有效邊界線。
5、 根據(jù)權利要求1所述的方法,其中,當兩個邊界線信息之間的距 離小于預定距離且兩個邊界線信息之間的角度差小于預定角度時,判定 所述邊界線信息包括有效邊界線。
6、 根據(jù)權利要求1所述的方法,所述方法進一步包括以下步驟獲得長度大于預定長度的邊界線信息, 基于平行的成對所述線信息來設置區(qū)域,以及 基于用于判定所述邊界線信息是否被判定包括有效邊界線的所述區(qū) 域的尺寸,來判定所述長度的條件信息。
7、 一種用于檢測包含在圖像信息中的邊界線信息的裝置,所述圖像 信息包括第一狀態(tài)和第二狀態(tài)中的任何一種狀態(tài)下的多個像素,所述裝置包括處理器,其用于根據(jù)處理來執(zhí)行,所述處理包括以下步驟檢測連續(xù)布置在所述圖像信息中的第一狀態(tài)下的第一組像素以判定第一線信息,并檢測彼此相鄰布置并由第二狀態(tài)下的像素包圍的第一狀態(tài)下的第二組像素以基于該第二組像素的輪廓來判定邊緣信息;以及基于所述線信息和所述邊緣信息的相對位置與第一組像素和第二組像素的尺寸之間的關系的信息,來判定所述邊界線信息。
8、 根據(jù)權利要求7所述的裝置,其中,在所述第一線信息指示長度大于預定值且由所述邊緣信息指示的一對邊緣夾著的線的情況下,判定 所述邊界線信息包括有效邊界線。
9、 根據(jù)權利要求7所述的裝置,其中,在所述邊緣信息指示長度大 于預定值且與寬度大于預定值的所述第二組像素相鄰布置的邊緣的情況 下,判定所述邊界線信息指示有效邊界線。
10、 根據(jù)權利要求7所述的裝置,其中,在所述邊緣信息指示長度 大于預定值的邊緣的情況下,判定所述邊界線信息包括有效邊界線。
11、 根據(jù)權利要求7所述的裝置,其中,當兩個邊界線信息之間的 距離小于預定距離且兩個邊界線信息之間的角度差小于預定角度時,判 定所述邊界線信息包括有效邊界線。
12、 根據(jù)權利要求7所述的裝置,所述處理進一步包括以下步驟 獲得長度大于預定長度的邊界線信息, 基于平行的成對的所述線信息來設置區(qū)域,以及 基于用于判定所述邊界線信息是否被判定包括有效邊界線的所述區(qū)域的尺寸,來判定所述長度的條件信息。全文摘要
本發(fā)明涉及用于識別圖像信息中的邊界線的方法和裝置。根據(jù)本實施方式的一個方面,提供一種檢測包含在圖像信息中的邊界線信息的方法,所述圖像信息包括在第一狀態(tài)和第二狀態(tài)中的任一狀態(tài)下的多個像素,所述方法包括以下步驟檢測連續(xù)布置在所述圖像信息中的第一狀態(tài)下的第一組像素以判定第一線信息,并檢測彼此相鄰布置并由第二狀態(tài)下的像素包圍的第一狀態(tài)下的第二組像素以基于該第二組像素的輪廓來判定邊緣信息;以及基于所述線信息和所述邊緣信息的相對位置與第一和第二組像素的尺寸之間的關系的信息,來判定邊界線信息。
文檔編號G06K9/20GK101246549SQ20081000556
公開日2008年8月20日 申請日期2008年2月15日 優(yōu)先權日2007年2月16日
發(fā)明者中島健次, 武部浩明, 田中宏, 皆川明洋, 藤本克仁 申請人:富士通株式會社