專利名稱:一種表格識別處理方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像處理領(lǐng)域,尤其涉及一種表格識別處理方法及系統(tǒng)。
背景技術(shù):
表格是文檔中常用的數(shù)據(jù)資料載體,目前,表格在日常工作生活中得到廣泛應(yīng)用, 大量的文檔信息以簡明的信息表達方式即表格形式存在,特別是IT、銀行、金融等行業(yè),每 天要處理的表格數(shù)量驚人,如果這些表格都能由計算機來處理,將會大大提高工作效率。表 格的自動輸入、存儲、管理已經(jīng)成為文檔智能處理領(lǐng)域的一個重要組成部分,表格的分析與 識別是計算機文檔處理中的一個重要項目,廣泛應(yīng)用于各種場合,例如商業(yè)和政府機構(gòu),表 格識別具有很高的研究和應(yīng)用價值。目前存在的表格識別系統(tǒng)可分為兩類1、不受限表格識別識別前沒有表格的結(jié)構(gòu)信息,主要通過對表格圖片進行表格 結(jié)構(gòu)分析,得到表格的結(jié)構(gòu)后再進行字符提取并識別。算法復(fù)雜,效果受圖象質(zhì)量影響很明 顯,檢測錯誤率高,并且目前還不存在通用的算法。2、受限表格識別識別前得到表格的結(jié)構(gòu)信息,然后利用這些信息指導(dǎo)識別,這種 結(jié)構(gòu)已知的表格被稱為受限表格。受限表格識別可以大大提高計算機識別表格的準(zhǔn)確率和 速度,但識別的表格格式固定,通常只有幾種,想增加表格格式比較困難。綜上所述,現(xiàn)有技術(shù)能夠識別的表格類型較少,且存在準(zhǔn)確率較低、速度較慢的問 題。另外,大部分表格識別方法都局限于采用掃描儀采集表格圖片,成本高,給表格識別工 作帶來不便。
發(fā)明內(nèi)容
本發(fā)明實施例的目的在于提供一種表格識別處理方法,旨在解決現(xiàn)有方案能夠識 別的表格類型較少的問題。本發(fā)明實施例是這樣實現(xiàn)的,一種表格識別處理方法,包括以下步驟獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu);根據(jù)所述表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)提取所述表格圖片中的字符圖片;對所述字符圖片進行字符識別,獲取字符圖片的識別結(jié)果;根據(jù)所述表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)繪制所述表格圖片對應(yīng)的表格,并將所述字符 圖片的識別結(jié)果保存在所述表格中相應(yīng)的表格單元。本發(fā)明實施例的另一目的在于提供一種表格識別處理系統(tǒng),系統(tǒng)包括數(shù)據(jù)結(jié)構(gòu)獲取單元,用于獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu);字符圖片提取單元,用于根據(jù)所述數(shù)據(jù)結(jié)構(gòu)獲取單元獲取的表格圖片對應(yīng)的數(shù)據(jù) 結(jié)構(gòu)提取所述表格圖片中的字符圖片;字符識別單元,用于對所述字符圖片提取單元提取的字符圖片進行字符識別,獲 取字符圖片的識別結(jié)果;
4
后處理單元,用于根據(jù)所述數(shù)據(jù)結(jié)構(gòu)獲取單元獲取的表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)繪 制所述表格圖片對應(yīng)的表格,并將所述字符識別單元獲取的字符圖片的識別結(jié)果保存在所 述表格中相應(yīng)的表格單元。本發(fā)明通過設(shè)置表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu),根據(jù)表格圖片對應(yīng)的表格類型獲取表 格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu),根據(jù)表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)提取表格圖片中的字符圖片,對字 符圖片進行字符識別,獲取字符圖片的識別結(jié)果后輸出表格圖片的識別結(jié)果。本發(fā)明實施 例通過設(shè)置多種表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)了多種表格類型的表格識別,大大增加了可 識別的表格類型,且準(zhǔn)確率高、速度快,具有很強的實用性。
圖1是本發(fā)明實施例提供的表格識別處理方法的流程圖;圖2是本發(fā)明實施例提供的表格圖片定位的流程圖;圖3是本發(fā)明一個示例提供的目標(biāo)定位標(biāo)識的示意圖;圖4是本發(fā)明實施例提供的獲取表格圖片對應(yīng)的表格類型的流程圖;圖5是本發(fā)明一個示例提供的表格圖片對應(yīng)的鑒定區(qū)域的示意圖;圖6是本發(fā)明實施例提供的提取字符圖片的流程圖;圖7是本發(fā)明實施例提供的表格單元結(jié)構(gòu)的示意圖;圖8是本發(fā)明實施例提供的表格識別的后處理的流程圖;圖9是本發(fā)明實施例提供的表格識別處理系統(tǒng)的結(jié)構(gòu)圖;圖10是本發(fā)明實施例提供的表格圖片采集系統(tǒng)的硬件結(jié)構(gòu)示意圖。
具體實施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對 本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。本發(fā)明通過預(yù)設(shè)多種表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu),根據(jù)表格圖片對應(yīng)的表格類型獲 取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu),根據(jù)表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)提取表格圖片中的字符圖片, 對字符圖片進行字符識別,獲取字符圖片的識別結(jié)果后輸出表格圖片的識別結(jié)果,實現(xiàn)了 多種表格類型的表格識別。圖1示出了本發(fā)明實施例提供的表格識別處理的流程。在步驟SlOl中,獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu);在步驟S102中,根據(jù)表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)提取表格圖片中的字符圖片;在步驟S103中,對字符圖片進行字符識別,獲取字符圖片的識別結(jié)果;在步驟S104中,根據(jù)表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)繪制表格圖片對應(yīng)的表格,并將字 符圖片的識別結(jié)果保存在表格中相應(yīng)的單元格。在本發(fā)明實施例中,一般采用掃描儀器或30萬以上的普通攝像頭采集表格圖片, 并保存成一定格式的圖像數(shù)據(jù)文件,通過有線傳輸方式或傳輸線傳到運行本系統(tǒng)的設(shè)備 上。在步驟SlOl之前,為了能夠在包含表格圖片的采集圖片上定位出表格圖片的區(qū)域,在獲取表格圖片對應(yīng)的表格類型的步驟之前,需要對表格圖片進行表格定位。圖2示出了本發(fā)明實施例提供的表格圖片定位的處理流程。在本發(fā)明實施例中,采集表格圖片前,在表格的固定相對位置上預(yù)先設(shè)置有定位 標(biāo)識,例如可以在表格的邊上或角上設(shè)置定位標(biāo)識,定位標(biāo)識可以是具有相同灰度值的圓 形或三角形或四邊形,當(dāng)然也可以是其他幾何形狀,大小可以根據(jù)需要進行設(shè)置,定位標(biāo)識 的個數(shù)至少為2,多個定位標(biāo)識可以相同也可以不同,在此不再一一列舉,通常為了統(tǒng)一處 理,所有表格和定位標(biāo)識的相對位置,以及定位標(biāo)識的圖案均一致,在本發(fā)明實施例中,通 過搜索采集的表格圖片中定位標(biāo)識的位置,根據(jù)定位標(biāo)識和表格的預(yù)知的相對位置關(guān)系可 以確定表格圖片中的表格區(qū)域?qū)崿F(xiàn)表格定位,步驟具體為在步驟S201中,采集表格圖片。在步驟S202中,模板匹配運算,獲取目標(biāo)定位標(biāo)識的位置。將作為模板的定位標(biāo)識最為參考定位標(biāo)識,在采集的表格圖片上以預(yù)設(shè)間隔從上 到下、從左到右進行灰度值模板匹配,獲取與參考定位標(biāo)識相似度最大匹配結(jié)果作為目標(biāo) 定位標(biāo)識,并獲取目標(biāo)定位標(biāo)識的位置。在步驟S203中,根據(jù)目標(biāo)定位標(biāo)識的位置定位表格圖片。其中,灰度值模板匹配的運算公式如下 公式中,r表示相似度,T(x, y)為參考定位標(biāo)識的灰度圖片,I (x, y)為表格圖片 中等于模板大小的灰度圖片,MXN為模板大小即參考定位標(biāo)識的灰度圖片的大小,當(dāng)r取 最大值時,對應(yīng)的I (x,y)為目標(biāo)定位標(biāo)識的灰度圖片。上述搜索目標(biāo)定位標(biāo)識的預(yù)設(shè)間隔 為一個像素點,為了達到精確定位的效果,上次定位過程可以重復(fù)多次。作為本發(fā)明第一較佳實施例,在進行表格定位之前,為了使表格圖片的表格定位 效果更好,針對表格圖像采集的不同效果,需要對表格圖像進行相關(guān)預(yù)處理,包括1)畸變矯正在本發(fā)明實施例中,表格圖片的采集主要采用兩種采集方式,對于掃描儀掃描的 表格圖片,由于其基本不存在畸變,可不進行畸變矯正處理,而對于攝像頭采集的表格圖 片,由于光學(xué)鏡頭的缺陷,會存在桶形畸變或枕形畸變,所以必須要進行畸變矯正。可根據(jù) 如下公式進行矯正b = M*x其中,b為矯正后的表格圖片的像素值,M為待矯正的畸變表格圖片的像素值,χ為 畸變調(diào)整系數(shù)。2) 二值化處理針對表格圖片的特點,在本發(fā)明實施例中,采用最大類間方差二值化算法對矯正 后的表格圖片進行處理,處理后的表格圖片有效的過濾掉了噪聲,并突出了表格圖片中的 線條與內(nèi)容。作為本發(fā)明第二較佳實施例,在完成表格圖片定位之后,由于定位的表格圖片會
6出現(xiàn)角度傾斜和大小不一的情況,對字符圖片的識別的影響較大,因此需要對表格定位后 的表格圖片進行標(biāo)準(zhǔn)化處理。在本發(fā)明實施例中,根據(jù)上述表格定位獲取的目標(biāo)定位標(biāo)識的位置,對表格圖片 進行標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化處理的內(nèi)容包括傾斜矯正和大小歸一化,例如圖3示出了本發(fā)明 一個示例提供的目標(biāo)定位標(biāo)識的示意圖,圖中四個目標(biāo)定位標(biāo)識分別處于表格圖片中表格 的四個邊角上時,通過表格定位獲取的目標(biāo)定位標(biāo)識的位置計算表格圖片的傾斜角度,根 據(jù)傾斜角度對表格圖片進行旋轉(zhuǎn)、雙線性插值完成表格圖片的傾斜校正,并以目標(biāo)定位標(biāo) 識作為邊角對校正后的表格圖片進行分割,最后,再將分割后的表格圖片的大小縮放到預(yù) 設(shè)的標(biāo)準(zhǔn)大小。在執(zhí)行步驟SlOl時,其具體實現(xiàn)步驟進一步包括獲取表格圖片對應(yīng)的表格類 型;根據(jù)表格圖片對應(yīng)的表格類型和預(yù)設(shè)的表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu)獲取表格圖片對應(yīng)的 數(shù)據(jù)結(jié)構(gòu)。其中,表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu)通過設(shè)置后保存在數(shù)據(jù)庫中,不同表格類型對 應(yīng)的數(shù)據(jù)結(jié)構(gòu)不同,且表格圖片對應(yīng)的表格類型可以是預(yù)知的,也可以根據(jù)表格圖片中的 目標(biāo)定位標(biāo)識確定。在通過定位標(biāo)識確定表格圖片對應(yīng)的表格類型時,需要預(yù)設(shè)的內(nèi)容包 括鑒定區(qū)域相對于目標(biāo)定位標(biāo)識的位置、鑒定區(qū)域的特征提取方式和特征值對應(yīng)的表格 類型。圖4示出了本發(fā)明實施例提供的獲取表格圖片對應(yīng)的表格類型的處理流程。在步驟S401中,根據(jù)目標(biāo)定位標(biāo)識在表格圖片中的位置和預(yù)設(shè)的鑒定區(qū)域相對 于目標(biāo)定位標(biāo)識的位置獲取表格圖片的鑒定區(qū)域;在步驟S402中,根據(jù)表格圖片的鑒定區(qū)域和預(yù)設(shè)的鑒定區(qū)域的特征提取方式獲 取表格圖片對應(yīng)的特征值;在步驟S403中,根據(jù)表格圖片對應(yīng)的特征值和預(yù)設(shè)的特征值對應(yīng)的表格類型獲 取表格圖片對應(yīng)的表格類型。在本發(fā)明實施例中,通過獲取表格圖片的鑒定區(qū)域?qū)?yīng)的特征值和預(yù)設(shè)的特征值 對應(yīng)的表格類型確定表格圖片對應(yīng)的表格類型,例如可以將鑒定區(qū)域默認為表格圖片中 目標(biāo)定位標(biāo)識的固定相對位置上,鑒定區(qū)域可以是長方形或者其他形狀二值圖片,鑒定區(qū) 域的特征提取方式可以是將鑒定區(qū)域劃分為8個相等大小的段區(qū)域,提取每個段區(qū)域?qū)?yīng) 的灰度特征,則鑒定區(qū)域?qū)?yīng)的特征值是每個段區(qū)域?qū)?yīng)的灰度值,具體操作時,還可以對 鑒定區(qū)域劃分的段區(qū)間分別進行標(biāo)號,如果鑒定區(qū)域是二值圖片,獲取每個段區(qū)域?qū)?yīng)的 灰度值,黑色表示1,白色表示0,當(dāng)段區(qū)域中有黑色又有白色時,取比重大者,8個標(biāo)號的段 區(qū)間對應(yīng)的灰度值構(gòu)成了一個字節(jié)大小的值即鑒定區(qū)域的特征值,此時可以得到,特征值 對應(yīng)的表格類型有256種。當(dāng)然還可以有其他方式,具體不再舉例。當(dāng)表格圖片對應(yīng)的鑒定區(qū)域有8個區(qū)間時,圖5示出了本發(fā)明一個示例提供的表 格圖片對應(yīng)的鑒定區(qū)域的示意圖。圖中鑒定區(qū)域?qū)?yīng)的特征值為01000110。在本發(fā)明實施例中,表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)包括表格的數(shù)據(jù)結(jié)構(gòu),線段的數(shù)據(jù) 結(jié)構(gòu)和表格單元的數(shù)據(jù)結(jié)構(gòu),具體包括表格的左上角坐標(biāo)、長度、寬度、內(nèi)線線寬和外線線 寬,表格單元的左上角坐標(biāo)、長度、寬度、和線寬。數(shù)據(jù)結(jié)構(gòu)還可以是線段的起點坐標(biāo)、終點 坐標(biāo)和線寬。在具體應(yīng)用時,數(shù)據(jù)結(jié)構(gòu)根據(jù)表格類型的不同而不同。下面是本發(fā)明實施例確定表格圖片對應(yīng)的表格類型后,根據(jù)表格類型提取獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)相關(guān)程序表格的數(shù)據(jù)結(jié)構(gòu)如下typedef struct FForm{CPoint fleftTop ;//表格的左上角坐標(biāo)int fLength ;// 表格的長度int fHeight ;// 表格的高度int fWidth_out ;//表格外線的寬度int fWidth_inner ;//表格內(nèi)線的寬度FLine^pLine ;//指向直線鏈表的指針FCell*pCell ;//指向待提取字符的表格單元的指針};線段的數(shù)據(jù)結(jié)構(gòu)如下Struct FLine{CPoint startPoint ;// 直線開始點CPoint endPoint ;// 直線結(jié)束點Int Lwidth ;//直線線寬FLine^next ;};表格單元的數(shù)據(jù)結(jié)構(gòu)如下struct FCell{CPoint IeftTop ;//表格單元的左上角坐標(biāo)int Length ;//表格單元的長度int Height ;//表格單元的高度int Lwidth[4] ;//表格單元四周的線寬struct FCell*next ;//指向下一個表格單元};圖6示出了本發(fā)明實施例提供的提取字符圖片的處理流程。在步驟S601中,根據(jù)表格圖片對應(yīng)的表格類型,從數(shù)據(jù)庫中提取該表格類型對應(yīng) 的數(shù)據(jù)結(jié)構(gòu)信息。其中數(shù)據(jù)結(jié)構(gòu)信息的內(nèi)容在此不再贅述。在步驟S602中,根據(jù)字符圖片在表格圖片中的相對坐標(biāo)值,獲取數(shù)據(jù)結(jié)構(gòu)信息中 表格中相對坐標(biāo)值的表格單元信息,根據(jù)該表格單元信息獲取表格單元大小,在表格圖片 中相對坐標(biāo)值的位置上提取表格單元大小的圖片。在步驟S603中,判斷是否還有字符圖片沒有提取,如果沒有,則結(jié)束,否則返回步 驟 S602。作為本發(fā)明第三較佳實施例,由于旋轉(zhuǎn)的誤差,歸一化之后的表格圖片與標(biāo)準(zhǔn)表 格圖片必然存在微小的誤差,為了精確提取字符圖片,需要對初步提取的字符圖片進行邊 框處理,即在表格單元里面設(shè)置一個淺灰度的邊框線,工作人員在填寫表格時盡量控制在淺灰度邊框內(nèi),可以保證填寫的字符不會超出表格單元的范圍。并且,在該灰色邊框線可以 在二值化的時候比較容易去掉,不會對其他識別步驟造成影響。圖7示出了本發(fā)明實施例提供的表格單元結(jié)構(gòu)的示意圖。表格單元包括不同灰度 值的內(nèi)框和外框,其中,內(nèi)框的灰度值比外框的灰度值大,兩者的差異需要足夠大才能達到 預(yù)期的效果,具體應(yīng)用時,內(nèi)框和外框的灰度值可以根據(jù)需要設(shè)定。在步驟S103中,表格單元中填寫的字符除了數(shù)字與英文字符,還可能會存在少數(shù) 幾個漢字,為了得到較好的表格識別結(jié)果,本發(fā)明實施例采用現(xiàn)在較為成熟的支持矢量機 (Support Vector Machines, SVM)分類器對字符圖片進行字符識別,得到字符圖片的識別 結(jié)果。在步驟S104中,根據(jù)字符識別結(jié)果輸出表格圖片的識別結(jié)果是表格識別的后處 理階段,表格圖片的識別結(jié)果可以表示為圖片形式或者EXCEL形式,其中,圖片形式的表格 圖片的識別結(jié)果的獲取過程可以是根據(jù)數(shù)據(jù)結(jié)構(gòu)的線段信息,先繪制表格,再根據(jù)字符圖 片的識別結(jié)果填入到繪制的表格相應(yīng)的位置。圖8示出了本發(fā)明實施例提供的表格識別的后處理的流程。在本發(fā)明實施例中,得到的整個表格圖片的識別結(jié)果為EXCEL形式,數(shù)據(jù)結(jié)構(gòu)包 括線段信息和坐標(biāo)信息,其中,線段分為水平線段、垂直線段和對角線三類。在步驟S801中,將線段分類后按不同方向進行排序。水平線段為一類,從上到下排序;垂直線段為一類,從左到右排序;斜線為一類, 以左上角為標(biāo)準(zhǔn),從上到下,左到右排序。在步驟S802中,根據(jù)排序后的線段繪制表格圖片對應(yīng)的表格。相鄰水平線段之間為一行,根據(jù)行排序構(gòu)建行。相鄰垂直線段之間為一列,根據(jù)構(gòu) 建的行和列排序構(gòu)建列。當(dāng)表格有斜線時,根據(jù)行、列和斜線排序分解行和列構(gòu)成的表格單 元,繪制斜線。在步驟S803中,在表格中相應(yīng)的表格單元中填寫字符圖片的識別結(jié)果。根據(jù)字符圖片對應(yīng)的坐標(biāo),以及繪制表格水平線段與垂直線段的交叉點坐標(biāo),確 定字符圖片的識別結(jié)果在EXCEL對應(yīng)的表格單元,將字符圖片的識別結(jié)果保存該表格單元 中。在本發(fā)明實施例中,表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu),以及特征值對應(yīng)的表格類型可以 通過構(gòu)建的數(shù)據(jù)庫得到支持,針對不同的表格類型,用戶可以設(shè)置不同的數(shù)據(jù)結(jié)構(gòu)。圖9示出了本發(fā)明實施例提供的表格識別處理系統(tǒng)的結(jié)構(gòu)。表格識別處理系統(tǒng)主要包括數(shù)據(jù)結(jié)構(gòu)獲取單元91、字符圖片提取單元92、字符識 別單元93和后處理單元94。數(shù)據(jù)結(jié)構(gòu)獲取單元91獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu),字符圖片提取單元92根據(jù) 數(shù)據(jù)獲取設(shè)置單元91獲取的表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)提取表格圖片中的字符圖片,字符 識別單元93根據(jù)字符圖片提取單元92提取的字符圖片提取的字符圖片進行字符識別,獲 取字符圖片的識別結(jié)果,后處理單元94根據(jù)數(shù)據(jù)結(jié)構(gòu)獲取單元91獲取的表格圖片對應(yīng)的 數(shù)據(jù)結(jié)構(gòu)繪制表格圖片對應(yīng)的表格,并將字符識別單元93獲取的字符圖片的識別結(jié)果保 存在表格中相應(yīng)的表格單元,其具體實現(xiàn)過程如上所述,在此不再贅述。針對存在的各種表格識別系統(tǒng)或各種光學(xué)字符識別(Optical
9CharacterRecognition, OCR)系統(tǒng)所存在的問題,為了保證識別效果可以使用掃描儀進行 表格圖片的采集,此時表格圖片不存在畸變,為字符分解提供方便,但也限制了系統(tǒng)的使用 范圍,攜帶不方便,成本高。在本發(fā)明實施例中,還可以采用攝像頭進行表格圖片采集。圖10示出了本發(fā)明實施例提供的表格圖片采集系統(tǒng)的硬件結(jié)構(gòu)示意圖。在本發(fā)明實施例中,表格圖片采集系統(tǒng)的硬件結(jié)構(gòu)包括攝像頭11和與攝像頭11 平行相對的平臺12,此時,將待識別的表格平放在平臺12上即可進行表格識別,硬件結(jié)構(gòu) 還可以只是掃描儀13,為了同時滿足表格識別的不同需要,硬件結(jié)構(gòu)可以同時包括攝像頭 11、與攝像頭11平行相對的平臺12和掃描儀13,此時,將待識別的表格平放在平臺12或者 掃描儀上13即可進行表格識別。表格識別處理系統(tǒng)還包括定位單元,定位單元進一步包括采集模塊,采集表格圖片;模板匹配模塊,以參考定位標(biāo)識為模板,在采集模塊采集的表格圖片上以預(yù)設(shè)間 隔從上到下、從左到右的進行灰度值模板匹配,獲取與參考定位標(biāo)識相似度最大的匹配結(jié) 果作為目標(biāo)定位標(biāo)識,并獲取目標(biāo)定位標(biāo)識的位置;表格圖片定位模塊,根據(jù)模板匹配模塊獲取的目標(biāo)定位標(biāo)識的位置進行表格定 位,其具體實現(xiàn)過程如上所述,在此不再贅述。由于定位出的表格圖片會出現(xiàn)角度傾斜和大小不一的情況,對字符識別的影響較 大,因此需要對定位后的表格圖片進行標(biāo)準(zhǔn)化處理,此時,表格識別處理系統(tǒng)還包括標(biāo)準(zhǔn)化單元,根據(jù)模板匹配模塊獲取的目標(biāo)定位標(biāo)識的位置對表格圖片進行標(biāo)準(zhǔn) 化處理,標(biāo)準(zhǔn)化處理包括傾斜矯正和大小歸一化。其具體實現(xiàn)過程如上所述,在此不再贅 述。在本發(fā)明實施例中,表格識別處理系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)獲取單元91進一步包括表格類型獲取模塊,用于獲取表格圖片對應(yīng)的表格類型;數(shù)據(jù)結(jié)構(gòu)設(shè)置模塊,用于設(shè)置表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu);數(shù)據(jù)結(jié)構(gòu)獲取模塊,用于根據(jù)表格類型獲取模塊獲取的表格圖片對應(yīng)的表格類型 和數(shù)據(jù)結(jié)構(gòu)設(shè)置模塊預(yù)設(shè)的表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu)獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)。其中,根據(jù)表格圖片對應(yīng)的表格類型獲取表格圖片對應(yīng)的表格類型的具體過程如 上所述,在此不再贅述。在本發(fā)明實施例中,表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)包括表格的左上角坐標(biāo)、長度、寬 度、內(nèi)線線寬和外線線寬,表格單元的左上角坐標(biāo)、長度、寬度、和線寬。數(shù)據(jù)結(jié)構(gòu)還可以是 線段的起點坐標(biāo)、終點坐標(biāo)和線寬。另外,表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu),以及特征值對應(yīng)的表 格類型可以通過構(gòu)建的數(shù)據(jù)庫得到支持,針對不同的表格類型,用戶可以設(shè)置不同的數(shù)據(jù) 結(jié)構(gòu)。在本發(fā)明實施例中,本發(fā)明通過設(shè)置表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu),根據(jù)表格圖片對 應(yīng)的表格類型獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu),根據(jù)表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)提取表格圖片 中的字符圖片,對字符圖片進行字符識別,獲取字符圖片的識別結(jié)果后輸出表格圖片的識 別結(jié)果。本發(fā)明實施例通過設(shè)置多種表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)了多種表格類型的表格 識別,通過數(shù)據(jù)庫支持,可以隨意增加識別表格種類,識別準(zhǔn)確率高和速度快,大大擴展了 可識別的表格類型,實現(xiàn)簡單設(shè)備,成本低,可運行在各種設(shè)備上,并且準(zhǔn)確率高,速度快,用戶可在采集表格圖片后1秒鐘之內(nèi)看到識別的結(jié)果,并保存在存儲設(shè)備上,具有很強的 實用性。 以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
一種表格識別處理方法,其特征在于,所述方法包括以下步驟獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu);根據(jù)所述表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)提取所述表格圖片中的字符圖片;對所述字符圖片進行字符識別,獲取字符圖片的識別結(jié)果;根據(jù)所述表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)繪制所述表格圖片對應(yīng)的表格,并將所述字符圖片的識別結(jié)果保存在所述表格中相應(yīng)的表格單元。
2.如權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)結(jié)構(gòu)包括表格的左上角坐標(biāo)、長 度、寬度、內(nèi)線和外線線寬,所述表格單元的左上角坐標(biāo)、長度、寬度和線寬。
3.如權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)結(jié)構(gòu)包括線段的起點坐標(biāo)、終點坐 標(biāo)和線寬。
4.如權(quán)利要求1所述的方法,其特征在于,所述獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)的步驟 之前,所述方法還包括對所述表格圖片進行表格定位,其步驟具體為采集表格圖片;以參考定位標(biāo)識為模板,在所述采集的表格圖片上以預(yù)設(shè)間隔從上到下、從左到右進 行灰度值模板匹配,獲取與所述參考定位標(biāo)識相似度最大的匹配結(jié)果作為目標(biāo)定位標(biāo)識, 并獲取所述目標(biāo)定位標(biāo)識的位置;根據(jù)所述目標(biāo)定位標(biāo)識的位置進行表格定位。
5.如權(quán)利要求4所述的方法,其特征在于,在所述根據(jù)目標(biāo)定位標(biāo)識的位置進行表格 定位的步驟之后,所述方法還包括根據(jù)所述目標(biāo)定位標(biāo)識對所述表格圖片進行標(biāo)準(zhǔn)化處理,所述標(biāo)準(zhǔn)化處理包括傾斜矯 正和大小歸一化。
6.如權(quán)利要求1所述的方法,其特征在于,所述獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)的步驟 具體為獲取表格圖片對應(yīng)的表格類型;根據(jù)所述表格圖片對應(yīng)的表格類型和預(yù)設(shè)的表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu)獲取所述表格 圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)。
7.如權(quán)利要求6所述的方法,其特征在于,所述獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)的步驟 具體為獲取表格圖片對應(yīng)的表格類型;根據(jù)所述表格圖片對應(yīng)的表格類型和預(yù)設(shè)的表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu)獲取所述表格 圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu);所述獲取表格圖片對應(yīng)的表格類型的步驟具體為根據(jù)所述目標(biāo)定位標(biāo)識在所述表格圖片中的位置和預(yù)設(shè)的鑒定區(qū)域相對于目標(biāo)定位 標(biāo)識的位置獲取所述表格圖片的鑒定區(qū)域;根據(jù)所述表格圖片的鑒定區(qū)域和預(yù)設(shè)的鑒定區(qū)域的特征提取方式獲取所述表格圖片 對應(yīng)的特征值;根據(jù)所述表格圖片對應(yīng)的特征值和預(yù)設(shè)的特征值對應(yīng)的表格類型獲取所述表格圖片 對應(yīng)的表格類型。
8.如權(quán)利要求4所述的方法,其特征在于,所述定位標(biāo)識是具有相同灰度值的圓形或 三角形或四邊形,所述目標(biāo)定位標(biāo)識的個數(shù)至少為2。
9.如權(quán)利要求7所述的方法,其特征在于,所述表格圖片對應(yīng)的特征值的個數(shù)至少為 1,所述特征值等于0或1。
10.一種表格識別處理系統(tǒng),其特征在于,所述系統(tǒng)包括數(shù)據(jù)結(jié)構(gòu)獲取單元,用于獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu);字符圖片提取單元,用于根據(jù)所述數(shù)據(jù)結(jié)構(gòu)獲取單元獲取的表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu) 提取所述表格圖片中的字符圖片;字符識別單元,用于對所述字符識別單元提取的字符圖片進行字符識別,獲取字符圖 片的識別結(jié)果;后處理單元,用于根據(jù)所述數(shù)據(jù)結(jié)構(gòu)獲取單元獲取的表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)繪制所 述表格圖片對應(yīng)的表格,并將所述字符識別單元獲取的字符圖片的識別結(jié)果保存在所述表 格中相應(yīng)的表格單元。
11.如權(quán)利要求10所述的系統(tǒng),其特征在于,系統(tǒng)還包括定位單元,所述定位單元進一 步包括采集模塊,用于采集表格圖片;模板匹配模塊,用于以參考定位標(biāo)識為模板,在所述采集模塊采集的表格圖片上以預(yù) 設(shè)間隔從上到下、從左到右的進行灰度值模板匹配,獲取與所述參考定位標(biāo)識相似度最大 的匹配結(jié)果作為目標(biāo)定位標(biāo)識,并獲取所述目標(biāo)定位標(biāo)識的位置;表格圖片定位模塊,用于根據(jù)所述模板匹配模塊獲取的目標(biāo)定位標(biāo)識的位置進行表格 定位。
12.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括標(biāo)準(zhǔn)化單元,用于根據(jù)所述模板匹配模塊獲取的目標(biāo)定位標(biāo)識的位置對所述表格圖片 進行標(biāo)準(zhǔn)化處理,所述標(biāo)準(zhǔn)化處理包括傾斜矯正和大小歸一化。
13.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述數(shù)據(jù)結(jié)構(gòu)獲取單元進一步包括表格類型獲取模塊,用于獲取表格圖片對應(yīng)的表格類型;數(shù)據(jù)結(jié)構(gòu)設(shè)置模塊,用于設(shè)置表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu);數(shù)據(jù)結(jié)構(gòu)獲取模塊,用于根據(jù)所述表格類型獲取模塊獲取的表格圖片對應(yīng)的表格類型 和所述數(shù)據(jù)結(jié)構(gòu)設(shè)置模塊預(yù)設(shè)的表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu)獲取所述表格圖片對應(yīng)的數(shù)據(jù) 結(jié)構(gòu)。
14.如權(quán)利要求10至13中任意一項所述的系統(tǒng),其特征在于,所述數(shù)據(jù)結(jié)構(gòu)包括表格 的左上角坐標(biāo)、長度、寬度、內(nèi)線線寬和外線線寬,所述表格單元的左上角坐標(biāo)、長度、寬度 和線寬。
15.如權(quán)利要求10至13中任意一項所述的系統(tǒng),其特征在于,所述數(shù)據(jù)結(jié)構(gòu)包括線段 的起點坐標(biāo)、終點坐標(biāo)和線寬。
全文摘要
本發(fā)明適用于圖像處理領(lǐng)域,提供了一種表格識別處理方法及系統(tǒng),該方法包括以下步驟獲取表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu);根據(jù)所述表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)提取所述表格圖片中的字符圖片;對所述字符圖片進行字符識別,獲取字符圖片的識別結(jié)果;根據(jù)所述表格圖片對應(yīng)的數(shù)據(jù)結(jié)構(gòu)繪制所述表格圖片對應(yīng)的表格,并將所述字符圖片的識別結(jié)果保存在所述表格中相應(yīng)的表格單元。本發(fā)明實施例通過設(shè)置多種表格類型對應(yīng)的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)了多種表格類型的表格識別,使可用于表格識別的表格數(shù)量大大增加,且識別率較高、速度較快,具有很強的實用性。
文檔編號G06K9/20GK101908136SQ20091010784
公開日2010年12月8日 申請日期2009年6月8日 優(yōu)先權(quán)日2009年6月8日
發(fā)明者徐濤, 符馬宏 申請人:比亞迪股份有限公司