專利名稱:試卷卷面表格自動(dòng)檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種表格自動(dòng)檢測(cè)方法,具體是一種試巻巻面表格自動(dòng)檢測(cè)的方法。
背景技術(shù):
在教學(xué)過(guò)程中,試巻作為一種重要的教學(xué)評(píng)估手段廣泛的應(yīng)用于各類學(xué)校中,然 而教師需要花費(fèi)大量的時(shí)間對(duì)試巻巻面信息進(jìn)行處理和統(tǒng)計(jì)。如何對(duì)如此大量的試巻 中的信息進(jìn)行自動(dòng)錄入和處理,是目前面臨的難題。因此,對(duì)試巻巻面信息自動(dòng)錄入 和處理具有很大的研究?jī)r(jià)值和應(yīng)用前景。表格是試巻巻面中信息的主要表達(dá)方式,大 量的表格信息的輸入計(jì)算機(jī)成為困擾人們的一種繁瑣工作,直接影響試巻巻面信息的 錄入和處理效率。因此,對(duì)試巻巻面表格自動(dòng)檢測(cè)的研究具有很重要的意義。當(dāng)今國(guó)內(nèi)外流行的表格自動(dòng)閱讀機(jī)都是采用一種特定顏色或特制墨水印制表格 線和固定欄,使用者用另一種顏色填寫,在掃描時(shí)濾去表格線和固定欄,這種方法簡(jiǎn) 單,但不能處理大量的普通紙張表格。而且不能自動(dòng)提取表格的結(jié)構(gòu)信息,它實(shí)際上 避開了表格圖象分折問(wèn)題。直接對(duì)表格圖像進(jìn)行分析,不但能夠快速處理圖象數(shù)據(jù), 而且能夠容忍圖象輕微傾斜和少量斷線虛線,允許字符跨過(guò)和粘連表格線。目前,對(duì)表格圖像進(jìn)行分析的方法主要有投影法和點(diǎn)搜索法。前者通過(guò)求取水 平和垂直方向的投影峰值來(lái)判斷表格線,但是如果表格線本身較短或較細(xì)且具有輕微 傾斜,可能在表格線處不能形成峰值,這樣就很難準(zhǔn)確的檢測(cè)出表格。后者通過(guò)跟蹤 圖象的邊緣點(diǎn)來(lái)獲得表格輪廓,然而它對(duì)于斷線、表格線與字符粘連不能獲得滿意結(jié) 果。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種準(zhǔn)確、高效,易于實(shí)現(xiàn)的試巻 巻面表格自動(dòng)檢測(cè)方法,滿足實(shí)際應(yīng)用的需求。 為了達(dá)到上述目的,本發(fā)明的構(gòu)思是對(duì)試巻巻面圖像進(jìn)行預(yù)處理和細(xì)化,利用Hough變換找出試巻巻面圖像的傾斜 角度,同時(shí)抽取出試巻巻面中水平和垂直的表格線段,結(jié)合上述傾斜角度,把水平和 垂直線段組合成表格,最終達(dá)到檢測(cè)試巻巻面表格的目的。本發(fā)明利用了計(jì)算機(jī)處理領(lǐng)域的模式識(shí)別技術(shù)和圖像處理技術(shù),能夠?qū)A斜的試巻巻面圖像進(jìn)行處理,并且利用了圖像處理算法,能夠快速、準(zhǔn)確的檢測(cè)出試巻巻面 圖像中的表格。該方法容易實(shí)現(xiàn),并具有較高的可靠性和準(zhǔn)確率。 根據(jù)上述的發(fā)明構(gòu)思,本發(fā)明是采用以下技術(shù)方案來(lái)實(shí)現(xiàn)的一種試巻巻面表格自動(dòng)檢測(cè)方法,其特征在于通過(guò)攝像頭獲取實(shí)時(shí)試巻巻面圖 像,經(jīng)過(guò)預(yù)處理和細(xì)化后,利用Hough變換找出巻面圖像的傾斜角度,然后抽取出 試巻巻面中的水平和垂直線段,最后結(jié)合傾斜角度把水平和垂直線段組合成表格;其 具體操作步驟如下-(1) 利用Hough變換找出傾斜角度的步驟① 輸入樣本將試巻巻面圖象由攝像頭和圖象采集卡經(jīng)模數(shù)轉(zhuǎn)換后輸入計(jì)算機(jī);② 預(yù)處理計(jì)算機(jī)對(duì)得到的實(shí)時(shí)試巻圖象進(jìn)行灰度化、二值化、平滑去噪、細(xì)化 等處理;③計(jì)算傾斜角度對(duì)試巻巻面圖像進(jìn)行Hough變換,并判斷出試巻巻面圖像是否傾斜,如果出現(xiàn)傾斜則計(jì)算出試巻巻面圖像的傾斜角度e。(2) 抽取出水平和垂直線段結(jié)合上述傾斜角度,通過(guò)投影抽取出試巻巻面圖像中的水平和垂直線段。(3) 形成表格 把上述抽取出的水平和垂直線段組合成表格。以下對(duì)本發(fā)明的方法作進(jìn)一步的說(shuō)明所述的試巻巻面圖象,是利用攝像頭實(shí)時(shí) 采集的,因此圖像受到噪聲和外界因素的影響,在進(jìn)行處理前, 一般來(lái)說(shuō)要對(duì)圖象進(jìn) 行預(yù)處理。對(duì)試巻巻面圖像的預(yù)處理包括以下過(guò)程灰度化、二值化、平滑去噪。由 于本方法要對(duì)整幅試巻巻面圖像進(jìn)行處理,為了減小計(jì)算量和提高算法速度,細(xì)化的 很必要的,在本方法中采用的是并行細(xì)化算法,該細(xì)化方法具有很好的實(shí)用性,獲取 的圖像骨架避免了過(guò)度腐蝕,并且還具有良好的連通性。所述的計(jì)算傾斜角度,是利用Hough變換得到試巻巻面圖像的傾斜角度。Hough變換的基本思想是由圖像空間目標(biāo)像素的坐標(biāo)去計(jì)算參數(shù)空間中參考點(diǎn)的可能軌 跡,并在一個(gè)累加器中給計(jì)算出的參考點(diǎn)計(jì)數(shù)。如果參數(shù)空間是極坐標(biāo)(P, e),則 坐標(biāo)變換的公式為<formula>formula see original document page 4</formula>這里的x 、 y是像素的直角坐標(biāo)。由此,H0Ugh變換算法設(shè)計(jì)為(1) 在p、 e合適的最大值與最小值之間建立一個(gè)離散的參數(shù)空間;(2) 建立一個(gè)累加器A(p, e),并將每一個(gè)元素置為o;(3) 選取圖像中超過(guò)門限值的每一個(gè)目標(biāo)像素點(diǎn)(x,y),對(duì)每一個(gè)e的取值&,計(jì)算 p' =;ccos(A) + ;/sin(^),并在相應(yīng)的累加器加l。在累加矩陣A(p, e)中,對(duì)應(yīng)的某一個(gè)列A,使得A(p, 0)具有局部較大值, 所以可以設(shè)定一個(gè)合適的門限值T,取7WmaxJ(一)......................................... (2)這里義<1,然后利用該門限值對(duì)A(p , e)進(jìn)行變換,當(dāng)a(p, e)《T時(shí),A(p, 8)=0。對(duì)A(p, e)進(jìn)行列累加,得到J'(0)。最后,選取的乂(60最大元素所對(duì)應(yīng)的角度為發(fā)現(xiàn)的傾斜角度e。所述的抽取水平和垂直線段,是利用投影的方法,結(jié)合上述傾斜角度得到水平和 垂直的線段。投影的方法即使對(duì)試巻巻面圖像的每一行或每一列的像素點(diǎn)p進(jìn)行疊加, 如果pi,既像素點(diǎn)p為黑像素點(diǎn),則加l。所述的形成表格,就是利用上訴得到的傾斜角度和水平、垂直線段組合成表格。本發(fā)明與現(xiàn)有技術(shù)相比較,具有如下顯而易見(jiàn)的突出實(shí)質(zhì)性特點(diǎn)和顯著優(yōu)點(diǎn)能夠?qū)崿F(xiàn)傾斜圖像中表格的檢測(cè),并且對(duì)于斷線的情況能夠得到滿意的效果。同時(shí),本 發(fā)明的方法,直接對(duì)試巻巻面的圖像進(jìn)行處理,對(duì)于不用版式和風(fēng)格的試巻均試用, 而且準(zhǔn)確率高,容易實(shí)現(xiàn),能夠大大提高巻巻面信息自動(dòng)錄入和處理的效率。本發(fā)明 的方法還適用于其它表格自動(dòng)錄入和處理系統(tǒng),具有很好的實(shí)用價(jià)值。
圖1為試巻巻面圖像圖。圖2為預(yù)處理和細(xì)化后的試巻巻面圖像圖。圖3為水平投影圖。圖4為垂直投影圖。圖5為水平線段圖。圖6為垂直垂直線段圖。圖7為檢測(cè)表格結(jié)果圖;具體實(shí)踐方式實(shí)施例一為了更好的理解本發(fā)明的技術(shù)方案,結(jié)合附圖就實(shí)施例進(jìn)一步詳細(xì)描 述。本試巻巻面表格自動(dòng)檢測(cè)方法的具體操作步驟如下(1) 利用Hough變換找出傾斜角度 CD輸入樣本通過(guò)攝像頭獲得試巻巻面實(shí)時(shí)圖象,其中學(xué)號(hào)部分和分?jǐn)?shù)部分圖象如圖1所示。 ②預(yù)處理計(jì)算機(jī)對(duì)得到的實(shí)時(shí)試巻圖象進(jìn)行灰度化、二值化、平滑去噪、細(xì)化等處理如圖 2所示。③計(jì)算傾斜角度對(duì)試巻巻面圖像進(jìn)行Hough變換,并判斷出試巻巻面圖像是否傾斜,如果出現(xiàn)傾斜者計(jì)算出試巻巻面圖像的傾斜角度e。(2) 抽取出水平和垂直線段結(jié)合上述傾斜角度,對(duì)試巻巻面圖像進(jìn)行水平投影和垂直投影,如圖3, 4隨時(shí), 然后抽取出試巻巻面圖像中的水平和垂直線段,如圖5, 6所示。 (4)形成表格根據(jù)上述抽取出來(lái)的表格線段,組合成表格,結(jié)果如圖7所示。
權(quán)利要求
1.一種試卷卷面表格自動(dòng)檢測(cè)方法,其特征在于通過(guò)攝像頭獲取實(shí)時(shí)的試卷卷面圖像,經(jīng)過(guò)預(yù)處理和細(xì)化后,利用Hough變換找出試卷圖像的傾斜角度,然后抽取出試卷卷面中的水平和垂直線段,最后結(jié)合傾斜角度把水平和垂直線段組合成表格其具體操作步驟如下(1)利用Hough變換找出傾斜角度的步驟①輸入樣本將試卷卷面圖像由攝像頭和圖像采集卡經(jīng)模數(shù)轉(zhuǎn)換后輸入計(jì)算機(jī);②預(yù)處理計(jì)算機(jī)對(duì)得到的實(shí)時(shí)試卷卷面圖像進(jìn)行灰度化、二值化、平滑去噪、細(xì)化處理;③計(jì)算傾斜角度對(duì)試卷卷面圖像進(jìn)行Hough變換,并判斷出試卷卷面圖像是否傾斜,如果出現(xiàn)傾斜,計(jì)算出試卷卷面圖像的傾斜角度。(2)抽取出水平和垂直線段結(jié)合上述傾斜角度,通過(guò)投影抽取出試卷卷面圖像中的水平和垂直線段。(3)形成表格把上述抽取出的水平和垂直線段組合成表格。
全文摘要
本發(fā)明涉及計(jì)算機(jī)處理領(lǐng)域的模式識(shí)別技術(shù),具體涉及一種試卷卷面表格的自動(dòng)檢測(cè)方法。本方法是通過(guò)攝像頭獲取實(shí)時(shí)的試卷卷面圖像,經(jīng)過(guò)預(yù)處理和細(xì)化后,利用Hough變換找出卷面圖像的傾斜角,然后抽取出試卷卷面中的水平和垂直線段,最后結(jié)合傾斜角度把水平和垂直線段組合成表格。采用本發(fā)明所述的方法,可以大大提高表格類文檔以及票據(jù)自動(dòng)錄入和識(shí)別的效率和準(zhǔn)確率。
文檔編號(hào)G06K9/36GK101315668SQ200810039999
公開日2008年12月3日 申請(qǐng)日期2008年7月1日 優(yōu)先權(quán)日2008年7月1日
發(fā)明者馮運(yùn)亮, 孫峰杰, 羅珍茜, 雷 薛 申請(qǐng)人:上海大學(xué)