基于移動(dòng)設(shè)備的問卷和表格數(shù)字化識(shí)別方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及的是一種機(jī)器學(xué)習(xí)和圖像處理技術(shù)領(lǐng)域的系統(tǒng),具體是一種基于移動(dòng) 設(shè)備的快速高效的問卷和表格數(shù)字化識(shí)別方法及系統(tǒng)。
【背景技術(shù)】
[0002] 問卷和表格在當(dāng)今社會(huì)生活中被廣泛地使用。比如開展一個(gè)新的項(xiàng)目或者生產(chǎn)一 個(gè)新的產(chǎn)品,都要通過市場(chǎng)問卷調(diào)查來分析項(xiàng)目的可行性或者產(chǎn)品的需求量。同樣在銀行 或則學(xué)校,通常需要填寫一些表格來登記注冊(cè)信息。雖然現(xiàn)在網(wǎng)絡(luò)調(diào)查和注冊(cè)已經(jīng)越來越 流行了,但是紙質(zhì)的問卷和表格對(duì)于調(diào)查和統(tǒng)計(jì)分析也是必不可少的。由于市場(chǎng)上識(shí)別紙 質(zhì)問卷和表格的設(shè)備或者應(yīng)用太少,當(dāng)該些問卷或者表格被填寫好后,問卷和表格的統(tǒng)計(jì) 分析只能靠人工來進(jìn)行,需要大量的人力和物力,該既消耗了大量的人力和物力,也浪費(fèi)里 寶貴的時(shí)間。所W設(shè)計(jì)需要一個(gè)快速高效的問卷和表格識(shí)別來幫助工作人員完成對(duì)紙質(zhì)問 卷和表格的數(shù)據(jù)的統(tǒng)計(jì)和錄入工作。
[0003] 要實(shí)現(xiàn)問卷和表格的數(shù)字化識(shí)別,需要實(shí)現(xiàn)問卷和表格的分割、標(biāo)定和識(shí)別=個(gè) 部分。對(duì)于圖像分割,傳統(tǒng)的方法有基于顏色分割、差分運(yùn)動(dòng)檢測(cè)分割和Ad油oost訓(xùn)練分 類器來進(jìn)行分割。由于紙質(zhì)問卷和表格一般只有白色和黑色兩種顏色,包含的顏色信息不 多,所W采用顏色分割的效果不好;而識(shí)別問卷和表格一般通過拍照采用靜態(tài)識(shí)別,不包含 運(yùn)動(dòng)的信息,所W差分運(yùn)動(dòng)檢測(cè)的效果也不甚理想;最后,通過訓(xùn)練Ad油oost分類器來識(shí) 別問卷和表格,Ad油oost分類器是機(jī)器學(xué)習(xí)里面的一種訓(xùn)練方法,但該項(xiàng)工作需要大量的 樣本圖片才能確定較好的效果,而且分類器在復(fù)雜環(huán)境下和光照變化較大的情況下,識(shí)別 率較低;對(duì)于圖像標(biāo)定,一般通過檢測(cè)直線的交點(diǎn)來計(jì)算出紙質(zhì)的問卷和表格的四個(gè)角的 坐標(biāo),然后通過仿射變換來校準(zhǔn)圖片,但在復(fù)雜環(huán)境下,直線檢測(cè)不太穩(wěn)定,并且計(jì)算出來 的角點(diǎn)的坐標(biāo)存在偏差,嚴(yán)重的影響了后續(xù)步驟。另外二維碼識(shí)別的方法來標(biāo)定圖片的方 法,設(shè)定標(biāo)志來標(biāo)定圖片,但對(duì)于問卷和表格,設(shè)定標(biāo)準(zhǔn)顯得太過復(fù)雜,不切實(shí)可行。表格識(shí) 別部分,一般的想法是通過文字識(shí)別來判斷出被選中的選項(xiàng),但對(duì)于文字的識(shí)別過于復(fù)雜, 現(xiàn)有的技術(shù)對(duì)文字的識(shí)別率較低,可行性較低。
[0004] 現(xiàn)有專利中,如申請(qǐng)?zhí)枮镃N201310455065. 0中國發(fā)明專利,該專利提供了一種表 格識(shí)別方法與系統(tǒng),但該技術(shù)通過分割出表格的基本圖元,采用無向圖,抽取頁面內(nèi)的圖 像,檢測(cè)水平和垂直直線的交叉點(diǎn),檢測(cè)交叉點(diǎn)的外包絡(luò)矩陣,將所述分割文本行是否落入 外包絡(luò)矩陣作為局部關(guān)系特征,然后使用聚類和SVM向量機(jī)等機(jī)器學(xué)習(xí)的方法建立表格模 型來識(shí)別表格。該方法只是在整個(gè)文檔中找到表格,而對(duì)于表格中的內(nèi)容沒有做任何的識(shí) 另IJ,類似于對(duì)表格的分割,而且在對(duì)表格的識(shí)別過程中文檔必須豎直放置,對(duì)于文檔旋轉(zhuǎn)和 有遮擋的情況下,識(shí)別率較低。并且該技術(shù)只是純粹的對(duì)表格的識(shí)別,而對(duì)于表格中的內(nèi)容 沒有做任何處理,對(duì)于表格的數(shù)據(jù)統(tǒng)計(jì)的用處不大。
[0005] 基于上述,需要設(shè)計(jì)一種新的識(shí)別方法和系統(tǒng),來在復(fù)雜環(huán)境先分割出問卷和表 格,并且識(shí)別出表格和問卷中那些被選擇的內(nèi)容W方便數(shù)據(jù)的統(tǒng)計(jì)分析,增加實(shí)用性。
【發(fā)明內(nèi)容】
[0006] 針對(duì)上述現(xiàn)有技術(shù)的不足,本發(fā)明提供一種快速高效的移動(dòng)設(shè)備問卷和表格數(shù)字 化識(shí)別方法及系統(tǒng),可W快速而高效的識(shí)別了整個(gè)問卷或者表格,準(zhǔn)確率幾乎達(dá)到百分之 百,方便工作人員對(duì)問卷和表格信息的統(tǒng)計(jì)和錄入。
[0007] 為實(shí)現(xiàn)上述目的,本發(fā)明采用W下技術(shù)方案:
[000引根據(jù)本發(fā)明的一方面,提供一種基于移動(dòng)設(shè)備的問卷和表格數(shù)字化識(shí)別方法,包 括如下步驟:
[0009] 步驟一,問卷或表格的分割:根據(jù)紙質(zhì)問卷或者表格圖片的角點(diǎn)特征,使用 化化riaSDK訓(xùn)練樣本圖片,在復(fù)雜多變的背景中快速高效的分割出問卷或表格;
[0010] 步驟二問卷或表格的校準(zhǔn);根據(jù)化en化系統(tǒng)中的坐標(biāo)變換,將分割出問卷或表 格的物體坐標(biāo)轉(zhuǎn)換為屏幕坐標(biāo),并通過仿射變換來校準(zhǔn)各種位置的問卷或表格;
[0011] 步驟S,問卷或表格的識(shí)別對(duì)校準(zhǔn)的問卷或表格進(jìn)行圖像處理,按照順序?qū)⒈碇?的選項(xiàng)數(shù)字化,根據(jù)選擇框中黑色區(qū)域占整個(gè)區(qū)域的比例來判讀該選項(xiàng)是否被選,輸出被 選中的選項(xiàng)的數(shù)字標(biāo)號(hào);根據(jù)數(shù)字標(biāo)號(hào)和本地建立的問卷或者表格選項(xiàng)內(nèi)容的S化庫,輸 出被選中的選項(xiàng)及內(nèi)容。
[0012] 優(yōu)選地,所述步驟一,具體為;從復(fù)雜背景中分割出問卷,求出問卷或表格的四 個(gè)頂點(diǎn)坐標(biāo),首先根據(jù)問卷或表格的角點(diǎn)特征訓(xùn)練出相應(yīng)的庫,然后在移動(dòng)設(shè)備中啟動(dòng) 化化riaSDK使用訓(xùn)練的庫對(duì)問卷或表格進(jìn)行識(shí)別,識(shí)別過程中采用化en化擅染移動(dòng)設(shè) 備的界面,計(jì)算出問卷或表格的四個(gè)頂點(diǎn)在W問卷或表格為中屯、建立的坐標(biāo)系下的=維坐 標(biāo)。
[0013] 優(yōu)選地,所述步驟二,具體為:將問卷或表格的=維頂點(diǎn)坐標(biāo)通過矩陣變換轉(zhuǎn)換成 移動(dòng)設(shè)備的屏幕坐標(biāo),即利用化en化中坐標(biāo)系的轉(zhuǎn)換,建立模視矩陣(ModelviewMatrix) 和投影矩陣(ProjectionMatrix),并通過視口變換(ViewportTransform)將物體坐標(biāo)系 下的=維坐標(biāo)轉(zhuǎn)換為屏幕坐標(biāo),然后根據(jù)仿射變換將不同位置的問卷或表格校準(zhǔn)。
[0014] 進(jìn)一步的,所述步驟二,包括如下操作步驟:
[0015] 首先得到問卷的頂點(diǎn)坐標(biāo),即在模型坐標(biāo)系的坐標(biāo)(x"w,y。^Z。^w"w),照相機(jī)坐 標(biāo)系的坐標(biāo)是由模型坐標(biāo)乘W模視矩陣得:
[0016]
0)
[0017] 眼坐標(biāo)通過乘W投影矩陣得到裁剪坐標(biāo)系下頂點(diǎn)的坐標(biāo)(Xdip,ydip,Ztiip,Wtiip):
[00化]
口)
[0019]將裁減坐標(biāo)系下的坐標(biāo)除WWtiip,即得到歸一化的設(shè)備坐標(biāo)(x"d。,y"d。,,該坐 標(biāo)經(jīng)過平移和縮放就得到屏幕坐標(biāo),通過視口變換(ViewportTransform)就將該坐標(biāo)轉(zhuǎn)換 成屏幕坐標(biāo)(X,,y,,Z,);
[0020]
[002U其中(X,y,W,h)是屏幕窗口的起點(diǎn)和大小,(X,y)是屏幕窗口起點(diǎn)的坐標(biāo),W是屏 幕的寬度,h是屏幕的高度,(n,f)是屏幕的深度范圍,線性情況下n--l,f一 1。
[0022] 通過仿射變換在移動(dòng)設(shè)備屏幕上將在不同位置的問卷或者表格校準(zhǔn)。其中使用的 仿射變換的矩陣為:
[0023]平移變換;將屏幕上點(diǎn)(X,y)平移到點(diǎn)(x+dx,y+dy),dx是橫坐標(biāo)平移的距離,dy 是縱坐標(biāo)平移的距離,變換矩陣為:
[0024]
(4)
[0025]旋轉(zhuǎn)變換;將屏幕上點(diǎn)(X,y)圍繞遠(yuǎn)點(diǎn)逆時(shí)針旋轉(zhuǎn)0,變換矩陣為;
[0026]
價(jià)
[0027] 縮放變換;將屏幕上點(diǎn)(X,y)的橫坐標(biāo)放大或縮小到原來的SX倍,縱坐標(biāo)放大或 縮小到原來的sy倍,變換矩陣為:
[002引
巧)
[0029] 優(yōu)選地,所述步驟=,具體為:首先將整個(gè)問卷和表格的內(nèi)容數(shù)字化,即按照從上 到下及從左往右的順序建立問卷內(nèi)容的數(shù)據(jù)庫,W數(shù)字來代表問卷的選項(xiàng),然后標(biāo)定出每 個(gè)選項(xiàng)的選擇框的位置,將數(shù)據(jù)保存在本地文件中,最后通過自適應(yīng)闊值處理標(biāo)定后的圖 片,通過闊值處理、腐蝕、膨脹、腐蝕等形態(tài)學(xué)操作將圖片二值化,然后計(jì)算每個(gè)選項(xiàng)區(qū)域中 涂黑部分占整個(gè)區(qū)域的比例,若比例大于某一闊值則判定該選項(xiàng)被選擇,輸出代表該選項(xiàng) 的數(shù)字,然后在數(shù)據(jù)庫中匹配出該數(shù)字代表的選項(xiàng)及其內(nèi)容,并輸出結(jié)果。
[0030] 根據(jù)本發(fā)明的另一方面,提供一種基于移動(dòng)設(shè)備的問卷和表格數(shù)字化識(shí)別系統(tǒng), 所述系統(tǒng)包括:?jiǎn)柧砘虮砀竦姆指畈糠?、校?zhǔn)部分和識(shí)別部分,其中:
[0031] 所述問卷或表格的分割部分:根據(jù)紙質(zhì)問卷或者表格圖片的角點(diǎn)特征,使用 化化riaSDK訓(xùn)練樣本圖片,在復(fù)雜多變的背景中快速高效的分割出問卷或表格;
[0032] 所述問卷或表格的校準(zhǔn)部分;根據(jù)化en化系統(tǒng)中的坐標(biāo)變換,將分割出問卷或表 格的物體坐標(biāo)轉(zhuǎn)