一種基于計算機圖像處理和模式識別的檢測方法及應(yīng)用的制作方法
【專利摘要】本發(fā)明一種基于計算機圖像處理和模式識別的檢測方法,步驟如下:(1)樣卷錄入:a.將寫有答案的標(biāo)準(zhǔn)試卷放在對準(zhǔn)采集圖像攝像頭處,使用采集設(shè)備進行采集,得到帶有答案的標(biāo)準(zhǔn)試卷圖像;b.對此圖像進行圖像處理,分類成為正樣本、副樣本存放于文字識別庫中,生成標(biāo)準(zhǔn)的試卷信息;(2)試卷種類識別:a.根據(jù)步驟(1)中所述的方法,獲取寫有答案的樣卷圖像;b.與標(biāo)準(zhǔn)試卷圖像進行低分辨率匹配;(3)手寫作答識別;(4)試卷分析。本發(fā)明方法可輔助教師進行手寫試卷或作業(yè)的批改,相對于機讀試卷評分系統(tǒng)具有設(shè)備簡單、使用方便等特點,同時可免去學(xué)生在考試中填寫機讀答題卡所占用的額外精力,尤其適用于低年級學(xué)生的作業(yè)和試卷的批改。
【專利說明】一種基于計算機圖像處理和模式識別的檢測方法及應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像識別【技術(shù)領(lǐng)域】,涉及針對手寫試卷的圖像識別和處理,輔助教師進行手寫試卷或作業(yè)的批改的方法,尤其是一種基于計算機圖像處理和模式識別的檢測方法及應(yīng)用。
【背景技術(shù)】
[0002]隨著計算機技術(shù)與信息技術(shù)的發(fā)展,圖像識別技術(shù)獲得了越來越廣泛的應(yīng)用。例如醫(yī)療診斷中各種醫(yī)學(xué)圖片的分析與識別、天氣預(yù)報中的衛(wèi)星云圖識別、遙感圖片識別、指紋識別、臉譜識別等,圖像識別技術(shù)越來越多地滲透到我們的日常生活中。
[0003]圖像識別技術(shù)的涵義很廣,主要指通過計算機,采用數(shù)學(xué)技術(shù)方法,對一個系統(tǒng)前端獲取的圖像按照特定目的進行相應(yīng)的處理。圖像識別包括諸如條碼識別、生物特征識別(人臉識別、指紋識別等)技術(shù)、智能交通中的動態(tài)對象識別、手寫識別等??梢哉f,圖像識別技術(shù)就是人類視覺認(rèn)知的延伸。是人工智能的一個重要領(lǐng)域,隨著計算機技術(shù)及人工智能技術(shù)的發(fā)展,圖像識別技術(shù)越來越成為人工智能的基礎(chǔ)技術(shù)。它涉及的【技術(shù)領(lǐng)域】也越來越廣泛,應(yīng)用越來越深入。其基本分析方法也隨著數(shù)學(xué)工具的不斷進步而不斷發(fā)展。現(xiàn)在,圖像識別技術(shù)的應(yīng)用范圍已經(jīng)遠遠突破視覺的范圍,而更多地體現(xiàn)為機器智能、數(shù)字技術(shù)的特點。
[0004]圖像的數(shù)字處理是以計算機為中心,包括各種輸入、輸出及顯示設(shè)備在內(nèi)的數(shù)字圖像處理系統(tǒng)上進行的,是將連續(xù)的模擬圖像變成離散的數(shù)字圖像后,用建立在特定的物理模型和數(shù)學(xué)模型基礎(chǔ)上編制的程序控制,運行并實現(xiàn)種種要求的處理。
[0005]目前,經(jīng)常使用OCR技術(shù)進行圖像識別,但是,OCR技術(shù)以樣卷為標(biāo)準(zhǔn),通過對比樣卷與試卷關(guān)鍵區(qū)域圖像對試卷進行評判時,OCR技術(shù)無法識別一些特殊符號,同時OCR技術(shù)存在識別率不高的問題。同時,OCR技術(shù)系統(tǒng)操作繁瑣,效率低,降低了教師的工作效率。
[0006]通過檢索,尚未發(fā)現(xiàn)與本發(fā)明專利申請相關(guān)的專利公開文獻。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足之處,提供一種輔助教師進行手寫試卷或作業(yè)的批改,免去了學(xué)生在考試中填寫機讀答題卡所占用的額外精力,尤其適用于低年級學(xué)生的作業(yè)和試卷的批改的基于計算機圖像處理和模式識別的檢測方法,該檢測方法可以應(yīng)用在圖像識別【技術(shù)領(lǐng)域】方面。
[0008]為了實現(xiàn)上述目的,本發(fā)明所采用的的技術(shù)方案如下:
[0009]一種基于計算機圖像處理和模式識別的檢測方法,步驟如下:
[0010](I)樣卷錄入,獲取步驟依次如下:
[0011]a.將寫有答案的標(biāo)準(zhǔn)試卷放在對準(zhǔn)采集圖像攝像頭處,使用采集設(shè)備進行采集,得到帶有答案的標(biāo)準(zhǔn)試卷圖像;
[0012]b.對此圖像進行圖像處理,分類成為正樣本、副樣本存放于文字識別庫中,生成標(biāo)準(zhǔn)的試卷信息;
[0013](2)試卷種類識別,獲取步驟依次如下:
[0014]a.根據(jù)步驟(I)中所述的方法,獲取寫有答案的樣卷圖像;
[0015]b.與標(biāo)準(zhǔn)試卷圖像進行低分辨率匹配;
[0016](3)手寫作答識別,獲取步驟依次如下:
[0017]a.對標(biāo)準(zhǔn)試卷ROI區(qū)域內(nèi)高分辨率圖像進行識別,得對比樣卷ROI區(qū)域圖像;
[0018]b.結(jié)合對比樣卷ROI區(qū)域圖像對手寫作答進行評判;
[0019](4)試卷分析,獲取步驟依次如下:
[0020]a.對已評判試卷信息進行整體正確率統(tǒng)計;
[0021]b.生成統(tǒng)計分析結(jié)果,得出最終分?jǐn)?shù)。
[0022]而且,所述步驟⑴a中彩色視頻采集設(shè)備為高拍儀。
[0023]而且,所述步驟⑴b中規(guī)范的文字作為正樣本,不規(guī)范的文字作為副樣本,其中規(guī)范的文字是符合國家頒布的規(guī)范標(biāo)準(zhǔn)的漢字,不規(guī)范的文字則是不符合國家頒布的規(guī)范標(biāo)準(zhǔn)的漢字。
[0024]而且,所述步驟(2)b中與標(biāo)準(zhǔn)試卷的圖像進行低分辨率匹配。
[0025]而且,所述步驟⑷中對已評判試卷信息進行自動分析。
[0026]而且,所述的基于計算機圖像處理和模式識別的檢測方法,具體步驟如下:
[0027]⑴試卷劃分與樣本制作
[0028]對寫有答案的考試試卷使用高拍儀進行圖像采集,通過軟件運用相關(guān)圖像處理算子將所需識別區(qū)域標(biāo)識出來,之后獲取各個位置的圖像樣本,對之進行圖像處理,將處理后所得到的文字圖像信息存放于文字識別庫中,作為正樣本應(yīng)用于之后的識別匹配中;同時,還寫不規(guī)范的文字或者錯別字,再對之進行同樣的處理后,將它作為副樣本應(yīng)用于之后的識別匹配中;
[0029]⑵試卷種類識別
[0030]通過對樣本試卷整體使用高拍儀進行圖像采集,對試卷種類所在區(qū)域的圖片提取出來,將之轉(zhuǎn)換為低分辨率圖片,與標(biāo)準(zhǔn)試卷的圖像進行低分辨率匹配,匹配一致則繼續(xù)進行下一步識別;
[0031]⑶手寫作答識別
[0032]對高拍儀所采集的圖像進行處理,將之轉(zhuǎn)換為高分辨率圖片,與文字識別庫內(nèi)所存放的正樣本、副樣本進行匹配,當(dāng)匹配成功時,即為正確答案,反之則為錯誤答案;
[0033]⑷試卷分析
[0034]在對試卷圖像處理完之后,進行整體統(tǒng)計,對錯誤處實行滿分減分原則,計算出最終得分。
[0035]如上所述的基于計算機圖像處理和模式識別的檢測方法在圖像識別【技術(shù)領(lǐng)域】方面的應(yīng)用。
[0036]本發(fā)明的優(yōu)點和積極效果是:
[0037]1、本發(fā)明方法以普通攝像頭采集到的文字圖像,識別關(guān)鍵區(qū)域(ROI,reg1n ofinterest)內(nèi)的文字,通過與標(biāo)準(zhǔn)答案進行對比以實現(xiàn)對試卷或作業(yè)的批改。該方法使用簡單的設(shè)備實現(xiàn)原先需要光標(biāo)閱讀機和答題卡才能實現(xiàn)的標(biāo)準(zhǔn)化考試功能。以樣卷為標(biāo)準(zhǔn),通過對比樣卷與試卷關(guān)鍵區(qū)域圖像對試卷進行評判,可實現(xiàn)一些OCR無法識別的特殊符號,并解決OCR識別率不高的問題。同時,該方法操作簡單,效率高,適于推廣,可大大提高教師的工作效率,降低教師工作壓力,在一定程度上可緩解我國當(dāng)前教育資源緊張的問題。
[0038]2、本發(fā)明方法僅使用普通的視頻采集設(shè)備,而且這些設(shè)備是圖像識別系統(tǒng)中的必需設(shè)備,不用對系統(tǒng)額外加入硬件設(shè)備,成本低廉,且算法簡單易于實現(xiàn),能夠滿足不同場合的實際要求。
[0039]3、本發(fā)明方法可免去學(xué)生在考試中填寫機讀答題卡所占用的額外精力,尤其適用于低年級學(xué)生的作業(yè)和試卷的批改。
【專利附圖】
【附圖說明】
[0040]圖1為本發(fā)明方法的流程示意圖;
[0041]圖2為本發(fā)明方法中ROI區(qū)域的選取樣本圖;其中,a為正樣本圖,b為副樣本圖;
[0042]圖3為本發(fā)明方法的手工指定標(biāo)畫位置圖;
[0043]圖4為OCR識別技術(shù)對于錯誤字體的糾正功能圖;
[0044]圖5為本發(fā)明對字體識別選取的樣本圖,其中對于不規(guī)范字體,用X來代替它在原文中的位置。
【具體實施方式】
[0045]下面結(jié)合實施例,對本發(fā)明進一步說明;下述實施例是說明性的,不是限定性的,不能以下述實施例來限定本發(fā)明的保護范圍。
[0046]本發(fā)明中所使用的設(shè)備,如無特殊規(guī)定,均為本領(lǐng)域內(nèi)常用的設(shè)備;本發(fā)明中所使用的方法,如無特殊規(guī)定,均為本領(lǐng)域內(nèi)常用的方法。本發(fā)明專利申請無需特殊定制的設(shè)備,使用的高拍儀可以是已經(jīng)規(guī)?;a(chǎn)的“高拍儀”,并且不指定品牌型號。
[0047]一種基于計算機圖像處理和模式識別的檢測方法,以PC機和普通攝像頭為平臺,開發(fā)適用于普教階段的手寫試卷計算機自動評分系統(tǒng)核心模塊。該系統(tǒng)可輔助教師進行手寫試卷或作業(yè)的批改,該方法借鑒OCR理念,實現(xiàn)對手寫試卷的計算機評判,但與之不同的是,本發(fā)明方法的識別庫與OCR文字識別庫是不一樣的,要求寫規(guī)范的漢字,即符合國家頒布的規(guī)范標(biāo)準(zhǔn)的漢字,并且圖像位置放置必須正確,即將所需檢驗部分對準(zhǔn)采集圖像攝像頭,而OCR文字識別庫則對字體的書寫沒有要求。
[0048]本發(fā)明基于計算機圖像處理和模式識別的檢測,其基本思路是:首先通過攝像頭采集樣卷圖像,然后制作正樣本、副樣本(如圖2所示),將其存儲于文字識別庫中,方便后續(xù)的試卷分析及評分,這是與OCR識別技術(shù)最大的不同之處。當(dāng)正樣本、副樣本錄入完畢后,即可開始對試卷的識別。對于試卷種類的識別可以通過對試卷圖像進行特征提取,進行低分辨率匹配,判別試卷與樣卷種類是否相同。在對手寫區(qū)域進行識別時,則對感興趣區(qū)域(即ROI區(qū)域)中的內(nèi)容進行高分辨率識別,結(jié)合對比樣卷ROI區(qū)域圖像對手寫作答進行評判。最后進行試卷分析,對試卷進行綜合評定,生成分析結(jié)果。
[0049]OCR識別技術(shù)具有對文字的糾錯能力,即使所檢驗樣本字體為不規(guī)范字體或者是錯誤字體時,也能夠?qū)⒅徽J(rèn)證為正確字體并輸出(如圖4所示,圖4為OCR文字糾錯),而本發(fā)明在對于此類字體時會用X來代替錯誤字體,提前將之認(rèn)定為錯誤字體,已達到正確評判試卷的目的。
[0050]現(xiàn)在結(jié)合附圖對本發(fā)明做進一步詳細地說明,附圖以示意方式說明本發(fā)明的基本結(jié)構(gòu),因此僅顯示與本發(fā)明有關(guān)的構(gòu)成。
[0051]實施例1
[0052]一種基于計算機圖像處理和模式識別的檢測方法,如圖1所示,步驟如下:
[0053](I)樣卷錄入,獲取步驟依次如下:
[0054]a.將寫有答案的標(biāo)準(zhǔn)試卷放在對準(zhǔn)采集圖像攝像頭處,使用采集設(shè)備進行采集,得到帶有答案的標(biāo)準(zhǔn)試卷圖像;
[0055]b.對此圖像進行圖像處理,分類成為正樣本、副樣本存放于文字識別庫中,生成標(biāo)準(zhǔn)的試卷信息;
[0056](2)試卷種類識別,獲取步驟依次如下:
[0057]a.根據(jù)步驟⑴中所述的方法,獲取寫有答案的樣卷圖像;
[0058]b.與標(biāo)準(zhǔn)試卷圖像進行低分辨率匹配:
[0059](3)手寫作答識別,獲取步驟依次如下:
[0060]a.對試卷ROI區(qū)域內(nèi)高分辨率圖像進行識別,得對比樣卷ROI區(qū)域圖像;
[0061]b.結(jié)合對比樣卷ROI區(qū)域圖像對手寫作答進行評判;
[0062](4)試卷分析,獲取步驟依次如下:
[0063]a.對已評判試卷信息進行整體正確率統(tǒng)計;
[0064]b.生成統(tǒng)計分析結(jié)果,得出最終分?jǐn)?shù)。
[0065]實施例2
[0066]一種基于計算機圖像處理和模式識別的檢測方法,步驟如下:
[0067](I)樣卷錄入,獲取步驟依次如下:
[0068]a.將寫有答案的試卷放在對準(zhǔn)采集圖像攝像頭處,使用采集設(shè)備進行采集,得到帶有答案的標(biāo)準(zhǔn)試卷圖像;
[0069]b.對此圖像進行圖像處理,分類成為正樣本、副樣本存放于文字識別庫中,生成標(biāo)準(zhǔn)的試卷信息;
[0070](2)試卷種類識別,獲取步驟依次如下:
[0071]a.根據(jù)步驟(I)中所述的方法,獲取寫有答案的樣卷圖像;
[0072]b.與標(biāo)準(zhǔn)試卷的圖像進行低分辨率匹配:
[0073](3)手寫作答識別,獲取步驟依次如下:
[0074]a.對試卷ROI區(qū)域內(nèi)高分辨率圖像進行識別;
[0075]b.結(jié)合對比樣卷ROI區(qū)域圖像對手寫作答進行評判;
[0076](4)試卷分析,獲取步驟依次如下:
[0077]a.對已評判試卷信息進行整體正確率統(tǒng)計;
[0078]b.生成統(tǒng)計分析結(jié)果,得出最終分?jǐn)?shù);
[0079]而且,所述步驟⑴a中彩色視頻采集設(shè)備為高拍儀;所述步驟⑴b中規(guī)范的文字作為正樣本,不規(guī)范的文字作為副樣本,其中規(guī)范的文字是符合國家頒布的規(guī)范標(biāo)準(zhǔn)的漢字,不規(guī)范的文字則是不符合國家頒布的規(guī)范標(biāo)準(zhǔn)的漢字;所述步驟(2)b中與標(biāo)準(zhǔn)試卷的圖像進行低分辨率匹配;所述步驟(3)a中對試卷ROI區(qū)域內(nèi)高分辨率圖像進行識別;所述步驟(4)中對已評判試卷信息進行自動分析。
[0080]實施例3
[0081]一種基于計算機圖像處理和模式識別的檢測方法,步驟如下:
[0082](一 )試卷劃分與樣本制作
[0083]對寫有答案的考試試卷使用高拍儀進行圖像采集,可通過opencv等軟件運用相關(guān)圖像處理算子將所需識別區(qū)域(即ROI區(qū)域)標(biāo)識出來(如圖3所示,圖3為劃分示例),之后獲取各個位置的圖像樣本,對之進行圖像處理,將處理后所得到的文字圖像信息之存放于文字識別庫中,作為正樣本應(yīng)用于之后的識別匹配中。同時,還應(yīng)寫一些不規(guī)范的文字或者是錯別字,再對之進行同樣的處理后,將它作為副樣本應(yīng)用于之后的識別匹配中。
[0084]( 二)試卷種類識別
[0085]這里主要是對試卷種類進行判別,避免對于錯誤試卷的識別。通過對試卷整體使用高拍儀進行圖像采集,對試卷種類所在區(qū)域的圖片提取出來,將之轉(zhuǎn)換為低分辨率圖片,與標(biāo)準(zhǔn)試卷的圖像進行低分辨率匹配,匹配一致則繼續(xù)進行下一步識別。
[0086](三)手寫作答識別
[0087]對高拍儀所采集的圖像進行處理,將之轉(zhuǎn)換為高分辨率圖片,與文字識別庫內(nèi)所存放的正樣本、副樣本進行匹配,當(dāng)匹配成功時,即為正確答案,反之則為錯誤答案。
[0088]如圖5所示,圖5為識別示例,通過匹配可將不規(guī)范字體認(rèn)定為錯誤,并用X替代。
[0089](四)試卷分析
[0090]在對試卷圖像處理完之后,進行整體統(tǒng)計,對錯誤處實行滿分減分原則,計算出最終得分。
[0091]以上述依據(jù)本發(fā)明的理想實施案例為啟示,通過上述的說明內(nèi)容,相關(guān)工作人員完全可以在不偏離本項發(fā)明技術(shù)思想的范圍內(nèi),進行多樣的變更以及修改。本想發(fā)明的技術(shù)性范圍并不局限于說明書上的內(nèi)容,必須要根據(jù)權(quán)利要求范圍來確定其技術(shù)性范圍。
【權(quán)利要求】
1.一種基于計算機圖像處理和模式識別的檢測方法,其特征在于:步驟如下: (1)樣卷錄入,獲取步驟依次如下: a.將寫有答案的標(biāo)準(zhǔn)試卷放在對準(zhǔn)采集圖像攝像頭處,使用采集設(shè)備進行采集,得到帶有答案的標(biāo)準(zhǔn)試卷圖像; b.對標(biāo)準(zhǔn)試卷圖像進行圖像處理,分類成為正樣本、副樣本存放于文字識別庫中,生成標(biāo)準(zhǔn)的試卷信息; (2)試卷種類識別,獲取步驟依次如下: a.根據(jù)步驟(I)中所述的方法,獲取寫有答案的樣卷圖像; b.與標(biāo)準(zhǔn)試卷圖像進行低分辨率匹配; (3)手寫作答識別,獲取步驟依次如下: a.對標(biāo)準(zhǔn)試卷ROI區(qū)域內(nèi)高分辨率圖像進行識別,得對比樣卷ROI區(qū)域圖像; b.結(jié)合對比樣卷ROI區(qū)域圖像對手寫作答進行評判,得已評判試卷信息; (4)試卷分析,獲取步驟依次如下: a.對已評判試卷信息進行整體正確率統(tǒng)計; b.生成統(tǒng)計分析結(jié)果,得出最終分?jǐn)?shù)。
2.根據(jù)權(quán)利要求1所述的基于計算機圖像處理和模式識別的檢測方法,其特征在于:所述步驟⑴a中彩色視頻采集設(shè)備為高拍儀。
3.根據(jù)權(quán)利要求1所述的基于計算機圖像處理和模式識別的檢測方法,其特征在于:所述步驟⑴b中規(guī)范的文字作為正樣本,不規(guī)范的文字作為副樣本,其中規(guī)范的文字是符合國家頒布的規(guī)范標(biāo)準(zhǔn)的漢字,不規(guī)范的文字則是不符合國家頒布的規(guī)范標(biāo)準(zhǔn)的漢字。
4.根據(jù)權(quán)利要求1所述的基于計算機圖像處理和模式識別的檢測方法,其特征在于:所述步驟(2)b中與標(biāo)準(zhǔn)試卷的圖像進行低分辨率匹配。
5.根據(jù)權(quán)利要求1所述的基于計算機圖像處理和模式識別的檢測方法,其特征在于:所述步驟(4)中對已評判試卷信息進行自動分析。
6.根據(jù)權(quán)利要求1所述的基于計算機圖像處理和模式識別的檢測方法,其特征在于:具體步驟如下: ⑴試卷劃分與樣本制作 對寫有答案的考試試卷使用高拍儀進行圖像采集,通過軟件運用相關(guān)圖像處理算子將所需識別區(qū)域標(biāo)識出來,之后獲取各個位置的圖像樣本,對之進行圖像處理,將處理后所得到的文字圖像信息存放于文字識別庫中,作為正樣本應(yīng)用于之后的識別匹配中;同時,還寫不規(guī)范的文字或者錯別字,再對之進行同樣的處理后,將它作為副樣本應(yīng)用于之后的識別匹配中; ⑵試卷種類識別 通過對樣本試卷整體使用高拍儀進行圖像采集,對試卷種類所在區(qū)域的圖片提取出來,將之轉(zhuǎn)換為低分辨率圖片,與標(biāo)準(zhǔn)試卷的圖像進行低分辨率匹配,匹配一致則繼續(xù)進行下一步識別; ⑶手寫作答識別 對高拍儀所采集的圖像進行處理,將之轉(zhuǎn)換為高分辨率圖片,與文字識別庫內(nèi)所存放的正樣本、副樣本進行匹配,當(dāng)匹配成功時,即為正確答案,反之則為錯誤答案; ⑷試卷分析 在對試卷圖像處理完之后,進行整體統(tǒng)計,對錯誤處實行滿分減分原則,計算出最終得分。
7.如權(quán)利要求1至6任一項所述的基于計算機圖像處理和模式識別的檢測方法在圖像識別【技術(shù)領(lǐng)域】方面的應(yīng)用。
【文檔編號】G06K9/20GK104376315SQ201410370703
【公開日】2015年2月25日 申請日期:2014年7月30日 優(yōu)先權(quán)日:2014年7月30日
【發(fā)明者】謝迎, 卜憲彬, 袁明明, 謝明娜, 張越威, 劉建征 申請人:天津科技大學(xué)