基于ocr的人工評判試卷處理裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于模式識別與人工智能技術(shù)領(lǐng)域,特別是涉及一種基于OCR的人工評判試卷自動采集裝置與數(shù)據(jù)統(tǒng)計處理方法。
【背景技術(shù)】
[0002]基于OCR的人工評判試卷自動采集與數(shù)據(jù)統(tǒng)計處理技術(shù)是指通過計算機等設(shè)備,利用OCR技術(shù)(光學(xué)字符識別)將人工評判試卷中的試卷信息、答題者個人信息、試卷評判結(jié)果等字符符號自動提取和識別出來,并進行評判結(jié)果的統(tǒng)計分析,構(gòu)建評判試卷的數(shù)據(jù)庫系統(tǒng)。它是實現(xiàn)人工評判試卷的自動化處理與有效管理的關(guān)鍵技術(shù)之一。試卷考試和作業(yè)練習(xí)是學(xué)生學(xué)習(xí)過程中的重要環(huán)節(jié),通過教師的評判與批閱,可以發(fā)現(xiàn)學(xué)生對學(xué)習(xí)知識點的掌握情況,并及時采取相應(yīng)措施改進學(xué)習(xí)效果。目前的人工評判試卷與作業(yè)練習(xí)的處理方式還主要采取人工統(tǒng)計計分的方式,評判后的紙質(zhì)試卷與作業(yè)練習(xí)需要占據(jù)較大的存放空間,長期積累的紙質(zhì)試卷與作業(yè)達(dá)到一定年限以后通過丟棄的方式處理。這種處理方式具有明顯的不足,不利于進行有效的教學(xué)管理,歸納起來,主要表現(xiàn)為以下幾個方面:
[0003]1、統(tǒng)計計分過程費時費力,統(tǒng)計結(jié)果容易出錯。采用人工統(tǒng)計方式,大量的試卷與作業(yè)練習(xí),特別是多個科目每日的作業(yè)練習(xí),計分過程需要耗費大量的人力,不利于提高教學(xué)管理的效率。另外,人工統(tǒng)計很容易出現(xiàn)錯誤。
[0004]2、難以進行有效數(shù)據(jù)存儲與管理。評判后的紙質(zhì)試卷與作業(yè)練習(xí)以紙質(zhì)方式由學(xué)生或教師分散保存,長期大量的試卷與作業(yè)不利于管理,通常會被丟棄。教學(xué)過程中,通常希望查閱以往的試卷或作業(yè),目前的處理方式很難滿足這方面的需求,查找的效率也很低。
[0005]3、無法實現(xiàn)有效的數(shù)據(jù)統(tǒng)計與分析。大量的試卷和作業(yè)數(shù)據(jù)可以為改善教與學(xué)的效果提供有效的數(shù)據(jù)支持。例如,可以通過對某個學(xué)生以往答題和作業(yè)情況的分析,針對不足提供個性化的教學(xué)。學(xué)生可以很容易找到自己的不足之處,教師也可以針對學(xué)生不足,單獨進行輔導(dǎo)。教師也可以通過對全班或某個群體的以往數(shù)據(jù)縱向(不同時間段間)與橫向(不同個體間)的分析,開展有針對性的教學(xué)。但是,目前的處理方法很難滿足這方面的需求。
[0006]現(xiàn)有技術(shù)中,還存在采用計算機自動進行閱卷的形式,主要包括以下幾種:
[0007]1、采用掃描試卷,教師在電腦前評閱打分。這種方式主要針對大型考試,它改變了教師的紙質(zhì)評閱習(xí)慣。教師必須在電腦上才可以評閱,操作不夠靈活、自然。而且,目前這類系統(tǒng)也沒有相應(yīng)的試題數(shù)據(jù)庫支撐,缺乏數(shù)據(jù)的統(tǒng)計與分析的功能。
[0008]2、采用專用答題卡的形式。這種方式要求答卷人通過填涂來完成答卷,僅適用于選擇、填空等少數(shù)題型。制作答題卡需要額外開銷,且填涂答題方式使用也不夠自然。
[0009]針對以上不足之處,以及教學(xué)單位進一步提高教與學(xué)的效率的需求,目前還不存在能夠較好地滿足人工評判試卷及作業(yè)的自動計分,以及數(shù)據(jù)統(tǒng)計與分析方面需求的計算機自動處理系統(tǒng)與裝置。
【發(fā)明內(nèi)容】
[0010]本發(fā)明的目的在于克服上述處理方式的不足,提供一種高效、成本低廉的人工評判試卷自動采集與數(shù)據(jù)統(tǒng)計處理解決方案。其特點是采用高速掃描儀,能夠高速地定位和識別試卷及作業(yè)中相關(guān)信息及評分結(jié)果,并可以完成試卷及作業(yè)圖像的壓縮保存和檢索。它可以實現(xiàn)人工評判試卷及作業(yè)的自動圖像采集、手寫評分的自動識別與統(tǒng)計、歷史數(shù)據(jù)分析、快速試卷及得分?jǐn)?shù)據(jù)查詢等,可以滿足人工評判試卷及作業(yè)的計算機自動化處理的需要。
[0011]本發(fā)明的技術(shù)方案為:
[0012]基于OCR的人工評判試卷處理裝置,其特征在于,包括:試題導(dǎo)入模塊、高速圖像采集裝置、圖形處理與識別模塊、圖像數(shù)據(jù)庫、試卷圖像及評分?jǐn)?shù)據(jù)庫的檢索模塊、歷史數(shù)據(jù)分析模塊;其中圖形處理與識別模塊,包括試卷條碼識別模塊、試卷版面分析與定位模塊、OCR識別模塊、校正模塊、試卷圖像的快速壓縮保存模塊;
[0013]試題導(dǎo)入模塊,用于將試卷及作業(yè)中的試題,以及試卷分類信息導(dǎo)入到圖像數(shù)據(jù)庫中進行保存;
[0014]高速圖像采集裝置,用于采集已作答的試卷及作業(yè)圖像,并將采集到的圖像數(shù)據(jù)信息通過試卷圖像的快速壓縮保存模塊處理后送至圖像數(shù)據(jù)庫中;
[0015]試卷條碼識別模塊,用于識別試卷中的條碼信息,并將識別的條碼信息送至試卷圖像的快速壓縮保存模塊處理;試卷版面分析與定位模塊,用于對試卷及作業(yè)圖像中的信息進行定位與分割,分割得到手寫字符圖像區(qū)域,并將手寫字符圖像區(qū)域送至OCR識別模塊做進一步處理;0CR識別模塊,對手寫字符圖像區(qū)域進行高精度識別,并將識別結(jié)果數(shù)據(jù)送至試卷圖像的快速壓縮保存模塊處理;校正模塊,將OCR識別模塊中得到的識別結(jié)果數(shù)據(jù)及可信度信息與需要識別處理的試卷及作業(yè)的所有學(xué)生信息進行校對、校正,并將處理的數(shù)據(jù)送至試卷圖像的快速壓縮保存模塊處理;試卷圖像的快速壓縮保存模塊,用于將高速圖像采集裝置采集的圖像進行快速壓縮保存到圖像數(shù)據(jù)庫中,并將試卷條碼識別模塊識別的條碼信息,OCR識別模塊、校正模塊處理的數(shù)據(jù)信息進行關(guān)聯(lián),保存到圖像數(shù)據(jù)庫中;
[0016]試卷圖像及評分?jǐn)?shù)據(jù)庫的檢索模塊,用于實現(xiàn)圖像數(shù)據(jù)庫中的關(guān)聯(lián)數(shù)據(jù)檢索,檢索內(nèi)容包括姓名、班級、學(xué)號、科目及數(shù)據(jù)時間段,并對相應(yīng)數(shù)據(jù)依據(jù)得分結(jié)果給出統(tǒng)計結(jié)果;
[0017]歷史數(shù)據(jù)分析模塊,用于實現(xiàn)以往試卷及作業(yè)的得分情況的縱向(不同時間段間)與橫向(不同個體間)的統(tǒng)計數(shù)據(jù)分析。
[0018]基于OCR的人工評判試卷方法,其特征在于:包括如下步驟:
[0019]1)試卷及作業(yè)的導(dǎo)入,將試卷及作業(yè)中試題,以及試卷分類信息導(dǎo)入到圖像數(shù)據(jù)庫中;
[0020]2)掃描并采集試卷及作業(yè)的圖像數(shù)據(jù)信息,并將采集到的圖像數(shù)據(jù)信息通過試卷圖像的快速壓縮保存模塊處理后送至圖像數(shù)據(jù)庫中;
[0021]3)通過試卷條碼識別模塊獲取試卷條碼信息;
[0022]4)通過試卷版面分析與定位模塊對試卷及作業(yè)圖像中的信息進行定位與分割,分割出待識別的字符圖像區(qū)域,并將手寫字符圖像區(qū)域送至OCR識別模塊,進行手寫字符的高精度識別;
[0023]5)0CR識別模塊對手寫字符圖形區(qū)域塊進行高精度識別,并將識別結(jié)果數(shù)據(jù)、識別可信度信息送至校正模塊進行校正;
[0024]6)校正模塊讀入需要識別處理的試卷及作業(yè)的所有學(xué)生信息,并將讀入數(shù)據(jù)與OCR識別模塊識別的數(shù)據(jù)進行比較,并將處理的數(shù)據(jù)送至試卷圖像的快速壓縮保存模塊處理;
[0025]7)建立試卷條碼信息,校正模塊校正后獲取的學(xué)生個人信息、以及評分結(jié)果分別與試卷及作業(yè)圖像建立有效的關(guān)聯(lián),并與圖像數(shù)據(jù)一起,壓縮保存到圖像數(shù)據(jù)庫中。
[0026]本發(fā)明與已有的技術(shù)相比,具有如下優(yōu)點:
[0027]1、高速數(shù)據(jù)采集與存儲,本裝置采用高速掃描儀進行人工評判試卷及作業(yè)的圖像采集,能夠?qū)崿F(xiàn)快速地圖像數(shù)據(jù)采集與壓縮存儲。
[0028]2、評分結(jié)果的快速、準(zhǔn)確自動識別與統(tǒng)計,本系統(tǒng)采用OCR技術(shù)對試卷及作業(yè)中的相關(guān)信息,包括分類信息(包括科目、章節(jié)等)、答卷人信息、手寫評分結(jié)果等進行自動快速、高準(zhǔn)確度的識別,并進行計分統(tǒng)計。
[0029]3、快速試卷得分?jǐn)?shù)據(jù)查詢與統(tǒng)計,系統(tǒng)通過將試卷中的試題信息與評分信息進行有效的數(shù)據(jù)關(guān)聯(lián),并構(gòu)建試卷及評分?jǐn)?shù)據(jù)庫,可以實現(xiàn)以往試卷及作業(yè)得分情況的快速查詢,以及數(shù)據(jù)統(tǒng)計。系統(tǒng)可以為個性化的教學(xué)提供數(shù)據(jù)支持。
[0030]4、歷史數(shù)據(jù)分析,系統(tǒng)的試卷分析模塊提供以往試卷及作業(yè)的得分情況的縱向(不同時間段間)與橫向(不同個體間)的統(tǒng)計數(shù)據(jù)分析。通過數(shù)據(jù)統(tǒng)計分析,為教師開展有效的教學(xué)管理提供決策依據(jù)。
[0031]另外,評判后的試卷及作業(yè)在放入高速掃描儀時,無需按順序放置,甚至可以倒置而不會影響識別與統(tǒng)計結(jié)果,避免了繁瑣的試卷整理工作。
【附圖說明】
[0032]圖1是基于OCR的人工評判試卷處理裝置的結(jié)構(gòu)框圖。
[0033]圖2為基于OCR的評判試卷方法的流程框圖。
【具體實施方式】
[0034]為了使本發(fā)明實現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,下面結(jié)合圖示與具體實施例,進一步闡述本發(fā)明。
[0035]如圖1所示,基于OCR的人工評判試卷處理裝置,包括試題導(dǎo)入模塊1、高速圖像采集裝置2、圖形處理與識別模塊、圖像數(shù)據(jù)庫7、試卷圖像及評分?jǐn)?shù)據(jù)庫的檢索模塊8、歷史數(shù)據(jù)分析模塊9。圖形處理與識別模塊包括試卷條碼識別模塊3、試卷版面分析與定位模塊4、OCR識別模塊5、校正模塊6、試卷圖像的快速壓縮保存模塊7。
[0036]試題導(dǎo)入模塊,負(fù)責(zé)將試卷及作業(yè)中試題,以及試卷分類信息(包括科目、章節(jié)等)等導(dǎo)入到圖像數(shù)據(jù)庫中進行保存。
[0037]高速圖像采集裝置,通過對高速掃描儀進行控制,并將采集的試卷及作業(yè)圖像傳輸?shù)礁咝阅茈娔X,并通過試卷圖像的快速壓縮保存模塊處理后送至圖像數(shù)據(jù)庫進行存儲。
[0038]試卷條碼識別模塊,用于識別試卷中的條碼信息,并將識別的條碼信息送至試卷圖像的快速壓縮保存模塊處理;
[0039]試卷版面分析與定位模塊,用于對試卷及作業(yè)圖像中的信息進行定位與分割,分割得到手寫字符圖像區(qū)域,并將手寫字符圖像區(qū)域送至OCR識別模塊做進一步處理;
[0040]OCR識別模塊,對手寫字符圖像區(qū)域進行高精度識別,并將識別結(jié)