用于文字性客觀題的智能閱卷方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種用于文字性客觀題的智能閱卷方法及系統(tǒng),該方法包括:獲取文字性客觀題答案圖像;對(duì)所述答案圖像進(jìn)行切分,獲得待識(shí)別答案字符串的一個(gè)或多個(gè)切分結(jié)果;判斷是否有字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果;如果沒(méi)有,則確定答案錯(cuò)誤;否則,計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度,和/或計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度;根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確。利用本發(fā)明,可以實(shí)現(xiàn)文字性客觀題的自動(dòng)閱卷,減少人力資源消耗,提高閱卷效率及準(zhǔn)確性。
【專利說(shuō)明】用于文字性客觀題的智能閱卷方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息處理【技術(shù)領(lǐng)域】,具體涉及一種用于文字性客觀題的智能閱卷方法 及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)技術(shù)和教育信息化的不斷推進(jìn),計(jì)算機(jī)和人工智能技術(shù)已經(jīng)逐步應(yīng)用 于日常的教育教學(xué)各項(xiàng)活動(dòng)中,在教學(xué)輔助、教學(xué)評(píng)測(cè)等實(shí)際應(yīng)用場(chǎng)景下都得到了相應(yīng)的 應(yīng)用。國(guó)內(nèi)現(xiàn)有的基礎(chǔ)教育、學(xué)生學(xué)習(xí)狀況的主要考察形式仍是各種類型的考試或測(cè)試,在 此狀況下,教師背負(fù)著很大的批改作業(yè)和試卷的工作壓力。針對(duì)這種現(xiàn)象,在大中型或重要 性高的考試或測(cè)試中已經(jīng)逐漸推廣和采用了各類自動(dòng)閱卷系統(tǒng),這類系統(tǒng)能夠一定程度上 減輕教師閱卷的工作量。
[0003] 然而,在現(xiàn)有的自動(dòng)閱卷系統(tǒng)中,完全由計(jì)算機(jī)完成閱卷的部分多是對(duì)填涂性客 觀題(如選擇題)的閱卷,而對(duì)于像填空題等文字性客觀試題的閱卷,現(xiàn)今仍需要大量的教 師集中進(jìn)行,且在大型考試閱卷前還需要對(duì)閱卷老師進(jìn)行集中培訓(xùn)、考試。因此,傳統(tǒng)的自 動(dòng)閱卷系統(tǒng)人力資源消耗仍然較大,且在閱卷時(shí)因不同教師風(fēng)格、情緒、心理狀態(tài)等主觀性 因素可能造成判卷結(jié)果出現(xiàn)不公平不公正的現(xiàn)象。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實(shí)施例提供一種用于文字性客觀題的智能閱卷方法及系統(tǒng),以實(shí)現(xiàn)文字性 客觀題的自動(dòng)閱卷,減少人力資源消耗,提高閱卷效率及準(zhǔn)確性。
[0005] 為此,本發(fā)明實(shí)施例提供如下技術(shù)方案:
[0006] -種用于文字性客觀題的智能閱卷方法,包括:
[0007] 獲取文字性客觀題答案圖像;
[0008] 對(duì)所述答案圖像進(jìn)行切分,獲得待識(shí)別答案字符串的一個(gè)或多個(gè)切分結(jié)果;
[0009] 判斷是否有字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果;
[0010] 如果沒(méi)有,則確定答案錯(cuò)誤;
[0011] 否則,計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度,和/或計(jì)算 所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度;
[0012] 根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確。
[0013] 優(yōu)選地,所述獲取文字性客觀題答案圖像包括:
[0014] 獲取答題卡圖像;
[0015] 根據(jù)答題卡布局信息,分割并提取目標(biāo)答題區(qū)域;
[0016] 從所述目標(biāo)答題區(qū)域提取文字性客觀題答案圖像。
[0017] 優(yōu)選地,所述獲取答題卡圖像包括:
[0018] 利用光標(biāo)閱讀設(shè)備、或者高拍儀、或者移動(dòng)終端設(shè)備獲取答題卡圖像。
[0019] 優(yōu)選地,所述對(duì)所述答案圖像進(jìn)行切分,獲得待識(shí)別答案字符串的一個(gè)或多個(gè)切 分結(jié)果包括:
[0020] 對(duì)所述答案圖像進(jìn)行細(xì)切分,得到多個(gè)細(xì)切分子塊;
[0021] 對(duì)所述細(xì)切分子塊進(jìn)行合并,并計(jì)算合并可信度;
[0022] 根據(jù)所述可信度確定合并結(jié)果,得到待識(shí)別答案字符串的一個(gè)或多個(gè)切分結(jié)果。
[0023] 優(yōu)選地,所述計(jì)算合并可信度包括:
[0024] 提取合并得到的字符的字符特征;
[0025] 利用預(yù)先訓(xùn)練得到的規(guī)則統(tǒng)計(jì)模型和所述字符特征計(jì)算該合并的可信度。
[0026] 優(yōu)選地,所述計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度包括:
[0027] 將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文本字串對(duì)齊;
[0028] 基于全字符集的聲學(xué)模型及通用的語(yǔ)言模型,對(duì)所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的 切分結(jié)果進(jìn)行手寫解碼識(shí)別,得到各識(shí)別結(jié)果的似然得分;
[0029] 選取識(shí)別結(jié)果中解碼路徑與標(biāo)準(zhǔn)答案一致的路徑的似然得分;
[0030] 計(jì)算所述路徑的后驗(yàn)得分,并將所述后驗(yàn)得分作為所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同 的切分結(jié)果的識(shí)別置信度;
[0031] 相應(yīng)地,所述根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確包括:
[0032] 如果有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度大于第一置信度 閾值,則確定答案正確;否則確定答案錯(cuò)誤。
[0033] 優(yōu)選地,所述計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信 度包括:
[0034] 將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文本字串對(duì)齊;
[0035] 基于全字符集的聲學(xué)模型,計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字 符的識(shí)別結(jié)果的似然得分;
[0036] 選取所述識(shí)別結(jié)果中與標(biāo)準(zhǔn)答案一致的字符的識(shí)別結(jié)果的似然得分;
[0037] 計(jì)算選取的識(shí)別結(jié)果的后驗(yàn)得分,并將所述后驗(yàn)得分作為所述字符的識(shí)別置信 度;
[0038] 相應(yīng)地,所述根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確包括:
[0039] 如果有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度均大于 第二置信度閾值,則確定答案正確;否則確定答案錯(cuò)誤。
[0040] 優(yōu)選地,所述計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信 度包括:
[0041] 將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文本字串對(duì)齊;
[0042] 基于全字符集的聲學(xué)模型及通用的語(yǔ)言模型,對(duì)所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的 切分結(jié)果進(jìn)行手寫解碼識(shí)別,得到各識(shí)別結(jié)果的似然得分;
[0043] 計(jì)算各識(shí)別結(jié)果的后驗(yàn)概率,并根據(jù)各識(shí)別結(jié)果的后驗(yàn)概率,針對(duì)所述切分結(jié)果 中的每個(gè)字符,累積各識(shí)別結(jié)果中該字符的識(shí)別結(jié)果與標(biāo)準(zhǔn)答案一致的后驗(yàn)概率,并將該 后驗(yàn)概率作為該字符的置信度;
[0044] 相應(yīng)地,所述根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確包括:
[0045] 如果有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度均大于 第三置信度閾值,則確定答案正確;否則確定答案錯(cuò)誤。
[0046] -種用于文字性客觀題的智能閱卷系統(tǒng),包括:
[0047] 圖像獲取模塊,用于獲取文字性客觀題答案圖像;
[0048] 切分模塊,用于對(duì)所述答案圖像進(jìn)行切分,獲得待識(shí)別答案字符串的一個(gè)或多個(gè) 切分結(jié)果;
[0049] 第一判斷模塊,用于判斷是否有字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果,并在判斷 結(jié)果為沒(méi)有與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果時(shí),觸發(fā)輸出模塊輸出答案錯(cuò)誤的指示信息; 否則,觸發(fā)計(jì)算模塊進(jìn)行識(shí)別置信度計(jì)算;;
[0050] 所述計(jì)算模塊包括:第一計(jì)算模塊、和/或第二計(jì)算模塊;所述第一計(jì)算模塊用于 計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度,所述第二計(jì)算模塊用于計(jì)算 所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度;
[0051] 第二判斷模塊,用于根據(jù)所述計(jì)算模塊計(jì)算得到的識(shí)別置信度確定答案是否正 確,并在判斷答案正確時(shí),觸發(fā)所述輸出模塊輸出答案正確的指示信息;在判斷答案錯(cuò)誤 時(shí),觸發(fā)所述輸出模塊輸出答案錯(cuò)誤的指示信息。
[0052] 優(yōu)選地,所述圖像獲取模塊包括:
[0053] 圖像獲取單元,用于獲取答題卡圖像;
[0054] 答題區(qū)域提取單元,用于根據(jù)答題卡布局信息,分割并提取目標(biāo)答題區(qū)域;
[0055] 答案內(nèi)容提取單元,從所述目標(biāo)答題區(qū)域提取文字性客觀題答案圖像。
[0056] 優(yōu)選地,所述圖像獲取單元具體為光標(biāo)閱讀設(shè)備、或者高拍儀、或者移動(dòng)終端設(shè) 備。
[0057] 優(yōu)選地,所述切分模塊包括:
[0058] 切分單元,用于對(duì)所述答案圖像進(jìn)行細(xì)切分,得到多個(gè)細(xì)切分子塊;
[0059] 可信度計(jì)算單元,用于對(duì)所述細(xì)切分子塊進(jìn)行合并,并計(jì)算合并可信度;
[0060] 合并結(jié)果確定單元,用于根據(jù)所述可信度確定合并結(jié)果,得到待識(shí)別答案字符串 的一個(gè)或多個(gè)切分結(jié)果。
[0061] 優(yōu)選地,所述可信度計(jì)算單元包括:
[0062] 合并子單元,用于對(duì)所述細(xì)切分子塊進(jìn)行合并;
[0063] 提取子單元,用于提取合并得到的字符的字符特征;
[0064] 計(jì)算子單元,用于利用預(yù)先訓(xùn)練得到的規(guī)則統(tǒng)計(jì)模型和所述字符特征計(jì)算該合并 的可信度。
[0065] 優(yōu)選地,所述第一計(jì)算模塊包括:
[0066] 對(duì)齊單元,用于將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文 本字串對(duì)齊;
[0067] 第一識(shí)別單元,用于基于全字符集的聲學(xué)模型及通用的語(yǔ)言模型,對(duì)所述字?jǐn)?shù)與 標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果進(jìn)行手寫解碼識(shí)別,得到各識(shí)別結(jié)果的似然得分;
[0068] 第一選擇單元,用于選取識(shí)別結(jié)果中解碼路徑與標(biāo)準(zhǔn)答案一致的路徑的似然得 分;
[0069] 第一計(jì)算單元,用于計(jì)算所述路徑的后驗(yàn)得分,并將所述后驗(yàn)得分作為所述切分 結(jié)果的識(shí)別置信度;
[0070] 所述第二判斷模塊具體用于在有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí) 別置信度大于第一置信度閾值時(shí),判斷答案正確;否則判斷答案錯(cuò)誤。
[0071] 優(yōu)選地,所述第二計(jì)算模塊包括:
[0072] 對(duì)齊單元,用于將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文 本字串對(duì)齊;
[0073] 第二識(shí)別單元,用于基于全字符集的聲學(xué)模型,計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相 同的切分結(jié)果中各字符的識(shí)別結(jié)果的似然得分;
[0074] 第二選擇單元,用于選取所述識(shí)別結(jié)果中與標(biāo)準(zhǔn)答案一致的字符的識(shí)別結(jié)果的似 然得分;
[0075] 第二計(jì)算單元,用于計(jì)算選取的識(shí)別結(jié)果的后驗(yàn)得分,并將所述后驗(yàn)得分作為所 述字符的識(shí)別置信度;
[0076] 所述第二判斷模塊具體用于在有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各 字符的識(shí)別置信度均大于第二置信度閾值時(shí),判斷答案正確;否則判斷答案錯(cuò)誤。
[0077] 優(yōu)選地,所述第二計(jì)算模塊包括:
[0078] 對(duì)齊單元,用于將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文 本字串對(duì)齊;
[0079] 第一識(shí)別單元,用于基于全字符集的聲學(xué)模型及通用的語(yǔ)言模型,對(duì)所述字?jǐn)?shù)與 標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果進(jìn)行手寫解碼識(shí)別,得到各識(shí)別結(jié)果的似然得分;
[0080] 第三計(jì)算單元,用于計(jì)算各識(shí)別結(jié)果的后驗(yàn)概率,并根據(jù)各識(shí)別結(jié)果的后驗(yàn)概率, 針對(duì)所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中的每個(gè)字符,累積各識(shí)別結(jié)果中該字符的 識(shí)別結(jié)果與標(biāo)準(zhǔn)答案一致的后驗(yàn)概率,并將該后驗(yàn)概率作為該字符的置信度;
[0081] 所述第二判斷模塊具體用于在有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各 字符的識(shí)別置信度均大于第三置信度閾值時(shí),判斷答案正確;否則判斷答案錯(cuò)誤。
[0082] 本發(fā)明實(shí)施例提供的用于文字性客觀題的智能閱卷方法及系統(tǒng),對(duì)已知標(biāo)準(zhǔn)答案 的文字性客觀題,利用答案的先驗(yàn)信息輔助進(jìn)行手寫字符串的識(shí)別,從而完成文字性客觀 題的自動(dòng)閱卷,解決了傳統(tǒng)自動(dòng)閱卷系統(tǒng)因不能應(yīng)用計(jì)算機(jī)完全自動(dòng)進(jìn)行文字性客觀題閱 卷,而采用人工閱卷帶來(lái)的人力資源消耗大、教師工作壓力大、因教師主觀因素導(dǎo)致的判卷 結(jié)果不準(zhǔn)確等問(wèn)題。
【專利附圖】
【附圖說(shuō)明】
[0083]為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所 需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一 些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,還可以根據(jù)這些附圖獲得其他的附圖。
[0084] 圖1是本發(fā)明實(shí)施例用于文字性客觀題的智能閱卷方法的流程圖;
[0085] 圖2是本發(fā)明實(shí)施例中答案圖像切分示例;
[0086] 圖3是本發(fā)明實(shí)施例中對(duì)答案圖像進(jìn)行切分的流程圖;
[0087] 圖4是本發(fā)明實(shí)施例中計(jì)算識(shí)別置信度的一種流程圖;
[0088] 圖5是本發(fā)明實(shí)施例中計(jì)算識(shí)別置信度的另一種流程圖;;
[0089] 圖6是本發(fā)明實(shí)施例中計(jì)算識(shí)別置信度的另一種流程圖;;
[0090] 圖7是本發(fā)明實(shí)施例用于文字性客觀題的智能閱卷系統(tǒng)的結(jié)構(gòu)示意圖;
[0091] 圖8是本發(fā)明實(shí)施例中第一計(jì)算模塊的結(jié)構(gòu)框圖;
[0092] 圖9是本發(fā)明實(shí)施例中第二計(jì)算模塊的一種結(jié)構(gòu)框圖;
[0093] 圖10是本發(fā)明實(shí)施例中第二計(jì)算模塊的另一種結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0094] 為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明實(shí)施例的方案,下面結(jié)合附圖和實(shí)施 方式對(duì)本發(fā)明實(shí)施例作進(jìn)一步的詳細(xì)說(shuō)明。
[0095] 本發(fā)明實(shí)施例用于文字性客觀題的智能閱卷方法及系統(tǒng),,針對(duì)具有標(biāo)準(zhǔn)答案的 文字性試題(比如填空題)的考卷,利用標(biāo)準(zhǔn)答案的先驗(yàn)信息輔助進(jìn)行手寫字符串的識(shí)別, 從而完成文字性客觀題的自動(dòng)閱卷。
[0096] 如圖1所示,是本發(fā)明實(shí)施例用于文字性客觀題的智能閱卷方法的流程圖,包括 以下步驟:
[0097] 步驟101,獲取文字性客觀題答案圖像。
[0098] 所述文字性客觀題答案圖像即為答案字符串圖像,在本發(fā)明實(shí)施例中,所述答案 字符串可以是中文字串、英文字串等。
[0099] 獲取答案圖像的具體過(guò)程如下:
[0100] ⑴獲取答題卡圖像。
[0101] 答題卡圖像的獲取可以采用光標(biāo)閱讀設(shè)備進(jìn)行掃描,或者采用高拍儀、移動(dòng)終端 等設(shè)備進(jìn)行拍照獲取。
[0102] (2)根據(jù)答題卡布局信息,分割并提取目標(biāo)答題區(qū)域。
[0103] 在實(shí)際應(yīng)用中,在分割提取目標(biāo)答題區(qū)域之前,可以先對(duì)答題卡圖像進(jìn)行預(yù)處理, 以提取到準(zhǔn)確的目標(biāo)答題區(qū)域。所述預(yù)處理可以包括:對(duì)答題卡圖像進(jìn)行定位、校準(zhǔn)、降噪、 對(duì)比度增強(qiáng)、灰度化等操作,具體處理方法與現(xiàn)有的自動(dòng)閱卷系統(tǒng)中答題卡圖像預(yù)處理方 法相同,在此不再贅述。
[0104] 答題卡布局信息是已知的先驗(yàn)信息,如果需要對(duì)答題卡圖像進(jìn)行定位,則還可獲 得答題卡圖像的定位信息,根據(jù)這些信息,再通過(guò)邊緣檢測(cè)即可準(zhǔn)確地分割并提取目標(biāo)答 題區(qū)域。
[0105] (3)從所述目標(biāo)答題區(qū)域提取文字性客觀題答案圖像。
[0106] 在得到目標(biāo)答題區(qū)域后,根據(jù)答題卡布局信息,再通過(guò)邊緣點(diǎn)檢測(cè)即可得到答案 圖像,該答案圖像是答案字符串的圖像。
[0107] 步驟102,對(duì)所述答案圖像進(jìn)行切分,獲得待識(shí)別答案字符串的一個(gè)或多個(gè)切分結(jié) 果。
[0108] 具體切分過(guò)程將在后面詳細(xì)說(shuō)明。
[0109] 另外,需要說(shuō)明的是,在實(shí)際應(yīng)用中,在對(duì)所述答案圖像進(jìn)行切分之前,還可以對(duì) 答案圖像進(jìn)行預(yù)處理,以得到更準(zhǔn)確的切分結(jié)果。所述預(yù)處理可以包括:對(duì)答案圖像進(jìn)行二 值化處理、矯正手寫筆跡傾斜、筆跡細(xì)化等。
[0110] 步驟103,判斷是否有字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果。如果有,則執(zhí)行步驟 104 ;否則,執(zhí)行步驟106。
[0111] 由于會(huì)有多種不同的合并結(jié)果,因此在步驟102得到的多個(gè)切分結(jié)果的字?jǐn)?shù)也會(huì) 有所不同,而與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果是最有可能正確的答案。由于本發(fā)明方案所 針對(duì)的是具有標(biāo)準(zhǔn)答案的文字性客觀試題,,因此,如果字?jǐn)?shù)不同,即可確定答案是錯(cuò)誤的。 如果切分結(jié)果的字?jǐn)?shù)與標(biāo)準(zhǔn)答案的字?jǐn)?shù)相同,則需要進(jìn)一步來(lái)判斷該答案是否正確。
[0112] 步驟104,計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度,和/或計(jì) 算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度。
[0113] 步驟105,根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確。
[0114] 識(shí)別置信度的計(jì)算方式可以有多種,相應(yīng)地,根據(jù)不同計(jì)算方式得到的識(shí)別置信 度來(lái)確定答案是否正確也有相應(yīng)的判斷,具體將在后面詳細(xì)說(shuō)明。
[0115] 步驟106,確定答案錯(cuò)誤。
[0116] 本發(fā)明實(shí)施例提供的用于文字性客觀題的智能閱卷方法,,對(duì)已知標(biāo)準(zhǔn)答案的文 字性客觀題,利用答案的先驗(yàn)信息輔助進(jìn)行手寫字符串的識(shí)別,從而完成文字性客觀題的 自動(dòng)閱卷,解決了傳統(tǒng)自動(dòng)閱卷系統(tǒng)因不能應(yīng)用計(jì)算機(jī)完全自動(dòng)進(jìn)行文字性客觀題閱卷, 而采用人工閱卷帶來(lái)的人力資源消耗大、教師工作壓力大、因教師主觀因素導(dǎo)致的判卷結(jié) 果不準(zhǔn)確等問(wèn)題。
[0117] 如圖3所示,是本發(fā)明實(shí)施例中對(duì)答案圖像進(jìn)行切分的流程圖,包括以下步驟:
[0118] 步驟301,對(duì)答案圖像進(jìn)行細(xì)切分,得到多個(gè)細(xì)切分子塊。
[0119] 比如,從答案圖像的最左上端的黑像素點(diǎn)開始進(jìn)行8鄰域黑色擴(kuò)展,從而將整幅 圖像劃分成幾個(gè)由黑色像素組成的連通子區(qū)域,如圖3所示是一個(gè)切分示例,可以看到通 過(guò)將黑色筆跡部分進(jìn)行連通域的分割后,原來(lái)的一個(gè)字符串圖像被切分成了幾個(gè)片段,這 些片段都是組成單字的部件,依書寫方式不同可能是偏旁部首也可能是單一筆跡部分,這 些片段進(jìn)行組合后就會(huì)組成不同的字符。
[0120] 步驟302,對(duì)所述細(xì)切分子塊進(jìn)行合并,并計(jì)算合并可信度。
[0121] 比如,可以對(duì)細(xì)切分子塊進(jìn)行窮舉性合并,即將所有可能的合并都一一進(jìn)行,比如 有5個(gè)細(xì)切分子塊,有以下幾種合并:
[0122] (1)假設(shè)為一個(gè)字符,則將細(xì)切分子塊1、2、3、4、5進(jìn)行合并;
[0123] (2)假設(shè)為二個(gè)字符,則將細(xì)切分子塊1、2、3、4進(jìn)行合并;將細(xì)切分子塊1、2、3合 并、并將細(xì)切分子塊4、5合并;將細(xì)切分子塊1、2合并、并將細(xì)切分子塊3、4、5合并;將細(xì)切 分子塊2、3、4、5合并;
[0124] 依此類推,一直假設(shè)到為五個(gè)字符。
[0125] 所述合并可信度代表了合并后得到的字符的準(zhǔn)確度,具體地,可以提取出合并后 字符的高度、寬度、高寬比、字符外間距、字符內(nèi)間距等特征,根據(jù)系統(tǒng)預(yù)先訓(xùn)練的規(guī)則統(tǒng)計(jì) 模型得到似然得分,將該得分作為當(dāng)前合并結(jié)果的可信度。
[0126] 所述規(guī)則統(tǒng)計(jì)模型是根據(jù)提取出的訓(xùn)練數(shù)據(jù)切分后字符的高度、寬度、高寬比、字 符外間距、字符內(nèi)間距等特征,訓(xùn)練出的統(tǒng)計(jì)模型,該模型可以是GMM(Gaussian Mixture Model,高斯混合模型)或SVM(Support Vector Machine,支持向量機(jī))等。
[0127] 合并可信度的計(jì)算,即計(jì)算合并結(jié)果所提取的特征通過(guò)規(guī)則統(tǒng)計(jì)模型計(jì)算出的似 然得分(即合并得分),并根據(jù)該得分確定合并可信度,也可以直接將該得分作為對(duì)應(yīng)的合 并可信度。
[0128] 步驟303,根據(jù)所述可信度確定合并結(jié)果,得到待識(shí)別答案字符串的一個(gè)或多個(gè)切 分結(jié)果。
[0129] 具體地,如果可信度大于設(shè)定的閾值,則認(rèn)為該合并是可信的,否則認(rèn)為該合并是 不可信的。進(jìn)而根據(jù)可信的合并結(jié)果得到一個(gè)或多個(gè)待識(shí)別答案字符串。
[0130] 需要說(shuō)明的是,在實(shí)際應(yīng)用中,在合并前或在判斷合并可信度時(shí),還可以根據(jù)經(jīng)驗(yàn) 或?qū)嶒?yàn)設(shè)定一些判斷規(guī)則,比如一個(gè)漢字的筆跡不超過(guò)3個(gè)細(xì)切分子塊等,以進(jìn)一步輔助 或指導(dǎo)完成字符串切分結(jié)果是否正確的判斷,提高判斷的準(zhǔn)確性。
[0131] 在本發(fā)明實(shí)施例中,需要計(jì)算字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的各切分結(jié)果的識(shí)別置信 度,和/或計(jì)算字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的各切分結(jié)果中每個(gè)字符的識(shí)別置信度,并根據(jù) 計(jì)算得到的識(shí)別置信度確定答案是否正確。在實(shí)際應(yīng)用中,可以有多種計(jì)算及判斷方法,下 面將分別加以說(shuō)明。
[0132] 如圖4所示,是本發(fā)明實(shí)施例中計(jì)算識(shí)別置信度的一種流程圖。在該實(shí)施例中,需 要計(jì)算各切分結(jié)果的識(shí)別似然得分,然后根據(jù)該識(shí)別似然得分計(jì)算該切分結(jié)果的識(shí)別置信 度。
[0133] 針對(duì)每個(gè)字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果,計(jì)算其識(shí)別置信度的具體過(guò)程包 括以下步驟:
[0134] 步驟401,將切分結(jié)果與標(biāo)準(zhǔn)答案的文本字串對(duì)齊。
[0135] 也就是說(shuō),將切分結(jié)果中的各切分片段(每個(gè)切分片段代表了一個(gè)字符)順序與 標(biāo)準(zhǔn)答案的文本字串中的各字符一一對(duì)齊。
[0136] 步驟402,基于全字符集的聲學(xué)模型及通用的語(yǔ)言模型,對(duì)所述切分結(jié)果進(jìn)行手寫 解碼識(shí)別,得到各識(shí)別結(jié)果的似然得分。
[0137] 所述語(yǔ)言模型可以是N-Gram模型,具體計(jì)算公式為:
[0138]
【權(quán)利要求】
1. 一種用于文字性客觀題的智能閱卷方法,其特征在于,包括: 獲取文字性客觀題答案圖像; 對(duì)所述答案圖像進(jìn)行切分,獲得待識(shí)別答案字符串的一個(gè)或多個(gè)切分結(jié)果; 判斷是否有字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果; 如果沒(méi)有,則確定答案錯(cuò)誤; 否則,計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度,和/或計(jì)算所述 字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度; 根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取文字性客觀題答案圖像包括: 獲取答題卡圖像; 根據(jù)答題卡布局信息,分割并提取目標(biāo)答題區(qū)域; 從所述目標(biāo)答題區(qū)域提取文字性客觀題答案圖像。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取答題卡圖像包括: 利用光標(biāo)閱讀設(shè)備、或者高拍儀、或者移動(dòng)終端設(shè)備獲取答題卡圖像。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述答案圖像進(jìn)行切分,獲得待識(shí) 別答案字符串的一個(gè)或多個(gè)切分結(jié)果包括: 對(duì)所述答案圖像進(jìn)行細(xì)切分,得到多個(gè)細(xì)切分子塊; 對(duì)所述細(xì)切分子塊進(jìn)行合并,并計(jì)算合并可信度; 根據(jù)所述可信度確定合并結(jié)果,得到待識(shí)別答案字符串的一個(gè)或多個(gè)切分結(jié)果。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述計(jì)算合并可信度包括: 提取合并得到的字符的字符特征; 利用預(yù)先訓(xùn)練得到的規(guī)則統(tǒng)計(jì)模型和所述字符特征計(jì)算該合并的可信度。
6. 根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于, 所述計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度包括: 將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文本字串對(duì)齊; 基于全字符集的聲學(xué)模型及通用的語(yǔ)言模型,對(duì)所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分 結(jié)果進(jìn)行手寫解碼識(shí)別,得到各識(shí)別結(jié)果的似然得分; 選取識(shí)別結(jié)果中解碼路徑與標(biāo)準(zhǔn)答案一致的路徑的似然得分; 計(jì)算所述路徑的后驗(yàn)得分,并將所述后驗(yàn)得分作為所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切 分結(jié)果的識(shí)別置信度; 所述根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確包括:: 如果有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度大于第一置信度閾值, 則確定答案正確;否則確定答案錯(cuò)誤。
7. 根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于, 所述計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度包括: 將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文本字串對(duì)齊; 基于全字符集的聲學(xué)模型,計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的 識(shí)別結(jié)果的似然得分; 選取所述識(shí)別結(jié)果中與標(biāo)準(zhǔn)答案一致的字符的識(shí)別結(jié)果的似然得分; 計(jì)算選取的識(shí)別結(jié)果的后驗(yàn)得分,并將所述后驗(yàn)得分作為所述字符的識(shí)別置信度; 所述根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確包括:: 如果有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度均大于第二 置信度閾值,則確定答案正確;否則確定答案錯(cuò)誤。
8. 根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于, 所述計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度包括: 將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文本字串對(duì)齊; 基于全字符集的聲學(xué)模型及通用的語(yǔ)言模型,對(duì)所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分 結(jié)果進(jìn)行手寫解碼識(shí)別,得到各識(shí)別結(jié)果的似然得分; 計(jì)算各識(shí)別結(jié)果的后驗(yàn)概率,并根據(jù)各識(shí)別結(jié)果的后驗(yàn)概率,針對(duì)所述切分結(jié)果中的 每個(gè)字符,累積各識(shí)別結(jié)果中該字符的識(shí)別結(jié)果與標(biāo)準(zhǔn)答案一致的后驗(yàn)概率,并將該后驗(yàn) 概率作為該字符的置信度; 所述根據(jù)計(jì)算得到的識(shí)別置信度確定答案是否正確包括:: 如果有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度均大于第三 置信度閾值,則確定答案正確;否則確定答案錯(cuò)誤。
9. 一種用于文字性客觀題的智能閱卷系統(tǒng),其特征在于,包括: 圖像獲取模塊,用于獲取文字性客觀題答案圖像; 切分模塊,用于對(duì)所述答案圖像進(jìn)行切分,獲得待識(shí)別答案字符串的一個(gè)或多個(gè)切分 結(jié)果; 第一判斷模塊,用于判斷是否有字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果,并在判斷結(jié)果 為沒(méi)有與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果時(shí),觸發(fā)輸出模塊輸出答案錯(cuò)誤的指示信息;否則, 觸發(fā)計(jì)算模塊進(jìn)行識(shí)別置信度計(jì)算;; 所述計(jì)算模塊包括:第一計(jì)算模塊、和/或第二計(jì)算模塊;所述第一計(jì)算模塊用于計(jì)算 所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置信度,所述第二計(jì)算模塊用于計(jì)算所述 字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符的識(shí)別置信度; 第二判斷模塊,用于根據(jù)所述計(jì)算模塊計(jì)算得到的識(shí)別置信度確定答案是否正確,并 在判斷答案正確時(shí),觸發(fā)所述輸出模塊輸出答案正確的指示信息;在判斷答案錯(cuò)誤時(shí),觸發(fā) 所述輸出模塊輸出答案錯(cuò)誤的指示信息。
10. 根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述圖像獲取模塊包括: 圖像獲取單元,用于獲取答題卡圖像; 答題區(qū)域提取單元,用于根據(jù)答題卡布局信息,分割并提取目標(biāo)答題區(qū)域; 答案內(nèi)容提取單元,從所述目標(biāo)答題區(qū)域提取文字性客觀題答案圖像。
11. 根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述圖像獲取單元具體為光標(biāo)閱讀設(shè) 備、或者高拍儀、或者移動(dòng)終端設(shè)備。
12. 根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述切分模塊包括: 切分單元,用于對(duì)所述答案圖像進(jìn)行細(xì)切分,得到多個(gè)細(xì)切分子塊; 可信度計(jì)算單元,用于對(duì)所述細(xì)切分子塊進(jìn)行合并,并計(jì)算合并可信度; 合并結(jié)果確定單元,用于根據(jù)所述可信度確定合并結(jié)果,得到待識(shí)別答案字符串的一 個(gè)或多個(gè)切分結(jié)果。
13. 根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述可信度計(jì)算單元包括: 合并子單元,用于對(duì)所述細(xì)切分子塊進(jìn)行合并; 提取子單元,用于提取合并得到的字符的字符特征; 計(jì)算子單元,用于利用預(yù)先訓(xùn)練得到的規(guī)則統(tǒng)計(jì)模型和所述字符特征計(jì)算該合并的可 信度。
14. 根據(jù)權(quán)利要求9至13任一項(xiàng)所述的系統(tǒng),其特征在于,所述第一計(jì)算模塊包括: 對(duì)齊單元,用于將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文本字 串對(duì)齊; 第一識(shí)別單元,用于基于全字符集的聲學(xué)模型及通用的語(yǔ)言模型,對(duì)所述字?jǐn)?shù)與標(biāo)準(zhǔn) 答案字?jǐn)?shù)相同的切分結(jié)果進(jìn)行手寫解碼識(shí)別,得到各識(shí)別結(jié)果的似然得分; 第一選擇單元,用于選取識(shí)別結(jié)果中解碼路徑與標(biāo)準(zhǔn)答案一致的路徑的似然得分; 第一計(jì)算單元,用于計(jì)算所述路徑的后驗(yàn)得分,并將所述后驗(yàn)得分作為所述切分結(jié)果 的識(shí)別置信度; 所述第二判斷模塊具體用于在有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果的識(shí)別置 信度大于第一置信度閾值時(shí),判斷答案正確;否則判斷答案錯(cuò)誤。
15. 根據(jù)權(quán)利要求9至13任一項(xiàng)所述的系統(tǒng),其特征在于,所述第二計(jì)算模塊包括: 對(duì)齊單元,用于將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文本字 串對(duì)齊; 第二識(shí)別單元,用于基于全字符集的聲學(xué)模型,計(jì)算所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的 切分結(jié)果中各字符的識(shí)別結(jié)果的似然得分; 第二選擇單元,用于選取所述識(shí)別結(jié)果中與標(biāo)準(zhǔn)答案一致的字符的識(shí)別結(jié)果的似然得 分; 第二計(jì)算單元,用于計(jì)算選取的識(shí)別結(jié)果的后驗(yàn)得分,并將所述后驗(yàn)得分作為所述字 符的識(shí)別置信度; 所述第二判斷模塊具體用于在有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符 的識(shí)別置信度均大于第二置信度閾值時(shí),判斷答案正確;否則判斷答案錯(cuò)誤。
16. 根據(jù)權(quán)利要求9至13任一項(xiàng)所述的系統(tǒng),其特征在于,所述第二計(jì)算模塊包括: 對(duì)齊單元,用于將所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果與所述標(biāo)準(zhǔn)答案的文本字 串對(duì)齊; 第一識(shí)別單元,用于基于全字符集的聲學(xué)模型及通用的語(yǔ)言模型,對(duì)所述字?jǐn)?shù)與標(biāo)準(zhǔn) 答案字?jǐn)?shù)相同的切分結(jié)果進(jìn)行手寫解碼識(shí)別,得到各識(shí)別結(jié)果的似然得分; 第三計(jì)算單元,用于計(jì)算各識(shí)別結(jié)果的后驗(yàn)概率,并根據(jù)各識(shí)別結(jié)果的后驗(yàn)概率,針對(duì) 所述字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中的每個(gè)字符,累積各識(shí)別結(jié)果中該字符的識(shí)別 結(jié)果與標(biāo)準(zhǔn)答案一致的后驗(yàn)概率,并將該后驗(yàn)概率作為該字符的置信度; 所述第二判斷模塊具體用于在有任一字?jǐn)?shù)與標(biāo)準(zhǔn)答案字?jǐn)?shù)相同的切分結(jié)果中各字符 的識(shí)別置信度均大于第三置信度閾值時(shí),判斷答案正確;否則判斷答案錯(cuò)誤。
【文檔編號(hào)】G06K9/68GK104268603SQ201410472818
【公開日】2015年1月7日 申請(qǐng)日期:2014年9月16日 優(yōu)先權(quán)日:2014年9月16日
【發(fā)明者】胡雨隆, 張銀田, 竺博, 魏思, 胡國(guó)平, 胡郁, 劉慶峰 申請(qǐng)人:科大訊飛股份有限公司