本發(fā)明屬于光學(xué)字符識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于人工神經(jīng)網(wǎng)絡(luò)的身份證快速識(shí)別方法及其裝置。
背景技術(shù):
隨著社會(huì)大力發(fā)展移動(dòng)互聯(lián)網(wǎng),特別是google于2007年推出的android手機(jī)平臺(tái),很多應(yīng)用移植到手機(jī)端,手機(jī)不僅僅成為人們常用的通訊工具,更是現(xiàn)代重要生活助手,為人們工作、生活帶來(lái)便捷和快樂(lè)。身份證是每個(gè)成年公民都擁有的,用來(lái)標(biāo)識(shí)個(gè)人身份的最重要的管理工具,已經(jīng)運(yùn)用到社會(huì)生活的方方面面,身份證的信息獲取具有重要的作用。
目前,身份證號(hào)碼的錄入大多采用人工錄入,不但耗時(shí),效率低,并且容易因?yàn)槿斯ぽ斎朐虍a(chǎn)生錯(cuò)誤錄入,造成不必要的損失;而通過(guò)手機(jī)攝像頭拍照快速錄入身份證號(hào)碼能方便得獲取中國(guó)公民的身份信息,其中關(guān)鍵技術(shù)是光學(xué)字符識(shí)別(OCR)。
光學(xué)字符識(shí)別(OCR)國(guó)外很早就開(kāi)始研究,國(guó)內(nèi)從80年代也開(kāi)始研究,是近年來(lái)的熱門(mén)研究方向,其實(shí)現(xiàn)算法也比較多,比如模板匹配、支持向量機(jī)(SVM)和人工神經(jīng)網(wǎng)絡(luò)(ANN);其中,人工神經(jīng)網(wǎng)絡(luò)是“artificial neural network”實(shí)際上就是存在于人腦的生物神經(jīng)網(wǎng)絡(luò),在向生物神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)時(shí),先要充分的了解和研究生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能特點(diǎn)以及構(gòu)造機(jī)理,然后學(xué)習(xí)和實(shí)現(xiàn)所需要的智能功能。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明的主要目的在于提供一種基于人工神經(jīng)網(wǎng)絡(luò)的身份證快速識(shí)別方法及其裝置,
為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
本發(fā)明實(shí)施例提供一種基于人工神經(jīng)網(wǎng)絡(luò)的身份證快速識(shí)別方法,該方法為:移動(dòng)終端將采集的身份證圖像轉(zhuǎn)換為灰度圖像,對(duì)所述轉(zhuǎn)換的灰度圖像進(jìn)行裁剪獲得身份證號(hào)碼區(qū),并且對(duì)該身份證號(hào)碼區(qū)進(jìn)行閾值處理和數(shù)學(xué)形態(tài)學(xué)閉運(yùn)算形成聯(lián)通域,通過(guò)身份證定位確定所述聯(lián)通域內(nèi)存在身份證號(hào)碼后,對(duì)所述聯(lián)通域進(jìn)行字符識(shí)別和輸出。
上述方案中,該方法還包括通過(guò)身份證定位確定所述聯(lián)通域內(nèi)不存在身份證號(hào)碼時(shí),結(jié)束流程停止識(shí)別。
上述方案中,所述移動(dòng)終端將采集的身份證圖像轉(zhuǎn)換為灰度圖像,具體為:將拍攝的身份證圖像按長(zhǎng)寬比例縮小圖像,并且圖像長(zhǎng)度小于600像素,之后,將彩色圖像轉(zhuǎn)換成灰度圖像。
上述方案中,該方法還包括收集字符樣本,讀取每個(gè)字符樣本的特征信息并進(jìn)行計(jì)算將結(jié)果寫(xiě)入XML文件,將每個(gè)字符樣本和對(duì)應(yīng)的特征信息構(gòu)建字符樣本庫(kù);所述字符樣本庫(kù)分為11大類(lèi),每個(gè)大類(lèi)包含100個(gè)字符樣本。
上述方案中,所述對(duì)所述聯(lián)通域進(jìn)行字符識(shí)別和輸出,具體為:識(shí)別聯(lián)通域分割為18個(gè)字符圖像,之后分別確定每個(gè)字符圖像的三個(gè)特征值,對(duì)所述三個(gè)特征值進(jìn)行識(shí)別結(jié)果預(yù)測(cè),將預(yù)測(cè)結(jié)果與字符樣本庫(kù)進(jìn)行對(duì)比,最后,將相似度最大的分類(lèi)作為識(shí)別結(jié)果輸出。
上述方案中,所述通過(guò)身份證定位確定所述聯(lián)通域內(nèi)存在身份證號(hào)碼,具體為:所述移動(dòng)終端通過(guò)一矩形框定位號(hào)碼區(qū)域,實(shí)時(shí)檢測(cè)號(hào)碼所形成的連通域是否在矩形定位框內(nèi),當(dāng)所述號(hào)碼區(qū)域在矩形定位框內(nèi)時(shí)執(zhí)行后續(xù)流程,否則重新采集圖像。
本發(fā)明實(shí)施例還提供一種基于人工神經(jīng)網(wǎng)絡(luò)的身份證快速識(shí)別裝置,該裝置包括:圖像轉(zhuǎn)換單元、定位單元、識(shí)別單元;
所述圖像轉(zhuǎn)換單元,用于將采集的身份證圖像轉(zhuǎn)換為灰度圖像,對(duì)所述轉(zhuǎn)換的灰度圖像進(jìn)行裁剪獲得身份證號(hào)碼區(qū),并且對(duì)該身份證號(hào)碼區(qū)進(jìn)行閾值處理和數(shù)學(xué)形態(tài)學(xué)閉運(yùn)算形成聯(lián)通域;
所述定位單元,用于確定所述聯(lián)通域內(nèi)是否存在身份證號(hào)碼;
所述識(shí)別單元,用于在確定所述聯(lián)通域內(nèi)存在身份證號(hào)碼時(shí),對(duì)所述聯(lián)通域進(jìn)行字符識(shí)別和輸出。
上述方案中,所述圖像轉(zhuǎn)換單元,具體用于將拍攝的身份證圖像按長(zhǎng)寬比例縮小圖像,并且圖像長(zhǎng)度小于600像素,之后,將彩色圖像轉(zhuǎn)換成灰度圖像。
上述方案中,所述識(shí)別單元,還用于收集字符樣本,讀取每個(gè)字符樣本的特征信息并進(jìn)行計(jì)算將結(jié)果寫(xiě)入XML文件,將每個(gè)字符樣本和對(duì)應(yīng)的特征信息構(gòu)建字符樣本庫(kù);所述字符樣本庫(kù)分為11大類(lèi),每個(gè)大類(lèi)包含100個(gè)字符樣本。
上述方案中,所述識(shí)別單元,具體用于識(shí)別聯(lián)通域分割為18個(gè)字符圖像,之后分別確定每個(gè)字符圖像的三個(gè)特征值,對(duì)所述三個(gè)特征值進(jìn)行識(shí)別結(jié)果預(yù)測(cè),將預(yù)測(cè)結(jié)果與字符樣本庫(kù)進(jìn)行對(duì)比,相似度最大的分類(lèi)作為識(shí)別結(jié)果輸出。
與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例提供一種基于人工神經(jīng)網(wǎng)絡(luò)的身份證快速識(shí)別方法,移動(dòng)終端將采集的身份證圖像轉(zhuǎn)換為灰度圖像,對(duì)所述轉(zhuǎn)換的灰度圖像進(jìn)行裁剪獲得身份證號(hào)碼區(qū),并且對(duì)該身份證號(hào)碼區(qū)進(jìn)行閾值處理和數(shù)學(xué)形態(tài)學(xué)閉運(yùn)算形成聯(lián)通域,通過(guò)身份證定位確定所述聯(lián)通域內(nèi)存在身份證號(hào)碼時(shí),對(duì)所述聯(lián)通域進(jìn)行字符識(shí)別和輸出;這樣,通過(guò)對(duì)裁剪的黑白圖像進(jìn)行識(shí)別,大幅度提升了識(shí)別速度,識(shí)別過(guò)程平均耗時(shí)500毫秒,識(shí)別準(zhǔn)確率99%,能夠滿(mǎn)足手機(jī)端用戶(hù)對(duì)身份證信息提取需求。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例提供一種基于人工神經(jīng)網(wǎng)絡(luò)的身份證快速識(shí)別方法的流程圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明實(shí)施例提供一種基于人工神經(jīng)網(wǎng)絡(luò)的身份證快速識(shí)別方法,如圖1所示,該方法通過(guò)以下步驟實(shí)現(xiàn):
步驟101:移動(dòng)終端將采集的身份證圖像轉(zhuǎn)換為灰度圖像。
具體地,將拍攝的身份證圖像按長(zhǎng)寬比例縮小圖像,并且圖像長(zhǎng)度小于600像素,之后,將彩色圖像轉(zhuǎn)換成灰度圖像。
步驟102:對(duì)所述轉(zhuǎn)換的灰度圖像進(jìn)行裁剪獲得身份證號(hào)碼區(qū),并且對(duì)該身份證號(hào)碼區(qū)進(jìn)行閾值處理和數(shù)學(xué)形態(tài)學(xué)閉運(yùn)算形成聯(lián)通域。
具體地,對(duì)灰度圖像進(jìn)行閾值處理時(shí),通過(guò)統(tǒng)計(jì)灰度值確定一個(gè)閾值,使得該閾值能夠?qū)⑶熬昂捅尘氨M可能的分開(kāi),也就是身份證圖像中字符與其他部分盡量區(qū)分開(kāi);通過(guò)統(tǒng)計(jì)計(jì)算得灰度圖的平均值為M,任取一灰度值t,將圖像分成A和B,對(duì)應(yīng)就是前景和背景色;這兩部分的平均值為MA和MB,A部分的像素占總像素比例為PA,B部分里的像素占總像素的比例為PB,這兩類(lèi)之間的方差定義為:ICV=α*PA*(MA-M)2+β*PB*(MB-M)2,最佳的閾值t就是使得ICV最大的,其中α和β為修正值,前景與背景比例相差太大時(shí)做適當(dāng)修正,通過(guò)實(shí)驗(yàn)這里α=1.2,β=0.8。
步驟103:通過(guò)身份證定位確定所述聯(lián)通域內(nèi)存在身份證號(hào)碼后,對(duì)所述聯(lián)通域進(jìn)行字符識(shí)別和輸出。
具體地,預(yù)先定義身份證號(hào)碼區(qū)域模板,內(nèi)容包括寬高比例,最大區(qū)域面積和最小區(qū)域面積,區(qū)域內(nèi)閾值分割后單元數(shù)為18,若滿(mǎn)足身份證號(hào)碼區(qū)域模板則認(rèn)為是號(hào)碼區(qū)域即確定所述聯(lián)通域內(nèi)存在身份證號(hào)碼,否則返回第一步。
在進(jìn)行字符識(shí)別之前,收集字符樣本,讀取每個(gè)字符樣本的特征信息并進(jìn)行計(jì)算將結(jié)果寫(xiě)入XML文件,將每個(gè)字符樣本和對(duì)應(yīng)的特征信息構(gòu)建字符樣本庫(kù);所述字符樣本庫(kù)分為11大類(lèi),每個(gè)大類(lèi)包含100個(gè)字符樣本。
身份證號(hào)碼由0、1、2、3、4、5、6、7、8、9、X字符組成;前17位只能是數(shù)字,最后一位為校驗(yàn)位,是前面17位通過(guò)計(jì)算得出的校驗(yàn)值,值在0-10之間,符號(hào)‘X’代表10,故所述11大類(lèi)具體為0-10。
識(shí)別聯(lián)通域分割為18個(gè)字符圖像,之后分別確定每個(gè)字符圖像的三個(gè)特征值,對(duì)所述三個(gè)特征值進(jìn)行識(shí)別結(jié)果預(yù)測(cè),將預(yù)測(cè)結(jié)果與字符樣本庫(kù)進(jìn)行對(duì)比,最后,將相似度最大的分類(lèi)作為識(shí)別結(jié)果輸出。
所述三個(gè)特征值具體為:1)字符圖像在4*2劃分區(qū)域里,確定每個(gè)區(qū)域的字符數(shù)量所占的比例,根據(jù)該比例與字符樣本庫(kù)中每個(gè)分類(lèi)的比例對(duì)比,相似度最接近的即為該分類(lèi)對(duì)應(yīng)的字符;
2)所述字符圖像在水平(垂直)方向上投影,確定每列(行)的字符像素總數(shù),根據(jù)該字符像素總數(shù)與字符樣本庫(kù)中每個(gè)分類(lèi)的字符像素總數(shù)對(duì)比,相似度最接近的即為該分類(lèi)對(duì)應(yīng)的字符;
3)所述字符圖像的歐拉數(shù),所述歐拉數(shù)描述了區(qū)域的聯(lián)通性,是全局的特征參數(shù),公式:E=C-H,E為區(qū)域的歐拉數(shù),C為區(qū)域的聯(lián)通區(qū)域數(shù),H為區(qū)域的空洞數(shù),比如字符‘X’的E=1-0=1,字符‘9’的E=1-1=0,
假如1)、2)的特征值無(wú)法分辨時(shí),就采用3)特征來(lái)區(qū)分;該特征描述了圖像的拓?fù)潢P(guān)系不受圖像畸變或邊緣噪聲的影響。
所述通過(guò)身份證定位確定所述聯(lián)通域內(nèi)存在身份證號(hào)碼,具體為:所述移動(dòng)終端通過(guò)一矩形框定位號(hào)碼區(qū)域,實(shí)時(shí)檢測(cè)號(hào)碼所形成的連通域是否在矩形定位框內(nèi),當(dāng)所述號(hào)碼區(qū)域在矩形定位框內(nèi)時(shí)執(zhí)行后續(xù)流程,否則重新采集圖像,這樣方便采集到適合識(shí)別的身份證圖像。
本發(fā)明實(shí)施例還提供一種基于人工神經(jīng)網(wǎng)絡(luò)的身份證快速識(shí)別裝置,該裝置包括:圖像轉(zhuǎn)換單元、定位單元、識(shí)別單元;
所述圖像轉(zhuǎn)換單元用于將采集的身份證圖像轉(zhuǎn)換為灰度圖像,對(duì)所述轉(zhuǎn)換的灰度圖像進(jìn)行裁剪獲得身份證號(hào)碼區(qū),并且對(duì)該身份證號(hào)碼區(qū)進(jìn)行閾值處理和數(shù)學(xué)形態(tài)學(xué)閉運(yùn)算形成聯(lián)通域;
所述定位單元用于確定所述聯(lián)通域內(nèi)是否存在身份證號(hào)碼,具體用于通過(guò)一矩形框定位號(hào)碼區(qū)域,實(shí)時(shí)檢測(cè)號(hào)碼所形成的連通域是否在矩形定位框內(nèi),當(dāng)所述號(hào)碼區(qū)域在矩形定位框內(nèi)時(shí)執(zhí)行后續(xù)流程,否則重新采集圖像,這樣方便采集到適合識(shí)別的身份證圖像;
所述識(shí)別單元用于在確定所述聯(lián)通域內(nèi)存在身份證號(hào)碼時(shí),對(duì)所述聯(lián)通域進(jìn)行字符識(shí)別和輸出。
所述圖像轉(zhuǎn)換單元具體用于將拍攝的身份證圖像按長(zhǎng)寬比例縮小圖像,并且圖像長(zhǎng)度小于600像素,之后,將彩色圖像轉(zhuǎn)換成灰度圖像。
所述識(shí)別單元還用于收集字符樣本,讀取每個(gè)字符樣本的特征信息并進(jìn)行計(jì)算將結(jié)果寫(xiě)入XML文件,將每個(gè)字符樣本和對(duì)應(yīng)的特征信息構(gòu)建字符樣本庫(kù);所述字符樣本庫(kù)分為11大類(lèi),每個(gè)大類(lèi)包含100個(gè)字符樣本。
所述識(shí)別單元具體用于識(shí)別聯(lián)通域分割為18個(gè)字符圖像,之后分別確定每個(gè)字符圖像的三個(gè)特征值,對(duì)所述三個(gè)特征值進(jìn)行識(shí)別結(jié)果預(yù)測(cè),將預(yù)測(cè)結(jié)果與字符樣本庫(kù)進(jìn)行對(duì)比,相似度最大的分類(lèi)作為識(shí)別結(jié)果輸出。
以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。