本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,特別是涉及一種證件版式分析的方法及裝置。
背景技術(shù):
隨著信息技術(shù)的發(fā)展,基于網(wǎng)絡(luò)進(jìn)行非接觸式認(rèn)證的應(yīng)用越來(lái)越多,而遠(yuǎn)程身份認(rèn)證技術(shù)則應(yīng)運(yùn)而生,其通過(guò)攝像頭對(duì)證件拍照,并對(duì)證件照片做OCR文字識(shí)別,提取證件照信息的技術(shù)也得到了普及和廣泛運(yùn)用。該方案具有成本低,集成方便,容易拓展等優(yōu)點(diǎn),越來(lái)越多的廠家也都推出了自己的證件照識(shí)別系統(tǒng)。
目前,證件照識(shí)別的一般包含以下流程:1.對(duì)證件圖像進(jìn)行旋轉(zhuǎn)傾斜校正;2.圖像去噪,圖像增強(qiáng)等預(yù)處理;3.版面分析,信息欄目定位;4.行分割和字符分割;5.字符識(shí)別;6.識(shí)別后處理?,F(xiàn)有的證件照識(shí)別系統(tǒng)一般側(cè)重于在預(yù)處理,字符分隔,字符識(shí)別,后處理等部分做優(yōu)化提升,版面分析和信息欄目則依賴(lài)于先驗(yàn)知識(shí)。由于證件照的版式具有很強(qiáng)的先驗(yàn)知識(shí),根據(jù)版式設(shè)定特定的規(guī)則來(lái)進(jìn)行信息欄目的定位,大部分情況下,這些證件照識(shí)別系統(tǒng)都能很好的工作。
然而,由于我國(guó)具有多民族,并且部分少數(shù)民族有自己的文字的特點(diǎn),少數(shù)民族地區(qū)的證件照往往有不同的版式,如二代身份證,西藏,新疆,內(nèi)蒙古,廣西等地區(qū)的少數(shù)民族的身份證版式就和主流的二代身份證版式不一致,而身份證識(shí)別系統(tǒng)則無(wú)法支持這些少數(shù)民族身份證的識(shí)別。因此,實(shí)現(xiàn)同類(lèi)證件多種不同版式的識(shí)別,是證件照OCR識(shí)別領(lǐng)域的一個(gè)迫切需求。
要實(shí)現(xiàn)證件照多版式的識(shí)別,也可以通過(guò)對(duì)每種版式的先驗(yàn)規(guī)則對(duì)版式進(jìn)行分析,從而實(shí)現(xiàn)版式的判斷。但是使用這種方法的話,則每當(dāng)有新的證件版式時(shí),則需要提取該種版式的布局特征,設(shè)定版式判斷的條件,這相當(dāng)于進(jìn)行一次新的開(kāi)發(fā)過(guò)程,必須不斷試驗(yàn),迭代,整個(gè)開(kāi)發(fā)過(guò)程繁瑣,工作量大,并且結(jié)果還具有不確定性。如何構(gòu)建一個(gè)通用的多版式分析框架,能夠適用于同類(lèi)證件的各種版式的識(shí)別,并且對(duì)新的版式能夠快速擴(kuò)展和集成,是證件照OCR識(shí)別領(lǐng)域的一個(gè)技術(shù)難點(diǎn)。
技術(shù)實(shí)現(xiàn)要素:
鑒于以上所述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的目的在于提供一種證件版式分析的方法及裝置,用于解決現(xiàn)有技術(shù)中同類(lèi)證件中多種不同版式的識(shí)別問(wèn)題。
為實(shí)現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種證件版式分析的方法,包括:
獲取證件圖像;
提取所述證件圖像中版式特征;
采用證件識(shí)別模型識(shí)別每個(gè)所述版式特征,獲取對(duì)應(yīng)版式特征的相關(guān)度等級(jí),其中所述證件識(shí)別模型是通過(guò)對(duì)訓(xùn)練樣本集進(jìn)行訓(xùn)練后得到的;
篩選所有版式特征對(duì)應(yīng)的相關(guān)度等級(jí)最高的為所述證件圖像的正確版式。
本發(fā)明的另一目的在于提供一種證件版式分析的裝置,包括:
獲取模塊,用于獲取證件圖像;
提取模塊,用于提取所述證件圖像中版式特征;
識(shí)別模塊,用于采用證件識(shí)別模型識(shí)別每個(gè)所述版式特征,獲取對(duì)應(yīng)版式特征的相關(guān)度等級(jí),其中所述證件識(shí)別模型是通過(guò)對(duì)訓(xùn)練樣本集進(jìn)行訓(xùn)練后得到的;
篩選模塊,用于篩選所有版式特征對(duì)應(yīng)的相關(guān)度等級(jí)最高的為所述證件圖像的正確版式。
如上所述,本發(fā)明的證件版式分析的方法及裝置,具有以下有益效果:
本發(fā)明在構(gòu)建分析框架時(shí),通過(guò)提前訓(xùn)練大量的證件圖像得到對(duì)應(yīng)的證件識(shí)別模型,獲取待分析的證件圖像的所有版式特征,然后采用證件識(shí)別模型獲取每個(gè)特征的相關(guān)度等級(jí),按相關(guān)度等級(jí)篩選其中相關(guān)度最接近的為正確版式。通過(guò)構(gòu)建一個(gè)通用的多版式分析框架,能夠識(shí)別不同版本的同類(lèi)證件,即使出現(xiàn)新增的版式,只需準(zhǔn)備相應(yīng)的證件圖像數(shù)據(jù),重新訓(xùn)練和更新模型,對(duì)原有框架改動(dòng)也極小,就能夠快速擴(kuò)展與集成,從而避免了重復(fù)開(kāi)發(fā),減少了開(kāi)發(fā)的工作量,開(kāi)發(fā)過(guò)程與結(jié)果都較為可控,便于證件圖像的OCR識(shí)別,提高了識(shí)別效率。
附圖說(shuō)明
圖1顯示為本發(fā)明提供的證件版式分析的方法流程圖;
圖2顯示為本發(fā)明提供的證件版式分析的方法中證件識(shí)別模型的訓(xùn)練流程圖;
圖3顯示為本發(fā)明提供的證件版式分析的方法中步驟S2的流程圖;
圖4顯示為本發(fā)明提供的證件版式分析的裝置結(jié)構(gòu)框圖;
圖5顯示為本發(fā)明提供的證件版式分析的裝置中證件識(shí)別模型的結(jié)構(gòu)框圖;
圖6顯示為本發(fā)明提供的證件版式分析的裝置提取模塊的結(jié)構(gòu)框圖。
元件標(biāo)號(hào)說(shuō)明:
1 證件識(shí)別模型
2 獲取模塊
3 提取模塊
4 識(shí)別模塊
5 篩選模塊
11 采集單元
12 第一提取單元
13 標(biāo)定單元
14 訓(xùn)練單元
31 分割單元
32 組合單元
33 第二提取單元
41 識(shí)別單元
51 篩選單元
S1~S4 步驟1~步驟4
具體實(shí)施方式
以下通過(guò)特定的具體實(shí)例說(shuō)明本發(fā)明的實(shí)施方式,本領(lǐng)域技術(shù)人員可由本說(shuō)明書(shū)所揭露的內(nèi)容輕易地了解本發(fā)明的其他優(yōu)點(diǎn)與功效。本發(fā)明還可以通過(guò)另外不同的具體實(shí)施方式加以實(shí)施或應(yīng)用,本說(shuō)明書(shū)中的各項(xiàng)細(xì)節(jié)也可以基于不同觀點(diǎn)與應(yīng)用,在沒(méi)有背離本發(fā)明的精神下進(jìn)行各種修飾或改變。需說(shuō)明的是,在不沖突的情況下,以下實(shí)施例及實(shí)施例中的特征可以相互組合。
需要說(shuō)明的是,以下實(shí)施例中所提供的圖示僅以示意方式說(shuō)明本發(fā)明的基本構(gòu)想,遂圖式中僅顯示與本發(fā)明中有關(guān)的組件而非按照實(shí)際實(shí)施時(shí)的組件數(shù)目、形狀及尺寸繪制,其實(shí)際實(shí)施時(shí)各組件的型態(tài)、數(shù)量及比例可為一種隨意的改變,且其組件布局型態(tài)也可能更為復(fù)雜。
實(shí)施例1
請(qǐng)參閱圖1,本發(fā)明提供一種證件版式分析的方法流程圖,包括:
步驟S1,獲取證件圖像;
具體地,證件圖像可為連接攝像頭的終端設(shè)備或自帶攝像頭的終端設(shè)備所拍攝,也可為通過(guò)分析視頻流所截取的圖像或者直接存好的證件圖像;終端設(shè)備例如可以是手機(jī)、平板電腦、PDA(Personal Digital Assistant,個(gè)人數(shù)字助理,簡(jiǎn)稱(chēng):PDA)等。
步驟S2,提取所述證件圖像中版式特征;
具體地,提取所述版式特征由文字梯度方向直方圖特征、行間分布特征與行內(nèi)字符間特征組合而成。
步驟S3,采用證件識(shí)別模型識(shí)別每個(gè)所述版式特征,獲取對(duì)應(yīng)版式特征的相關(guān)度等級(jí),其中所述證件識(shí)別模型是通過(guò)對(duì)訓(xùn)練樣本集進(jìn)行訓(xùn)練后得到的;
具體地,證件識(shí)別模型是通過(guò)采集大量的證件圖像,提取特征,然后使用LambdaMART Rank算法訓(xùn)練所得。在得到根據(jù)輸入的證件圖像所對(duì)應(yīng)的各個(gè)版式特征時(shí),分別識(shí)別各個(gè)版式特征,按照相關(guān)度等級(jí)進(jìn)行排序,其中,相關(guān)度等級(jí)是版式與正確版式的相似程度的表示,正確版式的相關(guān)度等級(jí)為1,表示完全一致;很相似的版式相關(guān)度等級(jí)為2,一般為只有一個(gè)信息欄目和正確版式不對(duì),其余信息欄目都對(duì)的情況;以此類(lèi)推,依次為較為相似,一般相似,不相似設(shè)定相關(guān)度等級(jí)為3-5。標(biāo)定時(shí),“很相似”,“較為相似”等判斷僅需要主觀感受,只要保證“很相似”比“較為相似”的相似度更高即可,不需要定量確定。
步驟S4,篩選所有版式特征對(duì)應(yīng)的相關(guān)度等級(jí)最高的為所述證件圖像的正確版式。
具體地,通過(guò)篩選所有版式中相關(guān)度最高的版式特征為證件圖像對(duì)應(yīng)的正確版式,將其作為輸出值,以便OCR(光學(xué)字符識(shí)別)時(shí)能夠迅速對(duì)證件圖像進(jìn)行識(shí)別。
在本實(shí)施例中,通過(guò)對(duì)證件圖像的多個(gè)版式特征進(jìn)行分析,得到各個(gè)版式特征的所對(duì)應(yīng)的相關(guān)度等級(jí),從而迅速查找出該證件圖像的正確版式;通過(guò)輸出唯一的正確版式,提升了識(shí)別的效率。
實(shí)施例2
如圖2所示,為本發(fā)明提供的證件版式分析的方法中證件識(shí)別模型的訓(xùn)練流程圖,包括:
步驟S101,采集同類(lèi)證件中不同版式的證件圖像;
其中,如果待分析的證件為身份證,那么需要采集不同版本的身份證的證件圖像,如果為待分析的證件為護(hù)照,那么需要采集不同版本的護(hù)照的證件圖像;如果為待分析的證件為銀行票據(jù),那么需要采集不同版本的銀行票據(jù)圖像;根據(jù)待分析的證件類(lèi)型不同,選用不同版本的該證件圖像。
步驟S102,提取每張證件圖像中所有的版式以及每個(gè)版式所對(duì)應(yīng)的版式特征,
其中,每張證件圖像均包含多個(gè)文字行,還涉及噪音引起的干擾行,而通過(guò)選取不同的文字行或干擾行組合成多個(gè)不同版式。
步驟S103,按相關(guān)度等級(jí)標(biāo)定每張證件圖像所有的版式對(duì)應(yīng)的版式特征,其中,每張證件圖像只對(duì)應(yīng)唯一的相關(guān)度等級(jí)最高的版式為正確版式;
其中,每一張證件圖像只對(duì)應(yīng)唯一的一個(gè)正確版式,通過(guò)預(yù)先標(biāo)定訓(xùn)練的證件圖像樣本所有版式特征的相關(guān)度,其相關(guān)度按等級(jí)排序,如果排序等級(jí)越高,則表示與正確版式越相近,如證件圖像中某個(gè)版式特征對(duì)應(yīng)的正確版式相關(guān)度等級(jí)標(biāo)定為1,則該證件圖像對(duì)應(yīng)的其余的版式特征相關(guān)度等級(jí)標(biāo)定則不能為1。
步驟S104,采用LambdaMART Rank算法訓(xùn)練所有證件圖像以及標(biāo)定的版式特征,得到證件識(shí)別模型。
其中,在版式訓(xùn)練時(shí),采用LambdaMART Rank對(duì)同類(lèi)的同一張證件照片進(jìn)行排序,其實(shí)基于MART和列表模型LambdaMART的組合優(yōu)化算法,在任何給定的隊(duì)中,通過(guò)交換證件圖像中版式特征的排序位置,對(duì)于構(gòu)建排序函數(shù)的特征集合進(jìn)行分析、然后重組和選擇,利用排序?qū)W習(xí)方法學(xué)習(xí)排序函數(shù),從而得到關(guān)于證件圖像版式特征排序輸出的證件識(shí)別模型。而使用其它的Rank算法也能達(dá)到訓(xùn)練的目的,如:Lambda Rank(基于樣本點(diǎn)的排序算法),Ranking SVM(基于樣本對(duì)的排序算法)等。
在本實(shí)施例中,基于排序算法訓(xùn)練同類(lèi)型的不同版本形式的證件圖像,得到對(duì)應(yīng)類(lèi)型的證件圖像的證件識(shí)別模型,當(dāng)輸入一個(gè)該類(lèi)的證件圖像為輸入查詢值,得到該證件圖像中各個(gè)文字行重組的版式特征,按照相關(guān)度等級(jí)排序輸出各個(gè)版式特征,而根據(jù)相關(guān)度等級(jí)高低確定證件圖像的正確版式;即使新增不同版本的該類(lèi)證件,也能在模型架構(gòu)不變的基礎(chǔ)上集成,避免了對(duì)新版式進(jìn)行判斷條件的試驗(yàn)和參數(shù)調(diào)整,具有標(biāo)準(zhǔn)的開(kāi)發(fā)流程,開(kāi)發(fā)過(guò)程和最終效果都較為可控,適于大面積的推廣運(yùn)用。
實(shí)施例3
如圖3所示,為本發(fā)明提供的證件版式分析的方法中步驟S2的流程圖,包括:
步驟S201,對(duì)所述證件圖像進(jìn)行二值分割,得到對(duì)應(yīng)的文字行;
其中,采用二值化分割原理的目的在于處理證件圖像中的關(guān)鍵點(diǎn),分割圖像時(shí)順便去除背景,留下感興趣的目標(biāo)物體,便于提取文字行;所述二值化分割的方法具體包含如下三類(lèi),基于像素值的閾值、基于區(qū)域性質(zhì)的閾值或基于坐標(biāo)位置的閾值。
步驟S202,依次選取不同文字行進(jìn)行組合,生成多個(gè)版式,其中每種組合為一個(gè)版式;
其中,將分割所得的各個(gè)文字行組合生成多個(gè)版式,每個(gè)版式及構(gòu)成一個(gè)版式特征;
步驟S203,提取每個(gè)版式對(duì)應(yīng)的版式特征,以向量方式進(jìn)行表達(dá),其中所述版式特征包含文字梯度方向直方圖特征、行間分布特征與行內(nèi)字符間特征。
其中,將所述文字梯度方向直方圖特征、行間分布特征與行內(nèi)字符間特征依次組合為一維向量;
例如得到文字梯度方向直方圖特征具體步驟如下:歸一化圖像;為了減少光照因素的影響,首先對(duì)檢測(cè)窗口中的圖像進(jìn)行歸一化。在圖像的紋理強(qiáng)度中,局部的表層曝光貢獻(xiàn)比重較大,所以,這種壓縮處理能夠有效地降低圖像局部的陰影和光照變化。
計(jì)算圖像梯度;計(jì)算圖像在設(shè)定的橫坐標(biāo)和縱坐標(biāo)方向的梯度,并據(jù)此計(jì)算每個(gè)像素位置的梯度方向值,其中求取梯度方向值的操作不僅能夠捕獲輪廓和一些紋理信息,還能進(jìn)一步弱化光照的影響。
為每個(gè)細(xì)胞單元構(gòu)建梯度方向直方圖;本步驟的目的是為局部圖像區(qū)域提供一個(gè)編碼,同時(shí)能夠保持對(duì)證件圖像中文字的姿勢(shì)和外觀的弱敏感性。本步驟中,將證件圖像分成若干個(gè)“單元格cell”,例如每個(gè)Cell為6*6個(gè)像素。對(duì)Cell內(nèi)的每個(gè)像素用梯度方向在直方圖中進(jìn)行加權(quán)投影(映射到固定的角度范圍),就可以得到這個(gè)Cell的梯度方向直方圖了。
把細(xì)胞單元組合成大的塊(Block),塊內(nèi)歸一化梯度直方圖;由于局部光照的變化以及前景-背景對(duì)比度的變化,使得梯度強(qiáng)度的變化范圍非常大。這就需要對(duì)梯度強(qiáng)度做歸一化。歸一化能夠進(jìn)一步地對(duì)光照、陰影和邊緣進(jìn)行壓縮。
具體實(shí)現(xiàn)方法包括:把各個(gè)細(xì)胞單元組合成大的、空間上連通的區(qū)間(Blocks)。這樣,一個(gè)Block內(nèi)所有Cell的特征向量串聯(lián)起來(lái)便得到該Block的HOG特征。這些區(qū)間是互有重疊的,這就意味著:每一個(gè)單元格的特征會(huì)以不同的結(jié)果多次出現(xiàn)在最后的特征向量中。我們將歸一化之后的塊描述符(向量)就稱(chēng)之為HOG描述符。收集文字HOG特征;將檢測(cè)窗口中所有重疊的塊進(jìn)行HOG特征的收集,并將它們結(jié)合成最終的特征向量。
提取行間分布特征的具體步驟:
計(jì)算行的中心位置,計(jì)算相鄰行的距離,依次將每行和其相鄰行的距離拼接組成特征向量
提取行內(nèi)字符間特征的具體步驟:
字符分割;對(duì)每行在水平方向進(jìn)行投影,然后找到投影極小值點(diǎn)作為字符分割點(diǎn),得到每個(gè)字符的分割位置。
統(tǒng)計(jì)字符尺寸特征;計(jì)算該行每個(gè)字符的高度,寬度,寬高比,統(tǒng)計(jì)該行所有字符的高度平均值、方差,高度平均值、方差,寬高比平均值、方差。
統(tǒng)計(jì)字符間距特征;計(jì)算相鄰字符間的間距,統(tǒng)計(jì)該行所有字符間距的平均值,方差。
將上述特征組合成向量作為行內(nèi)字符間的特征向量。
在本實(shí)施例中,通過(guò)針對(duì)每個(gè)版式特征提取其內(nèi)的文字梯度方向直方圖特征、行間分布特征與行內(nèi)字符間特征,將上述特征依次組成一維向量表示,便于識(shí)別該向量特征在所有版式特征中的相關(guān)度等級(jí)。
實(shí)施例4
如圖4所示,為本發(fā)明提供的證件版式分析的裝置結(jié)構(gòu)框圖,包括:
獲取模塊2,用于獲取證件圖像;
提取模塊3,用于提取所述證件圖像中版式特征;
識(shí)別模塊4,用于采用證件識(shí)別模型1識(shí)別每個(gè)所述版式特征,獲取對(duì)應(yīng)版式特征的相關(guān)度等級(jí),其中所述證件識(shí)別模型是通過(guò)對(duì)訓(xùn)練樣本集進(jìn)行訓(xùn)練后得到的;
篩選模塊5,用于篩選所有版式特征對(duì)應(yīng)的相關(guān)度等級(jí)最高的為所述證件圖像的正確版式。
在本實(shí)施例中,在獲取模塊之后,先分析出證件圖像中的所有版式,并根據(jù)版式特征內(nèi)具體的文字梯度方向直方圖特征、行間分布特征與行內(nèi)字符間特征組合的向量特征,通過(guò)使用證件識(shí)別模型1識(shí)別該版式特征對(duì)應(yīng)向量特征的相關(guān)度等級(jí),從而根據(jù)相關(guān)度等級(jí)高低確定證件圖像的正確版式。
如圖5所示,為本發(fā)明提供的證件版式分析的裝置中證件識(shí)別模型1的結(jié)構(gòu)框圖,包括:
采集單元11,用于采集同類(lèi)證件中不同版式的證件圖像;
第一提取單元12,用于提取每張證件圖像中所有的版式以及每個(gè)版式所對(duì)應(yīng)的版式特征;
標(biāo)定單元13,用于按相關(guān)度等級(jí)標(biāo)定每張證件圖像所有的版式對(duì)應(yīng)的版式特征,其中,每張證件圖像只對(duì)應(yīng)唯一的相關(guān)度等級(jí)最高的版式為正確版式;
訓(xùn)練單元14,用于采用LambdaMART Rank算法訓(xùn)練所有證件圖像以及標(biāo)定的版式特征,得到證件識(shí)別模型。
在本實(shí)施例中,通過(guò)采集同類(lèi)證件中不同版式的證件圖像,按照證件圖像中各個(gè)不同版本的版本特征,按相關(guān)度等級(jí)標(biāo)定每個(gè)版式特征,采用LambdaMART Rank算法訓(xùn)練所有證件圖像以及標(biāo)定的版式特征,得到證件識(shí)別模型,便于后期識(shí)別和集成。
如圖6所示,為本發(fā)明提供的證件版式分析的裝置提取模塊3的結(jié)構(gòu)框圖,包括:
分割單元31,用于對(duì)所述證件圖像進(jìn)行二值分割,得到對(duì)應(yīng)的文字行;
組合單元32,用于依次選取不同文字行進(jìn)行組合,生成多個(gè)版式,其中每種組合為一個(gè)版式;
第二提取單元33,用于提取每個(gè)版式對(duì)應(yīng)的版式特征,以向量方式進(jìn)行表達(dá),其中所述版式特征包含文字梯度方向直方圖特征、行間分布特征與行內(nèi)字符間特征。
本實(shí)施例中,通過(guò)提取證件圖像所有可能的版式特征,將每個(gè)版式特征均對(duì)應(yīng)的用向量表示為向量特征,便于識(shí)別和區(qū)分。
綜上所述,本發(fā)明在構(gòu)建分析框架時(shí),通過(guò)提前訓(xùn)練大量的證件圖像得到對(duì)應(yīng)的證件識(shí)別模型,獲取待分析的證件圖像的所有版式特征后,采用證件識(shí)別模型識(shí)別出每個(gè)版式特征的相關(guān)度等級(jí),按相關(guān)度等級(jí)篩選其中相關(guān)度最接近的為正確版式。通過(guò)構(gòu)建一個(gè)通用的多版式分析框架,能夠識(shí)別不同版本的同類(lèi)證件,即使出現(xiàn)新增的版式,只需準(zhǔn)備相應(yīng)的版式的證件圖像,重新訓(xùn)練和更新模型,對(duì)原有框架改動(dòng)也極小,就能夠快速擴(kuò)展與集成,從而避免了重復(fù)開(kāi)發(fā),減少了開(kāi)發(fā)的工作量,開(kāi)發(fā)過(guò)程與結(jié)果都較為可控,便于證件圖像的OCR識(shí)別,提高了識(shí)別效率。所以,本發(fā)明有效克服了現(xiàn)有技術(shù)中的種種缺點(diǎn)而具高度產(chǎn)業(yè)利用價(jià)值。
上述實(shí)施例僅例示性說(shuō)明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。任何熟悉此技術(shù)的人士皆可在不違背本發(fā)明的精神及范疇下,對(duì)上述實(shí)施例進(jìn)行修飾或改變。因此,舉凡所屬技術(shù)領(lǐng)域中具有通常知識(shí)者在未脫離本發(fā)明所揭示的精神與技術(shù)思想下所完成的一切等效修飾或改變,仍應(yīng)由本發(fā)明的權(quán)利要求所涵蓋。