區(qū)域識(shí)別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001 ]本公開涉及圖像處理領(lǐng)域,特別涉及一種區(qū)域識(shí)別方法及裝置。
【背景技術(shù)】
[0002]身份證的自動(dòng)識(shí)別技術(shù)是一種通過(guò)圖像處理對(duì)身份證上的文字信息進(jìn)行識(shí)別的技術(shù)。
[0003]相關(guān)技術(shù)提供了一種身份證的自動(dòng)識(shí)別方法,通過(guò)身份證掃描設(shè)備按照固定的相對(duì)位置對(duì)身份證進(jìn)行掃描,得到身份證的掃描圖像;對(duì)掃描圖像中的η個(gè)預(yù)定區(qū)域進(jìn)行文字識(shí)別,得到姓名信息、性別信息、民族信息、出生日期信息、地址信息和公民身份號(hào)碼信息中的至少一種。但是對(duì)于直接拍攝得到的身份證圖像,仍然有較大的識(shí)別難度。
【發(fā)明內(nèi)容】
[0004]為了解決相關(guān)技術(shù)中的問(wèn)題,本公開提供一種區(qū)域識(shí)別方法及裝置。所述技術(shù)方案如下:
[0005]根據(jù)本公開實(shí)施例的第一方面,提供了一種區(qū)域識(shí)別方法,該方法包括:
[0006]獲取證件圖像中人臉區(qū)域的區(qū)域位置;
[0007]根據(jù)人臉區(qū)域的區(qū)域位置確定出至少一個(gè)信息區(qū)域;
[0008]對(duì)信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域。
[0009]在可選的實(shí)施例中,人臉區(qū)域的區(qū)域位置采用人臉區(qū)域的預(yù)定邊緣表示;
[0010]獲取證件圖像中人臉區(qū)域的區(qū)域位置,包括:
[0011 ]對(duì)證件圖像進(jìn)行人臉識(shí)別,得到人臉區(qū)域;
[0012]根據(jù)人臉區(qū)域識(shí)別出人臉區(qū)域的預(yù)定邊緣。
[0013]在可選的實(shí)施例中,對(duì)證件圖像進(jìn)行人臉識(shí)別,得到人臉區(qū)域,包括:
[0014]通過(guò)針對(duì)預(yù)定人臉尺寸的人臉模型,對(duì)證件圖像中的預(yù)定區(qū)域進(jìn)行人臉識(shí)別,得到人臉區(qū)域。
[0015]在可選的實(shí)施例中,根據(jù)人臉區(qū)域,識(shí)別出人臉區(qū)域的預(yù)定邊緣,包括:
[0016]根據(jù)人臉區(qū)域的下部確定出興趣區(qū)域,興趣區(qū)域包括人臉區(qū)域的下邊緣;
[0017]對(duì)興趣區(qū)域進(jìn)行直線檢測(cè),識(shí)別出人臉區(qū)域的下邊緣。
[0018]在可選的實(shí)施例中,對(duì)興趣區(qū)域進(jìn)行直線檢測(cè),識(shí)別出人臉區(qū)域的下邊緣,包括:
[0019]對(duì)興趣區(qū)域進(jìn)行索貝爾水平濾波和二值化,得到處理后的興趣區(qū)域;
[0020]對(duì)處理后的興趣區(qū)域進(jìn)行Hough變換,得到長(zhǎng)度大于預(yù)定長(zhǎng)度的線段,將線段識(shí)別為人臉區(qū)域的下邊緣。
[0021]在可選的實(shí)施例中,該方法,還包括:
[0022]根據(jù)預(yù)定邊緣的斜率,對(duì)證件圖像進(jìn)行傾斜度修正。
[0023]在可選的實(shí)施例中,根據(jù)預(yù)定邊緣的斜率,對(duì)證件圖像進(jìn)行傾斜度修正,包括:
[0024]根據(jù)預(yù)定邊緣的斜率,確定出預(yù)定邊緣與水平方向的夾角;
[0025]對(duì)證件圖像按照夾角旋轉(zhuǎn),旋轉(zhuǎn)后的證件圖像中的預(yù)定邊緣與水平方向平行。
[0026]在可選的實(shí)施例中,對(duì)信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域,包括:
[0027]對(duì)信息區(qū)域進(jìn)行二值化,得到二值化后的信息區(qū)域;
[0028]對(duì)二值化后的信息區(qū)域按照水平方向計(jì)算第一直方圖,第一直方圖包括:每行像素點(diǎn)的豎坐標(biāo)和每行像素點(diǎn)中前景色像素點(diǎn)的累加值;
[0029]根據(jù)第一直方圖中前景色像素點(diǎn)的累加值大于第一閾值的行所組成的連續(xù)行集合,識(shí)別得到η行文字區(qū)域,η為正整數(shù);
[0030]對(duì)于第i行文字區(qū)域,按照豎直方向計(jì)算第二直方圖,第二直方圖包括:每列像素點(diǎn)的橫坐標(biāo)和每列像素點(diǎn)中前景色像素點(diǎn)的累加值,l,i為正整數(shù);
[0031]根據(jù)第二直方圖中前景色像素點(diǎn)的累加值大于第二閾值的列所組成的連續(xù)列集合,識(shí)別得到m個(gè)字符區(qū)域。
[0032]根據(jù)本公開實(shí)施例的第二方面,提供一種區(qū)域識(shí)別裝置,該裝置包括:
[0033]獲取模塊,被配置為獲取證件圖像中人臉區(qū)域的區(qū)域位置;
[0034]確定模塊,被配置為根據(jù)人臉區(qū)域的區(qū)域位置確定出至少一個(gè)信息區(qū)域;
[0035]切割模塊,被配置為對(duì)信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域。
[0036]在可選的實(shí)施例中,人臉區(qū)域的區(qū)域位置采用人臉區(qū)域的預(yù)定邊緣表示;
[0037]獲取模塊,包括:
[0038]第一識(shí)別子模塊,被配置為對(duì)證件圖像進(jìn)行人臉識(shí)別,得到人臉區(qū)域;
[0039]第二識(shí)別子模塊,被配置為根據(jù)人臉區(qū)域識(shí)別出人臉區(qū)域的預(yù)定邊緣。
[0040]在可選的實(shí)施例中,第一識(shí)別子模塊,被配置為通過(guò)針對(duì)預(yù)定人臉尺寸的人臉模型,對(duì)證件圖像中的預(yù)定區(qū)域進(jìn)行人臉識(shí)別,得到人臉區(qū)域。
[0041 ]在可選的實(shí)施例中,第二識(shí)別子模塊,包括:
[0042]興趣確定子模塊,被配置為根據(jù)人臉區(qū)域的下部確定出興趣區(qū)域,興趣區(qū)域包括人臉區(qū)域的下邊緣;
[0043]檢測(cè)子模塊,被配置為對(duì)興趣區(qū)域進(jìn)行直線檢測(cè),識(shí)別出人臉區(qū)域的下邊緣。
[0044]在可選的實(shí)施例中,檢測(cè)子模塊,包括:
[0045]濾波子模塊,被配置為對(duì)興趣區(qū)域進(jìn)行索貝爾水平濾波和二值化,得到處理后的興趣區(qū)域;
[0046]變換子模塊,被配置為對(duì)處理后的興趣區(qū)域進(jìn)行直線擬合或Hough變換,得到長(zhǎng)度大于預(yù)定長(zhǎng)度的線段,將線段識(shí)別為人臉區(qū)域的下邊緣。
[0047]在可選的實(shí)施例中,該裝置,還包括:
[0048]修正模塊,被配置為根據(jù)預(yù)定邊緣的斜率,對(duì)證件圖像進(jìn)行傾斜度修正。
[0049]在可選的實(shí)施例中,修正模塊,包括:
[0050]夾角確定子模塊,被配置為根據(jù)預(yù)定邊緣的斜率,確定出預(yù)定邊緣與水平方向的夾角;
[0051]旋轉(zhuǎn)子模塊,被配置為對(duì)證件圖像按照夾角旋轉(zhuǎn),旋轉(zhuǎn)后的證件圖像中的預(yù)定邊緣與水平方向平行。
[0052]在可選的實(shí)施例中,切割模塊,包括:
[0053]二值化子模塊,被配置為對(duì)信息區(qū)域進(jìn)行二值化,得到二值化后的信息區(qū)域;
[0054]第一計(jì)算子模塊,被配置為對(duì)二值化后的信息區(qū)域按照水平方向計(jì)算第一直方圖,第一直方圖包括:每行像素點(diǎn)的豎坐標(biāo)和每行像素點(diǎn)中前景色像素點(diǎn)的累加值;
[0055]行識(shí)別子模塊,被配置為根據(jù)第一直方圖中前景色像素點(diǎn)的累加值大于第一閾值的行所組成的連續(xù)行集合,識(shí)別得到η行文字區(qū)域,η為正整數(shù);
[0056]第二計(jì)算子模塊,被配置為對(duì)于第i行文字區(qū)域,按照豎直方向計(jì)算第二直方圖,第二直方圖包括:每列像素點(diǎn)的橫坐標(biāo)和每列像素點(diǎn)中前景色像素點(diǎn)的累加值,η 2 i >l,i為正整數(shù);
[0057]字符識(shí)別子模塊,被配置為根據(jù)第二直方圖中前景色像素點(diǎn)的累加值大于第二閾值的列所組成的連續(xù)列集合,識(shí)別得到m個(gè)字符區(qū)域。
[0058]根據(jù)本公開實(shí)施例的第三方面,提供一種區(qū)域識(shí)別裝置,該裝置包括:
[0059]處理器;
[0060]用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
[0061]其中,處理器被配置為:
[0062]獲取證件圖像中人臉區(qū)域的區(qū)域位置;
[0063]根據(jù)人臉區(qū)域的區(qū)域位置確定出至少一個(gè)信息區(qū)域;
[0064]對(duì)信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域。
[0065]本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
[0066]通過(guò)獲取證件圖像中人臉區(qū)域的區(qū)域位置;根據(jù)人臉區(qū)域的區(qū)域位置確定出至少一個(gè)信息區(qū)域;對(duì)信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域;解決了相關(guān)技術(shù)中對(duì)于直接拍攝得到的證件圖像中的某些信息區(qū)域的識(shí)別難度大和對(duì)某些信息區(qū)域的定位不準(zhǔn)確的問(wèn)題;達(dá)到了通過(guò)證件圖像中人臉區(qū)域的區(qū)域位置確定出其它信息區(qū)域,并對(duì)其它信息區(qū)域進(jìn)行切割,從而對(duì)信息區(qū)域準(zhǔn)確定位和對(duì)信息區(qū)域中的字符區(qū)域進(jìn)行準(zhǔn)確識(shí)別的效果O
[0067]應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性的,并不能限制本公開。
【附圖說(shuō)明】
[0068]此處的附圖被并入說(shuō)明書中并構(gòu)成本說(shuō)明書的一部分,示出了符合本公開的實(shí)施例,并于說(shuō)明書一起用于解釋本公開的原理。
[0069]圖1是根據(jù)一示例性實(shí)施例示出的一種區(qū)域識(shí)別方法的流程圖;
[0070]圖2是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域識(shí)別方法的流程圖;
[0071 ]圖3A是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域識(shí)別方法的流程圖;
[0072]圖3B是根據(jù)一示例性實(shí)施例示出的一種人臉識(shí)別的示意圖;
[0073]圖3C是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域識(shí)別方法的流程圖;
[0074]圖3D是根據(jù)一示例性實(shí)施例示出的一種sobel水平濾波的人臉圖像示意圖;
[0075]圖3E是根據(jù)一不例性實(shí)施例不出的一種一■值化后的人臉圖像不意圖;
[0076]圖3F是根據(jù)一示例性實(shí)施例示出的一種Hough變換后的人臉圖像示意圖;
[0077]圖4是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域識(shí)別方法的流程圖;
[0078]圖5A是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域識(shí)別方法的流程圖;
[0079]圖5B是根據(jù)一示例性實(shí)施例示出的一種信息區(qū)域第一直方圖的示意圖;
[0080]圖5C是根據(jù)一示例性實(shí)施例示出的一種信息區(qū)域連續(xù)行集合的示意圖;
[0081]圖f5D是根據(jù)另一示例性實(shí)施例示出的一種信息區(qū)域第二直方圖的示意圖;
[0082]圖5E是根據(jù)一示例性實(shí)施例示出的一種信息區(qū)域連續(xù)列集合的示意圖;
[0083]圖6是根據(jù)一示例性實(shí)施例示出的一種區(qū)域識(shí)別裝置的框圖;
當(dāng)前第1頁(yè)
1 
2 
3 
4 
5