夾角的??蛇x地,終端根據(jù)預(yù)定邊緣的斜率對(duì)證件圖像進(jìn)行傾斜度修正。也即,在步驟204之后,該方法還包括步驟205a和步驟205b,如圖4所示:
[0133]在步驟205a中,根據(jù)預(yù)定邊緣的斜率,確定出預(yù)定邊緣與水平方向的夾角;
[0134]終端計(jì)算出人臉區(qū)域的下邊緣與水平方向的夾角。該夾角也是證件與水平方向的夾角。
[0135]在步驟205b中,對(duì)證件圖像按照夾角旋轉(zhuǎn),旋轉(zhuǎn)后的證件圖像中的預(yù)定邊緣與水平方向平行。
[0136]綜上所述,本實(shí)施例提供的區(qū)域識(shí)別方法,通過人臉區(qū)域的預(yù)定邊緣進(jìn)行旋轉(zhuǎn)校正,使得證件圖像中的證件與水平方向平行,能夠提高后續(xù)識(shí)別信息區(qū)域時(shí)的準(zhǔn)確度。
[0137]在基于圖2實(shí)施例提供的可選實(shí)施例中,步驟208對(duì)信息區(qū)域進(jìn)行區(qū)域切割的過程。可替代實(shí)現(xiàn)為如下步驟208a至步驟208e,如圖5A所示:
[0138]在步驟208a中,對(duì)信息區(qū)域進(jìn)行二值化,得到二值化后的信息區(qū)域;
[0139]以信息區(qū)域是公民身份號(hào)碼區(qū)域?yàn)槔?,可選地,先對(duì)信息區(qū)域進(jìn)行預(yù)處理。其中,預(yù)處理可以包括:去噪、濾波、提取邊緣等操作;將預(yù)處理后的信息區(qū)域進(jìn)行二值化。
[0140]在步驟208b中,對(duì)二值化后的信息區(qū)域按照水平方向計(jì)算第一直方圖,第一直方圖包括:每行像素點(diǎn)的豎坐標(biāo)和每行像素點(diǎn)中前景色像素點(diǎn)的累加值;
[0141]將二值化后的信息區(qū)域按照水平方向計(jì)算第一直方圖,該第一直方圖在豎直方向表示每行像素點(diǎn)的豎坐標(biāo),在水平方向表示每行像素點(diǎn)中前景色像素點(diǎn)的個(gè)數(shù)累加值,如圖5B所示。
[0142]在步驟208c中,根據(jù)第一直方圖中前景色像素點(diǎn)的累加值大于第一閾值的行所組成的連續(xù)行集合,識(shí)別得到η行文字區(qū)域,η為正整數(shù);
[0143]根據(jù)第一直方圖可以獲取到每一行像素點(diǎn)中前景色像素點(diǎn)的累加值,將每一行像素點(diǎn)中前景色像素點(diǎn)的累加值與第一閾值進(jìn)行比較,將第一直方圖中前景色像素點(diǎn)的累加值大于第一閾值的行所組成的連續(xù)行集合,確定為文字區(qū)域所在的行。
[0144]連續(xù)行集合是指:前景色像素點(diǎn)的累加值大于第一閾值的行是連續(xù)的m行,該連續(xù)的m行像素點(diǎn)所組成的集合,如圖5C所示,對(duì)于圖中的m行像素點(diǎn),在位于左側(cè)直方圖中的前景色像素點(diǎn)的累加值均大于第一閾值。而該m行像素點(diǎn)在證件圖像中對(duì)應(yīng)公民身份號(hào)碼行“0421199”。
[0145]當(dāng)然,若該信息區(qū)域是地址信息區(qū)域或者其他信息區(qū)域,文字區(qū)域可能為兩行或者兩行以上。此時(shí),每個(gè)連續(xù)行集合識(shí)別為一行文字區(qū)域,η個(gè)連續(xù)行集合識(shí)別為η行文字區(qū)域。
[0146]在步驟208d中,對(duì)于第i行文字區(qū)域,按照豎直方向計(jì)算第二直方圖,第二直方圖包括:每列像素點(diǎn)的橫坐標(biāo)和每列像素點(diǎn)中前景色像素點(diǎn)的累加值,l,i為正整數(shù);
[0147]對(duì)于識(shí)別出的公民身份號(hào)碼行,按照豎直方向計(jì)算第二直方圖,該第二直方圖在水平方向表示每列像素點(diǎn)的橫坐標(biāo),在豎直方向表示每列像素點(diǎn)中前景色像素點(diǎn)的個(gè)數(shù)累加值,如圖所示。
[0148]在步驟208e中,根據(jù)第二直方圖中前景色像素點(diǎn)的累加值大于第二閾值的列所組成的連續(xù)列集合,識(shí)別得到m個(gè)字符區(qū)域。
[0149]根據(jù)第二直方圖可以獲取到每一列像素點(diǎn)中前景色像素點(diǎn)的累加值,將每一列像素點(diǎn)中前景色像素點(diǎn)的累加值與第二閾值進(jìn)行比較,將第二直方圖中前景色像素點(diǎn)的累加值大于第二閾值的列所組成的連續(xù)列集合,確定為字符區(qū)域所在的列。
[0150]連續(xù)列集合是指:前景色像素點(diǎn)的累加值大于第二閾值的列是連續(xù)的P列,該連續(xù)的P列像素點(diǎn)所組成的集合,如圖5E所示,連續(xù)列集合為p,也即第二直方圖中形成的連續(xù)白色區(qū)域。對(duì)于圖中的P列像素點(diǎn),在位于下側(cè)直方圖中的前景色像素點(diǎn)的累加值均大于第二閾值。而該P(yáng)列像素點(diǎn)在證件圖像中對(duì)應(yīng)字符區(qū)域“X”。
[0151]每個(gè)連續(xù)列集合識(shí)別為一個(gè)字符區(qū)域,η個(gè)連續(xù)列集合識(shí)別為η個(gè)字符區(qū)域。在圖5Ε中,能夠識(shí)別出18個(gè)字符區(qū)域。
[0152]若文字區(qū)域有η行,則步驟208d和步驟208e會(huì)針對(duì)每一行文字區(qū)域執(zhí)行一次,共執(zhí)行η次。
[0153]對(duì)于識(shí)別出的每個(gè)字符區(qū)域,還可以通過字符識(shí)別技術(shù),識(shí)別出該字符區(qū)域中包含的文字。文字可以是漢字、英文字母、數(shù)字或其它語種的單個(gè)字符。
[0154]綜上所述,本實(shí)施例通過對(duì)信息區(qū)域二值化,并將二值化后的信息區(qū)域按照水平方向計(jì)算第一直方圖,確定第二信息區(qū)域中η行文字區(qū)域,再通過分別對(duì)η行文字區(qū)域按照豎直方向計(jì)算第二直方圖,識(shí)別出每個(gè)文字對(duì)應(yīng)的字符區(qū)域,能夠提高識(shí)別信息區(qū)域中字符區(qū)域的準(zhǔn)確度。
[0155]下述為本公開裝置實(shí)施例,可以用于執(zhí)行本公開方法實(shí)施例。對(duì)于本公開裝置實(shí)施例中未披露的細(xì)節(jié),請(qǐng)參照本公開方法實(shí)施例。
[0156]圖6是根據(jù)一示例性實(shí)施例示出的一種區(qū)域識(shí)別裝置的框圖,如圖6所示,該區(qū)域識(shí)別裝置包括但不限于:
[0157]獲取模塊610,被配置為獲取證件圖像中人臉區(qū)域的區(qū)域位置;
[0158]證件圖像是對(duì)證件直接拍攝得到的圖像,比如:身份證圖像、社會(huì)保障卡圖像等。
[0159]由于證件中通常都有用戶的證件照,所以證件圖像中會(huì)存在人臉區(qū)域。
[0160]獲取模塊610獲取證件圖像中人臉區(qū)域的區(qū)域位置。
[0161]確定模塊620,被配置為根據(jù)人臉區(qū)域的區(qū)域位置確定出至少一個(gè)信息區(qū)域;
[0162]信息區(qū)域是指證件圖像中攜帶有文字信息的區(qū)域,比如:姓名信息區(qū)域、出生日期信息區(qū)域、性別區(qū)域、地址信息區(qū)域、公民身份號(hào)碼信息區(qū)域、編號(hào)信息區(qū)域、頒發(fā)證件機(jī)關(guān)信息區(qū)域、有效日期信息區(qū)域等等信息區(qū)域中的至少一種。
[0163]根據(jù)獲取模塊610中獲取的區(qū)域位置確定模塊620確定出至少一個(gè)信息區(qū)域。
[0164]切割模塊630,被配置為對(duì)信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域。
[0165]信息區(qū)域中包括有多個(gè)字符。對(duì)于一個(gè)信息區(qū)域,切割模塊630通過區(qū)域切割能夠得到至少一個(gè)字符區(qū)域。字符區(qū)域是包括單個(gè)字符的區(qū)域。字符可以是漢字、英文字母、數(shù)字或者其它語種的字符。
[0166]綜上所述,本公開實(shí)施例中提供的區(qū)域識(shí)別裝置,通過獲取證件圖像中人臉區(qū)域的區(qū)域位置;根據(jù)人臉區(qū)域的區(qū)域位置確定出至少一個(gè)信息區(qū)域;對(duì)信息區(qū)域進(jìn)行區(qū)域切害J,得到至少一個(gè)字符區(qū)域;解決了相關(guān)技術(shù)中對(duì)于直接拍攝得到的證件圖像中的某些信息區(qū)域的識(shí)別難度大和對(duì)某些信息區(qū)域的定位不準(zhǔn)確的問題;達(dá)到了通過證件圖像中人臉區(qū)域的區(qū)域位置確定出其它信息區(qū)域,并對(duì)其它信息區(qū)域進(jìn)行切割,從而對(duì)信息區(qū)域準(zhǔn)確定位和對(duì)信息區(qū)域中的字符區(qū)域進(jìn)行準(zhǔn)確識(shí)別的效果。
[0167]圖7是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域識(shí)別裝置的框圖,如圖7所示,該區(qū)域識(shí)別裝置包括但不限于:
[0168]獲取模塊610,被配置為獲取證件圖像中人臉區(qū)域的區(qū)域位置;
[0169]本實(shí)施例中,獲取模塊610可以包括如下子模塊:
[0170]第一識(shí)別子模塊611,被配置為對(duì)證件圖像進(jìn)行人臉識(shí)別,得到人臉區(qū)域;
[0171]由于證件中通常都有用戶的證件照,所以證件圖像中會(huì)存在人臉區(qū)域。通過人臉識(shí)別技術(shù),能夠從證件圖像中識(shí)別得到人臉區(qū)域。
[0172]本實(shí)施例中對(duì)人臉區(qū)域的識(shí)別模塊為第一識(shí)別子模塊611。
[0173]第二識(shí)別子模塊612,被配置為根據(jù)人臉區(qū)域識(shí)別出人臉區(qū)域的預(yù)定邊緣。
[0174]在證件圖像中,由于人臉區(qū)域的下邊緣與證件的背景色通常會(huì)形成較大的反差,所以人臉區(qū)域的下邊緣是相對(duì)容易識(shí)別的一條邊緣。
[0175]第二識(shí)別子模塊612根據(jù)人臉區(qū)域識(shí)別出人臉區(qū)域的預(yù)定邊緣。
[0176]其中,第一識(shí)別子模塊611,還被配置為通過針對(duì)預(yù)定人臉尺寸的人臉模型,對(duì)證件圖像中的預(yù)定區(qū)域進(jìn)行人臉識(shí)別,得到人臉區(qū)域。
[0177]確定模塊620,被配置為根據(jù)人臉區(qū)域的區(qū)域位置確定出至少一個(gè)信息區(qū)域;
[0178]在證件圖像的類型已知時(shí),人臉區(qū)域的預(yù)定邊緣與證件上其它信息區(qū)域之間存在固定的相對(duì)位置關(guān)系,確定模塊620根據(jù)人臉區(qū)域的預(yù)定邊緣和該相對(duì)位置關(guān)系確定出至少一個(gè)信息區(qū)域。
[0179]切割模塊630,被配置為對(duì)信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域。
[0180]信息區(qū)域中包括有多個(gè)字符。對(duì)于一個(gè)信息區(qū)域,切割模塊630通過區(qū)域切割能夠得到至少一個(gè)字符區(qū)域。字符區(qū)域是包括單個(gè)字符的區(qū)域。字符可以是漢字、英文字母、數(shù)字或者其它語種的字符。
[0181]綜上所述,本公開實(shí)施例中提供的區(qū)域識(shí)別裝置,通過獲取證件圖像中人臉區(qū)域的預(yù)定邊緣;根據(jù)人臉區(qū)域的預(yù)定邊緣確定出信息區(qū)域;對(duì)信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域;解決了相關(guān)技術(shù)中對(duì)于直接拍攝得到的證件圖像中的某些信息區(qū)域的識(shí)別難度大和對(duì)某些信息區(qū)域的定位不準(zhǔn)確的問題;達(dá)到了通過證件圖像中人臉區(qū)域的區(qū)域位置確定出其它信息區(qū)域,并對(duì)其它信息區(qū)域進(jìn)行切割,從而對(duì)信息區(qū)域準(zhǔn)確定位和對(duì)信息區(qū)域中的字符區(qū)域進(jìn)行準(zhǔn)確識(shí)別的效果。
[0182]在基于圖7實(shí)施例提供的可選實(shí)施例中,第二識(shí)別子模塊612,可以包括如下子模塊如圖8所不:
[0183]興趣確定子模塊810,被配置為根據(jù)人臉區(qū)域的下部確定出興趣區(qū)域,興趣區(qū)域包括人臉區(qū)域的下邊緣;
[0184]興趣確定子模塊810在人臉區(qū)域的下部按照預(yù)設(shè)窗口確定出興趣區(qū)域,該興趣區(qū)域以保證覆蓋人臉區(qū)域的下邊緣為準(zhǔn)。
[0185]檢測(cè)子模塊820,被配置為對(duì)