。其中,位于前景的一種顏色的像素點稱之為前景色像素點,也即圖3B的白色像素點;位于背景的一種顏色的像素點稱之為背景色像素點,也即圖3B中的黑色像素點。
[0130]在步驟202b中,對處理后的證件圖像中的預定區(qū)域進行直線檢測,得到至少一條直線;
[0131]該預定區(qū)域是位于證件的預定方向的區(qū)域。比如:該預定區(qū)域是證件的下邊緣在證件圖像中的區(qū)域,或者,該預定區(qū)域是證件的上邊緣在證件圖像中的區(qū)域等等。
[0132]在獲取到索貝爾水平濾波和二值化的證件圖像后,對處理后的證件圖像進行直線檢測,該直線檢測包括直線擬合或Hough變換,從而得到至少一條直線,如圖3C所示。
[0133]在步驟202c中,在直線為η條時,η22,將η條直線識別為η條候選的預定邊緣。
[0134]當獲取到的直線為η條時,將η條直線識別為η條候選的預定邊緣,其中,2;
[0135]比如:針對索貝爾水平濾波和二值化的證件圖像,對證件的下邊緣在證件圖像中的區(qū)域進行直線檢測,通過直線擬合或Hough變換后,得到η條候選的預定邊緣,則η條候選的證件的下邊緣在二值化證件圖像中的區(qū)域,如圖3D所示。
[0136]當獲取到的直線只有一條時,將該條直線直接識別為證件圖像中的目標預定邊緣,直接執(zhí)行步驟212。
[0137]綜上所述,本實施例提供的區(qū)域識別方法,通過對證件圖像進行索貝爾水平濾波和二值化,得到處理后的證件圖像,對處理后的證件圖像中的預定區(qū)域進行直線檢測,得到至少一條直線,將η條直線識別為η條候選的預定邊緣,使得在對證件圖像的目標預定邊緣的檢測更加準確,能夠提高后續(xù)信息區(qū)域識別時的準確度。
[0138]在基于圖2實施例提供的可選實施例中,步驟204對η條候選的預定邊緣進行排序可替代實現(xiàn)為如下步驟204a和步驟204b,如圖4所示:
[0139]在步驟204a中,對于每一條候選的預定邊緣,將預定邊緣與處理后的證件圖像中相同位置處的前景色像素點求交,得到預定邊緣對應的交點數(shù);
[0140]其中,處理后的證件圖像是經(jīng)過索貝爾水平濾波和二值化的圖像;
[0141]在獲取到η條候選的預定邊緣后,首先對證件圖像進行sobel水平濾波,也即采用sobel算子沿水平方向進行濾波。然后,對濾波后的證件圖像進行二值化。
[0142]將每一條候選的預定邊緣于處理后的證件圖像中相同位置處的前景色像素點求交。也即求取每一條候選的預定邊緣在二值化后的證件圖像中相同位置處屬于前景色像素點的個數(shù)。
[0143]在步驟204b中,按照交點數(shù)由多到少的順序,將η條候選的預定邊緣進行排序。
[0144]在獲取到每一條候選的預定邊緣對應的交點數(shù)后,按照交點數(shù)的個數(shù)有多到少的順序進行排序,獲取排序后的η條候選的預定邊緣。
[0145]綜上所述,本實施例提供的區(qū)域識別方法,通過對η條候選的預定邊緣進行排序,提高了確定目標預定邊緣的速度,有利于對目標預定邊緣的準確定位,能夠提高后續(xù)信息區(qū)域識別時的準確性。
[0146]在基于圖2實施例提供的可選實施例中,步驟206使用第i條候選的預定邊緣和第一相對位置關系,在證件圖像中嘗試識別目標信息區(qū)域??商娲鷮崿F(xiàn)為如下步驟206a和步驟206b,如圖5A所示:
[0147]在步驟206a中,使用第i條候選的預定邊緣和第一相對位置關系,在證件圖像中截取出興趣區(qū)域;
[0148]根據(jù)第i條候選的預定邊緣和第一相對位置關系,可以確定出興趣區(qū)域的上邊緣、下邊緣、左邊緣和右邊緣的大概位置,因此,根據(jù)確定的興趣區(qū)域的上邊緣、下邊緣、左邊緣和右邊緣,在證件圖像中截取出興趣區(qū)域。
[0149]比如:以目標預定邊緣為身份證的下邊緣為例,將圖3C中的第i條候選的預定邊緣確定為身份證的下邊緣51,根據(jù)身份證的下邊緣51與公民身份號碼之間的相對位置關系,確定出公民身份號碼上邊緣52、下邊緣53、左邊緣54和右邊緣55的大概位置,如圖5B所示。
[0150]其中,興趣區(qū)域是指根據(jù)第i條候選的預定邊緣和第一相對位置關系確定出的區(qū)域。
[0151]在步驟206b中,識別興趣區(qū)域中是否存在符合預定特征的字符區(qū)域,預定特征是目標信息區(qū)域中的字符區(qū)域所具有的特征。
[0152]在截取出興趣區(qū)域后,根據(jù)預定特征識別興趣區(qū)域中是否存在符合預定特征的字符區(qū)域。
[0153]其中,預定特征是目標信息區(qū)域中的字符區(qū)域所具有的特征。比如,目標信息區(qū)域是公民身份號碼區(qū)域,則該特征可以是包括有連續(xù)的18個字符區(qū)域(或稱18個數(shù)字區(qū)域),相鄰的兩個字符區(qū)域之間的字間距較小,且每個字符區(qū)域的高度符合預定區(qū)間。
[0154]當識別出興趣區(qū)域中存在符合預定特征的字符區(qū)域時,即成功識別出目標信息區(qū)域;
[0155]當識別出興趣區(qū)域中不存在符合預定特征的字符區(qū)域時,即未能識別出目標信息區(qū)域。
[0156]可選地,識別興趣區(qū)域中是否存在符合預定特征的字符區(qū)域。步驟206b可替代實現(xiàn)成為步驟301至步驟305,如圖6A所示。
[0157]在步驟301中,對興趣區(qū)域進行二值化,得到二值化后的興趣區(qū)域;
[0158]以興趣區(qū)域是公民身份號碼區(qū)域為例,可選地,先對興趣區(qū)域進行預處理。其中,預處理可以包括:去噪、濾波、提取邊緣等操作;將預處理后的興趣區(qū)域進行二值化。
[0159]在步驟302中,對二值化后的興趣區(qū)域按照水平方向計算第一直方圖,第一直方圖包括:每行像素點的豎坐標和每行像素點中前景色像素點的累加值;
[0160]將二值化后的興趣區(qū)域按照水平方向計算第一直方圖,該第一直方圖在豎直方向表示每行像素點的豎坐標,在水平方向表示每行像素點中前景色像素點的個數(shù)累加值。前景色像素點是指二值化后的圖像中的白色像素點,如圖6B所示。
[0161]在步驟303中,對二值化后的興趣區(qū)域按照豎直方向計算第二直方圖,第二直方圖包括:每列像素點的橫坐標和每列像素點中前景色像素點的累加值;
[0162]將二值化后的興趣區(qū)域按照豎直方向計算第二直方圖,該第二直方圖在水平方向表示每列像素點的橫坐標,在豎直方向表示每列像素點中前景色像素點的個數(shù)累加值,如圖6(:所示。
[0163]在步驟304中,若第一直方圖中前景色像素點的累加值大于第一閾值的行所組成的連續(xù)行集合的高度符合預定高度區(qū)間,且第二直方圖中前景色像素點的累加值大于第二閾值的列所組成的連續(xù)列集合的個數(shù)符合預定個數(shù),則在興趣區(qū)域中成功識別出符合預定特征的字符區(qū)域;
[0164]根據(jù)第一直方圖可以獲取到每一行像素點中前景色像素點的累加值,將每一行像素點中前景色像素點的累加值與第一閾值進行比較,獲取第一直方圖中前景色像素點的累加值大于第一閾值的行所組成的連續(xù)行集合的高度。
[0165]連續(xù)行集合是指:前景色像素點的累加值大于第一閾值的行是連續(xù)的m行,該連續(xù)的m行像素點所組成的集合,如圖6D所示,對于圖中的m行像素點,在位于左側直方圖中的前景色像素點的累加值均大于第一閾值。而該m行像素點在證件圖像中對應公民身份號碼行“0421199”,則m行像素點的高度即為連續(xù)行集合的高度。
[0166]根據(jù)第二直方圖可以獲取到每一列像素點中前景色像素點的累加值,將每一列像素點中前景色像素點的累加值與第二閾值進行比較,獲取第二直方圖中前景色像素點的累加值大于第二閾值的列所組成的連續(xù)列集合的個數(shù)。
[0167]連續(xù)列集合是指:前景色像素點的累加值大于第二閾值的列是連續(xù)的P列,該連續(xù)的P列像素點所組成的集合,如圖6E所示,連續(xù)列集合為p,也即第二直方圖中形成的連續(xù)白色區(qū)域。對于圖中的P列像素點,在位于下側直方圖中的前景色像素點的累加值均大于第二閾值。而該P列像素點在證件圖像中對應字符區(qū)域“X”。
[0168]當連續(xù)行集合的高度符合預定高度區(qū)間,且,連續(xù)列集合的個數(shù)符合預定個數(shù)時,則認為在興趣區(qū)域中成功識別出符合預定特征的字符區(qū)域。
[0169]在步驟305中,若第一直方圖中前景色像素點的累加值大于第一閾值的行所組成的連續(xù)行集合的高度不符合預定高度區(qū)間,或者第二直方圖中前景色像素點的累加值大于第二閾值的列所組成的連續(xù)列集合的個數(shù)不符合預定個數(shù),則在興趣區(qū)域中未能識別出符合預定特征的字符區(qū)域。
[0170]當連續(xù)行集合的高度不符合預定高度區(qū)間,或者,連續(xù)列集合的個數(shù)不符合預定個數(shù)時,則認為在興趣區(qū)域中未能識別出符合預定特征的字符區(qū)域。
[0171]綜上所述,本實施例提供的區(qū)域識別方法,通過對興趣區(qū)域進行二值化,并將二值化后的興趣區(qū)域分別按照水平方向和豎直方向計算第一直方圖和第二直方圖,根據(jù)第一直方圖中連續(xù)行集合的高度和第二直方圖中連續(xù)列集合的個數(shù)確定是否識別出符合預定特征的字符區(qū)域,使得對字符區(qū)域的定位更加準確。
[0172]在基于圖2實施例提供的可選實施例中,在根據(jù)目標預定邊緣在證件圖像中識別出至少一個信息區(qū)域后,可以根據(jù)如下步驟對信息區(qū)域中的字符進行識別。如圖7所示:
[0173]在步驟701中,對信息區(qū)域進行二值化,得到二值化后的信息區(qū)域;
[0174]以信息區(qū)域是公民身份號碼區(qū)域為例,可選地,先對信息區(qū)域進行預處理。其中,預處理可以包括:去噪、濾波、提取邊緣等操作;將預處理后的信息區(qū)域進行二值化。
[0175]在步驟702中,對二值化后的信息區(qū)域按照水平方向計算第一直方圖,第一直方圖包括:每行像素點的豎坐標和每行像素點中前景色像素點的累加值;
[0176]在步驟703中,根據(jù)第一直方圖中前景色像素點的累加值大于第一閾值的行所組成的連續(xù)行集合,識別得到a行文字區(qū)域,a為正整數(shù);
[0177]根據(jù)第一直方圖可以獲取到每一行像素點中前景色像素點的累加值,將每一行像素點中前景色像素點的累加值與第一閾值進行比較,將第一直方圖中前景色像素點的累加值大于第一閾值的行所組成的連續(xù)行集合,確定為文字區(qū)域所在的行。
[0178]當然,若該信息區(qū)域是地址信息區(qū)域或者其他信息區(qū)域,文字區(qū)域可能為兩行或者兩行以上。此時,每個連續(xù)行集合識別為一行