1.一種基于連通域的自然場景文本檢測方法,包括:
1)輸入原始圖像I,并對其進(jìn)行灰度變換得到灰度圖像IG;
2)對灰度圖像IG,利用最大穩(wěn)定極值區(qū)域算子MSER提取字符候選區(qū)域,得到字符候選區(qū)域圖像Im;
3)根據(jù)字符區(qū)域的基本幾何特性過濾掉Im中一些不含有字符的候選區(qū)域,得到初步過濾后的字符候選區(qū)域圖像I1;
3a)計(jì)算Im每一個字符候選區(qū)域的外接矩形邊界框;
3b)計(jì)算每個外接矩形邊界框的長寬比,將長寬比大于10的字符候選區(qū)域去除;
3c)計(jì)算剩余字符候選區(qū)域的歐拉數(shù),將歐拉數(shù)小于-4的字符候選區(qū)域去除;
3d)計(jì)算與剩余字符候選區(qū)域具有相同標(biāo)準(zhǔn)二階中心矩的橢圓離心率,將離心率大于0.995的候選區(qū)域去除;
3e)計(jì)算剩余字符候選區(qū)域的固靠性程度值,將該值小于0.3的候選區(qū)域去除,得到初步過濾后的字符候選區(qū)域圖像I1;
4)根據(jù)字符筆畫寬度特性進(jìn)一步過濾掉I1中一些不含有字符的候選區(qū)域,得到最終的過濾后字符區(qū)域候選圖像I2;
4a)分別計(jì)算出I1中每個字符候選區(qū)域的筆畫寬度均值和筆畫寬度標(biāo)準(zhǔn)偏差;
4b)計(jì)算出筆畫寬度均值與標(biāo)準(zhǔn)偏差的比值,將比值大于0.5的字符候選區(qū)域去掉,得到再次過濾后字符候選區(qū)域圖像I2;
5)將I2中剩余的字符候選區(qū)域合并為文本行區(qū)域;
5a)將I2中剩余的字符候選區(qū)域用邊界框標(biāo)定;
5b)分別計(jì)算每一對相鄰的邊界框的重疊區(qū)域面積值Sr和這兩個重疊區(qū)域的總面積值Sa,獲得這兩個面積的比值;
5c)依次將比值為非零的字符候選區(qū)域進(jìn)行連接,合并成文本行區(qū)域;
6)將文本行區(qū)域依次輸入到卷積神經(jīng)網(wǎng)絡(luò)CNN文字檢測器中,去除掉不含有文字的文本行區(qū)域,得到最終含有文字的文本行區(qū)域。
2.根據(jù)權(quán)利要求1所述的方法,其中步驟3a)中計(jì)算Im每一個字符候選區(qū)域的外接矩形邊界框,按如下步驟進(jìn)行:
3a1)依次計(jì)算每個字符候選區(qū)域的最上邊的像素點(diǎn)坐標(biāo)(xu,yu)、最下邊的像素點(diǎn)坐標(biāo)(xd,yd)、最右邊的像素點(diǎn)坐標(biāo)(xr,yr)、最左邊的像素點(diǎn)坐標(biāo)(xl,yl),其中xu、xd、xr、xl分別代表最上邊、最下邊、最右邊、最左邊的像素點(diǎn)橫坐標(biāo),yu、yd、yr、yl分別代表最上邊、最下邊、最右邊、最左邊的像素點(diǎn)縱坐標(biāo);
3a2)根據(jù)如下公式計(jì)算出每個候選區(qū)域的中心坐標(biāo)(xc,yc):
xc=(xr+xl)/2
yc=(yu+yd)/2
其中xc代表區(qū)域中心的橫坐標(biāo),yc代表區(qū)域中心的縱坐標(biāo);
3a3)計(jì)算每個字符候選區(qū)域?qū)?yīng)的外接矩形的寬w和長l:
w=xr-xl,l=y(tǒng)u-yd;
3a4)依次以點(diǎn)(xc,yc)為中心繪制寬為w,長為l的矩形邊界框。
3.根據(jù)權(quán)利要求1所述的方法,其中步驟3c)中計(jì)算剩余字符候選區(qū)域的歐拉數(shù),按如下步驟進(jìn)行:
3c1)依次統(tǒng)計(jì)出每個字符候選區(qū)域的連接體數(shù)C和孔洞數(shù)H;
3c2)連接體數(shù)C和孔洞數(shù)H,計(jì)算候選區(qū)域歐拉數(shù)的值E:E=C-H。
4.根據(jù)權(quán)利要求1所述的方法,其中步驟3d)中計(jì)算與剩余字符候選區(qū)域具有相同標(biāo)準(zhǔn)二階中心矩的橢圓離心率,通過調(diào)用Matlab中的regionprops函數(shù)求解得到,該函數(shù)形式如下:
e=regionprops(L,'eccentricity')
其中,e代表離心率的值,L代表待檢測的字符候選區(qū)域,eccentricity代表離心率參數(shù)。
5.根據(jù)權(quán)利要求1所述的方法,其中步驟3e)中計(jì)算剩余字符候選區(qū)域的固靠性程度值,通過調(diào)用Matlab中的regionprops函數(shù)求解得到,該函數(shù)形式如下:
s=regionprops(L,'solidity')
其中,s代表固靠性程度值,L代表待檢測的字符候選區(qū)域,solidity代表固靠性程度值參數(shù)。
6.根據(jù)權(quán)利要求1所述的方法,其中步驟4a)中分別計(jì)算出I1中每個字符候選區(qū)域的筆畫寬度均值和筆畫寬度標(biāo)準(zhǔn)偏差,按如下步驟進(jìn)行:
4a1)通過調(diào)用Matlab中的距離變換bwdist函數(shù)求得每個候選文字區(qū)域的筆畫寬度矩陣S:
S=bwdist(L)
其中L代表待檢測的字符候選區(qū)域;
4a2)通過調(diào)用Matlab中的mean函數(shù)求得S對應(yīng)的筆畫寬度均值Y:
Y=mean(S)
4a3)通過調(diào)用Matlab中的std函數(shù)求得S對應(yīng)的筆畫寬度方差δ:δ=std(S)。