本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種傾斜文本圖像的校正方法及系統(tǒng)。
背景技術(shù):
近年來(lái),隨著移動(dòng)通信和互聯(lián)網(wǎng)技術(shù)的發(fā)展,大量的移動(dòng)終端設(shè)備如智能手機(jī)、平板電腦等走進(jìn)我們的生活,逐漸成為人們生活中不可缺少的一部分。這些移動(dòng)設(shè)備都擁有攝像功能,在金融行業(yè)中得到了廣泛應(yīng)用,同時(shí)也對(duì)金融行業(yè)傳統(tǒng)的影像資料采集帶來(lái)了新的變革和挑戰(zhàn)。但采集的影像資料質(zhì)量往往難以保證,會(huì)出現(xiàn)噪聲、傾斜等問(wèn)題,為后續(xù)的識(shí)別處理增加了很大的難度。
在現(xiàn)有的圖像處理技術(shù)中,文本圖像校正方法的主要思路是在進(jìn)行預(yù)處理后檢測(cè)文本圖像的傾斜角,主要包括基于fourier變換的方法、基于hough變換的方法、基于投影的方法以及基于交叉相關(guān)性的方法和k-最近鄰簇方法。
hough變換是最常用的檢測(cè)傾斜角方法,計(jì)算量很大,計(jì)算量為whm次變換(其中w為圖像寬度,h為圖像高度,m為選取的變換角度的個(gè)數(shù));交叉相關(guān)性算法相關(guān)矩陣的計(jì)算量較大,基于投影的方法需要對(duì)整個(gè)圖像統(tǒng)計(jì)特征值,因此計(jì)算量和復(fù)雜度都較高;fourier變換方法將文檔圖像的所有像素點(diǎn)進(jìn)行fourier變換,計(jì)算量非常大,目前很少采用;最近鄰簇(knn)方法計(jì)算復(fù)雜度為o(n*n),其中n為連通區(qū)個(gè)數(shù)。
綜上,現(xiàn)有的文本圖像校正方法計(jì)算量都較大,且過(guò)程復(fù)雜。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種傾斜文本圖像的校正方法,包括以下步驟:
獲取待校正文本圖像左右兩邊的平均像素高度;
根據(jù)所述平均像素高度,計(jì)算圖像的傾斜角度;
將所述待校正文本圖像反方向旋轉(zhuǎn)所述傾斜角度,得到校正后的文本圖像。
作為一種可實(shí)施方式,本發(fā)明的傾斜文本圖像的校正方法,還包括以下步驟:
獲取所述待校正文本圖像;
對(duì)所述待校正文本圖像進(jìn)行預(yù)處理,得到第一文本圖像;
計(jì)算所述第一文本圖像左右兩邊的平均像素高度,并將其作為所述待校正文本圖像左右兩邊的平均像素高度。
作為一種可實(shí)施方式,對(duì)所述待校正文本圖像進(jìn)行預(yù)處理,得到第一文本圖像,包括以下步驟:
對(duì)所述待校正文本圖像進(jìn)行灰度化處理,得到灰度圖像;
利用中值濾波算法對(duì)所述灰度圖像進(jìn)行去噪,得到平滑后的所述灰度圖像;
對(duì)平滑后的所述灰度圖像進(jìn)行反色,得到黑底白字的所述第一文本圖像。
作為一種可實(shí)施方式,計(jì)算所述第一文本圖像左右兩邊的平均像素高度,包括以下步驟:
從上、左、右遍歷所述第一文本圖像,得到最高點(diǎn)t、最左點(diǎn)l、最右點(diǎn)r;
比較|t.x-l.x|與|r.x-t.x|之間的大小,t.x、l.x、r.x依次為圖像的最高點(diǎn)、最左點(diǎn)、最右點(diǎn)的橫坐標(biāo);
若|t.x-l.x|大于|r.x-t.x|,則判斷所述第一文本圖像右傾斜,計(jì)算最高點(diǎn)t的像素高度h1和最右點(diǎn)r的像素高度h2;
若|t.x-l.x|小于|r.x-t.x|,則判斷所述第一文本圖像左傾斜,計(jì)算最高點(diǎn)t的像素高度h1和最左點(diǎn)l的像素高度h3。
作為一種可實(shí)施方式,根據(jù)所述平均像素高度,計(jì)算圖像的傾斜角度,包括以下步驟:
若判斷所述第一文本圖像右傾斜,則根據(jù)公式
若判斷所述第一文本圖像左傾斜,則根據(jù)公式
作為一種可實(shí)施方式,本發(fā)明的傾斜文本圖像的校正方法,還包括以下步驟:
在從上、左、右遍歷所述第一文本圖像,得到最高點(diǎn)t、最左點(diǎn)l、最右點(diǎn)r之后,對(duì)所述最高點(diǎn)t、最左點(diǎn)l、最右點(diǎn)r的鄰域求均值。
基于同一發(fā)明構(gòu)思,本發(fā)明還提供了一種傾斜文本圖像的校正系統(tǒng),包括第一獲取模塊、第一計(jì)算模塊以及旋轉(zhuǎn)模塊;
所述第一獲取模塊用于獲取待校正文本圖像左右兩邊的平均像素高度;
所述第一計(jì)算模塊用于根據(jù)所述第一獲取模塊獲取的所述平均像素高度,計(jì)算圖像的傾斜角度;
所述旋轉(zhuǎn)模塊用于將所述待校正文本圖像反方向旋轉(zhuǎn)所述傾斜角度,得到校正后的文本圖像。
作為一種可實(shí)施方式,本發(fā)明的傾斜文本圖像的校正系統(tǒng),還包括第二獲取模塊、預(yù)處理模塊以及第二計(jì)算模塊;
所述第二獲取模塊用于獲取所述待校正文本圖像;
所述預(yù)處理模塊用于對(duì)所述待校正文本圖像進(jìn)行預(yù)處理,得到第一文本圖像;
所述第二計(jì)算模塊用于計(jì)算所述第一文本圖像左右兩邊的平均像素高度,并將其作為所述待校正文本圖像左右兩邊的平均像素高度。
作為一種可實(shí)施方式,所述預(yù)處理模塊包括灰度化處理單元、去噪處理單元以及反色處理單元;
所述灰度化處理單元用于對(duì)所述待校正文本圖像進(jìn)行灰度化處理,得到灰度圖像;
所述去噪處理單元用于利用中值濾波算法對(duì)所述灰度圖像進(jìn)行去噪,得到平滑后的所述灰度圖像;
所述反色處理單元用于對(duì)平滑后的所述灰度圖像進(jìn)行反色,得到黑底白字的所述第一文本圖像。
作為一種可實(shí)施方式,所述第一獲取模塊包括遍歷單元、比較單元、第一計(jì)算單元以及第二計(jì)算單元;
所述遍歷單元,用于從上、左、右遍歷所述第一文本圖像,得到最高點(diǎn)t、最左點(diǎn)l、最右點(diǎn)r;
所述比較單元用于比較|t.x-l.x|與|r.x-t.x|之間的大小,t.x、l.x、r.x依次為圖像的最高點(diǎn)、最左點(diǎn)、最右點(diǎn)的橫坐標(biāo);
所述第一計(jì)算單元用于若|t.x-l.x|大于|r.x-t.x|,則判斷所述第一文本圖像右傾斜,計(jì)算最高點(diǎn)t的像素高度h1和最右點(diǎn)r的像素高度h2;
所述第二計(jì)算單元用于若|t.x-l.x|小于|r.x-t.x|,則判斷所述第一文本圖像左傾斜,計(jì)算最高點(diǎn)t的像素高度h1和最左點(diǎn)l的像素高度h3。
本發(fā)明相比于現(xiàn)有技術(shù)的有益效果在于:
本發(fā)明提供的傾斜文本圖像的校正方法及系統(tǒng),通過(guò)獲取待校正文本圖像左右兩邊的平均像素高度,進(jìn)而計(jì)算圖像的傾斜角度,最后將待校正文本圖像反方向旋轉(zhuǎn)該傾斜角度,即可得到校正后的文本圖像,實(shí)現(xiàn)對(duì)傾斜的文本圖像進(jìn)行快速校正,方法簡(jiǎn)單,計(jì)算量小,易于實(shí)現(xiàn)。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例一提供的傾斜文本圖像的校正方法的流程示意圖;
圖2為本發(fā)明實(shí)施例二提供的傾斜文本圖像的校正方法的流程示意圖;
圖3為待校正文本圖像示意圖;
圖4為第一文本圖像示意圖;
圖5為統(tǒng)計(jì)第一文本圖象平均像素高度示意圖;
圖6為校正后的文本圖像示意圖;
圖7為圖2所示的本發(fā)明實(shí)施例二中計(jì)算第一文本圖像左右兩邊的平均像素高度,并計(jì)算出傾斜角度的流程示意圖。
具體實(shí)施方式
以下結(jié)合附圖,對(duì)本發(fā)明上述的和另外的技術(shù)特征和優(yōu)點(diǎn)進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明的部分實(shí)施例,而不是全部實(shí)施例。
參見(jiàn)圖1,本發(fā)明實(shí)施例一提供了一種傾斜文本圖像的校正方法,包括以下步驟:
s110、獲取待校正文本圖像左右兩邊的平均像素高度;
s120、根據(jù)平均像素高度,計(jì)算圖像的傾斜角度;
s130、將待校正文本圖像反方向旋轉(zhuǎn)傾斜角度,得到校正后的文本圖像。
實(shí)施例一提供的傾斜文本圖像的校正方法及系統(tǒng),采用統(tǒng)計(jì)圖像左右兩邊的平均像素高度,計(jì)算出傾斜角,從而實(shí)現(xiàn)對(duì)傾斜的文本圖像進(jìn)行快速校正,過(guò)程簡(jiǎn)單,可大大減少計(jì)算量。
本發(fā)明提供的傾斜文本圖像的校正方法,適用于彩色文本圖像,也適用于黑白文本圖像。
進(jìn)一步地,參見(jiàn)圖2,針對(duì)彩色文本圖像,本發(fā)明實(shí)施例二提供了一種傾斜文本圖像的校正方法,包括以下步驟:
s210、獲取待校正文本圖像,如圖3所示;
s220、對(duì)待校正文本圖像進(jìn)行預(yù)處理,得到第一文本圖像,如圖4所示;
s230、計(jì)算第一文本圖像左右兩邊的平均像素高度,并計(jì)算出傾斜角度,如圖5所示;
s240、將待校正文本圖像反向旋轉(zhuǎn)該旋轉(zhuǎn)角度,得到校正后的文本圖像,如圖6所示。
其中,步驟s220對(duì)待校正文本圖像進(jìn)行預(yù)處理,主要針對(duì)的是彩色圖像,先把彩色圖像進(jìn)行灰度化處理,得到灰度圖像。然后利用中值濾波算法對(duì)得到的灰度圖像進(jìn)行去噪,得到平滑后的灰度圖像。接下來(lái),對(duì)平滑后的灰度圖像進(jìn)行反色,得到黑底白字的第一文本圖像,如圖4所示。
參見(jiàn)圖7,步驟s230具體包括以下步驟:
s231、對(duì)第一文本圖像從上、左、右遍歷圖像得到最高點(diǎn)t、最左點(diǎn)l、最右點(diǎn)r。為了防止噪聲等干擾,可以對(duì)所求的t、l、r的鄰域求均值。如果是最高點(diǎn)t,求其3×3下領(lǐng)域的平均值;如果是最左點(diǎn)l,求其3×3右領(lǐng)域的平均值;如果是最右點(diǎn)r,求其3×3左領(lǐng)域的平均值。
s232、接下來(lái)比較|t.x-l.x|與|r.x-t.x|之間的大小(t.x、l.x、r.x依次為圖像的最高點(diǎn)、最左點(diǎn)、最右點(diǎn)的橫坐標(biāo));
s233、若|t.x-l.x|大于|r.x-t.x|,則判斷第一文本圖像右傾斜,計(jì)算最高點(diǎn)t的像素高度h1和最右點(diǎn)r的像素高度h2,最高點(diǎn)t的像素高度h1和最右點(diǎn)r的像素高度h2均為平均像素高度;根據(jù)公式
s234、若|t.x-l.x|小于|r.x-t.x|,則判斷第一文本圖像左傾斜,計(jì)算最高點(diǎn)t的像素高度h1和最左點(diǎn)l的像素高度h3,最高點(diǎn)t的像素高度h1和最左點(diǎn)l的像素高度h3均為平均像素高度;則根據(jù)公式
最后,將待校正文本圖像進(jìn)行旋轉(zhuǎn),如果是右傾斜,則逆時(shí)針旋轉(zhuǎn)(向左旋轉(zhuǎn))角度θ1得到校正后文本圖像;如果是左傾斜,則順時(shí)針旋轉(zhuǎn)(向右旋轉(zhuǎn))角度θ2得到校正后文本圖像,如圖6所示。
基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例三還提供一種傾斜文本圖像的校正系統(tǒng),該系統(tǒng)與上述方法的原理相同,系統(tǒng)的實(shí)施可參照上述方法實(shí)現(xiàn),此處不再冗述。
本發(fā)明實(shí)施例三提供的一種傾斜文本圖像的校正系統(tǒng),包括第一獲取模塊、第一計(jì)算模塊以及旋轉(zhuǎn)模塊;
第一獲取模塊用于獲取待校正文本圖像左右兩邊的平均像素高度;
第一計(jì)算模塊用于根據(jù)第一獲取模塊獲取的平均像素高度,計(jì)算圖像的傾斜角度;
旋轉(zhuǎn)模塊用于將待校正文本圖像反方向旋轉(zhuǎn)傾斜角度,得到校正后的文本圖像。
作為一種可實(shí)施方式,本發(fā)明的傾斜文本圖像的校正系統(tǒng),還包括第二獲取模塊、預(yù)處理模塊以及第二計(jì)算模塊;
第二獲取模塊用于獲取待校正文本圖像;
預(yù)處理模塊用于對(duì)待校正文本圖像進(jìn)行預(yù)處理,得到第一文本圖像;
第二計(jì)算模塊用于計(jì)算第一文本圖像左右兩邊的平均像素高度,并將其作為待校正文本圖像左右兩邊的平均像素高度。
作為一種可實(shí)施方式,預(yù)處理模塊包括灰度化處理單元、去噪處理單元以及反色處理單元;
灰度化處理單元用于對(duì)待校正文本圖像進(jìn)行灰度化處理,得到灰度圖像;
去噪處理單元用于利用中值濾波算法對(duì)灰度圖像進(jìn)行去噪,得到平滑后的灰度圖像;
反色處理單元用于對(duì)平滑后的灰度圖像進(jìn)行反色,得到黑底白字的第一文本圖像。
作為一種可實(shí)施方式,第一獲取模塊包括遍歷單元、比較單元、第一計(jì)算單元以及第二計(jì)算單元;
遍歷單元,用于從上、左、右遍歷第一文本圖像,得到最高點(diǎn)t、最左點(diǎn)l、最右點(diǎn)r;
比較單元用于比較|t.x-l.x|與|r.x-t.x|之間的大小,t.x、l.x、r.x依次為圖像的最高點(diǎn)、最左點(diǎn)、最右點(diǎn)的橫坐標(biāo);
第一計(jì)算單元用于若|t.x-l.x|大于|r.x-t.x|,則判斷第一文本圖像右傾斜,計(jì)算最高點(diǎn)t的像素高度h1和最右點(diǎn)r的像素高度h2;
第二計(jì)算單元用于若|t.x-l.x|小于|r.x-t.x|,則判斷第一文本圖像左傾斜,計(jì)算最高點(diǎn)t的像素高度h1和最左點(diǎn)l的像素高度h3。
進(jìn)一步地,第一計(jì)算模塊包括第一判斷單元和第二判斷單元;
第一判斷單元用于若判斷第一文本圖像右傾斜,則根據(jù)公式
第二判斷單元用于若判斷第一文本圖像左傾斜,則根據(jù)公式
進(jìn)一步地,第一獲取模塊還包括均值求解單元,均值求解單元用于在從上、左、右遍歷第一文本圖像,得到最高點(diǎn)t、最左點(diǎn)l、最右點(diǎn)r之后,對(duì)最高點(diǎn)t、最左點(diǎn)l、最右點(diǎn)r的鄰域求均值。
本發(fā)明通過(guò)采用統(tǒng)計(jì)圖像左右兩邊的平均像素高度,計(jì)算出傾斜角,從而實(shí)現(xiàn)對(duì)傾斜的文本圖像進(jìn)行快速校正,計(jì)算量小,便于實(shí)現(xiàn)。
以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來(lái)實(shí)現(xiàn)本公開(kāi)方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
以上所述的具體實(shí)施例,對(duì)本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步的詳細(xì)說(shuō)明,應(yīng)當(dāng)理解,以上所述僅為本發(fā)明的具體實(shí)施例而已,并不用于限定本發(fā)明的保護(hù)范圍。特別指出,對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。