亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

訓(xùn)練分類器、圖像中文字區(qū)域檢測(cè)的方法及系統(tǒng)的制作方法

文檔序號(hào):6488117閱讀:219來源:國知局
訓(xùn)練分類器、圖像中文字區(qū)域檢測(cè)的方法及系統(tǒng)的制作方法
【專利摘要】本申請(qǐng)公開了一種訓(xùn)練分類器的方法及系統(tǒng)、圖像中文字區(qū)域檢測(cè)的方法及系統(tǒng),屬于圖像檢測(cè)領(lǐng)域。該檢測(cè)方法包括:獲取經(jīng)灰度處理的待檢測(cè)圖像;獲取與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的黑白二值圖;根據(jù)所述黑白二值圖確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選檢測(cè)區(qū)域;根據(jù)從候選檢測(cè)區(qū)域提取的圖像特征和分類器確定待檢測(cè)圖像中的候選文字區(qū)域;根據(jù)候選文字區(qū)域獲取圖像中的文字區(qū)域。本申請(qǐng)可以快速準(zhǔn)確地檢測(cè)圖像中的文字區(qū)域。
【專利說明】訓(xùn)練分類器、圖像中文字區(qū)域檢測(cè)的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及圖像檢測(cè)領(lǐng)域,尤其涉及一種訓(xùn)練分類器的方法及系統(tǒng)、圖像中文字區(qū)域檢測(cè)的方法及系統(tǒng)。
【背景技術(shù)】
[0002]圖像中文字區(qū)域的檢測(cè)歷來是圖像檢測(cè)的一個(gè)重要課題,以圖像中的商標(biāo)為例,商標(biāo)是指生產(chǎn)者、經(jīng)營者為使自已的商品或服務(wù)與他人的商品或服務(wù)相區(qū)別,而使用在商品或服務(wù)上的一種可視性標(biāo)志。大多數(shù)商標(biāo)包括文字部分,這樣的商標(biāo)也可以稱為文字商標(biāo)。對(duì)于許多網(wǎng)站,尤其是電子商務(wù)網(wǎng)站,存在各種侵犯商標(biāo)專用權(quán)的行為,比如賣家發(fā)布的圖像中使用了某個(gè)未經(jīng)商標(biāo)持有人授權(quán)的商標(biāo),這種行為對(duì)商標(biāo)持有人和商品購買者都帶來了很多的利益損害。如果可以在一幅圖像中檢測(cè)出商標(biāo)的文字區(qū)域,則可以為后續(xù)的商標(biāo)侵權(quán)判斷提供更精準(zhǔn)的依據(jù)。目前常用的圖像中文字區(qū)域的檢測(cè)方法如下:
[0003]第一、基于邊緣檢測(cè)的方法。該方法是利用文字區(qū)域存在較多邊緣的特點(diǎn),先檢測(cè)待檢測(cè)圖像的邊緣,然后利用形態(tài)學(xué)等方法定位待檢測(cè)圖像中的文字區(qū)域。雖然基于邊緣檢測(cè)的方法可以快速檢測(cè)待檢測(cè)圖像中的文字區(qū)域,但由于文字經(jīng)常直接疊加在復(fù)雜的背景中,文字區(qū)域周圍的背景的邊緣經(jīng)常會(huì)與文字的邊緣粘連在一起,從而影響待檢測(cè)圖像中的文字區(qū)域定位的準(zhǔn)確性。
[0004]第二、基于區(qū)域分析的方法。該方法是利用顏色信息從待檢測(cè)圖像中提取連通域,再根據(jù)區(qū)域幾何約束使用閾值規(guī)則從連通域中定位文字區(qū)域。但該方法的缺陷在于:在待檢測(cè)圖像背景復(fù)雜時(shí)很難準(zhǔn)確地提取連通域,并且在該方法中使用的幾何規(guī)則和閾值更缺乏魯棒性,很難推廣。
[0005]第三、基于機(jī)器學(xué)習(xí)的方法。該方法事先通過選取樣本來對(duì)分類器進(jìn)行訓(xùn)練,使之能在不斷變化的因素中定位待檢測(cè)圖像的文字區(qū)域和背景區(qū)域兩種模式。但該方法的難點(diǎn)和關(guān)鍵在于訓(xùn)練特征提取,即如何快速有效地從預(yù)處理階段輸出的信息中,提取出能代表待檢測(cè)圖像的文字區(qū)域的特征的有效信息,因此,訓(xùn)練樣本的選擇對(duì)于檢測(cè)效果有較大影響,并且該方法處理速度慢。

【發(fā)明內(nèi)容】

[0006]為了快速且準(zhǔn)確地檢測(cè)圖像中文字區(qū)域,本申請(qǐng)?zhí)峁┝艘环N訓(xùn)練分類器的方法及系統(tǒng)、圖像中文字區(qū)域檢測(cè)的方法及系統(tǒng)。
[0007]本申請(qǐng)的一個(gè)方案提供了一種訓(xùn)練用于圖像中文字區(qū)域檢測(cè)的分類器的方法,包括:
[0008]獲取圖像樣本,所述樣本大小為η列*m行像素,n, m為正整數(shù);
[0009]對(duì)所述樣本進(jìn)行灰度處理,得到經(jīng)灰度處理的樣本;
[0010]從所述經(jīng)灰度處理的樣本提取圖像特征,所述圖像特征包括梯度信息、顏色信息和連通域信息;[0011]利用提取的圖像特征訓(xùn)練用于圖像中文字區(qū)域檢測(cè)的分類器。
[0012]本申請(qǐng)的另一個(gè)方案提供了一種圖像中文字區(qū)域檢測(cè)的方法,包括:
[0013]獲取經(jīng)灰度處理的待檢測(cè)圖像;
[0014]獲取與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的黑白二值圖;
[0015]根據(jù)所述黑白二值圖確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選檢測(cè)區(qū)域;
[0016]根據(jù)從所述候選檢測(cè)區(qū)域提取的圖像特征和用于圖像中文字區(qū)域檢測(cè)的分類器確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選文字區(qū)域,所述圖像特征包括梯度信息、顏色信息和連通域信息;
[0017]根據(jù)所述候選文字區(qū)域獲取圖像中的文字區(qū)域。
[0018]本申請(qǐng)的再一個(gè)方案提供了一種訓(xùn)練用于圖像中文字區(qū)域檢測(cè)的分類器的系統(tǒng),包括:
[0019]樣本獲取模塊,用于獲取圖像樣本,所述樣本大小為η列*m行像素,n, m為正整數(shù);
[0020]灰度處理模塊,用于對(duì)所述樣本進(jìn)行灰度處理,得到經(jīng)灰度處理的樣本;
[0021]圖像特征提取模塊,用于從所述經(jīng)灰度處理的樣本提取圖像特征,所述圖像特征包括梯度信息、顏色信息和連通域信息;
[0022]分類器訓(xùn)練模塊,用于利用提取的圖像特征訓(xùn)練用于圖像中文字區(qū)域檢測(cè)的分類器。
[0023]本申請(qǐng)的再一個(gè)方案提供了一種圖像中文字區(qū)域的檢測(cè)系統(tǒng),包括:
[0024]待檢測(cè)圖像獲取模塊,用于獲取經(jīng)灰度處理的待檢測(cè)圖像;
[0025]黑白二值圖獲取模塊,用于獲取與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的黑白二值圖;
[0026]候選檢測(cè)區(qū)域確定模塊,用于根據(jù)所述黑白二值圖確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選檢測(cè)區(qū)域;
[0027]候選文字區(qū)域確定模塊,用于根據(jù)利用從所述候選檢測(cè)區(qū)域提取的圖像特征和用于圖像中文字區(qū)域檢測(cè)的分類器確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選文字區(qū)域,所述圖像特征包括梯度信息、顏色信息和連通域信息;
[0028]文字區(qū)域獲取模塊,用于根據(jù)所述候選文字區(qū)域獲取圖像中的文字區(qū)域。
[0029]根據(jù)本申請(qǐng)的一個(gè)優(yōu)選方案,該系統(tǒng)還包括:多尺度變換模塊,用于對(duì)所述經(jīng)灰度處理的待檢測(cè)圖像和所述黑白二值圖進(jìn)行多尺度變換,得到多幅不同尺度的所述經(jīng)灰度處理的待檢測(cè)圖像和所述黑白二值圖。
[0030]本申請(qǐng)通過獲取對(duì)應(yīng)于經(jīng)灰度處理的待檢測(cè)圖像的黑白二值圖,并在檢測(cè)文字區(qū)域過程中,根據(jù)黑白二值圖來確定經(jīng)灰度處理的待檢測(cè)圖像中候選檢測(cè)區(qū)域,從候選檢測(cè)區(qū)域提取圖像特征,然后利用用于圖像中文字區(qū)域檢測(cè)的分類器來確定檢測(cè)圖像中的文字區(qū)域,可以大幅度地減少圖像中文字區(qū)域檢測(cè)的計(jì)算量,提高了圖像中文字區(qū)域檢測(cè)的效率。此外,通過對(duì)經(jīng)灰度處理的待檢測(cè)圖像和黑白二值圖進(jìn)行多尺度變換,進(jìn)而,利用多幅不同尺度的經(jīng)灰度處理的待檢測(cè)圖像和黑白二值圖來確定待檢測(cè)圖像中的文字區(qū)域,可以大幅度地降低圖像中文字區(qū)域檢測(cè)的誤檢率,提高了圖像中文字區(qū)域的檢測(cè)準(zhǔn)確度。
[0031]通過以下參照附圖對(duì)本申請(qǐng)實(shí)施例的說明,本申請(qǐng)的上述以及其它目的、特征和優(yōu)點(diǎn)將更加明顯。
【專利附圖】

【附圖說明】
[0032]下面將參照所附附圖來描述本申請(qǐng)的實(shí)施例,其中:
[0033]圖1所示為實(shí)施例一提供的訓(xùn)練分類器的方法的流程圖;
[0034]圖2所示為實(shí)施例二提供的圖像中文字區(qū)域檢測(cè)的方法的流程圖;
[0035]圖3所示為實(shí)施例三提供的訓(xùn)練分類器的系統(tǒng)的方塊圖;
[0036]圖4所示為實(shí)施例四提供的圖像中文字區(qū)域檢測(cè)的系統(tǒng)的方塊圖。
【具體實(shí)施方式】
[0037]下面結(jié)合附圖詳細(xì)描述本申請(qǐng)的具體實(shí)施例。應(yīng)當(dāng)注意,這里描述的實(shí)施例只用于舉例說明,并不用于限制本申請(qǐng)。
[0038]實(shí)施例一
[0039]在進(jìn)行圖像中文字區(qū)域檢測(cè)前,需要先訓(xùn)練用于圖像中文字區(qū)域檢測(cè)的分類器。在本申請(qǐng)中,分類器可以是支持向量機(jī)(Support Vector Machine, SVM)分類器、Adaboost分類器等,但本申請(qǐng)的保護(hù)范圍并不限于此。為了描述簡(jiǎn)便,以下以SVM分類器為例來說明訓(xùn)練分類器的過程,具體如圖1所示,
[0040]S100,獲取圖像的樣本,樣本的大小為η (列)*m (行)像素,其中,n, m為正整數(shù)。需要說明的是,樣本的大小會(huì)影響以后的運(yùn)算速度,通常η和m的取值以大于10且不超過50為宜。
[0041]其中,樣本的數(shù)量可以根據(jù)實(shí)際需要進(jìn)行調(diào)整,本申請(qǐng)實(shí)施例中樣本的數(shù)量為5000。本申請(qǐng)為了描述簡(jiǎn)便,以樣本的大小均為36 (列)*12 (行)像素為例,但本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際需要進(jìn)行調(diào)整。需要說明的是,樣本的大小并不一定要相同,但通過適當(dāng)?shù)某叨茸儞Q可以將不同大小的樣本統(tǒng)一成相同尺寸的樣本。以下以一個(gè)樣本為例,對(duì)于其他樣本,處理原理相同,不再贅述。
[0042]SI 10,對(duì)樣本進(jìn)行灰度處理,得到經(jīng)灰度處理的樣本。
[0043]S120,從經(jīng)灰度處理的樣本提取圖像特征,該圖像特征包括:梯度信息、顏色信息和連通域信息。
[0044]其中,圖像特征提取的具體過程描述如下:
[0045](I)梯度信息的提取。
[0046]首先,對(duì)每一經(jīng)灰度處理的樣本進(jìn)行j個(gè)方向的梯度信息計(jì)算。其中,j的取值范圍為大于或等于3的整數(shù),優(yōu)選地,j取值為大于或等于4且小于或等于8的偶數(shù)。為了描述方便,在本申請(qǐng)實(shí)施例中,j取值為4,分別為(0°、45°、90°、135° )。在一個(gè)方向上計(jì)算一行像素中的每一像素的梯度,然后對(duì)計(jì)算的梯度進(jìn)行求和,得到該行所有像素的梯度的和值。由于在本實(shí)施例中j取值為4,因此,針對(duì)每一行像素,對(duì)應(yīng)于4個(gè)方向,可以得到4個(gè)梯度和值,然后取4個(gè)梯度和值的平均值作為該行像素的梯度和值。由于本實(shí)施例中經(jīng)灰度處理的樣本有12行像素,這樣,分別對(duì)應(yīng)于12行的像素可以計(jì)算出12個(gè)梯度和值。
[0047]然后,將最大和值對(duì)應(yīng)的行的行號(hào)標(biāo)記為LM,其中,M取值為O至12的整數(shù)。用Lm計(jì)算出2個(gè)邊界值Lm/2和(Lm+12) /2,利用該2個(gè)邊界值將經(jīng)灰度處理的樣本劃分為3個(gè)子區(qū)域出1=(0,1^/2)、82=(1^/2,(Lm+12)/2)和 B3= ((Lm+12)/2,12)。例如,最大和值對(duì)應(yīng)的行的行號(hào)為6,即Lm=6,M=6。然后利用L6計(jì)算兩個(gè)邊界值,分別為3和9。然后利用這兩個(gè)邊界值將經(jīng)灰度處理的樣本劃分3個(gè)子區(qū)域:B1=(0,3)、B2=(3,9)和B3=(9,12)。需要指出的是,在本申請(qǐng)實(shí)施例中是用最大的和值對(duì)應(yīng)的行的行號(hào)的標(biāo)記Lm將經(jīng)灰度處理的樣本劃分為3個(gè)子區(qū)域,但本領(lǐng)域技術(shù)人員可以理解的是,也可以用最小的和值(或中間值,或其他數(shù)值)對(duì)應(yīng)的行的行號(hào)將經(jīng)灰度處理的樣本劃分為3個(gè)子區(qū)域,本申請(qǐng)的保護(hù)范圍并不限于上述數(shù)值。當(dāng)然也可以將經(jīng)灰度處理的樣本隨機(jī)劃分3個(gè)子區(qū)域。此外,劃分的子區(qū)域的數(shù)量也并不限于3個(gè)子區(qū)域,也可以是4個(gè)子區(qū)域、6個(gè)子區(qū)域等,本領(lǐng)域技術(shù)人員可以理解的是,可以將經(jīng)灰度處理的樣本劃分為k個(gè)子區(qū)域,k的取值范圍為大于或等于3的整數(shù)。
[0048]然后,分別計(jì)算每一子區(qū)域內(nèi)的所有像素的梯度的均值和方差,這樣在每一子區(qū)域得到2維特征,從而在每個(gè)方向上可以得到(2*k)維特征。這樣,在j個(gè)方向上總共可以得到(2*k*j)維特征。此外,將行號(hào)標(biāo)記Lm作為另一維特征,從而總共可以得到(2*k*j+l)維特征。在本申請(qǐng)中,由于j取值為4,k取值為3,因此,總共可以得到25維特征。
[0049]( 2 )顏色信息的提取。
[0050]具體地,對(duì)經(jīng)灰度處理的樣本的像素進(jìn)行統(tǒng)計(jì)以得到顏色分布的直方圖,即將O到255的灰度空間分為L (L為大于I的正整數(shù))個(gè)組(bin,計(jì)算顏色直方圖需要將顏色空間劃分成若干個(gè)小的顏色區(qū)間,每個(gè)小區(qū)間稱為直方圖的一個(gè)bin)。在本申請(qǐng)實(shí)施例中,將該灰度空間均分(也可以是不均分,而是隨機(jī)劃分)為32 (也可以是其他數(shù)值,例如16、24、64等數(shù)值)個(gè)bin,每個(gè)bin的高度為出現(xiàn)在該bin內(nèi)的像素個(gè)數(shù),進(jìn)而計(jì)算得到顏色分布的直方圖,然后計(jì)算直方圖的方差和信息熵,作為經(jīng)灰度處理的樣本的2維特征。其中,直
方圖的方差為
【權(quán)利要求】
1.一種訓(xùn)練用于圖像中文字區(qū)域檢測(cè)的分類器的方法,其特征在于,包括: 獲取圖像樣本,所述樣本大小為η列*m行像素,n,m為正整數(shù); 對(duì)所述樣本進(jìn)行灰度處理,得到經(jīng)灰度處理的樣本; 從所述經(jīng)灰度處理的樣本提取圖像特征,所述圖像特征包括梯度信息、顏色信息和連通域信息; 利用提取的圖像特征訓(xùn)練用于圖像中文字區(qū)域檢測(cè)的分類器。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,從所述經(jīng)灰度處理的樣本提取梯度信息的步驟包括: 對(duì)所述經(jīng)灰度處理的樣本進(jìn)行j個(gè)方向的梯度信息計(jì)算,得到所述經(jīng)灰度處理的樣本中每行中所有像素的梯度的和值,從而得到m個(gè)和值,其中,j為大于或等于3的正整數(shù);利用m個(gè)和值中的一和值對(duì)應(yīng)的行的行號(hào)將所述經(jīng)灰度處理的樣本劃分為k個(gè)子區(qū)域,k為大于或等于3的正整數(shù); 將m個(gè)和值中的該和值對(duì)應(yīng)的行的標(biāo)記作為I維特征; 分別從每一方向計(jì)算每一子區(qū)域的所有像素的梯度的均值和方差,得到2*j*k維特征。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,從所述經(jīng)灰度處理的樣本提取顏色信息的步驟包括: 將所述經(jīng)灰度處理的樣本的灰度空間劃分為L個(gè)bin,每個(gè)bin的高度為落入該bin的像素個(gè)數(shù),從而得到所述經(jīng)灰度處理的樣本的顏色分布的直方圖; 計(jì)算所述直方圖的方差和信息熵,作為所述經(jīng)灰度處理的樣本的2維特征; 其中,所述直方圖的方差為
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,從所述經(jīng)灰度處理的樣本提取連通域信息的步驟包括: 采用聚類算法對(duì)所述經(jīng)灰度處理的樣本進(jìn)行聚類運(yùn)算,將經(jīng)灰度處理的樣本中的像素聚為兩類,將同一類像素設(shè)為白色或黑色; 統(tǒng)計(jì)所述經(jīng)灰度處理的樣本的4個(gè)邊沿部分的所有像素的灰度,如果4個(gè)邊沿部分中超過預(yù)設(shè)數(shù)量的像素的灰度為白色,則對(duì)所述經(jīng)灰度處理的樣本進(jìn)行反色處理,從而得到文字為白色、背景為黑色的黑白二值圖; 從所述黑白二值圖中提取白色連通域,計(jì)算所述白色連通域中心的X坐標(biāo)和Y坐標(biāo)的均值,得到2維特征,將所述白色連通域的大小的標(biāo)準(zhǔn)差作為另一維特征。
5.一種圖像中文字區(qū)域檢測(cè)的方法,其特征在于,包括: 獲取經(jīng)灰度處理的待檢測(cè)圖像; 獲取與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的黑白二值圖; 根據(jù)所述黑白二值圖確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選檢測(cè)區(qū)域; 根據(jù)從所述候選檢測(cè)區(qū)域提取的圖像特征和用于圖像中文字區(qū)域檢測(cè)的分類器確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選文字區(qū)域,所述圖像特征包括梯度信息、顏色信息和連通域信息; 根據(jù)所述候選文字區(qū)域獲取圖像中的文字區(qū)域。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,在獲取與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的黑白二值圖的步驟之后,根據(jù)所述黑白二值圖確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選檢測(cè)區(qū)域的步驟之前,還包括: 對(duì)所述經(jīng)灰度處理的待檢測(cè)圖像和所述黑白二值圖進(jìn)行多尺度變換,得到多幅不同尺度的經(jīng)灰度處理的待檢測(cè)圖像和所述黑白二值圖。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述黑白二值圖確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選檢測(cè)區(qū)域的步驟包括: 利用預(yù)設(shè)大小的滑動(dòng)框遍歷所述經(jīng)灰度處理的待檢測(cè)圖像,判斷與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的所述黑白二值圖中對(duì)應(yīng)該滑動(dòng)框的區(qū)域中的預(yù)設(shè)位置的像素是否為白色,如果是,則確定所述經(jīng)灰度處理的待檢測(cè)圖像中對(duì)應(yīng)該滑動(dòng)框的區(qū)域?yàn)楹蜻x檢測(cè)區(qū)域。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,還包括:如果判斷與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的所述黑白二值圖中對(duì)應(yīng)該滑動(dòng)框的區(qū)域中的預(yù)設(shè)位置的像素為黑色,則以預(yù)設(shè)的步長在所述經(jīng)灰度處理的待檢測(cè)圖像上繼續(xù)滑動(dòng)該滑動(dòng)框。
9.根據(jù)權(quán)利要求7或8所述的方法,其特征在于,所述預(yù)設(shè)位置為所述黑白二值圖中對(duì)應(yīng)該滑動(dòng)框的區(qū)域中的左上角、左下角、右上角、右下角或中心位置。
10.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述候選文字區(qū)域獲取圖像中的文字區(qū)域的步驟包括: 針對(duì)所述經(jīng)灰度處理的待檢測(cè)圖像,判斷不同的候選文字區(qū)域間的相交面積與該滑動(dòng)框的面積的比值是否大于第一預(yù)設(shè)值; 如果是,則將所述不同的候選文字區(qū)域歸為一類; 判斷歸為該類的候選文字區(qū)域的數(shù)量是否小于第二預(yù)設(shè)值,如果是,則淘汰所述歸為該類的候選文字區(qū)域;如果否,則保留所述歸為該類的候選文字區(qū)域,所述歸為該類的候選文字區(qū)域即為所述圖像中的文字區(qū)域。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,當(dāng)對(duì)所述經(jīng)灰度處理的待檢測(cè)圖像和所述黑白二值圖進(jìn)行多尺度變換時(shí),根據(jù)所述候選文字區(qū)域獲取圖像中的文字區(qū)域的步驟還包括: 將經(jīng)歸類處理的待檢測(cè)圖像進(jìn)行尺度還原處理; 判斷尺度還原處理后的待檢測(cè)圖像中的小的候選文字區(qū)域與大的候選文字區(qū)域的比值是否大于第三預(yù)設(shè)值; 如果是,則將小的候選文字區(qū)域和大的候選文字區(qū)域合并到第三候選文字區(qū)域,所述第三候選文字區(qū)域?yàn)榘ㄐ〉暮蜻x文字區(qū)域和大的候選文字區(qū)域的最小矩形區(qū)域,所述第三候選文字區(qū)域即為所述圖像中的文字區(qū)域。
12.—種訓(xùn)練用于圖像中文字區(qū)域檢測(cè)的分類器的系統(tǒng),其特征在于,包括: 樣本獲取模塊,用于獲取圖像樣本,所述樣本大小為η列*m行像素,n, m為正整數(shù); 灰度處理模塊,用于對(duì)所述樣本進(jìn)行灰度處理,得到經(jīng)灰度處理的樣本; 圖像特征提取模塊,用于從所述經(jīng)灰度處理的樣本提取圖像特征,所述圖像特征包括梯度信息、顏色信息和連通域信息; 分類器訓(xùn)練模塊,用于利用提取的圖像特征訓(xùn)練用于圖像中文字區(qū)域檢測(cè)的分類器。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述圖像特征提取模塊用于: 對(duì)所述經(jīng)灰度處理的樣本進(jìn)行j個(gè)方向的梯度信息計(jì)算,得到所述經(jīng)灰度處理的樣本中每行中所有像素的梯度的和值,從而得到m個(gè)和值,其中,j為大于或等于3的正整數(shù);利用m個(gè)和值中的一和值對(duì)應(yīng)的行將所述經(jīng)灰度處理的樣本劃分為k個(gè)子區(qū)域,k為大于或等于3的正整數(shù); 將m個(gè)和值中的該和值對(duì)應(yīng)的行的標(biāo)記作為I維特征; 分別從每一方向計(jì)算每一子區(qū)域的所有像素的梯度的均值和方差,得到2*j*k維特征。
14.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述圖像特征提取模塊用于: 將所述經(jīng)灰度處理的樣本的灰度空間劃分為L個(gè)bin,每個(gè)bin的高度為落入該bin的像素個(gè)數(shù),從而得到所述經(jīng)灰度處理的樣本的顏色分布的直方圖; 計(jì)算所述直方圖的方差和信息熵,作為所述經(jīng)灰度處理的樣本的2維特征;
其中,所述直方圖的方差為
15.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述圖像特征提取模塊用于: 采用聚類算法對(duì)所述經(jīng)灰度處理的樣本進(jìn)行聚類運(yùn)算,將經(jīng)灰度處理的樣本中的像素聚為兩類,將同一類像素設(shè)為白色或黑色; 統(tǒng)計(jì)所述經(jīng)灰度處理的樣本的4個(gè)邊沿部分的所有像素的灰度,如果4個(gè)邊沿部分中超過預(yù)設(shè)數(shù)量的像素的灰度為白色,則對(duì)所述經(jīng)灰度處理的樣本進(jìn)行反色處理,從而得到文字為白色、背景為黑色的黑白二值圖; 從所述黑白二值圖中提取白色連通域,計(jì)算所述白色連通域中心的X坐標(biāo)和Y坐標(biāo)的均值,得到2維特征,將所述白色連通域的大小的標(biāo)準(zhǔn)差作為另一維特征。
16.一種圖像中文字區(qū)域檢測(cè)的系統(tǒng),其特征在于,包括: 待檢測(cè)圖像獲取模塊,用于獲取經(jīng)灰度處理的待檢測(cè)圖像; 黑白二值圖獲取模塊,用于獲取與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的黑白二值圖;候選檢測(cè)區(qū)域確定模塊,用于根據(jù)所述黑白二值圖確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選檢測(cè)區(qū)域; 候選文字區(qū)域確定模塊,用于根據(jù)從所述候選檢測(cè)區(qū)域提取的圖像特征和用于圖像中文字區(qū)域檢測(cè)的分類器確定所述經(jīng)灰度處理的待檢測(cè)圖像中的候選文字區(qū)域,所述圖像特征包括梯度信息、顏色信息和連通域信息; 文字區(qū)域獲取模塊,用于根據(jù)所述候選文字區(qū)域獲取圖像中的文字區(qū)域。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,還包括:多尺度變換模塊,用于對(duì)所述經(jīng)灰度處理的待檢測(cè)圖像和所述黑白二值圖進(jìn)行多尺度變換,得到多幅不同尺度的經(jīng)灰度處理的待檢測(cè)圖像和所述黑白二值圖;
18.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述候選檢測(cè)區(qū)域確定模塊用于: 利用預(yù)設(shè)大小的滑動(dòng)框遍歷所述經(jīng)灰度處理的待檢測(cè)圖像,判斷與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的所述黑白二值圖中對(duì)應(yīng)該滑動(dòng)框的區(qū)域中的預(yù)設(shè)位置的像素是否為白色,如果是,則確定所述經(jīng)灰度處理的待檢測(cè)圖像中對(duì)應(yīng)該滑動(dòng)框的區(qū)域?yàn)楹蜻x檢測(cè)區(qū)域。
19.根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于,還包括:繼續(xù)滑動(dòng)模塊,用于在判斷與所述經(jīng)灰度處理的待檢測(cè)圖像對(duì)應(yīng)的所述黑白二值圖中對(duì)應(yīng)該滑動(dòng)框的區(qū)域中的預(yù)設(shè)位置的像素為黑色時(shí),則以預(yù)設(shè)的步長在所述經(jīng)灰度處理的待檢測(cè)圖像上繼續(xù)滑動(dòng)該滑動(dòng)框。
20.根據(jù)權(quán)利要求18或19所述的系統(tǒng),其特征在于,所述預(yù)設(shè)位置為所述黑白二值圖中對(duì)應(yīng)該滑動(dòng)框的區(qū)域中的左上角、左下角、右上角、右下角或中心位置。
21.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述文字區(qū)域獲取模塊用于: 針對(duì)所述經(jīng)灰度處理的待檢測(cè)圖像,判斷不同的候選文字區(qū)域間的相交面積與該滑動(dòng)框的面積的比值是否大于第一預(yù)設(shè)值; 如果是,則將所述不同的候選文字區(qū)域歸為一類; 判斷歸為該類的候選文字區(qū)域的數(shù)量是否小于第二預(yù)設(shè)值,如果是,則淘汰所述歸為該類的候選文字區(qū)域;如果否,則保留所述歸為該類的候選文字區(qū)域,所述歸為該類的候選文字區(qū)域即為圖像中的 文字區(qū)域。
22.根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,當(dāng)對(duì)所述經(jīng)灰度處理的待檢測(cè)圖像和所述黑白二值圖進(jìn)行多尺度變換時(shí),所述文字區(qū)域獲取模塊還用于: 將經(jīng)歸類處理的待檢測(cè)圖像進(jìn)行尺度還原處理; 判斷還原處理的待檢測(cè)圖像中的小的候選文字區(qū)域與大的候選文字區(qū)域的比值是否大于第三預(yù)設(shè)值; 如果是,則將小的候選文字區(qū)域和大的候選文字區(qū)域合并到第三候選文字區(qū)域,所述第三候選文字區(qū)域?yàn)榘ㄐ〉暮蜻x文字區(qū)域和大的候選文字區(qū)域的最小矩形區(qū)域,所述第三候選文字區(qū)域即為所述圖像中的文字區(qū)域。
【文檔編號(hào)】G06K9/62GK103632159SQ201210303844
【公開日】2014年3月12日 申請(qǐng)日期:2012年8月23日 優(yōu)先權(quán)日:2012年8月23日
【發(fā)明者】鄧宇, 陳艷琴 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1