專利名稱:在圖像中識別字符區(qū)域的方法
技術領域:
本發(fā)明基本上涉及圖像處理領域,更具體地來說,涉及一種在圖像中識別字符區(qū)域的方法。
背景技術:
在如今的計算機應用中,經(jīng)常需要將視頻或者靜態(tài)圖片中的字符信息提取出來,這就在技術實現(xiàn)上提出了更高的要求?,F(xiàn)有技術提供了一種視頻字幕提取的方法,包括以下步驟(I)對視頻字幕區(qū)域進行基于連通區(qū)統(tǒng)計的字幕顏色判斷,確認字幕顏色是深色還是淺色,同時反轉(zhuǎn)淺色字幕的灰度圖片為深色字幕圖片;(2)對步驟(I)獲得的灰度圖片進行基于局部窗口分析的灰度圖片二值化;(3)進行OCR軟件識別,提取字幕文本結(jié)果。上述現(xiàn)有技術使用了字幕文字顏色判斷和局部閾值的方法,能取得較好的二值化效果,然而,該現(xiàn)有技術通過深色和淺色對于字幕區(qū)域進行判斷,準確度不高,無法應對較為復雜的識別需要。
發(fā)明內(nèi)容
針對現(xiàn)有技術準確度不高,無法應對較為復雜的識別需要的缺陷,本發(fā)明提供了一種在圖像中識別字符區(qū)域的方法。通過本發(fā)明所描述的技術方案,解決了如何更精確地在圖像中識別字符區(qū)域的技術問題。本發(fā)明提供了一種在圖像中識別字符區(qū)域的方法,其特征在于,包括步驟S1:建立所述圖像的彩色直方圖;以及步驟S2 :根據(jù)所述彩色直方圖上的像素點密度識別所述圖像上的字符區(qū)域和非字符區(qū)域。優(yōu)選地,所述步驟S2包括步驟S21 :如果所述彩色直方圖上只具有一個像素點聚集區(qū)域,則所述像素點聚集區(qū)域中的直方圖坐標點所表示的顏色是字符顏色;以及步驟S22 :將所述圖像中的所述字符顏色的區(qū)域識別為字符區(qū)域,其他區(qū)域為非字符區(qū)域。優(yōu)選地,所述步驟S2包括步驟S21 :如果所述彩色直方圖上具有兩個像素點聚集區(qū)域,則所述兩個像素點聚集區(qū)域中的第一像素點聚集區(qū)域中的直方圖坐標點所表示的顏色是字符顏色,所述兩個像素點聚集區(qū)域中的第二像素點聚集區(qū)域中的直方圖坐標點所表示的顏色是非字符顏色;以及步驟S22 :將所述圖像中的所述字符顏色的區(qū)域識別為字符區(qū)域,并且將所述圖像中的所述非字符顏色的區(qū)域識別為非字符區(qū)域。優(yōu)選地,所述第一像素點聚集區(qū)域中的像素點多于所述第二像素點聚集區(qū)域中的像素點。優(yōu)選地,所述像素點聚集區(qū)域為像素點密度大于預定密度閾值的區(qū)域。優(yōu)選地,所述像素點聚集區(qū)域為像素點占所述圖像中的所有像素點的比例大于預定比例閾值的區(qū)域。優(yōu)選地,還包括對所述圖像進行二值化處理。
優(yōu)選地,所述預定比例閾值為20 %至30 %。優(yōu)選地,所述彩色直方圖的像素為256*256*256。通過本發(fā)明所提供的在圖像中識別字符區(qū)域的方法,能夠更準確地在圖像中識別字符區(qū)域,從而能夠應對較為復雜的識別需要。
附圖用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中圖1是根據(jù)本發(fā)明的實施例的在圖像中識別字符區(qū)域的方法的總體流程圖;圖2是根據(jù)本發(fā)明的一個具體實施例的在圖像中識別字符區(qū)域的方法的流程圖;圖3是根據(jù)本發(fā)明的另一個具體實施例的在圖像中識別字符區(qū)域的方法的流程圖。
具體實施例方式以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明,應當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。圖1是根據(jù)本發(fā)明的實施例的在圖像中識別字符區(qū)域的方法的總體流程圖。在圖1中步驟SlOO :建立圖像的彩色直方圖。在一個優(yōu)選實施例中,該彩色直方圖的像素為 256*256*256。步驟S102 :根據(jù)彩色直方圖上的像素點密度區(qū)分圖像上的字符區(qū)域和非字符區(qū)域。具體來說,彩色直方圖中的每個直方圖坐標點均代表了一種顏色,而每個直方圖坐標點上均標記有數(shù)字,這個數(shù)字代表了在圖像上有多少個像素點的顏色是這個直方圖坐標點所表示的顏色??梢酝ㄟ^兩種具體方式來實現(xiàn)該步驟,這兩種方式將在以下兩個具體實施例中示出。通過本發(fā)明所描述的在圖像中識別字符區(qū)域的方法,能夠更準確地在圖像中識別字符區(qū)域,從而能夠應對較為復雜的識別需要。圖2是根據(jù)本發(fā)明的一個具體實施例的在圖像中識別字符區(qū)域的方法的流程圖。步驟S200和步驟SlOO相同,在此不再贅述。此外,在圖2中還包括以下步驟步驟S202 :如果彩色直方圖上具有一個像素點聚集區(qū)域,則像素點聚集區(qū)域中的直方圖坐標點所表示的顏色是字符顏色。其中,可以通過兩種方式來判斷一個區(qū)域是否是像素點聚集區(qū)域在第一種方式中,該像素點聚集區(qū)域被限定為像素點密度大于預定密度閾值的區(qū)域,其中,該像素點密度是在彩色直方圖的坐標系中的單位體積中所包含的圖像的像素點的數(shù)量;在第二種方式中,該像素點聚集區(qū)域為像素點占圖像中的所有像素點的比例大于預定比例閾值的區(qū)域,也就是說,在該像素點聚集區(qū)域中,像素點的數(shù)量所占全部像素點的數(shù)量的比例達到了一定程度。優(yōu)選地,該預定比例閾值為20 %至30 %。在本實施例中,由于有且只有一個區(qū)域是像素點聚集區(qū)域,也就是只有該區(qū)域所包含的像素點的數(shù)量達到了一定程度,因此,可以認為該區(qū)域中的顏色是字符顏色,即步驟S204:將圖像中的字符顏色的區(qū)域識別為字符區(qū)域,其他區(qū)域為非字符區(qū)域。通過本實施例所描述的在圖像中識別字符區(qū)域的方法,能夠更準確地在圖像中識別字符區(qū)域,從而能夠應對較為復雜的識別需要。圖3是根據(jù)本發(fā)明的另一個具體實施例的在圖像中識別字符區(qū)域的方法的流程圖。步驟S300和步驟SlOO相同,在此不再贅述。此外,在圖3中還包括以下步驟步驟S302 :如果彩色直方圖上具有兩個像素點聚集區(qū)域,則兩個像素點聚集區(qū)域中的第一像素點聚集區(qū)域中的直方圖坐標點所表示的顏色是字符顏色,兩個像素點聚集區(qū)域中的第二像素點聚集區(qū)域中的直方圖坐標點所表示的顏色是非字符顏色。其中,可以通過兩種方式來判斷一個區(qū)域是否是像素點聚集區(qū)域(包括第一像素點聚集區(qū)域和第二像素點聚集區(qū)域)在第一種方式中,該像素點聚集區(qū)域被限定為像素點密度大于預定密度閾值的區(qū)域,其中,該像素點密度是在彩色直方圖的坐標系中的單位體積中所包含的圖像的像素點的數(shù)量;在第二種方式中,該像素點聚集區(qū)域為像素點占圖像中的所有像素點的比例大于預定比例閾值的區(qū)域,也就是說,在該像素點聚集區(qū)域中,像素點的數(shù)量所占全部像素點的數(shù)量的比例達到了 一定程度。優(yōu)選地,該預定比例閾值為20 %至30 %。在本實施例中,由于有兩個區(qū)域是像素點聚集區(qū)域,也就是說有兩個區(qū)域所包含的像素點的數(shù)量達到了一定程度,因此,可以認為這兩個區(qū)域中的顏色是一種字符顏色,另一種是非字符顏色(即,背景顏色),即步驟S304 :將圖像中的字符顏色的區(qū)域識別為字符區(qū)域,并且將圖像中的非字符顏色的區(qū)域識別為非字符區(qū)域。通過本實施例所描述的在圖像中識別字符區(qū)域的方法,能夠更準確地在圖像中識別字符區(qū)域,從而能夠應對較為復雜的識別需要。以上所描述的內(nèi)容僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領域的技術人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。
權利要求
1.一種在圖像中識別字符區(qū)域的方法,其特征在于,包括 步驟S1:建立所述圖像的彩色直方圖;以及 步驟S2 :根據(jù)所述彩色直方圖上的像素點密度識別所述圖像上的字符區(qū)域和非字符區(qū)域。
2.根據(jù)權利要求1中所述的在圖像中識別字符區(qū)域的方法,其特征在于,所述步驟S2包括 步驟S21 :如果所述彩色直方圖上只具有一個像素點聚集區(qū)域,則所述像素點聚集區(qū)域中的直方圖坐標點所表示的顏色是字符顏色;以及 步驟S22 :將所述圖像中的所述字符顏色的區(qū)域識別為字符區(qū)域。
3.根據(jù)權利要求1中所述的在圖像中識別字符區(qū)域的方法,其特征在于,所述步驟S2包括 步驟S21 :如果所述彩色直方圖上具有兩個像素點聚集區(qū)域,則所述兩個像素點聚集區(qū)域中的第一像素點聚集區(qū)域中的直方圖坐標點所表示的顏色是字符顏色,所述兩個像素點聚集區(qū)域中的第二像素點聚集區(qū)域中的直方圖坐標點所表示的顏色是非字符顏色;以及 步驟S22 :將所述圖像中的所述字符顏色的區(qū)域識別為字符區(qū)域,并且將所述圖像中的所述非字符顏色的區(qū)域識別為非字符區(qū)域。
4.根據(jù)權利要求3中所述的在圖像中識別字符區(qū)域的方法,其特征在于,所述第一像素點聚集區(qū)域中的像素點多于所述第二像素點聚集區(qū)域中的像素點。
5.根據(jù)權利要求2-4中的任一項所述的在圖像中識別字符區(qū)域的方法,其特征在于,所述像素點聚集區(qū)域為像素點密度大于預定密度閾值的區(qū)域。
6.根據(jù)權利要求2-4中的任一項所述的在圖像中識別字符區(qū)域的方法,其特征在于,所述像素點聚集區(qū)域為像素點占所述圖像中的所有像素點的比例大于預定比例閾值的區(qū)域。
7.根據(jù)權利要求1中所述的在圖像中識別字符區(qū)域的方法,其特征在于,還包括對所述圖像進行二值化處理。
8.根據(jù)權利要求6中所述的在圖像中識別字符區(qū)域的方法,其特征在于,所述預定比例閾值為20%至30%。
9.根據(jù)權利要求1中所述的在圖像中識別字符區(qū)域的方法,其特征在于,所述彩色直方圖的像素為256*256*256。
全文摘要
本發(fā)明提供了一種在圖像中識別字符區(qū)域的方法,包括以下步驟步驟S1建立圖像的彩色直方圖;以及步驟S2根據(jù)彩色直方圖上的像素點密度區(qū)分圖像上的字符區(qū)域和非字符區(qū)域。通過本發(fā)明所提供的在圖像中識別字符區(qū)域的方法,能夠更準確地在圖像中識別字符區(qū)域,從而能夠應對較為復雜的識別需要。
文檔編號G06K9/20GK103034855SQ20121051815
公開日2013年4月10日 申請日期2012年12月5日 優(yōu)先權日2012年12月5日
發(fā)明者劉立 申請人:曙光信息產(chǎn)業(yè)(北京)有限公司