專利名稱:一種基于外包絡(luò)生長的圖標檢測方法及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像檢測技術(shù),特別涉及一種基于外包絡(luò)生長的圖標檢測 方法及其應(yīng)用。
背景技術(shù):
在文本圖像、網(wǎng)頁圖像的處理中,圖標的檢測是一種重要的輔助 手段。通過檢測并識別在文本中出現(xiàn)的圖標,可以迅速確定文本的發(fā) 行機構(gòu)或網(wǎng)頁的所屬者,為對文本或網(wǎng)頁內(nèi)容的進一步分析提供重要 的依據(jù),從而極大地提高文本或網(wǎng)頁的處理效率。
現(xiàn)有的圖標檢領(lǐng)!J處理技術(shù)有Automatic Document Logo Detection (文本圖*示的自動檢測),來源Proceedings of the Ninth International Conference on Document Analysis and Recognition (ICDAR 2007),這禾中
方法的主要原理是(1)如圖1所示,將圖像模糊化(即降低圖像 分辨率),這樣由于在圖標內(nèi)部各部分距離相對較近,會粘連成一個 整體。(2)對模糊圖像,采取連通域方法對每一個粘連起來的整體進 行提取,提取出來的每一個整體認為有可能是圖標,送數(shù)據(jù)庫鑒別。 這種方法的主要缺點是(1)圖像模糊化后文本圖像中的圖標容易與 文本圖像中的其他成分相連,如圖2、圖3所示,在空間比較擁擠時, 模糊化的結(jié)果不僅圖標內(nèi)部會粘連起來,圖標與圖標外部也會粘連起 來。(2)連通域算法速度較慢。另一份文獻Logo detection in document images(文本圖像的圖標檢測),來源Proc. Infl Conf. Imaging Science, Sys., and Tech., pages 446-449, 1997;這種方法的主要原理是(1)使 用文本分析的X-Y樹方法將整幅文本圖形進行分割。X-Y方法的過 程是將整幅圖像在橫軸或者縱軸上做投影,以判斷是否可以在橫軸或 縱軸上分割成兩部分,如果可以,再將分割所得兩部分各自重復該過 程。(2)將X-Y方法所分割成的每一最小部分送數(shù)據(jù)庫鑒別。這種 方法存在的不足是并非所有文本中的Logo都可以與其他成分X-Y可分,如圖4所示,這張支票的手寫字符與印刷體字符存在粘連,造 成無法從橫軸和縱軸的任一方向?qū)⒅眱?nèi)容分割。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺點與不足,提供一種運算速度 快,檢測精確度高,適用性良好的基于外包絡(luò)生長的圖標檢測方法。
本發(fā)明的另一目的在于提供上述基于外包絡(luò)生長的圖標檢測方法的 應(yīng)用。
本發(fā)明的目的通過下述技術(shù)方案實現(xiàn) 一種基于外包絡(luò)生長的圖標檢 測方法,包括下述步驟
(1) 在整幅由像素組成圖像中,將某些人為選定的可能屬于一個圖 標的像素(例如,如果一幅圖像是二值圖像,則認為該二值圖像的前景像 素可能屬于一個圖標;如果一幅圖像是彩色圖像,則可認為某種顏色的像 素可能屬于一個圖標;如果己知一幅文本圖像的用途,則可預(yù)先確定圖標
可能的位置,這樣只有在這些特定位置的像素才有可能屬于一個圖標)設(shè)
為種子點,搜索圖像中的像素,搜索到N (N^l)個種子點后,在N個種 子點的外側(cè)設(shè)置特定形狀的初始外包絡(luò);所述初始外包絡(luò)包含該N個種子 點在內(nèi),準備進行生長;
(2) 對外包絡(luò)的生長,設(shè)定基本終止條件某一空間區(qū)域范圍內(nèi)覆 蓋的不同種類的像素(例如,在二值圖像中的前景和背景像素、灰度圖像 中的不同灰度值的像素,彩色圖像中不同顏色的像素等)分布情況滿足預(yù) 定要求;(3)從初始外包絡(luò)出發(fā),將初始外包絡(luò)逐次生長為符合步驟(2) 中終止條件的外包絡(luò);具體為外包絡(luò)的每次生長,先對外包絡(luò)用步驟(2) 的終止條件進行判斷,如果還需要繼續(xù)生長,則將外包絡(luò)在特定方向上進 行延伸,直至滿足步驟(2)中的終止條件?!?br>
步驟(1)中,所述初始外包絡(luò)的特定形狀可為規(guī)則或不規(guī)則的幾何 形狀,優(yōu)選矩形、圓形。
步驟(1)中,搜索圖像中的像素具體可為對所有像素進行逐行逐 列搜索,對于圖標局限在特定空間區(qū)域內(nèi)的圖像,在一定范圍內(nèi)進行逐行 逐列搜索。
步驟(2)中,所述預(yù)定要求可為(2-1)在二值圖像中,矩形外包 絡(luò)的邊緣上不能存在前景像素;(2-2)圓形外包絡(luò)離邊緣距離一定范圍內(nèi)
5的前景像素和背景像素個數(shù)的比例在某閾值Nmax以下;(2-3)在灰度圖
像中,矩形(圓形、或其他形狀)外包絡(luò)邊緣附近一定范圍內(nèi)的像素灰度 值大于某值Gmax的像素個數(shù)在某閾值Nmax以下;(2-4)在彩色圖像中,
外包絡(luò)邊緣上不能存在某種顏色的像素等。
歩驟(2)中,在滿足該基本終止條件的基礎(chǔ)上,也可以根據(jù)實際需 要附加其他的特定條件,例如一定大小的外包絡(luò)、不包含某像素的外包絡(luò)、 特定位置的外包絡(luò)等。
歩驟(3)中,所述將外包絡(luò)在特定方向上進行延伸具體可為對于 二值圖像的矩形外包絡(luò)情況,預(yù)設(shè)循環(huán)的終止條件是四條邊界均只有背景 像素,特定方向?qū)?yīng)的是存在前景像素的邊緣(如果矩形上邊緣存在前景 像素,則上邊緣上移1個單位,矩形左邊緣存在前景像素,則左邊緣左移 l個單位);對于彩色圖像的圓形外包絡(luò)情況,設(shè)定的循環(huán)終止條件是距離 圓形邊緣n (n)l)個像素范圍內(nèi)的部分不能包含紅色的像素超過10%, 那么可設(shè)定特定方向是圓形外包絡(luò)的圓心不變,而半徑延伸l個像素等。
上述基于外包絡(luò)生長的圖標檢測方法可應(yīng)用于對文本圖像、網(wǎng)頁圖 像的處理過程。
本發(fā)明的作用原理是:基于小范圍內(nèi)的像素成分的分析進行的形狀 快速刷新,利用特定類型圖像排版布局的規(guī)則,確定意義單位(所述 意義單位是指在圖像中空間位置集中的某些點的集合,這些點合在一 起組成的圖案傳遞一條完整的信息,例如一個圖標, 一個文本塊、一 個表格等)所占據(jù)的特定形狀,從而實現(xiàn)文本圖像圖標的檢測識別。
本發(fā)明相對于現(xiàn)有技術(shù)具有如下的優(yōu)點及效果
(1) 本發(fā)明方法較好地利用了圖像的布局規(guī)則,在定位過程中只需檢 驗一定數(shù)量的像素,速度高于連通域算法50%以上;另外,不需借助任何 模糊或者膨脹運算,進一步提高了運算速度。
(2) 本發(fā)明方法不需借助任何模糊或者膨脹運算,避免了可能出現(xiàn)的 圖標與其他部分粘連的問題,所以檢測精確度高,可用于各種不同情況的 圖像圖標檢測,適用性良好。
(3) 本發(fā)明方法降低了圖標的成功檢測對圖標形狀的依賴。例如圖 13(a)是一個各連通域之間距離較大的圖標,即使做模糊運算也不一定能 夠?qū)⑵涓鞑糠趾喜⒊梢粋€連通域。但本發(fā)明提供的方法,即使以下方的五 角星作為種子點不能將整個圖標提取出來(如圖13(b)所示),以最上方的五角星為種子點仍然可能將整個圖標提取出來(如圖13(c)所示)。
圖1是現(xiàn)有技術(shù)中對圖標進行模糊化處理的過程示意圖;其中由(a) (c)逐漸模糊。
圖2是空間比較擁擠的文本圖像的示例圖;其中框內(nèi)為圖標。 圖3是將圖2模糊化處理后圖標與文字發(fā)生粘連的示意圖。 圖4是一張無法用X-Y方法分析的文本圖像的示例圖。 圖5是運用本發(fā)明方法對圖1 (a)所示的圖fe進行處理,種子點的外 包絡(luò)延伸至包含整個圖標的過程示意圖;其中圖5 (a)與圖1 (a)相同。 圖6是本實施例中二值圖像矩形外包絡(luò)生長的算法流程圖。 圖7本發(fā)明另一實施例的待處理二值文本圖像。 圖8是本實施例中二值圖像圓形外包絡(luò)生長的算法流程圖。 圖9是對圖7所示文本圖像的圖標設(shè)置初始圓形外包絡(luò)的示意圖。 圖10是對圖7所示文本圖像的圖標處理完成的示意圖。 圖11是本發(fā)明又一實施例的待處理文本圖像。 圖12是本實施例中彩色文本圖像矩形外包絡(luò)生長的算法流程圖。 圖13是本發(fā)明效果的示意圖。
具體實施例方式
下面結(jié)合實施例及附圖對本發(fā)明作進一步詳細的描述,但本發(fā)明的實 施方式不限于此。 . 實施例1
本實施例對圖5 (a)所示圖標進行處理,具體包括下述步驟(見圖6):
(1) 將圖5 (a)圖像作為二值圖像處理,認為該二值圖像的前景像 素可能屬于一個圖標,將這些前景像素設(shè)為種子點,搜索圖5 (a)圖像中 的像素,設(shè)搜索方向為左上角到右下角,最初搜索到的l個種子點,記為 A,見圖5 (a)。在A的外側(cè)設(shè)置矩形的初始外包絡(luò),該矩形尺寸為3X3, 長、寬各為3個像素,且以A點為中心,所述初始外包絡(luò)包含A點在內(nèi), 準備進行生長;
(2) 對外包絡(luò)的生長,設(shè)定基本終止條件在本二值圖像中的前景 和背景像素分布情況滿足預(yù)定要求——在二值圖像中,矩形外包絡(luò)的邊緣
7上不能存在前景像素(在本例中用黑像素表示)。
(3)從矩形的初始外包絡(luò)出發(fā),將初始外包絡(luò)逐次生長為符合步驟(2)
中終止條件的外包絡(luò);具體為外包絡(luò)的每次生長,先對外包絡(luò)用步驟(2)
的終止條件進行判斷,如果還需要繼續(xù)生長,則將外包絡(luò)在特定方向上進
行延伸,如圖5(b)、 5(c)所示皆為在生長過程中不滿足終止條件還需要繼 續(xù)生長的矩形形態(tài),直至滿足步驟(2)中的終止條件,其結(jié)果如圖5 (d)所示。
實施例2 —
本實施例對圖7所示的二值文本圖像進行處理,圖中右下角小圖為待
檢測的"中國建設(shè)銀行"圖標。具體包括下述步驟
(1) 在圖7中,設(shè)前景像素具備種子點資格,從左上角開始逐列逐
行搜索圖像中的種子點。由于已知圖標必然位于文本圖像左上角,搜索范
圍限定為文本上方1/4,左方l/3的矩形范圍。由于已知圖標為近似圓形, 設(shè)外包絡(luò)為圓形。搜索到1個前景像素A(見圖7),為球形圖標的左方一 點。即以該前景像素所在連通域的全體N個像素作為種子點,在這N個像 素的外側(cè)設(shè)置初始圓形外包絡(luò),外包絡(luò)要求中心位于這N個像素的質(zhì)量中 心,且A在邊緣上,如圖9所示。
(2) 對外包絡(luò)的生長,設(shè)定基本終止條件圓形包絡(luò)的邊緣不能含 有前景像素。
(3) 從初始外包絡(luò)出發(fā),將初始外包絡(luò)逐次生長為符合步驟(2)中終 止條件的外包絡(luò);具體為外包絡(luò)的每次生長,先對外包絡(luò)用步驟(2)的 終止條件進行判斷,如果還需要繼續(xù)生長,則將圓形的圓心不變,半徑增 加1個像素,直至滿足步驟(2)中的終止條件,如圖9所示。最終所得 的結(jié)果圖IO所示。
實施例3
本實施例對圖11所示的彩色文本圖像進行處理,右下角小圖為在文本 中需要檢測的"Torrey Pines Bank"圖標。具體包括下述步驟(見圖12): (1)在圖11中,設(shè)種子點為圖標中呈現(xiàn)的深綠色像素,規(guī)定種子點 的色彩成分為G〉200、 R<50、 B<50。利用先驗知識,搜索范圍為中部的 橫線和下方橫線之間的范圍,外包絡(luò)為矩形。搜索到1個種子點后,確定初始外包絡(luò)為以該種子點為中心的3 X 3矩形。
(2)對外包絡(luò)生長,設(shè)定基本終止條件矩形任何一條邊顏色組成符
合種子點條件(G〉200、 R<50、 B<50)的像素所占的比例不能大于5。/0。
(3)從初始外包絡(luò)出發(fā),將初始外包絡(luò)生長為符合步驟(2)中終止 條件的外包絡(luò),具體為外包絡(luò)的每次生長,先對外包絡(luò)用歩驟(2)中的 終止條件進行判斷,如果還需要繼續(xù)生長,則將對應(yīng)的邊緣延伸1個像素, 直至滿足步驟(2)中的終止條件。上述實施例為本發(fā)明較佳的實施方式, 但本發(fā)明的實施方式并不受上述實施例的限制,其他的任何未背離本發(fā)明 的精神實質(zhì)與原理下所作的改變、修飾、替代、組合、簡化,均應(yīng)為等效 的置換方式,都包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1、一種基于外包絡(luò)生長的圖標檢測方法,其特征在于包括下述步驟(1)在整幅由像素組成圖像中,將某些人為選定的可能屬于一個圖標的像素設(shè)為種子點,搜索圖像中的像素,搜索到N(N≥1)個種子點后,在N個種子點的外側(cè)設(shè)置特定形狀的初始外包絡(luò);所述初始外包絡(luò)包含該N個種子點在內(nèi),準備進行生長;(2)對外包絡(luò)的生長,設(shè)定基本終止條件某一空間區(qū)域范圍內(nèi)覆蓋的不同種類的像素分布情況滿足預(yù)定要求;(3)從初始外包絡(luò)出發(fā),將初始外包絡(luò)逐次生長為符合步驟(2)中終止條件的外包絡(luò);具體為外包絡(luò)的每次生長,先對外包絡(luò)用步驟(2)的終止條件進行判斷,如果還需要繼續(xù)生長,則將外包絡(luò)在特定方向上進行延伸,直至滿足步驟(2)中的終止條件。
2、 根據(jù)權(quán)利要求1所述的基于外包絡(luò)生長的圖標檢測方法,其特征 在于步驟(1)中,所述初始外包絡(luò)的特定形狀為規(guī)則或不規(guī)則的幾何 形狀。
3、 根據(jù)權(quán)利要求2所述的基于外包絡(luò)生長的圖標檢測方法,其特征 在于所述初始外包絡(luò)的特定形狀為矩形或圓形。
4、 根據(jù)權(quán)利要求1所述的基于外包絡(luò)生長的圖標檢測方法,其特征 在于歩驟(1)中,搜索圖像中的像素具體為對所有像素進行逐行逐 列搜索,對于圖標局限在特定空間區(qū)域內(nèi)的圖像,在一定范圍內(nèi)進行逐行 逐列搜索。
5、 根據(jù)權(quán)利要求1所述的基于外包絡(luò)生長的圖標檢測方法,其特征 在于步驟(2)中,所述預(yù)定要求為(2-1)在二值圖像中,矩形外包 絡(luò)的邊緣上不能存在前景像素;(2-2)圓形外包絡(luò)離邊緣距離一定范圍內(nèi) 的前景像素和背景像素個數(shù)的比例在某閾值Nmax以下;(2-3)在灰度圖 像中,外包絡(luò)邊緣附近一定范圍內(nèi)的像素灰度值大于某值Gmax的像素個 數(shù)在某閾值Nmax以下;(2-4)在彩色圖像中,外包絡(luò)邊緣上不能存在某 種顏色的像素。
6、 根據(jù)權(quán)利要求1所述的基于外包絡(luò)生長的圖標檢測方法,其特征 在于步驟(2)中,在滿足該基本終止條件的基礎(chǔ)上,附加其他的特定 條件,具體為 一定大小的外包絡(luò)、不包含某像素的外包絡(luò)或特定位置的外包絡(luò)。
7、 根據(jù)權(quán)利要求1所述的基于外包絡(luò)生長的圖標檢測方法,其特征 在于步驟(3)中,所述將外包絡(luò)在特定方向上進行延伸具體為對于 二值圖像的矩形外包絡(luò)情況,預(yù)設(shè)循環(huán)的終止條件是四條邊界均只有背景 像素,特定方向?qū)?yīng)的是存在前景像素的邊緣;如果矩形上邊緣存在前景 像素,則上邊緣上移1個單位,矩形左邊緣存在前景像素,則左邊緣左移 1個單位;對于彩色圖像的圓形外包絡(luò)情況,設(shè)定的循環(huán)終止條件是距離 圓形邊緣n (n^1)個像素范圍內(nèi)的部分不能包含紅色的像素超過10%, 那么設(shè)定特定方向是圓形外包絡(luò)的圓心不變,而半徑延伸l個像素。
8、 根據(jù)權(quán)利要求1 7任一項所述的基于外包絡(luò)生長的圖標檢測方法 的應(yīng)用,其特征在于用于對文本圖像、網(wǎng)頁圖像的處理過程。
全文摘要
本發(fā)明提供一種基于外包絡(luò)生長的圖標檢測方法,包括下述步驟(1)在整幅由像素組成圖像中,將某些人為選定的可能屬于一個圖標的像素設(shè)為種子點,搜索圖像中的像素,搜索到N(N≥1)個種子點后,在其外側(cè)設(shè)置初始外包絡(luò);初始外包絡(luò)包含該N個種子點在內(nèi),準備進行生長;(2)對外包絡(luò)的生長,設(shè)定基本終止條件;(3)從初始外包絡(luò)出發(fā),將初始外包絡(luò)逐次生長為符合步驟(2)中終止條件的外包絡(luò)。本方法較好地利用了圖像的布局規(guī)則,在定位過程中只需檢驗一定數(shù)量的像素,遠遠快于連通域算法;另外,不需借助任何模糊或者膨脹運算,進一步提高了運算速度;還可避免出現(xiàn)圖標與其他部分粘連的問題,所以檢測精確度高,適用性良好。
文檔編號G06K9/00GK101488183SQ20081022038
公開日2009年7月22日 申請日期2008年12月25日 優(yōu)先權(quán)日2008年12月25日
發(fā)明者王宏業(yè), 陳友斌 申請人:東莞市微模式軟件有限公司