專利名稱:定位圖像中文字區(qū)域的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理領(lǐng)域,特別是涉及一種定位圖像中文字區(qū)域的方法及裝置。
背景技術(shù):
商務(wù)活動(dòng)中,用戶通常采用名片作為表明身份的工具。但傳統(tǒng)技術(shù)中的紙質(zhì)名片不方便攜帶和保管,用戶通常需要手動(dòng)將紙質(zhì)名片上的信息錄入到智能終端中。為了能夠自動(dòng)識(shí)別紙質(zhì)名片上的信息,現(xiàn)用的名片管理軟件通常需要先定位拍照得到的名片圖像中的文字區(qū)域,然后再通過(guò)OCR (Optical CharacterRecognition,光學(xué)字符識(shí)別)系統(tǒng)將文字區(qū)域轉(zhuǎn)化成文本信息。然而,傳統(tǒng)技術(shù)中,定位圖像中文字區(qū)域的方法不準(zhǔn)確,會(huì)漏掉關(guān)鍵信息,使得定位的準(zhǔn)確度不高。
發(fā)明內(nèi)容
基于此,有必要提供一種能提高準(zhǔn)確度的定位圖像中文字區(qū)域的方法。一種定位圖像中文字區(qū)域的方法,包括獲取原始圖像;通過(guò)Roberts算子對(duì)所述原始圖像進(jìn)行轉(zhuǎn)換生成灰度圖像;將所述灰度圖像二值化得到邊緣圖像;將所述邊緣圖像膨脹,提取所述邊緣圖像的連通域的位置信息。在其中一個(gè)實(shí)施例中,所述通過(guò)Roberts算子將所述原始圖像轉(zhuǎn)換成灰度圖像的步驟為根據(jù)公式
權(quán)利要求
1.一種定位圖像中文字區(qū)域的方法,包括獲取原始圖像;通過(guò)Roberts算子對(duì)所述原始圖像進(jìn)行轉(zhuǎn)換生成灰度圖像;將所述灰度圖像二值化得到邊緣圖像;將所述邊緣圖像膨脹,提取所述邊緣圖像的連通域的位置信息。
2.根據(jù)權(quán)利要求1所述的定位圖像中文字區(qū)域的方法,其特征在于,所述通過(guò)Roberts算子將所述原始圖像轉(zhuǎn)換成灰度圖像的步驟為根據(jù)公式
3.根據(jù)權(quán)利要求1所述的定位圖像中文字區(qū)域的方法,其特征在于,所述將所述灰度圖像二值化得到邊緣圖像的步驟為通過(guò)最大類間方差算法對(duì)所述灰度圖像進(jìn)行二值化得到邊緣圖像。
4.根據(jù)權(quán)利要求1所述的定位圖像中文字區(qū)域的方法,其特征在于,所述提取所述邊緣圖像的連通域的位置信息的步驟為根據(jù)區(qū)域標(biāo)記算法提取所述邊緣圖像的連通域的位置信息。
5.根據(jù)權(quán)利要求1所述的定位圖像中文字區(qū)域的方法,其特征在于,所述提取所述邊緣圖像的連通域的位置信息的步驟之后還包括獲取所述連通域的紋理特征和/或直方圖特征;獲取預(yù)設(shè)的支持向量機(jī)的分類器;利用所述分類器根據(jù)所述紋理特征和/或直方圖特征篩選所述位置信息。
6.一種定位圖像中文字區(qū)域的裝置,其特征在于,包括圖像獲取模塊,用于獲取原始圖像;灰度圖像生成模塊,用于通過(guò)Roberts算子對(duì)所述原始圖像進(jìn)行轉(zhuǎn)換生成灰度圖像;圖像二值化模塊,用于將所述灰度圖像二值化得到邊緣圖像;區(qū)域定位模塊,用于將所述邊緣圖像膨脹,提取所述邊緣圖像的連通域的位置信息。
7.根據(jù)權(quán)利要求6所述的定位圖像中文字區(qū)域的裝置,其特征在于,所述灰度圖像生成模塊還用于根據(jù)公式
8.根據(jù)權(quán)利要求6所述的定位圖像中文字區(qū)域的裝置,其特征在于,所述圖像二值化模塊還用于通過(guò)最大類間方差算法對(duì)所述灰度圖像進(jìn)行二值化得到邊緣圖像。
9.根據(jù)權(quán)利要求6所述的定位圖像中文字區(qū)域的裝置,其特征在于,所述區(qū)域定位模塊還用于根據(jù)區(qū)域標(biāo)記算法提取所述邊緣圖像的連通域的位置信息。
10.根據(jù)權(quán)利要求6所述的定位圖像中文字區(qū)域的裝置,其特征在于,所述裝置還包括區(qū)域篩選模塊,用于獲取所述連通域的紋理特征和/或直方圖特征,獲取預(yù)設(shè)的支持向量機(jī)的分類器,利用所述分類器根據(jù)所述紋理特征和/或直方圖特征篩選所述位置信息。
全文摘要
本發(fā)明涉及一種定位圖像中文字區(qū)域的方法,包括獲取原始圖像;通過(guò)Roberts算子對(duì)所述原始圖像進(jìn)行轉(zhuǎn)換生成灰度圖像;將所述灰度圖像二值化得到邊緣圖像;將所述邊緣圖像膨脹,提取所述邊緣圖像的連通域的位置信息。此外,還包括一種定位圖像中文字區(qū)域的裝置。上述定位圖像中文字區(qū)域的方法及裝置可以提高定位的準(zhǔn)確性。
文檔編號(hào)G06K9/54GK103034856SQ201210552389
公開(kāi)日2013年4月10日 申請(qǐng)日期2012年12月18日 優(yōu)先權(quán)日2012年12月18日
發(fā)明者李冰, 陳小平, 肖方明, 汪利 申請(qǐng)人:深圳深訊和科技有限公司