技術(shù)總結(jié)
本發(fā)明公開了基于深度學習的自然場景多語言文本檢測方法,包括步驟為:轉(zhuǎn)為灰度圖片,構(gòu)建ER樹,獲取LER,移除其中重復的LER,區(qū)分文字和背景雜質(zhì),種子生長、聚類,用隨機森林進行文本識別。其中,區(qū)分文字和背景雜質(zhì)時,使用了兩階段CNN,其中一階?CNN用于將背景雜質(zhì)與類文字符號Symbol區(qū)分開來;二階CNN用于將類文字符號Symbol細劃分為中文、英文以及標識符Sign,并去除其中的標識符Sign,使含有中文和英文的組件被保留下來。采用上述方法后,能夠檢測自然場景下的多語言文本以及斷裂的文字。另外,與現(xiàn)有技術(shù)相比,本技術(shù)在自然場景下?lián)碛休^好的魯棒性,對于多語言的復雜環(huán)境下也能較好適用,同時有不低于現(xiàn)有技術(shù)的檢測速度。
技術(shù)研發(fā)人員:路通;劉若澤
受保護的技術(shù)使用者:南京大學
文檔號碼:201610975596
技術(shù)研發(fā)日:2016.11.07
技術(shù)公布日:2017.03.15