技術(shù)總結(jié)
本發(fā)明涉及一種用于快速生成OCR訓(xùn)練樣本的自適應(yīng)方法及系統(tǒng),其方法包括:利用編輯器生成模板字符數(shù)據(jù),標(biāo)記特征點(diǎn),并將模板數(shù)據(jù)打印作為模板;獲取屏幕坐標(biāo)系下特征點(diǎn)及每個(gè)所述字符的中心坐標(biāo),對(duì)模板進(jìn)行拍照并獲取相機(jī)圖像坐標(biāo)系下每個(gè)所述字符的中心點(diǎn)的坐標(biāo);在不同條件下對(duì)模板進(jìn)行多組不同清晰度的拍照,提取出模板上所述特征點(diǎn)的位置坐標(biāo);然后利用屏幕坐標(biāo)系下的所述特征點(diǎn)坐標(biāo)與所提取的相機(jī)圖像坐標(biāo)系下特征點(diǎn)坐標(biāo)得到兩個(gè)坐標(biāo)系之間的線性變換矩陣,再利用該線性變換矩陣得到屏幕坐標(biāo)系下所述字符中心坐標(biāo)在實(shí)際所拍攝的照片中所對(duì)應(yīng)的字符中心坐標(biāo)。本發(fā)明能夠自適應(yīng)各種真實(shí)場(chǎng)景,能夠模擬相機(jī)和文檔的相對(duì)運(yùn)動(dòng)導(dǎo)致的模糊,提高了樣本生成的速率及真實(shí)性。
技術(shù)研發(fā)人員:王經(jīng)宇;潘嶸;鄭華斌;劉思聰;費(fèi)行健
受保護(hù)的技術(shù)使用者:深圳愛(ài)拼信息科技有限公司
文檔號(hào)碼:201611239121
技術(shù)研發(fā)日:2016.12.29
技術(shù)公布日:2017.05.31