1.一種用于快速生成OCR訓(xùn)練樣本的自適應(yīng)方法,其特征在于,包括如下步驟:
步驟1,模板制作,利用編輯器生成模板字符數(shù)據(jù),并在模板數(shù)據(jù)的上下左右標記四個特征點,將模板數(shù)據(jù)打印出來作為模板;
步驟2,選取屏幕坐標系作為參考坐標系,在編輯器中下得到所述四個特征點及每個所述字符的中心坐標,對模板進行拍照并保證模板上每個所述字符的輪廓清晰,采用相關(guān)算法獲取相機圖像坐標系下每個所述字符的中心點坐標;
步驟3,在不同條件下對模板進行多組不同清晰度的拍照,采用圖像形態(tài)學(xué)方法,提取出模板上下左右四個所述特征點的位置坐標;
步驟4,樣本生成,利用步驟2中屏幕坐標系下的所述特征點坐標與步驟3中所述提取的特征點坐標得到兩個坐標系之間的線性變換矩陣,再利用該線性變換矩陣得到步驟2中屏幕坐標系下所述字符中心坐標在步驟3中所拍攝的照片中所對應(yīng)的字符中心坐標。
2.根據(jù)權(quán)利要求1所述的一種用于快速生成OCR訓(xùn)練樣本的自適應(yīng)方法,其特征在于,所述步驟1中的特征點為十字交叉符號。
3.根據(jù)權(quán)利要求1所述的一種用于快速生成OCR訓(xùn)練樣本的自適應(yīng)方法,其特征在于,所述步驟2中所述對模板進行拍照并保證模板上每個所述字符的輪廓清晰,采用相關(guān)算法獲取相機圖像坐標系下每個所述字符的中心點的坐標具體包括:
對模板拍照,保證模板上的每個字符輪廓清晰,選取相機圖像坐標系為參考坐標系,對得到的圖像首先二值化,然后利用圖像形態(tài)學(xué)或者模板匹配找到所述特征點,采用行分割和列分割算法計算得到每個所述字符的中心點坐標。
4.根據(jù)權(quán)利要求1所述的一種用于快速生成OCR訓(xùn)練樣本的自適應(yīng)方法,其特征在于,所述步驟3具體包括:
在不同距離下,采用不同品牌的攝像頭,加入適量抖動對所述模板進行拍照,得到所述模板不同清晰度的樣本圖像,拍照過程中保證能夠肉眼看到四個所述特征點,然后,采用圖像形態(tài)學(xué)方法,提取出所述模板上所述特征點的位置坐標。
5.一種用于快速生成OCR訓(xùn)練樣本的自適應(yīng)系統(tǒng),其特征在于,該系統(tǒng)包括:
模板制作模塊,利用編輯器生成模板字符數(shù)據(jù),并在模板數(shù)據(jù)的上下左右標記四個特征點,將模板數(shù)據(jù)打印出來作為模板;
字符中心坐標計算模塊,選取屏幕坐標系作為參考坐標系,在編輯器中得到所述四個特征點及每個所述字符的中心坐標,對模板進行拍照并保證模板上每個所述字符的輪廓清晰,采用相關(guān)算法獲取相機圖像坐標系下每個所述字符的中心點的坐標;
特征點提取模塊,在不同條件下對模板進行多組不同清晰度的拍照,采用圖像形態(tài)學(xué)方法,提取出模板上下左右四個所述特征點的位置坐標;
樣本生成模塊,利用所述字符中心坐標計算模塊中屏幕坐標系下的所述特征點坐標與所述特征點提取模塊中所述提取的特征點坐標得到兩個坐標系之間的線性變換矩陣,再利用該線性變換矩陣得到步驟2中屏幕坐標系下所述字符中心坐標在步驟3中所拍攝的照片中所對應(yīng)的字符中心坐標。
6.根據(jù)權(quán)利要求5所述的一種用于快速生成OCR訓(xùn)練樣本的自適應(yīng)系統(tǒng),其特征在于,所述模板制作模塊中的特征點為十字交叉符號。
7.根據(jù)權(quán)利要求5所述的一種用于快速生成OCR訓(xùn)練樣本的自適應(yīng)系統(tǒng),其特征在于,所述特征點提取模塊中所述對模板進行拍照并保證模板上每個所述字符的輪廓清晰,采用相關(guān)算法獲取相機圖像坐標系下每個所述字符的中心點的坐標具體實現(xiàn)為:
對模板拍照,保證模板上的每個字符輪廓清晰,選取相機圖像坐標系為參考坐標系,對得到的圖像首先二值化,然后利用圖像形態(tài)學(xué)或者模板匹配找到所述特征點,采用行分割和列分割算法計算得到每個所述字符的中心點坐標。
8.根據(jù)權(quán)利要求5所述的一種用于快速生成OCR訓(xùn)練樣本的自適應(yīng)系統(tǒng),其特征在于,所述特征點提取模塊具體實現(xiàn)為:
在不同距離下,采用不同品牌的攝像頭,加入適量抖動對所述模板進行拍照,得到所述模板不同清晰度的樣本圖像,拍照過程中保證能夠肉眼看到四個所述特征點,然后,采用圖像形態(tài)學(xué)方法,提取出所述模板上所述特征點的位置坐標。