本發(fā)明涉及數(shù)字圖像處理領域,具體為一種基于相位信息的壓印字符識別方法及系統(tǒng)。
背景技術:
在汽車、輪胎及各種機電產品中,工業(yè)標牌包含著許多信息。但工業(yè)標牌大多采用的是壓印字符。其輪廓是靠其表面不同強度的反射光,而不是靠材質對光線的不同的吸收成都而形成的。成像時不能表現(xiàn)出明顯的色差,屬于“無色差字符”圖像,采用OCR技術很難獲得理想的效果。目前,面對這種問題也已經有人提出解決辦法,采用線激光掃描的方法,根據(jù)線激光的變化,獲得被測表面的高度信息。由于需要掃描,所以這種方法的測量速度很慢。且傳統(tǒng)的線激光掃描的方法需要移動機構,結構相對復雜,同時對相機采集頻率及線激光光源要求比較高,生產成本很大,限制其發(fā)展。因此,該技術有必要進行改進。
技術實現(xiàn)要素:
為了解決上述技術問題,本發(fā)明的目的是提供一種采用相位變化來識別壓印字符的方法及系統(tǒng)。
本發(fā)明所采用的技術方案是:
本發(fā)明提供一種基于相位信息的壓印字符識別方法,包括以下步驟:
S1、系統(tǒng)向被測物體投射4幅相位差為π/2的余弦光柵,并采集所得的圖像;
S2、系統(tǒng)計算出被測物體的折疊相位;
S3、系統(tǒng)利用一維傅里葉變換,獲得所述折疊相位的頻率,并進行傅里葉逆變換,求得所述被測物體的各字符的相位信息;
S4、系統(tǒng)根據(jù)相位與高度成正相關關系,分別對不同高度平面下抽取的各字符信息與已訓練好的字符進行匹配識別。
作為該技術方案的改進,所述步驟S2計算折疊相位采用的公式為:
其中,為所得折疊相位圖像的折疊相位,I(x,y)表示余弦光柵圖像,A(x,y)表示背景強度,B(x,y)表示光柵條紋的振幅值,R(x,y)表示所測物體表面的不均勻反射率。
作為該技術方案的改進,所述步驟S3,其還包括,
分別選取折疊相位圖像非字符區(qū)域對應X軸和Y軸的各一組一維數(shù)據(jù),對所述兩組一維數(shù)據(jù)的兩端分別補零。
作為該技術方案的改進,所述在選取的兩個一維向量的兩端進行補零操作,其具體公式為:
其中M、N、k均為正整數(shù)。
進一步地,所述步驟S3,其還包括:
對所述補零后數(shù)據(jù)進行傅里葉變換,得到基頻位置(u0,v0);
將所述基頻位置(u0,v0)移動至原點,并進行傅里葉逆變換,其中變換公式為:
所得到折疊圖像的相位信息為
其中,W表示相位部分,fx表示x軸方向頻率,fy表示y軸方向頻率。
進一步地,根據(jù)所獲得的相位信息進行二值化操作,抽取各字符的高度信息,并設定相位閾值以截取同一高度的字符信息。
進一步地,采用BP神經網(wǎng)絡算法對現(xiàn)有已知字符的二值圖像進行訓練,并與不同高度平面的字符信息進行模式匹配。
另一方面,本發(fā)明還提供一種基于相位信息的壓印字符識別系統(tǒng),包括:
投影儀,用于向被測物體投射4幅相位差為π/2的余弦光柵;相機,用于采集圖像信息;
處理器,用于執(zhí)行計算出被測物體的折疊相位;利用一維傅里葉變換,獲得所述折疊相位的頻率,并進行傅里葉逆變換,求得所述被測物體的各字符的相位大??;根據(jù)相位與高度成正相關關系,分別對不同高度平面下抽取的字符信息與已訓練好的字符進行匹配識別。
本發(fā)明的有益效果是:本發(fā)明提供的一種采用相位變化來識別壓印字符的方法及系統(tǒng),利用被測字符表面高度變化對投影光柵相位調制的原理,獲得被測表面高度變化,根據(jù)凸出字符與背景高度不同的性質進行二值化操作,將被測字符提取出來,然后進行OCR識別。本發(fā)明算法實現(xiàn)簡單,不需要進行2維傅里葉變換,算法有較高的執(zhí)行效率,同時結構簡單,對環(huán)境和器件要求較低,對于復雜的測量環(huán)境下依然具有很好的實現(xiàn)效果,不容易受局部噪聲干擾,具有很強的適應性,為工業(yè)化生產提供了可能。本方案提供的方法在識別字符時速度快,精度高,還原效果明顯,字符識別率極高。
附圖說明
下面結合附圖對本發(fā)明的具體實施方式作進一步說明:
圖1是本發(fā)明一實施例的算法流程圖;
圖2是本發(fā)明一實施例的示意圖;
圖3是本發(fā)明一實施例的被測字符;
圖4是本發(fā)明一實施例的折疊相位圖;
圖5是本發(fā)明一實施例的向量補零圖;
圖6是本發(fā)明一實施例的傅里葉變換頻譜圖;
圖7是本發(fā)明一實施例的被測表面相位圖;
圖8是本發(fā)明一實施例的被測字符二值圖像;
圖9是本發(fā)明另一實施例的被測字符二值圖像。
具體實施方式
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。
參照圖1,為本發(fā)明的算法流程圖。一種基于相位信息的壓印字符識別方法,包括以下步驟:
S1、系統(tǒng)向被測物體投射4幅相位差為π/2的余弦光柵,并采集所得得圖像;
S2、系統(tǒng)計算出被測物體的折疊相位;
S3、系統(tǒng)利用一維傅里葉變換,獲得所述折疊相位的頻率,并進行傅里葉逆變換,求得所述被測物體的各字符的相位信息;
S4、系統(tǒng)根據(jù)相位與高度成正相關關系,分別對不同高度平面下抽取的各字符信息與已訓練好的字符進行匹配識別。
本發(fā)明采用的方案是利用高度調制相位的方法,確定字符位置。根據(jù)相位信息得到字符的二值圖像。通過相位的信息來提取“無色差字符”的圖像信息。根據(jù)物體高度引起余弦光柵相位變化的現(xiàn)象,提取相位變化量,根據(jù)變化量大小來確定壓印字符的高度,通過設定相位閾值來截取同一高度下的字符信息,進而利用ocr識別技術來識別字符。
該方法包括利用投影儀向被測字符表面投射余弦光柵;參照圖2所示,該系統(tǒng)硬件部分只需要一臺投影儀和一臺工業(yè)相機,投影儀1投射4幅相位差為π/2的余弦光柵,相機2進行圖像的采集。
參照圖3,為一實施例試驗的被測字符。工業(yè)相機分別采集四幅圖片,將所得的四幅圖片根據(jù)四步相移法求得被測表面的折疊相位。改變投射光柵的相位,分別投射相位差為的四幅余弦光柵圖像,利用工業(yè)相機采集四幅圖像,計算出被測物體的折疊相位,具體公式如下:
其中,為所得折疊相位圖像的折疊相位,I(x,y)表示余弦光柵圖像,A(x,y)表示背景強度,B(x,y)表示光柵條紋的振幅值,R(x,y)表示所測物體表面的不均勻反射率。參照圖4為本發(fā)明一實施例被測物體的折疊相位圖。
分別取第一行和第一列共2個一維向量,參照圖5所示,在每個向量兩端進行補零操作,此次試驗在向量兩端補零數(shù)目為向量元素個數(shù)的十倍,以提高頻移精度。分別對兩個向量進行傅里葉傅里葉變換,計算x,y兩個軸的基頻位置。
進一步,由折疊相位圖像獲得相位信息的方法為:
選取圖像非字符區(qū)域的一行和一列,通常為第一行第一列;
在選取的兩個一維向量的兩端進行補零操作具體公式為:
其中M、N、k均為正整數(shù)。
根據(jù)傅里葉變換的頻移特性可知:
獲得頻移后的相位信息圖像,則可以進行移頻計算:
參照圖6所示,分別為x,y方向的傅里葉變換的頻譜圖。用計算獲得的u0,v0,對被測物體折疊相位圖進行移頻計算,公式如下:
被測物體的相位信息即可用下列公式獲得:
本發(fā)明不需要進行2維傅里葉變換和2維傅里葉逆變換,只需要獲得頻移后的圖像信息。被測物體的高度信息反應在相位圖中,根據(jù)所獲得的相位變化量信息進行二值化操作,根據(jù)不同的閾值選取來抽取同一高度下的字符信息;針對不同高度的字符,需循環(huán)執(zhí)行該抽取步驟進行字符識別。
在獲得字符的二值圖像之后利用傳統(tǒng)的模式識別的方法進行字符識別。本發(fā)明采用BP神經網(wǎng)絡的模式匹配的方法,先將26個英文字母及0到9十個數(shù)字的二值圖像進行訓練,然后與采集到的圖像進行匹配,即可得到被測表面的字符信息。
本方案采用壓印字符凸出部分與背景存在高度差,利用被測物體表面的高度變化對投影光柵相位的調制現(xiàn)象,根據(jù)被測表面的相位變化量抽取同一高度下的字符信息;使用BP神經網(wǎng)絡算法對已知字符的二值圖像進行訓練,與不同高度平面的字符信息進行模式匹配,匹配成功后進行顯示。
其中,系統(tǒng)由一個工業(yè)相機和一個投影儀組成,用投影儀向被測物體投射余弦光柵,獲取4幅相位差為π/2的余弦光柵圖;獲取折疊相位,將基頻部分移至原點。
分別取圖像X、Y軸一組數(shù)據(jù)。對X、Y的一維數(shù)據(jù)兩端補零。分別進行傅里葉變換得到基頻位置u0,v0,將(u0,v0)移動到原點,進行傅里葉逆變換,公式如下:
根據(jù)如下公式即可得到相位變化量:
其中,W表示相位部分,fx表示x軸方向頻率,fy表示y軸方向頻率。
根據(jù)所獲得的相位信息進行二值化操作,抽取高度信息,設定閾值;
分別對26個字母及0~9數(shù)字的二值圖像進行神經網(wǎng)絡訓練,找出匹配成功的字符信息。
參照圖7所示為求得被測表面的相位圖。因為被測表面相位信息與表面高度成正相關關系,所以根據(jù)相位信息即可對不同高度進行截取。
圖8-9均為截取同一高度下的字符信息。利用BP神經網(wǎng)絡算法,將預先訓練好的字符與數(shù)字信息與所得字符信息進行模式匹配。
利用被測字符表面高度變化對投影光柵相位調制的原理,獲得被測表面高度變化,根據(jù)凸出字符與背景高度不同的性質進行二值化操作,將被測字符提取出來,然后進行OCR識別。本發(fā)明算法實現(xiàn)簡單,不需要進行2維傅里葉變換,算法有較高的執(zhí)行效率,同時結構簡單,只需要一臺投影儀和一臺工業(yè)相機,對環(huán)境和器件要求較低,對于環(huán)境復雜的測量環(huán)境下依然具有很好的實現(xiàn)效果,具有處理的整體性,不容易受局部噪聲干擾,具有很強的適應性,為工業(yè)化生產提供了可能。
與現(xiàn)有技術相比,本發(fā)明解決了“無色差字符”的識別問題,提出用相位變化信息反應被測表面的高度信息,本發(fā)明只需要一臺投影儀和一臺工業(yè)相機,結構簡單,器件要求低,便于工業(yè)化。而且對光源的要求及測量環(huán)境要求相對較低,實驗環(huán)境易于實現(xiàn)。在算法方面,現(xiàn)有采用條紋測量的產品中均使用2維傅里葉變換,本發(fā)明的算法不需要2維傅里葉變換,只要計算單行向量的頻率即可實現(xiàn)功能,算法執(zhí)行效率大大提高。
以上是對本發(fā)明的較佳實施進行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實施例,熟悉本領域的技術人員在不違背本發(fā)明精神的前提下還可做出種種的等同變形或替換,這些等同的變形或替換均包含在本申請權利要求所限定的范圍內。