本發(fā)明涉及冠字號識別技術(shù)領(lǐng)域,尤其涉及一種基于DSP的紙幣冠字號智能識別方法。
背景技術(shù):
目前主流的冠字號識別方法,大多數(shù)采用人工神經(jīng)網(wǎng)絡(luò)、骨骼特征、特征點匹配等單一的算法來實現(xiàn)對冠字號的識別。
中國專利公開號為CN105261110A的發(fā)明專利公開一種高效的DSP紙幣冠字號識別方法,其具體步驟為:
a)采集紙幣圖像,尋找紙幣的邊緣點;
b)將找到的紙幣邊緣點鐘的異常邊緣點排出,并擬合邊緣直線,得到紙幣上、下、左、右四條邊的斜率和截距;
c)對紙幣的面向以及朝向進行識別;
d)對紙幣上的冠字號進行定位;
e)對最后得到的精確定位的冠字號圖像進行冠字號分割;
f)通過神經(jīng)網(wǎng)絡(luò)算法對冠字號進行識別。
該方法的識別原理為:首先尋找紙幣的邊緣點,擬合出紙幣四條邊的直線,即斜率和截距,然后識別出紙幣的面向和朝向,接著分別采用粗定位、細定位來獲取圖像的冠字號,最后用神經(jīng)網(wǎng)絡(luò)算法對冠字號進行識別。該方法是現(xiàn)有冠字號識別方法中比較典型的識別方法,對于DSP等集成度較高、運算量和實時性要求較高的嵌入式設(shè)備來講,存在以下缺陷:
1.邊緣計算法復(fù)雜,各個國家使用的紙幣通常都是矩形的,即上下邊平行、左右邊平行,在使用上述方法時,需要通過邊緣點的大量采樣,擬合出所有邊緣的直線方程,其計算量上存在冗余;
2.人工神經(jīng)網(wǎng)絡(luò)計算量較大,普遍用于字符判別的神經(jīng)網(wǎng)絡(luò)模型至少是3-4層的模型,即起碼包含輸入層、輸出層和中間層。如果不做降維處理,該算法的輸入層幾點個數(shù)有wc×hc個,輸出層節(jié)點個數(shù)有34個,另外還存在2層以上的中間層,因此存在大量的浮點運算,對DSP的性能要求和預(yù)算實時性要求很高,一般的系統(tǒng)無法達到。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)中的問題,本發(fā)明提供一種對DSP性能和預(yù)算實時性要求低、計算速度快和識別準確度高的基于DSP的紙幣冠字號智能識別方法。
為實現(xiàn)以上技術(shù)目的,本發(fā)明的技術(shù)方案是:
一種基于DSP的紙幣冠字號智能識別方法,其具體步驟包括:
A.采集紙幣正、反面圖像;
B.根據(jù)已建立的紙幣信息數(shù)據(jù)庫,判斷并得出紙幣的幣種、幣值、正反、顛倒、冠字號排列規(guī)律信息;
C.選取包含有冠字號信息的紙幣面的圖像,計算出紙幣的中心,根據(jù)中心裁剪出包含冠字號的1/4局部圖像;
D.從局部圖像中分割出只包含有紙幣的圖像,計算紙幣圖像邊緣的正弦、余弦以及角點坐標;
E.根據(jù)冠字號區(qū)域在紙幣圖像中的相對位置的統(tǒng)計數(shù)據(jù),從紙幣圖像中粗略定位冠字號區(qū)域,對冠字號區(qū)域的圖像進行顛倒、傾斜校正;
F.從已校正的冠字號區(qū)域圖像中精確定位冠字號區(qū)域并將該區(qū)域的圖像分割出來;
G.對分割出來的冠字號區(qū)域圖像中的冠字號進行字符圖像分離,并對字符圖像進行歸一化處理;
H.結(jié)合冠字號排列規(guī)律,利用模板匹配法,將字符圖像與字符模板圖像比對,相似度最高的字符模板圖像所對應(yīng)的字符即為該字符圖像所識別出來的字符;
I.對識別出的字符為易混淆字符的字符圖像提取骨骼特征,利用骨骼特征對該字符圖像進行二次判別,確認該字符圖像對應(yīng)的最終字符;
J.根據(jù)步驟H和步驟I,輸出識別的冠字號信息。
本發(fā)明所述的基于DSP的紙幣冠字號智能識別方法主要分為兩大步:圖像預(yù)處理和冠字號識別。圖像預(yù)處理步驟主要包括:首先對紙幣圖像(包括正面和反面)進行采集,然后對紙幣的幣種(包括國別和版本)、幣值、正反(紙幣正面或反面)、顛倒(紙幣是正置的還是倒置的)等信息進行判別,然后從獲取的紙幣正面圖像中截取出包含有冠字號的1/4圖像,再對1/4圖像進行裁切,分割出只包含紙幣部分的圖像,接著對紙幣部分的圖像的冠字號區(qū)域依次進行粗略定位、精確定位,最終獲得二值化的冠字號區(qū)域圖像;冠字號識別步驟主要包括:將圖像預(yù)處理步驟獲得的冠字號區(qū)域圖像中的字符圖像中分離出來,再與字符模板圖像進行比對,計算相似度,以識別字符圖像中的字符,對于識別出的字符為易混淆字符的字符圖像再進行骨骼特征提取,利用骨骼特征進行二次判別,以確認該字符圖像對應(yīng)的字符,最后結(jié)合模板比對結(jié)果和骨骼特征判別結(jié)果,輸出識別出來的冠字號字符。
從以上描述可以看出,本發(fā)明具備以下優(yōu)點:
(1)在冠字號提取過程中,利用局部圖像處理后的特征值來定位冠字號區(qū)域,減少了大量計算過程,從而提高了冠字號區(qū)域定位速度;
(2)基于冠字號排列規(guī)律,通過模板比對方法對冠字號字符圖像中的字符進行識別,降低了算法的復(fù)雜度,從而提高了識別速度;
(3)對易混淆字符對應(yīng)的字符圖像利用骨骼特征進行二次判別,提高了識別結(jié)果的準確性。
作為優(yōu)選,對所述步驟G分離出來的字符圖像進行歸一化處理,以獲得模板匹配時的字符模板圖像。
作為優(yōu)選,所述步驟C具體包括以下步驟:C1.選取包含有冠字號信息的紙幣面的圖像;C2.計算出紙幣在圖像中的相對位置;C3.根據(jù)相對位置粗略計算紙幣上、下、左、右各邊的中點坐標,再利用均值平均法計算出紙幣的中心坐標;C4.以中心坐標為原點,將紙幣劃分為四個象限;C5.結(jié)合步驟B獲得的紙幣顛倒信息,選取包含冠字號信息的象限,將該象限所對應(yīng)的局部圖像記作Is。
作為優(yōu)選,所述步驟D具體包括以下步驟:D1.對圖像Is采用3×3的模板進行均值濾波,再利用閾值分割法分割出圖像Is中只包含有紙幣的圖像,記作It;D2.結(jié)合步驟B獲得的紙幣信息,對圖像It分別進行相應(yīng)地縱向和橫向分段掃描,獲得紙幣的縱向邊緣采樣點點集和橫向邊緣采樣點點集;D3.利用最小二乘法擬合出兩個點集所對應(yīng)的兩條直線的方程并求解,根據(jù)兩條直線的方程即可得知紙幣邊緣的正弦、余弦,再根據(jù)兩條直線的方程計算得到兩條直線的交點P,交點P即為紙幣的角點。
作為優(yōu)選,所述步驟E具體包括以下步驟:E1.根據(jù)冠字號區(qū)域在紙幣圖像中的相對位置的統(tǒng)計數(shù)據(jù),以交點P為原點,粗略定位冠字號區(qū)域在圖像Is的位置;E2.根據(jù)步驟B獲得的紙幣顛倒信息,對冠字號區(qū)域圖像進行顛倒校正;E3.通過仿射變換,對已進行顛倒校正的冠字號區(qū)域圖像進行傾斜校正,校正后的圖像記作Ir。
作為優(yōu)選,所述步驟F具體包括以下步驟:F1.對圖像Ir進行水平掃面,統(tǒng)計出小于閾值的像素點,得到一個數(shù)組;F2.檢測數(shù)組中相鄰的三個元素,當這三個元素均大于指定的數(shù)值時,數(shù)組索引所對應(yīng)圖像的那一行包含有效的冠字號像素,從而在縱向上精確定位冠字號區(qū)域的位置;F3.采用3×3的模板對步驟F2的結(jié)果進行高斯濾波,去除圖像中的噪聲,以便于冠字號的準確分割;F4.利用動態(tài)閾值分割算法,對步驟F3的結(jié)果進行圖像分割處理,獲得冠字號圖像,記作Ibi。
作為優(yōu)選,所述步驟G利用垂直映射實現(xiàn)冠字號的字符圖像分離。垂直映射法簡單、快速。
附圖說明
圖1是本發(fā)明的流程示意圖;
具體實施方式
結(jié)合附圖,詳細說明本發(fā)明的一個具體實施例,但不對本發(fā)明的權(quán)利要求做任何限定。
一種基于DSP的冠字號智能識別方法,包括以下步驟:
1.采集紙幣正、反面圖像。
2.根據(jù)已建立的紙幣信息數(shù)據(jù)庫,判斷并得出所采集紙幣的幣種(包括國別和版本)、幣值、正反(紙幣正面、反面)、顛倒(紙幣正置、倒置)、冠字號排列規(guī)律等信息。
3.根據(jù)步驟2采集的紙幣信息,選取包含有冠字號的紙幣面對應(yīng)的圖像并記作圖像I(例如,采集的若為人民幣,由于人民幣的冠字號在紙幣正面,則選取人民幣正面對應(yīng)的圖像信息),然后根據(jù)圖像I,計算出紙幣在圖像中的相對位置,具體方法為:由于采集圖像時,會采集到紙幣邊緣以外的圖像,根據(jù)亮度(紙幣區(qū)域亮度高,紙幣邊緣以外區(qū)域亮度低)即可計算出紙幣在圖像中的相對位置。
4.根據(jù)步驟3獲得的紙幣在圖像中的相對位置,粗略計算圖像I中紙幣上、下、左、右邊緣的中點坐標,利用均值平均法大致計算出紙幣中心的坐標,再以該中心為原點,將圖像I劃分為四個象限,再根據(jù)步驟2獲得的紙幣顛倒信息,選取四個象限中包含冠字號的象限。(例如若步驟2獲得的信息為:人民幣、正置,則選第三象限,如果人民幣倒置,若步驟2獲得的信息為:人民幣、倒置,則選第一象限),將該象限對應(yīng)的局部圖像記作Is。
5.利用3×3的模板對圖像Is進行均值濾波,利用閾值分割法分割出圖像中的紙幣,分割獲得的圖像記作It。
6.結(jié)合步驟2獲得的紙幣信息,對圖像It分別進行相應(yīng)地縱向和橫向分段掃描,獲得紙幣的縱向邊緣采樣點點集和橫向邊緣采樣點點集,并利用最小二乘法擬合出兩個點集所對應(yīng)的兩條直線的方程并求解,根據(jù)兩條直線的方程即可得知紙幣邊緣的正弦、余弦,再根據(jù)兩條直線的方程計算得到兩條直線的交點P,交點P即為紙幣的角點。
例如:(1)若步驟2獲得的信息為:人民幣、正置,由于冠字號位于正置人民幣的左下角,因此對圖像It,自左向右分段掃描以獲得人民幣的左邊緣采樣點點集,自下而上分段掃描以獲得人民幣的下邊緣采樣點點集,并利用最小二乘法擬合出兩個點集所對應(yīng)的兩條直線的方程并求解,根據(jù)兩條直線的方程即可得知紙幣邊緣的正弦、余弦,再根據(jù)兩條直線的方程計算得到兩條直線的交點P,交點P即為圖像Is中人民幣的左下角的頂點;(2)若步驟2獲得的信息為:人民幣、倒置,由于冠字號位于倒置人民幣的右上角,因此對圖像It自右向左分段掃描以獲得人民幣的右邊緣采樣點點集,自上而下分段掃描以獲得人民幣的上邊緣采樣點點集,并利用最小二乘法擬合出兩個點集所對應(yīng)的兩條直線的方程并求解,根據(jù)兩條直線的方程即可得知紙幣邊緣的正弦、余弦,再根據(jù)兩條直線的方程計算得到兩條直線的交點P,交點P即為圖像Is中人民幣右上角的頂點。
其中兩條直線方程的擬合方法為:
設(shè)一條直線上x和y之間的函數(shù)關(guān)系為:y=a+bx,則最小距離公式為:
式(1)中,(xi,yi)為對應(yīng)點集中的點,n為點集中點的個數(shù)。
對上式分別對a、b求偏導(dǎo)后聯(lián)立方程組,求解后得到參數(shù)a、b,從而得到兩個點集分別對應(yīng)的兩條直線方程。
7.根據(jù)冠字號區(qū)域在紙幣圖像中的相對位置的統(tǒng)計數(shù)據(jù),以交點P為原點,粗略定位冠字號區(qū)域在圖像Is的位置。
其中,冠字號區(qū)域在紙幣圖像中的相對位置的統(tǒng)計數(shù)據(jù)可前期經(jīng)人工或機器對冠字號區(qū)域在紙幣中的相對位置信息進行數(shù)據(jù)采集并統(tǒng)計分析,得出冠字號區(qū)域在紙幣圖像中的相對位置信息,該相對位置信息優(yōu)選為含有冠字號的一定的矩形區(qū)域?qū)?yīng)的坐標信息。
8.根據(jù)步驟2獲得的紙幣顛倒信息,對粗略定位獲得的冠字號區(qū)域圖像進行顛倒校正。
例如:(1)若步驟2獲得的信息為:人民幣、倒置,則對冠字號區(qū)域圖像進行顛倒;(2)若步驟2獲得的信息為:人民幣、正置,則不操作。
9.通過仿射變換,對已進行顛倒校正的冠字號區(qū)域圖像進行傾斜校正,校正后的圖像記作Ir。
其中,傾斜校正的具體公式如下:
式(2)中,sinθ、cosθ為步驟6中計算得到的水平邊緣的正弦、余弦值,(v,w)為原圖像Is中像素的坐標,(x,y)為校正后圖像像素中對應(yīng)的坐標。
10.對圖像Ir進行水平掃面,統(tǒng)計出小于閾值的像素點,得到一個數(shù)組;檢測數(shù)組中相鄰的三個元素,當這三個元素均大于指定的數(shù)值時,數(shù)組索引所對應(yīng)圖像的那一行包含有效的冠字號像素,從而在縱向上精確定位冠字號區(qū)域的位置。
11.采用3×3的模板對精確定位的冠字號區(qū)域圖像進行高斯濾波,去除圖像中的噪聲,以便于冠字號的準確分割。
其中,高斯模板如下:
12.再利用動態(tài)閾值分割算法,對步驟11的結(jié)果進行圖像分割處理,獲得二值化的冠字號圖像,記作Ibi。
13.對圖像Ibi進行垂直映射,將冠字號字符分離出來,獲得字符圖像,并對字符圖像進行歸一化處理。
14.結(jié)合步驟2獲得的冠字號排列規(guī)律信息,利用模板匹配法,將字符圖像與字符模板圖像比對,相似度最高的字符模板圖像所對應(yīng)的字符即為該字符圖像所識別出來的字符。
其中,字符模板圖像的獲取可前期經(jīng)人工或機器對冠字號字符圖像進行數(shù)據(jù)采集并統(tǒng)計分析,再進行歸一化處理獲得。
例如:若步驟2獲得的紙幣信息為人民幣,則其對應(yīng)的冠字號排列規(guī)律信息為:首字符為字母,后六個字符為數(shù)字,第二、三、四個字符,其中一個為字母,其余兩個為數(shù)字,且第二、三、四個字符中,字母字符的高度高于數(shù)字字符的高度,結(jié)合該規(guī)律,分下述步驟識別:
(1)對于首個字符圖像,將其與字母模板圖像比對,相似度最高的字符模板圖像所對應(yīng)的字符即為該字符圖像所識別出來的字符。
其中,相似度公式為:
式(4)中:S(m,n)為步驟歸一化的待識別的字符圖像,T(m,n)為對應(yīng)的模板圖像。
(2)對于后六個字符圖像,將其與數(shù)字模板圖像比對,相似度最高的字符模板圖像所對應(yīng)的字符即為該字符圖像所識別出來的字符。
其中,相似度公式為:
式(4)中:S(m,n)為步驟歸一化的待識別的字符圖像,T(m,n)為對應(yīng)的模板圖像。
(3)對于第二、三、四個字符圖像,在步驟13進行處理時,要先剔除字符圖像中上、下、左、右多余的背景,確保字符圖像中的前景最大化,并記錄前景高度。
A.若記錄的三個字符圖像中前景的高度與字符類型無關(guān),則將其分別與字母模板和數(shù)字模板進行對比,同時分別找出相似度最高值,則它們的最高相似度為:R2c、R2n、R3c、R3n、R4c、R4n。計算出組合相似度,當其取最大值時,此時各個相似度相應(yīng)模板所對應(yīng)的字符,即為識別出來的字符。組合相似度有三組,其計算公式如下:
B.若三個字符圖像中前景的高度與字符類型相關(guān),則將前景高度最大的字符圖像與字母模板進行對比,計算相似度,相似度最高的字符模板對應(yīng)的字符,即為識別出來的字符;將其余兩個字符圖像與數(shù)字模板進行對比,計算相似度,相似度最高的字符模板對應(yīng)的字符,即為識別出來的字符。
其中,相似度公式為:
式(4)中:S(m,n)為步驟歸一化的待識別的字符圖像,T(m,n)為對應(yīng)的字符模板圖像。
15.對識別出的字符為易混淆字符的字符圖像進行細化處理,提取其骨骼特征,利用穿插掃面方法判斷該骨骼特征,確認該字符圖像對應(yīng)的最終字符。
16.根據(jù)步驟14和步驟15的結(jié)果,輸出識別的冠字號信息。
上述步驟中,值得注意的有:
(1)步驟2中所述的紙幣信息數(shù)據(jù)庫存儲的紙幣信息數(shù)據(jù)至少包括幣種(包括國別和版本)、幣值、正反(紙幣正面、反面)、顛倒(紙幣正置、倒置)、冠字號排列規(guī)律信息,其中冠字號排列規(guī)律信息是指每種紙幣所對應(yīng)的冠字號排列規(guī)律,可以經(jīng)前期統(tǒng)計分析獲得;步驟2中對所采集紙幣的幣種(包括國別和版本)、幣值、正反(紙幣正面、反面)、顛倒(紙幣正置、倒置)信息判斷的方法采用現(xiàn)有技術(shù)的常規(guī)方法,故不再贅述,對所采集紙幣的冠字號排列規(guī)律判斷是指根據(jù)紙幣判斷得出的幣種和幣值信息,獲得相應(yīng)的冠字號排列規(guī)律信息;
(2)步驟6中對紙幣邊緣采樣點的采集,要結(jié)合紙幣信息(幣種、幣值、冠字號區(qū)域位置等)進行采集;
(3)步驟14中模板匹配法的使用,要結(jié)合紙幣信息(主要是冠字號排列規(guī)律),在統(tǒng)計策略的基礎(chǔ)上進行比對;
(4)步驟15的骨骼特征判別方法與現(xiàn)有技術(shù)的骨骼特征判別方法相同,故不再贅述。
本發(fā)明所述的基于DSP的紙幣冠字號智能識別方法的流程圖如圖1所示。
本發(fā)明所述的基于DSP的紙幣冠字號智能識別方法主要分為兩大步:圖像預(yù)處理和冠字號識別。圖像預(yù)處理步驟主要包括:首先對紙幣圖像(包括正面和反面)進行采集,然后對紙幣的幣種(包括國別和版本)、幣值、正反(紙幣正面或反面)、顛倒(紙幣是正置的還是倒置的)等信息進行判別,然后從獲取的紙幣正面圖像中截取出包含有冠字號的1/4圖像,再對1/4圖像進行裁切,分割出只包含紙幣部分的圖像,接著對紙幣部分的圖像的冠字號區(qū)域依次進行粗略定位、精確定位,最終獲得二值化的冠字號區(qū)域圖像;冠字號識別步驟主要包括:將圖像預(yù)處理步驟獲得的冠字號區(qū)域圖像中的字符圖像中分離出來,再與字符模板圖像進行比對,計算相似度,以識別字符圖像中的字符,對于識別出的字符為易混淆字符的字符圖像再進行骨骼特征提取,利用骨骼特征進行二次判別,以確認該字符圖像對應(yīng)的字符,最后結(jié)合模板比對結(jié)果和骨骼特征判別結(jié)果,輸出識別出來的冠字號字符。
從以上描述可以看出,本發(fā)明具備以下優(yōu)點:
(1)在冠字號提取過程中,利用局部圖像處理后的特征值來定位冠字號區(qū)域,減少了大量計算過程,從而提高了冠字號區(qū)域定位速度;
(2)基于冠字號排列規(guī)律,通過模板比對方法對冠字號字符圖像中的字符進行識別,降低了算法的復(fù)雜度,從而提高了識別速度;
(3)對易混淆字符對應(yīng)的字符圖像利用骨骼特征進行二次判別,提高了識別結(jié)果的準確性。
將本發(fā)明所述方法應(yīng)用到冠字號判別產(chǎn)品時,可將前期統(tǒng)計獲得的冠字號區(qū)域位置數(shù)據(jù)(即冠字號區(qū)域位于紙幣的哪個象限)、冠字號區(qū)域相對位置數(shù)據(jù)(即冠字號區(qū)域位于所處象限的大致矩形區(qū)域范圍)、冠字號字符模板數(shù)據(jù)和冠字號字符骨骼特征數(shù)據(jù)等也建立在紙幣信息數(shù)據(jù)庫中。
本發(fā)明所述基于DSP的紙幣冠字號智能識別方法,可以應(yīng)用于單幣種單幣值的冠字號識別、單幣種多幣值的冠字號識別,也可以應(yīng)用于多幣種的冠字號識別,只要根據(jù)相應(yīng)的需求,建立相應(yīng)的紙幣信息數(shù)據(jù)庫即可。
可以理解的是,以上關(guān)于本發(fā)明的具體描述,僅用于說明本發(fā)明而并非受限于本發(fā)明實施例所描述的技術(shù)方案。本領(lǐng)域的普通技術(shù)人員應(yīng)當理解,仍然可以對本發(fā)明進行修改或等同替換,以達到相同的技術(shù)效果;只要滿足使用需要,都在本發(fā)明的保護范圍之內(nèi)。