冠字號(hào)碼的識(shí)別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種冠字號(hào)碼的識(shí)別方法及系統(tǒng),該方法包括:提取冠字號(hào)碼所在區(qū)域的灰度圖像,并對(duì)灰度圖像進(jìn)行邊緣檢測(cè);對(duì)圖像進(jìn)行旋轉(zhuǎn);對(duì)圖像中的單個(gè)號(hào)碼進(jìn)行精細(xì)定位,對(duì)定位后的號(hào)碼的圖像中包含的字符進(jìn)行套緊,并對(duì)每個(gè)號(hào)碼圖像進(jìn)行歸一化處理,所述歸一化包含尺寸歸一化和明暗歸一化;采用神經(jīng)網(wǎng)絡(luò)對(duì)歸一化后的號(hào)碼圖像進(jìn)行識(shí)別,獲得冠字號(hào)碼。上述方法能夠在保證運(yùn)算速度的同時(shí),提高識(shí)別的魯棒性,保證了實(shí)際應(yīng)用中的準(zhǔn)確性和實(shí)用性。
【專利說(shuō)明】
冠字號(hào)碼的識(shí)別方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種冠字號(hào)碼的識(shí)別方法及系統(tǒng),適用于特殊印刷制品上的冠字號(hào)碼 的識(shí)別。
【背景技術(shù)】
[0002] 目前,無(wú)論是在現(xiàn)金存取款、支票支付轉(zhuǎn)賬、車牌號(hào)碼識(shí)別等領(lǐng)域中,對(duì)于待識(shí)別 區(qū)域中的冠字號(hào)碼的識(shí)別,都有著重要的要求,尤其在紙幣的識(shí)別中,要求準(zhǔn)確率高,識(shí)別 效率和識(shí)別速度也要高。
[0003] 在現(xiàn)有技術(shù)中,隨著DSP技術(shù)的發(fā)展,通過(guò)DSP平臺(tái),配合計(jì)算機(jī)視覺(jué)技術(shù)和圖像處 理技術(shù),實(shí)現(xiàn)對(duì)冠字號(hào)碼的識(shí)別,較為常見(jiàn)。而在具體的識(shí)別算法中,常用的方法有模板匹 配、BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,也有采用多重神經(jīng)網(wǎng)絡(luò)融合的方式實(shí)現(xiàn)識(shí)別,例如,在申請(qǐng) 號(hào)為CN201410258528.9的專利申請(qǐng)中,通過(guò)分別設(shè)計(jì)訓(xùn)練兩個(gè)神經(jīng)網(wǎng)絡(luò)的方式,實(shí)現(xiàn)識(shí)別, 即通過(guò)冠字號(hào)碼的圖像矢量特征訓(xùn)練一個(gè)特征提取網(wǎng)絡(luò),再結(jié)合一個(gè)BP神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別, 通過(guò)對(duì)上述兩個(gè)網(wǎng)絡(luò)的加權(quán)融合,實(shí)現(xiàn)對(duì)冠字號(hào)碼的識(shí)別。而在DSP識(shí)別方式中,往往局限 于網(wǎng)絡(luò)傳輸效率以及DSP識(shí)別中對(duì)紙幣的位置、朝向等影響,其識(shí)別效率及識(shí)別算法的魯棒 性都比較差,例如在申請(qǐng)?zhí)枮镃N201510702688.2的專利申請(qǐng)中,通過(guò)灰度閾值與方向搜索 的方式,擬合出邊緣,再通過(guò)閾值對(duì)邊緣線進(jìn)行篩選,獲得區(qū)域斜率,結(jié)合神經(jīng)網(wǎng)絡(luò)訓(xùn)練識(shí) 別面向后,通過(guò)逐行掃描及后續(xù)的神經(jīng)網(wǎng)絡(luò)識(shí)別出冠字號(hào)碼。
[0004]又如在一現(xiàn)有技術(shù)中,如論文《基于圖像分析的人民幣清分方法研究與實(shí)現(xiàn)》中, 期采用了卷積神經(jīng)網(wǎng)絡(luò)的方式對(duì)冠字號(hào)碼進(jìn)行識(shí)別,但是,上述方案中僅通過(guò)最簡(jiǎn)單二值 化對(duì)字符進(jìn)行劃分,無(wú)法實(shí)現(xiàn)對(duì)字符的有效套緊,而這將直接影響后續(xù)需要處理的數(shù)據(jù)量, 直接影響算法的實(shí)用價(jià)值;并且上述技術(shù)方案中僅采取了對(duì)分割字符的簡(jiǎn)單大小處理,沒(méi) 有有效對(duì)預(yù)處理及分割后的圖像進(jìn)行套緊以及圖像數(shù)據(jù)的有效歸一化處理,而這種簡(jiǎn)單的 大小處理,將對(duì)后續(xù)的神經(jīng)網(wǎng)絡(luò)識(shí)別帶來(lái)繁重的數(shù)據(jù)處理量,極大降低了后續(xù)的識(shí)別效率; 并且,上述技術(shù)方案中同樣沒(méi)有很好地處理紙幣殘缺對(duì)紙幣識(shí)別及圖像的處理造成的影 響。雖然上述技術(shù)方案理論上能夠達(dá)到一定的識(shí)別準(zhǔn)確率,但是,由于其運(yùn)算識(shí)別效率低 下,不能很好地轉(zhuǎn)化為商業(yè)實(shí)用方法,不能適應(yīng)在現(xiàn)實(shí)紙幣識(shí)別中的速度要求。
[0005] 可見(jiàn),現(xiàn)有技術(shù)存在以下問(wèn)題:不能高效率地解決對(duì)紙幣的朝向及字符的有效定 位,其識(shí)別后的字符范圍較大,容易造成字符的錯(cuò)誤劃分,并且后期圖像處理及識(shí)別的數(shù)據(jù) 量大,降低了識(shí)別效率;對(duì)于走鈔造成的紙幣圖像的快速傾斜變化不能很好地適應(yīng),不能及 時(shí)對(duì)紙幣的傾斜進(jìn)行糾正并識(shí)別;對(duì)破損紙幣識(shí)別的魯棒性低,沒(méi)有提供相應(yīng)的紙幣破損 識(shí)別處理方式。
【發(fā)明內(nèi)容】
[0006] 基于現(xiàn)有技術(shù)中存在的諸多問(wèn)題,本發(fā)明提出了一種冠字號(hào)碼的識(shí)別方法和系 統(tǒng),在保證了冠字號(hào)碼識(shí)別的效率的情況下,有效解決了待識(shí)別對(duì)象破損、臟污、快速翻折 等情況下識(shí)別算法的魯棒性問(wèn)題。具體而言,本發(fā)明提供了以下的技術(shù)方案:
[0007] 一種冠字號(hào)碼的識(shí)別方法,所述方法包括以下步驟:
[0008] 步驟1、提取冠字號(hào)碼所在區(qū)域的灰度圖像,并對(duì)灰度圖像進(jìn)行邊緣檢測(cè);該邊緣 檢測(cè),可以通過(guò)常規(guī)的canny檢測(cè)、SObel檢測(cè)等方式實(shí)現(xiàn),再結(jié)合直線擬合,獲得邊緣直線 方程,但需要對(duì)邊緣檢測(cè)時(shí)的經(jīng)驗(yàn)閾值進(jìn)行試驗(yàn)設(shè)定,以保證方法的運(yùn)算速度。
[0009] 步驟2、對(duì)圖像進(jìn)行旋轉(zhuǎn);即將邊緣檢測(cè)后的紙幣的圖像進(jìn)行坐標(biāo)點(diǎn)糾正和映射, 以將圖像擺正,從而方便號(hào)碼圖像的分割和識(shí)別,該旋轉(zhuǎn)方法,可以采用坐標(biāo)點(diǎn)變換方法, 或者依據(jù)檢測(cè)出的邊緣方程進(jìn)行糾正,獲得變換方程,也可以以極坐標(biāo)旋轉(zhuǎn)等方式實(shí)現(xiàn); [0010]步驟3、對(duì)圖像中的單個(gè)號(hào)碼進(jìn)行定位,具體包含:通過(guò)自適應(yīng)二值化,對(duì)圖像進(jìn)行 二值化處理,獲得二值化圖像;然后對(duì)所述二值化圖像進(jìn)行投影,常規(guī)的圖像投影僅通過(guò)一 次垂直投影和一次水平投影來(lái)完成,具體的投影方向和次數(shù),可以依據(jù)識(shí)別的具體環(huán)境及 精度要求做調(diào)整,例如還可以采用帶有傾斜角度方向的投影等,或者采用多次多重投影結(jié) 合;最后通過(guò)設(shè)置移動(dòng)窗口,采用移動(dòng)窗口配準(zhǔn)的方式,對(duì)號(hào)碼進(jìn)行分割,得到每個(gè)號(hào)碼的 圖像,由于紙幣的破損、臟污等常見(jiàn)問(wèn)題,對(duì)于冠字號(hào)碼圖像上有臟污,字符與字符之間存 在粘連的紙幣效果較差,尤其是對(duì)三個(gè)或三個(gè)以上字符的粘連,幾乎分割不開(kāi),因此,本發(fā) 明在圖像投影之后,又加入了移動(dòng)窗口配準(zhǔn)的方式,精確確定字符的位置;該移動(dòng)窗口配準(zhǔn) 的方式,即通過(guò)設(shè)置固定窗口的方式,例如類似窗口模板方式等,縮小號(hào)碼區(qū)域,實(shí)現(xiàn)更精 準(zhǔn)的區(qū)域定位,而所有通過(guò)設(shè)置固定窗口滑動(dòng)匹配的方式,均能夠適用于本申請(qǐng)之中;
[0011] 步驟4、對(duì)所述每個(gè)號(hào)碼的圖像中包含的字符進(jìn)行套緊,并對(duì)每個(gè)號(hào)碼圖像進(jìn)行歸 一化處理,所述歸一化包含尺寸歸一化和明暗歸一化;字符的套緊操作,是在步驟3的基礎(chǔ) 上,對(duì)分割出大致位置的字符,再次進(jìn)行詳細(xì)定位,以進(jìn)一步減少后續(xù)圖像識(shí)別要處理的數(shù) 據(jù)量,這大大保證了系統(tǒng)的整體運(yùn)行速度;
[0012] 步驟5、采用神經(jīng)網(wǎng)絡(luò)對(duì)歸一化后的號(hào)碼圖像進(jìn)行識(shí)別,獲得冠字號(hào)碼。
[0013] 優(yōu)選地,所述步驟1中的邊緣檢測(cè)進(jìn)一步包括:設(shè)定一灰度閾值,依據(jù)該閾值從上、 下兩方向進(jìn)行直線搜索,獲取邊緣,這一邊緣檢測(cè),采用直線掃面的方式,獲取邊緣直線的 像素坐標(biāo);再通過(guò)最小二乘法,獲得圖像的邊緣直線方程,并同時(shí)獲得紙幣圖像的水平長(zhǎng) 度、垂直長(zhǎng)度和斜率。
[0014] 優(yōu)選地,所述步驟2中的旋轉(zhuǎn),進(jìn)一步包括:基于所述水平長(zhǎng)度、垂直長(zhǎng)度和斜率, 獲得旋轉(zhuǎn)矩陣,依據(jù)所述旋轉(zhuǎn)矩陣,求取旋轉(zhuǎn)后的像素點(diǎn)坐標(biāo)。所述旋轉(zhuǎn)矩陣,可以通過(guò)極 坐標(biāo)轉(zhuǎn)換的方式獲得,即極坐標(biāo)轉(zhuǎn)換矩陣,例如可以通過(guò)獲取到的邊緣的直線方程,得到紙 幣的傾斜角度,依據(jù)該角度以及邊緣的長(zhǎng)度,計(jì)算各像素點(diǎn)的極坐標(biāo)轉(zhuǎn)換矩陣;也可以通過(guò) 普通的坐標(biāo)轉(zhuǎn)換方式計(jì)算,例如依據(jù)該傾斜角度和邊緣長(zhǎng)度,將紙幣的中心點(diǎn)設(shè)定為坐標(biāo) 原點(diǎn),計(jì)算每個(gè)坐標(biāo)點(diǎn)的在新坐標(biāo)系中的轉(zhuǎn)換矩陣等;當(dāng)然,也可以采用其他的矩陣變換法 方式進(jìn)行紙幣圖像的旋轉(zhuǎn)糾正。
[0015] 優(yōu)選地,所述步驟3中,所述通過(guò)自適應(yīng)二值化對(duì)圖像進(jìn)行二值化處理,具體包括: 求取圖像的直方圖,設(shè)置一閾值Th,當(dāng)直方圖中灰度值由0到Th的點(diǎn)數(shù)和大于等于一預(yù)設(shè)值 時(shí),以此時(shí)的Th作為自適應(yīng)二值化閾值,對(duì)圖像進(jìn)行二值化,獲得二值化圖像。
[0016] 優(yōu)選地,所述對(duì)所述二值化圖像進(jìn)行投影,共進(jìn)行三次不同方向投影。
[0017] 優(yōu)選地,所述步驟3中的移動(dòng)窗口配準(zhǔn)具體包括:設(shè)計(jì)配準(zhǔn)用移動(dòng)窗口,所述窗口 在垂直投影圖上水平移動(dòng),窗口內(nèi)的黑點(diǎn)數(shù)總和最小值所對(duì)應(yīng)的位置,即為冠字號(hào)碼左右 方向分割的最佳位置。
[0018] 優(yōu)選地,所述窗口為間隔固定的一脈沖序列,脈沖之間的寬度由冠字號(hào)碼圖像之 間的間隔預(yù)先設(shè)置。
[0019] 優(yōu)選地,每個(gè)所述脈沖的寬度為2-10個(gè)像素。
[0020] 優(yōu)選地,所述步驟4中的套緊,具體包括:對(duì)所述每個(gè)號(hào)碼的圖像單獨(dú)進(jìn)行二值化, 對(duì)獲取到的每個(gè)號(hào)碼的二值化圖像進(jìn)行區(qū)域增長(zhǎng),最后,再對(duì)區(qū)域增長(zhǎng)后得到的區(qū)域里,選 取一個(gè)或兩個(gè)面積大于某一預(yù)設(shè)面積閾值的區(qū)域,該些選取后的區(qū)域所在的矩形即為每個(gè) 號(hào)碼圖像套緊后的矩形。該區(qū)域增長(zhǎng)可以采用例如八鄰域區(qū)域增長(zhǎng)算法等。
[0021] 優(yōu)選地,對(duì)所述每個(gè)號(hào)碼的圖像單獨(dú)進(jìn)行二值化,具體包含:對(duì)所述每個(gè)號(hào)碼的圖 像提取直方圖,采用直方圖雙峰法獲取二值化閾值,再依據(jù)該二值化閾值將所述每個(gè)號(hào)碼 的圖像進(jìn)行二值化。
[0022] 優(yōu)選地,所述步驟4中的尺寸歸一化采用雙線性插值算法進(jìn)行尺寸歸一化。
[0023] 更為優(yōu)選地,歸一化后的尺寸為下述中的一個(gè):12*12、14*14、18*18、28*28,單位 為像素。
[0024] 優(yōu)選地,所述步驟4中的所述明暗歸一化包括:獲取所述每個(gè)號(hào)碼的圖像的直方 圖,計(jì)算號(hào)碼前景灰度平均值和背景灰度平均值,并將明暗歸一化之前的像素灰度值分別 與前景灰度平均值和背景灰度平均值進(jìn)行比較,依據(jù)該比較結(jié)果,將歸一化之前的像素灰 度值設(shè)置為對(duì)應(yīng)的特定灰度值。
[0025] 優(yōu)選地,在所述步驟2、步驟3之間,進(jìn)一步包括面向判斷步驟:通過(guò)所述旋轉(zhuǎn)后的 圖像確定紙幣尺寸,依據(jù)所述尺寸確定面值;將目標(biāo)紙幣圖像分割為η個(gè)區(qū)塊,計(jì)算各區(qū)塊 中的亮度均值,與預(yù)先存儲(chǔ)的模板比較,差值最小時(shí),判斷為模板對(duì)應(yīng)的面向。該模板可以 通過(guò)多種方式進(jìn)行預(yù)先設(shè)置,只要能夠通過(guò)紙幣圖像的對(duì)比,例如面額不同,朝向不同而引 起的亮度值差別、顏色差別,或其他能夠轉(zhuǎn)換為亮度數(shù)值的其他特征等等,均能夠作為比較 模板使用。
[0026] 優(yōu)選地,所述預(yù)先存儲(chǔ)的模板,是將不同面值紙幣的不同面向的圖像,分割為η個(gè) 區(qū)塊,并計(jì)算各區(qū)塊中的亮度均值,作為模板。
[0027] 優(yōu)選地,在所述步驟2、步驟3之間,進(jìn)一步包括新舊程度判斷步驟:首先提取預(yù)設(shè) 數(shù)量dpi的圖像,將該圖像全部區(qū)域作為直方圖的特征區(qū)域,掃描區(qū)域內(nèi)的像素點(diǎn),放在數(shù) 組里,記錄各個(gè)像素點(diǎn)的直方圖,根據(jù)直方圖統(tǒng)計(jì)出一定比例的最亮像素點(diǎn),求取該些最亮 像素點(diǎn)的平均灰度值,作為新舊程度判斷依據(jù)。這一預(yù)設(shè)數(shù)量dpi圖像,可以是例如25dpi圖 像等,該一定比例,可以根據(jù)具體需要進(jìn)行調(diào)整,可以是例如40%、50%等等。
[0028] 優(yōu)選地,在所述步驟2、步驟3之間,進(jìn)一步包括破損識(shí)別步驟:通過(guò)在紙幣兩側(cè)分 別設(shè)置光源和傳感器,獲取透射后圖像;對(duì)旋轉(zhuǎn)后的透射后圖像逐點(diǎn)檢測(cè),當(dāng)該點(diǎn)的相鄰兩 像素點(diǎn)同時(shí)小于一預(yù)設(shè)閾值時(shí),則判斷該點(diǎn)為破損點(diǎn)。該破損點(diǎn)的檢測(cè),可以更詳細(xì)地分為 缺角破損、孔洞破損等等。
[0029] 優(yōu)選地,在所述步驟2、步驟3之間,進(jìn)一步包括字跡識(shí)別步驟:在固定區(qū)域內(nèi),掃描 區(qū)域內(nèi)的像素點(diǎn),放在數(shù)組里,記錄各個(gè)像素點(diǎn)的直方圖,根據(jù)直方圖統(tǒng)計(jì)出預(yù)設(shè)數(shù)量個(gè)最 亮像素點(diǎn),求取平均灰度值,依據(jù)該平均灰度值得出閾值,灰度值小于閾值的像素點(diǎn)判定為 字跡點(diǎn)。該預(yù)設(shè)數(shù)量可以是例如20、30等,此處并不以此為保護(hù)范圍的限定理解;該依據(jù)平 均灰度值得出閾值,可以采用多種方法,可以該平均灰度值直接作為閾值,也可以采用以該 平均灰度值作為變量的函數(shù),求解出閾值。
[0030]優(yōu)選地,所述步驟5中的神經(jīng)網(wǎng)絡(luò)采用二級(jí)分類的卷積神經(jīng)網(wǎng)絡(luò);第一級(jí)分類將冠 字號(hào)碼涉及的所有數(shù)字和字母進(jìn)行分類,第二級(jí)分類分別對(duì)第一級(jí)分類中的部分類進(jìn)行細(xì) 分類。此處需要說(shuō)明的是,該第一級(jí)分類的類別數(shù)量可以根據(jù)分類需要和設(shè)置習(xí)慣等進(jìn)行 設(shè)置,可以是例如10類、23類、38類等,此處不以此為限,而該第二級(jí)分類同樣,是在第一級(jí) 分類的基礎(chǔ)上,針對(duì)部分容易誤判、特征近似或準(zhǔn)確率不高等的分類中,再次進(jìn)行二級(jí)分 類,從而以更高的識(shí)別率將冠字號(hào)碼進(jìn)一步區(qū)分識(shí)別,而該第二級(jí)分類的具體輸入類別數(shù) 量以及輸出類別數(shù)量,則可以根據(jù)第一級(jí)分類的類別設(shè)置以及分類需要和設(shè)置習(xí)慣等,進(jìn) 行詳細(xì)設(shè)定,此處并不以此為限。
[0031 ]優(yōu)選地,所述卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型結(jié)構(gòu)依次設(shè)置如下:
[0032]輸入層:僅以一個(gè)圖像作為視覺(jué)輸入,所述圖像為待識(shí)別的單個(gè)冠字號(hào)碼的灰度 圖像;
[0033] Cl層:是一個(gè)卷積層,該層由6個(gè)特征圖構(gòu)成;
[0034] S2層:為下采樣層,利用圖像局部相關(guān)性原理,對(duì)圖像進(jìn)行子抽樣;
[0035] C3層:是一個(gè)卷積層,采用預(yù)設(shè)卷積核去卷積層S2,C3層中的每個(gè)特征圖采用不全 連接的方式連接到S2中;
[0036] S4層:為下采樣層,利用圖像局部相關(guān)性原理,對(duì)圖像進(jìn)行子抽樣;
[0037] C5層:C5層是S4層的簡(jiǎn)單拉伸,變成一維向量;
[0038]網(wǎng)絡(luò)的輸出個(gè)數(shù)為分類個(gè)數(shù),與C5層組成全連接結(jié)構(gòu)。
[0039]優(yōu)選地,所述Cl層、C3層均通過(guò)3x3的卷積核進(jìn)行卷積。
[0040]此外,本發(fā)明還提供了一種能夠適用于DSP平臺(tái)的冠字號(hào)碼的識(shí)別系統(tǒng),可以嵌入 或聯(lián)接到市面上常規(guī)的驗(yàn)鈔機(jī)、點(diǎn)鈔機(jī)、ATM等設(shè)備結(jié)合使用,具體而言,所述系統(tǒng)包括:圖 像預(yù)處理模塊、處理器模塊、Cl S圖像傳感器模塊;
[0041 ]所述圖像預(yù)處理模塊進(jìn)一步包括邊緣檢測(cè)模塊、旋轉(zhuǎn)模塊;
[0042]所述處理器模塊進(jìn)一步包括號(hào)碼定位模塊、套緊模塊、歸一化模塊、識(shí)別模塊; [0043]所述號(hào)碼定位模塊,通過(guò)自適應(yīng)二值化,對(duì)圖像進(jìn)行二值化處理,獲得二值化圖 像;然后對(duì)所述二值化圖像進(jìn)行投影;最后通過(guò)設(shè)置移動(dòng)窗口,采用移動(dòng)窗口配準(zhǔn)的方式, 對(duì)號(hào)碼進(jìn)行分割,得到每個(gè)號(hào)碼的圖像,并將所述每個(gè)號(hào)碼的圖像傳輸給套緊模塊;該移動(dòng) 窗口配準(zhǔn)的方式,即通過(guò)設(shè)置固定窗口的方式,例如類似窗口模板方式等,縮小號(hào)碼區(qū)域, 實(shí)現(xiàn)更精準(zhǔn)的區(qū)域定位,而所有通過(guò)設(shè)置固定窗口滑動(dòng)匹配的方式,均能夠適用于本申請(qǐng) 之中。
[0044] 所述歸一化模塊用于對(duì)套緊模塊處理后的圖像進(jìn)行尺寸歸一化及明暗歸一化。
[0045] 優(yōu)選地,所述號(hào)碼定位模塊進(jìn)一步包括窗口模塊,所述窗口模塊依據(jù)冠字號(hào)碼間 距,設(shè)計(jì)配準(zhǔn)用移動(dòng)窗口,將所述窗口在垂直投影圖上水平移動(dòng),并計(jì)算所述窗口內(nèi)的黑點(diǎn) 數(shù)總和;
[0046] 所述窗口模塊還可以將不同窗口內(nèi)的所述黑點(diǎn)數(shù)總和進(jìn)行比較。
[0047] 優(yōu)選地,所述套緊模塊對(duì)每個(gè)號(hào)碼的圖像單獨(dú)進(jìn)行二值化,對(duì)獲取到的每個(gè)號(hào)碼 的二值化圖像進(jìn)行區(qū)域增長(zhǎng),最后,再對(duì)區(qū)域增長(zhǎng)后得到的區(qū)域里,選取一個(gè)或兩個(gè)面積大 于某一預(yù)設(shè)面積閾值的區(qū)域,該些選取后的區(qū)域所在的矩形即為每個(gè)號(hào)碼圖像套緊后的矩 形。該區(qū)域增長(zhǎng)可以采用例如八鄰域區(qū)域增長(zhǎng)算法等。
[0048] 優(yōu)選地,對(duì)所述每個(gè)號(hào)碼的圖像單獨(dú)進(jìn)行二值化,具體包含:對(duì)所述每個(gè)號(hào)碼的圖 像提取直方圖,采用直方圖雙峰法獲取二值化閾值,再依據(jù)該二值化閾值將所述每個(gè)號(hào)碼 的圖像進(jìn)行二值化。
[0049] 優(yōu)選地,所述系統(tǒng)還包括補(bǔ)償模塊,用于對(duì)CIS圖像傳感器模塊獲得的圖像進(jìn)行補(bǔ) 償,所述補(bǔ)償模塊預(yù)先存儲(chǔ)純白及純黑的采集亮度數(shù)據(jù),并結(jié)合可設(shè)定的像素點(diǎn)的灰度參 考值,得到補(bǔ)償系數(shù);
[0050] 所述補(bǔ)償系數(shù)存儲(chǔ)至處理器模塊,并建立查找表。
[0051] 優(yōu)選地,所述識(shí)別模塊利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)冠字號(hào)碼的識(shí)別。
[0052]優(yōu)選地,所述神經(jīng)網(wǎng)絡(luò)采用二級(jí)分類的卷積神經(jīng)網(wǎng)絡(luò);第一級(jí)分類將冠字號(hào)碼涉 及的所有數(shù)字和字母進(jìn)行分類,第二級(jí)分類分別對(duì)第一級(jí)分類中的部分類進(jìn)行細(xì)分類。此 處需要說(shuō)明的是,該第一級(jí)分類的類別數(shù)量可以根據(jù)分類需要和設(shè)置習(xí)慣等進(jìn)行設(shè)置,可 以是例如10類、23類、38類等,此處不以此為限,而該第二級(jí)分類同樣,是在第一級(jí)分類的基 礎(chǔ)上,針對(duì)部分容易誤判、特征近似或準(zhǔn)確率不高等的分類中,再次進(jìn)行二級(jí)分類,從而以 更高的識(shí)別率將冠字號(hào)碼進(jìn)一步區(qū)分識(shí)別,而該第二級(jí)分類的具體輸入類別數(shù)量以及輸出 類別數(shù)量,則可以根據(jù)第一級(jí)分類的類別設(shè)置以及分類需要和設(shè)置習(xí)慣等,進(jìn)行詳細(xì)設(shè)定, 此處并不以此為限。
[0053]優(yōu)選地,所述卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型結(jié)構(gòu)依次設(shè)置如下:
[0054]輸入層:僅以一個(gè)圖像作為視覺(jué)輸入,所述圖像為待識(shí)別的單個(gè)冠字號(hào)碼的灰度 圖像;
[0055 ] Cl層:是一個(gè)卷積層,該層由6個(gè)特征圖構(gòu)成;
[0056] S2層:為下采樣層,利用圖像局部相關(guān)性原理,對(duì)圖像進(jìn)行子抽樣;
[0057] C3層:是一個(gè)卷積層,采用預(yù)設(shè)卷積核去卷積層S2,C3層中的每個(gè)特征圖采用不全 連接的方式連接到S2中;
[0058] S4層:為下采樣層,利用圖像局部相關(guān)性原理,對(duì)圖像進(jìn)行子抽樣;
[0059] C5層:C5層是S4層的簡(jiǎn)單拉伸,變成一維向量;
[0060]網(wǎng)絡(luò)的輸出個(gè)數(shù)為分類個(gè)數(shù),與C5層組成全連接結(jié)構(gòu)。
[0061] 優(yōu)選地,所述Cl層、C3層均通過(guò)3x3的卷積核進(jìn)行卷積。
[0062] 優(yōu)選地,所述識(shí)別模塊還包括神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊,用于訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)。
[0063]優(yōu)選地,該處理器模塊可以采用例如FPGA等芯片系統(tǒng)。
[0064]優(yōu)選地,所述處理器模塊還包括:面向判斷模塊,用于判斷紙幣的朝向。
[0065]優(yōu)選地,所述處理器模塊還包括新舊程度判斷模塊,用于判斷紙幣的新舊程度。 [0066]優(yōu)選地,所述處理器模塊還包括破損識(shí)別模塊,用于將紙幣中的破損位置識(shí)別出 來(lái)。該破損包括缺角、孔洞等等。
[0067]優(yōu)選地,所述處理器模塊還包括字跡識(shí)別模塊,用于識(shí)別紙幣上的字跡。
[0068]本發(fā)明的上述技術(shù)方案的有益效果如下:
[0069] 1、在保證了整體方法及系統(tǒng)運(yùn)行的速度的情況下,提高了方法的魯棒性,能夠很 好地應(yīng)付實(shí)際應(yīng)用中,由于紙幣污損、殘缺、快速翻折等對(duì)冠字號(hào)碼識(shí)別帶來(lái)的識(shí)別困難;
[0070] 2、本發(fā)明提供的方法占用系統(tǒng)資源少,比現(xiàn)有技術(shù)中的常規(guī)算法運(yùn)算速度快,能 夠很好地與ATM、驗(yàn)鈔機(jī)等設(shè)備結(jié)合使用。
【附圖說(shuō)明】
[0071] 圖1為本發(fā)明實(shí)施例的識(shí)別方法示意圖;
[0072] 圖2為本發(fā)明實(shí)施例的邊緣檢測(cè)方法示意圖;
[0073] 圖3為本發(fā)明實(shí)施例的走鈔過(guò)程中的紙幣圖像與實(shí)際紙幣示意圖;
[0074] 圖4為本發(fā)明實(shí)施例的紙幣任意點(diǎn)旋轉(zhuǎn)的示意圖;
[0075] 圖5為本發(fā)明實(shí)施例的移動(dòng)窗口設(shè)置示意圖;
[0076] 圖6為本發(fā)明實(shí)施例的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0077] 為使本發(fā)明要解決的技術(shù)問(wèn)題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具 體實(shí)施例進(jìn)行詳細(xì)描述。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)知曉,下述具體實(shí)施例或【具體實(shí)施方式】,是本 發(fā)明為進(jìn)一步解釋具體的
【發(fā)明內(nèi)容】
而列舉的一系列優(yōu)化的設(shè)置方式,而該些設(shè)置方式之間 均是可以相互結(jié)合或者相互關(guān)聯(lián)使用的,除非在本發(fā)明明確提出了其中某些或某一具體實(shí) 施例或?qū)嵤┓绞綗o(wú)法與其他的實(shí)施例或?qū)嵤┓绞竭M(jìn)行關(guān)聯(lián)設(shè)置或共同使用。同時(shí),下述的 具體實(shí)施例或?qū)嵤┓绞絻H作為最優(yōu)化的設(shè)置方式,而不作為限定本發(fā)明的保護(hù)范圍的理 解。
[0078] 此外,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)了解,一下【具體實(shí)施方式】及實(shí)施例中所列舉出來(lái)的對(duì) 于參數(shù)設(shè)定的具體數(shù)值,是作舉例解釋用,作為一可選的實(shí)施方式,而不應(yīng)當(dāng)理解為對(duì)本發(fā) 明保護(hù)范圍的限定;而其中涉及到的各算法及其參數(shù)的設(shè)定,也僅作為距離解釋用,而對(duì)下 述參數(shù)的形式變換以及對(duì)下述算法的常規(guī)數(shù)學(xué)推導(dǎo),均應(yīng)視為落入本發(fā)明的保護(hù)范圍之 內(nèi)。
[0079] 實(shí)施例1:
[0080] 在一個(gè)具體的實(shí)施例中,本發(fā)明提供了一種冠字號(hào)碼的識(shí)別方法,如圖1所示,所 述方法包括以下步驟:
[0081] 步驟1、提取冠字號(hào)碼所在區(qū)域的灰度圖像,并對(duì)灰度圖像進(jìn)行邊緣檢測(cè);該邊緣 檢測(cè),可以通過(guò)常規(guī)的canny檢測(cè)、sobel檢測(cè)等方式實(shí)現(xiàn),再結(jié)合直線擬合,獲得邊緣直線 方程,但需要對(duì)邊緣檢測(cè)時(shí)的經(jīng)驗(yàn)閾值進(jìn)行試驗(yàn)設(shè)定,以保證方法的運(yùn)算速度。
[0082] 在一個(gè)具體的實(shí)施方式中,所述步驟1中的邊緣檢測(cè)進(jìn)一步包括:設(shè)定一灰度閾 值,依據(jù)該閾值從上、下兩方向進(jìn)行直線搜索,獲取邊緣,這一邊緣檢測(cè),采用直線掃面的方 式,獲取邊緣直線的像素坐標(biāo);再通過(guò)最小二乘法,獲得圖像的邊緣直線方程,并同時(shí)獲得 紙幣圖像的水平長(zhǎng)度、垂直長(zhǎng)度和斜率。
[0083] 在一個(gè)具體的實(shí)施方式中,如圖2所示,為保證邊緣檢測(cè)的準(zhǔn)確性和計(jì)算的速度, 可以采用閾值線性回歸分割技術(shù),計(jì)算速度快,不受圖像大小的限制,在其他的邊緣檢測(cè)理 論中,是需要對(duì)邊緣的每一個(gè)像素點(diǎn)都要計(jì)算的,這樣的話,圖像越大,計(jì)算時(shí)間越長(zhǎng)。而采 用閾值線性回歸分割技術(shù),只需要在上下邊緣上找到少量的像素點(diǎn),通過(guò)直線擬合的方式 可以很快速的確定邊緣的直線方程。無(wú)論圖像大或小都可以找少量的點(diǎn)來(lái)計(jì)算。
[0084] 具體而言,由于紙幣圖像的邊緣亮度與背景黑色差異很大,非常容易找到一個(gè)閾 值來(lái)區(qū)分紙幣和背景,因此這里采用直線搜索的方法從上、下兩個(gè)方向檢測(cè)紙幣邊緣。上、 下方向我們分別沿直線X= {xi},(i = l,2,···,n)搜索得到紙幣上邊沿Yi={yii},下邊沿Y2 = {y2i} 〇
[0085] 利用最小二乘法求出斜率kl,k2,截距bI,b2。求取上下沿中線的斜率K,截距B。已 知中線必然要經(jīng)過(guò)中點(diǎn)(幼,7〇),所以沿直線7 = 1(*計(jì)8
[0086]因此可以得到如下關(guān)系式:
[0087]
[0088]
[0089]
[0090]
[0091]
[0092]
[0093]
[0094]
[0095]
[0096] 由于紙幣的上沿、下沿中線y = K · x+B必然經(jīng)過(guò)紙幣的中點(diǎn)(XQ,yQ),所以沿直線y =K · x+B進(jìn)行搜索得到左端點(diǎn)(Xi,y 1)和右端點(diǎn)(xr,yr),最后可以得到紙幣圖像的中點(diǎn)為:
[0097] (1-6)
[0098] 得到紙幣中點(diǎn)之后,我們需要來(lái)求得紙幣的水平方向長(zhǎng)度L和垂直方向上的長(zhǎng)度 W,這樣在下節(jié)就可以建立紙幣的長(zhǎng)寬模型。因此有:
[0099] (1-7)
[0100] 然后我們?cè)谥本€y = yo附近取Y={yi},(i = l,2,…,m)進(jìn)行直線搜索得到紙幣左邊 沿X1 ={ X11}和右邊沿X2 ={ X21},因此有:
[0101]
[0102] 步驟2、對(duì)圖像進(jìn)行旋轉(zhuǎn);即將邊緣檢測(cè)后的紙幣的圖像進(jìn)行坐標(biāo)點(diǎn)糾正和映射, 以將圖像擺正,從而方便號(hào)碼圖像的分割和識(shí)別,該旋轉(zhuǎn)方法,可以采用坐標(biāo)點(diǎn)變換方法, 或者依據(jù)檢測(cè)出的邊緣方程進(jìn)行糾正,獲得變換方程,也可以以極坐標(biāo)旋轉(zhuǎn)等方式實(shí)現(xiàn);
[0103] 在一具體的實(shí)施方式中,所述步驟2中的旋轉(zhuǎn),進(jìn)一步包括:基于所述水平長(zhǎng)度、垂 直長(zhǎng)度和斜率,獲得旋轉(zhuǎn)矩陣,依據(jù)所述旋轉(zhuǎn)矩陣,求取旋轉(zhuǎn)后的像素點(diǎn)坐標(biāo)。所述旋轉(zhuǎn)矩 陣,可以通過(guò)極坐標(biāo)轉(zhuǎn)換的方式獲得,即極坐標(biāo)轉(zhuǎn)換矩陣,例如可以通過(guò)獲取到的邊緣的直 線方程,得到紙幣的傾斜角度,依據(jù)該角度以及邊緣的長(zhǎng)度,計(jì)算各像素點(diǎn)的極坐標(biāo)轉(zhuǎn)換矩 陣;也可以通過(guò)普通的坐標(biāo)轉(zhuǎn)換方式計(jì)算,例如依據(jù)該傾斜角度和邊緣長(zhǎng)度,將紙幣的中心 點(diǎn)設(shè)定為坐標(biāo)原點(diǎn),計(jì)算每個(gè)坐標(biāo)點(diǎn)的在新坐標(biāo)系中的轉(zhuǎn)換矩陣等;當(dāng)然,也可以采用其他 的矩陣變換法方式進(jìn)行紙幣圖像的旋轉(zhuǎn)糾正。
[0104] 在一具體的實(shí)施方式中,如圖3所示,可以采用直角坐標(biāo)變換的方式對(duì)圖像進(jìn)行旋 轉(zhuǎn)糾正,由于在圖像采集過(guò)程中水平方向上每毫米采集P個(gè)點(diǎn),垂直方向上每毫米采集q個(gè) 點(diǎn)。在之前的紙幣圖像邊緣檢測(cè)中我們已經(jīng)計(jì)算出了紙幣圖像的水平長(zhǎng)度AC = U垂直長(zhǎng)度 BE=W和斜率K。因此對(duì)紙幣圖像的幾何計(jì)算得到下邊的公式:
[0105] 由于
[0106]
[0107]
[0108]
[0109]
[0110]
[0111]
[0112]
[0113]
[0114]
[0115]
[0116]
[0117]
[0118]
[0119]同理:
[0120]
[0121]
[0122]
[0123]
[0124]
[0125] 紙幣圖像任意點(diǎn)的旋轉(zhuǎn),旋轉(zhuǎn)的整個(gè)過(guò)程是對(duì)任意給出的紙幣圖像上的某一點(diǎn)A (^ + ),找到點(diǎn)八對(duì)應(yīng)于實(shí)際紙幣的點(diǎn)4'(廣,7%),把點(diǎn)4'旋轉(zhuǎn)0角后得到點(diǎn)8'(1'(1,7' (1), 最后找到點(diǎn)B '對(duì)應(yīng)于旋轉(zhuǎn)后的紙幣圖像上的點(diǎn)B(Xd,yd)。
[0126] 結(jié)合圖4,紙幣上的任意點(diǎn)旋轉(zhuǎn)時(shí),
[0132 ]如有旋轉(zhuǎn)前的紙幣圖像中心為(XQ,yo),旋轉(zhuǎn)后的紙幣圖像中心為(Xe,yC),這樣可 得:
[0127]
[0128]
[0129]
[0130]
[0131]
[0133]
[0134] 步驟3、對(duì)圖像中的單個(gè)號(hào)碼進(jìn)行定位,具體包含:通過(guò)自適應(yīng)二值化,對(duì)圖像進(jìn)行 二值化處理,獲得二值化圖像;然后對(duì)所述二值化圖像進(jìn)行投影,常規(guī)的圖像投影僅通過(guò)一 次垂直投影和一次水平投影來(lái)完成,具體的投影方向和次數(shù),可以依據(jù)識(shí)別的具體環(huán)境及 精度要求做調(diào)整,例如還可以采用帶有傾斜角度方向的投影等,或者采用多次多重投影結(jié) 合;最后通過(guò)設(shè)置移動(dòng)窗口,采用移動(dòng)窗口配準(zhǔn)的方式,對(duì)號(hào)碼進(jìn)行分割,得到每個(gè)號(hào)碼的 圖像,由于紙幣的破損、臟污等常見(jiàn)問(wèn)題,對(duì)于冠字號(hào)碼圖像上有臟污,字符與字符之間存 在粘連的紙幣效果較差,尤其是對(duì)三個(gè)或三個(gè)以上字符的粘連,幾乎分割不開(kāi),因此,本發(fā) 明在圖像投影之后,又加入了移動(dòng)窗口配準(zhǔn)的方式,精確確定字符的位置;
[0135] 在一具體的實(shí)施方式中,所述步驟3中,所述通過(guò)自適應(yīng)二值化對(duì)圖像進(jìn)行二值化 處理,具體包括:求取圖像的直方圖,設(shè)置一閾值Th,當(dāng)直方圖中灰度值由0到Th的點(diǎn)數(shù)和大 于等于一預(yù)設(shè)值時(shí),以此時(shí)的Th作為自適應(yīng)二值化閾值,對(duì)圖像進(jìn)行二值化,獲得二值化圖 像;所述對(duì)所述二值化圖像進(jìn)行投影,共進(jìn)行三次不同方向投影。優(yōu)選地,所述設(shè)置移動(dòng)窗 口具體包括:所述窗口在垂直投影圖上水平移動(dòng),窗口內(nèi)的黑點(diǎn)數(shù)總和最小值所對(duì)應(yīng)的位 置,即為冠字號(hào)碼左右方向分割的最佳位置。
[0136] 在一具體的實(shí)施方式中,對(duì)圖像的二值化,可以采用整體自適應(yīng)二值化的方法。首 選,求圖像的直方圖,亮度較黑色的是冠字號(hào)碼區(qū)域,亮度較為白色的是背景區(qū)域。在直方 圖上求灰度值為〇到Th的點(diǎn)數(shù)和N,當(dāng)N> = 2200(經(jīng)驗(yàn)值)時(shí),所對(duì)應(yīng)的閾值Th即為自適應(yīng)二 值化的閾值。該方法的最大優(yōu)點(diǎn)是計(jì)算時(shí)間短,可以滿足清分機(jī)快速點(diǎn)鈔的實(shí)時(shí)性要求,并 且具有很好的自適應(yīng)性。
[0137] 在一具體的實(shí)施方式中,對(duì)二值化后的圖像進(jìn)行投影,可以采用三次投影結(jié)合的 方式,確定每個(gè)號(hào)碼所在的上下左右位置。其中,第一次進(jìn)行水平方向投影,確定號(hào)碼所在 的行,第二次進(jìn)行垂直方向投影,確定每個(gè)號(hào)碼所在的左右方向位置,第三次是對(duì)每個(gè)小圖 進(jìn)行水平方向投影,確定每個(gè)號(hào)碼所在的上下方向位置。
[0138] 在一具體的實(shí)施方式中,上述三次投影方法對(duì)于大多數(shù)紙幣的單個(gè)號(hào)碼分割都能 取得良好的效果,但是對(duì)于冠字號(hào)碼圖像上有臟污,字符與字符之間存在粘連的紙幣效果 較差,尤其是對(duì)三個(gè)或三個(gè)以上字符的粘連,幾乎分割不開(kāi)。為了克服這一困難,在一個(gè)具 體的實(shí)施方式中,可采用窗口移動(dòng)配準(zhǔn)法。因?yàn)榍宸謾C(jī)采集的冠字號(hào)碼大小分辨率固定,每 個(gè)字符大小固定,每個(gè)字符之間的間距也固定,窗口的設(shè)計(jì)可以根據(jù)紙幣上冠字號(hào)碼的間 距設(shè)計(jì),如圖5所示。窗口在垂直投影圖上水平移動(dòng),窗口內(nèi)的黑點(diǎn)數(shù)總和最小值所對(duì)應(yīng)的 位置,即為冠字號(hào)碼左右方向分割的最佳位置。由于該識(shí)別算法用在紙幣清分機(jī)上,準(zhǔn)確性 和快速性都要滿足,原始圖像的分辨率為200dpi。窗口的設(shè)計(jì)每個(gè)脈沖寬度為4個(gè)像素,脈 沖之間的寬度根據(jù)號(hào)碼圖像之間的間隔設(shè)計(jì),經(jīng)過(guò)測(cè)試,該方法完全能夠滿足紙幣清分機(jī) 實(shí)時(shí)性和準(zhǔn)確性要求。
[0139] 步驟4、對(duì)所述每個(gè)號(hào)碼的圖像中包含的字符進(jìn)行套緊,并對(duì)每個(gè)號(hào)碼圖像進(jìn)行歸 一化處理,所述歸一化包含尺寸歸一化和明暗歸一化;字符的套緊操作,是在步驟3的基礎(chǔ) 上,對(duì)分割出大致位置的字符,再次進(jìn)行詳細(xì)定位,以進(jìn)一步減少后續(xù)圖像識(shí)別要處理的數(shù) 據(jù)量,這大大保證了系統(tǒng)的整體運(yùn)行速度。
[0140] 三次投影法僅僅是對(duì)單個(gè)號(hào)碼的初步定位,對(duì)于很多臟污的單個(gè)號(hào)碼,都不能真 正的套緊。上面提到的二值化方法是對(duì)整個(gè)圖像做二值化,所計(jì)算得到的閾值并不適用于 單個(gè)字符的二值化。例如2005版人民幣一百元,前四個(gè)字符是紅色,后六個(gè)字符是黑色,這 會(huì)導(dǎo)致采集到的灰度圖像每個(gè)字符的明暗程度不均,在一具體的實(shí)施方式中,還可以對(duì)每 個(gè)小圖單獨(dú)進(jìn)行二值化。
[0141] 在一個(gè)具體的實(shí)施方式中,該二值化采用的是基于直方圖雙峰的自適應(yīng)二值化方 法。直方圖雙峰法是一種迭代法求閾值的方法。特點(diǎn):自適應(yīng),快速,準(zhǔn)確。具體的,可以采用 以下的一個(gè)優(yōu)選的實(shí)施方式來(lái)實(shí)現(xiàn):
[0142] 首先設(shè)定一個(gè)初始化閾值T'然后經(jīng)過(guò)K次迭代后得到二值化分割的閾值。K為大 于〇的正整數(shù),這里第k次迭代的背景灰度平均值和前景灰度平均值#分別為:
[014-
[01心
[014? [014d
[0147] 退出迭代的條件:當(dāng)?shù)螖?shù)足夠多(例如50次),或者兩次迭代計(jì)算的閾值結(jié)果 相同,即第k次和第k-Ι次的閾值相同,則退出迭代。
[0148] 二值化后,對(duì)每個(gè)小圖要進(jìn)行八鄰域區(qū)域增長(zhǎng)算法,目的是去除面積過(guò)小的噪聲 點(diǎn)。最后,在對(duì)每個(gè)小圖區(qū)域增長(zhǎng)后得到的區(qū)域里,選取一個(gè)或兩個(gè)面積大于某一個(gè)經(jīng)驗(yàn)值 的區(qū)域,這些區(qū)域所在的矩形即為每個(gè)號(hào)碼圖像套緊后的矩形。綜上,該套緊方法的步驟為 二值化,區(qū)域增長(zhǎng),區(qū)域選取,它的優(yōu)點(diǎn)是抗干擾性強(qiáng),計(jì)算速度快。
[0149] 在二值化之后,需要對(duì)圖像進(jìn)一步進(jìn)行歸一化處理,在一個(gè)具體的實(shí)施方式中,上 述歸一化可以采用如下方式:這里的歸一化是為了下一步的神經(jīng)網(wǎng)絡(luò)識(shí)別。考慮到計(jì)算速 度和準(zhǔn)確性的要求,尺寸歸一化時(shí)的圖像大小不能太大,也不能太小。太大,造成后續(xù)的神 經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)過(guò)多,計(jì)算速度慢,太小,信息損失過(guò)多。測(cè)試了幾種歸一化尺寸大小,28*28, 18* 18,14* 14,12* 12,最后選擇了 14* 14。歸一化的縮放算法采用雙線性插值算法。
[0150] 在一個(gè)具體的實(shí)施方式中,所述步驟4中歸一化處理具體包括:采用雙線性插值算 法進(jìn)行尺寸歸一化;所述明暗歸一化包括:獲取所述每個(gè)號(hào)碼的圖像的直方圖,計(jì)算號(hào)碼前 景灰度平均值和背景灰度平均值,并將明暗歸一化之前的像素灰度值分別與前景灰度平均 值和背景灰度平均值進(jìn)行比較,依據(jù)該比較結(jié)果,將歸一化之前的像素灰度值設(shè)置為對(duì)應(yīng) 的特定灰度值。
[0151] 在又一具體的實(shí)施方式中,為了減少訓(xùn)練模板數(shù)量,還必須進(jìn)行明暗程度的歸一 化。首先在每個(gè)小圖的直方圖上計(jì)算號(hào)碼前景灰度平均值G b,和背景灰度平均值Gf。設(shè),VOlj 為每個(gè)像素灰度歸一化之前的值,Vllj為每個(gè)像素灰度歸一化之后的值,計(jì)算方法如下。
[0152]
[0153] 步驟5、采用神經(jīng)網(wǎng)絡(luò)對(duì)歸一化后的號(hào)碼圖像進(jìn)行識(shí)別,獲得冠字號(hào)碼。
[0154] 在一個(gè)具體的實(shí)施方式中,上述神經(jīng)網(wǎng)絡(luò)可以采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)算法來(lái)實(shí) 現(xiàn)。
[0155] 卷積神經(jīng)網(wǎng)絡(luò)(C N N)在本質(zhì)上是一種輸入到輸出的映射,它能夠?qū)W習(xí)大量的輸入 與輸出之間的映射關(guān)系,而不需要任何輸入和輸出之間的精確的數(shù)學(xué)表達(dá)式,只要用已知 的模式對(duì)卷積網(wǎng)絡(luò)加以訓(xùn)練,網(wǎng)絡(luò)就具有輸入輸出對(duì)之間的映射能力。在CNN中,圖像的一 小部分(局部感受區(qū)域)作為層級(jí)結(jié)構(gòu)的最低層的輸入,信息再依次傳輸?shù)讲煌膶樱繉?通過(guò)一個(gè)數(shù)字濾波器去獲得觀測(cè)數(shù)據(jù)的最顯著的特征。這個(gè)方法能夠獲取對(duì)平移、縮放和 旋轉(zhuǎn)不變的觀測(cè)數(shù)據(jù)的顯著特征,因?yàn)閳D像的局部感受區(qū)域允許神經(jīng)元或者處理單元可以 訪問(wèn)到最基礎(chǔ)的特征,冠字號(hào)碼圖像上的主要特征是邊緣和角點(diǎn),因此非常適合采用CNN的 方法進(jìn)行識(shí)別。
[0156] 在一個(gè)具體的實(shí)施方式中,所述神經(jīng)網(wǎng)絡(luò)采用二級(jí)分類的卷積神經(jīng)網(wǎng)絡(luò);第一級(jí) 分類將冠字號(hào)碼涉及的所有數(shù)字和字母進(jìn)行分類,第二級(jí)分類分別對(duì)第一級(jí)分類中的部分 類進(jìn)行細(xì)分類。此處需要說(shuō)明的是,該第一級(jí)分類的類別數(shù)量可以根據(jù)分類需要和設(shè)置習(xí) 慣等進(jìn)行設(shè)置,可以是例如10類、23類、38類等,而該第二級(jí)分類同樣,是在第一級(jí)分類的基 礎(chǔ)上,針對(duì)部分容易誤判、特征近似或準(zhǔn)確率不高等的分類中,再次進(jìn)行二級(jí)分類,從而以 更高的識(shí)別率將冠字號(hào)碼進(jìn)一步區(qū)分識(shí)別,而該第二級(jí)分類的具體輸入類別數(shù)量以及輸出 類別數(shù)量,則可以根據(jù)第一級(jí)分類的類別設(shè)置以及分類需要和設(shè)置習(xí)慣等,進(jìn)行詳細(xì)設(shè)定。
[0157] 下面以一個(gè)優(yōu)選的實(shí)施方式,例舉可適用于本發(fā)明技術(shù)方案中的一個(gè)具體的卷積 (CNN)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及訓(xùn)練方式:
[0158] 一、CNN神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
[0159] 因?yàn)樾枰獙?duì)數(shù)字和字母混合識(shí)別,某些數(shù)字和字母非常相似,無(wú)法區(qū)分,人民幣沒(méi) 有字母V,字母0和數(shù)字0印刷完全一樣,所以,我們對(duì)冠字號(hào)碼的識(shí)別采用了二級(jí)分類的方 法。第一級(jí)分類把所有數(shù)字和字母歸為23類:
[0160] 第一類:A4
[0161] 第二類:B8
[0162] 第三類:CG6
[0163] 第四類:〇DQ
[0164] 第五類:ELF
[0165] 第六類:H
[0166] 第七類:K
[0167] 第八類:Μ
[0168] 第九類:Ν
[0169] 第十類:Ρ
[0170] 第^^一類:R
[0171] 第十二類:S5
[0172]第十三類:TJ( J為2005版及一切版本的人民幣)
[0173] 第十四類:U
[0174] 第十五類:W
[0175] 第十六類:χ
[0176] 第十七類:Y
[0177] 第十八:Ζ2
[0178] 第十九:1
[0179] 第二十類:3
[0180] 第二^^一類:7
[0181] 第二十二類:9
[0182]第二十三類:J(J為2015新版人民幣)
[0183] 第二級(jí)分類是分別對(duì) A4,B8,C6G,ODQ,ELF,S5,TJ,Z2的分類。
[0184] 以上的二級(jí)CNN分類方法涉及到9個(gè)神經(jīng)網(wǎng)絡(luò)的模型,分別記為:CNN_23,CNN_A4, CNN_B8,CNN_CG6,CNN_0DQ,CNN_ELF,CNN_S5,CNN_JT,CNN_Z2 〇
[0185] 以第一級(jí)分類的CNN神經(jīng)網(wǎng)絡(luò)為例,圖6是它的結(jié)構(gòu)示意圖。網(wǎng)絡(luò)的輸入層:只有一 個(gè)圖,相當(dāng)于網(wǎng)絡(luò)的視覺(jué)輸入,即為待識(shí)別的單個(gè)號(hào)碼灰度圖像。這里選用灰度圖像是為了 信息不丟失,因?yàn)槿绻麑?duì)二值化圖像進(jìn)行識(shí)別,則在二值化的過(guò)程中會(huì)損失一些圖像的邊 緣和細(xì)節(jié)信息。為了不受圖像明暗效果的影響,對(duì)每個(gè)灰度小圖的亮度進(jìn)行了歸一化處理, 即明暗歸一化。
[0186] Cl層是一個(gè)卷積層,卷積層存在的好處是通過(guò)卷積運(yùn)算,可以使原信號(hào)特征增強(qiáng), 并且降低噪音,由6個(gè)特征圖Feature Map構(gòu)成。特征圖中每個(gè)神經(jīng)元與輸入中3*3的鄰域相 連。特征圖的大小為14*14X1有156個(gè)可訓(xùn)練參數(shù)(每個(gè)濾波器5*5 = 25個(gè)unit參數(shù)和一個(gè) b ias參數(shù),一共6個(gè)濾波器,共(3*3+1) *6 = 60個(gè)參數(shù)),共60* (12*12 )= 8640個(gè)連接。
[0187] S2和S4層均為下采樣層,利用圖像局部相關(guān)性的原理,對(duì)圖像進(jìn)行子抽樣,可以減 少數(shù)據(jù)處理量同時(shí)保留有用信息。
[0188] C3層也是一個(gè)卷積層,它同樣通過(guò)3x3的卷積核去卷積層S2,然后得到的特征map 就只有4x4個(gè)神經(jīng)元,為了計(jì)算簡(jiǎn)單,僅僅設(shè)計(jì)了 6種不同的卷積核,所以就存在6個(gè)特征map 了。這里需要注意的一點(diǎn)是:C3中的每個(gè)特征map是連接到S2中并不是全連接的。為什么不 把S2中的每個(gè)特征圖連接到每個(gè)C3的特征圖呢?原因有二。其一,不完全的連接機(jī)制將連接 的數(shù)量保持在合理的范圍內(nèi)。其二,也是最重要的,其破壞了網(wǎng)絡(luò)的對(duì)稱性。由于不同的特 征圖有不同的輸入,所以迫使他們抽取不同的特征。這種非全連接結(jié)果的組成方式并不唯 一。例如,C3的前2個(gè)特征圖以S2中3個(gè)相鄰的特征圖子集為輸入,接下來(lái)2個(gè)特征圖以S2中4 個(gè)相鄰特征圖子集為輸入,然后的1個(gè)以不相鄰的3個(gè)特征圖子集為輸入,最后1個(gè)將S2中所 有特征圖為輸入。
[0189] 最后一組S層到C層不是下采樣,而是S層的簡(jiǎn)單拉伸,變成一維向量。網(wǎng)絡(luò)的輸出 個(gè)數(shù)為該神經(jīng)網(wǎng)絡(luò)的分類個(gè)數(shù),與最后一層組成全連接結(jié)構(gòu)。這里的CNN_23共有23個(gè)類別, 所以有23個(gè)輸出。
[0190] 二、神經(jīng)網(wǎng)絡(luò)的訓(xùn)練可以通過(guò)以下方式進(jìn)行:
[0191] 假設(shè)第1層為卷積層,第1+1層為下采樣層,則第1層第j個(gè)特征圖的計(jì)算公式如下:
[0192]
[0193] 其中,*號(hào)表示卷積,是卷積核k在第1-1層所有關(guān)聯(lián)的特征圖上做卷積運(yùn)算,然后 求和,再加上一個(gè)偏置參數(shù)b,取sigmoid函數(shù)
得到最終的激勵(lì)。
[0194] 第1層的第j個(gè)特征圖的殘差計(jì)算公式如下:
[0195]
[0196] 其中,其中第1層為卷積層,第1 + 1層為下采樣層,下采樣層與卷積層是一一對(duì)應(yīng) 的。其中up(X)是將第1+1層的大小擴(kuò)展為和第1層大小一樣。
[0197] 誤差對(duì)b的偏導(dǎo)數(shù)公式為:
[0198]
[0199]
[0200]
[0201]隨機(jī)選擇人民幣冠字號(hào)碼作為訓(xùn)練樣本,約10萬(wàn)個(gè),訓(xùn)練次數(shù)1000回以上,逼近的 精度小于0.004。
[0202] 在一具體的實(shí)施方式中,在所述步驟2、步驟3之間,進(jìn)一步包括面向判斷步驟:通 過(guò)所述旋轉(zhuǎn)后的圖像確定紙幣尺寸,依據(jù)所述尺寸確定面值;將目標(biāo)紙幣圖像分割為η個(gè)區(qū) 塊,計(jì)算各區(qū)塊中的亮度均值,與預(yù)先存儲(chǔ)的模板比較,差值最小時(shí),判斷為模板對(duì)應(yīng)的面 向;所述預(yù)先存儲(chǔ)的模板,是將不同面值紙幣的不同面向的圖像,分割為η個(gè)區(qū)塊,并計(jì)算各 區(qū)塊中的亮度均值,作為模板。
[0203] 具體而言,可通過(guò)紙幣尺寸檢測(cè)+模板匹配方式來(lái)確定紙幣的面向值。先通過(guò)紙幣 尺寸確定紙幣的面值。然后在確定紙幣的面向,在紙幣圖像內(nèi)部分割了 16*8個(gè)相同的矩形 塊,并計(jì)算出每個(gè)矩形塊內(nèi)的亮度均值,將這16*8個(gè)亮度均值數(shù)據(jù)置于存儲(chǔ)器中作為模板 數(shù)據(jù)。同理取得目標(biāo)紙幣的亮度均值,與模板數(shù)據(jù)做比較,找到差值最小的??纱_認(rèn)紙幣的 面向。
[0204]此外,在一具體的實(shí)施方式中,還可以加入紙幣新舊程度的判斷,首先提取25dpi 圖像,將25dpi圖像全部區(qū)域作為直方圖的特征區(qū)域,掃描區(qū)域內(nèi)的像素點(diǎn),放在數(shù)組里,記 錄各個(gè)像素點(diǎn)的直方圖,根據(jù)直方圖統(tǒng)計(jì)出50%最亮像素點(diǎn),求取平均灰度值,以該灰度值 作為新舊程度判斷的依據(jù)。
[0205] 在一個(gè)具體的實(shí)施方式中,在所述步驟2、步驟3之間,進(jìn)一步包括破損識(shí)別步驟: 通過(guò)在紙幣兩側(cè)分別設(shè)置光源和傳感器,獲取透射后圖像;對(duì)旋轉(zhuǎn)后的透射后圖像逐點(diǎn)檢 測(cè),當(dāng)該點(diǎn)的相鄰兩像素點(diǎn)同時(shí)小于一預(yù)設(shè)閾值時(shí),則判斷該點(diǎn)為破損點(diǎn)。
[0206] 在【具體實(shí)施方式】中,紙幣破損識(shí)別時(shí)采用的是發(fā)光源和傳感器分布在紙幣的兩 偵I即透射方式。發(fā)光源遇到紙幣僅有少部分光線能夠穿透紙幣打到傳感器件上,而沒(méi)有遇 到紙幣的光線完全打到了傳感器件上。因此背景為白色,紙幣也為灰度圖。破損包含缺角和 孔洞。缺角和孔洞的檢測(cè)都是應(yīng)用破損識(shí)別技術(shù)的,不同的是檢測(cè)的區(qū)域不同,缺角檢測(cè)的 是紙幣的四個(gè)角,孔洞是檢測(cè)紙幣的中間區(qū)域。
[0207] 在又一具體的實(shí)施方式中,對(duì)于紙幣缺角,可分別在旋轉(zhuǎn)完的透射紙幣圖像上分 成左上、左下、右上、右下,四個(gè)區(qū)域。然后分別對(duì)這四個(gè)區(qū)域逐點(diǎn)檢測(cè),相鄰兩個(gè)像素點(diǎn)同 時(shí)小于閾值,則判斷此點(diǎn)為破損點(diǎn),如果相鄰兩點(diǎn)不滿足小于閾值的條件,則表明該交點(diǎn)對(duì) 應(yīng)的角不具有破損特征。
[0208] 對(duì)于紙幣上的孔洞檢測(cè),在搜索完了紙幣的缺角之后,由于缺角的位置已經(jīng)被黑 色填充了,如果紙幣上有缺角和孔洞特征,那么這個(gè)像素點(diǎn)是白色的,在搜索紙幣的過(guò)程 中,把確定是缺角的點(diǎn)的像素值改為黑色的像素值,這樣就實(shí)現(xiàn)了填充。所以再以紙幣的四 邊為邊界搜索整張紙幣。如果搜索到紙幣具有破損特征,則表明紙幣具有孔洞,否則此紙幣 沒(méi)有孔洞。當(dāng)每搜索到一個(gè)小于閾值的像素點(diǎn)時(shí),孔洞面積將加1。搜索結(jié)束后最終將得到 孔洞的面積。
[0209] 在又一具體的實(shí)施方式中,對(duì)于字跡的檢測(cè),可采用以下方式:在固定區(qū)域內(nèi),掃 描區(qū)域內(nèi)的像素點(diǎn),放在數(shù)組里,記錄各個(gè)像素點(diǎn)的直方圖,根據(jù)直方圖統(tǒng)計(jì)出20個(gè)最亮像 素點(diǎn),求取平均灰度值,計(jì)算得出閾值。小于閾值的像素點(diǎn)判定為字跡+1。
[0210] 實(shí)施例2:
[0211] 此外,在一個(gè)具體的實(shí)施例中,本發(fā)明還提供了一種能夠適用于DSP平臺(tái)的冠字號(hào) 碼的識(shí)別系統(tǒng),可以嵌入或聯(lián)接到市面上常規(guī)的驗(yàn)鈔機(jī)、點(diǎn)鈔機(jī)、ATM等設(shè)備結(jié)合使用,具體 而言,所述系統(tǒng)包括:圖像預(yù)處理模塊、處理器模塊、CIS圖像傳感器模塊;
[0212] 所述圖像預(yù)處理模塊進(jìn)一步包括邊緣檢測(cè)模塊、旋轉(zhuǎn)模塊;
[0213] 所述處理器模塊進(jìn)一步包括號(hào)碼定位模塊、套緊模塊、歸一化模塊、識(shí)別模塊; [0214]所述號(hào)碼定位模塊,通過(guò)自適應(yīng)二值化,對(duì)圖像進(jìn)行二值化處理,獲得二值化圖 像;然后對(duì)所述二值化圖像進(jìn)行投影;最后通過(guò)設(shè)置移動(dòng)窗口,采用移動(dòng)窗口配準(zhǔn)的方式, 對(duì)號(hào)碼進(jìn)行分割,得到每個(gè)號(hào)碼的圖像,并將所述每個(gè)號(hào)碼的圖像傳輸給套緊模塊;
[0215]所述歸一化模塊用于對(duì)套緊模塊處理后的圖像進(jìn)行尺寸歸一化及明暗歸一化。
[0216] 在一個(gè)具體的實(shí)施方式中,所述號(hào)碼定位模塊進(jìn)一步包括窗口模塊,所述窗口模 塊依據(jù)冠字號(hào)碼間距,設(shè)計(jì)配準(zhǔn)用移動(dòng)窗口,將所述窗口在垂直投影圖上水平移動(dòng),并計(jì)算 所述窗口內(nèi)的黑點(diǎn)數(shù)總和;所述窗口模塊還可以將不同窗口內(nèi)的所述黑點(diǎn)數(shù)總和進(jìn)行比 較。該定位的具體方式,可以采用實(shí)施例1中的方法進(jìn)行。
[0217] 在又一具體的實(shí)施方式中,所述套緊模塊對(duì)每個(gè)號(hào)碼的圖像提取直方圖,采用直 方圖雙峰法獲取二值化閾值,再依據(jù)該二值化閾值將所述每個(gè)號(hào)碼的圖像進(jìn)行二值化,對(duì) 獲取到的每個(gè)號(hào)碼的二值化圖像進(jìn)行區(qū)域增長(zhǎng),最后,再對(duì)區(qū)域增長(zhǎng)后得到的區(qū)域里,選取 一個(gè)或兩個(gè)面積大于某一預(yù)設(shè)面積閾值的區(qū)域,該些選取后的區(qū)域所在的矩形即為每個(gè)號(hào) 碼圖像套緊后的矩形。該區(qū)域增長(zhǎng)可以采用例如八鄰域區(qū)域增長(zhǎng)算法等。
[0218] 在一個(gè)具體的實(shí)施方式中,由于常規(guī)的紙幣圖像獲取中,紙幣的新舊、殘損等狀況 不一,所以需要對(duì)紙幣圖像進(jìn)行補(bǔ)償,則可以在所述系統(tǒng)中設(shè)置補(bǔ)償模塊,用于對(duì)CIS圖像 傳感器模塊獲得的圖像進(jìn)行補(bǔ)償,所述補(bǔ)償模塊預(yù)先存儲(chǔ)純白及純黑的采集亮度數(shù)據(jù),并 結(jié)合可設(shè)定的像素點(diǎn)的灰度參考值,得到補(bǔ)償系數(shù);所述補(bǔ)償系數(shù)存儲(chǔ)至處理器模塊,并建 立查找表。
[0219] 具體而言,將白紙壓在CIS圖像傳感器上,采集亮電平數(shù)據(jù)存儲(chǔ)在CISVL[i]數(shù)組 里,在采集暗電平數(shù)據(jù)存儲(chǔ)在CISDK[i]里,通過(guò)公式
[0220] CVLMAX/ (CISVL[ i ] -CI SDK [ i ])
[0221] 取得補(bǔ)償系數(shù)。其中CVLMAX為可設(shè)定的像素點(diǎn)灰度參考值,按照經(jīng)驗(yàn),白紙的灰度 值設(shè)置為200。
[0222]將DSP芯片計(jì)算得出的補(bǔ)償系數(shù),傳送到FPGA(處理模塊)的隨機(jī)存儲(chǔ)器里,形成一 個(gè)查找表。之后FPGA芯片對(duì)采集到的像素點(diǎn)數(shù)據(jù)乘以查找表中對(duì)應(yīng)像素點(diǎn)的補(bǔ)償系數(shù),直 接得到補(bǔ)償后的數(shù)據(jù),再傳送給DSP。
[0223] 在一具體的實(shí)施方式中,所述識(shí)別模塊利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)冠字號(hào)碼的識(shí) 別。
[0224] 在一個(gè)具體的實(shí)施方式中,所述神經(jīng)網(wǎng)絡(luò)采用二級(jí)分類的卷積神經(jīng)網(wǎng)絡(luò);第一級(jí) 分類將冠字號(hào)碼涉及的所有數(shù)字和字母進(jìn)行分類,第二級(jí)分類分別對(duì)第一級(jí)分類中的部分 類進(jìn)行細(xì)分類。此處需要說(shuō)明的是,該第一級(jí)分類的類別數(shù)量可以根據(jù)分類需要和設(shè)置習(xí) 慣等進(jìn)行設(shè)置,可以是例如10類、23類、38類等,而該第二級(jí)分類同樣,是在第一級(jí)分類的基 礎(chǔ)上,針對(duì)部分容易誤判、特征近似或準(zhǔn)確率不高等的分類中,再次進(jìn)行二級(jí)分類,從而以 更高的識(shí)別率將冠字號(hào)碼進(jìn)一步區(qū)分識(shí)別,而該第二級(jí)分類的具體輸入類別數(shù)量以及輸出 類別數(shù)量,則可以根據(jù)第一級(jí)分類的類別設(shè)置以及分類需要和設(shè)置習(xí)慣等,進(jìn)行詳細(xì)設(shè)定。
[0225] 在一個(gè)更為具體的實(shí)施方式中,上述的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可以采用上述實(shí)施例 1中的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)實(shí)現(xiàn)。
[0226] 在一個(gè)更為具體的實(shí)施方式中,上述的處理器模塊還可以包括以下至少一種模 塊:面向判斷模塊,用于判斷紙幣的朝向;新舊程度判斷模塊,用于判斷紙幣的新舊程度;破 損識(shí)別模塊,用于將紙幣中的破損位置識(shí)別出來(lái);字跡識(shí)別模塊,用于識(shí)別紙幣上的字跡。 該些模塊所采用的功能實(shí)現(xiàn)方法,可以采用實(shí)施例1中所例舉的方法。
[0227] 在一具體的實(shí)施方式中,該處理器模塊可以采用例如FPGA(京微雅格M7芯片具體 型號(hào)M7A12N5L144C7)等芯片系統(tǒng)。芯片的主頻為(FPGA主頻125M,ARM主頻333M),占用的資 源是(Logic 85%,EMB 98%),識(shí)別時(shí)間為7ms。準(zhǔn)確度為99.6%以上。
[0228]以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員 來(lái)說(shuō),在不脫離本發(fā)明所述原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也 應(yīng)視為本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1. 一種冠字號(hào)碼的識(shí)別方法,其特征在于,所述方法包括以下步驟: 步驟1、提取冠字號(hào)碼所在區(qū)域的灰度圖像,并對(duì)灰度圖像進(jìn)行邊緣檢測(cè); 步驟2、對(duì)圖像進(jìn)行旋轉(zhuǎn); 步驟3、對(duì)圖像中的單個(gè)號(hào)碼進(jìn)行定位,具體包含:通過(guò)自適應(yīng)二值化,對(duì)圖像進(jìn)行二值 化處理,獲得二值化圖像;然后對(duì)所述二值化圖像進(jìn)行投影;最后通過(guò)設(shè)置移動(dòng)窗口,采用 移動(dòng)窗口配準(zhǔn)的方式,對(duì)號(hào)碼進(jìn)行分割,得到每個(gè)號(hào)碼的圖像; 步驟4、對(duì)所述每個(gè)號(hào)碼的圖像中包含的字符進(jìn)行套緊,并對(duì)每個(gè)號(hào)碼圖像進(jìn)行歸一化 處理,所述歸一化包含尺寸歸一化和明暗歸一化; 步驟5、采用神經(jīng)網(wǎng)絡(luò)對(duì)歸一化后的號(hào)碼圖像進(jìn)行識(shí)別,獲得冠字號(hào)碼。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟1中的邊緣檢測(cè)進(jìn)一步包括:設(shè)定 一灰度閾值,依據(jù)該閾值從上、下兩方向進(jìn)行直線搜索,獲取邊緣;再通過(guò)最小二乘法,獲得 圖像的邊緣直線方程,并同時(shí)獲得紙幣圖像的水平長(zhǎng)度、垂直長(zhǎng)度和斜率。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟2中的旋轉(zhuǎn),進(jìn)一步包括:基于所 述水平長(zhǎng)度、垂直長(zhǎng)度和斜率,獲得旋轉(zhuǎn)矩陣,依據(jù)所述旋轉(zhuǎn)矩陣,求取旋轉(zhuǎn)后的像素點(diǎn)坐 標(biāo)。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟3中,所述通過(guò)自適應(yīng)二值化對(duì)圖 像進(jìn)行二值化處理,具體包括:求取圖像的直方圖,設(shè)置一閾值Th,當(dāng)直方圖中灰度值由0到 Th的點(diǎn)數(shù)和大于等于一預(yù)設(shè)值時(shí),以此時(shí)的Th作為自適應(yīng)二值化閾值,對(duì)圖像進(jìn)行二值化, 獲得二值化圖像。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟3中,所述對(duì)所述二值化圖像進(jìn)行 投影,共進(jìn)行三次不同方向投影。6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟3中的移動(dòng)窗口配準(zhǔn)具體包括:設(shè) 計(jì)配準(zhǔn)用移動(dòng)窗口,所述窗口在垂直投影圖上水平移動(dòng),窗口內(nèi)的黑點(diǎn)數(shù)總和最小值所對(duì) 應(yīng)的位置,即為冠字號(hào)碼左右方向分割的最佳位置。7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述窗口為間隔固定的一脈沖序列,脈沖 之間的寬度由冠字號(hào)碼圖像之間的間隔預(yù)先設(shè)置。8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,每個(gè)所述脈沖的寬度為2-10個(gè)像素。9. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟4中的套緊,具體包括:對(duì)所述每 個(gè)號(hào)碼的圖像單獨(dú)進(jìn)行二值化,對(duì)獲取到的每個(gè)號(hào)碼的二值化圖像進(jìn)行區(qū)域增長(zhǎng),再對(duì)區(qū) 域增長(zhǎng)后得到的區(qū)域里,選取一個(gè)或兩個(gè)面積大于某一預(yù)設(shè)面積閾值的區(qū)域,該些選取后 的區(qū)域所在的矩形即為每個(gè)號(hào)碼圖像套緊后的矩形。10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,對(duì)所述每個(gè)號(hào)碼的圖像單獨(dú)進(jìn)行二值化, 具體包含:對(duì)所述每個(gè)號(hào)碼的圖像提取直方圖,采用直方圖雙峰法獲取二值化閾值,再依據(jù) 該二值化閾值將所述每個(gè)號(hào)碼的圖像進(jìn)行二值化。11. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟4中的尺寸歸一化采用雙線性插 值算法進(jìn)行尺寸歸一化;優(yōu)選的,歸一化后的尺寸為下述中的一個(gè):12*12、14*14、18*18、 28*28,單位為像素。12. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟4中的明暗歸一化包括:獲取所 述每個(gè)號(hào)碼的圖像的直方圖,計(jì)算號(hào)碼前景灰度平均值和背景灰度平均值,并將明暗歸一 化之前的像素灰度值分別與前景灰度平均值和背景灰度平均值進(jìn)行比較,依據(jù)該比較結(jié) 果,將歸一化之前的像素灰度值設(shè)置為對(duì)應(yīng)的特定灰度值。13. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述步驟2、步驟3之間,進(jìn)一步包括面 向判斷步驟:通過(guò)所述旋轉(zhuǎn)后的圖像確定紙幣尺寸,依據(jù)所述尺寸確定面值;將目標(biāo)紙幣圖 像分割為η個(gè)區(qū)塊,計(jì)算各區(qū)塊中的亮度均值,與預(yù)先存儲(chǔ)的模板比較,差值最小時(shí),判斷為 模板對(duì)應(yīng)的面向。14. 根據(jù)權(quán)利要求13所述的方法,其特征在于,所述預(yù)先存儲(chǔ)的模板,是將不同面值紙 幣的不同面向的圖像,分割為η個(gè)區(qū)塊,并計(jì)算各區(qū)塊中的亮度均值,作為模板。15. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述步驟2、步驟3之間,進(jìn)一步包括新 舊程度判斷步驟:首先提取預(yù)設(shè)數(shù)量dpi的圖像,將該圖像全部區(qū)域作為直方圖的特征區(qū) 域,掃描區(qū)域內(nèi)的像素點(diǎn),放在數(shù)組里,記錄各個(gè)像素點(diǎn)的直方圖,根據(jù)直方圖統(tǒng)計(jì)出一定 比例的最亮像素點(diǎn),求取該些最亮像素點(diǎn)的平均灰度值,作為新舊程度判斷依據(jù)。16. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述步驟2、步驟3之間,進(jìn)一步包括破 損識(shí)別步驟:通過(guò)在紙幣兩側(cè)分別設(shè)置光源和傳感器,獲取透射后圖像;對(duì)旋轉(zhuǎn)后的透射后 圖像逐點(diǎn)檢測(cè),當(dāng)該點(diǎn)的相鄰兩像素點(diǎn)同時(shí)小于一預(yù)設(shè)閾值時(shí),則判斷該點(diǎn)為破損點(diǎn)。17. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述步驟2、步驟3之間,進(jìn)一步包括字 跡識(shí)別步驟:在固定區(qū)域內(nèi),掃描區(qū)域內(nèi)的像素點(diǎn),放在數(shù)組里,記錄各個(gè)像素點(diǎn)的直方圖, 根據(jù)直方圖統(tǒng)計(jì)出預(yù)設(shè)數(shù)量個(gè)最亮像素點(diǎn),求取平均灰度值,依據(jù)該平均灰度值得出閾值, 灰度值小于閾值的像素點(diǎn)判定為字跡點(diǎn)。18. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟5中的神經(jīng)網(wǎng)絡(luò)采用二級(jí)分類的 卷積神經(jīng)網(wǎng)絡(luò);第一級(jí)分類將冠字號(hào)碼涉及的所有數(shù)字和字母進(jìn)行分類,第二級(jí)分類分別 對(duì)第一級(jí)分類中的部分類進(jìn)行細(xì)分類。19. 根據(jù)權(quán)利要求18所述的方法,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型結(jié)構(gòu)依次 設(shè)置如下: 輸入層:僅以一個(gè)圖像作為視覺(jué)輸入,所述圖像為待識(shí)別的單個(gè)冠字號(hào)碼的灰度圖像; C1層:是一個(gè)卷積層,該層由6個(gè)特征圖構(gòu)成; S2層:為下采樣層,利用圖像局部相關(guān)性原理,對(duì)圖像進(jìn)行子抽樣; C3層:是一個(gè)卷積層,采用預(yù)設(shè)卷積核去卷積層S2,C3層中的每個(gè)特征圖采用不全連接 的方式連接到S2中; S4層:為下采樣層,利用圖像局部相關(guān)性原理,對(duì)圖像進(jìn)行子抽樣; C5層:C5層是S4層的簡(jiǎn)單拉伸,變成一維向量; 網(wǎng)絡(luò)的輸出個(gè)數(shù)為分類個(gè)數(shù),與C5層組成全連接結(jié)構(gòu)。20. 根據(jù)權(quán)利要求19所述的方法,其特征在于,所述C1層、C3層均通過(guò)3x3的卷積核進(jìn)行 卷積。21. -種冠字號(hào)碼的識(shí)別系統(tǒng),其特征在于,所述系統(tǒng)包括:圖像預(yù)處理模塊、處理器模 塊、CIS圖像傳感器模塊; 所述圖像預(yù)處理模塊進(jìn)一步包括邊緣檢測(cè)模塊、旋轉(zhuǎn)模塊; 所述處理器模塊進(jìn)一步包括號(hào)碼定位模塊、套緊模塊、歸一化模塊、識(shí)別模塊; 所述號(hào)碼定位模塊,通過(guò)自適應(yīng)二值化,對(duì)圖像進(jìn)行二值化處理,獲得二值化圖像;然 后對(duì)所述二值化圖像進(jìn)行投影;最后通過(guò)設(shè)置移動(dòng)窗口,采用移動(dòng)窗口配準(zhǔn)的方式,對(duì)號(hào)碼 進(jìn)行分割,得到每個(gè)號(hào)碼的圖像,并將所述每個(gè)號(hào)碼的圖像傳輸給套緊模塊; 所述歸一化模塊用于對(duì)套緊模塊處理后的圖像進(jìn)行尺寸歸一化及明暗歸一化。22. 根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,所述號(hào)碼定位模塊進(jìn)一步包括窗口模 塊,所述窗口模塊依據(jù)冠字號(hào)碼間距,設(shè)計(jì)配準(zhǔn)用移動(dòng)窗口,將所述窗口在垂直投影圖上水 平移動(dòng),并計(jì)算所述窗口內(nèi)的黑點(diǎn)數(shù)總和; 所述窗口模塊還可以將不同窗口內(nèi)的所述黑點(diǎn)數(shù)總和進(jìn)行比較。23. 根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,所述套緊模塊對(duì)每個(gè)號(hào)碼的圖像單獨(dú)進(jìn) 行二值化,對(duì)獲取到的每個(gè)號(hào)碼的二值化圖像進(jìn)行區(qū)域增長(zhǎng),再對(duì)區(qū)域增長(zhǎng)后得到的區(qū)域 里,選取一個(gè)或兩個(gè)面積大于某一預(yù)設(shè)面積閾值的區(qū)域,該些選取后的區(qū)域所在的矩形即 為每個(gè)號(hào)碼圖像套緊后的矩形。24. 根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,對(duì)所述每個(gè)號(hào)碼的圖像單獨(dú)進(jìn)行二值 化,具體包含:對(duì)所述每個(gè)號(hào)碼的圖像提取直方圖,采用直方圖雙峰法獲取二值化閾值,再 依據(jù)該二值化閾值將所述每個(gè)號(hào)碼的圖像進(jìn)行二值化。25. 根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括補(bǔ)償模塊,用于對(duì)CIS圖 像傳感器模塊獲得的圖像進(jìn)行補(bǔ)償,所述補(bǔ)償模塊預(yù)先存儲(chǔ)純白及純黑的采集亮度數(shù)據(jù), 并結(jié)合可設(shè)定的像素點(diǎn)的灰度參考值,得到補(bǔ)償系數(shù); 所述補(bǔ)償系數(shù)存儲(chǔ)至處理器模塊,并建立查找表。26. 根據(jù)權(quán)利要求21所述的系統(tǒng),其特征在于,所述識(shí)別模塊利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)實(shí) 現(xiàn)冠字號(hào)碼的識(shí)別。27. 根據(jù)權(quán)利要求26所述的系統(tǒng),其特征在于,所述神經(jīng)網(wǎng)絡(luò)采用二級(jí)分類的卷積神經(jīng) 網(wǎng)絡(luò);第一級(jí)分類將冠字號(hào)碼涉及的所有數(shù)字和字母進(jìn)行分類,第二級(jí)分類分別對(duì)第一級(jí) 分類中的部分類進(jìn)行細(xì)分類。28. 根據(jù)權(quán)利要求27所述的系統(tǒng),其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型結(jié)構(gòu)依次 設(shè)置如下: 輸入層:僅以一個(gè)圖像作為視覺(jué)輸入,所述圖像為待識(shí)別的單個(gè)冠字號(hào)碼的灰度圖像; C1層:是一個(gè)卷積層,該層由6個(gè)特征圖構(gòu)成; S2層:為下采樣層,利用圖像局部相關(guān)性原理,對(duì)圖像進(jìn)行子抽樣; C3層:是一個(gè)卷積層,采用預(yù)設(shè)卷積核去卷積層S2,C3層中的每個(gè)特征圖采用不全連接 的方式連接到S2中; S4層:為下采樣層,利用圖像局部相關(guān)性原理,對(duì)圖像進(jìn)行子抽樣; C5層:C5層是S4層的簡(jiǎn)單拉伸,變成一維向量; 網(wǎng)絡(luò)的輸出個(gè)數(shù)為分類個(gè)數(shù),與C5層組成全連接結(jié)構(gòu)。29. 根據(jù)權(quán)利要求28所述的系統(tǒng),其特征在于,所述C1層、C3層均通過(guò)3x3的卷積核進(jìn)行 卷積。30. 根據(jù)權(quán)利要求26所述的系統(tǒng),其特征在于,所述識(shí)別模塊還包括神經(jīng)網(wǎng)絡(luò)訓(xùn)練模 塊,用于訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)。
【文檔編號(hào)】G07D7/20GK106056751SQ201610341835
【公開(kāi)日】2016年10月26日
【申請(qǐng)日】2016年5月20日
【發(fā)明人】柳永詮, 柳長(zhǎng)慶, 柳偉生, 趙楠楠, 田英, 孫偉忠, 金彬, 焦仁剛, 呂娜, 牛作琴, 陳智博, 殷忠
【申請(qǐng)人】聚龍股份有限公司