本發(fā)明涉及機器學習、spiking神經(jīng)網(wǎng)絡(luò)和延遲相位編碼技術(shù)領(lǐng)域,具體涉及一種基于spiking神經(jīng)網(wǎng)絡(luò)的圖像識別方法。
背景技術(shù):
spiking神經(jīng)網(wǎng)絡(luò)對圖像處理的敏感性,使它頻頻出現(xiàn)在仿真視網(wǎng)膜神經(jīng)元對圖像信息轉(zhuǎn)化的模擬中。其對于數(shù)據(jù)的時空編碼特性,使得在圖像處理問題中spiking神經(jīng)網(wǎng)絡(luò)可以對不同尺寸和角度的圖像內(nèi)容進行識別和處理,并表現(xiàn)出了很好的效果。
在傳統(tǒng)的圖像識別問題中,計算機對圖像進行特征索引然后查詢。這類方法的可重用性不高,并且在實際應(yīng)用中操作復雜,經(jīng)過多次調(diào)試之后才能達到一定的效果。一些算法甚至使用灰階差的方式來對識別問題進行處理,這類方法簡單直接,但往往不能取得很好的識別效果。圖像信息是人類感官里的重要信息輸入,人類用眼識字,當有人用手在他背后寫字時,人也可以認出字的內(nèi)容,神經(jīng)網(wǎng)絡(luò)對這一問題提供了新的解決思路。在具體的做法上,主要是通過圖像編碼技術(shù)將數(shù)字圖片信息轉(zhuǎn)換為神經(jīng)元能夠識別的脈沖序列,然后使用學習算法對神經(jīng)網(wǎng)絡(luò)進行訓練,對輸出脈沖分類完成識別任務(wù)。
最近的神經(jīng)生理學結(jié)果顯示,單個脈沖可以攜帶關(guān)于視覺刺激的大量信息。視網(wǎng)膜神經(jīng)節(jié)細胞的對視覺神經(jīng)元產(chǎn)生的重要的信息可以由脈沖的時間和數(shù)量體現(xiàn)出來。在人視網(wǎng)膜中,來自感光細胞的視覺信號以脈沖的形式被投射到視網(wǎng)膜神經(jīng)節(jié)細胞中。因此,在投影期間信息壓縮是不可缺少的。相位編碼已經(jīng)成功地用于通過相位變換在海馬體中執(zhí)行學習和情景記憶的任務(wù)。在接收域內(nèi)利用脈沖的相位信息,神經(jīng)節(jié)細胞可以從感光細胞接收信息,而相位編碼可以用于在壓縮期間保留足夠的空間信息。因此,特征提取和編碼的組合提供了一種實現(xiàn)圖像壓縮和解壓過程的新方式。
在圖像特征提取和編碼之后,神經(jīng)系統(tǒng)需要學習呈現(xiàn)外部感覺刺激的神經(jīng)信號。基于spiking神經(jīng)網(wǎng)絡(luò)的學習算法被認為在學習、記憶和神經(jīng)電路的發(fā)展中起重要作用。許多現(xiàn)有的學習模型使用時間編碼的學習,目的是訓練輸出神經(jīng)元生成所需的輸出脈沖序列模式。很多證據(jù)表明基于spiking神經(jīng)網(wǎng)絡(luò)的監(jiān)督學習在生物小腦和小腦皮層中存在。它也已被證明是一種成功的學習形式,建立具有認知功能的方法。
技術(shù)實現(xiàn)要素:
針對上述現(xiàn)有技術(shù),本發(fā)明目的在于提供一種基于spiking神經(jīng)網(wǎng)絡(luò)的圖像識別方法,解決現(xiàn)有技術(shù)對圖像識別效率較低、對圖像的特征不能準確識別以及由于神經(jīng)元所學習的序列存在偏移而導致的網(wǎng)絡(luò)識別精度低等技術(shù)問題。
本發(fā)明基于高斯差分濾波的思想對圖像特征進行了分離,將得到的特征使用延遲相位的方法進行了編碼,在編碼完成后使用spiking神經(jīng)網(wǎng)絡(luò)學習算法對所得特征序列進行了學習,最終得到識別輸出的結(jié)果。
為達到上述目的,本發(fā)明采用的技術(shù)方案如下:
一種基于spiking神經(jīng)網(wǎng)絡(luò)的圖像識別方法,包括以下步驟:
步驟1、將圖像轉(zhuǎn)換為灰度像素,獲得灰度圖;
步驟2、對灰度圖進行特征提取,得到灰度圖區(qū)域特征關(guān)聯(lián)的第一層神經(jīng)元;
步驟3、對第一層神經(jīng)元再采樣降維后得到第二層神經(jīng)元;
步驟4、使用相位延遲編碼的方案將第二層神經(jīng)元的特征強度轉(zhuǎn)換為脈沖時間序列,對齊后再編碼該脈沖時間序列;
步驟5、將編碼后的脈沖時間序列輸入至spiking神經(jīng)網(wǎng)絡(luò),使用多張圖片對spiking神經(jīng)網(wǎng)絡(luò)初始的目標輸出時間序列進行監(jiān)督學習訓練,訓練后獲得具有不同目標脈沖輸出序列的spiking神經(jīng)網(wǎng)絡(luò);
步驟6、將待測試圖像經(jīng)過步驟1至步驟4后輸入至訓練后的spiking神經(jīng)網(wǎng)絡(luò)中,通過待測試圖像的脈沖輸出序列與目標脈沖輸出序列的相似計算值最小判斷得出待測試圖像所屬識別結(jié)果類。
上述方法中,所述的步驟2,選擇接受域,并使用高斯差分的方法對灰度圖進行特征提取。
上述方法中,所述的步驟3,使用最大池化的方法對第一層神經(jīng)元再采樣降維后得到第二層神經(jīng)元。
上述方法中,所述的步驟4,選取編碼窗口的持續(xù)時間,將接受域內(nèi)的第二層神經(jīng)元乘以尺度參數(shù)后結(jié)合編碼窗口的持續(xù)時間映射為脈沖時間序列。
上述方法中,所述的步驟4,還將脈沖時間序列按亞閾值膜震蕩函數(shù)向最鄰近的波峰位置進行調(diào)整,得到對齊后的脈沖時間序列。
上述方法中,所述的步驟5,訓練過程中使用pbsnlr算法調(diào)整spiking神經(jīng)網(wǎng)絡(luò)的參數(shù)。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果:
本發(fā)明方法對圖像的特征進行了細化,通過降維、整合、分離、提取等方式對圖像的局部特點進行了針對性優(yōu)化,創(chuàng)造性地利用了基于膜電壓的spiking神經(jīng)網(wǎng)絡(luò)學習算法,實質(zhì)并顯著地提高了識別過程的效率和準確度;
一、使用了高斯差分的特征提取方法,使得圖像的特征得到了更精準表出,提高了圖像識別的準確程度;
二、采用脈沖延遲編碼的方法大大降低了編碼的復雜度,提高了圖像識別的效率;
三、使用spiking神經(jīng)網(wǎng)絡(luò)對圖像信息進行處理,最大程度保留了圖像的旋轉(zhuǎn)、時空等信息,利用仿生的學習方式識別圖像;
四、模型結(jié)構(gòu)簡單清晰,其s1和c1層具有可迭代的特點,對較為復雜的圖像可以使用多層提取的方式使復雜的圖像信息更直接的體現(xiàn)到最后的特征脈沖時間序列中。
附圖說明
圖1為本發(fā)明的整體網(wǎng)絡(luò)結(jié)構(gòu)示意圖;
圖2為本發(fā)明特征編碼對齊過程的示意圖;
圖3為本發(fā)明圖像特征提取過程對圖像的三個處理直觀展示圖;
圖4為本發(fā)明的圖像特征編碼過程的具體示例示意圖;
圖5為本發(fā)明三個實施圖像;
圖6為本發(fā)明經(jīng)過處理后的脈沖編碼序列示意圖;
圖7為本發(fā)明在訓練過程的輸出準確度變化示意圖。
具體實施方式
本說明書中公開的所有特征,或公開的所有方法或過程中的步驟,除了互相排斥的特征和/或步驟以外,均可以以任何方式組合。
下面結(jié)合附圖對本發(fā)明做進一步說明:
一種基于spiking神經(jīng)網(wǎng)絡(luò)的圖像識別方法,包括以下步驟:
步驟1:將圖像轉(zhuǎn)換為灰度像素,輸入識別模型;
步驟2:選擇適當?shù)慕邮苡?,并使用高斯差分的方法對灰度圖進行特征提取,使用的高斯差分函數(shù)為
其中
即對接受域ri中所有像素的強度值i(l)與高斯濾波器的權(quán)值
步驟3:對步驟2中得到的s1層神經(jīng)元,使用最大池化的方法對其進行再次采樣,即將劃分區(qū)域內(nèi)的最大值保留并傳遞到c1層對應(yīng)位置;
步驟4:使用相位延遲編碼的方案將c1層的特征強度轉(zhuǎn)換為脈沖時間序列并編碼;
其中轉(zhuǎn)換公式為ti=f(xi)=tmax-ln(α·xi+1),即將m×n個接受域內(nèi)的神經(jīng)元乘以尺度參數(shù)α,tmax為編碼窗口的持續(xù)時間;
在確定了ti時間后,將其在對應(yīng)的亞閾值膜震蕩函數(shù)
步驟5:將步驟4得到的脈沖時間序列ti‘輸入到spiking神經(jīng)網(wǎng)絡(luò)中,使用多張圖片對網(wǎng)絡(luò)進行監(jiān)督學習訓練,得到訓練結(jié)果,在本方法中,我們使用了pbsnlr算法進行神經(jīng)網(wǎng)絡(luò)的參數(shù)調(diào)整;
步驟6:步驟5訓練得到的網(wǎng)絡(luò)可以進行識別測試,將測試圖像經(jīng)過步驟1~4的處理,輸入網(wǎng)絡(luò)中,得到脈沖輸出序列tio與監(jiān)督訓練設(shè)置的目標脈沖輸出序列tid進行相似計算,即
得到的相似計算值c最小的即為圖片的識別結(jié)果類。
實施例1
(1)對如圖5所示的三個樣本圖片分別進行處理,將圖像統(tǒng)一大小,并轉(zhuǎn)換為灰度圖像;
(2)如表1設(shè)置整個計算模型的相關(guān)參數(shù)
表1計算模型的參數(shù)設(shè)置
(3)選擇一個16×16的接受域?qū)?56×256的圖像進行特征提取,高斯差分權(quán)值乘積后如圖3(a)中的原圖將被轉(zhuǎn)換為圖3(b)所示的特征圖像;
(4)對得到的特征圖像使用2×2的最大池化進行采樣,得到如圖3(c)所示的采樣圖像;
(5)將得到的特征強度信息使用延遲相位編碼進行對齊調(diào)整,如圖4所示。圖像信息被重新分列放入亞閾值膜電壓震蕩函數(shù)中,調(diào)整時間序列后壓縮得到最終的特征時間脈沖序列,image1圖像得到的最終編碼時間序列如圖6所示;
(6)將圖像得到的脈沖序列輸入spiking神經(jīng)網(wǎng)絡(luò)進行權(quán)值訓練調(diào)整,這里設(shè)置三種識別結(jié)果,分別為(50,150,450)、(120,320,520)、(190,390,590)時間序列的目標輸出,如圖7所示,經(jīng)過約20次的訓練后,整個網(wǎng)絡(luò)輸出趨向穩(wěn)定,得到在關(guān)于這三張圖像的訓練識別模型;
(7)使用(6)中訓練得到的網(wǎng)絡(luò)權(quán)值對圖像識別效果進行測試,在此三張圖模型中,識別計算的準確度可以達到百分之百。
本發(fā)明已經(jīng)通過上述實施例進行了說明,但應(yīng)當理解的是,上述實施例只是用于舉例和說明的目的,而非意在將本發(fā)明限制于所描述的實施例范圍內(nèi)。此外本領(lǐng)域技術(shù)人員可以理解的是,本發(fā)明并不局限于上述實施示例,根據(jù)本發(fā)明的教導還可以做出更多種的變型和修改,這些變型和修改均落在本發(fā)明所要求保護的范圍以內(nèi)。本發(fā)明的保護范圍由附屬的權(quán)利要求書及其等效范圍所界定。