本發(fā)明一種反饋式icm神經(jīng)網(wǎng)絡和fpf相結(jié)合的剪影識別系統(tǒng),涉及圖像識別技術(shù)領域。
背景技術(shù):
剪影識別是一種基于目標輪廓的圖像識別技術(shù),被廣泛應用于機器人抓取,醫(yī)學圖像處理和基于內(nèi)容的圖像檢索等領域。多年以來,出現(xiàn)了很多剪影識別算法,經(jīng)典的有如下幾種算法:1)基于統(tǒng)計學習的方法,基于統(tǒng)計學習的方法一般分成學習階段(用于訓練分類器)和分類階段。學習階段是在不同類別模式下的特征域內(nèi),評估每類目標邊緣的分布;分類階段是利用評估階段得到的目標邊緣分布對剪影圖像進行分類。該類方法依賴于大量的統(tǒng)計特征,且容易出現(xiàn)過學習或過訓練的現(xiàn)象。2)神經(jīng)網(wǎng)絡的方法,基于傳統(tǒng)神經(jīng)網(wǎng)絡的方法,在學習階段從不同類別的目標圖像中提取一系列的特征參數(shù),在分類階段把提取的特征反饋給神經(jīng)網(wǎng)絡對圖像進行分類,該方法需要對大量的測試圖像進行學習才能進行相關的圖像處理步驟。3)基于動態(tài)規(guī)劃的方法,動態(tài)規(guī)劃法是把未知目標邊緣的圖像和原目標圖像作為一系列變量,然后計算兩個變量之間的最短距離。該類方法若不事先采用窮舉法計算出連接權(quán)值,就無法使用動態(tài)規(guī)劃中常用的從后向前逐步遞推的方法,因此計算量很大。
技術(shù)實現(xiàn)要素:
針對以上幾種經(jīng)典剪影識別算法的不足,本發(fā)明提出了一種反饋式icm神經(jīng)網(wǎng)絡和fpf相結(jié)合的剪影識別系統(tǒng),該系統(tǒng)對于圖中同類別的圖像能夠較好地識別,對具有一定旋轉(zhuǎn)以及尺度變化的圖像也具有較好的穩(wěn)定性。與其他剪影識別算法相比計算量有所減小,工作量相應的降低,速度得到了增加。
本發(fā)明采取的技術(shù)方案為:
一種反饋式icm神經(jīng)網(wǎng)絡和fpf相結(jié)合的剪影識別系統(tǒng),利用icmnn具有的脈沖耦合特性,提取目標圖像的完整輪廓;而所采用的反饋機制則對原始圖像不斷進行增強,從而達到抑制非同類目標同時增強同類目標的目的;隨著不斷迭代,fpf在經(jīng)icm處理過的圖像中,不斷搜索和目標邊緣相似的候選目標,當找到可靠的同類目標時就會在相應位置產(chǎn)生較大的相關峰,而由于反饋機制的加入有效抑制其他非目標區(qū)域,從而使得其他區(qū)域的相關值降低,從而實現(xiàn)目標的可靠識別。
一種反饋式icm神經(jīng)網(wǎng)絡和fpf相結(jié)合的剪影識別系統(tǒng),
步驟一:建立交叉視覺皮質(zhì)模型icm:
交叉視覺皮質(zhì)模型icm所構(gòu)成的最小系統(tǒng)用以下三個式子來描述:
fij[n+1]=ffij[n]+sij+w{y[n]}ij(l)
θij[n+1]=gθij[n]+hyij[n+1](3)
其中,輸入矩陣為s,神經(jīng)元的狀態(tài)矩陣為f,輸出矩陣為y,動態(tài)閾值矩陣為θ,標量f和g小于1.0,令g<f,可確保閾值最終低于神經(jīng)元的狀態(tài)值,促使神經(jīng)元激發(fā),標量h是一個很大的值,當神經(jīng)元激發(fā)時,使得閾值急劇增加,從而抑制神經(jīng)元的脈沖發(fā)放,使其進入不應期,即在一定時期內(nèi)不再發(fā)放脈沖;
步驟二:用交叉視覺皮質(zhì)模型icm對剪影圖像處理,可產(chǎn)生一個包含目標輪廓的脈沖圖像,fpf的作用是在該脈沖圖像區(qū)域進行搜索,如果有與目標邊緣相似的候選目標,則會在其相關面內(nèi)產(chǎn)生相關峰值,fpf是等相關峰綜合鑒別函數(shù)濾波器sdf和最小平均相關能量濾波器mace的擴展;
sdf的基本思想是:將某類圖像及其畸變圖像組成一個訓練集,找出綜合鑒別函數(shù),綜合鑒別函數(shù)的目的是尋求這樣一個濾波函數(shù):當正確目標輸入時,相關面內(nèi)有一相關峰值;選出一組訓練圖像vi,令濾波器為h,sdf是輸入加權(quán)線性組合,式(6)中矩陣v是通過輸入向量的傅立葉變換的組合來創(chuàng)建的,
如式(8)用
平均最小相關能量濾波器mace是在綜合鑒別函數(shù)的基礎上發(fā)展而來的,利用mace能夠使訓練圖像相關運算后的平均相關能量最小化;
mace濾波器是通過下式計算得到:
其中:
其中
x由訓練圖像創(chuàng)建,與公式(6)相似,
在公式(14)中,若冪項p=2則稱之為最小平均相關能量濾波器,p=0式稱之為鑒別函數(shù)濾波器,p處于0-2之間時稱為分數(shù)冪指數(shù)濾波器fpf。
步驟三:利用反饋式icm對結(jié)果圖像再進行處理,最后得到只有目標圖像存在的圖像?;诖耍梅答伿絠cm結(jié)合fpf形成一個閉環(huán)系統(tǒng)實現(xiàn)剪影識別。
本發(fā)明一種反饋式icm神經(jīng)網(wǎng)絡和fpf相結(jié)合的剪影識別系統(tǒng),有益效果如下:
(1)該系統(tǒng)對于圖中同類別的圖像能夠較好地識別,對具有一定旋轉(zhuǎn)以及尺度變化的圖像也具有較好的穩(wěn)定性。
(2)與其他剪影識別算法相比計算量有所減小,工作量相應的降低,速度得到了增加。
附圖說明
圖1是曲率流圖像一;
圖2是曲率流圖像二;
圖3是曲率流圖像三;
圖4是曲率流圖像四。
圖5是icm模型框圖。
圖6是旋轉(zhuǎn)10°角度下的fpf訓練圖像圖;
圖7是旋轉(zhuǎn)20°角度下的fpf訓練圖像圖;
圖8是旋轉(zhuǎn)30°角度下的fpf訓練圖像圖;
圖9是分數(shù)冪指數(shù)濾波器冪項p取0.1的結(jié)果圖。
圖10是分數(shù)冪指數(shù)濾波器冪項p取0.5的結(jié)果圖。
圖11是分數(shù)冪指數(shù)濾波器冪項p取0.9的結(jié)果圖。
圖12是fpf結(jié)合icm的系統(tǒng)框圖。
具體實施方式
由于非剛性目標形狀變化多樣,故要求識別算法不僅能有效地表示目標輪廓,同時還需在泛化與鑒別之間做好平衡。本發(fā)明將具有生物視覺神經(jīng)系統(tǒng)的交叉視覺皮層模型神經(jīng)網(wǎng)絡(icmnn)與分數(shù)冪指數(shù)濾波器(fpf)相結(jié)合,設計了一種利用反饋式icmnn分離目標輪廓,并使用fpf實現(xiàn)快速相關的剪影識別系統(tǒng)。
一種反饋式icm神經(jīng)網(wǎng)絡和fpf相結(jié)合的剪影識別系統(tǒng),利用icmnn具有的脈沖耦合特性,提取目標圖像的完整輪廓;而所采用的反饋機制則對原始圖像不斷進行增強,從而達到抑制非同類目標同時增強同類目標的目的;隨著不斷迭代,fpf在經(jīng)icm處理過的圖像中,不斷搜索和目標邊緣相似的候選目標,當找到可靠的同類目標時就會在相應位置產(chǎn)生較大的相關峰,而由于反饋機制的加入有效抑制其他非目標區(qū)域,從而使得其他區(qū)域的相關值降低,從而實現(xiàn)目標的可靠識別。
本發(fā)明一種反饋式icm神經(jīng)網(wǎng)絡和fpf相結(jié)合的剪影識別系統(tǒng),包括:
1:交叉視覺皮質(zhì)模型(icm)和反饋式視覺皮質(zhì)模型(ficm):
1)、交叉視覺皮質(zhì)模型:
交叉視覺皮質(zhì)模型(icm)主要是基于eckhorn模型和rybak模型演化而來,它是多種腦皮質(zhì)模型交叉綜合的產(chǎn)物,是一種簡化的脈沖耦合神經(jīng)網(wǎng)絡模型。icm比傳統(tǒng)的人工神經(jīng)網(wǎng)絡模型更接近真實的生物視覺神經(jīng)網(wǎng)絡,且icm計算量更少;另外,icm還可利用基于曲率流理論實現(xiàn)的向心波技術(shù)克服脈沖耦合網(wǎng)絡中存在的自動波干擾問題。利用這種技術(shù),可使脈沖耦合神經(jīng)網(wǎng)絡中的自動波不再向外傳播而是向目標中心傳播,最后收縮為一點,如圖1-4中各個目標圖像的波形傳遞所示。這可用于減少因目標尺度變化所引起的輪廓大小變化對剪影識別所造成的影響。
icm所構(gòu)成的最小系統(tǒng)用以下三個式子來描述,圖5為其模型框圖。
fij[n+1]=ffij[n]+sij+w{y[n]}ij(1)
θij[n+1]=gθij[n]+hyij[n+1](3)
其中,外部刺激輸入為矩陣s,神經(jīng)元的當前狀態(tài)矩陣為f[n+1],前一狀態(tài)為f[n],w{*}表示神經(jīng)元之間的連接。神經(jīng)元輸出為矩陣y,如果y為1表示神經(jīng)元處于激發(fā)狀態(tài),如果為0表示處于熄滅狀態(tài)。動態(tài)閾值矩陣為θ,θ根據(jù)用戶的需求來進行設定。標量f和g小于1.0,令g<f,可確保閾值最終低于神經(jīng)元的狀態(tài)值,促使神經(jīng)元激發(fā),標量h是一個很大的值,在本文試驗中取值20。當神經(jīng)元激發(fā)時,使得閾值θ急劇增加,從而抑制神經(jīng)元的脈沖發(fā)放,使其進入不應期,即在一定時期內(nèi)不再發(fā)放脈沖。
2)、反饋式交叉視覺皮質(zhì)模型:
在icm迭代之后,同步激發(fā)的區(qū)域到一定時間會熄滅,這種熄滅叫做去同步,運用這種去同步的機制可以分割出圖像的紋理信息。紋理帶來的細小差異隨著時間不斷傳播,最終造成神經(jīng)元狀態(tài)的改變,這樣紋理信息就被提取出來。為了得到更好的紋理信息我們運用了一種反饋式交叉視覺皮質(zhì)模型,反饋式交叉視覺皮質(zhì)模型將icmnn的輸出以一種抑制性的方式反饋到輸入,反饋式交叉視覺皮質(zhì)模型與哺乳動物中老鼠的嗅覺系統(tǒng)類似。icm在迭代過程中會將圖像內(nèi)部區(qū)域與邊緣分離,但對于反饋式icm,其輸出會反饋至輸入產(chǎn)生分流,從而對整個輸入造成不均勻影響。這就是icm與反饋式icm的不同。
icm迭代中激發(fā)的神經(jīng)元將輸出作為輸入反饋給其它神經(jīng)元,這樣的話在迭代完之后需要一定的時間才能達到穩(wěn)定狀態(tài)。要想達到穩(wěn)定,必須滿足一定的條件,首先,輸入值要求必須大于閾值,如果輸入值過低,輸入灰度值將會很快被衰減(衰減因子α)而最終消失。其次是輸出必須安全進入所重脈沖發(fā)放階段,在這種情況下所有處于激發(fā)狀態(tài)的神經(jīng)元將會一直激發(fā)。當滿足次條件時,反饋和連接權(quán)矩陣會變成常量。事實上,輸出是彼此獨立的,而正是這些輸出引起了網(wǎng)絡中所有的其他波動。當輸出穩(wěn)定時,將不存在改變輸入和其他網(wǎng)絡參數(shù)的其他因素。
系統(tǒng)的反饋輸入a按照公式(4)中的時間加權(quán)平均方式計算,這與icm的動態(tài)閾值計算相似,差別在于常數(shù)v的取值不同。
其中va比動態(tài)閾值中用到的v要小很多,在這里令va=1,經(jīng)過抑制性反饋計算后的輸入為:
反饋式交叉皮層視覺模型在計算完每次迭代后進行公式(9)和(10)的運算。
2:分數(shù)冪指數(shù)濾波器(fpf):用icm對剪影圖像處理,可產(chǎn)生一個包含目標輪廓的脈沖圖像,fpf的作用是在該脈沖圖像區(qū)域進行搜索,如果有與目標邊緣相似的候選目標,則會在其相關面內(nèi)產(chǎn)生相關峰值。fpf是等相關峰綜合鑒別函數(shù)濾波器(sdf)和最小平均相關能量濾波器(mace)的擴展。
sdf的基本思想是:將某類圖像及其畸變圖像組成一個訓練集,找出綜合鑒別函數(shù),綜合鑒別函數(shù)的目的是尋求這樣一個濾波函數(shù):當正確目標輸入時,相關面內(nèi)有一相關峰值。
選出一組訓練圖像vi,令濾波器為h。sdf是輸入加權(quán)線性組合,式(6)中矩陣v是通過輸入向量的傅立葉變換的組合來創(chuàng)建的。
如式(8)用
平均最小相關能量濾波器(mace)是在綜合鑒別函數(shù)的基礎上發(fā)展而來的[14],利用mace能夠使訓練圖像相關運算后的平均相關能量最小化。
mace濾波器是通過下式計算得到:
d由式(10)構(gòu)建而來,c為式(7)提到的限制值。
其中:
n為訓練圖像個數(shù),δij是大小為d*d的對角矩陣,元素值為1,d大小為訓練圖像對角元素個數(shù)。
二維分數(shù)冪指數(shù)濾波器可按如下公式描述:
公式(14)與公式(10)一樣,冪項p=2則稱之為最小平均相關能量濾波器,p=0式稱之為鑒別函數(shù)濾波器,p處于0-2之間時稱為分數(shù)冪指數(shù)濾波器fpf。
圖6-8中顯示的是三幅不同旋轉(zhuǎn)角度下的駱駝剪影圖像,利用這三幅圖像可構(gòu)建一個fpf,不同的p值的fpf對應的空間域圖像如圖9-11所示??梢钥闯?,p值越大fpf對應的結(jié)果越接近訓練圖像的邊緣。
3..反饋式icm和fpf相結(jié)合的剪影識別:
在剪影識別中,如果僅用icm和fpf對目標進行識別,得到的只是目標圖像的增強,非目標圖像依然存在,為了使效果更好,利用反饋式icm對結(jié)果圖像再進行處理,最后得到只有目標圖像存在的圖像?;诖?,利用反饋式icm結(jié)合fpf形成一個閉環(huán)系統(tǒng)實現(xiàn)剪影識別。
圖12中顯示了系統(tǒng)的工作流程:首先對輸入的剪影圖像進行icm迭代產(chǎn)生邊緣激發(fā)的圖像,再對該圖像進行邊緣增強。輸入訓練圖像到fpf中,得到邊緣增強的圖像。在原始圖像邊緣增強后的結(jié)果與fpf進行相關運算,得到相關峰值,對相關峰值最大點的區(qū)域進行修改,再把修改后的圖像作為原始圖像輸入系統(tǒng),最后得到目標圖像在原圖像上的增強。
實驗步驟:
步驟1:對輸入的剪影圖像進行icm迭代產(chǎn)生邊緣激發(fā)的圖像,再對該圖像進行邊緣增強。
步驟2:輸入訓練圖像到fpf中,得到邊緣增強的圖像。
步驟3:將原始圖像邊緣增強后的結(jié)果與fpf進行相關運算,得到相關峰值。
步驟4:對相關峰值最大點的區(qū)域進行修改。
步驟5:把修改后的圖像作為原始圖像輸入系統(tǒng),最后得到目標圖像上的增強。
實驗中對系統(tǒng)性能進行測試,選用了kimia剪影數(shù)據(jù)進行測試:
(1)、輸入原始待識別圖像和訓練圖像;
(2)、取fpf冪項p為0.3,原始待識別圖像經(jīng)過icm后的圖像與訓練后的fpf相關得到的峰值為0.99;
(3)、設置不同的峰值門限,會得到不同的反饋增強的結(jié)果??梢缘玫剑旈撝甸T限越大時,系統(tǒng)識別效果越好;
(4)、取p=0.4,產(chǎn)生的相關峰值為0.1;
(5)、再依次增大閾值門限可以得到和(3)中相同的結(jié)果。即閾值門限越大識別效果越好;
(6)、依次增大p的取值,重復(3)中的步驟可得p值越大圖像邊緣越明顯,與原始圖像產(chǎn)生的相關峰值越大,識別效果越好。