圖像實(shí)時處理方法
【專利摘要】本發(fā)明提供了一種圖像實(shí)時處理方法,用于識別圖像中的特征,包括視覺掃描、中心外圍差運(yùn)算、灰度顯著圖獲取、注視點(diǎn)搜索、重點(diǎn)區(qū)域確定;采取遞進(jìn)式訓(xùn)練將重點(diǎn)區(qū)域的像素灰度信號直接通過已訓(xùn)練的網(wǎng)絡(luò)層次模型,獲取重點(diǎn)特征區(qū)域的本質(zhì)特征直接進(jìn)行識別。本發(fā)明按照視覺顯著性強(qiáng)弱順序串行選擇和識別圖像目標(biāo),提高了圖像分析與識別的效率和準(zhǔn)確性、適應(yīng)性強(qiáng)、通用性好。
【專利說明】圖像實(shí)時處理方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理,特別涉及一種用于環(huán)境檢測的圖像實(shí)時特征識別方法和裝 置。
【背景技術(shù)】
[0002] 隨著計算機(jī)技術(shù)、自動控制技術(shù)以及信息和軟件技術(shù)迅速地引入環(huán)境保護(hù)領(lǐng)域, 自動化、智能化已經(jīng)成為遙感環(huán)境監(jiān)測技術(shù)發(fā)展的重要方向。計算機(jī)視覺技術(shù)以其信息量 大、精度高、檢測范圍大等特點(diǎn),在基于遙感水質(zhì)的檢測領(lǐng)域得到了廣泛的應(yīng)用。而遙感圖 像檢測的結(jié)果將作為水質(zhì)分析和污染物評定的重要依據(jù)。評定遙感圖像檢測結(jié)果有兩種方 法:人工評定和計算機(jī)圖像識別評定。
[0003] 傳統(tǒng)的特征檢測方法主要由監(jiān)測人員手工完成。目前實(shí)際生產(chǎn)中,主要采取的方 式是人工分析遙感圖像,憑經(jīng)驗(yàn)確定有無污染及污染的類型、位置等,由此評定水質(zhì),例如 海洋溢油事故。人工評定方式受人為因素及外界條件的影響,效率低、不可靠、一致性差。采 用計算機(jī)圖像處理技術(shù),對遙感圖像特征進(jìn)行分析、檢測和識別,可以較好的解決人工評定 的上述問題,使水域質(zhì)量評定更科學(xué)、客觀。
[0004] 遙感圖像檢測識別中仍然存在較多還未解決的問題,主要有:(1)復(fù)雜大背景下 微小及微弱目標(biāo)的識別問題,對此采用何種更具針對性的圖像處理算法;(2)如何解決遙 感圖像灰度對比度低、不均勻、存在較大的起伏及圖像背景復(fù)雜、噪聲多等不利因素,進(jìn)一 步提高識別準(zhǔn)確率及可靠性問題;(3)特征描述的有效性問題。如何對類型多樣、形狀各異 的特征進(jìn)行有效描述,以能準(zhǔn)確識別的問題;(4)方法的適應(yīng)性和通用性問題。遙感圖像千 變?nèi)f化,如何提高特征識別方法的適應(yīng)性和通用性問題等;(5)特征分類識別方法問題,目 前采用的神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等方法還存在不少問題,目前所有方法中實(shí)驗(yàn)中正確識別 率通常為85%左右,如果是針對具有噪聲較強(qiáng)和對比度較低的圖片(如海洋遙感圖像),且 特征面積較小,及實(shí)驗(yàn)環(huán)境和實(shí)際生產(chǎn)環(huán)境的差異,識別正確率更低。以海洋環(huán)境為例,復(fù) 雜的情況會對油膜的光譜特征造成影響,降低油膜識別精度。目前,對油膜波譜響應(yīng)特征的 識別主要基于海上試驗(yàn)獲取的光譜數(shù)據(jù)(點(diǎn)數(shù)據(jù)),利用地物光譜儀獲得油在可見光近紅 外波段的光譜特征,分析油膜的光譜特征變化及油水反差規(guī)律。基于點(diǎn)的光譜數(shù)據(jù)無法提 供油膜分布信息,影響海上油膜應(yīng)急水平的實(shí)質(zhì)性提高。
[0005] 因此,針對相關(guān)技術(shù)中所存在的上述問題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0006] 為解決上述現(xiàn)有技術(shù)所存在的問題,本發(fā)明提出了一種遙感圖像特征識別的有效 方法。
[0007] 本發(fā)明采用如下技術(shù)方案:一種圖像實(shí)時處理方法,用于對圖像中的特征進(jìn)行識 另1J,包括:
[0008] 步驟一:對灰度遙感圖像進(jìn)行視覺掃描,搜索各掃描線的中央點(diǎn),通過中心外圍差 運(yùn)算,獲得遙感圖像的顯著圖和注視點(diǎn);根據(jù)自適應(yīng)梯度門限值計算方法,利用自適應(yīng)中心 外圍差門限值和各注視點(diǎn)的顯著性級別確定重點(diǎn)特征區(qū)域;
[0009] 步驟二:基于卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造遞進(jìn)式訓(xùn)練網(wǎng)絡(luò),從初始網(wǎng)絡(luò)開始,利用預(yù)設(shè)網(wǎng)絡(luò) 生長規(guī)則進(jìn)行生長;基于上述遞進(jìn)式訓(xùn)練網(wǎng)絡(luò),將重點(diǎn)區(qū)域的像素灰度信號輸入已訓(xùn)練的 卷積神經(jīng)網(wǎng)絡(luò)層次模型,獲取重點(diǎn)特征區(qū)域的遞進(jìn)式訓(xùn)練本質(zhì)特征,從而得到遙感圖像特 征。
[0010] 優(yōu)選地,在步驟一的確定重點(diǎn)特征區(qū)域中,基于對各注視點(diǎn)的顯著性級別的排序 來順序處理顯著區(qū)域,如注視點(diǎn)的顯著性級別S(Xi,yj) > T,則該注視點(diǎn)為重點(diǎn)特征區(qū)域, 其中T為預(yù)設(shè)判定門限值。
[0011] 優(yōu)選地,所輸入的圖像為獲得的感興趣區(qū)域,大小按比例規(guī)范為32X32 ;
[0012] 所述卷積網(wǎng)絡(luò)的結(jié)構(gòu)共有7層,每層都包含可訓(xùn)練參數(shù),分別為:
[0013] 卷積層C1,由兩個5X5卷積核卷積輸入圖像獲得,由2個特征圖構(gòu)成,特征圖中每 個神經(jīng)元與輸入中5X5的鄰域相連;特征圖的大小為28X28,包括52個可訓(xùn)練參數(shù),連接 數(shù)為 52X (28X28)個;
[0014] 下采樣層S2,對圖像進(jìn)行子抽樣獲得,具有2個14 X 14的特征圖,特征圖中的每個 單元與C1中相對應(yīng)特征圖的2 X 2鄰域相連接,每個單元的4個輸入相加,乘以一個可訓(xùn)練 參數(shù),再加上一個可訓(xùn)練偏置,結(jié)果通過高斯函數(shù)計算,每個特征圖的大小是C1中特征圖 大小的1/4,有4個可訓(xùn)練參數(shù)和4X (14X14)個連接;
[0015] 卷積層C3,通過3種不同的5X5卷積核去卷積層S2,由3張10X 10特征圖組成, 每張含10X 10個神經(jīng)元,每個特征圖連接到S2中的1個或者2個特征圖;
[0016] 下采樣層S4,由16個5X5大小的特征圖構(gòu)成,每個單元與C3中相應(yīng)特征圖的 2X2鄰域相連接,具有4個可訓(xùn)練參數(shù);
[0017] 卷積層C5,有100個特征圖,每個單元與S4層的全部單元的5X5鄰域相連,特征 圖的大小為1X1,構(gòu)成了 S4和C5之間的全連接;
[0018] 點(diǎn)積計算層F6,與C5全相連,計算輸入向量和權(quán)重向量之間的點(diǎn)積,再加上一個 偏置,然后將其傳遞給高斯函數(shù)產(chǎn)生單元的一個狀態(tài);
[0019] 其中所述卷積網(wǎng)絡(luò)連接輸出層,其由歐氏徑向基函數(shù)單元組成,計算輸入向量和 參數(shù)向量之間的歐氏距離,該向量在F6高斯的范圍內(nèi),防止高斯函數(shù)飽和。
[0020] 優(yōu)選地,所述步驟二的生長規(guī)則進(jìn)一步定義為:
[0021] 所述(:1、52、03、54層同步匹配生長,各層特征圖數(shù)量為乂1、隊 2、乂3、隊4,(:1特征圖 每次生長數(shù)量為2 ;S2的特征圖數(shù)量與C1層相同;C3的前Ml個特征圖以S2中NS2/2個相 鄰的特征圖子集為輸入;接下來的M2個特征圖以S2中NS2/2+1個相鄰特征圖子集為輸入, 然后M3個以不相鄰的(NS2/2)+l個特征圖子集為輸入,最后一個將S2中所有特征圖為輸 入,C3的特征圖數(shù)量為M1+M2+M3+1 ;S4的特征圖數(shù)量與C3相同;其中Ml表示以S2中NS2/2 個相鄰的特征圖子集為輸入的特征圖數(shù)量、M2表示以S2中N S2/2+l個相鄰特征圖子集為輸 入的特征圖數(shù)量、M3表示以S2中NS2/2+1個不相鄰特征圖子集為輸入的特征圖數(shù)量;
[0022] 設(shè)定樣本訓(xùn)練時網(wǎng)絡(luò)的平均誤差指標(biāo)和誤差收斂速度門限值,訓(xùn)練初始網(wǎng)絡(luò),當(dāng) 平均誤差沒有達(dá)到所述指標(biāo)時,則生長網(wǎng)絡(luò)結(jié)構(gòu),如果平均誤差達(dá)到所述指標(biāo),則考察樣本 誤差收斂速度,如收斂速度沒有超過設(shè)定門限值,則繼續(xù)生長網(wǎng)絡(luò)結(jié)構(gòu),直到收斂速度達(dá)到 門限值。
[0023] 相比于現(xiàn)有技術(shù),本發(fā)明的技術(shù)方案的具有以下優(yōu)點(diǎn):
[0024] (1)利用關(guān)注機(jī)制快速聚焦于遙感圖像重點(diǎn)特征區(qū)域,使圖像數(shù)據(jù)處理量大大減 少,保證了算法有較高的效率,減少無關(guān)數(shù)據(jù)干擾同時提高算法準(zhǔn)確性;
[0025] (2)采取遞進(jìn)式訓(xùn)練,應(yīng)用于圖像識別,提升了準(zhǔn)確性,而且避免了人工特征抽取 的時間消耗,從而提高了計算效率,可為視覺特征檢測領(lǐng)域研究提供新的思路。
【專利附圖】
【附圖說明】
[0026] 圖la是根據(jù)本發(fā)明實(shí)施例的遙感圖像特征自動識別的方法流程圖。
[0027] 圖lb是根據(jù)本發(fā)明實(shí)施例的遙感圖像掃描線的灰度分布曲線圖。
[0028] 圖2是根據(jù)本發(fā)明實(shí)施例的初始網(wǎng)絡(luò)CN1結(jié)構(gòu)的層次示意圖。
[0029] 圖3是根據(jù)本發(fā)明實(shí)施例的卷積和子采樣過程的示意圖。
[0030] 圖4是根據(jù)本發(fā)明實(shí)施例的C3層與S2層神經(jīng)元連接方式表。
[0031] 圖5是根據(jù)本發(fā)明實(shí)施例的層次網(wǎng)絡(luò)CN1的訓(xùn)練過程示意圖。
[0032] 圖6是根據(jù)本發(fā)明實(shí)施例的層次網(wǎng)絡(luò)CN2的訓(xùn)練過程示意圖。
[0033] 圖7是根據(jù)本發(fā)明實(shí)施例的層次網(wǎng)絡(luò)CN3的訓(xùn)練過程示意圖。
[0034] 圖8是根據(jù)本發(fā)明實(shí)施例的層次網(wǎng)絡(luò)CN4的訓(xùn)練過程示意圖。
[0035] 圖9是根據(jù)本發(fā)明實(shí)施例的層次網(wǎng)絡(luò)CN3的結(jié)構(gòu)層次示意圖。
[0036] 圖10是根據(jù)本發(fā)明實(shí)施例的C3層與S2層神經(jīng)元的連接方式表。
[0037] 圖11是根據(jù)本發(fā)明實(shí)施例的層次網(wǎng)絡(luò)CN3的實(shí)驗(yàn)結(jié)果示意圖。
【具體實(shí)施方式】
[0038] 多種方式可以用于(包括實(shí)施為過程;裝置;系統(tǒng);物質(zhì)組成;在計算機(jī)可讀存儲 介質(zhì)上包括的計算機(jī)程序產(chǎn)品;和/或處理器(諸如如下處理器,該處理器被配置成執(zhí)行在 耦合到處理器的存儲器上存儲的和/或由該存儲器提供的指令))實(shí)施本發(fā)明。在本說明 書中,這些實(shí)施或者本發(fā)明可以采用的任何其他形式可以稱為技術(shù)。一般而言,可以在本發(fā) 明的范圍內(nèi)變更公開的過程的步驟順序。除非另有明示,描述為被配置成執(zhí)行任務(wù)的部件 (諸如處理器或者存儲器)可以實(shí)施為被臨時配置成在給定時間執(zhí)行該任務(wù)的一般部件或 者被制造成執(zhí)行該任務(wù)的具體部件。
[0039] 下文與圖示本發(fā)明原理的附圖一起提供對本發(fā)明一個或者多個實(shí)施例的詳細(xì)描 述。結(jié)合這樣的實(shí)施例描述本發(fā)明,但是本發(fā)明不限于任何實(shí)施例。本發(fā)明的范圍僅由權(quán) 利要求書限定,并且本發(fā)明涵蓋諸多替代、修改和等同物。在下文描述中闡述諸多具體細(xì)節(jié) 以便提供對本發(fā)明的透徹理解。出于示例的目的而提供這些細(xì)節(jié),并且無這些具體細(xì)節(jié)中 的一些或者所有細(xì)節(jié)也可以根據(jù)權(quán)利要求書實(shí)現(xiàn)本發(fā)明。
[0040] 本發(fā)明的目的在于針對現(xiàn)有遙感圖像檢測存在的難點(diǎn)及現(xiàn)有技術(shù)的不足,將關(guān)注 機(jī)制引入遙感圖像分析中,提出一種遙感圖像特征的有效方法,克服現(xiàn)有技術(shù)中存在的問 題。
[0041] 傳統(tǒng)方法需對所有遙感圖像區(qū)域同等看待、進(jìn)行同等的檢測與分析,但實(shí)際上所 關(guān)心的重點(diǎn)特征區(qū)域通常僅占遙感圖像整體圖像中非常小的一部分,可能不到1%的比例, 甚至更少。這不但造成了特征檢測識別系統(tǒng)的計算資源與計算時間的浪費(fèi),而且加重檢測 識別的分析難度、降低準(zhǔn)確性。本發(fā)明將人眼選擇性關(guān)注機(jī)制引入到遙感圖像特征目標(biāo)的 檢測中,通過模擬人眼視覺的掃描來進(jìn)行自適應(yīng)中心外圍差計算來直接獲得顯著圖的方 法,以迅速有效地減少圖像處理的數(shù)據(jù)量,提高檢測速度;更重要的是有效地消除無效數(shù)據(jù) 對特征檢測區(qū)域的干擾,有助于提高檢測精度和準(zhǔn)確度。并且,采取遞進(jìn)式訓(xùn)練將重點(diǎn)區(qū)域 的像素灰度信號直接通過已訓(xùn)練的網(wǎng)絡(luò)層次模型,獲取重點(diǎn)特征區(qū)域的本質(zhì)特征直接進(jìn)行 識別。
[0042] 圖1是根據(jù)本發(fā)明實(shí)施例的遙感圖像特征自動識別的方法流程圖。如圖1所示, 實(shí)施本發(fā)明的具體步驟如下:
[0043] 步驟一:獲取遙感圖像的顯著圖。通過直接對灰度遙感圖像進(jìn)行視覺掃描,搜索各 掃描線的中央點(diǎn),通過中心外圍差運(yùn)算,獲得遙感圖像的顯著圖和注視點(diǎn)。
[0044] 人類視覺神經(jīng)元對位于其感受野中央小區(qū)域的刺激最敏感,而中央?yún)^(qū)周圍的更 廣、更弱區(qū)域內(nèi)的刺激將抑制該神經(jīng)元的響應(yīng)。這種對局部空間具有不連續(xù)性的敏感結(jié)構(gòu) 特別適用于檢測局部顯著性較強(qiáng)的區(qū)域,這即是生物感受野的線性中心外圍操作。本發(fā)明 對強(qiáng)度特征的計算,是通過線掃描及計算自適應(yīng)中心外圍差門限值的方式來獲得視點(diǎn)中央 與周圍部分的差值,從而實(shí)現(xiàn)與生物感受野類似的線性中心外圍操作。
[0045] 步驟二:判定遙感圖像重點(diǎn)區(qū)域。根據(jù)自適應(yīng)梯度門限值計算方法,利用自適應(yīng)中 心外圍差門限值和各注視點(diǎn)的顯著性級別,確定重點(diǎn)特征區(qū)域,從而對這些重點(diǎn)特征區(qū)域 進(jìn)行優(yōu)先、細(xì)致的處理,提高遙感圖像特征檢測的效率和準(zhǔn)確性;
[0046] 具體地,根據(jù)各注視點(diǎn)的顯著性級別排序標(biāo)記,級別高的顯著區(qū)域優(yōu)先處理。
[0047] 步驟三:基于卷積神經(jīng)網(wǎng)絡(luò)的遞進(jìn)式訓(xùn)練網(wǎng)絡(luò)構(gòu)造,利用卷積網(wǎng)絡(luò)的生長方法,從 初始網(wǎng)絡(luò)開始,根據(jù)生長規(guī)則,自動生長到識別能力和檢測效率都達(dá)到期望門限值。
[0048] 類似于生物視覺神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)具有層次化和局部感知區(qū)域抽取特征的 特點(diǎn),適當(dāng)增加各層感知器的數(shù)量,能夠提高網(wǎng)絡(luò)中各層所能抽取的特征數(shù)量,提高網(wǎng)絡(luò)的 識別能力,相對于與噪音、平移和擾動的魯棒性也會更好,但前提是在樣本數(shù)量滿足的情況 下。如樣本數(shù)量相對不足,可能造成復(fù)雜卷積網(wǎng)絡(luò)訓(xùn)練不充分,而使識別能力降低;且即使 樣本數(shù)量充足,卷積網(wǎng)絡(luò)規(guī)模增大,運(yùn)算量也會成倍增加,可能造成識別能力提高少許,而 檢測效率降低很多。合適的卷積神經(jīng)網(wǎng)絡(luò)應(yīng)該同時兼顧識別能力和檢測速度。
[0049] 有鑒于此,本發(fā)明改進(jìn)了卷積網(wǎng)絡(luò)的生長方法,從初始網(wǎng)絡(luò)開始,根據(jù)生長規(guī)則, 自動生長到識別能力和檢測效率都達(dá)到期望門限值為止。初始網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
[0050] 該卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)共有7層,不包含輸入,每層都包含可訓(xùn)練參數(shù)(連接權(quán) 重)。輸入圖像為獲得的感興趣區(qū)域,大小按比例規(guī)范為32X32。潛在的明顯特征如溢油 等能夠出現(xiàn)在最高層特征監(jiān)測子感受野的中心。
[0051] C1層是一個卷積層,是兩個5X5卷積核卷積輸入圖像獲得,由2個特征圖構(gòu)成。 特征圖中每個神經(jīng)元與輸入中5X5的鄰域相連。特征圖的大小為28X28。C1有52個 可訓(xùn)練參數(shù)(每個濾波器5X5 = 25個unit參數(shù)和一個bias參數(shù),一共2個濾波器,共 (5X5+1) X2 = 52 個參數(shù)),共 52X (28X28)個連接。
[0052] S2層是一個下采樣層,是利用圖像局部相關(guān)性的原理,對圖像進(jìn)行子抽樣獲得,有 2個14X14的特征圖。特征圖中的每個單元與C1中相對應(yīng)特征圖的2X2鄰域相連接。S2 層每個單元的4個輸入相加,乘以一個可訓(xùn)練參數(shù),再加上一個可訓(xùn)練偏置。結(jié)果通過高斯 函數(shù)計算??捎?xùn)練系數(shù)和偏置控制著高斯函數(shù)的非線性程度。如果系數(shù)比較小,那么運(yùn)算 近似于線性運(yùn)算,亞采樣相當(dāng)于模糊圖像。如果系數(shù)比較大,根據(jù)偏置的大小亞采樣可以被 看成是有噪聲的"或"運(yùn)算或者有噪聲的"與"運(yùn)算。每個單元的2X 2感受野并不重疊,因 此S2中每個特征圖的大小是C1中特征圖大小的1/4 (行和列各1/2)。S2層有4個可訓(xùn)練 參數(shù)和共4 X (14 X 14)個連接。
[0053] 如圖3所示,卷積過程包括:用一個可訓(xùn)練的濾波器仁去卷積一個輸入的圖像(第 一階段是輸入的圖像,后面的階段就是卷積特征map 了),然后加一個偏置bx,得到卷積層 Cx。子采樣過程包括:每鄰域四個像素求和變?yōu)橐粋€像素,然后通過標(biāo)量Wx+1加權(quán),再增加 偏置b x+1,然后通過一個高斯激活函數(shù),產(chǎn)生一個大概縮小四倍的特征映射圖Sx+1。
[0054] 所以從一個平面到下一個平面的映射可以看作是作卷積運(yùn)算,S-層可看作是模糊 濾波器,起到二次特征提取的作用。隱層與隱層之間空間分辨率遞減,而每層所含的平面數(shù) 遞增,這樣可用于檢測更多的特征信息。
[0055] C3層也是一個卷積層,通過3種不同的5X5卷積核去卷積層S2,由3張10X 10 特征圖組成,即每張含10X 10個神經(jīng)元。C3中的每個特征圖連接到S2中的所有1個或者 2個特征圖,表示本層的特征圖是上一層提取到的特征圖的不同組合,如圖4所示。由于不 同的特征圖有不同的輸入,所以能抽取不同的特征。正如人的視覺系統(tǒng)一樣,底層的結(jié)構(gòu)構(gòu) 成上層更抽象的結(jié)構(gòu),例如邊緣構(gòu)成形狀或者目標(biāo)的部分。
[0056] S4層是一個下采樣層,由16個5X5大小的特征圖構(gòu)成。特征圖中的每個單元與 C3中相應(yīng)特征圖的2X2鄰域相連接,跟C1和S2之間的連接一樣。S4層有4個可訓(xùn)練參 數(shù)(每個特征圖1個因子和一個偏置)。
[0057] C5層是一個卷積層,有100個特征圖(有輸出層和F6層決定)。每個單元與S4層 的全部單元的5X5鄰域相連。由于S4層特征圖的大小也為5X5(同卷積核一樣),故C5 特征圖的大小為1X1 :這構(gòu)成了 S4和C5之間的全連接。
[0058] F6層有個50單元(由輸出層的設(shè)計決定),與C5層全相連。如同經(jīng)典神經(jīng)網(wǎng)絡(luò), F6層計算輸入向量和權(quán)重向量之間的點(diǎn)積,再加上一個偏置。然后將其傳遞給高斯函數(shù)產(chǎn) 生單元的一個狀態(tài)。
[0059] 輸出層由歐氏徑向基函數(shù)(Euclidean Radial Basis Function)單兀即RBF單兀 組成,每類一個單元,每個有50個輸入。即每個輸出RBF單元計算輸入向量和參數(shù)向量之 間的歐氏距離。輸入離參數(shù)向量越遠(yuǎn),RBF輸出的越大。RBF參數(shù)向量起著F6層目標(biāo)向量 的角色。這些向量的是+1或-1,這正好在F6高斯的范圍內(nèi),因此可以防止高斯函數(shù)飽和。 實(shí)際上,+1和-1是高斯函數(shù)的最大彎曲的點(diǎn)處。這使得F6單元運(yùn)行在最大非線性范圍內(nèi)。 必須避免高斯函數(shù)的飽和,因?yàn)檫@將會導(dǎo)致?lián)p失函數(shù)較慢的收斂和病態(tài)問題。
[0060] 本發(fā)明優(yōu)選的實(shí)施例采用以下網(wǎng)絡(luò)生長規(guī)則:
[0061] 1)為了確保存在主要的特征圖組合,網(wǎng)絡(luò)結(jié)構(gòu)的C1層、S2層、C3層、S4層同步匹 配生長,設(shè)各層特征圖數(shù)量為^^^。^。匹配生長規(guī)則為:^特征圖每次生長數(shù)量為 2 ;S2層的特征圖數(shù)量與C1層相同;C3的前Ml個特征圖以S2中NS2/2個相鄰的特征圖子 集為輸入;接下來的M2個特征圖以S2中N S2/2+l個相鄰特征圖子集為輸入。然后M3個以 不相鄰的(NS2/2)+l個特征圖子集為輸入。最后一個將S2中所有特征圖為輸入,因此C3的 特征圖數(shù)量為M1+M2+M3+1 ;S4層的特征圖數(shù)量與C3層相同。其中Ml表示以S2中NS2/2個 相鄰的特征圖子集為輸入的特征圖數(shù)量、M2表示以S2中NS2/2+l個相鄰特征圖子集為輸入 的特征圖數(shù)量、M3表示以S2中NS2/2+1個不相鄰特征圖子集為輸入的特征圖數(shù)量。
[0062] 2)設(shè)定樣本訓(xùn)練時網(wǎng)絡(luò)的平均誤差指標(biāo)和和誤差收斂速度門限值。訓(xùn)練初始卷積 神經(jīng)網(wǎng)絡(luò),如平均誤差沒有達(dá)到指標(biāo),則生長網(wǎng)絡(luò)結(jié)構(gòu),直到平均誤差達(dá)到設(shè)定要求,這時 的網(wǎng)絡(luò)結(jié)構(gòu)基本可用。
[0063] 3)平均誤差達(dá)到設(shè)定要求后,即考察樣本誤差收斂速度,如收斂速度沒有超過設(shè) 定門限值,說明平均誤差還有進(jìn)一步提高空間。則繼續(xù)生長網(wǎng)絡(luò)結(jié)構(gòu),直到收斂速度達(dá)到門 限值。此時,網(wǎng)絡(luò)結(jié)構(gòu)成型,誤差收斂速度符合要求,同時具有較低的平均誤差。
[0064] 步驟四:基于遞進(jìn)式訓(xùn)練網(wǎng)絡(luò)的遙感圖像特征識別,將重點(diǎn)區(qū)域的像素灰度信號 直接通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)層次模型,獲取重點(diǎn)特征區(qū)域的遞進(jìn)式訓(xùn)練本質(zhì)特征直接 進(jìn)行識別。
[0065] 把上述步驟二獲得的依顯著性級別排序標(biāo)記的重點(diǎn)區(qū)域作為重點(diǎn)分析對象,重點(diǎn) 區(qū)域按比例規(guī)范為32X32的灰度圖像,保證潛在的明顯特征如溢油痕跡等能夠出現(xiàn)在最 高層特征監(jiān)測子感受野的中心,其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入圖像。將32X32像素點(diǎn)的灰度 信號作為網(wǎng)絡(luò)的輸入,直接通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)層次模型,獲取重點(diǎn)特征區(qū)域的50 個遞進(jìn)式訓(xùn)練本質(zhì)特征,通過輸出層徑向基網(wǎng)絡(luò)直接進(jìn)行識別,輸出為特征類型。
[0066] 為進(jìn)一步闡述本發(fā)明,以下將以圖2的初始網(wǎng)絡(luò)的實(shí)際訓(xùn)練情況為例,具體描述 的本發(fā)明方法的實(shí)施例。
[0067] 用600個樣本對上述初始網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練過程中的誤分類曲線如圖所示,平 均誤差未達(dá)到要求,網(wǎng)絡(luò)迭代36次后,訓(xùn)練收斂時誤差率超過16%,如圖5所示。
[0068] 根據(jù)網(wǎng)絡(luò)生長規(guī)則對初始網(wǎng)絡(luò)進(jìn)行一次生長得到層次網(wǎng)絡(luò)CN2, Cl、S2層特征圖 數(shù)量生長為4, C3、S4特征圖數(shù)量匹配生長為9,生長后網(wǎng)絡(luò)結(jié)構(gòu)CN2如圖6所示。訓(xùn)練過 程中的誤分類曲線如圖所示,網(wǎng)絡(luò)迭代36次后,訓(xùn)練收斂時誤差率超11%。訓(xùn)練后平均誤 差仍未達(dá)到要求。
[0069] 再次對網(wǎng)絡(luò)進(jìn)行生長獲得層次網(wǎng)絡(luò)CN3, Cl、S2層特征圖數(shù)量生長為6, C3、S4特 征圖數(shù)量匹配生長為16。訓(xùn)練后平均誤差達(dá)到指標(biāo),且誤差收斂速度小于設(shè)定門限值,訓(xùn)練 過程如圖7所示。繼續(xù)對網(wǎng)絡(luò)中各層進(jìn)行生長形成層次網(wǎng)絡(luò)CN4,其中C1層和S2層增加 到8個,相對應(yīng)的C3層和S4層為24個,生長后,網(wǎng)絡(luò)需訓(xùn)練參數(shù)也大大增加,訓(xùn)練過程中 的誤分類曲線如圖8所示,由于樣本數(shù)量不充足的原因,訓(xùn)練已不能收斂。因此,決定最終 的網(wǎng)絡(luò)結(jié)構(gòu)如圖9所示。
[0070] C1卷積層,由6個特征圖構(gòu)成。特征圖中每個神經(jīng)元與輸入中5X5的鄰域相連。 特征圖的大小為28X28。C1有156個可訓(xùn)練參數(shù)(每個濾波器5X5 = 25個unit參數(shù) 和一個bias參數(shù),一共6個濾波器,共(5 X 5+1) X 6 = 156個參數(shù)),共156 X (28 X 28)= 122, 304個連接。
[0071] S2下采樣層,有6個14X14的特征圖。特征圖中的每個單元與C1中相對應(yīng)特征 圖的2X2鄰域相連接。S2層每個單元的4個輸入相加,乘以一個可訓(xùn)練參數(shù),再加上一個 可訓(xùn)練偏置。結(jié)果通過高斯函數(shù)計算。每個單元的2X2感受野并不重疊,因此S2中每個 特征圖的大小是C1中特征圖大小的1/4 (行和列各1/2)。S2層有12個可訓(xùn)練參數(shù)和5880 個連接。
[0072] C3卷積層,通過16種不同的5X 5的卷積核去卷積層S2得到的16個特征圖,每個 含10X10個神經(jīng)元。C3的前6個特征圖以S2中3個相鄰的特征圖子集為輸入。接下來6 個特征圖以S2中4個相鄰特征圖子集為輸入。然后的3個以不相鄰的4個特征圖子集為 輸入。最后一個將S2中所有特征圖為輸入。這樣C3層有1516個可訓(xùn)練參數(shù)和151600個 連接。如圖10所示
[0073] S4下采樣層,由16個5X5大小的特征圖構(gòu)成。特征圖中的每個單元與C3中相應(yīng) 特征圖的2X2鄰域相連接,跟C1和S2之間的連接一樣。S4層有32個可訓(xùn)練參數(shù)(每個 特征圖1個因子和一個偏置)和2000個連接。
[0074] C5層、F6層及輸出層的結(jié)構(gòu)和神經(jīng)元數(shù)量與初始網(wǎng)絡(luò)相同。
[0075] 成型的層次卷積神經(jīng)網(wǎng)絡(luò)CN3在實(shí)驗(yàn)中的誤分類率曲線如圖11所示。從圖中可 知,在進(jìn)行到42次迭代以后,訓(xùn)練的誤分類率達(dá)到最低點(diǎn)的8. 5 %,繼續(xù)訓(xùn)練誤分類率有所 降低,但測試的誤分率在第46次迭代后上升,但隨后保持基本穩(wěn)定,因此,層次網(wǎng)絡(luò)在第45 次迭代完成后網(wǎng)絡(luò)訓(xùn)練收斂,訓(xùn)練的誤分類率5%,測試的誤分類率為6. 5%。
[0076] 綜上所述,本發(fā)明克服了傳統(tǒng)缺陷,可以較好的解決人工因素造成效率低、不可 靠、一致性差的問題。無需其他圖像預(yù)處理,克服了傳統(tǒng)遙感特征圖像檢測方法適應(yīng)性不 強(qiáng),通用性不好,效率低、難以檢測微弱特征的問題。
[0077] 顯然,本領(lǐng)域的技術(shù)人員應(yīng)該理解,上述的本發(fā)明的各模塊或各步驟可以用通用 的計算系統(tǒng)來實(shí)現(xiàn),它們可以集中在單個的計算系統(tǒng)上,或者分布在多個計算系統(tǒng)所組成 的網(wǎng)絡(luò)上,可選地,它們可以用計算系統(tǒng)可執(zhí)行的程序代碼來實(shí)現(xiàn),從而,可以將它們存儲 在存儲系統(tǒng)中由計算系統(tǒng)來執(zhí)行。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
[0078] 應(yīng)當(dāng)理解的是,本發(fā)明的上述【具體實(shí)施方式】僅僅用于示例性說明或解釋本發(fā)明的 原理,而不構(gòu)成對本發(fā)明的限制。因此,在不偏離本發(fā)明的精神和范圍的情況下所做的任何 修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。此外,本發(fā)明所附權(quán)利要求旨 在涵蓋落入所附權(quán)利要求范圍和邊界、或者這種范圍和邊界的等同形式內(nèi)的全部變化和修 改例。
【權(quán)利要求】
1. 一種圖像實(shí)時處理方法,用于對圖像中的特征進(jìn)行識別,其特征在于,包括: 步驟一:對灰度遙感圖像進(jìn)行視覺掃描,搜索各掃描線的中央點(diǎn),通過中心外圍差運(yùn) 算,獲得遙感圖像的顯著圖和注視點(diǎn);根據(jù)自適應(yīng)梯度門限值計算方法,利用自適應(yīng)中心外 圍差門限值和各注視點(diǎn)的顯著性級別確定重點(diǎn)特征區(qū)域; 步驟二:基于卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造遞進(jìn)式訓(xùn)練網(wǎng)絡(luò),從初始網(wǎng)絡(luò)開始,利用預(yù)設(shè)網(wǎng)絡(luò)生長 規(guī)則進(jìn)行生長;基于上述遞進(jìn)式訓(xùn)練網(wǎng)絡(luò),將重點(diǎn)區(qū)域的像素灰度信號輸入已訓(xùn)練的卷積 神經(jīng)網(wǎng)絡(luò)層次模型,獲取重點(diǎn)特征區(qū)域的遞進(jìn)式訓(xùn)練本質(zhì)特征,從而得到遙感圖像特征。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟一的確定重點(diǎn)特征區(qū)域中,基于對 各注視點(diǎn)的顯著性級別的排序來順序處理顯著區(qū)域,如注視點(diǎn)的顯著性級別S( Xi,yj) > T, 則該注視點(diǎn)為重點(diǎn)特征區(qū)域,其中T為預(yù)設(shè)判定門限值。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所輸入的圖像為獲得的感興趣區(qū)域,大小 按比例規(guī)范為32X32 ; 所述卷積網(wǎng)絡(luò)的結(jié)構(gòu)共有7層,每層都包含可訓(xùn)練參數(shù),分別為: 卷積層C1,由兩個5X5卷積核卷積輸入圖像獲得,由2個特征圖構(gòu)成,特征圖中每個神 經(jīng)元與輸入中5X5的鄰域相連;特征圖的大小為28X28,包括52個可訓(xùn)練參數(shù),連接數(shù)為 52 X (28X28)個; 下采樣層S2,對圖像進(jìn)行子抽樣獲得,具有2個14Χ 14的特征圖,特征圖中的每個單 元與C1中相對應(yīng)特征圖的2 X 2鄰域相連接,每個單元的4個輸入相加,乘以一個可訓(xùn)練參 數(shù),再加上一個可訓(xùn)練偏置,結(jié)果通過高斯函數(shù)計算,每個特征圖的大小是C1中特征圖大 小的1/4,有4個可訓(xùn)練參數(shù)和4Χ (14X14)個連接; 卷積層C3,通過3種不同的5X5卷積核去卷積層S2,由3張10Χ 10特征圖組成,每張 含10X10個神經(jīng)元,每個特征圖連接到S2中的1個或者2個特征圖; 下采樣層S4,由16個5 X 5大小的特征圖構(gòu)成,每個單元與C3中相應(yīng)特征圖的2 X 2鄰 域相連接,具有4個可訓(xùn)練參數(shù); 卷積層C5,有100個特征圖,每個單元與S4層的全部單元的5 X 5鄰域相連,特征圖的 大小為1X1,構(gòu)成了 S4和C5之間的全連接; 點(diǎn)積計算層F6,與C5全相連,計算輸入向量和權(quán)重向量之間的點(diǎn)積,再加上一個偏置, 然后將其傳遞給高斯函數(shù)產(chǎn)生單元的一個狀態(tài); 其中所述卷積網(wǎng)絡(luò)連接輸出層,其由歐氏徑向基函數(shù)單元組成,計算輸入向量和參數(shù) 向量之間的歐氏距離,該向量在F6高斯的范圍內(nèi),防止高斯函數(shù)飽和。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟二的生長規(guī)則進(jìn)一步定義為: 所述(:1、52、03、54層同步匹配生長,各層特征圖數(shù)量為1、隊 2、乂3、隊4,(:1特征圖每次 生長數(shù)量為2 ;S2的特征圖數(shù)量與C1層相同;C3的前Ml個特征圖以S2中NS2/2個相鄰的 特征圖子集為輸入;接下來的M2個特征圖以S2中NS2/2+l個相鄰特征圖子集為輸入,然后 M3個以不相鄰的(NS2/2)+l個特征圖子集為輸入,最后一個將S2中所有特征圖為輸入,C3 的特征圖數(shù)量為M1+M2+M3+1 ;S4的特征圖數(shù)量與C3相同;其中Ml表示以S2中NS2/2個相 鄰的特征圖子集為輸入的特征圖數(shù)量、M2表示以S2中N S2/2+l個相鄰特征圖子集為輸入的 特征圖數(shù)量、M3表示以S2中NS2/2+1個不相鄰特征圖子集為輸入的特征圖數(shù)量; 設(shè)定樣本訓(xùn)練時網(wǎng)絡(luò)的平均誤差指標(biāo)和誤差收斂速度門限值,訓(xùn)練初始網(wǎng)絡(luò),當(dāng)平均 誤差沒有達(dá)到所述指標(biāo)時,則生長網(wǎng)絡(luò)結(jié)構(gòu),如果平均誤差達(dá)到所述指標(biāo),則考察樣本誤差 收斂速度,如收斂速度沒有超過設(shè)定門限值,則繼續(xù)生長網(wǎng)絡(luò)結(jié)構(gòu),直到收斂速度達(dá)到門限 值。
【文檔編號】G06T1/20GK104103033SQ201410381568
【公開日】2014年10月15日 申請日期:2014年8月5日 優(yōu)先權(quán)日:2014年8月5日
【發(fā)明者】毛力 申請人:四川九成信息技術(shù)有限公司