基于小波池化卷積神經(jīng)網(wǎng)絡的sar圖像分割方法
【技術領域】
[0001] 本發(fā)明屬于圖像處理技術領域,涉及SAR圖像分割方法,可用于目標檢測和識別。
【背景技術】
[0002] 隨著遙感技術的快速發(fā)展,SAR圖像解譯在能源、環(huán)境、考古等方面發(fā)揮越來越重 要的作用。SAR圖像分割是SAR圖像解譯中基礎而重要的一環(huán),它可以為后續(xù)的分類、檢測、 識別和跟蹤提供幫助。SAR圖像分割的主要目標是將SAR圖像劃分成沒有交集的連通區(qū)域, 完成這一目標需要對SAR圖像的每個像素進行標記,因此是一項非常困難的任務。
[0003] 現(xiàn)有的SAR圖像分割方法主要分為基于特征的方法和基于統(tǒng)計模型的方法?;?特征的方法主要是提取一些SAR圖像的特征進行分割,比如紋理特征、邊特征和混合特征 等。這些方法在SAR圖像的勻質區(qū)域取得了較好的分割效果。然而,SAR圖像是對地觀測, 總是能觀測到一些城區(qū)、森林等復雜場景。這些復雜的場景總是伴隨著尖銳的明暗變化,這 種特性使基于特征的方法受到挑戰(zhàn)。基于統(tǒng)計模型的方法將SAR圖像分割問題用概率的方 式表達,由于該類方法考慮了圖像的空間上下文關系,最近幾年受到了越來越多的關注?;?于統(tǒng)計模型的方法將圖像的特征描述為一些經(jīng)驗的分布,例如Nakagami分布、Ga_a分布、 K分布、G分布等??臻g上下文模型描述為Gibbs分布、多項式邏輯回歸函數(shù)等。實際上,SAR 圖像分割問題轉化成為求這些分布或者函數(shù)的參數(shù)問題。參數(shù)求解通常用組合優(yōu)化的方法 來解決,這是一個耗時的過程,而且很多時候總是不能找到滿意解。盡管基于模型的方法取 得了較好的分割效果,對于一些復雜的宏紋理的區(qū)域,仍然不能將他們分成一致性的區(qū)域。 這兩類方法都是在人為給定的特征下進行SAR圖像的分割,而卷積神經(jīng)網(wǎng)絡可以從數(shù)據(jù)本 身逐層的學習圖像的結構特征,能提高分割過程中異質區(qū)域的一致性。然而,卷積神經(jīng)網(wǎng)絡 中傳統(tǒng)的池化方法,即最大池化、平均池化法,只是簡單的在特征圖的鄰域窗內取最大值或 者平均值,會對學習到的特征的結構造成一定的破壞,不利于SAR圖像的分割。
【發(fā)明內容】
[0004] 本發(fā)明的目的在于針對上述已有方法的不足,提出一種基于小波池化卷積神經(jīng)網(wǎng) 絡的SAR圖像分割方法,以提升SAR圖像分割的效果。
[0005] 為實現(xiàn)上述目的,本發(fā)明的技術方案如下:
[0006] (1)在卷積神經(jīng)網(wǎng)絡中,對特征圖進行小波變換并取其近似子帶構成小波池化層, 利用小波池化層形成小波池化的卷積神經(jīng)網(wǎng)絡;
[0007] (2)根據(jù)SAR圖像標記圖,每類選取50%的像素,并將以該像素為中心的圖像塊輸 入到小波池化的卷積神經(jīng)網(wǎng)絡中進行訓練;
[0008] (3)對SAR圖像的所有像素,選取以該像素為中心的圖像塊輸入到訓練好的網(wǎng)絡 中進行測試,得到SAR圖像的第一類標;
[0009] (4)對SAR圖像進行超像素分割,得到SAR圖像的超像素分割結果,并將其與SAR 圖像的第一類標融合,得到SAR圖像的第二類標;
[0010] (5)根據(jù)Markov隨機場模型得到SAR圖像的第三類標,并將其與SAR圖像的超像 素分割結果融合,得到SAR圖像的第四類標;
[0011] (6)根據(jù)SAR圖像梯度圖,將SAR圖像的第二類標和第四類標進行融合,得到最終 的分割結果。
[0012] 本發(fā)明與現(xiàn)有技術相比具有如下優(yōu)點:
[0013] 第一,卷積神經(jīng)網(wǎng)絡中的傳統(tǒng)池化方法,即最大池化、平均池化法,只是簡單的在 特征圖的鄰域中取最大值或平均值,會對學習到的結構特征造成一定的破壞,本發(fā)明采用 的小波池化不僅具有降噪的功能,而且能更好的保持學習到的結構特征,這對于圖像的分 割是至關重要的。
[0014] 第二,本發(fā)明基于小波池化的卷積神經(jīng)網(wǎng)絡可以從原始數(shù)據(jù)自動學習特征,而不 需要人為給定特征的類型,這種從原始數(shù)據(jù)學習到的豐富的結構特征可以提高異質區(qū)域, 例如城區(qū)、森林等分割結果的一致性。
[0015] 第三,本發(fā)明基于SAR圖像梯度的融合策略,將基于小波池化的卷積神經(jīng)網(wǎng)絡與 Markov隨機場模型的優(yōu)點融合在一起,使分割在精確地定位邊界的同時又可以保持區(qū)域的 一致性。
【附圖說明】
[0016] 圖1是本發(fā)明的實現(xiàn)流程圖;
[0017] 圖2是本發(fā)明中小波池化卷積神經(jīng)網(wǎng)絡示意圖;
[0018] 圖3是本發(fā)明中小波池化卷積神經(jīng)網(wǎng)絡學習到的特征圖;
[0019] 圖4是本發(fā)明仿真使用的SAR圖像標記圖;
[0020] 圖5是用本發(fā)明與現(xiàn)有方法對X波段分辨率為1米的Noerdlinger Ries圖像的 分割結果圖;
[0021] 圖6是用本發(fā)明與現(xiàn)有方法對Ku波段分辨率為1米的Piperiver圖像的分割結 果圖。
【具體實施方式】
[0022] 參照圖1,本發(fā)明的實施步驟如下:
[0023] 步驟1,構建小波池化層并形成小波池化的卷積神經(jīng)網(wǎng)絡。
[0024] (I. 1)按照下式對特征圖0&進行小波變換,
[0025]
[0026] 其中k=l,...,N,N為特征圖的個數(shù):CF/('1 >是特征圖CFk中以點(X,y)為中心的 鄰域塊,*代表卷積操作,Φ是小波基函數(shù),down( ·)代表下2采樣操作, 是經(jīng)過小波變換得到的各子帶中的點,a,h,v,d分別代表近似子帶、水平子帶、垂直 子帶和對角子帶;
[0027] (1. 2)用近似子帶特征圖SF/構成小波池化層,其中k = 1,...,N,N為特征圖的個 數(shù);
[0028] (I. 3)利用小波池化層形成小波池化的卷積神經(jīng)網(wǎng)絡,如圖2所示,該神經(jīng)網(wǎng)絡是 一個包含輸入層、卷積層、池化層、全連接層和輸出層的八層神經(jīng)網(wǎng)絡,其中,第一層為輸入 層,第二層與第四層為卷積層,第三層與第五層為池化層,第六層與第七層為全連接層,第 八層為輸出層。
[0029] 步驟2,選取圖像塊輸入到小波池化的卷積神經(jīng)網(wǎng)絡中進行訓練。
[0030] (2. 1)在如圖4所示的SAR圖像標記圖中,每類選取50%的像素,并且對每個像素 選取以它為中心的32X32的圖像塊作為訓練樣本,其中圖4(a)為Noerdlinger Ries圖 像,圖4(b)為Noerdlinger Ries圖像的標記圖,類別數(shù)為5,圖4(c)為Piperiver圖像,圖 4(b)為Piperiver圖像的標記圖,類別數(shù)為5 ;
[0031] (2. 2)將訓練樣本輸入到步驟⑴構建的小波池化的卷積神經(jīng)網(wǎng)絡,并用后向傳 播算法學習網(wǎng)絡的參數(shù),直到所有的訓練樣本訓練完畢。
[0032] 步驟3,將所有圖像塊輸入到訓練好的網(wǎng)絡中進行測試。
[0033] (3. 1)對SAR圖像中所有像素,選取以該像素為中心的32X32的圖像塊作為測試 樣本;
[0034] (3. 2)將測試樣本輸入到步驟⑵中訓練好的神經(jīng)網(wǎng)絡中,學習到特征圖,如圖 3所示,其中圖3(a)為測試樣本類型為森林時,網(wǎng)絡學習到的第二層與第四層特征圖,圖 3(b)為測試樣本類型為城區(qū)時,網(wǎng)絡學習到的第二層與第四層特征圖,圖3(c)為測試樣本 類型為農田1時,網(wǎng)絡學習到的第二層與第四層特征圖,圖3(d)為測試樣本類型為農田2 時,網(wǎng)絡學習到的第二層與第四層特征圖;
[0035] (3. 3)利用前向傳播算法,預測得到每個圖像塊的類標,即得到SAR圖像中每個像 素的第一類標。
[0036] 步驟4,對SAR圖像進行超像素分割,獲得該SAR圖像的第二類標。
[0037] 圖像超像素分割的常用方法有:分水嶺、MeanShift和TurboPixels等。本發(fā)明中 采用但不限于TurboPixels的方法,得到SAR圖像超像素的分割結果;
[0038] 根據(jù)步驟(3)中得到的SAR圖像的第一類標,計算每個超像素內各類別的像素個 數(shù);
[0039] 將每個超像素標記為該超像素內像素個數(shù)最多的那個類別,得到SAR圖像的第二 類標。
[0040] 步驟5,根據(jù)Markov隨機場模型得到SAR圖像的第三類標。
[0041] (5. DMarkov隨機場模型的先驗概率公式如下:
[0042]
[0043] 其中,^代表圖像像素的類標,L= 表示圖像的類別,U(Xs)定義如下:
[0044]