本發(fā)明屬于大氣探測(cè)中地面氣象觀測(cè)技術(shù)領(lǐng)域,尤其涉及一種基于動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的雷達(dá)回波外推方法。
背景技術(shù):
臨近預(yù)報(bào)主要指0~3小時(shí)的高時(shí)空分辨率的天氣預(yù)報(bào),主要預(yù)報(bào)對(duì)象包括強(qiáng)降水、大風(fēng)、冰雹等災(zāi)害性天氣。目前,很多預(yù)報(bào)系統(tǒng)都采用數(shù)值預(yù)報(bào)模式,但是由于數(shù)值預(yù)報(bào)存在預(yù)報(bào)起轉(zhuǎn)延遲(spin-up),其短時(shí)臨近預(yù)報(bào)能力有限。新一代多普勒天氣雷達(dá)具有很高的靈敏度和分辨率,其數(shù)據(jù)資料的空間分辨率能夠達(dá)到200~1000m,時(shí)間分辨率能夠達(dá)到2~15min。此外,多普勒天氣雷達(dá)還具有合理的工作模式、全面的狀態(tài)監(jiān)控和故障警報(bào)、先進(jìn)的實(shí)時(shí)標(biāo)校系統(tǒng)和豐富的雷達(dá)氣象產(chǎn)品算法,能夠大大提高短時(shí)臨近預(yù)報(bào)的可靠性。如今,新一代多普勒天氣雷達(dá)已經(jīng)成為臨近預(yù)報(bào)的最有效工具之一,利用多普勒天氣雷達(dá)進(jìn)行臨近預(yù)報(bào)主要基于雷達(dá)回波外推技術(shù),即根據(jù)當(dāng)前時(shí)刻雷達(dá)觀測(cè)結(jié)果,推測(cè)雷達(dá)回波未來(lái)的位置和強(qiáng)度,以實(shí)現(xiàn)對(duì)強(qiáng)對(duì)流系統(tǒng)的跟蹤預(yù)報(bào)。
傳統(tǒng)的的雷達(dá)回波外推方法是質(zhì)心跟蹤法和基于最大相關(guān)系數(shù)的交叉相關(guān)法(Tracking Radar Echoes by Correlation,TREC),但是傳統(tǒng)方法都存在一定的不足,質(zhì)心跟蹤法僅適用于回波較強(qiáng)、范圍較小的風(fēng)暴單體,對(duì)于大范圍降水的預(yù)報(bào)不可靠;TREC一般將回波視為線性變化的,而現(xiàn)實(shí)情況中回波變化更為復(fù)雜,同時(shí)此類(lèi)方法易受矢量場(chǎng)中的無(wú)序矢量干擾。此外,現(xiàn)有的方法對(duì)雷達(dá)資料的利用率低,而歷史雷達(dá)資料包含當(dāng)?shù)靥鞖庀到y(tǒng)變化的重要特征,具有很高的研究?jī)r(jià)值。
為提高雷達(dá)回波外推的時(shí)效性,并從大量的歷史雷達(dá)資料中研究雷達(dá)回波的變化規(guī)律,將機(jī)器學(xué)習(xí)方法引入雷達(dá)回波外推中。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)作為深度學(xué)習(xí)的重要分支,廣泛應(yīng)用于圖像處理,模式識(shí)別等領(lǐng)域。該網(wǎng)絡(luò)最大的特點(diǎn)在于采用局部連接、權(quán)值共享、下采樣的方法,對(duì)輸入圖像的形變、平移和翻轉(zhuǎn)具有較強(qiáng)的適應(yīng)性。針對(duì)雷達(dá)回波圖像之間存在的強(qiáng)時(shí)間相關(guān)性,設(shè)計(jì)基于輸入的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠根據(jù)輸入的雷達(dá)回波圖動(dòng)態(tài)的變化權(quán)值參數(shù),進(jìn)而預(yù)測(cè)外推圖像。利用歷史雷達(dá)資料訓(xùn)練動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò),使網(wǎng)絡(luò)更加充分地提取回波特征,學(xué)習(xí)回波變化規(guī)律,對(duì)于提高雷達(dá)回波外推準(zhǔn)確性,優(yōu)化臨近預(yù)報(bào)效果具有重要意義。
技術(shù)實(shí)現(xiàn)要素:
發(fā)明目的:本發(fā)明所要解決的技術(shù)問(wèn)題是針對(duì)現(xiàn)有的雷達(dá)回波外推方法的外推時(shí)效短,對(duì)雷達(dá)資料利用率不足,提出了一種基于動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的雷達(dá)回波外推方法,實(shí)現(xiàn)對(duì)雷達(dá)回波強(qiáng)度等高平面顯示CAPPI(Constant AltitudePlan Position Indicator,CAPPI)圖像的外推預(yù)測(cè),包括以下步驟:
步驟1,訓(xùn)練離線卷積神經(jīng)網(wǎng)絡(luò):輸入訓(xùn)練圖像集,對(duì)訓(xùn)練圖像集進(jìn)行數(shù)據(jù)預(yù)處理,得到訓(xùn)練樣本集,設(shè)計(jì)動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并初始化網(wǎng)絡(luò)訓(xùn)練參數(shù);利用訓(xùn)練樣本集訓(xùn)練動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò),輸入的有序圖像序列經(jīng)過(guò)動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)前向傳播得到一幅預(yù)測(cè)圖像,計(jì)算預(yù)測(cè)圖像和對(duì)照標(biāo)簽之間的誤差,通過(guò)反向傳播更新網(wǎng)絡(luò)的權(quán)值參數(shù)和偏置參數(shù),重復(fù)此過(guò)程直到達(dá)到訓(xùn)練結(jié)束條件,得到收斂的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò);
步驟2,在線雷達(dá)回波外推:輸入測(cè)試圖像集,對(duì)測(cè)試圖像集進(jìn)行數(shù)據(jù)預(yù)處理,得到測(cè)試樣本集,然后將測(cè)試樣本集輸入步驟1中獲得的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)中,經(jīng)過(guò)網(wǎng)絡(luò)前向傳播計(jì)算概率向量,并將輸入圖像序列中的最后一幅雷達(dá)回波圖像與得到的概率向量相卷積,得到預(yù)測(cè)的雷達(dá)回波外推圖像。
本發(fā)明步驟1包括以下步驟:
步驟1-1,數(shù)據(jù)預(yù)處理:輸入訓(xùn)練圖像集,對(duì)訓(xùn)練圖像集中的每一幅圖像進(jìn)行規(guī)范化處理,將每一幅圖像轉(zhuǎn)化為280×280的浮點(diǎn)數(shù)圖像,得到浮點(diǎn)數(shù)圖像集合,對(duì)浮點(diǎn)數(shù)圖像集合進(jìn)行劃分,構(gòu)造包含TrainsetSize組樣本的訓(xùn)練樣本集;
步驟1-2,初始化動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò):設(shè)計(jì)動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),構(gòu)造用于生成概率向量的子網(wǎng)絡(luò),再構(gòu)造用于圖像外推的概率預(yù)測(cè)層,為離線神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段提供動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)初始化模型;
步驟1-3,初始化動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù):令網(wǎng)絡(luò)學(xué)習(xí)率λ=0.0001,訓(xùn)練階段每次輸入的樣本數(shù)量BatchSize=10,訓(xùn)練樣本集的最大批訓(xùn)練次數(shù)當(dāng)前批訓(xùn)練次數(shù)BatchNum=1,網(wǎng)絡(luò)訓(xùn)練的最大迭代次數(shù)IterationMax=40,當(dāng)前迭代次數(shù)IterationNum=1;
步驟1-4,讀取訓(xùn)練樣本:采用批訓(xùn)練的方式,每次訓(xùn)練從步驟1-1獲得的訓(xùn)練樣本集中讀取BatchSize組訓(xùn)練樣本,每組訓(xùn)練樣本為{x1,x2,x3,x4,y},共包含5幅圖像,其中{x1,x2,x3,x4}作為輸入圖像序列,y為對(duì)應(yīng)的對(duì)照標(biāo)簽;
步驟1-5,前向傳播:在子網(wǎng)絡(luò)中提取步驟1-4獲得的輸入圖像序列特征,得到水平概率向量HPV和垂直概率向量VPV;在概率預(yù)測(cè)層中,將輸入圖像序列中的最后一幅圖像依次與VPV、HPV相卷積,得到前向傳播的輸出預(yù)測(cè)圖像;
步驟1-6,反向傳播:在概率預(yù)測(cè)層中反向求得概率向量的誤差項(xiàng),根據(jù)概率向量的誤差項(xiàng)從后至前逐層計(jì)算子網(wǎng)絡(luò)層中各個(gè)網(wǎng)絡(luò)層的誤差項(xiàng),進(jìn)而計(jì)算各個(gè)網(wǎng)絡(luò)層中誤差項(xiàng)對(duì)權(quán)值參數(shù)和偏置參數(shù)的梯度,利用得到的梯度更新動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的參數(shù);
步驟1-7,離線訓(xùn)練階段控制:對(duì)離線神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段進(jìn)行整體控制,分為以下三種情況:
若訓(xùn)練樣本集中仍存在未使用過(guò)的訓(xùn)練樣本,即BatchNum<BatchMax,則返回步驟1-4繼續(xù)讀取BatchSize組訓(xùn)練樣本,進(jìn)行網(wǎng)絡(luò)訓(xùn)練;
若訓(xùn)練樣本集中不存在未使用過(guò)的訓(xùn)練樣本,即BatchNum=BatchMax,且當(dāng)前網(wǎng)絡(luò)迭代次數(shù)小于最大迭代次數(shù),即IterationNum<IterationMax,則令BatchNum=1,返回步驟1-4繼續(xù)讀取BatchSize組訓(xùn)練樣本,進(jìn)行網(wǎng)絡(luò)訓(xùn)練;
若訓(xùn)練樣本集中不存在未使用過(guò)的訓(xùn)練樣本,即BatchNum=BatchMax,且網(wǎng)絡(luò)迭代次數(shù)達(dá)到最大迭代次數(shù),即IterationNum=IterationMax,則結(jié)束離線神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段,得到訓(xùn)練好的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)模型。
本發(fā)明步驟1-1數(shù)據(jù)預(yù)處理包括以下步驟:
步驟1-1-1,采樣:訓(xùn)練圖像集中的圖像按時(shí)間順序排列,并且等時(shí)間間隔分布,時(shí)間間隔為6分鐘,共包含NTrain幅圖像,通過(guò)如下公式確定TrainsetSize:
其中,Mod(NTrain,4)表示NTrain對(duì)4取模,[N]表示不大于N的最大整數(shù),求得TrainsetSize后,通過(guò)采樣保留訓(xùn)練圖像集中前4×TrainsetSize+1幅圖像,采樣時(shí)通過(guò)刪除訓(xùn)練圖像集中最后的圖像使圖像數(shù)量滿(mǎn)足要求;
步驟1-1-2,規(guī)范化圖像:對(duì)采樣得到的圖像進(jìn)行圖像變換,歸一化操作,將原始分辨率為2000×2000的彩色圖像轉(zhuǎn)換成分辨率為280×280的浮點(diǎn)數(shù)圖像;
步驟1-1-3,構(gòu)造訓(xùn)練樣本集:
利用步驟1-1-2獲得的浮點(diǎn)數(shù)圖像集構(gòu)造訓(xùn)練樣本集,將浮點(diǎn)數(shù)圖像集中每四個(gè)相鄰的圖像,即第{4N+1,4N+2,4N+3,4N+4}幅圖像作為一組輸入序列,第[4×(N+1)+1]幅圖像經(jīng)過(guò)裁剪,保留中央分辨率為240×240的部分作為對(duì)應(yīng)樣本的對(duì)照標(biāo)簽,對(duì)于第N組樣本其構(gòu)造方式如下:
上式中,G4N+1表示浮點(diǎn)數(shù)圖像集中的第4N+1幅圖像,N為正整數(shù),并有N∈[0,TrainsetSize-1],Crop(·)表示裁剪操作,裁剪后保留原圖像中央大小為240×240的部分,最終得到包含TrainsetSize組訓(xùn)練樣本的訓(xùn)練樣本集;
其中,步驟1-1-2包括以下步驟:
步驟1-1-2-1,圖像轉(zhuǎn)化:為降低卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的計(jì)算復(fù)雜度,將步驟1-1-1采樣得到的圖像轉(zhuǎn)化為灰度圖像,通過(guò)裁剪保留原始圖像中央分辨率為560×560的部分,將裁剪后的圖像分辨率壓縮為280×280,得到分辨率為280×280的灰度圖;
步驟1-1-2-2,數(shù)據(jù)歸一化:將步驟1-1-2-1中獲得的灰度圖中的每一個(gè)像素點(diǎn)的值從[0~255]映射到[0~1],通過(guò)歸一化之后得到分辨率為280×280的浮點(diǎn)數(shù)圖像。
本發(fā)明步驟1-2包括以下步驟:
步驟1-2-1,構(gòu)造子網(wǎng)絡(luò):
子網(wǎng)絡(luò)由10個(gè)網(wǎng)絡(luò)層構(gòu)成,從前至后依次為卷積層C1、下采樣層S1、卷積層C2、下采樣層S2、卷積層C3、下采樣層S3、卷積層C4、下采樣層S5、卷積層C5以及分類(lèi)器層F1;
步驟1-2-2,構(gòu)造概率預(yù)測(cè)層:
概率預(yù)測(cè)層中構(gòu)造動(dòng)態(tài)卷積層DC1和動(dòng)態(tài)卷積層DC2,將子網(wǎng)絡(luò)輸出的垂直概率向量VPV作為動(dòng)態(tài)卷積層DC1的卷積核,水平概率向量HPV作為動(dòng)態(tài)卷積層DC2的卷積核;
其中,步驟1-2-1包括以下步驟:
步驟1-2-1-1,構(gòu)造卷積層:確定以下內(nèi)容:卷積層的輸出特征圖數(shù)量OutputMaps、卷積核k以及偏置參數(shù)bias。對(duì)于卷積核,需要確定卷積核的寬度KernelSize(卷積核的分辨率為KernelSize×KernelSize),卷積核的數(shù)量KernelNumber(該值為該卷積層輸入與輸出特征圖數(shù)量的乘積),并根據(jù)Xavier初始化方法構(gòu)造卷積核;對(duì)于偏置參數(shù),其數(shù)量與該層的輸出特征圖數(shù)量相同。對(duì)于卷積層lC,lC∈{C1,C2,C3,C4,C5},該層的輸出特征圖寬度為的值由其輸入特征圖分辨率和卷積核的大小共同決定,即表示卷積層lC的上一層卷積層的輸出特征圖寬度;
對(duì)于卷積層C1,令C1層的輸出特征圖數(shù)量OutputMapsC1=12,輸出特征圖的寬度OutputSizeC1=272,卷積核寬度KernelSizeC1=9,偏置參數(shù)biasC1均初始化為零,C1層的卷積核kC1的數(shù)量KernelNumberC1=48,卷積核中每一個(gè)參數(shù)的初始值為rand(·)用于生成隨機(jī)數(shù);
對(duì)于卷積層C2,令C2層輸出特征圖數(shù)量OutputMapsC2=32,輸出特征圖的寬度OutputSizeC2=128,卷積核寬度KernelSizeC2=9,偏置參數(shù)均初始化為零,C2層的卷積核kC2的數(shù)量KernelNumberC2=384,卷積核中每一個(gè)參數(shù)的初始值為
對(duì)于卷積層C3,令C3層輸出特征圖數(shù)量OutputMapsC3=32,輸出特征圖的寬度OutputSizeC3=56,卷積核寬度KernelSizeC3=9,偏置參數(shù)均初始化為零,C3層的卷積核kC3的數(shù)量KernelNumberC3=1024,卷積核中每一個(gè)參數(shù)的初始值為
對(duì)于卷積層C4,令C4層輸出特征圖數(shù)量OutputMapsC4=32,輸出特征圖的寬度OutputSizeC4=20,卷積核寬度KernelSizeC4=9,偏置參數(shù)均初始化為零,C4層的卷積核kC4的數(shù)量KernelNumberC4=1024,卷積核中每一個(gè)參數(shù)的初始值為
對(duì)于卷積層C5,令該層OutputMapsC5=32,OutputSizeC5=4,KernelSizeC5=7,偏置參數(shù)均初始化為零,C5層的卷積核kC5的數(shù)量KernelNumberC5=1024,卷積核中每一個(gè)參數(shù)的初始值為
步驟1-2-1-2,構(gòu)造下采樣層:下采樣層中不包含需要訓(xùn)練的參數(shù),將下采樣層S1、S2、S3和S4的采樣核均初始化為對(duì)于下采樣層lS,lS∈{S1,S2,S3,S4},其輸出特征圖數(shù)量與其上一層的卷積層的輸出特征圖數(shù)量保持一致,輸出特征圖寬度為其上一層的卷積層的輸出特征圖寬度的1/2,公式表達(dá)如下:
步驟1-2-1-3,構(gòu)造分類(lèi)器層:分類(lèi)器層由一個(gè)全連接層F1構(gòu)成,F(xiàn)1層的權(quán)值參數(shù)為水平權(quán)值參數(shù)矩陣WH和垂直權(quán)值參數(shù)矩陣WV,大小均為41×512,令權(quán)值參數(shù)矩陣中的每一個(gè)參數(shù)的初始值為偏置參數(shù)為水平偏置參數(shù)BH和垂直偏置參數(shù)BV,均初始化為41×1的一維零向量。
本發(fā)明步驟1-5包括以下步驟:
步驟1-5-1,子網(wǎng)絡(luò)計(jì)算概率向量:在子網(wǎng)絡(luò)中通過(guò)卷積層和下采樣層的交替處理提取輸入的圖像序列特征,在分類(lèi)器層中通過(guò)Softmax函數(shù)處理,得到水平概率向量HPV和垂直概率向量VPV;
步驟1-5-2,計(jì)算概率預(yù)測(cè)層輸出圖像:步驟1-5-1得到的HPV和VPV作為概率預(yù)測(cè)層的卷積核,將輸入圖像序列中的最后一幅圖像依次與VPV、HPV相卷積,得到前向傳播的輸出預(yù)測(cè)圖像。
本發(fā)明步驟1-5-1包括以下步驟:
步驟1-5-1-1,判斷網(wǎng)絡(luò)層類(lèi)型:用l表示當(dāng)前所處的子網(wǎng)絡(luò)中的網(wǎng)絡(luò)層,l初始值為C1,判斷網(wǎng)絡(luò)層l的類(lèi)型,若l∈{C1,C2,C3,C4,C5},則l為卷積層,執(zhí)行步驟1-5-1-2,若l∈{S1,S2,S3,S4},則l為下采樣層,執(zhí)行步驟1-5-1-4;
步驟1-5-1-2,處理卷積層:此時(shí)有l(wèi)=lC,lC∈{C1,C2,C3,C4,C5},首先計(jì)算lC層的第j個(gè)輸出特征圖將lC層的輸入特征圖分別與該層的對(duì)應(yīng)卷積核相卷積,將卷積結(jié)果求和,求和結(jié)果加上lC層的第j個(gè)偏置參數(shù)再經(jīng)過(guò)ReLU激活函數(shù)處理,得到計(jì)算公式如下所示:
其中,為lC層的第i個(gè)輸入特征圖與第j個(gè)輸出特征圖相對(duì)應(yīng)的卷積核,n為當(dāng)前卷積層的前一下采樣層的輸出特征圖個(gè)數(shù),表示lC層的第i個(gè)輸入特征圖,同時(shí)也是lC-1層的第i個(gè)輸出特征圖,*表示矩陣卷積,若lC=C1,則lC-1層為輸入層;
依次計(jì)算所有的輸出特征圖,得到lC層的輸出特征圖將l更新為l+1,并返回步驟1-5-1-1判斷網(wǎng)絡(luò)類(lèi)型,進(jìn)行下一個(gè)網(wǎng)絡(luò)層的操作;
步驟1-5-1-3,處理下采樣層:此時(shí)有l(wèi)=lS,lS∈{S1,S2,S3,S4},將步驟1-5-1-2得到的卷積層的輸出特征圖分別與相卷積,再以步長(zhǎng)為2進(jìn)行采樣,采樣得到lS層的輸出特征圖計(jì)算公式如下所示:
上式中,Sample(·)表示步長(zhǎng)為2的采樣處理,lS-1表示當(dāng)前下采樣層的前一卷積層,表示lS層的輸出特征圖中的第j個(gè)輸出特征圖,得到lS層的輸出特征圖后,將l更新為l+1,并返回步驟1-5-1-1判斷網(wǎng)絡(luò)類(lèi)型,進(jìn)行下一個(gè)網(wǎng)絡(luò)層的操作;
步驟1-5-1-4,計(jì)算F1層概率向量:若網(wǎng)絡(luò)層l為分類(lèi)器層,即l=F1,通過(guò)矩陣變換,將C5的32幅分辨率為4×4的輸出特征圖以列順序展開(kāi),得到分辨率為512×1的F1層的輸出特征向量aF1,分別計(jì)算水平權(quán)值參數(shù)矩陣WH與aF1的外積、垂直權(quán)值參數(shù)矩陣WV與aF1的外積,將計(jì)算結(jié)果分別與水平偏置參數(shù)BH、垂直偏置參數(shù)BV求和,經(jīng)Softmax函數(shù)處理后得到水平概率向量HPV和垂直概率向量VPV,具體計(jì)算公式如下:
將其垂直概率向量VPV轉(zhuǎn)置,得到最終的垂直概率向量;
步驟1-5-2包括以下步驟:
步驟1-5-2-1,預(yù)測(cè)DC1層垂直方向:將輸入層的最后一幅輸入圖像與垂直概率向量VPV相卷積,得到分辨率為240×280的DC1層輸出特征圖aDC1;
步驟1-5-2-2,預(yù)測(cè)DC2層垂直方向:將DC1層輸出特征圖aDC1與垂直概率向量HPV相卷積,得到前向傳播的輸出預(yù)測(cè)圖像,其分辨率為240×240。
本發(fā)明步驟1-6包括以下步驟:
步驟1-6-1,計(jì)算概率預(yù)測(cè)層誤差項(xiàng):將步驟1-5-2-2獲得的預(yù)測(cè)圖像與輸入的訓(xùn)練樣本中的對(duì)照標(biāo)簽求差,計(jì)算DC2層、DC1層的誤差項(xiàng),最終求得水平概率向量的誤差項(xiàng)δHPV和垂直概率向量的誤差項(xiàng)δVPV;
步驟1-6-2,計(jì)算子網(wǎng)絡(luò)誤差項(xiàng):根據(jù)水平概率向量的誤差項(xiàng)δHPV和垂直概率向量的誤差項(xiàng)δVPV,從后至前依次計(jì)算分類(lèi)層F1,卷積層C5、C4、C3、C2、C1和下采樣層S4、S3、S2、S1的誤差項(xiàng),求得的任一層誤差項(xiàng)矩陣的分辨率與該層的輸出特征圖的分辨率相一致;
步驟1-6-3,計(jì)算梯度:根據(jù)步驟1-6-2獲得的誤差項(xiàng)計(jì)算子網(wǎng)絡(luò)各個(gè)網(wǎng)絡(luò)層的誤差項(xiàng)對(duì)該層權(quán)值參數(shù)和偏置參數(shù)的梯度值;
步驟1-6-4,更新參數(shù):將步驟1-6-3獲得的各網(wǎng)絡(luò)層的權(quán)值參數(shù)和偏置參數(shù)的梯度值乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到各網(wǎng)絡(luò)層權(quán)值參數(shù)和偏置參數(shù)的更新項(xiàng),將原權(quán)值參數(shù)和偏置參數(shù)分別與該更新項(xiàng)求差,得到更新后的權(quán)值參數(shù)和偏置參數(shù)。
本發(fā)明步驟1-6-1包括以下步驟:
步驟1-6-1-1,計(jì)算動(dòng)態(tài)卷積層DC2誤差項(xiàng):將步驟1-5-2-2獲得的預(yù)測(cè)圖像與該組樣本的對(duì)照標(biāo)簽求差,得到大小為240×240的誤差項(xiàng)矩陣δDC2;
步驟1-6-1-2,計(jì)算動(dòng)態(tài)卷積層DC1誤差項(xiàng):通過(guò)零填充將DC2層的誤差項(xiàng)矩陣δDC2拓展為240×320,將水平概率向量旋轉(zhuǎn)180度,將拓展后的誤差項(xiàng)矩陣與翻轉(zhuǎn)后的水平概率向量相卷積,得到DC1層的誤差項(xiàng)矩陣δDC1,其大小為240×280,公式如下所示:
δDC1=Expand_Zero(δDC2)*rot180(HPV),
其中,Expand_Zero(·)表示零擴(kuò)充函數(shù),rot180(·)表示角度為180°的旋轉(zhuǎn)函數(shù),將2×2的矩陣零擴(kuò)充為4×4的矩陣,零擴(kuò)充后的矩陣,中央分辨率為2×2的區(qū)域與原矩陣相一致,其余位置用零像素填充;
步驟1-6-1-3,計(jì)算概率向量誤差項(xiàng):計(jì)算水平概率向量HPV的誤差項(xiàng),將DC1層的輸出特征圖與誤差項(xiàng)矩陣δDC2相卷積,卷積后得到1×41的行向量,該向量為HPV的誤差項(xiàng)δHPV,公式如下:
δHPV=aDC1*δDC2,
計(jì)算垂直概率向量VPV的誤差項(xiàng),將輸入層的輸入特征圖與誤差項(xiàng)矩陣δDC1相卷積,卷積后得到41×1的列向量,該向量為VPV的誤差項(xiàng)δVPV,公式如下:
其中,為訓(xùn)練樣本的輸入圖像序列中的最后一幅圖像;
步驟1-6-2包括以下步驟:
步驟1-6-2-1,計(jì)算分類(lèi)器層F1誤差項(xiàng):將步驟1-6-1-3獲得的概率向量的誤差項(xiàng)δVPV和δHPV分別與F1層的垂直權(quán)值參數(shù)矩陣WV和水平權(quán)值參數(shù)矩陣WH進(jìn)行矩陣相乘,再將矩陣的外積求和并取平均值,得到F1層的誤差項(xiàng)δF1,公式如下:
其中,×表示矩陣外積,(·)T代表矩陣的轉(zhuǎn)置,得到的δF1的大小為512×1;
步驟1-6-2-2,計(jì)算卷積層C5誤差項(xiàng):通過(guò)矩陣變換,將步驟1-6-2-1中獲得的F1層的誤差項(xiàng)δF1變換為32個(gè)分辨率為4×4的矩陣得到C5層的誤差項(xiàng)δC5,表示變換后的第32個(gè)分辨率為4×4的矩陣;此次矩陣變換與步驟1-5-1-6中的矩陣變換互為逆變換,
步驟1-6-2-3,判斷網(wǎng)絡(luò)層類(lèi)型:用l表示當(dāng)前所處的子網(wǎng)絡(luò)中的網(wǎng)絡(luò)層(l初始值為S4),判斷網(wǎng)絡(luò)層l的類(lèi)型,若l∈{S4,S3,S2,S1},則l為下采樣層,執(zhí)行步驟1-6-2-4,若l∈{C4,C3,C2,C1},則l為卷積層,執(zhí)行步驟1-6-2-5;
步驟1-6-2-4,計(jì)算下采樣層誤差項(xiàng):若l層為下采樣層,此時(shí)有l(wèi)=lS,lS∈{S1,S2,S3,S4},對(duì)于lS層的第i個(gè)誤差項(xiàng)矩陣通過(guò)零填充分別將lS+1層的各個(gè)誤差項(xiàng)矩陣拓展至寬度為其中l(wèi)S+1層表示當(dāng)前下采樣層的后一卷積層,j表示lS+1層的第j個(gè)誤差項(xiàng),并有再將對(duì)應(yīng)的卷積核旋轉(zhuǎn)180度,然后將拓展后的矩陣與翻轉(zhuǎn)后的卷積核相卷積,并將卷積結(jié)果求和,得到lS層的第i個(gè)誤差項(xiàng)矩陣公式如下所示:
其中,
依次計(jì)算所有的誤差項(xiàng)矩陣,得到lS層的輸出特征圖將l更新為l-1,并返回步驟1-6-2-3判斷網(wǎng)絡(luò)類(lèi)型,計(jì)算上一個(gè)網(wǎng)絡(luò)層的誤差項(xiàng);
步驟1-6-2-5,計(jì)算卷積層誤差項(xiàng):若l層為卷積層,此時(shí)有l(wèi)=lC,lC∈{C1,C2,C3,C4,C5},由于步驟1-6-2-3中l(wèi)的初始值為S4,因此并不會(huì)出現(xiàn)lC=C5的情況,對(duì)于lC層的第i個(gè)誤差項(xiàng)矩陣先對(duì)lC+1層中的對(duì)應(yīng)的第i個(gè)誤差項(xiàng)矩陣進(jìn)行上采樣,上采樣時(shí)將中每個(gè)元素的誤差項(xiàng)值平均分至采樣區(qū)域中,得到分辨率為的上采樣矩陣,再計(jì)算激活函數(shù)在lC層對(duì)應(yīng)特征圖處的導(dǎo)數(shù)與求得的上采樣矩陣的內(nèi)積,得到lC層的第i個(gè)誤差項(xiàng)矩陣公式如下所示:
其中,·表示矩陣內(nèi)積,ReLU'(·)表示ReLU激活函數(shù)的導(dǎo)數(shù),其形式如下:
UpSample(·)表示上采樣函數(shù),上采樣后原圖像中的每一個(gè)像素對(duì)應(yīng)一個(gè)上采樣區(qū)域,原像素值平均分配至采樣區(qū)域中的每一個(gè)像素點(diǎn)中,依次計(jì)算所有的誤差項(xiàng)矩陣,得到lC層的輸出特征圖
步驟1-6-2-6,此時(shí)l層為卷積層,即l=lC,之后分為兩種情況:
若l≠C1,則將l更新為l-1,并返回步驟1-6-2-3判斷網(wǎng)絡(luò)類(lèi)型,計(jì)算上一個(gè)網(wǎng)絡(luò)層的誤差項(xiàng);
若l=C1,則步驟1-6-2子網(wǎng)絡(luò)誤差項(xiàng)計(jì)算結(jié)束;
步驟1-6-3包括以下步驟:
步驟1-6-3-1,計(jì)算卷積層誤差項(xiàng)對(duì)卷積核的梯度:用lC表示當(dāng)前處理的卷積層,lC∈{C1,C2,C3,C4,C5},從C1層開(kāi)始逐層計(jì)算各卷積層誤差項(xiàng)對(duì)卷積核的梯度,將lC-1層的第i個(gè)輸出特征圖與第lC層的第j個(gè)誤差項(xiàng)矩陣相卷積,卷積結(jié)果為對(duì)應(yīng)卷積核的梯度值公式如下:
上式中,與分別表示第lC層的輸出特征圖個(gè)數(shù)與第lC-1層的輸出特征圖個(gè)數(shù),▽k為誤差項(xiàng)對(duì)卷積核的梯度值;
步驟1-6-3-2,計(jì)算各卷積層誤差項(xiàng)對(duì)偏置的梯度:用lC表示當(dāng)前處理的卷積層,lC∈{C1,C2,C3,C4,C5},從C1層開(kāi)始逐層計(jì)算各卷積層誤差項(xiàng)對(duì)偏置的梯度,將lC層的第j個(gè)誤差項(xiàng)矩陣中的所有元素進(jìn)行求和,得到該層第j個(gè)偏置的梯度值公式如下所示:
其中,Sum(·)表示對(duì)矩陣的所有元素進(jìn)行求和;
步驟1-6-3-3,計(jì)算F1層誤差項(xiàng)對(duì)權(quán)值參數(shù)的梯度:分別計(jì)算水平概率向量與垂直概率向量的誤差項(xiàng)δHPV、δVPV與F1層誤差項(xiàng)δF1的內(nèi)積,計(jì)算結(jié)果為F1層誤差項(xiàng)對(duì)權(quán)值參數(shù)WH、WV的梯度值,公式如下:
▽W(xué)H=(δHPV)T×(δF1)T,
▽W(xué)V=δVPV×(δF1)T,
上式中,▽W(xué)H為誤差項(xiàng)對(duì)水平權(quán)值參數(shù)的梯度值,▽W(xué)V為誤差項(xiàng)對(duì)垂直權(quán)值參數(shù)的梯度值;
步驟1-6-3-4,計(jì)算F1層誤差項(xiàng)對(duì)偏置參數(shù)的梯度:將水平概率向量與垂直概率向量的誤差項(xiàng)δHPV、δVPV分別作為F1層誤差項(xiàng)對(duì)水平偏置參數(shù)BH和垂直偏置參數(shù)BV的梯度值,公式如下:
▽BH=(δHPV)T,
▽BV=δVPV,
其中,▽BH為誤差項(xiàng)對(duì)水平偏置參數(shù)的梯度值,▽BV為誤差項(xiàng)對(duì)垂直偏置參數(shù)的梯度值;
步驟1-6-4包括以下步驟:
步驟1-6-4-1,更新各卷積層權(quán)值參數(shù):將步驟1-6-3-1獲得的各卷積層誤差項(xiàng)對(duì)卷積核的梯度乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到卷積核的修正項(xiàng),再將原卷積核與該修正項(xiàng)求差,得到更新的卷積核公式如下:
其中,λ為步驟1-3中確定的網(wǎng)絡(luò)學(xué)習(xí)率,λ=0.0001;
步驟1-6-4-2,更新各卷積層偏置參數(shù):將步驟1-6-3-2獲得的各卷積層誤差項(xiàng)對(duì)偏置的梯度乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到偏置參數(shù)的修正項(xiàng),再將原偏置項(xiàng)與該修正項(xiàng)求差,得到更新的偏置項(xiàng)公式如下:
步驟1-6-4-3,更新F1層權(quán)值參數(shù):將步驟1-6-3-3獲得的F1層誤差項(xiàng)對(duì)權(quán)值參數(shù)WH和WV的梯度值乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到權(quán)值參數(shù)的修正項(xiàng),再將原權(quán)值參數(shù)WH和WV分別與求得的修正項(xiàng)求差,得到更新的WH和WV,公式如下:
WH=WH-λ▽W(xué)H,
WV=WV-λ▽W(xué)V;
步驟1-6-4-4,更新F1層偏置參數(shù):將步驟1-6-3-4獲得的F1層誤差項(xiàng)對(duì)偏置參數(shù)BH和BV的梯度值乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到偏置參數(shù)的修正項(xiàng),再將原偏置參數(shù)BH和BV分別與求得的修正項(xiàng)求差,得到更新的BH和BV,公式如下:
BH=BH-λ▽BH,
BV=BV-λ▽BV。
本發(fā)明步驟2包括以下步驟:
步驟2-1,數(shù)據(jù)預(yù)處理:輸入測(cè)試圖像集,對(duì)測(cè)試圖像集中的每一幅圖像進(jìn)行規(guī)范化處理,將每一幅圖像轉(zhuǎn)化為280×280的浮點(diǎn)數(shù)圖像,再對(duì)浮點(diǎn)數(shù)圖像集合進(jìn)行劃分,構(gòu)造包含TestsetSize組樣本的測(cè)試樣本集;
步驟2-2,讀取測(cè)試樣本:將步驟2-1獲得的TestsetSize組測(cè)試樣本輸入經(jīng)過(guò)訓(xùn)練的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)中;
步驟2-3,前向傳播:在子網(wǎng)絡(luò)中提取輸入的圖像序列特征,得到水平概率向量HPVtest和垂直概率向量VPVtest;在概率預(yù)測(cè)層中,將輸入圖像序列中的最后一幅圖像依次與VPVtest、HPVtest相卷積,得到動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)最終的外推圖像。
本發(fā)明步驟2-1包括以下步驟:
步驟2-1-1,采樣:測(cè)試圖像集中的圖像按時(shí)間順序排列,并且等時(shí)間間隔分布,時(shí)間間隔為6分鐘,共包含NTest幅圖像,通過(guò)如下公式確定TestsetSize:
如果Mod(NTest,4)=0則
如果Mod(NTest,4)≠0則
求得TestsetSize后,通過(guò)采樣保留測(cè)試圖像集中前4×TestsetSize+1幅圖像,采樣時(shí)通過(guò)刪除測(cè)試圖像集中最后的圖像使圖像數(shù)量滿(mǎn)足要求;
步驟2-1-2,圖像規(guī)范化:對(duì)采樣得到的圖像進(jìn)行圖像變換,歸一化操作,將原始分辨率為2000×2000的彩色圖像轉(zhuǎn)換成分辨率為280×280的浮點(diǎn)數(shù)圖像;
步驟2-1-3,構(gòu)造測(cè)試樣本集:利用步驟2-1-2獲得的浮點(diǎn)數(shù)圖像集構(gòu)造測(cè)試樣本集,將浮點(diǎn)數(shù)圖像集中每四個(gè)相鄰的圖像,即第{4M+1,4M+2,4M+3,4M+4}幅圖像作為一組輸入序列,第[4×(M+1)+1]幅圖像經(jīng)過(guò)裁剪,保留中央分辨率為240×240的部分作為對(duì)應(yīng)樣本的對(duì)照標(biāo)簽,其中為正整數(shù),并有M∈[0,TestsetSize-1]得到包含TestsetSize組測(cè)試樣本的測(cè)試樣本集;
步驟2-1-2包括以下步驟:
步驟2-1-2-1,圖像轉(zhuǎn)化:為降低卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的計(jì)算復(fù)雜度,將彩色的回波強(qiáng)度CAPPI圖像轉(zhuǎn)化為灰度圖像,再通過(guò)裁剪保留原始圖像中央分辨率為560×560的部分,將裁剪后的圖像分辨率壓縮為280×280,得到分辨率為280×280的灰度圖;
步驟2-1-2-2,數(shù)據(jù)歸一化:將步驟1-1-2-1中獲得的灰度圖中的每一個(gè)像素點(diǎn)的值從[0~255]映射到[0~1],通過(guò)歸一化之后得到分辨率為280×280的浮點(diǎn)數(shù)圖像;
步驟2-3包括以下步驟:
步驟2-3-1,計(jì)算子網(wǎng)絡(luò)概率向量:在子網(wǎng)絡(luò)中通過(guò)卷積層和下采樣層的交替處理提取輸入的圖像序列特征,然后在分類(lèi)器層中通過(guò)Softmax函數(shù)處理,得到水平概率向量HPVtest和垂直概率向量VPVtest;
步驟2-3-2,計(jì)算概率預(yù)測(cè)層輸出圖像:步驟2-3-1得到的VPVtest和HPVtest作為概率預(yù)測(cè)層的卷積核,將輸入圖像序列中的最后一幅圖像依次與VPVtest和HPVtest相卷積,得到動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)最終的外推圖像;
步驟2-3-1包括以下步驟:
步驟2-3-1-1,判斷網(wǎng)絡(luò)層類(lèi)型:用p表示當(dāng)前所處的子網(wǎng)絡(luò)中的網(wǎng)絡(luò)層,判斷網(wǎng)絡(luò)層p的類(lèi)型,p初始值為C1,若p∈{C1,C2,C3,C4,C5},則p為卷積層,執(zhí)行步驟2-3-1-2,若p∈{S1,S2,S3,S4},則p為下采樣層,執(zhí)行步驟2-3-1-4;
步驟2-3-1-2,處理卷積層:此時(shí)有p=pC,pC∈{C1,C2,C3,C4,C5},首先計(jì)算pC層的第v個(gè)輸出特征圖將pC層的輸入特征圖分別與該層的對(duì)應(yīng)卷積核相卷積,再將卷積結(jié)果求和,求和結(jié)果加上pC層的第v個(gè)偏置再經(jīng)過(guò)ReLU激活函數(shù)處理,得到pC層的第v個(gè)輸出特征圖計(jì)算公式如下所示:
其中,為pC層的第u個(gè)輸入特征圖與第v個(gè)輸出特征圖相對(duì)應(yīng)的卷積核,m為當(dāng)前卷積層的前一下采樣層的輸出特征圖個(gè)數(shù),表示pC層的第u個(gè)輸入特征圖,同時(shí)也是pC-1層的第u個(gè)輸出特征圖,*表示矩陣卷積,當(dāng)pC=C1時(shí),則pC-1層為輸入層。
依次計(jì)算所有的輸出特征圖,得到pC層的輸出特征圖將p更新為p+1,并返回步驟2-3-1-1判斷網(wǎng)絡(luò)類(lèi)型,進(jìn)行下一個(gè)網(wǎng)絡(luò)層的操作;
步驟2-3-1-3,處理下采樣層:此時(shí)有p=pS,pS∈{S1,S2,S3,S4},將步驟2-3-1-2得到的卷積層的輸出特征圖分別與相卷積,再以步長(zhǎng)為2進(jìn)行采樣,采樣得到pS層的輸出特征圖計(jì)算公式如下所示:
其中,Sample(·)表示步長(zhǎng)為2的采樣處理,pS-1表示當(dāng)前下采樣層的前一卷積層,表示pS層的輸出特征圖中的第j個(gè)輸出特征圖,得到pS層的輸出特征圖后,將p更新為p+1,并返回步驟2-3-1-1判斷網(wǎng)絡(luò)類(lèi)型,進(jìn)行下一個(gè)網(wǎng)絡(luò)層的操作;
步驟2-3-1-4,計(jì)算F1層概率向量:若網(wǎng)絡(luò)層p為分類(lèi)器層,即p=F1,通過(guò)矩陣變換,將C5的32幅分辨率為4×4的輸出特征圖以列順序展開(kāi),得到分辨率為512×1的F1層的輸出特征向量然后分別計(jì)算水平參數(shù)矩陣WH、垂直參數(shù)矩陣WV與的外積,將計(jì)算結(jié)果分別與水平偏置參數(shù)BH、垂直偏置參數(shù)BV求和,求和結(jié)果經(jīng)Softmax函數(shù)處理后得到水平概率向量HPVtest、垂直概率向量VPVtest,計(jì)算公式如下:
將其垂直概率向量VPVtest轉(zhuǎn)置,得到最終的垂直概率向量;
步驟2-3-2包括以下步驟:
步驟2-3-2-1,預(yù)測(cè)DC1層垂直方向:將輸入層的最后一幅輸入圖像與垂直概率向量VPVtest相卷積,得到分辨率為240×280的DC1層輸出特征圖
步驟2-3-2-2,預(yù)測(cè)DC2層垂直方向:將步驟2-3-2-1獲得的與水平概率向量HPVtest相卷積,得到動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)最終的外推圖像,其分辨率為240×240,將外推圖像與對(duì)應(yīng)測(cè)試樣本的對(duì)照標(biāo)簽相對(duì)比,判定動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行雷達(dá)回波外推的準(zhǔn)確性。
有益效果:基于動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò),在大量的雷達(dá)回波圖像集上進(jìn)行訓(xùn)練,并利用訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行雷達(dá)回波外推,有效提高了雷達(dá)回波外推的準(zhǔn)確度。
具體而言本發(fā)明與已有方法相比有以下優(yōu)點(diǎn):1.雷達(dá)資料的利用率高,與傳統(tǒng)雷達(dá)回波外推技術(shù)只利用少量的雷達(dá)資料相比,本發(fā)明在大量的雷達(dá)回波圖像集上訓(xùn)練,數(shù)據(jù)利用率更高;2.外推時(shí)效長(zhǎng),可以通過(guò)調(diào)整訓(xùn)練樣本集中樣本之間的時(shí)間間隔來(lái)提高外推時(shí)效。
附圖說(shuō)明
下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明做更進(jìn)一步的具體說(shuō)明,本發(fā)明的上述或其他方面的優(yōu)點(diǎn)將會(huì)變得更加清楚。
圖1為本發(fā)明流程圖。
圖2為動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)初始化模型結(jié)構(gòu)圖。
圖3為子網(wǎng)絡(luò)構(gòu)造圖。
圖4為概率預(yù)測(cè)層構(gòu)造圖。
圖5為矩陣零擴(kuò)充示意圖。
圖6為對(duì)2×2的矩陣進(jìn)行上采樣的過(guò)程示意圖。
具體實(shí)施方式
下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明做進(jìn)一步說(shuō)明。
如圖1所示,本發(fā)明包括以下步驟:
步驟1,如圖2所示,訓(xùn)練離線卷積神經(jīng)網(wǎng)絡(luò):輸入訓(xùn)練圖像集,對(duì)訓(xùn)練圖像集進(jìn)行數(shù)據(jù)預(yù)處理,得到訓(xùn)練樣本集,設(shè)計(jì)動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并初始化網(wǎng)絡(luò)訓(xùn)練參數(shù);利用訓(xùn)練樣本集訓(xùn)練動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò),輸入的有序圖像序列經(jīng)過(guò)動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)前向傳播得到一幅預(yù)測(cè)圖像,計(jì)算預(yù)測(cè)圖像和對(duì)照標(biāo)簽之間的誤差,通過(guò)反向傳播更新網(wǎng)絡(luò)的權(quán)值參數(shù)和偏置參數(shù),重復(fù)此過(guò)程直到達(dá)到訓(xùn)練結(jié)束條件,得到收斂的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò);
步驟2,在線雷達(dá)回波外推:輸入測(cè)試圖像集,對(duì)測(cè)試圖像集進(jìn)行數(shù)據(jù)預(yù)處理,得到測(cè)試樣本集,然后將測(cè)試樣本集輸入步驟1中獲得的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)中,經(jīng)過(guò)網(wǎng)絡(luò)前向傳播計(jì)算概率向量,并將輸入圖像序列中的最后一幅雷達(dá)回波圖像與得到的概率向量相卷積,得到預(yù)測(cè)的雷達(dá)回波外推圖像。
本發(fā)明步驟1包括以下步驟:
步驟1-1,數(shù)據(jù)預(yù)處理:輸入訓(xùn)練圖像集,對(duì)訓(xùn)練圖像集中的每一幅圖像進(jìn)行規(guī)范化處理,將每一幅圖像轉(zhuǎn)化為280×280的浮點(diǎn)數(shù)圖像,得到浮點(diǎn)數(shù)圖像集合,對(duì)浮點(diǎn)數(shù)圖像集合進(jìn)行劃分,構(gòu)造包含TrainsetSize組樣本的訓(xùn)練樣本集;
步驟1-2,初始化動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò):設(shè)計(jì)動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),構(gòu)造用于生成概率向量的子網(wǎng)絡(luò),再構(gòu)造用于圖像外推的概率預(yù)測(cè)層,為離線神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段提供動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)初始化模型;
步驟1-3,初始化動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù):令網(wǎng)絡(luò)學(xué)習(xí)率λ=0.0001,訓(xùn)練階段每次輸入的樣本數(shù)量BatchSize=10,訓(xùn)練樣本集的最大批訓(xùn)練次數(shù)當(dāng)前批訓(xùn)練次數(shù)BatchNum=1,網(wǎng)絡(luò)訓(xùn)練的最大迭代次數(shù)IterationMax=40,當(dāng)前迭代次數(shù)IterationNum=1;
步驟1-4,讀取訓(xùn)練樣本:采用批訓(xùn)練的方式,每次訓(xùn)練從步驟1-1獲得的訓(xùn)練樣本集中讀取BatchSize組訓(xùn)練樣本,每組訓(xùn)練樣本為{x1,x2,x3,x4,y},共包含5幅圖像,其中{x1,x2,x3,x4}作為輸入圖像序列,x1表示第一幅圖像,y為對(duì)應(yīng)的對(duì)照標(biāo)簽;
步驟1-5,前向傳播:在子網(wǎng)絡(luò)中提取步驟1-4獲得的輸入圖像序列特征,得到水平概率向量HPV和垂直概率向量VPV;在概率預(yù)測(cè)層中,將輸入圖像序列中的最后一幅圖像依次與VPV、HPV相卷積,得到前向傳播的輸出預(yù)測(cè)圖像;
步驟1-6,反向傳播:在概率預(yù)測(cè)層中反向求得概率向量的誤差項(xiàng),根據(jù)概率向量的誤差項(xiàng)從后至前逐層計(jì)算子網(wǎng)絡(luò)層中各個(gè)網(wǎng)絡(luò)層的誤差項(xiàng),進(jìn)而計(jì)算各個(gè)網(wǎng)絡(luò)層中誤差項(xiàng)對(duì)權(quán)值參數(shù)和偏置參數(shù)的梯度,利用得到的梯度更新動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的參數(shù);
步驟1-7,離線訓(xùn)練階段控制:對(duì)離線神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段進(jìn)行整體控制,分為以下三種情況:
若訓(xùn)練樣本集中仍存在未使用過(guò)的訓(xùn)練樣本,即BatchNum<BatchMax,則返回步驟1-4繼續(xù)讀取BatchSize組訓(xùn)練樣本,進(jìn)行網(wǎng)絡(luò)訓(xùn)練;
若訓(xùn)練樣本集中不存在未使用過(guò)的訓(xùn)練樣本,即BatchNum=BatchMax,且當(dāng)前網(wǎng)絡(luò)迭代次數(shù)小于最大迭代次數(shù),即IterationNum<IterationMax,則令BatchNum=1,返回步驟1-4繼續(xù)讀取BatchSize組訓(xùn)練樣本,進(jìn)行網(wǎng)絡(luò)訓(xùn)練;
若訓(xùn)練樣本集中不存在未使用過(guò)的訓(xùn)練樣本,即BatchNum=BatchMax,且網(wǎng)絡(luò)迭代次數(shù)達(dá)到最大迭代次數(shù),即IterationNum=IterationMax,則結(jié)束離線神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段,得到訓(xùn)練好的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)模型。
本發(fā)明步驟1-1數(shù)據(jù)預(yù)處理包括以下步驟:
步驟1-1-1,采樣:訓(xùn)練圖像集中的圖像按時(shí)間順序排列,并且等時(shí)間間隔分布,時(shí)間間隔為6分鐘,共包含NTrain幅圖像,通過(guò)如下公式確定TrainsetSize:
其中,Mod(NTrain,4)表示NTrain對(duì)4取模,[N]表示不大于N的最大整數(shù),求得TrainsetSize后,通過(guò)采樣保留訓(xùn)練圖像集中前4×TrainsetSize+1幅圖像,采樣時(shí)通過(guò)刪除訓(xùn)練圖像集中最后的圖像使圖像數(shù)量滿(mǎn)足要求;
步驟1-1-2,規(guī)范化圖像:對(duì)采樣得到的圖像進(jìn)行圖像變換,歸一化操作,將原始分辨率為2000×2000的彩色圖像轉(zhuǎn)換成分辨率為280×280的浮點(diǎn)數(shù)圖像;
步驟1-1-3,構(gòu)造訓(xùn)練樣本集:
利用步驟1-1-2獲得的浮點(diǎn)數(shù)圖像集構(gòu)造訓(xùn)練樣本集,將浮點(diǎn)數(shù)圖像集中每四個(gè)相鄰的圖像,即第{4N+1,4N+2,4N+3,4N+4}幅圖像作為一組輸入序列,第[4×(N+1)+1]幅圖像經(jīng)過(guò)裁剪,保留中央分辨率為240×240的部分作為對(duì)應(yīng)樣本的對(duì)照標(biāo)簽,對(duì)于第N組樣本其構(gòu)造方式如下:
上式中,G4N+1表示浮點(diǎn)數(shù)圖像集中的第4N+1幅圖像,N為正整數(shù),并有N∈[0,TrainsetSize-1],Crop(·)表示裁剪操作,裁剪后保留原圖像中央大小為240×240的部分,最終得到包含TrainsetSize組訓(xùn)練樣本的訓(xùn)練樣本集;
其中,步驟1-1-2包括以下步驟:
步驟1-1-2-1,圖像轉(zhuǎn)化:為降低卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的計(jì)算復(fù)雜度,將步驟1-1-1采樣得到的圖像轉(zhuǎn)化為灰度圖像,通過(guò)裁剪保留原始圖像中央分辨率為560×560的部分,將裁剪后的圖像分辨率壓縮為280×280,得到分辨率為280×280的灰度圖;
步驟1-1-2-2,數(shù)據(jù)歸一化:將步驟1-1-2-1中獲得的灰度圖中的每一個(gè)像素點(diǎn)的值從[0~255]映射到[0~1],通過(guò)歸一化之后得到分辨率為280×280的浮點(diǎn)數(shù)圖像。
本發(fā)明步驟1-2包括以下步驟:
步驟1-2-1,構(gòu)造子網(wǎng)絡(luò):將子網(wǎng)絡(luò)構(gòu)造為如圖3所示結(jié)構(gòu):
子網(wǎng)絡(luò)由10個(gè)網(wǎng)絡(luò)層構(gòu)成,從前至后依次為卷積層C1、下采樣層S1、卷積層C2、下采樣層S2、卷積層C3、下采樣層S3、卷積層C4、下采樣層S5、卷積層C5以及分類(lèi)器層F1;
步驟1-2-2,構(gòu)造概率預(yù)測(cè)層:將概率預(yù)測(cè)層構(gòu)造為如圖4所示結(jié)構(gòu):
概率預(yù)測(cè)層中構(gòu)造動(dòng)態(tài)卷積層DC1和動(dòng)態(tài)卷積層DC2,將子網(wǎng)絡(luò)輸出的垂直概率向量VPV作為動(dòng)態(tài)卷積層DC1的卷積核,水平概率向量HPV作為動(dòng)態(tài)卷積層DC2的卷積核;
其中,步驟1-2-1包括以下步驟:
步驟1-2-1-1,構(gòu)造卷積層:確定以下內(nèi)容:卷積層的輸出特征圖數(shù)量OutputMaps、卷積核k以及偏置參數(shù)bias。對(duì)于卷積核,需要確定卷積核的寬度KernelSize(卷積核的分辨率為KernelSize×KernelSize),卷積核的數(shù)量KernelNumber(該值為該卷積層輸入與輸出特征圖數(shù)量的乘積),并根據(jù)Xavier初始化方法構(gòu)造卷積核;對(duì)于偏置參數(shù),其數(shù)量與該層的輸出特征圖數(shù)量相同。對(duì)于卷積層lC,lC∈{C1,C2,C3,C4,C5},該層的輸出特征圖寬度為的值由其輸入特征圖分辨率和卷積核的大小共同決定,即
對(duì)于卷積層C1,令C1層的輸出特征圖數(shù)量OutputMapsC1=12,輸出特征圖的寬度OutputSizeC1=272,卷積核寬度KernelSizeC1=9,偏置參數(shù)biasC1均初始化為零,C1層的卷積核kC1的數(shù)量KernelNumberC1=48,卷積核中每一個(gè)參數(shù)的初始值為rand(·)用于生成隨機(jī)數(shù);
對(duì)于卷積層C2,令該層OutputMapsC2=32,OutputSizeC2=128,KernelSizeC2=9,偏置參數(shù)均初始化為零,C2層的卷積核kC2的數(shù)量KernelNumberC2=384,卷積核中每一個(gè)參數(shù)的初始值為
對(duì)于卷積層C3,令該層OutputMapsC3=32,OutputSizeC3=56,KernelSizeC3=9,偏置參數(shù)均初始化為零,C3層的卷積核kC3的數(shù)量KernelNumberC3=1024,卷積核中每一個(gè)參數(shù)的初始值為
對(duì)于卷積層C4,令該層OutputMapsC4=32,OutputSizeC4=20,KernelSizeC4=9,偏置參數(shù)均初始化為零,C4層的卷積核kC4的數(shù)量KernelNumberC4=1024,卷積核中每一個(gè)參數(shù)的初始值為
對(duì)于卷積層C5,令該層OutputMapsC5=32,OutputSizeC5=4,KernelSizeC5=7,偏置參數(shù)均初始化為零,C5層的卷積核kC5的數(shù)量KernelNumberC5=1024,卷積核中每一個(gè)參數(shù)的初始值為
步驟1-2-1-2,構(gòu)造下采樣層:下采樣層中不包含需要訓(xùn)練的參數(shù),將下采樣層S1、S2、S3和S4的采樣核均初始化為對(duì)于下采樣層lS,lS∈{S1,S2,S3,S4},其輸出特征圖數(shù)量與其上一層的卷積層的輸出特征圖數(shù)量保持一致,輸出特征圖寬度為其上一層的卷積層的輸出特征圖寬度的1/2,公式表達(dá)如下:
步驟1-2-1-3,構(gòu)造分類(lèi)器層:分類(lèi)器層由一個(gè)全連接層F1構(gòu)成,F(xiàn)1層的權(quán)值參數(shù)為水平權(quán)值參數(shù)矩陣WH和垂直權(quán)值參數(shù)矩陣WV,大小均為41×512,令權(quán)值參數(shù)矩陣中的每一個(gè)參數(shù)的初始值為偏置參數(shù)為水平偏置參數(shù)BH和垂直偏置參數(shù)BV,均初始化為41×1的一維零向量。
本發(fā)明步驟1-5包括以下步驟:
步驟1-5-1,子網(wǎng)絡(luò)計(jì)算概率向量:在子網(wǎng)絡(luò)中通過(guò)卷積層和下采樣層的交替處理提取輸入的圖像序列特征,在分類(lèi)器層中通過(guò)Softmax函數(shù)處理,得到水平概率向量HPV和垂直概率向量VPV;
步驟1-5-2,計(jì)算概率預(yù)測(cè)層輸出圖像:步驟1-5-1得到的HPV和VPV作為概率預(yù)測(cè)層的卷積核,將輸入圖像序列中的最后一幅圖像依次與VPV、HPV相卷積,得到前向傳播的輸出預(yù)測(cè)圖像。
本發(fā)明步驟1-5-1包括以下步驟:
步驟1-5-1-1,判斷網(wǎng)絡(luò)層類(lèi)型:用l表示當(dāng)前所處的子網(wǎng)絡(luò)中的網(wǎng)絡(luò)層,l初始值為C1,判斷網(wǎng)絡(luò)層l的類(lèi)型,若l∈{C1,C2,C3,C4,C5},則l為卷積層,執(zhí)行步驟1-5-1-2,若l∈{S1,S2,S3,S4},則l為下采樣層,執(zhí)行步驟1-5-1-4;
步驟1-5-1-2,處理卷積層:此時(shí)有l(wèi)=lC,lC∈{C1,C2,C3,C4,C5},首先計(jì)算lC層的第j個(gè)輸出特征圖將lC層的輸入特征圖分別與該層的對(duì)應(yīng)卷積核相卷積,將卷積結(jié)果求和,求和結(jié)果加上lC層的第j個(gè)偏置參數(shù)再經(jīng)過(guò)ReLU激活函數(shù)處理,得到計(jì)算公式如下所示:
其中,為lC層的第i個(gè)輸入特征圖與第j個(gè)輸出特征圖相對(duì)應(yīng)的卷積核,n為當(dāng)前卷積層的前一下采樣層的輸出特征圖個(gè)數(shù),表示lC層的第i個(gè)輸入特征圖,同時(shí)也是lC-1層的第i個(gè)輸出特征圖,*表示矩陣卷積,若lC=C1,則lC-1層為輸入層;
依次計(jì)算所有的輸出特征圖,得到lC層的輸出特征圖將l更新為l+1,并返回步驟1-5-1-1判斷網(wǎng)絡(luò)類(lèi)型,進(jìn)行下一個(gè)網(wǎng)絡(luò)層的操作;
步驟1-5-1-3,處理下采樣層:此時(shí)有l(wèi)=lS,lS∈{S1,S2,S3,S4},將步驟1-5-1-2得到的卷積層的輸出特征圖分別與相卷積,再以步長(zhǎng)為2進(jìn)行采樣,采樣得到lS層的輸出特征圖計(jì)算公式如下所示:
上式中,Sample(·)表示步長(zhǎng)為2的采樣處理,lS-1表示當(dāng)前下采樣層的前一卷積層,表示lS層的輸出特征圖中的第j個(gè)輸出特征圖,得到lS層的輸出特征圖后,將l更新為l+1,并返回步驟1-5-1-1判斷網(wǎng)絡(luò)類(lèi)型,進(jìn)行下一個(gè)網(wǎng)絡(luò)層的操作;
步驟1-5-1-4,計(jì)算F1層概率向量:若網(wǎng)絡(luò)層l為分類(lèi)器層,即l=F1,通過(guò)矩陣變換,將C5的32幅分辨率為4×4的輸出特征圖以列順序展開(kāi),得到分辨率為512×1的F1層的輸出特征向量aF1,分別計(jì)算水平權(quán)值參數(shù)矩陣WH與aF1的外積、垂直權(quán)值參數(shù)矩陣WV與aF1的外積,將計(jì)算結(jié)果分別與水平偏置參數(shù)BH、垂直偏置參數(shù)BV求和,經(jīng)Softmax函數(shù)處理后得到水平概率向量HPV和垂直概率向量VPV,具體計(jì)算公式如下:
將其垂直概率向量VPV轉(zhuǎn)置,得到最終的垂直概率向量;
步驟1-5-2包括以下步驟:
步驟1-5-2-1,預(yù)測(cè)DC1層垂直方向:將輸入層的最后一幅輸入圖像與垂直概率向量VPV相卷積,得到分辨率為240×280的DC1層輸出特征圖aDC1;
步驟1-5-2-2,預(yù)測(cè)DC2層垂直方向:將DC1層輸出特征圖aDC1與垂直概率向量HPV相卷積,得到前向傳播的輸出預(yù)測(cè)圖像,其分辨率為240×240。
本發(fā)明步驟1-6包括以下步驟:
步驟1-6-1,計(jì)算概率預(yù)測(cè)層誤差項(xiàng):將步驟1-5-2-2獲得的預(yù)測(cè)圖像與輸入的訓(xùn)練樣本中的對(duì)照標(biāo)簽求差,計(jì)算DC2層、DC1層的誤差項(xiàng),最終求得水平概率向量的誤差項(xiàng)δHPV和垂直概率向量的誤差項(xiàng)δVPV;
步驟1-6-2,計(jì)算子網(wǎng)絡(luò)誤差項(xiàng):根據(jù)水平概率向量的誤差項(xiàng)δHPV和垂直概率向量的誤差項(xiàng)δVPV,從后至前依次計(jì)算分類(lèi)層F1,卷積層C5、C4、C3、C2、C1和下采樣層S4、S3、S2、S1的誤差項(xiàng),求得的任一層誤差項(xiàng)矩陣的分辨率與該層的輸出特征圖的分辨率相一致;
步驟1-6-3,計(jì)算梯度:根據(jù)步驟1-6-2獲得的誤差項(xiàng)計(jì)算子網(wǎng)絡(luò)各個(gè)網(wǎng)絡(luò)層的誤差項(xiàng)對(duì)該層權(quán)值參數(shù)和偏置參數(shù)的梯度值;
步驟1-6-4,更新參數(shù):將步驟1-6-3獲得的各網(wǎng)絡(luò)層的權(quán)值參數(shù)和偏置參數(shù)的梯度值乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到各網(wǎng)絡(luò)層權(quán)值參數(shù)和偏置參數(shù)的更新項(xiàng),將原權(quán)值參數(shù)和偏置參數(shù)分別與該更新項(xiàng)求差,得到更新后的權(quán)值參數(shù)和偏置參數(shù)。
本發(fā)明步驟1-6-1包括以下步驟:
步驟1-6-1-1,計(jì)算動(dòng)態(tài)卷積層DC2誤差項(xiàng):將步驟1-5-2-2獲得的預(yù)測(cè)圖像與該組樣本的對(duì)照標(biāo)簽求差,得到大小為240×240的誤差項(xiàng)矩陣δDC2;
步驟1-6-1-2,計(jì)算動(dòng)態(tài)卷積層DC1誤差項(xiàng):通過(guò)零填充將DC2層的誤差項(xiàng)矩陣δDC2拓展為240×320,將水平概率向量旋轉(zhuǎn)180度,將拓展后的誤差項(xiàng)矩陣與翻轉(zhuǎn)后的水平概率向量相卷積,得到DC1層的誤差項(xiàng)矩陣δDC1,其大小為240×280,公式如下所示:
δDC1=Expand_Zero(δDC2)*rot180(HPV),
其中,Expand_Zero(·)表示零擴(kuò)充函數(shù),rot180(·)表示角度為180°的旋轉(zhuǎn)函數(shù),將2×2的矩陣零擴(kuò)充為4×4的過(guò)程如圖5所示,零擴(kuò)充后的矩陣,中央分辨率為2×2的區(qū)域與原矩陣相一致,其余位置用零像素填充;
步驟1-6-1-3,計(jì)算概率向量誤差項(xiàng):計(jì)算水平概率向量HPV的誤差項(xiàng),將DC1層的輸出特征圖與誤差項(xiàng)矩陣δDC2相卷積,卷積后得到1×41的行向量,該向量為HPV的誤差項(xiàng)δHPV,公式如下:
δHPV=aDC1*δDC2,
計(jì)算垂直概率向量VPV的誤差項(xiàng),將輸入層的輸入特征圖與誤差項(xiàng)矩陣δDC1相卷積,卷積后得到41×1的列向量,該向量為VPV的誤差項(xiàng)δVPV,公式如下:
其中,為訓(xùn)練樣本的輸入圖像序列中的最后一幅圖像;
步驟1-6-2包括以下步驟:
步驟1-6-2-1,計(jì)算分類(lèi)器層F1誤差項(xiàng):將步驟1-6-1-3獲得的概率向量的誤差項(xiàng)δVPV和δHPV分別與F1層的垂直權(quán)值參數(shù)矩陣WV和水平權(quán)值參數(shù)矩陣WH進(jìn)行矩陣相乘,再將矩陣的外積求和并取平均值,得到F1層的誤差項(xiàng)δF1,公式如下:
其中,×表示矩陣外積,(·)T代表矩陣的轉(zhuǎn)置,得到的δF1的大小為512×1;
步驟1-6-2-2,計(jì)算卷積層C5誤差項(xiàng):通過(guò)矩陣變換,將步驟1-6-2-1中獲得的F1層的誤差項(xiàng)δF1變換為32個(gè)分辨率為4×4的矩陣得到C5層的誤差項(xiàng)表示變換后的第32個(gè)分辨率為4×4的矩陣;此次矩陣變換與步驟1-5-1-6中的矩陣變換互為逆變換,
步驟1-6-2-3,判斷網(wǎng)絡(luò)層類(lèi)型:用l表示當(dāng)前所處的子網(wǎng)絡(luò)中的網(wǎng)絡(luò)層(l初始值為S4),判斷網(wǎng)絡(luò)層l的類(lèi)型,若l∈{S4,S3,S2,S1},則l為下采樣層,執(zhí)行步驟1-6-2-4,若l∈{C4,C3,C2,C1},則l為卷積層,執(zhí)行步驟1-6-2-5;
步驟1-6-2-4,計(jì)算下采樣層誤差項(xiàng):若l層為下采樣層,此時(shí)有l(wèi)=lS,lS∈{S1,S2,S3,S4},對(duì)于lS層的第i個(gè)誤差項(xiàng)矩陣通過(guò)零填充分別將lS+1層的各個(gè)誤差項(xiàng)矩陣拓展至寬度為其中l(wèi)S+1層表示當(dāng)前下采樣層的后一卷積層,j表示lS+1層的第j個(gè)誤差項(xiàng),并有再將對(duì)應(yīng)的卷積核旋轉(zhuǎn)180度,然后將拓展后的矩陣與翻轉(zhuǎn)后的卷積核相卷積,并將卷積結(jié)果求和,得到lS層的第i個(gè)誤差項(xiàng)矩陣公式如下所示:
其中,
依次計(jì)算所有的誤差項(xiàng)矩陣,得到lS層的輸出特征圖將l更新為l-1,并返回步驟1-6-2-3判斷網(wǎng)絡(luò)類(lèi)型,計(jì)算上一個(gè)網(wǎng)絡(luò)層的誤差項(xiàng);
步驟1-6-2-5,計(jì)算卷積層誤差項(xiàng):若l層為卷積層,此時(shí)有l(wèi)=lC,lC∈{C1,C2,C3,C4,C5},由于步驟1-6-2-3中l(wèi)的初始值為S4,因此并不會(huì)出現(xiàn)lC=C5的情況,對(duì)于lC層的第i個(gè)誤差項(xiàng)矩陣先對(duì)lC+1層中的對(duì)應(yīng)的第i個(gè)誤差項(xiàng)矩陣進(jìn)行上采樣,上采樣時(shí)將中每個(gè)元素的誤差項(xiàng)值平均分至采樣區(qū)域中,得到分辨率為的上采樣矩陣,再計(jì)算激活函數(shù)在lC層對(duì)應(yīng)特征圖處的導(dǎo)數(shù)與求得的上采樣矩陣的內(nèi)積,得到lC層的第i個(gè)誤差項(xiàng)矩陣公式如下所示:
其中,·表示矩陣內(nèi)積,ReLU'(·)表示ReLU激活函數(shù)的導(dǎo)數(shù),其形式如下:
UpSample(·)表示上采樣函數(shù),圖6為對(duì)2×2的矩陣進(jìn)行上采樣的過(guò)程,上采樣后原圖像中的每一個(gè)像素對(duì)應(yīng)一個(gè)上采樣區(qū)域,原像素值平均分配至采樣區(qū)域中的每一個(gè)像素點(diǎn)中,依次計(jì)算所有的誤差項(xiàng)矩陣,得到lC層的輸出特征圖
步驟1-6-2-6,此時(shí)l層為卷積層,即l=lC,之后分為兩種情況:
若l≠C1,則將l更新為l-1,并返回步驟1-6-2-3判斷網(wǎng)絡(luò)類(lèi)型,計(jì)算上一個(gè)網(wǎng)絡(luò)層的誤差項(xiàng);
若l=C1,則步驟1-6-2子網(wǎng)絡(luò)誤差項(xiàng)計(jì)算結(jié)束;
步驟1-6-3包括以下步驟:
步驟1-6-3-1,計(jì)算卷積層誤差項(xiàng)對(duì)卷積核的梯度:用lC表示當(dāng)前處理的卷積層,lC∈{C1,C2,C3,C4,C5},從C1層開(kāi)始逐層計(jì)算各卷積層誤差項(xiàng)對(duì)卷積核的梯度,將lC-1層的第i個(gè)輸出特征圖與第lC層的第j個(gè)誤差項(xiàng)矩陣相卷積,卷積結(jié)果為對(duì)應(yīng)卷積核的梯度值公式如下:
上式中,與分別表示第lC層與第lC-1層的輸出特征圖個(gè)數(shù),▽k為誤差項(xiàng)對(duì)卷積核的梯度值;
步驟1-6-3-2,計(jì)算各卷積層誤差項(xiàng)對(duì)偏置的梯度:用lC表示當(dāng)前處理的卷積層,lC∈{C1,C2,C3,C4,C5},從C1層開(kāi)始逐層計(jì)算各卷積層誤差項(xiàng)對(duì)偏置的梯度,將lC層的第j個(gè)誤差項(xiàng)矩陣中的所有元素進(jìn)行求和,得到該層第j個(gè)偏置的梯度值公式如下所示:
其中,Sum(·)表示對(duì)矩陣的所有元素進(jìn)行求和;
步驟1-6-3-3,計(jì)算F1層誤差項(xiàng)對(duì)權(quán)值參數(shù)的梯度:分別計(jì)算水平概率向量與垂直概率向量的誤差項(xiàng)δHPV、δVPV與F1層誤差項(xiàng)δF1的內(nèi)積,計(jì)算結(jié)果為F1層誤差項(xiàng)對(duì)權(quán)值參數(shù)WH、WV的梯度值,公式如下:
▽W(xué)H=(δHPV)T×(δF1)T,
▽W(xué)V=δVPV×(δF1)T,
上式中,▽W(xué)H為誤差項(xiàng)對(duì)水平權(quán)值參數(shù)的梯度值,▽W(xué)V為誤差項(xiàng)對(duì)垂直權(quán)值參數(shù)的梯度值;
步驟1-6-3-4,計(jì)算F1層誤差項(xiàng)對(duì)偏置參數(shù)的梯度:將水平概率向量與垂直概率向量的誤差項(xiàng)δHPV、δVPV分別作為F1層誤差項(xiàng)對(duì)水平偏置參數(shù)BH和垂直偏置參數(shù)BV的梯度值,公式如下:
▽BH=(δHPV)T,
▽BV=δVPV,
其中,▽BH為誤差項(xiàng)對(duì)水平偏置參數(shù)的梯度值,▽BV為誤差項(xiàng)對(duì)垂直偏置參數(shù)的梯度值;
步驟1-6-4包括以下步驟:
步驟1-6-4-1,更新各卷積層權(quán)值參數(shù):將步驟1-6-3-1獲得的各卷積層誤差項(xiàng)對(duì)卷積核的梯度乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到卷積核的修正項(xiàng),再將原卷積核與該修正項(xiàng)求差,得到更新的卷積核公式如下:
其中,λ為步驟1-3中確定的網(wǎng)絡(luò)學(xué)習(xí)率,λ=0.0001;
步驟1-6-4-2,更新各卷積層偏置參數(shù):將步驟1-6-3-2獲得的各卷積層誤差項(xiàng)對(duì)偏置的梯度乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到偏置參數(shù)的修正項(xiàng),再將原偏置項(xiàng)與該修正項(xiàng)求差,得到更新的偏置項(xiàng)公式如下:
步驟1-6-4-3,更新F1層權(quán)值參數(shù):將步驟1-6-3-3獲得的F1層誤差項(xiàng)對(duì)權(quán)值參數(shù)WH和WV的梯度值乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到權(quán)值參數(shù)的修正項(xiàng),再將原權(quán)值參數(shù)WH和WV分別與求得的修正項(xiàng)求差,得到更新的WH和WV,公式如下:
WH=WH-λ▽W(xué)H,
WV=WV-λ▽W(xué)V;
步驟1-6-4-4,更新F1層偏置參數(shù):將步驟1-6-3-4獲得的F1層誤差項(xiàng)對(duì)偏置參數(shù)BH和BV的梯度值乘上動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,得到偏置參數(shù)的修正項(xiàng),再將原偏置參數(shù)BH和BV分別與求得的修正項(xiàng)求差,得到更新的BH和BV,公式如下:
BH=BH-λ▽BH,
BV=BV-λ▽BV。
本發(fā)明步驟2包括以下步驟:
步驟2-1,數(shù)據(jù)預(yù)處理:輸入測(cè)試圖像集,對(duì)測(cè)試圖像集中的每一幅圖像進(jìn)行規(guī)范化處理,將每一幅圖像轉(zhuǎn)化為280×280的浮點(diǎn)數(shù)圖像,再對(duì)浮點(diǎn)數(shù)圖像集合進(jìn)行劃分,構(gòu)造包含TestsetSize組樣本的測(cè)試樣本集;
步驟2-2,讀取測(cè)試樣本:將步驟2-1獲得的TestsetSize組測(cè)試樣本輸入經(jīng)過(guò)訓(xùn)練的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)中;
步驟2-3,前向傳播:在子網(wǎng)絡(luò)中提取輸入的圖像序列特征,得到水平概率向量HPVtest和垂直概率向量VPVtest;在概率預(yù)測(cè)層中,將輸入圖像序列中的最后一幅圖像依次與VPVtest、HPVtest相卷積,得到動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)最終的外推圖像。
本發(fā)明步驟2-1包括以下步驟:
步驟2-1-1,采樣:測(cè)試圖像集中的圖像按時(shí)間順序排列,并且等時(shí)間間隔分布,時(shí)間間隔為6分鐘,共包含NTest幅圖像,通過(guò)如下公式確定TestsetSize:
如果Mod(NTest,4)=0則
如果Mod(NTest,4)≠0則
求得TestsetSize后,通過(guò)采樣保留測(cè)試圖像集中前4×TestsetSize+1幅圖像,采樣時(shí)通過(guò)刪除測(cè)試圖像集中最后的圖像使圖像數(shù)量滿(mǎn)足要求;
步驟2-1-2,圖像規(guī)范化:對(duì)采樣得到的圖像進(jìn)行圖像變換,歸一化操作,將原始分辨率為2000×2000的彩色圖像轉(zhuǎn)換成分辨率為280×280的浮點(diǎn)數(shù)圖像;
步驟2-1-3,構(gòu)造測(cè)試樣本集:利用步驟2-1-2獲得的浮點(diǎn)數(shù)圖像集構(gòu)造測(cè)試樣本集,將浮點(diǎn)數(shù)圖像集中每四個(gè)相鄰的圖像,即第{4M+1,4M+2,4M+3,4M+4}幅圖像作為一組輸入序列,第[4×(M+1)+1]幅圖像經(jīng)過(guò)裁剪,保留中央分辨率為240×240的部分作為對(duì)應(yīng)樣本的對(duì)照標(biāo)簽,其中為正整數(shù),并有M∈[0,TestsetSize-1]得到包含TestsetSize組測(cè)試樣本的測(cè)試樣本集;
步驟2-1-2包括以下步驟:
步驟2-1-2-1,圖像轉(zhuǎn)化:為降低卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的計(jì)算復(fù)雜度,將彩色的回波強(qiáng)度CAPPI圖像轉(zhuǎn)化為灰度圖像,再通過(guò)裁剪保留原始圖像中央分辨率為560×560的部分,將裁剪后的圖像分辨率壓縮為280×280,得到分辨率為280×280的灰度圖;
步驟2-1-2-2,數(shù)據(jù)歸一化:將步驟1-1-2-1中獲得的灰度圖中的每一個(gè)像素點(diǎn)的值從[0~255]映射到[0~1],通過(guò)歸一化之后得到分辨率為280×280的浮點(diǎn)數(shù)圖像;
步驟2-3包括以下步驟:
步驟2-3-1,計(jì)算子網(wǎng)絡(luò)概率向量:在子網(wǎng)絡(luò)中通過(guò)卷積層和下采樣層的交替處理提取輸入的圖像序列特征,然后在分類(lèi)器層中通過(guò)Softmax函數(shù)處理,得到水平概率向量HPVtest和垂直概率向量VPVtest;
步驟2-3-2,計(jì)算概率預(yù)測(cè)層輸出圖像:步驟2-3-1得到的VPVtest和HPVtest作為概率預(yù)測(cè)層的卷積核,將輸入圖像序列中的最后一幅圖像依次與VPVtest和HPVtest相卷積,得到動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)最終的外推圖像;
步驟2-3-1包括以下步驟:
步驟2-3-1-1,判斷網(wǎng)絡(luò)層類(lèi)型:用p表示當(dāng)前所處的子網(wǎng)絡(luò)中的網(wǎng)絡(luò)層,判斷網(wǎng)絡(luò)層p的類(lèi)型,p初始值為C1,若p∈{C1,C2,C3,C4,C5},則p為卷積層,執(zhí)行步驟2-3-1-2,若p∈{S1,S2,S3,S4},則p為下采樣層,執(zhí)行步驟2-3-1-4;
步驟2-3-1-2,處理卷積層:此時(shí)有p=pC,pC∈{C1,C2,C3,C4,C5},首先計(jì)算pC層的第v個(gè)輸出特征圖將pC層的輸入特征圖分別與該層的對(duì)應(yīng)卷積核相卷積,再將卷積結(jié)果求和,求和結(jié)果加上pC層的第v個(gè)偏置再經(jīng)過(guò)ReLU激活函數(shù)處理,得到pC層的第v個(gè)輸出特征圖計(jì)算公式如下所示:
其中,為pC層的第u個(gè)輸入特征圖與第v個(gè)輸出特征圖相對(duì)應(yīng)的卷積核,m為當(dāng)前卷積層的前一下采樣層的輸出特征圖個(gè)數(shù),表示pC層的第u個(gè)輸入特征圖,同時(shí)也是pC-1層的第u個(gè)輸出特征圖,*表示矩陣卷積,當(dāng)pC=C1時(shí),則pC-1層為輸入層。
依次計(jì)算所有的輸出特征圖,得到pC層的輸出特征圖將p更新為p+1,并返回步驟2-3-1-1判斷網(wǎng)絡(luò)類(lèi)型,進(jìn)行下一個(gè)網(wǎng)絡(luò)層的操作;
步驟2-3-1-3,處理下采樣層:此時(shí)有p=pS,pS∈{S1,S2,S3,S4},將步驟2-3-1-2得到的卷積層的輸出特征圖分別與相卷積,再以步長(zhǎng)為2進(jìn)行采樣,采樣得到pS層的輸出特征圖計(jì)算公式如下所示:
其中,Sample(·)表示步長(zhǎng)為2的采樣處理,pS-1表示當(dāng)前下采樣層的前一卷積層,表示pS層的輸出特征圖中的第j個(gè)輸出特征圖,得到pS層的輸出特征圖后,將p更新為p+1,并返回步驟2-3-1-1判斷網(wǎng)絡(luò)類(lèi)型,進(jìn)行下一個(gè)網(wǎng)絡(luò)層的操作;
步驟2-3-1-4,計(jì)算F1層概率向量:若網(wǎng)絡(luò)層p為分類(lèi)器層,即p=F1,通過(guò)矩陣變換,將C5的32幅分辨率為4×4的輸出特征圖以列順序展開(kāi),得到分辨率為512×1的F1層的輸出特征向量然后分別計(jì)算水平參數(shù)矩陣WH、垂直參數(shù)矩陣WV與的外積,將計(jì)算結(jié)果分別與水平偏置參數(shù)BH、垂直偏置參數(shù)BV求和,求和結(jié)果經(jīng)Softmax函數(shù)處理后得到水平概率向量HPVtest、垂直概率向量VPVtest,計(jì)算公式如下:
將其垂直概率向量VPVtest轉(zhuǎn)置,得到最終的垂直概率向量;
步驟2-3-2包括以下步驟:
步驟2-3-2-1,預(yù)測(cè)DC1層垂直方向:將輸入層的最后一幅輸入圖像與垂直概率向量VPVtest相卷積,得到分辨率為240×280的DC1層輸出特征圖
步驟2-3-2-2,預(yù)測(cè)DC2層垂直方向:將步驟2-3-2-1獲得的與水平概率向量HPVtest相卷積,得到動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)最終的外推圖像,其分辨率為240×240,將外推圖像與對(duì)應(yīng)測(cè)試樣本的對(duì)照標(biāo)簽相對(duì)比,判定動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行雷達(dá)回波外推的準(zhǔn)確性。
本發(fā)明提供了一種基于動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)的雷達(dá)回波外推方法,具體實(shí)現(xiàn)該技術(shù)方案的方法和途徑很多,以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。本實(shí)施例中未明確的各組成部分均可用現(xiàn)有技術(shù)加以實(shí)現(xiàn)。