一種適應(yīng)噪聲條件下的抽樣學(xué)習(xí)機(jī)遙感定量反演方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及遙感應(yīng)用領(lǐng)域,具體涉及一種適應(yīng)噪聲條件下的抽樣學(xué)習(xí)機(jī)遙感定量 反演方法。
【背景技術(shù)】
[0002] 遙感技術(shù)作為一種重要的地球系統(tǒng)觀測手段,能提供持續(xù)的全球地表變化信息。 近年來,基于遙感數(shù)據(jù)定量反演水、大氣及生態(tài)環(huán)境參數(shù)的應(yīng)用需求愈發(fā)突出,對定量反演 精度提出了日益迫切的要求。定量遙感所要解決的主要問題是如何利用遙感數(shù)據(jù)精確估算 地表參量,實現(xiàn)遙感數(shù)據(jù)行業(yè)應(yīng)用模型的鏈接,提高模型的預(yù)報精度。以水質(zhì)遙感定量反演 應(yīng)用為例,首先建立遙感觀測指標(biāo)與具體水質(zhì)參量(如總懸浮物濃度、無機(jī)懸浮物濃度等) 間的數(shù)學(xué)模型,然后估計模型參數(shù),最后定量推演預(yù)測解決水質(zhì)監(jiān)測的行業(yè)需求。目前,較 為常用的定量反演算法主要有最小二乘線性回歸法、偏最小二乘法等。這類算法具有較嚴(yán) 密的數(shù)學(xué)理論基礎(chǔ),模型簡單且效率高,在遙感定量反演應(yīng)用中亦取得良好的效果,但對解 決遙感觀測指標(biāo)與地表參量間非線性關(guān)系的能力稍顯不足,實用性受限。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明要解決的技術(shù)問題是:提供一種更具有適應(yīng)性的遙感定量反演方法,同時 解決遙感定量反演應(yīng)用中呈現(xiàn)的非線性和噪聲干擾的問題。
[0004] 本發(fā)明為解決上述技術(shù)問題所采取的技術(shù)方案為:一種適應(yīng)噪聲條件下的抽樣學(xué) 習(xí)機(jī)遙感定量反演方法,其特征在于:它包括以下步驟:
[0005] S1、利用極限學(xué)習(xí)機(jī)中固定小數(shù)量級權(quán)值的特點模擬遙感定量反演中影響因子與 反演對象間的非線性的復(fù)雜數(shù)學(xué)關(guān)系,將其轉(zhuǎn)化為求解一個線性系統(tǒng)=Tt;其中,H為 網(wǎng)絡(luò)隱含層輸出矩陣,由輸入層、隱含層及激勵函數(shù)決定;TT為輸出層輸出矩陣,由輸出層 決定邛為網(wǎng)絡(luò)模型參數(shù);
[0006] 其中影響因子為遙感觀測指標(biāo),反演對象為建模過程中采用的地面實測數(shù)據(jù);
[0007] S2 :根據(jù)網(wǎng)絡(luò)模型參數(shù)0的維度自適應(yīng)選取模型參數(shù)估計算法,維度高時選擇 NAPSAC算法,維度低時選擇RANSAC算法;預(yù)設(shè)相應(yīng)的標(biāo)準(zhǔn)判斷維度的高和低;
[0008] S3 :利用S2中選取的模型參數(shù)估計算法,實現(xiàn)對Hf3 =Tt中網(wǎng)絡(luò)模型參數(shù)e的 求解。
[0009] 按上述方法,所述的H通過選擇激勵函數(shù)與神經(jīng)元個數(shù)來確定。
[0010] 按上述方法,所述的S2以RANSAC算法確定0所需的迭代運算次數(shù)為標(biāo)準(zhǔn),若迭 代運算次數(shù)高于^次則判定維度為高維,否則維度為低維。
[0011] 按上述方法,當(dāng)選擇NAPSAC算法時,通過計算H中所有兩兩向量間的歐氏幾何距 離,將其歐氏幾何距離均值作為相鄰點的閾值半徑r。
[0012] 按上述方法,當(dāng)選擇NAPSAC算法時,根據(jù)實際樣本數(shù)據(jù)的計算確定是否為局內(nèi)點 閾值e,進(jìn)而判定模型參數(shù)估計收斂所需的最少局內(nèi)點的數(shù)量G,其中G與實際樣本數(shù)據(jù)中 噪聲所占的比例相關(guān)。
[0013] 按上述方法,G的取值小于或等于通過局內(nèi)點閾值e劃分得到的局內(nèi)點個數(shù)的最 大值。
[0014] 本發(fā)明的有益效果為:通過建立遙感定量反演中影響因子與反演對象間的復(fù)雜數(shù) 學(xué)關(guān)系模型;在模型參數(shù)求解過程中,能過濾樣本數(shù)據(jù)噪聲的干擾,自適應(yīng)選取模型參數(shù)估 計算法,從而能快速獲取模型最優(yōu)的參數(shù)結(jié)果;本發(fā)明能夠快速獲取模型參數(shù),學(xué)習(xí)效率 高,并且能夠有效排除噪聲影響,提高定量反演精度,泛化能力強(qiáng)。。
【附圖說明】
[0015] 圖1為本發(fā)明一實施例的控制流程圖。
【具體實施方式】
[0016] 人工神經(jīng)網(wǎng)絡(luò)(artificialneuralnetwork,ANN)作為一種非線性、統(tǒng)計建模工 具,被廣泛應(yīng)用于遙感定量反演中。該模型通過神經(jīng)結(jié)構(gòu)與連接權(quán)值的設(shè)定,能充分逼近任 意復(fù)雜的非線性關(guān)系。然而,由于ANN模型自身的缺陷,如學(xué)習(xí)收斂速度慢、易陷入局部極 值以及網(wǎng)絡(luò)結(jié)構(gòu)難以確定等問題,使得反演精度難于滿足應(yīng)用需求。Huang等改進(jìn)了傳統(tǒng) ANN模型,提出了一種極限學(xué)習(xí)機(jī)(ExtremeLearningMachine,ELM)算法。ELM算法是一 種新型的單隱層前向神經(jīng)網(wǎng)絡(luò),其學(xué)習(xí)速度與泛化能力比ANN模型均具有較大幅度提升。 這主要取決于兩方面的改進(jìn):(1)隨機(jī)產(chǎn)生小數(shù)量級的值作為輸入層與隱含層間的連接權(quán) 值和隱含層神經(jīng)元閾值,突破了ANN模型網(wǎng)絡(luò)結(jié)構(gòu)難以確定的缺陷;(2)采用最小二乘法求 解模型隱含層與輸出層間的連接權(quán)值,解決了傳統(tǒng)ANN模型易陷入局部最優(yōu)解的問題,并 提升了最優(yōu)參數(shù)獲取的學(xué)習(xí)效率。然而,ELM模型在遙感定量反演應(yīng)用中,同樣遇到新的問 題,即ELM模型參數(shù)估計的精度受制于樣本數(shù)據(jù)質(zhì)量。遙感影像受到數(shù)據(jù)獲取時傳感器系 統(tǒng)噪聲、光照、天氣條件、云層等的干擾,而地面同步測量數(shù)據(jù)同樣因儀器偏差、實驗人員的 主觀操作等引入噪聲。若用夾雜噪聲的樣本數(shù)據(jù)訓(xùn)練ELM模型參數(shù),會產(chǎn)生較大的誤差,將 無法達(dá)到業(yè)務(wù)應(yīng)用精度的需求。
[0017] 由上述可知,常規(guī)ELM模型主要采用最小二乘法求解模型隱含層與輸出層間的連 接權(quán)值,這將難于排除噪聲干擾。為了提升ELM模型對數(shù)據(jù)噪聲的魯棒性,可考慮利用隨 機(jī)抽樣一致性(RandomSampleConsensus,RANSAC)或N鄰近點抽樣一致性(NAdjacent PointsSampleConsensus,NAPSAC)算法改進(jìn)模型參數(shù)估計過程。RANSAC算法和NAPSAC 算法均可以排除局外點(噪聲數(shù)據(jù))、選擇局內(nèi)點進(jìn)行模型參數(shù)求解,能有效地排除樣本數(shù) 據(jù)中噪聲的影響。當(dāng)ELM模型隱含層與輸出層間連接權(quán)值參數(shù)維度較低的情況下,RANSAC 算法與NAPSAC算法達(dá)到相同模型精度所需的循環(huán)次數(shù)差異較小。但NAPSAC的算法復(fù)雜度 要遠(yuǎn)高于RANSAC算法,故RANSAC算法更為合適。而當(dāng)參數(shù)維度相對較高時,模型初始化需 要的樣本點數(shù)量也將隨之增多。RANSAC算法需大量的迭代運算方能獲得較為準(zhǔn)確的模型參 數(shù);而NAPSAC算法考慮了相鄰的樣本點(空間幾何距離度量)具有相似特征的特性,在模 型初始化時利用鄰近點特征選取替代RANSAC算法隨機(jī)選取的方法,能有效地提升模型參 數(shù)獲取的速度與模型參數(shù)估計的精度,故NAPSAC算法更為適合。
[0018] 本發(fā)明提供一種適應(yīng)噪聲條件下的抽樣學(xué)習(xí)機(jī)遙感定量反演方法,如圖1所示, 它包括以下步驟:
[0019] S1、利用極限學(xué)習(xí)機(jī)中固定小數(shù)量級權(quán)值的特點模擬遙感定量反演中影響因子與 反演對象間的非線性的復(fù)雜數(shù)學(xué)關(guān)系,將其轉(zhuǎn)化為求解一個線性系統(tǒng)=Tt;其中,H為 網(wǎng)絡(luò)隱含層輸出矩陣,由輸入層、隱含層及激勵函數(shù)決定;TT為輸出層輸出矩陣,由輸出層 決定邛為網(wǎng)絡(luò)模型參數(shù);其中影響因子為遙感觀測指標(biāo),反演對象為建模過程中采用地 面實測數(shù)據(jù)。所述的H通過選擇激勵函數(shù)與神經(jīng)元個數(shù)來確定。
[0020] S2 :根據(jù)網(wǎng)絡(luò)模型參數(shù)0的維度自適應(yīng)選取模型參數(shù)估計算法,維度高時選擇 NAPSAC算法,維度低時選擇RANSAC算法;預(yù)設(shè)相應(yīng)的標(biāo)準(zhǔn)判斷維度的高和低。
[0021] 本實施例中,以RANSAC算法確定0所需的迭代運算次數(shù)為標(biāo)準(zhǔn),若迭代運算次數(shù) 高于^ (如ni= 1000,也可根據(jù)情況另外設(shè)置其它值)次則判定維度為高維,否則維度為 低維。
[0022] 當(dāng)選擇NAPSAC算法時,通過計算H中所有兩兩向量間的歐氏幾何距離,將其歐氏 幾何距離均值作為相鄰點的閾值半徑r。根據(jù)實際樣本數(shù)據(jù)的計算確定是否為局內(nèi)點閾值 e,進(jìn)而判定模型參數(shù)估計收斂所需的最少局內(nèi)點的數(shù)量G,其中G與實際樣本數(shù)據(jù)中噪聲 所占的比例相關(guān)。通常情況下,G的取值小于或等于通過局內(nèi)點閾值e劃分得到的局內(nèi)點 個數(shù)的最大值。
[0023] S3 :利用S2中選取的模型參數(shù)估計算法,實現(xiàn)對Hf3 =Tt中參數(shù)0的求解。
[0024] 本實施例中,具體的實施步驟如下:
[0025] 1、遙感觀測指標(biāo)與地面實測數(shù)據(jù)的時空配準(zhǔn)
[0026] 主要實現(xiàn)遙感觀測指標(biāo)與地面實測數(shù)據(jù)在時間尺度上和空間尺度上配準(zhǔn),具體步 驟為:
[0027] ①根據(jù)遙感衛(wèi)星的軌道參數(shù)計算衛(wèi)星的過境時間,開展針對地表參量觀測衛(wèi)星的 野外同步觀測試驗;
[0028] ②對遙感影像進(jìn)行數(shù)據(jù)預(yù)處理,包括輻射定標(biāo)、大氣校正、幾何校正等,并對地面 實測數(shù)據(jù)進(jìn)行歸一化處理,即統(tǒng)一量綱、數(shù)量級等;
[0029] ③根據(jù)每個地面實測點的空間坐標(biāo)獲取相同位置對應(yīng)遙感數(shù)據(jù)上所有波段信息 (如亮度、輻射率或反射率);
[0030] ④計算地面實測地表參量與遙感影像各個波段間的相關(guān)系數(shù),據(jù)此選取最優(yōu)的波 段組合以表征地表參量的特性;
[0031] ⑤將選取的波段信息與地面實測地表參量值一一對應(yīng),形成特征向量,構(gòu)成樣本 數(shù)據(jù)集。
[0032] 2、非線性關(guān)系至線性模型的映射
[0033] 假設(shè)輸入層有n個輸入變量、隱含層含有1個神經(jīng)元、輸出層有m個輸出變量。輸 入層與隱含層間連接權(quán)值、隱含層與輸出層間的連接權(quán)值以及隱含層神經(jīng)元的閾值分別記 為w、|3、b,那么,《、|3和b可表示為:
[0034]
[0035] 式中,《 ^表示輸入層第i個變量與隱含層第j個神經(jīng)元間的連接權(quán)值;0 jk表示 隱含層第j個神經(jīng)元與