本發(fā)明涉及一種基于典型對應(yīng)分析的土壤氮儲量估算方法,屬于土壤屬性預測技術(shù)領(lǐng)域。
背景技術(shù):
土壤中氮的90%是有機態(tài)的,10%是無機態(tài)的。土壤中的無機氮主要包括no3-、no2-、交換性nh4+、非交換型nh4+。絕大部分土壤中的有機態(tài)氮是與無機礦物結(jié)合在一起的。土壤氮含量與土壤有機質(zhì)含量的變化是一致的。氮在自然界中活動比較活躍,能夠在大氣、土壤與生物有機體之間互相交換。區(qū)域土壤氮儲量估算是全球氣候變化的重要組成部分。準確估算區(qū)域氮儲量可以有效減少國家尺度氮循環(huán)模擬中的不確定性。
傳統(tǒng)的氮儲量估算方法主要有生命帶類型法、植被類型法、氣候參數(shù)法、土壤類型法。由于基于圖斑的方法,例如土壤類型法、植被類型法原理簡單且數(shù)據(jù)易于獲取,諸多技術(shù)人員往往采用該類型方法進行氮儲量估算。然而,這種方法往往忽略了土壤發(fā)展受自然條件綜合影響這一問題。隨著3s技術(shù)與土壤調(diào)查的迅速發(fā)展,土壤形成的環(huán)境變量的地理數(shù)據(jù),如年均降雨、日照輻射模擬、高精度數(shù)字高程模型等數(shù)據(jù)的精度與質(zhì)量都有了較大提升。
國內(nèi)外學者經(jīng)過大量的土壤制圖實踐已證明,基于環(huán)境變量的數(shù)字土壤制圖方法具有更高的預測精度。常規(guī)的數(shù)字土壤制圖方法已日趨成熟,不同領(lǐng)域的空間預測方法已廣泛地被改進并應(yīng)用到土壤屬性的預測,例如地統(tǒng)計、多元回歸、機器學習與深度學習等。據(jù)不完全統(tǒng)計,至少有上百種預測方法能夠基于土壤數(shù)據(jù)與環(huán)境變量(自變量)來有效地預測區(qū)域級的土壤屬性空間分布。數(shù)字土壤制圖的主要目標是進行土壤屬性的空間預測,其理論與技術(shù)基礎(chǔ)是已觀測到的土壤樣點數(shù)據(jù)與成土因素(氣候、地形、母質(zhì)等)間的耦合關(guān)系。大量的應(yīng)用實踐已證明應(yīng)用合適的環(huán)境變量來構(gòu)建土壤屬性預測模型能夠獲取較高的預測精度。然而,環(huán)境變量數(shù)據(jù)種類眾多且不同數(shù)據(jù)誤差迥異,會導致預測模型在訓練過程中出現(xiàn)過擬合現(xiàn)象,進而降低了預測模型的泛化能力。同時,環(huán)境變量的高維數(shù)也會顯著提升模型的運行時間,降低預測模型的運行效率。因此,部分較為高效的預測技術(shù)往往采用降維的預處理技術(shù),來將合理的環(huán)境變量信息映射到一個低維的空間中,不僅可以降低預測模型的復雜度與計算復雜度,還可以減少過擬合和增加模型的泛化能力。
作為主成分分析的拓展,對應(yīng)分析可以逐步地展現(xiàn)降維的分析過程,進而直觀、明了地觀察和分析目標數(shù)據(jù)與自變量的相關(guān)系。典型對應(yīng)分析(cca,canonicalcorrespondenceanalysis)是基于對應(yīng)分析衍生的一種較為先進的數(shù)學排序方法。cca主要的技術(shù)原理是在對應(yīng)分析迭代分析的過程中,將每次得到的樣方排序坐標與自變量進行多元線性回歸,使用單峰線性排序并結(jié)合諸多環(huán)境變量,進而分析環(huán)境因子排序與樣方排序,計算到最終的排序結(jié)果。根據(jù)環(huán)境變量和排序軸可以確定環(huán)境變量的相關(guān)系數(shù),進而在排序圖上得到代表該環(huán)境變量的點。因此,通過這種排序方式能夠同時顯示采樣點、多種土壤類型和環(huán)境變量的關(guān)系,進而綜合地反映土壤演化的最核心變量,能夠更科學、更準確地構(gòu)建地表生態(tài)模擬方程,創(chuàng)造更高的生態(tài)、環(huán)境、生產(chǎn)價值。
然而,由于土壤屬性的高度空間異質(zhì)性及環(huán)境變量的多源特征,系列的預處理技術(shù)尚難以直接地應(yīng)用在計量土壤學中,歸納起來,主要有以下幾個方面的技術(shù)問題:
(1)基于圖斑的傳統(tǒng)氮儲量估算方法及區(qū)域級野外調(diào)查工作方式已較難適應(yīng)快速發(fā)展的精準農(nóng)業(yè)、環(huán)境管理等部門的需求。更多的應(yīng)用領(lǐng)域?qū)Ω呔鹊耐寥赖獌α抗浪慵捌淇臻g分布提出了更高的要求,尤其是土壤氮密度的空間部分圖分辨率及總氮儲量估算。
(2)從本質(zhì)上分析,降維技術(shù)將原始信息維度空間映射到一個新的維度空間。環(huán)境變量(自變量)特征種類的總數(shù)沒有發(fā)生改變,然而在映射的過程中特征值會發(fā)生部分的變化。部分特征的特征值發(fā)生的改變會潛在導致預測模型往往只能面向單一的預測目標,而在計量土壤學中,往往是相同的環(huán)境變量(如氣候、母質(zhì)等)對應(yīng)了多種土壤屬性(如土壤有效氮含量、土壤有機碳含量等)。因此,傳統(tǒng)的降維預處理技術(shù)在使用相同環(huán)境變量預測多種土壤屬性的過程中存在先天不足。
(3)在空間上,土壤屬性具有高度的空間變異特征。土壤屬性與環(huán)境變量具有非常復雜的非線性關(guān)系。典型對應(yīng)分析理論上能夠反映土壤屬性與環(huán)境變量以及土壤屬性內(nèi)部的協(xié)同關(guān)系。然而,不同土壤屬性的最優(yōu)環(huán)境變量集合可能并不完全相同。如何選擇具有相似環(huán)境變量的土壤屬性群是解決對應(yīng)關(guān)系分析的挑戰(zhàn)。
(4)數(shù)字土壤圖的主要優(yōu)點是能集成有效的環(huán)境變量并提供制圖結(jié)果的可信度。傳統(tǒng)的逐步線性回歸方法所篩選的環(huán)境變量集合難以適應(yīng)機器學習等復雜模型。面向多種土壤屬性,如何根據(jù)相同的最優(yōu)環(huán)境變量集合獨立訓練預測模型,并評估環(huán)境變量本身與預測結(jié)果的不確定性,是土壤圖應(yīng)用所必須提供的定量信息。如何對數(shù)字土壤圖進行客觀科學地驗證直接關(guān)系到數(shù)字土壤制圖技術(shù)的工業(yè)應(yīng)用。
綜上所述,對于上述分析出的不足之處,同樣出現(xiàn)在土壤氮儲量的其他分析應(yīng)用方面。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種基于典型對應(yīng)分析的土壤氮儲量估算方法,能夠解決任意深度土壤氮密度預測模型的輸入?yún)?shù)選擇問題,進而預測不同地理尺度的土壤氮儲量。
本發(fā)明為了解決上述技術(shù)問題采用以下技術(shù)方案:本發(fā)明設(shè)計了一種基于典型對應(yīng)分析的土壤氮儲量估算方法,包括如下步驟:
步驟a.分別針對土壤區(qū)域中的各個采樣點,構(gòu)建采樣點下的預設(shè)k個固定深度層次,并進入步驟b;
步驟b.分別針對土壤區(qū)域中的各個采樣點,獲得采樣點下各個固定深度層次分別所對應(yīng)的土壤氮含量,并進一步獲得采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,然后進入步驟c;
步驟c.分別針對土壤區(qū)域中的各個采樣點,獲得采樣點所對應(yīng)預設(shè)總環(huán)境變量集合x中的各個環(huán)境變量,然后將各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,以及各個采樣點分別所對應(yīng)預設(shè)總環(huán)境變量集合x中的各個環(huán)境變量構(gòu)成預測數(shù)據(jù)集pred,然后進入步驟d;
步驟d.使用多元線性回歸方法與隨機森林方法,根據(jù)預測數(shù)據(jù)集pred,分別針對各個固定深度層次,剔除固定深度層次相對各個采樣點不顯著的環(huán)境變量,進而分別更新獲得各個固定深度層次分別相對應(yīng)各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k,最后進入步驟e,其中,1≤k≤k;
步驟e.使用典型對應(yīng)分析,根據(jù)預測數(shù)據(jù)集pred,針對預設(shè)總環(huán)境變量集合x中各個環(huán)境變量進行典型對應(yīng)分析,選擇綜合作用顯著的環(huán)境變量,構(gòu)成第二優(yōu)化環(huán)境變量集合x_cca,然后進入步驟f;
步驟f.根據(jù)各個固定深度層次分別相對各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k,以及第二優(yōu)化環(huán)境變量集合x_cca,構(gòu)建綜合環(huán)境變量集合,并針對綜合環(huán)境變量集合與土壤屬性的擬合,進行多種主成分分析測試,選擇最優(yōu)主成分分析方法,然后進入步驟g;
步驟g.采用最優(yōu)主成分分析方法針對綜合環(huán)境變量集合進行分析,獲得環(huán)境變量分析結(jié)果,并根據(jù)環(huán)境變量分析結(jié)果和各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,構(gòu)建多種預測模型,接著使用留一法交叉驗證評估預測模型,獲得最優(yōu)預測模型,最后,根據(jù)最優(yōu)預測模型預測土壤區(qū)域中未采樣區(qū)域的土壤氮儲量。
作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟a中,分別針對土壤區(qū)域中的各個采樣點,按如下步驟進行操作,構(gòu)建采樣點下的預設(shè)k個固定深度層次;
步驟a01.判斷采樣點至其下基巖層的深度是否小于預設(shè)深度,是則進入步驟a02,否則直接將采樣點下的預設(shè)深度劃分為預設(shè)k個固定深度層次,構(gòu)建采樣點下的預設(shè)k個固定深度層次,該采樣點的處理結(jié)束;
步驟a02.將采樣點至其下基巖層的深度劃分為預設(shè)k個層次,并針對該各個層次深度,按該各個層次深度與預設(shè)深度劃分為預設(shè)k個固定深度之間的比例進行拉伸,統(tǒng)一為預設(shè)k個固定深度層次,構(gòu)建采樣點下的預設(shè)k個固定深度層次,該采樣點的處理結(jié)束。
作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟b包括如下步驟:
步驟b01.針對土壤區(qū)域中的各個采樣點,獲得各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮含量tnik,1≤i≤n,tnik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤氮含量,然后進入步驟b02;
步驟b02.根據(jù)如下公式:
分別獲得各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度tndik,其中,tndik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤氮密度;tnik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤氮含量,bdik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤容重;grik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤礫石含量;tk表示第k個固定深度層次所對應(yīng)的深度。
作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述預設(shè)總環(huán)境變量集合x中包括氣候、地形因子、土地利用類型、成土母質(zhì)類型、植被類型,其中,氣候包括年均降水、年均降雨變量;地形因子包括坡度、坡向、高程、地形濕度指數(shù)因子、地表曲率。
作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟d包括如下步驟:
步驟d01.根據(jù)各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,分別針對各個固定深度層次,針對預設(shè)總環(huán)境變量集合x,使用逐步回歸方法,剔除固定深度層次相對各個采樣點不顯著的環(huán)境變量,選擇線性回歸模型中自變量集合,即各個固定深度層次分別相對各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k,x_mlr_k表示第k個固定深度層次相對各個采樣點的第一優(yōu)化環(huán)境變量集合,然后進入步驟d02;
步驟d02.根據(jù)各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,分別針對各個固定深度層次,使用隨機森林模型計算固定深度層次相對各個采樣點所對應(yīng)預設(shè)總環(huán)境變量集合x中各個環(huán)境變量的重要性,構(gòu)成固定深度層次相對各個采樣點所對應(yīng)環(huán)境變量重要性集合,即各個固定深度層次相對各個采樣點所對應(yīng)環(huán)境變量重要性集合rf_k,rf_k表示第k個固定深度層次相對各個采樣點所對應(yīng)環(huán)境變量重要性集合,然后進入步驟d03;
步驟d03.分別針對各個固定深度層次相對各個采樣點所對應(yīng)環(huán)境變量重要性集合rf_k,針對rf_k中各個環(huán)境變量,按重要性進行降序排序,并選擇前預設(shè)比例數(shù)量的環(huán)境變量,構(gòu)成集合rf_k',然后進入步驟d04;
步驟d04.分別針對各個固定深度層次分別相對各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k,將存在于x_mlr_k中、且不存在于rf_k'中的環(huán)境變量,由x_mlr_k中刪除,更新x_mlr_k,進而分別更新獲得各個固定深度層次分別相對各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k。
作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟e包括如下步驟:
步驟e01.以預測數(shù)據(jù)集pred為分析對象,分別針對各個采樣點,初始化采樣點分數(shù)ai,以及初始化λ=1,1≤i≤n,n表示采樣點的數(shù)量;
步驟e02.使用特征值λ,按如下公式:
計算所有采樣點對應(yīng)預設(shè)總環(huán)境變量集合x中各環(huán)境變量的分數(shù)wm,1≤m≤m,m表示預設(shè)總環(huán)境變量集合x中環(huán)境變量的數(shù)量,wm表示所有采樣點對應(yīng)預設(shè)總環(huán)境變量集合x中第m個環(huán)境變量的分數(shù)wm,bim表示第i個采樣點所對應(yīng)預設(shè)總環(huán)境變量集合x中的第m個環(huán)境變量,
步驟e03.分別針對各個采樣點,根據(jù)如下公式:
計算獲得采樣點對應(yīng)預設(shè)總環(huán)境變量集合x中各個環(huán)境變量平均加權(quán)后樣點分數(shù)
步驟e04.根據(jù)如下公式:
獲得方程的回歸系數(shù)e,式中,a表示所有采樣點分數(shù)集合,x表示預設(shè)總環(huán)境變量集合;
步驟e05.根據(jù)如下公式:
計算獲得所有采樣點所構(gòu)樣點圖的質(zhì)心c,并進一步根據(jù)如下公式:
計算獲得分散度f,其中,
步驟e06.以步驟e02至步驟e05為單次迭代,判斷當前樣點分數(shù)之和
步驟e07.分析典型對應(yīng)分析的結(jié)果,根據(jù)樣點圖中各個環(huán)境變量與中心之間的距離,針對各個環(huán)境變量按距離由近至遠的順序進行排序,并按序選取預設(shè)總環(huán)境變量集合x中預設(shè)比例數(shù)量的環(huán)境變量,構(gòu)成第二優(yōu)化環(huán)境變量集合x_cca。
作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟f包括如下步驟:
步驟f01.分別針對第二優(yōu)化環(huán)境變量集合x_cca中的各個環(huán)境變量,判斷環(huán)境變量是否位于第一優(yōu)化環(huán)境變量集合x_mlr_k中,是則不做任何處理;否則將該環(huán)境變量加入至第一優(yōu)化環(huán)境變量集合x_mlr_k中;進而針對第二優(yōu)化環(huán)境變量集合x_cca中各個環(huán)境變量進行如上處理,更新獲得第一優(yōu)化環(huán)境變量集合x_mlr_k,作為綜合環(huán)境變量集合;
步驟f02.采用預設(shè)各類主成分分析法,針對綜合環(huán)境變量集合與土壤屬性的擬合進行主成分分析測試,并根據(jù)預設(shè)方差解釋閾值,選擇最優(yōu)主成分分析方法。
作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟f02中的預設(shè)各類主成分分析法包括:pca主成分分析、核主成分分析kpca、稀疏主成分分析spca和奇異值分解svd。
作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟g包括如下步驟:
步驟g01.采用最優(yōu)主成分分析方法針對綜合環(huán)境變量集合進行分析,獲得環(huán)境變量分析結(jié)果,并根據(jù)環(huán)境變量分析結(jié)果和各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,采用預設(shè)各類構(gòu)建方法,構(gòu)建對應(yīng)各種預測模型;
步驟g02.采用留一法交叉驗證方法評估各個預測模型,分別針對各種預測模型,獲得對應(yīng)預測結(jié)果,并分別根據(jù)各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度與各種預測模型所對應(yīng)的預測結(jié)果,分別計算獲得各個預測模型的預測誤差,然后進一步分別獲得各個預測模型所對應(yīng)的均方根誤差,最后選擇最小均方根誤差所對應(yīng)的預測模型作為最優(yōu)預測模型;
步驟g03.根據(jù)最優(yōu)預測模型和綜合環(huán)境變量集合,預測獲得土壤區(qū)域中未采樣區(qū)域中各個未采樣點的土壤氮密度tndr,然后采用如下公式:
獲得土壤區(qū)域中未采樣區(qū)域的土壤氮儲量,其中,1≤r≤r,r表示土壤區(qū)域中未采樣區(qū)域中未采樣點的數(shù)量,area表示土壤區(qū)域中未采樣樣點所代表的面積。
作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟g01中,所述預設(shè)各類構(gòu)建方法包括多元線性回歸方法、隨機森林方法、外部漂移克里格方法。
本發(fā)明所述一種基于典型對應(yīng)分析的土壤氮儲量估算方法采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)效果:
(1)本發(fā)明設(shè)計的一種基于典型對應(yīng)分析的土壤氮儲量估算方法,能夠合理融合不同重要性分析方法的分析結(jié)果,集成了傳統(tǒng)的降維技術(shù)與重要性分析技術(shù)(多元回歸、隨機森林),進而防止了模型過擬合或環(huán)境變量數(shù)據(jù)集信息特征的缺失。在未來環(huán)境變量日益豐富的條件下,能夠充分挖掘變量的有效特征,進而最大程度地提升預測模型的泛化能力;
(2)本發(fā)明設(shè)計的一種基于典型對應(yīng)分析的土壤氮儲量估算方法中,創(chuàng)新地采用了典型對應(yīng)分析計算綜合作用顯著的環(huán)境變量,該方法能夠充分體現(xiàn)多變量直接梯度分析方法的優(yōu)勢,將土壤視為一個有機的整體,分析不同土壤屬性與環(huán)境變量的綜合耦合關(guān)系,進而篩選綜合作用最為顯著的環(huán)境變量集合,有效提升制圖分辨率并擴大制圖范圍,進而顯著地提高土壤信息的服務(wù)功能和質(zhì)量;
(3)本發(fā)明設(shè)計的一種基于典型對應(yīng)分析的土壤氮儲量估算方法中,提出了提出的綜合預處理與重要性分析機制,具有一定的普適性,并且所提出的技術(shù)方案不僅面向土壤氮儲量估算,也可以與土壤有機碳估算相結(jié)合,構(gòu)成土壤碳氮比預測的技術(shù)流程,不僅如此,本發(fā)明設(shè)計技術(shù)方案還具有較好的魯棒性,通過多種技術(shù)篩選的綜合環(huán)境變量集合可望在保證預測精度的同時,也降低其他土壤屬性預測過程的誤差。
附圖說明
圖1是土壤采樣點數(shù)據(jù)與環(huán)境變量集合構(gòu)建主要流程圖;
圖2是基于多元線性回歸與隨機森林模型的環(huán)境變量選擇流程示意圖;
圖3是基于最優(yōu)預測模型與綜合環(huán)境變量估算研究區(qū)土壤氮儲量的分析流程圖;
圖4是本發(fā)明實施例中0-30cm土壤氮密度與環(huán)境變量的回歸系數(shù)直方圖;
圖5是本發(fā)明實施例中0-30cm土壤氮密度與環(huán)境變量的典型對應(yīng)分析散點圖;
圖6是本發(fā)明實施例中0-30cm土壤氮密度空間分布圖。
具體實施方式
下面結(jié)合說明書附圖對本發(fā)明的具體實施方式作進一步詳細的說明。
本發(fā)明所設(shè)計基于典型對應(yīng)分析的土壤氮儲量估算方法,屬于面向計量土壤學與空間分析中土壤氮儲量估算技術(shù)領(lǐng)域,涉及一米土體土壤氮密度計算與土壤氮密度在不同景觀特征下呈現(xiàn)的空間變異特征模擬,能夠通過多種降維技術(shù)對自變量進行高效的信息預處理,使用典型對應(yīng)分析分析不同深度氮儲量的綜合影響變量。特別是在不同性質(zhì)、不同深度的土壤屬性影響因素分析方面,構(gòu)建多種土壤屬性與環(huán)境變量典型特征的綜合擬合關(guān)系。
本發(fā)明設(shè)計技術(shù)方案的基本思想是在建立空間預測模型前,通過環(huán)境變量的重要性分析、主成分分析與典型對應(yīng)分析對環(huán)境變量的信息量進行分析。通過多種主成分分析技術(shù)的對比試驗,選擇一種最高效的主成分分析方法。通過構(gòu)建多種土壤屬性與盡可能多的環(huán)境變量進行典型對應(yīng)分析,遴選綜合作用較為顯著的環(huán)境變量,在保證高維環(huán)境變量集合的特征能夠充分保留的情況下,基于數(shù)字土壤制圖方法與交叉驗證機制,提升空間預測精度。
為實現(xiàn)上述目的,本發(fā)明設(shè)計了一種基于典型對應(yīng)分析的土壤氮儲量估算方法,實際應(yīng)用過程當中,具體包括如下步驟:
步驟a.分別針對土壤區(qū)域中的各個采樣點,構(gòu)建采樣點下的預設(shè)k個固定深度層次,并進入步驟b。如圖1所示,具體分別針對土壤區(qū)域中的各個采樣點,按如下步驟進行操作,構(gòu)建采樣點下的預設(shè)k個固定深度層次。
步驟a01.判斷采樣點至其下基巖層的深度是否小于預設(shè)深度,是則進入步驟a02,否則直接將采樣點下的預設(shè)深度劃分為預設(shè)k個固定深度層次,構(gòu)建采樣點下的預設(shè)k個固定深度層次,該采樣點的處理結(jié)束。
步驟a02.將采樣點至其下基巖層的深度劃分為預設(shè)k個層次,并針對該各個層次深度,按該各個層次深度與預設(shè)深度劃分為預設(shè)k個固定深度之間的比例進行拉伸,統(tǒng)一為預設(shè)k個固定深度層次,構(gòu)建采樣點下的預設(shè)k個固定深度層次,該采樣點的處理結(jié)束,實際應(yīng)用中,可以設(shè)置第一個固定深度層次的厚度為0-5cm,第二個固定深度層次的厚度為5-15cm,第三個固定深度層次的厚度為15-30cm,第四個固定深度層次的厚度為30-60cm,第五個固定深度層次的厚度為60-100cm。
步驟b.分別針對土壤區(qū)域中的各個采樣點,獲得采樣點下各個固定深度層次分別所對應(yīng)的土壤氮含量,并進一步獲得采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,然后進入步驟c。
上述步驟b具體包括如下步驟:
步驟b01.按照gsm國際土壤制圖標準(globalsoilmap),使用等積樣條函數(shù)(equal-areaspline),針對土壤區(qū)域中的各個采樣點,獲得各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮含量tnik,1≤i≤n,tnik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤氮含量,然后進入步驟b02。
步驟b02.根據(jù)如下公式:
分別獲得各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度tndik,其中,tndik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤氮密度;tnik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤氮含量,bdik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤容重;grik表示第i個采樣點下第k個固定深度層次所對應(yīng)的土壤礫石含量;tk表示第k個固定深度層次所對應(yīng)的深度。
步驟c.分別針對土壤區(qū)域中的各個采樣點,獲得采樣點所對應(yīng)預設(shè)總環(huán)境變量集合x中的各個環(huán)境變量,然后將各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,以及各個采樣點分別所對應(yīng)預設(shè)總環(huán)境變量集合x中的各個環(huán)境變量構(gòu)成預測數(shù)據(jù)集pred,然后進入步驟d。其中,預設(shè)總環(huán)境變量集合x中包括氣候、地形因子、土地利用類型、成土母質(zhì)類型、植被類型,其中,氣候包括年均降水、年均降雨變量;地形因子包括坡度、坡向、高程、地形濕度指數(shù)因子、地表曲率。
步驟d.使用多元線性回歸方法與隨機森林方法,根據(jù)預測數(shù)據(jù)集pred,分別針對各個固定深度層次,剔除固定深度層次相對各個采樣點不顯著的環(huán)境變量,進而分別更新獲得各個固定深度層次分別相對應(yīng)各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k,最后進入步驟e,其中,1≤k≤k。
如圖2所示,上述步驟d具體包括如下步驟:
步驟d01.根據(jù)各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,分別針對各個固定深度層次,針對預設(shè)總環(huán)境變量集合x,使用逐步回歸方法,剔除固定深度層次相對各個采樣點不顯著的環(huán)境變量,選擇線性回歸模型中自變量集合,即各個固定深度層次分別相對各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k,x_mlr_k表示第k個固定深度層次相對各個采樣點的第一優(yōu)化環(huán)境變量集合,然后進入步驟d02。
由于環(huán)境變量已經(jīng)進行歸一化操作,因此環(huán)境變量的量綱對回歸方程的構(gòu)建不會造成影響。因此,對土壤氮密度與環(huán)境變量的回歸方程擬合可以得到每個環(huán)境變量的回歸系數(shù),回歸系數(shù)的大小代表了該變量的在回歸模型的重要性。
有別于多元回歸模型,隨機森林模型能夠通過構(gòu)建眾多的決策樹,通過袋外數(shù)據(jù)誤差(outofbag)機制計算模型的預測錯誤率,進而計算每個特征的重要性,并按照降序排序。該方法已被證明為無偏估計,因此隨機森林模型不需要再進行交叉驗證。
步驟d02.根據(jù)各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,分別針對各個固定深度層次,使用隨機森林模型計算固定深度層次相對各個采樣點所對應(yīng)預設(shè)總環(huán)境變量集合x中各個環(huán)境變量的重要性,構(gòu)成固定深度層次相對各個采樣點所對應(yīng)環(huán)境變量重要性集合,即各個固定深度層次相對各個采樣點所對應(yīng)環(huán)境變量重要性集合rf_k,rf_k表示第k個固定深度層次相對各個采樣點所對應(yīng)環(huán)境變量重要性集合,然后進入步驟d03。
步驟d03.分別針對各個固定深度層次相對各個采樣點所對應(yīng)環(huán)境變量重要性集合rf_k,針對rf_k中各個環(huán)境變量,按重要性進行降序排序,并選擇前預設(shè)比例數(shù)量的環(huán)境變量,構(gòu)成集合rf_k',然后進入步驟d04。實際應(yīng)用中,選擇前80%數(shù)量的環(huán)境變量,構(gòu)成集合rf_k'。
步驟d04.分別針對各個固定深度層次分別相對各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k,將存在于x_mlr_k中、且不存在于rf_k'中的環(huán)境變量,由x_mlr_k中刪除,更新x_mlr_k,進而分別更新獲得各個固定深度層次分別相對各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k。
步驟e.使用典型對應(yīng)分析,根據(jù)預測數(shù)據(jù)集pred,針對預設(shè)總環(huán)境變量集合x中各個環(huán)境變量進行典型對應(yīng)分析,選擇綜合作用顯著的環(huán)境變量,構(gòu)成第二優(yōu)化環(huán)境變量集合x_cca,然后進入步驟f。
上述步驟e具體包括如下步驟:
步驟e01.以預測數(shù)據(jù)集pred為分析對象,分別針對各個采樣點,初始化采樣點分數(shù)ai,以及初始化λ=1,1≤i≤n,n表示采樣點的數(shù)量。
步驟e02.使用特征值λ,按如下公式:
計算所有采樣點對應(yīng)預設(shè)總環(huán)境變量集合x中各環(huán)境變量的分數(shù)wm,1≤m≤m,m表示預設(shè)總環(huán)境變量集合x中環(huán)境變量的數(shù)量,wm表示所有采樣點對應(yīng)預設(shè)總環(huán)境變量集合x中第m個環(huán)境變量的分數(shù)wm,bim表示第i個采樣點所對應(yīng)預設(shè)總環(huán)境變量集合x中的第m個環(huán)境變量,
步驟e03.分別針對各個采樣點,根據(jù)如下公式:
計算獲得采樣點對應(yīng)預設(shè)總環(huán)境變量集合x中各個環(huán)境變量平均加權(quán)后樣點分數(shù)
步驟e04.根據(jù)如下公式:
獲得方程的回歸系數(shù)e,式中,a表示所有采樣點分數(shù)集合,x表示預設(shè)總環(huán)境變量集合。
步驟e05.根據(jù)如下公式:
計算獲得所有采樣點所構(gòu)樣點圖的質(zhì)心c,并進一步根據(jù)如下公式:
計算獲得分散度f,其中,
步驟e06.以步驟e02至步驟e05為單次迭代,判斷當前樣點分數(shù)之和
分析典型對應(yīng)分析的結(jié)果,從距離中的位置看:越靠近中心,越?jīng)]有特征,越遠離中心,說明特征越明顯。因此,距離圖的中心最遠的環(huán)境變量對于不同深度的土壤氮密度變量越具有統(tǒng)計意義。
步驟e07.分析典型對應(yīng)分析的結(jié)果,根據(jù)樣點圖中各個環(huán)境變量與中心之間的距離,針對各個環(huán)境變量按距離由近至遠的順序進行排序,并按序選取預設(shè)總環(huán)境變量集合x中預設(shè)比例數(shù)量的環(huán)境變量,構(gòu)成第二優(yōu)化環(huán)境變量集合x_cca。
步驟f.根據(jù)各個固定深度層次分別相對各個采樣點的第一優(yōu)化環(huán)境變量集合x_mlr_k,以及第二優(yōu)化環(huán)境變量集合x_cca,構(gòu)建綜合環(huán)境變量集合,并針對綜合環(huán)境變量集合與土壤屬性的擬合,進行多種主成分分析測試,選擇最優(yōu)主成分分析方法,然后進入步驟g。
上述步驟f具體包括如下步驟:
步驟f01.分別針對第二優(yōu)化環(huán)境變量集合x_cca中的各個環(huán)境變量,判斷環(huán)境變量是否位于第一優(yōu)化環(huán)境變量集合x_mlr_k中,是則不做任何處理;否則將該環(huán)境變量加入至第一優(yōu)化環(huán)境變量集合x_mlr_k中;進而針對第二優(yōu)化環(huán)境變量集合x_cca中各個環(huán)境變量進行如上處理,更新獲得第一優(yōu)化環(huán)境變量集合x_mlr_k,作為綜合環(huán)境變量集合;
步驟f02.采用預設(shè)各類主成分分析法,針對綜合環(huán)境變量集合與土壤屬性的擬合進行主成分分析測試,并根據(jù)預設(shè)方差解釋閾值,選擇最優(yōu)主成分分析方法,其中,預設(shè)各類主成分分析法包括:pca主成分分析(principalcomponentanalysis,pca)、核主成分分析kpca(kernelprincipalcomponentanalysis,kpca)、稀疏主成分分析spca(sparseprincipalcomponentanalysis,spca)和奇異值分解svd(singularvaluedecomposition,svd)。
步驟g.采用最優(yōu)主成分分析方法針對綜合環(huán)境變量集合進行分析,獲得環(huán)境變量分析結(jié)果,并根據(jù)環(huán)境變量分析結(jié)果和各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,構(gòu)建多種預測模型,接著使用留一法交叉驗證評估預測模型,獲得最優(yōu)預測模型,最后,根據(jù)最優(yōu)預測模型預測土壤區(qū)域中未采樣區(qū)域的土壤氮儲量。
如圖3所示,上述步驟g具體包括如下步驟:
步驟g01.采用最優(yōu)主成分分析方法針對綜合環(huán)境變量集合進行分析,獲得環(huán)境變量分析結(jié)果,并根據(jù)環(huán)境變量分析結(jié)果和各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度,采用預設(shè)各類構(gòu)建方法,構(gòu)建對應(yīng)各種預測模型,其中,預設(shè)各類構(gòu)建方法包括多元線性回歸方法(mlr)、隨機森林方法(rf)、外部漂移克里格方法(ked)。
步驟g02.采用留一法交叉驗證方法評估各個預測模型,分別針對各種預測模型,獲得對應(yīng)預測結(jié)果,并分別根據(jù)各個采樣點下各個固定深度層次分別所對應(yīng)的土壤氮密度與各種預測模型所對應(yīng)的預測結(jié)果,分別計算獲得各個預測模型的預測誤差,然后進一步分別獲得各個預測模型所對應(yīng)的均方根誤差,最后選擇最小均方根誤差所對應(yīng)的預測模型作為最優(yōu)預測模型。
步驟g03.根據(jù)最優(yōu)預測模型和綜合環(huán)境變量集合,預測獲得土壤區(qū)域中未采樣區(qū)域中各個未采樣點的土壤氮密度tndr,然后采用如下公式:
獲得土壤區(qū)域中未采樣區(qū)域的土壤氮儲量,其中,1≤r≤r,r表示土壤區(qū)域中未采樣區(qū)域中未采樣點的數(shù)量,area表示土壤區(qū)域中未采樣樣點所代表的面積。
將上述本發(fā)明所設(shè)計基于典型對應(yīng)分析的土壤氮儲量估算方法,應(yīng)用于吉林省德惠市與榆樹市的土壤氮儲量的估算。
土壤氮密度在不同的土壤層次中變化較大。在土壤表層,土壤氮密度受地表植被影響較大,氮庫含量往往較高。然而,表下層土壤氮密度仍然不可忽略。為了更準確地分析不同氣候、成土條件下各種生態(tài)系統(tǒng)氮庫特點,技術(shù)人員往往需要計算不同深度的土壤氮密度及區(qū)域的氮儲量,以研究區(qū)土壤表層(0-30cm)與表下層(0-100cm)的土壤氮儲量估算為例,其中,設(shè)置第一個固定深度層次的厚度為0-5cm,第二個固定深度層次的厚度為5-15cm,第三個固定深度層次的厚度為15-30cm,第四個固定深度層次的厚度為30-60cm,第五個固定深度層次的厚度為60-100cm。
經(jīng)過上述步驟a-至步驟f進行操作后,其中,步驟d01中,0-30cm深度土壤對應(yīng)環(huán)境變量回歸系數(shù)的直方圖如圖4所示,所述步驟e06中,當結(jié)束迭代時,0-30cm深度土壤所典型對應(yīng)分析結(jié)果如圖5所示;后進入步驟g,執(zhí)行步驟g的操作,并且步驟g02中選在外部漂移克里格方法(ked)所建立的預測模型作為最優(yōu)預測模型,則采用最優(yōu)預測模型獲得土壤區(qū)域中未采樣區(qū)域中各個未采樣點的土壤氮密度,其中,0-30cm土壤氮密度的預測結(jié)果如圖6所示,最后進一步獲得土壤區(qū)域中未采樣區(qū)域的土壤氮儲量。
基于以上分析,示例案例的預測結(jié)果如圖6所示。本發(fā)明采用的典型對應(yīng)分析方法能夠綜合不同環(huán)境變量對不同深度土壤屬性的影響,進而提取其最顯著的數(shù)據(jù)特征。這些特征能夠?qū)⑼寥酪暈橐粋€有機的整體,進而顯著提升土壤信息的挖掘質(zhì)量。該發(fā)明提出的綜合處理與重要性分析機制具有較高的普適性,不僅能夠計算土壤氮儲量,還可以計算其他土壤屬性不同深度的儲量(如土壤碳、土壤磷等)。此方法有待于在更多的領(lǐng)域內(nèi)應(yīng)用,以檢驗其性能。
上面結(jié)合附圖對本發(fā)明的實施方式作了詳細說明,但是本發(fā)明并不限于上述實施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前提下做出各種變化。