本發(fā)明屬于遙感數(shù)據(jù)的時空分析領(lǐng)域,尤其是公開了一種多尺度嵌套的空間統(tǒng)計單元構(gòu)建方法。
背景技術(shù):
在大數(shù)據(jù)時代,數(shù)據(jù)挖掘和數(shù)據(jù)分析愈來愈顯得至關(guān)重要,特別是在地學領(lǐng)域,隨著對地觀測技術(shù)的迅猛發(fā)展,積累了海量的時空數(shù)據(jù)。目前全球共發(fā)射了320顆對地觀測衛(wèi)星,包括陸地、大氣和海洋等各個領(lǐng)域。通過對地觀測衛(wèi)星所攜帶的各類傳感器,可以對大氣和地球表面的各類物理和化學參數(shù)進行監(jiān)測。經(jīng)過50多年的發(fā)展,采集積累了大量的衛(wèi)星遙感時空觀測數(shù)據(jù),但目前對于遙感數(shù)據(jù)的分析處理能力還需要進一步加強,特別是對于時空大數(shù)據(jù)的挖掘分析。盡管目前計算機硬件技術(shù)快速發(fā)展,但也難以追趕數(shù)據(jù)量的幾何級增長。對于時空大數(shù)據(jù)的統(tǒng)計分析,若簡單以最小觀測單元(如像元)為統(tǒng)計單元,則無疑會帶來巨大的計算負擔,同時也存在信息冗余的問題,換句話說,并不是統(tǒng)計單元越小越合理,目前人們在對時空遙感數(shù)據(jù)統(tǒng)計分析時,大都慣以像元為空間統(tǒng)計單元,這樣做不但難以將復雜的時空分析方法引入時空大數(shù)據(jù)分析領(lǐng)域,而且在理論上也難以站住腳。
對于遙感數(shù)據(jù)的時空分析問題,一般都以固定的像元尺度進行時空統(tǒng)計分析,通常以3*3像元的一階空間鄰接考慮空間相關(guān)性,而這樣并不能反映時空過程中的多尺度耦合效應,其對時空格局的探測和研究結(jié)果可能存在偏差。
現(xiàn)有空間統(tǒng)計單元選取或構(gòu)建技術(shù)的一個共同缺點是:擬通過固定尺度的空間統(tǒng)計單元來測度多尺度耦合的時空變化過程,顯然有失合理性和科學性。再者,若以原始像元為空間統(tǒng)計單元,不但在存在上述理論缺陷,而且還會帶來巨大的冗余計算負擔,致使很多時空分析方法無法實施;而若以固定的較大尺度格網(wǎng)單元為空間統(tǒng)計單元,也同樣會存在上述理論缺陷,且會降低原始數(shù)據(jù)的精度,丟失很多有用的信息。
技術(shù)實現(xiàn)要素:
本發(fā)明克服現(xiàn)有技術(shù)存在的不足,提供一種在不降低原始時空遙感大數(shù)據(jù)精度和不丟失有用信息的前提下,一種多尺度嵌套的空間統(tǒng)計單元構(gòu)建方法,為進一步深入分析打下堅實基礎(chǔ),也為順利將眾多復雜、科學、優(yōu)良的時空分析技術(shù)順利引入時空遙感大數(shù)據(jù)分析領(lǐng)域創(chuàng)造有利條件。
為了解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:
一種多尺度嵌套的空間統(tǒng)計單元構(gòu)建方法,其特征在于,包括以下步驟:
步驟1:確定格網(wǎng)局部均質(zhì)閾值,即變異系數(shù)閾值
步驟2:構(gòu)建第n階尺度正方形格網(wǎng);假設(shè)原來像元尺度為
步驟3,構(gòu)建(n-1)階尺度正方形格網(wǎng)單元;計算每一個n階尺度正方形格網(wǎng)包含像元屬性值的變異系數(shù),記第
按照上述過程遍歷完所有的n階尺度正方形格網(wǎng)后,則已經(jīng)構(gòu)建出n階和(n-1)階兩個尺度嵌套的空間統(tǒng)計單元,前者尺度為
步驟4,構(gòu)建(n-2),(n-3),......,2,1階尺度正方形格網(wǎng)單元;在步驟3的基礎(chǔ)上,計算每一個(n-1)階尺度正方形格網(wǎng)包含像元屬性值的變異系數(shù),若其包含像元屬性值的變異系數(shù)大于
優(yōu)選的,所述步驟1中計算原始遙感數(shù)據(jù)的變異系數(shù)的公示為:
變異系數(shù)=平均值/標準差。
優(yōu)選的,所述步驟1中確定格網(wǎng)局部均質(zhì)閾值
表1不同原始數(shù)據(jù)變異系數(shù)條件下的格網(wǎng)局部均質(zhì)閾值選取參考表
優(yōu)選的,所述步驟2中n的取值為4-6。
優(yōu)選的,所述步驟2中的正方形格網(wǎng)需要滿足兩個條件:
第一,正方形格網(wǎng)邊界須與像素邊界齊整,即須恰好包含
第二,所有正方形格網(wǎng)包含的像素屬性值計算的變異系數(shù)不能都大于格網(wǎng)局部均質(zhì)閾值
本發(fā)明與現(xiàn)有技術(shù)相比有以下有益效果:
現(xiàn)有技術(shù)中以像元為統(tǒng)計單元進行時空統(tǒng)計分析,不僅難以描述多尺度耦合的時間過程,同時巨大的計算負擔也使得很多時空分析方法難以實施,而按照本發(fā)明的多尺度嵌套的空間統(tǒng)計單元構(gòu)建后,空間統(tǒng)計單元數(shù)縮減少,同時嵌套的多尺度空間統(tǒng)計格網(wǎng)的統(tǒng)計性質(zhì)與原始數(shù)據(jù)基本一致,也就是并不影響時空變化規(guī)律的探測與挖掘。其次,根據(jù)本發(fā)明構(gòu)建的多尺度嵌套的空間統(tǒng)計單元則巧妙地解決了以上問題,有效過濾了冗余信息,在提高計算效率的同時,突破了原來以固定尺度統(tǒng)計分析時空現(xiàn)象,既保證了理論的合理性和科學性,也使得一些復雜和優(yōu)良的時空分析方法(如貝葉斯時空交互模型)順利應用到遙感大數(shù)據(jù)的分析領(lǐng)域中。
附圖說明
圖1展示了一個包含4階尺度剖分的格網(wǎng)示例;
圖2是根據(jù)2014年亞洲pm2.5年均濃度遙感反演數(shù)據(jù)情況進行的多尺度嵌套的空間統(tǒng)計格網(wǎng)單元構(gòu)建結(jié)果;
圖3是2014年全球pm2.5年均濃度遙感反演數(shù)據(jù)多尺度空間統(tǒng)計單元構(gòu)建結(jié)構(gòu)圖。
具體實施方式
下面結(jié)合附圖和實施例,對本發(fā)明的具體實施方式作進一步詳細描述,以下實施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
一種多尺度嵌套的空間統(tǒng)計單元構(gòu)建方法,其特征在于,包括以下步驟:
將對2014年全球pm2.5年均濃度遙感反演數(shù)據(jù)進行多尺度嵌套的空間統(tǒng)計單元積進行構(gòu)建。原始數(shù)據(jù)空間分辨率為0.10.1,共有1,455,488個像元。
以下將按照本發(fā)明技術(shù)方案對其進行多尺度空間統(tǒng)計單元構(gòu)建:
步驟1:確定格網(wǎng)局部均質(zhì)閾值----變異系數(shù)閾值
步驟2:將n值確定為5,即最高階尺度格網(wǎng)為5階尺度正方形格網(wǎng),其空間尺度分辨率為1.6°′1.6°;
步驟3:構(gòu)建4階尺度正方形格網(wǎng)單元;計算每一個5階尺度正方形格網(wǎng)包含像元屬性值的變異系數(shù),記第
步驟4:構(gòu)建3、2、1階尺度正方形格網(wǎng)單元;在步驟3的基礎(chǔ)上,計算每一個4階尺度正方形格網(wǎng)包含像元屬性值的變異系數(shù),若其包含像元屬性值的變異系數(shù)大于8.0%,則對其進行四叉樹剖分,形成3階尺度正方形格網(wǎng),對應尺度為0.4°′0.4°,若其包含像元屬性值的變異系數(shù)
對于本實例而言,到3階尺度正方形格網(wǎng)剖分后,其所有的空間統(tǒng)計單元包含的像元屬性值的變異系數(shù)都小于8.0%,因此,最小尺度的空間統(tǒng)計單元為3階尺度正方形格網(wǎng),尺度為0.4°′0.4°。最終,共構(gòu)建了10314個多尺度空間統(tǒng)計單元格網(wǎng),具體如圖3所示,其中5階尺度格網(wǎng)有5547個,4階尺度格網(wǎng)有4131個,3階尺度格網(wǎng)有636個,其中彩色圖為原遙感數(shù)據(jù)。
圖2顯示的是根據(jù)2014年亞洲pm2.5年均濃度遙感反演數(shù)據(jù)情況進行的多尺度嵌套的空間統(tǒng)計格網(wǎng)單元構(gòu)建結(jié)果,底圖是2014年亞洲pm2.5年均濃度遙感反演原數(shù)據(jù)的平均值分布圖。原始遙感數(shù)據(jù)的空間分辨率為0.1°′0.1°,具有70,656個像元單元,如果以像元為統(tǒng)計單元進行時空統(tǒng)計分析,不僅難以描述多尺度耦合的時間過程,同時巨大的計算負擔也使得很多時空分析方法難以實施,而按照本發(fā)明的多尺度嵌套的空間統(tǒng)計單元構(gòu)建后,空間統(tǒng)計單元數(shù)縮減為為4481個,其中1587個4階尺度格網(wǎng),2286個3階尺度格網(wǎng),608個2階尺度格網(wǎng),同時嵌套的多尺度空間統(tǒng)計格網(wǎng)的統(tǒng)計性質(zhì)與原始數(shù)據(jù)基本一致,也就是并不影響時空變化規(guī)律的探測與挖掘。
若以原有像元單位為空間統(tǒng)計單元的話,由于巨大的計算負擔,性質(zhì)良好的貝葉斯時空交互模型統(tǒng)將難以進行實施,如若通過平均值池化到較大尺度格網(wǎng)后計算,則又損失了原始遙感數(shù)據(jù)的精度,也會丟失很多有用信息,而且計算出的結(jié)果也會存在一定的偏差。而根據(jù)本發(fā)明構(gòu)建的多尺度嵌套的空間統(tǒng)計單元則巧妙地解決了以上問題,有效過濾了冗余信息,在提高計算效率的同時,突破了原來以固定尺度統(tǒng)計分析時空現(xiàn)象,既保證了理論的合理性和科學性,也使得一些復雜和優(yōu)良的時空分析方法(如貝葉斯時空交互模型)順利應用到遙感大數(shù)據(jù)的分析領(lǐng)域中。
以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,盡管參照前述實施例對本發(fā)明進行了詳細的說明,對于本領(lǐng)域的技術(shù)人員來說,其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。