本發(fā)明涉及大氣污染監(jiān)測技術(shù)領(lǐng)域,具體涉及一種基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法及裝置。
背景技術(shù):
為推進空氣質(zhì)量改善,落實屬地環(huán)保責任,按照清潔空氣行動計劃要求,北京市制定了《北京市2013-2017年清潔空氣行動計劃實施情況考核辦法(試行)》(京政辦發(fā)〔2014〕61號)和《北京市2013-2017年清潔空氣行動計劃實施情況考核辦法(試行)實施細則》(京環(huán)發(fā)〔2014〕92號),每年對各區(qū)空氣質(zhì)量改善情況和清潔空氣行動計劃任務完成情況進行考核。傳統(tǒng)的監(jiān)測網(wǎng)絡受人力和物力的制約,空間分辨率較粗,只針對空氣質(zhì)量進行常規(guī)監(jiān)測,無法實時分析區(qū)內(nèi)污染特征,定位疑似污染源,更產(chǎn)生不了精細化監(jiān)測產(chǎn)品,落實屬地管理和調(diào)動基層環(huán)保力量進行執(zhí)法監(jiān)管存在較大難度。
國家知識產(chǎn)權(quán)局于2017年3月22日公開了申請?zhí)枮?01510564563.8,名稱為《基于大密度部署傳感器的大氣污染監(jiān)控及管理方法及系統(tǒng)》的發(fā)明專利,該發(fā)明通過在區(qū)域內(nèi)大密度部署傳感器,并對返回的傳感器數(shù)據(jù)采用云端算法進行聯(lián)合校正,并進一步采用高斯推斷模型在空間上推斷出未部署傳感器位置點的大氣污染數(shù)據(jù),再將上述已部署和未部署傳感器位置點的大氣污染物數(shù)據(jù)統(tǒng)一反饋給監(jiān)控中心,進行監(jiān)控和管理,以實現(xiàn)實時監(jiān)測取證,量化評級及精細化管理的目標。但是,該發(fā)明只是將傳感器數(shù)據(jù)反饋給監(jiān)控中心,并未對大氣污染數(shù)據(jù)進行后續(xù)處理。
技術(shù)實現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是提供一種基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法及裝置,其能夠獲得區(qū)縣級別的空氣質(zhì)量變化精細化特征,并能夠甄別本地的污染源特征,為環(huán)境管理形成更為系統(tǒng)化的技術(shù)支撐。
為解決上述技術(shù)問題,本發(fā)明提供技術(shù)方案如下:
一種基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法,包括:
步驟1:獲取地面高密度監(jiān)測網(wǎng)絡監(jiān)測到的目標區(qū)域的大氣污染濃度數(shù)據(jù),其中,所述地面高密度監(jiān)測網(wǎng)絡由部署在目標區(qū)域的多個傳感器組成;
步驟2:將獲取到的大氣污染濃度數(shù)據(jù)排列成矩陣的形式,得到大氣污染濃度數(shù)據(jù)矩陣,其中,所述大氣污染濃度數(shù)據(jù)矩陣中的行以傳感器監(jiān)測站點進行排列,所述大氣污染濃度數(shù)據(jù)矩陣中的列以時間順序進行排列;
步驟3:對所述大氣污染濃度數(shù)據(jù)矩陣進行雙聚類處理,得到多個不同傳感器監(jiān)測站點的雙聚類塊;
步驟4:將雙聚類處理后的大氣污染濃度數(shù)據(jù)利用空間分析工具插值到空氣質(zhì)量模型的網(wǎng)格中,對大氣污染濃度數(shù)據(jù)進行網(wǎng)格化處理;
步驟5:將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比,確定出高濃度排放網(wǎng)格,最后得到不同雙聚類塊的高值區(qū)域。
進一步的,所述步驟5之后還包括:
步驟6:對不同的高值區(qū)域采用不同的顏色進行區(qū)分。
進一步的,所述步驟3包括:
步驟31:將大氣污染濃度數(shù)據(jù)矩陣分割成若干個子矩陣;
步驟32:計算第n個子矩陣的平均平方殘基打分函數(shù)h(i,j)和子矩陣中每行和每列的平均殘基a(i)和a(j):
其中,n大于等于1且小于等于子矩陣的總個數(shù),|i|和|j|分別為子矩陣的行數(shù)和列數(shù),aij為子矩陣的元素的值,aij、aij和aij分別為子矩陣中第i行的平均值、第j行的平均值和子矩陣整體的平均值,即:
若h(i,j)>δ,則執(zhí)行步驟33,若h(i,j)≤δ,該子矩陣形成雙聚類塊,并且結(jié)束,其中,δ為預先設(shè)定的最大平均平方剩余分數(shù);
步驟33:將所述子矩陣中最大的a(i)或a(j)對應的行或列刪除;
步驟34:將所述子矩陣中最小的a(i)或a(j)對應的行或列添加到子矩陣中,之后轉(zhuǎn)至所述步驟32。
進一步的,所述步驟3還包括:當一個雙聚類塊形成后,使用隨機數(shù)代替已經(jīng)形成的雙聚類塊中的元素的值,之后對其它的子矩陣進行雙聚類處理。
進一步的,所述步驟5中,將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比時,采用等值線、陰影圖、柵格圖或填色圖進行對比。
一種基于海量大氣污染濃度數(shù)據(jù)的污染空間分析裝置,包括:
獲取模塊:用于獲取地面高密度監(jiān)測網(wǎng)絡監(jiān)測到的目標區(qū)域的大氣污染濃度數(shù)據(jù),其中,所述地面高密度監(jiān)測網(wǎng)絡由部署在目標區(qū)域的多個傳感器組成;
大氣污染濃度數(shù)據(jù)矩陣建立模塊:用于將網(wǎng)格化處理后的大氣污染濃度數(shù)據(jù)排列成矩陣的形式,得到大氣污染濃度數(shù)據(jù)矩陣,其中,所述大氣污染濃度數(shù)據(jù)矩陣中的行以傳感器監(jiān)測站點進行排列,所述大氣污染濃度數(shù)據(jù)矩陣中的列以時間順序進行排列;
雙聚類處理模塊:用于對所述大氣污染濃度數(shù)據(jù)矩陣進行雙聚類處理,得到多個不同的雙聚類塊;
網(wǎng)格化處理模塊:用于將獲取的大氣污染濃度數(shù)據(jù)利用空間分析工具插值到空氣質(zhì)量模型的網(wǎng)格中,對大氣污染濃度數(shù)據(jù)進行網(wǎng)格化處理;
高值區(qū)域建立模塊:用于將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比,確定出高濃度排放網(wǎng)格,最后得到不同雙聚類塊的高值區(qū)域。
進一步的,所述高值區(qū)域建立模塊之后還包括:
高值區(qū)域區(qū)分模塊:用于對不同的高值區(qū)域采用不同的顏色進行區(qū)分。
進一步的,所述雙聚類處理模塊包括:
子矩陣分割模塊:用于將大氣污染濃度數(shù)據(jù)矩陣分割成若干個子矩陣;
計算模塊:用于計算第n個子矩陣的平均平方殘基打分函數(shù)h(i,j)和子矩陣中每行和每列的平均殘基d(i)和d(j):
其中,n大于等于1且小于等于子矩陣的總個數(shù),|i|和|j|分別為子矩陣的行數(shù)和列數(shù),aij為子矩陣的元素的值,aij、aij和aij分別為子矩陣中第i行的平均值、第j行的平均值和子矩陣整體的平均值,即:
若h(i,j)>δ,則進入刪除模塊,若h(i,j)≤δ,該子矩陣形成雙聚類塊,并且結(jié)束,其中,δ為預先設(shè)定的最大平均平方剩余分數(shù);
刪除模塊:用于將所述子矩陣中最大的a(i)或a(j)對應的行或列刪除;
添加模塊:用于將所述子矩陣中最小的a(i)或a(j)對應的行或列添加到子矩陣中。
進一步的,所述雙聚類處理模塊還包括:用于當一個雙聚類塊形成后,使用隨機數(shù)代替已經(jīng)形成的雙聚類塊中的元素的值,之后對其它的子矩陣進行雙聚類處理。
進一步的,所述高值區(qū)域建立模塊中,將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比時,采用等值線、陰影圖、柵格圖或填色圖進行對比。
本發(fā)明具有以下有益效果:
與現(xiàn)有技術(shù)相比,本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法及裝置,通過在目標區(qū)域部署多個傳感器建立地面高密度監(jiān)測網(wǎng)絡獲取目標區(qū)域的大氣污染濃度數(shù)據(jù),并對目標區(qū)域的大氣污染濃度數(shù)據(jù)進行雙聚類處理得到不同的雙聚類塊,之后將雙聚類處理后的大氣污染濃度數(shù)據(jù)利用空間分析工具插值到空氣質(zhì)量模型的網(wǎng)格中,并將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比,確定出高濃度排放網(wǎng)格,最后得到不同雙聚類塊的高值區(qū)域,并獲得污染區(qū)域范圍及邊界、污染強度、高污染發(fā)生的頻率,結(jié)合污染源排放數(shù)據(jù)和污染源調(diào)查,能夠認識高值區(qū)域形成的污染源排放原因,支持市及區(qū)縣展開污染排放的監(jiān)察及控制。本發(fā)明利用了基于傳感器地面高密度監(jiān)測網(wǎng)絡產(chǎn)生的海量數(shù)據(jù)進行空氣質(zhì)量排名和高值區(qū)識別,這些數(shù)據(jù)與傳統(tǒng)的衛(wèi)星遙感數(shù)據(jù)相比,時空分辨率較高且數(shù)據(jù)質(zhì)量可靠,能夠獲得區(qū)縣級別的空氣質(zhì)量變化精細化特征,形成甄別本地污染源特征的分析方法,為環(huán)境管理形成更為系統(tǒng)化的技術(shù)支撐。
附圖說明
圖1為本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法的流程示意圖;
圖2為本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法中對污染濃度數(shù)據(jù)進行雙聚類處理的流程示意圖;
圖3為在北京市采用本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法的地面高密度監(jiān)測網(wǎng)絡的布置示意圖;
圖4為北京市傳統(tǒng)監(jiān)測站點的布置示意圖;
圖5為對大氣污染數(shù)據(jù)直接插值網(wǎng)格化與采用本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法對大氣污染濃度數(shù)據(jù)進行插值網(wǎng)格化的對比示意圖,其中(a)為對大氣污染數(shù)據(jù)直接插值網(wǎng)格化后的示意圖,(b)為采用本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法對大氣污染濃度數(shù)據(jù)進行插值網(wǎng)格化后的示意圖;
圖6為采用本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法及裝置獲得的北京某地區(qū)及其周邊地區(qū)在某一時間段pm2.5濃度的變化示意圖,其中(a)為工作日pm2.5濃度日變化的示意圖,(b)為休息日pm2.5濃度日變化的示意圖;
圖7為采用本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法及裝置得到的北京市存在的污染源的示意圖;
圖8為本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析裝置的結(jié)構(gòu)示意圖;
圖9為本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析裝置中雙聚類處理模塊的結(jié)構(gòu)示意圖。
具體實施方式
為使本發(fā)明要解決的技術(shù)問題、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖及具體實施例進行詳細描述。
一方面,本發(fā)明提供一種基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法,如圖1至圖7所示,包括:
步驟s1:獲取地面高密度監(jiān)測網(wǎng)絡監(jiān)測到的目標區(qū)域的大氣污染濃度數(shù)據(jù),其中,地面高密度監(jiān)測網(wǎng)絡由部署在目標區(qū)域的多個傳感器組成;
本步驟中,通過在目標區(qū)域內(nèi)大密度部署傳感器,利用傳感器獲取目標區(qū)域在特定的氣象條件下的大氣污染濃度數(shù)據(jù),與傳統(tǒng)的監(jiān)測網(wǎng)絡站點檢測到的數(shù)據(jù)相比,時空分辨率較高且數(shù)據(jù)質(zhì)量可靠。
本步驟中,以北京地區(qū)為例,如圖3所示,在整個北京地區(qū)部署1500個左右的傳感器,這些傳感器的部署原則是:均勻覆蓋、重點加密、彈性布設(shè),平原地區(qū)每3x3公里至少部署一個傳感器監(jiān)測站點,山區(qū)每8x8公里至少部署一個傳感器監(jiān)測站點。
本步驟將多個傳感器部署在近地面層,且傳感器的分布密度遠高于現(xiàn)有監(jiān)測站,如圖3和圖4所示,因此經(jīng)過混合反演可以得到該平面上空間精度小于500米的連續(xù)污染濃度指標。
步驟s2:將獲取到的大氣污染濃度數(shù)據(jù)排列成矩陣的形式,得到大氣污染濃度數(shù)據(jù)矩陣,其中,大氣污染濃度數(shù)據(jù)矩陣中的行以傳感器監(jiān)測站點進行排列,大氣污染濃度數(shù)據(jù)矩陣中的列以時間順序進行排列;
本步驟中,以北京地區(qū)為例,獲取的大氣污染濃度數(shù)據(jù)的矩陣如下:
其中,c1~cm表示m個傳感器監(jiān)測站點,r1~rn表示時間,aij表示第i個傳感器在j時間監(jiān)測到的大氣污染濃度的數(shù)據(jù)。
步驟s3:對大氣污染濃度數(shù)據(jù)矩陣進行雙聚類處理,得到多個不同傳感器監(jiān)測站點的雙聚類塊;
由于傳感器監(jiān)測到的數(shù)據(jù)存在大量無關(guān)屬性、分布較為稀疏、有較多局部信息的特征,使得基于距離或密度的傳統(tǒng)聚類算法無法發(fā)現(xiàn)有價值的信息,而本步驟中采用雙聚類算法對大氣污染濃度數(shù)據(jù)進行處理,雙聚類在矩陣的行和列兩個方向上同時聚類,可以應用于不宜使用對象的所有屬性度量對象的相似性,從而得到質(zhì)量更高的聚類結(jié)果。
步驟s4:將雙聚類處理后的大氣污染濃度數(shù)據(jù)利用空間分析工具插值到空氣質(zhì)量模型的網(wǎng)格中,對大氣污染濃度數(shù)據(jù)進行網(wǎng)格化處理;
本步驟中的空氣質(zhì)量模型可以采用多尺度空氣質(zhì)量模型(即cmaq模型)或綜合空氣質(zhì)量模型和擴展(即camx模型)。
步驟s5:將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比,確定出高濃度排放網(wǎng)格,最后得到不同雙聚類塊的高值區(qū)域;
本步驟中,通過將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比,即可確定出高濃度排放網(wǎng)格。在不同的傳感器監(jiān)測站點的雙聚類結(jié)果下,形成不同聚類的高值區(qū),以便更好的對每個區(qū)域進行差別對待,形成高中篩高,低中取高的效果。
本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法通過在目標區(qū)域部署多個傳感器建立地面高密度監(jiān)測網(wǎng)絡獲取目標區(qū)域的大氣污染濃度數(shù)據(jù),并對目標區(qū)域的大氣污染濃度數(shù)據(jù)進行雙聚類處理得到不同的雙聚類塊,之后將雙聚類處理后的大氣污染濃度數(shù)據(jù)利用空間分析工具插值到空氣質(zhì)量模型的網(wǎng)格中,并將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比,確定出高濃度排放網(wǎng)格,最后得到不同雙聚類塊的高值區(qū)域,并獲得污染區(qū)域范圍及邊界、污染強度、高污染發(fā)生的頻率,結(jié)合污染源排放數(shù)據(jù)和污染源調(diào)查,能夠認識高值區(qū)域形成的污染源排放原因,支持市及區(qū)縣展開污染排放的監(jiān)察及控制。本發(fā)明將多個傳感器部署在近地面層,且傳感器的分布密度遠高于現(xiàn)有監(jiān)測站,因此經(jīng)過混合反演可以得到該平面上空間精度小于500米的連續(xù)污染濃度指標。本發(fā)明利用了基于傳感器地面高密度監(jiān)測網(wǎng)絡產(chǎn)生的海量大氣污染濃度數(shù)據(jù)進行空氣質(zhì)量排名和高值區(qū)識別,這些數(shù)據(jù)與傳統(tǒng)的衛(wèi)星遙感數(shù)據(jù)相比,時空分辨率較高且數(shù)據(jù)質(zhì)量可靠,能夠獲得區(qū)縣級別的空氣質(zhì)量變化精細化特征,形成甄別本地污染源特征的分析方法,為環(huán)境管理形成更為系統(tǒng)化的技術(shù)支撐。
本發(fā)明采用先將獲取到的大氣污染濃度數(shù)據(jù)進行雙聚類處理,然后對雙聚類處理后的大氣污染濃度數(shù)據(jù)插值并進行網(wǎng)格化,由于雙聚類處理后的大氣污染濃度數(shù)據(jù)的質(zhì)量更高,其網(wǎng)格化后的數(shù)據(jù)與直接對獲取到的氣污染濃度數(shù)據(jù)插值并進行網(wǎng)格化相比,如圖5所示,可以更加微觀、細致的反應局部地區(qū)污染情況變化趨勢,實現(xiàn)“地面大氣污染濃度監(jiān)測的全覆蓋”,即目標區(qū)域濃度估算。
本發(fā)明名稱中的“空間”具體指的是目標區(qū)域近地面層的平面空間。
進一步的,步驟s5之后還優(yōu)選包括:
步驟s6:對不同的高值區(qū)域采用不同的顏色進行區(qū)分。
本步驟中,通過對不同的高值區(qū)域采用不同的顏色進行區(qū)分,能夠更明顯有效地區(qū)分出不同濃度的區(qū)域。本實施例優(yōu)選紫色為大氣污染濃度最高的區(qū)域,紅色次之,接下來依次為橙色、黃色,綠色為大氣污染濃度最低的區(qū)域,即空氣質(zhì)量為優(yōu)。
優(yōu)選的,如圖2所示,步驟s3可以包括:
步驟31:將大氣污染濃度數(shù)據(jù)矩陣分割成若干個子矩陣;
本步驟中,已知大氣污染濃度的矩陣a如下,其中行(時間)集合(r1,r2,…,rn)記為x,列(傳感器監(jiān)測站點)集合(c1,c2,…,cm)記為y,矩陣a中元素aij表示第i個傳感器監(jiān)測站點在j時間監(jiān)測到的大氣污染物的濃度。
現(xiàn)有一個集合i∈x和j∈y,則矩陣aij=(i,j)為原矩陣a的一個子矩陣。
步驟s32:計算第n個子矩陣的平均平方殘基打分函數(shù)h(i,j)和子矩陣中每行和每列的平均殘基d(i)和d(j):
其中,n大于等于1且小于等于子矩陣的總個數(shù),|i|和|j|分別為子矩陣的行數(shù)和列數(shù),aij為子矩陣的元素的值,aij、aij和aij分別為子矩陣中第i行的平均值、第j行的平均值和子矩陣整體的平均值,即:
若h(i,j)>δ,則執(zhí)行步驟s33,若h(i,j)≤δ,該子矩陣形成雙聚類塊,并且結(jié)束,其中δ為預先設(shè)定的最大平均平方剩余分數(shù);
本步驟中,當對其中一個子矩陣aij進行雙聚類時,如果存在一個δ≥0,使得子矩陣aij的平均平方殘基打分函數(shù)h(i,j)≤δ,則該子矩陣aij則形成一個雙聚類塊。
步驟s33:將該子矩陣中最大的a(i)或a(j)對應的行或列刪除;
本步驟優(yōu)選采用貪心算法策略,通過刪除行或列來尋找一個平均平方殘基打分函數(shù)值盡可能小、塊的尺寸盡可能大的雙聚類塊,如圖2所示。
當采用刪除行或列的方式時,首先初始化一個包含矩陣a的全部行和全部列的聚類塊,然后在一個循環(huán)中不斷地刪除當前聚類塊的行或列以期達到降低平均平方殘基打分函數(shù)h(i,j)的目的,直至h(i,j)小于等于預先設(shè)定的δ時循環(huán)終止。
步驟s34:將該子矩陣中最小的a(i)或a(j)對應的行或列添加到子矩陣中,之后轉(zhuǎn)至步驟s32。
由于通過刪除操作,得到的雙聚類塊的平均平方殘基打分函數(shù)h(i,j)有可能不是最大的,因此某些剩余的行和列有可能可以被添加進去,只要保證雙聚類塊的平均平方殘基打分函數(shù)h(i,j)小于等于預先設(shè)定的δ即可。
由于雙聚類算法是確定的,所以對同一數(shù)據(jù)集重復使用上述雙聚類算法每次找到的雙聚類模塊都是同一個,并不能找出第二個雙聚類塊。因此,為了找到多個雙聚類塊,步驟s32還優(yōu)選包括:當一個雙聚類塊形成后,使用隨機數(shù)代替已經(jīng)形成的雙聚類塊中的元素的值,之后對其它的子矩陣進行雙聚類處理。
進一步的,步驟s5中,將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比時,優(yōu)選采用等值線、陰影圖、柵格圖或填色圖進行對比。通過采用等值線、陰影圖、柵格圖或填色圖等方式進行大氣污染濃度的空間專題分析,分析內(nèi)容涵蓋實時、小時、日均、月均等時間尺度目標區(qū)域精細污染空間分布圖。
采用本發(fā)明的方法甄別本地污染源時,主要是分析某一網(wǎng)格與周邊網(wǎng)格平均濃度日變化的同比變化情況,如果該網(wǎng)格在某幾個小時比方上下班或者夜間濃度高,說明該網(wǎng)格存在一定的污染源排放。之后采用實地調(diào)查或者衛(wèi)星遙感的方法,將該網(wǎng)格周邊的排放源情況結(jié)合污染物濃度變化分析,即可甄別本地污染源突變情況。
下面以圖6為例進一步說明。
采用本發(fā)明的方法得到北京市某地區(qū)在2016年12月16日-12月19日的pm2.5濃度變化情況及其與周邊地區(qū)的pm2.5濃度的對比情況,如圖6所示,其中圖6(a)為2016年12月16日及12月19日(工作日)的pm2.5濃度變化情況,圖6(b)為2016年12月17日和12月18日(休息日)的pm2.5濃度變化情況。由此可知,該地區(qū)pm2.5濃度在凌晨時段明顯比周邊地區(qū)高,工作日凌晨3點最大高于周邊272ug/m3。根據(jù)結(jié)果可選擇在凌晨0-7點進行現(xiàn)場排查或通過遙感衛(wèi)星排查污染產(chǎn)生的原因。
圖7中顯示了在北京市使用本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法及裝置得到的北京市存在的pm2.5濃度污染源的示意圖,其中3條虛線表示北京市存在的污染帶。目前發(fā)現(xiàn)城六區(qū)加海淀朝陽,pm2.5分布比較均勻(圖7中虛線圓圈部分)。南部的污染帶主要分布在房山南部至大興中心部一線,和通州大興的六環(huán)沿線地區(qū)。北部污染帶主要是昌平-順義-平谷一線。其中,房山南部至大興中心部一線上(即西南線),1表示大興區(qū)龐各莊鎮(zhèn)(pm2.5濃度160ug/m3),2表示大興區(qū)禮賢鎮(zhèn)(pm2.5濃度159ug/m3),3表示大興區(qū)北藏村鎮(zhèn)(pm2.5濃度158ug/m3),4表示大興區(qū)榆垡鎮(zhèn)(pm2.5濃度151ug/m3),5表示房山區(qū)竇店鎮(zhèn)(pm2.5濃度151ug/m3),6表示房山區(qū)琉璃河鎮(zhèn)鎮(zhèn)(pm2.5濃度149ug/m3),7表示房山區(qū)良鄉(xiāng)鎮(zhèn)(pm2.5濃度149ug/m3),8表示房山區(qū)長溝鎮(zhèn)(pm2.5濃度148ug/m3),9表示房山區(qū)石樓鎮(zhèn)(pm2.5濃度148ug/m3)。通州大興的六環(huán)沿線上(即東南線),1表示大興區(qū)魏善莊鎮(zhèn)(pm2.5濃度150ug/m3),2表示通州區(qū)張家灣鎮(zhèn)(pm2.5濃度147ug/m3),3表示大興區(qū)青云店鎮(zhèn)(pm2.5濃度145ug/m3),4表示通州區(qū)永樂店鎮(zhèn)(pm2.5濃度144ug/m3),5表示通州區(qū)馬駒橋鎮(zhèn)(pm2.5濃度143ug/m3)。昌平-順義-平谷一線上(即北線),1表示順義區(qū)李橋鎮(zhèn)(pm2.5濃度133ug/m3),2表示順義區(qū)南法信鎮(zhèn)(pm2.5濃度126ug/m3),3表示順義區(qū)南彩鎮(zhèn)(pm2.5濃度126ug/m3),4表示順義區(qū)北務鎮(zhèn)(pm2.5濃度125ug/m3),5表示昌平區(qū)百善鎮(zhèn)(pm2.5濃度123ug/m3),6表示順義區(qū)李遂鎮(zhèn)(pm2.5濃度123ug/m3),7表示順義區(qū)馬坡鎮(zhèn)(pm2.5濃度122ug/m3),8表示平谷區(qū)馬坊鎮(zhèn)(pm2.5濃度122ug/m3),9表示平谷區(qū)興谷街9道鎮(zhèn)(pm2.5濃度118ug/m3)。
通過本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析方法,可后期針對3條污染帶上的6區(qū)23鎮(zhèn)采取監(jiān)察及控制,可落實屬地責任、全面摸排,全面整治、“一鎮(zhèn)(街道)一策”;細化責任分解、細化落實方案、解決環(huán)保工作“最后一公里”。
綜上,本發(fā)明通過在目標區(qū)域大密度部署傳感器監(jiān)測站點,獲取海量大氣污染濃度數(shù)據(jù),通過雙聚類與大氣污染濃度空間網(wǎng)格化熱力圖相結(jié)合的方法,識別高污染發(fā)生的區(qū)域,并獲得污染區(qū)域范圍及邊界、污染強度、高污染發(fā)生的頻率,結(jié)合污染源排放數(shù)據(jù)與污染源調(diào)查,認識高污染區(qū)域形成的污染源排放原因,支持市及區(qū)縣展開污染排放的監(jiān)察及控制。潛在的應用對象包括小工業(yè)集中區(qū)域、大型工業(yè)園區(qū)、物流集中區(qū)域、城鄉(xiāng)結(jié)合部、城中村等。首先,本發(fā)明將監(jiān)測結(jié)果的空間精度從離散稀疏的點位讀數(shù)擴展為時空連續(xù)的面測量值。由于絕大多數(shù)監(jiān)測網(wǎng)絡設(shè)備(即傳感器)處于近地面層,且分布密度遠高于現(xiàn)有監(jiān)測站,因此經(jīng)過混合反演可以得到該平面上空間精度小于500米的連續(xù)污染濃度指標。其次,采用大數(shù)據(jù)分析手段,從時域和空間指標兩個方面,提取高于背景濃度場的高值區(qū)域和疑似源。其中,時域指標表征高值區(qū)域和疑似源的持續(xù)時間和周期性規(guī)律,空間指標表征高值區(qū)域和疑似源的污染程度和影響范圍。綜合采用以上兩類指標集,量化評估高值區(qū)域和疑似源的污染貢獻排序,為后續(xù)模型和決策支持提供原始排查清單和優(yōu)先級排序。
另一方面,本發(fā)明提供一種基于海量大氣污染濃度數(shù)據(jù)的污染空間分析裝置,如圖8和圖9所示,包括:
獲取模塊1:用于獲取地面高密度監(jiān)測網(wǎng)絡監(jiān)測到的目標區(qū)域的大氣污染濃度數(shù)據(jù),其中,地面高密度監(jiān)測網(wǎng)絡由部署在目標區(qū)域的多個傳感器組成;
大氣污染濃度數(shù)據(jù)矩陣建立模塊2:用于將獲取到的大氣污染濃度數(shù)據(jù)排列成矩陣的形式,得到大氣污染濃度數(shù)據(jù)矩陣,其中,大氣污染濃度數(shù)據(jù)矩陣中的行以傳感器監(jiān)測站點進行排列,大氣污染濃度數(shù)據(jù)矩陣中的列以時間順序進行排列;
雙聚類處理模塊3:用于對大氣污染濃度數(shù)據(jù)矩陣進行雙聚類處理,得到多個不同的雙聚類塊;
網(wǎng)格化處理模塊4:用于將雙聚類處理后的大氣污染濃度數(shù)據(jù)利用空間分析工具插值到空氣質(zhì)量模型的網(wǎng)格中;
高值區(qū)域建立模塊5:用于將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比,確定出高濃度排放網(wǎng)格,最后得到不同雙聚類塊的高值區(qū)域。
本發(fā)明的基于海量大氣污染濃度數(shù)據(jù)的污染空間分析裝置,通過在目標區(qū)域部署多個傳感器建立地面高密度監(jiān)測網(wǎng)絡獲取目標區(qū)域的大氣污染濃度數(shù)據(jù),并對目標區(qū)域的大氣污染濃度數(shù)據(jù)進行雙聚類處理得到不同的雙聚類塊,之后將雙聚類處理后的大氣污染濃度數(shù)據(jù)利用空間分析工具插值到空氣質(zhì)量模型的網(wǎng)格中,并將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比,確定出高濃度排放網(wǎng)格,最后得到不同雙聚類塊的高值區(qū)域,并獲得污染區(qū)域范圍及邊界、污染強度、高污染發(fā)生的頻率,結(jié)合污染源排放數(shù)據(jù)和污染源調(diào)查,能夠認識高值區(qū)域形成的污染源排放原因,支持市及區(qū)縣展開污染排放的監(jiān)察及控制。本發(fā)明將多個傳感器部署在近地面層,且傳感器的分布密度遠高于現(xiàn)有監(jiān)測站,因此經(jīng)過混合反演可以得到該平面上空間精度小于500米的連續(xù)污染濃度指標。本發(fā)明利用了基于傳感器地面高密度監(jiān)測網(wǎng)絡產(chǎn)生的海量數(shù)據(jù)進行空氣質(zhì)量排名和高值區(qū)識別,這些數(shù)據(jù)與傳統(tǒng)的衛(wèi)星遙感數(shù)據(jù)相比,時空分辨率較高且數(shù)據(jù)質(zhì)量可靠,能夠獲得區(qū)縣級別的空氣質(zhì)量變化精細化特征,形成甄別本地污染源特征的分析方法,為環(huán)境管理形成更為系統(tǒng)化的技術(shù)支撐。
進一步的,高值區(qū)域建立模塊5之后還優(yōu)選包括:
高值區(qū)域區(qū)分模塊6:用于對不同的高值區(qū)域采用不同的顏色進行區(qū)分。高值區(qū)域區(qū)分模塊6通過對不同的高值區(qū)域采用不同的顏色進行區(qū)分,能夠更明顯有效地區(qū)分出不同濃度的區(qū)域。本實施例優(yōu)選紫色為大氣污染濃度最高的區(qū)域,紅色次之,接下來依次為橙色、黃色,綠色為大氣污染濃度最低的區(qū)域,即空氣質(zhì)量為優(yōu)。
優(yōu)選的,雙聚類處理模塊3可以包括:
子矩陣分割模塊31:用于將大氣污染濃度數(shù)據(jù)矩陣分割成若干個子矩陣;
計算模塊32:用于計算第n個子矩陣的平均平方殘基打分函數(shù)h(i,j)和子矩陣中每行和每列的平均殘基d(i)和d(j):
其中,n大于等于1且小于等于子矩陣的總個數(shù),|i|和|j|分別為子矩陣的行數(shù)和列數(shù),aij為子矩陣的元素的值,aij、aij和aij分別為子矩陣中第i行的平均值、第j行的平均值和子矩陣整體的平均值,即:
若h(i,j)>δ,則進入刪除模塊33,若h(i,j)≤δ,該子矩陣形成雙聚類塊,并且結(jié)束,其中,δ為預先設(shè)定的最大平均平方剩余分數(shù);
刪除模塊33:用于將該子矩陣中最大的a(i)或a(j)對應的行或列刪除;
添加模塊34:用于將該子矩陣中最小的a(i)或a(j)對應的行或列添加到子矩陣中,之后轉(zhuǎn)至計算模塊32。
已知大氣污染濃度的矩陣a如下,其中行(時間)集合(r1,r2,…,rn)記為x,列(傳感器監(jiān)測站點)集合(c1,c2,…,cm)記為y,矩陣a中元素aij表示第i個傳感器監(jiān)測站點在j時間監(jiān)測到的大氣污染物的濃度。
現(xiàn)有一個集合i∈x和j∈y,則矩陣aij=(i,j)為原矩陣a的一個子矩陣。
雙聚類處理模塊3采用貪心算法策略,通過刪除或添加行或列來尋找一個平均平方殘基打分函數(shù)值盡可能小、塊的尺寸盡可能大的雙聚類塊,如圖2所示。
當采用刪除行或列的方式時,首先初始化一個包含矩陣a的全部行和全部列的聚類塊,然后在一個循環(huán)中不斷地刪除當前聚類塊的行或列以期達到降低平均平方殘基打分函數(shù)h(i,j)的目的,直至h(i,j)小于等于預先設(shè)定的δ時循環(huán)終止。
由于通過刪除操作,得到的雙聚類塊的平均平方殘基打分函數(shù)h(i,j)有可能不是最大的,因此某些剩余的行和列有可能可以被添加進去,只要保證雙聚類塊的平均平方殘基打分函數(shù)h(i,j)小于等于預先設(shè)定的δ即可。
由于雙聚類算法是確定的,所以對同一數(shù)據(jù)集重復使用上述雙聚類算法每次找到的雙聚類模塊都是同一個,并不能找出第二個雙聚類塊。因此,為了找到多個雙聚類塊,,計算模塊32還優(yōu)選包括:用于當一個雙聚類塊形成后,使用隨機數(shù)代替已經(jīng)形成的雙聚類塊中的元素的值,之后對其它的子矩陣進行雙聚類處理。
進一步的,高值區(qū)域建立模塊5中,將每個網(wǎng)格內(nèi)的大氣污染濃度與周邊網(wǎng)格內(nèi)的大氣污染濃度進行對比時,優(yōu)選采用等值線、陰影圖、柵格圖或填色圖進行對比。高值區(qū)域建立模塊5通過采用等值線、陰影圖、柵格圖或填色圖等方式進行大氣污染濃度的空間專題分析,分析內(nèi)容涵蓋實時、小時、日均、月均等時間尺度目標區(qū)域精細污染空間分布圖。
綜上,本發(fā)明通過在目標區(qū)域大密度部署傳感器監(jiān)測站點,獲取海量大氣污染濃度數(shù)據(jù),通過雙聚類與大氣污染濃度空間網(wǎng)格化熱力圖相結(jié)合的方法,識別高污染發(fā)生的區(qū)域,并獲得污染區(qū)域范圍及邊界、污染強度、高污染發(fā)生的頻率,結(jié)合污染源排放數(shù)據(jù)與污染源調(diào)查,認識高污染區(qū)域形成的污染源排放原因,支持市及區(qū)縣展開污染排放的監(jiān)察及控制。潛在的應用對象包括小工業(yè)集中區(qū)域、大型工業(yè)園區(qū)、物流集中區(qū)域、城鄉(xiāng)結(jié)合部、城中村等。首先,本發(fā)明將監(jiān)測結(jié)果的空間精度從離散稀疏的點位讀數(shù)擴展為時空連續(xù)的面測量值。由于絕大多數(shù)監(jiān)測網(wǎng)絡設(shè)備(即傳感器)處于近地面層,且分布密度遠高于現(xiàn)有監(jiān)測站,因此經(jīng)過混合反演可以得到該平面上空間精度小于500米的連續(xù)污染濃度指標。其次,采用大數(shù)據(jù)分析手段,從時域和空間指標兩個方面,提取高于背景濃度場的高值區(qū)域和疑似源。其中,時域指標表征高值區(qū)域和疑似源的持續(xù)時間和周期性規(guī)律,空間指標表征高值區(qū)域和疑似源的污染程度和影響范圍。綜合采用以上兩類指標集,量化評估高值區(qū)域和疑似源的污染貢獻排序,為后續(xù)模型和決策支持提供原始排查清單和優(yōu)先級排序。
以上所述是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明所述原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。