本發(fā)明屬于工業(yè)污水污染物監(jiān)管技術(shù)領(lǐng)域,涉及一種工業(yè)污水污染物溯源分析方法,特別是一種基于特征數(shù)據(jù)庫的工業(yè)污水污染物溯源分析方法。
背景技術(shù):
目前我國的水污染問題相當(dāng)嚴(yán)重,這與非法超標(biāo)偷排現(xiàn)象屢禁不止有著直接的關(guān)系。加強(qiáng)各類工業(yè)排放污水的監(jiān)管已經(jīng)成為各級政府工作的重要內(nèi)容,對非法超排的有效監(jiān)管與溯源追責(zé)尚缺乏行之有效的技術(shù)手段。傳統(tǒng)的溯源技術(shù)一般都是在污染事件發(fā)生后,對污染源上下游附近的工廠污水進(jìn)行取樣分析,工作量大、耗時較長、時效性差,往往很難及時找到污染源。
近年來也涌現(xiàn)出一些新的溯源技術(shù),但一般都是針對某一類工業(yè)廢水或者某些陰離子而進(jìn)行的,或者是從監(jiān)管管理方面提出的方法,比如中國環(huán)境科學(xué)院2012年公開的《一種突發(fā)水環(huán)境污染事故涉嫌風(fēng)險源的溯源方法》,公開號為CN102622670A,再比如環(huán)境保護(hù)部華南環(huán)境科學(xué)研究所2014年公開的《一種有限條件下突發(fā)性水環(huán)境事件污染源的溯源方法》,公開號為CN104103005A,該方法主要給出了一個系統(tǒng),其匹配模型僅在有限條件下適用。
尚缺乏一種普遍適用各種工業(yè)混合廢水的溯源方法,滿足不同種類工業(yè)區(qū)域混合污水的溯源需求。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是為了克服上述背景技術(shù)的不足,提供一種基于特征數(shù)據(jù)庫的工業(yè)污水污染物溯源分析方法,能夠適用于對各種工業(yè)混合廢水的溯源。
本發(fā)明提供的一種基于特征數(shù)據(jù)庫的工業(yè)污水污染物溯源分析方法如圖1所示,具體步驟如下,:
(1)收集各類型工廠主要排放污水的污染物參數(shù),建立各類型工廠污染物參數(shù)的特征權(quán)重數(shù)據(jù)庫M;
(2)采集目標(biāo)區(qū)域各工廠排泄污水的污染物數(shù)據(jù),構(gòu)建目標(biāo)區(qū)域工廠排污的特征數(shù)據(jù)樣本庫N;
(3)利用所述特征數(shù)據(jù)樣本庫N構(gòu)建KD-tree的類變量,作為kNN分類器的識別模型;
(4)通過集成式污染物采集工控機(jī)獲取或者直接手動輸入混合工業(yè)廢水的各污染物測量值,作為待識別向量z;
(5)采用所述kNN分類器與特征數(shù)據(jù)樣本庫N中的數(shù)據(jù)進(jìn)行匹配識別,在匹配過程中,利用所述特征權(quán)重數(shù)據(jù)庫M按照工廠類型對目標(biāo)工廠進(jìn)行加權(quán),根據(jù)匹配程度給出目標(biāo)排放工廠排序;
(6)按順序顯示目標(biāo)排放工廠名稱。
所述kNN分類器的核心識別算法為:
Input:所述特征數(shù)據(jù)樣本庫N的訓(xùn)練樣本集D,所述待識別向量z,樣本的類別標(biāo)簽集L。
Output:cz∈L,即樣本向量的類別。
for each樣本y∈D do
計算z到y(tǒng)的距離d(z,y)
end
選擇k個與z距離最近的訓(xùn)練樣本構(gòu)成集合N,
其中,k為預(yù)定識別的目標(biāo)排放工廠的個數(shù),I(·)為指示函數(shù),如果條件成立值為1,如果條件不成立值為0。
kNN分類器中的細(xì)節(jié)處理原則包括:
A.d(z,y)是待識別樣本與訓(xùn)練樣本庫中樣本的相似度度量,表示特征空間內(nèi)兩個點(diǎn)的距離。可供選擇的其他數(shù)學(xué)距離有多種,比如歐拉距離、馬氏距離、曼哈頓距離、切比雪夫距離、閔氏距離等等;
B.采用加權(quán)投票法進(jìn)行類別判定,采取少數(shù)服從多數(shù)的原則,近鄰中哪個類別的點(diǎn)最多就分為哪類,權(quán)重根據(jù)特征權(quán)重數(shù)據(jù)庫M按工廠類型進(jìn)行選取;
C.對特征向量進(jìn)行歸一化,降低變量值域?qū)嚯x的影響;
D.采用主成分分析的方法,降低高維度對距離衡量的影響。
本發(fā)明的有益效果是,能夠完成各種區(qū)域混合工業(yè)廢水的污染物溯源,快速有效的給出目標(biāo)排放工廠的排序,適用性與普遍性強(qiáng),為政府相關(guān)職能部門按次序排查污染來源工廠提供了技術(shù)支持,大大提高了排查效率和成功率。
附圖說明
圖1工業(yè)污水污染物溯源分析方法流程圖。
圖2目標(biāo)區(qū)域工廠名稱圖示。
具體實(shí)施方式:
下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步的詳細(xì)描述,但該實(shí)施例不應(yīng)理解為對本發(fā)明的限制。
在本實(shí)施方式中,目標(biāo)區(qū)域選擇大連市工業(yè)園區(qū),區(qū)域內(nèi)工廠包括12家,具體名稱由圖2所示,各工廠排泄污水污染物種類28種,包括苯、pH值、氨氮、色度、甲苯、總氮、總鎘、總鉻、總鎳、總砷、總銅、總鋅、二甲苯、氟 化物、揮發(fā)酚等等。
按照以下操作步驟進(jìn)行溯源:
(1)收集各類型工廠主要排放污水的污染物參數(shù),建立各類型工廠污染物參數(shù)的特征權(quán)重數(shù)據(jù)庫M1;
(2)采集圖2所示各工廠排泄污水的28種污染物數(shù)據(jù),構(gòu)建目標(biāo)區(qū)域工廠排污的特征數(shù)據(jù)樣本庫N1,并按照類型對工廠分類;
(3)利用所述特征數(shù)據(jù)樣本庫N1構(gòu)建KD-tree的類變量,作為kNN分類器的識別模型;
(4)通過手動輸入混合工業(yè)廢水的各污染物量值,作為待識別向量z1;
(5)采用所述kNN分類器與特征數(shù)據(jù)樣本庫N1中的數(shù)據(jù)進(jìn)行匹配識別,在匹配過程中,利用所述特征權(quán)重數(shù)據(jù)庫M1按照工廠類型對目標(biāo)工廠進(jìn)行加權(quán),根據(jù)匹配程度給出目標(biāo)排放工廠排序;
(6)按順序顯示所述目標(biāo)排放工廠名稱。
所述kNN分類器算法中,所述距離d(z1,y)選擇歐式距離,公式如下:
所述kNN分類器算法中,k值選擇為3,投票權(quán)重根據(jù)特征權(quán)重數(shù)據(jù)庫M1按工廠類型進(jìn)行選取,對特征向量z1進(jìn)行了歸一化,采用了主成分分析的方法。