1.一種基于特征數(shù)據(jù)庫(kù)的工業(yè)污水污染物溯源分析方法,其特征在于,
(1)收集各類型工廠主要排放污水的污染物參數(shù),建立各類型工廠污染物參數(shù)的特征權(quán)重?cái)?shù)據(jù)庫(kù)M;
(2)采集目標(biāo)區(qū)域各工廠排泄污水的污染物數(shù)據(jù),構(gòu)建目標(biāo)區(qū)域工廠排污的特征數(shù)據(jù)樣本庫(kù)N;
(3)利用所述特征數(shù)據(jù)樣本庫(kù)N構(gòu)建KD-tree的類變量,作為kNN分類器的識(shí)別模型;
(4)通過(guò)集成式污染物采集工控機(jī)獲取或者直接手動(dòng)輸入混合工業(yè)廢水的各污染物測(cè)量值,作為待識(shí)別向量z;
(5)采用所述kNN分類器與特征數(shù)據(jù)樣本庫(kù)N中的數(shù)據(jù)進(jìn)行匹配識(shí)別,在匹配過(guò)程中,利用所述特征權(quán)重?cái)?shù)據(jù)庫(kù)M按照工廠類型對(duì)目標(biāo)工廠進(jìn)行加權(quán),根據(jù)匹配程度給出目標(biāo)排放工廠排序;
采用加權(quán)投票法進(jìn)行類別判定,采取少數(shù)服從多數(shù)的原則,近鄰中哪個(gè)類別的點(diǎn)最多就分為哪類,權(quán)重根據(jù)特征權(quán)重?cái)?shù)據(jù)庫(kù)M按工廠類型進(jìn)行選??;
對(duì)特征向量進(jìn)行歸一化,降低變量值域?qū)嚯x的影響;
采用主成分分析的方法,降低高維度對(duì)距離衡量的影響;
所述kNN分類器的核心識(shí)別算法為:
Input:所述特征數(shù)據(jù)樣本庫(kù)N的訓(xùn)練樣本集D,所述待識(shí)別向量z,樣本的類別標(biāo)簽集L;
Output:cz∈L,即樣本向量的類別;
for each樣本y∈D do
計(jì)算z到y(tǒng)的距離d(z,y)
end
選擇k個(gè)與z距離最近的訓(xùn)練樣本構(gòu)成集合N,
其中,k為預(yù)定識(shí)別的目標(biāo)排放工廠的個(gè)數(shù),I(·)為指示函數(shù),如果條件成立值為1,如果條件不成立值為0;
d(z,y)是待識(shí)別樣本與訓(xùn)練樣本庫(kù)中樣本的相似度度量,表示特征空間內(nèi)兩個(gè)點(diǎn)的距離;
(6)按順序顯示目標(biāo)排放工廠名稱。