本發(fā)明屬于環(huán)境監(jiān)測(cè)領(lǐng)域,具體涉及一種空氣質(zhì)量檢測(cè)方法、檢測(cè)系統(tǒng),尤其是基于級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合的空氣質(zhì)量檢測(cè)方法、檢測(cè)系統(tǒng)。
背景技術(shù):
面對(duì)社會(huì)對(duì)空氣質(zhì)量日益加重的擔(dān)憂,如何能夠準(zhǔn)確檢測(cè)到空氣中對(duì)人體有害的成分成為了值得研究人員進(jìn)行探討的課題。對(duì)于環(huán)境監(jiān)測(cè)這種實(shí)際的數(shù)學(xué)問(wèn)題,多元非線性方法在眾多的核心技術(shù)中是比較理想的一種。
目前在不同的多元非線性方法中,有較好的優(yōu)點(diǎn)及理論基礎(chǔ)的第二類切比雪夫多項(xiàng)式回歸法是一種較為新興的非線性回歸法。
然而這種方法與其他的多項(xiàng)式回歸法有著相同的缺陷,即待擬合系數(shù)的個(gè)數(shù)會(huì)隨著變量數(shù)增長(zhǎng)而呈指數(shù)式增長(zhǎng)。
與此對(duì)應(yīng)的,目前主流的一類回歸方法是以偏最小二乘回歸法為典型例子,它嘗試用多個(gè)多元線性回歸器來(lái)代替一個(gè)多元非線性回歸器,這種多個(gè)回歸器組合的形式又被稱為級(jí)聯(lián)。
但此種方法的問(wèn)題在于當(dāng)此類方法應(yīng)用于非線性回歸問(wèn)題時(shí),普遍會(huì)出現(xiàn)誤差較大的問(wèn)題。原因可被歸結(jié)為這類方法的核心方法還是采用了線性回歸,即使采用了級(jí)聯(lián)的形式,如果系統(tǒng)過(guò)于復(fù)雜我們同樣無(wú)法通過(guò)這類回歸方法獲得令人滿意的結(jié)果。
技術(shù)實(shí)現(xiàn)要素:
(一)要解決的技術(shù)問(wèn)題
為了解決現(xiàn)有技術(shù)的上述問(wèn)題,本發(fā)明提供一種空氣質(zhì)量檢測(cè)方法,其基于級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合的數(shù)據(jù)處理方法,能夠同時(shí)保證對(duì)多元非線性回歸問(wèn)題的快速、準(zhǔn)確地完成從輸入特征到預(yù)測(cè)值的映射,能夠更加快速、準(zhǔn)確地檢測(cè)空氣質(zhì)量。
本發(fā)明還提供一種空氣質(zhì)量檢測(cè)系統(tǒng),其基于級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合的數(shù)據(jù)處理裝置,能夠同時(shí)保證對(duì)多元非線性回歸問(wèn)題的快速、準(zhǔn)確地完成從輸入特征到預(yù)測(cè)值的映射,能夠更加快速、準(zhǔn)確地檢測(cè)空氣質(zhì)量。
(二)技術(shù)方案
為了達(dá)到上述目的,本發(fā)明采用的主要技術(shù)方案包括:
一種空氣質(zhì)量檢測(cè)方法,其包括如下步驟:
S1、獲得檢測(cè)數(shù)據(jù);
S2、通過(guò)級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合對(duì)步驟S1獲得的檢測(cè)數(shù)據(jù)進(jìn)行處理,包括:
S21、通過(guò)迭代法訓(xùn)練,獲取整個(gè)級(jí)聯(lián)回歸器中各子回歸器的回歸系數(shù)及相關(guān)參數(shù)(例如:總的迭代次數(shù)、每次遞歸過(guò)程中生成的映射矩陣、歸一化時(shí)生成的邊界參數(shù)),
S22、結(jié)合步驟S21得到的回歸系數(shù)及相關(guān)參數(shù),對(duì)步驟S1獲得的檢測(cè)數(shù)據(jù)進(jìn)行處理,得到用于預(yù)測(cè)空氣質(zhì)量的結(jié)果;
S3、得到空氣質(zhì)量的預(yù)測(cè)結(jié)果。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)方法,其中,步驟S1獲得的檢測(cè)數(shù)據(jù)包括空氣中至少一種化學(xué)基的比例信息。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)方法,其中,步驟S1獲得的檢測(cè)數(shù)據(jù)包括CO的濃度值/小時(shí)、NMHC的濃度值/小時(shí)、NOx的濃度值/小時(shí)、NO2的濃度值/小時(shí)、O3的濃度值/小時(shí)、每小時(shí)平均溫度、每小時(shí)相對(duì)濕度和每小時(shí)絕對(duì)濕度。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)方法,其中,步驟S21中,每次迭代過(guò)程包括:
S2141、計(jì)算本次迭代過(guò)程中的輸入樣本與對(duì)應(yīng)標(biāo)簽的二階相關(guān)矩陣,并獲取該二階相關(guān)矩陣的主成分映射矩陣;
S2142、利用該主成分映射矩陣將輸入樣本矩陣投影至主成分空間;
S2143、對(duì)投影后的特征樣本分別進(jìn)行針對(duì)輸入樣本與對(duì)應(yīng)標(biāo)簽的多階一元第二類切比雪夫多項(xiàng)式回歸,獲得回歸系數(shù);
S2144、獲取輸入樣本與對(duì)應(yīng)標(biāo)簽的殘差矩陣作為下一輪迭代的輸入。
進(jìn)一步的,步驟S21中還包括:S2145、重復(fù)S2141~S2144,直至滿足迭代條件。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)方法,其中,步驟S2141中,主成分映射矩陣是指二階相關(guān)矩陣的主特征值所對(duì)應(yīng)的特征向量組成的矩陣。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)方法,其中,步驟S21包括:
S211、獲取各時(shí)段空氣中不同化學(xué)基的比例信息,并送到信息處理終端;
S212、獲取同時(shí)段同一所測(cè)區(qū)域內(nèi)空氣質(zhì)量數(shù)據(jù)作為訓(xùn)練標(biāo)簽數(shù)據(jù);
S213、對(duì)輸入的數(shù)據(jù)進(jìn)行歸一化處理;
S214、通過(guò)訓(xùn)練獲取整個(gè)級(jí)聯(lián)回歸器中各子回歸器的回歸系數(shù)及相關(guān)參數(shù),其包括:
S2141、計(jì)算本次迭代過(guò)程中的輸入樣本與對(duì)應(yīng)標(biāo)簽的二階相關(guān)矩陣,并獲取該二階相關(guān)矩陣的主成分映射矩陣;
S2142、利用該主成分映射矩陣將輸入樣本矩陣投影至主成分空間;
S2143、對(duì)投影后的特征樣本分別進(jìn)行針對(duì)輸入樣本與對(duì)應(yīng)標(biāo)簽的多階一元第二類切比雪夫多項(xiàng)式回歸,獲得回歸系數(shù);
S2144、獲取輸入樣本與對(duì)應(yīng)標(biāo)簽的殘差矩陣作為下一輪迭代的輸入;
S2145、重復(fù)S2141~S2144,直至滿足迭代條件;
S215、輸出總的迭代次數(shù)、每次遞歸過(guò)程中生成的映射矩陣、歸一化時(shí)生成的邊界參數(shù)。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)方法,其中,步驟S22包括:
S221、獲取各時(shí)段空氣中不同化學(xué)基的比例信息,并送到信息處理終端;
S222、對(duì)輸入的數(shù)據(jù)進(jìn)行歸一化處理,初始化預(yù)測(cè)值為零;
S223、計(jì)算各樣本對(duì)應(yīng)時(shí)段的空氣質(zhì)量水平,其包括:
S2231、利用訓(xùn)練過(guò)程中獲取的主成分映射矩陣將每次迭代的輸入樣本投影至主成分空間;
S2232、計(jì)算樣本對(duì)應(yīng)的一元第二類切比雪夫多項(xiàng)式各階值;
S2233、使用訓(xùn)練過(guò)程中針對(duì)標(biāo)簽生成的對(duì)應(yīng)回歸器的回歸系數(shù)加權(quán)求和生成本次迭代過(guò)程的回歸輸出,將本次迭代生成的回歸輸出累加到最終預(yù)測(cè)值上;
S2234、根據(jù)針對(duì)輸入樣本生成的對(duì)應(yīng)回歸器的回歸系數(shù),對(duì)投影后的樣本進(jìn)行加權(quán)求和,生成本次迭代過(guò)程的回歸輸出,并獲取回歸殘差作為下一輪迭代的輸入;
S2235、重復(fù)S2231~S2234,直至達(dá)到訓(xùn)練時(shí)獲得的總迭代次數(shù);
S224、對(duì)生成的最終預(yù)測(cè)值進(jìn)行逆歸一化處理并輸出。
本發(fā)明還提供一種空氣質(zhì)量檢測(cè)系統(tǒng),其包括:
傳感器,用于檢測(cè)空氣中相應(yīng)成分的含量信息;
信息處理終端,用于接收并處理來(lái)自傳感器的數(shù)據(jù),其包括基于級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合的數(shù)據(jù)處理模塊,用于對(duì)數(shù)據(jù)進(jìn)行級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合處理;
輸出模塊,用于輸出空氣質(zhì)量檢測(cè)結(jié)果。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)系統(tǒng),其中,傳感器為多路集成傳感器,用于獲取空氣中多種化學(xué)成分的含量信息。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)系統(tǒng),其中,基于級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合的數(shù)據(jù)處理模塊包括訓(xùn)練子模塊和預(yù)測(cè)子模塊,訓(xùn)練子模塊用于通過(guò)訓(xùn)練獲取整個(gè)級(jí)聯(lián)回歸器中各子回歸器的回歸系數(shù)及相關(guān)系數(shù),預(yù)測(cè)子模塊用于計(jì)算各樣本對(duì)應(yīng)時(shí)段的空氣質(zhì)量水平的最終預(yù)測(cè)值。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)系統(tǒng),其中,訓(xùn)練子模塊包括:
訓(xùn)練標(biāo)簽數(shù)據(jù)獲取單元,用于獲取同時(shí)段同一所測(cè)區(qū)域內(nèi)空氣質(zhì)量數(shù)據(jù)作為訓(xùn)練標(biāo)簽數(shù)據(jù);
訓(xùn)練歸一化處理單元,用于對(duì)訓(xùn)練標(biāo)簽數(shù)據(jù)獲取單元所獲取的數(shù)據(jù)(包括X和Y)進(jìn)行歸一化處理;
迭代處理單元,用于通過(guò)訓(xùn)練獲取整個(gè)級(jí)聯(lián)回歸器中各子回歸器的回歸系數(shù)及相關(guān)參數(shù),其包括:
主成分映射矩陣獲取子單元,用于計(jì)算每次迭代過(guò)程中的輸入樣本與對(duì)應(yīng)標(biāo)簽的二階相關(guān)矩陣,并獲取該二階相關(guān)矩陣的主成分映射矩陣,
訓(xùn)練投影子單元,用于利用主成分映射矩陣將輸入樣本矩陣投影至主成分空間;
回歸系數(shù)獲取子單元,用于對(duì)投影后的特征樣本分別進(jìn)行針對(duì)輸入樣本與標(biāo)簽的多階一元第二類切比雪夫多項(xiàng)式回歸,獲取回歸系數(shù),
訓(xùn)練殘差矩陣獲取子單元,用于獲取輸入樣本與對(duì)應(yīng)標(biāo)簽的殘差矩陣作為下一輪迭代的輸入,
訓(xùn)練迭代條件判定子單元,用于根據(jù)迭代循環(huán)變量是否達(dá)到總的迭代次數(shù)來(lái)判定是否滿足迭代條件,借以判定迭代循環(huán)是否終止;
數(shù)據(jù)輸出單元,用于輸出下列數(shù)據(jù)中的任一個(gè)或幾個(gè):總的迭代次數(shù)、各子回歸器的回歸系數(shù)、每次遞歸過(guò)程中生成的映射矩陣及歸一化時(shí)生成的邊界參數(shù)。
本發(fā)明一個(gè)實(shí)施例的空氣質(zhì)量檢測(cè)系統(tǒng),其中,預(yù)測(cè)子模塊包括:
檢測(cè)數(shù)據(jù)獲取單元,用于獲取檢測(cè)得到的空氣中相應(yīng)成分的含量信息數(shù)據(jù);
預(yù)測(cè)歸一化處理單元,用于對(duì)檢測(cè)數(shù)據(jù)獲取單元所獲取的數(shù)據(jù)(包括X)歸一化處理,并初始化預(yù)測(cè)值為零;
預(yù)測(cè)計(jì)算單元,用于計(jì)算各樣本對(duì)應(yīng)時(shí)段的空氣質(zhì)量水平,其包括:
預(yù)測(cè)投影子單元,利用訓(xùn)練過(guò)程中獲取的矩陣投影將每次迭代的輸入樣本投影至主成分空間,
多項(xiàng)式階值計(jì)算子單元,用于計(jì)算樣本對(duì)應(yīng)的一元第二類切比雪夫多項(xiàng)式各階值,
迭代回歸輸出生成子單元,用于使用訓(xùn)練過(guò)程中生成的對(duì)應(yīng)子回歸器的回歸系數(shù)加權(quán)求和生成本次迭代過(guò)程的回歸輸出,
預(yù)測(cè)回歸殘差獲取子單元,用于對(duì)投影后的樣本進(jìn)行針對(duì)輸入樣本的多階第二類切比雪夫多項(xiàng)式回歸,并獲取回歸殘差作為下一輪迭代的輸入,
預(yù)測(cè)值生成子單元,用于生成預(yù)測(cè)值并將之后每次迭代生成的回歸輸出累加到預(yù)測(cè)值上以得到最終預(yù)測(cè)值,
預(yù)測(cè)迭代條件判定子單元,用于根據(jù)迭代循環(huán)變量是否達(dá)到訓(xùn)練時(shí)獲得的總迭代次數(shù)來(lái)判定是否滿足迭代條件,借以判定迭代循環(huán)是否終止;
預(yù)測(cè)值輸出單元,用于對(duì)生成的最終預(yù)測(cè)值進(jìn)行逆歸一化處理并輸出。
(三)有益效果
本發(fā)明的有益效果是:本發(fā)明提出的空氣質(zhì)量檢測(cè)方法,通過(guò)使用第二類切比雪夫多項(xiàng)式擬合法以提升預(yù)測(cè)的精度,在此基礎(chǔ)上,為了緩解多項(xiàng)式擬合法在多元回歸問(wèn)題上的缺陷,提出使用類偏最小二乘擬合式的級(jí)聯(lián)結(jié)構(gòu)來(lái)簡(jiǎn)化第二類切比雪夫多項(xiàng)式擬合法的復(fù)雜度,能夠同時(shí)保證對(duì)多元非線性回歸問(wèn)題的快速、準(zhǔn)確地完成從輸入特征到預(yù)測(cè)值的映射,有利于實(shí)現(xiàn)環(huán)境監(jiān)測(cè)中的更準(zhǔn)確檢測(cè)。
附圖說(shuō)明
圖1為本發(fā)明所述空氣質(zhì)量檢測(cè)系統(tǒng)的框圖;
圖2為本發(fā)明所述空氣質(zhì)量檢測(cè)方法的流程圖;
圖3為本發(fā)明一個(gè)實(shí)施例的檢測(cè)結(jié)果示意圖。
具體實(shí)施方式
為了更好的解釋本發(fā)明,以便于理解,下面結(jié)合附圖,通過(guò)具體實(shí)施方式,對(duì)本發(fā)明作詳細(xì)描述。
本發(fā)明主要設(shè)計(jì)思路如下:
本發(fā)明利用多路傳感器獲取空氣中各時(shí)段不同化學(xué)基的比例作為變量。隨后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理得到回歸器的輸入。整個(gè)回歸器分為訓(xùn)練和檢測(cè)兩個(gè)環(huán)節(jié)。在訓(xùn)練環(huán)節(jié),每個(gè)訓(xùn)練樣本及對(duì)應(yīng)的標(biāo)簽將通過(guò)數(shù)次迭代獲取對(duì)應(yīng)次數(shù)的回歸系數(shù)與輔助參數(shù);而在測(cè)試環(huán)節(jié)則直接利用訓(xùn)練得到的參數(shù)及回歸系數(shù)實(shí)現(xiàn)多次疊加后的空氣質(zhì)量的估計(jì)。
本發(fā)明的基于級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合的空氣質(zhì)量檢測(cè)方法,包括訓(xùn)練環(huán)節(jié)和預(yù)測(cè)環(huán)節(jié)。
其中,訓(xùn)練環(huán)節(jié)包括:
步驟一、由各路傳感器獲取各時(shí)段空氣中不同化學(xué)基的比例信息,并將數(shù)據(jù)送到信息處理終端。
步驟二、獲取同時(shí)段同一所測(cè)區(qū)域內(nèi)空氣質(zhì)量數(shù)據(jù)作為訓(xùn)練標(biāo)簽數(shù)據(jù)。
步驟三、對(duì)輸入的數(shù)據(jù)進(jìn)行歸一化處理。
步驟四、通過(guò)訓(xùn)練獲取整個(gè)級(jí)聯(lián)回歸器中各子回歸器的回歸系數(shù)及相關(guān)參數(shù),方法如下:
在每次迭代過(guò)程中,
(1)計(jì)算本次迭代過(guò)程中的輸入樣本與對(duì)應(yīng)標(biāo)簽的二階相關(guān)矩陣,并獲取該二階相關(guān)矩陣的主成分映射矩陣(即該二階相關(guān)矩陣的主特征值所對(duì)應(yīng)的特征向量組成的矩陣,且該特征映射矩陣即為迭代過(guò)程中要獲取的參數(shù)之一);
(2)利用該映射矩陣將輸入樣本矩陣投影至主成分空間;
(3)對(duì)投影后的特征樣本分別進(jìn)行針對(duì)輸入樣本與標(biāo)簽的多階一元第二類切比雪夫多項(xiàng)式回歸,獲取回歸系數(shù);
(4)獲取輸入樣本與對(duì)應(yīng)標(biāo)簽的殘差矩陣作為下一輪迭代的輸入;
(5)重復(fù)(1)~(4),直至滿足迭代條件。
步驟五、輸出總的迭代次數(shù),各子回歸器的回歸系數(shù),每次迭代過(guò)程中生成的主成分映射矩陣及歸一化時(shí)生成的邊界參數(shù)。
預(yù)測(cè)環(huán)節(jié)包括:
步驟一、由各路傳感器獲取各時(shí)段空氣中不同化學(xué)基的比例信息,并將數(shù)據(jù)送到信息處理終端。
步驟二、對(duì)輸入的數(shù)據(jù)進(jìn)行歸一化處理,初始化預(yù)測(cè)值為零。
步驟三、計(jì)算各樣本對(duì)應(yīng)時(shí)段的空氣質(zhì)量水平,方法如下:
在每次迭代過(guò)程中,
(1)利用訓(xùn)練過(guò)程中獲取的主成分映射矩陣將每次迭代的輸入樣本投影至主成分空間;
(2)計(jì)算樣本對(duì)應(yīng)的一元第二類切比雪夫多項(xiàng)式各階值;
(3)使用訓(xùn)練過(guò)程中針對(duì)標(biāo)簽生成的對(duì)應(yīng)子回歸器的回歸系數(shù)加權(quán)求和生成本次迭代過(guò)程的回歸輸出,將本次迭代生成的回歸輸出累加到預(yù)測(cè)值上;
(4)利用訓(xùn)練過(guò)程中針對(duì)輸入樣本生成的對(duì)應(yīng)子回歸器的回歸系數(shù)加權(quán)求和生成本次迭代過(guò)程的回歸輸出,并獲取本次迭代過(guò)程中輸入樣本的回歸殘差矩陣,作為下一輪迭代的輸入;
(5)重復(fù)(1)~(4),直至達(dá)到訓(xùn)練時(shí)獲得的總迭代次數(shù)。
步驟四、對(duì)生成的最終預(yù)測(cè)值進(jìn)行逆歸一化處理并輸出。
為了更好地解釋本發(fā)明,下面以苯濃度預(yù)測(cè)實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
本實(shí)施例是對(duì)某城市某街道長(zhǎng)達(dá)一年的環(huán)境監(jiān)測(cè)實(shí)例,目的是通過(guò)傳感器獲取CO的濃度值/小時(shí)、NMHC的濃度值/小時(shí)、NOx的濃度值/小時(shí)、NO2的濃度值/小時(shí)、O3的濃度值/小時(shí)、每小時(shí)平均溫度T、每小時(shí)相對(duì)濕度RH、每小時(shí)絕對(duì)濕度AH,再通過(guò)這8個(gè)值來(lái)預(yù)測(cè)苯濃度值/小時(shí)。
本實(shí)施例的空氣質(zhì)量檢測(cè)方法的整體流程如圖2所示,具體包括以下步驟:
其中,各步驟中涉及的參數(shù)定義以下:
X表示輸入樣本,Y表示訓(xùn)練用標(biāo)簽樣本;
t表示迭代變量,T表示迭代次數(shù);
Et,Ft表示第t次迭代過(guò)程中的輸入樣本矩陣、標(biāo)簽矩陣;
pt表示第t次迭代過(guò)程中的主成分映射矩陣;
Zt表示第t次迭代過(guò)程中通過(guò)投影后得到的特征矩陣生成的第二類切比雪夫多項(xiàng)式矩陣;
ct,rt分別表示第t次迭代過(guò)程中利用切比雪夫多項(xiàng)式回歸法針對(duì)輸入的訓(xùn)練樣本和對(duì)應(yīng)輸入訓(xùn)練樣本的輸出預(yù)測(cè)值生成的回歸系數(shù)矩陣。
訓(xùn)練環(huán)節(jié)包括:
步驟一、由各路傳感器獲取各時(shí)段空氣中不同化學(xué)基的比例信息X,X∈RSampleNum×W,SampleNum為訓(xùn)練樣本數(shù),W為特征數(shù)(本實(shí)施例中為W=8),并將數(shù)據(jù)送到信息處理終端。
步驟二、獲取同時(shí)段同一所測(cè)區(qū)域內(nèi)空氣質(zhì)量數(shù)據(jù)作為訓(xùn)練標(biāo)簽數(shù)據(jù)Y,Y∈RSampleNum。
步驟三、依據(jù)式(1)、式(2)對(duì)輸入的數(shù)據(jù)進(jìn)行歸一化處理,
其中,min表示對(duì)象的每一維特征的取最小值,max表示對(duì)象的每一維特征的取最大值,ε=0.001。
步驟四、初始化輸入樣本矩陣E1=X和標(biāo)簽矩陣F1=Y(jié)。
步驟五、通過(guò)訓(xùn)練獲取整個(gè)級(jí)聯(lián)回歸器中各子回歸器的回歸系數(shù)及相關(guān)參數(shù),方法如下:
在每次迭代過(guò)程中,
(1)計(jì)算本次迭代過(guò)程中的輸入樣本與對(duì)應(yīng)標(biāo)簽的二階相關(guān)矩陣并獲取該二階相關(guān)矩陣的主成分映射矩陣pt(即該二階相關(guān)矩陣的主特征值所對(duì)應(yīng)的特征向量組成的矩陣),且該主成分映射矩陣pt即為迭代過(guò)程中要獲取的參數(shù);
(2)利用該主成分映射矩陣pt將輸入樣本矩陣投影至主成分空間Etpt;
(3)對(duì)投影后的特征樣本分別進(jìn)行針對(duì)輸入樣本與標(biāo)簽的多階一元第二類切比雪夫多項(xiàng)式回歸,依據(jù)式(3)、式(4)獲取回歸系數(shù)ct,rt,
(4)獲取輸入樣本與對(duì)應(yīng)標(biāo)簽的殘差矩陣Et+1,Ft+1作為下一輪迭代的輸入,t=t+1(即下一輪迭代變量取值為本輪迭代變量取值加1);
(5)重復(fù)(1)~(4),直至滿足迭代條件t=T。
步驟六、輸出總的迭代次數(shù)T,各子回歸器的回歸系數(shù)ct,rt,每次迭代過(guò)程中生成的主成分映射矩陣pt及歸一化時(shí)生成的邊界參數(shù)min(Y),max(Y)。
其中,預(yù)測(cè)環(huán)節(jié)包括:
步驟一、由各路傳感器獲取某時(shí)段空氣中不同化學(xué)基(與訓(xùn)練時(shí)的化學(xué)基一一對(duì)應(yīng))的比例信息X,X∈RSampleNum×W,SampleNum為測(cè)試樣本數(shù),W為特征數(shù)(本實(shí)施例中為W=8),并將數(shù)據(jù)送到信息處理終端。
步驟二、依據(jù)式(1)對(duì)輸入的數(shù)據(jù)進(jìn)行歸一化處理,初始化輸入樣本矩陣E1=X和標(biāo)簽矩陣;Y=0。
步驟三、計(jì)算各樣本對(duì)應(yīng)時(shí)段的空氣質(zhì)量水平,方法如下:
在每次迭代過(guò)程中,
(1)利用訓(xùn)練過(guò)程中獲取的主成分映射矩陣pt將每次迭代的輸入樣本投影至主成分空間Etpt,其中,pt∈RW×m,t=1,...,T;
(2)計(jì)算樣本對(duì)應(yīng)的一元第二類切比雪夫多項(xiàng)式各階值,形成矩陣Zt;
(3)使用訓(xùn)練過(guò)程中生成的對(duì)應(yīng)子回歸器的回歸系數(shù)rt對(duì)矩陣Zt加權(quán)求和生成本次迭代過(guò)程的回歸輸出依據(jù)式(5)將本次迭代生成的回歸輸出累加到預(yù)測(cè)值上,t=t+1;
(4)利用訓(xùn)練過(guò)程中生成的對(duì)應(yīng)子回歸器的回歸系數(shù)ct對(duì)矩陣Zt加權(quán)求和生成本次迭代過(guò)程的回歸輸出依據(jù)式(6)獲取輸入樣本與對(duì)應(yīng)標(biāo)簽的回歸殘差矩陣Et+1作為下一輪迭代的輸入,
(5)重復(fù)(1)~(4),直至達(dá)到訓(xùn)練時(shí)獲得的總迭代次數(shù)T,獲得最終預(yù)測(cè)值。
步驟四、依據(jù)式(7)對(duì)生成的最終預(yù)測(cè)值進(jìn)行逆歸一化處理并輸出,
Y=Y(jié)×[max(Y)-min(Y)]-min(Y) 式(7)。
本實(shí)施例中,測(cè)試流程按5倍交叉驗(yàn)證方式進(jìn)行,回歸結(jié)果如圖2所示,其中,橫軸為實(shí)際獲得的苯濃度標(biāo)簽,縱軸為通過(guò)本方法獲取的預(yù)測(cè)苯濃度,每個(gè)點(diǎn)對(duì)應(yīng)于一個(gè)樣本。通過(guò)觀察樣本點(diǎn)是否集中分布于45°線(圖中所標(biāo)識(shí)的斜線)可以來(lái)評(píng)估本發(fā)明的方法,如果集中于45°線,說(shuō)明樣本的苯濃度實(shí)測(cè)值與預(yù)測(cè)值接近,方法表現(xiàn)很好;反之,則相差較遠(yuǎn),方法表現(xiàn)不佳。通過(guò)觀察圖2可以獲知,本發(fā)明的方法對(duì)大氣中苯濃度的預(yù)測(cè)優(yōu)異。
對(duì)于空氣中的其他成分(例如:硫化物SOx、甲醛、重金屬等)的檢測(cè),可參照苯濃度預(yù)測(cè)實(shí)施例進(jìn)行,本發(fā)明不再贅述。
如圖1所示,本發(fā)明還提供一種空氣質(zhì)量檢測(cè)系統(tǒng),其包括:
傳感器,用于檢測(cè)空氣中相應(yīng)成分的含量信息;
信息處理終端,用于接收并處理來(lái)自傳感器的數(shù)據(jù),其包括基于級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合的數(shù)據(jù)處理模塊,用于對(duì)數(shù)據(jù)進(jìn)行級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合處理;
輸出模塊,用于輸出空氣質(zhì)量檢測(cè)結(jié)果。
其中,傳感器為多路集成傳感器,用于獲取空氣中多種化學(xué)成分的含量信息。
其中,基于級(jí)聯(lián)回歸切比雪夫多項(xiàng)式擬合的數(shù)據(jù)處理模塊包括訓(xùn)練子模塊和預(yù)測(cè)子模塊,訓(xùn)練子模塊用于通過(guò)訓(xùn)練獲取整個(gè)級(jí)聯(lián)回歸器中各子回歸器的回歸系數(shù)及相關(guān)系數(shù),預(yù)測(cè)子模塊用于計(jì)算各樣本對(duì)應(yīng)時(shí)段的空氣質(zhì)量水平的最終預(yù)測(cè)值。
其中,訓(xùn)練子模塊包括:
訓(xùn)練標(biāo)簽數(shù)據(jù)獲取單元,用于獲取同時(shí)段同一所測(cè)區(qū)域內(nèi)空氣質(zhì)量數(shù)據(jù)作為訓(xùn)練標(biāo)簽數(shù)據(jù);
訓(xùn)練歸一化處理單元,用于對(duì)訓(xùn)練標(biāo)簽數(shù)據(jù)獲取單元所獲取的數(shù)據(jù)(包括X和Y)進(jìn)行歸一化處理;
迭代處理單元,用于通過(guò)訓(xùn)練獲取整個(gè)級(jí)聯(lián)回歸器中各子回歸器的回歸系數(shù)及相關(guān)參數(shù),其包括:
主成分映射矩陣獲取子單元,用于計(jì)算每次迭代過(guò)程中的輸入樣本與對(duì)應(yīng)標(biāo)簽的二階相關(guān)矩陣,并獲取該二階相關(guān)矩陣的主成分映射矩陣,
訓(xùn)練投影子單元,用于利用主成分映射矩陣將輸入樣本矩陣投影至主成分空間;
回歸系數(shù)獲取子單元,用于對(duì)投影后的特征樣本分別進(jìn)行針對(duì)輸入樣本與標(biāo)簽的多階一元第二類切比雪夫多項(xiàng)式回歸,獲取回歸系數(shù),
訓(xùn)練殘差矩陣獲取子單元,用于獲取輸入樣本與對(duì)應(yīng)標(biāo)簽的殘差矩陣作為下一輪迭代的輸入,
訓(xùn)練迭代條件判定子單元,用于根據(jù)迭代循環(huán)變量是否達(dá)到總的迭代次數(shù)來(lái)判定是否滿足迭代條件,借以判定迭代循環(huán)是否終止;
數(shù)據(jù)輸出單元,用于輸出下列數(shù)據(jù)中的任一個(gè)或幾個(gè):總的迭代次數(shù)、各子回歸器的回歸系數(shù)、每次迭代過(guò)程中生成的主成分映射矩陣及歸一化時(shí)生成的邊界參數(shù)。
其中,預(yù)測(cè)子模塊包括:
檢測(cè)數(shù)據(jù)獲取單元,用于獲取檢測(cè)得到的空氣中相應(yīng)成分的含量信息數(shù)據(jù);
預(yù)測(cè)歸一化處理單元,用于對(duì)檢測(cè)數(shù)據(jù)獲取單元所獲取的數(shù)據(jù)(包括X)歸一化處理,并初始化預(yù)測(cè)值為零;
預(yù)測(cè)計(jì)算單元,用于計(jì)算各樣本對(duì)應(yīng)時(shí)段的空氣質(zhì)量水平,其包括:
預(yù)測(cè)投影子單元,利用訓(xùn)練過(guò)程中獲取的矩陣投影將每次迭代的輸入樣本投影至主成分空間,
多項(xiàng)式階值計(jì)算子單元,用于計(jì)算樣本對(duì)應(yīng)的一元第二類切比雪夫多項(xiàng)式各階值,
迭代回歸輸出生成子單元,用于使用訓(xùn)練過(guò)程中生成的對(duì)應(yīng)子回歸器的回歸系數(shù)加權(quán)求和生成本次迭代過(guò)程的回歸輸出,
預(yù)測(cè)回歸殘差獲取子單元,用于對(duì)投影后的樣本進(jìn)行針對(duì)輸入樣本的多階第二類切比雪夫多項(xiàng)式回歸,并獲取回歸殘差作為下一輪迭代的輸入,
預(yù)測(cè)值生成子單元,用于生成預(yù)測(cè)值并將之后每次迭代生成的回歸輸出累加到預(yù)測(cè)值上以得到最終預(yù)測(cè)值,
預(yù)測(cè)迭代條件判定子單元,用于根據(jù)迭代循環(huán)變量是否達(dá)到訓(xùn)練時(shí)獲得的總迭代次數(shù)來(lái)判定是否滿足迭代條件,借以判定迭代循環(huán)是否終止;
預(yù)測(cè)值輸出單元,用于對(duì)生成的最終預(yù)測(cè)值進(jìn)行逆歸一化處理并輸出。
本發(fā)明的空氣質(zhì)量檢測(cè)方法中根據(jù)若干檢測(cè)值預(yù)測(cè)得到空氣中其他成分含量的檢測(cè)方法和系統(tǒng),能夠同時(shí)保證對(duì)多元非線性回歸問(wèn)題的快速、準(zhǔn)確地完成從輸入特征到預(yù)測(cè)值的映射,能夠更加快速、準(zhǔn)確地檢測(cè)空氣質(zhì)量。