基于rbm回歸的水質(zhì)toc濃度分析方法
【專利摘要】本發(fā)明公開(kāi)了一種基于RBM回歸的水質(zhì)TOC濃度分析方法,多次采集光源發(fā)出的光通過(guò)不同已知濃度的TOC溶液時(shí)的光譜數(shù)據(jù),得到每種濃度對(duì)應(yīng)的吸收光譜數(shù)據(jù);分別計(jì)算光譜數(shù)據(jù)的吸光度;將所有吸光度值作為訓(xùn)練樣本輸入限制波爾茲曼機(jī)中訓(xùn)練,得到不同迭代次數(shù)對(duì)應(yīng)的訓(xùn)練后的受限波爾茲曼機(jī)和對(duì)應(yīng)的重構(gòu)后的訓(xùn)練樣本;將重構(gòu)后的訓(xùn)練樣本組合成新的訓(xùn)練樣本送入BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,得到訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)模型;將測(cè)試樣本按訓(xùn)練樣本方式處理,并將重構(gòu)后的測(cè)試樣本組合成新的測(cè)試樣本送入BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行測(cè)試,即得待測(cè)溶液的TOC濃度。本方法可提高TOC濃度反演精度,改善濃度反演算法的重復(fù)性和可移植性,滿足在線檢測(cè)精度要求。
【專利說(shuō)明】
基于RBM回歸的水質(zhì)TOC濃度分析方法
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及水質(zhì)T0C濃度檢測(cè),具體指一種基于RBM回歸的水質(zhì)T0C濃度分析方法, 屬于水質(zhì)檢測(cè)分析處理領(lǐng)域,適用于因濃度高、光程短,光譜吸收不充分等導(dǎo)致的信噪比 低,即傳統(tǒng)方法問(wèn)題較大情況下的溶液T0C濃度反演。
【背景技術(shù)】
[0002] 總有機(jī)碳T0C(Total Organic Carbon)是表征水體中有機(jī)物質(zhì)總量的綜合指標(biāo), 它代表了水體中所含有機(jī)物質(zhì)的總和,直接反映了水體被有機(jī)物質(zhì)污染的程度。目前,T0C 測(cè)量已經(jīng)廣泛地應(yīng)用到江河、湖泊以及海洋監(jiān)測(cè)等方面。對(duì)于地表水、飲用水、工業(yè)用水等 方面的質(zhì)量控制,T0C同樣是重要的測(cè)量參數(shù),實(shí)際上T0C測(cè)量已經(jīng)成為世界上水體質(zhì)量控 制的主要檢測(cè)手段。2003年國(guó)家四部委在新頒布的排污費(fèi)用征收標(biāo)準(zhǔn)管理辦法中,已經(jīng)把 T0C正式列入水污染物污染當(dāng)量值表。
[0003] 常規(guī)T0C測(cè)量是根據(jù)碳是構(gòu)成有機(jī)體的基本元素這個(gè)原理而進(jìn)行的,碳是整個(gè)生 物圈物質(zhì)和能量循環(huán)的主體。碳循環(huán)進(jìn)入水體后主要以不同的化合物結(jié)構(gòu)和不同的形態(tài)方 式存在,它進(jìn)入水體主要有兩種途徑,一方面是通過(guò)大氣與水體之間的交換,水體與大氣為 了達(dá)到碳平衡,會(huì)吸收大量的氣態(tài)碳直至飽和;另一方面是由于生活污染物的排放、石油開(kāi) 發(fā)、工業(yè)生產(chǎn)以及養(yǎng)殖的發(fā)展,使得水體中碳構(gòu)成的有機(jī)物質(zhì)成分增加。因此,總體來(lái)講T0C 比C0D或B0D 5更能直接合理的表征水體受到有機(jī)物質(zhì)污染的程度。
[0004] 現(xiàn)在我國(guó)水環(huán)境污染日趨嚴(yán)重,江河、湖泊不斷受到石油泄漏、生活污染物排放、 傾廢等行為的影響,特別是隨著現(xiàn)代工業(yè)如有機(jī)化工,精細(xì)化工、高分子工業(yè)、電子工業(yè)的 迅速發(fā)展,水體中的有機(jī)污染物呈現(xiàn)出多樣化、復(fù)雜化的特點(diǎn),特別是有些持久性有機(jī)污染 物POPs (Persistent Organic Pollutants),又稱難降解有機(jī)污染物,它們是一類具有毒 性、易于在生物體內(nèi)富集、在環(huán)境中能夠持久存在、對(duì)人體有著嚴(yán)重危害的有機(jī)物質(zhì),傳統(tǒng) 的測(cè)量分析方法已經(jīng)不能或者很難準(zhǔn)確測(cè)量其含量,但是T0C測(cè)量卻是目前非常理想的測(cè) 量手段,可以得到滿意的檢測(cè)結(jié)果。
[0005] 常規(guī)的T0C測(cè)量方法是根據(jù)水體中的碳循環(huán),即碳的各種存在形態(tài)而進(jìn)行的,測(cè)量 方法基本上是先將水中的有機(jī)物質(zhì)氧化為C0 2,然后檢測(cè)C02的含量來(lái)確定T0C的濃度。然而 這些常規(guī)的測(cè)量方法在應(yīng)用過(guò)程中是有缺陷的,例如測(cè)試方法復(fù)雜,需要使用化學(xué)試劑,容 易造成二次污染,測(cè)量時(shí)間、速度不能滿足實(shí)時(shí)性要求以及需要一定的維護(hù)工作等,因此, 這些方法不適于大規(guī)模環(huán)保監(jiān)測(cè)的發(fā)展需要。在這種現(xiàn)實(shí)條件下,一些新的測(cè)量方法和技 術(shù)應(yīng)運(yùn)而生,如電阻法、電導(dǎo)法、臭氧氧化法、超聲空化與聲致發(fā)光法、紫外法等等,這些方 法正在得到廣泛的關(guān)注及應(yīng)用。
[0006] 1)電阻法:電阻法是近年來(lái)開(kāi)始應(yīng)用的技術(shù),其原理是在溫度補(bǔ)償?shù)那疤嵯?,測(cè)量 樣品在紫外線氧化前后電阻率的差值來(lái)實(shí)現(xiàn)的。當(dāng)水進(jìn)入儀器后,首先測(cè)量最初的溫度和 電阻率,然后使水會(huì)通過(guò)一個(gè)螺旋石英管,并且暴露在185nm的紫外線下,這時(shí)所有的低分 子量的有機(jī)組分會(huì)立即轉(zhuǎn)化成有機(jī)酸。生成的酸會(huì)使水的電阻率變低,這時(shí)我們?cè)贉y(cè)量此 時(shí)的水的電阻率,根據(jù)前后兩次測(cè)量的電阻率差值和水中TOC的含量成正比這一關(guān)系,即可 測(cè)得待測(cè)液體的T0C含量。但該方法對(duì)被測(cè)量的水體來(lái)源要求比較苛刻,只能用相對(duì)潔凈的 工業(yè)用水和純水,應(yīng)用方向單一。
[0007] 2)電導(dǎo)法:電導(dǎo)法的主要應(yīng)用是電導(dǎo)池,它由參比電極、測(cè)量電極、氣液分離器、離 子交換樹(shù)脂、反應(yīng)盤管、〇.〇〇lmol/L NaOH電導(dǎo)液等組成。它的測(cè)量原理是:當(dāng)反應(yīng)氣流通過(guò) 電導(dǎo)池的反應(yīng)盤管時(shí),其中的C02與NaOH電導(dǎo)液會(huì)在反應(yīng)盤管中充分接觸,從而發(fā)生化學(xué)反 應(yīng)生成碳酸鈉。因?yàn)镹aOH的電導(dǎo)率與Na 2C03的電導(dǎo)率是不同的,這就導(dǎo)致測(cè)量電極檢測(cè)到的 信號(hào)發(fā)生變化,而它們的差值又與C0 2的濃度成正比,這樣就可以實(shí)現(xiàn)對(duì)C02的測(cè)量。電導(dǎo)池 的優(yōu)點(diǎn)是價(jià)格低、易普及,但穩(wěn)定性較差。
[0008] 3)臭氧氧化法:臭氧氧化法的主要依據(jù)是臭氧的氧化能力在天然元素中僅次于 氟,采用臭氧氧化方式來(lái)作為T0C檢測(cè)技術(shù),優(yōu)點(diǎn)是反應(yīng)速度快,無(wú)二次污染,具有較高的應(yīng) 用價(jià)值。測(cè)量原理是根據(jù)臭氧氧化化學(xué)發(fā)光探測(cè)原理,測(cè)量定量化學(xué)發(fā)光總量,根據(jù)大量試 驗(yàn)數(shù)據(jù)驗(yàn)證,測(cè)量信號(hào)與T0C的線性相關(guān)性非常好。此方法的應(yīng)用前景非常可觀。
[0009] 4)超聲空化與聲致發(fā)光法:聲化學(xué)已成為一個(gè)蓬勃發(fā)展的研究領(lǐng)域,聲致發(fā)光的 研究已涉及到環(huán)境保護(hù)領(lǐng)域,我國(guó)的相關(guān)學(xué)者在基礎(chǔ)研究和應(yīng)用研究方面做了大量的工 作,近年來(lái),這一獨(dú)特的方法已經(jīng)得到專家的認(rèn)可,目前在山東省科學(xué)院海洋儀器研究所, 利用超聲空化與聲致發(fā)光法研制的樣機(jī)正在進(jìn)行初步的測(cè)試,大量的試驗(yàn)數(shù)據(jù)表明該方法 具明顯優(yōu)勢(shì)。
[0010] 5)紫外法:基于紫外可見(jiàn)(uv-V i S)光譜的水體T0C分析由于具有快速、不接觸測(cè) 量、重復(fù)性好、維護(hù)量少等優(yōu)點(diǎn),在目前的發(fā)展比較迅速。UV吸收光譜用于T0C的檢測(cè)分析最 早可追溯到1972年,Dobbs等人對(duì)于254nm處紫外吸光度值(A)和城市污水處理二級(jí)出水及 河水的T0C之間線性關(guān)系進(jìn)行了研究,到2001年更多的技術(shù)人員分別驗(yàn)證了這一方法對(duì)于 更廣泛污水水樣同樣具有有效性,與傳統(tǒng)的化學(xué)測(cè)量方法檢測(cè)的T0C之間具有良好的線性 相關(guān)性,因此,該方法的應(yīng)用得到飛速發(fā)展。目前國(guó)外的一些儀器公司已經(jīng)開(kāi)發(fā)出基于紫外 可見(jiàn)(UV-Vis)光譜的T0C分析儀,圖1是現(xiàn)有紫外光譜法測(cè)量系統(tǒng)示意圖。但是通過(guò)單點(diǎn)進(jìn) 行測(cè)量,得到的信息不充分,線性回歸方程的擬合精度不高。目前很多科技人員正在應(yīng)用多 波段擬合的方法進(jìn)行測(cè)量。
[0011] 紫外光譜法反演T0C溶液的濃度所依據(jù)的原理就是朗伯比爾定律,朗伯比爾定律 可表述為:
[0012] A= lg(Io/It) =K ? 1 ? c
[0013] 式中,A為吸光度,Io為入射光的強(qiáng)度,It為透射光的強(qiáng)度,K為吸收系數(shù)或者摩爾吸 收系數(shù),1為吸收介質(zhì)的厚度,c為吸光介質(zhì)的濃度,單位可以是g/L或者mol/L。
[0014]常規(guī)的用于反演T0C溶液濃度的方法就是根據(jù)朗伯比爾定律來(lái)測(cè)定所有各種濃度 T0C溶液的吸光度,然后根據(jù)各種濃度T0C溶液的平均吸光度擬合出一條直線,然后將未知 溶液的吸光度帶入該一次函數(shù)從而反演出未知溶液濃度。
[0015]然而在具體實(shí)驗(yàn)過(guò)程中,T0C溶液標(biāo)定的線性并不理想。圖2是表1所示10種標(biāo)準(zhǔn)濃 度T0C溶液的光譜吸收曲線圖;圖3是表1所示10種標(biāo)準(zhǔn)濃度溶液吸光度曲線圖。如果用 30mg/L和70mg/L濃度的計(jì)算結(jié)果擬合直線,再利用該直線對(duì)其余結(jié)果進(jìn)行濃度反演。反演 結(jié)果和誤差如表1所示(單位:mg/L):
[0016]表1線性反演結(jié)果與誤差(% )
[0017]單位:mg/L
[0019]圖4是濃度計(jì)算結(jié)果線性度示意圖。從圖4中可以看出,當(dāng)TOC濃度范圍在Omg/L-100mg/L時(shí),計(jì)算結(jié)果所呈圖形雖然基本呈線性,但此時(shí)用直線進(jìn)行反演的時(shí)候,個(gè)別濃度 會(huì)出現(xiàn)很大的誤差(見(jiàn)表1),而且這些濃度的精度都不能達(dá)到要求。鑒于現(xiàn)有方法已不能滿 足T0C溶液濃度反演的精度要求,因此亟需一種新的高精度的方法來(lái)完成T0C溶液的在線檢 測(cè) 。
【發(fā)明內(nèi)容】
[0020]針對(duì)現(xiàn)有技術(shù)存在的上述不足,本發(fā)明的目的在于提供一種基于RBM回歸的水質(zhì) T0C濃度分析方法,本方法可以提高T0C濃度反演精度,改善濃度反演算法的重復(fù)性和可移 植性,尤其能夠提高短光程條件下T0C溶液的反演精度,滿足在線檢測(cè)的精度要求。
[0021 ]本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0022]基于RBM回歸的水質(zhì)T0C濃度分析方法,步驟如下,
[0023] 1)訓(xùn)練樣本光譜數(shù)據(jù)采集:通過(guò)光譜儀分別采集光源發(fā)出的光通過(guò)不同已知濃度 的T0C溶液時(shí)的光譜數(shù)據(jù),得到每種濃度T0C溶液對(duì)應(yīng)的吸收光譜數(shù)據(jù);每種濃度T0C溶液的 吸收光譜數(shù)據(jù)進(jìn)行同樣次數(shù)的多次采集,使每種濃度T0C溶液對(duì)應(yīng)著一組包含著其濃度特 征信息的高維數(shù)據(jù);
[0024] 2)吸收光譜數(shù)據(jù)預(yù)處理:將步驟1)采集的所有吸收光譜數(shù)據(jù)對(duì)應(yīng)減去各自包含的 暗光譜,得到預(yù)處理后的光譜數(shù)據(jù);
[0025] 3)特征波段選取:將預(yù)處理后的光譜數(shù)據(jù)選擇特征比較明顯的波段進(jìn)行分析,得 到特征波段;
[0026] 4)吸光度的計(jì)算:根據(jù)朗伯比爾定律分別計(jì)算出所選特征波段光譜數(shù)據(jù)的吸光 度;
[0027] 5)RBM參數(shù)初始化:初始化限制波爾茲曼機(jī)RBM(Restricted Boltzmann Machine) 的相關(guān)參數(shù),得到初始限制波爾茲曼機(jī)RBM網(wǎng)絡(luò)模型;
[0028] 6)RBM模型構(gòu)建:將步驟4)計(jì)算得到的所有吸光度值作為訓(xùn)練樣本輸入初始限制 波爾茲曼機(jī)RBM網(wǎng)絡(luò)模型中在某一迭代次數(shù)下進(jìn)行訓(xùn)練,利用對(duì)比散度算法,得到該迭代次 數(shù)對(duì)應(yīng)的訓(xùn)練后的受限波爾茲曼機(jī)RBM,同時(shí)得到該迭代次數(shù)對(duì)應(yīng)的降低了維度的重構(gòu)后 的訓(xùn)練樣本;
[0029] 7)改變迭代次數(shù),重復(fù)步驟6),得到不同迭代次數(shù)下對(duì)應(yīng)的訓(xùn)練后的受限波爾茲 曼機(jī)RBM和不同迭代次數(shù)對(duì)應(yīng)的降低了維度的重構(gòu)后的訓(xùn)練樣本;
[0030] 8)將所有迭代次數(shù)下對(duì)應(yīng)的降低了維度的重構(gòu)后的訓(xùn)練樣本組合成新的訓(xùn)練樣 本送入BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,得到訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)模型;
[0031] 9)測(cè)試樣本光譜數(shù)據(jù)采集:通過(guò)光譜儀多次采集光源發(fā)出的光通過(guò)待測(cè)濃度T0C 溶液時(shí)的吸收光譜數(shù)據(jù),得到待測(cè)濃度T0C溶液對(duì)應(yīng)著的一組包含著其T0C濃度特征信息的 高維數(shù)據(jù);
[0032] 10)將測(cè)試樣本光譜數(shù)據(jù)依次按步驟2)、步驟3)和步驟4)進(jìn)行處理,得到每個(gè)測(cè)試 樣本光譜數(shù)據(jù)對(duì)應(yīng)的吸光度值;
[0033] 11)將步驟10)得到的所有吸光度值作為測(cè)試樣本分別輸入步驟7)得到的所有訓(xùn) 練后的受限波爾茲曼機(jī)RBM中并分別按訓(xùn)練后的受限波爾茲曼機(jī)RBM對(duì)應(yīng)的迭代次數(shù)進(jìn)行 訓(xùn)練,得到不同迭代次數(shù)對(duì)應(yīng)的降低了維度的重構(gòu)后的測(cè)試樣本;
[0034] 12)將所有迭代次數(shù)下對(duì)應(yīng)的降低了維度的重構(gòu)后的測(cè)試樣本組合成新的測(cè)試樣 本,再將該新的測(cè)試樣本送入訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行測(cè)試,即可得到待測(cè)溶液的 T0C濃度值。
[0035] 第6)步將訓(xùn)練樣本輸入初始限制波爾茲曼機(jī)RBM網(wǎng)絡(luò)模型中在某一迭代次數(shù)下進(jìn) 行訓(xùn)練的具體步驟為,
[0036] 6a)對(duì)于每次迭代,在每小批量數(shù)據(jù)上,調(diào)用⑶-k算法,進(jìn)行k次交替Gibbs采樣,本 方法只需1次交替Gibbs采樣即可保證采集到的樣本符合目標(biāo)分布,具體為:
[0039] 其中(1)式表示在已知可見(jiàn)層狀態(tài)v(Q)時(shí)采樣出隱藏層的第j個(gè)單元的狀態(tài)/f等 于1的概率,表示可見(jiàn)層的輸入狀態(tài),即訓(xùn)練樣本原始特征向量歸一化后的數(shù)據(jù),vf表 示可見(jiàn)層第i個(gè)單元的狀態(tài),A W表示隱藏層第j個(gè)單元的狀態(tài),bj表示隱藏層第j個(gè)單元的 偏置,表示可見(jiàn)層第i個(gè)單元與隱藏層第j個(gè)單元的連接權(quán)重;
[0040] 接著,產(chǎn)生[0,1 ]內(nèi)的隨機(jī)數(shù)n,對(duì)#>進(jìn)行二值化,即若G 11 v(u>),則 4〇1=1,否貝>1,^))二〇;
[0041 ]其中(2)式表示在已知隱藏層狀態(tài)if >時(shí)采樣出可見(jiàn)層各個(gè)單元狀態(tài)vP,以此來(lái)代 替目標(biāo)分布,其中,ai表示可見(jiàn)層第i個(gè)單元的偏置;
[0042] ; ? P(/?,(01 = 11 v(01 )vf -戶認(rèn)⑴=11 v(1) )<) ( 3)
[0043] ~ i^0) - vf^ (4)
[0044] =l \v(0))~P(h^ - l|v(1)) (5)
[0045] 利用(3)、(4)、(5)式分別計(jì)算每次迭代時(shí)目標(biāo)函數(shù)在每小批量數(shù)據(jù)上關(guān)于連接權(quán) 重W、可見(jiàn)層偏置a、隱藏層偏置b的偏導(dǎo)數(shù);
[0046] ^ =p^;rl)+nw lnhl0Lt-A-An^-1') (6)
[0047] Aa^r> = p*Aa]iler-l} -+ /nbloct) (7)
[0048] Abiirer) +fj,kb *-(Abrr)/nblock) (8)
[0049] 本方法采用(6)、(7)、(8)式更新當(dāng)前迭代(iter多1)每小批量數(shù)據(jù)上的平均偏導(dǎo) 數(shù),其中nblcickS小批量數(shù)據(jù)的數(shù)目,P為動(dòng)量學(xué)習(xí)率,本方法中,當(dāng)每次迭代次數(shù)大于30次 時(shí),P = Pf inal = 0 ? 9,否則,P = Pini = 0 ? 5 ;
[0050] 6b)利用梯度上升法更新RBM參數(shù)0 = (W,a,b),具體為:
[0051 ] ff(iter)=ff(iter-D+Aff(iter) (9)
[0052] a(iter)=a(iter-l)+Aa(iter) (l〇)
[0053] b(iter)=b(iter-l)+Ab(iter) (^)
[0054]按上式更新當(dāng)前迭代每小批量數(shù)據(jù)上的連接權(quán)重、可見(jiàn)層偏置和隱藏層偏置。
[0055] 其中,步驟6)中對(duì)比散度算法的具體步驟如下:
[0056] 第1步,將待訓(xùn)練樣本輸入到受限波爾茲曼機(jī)可見(jiàn)層的第一層,得到受限波爾茲曼 機(jī)可見(jiàn)層的第一層輸出;
[0057]第2步,按照下式,采樣得到受限波爾茲曼機(jī)RBM隱藏層的第一層輸出:
[0059] 其中,hln表示受限波爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)的輸出,n表示限波 爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn),~表示采樣操作,P(h ln= 11 V1)表示受限波爾茲 曼機(jī)RBM可見(jiàn)層的第一層輸出為^時(shí)受限波爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)輸出 為1的幾率, V1表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出,e表示歐拉常數(shù),E表示求和 操作,N表示受限波爾茲曼機(jī)RBM隱藏層的第一層的節(jié)點(diǎn)總數(shù),w ln表示連接受限波爾茲曼機(jī) RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)與受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層的權(quán)值,bln表示受 限波爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)的偏置向量;
[0060] 第3步,按照下式,采樣得到受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出:
[0062]其中,v2m表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)的輸出,m表示受限 波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn),~表示采樣操作,P( v2m= 11 lu)表示受限波爾 茲曼機(jī)RBM隱藏層的第一層輸出為匕時(shí)受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)輸 出為1的幾率,ln表示受限波爾茲曼機(jī)RBM隱藏層的第一層輸出,e表示歐拉常數(shù),E表示求 和操作,M表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層的節(jié)點(diǎn)總數(shù),w 2m表示受限波爾茲曼機(jī)RBM 連接可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)與受限波爾茲曼機(jī)RBM隱藏層的第一層的權(quán)值,a2m表示受 限波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)的偏置向量;
[0063]第4步,按照下式,采樣得到受限波爾茲曼機(jī)RBM隱藏層的第二層輸出:
[0065] 其中,h2n表示受限波爾茲曼機(jī)RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn)的輸出,n表示受限 波爾茲曼機(jī)RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn),~表示采樣操作,P(h 2n=l|V2)表示受限波爾 茲曼機(jī)RBM可見(jiàn)層的第二層輸出為^時(shí)受限波爾茲曼機(jī)隱藏層的第二層中第n個(gè)節(jié)點(diǎn)輸出 為1的幾率, V2表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出,e表示歐拉常數(shù),E表示求和 操作,N表示受限波爾茲曼機(jī)RBM隱藏層的第二層的節(jié)點(diǎn)總數(shù),w 2n表示連接受限波爾茲曼機(jī) RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn)與受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層的權(quán)值,b2n表示受 限波爾茲曼機(jī)RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn)的偏置向量;
[0066] 第5步,按照下式,更新受限波爾茲曼機(jī)RBM的權(quán)重:
[0067] wt+i=wt+(P(hi = l | vi) Xvi)-(P(h2 = l | V2) Xv2) (15)
[0068]其中,wt+1表示第t+1次更新后受限波爾茲曼機(jī)RBM的權(quán)重,wt表示第t次更新后受 限波爾茲曼機(jī)RBM的權(quán)重,P(lu = l|V1)表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出為^時(shí) 受限波爾茲曼機(jī)隱藏層的第一層輸出為1的幾率,lu表示受限波爾茲曼機(jī)RBM隱藏層的第一 層輸出, V1表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出,(X)表示內(nèi)積操作,P(h2=l|V2) 表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出為^時(shí)受限波爾茲曼機(jī)RBM隱藏層的第二層 輸出為1的幾率,h 2表示受限波爾茲曼機(jī)RBM隱藏層的第二層輸出,v2表示受限波爾茲曼機(jī) RBM可見(jiàn)層的第二層輸出;
[0069] 第6步,按照下式,更新受限波爾茲曼機(jī)RBM可見(jiàn)層的偏置向量:
[0070] at+i = at+vi-V2 (16)
[0071] 其中,at+1表示第t+1次更新后受限波爾茲曼機(jī)RBM可見(jiàn)層的偏置向量,at表示第t 次更新后受限波爾茲曼機(jī)RBM可見(jiàn)層的偏置向量,V1表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一 層輸出,v2表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出;
[0072] 第7步,按照下式,更新受限波爾茲曼機(jī)RBM隱藏層的偏置向量:
[0073] bt+i = bt+P(hi = 11 vi)-P(h2= 11 V2) (17)
[0074]其中,bt+1表示第t+1次更新后受限波爾茲曼機(jī)RBM隱藏層的偏置向量,bt表示第t 次更新后受限波爾茲曼機(jī)RBM隱藏層的偏置向量,P(lu=l|vi)表示受限波爾茲曼機(jī)RBM可見(jiàn) 層的第一層輸出為 V1時(shí)受限波爾茲曼機(jī)隱藏層的第一層輸出為1的幾率,匕表示受限波爾茲 曼機(jī)RBM隱藏層的第一層輸出,V1表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出,P(h 2=l V2)表示受限波爾茲曼機(jī)可見(jiàn)層的第二層輸出為^時(shí)受限波爾茲曼機(jī)RBM隱藏層的第二層輸 出為1的幾率,h 2表示受限波爾茲曼機(jī)RBM隱藏層的第二層輸出,v2表示受限波爾茲曼機(jī)RBM 可見(jiàn)層的第二層輸出;
[0075] 第8步,判斷受限波爾茲曼機(jī)的訓(xùn)練周期是否達(dá)到300秒,若是,停止更新受限波爾 茲曼機(jī)RBM的權(quán)值、可見(jiàn)層的偏置向量和隱藏層的偏置向量,得到訓(xùn)練完成的受限波爾茲曼 機(jī),否則,重復(fù)執(zhí)行第2步-第7步,直到受限波爾茲曼機(jī)的訓(xùn)練周期達(dá)到300秒。
[0076] 相比現(xiàn)有技術(shù),本發(fā)明具有如下有益效果:
[0077]本發(fā)明采用基于RBM回歸的T0C濃度反演方法,相對(duì)于直接采用線性擬合的技術(shù), 在算法復(fù)雜度基本不變的情況下,本方法大幅度提升了反演結(jié)果的精度。本方法可以改善 濃度反演算法的重復(fù)性和可移植性,尤其是提高短光程條件下T0C溶液的反演精度,滿足在 線檢測(cè)的精度要求。
【附圖說(shuō)明】
[0078]圖1-紫外光譜法測(cè)量系統(tǒng)結(jié)構(gòu)示意圖。
[0079]圖2-10種濃度光譜吸收曲線圖。
[0080]圖3-10種濃度的吸光度曲線圖。
[0081] 圖4-濃度計(jì)算結(jié)果線性度示意圖。
[0082] 圖5-RBM模型示意圖。
[0083]圖6-反演結(jié)果與標(biāo)液濃度對(duì)比示意圖。
[0084]圖7-反演結(jié)果與標(biāo)液濃度誤差示意圖。
[0085]圖8-本發(fā)明實(shí)現(xiàn)流程示意圖。
【具體實(shí)施方式】
[0086]下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
[0087]基于現(xiàn)有直接線性擬合方法的不足,本發(fā)明提出了一種基于RBM回歸的水質(zhì)T0C濃 度反演方法。在所采集的T0C溶液吸收光譜數(shù)據(jù)中,不同波長(zhǎng)點(diǎn)對(duì)應(yīng)不同的光強(qiáng),相應(yīng)波段 對(duì)應(yīng)著大量的數(shù)據(jù)。為減小單次采集產(chǎn)生的隨機(jī)誤差,本發(fā)明對(duì)同一種濃度的光譜數(shù)據(jù)進(jìn) 行多次采集。這樣同一種濃度就相當(dāng)于對(duì)應(yīng)著一組高維數(shù)據(jù),而這組高維數(shù)據(jù)中就包含著 其對(duì)應(yīng)濃度的特征信息。由此可以利用特征提取的方法分別將每種濃度T0C溶液的特征信 息提取出來(lái),剔除不必要的信息,即受限玻爾茲曼機(jī)RBM法。再利用BP神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本 進(jìn)行建模,最后再將測(cè)試樣本的特征提取出來(lái),再利用該BP神經(jīng)網(wǎng)絡(luò)模型即可得出其對(duì)應(yīng) 的濃度。
[0088]本方法首先對(duì)光譜儀所采得的不同濃度T0C溶液的吸收光譜數(shù)據(jù)進(jìn)行預(yù)處理,然 后對(duì)預(yù)處理后的數(shù)據(jù)對(duì)應(yīng)相應(yīng)標(biāo)準(zhǔn)濃度進(jìn)行建模,最后用所建模型對(duì)新采得的光譜數(shù)據(jù)進(jìn) 行回歸分析,得到反演濃度。
[0089] 本發(fā)明具體步驟如下,同時(shí)可以參見(jiàn)圖5:
[0090] 1、基于RBM回歸的水質(zhì)T0C濃度分析方法,其特征在于:步驟如下,
[0091] 1)訓(xùn)練樣本光譜數(shù)據(jù)采集:通過(guò)光譜儀分別采集光源發(fā)出的光通過(guò)不同已知濃度 的T0C溶液時(shí)的光譜數(shù)據(jù),得到每種濃度T0C溶液對(duì)應(yīng)的吸收光譜數(shù)據(jù);每種濃度T0C溶液的 吸收光譜數(shù)據(jù)進(jìn)行同樣次數(shù)的多次采集,使每種濃度T0C溶液對(duì)應(yīng)著一組包含著其濃度特 征信息的高維數(shù)據(jù);
[0092] 2)吸收光譜數(shù)據(jù)預(yù)處理:將步驟1)采集的所有吸收光譜數(shù)據(jù)對(duì)應(yīng)減去各自包含的 暗光譜,得到預(yù)處理后的光譜數(shù)據(jù);
[0093] 3)特征波段選取:將預(yù)處理后的光譜數(shù)據(jù)選擇特征比較明顯的波段進(jìn)行分析,得 到特征波段;
[0094] 4)吸光度的計(jì)算:根據(jù)朗伯比爾定律分別計(jì)算出所選特征波段光譜數(shù)據(jù)的吸光 度;
[0095] 5)RBM參數(shù)初始化:初始化限制波爾茲曼機(jī)RBM(Restricted Boltzmann Machine) 的相關(guān)參數(shù),得到初始限制波爾茲曼機(jī)RBM網(wǎng)絡(luò)模型;
[0096] 6)RBM模型構(gòu)建:將步驟4)計(jì)算得到的所有吸光度值作為訓(xùn)練樣本輸入初始限制 波爾茲曼機(jī)RBM網(wǎng)絡(luò)模型中在某一迭代次數(shù)下進(jìn)行訓(xùn)練,利用對(duì)比散度算法,得到該迭代次 數(shù)對(duì)應(yīng)的訓(xùn)練后的受限波爾茲曼機(jī)RBM,同時(shí)得到該迭代次數(shù)對(duì)應(yīng)的降低了維度的重構(gòu)后 的訓(xùn)練樣本;
[0097] 7)改變迭代次數(shù),重復(fù)步驟6),得到不同迭代次數(shù)下對(duì)應(yīng)的訓(xùn)練后的受限波爾茲 曼機(jī)RBM和不同迭代次數(shù)對(duì)應(yīng)的降低了維度的重構(gòu)后的訓(xùn)練樣本;
[0098] 8)將所有迭代次數(shù)下對(duì)應(yīng)的降低了維度的重構(gòu)后的訓(xùn)練樣本組合成新的訓(xùn)練樣 本送入BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,得到訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)模型;
[0099] 9)測(cè)試樣本光譜數(shù)據(jù)采集:通過(guò)光譜儀多次采集光源發(fā)出的光通過(guò)待測(cè)濃度T0C 溶液時(shí)的吸收光譜數(shù)據(jù),得到待測(cè)濃度T0C溶液對(duì)應(yīng)著的一組包含著其T0C濃度特征信息的 高維數(shù)據(jù);
[0100] 10)將測(cè)試樣本光譜數(shù)據(jù)依次按步驟2)、步驟3)和步驟4)進(jìn)行處理,得到每個(gè)測(cè)試 樣本光譜數(shù)據(jù)對(duì)應(yīng)的吸光度值;
[0101] 11)將步驟1〇)得到的所有吸光度值作為測(cè)試樣本分別輸入步驟7)得到的所有訓(xùn) 練后的受限波爾茲曼機(jī)RBM中并分別按訓(xùn)練后的受限波爾茲曼機(jī)RBM對(duì)應(yīng)的迭代次數(shù)進(jìn)行 訓(xùn)練,得到不同迭代次數(shù)對(duì)應(yīng)的降低了維度的重構(gòu)后的測(cè)試樣本;
[0102] 12)將所有迭代次數(shù)下對(duì)應(yīng)的降低了維度的重構(gòu)后的測(cè)試樣本組合成新的測(cè)試樣 本,再將該新的測(cè)試樣本送入訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行測(cè)試,即可得到待測(cè)溶液的 T0C濃度值。
[0103]其中,第6)步將訓(xùn)練樣本輸入初始限制波爾茲曼機(jī)RBM網(wǎng)絡(luò)模型中在某一迭代次 數(shù)下進(jìn)行訓(xùn)練的具體步驟為,
[0104] 6a)對(duì)于每次迭代,在每小批量數(shù)據(jù)上,調(diào)用⑶-k算法,進(jìn)行k次交替Gibbs采樣,本 方法只需1次交替Gibbs采樣即可保證采集到的樣本符合目標(biāo)分布,具體為:
[0107] 其中(1)式表示在已知可見(jiàn)層狀態(tài)v(Q)時(shí)采樣出隱藏層的第j個(gè)單元的狀態(tài)/f等 于1的概率,表示可見(jiàn)層的輸入狀態(tài),g卩訓(xùn)練樣本原始特征向量歸一化后的數(shù)據(jù),表 示可見(jiàn)層第i個(gè)單元的狀態(tài),表示隱藏層第j個(gè)單元的狀態(tài),W表示隱藏層第j個(gè)單元的 偏置,ww表示可見(jiàn)層第i個(gè)單元與隱藏層第j個(gè)單元的連接權(quán)重;
[0108] 接著,產(chǎn)生[0,1 ]內(nèi)的隨機(jī)數(shù)r j,對(duì)f}進(jìn)行二值化,SP若& < = 1 ,則 4〇):=1,否貝|1,鱒0): = 〇;
[0109] 其中(2)式表示在已知隱藏層狀態(tài)Af時(shí)采樣出可見(jiàn)層各個(gè)單元狀態(tài)^~,以此來(lái)代 替目標(biāo)分布,其中,ai表示可見(jiàn)層第i個(gè)單元的偏置;
[0110] &witJ P(hf} - P(hp -l|v(1,)vf (3)
[0111] Aa,. ~ vf] -vf} (4)
[0112] Ab, ? P{h^ = 1 j v(0!)- P{hf] = 11 v(1>) (5)
[0113] 利用(3)、(4)、(5)式分別計(jì)算每次迭代時(shí)目標(biāo)函數(shù)在每小批量數(shù)據(jù)上關(guān)于連接權(quán) 重W、可見(jiàn)層偏置a、隱藏層偏置b的偏導(dǎo)數(shù);
[0114] A^er> =P*^rl] +Thv "i^iThbiock(6)
[0115] Aaf^ -p*Aar^+%bn^(r]/nblork) (7)
[0116] Ab^,en = p* Ab^ler-U + *(Ab^,er)/nblock) (8)
[0117] 本方法采用(6)、(7)、(8)式更新當(dāng)前迭代(iter多1)每小批量數(shù)據(jù)上的平均偏導(dǎo) 數(shù),其中nblcickS小批量數(shù)據(jù)的數(shù)目,P為動(dòng)量學(xué)習(xí)率,本方法中,當(dāng)每次迭代次數(shù)大于30次 時(shí),P = Pf inal = 0 ? 9,否則,P = Pini = 0 ? 5 ;
[0118] 6b)利用梯度上升法更新RBM參數(shù)0 = (W,a,b),具體為:
[0119] ff(iter)=ff(iter-D+Aff(iter) (9)
[0120] a(iter)=a(iter-l)+Aa(iter) (l〇)
[0121] b(iter)=b(iter-l)+Ab(iter) ( n)
[0122] 按上式更新當(dāng)前迭代每小批量數(shù)據(jù)上的連接權(quán)重、可見(jiàn)層偏置和隱藏層偏置。
[0123] 步驟6)中對(duì)比散度算法的具體步驟如下:
[0124] 第1步,將待訓(xùn)練樣本輸入到受限波爾茲曼機(jī)可見(jiàn)層的第一層,得到受限波爾茲曼 機(jī)可見(jiàn)層的第一層輸出;
[0125] 第2步,按照下式,采樣得到受限波爾茲曼機(jī)RBM隱藏層的第一層輸出:
[0127] 其中,hln表示受限波爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)的輸出,n表示限波 爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn),~表示采樣操作,P(h ln= 1 | V1)表示受限波爾茲 曼機(jī)RBM可見(jiàn)層的第一層輸出為^時(shí)受限波爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)輸出 為1的幾率, V1表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出,e表示歐拉常數(shù),E表示求和 操作,N表示受限波爾茲曼機(jī)RBM隱藏層的第一層的節(jié)點(diǎn)總數(shù),w ln表示連接受限波爾茲曼機(jī) RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)與受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層的權(quán)值,bln表示受 限波爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)的偏置向量;
[0128] 第3步,按照下式,采樣得到受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出:
[0130]其中,v2m表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)的輸出,m表示受限 波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn),~表示采樣操作,P( v2m= 11 lu)表示受限波爾 茲曼機(jī)RBM隱藏層的第一層輸出為匕時(shí)受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)輸 出為1的幾率,ln表示受限波爾茲曼機(jī)RBM隱藏層的第一層輸出,e表示歐拉常數(shù),E表示求 和操作,M表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層的節(jié)點(diǎn)總數(shù),W2m表示受限波爾茲曼機(jī)RBM 連接可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)與受限波爾茲曼機(jī)RBM隱藏層的第一層的權(quán)值,a2m表示受 限波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)的偏置向量;
[0131]第4步,按照下式,采樣得到受限波爾茲曼機(jī)RBM隱藏層的第二層輸出:
[0133] 其中,h2n表示受限波爾茲曼機(jī)RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn)的輸出,n表示受限 波爾茲曼機(jī)RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn),~表示采樣操作,P(h 2n=l|V2)表示受限波爾 茲曼機(jī)RBM可見(jiàn)層的第二層輸出為^時(shí)受限波爾茲曼機(jī)隱藏層的第二層中第n個(gè)節(jié)點(diǎn)輸出 為1的幾率, V2表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出,e表示歐拉常數(shù),E表示求和 操作,N表示受限波爾茲曼機(jī)RBM隱藏層的第二層的節(jié)點(diǎn)總數(shù),w 2n表示連接受限波爾茲曼機(jī) RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn)與受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層的權(quán)值,b2n表示受 限波爾茲曼機(jī)RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn)的偏置向量;
[0134] 第5步,按照下式,更新受限波爾茲曼機(jī)RBM的權(quán)重:
[0135] wt+i=wt+(P(hi = l | vi) Xvi)-(P(h2 = l | V2) Xv2) (15)
[0136] 其中,Wt+1表示第t+1次更新后受限波爾茲曼機(jī)RBM的權(quán)重,wt表示第t次更新后受 限波爾茲曼機(jī)RBM的權(quán)重,P(lu = l|V1)表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出為^時(shí) 受限波爾茲曼機(jī)隱藏層的第一層輸出為1的幾率,lu表示受限波爾茲曼機(jī)RBM隱藏層的第一 層輸出, V1表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出,(X)表示內(nèi)積操作,P(h2=l|V2) 表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出為^時(shí)受限波爾茲曼機(jī)RBM隱藏層的第二層 輸出為1的幾率,h 2表示受限波爾茲曼機(jī)RBM隱藏層的第二層輸出,v2表示受限波爾茲曼機(jī) RBM可見(jiàn)層的第二層輸出;
[0137] 第6步,按照下式,更新受限波爾茲曼機(jī)RBM可見(jiàn)層的偏置向量:
[0138] at+i = at+vi-V2 (16)
[0139] 其中,at+1表示第t+1次更新后受限波爾茲曼機(jī)RBM可見(jiàn)層的偏置向量,at表示第t 次更新后受限波爾茲曼機(jī)RBM可見(jiàn)層的偏置向量,V1表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一 層輸出,v 2表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出;
[0140] 第7步,按照下式,更新受限波爾茲曼機(jī)RBM隱藏層的偏置向量:
[0141] bt+i = bt+P(hi = 11 vi)-P(h2= 11 V2) (17)
[0142] 其中,bt+1表示第t+1次更新后受限波爾茲曼機(jī)RBM隱藏層的偏置向量,bt表示第t 次更新后受限波爾茲曼機(jī)RBM隱藏層的偏置向量,P(lu=l|vi)表示受限波爾茲曼機(jī)RBM可見(jiàn) 層的第一層輸出為 V1時(shí)受限波爾茲曼機(jī)隱藏層的第一層輸出為1的幾率,匕表示受限波爾茲 曼機(jī)RBM隱藏層的第一層輸出,V1表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出,P(h 2=l V2)表示受限波爾茲曼機(jī)可見(jiàn)層的第二層輸出為^時(shí)受限波爾茲曼機(jī)RBM隱藏層的第二層輸 出為1的幾率,h 2表示受限波爾茲曼機(jī)RBM隱藏層的第二層輸出,v2表示受限波爾茲曼機(jī)RBM 可見(jiàn)層的第二層輸出;
[0143] 第8步,判斷受限波爾茲曼機(jī)的訓(xùn)練周期是否達(dá)到300秒,若是,停止更新受限波爾 茲曼機(jī)RBM的權(quán)值、可見(jiàn)層的偏置向量和隱藏層的偏置向量,得到訓(xùn)練完成的受限波爾茲曼 機(jī),否則,重復(fù)執(zhí)行第2步-第7步,直到受限波爾茲曼機(jī)的訓(xùn)練周期達(dá)到300秒。
[0144] 本發(fā)明針對(duì)數(shù)據(jù)本身所具有的本質(zhì)特征進(jìn)行分析,拋開(kāi)現(xiàn)有直接線性擬合技術(shù)的 弊端,直接對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行受限玻爾茲曼機(jī)RBM特征提取,通過(guò)BP神經(jīng)網(wǎng)絡(luò)構(gòu)建模 型,進(jìn)而利用待測(cè)T0C溶液采得的吸收光譜數(shù)據(jù)輸入數(shù)學(xué)模型得到T0C溶液的濃度。通過(guò)幾 個(gè)實(shí)例進(jìn)行的反演結(jié)果如圖6所示,其中' + '代表標(biāo)液濃度,'〇'代表10種濃度每種濃度90組 數(shù)據(jù)的反演結(jié)果(此時(shí)標(biāo)液濃度已被反演出來(lái)的濃度覆蓋),二者吻合性越好,說(shuō)明反演結(jié) 果越好。
[0145] 圖6反演濃度的具體結(jié)果與誤差百分比見(jiàn)表2所示:
[0146]單位:mg/L
[0148] 與表1對(duì)比可知,該反演結(jié)果和標(biāo)準(zhǔn)TOC溶液濃度基本一致,且該模型較傳統(tǒng)算法 而言,在計(jì)算精度上有了大幅度地提升,尤其是高濃度T0C溶液結(jié)果精度非常高。圖7是反演 結(jié)果與標(biāo)準(zhǔn)T0C濃度誤差示意圖。
[0149] 為了更好地說(shuō)明本發(fā)明涉及的基于RBM回歸的T0C溶液濃度反演方法,利用紫外光 譜儀所采集的吸收光譜數(shù)據(jù)進(jìn)行實(shí)驗(yàn),以檢測(cè)T0C溶液的濃度。本發(fā)明的實(shí)現(xiàn)流程如圖8所 示,具體實(shí)施方案按以下步驟進(jìn)行:
[0150] 1)訓(xùn)練樣本數(shù)據(jù)讀入:讀入紫外光譜儀采集的不同濃度的吸收光譜數(shù)據(jù)和暗光譜 數(shù)據(jù),對(duì)吸收光譜數(shù)據(jù)進(jìn)行預(yù)處理之后,根據(jù)朗伯比爾定律計(jì)算得出吸光度數(shù)據(jù);
[0151] 2)受限玻爾茲曼機(jī)RBM特征提取:利用受限玻爾茲曼機(jī)RBM對(duì)不同濃度的吸光度數(shù) 據(jù)分別進(jìn)行特征提取,提取主成分;
[0152] 3)利用提取的主成分和對(duì)應(yīng)的標(biāo)準(zhǔn)T0C溶液濃度,將數(shù)據(jù)送入BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行 訓(xùn)練,構(gòu)建反演模型;
[0153] 4)將測(cè)試樣本依次經(jīng)過(guò)步驟1)和步驟2)處理后,再送入步驟3)構(gòu)建的模型中,即 可得到待測(cè)試T0C溶液濃度反演結(jié)果。
[0154]最后需要說(shuō)明的是,本發(fā)明的上述實(shí)例僅僅是為說(shuō)明本發(fā)明所作的舉例,而并非 是對(duì)本發(fā)明的實(shí)施方式的限定。盡管
【申請(qǐng)人】參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,對(duì) 于所屬領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在上述說(shuō)明的基礎(chǔ)上還可以做出其他不同形式的變化和 變動(dòng)。這里無(wú)法對(duì)所有的實(shí)施方式予以窮舉。凡是屬于本發(fā)明的技術(shù)方案所引申出的顯而 易見(jiàn)的變化或變動(dòng)仍處于本發(fā)明的保護(hù)范圍之列。
【主權(quán)項(xiàng)】
1. 基于RBM回歸的水質(zhì)TOC濃度分析方法,其特征在于:步驟如下, 1) 訓(xùn)練樣本光譜數(shù)據(jù)采集:通過(guò)光譜儀分別采集光源發(fā)出的光通過(guò)不同已知濃度的 TOC溶液時(shí)的光譜數(shù)據(jù),得到每種濃度TOC溶液對(duì)應(yīng)的吸收光譜數(shù)據(jù);每種濃度TOC溶液的吸 收光譜數(shù)據(jù)進(jìn)行同樣次數(shù)的多次采集,使每種濃度TOC溶液對(duì)應(yīng)著一組包含著其濃度特征 信息的高維數(shù)據(jù); 2) 吸收光譜數(shù)據(jù)預(yù)處理:將步驟1)采集的所有吸收光譜數(shù)據(jù)對(duì)應(yīng)減去各自包含的暗光 譜,得到預(yù)處理后的光譜數(shù)據(jù); 3) 特征波段選取:將預(yù)處理后的光譜數(shù)據(jù)選擇特征比較明顯的波段進(jìn)行分析,得到特 征波段; 4) 吸光度的計(jì)算:根據(jù)朗伯比爾定律分別計(jì)算出所選特征波段光譜數(shù)據(jù)的吸光度; 5. RBM參數(shù)初始化:初始化限制波爾茲曼機(jī)RBM(Rest;ricted Boltzmann Machine)的相 關(guān)參數(shù),得到初始限制波爾茲曼機(jī)RBM網(wǎng)絡(luò)模型; 6. RBM模型構(gòu)建:將步驟4)計(jì)算得到的所有吸光度值作為訓(xùn)練樣本輸入初始限制波爾 茲曼機(jī)RBM網(wǎng)絡(luò)模型中在某一迭代次數(shù)下進(jìn)行訓(xùn)練,利用對(duì)比散度算法,得到該迭代次數(shù)對(duì) 應(yīng)的訓(xùn)練后的受限波爾茲曼機(jī)RBM,同時(shí)得到該迭代次數(shù)對(duì)應(yīng)的降低了維度的重構(gòu)后的訓(xùn) 練樣本; 7) 改變迭代次數(shù),重復(fù)步驟6),得到不同迭代次數(shù)下對(duì)應(yīng)的訓(xùn)練后的受限波爾茲曼機(jī) RBM和不同迭代次數(shù)對(duì)應(yīng)的降低了維度的重構(gòu)后的訓(xùn)練樣本; 8) 將所有迭代次數(shù)下對(duì)應(yīng)的降低了維度的重構(gòu)后的訓(xùn)練樣本組合成新的訓(xùn)練樣本送 入BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,得到訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)模型; 9) 測(cè)試樣本光譜數(shù)據(jù)采集:通過(guò)光譜儀多次采集光源發(fā)出的光通過(guò)待測(cè)濃度TOC溶液 時(shí)的吸收光譜數(shù)據(jù),得到待測(cè)濃度TOC溶液對(duì)應(yīng)著的一組包含著其TO切農(nóng)度特征信息的高維 數(shù)據(jù); 10) 將測(cè)試樣本光譜數(shù)據(jù)依次按步驟2)、步驟3)和步驟4)進(jìn)行處理,得到每個(gè)測(cè)試樣本 光譜數(shù)據(jù)對(duì)應(yīng)的吸光度值; 11) 將步驟10)得到的所有吸光度值作為測(cè)試樣本分別輸入步驟7)得到的所有訓(xùn)練后 的受限波爾茲曼機(jī)RBM中并分別按訓(xùn)練后的受限波爾茲曼機(jī)RBM對(duì)應(yīng)的迭代次數(shù)進(jìn)行訓(xùn)練, 得到不同迭代次數(shù)對(duì)應(yīng)的降低了維度的重構(gòu)后的測(cè)試樣本; 12) 將所有迭代次數(shù)下對(duì)應(yīng)的降低了維度的重構(gòu)后的測(cè)試樣本組合成新的測(cè)試樣本, 再將該新的測(cè)試樣本送入訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行測(cè)試,即可得到待測(cè)溶液的TOC 濃度值。2. 根據(jù)權(quán)利要求1所述的基于RBM回歸的水質(zhì)TOC濃度分析方法,其特征在于:第6)步將 訓(xùn)練樣本輸入初始限制波爾茲曼機(jī)RBM網(wǎng)絡(luò)模型中在某一迭代次數(shù)下進(jìn)行訓(xùn)練的具體步驟 為, 6a)對(duì)于每次迭代,在每小批量數(shù)據(jù)上,調(diào)用CD-k算法,進(jìn)行k次交替G化bs采樣,本方法 只需1次交替Gibbs夢(mèng)垃日n而化巫隹巧Il於T垃古給各曰來(lái)是A方T目"C擊.其中(I)式表示在已知可見(jiàn)層狀態(tài)vW時(shí)采樣出隱藏層的第j個(gè)單元的狀態(tài)Af等于I的 概率,V W表示可見(jiàn)層的輸入狀態(tài),即訓(xùn)練樣本原始特征向量歸一化后的數(shù)據(jù),表示可見(jiàn) 層第i個(gè)單元的狀態(tài),Af"表示隱藏層第j個(gè)單元的狀態(tài),bj表示隱藏層第j個(gè)單元的偏置,Wj,1 表示可見(jiàn)層第i個(gè)單元與隱藏層第j個(gè)單元的連接權(quán)重; 接著,產(chǎn)生[oa]內(nèi)的隨機(jī)數(shù)印對(duì)皆墻行二值化,即若〇<p(/f=i|v("),則Zf =1,否 則,皆,=〇; 其中(2)式表示在已知隱藏層狀態(tài)Af時(shí)采樣出可見(jiàn)層各個(gè)單元狀態(tài)if,w此來(lái)代替目 標(biāo)分布,其中,ai表示可見(jiàn)層第i個(gè)單元的偏置: 利用(3)、(4)、丹別TT異母化店曰你四雙化母小化至雙化Jl關(guān)于連接權(quán)重W、 可見(jiàn)層偏置a、隱藏層偏置b的偏導(dǎo)數(shù); 本方法采用、O;、W ;、、8 "V義新a刖店U ter < i;母/J、化至勁_(tái)化Jl的平均偏導(dǎo)數(shù),其 中nbiDck為小批量數(shù)據(jù)的數(shù)目,P為動(dòng)量學(xué)習(xí)率,本方法中,當(dāng)每次迭代次數(shù)大于30次時(shí),P = 化inal 二 0.9 ,否則,P 二化ni 二 0.5 ; 6b)利用梯度上升法更新RBM參數(shù)0 = (W,a,b),具體為: W(iter)二 w(iter-l)+ A w(iter) g ) aUter)二 aUter-l)+AaUter) (l〇) bUter)二 bUter-1)+Abater) (H) 按上式更新當(dāng)前迭代每小批量數(shù)據(jù)上的連接權(quán)重、可見(jiàn)層偏置和隱藏層偏置。3.根據(jù)權(quán)利要求1所述的基于RBM回歸的水質(zhì)TOC濃度分析方法,其特征在于:步驟6)中 對(duì)比散度算法的具體步驟如下: 第1步,將待訓(xùn)練樣本輸入到受限波爾茲曼機(jī)可見(jiàn)層的第一層,得到受限波爾茲曼機(jī)可 見(jiàn)層的第一層輸出; 第2步,按照下式,采樣得到受限波爾茲曼機(jī)RBM隱藏層的第一層輸出:(12) 其中,hin表示受限波爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)的輸出,n表示限波爾茲 曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn),~表示采樣操作,P化In=I I VI)表示受限波爾茲曼機(jī) RBM可見(jiàn)層的第一層輸出為Vi時(shí)受限波爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)輸出為1 的幾率,Vi表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出,e表示歐拉常數(shù),I:表示求和操 作,N表示受限波爾茲曼機(jī)RBM隱藏層的第一層的節(jié)點(diǎn)總數(shù),Win表示連接受限波爾茲曼機(jī)RBM 隱藏層的第一層中第n個(gè)節(jié)點(diǎn)與受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層的權(quán)值,bln表示受限波 爾茲曼機(jī)RBM隱藏層的第一層中第n個(gè)節(jié)點(diǎn)的偏置向量; 第3步,按照下式,采樣得到受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出:其中,V2m表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)的輸出,m表示受限波爾 茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn),~表示采樣操作,P(V2m=l Ihi)表示受限波爾茲曼 機(jī)RBM隱藏層的第一層輸出為hi時(shí)受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)輸出為 1的幾率,hi表示受限波爾茲曼機(jī)RBM隱藏層的第一層輸出,e表示歐拉常數(shù),E表示求和操 作,M表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層的節(jié)點(diǎn)總數(shù),表示受限波爾茲曼機(jī)RBM連接 可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)與受限波爾茲曼機(jī)RBM隱藏層的第一層的權(quán)值,表示受限波 爾茲曼機(jī)RBM可見(jiàn)層的第二層中第m個(gè)節(jié)點(diǎn)的偏置向量; 第4步,按照下式,采樣得到受限波爾茲曼機(jī)RBM隱藏層的第二層輸出:其中,h2n表示受限波爾茲曼機(jī)RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn)的輸出,n表示受限波爾 茲曼機(jī)RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn),~表示采樣操作,P化2n= 1 I V2)表示受限波爾茲曼 機(jī)RBM可見(jiàn)層的第二層輸出為V2時(shí)受限波爾茲曼機(jī)隱藏層的第二層中第n個(gè)節(jié)點(diǎn)輸出為1的 幾率,V2表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出,e表示歐拉常數(shù),E表示求和操作,N 表示受限波爾茲曼機(jī)RBM隱藏層的第二層的節(jié)點(diǎn)總數(shù),W2n表示連接受限波爾茲曼機(jī)RBM隱藏 層的第二層中第n個(gè)節(jié)點(diǎn)與受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層的權(quán)值,b2n表示受限波爾茲 曼機(jī)RBM隱藏層的第二層中第n個(gè)節(jié)點(diǎn)的偏置向量; 第5步,按照下式,更新受限波爾茲曼機(jī)RBM的權(quán)重: Wt+l=Wt+(P(hl=l I VI) Xvi)-(P化2=1 I V2) XV2) (15) 其中,wt+1表示第t+1次更新后受限波爾茲曼機(jī)RBM的權(quán)重,Wt表示第t次更新后受限波爾 茲曼機(jī)RBM的權(quán)重,P化1 = 11 VI)表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出為Vi時(shí)受限波 爾茲曼機(jī)隱藏層的第一層輸出為1的幾率,hi表示受限波爾茲曼機(jī)RBM隱藏層的第一層輸 出,Vi表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出,(X )表示內(nèi)積操作,P化2=11 V2)表示 受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出為V2時(shí)受限波爾茲曼機(jī)RBM隱藏層的第二層輸出 為1的幾率,h2表示受限波爾茲曼機(jī)RBM隱藏層的第二層輸出,V2表示受限波爾茲曼機(jī)RBM可 見(jiàn)層的束^層輸出; 第6步,按照下式,更新受限波爾茲曼機(jī)RBM可見(jiàn)層的偏置向量: 日 t+l =日 t+V 廣 V2 (16) 其中,at+1表示第t+1次更新后受限波爾茲曼機(jī)RBM可見(jiàn)層的偏置向量,at表示第t次更新 后受限波爾茲曼機(jī)RBM可見(jiàn)層的偏置向量,Vi表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸 出,V2表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第二層輸出; 第7步,按照下式,更新受限波爾茲曼機(jī)RBM隱藏層的偏置向量: bt+i = bt+P化 1=1 I vi)-P(h2 = l I V2) (17) 其中,bt+i表示第t+1次更新后受限波爾茲曼機(jī)RBM隱藏層的偏置向量,bt表示第t次更新 后受限波爾茲曼機(jī)RBM隱藏層的偏置向量,P化1 = 11 VI)表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第 一層輸出為Vl時(shí)受限波爾茲曼機(jī)隱藏層的第一層輸出為1的幾率,hi表示受限波爾茲曼機(jī) RBM隱藏層的第一層輸出,Vi表示受限波爾茲曼機(jī)RBM可見(jiàn)層的第一層輸出,P化2= 11 V2)表 示受限波爾茲曼機(jī)可見(jiàn)層的第二層輸出為V2時(shí)受限波爾茲曼機(jī)RBM隱藏層的第二層輸出為 1的幾率,h2表示受限波爾茲曼機(jī)RBM隱藏層的第二層輸出,V2表示受限波爾茲曼機(jī)RBM可見(jiàn) 層的第二層輸出; 第8步,判斷受限波爾茲曼機(jī)的訓(xùn)練周期是否達(dá)到300秒,若是,停止更新受限波爾茲曼 機(jī)RBM的權(quán)值、可見(jiàn)層的偏置向量和隱藏層的偏置向量,得到訓(xùn)練完成的受限波爾茲曼機(jī), 否則,重復(fù)執(zhí)行第2步-第7步,直到受限波爾茲曼機(jī)的訓(xùn)練周期達(dá)到300秒。
【文檔編號(hào)】G01N21/31GK105911003SQ201610228307
【公開(kāi)日】2016年8月31日
【申請(qǐng)日】2016年4月11日
【發(fā)明人】黃鴻, 石光耀, 黃云彪, 金瑩瑩
【申請(qǐng)人】重慶大學(xué)