本發(fā)明涉及一種基于EPR進(jìn)化多項(xiàng)式回歸的管網(wǎng)漏失預(yù)測(cè)模型的建立方法,屬于城市供水管網(wǎng)領(lǐng)域。
背景技術(shù):
供水管網(wǎng)是城市的“生命線”,負(fù)責(zé)為城市輸送新鮮的“血液”,是保障城市穩(wěn)定轉(zhuǎn)動(dòng)的前提。供水管網(wǎng)漏失的發(fā)生,將會(huì)帶來(lái)巨大的社會(huì)影響及經(jīng)濟(jì)損失。因此,提前判斷漏失發(fā)生的高風(fēng)險(xiǎn)管道,對(duì)供水管網(wǎng)的漏失狀況進(jìn)行預(yù)測(cè),降低漏失發(fā)生的可能性,有著十分重要的意義。
目前常用于供水管網(wǎng)漏失預(yù)測(cè)的模型主要有兩大類(lèi):一類(lèi)是基于實(shí)驗(yàn)室試驗(yàn)的物理研究模型,一類(lèi)是計(jì)算機(jī)模擬的數(shù)據(jù)分析模型。第一類(lèi)模型的研究需要對(duì)造成管道漏失的各影響因素間的關(guān)系有著明確的認(rèn)知,而實(shí)際各影響因素間關(guān)系復(fù)雜。第二類(lèi)模型主要包括兩個(gè)內(nèi)容,一是基于老化機(jī)制的物理模型,此模型的構(gòu)建需要對(duì)特定的研究管道進(jìn)行時(shí)間跟蹤,數(shù)據(jù)的獲取比較困難,耗費(fèi)大量的時(shí)間精力;二是基于歷史漏失數(shù)據(jù)的統(tǒng)計(jì)模型,該模型的研究可以得到漏失次數(shù)與各影響因素間明確的數(shù)學(xué)關(guān)系,是當(dāng)前研究的熱點(diǎn)。
我國(guó)城市供水管網(wǎng)的基礎(chǔ)數(shù)據(jù)量大,漏失數(shù)據(jù)記錄不完善,導(dǎo)致管道漏失的原因眾多且關(guān)系復(fù)雜非線性。已有精度較高的模型存在無(wú)明確模型公式的問(wèn)題,而有明確公式表示的模型的精度有待提高,公式結(jié)構(gòu)有待簡(jiǎn)化,公式獲取效率有待提升。同時(shí)目前尚無(wú)明確的理論方法對(duì)模型建立后的預(yù)測(cè)效果進(jìn)行評(píng)價(jià),并對(duì)誤差影響進(jìn)行糾正。
技術(shù)實(shí)現(xiàn)要素:
鑒于以上問(wèn)題,本方法的目的是提供一種新的可處理大量漏失數(shù)據(jù)、挖掘非線性關(guān)系、構(gòu)建明確模型表達(dá)式、提高建模效率的基于EPR進(jìn)化多項(xiàng)式回歸的管網(wǎng)漏失預(yù)測(cè)模型的建立方法,并對(duì)模型建立后的預(yù)測(cè)誤差影響的糾正提供方法,以提高模型的預(yù)測(cè)精度,最后將各模型預(yù)測(cè)的漏失次數(shù)加權(quán)得到區(qū)域漏失次數(shù)。模型的建立和區(qū)域漏失次數(shù)的確定能夠在日常管理中盡早發(fā)現(xiàn)具有漏失風(fēng)險(xiǎn)的管道,降低事故發(fā)生的概率,減少經(jīng)濟(jì)損失。
本方法的技術(shù)方案如下:
一種基于EPR進(jìn)化多項(xiàng)式回歸的管網(wǎng)漏失預(yù)測(cè)模型的建立方法,其特征在于該方法包括如下步驟:
第一步:預(yù)測(cè)模型建立的前期數(shù)據(jù)準(zhǔn)備。
(1)信息完善:在城市供水管網(wǎng)的地理信息系統(tǒng)(Geographic Information System,GIS)的漏失系統(tǒng)中,完善漏失管道的相關(guān)信息,包括管材、管徑、管道埋設(shè)時(shí)間、管道編號(hào)、管長(zhǎng)、漏失事件接報(bào)時(shí)間等。
(2)信息編碼:根據(jù)影響因子的屬性不同,管道管材作為不連續(xù)變量,管道管材分別為:鋼管、球墨鑄鐵管、普通鑄鐵管、鍍鋅管、鋼塑復(fù)合管;
(3)信息初步處理:將同一根管道的漏失事件接報(bào)時(shí)間(如2015年2月23日)減去管道埋設(shè)時(shí)間(如1988年3月21日),得到該管道發(fā)生漏失時(shí)的年齡,即管齡;
第二步:影響因子的確定
根據(jù)發(fā)生漏失管道的完整信息,本方法選定管長(zhǎng)L、管齡A和管徑D為影響因子,每年漏失發(fā)生次數(shù)Z(以下簡(jiǎn)稱(chēng):年漏失次數(shù))隨影響因子而改變;
第三步:數(shù)據(jù)分組處理方法
(1)選定GIS中n年完整的漏失管道信息作為原始數(shù)據(jù),其中前(n-1)年原始數(shù)據(jù)用于預(yù)測(cè)模型的建立,第n年的原始數(shù)據(jù)用于預(yù)測(cè)模型的驗(yàn)證;
(2)根據(jù)管材的不同,對(duì)五種管材分別建立各自的漏失預(yù)測(cè)模型,具體方法見(jiàn)第四步;
(3)根據(jù)不同管材在供水管網(wǎng)中實(shí)際鋪設(shè)的管徑D不同,在每一種管材內(nèi)按照管徑大小再進(jìn)行分組,相同管徑的為一組;
(4)根據(jù)不同管材管徑分組內(nèi)每一組管徑的管道每年漏失發(fā)生次數(shù)的不同,按照公式(1)分別計(jì)算每一種管材管徑分組內(nèi)每一組管徑所有管道總的年漏失次數(shù);
式中:Z為每一組管徑年漏失次數(shù),次/年;i為每一相同管徑的管道編號(hào);Zi為管道i的前(n-1)年總漏失次數(shù),次;n-1為研究所用原始數(shù)據(jù)的年數(shù);
(5)根據(jù)不同管材管徑分組內(nèi)的每一組管徑的管道在發(fā)生漏失時(shí)的管齡的不同,按照公式(2)計(jì)算該管材管徑分組內(nèi)每一組管徑所有管道的加權(quán)管齡;
式中:A為(n-1)年管材管徑分組內(nèi)每一組管徑所有管道的加權(quán)管齡,年;Ai為(n-1)年管材管徑分組內(nèi)每一組管徑內(nèi)某管道i的管齡,年。
(6)根據(jù)不同管材管徑分組內(nèi)每一組管徑管道長(zhǎng)度,即管長(zhǎng)的不同,按照公式(3)分別計(jì)算每一組管徑所有管道總的長(zhǎng)度L;
L=∑li (3)
式中:L為每一組管徑對(duì)應(yīng)管道的總長(zhǎng),km;li管道i的長(zhǎng)度,km。
最終得到每一種管材的對(duì)應(yīng)的每一組管徑、管長(zhǎng)、平均加權(quán)管齡、年漏失次數(shù),每一管材分為m組不同的管徑,則有為m組的相應(yīng)分組數(shù)據(jù);
第四步:采用EPR建立漏失預(yù)測(cè)模型。
(1)EPR的參數(shù)設(shè)置:對(duì)每一種管材漏失管道進(jìn)行EPR建模,EPR建模采用的自變量為管長(zhǎng)L、管齡A和管徑D,因變量為Z;表達(dá)式中多項(xiàng)式的項(xiàng)數(shù)小于等于3;函數(shù)類(lèi)型為指數(shù)函數(shù)f(x)=ex,指數(shù)選取范圍為-2、-1、-0.5、0、0.5、1、2;偏差項(xiàng)a0取值為0;基于以上設(shè)置,建立管網(wǎng)漏失預(yù)測(cè)模型;
(2)擬合精度衡量指標(biāo):漏失預(yù)測(cè)模型擬合程度優(yōu)劣按照公式(4)采用決定系數(shù)(Coefficient of Determination,CoD)來(lái)判斷,CoD取值范圍為[0,1],值越大對(duì)應(yīng)的擬合精度越高:
式中:為表達(dá)式i模擬的第j組管徑分組數(shù)據(jù)時(shí)年漏失次數(shù)的模擬值;yj為第j組管徑分組數(shù)據(jù)年漏失次數(shù)的真實(shí)值,為第j組管徑分組數(shù)據(jù)年漏失次數(shù)真實(shí)值的平均數(shù);m為每一種管材管徑的總分組數(shù);
第五步:漏失預(yù)測(cè)模型的驗(yàn)證
漏失預(yù)測(cè)模型預(yù)測(cè)程度的優(yōu)劣按照公式(5)采用均方根誤差(Root Mean Square Error,RMSE)表示,RMSE值越小,預(yù)測(cè)精度越高;
式中:為第n年漏失次數(shù)的預(yù)測(cè)值;y為第n年漏失次數(shù)的真實(shí)值;m為分組數(shù)據(jù)的組數(shù);
第六步:區(qū)域供水管網(wǎng)漏失次數(shù)
以上各步驟得到了某一管材的每一分組管徑漏失預(yù)測(cè)模型后,再用相同方法建立其余四種管材的漏失預(yù)測(cè)模型,采用各管材模型根據(jù)某一年的管網(wǎng)數(shù)據(jù),分別預(yù)測(cè)以后某年各對(duì)應(yīng)管材的漏失次數(shù),加和得到該區(qū)域管網(wǎng)漏失次數(shù)總數(shù),即每種管材的每一種管徑的年漏失次數(shù)均進(jìn)行加和。
進(jìn)一步優(yōu)選,所采用的管網(wǎng)漏失預(yù)測(cè)模型為所建立的管網(wǎng)漏失預(yù)測(cè)模型中CoD取值最接近1的和RMSE值最小的模型。
根據(jù)上述一種基于EPR進(jìn)化多項(xiàng)式回歸的管網(wǎng)漏失預(yù)測(cè)模型的建立方法,先對(duì)建模的原始數(shù)據(jù)進(jìn)行處理,確定管徑、管長(zhǎng)和管齡為影響因子;然后分別對(duì)五種管材建模,每種管材按照管徑、管長(zhǎng)、平均加權(quán)管齡和年漏失次數(shù)為內(nèi)容進(jìn)行分組,建立以管徑、管長(zhǎng)、管齡為自變量,年漏失次數(shù)為因變量的漏失預(yù)測(cè)模型,采用CoD判斷模型的擬合程度;并用實(shí)際漏失數(shù)據(jù)對(duì)漏失預(yù)測(cè)模型進(jìn)行驗(yàn)證,采用RMSE評(píng)判模型的預(yù)測(cè)能力;最后將五種管材根據(jù)的各自建立的漏失預(yù)測(cè)模型預(yù)測(cè)出的年漏失次數(shù),加和得到最終該區(qū)域管網(wǎng)漏失次數(shù)總數(shù)。
與現(xiàn)有供水管網(wǎng)漏失預(yù)測(cè)模型相比,本發(fā)明的有益成果為:(1)模型的建立采用EPR軟件,該方法運(yùn)行界面簡(jiǎn)潔,操作簡(jiǎn)便,能夠根據(jù)需要快速擬合得出模型公式,并且公式結(jié)構(gòu)簡(jiǎn)單;(2)模型公式建立采用EPR軟件中的指數(shù)形式,確定的模型形式更有針對(duì)性,提高了模型擬合的效率;(3)將各管材根據(jù)各自建立的不同漏失預(yù)測(cè)模型預(yù)測(cè)出的年漏失次數(shù),按照n年各管材實(shí)際總漏失次數(shù)比,加權(quán)得到最終的區(qū)域供水管網(wǎng)漏失次數(shù),此舉保留了各管材年漏失次數(shù)的差異的同時(shí),將年漏失次數(shù)加權(quán)得到了區(qū)域漏失次數(shù),結(jié)果更準(zhǔn)確。
具體實(shí)施方式
為更好的理解和實(shí)施本發(fā)明,下面結(jié)合實(shí)施例進(jìn)行詳細(xì)闡述。
鑒于以上問(wèn)題,本方法的目的是提供一種新的可處理大量漏失數(shù)據(jù)、挖掘非線性關(guān)系、構(gòu)建明確模型表達(dá)式、提高建模效率的基于EPR進(jìn)化多項(xiàng)式回歸的管網(wǎng)漏失預(yù)測(cè)模型的建立方法,并對(duì)模型建立后的預(yù)測(cè)誤差影響的糾正提供方法,以提高模型的預(yù)測(cè)精度,最后將各模型預(yù)測(cè)的漏失次數(shù)加權(quán)得到區(qū)域漏失次數(shù)。模型的建立和區(qū)域漏失次數(shù)的確定能夠在日常管理中盡早發(fā)現(xiàn)具有漏失風(fēng)險(xiǎn)的管道,降低事故發(fā)生的概率,減少經(jīng)濟(jì)損失。
本方法的技術(shù)方案如下:
一種基于EPR進(jìn)化多項(xiàng)式回歸的管網(wǎng)漏失預(yù)測(cè)模型的建立方法,其特征在于該方法包括如下步驟:
第一步:預(yù)測(cè)模型建立的前期數(shù)據(jù)準(zhǔn)備。
(1)信息完善:在城市供水管網(wǎng)的地理信息系統(tǒng)(Geographic Information System,GIS)的漏失系統(tǒng)中,完善漏失管道的相關(guān)信息,包括管材、管徑、管道埋設(shè)時(shí)間、管道編號(hào)、管長(zhǎng)、漏失事件接報(bào)時(shí)間等。
(2)信息編碼:根據(jù)影響因子的屬性不同,管道管材作為不連續(xù)變量,管道管材分別為:鋼管、球墨鑄鐵管、普通鑄鐵管、鍍鋅管、鋼塑復(fù)合管;
(3)信息初步處理:將同一根管道的漏失事件接報(bào)時(shí)間(如2015年2月23日)減去管道埋設(shè)時(shí)間(如1988年3月21日),得到該管道發(fā)生漏失時(shí)的年齡,即管齡。
第二步:影響因子的確定。
根據(jù)發(fā)生漏失管道信息的完整性等,本方法選定管長(zhǎng)L、管齡A和管徑D為影響因子,每年漏失發(fā)生次數(shù)Z(以下簡(jiǎn)稱(chēng):年漏失次數(shù))隨影響因子而改變。
第三步:數(shù)據(jù)分組處理方法。
(1)選定GIS中10年完整的漏失管道信息作為原始數(shù)據(jù),其中前9年原始數(shù)據(jù)用于預(yù)測(cè)模型的建立,第10年的原始數(shù)據(jù)用于預(yù)測(cè)模型的驗(yàn)證。
(2)根據(jù)管材的不同,對(duì)五種管材分別建立各自的漏失預(yù)測(cè)模型,本實(shí)施例以鍍鋅管的漏失預(yù)測(cè)模型建立方法為例進(jìn)行說(shuō)明。
(3)根據(jù)鍍鋅管在供水管網(wǎng)中實(shí)際鋪設(shè)的管徑D不同,將鍍鋅管的漏失數(shù)據(jù)按照管徑大小進(jìn)行分組,分為DN15、DN20、D25…等7組。
(4)根據(jù)鍍鋅管7組不同管徑分組內(nèi)的管道每年漏失發(fā)生次數(shù)的不同,按照公式(6)分別計(jì)算鍍鋅管7組管徑分組內(nèi)各組所有管道總的年漏失次數(shù)。
式中:Z為年漏失次數(shù),次/年;i為管道編號(hào);Zi為管道i的9年總漏失次數(shù),次。
(5)根據(jù)鍍鋅管7組不同管徑分組內(nèi)的管道在發(fā)生漏失時(shí)的管齡的不同,按照公式(2)計(jì)算鍍鋅管7組管徑分組內(nèi)各組所有管道的加權(quán)管齡。
式中:A為9年管材管徑分組內(nèi)每一組管徑所有管道的加權(quán)管齡,年;Ai為9年管材管徑分組內(nèi)每一組管徑內(nèi)某管道i的管齡,年。
(6)根據(jù)鍍鋅管7組不同管徑分組內(nèi)管道長(zhǎng)度,即管長(zhǎng)的不同,按照公式(3)分別計(jì)算鍍鋅管7組管徑分組內(nèi)各組所有管道總的長(zhǎng)度L。
L=∑li (3)
式中:L為管徑對(duì)應(yīng)管道的總長(zhǎng),km;li管道i的長(zhǎng)度,km。
最終得到鍍鋅管的以管徑、管長(zhǎng)、平均加權(quán)管齡、年漏失次數(shù)為內(nèi)容的7組分組數(shù)據(jù)。
本實(shí)施例的部分分組數(shù)據(jù)如表1所示
表1 鍍鋅管漏失次數(shù)與相關(guān)屬性
第四步:采用EPR建立漏失預(yù)測(cè)模型。
(1)EPR的參數(shù)設(shè)置:EPR建模采用的自變量為管長(zhǎng)L、管齡A和管徑D,因變量為年漏失次數(shù)Z;表達(dá)式中多項(xiàng)式的項(xiàng)數(shù)小于等于3;函數(shù)類(lèi)型為指數(shù)函數(shù)f(x)=ex,指數(shù)選取范圍為-2、-1、-0.5、0、0.5、1、2;偏差項(xiàng)a0取值為0?;谝陨显O(shè)置,建立管網(wǎng)漏失預(yù)測(cè)模型。
(2)擬合精度衡量指標(biāo):漏失預(yù)測(cè)模型擬合程度優(yōu)劣按照公式(4)采用決定系數(shù)(Coefficient of Determination,CoD)來(lái)判斷,CoD取值范圍為[0,1],值越大對(duì)應(yīng)的擬合精度越高:
式中:為表達(dá)式i模擬第j組分組數(shù)據(jù)時(shí)年漏失次數(shù)的模擬值;yj為第j組分組數(shù)據(jù)年漏失次數(shù)的真實(shí)值,為第j組分組數(shù)據(jù)年漏失次數(shù)真實(shí)值的平均數(shù);m為分組數(shù)據(jù)的組數(shù),根據(jù)鍍鋅管分組的實(shí)際情況,在此取7。
第五步:漏失預(yù)測(cè)模型的驗(yàn)證。
漏失預(yù)測(cè)模型預(yù)測(cè)程度的優(yōu)劣按照公式(5)采用均方根誤差(Root Mean Square Error,RMSE)表示,RMSE值越小,預(yù)測(cè)精度越高。
式中:為第10年漏失次數(shù)的預(yù)測(cè)值;y為第10年漏失次數(shù)的真實(shí)值;m為分組數(shù)據(jù)的組數(shù),根據(jù)鍍鋅管分組的實(shí)際情況,在此取7。
本方法針對(duì)鍍鋅管建立的最優(yōu)自變量為管長(zhǎng)L、管齡A和管徑D、因變量為Z的漏失模型為公式(7),CoD為0.9164,RMSE為54.7257。其他四種管材的漏失預(yù)測(cè)模型建立方法相同。
Z=5.69×103AD-2L-0.5exp(D0.5L0.5A-1) (7)
第六步:區(qū)域供水管網(wǎng)漏失次數(shù)。
以上各步驟得到鍍鋅管的漏失預(yù)測(cè)模型后,再用相同方法分別建立鋼管、球墨鑄鐵管、普通鑄鐵管和鋼塑復(fù)合管的漏失預(yù)測(cè)模型,各管材模型預(yù)測(cè)2016年該管材的總漏失次數(shù)分別為21,19,176,1697,79,加和得到該區(qū)域管網(wǎng)漏失次數(shù)總數(shù)為1992。
根據(jù)上述一種基于EPR進(jìn)化多項(xiàng)式回歸的管網(wǎng)漏失預(yù)測(cè)模型的建立方法,先對(duì)建模的原始數(shù)據(jù)進(jìn)行處理,確定管徑、管長(zhǎng)和管齡為影響因子;然后分別對(duì)五種管材建模,每種管材按照管徑、管長(zhǎng)、平均加權(quán)管齡和年漏失次數(shù)為內(nèi)容進(jìn)行分組,建立以管徑、管長(zhǎng)、管齡為自變量,年漏失次數(shù)為因變量的漏失預(yù)測(cè)模型,采用CoD判斷模型的擬合程度;并用實(shí)際漏失數(shù)據(jù)對(duì)漏失預(yù)測(cè)模型進(jìn)行驗(yàn)證,采用RMSE評(píng)判模型的預(yù)測(cè)能力;最后將五種管材根據(jù)的各自建立的漏失預(yù)測(cè)模型預(yù)測(cè)出的年漏失次數(shù),加和得到最終該區(qū)域管網(wǎng)漏失次數(shù)總數(shù)。