專利名稱:基于數(shù)據(jù)的城市污水泵站系統(tǒng)建模方法
技術領域:
本發(fā)明屬于自動化技術領域,具體涉及一種基于數(shù)據(jù)的城市污水泵站系統(tǒng)建模方法。
背景技術:
隨著城市的飛速發(fā)展,城市排水已成為制約城市快速發(fā)展的瓶頸之。城市排水主要針對城市現(xiàn)有排水設施,通過排水系統(tǒng)管網(wǎng)泵站模型和實時監(jiān)測數(shù)據(jù),整體優(yōu)化排水系統(tǒng)運行,提高泵站網(wǎng)絡的綜合運行效率、節(jié)能降耗,提高城市的預洪、防洪能力。
排水管網(wǎng)泵站系統(tǒng)模型是城市排水泵站規(guī)劃設計、運行控制、維護管理的核心。受天氣、居民生活污水排放及管道淤堵、滲漏等復雜因素影響,泵站污水流量具有不確定性、非線性和滯后性?,F(xiàn)有排水管網(wǎng)泵站模型(SWMM,STORM和DHI等)多采用基于圣維南方程的水力學建模,建模復雜度高,往往由于缺乏準確的邊界條件信息而難以解析求解。同時排水管網(wǎng)系統(tǒng)存在的大量不確定因素,如降雨分布、生活污水排放、管道淤堵、滲漏等,都將增加建模復雜性。
發(fā)明內容
本發(fā)明的目標是針對現(xiàn)有排水泵站系統(tǒng)建模難題,提供一種基于數(shù)據(jù)的城市污水泵站系統(tǒng)建模方法,避免傳統(tǒng)基于圣維南方程的水力學建模的不足,保證模型精度的同時,也保證模型結構簡單并滿足實際排水系統(tǒng)運行要求。
本發(fā)明首先利用污水泵站系統(tǒng)已知的先驗知識,確定系統(tǒng)模型的類型結構和部分參數(shù)取值范圍;然后根據(jù)泵站已有的大量運行數(shù)據(jù)認知模型參數(shù),獲得可行的數(shù)據(jù)模型。所建模型是實際系統(tǒng)的一個近似,結構簡單,建模時間相對較短,適用于城市排水管網(wǎng)泵站實時優(yōu)化運行和控制。
本發(fā)明利用數(shù)據(jù)采集、數(shù)據(jù)挖掘、系統(tǒng)辨識、預測機理、數(shù)據(jù)驅動和數(shù)值計算等手段,對難以建立機理模型的情況下,建立基于數(shù)據(jù)的城市排水管網(wǎng)系統(tǒng)污水泵站模型,以實現(xiàn)對排水運行過程的優(yōu)化控制和調度。
本發(fā)明方法的具體步驟 步驟(1)建立排水管網(wǎng)泵站預測模型。
現(xiàn)有城市排水系統(tǒng)數(shù)據(jù)采集與監(jiān)控系統(tǒng)(SCADA系統(tǒng))可采集泵站的水位信息,但因測量難題無法獲得管道污水流量數(shù)據(jù),為預測污水在排水管網(wǎng)系統(tǒng)中各泵站的分布情況,改進Gelormino和Ricker(1994)提出的管網(wǎng)模型,分別建立排水管網(wǎng)泵站污水儲量(水位)和污水入流量的預測模型 x(k)=x(k-1)+T(z-1)v(k-1)-s(k-1)+u(k-1)+ε(k-1) 和x′(k-1)=x(k)-x(k-1)+s(k-1)=T(z-1)v(k-1)+u(k-1)+ε(k-1) 其中k表示采樣時刻,x(k)為k時刻該泵站污水儲水量,可以通過泵站前池截面積乘以泵站前池水位求得;x′(k-1)為采樣周期[k-1 k]內該泵站的污水入流量;s(k-1)為采樣周期[k-1 k]內該泵站排出的污水量;u(k-1)和ε(k-1)分別為采樣周期[k-1 k]內本地流入該泵站的污水量之和的均值和噪聲;v(k-1)為采樣周期[k-1 k]內上游泵站排出的污水量;由于上游泵站排出污水量經(jīng)管網(wǎng)流入下游泵站的過程是非線性和滯后過程,采用T(z-1)v(k-1)表示上游泵站排出的污水量經(jīng)管網(wǎng)延遲流入該泵站的污水量,描述為 其中T(z-1)為不確定延遲算子,z-1為一步延遲算子,表示延時一步采樣周期的相應量;na和nb分別表示上游泵站排水量v對流入該泵站的污水量x′的最小和最大遲延,nb>na;系數(shù)ai(i=na,…,nb)表示采樣周期[k-i-1 k-i]內上游泵站排出量流入該泵站的污水量的比例。
由于污水在管網(wǎng)流動的延遲和不確定特性,不確定延遲算子T(z-1)的結構(na和nb)和參數(shù)ai(i=na,…,nb)未知,后面將利用SCADA系統(tǒng)采集的運行數(shù)據(jù)辨識不確定算子T(z-1),建立數(shù)據(jù)模型。
步驟(2)數(shù)據(jù)預處理。
SCADA系統(tǒng)采集的原始數(shù)據(jù)可能存在噪聲、數(shù)據(jù)不完整甚至是不一致,在利用這些數(shù)據(jù)進行分析建模前,需要對數(shù)據(jù)進行預處理。主要包括 遺漏數(shù)據(jù)處理SCADA采集的是時間序列數(shù)據(jù),每隔10~30秒采樣1次。針對可能存在的遺漏項,首先粗選時間序列數(shù)據(jù),每分鐘選1個數(shù)據(jù);再利用忽略元組或歷史數(shù)據(jù)補全方法處理遺漏數(shù)據(jù)。
噪聲數(shù)據(jù)處理采用分箱(按周圍值的平均值平滑)方法處理噪聲數(shù)據(jù)。
步驟(3)系統(tǒng)辨識。
由步驟(1)給出的排水管網(wǎng)泵站預測模型可知,由于上游泵站排水量大小對下游泵站的影響不同,不確定延遲算子T(z-1)中模型結構(na和nb)和模型參數(shù)(系數(shù)
…,
)發(fā)生變化。辨識不確定延遲算子T(z-1)具體步驟如下 a.確定模型集類型 根據(jù)先驗信息分析,確定影響上游泵站排水量大小的兩個具體因素①開泵臺數(shù);②開泵時間。采用開泵率綜合評估影響上游泵站排水量大小開泵率(即計量時間內上游泵站所開泵運行總時間與計量時間內上游泵站可用泵總可運行時間的比值)。根據(jù)泵站大量歷史運行數(shù)據(jù)統(tǒng)計分析,計量時間(如一天)內開泵率情況可聚類為3~5類模式,每一類對應建立一個預測模型。實際運行過程中,跟蹤開泵率指標,動態(tài)判斷當前運行時刻屬于何種模式,從而切換至合適的模型。
b.模型結構辨識 對流入泵站的污水量x′與上游泵站排水量v進行互相關性分析,從而確定模型結構,即不確定延遲算子T(z-1)中na和nb值。
n組采樣數(shù)據(jù)構成的時間序列[x′t]和[vt](t=1,2,…,n)與時延q相關,其中1≤q≤n,互相關系數(shù)rq(x′,v)為 式中 計算不同時延q下相關系數(shù)rq(x′,v),相關系數(shù)大于置信上限值的時刻就是模型結構na和nb,從而確定各模式下預測模型的結構。
c.模型參數(shù)辨識 確定模型結構后,需對模型參數(shù)進行辨識,確定
的值,采用最小二乘法進行參數(shù)辨識。
為便于使用最小二乘法,將步驟(1)得到的模型轉化為 z(k)=x(k)-x(k-1)+s(k-1)-u(k-1)=T(z-1)v(k-1)+ε(k-1) 將上式化為一個標準的最小二乘形式 z(k)=hT(k)θ+ε(k-1) 式中,系數(shù)
h(k)=[v(k-na-1),…,v(k-nb-1)]T 將上式可寫成矩陣形式 ZL=HLθ+∑L 式中ZL=[z(1),z(2),…,z(L)]T,∑L=[ε(1),ε(2),…,ε(L)]T,L為辨識數(shù)據(jù)維數(shù);
最小二乘法的準則函數(shù)J(θ)取為 J(θ)=(ZL-HLθ)TΛL(ZL-HLθ) 其中,ΛL為加權陣,一般取為正定對角陣。
極小化J(θ),可求出系數(shù)θ的估計值
步驟(4)模型參數(shù)在線動態(tài)修正。
隨著觀測數(shù)據(jù)的增多,常規(guī)最小二乘法計算量增加,不能及時辨識模型參數(shù)。本發(fā)明采用遺忘因子最小二乘法,克服數(shù)據(jù)飽和現(xiàn)象,減弱舊觀測數(shù)據(jù)對未知參數(shù)估計的影響,動態(tài)修正模型參數(shù)。
選擇準則函數(shù)為 JL+1=αJL+[z(L+1)-hT(L+1)θL]2 給出遞推公式求解模型系數(shù)θ的估計值
其中α為遺忘因子,一般取0.95<α<1;K(L+1)為權因子;P(L+1)為正定的協(xié)方差陣。
本發(fā)明方法的有益效果 (1)該方法突破傳統(tǒng)建模需對機理特性完全了解的束縛,建模時間相對較短,獲得模型結構較為簡單,是實際系統(tǒng)的一個合理近似。
(2)該方法避免求解傳統(tǒng)水力學數(shù)學模型-圣維南方程組,同時也避免計算機模擬模型對邊界參數(shù)等基礎數(shù)據(jù)的需求,只需利用大量的泵站歷史運行數(shù)據(jù),實用更強。
(3)該方法通過模型結構聚類,建立不同模式下預測模型,可更好地模擬預測各種條件下的排水情況。
(4)該方法通過遺忘因子最小二乘法對模型參數(shù)進行在線辨識,克服了數(shù)據(jù)飽和現(xiàn)象,減弱舊觀測數(shù)據(jù)對未知參數(shù)估計的影響,能及時反映模型參數(shù)的變化,從而可以減少降雨分布、生活污水排放、管道淤堵、滲漏諸多不確定因素對系統(tǒng)性能的影響,提高系統(tǒng)的魯棒性和可靠性,彌補了傳統(tǒng)建模方法的不足。
(5)該方法建立的基于數(shù)據(jù)的城市污水泵站系統(tǒng)模型,可以很好的預測污水泵站系統(tǒng)的多個參數(shù)(污水流入量、污水儲量、污水水位),用于指導泵站的實際運行(a)合理設置泵站的控制水位,以避免不必要的頻繁開關泵,從而降低能耗,延長水泵的壽命;(b)實現(xiàn)預警判斷,為保證安全裕度提前開泵,甚至排空泵站污水,以避免污水溢出,實現(xiàn)安全生產(chǎn)。
具體實施例方式 以杭州留下和磁帶廠兩個上下游泵站為例,對本發(fā)明作進一步說明。
(1)建立排水管網(wǎng)泵站預測模型;排水管網(wǎng)泵站預測模型包括排水管網(wǎng)泵站污水儲量預測模型和污水入流量的預測模型,分別為 x(k)=x(k-1)+T(z-1)v(k-1)-s(k-1)+u(k-1)+ε(k-1) 和x′(k-1)=x(k)-x(k-1)+s(k-1)=T(z-1)v(k-1)+u(k-1)+ε(k-1) 其中k為采樣時刻,x(k)為k時刻磁帶廠泵站污水儲水量,x′(k-1)為采樣周期[k-1 k]內磁帶廠泵站的污水入流量;s(k-1)為采樣周期[k-1 k]內磁帶廠泵站排出的污水量;u(k-1)為采樣周期[k-1 k]內本地流入磁帶廠泵站的污水量之和的均值;ε(k-1)為采樣周期[k-1 k]內本地流入磁帶廠泵站的污水量之和的噪聲;v(k-1)為采樣周期[k-1 k]內留下泵站排出的污水量,T(z-1)v(k-1)為留下泵站排出的污水量經(jīng)管網(wǎng)延遲流入該泵站的污水量 其中T(z-1)為不確定延遲算子,z-1為一步延遲算子,表示延時一步采樣周期的相應量;na和nb分別表示留下泵站排水量v對流入磁帶廠泵站的污水量x′的最小遲延和最大遲延,nb>na;系數(shù)ai(i=na,…,nb)為采樣周期[k-i-1 k-i]內上游泵站排出量流入該泵站污水量的比例; (2)數(shù)據(jù)預處理對SCADA采集的數(shù)據(jù)進行數(shù)據(jù)遺漏處理和噪聲處理。
遺漏數(shù)據(jù)處理泵站SCADA每隔20秒采樣1次數(shù)據(jù),首先從采集的時間序列數(shù)據(jù)中進行粗選,每分鐘選1個數(shù)據(jù),根據(jù)前后數(shù)據(jù)補全,關聯(lián)數(shù)據(jù)補全方法進行遺漏數(shù)據(jù)處理;對于連續(xù)缺失較多的數(shù)據(jù),通過對比前一天的數(shù)據(jù),進行類比補全。
噪聲數(shù)據(jù)處理對開關泵時水面波動造成的水位測量誤差,通過多傳感器測量值平均和前后數(shù)據(jù)平滑校正進行處理;對于明顯的偏大偏小的數(shù)據(jù),通過去除毛刺方法進行校正。
(3)數(shù)據(jù)聚類根據(jù)預處理后的歷史數(shù)據(jù)計算統(tǒng)計指標值-開泵率,通過統(tǒng)計分析將開泵率聚類為3~4類模式,每一類對應建立一個預測模型。實際運行過程中,跟蹤開泵率指標,動態(tài)判斷當前運行模式,切換至合適的預測模型。
(4)模型結構辨識分別對每種模式的杭州磁帶廠泵站污水流入量x′與其上游留下泵站的排水量v進行相關性分析,獲得每類模式下留下泵站和磁帶廠泵站互相關系數(shù)值rq(x′,v),污水泵站液位控制的運行機理決定了互相關系數(shù)的周期性。
根據(jù)經(jīng)驗公式計算得到的流速和上下游泵站的距離計算污水流經(jīng)管網(wǎng)時間,確定正相關性對應的周期,即上游留下泵站的排水量影響下游磁帶廠泵站流入量的時間段。該周期內的相關系數(shù)大于置信上限值時所對應的最小時刻和最大時刻就是模型中不確定延遲算子T(z-1)中na和nb值,從而確定各模式下預測模型的結構。
(5)模型參數(shù)辨識采用最小二乘法對各種模式下預測模型進行參數(shù)辨識,即確定
的值。
將預測模型轉化為如下形式 z(k)=x(k)-x(k-1)+s(k-1)-u(k-1)=T(z-1)v(k-1)+ε(k-1) 將上式轉化為一個標準的最小二乘形式 z(k)=hT(k)θ+ε(k-1) 式中,系數(shù)
h(k)=[v(k-na-1),…,v(k-nb-1)]T。
將上式可寫成矩陣形式 ZL=HLθ+∑L 式中ZL=[z(1),z(2),…,z(L)]T,∑L=[ε(1),ε(2),…,ε(L)]T,L為辨識數(shù)據(jù)維數(shù);
根據(jù)
從而得到模型參數(shù)
的估計值
(6)模型參數(shù)在線動態(tài)修正。
通過步驟(2)至步驟(4)得到不同模式下的預測模型,在實際運行時,為了能及時反映不確定因素對模型參數(shù)的影響,采用遺忘因子最小二乘法對模型參數(shù)進行在線修正。
取遺忘因子α值為0.98。初值θ和P取步驟(4)中參數(shù)辨識的結果,即
誤差ε=0.01。按如下遞歸方程進行在線參數(shù)修正 (7)排水管網(wǎng)泵站污水分布預測。
由步驟(3)至步驟(5)確定各模式下泵站預測模型,利用該模型可以預測下游泵站的污水流入量和污水儲量,以及泵站前池水位。
權利要求
1.基于數(shù)據(jù)的城市污水泵站系統(tǒng)建模方法,其特征在于該方法包括如下步驟
步驟(1)建立排水管網(wǎng)泵站預測模型;排水管網(wǎng)泵站預測模型包括排水管網(wǎng)泵站污水儲量預測模型和污水入流量的預測模型,分別為
x(k)=x(k-1)+T(z-1)v(k-1)-s(k-1)+u(k-1)+ε(k-1)
和x′(k-1)=x(k)-x(k-1)+s(k-1)=T(z-1)v(k-1)+u(k-1)+ε(k-1)
其中k為采樣時刻,x(k)為k時刻該泵站污水儲水量,x′(k-1)為采樣周期[k-1 k]內該泵站的污水入流量;s(k-1)為采樣周期[k-1 k]內該泵站排出的污水量;u(k-1)為采樣周期[k-1 k]內本地流入該泵站的污水量之和的均值;ε(k-1)為采樣周期[k-1 k]內本地流入該泵站的污水量之和的噪聲;v(k-1)為采樣周期[k-1 k]內上游泵站排出的污水量,T(z-1)v(k-1)為上游泵站排出的污水量經(jīng)管網(wǎng)延遲流入該泵站的污水量
其中T(z-1)為不確定延遲算子,z-1為一步延遲算子,表示延時一步采樣周期的相應量;na和nb分別表示上游泵站排水量v對流入該泵站的污水量x′的最小遲延和最大遲延,nb>na;系數(shù)ai(i=na,...,nb)為采樣周期[k-i-1 k-i]內上游泵站排出量流入該泵站污水量的比例;
步驟(2)對數(shù)據(jù)進行預處理,具體包括處理遺漏數(shù)據(jù)和處理噪聲數(shù)據(jù);
處理遺漏數(shù)據(jù)的方法為對數(shù)據(jù)采集與監(jiān)控系統(tǒng)采集的時間序列數(shù)據(jù)首先進行數(shù)據(jù)粗選,即每分鐘選1個數(shù)據(jù);然后再利用忽略元組或歷史數(shù)據(jù)補全方法處理遺漏數(shù)據(jù);
處理噪聲數(shù)據(jù)的方法為采用分箱方法處理噪聲數(shù)據(jù);
步驟(3)辨識不確定延遲算子T(z-1),具體方法是
a、確定模型集類型;
根據(jù)泵站大量歷史運行數(shù)據(jù)將上游泵站開泵率聚類為3~5類模式,每一類對應建立一個預測模型,跟蹤當前開泵率指標,動態(tài)判斷當前運行時刻屬于何種模式,從而切換至與該模式對應的預測模型;
所述的開泵率為計量時間內上游泵站所開泵運行總時間與計量時間內上游泵站可用泵總可運行時間的比值;
b、對流入泵站的污水量x′與上游泵站排水量v進行互相關性分析,確定模型結構na和nb;具體方法是
n組采樣數(shù)據(jù)構成時間序列[x′t]和[vt](t=1,2,...,n)與時延q相關,其中1≤q≤n,互相關系數(shù)rq(x′,v)為
式中
計算不同時延q的相關系數(shù)rq(x′,v),當rq(x′,v)大于設定的置信上限值時,rq(x′,v)所對應的最小時刻和最大時刻就是模型結構na和nb;
c、采用最小二乘法確定預測模型參數(shù)
將步驟(1)得到的預測模型轉化為
z(k)=x(k)-x(k-1)+s(k-1)-u(k-1)=T(z-1)v(k-1)+ε(k-1)
將上式化為一個標準的最小二乘形式
z(k)=hT(k)θ+ε(k-1)
式中,系數(shù)
h(k)=[v(k-na-1),...,v(k-nb-1)]T;
將上式寫成矩陣形式
ZL=HLθ+∑L
式中ZL=[z(1),z(2),...,z(L)]T,∑L=[ε(1),ε(2),...,ε(L)]T,L為辨識數(shù)據(jù)維數(shù);
最小二乘法的準則函數(shù)J(θ)取為
J(θ)=(ZL-HLθ)TΛL(ZL-HLθ)
其中,ΛL為加權陣,取正定對角陣;
極小化J(θ),得到系數(shù)θ的估計值
d、在線動態(tài)修正模型參數(shù)
選擇準則函數(shù)JL+1,JL+1=αJL+[z(L+1)-hT(L+1)θL]2;
根據(jù)遞推公式求解系數(shù)θ的估計值
其中α為遺忘因子,一般取0.95<α<1;K(L+1)為權因子;P(L+1)為正定的協(xié)方差陣。
全文摘要
本發(fā)明涉及一種基于數(shù)據(jù)的城市污水泵站系統(tǒng)建模方法?,F(xiàn)有排水管網(wǎng)泵站模型建模復雜度高。本發(fā)明方法首先建立排水管網(wǎng)泵站預測模型;其次SCADA系統(tǒng)采集的原始數(shù)據(jù)進行預處理;然后確定模型集類型,辨識模型結構和模型參數(shù)辨識;最后對模型參數(shù)進行在線動態(tài)修正。本發(fā)明方法突破傳統(tǒng)建模需對機理特性完全了解的束縛,建模時間相對較短,獲得模型結構較為簡單。
文檔編號G05B13/02GK101807045SQ201010140199
公開日2010年8月18日 申請日期2010年4月2日 優(yōu)先權日2010年4月2日
發(fā)明者徐哲, 左燕, 薛安克, 王建中, 何必仕, 張學同 申請人:杭州電子科技大學