本發(fā)明屬于電網(wǎng)維護,具體是一種支撐配網(wǎng)故障主動搶修的分級預(yù)測與預(yù)警方法。
背景技術(shù):
故障搶修是供電服務(wù)的核心業(yè)務(wù),傳統(tǒng)的配電網(wǎng)搶修模式是被動搶修,即故障后由用戶撥打95598報修電話開始,電網(wǎng)公司接到報修后,安排所處片區(qū)的搶修隊伍進行處理。受到技術(shù)手段的限制,管理部門僅能掌握報修情況、維修人員數(shù)量和出勤情況,對故障報修的趨勢沒有預(yù)測預(yù)警,難以在客戶報修之前獲知報修趨勢并采取精準搶修預(yù)案,搶修效率不能保證。此外,由于缺少對搶修態(tài)勢的量化分析,搶修資源只能按經(jīng)驗固定配置,一旦某區(qū)域搶修力量不足,就會導(dǎo)致維修時間大大延長,影響客戶的正常用電。
技術(shù)實現(xiàn)要素:
為了解決上述問題,本發(fā)明提供了一種支撐配網(wǎng)故障主動搶修的分級預(yù)測與預(yù)警方法,可以根據(jù)歷史數(shù)據(jù)和實時數(shù)據(jù),提前預(yù)測故障發(fā)生的類型和概率,并按照嚴重和緊急程度進行分級,從而提前調(diào)配維修人員,提高維修效率,提升電網(wǎng)運行質(zhì)量。
本發(fā)明采用以下技術(shù)方案:一種支撐配網(wǎng)故障主動搶修的分級預(yù)測與預(yù)警方法,其特征在于,所述的方法包括以下步驟:
步驟101:獲取客戶歷史數(shù)據(jù);
步驟102:預(yù)處理歷史數(shù)據(jù);
步驟103:生成基準編碼;
步驟104:獲取實時一級預(yù)警數(shù)據(jù);
步驟105:生成一級預(yù)警編碼;
步驟106:判斷一級預(yù)警編碼與基準編碼是否相似,若是,發(fā)出一級預(yù)警并進入下一步,若否,返回步驟104;
步驟107:獲取實時二級預(yù)警數(shù)據(jù);
步驟108:生成二級預(yù)警編碼;
步驟109:判斷二級預(yù)警編碼與基準編碼是否相似,若是,發(fā)出二級預(yù)警并進入下一步,若否,返回步驟104;
步驟110:獲取實時三級預(yù)警數(shù)據(jù);
步驟111:生成三級預(yù)警編碼;
步驟112:判斷三級預(yù)警編碼與基準編碼是否相似,若是,發(fā)出三級預(yù)警并返回步驟104,若否,直接返回步驟104。
進一步的,所述的步驟102中,預(yù)處理歷史數(shù)據(jù)的具體方法為:利用Storm實現(xiàn)過濾篩選和數(shù)據(jù)規(guī)劃,然后將處理后的數(shù)據(jù)存儲在HBase中。
進一步的,步驟103、105、107、111中,編碼的生成均采用哈希算法。
進一步的,哈希算法生成編碼的具體過程為:
1)輸入以下參數(shù):hashcode位數(shù)k,視圖數(shù)m,客戶數(shù)n,客戶相似度客戶特征向量
2)結(jié)合算法HashingCodeLearning(k,m,n,),輸出以下參數(shù):客戶總體哈希編碼U,各視圖權(quán)重α,各視圖哈希函數(shù)
3)初始化
4)構(gòu)建連接矩陣
5)構(gòu)建拉普拉斯矩陣(Dp)-1/2LP(Dp)-1/2,p=1,2,...,m,判斷是否收斂,若收斂,進入7),若未收斂,進入6);
6)循環(huán)以下計算過程:
計算得到
計算得到
計算得到矩陣
計算得到矩陣H(α)的k個對應(yīng)特征值最小的特征向量;
根據(jù)特征向量生成哈希編碼矩陣U;
計算得到
使用二次規(guī)劃算法得到α;
返回U,α;
7)在得到連續(xù)化哈希編碼之后,對其進行二值化,得到每一位取值為-1或1的哈希編碼。
進一步的,步驟104中,實時一級預(yù)警數(shù)據(jù)至少包括以下數(shù)據(jù):客戶報修傾向數(shù)據(jù)、歷史重過載數(shù)據(jù)、歷史故障數(shù)據(jù)、歷史停電數(shù)據(jù)、歷史天氣數(shù)據(jù)。
進一步的,步驟107中,實時二級預(yù)警數(shù)據(jù)至少包括以下數(shù)據(jù):實時重過載數(shù)據(jù)、停電發(fā)布漏報數(shù)據(jù)。
進一步的,步驟108中,生成的二級預(yù)警編碼中包含一級預(yù)警數(shù)據(jù)和二級預(yù)警數(shù)據(jù)。
進一步的,步驟110中,實時三級預(yù)警數(shù)據(jù)至少包括以下數(shù)據(jù):OMS故障停電數(shù)據(jù)、實時停電數(shù)據(jù)、電流突變數(shù)據(jù)、預(yù)報天氣數(shù)據(jù)、客戶物聯(lián)網(wǎng)監(jiān)控數(shù)據(jù)。
進一步的,步驟111中,生成的三級預(yù)警編碼中包含一級預(yù)警數(shù)據(jù)、二級預(yù)警數(shù)據(jù)、三級預(yù)警數(shù)據(jù)。
本發(fā)明的有益效果是:
1、由于客戶量巨大,我們面對的數(shù)據(jù)具有很高的維度;同時,不同類型的數(shù)據(jù)(如報修傾向、歷史故障、歷史天氣等)決定了我們需要提取不同類型的特征和屬性。在這樣的背景下,我們選擇采用多視圖哈希方法來處理。用哈希方法能夠提高尋找到相似狀態(tài)客戶的速度,這樣就可以對相似的客戶采用相同的判斷結(jié)果——預(yù)警或不預(yù)警,從而提高計算效率。
2、根據(jù)不同電力故障對于客戶本身和周邊電網(wǎng)的影響,將電力故障劃分為三級,一級為最弱,三級為最強,從而可以根據(jù)問題嚴重性合理分配處理的優(yōu)先級,盡量確保電網(wǎng)整體運行的質(zhì)量。
附圖說明
圖1是本發(fā)明方法的流程示意圖。
具體實施方式
如圖1所示的一種支撐配網(wǎng)故障主動搶修的分級預(yù)測與預(yù)警方法,所述的方法包括以下步驟:
步驟101:獲取客戶歷史數(shù)據(jù),包括往年跨部門跨業(yè)務(wù)的95598、營銷、用采、PMS、OMS、EMS、配網(wǎng)自動化等電力數(shù)據(jù)和天氣、客戶物聯(lián)網(wǎng)監(jiān)控數(shù)據(jù)。
步驟102:預(yù)處理歷史數(shù)據(jù),首先對客戶數(shù)據(jù)進行預(yù)處理,包括過濾篩選、數(shù)據(jù)規(guī)劃等,這個過程可以利用Storm這一開源實時處理與計算技術(shù);對預(yù)處理后的數(shù)據(jù),我們使用HBase存儲。
步驟103:生成基準編碼,采用哈希算法來實現(xiàn),在哈希算法應(yīng)用的過程中,需要考量的環(huán)節(jié)和要素如下:
1、數(shù)據(jù)歸一化
我們所擁有的每個客戶Pi的數(shù)據(jù)可以用向量來表示,即[x1,x2,...,xn],其中xi分別依次表示報修傾向、歷史重過載、歷史故障等。由于數(shù)據(jù)排布分散,比如每個客戶的歷史報修次數(shù)可以從0到n不等,我們需要將數(shù)據(jù)進行歸一化。本方案中我們采用min-max標準化,也稱為離差標準化,是對原始數(shù)據(jù)的線性變換,使結(jié)果映射到[0,1]之間。轉(zhuǎn)換函數(shù)為:
2、相似性保留
哈希編碼在該系統(tǒng)中的主要作用是提高尋找相似客戶的速度。因此,客戶數(shù)據(jù)中所體現(xiàn)的客戶之間的相似度必須在學習得到的哈希編碼中保留,即相似度保留。
為了保留相似度,我們可以用如下的哈希編碼帶權(quán)距離和來衡量相似度保留的程度:其中權(quán)值代表客戶i和客戶j在視圖p中的相似度,由視圖p中的客戶數(shù)據(jù)計算而得。哈希編碼之間的距離||ui-uj||2用漢明距離(Hamming Distance)進行衡量。
可以發(fā)現(xiàn),一旦存相似客戶的對應(yīng)哈希編碼之間距離較大的情況,上示公式結(jié)果會明顯增加。為了最大程度保留相似度,我們需要使上示公式的結(jié)果最小化。我們采用拉普拉斯特征映射(Laplacian Eigenmap)的方法對公式進行變換,為每個視圖p定義一個n×n的對角矩陣,該矩陣對角線上的元素如此,公式轉(zhuǎn)換為
3、一致性
除了保留相似度,我們還想到,所得到的多視圖哈希編碼應(yīng)該與由各視圖單獨生成的哈希編碼的組合之間存在緊密的聯(lián)系,因此模型的另一個目標是減少總體哈希編碼與各單視圖哈希編碼組合之間的距離。我們?yōu)槊恳粋€視圖學習一個哈希函數(shù)參數(shù)矩陣Wp??傮w哈希編碼與單視圖哈希編碼組合之間的距離可以表示為同時為了防止過擬合的發(fā)生,還需要引入一個參數(shù)正則項
除了上述要求之外,對于哈希編碼本身,我們需要使最終得到的編碼每一位為1或-1,且概率相同,編碼各位之間也不能相關(guān),即UUT=I。綜上所述,本模型最終的目標函數(shù)為
由于上式是一個多約束優(yōu)化問題,想要直接求最小值比較困難,我們先將問題松弛化,再轉(zhuǎn)換為正則化最小二乘問題求解。
最終,我們利用哈希算法生成編碼的具體過程為:
1)輸入以下參數(shù):hashcode位數(shù)k,視圖數(shù)m,客戶數(shù)n,客戶相似度客戶特征向量
2)結(jié)合算法HashingCodeLearning(k,m,n,),輸出以下參數(shù):客戶總體哈希編碼U,各視圖權(quán)重α,各視圖哈希函數(shù)
3)初始化
4)構(gòu)建連接矩陣
5)構(gòu)建拉普拉斯矩陣(Dp)-1/2LP(Dp)-1/2,p=1,2,...,m,判斷是否收斂,若收斂,進入7),若未收斂,進入6);
6)循環(huán)以下計算過程:
計算得到
計算得到
計算得到矩陣
計算得到矩陣H(α)的k個對應(yīng)特征值最小的特征向量;
根據(jù)特征向量生成哈希編碼矩陣U;
計算得到
使用二次規(guī)劃算法得到α;
返回U,α;
7)在得到連續(xù)化哈希編碼之后,對其進行二值化,得到每一位取值為-1或1的哈希編碼。
步驟104:獲取實時一級預(yù)警數(shù)據(jù),實時一級預(yù)警數(shù)據(jù)至少包括以下數(shù)據(jù):客戶報修傾向數(shù)據(jù)、歷史重過載數(shù)據(jù)、歷史故障數(shù)據(jù)、歷史停電數(shù)據(jù)、歷史天氣數(shù)據(jù)。
步驟105:生成一級預(yù)警編碼。
步驟106:判斷一級預(yù)警編碼與基準編碼是否相似,若是,發(fā)出一級預(yù)警并進入下一步,若否,返回步驟104。
步驟107:獲取實時二級預(yù)警數(shù)據(jù),實時二級預(yù)警數(shù)據(jù)至少包括以下數(shù)據(jù):實時重過載數(shù)據(jù)、停電發(fā)布漏報數(shù)據(jù)。
步驟108:生成二級預(yù)警編碼,生成的二級預(yù)警編碼是利用一級預(yù)警數(shù)據(jù)和二級預(yù)警數(shù)據(jù)來編碼的。
步驟109:判斷二級預(yù)警編碼與基準編碼是否相似,若是,發(fā)出二級預(yù)警并進入下一步,若否,返回步驟104。
步驟110:獲取實時三級預(yù)警數(shù)據(jù),實時三級預(yù)警數(shù)據(jù)至少包括以下數(shù)據(jù):OMS故障停電數(shù)據(jù)、實時停電數(shù)據(jù)、電流突變數(shù)據(jù)、預(yù)報天氣數(shù)據(jù)、客戶物聯(lián)網(wǎng)監(jiān)控數(shù)據(jù)。
步驟111:生成三級預(yù)警編碼,生成的三級預(yù)警編碼中包含一級預(yù)警數(shù)據(jù)、二級預(yù)警數(shù)據(jù)、三級預(yù)警數(shù)據(jù)。
步驟112:判斷三級預(yù)警編碼與基準編碼是否相似,若是,發(fā)出三級預(yù)警并返回步驟104,若否,直接返回步驟104。
應(yīng)當指出,以上所述具體實施方式可以使本領(lǐng)域的技術(shù)人員更全面地理解本發(fā)明的具體結(jié)構(gòu),但不以任何方式限制本發(fā)明創(chuàng)造。因此,盡管說明書及附圖和實施例對本發(fā)明創(chuàng)造已進行了詳細的說明,但是,本領(lǐng)域技術(shù)人員應(yīng)當理解,仍然可以對本發(fā)明創(chuàng)造進行修改或者等同替換;而一切不脫離本發(fā)明創(chuàng)造的精神和范圍的技術(shù)方案及其改進,其均涵蓋在本發(fā)明創(chuàng)造專利的保護范圍當中。