本發(fā)明涉及能耗監(jiān)測,尤其涉及一種車站能耗異常檢測方法、系統(tǒng)、設(shè)備以及介質(zhì)。
背景技術(shù):
1、隨著工業(yè)化和城市化步伐的加快,全球能源需求呈現(xiàn)出持續(xù)增長的態(tài)勢。在這種情境下,能源的合理利用與節(jié)約問題變得日益突出,引發(fā)了社會各界對能源管理效率的廣泛關(guān)注。能耗異常檢測技術(shù)因此應(yīng)運而生,并迅速發(fā)展成為提升能源管理和優(yōu)化能效的重要手段。
2、能耗異常檢測的核心在于通過實時監(jiān)測和深入分析能源消耗數(shù)據(jù),準確捕捉并識別出超出正常波動范圍的能耗變化。這種技術(shù)的及時性和精準性,使得能源管理者能夠迅速作出反應(yīng),調(diào)整和優(yōu)化能源使用策略,從而達到提高能源利用效率、降低運營成本、確保設(shè)備安全運行以及推動可持續(xù)發(fā)展目標的實現(xiàn)。
3、然而,在當(dāng)前的能耗異常識別技術(shù)中,主要采用的是統(tǒng)計學(xué)方法、機器學(xué)習(xí)算法或深度學(xué)習(xí)技術(shù)。盡管這些技術(shù)在某些方面表現(xiàn)出色,但各自也存在不容忽視的局限性。具體來說,傳統(tǒng)的統(tǒng)計學(xué)方法在處理能耗數(shù)據(jù)時,往往只能檢測到那些明顯的、偏離正常范圍的異常值,而對于更為復(fù)雜、隱蔽的異常模式則顯得力不從心。另一方面,機器學(xué)習(xí)算法雖然在適應(yīng)數(shù)據(jù)變化方面表現(xiàn)出較強的靈活性,但需要定期更新模型以適應(yīng)不斷變化的工作環(huán)境。同時,在動態(tài)變化的工作環(huán)境中,機器學(xué)習(xí)算法還需要頻繁的手動調(diào)整參數(shù),這不僅增加了人工干預(yù)的成本,也在一定程度上影響了檢測的實時性和準確性。
技術(shù)實現(xiàn)思路
1、(一)要解決的技術(shù)問題
2、鑒于現(xiàn)有技術(shù)的上述缺點、不足,本發(fā)明提供一種車站能耗異常檢測方法、系統(tǒng)、設(shè)備以及介質(zhì),其解決了現(xiàn)有的能耗異常檢測技術(shù)存在無法全面識別復(fù)雜異常模式且需要高頻率手動調(diào)整參數(shù)的技術(shù)問題。
3、(二)技術(shù)方案
4、為了達到上述目的,本發(fā)明采用的主要技術(shù)方案包括:
5、第一方面,本發(fā)明實施例提供一種車站能耗異常檢測方法,包括:
6、自動采集車站的至少一種類型的數(shù)據(jù),并加載至預(yù)先部署的數(shù)據(jù)處理環(huán)境交由至少一個處理節(jié)點處理,以構(gòu)成數(shù)據(jù)集;
7、基于數(shù)據(jù)集獲得能耗數(shù)據(jù)至少一個維度的特征,結(jié)合通過統(tǒng)計方法得到的各影響因素與能耗數(shù)據(jù)的分布規(guī)律和相關(guān)性,輸出數(shù)據(jù)分析結(jié)果;
8、根據(jù)數(shù)據(jù)分析結(jié)果,對數(shù)據(jù)集中的不同類型的數(shù)據(jù)進行特征工程處理,構(gòu)造反映能耗影響因素的特征集;
9、將反映能耗影響因素的特征集輸入至預(yù)先構(gòu)建并訓(xùn)練好的能耗異常檢測模型,以使得能耗異常檢測模型根據(jù)輸入的特征集,對能耗數(shù)據(jù)進行單個或批量的異常檢測,輸出異常檢測結(jié)果。
10、可選地,自動采集車站的至少一種類型的數(shù)據(jù),并加載至預(yù)先部署的數(shù)據(jù)處理環(huán)境交由至少一個處理節(jié)點處理,以構(gòu)成數(shù)據(jù)集包括:
11、響應(yīng)于用戶需求或自動選擇并采集車站的至少一種類型的數(shù)據(jù);
12、將采集到的各類數(shù)據(jù)整合到統(tǒng)一的數(shù)據(jù)平臺,得到整合數(shù)據(jù)集;
13、將整合數(shù)據(jù)集劃分為至少一個子集,并按照子集到節(jié)點的映射規(guī)則加載到預(yù)先部署的數(shù)據(jù)處理環(huán)境中的至少一個獨立處理節(jié)點上;
14、在每一獨立處理節(jié)點上,進行如下處理:
15、對整合數(shù)據(jù)子集進行邏輯檢查,識別并標記缺失值、重復(fù)值和格式錯誤的數(shù)據(jù);
16、對于整合數(shù)據(jù)子集的缺失值,根據(jù)數(shù)據(jù)的分布特性、缺失值的比例或分析需求采用至少一種填補方法,根據(jù)選擇的填補方法,對標記的缺失值進行填補;
17、通過檢查整合數(shù)據(jù)子集中的時間戳或日期字段,識別并分析出時間序列數(shù)據(jù)以及統(tǒng)計時間序列的粒度和頻率,根據(jù)統(tǒng)計時間序列的粒度和頻率,將各個整合數(shù)據(jù)子集進行對齊;
18、按照節(jié)點到子集的映射規(guī)則和/或分析需求,將經(jīng)過獨立處理節(jié)點處理的整合數(shù)據(jù)子集重構(gòu)成待分析的數(shù)據(jù)集;
19、其中,
20、數(shù)據(jù)類型包括:車站基礎(chǔ)信息、設(shè)備基礎(chǔ)信息、環(huán)境數(shù)據(jù)、設(shè)備運行數(shù)據(jù)、能耗數(shù)據(jù)、運營數(shù)據(jù)、客流數(shù)據(jù)以及標簽數(shù);
21、子集到節(jié)點的映射規(guī)則為:
22、;
23、式中, f是一個映射函數(shù), d i為第 ?i?個子集, n為被劃分的子集數(shù)量, n j為第 ?j?個處理節(jié)點, argmax k表示尋找使函數(shù)達到最大值的自變量, α為數(shù)據(jù)量權(quán)重系數(shù), β為數(shù)據(jù)特性權(quán)重系數(shù),∣ d i∣為數(shù)據(jù)子集 ?d i的數(shù)據(jù)量大小,為所有數(shù)據(jù)子集的數(shù)據(jù)量總和,為數(shù)據(jù)子集 ?d i與處理節(jié)點? n k?之間的特性相似度,? k為索引變量,用于遍歷所有處理節(jié)點 n k,并找到使得表達式值最大的處理節(jié)點索引 j;
24、節(jié)點到子集的映射規(guī)則為:
25、;
26、式中, g是重新映射函數(shù),為重新映射后的第 i個子集, n j為第 j個處理節(jié)點, γ為節(jié)點處理能力權(quán)重系數(shù), δ為數(shù)據(jù)子集與節(jié)點特性匹配度權(quán)重系數(shù),為處理節(jié)點 n k的容量大小,為所有處理節(jié)點的容量總和,為重新映射后的數(shù)據(jù)子集與處理節(jié)點 ?n k之間的特性匹配度。
27、可選地,基于數(shù)據(jù)集獲得能耗數(shù)據(jù)至少一個維度的特征,結(jié)合通過統(tǒng)計方法得到的各影響因素與能耗數(shù)據(jù)的分布規(guī)律和相關(guān)性,輸出數(shù)據(jù)分析結(jié)果包括:
28、對數(shù)據(jù)集中的能耗數(shù)據(jù)進行至少一個維度的特征的提取,構(gòu)造包含能耗數(shù)據(jù)的趨勢特征、季節(jié)性特征、周期性特征、能耗模式特征、非線性特征以及復(fù)雜關(guān)聯(lián)特征的初始特征數(shù)據(jù);
29、采用遞歸特征消除算法,通過迭代地訓(xùn)練預(yù)設(shè)的基模型并根據(jù)基模型的重要性評分或系數(shù),逐步減少初始特征集中的特征數(shù)量,直到達到預(yù)設(shè)條件,得到初次精簡后的特征數(shù)據(jù);
30、根據(jù)能耗數(shù)據(jù)的特性和預(yù)測目標,選擇一特征選擇模型,利用特征選擇模型對初次精簡后的特征數(shù)據(jù)中的剩余特征進行訓(xùn)練和篩選,選擇出對能耗預(yù)測或分析貢獻最大的特征,得到再次精簡后的特征數(shù)據(jù);
31、通過箱線圖分析,識別并比較數(shù)據(jù)集中不同類型的數(shù)據(jù)對應(yīng)的能耗水平;
32、根據(jù)箱線圖的分布特點,確定能耗數(shù)據(jù)在不同類型的數(shù)據(jù)影響下的分布情況;
33、使用相關(guān)性分析或回歸分析,量化分析不同類型的數(shù)據(jù)與能耗數(shù)據(jù)之間的單調(diào)關(guān)系的強度和方向;
34、根據(jù)再次精簡后的特征數(shù)據(jù)、能耗數(shù)據(jù)在不同類型的數(shù)據(jù)影響下的分布情況及不同類型的數(shù)據(jù)與能耗數(shù)據(jù)之間的單調(diào)關(guān)系的強度和方向,形成數(shù)據(jù)分析結(jié)果。
35、可選地,根據(jù)數(shù)據(jù)分析結(jié)果,對數(shù)據(jù)集中的不同類型的數(shù)據(jù)進行特征工程處理,構(gòu)造反映能耗影響因素的特征集包括:
36、對數(shù)據(jù)集中的包含車站類型、車站敷設(shè)方式、是否有物業(yè)區(qū)、季節(jié)類型、天氣類型、是否有特殊事件以及能耗標簽的非數(shù)值型數(shù)據(jù),采用標簽化變換為可用于模型輸入的數(shù)值化結(jié)果;
37、對數(shù)據(jù)集中的包含車站建筑面積、天氣溫度、天氣濕度、客運量的連續(xù)數(shù)值型數(shù)據(jù),通過計算數(shù)據(jù)集的平均值和標準差進行標準化變換,得到標準化結(jié)果;
38、對數(shù)據(jù)集中的包含運營時長、各能耗數(shù)據(jù)的特定連續(xù)數(shù)值型變量,進行歸一化變換,通過確定數(shù)據(jù)集中的最小值和最大值將數(shù)據(jù)縮放到特定范圍內(nèi),得到歸一化結(jié)果;
39、利用數(shù)值化、標準化以及歸一化的結(jié)果訓(xùn)練多個基學(xué)習(xí)器,得到多個基學(xué)習(xí)器的輸出;
40、引入軟投票機制,將每個基學(xué)習(xí)器的輸出轉(zhuǎn)換為概率分布,并通過根據(jù)每個基學(xué)習(xí)器的性能和置信度分配的權(quán)重進行加權(quán)平均融合,以形成反映能耗影響因素的特征集。
41、可選地,將反映能耗影響因素的特征集輸入至預(yù)先構(gòu)建并訓(xùn)練好的能耗異常檢測模型,以使得能耗異常檢測模型根據(jù)輸入的特征集,對能耗數(shù)據(jù)進行單個或批量的異常檢測,輸出異常檢測結(jié)果之前,還包括:
42、確定包括車站類型、車站敷設(shè)方式、車站面積、車站層數(shù)、是否有物業(yè)區(qū)、季節(jié)類型、天氣類型、天氣溫度、天氣濕度、各設(shè)備平均運行功率、各設(shè)備平均運行時長、各設(shè)備故障數(shù)據(jù)、各系統(tǒng)電耗、運營時長、是否有特殊事件、列車發(fā)車對數(shù)以及客流數(shù)據(jù)的輸入項作為模型的輸入;
43、確定模型的輸出為能耗標簽數(shù)據(jù);
44、以固定時間間隔為時間粒度,對獲取的歷史數(shù)據(jù)進行整合,形成包含時間、輸入數(shù)據(jù)及對應(yīng)能耗標簽的訓(xùn)練數(shù)據(jù)結(jié)構(gòu)表,并將訓(xùn)練數(shù)據(jù)結(jié)構(gòu)表劃分為訓(xùn)練集和驗證集;
45、根據(jù)確定的模型輸入輸出,選擇復(fù)合局部異常因子構(gòu)建初始能耗異常檢測模型,配置模型參數(shù),確保模型能夠接收對應(yīng)的輸入項并輸出能耗標簽數(shù)據(jù);
46、使用訓(xùn)練集中的數(shù)據(jù)對初始能耗異常檢測模型進行訓(xùn)練,通過調(diào)整模型參數(shù)和優(yōu)化算法,使模型能夠?qū)W習(xí)輸入數(shù)據(jù)與能耗標簽之間的映射關(guān)系,同時訓(xùn)練過程中,定期使用驗證集對模型進行評估;
47、經(jīng)過至少一次迭代訓(xùn)練和優(yōu)化,直至達到預(yù)設(shè)標準,得到能耗異常檢測模型。
48、可選地,根據(jù)確定的模型輸入輸出,選擇局部異常因子構(gòu)建初始能耗異常檢測模型,配置模型參數(shù),確保模型能夠接收對應(yīng)的輸入項并輸出能耗標簽數(shù)據(jù)包括:
49、構(gòu)建一局部異常因子基礎(chǔ)模型;
50、根據(jù)局部異常因子基礎(chǔ)模型,引入核方法得到引入核方法的局部異常因子模型;
51、通過采用集成學(xué)習(xí)的策略,訓(xùn)練多個引入核方法的局部異常因子模型,并將輸出結(jié)果進行融合,以得到復(fù)合局部異常因子;
52、根據(jù)異常檢測的目標,動態(tài)調(diào)整復(fù)合局部異常因子的參數(shù),以確保模型能夠接收對應(yīng)的輸入項并輸出能耗標簽數(shù)據(jù);
53、其中,
54、基礎(chǔ)的局部異常因子模型為:
55、;
56、式中, l( x)表示樣本點 x的局部異常因子,用于衡量樣本點 x與鄰居之間的相對密度, n k( x)表示樣本點 x的 k個最近鄰居, o是 n k( x)集合中的一個元素,表示為 x的一個最近鄰居, k表示最近鄰居的數(shù)量, lrd( x)表示樣本點 x的局部可達密度;
57、引入核方法的局部異常因子模型為:
58、;
59、式中, k( x, y)表示高斯核函數(shù),用于將原始數(shù)據(jù)映射到高維空間, x, y為被比較的兩個數(shù)據(jù)點, σ表示高斯核的帶寬參數(shù), l k( x)表示在高維空間中計算的樣本點 x的局部異常因子, lrd k( x)表示在高維空間中計算的樣本點 x的局部可達密度,表示 x的所有 k個最近鄰居 o與 x之間的核函數(shù)值 k( x,? o)與在高維空間中的局部可達密度的乘積之和;
60、集成學(xué)習(xí)的局部異常因子模型為:
61、;
62、其中, l e( x)表示集成學(xué)習(xí)后樣本點 x的局部異常因子, m表示訓(xùn)練的模型數(shù)量 ,l km( x)表示第 m個引入核方法的局部異常因子模型計算的樣本點 x的局部異常因子。
63、可選地,將反映能耗影響因素的特征集輸入至預(yù)先構(gòu)建并訓(xùn)練好的能耗異常檢測模型,以使得能耗異常檢測模型根據(jù)輸入的特征集,對能耗數(shù)據(jù)進行單個或批量的異常檢測,輸出異常檢測結(jié)果包括:
64、將反映能耗影響因素的特征集輸入至訓(xùn)練好的能耗異常檢測模型以進行異常檢測,得到單個或批量的當(dāng)前車站能耗的正常或異常類別判斷結(jié)果;
65、在每一次檢測的同時,將模型輸入數(shù)據(jù)以及對應(yīng)的能耗標簽存入訓(xùn)練數(shù)據(jù)結(jié)構(gòu)表;
66、每隔設(shè)定時段,計算當(dāng)前模型的檢測精度,如果精度低于設(shè)定的下限值,則啟動重新訓(xùn)練流程,利用累積的所有數(shù)據(jù)重新訓(xùn)練模型,并更新模型參數(shù);
67、利用可視化工具,將能耗數(shù)據(jù)、異常檢測結(jié)果以及原因分析結(jié)論向用戶展現(xiàn),并當(dāng)檢測到能耗異常時,通過至少一個通信渠道通知用戶;
68、編制并定期向用戶發(fā)布包含定期總結(jié)異常情況、原因分析結(jié)果以及采取的改善措施和效果的能耗分析報告。
69、第二方面,本發(fā)明實施例提供一種車站能耗異常檢測系統(tǒng),包括:
70、收集與處理模塊,用于自動采集車站的至少一種類型的數(shù)據(jù),并加載至預(yù)先部署的數(shù)據(jù)處理環(huán)境交由至少一個處理節(jié)點處理,以構(gòu)成數(shù)據(jù)集。
71、數(shù)據(jù)分析模塊,用于基于數(shù)據(jù)集獲得能耗數(shù)據(jù)至少一個維度的特征,結(jié)合通過統(tǒng)計方法得到的各影響因素與能耗數(shù)據(jù)的分布規(guī)律和相關(guān)性,輸出數(shù)據(jù)分析結(jié)果。
72、特征集輸出模塊,用于根據(jù)數(shù)據(jù)分析結(jié)果,對數(shù)據(jù)集中的不同類型的數(shù)據(jù)進行特征工程處理,構(gòu)造反映能耗影響因素的特征集。
73、異常檢測模塊,用于將反映能耗影響因素的特征集輸入至預(yù)先構(gòu)建并訓(xùn)練好的能耗異常檢測模型,以使得能耗異常檢測模型根據(jù)輸入的特征集,對能耗數(shù)據(jù)進行單個或批量的異常檢測,輸出異常檢測結(jié)果。
74、第三方面,本發(fā)明實施例提供一種車站能耗異常檢測設(shè)備,包括:
75、至少一個數(shù)據(jù)庫;以及與所述至少一個數(shù)據(jù)庫通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個數(shù)據(jù)庫執(zhí)行的指令,所述指令被所述至少一個數(shù)據(jù)庫執(zhí)行,以使所述至少一個數(shù)據(jù)庫能夠執(zhí)行如上所述的車站能耗異常檢測方法。
76、第四方面,本發(fā)明實施例提供一種計算機可讀介質(zhì),其上存儲有計算機可執(zhí)行指令,所述可執(zhí)行指令被處理器執(zhí)行時實現(xiàn)如上所述的車站能耗異常檢測方法。
77、(三)有益效果
78、本發(fā)明的有益效果是:
79、首先,本發(fā)明通過收集并處理車站的多種類型數(shù)據(jù),構(gòu)成全面且豐富的數(shù)據(jù)集。這一步驟的益處在于,它能夠整合來自不同源的數(shù)據(jù),打破信息孤島,為后續(xù)的能耗分析提供堅實的數(shù)據(jù)基礎(chǔ)。
80、其次,基于構(gòu)建的數(shù)據(jù)集,該方法深入分析能耗數(shù)據(jù)的多個維度特征,并結(jié)合統(tǒng)計方法揭示各影響因素與能耗數(shù)據(jù)之間的分布規(guī)律和相關(guān)性。這種深入分析不僅有助于理解能耗的復(fù)雜行為,而且能夠準確識別出影響能耗的關(guān)鍵因素,為能源管理提供科學(xué)依據(jù)。
81、進一步地,根據(jù)數(shù)據(jù)分析結(jié)果,對數(shù)據(jù)進行特征工程處理,構(gòu)造出反映能耗影響因素的特征集。這一步驟的巧妙之處在于,它能夠?qū)⒃紨?shù)據(jù)轉(zhuǎn)化為更具代表性和鑒別力的特征,從而提升能耗異常檢測模型的性能和準確性。
82、此外,通過構(gòu)建能耗異常檢測模型,并利用歷史數(shù)據(jù)和對應(yīng)的能耗類別數(shù)據(jù)進行訓(xùn)練,該方法使得模型能夠?qū)W習(xí)到能耗行為的內(nèi)在規(guī)律和異常模式。這種自學(xué)習(xí)能力意味著模型能夠不斷適應(yīng)工作環(huán)境的變化,保持對能耗異常的敏感性和準確性。
83、最后,將經(jīng)過處理的特征集輸入到訓(xùn)練好的能耗異常檢測模型中,進行異常檢測,并可視化展示檢測結(jié)果。這一步驟的實用性在于,它不僅能夠及時發(fā)現(xiàn)和定位能耗異常,還能夠以直觀的方式呈現(xiàn)檢測結(jié)果,便于管理人員快速理解和響應(yīng),從而大大提高了能源管理的智能化水平和響應(yīng)速度。
84、由此,本發(fā)明通過整合數(shù)據(jù)、深入分析、特征工程、模型訓(xùn)練和可視化展示等一系列步驟,實現(xiàn)了對車站能耗的全面監(jiān)控和智能管理。這不僅能夠提高能源利用效率,實現(xiàn)節(jié)能減排目標,還能夠降低運營成本,提升車站運營的整體效益。