本發(fā)明屬于低壓配電臺區(qū)拓撲識別領域,具體涉及一種基于多種量測數據的低壓臺區(qū)用戶相位識別方法。
背景技術:
1、近年來,隨著經濟的發(fā)展和城市化進程的不斷推進,低壓臺區(qū)下的用戶數量增長迅速,但因為排查困難、信息更新不及時等問題,用戶相位的檔案信息常處于未知或記錄錯誤的狀態(tài),影響了線路升級改造,以及三相不平衡治理得工作的開展。為了解決上述問題,在實際工程應用中有必要同步開展臺區(qū)用戶相位信息的識別工作。目前,低壓配電臺區(qū)戶變關系識別的方法主要分為人工排查、載波信號檢測和量測數據分析三類。人工現場排查的方法工作量較大且排查效率低,信號檢測法抗干擾能力弱,且實施和維護成本較高,而基于臺區(qū)量測數據的方法具有抗干擾能力強,實施和維護成本低的優(yōu)點,逐漸成為現階段解決臺區(qū)相位識別問題的主流方法。
2、根據使用數據的不同,基于量測數據的方法一般可以分為基于電壓數據的方法和基于功率數據的方法?;陔妷簲祿姆椒ㄔ谂_區(qū)三相電壓較平衡時,難以判斷用戶相位。使用單一功率數據的方法的準確率受臺區(qū)用戶總量以及臺區(qū)電表可采集用戶數的影響,或需要足夠的功率突出變化特征作為支撐,即需要更大的數據量,造成算法的時間復雜度增高,且方法不能很好的區(qū)分空房用戶和低用電量用戶。
3、只使用單一數據的識別方法在部分場景下識別準確率偏差較大,為了提高用戶相位識別的準確率,可以綜合使用臺區(qū)量測數據,做到取長補短。綜合利用電壓和功率兩種數據的優(yōu)點在于能夠解決單一數據方法在三相電壓平衡場景下以及用戶低用電量場景下識別準確率難以保障的問題,提高不同場景下的適用性,具有更好的性能。
技術實現思路
1、方明目的:本發(fā)明的目的在于針對低壓配電臺區(qū)拓撲識別中的相位識別問題,提供一種基于多種量測數據的低壓臺區(qū)用戶相位識別方法。
2、技術方案:本發(fā)明提出的基于多種量測數據的低壓臺區(qū)用戶相位識別方法,包括以下步驟:
3、步驟1:數據集預處理,包括缺失值填補以及冗余信息刪除,進行數據標準化。
4、步驟2:電壓和功率數據篩選,通過篩選電壓序列差異子段和功率數據顯著特征提取,對臺區(qū)原始電壓和功率數據進行處理。
5、步驟3:篩選電壓序列一次聚類,基于電壓相似性對用戶進行聚類,得到初始用戶簇。
6、步驟4:基于集成相似度的二次聚類,結合提取的電壓和功率序列,對用戶與臺區(qū)總表之間進行集成相似性度量,使用聚類算法對用戶簇進行二次聚類,實現用戶相位識別的最終判別。
7、所述步驟1包括以下步驟:
8、(11)對原始數據進行處理,對不符合邏輯的異常值進行刪除,使用缺失值之前的數據補齊缺失位置數據。
9、(12)對原始電壓數據進行標準化處理,公式如下:
10、
11、式中,表示第n個測量點在t時刻的測量值,t表示測量時刻的總數目,n表示測量點的總個數即總用戶數。表示在t時刻所有計量點的電壓均值,表示在t時刻所有計量點的電壓標準差。表示表示第n個計量點電壓在t時刻的z-score標準值。
12、步驟2電壓和功率數據篩選具體方法為:
13、(21)電壓差異序列篩選思想是突出不同物理連接位置下用戶電壓序列差異,使得同相相鄰用戶電壓變化相對其他用戶擁有更高的相關性。根據總表功率曲線的變化,篩選相線高功率時段電壓序列。
14、將功率閾值定義為θp,使用最小長度tdur來排除短數據段,所選電壓序列應滿足在該數據段時間內的總表三相功率大于功率閾值。用于選擇數據段的過程可以公式化為:
15、
16、
17、式中,表示用戶i篩選后的電壓序列,表示其中的第k個數據段,mk表示第k個數據段中的數據點索引,表示該數據段時間內總表功率數據的均值,δt表示采樣間隔。
18、(22)功率顯著變化特征提取思想是去除冗余的微小變化,提取相對于其他用戶的顯著功率變化,以更好的反應用戶與其相位總表的數據相似性。步驟如下所示:
19、1)根據公式計算用戶功率變化量,并將得到的變化量合并組成用戶功率變化量序列和總表功率變化量序列vpd。
20、
21、
22、式中,表示用戶i在時刻t相對于t-k時刻的功率變化量,表示總表相位d在時刻t相對于t-k時刻的功率變化量,通過選取不同的k值對功率變化序列進行擴充。
23、2)依據公式6所示顯著變化提取條件,提取用戶功率顯著變化特征,記用戶i的顯著變化特征序列為顯著變化量對應的索引值為根據索引提取總表功率變化的對應序列記為vp′d。
24、
25、式中,表示t時刻其他用戶的功率變化,α為平均變化系數。利用該條件,提取每個用戶的顯著變化特征,并記錄顯著變化特征對應的時刻。
26、所述步驟3篩選電壓序列一次聚類包括以下步驟:
27、(31)根據公式,使用步驟2中得到的篩選電壓序列計算用戶相似度矩陣d,公式如下:
28、
29、式中,pcc(u′li,m,u′lj,m)為用戶li和lj篩選電壓序列的皮爾遜相關系數。
30、(32)初始將每個用戶當作一個類;
31、(33)將距離最近的兩個類合并為一類,計算合并前后輪廓系數變化δs;
32、(34)如果輪廓系數變化δs<0,結束,得到初步聚類結果c,否則返回步驟(33)。
33、所述步驟4基于集成相似度的二次聚類具體方法為:
34、采用集成相似度作為二次聚類的距離度量,對于步驟3聚類結果c中用戶簇ck的簇內用戶電壓序列,計算用戶電壓序列與總表各相位電壓序列的相似度距離,取平均dv作為用戶簇與總表的電壓相似度距離。ck與相位d的相似度距離表示為:
35、
36、對簇ck內用戶功率數據進行隨機選取求和,作為擴充序列,之后根據功率顯著變化特征序列計算序列與總表對應序列的相似度,取平均值dp作為用戶簇與總表的功率相似度距離。
37、最終的聯合相似度距離d為二者的和:
38、d=dv+βdp???????????(9)
39、式中參數β是為了使二者的變化量綱一致。
40、基于此集成相似度距離,對用戶簇集合c中的用戶簇進行二次聚類,具體步驟為:
41、1)初始化聚類中心為總表三相電壓序列及功率變化序列;
42、2)根據集成相似度距離,計算待識別用戶簇ck到各聚類中心的距離;
43、3)將各用戶簇歸入最近距離對應的簇中,并對各用戶簇到聚類中心的最小距離進行排序。將最小值對應的用戶簇標記為為高可信度用戶簇;
44、4)計算高可信用戶簇內用戶與對應相總表電壓序列的均值序列,將用戶簇內功率變化序列從對應相總表功率變化序列中減去;
45、5)將聚類中心更新為電壓均值序列及相減后的功率變化序列,并根據公式,更新迭代功率顯著變化特征提取條件;
46、
47、式中,nh表示高可信用戶簇所包含的用戶總數,表示t時刻高可信用戶簇中用戶的功率變化。
48、6)若待識別用戶簇為0,結束,否則返回步驟2)。
49、有益效果:與現有技術相比,本發(fā)明的有益效果為:1、綜合利用電壓及功率兩種量測數據,體現了多種數據融合方法的優(yōu)勢,解決單一數據方法存在的短板,使得本發(fā)明在用戶相位識別中具有較高的準確率與較強的適用性。2、對原始電壓數據進行篩選,減少數據冗余度,反映數據重要特征,發(fā)明中的基于篩選電壓的一次聚類方法,有效保證了同相相鄰用戶的聚類有效性和穩(wěn)定性。3、對功率數據進行顯著變化特征提取,并提出電壓、功率集成相似性度量方法,在二次聚類模型中引入顯著特征提取迭代機制,有效提高了識別準確率。