本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種數(shù)據(jù)處理方法和裝置。
背景技術(shù):
隨著經(jīng)濟(jì)的發(fā)展,國家用電量也穩(wěn)步上升。根據(jù)國家能源局發(fā)布的數(shù)據(jù)中,2015年全國用電量為55500億千瓦時(shí),全國用電量極高。隨之很多人因?yàn)槔娴年P(guān)系竊電,且竊電手段多樣,科技性高,導(dǎo)致在竊電偵查非常困難。其手段有:電壓竊電、電流竊電、移相竊電、擴(kuò)差法竊電以及較為高技術(shù)的強(qiáng)磁竊電、無線遙控竊電、大功率無線干擾竊電和電能表編程器竊電等,這些手段的竊電導(dǎo)致我國供電企業(yè)每年經(jīng)濟(jì)損失達(dá)200億左右,并有每年上升的傾向。而目前,我國供電企業(yè)在供電管理方面采用自動(dòng)化的管理系統(tǒng),監(jiān)測手段落后于竊電手段,因此無法較好的遏制竊電行為。竊電行為給供電企業(yè)和社會(huì)發(fā)展造成了極大的經(jīng)濟(jì)危害,因此尋找一種較好的反竊電方法對(duì)供電企業(yè)和社會(huì)的發(fā)展有著非常重要的、深遠(yuǎn)的意義。
從供電企業(yè)開始采用全自動(dòng)化管理開始,用戶的用電數(shù)據(jù)就被一一的記錄下來,自此,供電企業(yè)存留了海量用戶用電數(shù)據(jù)。而在這個(gè)信息技術(shù)極為發(fā)達(dá)的時(shí)代,這海量的用戶用電數(shù)據(jù)為之后制定反竊電行為有極其重要的作用。我們利用sas(statisticsanalysissystem)數(shù)據(jù)統(tǒng)計(jì)分析軟件,將用戶的用電數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫中,進(jìn)行統(tǒng)計(jì)分析,建立竊電行為模型。我們所建立的竊電行為模型庫精確度達(dá)99.3871%,具有非常高的實(shí)用性和推廣價(jià)值。建模方法單一、精準(zhǔn)度較低,也因?yàn)槠渚珳?zhǔn)度較低而無法較好的推廣到現(xiàn)實(shí)中。
針對(duì)相關(guān)技術(shù)中預(yù)計(jì)用戶的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法和裝置,以至少解決相關(guān)技術(shù)中預(yù)計(jì)用戶的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問題。
根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種數(shù)據(jù)處理方法,該方法包括:獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶的屬性參數(shù)及用電用戶對(duì)應(yīng)的用電行為參數(shù);將用電數(shù)據(jù)庫中的用電用戶分為竊電用戶和不竊電用戶;根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模,得到竊電用戶的竊電行為模型和不竊電用戶的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶的竊電期望值之間的關(guān)系。
進(jìn)一步地,用電數(shù)據(jù)庫中包括多張數(shù)據(jù)表,每張數(shù)據(jù)表包括用電用戶的至少一種屬性參數(shù)和至少一種用電行為參數(shù),獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù)包括:分別判斷每張數(shù)據(jù)表中每個(gè)種類的屬性參數(shù)或用電行為參數(shù)的表格值是缺失值或無效值的數(shù)量是否超過預(yù)設(shè)數(shù)量;如果判斷結(jié)果為是,則將對(duì)應(yīng)種類的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除。
進(jìn)一步地,在將對(duì)應(yīng)種類的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除之后,方法還包括:判斷用電數(shù)據(jù)庫中是否存在變量內(nèi)容相同的屬性參數(shù)或用電行為參數(shù);如果判斷結(jié)果為是,則將變量內(nèi)容相同的屬性參數(shù)或用電行為參數(shù)進(jìn)行合并。
進(jìn)一步地,根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模包括:采用多種模型對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模;根據(jù)測試樣本集對(duì)每種模型的建模結(jié)果進(jìn)行測試,以確定誤差最小的模型種類。
根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種數(shù)據(jù)處理裝置,該裝置包括:獲取單元,用于獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶的屬性參數(shù)及用電用戶對(duì)應(yīng)的用電行為參數(shù);分類單元,用于將用電數(shù)據(jù)庫中的用電用戶分為竊電用戶和不竊電用戶;建模單元,用于根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模,得到竊電用戶的竊電行為模型和不竊電用戶的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶的竊電期望值之間的關(guān)系。
進(jìn)一步地,用電數(shù)據(jù)庫中包括多張數(shù)據(jù)表,每張數(shù)據(jù)表包括用電用戶的至少一種屬性參數(shù)和至少一種用電行為參數(shù),獲取單元包括:判斷模塊,用于分別判斷每張數(shù)據(jù)表中每個(gè)種類的屬性參數(shù)或用電行為參數(shù)的表格值是缺失值或無效值的數(shù)量是否超過預(yù)設(shè)數(shù)量;刪除模塊,用于如果判斷結(jié)果為是,則將對(duì)應(yīng)種類的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除。
進(jìn)一步地,該裝置還包括:判斷單元,用于在將對(duì)應(yīng)種類的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除之后,判斷用電數(shù)據(jù)庫中是否存在變量內(nèi)容相同的屬性參數(shù)或用電行為參數(shù);合并單元,用于如果判斷結(jié)果為是,則將變量內(nèi)容相同的屬性參數(shù)或用電行為參數(shù)進(jìn)行合并。
進(jìn)一步地,建模單元包括:建模模塊,用于采用多種模型對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模;測試模塊,用于根據(jù)測試樣本集對(duì)每種模型的建模結(jié)果進(jìn)行測試,以確定誤差最小的模型種類。
根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種存儲(chǔ)介質(zhì),該存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在程序運(yùn)行時(shí)控制存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行本發(fā)明的數(shù)據(jù)處理方法。
根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種處理器,該處理器用于運(yùn)行程序,其中,程序運(yùn)行時(shí)執(zhí)行本發(fā)明的數(shù)據(jù)處理方法。
在本發(fā)明實(shí)施例中,通過獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶的屬性參數(shù)及用電用戶對(duì)應(yīng)的用電行為參數(shù);將用電數(shù)據(jù)庫中的用電用戶分為竊電用戶和不竊電用戶;根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模,得到竊電用戶的竊電行為模型和不竊電用戶的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶的竊電期望值之間的關(guān)系,解決了相關(guān)技術(shù)中預(yù)計(jì)用戶的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問題,進(jìn)而實(shí)現(xiàn)了更準(zhǔn)確地預(yù)計(jì)用戶的竊電行為的技術(shù)效果。
附圖說明
此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
圖1是根據(jù)本發(fā)明實(shí)施例的一種可選的數(shù)據(jù)處理方法的流程圖;
圖2是根據(jù)本發(fā)明實(shí)施例的一種可選的數(shù)據(jù)處理裝置的示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
本申請(qǐng)?zhí)峁┝艘环N數(shù)據(jù)處理方法的實(shí)施例。
圖1是根據(jù)本發(fā)明實(shí)施例的一種可選的數(shù)據(jù)處理方法的流程圖,如圖1所示,該方法包括如下步驟:
步驟s101,獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù):
用電數(shù)據(jù)庫中包括多個(gè)用電用戶的歷史用電數(shù)據(jù),歷史用電數(shù)據(jù)包括用電用戶的屬性參數(shù)及用電用戶對(duì)應(yīng)的用電行為參數(shù),為了分析和預(yù)測用戶的竊電行為,需要大量的歷史用電數(shù)據(jù),因此,首先需要從用電數(shù)據(jù)庫中獲取歷史用電數(shù)據(jù),可選的,在獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù)時(shí),可以對(duì)這些數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,例如刪除無效數(shù)據(jù)、合并同類數(shù)據(jù)等數(shù)據(jù)處理操作。
用電數(shù)據(jù)庫中可以包括多張數(shù)據(jù)表,每張數(shù)據(jù)表包括用電用戶的至少一種屬性參數(shù)和至少一種用電行為參數(shù),屬性參數(shù)是用于表示用戶信息的屬性的參數(shù),例如,用戶標(biāo)識(shí)(可以是id編號(hào)等)、用電行業(yè)類型、國家行業(yè)類型、城鄉(xiāng)類型等,用電行為參數(shù)是用于表示用戶用電行為的類型的參數(shù),例如,檢查周期、用電電壓分類、應(yīng)收電費(fèi)等。
在這種應(yīng)用場景中,獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù)可以包括:分別判斷每張數(shù)據(jù)表中每個(gè)種類的屬性參數(shù)或用電行為參數(shù)的表格值是缺失值或無效值的數(shù)量是否超過預(yù)設(shè)數(shù)量;如果判斷結(jié)果為是,則將對(duì)應(yīng)種類的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除。
進(jìn)一步地,在將對(duì)應(yīng)種類的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除之后,該方法還可以包括:判斷用電數(shù)據(jù)庫中是否存在變量內(nèi)容相同的屬性參數(shù)或用電行為參數(shù);如果判斷結(jié)果為是,則將變量內(nèi)容相同的屬性參數(shù)或用電行為參數(shù)進(jìn)行合并。
步驟s102,將用電數(shù)據(jù)庫中的用電用戶分為竊電用戶和不竊電用戶:
用電數(shù)據(jù)庫中的用電用戶可能存在過竊電行為,根據(jù)歷史竊電行為可以將用電數(shù)據(jù)庫中的用電用戶分為竊電用戶和不竊電用戶,存在過竊電行為的竊電用戶的預(yù)測模型與未存在過竊電行為的竊電用戶的預(yù)測模型是不同的,通過將用電用戶進(jìn)行分類,可以提高預(yù)測用戶竊電行為的準(zhǔn)確性。
可選的,將用電數(shù)據(jù)庫中的用電用戶分為竊電用戶和不竊電用戶可以在獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù)之前,也可以在獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù)之后,根據(jù)具體情況而定。
步驟s103,根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模,得到竊電用戶的竊電行為模型和不竊電用戶的竊電行為模型:
在獲取歷史用電數(shù)據(jù)之后,分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模,得到用于預(yù)測用電用戶的竊電行為的竊電行為模型,竊電行為模型用于表示變量為用電用戶的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶的竊電期望值之間的關(guān)系,也即,竊電行為模型的表達(dá)式為竊電期望值=f(屬性參數(shù),用電行為參數(shù))。
進(jìn)一步地,根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建??梢圆捎枚喾N模型建模,并對(duì)通過多種模型進(jìn)行建模后的建模結(jié)果進(jìn)行測試,應(yīng)用效果最好的模型,具體而言,根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模包括:采用多種模型對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模;根據(jù)測試樣本集對(duì)每種模型的建模結(jié)果進(jìn)行測試,以確定誤差最小的模型種類。
該實(shí)施例通過獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶的屬性參數(shù)及用電用戶對(duì)應(yīng)的用電行為參數(shù);將用電數(shù)據(jù)庫中的用電用戶分為竊電用戶和不竊電用戶;根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模,得到竊電用戶的竊電行為模型和不竊電用戶的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶的竊電期望值之間的關(guān)系,解決了相關(guān)技術(shù)中預(yù)計(jì)用戶的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問題,進(jìn)而實(shí)現(xiàn)了更準(zhǔn)確地預(yù)計(jì)用戶的竊電行為的技術(shù)效果。
作為上述實(shí)施例的一種可選實(shí)施方式,數(shù)據(jù)處理方法的步驟如下:
(1)對(duì)數(shù)據(jù)庫中的歷史用電數(shù)據(jù)進(jìn)行清洗:
1)通過一個(gè)或多個(gè)數(shù)據(jù)平臺(tái)向數(shù)據(jù)庫導(dǎo)入多張數(shù)據(jù)表,檢查導(dǎo)入數(shù)據(jù)庫的多張表的dmp數(shù)據(jù)的一致性,并查詢每個(gè)表的完整性約束、主鍵和外鍵;
2)每張數(shù)據(jù)表中包括一個(gè)或多個(gè)變量,確定每個(gè)變量下的值,如果多數(shù)是缺失值和無效值,則該變量對(duì)模型的參考價(jià)值較小,刪除對(duì)應(yīng)的變量,保留缺失值和無效值較少的變量;
3)檢查不同表格間的同名變量的含義是否相同,如果含義相同,則通過相似id的主鍵連接,并檢查格式內(nèi)容是否一致,剔除不一致的數(shù)據(jù);
4)在上述結(jié)果中,保留信息較完整詳細(xì)的數(shù)據(jù)。
(2)模型中變量的篩選
1)根據(jù)電力行業(yè)的特點(diǎn),從清洗過的數(shù)據(jù)中選擇并保留符合建模需要的變量;
2)利用表的主鍵和外鍵進(jìn)行合并,如果沒有對(duì)應(yīng)的主鍵和外鍵,依照建模需求挑選合適的變量合并,或者結(jié)合時(shí)間序列,參照兩個(gè)變量進(jìn)行合并,最終得到每個(gè)觀測描述某個(gè)用戶在某月內(nèi)的行為的總表;
3)檢查表中數(shù)據(jù)的一致性和完整性,并對(duì)不符合條件的變量進(jìn)行補(bǔ)缺或者剔除部分再觀測;
4)通過竊電用戶表內(nèi)的竊電天數(shù)、竊電時(shí)間點(diǎn)和用戶編號(hào)加入目標(biāo)變量“用戶是否竊電”;
(3)對(duì)用電用戶進(jìn)行分類
1)根據(jù)國家用電分類標(biāo)準(zhǔn)和用電客戶的用電類別分成八大類并去除全部居民的數(shù)據(jù);
2)將八大類數(shù)據(jù):大工業(yè)用電、中小學(xué)教育教學(xué)用電、農(nóng)業(yè)生產(chǎn)用電、農(nóng)業(yè)排灌用電、非居民照明用電、非工業(yè)用電、普通工業(yè)用電、普通工業(yè)用電和商業(yè)用電的用戶觀測分別提取出來;
(4)數(shù)據(jù)分區(qū)
1)把一次分區(qū)所需要的全部觀測,按用戶分成竊電用戶的觀測和不竊電用戶的觀測兩個(gè)部分;
2)在數(shù)據(jù)庫中的竊電用戶和不竊電用戶兩個(gè)部分分別抽取一部分,組成建模集,數(shù)據(jù)庫中剩下的組成評(píng)分集;
3)對(duì)建模集再按一定比例分成訓(xùn)練集、驗(yàn)證集和評(píng)分集;
(5)運(yùn)行sas(statisticsanalysissystem)數(shù)據(jù)統(tǒng)計(jì)分析軟件,建立模型
(6)通過多種模型進(jìn)行建模,將多個(gè)建模結(jié)果的模型進(jìn)行對(duì)比和評(píng)分
結(jié)果如表1至表3所示:
如表1所示,在決策樹(卡方)、回歸、神經(jīng)網(wǎng)絡(luò)、梯度boosting、數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡(luò)、dmine回歸合mbr模型中,決策樹(卡方)的測試精準(zhǔn)度是最高的,達(dá)99.3871%。將建立模型的變量進(jìn)行重要性排序(如表2所示),結(jié)果顯示為用電量排第一,第二為用電行業(yè)分類,第三為國家行業(yè)分類,因此將數(shù)據(jù)進(jìn)行行業(yè)分類后再次進(jìn)行模型構(gòu)建(如表3所示)。從表3的結(jié)果中,八大類用電用戶的精準(zhǔn)度均高于97.8905%,最高為非工業(yè)的99.56492%,精準(zhǔn)度超過99%的共6個(gè),占75%。
表1模型間精準(zhǔn)度表比較(單位%)
表2決策樹變量重要性排序
表3各行業(yè)間決策樹精準(zhǔn)度分析(單位%)
該實(shí)施例提供的數(shù)據(jù)處理方法能夠建立與實(shí)際情況符合程度較高的竊電行為模型,能夠根據(jù)用戶的屬性和行為推測用戶的竊電行為,具有非常高的實(shí)用性和推廣價(jià)值,準(zhǔn)確率較高。
需要說明的是,在附圖的流程圖雖然示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
本申請(qǐng)還提供了一種存儲(chǔ)介質(zhì)的實(shí)施例,該實(shí)施例的存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在程序運(yùn)行時(shí)控制存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行本發(fā)明實(shí)施例的數(shù)據(jù)處理方法。
本申請(qǐng)還提供了一種處理器的實(shí)施例,該實(shí)施例的處理器用于運(yùn)行程序,其中,程序運(yùn)行時(shí)執(zhí)行本發(fā)明實(shí)施例的數(shù)據(jù)處理方法。
本申請(qǐng)還提供了一種數(shù)據(jù)處理裝置的實(shí)施例。需要說明的是,該實(shí)施例提供數(shù)據(jù)處理裝置可以用于執(zhí)行本發(fā)明實(shí)施例提供的數(shù)據(jù)處理方法。
圖2是根據(jù)本發(fā)明實(shí)施例的一種可選的數(shù)據(jù)處理裝置的示意圖,如圖2所示,該裝置包括獲取單元10,分類單元20和建模單元30,其中,獲取單元,用于獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶的屬性參數(shù)及用電用戶對(duì)應(yīng)的用電行為參數(shù);分類單元,用于將用電數(shù)據(jù)庫中的用電用戶分為竊電用戶和不竊電用戶;建模單元,用于根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模,得到竊電用戶的竊電行為模型和不竊電用戶的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶的竊電期望值之間的關(guān)系。
該實(shí)施例通過獲取單元,用于獲取用電數(shù)據(jù)庫中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶的屬性參數(shù)及用電用戶對(duì)應(yīng)的用電行為參數(shù);分類單元,用于將用電數(shù)據(jù)庫中的用電用戶分為竊電用戶和不竊電用戶;建模單元,用于根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模,得到竊電用戶的竊電行為模型和不竊電用戶的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶的竊電期望值之間的關(guān)系,解決了相關(guān)技術(shù)中預(yù)計(jì)用戶的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問題,進(jìn)而實(shí)現(xiàn)了更準(zhǔn)確地預(yù)計(jì)用戶的竊電行為的技術(shù)效果。
進(jìn)一步地,用電數(shù)據(jù)庫中包括多張數(shù)據(jù)表,每張數(shù)據(jù)表包括用電用戶的至少一種屬性參數(shù)和至少一種用電行為參數(shù),獲取單元包括:判斷模塊,用于分別判斷每張數(shù)據(jù)表中每個(gè)種類的屬性參數(shù)或用電行為參數(shù)的表格值是缺失值或無效值的數(shù)量是否超過預(yù)設(shè)數(shù)量;刪除模塊,用于如果判斷結(jié)果為是,則將對(duì)應(yīng)種類的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除。
進(jìn)一步地,該裝置還包括:判斷單元,用于在將對(duì)應(yīng)種類的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除之后,判斷用電數(shù)據(jù)庫中是否存在變量內(nèi)容相同的屬性參數(shù)或用電行為參數(shù);合并單元,用于如果判斷結(jié)果為是,則將變量內(nèi)容相同的屬性參數(shù)或用電行為參數(shù)進(jìn)行合并。
進(jìn)一步地,建模單元包括:建模模塊,用于采用多種模型對(duì)竊電用戶的竊電行為和不竊電用戶的竊電行為進(jìn)行建模;測試模塊,用于根據(jù)測試樣本集對(duì)每種模型的建模結(jié)果進(jìn)行測試,以確定誤差最小的模型種類。
上述的裝置可以包括處理器和存儲(chǔ)器,上述單元均可以作為程序單元存儲(chǔ)在存儲(chǔ)器中,由處理器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的上述程序單元來實(shí)現(xiàn)相應(yīng)的功能。
存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(rom)或閃存(flashram),存儲(chǔ)器包括至少一個(gè)存儲(chǔ)芯片。
上述本申請(qǐng)實(shí)施例的順序不代表實(shí)施例的優(yōu)劣。
在本申請(qǐng)的上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過其它的方式實(shí)現(xiàn)。
其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。
另外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:u盤、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述僅是本申請(qǐng)的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本申請(qǐng)?jiān)淼那疤嵯拢€可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本申請(qǐng)的保護(hù)范圍。