本發(fā)明涉及電力技術(shù)領(lǐng)域,更具體地說(shuō),涉及一種關(guān)聯(lián)度計(jì)算方法及裝置。
背景技術(shù):
近年來(lái),隨著電力業(yè)務(wù)的不斷發(fā)展,國(guó)家電網(wǎng)公司積累了大量的電力客戶。傳統(tǒng)的電力客戶管理模式主要是對(duì)客戶進(jìn)行單點(diǎn)服務(wù),較少關(guān)注客戶之間的相關(guān)性,這就會(huì)導(dǎo)致公司對(duì)于客戶信息把握不全面并且工作效率低下。
目前,對(duì)電力客戶之間關(guān)聯(lián)性主要是專家利用自身經(jīng)驗(yàn)人為度量,但是,隨著業(yè)務(wù)規(guī)模擴(kuò)大,電力數(shù)據(jù)也在不斷增加,這種人為識(shí)別的方式所需的工作量和工作難度會(huì)大大增加。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提供關(guān)聯(lián)度計(jì)算方法及裝置,以解決現(xiàn)有人為識(shí)別電力客戶之間關(guān)聯(lián)性所需的工作量和工作難度會(huì)大大增加的問(wèn)題。技術(shù)方案如下:
一種關(guān)聯(lián)度計(jì)算方法,包括:
從后臺(tái)數(shù)據(jù)庫(kù)中調(diào)取至少兩個(gè)用電客戶的電力數(shù)據(jù),并從各個(gè)所述用電客戶中確定一個(gè)目標(biāo)客戶和至少一個(gè)對(duì)比客戶,所述電力數(shù)據(jù)包括客戶信息以及客戶用電信息;
針對(duì)每一個(gè)所述對(duì)比客戶,根據(jù)對(duì)比客戶信息和目標(biāo)客戶信息計(jì)算單因子匹配相似度,同時(shí),根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息計(jì)算多因子復(fù)合相似度;
針對(duì)每一個(gè)所述對(duì)比客戶,根據(jù)所述單因子匹配相似度和所述多因子復(fù)合相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算與所述目標(biāo)客戶之間的關(guān)聯(lián)度。
優(yōu)選的,所述根據(jù)對(duì)比客戶信息和目標(biāo)客戶信息計(jì)算單因子匹配相似度,包括:
分別從對(duì)比客戶信息和目標(biāo)客戶信息中獲取對(duì)比客戶指標(biāo)集合和目標(biāo)客戶指標(biāo)集合;
分別解析所述對(duì)比客戶指標(biāo)集合和所述目標(biāo)客戶指標(biāo)集合中包含的各個(gè)指標(biāo),得到對(duì)應(yīng)的指標(biāo)類型,所述指標(biāo)類型為純文本型、具有層次性結(jié)構(gòu)的文本型或數(shù)值型;
根據(jù)所述指標(biāo)類型對(duì)所述對(duì)比客戶指標(biāo)集合進(jìn)行劃分,得到對(duì)比客戶純文本型指標(biāo)集合、對(duì)比客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和對(duì)比客戶數(shù)值型指標(biāo)集合,同時(shí),根據(jù)所述指標(biāo)類型對(duì)所述目標(biāo)客戶指標(biāo)集合進(jìn)行劃分,得到目標(biāo)客戶純文本型指標(biāo)集合、目標(biāo)客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和目標(biāo)客戶數(shù)值型指標(biāo)集合;
計(jì)算所述對(duì)比客戶純文本型指標(biāo)集合和所述目標(biāo)客戶純文本型指標(biāo)集合的文本相似度,并判斷所述文本相似度是否為0;
當(dāng)所述文本相似度為0時(shí),確定單因子匹配相似度為0;
當(dāng)所述文本相似度不為0時(shí),計(jì)算所述對(duì)比客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和所述目標(biāo)客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合的層級(jí)相似度,并判斷所述層級(jí)相似度是為0;
當(dāng)所述層級(jí)相似度為0時(shí),將所述文本相似度確定為單因子匹配相似度;
當(dāng)所述層級(jí)相似度不為0時(shí),計(jì)算所述對(duì)比客戶數(shù)值型指標(biāo)集合和所述目標(biāo)客戶數(shù)值型指標(biāo)集合的數(shù)值相似度;
根據(jù)所述文本相似度、所述層級(jí)相似度和所述數(shù)值相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算單因子匹配相似度。
優(yōu)選的,所述根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息計(jì)算多因子復(fù)合相似度,包括:
根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息判斷所述對(duì)比客戶和所述目標(biāo)客戶是否屬于同一用電類別客戶;
當(dāng)所述對(duì)比客戶和所述目標(biāo)客戶不屬于同一用電類別客戶時(shí),確定多因子復(fù)合相似度為0;
當(dāng)所述對(duì)比客戶和所述目標(biāo)客戶屬于同一用電類別客戶時(shí),從所述對(duì)比客戶用電信息中獲取所述對(duì)比客戶的對(duì)比用電量信息以及對(duì)比信用信息,同時(shí),從所述目標(biāo)客戶用電信息中獲取所述目標(biāo)客戶的目標(biāo)用電量信息以及目標(biāo)信用信息;
根據(jù)所述對(duì)比用電量信息和所述目標(biāo)用電量信息計(jì)算用電維度相似度,同時(shí),根據(jù)所述對(duì)比信用信息和所述目標(biāo)信用信息確定信用維度相似度;
根據(jù)所述用電維度相似度和所述信用維度相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算多因子復(fù)合相似度。
優(yōu)選的,所述根據(jù)所述對(duì)比用電量信息和所述目標(biāo)用電量信息計(jì)算用電維度相似度,包括:
分別從所述對(duì)比用電量信息和所述目標(biāo)用電量信息中獲取對(duì)比用電量指標(biāo)值集合和目標(biāo)用電量指標(biāo)值集合,并生成相應(yīng)的對(duì)比用電曲線和目標(biāo)用電曲線;
針對(duì)所述對(duì)比用電曲線和所述目標(biāo)用電曲線,選取曲線端點(diǎn)和至少一個(gè)曲線采樣點(diǎn),并根據(jù)所述曲線端點(diǎn)的位置值確定各個(gè)所述曲線采樣點(diǎn)的位置值;
根據(jù)所述對(duì)比用電曲線上的各個(gè)所述曲線采樣點(diǎn)的用電量指標(biāo)值和所述目標(biāo)用電曲線上的各個(gè)所述曲線采樣點(diǎn)的用電量指標(biāo)值,計(jì)算曲線數(shù)值相似度;
依據(jù)所述對(duì)比用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值和所述目標(biāo)用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值,計(jì)算曲線形狀相似度;
根據(jù)所述曲線數(shù)值相似度和所述曲線形狀相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算用電維度相似度。
優(yōu)選的,所述依據(jù)所述對(duì)比用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值和所述目標(biāo)用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值,計(jì)算曲線形狀相似度,包括:
根據(jù)所述對(duì)比用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值計(jì)算所述對(duì)比用電曲線的質(zhì)心位置值,同時(shí),根據(jù)所述目標(biāo)用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值計(jì)算所述目標(biāo)用電曲線的質(zhì)心位置值,所述質(zhì)心用于表征曲線中心點(diǎn);
針對(duì)所述對(duì)比用電曲線和所述目標(biāo)用電曲線,根據(jù)對(duì)應(yīng)的各個(gè)所述質(zhì)心向量計(jì)算各個(gè)所述曲線采樣點(diǎn)的質(zhì)心距離增量;
針對(duì)所述對(duì)比用電曲線和所述目標(biāo)用電曲線,依據(jù)對(duì)應(yīng)的各個(gè)所述質(zhì)心距離增量構(gòu)建曲線質(zhì)心增量矩陣;
根據(jù)所述對(duì)比用電曲線的曲線質(zhì)心增量矩陣和所述目標(biāo)用電曲線的曲線質(zhì)心增量矩陣,計(jì)算曲線形狀相似度。
一種關(guān)聯(lián)度計(jì)算裝置,包括:客戶確定模塊、相似度計(jì)算模塊和關(guān)聯(lián)度計(jì)算模塊;
所述客戶確定模塊,用于從后臺(tái)數(shù)據(jù)庫(kù)中調(diào)取至少兩個(gè)用電客戶的電力數(shù)據(jù),并從各個(gè)所述用電客戶中確定一個(gè)目標(biāo)客戶和至少一個(gè)對(duì)比客戶,所述電力數(shù)據(jù)包括客戶信息以及客戶用電信息;
所述相似度計(jì)算模塊,用于針對(duì)每一個(gè)所述對(duì)比客戶,根據(jù)對(duì)比客戶信息和目標(biāo)客戶信息計(jì)算單因子匹配相似度,同時(shí),根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息計(jì)算多因子復(fù)合相似度;
所述關(guān)聯(lián)度計(jì)算模塊,用于針對(duì)每一個(gè)所述對(duì)比客戶,根據(jù)所述單因子匹配相似度和所述多因子復(fù)合相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算與所述目標(biāo)客戶之間的關(guān)聯(lián)度。
優(yōu)選的,所述相似度計(jì)算模塊包括:單因子匹配相似度計(jì)算模塊;所述單因子匹配相似度計(jì)算模塊包括指標(biāo)集合獲取單元、解析單元、指標(biāo)集合劃分單元、文本相似度計(jì)算判斷單元、第一確定單元、層級(jí)相似度計(jì)算判斷單元、第二確定單元、數(shù)值相似度計(jì)算單元和單因子匹配相似度計(jì)算單元;
所述指標(biāo)集合獲取單元,用于分別從對(duì)比客戶信息和目標(biāo)客戶信息中獲取對(duì)比客戶指標(biāo)集合和目標(biāo)客戶指標(biāo)集合;
所述解析單元,用于分別解析所述對(duì)比客戶指標(biāo)集合和所述目標(biāo)客戶指標(biāo)集合中包含的各個(gè)指標(biāo),得到對(duì)應(yīng)的指標(biāo)類型,所述指標(biāo)類型為純文本型、具有層次性結(jié)構(gòu)的文本型或數(shù)值型;
所述指標(biāo)集合劃分單元,用于根據(jù)所述指標(biāo)類型對(duì)所述對(duì)比客戶指標(biāo)集合進(jìn)行劃分,得到對(duì)比客戶純文本型指標(biāo)集合、對(duì)比客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和對(duì)比客戶數(shù)值型指標(biāo)集合,同時(shí),根據(jù)所述指標(biāo)類型對(duì)所述目標(biāo)客戶指標(biāo)集合進(jìn)行劃分,得到目標(biāo)客戶純文本型指標(biāo)集合、目標(biāo)客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和目標(biāo)客戶數(shù)值型指標(biāo)集合;
所述文本相似度計(jì)算判斷單元,用于計(jì)算所述對(duì)比客戶純文本型指標(biāo)集合和所述目標(biāo)客戶純文本型指標(biāo)集合的文本相似度,并判斷所述文本相似度是否為0;
所述第一確定單元,用于當(dāng)所述文本相似度為0時(shí),確定單因子匹配相似度為0;
所述層級(jí)相似度計(jì)算判斷單元,用于當(dāng)所述文本相似度不為0時(shí),計(jì)算所述對(duì)比客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和所述目標(biāo)客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合的層級(jí)相似度,并判斷所述層級(jí)相似度是為0;
所述第二確定單元,用于當(dāng)所述層級(jí)相似度為0時(shí),將所述文本相似度確定為單因子匹配相似度;
所述數(shù)值相似度計(jì)算單元,用于當(dāng)所述層級(jí)相似度不為0時(shí),計(jì)算所述對(duì)比客戶數(shù)值型指標(biāo)集合和所述目標(biāo)客戶數(shù)值型指標(biāo)集合的數(shù)值相似度;
所述單因子匹配相似度計(jì)算單元,用于根據(jù)所述文本相似度、所述層級(jí)相似度和所述數(shù)值相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算單因子匹配相似度。
優(yōu)選的,所述相似度計(jì)算模塊還包括:多因子復(fù)合相似度計(jì)算模塊;所述多因子復(fù)合相似度計(jì)算模塊包括判斷單元、第三確定單元、信息獲取單元、相似度計(jì)算單元和多因子復(fù)合相似度計(jì)算單元;
所述判斷單元,用于根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息判斷所述對(duì)比客戶和所述目標(biāo)客戶是否屬于同一用電類別客戶;
所述第三確定單元,用于當(dāng)所述對(duì)比客戶和所述目標(biāo)客戶不屬于同一用電類別客戶時(shí),確定多因子復(fù)合相似度為0;
所述信息獲取單元,用于當(dāng)所述對(duì)比客戶和所述目標(biāo)客戶屬于同一用電類別客戶時(shí),從所述對(duì)比客戶用電信息中獲取所述對(duì)比客戶的對(duì)比用電量信息以及對(duì)比信用信息,同時(shí),從所述目標(biāo)客戶用電信息中獲取所述目標(biāo)客戶的目標(biāo)用電量信息以及目標(biāo)信用信息;
所述相似度計(jì)算單元,用于根據(jù)所述對(duì)比用電量信息和所述目標(biāo)用電量信息計(jì)算用電維度相似度,同時(shí),根據(jù)所述對(duì)比信用信息和所述目標(biāo)信用信息確定信用維度相似度;
所述多因子復(fù)合相似度計(jì)算單元,用于根據(jù)所述用電維度相似度和所述信用維度相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算多因子復(fù)合相似度。
優(yōu)選的,所述相似度計(jì)算單元包括:用電維度相似度計(jì)算單元;所述用電維度相似度計(jì)算單元包括用電曲線生成子單元、選取確定子單元、曲線數(shù)值相似度計(jì)算子單元、曲線形狀相似度計(jì)算子單元和用電維度相似度計(jì)算子單元;
所述用電曲線生成子單元,用于分別從所述對(duì)比用電量信息和所述目標(biāo)用電量信息中獲取對(duì)比用電量指標(biāo)值集合和目標(biāo)用電量指標(biāo)值集合,并生成相應(yīng)的對(duì)比用電曲線和目標(biāo)用電曲線;
所述選取確定子單元,用于針對(duì)所述對(duì)比用電曲線和所述目標(biāo)用電曲線,選取曲線端點(diǎn)和至少一個(gè)曲線采樣點(diǎn),并根據(jù)所述曲線端點(diǎn)的位置值確定各個(gè)所述曲線采樣點(diǎn)的位置值;
所述曲線數(shù)值相似度計(jì)算子單元,用于根據(jù)所述對(duì)比用電曲線上的各個(gè)所述曲線采樣點(diǎn)的用電量指標(biāo)值和所述目標(biāo)用電曲線上的各個(gè)所述曲線采樣點(diǎn)的用電量指標(biāo)值,計(jì)算曲線數(shù)值相似度;
所述曲線形狀相似度計(jì)算子單元,用于依據(jù)所述對(duì)比用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值和所述目標(biāo)用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值,計(jì)算曲線形狀相似度;
所述用電維度相似度計(jì)算子單元,用于根據(jù)所述曲線數(shù)值相似度和所述曲線形狀相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算用電維度相似度。
優(yōu)選的,所述曲線形狀相似度計(jì)算子單元包括:質(zhì)心位置值計(jì)算子單元、質(zhì)心距離增量計(jì)算子單元、曲線質(zhì)心增量矩陣構(gòu)建子單元和計(jì)算子單元;
所述質(zhì)心位置值計(jì)算子單元,用于根據(jù)所述對(duì)比用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值計(jì)算所述對(duì)比用電曲線的質(zhì)心位置值,同時(shí),根據(jù)所述目標(biāo)用電曲線上的各個(gè)所述曲線采樣點(diǎn)的位置值計(jì)算所述目標(biāo)用電曲線的質(zhì)心位置值,所述質(zhì)心用于表征曲線中心點(diǎn);
所述質(zhì)心距離增量計(jì)算子單元,用于針對(duì)所述對(duì)比用電曲線和所述目標(biāo)用電曲線,根據(jù)對(duì)應(yīng)的各個(gè)所述質(zhì)心向量計(jì)算各個(gè)所述曲線采樣點(diǎn)的質(zhì)心距離增量;
所述曲線質(zhì)心增量矩陣構(gòu)建子單元,用于針對(duì)所述對(duì)比用電曲線和所述目標(biāo)用電曲線,依據(jù)對(duì)應(yīng)的各個(gè)所述質(zhì)心距離增量構(gòu)建曲線質(zhì)心增量矩陣;
所述計(jì)算子單元,用于根據(jù)所述對(duì)比用電曲線的曲線質(zhì)心增量矩陣和所述目標(biāo)用電曲線的曲線質(zhì)心增量矩陣,計(jì)算曲線形狀相似度。
相較于現(xiàn)有技術(shù),本發(fā)明實(shí)現(xiàn)的有益效果為:
以上本發(fā)明提供的一種關(guān)聯(lián)度計(jì)算方法及裝置,該方法通過(guò)同時(shí)計(jì)算兩個(gè)用電客戶在客戶信息和客戶用電信息兩個(gè)方面的相似度,來(lái)計(jì)算兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例一公開的一種關(guān)聯(lián)度計(jì)算方法流程圖;
圖2為本發(fā)明實(shí)施例二公開的一種關(guān)聯(lián)度計(jì)算方法部分流程圖;
圖3為本發(fā)明實(shí)施例二公開的另一種關(guān)聯(lián)度計(jì)算方法部分流程圖;
圖4為本發(fā)明實(shí)施例二公開的另一種關(guān)聯(lián)度計(jì)算方法部分流程圖;
圖5為本發(fā)明實(shí)施例二公開的另一種關(guān)聯(lián)度計(jì)算方法部分流程圖;
圖6為本發(fā)明實(shí)施例三公開的一種關(guān)聯(lián)度計(jì)算裝置結(jié)構(gòu)示意圖;
圖7為本發(fā)明實(shí)施例四公開的一種關(guān)聯(lián)度計(jì)算裝置部分結(jié)構(gòu)示意圖;
圖8為本發(fā)明實(shí)施例四公開的另一種關(guān)聯(lián)度計(jì)算裝置部分結(jié)構(gòu)示意圖;
圖9為本發(fā)明實(shí)施例四公開的另一種關(guān)聯(lián)度計(jì)算裝置部分結(jié)構(gòu)示意圖;
圖10為本發(fā)明實(shí)施例四公開的另一種關(guān)聯(lián)度計(jì)算裝置部分結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
實(shí)施例一
本發(fā)明實(shí)施例一公開了一種關(guān)聯(lián)度計(jì)算方法,應(yīng)用于關(guān)聯(lián)度計(jì)算裝置,方法流程圖如圖1所示,包括如下步驟:
S101,從后臺(tái)數(shù)據(jù)庫(kù)中調(diào)取至少兩個(gè)用電客戶的電力數(shù)據(jù),并從各個(gè)用電客戶中確定一個(gè)目標(biāo)客戶和至少一個(gè)對(duì)比客戶,所述電力數(shù)據(jù)包括客戶信息以及客戶用電信息;
在執(zhí)行步驟S101的過(guò)程中,在國(guó)家電網(wǎng)公司的后臺(tái)數(shù)據(jù)庫(kù)中可調(diào)取至少兩個(gè)用電客戶的電力數(shù)據(jù),可根據(jù)實(shí)際需要確定相應(yīng)的目標(biāo)客戶,相應(yīng)的,剩余的其他用電客戶為對(duì)比客戶,電力數(shù)據(jù)包括但不局限于客戶信息以及客戶用電信息,其中,客戶信息可包括但不局限于客戶的身份證號(hào)碼、地址、手機(jī)號(hào)碼、開戶時(shí)間、欠費(fèi)金額和繳費(fèi)金額,可根據(jù)實(shí)際需要進(jìn)行選擇,客戶用電信息包括但不局限于客戶的用電量信息和信用信息,可根據(jù)實(shí)際需要進(jìn)行選擇。
S102,針對(duì)每一個(gè)對(duì)比客戶,根據(jù)對(duì)比客戶信息和目標(biāo)客戶信息計(jì)算單因子匹配相似度,同時(shí),根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息計(jì)算多因子復(fù)合相似度;
在執(zhí)行步驟S102的過(guò)程中,針對(duì)每一個(gè)對(duì)比客戶,可根據(jù)對(duì)比客戶信息中包含的指標(biāo),例如,當(dāng)指標(biāo)為身份證號(hào)碼和地址時(shí),分別與目標(biāo)客戶信息中相應(yīng)指標(biāo)進(jìn)行對(duì)比,計(jì)算對(duì)比客戶和目標(biāo)客戶在客戶信息方面的相似度;可根據(jù)對(duì)比客戶用電信息中的包含的指標(biāo),例如,用電量、電費(fèi)、預(yù)付費(fèi)和欠費(fèi)以及目標(biāo)客戶用電信息中相應(yīng)的指標(biāo)計(jì)算對(duì)比客戶和目標(biāo)客戶在用電信息方面的相似度。
S103,針對(duì)每一個(gè)對(duì)比客戶,根據(jù)單因子匹配相似度和多因子復(fù)合相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算與目標(biāo)客戶之間的關(guān)聯(lián)度。
在執(zhí)行步驟S103的過(guò)程中,可根據(jù)實(shí)際需要具體設(shè)置單因子匹配相似度與多因子復(fù)合相似度各自對(duì)應(yīng)的權(quán)重值,并且,兩權(quán)重值之和為1,舉例說(shuō)明,第一客戶相似度對(duì)應(yīng)的權(quán)重值為0.7,第二客戶相似度對(duì)應(yīng)的權(quán)重值為0.3,當(dāng)?shù)谝豢蛻粝嗨贫葹?.5以及第二客戶相似度為0.6時(shí),計(jì)算得到的目標(biāo)客戶之間的關(guān)聯(lián)度為0.5*0.7+0.6*0.3=0.53。
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算方法,通過(guò)同時(shí)計(jì)算兩個(gè)用電客戶在客戶信息和客戶用電信息兩個(gè)方面的相似度,來(lái)計(jì)算兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
實(shí)施例二
基于上述本發(fā)明實(shí)施例一公開的關(guān)聯(lián)度計(jì)算方法,如圖1所示出的步驟S102中,根據(jù)對(duì)比客戶信息和目標(biāo)客戶信息計(jì)算單因子匹配相似度的具體執(zhí)行過(guò)程,如圖2所示,包括如下步驟:
S201,分別從對(duì)比客戶信息和目標(biāo)客戶信息中獲取對(duì)比客戶指標(biāo)集合和目標(biāo)客戶指標(biāo)集合;
S202,分別解析對(duì)比客戶指標(biāo)集合和目標(biāo)客戶指標(biāo)集合中包含的各個(gè)指標(biāo),得到對(duì)應(yīng)的指標(biāo)類型,指標(biāo)類型為純文本型、具有層次性結(jié)構(gòu)的文本型或數(shù)值型;
S203,根據(jù)指標(biāo)類型對(duì)對(duì)比客戶指標(biāo)集合進(jìn)行劃分,得到對(duì)比客戶純文本型指標(biāo)集合、對(duì)比客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和對(duì)比客戶數(shù)值型指標(biāo)集合,同時(shí),根據(jù)指標(biāo)類型對(duì)所述目標(biāo)客戶指標(biāo)集合進(jìn)行劃分,得到目標(biāo)客戶純文本型指標(biāo)集合、目標(biāo)客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和目標(biāo)客戶數(shù)值型指標(biāo)集合;
S204,計(jì)算對(duì)比客戶純文本型指標(biāo)集合和目標(biāo)客戶純文本型指標(biāo)集合的文本相似度,并判斷文本相似度是否為0;
在執(zhí)行步驟S204的過(guò)程中,純文本型的指標(biāo)集合中包含有各個(gè)純文本型指標(biāo),例如,指標(biāo)集合中包含有電話號(hào)碼和身份證號(hào)這兩個(gè)指標(biāo),按照完全匹配法將對(duì)比客戶電話號(hào)碼和目標(biāo)客戶電話號(hào)碼進(jìn)行對(duì)比,同時(shí),將對(duì)比客戶身份證號(hào)和目標(biāo)客戶身份證號(hào)進(jìn)行對(duì)比,如果對(duì)比客戶電話號(hào)碼和目標(biāo)客戶電話號(hào)碼不是完全一致,對(duì)比客戶身份證號(hào)和目標(biāo)客戶身份證號(hào)完全一致,那么,對(duì)比客戶與目標(biāo)客戶在電話號(hào)碼這個(gè)指標(biāo)上的相似度為0,在身份證號(hào)這個(gè)指標(biāo)上的相似度為1,并且,根據(jù)指標(biāo)集合中各個(gè)指標(biāo)所占的權(quán)重,計(jì)算兩個(gè)指標(biāo)集合的文本相似度,例如,電話號(hào)碼這個(gè)指標(biāo)的權(quán)重為0.5,并且,身份證號(hào)這個(gè)指標(biāo)的權(quán)重為0.5,則文本相似度可為0*0.5+1*0.5=0.5。
S205,當(dāng)文本相似度為0時(shí),確定單因子匹配相似度為0;
S206,當(dāng)文本相似度不為0時(shí),計(jì)算對(duì)比客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和目標(biāo)客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合的層級(jí)相似度,并判斷層級(jí)相似度是為0;
在執(zhí)行步驟S206的過(guò)程中,具有層次性結(jié)構(gòu)的文本型指標(biāo)集合中包含有各個(gè)具有層次性結(jié)構(gòu)的指標(biāo),例如,指標(biāo)集合中包含有客戶住址和客戶行業(yè)這兩個(gè)指標(biāo),按照層次法將對(duì)比客戶住址與目標(biāo)客戶住址進(jìn)行對(duì)比,同時(shí),將對(duì)比客戶行業(yè)與目標(biāo)客戶行業(yè)進(jìn)行對(duì)比,具體的,例如,對(duì)比客戶住址為河北省保定市、目標(biāo)客戶住址為河北省保定市蠡縣,則對(duì)比客戶住址與目標(biāo)客戶住址在市這個(gè)層級(jí)是一致的,并且,由于每個(gè)層級(jí)對(duì)應(yīng)的相似度是預(yù)設(shè)的(例如,省層級(jí)的相似度為0.3,市層級(jí)的相似度為0.6,縣層級(jí)的相似度為0.9),則對(duì)比客戶與目標(biāo)客戶在客戶住址這個(gè)指標(biāo)上的相似度為0.6,同理,客戶行業(yè)的對(duì)比過(guò)程也是如此,在此不再贅述,并且,根據(jù)指標(biāo)集合中各個(gè)指標(biāo)所占的權(quán)重,計(jì)算兩個(gè)指標(biāo)集合的文本相似度,例如,對(duì)比客戶與目標(biāo)客戶在客戶行業(yè)這個(gè)指標(biāo)上的相似度為0.6,客戶住址這個(gè)指標(biāo)的權(quán)重為0.3,并且,客戶行業(yè)這個(gè)指標(biāo)的權(quán)重為0.7,則層級(jí)相似度可為0.9*0.3+0.6*0.7=0.69。
S207,當(dāng)層級(jí)相似度為0時(shí),將文本相似度確定為單因子匹配相似度;
S208,當(dāng)層級(jí)相似度不為0時(shí),計(jì)算對(duì)比客戶數(shù)值型指標(biāo)集合和目標(biāo)客戶數(shù)值型指標(biāo)集合的數(shù)值相似度;
在執(zhí)行步驟S208的過(guò)程中,數(shù)值型指標(biāo)集合中包含有各個(gè)數(shù)值型指標(biāo),例如指標(biāo)集合中包含有欠費(fèi)金額和繳費(fèi)金額這兩個(gè)指標(biāo),按照差比法將對(duì)比客戶欠費(fèi)金額與目標(biāo)客戶欠費(fèi)金額進(jìn)行對(duì)比,同時(shí),將對(duì)比客戶繳費(fèi)金額與目標(biāo)客戶繳費(fèi)金額進(jìn)行對(duì)比,具體的,對(duì)比客戶繳費(fèi)金額為7萬(wàn),目標(biāo)客戶繳費(fèi)金額為9萬(wàn),根據(jù)差比法計(jì)算公式可知,對(duì)比客戶與目標(biāo)客戶在繳費(fèi)金額這個(gè)指標(biāo)上的相似度為相應(yīng)的,欠費(fèi)金額的對(duì)比過(guò)程也是如此,并且,根據(jù)指標(biāo)集合中各個(gè)指標(biāo)所占的權(quán)重,計(jì)算兩個(gè)指標(biāo)集合的數(shù)值相似度,例如,對(duì)比客戶與目標(biāo)客戶在繳費(fèi)金額這個(gè)指標(biāo)上的相似度為0.8,對(duì)比客戶與目標(biāo)客戶在欠費(fèi)金額這個(gè)指標(biāo)上的相似度為0.7,繳費(fèi)金額這個(gè)的指標(biāo)的權(quán)重是0.6,并且,欠費(fèi)金額這個(gè)指標(biāo)的權(quán)重為0.4,則數(shù)值相似度可為0.8*0.6+0.6*0.4=0.72。
S209,根據(jù)文本相似度、層級(jí)相似度和數(shù)值相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算單因子匹配相似度;
在執(zhí)行步驟S209的過(guò)程中,例如,文本相似度為0.5、層級(jí)相似度為0.69、數(shù)值相似度為0.72,并且,文本相似度、層級(jí)相似度和數(shù)值相似度分別占的權(quán)重為0.3、0.3和0.4,則第一客戶相似度可為0.5*0.3+0.69*0.3+0.72*0.4=0.645。
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算方法,通過(guò)對(duì)兩個(gè)用電客戶的客戶信息進(jìn)行指標(biāo)分類,再根據(jù)各個(gè)類型的指標(biāo)之間的相似度計(jì)算在客戶信息方面的相似度,再結(jié)合同時(shí)計(jì)算的客戶用電信息的相似度,進(jìn)一步計(jì)算得到兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
基于上述本發(fā)明實(shí)施例一公開的關(guān)聯(lián)度計(jì)算方法,如圖1所示出的步驟S102中,根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息計(jì)算多因子復(fù)合相似度的具體執(zhí)行過(guò)程,如圖3所示,包括如下步驟:
S301,根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息判斷對(duì)比客戶和目標(biāo)客戶是否屬于同一用電類別客戶;
在執(zhí)行步驟S301的過(guò)程中,可根據(jù)對(duì)比客戶用電信息確定對(duì)比客戶所屬的用電類別客戶,同時(shí),根據(jù)目標(biāo)客戶用電信息確定目標(biāo)客戶所屬的用電類型客戶,進(jìn)而判斷對(duì)比客戶與目標(biāo)客戶是否屬于同一用電類別客戶,具體的,用電類型客戶包括但不局限于高壓用電客戶、低壓居民用電客戶和低壓非居民用電客戶。
S302,當(dāng)對(duì)比客戶和目標(biāo)客戶不屬于同一用電類別客戶時(shí),確定多因子復(fù)合相似度為0;
S303,當(dāng)對(duì)比客戶和目標(biāo)客戶屬于同一用電類別客戶時(shí),從對(duì)比客戶用電信息中獲取對(duì)比客戶的對(duì)比用電量信息以及對(duì)比信用信息,同時(shí),從目標(biāo)客戶用電信息中獲取目標(biāo)客戶的目標(biāo)用電量信息以及目標(biāo)信用信息;
S304,根據(jù)對(duì)比用電量信息和目標(biāo)用電量信息計(jì)算用電維度相似度,同時(shí),根據(jù)對(duì)比信用信息和所述目標(biāo)信用信息確定信用維度相似度;
在執(zhí)行步驟S304的過(guò)程中,根據(jù)對(duì)比信用信息和目標(biāo)信用信息確定信用維度相似度,其中,信用信息中可包含客戶的信用等級(jí),以信用等級(jí)舉例,若對(duì)比用戶的信用等級(jí)為優(yōu),目標(biāo)用戶的信用等級(jí)為良,由于信用等級(jí)對(duì)應(yīng)關(guān)系的相似度為預(yù)設(shè)的(例如,優(yōu)與優(yōu)、良與良、差與差的相似度均為1,優(yōu)與良的相似度為0.5、優(yōu)與差的相似度為0),則該對(duì)比用戶與目標(biāo)用戶在信用維度的相似度為0.5。
305,根據(jù)用電維度相似度和信用維度相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算多因子復(fù)合相似度。
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算方法,通過(guò)根據(jù)兩個(gè)用電客戶的用電信息獲取用電量信息和信用信息,并根據(jù)各自的用電量信息和信用信息計(jì)算在客戶用電信息發(fā)面的相似度,同時(shí),結(jié)合在客戶信息方面的相似度,進(jìn)一步計(jì)算得到兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
基于上述本發(fā)明實(shí)施例二公開的關(guān)聯(lián)度計(jì)算方法,如圖3所示出的步驟S304中,根據(jù)對(duì)比用電量信息和目標(biāo)用電量信息計(jì)算用電維度相似度的具體執(zhí)行過(guò)程,如圖4所示,包括如下步驟:
S401,分別從對(duì)比用電量信息和目標(biāo)用電量信息中獲取對(duì)比用電量指標(biāo)值集合和目標(biāo)用電量指標(biāo)值集合,并生成相應(yīng)的對(duì)比用電曲線和目標(biāo)用電曲線;
S402,針對(duì)對(duì)比用電曲線和目標(biāo)用電曲線,選取曲線端點(diǎn)和至少一個(gè)曲線采樣點(diǎn),并根據(jù)曲線端點(diǎn)的位置值確定各個(gè)曲線采樣點(diǎn)的位置值;
在執(zhí)行步驟S402的過(guò)程中,由于根據(jù)用電量指標(biāo)值集合中的各個(gè)用電量指標(biāo)值生成的用電曲線是開口曲線,則會(huì)有兩個(gè)端點(diǎn),例如,端點(diǎn)A和端點(diǎn)B,確定距離線段AB最遠(yuǎn)的極值點(diǎn),以及該極值點(diǎn)在線段AB上的投影點(diǎn),并選取距離該投影點(diǎn)最近的端點(diǎn)作為曲線端點(diǎn),并且,如果兩個(gè)端點(diǎn)與投影點(diǎn)的距離一致,則任選一個(gè)端點(diǎn)作為曲線端點(diǎn)。
需要說(shuō)明的是,對(duì)比用電曲線和目標(biāo)用電曲線上的曲線采樣點(diǎn)數(shù)量是一致的,并且數(shù)量可根據(jù)數(shù)據(jù)需要進(jìn)行設(shè)置。
S403,根據(jù)對(duì)比用電曲線上的各個(gè)曲線采樣點(diǎn)的用電量指標(biāo)值和目標(biāo)用電曲線上的各個(gè)曲線采樣點(diǎn)的用電量指標(biāo)值,計(jì)算曲線數(shù)值相似度;
在執(zhí)行步驟S403的過(guò)程中,舉例說(shuō)明,對(duì)比用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值的集合為A=[a1,a2,a3,…,an],目標(biāo)用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值的集合為B=[b1,b2,b3,…,bn],可選取兩向量的余弦值作為曲線形狀相似度,余弦值的計(jì)算公式如下:則相應(yīng)也計(jì)算出曲線形狀相似度。
S404,依據(jù)對(duì)比用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值和目標(biāo)用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值,計(jì)算曲線形狀相似度;
S405,根據(jù)曲線數(shù)值相似度和曲線形狀相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算用電維度相似度。
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算方法,通過(guò)根據(jù)兩個(gè)用電客戶的用電信息獲取用電量信息和信用信息,并根據(jù)各自的用電量信息和信用信息計(jì)算在客戶用電信息發(fā)面的相似度,同時(shí),結(jié)合在客戶信息方面的相似度,進(jìn)一步計(jì)算得到兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
基于上述本發(fā)明實(shí)施例二公開的關(guān)聯(lián)度計(jì)算方法,如圖4所示出的步驟S404中,依據(jù)對(duì)比用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值和目標(biāo)用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值,計(jì)算曲線形狀相似度的具體執(zhí)行過(guò)程,如圖5所示,包括如下步驟:
S501,根據(jù)對(duì)比用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值計(jì)算對(duì)比用電曲線的質(zhì)心位置值,同時(shí),根據(jù)目標(biāo)用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值計(jì)算目標(biāo)用電曲線的質(zhì)心位置值,質(zhì)心用于表征曲線中心點(diǎn);
在執(zhí)行步驟S501的過(guò)程中,舉例說(shuō)明,Pi表示對(duì)比用電曲線上的曲線采樣點(diǎn)的位置值,則對(duì)比用電曲線的質(zhì)心位置值可表示為
S502,針對(duì)對(duì)比用電曲線和目標(biāo)用電曲線,根據(jù)對(duì)應(yīng)的各個(gè)質(zhì)心向量計(jì)算各個(gè)曲線采樣點(diǎn)的質(zhì)心距離增量;
在執(zhí)行步驟S502的過(guò)程中,舉例說(shuō)明,Pm和Pk為對(duì)比用電曲線上的兩個(gè)曲線采樣點(diǎn),則可通過(guò)計(jì)算曲線采樣點(diǎn)Pm位置值與質(zhì)心位置值W的差值得到曲線采樣點(diǎn)Pm的質(zhì)心向量同時(shí),通過(guò)計(jì)算曲線采樣點(diǎn)Pk位置值與質(zhì)心位置值W的差值得到曲線采樣點(diǎn)Pk的質(zhì)心向量再根據(jù)質(zhì)心向量和計(jì)算曲線采樣點(diǎn)Pm相對(duì)于曲線采樣點(diǎn)Pk的質(zhì)心距離增量其中,θ為質(zhì)心向量和質(zhì)心向量的夾角。
S503,針對(duì)對(duì)比用電曲線和目標(biāo)用電曲線,依據(jù)對(duì)應(yīng)的各個(gè)質(zhì)心距離增量構(gòu)建曲線質(zhì)心增量矩陣;
在執(zhí)行步驟S503的過(guò)程中,以對(duì)比用電曲線舉例說(shuō)明,根據(jù)對(duì)比用電曲線上各個(gè)曲線采樣點(diǎn)相于對(duì)對(duì)比用電曲線上所有曲線采樣點(diǎn)的質(zhì)心距離增量,可得到對(duì)比用電曲線質(zhì)心增量矩陣
S504,根據(jù)對(duì)比用電曲線的曲線質(zhì)心增量矩陣和目標(biāo)用電曲線的曲線質(zhì)心增量矩陣,計(jì)算曲線形狀相似度。
在執(zhí)行步驟S504的過(guò)程中,舉例說(shuō)明,對(duì)比用電曲線L0和目標(biāo)用電曲線用L1各自對(duì)應(yīng)的曲線質(zhì)心增量矩陣分別為FiL0和FiL1,則曲線形狀相似度可通過(guò)如下公式計(jì)算:其中,
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算方法,通過(guò)根據(jù)兩個(gè)用電客戶的用電信息獲取用電量信息和信用信息,并根據(jù)各自的用電量信息和信用信息計(jì)算在客戶用電信息發(fā)面的相似度,同時(shí),結(jié)合在客戶信息方面的相似度,進(jìn)一步計(jì)算得到兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
實(shí)施例三
基于上述本發(fā)明各實(shí)施例公開的關(guān)聯(lián)度計(jì)算方法,本發(fā)明實(shí)施例則對(duì)應(yīng)公開執(zhí)行上述關(guān)聯(lián)度計(jì)算方法的裝置,其結(jié)構(gòu)示意圖如圖6所示,關(guān)聯(lián)度計(jì)算裝置100包括:客戶確定模塊101、相似度計(jì)算模塊102和關(guān)聯(lián)度計(jì)算模塊103;
客戶確定模塊,用于從后臺(tái)數(shù)據(jù)庫(kù)中調(diào)取至少兩個(gè)用電客戶的電力數(shù)據(jù),并從各個(gè)用電客戶中確定一個(gè)目標(biāo)客戶和至少一個(gè)對(duì)比客戶,電力數(shù)據(jù)包括客戶信息以及客戶用電信息;
相似度計(jì)算模塊,用于針對(duì)每一個(gè)對(duì)比客戶,根據(jù)對(duì)比客戶信息和目標(biāo)客戶信息計(jì)算單因子匹配相似度,同時(shí),根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息計(jì)算多因子復(fù)合相似度;
關(guān)聯(lián)度計(jì)算模塊,用于針對(duì)每一個(gè)對(duì)比客戶,根據(jù)單因子匹配相似度和多因子復(fù)合相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算與目標(biāo)客戶之間的關(guān)聯(lián)度。
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算裝置,通過(guò)同時(shí)計(jì)算兩個(gè)用電客戶在客戶信息和客戶用電信息兩個(gè)方面的相似度,來(lái)計(jì)算兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
實(shí)施例四
結(jié)合上述本發(fā)明實(shí)施例三公開的關(guān)聯(lián)度計(jì)算裝置,如圖6所示出的相似度計(jì)算模塊102包括:?jiǎn)我蜃悠ヅ湎嗨贫扔?jì)算模塊1021;單因子匹配相似度計(jì)算模塊1021結(jié)構(gòu)示意圖如圖7所示,包括指標(biāo)集合獲取單元201、解析單元202、指標(biāo)集合劃分單元203、文本相似度計(jì)算判斷單元204、第一確定單元205、層級(jí)相似度計(jì)算判斷單元206、第二確定單元207、數(shù)值相似度計(jì)算單元208和單因子匹配相似度計(jì)算單元209;
指標(biāo)集合獲取單元201,用于分別從對(duì)比客戶信息和目標(biāo)客戶信息中獲取對(duì)比客戶指標(biāo)集合和目標(biāo)客戶指標(biāo)集合;
解析單元202,用于分別解析對(duì)比客戶指標(biāo)集合和目標(biāo)客戶指標(biāo)集合中包含的各個(gè)指標(biāo),得到對(duì)應(yīng)的指標(biāo)類型,指標(biāo)類型為純文本型、具有層次性結(jié)構(gòu)的文本型或數(shù)值型;
指標(biāo)集合劃分單元203,用于根據(jù)指標(biāo)類型對(duì)對(duì)比客戶指標(biāo)集合進(jìn)行劃分,得到對(duì)比客戶純文本型指標(biāo)集合、對(duì)比客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和對(duì)比客戶數(shù)值型指標(biāo)集合,同時(shí),根據(jù)指標(biāo)類型對(duì)目標(biāo)客戶指標(biāo)集合進(jìn)行劃分,得到目標(biāo)客戶純文本型指標(biāo)集合、目標(biāo)客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和目標(biāo)客戶數(shù)值型指標(biāo)集合;
文本相似度計(jì)算判斷單元204,用于計(jì)算對(duì)比客戶純文本型指標(biāo)集合和目標(biāo)客戶純文本型指標(biāo)集合的文本相似度,并判斷文本相似度是否為0;
第一確定單元205,用于當(dāng)文本相似度為0時(shí),確定單因子匹配相似度為0;
層級(jí)相似度計(jì)算判斷單元206,用于當(dāng)文本相似度不為0時(shí),計(jì)算對(duì)比客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合和目標(biāo)客戶具有層次性結(jié)構(gòu)的文本型指標(biāo)集合的層級(jí)相似度,并判斷層級(jí)相似度是為0;
第二確定單元207,用于當(dāng)層級(jí)相似度為0時(shí),將文本相似度確定為單因子匹配相似度;
數(shù)值相似度計(jì)算單元208,用于當(dāng)層級(jí)相似度不為0時(shí),計(jì)算對(duì)比客戶數(shù)值型指標(biāo)集合和目標(biāo)客戶數(shù)值型指標(biāo)集合的數(shù)值相似度;
單因子匹配相似度計(jì)算單元209,用于根據(jù)文本相似度、層級(jí)相似度和數(shù)值相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算單因子匹配相似度。
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算裝置,通過(guò)對(duì)兩個(gè)用電客戶的客戶信息進(jìn)行指標(biāo)分類,再根據(jù)各個(gè)類型的指標(biāo)之間的相似度計(jì)算在客戶信息方面的相似度,再結(jié)合同時(shí)計(jì)算的客戶用電信息的相似度,進(jìn)一步計(jì)算得到兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
結(jié)合上述本發(fā)明實(shí)施例三公開的關(guān)聯(lián)度計(jì)算裝置,如圖6所示出的相似度計(jì)算模塊102還包括:多因子復(fù)合相似度計(jì)算模塊1022;多因子復(fù)合相似度計(jì)算模塊1022結(jié)構(gòu)示意圖如圖8所示,包括判斷單元301、第三確定單元302、信息獲取單元303、相似度計(jì)算單元304和多因子復(fù)合相似度計(jì)算單元305;
判斷單元301,用于根據(jù)對(duì)比客戶用電信息和目標(biāo)客戶用電信息判斷對(duì)比客戶和目標(biāo)客戶是否屬于同一用電類別客戶;
第三確定單元302,用于當(dāng)對(duì)比客戶和目標(biāo)客戶不屬于同一用電類別客戶時(shí),確定多因子復(fù)合相似度為0;
信息獲取單元303,用于當(dāng)對(duì)比客戶和目標(biāo)客戶屬于同一用電類別客戶時(shí),從對(duì)比客戶用電信息中獲取對(duì)比客戶的對(duì)比用電量信息以及對(duì)比信用信息,同時(shí),從目標(biāo)客戶用電信息中獲取目標(biāo)客戶的目標(biāo)用電量信息以及目標(biāo)信用信息;
相似度計(jì)算單元304,用于根據(jù)對(duì)比用電量信息和目標(biāo)用電量信息計(jì)算用電維度相似度,同時(shí),根據(jù)對(duì)比信用信息和目標(biāo)信用信息確定信用維度相似度;
多因子復(fù)合相似度計(jì)算單元305,用于根據(jù)用電維度相似度和信用維度相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算多因子復(fù)合相似度。
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算裝置,通過(guò)根據(jù)兩個(gè)用電客戶的用電信息獲取用電量信息和信用信息,并根據(jù)各自的用電量信息和信用信息計(jì)算在客戶用電信息發(fā)面的相似度,同時(shí),結(jié)合在客戶信息方面的相似度,進(jìn)一步計(jì)算得到兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
結(jié)合上述本發(fā)明實(shí)施例三公開的關(guān)聯(lián)度計(jì)算裝置,如圖8所示出的相似度計(jì)算單元304包括:用電維度相似度計(jì)算單元3041;用電維度相似度計(jì)算單元3041結(jié)構(gòu)示意圖如圖9所示,包括用電曲線生成子單元401、選取確定子單元402、曲線數(shù)值相似度計(jì)算子單元403、曲線形狀相似度計(jì)算子單元404和用電維度相似度計(jì)算子單元405;
用電曲線生成子單元401,用于分別從對(duì)比用電量信息和目標(biāo)用電量信息中獲取對(duì)比用電量指標(biāo)值集合和目標(biāo)用電量指標(biāo)值集合,并生成相應(yīng)的對(duì)比用電曲線和目標(biāo)用電曲線;
選取確定子單元402,用于針對(duì)對(duì)比用電曲線和目標(biāo)用電曲線,選取曲線端點(diǎn)和至少一個(gè)曲線采樣點(diǎn),并根據(jù)曲線端點(diǎn)的位置值確定各個(gè)曲線采樣點(diǎn)的位置值;
曲線數(shù)值相似度計(jì)算子單元403,用于根據(jù)對(duì)比用電曲線上的各個(gè)曲線采樣點(diǎn)的用電量指標(biāo)值和目標(biāo)用電曲線上的各個(gè)曲線采樣點(diǎn)的用電量指標(biāo)值,計(jì)算曲線數(shù)值相似度;
曲線形狀相似度計(jì)算子單元404,用于依據(jù)對(duì)比用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值和目標(biāo)用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值,計(jì)算曲線形狀相似度;
用電維度相似度計(jì)算子單元405,用于根據(jù)曲線數(shù)值相似度和曲線形狀相似度及其各自對(duì)應(yīng)的權(quán)重值,計(jì)算用電維度相似度。
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算裝置,通過(guò)根據(jù)兩個(gè)用電客戶的用電信息獲取用電量信息和信用信息,并根據(jù)各自的用電量信息和信用信息計(jì)算在客戶用電信息發(fā)面的相似度,同時(shí),結(jié)合在客戶信息方面的相似度,進(jìn)一步計(jì)算得到兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
結(jié)合上述本發(fā)明實(shí)施例三公開的關(guān)聯(lián)度計(jì)算裝置,如圖9所示出的曲線形狀相似度計(jì)算子單元404的結(jié)構(gòu)示意圖如圖10所示,包括:質(zhì)心位置值計(jì)算子單元501、質(zhì)心距離增量計(jì)算子單元502、曲線質(zhì)心增量矩陣構(gòu)建子單元503和計(jì)算子單元504;
質(zhì)心位置值計(jì)算子單元501,用于根據(jù)對(duì)比用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值計(jì)算對(duì)比用電曲線的質(zhì)心位置值,同時(shí),根據(jù)目標(biāo)用電曲線上的各個(gè)曲線采樣點(diǎn)的位置值計(jì)算目標(biāo)用電曲線的質(zhì)心位置值,質(zhì)心用于表征曲線中心點(diǎn);
質(zhì)心距離增量計(jì)算子單元502,用于針對(duì)對(duì)比用電曲線和目標(biāo)用電曲線,根據(jù)對(duì)應(yīng)的各個(gè)質(zhì)心向量計(jì)算各個(gè)曲線采樣點(diǎn)的質(zhì)心距離增量;
曲線質(zhì)心增量矩陣構(gòu)建子單元503,用于針對(duì)對(duì)比用電曲線和目標(biāo)用電曲線,依據(jù)對(duì)應(yīng)的各個(gè)質(zhì)心距離增量構(gòu)建曲線質(zhì)心增量矩陣;
計(jì)算子單元504,用于根據(jù)對(duì)比用電曲線的曲線質(zhì)心增量矩陣和目標(biāo)用電曲線的曲線質(zhì)心增量矩陣,計(jì)算曲線形狀相似度。
本發(fā)明實(shí)施例公開的關(guān)聯(lián)度計(jì)算裝置,通過(guò)根據(jù)兩個(gè)用電客戶的用電信息獲取用電量信息和信用信息,并根據(jù)各自的用電量信息和信用信息計(jì)算在客戶用電信息發(fā)面的相似度,同時(shí),結(jié)合在客戶信息方面的相似度,進(jìn)一步計(jì)算得到兩個(gè)用電客戶之間的關(guān)聯(lián)度,這就實(shí)現(xiàn)了同時(shí)對(duì)大量的電力數(shù)據(jù)進(jìn)行關(guān)聯(lián)性度量,同時(shí),由于從客戶信息和用電信息兩個(gè)方面進(jìn)行了綜合計(jì)算,也保證了計(jì)算的精確度。
以上對(duì)本發(fā)明所提供的一種關(guān)聯(lián)度計(jì)算方法及裝置進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
需要說(shuō)明的是,本說(shuō)明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。對(duì)于實(shí)施例公開的裝置而言,由于其與實(shí)施例公開的方法相對(duì)應(yīng),所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法部分說(shuō)明即可。
還需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備所固有的要素,或者是還包括為這些過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
對(duì)所公開的實(shí)施例的上述說(shuō)明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。