1.一種挖掘潛在客戶的方法,其特征在于,所述方法包括:
獲取商家的樣本客戶的各個(gè)屬性標(biāo)簽,并計(jì)算所述樣本客戶的各個(gè)屬性標(biāo)簽的集中度,以及所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;
將所述樣本客戶的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)所述屬性標(biāo)簽組合的集中度;
根據(jù)每個(gè)所述屬性標(biāo)簽組合的集中度,以及組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)所述屬性標(biāo)簽組合中選擇所述樣本客戶的挖掘?qū)傩詷?biāo)簽,并計(jì)算所述樣本客戶的各個(gè)所述挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重;
根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)所述樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群;
獲取新客戶的各個(gè)屬性標(biāo)簽,并根據(jù)所述新客戶的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)所述客戶社群中的所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶屬于每個(gè)所述客戶社群的概率;
當(dāng)所述新客戶屬于每個(gè)所述客戶社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定所述新客戶是所述商家的潛在客戶。
2.如權(quán)利要求1所述的方法,其特征在于,所述屬性值域的權(quán)重包括:屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
3.如權(quán)利要求2所述的方法,其特征在于,計(jì)算所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重,包括:
判斷所述樣本客戶的各個(gè)屬性標(biāo)簽的類(lèi)別;
如果所述樣本客戶的某屬性標(biāo)簽是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重;
如果所述樣本客戶的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)方 法對(duì)所述樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
4.如權(quán)利要求3所述的方法,其特征在于,所述預(yù)設(shè)權(quán)重計(jì)算公式為:
其中,對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的所有屬性值的總個(gè)數(shù);對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
5.如權(quán)利要求2所述的方法,其特征在于,將所述樣本客戶的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,包括:
將所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到所述樣本客戶的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽;
將所述樣本客戶的小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)所述屬性標(biāo)簽組合。
6.如權(quán)利要求5所述的方法,其特征在于,計(jì)算所述樣本客戶的各個(gè)所述挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,包括:
判斷組成所述樣本客戶的各個(gè)所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別;
如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重;
如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別 一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)方法對(duì)所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重;
如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則采用自組織映射SOM聚類(lèi)方法對(duì)所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
7.如權(quán)利要求2所述的方法,其特征在于,根據(jù)每個(gè)所述屬性標(biāo)簽組合的集中度,以及組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)所述屬性標(biāo)簽組合中選擇所述樣本客戶的挖掘?qū)傩詷?biāo)簽,包括:
將每個(gè)所述屬性標(biāo)簽組合的集中度,分別與組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
如果某個(gè)所述屬性標(biāo)簽組合的集中度大于組成某個(gè)所述屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合能夠作為所述樣本客戶的所述挖掘?qū)傩詷?biāo)簽;
如果某個(gè)所述屬性標(biāo)簽組合的集中度小于等于組成某個(gè)所述屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合不能夠作為所述樣本客戶的所述挖掘?qū)傩詷?biāo)簽。
8.如權(quán)利要求2所述的方法,其特征在于,根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)所述樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群,包括:
從所有的所述樣本客戶中隨機(jī)選擇一個(gè)所述樣本客戶,根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的所述樣本客戶與其他各個(gè)所述樣本客戶之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他所述樣本客戶,并將連接權(quán)重 最大的一個(gè)其他所述樣本客戶與隨機(jī)選擇的所述樣本客戶組成待定客戶社群;
根據(jù)預(yù)設(shè)聚合公式,計(jì)算所述待定客戶社群之外的其他所述樣本客戶與所述待定客戶社群的聚合效應(yīng),根據(jù)所述待定客戶社群之外的其他所述樣本客戶與待定客戶社群的聚合效應(yīng),確定是否將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群;
從所述客戶社群之外的所述樣本客戶中隨機(jī)選擇一個(gè)所述樣本客戶,然后執(zhí)行計(jì)算隨機(jī)選擇的所述樣本客戶與其他各個(gè)所述樣本客戶之間的連接權(quán)重的步驟。
9.如權(quán)利要求8所述的方法,其特征在于,所述預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的所述樣本客戶v的連接權(quán)重最大的一個(gè)其他所述樣本客戶,Ev-connect表示隨機(jī)選擇的所述樣本客戶v與隨機(jī)選擇的所述樣本客戶v有共同屬性值的任一所述樣本客戶的連接權(quán)重。
10.如權(quán)利要求9所述的方法,其特征在于,所述預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶v與所述待定客戶社群中的其他所述樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶v與所述待定客戶社群之外的其他所述樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示所述待定客戶社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶v與所述客戶社群中的其他所述樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶v與所述客戶社群之外的其他所述樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示所述客戶社群的聚合效應(yīng)值。
11.如權(quán)利要求10所述的方法,其特征在于,根據(jù)所述待定客戶社群之外的其他所述樣本客戶與所述待定客戶社群的聚合效應(yīng),確定是否將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群,包括:
將所述待定客戶社群的聚合效應(yīng)值與所述客戶社群的聚合效應(yīng)值進(jìn)行比較;
如果所述客戶社群的聚合效應(yīng)值大于所述待定客戶社群的聚合效應(yīng)值,則確定將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群;
如果所述客戶社群的聚合效應(yīng)值小于等于所述待定客戶社群的聚合效應(yīng)值,則確定不將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群。
12.如權(quán)利要求2所述的方法,其特征在于,按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶屬于每個(gè)所述客戶社群的概率之后,還包括:
將所述新客戶屬于每個(gè)所述客戶社群的概率進(jìn)行比較,得到所述新客戶屬于所述客戶社群的最大概率;
確定所述新客戶屬于最大概率對(duì)應(yīng)的所述客戶社群;
更新所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
13.如權(quán)利要求12所述的方法,其特征在于,所述預(yù)設(shè)概率公式如下:
其中,Y表示所述新客戶的屬性標(biāo)簽,yi表示所述新客戶的屬性標(biāo)簽的第i個(gè)屬性值,n表示所述新客戶的屬性標(biāo)簽有n個(gè)屬性值,B表示任一所述客戶社群。
14.如權(quán)利要求2所述的方法,其特征在于,確定所述新客戶是所述商家的潛在客戶之后,還包括:
獲取所述商家的反饋信息;其中,所述反饋信息包括確定的某所述新客戶是所述商家的潛在客戶不正確、和/或原來(lái)的某所述樣本客戶當(dāng)前不符合所述商家的客戶標(biāo)準(zhǔn);
根據(jù)所述商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)所述樣本客戶或所述新客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正, 并根據(jù)所述商家的反饋信息,對(duì)所述客戶社群進(jìn)行矯正。
15.如權(quán)利要求14所述的方法,其特征在于,所述預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示所述樣本客戶或所述新客戶的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶社群中的權(quán)重;表示所述樣本客戶或所述新客戶的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶社群中的權(quán)重;表示所述樣本客戶或所述新客戶的矯正后的屬性標(biāo)簽A在矯正前的所述客戶社群中的權(quán)重。
16.一種挖掘潛在客戶的裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取商家的樣本客戶的各個(gè)屬性標(biāo)簽,并計(jì)算所述樣本客戶的各個(gè)屬性標(biāo)簽的集中度,以及所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;
組合計(jì)算模塊,用于將所述樣本客戶的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)所述屬性標(biāo)簽組合的集中度;
確定計(jì)算模塊,用于根據(jù)每個(gè)所述屬性標(biāo)簽組合的集中度,以及組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)所述屬性標(biāo)簽組合中選擇所述樣本客戶的挖掘?qū)傩詷?biāo)簽,并計(jì)算所述樣本客戶的各個(gè)所述挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重;
劃分模塊,用于根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)所述樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群;
概率計(jì)算模塊,用于獲取新客戶的各個(gè)屬性標(biāo)簽,并根據(jù)所述新客戶的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)所述客戶社群中的所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶屬于每個(gè)所述客戶社群的概率;
潛在客戶確定模塊,用于當(dāng)所述新客戶屬于每個(gè)所述客戶社群的概率中 存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定所述新客戶是所述商家的潛在客戶。
17.如權(quán)利要求16所述的裝置,其特征在于,所述屬性值域的權(quán)重包括:屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
18.如權(quán)利要求17所述的裝置,其特征在于,所述獲取模塊包括:
第一判斷單元,用于判斷所述樣本客戶的各個(gè)屬性標(biāo)簽的類(lèi)別;
第一計(jì)算單元,用于如果所述樣本客戶的某屬性標(biāo)簽是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重;
第二計(jì)算單元,用于如果所述樣本客戶的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)所述樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
19.如權(quán)利要求18所述的裝置,其特征在于,所述預(yù)設(shè)權(quán)重計(jì)算公式為:
其中,對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的所有屬性值的總個(gè)數(shù);對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
20.如權(quán)利要求17所述的裝置,其特征在于,所述組合計(jì)算模塊包括:
第一比較單元,用于將所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到所述樣本客戶的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于所述預(yù)設(shè)權(quán)重閾值的多個(gè) 屬性標(biāo)簽;
組合單元,用于將所述樣本客戶的小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)所述屬性標(biāo)簽組合。
21.如權(quán)利要求20所述的裝置,其特征在于,所述確定計(jì)算模塊還包括:
第二判斷單元,用于判斷組成所述樣本客戶的各個(gè)所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別;
第三計(jì)算單元,用于如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重;
第四計(jì)算單元,用于如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重;
第五計(jì)算單元,用于如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則采用自組織映射SOM聚類(lèi)裝置對(duì)所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
22.如權(quán)利要求17所述的裝置,其特征在于,所述確定計(jì)算模塊包括:
第二比較單元,用于將每個(gè)所述屬性標(biāo)簽組合的集中度,分別與組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
第一確定單元,用于如果某個(gè)所述屬性標(biāo)簽組合的集中度大于組成某個(gè)所述屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合能夠作為所述樣本客戶的所述挖掘?qū)傩詷?biāo)簽;
第二確定單元,用于如果某個(gè)所述屬性標(biāo)簽組合的集中度小于等于組成某個(gè)所述屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽 組合不能夠作為所述樣本客戶的所述挖掘?qū)傩詷?biāo)簽。
23.如權(quán)利要求17所述的裝置,其特征在于,所述劃分模塊包括:
選擇單元,用于從所有的所述樣本客戶中隨機(jī)選擇一個(gè)所述樣本客戶,根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的所述樣本客戶與其他各個(gè)所述樣本客戶之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他所述樣本客戶,并將連接權(quán)重最大的一個(gè)其他所述樣本客戶與隨機(jī)選擇的所述樣本客戶組成待定客戶社群;
第三確定單元,用于根據(jù)預(yù)設(shè)聚合公式,計(jì)算所述待定客戶社群之外的其他所述樣本客戶與所述待定客戶社群的聚合效應(yīng),根據(jù)所述待定客戶社群之外的其他所述樣本客戶與待定客戶社群的聚合效應(yīng),確定是否將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群;
通知單元,用于從所述客戶社群之外的所述樣本客戶中隨機(jī)選擇一個(gè)所述樣本客戶,然后通知所述選擇單元執(zhí)行計(jì)算隨機(jī)選擇的所述樣本客戶與其他各個(gè)所述樣本客戶之間的連接權(quán)重的步驟。
24.如權(quán)利要求23所述的裝置,其特征在于,所述預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的所述樣本客戶v的連接權(quán)重最大的一個(gè)其他所述樣本客戶,Ev-connect表示隨機(jī)選擇的所述樣本客戶v與隨機(jī)選擇的所述樣本客戶v有共同屬性值的任一所述樣本客戶的連接權(quán)重。
25.如權(quán)利要求24所述的裝置,其特征在于,所述預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶v與所述待定客戶社群中的其他所述樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶v與所述待定客戶社群之外的其他所述樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示所 述待定客戶社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶v與所述客戶社群中的其他所述樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶v與所述客戶社群之外的其他所述樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示所述客戶社群的聚合效應(yīng)值。
26.如權(quán)利要求25所述的裝置,其特征在于,所述第三確定單元包括:
比較子單元,用于將所述待定客戶社群的聚合效應(yīng)值與所述客戶社群的聚合效應(yīng)值進(jìn)行比較;
第一確定子單元,用于如果所述客戶社群的聚合效應(yīng)值大于所述待定客戶社群的聚合效應(yīng)值,則確定將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群;
第二確定子單元,用于如果所述客戶社群的聚合效應(yīng)值小于等于所述待定客戶社群的聚合效應(yīng)值,則確定不將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群。
27.如權(quán)利要求17所述的裝置,其特征在于,所述裝置還包括:
比較模塊,用于按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶屬于每個(gè)所述客戶社群的概率之后,將所述新客戶屬于每個(gè)所述客戶社群的概率進(jìn)行比較,得到所述新客戶屬于所述客戶社群的最大概率;
確定模塊,用于確定所述新客戶屬于最大概率對(duì)應(yīng)的所述客戶社群;
更新模塊,用于更新所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
28.如權(quán)利要求27所述的裝置,其特征在于,所述預(yù)設(shè)概率公式如下:
其中,Y表示所述新客戶的屬性標(biāo)簽,yi表示所述新客戶的屬性標(biāo)簽的第i個(gè)屬性值,n表示所述新客戶的屬性標(biāo)簽有n個(gè)屬性值,B表示任一所述客戶社群。
29.如權(quán)利要求17所述的裝置,其特征在于,所述裝置還包括:
反饋模塊,用于確定所述新客戶是所述商家的潛在客戶之后,獲取所述 商家的反饋信息;其中,所述反饋信息包括確定的某所述新客戶是所述商家的潛在客戶不正確、和/或原來(lái)的某所述樣本客戶當(dāng)前不符合所述商家的客戶標(biāo)準(zhǔn);
矯正模塊,用于根據(jù)所述商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)所述樣本客戶或所述新客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,并根據(jù)所述商家的反饋信息,對(duì)所述客戶社群進(jìn)行矯正。
30.如權(quán)利要求29所述的裝置,其特征在于,所述預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示所述樣本客戶或所述新客戶的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶社群中的權(quán)重;表示所述樣本客戶或所述新客戶的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶社群中的權(quán)重;表示所述樣本客戶或所述新客戶的矯正后的屬性標(biāo)簽A在矯正前的所述客戶社群中的權(quán)重。