本發(fā)明涉及網(wǎng)絡(luò)通信技術(shù)領(lǐng)域,具體涉及一種挖掘潛在客戶的方法和裝置。
背景技術(shù):
隨著網(wǎng)絡(luò)通信技術(shù)的發(fā)展,越來(lái)越多的商家通過(guò)網(wǎng)上商城售賣(mài)貨品,在商家進(jìn)行促銷(xiāo)的過(guò)程中,十分關(guān)心的一個(gè)問(wèn)題是:如何根據(jù)商家現(xiàn)在已擁有的客戶的信息(比如客戶的年齡、性別、家庭地址等信息),挖掘出潛在的客戶,實(shí)現(xiàn)客戶的精準(zhǔn)觸達(dá)。我們的技術(shù)就是解決這個(gè)問(wèn)題,根據(jù)商家現(xiàn)有會(huì)員數(shù)據(jù),挖掘出其會(huì)員的社群特征,并根據(jù)這些特征從淘寶客中篩選出商家的潛在會(huì)員。
目前,挖掘潛在客戶的方法如下:獲得商家的樣本客戶的各個(gè)屬性標(biāo)簽;統(tǒng)計(jì)樣本客戶的各個(gè)屬性標(biāo)簽的分布特征;運(yùn)用貝葉斯無(wú)向圖網(wǎng)絡(luò),獲得樣本客戶的各個(gè)屬性標(biāo)簽的聯(lián)合概率分布函數(shù);運(yùn)用梯度下降法得到對(duì)于樣本客戶擬合度最好的屬性標(biāo)簽的權(quán)重,以及屬性標(biāo)簽組合的權(quán)重;運(yùn)用屬性標(biāo)簽的權(quán)重,屬性標(biāo)簽組合的權(quán)重,計(jì)算新客戶成為商家的潛在客戶的概率;根據(jù)新客戶成為商家的潛在客戶的概率,確定新客戶是否是商家的潛在客戶。
然而,現(xiàn)有挖掘潛在客戶的方法,需要將樣本客戶的各個(gè)屬性標(biāo)簽進(jìn)行組合,需要遍歷各種組合情況,計(jì)算復(fù)雜,浪費(fèi)時(shí)間。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明提供了一種挖掘潛在客戶的方法和裝置,不需要將樣本客戶的各個(gè)屬性標(biāo)簽進(jìn)行組合,不需要遍歷各種組合情況,計(jì)算簡(jiǎn)單快捷,可以節(jié)約時(shí)間。
為了解決上述問(wèn)題,本發(fā)明公開(kāi)了一種挖掘潛在客戶的方法,所述方法包括:
獲取商家的樣本客戶的各個(gè)屬性標(biāo)簽,并計(jì)算所述樣本客戶的各個(gè)屬性標(biāo)簽的集中度,以及所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;
將所述樣本客戶的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)所述屬性標(biāo)簽組合的集中度;
根據(jù)每個(gè)所述屬性標(biāo)簽組合的集中度,以及組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)所述屬性標(biāo)簽組合中選擇所述樣本客戶的挖掘?qū)傩詷?biāo)簽,并計(jì)算所述樣本客戶的各個(gè)所述挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重;
根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)所述樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群;
獲取新客戶的各個(gè)屬性標(biāo)簽,并根據(jù)所述新客戶的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)所述客戶社群中的所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶屬于每個(gè)所述客戶社群的概率;
當(dāng)所述新客戶屬于每個(gè)所述客戶社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定所述新客戶是所述商家的潛在客戶。
進(jìn)一步地,所述屬性值域的權(quán)重包括:屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,計(jì)算所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,包括:
判斷所述樣本客戶的各個(gè)屬性標(biāo)簽的類(lèi)別;
如果所述樣本客戶的某屬性標(biāo)簽是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重;
如果所述樣本客戶的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)方法對(duì)所述樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì), 得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)權(quán)重計(jì)算公式為:
其中,對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的所有屬性值的總個(gè)數(shù);對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
進(jìn)一步地,將所述樣本客戶的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,包括:
將所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到所述樣本客戶的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽;
將所述樣本客戶的小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)所述屬性標(biāo)簽組合。
進(jìn)一步地,計(jì)算所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,包括:
判斷組成所述樣本客戶的各個(gè)所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別;
如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重;
如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)方法對(duì)所述樣本客戶的某所 述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重;
如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則采用自組織映射SOM聚類(lèi)方法對(duì)所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,根據(jù)每個(gè)所述屬性標(biāo)簽組合的集中度,以及組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,確定每個(gè)所述屬性標(biāo)簽組合是否能夠作為所述樣本客戶的挖掘?qū)傩詷?biāo)簽,包括:
將每個(gè)所述屬性標(biāo)簽組合的集中度,分別與組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
如果某個(gè)所述屬性標(biāo)簽組合的集中度大于組成某個(gè)所述屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合能夠作為所述樣本客戶的所述挖掘?qū)傩詷?biāo)簽;
如果某個(gè)所述屬性標(biāo)簽組合的集中度小于等于組成某個(gè)所述屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合不能夠作為所述樣本客戶的所述挖掘?qū)傩詷?biāo)簽。
進(jìn)一步地,根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,采用圖聚類(lèi)方法對(duì)所述樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群,包括:
從所有的所述樣本客戶中隨機(jī)選擇一個(gè)所述樣本客戶,根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的所述樣本客戶與其他各個(gè)所述樣本客戶之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他所述樣本客戶,并將連接權(quán)重最大的一個(gè)其他所述樣本客戶與隨機(jī)選擇的所述樣本客戶組成待定客戶社 群;
根據(jù)預(yù)設(shè)聚合公式,計(jì)算所述待定客戶社群之外的其他所述樣本客戶與所述待定客戶社群的聚合效應(yīng),根據(jù)所述待定客戶社群之外的其他所述樣本客戶與待定客戶社群的聚合效應(yīng),確定是否將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群;
從所述客戶社群之外的所述樣本客戶中隨機(jī)選擇一個(gè)所述樣本客戶,然后執(zhí)行計(jì)算隨機(jī)選擇的所述樣本客戶與其他各個(gè)所述樣本客戶之間的連接權(quán)重的步驟。
進(jìn)一步地,所述預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的所述樣本客戶v的連接權(quán)重最大的一個(gè)其他所述樣本客戶,Ev-connect表示隨機(jī)選擇的所述樣本客戶v與隨機(jī)選擇的所述樣本客戶v有共同屬性值的任一所述樣本客戶的連接權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶v與所述待定客戶社群中的其他所述樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶v與所述待定客戶社群之外的其他所述樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示所述待定客戶社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶v與所述客戶社群中的其他所述樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶v與所述客戶社群之外的其他所述樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示所述客戶社群的聚合效應(yīng)值。
進(jìn)一步地,根據(jù)所述待定客戶社群之外的其他所述樣本客戶與所述待定客戶社群的聚合效應(yīng),確定是否將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群,包括:
將所述待定客戶社群的聚合效應(yīng)值與所述客戶社群的聚合效應(yīng)值進(jìn)行比較;
如果所述客戶社群的聚合效應(yīng)值大于所述待定客戶社群的聚合效應(yīng)值,則確定將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群;
如果所述客戶社群的聚合效應(yīng)值小于等于所述待定客戶社群的聚合效應(yīng)值,則確定不將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群。
進(jìn)一步地,按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶屬于每個(gè)所述客戶社群的概率之后,還包括:
將所述新客戶屬于每個(gè)所述客戶社群的概率進(jìn)行比較,得到所述新客戶屬于所述客戶社群的最大概率;
確定所述新客戶屬于最大概率對(duì)應(yīng)的所述客戶社群;
更新所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)概率公式如下:
其中,Y表示所述新客戶的屬性標(biāo)簽,yi表示所述新客戶的屬性標(biāo)簽的第i個(gè)屬性值,n表示所述新客戶的屬性標(biāo)簽有n個(gè)屬性值,B表示任一所述客戶社群。
進(jìn)一步地,確定所述新客戶是所述商家的潛在客戶之后,還包括:
獲取所述商家的反饋信息;其中,所述反饋信息包括確定的某所述新客戶是所述商家的潛在客戶不正確、和/或原來(lái)的某所述樣本客戶當(dāng)前不符合所述商家的客戶標(biāo)準(zhǔn);
根據(jù)所述商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)所述樣本客戶或所述新客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,并根據(jù)所述商家的反饋信息,對(duì)所述客戶社群進(jìn)行矯正。
進(jìn)一步地,所述預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示所述樣本客戶或所述新客戶的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶社群中的權(quán)重;表示所述樣本客戶或所述新客戶的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶社群中的權(quán)重;表示所述樣本客戶或所述新客戶的矯正后的屬性標(biāo)簽A在矯正前的所述客戶社群中的權(quán)重。
為了解決上述問(wèn)題,本發(fā)明還公開(kāi)了一種挖掘潛在客戶的裝置,所述裝置包括:
獲取模塊,用于獲取商家的樣本客戶的各個(gè)屬性標(biāo)簽,并計(jì)算所述樣本客戶的各個(gè)屬性標(biāo)簽的集中度,以及所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;
組合計(jì)算模塊,用于將所述樣本客戶的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)所述屬性標(biāo)簽組合的集中度;
確定計(jì)算模塊,用于根據(jù)每個(gè)所述屬性標(biāo)簽組合的集中度,以及組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)所述屬性標(biāo)簽組合中選擇所述樣本客戶的挖掘?qū)傩詷?biāo)簽,并計(jì)算所述樣本客戶的各個(gè)所述挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重;
劃分模塊,用于根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)所述樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群;
概率計(jì)算模塊,用于獲取新客戶的各個(gè)屬性標(biāo)簽,并根據(jù)所述新客戶的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)所述客戶社群中的所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶屬于每個(gè)所述客戶社群的概率;
潛在客戶確定模塊,用于當(dāng)所述新客戶屬于每個(gè)所述客戶社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定所述新客戶是所述商家的潛在客戶。
進(jìn)一步地,所述屬性值域的權(quán)重包括:屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述獲取模塊包括:
第一判斷單元,用于判斷所述樣本客戶的各個(gè)屬性標(biāo)簽的類(lèi)別;
第一計(jì)算單元,用于如果所述樣本客戶的某屬性標(biāo)簽是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重;
第二計(jì)算單元,用于如果所述樣本客戶的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)所述樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)權(quán)重計(jì)算公式為:
其中,對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的所有屬性值的總個(gè)數(shù);對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
進(jìn)一步地,所述組合計(jì)算模塊包括:
第一比較單元,用于將所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到所述樣本客戶的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽;
組合單元,用于將所述樣本客戶的小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)所述屬性標(biāo)簽組合。
進(jìn)一步地,所述確定計(jì)算模塊還包括:
第二判斷單元,用于判斷組成所述樣本客戶的各個(gè)所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別;
第三計(jì)算單元,用于如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重;
第四計(jì)算單元,用于如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重;
第五計(jì)算單元,用于如果組成所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則采用自組織映射SOM聚類(lèi)裝置對(duì)所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述確定計(jì)算模塊包括:
第二比較單元,用于將每個(gè)所述屬性標(biāo)簽組合的集中度,分別與組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
第一確定單元,用于如果某個(gè)所述屬性標(biāo)簽組合的集中度大于組成某個(gè)所述屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合能夠作為所述樣本客戶的所述挖掘?qū)傩詷?biāo)簽;
第二確定單元,用于如果某個(gè)所述屬性標(biāo)簽組合的集中度小于等于組成某個(gè)所述屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合不能夠作為所述樣本客戶的所述挖掘?qū)傩詷?biāo)簽。
進(jìn)一步地,所述劃分模塊包括:
選擇單元,用于從所有的所述樣本客戶中隨機(jī)選擇一個(gè)所述樣本客戶,根據(jù)所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、 所述樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的所述樣本客戶與其他各個(gè)所述樣本客戶之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他所述樣本客戶,并將連接權(quán)重最大的一個(gè)其他所述樣本客戶與隨機(jī)選擇的所述樣本客戶組成待定客戶社群;
第三確定單元,用于根據(jù)預(yù)設(shè)聚合公式,計(jì)算所述待定客戶社群之外的其他所述樣本客戶與所述待定客戶社群的聚合效應(yīng),根據(jù)所述待定客戶社群之外的其他所述樣本客戶與待定客戶社群的聚合效應(yīng),確定是否將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群;
通知單元,用于從所述客戶社群之外的所述樣本客戶中隨機(jī)選擇一個(gè)所述樣本客戶,然后通知所述選擇單元執(zhí)行計(jì)算隨機(jī)選擇的所述樣本客戶與其他各個(gè)所述樣本客戶之間的連接權(quán)重的步驟。
進(jìn)一步地,所述預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的所述樣本客戶v的連接權(quán)重最大的一個(gè)其他所述樣本客戶,Ev-connect表示隨機(jī)選擇的所述樣本客戶v與隨機(jī)選擇的所述樣本客戶v有共同屬性值的任一所述樣本客戶的連接權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶v與所述待定客戶社群中的其他所述樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶v與所述待定客戶社群之外的其他所述樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示所述待定客戶社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶v與所述客戶社群中的其他所述樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶v與所述客戶社群之外的其他所述樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示所述客戶社群的聚合效應(yīng)值。
進(jìn)一步地,所述第三確定單元包括:
比較子單元,用于將所述待定客戶社群的聚合效應(yīng)值與所述客戶社群的聚合效應(yīng)值進(jìn)行比較;
第一確定子單元,用于如果所述客戶社群的聚合效應(yīng)值大于所述待定客戶社群的聚合效應(yīng)值,則確定將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群;
第二確定子單元,用于如果所述客戶社群的聚合效應(yīng)值小于等于所述待定客戶社群的聚合效應(yīng)值,則確定不將所述待定客戶社群之外的其他所述樣本客戶添加到所述待定客戶社群組成所述客戶社群。
進(jìn)一步地,所述裝置還包括:
比較模塊,用于按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶屬于每個(gè)所述客戶社群的概率之后,將所述新客戶屬于每個(gè)所述客戶社群的概率進(jìn)行比較,得到所述新客戶屬于所述客戶社群的最大概率;
確定模塊,用于確定所述新客戶屬于最大概率對(duì)應(yīng)的所述客戶社群;
更新模塊,用于更新所述樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)概率公式如下:
其中,Y表示所述新客戶的屬性標(biāo)簽,yi表示所述新客戶的屬性標(biāo)簽的第i個(gè)屬性值,n表示所述新客戶的屬性標(biāo)簽有n個(gè)屬性值,B表示任一所述客戶社群。
進(jìn)一步地,所述裝置還包括:
反饋模塊,用于確定所述新客戶是所述商家的潛在客戶之后,獲取所述商家的反饋信息;其中,所述反饋信息包括確定的某所述新客戶是所述商家的潛在客戶不正確、和/或原來(lái)的某所述樣本客戶當(dāng)前不符合所述商家的客戶標(biāo)準(zhǔn);
矯正模塊,用于根據(jù)所述商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)所述樣本客戶或所述新客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間 的權(quán)重進(jìn)行矯正,并根據(jù)所述商家的反饋信息,對(duì)所述客戶社群進(jìn)行矯正。
進(jìn)一步地,所述預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示所述樣本客戶或所述新客戶的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶社群中的權(quán)重;表示所述樣本客戶或所述新客戶的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶社群中的權(quán)重;表示所述樣本客戶或所述新客戶的矯正后的屬性標(biāo)簽A在矯正前的所述客戶社群中的權(quán)重。
與現(xiàn)有技術(shù)相比,本發(fā)明可以獲得包括以下技術(shù)效果:
1)根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,選擇樣本客戶的挖掘?qū)傩詷?biāo)簽,根據(jù)樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群,當(dāng)新客戶屬于每個(gè)客戶社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶是商家的潛在客戶,不需要將樣本客戶的各個(gè)屬性標(biāo)簽進(jìn)行組合,不需要遍歷各種組合情況,計(jì)算簡(jiǎn)單快捷,可以節(jié)約時(shí)間。
2)按照預(yù)設(shè)概率公式計(jì)算得到新客戶屬于每個(gè)客戶社群的概率,通過(guò)概率確定新客戶是不是商家的潛在客戶,而不需要采用梯度下降法求全局最優(yōu)結(jié)果,大大提高了運(yùn)算速度。
3)預(yù)設(shè)權(quán)重計(jì)算公式通過(guò)運(yùn)用屬性標(biāo)簽的集中度,能夠適應(yīng)更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),能夠更有效的反應(yīng)數(shù)據(jù)的分布規(guī)律。
4)根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶或新客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,預(yù)設(shè)權(quán)重矯正公式不僅考慮了屬性標(biāo)簽所包含的樣本量因素,還針對(duì)權(quán)重本身進(jìn)行懲罰或者獎(jiǎng)勵(lì),這樣不僅加快了效果反饋速度,同時(shí)還使得權(quán)重的變化更加穩(wěn)健,不會(huì)出現(xiàn)異常的增加或者減少,并且會(huì)隨著樣本客戶數(shù)量的增加,準(zhǔn)確度也會(huì)越來(lái)越高。
當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品必不一定需要同時(shí)達(dá)到以上所述的所有技術(shù)效果。
附圖說(shuō)明
此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
圖1是本發(fā)明實(shí)施例的第一種挖掘潛在客戶的方法流程圖;
圖2是本發(fā)明實(shí)施例的屬性值類(lèi)區(qū)間對(duì)應(yīng)的波峰示意圖;
圖3是本發(fā)明實(shí)施例的對(duì)于文本類(lèi)的屬性標(biāo)簽的屬性值X和文本類(lèi)的屬性標(biāo)簽的屬性值Y的屬性標(biāo)簽組合的計(jì)算示意圖;
圖4是本發(fā)明實(shí)施例的文本類(lèi)的屬性值下的數(shù)字類(lèi)的屬性值的分布規(guī)律示意圖;
圖5是本發(fā)明實(shí)施例的不同數(shù)字類(lèi)的屬性值的分布規(guī)律示意圖;
圖6是本發(fā)明實(shí)施例的第二種挖掘潛在客戶的方法流程圖;
圖7是本發(fā)明實(shí)施例的第三種挖掘潛在客戶的方法流程圖;
圖8是本發(fā)明實(shí)施例的第四種挖掘潛在客戶的方法流程圖;
圖9是本發(fā)明實(shí)施例的采用圖聚類(lèi)方法依次對(duì)樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群的示意圖;
圖10是本發(fā)明實(shí)施例的第五種挖掘潛在客戶的方法流程圖;
圖11是本發(fā)明實(shí)施例的第六種挖掘潛在客戶的方法流程圖;
圖12是本發(fā)明實(shí)施例的第一種挖掘潛在客戶的裝置結(jié)構(gòu)示意圖;
圖13是本發(fā)明實(shí)施例的第二種挖掘潛在客戶的裝置結(jié)構(gòu)示意圖;
圖14是本發(fā)明實(shí)施例的第三種挖掘潛在客戶的裝置結(jié)構(gòu)示意圖。
具體實(shí)施方式
以下將配合附圖及實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式,藉此對(duì)本發(fā)明 如何應(yīng)用技術(shù)手段來(lái)解決技術(shù)問(wèn)題并達(dá)成技術(shù)功效的實(shí)現(xiàn)過(guò)程能充分理解并據(jù)以實(shí)施。
在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性?xún)?nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來(lái)實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類(lèi)型的隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤(pán)只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能光盤(pán)(DVD)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤(pán)存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問(wèn)的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括非暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
如在說(shuō)明書(shū)及權(quán)利要求當(dāng)中使用了某些詞匯來(lái)指稱(chēng)特定組件。本領(lǐng)域技術(shù)人員應(yīng)可理解,硬件制造商可能會(huì)用不同名詞來(lái)稱(chēng)呼同一個(gè)組件。本說(shuō)明書(shū)及權(quán)利要求并不以名稱(chēng)的差異來(lái)作為區(qū)分組件的方式,而是以組件在功能上的差異來(lái)作為區(qū)分的準(zhǔn)則。如在通篇說(shuō)明書(shū)及權(quán)利要求當(dāng)中所提及的“包含”為一開(kāi)放式用語(yǔ),故應(yīng)解釋成“包含但不限定于”。“大致”是指在可接收的誤差范圍內(nèi),本領(lǐng)域技術(shù)人員能夠在一定誤差范圍內(nèi)解決所述技術(shù)問(wèn)題,基本達(dá)到所述技術(shù)效果。此外,“耦接”一詞在此包含任何直接及間接的電性耦接手段。因此,若文中描述一第一裝置耦接于一第二裝置,則代表所述第一裝置可直接電性耦接于所述第二裝置,或通過(guò)其他裝置或耦接手段間接地電性耦接至所述第二裝置。說(shuō)明書(shū)后續(xù)描述為實(shí)施本發(fā)明的較佳實(shí)施方式,然所述描述乃以說(shuō)明本發(fā)明的一般原則為目的,并非用以限定本發(fā)明的范圍。本發(fā)明的保護(hù)范圍當(dāng)視所附權(quán)利要求所界定者為準(zhǔn)。
還需要說(shuō)明的是,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的商品或者系統(tǒng)不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種商品或者系統(tǒng)所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的商品或者系統(tǒng)中還存在另外的相同要素。
實(shí)施例描述
下面以一實(shí)施例對(duì)本發(fā)明方法的實(shí)現(xiàn)作進(jìn)一步說(shuō)明。如圖1所示,為本發(fā)明實(shí)施例的一種挖掘潛在客戶的方法流程圖,該方法包括:
S101:獲取商家的樣本客戶的各個(gè)屬性標(biāo)簽,并計(jì)算樣本客戶的各個(gè)屬性標(biāo)簽的集中度,以及樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;其中,屬性值域的權(quán)重包括屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
具體地,可以獲取商家的會(huì)員信息,將商家的各個(gè)會(huì)員作為樣本客戶。
其中,屬性標(biāo)簽例如可以是性別、年齡、地域、消費(fèi)金額等。屬性標(biāo)簽的屬性值例如:對(duì)于性別其屬性值是男或女;對(duì)于年齡其屬性值是18、20、30等;對(duì)于地域其屬性值是上海、北京等;對(duì)于消費(fèi)金額其屬性值是10、、20、100等。
需要說(shuō)明的是,對(duì)于年齡、地域等屬性標(biāo)簽,其對(duì)應(yīng)的屬性值一般通過(guò)文本(如男、女、上海、北京等)來(lái)表示,其屬性值的個(gè)數(shù)一般是有限的幾個(gè),可以直接求屬性值的權(quán)重。而對(duì)于年齡、消費(fèi)金額等屬性標(biāo)簽,其對(duì)應(yīng)的屬性值一般通過(guò)數(shù)字(如18、20、30等)來(lái)表示,其屬性值的個(gè)數(shù)一般可以有很多個(gè),需要通過(guò)動(dòng)態(tài)聚類(lèi)方法將屬性值歸類(lèi)為屬性值類(lèi)區(qū)間,求屬性值類(lèi)區(qū)間的權(quán)重,參見(jiàn)圖2,將屬性值歸類(lèi)為屬性值類(lèi)區(qū)間是為了找到如圖2所示的波峰,再計(jì)算屬性值類(lèi)區(qū)間的集中度。
具體地,計(jì)算樣本客戶的各個(gè)屬性標(biāo)簽的集中度CRn的公式如下:
其中,對(duì)于文本類(lèi)的屬性標(biāo)簽:xi表示屬性標(biāo)簽的屬性值是xi,c(xi)表示屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示屬性標(biāo)簽的所有屬性值的總個(gè)數(shù),n 表示選取屬性標(biāo)簽的屬性值的個(gè)數(shù)的排名在前n的屬性值;對(duì)于數(shù)字類(lèi)的屬性標(biāo)簽:xi表示屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,c(xi)表示屬性標(biāo)簽的屬性值類(lèi)區(qū)間xi中元素的個(gè)數(shù),c(X)表示屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù),n表示選取屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù)的排名在前n的屬性值。n的取值可以是2、4、5等,可以根據(jù)實(shí)際應(yīng)用狀況進(jìn)行選取,本實(shí)施例中優(yōu)選選取n=4。
S102:將樣本客戶的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)屬性標(biāo)簽組合的集中度。
具體地,可以將屬性標(biāo)簽進(jìn)行兩兩、三三等進(jìn)行組合,本實(shí)施例中優(yōu)選進(jìn)行兩兩組合,例如:將性別、年齡組合,將年齡、地域組合等。
具體地,將樣本客戶的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,包括:
將樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到樣本客戶的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽;
將樣本客戶的小于預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)屬性標(biāo)簽組合。
具體地,計(jì)算每個(gè)屬性標(biāo)簽組合的集中度,包括:
當(dāng)組成每個(gè)屬性標(biāo)簽組合的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi)時(shí),分別計(jì)算各個(gè)文本類(lèi)的屬性標(biāo)簽的屬性值的分布,參見(jiàn)圖3,對(duì)于文本類(lèi)的屬性標(biāo)簽的屬性值X和文本類(lèi)的屬性標(biāo)簽的屬性值Y的屬性標(biāo)簽組合中,當(dāng)Y取值為D時(shí),分別計(jì)算X中的前m個(gè)屬性值(此處為3,可以分別設(shè)為a、b、c)的集中度,分別為0.4、0.3、0.1,從而對(duì)應(yīng)的屬性標(biāo)簽組合的集中度為0.4+0.3+0.1=0.8。
當(dāng)組成每個(gè)屬性標(biāo)簽組合的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi)時(shí),獲得各個(gè)文本類(lèi)的屬性值下的數(shù)字類(lèi)的屬性值的分布規(guī)律,如參見(jiàn)圖4,在不同的文本類(lèi)的屬性值X的區(qū)間,數(shù)字類(lèi)的屬性值Y都有不一樣的分布規(guī)律,從而將X劃分成一個(gè)個(gè)離散的區(qū)間,那么Y就會(huì)在每個(gè)區(qū)間內(nèi)是呈現(xiàn)單一分布的情況,計(jì)算各個(gè)單一分布的集中度,然后將各個(gè)單一分 布的集中度相加即得到對(duì)應(yīng)的屬性標(biāo)簽組合的集中度。
當(dāng)組成每個(gè)屬性標(biāo)簽組合的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi)時(shí),識(shí)別出不同數(shù)字類(lèi)的屬性值的分布規(guī)律,如參見(jiàn)圖5,3種線型分別代表不同的分布情況,計(jì)算各個(gè)分布的集中度,然后將各個(gè)分布的集中度相加即得到對(duì)應(yīng)的屬性標(biāo)簽組合的集中度。
S103:根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)屬性標(biāo)簽組合中選擇樣本客戶的挖掘?qū)傩詷?biāo)簽,并計(jì)算樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重。
其中,挖掘?qū)傩詷?biāo)簽即在對(duì)新客戶進(jìn)行判斷驗(yàn)證其是否是商家的潛在客戶時(shí)用于參考使用的屬性標(biāo)簽組合。從多個(gè)屬性標(biāo)簽組合中選擇樣本客戶的挖掘?qū)傩詷?biāo)簽即從多個(gè)屬性標(biāo)簽組合中選擇能夠作為樣本客戶的挖掘?qū)傩詷?biāo)簽的屬性標(biāo)簽組合。
具體地,根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)屬性標(biāo)簽組合中選擇樣本客戶的挖掘?qū)傩詷?biāo)簽,包括:
將每個(gè)屬性標(biāo)簽組合的集中度,分別與組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
如果某個(gè)屬性標(biāo)簽組合的集中度大于組成某個(gè)屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)屬性標(biāo)簽組合能夠作為樣本客戶的挖掘?qū)傩詷?biāo)簽;
如果某個(gè)屬性標(biāo)簽組合的集中度小于等于組成某個(gè)屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)屬性標(biāo)簽組合不能夠作為樣本客戶的挖掘?qū)傩詷?biāo)簽。
S104:根據(jù)樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群。
S105:獲取新客戶的各個(gè)屬性標(biāo)簽,并根據(jù)新客戶的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)客戶社群中的樣本客戶的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩? 標(biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到新客戶屬于每個(gè)客戶社群的概率。
其中,預(yù)設(shè)概率公式如下:
其中,Y表示新客戶的屬性標(biāo)簽,yi表示新客戶的屬性標(biāo)簽的第i個(gè)屬性值,m表示新客戶的屬性標(biāo)簽有m個(gè)屬性值,B表示任一客戶社群。
S106:當(dāng)新客戶屬于每個(gè)客戶社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶是商家的潛在客戶。
其中,預(yù)設(shè)概率閾值可以是0.4、0.6、0.7等,可以根據(jù)實(shí)際應(yīng)用狀況進(jìn)行設(shè)置,對(duì)此不做限定。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖6,S101中的計(jì)算樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,包括:
S101a:判斷樣本客戶的各個(gè)屬性標(biāo)簽的類(lèi)別,如果樣本客戶的某屬性標(biāo)簽是文本類(lèi),則執(zhí)行S101b;如果樣本客戶的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則執(zhí)行S101c。
其中,文本類(lèi)也可以稱(chēng)為離散類(lèi),數(shù)字類(lèi)也可以稱(chēng)為連續(xù)類(lèi)。
S101b:按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重,然后執(zhí)行S102。
其中,預(yù)設(shè)權(quán)重計(jì)算公式w(xi)為:
對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的總個(gè)數(shù)。
S101c:采用動(dòng)態(tài)聚類(lèi)方法對(duì)樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬 性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重,然后執(zhí)行S102。
其中,預(yù)設(shè)權(quán)重計(jì)算公式w(xi)為:
對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖7,S103中的計(jì)算樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,包括:
S103a:判斷組成樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別,如果組成樣本客戶的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則執(zhí)行S103b;如果組成樣本客戶的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則執(zhí)行S103c;如果組成樣本客戶的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則執(zhí)行S103d。
S103b:按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重,然后執(zhí)行104。
其中,預(yù)設(shè)權(quán)重計(jì)算公式w(xi)為:
對(duì)于某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi):xi表示某挖掘?qū)傩詷?biāo)簽的屬性值是xi,w(xi)表示某挖掘?qū)傩詷?biāo)簽的屬性值xi的權(quán)重,CRn表示某挖掘?qū)傩詷?biāo)簽的集中度,c(xi)表示某挖掘?qū)傩詷?biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示某挖掘?qū)傩詷?biāo)簽的屬性值xi的總個(gè)數(shù)。
需要說(shuō)明的是,由于挖掘?qū)傩詷?biāo)簽是由二個(gè)屬性標(biāo)簽組合得到的,所以 挖掘?qū)傩詷?biāo)簽的屬性值也是由二個(gè)屬性標(biāo)簽的屬性值組合得到的。
S103c:采用動(dòng)態(tài)聚類(lèi)方法對(duì)樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重,然后執(zhí)行104。
S103d:采用自組織映射SOM(self-organization map)聚類(lèi)方法對(duì)樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重,然后執(zhí)行104。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖8,S104根據(jù)樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群,包括:
S104a:從所有的樣本客戶中隨機(jī)選擇一個(gè)樣本客戶,根據(jù)樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的樣本客戶與其他各個(gè)樣本客戶之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他樣本客戶,并將連接權(quán)重最大的一個(gè)其他樣本客戶與隨機(jī)選擇的樣本客戶組成待定客戶社群。
其中,預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的樣本客戶v的連接權(quán)重最大的一個(gè)其他樣本客戶,Ev-connect表示隨機(jī)選擇的樣本客戶v與隨機(jī)選擇的樣本客戶v有共同屬性值的任一樣本客戶的連接權(quán)重。
其中,待定客戶社群即該客戶社群中包含的樣本客戶還沒(méi)有最好定下來(lái),可能還有其他樣本客戶屬于該客戶社群,需要遍歷其他所有樣本客戶后再確定。
例如:從所有的樣本客戶中隨機(jī)選擇一個(gè)樣本客戶v1,按照預(yù)設(shè)最大連 接權(quán)重選擇公式,從隨機(jī)選擇的樣本客戶與其他各個(gè)樣本客戶之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他樣本客戶為v2,v1和v2組成第一個(gè)客戶社群g1(暫時(shí)為待定客戶社群)。
S104b:根據(jù)預(yù)設(shè)聚合公式,計(jì)算待定客戶社群之外的其他樣本客戶與待定客戶社群的聚合效應(yīng),根據(jù)待定客戶社群之外的其他樣本客戶與待定客戶社群的聚合效應(yīng),確定是否將待定客戶社群之外的其他樣本客戶添加到待定客戶社群組成客戶社群。
其中,預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的樣本客戶v與待定客戶社群中的其他樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的樣本客戶v與待定客戶社群之外的其他樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示待定客戶社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的樣本客戶v與客戶社群中的其他樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的樣本客戶v與客戶社群之外的其他樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示客戶社群的聚合效應(yīng)值。
相應(yīng)地,根據(jù)待定客戶社群之外的其他樣本客戶與待定客戶社群的聚合效應(yīng),確定是否將待定客戶社群之外的其他樣本客戶添加到待定客戶社群組成客戶社群,包括:
將待定客戶社群的聚合效應(yīng)值與客戶社群的聚合效應(yīng)值進(jìn)行比較;
如果客戶社群的聚合效應(yīng)值大于待定客戶社群的聚合效應(yīng)值,則確定將待定客戶社群之外的其他樣本客戶添加到待定客戶社群組成客戶社群;
如果客戶社群的聚合效應(yīng)值小于等于待定客戶社群的聚合效應(yīng)值,則確定不將待定客戶社群之外的其他樣本客戶添加到待定客戶社群組成客戶社群。
例如:假設(shè)待定客戶社群g2是將樣本客戶v3擴(kuò)充進(jìn)入g1后形成的新的待定客戶社群,根據(jù)預(yù)設(shè)聚合公式分別計(jì)算得到Condensity(g2)、Condensity(g1),如果Condensity(g2)大于Condensity(g1),則確定能夠?qū)颖究蛻魐3擴(kuò)充進(jìn)入g1,如果Condensity(g2)小于等于Condensity(g1),則確定不能夠?qū)颖究蛻魐3擴(kuò)充進(jìn)入g1。
S104c:判斷客戶社群之外是否還有樣本客戶,如果有,則執(zhí)行S104d;否則,結(jié)束。
S104d:從客戶社群之外的樣本客戶中隨機(jī)選擇一個(gè)樣本客戶,然后執(zhí)行104a中的計(jì)算隨機(jī)選擇的樣本客戶與其他各個(gè)樣本客戶之間的連接權(quán)重的步驟。
具體地,參見(jiàn)圖9,按照S104a-S104d采用圖聚類(lèi)方法依次對(duì)樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群(例如:第一客戶社群、第二客戶社群、第三客戶社群等)。需要說(shuō)明的是,得到多個(gè)客戶社群,并不用分辨這個(gè)客戶社群到底是屬于什么性質(zhì)的社群(例如是運(yùn)動(dòng)客戶社群、工作客戶社群等),只需要通過(guò)標(biāo)識(shí)區(qū)分開(kāi)每個(gè)社群即可。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖10,按照預(yù)設(shè)概率公式計(jì)算得到新客戶屬于每個(gè)客戶社群的概率之后,還包括:
S107:將新客戶屬于每個(gè)客戶社群的概率進(jìn)行比較,得到新客戶屬于客戶社群的最大概率。
其中,預(yù)設(shè)概率公式如下:
其中,Y表示新客戶的屬性標(biāo)簽,yi表示新客戶的屬性標(biāo)簽的第i個(gè)屬性值,n表示新客戶的屬性標(biāo)簽有n個(gè)屬性值,B表示任一客戶社群。
S108:確定新客戶屬于最大概率對(duì)應(yīng)的客戶社群。
具體地,確定新客戶屬于最大概率對(duì)應(yīng)的客戶社群。對(duì)于具體類(lèi)別的劃分,采用改進(jìn)的貝葉斯網(wǎng)絡(luò),這里不再限定其為有向無(wú)環(huán)圖,而是對(duì)屬性標(biāo)簽進(jìn)行無(wú)序排列。
S109:更新樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
具體地,確定新客戶屬于最大概率對(duì)應(yīng)的客戶社群后,將新客戶擴(kuò)充進(jìn)入最大概率對(duì)應(yīng)的客戶社群,樣本客戶的數(shù)量發(fā)生了變化,需要更新樣本客 戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。更新樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重的過(guò)程是按照上述權(quán)重計(jì)算公式重新進(jìn)行計(jì)算。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖11,確定新客戶是商家的潛在客戶之后,還包括:
S110:獲取商家的反饋信息;其中,反饋信息包括確定的某新客戶是商家的潛在客戶不正確、和/或原來(lái)的某樣本客戶當(dāng)前不符合商家的客戶標(biāo)準(zhǔn)。
具體地,當(dāng)確定新客戶是商家的潛在客戶后,可以將新客戶的信息反饋給商家,然后商家判斷該新客戶是否是其需要的潛在客戶,如果不是,則可以反饋確定的某新客戶是商家的潛在客戶不正確。或者商家也可以根據(jù)當(dāng)前的情況,確定原來(lái)的某樣本客戶當(dāng)前不符合商家的客戶標(biāo)準(zhǔn),然后反饋原來(lái)的某樣本客戶當(dāng)前不符合商家的客戶標(biāo)準(zhǔn)。
S111:根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶或新客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,并根據(jù)商家的反饋信息,對(duì)客戶社群進(jìn)行矯正。
其中,預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示樣本客戶或新客戶的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的客戶社群中的權(quán)重;表示樣本客戶或新客戶的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的客戶社群中的權(quán)重;表示樣本客戶或新客戶的矯正后的屬性標(biāo)簽A在矯正前的客戶社群中的權(quán)重;表示矯正后的屬性標(biāo)簽A的屬性值在矯正前的客戶社群中的總個(gè)數(shù);表示矯正前的屬性標(biāo)簽A的屬性值在矯正后的客戶社群中的總個(gè)數(shù)。
本實(shí)施例所述的挖掘潛在客戶的方法,根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,選擇樣本客戶的挖掘 屬性標(biāo)簽,根據(jù)樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群,當(dāng)新客戶屬于每個(gè)客戶社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶是商家的潛在客戶,不需要將樣本客戶的各個(gè)屬性標(biāo)簽進(jìn)行組合,不需要遍歷各種組合情況,計(jì)算簡(jiǎn)單快捷,可以節(jié)約時(shí)間。按照預(yù)設(shè)概率公式計(jì)算得到新客戶屬于每個(gè)客戶社群的概率,通過(guò)概率確定新客戶是不是商家的潛在客戶,而不需要采用梯度下降法求全局最優(yōu)結(jié)果,大大提高了運(yùn)算速度。預(yù)設(shè)權(quán)重計(jì)算公式通過(guò)運(yùn)用屬性標(biāo)簽的集中度,能夠適應(yīng)更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),能夠更有效的反應(yīng)數(shù)據(jù)的分布規(guī)律。根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶或新客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,預(yù)設(shè)權(quán)重矯正公式不僅考慮了屬性標(biāo)簽所包含的樣本量因素,還針對(duì)權(quán)重本身進(jìn)行懲罰或者獎(jiǎng)勵(lì),這樣不僅加快了效果反饋速度,同時(shí)還使得權(quán)重的變化更加穩(wěn)健,不會(huì)出現(xiàn)異常的增加或者減少,并且會(huì)隨著樣本客戶數(shù)量的增加,準(zhǔn)確度也會(huì)越來(lái)越高。
如圖12所示,是本發(fā)明實(shí)施例的一種挖掘潛在客戶的裝置結(jié)構(gòu)圖,該裝置包括:
獲取模塊201,用于獲取商家的樣本客戶的各個(gè)屬性標(biāo)簽,并計(jì)算樣本客戶的各個(gè)屬性標(biāo)簽的集中度,以及樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;
組合計(jì)算模塊202,用于將樣本客戶的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)屬性標(biāo)簽組合的集中度;
確定計(jì)算模塊203,用于根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)屬性標(biāo)簽組合中選擇樣本客戶的挖掘?qū)傩詷?biāo)簽,并計(jì)算樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重;
劃分模塊204,用于根據(jù)樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)裝置對(duì)樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群;
概率計(jì)算模塊205,用于獲取新客戶的各個(gè)屬性標(biāo)簽,并根據(jù)新客戶的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)客戶社群中的樣本客戶的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到新客戶屬于每個(gè)客戶社群的概率;
潛在客戶確定模塊206,用于當(dāng)新客戶屬于每個(gè)客戶社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶是商家的潛在客戶。
進(jìn)一步地,屬性值域的權(quán)重包括:屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,獲取模塊201包括:
第一判斷單元,用于判斷樣本客戶的各個(gè)屬性標(biāo)簽的類(lèi)別;
第一計(jì)算單元,用于如果樣本客戶的某屬性標(biāo)簽是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重;
第二計(jì)算單元,用于如果樣本客戶的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,預(yù)設(shè)權(quán)重計(jì)算公式為:
其中,對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的所有屬性值的總個(gè)數(shù);對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
進(jìn)一步地,組合計(jì)算模塊202包括:
第一比較單元,用于將樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩? 值類(lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到樣本客戶的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽;
組合單元,用于將樣本客戶的小于預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)屬性標(biāo)簽組合。
進(jìn)一步地,確定計(jì)算模塊204還包括:
第二判斷單元,用于判斷組成樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別;
第三計(jì)算單元,用于如果組成樣本客戶的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重;
第四計(jì)算單元,用于如果組成樣本客戶的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重;
第五計(jì)算單元,用于如果組成樣本客戶的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則采用自組織映射SOM聚類(lèi)裝置對(duì)樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,確定計(jì)算模塊203包括:
第二比較單元,用于將每個(gè)屬性標(biāo)簽組合的集中度,分別與組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
第一確定單元,用于如果某個(gè)屬性標(biāo)簽組合的集中度大于組成某個(gè)屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)屬性標(biāo)簽組合能夠作為樣本客戶的挖掘?qū)傩詷?biāo)簽;
第二確定單元,用于如果某個(gè)屬性標(biāo)簽組合的集中度小于等于組成某個(gè)屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)屬性標(biāo)簽組合不能夠作 為樣本客戶的挖掘?qū)傩詷?biāo)簽。
進(jìn)一步地,劃分模塊204包括:
選擇單元,用于從所有的樣本客戶中隨機(jī)選擇一個(gè)樣本客戶,根據(jù)樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的樣本客戶與其他各個(gè)樣本客戶之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他樣本客戶,并將連接權(quán)重最大的一個(gè)其他樣本客戶與隨機(jī)選擇的樣本客戶組成待定客戶社群;
第三確定單元,用于根據(jù)預(yù)設(shè)聚合公式,計(jì)算待定客戶社群之外的其他樣本客戶與待定客戶社群的聚合效應(yīng),根據(jù)待定客戶社群之外的其他樣本客戶與待定客戶社群的聚合效應(yīng),確定是否將待定客戶社群之外的其他樣本客戶添加到待定客戶社群組成客戶社群;
通知單元,用于從客戶社群之外的樣本客戶中隨機(jī)選擇一個(gè)樣本客戶,然后通知選擇單元執(zhí)行計(jì)算隨機(jī)選擇的樣本客戶與其他各個(gè)樣本客戶之間的連接權(quán)重的步驟。
進(jìn)一步地,預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的樣本客戶v的連接權(quán)重最大的一個(gè)其他樣本客戶,Ev-connect表示隨機(jī)選擇的樣本客戶v與隨機(jī)選擇的樣本客戶v有共同屬性值的任一樣本客戶的連接權(quán)重。
進(jìn)一步地,預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的樣本客戶v與待定客戶社群中的其他樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的樣本客戶v與待定客戶社群之外的其他樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示待定客戶社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的樣本客戶v與客戶社群中的其他樣本客戶的連接權(quán)重、w(Sout)表示隨機(jī)選擇的樣本客戶v與客戶社群之外的其他樣本客戶的連接權(quán)重時(shí),Condensity(gi)表示客戶社群的聚合效應(yīng)值。
進(jìn)一步地,第三確定單元包括:
比較子單元,用于將待定客戶社群的聚合效應(yīng)值與客戶社群的聚合效應(yīng)值進(jìn)行比較;
第一確定子單元,用于如果客戶社群的聚合效應(yīng)值大于待定客戶社群的聚合效應(yīng)值,則確定將待定客戶社群之外的其他樣本客戶添加到待定客戶社群組成客戶社群;
第二確定子單元,用于如果客戶社群的聚合效應(yīng)值小于等于待定客戶社群的聚合效應(yīng)值,則確定不將待定客戶社群之外的其他樣本客戶添加到待定客戶社群組成客戶社群。
進(jìn)一步地,參見(jiàn)圖13,該裝置還包括:
比較模塊207,用于按照預(yù)設(shè)概率公式計(jì)算得到新客戶屬于每個(gè)客戶社群的概率之后,將新客戶屬于每個(gè)客戶社群的概率進(jìn)行比較,得到新客戶屬于客戶社群的最大概率;
確定模塊208,用于確定新客戶屬于最大概率對(duì)應(yīng)的客戶社群;
更新模塊209,用于更新樣本客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,預(yù)設(shè)概率公式如下:
其中,Y表示新客戶的屬性標(biāo)簽,yi表示新客戶的屬性標(biāo)簽的第i個(gè)屬性值,n表示新客戶的屬性標(biāo)簽有n個(gè)屬性值,B表示任一客戶社群。
進(jìn)一步地,參見(jiàn)圖14,該裝置還包括:
反饋模塊210,用于確定新客戶是商家的潛在客戶之后,獲取商家的反饋信息;其中,反饋信息包括確定的某新客戶是商家的潛在客戶不正確、和/或原來(lái)的某樣本客戶當(dāng)前不符合商家的客戶標(biāo)準(zhǔn);
矯正模塊211,用于根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶或新客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,并根據(jù)商家的反饋信息,對(duì)客戶社群進(jìn)行矯正。
進(jìn)一步地,預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示樣本客戶或新客戶的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的客戶社群中的權(quán)重;表示樣本客戶或新客戶的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的客戶社群中的權(quán)重;表示樣本客戶或新客戶的矯正后的屬性標(biāo)簽A在矯正前的客戶社群中的權(quán)重。
本實(shí)施例所述的挖掘潛在客戶的裝置,根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,選擇樣本客戶的挖掘?qū)傩詷?biāo)簽,根據(jù)樣本客戶的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、樣本客戶的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶進(jìn)行社群劃分,得到多個(gè)客戶社群,當(dāng)新客戶屬于每個(gè)客戶社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶是商家的潛在客戶,不需要將樣本客戶的各個(gè)屬性標(biāo)簽進(jìn)行組合,不需要遍歷各種組合情況,計(jì)算簡(jiǎn)單快捷,可以節(jié)約時(shí)間。按照預(yù)設(shè)概率公式計(jì)算得到新客戶屬于每個(gè)客戶社群的概率,通過(guò)概率確定新客戶是不是商家的潛在客戶,而不需要采用梯度下降法求全局最優(yōu)結(jié)果,大大提高了運(yùn)算速度。預(yù)設(shè)權(quán)重計(jì)算公式通過(guò)運(yùn)用屬性標(biāo)簽的集中度,能夠適應(yīng)更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),能夠更有效的反應(yīng)數(shù)據(jù)的分布規(guī)律。根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶或新客戶的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,預(yù)設(shè)權(quán)重矯正公式不僅考慮了屬性標(biāo)簽所包含的樣本量因素,還針對(duì)權(quán)重本身進(jìn)行懲罰或者獎(jiǎng)勵(lì),這樣不僅加快了效果反饋速度,同時(shí)還使得權(quán)重的變化更加穩(wěn)健,不會(huì)出現(xiàn)異常的增加或者減少,并且會(huì)隨著樣本客戶數(shù)量的增加,準(zhǔn)確度也會(huì)越來(lái)越高。
所述裝置與前述的方法流程描述對(duì)應(yīng),不足之處參考上述方法流程的敘述,不再一一贅述。
上述說(shuō)明示出并描述了本發(fā)明的若干優(yōu)選實(shí)施例,但如前所述,應(yīng)當(dāng)理 解本發(fā)明并非局限于本文所披露的形式,不應(yīng)看作是對(duì)其他實(shí)施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi),通過(guò)上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識(shí)進(jìn)行改動(dòng)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護(hù)范圍內(nèi)。