本發(fā)明屬于大數(shù)據(jù)處理和分析的技術(shù)領(lǐng)域,具體地涉及一種房產(chǎn)銷售線索的挖掘方法。
背景技術(shù):
目前的房產(chǎn)銷售線索主要來(lái)自線上和線下兩個(gè)方面,線下主要為客戶拜訪與相互介紹,線上來(lái)自客戶在房產(chǎn)電商網(wǎng)站的主動(dòng)登記,以及根據(jù)客戶在房產(chǎn)網(wǎng)站的訪問(wèn)行為進(jìn)行的潛在客戶挖掘。
目前線上的潛在客戶挖掘主要采用傳統(tǒng)電子商務(wù)平臺(tái)的潛在客戶挖掘方案,通過(guò)客戶id識(shí)別客戶,以session為單位分析客戶的訪問(wèn)、購(gòu)買行為,提取特征后建立預(yù)估或者分類模型,然后根據(jù)模型對(duì)客戶的購(gòu)買意愿進(jìn)行識(shí)別。
專利申請(qǐng)“一種基于客戶行為特征的潛在客戶挖掘方法”(CN201510903856.4),通過(guò)客戶id識(shí)別客戶,以session為單位分析客戶的訪問(wèn)行為,提取特征后進(jìn)行經(jīng)過(guò)粗糙集約簡(jiǎn),在約簡(jiǎn)后的特征上建立隨機(jī)森林模型,然后根據(jù)模型進(jìn)行潛在客戶識(shí)別。
專利申請(qǐng)“判斷用戶興趣度的方法及裝置”(CN201511018992.1),根據(jù)用戶訪問(wèn)的網(wǎng)頁(yè)和時(shí)長(zhǎng)特征來(lái)判斷用戶的興趣。
現(xiàn)有線上的銷售線索挖掘方案存在著如下缺點(diǎn):
1)線索數(shù)量不夠多。因?yàn)榉慨a(chǎn)銷售的利潤(rùn)可觀,開(kāi)發(fā)商希望較多的銷售線索,會(huì)在多家房產(chǎn)電商網(wǎng)站一起進(jìn)行推廣。但受平臺(tái)所限,房產(chǎn)電商網(wǎng)站只能對(duì)用戶在自己網(wǎng)站的行為進(jìn)行監(jiān)控,房產(chǎn)電商網(wǎng)站競(jìng)爭(zhēng)比較充分,單一網(wǎng)站的線索覆蓋率較差。
2)可以用來(lái)聯(lián)絡(luò)的線索較少。根據(jù)房產(chǎn)行業(yè)的特點(diǎn),用戶訪問(wèn)房產(chǎn)電商網(wǎng)站大多是為了獲取資訊,大部分情況下無(wú)需進(jìn)行登錄,房產(chǎn)電商網(wǎng)站只能根據(jù)cookie等行為進(jìn)行分析,無(wú)法進(jìn)行進(jìn)一步更有效的線下?tīng)I(yíng)銷。
3)缺乏交叉驗(yàn)證。只能搜集到用戶房產(chǎn)相關(guān)的行為,無(wú)法判斷其是否真有實(shí)力進(jìn)行購(gòu)買。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的技術(shù)解決問(wèn)題是:克服現(xiàn)有技術(shù)的不足,提供一種房產(chǎn)銷售線索的挖掘方法,其能夠得到更多更有效的登陸與未登陸用戶的銷售線索,幫助樓盤進(jìn)行營(yíng)銷。
本發(fā)明的技術(shù)解決方案是:這種房產(chǎn)銷售線索的挖掘方法,該方法包括以下步驟:
(1)建立房產(chǎn)知識(shí)庫(kù)、用戶ID知識(shí)庫(kù)、用戶消費(fèi)能力知識(shí)庫(kù)、用戶購(gòu)房知識(shí)庫(kù)和用戶風(fēng)險(xiǎn)知識(shí)庫(kù);
(2)基于屬性與基于行為對(duì)相似樓盤進(jìn)行挖掘;
(3)建立線索打分模型;
(4)選取候選線索:分析最近一段時(shí)間用戶在各網(wǎng)站的訪問(wèn)行為,若其訪問(wèn)過(guò)目標(biāo)樓盤及其相似樓盤,則將該用戶加入候選線索列表,同時(shí)記錄線索用戶在各網(wǎng)站的訪問(wèn)行為;
(5)對(duì)候選線索進(jìn)行打分:對(duì)于候選線索列表里的用戶,分析其在各網(wǎng)站的行為,抽取其行為特征,使用線索打分模型進(jìn)行打分,打分結(jié)果大于閾值Z的線索作為潛在線索;
(6)對(duì)潛在線索進(jìn)行過(guò)濾,得到潛在線索列表;
(7)對(duì)于潛在線索列表里的用戶,訪問(wèn)用戶ID知識(shí)庫(kù),得到其聯(lián)系方式,提供給開(kāi)發(fā)商進(jìn)行營(yíng)銷。
本發(fā)明基于第三方大數(shù)據(jù),綜合分析用戶在多個(gè)房產(chǎn)電商網(wǎng)站以及其他網(wǎng)站上的訪問(wèn)行為,交叉驗(yàn)證,從而能夠得到更多更有效的登陸與未登陸用戶的銷售線索,幫助樓盤進(jìn)行營(yíng)銷。
附圖說(shuō)明
圖1是根據(jù)本發(fā)明的房產(chǎn)銷售線索的挖掘方法的流程圖。
具體實(shí)施方式
如圖1所示,這種房產(chǎn)銷售線索的挖掘方法,該方法包括以下步驟:
(1)建立房產(chǎn)知識(shí)庫(kù)、用戶ID知識(shí)庫(kù)、用戶消費(fèi)能力知識(shí)庫(kù)、用戶購(gòu)房知識(shí)庫(kù)和用戶風(fēng)險(xiǎn)知識(shí)庫(kù);
(2)基于屬性與基于行為對(duì)相似樓盤進(jìn)行挖掘;
(3)建立線索打分模型;
(4)選取候選線索:分析最近一段時(shí)間用戶在各網(wǎng)站的訪問(wèn)行為,若其訪問(wèn)過(guò)目標(biāo)樓盤及其相似樓盤,則將該用戶加入候選線索列表,同時(shí)記錄線索用戶在各網(wǎng)站的訪問(wèn)行為;
(5)對(duì)候選線索進(jìn)行打分:對(duì)于候選線索列表里的用戶,分析其在各網(wǎng)站的行為,抽取其行為特征,使用線索打分模型進(jìn)行打分,打分結(jié)果大于閾值Z的線索作為潛在線索;
(6)對(duì)潛在線索進(jìn)行過(guò)濾,得到潛在線索列表;
(7)對(duì)于潛在線索列表里的用戶,訪問(wèn)用戶ID知識(shí)庫(kù),得到其聯(lián)系方式,提供給開(kāi)發(fā)商進(jìn)行營(yíng)銷。
本發(fā)明基于第三方大數(shù)據(jù),綜合分析用戶在多個(gè)房產(chǎn)電商網(wǎng)站以及其他網(wǎng)站上的訪問(wèn)行為,交叉驗(yàn)證,從而能夠得到更多更有效的登陸與未登陸用戶的銷售線索,幫助樓盤進(jìn)行營(yíng)銷。
更進(jìn)一步地,所述步驟(1)包括以下分步驟:
(1.1)抓取多個(gè)網(wǎng)站的房產(chǎn)數(shù)據(jù),建立完整、統(tǒng)一的房產(chǎn)知識(shí)庫(kù),對(duì)不同網(wǎng)站表述不同的同一樓盤、新房與二手房進(jìn)行統(tǒng)一;
(1.2)根據(jù)ip與設(shè)備編號(hào),以session為單位分析客戶在所有網(wǎng)站的行為,建立其登陸id與集奧ID的映射關(guān)系,集奧ID是集奧公司為客戶分配的唯一ID,通過(guò)id-mapping映射清洗后將客戶在各種網(wǎng)站的行為串聯(lián)起來(lái)(例如,舉個(gè)簡(jiǎn)單例子,集奧ID可以和手機(jī)的imei號(hào)關(guān)聯(lián),那么所有在同一部手機(jī)上登錄過(guò)的賬號(hào)都可以歸屬到一個(gè)GID下邊,也可以和一個(gè)ip地址或者別的標(biāo)識(shí)符關(guān)聯(lián));
(1.3)分析客戶在購(gòu)物、投資網(wǎng)站的行為,預(yù)估其經(jīng)濟(jì)水平與消費(fèi)能力,按照閾值分別設(shè)置為低、中、高三個(gè)級(jí)別;
(1.4)分析客戶在房產(chǎn)與購(gòu)物、資訊、裝修網(wǎng)站上的行為,若最近關(guān)注裝修、房貸信息的頻率大于關(guān)注房源信息的M倍,則判定為近期已購(gòu)房;
(1.5)分析客戶在各網(wǎng)站的行為,若命中高風(fēng)險(xiǎn)規(guī)則,則標(biāo)記為高風(fēng)險(xiǎn)人群。
另外,所述步驟(2)中,基于屬性的挖掘方法為:對(duì)于每一個(gè)樓盤,根據(jù)房產(chǎn)知識(shí)庫(kù),找出于其位置、均價(jià)、總價(jià)類似的樓盤,將位置距離小于M公里,均價(jià)差異在X%以內(nèi),總價(jià)差異小于Y%的樓盤,作為其相似樓盤,其中M,X,Y是用戶設(shè)定值。
另外,所述步驟(2)中,基于行為的挖掘方法為:根據(jù)用戶的訪問(wèn)記錄,對(duì)于樓盤A,B,統(tǒng)計(jì)所有同時(shí)訪問(wèn)了A,B的用戶,累加他們?cè)L問(wèn)A的次數(shù)為U,累加他們?cè)L問(wèn)B的次數(shù)為V,則A,B間的相似度貢獻(xiàn)為min(U,V)/max(U,V);對(duì)于樓盤A,共同訪問(wèn)次數(shù)大于P,相似度大于閾值Q的樓盤為其相似樓盤;其中U,V,P,Q是用戶設(shè)定值。
另外,所述步驟(3)包括以下分步驟:
(3.1)訓(xùn)練樣本的選擇:選擇時(shí)間節(jié)點(diǎn)T之前一個(gè)月訪問(wèn)過(guò)目標(biāo)樓盤及其相似的用戶的行為數(shù)據(jù),作為訓(xùn)練樣本;
(3.2)訓(xùn)練目標(biāo)的標(biāo)記:根據(jù)時(shí)間節(jié)點(diǎn)T之后一周該用戶是否訪問(wèn)過(guò)目標(biāo)樓盤,作為訓(xùn)練目標(biāo),若訪問(wèn)過(guò),則樣本數(shù)據(jù)標(biāo)記為1,沒(méi)訪問(wèn)過(guò),則樣本數(shù)據(jù)標(biāo)記為0;
(3.3)樣本特征的抽?。簭挠?xùn)練樣本的行為數(shù)據(jù)中抽取特征,包括:客戶在各房產(chǎn)網(wǎng)站各樓盤的細(xì)致瀏覽行為、客戶在各房產(chǎn)網(wǎng)站對(duì)同一樓盤的訪問(wèn)行為加權(quán)后作為整體特征、客戶訪問(wèn)的樓盤的特征、客戶在非房產(chǎn)網(wǎng)站的瀏覽行為;
(3.4)模型的訓(xùn)練:使用邏輯回歸模型對(duì)樣本進(jìn)行訓(xùn)練,得到線索打分模型。
另外,所述步驟(6)中,過(guò)濾包括:最近已購(gòu)房過(guò)濾、低消費(fèi)能力過(guò)濾、高風(fēng)險(xiǎn)過(guò)濾。
以下給出一個(gè)具體實(shí)施例。
以為北京市昌平區(qū)某樓盤“XX家園”挖掘潛力客戶為例,該樓盤為分期開(kāi)發(fā),前兩期已入住,在搜房網(wǎng),鏈家網(wǎng),我愛(ài)我家等房產(chǎn)網(wǎng)站均有房源信息。具體過(guò)程如下:
1.知識(shí)庫(kù)的建立:需要建立房產(chǎn)知識(shí)庫(kù)、用戶ID知識(shí)庫(kù)、用戶消費(fèi)能力知識(shí)庫(kù)、用戶購(gòu)房知識(shí)庫(kù)和用戶風(fēng)險(xiǎn)知識(shí)庫(kù)。具體如下:
1)抓取搜房網(wǎng),鏈家網(wǎng),我愛(ài)我家等房產(chǎn)網(wǎng)站的房產(chǎn)數(shù)據(jù),建立完整、統(tǒng)一的房產(chǎn)知識(shí)庫(kù)。除了抓取必要的房產(chǎn)位置,均價(jià),面積,總價(jià),房源數(shù),開(kāi)發(fā)商,建成日期,配套設(shè)施,物業(yè)公司等資料外,統(tǒng)一還包括兩層含義:
a)同一樓盤在不同網(wǎng)站表述的統(tǒng)一。對(duì)于部分網(wǎng)站某些屬性進(jìn)行補(bǔ)充,對(duì)于同一網(wǎng)站同一小區(qū)的信息進(jìn)行匯總。
b)新房與二手房的統(tǒng)一,不少樓盤是分期售賣的,同時(shí)存在新房和二手房可售,需要保證客戶在新房和二手房的訪問(wèn)行為可被一起分析。
2)用戶ID知識(shí)庫(kù)的建立:使用第三方大數(shù)據(jù)平臺(tái),分析用戶的歷史訪問(wèn)記錄,根據(jù)ip與設(shè)備編號(hào),以session為單位分析客戶在搜房網(wǎng),鏈家網(wǎng),我愛(ài)我家等房產(chǎn)網(wǎng)站,百度、youku,微信,qq等娛樂(lè)網(wǎng)站以及在京東,淘寶,陸金所等購(gòu)物理財(cái)網(wǎng)站所有網(wǎng)站的行為,建立其登陸id與GID(集奧id)的映射關(guān)系。
3)用戶消費(fèi)能力知識(shí)庫(kù)的建立:分析客戶在購(gòu)物、投資網(wǎng)站的行為,預(yù)估其經(jīng)濟(jì)水平與消費(fèi)能力,按照閾值分別設(shè)置為低、中、高三個(gè)級(jí)別。
4)用戶購(gòu)房知識(shí)庫(kù)的建立:分析客戶在房產(chǎn)與購(gòu)物、資訊、裝修網(wǎng)站上的行為,若最近關(guān)注裝修、房貸信息的頻率大于關(guān)注房源信息的M倍,則判定為近期已購(gòu)房。
5)用戶風(fēng)險(xiǎn)知識(shí)庫(kù)的建立:分析其在各網(wǎng)站的行為,若命中賭博,博彩等高風(fēng)險(xiǎn)規(guī)則,則標(biāo)記為高風(fēng)險(xiǎn)人群。
2.相似樓盤挖掘,相似樓盤挖掘綜合采用兩個(gè)方法,基于屬性的挖掘與基于行為的挖掘。具體如下:
1)基于屬性的挖掘方法:對(duì)于每一個(gè)樓盤,根據(jù)1中建立的房產(chǎn)知識(shí)庫(kù),找出于其位置,均價(jià),總價(jià)類似的樓盤,將位置距離小于M公里,均價(jià)差異在X%以內(nèi),總價(jià)差異小于Y%的樓盤,作為其相似樓盤。則挖掘出“XX家園”附近價(jià)位相似的樓盤列表。
2)基于行為的挖掘方法:根據(jù)用戶的訪問(wèn)記錄,對(duì)于樓盤A,B,統(tǒng)計(jì)所有同時(shí)訪問(wèn)了A,B的用戶,累加他們?cè)L問(wèn)A的次數(shù)為U,累加他們?cè)L問(wèn)B的次數(shù)為V,則A,B間的相似度貢獻(xiàn)min(U,V)/max(U,V)。對(duì)于樓盤A,共同訪問(wèn)次數(shù)大于P,相似度大于閾值Q的樓盤為其相似樓盤。“XX家園”位于地鐵沿線,可以挖掘出“XX家園”同一地鐵線3站距離的“YY家園”等樓盤。
3.線索打分模型的建立,包括如下步驟訓(xùn)練樣本的選擇,樣本特征的抽取,模型的訓(xùn)練。具體如下:
1)訓(xùn)練樣本的選擇:選擇時(shí)間節(jié)點(diǎn)T之前一個(gè)月訪問(wèn)過(guò)目標(biāo)樓盤及其相似的用戶的行為數(shù)據(jù),作為訓(xùn)練樣本。
2)訓(xùn)練目標(biāo)的標(biāo)記:根據(jù)時(shí)間節(jié)點(diǎn)T之后一周該用戶是否訪問(wèn)過(guò)目標(biāo)樓盤,作為訓(xùn)練目標(biāo),若訪問(wèn)過(guò),則樣本數(shù)據(jù)標(biāo)記為1,沒(méi)訪問(wèn)過(guò),則樣本數(shù)據(jù)標(biāo)記為0。
3)樣本特征的抽?。簭挠?xùn)練樣本的行為數(shù)據(jù)中抽取特征,包括以下幾大類:
a)客戶在各房產(chǎn)網(wǎng)站各樓盤的細(xì)致瀏覽行為;
b)客戶在各房產(chǎn)網(wǎng)站對(duì)同一樓盤的訪問(wèn)行為加權(quán)后作為整體特征;
c)客戶訪問(wèn)的樓盤的特征;
d)客戶在非房產(chǎn)網(wǎng)站的瀏覽行為。
4)模型的訓(xùn)練,使用邏輯回歸模型對(duì)樣本進(jìn)行訓(xùn)練,得到最終的線索打分模型。
4.候選線索的選?。悍治鲎罱欢螘r(shí)間用戶在各網(wǎng)站的訪問(wèn)行為,若其訪問(wèn)過(guò)目標(biāo)樓盤及其相似樓盤,則將該用戶加入候選線索列表,同時(shí)記錄線索用戶在各網(wǎng)站的訪問(wèn)行為。
5.候選線索的打分:對(duì)于上一步候選線索列表里的用戶,分析其在各網(wǎng)站的行為,抽取其行為特征,使用線索打分模型進(jìn)行打分,打分結(jié)果大于閾值Z的線索作為潛在線索。
6.潛在線索過(guò)濾:對(duì)于上一步潛在線索列表里的用戶,進(jìn)行一下三個(gè)方面的過(guò)濾,最近已購(gòu)房過(guò)濾、低消費(fèi)能力過(guò)濾與高風(fēng)險(xiǎn)過(guò)濾。
1)若潛在線索的消費(fèi)能力為低,則從挖掘結(jié)果中移除該條線索
2)若潛在線索在已購(gòu)房線索庫(kù)中,則從挖掘結(jié)果中移除該條線索
3)若潛在線索在高風(fēng)險(xiǎn)線索庫(kù)中,則從挖掘結(jié)果中移除該條線索
7.線索信息的提供,對(duì)于上一步的潛在線索列表里的用戶,訪問(wèn)用戶ID知識(shí)庫(kù),得到其更準(zhǔn)確的聯(lián)系方式,提供給開(kāi)發(fā)商進(jìn)行營(yíng)銷。例如某用戶訪問(wèn)了鏈家網(wǎng)站的A樓盤信息,但并未登陸,通過(guò)查詢用戶ID知識(shí)庫(kù)知道,這個(gè)用戶ID曾經(jīng)登陸過(guò)微信賬號(hào)123456,則可更精準(zhǔn)的定位到用戶進(jìn)行營(yíng)銷。
本發(fā)明的有益效果如下:
1.使用第三方大數(shù)據(jù)平臺(tái),綜合分析線索在各房產(chǎn)營(yíng)銷網(wǎng)站行為,建立行為模型,進(jìn)行購(gòu)買意向評(píng)估,增加了銷售線索的覆蓋范圍,提升了發(fā)現(xiàn)銷售線索的速度。
2.房產(chǎn)網(wǎng)站ID與非房產(chǎn)網(wǎng)站ID統(tǒng)一映射到內(nèi)部的GID,擴(kuò)充了對(duì)匿名用戶的識(shí)別能力。
3.綜合先做非房產(chǎn)網(wǎng)站的行為,預(yù)估驗(yàn)證銷售線索的消費(fèi)能力與風(fēng)險(xiǎn)程度的方法,提升了銷售線索的精準(zhǔn)程度。
以上所述,僅是本發(fā)明的較佳實(shí)施例,并非對(duì)本發(fā)明作任何形式上的限制,凡是依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均仍屬本發(fā)明技術(shù)方案的保護(hù)范圍。