本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種確定目標(biāo)用戶的方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)的不斷發(fā)展,越來(lái)越多的產(chǎn)品銷售方通過(guò)互聯(lián)網(wǎng)進(jìn)行產(chǎn)品信息的發(fā)布。
現(xiàn)有技術(shù)中,產(chǎn)品銷售方可以將其銷售的產(chǎn)品的相關(guān)信息發(fā)布在產(chǎn)品交易網(wǎng)站(例如新車交易網(wǎng)站或者二手車交易網(wǎng)站等)中,用戶通過(guò)瀏覽產(chǎn)品交易網(wǎng)站來(lái)獲得產(chǎn)品的相關(guān)信息,并可以通過(guò)產(chǎn)品交易網(wǎng)站中所提供的聯(lián)系方式與產(chǎn)品銷售方進(jìn)行聯(lián)系溝通。
但是,現(xiàn)有技術(shù)中,產(chǎn)品銷售方只能被動(dòng)的等待用戶與其進(jìn)行聯(lián)系,而無(wú)法獲得有購(gòu)買意愿的用戶。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種確定目標(biāo)用戶的方法及裝置,用以解決現(xiàn)有技術(shù)中產(chǎn)品銷售方只能被動(dòng)的等待用戶與其進(jìn)行聯(lián)系,而無(wú)法獲得有購(gòu)買意愿的用戶的問(wèn)題。
第一方面,本發(fā)明提供一種確定目標(biāo)用戶的方法,包括:
根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中多個(gè)用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型;所述第一用戶集由通過(guò)所述產(chǎn)品交易網(wǎng)站聯(lián)系所述同一類產(chǎn)品對(duì)應(yīng)的產(chǎn)品銷售方并購(gòu)買所述產(chǎn)品銷售方所銷售的產(chǎn)品的所有用戶組成;
根據(jù)所述預(yù)測(cè)模型以及所述產(chǎn)品交易網(wǎng)站的第二用戶集中各用戶的訪問(wèn)行為信息,從所述第二用戶集中確定出目標(biāo)用戶;所述第二用戶集由瀏覽所述同一類產(chǎn)品的所有用戶中除所述第一用戶集包括的用戶之外的所有用戶組成。
可選的,所述根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中多個(gè)用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型,包括:
根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第一用戶以及所述第二用戶集中多個(gè)第二用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,確定所述預(yù)測(cè)模型。
可選的,所述根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第一用戶以及所述第二用戶集中多個(gè)第二用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,確定所述預(yù)測(cè)模型,包括:
根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第一用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,生成正向訓(xùn)練樣本;
根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第二用戶集中多個(gè)第二用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,生成負(fù)向訓(xùn)練樣本;
根據(jù)所述正向訓(xùn)練樣本、所述負(fù)向訓(xùn)練樣本以及預(yù)設(shè)算法,確定所述預(yù)測(cè)模型。
可選的,所述預(yù)設(shè)算法包括:邏輯回歸算法、決策樹(shù)算法或者隨機(jī)森林算法。
可選的,所述根據(jù)所述正向訓(xùn)練樣本、所述負(fù)向訓(xùn)練樣本以及預(yù)設(shè)算法,確定所述預(yù)測(cè)模型之后,還包括:
根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第三用戶以及所述第二用戶集中多個(gè)第四用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,對(duì)所述預(yù)測(cè)模型進(jìn)行優(yōu)化。
可選的,所述根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中多個(gè)用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型之前,還包括:
獲取所述產(chǎn)品銷售方的反饋信息,所述反饋信息用于指示所述第一用戶集。
可選的,所述訪問(wèn)行為信息包括下述中的至少一種:
瀏覽頁(yè)面數(shù)、頁(yè)面瀏覽時(shí)長(zhǎng)、瀏覽產(chǎn)品數(shù)、瀏覽產(chǎn)品詳情頁(yè)數(shù)、瀏覽產(chǎn)品詳情頁(yè)時(shí)長(zhǎng)、搜索次數(shù)。
第二方面,本發(fā)明提供一種確定目標(biāo)用戶的裝置,包括:
預(yù)測(cè)模型確定模塊,用于根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中多個(gè)用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型;所述第一用戶集由通過(guò)所述產(chǎn)品交易網(wǎng)站聯(lián)系所述同一類產(chǎn)品對(duì)應(yīng)的產(chǎn)品銷售方并購(gòu)買所述產(chǎn)品銷售方所銷售的產(chǎn)品的所有用戶組成;
目標(biāo)用戶確定模塊,用于根據(jù)所述預(yù)測(cè)模型以及所述產(chǎn)品交易網(wǎng)站的第二用戶集中各用戶的訪問(wèn)行為信息,從所述第二用戶集中確定出目標(biāo)用戶;所述第二用戶集由瀏覽所述同一類產(chǎn)品的所有用戶中除所述第一用戶集包括的用戶之外的所有用戶組成。
可選的,所述預(yù)測(cè)模型確定模塊,具體用于:
根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第一用戶以及所述第二用戶集中多個(gè)第二用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,確定所述預(yù)測(cè)模型。
可選的,所述預(yù)測(cè)模型確定模塊,包括:
正向訓(xùn)練樣本子模塊,用于根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第一用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,生成正向訓(xùn)練樣本;
負(fù)向訓(xùn)練樣本子模塊,用于根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第二用戶集中多個(gè)第二用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,生成負(fù)向訓(xùn)練樣本;
確定子模塊,用于根據(jù)所述正向訓(xùn)練樣本、所述負(fù)向訓(xùn)練樣本以及預(yù)設(shè)算法,確定所述預(yù)測(cè)模型。
可選的,所述預(yù)設(shè)算法包括:邏輯回歸算法、決策樹(shù)算法或者隨機(jī)森林算法。
可選的,所述裝置還包括:優(yōu)化模塊,用于根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第三用戶以及所述第二用戶集中多個(gè)第四用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,對(duì)所述預(yù)測(cè)模型進(jìn)行優(yōu)化。
可選的,所述裝置還包括:獲取模塊,用于獲取所述產(chǎn)品銷售方的反饋信息,所述反饋信息用于指示所述第一用戶集。
可選的,所述訪問(wèn)行為信息包括下述中的至少一種:
瀏覽頁(yè)面數(shù)、頁(yè)面瀏覽時(shí)長(zhǎng)、瀏覽產(chǎn)品數(shù)、瀏覽產(chǎn)品詳情頁(yè)數(shù)、瀏覽產(chǎn)品詳情頁(yè)時(shí)長(zhǎng)、搜索次數(shù)。
本發(fā)明提供的確定目標(biāo)用戶的方法及裝置,通過(guò)根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中多個(gè)用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型,根據(jù)所述預(yù)測(cè)模型以及所述產(chǎn)品交易網(wǎng)站的第二用戶集中各用戶的訪問(wèn)行為信息,從所述第二用戶集中確定出目標(biāo)用戶,從而獲得了有購(gòu)買意愿的用戶,使得產(chǎn)品銷售商可以針對(duì)有購(gòu)買意愿的用戶進(jìn)行有效的產(chǎn)品推廣。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明確定目標(biāo)用戶的方法實(shí)施例一的流程圖;
圖2為本發(fā)明確定目標(biāo)用戶的方法實(shí)施例二的流程圖;
圖3為本發(fā)明確定目標(biāo)用戶的方法實(shí)施例三的流程圖;
圖4為本發(fā)明一實(shí)施例示出的確定目標(biāo)用戶的流程圖;
圖5為本發(fā)明一實(shí)施例示出的對(duì)預(yù)測(cè)模型進(jìn)行優(yōu)化的流程圖;
圖6為本發(fā)明確定目標(biāo)用戶的裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
圖1為本發(fā)明確定目標(biāo)用戶的方法實(shí)施例一的流程圖,本實(shí)施例的方法可以由能夠從產(chǎn)品交易網(wǎng)站獲得用戶的訪問(wèn)行為信息的任何設(shè)備來(lái)執(zhí)行。如圖1所示,本實(shí)施例的方法可以包括:
步驟101、根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中多個(gè)用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型;所述第一用戶集由通過(guò)所述產(chǎn)品交易網(wǎng)站聯(lián)系所述同一類產(chǎn)品對(duì)應(yīng)的產(chǎn)品銷售方并購(gòu)買所述產(chǎn)品銷售方所銷售的產(chǎn)品的所有用戶組成。
本步驟中,所述產(chǎn)品交易網(wǎng)站例如可以為二手車交易網(wǎng)站、新車交易網(wǎng)站等。對(duì)于同一類產(chǎn)品的理解,例如可以為:不同型號(hào)的手機(jī)可以認(rèn)為是同一類產(chǎn)品,即手機(jī);不同型號(hào)的汽車也可以認(rèn)為是同一類產(chǎn)品,即汽車。并且,由于屬于所述同一類產(chǎn)品的不同產(chǎn)品的產(chǎn)品銷售方可以為為一個(gè)或多個(gè),因此所述同一類產(chǎn)品對(duì)應(yīng)的產(chǎn)品銷售方的個(gè)數(shù)也可以為一個(gè)或多個(gè)。所述預(yù)測(cè)模型為數(shù)學(xué)模型。具體的,可以通過(guò)算法建模的方式確定所述預(yù)測(cè)模型??蛇x的,可以根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中所有用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型;或者,也可以根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中部分用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型。
步驟102、根據(jù)所述預(yù)測(cè)模型以及所述產(chǎn)品交易網(wǎng)站的第二用戶集中各用戶的訪問(wèn)行為信息,從所述第二用戶集中確定出目標(biāo)用戶;所述第二用戶集由瀏覽所述同一類產(chǎn)品的所有用戶中除所述第一用戶集包括的用戶之外的所有用戶組成。
本步驟中,具體的,可以首先對(duì)第二用戶集中的各用戶的訪問(wèn)行為信息進(jìn)行處理,獲得能夠用于所述預(yù)測(cè)模型的特征信息;之后,將所獲得的特征信息輸入至所述預(yù)測(cè)模型,并通過(guò)所述預(yù)測(cè)模型的輸出確定第二用戶集中的各用戶是否有購(gòu)買意愿。需要說(shuō)明的是,本步驟中的用戶應(yīng)該為實(shí)際存在的用戶,所對(duì)應(yīng)的訪問(wèn)行為信息也應(yīng)該是為由實(shí)際存在的用戶所產(chǎn)生的訪問(wèn)行為信息。為了提高有效性,在步驟102之前可以通過(guò)預(yù)設(shè)條件區(qū)分出非實(shí)際存在的用戶所產(chǎn)生的訪問(wèn)行為信息(即,爬蟲(chóng)數(shù)據(jù)),該預(yù)設(shè)條件例如可以為點(diǎn)擊量條件等。需要說(shuō)明的是,本發(fā)明中的目標(biāo)用戶即為有購(gòu)買意愿的用戶。
本實(shí)施例中,通過(guò)根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中多個(gè)用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型,根據(jù)所述預(yù)測(cè)模型以及所述產(chǎn)品交易網(wǎng)站的第二用戶集中各用戶的訪問(wèn)行為信息,從所述第二用戶集中確定出目標(biāo)用戶,從而獲得了有購(gòu)買意愿的用戶,使得產(chǎn)品銷售商可以針對(duì)有購(gòu)買意愿的用戶進(jìn)行有效的產(chǎn)品推廣。
圖2為本發(fā)明確定目標(biāo)用戶的方法實(shí)施例二的流程圖,本實(shí)施例的方法在圖1所示方法實(shí)施例的基礎(chǔ)上,主要描述了根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中多個(gè)用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型的一種可選的實(shí)現(xiàn)方式。如圖2所示,本實(shí)施例的方法可以包括:
步驟201、根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第一用戶以及所述第二用戶集中多個(gè)第二用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,確定所述預(yù)測(cè)模型。
本步驟中,確定預(yù)測(cè)模型時(shí)的第一用戶的個(gè)數(shù)與第二用戶的個(gè)數(shù)都為多個(gè),優(yōu)選的,兩者的個(gè)數(shù)相同或者個(gè)數(shù)的差值小于或等于預(yù)設(shè)閾值。其中,所述訪問(wèn)行為信息具體可以為與訪問(wèn)行為有關(guān)的所有信息或者部分信息。可選的,所述訪問(wèn)行為信息可以包括下述中的至少一種:瀏覽頁(yè)面數(shù)、頁(yè)面瀏覽時(shí)長(zhǎng)、瀏覽產(chǎn)品數(shù)、瀏覽產(chǎn)品詳情頁(yè)數(shù)、瀏覽產(chǎn)品詳情頁(yè)時(shí)長(zhǎng)、搜索次數(shù)??蛇x的,可以從用戶的原始訪問(wèn)日志中獲取用戶的訪問(wèn)行為信息??蛇x的,步驟201具體可以包括如下步驟2011-步驟2013。
步驟2011、根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第一用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,生成正向訓(xùn)練樣本。
本步驟中,可以通過(guò)對(duì)第一用戶集中的多個(gè)第一用戶的訪問(wèn)行為信息進(jìn)行處理,獲得能夠用于對(duì)預(yù)測(cè)模型進(jìn)行訓(xùn)練的特征信息,即訓(xùn)練樣本,并將所獲得的訓(xùn)練樣本作為正向訓(xùn)練樣本。
步驟2012、根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第二用戶集中多個(gè)第二用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,生成負(fù)向訓(xùn)練樣本。
本步驟中,可以通過(guò)對(duì)第二用戶集中的多個(gè)第二用戶的訪問(wèn)行為信息進(jìn)行處理,獲得能夠用于對(duì)預(yù)測(cè)模型進(jìn)行訓(xùn)練的特征信息,即訓(xùn)練樣本,并將所獲得的訓(xùn)練樣本作為負(fù)向訓(xùn)練樣本。
需要說(shuō)明的是,步驟2011與步驟2012之間并沒(méi)有先后順序的限制。
步驟2013、根據(jù)所述正向訓(xùn)練樣本、所述負(fù)向訓(xùn)練樣本以及預(yù)設(shè)算法,確定所述預(yù)測(cè)模型。
本步驟中,所述預(yù)設(shè)算法例如可以為邏輯回歸算法、決策樹(shù)算法或者隨機(jī)森林算法等。當(dāng)為邏輯回歸算法時(shí)具體可以為二分類邏輯回歸算法。具體的,可以通過(guò)所述正向訓(xùn)練樣本、所述負(fù)向訓(xùn)練樣本對(duì)所述預(yù)設(shè)算法實(shí)現(xiàn)的預(yù)測(cè)模型進(jìn)行訓(xùn)練,最終確定所述預(yù)測(cè)模型。
可選的,步驟101或步驟201之前還可以包括:獲取所述產(chǎn)品銷售方的反饋信息,所述反饋信息用于指示所述第一用戶集。由于產(chǎn)品交易網(wǎng)站的用戶最終是否在產(chǎn)品銷售方購(gòu)買產(chǎn)品通常需要在產(chǎn)品銷售方獲得,因此需要通過(guò)獲取產(chǎn)品銷售方用于指示所述第一用戶集的反饋信息,并根據(jù)該反饋信息確定用于確定所述預(yù)測(cè)模型的多個(gè)第一用戶和多個(gè)第二用戶。
可選的,步驟102之后還可以包括:將所述目標(biāo)用戶推送給所述產(chǎn)品銷售方。具體的,可以通過(guò)向所述產(chǎn)品銷售方發(fā)送郵件或短信等方式將所述目標(biāo)用戶推送給所述產(chǎn)品銷售方??蛇x的,可以將所述目標(biāo)用戶的聯(lián)系信息推送給所述產(chǎn)品銷售方,所述聯(lián)系信息可以包括聯(lián)系電話和/或郵箱等,所述聯(lián)系信息還可以包括姓名。
本實(shí)施例中,通過(guò)同時(shí)根據(jù)由通過(guò)所述產(chǎn)品交易網(wǎng)站聯(lián)系所述同一類產(chǎn)品對(duì)應(yīng)的產(chǎn)品銷售方并購(gòu)買所述產(chǎn)品銷售方所銷售的產(chǎn)品的所有用戶組成的第一用戶集中的用戶與由瀏覽所述同一類產(chǎn)品的所有用戶中除第一用戶集所包括的用戶之外的所有用戶組成的第二用戶集中的用戶的對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型,提高了預(yù)測(cè)模型的準(zhǔn)確性,從而也提高了所確定的目標(biāo)用戶的準(zhǔn)確性。
圖3為本發(fā)明確定目標(biāo)用戶的方法實(shí)施例三的流程圖。如圖3所示,本實(shí)施例的方法在圖2所示方法實(shí)施例的基礎(chǔ)上,為了進(jìn)一步提高所確定的預(yù)測(cè)模型的準(zhǔn)確性,在步驟201之后具體還可以包括以下步驟:
步驟301、根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第三用戶以及所述第二用戶集中多個(gè)第四用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,對(duì)所述預(yù)測(cè)模型進(jìn)行優(yōu)化。
本步驟中,所述第三用戶與上述第一用戶為不同的用戶,所述第四用戶與上述第二用戶為不同的用戶。即,用于確定預(yù)測(cè)模型的用戶與用戶優(yōu)化預(yù)測(cè)模型的用戶不同??蛇x的,步驟301具體可以包括如下步驟3011-步驟3013。
步驟3011、根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第三用戶以及所述第二用戶集中多個(gè)第四用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,生成測(cè)試樣本。
需要說(shuō)明的是,步驟3011中生成測(cè)試樣本的方式與步驟2011、步驟2012中生成訓(xùn)練樣本的方式類似,在此不再贅述。
步驟3012、根據(jù)所述測(cè)試樣本對(duì)所述預(yù)測(cè)模型進(jìn)行測(cè)試,獲得測(cè)試結(jié)果。
本步驟中,所述測(cè)試結(jié)果例如可以為受試者工作特征(ROC,Receiver Operating Characteristic)曲線,F(xiàn)1分?jǐn)?shù)(F1SCORE),F(xiàn)2分?jǐn)?shù)(F2SCORE)或召回率(RECALL)等。
步驟3013、根據(jù)所述測(cè)試結(jié)果對(duì)所述預(yù)測(cè)模型進(jìn)行優(yōu)化。
本步驟中,具體的,可以根據(jù)所述測(cè)試結(jié)果對(duì)所述預(yù)測(cè)模型所基于的預(yù)設(shè)算法的相關(guān)參數(shù)進(jìn)行調(diào)整來(lái)實(shí)現(xiàn)對(duì)所述預(yù)測(cè)模型的優(yōu)化。其中,所述相關(guān)參數(shù)例如可以為特征參數(shù)、算法參數(shù)、樣本參數(shù)等。
本實(shí)施例中,通過(guò)根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第三用戶以及所述第二用戶集中多個(gè)第四用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,對(duì)所述預(yù)測(cè)模型進(jìn)行優(yōu)化,進(jìn)一步提高了預(yù)測(cè)模型的準(zhǔn)確性,從而也提高了所確定的目標(biāo)用戶的準(zhǔn)確性。
圖4為本發(fā)明一實(shí)施例示出的確定目標(biāo)用戶的流程圖,圖4中以二手車交易網(wǎng)站為例進(jìn)行說(shuō)明。如圖4所示,首先,從各用戶的原始訪問(wèn)日志中清洗出各用戶的訪問(wèn)行為信息,該訪問(wèn)行為信息具體可以包括瀏覽二手車數(shù)、瀏覽二手車詳情頁(yè)數(shù)、瀏覽二手車詳情頁(yè)時(shí)長(zhǎng)、搜索次數(shù)等。之后,根據(jù)二手車銷售方提供的通過(guò)二手車交易網(wǎng)站與其聯(lián)系并購(gòu)買二手車的用戶的用戶信息以及各用戶的訪問(wèn)行為信息,確定第一用戶集和第二用戶集。其中,二手車銷售方提供的用戶信息一般包括的是用戶姓名和聯(lián)系電話,而二手車交易網(wǎng)站中一般使用用戶的標(biāo)識(shí)(ID,IDentity)來(lái)區(qū)分用戶,因此可以通二手車交易網(wǎng)站中用戶的注冊(cè)信息中包括的姓名和聯(lián)系電話以及二手車銷售方提供的用戶的用戶信息中包括的姓名和聯(lián)系電話,來(lái)確定二手車銷售方提供的用戶在二手車交易網(wǎng)站中的用戶ID。之后,通過(guò)第一用戶集和第二用戶集對(duì)SPARK框架實(shí)現(xiàn)的二分類邏輯回歸算法進(jìn)行訓(xùn)練及測(cè)試,得到二分類邏輯回歸算法實(shí)現(xiàn)的預(yù)測(cè)模型以及對(duì)該預(yù)測(cè)模型的測(cè)試結(jié)果,并根據(jù)該測(cè)試結(jié)果對(duì)該預(yù)測(cè)模型進(jìn)行優(yōu)化,得到最終的預(yù)測(cè)模型。最后,根據(jù)最終的預(yù)測(cè)模型對(duì)第二用戶集中的各用戶進(jìn)行購(gòu)買意愿的預(yù)測(cè),確定目標(biāo)用戶。
其中,根據(jù)測(cè)試結(jié)果對(duì)二分類邏輯回歸算法的相關(guān)參數(shù)進(jìn)行調(diào)整以實(shí)現(xiàn)對(duì)預(yù)測(cè)模型進(jìn)行優(yōu)化(即,確定最終的預(yù)測(cè)模型)的流程,可以參照?qǐng)D5。如圖5所示,二分類邏輯回歸算法的相關(guān)參數(shù)包括:樣本參數(shù)、算法參數(shù)和特征參數(shù),樣本參數(shù)包括正負(fù)樣本比例、訓(xùn)練測(cè)試集拆分比例和樣本采集數(shù)量等,算法參數(shù)包括損失函數(shù)、正則化規(guī)則、正則系數(shù)和迭代次數(shù)等,特征參數(shù)包括特征選取、特征離散化和特征歸一化等。具體的,通過(guò)調(diào)整二分類邏輯回歸算法的相關(guān)參數(shù),會(huì)影響算法實(shí)現(xiàn)的預(yù)測(cè)模型以及對(duì)算法實(shí)現(xiàn)的預(yù)測(cè)模型的測(cè)試結(jié)果;根據(jù)對(duì)二分類邏輯回歸算法實(shí)現(xiàn)的預(yù)測(cè)模型進(jìn)行測(cè)試得到的測(cè)試結(jié)果,來(lái)調(diào)整二分類邏輯回歸算法的相關(guān)參數(shù),從而確定最優(yōu)模型,即最終的預(yù)測(cè)模型。
圖6為本發(fā)明確定目標(biāo)用戶的裝置的結(jié)構(gòu)示意圖,本實(shí)施例提供的裝置可以應(yīng)用于圖1-圖3實(shí)施例的方法中,實(shí)現(xiàn)其設(shè)備的功能。如圖6所示,本實(shí)施例的裝置可以包括:預(yù)測(cè)模型確定模塊601和目標(biāo)用戶確定模塊602。其中,預(yù)測(cè)模型確定模塊601,用于根據(jù)產(chǎn)品交易網(wǎng)站的第一用戶集中多個(gè)用戶對(duì)同一類產(chǎn)品的訪問(wèn)行為信息,確定預(yù)測(cè)模型;所述第一用戶集由通過(guò)所述產(chǎn)品交易網(wǎng)站聯(lián)系所述同一類產(chǎn)品對(duì)應(yīng)的產(chǎn)品銷售方并購(gòu)買所述產(chǎn)品銷售方所銷售的產(chǎn)品的所有用戶組成;目標(biāo)用戶確定模塊602,用于根據(jù)預(yù)測(cè)模型確定模塊601確定的所述預(yù)測(cè)模型以及所述產(chǎn)品交易網(wǎng)站的第二用戶集中各用戶的訪問(wèn)行為信息,從所述第二用戶集中確定出目標(biāo)用戶;所述第二用戶集由瀏覽所述同一類產(chǎn)品的所有用戶中除所述第一用戶集包括的用戶之外的所有用戶組成。
可選的,預(yù)測(cè)模型確定模塊601,具體用于:
根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第一用戶以及所述第二用戶集中多個(gè)第二用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,確定所述預(yù)測(cè)模型。
可選的,預(yù)測(cè)模型確定模塊601,包括:正向訓(xùn)練樣本子模塊、負(fù)向訓(xùn)練樣本子模塊和確定子模塊;
所述正向訓(xùn)練樣本子模塊,用于根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第一用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,生成正向訓(xùn)練樣本;
所述負(fù)向訓(xùn)練樣本子模塊,用于根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第二用戶集中多個(gè)第二用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,生成負(fù)向訓(xùn)練樣本;
所述確定子模塊,用于根據(jù)所述正向訓(xùn)練樣本子模塊生成的所述正向訓(xùn)練樣本、所述負(fù)向訓(xùn)練樣本子模塊生成的所述負(fù)向訓(xùn)練樣本以及預(yù)設(shè)算法,確定所述預(yù)測(cè)模型。
可選的,所述預(yù)設(shè)算法包括:邏輯回歸算法、決策樹(shù)算法或者隨機(jī)森林算法。
可選的,本實(shí)施例的裝置還包括:優(yōu)化模塊603,用于根據(jù)所述產(chǎn)品交易網(wǎng)站的所述第一用戶集中多個(gè)第三用戶以及所述第二用戶集中多個(gè)第四用戶對(duì)所述同一類產(chǎn)品的訪問(wèn)行為信息,對(duì)預(yù)測(cè)模型確定模塊601確定的所述預(yù)測(cè)模型進(jìn)行優(yōu)化。
可選的,本實(shí)施例的裝置還包括:獲取模塊604,用于獲取所述產(chǎn)品銷售方的反饋信息,所述反饋信息用于指示所述第一用戶集。
可選的,所述訪問(wèn)行為信息包括下述中的至少一種:
瀏覽頁(yè)面數(shù)、頁(yè)面瀏覽時(shí)長(zhǎng)、瀏覽產(chǎn)品數(shù)、瀏覽產(chǎn)品詳情頁(yè)數(shù)、瀏覽產(chǎn)品詳情頁(yè)時(shí)長(zhǎng)、搜索次數(shù)。
本實(shí)施例的裝置,可以用于執(zhí)行圖1-圖3所示方法實(shí)施例的技術(shù)方案,其實(shí)現(xiàn)原理和技術(shù)效果類似,此處不再贅述。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:ROM、RAM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
最后應(yīng)說(shuō)明的是:以上各實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。