亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用戶屬性特征的確定方法和裝置與流程

文檔序號:11952962閱讀:393來源:國知局
一種用戶屬性特征的確定方法和裝置與流程

本發(fā)明涉及電子商務(wù)技術(shù)領(lǐng)域,尤其涉及一種用戶屬性特征的確定方法和裝置。



背景技術(shù):

隨著互聯(lián)網(wǎng)和電子商務(wù)的迅猛發(fā)展,每天都有大量的商品交易在電商網(wǎng)站上完成,各大電商平臺的商品種類、數(shù)量增長很快。隨著競爭和業(yè)務(wù)的發(fā)展,用戶的價(jià)值不斷在提高,精確定位用戶的屬性特征,通過屬性特征進(jìn)行精確的商品推廣、信息發(fā)送等用戶服務(wù),能夠提高用戶的感受度并為電商提高銷售量。用戶在電商進(jìn)行注冊,在用戶注冊過程中,系統(tǒng)為用戶對應(yīng)的虛擬對象分派唯一的用戶編碼user_id,用以對用戶進(jìn)行標(biāo)識。用戶對商品進(jìn)行瀏覽并產(chǎn)生訂單,訂單信息是用戶在購買商品時(shí)的產(chǎn)物,記錄了用戶購買的商品、數(shù)量、下單時(shí)間、商品金額等一系列信息,商品通過商品sku標(biāo)識進(jìn)行唯一標(biāo)識。

目前,對于用戶屬性特征的確定通常采用兩種方法。規(guī)則判斷:獲取用戶的購物信息,然后提取商品描述的關(guān)鍵字,再通過關(guān)鍵字定位該用戶的年齡等屬性信息。用戶簇類:通過提取用戶的購物特征,將購買相同群簇的用戶歸為一簇,同時(shí)提取每簇的屬性年齡作為該簇用戶的年齡。然而,在現(xiàn)有的用戶屬性特征的確定方法中,通過單一的規(guī)則關(guān)鍵字判斷,嚴(yán)重的依賴商品描述,武斷性太強(qiáng),同時(shí)很可能會丟失商品的部分屬性,從而導(dǎo)致用戶識別錯誤。同時(shí)對于關(guān)鍵字的詞庫維護(hù)成本太大,往往由于關(guān)鍵字的數(shù)量等因素,造成用戶屬性判斷的覆蓋度嚴(yán)重偏低。如果通過用戶群簇進(jìn)行判斷,群簇的交叉嚴(yán)重,準(zhǔn)確度往往沒有保證,普遍偏低。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明要解決的一個技術(shù)問題是提供一種用戶屬性特征的確定方法和裝置。

根據(jù)本發(fā)明的一個方面,提供一種用戶屬性特征的確定方法,包括:基于用戶屬性特征確定種子用戶所屬的用戶屬性區(qū)間;確定所述用戶屬性區(qū)間中的種子用戶所購買的種子商品對于所述用戶屬性區(qū)間的商品歸屬值;基于所述商品歸屬值確定購買了所述種子商品的非種子用戶對于所述用戶屬性區(qū)間的用戶歸屬值;根據(jù)所述用戶歸屬值確定歸屬于所述用戶屬性區(qū)間的所述非種子用戶。

可選地,確定所述用戶屬性區(qū)間中的種子用戶所購買的種子商品對于所述用戶屬性區(qū)間的商品歸屬值包括:根據(jù)用戶訂單信息獲取所述種子用戶購買的所述種子商品;統(tǒng)計(jì)出所述種子商品被全部種子用戶購買的總數(shù)量、所述種子商品被每個用戶屬性區(qū)間中的所有種子用戶購買的區(qū)間數(shù)量;確定每個區(qū)間數(shù)量與所述總數(shù)量的比值,其中,所述種子商品對于所述用戶屬性區(qū)間的商品歸屬值為與所述用戶屬性區(qū)間對應(yīng)的所述比值。

可選地,所述基于所述商品歸屬值確定購買了所述種子商品的非種子用戶對于所述用戶屬性區(qū)間的用戶歸屬值包括:根據(jù)用戶訂單信息統(tǒng)計(jì)所述非種子用戶購買的所述種子商品的數(shù)量和非種子商品的數(shù)量;基于所述種子商品的數(shù)量以及所述商品歸屬值確定所述非種子用戶對于所述用戶屬性區(qū)間的標(biāo)識商品歸屬值;基于所述非種子商品的數(shù)量確定所述非種子用戶對于所述用戶屬性區(qū)間的未標(biāo)識商品歸屬值;根據(jù)所述標(biāo)識商品歸屬值和所述未標(biāo)識商品歸屬值確定所述非種子用戶對于所述用戶屬性區(qū)間的用戶歸屬值。

可選地,計(jì)算第i個非種子用戶Ci對于第j個用戶屬性區(qū)間的用戶歸屬值

其中,P(Slj)為第i個非種子用戶購買的第l種種子商品對于第j個用戶屬性區(qū)間的商品歸屬值,l為自然數(shù),ml為第i個非種子用戶購買第l種種子商品的購買數(shù)量,f為第i個非種子用戶購買的種子商品的總量,k為第i個非種子用戶購買的未種子商品的總量,N為所述用戶屬性區(qū)間的總數(shù)。

可選地,根據(jù)所述用戶歸屬值選出歸屬于所述用戶屬性區(qū)間的所述非種子用戶包括:從所述非種子用戶對于全部用戶屬性區(qū)間的用戶歸屬值中選取最大值,如果用戶歸屬值的最大值大于歸屬門限值,則確定所述非種子用戶歸屬于與最大用戶歸屬值對應(yīng)的用戶屬性區(qū)間。

可選地,將確定的歸屬于所述用戶屬性區(qū)間的所述非種子用戶作為種子用戶,通過迭代運(yùn)算選出歸屬于所述用戶屬性區(qū)間的其它非種子用戶。

可選地,所述用戶屬性特征為年齡屬性特征,其中,所述基于用戶屬性特征確定種子用戶所屬的用戶屬性區(qū)間包括:設(shè)置年齡間隔并基于所述年齡間隔設(shè)置多個所述用戶屬性區(qū)間;根據(jù)所述種子用戶的年齡信息將所述種子用戶歸類到對應(yīng)的所述用戶屬性區(qū)間;其中,所述種子用戶包括:注冊信息通過完整性篩選的用戶、實(shí)名認(rèn)證用戶、購買了特定商品的用戶。

根據(jù)本發(fā)明的另一方面,提供一種用戶屬性特征的確定裝置,包括:用戶區(qū)間確定模塊,用于基于用戶屬性特征確定種子用戶所屬的用戶屬性區(qū)間;商品歸屬確定模塊,用于確定所述用戶屬性區(qū)間中的種子用戶所購買的種子商品對于所述用戶屬性區(qū)間的商品歸屬值;用戶歸屬確定模塊,用于基于所述商品歸屬值確定購買了所述種子商品的非種子用戶對于所述用戶屬性區(qū)間的用戶歸屬值;區(qū)間歸屬確定模塊,用于根據(jù)所述用戶歸屬值確定歸屬于所述用戶屬性區(qū)間的所述非種子用戶。

可選地,所述商品歸屬確定模塊,包括:種子商品獲取單元,用于根據(jù)用戶訂單信息獲取所述種子用戶購買的所述種子商品;商品歸屬計(jì)算單元,用于統(tǒng)計(jì)出所述種子商品被全部種子用戶購買的總數(shù)量、所述種子商品被每個用戶屬性區(qū)間中的所有種子用戶購買的區(qū)間數(shù)量;確定每個區(qū)間數(shù)量與所述總數(shù)量的比值,其中,所述種子商品對于所述用戶屬性區(qū)間的商品歸屬值為與所述用戶屬性區(qū)間對應(yīng)的所述比值。

可選地,所述用戶歸屬確定模塊,包括:購買商品統(tǒng)計(jì)單元,用于根據(jù)用戶訂單信息統(tǒng)計(jì)所述非種子用戶購買的所述種子商品的數(shù)量和非種子商品的數(shù)量;用戶歸屬計(jì)算單元,用于基于所述種子商品的數(shù)量以及所述商品歸屬值確定所述非種子用戶對于所述用戶屬性區(qū)間的標(biāo)識商品歸屬值,基于所述非種子商品的數(shù)量確定所述非種子用戶對于所述用戶屬性區(qū)間的未標(biāo)識商品歸屬值,根據(jù)所述標(biāo)識商品歸屬值和所述未標(biāo)識商品歸屬值確定所述非種子用戶對于所述用戶屬性區(qū)間的用戶歸屬值。

可選地,所述用戶歸屬計(jì)算單元,還用于計(jì)算第i個所述非種子用戶Ci對于第j個用戶屬性區(qū)間的用戶歸屬值

其中,P(Slj)為第i個非種子用戶購買的第l種種子商品對于第j個用戶屬性區(qū)間的商品歸屬值,l為自然數(shù),ml為第i個非種子用戶購買第l種種子商品的購買數(shù)量,f為第i個非種子用戶購買的種子商品的總量,k為第i個非種子用戶購買的未種子商品的總量,N為所述用戶屬性區(qū)間的總數(shù)。

可選地,所述屬性特征確定模塊,還用于從所述非種子用戶對于全部用戶屬性區(qū)間的用戶歸屬值中選取最大值,如果用戶歸屬值的最大值大于歸屬門限值,則確定所述非種子用戶歸屬于與最大用戶歸屬值對應(yīng)的用戶屬性區(qū)間。

可選地,迭代運(yùn)算處理模塊,用于將確定的歸屬于所述用戶屬性區(qū)間的所述非種子用戶作為種子用戶,通過迭代運(yùn)算選出歸屬于所述用戶屬性區(qū)間的其它非種子用戶。

可選地,所述用戶屬性特征為年齡屬性特征,其中,所述用戶區(qū)間確定模塊,用于設(shè)置年齡間隔并基于所述年齡間隔設(shè)置多個所述用戶屬性區(qū)間;根據(jù)所述種子用戶的年齡信息將所述種子用戶歸類到對應(yīng)的所述用戶屬性區(qū)間;其中,所述種子用戶包括:注冊信息通過完整性篩選的用戶、實(shí)名認(rèn)證用戶、購買了特定商品的用戶。

根據(jù)本發(fā)明的又一方面,提供一種用戶屬性特征的確定裝置,包括:存儲器;以及耦接至所述存儲器的處理器,所述處理器被配置為基于存儲在所述存儲器中的指令,執(zhí)行如上所述的用戶屬性特征的確定方法。

本發(fā)明中的用戶屬性特征的確定方法和裝置,確定種子用戶購買的種子商品對于用戶屬性區(qū)間的商品歸屬值,通過商品歸屬值確定購買了種子商品的非種子用戶歸屬的用戶屬性區(qū)間,從而確定了非種子用戶的用戶屬性特征,能夠有效提高用戶屬性特征的識別率以及準(zhǔn)確率。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為根據(jù)本發(fā)明的用戶屬性特征的確定方法的一個實(shí)施例的流程示意圖;

圖2為根據(jù)本發(fā)明的用戶屬性特征的確定方法的另一個實(shí)施例的流程示意圖;

圖3為根據(jù)本發(fā)明的用戶屬性特征的確定裝置的一個實(shí)施例的模塊示意圖;

圖4為根據(jù)本發(fā)明的用戶屬性特征的確定裝置的一個實(shí)施例中的商品歸屬確定模塊的模塊示意圖;

圖5為根據(jù)本發(fā)明的用戶屬性特征的確定裝置的一個實(shí)施例中的用戶歸屬確定模塊的模塊示意圖;

圖6為根據(jù)本發(fā)明的用戶屬性特征的確定裝置的另一個實(shí)施例的模塊示意圖。

具體實(shí)施方式

下面參照附圖對本發(fā)明進(jìn)行更全面的描述,其中說明本發(fā)明的示例性實(shí)施例。下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。下面結(jié)合每個圖和實(shí)施例對本發(fā)明的技術(shù)方案進(jìn)行多方面的描述。

圖1為根據(jù)本發(fā)明的用戶屬性特征的確定方法的一個實(shí)施例的流程示意圖,如圖1所示:

步驟101,基于用戶屬性特征確定種子用戶所屬的用戶屬性區(qū)間。

用戶屬性特征可以為年齡、職業(yè)、愛好等,用戶屬性區(qū)間是根據(jù)用戶屬性特性劃分的一個或多個區(qū)間,可以按照用戶屬性特征將種子用戶歸類或劃分到用戶屬性區(qū)間中。種子用戶是指能夠獲取完整、真實(shí)或可信的用戶屬性特征的用戶,種子用戶可以是注冊信息通過完整性篩選的用戶、實(shí)名認(rèn)證用戶、購買了特定商品的用戶等。

例如,用戶屬性特征為年齡屬性特征,可以設(shè)置年齡間隔并基于年齡間隔設(shè)置多個年齡區(qū)間,篩選年齡信息真實(shí)的用戶作為種子用戶,根據(jù)種子用戶的年齡信息將種子用戶分配到對應(yīng)的用戶屬性區(qū)間。

步驟102,確定種子用戶購買的種子商品對于用戶屬性區(qū)間的商品歸屬值。

種子商品為種子用戶所購買的商品,例如手機(jī)等,每個用戶屬性區(qū)間中的種子用戶可以購買相同的種子商品??梢圆捎枚喾N方法,確定種子商品對于每個用戶屬性區(qū)間的商品歸屬值,商品歸屬值可以為種子商品對于用戶屬性區(qū)間的區(qū)間概率、權(quán)重等,用于表征種子商品歸屬于用戶屬性區(qū)間的概率大小或緊密程度。

例如,根據(jù)用戶訂單信息獲取種子用戶購買的種子商品,統(tǒng)計(jì)出種子商品被全部種子用戶購買的總數(shù)量,將種子商品被每個用戶屬性區(qū)間中的所有種子用戶的購買數(shù)量與總數(shù)量的比值,確定為種子商品對于每個用戶屬性區(qū)間的商品歸屬值。

步驟103,基于商品歸屬值確定購買了種子商品的非種子用戶對于用戶屬性區(qū)間的用戶歸屬值。

非種子用戶即為沒有被篩選為種子用戶的其它用戶,非種子用戶的相關(guān)用戶屬性特征不完整或不可信??梢圆捎枚喾N方法確定出非種子用戶對于每個用戶屬性區(qū)間的用戶歸屬值,用戶歸屬值可以為非種子用戶對于用戶屬性區(qū)間的區(qū)間概率、權(quán)重等,用于表征非種子用戶歸屬于用戶屬性區(qū)間的概率大小或緊密程度。

例如,根據(jù)用戶訂單信息統(tǒng)計(jì)非種子用戶購買的種子商品的數(shù)量和非種子商品的數(shù)量,基于種子商品的數(shù)量以及商品歸屬值確定非種子用戶對于用戶屬性區(qū)間的標(biāo)識商品歸屬值,基于非種子商品的數(shù)量確定非種子用戶對于用戶屬性區(qū)間的未標(biāo)識商品歸屬值,根據(jù)標(biāo)識商品歸屬值和未標(biāo)識商品歸屬值確定非種子用戶對于用戶屬性區(qū)間的用戶歸屬值。

步驟104,根據(jù)用戶歸屬值選出歸屬于用戶屬性區(qū)間的非種子用戶。

根據(jù)非種子用戶對于每個用戶屬性區(qū)間的用戶歸屬值選取非種子用戶,確定非種子用戶歸屬的用戶屬性區(qū)間,能夠確定選出的非種子用戶的用戶屬性特征。

例如,從非種子用戶對于全部用戶屬性區(qū)間的用戶歸屬值中選取最大值,如果用戶歸屬值的最大值大于歸屬門限值,則確定非種子用戶歸屬于與最大用戶歸屬值對應(yīng)的用戶屬性區(qū)間。如果用戶在每個區(qū)間上的概率相同,則不能識別出用戶的年齡,則進(jìn)行下一輪的迭代運(yùn)算。歸屬門限值能夠根據(jù)具體的需求進(jìn)行調(diào)整。

將新選出的歸屬于用戶屬性區(qū)間的非種子用戶作為相應(yīng)的用戶屬性區(qū)間的新種子用戶,不斷迭代執(zhí)行步驟102、103和104,繼續(xù)確定歸屬于用戶屬性區(qū)間的其它非種子用戶,從而確定選出的非種子用戶的用戶屬性特征,直至不能選出歸屬于任何用戶屬性區(qū)間的其它非種子用戶為止。

上述實(shí)施例提供的用戶屬性特征的確定方法,對篩選出的種子用戶劃分為用戶屬性區(qū)間,確定種子用戶購買的種子商品對于用戶屬性區(qū)間的商品歸屬值,通過商品歸屬值確定購買了種子商品的非種子用戶歸屬的用戶屬性區(qū)間,從而識別出非種子用戶的用戶屬性特征,并不斷進(jìn)行迭代運(yùn)算,深度挖掘用戶屬性特征,能夠識別出更多用戶的用戶屬性特征,具有高效的擴(kuò)散屬性,可以提高用戶屬性識別的覆蓋度和識別度。

圖2為根據(jù)本發(fā)明的用戶屬性特征的確定方法的另一個實(shí)施例的流程示意圖,以用戶屬性特征為年齡為例,如圖2所示:

步驟201,篩選種子用戶。

采用多種方式篩選種子用戶,例如,對于電商網(wǎng)站的注冊用戶,種子用戶為注冊數(shù)據(jù)質(zhì)量高而且可信度很大程度接近真實(shí)的用戶,可以根據(jù)用戶注冊的年齡信息的完整性篩選種子用戶。完整性檢驗(yàn)是指判斷用戶在注冊時(shí)填寫的各部分信息的整體質(zhì)量和依賴等各種邏輯校驗(yàn)是否合理,比如年齡和婚姻狀況會存在某種程度的相關(guān)性。

通過判斷用戶是否購買了設(shè)定的特殊商品確定種子用戶,但根據(jù)特殊商品定位用戶年齡,存在一定的誤差性。通過相關(guān)業(yè)務(wù)干線獲取種子用戶,對于像京東、亞馬遜這樣的大型購物網(wǎng)站,通常會存在部分少量實(shí)名認(rèn)證用戶,具有年齡信息的實(shí)名認(rèn)證用戶可以直接作為種子用戶。

步驟202,基于年齡將種子用戶劃分為一個或多個年齡區(qū)間。

根據(jù)步驟201的篩選結(jié)果以及業(yè)務(wù)需求,確定年齡區(qū)間的數(shù)量和區(qū)間的年齡間隔,例如,以年齡間隔為5歲劃分多個年齡區(qū)間,年齡區(qū)間分成了1-15,15-20,20-25等,確定所有種子用戶歸屬的年齡區(qū)間。

步驟203,獲取各年齡區(qū)間的種子用戶購買商品的信息,確定商品對于區(qū)間集合的商品歸屬值。

例如,用戶Ci表示第i個種子用戶,訂單信息上附加有用戶Ci購物的商品Si和商品數(shù)量SNi,根據(jù)訂單信息統(tǒng)計(jì)每個年齡區(qū)間中的種子用戶購買的商品和商品數(shù)量,計(jì)算每個商品Si在各年齡區(qū)間Nj上的概率:P(Sij)=商品Si被年齡區(qū)間Nj中的所有種子用戶購買的數(shù)量/商品Si被全部種子用戶購買的總量。

例如,蘋果手機(jī)為第j個商品Sj,商品Sj被所有種子用戶購買的數(shù)量為1萬件,商品Sj在1-15歲年齡區(qū)間(年齡區(qū)間1)中的銷量為500件,商品Sj在15-20年齡區(qū)間(年齡區(qū)間2)中銷量為1000件,商品Sj在20-25年齡區(qū)間(年齡區(qū)間3)中銷量為500件,則P(S1j)=500/10000,P(S2j)=1000/10000,P(S3j)=5000/10000。

可以通過P(Sij)確定商品Si在年齡區(qū)間Nj上的年齡區(qū)間概率,同理可以獲取每個種子商品在個年齡區(qū)間上的年齡區(qū)間概率,即商品歸屬值。

步驟204,確定購買了商品的其它用戶,基于商品區(qū)間概率計(jì)算出其它用戶歸屬于各年齡區(qū)間的用戶歸屬值。

通過在步驟203計(jì)算出的種子商品的年齡區(qū)間概率,判斷新的用戶歸屬年齡區(qū)間的概率,使用如下假設(shè)條件:用戶購買的商品年齡歸屬事件為相互獨(dú)立,對于用戶購買商品,種子商品和非種子商品(標(biāo)識商品和未標(biāo)識商品)相互獨(dú)立,同時(shí)對于用戶購買的商品,初始?xì)w屬年齡區(qū)間的概率為相等,即1/N。

通過用戶購物訂單信息統(tǒng)計(jì)每個非種子用戶的購買的商品、商品數(shù)量??梢园阉械纳唐贩譃闃?biāo)識商品{F1}和未標(biāo)識{F2}。例如,一個非種子用戶共買了蘋果手機(jī),茶具,學(xué)習(xí)機(jī)三種商品。在步驟203中,確定了種子用戶購買的種子商品中已經(jīng)存在蘋果手機(jī)、茶具,但沒有學(xué)習(xí)機(jī),所以{F1}={蘋果手機(jī),茶具},{F2}={學(xué)習(xí)機(jī)}。

非種子用戶很可能買了多件商品,但是在{F1}中只是部分,所以通過均等概率來判斷商品的影響程度,即對于非種子用戶購買的未標(biāo)識的商品{F2}來說,每個未標(biāo)識的商品歸屬年齡區(qū)間的概率是一致的1/N。

在一個實(shí)施例中,計(jì)算第i個非種子用戶Ci對于第j個用戶屬性區(qū)間的用戶歸屬值

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mrow> <mo>(</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>f</mi> </msubsup> <mi>P</mi> <mo>(</mo> <msub> <mi>S</mi> <mrow> <mi>l</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> <mo>*</mo> <msub> <mi>m</mi> <mrow> <mi>l</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>*</mo> <mfrac> <mi>f</mi> <mrow> <mi>f</mi> <mo>+</mo> <mi>k</mi> </mrow> </mfrac> <mo>+</mo> <mfrac> <mn>1</mn> <mi>N</mi> </mfrac> <mo>*</mo> <mfrac> <mi>k</mi> <mrow> <mi>f</mi> <mo>+</mo> <mi>k</mi> </mrow> </mfrac> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

P(Slj)為第i個非種子用戶購買的第l種種子商品對于第j個用戶屬性區(qū)間的商品歸屬值,l為自然數(shù),ml為第i個非種子用戶購買第l種種子商品的購買數(shù)量,f為第i個非種子用戶購買的種子商品的總量,k為第i個非種子用戶購買的未種子商品的總量,N為用戶屬性區(qū)間的總數(shù)。f+k為第i個非種子用戶購買的總商品數(shù)量,f為{F1}的數(shù)量、k為{F2}的數(shù)量。其它的非種子用戶的對于用戶屬性區(qū)間的用戶歸屬值的計(jì)算方法同上。

例如,篩選了種子用戶,設(shè)置了2個年齡區(qū)間,分別為年齡區(qū)間1和年齡區(qū)間2,基于年齡將種子用戶分別歸類到年齡區(qū)間1和年齡區(qū)間2中。非種子用戶C1購買了2種種子商品和3種非種子商品,2種種子商品分別為蘋果手機(jī)和茶具,蘋果手機(jī)購買量為2個,茶具的購買量為1個,3種非種子商品的購買數(shù)量分別為1個。

蘋果手機(jī)對年齡區(qū)間1和年齡區(qū)間2的年齡區(qū)間概率,即商品歸屬值分別為:P(S11)=0.3,P(S12)=0.4。茶具對年齡區(qū)間1和年齡區(qū)間2的年齡區(qū)間概率,即商品歸屬值分別為:P(S21)=0.5,P(S22)=0.4。

將以上數(shù)值代入上述的公式(1-1)計(jì)算,其中,N=2,f=3,k=3,非種子用戶Ci對于年齡區(qū)間1的用戶歸屬值

P(C11)=(0.3×2+0.5×1)×3/6+0.5×0.5=0.8。

非種子用戶Ci對于年齡區(qū)間2的用戶歸屬值

P(C12)=(0.4×2+0.4×1)×3/6+0.5×0.5=0.85。

步驟205,根據(jù)用戶歸屬值從其它用戶中選出歸屬于年齡區(qū)間的新用戶。

設(shè)置歸屬門限值a,其中a為[0,1]常數(shù),例如,設(shè)置a=0.8。確定非種子用戶在每個年齡區(qū)間上概率的最大值MAX,如果該值MAX大于a則該用戶歸屬的年齡區(qū)間為MAX所對應(yīng)的年齡區(qū)間。例如,非種子用戶Ci對于年齡區(qū)間2的用戶歸屬值0.85為最大值,并且0.85大于歸屬門限值a=0.8,則可以確定非種子用戶C1歸屬于年齡區(qū)間2。

步驟206,判斷選出的歸屬于年齡區(qū)間的新用戶是否為空,如果為空,則結(jié)束,如果不為空,則進(jìn)行步驟207。

步驟207,將新選出的歸屬于年齡區(qū)間的非種子用戶作為種子用戶,通過迭代運(yùn)算步驟203-205,選出歸屬于年齡區(qū)間的其它非種子用戶,直至不能選取歸屬于年齡區(qū)間的其它非種子用戶為止。

本發(fā)明中的用戶屬性特征的確定方法,確定購買了種子商品的非種子用戶歸屬的用戶屬性區(qū)間并識別出非種子用戶的用戶屬性特征,可以不斷進(jìn)行迭代運(yùn)算,從而識別出更多用戶的用戶屬性特征,能夠有效提高用戶屬性特征的識別率,準(zhǔn)確率、覆蓋度。

如圖3所示,本發(fā)明提供一種用戶屬性特征的確定裝置30,包括:用戶區(qū)間確定模塊31、商品歸屬確定模塊32、用戶歸屬確定模塊33、區(qū)間歸屬確定模塊34和迭代運(yùn)算處理模塊35。用戶區(qū)間確定模塊31基于用戶屬性特征確定種子用戶所屬的用戶屬性區(qū)間。商品歸屬確定模塊32確定種子用戶購買的種子商品對于用戶屬性區(qū)間的商品歸屬值。

用戶歸屬確定模塊33基于商品歸屬值確定購買了種子商品的非種子用戶對于用戶屬性區(qū)間的用戶歸屬值。區(qū)間歸屬確定模塊34根據(jù)用戶歸屬值選出歸屬于用戶屬性區(qū)間的非種子用戶。迭代運(yùn)算處理模塊35將新選出的歸屬于用戶屬性區(qū)間的非種子用戶作為種子用戶,通過迭代運(yùn)算選出歸屬于用戶屬性區(qū)間的其它非種子用戶。

如圖4所示,商品歸屬確定模塊32包括:種子商品獲取單元321和商品歸屬計(jì)算單元322。種子商品獲取單元321根據(jù)用戶訂單信息獲取種子用戶購買的種子商品。商品歸屬計(jì)算單元322統(tǒng)計(jì)出種子商品被全部種子用戶購買的總數(shù)量、種子商品被每個用戶屬性區(qū)間中的所有種子用戶購買的區(qū)間數(shù)量;商品歸屬計(jì)算單元322確定每個區(qū)間數(shù)量與總數(shù)量的比值,其中,種子商品對于用戶屬性區(qū)間的商品歸屬值為與用戶屬性區(qū)間對應(yīng)的比值。

如圖5所示,用戶歸屬確定模塊33包括:購買商品統(tǒng)計(jì)單元331和用戶歸屬計(jì)算單元332。購買商品統(tǒng)計(jì)單元331根據(jù)用戶訂單信息統(tǒng)計(jì)非種子用戶購買的種子商品的數(shù)量和非種子商品的數(shù)量。用戶歸屬計(jì)算單元332基于種子商品的數(shù)量以及商品歸屬值確定非種子用戶對于用戶屬性區(qū)間的標(biāo)識商品歸屬值,基于非種子商品的數(shù)量確定非種子用戶對于用戶屬性區(qū)間的未標(biāo)識商品歸屬值,用戶歸屬計(jì)算單元332根據(jù)標(biāo)識商品歸屬值和未標(biāo)識商品歸屬值確定非種子用戶對于用戶屬性區(qū)間的用戶歸屬值。

用戶歸屬計(jì)算單元332計(jì)算第i個非種子用戶Ci對于第j個用戶屬性區(qū)間的用戶歸屬值其中,其中,P(Slj)為第i個非種子用戶購買的第l種種子商品對于第j個用戶屬性區(qū)間的商品歸屬值,l為自然數(shù),ml為第i個非種子用戶購買第l種種子商品的購買數(shù)量,f為第i個非種子用戶購買的種子商品的總量,k為第i個非種子用戶購買的未種子商品的總量,N為所述用戶屬性區(qū)間的總數(shù)。

屬性特征確定模塊34從非種子用戶對于全部用戶屬性區(qū)間的用戶歸屬值中選取最大值,如果用戶歸屬值的最大值大于歸屬門限值,則確定非種子用戶歸屬于與最大用戶歸屬值對應(yīng)的用戶屬性區(qū)間。

用戶屬性特征為年齡屬性特征,用戶區(qū)間確定模塊31設(shè)置年齡間隔并基于年齡間隔設(shè)置多個用戶屬性區(qū)間,根據(jù)種子用戶的年齡信息將種子用戶分配到對應(yīng)的用戶屬性區(qū)間。種子用戶包括:注冊信息通過完整性篩選的用戶、實(shí)名認(rèn)證用戶、購買了特定商品的用戶等。

如圖6所示,該裝置可包括存儲器71和處理器72,存儲器71用于存儲指令,處理器72耦合到存儲器71,處理器72被配置為基于存儲器71存儲的指令執(zhí)行實(shí)現(xiàn)上述的用戶屬性特征的確定方法。

存儲器71可以為高速RAM存儲器、非易失性存儲器(non-volatile memory)等,存儲器71也可以是存儲器陣列。存儲器71還可能被分塊,并且塊可按一定的規(guī)則組合成虛擬卷。處理器72可以為中央處理器CPU,或?qū)S眉呻娐稟SIC(Application Specific Integrated Circuit),或者是被配置成實(shí)施本發(fā)明的用戶屬性特征的確定方法的一個或多個集成電路。

上述實(shí)施例中的用戶屬性特征的確定方法和裝置,確定種子用戶歸屬的用戶屬性區(qū)間,獲取種子用戶購買的種子商品對于用戶屬性區(qū)間的商品歸屬值,通過商品歸屬值確定購買了種子商品的非種子用戶歸屬的用戶屬性區(qū)間,從而識別出非種子用戶的用戶屬性特征,并可以不斷進(jìn)行迭代運(yùn)算,能夠識別出更多用戶的用戶屬性特征,有效提高用戶屬性特征的識別率以及準(zhǔn)確率,可以提高用戶屬性特征識別的覆蓋度,能夠提高用戶服務(wù)的準(zhǔn)確性和有效性。

可能以許多方式來實(shí)現(xiàn)本發(fā)明的方法和系統(tǒng)。例如,可通過軟件、硬件、固件或者軟件、硬件、固件的任何組合來實(shí)現(xiàn)本發(fā)明的方法和系統(tǒng)。用于方法的步驟的上述順序僅是為了進(jìn)行說明,本發(fā)明的方法的步驟不限于以上具體描述的順序,除非以其它方式特別說明。此外,在一些實(shí)施例中,還可將本發(fā)明實(shí)施為記錄在記錄介質(zhì)中的程序,這些程序包括用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而,本發(fā)明還覆蓋存儲用于執(zhí)行根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。

本發(fā)明的描述是為了示例和描述起見而給出的,而并不是無遺漏的或者將本發(fā)明限于所公開的形式。很多修改和變化對于本領(lǐng)域的普通技術(shù)人員而言是顯然的。選擇和描述實(shí)施例是為了更好說明本發(fā)明的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計(jì)適于特定用途的帶有各種修改的各種實(shí)施例。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1