本申請涉及計算機技術(shù)領(lǐng)域,具體涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及用于生成用戶的年齡信息的方法和裝置。
背景技術(shù):
用戶的行為習慣與用戶年齡有很強的相關(guān)性,因此預測用戶年齡可以使得根據(jù)用戶的行為習慣進行信息推送有較強的針對性。目前,在預測用戶的年齡時,通常基于用戶的行為數(shù)據(jù)來預測用戶年齡,例如通過用戶在一段時間中購買商品的品類數(shù)量、各品類分別購買的數(shù)量、首次購買距今的時長等數(shù)據(jù)作為特征,然后用設(shè)定的算法對用戶所屬年齡段進行預測。
然而,現(xiàn)有的這種預測用戶年齡的方式常常忽略了不同商品的差異性,無法體現(xiàn)出不同商品影響用戶年齡的強度,使得最終預測出的年齡存在準確性不足的問題。
技術(shù)實現(xiàn)要素:
本申請的目的在于提出一種改進的用于生成用戶的年齡信息的方法和裝置,來解決以上背景技術(shù)部分提到的技術(shù)問題。
第一方面,本申請實施例提供了一種用于生成用戶的年齡信息的方法,該方法包括:獲取用戶集合中的待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、待檢測用戶對物品集合中的所有物品執(zhí)行預設(shè)操作的總操作次數(shù)、對物品集合中的至少一種物品執(zhí)行過預設(shè)操作的用戶的總用戶數(shù)量以及對單個物品執(zhí)行過預設(shè)操作的用戶的單物品用戶數(shù)量;基于單物品操作次數(shù)、總操作次數(shù)、總用戶數(shù)量以及單物品用戶數(shù)量,生成待檢測用戶對單個物品執(zhí)行預設(shè)操作的操作量特征參數(shù);基于物品集合中至少一個物品對應(yīng)的操作量特征參數(shù),生成待檢測用戶的年齡信息。
在一些實施例中,上述基于物品集合中至少一個物品對應(yīng)的操作量特征參數(shù),生成待檢測用戶的年齡信息,包括:使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型,其中,機器學習模型是預先使用年齡已知用戶在物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造的特征矩陣以及年齡已知用戶的年齡值分別作為模型的輸入與輸出樣本進行訓練而得到的;基于機器學習模型的輸出值確定待檢測用戶的年齡信息。
在一些實施例中,上述基于單物品操作次數(shù)、總操作次數(shù)、總用戶數(shù)量以及單物品用戶數(shù)量,生成待檢測用戶對單個物品執(zhí)行預設(shè)操作的操作量特征參數(shù),包括:確定單操作次數(shù)與總操作次數(shù)之間的第一比值;確定總用戶數(shù)量與單物品用戶數(shù)量之間的第二比值;基于第一比值和第二比值,生成單個物品對應(yīng)的操作量特征參數(shù)。
在一些實施例中,上述基于第一比值和第二比值,生成單個物品對應(yīng)的操作量特征參數(shù),包括:以預設(shè)底數(shù)對第二比值求對數(shù),得到對數(shù)值;對第一比值與對數(shù)值執(zhí)行乘積操作,并將所得到的乘積結(jié)果設(shè)置為待檢測用戶對單個物品的操作量特征參數(shù)。
在一些實施例中,上述方法還包括:獲取待檢測用戶執(zhí)行預設(shè)操作的其他操作特征參數(shù);以及,使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型,包括:使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及其他操作特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型,其中機器學習模型是是預先使用年齡已知用戶在物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及其他特征參數(shù)構(gòu)造的特征矩陣以及年齡已知用戶的年齡值分別作為模型的輸入與輸出樣本進行訓練而得到的。
在一些實施例中,在獲取待檢測用戶執(zhí)行預設(shè)操作的其他操作特征參數(shù)之后,上述方法還包括:對其他操作特征參數(shù)執(zhí)行標準化操作,得到標準化參數(shù);以及,上述使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及其他操作特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型,包括:使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及標準化參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型。
在一些實施例中,上述對其他操作特征參數(shù)執(zhí)行標準化操作,得到標準化操作,包括以下任意一項:將預設(shè)的上限閾值減去其他操作特征參數(shù),以得到標準化參數(shù);獲取用戶集合中的所有用戶的其他特征參數(shù)的平均值以及標準差,求取將待檢測用戶的其他特征參數(shù)與平均值之間的差值,并將差值與標準差之間的比值設(shè)置為標準化參數(shù)。
第二方面,本申請實施例提供了一種用于生成用戶的年齡信息的裝置,該裝置包括:第一獲取單元,用于獲取用戶集合中的待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、待檢測用戶對物品集合中的所有物品執(zhí)行預設(shè)操作的總操作次數(shù)、對物品集合中的至少一種物品執(zhí)行過預設(shè)操作的用戶的總用戶數(shù)量以及對單個物品執(zhí)行過預設(shè)操作的用戶的單物品用戶數(shù)量;參數(shù)生成單元,用于基于單物品操作次數(shù)、總操作次數(shù)、總用戶數(shù)量以及單物品用戶數(shù)量,生成待檢測用戶對單個物品執(zhí)行預設(shè)操作的操作量特征參數(shù);年齡生成單元,用于基于物品集合中至少一個物品對應(yīng)的操作量特征參數(shù),生成待檢測用戶的年齡信息。
在一些實施例中,年齡生成單元,包括:輸入子單元,用于使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型,其中,機器學習模型是預先使用年齡已知用戶在物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造的特征矩陣以及年齡已知用戶的年齡值分別作為模型的輸入與輸出樣本進行訓練而得到的;年齡生成子單元,用于基于機器學習模型的輸出值確定待檢測用戶的年齡信息。
在一些實施例中,參數(shù)生成單元,包括:第一比值確定子單元,用于確定單操作次數(shù)與總操作次數(shù)之間的第一比值;第二比值確定子單元,用于確定總用戶數(shù)量與單物品用戶數(shù)量之間的第二比值;參數(shù)生成子單元,用于基于第一比值和第二比值,生成單個物品對應(yīng)的操作量特征參數(shù)。
在一些實施例中,參數(shù)生成子單元進一步用于:以預設(shè)底數(shù)對第二比值求對數(shù),得到對數(shù)值;對第一比值與對數(shù)值執(zhí)行乘積操作,并將所得到的乘積結(jié)果設(shè)置為待檢測用戶對單個物品的操作量特征參數(shù)。
在一些實施例中,上述裝置還包括:第二獲取單元,用于獲取待檢測用戶執(zhí)行預設(shè)操作的其他操作特征參數(shù);以及,輸入子單元進一步用于:使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及其他操作特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型,其中機器學習模型是是預先使用年齡已知用戶在物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及其他特征參數(shù)構(gòu)造的特征矩陣以及年齡已知用戶的年齡值分別作為模型的輸入與輸出樣本進行訓練而得到的。
在一些實施例中,上述裝置還包括:標準化單元,用于在獲取待檢測用戶執(zhí)行預設(shè)操作的其他操作特征參數(shù)之后,對其他操作特征參數(shù)執(zhí)行標準化操作,得到標準化參數(shù);以及,輸入子單元進一步用于:使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及標準化參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型。
在一些實施例中,標準化單元,用于執(zhí)行以下任意一項:將預設(shè)的上限閾值減去其他操作特征參數(shù),以得到標準化參數(shù);獲取用戶集合中的所有用戶的其他特征參數(shù)的平均值以及標準差,求取將待檢測用戶的其他特征參數(shù)與平均值之間的差值,并將差值與標準差之間的比值設(shè)置為標準化參數(shù)。
第三方面,本申請?zhí)峁┮环N服務(wù)器,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當一個或多個程序被一個或多個處理器執(zhí)行,使得一個或多個處理器實現(xiàn)如第一方面中任一項所描述的方法。
第四方面,本申請?zhí)峁┮环N計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如第一方面中任一項所描述的方法。
本申請?zhí)峁┑挠糜谏捎脩舻哪挲g信息的方法和裝置,在預測用戶年齡時,在考慮用戶對物品的操作行為的操作次數(shù)的同時,還引入對物品操作的用戶量與總用戶量的比例,從而使得預測過程考慮到了不同物品本身在決定用戶年齡的強度差異,有利于更準確地預測出用戶的年齡。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征參數(shù)、目的和優(yōu)點將會變得更明顯:
圖1是本申請可以應(yīng)用于其中的示例性系統(tǒng)架構(gòu)圖;
圖2是根據(jù)本申請的用于生成用戶的年齡信息的方法的一個實施例的流程圖;
圖3是根據(jù)本申請的用于生成用戶的年齡信息的方法的又一個實施例的流程圖;
圖4是根據(jù)本申請的用于生成用戶的年齡信息的裝置的一個實施例的結(jié)構(gòu)示意圖;
圖5是適于用來實現(xiàn)本申請實施例的服務(wù)器的計算機系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施方式
下面結(jié)合附圖和實施例對本申請作進一步的詳細說明??梢岳斫獾氖牵颂幩枋龅木唧w實施例僅僅用于解釋相關(guān)發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征參數(shù)可以相互組合。下面將參考附圖并結(jié)合實施例來詳細說明本申請。
圖1示出了可以應(yīng)用本申請的用于生成用戶的年齡信息的方法或用于生成用戶的年齡信息的裝置的實施例的示例性系統(tǒng)架構(gòu)100。
如圖1所示,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103,網(wǎng)絡(luò)104和服務(wù)器105。網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
用戶可以使用終端設(shè)備101、102、103通過網(wǎng)絡(luò)104與服務(wù)器105交互,以接收或發(fā)送消息等。終端設(shè)備101、102、103上可以安裝有各種通訊客戶端應(yīng)用,例如網(wǎng)頁瀏覽器應(yīng)用、購物類應(yīng)用、搜索類應(yīng)用等。
終端設(shè)備101、102、103可以是具有顯示屏并且支持信息瀏覽的各種電子設(shè)備,包括但不限于智能手機、平板電腦、電子書閱讀器、mp3播放器(movingpictureexpertsgroupaudiolayeriii,動態(tài)影像專家壓縮標準音頻層面3)、mp4(movingpictureexpertsgroupaudiolayeriv,動態(tài)影像專家壓縮標準音頻層面4)播放器、膝上型便攜計算機和臺式計算機等等。
服務(wù)器105可以是提供各種服務(wù)的服務(wù)器,例如對終端設(shè)備101、102、103上顯示的信息提供數(shù)據(jù)支持的后臺服務(wù)器。后臺服務(wù)器可以根據(jù)與終端設(shè)備101、102、103的交互確定用戶的操作信息,例如用戶購買每一種商品的商品數(shù)量的信息。該操作信息可以供后續(xù)過程進行分析,以確定用戶年齡。
需要說明的是,本申請實施例所提供的用于生成用戶的年齡信息的方法一般由服務(wù)器105執(zhí)行,相應(yīng)地,用于生成用戶的年齡信息的裝置一般設(shè)置于服務(wù)器105中。
應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目僅僅是示意性的。根據(jù)實現(xiàn)需要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。
繼續(xù)參考圖2,示出了根據(jù)本申請的用于生成用戶的年齡信息的方法的一個實施例的流程200。該用于生成用戶的年齡信息的方法,包括以下步驟:
步驟201,獲取用戶集合中的待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、待檢測用戶對物品集合中的所有物品執(zhí)行預設(shè)操作的總操作次數(shù)、對物品集合中的至少一種物品執(zhí)行過預設(shè)操作的用戶的總用戶數(shù)量以及對單個物品執(zhí)行過預設(shè)操作的用戶的單物品用戶數(shù)量。
在本實施例中,電子設(shè)備可以首先獲取用戶集合中的待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、待檢測用戶對物品集合中的所有物品執(zhí)行預設(shè)操作的總操作次數(shù)、對物品集合中的至少一種物品執(zhí)行過預設(shè)操作的用戶的總用戶數(shù)量以及對單個物品執(zhí)行過預設(shè)操作的用戶的單物品用戶數(shù)量。實踐中,大量用戶可以預先通過終端設(shè)備對電子設(shè)備中存儲的信息進行訪問,電子設(shè)備可以根據(jù)與終端設(shè)備的交互信息確定各個用戶的操作行為信息。其中,該操作行為信息可以包括用戶集合中的每個用戶對物品集合中的每個物品執(zhí)行各種操作的操作次數(shù)。電子設(shè)備可以針對待檢測用戶以及預設(shè)操作,使用每個用戶對物品集合中的每個物品執(zhí)行各種操作的操作次數(shù)進行統(tǒng)計,從而獲取待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、待檢測用戶對物品集合中的所有物品執(zhí)行預設(shè)操作的總操作次數(shù)、用戶集合的總用戶數(shù)量以及對單個物品執(zhí)行過預設(shè)操作的用戶的單物品用戶數(shù)量等數(shù)據(jù)。需要說明的是,上述物品集合可以是通過電子設(shè)備對外銷售的所有商品或部分商品,預設(shè)操作可以是用戶對物品進行的購買、瀏覽、關(guān)注、收藏、搜索等操作,這些操作可以表明用戶與物品之間存在較強的關(guān)聯(lián)關(guān)系??傆脩魯?shù)量可以是對物品集合中的至少一種物品執(zhí)行過預設(shè)操作的用戶的用戶數(shù)量,單物品用戶數(shù)量可以是對單個物品執(zhí)行過預設(shè)操作的用戶的用戶數(shù)量。
需要說明的是,預設(shè)操作可以是一種或多種操作,單物品用戶數(shù)量可以是僅包含一種物品的單物品用戶數(shù)量,也可以是包括多種物品中每一種物品的單物品用戶數(shù)量,待檢測用戶也可以是一個或多個待檢測年齡的用戶。當預設(shè)操作為多種操作或多種物品中每一種物品的單物品用戶數(shù)量或待檢測用戶為多個用戶時,后續(xù)過程中的步驟202可以對每種操作或每一種物品或每一個用戶分別生成一個操作量特征參數(shù)。
還需要說明的是,上述獲取待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、待檢測用戶對物品集合中的所有物品執(zhí)行預設(shè)操作的總操作次數(shù)、用戶集合的總用戶數(shù)量以及對單個物品執(zhí)行過預設(shè)操作的用戶的單物品用戶數(shù)量等數(shù)據(jù)的方式僅為舉例,實踐中還可以通過其他方式獲取這些數(shù)據(jù)。
步驟202,基于單物品操作次數(shù)、總操作次數(shù)、總用戶數(shù)量以及單物品用戶數(shù)量,生成待檢測用戶對單個物品執(zhí)行預設(shè)操作的操作量特征參數(shù)。
在本實施例中,基于步驟201中獲取到的數(shù)據(jù),上述電子設(shè)備(例如圖1所示的服務(wù)器)可以基于單物品操作次數(shù)、總操作次數(shù)、總用戶數(shù)量以及單物品用戶數(shù)量,生成待檢測用戶對單個物品執(zhí)行預設(shè)操作的操作量特征參數(shù)。在生成待檢測用戶對單個物品執(zhí)行所述預設(shè)操作的操作量特征參數(shù)時,需要同時使用到單物品操作次數(shù)、總操作次數(shù)、總用戶數(shù)量以及單物品用戶數(shù)量這四項數(shù)據(jù)進行運算,從而將運算結(jié)果作為操作量特征參數(shù)。其中,運算所涉及到的具體運算方式可以包括但不限于加、減、乘、除或乘方等。
步驟203,基于物品集合中至少一個物品對應(yīng)的操作量特征參數(shù),生成待檢測用戶的年齡信息。
在本實施例中,基于步驟202生成的操作量特征參數(shù),電子設(shè)備可以對操作量特征參數(shù)進行分析,從而生成待檢測用戶的年齡信息。例如,可以預先設(shè)計根據(jù)操作量特征參數(shù)計算年齡的公式,此時可以根據(jù)該公式即可求取出用戶年齡。此外,還可以設(shè)計操作量特征參數(shù)和用戶年齡之間的映射表,當生成待測試用戶的操作量特征參數(shù)后,可以直接查詢該映射表得到對應(yīng)的用戶年齡。需要說明的是,還可以通過其他方式基于操作量特征參數(shù)生成待檢測用戶的年齡信息。
在本實施例的一些可選的實現(xiàn)方式中,上述步驟203可以具體包括:使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型,其中,機器學習模型是預先使用年齡已知用戶在物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造的特征矩陣以及年齡已知用戶的年齡值分別作為模型的輸入與輸出樣本進行訓練而得到的;基于機器學習模型的輸出值確定待檢測用戶的年齡信息。在該實現(xiàn)方式中,機器學習模型的輸入可以是使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造成的特征矩陣。當操作量特征參數(shù)僅包括一項參數(shù)時,特征矩陣可以是1×1的矩陣。當操作量特征參數(shù)包括一個待檢測用戶在多種物品的操作量特征參數(shù)時,特征矩陣可以是n×1的矩陣(n為大于1的整數(shù))。當操作量特征參數(shù)包括多個待檢測用戶在多種物品的操作量特征參數(shù)時,輸入矩陣可以是n×m的矩陣(n、m分別為大于1的整數(shù))。此時,電子設(shè)備可以通過機器學習模型的輸出向量中的各個分量確定每個待檢測用戶的年齡,這種方式可以使用機器學習模型對數(shù)據(jù)處理一次即可同時生成多個待測試用戶的年齡信息,從而可以提高處理效率。此外,機器學習模型還可以不斷更新以進一步提高年齡預測的準確性。特征矩陣通常是稀疏矩陣,處理時需要按照稀疏矩陣的形式進行處理。
在本實施例的一些可選實現(xiàn)方式中,上述步驟202可以具體包括:確定單操作次數(shù)與總操作次數(shù)之間的第一比值;確定總用戶數(shù)量與單物品用戶數(shù)量之間的第二比值;基于第一比值和第二比值,生成單個物品對應(yīng)的操作量特征參數(shù)。在該實現(xiàn)方式中,電子設(shè)備在計算單個物品對應(yīng)的操作量特征參數(shù)時,可以利用單操作次數(shù)與總操作次數(shù)之間的第一比值以及總用戶數(shù)量與單物品用戶數(shù)量之間的第二比值確定操作量特征參數(shù)時。
對于單個物品,總用戶數(shù)量與單物品用戶數(shù)量之間的第二比值是逆向購買該物品的用戶頻率,能度量該物品的普遍重要性。當?shù)诙戎翟酱?,即單物品用戶?shù)量占總用戶數(shù)量的比例越小時,則該物品對用戶年齡的區(qū)分度越強。單操作次數(shù)與總操作次數(shù)之間的第一比值用于表示待檢測的特定用戶對該物品執(zhí)行預設(shè)操作的頻率,即可以表征待檢測用戶在該物品上的得分值越高。因此,將第一比值和第二比值結(jié)合,可以確定體現(xiàn)出該物品在對待檢測用戶進行年齡預測時的綜合價值。
在本實施例的一些可選實現(xiàn)方式中,上述基于第一比值和第二比值,生成單個物品對應(yīng)的操作量特征參數(shù),可以具體包括:以預設(shè)底數(shù)對第二比值求對數(shù),得到對數(shù)值;對第一比值與對數(shù)值執(zhí)行乘積操作,并將所得到的乘積結(jié)果設(shè)置為待檢測用戶對所述單個物品的操作量特征參數(shù)。在該實現(xiàn)方式中,在結(jié)合第一比值和第二比值得到單個物品的操作量特征參數(shù)時,可以先對第二比值求對數(shù),再將第一比值與求取的對數(shù)值相乘后作為單個物品的操作量特征參數(shù)。可選的,求取對數(shù)時所使用的底數(shù)可以是自然常數(shù)e。該實現(xiàn)方式中,所得到的操作量特征參數(shù)相當于文本處理中的tf-idf(詞頻-逆文檔頻率)技術(shù),用于評估一字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現(xiàn)的次數(shù)成正比增加,但同時會隨著它在語料庫中出現(xiàn)的頻率成反比下降。對應(yīng)的,將該技術(shù)應(yīng)用到基于用戶對物品的操作預測用戶年齡時,物品的重要性隨著它被用戶執(zhí)行預設(shè)操作的操作次數(shù)成正比增加,同時也隨操作該物品的用戶量成反比下降。將tf-idf技術(shù)轉(zhuǎn)用到基于用戶對物品的操作預測用戶年齡,可以使得年齡的預測更科學準確。
本申請的上述實施例提供的方法在預測用戶年齡時,在考慮用戶對物品的操作行為的操作次數(shù)的同時,還引入對物品操作的用戶量與總用戶量的比例,從而使得預測過程考慮到了不同物品本身在決定用戶年齡的強度差異,有利于更準確地預測出用戶的年齡。
進一步參考圖3,其示出了用于生成用戶的年齡信息的方法的又一個實施例的流程300。該用于生成用戶的年齡信息的方法的流程300,包括以下步驟:
步驟301,獲取用戶集合中的待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、待檢測用戶對物品集合中的所有物品執(zhí)行預設(shè)操作的總操作次數(shù)、對物品集合中的至少一種物品執(zhí)行過預設(shè)操作的用戶的總用戶數(shù)量以及對單個物品執(zhí)行過預設(shè)操作的用戶的單物品用戶數(shù)量。
在本實施例中,步驟301的具體處理可以參考圖2對應(yīng)實施例的步驟201,這里不再贅述。
步驟302,基于單物品操作次數(shù)、總操作次數(shù)、總用戶數(shù)量以及單物品用戶數(shù)量,生成待檢測用戶對單個物品執(zhí)行預設(shè)操作的操作量特征參數(shù)。
在本實施例中,步驟302的具體處理可以參考圖2對應(yīng)實施例中相應(yīng)的實現(xiàn)方式。
步驟303,獲取待檢測用戶執(zhí)行預設(shè)操作的其他操作特征參數(shù)。
在本實施例中,電子設(shè)備還獲取待檢測用戶執(zhí)行預設(shè)操作的其他操作特征參數(shù)。該其他操作特征參數(shù)包括但不限于待檢測用戶首次執(zhí)行預設(shè)操作至今的時長、執(zhí)行預設(shè)操作的總操作次數(shù)等參數(shù)。
步驟304,使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及其他操作特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型。
在本實施例中,基于步驟302所得到的操作量特征參數(shù)以及步驟303獲取到的其他操作特征參數(shù),電子設(shè)備可以使用操作量特征參數(shù)以及其他操作特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型中。其中,機器學習模型是是預先使用年齡已知用戶在物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及其他特征參數(shù)構(gòu)造的特征矩陣以及年齡已知用戶的年齡值分別作為模型的輸入與輸出樣本進行訓練而得到的。
步驟305,基于機器學習模型的輸出值確定待檢測用戶的年齡信息。
在本實施例中,步驟305的具體處理可以參考圖2對應(yīng)實施例中的步驟203,這里不再贅述。
在本實施例的一些可選實現(xiàn)方式中,在步驟303之后,上述方法還包括:對其他操作特征參數(shù)執(zhí)行標準化操作,得到標準化參數(shù)。同時,上述步驟304可以具體包括:使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及標準化參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型。在該實現(xiàn)方式中,為了使得不同的特征參數(shù)的尺度盡可能一致,可以對特征參數(shù)進行標準化操作,使得在計算年齡時均衡考慮各項其他參數(shù)的影響。
在本實施例的一些可選實現(xiàn)方式中,上述對其他操作特征參數(shù)執(zhí)行標準化操作,得到標準化操作,包括以下任意一項:將預設(shè)的上限閾值減去其他操作特征參數(shù),以得到標準化參數(shù);獲取用戶集合中的所有用戶的其他特征參數(shù)的平均值以及標準差,求取將待檢測用戶的其他特征參數(shù)與平均值之間的差值,并將差值與標準差之間的比值設(shè)置為標準化參數(shù)。
前者是為了解決特征指標方向不一致的問題。有些指標是指標值越大評價得分越好,指標方向和評價得分方向一致,稱為正向指標;而有些指標是指標值越小,評價得分越好,稱為逆向指標。因此需要把逆向指標進行正向化處理,比如首次購買距今的天數(shù)這個就是逆向指標,它度量的是用戶第一次消費統(tǒng)計日期的時間長度,理論上來說,這個指標越小的用戶應(yīng)該是比較好的用戶,其營銷價值比較高,對提供商品或服務(wù)也最有可能有反應(yīng)。逆向指標正向化的具體方式即可通過預設(shè)的上限閾值減去逆向指標的其他操作特征參數(shù)所得到的值作為正向化之后的數(shù)據(jù),即標準化參數(shù)。
后者則是為了解決不同參數(shù)的量綱不統(tǒng)一的問題。例如,天數(shù)、消費頻次、消費金額的單位都不一樣,無法直接比較,需要統(tǒng)一做標準化處理,具體方法是進行標準差標準化,即將數(shù)據(jù)減去其樣本平均值,然后除以樣本標準差,這樣處理后的數(shù)據(jù)符合標準正太分布,均值為0,標準差為1,其轉(zhuǎn)化可以通過如下式(1)所示:
x為標準化之前的數(shù)據(jù),xnew為標準化之后的數(shù)據(jù),mean(x)是對標準化之前的數(shù)據(jù)求均值,std(x)是對標準化之前的數(shù)據(jù)求標準差。
從圖3中可以看出,與圖2對應(yīng)的實施例相比,本實施例中的用于生成用戶的年齡信息的方法的流程300,進一步引入了除操作量特征外的其他操作特征作為預測年齡的依據(jù),從而可以進一步提高所預測年齡的準確度。
進一步參考圖4,作為對上述各圖所示方法的實現(xiàn),本申請?zhí)峁┝艘环N用于生成用戶的年齡信息的裝置的一個實施例,該裝置實施例與圖2所示的方法實施例相對應(yīng),該裝置具體可以應(yīng)用于各種電子設(shè)備中。
如圖4所示,本實施例的用于生成用戶的年齡信息的裝置400包括:第一獲取單元401、參數(shù)生成單元402和年齡生成單元403。其中,第一獲取單元401用于獲取用戶集合中的待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、待檢測用戶對物品集合中的所有物品執(zhí)行預設(shè)操作的總操作次數(shù)、對物品集合中的至少一種物品執(zhí)行過預設(shè)操作的用戶的總用戶數(shù)量以及對單個物品執(zhí)行過預設(shè)操作的用戶的單物品用戶數(shù)量;參數(shù)生成單元402用于基于單物品操作次數(shù)、總操作次數(shù)、總用戶數(shù)量以及單物品用戶數(shù)量,生成待檢測用戶對單個物品執(zhí)行預設(shè)操作的操作量特征參數(shù);年齡生成單元403用于基于物品集合中至少一個物品對應(yīng)的操作量特征參數(shù),生成待檢測用戶的年齡信息。
在本實施例中,第一獲取單元401、參數(shù)生成單元402和年齡生成單元403的具體處理可以參考圖2對應(yīng)實施例的步驟201、步驟201以及步驟203,這里不再贅述。
在本實施例的一些可選實現(xiàn)方式中,年齡生成單元403可以包括:輸入子單元(未示出),用于使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型,其中,機器學習模型是預先使用年齡已知用戶在物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)構(gòu)造的特征矩陣以及年齡已知用戶的年齡值分別作為模型的輸入與輸出樣本進行訓練而得到的;年齡生成子單元(未示出),用于基于機器學習模型的輸出值確定待檢測用戶的年齡信息。該實現(xiàn)方式的具體處理可以參考圖2對應(yīng)實施例中相應(yīng)的實現(xiàn)方式,這里不再贅述。
在本實施例的一些可選實現(xiàn)方式中,參數(shù)生成單元402可以包括:第一比值確定子單元(未示出),用于確定單操作次數(shù)與總操作次數(shù)之間的第一比值;第二比值確定子單元(未示出),用于確定總用戶數(shù)量與單物品用戶數(shù)量之間的第二比值;參數(shù)生成子單元(未示出),用于基于第一比值和第二比值,生成單個物品對應(yīng)的操作量特征參數(shù)。該實現(xiàn)方式的具體處理可以參考圖2對應(yīng)實施例中相應(yīng)的實現(xiàn)方式,這里不再贅述。
在本實施例的一些可選實現(xiàn)方式中,參數(shù)生成子單元進一步用于:以預設(shè)底數(shù)對第二比值求對數(shù),得到對數(shù)值;對第一比值與對數(shù)值執(zhí)行乘積操作,并將所得到的乘積結(jié)果設(shè)置為所述待檢測用戶對單個物品的操作量特征參數(shù)。該實現(xiàn)方式的具體處理可以參考圖2對應(yīng)實施例中相應(yīng)的實現(xiàn)方式,這里不再贅述。
在本實施例的一些可選實現(xiàn)方式中,裝置400還包括第二獲取單元(未示出),用于獲取待檢測用戶執(zhí)行預設(shè)操作的其他操作特征參數(shù);以及,上述輸入子單元進一步用于:使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及其他操作特征參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型,其中機器學習模型是是預先使用年齡已知用戶在物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及其他特征參數(shù)構(gòu)造的特征矩陣以及年齡已知用戶的年齡值分別作為模型的輸入與輸出樣本進行訓練而得到的。該實現(xiàn)方式的具體處理可以參考圖3對應(yīng)實施例中相應(yīng)的步驟,這里不再贅述。
在本實施例的一些可選實現(xiàn)方式中,裝置400還包括:標準化單元(未示出),用于在獲取待檢測用戶執(zhí)行預設(shè)操作的其他操作特征參數(shù)之后,對其他操作特征參數(shù)執(zhí)行標準化操作,得到標準化參數(shù);以及,輸入子單元進一步用于:使用物品集合中至少一個物品對應(yīng)的操作量特征參數(shù)以及標準化參數(shù)構(gòu)造成特征矩陣并輸入至機器學習模型。該實現(xiàn)方式的具體處理可以參考圖3對應(yīng)實施例中相應(yīng)的實現(xiàn)方式,這里不再贅述。
在本實施例的一些可選實現(xiàn)方式中,標準化單元,用于執(zhí)行以下任意一項:將預設(shè)的上限閾值減去其他操作特征參數(shù),以得到標準化參數(shù);獲取用戶集合中的所有用戶的其他特征參數(shù)的平均值以及標準差,求取將待檢測用戶的其他特征參數(shù)與平均值之間的差值,并將差值與標準差之間的比值設(shè)置為標準化參數(shù)。
此外,本申請還提供一種服務(wù)器的實施例。該服務(wù)器包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當一個或多個程序被一個或多個處理器執(zhí)行,使得一個或多個處理器實現(xiàn)如圖2對應(yīng)實施例或任一實現(xiàn)方式中所描述的方法。下面參考圖5,其示出了適于用來實現(xiàn)本申請實施例的服務(wù)器的計算機系統(tǒng)500的結(jié)構(gòu)示意圖。圖5示出的服務(wù)器僅僅是一個示例,不應(yīng)對本申請實施例的功能和使用范圍帶來任何限制。
如圖5所示,計算機系統(tǒng)500包括中央處理單元(cpu)501,其可以根據(jù)存儲在只讀存儲器(rom)502中的程序或者從存儲部分508加載到隨機訪問存儲器(ram)503中的程序而執(zhí)行各種適當?shù)膭幼骱吞幚怼T趓am503中,還存儲有系統(tǒng)500操作所需的各種程序和數(shù)據(jù)。cpu501、rom502以及ram503通過總線504彼此相連。輸入/輸出(i/o)接口505也連接至總線504。
以下部件連接至i/o接口505:包括鍵盤、鼠標等的輸入部分506;包括諸如陰極射線管(crt)、液晶顯示器(lcd)等以及揚聲器等的輸出部分507;包括硬盤等的存儲部分508;以及包括諸如lan卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分509。通信部分509經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動器510也根據(jù)需要連接至i/o接口505??刹鹦督橘|(zhì)511,諸如磁盤、光盤、磁光盤、半導體存儲器等等,根據(jù)需要安裝在驅(qū)動器510上,以便于從其上讀出的計算機程序根據(jù)需要被安裝入存儲部分508。
特別地,根據(jù)本公開的實施例,上文參考流程圖描述的過程可以被實現(xiàn)為計算機軟件程序。例如,本公開的實施例包括一種計算機程序產(chǎn)品,其包括承載在計算機可讀介質(zhì)上的計算機程序,該計算機程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分509從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)511被安裝。在該計算機程序被中央處理單元(cpu)501執(zhí)行時,執(zhí)行本申請的方法中限定的上述功能。需要說明的是,本申請所描述的計算機可讀介質(zhì)可以是計算機可讀信號介質(zhì)或者計算機可讀存儲介質(zhì)或者是上述兩者的任意組合。計算機可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質(zhì)的更具體的例子可以包括但不限于:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機訪問存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本申請中,計算機可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。而在本申請中,計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計算機可讀介質(zhì)上包含的程序代碼可以用任何適當?shù)慕橘|(zhì)傳輸,包括但不限于:無線、電線、光纜、rf等等,或者上述的任意合適的組合。
附圖中的流程圖和框圖,圖示了按照本申請各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,該模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當注意,在有些作為替換的實現(xiàn)中,方框中所標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
描述于本申請實施例中所涉及到的單元可以通過軟件的方式實現(xiàn),也可以通過硬件的方式來實現(xiàn)。所描述的單元也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括第一獲取單元、參數(shù)生成單元和年齡生成單元。其中,這些單元的名稱在某種情況下并不構(gòu)成對該單元本身的限定,例如,第一獲取單元還可以被描述為“獲取用戶集合中的待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、待檢測用戶對物品集合中的所有物品執(zhí)行預設(shè)操作的總操作次數(shù)、對物品集合中的至少一種物品執(zhí)行過預設(shè)操作的用戶的總用戶數(shù)量以及對單個物品執(zhí)行過預設(shè)操作的用戶的單物品用戶數(shù)量的單元”。
作為另一方面,本申請還提供了一種計算機可讀介質(zhì),該計算機可讀介質(zhì)可以是上述實施例中描述的裝置中所包含的;也可以是單獨存在,而未裝配入該裝置中。上述計算機可讀介質(zhì)承載有一個或者多個程序,當上述一個或者多個程序被該裝置執(zhí)行時,使得該裝置:獲取用戶集合中的待檢測用戶對物品集合中的單個物品執(zhí)行預設(shè)操作的單物品操作次數(shù)、所述待檢測用戶對所述物品集合中的所有物品執(zhí)行所述預設(shè)操作的總操作次數(shù)、對所述物品集合中的至少一種物品執(zhí)行過所述預設(shè)操作的用戶的總用戶數(shù)量以及對所述單個物品執(zhí)行過所述預設(shè)操作的用戶的單物品用戶數(shù)量;基于所述單物品操作次數(shù)、所述總操作次數(shù)、所述總用戶數(shù)量以及所述單物品用戶數(shù)量,生成所述待檢測用戶對所述單個物品執(zhí)行所述預設(shè)操作的操作量特征參數(shù);基于所述物品集合中至少一個物品對應(yīng)的操作量特征參數(shù),生成所述待檢測用戶的年齡信息。
以上描述僅為本申請的較佳實施例以及對所運用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征參數(shù)的特定組合而成的技術(shù)方案,同時也應(yīng)涵蓋在不脫離上述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征參數(shù)或其等同特征參數(shù)進行任意組合而形成的其它技術(shù)方案。例如上述特征參數(shù)與本申請中公開的(但不限于)具有類似功能的技術(shù)特征參數(shù)進行互相替換而形成的技術(shù)方案。