用戶(hù)年齡估計(jì)方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別涉及一種用戶(hù)年齡估計(jì)方法及裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)技術(shù)與人們生活的融合,越來(lái)越多的商務(wù)和個(gè)人活動(dòng),均可以基于網(wǎng)絡(luò)進(jìn)行,而隨著用戶(hù)對(duì)網(wǎng)絡(luò)服務(wù)質(zhì)量要求越來(lái)越高,需要為用戶(hù)提供更靈活而個(gè)性化的網(wǎng)絡(luò)服務(wù)。
[0003]針對(duì)用戶(hù)的個(gè)性化網(wǎng)絡(luò)服務(wù)可以基于用戶(hù)的一些基本特征進(jìn)行,如用戶(hù)資料中所填寫(xiě)的年齡、性別以及興趣愛(ài)好等,然而,用戶(hù)在公共平臺(tái)上的用戶(hù)資料并不完整,尤其是年齡這種信息。因此,亟需一種對(duì)用戶(hù)年齡進(jìn)行估計(jì)的方法。
【發(fā)明內(nèi)容】
[0004]為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明實(shí)施例提供了一種用戶(hù)年齡估計(jì)方法及裝置。所述技術(shù)方案如下:
[0005]一方面,提供了一種用戶(hù)年齡估計(jì)方法,所述方法包括:
[0006]獲取未知年齡用戶(hù)的用戶(hù)關(guān)系鏈,所述用戶(hù)關(guān)系鏈上包括與所述未知年齡用戶(hù)具有關(guān)聯(lián)關(guān)系的多個(gè)用戶(hù);
[0007]根據(jù)所述多個(gè)用戶(hù)的用戶(hù)信息,對(duì)所述多個(gè)用戶(hù)進(jìn)行篩選;
[0008]根據(jù)篩選后的剩余用戶(hù)的年齡,對(duì)所述未知年齡用戶(hù)的年齡進(jìn)行估計(jì)。
[0009]另一方面,提供了一種用戶(hù)年齡估計(jì)裝置,所述裝置包括:
[0010]獲取未知年齡用戶(hù)的用戶(hù)關(guān)系鏈,所述用戶(hù)關(guān)系鏈上包括與所述未知年齡用戶(hù)具有關(guān)聯(lián)關(guān)系的多個(gè)用戶(hù);
[0011]根據(jù)所述多個(gè)用戶(hù)的用戶(hù)信息,對(duì)所述多個(gè)用戶(hù)進(jìn)行篩選;
[0012]根據(jù)篩選后的剩余用戶(hù)的年齡,對(duì)所述未知年齡用戶(hù)的年齡進(jìn)行估計(jì)。
[0013]另一方面,提供了一種用戶(hù)年齡估計(jì)裝置,所述裝置包括:
[0014]獲取模塊,用于獲取未知年齡用戶(hù)的用戶(hù)關(guān)系鏈,所述用戶(hù)關(guān)系鏈上包括與所述未知年齡用戶(hù)具有關(guān)聯(lián)關(guān)系的多個(gè)用戶(hù);
[0015]篩選模塊,用于根據(jù)所述多個(gè)用戶(hù)的用戶(hù)信息,對(duì)所述多個(gè)用戶(hù)進(jìn)行篩選;
[0016]估計(jì)模塊,用于根據(jù)篩選后的剩余用戶(hù)的年齡,對(duì)所述未知年齡用戶(hù)的年齡進(jìn)行估計(jì)。
[0017]本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:
[0018]通過(guò)基于未知年齡用戶(hù)的實(shí)際交友情況,對(duì)未知年齡用戶(hù)的年齡進(jìn)行估計(jì),以獲知用戶(hù)年齡,提高了年齡估計(jì)的準(zhǔn)確性和可靠性,進(jìn)一步提高了個(gè)性化網(wǎng)絡(luò)服務(wù)的準(zhǔn)確性。
【附圖說(shuō)明】
[0019]為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0020]圖1是本發(fā)明實(shí)施例提供的一種用戶(hù)年齡估計(jì)方法流程圖;
[0021]圖2是本發(fā)明實(shí)施例提供的一種用戶(hù)年齡估計(jì)方法流程圖;
[0022]圖3是本發(fā)明實(shí)施例提供的一種用戶(hù)年齡估計(jì)裝置結(jié)構(gòu)示意圖;
[0023]圖4是根據(jù)一示例性實(shí)施例示出的一種用于用戶(hù)年齡估計(jì)的裝置400的框圖。
【具體實(shí)施方式】
[0024]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0025]用戶(hù)關(guān)系鏈:社交工具中用戶(hù)與用戶(hù)之間添加為好友后形成的關(guān)系鏈條。
[0026]年齡段:具有一定年齡跨度的年齡區(qū)間。
[0027]廣告點(diǎn)擊率預(yù)測(cè)模型:用于預(yù)測(cè)用戶(hù)對(duì)某個(gè)廣告素材曝光后進(jìn)行點(diǎn)擊的可能性,輸入?yún)?shù)往往包含用戶(hù)相關(guān)的例如年齡、性別、歸屬地等人口統(tǒng)計(jì)特征,廣告素材相關(guān)的例如廣告主行業(yè)、廣告素材類(lèi)型等特征。
[0028]大數(shù)定律:是一種描述當(dāng)試驗(yàn)次數(shù)很大時(shí)所呈現(xiàn)的概率性質(zhì)的定律。有些隨機(jī)事件無(wú)規(guī)律可循,但不少是有規(guī)律的,這些“有規(guī)律的隨機(jī)事件”在大量重復(fù)出現(xiàn)的條件下,往往呈現(xiàn)幾乎必然的統(tǒng)計(jì)特性。
[0029]近似迀移:假設(shè)用戶(hù)年齡段與之大多數(shù)好友年齡段相符,則可以通過(guò)用戶(hù)好友的年齡段估計(jì)出用戶(hù)本身的年齡段。
[0030]用戶(hù)小號(hào):特指?jìng)溆觅~號(hào)以備不時(shí)之需,用戶(hù)不想或者不方便讓別人知道自己在線(xiàn)活動(dòng),另行申請(qǐng)的賬號(hào)稱(chēng)為小號(hào),與原有常用賬號(hào)的線(xiàn)上生活軌跡不同,隱藏身份所用。
[0031]圖1是本發(fā)明實(shí)施例提供的一種用戶(hù)年齡估計(jì)方法流程圖。參見(jiàn)圖1,所述方法包括:
[0032]101、獲取未知年齡用戶(hù)的用戶(hù)關(guān)系鏈,所述用戶(hù)關(guān)系鏈上包括與所述未知年齡用戶(hù)具有關(guān)聯(lián)關(guān)系的多個(gè)用戶(hù)。
[0033]102、根據(jù)所述多個(gè)用戶(hù)的用戶(hù)信息,對(duì)所述多個(gè)用戶(hù)進(jìn)行篩選。
[0034]103、根據(jù)篩選后的剩余用戶(hù)的年齡,對(duì)所述未知年齡用戶(hù)的年齡進(jìn)行估計(jì)。
[0035]本發(fā)明實(shí)施例提供的方法,通過(guò)基于未知年齡用戶(hù)的實(shí)際交友情況,對(duì)未知年齡用戶(hù)的年齡進(jìn)行估計(jì),以獲知用戶(hù)年齡,提高了年齡估計(jì)的準(zhǔn)確性和可靠性,進(jìn)一步提高了個(gè)性化網(wǎng)絡(luò)服務(wù)的準(zhǔn)確性。
[0036]可選地,所述根據(jù)所述多個(gè)用戶(hù)的用戶(hù)信息,對(duì)所述多個(gè)用戶(hù)進(jìn)行篩選,包括:
[0037]根據(jù)所述多個(gè)用戶(hù)的用戶(hù)關(guān)系鏈,篩選掉用戶(hù)關(guān)系鏈為空的用戶(hù)。
[0038]可選地,所述根據(jù)所述多個(gè)用戶(hù)的用戶(hù)信息,對(duì)所述多個(gè)用戶(hù)進(jìn)行篩選,包括:
[0039]根據(jù)所述多個(gè)用戶(hù)的用戶(hù)關(guān)系鏈,篩選掉年齡處于第一年齡段和第二年齡段的用戶(hù)。
[0040]可選地,根據(jù)篩選后的剩余用戶(hù)的年齡,對(duì)所述未知年齡用戶(hù)的年齡進(jìn)行估計(jì),包括:
[0041]將篩選后的剩余用戶(hù)按照年齡分別映射至多個(gè)年齡段中;
[0042]將用戶(hù)數(shù)量占比最大的年齡段,作為所述未知年齡用戶(hù)的年齡估計(jì)值。
[0043]可選地,跟據(jù)篩選后的剩余用戶(hù)的年齡,對(duì)所述未知年齡用戶(hù)的年齡進(jìn)行估計(jì)之后,所述方法還包括:
[0044]基于已知年齡用戶(hù)的用戶(hù)關(guān)系鏈進(jìn)行校驗(yàn),確定估計(jì)準(zhǔn)確度。
[0045]上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本公開(kāi)的可選實(shí)施例,在此不再
--贅述。
[0046]圖2是本發(fā)明實(shí)施例提供的一種用戶(hù)年齡估計(jì)方法的流程圖。該方法可以用于服務(wù)器中,參見(jiàn)圖2,該方法具體包括:
[0047]201、獲取未知年齡用戶(hù)的用戶(hù)關(guān)系鏈,所述用戶(hù)關(guān)系鏈上包括與所述未知年齡用戶(hù)具有關(guān)聯(lián)關(guān)系的多個(gè)用戶(hù)。
[0048]在本發(fā)明實(shí)施例中,進(jìn)行用戶(hù)年齡估計(jì)的對(duì)象可以是來(lái)自互聯(lián)網(wǎng)應(yīng)用的用戶(hù),該互聯(lián)網(wǎng)應(yīng)用可以是提供多媒體服務(wù)、信息交互等服務(wù)的應(yīng)用,并且,在該互聯(lián)網(wǎng)應(yīng)用中具有用戶(hù)和用戶(hù)之間有一定關(guān)系的用戶(hù)關(guān)系鏈,每個(gè)用戶(hù)可以根據(jù)自己的交友、興趣愛(ài)好等情況,維護(hù)自己的用戶(hù)關(guān)系鏈。
[0049]該未知年齡用戶(hù)可以是指用戶(hù)資料中未填寫(xiě)年齡的用戶(hù),也可以是指用戶(hù)資料中年齡填寫(xiě)不符合現(xiàn)實(shí)的用戶(hù),例如,年齡寫(xiě)成I萬(wàn)歲等用戶(hù)等。
[0050]具體地,在獲取未知年齡用戶(hù)的用戶(hù)關(guān)系鏈過(guò)程中,可以包括以下步驟:根據(jù)用戶(hù)資料數(shù)據(jù)庫(kù)中的用戶(hù)以及用戶(hù)資料,確定未知年齡用戶(hù);根據(jù)未知年齡用戶(hù),從用戶(hù)關(guān)系數(shù)據(jù)庫(kù)中,獲取該未知年齡用戶(hù)的用戶(hù)關(guān)系鏈。
[0051]其中,根據(jù)用戶(hù)資料數(shù)據(jù)庫(kù)中的用戶(hù)以及用戶(hù)資料,確定未知年齡用戶(hù)包括以下至少一項(xiàng):(I)根據(jù)用戶(hù)資料數(shù)據(jù)庫(kù)中的用戶(hù)以及用戶(hù)資料,獲取用戶(hù)資料中年齡項(xiàng)為空的用戶(hù),將獲取到的用戶(hù)確定為未知年齡用戶(hù)。(2)根據(jù)用戶(hù)資料數(shù)據(jù)庫(kù)中的用戶(hù)以及用戶(hù)資料,獲取用戶(hù)資料中年齡項(xiàng)的數(shù)值大于預(yù)設(shè)閾值的用戶(hù),將獲取到的用戶(hù)確定為未知年齡用戶(hù)。在獲取未知年齡用戶(hù)時(shí),可以采用上述⑴⑵中任一項(xiàng),當(dāng)然,還可以結(jié)合⑴和
(2)進(jìn)行。在具體實(shí)施中,還可以通過(guò)分析該用戶(hù)的賬號(hào)關(guān)聯(lián)情況、用戶(hù)的歷史網(wǎng)絡(luò)操作信息來(lái)確定該用戶(hù)是否屬于未知年齡用戶(hù)。其中,歷史網(wǎng)絡(luò)操作信息可以包括公眾號(hào)訂閱情況或閱讀行為等等。如,可以將無(wú)法關(guān)聯(lián)到其他賬號(hào)機(jī)制內(nèi)賬號(hào)、沒(méi)有公眾號(hào)訂閱行為或沒(méi)有文章閱讀行為的用戶(hù)確定為未知年齡用戶(hù)。
[0052]其中,上述的用戶(hù)資料數(shù)據(jù)庫(kù)、用戶(hù)關(guān)系數(shù)據(jù)庫(kù)等均可以位于同一個(gè)服務(wù)器上,也可以位于不同服務(wù)器上,本發(fā)明實(shí)施例對(duì)如何從數(shù)據(jù)庫(kù)中獲取相應(yīng)數(shù)據(jù)的過(guò)程不做贅述。
[0053]202、根據(jù)所述多個(gè)用戶(hù)的用戶(hù)關(guān)系鏈,篩選掉用戶(hù)關(guān)系鏈為空的用戶(hù)。
[0054]為了提高估計(jì)準(zhǔn)確率,避免一些小號(hào)的干擾,可以將用戶(hù)關(guān)系鏈為空的用戶(hù)篩選掉。例如,將好友列表為空的微信賬號(hào)刪除。
[0055]203、根據(jù)所述多個(gè)用戶(hù)的用戶(hù)關(guān)系鏈,篩選掉年齡處于第一年齡段和第二年齡段的用戶(hù)。
[0056]由于網(wǎng)絡(luò)使用的特性,年齡過(guò)小或年齡過(guò)大的用戶(hù)不太可能上網(wǎng),因此,填寫(xiě)的年齡過(guò)小或過(guò)大,其可信度較低,則在進(jìn)一步篩選時(shí),還可以將處于某個(gè)特定年齡段的用戶(hù)篩選掉。例如,篩選掉年齡小于5對(duì)或年齡大于60歲的用戶(hù)。當(dāng)然,在對(duì)年齡段進(jìn)行篩選之前,還需要篩選掉用戶(hù)資料中年齡項(xiàng)為空的用戶(hù)。
[0057]具體實(shí)施過(guò)程中,可以有以下步驟:對(duì)于多個(gè)用戶(hù)中的每個(gè)用戶(hù),在估計(jì)該用戶(hù)的年齡時(shí),從該用戶(hù)的用戶(hù)關(guān)系鏈上的多個(gè)用戶(hù)中,篩選掉用戶(hù)資料中年齡項(xiàng)為空的用戶(hù);再篩選掉年齡處于第一年齡段和第二年齡段