亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于游戲日志確定用戶性別的方法及系統(tǒng)與流程

文檔序號:12667294閱讀:222來源:國知局
一種基于游戲日志確定用戶性別的方法及系統(tǒng)與流程
本發(fā)明涉及用戶群分析領(lǐng)域,尤其涉及一種基于游戲日志確定用戶性別的方法及對應(yīng)系統(tǒng)。
背景技術(shù)
:用戶群定位是游戲設(shè)計(jì)的重要環(huán)節(jié),而性別則是其中一個(gè)重要的群體劃分標(biāo)準(zhǔn)。不同的游戲分類,如角色扮演、動(dòng)作游戲、策略戰(zhàn)棋、益智休閑、賽車游戲、飛行游戲、養(yǎng)成游戲、體育運(yùn)動(dòng)、冒險(xiǎn)游戲、射擊游戲、棋牌游戲、模擬經(jīng)營、格斗游戲,等,往往都有各自所針對的用戶群體。一款游戲面世后,往往男女比例有嚴(yán)重的不均衡性。例如,男性更喜歡積極激烈的活動(dòng),他們喜歡尋求刺激,喜歡占主導(dǎo)地位,喜歡冒險(xiǎn);而女性則喜歡多愁善感,喜歡保守,他們喜歡尋求穩(wěn)定而不是刺激,他們喜歡被主導(dǎo),喜歡‘小鳥依人’。由此男性相對更愛玩動(dòng)作冒險(xiǎn)類游戲,女性則相對更喜歡趣味類游戲。為了提高游戲推薦的效果,應(yīng)當(dāng)向不同性別的用戶推薦不同類型的游戲。比如戰(zhàn)爭類游戲多為男性所偏愛,如果向女性用戶推薦則會往往沒有效果。如果能夠針對用戶性別進(jìn)行精準(zhǔn)的游戲推送,往往能夠優(yōu)化用戶體驗(yàn),并同時(shí)提高推送的成功率?,F(xiàn)有的游戲平臺通常只能夠通過用戶填寫的注冊信息直接獲得用戶性別。但實(shí)際進(jìn)行游戲推送時(shí),如果用戶沒有提供性別信息,或者用戶是異網(wǎng)用戶,現(xiàn)有的技術(shù)往往無法獲得用戶性別,進(jìn)而無法有針對性地對用戶進(jìn)行有效的推送。目前,針對用戶性別,在用戶群體數(shù)據(jù)分析領(lǐng)域通常需要先通過構(gòu)建數(shù)據(jù)挖掘模型進(jìn)行訓(xùn)練,再使用訓(xùn)練得到的模型對用戶數(shù)據(jù)分析才能實(shí)現(xiàn)對用戶性別的預(yù)測。這種方式的計(jì)算量消耗非常大,且需要分布式編程才能夠?qū)崿F(xiàn)精確建模,增加了程序開發(fā)、運(yùn)作的成本。因而目前急需一種通過簡單的運(yùn)算即可實(shí)現(xiàn)用戶性別數(shù)據(jù)挖掘的方法,從而擺脫傳統(tǒng)數(shù)據(jù)挖掘方法而給推送系統(tǒng)帶來的運(yùn)算負(fù)荷。技術(shù)實(shí)現(xiàn)要素:為了解決現(xiàn)有技術(shù)存在的不足,本發(fā)明的目的在于提供一種基于游戲日志確定用戶性別的方法及系統(tǒng)。首先,為實(shí)現(xiàn)上述目的,提出一種基于游戲日志確定用戶性別的方法,包括以下步驟:數(shù)據(jù)預(yù)處理:篩選游戲日志數(shù)據(jù),對篩選出的有效數(shù)據(jù)建立統(tǒng)計(jì)表,所述統(tǒng)計(jì)表包括已知性別用戶分表以及未知性別用戶分表,所述已知性別用戶分表和未知性別用戶分表內(nèi)均包括用戶的IMSI(國際移動(dòng)用戶識別碼,InternationalMobileSubscriberIdentificationNumber)數(shù)據(jù)以及每一位用戶所使用的游戲名稱;統(tǒng)計(jì)游戲性別極性:統(tǒng)計(jì)所述已知性別分表中各款游戲出現(xiàn)的比例,得到各款游戲的性別極性G(game_i);預(yù)測未知用戶性別:遍歷所述未知性別用戶分表,統(tǒng)計(jì)每一位未知性別用戶使用每一款游戲的頻率P(game_i),并根據(jù)如下公式計(jì)算每一位用戶的性別概率其中,n為統(tǒng)計(jì)表中游戲的總數(shù)量,根據(jù)所述每一位用戶的性別概率Pgender預(yù)測對應(yīng)用戶的性別。進(jìn)一步,上述方法中,所述篩選游戲日志數(shù)據(jù)的步驟包括:通過業(yè)務(wù)口徑,由正則表達(dá)式判斷數(shù)據(jù)是否有效,篩選掉被判斷為無效的數(shù)據(jù)。所述無效的數(shù)據(jù)包含空數(shù)據(jù)、亂碼數(shù)據(jù)或非460開頭且長度不等于15位的數(shù)據(jù)。進(jìn)一步,上述方法中,所述統(tǒng)計(jì)表中的數(shù)據(jù)還包括:每一位用戶使用每一款游戲的次數(shù)或頻率。進(jìn)一步,上述方法中,所述已知性別用戶分表僅包括男性用戶的有效數(shù)據(jù),或僅包括女性用戶的有效數(shù)據(jù)。尤其,由于游戲日志數(shù)據(jù)中男性用戶所占比例大約有70%,因而著重對男性用戶數(shù)據(jù)進(jìn)行處理,即可直接根據(jù)男性用戶的概率推知女性用戶。進(jìn)一步,上述方法中,所述統(tǒng)計(jì)游戲性別極性的步驟包括:第一步,將所述已知性別分表中的用戶隨機(jī)分為兩組,統(tǒng)計(jì)其中第一組中各款游戲出現(xiàn)的比例,得到各款游戲的性別極性預(yù)測值G′(game_i);其中,第一組中用戶的數(shù)目占所述已知性別分表中用戶總數(shù)的70%;第二步,使用所述性別極性預(yù)測值G′(game_i)按照所述預(yù)測未知用戶性別的方法,預(yù)測第二組中各用戶的性別,并將預(yù)測的性別與所述第二組中各用戶標(biāo)記的性別進(jìn)行比較,評估預(yù)測未知用戶性別的準(zhǔn)確度。進(jìn)一步,上述方法中,所述用戶使用每一款游戲的頻率P(game_i)為所述未知性別用戶分表中標(biāo)記的每一位用戶使用每一款游戲的次數(shù)占該用戶使用游戲總次數(shù)的比例,或者為所述未知性別用戶分表中標(biāo)記的每一位用戶使用每一款游戲的頻率,或者為所述未知性別用戶分表中每一位用戶使用游戲的總數(shù)量的倒數(shù)。其次,為實(shí)現(xiàn)精確推送游戲的目的,還在上述方法中增加根據(jù)用戶性別推薦游戲的步驟,具體方法為:遍歷所述統(tǒng)計(jì)表,根據(jù)所述統(tǒng)計(jì)表中標(biāo)記的用戶性別或根據(jù)預(yù)測得到的用戶性別,查詢游戲目錄,推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲。其中,所述根據(jù)用戶性別推薦游戲的步驟中,推送所述游戲的順序還根據(jù)用戶使用每一種類游戲的頻率進(jìn)行排序,用戶使用頻率高的游戲種類推送時(shí)排序靠前,用戶使用頻率低的游戲種類推送時(shí)排序靠后。同時(shí),為實(shí)現(xiàn)精確推送游戲的目的,還提出一種基于游戲日志確定用戶性別的系統(tǒng),包括依次順序連接的:游戲日志數(shù)據(jù)接口模塊、數(shù)據(jù)預(yù)處理模塊、統(tǒng)計(jì)表存儲單元、游戲性別極性統(tǒng)計(jì)單元、未知用戶性別預(yù)測模塊;所述游戲日志數(shù)據(jù)接口模塊用于讀取游戲日志數(shù)據(jù);所述數(shù)據(jù)預(yù)處理模塊用于篩選游戲日志數(shù)據(jù)接口所讀取的游戲日志數(shù)據(jù),并對篩選出的有效數(shù)據(jù)建立統(tǒng)計(jì)表,將所述統(tǒng)計(jì)表存儲于所述統(tǒng)計(jì)表存儲單元;所述統(tǒng)計(jì)表存儲單元用于存儲所述統(tǒng)計(jì)表內(nèi)的數(shù)據(jù);所述統(tǒng)計(jì)表包括已知性別用戶分表以及未知性別用戶分表,所述已知性別用戶分表和未知性別用戶分表內(nèi)均包括用戶的IMSI數(shù)據(jù)以及每一位用戶所使用的游戲名稱;所述游戲性別極性統(tǒng)計(jì)單元用于統(tǒng)計(jì)所述已知性別分表中各款游戲出現(xiàn)的比例,并將所述比例存儲為各款游戲?qū)?yīng)的性別極性G(game_i)數(shù)據(jù);所述未知用戶性別預(yù)測模塊用于遍歷所述未知性別用戶分表,統(tǒng)計(jì)每一位未知性別用戶使用每一款游戲的頻率P(game_i),并根據(jù)如下公式計(jì)算每一位用戶的性別概率其中,n為統(tǒng)計(jì)表中游戲的總數(shù)量,最后根據(jù)所述每一位用戶的性別概率Pgender預(yù)測對應(yīng)用戶的性別。進(jìn)一步,所述系統(tǒng),在所述未知用戶性別預(yù)測模塊后還連接有推薦系統(tǒng),所述推薦系統(tǒng)遍歷所述統(tǒng)計(jì)表,根據(jù)所述統(tǒng)計(jì)表中標(biāo)記的用戶性別或根據(jù)預(yù)測得到的用戶性別,查詢游戲目錄,推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲。有益效果本發(fā)明針對游戲日志內(nèi)靜態(tài)存儲的數(shù)據(jù)類別數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。由于僅針對靜態(tài)數(shù)據(jù)進(jìn)行分析,而減輕了對用戶行為數(shù)據(jù)(如訪問內(nèi)容、訪問頻次、行為時(shí)間、行為載體)進(jìn)行分析時(shí)所產(chǎn)生的非必要的額外運(yùn)算負(fù)荷。此外,本方法主要運(yùn)用全概率公式的思想,并對根據(jù)游戲日志數(shù)據(jù)的特點(diǎn),對全概率公式的計(jì)算進(jìn)行了簡化。具體而言,通過對已知性別用戶的有效數(shù)據(jù)進(jìn)行統(tǒng)計(jì),得到各款游戲的性別極性G(game_i),用以取代全概率公式中的條件概率。本方法在進(jìn)行未知用戶性別預(yù)測時(shí),計(jì)算方法簡單高效,運(yùn)算資源消耗更少,無需對系統(tǒng)程序進(jìn)行大范圍的改進(jìn),即可使性別預(yù)測的準(zhǔn)確率至少達(dá)到71.4%。若同時(shí)結(jié)合模型融合方法,加入其它模型,即可將預(yù)測準(zhǔn)確率提升至81.2%以上。為進(jìn)一步簡化運(yùn)算,本方法中的已知性別用戶分表僅包括男性(或僅包括女性)用戶的有效數(shù)據(jù),通過設(shè)置0.5的閾值對計(jì)算得到的用戶的性別概率Pgender進(jìn)行判斷。這樣,在根據(jù)男性用戶數(shù)據(jù)判斷用戶性別為男性的概率Pgender后,即可得出相應(yīng)的性別為女性的概率(1-Pgender)。根據(jù)女性用戶數(shù)據(jù)進(jìn)行計(jì)算也類似,可通過簡單運(yùn)算得到相應(yīng)的性別為男性的概率。尤其,由于游戲日志數(shù)據(jù)中男性用戶所占比例更大,因而著重對男性用戶數(shù)據(jù)進(jìn)行處理。這樣,由于樣本本身更大,由此得到的男性用戶的概率也會更為準(zhǔn)確。同時(shí),為了能夠方便地評估本方法預(yù)測未知用戶性別的準(zhǔn)確度,本方法在統(tǒng)計(jì)游戲性別極性的步驟中優(yōu)先利用70%的已知性別分表中用戶數(shù)據(jù)進(jìn)行訓(xùn)練,并通過剩下的30%的已知性別分表中的用戶數(shù)據(jù)來評估模型效果。進(jìn)一步,本方法所統(tǒng)計(jì)的各款游戲的性別極性G(game_i)還為現(xiàn)有游戲推送系統(tǒng)所利用,稱為選擇推送游戲時(shí)的一個(gè)考核維度。推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲(例如,計(jì)算或統(tǒng)計(jì)得到某用戶為男性的概率為Pgender,則向該用戶推送性別極性G(game_i)在接近Pgender數(shù)值的游戲),這樣推送更加符合用戶使用游戲的傾向,推送游戲的成功率會更高,同時(shí),用戶接受程度也會更高。本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。附圖說明附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,并與本發(fā)明的實(shí)施例一起,用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:圖1為根據(jù)本發(fā)明實(shí)施例的基于游戲日志確定用戶性別的系統(tǒng)結(jié)構(gòu)圖;圖2為根據(jù)本發(fā)明實(shí)施例的游戲極性示意圖。具體實(shí)施方式以下結(jié)合附圖對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。圖1為基于游戲日志確定用戶性別的系統(tǒng)結(jié)構(gòu)圖,包括以下步驟:依次順序連接的:游戲日志數(shù)據(jù)接口模塊、數(shù)據(jù)預(yù)處理模塊、統(tǒng)計(jì)表存儲單元、游戲性別極性統(tǒng)計(jì)單元、未知用戶性別預(yù)測模塊;所述游戲日志數(shù)據(jù)接口模塊用于讀取游戲日志數(shù)據(jù);所述數(shù)據(jù)預(yù)處理模塊用于篩選游戲日志數(shù)據(jù)接口所讀取的游戲日志數(shù)據(jù),并對篩選出的有效數(shù)據(jù)建立統(tǒng)計(jì)表,將所述統(tǒng)計(jì)表存儲于所述統(tǒng)計(jì)表存儲單元;所述統(tǒng)計(jì)表存儲單元用于存儲所述統(tǒng)計(jì)表內(nèi)的數(shù)據(jù);所述統(tǒng)計(jì)表包括已知性別用戶分表以及未知性別用戶分表,所述已知性別用戶分表和未知性別用戶分表內(nèi)均包括用戶的IMSI數(shù)據(jù)以及每一位用戶所使用的游戲名稱;所述游戲性別極性統(tǒng)計(jì)單元用于統(tǒng)計(jì)所述已知性別分表中各款游戲出現(xiàn)的比例,并將所述比例存儲為各款游戲?qū)?yīng)的性別極性G(game_i)數(shù)據(jù);所述未知用戶性別預(yù)測模塊用于遍歷所述未知性別用戶分表,統(tǒng)計(jì)每一位未知性別用戶使用每一款游戲的頻率P(game_i),并根據(jù)如下公式計(jì)算每一位用戶的性別概率其中,n為統(tǒng)計(jì)表中游戲的總數(shù)量,最后根據(jù)所述每一位用戶的性別概率Pgender預(yù)測對應(yīng)用戶的性別。本實(shí)施例中,為實(shí)現(xiàn)精確推送游戲的目的,上述系統(tǒng)在在所述未知用戶性別預(yù)測模塊后還連接有推薦系統(tǒng),所述推薦系統(tǒng)遍歷所述統(tǒng)計(jì)表,根據(jù)所述統(tǒng)計(jì)表中標(biāo)記的用戶性別或根據(jù)預(yù)測得到的用戶性別,查詢游戲目錄,推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲。所述系統(tǒng)按照如下方法進(jìn)行工作:步驟一,數(shù)據(jù)預(yù)處理:篩選游戲日志數(shù)據(jù),對篩選出的有效數(shù)據(jù)建立統(tǒng)計(jì)表,所述統(tǒng)計(jì)表包括已知性別用戶分表以及未知性別用戶分表,所述已知性別用戶分表和未知性別用戶分表內(nèi)均包括用戶的IMSI(國際移動(dòng)用戶識別碼,InternationalMobileSubscriberIdentificationNumber)數(shù)據(jù)以及每一位用戶所使用的游戲名稱;步驟二,統(tǒng)計(jì)游戲性別極性:統(tǒng)計(jì)所述已知性別分表中各款游戲出現(xiàn)的比例,得到各款游戲的性別極性G(game_i);步驟三,預(yù)測未知用戶性別:遍歷所述未知性別用戶分表,統(tǒng)計(jì)每一位未知性別用戶使用每一款游戲的頻率P(game_i),并根據(jù)如下公式計(jì)算每一位用戶的性別概率其中,n為統(tǒng)計(jì)表中游戲的總數(shù)量,根據(jù)所述每一位用戶的性別概率Pgender預(yù)測對應(yīng)用戶的性別。例如,以男性用戶數(shù)據(jù)為例,如果計(jì)算得到的某一位用戶的性別概率Pgender不小于0.5,則判斷該用戶為男性;否則,判斷該用戶為女性。其中,上述方法的步驟一中,所述篩選游戲日志數(shù)據(jù)的步驟包括:通過業(yè)務(wù)口徑,由正則表達(dá)式判斷數(shù)據(jù)是否有效,篩選掉被判斷為無效的數(shù)據(jù)。所述無效的數(shù)據(jù)包含空數(shù)據(jù)、亂碼數(shù)據(jù)或非460開頭且長度不等于15位的數(shù)據(jù),例如imsi是0000000000000,或者13456778等。獨(dú)立使用上述步驟即可得到用戶的性別概率Pgender。進(jìn)一步,為簡化計(jì)算,上述方法的步驟一中,所述已知性別用戶分表僅包括男性用戶的有效數(shù)據(jù),或僅包括女性用戶的有效數(shù)據(jù)。尤其,由于游戲日志數(shù)據(jù)中男性用戶所占比例大約有70%,因而著重對男性用戶數(shù)據(jù)進(jìn)行處理,即可直接根據(jù)男性用戶的概率推知女性用戶。若方法中的已知性別用戶分表僅包括男性用戶的有效數(shù)據(jù),通過設(shè)置0.5的閾值對計(jì)算得到的用戶的性別概率Pgender進(jìn)行判斷:當(dāng)用戶性別為男性的概率Pgender≥0.5時(shí),即可判斷對應(yīng)用戶為男性。這樣,在根據(jù)男性用戶數(shù)據(jù)判斷用戶性別為男性的概率Pgender后,即可得出相應(yīng)的性別為女性的概率(1-Pgender)。對應(yīng)的,若方法中的已知性別用戶分表僅包括女性用戶的有效數(shù)據(jù),通過設(shè)置0.5的閾值對計(jì)算得到的用戶的性別概率Pgender進(jìn)行判斷:當(dāng)用戶性別為女性的概率Pgender≥0.5時(shí),即可判斷對應(yīng)用戶為女性。這樣,在根據(jù)男性用戶數(shù)據(jù)判斷用戶性別為女性的概率Pgender后,即可得出相應(yīng)的性別為男性的概率(1-Pgender)。不過,由于游戲日志數(shù)據(jù)中男性用戶的樣本更多,以男性用戶作為基準(zhǔn)進(jìn)行統(tǒng)計(jì)、計(jì)算,得到的結(jié)果會更為準(zhǔn)確。進(jìn)一步,為增加計(jì)算的準(zhǔn)確度,上述方法的步驟一中,所述統(tǒng)計(jì)表中的數(shù)據(jù)還可以包括:每一位用戶使用每一款游戲的次數(shù)或頻率。這樣在步驟三的計(jì)算中可通過所述每一位用戶使用每一款游戲的次數(shù)或頻率,通過簡單處理,得到用戶使用每一款游戲的頻率P(game_i)。進(jìn)一步,為量化用戶性別預(yù)測的準(zhǔn)確度,上述方法的步驟二,統(tǒng)計(jì)游戲性別極性的步驟包括:第一步,將所述已知性別分表中的用戶隨機(jī)分為兩組,統(tǒng)計(jì)其中第一組中各款游戲出現(xiàn)的比例,得到各款游戲的性別極性預(yù)測值G′(game_i);其中,第一組中用戶的數(shù)目占所述已知性別分表中用戶總數(shù)的70%;第二步,使用所述性別極性預(yù)測值G′(game_i)按照所述預(yù)測未知用戶性別的方法,預(yù)測第二組中各用戶的性別,并將預(yù)測的性別與所述第二組中各用戶標(biāo)記的性別進(jìn)行比較,評估預(yù)測未知用戶性別的準(zhǔn)確度。進(jìn)一步,為簡化計(jì)算,上述方法的步驟三中,所述用戶使用每一款游戲的頻率P(game_i)為所述未知性別用戶分表中標(biāo)記的每一位用戶使用每一款游戲的次數(shù)占該用戶使用游戲總次數(shù)的比例,或者為所述未知性別用戶分表中標(biāo)記的每一位用戶使用每一款游戲的頻率,或者為所述未知性別用戶分表中每一位用戶使用游戲的總數(shù)量的倒數(shù)。其次,為實(shí)現(xiàn)精確推送游戲的目的,還在上述方法中增加根據(jù)用戶性別推薦游戲的步驟,具體方法為:遍歷所述統(tǒng)計(jì)表,根據(jù)所述統(tǒng)計(jì)表中標(biāo)記的用戶性別或根據(jù)預(yù)測得到的用戶性別,查詢游戲目錄,推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲。其中,所述根據(jù)用戶性別推薦游戲的步驟中,推送所述游戲的順序還根據(jù)用戶使用每一種類游戲的頻率進(jìn)行排序,用戶使用頻率高的游戲種類推送時(shí)排序靠前,用戶使用頻率低的游戲種類推送時(shí)排序靠后。使用中,具體計(jì)算實(shí)例如下:步驟二中,通過已有性別標(biāo)簽的游戲日志數(shù)據(jù)計(jì)算各款游戲的性別極性G(game_i)的過程中,假設(shè)日志數(shù)據(jù)篩選出標(biāo)簽為'男'的用戶如下:用戶游戲游戲游戲游戲游戲性別user1愛情女神中國象棋極品飛車連連看男user2中國象棋愛情女神極品飛車連連看男user3大富翁愛情女神王牌飛行男user4愛情女神王牌飛行中國象棋連連看男user5王牌飛行愛情女神連連看極品飛車男user6愛情女神極品飛車中國象棋王牌飛行男user7中國象棋愛情女神大富翁極品飛車男user8中國象棋男user9大富翁王牌飛行極品飛車愛情女神男user10大富翁愛情女神連連看極品飛車中國象棋男G(game_'大富翁')=0.4,G(game_'連連看')=0.5G(game_'愛情女神')=0.9,G(game_'極品飛車')=0.7可計(jì)算得到G(game_'中國象棋')=0.7,G(game_'王牌飛行')=0.9則,根據(jù)公式得到user1....user10每個(gè)用戶為男的概率分別為0.7,0.7,0.6,0.65,0.65,0.7,0.675,0.7,0.625,0.64。以user10為例,具體計(jì)算過程為:游戲日志表中每個(gè)用戶使用游戲的數(shù)量,表示一段時(shí)間內(nèi)用戶使用游戲的次數(shù)。游戲日志表中統(tǒng)計(jì)的時(shí)間的長短越長越好,越長越準(zhǔn)確,實(shí)際應(yīng)用中,一般能夠統(tǒng)計(jì)用戶7天內(nèi)的數(shù)據(jù)。本發(fā)明可以通過圖2的數(shù)據(jù)圖直觀地對用戶的性別進(jìn)行判斷。以用戶B為例,其使用的“極品飛車”、“中國象棋”和“王牌飛行”都具備明顯的性別極性,因而,可通過上述公式預(yù)測其為男性。與其實(shí)際性別對比,即可判斷所述性別極性數(shù)據(jù)是否可靠,是否需要進(jìn)行修正。本發(fā)明技術(shù)方案的優(yōu)點(diǎn)主要體現(xiàn)在于:本發(fā)明應(yīng)用全概率公式的思想,直接對游戲用戶的日志數(shù)據(jù)進(jìn)行篩選統(tǒng)計(jì),通過簡單計(jì)算即可準(zhǔn)確推測出用戶性別。本方法無需對現(xiàn)有用戶信息構(gòu)數(shù)據(jù)挖掘模型,也無需對模型進(jìn)行特殊訓(xùn)練,僅通過簡單統(tǒng)計(jì)以及運(yùn)算即可準(zhǔn)確獲知對應(yīng)用戶的性別,從而降低了因構(gòu)造分布式方程訓(xùn)練而造成的額外的運(yùn)算成本,并同時(shí)提高了運(yùn)算效率。通過本方法,游戲運(yùn)營商可通過自身日志信息,僅花費(fèi)很小的成本即可對用戶進(jìn)行準(zhǔn)確的用戶群定位,從而有針對性地進(jìn)行游戲推送,運(yùn)營成本大大降低,而同時(shí),用戶體驗(yàn)卻可以有所提升。具體而言:1)本方法所用數(shù)據(jù)簡單,可以直接從運(yùn)營日志獲取,這類數(shù)據(jù)在每一個(gè)游戲公司應(yīng)該都有,是最初級的日志數(shù)據(jù)。2)本方法實(shí)現(xiàn)相對容易本專利預(yù)測出來的用戶性別準(zhǔn)確度為71.4%,再結(jié)合模型融合方法加入其它模型,最后提升到81.2%計(jì)算量成本較低,一般數(shù)據(jù)挖掘模型先通過構(gòu)建數(shù)據(jù)挖掘模型來訓(xùn)練得到模型再根據(jù)模型來對數(shù)據(jù)進(jìn)行男女預(yù)測,計(jì)算量消耗非常大,且需要分布式編程增加了編程難度,這種方法只需要簡單的公式即可實(shí)現(xiàn),沒有因傳統(tǒng)的數(shù)據(jù)挖掘方法而有所約束。3)本方法的數(shù)據(jù)模型容易理解,尤其相比較于傳統(tǒng)的數(shù)據(jù)挖掘算法而言,本方法更為簡單,很好理解,系統(tǒng)實(shí)現(xiàn)難度也更小。本領(lǐng)域普通技術(shù)人員可以理解:以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,對于本領(lǐng)域的技術(shù)人員來說,其依然可以對前述各實(shí)施例記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1