本發(fā)明涉及數(shù)據(jù)分析領(lǐng)域,尤其涉及一種目標(biāo)用戶濃度的獲取方法及裝置。
背景技術(shù):
在信息推送技術(shù)領(lǐng)域,目標(biāo)用戶濃度是分析信息推送效果的重要指標(biāo),其通過計(jì)算符合特定條件的目標(biāo)用戶占全部用戶的百分比,獲得用戶群體的構(gòu)成、用戶狀態(tài)等信息,以便對(duì)信息推送效果的作用人群進(jìn)行評(píng)估。
在現(xiàn)有的獲得目標(biāo)用戶濃度的方法中,以問卷調(diào)查的形式獲得用戶數(shù)據(jù)并將這些用戶數(shù)據(jù)作為樣本,對(duì)目標(biāo)用戶濃度進(jìn)行計(jì)算。
現(xiàn)有的目標(biāo)用戶濃度的獲取方法獲取到的目標(biāo)用戶濃度的準(zhǔn)確性不高。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有的目標(biāo)用戶濃度的獲取方法所獲取的目標(biāo)用戶濃度的準(zhǔn)確性不高的問題,本發(fā)明提供一種目標(biāo)用戶濃度的獲取方法及裝置。
一方面,本發(fā)明提供一種目標(biāo)用戶濃度的獲取方法,包括:
獲取用戶的網(wǎng)頁瀏覽操作,根據(jù)所述網(wǎng)頁瀏覽操作生成與所述用戶對(duì)應(yīng)的用戶信息;
根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶;
向所述第一用戶發(fā)送調(diào)查請(qǐng)求,并接收所述第一用戶發(fā)送的調(diào)查反饋信息;
將所述第一用戶的調(diào)查反饋信息和用戶信息進(jìn)行融合,獲得數(shù)據(jù)樣本庫,根據(jù)預(yù)設(shè)規(guī)則對(duì)所述數(shù)據(jù)樣本庫進(jìn)行分析處理得到目標(biāo)用戶的濃度。
進(jìn)一步地,所述用戶信息包括行為標(biāo)簽和人口屬性標(biāo)簽;所述調(diào)查反饋信息包括行為反饋信息和人口屬性反饋信息;
其中,所述根據(jù)所述網(wǎng)頁瀏覽操作生成與所述用戶對(duì)應(yīng)的用戶信息,包括:
根據(jù)所述網(wǎng)頁瀏覽操作生成所述用戶的行為標(biāo)簽;
根據(jù)所述行為標(biāo)簽分析獲得所述用戶的人口屬性標(biāo)簽;
所述向所述第一用戶發(fā)送調(diào)查請(qǐng)求,并接收所述第一用戶的調(diào)查反饋信息,包括:
向所述第一用戶發(fā)送調(diào)查請(qǐng)求,其中所述調(diào)查請(qǐng)求包括行為調(diào)查請(qǐng)求和人口屬性調(diào)查請(qǐng)求;
接收所述第一用戶發(fā)送的行為反饋信息和人口屬性反饋信息;
所述將所述第一用戶的調(diào)查反饋信息和用戶信息進(jìn)行融合,獲得數(shù)據(jù)樣本庫,包括:
將所述第一用戶的行為標(biāo)簽與行為反饋信息進(jìn)行融合,獲得所述第一用戶的行為信息;
將所述第一用戶的人口屬性標(biāo)簽和人口屬性反饋信息進(jìn)行融合,獲得所述第一用戶的人口屬性信息;
根據(jù)每個(gè)所述第一用戶的行為信息和人口屬性信息,建立數(shù)據(jù)樣本庫。
進(jìn)一步地,所述用戶的人口屬性標(biāo)簽的數(shù)量為至少兩個(gè);
所述根據(jù)所述行為標(biāo)簽分析獲得所述用戶的人口屬性標(biāo)簽之后,還包括:
若同一所述用戶的人口屬性標(biāo)簽中包括互相對(duì)立的人口屬性標(biāo)簽,則刪除所述互相對(duì)立的人口屬性標(biāo)簽。
進(jìn)一步地,所述根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶,包括:
對(duì)所述用戶的每個(gè)行為標(biāo)簽進(jìn)行置信度測(cè)評(píng);
若所述用戶的全部所述行為標(biāo)簽的置信度均值大于預(yù)設(shè)的置信度閾值,則確定所述用戶為第一用戶。
進(jìn)一步地,所述用戶信息中還包括:所述行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間;
所述根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶,包括:
根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間,獲得所述用戶的每個(gè)行為標(biāo)簽的穩(wěn)定性參數(shù);
根據(jù)所述用戶的每個(gè)行為標(biāo)簽的穩(wěn)定性參數(shù)確定所述第一用戶。
進(jìn)一步地,所述用戶信息中還包括:所述行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù);
所述根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶,包括:
根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù),獲得所述用戶的每個(gè)行為標(biāo)簽的合理性參數(shù);
根據(jù)所述用戶的每個(gè)行為標(biāo)簽的合理性參數(shù)確定所述第一用戶。
進(jìn)一步地,所述根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶之前,還包括:
根據(jù)每個(gè)所述用戶的行為標(biāo)簽的數(shù)量和全部用戶的行為標(biāo)簽類型總數(shù),獲得每個(gè)所述用戶的行為標(biāo)簽的完整度;
若所述用戶的行為標(biāo)簽的完整度大于預(yù)設(shè)的完整度閾值,則確定所述用戶為第二用戶;
所述根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶,包括:
根據(jù)所述第二用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶。
另一方面,本發(fā)明還提供一種目標(biāo)用戶濃度的獲取裝置,包括:
獲取模塊,用于獲取用戶的網(wǎng)頁瀏覽操作,根據(jù)所述網(wǎng)頁瀏覽操作生成與所述用戶對(duì)應(yīng)的用戶信息;
篩選模塊,用于根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶;
調(diào)查模塊,用于向所述第一用戶發(fā)送調(diào)查請(qǐng)求,并接收所述第一用戶發(fā)送的調(diào)查反饋信息;
分析模塊,用于將所述第一用戶的調(diào)查反饋信息和用戶信息進(jìn)行融合,獲得數(shù)據(jù)樣本庫,根據(jù)預(yù)設(shè)規(guī)則對(duì)所述數(shù)據(jù)樣本庫進(jìn)行分析處理得到目標(biāo)用戶的濃度。
進(jìn)一步地,所述用戶信息包括行為標(biāo)簽和人口屬性標(biāo)簽;所述調(diào)查反饋信息包括行為反饋信息和人口屬性反饋信息;
所述獲取模塊,還用于根據(jù)所述網(wǎng)頁瀏覽操作生成所述用戶的行為標(biāo)簽;根據(jù)所述行為標(biāo)簽分析獲得所述用戶的人口屬性標(biāo)簽;
所述調(diào)查模塊,還用于向所述第一用戶發(fā)送調(diào)查請(qǐng)求,其中所述調(diào)查請(qǐng)求包括行為調(diào)查請(qǐng)求和人口屬性調(diào)查請(qǐng)求;接收所述第一用戶發(fā)送的行為反饋信息和人口屬性反饋信息;
所述分析模塊,還用于將所述第一用戶的行為標(biāo)簽與行為反饋信息進(jìn)行融合,獲得所述第一用戶的行為信息;將所述第一用戶的人口屬性標(biāo)簽和人口屬性反饋信息進(jìn)行融合,獲得所述第一用戶的人口屬性信息;根據(jù)每個(gè)所述第一用戶的行為信息和人口屬性信息,建立數(shù)據(jù)樣本庫。
進(jìn)一步地,所述篩選模塊,還用于對(duì)所述用戶的每個(gè)行為標(biāo)簽進(jìn)行置信度測(cè)評(píng);若所述用戶的全部所述行為標(biāo)簽的置信度均值大于預(yù)設(shè)的置信度閾值,則確定所述用戶為第一用戶;
或者,
所述用戶信息中還包括:所述行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間;所述篩選模塊,還用于根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間,獲得所述用戶的每個(gè)行為標(biāo)簽的穩(wěn)定性參數(shù);根據(jù)所述用戶的每個(gè)行為標(biāo)簽的穩(wěn)定性參數(shù)確定所述第一用戶;
或者,
所述用戶信息中還包括:所述行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù);所述篩選模塊,還用于根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù),獲得所述用戶的每個(gè)行為標(biāo)簽的合理性參數(shù);根據(jù)所述用戶的每個(gè)行為標(biāo)簽的合理性參數(shù)確定所述第一用戶。
本發(fā)明提供的目標(biāo)用戶濃度的獲取方法及裝置,通過采用獲取用戶的網(wǎng)頁瀏覽操作,根據(jù)所述網(wǎng)頁瀏覽操作生成與所述用戶對(duì)應(yīng)的用戶信息;根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶;向所述第一用戶發(fā)送調(diào)查請(qǐng)求,并接收所述第一用戶發(fā)送的調(diào)查反饋信息;將所述第一用戶的調(diào)查反饋信息和用戶信息進(jìn)行融合,獲得數(shù)據(jù)樣本庫,根據(jù)預(yù)設(shè)規(guī)則對(duì)所述數(shù)據(jù)樣本庫進(jìn)行分析處理得到目標(biāo)用戶的濃度,從而通過優(yōu)化數(shù)據(jù)樣本庫中各數(shù)據(jù)的來源方式,獲得更為準(zhǔn)確的目標(biāo)用戶的濃度,進(jìn)而為信息推送效果的評(píng)估提供良好的依據(jù)和支持。
附圖說明
圖1為本發(fā)明實(shí)施例一提供的一種目標(biāo)用戶濃度的獲取方法的流程示意圖;
圖2為本發(fā)明實(shí)施例二提供的一種目標(biāo)用戶濃度的獲取方法的流程示意圖;
圖3為本發(fā)明實(shí)施例三提供的一種目標(biāo)用戶濃度的獲取裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。
圖1為本發(fā)明實(shí)施例一提供的一種目標(biāo)用戶濃度的獲取方法的流程示意圖,如圖1所述,本實(shí)施例提供的目標(biāo)用戶濃度的獲取方法包括如下步驟:
步驟101、獲取用戶的網(wǎng)頁瀏覽操作,根據(jù)所述網(wǎng)頁瀏覽操作生成與所述用戶對(duì)應(yīng)的用戶信息。
具體的,獲取用戶的網(wǎng)頁瀏覽操作,根據(jù)獲取的該網(wǎng)頁瀏覽操作生成與該用戶對(duì)應(yīng)的用戶信息。其中,獲取用戶的網(wǎng)頁瀏覽操作可通過對(duì)查詢?yōu)g覽器中的用戶瀏覽窗口的歷史信息或?qū)崟r(shí)對(duì)用戶當(dāng)前所瀏覽頁面進(jìn)行記錄等方式獲取。其獲取的網(wǎng)頁瀏覽操作的內(nèi)容具體可為網(wǎng)頁的網(wǎng)址,網(wǎng)頁的類型,以及網(wǎng)頁所展示的具體內(nèi)容等,例如,網(wǎng)頁的類型可為搜索引擎,在線視頻觀看,網(wǎng)上購物等,而網(wǎng)頁所展示的具體內(nèi)容可為,搜索的關(guān)鍵詞,視頻內(nèi)容,商品內(nèi)容等。隨后,根據(jù)獲得的該網(wǎng)頁瀏覽操作生成與該用戶對(duì)應(yīng)的用戶信息,其具體生成方法可使用本領(lǐng)域任意一種用戶信息的生成方法,本發(fā)明對(duì)此不做限定。
步驟102、根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶。
具體的,對(duì)獲取到的每個(gè)用戶的用戶信息進(jìn)行篩選,例如,可通過采用現(xiàn)有的用戶信息篩選方法,比如過濾掉錯(cuò)誤的用戶信息等,本發(fā)明對(duì)此不做限定。根據(jù)篩選情況,從全部用戶中確定符合預(yù)設(shè)條件的第一用戶,例如,選出用戶信息可信度較高的第一用戶,選出用戶信息比較完整的第一用戶等。
步驟103、向所述第一用戶發(fā)送調(diào)查請(qǐng)求,并接收所述第一用戶發(fā)送的調(diào)查反饋信息。
具體的,在確認(rèn)第一用戶之后,向第一用戶發(fā)送調(diào)查請(qǐng)求,其中,該調(diào)查請(qǐng)求可以問卷調(diào)查的形式進(jìn)行發(fā)送,也可以其他形式進(jìn)行發(fā)送,本發(fā)明對(duì)此不進(jìn)行限定。接收第一用戶發(fā)送的調(diào)查反饋信息,其中,獲得的調(diào)查反饋信息將與步驟101中獲得的用戶信息在內(nèi)容上相應(yīng),即相當(dāng)于,若獲取的用戶信息為該用戶使用過某一產(chǎn)品;則調(diào)查請(qǐng)求可為是否使用過某一產(chǎn)品等。
步驟104、將所述第一用戶的調(diào)查反饋信息和用戶信息進(jìn)行融合,獲得數(shù)據(jù)樣本庫,根據(jù)預(yù)設(shè)規(guī)則對(duì)所述數(shù)據(jù)樣本庫進(jìn)行分析處理得到目標(biāo)用戶的濃度。
具體的,將每個(gè)第一用戶的調(diào)查反饋信息和用戶信息進(jìn)行融合,獲得數(shù)據(jù)樣本庫,其中,可根據(jù)用戶信息和調(diào)查反饋信息的內(nèi)容進(jìn)行融合。具體地,將表征相同內(nèi)容的用戶信息和調(diào)查反饋信息進(jìn)行合并,以獲得該內(nèi)容的信息集合,建立形成以第一用戶的身份標(biāo)識(shí)(identity,簡(jiǎn)稱ID)為索引的數(shù)據(jù)樣本庫,例如,ID為“1”的第一用戶的用戶信息為“看《建國偉業(yè)》”,而該用戶的調(diào)查反饋信息為“看過國產(chǎn)電影”,則可將用戶信息的內(nèi)容和調(diào)查反饋信息的內(nèi)容,進(jìn)行合并形成格式為{ID,用戶信息&調(diào)查反饋信息}的數(shù)據(jù)樣本,如,{1,看《建國偉業(yè)》&看過國產(chǎn)電影}。
進(jìn)一步地,由于第一用戶的發(fā)送的調(diào)查反饋信息不完整,可能會(huì)產(chǎn)生當(dāng)?shù)谝挥脩舻挠脩粜畔⒅邪ㄔ撚脩舻恼{(diào)查反饋信息中沒有涉及的內(nèi)容的情況。此時(shí),也可對(duì)用戶信息和調(diào)查反饋信息進(jìn)行融合,例如,ID為“2”的第一用戶的用戶信息為“看《建國偉業(yè)》”,而該與用戶的調(diào)查反饋信息僅為“有網(wǎng)購行為”,其并沒有涉及看電影的內(nèi)容,則可將用戶信息的種類和調(diào)查反饋信息的種類進(jìn)行合并,形成格式為{ID,用戶信息,調(diào)查反饋信息}的數(shù)據(jù)樣本,如,{2,看《建國偉業(yè)》,有網(wǎng)購行為};反之,當(dāng)獲取的第一用戶的用戶信息不完整時(shí),可采用相似方法。此外,也可采用其他融合方式,本發(fā)明對(duì)此不進(jìn)行限定。
根據(jù)預(yù)設(shè)規(guī)則對(duì)數(shù)據(jù)樣本庫進(jìn)行分析處理得到目標(biāo)用戶濃度,其中,預(yù)設(shè)規(guī)則可由企業(yè)根據(jù)分析要求進(jìn)行自行設(shè)定,例如,若希望得知目標(biāo)用戶為老年人的目標(biāo)用戶的濃度,則可在數(shù)據(jù)樣本庫內(nèi)的第一用戶的數(shù)據(jù)中,選出滿足特定年齡條件的目標(biāo)用戶,并用該目標(biāo)用戶的數(shù)量除以所有在數(shù)據(jù)樣本庫內(nèi)的第一用戶中的數(shù)量,得到該目標(biāo)用戶濃度。
本發(fā)明實(shí)施例一提供的目標(biāo)用戶濃度的獲取方法,通過采用獲取用戶的網(wǎng)頁瀏覽操作,根據(jù)所述網(wǎng)頁瀏覽操作生成與所述用戶對(duì)應(yīng)的用戶信息;根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶;向所述第一用戶發(fā)送調(diào)查請(qǐng)求,并接收所述第一用戶發(fā)送的調(diào)查反饋信息;將所述第一用戶的調(diào)查反饋信息和用戶信息進(jìn)行融合,獲得數(shù)據(jù)樣本庫,根據(jù)預(yù)設(shè)規(guī)則對(duì)所述數(shù)據(jù)樣本庫進(jìn)行分析處理得到目標(biāo)用戶的濃度,從而通過優(yōu)化數(shù)據(jù)樣本庫中各數(shù)據(jù)的來源方式,獲得更為準(zhǔn)確的目標(biāo)用戶的濃度,進(jìn)而為信息推送效果的評(píng)估提供良好的依據(jù)和支持。
進(jìn)一步地,為了進(jìn)一步提高獲取的目標(biāo)用戶濃度的準(zhǔn)確性,圖2為本發(fā)明實(shí)施例二提供的一種目標(biāo)用戶濃度的獲取方法的流程示意圖,在圖1所示方法的基礎(chǔ)上,在本發(fā)明實(shí)施例二中,用戶信息包括行為標(biāo)簽和人口屬性標(biāo)簽,調(diào)查反饋信息包括行為反饋信息和人口屬性反饋信息。
步驟101具體包括:
步驟200、獲取用戶的網(wǎng)頁瀏覽操作;
步驟201、根據(jù)所述網(wǎng)頁瀏覽操作生成所述用戶的行為標(biāo)簽;
步驟202、根據(jù)所述行為標(biāo)簽分析獲得所述用戶的人口屬性標(biāo)簽。
具體的,在步驟200-202中,通過獲取用戶的網(wǎng)頁瀏覽操作,以生成用戶的行為標(biāo)簽,其中該行為標(biāo)簽可理解為用戶的興趣愛好的標(biāo)識(shí),例如,獲取的某用戶的網(wǎng)頁瀏覽操作為觀看某一電視劇,則可生成該用戶為上述電視劇的愛好者的行為標(biāo)簽。相似的,還可通過獲取其他網(wǎng)頁瀏覽操作生成更多的行為標(biāo)簽,例如,汽車愛好者,游戲愛好者,美食愛好者等等,同時(shí)還可進(jìn)一步劃分,例如,某一品牌的汽車的愛好者,某一種類的游戲的愛好者,某一種類的美食的愛好者等行為標(biāo)簽。根據(jù)對(duì)該用戶的行為標(biāo)簽的分析可獲得該用戶的人口屬性標(biāo)簽,其中,人口屬性標(biāo)簽可理解為用戶的固有屬性的標(biāo)識(shí),例如,性別,年齡,學(xué)歷,婚姻等這些相對(duì)固定的屬性。這些用戶的人口屬性標(biāo)簽可通過對(duì)行為標(biāo)簽進(jìn)行分析獲取,例如,若某一用戶的行為標(biāo)簽中包括有游戲愛好者,則可分析出,該用戶為男性的可能性較大等。
相應(yīng)的,步驟103具體包括:
步驟203、向所述第一用戶發(fā)送調(diào)查請(qǐng)求,其中所述調(diào)查請(qǐng)求包括行為調(diào)查請(qǐng)求和人口屬性調(diào)查請(qǐng)求;
步驟204、接收所述第一用戶發(fā)送的行為反饋信息和人口屬性反饋信息。
具體的,向第一用戶發(fā)送的調(diào)查請(qǐng)求中包括有行為調(diào)查請(qǐng)求和人口屬性調(diào)查請(qǐng)求,其中,該調(diào)查請(qǐng)求可以調(diào)查問卷或投票等方式發(fā)送給第一用戶。相應(yīng)的,接收由第一用戶發(fā)送的的行為反饋信息和人口屬性反饋信息。
步驟104具體包括:
步驟205、將所述第一用戶的行為標(biāo)簽與行為反饋信息進(jìn)行融合,獲得所述第一用戶的行為信息;
步驟206、將所述第一用戶的人口屬性標(biāo)簽和人口屬性反饋信息進(jìn)行融合,獲得所述第一用戶的人口屬性信息;
步驟207、根據(jù)每個(gè)所述第一用戶的行為信息和人口屬性信息,建立數(shù)據(jù)樣本庫;
步驟208、根據(jù)預(yù)設(shè)規(guī)則對(duì)所述數(shù)據(jù)樣本庫進(jìn)行分析處理得到目標(biāo)用戶的濃度。
具體的,在步驟206-208中,通過對(duì)第一用戶網(wǎng)頁瀏覽操作進(jìn)行分析獲得的行為標(biāo)簽,與通過對(duì)第一用戶進(jìn)行調(diào)查獲取的行為反饋信息進(jìn)行融合,形成行為信息;還通過對(duì)第一用戶的行為標(biāo)簽進(jìn)行分析獲得的人口屬性標(biāo)簽,與通過對(duì)第一用戶進(jìn)行調(diào)查獲取的人口屬性反饋信息進(jìn)行融合形成人口屬性信息。隨后,建立以第一用戶為ID索引的包括每個(gè)第一用戶的行為信息和人口屬性信息在內(nèi)的數(shù)據(jù)樣本庫??梢岳斫獾氖?,在本實(shí)施例二中,將行為標(biāo)簽與行為反饋信息進(jìn)行融合以及將人口屬性標(biāo)簽和人口屬性反饋信息進(jìn)行融合可理解為,將實(shí)施例一中的用戶信息和調(diào)查反饋信息進(jìn)一步細(xì)化,建立分別以標(biāo)簽信息、人口屬性信息以及用戶ID為維度的數(shù)據(jù)坐標(biāo),并將通過分析或調(diào)查獲取的相應(yīng)內(nèi)容輸入至相應(yīng)的數(shù)據(jù)欄內(nèi),從而獲得一個(gè)以用戶ID為索引的多維數(shù)據(jù)樣本庫,其中,融合方式具體可參見實(shí)施例一相應(yīng)部分,在此不做贅述。此外,步驟208與步驟104中的內(nèi)容對(duì)應(yīng),在此不做贅述。
進(jìn)一步地,為了提高分析效率,其中用戶的人口屬性標(biāo)簽的數(shù)量為至少兩個(gè);
相應(yīng)的,步驟202之后,還包括:若同一所述用戶的人口屬性標(biāo)簽中包括互相對(duì)立的人口屬性標(biāo)簽,則刪除所述互相對(duì)立的人口屬性標(biāo)簽。
具體的,人口屬性標(biāo)簽一般所指為用戶的固定屬性,即相當(dāng)于其通常只包括單一信息,而若通過對(duì)某一用戶某一行為標(biāo)簽進(jìn)行分析獲得該用戶的人口屬性標(biāo)簽為該用戶為男性,而通過對(duì)該用戶的另一行為標(biāo)簽進(jìn)行分析獲得該用戶的人口屬性標(biāo)簽為該用戶為女性,則將“該用戶為男性”和“該用戶為女性”這種情況稱之為互相對(duì)立的人口屬性標(biāo)簽,在這種情況下,需要將互相對(duì)立的人口屬性標(biāo)簽刪除,以減少對(duì)無效數(shù)據(jù)的分析次數(shù),提高分析效率。
本發(fā)明實(shí)施例二提供了一種目標(biāo)用戶濃度的獲取方法,通過用戶信息包括行為標(biāo)簽和人口屬性標(biāo)簽,調(diào)查反饋信息包括行為反饋信息和人口屬性反饋信息,并對(duì)整個(gè)分析過程進(jìn)行細(xì)化,以建立分別以標(biāo)簽信息,人口屬性信息以及第一用戶ID為維度的數(shù)據(jù)樣本庫,從而進(jìn)一步提高獲取的目標(biāo)用戶濃度的準(zhǔn)確性。
進(jìn)一步地,為了更好地說明本發(fā)明,在目標(biāo)用戶濃度的獲取方法的一種具體實(shí)現(xiàn)方式中,在上述實(shí)施例二的基礎(chǔ)上,步驟102具體可包括:
對(duì)所述用戶的每個(gè)行為標(biāo)簽進(jìn)行置信度測(cè)評(píng);
若所述用戶的全部所述行為標(biāo)簽的置信度均值大于預(yù)設(shè)的置信度閾值,則確定所述用戶為第一用戶。
具體的,置信度可理解為行為標(biāo)簽的可信度程度,其可通過以百分比的形式進(jìn)行表示,例如,若分析獲得出某一用戶的行為標(biāo)簽為“汽車愛好者”,而該行為標(biāo)簽的置信度為70%,則相當(dāng)于有百分之七十的概率,該用戶的確為汽車愛好者。通過對(duì)用戶的每一個(gè)行為標(biāo)簽的置信度進(jìn)行測(cè)評(píng),獲得該用戶的全部行為標(biāo)簽的置信度均值,將該均值與預(yù)設(shè)的置信度閾值進(jìn)行比對(duì),以確定第一用戶。通過對(duì)行為標(biāo)簽置信度的測(cè)評(píng),可排除一些可信度程度不高的用戶,并將可信度較高的用戶作為第一用戶,以進(jìn)行后續(xù)調(diào)查和分析,進(jìn)而提高了目標(biāo)用戶濃度的準(zhǔn)確性。
或者,在目標(biāo)用戶濃度的獲取方法的另一種具體實(shí)現(xiàn)方式中,在上述實(shí)施例二的基礎(chǔ)上,所述用戶信息中還包括:所述行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間;
步驟102具體可包括:
根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間,獲得所述用戶的每個(gè)行為標(biāo)簽的穩(wěn)定性參數(shù);
根據(jù)所述用戶的每個(gè)行為標(biāo)簽的穩(wěn)定性參數(shù)確定所述第一用戶。
具體的,用戶信息中還包括行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間。根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間,獲得所述用戶的每個(gè)行為標(biāo)簽的穩(wěn)定性參數(shù),其中,該穩(wěn)定性參數(shù)可理解為與行為標(biāo)簽發(fā)生的分布;例如,若針對(duì)某一用戶在每一個(gè)周一均分析出該用戶行為標(biāo)簽中包括有某一行為標(biāo)簽,則說明,該用戶的該某一行為標(biāo)簽的穩(wěn)定性很高;反之,若某一用戶的行為標(biāo)簽中包括有另一行為標(biāo)簽,但是該另一行為標(biāo)簽僅在幾個(gè)月前出現(xiàn)過,近期沒有再出現(xiàn),則可說明,用戶的該另一行為標(biāo)簽的穩(wěn)定性很低。通過將每個(gè)行為標(biāo)簽的穩(wěn)定性轉(zhuǎn)換為參數(shù),其可根據(jù)實(shí)際情況進(jìn)行相應(yīng)的設(shè)定,選出符合要求的第一用戶。從而提高了目標(biāo)用戶濃度的準(zhǔn)確性。
或者,在目標(biāo)用戶濃度的獲取方法的又一種具體實(shí)現(xiàn)方式中,在上述實(shí)施例二的基礎(chǔ)上,所述用戶信息中還包括:所述行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù);
步驟102具體可包括:
根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù),獲得所述用戶的每個(gè)行為標(biāo)簽的合理性參數(shù);
根據(jù)所述用戶的每個(gè)行為標(biāo)簽的合理性參數(shù)確定所述第一用戶。
具體的,用戶信息中還包括行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù)。根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù),獲得所述用戶的每個(gè)行為標(biāo)簽的合理性參數(shù),通過對(duì)行為發(fā)生的次數(shù)進(jìn)行統(tǒng)計(jì),例如,某一用戶的行為標(biāo)簽在短時(shí)間內(nèi)進(jìn)行了10000次,則可說明,該用戶的這一行為標(biāo)簽并不符合常理,該用戶可能會(huì)存在有作弊行為。通過對(duì)用戶的每一行為標(biāo)簽的合理性參數(shù)進(jìn)行分析,以確定合理性參數(shù)符合要求的第一用戶,從而提高目標(biāo)用戶濃度的準(zhǔn)確性。
需要說明的是,上述確定第一用戶的預(yù)設(shè)條件均可進(jìn)行結(jié)合,以進(jìn)一步提高目標(biāo)用戶濃度的準(zhǔn)確性,不再贅述。
進(jìn)一步地,在上述任意實(shí)現(xiàn)方式中,為了進(jìn)一步提高分析效率,步驟102之前,還可以包括:
根據(jù)每個(gè)所述用戶的行為標(biāo)簽的數(shù)量和全部用戶的行為標(biāo)簽類型總數(shù),獲得每個(gè)所述用戶的行為標(biāo)簽的完整度;
若所述用戶的行為標(biāo)簽的完整度大于預(yù)設(shè)的完整度閾值,則確定所述用戶為第二用戶。
相應(yīng)的,步驟102可包括:
根據(jù)所述第二用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶。
具體的,在對(duì)用戶進(jìn)行篩選之前,將根據(jù)每個(gè)所述用戶的行為標(biāo)簽的數(shù)量和全部用戶的行為標(biāo)簽類型總數(shù),例如,若統(tǒng)計(jì)出的全部用戶的行為標(biāo)簽類型的總數(shù)為5個(gè),其分別為A,B,C,D,E;而統(tǒng)計(jì)出的某一用戶的行為標(biāo)簽的數(shù)量為2個(gè),其可為不同類型的行為標(biāo)簽A和E,或,其也可為同一類型的不同內(nèi)容的行為標(biāo)簽A1和A2,即相當(dāng)于,通過將某一用戶的行為標(biāo)簽的數(shù)量與全部行為標(biāo)簽類型的總數(shù)進(jìn)行比值計(jì)算,以獲取行為標(biāo)簽的完整度??梢岳斫獾氖?,該行為標(biāo)簽越完整,則完整度數(shù)值越大,若用戶的行為標(biāo)簽的完整度大于預(yù)設(shè)的完整度閾值,則確定所述用戶為第二用戶。相應(yīng)的,根據(jù)第二用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶。
本發(fā)明上述實(shí)施方式提供的目標(biāo)用戶濃度的獲取方法,通過根據(jù)所述用戶的行為標(biāo)簽的置信度均值,穩(wěn)定性參數(shù)和合理性參數(shù)進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶,從而進(jìn)一步提高了目標(biāo)用戶濃度的準(zhǔn)確性。
圖3為本發(fā)明實(shí)施例三提供的一種目標(biāo)用戶濃度的獲取裝置的結(jié)構(gòu)示意圖,如圖3所示,該裝置包括:
獲取模塊10,用于獲取用戶的網(wǎng)頁瀏覽操作,根據(jù)所述網(wǎng)頁瀏覽操作生成與所述用戶對(duì)應(yīng)的用戶信息;
篩選模塊20,用于根據(jù)所述用戶的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶;
調(diào)查模塊30,用于向所述第一用戶發(fā)送調(diào)查請(qǐng)求,并接收所述第一用戶發(fā)送的調(diào)查反饋信息;
分析模塊40,用于將所述第一用戶的調(diào)查反饋信息和用戶信息進(jìn)行融合,獲得數(shù)據(jù)樣本庫,根據(jù)預(yù)設(shè)規(guī)則對(duì)所述數(shù)據(jù)樣本庫進(jìn)行分析處理得到目標(biāo)用戶的濃度。
需要說明的是,本實(shí)施方式提供的目標(biāo)用戶濃度的獲取裝置能夠?qū)崿F(xiàn)上述實(shí)施例一提供的目標(biāo)用戶濃度的獲取方法,在此不做贅述。
本實(shí)施方式提供的目標(biāo)用戶濃度的獲取裝置,通過獲取模塊10獲取用戶的網(wǎng)頁瀏覽操作,根據(jù)所述網(wǎng)頁瀏覽操作生成與所述用戶對(duì)應(yīng)的用戶信息;篩選模塊20根據(jù)獲取模塊10獲取的用戶信息進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶;調(diào)查模塊30向所述第一用戶發(fā)送調(diào)查請(qǐng)求,并接收所述第一用戶發(fā)送的調(diào)查反饋信息;分析模塊40將篩選模塊20確定的第一用戶的調(diào)查反饋信息和用戶信息進(jìn)行融合,獲得數(shù)據(jù)樣本庫,根據(jù)預(yù)設(shè)規(guī)則對(duì)所述數(shù)據(jù)樣本庫進(jìn)行分析處理得到目標(biāo)用戶的濃度,從而通過優(yōu)化數(shù)據(jù)樣本庫中各數(shù)據(jù)的來源的方式,以獲得更為準(zhǔn)確的目標(biāo)用戶的濃度,進(jìn)而為信息推送效果的評(píng)估提供良好的依據(jù)和支持。
進(jìn)一步地,在目標(biāo)用戶濃度的獲取裝置的上述技術(shù)方案的基礎(chǔ)上,為了使分析的準(zhǔn)確率更高,所述用戶信息包括行為標(biāo)簽和人口屬性標(biāo)簽;所述調(diào)查反饋信息包括行為反饋信息和人口屬性反饋信息。
相應(yīng)地,所述獲取模塊10,還用于根據(jù)所述網(wǎng)頁瀏覽操作生成所述用戶的行為標(biāo)簽;根據(jù)所述行為標(biāo)簽分析獲得所述用戶的人口屬性標(biāo)簽。
相應(yīng)地,所述調(diào)查模塊30,還用于向所述第一用戶發(fā)送調(diào)查請(qǐng)求,其中所述調(diào)查請(qǐng)求包括行為調(diào)查請(qǐng)求和人口屬性調(diào)查請(qǐng)求;接收所述第一用戶發(fā)送的行為反饋信息和人口屬性反饋信息。
相應(yīng)地,所述分析模塊40,還用于將所述第一用戶的行為標(biāo)簽與行為反饋信息進(jìn)行融合,獲得所述第一用戶的行為信息;將所述第一用戶的人口屬性標(biāo)簽和人口屬性反饋信息進(jìn)行融合,獲得所述第一用戶的人口屬性信息;根據(jù)每個(gè)所述第一用戶的行為信息和人口屬性信息,建立數(shù)據(jù)樣本庫。
需要說明的是,本實(shí)施方式提供的目標(biāo)用戶濃度的獲取裝置能夠?qū)崿F(xiàn)上述實(shí)施例二提供的目標(biāo)用戶濃度的獲取方法,在此不做贅述。
本實(shí)施方式提供的目標(biāo)用戶濃度的獲取裝置,通過用戶信息包括行為標(biāo)簽和人口屬性標(biāo)簽,調(diào)查反饋信息包括行為反饋信息和人口屬性反饋信息,并對(duì)整個(gè)分析過程進(jìn)行細(xì)化,以建立以標(biāo)簽信息,人口屬性信息以及第一用戶ID為維度的數(shù)據(jù)樣本庫,從而進(jìn)一步提高獲取的目標(biāo)用戶濃度的準(zhǔn)確性。
進(jìn)一步地,在目標(biāo)用戶濃度的獲取裝置的上述技術(shù)方案的基礎(chǔ)上,為了使分析的準(zhǔn)確率更高,所述篩選模塊20,還用于對(duì)所述用戶的每個(gè)行為標(biāo)簽進(jìn)行置信度測(cè)評(píng);若所述用戶的全部所述行為標(biāo)簽的置信度均值大于預(yù)設(shè)的置信度閾值,則確定所述用戶為第一用戶。
或者,
所述用戶信息中還包括:所述行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間。相應(yīng)地,所述篩選模塊20,還用于根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的時(shí)間,獲得所述用戶的每個(gè)行為標(biāo)簽的穩(wěn)定性參數(shù);根據(jù)所述用戶的每個(gè)行為標(biāo)簽的穩(wěn)定性參數(shù)確定所述第一用戶。
或者,
所述用戶信息中還包括:所述行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù)。相應(yīng)地,所述篩選模塊20,還用于根據(jù)所述用戶的每個(gè)行為標(biāo)簽對(duì)應(yīng)的行為發(fā)生的次數(shù),獲得所述用戶的每個(gè)行為標(biāo)簽的合理性參數(shù);根據(jù)所述用戶的每個(gè)行為標(biāo)簽的合理性參數(shù)確定所述第一用戶。
需要說明的是,本實(shí)施方式提供的目標(biāo)用戶濃度的獲取裝置能夠?qū)崿F(xiàn)上述實(shí)施例三提供的目標(biāo)用戶濃度的獲取方法,在此不做贅述。
本實(shí)施方式提供的目標(biāo)用戶濃度的獲取裝置,通過根據(jù)所述用戶的行為標(biāo)簽的置信度均值,穩(wěn)定性參數(shù)和合理性參數(shù)進(jìn)行篩選,確定符合預(yù)設(shè)條件的第一用戶,從而進(jìn)一步提高了目標(biāo)用戶濃度的準(zhǔn)確性。
上述目標(biāo)用戶濃度的獲取方法和裝置可以應(yīng)用于信息推送技術(shù)領(lǐng)域,例如,數(shù)據(jù)推送技術(shù)領(lǐng)域、廣告推送技術(shù)領(lǐng)域等。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng)的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:ROM、RAM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。