一種相似用戶識(shí)別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,特別是涉及一種相似用戶識(shí)別方法及裝置。
【背景技術(shù)】
[0002]隨著信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)能夠收集到越來(lái)越多的用戶信息,如何將這些信息采集、存儲(chǔ)并分析,進(jìn)而發(fā)現(xiàn)不同用戶之間的相似性正在成為研究熱點(diǎn)。然而,現(xiàn)有技術(shù)中對(duì)相似用戶識(shí)別的方法存在著計(jì)算復(fù)雜度高、效率低、準(zhǔn)確度低的缺點(diǎn)。
[0003]鑒于此,本發(fā)明提供了一種相似用戶識(shí)別方法及裝置,以使得對(duì)用戶進(jìn)行相似度分析的過(guò)程效率更高、識(shí)別準(zhǔn)確度更高。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供一種相似用戶識(shí)別方法及裝置,以解決現(xiàn)有技術(shù)中對(duì)相似用戶進(jìn)行識(shí)別的過(guò)程效率低以及準(zhǔn)確度低的問(wèn)題。
[0005]為解決上述技術(shù)問(wèn)題,本發(fā)明提供一種相似用戶識(shí)別方法,包括:
[0006]采集當(dāng)前用戶的用戶信息以及狀態(tài)信息;
[0007]通過(guò)所述用戶信息以及所述狀態(tài)信息,根據(jù)預(yù)先定義的特性因子以及權(quán)重?cái)?shù)值的對(duì)應(yīng)關(guān)系,分別確定所述當(dāng)前用戶的各特性因子對(duì)應(yīng)的當(dāng)前權(quán)重?cái)?shù)值,所述特性因子為滿足預(yù)設(shè)數(shù)據(jù)規(guī)則的標(biāo)簽信息;
[0008]將所述當(dāng)前用戶的各當(dāng)前權(quán)重?cái)?shù)值分別與預(yù)先設(shè)定的目標(biāo)用戶的各權(quán)重?cái)?shù)值進(jìn)行比較,確定所述當(dāng)前用戶與所述目標(biāo)用戶的相似度。
[0009]可選地,所述分別確定所述當(dāng)前用戶的各特性因子對(duì)應(yīng)的當(dāng)前權(quán)重?cái)?shù)值包括:
[0010]根據(jù)預(yù)設(shè)規(guī)則對(duì)預(yù)設(shè)周期內(nèi)的數(shù)值進(jìn)行篩選,選取的數(shù)值作為所述當(dāng)前用戶的各特性因子對(duì)應(yīng)的當(dāng)前權(quán)重?cái)?shù)值。
[0011]可選地,所述采集當(dāng)前用戶的用戶信息以及狀態(tài)信息包括:
[0012]通過(guò)數(shù)據(jù)適配器周期性采集可穿戴設(shè)備、機(jī)器爬蟲程序或人工手動(dòng)輸入的當(dāng)前用戶的用戶信息以及狀態(tài)信息。
[0013]可選地,在采集當(dāng)前用戶的用戶信息以及狀態(tài)信息之后還包括:
[0014]將所述用戶信息以及所述狀態(tài)信息轉(zhuǎn)換為預(yù)設(shè)格式的數(shù)據(jù);
[0015]將所述預(yù)設(shè)格式的數(shù)據(jù)緩存至第一消息隊(duì)列中,按照先進(jìn)先出的規(guī)則將緩存數(shù)據(jù)發(fā)送至指定的第一計(jì)算單元;
[0016]計(jì)算所述第一消息隊(duì)列的緩存數(shù)據(jù)量,動(dòng)態(tài)調(diào)整所述第一計(jì)算單元的數(shù)量;并根據(jù)所述第一計(jì)算單元反饋的計(jì)算結(jié)果,動(dòng)態(tài)調(diào)整從所述第一消息隊(duì)列中獲取數(shù)據(jù)的數(shù)量;
[0017]將所述預(yù)設(shè)格式的數(shù)據(jù)存儲(chǔ)于預(yù)先建立的數(shù)據(jù)庫(kù)中。
[0018]可選地,所述通過(guò)所述用戶信息以及所述狀態(tài)信息,根據(jù)預(yù)先定義的特性因子以及權(quán)重?cái)?shù)值的對(duì)應(yīng)關(guān)系,分別確定所述當(dāng)前用戶的各特性因子對(duì)應(yīng)的當(dāng)前權(quán)重?cái)?shù)值包括:
[0019]將所述用戶信息以及所述狀態(tài)信息緩存至第二消息隊(duì)列中,按照先進(jìn)先出的規(guī)則將緩存數(shù)據(jù)發(fā)送至指定的第二計(jì)算單元;
[0020]計(jì)算所述第二消息隊(duì)列中的緩存數(shù)據(jù)量,動(dòng)態(tài)調(diào)整所述第二計(jì)算單元的數(shù)量;并根據(jù)所述第二計(jì)算單元反饋的計(jì)算結(jié)果,動(dòng)態(tài)調(diào)整從所述第二消息隊(duì)列中獲取數(shù)據(jù)的數(shù)量;
[0021]根據(jù)預(yù)先定義的特性因子以及權(quán)重?cái)?shù)值的對(duì)應(yīng)關(guān)系,分別確定所述當(dāng)前用戶的各特性因子對(duì)應(yīng)的當(dāng)前權(quán)重?cái)?shù)值。
[0022]可選地,所述將所述當(dāng)前用戶的各當(dāng)前權(quán)重?cái)?shù)值分別與預(yù)先設(shè)定的目標(biāo)用戶的各權(quán)重?cái)?shù)值進(jìn)行比較,確定所述當(dāng)前用戶與所述目標(biāo)用戶的相似度包括:
[0023]將所述當(dāng)前用戶的各當(dāng)前權(quán)重?cái)?shù)值以及所述目標(biāo)用戶的各權(quán)重?cái)?shù)值緩存至第三消息隊(duì)列中,按照先進(jìn)先出的規(guī)則將緩存數(shù)據(jù)發(fā)送至指定的第三計(jì)算單元;
[0024]計(jì)算所述第三消息隊(duì)列中的緩存數(shù)據(jù)量,動(dòng)態(tài)調(diào)整所述第三計(jì)算單元的數(shù)量;并根據(jù)所述第三計(jì)算單元反饋的計(jì)算結(jié)果,動(dòng)態(tài)調(diào)整從所述第三消息隊(duì)列中獲取數(shù)據(jù)的數(shù)量;
[0025]將所述當(dāng)前用戶的各當(dāng)前權(quán)重?cái)?shù)值分別與預(yù)先設(shè)定的目標(biāo)用戶的各權(quán)重?cái)?shù)值進(jìn)行比較,確定所述當(dāng)前用戶與所述目標(biāo)用戶的相似度。
[0026]本發(fā)明還提供了一種相似用戶識(shí)別裝置,包括:
[0027]采集模塊,用于采集當(dāng)前用戶的用戶信息以及狀態(tài)信息;
[0028]確定模塊,用于通過(guò)所述用戶信息以及所述狀態(tài)信息,根據(jù)預(yù)先定義的特性因子以及權(quán)重?cái)?shù)值的對(duì)應(yīng)關(guān)系,分別確定所述當(dāng)前用戶的各特性因子對(duì)應(yīng)的當(dāng)前權(quán)重?cái)?shù)值,所述特性因子為滿足預(yù)設(shè)數(shù)據(jù)規(guī)則的標(biāo)簽信息;
[0029]識(shí)別模塊,用于將所述當(dāng)前用戶的各當(dāng)前權(quán)重?cái)?shù)值分別與預(yù)先設(shè)定的目標(biāo)用戶的各權(quán)重?cái)?shù)值進(jìn)行比較,確定所述當(dāng)前用戶與所述目標(biāo)用戶的相似度。
[0030]可選地,所述采集模塊還包括:
[0031]轉(zhuǎn)換單元,用于將所述用戶信息以及所述狀態(tài)信息轉(zhuǎn)換為預(yù)設(shè)格式的數(shù)據(jù);
[0032]第一消息隊(duì)列單元,用于將所述預(yù)設(shè)格式的數(shù)據(jù)緩存至第一消息隊(duì)列中,按照先進(jìn)先出的規(guī)則將緩存數(shù)據(jù)發(fā)送至指定的第一計(jì)算單元;
[0033]第一彈性計(jì)算單元,用于計(jì)算所述第一消息隊(duì)列的緩存數(shù)據(jù)量,動(dòng)態(tài)調(diào)整所述第一計(jì)算單元的數(shù)量;并根據(jù)所述第一計(jì)算單元反饋的計(jì)算結(jié)果,動(dòng)態(tài)調(diào)整從所述第一消息隊(duì)列中獲取數(shù)據(jù)的數(shù)量;
[0034]存儲(chǔ)單元,用于將所述預(yù)設(shè)格式的數(shù)據(jù)存儲(chǔ)于預(yù)先建立的數(shù)據(jù)庫(kù)中。
[0035]可選地,所述確定模塊包括:
[0036]第二消息隊(duì)列單元,用于將所述用戶信息以及所述狀態(tài)信息緩存至第二消息隊(duì)列中,按照先進(jìn)先出的規(guī)則將緩存數(shù)據(jù)發(fā)送至指定的第二計(jì)算單元;
[0037]第二彈性計(jì)算單元,用于計(jì)算所述第二消息隊(duì)列中的緩存數(shù)據(jù)量,動(dòng)態(tài)調(diào)整所述第二計(jì)算單元的數(shù)量;并根據(jù)所述第二計(jì)算單元反饋的計(jì)算結(jié)果,動(dòng)態(tài)調(diào)整從所述第二消息隊(duì)列中獲取數(shù)據(jù)的數(shù)量;
[0038]確定單元,用于根據(jù)預(yù)先定義的特性因子以及權(quán)重?cái)?shù)值的對(duì)應(yīng)關(guān)系,分別確定所述當(dāng)前用戶的各特性因子對(duì)應(yīng)的當(dāng)前權(quán)重?cái)?shù)值。
[0039]可選地,所述識(shí)別模塊包括:
[0040]第三消息隊(duì)列單元,用于將所述當(dāng)前用戶的各當(dāng)前權(quán)重?cái)?shù)值以及所述目標(biāo)用戶的各權(quán)重?cái)?shù)值緩存至第三消息隊(duì)列中,按照先進(jìn)先出的規(guī)則將緩存數(shù)據(jù)發(fā)送至指定的第三計(jì)算單元;
[0041]第三彈性計(jì)算單元,用于計(jì)算所述第三消息隊(duì)列中的緩存數(shù)據(jù)量,動(dòng)態(tài)調(diào)整所述第三計(jì)算單元的數(shù)量;并根據(jù)所述第三計(jì)算單元反饋的計(jì)算結(jié)果,動(dòng)態(tài)調(diào)整從所述第三消息隊(duì)列中獲取數(shù)據(jù)的數(shù)量;
[0042]識(shí)別單元,用于將所述當(dāng)前用戶的各當(dāng)前權(quán)重?cái)?shù)值分別與預(yù)先設(shè)定的目標(biāo)用戶的各權(quán)重?cái)?shù)值進(jìn)行比較,確定所述當(dāng)前用戶與所述目標(biāo)用戶的相似度。
[0043]本發(fā)明所提供的相似用戶識(shí)別方法及裝置,通過(guò)采集當(dāng)前用戶的用戶信息以及狀態(tài)信息;根據(jù)預(yù)先定義的特性因子以及權(quán)重?cái)?shù)值的對(duì)應(yīng)關(guān)系,分別確定當(dāng)前用戶的各特性因子對(duì)應(yīng)的當(dāng)前權(quán)重?cái)?shù)值;將當(dāng)前用戶的各當(dāng)前權(quán)重?cái)?shù)值分別與預(yù)先設(shè)定的目標(biāo)用戶的各權(quán)重?cái)?shù)值進(jìn)行比較,從而確定當(dāng)前用戶與目標(biāo)用戶的相似度??梢?jiàn),本發(fā)明提供了一種通過(guò)特性因子的權(quán)重關(guān)系對(duì)當(dāng)前用戶以及目標(biāo)用戶進(jìn)行比較,得到二者相似度的方法及裝置,與現(xiàn)有技術(shù)相比,本申請(qǐng)所提供的方法及裝置效率較高、識(shí)別準(zhǔn)確度較高。
【附圖說(shuō)明】
[0044]圖1為本發(fā)明所提供的相似用戶識(shí)別方法的一種【具體實(shí)施方式】的流程圖;
[0045]圖2為將采集到的數(shù)據(jù)存儲(chǔ)至數(shù)據(jù)庫(kù)的過(guò)程流程圖;
[0046]圖3為確定當(dāng)前用戶的各特性因子對(duì)應(yīng)的當(dāng)前權(quán)重?cái)?shù)值的過(guò)程流程圖;
[0047]圖4為確定當(dāng)前用戶與目標(biāo)用戶的相似度的過(guò)程流程圖;
[0048]圖5為消息隊(duì)列緩存數(shù)據(jù)的工作流程圖;
[0049]圖6為彈性計(jì)算單元的工作流程圖;
[0050]圖7為本發(fā)明實(shí)施例提供的相似用戶識(shí)別裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0051]為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明。顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0052]本發(fā)明所提供的相似用戶識(shí)別方法的一種【具體實(shí)施方式】的流程圖如圖1所示,該方法包括:
[0053]步驟S101:采集當(dāng)前用戶的用戶信息以及狀態(tài)信息;
[0054]具體地,可以通過(guò)數(shù)據(jù)適配器周期性采集可穿戴設(shè)備、機(jī)器爬蟲程序或人工手動(dòng)輸入的當(dāng)前用戶的用戶信息以及狀態(tài)信息。通過(guò)數(shù)據(jù)適配器進(jìn)行采集,可兼容關(guān)系數(shù)據(jù)庫(kù)、非關(guān)系數(shù)據(jù)庫(kù)或XML等各種數(shù)據(jù)源,能夠解決現(xiàn)有技術(shù)中對(duì)異構(gòu)數(shù)據(jù)處理能力差的問(wèn)題。
[0055]步驟S102:通過(guò)所述用戶信息以