本申請(qǐng)涉及大數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種用戶關(guān)聯(lián)處理方法和裝置。
背景技術(shù):
目前,為對(duì)可疑團(tuán)伙成員進(jìn)行圈定,很重要的一個(gè)手段是從可以團(tuán)伙的一個(gè)已知成員入手,通過(guò)該已知成員所使用的設(shè)備信息關(guān)聯(lián)出其他用戶,其中用戶與設(shè)備的關(guān)系強(qiáng)度決定了最終關(guān)聯(lián)哪些用戶以及用戶之間的關(guān)聯(lián)強(qiáng)度。
傳統(tǒng)的對(duì)可疑團(tuán)伙成員進(jìn)行圈定方法將各個(gè)用戶與設(shè)備的關(guān)系強(qiáng)度看成等值進(jìn)行計(jì)算,這樣最終可能會(huì)關(guān)聯(lián)出來(lái)一批非強(qiáng)關(guān)聯(lián)用戶,關(guān)聯(lián)結(jié)果膨脹嚴(yán)重,無(wú)法圈定可疑團(tuán)伙成員,需要借助其他手段進(jìn)行最終結(jié)果篩選。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)實(shí)施例提出了一種用戶關(guān)聯(lián)處理方法和裝置,用以優(yōu)化目前的用戶關(guān)聯(lián)處理。
在一個(gè)方面,本申請(qǐng)實(shí)施例提供了一種用戶關(guān)聯(lián)處理方法,包括:
確定特定用戶的關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合;
根據(jù)所述關(guān)聯(lián)設(shè)備集合中各設(shè)備的關(guān)聯(lián)用戶數(shù),確定所述各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重;
根據(jù)所述關(guān)聯(lián)用戶集合中各用戶訪問(wèn)所述各設(shè)備的信息,確定所述各用戶針對(duì)各設(shè)備的用戶訪問(wèn)權(quán)重;
根據(jù)所述各用戶針對(duì)各設(shè)備的用戶訪問(wèn)權(quán)重,以及所述各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重,確定所述各用戶與所述各設(shè)備的關(guān)聯(lián)強(qiáng)度。
在另一個(gè)方面,本申請(qǐng)實(shí)施例提供了一種用戶關(guān)聯(lián)處理裝置,包括:
關(guān)聯(lián)集合確定模塊,用于確定特定用戶的關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合;
設(shè)備權(quán)重確定模塊,用于根據(jù)所述關(guān)聯(lián)設(shè)備集合中各設(shè)備的關(guān)聯(lián)用戶數(shù),確定所述各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重;
用戶訪問(wèn)權(quán)重確定模塊,用于根據(jù)所述關(guān)聯(lián)用戶集合中各用戶訪問(wèn)所述各設(shè)備的信息,確定所述各用戶針對(duì)各設(shè)備的用戶訪問(wèn)權(quán)重;
關(guān)聯(lián)強(qiáng)度確定模塊,用于根據(jù)所述各用戶針對(duì)各設(shè)備的用戶訪問(wèn)權(quán)重,以及所述各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重,確定所述各用戶與所述各設(shè)備的關(guān)聯(lián)強(qiáng)度。
有益效果如下:
在本申請(qǐng)中,引入了設(shè)備關(guān)聯(lián)權(quán)重和用戶訪問(wèn)權(quán)重的概念,通過(guò)區(qū)分關(guān)聯(lián)設(shè)備集合中各個(gè)不同設(shè)備的關(guān)聯(lián)權(quán)重,以及根據(jù)關(guān)聯(lián)用戶集合中各個(gè)用戶對(duì)各個(gè)設(shè)備的訪問(wèn)程度的不同區(qū)分用戶訪問(wèn)權(quán)重,不再如現(xiàn)有技術(shù)中將各個(gè)用戶與設(shè)備的關(guān)系強(qiáng)度看成等值,可以清楚地計(jì)算出各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度,從而不僅給出關(guān)聯(lián)關(guān)系,并且給出了每個(gè)用戶與每個(gè)設(shè)備的關(guān)聯(lián)強(qiáng)度,從而增加了關(guān)聯(lián)結(jié)果中的信息量,使得關(guān)聯(lián)結(jié)果是可處理的。
進(jìn)一步地,在確定所述各用戶與所述各設(shè)備的關(guān)聯(lián)強(qiáng)度之后,可以確定所述關(guān)聯(lián)強(qiáng)度高于或不低于第一閾值的用戶為目的關(guān)聯(lián)用戶,從而去掉了大量的非強(qiáng)關(guān)聯(lián)用戶,增強(qiáng)了關(guān)聯(lián)處理結(jié)果的準(zhǔn)確性,避免了關(guān)聯(lián)結(jié)果過(guò)分膨脹的后果。
附圖說(shuō)明
下面將參照附圖描述本申請(qǐng)的具體實(shí)施例,其中:
圖1示出了本申請(qǐng)實(shí)施例的用戶關(guān)聯(lián)處理流程圖;
圖2示出了本申請(qǐng)實(shí)施例一中對(duì)數(shù)據(jù)倉(cāng)庫(kù)中保存的用戶訪問(wèn)設(shè)備的記錄數(shù) 據(jù)的處理流程圖;
圖3示出了本申請(qǐng)實(shí)施例一中關(guān)聯(lián)用戶集合和關(guān)聯(lián)設(shè)備集合的二部圖;
圖4示出了本申請(qǐng)實(shí)施例二中如何進(jìn)行關(guān)聯(lián)強(qiáng)度的計(jì)算的一個(gè)實(shí)例的流程圖;
圖5示出了本申請(qǐng)實(shí)施例中的用戶關(guān)聯(lián)處理裝置的結(jié)構(gòu)示意圖;
圖6示出了本申請(qǐng)中一個(gè)示例的用戶關(guān)聯(lián)處理裝置的結(jié)構(gòu)示意圖;
圖7示出了本申請(qǐng)中一個(gè)示例的用戶關(guān)聯(lián)處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本申請(qǐng)的技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖對(duì)本申請(qǐng)的示例性實(shí)施例進(jìn)行進(jìn)一步詳細(xì)的說(shuō)明,顯然,所描述的實(shí)施例僅是本申請(qǐng)的一部分實(shí)施例,而不是所有實(shí)施例的窮舉。并且在不沖突的情況下,本說(shuō)明中的實(shí)施例及實(shí)施例中的特征可以互相結(jié)合。
發(fā)明人在發(fā)明過(guò)程中注意到:傳統(tǒng)的對(duì)可疑團(tuán)伙成員進(jìn)行圈定方法將各個(gè)用戶與設(shè)備的關(guān)系強(qiáng)度看成等值進(jìn)行計(jì)算,這樣最終可能會(huì)關(guān)聯(lián)出來(lái)一批非強(qiáng)關(guān)聯(lián)用戶,關(guān)聯(lián)結(jié)果膨脹嚴(yán)重,無(wú)法圈定可疑團(tuán)伙成員,且這些關(guān)聯(lián)用戶與可以團(tuán)伙的關(guān)聯(lián)強(qiáng)度并未標(biāo)識(shí),為后續(xù)處理帶來(lái)了很大的困難,甚至在數(shù)據(jù)極度膨脹的情況下,用傳統(tǒng)方法得到的關(guān)聯(lián)處理結(jié)果是毫無(wú)意義的。
針對(duì)上述不足,本申請(qǐng)實(shí)施例提出了一種用戶關(guān)聯(lián)處理方法和裝置,下面進(jìn)行說(shuō)明。
圖1示出了本申請(qǐng)實(shí)施例的用戶關(guān)聯(lián)處理流程圖,如圖所示,包括:
步驟101,確定特定用戶的關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合,以及關(guān)聯(lián)設(shè)備集合中各設(shè)備與關(guān)聯(lián)用戶集合中各用戶間的關(guān)聯(lián)關(guān)系;
步驟102,根據(jù)關(guān)聯(lián)設(shè)備集合中各設(shè)備的關(guān)聯(lián)用戶數(shù),確定各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重;
步驟103,根據(jù)關(guān)聯(lián)用戶集合中各用戶訪問(wèn)各設(shè)備的信息,確定各用戶針 對(duì)各設(shè)備的用戶訪問(wèn)權(quán)重;
步驟102和步驟103沒(méi)有一定的先后順序。
步驟104,根據(jù)各用戶針對(duì)各設(shè)備的用戶訪問(wèn)權(quán)重,以及各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重,確定各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度。
有益效果:
在本申請(qǐng)實(shí)施例通過(guò)區(qū)分關(guān)聯(lián)設(shè)備集合中各個(gè)不同設(shè)備的關(guān)聯(lián)權(quán)重,以及根據(jù)關(guān)聯(lián)用戶集合中各個(gè)用戶對(duì)各個(gè)設(shè)備的訪問(wèn)程度的不同區(qū)分用戶訪問(wèn)權(quán)重,不再如現(xiàn)有技術(shù)中將各個(gè)用戶與設(shè)備的關(guān)系強(qiáng)度看成等值,可以清楚地計(jì)算出各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度,從而不僅給出關(guān)聯(lián)關(guān)系,并且給出了每個(gè)用戶與每個(gè)設(shè)備的關(guān)聯(lián)強(qiáng)度,從而增加了關(guān)聯(lián)結(jié)果中的信息量,使得關(guān)聯(lián)結(jié)果是可處理的。
可以看出,雖然發(fā)明人是從對(duì)可疑團(tuán)伙成員進(jìn)行圈定的方案出發(fā),發(fā)現(xiàn)了現(xiàn)有的用戶間關(guān)聯(lián)關(guān)系計(jì)算中存在的問(wèn)題,但從發(fā)明人得出的解決方案來(lái)看,并不局限在對(duì)可疑團(tuán)伙成員進(jìn)行圈定的應(yīng)用場(chǎng)景,只要是對(duì)特定用戶通過(guò)使用的設(shè)備的關(guān)聯(lián)來(lái)確定其與其他用戶的關(guān)聯(lián)關(guān)系,均可以采用本申請(qǐng)實(shí)施例的方案,該特定用戶可以是可疑團(tuán)伙的一個(gè)或者多個(gè)已知成員,也可以是其他需要進(jìn)行圈子挖掘的已知用戶。
進(jìn)一步地,為了去掉大量的非強(qiáng)關(guān)聯(lián)用戶,增強(qiáng)關(guān)聯(lián)處理結(jié)果的準(zhǔn)確性,避免關(guān)聯(lián)結(jié)果過(guò)分膨脹的后果,還可以按以下方式實(shí)施。
實(shí)施中,確定所述各用戶與所述各設(shè)備的關(guān)聯(lián)強(qiáng)度之后,確定所述關(guān)聯(lián)強(qiáng)度高于或不低于第一閾值的用戶為目的關(guān)聯(lián)用戶。
有益效果:通過(guò)確定關(guān)聯(lián)強(qiáng)度高于或不低于第一閾值的用戶為目的關(guān)聯(lián)用戶,從而去掉了大量的非強(qiáng)關(guān)聯(lián)用戶,增強(qiáng)了關(guān)聯(lián)處理結(jié)果的準(zhǔn)確性,避免了關(guān)聯(lián)結(jié)果過(guò)分膨脹的后果。
進(jìn)一步地,在具體實(shí)現(xiàn)中,確定與特定用戶關(guān)聯(lián)的設(shè)備集合和用戶集合,以及所述設(shè)備集合中各設(shè)備與所述用戶集合中各用戶間的關(guān)聯(lián)關(guān)系的方法可 以包括:
根據(jù)用戶訪問(wèn)應(yīng)用的日志信息統(tǒng)計(jì)用戶訪問(wèn)設(shè)備的痕跡,導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù),保存用戶訪問(wèn)設(shè)備的記錄數(shù)據(jù);
在所述記錄數(shù)據(jù)中,查找出與所述特定用戶關(guān)聯(lián)的設(shè)備集合;
遍歷所述設(shè)備集合,查找出所述設(shè)備集合關(guān)聯(lián)的用戶集合;
循環(huán)查找,直到所述用戶集合和/或所述設(shè)備集合不再增長(zhǎng)或循環(huán)查找的迭代次數(shù)達(dá)到第二閾值,以當(dāng)前的設(shè)備集合作為所述特定用戶的關(guān)聯(lián)設(shè)備集合,以當(dāng)前的用戶集合作為所述特定用戶的關(guān)聯(lián)用戶集合,構(gòu)建關(guān)聯(lián)用戶集合和關(guān)聯(lián)設(shè)備集合的二部圖,二部圖是圖論中的一種特殊模型,模型中的每條邊所關(guān)聯(lián)的兩個(gè)頂點(diǎn)分別屬于兩個(gè)不相交的頂點(diǎn)集,用戶集合和設(shè)備集合的二部圖可以反映設(shè)備集合中各設(shè)備與用戶集合中各用戶間的關(guān)聯(lián)關(guān)系。
通過(guò)上述方法,可以比較方便且全面地確定特定用戶的關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合,在本申請(qǐng)中,不限定確定特定用戶的關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合的具體方案,本申請(qǐng)的改進(jìn)主要在于對(duì)特定用戶的關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合的處理,以明確各用戶和特定用戶之間的關(guān)聯(lián)關(guān)系。
進(jìn)一步地,根據(jù)所述關(guān)聯(lián)用戶集合中各用戶訪問(wèn)所述各設(shè)備的信息,確定所述各用戶針對(duì)各設(shè)備的用戶訪問(wèn)權(quán)重,包括如下任意一種或其組合:
根據(jù)所述關(guān)聯(lián)用戶集合中各用戶訪問(wèn)所述各設(shè)備的次數(shù)信息,確定所述各用戶針對(duì)各設(shè)備的訪問(wèn)次數(shù)權(quán)重;
根據(jù)所述關(guān)聯(lián)用戶集合中各用戶訪問(wèn)所述各設(shè)備的時(shí)間信息,確定所述各用戶針對(duì)各設(shè)備的和訪問(wèn)時(shí)間權(quán)重。
在具體實(shí)現(xiàn)時(shí),用戶訪問(wèn)權(quán)重可以是單獨(dú)的訪問(wèn)次數(shù)權(quán)重、單獨(dú)的訪問(wèn)時(shí)間權(quán)重,或者二者的結(jié)合,這可以根據(jù)實(shí)際應(yīng)用本方案是的具體情況來(lái)進(jìn)行選擇。
在計(jì)算訪問(wèn)時(shí)間權(quán)重時(shí),可以采用如下任意一種:
根據(jù)各用戶最后一次訪問(wèn)各設(shè)備的時(shí)間分別計(jì)算得到的第一時(shí)間權(quán)重;
根據(jù)各用戶訪問(wèn)各設(shè)備的最長(zhǎng)一次時(shí)間分別計(jì)算得到的第二時(shí)間權(quán)重;
根據(jù)所述第一時(shí)間權(quán)重和第二時(shí)間權(quán)重計(jì)算得到的第三時(shí)間權(quán)重。
為了便于本申請(qǐng)的實(shí)施,下面以實(shí)例進(jìn)行說(shuō)明。
實(shí)施例一:
本實(shí)施例給出確定特定用戶的關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合的方法,根據(jù)用戶訪問(wèn)應(yīng)用的日志信息統(tǒng)計(jì)用戶訪問(wèn)設(shè)備的痕跡,導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)倉(cāng)庫(kù)是企業(yè)所有級(jí)別的決策制定過(guò)程提供支持的所有類型數(shù)據(jù)的戰(zhàn)略集合,在本實(shí)施例中,數(shù)據(jù)倉(cāng)庫(kù)用于保存用戶訪問(wèn)設(shè)備的記錄數(shù)據(jù),對(duì)數(shù)據(jù)倉(cāng)庫(kù)中保存的用戶訪問(wèn)設(shè)備的記錄數(shù)據(jù)的處理可以如圖2所示,包括如下步驟:
步驟201,查找與特定用戶關(guān)聯(lián)的設(shè)備,更新設(shè)備集合和用戶集合的二部圖;
步驟202,遍歷當(dāng)前設(shè)備集合,查找出與該設(shè)備集合關(guān)聯(lián)的用戶,更新設(shè)備集合和用戶集合的二部圖;
步驟203,遍歷當(dāng)前用戶集合,查找與當(dāng)前用戶集合中用戶關(guān)聯(lián)的設(shè)備;
步驟204,判斷當(dāng)前查找出的設(shè)備與當(dāng)前設(shè)備集合中的設(shè)備相比是否有增加,若是,進(jìn)行步驟205,否則,結(jié)束。
步驟205,更新設(shè)備集合和用戶集合的二部圖;
步驟206,判斷遍歷設(shè)備集合的次數(shù)是否達(dá)到第二閾值,若是,結(jié)束,否則,返回步驟202。
在具體實(shí)現(xiàn)時(shí),可以不在每次找出新的設(shè)備或用戶時(shí)都更新設(shè)備集合和用戶集合的二部圖,可以最后再根據(jù)查找結(jié)果和過(guò)程記錄構(gòu)建設(shè)備集合和用戶集合的二部圖。
在本實(shí)施例中,以設(shè)備集合不再增長(zhǎng),以及循環(huán)查找設(shè)備集合的迭代次數(shù)達(dá)到第二閾值為例進(jìn)行說(shuō)明,在實(shí)際操作中,可以以用戶集合不再增加,或者用戶集合和設(shè)備集合均不增長(zhǎng)作為判斷依據(jù),而迭代次數(shù),同樣可以以循環(huán)查找用戶集合的迭代次數(shù),或循環(huán)查找用戶集合和設(shè)備集合的迭代次數(shù)作為判斷 依據(jù)。
根據(jù)上述操作,能夠構(gòu)建出特定用戶的關(guān)聯(lián)用戶集合和關(guān)聯(lián)設(shè)備集合的二部圖,如圖3所示,關(guān)聯(lián)用戶集合中包括用戶U1至Ui,關(guān)聯(lián)設(shè)備集合中包括設(shè)備D1至Dj,其中,用戶U1與設(shè)備D1和Dj關(guān)聯(lián),用戶U2與設(shè)備Dj關(guān)聯(lián),用戶Ui與設(shè)備D2關(guān)聯(lián),可見,關(guān)聯(lián)用戶集合和關(guān)聯(lián)設(shè)備集合的二部圖可以顯示出關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合,以及關(guān)聯(lián)設(shè)備集合中各設(shè)備與關(guān)聯(lián)用戶集合中各用戶間的關(guān)聯(lián)關(guān)系。
實(shí)施例二:
實(shí)施例二給出了在確定特定用戶的關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合之后,如何進(jìn)行關(guān)聯(lián)強(qiáng)度的計(jì)算的一個(gè)實(shí)例,具體可以如圖4所示,包括如下步驟:
步驟301,根據(jù)關(guān)聯(lián)設(shè)備集合中各設(shè)備的關(guān)聯(lián)用戶數(shù),確定各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重;
由于設(shè)備關(guān)聯(lián)權(quán)重與設(shè)備的最大墑成反向關(guān)系,因此根據(jù)信息墑理論,首先歸一化設(shè)備的度再針對(duì)每個(gè)設(shè)備點(diǎn)通過(guò)公式(1)或公式(2)進(jìn)行計(jì)算,得出每個(gè)設(shè)備點(diǎn)的設(shè)備關(guān)聯(lián)權(quán)重。信息墑是信息論中度量信息量的一個(gè)概念,一個(gè)系統(tǒng)越有序,信息墑就越低。
h(dj)=-log10k(dj)* 公式(1)
其中,k(dj)*為對(duì)用戶集合和設(shè)備集合的二部圖中的設(shè)備j的度進(jìn)行歸一化得到的歸一化值,k(dj)*為0到1之間的值,度是圖中某一點(diǎn)關(guān)聯(lián)的邊的個(gè)數(shù),在用戶集合和設(shè)備集合的二部圖中,設(shè)備j的度即與其關(guān)聯(lián)的用戶的個(gè)數(shù)。
可以理解,若一臺(tái)設(shè)備只對(duì)應(yīng)一個(gè)用戶,則該設(shè)備與該用戶關(guān)系緊密,關(guān)聯(lián)權(quán)重較高,若一臺(tái)設(shè)備是公共設(shè)備,對(duì)應(yīng)很多用戶,則該設(shè)備與該用戶關(guān)系不夠緊密,關(guān)聯(lián)權(quán)重應(yīng)該較低,否則會(huì)關(guān)聯(lián)進(jìn)來(lái)許多與特定用戶并沒(méi)有很大關(guān)聯(lián)性的用戶。
步驟302,根據(jù)關(guān)聯(lián)用戶集合中各用戶訪問(wèn)各設(shè)備的次數(shù)信息,確定各用戶針對(duì)各設(shè)備的訪問(wèn)次數(shù)權(quán)重;
本實(shí)施例中,訪問(wèn)次數(shù)權(quán)重根據(jù)如下公式進(jìn)行計(jì)算:
其中,d(ui,dj)代表用戶i訪問(wèn)設(shè)備j的次數(shù)。
步驟303,根據(jù)關(guān)聯(lián)用戶集合中各用戶訪問(wèn)各設(shè)備的時(shí)間信息,確定各用戶針對(duì)各設(shè)備的訪問(wèn)時(shí)間權(quán)重;
在具體實(shí)現(xiàn)時(shí),計(jì)算訪問(wèn)時(shí)間權(quán)重可以采用如下任意一種:
根據(jù)各用戶最后一次訪問(wèn)各設(shè)備的時(shí)間分別計(jì)算得到的第一時(shí)間權(quán)重;
根據(jù)各用戶訪問(wèn)各設(shè)備的最長(zhǎng)一次時(shí)間分別計(jì)算得到的第二時(shí)間權(quán)重;
根據(jù)第一時(shí)間權(quán)重和第二時(shí)間權(quán)重計(jì)算得到的第三時(shí)間權(quán)重。
本實(shí)施例采用了根據(jù)第一時(shí)間權(quán)重和第二時(shí)間權(quán)重計(jì)算得到的第三時(shí)間權(quán)重,在具體實(shí)現(xiàn)時(shí),可以單獨(dú)采用第一時(shí)間權(quán)重或第二時(shí)間權(quán)重,而單獨(dú)采用時(shí),第一時(shí)間權(quán)重或第二時(shí)間權(quán)重的計(jì)算方法可以參考本實(shí)施例中的計(jì)算方式。
根據(jù)如下公式計(jì)算第一時(shí)間權(quán)重:
其中,T(dj)為設(shè)備j最近一次被訪問(wèn)的時(shí)間,T(ui,dj)為用戶i最近一次訪問(wèn)設(shè)備j的時(shí)間。
根據(jù)如下公式計(jì)算第二時(shí)間權(quán)重:
其中,t(ui,dj)為用戶i訪問(wèn)設(shè)備j的最長(zhǎng)一次時(shí)間,maxk∈[1,m]t(uk,dj) 為設(shè)備j被訪問(wèn)的最長(zhǎng)一次時(shí)間。
根據(jù)如下公式計(jì)算第三時(shí)間權(quán)重:
g(ui,dj)=p(ui,dj)×q(ui,dj) 公式(6)
步驟304,根據(jù)各用戶針對(duì)各設(shè)備的訪問(wèn)次數(shù)權(quán)重、訪問(wèn)時(shí)間權(quán)重,以及各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重,確定各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度。
根據(jù)如下公式計(jì)算各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度:
w(ui,dj)=f(ui,dj)×g(ui,dj)×h(dj) 公式(7)
在計(jì)算得到各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度后,可以將每個(gè)用戶與每個(gè)設(shè)備的關(guān)聯(lián)強(qiáng)度提供給管理人員,由于增加了關(guān)聯(lián)強(qiáng)度的信息,即使同樣關(guān)聯(lián)出大量的非強(qiáng)關(guān)聯(lián)用戶,這個(gè)關(guān)聯(lián)結(jié)果也不像現(xiàn)有技術(shù)中那樣無(wú)法處理,例如,管理人員可以根據(jù)關(guān)聯(lián)強(qiáng)度進(jìn)行排序,優(yōu)先處理關(guān)聯(lián)強(qiáng)度較高的用戶。在團(tuán)伙挖掘的場(chǎng)景下,可以根據(jù)關(guān)聯(lián)強(qiáng)度對(duì)可疑團(tuán)伙成員進(jìn)行圈定。
進(jìn)一步地,為了去掉大量的非強(qiáng)關(guān)聯(lián)用戶,增強(qiáng)關(guān)聯(lián)處理結(jié)果的準(zhǔn)確性,避免關(guān)聯(lián)結(jié)果過(guò)分膨脹的后果,使得推送給管理人員的已經(jīng)是比較準(zhǔn)確的關(guān)聯(lián)結(jié)果,還可以在確定各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度之后,確定關(guān)聯(lián)強(qiáng)度高于或不低于第一閾值的用戶為目的關(guān)聯(lián)用戶。例如,設(shè)定第一閾值為60%,那么,在推送關(guān)聯(lián)結(jié)果給管理人員之前,還可以根據(jù)關(guān)聯(lián)強(qiáng)度進(jìn)行一次篩選,將關(guān)聯(lián)強(qiáng)度高于或不低于60%的用戶篩選出來(lái),提供給管理人員,從而避免了關(guān)聯(lián)結(jié)果過(guò)分膨脹的后果,使得管理人員更容易處理數(shù)據(jù)。在團(tuán)伙挖掘的場(chǎng)景下,可以直接將目的關(guān)聯(lián)用戶作為可疑團(tuán)伙成員進(jìn)行圈定。第一閾值可以根據(jù)具體需要進(jìn)行確定,例如在具體場(chǎng)景下的經(jīng)驗(yàn)值,或者本次關(guān)聯(lián)處理得到的關(guān)聯(lián)強(qiáng)度平均值等。
基于同一發(fā)明構(gòu)思,本申請(qǐng)實(shí)施例中還提供了一種用戶關(guān)聯(lián)處理裝置,由于這些設(shè)備解決問(wèn)題的原理與一種用戶關(guān)聯(lián)處理方法相似,因此這些設(shè)備的實(shí) 施可以參見方法的實(shí)施,重復(fù)之處不再贅述。
如圖5所示,本申請(qǐng)實(shí)施例中的裝置可以包括:
關(guān)聯(lián)集合確定模塊501,用于確定特定用戶的關(guān)聯(lián)設(shè)備集合和關(guān)聯(lián)用戶集合,以及關(guān)聯(lián)設(shè)備集合中各設(shè)備與關(guān)聯(lián)用戶集合中各用戶間的關(guān)聯(lián)關(guān)系;
設(shè)備權(quán)重確定模塊502,用于根據(jù)關(guān)聯(lián)設(shè)備集合中各設(shè)備的關(guān)聯(lián)用戶數(shù),確定各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重;
用戶訪問(wèn)權(quán)重確定模塊503,用于根據(jù)關(guān)聯(lián)用戶集合中各用戶訪問(wèn)各設(shè)備的信息,確定各用戶針對(duì)各設(shè)備的用戶訪問(wèn)權(quán)重;
關(guān)聯(lián)強(qiáng)度確定模塊504,用于根據(jù)各用戶針對(duì)各設(shè)備的用戶訪問(wèn)權(quán)重,以及各設(shè)備的設(shè)備關(guān)聯(lián)權(quán)重,確定各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度。
進(jìn)一步地,該裝置還可以如圖6所示,包括關(guān)聯(lián)用戶確定模塊601,用于在關(guān)聯(lián)強(qiáng)度確定模塊確定各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度之后,確定關(guān)聯(lián)強(qiáng)度高于或不低于第一閾值的用戶為目的關(guān)聯(lián)用戶。
進(jìn)一步地,該裝置還可以如圖7所示,包括用戶信息處理模塊701和數(shù)據(jù)倉(cāng)庫(kù)702,其中:
用戶信息處理模塊701,用于根據(jù)用戶訪問(wèn)應(yīng)用的日志信息統(tǒng)計(jì)用戶訪問(wèn)設(shè)備的痕跡,導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)702;
數(shù)據(jù)倉(cāng)庫(kù)702,用于保存用戶訪問(wèn)設(shè)備的記錄數(shù)據(jù);
關(guān)聯(lián)集合確定模塊501,在記錄數(shù)據(jù)中,查找出與特定用戶關(guān)聯(lián)的設(shè)備集合;遍歷設(shè)備集合,查找出設(shè)備集合關(guān)聯(lián)的用戶集合;循環(huán)查找,直到用戶集合和/或設(shè)備集合不再增長(zhǎng)或循環(huán)查找的迭代次數(shù)達(dá)到第二閾值,以當(dāng)前的設(shè)備集合作為特定用戶的關(guān)聯(lián)設(shè)備集合,以當(dāng)前的用戶集合作為特定用戶的關(guān)聯(lián)用戶集合,構(gòu)建關(guān)聯(lián)用戶集合和關(guān)聯(lián)設(shè)備集合的二部圖。
在具體實(shí)現(xiàn)時(shí),圖7中可以不包括用戶確定模塊601,即關(guān)聯(lián)強(qiáng)度確定模塊504確定各用戶與各設(shè)備的關(guān)聯(lián)強(qiáng)度后即可輸出關(guān)聯(lián)處理結(jié)果。
為了描述的方便,以上所述裝置的各部分以功能分為各種模塊或單元分別 描述。當(dāng)然,在實(shí)施本申請(qǐng)時(shí)可以把各模塊或單元的功能在同一個(gè)或多個(gè)軟件或硬件中實(shí)現(xiàn)。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
本申請(qǐng)是參照根據(jù)本申請(qǐng)實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
盡管已描述了本申請(qǐng)的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本申請(qǐng)范圍的所有變更和修改。