惡意用戶識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別是涉及一種惡意用戶識別方法及裝置。
【背景技術(shù)】
[0002]傳統(tǒng)的社交網(wǎng)絡(luò)應(yīng)用中,某些惡意用戶通常在同一 IP下使用多個(gè)社交網(wǎng)絡(luò)賬號群發(fā)廣告、色情、暴力或者具有政治目的的垃圾信息。傳統(tǒng)技術(shù)中則根據(jù)用戶提交服務(wù)器的消息內(nèi)容來識別惡意用戶,然而提交垃圾信息的惡意用戶通常針對性地對垃圾信息中的信息內(nèi)容添加干擾信息(例如,在敏感詞的字符之間加入符號等),使得惡意用戶的識別不準(zhǔn)確。
【發(fā)明內(nèi)容】
[0003]基于此,有必要提供一種能提高識別的準(zhǔn)確率的惡意用戶識別方法。
[0004]一種惡意用戶識別方法,包括:
[0005]獲取全局用戶的用戶標(biāo)識,計(jì)算其對應(yīng)的信用度,根據(jù)所述全局用戶的用戶標(biāo)識對應(yīng)的信用度生成全局用戶信用分布;
[0006]獲取預(yù)設(shè)的查詢條件,根據(jù)所述查詢條件在所述全局用戶的用戶標(biāo)識中篩選得到條件用戶的用戶標(biāo)識;
[0007]獲取所述條件用戶的用戶標(biāo)識對應(yīng)的信用度,根據(jù)所述條件用戶的用戶標(biāo)識對應(yīng)的信用度生成條件用戶信用分布;
[0008]獲取預(yù)設(shè)的信用度閾值,在所述全局用戶信用分布和條件用戶信用分布中分別獲取其信用度大于/小于所述信用度閾值的全局優(yōu)質(zhì)/惡意用戶數(shù)以及條件優(yōu)質(zhì)/惡意用戶數(shù);
[0009]獲取預(yù)設(shè)的優(yōu)質(zhì)/惡意用戶數(shù)閾值,計(jì)算所述全局優(yōu)質(zhì)/惡意用戶數(shù)與所述條件優(yōu)質(zhì)/惡意用戶數(shù)的差值,根據(jù)所述差值和所述優(yōu)質(zhì)/惡意用戶數(shù)閾值判斷所述查詢條件是否對應(yīng)惡意用戶。
[0010]此外,還有必要提供一種能提高識別的準(zhǔn)確率的惡意用戶識別裝置。
[0011]一種惡意用戶識別裝置,包括:
[0012]全局分布生成模塊,用于獲取全局用戶的用戶標(biāo)識,計(jì)算其對應(yīng)的信用度,根據(jù)所述全局用戶的用戶標(biāo)識對應(yīng)的信用度生成全局用戶信用分布;
[0013]條件用戶查找模塊,用于獲取預(yù)設(shè)的查詢條件,根據(jù)所述查詢條件在所述全局用戶的用戶標(biāo)識中篩選得到條件用戶的用戶標(biāo)識;
[0014]條件分布生成模塊,用于獲取所述條件用戶的用戶標(biāo)識對應(yīng)的信用度,根據(jù)所述條件用戶的用戶標(biāo)識對應(yīng)的信用度生成條件用戶信用分布;
[0015]用戶篩選模塊,用于獲取預(yù)設(shè)的信用度閾值,在所述全局用戶信用分布和條件用戶信用分布中分別獲取大于/小于所述信用度閾值的全局優(yōu)質(zhì)/惡意用戶數(shù)以及條件優(yōu)質(zhì)/惡意用戶數(shù);
[0016]惡意用戶識別模塊,用于獲取預(yù)設(shè)的優(yōu)質(zhì)/惡意用戶數(shù)閾值,計(jì)算所述全局優(yōu)質(zhì)/惡意用戶數(shù)與所述條件優(yōu)質(zhì)/惡意用戶數(shù)的差值,根據(jù)所述差值和所述優(yōu)質(zhì)/惡意用戶數(shù)閾值判斷所述查詢條件是否對應(yīng)惡意用戶。
[0017]上述惡意用戶識別方法,根據(jù)查詢條件對應(yīng)的條件用戶的條件用戶信用度分布與社交網(wǎng)絡(luò)應(yīng)用上注冊的全局用戶的全局用戶信用度分布的差異性來判定條件用戶是否對應(yīng)惡意用戶,與傳統(tǒng)技術(shù)相比,即使某些添加了干擾的垃圾信息漏過檢查,仍然能通過惡意用戶與非惡意用戶提交的消息在整體上的差異性將其識別出來,從而識別的準(zhǔn)確率較高。
【附圖說明】
[0018]圖1為一個(gè)實(shí)施例中惡意用戶識別方法的流程圖;
[0019]圖2為一個(gè)實(shí)施例中全局用戶信用分布示意圖;
[0020]圖3為一個(gè)實(shí)施例中條件用戶信用分布示意圖;
[0021]圖4為一個(gè)實(shí)施例中使用信用等級的全局用戶信用分布示意圖;
[0022]圖5為一個(gè)實(shí)施例中使用信用等級的條件用戶信用分布示意圖;
[0023]圖6為一個(gè)實(shí)施例中惡意用戶識別裝置的結(jié)構(gòu)示意圖;
[0024]圖7為一個(gè)實(shí)施例中惡意用戶識別裝置的硬件環(huán)境圖。
【具體實(shí)施方式】
[0025]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0026]除非上下文另有特定清楚的描述,本發(fā)明中的元件和組件,數(shù)量既可以單個(gè)的形式存在,也可以多個(gè)的形式存在,本發(fā)明并不對此進(jìn)行限定。本發(fā)明中的步驟雖然用標(biāo)號進(jìn)行了排列,但并不用于限定步驟的先后次序,除非明確說明了步驟的次序或者某步驟的執(zhí)行需要其他步驟作為基礎(chǔ),否則步驟的相對次序是可以調(diào)整的??梢岳斫猓疚闹兴褂玫男g(shù)語“和/或”涉及且涵蓋相關(guān)聯(lián)的所列項(xiàng)目中的一者或一者以上的任何和所有可能的組口 ο
[0027]如圖1所示,在一個(gè)實(shí)施例中,一種惡意用戶識別方法,該方法的執(zhí)行依賴于計(jì)算機(jī)程序,可運(yùn)行于基于馮洛伊曼體系的計(jì)算機(jī)系統(tǒng)上,該方法包括:
[0028]步驟S102,獲取全局用戶的用戶標(biāo)識,計(jì)算其對應(yīng)的信用度,根據(jù)所述全局用戶的用戶標(biāo)識對應(yīng)的信用度生成全局用戶信用分布。
[0029]全局用戶即為在社交網(wǎng)絡(luò)應(yīng)用中注冊的用戶。用戶在社交網(wǎng)絡(luò)應(yīng)用中注冊后,社交網(wǎng)絡(luò)應(yīng)用中通常使用用戶數(shù)據(jù)庫存儲(chǔ)已注冊用戶的用戶標(biāo)識及相應(yīng)注冊信息、用戶資料??稍谟脩魯?shù)據(jù)庫中查找到全局用戶的用戶標(biāo)識。
[0030]用戶標(biāo)識對應(yīng)的信用度即為該用戶標(biāo)識對應(yīng)的社交網(wǎng)絡(luò)賬號提交給社交網(wǎng)絡(luò)服務(wù)器的消息(UGC,User Generated Content,用戶生成內(nèi)容)的信用程度。若某個(gè)用戶經(jīng)常使用其社交網(wǎng)絡(luò)賬號在社交網(wǎng)絡(luò)應(yīng)用上提交具有色情、暴力、廣告或政治目的的垃圾信息,則該用戶的信用度則較低。
[0031]惡意用戶即為信用度較低的用戶,惡意用戶通常將垃圾信息頻繁傳播給其他用戶,從而影響其他用戶的正常瀏覽。與惡意用戶相對應(yīng)的即為優(yōu)質(zhì)用戶,優(yōu)質(zhì)用戶信用度較高,為正常使用社交網(wǎng)絡(luò),較少違規(guī)發(fā)帖、較少重復(fù)發(fā)帖且發(fā)帖內(nèi)容合乎規(guī)范的用戶。
[0032]在本實(shí)施例中,計(jì)算全局用戶的用戶標(biāo)識對應(yīng)的信用度的步驟可具體為:獲取全局用戶的用戶標(biāo)識對應(yīng)的消息提交次數(shù)、在線時(shí)長和垃圾消息提交次數(shù);通過將消息提交次數(shù)、在線時(shí)長和垃圾消息提交次數(shù)分別乘以相應(yīng)的預(yù)設(shè)的權(quán)重系數(shù)后疊加得到全局用戶的用戶標(biāo)識對應(yīng)的信用度。
[0033]例如,若某用戶共向社交網(wǎng)絡(luò)應(yīng)用提交消息NI次,其中提交垃圾消息的次數(shù)為N2次,且在線的天數(shù)為D,則可根據(jù)公式:
[0034]C=klXNl+k2XD-k3XN2
[0035]其中,C即為信用度,kl、k2和k3分別為相應(yīng)的權(quán)重系數(shù)。
[0036]在優(yōu)選的方式中,還可預(yù)先設(shè)定時(shí)間區(qū)間,獲取該時(shí)間區(qū)間內(nèi)全局用戶的用戶標(biāo)識對應(yīng)的消息提交次數(shù)、在線時(shí)長和垃圾消息提交次數(shù),并根據(jù)上述公式計(jì)算出全局用戶在該時(shí)間區(qū)間中的信用度。例如,預(yù)先設(shè)定的時(shí)間區(qū)間為上個(gè)月,從而可獲取社交網(wǎng)絡(luò)應(yīng)用上的用戶在上個(gè)月30天內(nèi)提交消息的次數(shù)、提交垃圾消息的次數(shù)以及上個(gè)月30天中由多少天登錄過,進(jìn)而計(jì)算出全局用戶在上個(gè)月的信用度。
[0037]需要說明的是,對于用戶提交的消息,可通過關(guān)鍵字匹配或機(jī)器學(xué)習(xí)算法來識別其是否為垃圾消息。例如,若消息的內(nèi)容中具有與色情、暴力、政治、廣告和政治目的的關(guān)鍵字,則可將其判定為垃圾消息,相應(yīng)的,在統(tǒng)計(jì)垃圾消息提交次數(shù)時(shí)則加I。也可使用用于識別垃圾郵件的支持向量機(jī)對消息進(jìn)行分類,從而識別用戶提交的消息是否為垃圾消息。
[0038]全局用戶信用分布即為計(jì)算得到社交網(wǎng)絡(luò)應(yīng)用上的用戶各自的信用度后,信用度大小與用戶人數(shù)的分布情況。需要說明的是,用戶數(shù)均為百分比用戶數(shù),以下不再贅述。如圖2所述,橫軸即為信用度(可歸一化到O至100),縱軸即為小于或等于相應(yīng)信用度的百分比用戶數(shù)。由圖中即可看出,信用度小于或等于60的用戶數(shù)為30%。
[0039]步驟S104,獲取預(yù)設(shè)的查詢條件,根據(jù)查詢條件在全局用戶的用戶標(biāo)識中篩選得到條件用戶的用戶標(biāo)識。
[0040]在本實(shí)施例中,查詢條件在社交網(wǎng)絡(luò)應(yīng)用的注冊用戶中篩選出特定用戶群體(SP條件用戶)的條件信息??梢允荌P地址、消息標(biāo)識、用戶群組標(biāo)識或用戶個(gè)人資料屬性值中的一種。
[0041 ] 例如,若某個(gè)IP地址在一個(gè)月內(nèi)群發(fā)了大量的消息,即向社交服務(wù)器提交了大量UGC,則