惡意訂單識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本公開涉及電子技術(shù)應(yīng)用領(lǐng)域,特別涉及一種惡意訂單識別方法及裝置。
【背景技術(shù)】
[0002] 隨著電子商務(wù)技術(shù)的快速發(fā)展,各種營銷手段層出不窮,當(dāng)下流行一種搶購、大促 模式的營銷手段,例如:將商品定價為較低的價格,并在一個指定的時間點開放購買。在這 種情況下,可能會出現(xiàn)一些惡意用戶,采用違背活動規(guī)則的方式,大批量搶占資源,再以高 價賣出。這些惡意用戶的行為嚴(yán)重影響了其他具有真實購買意圖的用戶的利益。
[0003] 相關(guān)技術(shù)中,惡意用戶在電商平臺中進(jìn)行大批量的購買行為時,電商平臺數(shù)據(jù)庫 中存儲的該惡意用戶的訂單信息中,可能會出現(xiàn)大量的重復(fù)信息:例如地址信息、聯(lián)系電 話、收獲人姓名或者下單時所使用的終端的互聯(lián)網(wǎng)協(xié)議(簡稱:IP)地址等。因此,相關(guān)技術(shù) 中,一般是通過對訂單信息進(jìn)行相似度評價來識別惡意用戶的。例如可以計算各個訂單中 的地址信息的相似度,并將地址信息相似度超過一定閾值的訂單確定為備選訂單,若該備 選訂單的數(shù)量也超過一定的閾值,則可以將該備選訂單確定為惡意訂單。
【發(fā)明內(nèi)容】
[0004] 為了解決相關(guān)技術(shù)中的問題,本公開提供了一種惡意訂單識別方法及裝置。所述 技術(shù)方案如下:
[0005] 根據(jù)本公開實施例的第一方面,提供一種惡意訂單識別方法,所述方法包括:
[0006] 根據(jù)預(yù)設(shè)的第一分詞算法,對待識別地址進(jìn)行分詞,得到所述待識別地址中的特 征詞語集合;
[0007] 根據(jù)預(yù)先建立的詞語與權(quán)重的對應(yīng)關(guān)系,獲取所述特征詞語集合中每個特征詞語 的目標(biāo)權(quán)重,得到與所述特征詞語集合對應(yīng)的目標(biāo)權(quán)重集合;
[0008] 根據(jù)所述目標(biāo)權(quán)重集合,判斷所述待識別地址是否為惡意地址;
[0009] 當(dāng)所述待識別地址為惡意地址時,確定所述待識別地址對應(yīng)的訂單為惡意訂單。
[0010] 可選的,所述根據(jù)所述目標(biāo)權(quán)重集合,判斷所述待識別地址是否為惡意地址,包 括:
[0011] 根據(jù)所述目標(biāo)權(quán)重集合,通過惡意度公式計算所述待識別地址的惡意度g,所述惡 意度公式為
其中,η為所述特征詞語集合中包括的特征詞語的個數(shù),&1為 第i個特征詞語的目標(biāo)權(quán)重,所述η為大于或等于1的整數(shù),所述i為大于等于1,小于等于η的 整數(shù),所述e為自然常數(shù);
[0012] 判斷所述待識別地址的惡意度g是否小于預(yù)設(shè)閾值t;
[0013] 當(dāng)所述惡意度g小于預(yù)設(shè)閾值t時,確定所述待識別地址為惡意地址;
[0014] 當(dāng)所述惡意度g不小于預(yù)設(shè)閾值t時,確定所述待識別地址不為惡意地址。
[0015] 可選的,所述方法還包括:
[0016] 獲取數(shù)據(jù)庫中存儲的歷史地址及所述歷史地址的標(biāo)識,所述標(biāo)識為惡意地址或者 正常地址中的一種;
[0017] 根據(jù)預(yù)設(shè)的第二分詞算法,對數(shù)據(jù)庫中存儲的每個所述歷史地址進(jìn)行分詞,得到 每個所述歷史地址的分詞詞語集合;
[0018] 根據(jù)每個所述歷史地址的分詞詞語集合,建立特征詞語庫;
[0019] 根據(jù)每個所述歷史地址的標(biāo)識,通過預(yù)設(shè)的機(jī)器學(xué)習(xí)分類模型,確定所述特征詞 語庫中每個詞語的權(quán)重;
[0020] 根據(jù)所述特征詞語庫,以及所述特征詞語庫中每個詞語的權(quán)重,建立所述詞語與 權(quán)重的對應(yīng)關(guān)系。
[0021] 可選的,所述預(yù)設(shè)的機(jī)器學(xué)習(xí)分類模型為邏輯回歸模型,
[0022] 所述根據(jù)每個所述歷史地址的標(biāo)識,通過預(yù)設(shè)的機(jī)器學(xué)習(xí)分類模型,確定所述特 征詞語庫中每個詞語的權(quán)重,包括:
[0023] 根據(jù)所述特征詞語庫,以及每個所述歷史地址的分詞詞語集合,確定每個所述歷 史地址的特征向量,所述每個所述歷史地址的特征向量中記錄了所述每個所述歷史地址的 分詞詞語集合中每個詞語在所述特征詞語庫中的索引;
[0024] 根據(jù)每個所述歷史地址的標(biāo)識以及每個所述歷史地址的特征向量,通過邏輯回歸 模型,確定所述特征詞語庫中每個詞語的權(quán)重。
[0025] 可選的,所述第二分詞算法包括所述第一分詞算法,所述第一分詞算法包括三字 切分算法。
[0026] 根據(jù)本公開實施例的第二方面,提供一種惡意訂單識別裝置,所述裝置包括:
[0027] 第一分詞模塊,被配置為根據(jù)預(yù)設(shè)的第一分詞算法,對待識別地址進(jìn)行分詞,得到 所述待識別地址中的特征詞語集合;
[0028] 第一獲取模塊,被配置為根據(jù)預(yù)先建立的詞語與權(quán)重的對應(yīng)關(guān)系,獲取所述特征 詞語集合中每個特征詞語的目標(biāo)權(quán)重,得到與所述特征詞語集合對應(yīng)的目標(biāo)權(quán)重集合;
[0029] 判斷模塊,被配置為根據(jù)所述目標(biāo)權(quán)重集合,判斷所述待識別地址是否為惡意地 址;
[0030] 第一確定模塊,被配置為當(dāng)所述待識別地址為惡意地址時,確定所述待識別地址 對應(yīng)的訂單為惡意訂單。
[0031] 可選的,所述判斷模塊,被配置為:
[0032] 根據(jù)所述目標(biāo)權(quán)重集合,通過惡意度公式計算所述待識別地址的惡意度g,所述惡 意度公式為:
%其中,η為所述特征詞語集合中包括的特征詞語的個數(shù),&1為 第i個特征詞語的目標(biāo)權(quán)重,所述η為大于或等于1的整數(shù),所述i為大于等于1,小于等于η的 整數(shù),所述e為自然常數(shù);
[0033] 判斷所述待識別地址的惡意度g是否小于預(yù)設(shè)閾值t;
[0034] 當(dāng)所述惡意度g小于預(yù)設(shè)閾值t時,確定所述待識別地址為惡意地址;
[0035] 當(dāng)所述惡意度g不小于預(yù)設(shè)閾值t時,確定所述待識別地址不為惡意地址。
[0036] 可選的,所述裝置還包括:
[0037] 第二獲取模塊,被配置為獲取數(shù)據(jù)庫中存儲的歷史地址及所述歷史地址的標(biāo)識, 所述標(biāo)識為惡意地址或者正常地址中的一種;
[0038] 第二分詞模塊,被配置為根據(jù)預(yù)設(shè)的第二分詞算法,對數(shù)據(jù)庫中存儲的每個所述 歷史地址進(jìn)行分詞,得到每個所述歷史地址的分詞詞語集合;
[0039] 第一建立模塊,被配置為根據(jù)每個所述歷史地址的分詞詞語集合,建立特征詞語 庫;
[0040] 第二確定模塊,被配置為根據(jù)每個所述歷史地址的標(biāo)識,通過預(yù)設(shè)的機(jī)器學(xué)習(xí)分 類模型,確定所述特征詞語庫中每個詞語的權(quán)重;
[0041] 第二建立模塊,被配置為根據(jù)所述特征詞語庫,以及所述特征詞語庫中每個詞語 的權(quán)重,建立所述詞語與權(quán)重的對應(yīng)關(guān)系。
[0042]可選的,所述預(yù)設(shè)的機(jī)器學(xué)習(xí)分類模型為邏輯回歸模型,所述第二確定模塊,被配 置為:
[0043] 根據(jù)所述特征詞語庫,以及每個所述歷史地址的分詞詞語集合,確定每個所述歷 史地址的特征向量,所述每個所述歷史地址的特征向量中記錄了所述每個所述歷史地址的 分詞詞語集合中每個詞語在所述特征詞語庫中的索引;
[0044] 根據(jù)每個所述歷史地址的標(biāo)識以及每個所述歷史地址的特征向量,通過邏輯回歸 模型,確定所述特征詞語庫中每個詞語的權(quán)重。
[0045] 可選的,所述第二分詞算法包括所述第一分詞算法,所述第一分詞算法包括三字 切分算法。
[0046]根據(jù)本公開實施例的第三方面,提供一種惡意訂單識別裝置,所述裝置包括:處理 器;
[0047]用于存儲所述處理器的可執(zhí)行指令的存儲器;
[0048]其中,所述處理器被配置為:
[0049] 根據(jù)預(yù)設(shè)的第一分詞算法,對待識別地址進(jìn)行分詞,得到所述待識別地址中的特 征詞語集合;
[0050] 根據(jù)預(yù)先建立的詞語與權(quán)重的對應(yīng)關(guān)系,獲取所述特征詞語集合中每個特征詞語 的目標(biāo)權(quán)重,得到與所述特征詞語集合對應(yīng)的目標(biāo)權(quán)重集合;
[0051 ]根據(jù)所述目標(biāo)權(quán)重集合,判斷所述待識別地址是否為惡意地址;
[0052]當(dāng)所述待識別地址為惡意地址時,確定所述待識別地址對應(yīng)的訂單為惡意訂單。 [0053]本公開的實施例提供的技術(shù)方案可以包括以下有益效果:
[0054] 本公開實施例提供的一種惡意訂單識別方法及裝置,可以根據(jù)預(yù)設(shè)的第一分詞算 法,對待識別地址進(jìn)行分詞,得到該待識別地址中的特征詞語集合;根據(jù)預(yù)先建立的詞語與 權(quán)重的對應(yīng)關(guān)系,獲取該特征詞語集合中每個特征詞語的目標(biāo)權(quán)重,得到與該特征詞語集 合對應(yīng)的目標(biāo)權(quán)重集合;根據(jù)該目標(biāo)權(quán)重集合,判斷該待識別地址是否為惡意地址;當(dāng)該待 識別地址為惡意地址時,確定該待識別地址對應(yīng)的訂單為惡意訂單。該算法可以通過預(yù)先 建立的詞語與權(quán)重的對應(yīng)關(guān)系,對訂單中的地址進(jìn)行識別,進(jìn)而確定該訂單是否為惡意訂 單,提尚了識別惡意訂單時的準(zhǔn)確性。<