一種處理異常業(yè)務數(shù)據(jù)的方法和裝置的制造方法
【技術領域】
[0001]本申請涉及互聯(lián)網領域,更具體地涉及一種處理異常業(yè)務數(shù)據(jù)的方法和裝置。
【背景技術】
[0002]隨著互聯(lián)網的快速發(fā)展,各種惡意數(shù)據(jù),尤其是異常業(yè)務數(shù)據(jù)頻繁出現(xiàn),極大地干擾了數(shù)據(jù)的分析和統(tǒng)計工作。因此,如何能夠快速并及時地判斷和捕獲異常數(shù)據(jù),并且能夠及時對異常數(shù)據(jù)進行后續(xù)處理,就顯得尤為重要。
[0003]現(xiàn)有的方法通常是根據(jù)歷史業(yè)務數(shù)據(jù)的規(guī)則積累,利用黑名單庫進行異常數(shù)據(jù)的抓取。
[0004]但是,盡管存在上述技術方案,但是該方案存在缺陷。一方面,上述方案僅僅考慮了歷史業(yè)務數(shù)據(jù)中的遠期歷史業(yè)務數(shù)據(jù),如10天前的歷史業(yè)務數(shù)據(jù)。這種方案忽略了當前業(yè)務之前某段相近時間的業(yè)務數(shù)據(jù),而這部分數(shù)據(jù)對異常數(shù)據(jù)的捕獲是非常重要的,尤其是當遠期歷史數(shù)據(jù)中未出現(xiàn)過的某些顯著特征,在與當前業(yè)務時間相近的業(yè)務數(shù)據(jù)中可能會出現(xiàn)。另一方面,現(xiàn)有方法中,對異常數(shù)據(jù)的判斷是延遲進行的。如延遲一天根據(jù)規(guī)則抓取異常數(shù)據(jù),然后再對抓取的異常數(shù)據(jù)進行需要的后續(xù)處理。這種延遲抓取和處理異常數(shù)據(jù)的情況,使得異常數(shù)據(jù)不能及時被捕獲,相應的,也延遲了對異常數(shù)據(jù)的后續(xù)處理。
[0005]因此,在本領域中,需要一種處理異常業(yè)務數(shù)據(jù)的方案,能夠及時、準確地判斷和處理異常數(shù)據(jù),避免現(xiàn)有技術中異常數(shù)據(jù)漏檢和處理延遲等的問題。
【發(fā)明內容】
[0006]本申請的主要目的在于,提供一種處理異常業(yè)務數(shù)據(jù)的技術,以解決現(xiàn)有技術中異常數(shù)據(jù)漏檢和處理延遲等的問題。
[0007]根據(jù)本申請的一個方面,提供一種處理異常業(yè)務數(shù)據(jù)的方法,其特征在于,包括:獲取當前業(yè)務數(shù)據(jù);根據(jù)當前業(yè)務數(shù)據(jù)和近期歷史業(yè)務數(shù)據(jù),確定當前業(yè)務數(shù)據(jù)是否是異常業(yè)務數(shù)據(jù);以及對所確定的異常業(yè)務數(shù)據(jù)進行處理。
[0008]根據(jù)本申請的另一方面,提供一種處理異常業(yè)務數(shù)據(jù)的裝置,其特征在于,包括:獲取模塊,用于獲取當前業(yè)務數(shù)據(jù);確定模塊,用于根據(jù)當前業(yè)務數(shù)據(jù)和近期歷史業(yè)務數(shù)據(jù),確定當前業(yè)務數(shù)據(jù)是否是異常業(yè)務數(shù)據(jù);以及處理模塊,用于對異常業(yè)務數(shù)據(jù)進行處理。
[0009]與現(xiàn)有技術相比,根據(jù)本申請的技術方案,能夠不僅考慮遠期歷史業(yè)務數(shù)據(jù),而且結合近期歷史業(yè)務數(shù)據(jù),并且實時地對當前業(yè)務數(shù)據(jù)進行異常判斷和處理,從而避免現(xiàn)有技術中異常數(shù)據(jù)漏檢和處理延遲等的問題。
【附圖說明】
[0010]此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:
[0011]圖1是根據(jù)本申請一個實施例的處理異常業(yè)務數(shù)據(jù)的方法的流程圖;
[0012]圖2是根據(jù)本申請一個實施例的根據(jù)當前業(yè)務數(shù)據(jù)和近期歷史業(yè)務數(shù)據(jù)來確定當前業(yè)務數(shù)據(jù)是否是異常業(yè)務數(shù)據(jù)的方法的流程圖;
[0013]圖3是根據(jù)本申請另一實施例的處理異常業(yè)務數(shù)據(jù)的方法的流程圖;
[0014]圖4是根據(jù)本申請另一實施例的處理異常業(yè)務數(shù)據(jù)的方法的流程圖;以及
[0015]圖5是根據(jù)本申請一個實施例的處理異常業(yè)務數(shù)據(jù)的裝置的結構框圖。
【具體實施方式】
[0016]本申請的主要思想在于,通過獲取當前業(yè)務數(shù)據(jù),根據(jù)當前業(yè)務數(shù)據(jù)和近期歷史業(yè)務數(shù)據(jù),確定當前業(yè)務數(shù)據(jù)是否是異常業(yè)務數(shù)據(jù),并對異常業(yè)務數(shù)據(jù)進行處理。該技術方案能夠實時、準確地判斷和處理異常數(shù)據(jù),從而避免現(xiàn)有技術中異常數(shù)據(jù)漏檢和處理延遲等的問題。
[0017]為使本申請的目的、技術方案和優(yōu)點更加清楚,下面將結合本申請具體實施例及相應的附圖對本申請技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├?,本領域普通技術人員所獲得的所有其他實施例,都屬于本申請保護的范圍。
[0018]參考圖1,圖1是根據(jù)本申請一個實施例的處理異常業(yè)務數(shù)據(jù)的方法100的流程圖。如圖1所示,方法100開始于步驟101。
[0019]在步驟101,獲取當前業(yè)務數(shù)據(jù)。
[0020]在本申請的實施例中,當前業(yè)務數(shù)據(jù)可以包括當前與業(yè)務變更相關的業(yè)務數(shù)據(jù)??梢酝ㄟ^監(jiān)測用戶操作請求或監(jiān)測數(shù)據(jù)庫日志文件等方式來獲取當前業(yè)務數(shù)據(jù)。
[0021]根據(jù)本申請的一個具體實施例,可以實時監(jiān)測數(shù)據(jù)庫中的日志文件,以獲取與業(yè)務變更相關的業(yè)務操作數(shù)據(jù)(當前業(yè)務數(shù)據(jù)),從而可以實時地對該業(yè)務操作是否異常進行判斷和處理。具體而言,日志文件記載了與業(yè)務變更相關的操作數(shù)據(jù),其中包括當前時刻發(fā)生變更的當前業(yè)務數(shù)據(jù)和在當前時刻之前發(fā)生過變更的歷史業(yè)務數(shù)據(jù),并且業(yè)務變更數(shù)據(jù)的記錄都是按照業(yè)務發(fā)生時間先后順序排列的。因此,可以從日志文件中提取或導出當前時刻發(fā)生變更的當前業(yè)務數(shù)據(jù)(記錄),該條記錄例如可以包括用戶標識(例如,買家或賣家標識)、當前業(yè)務發(fā)生變更的時間、業(yè)務類型(例如,是“購買”還是“出售”)、業(yè)務對象類型(例如,作為業(yè)務對象的商品的所屬類別)等方面的變更數(shù)據(jù)。
[0022]在步驟102,根據(jù)當前業(yè)務數(shù)據(jù)和近期歷史業(yè)務數(shù)據(jù),確定當前業(yè)務數(shù)據(jù)是否是異常業(yè)務數(shù)據(jù)。
[0023]具體而言,為了對當前業(yè)務數(shù)據(jù)是否是異常業(yè)務數(shù)據(jù)進行準確的判斷,可以參考與當前業(yè)務發(fā)生時間之前相隔比較近的時間段內的歷史業(yè)務數(shù)據(jù),通過對這段時間內的業(yè)務數(shù)據(jù)進行統(tǒng)計,可以得到近期歷史業(yè)務數(shù)據(jù)。通過這種方式,能夠更準確地確定當前業(yè)務數(shù)據(jù)是否存在異常。
[0024]在實際操作中,根據(jù)本申請的一個實施例,當獲取到一條當前業(yè)務數(shù)據(jù)后,可以將該條記錄轉化為一條或多條基礎業(yè)務數(shù)據(jù),并且存儲該基礎業(yè)務數(shù)據(jù),例如,可以將該基礎業(yè)務數(shù)據(jù)存儲在內存或數(shù)據(jù)庫中,以供后續(xù)統(tǒng)計近期歷史業(yè)務數(shù)據(jù)使用。
[0025]將基礎業(yè)務數(shù)據(jù)與近期歷史業(yè)務數(shù)據(jù)進行合并,以得到合并后的業(yè)務數(shù)據(jù)。具體而言,通過將每條基礎業(yè)務數(shù)據(jù)合并到當前業(yè)務數(shù)據(jù)的近期歷史業(yè)務數(shù)據(jù)中,并且根據(jù)合并后的業(yè)務數(shù)據(jù)計算預設維度特征的維度特征值,并根據(jù)維度特征值判斷當前業(yè)務數(shù)據(jù)是否是異常業(yè)務數(shù)據(jù)。預設維度特征例如可以是來自同一 IP地址的用戶數(shù)目、用戶的不同行為類別的占比、用戶的異常行為的占比等等。
[0026]根據(jù)本申請的一個實施例,可以將合并后的業(yè)務數(shù)據(jù)存儲在內存或數(shù)據(jù)庫中,以便作為后續(xù)業(yè)務數(shù)據(jù)的近期歷史業(yè)務數(shù)據(jù)使用。
[0027]這里需要指出的是,對于當前業(yè)務數(shù)據(jù)而言,其近期歷史業(yè)務數(shù)據(jù)實際上是當前業(yè)務發(fā)生時刻之前的較短時間段內的歷史業(yè)務數(shù)據(jù)的統(tǒng)計結果。具體而言,該近期歷史業(yè)務數(shù)據(jù)實際上也是通過將每條歷史業(yè)務數(shù)據(jù)轉化為一條或多條基礎業(yè)務數(shù)據(jù),然后根據(jù)預定維度特征從這些基礎業(yè)務數(shù)據(jù)統(tǒng)計而來的。
[0028]根據(jù)本申請的一個實施例,近期歷史業(yè)務數(shù)據(jù)可以是當前業(yè)務發(fā)生時刻之前某一段時間內所產生并經過處理的業(yè)務數(shù)據(jù)。例如,近期歷史業(yè)務數(shù)據(jù)可以是當前業(yè)務發(fā)生時刻之前的近數(shù)個小時內所產生并經過處理的業(yè)務數(shù)據(jù),例如,可以是24小時、12小時、6小時、I小時、0.5小時等等,還可以是當天內所產生并經過處理的業(yè)務數(shù)據(jù)。
[0029]在步驟103,對