本公開涉及計算機技術(shù)領(lǐng)域,具體而言,涉及一種用于監(jiān)控節(jié)點變化及輔助識別黑名單的方法、裝置及電子設(shè)備。
背景技術(shù):
隨著互聯(lián)網(wǎng)金融業(yè)務(wù)、電子商務(wù)、網(wǎng)上交易等的迅速發(fā)展,金融詐騙現(xiàn)象也出現(xiàn)了團伙化、組織化的趨勢,對風(fēng)險管控體系保障安全的要求也越來越高。為了能夠有效預(yù)防欺詐行為,需要提前識別出隱含的黑名單。
現(xiàn)有的常見防欺詐方式,主要分為以下兩種:
一、通過一個反欺詐規(guī)則引擎的模型來描述欺詐行為特征,從而將欺詐行為從正常操作中區(qū)別開來。在反欺詐規(guī)則引擎中,這些甄別欺詐行為的規(guī)則依賴于從大量歷史案例中總結(jié)出來的“專家知識”。
二、通過數(shù)據(jù)挖掘的方法,基于歷史數(shù)據(jù)(即,已知的欺詐申請和正常申請的數(shù)據(jù))而建立的分類模型,這里模型的訓(xùn)練往往需要大量數(shù)據(jù)。
上述兩種方式,通過從歷史案例中發(fā)現(xiàn)金融欺詐時重復(fù)出現(xiàn)的個體行為模式,不適用于團伙化、有組織的行為。同時,這兩種方式均是事后處理方式,欺詐案件發(fā)生后,進行事后的分析、處理,而不能進行事前的預(yù)測和事中的警報。
因此,需要一種新的用于監(jiān)控節(jié)點變化及輔助識別黑名單的方法、裝置及電子設(shè)備。
需要說明的是,在上述背景技術(shù)部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構(gòu)成對本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)中的部分問題或者全部問題,本公開提供一種用于監(jiān)控節(jié)點變化及輔助識別黑名單的方法、裝置及電子設(shè)備。
根據(jù)本公開的一個方面,提供一種用于監(jiān)控節(jié)點變化的方法,包括:
獲取用戶數(shù)據(jù),所述用戶數(shù)據(jù)包括多個虛擬用戶的用戶標(biāo)識;
將所述用戶標(biāo)識作為節(jié)點,并連接具有關(guān)聯(lián)關(guān)系的節(jié)點形成邊,根據(jù)所述節(jié)點和所述邊建立基礎(chǔ)圖;
監(jiān)控各節(jié)點與其他節(jié)點之間的關(guān)聯(lián)關(guān)系的變化度;
當(dāng)一節(jié)點與其他節(jié)點之間的關(guān)聯(lián)關(guān)系的變化度超過第一預(yù)設(shè)閾值時,將所述節(jié)點判定為異常節(jié)點;或者選擇變化度最大的預(yù)設(shè)數(shù)量的節(jié)點作為異常節(jié)點。
在本公開的一種示例性實施例中,所述獲取用戶數(shù)據(jù)包括:通過spark-storm插件實時抽取所述用戶數(shù)據(jù);和/或離線抽取所述用戶數(shù)據(jù)。
在本公開的一種示例性實施例中,還包括:
獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點。
在本公開的一種示例性實施例中,所述獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點包括:
將所述預(yù)定節(jié)點的節(jié)點標(biāo)識作為消息、數(shù)值1作為距離,封裝成第一元組發(fā)送到所述預(yù)定節(jié)點的相鄰節(jié)點的屬性中,獲取所述預(yù)定節(jié)點的一度節(jié)點。
在本公開的一種示例性實施例中,所述獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點還包括:
根據(jù)所述一度節(jié)點和所述邊構(gòu)造第一圖,將所述一度節(jié)點的屬性信息發(fā)送到所述一度節(jié)點的相鄰節(jié)點的屬性中,并將所述屬性中的距離加1,獲取所述預(yù)定節(jié)點的二度節(jié)點。
根據(jù)本公開的一個方面,提供一種用于監(jiān)控節(jié)點變化的裝置,包括:
數(shù)據(jù)采集模塊,用于獲取用戶數(shù)據(jù),所述用戶數(shù)據(jù)包括多個虛擬用戶的用戶標(biāo)識;
基礎(chǔ)圖繪制模塊,用于將所述用戶標(biāo)識作為節(jié)點,并連接具有關(guān)聯(lián)關(guān)系的節(jié)點形成邊,根據(jù)所述節(jié)點和所述邊建立基礎(chǔ)圖;
節(jié)點監(jiān)控模塊,用于監(jiān)控各節(jié)點與其他節(jié)點之間的關(guān)聯(lián)關(guān)系的變化度;
異常節(jié)點判斷模塊,用于當(dāng)一節(jié)點與其他節(jié)點之間的關(guān)聯(lián)關(guān)系的變化度超過第一預(yù)設(shè)閾值時,將所述節(jié)點判定為異常節(jié)點;或者選擇變化度最大的預(yù)設(shè)數(shù)量的節(jié)點作為異常節(jié)點。
根據(jù)本公開的一個方面,提供一種電子設(shè)備,包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,所述處理器被配置為執(zhí)行上述任意所述的用于監(jiān)控節(jié)點變化的方法。
根據(jù)本公開的一個方面,提供用于輔助識別黑名單的方法,包括:
獲取用戶數(shù)據(jù),所述用戶數(shù)據(jù)包括多個虛擬用戶的用戶標(biāo)識;
將所述用戶標(biāo)識作為節(jié)點,并連接具有關(guān)聯(lián)關(guān)系的節(jié)點形成邊,根據(jù)所述節(jié)點和所述邊建立基礎(chǔ)圖;
采用群體分類方式將所述基礎(chǔ)圖分為多個子圖。
在本公開的一種示例性實施例中,所述群體分類方式包括:聚類分析、支持向量機、邏輯回歸中的任意一種。
在本公開的一種示例性實施例中,還包括:
計算各個子圖中的黑名單的占比比率;
當(dāng)子圖中的黑名單的占比比率超過第二預(yù)設(shè)閾值時,將所述子圖中的除黑名單以外的其他節(jié)點加入至一灰名單。
根據(jù)本公開的一個方面,提供一種用于輔助識別黑名單的裝置,包括:
數(shù)據(jù)采集模塊,用于獲取用戶數(shù)據(jù),所述用戶數(shù)據(jù)包括多個虛擬用戶的用戶標(biāo)識;
基礎(chǔ)圖繪制模塊,用于將所述用戶標(biāo)識作為節(jié)點,并連接具有關(guān)聯(lián)關(guān)系的節(jié)點形成邊,根據(jù)所述節(jié)點和所述邊建立基礎(chǔ)圖;
子圖劃分模塊,用于采用群體分類方式將所述基礎(chǔ)圖分為多個子圖。
在本公開的一種示例性實施例中,還包括:
黑名單比率計算模塊,用于計算各個子圖中的黑名單的占比比率;
灰名單形成單元,用于當(dāng)子圖中的黑名單的占比比率超過第二預(yù)設(shè)閾值時,將所述子圖中的除黑名單以外的其他節(jié)點加入至一灰名單。
根據(jù)本公開的一個方面,提供一種電子設(shè)備,包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,所述處理器被配置為執(zhí)行上述任意所述的用于輔助識別黑名單的方法。
一方面,本公開的一種實施例中的用于監(jiān)控節(jié)點變化的方法、裝置及電子設(shè)備,根據(jù)已經(jīng)構(gòu)建好的圖數(shù)據(jù),可以監(jiān)控各個節(jié)點關(guān)系的變化情況,并根據(jù)變化度可以監(jiān)控異常變動節(jié)點。
另一方面,本公開的一種實施例中的用于輔助識別黑名單的方法、裝置及電子設(shè)備,可以實現(xiàn)根據(jù)群體分類方式將構(gòu)建好的基礎(chǔ)圖劃分為多個子圖,研究對象不以每個用戶為維度,而是將所有用戶的所有基礎(chǔ)屬性降維,各基礎(chǔ)屬性對應(yīng)一個節(jié)點,使得數(shù)據(jù)結(jié)構(gòu)具有普適性,數(shù)據(jù)結(jié)構(gòu)簡潔已操作。
在一些實施例中,可以利用關(guān)系網(wǎng)絡(luò)的方式通過現(xiàn)有黑名單進行節(jié)點關(guān)聯(lián),提高效率,有效發(fā)現(xiàn)隱藏的黑名單,豐富黑名單庫,能夠做到事前預(yù)防。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。顯而易見地,下面描述中的附圖僅僅是本公開的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1示意性示出本示例實施方式中一種用于監(jiān)控節(jié)點變化的方法的流程圖。
圖2示意性示出本公開示例性實施例中一種用于監(jiān)控節(jié)點變化的裝置的方框圖。
圖3示意性示出本公開示例性實施例中一種用于輔助識別黑名單的方法的流程圖。
圖4示意性示出本公開示例性實施例中一種用于輔助識別黑名單的裝置的方框圖。
圖5示意性示出本公開示例性實施例中一種電子設(shè)備的方框圖。
圖6示意性示出本公開示例性實施例中一種用于輔助識別黑名單的裝置的方框圖。
具體實施方式
現(xiàn)在將參考附圖更全面地描述示例實施方式。然而,示例實施方式能夠以多種形式實施,且不應(yīng)被理解為限于在此闡述的范例;相反,提供這些實施方式使得本公開將更加全面和完整,并將示例實施方式的構(gòu)思全面地傳達給本領(lǐng)域的技術(shù)人員。所描述的特征、結(jié)構(gòu)或特性可以以任何合適的方式結(jié)合在一個或更多實施方式中。在下面的描述中,提供許多具體細節(jié)從而給出對本公開的實施方式的充分理解。然而,本領(lǐng)域技術(shù)人員將意識到,可以實踐本公開的技術(shù)方案而省略所述特定細節(jié)中的一個或更多,或者可以采用其它的方法、組元、裝置、步驟等。在其它情況下,不詳細示出或描述公知技術(shù)方案以避免喧賓奪主而使得本公開的各方面變得模糊。
此外,附圖僅為本公開的示意性圖解,并非一定是按比例繪制。圖中相同的附圖標(biāo)記表示相同或類似的部分,因而將省略對它們的重復(fù)描述。附圖中所示的一些方框圖是功能實體,不一定必須與物理或邏輯上獨立的實體相對應(yīng)。可以采用軟件形式來實現(xiàn)這些功能實體,或在一個或多個硬件模塊或集成電路中實現(xiàn)這些功能實體,或在不同網(wǎng)絡(luò)和/或處理器裝置和/或微控制器裝置中實現(xiàn)這些功能實體。
圖1示意性示出本示例實施方式中一種用于監(jiān)控節(jié)點變化的方法的流程圖。
如圖1所示,在步驟S110中,獲取用戶數(shù)據(jù),所述用戶數(shù)據(jù)包括多個虛擬用戶的用戶標(biāo)識。
隨著互聯(lián)網(wǎng)的發(fā)展,越來越多的人通過網(wǎng)絡(luò)進行溝通和交流,網(wǎng)絡(luò)已經(jīng)成為眾多用戶的一個信息交流平臺。在網(wǎng)絡(luò)中,每一個用戶都是一個虛擬用戶。
其中,獲取所述用戶數(shù)據(jù)的數(shù)據(jù)源按照來源可以包括:內(nèi)部數(shù)據(jù)與外部數(shù)據(jù),內(nèi)部數(shù)據(jù)主要是系統(tǒng)自己生產(chǎn)的數(shù)據(jù),例如從業(yè)務(wù)系統(tǒng)采集的會員信息、訂單信息、登錄信息等,虛擬用戶在利用賬號登錄網(wǎng)站時,服務(wù)器通常會記錄一些反映用戶基本信息的用戶標(biāo)識,如,IP地址、Agent、cookie、用戶ID(如,用戶的郵箱或手機號)或MAC(Medium Media Access Control,介質(zhì)訪問控制)地址等。即使虛擬用戶在同一個網(wǎng)站上注冊了多個賬號,但所有賬號很有可能會關(guān)聯(lián)同一個用戶標(biāo)識,如,當(dāng)虛擬用戶利用同一臺電腦在網(wǎng)站上注冊多個賬號時,所有的賬號都會關(guān)聯(lián)同一個IP地址。外部數(shù)據(jù)主要是指從其他廠商處收集或購買的數(shù)據(jù)。但本公開不限定于。
在示例性實施例中,所述獲取用戶數(shù)據(jù)包括:通過spark-storm插件實時抽取所述用戶數(shù)據(jù);和/或離線抽取所述用戶數(shù)據(jù)。
抽取所述用戶數(shù)據(jù)的過程可以根據(jù)對數(shù)據(jù)的實時性要求,分為實時抽取與離線抽取(例如,T+1抽取,即抽取前一天的數(shù)據(jù))方式。其中,實時數(shù)據(jù)抽取是一種流式處理,例如可以通過spark-storm插件,每隔十分鐘抽取業(yè)務(wù)數(shù)據(jù)庫中的數(shù)據(jù),進行加工、計算,實時返回抽取數(shù)據(jù)結(jié)果。其中,離線抽取以T+1抽取方式為例,一般為經(jīng)過處理后的匯總數(shù)據(jù),然后放入數(shù)據(jù)庫中作對比。實時抽取主要是為了獲取實時交易的數(shù)據(jù),適用于對時效性要求比較高的場景、數(shù)據(jù)屬性等。離線抽取,主要可對應(yīng)于用戶的固有屬性,如相關(guān)用戶的電話、郵箱等,對時效性要求不高,可以使用離線抽取方式。
需要說明的是,數(shù)據(jù)抽取的方式不限于上述例舉的方式,且其中抽取的天數(shù)、抽取間隔時間均為舉例說明,并不用于限定本發(fā)明。例如,還可以定期從業(yè)務(wù)數(shù)據(jù)庫中獲取某一段時間內(nèi)(如,最近3個月內(nèi))保存的用戶數(shù)據(jù)。
在步驟S120中,將所述用戶標(biāo)識作為節(jié)點,并連接具有關(guān)聯(lián)關(guān)系的節(jié)點形成邊,根據(jù)所述節(jié)點和所述邊建立基礎(chǔ)圖。
本發(fā)明實施例中的所述用戶標(biāo)識是對所述用戶數(shù)據(jù)進行最小粒度化,從訂單信息、會員信息、登錄信息等中獲取的,并將所述用戶標(biāo)識作為節(jié)點。例如,一條訂單信息可以包含用戶賬號、用戶手機號、收貨地址、購買的商品種類、某一種商品種類的數(shù)量、訂單金額、支付賬號等等,其中用戶賬號、用戶手機號、收貨地址、購買的商品種類、某一種商品種類的數(shù)量、訂單金額、支付賬號可以分別作為一個節(jié)點。
在示例性實施例中,可以進一步的將上述獲得的多個虛擬用戶的多個節(jié)點劃分為不同的節(jié)點類型,節(jié)點類型例如可以分為:賬戶、電話、郵箱、地址、證件、姓名、銀行卡、設(shè)備等(這些節(jié)點中有的是根據(jù)所述黑名單已知的黑名單節(jié)點)。本公開不限定于上述例舉的節(jié)點類型,可以根據(jù)具體的應(yīng)用場合選擇不同的節(jié)點類型。
在示例性實施例中,可以將同一節(jié)點類型中相同的節(jié)點合并為同一個節(jié)點。例如,虛擬用戶A可以包括用戶賬號A、用戶手機號A、收貨地址A、身份證A、姓名A、設(shè)備A等,虛擬用戶B可以包括用戶賬號B、用戶手機號B、收貨地址B、身份證B、姓名B、設(shè)備B等,雖然,用戶賬號A和用戶賬號B不同,分別對應(yīng)兩個虛擬用戶A和B,但其中用戶手機號A和用戶手機號B相同,則在電話這個節(jié)點類型中,將用戶手機號A和用戶手機號B合并為同一個手機號。再例如,虛擬用戶A和虛擬用戶B的其他節(jié)點信息均不相同,但身份證A和身份證B相同,可以在證件這個節(jié)點類型中,將身份證A和身份證B合并為同一個身份證。其他情況可以以此類推。其中,可以是多個(大于等于2)虛擬用戶的其中某一節(jié)點信息相同,也可以是多個(大于等于2)虛擬用戶的其中某些節(jié)點信息相同。
在示例性實施例中,根據(jù)所述用戶數(shù)據(jù)中不同節(jié)點之間的關(guān)聯(lián)關(guān)系,用連線連接具有關(guān)聯(lián)關(guān)系的節(jié)點形成邊,作為邊信息進行存儲。例如,根據(jù)一條包含用戶賬號、用戶手機號、收貨地址等節(jié)點的訂單信息,可以將該用戶賬號對應(yīng)的節(jié)點與該用戶手機號對應(yīng)的節(jié)點連接形成一條邊,還可以將該用戶賬號對應(yīng)的節(jié)點與該收獲地址對應(yīng)的節(jié)點連接形成另一條邊,將該用戶手機號對應(yīng)的節(jié)點與該收貨地址對應(yīng)的節(jié)點連接形成再一條邊。再例如,根據(jù)第一條包含用戶賬號A、用戶手機號A、收貨地址A等節(jié)點的訂單信息,以及根據(jù)第二條包含用戶賬號B、用戶手機號B、收貨地址B等節(jié)點的訂單信息,假設(shè)收貨地址A和收貨地址B相同,則在地址這一節(jié)點類型中,收貨地址A和收貨地址B合并為同一個地址,此時用戶賬號A、用戶手機號A、用戶賬號B、用戶手機號B均與該同一收貨地址之間分別具有一條邊。其他情況以此類推。在不同的實施例中,可以為多個虛擬用戶的一個或者多個節(jié)點由于關(guān)聯(lián)關(guān)系與某一節(jié)點類型中的一個或者多個節(jié)點具有一條或者多條邊。
在示例性實施例中,根據(jù)上述節(jié)點類型,可以將邊分為例如以下類型:賬戶與電話之間的關(guān)聯(lián)關(guān)系形成的邊、賬戶與郵箱之間的關(guān)聯(lián)關(guān)系形成的邊、賬戶與地址之間的關(guān)聯(lián)關(guān)系形成的邊、賬戶與證件之間的關(guān)聯(lián)關(guān)系形成的邊、電話與郵箱之間的關(guān)聯(lián)關(guān)系形成的邊、電話與地址之間的關(guān)聯(lián)關(guān)系形成的邊等等。
在示例性實施例中,根據(jù)上述節(jié)點信息和邊信息構(gòu)造Graph(圖)對象,生成所述基礎(chǔ)圖。
在步驟S130中,監(jiān)控各節(jié)點與其他節(jié)點之間的關(guān)聯(lián)關(guān)系的變化度。
在步驟S140中,當(dāng)一節(jié)點與其他節(jié)點之間的關(guān)聯(lián)關(guān)系的變化度超過第一預(yù)設(shè)閾值時,將所述節(jié)點判定為異常節(jié)點;或者選擇變化度最大的預(yù)設(shè)數(shù)量的節(jié)點作為異常節(jié)點。
其中所述第一預(yù)設(shè)閾值的取值可以根據(jù)具體應(yīng)用場合進行設(shè)置,本公開對此不作限定。
根據(jù)上述已經(jīng)構(gòu)建好的圖(基礎(chǔ)圖)數(shù)據(jù),實時抽取數(shù)據(jù),并監(jiān)控每個節(jié)點類型中節(jié)點關(guān)系的變化情況。例如:某個電話與其他節(jié)點的關(guān)系,發(fā)生劇烈的變化,急速變多或者變小的情況,按照一定的閾值(一般是通過數(shù)據(jù)平均的變化度來進行設(shè)置的),如變化比率達到50%,或者增加邊數(shù)到500,或者取變化度最大的前n(例如n=30)個節(jié)點,判斷是否這些異常點是否有問題。比如,一個電話平時只關(guān)聯(lián)某一商品種類中的一個商品,突然有一天這個電話關(guān)聯(lián)了500個該同一種商品種類中的商品,則此時可以認為這個電話出現(xiàn)異常,該電話對應(yīng)的賬號可能被盜號,將該電話對應(yīng)的節(jié)點判定為一異常節(jié)點,并可以將該異常節(jié)點加入至一灰名單中。然后可以通過人工判別方式或是自動判別方式來判斷該灰名單中的信息是否應(yīng)該加入黑名單。
在示例性實施例中,用于監(jiān)控節(jié)點變化的方法還可以包括:
獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點。
例如,所述預(yù)定節(jié)點可以為黑名單節(jié)點,但本公開對此不作限定。其中,與已知的黑名單節(jié)點之間存在一條邊的節(jié)點稱為該已知的黑名單節(jié)點的一度節(jié)點,與已知的黑名單節(jié)點之間存在二條邊的節(jié)點稱為該已知的黑名單節(jié)點的二度節(jié)點,與已知的黑名單節(jié)點之間存在三條邊的節(jié)點稱為該已知的黑名單節(jié)點的三度節(jié)點,與已知的黑名單節(jié)點之間存在四條邊的節(jié)點稱為該已知的黑名單節(jié)點的四度節(jié)點,與已知的黑名單節(jié)點之間存在五條邊的節(jié)點稱為該已知的黑名單節(jié)點的五度節(jié)點,其他預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點的定義可以此類推。
各類網(wǎng)站通常都擁有大量的網(wǎng)站用戶(虛擬用戶),在這些虛擬用戶中,有些虛擬用戶在登錄網(wǎng)站后會憑借網(wǎng)站這個平臺對其它的虛擬用戶實施某種欺詐行為。例如,一些賣家在網(wǎng)站上發(fā)布虛假商品信息,并且只收錢不發(fā)貨,詐騙買家的錢財。對于網(wǎng)站系統(tǒng)而言,這些實施欺詐行為的虛擬用戶就屬于危險的虛擬用戶。為了防控危險的虛擬用戶的欺詐行為,必須要先從海量的虛擬用戶中準(zhǔn)確地識別出哪些為危險的虛擬用戶。通常,虛擬用戶是通過賬號來登錄網(wǎng)站的,不同的虛擬用戶綁定的賬號也不同,因此,可以直接利用賬號來識別一個虛擬用戶。并且,通過判斷某個賬號是否發(fā)生欺詐事實,進一步確定與該賬號綁定的虛擬用戶是否屬于危險的虛擬用戶。對于那些被確定為危險的虛擬用戶,服務(wù)器可以進一步采取一些防控措施,例如將其加入至黑名單。有時候,這些危險的虛擬用戶往往會通過各種手段在同一個網(wǎng)站上注冊多個賬號。
其中,獲取所述黑名單的數(shù)據(jù)源按照來源可以包括:內(nèi)部數(shù)據(jù)與外部數(shù)據(jù),內(nèi)部數(shù)據(jù)主要是系統(tǒng)自己生產(chǎn)的數(shù)據(jù),例如從業(yè)務(wù)系統(tǒng)采集的會員信息、訂單信息、登錄信息等,虛擬用戶在利用賬號登錄網(wǎng)站時,服務(wù)器通常會記錄一些反映用戶基本信息的用戶標(biāo)識,如,IP地址、Agent、cookie、用戶ID(如,用戶的郵箱或手機號)或MAC(Medium Media Access Control,介質(zhì)訪問控制)地址等。即使虛擬用戶在同一個網(wǎng)站上注冊了多個賬號,但所有賬號很有可能會關(guān)聯(lián)同一個用戶標(biāo)識,如,當(dāng)虛擬用戶利用同一臺電腦在網(wǎng)站上注冊多個賬號時,所有的賬號都會關(guān)聯(lián)同一個IP地址。外部數(shù)據(jù)主要是指從其他廠商處收集或購買的數(shù)據(jù),例如,從第三方廠商購買的風(fēng)險用戶數(shù)據(jù)作為已知的黑名單。但本公開不限定于。
在示例性實施例中,所述獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點可以包括:
將所述預(yù)定節(jié)點的節(jié)點標(biāo)識作為消息、數(shù)值1作為距離,封裝成第一元組發(fā)送到所述預(yù)定節(jié)點的相鄰節(jié)點的屬性中,獲取所述預(yù)定節(jié)點的一度節(jié)點。
例如,可以使用圖計算(通過上面建立的基礎(chǔ)圖結(jié)構(gòu))的函數(shù),將頂點(例如,黑名單節(jié)點)ID當(dāng)做消息,數(shù)值1作為距離,封裝成元組(VertexId,1)發(fā)送到相鄰節(jié)點的屬性中,圖中點的結(jié)構(gòu)就是點ID,屬性為鄰接點ID和距離。
在示例性實施例中,所述獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點還可以包括:
根據(jù)所述一度節(jié)點和所述邊構(gòu)造第一圖,將所述一度節(jié)點的屬性信息發(fā)送到所述一度節(jié)點的相鄰節(jié)點的屬性中,并將所述屬性中的距離加1,獲取所述預(yù)定節(jié)點的二度節(jié)點。
例如,根據(jù)一度節(jié)點和邊構(gòu)造新的圖,將點的屬性信息發(fā)送到相鄰節(jié)點,并且將屬性中的距離+1,得到二度節(jié)點的信息。此時,圖中每個點的屬性信息為二度節(jié)點的信息。
在示例性實施例中,所述獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點還可以包括:
根據(jù)所述二度節(jié)點和所述邊構(gòu)造第二圖,將所述二度節(jié)點的屬性信息發(fā)送到所述二度節(jié)點的相鄰節(jié)點的屬性中,并將所述屬性中的距離加1,獲取所述預(yù)定節(jié)點的三度節(jié)點。
在示例性實施例中,所述獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點還可以包括:
根據(jù)所述三度節(jié)點和所述邊構(gòu)造第三圖,將所述三度節(jié)點的屬性信息發(fā)送到所述三度節(jié)點的相鄰節(jié)點的屬性中,并將所述屬性中的距離加1,獲取所述預(yù)定節(jié)點的四度節(jié)點。
在示例性實施例中,所述獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點還可以包括:
根據(jù)所述四度節(jié)點和所述邊構(gòu)造第四圖,將所述四度節(jié)點的屬性信息發(fā)送到所述四度節(jié)點的相鄰節(jié)點的屬性中,并將所述屬性中的距離加1,獲取所述預(yù)定節(jié)點的五度節(jié)點。
同理計算三度、四度、五度節(jié)點,通過計算這些信息,可以得到每個節(jié)點之間的關(guān)系。其中隨著節(jié)點度數(shù)的增大,圖數(shù)據(jù)量相應(yīng)的增大。雖然這里只計算到五度節(jié)點信息,但實際上可以根據(jù)系統(tǒng)需求、計算處理量、處理速度等選擇更大或更小度數(shù)的節(jié)點。
在示例性實施例中,還可以包括:將與所述黑名單節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點加入至灰名單。
在示例性實施例中,根據(jù)所述基礎(chǔ)圖和已知的黑名單節(jié)點,計算出與已知的黑名單節(jié)點關(guān)聯(lián)的一度、二度、三度、四度、五度節(jié)點信息,這些與已知的黑名單節(jié)點之間有關(guān)聯(lián)的節(jié)點稱之為(或者與這些節(jié)點對應(yīng)的賬戶)灰名單。
在示例性實施例中,可以通過人工審核的方式來判斷這些灰名單是否應(yīng)該歸屬到黑名單中。
本實施方式提供的用于監(jiān)控節(jié)點變化的方法,以用戶最小粒度的屬性作為一個節(jié)點,如:一個電話、一個ip、一個證件、一個地址等,以用戶屬性之間的關(guān)系作為一條邊,通過點和邊組成一個基礎(chǔ)圖,并通過關(guān)聯(lián)節(jié)點之間的變化度來監(jiān)控異常節(jié)點。
圖2示意性示出本公開示例性實施例中一種用于監(jiān)控節(jié)點變化的裝置的方框圖。
如圖2所示,用于監(jiān)控節(jié)點變化的裝置100包括數(shù)據(jù)采集模塊110、基礎(chǔ)圖繪制模塊120、節(jié)點監(jiān)控模塊130以及異常節(jié)點判斷模塊140。
其中數(shù)據(jù)采集模塊110可以用于獲取用戶數(shù)據(jù),所述用戶數(shù)據(jù)包括多個虛擬用戶的用戶標(biāo)識。
基礎(chǔ)圖繪制模塊120可以用于將所述用戶標(biāo)識作為節(jié)點,并連接具有關(guān)聯(lián)關(guān)系的節(jié)點形成邊,根據(jù)所述節(jié)點和所述邊建立基礎(chǔ)圖。
節(jié)點監(jiān)控模塊130可以用于監(jiān)控各節(jié)點與其他節(jié)點之間的關(guān)聯(lián)關(guān)系的變化度。
異常節(jié)點判斷模塊140可以用于當(dāng)一節(jié)點與其他節(jié)點之間的關(guān)聯(lián)關(guān)系的變化度超過第一預(yù)設(shè)閾值時,將所述節(jié)點判定為異常節(jié)點;或者選擇變化度最大的預(yù)設(shè)數(shù)量的節(jié)點作為異常節(jié)點。
在示例性實施例中,用于監(jiān)控節(jié)點變化的裝置100還可以包括:關(guān)聯(lián)節(jié)點獲取模塊,其可以用于獲取預(yù)定節(jié)點與其他節(jié)點之間存在預(yù)設(shè)度數(shù)的關(guān)聯(lián)節(jié)點。
在示例性實施例中,所述關(guān)聯(lián)節(jié)點獲取模塊可以包括:一度節(jié)點計算單元,可以用于將所述預(yù)定節(jié)點的節(jié)點標(biāo)識作為消息、數(shù)值1作為距離,封裝成第一元組發(fā)送到所述預(yù)定節(jié)點的相鄰節(jié)點的屬性中,獲取所述預(yù)定節(jié)點的一度節(jié)點。
在示例性實施例中,所述關(guān)聯(lián)節(jié)點獲取模塊還可以包括:二度節(jié)點計算單元,可以用于根據(jù)所述一度節(jié)點和所述邊構(gòu)造第一圖,將所述一度節(jié)點的屬性信息發(fā)送到所述一度節(jié)點的相鄰節(jié)點的屬性中,并將所述屬性中的距離加1,獲取所述預(yù)定節(jié)點的二度節(jié)點。
本發(fā)明實施例中的用于監(jiān)控節(jié)點變化的裝置中的模塊和/或單元對應(yīng)上述用于監(jiān)控節(jié)點變化的方法的實施例中的具體內(nèi)容,可以參照上述方法實施例,在此不再贅述。
進一步的,本示例實施方式中,還提供了一種電子設(shè)備。所述電子設(shè)備包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,所述處理器被配置為執(zhí)行上述實施例所述的用于監(jiān)控節(jié)點變化的方法。
圖3示意性示出本公開示例性實施例中一種用于輔助識別黑名單的方法的流程圖。
如圖3所示,該用于輔助識別黑名單的方法可以包括以下步驟:
在步驟S210中,獲取用戶數(shù)據(jù),所述用戶數(shù)據(jù)包括多個虛擬用戶的用戶標(biāo)識。
在步驟S220中,將所述用戶標(biāo)識作為節(jié)點,并連接具有關(guān)聯(lián)關(guān)系的節(jié)點形成邊,根據(jù)所述節(jié)點和所述邊建立基礎(chǔ)圖。
上述步驟S210和S220可以參考上述用于監(jiān)控節(jié)點變化的方法的實施例中的步驟S110和S120,在此不再贅述。
在步驟S230中,采用群體分類方式將所述基礎(chǔ)圖分為多個子圖。
在示例性實施例中,所述群體分類方式包括:聚類分析、支持向量機、邏輯回歸中的任意一種。
在示例性實施例中,以一個節(jié)點為中心,通過各個維度的屬性,向周邊進行輻射,比如:與某個電話有關(guān)的一度內(nèi)的地址、用戶賬號、銀行卡等信息,稱之為以該電話為中心的一度群體,二度內(nèi)的為二度群體,以此類推??梢岳镁垲惙治觥⒅С窒蛄繖C、邏輯回歸等對上述基礎(chǔ)圖進行分類,劃分為多個子圖。
聚類分析是將相同的用戶群體進行聚類,將所有用戶分為幾種不同的類別,是一種無監(jiān)督算法。支持向量機、邏輯回歸這兩種算法是根據(jù)已知用戶的屬性信息(例如購買頻次、關(guān)聯(lián)的屬性個數(shù))和用戶的標(biāo)簽信息(例如二次元愛好者的群體類別)來對用戶進行分類,是一種有監(jiān)督算法。
在示例性實施例中,該用于輔助識別黑名單的方法還可以包括以下步驟:計算各個子圖中的黑名單的占比比率。
在示例性實施例中,利用深度學(xué)習(xí)的算法進行預(yù)測,對數(shù)據(jù)進行分層,每一層的輸出結(jié)果就是下一層的輸入,通過神經(jīng)網(wǎng)絡(luò)預(yù)測群體中的黑名單情況。
在示例性實施例中,該用于輔助識別黑名單的方法還可以包括以下步驟:當(dāng)子圖中的黑名單的占比比率超過第二預(yù)設(shè)閾值時,將所述子圖中的除黑名單以外的其他節(jié)點加入至一灰名單。
本發(fā)明實施例中,所述用戶數(shù)據(jù)和黑名單的獲取過程及數(shù)據(jù)來源均可參照上述用于監(jiān)控節(jié)點變化的方法的實施例。
在已經(jīng)分類后的群體(一個子圖對應(yīng)一個群體)中,已知有黑名單的節(jié)點,通過該已知的黑名單節(jié)點在該群體內(nèi)占比以及變化情況,可以預(yù)測該群體的變化情況。其中,可以利用時間序列,給數(shù)據(jù)加入時間屬性,隨著時間的變化,一個群體內(nèi)黑名單節(jié)點持續(xù)變多,可以對該群體內(nèi)不是黑名單的節(jié)點進行預(yù)測,例如,當(dāng)一個群體內(nèi)黑名單節(jié)點占比超過50%時,則可以認為該群體內(nèi)所有其他節(jié)點都為灰名單。
在示例性實施例中,還可以黑名單進行分級處理,根據(jù)預(yù)測算法的結(jié)果,優(yōu)先處理可能性最高的黑名單用戶,人性化處理黑名單用戶。例如,可以設(shè)置當(dāng)一個群體內(nèi)黑名單節(jié)點占比超過90%時,該群體對應(yīng)的優(yōu)先級最高,優(yōu)先判斷該群體內(nèi)的其他節(jié)點是否灰名單;當(dāng)一個群體內(nèi)黑名單節(jié)點占比超過80%小于90%時,該群體對應(yīng)的優(yōu)先級次之,以此類推。
在示例性實施例中,由于用戶數(shù)據(jù)中的用戶屬性可能發(fā)生變化,因此,上述構(gòu)造的圖不是固定不變的,圖中的屬性會發(fā)生變化,比如用戶修改手機號信息。當(dāng)用戶標(biāo)識發(fā)生變化時,會對圖的數(shù)據(jù)信息進行修改,重新計算相關(guān)的信息。
在示例性實施例中,圖3所述的用于輔助識別黑名單的方法,可以應(yīng)用于催收系統(tǒng)、風(fēng)控系統(tǒng)、交易系統(tǒng)、反欺詐系統(tǒng)等中。例如,在催收系統(tǒng)中,可以提供催收對象的關(guān)聯(lián)人的信息,家人的手機、地址等,從而提高催收率,減低公司信貸業(yè)務(wù)損失。在風(fēng)控系統(tǒng)中,可以通過檢查多個交易對象是否在同一個網(wǎng)絡(luò)中,進行團隊反欺詐,防止欺詐交易的產(chǎn)生。
本實施方式提供的用于輔助識別黑名單的方法,利用關(guān)系網(wǎng)絡(luò)的方式通過現(xiàn)有黑信息進行用戶關(guān)聯(lián),提高效率,有效發(fā)現(xiàn)隱藏的黑用戶,豐富黑名單庫,做到事前預(yù)防。一方面,通過在一個群體中,節(jié)點黑化的程度與速度,預(yù)測對整個群體的影響。另一方面,研究對象不以每個用戶為維度,而是以關(guān)系網(wǎng)絡(luò)中的子圖為研究對象,研究這個子圖中可能出現(xiàn)的黑名單。還通過大數(shù)據(jù)實時分析,提高黑名單的準(zhǔn)確度,靈活應(yīng)對盜號問題。
圖4示意性示出本公開示例性實施例中一種用于輔助識別黑名單的裝置的方框圖。
如圖4所示,用于輔助識別黑名單的裝置200可以包括數(shù)據(jù)采集模塊210、基礎(chǔ)圖繪制模塊220以及子圖劃分模塊230。
其中數(shù)據(jù)采集模塊210可用于獲取用戶數(shù)據(jù),所述用戶數(shù)據(jù)包括多個虛擬用戶的用戶標(biāo)識。
基礎(chǔ)圖繪制模塊220可用于將所述用戶標(biāo)識作為節(jié)點,并連接具有關(guān)聯(lián)關(guān)系的節(jié)點形成邊,根據(jù)所述節(jié)點和所述邊建立基礎(chǔ)圖。
子圖劃分模塊230可用于采用群體分類方式將所述基礎(chǔ)圖分為多個子圖。
在示例性實施例中,用于輔助識別黑名單的裝置200還可包括:黑名單比率計算模塊,用于計算各個子圖中的黑名單的占比比率;灰名單形成單元,用于當(dāng)子圖中的黑名單的占比比率超過第二預(yù)設(shè)閾值時,將所述子圖中的除黑名單以外的其他節(jié)點加入至一灰名單。
本發(fā)明實施例中的用于輔助識別黑名單的裝置中的模塊對應(yīng)上述用于輔助識別黑名單的方法的實施例中的具體內(nèi)容,可以參照上述方法實施例,在此不再贅述。
進一步的,本發(fā)明實施方式還提供了一種電子設(shè)備,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,所述處理器被配置為執(zhí)行上述所述的用于輔助識別黑名單的方法。
應(yīng)當(dāng)注意,盡管在上文詳細描述中提及了用于動作執(zhí)行的設(shè)備的若干模塊或者單元,但是這種劃分并非強制性的。實際上,根據(jù)本公開的實施方式,上文描述的兩個或更多模塊或者單元的特征和功能可以在一個模塊或者單元中具體化。反之,上文描述的一個模塊或者單元的特征和功能可以進一步劃分為由多個模塊或者單元來具體化。
此外,盡管在附圖中以特定順序描述了本公開中方法的各個步驟,但是,這并非要求或者暗示必須按照該特定順序來執(zhí)行這些步驟,或是必須執(zhí)行全部所示的步驟才能實現(xiàn)期望的結(jié)果。附加的或備選的,可以省略某些步驟,將多個步驟合并為一個步驟執(zhí)行,以及/或者將一個步驟分解為多個步驟執(zhí)行等。
進一步的,本示例實施方式中,還提供了一種電子設(shè)備。圖5示出根據(jù)本公開示例實施方式中一種電子設(shè)備的示意圖。例如,電子設(shè)備300可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,智能電視,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。
參照圖5,電子設(shè)備300可以包括以下一個或多個組件:處理組件302,存儲器304,電源組件306,多媒體組件308,音頻組件310,輸入/輸出(I/O)的接口312,傳感器組件314,以及通信組件316。
處理組件302通??刂齐娮釉O(shè)備300的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關(guān)聯(lián)的操作。處理組件302可以包括一個或多個處理器320來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件302可以包括一個或多個模塊,便于處理組件302和其他組件之間的交互。例如,處理組件302可以包括多媒體模塊,以方便多媒體組件304和處理組件302之間的交互。
存儲器304被配置為存儲各種類型的數(shù)據(jù)以支持在設(shè)備300的操作。這些數(shù)據(jù)的示例包括用于在電子設(shè)備300上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器304可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。
電力組件306為電子設(shè)備300的各種組件提供電力。電力組件306可以包括電源管理系統(tǒng),一個或多個電源,及其他與為電子設(shè)備300生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件308包括在所述電子設(shè)備300和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件308包括一個前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備300處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
音頻組件310被配置為輸出和/或輸入音頻信號。例如,音頻組件310包括一個麥克風(fēng)(MIC),當(dāng)電子設(shè)備300處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器304或經(jīng)由通信組件316發(fā)送。在一些實施例中,音頻組件310還包括一個揚聲器,用于輸出音頻信號。
I/O接口312為處理組件302和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
傳感器組件314包括一個或多個傳感器,用于為電子設(shè)備300提供各個方面的狀態(tài)評估。例如,傳感器組件314可以檢測到設(shè)備300的打開/關(guān)閉狀態(tài),組件的相對定位,例如所述組件為電子設(shè)備300的顯示器和小鍵盤,傳感器組件314還可以檢測電子設(shè)備300或電子設(shè)備300一個組件的位置改變,用戶與電子設(shè)備300接觸的存在或不存在,電子設(shè)備300方位或加速/減速和電子設(shè)備300的溫度變化。傳感器組件314可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件314還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實施例中,該傳感器組件314還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件316被配置為便于電子設(shè)備300和其他設(shè)備之間有線或無線方式的通信。電子設(shè)備300可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個示例性實施例中,通信組件316經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,所述通信組件316還包括近場通信(NFC)模塊,以促進短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍牙(BT)技術(shù)和其他技術(shù)來實現(xiàn)。
在示例性實施例中,電子設(shè)備300可以被一個或多個應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。
在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器304,上述指令可由電子設(shè)備300的處理器320執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質(zhì)可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。
圖6是根據(jù)一示例性實施例示出的一種用于輔助識別黑名單的裝置500的框圖。例如,裝置500可以被提供為一服務(wù)器。參照圖6,裝置500包括處理組件522,其進一步包括一個或多個處理器,以及由存儲器532所代表的存儲器資源,用于存儲可由處理組件522的執(zhí)行的指令,例如應(yīng)用程序。存儲器532中存儲的應(yīng)用程序可以包括一個或一個以上的每一個對應(yīng)于一組指令的模塊。此外,處理組件522被配置為執(zhí)行指令,以執(zhí)行上述方法……
裝置500還可以包括一個電源組件526被配置為執(zhí)行裝置500的電源管理,一個有線或無線網(wǎng)絡(luò)接口550被配置為將裝置500連接到網(wǎng)絡(luò),和一個輸入輸出(I/O)接口558。裝置500可以操作基于存儲在存儲器532的操作系統(tǒng),例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM或類似。
本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。