本發(fā)明涉及互聯(lián)網(wǎng)安全技術(shù)領(lǐng)域,尤其涉及一種業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法和裝置。
背景技術(shù):
目前,業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法通常有兩類,一類是基于規(guī)則策略,即設(shè)置安全的業(yè)務(wù)操作應(yīng)該滿足的規(guī)則,將不符合規(guī)則的業(yè)務(wù)操作判斷為存在風(fēng)險(xiǎn)的業(yè)務(wù)操作。但是,這種方式需要根據(jù)業(yè)務(wù)和場景變化進(jìn)行調(diào)整,智能化程度較低。另一類是采用二類智能判別方法,該方法可以建立二類模型,根據(jù)模型將業(yè)務(wù)操作劃分為正常業(yè)務(wù)操作和危險(xiǎn)業(yè)務(wù)操作。
以業(yè)務(wù)操作是互聯(lián)網(wǎng)交易為例,互聯(lián)網(wǎng)交易中,相比于海量的正常交易,危險(xiǎn)交易在量級上極小且形態(tài)各異,也即存在小樣本問題:白樣本海量而黑樣本稀缺。在小樣本場景下,為了解決樣本不均衡的問題,在建模時(shí)需要采用大類(正常交易)欠采樣,或者小類(危險(xiǎn)交易)過采樣,但是,這種方式會導(dǎo)致數(shù)據(jù)過學(xué)習(xí)等問題,檢測方式可能失效。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的一個(gè)目的在于提出一種業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法,該方法可以實(shí)現(xiàn)業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測,并且在小樣本問題下依然保持有效。
本發(fā)明的另一個(gè)目的在于提出一種業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測裝置。
為達(dá)到上述目的,本發(fā)明第一方面實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法,包括:獲取待檢測的業(yè)務(wù)操作的初始特征;根據(jù)預(yù)先獲取的映射函數(shù),對所述初始特征進(jìn)行映射,獲取映射后的特征,其中,所述映射后的特征的個(gè)數(shù)小于所述初始特征的個(gè)數(shù),且,所述映射后的特征與所述初始特征具有局部流形保持特性;根據(jù)所述映射后的特征判斷所述業(yè)務(wù)操作是否存在風(fēng)險(xiǎn)。
本發(fā)明第一方面實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法,通過對初始特征進(jìn)行降維處理,且降維后的特征與初始特征具有局部流形保持特性,可以最大化的不丟失原始數(shù)據(jù)業(yè)務(wù)操作,并且可以選擇少量數(shù)據(jù)進(jìn)行運(yùn)算,實(shí)現(xiàn)業(yè)務(wù)操作風(fēng)險(xiǎn)檢測,并且不需要 根據(jù)不同類別的樣本進(jìn)行建模,不需要考慮數(shù)據(jù)不均衡問題,在小樣本問題下依然適用。
為達(dá)到上述目的,本發(fā)明第二方面實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測裝置,包括:第一獲取模塊,用于獲取待檢測的業(yè)務(wù)操作的初始特征;映射模塊,用于根據(jù)預(yù)先獲取的映射函數(shù),對所述初始特征進(jìn)行映射,獲取映射后的特征,其中,所述映射后的特征的個(gè)數(shù)小于所述初始特征的個(gè)數(shù),且,所述映射后的特征與所述初始特征具有局部流形保持特性;判斷模塊,用于根據(jù)所述映射后的特征判斷所述業(yè)務(wù)操作是否存在風(fēng)險(xiǎn)。
本發(fā)明第二方面實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測裝置,通過對初始特征進(jìn)行降維處理,且降維后的特征與初始特征具有局部流形保持特性,可以最大化的不丟失原始數(shù)據(jù)業(yè)務(wù)操作,并且可以選擇少量數(shù)據(jù)進(jìn)行運(yùn)算,實(shí)現(xiàn)業(yè)務(wù)操作風(fēng)險(xiǎn)檢測,并且不需要根據(jù)不同類別的樣本進(jìn)行建模,不需要考慮數(shù)據(jù)不均衡問題,在小樣本問題下依然適用。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
附圖說明
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1是本發(fā)明一實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法的流程示意圖;
圖2是本發(fā)明實(shí)施例中多種維度的特征的示意圖;
圖3是本發(fā)明實(shí)施例中基于局部流形保持的交易采樣點(diǎn)的示意圖;
圖4是本發(fā)明另一實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法的流程示意圖;
圖5是本發(fā)明另一實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法的流程示意圖;
圖6是本發(fā)明實(shí)施例中采用F分布統(tǒng)計(jì)量檢測風(fēng)險(xiǎn)的示意圖;
圖7是本發(fā)明另一實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法的流程示意圖;
圖8是本發(fā)明另一實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測裝置的結(jié)構(gòu)示意圖;
圖9是本發(fā)明另一實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本發(fā) 明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
圖1是本發(fā)明一實(shí)施例提出的業(yè)務(wù)操作的風(fēng)險(xiǎn)檢測方法的流程示意圖,該方法包括:
S11:獲取待檢測的業(yè)務(wù)操作的初始特征。
本發(fā)明實(shí)施例中,將以業(yè)務(wù)操作具體為交易進(jìn)行說明。
例如,數(shù)據(jù)庫中記錄交易的標(biāo)識信息與交易的特征之間的對應(yīng)關(guān)系,通過該對應(yīng)關(guān)系以及待檢測的交易的標(biāo)識信息,可以獲取相應(yīng)的初始特征。
S12:根據(jù)預(yù)先獲取的映射函數(shù),對所述初始特征進(jìn)行映射,獲取映射后的特征,其中,所述映射后的特征的個(gè)數(shù)小于所述初始特征的個(gè)數(shù),且,所述映射后的特征與所述初始特征具有局部流形保持特性。
在互聯(lián)網(wǎng)交易場景下,每個(gè)交易的初始特征是具有多個(gè)維度的特征。參見圖2,特征可以分為客戶主體、行為、交易、時(shí)間頻次等多個(gè)維度。兩個(gè)維度之間都可以笛卡爾積疊加而成,因此會引發(fā)海量的特征集,特別是時(shí)間維度的引入,每個(gè)交易樣本所帶有的特征可能達(dá)到上萬種。
現(xiàn)有技術(shù)中,需要在海量的特征中進(jìn)行選擇,從而根據(jù)選擇后的特征建?!,F(xiàn)有技術(shù)中通常是采用人工方式選擇特征,也即建模研究人員和工程師對業(yè)務(wù)的理解對最終的模型性能起到了決定性的作用。因此,極大地影響業(yè)務(wù)快速擴(kuò)展,模型體系變得越來越重。
雖然初始特征具有海量維度,但是,這些海量的初始特征往往只受少數(shù)內(nèi)置的約束變量所控制,高維數(shù)據(jù)雖外在表現(xiàn)為高維,但內(nèi)在存在著線性或非線性相關(guān)關(guān)系。也即真正驅(qū)動過程數(shù)據(jù)的自由隱變量數(shù)往往大幅小于原始變量數(shù),即其內(nèi)在核心結(jié)構(gòu)往往是低維的。變量之間的這種相關(guān)性可認(rèn)為其在幾何上表現(xiàn)為數(shù)據(jù)點(diǎn)散布在低維光滑流形上或者附近。
也就是說,一些高維數(shù)據(jù)雖外在表現(xiàn)為高維,但內(nèi)在本質(zhì)上可以映射到低維數(shù)據(jù),且高維數(shù)據(jù)和相應(yīng)的低維數(shù)據(jù)具有局部流形保持特性。局部流形保持特性的具體含義可以參見各種已有流形學(xué)習(xí)算法,大概含義是指:局部特征點(diǎn)在高維和低維上具有相同的空間特性,局部特征點(diǎn)是指在所有的采樣點(diǎn)中選擇的目標(biāo)點(diǎn),相同的空間特性例如兩個(gè)目標(biāo)點(diǎn)在高維空間的歐式距離與其在低維空間上的歐式距離相同。例如,目標(biāo)點(diǎn)分別是A、B、C,如果滿足局部保持特性,那么,在高維空間上,A、B、C這三個(gè)點(diǎn)兩兩之間的空間距離,與映射后,在低維空間上,這三個(gè)點(diǎn)兩兩之間的空間距離是相同的,而這三個(gè)目標(biāo)點(diǎn)與其他采樣點(diǎn)或其他采樣點(diǎn)之間在映射前后的距離關(guān)系可以改變??梢岳斫獾氖?,相同可以是指完全一致或者在預(yù)設(shè)誤差范圍內(nèi)的相同。
為此,本實(shí)施例中,采用映射函數(shù)的方式,實(shí)現(xiàn)初始特征的降維,一方面可以實(shí)現(xiàn)特征個(gè)數(shù)的減少,另一方面,通過局部流形保持特性,可以使得高維中兩點(diǎn)之間(具有相似 購買習(xí)慣的群體、相似年齡、收入層和社交圈的一類個(gè)體)的距離能夠在降維后依舊保持(那些相似特征個(gè)體在經(jīng)過維度降解后也應(yīng)聚集在同處或者相近處),實(shí)現(xiàn)數(shù)據(jù)特征的最大化保持。
在局部流形保持時(shí),將一個(gè)交易的采樣點(diǎn)作為目標(biāo)點(diǎn),該目標(biāo)點(diǎn)所在的鄰接域內(nèi)的采樣點(diǎn)之間的空間距離結(jié)構(gòu),在高維空間與低維空間具有一致性。
例如,參見圖3,便于可視化且不失一般性,假設(shè)原始空間的特征集為3維空間(實(shí)際交易風(fēng)險(xiǎn)特征維度為超高維),各圓圈點(diǎn)表示交易采樣點(diǎn)。假設(shè)圖3(1)中的采樣點(diǎn)Xi為目標(biāo)點(diǎn),該采樣點(diǎn)的鄰接域內(nèi)的采樣點(diǎn)包括另外三個(gè)采樣點(diǎn),且參見圖3(2)另外三個(gè)采樣點(diǎn)與目標(biāo)點(diǎn)之間的距離分別為R1i、R2i和R3i。參見圖3(3),經(jīng)過降維后,鄰接域內(nèi)的這四個(gè)采樣點(diǎn)之間從三維空間降維到二維空間還是保持空間距離結(jié)構(gòu),而其他采樣點(diǎn)的距離結(jié)構(gòu)則可能發(fā)生變化。
因此,在計(jì)算各點(diǎn)到目標(biāo)點(diǎn)的距離后,可獲得相應(yīng)的權(quán)重。也即,距離越近,權(quán)重越大。從互聯(lián)網(wǎng)支付交易的業(yè)務(wù)場景分析,那些高維空間上與目標(biāo)交易事件越相似的交易事件(具有相似購買習(xí)慣的群體、相似年齡、收入層和社交圈的一類個(gè)體),其距離應(yīng)該最接近,而在投影計(jì)算中,這些臨近點(diǎn)權(quán)重值越大。并且,在完成超高維特征降解后,在低維空間也應(yīng)當(dāng)保持該特性(那些相似特征個(gè)體在經(jīng)過維度降解后也應(yīng)聚集在同處或者相近處)。
為了實(shí)現(xiàn)特征降維并保持局部流形,本實(shí)施例可以預(yù)先生成映射函數(shù),采用該映射函數(shù)進(jìn)行映射。
參見圖4,該方法還可以包括獲取映射函數(shù)的流程,其中,以業(yè)務(wù)操作具體是交易為例,獲取映射函數(shù)可以包括:
S41:收集歷史交易的初始特征,并根據(jù)所述初始特征確定第一交易采樣點(diǎn),所述第一交易采樣點(diǎn)是歷史交易在初始特征所在的高維空間內(nèi)的交易采樣點(diǎn)。
相對于當(dāng)前檢測的交易,映射函數(shù)是預(yù)先建立的,其根據(jù)的特征是之前的交易對應(yīng)的特征,之前的交易可以稱為歷史交易。
在每次進(jìn)行交易時(shí)可以在數(shù)據(jù)庫內(nèi)記錄該交易與對應(yīng)的高維特征,因此,可以從數(shù)據(jù)庫中獲取交易的高維特征,也就是初始特征。
在獲取每個(gè)歷史交易對應(yīng)的初始特征后,可以在初始特征所在的高維空間內(nèi),確定每個(gè)歷史交易對應(yīng)的坐標(biāo)點(diǎn),該坐標(biāo)點(diǎn)可以稱為第一交易采樣點(diǎn)。
S42:確定鄰接域。
其中,可以設(shè)置鄰接域的范圍和閾值,例如,將某個(gè)年齡段的人群對應(yīng)的交易采樣點(diǎn)確定為同一個(gè)鄰接域等。
S43:確定同一個(gè)鄰接域內(nèi)的第一交易采樣點(diǎn),根據(jù)待求解的映射函數(shù)和第一交易采樣點(diǎn)確定第二交易采樣點(diǎn),所述第二交易采樣點(diǎn)是第一交易采樣點(diǎn)映射到低維空間內(nèi)的交易采樣點(diǎn),以及,確定目標(biāo)函數(shù),所述目標(biāo)函數(shù)使得第二交易采樣點(diǎn)之間的空間距離關(guān)系與所述第一交易采樣點(diǎn)之間的空間距離關(guān)系相同。
在確定鄰接域后,可以確定高維空間內(nèi)同一個(gè)鄰接域內(nèi)的交易采樣點(diǎn),也就是第一交易采樣點(diǎn),根據(jù)映射函數(shù)可以將第一交易采樣點(diǎn)映射到低維空間,得到第二交易采樣點(diǎn),從而第二交易采樣點(diǎn)與映射函數(shù)相關(guān)。
該目標(biāo)函數(shù)可以稱為基于局部流形保持的數(shù)據(jù)結(jié)構(gòu)描述。通過該目標(biāo)函數(shù),可以保證特征降維后,同一個(gè)鄰接域內(nèi)的交易采樣點(diǎn)的空間距離關(guān)系保持不變,而鄰接域之外的交易采樣點(diǎn)之間的空間距離關(guān)系可以發(fā)生改變。
可以理解的是,該具有相同的空間距離關(guān)系可以是完全相同,或者是在設(shè)定誤差范圍內(nèi)的相同。
S44:求解所述目標(biāo)函數(shù),得到映射函數(shù)。
由于目標(biāo)函數(shù)是關(guān)于映射函數(shù)的函數(shù),通過求解目標(biāo)函數(shù)可以獲取映射函數(shù)。
在S44之后可以執(zhí)行S11’-S13’,S11’-S13’是具體將S11-S13中的業(yè)務(wù)操作具體為交易。
S13:根據(jù)所述映射后的特征判斷所述業(yè)務(wù)操作是否存在風(fēng)險(xiǎn)。
例如,在對交易的特征進(jìn)行降維后,可以對少量特征進(jìn)行處理,以判斷交易是否存在風(fēng)險(xiǎn)。
一些實(shí)施例中,參見圖5,S13可以具體包括:
S51:對所述映射后的特征進(jìn)行統(tǒng)計(jì)運(yùn)算,得到統(tǒng)計(jì)量。
一些實(shí)施例中,計(jì)算的統(tǒng)計(jì)量可以具體是指F分布統(tǒng)計(jì)量。
在得到低維的特征后,可以計(jì)算這些特征的F分布統(tǒng)計(jì)量。
S52:根據(jù)所述統(tǒng)計(jì)量與預(yù)設(shè)的閾值,判斷所述業(yè)務(wù)操作是否存在風(fēng)險(xiǎn)。
例如,參見圖6,以統(tǒng)計(jì)量是F分布統(tǒng)計(jì)量為例,可以預(yù)先設(shè)置一個(gè)閾值,以業(yè)務(wù)操作是交易為例,當(dāng)一個(gè)交易的F分布統(tǒng)計(jì)量大于該閾值時(shí),判斷出存在風(fēng)險(xiǎn),如圖6所示的交易61為存在風(fēng)險(xiǎn)的交易,否則,當(dāng)一個(gè)交易對應(yīng)的F分布統(tǒng)計(jì)量小于或等于該閾值時(shí),確定該交易不存在風(fēng)險(xiǎn)。
其中,存在風(fēng)險(xiǎn)的交易可以稱為危險(xiǎn)交易,不存在風(fēng)險(xiǎn)的交易可以稱為正常交易。
一些實(shí)施例中,在判斷出正常交易和危險(xiǎn)交易后,可以進(jìn)行相應(yīng)處理。
例如,參見圖7,S11’-S13’之后,該方法還可以包括:
S71:當(dāng)該交易是正常交易時(shí),對該交易進(jìn)行放行。
例如,允許支付,轉(zhuǎn)賬等。
S72:當(dāng)該交易是危險(xiǎn)交易時(shí),進(jìn)行交易異常處理。
交易異常處理例如攔截,交易失敗處理,或者,賬戶限權(quán)等。
本實(shí)施例中,通過對初始特征進(jìn)行降維處理,且降維后的特征與初始特征具有局部流形保持特性,可以最大化的不丟失原始數(shù)據(jù)信息,并且可以選擇少量數(shù)據(jù)進(jìn)行運(yùn)算,實(shí)現(xiàn)交易風(fēng)險(xiǎn)檢測,并且不需要根據(jù)不同類別的樣本進(jìn)行建模,不需要考慮數(shù)據(jù)不均衡問題,在小樣本問題下依然適用。
圖8是本發(fā)明另一實(shí)施例提出的交易風(fēng)險(xiǎn)檢測裝置的結(jié)構(gòu)示意圖,該裝置80包括:
第一獲取模塊81,用于獲取待檢測的業(yè)務(wù)操作的初始特征;
具體的,將以業(yè)務(wù)操作是交易進(jìn)行具體說明。
例如,數(shù)據(jù)庫中記錄交易的標(biāo)識信息與交易的特征之間的對應(yīng)關(guān)系,通過該對應(yīng)關(guān)系以及待檢測的交易的標(biāo)識信息,可以獲取相應(yīng)的初始特征。
映射模塊82,用于根據(jù)預(yù)先獲取的映射函數(shù),對所述初始特征進(jìn)行映射,獲取映射后的特征,其中,所述映射后的特征的個(gè)數(shù)小于所述初始特征的個(gè)數(shù),且,所述映射后的特征與所述初始特征具有局部流形保持特性;
在互聯(lián)網(wǎng)交易場景下,每個(gè)交易的初始特征是具有多個(gè)維度的特征。參見圖2,特征可以分為客戶主體、行為、交易、時(shí)間頻次等多個(gè)維度。兩個(gè)維度之間都可以笛卡爾積疊加而成,因此會引發(fā)海量的特征集,特別是時(shí)間維度的引入,每個(gè)交易樣本所帶有的特征可能達(dá)到上萬種。
現(xiàn)有技術(shù)中,需要在海量的特征中進(jìn)行選擇,從而根據(jù)選擇后的特征建?!,F(xiàn)有技術(shù)中通常是采用人工方式選擇特征,也即建模研究人員和工程師對業(yè)務(wù)的理解對最終的模型性能起到了決定性的作用。因此,極大地影響業(yè)務(wù)快速擴(kuò)展,模型體系變得越來越重。
雖然初始特征具有海量維度,但是,這些海量的初始特征往往只受少數(shù)內(nèi)置的約束變量所控制,高維數(shù)據(jù)雖外在表現(xiàn)為高維,但內(nèi)在存在著線性或非線性相關(guān)關(guān)系。也即真正驅(qū)動過程數(shù)據(jù)的自由隱變量數(shù)往往大幅小于原始變量數(shù),即其內(nèi)在核心結(jié)構(gòu)往往是低維的。變量之間的這種相關(guān)性可認(rèn)為其在幾何上表現(xiàn)為數(shù)據(jù)點(diǎn)散布在低維光滑流形上或者附近。
也就是說,一些高維數(shù)據(jù)雖外在表現(xiàn)為高維,但內(nèi)在本質(zhì)上可以映射到低維數(shù)據(jù),且高維數(shù)據(jù)和相應(yīng)的低維數(shù)據(jù)具有局部流形保持特性。局部流形保持特性的具體含義可以參見各種已有流形學(xué)習(xí)算法,大概含義是指:局部特征點(diǎn)在高維和低維上具有相同的空間特性,局部特征點(diǎn)是指在所有的采樣點(diǎn)中選擇的目標(biāo)點(diǎn),相同的空間特性例如兩個(gè)目標(biāo)點(diǎn)在高維空間的歐式距離與其在低維空間上的歐式距離相同。例如,目標(biāo)點(diǎn)分別是A、B、C,如果滿足局部保持特性,那么,在高維空間上,A、B、C這三個(gè)點(diǎn)兩兩之間的空間距離, 與映射后,在低維空間上,這三個(gè)點(diǎn)兩兩之間的空間距離是相同的,而這三個(gè)目標(biāo)點(diǎn)與其他采樣點(diǎn)或其他采樣點(diǎn)之間在映射前后的距離關(guān)系可以改變??梢岳斫獾氖牵嗤梢允侵竿耆恢禄蛘咴陬A(yù)設(shè)誤差范圍內(nèi)的相同。
為此,本實(shí)施例中,采用映射函數(shù)的方式,實(shí)現(xiàn)初始特征的降維,一方面可以實(shí)現(xiàn)特征個(gè)數(shù)的減少,另一方面,通過局部流形保持特性,可以使得高維中兩點(diǎn)之間(具有相似購買習(xí)慣的群體、相似年齡、收入層和社交圈的一類個(gè)體)的距離能夠在降維后依舊保持(那些相似特征個(gè)體在經(jīng)過維度降解后也應(yīng)聚集在同處或者相近處),實(shí)現(xiàn)數(shù)據(jù)特征的最大化保持。
在局部流形保持時(shí),將一個(gè)交易的采樣點(diǎn)作為目標(biāo)點(diǎn),該目標(biāo)點(diǎn)所在的鄰接域內(nèi)的采樣點(diǎn)之間的空間距離結(jié)構(gòu),在高維空間與低維空間具有一致性。
例如,參見圖3a-圖3c,便于可視化且不失一般性,假設(shè)原始空間的特征集為3維空間(實(shí)際交易風(fēng)險(xiǎn)特征維度為超高維),各圓圈點(diǎn)表示交易采樣點(diǎn)。假設(shè)圖3a中的采樣點(diǎn)Xi為目標(biāo)點(diǎn),該采樣點(diǎn)的鄰接域內(nèi)的采樣點(diǎn)包括另外三個(gè)采樣點(diǎn),且參見圖3b,另外三個(gè)采樣點(diǎn)與目標(biāo)點(diǎn)之間的距離分別為R1i、R2i和R3i。參見圖3c,經(jīng)過降維后,鄰接域內(nèi)的這四個(gè)采樣點(diǎn)之間從三維空間降維到二維空間還是保持空間距離結(jié)構(gòu),而其他采樣點(diǎn)的距離結(jié)構(gòu)則可能發(fā)生變化。
因此,在計(jì)算各點(diǎn)到目標(biāo)點(diǎn)的距離后,可獲得相應(yīng)的權(quán)重。也即,距離越近,權(quán)重越大。從互聯(lián)網(wǎng)支付交易的業(yè)務(wù)場景分析,那些高維空間上與目標(biāo)交易事件越相似的交易事件(具有相似購買習(xí)慣的群體、相似年齡、收入層和社交圈的一類個(gè)體),其距離應(yīng)該最接近,而在投影計(jì)算中,這些臨近點(diǎn)權(quán)重值越大。并且,在完成超高維特征降解后,在低維空間也應(yīng)當(dāng)保持該特性(那些相似特征個(gè)體在經(jīng)過維度降解后也應(yīng)聚集在同處或者相近處)。
為了實(shí)現(xiàn)特征降維并保持局部流形,本實(shí)施例可以預(yù)先生成映射函數(shù),采用該映射函數(shù)進(jìn)行映射。
一些實(shí)施例中,參見圖9,該裝置80還包括:用于獲取映射函數(shù)的第二獲取模塊84,所述第二獲取模塊84具體用于:
收集歷史業(yè)務(wù)操作的初始特征,并根據(jù)所述初始特征確定第一業(yè)務(wù)操作采樣點(diǎn),所述第一業(yè)務(wù)操作采樣點(diǎn)是歷史業(yè)務(wù)操作在初始特征所在的高維空間內(nèi)的業(yè)務(wù)操作采樣點(diǎn);
確定鄰接域;
確定同一個(gè)鄰接域內(nèi)的第一業(yè)務(wù)操作采樣點(diǎn),根據(jù)待求解的映射函數(shù)和第一業(yè)務(wù)操作采樣點(diǎn)確定第二業(yè)務(wù)操作采樣點(diǎn),所述第二業(yè)務(wù)操作采樣點(diǎn)是第一業(yè)務(wù)操作采樣點(diǎn)映射到低維空間內(nèi)的業(yè)務(wù)操作采樣點(diǎn),以及,確定目標(biāo)函數(shù),所述目標(biāo)函數(shù)使得第二業(yè)務(wù)操作采 樣點(diǎn)之間的空間距離關(guān)系與所述第一業(yè)務(wù)操作采樣點(diǎn)之間的空間距離關(guān)系相同;
求解所述目標(biāo)函數(shù),得到映射函數(shù)。
相對于當(dāng)前檢測的交易,映射函數(shù)是預(yù)先建立的,其根據(jù)的特征是之前的交易對應(yīng)的特征,之前的交易可以稱為歷史交易。
在每次進(jìn)行交易時(shí)可以在數(shù)據(jù)庫內(nèi)記錄該交易與對應(yīng)的高維特征,因此,可以從數(shù)據(jù)庫中獲取交易的高維特征,也就是初始特征。
在獲取每個(gè)歷史交易對應(yīng)的初始特征后,可以在初始特征所在的高維空間內(nèi),確定每個(gè)歷史交易對應(yīng)的坐標(biāo)點(diǎn),該坐標(biāo)點(diǎn)可以稱為第一交易采樣點(diǎn)。
其中,可以設(shè)置鄰接域的范圍和閾值,例如,將某個(gè)年齡段的人群對應(yīng)的交易采樣點(diǎn)確定為同一個(gè)鄰接域等。
在確定鄰接域后,可以確定高維空間內(nèi)同一個(gè)鄰接域內(nèi)的交易采樣點(diǎn),也就是第一交易采樣點(diǎn),根據(jù)映射函數(shù)可以將第一交易采樣點(diǎn)映射到低維空間,得到第二交易采樣點(diǎn),從而第二交易采樣點(diǎn)與映射函數(shù)相關(guān)。
該目標(biāo)函數(shù)可以稱為基于局部流形保持的數(shù)據(jù)結(jié)構(gòu)描述。通過該目標(biāo)函數(shù),可以保證特征降維后,同一個(gè)鄰接域內(nèi)的交易采樣點(diǎn)的空間距離關(guān)系保持不變,而鄰接域之外的交易采樣點(diǎn)之間的空間距離關(guān)系可以發(fā)生改變。
可以理解的是,該具有相同的空間距離關(guān)系可以是完全相同,或者是在設(shè)定誤差范圍內(nèi)的相同。
由于目標(biāo)函數(shù)是關(guān)于映射函數(shù)的函數(shù),通過求解目標(biāo)函數(shù)可以獲取映射函數(shù)。
判斷模塊83,用于根據(jù)所述映射后的特征判斷所述業(yè)務(wù)操作是否存在風(fēng)險(xiǎn)。
由于目標(biāo)函數(shù)是關(guān)于映射函數(shù)的函數(shù),通過求解目標(biāo)函數(shù)可以獲取映射函數(shù)。
一些實(shí)施例中,參見圖9,所述判斷模塊83包括:
第一單元831,用于對所述映射后的特征進(jìn)行統(tǒng)計(jì)運(yùn)算,得到統(tǒng)計(jì)量;
一些實(shí)施例中,計(jì)算的統(tǒng)計(jì)量可以具體是指F分布統(tǒng)計(jì)量。
在得到低維的特征后,可以計(jì)算這些特征的F分布統(tǒng)計(jì)量。
第二單元832,用于根據(jù)所述統(tǒng)計(jì)量與預(yù)設(shè)的閾值,判斷所述業(yè)務(wù)操作是否存在風(fēng)險(xiǎn)。
所述統(tǒng)計(jì)量是F分布統(tǒng)計(jì)量,所述第二單元具體用于:
當(dāng)所述F分布統(tǒng)計(jì)量大于所述閾值時(shí),判斷出所述業(yè)務(wù)操作存在風(fēng)險(xiǎn)。
例如,參見圖6,以統(tǒng)計(jì)量是F分布統(tǒng)計(jì)量為例,可以預(yù)先設(shè)置一個(gè)閾值,當(dāng)一個(gè)交易的F分布統(tǒng)計(jì)量大于該閾值時(shí),判斷出存在風(fēng)險(xiǎn),如圖6所示的交易61為存在風(fēng)險(xiǎn)的交易,否則,當(dāng)一個(gè)交易對應(yīng)的F分布統(tǒng)計(jì)量小于或等于該閾值時(shí),確定該交易不存在風(fēng)險(xiǎn)。
其中,存在風(fēng)險(xiǎn)的交易可以稱為危險(xiǎn)交易,不存在風(fēng)險(xiǎn)的交易可以稱為正常交易。
一些實(shí)施例中,在判斷出正常交易和危險(xiǎn)交易后,可以進(jìn)行相應(yīng)處理。
一些實(shí)施例中,參見圖9,該裝置80還包括:
處理模塊85,用于當(dāng)判斷結(jié)果是不存在風(fēng)險(xiǎn)時(shí),對所述業(yè)務(wù)操作進(jìn)行放行處理;或者,當(dāng)判斷結(jié)果是存在風(fēng)險(xiǎn)時(shí),對所述業(yè)務(wù)操作進(jìn)行異常處理。
例如,在正常交易時(shí),允許支付,轉(zhuǎn)賬等。或者,在危險(xiǎn)交易時(shí),交易異常處理例如攔截,交易失敗處理,或者,賬戶限權(quán)等。
本實(shí)施例中,通過對初始特征進(jìn)行降維處理,且降維后的特征與初始特征具有局部流形保持特性,可以最大化的不丟失原始數(shù)據(jù)信息,并且可以選擇少量數(shù)據(jù)進(jìn)行運(yùn)算,實(shí)現(xiàn)交易風(fēng)險(xiǎn)檢測,并且不需要根據(jù)不同類別的樣本進(jìn)行建模,不需要考慮數(shù)據(jù)不均衡問題,在小樣本問題下依然適用。
需要說明的是,在本發(fā)明的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本發(fā)明的描述中,除非另有說明,“多個(gè)”的含義是指至少兩個(gè)。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲在一個(gè)計(jì)算機(jī)可讀 取存儲介質(zhì)中。
上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實(shí)施例進(jìn)行變化、修改、替換和變型。