本發(fā)明涉及電子交易技術(shù)領(lǐng)域,更具體地說(shuō),涉及一種欺詐交易檢測(cè)方法及系統(tǒng)。
背景技術(shù):
隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,移動(dòng)終端交易、云閃付業(yè)務(wù)逐步普及,在給人們生活帶來(lái)極大便利的同時(shí),也給了不法分子有趁之機(jī)。
當(dāng)前各類(lèi)電子交易中,或多或少都存在這信息泄露、被盜取的風(fēng)險(xiǎn)。一些違法犯罪分子可以通過(guò)騙取持卡人交易密碼、短信驗(yàn)證碼等信息,將持卡人卡號(hào)綁定在犯罪分子手機(jī)上,然手再進(jìn)行手機(jī)刷卡支付,這會(huì)給持卡人、金融機(jī)構(gòu)帶來(lái)嚴(yán)重?fù)p失,為此,相關(guān)機(jī)構(gòu)通過(guò)設(shè)置風(fēng)險(xiǎn)規(guī)則對(duì)疑似欺詐綁卡交易進(jìn)行攔截,這種方式對(duì)遏制違法犯罪分子的欺詐綁卡起到了一定效果,但是也存在一些不完善之處,主要包括:
一、依靠專(zhuān)家經(jīng)驗(yàn)進(jìn)行欺詐規(guī)則的提取,費(fèi)時(shí)費(fèi)力;
二、專(zhuān)家經(jīng)驗(yàn)不可能窮盡所有的欺詐規(guī)則;
三、違法犯罪分子總是在測(cè)試、避開(kāi)規(guī)則,經(jīng)過(guò)一段時(shí)間后,規(guī)則很容易失效;
四、無(wú)法有效利用欺詐卡片及欺詐設(shè)備的關(guān)聯(lián)關(guān)系。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種電子交易中的欺詐交易檢測(cè)方法,其能夠可靠地、自適應(yīng)地檢測(cè)欺詐交易,克服規(guī)則模型檢測(cè)及專(zhuān)家經(jīng)驗(yàn)檢測(cè)的不足之處。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種技術(shù)方案如下:
一種電子交易中的欺詐交易檢測(cè)方法,包括如下步驟:a)、建立評(píng)分模型;b)、將評(píng)分模型與規(guī)則模型相結(jié)合,對(duì)電子交易進(jìn)行檢測(cè);其中,步驟a)包括:a1)、根據(jù)欺詐卡片與欺詐設(shè)備之間的關(guān)聯(lián)關(guān)系確定N組樣本數(shù)據(jù),其中,N為欺詐卡片或欺詐設(shè)備的分級(jí)數(shù),每組樣本數(shù)據(jù)包括用于區(qū)分電子交易是否為欺詐交易的負(fù)樣本與正樣本;a2)、對(duì)每組樣本數(shù)據(jù)進(jìn)行特征值計(jì)算,以生成N組特征數(shù)據(jù),其中特征值至少包括IV值;a3)、對(duì)各組特征數(shù)據(jù)進(jìn)行劃分以獲得訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),基于各組訓(xùn)練數(shù)據(jù)生成多個(gè)評(píng)分模型,利用各組測(cè)試數(shù)據(jù)來(lái)測(cè)試多個(gè)評(píng)分模型;步驟b)包括:b1)、利用多個(gè)評(píng)分模型分別對(duì)當(dāng)前電子交易進(jìn)行評(píng)分,基于各評(píng)分結(jié)果對(duì)當(dāng)前電子交易是否為欺詐交易進(jìn)行投票;b2)、基于投票的結(jié)果與規(guī)則模型計(jì)算的結(jié)果判定當(dāng)前電子交易是否為欺詐交易。
優(yōu)選地,步驟a1)具體包括:將電子交易欺詐檢測(cè)系統(tǒng)檢測(cè)出的欺詐卡片確定為第1級(jí)欺詐卡片;將與第N級(jí)欺詐卡片關(guān)聯(lián)的欺詐設(shè)備確定第N級(jí)欺詐設(shè)備,將與第N級(jí)欺詐設(shè)備關(guān)聯(lián)的欺詐卡片確定為第N+1級(jí)欺詐卡片;其中N≥1。
優(yōu)選地,步驟a2)具體包括,針對(duì)每組樣本數(shù)據(jù):計(jì)算該組內(nèi)負(fù)樣本數(shù)量與各組內(nèi)負(fù)樣本數(shù)量之和的比例p1,以及該組內(nèi)正樣本數(shù)量與各組內(nèi)正樣本數(shù)量之和的比例p2;計(jì)算該組樣本數(shù)據(jù)的WOE值,WOE值表示為以及計(jì)算該組樣本數(shù)據(jù)的IV值,IV值表示為IV=(p1-p2)*WOE。
優(yōu)選地,步驟a3)具體包括:利用邏輯回歸算法對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,以生成N個(gè)評(píng)分模型。
優(yōu)選地,步驟a3)還包括:利用測(cè)試數(shù)據(jù)分別測(cè)試N個(gè)評(píng)分模型,統(tǒng)計(jì)各評(píng)分模型的準(zhǔn)確率;舍棄準(zhǔn)確率低于準(zhǔn)確率閾值的評(píng)分模型。
本發(fā)明還公開(kāi)一種欺詐交易檢測(cè)系統(tǒng),包括:評(píng)分模型單元,其包括:樣本數(shù)據(jù)確定模塊,用于根據(jù)欺詐卡片與欺詐設(shè)備之間的關(guān)聯(lián)關(guān)系確定N組樣本數(shù)據(jù),其中,N為欺詐卡片或欺詐設(shè)備的分級(jí)數(shù);特征計(jì)算模塊,與樣本數(shù)據(jù)確定模塊相耦合,用于對(duì)每組樣本數(shù)據(jù)進(jìn)行特征值計(jì)算,以生成N組特征數(shù)據(jù);評(píng)分模型訓(xùn)練及測(cè)試模塊,與特征計(jì)算模塊相耦合,用于對(duì)各組特征數(shù)據(jù)進(jìn)行劃分以獲得訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),基于各組訓(xùn)練數(shù)據(jù)生成多個(gè)評(píng)分模型,以及利用各組測(cè)試數(shù)據(jù)來(lái)測(cè)試多個(gè)評(píng)分模型;以及投票模塊,用于利用多個(gè)評(píng)分模型對(duì)當(dāng)前電子交易是否為欺詐交易進(jìn)行投票,以生成第一輸出;規(guī)則模型單元,基于欺詐判定規(guī)則對(duì)當(dāng)前電子交易的特征進(jìn)行判定,以生成第二輸出;以及決策單元,基于第一、第二輸出識(shí)別當(dāng)前電子交易是否為欺詐交易。
本發(fā)明所提供的欺詐交易檢測(cè)方法及檢測(cè)系統(tǒng),能夠克服規(guī)則模型檢測(cè)及專(zhuān)家經(jīng)驗(yàn)檢測(cè)的不足之處,基于數(shù)據(jù)之間的關(guān)聯(lián)性以及前期的檢測(cè)結(jié)果來(lái)補(bǔ)充、完善后期的檢測(cè),從而可靠地、自適應(yīng)地檢測(cè)欺詐交易。上述檢測(cè)方法及檢測(cè)系統(tǒng)實(shí)現(xiàn)簡(jiǎn)單,便于在業(yè)內(nèi)推廣應(yīng)用。
附圖說(shuō)明
圖1示出本發(fā)明第一實(shí)施例的欺詐交易檢測(cè)方法的流程示意圖。
圖2示出本發(fā)明第二實(shí)施例的欺詐交易檢測(cè)系統(tǒng)的模塊結(jié)構(gòu)示意圖。
具體實(shí)施方式
如圖1所示,本發(fā)明第一實(shí)施例提供一種欺詐交易檢測(cè)方法,其包括如下步驟:
步驟S10、根據(jù)欺詐卡片與欺詐設(shè)備之間的關(guān)聯(lián)關(guān)系確定N組樣本數(shù)據(jù),其中,N為欺詐卡片或欺詐設(shè)備的分級(jí)數(shù),每組樣本數(shù)據(jù)包括用于區(qū)分電子交易是否為欺詐交易的負(fù)樣本與正樣本。
作為一個(gè)示例,該步驟可以按如下方式實(shí)現(xiàn):將電子交易欺詐檢測(cè)系統(tǒng)(或根據(jù)專(zhuān)家經(jīng)驗(yàn))檢測(cè)出的欺詐卡片確定為第1級(jí)欺詐卡片;將與第1級(jí)欺詐卡片關(guān)聯(lián)的欺詐設(shè)備確定第1級(jí)欺詐設(shè)備,并將與第1級(jí)欺詐設(shè)備關(guān)聯(lián)的欺詐卡片確定為第2級(jí)欺詐卡片;依次類(lèi)推,最終可以確定總共N級(jí)欺詐卡片以及N級(jí)欺詐設(shè)備,N為大于等于1的正整數(shù)。
作為另一個(gè)示例,可以按照欺詐卡片或欺詐設(shè)備出現(xiàn)的頻率或地點(diǎn)等來(lái)對(duì)欺詐卡片或欺詐設(shè)備進(jìn)行分級(jí),例如,出現(xiàn)頻次屬于第一范圍的欺詐設(shè)備歸類(lèi)于第1級(jí)欺詐設(shè)備,出現(xiàn)頻次屬于第二范圍的欺詐設(shè)備歸類(lèi)于第2級(jí)欺詐設(shè)備,依次類(lèi)推,其中第一范圍的數(shù)值高于第二范圍的數(shù)值。又例如,出現(xiàn)地點(diǎn)屬于第一地域的欺詐設(shè)備歸類(lèi)于第1級(jí)欺詐設(shè)備,出現(xiàn)地點(diǎn)屬于第二地域的欺詐設(shè)備歸類(lèi)于第2級(jí)欺詐設(shè)備,等等。
步驟S11、對(duì)每組樣本數(shù)據(jù)進(jìn)行特征值計(jì)算,以生成N組特征數(shù)據(jù),其中特征值至少包括IV值。
具體地,在該步驟中,針對(duì)每組樣本數(shù)據(jù)分別進(jìn)行如下操作:計(jì)算該組內(nèi)負(fù)樣本數(shù)量與各組內(nèi)負(fù)樣本數(shù)量之和的比例p1,以及該組內(nèi)正樣本數(shù)量與各組內(nèi)正樣本數(shù)量之和的比例p2;計(jì)算該組樣本數(shù)據(jù)的WOE(Weight ofEvidence)值,WOE值表示為以及計(jì)算該組樣本數(shù)據(jù)的IV(Information Value)值,IV值表示為IV=(p1-p2)*WOE。
可見(jiàn),每組樣本數(shù)據(jù)的特征值可以表示為其中i為組編號(hào)。可見(jiàn),每組樣本數(shù)據(jù)的特征值可以取決于正樣本、負(fù)樣本的數(shù)量與分布。
進(jìn)一步,可以將IV值小于給定閾值的若干組樣本數(shù)據(jù)剔除。
步驟S12、對(duì)各組特征數(shù)據(jù)進(jìn)行劃分以獲得訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),基于各組訓(xùn)練數(shù)據(jù)生成多個(gè)評(píng)分模型,利用各組測(cè)試數(shù)據(jù)來(lái)測(cè)試多個(gè)評(píng)分模型。
作為一種具體實(shí)現(xiàn),可以對(duì)樣本數(shù)據(jù)組中的每一組樣本數(shù)據(jù),按時(shí)間進(jìn)行抽樣,T時(shí)間節(jié)點(diǎn)之前的數(shù)據(jù)形成為訓(xùn)練數(shù)據(jù),T時(shí)間節(jié)點(diǎn)之后的數(shù)據(jù)形成為測(cè)試數(shù)據(jù)。
可以利用邏輯回歸算法對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,以生成N個(gè)評(píng)分模型。隨后,利用測(cè)試數(shù)據(jù)分別測(cè)試N個(gè)評(píng)分模型。
作為進(jìn)一步改進(jìn),在測(cè)試之后,可以統(tǒng)計(jì)各評(píng)分模型的準(zhǔn)確率;并舍棄準(zhǔn)確率低于準(zhǔn)確率閾值的評(píng)分模型。從而,最終評(píng)分模型的數(shù)量一般會(huì)低于欺詐卡片或欺詐設(shè)備的分級(jí)數(shù)N。
可以理解,由于評(píng)分模型的數(shù)量為多個(gè),并可以分別對(duì)應(yīng)于多個(gè)不同級(jí)別的欺詐卡片或欺詐設(shè)備,從而本發(fā)明提供的方法可以充分利用欺詐卡片或欺詐設(shè)備之間的關(guān)聯(lián)性,從而實(shí)現(xiàn)更準(zhǔn)確的欺詐交易檢測(cè)。
步驟S20、利用多個(gè)評(píng)分模型分別對(duì)當(dāng)前電子交易進(jìn)行評(píng)分,基于各評(píng)分結(jié)果對(duì)當(dāng)前電子交易是否為欺詐交易進(jìn)行投票。
具體地,該步驟可以包括:可以利用上述多個(gè)評(píng)分模型分別對(duì)當(dāng)前電子交易進(jìn)行評(píng)分;確定每個(gè)評(píng)分模型的投票權(quán)重;其中,投票權(quán)重表示為其中,l為評(píng)分模型的數(shù)量,ri為對(duì)應(yīng)評(píng)分模型的準(zhǔn)確率。
可見(jiàn),每個(gè)評(píng)分模型的投票權(quán)重取決于該評(píng)分模型的準(zhǔn)確率。可以理解,當(dāng)一個(gè)評(píng)分模型的準(zhǔn)確率較高時(shí),意味這該評(píng)分模型能夠?qū)颖緮?shù)據(jù)進(jìn)行更好地表征,也通常表示其能夠更準(zhǔn)確地檢測(cè)欺詐交易。
步驟S21、基于投票的結(jié)果與規(guī)則模型計(jì)算的結(jié)果判定當(dāng)前電子交易是否為欺詐交易。
為了克服自動(dòng)檢測(cè)欺詐交易的弊端,該步驟中,結(jié)合規(guī)則模型計(jì)算的結(jié)果(和/或結(jié)合專(zhuān)家經(jīng)驗(yàn))來(lái)綜合判定當(dāng)前電子交易是否為欺詐交易。
作為對(duì)上述實(shí)施例的進(jìn)一步改進(jìn),可以每隔一時(shí)間周期,重新執(zhí)行上述步驟S10、S11及S12,以便更新評(píng)分模型,從而可以根據(jù)前期的檢測(cè)結(jié)果來(lái)補(bǔ)充、完善后期的檢測(cè),也有利于使不法分子意圖避開(kāi)檢測(cè)規(guī)則的企圖無(wú)法實(shí)現(xiàn)。
本發(fā)明第二實(shí)施例提供一種欺詐交易檢測(cè)系統(tǒng),其包括評(píng)分模型單元10、規(guī)則模型單元20及決策單元30,如圖2所示。
其中,評(píng)分模型單元10包括樣本數(shù)據(jù)確定模塊101、特征計(jì)算模塊102、評(píng)分模型訓(xùn)練及測(cè)試模塊103以及投票模塊104。其中,樣本數(shù)據(jù)確定模塊101用于根據(jù)欺詐卡片與欺詐設(shè)備之間的關(guān)聯(lián)關(guān)系確定N組樣本數(shù)據(jù),其中,N為欺詐卡片或欺詐設(shè)備的分級(jí)數(shù);特征計(jì)算模塊102與樣本數(shù)據(jù)確定模塊101相耦合,用于對(duì)每組樣本數(shù)據(jù)進(jìn)行特征值計(jì)算,以生成N組特征數(shù)據(jù);評(píng)分模型訓(xùn)練及測(cè)試模塊103與特征計(jì)算模塊102相耦合,用于對(duì)各組特征數(shù)據(jù)進(jìn)行劃分以獲得訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),基于各組訓(xùn)練數(shù)據(jù)生成多個(gè)評(píng)分模型,以及利用各組測(cè)試數(shù)據(jù)來(lái)測(cè)試多個(gè)評(píng)分模型;投票模塊104用于利用多個(gè)評(píng)分模型對(duì)當(dāng)前電子交易是否為欺詐交易進(jìn)行投票,以生成第一輸出;
規(guī)則模型單元20則基于欺詐判定規(guī)則(或?qū)<医?jīng)驗(yàn))對(duì)當(dāng)前電子交易的特征進(jìn)行判定,以生成第二輸出。
決策單元30基于上述第一、第二輸出最終識(shí)別當(dāng)前電子交易是否為欺詐交易。
上述各實(shí)施例所提供的欺詐交易檢測(cè)方法及檢測(cè)系統(tǒng),能夠克服規(guī)則模型檢測(cè)及專(zhuān)家經(jīng)驗(yàn)檢測(cè)的不足之處,基于數(shù)據(jù)之間的關(guān)聯(lián)性以及前期的檢測(cè)結(jié)果來(lái)補(bǔ)充、完善后期的檢測(cè),從而更可靠地、并自適應(yīng)地檢測(cè)欺詐交易。此外,上述檢測(cè)方法及檢測(cè)系統(tǒng)實(shí)現(xiàn)簡(jiǎn)單,便于在業(yè)內(nèi)推廣應(yīng)用。
上述說(shuō)明僅針對(duì)于本發(fā)明的優(yōu)選實(shí)施例,并不在于限制本發(fā)明的保護(hù)范圍。本領(lǐng)域技術(shù)人員可作出各種變形設(shè)計(jì),而不脫離本發(fā)明的思想及附隨的權(quán)利要求。