一種可疑洗錢賬戶的確定方法及裝置與流程

文檔序號：11831677閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種可疑洗錢賬戶的確定方法及裝置與流程

技術(shù)特征：

1.一種可疑洗錢賬戶的確定方法，其特征在于，包括：

獲取待偵測金融網(wǎng)絡(luò)中的n個(gè)數(shù)據(jù)樣本，其中，一個(gè)數(shù)據(jù)樣本用于表示一個(gè)賬戶在設(shè)定時(shí)間段的設(shè)定時(shí)長內(nèi)的交易信息，n為大于1的整數(shù)；

根據(jù)每個(gè)數(shù)據(jù)樣本的加權(quán)系數(shù)，將所述n個(gè)數(shù)據(jù)樣本劃分為c₁類數(shù)據(jù)樣本，其中c₁滿足使得劃分得到的所述c₁類數(shù)據(jù)樣本對應(yīng)的平均信息熵最小，所述加權(quán)系數(shù)用于表示一個(gè)數(shù)據(jù)樣本對分類的影響程度，所述平均信息熵是根據(jù)所有數(shù)據(jù)樣本的偏向度得到的，所述偏向度用于表示一個(gè)數(shù)據(jù)樣本偏向聚類中心的程度；

確定所述c₁類數(shù)據(jù)樣本中的孤立點(diǎn)數(shù)據(jù)樣本，并將所述孤立點(diǎn)數(shù)據(jù)樣本對應(yīng)的賬戶確定為可疑洗錢賬戶。

2.如權(quán)利要求1所述的方法，其特征在于，所述根據(jù)每個(gè)數(shù)據(jù)樣本的加權(quán)系數(shù)，將所述n個(gè)數(shù)據(jù)樣本劃分為c₁類數(shù)據(jù)樣本，包括：

針對所述n個(gè)數(shù)據(jù)樣本的一個(gè)分類值c，根據(jù)每個(gè)數(shù)據(jù)樣本的加權(quán)系數(shù)及模糊C均值聚類算法，將所述n個(gè)數(shù)據(jù)樣本劃分為c類數(shù)據(jù)樣本；確定所述c類數(shù)據(jù)樣本中每個(gè)數(shù)據(jù)樣本分別對所述c類數(shù)據(jù)樣本的c個(gè)聚類中心的偏向度；并根據(jù)確定的所有偏向度，確定所述c類數(shù)據(jù)樣本對應(yīng)的平均信息熵；

將對應(yīng)的平均信息熵最小的c類數(shù)據(jù)樣本作為所述c₁類數(shù)據(jù)樣本。

3.如權(quán)利要求2所述的方法，其特征在于，所述根據(jù)每個(gè)數(shù)據(jù)樣本的加權(quán)系數(shù)及模糊C均值聚類算法，將所述n個(gè)數(shù)據(jù)樣本劃分為c類數(shù)據(jù)樣本，包括：

使用隨機(jī)數(shù)初始化所述n個(gè)數(shù)據(jù)樣本對應(yīng)的隸屬度矩陣，以及將所述n個(gè)數(shù)據(jù)樣本對應(yīng)的目標(biāo)函數(shù)值設(shè)定為預(yù)設(shè)值；

根據(jù)所述隸屬度矩陣，將所述n個(gè)數(shù)據(jù)樣本劃分為c類數(shù)據(jù)樣本，以及確定所述c類數(shù)據(jù)樣本中每個(gè)類的聚類中心；

根據(jù)所述c類數(shù)據(jù)樣本及所述c類數(shù)據(jù)樣本中每個(gè)類的聚類中心，更新所述目標(biāo)函數(shù)值；

若確定所述目標(biāo)函數(shù)值的更新變化量小于或等于變化量閾值，則得到所述c類數(shù)據(jù)樣本；

若確定所述目標(biāo)函數(shù)值的變化量大于所述變化量閾值，則根據(jù)隸屬度矩陣更新公式，更新所述隸屬度矩陣，并返回到根據(jù)所述隸屬度矩陣，將所述n個(gè)數(shù)據(jù)樣本劃分為c類數(shù)據(jù)樣本，以及確定所述c類數(shù)據(jù)樣本中每個(gè)類的聚類中心的步驟。

4.如權(quán)利要求3所述的方法，其特征在于，所述模糊C均值聚類算法對應(yīng)的目標(biāo)函數(shù)為：

$<mrow> <mi>J</mi> <mo>=</mo> <msub> <mi>J</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <mi>U</mi> <mo>,</mo> <msub> <mi>v</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>v</mi> <mn>2</mn> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>v</mi> <mi>c</mi> </msub> <mo>,</mo> <mi>X</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>c</mi> </munderover> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>w</mi> <mi>j</mi> </msub> <msubsup> <mi>μ</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>m</mi> </msubsup> <msubsup> <mi>d</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mn>2</mn> </msubsup> <mo>,</mo> </mrow>$

$<mrow> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>c</mi> </munderover> <msub> <mi>μ</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>&ForAll;</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>n</mi> <mo>;</mo> <mn>1</mn> <mo>≤</mo> <mi>j</mi> <mo>≤</mo> <mi>n</mi> <mo>;</mo> </mrow>$

其中，μ_ij為數(shù)據(jù)樣本x_j對第i個(gè)聚類的隸屬度，{v₁,v₂,…,v_c}為各個(gè)聚類的聚類中心，U是一個(gè)c*n的隸屬矩陣且μ_ij為U中的元素，X為所述n個(gè)數(shù)據(jù)樣本的集合，w_j為數(shù)據(jù)樣本x_j的加權(quán)系數(shù)，m為預(yù)設(shè)的加權(quán)指數(shù)，d_ij為第i個(gè)聚類中心與數(shù)據(jù)樣本x_j之間的歐氏距離。

5.如權(quán)利要求1所述的方法，其特征在于，所述確定所述c₁類數(shù)據(jù)樣本中的孤立點(diǎn)數(shù)據(jù)樣本，包括：

根據(jù)所述c₁類數(shù)據(jù)樣本中每類數(shù)據(jù)樣本的數(shù)量，將所述c₁類數(shù)據(jù)樣本劃分為大類數(shù)據(jù)樣本和小類數(shù)據(jù)樣本；

針對所述大類數(shù)據(jù)樣本中的一個(gè)數(shù)據(jù)樣本，根據(jù)所述數(shù)據(jù)樣本所在聚類中數(shù)據(jù)樣本的數(shù)量，以及所述數(shù)據(jù)樣本與所述數(shù)據(jù)樣本所在聚類中數(shù)據(jù)樣本之間的歐式距離的最小值，確定所述數(shù)據(jù)樣本對應(yīng)的局部偏離值；

針對所述小類數(shù)據(jù)樣本中的一個(gè)數(shù)據(jù)樣本，根據(jù)所述數(shù)據(jù)樣本所在聚類中數(shù)據(jù)樣本的數(shù)量，以及所述數(shù)據(jù)樣本與所述大類數(shù)據(jù)樣本中數(shù)據(jù)樣本之間的歐式距離的最小值，確定所述數(shù)據(jù)樣本對應(yīng)的局部偏離值；

將所述c₁類數(shù)據(jù)樣本中局部偏離值大于偏離度閾值的所有數(shù)據(jù)樣本確定為所述孤立點(diǎn)數(shù)據(jù)樣本。

6.如權(quán)利要求1-4中任一項(xiàng)所述的方法，其特征在于，根據(jù)下列方式確定每個(gè)數(shù)據(jù)樣本的加權(quán)系數(shù)：

$<mrow> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>C</mi> <mi>i</mi> </msub> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>C</mi> <mi>i</mi> </msub> </mrow> </mfrac> <mo>,</mo> </mrow>$

$<mrow> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>N</mi> <mi>i</mi> </msub> <msup> <mi>r</mi> <mi>D</mi> </msup> </mfrac> <mo>,</mo> <msub> <mi>r</mi> <mi>min</mi> </msub> <mo><</mo> <mi>r</mi> <mo><</mo> <msub> <mi>r</mi> <mi>max</mi> </msub> <mo>,</mo> </mrow>$

r_min＝min{||x_i-x_j||},1≤i,j≤n，

r_max＝max{||x_i-x_j||},1≤i,j≤n；

其中，w_i表示數(shù)據(jù)樣本x_i的加權(quán)系數(shù)，C_i表示數(shù)據(jù)樣本x_i的粒子數(shù)密度，N_i表示以數(shù)據(jù)樣本x_i為球心，r為半徑的球體內(nèi)包含的數(shù)據(jù)樣本的數(shù)量且r值預(yù)先設(shè)定，D表示數(shù)據(jù)樣本x_i的維度，||x_i-x_j||為數(shù)據(jù)樣本x_i與數(shù)據(jù)樣本x_j之間的歐氏距離。

7.如權(quán)利要求1-4中任一項(xiàng)所述的方法，其特征在于，所述n個(gè)數(shù)據(jù)樣本中的任一個(gè)數(shù)據(jù)樣本可用下列部分或全部的內(nèi)容來表示：

總交易金額、總轉(zhuǎn)出金額、總轉(zhuǎn)入金額、交易金額離散系數(shù)、轉(zhuǎn)出金額離散系數(shù)、轉(zhuǎn)入金額離散系數(shù)、轉(zhuǎn)出頻率、轉(zhuǎn)入頻率；其中所述交易金額離散系數(shù)為所述數(shù)據(jù)樣本在設(shè)定時(shí)間段的設(shè)定時(shí)長內(nèi)交易金額方差與交易金額均值的比值，所述轉(zhuǎn)出金額離散系數(shù)為所述數(shù)據(jù)樣本在設(shè)定時(shí)間段的設(shè)定時(shí)長內(nèi)轉(zhuǎn)出金額方差與轉(zhuǎn)出金額均值的比值，所述轉(zhuǎn)入金額離散系數(shù)為所述數(shù)據(jù)樣本在設(shè)定時(shí)間段的設(shè)定時(shí)長內(nèi)轉(zhuǎn)入金額方差與轉(zhuǎn)入金額均值的比值。

8.如權(quán)利要求2所述的方法，其特征在于，根據(jù)下列公式確定所述c類數(shù)據(jù)樣本中每個(gè)數(shù)據(jù)樣本分別對所述c類數(shù)據(jù)樣本的c個(gè)聚類中心的偏向度：

$<mrow> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msubsup> <mi>d</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mn>2</mn> </msubsup> </mrow> </msup> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>c</mi> </munderover> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msubsup> <mi>d</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mn>2</mn> </msubsup> </mrow> </msup> </mrow> </mfrac> <mo>,</mo> </mrow>$

其中，p_ij表示數(shù)據(jù)樣本x_j對第i個(gè)聚類中心的偏向度，d_ij為第i個(gè)聚類中心與數(shù)據(jù)樣本x_j之間的歐氏距離。

9.如權(quán)利要求2所述的方法，其特征在于，根據(jù)下列公式確定所述c類數(shù)據(jù)樣本中每個(gè)類的聚類中心：

$<mrow> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>w</mi> <mi>j</mi> </msub> <msubsup> <mi>μ</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mn>2</mn> </msubsup> <msub> <mi>x</mi> <mi>j</mi> </msub> </mrow> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>w</mi> <mi>j</mi> </msub> <msubsup> <mi>μ</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mn>2</mn> </msubsup> </mrow> </mfrac> <mo>,</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>≤</mo> <mi>i</mi> <mo>≤</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

其中，v_i表示聚類中心，w_i表示數(shù)據(jù)樣本x_i的加權(quán)系數(shù)，μ_ij為數(shù)據(jù)樣本x_j對第i個(gè)聚類的隸屬度。

10.一種可疑洗錢賬戶的確定裝置，其特征在于，包括：

獲取單元，用于獲取待偵測金融網(wǎng)絡(luò)中的n個(gè)數(shù)據(jù)樣本，其中，一個(gè)數(shù)據(jù)樣本用于表示一個(gè)賬戶在設(shè)定時(shí)間段的設(shè)定時(shí)長內(nèi)的交易信息，n為大于1的整數(shù)；

劃分單元，用于根據(jù)每個(gè)數(shù)據(jù)樣本的加權(quán)系數(shù)，將所述n個(gè)數(shù)據(jù)樣本劃分為c₁類數(shù)據(jù)樣本，其中c₁滿足使得劃分得到的所述c₁類數(shù)據(jù)樣本對應(yīng)的平均信息熵最小，所述加權(quán)系數(shù)用于表示一個(gè)數(shù)據(jù)樣本對分類的影響程度，所述平均信息熵是根據(jù)所有數(shù)據(jù)樣本的偏向度得到的，所述偏向度用于表示一個(gè)數(shù)據(jù)樣本偏向聚類中心的程度；

可疑洗錢賬戶確定單元，用于確定所述c₁類數(shù)據(jù)樣本中的孤立點(diǎn)數(shù)據(jù)樣本，并將所述孤立點(diǎn)數(shù)據(jù)樣本對應(yīng)的賬戶確定為可疑洗錢賬戶。

11.如權(quán)利要求10所述的裝置，其特征在于，所述劃分單元，具體用于：

將對應(yīng)的平均信息熵最小的c類數(shù)據(jù)樣本作為所述c₁類數(shù)據(jù)樣本。

12.如權(quán)利要求11所述的裝置，其特征在于，所述劃分單元，具體用于：

根據(jù)所述隸屬度矩陣，將所述n個(gè)數(shù)據(jù)樣本劃分為c類數(shù)據(jù)樣本，以及確定所述c類數(shù)據(jù)樣本中每個(gè)類的聚類中心；

根據(jù)所述c類數(shù)據(jù)樣本及所述c類數(shù)據(jù)樣本中每個(gè)類的聚類中心，更新所述目標(biāo)函數(shù)值；

若確定所述目標(biāo)函數(shù)值的更新變化量小于或等于變化量閾值，則得到所述c類數(shù)據(jù)樣本；

13.如權(quán)利要求12所述的裝置，其特征在于，所述模糊C均值聚類算法對應(yīng)的目標(biāo)函數(shù)為：

14.如權(quán)利要求10所述的裝置，其特征在于，所述可疑洗錢賬戶確定單元，具體用于：

將所述c₁類數(shù)據(jù)樣本中局部偏離值大于偏離度閾值的所有數(shù)據(jù)樣本確定為所述孤立點(diǎn)數(shù)據(jù)樣本。

15.如權(quán)利要求10-13中任一項(xiàng)所述的裝置，其特征在于，所述裝置還包括加權(quán)系數(shù)確定單元，用于根據(jù)下列方式確定每個(gè)數(shù)據(jù)樣本的加權(quán)系數(shù)：

$<mrow> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>N</mi> <mi>i</mi> </msub> <msup> <mi>r</mi> <mi>D</mi> </msup> </mfrac> <mo>,</mo> <msub> <mi>r</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mo><</mo> <mi>r</mi> <mo><</mo> <msub> <mi>r</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>,</mo> </mrow>$

r_min＝min{||x_i-x_j||},1≤i,j≤n，

r_max＝max{||x_i-x_j||},1≤i,j≤n；

16.如權(quán)利要求10-13中任一項(xiàng)所述的裝置，其特征在于，所述n個(gè)數(shù)據(jù)樣本中的任一個(gè)數(shù)據(jù)樣本可用下列部分或全部的內(nèi)容來表示：

17.如權(quán)利要求11所述的裝置，其特征在于，所述裝置還包括偏向度確定單元，用于根據(jù)下列公式確定所述c類數(shù)據(jù)樣本中每個(gè)數(shù)據(jù)樣本分別對所述c類數(shù)據(jù)樣本的c個(gè)聚類中心的偏向度：

其中，p_ij表示數(shù)據(jù)樣本x_j對第i個(gè)聚類中心的偏向度，d_ij為第i個(gè)聚類中心與數(shù)據(jù)樣本x_j之間的歐氏距離。

18.如權(quán)利要求11所述的裝置，其特征在于，所述裝置還包括聚類中心確定單元，用于根據(jù)下列公式確定所述c類數(shù)據(jù)樣本中每個(gè)類的聚類中心：

其中，v_i表示聚類中心，w_i表示數(shù)據(jù)樣本x_i的加權(quán)系數(shù)，μ_ij為數(shù)據(jù)樣本x_j對第i個(gè)聚類的隸屬度。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種可疑洗錢賬戶的確定方法及裝置與流程