利用模糊理論對欺詐網(wǎng)頁識別的方法與流程

文檔序號：12748389閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>利用模糊理論對欺詐網(wǎng)頁識別的方法與流程

技術(shù)特征：

1.一種利用模糊理論對欺詐網(wǎng)頁識別的方法，包括如下步驟：

步驟一：

用戶瀏覽完網(wǎng)頁，對網(wǎng)頁進(jìn)行評價做出用戶標(biāo)記：分別為“非欺詐網(wǎng)頁F”、“欺詐網(wǎng)頁S”、“模棱兩可B”或“不知道U”；

步驟二：

每個月末通過搜索引擎將當(dāng)月全部用戶標(biāo)記的數(shù)據(jù)集下載；

步驟三：

對數(shù)據(jù)集按每個網(wǎng)頁不同用戶標(biāo)記的數(shù)量分成若干的矩陣M_i，其中，i＝1，2，...，n；

步驟四：

對每個矩陣M_i：記作N，轉(zhuǎn)成模糊相似矩陣R，R的每個元素R_ij，其中i，j＝1，2，...，n，n∈R，計算公式包括：

$<mrow> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>=</mo> <mi>j</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>1</mn> <mo>-</mo> <mn>0.1</mn> <mo>*</mo> <mi>d</mi> <mrow> <mo>(</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>N</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>&NotEqual;</mo> <mi>j</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>$

其中，i，j＝1，2，...，n；n為N的行數(shù)；

$<mrow> <mi>d</mi> <mrow> <mo>(</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>N</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <mo>|</mo> <mrow> <msub> <mi>N</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>N</mi> <mrow> <mi>j</mi> <mi>k</mi> </mrow> </msub> </mrow> <mo>|</mo> </mrow>$

其中，i，j＝1，2，...，n；n為N的行數(shù)，m為N的列數(shù)；

步驟五：

模糊相似矩陣轉(zhuǎn)成模糊等價矩陣，公式如下：

b＝1,2,…,n；n為自熱數(shù)；p為R的行數(shù)；

直到滿足R^b*R^b?。絉^b條件，矩陣達(dá)到收斂；

步驟六：

將收斂的矩陣選取所有的置信水平值[0,1]，計算截矩陣；

步驟七：

對于每個截矩陣，聚類產(chǎn)生多個集合，依次從每個集合中選取出第一個站點人工判斷是欺詐網(wǎng)頁還是非欺詐網(wǎng)頁，若是欺詐網(wǎng)頁則認(rèn)為該集合屬于欺詐網(wǎng)頁；若是非欺詐網(wǎng)頁則認(rèn)為該集合屬于非欺詐網(wǎng)頁。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)