亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于分解的多目標進化模糊規(guī)則分類方法

文檔序號:8488141閱讀:510來源:國知局
一種基于分解的多目標進化模糊規(guī)則分類方法
【技術領域】
[0001] 本發(fā)明屬于數(shù)據(jù)挖掘中的分類技術領域,特別涉及一種在不平衡數(shù)據(jù)分類領域采 用進化算法對模糊分類器進行優(yōu)化的方法。具體是一種基于分解的多目標進化模糊規(guī)則分 類方法。主要用于生物醫(yī)學識別、腫瘤檢測、信用卡欺詐檢測、垃圾短信識別等領域中存在 的不平衡數(shù)據(jù)的分類。
【背景技術】
[0002] 隨著科技的不斷進步,數(shù)據(jù)挖掘技術越來越廣泛的應用于我們的生產(chǎn)生活中,而 作為數(shù)據(jù)挖掘領域的一個重要的分支,分類技術也越來越受到人們的重視。分類技術是指 利用已知類別的數(shù)據(jù)訓練分類模型,然后用此分類模型對未知數(shù)據(jù)進行類別預測的技術。 常見的應用如:語音識別、圖像識別、生物醫(yī)學識別、腫瘤檢測、信用卡欺詐檢測、垃圾短信 識別等都是應用分類技術的例子,可見分類技術與我們的工作和生活息息相關,它能提高 我們的工作效率和生活質(zhì)量,給我們的生活帶來極大地便利。而現(xiàn)實生活中大部分的分類 問題又都屬于不平衡分類問題,不平衡分類問題是指待分類的兩類中某一類(多數(shù)類)的 數(shù)據(jù)規(guī)模遠遠大于另一類(少數(shù)類)的數(shù)據(jù)規(guī)模,例如上面提到的生物醫(yī)學識別、腫瘤檢 測、信用卡欺詐檢測、垃圾短信識別。由于不平衡分類問題特有的不平衡結構,使得常規(guī)的 分類技術如決策樹C4. 5等更偏向于將未知數(shù)據(jù)預測為多數(shù)類而降低識別精度。
[0003] 近年來基于模糊規(guī)則的模糊分類技術被應用于生物醫(yī)學檢測、腫瘤檢測、信用卡 欺詐檢測、垃圾短信識別等不平衡問題分類領域并取得了較好的效果。但由于不平衡問題 中多數(shù)類數(shù)據(jù)集所包含的數(shù)據(jù)與少數(shù)類數(shù)據(jù)集所包含的數(shù)據(jù)在數(shù)量上的不平衡性,導致模 糊分類技術的識別精度很難提高;并且由于不平衡問題的特殊性,評價分類結果的指標也 由單標準(分類精度)變成了多標準(特異度FPR、靈敏度TPR),若用單個模糊分類器對 不平衡問題進行類別預測,就會導致對分類結果的評價不全面的問題。而多目標進化算法 是一種基于種群的迭代優(yōu)化算法,通過對分類器的多次進化迭代可以提高分類器的識別精 度;并且該算法針對多標準情況能夠同時優(yōu)化多個模糊分類器,有效彌補了單個模糊分類 器對分類結果的評價不全面的缺點。但由于多目標進化算法較為復雜,需要多次迭代優(yōu)化, 使得算法運行時間較長,導致現(xiàn)有分類方法在處理腫瘤檢測、誤差檢測、信用卡欺詐檢測、 垃圾短信識別等不平衡問題時不能兼顧較高的識別精度與較快的運行速度。數(shù)據(jù)分類過程 中由于算法復雜、運行速度慢,直接影響了數(shù)據(jù)分類的效率和限制了分類算法的廣泛應用。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的是針對生物醫(yī)學識別、腫瘤檢測、信用卡欺詐檢測、垃圾短信識別存 在數(shù)據(jù)不平衡現(xiàn)象的應用中少數(shù)類不易被識別的問題,提出了一種識別精度高、運行速度 快的基于分解的多目標進化模糊規(guī)則分類方法。
[0005] 本發(fā)明是一種基于分解的多目標進化模糊規(guī)則分類方法,其特征在于,數(shù)據(jù)分類 過程包括有如下步驟:
[0006] 步驟1.從某一技術領域中采集或獲取被測訓練數(shù)據(jù)集X和測試數(shù)據(jù)集X',訓練 數(shù)據(jù)集用來訓練分類器,測試數(shù)據(jù)集用來檢測訓練好的分類器的性能,兩個數(shù)據(jù)集所包含 的數(shù)據(jù)具有相同的數(shù)據(jù)格式,其數(shù)據(jù)格式為Xi=[XU,...,Xi,n,y],Xi為任一數(shù)據(jù)集中的第 i條數(shù)據(jù),其中Xu,. ..,Xi,n為數(shù)據(jù)Xn個屬性值,y為數(shù)據(jù)xi所屬類別的類標。
[0007] 步驟2.分別將訓練數(shù)據(jù)集X和測試數(shù)據(jù)集X'的n個屬性值歸一化到[0, 1]內(nèi), 并將訓練數(shù)據(jù)集X按類別的類標分成多數(shù)類數(shù)據(jù)集Dmgative與少數(shù)類數(shù)據(jù)集Dp()sitiTC,多數(shù)類 數(shù)據(jù)集與少數(shù)類數(shù)據(jù)集所包含的數(shù)據(jù)個數(shù)分別為Nn6gatiV6、Np()sitiV6。
[0008] 步驟3.人為設定忽略概率pi,piG[0, 1],人為設定模糊分區(qū)數(shù)par,par辛0,取 值為正整數(shù),人為初始化模糊分區(qū)的隸屬度函數(shù)為三角隸屬度函數(shù)。
[0009] 步驟4.初始化由pop個模糊分類器構成的原始種群P,每個模糊分類器代表一條 染色體chroh,hG{1,? ? ?,pop},每條染色體包含R條模糊規(guī)則1^=[ri;1,? ? ?,ri,n,Wi, 1J, ie{1,...,R},模糊規(guī)則ri的前n項屬性值,記錄了n個模糊分區(qū)標號,每個屬性代表一個 基因,模糊分區(qū)標號的范圍為{0,...,par},Wi為模糊規(guī)則的權重,1i為模糊規(guī)則所屬類別 的類標,其中每一條模糊規(guī)則的權重采用具有加權因子的模糊規(guī)則權重公式來確定,其中 模糊規(guī)則的權重&,iG{1,. . .,R}。
[0010] 步驟5.人為設定迭代終止條件termination,初始迭代次數(shù)t= 1,迭代步長也為 1,理想點idealpoint= [0, 1] 〇
[0011] 步驟6.采用分解機制,根據(jù)原始種群P的大小pop,劃分出pop個方向向量,其中 染色體chroh,hG{1,? ? ?,pop}對應的方向向量為1
【主權項】
1. 一種基于分解的多目標進化模糊規(guī)則分類方法,其特征在于,數(shù)據(jù)分類過程包括有 如下步驟: 步驟1.從某一技術領域中采集或獲取被測訓練數(shù)據(jù)集X和測試數(shù)據(jù)集X',兩個數(shù)據(jù) 集所包含的數(shù)據(jù)具有相同的數(shù)據(jù)格式,其數(shù)據(jù)格式為Xi=[XU,...,Xi,n,y],Xi為兩個數(shù)據(jù) 集中的任意一條數(shù)據(jù),其中Xu,. . .,Xi,n為數(shù)據(jù)x^勺n個屬性值,y為數(shù)據(jù)xi所屬類別的類 標; 步驟2.分別將訓練數(shù)據(jù)集X和測試數(shù)據(jù)集X'的n個屬性值歸一化到[0,1]內(nèi),并將 訓練數(shù)據(jù)集X按類別的類標分成多數(shù)類數(shù)據(jù)集Dmgative與少數(shù)類數(shù)據(jù)集Dp()SitiTC,多數(shù)類數(shù)據(jù) 集與少數(shù)類數(shù)據(jù)集所包含的數(shù)據(jù)個數(shù)分別為Nn6gatiV6、Np()SitiV6; 步驟3.人為設定忽略概率pi,piG[〇,1],人為設定模糊分區(qū)數(shù)par,par辛0,取值為 正整數(shù),人為設定模糊分區(qū)的隸屬度函數(shù)為三角隸屬度函數(shù); 步驟4.初始化由pop個模糊分類器構成的原始種群P,每個模糊分類器代表一條染色 體chroh,hG{1,? ? ?,pop},每條染色體包含R條模糊規(guī)則1^=[rm? ? ?,rm,Wi,1J,iG{ 1,. . .,R},模糊規(guī)則ri的前n項屬性值,記錄了n個模糊分區(qū)標號,模糊分區(qū)標號的范圍為 {0,...,par},Wi為模糊規(guī)則的權重,1i為模糊規(guī)則所屬類別的類標,其中每一條模糊規(guī)則 的權重采用具有加權因子的模糊規(guī)則權重公式來確定; 步驟5.人為設定迭代終止條件termination,初始迭代次數(shù)t= 1,迭代步長也為1,理 想點idealpoint= [0, 1]; 步驟6.采用分解機制,根據(jù)原始種群P的大小pop,劃分出pop個方向向量,其中染色 體chroh,hG{l,...,p〇p}對應的方向向量夕
步驟7.對原始種群P執(zhí)行進化操作,得到子代染色體chrohn,chroh,"_2,chroh,mU_i,chroh,mu_2,hG{1,. . .,pop},依次用子代染色體對原始種群中的所有染色體 chroh,hG{1,. . .,pop}采用切比雪夫更新方式進行更新,最終得到由pop條染色體 chro'h,hG{l,...,p〇p}組成的進化種群P'; 步驟8.若迭代次數(shù)t小于迭代終止條件termination,則迭代次數(shù)t加1,并將進化種 群P記為原始種群P,將染色體chrc/h,hG{1,? ? ?,pop}記為chroh,hG{1,? ? ?,pop}, 返回執(zhí)行步驟7,若迭代次數(shù)t等于迭代終止條件termination,執(zhí)行步驟9 ; 步驟9.將進化種群P'中的所有染色體chro'11,11= 1,...4(^依次對測試數(shù)據(jù) 集X'進行分類,得到pop條分類結果resulth=
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1