專利名稱:粗糙集擴展模型中近似集動態(tài)更新方法
技術領域:
本發(fā)明涉及一種近似集動態(tài)更新方法。
背景技術:
Pawlark提出的粗糙集理論可以處理不確定和不精確性問題,在知識發(fā)現(xiàn)、機器學習、決策分析等方面得到了日益廣泛的應用[Pawlak Zdzistaw. Rough sets [J], International Journal of Computer and Information Sciences,1982,11 (5) 341-356]。為了適應實際應用的需求,許多研究者提出了各種推廣的粗糙集模型。如 Bonikowski等首先提出了覆蓋粗糙集模型,并給出了其基本概念及相關性質[Zbigniew Boinkowski, Edward Bryniarski, Urszula Wybraniedc-Skardowska, Extensions and intentions in the rough set theory [J]. Information Science,1998,107 :149-167]。 Zhu等給出了覆蓋粗糙集中約簡的概念和方法及相關概念之間的聯(lián)系[Willam Zhu, Fei-yue Wang. Reduction and axiomization of covering generalized rough sets[J]. Information Science,2003,152 :217-230 ;William Zhu.Relationship among basic concepts in covering-based rough sets[J]. Information Sciences,2009,179 (14) M78-2486]。陳文等討論了覆蓋粗糙集上近似的定義方法,提出了覆蓋粗糙集最小上近似的概念 等等。另一方面,人們在基于經典粗糙集及不同的擴展粗糙集模型下的動態(tài)知識更新方面做了大量的工作,如Li等實現(xiàn)了多個屬性同時增刪時粗糙集模型中近 ^^WiIfi^Sfr^ [Li Tianrui, Ruan Da, Greet Wets, et al. A rough set based characteristic relation approach for dynamic attribute generalization in data mining [J], Knowledge-Based Systems, 2007, 20 (2) :485-494.],并討論了屬性值變化下經典粗糙集和優(yōu)勢關系粗糙集模型下近似集的動態(tài)更新[Chen Hongmei, Li Tianrui, Qiao Shaojie,et al. A rough set based dynamic maintenance approach for approximations in coarsening and refining attribute valves[J]. International Journal of Intelligent System. 2010,25(10) : 1005-1026 ;季曉嵐,李天瑞,鄒維麗等.優(yōu)勢關系下屬性值粗化細化時近似集分析[J].計算機工程.2010,36 (1 :33-35]?,F(xiàn)有的基于覆蓋廣義粗糙集的理論體系有待進一步完善。
發(fā)明內容
本發(fā)明的目的是提供一種粗糙集擴展模型中近似集動態(tài)更新方法,以進一步完善基于覆蓋廣義粗糙集的理論體系,使其能夠更好地應用于實際的需求。本發(fā)明方法在已有理論體系的基礎上,分析對象的鄰域(對象的最小描述的交集)、邊界域與近似集的關系,給出了覆蓋粗糙集模型中近似集的增量更新方法。本發(fā)明為解決上述技術問題采取的技術方案是本發(fā)明所述的粗糙集擴展模型中近似集動態(tài)更新方法是基于以下定義來實現(xiàn)的定義1 一個信息系統(tǒng)以四元組S = (U,A,V,f)表示,其中,U =U = Ix1, &,...,xn}為對象的非空有限集合,稱為論域;A = {α I α e Α}稱為屬性集= 是信息函數(shù) f的值域,而Va表示值域;=表示信息系統(tǒng)的信息函數(shù),fa為屬性
α的信息函數(shù);定義2 設U是一有限非空論域,C是U上的一個子集族,若0任C且U C = U,則稱 C為論域U的一個覆蓋,稱元組<υ,O為覆蓋近似空間;定義3 設<U,O為覆蓋近似空間,χ e U,則定義χ關于<U,O的最小描述為 md(x) = {KeC:xeKA/SeC A(xeSAScK^K = S)}定義4 設<U,O為覆蓋近似空間,對任意χ e U,N(x) = η {K e C ;χ e K}稱為 χ的鄰域;結合定義3和定義4,容易得到N(X) = Π md(x);定義3 設<U,O為覆蓋近似空間,χ e U,則定義χ關于<U,O的最小描述為 md(x) = {KsC:xsK a/Ss C a(xs S AScK^K = S)]定義4 設<U,C>為覆蓋近似空間,對任意χ e U,N(x) = η {K e C ;χ e K}稱為 χ的鄰域;結合定義3和定義4,容易得到N(X) = Π md(x);定義5:設U是一有限非空論域,C是U上的一個子覆蓋,對于任意的;T£f/,X關于覆蓋近似空間〈U,O的下近似£(X)和上近似C(X)分別定義為C(X) = {xeU\^]md{x) c X},
C(X) = {xef/| Hmd(X) Π X 矣 0}X關于近似空間<U,C>的正域ρ0 ^(Χ),負域ne&(X)和邊界域bnc(X)分別定義為 Posc(X) = C(X),negc(X) =~ C(X),bnc (X) = C(X) - C(X);即覆蓋粗糙集模型是Pawlak粗糙集模型的推廣;當C(X) = G(X)時,稱X關于近似空間<U,O可定義的,否則稱為粗糙的;定義6 設覆蓋近似空間<U,C>, U是一有限非空論域,C是由屬性集B生成的覆蓋元所構成的U上的一個子覆蓋,對于任意的;T£f/,X e X關于屬性集B的鄰域為Nb(X) = η {K e C ;X e K}定義7 設覆蓋近似空間<U,C>, U是一有限非空論域,C是由屬性集B生成的覆蓋元所構成的U上的一個子覆蓋,對于任意的;r ,X關于屬性集B的下近似集、上近似集、 下邊界和上邊界分別定義為C,(X) = {xeU\NB(x)QX},
C^(X) = {xeU\NB(x)r\X^0}4cb (X)=X-Cb(X) 'ACb (X) = C^(X) - XX關于屬性集B的正域(X),負域(X)和邊界域Η·β (X)分別定義為poscb (X) = Cg(X) megcb (X) =~ C~B(X) ,bnCs (X) = C~B(X) ~C (X);
所述方法的具體過程為步驟A、屬性集變化時近似集的性質分析過程為在覆蓋粗糙集中,一個覆蓋表示知識庫中的某種知識,覆蓋元代表知識粒,由覆蓋生成的集合逼近則代表基于知識庫對某事物的刻畫和描述;在信息系統(tǒng)中,根據(jù)對象的屬性值生成覆蓋元,所有的屬性生成的覆蓋元放在一起,構成論域U上的一個覆蓋,屬性集元素個數(shù)越多,則覆蓋元個數(shù)越多,由覆蓋生成的集合逼近則對某事物的刻畫和描述越精確; 當屬性集變化時,由屬性構成的覆蓋發(fā)生變化,近而影響對給定的集合的上、下近似集及邊界域的變化;下面當屬性集變化時對近似集性質進行分析設<U,C>是一個覆蓋近似空間,即U是一個非空有限集合。A是U的屬性集,對于 MxeU ’ P = {al,a2,-,an}^A,則 Cp =IKail,KwsK0mVK0^Kai2,...,Kam,...,Kani,Ka), ···,…,^^^構成的 U —個覆蓋,向屬性集P添加一個屬性a,C{a} = {Kal,Ka2,-,KaJ,則Cp U {a} = Cp U C{a}仍是U的一個覆蓋, 此時有,7Vp(x)2#puw(x),且有Npu{a}(x) =Np(x) η N{a} (χ) 0相反,若從P中刪除一個屬性, 則覆蓋元減少,NP{x) c Νρ_{α}(χ);設屬性 a e λ, ρ ^ A .go ρ .貝IjCpOO £ CPU{a}證明對于屬性集P,其構成的覆蓋為CP,對于屬性集P U {a},其構成的覆蓋為 Cp U {a} = Cp U C {a},且 Cp c Cpuw。設 Vx e Cf(X),則有 TVp (χ) £ X。由引理 1 知,乂 (x) 2 (χ),
則有&,即 χ e Cpυ ial ⑴,所以有£CPU{a](X);設Vxe Q^(X),則有 &⑴ Π X # 0,Np (χ) 2 Νρ[){α} (χ),則 TVp ⑴ Π X # 0,即 xeC~p(X);所以有5(1)2^00 ;設屬性a e Κ,Ρ^Α,α^Ρ J1J^cp W □ 4Cpuw (X);設屬性a e λ,ρ^Α P J'JAc,(X)□ Kcpuw(X);設屬性a e λ,Ρ^Α,α^Ρ J1J0^p (^) □ (^);設屬性集尸e P,則&(I) 3 Cp_{a](X)£ C^(X);
設屬性集尸 ^A,a e P,則 (X) £ (X);設屬性集尸£ 乂,a e P,則(X) c (X);設屬性集尸£ 乂,a e P,貝丨(X) £ bnCpAa) (X);步驟B、屬性集變化時近似集增量更新方法過程設覆蓋近似空間 <仏0,1£^/,通過下面的定理來實現(xiàn)乂的上、下近似的更新設屬性 a e Κ,Ρ^Α,α^Ρ M\Cp υ ia} (X) = Ce(X) U Cial(X) U Y其中;T= {x U TVpuw(X) c Xaxg U TVp (Χ)門(Χ)};
χεΧΧΕΧ設屬性集尸£ j,a e ρ,貝丨JCp_{a](X) = Cl(X) - Ac^aj (X)設屬性a e A,尸£ j, ^尸,則Q^(X) = Q(X)-Z
其中Z = {χ |7VPUw (χ) Π X * 0 λ χ e TVp (χ) - TVpuw (χ)};設屬性集尸£ j,a e P,貝丨J=;步驟C、具體過程描述為當屬性增加時,信息系統(tǒng)關于新增屬性會形成新的覆蓋元,這些覆蓋元構成論域的一個覆蓋,那么新增屬性所形成的覆蓋元與原來屬性所形成的覆蓋元合并在一起也構成論域的一族覆蓋。對于近似集的更新,如果是采用靜態(tài)增量更新方法,那么,系統(tǒng)會把所有的覆蓋元合并在一起從新計算給定集合的上近似集、下近似集,會花費很多時間和空間去重復計算,為了節(jié)省時間和空間,以便更及時地去更新信息,則宜采用動態(tài)的更新方法,因為在屬性增加時,增加了新的覆蓋元,根據(jù)上近似集、下近似的定義及求解原理知,上近似集、下近似是所包含對象的最小描述的交集,那么所包含對象的最小描述的交集即對象的鄰域。屬性增加,對于給定集合中所包含的對象的鄰域的并集形成一種分解,如果增加屬性后集合X所包含的對象集的鄰域的并集大小沒有改變,那么說明添加的屬性對集合X的上近似集、下近似集沒有影響,即集合X的上近似集、下近似集大小不變;如果增加屬性后集合X所包含的對象集的鄰域的并集發(fā)生了變化,則說明添加屬性后對集合X的上近似集、下近集產生了影響,即集合X的上近似集、下近似集發(fā)生了變化,此時根據(jù)對象的鄰域與近似集的關系,利用動態(tài)增量更新方法對近似集進行增量更新效率更高。當某一屬性刪除時,由刪除該屬性后所形成的覆蓋元隨之減少,分析屬性刪除后,集合X所包含的對象集的鄰域的并集是否發(fā)生了變化,如果對象的鄰域的并集保持原大小,則說明屬性刪除對集合X的上近似集、下近似集并沒有產生影響,則集合X的上近似集、下近似集的大小保持不變;如果刪除某一屬性后對于給定集合中所包含的對象的鄰域變大,此時,可以利用對象的鄰域、 集合的邊界域與近似集的關系,利用近似集動態(tài)增量更新算法進行更新;步驟Cl、屬性增加時近似集增量更新算法1.靜態(tài)新增屬性算法描述輸入S=(U,A,V,f),X;輸出,巧(X);具體步驟步驟1、計算由屬性集PeW中單個屬性形成的覆蓋元,構成U的一個覆蓋Cp ;步驟2、對于 Xi e U,計算 N(Xi);步驟3、若\ e U,且Λ^_)£Ζ,則將對象\加入到對象子集X的下近似集中,即 {xt} ^ C1(X);步驟4、若\ e U,且門1矣0,則將對象Xi加入到對象子集χ的上近似集中, 即{如^⑷;步驟6、增加一個新的屬性a產生新的覆蓋元,合并原來的覆蓋構成一個新的覆蓋 Cv .步驟7、重復步驟2、3、4,輸出G(X),算法結束;2.動態(tài)增量更新算法描述輸入S=(U,A,V,f),X;
輸出^^(1),0(;0;具體步驟步驟1、計算由屬性集PeW中單個屬性形成的覆蓋元,構成U的一個覆蓋;步驟2、對于 Xi e U,計算 N(Xi);步驟3、若\ e X,且#(χ)£Ζ,則將對象\加入到對象子集X的下近似集中,即 {xt} ^ C1(X);步驟4、若\ e U,且#h)m#0,則將對象\加入到對象子集χ的上近似集中, 即{如^⑷;步驟5、增加一個新的屬性a產生新的覆蓋元,構成一個新的覆蓋,計算N{a} (χ);步驟6、如果 (x)n (χ)) = Ux Np (x) JlJW) = 'C;(X) = ΓΡ(Χ),轉向第 8
止
少;步驟7、如果2(Λ^(χ)ηΛ^(χ))〔2Α(χ),如果£Ζ, 則= C1^U(Np(Χ)ηΝ α}(X));如果JVp(X)ΠJViai(Χ)Γ\Χ^0, 則巧(Z) = C~P(X) - (Np(χ) -N糊(χ));步驟8、輸出^(Z) ,C;(X),算法結束;步驟C2、屬性減少時近似集動態(tài)增量更新算法1.靜態(tài)刪除屬性算法描述輸入S=(U,A,V,f),X;輸出&(X),G(Z);具體步驟為步驟1、計算由屬性集PeW中單個屬性形成的覆蓋元,構成U的一個覆蓋Cp ;步驟2、對于 Xi e U,計算 N(Xi);步驟3、計算X的上、下近似仏(X),〔(Ζ);步驟4、刪除一個屬性a,構成一個新的覆蓋Q;步驟5、重復步驟1、2、3,輸出,算法結束;2.動態(tài)刪除屬性增量更新算法輸入S=(U,A,V,f),X;輸出&(X),G(Z);具體步驟步驟1、計算由屬性集PeW中單個屬性形成的覆蓋元,構成U的一個覆蓋Cp ;步驟2、Vx e f/,計算 Np (χ);步驟3、計算X的上、下近似仏(X),〔(Ζ);步驟4、刪除一個屬性a,構成一個新的覆蓋Q;步驟5、計算 NP_{a} GO,若=,股⑷= Q(X) ^(X) = TAX),轉
向步驟7 ;步驟6、若 U (X)〕U A(x),則 C;_[a](X) = {χe Νρ_{α}(χ) | Νρ_{α}(χ) c Χ},Cp.ia}(X) = {xe ΝΡ_{α}(χ) I NP_{a}(χ) ΠX 矣 0};步驟7、輸出^(X),算法結束。本發(fā)明的有益效果是本發(fā)明方法給出了當屬性集增加或減少時,在覆蓋廣義粗糙集模型中近似集的動態(tài)變化趨勢及近似集的動態(tài)增量更新方法,不僅適用于單屬性增加刪除時近似集的增量更新,而且也適用于多個屬性變化的情況,通過實例驗證了這種方法的可行性,通過實驗仿真驗證所提出方法的性能,且從給出的實例的實驗仿真說明,基于覆蓋廣義粗糙集理論的動態(tài)增量更新方法不但有效,而且在效率上也有所提高。
圖1屬性增加時靜態(tài)更新算法與動態(tài)更新算法比較圖,圖2屬性減少時靜態(tài)更新算法與動態(tài)更新算法比較圖。
具體實施例方式具體實施方式
一如圖1所示,本實施方式所述的粗糙集擴展模型中近似集動態(tài)更新方法是基于以下定義來實現(xiàn)的定義1 一個信息系統(tǒng)以四元組S = (U,Α,V,f)表示,其中,U =U = Ix1, &,..., xn}為對象的非空有限集合,稱為論域;A = {α I α e Α}稱為屬性集= 是信息函數(shù) f的值域,而Va表示值域;=表示信息系統(tǒng)的信息函數(shù),fa為屬性 α的信息函數(shù);定義2 設U是一有限非空論域,C是U上的一個子集族,若0任C且U C = U,則稱 C為論域U的一個覆蓋,稱元組〈U,O為覆蓋近似空間;定義3 設<U,O為覆蓋近似空間,χ e U,則定義χ關于<U,O的最小描述為 md(x) = {KeC:xeKA/Se C A(xeSAScK^K = S)}定義4 設<U,O為覆蓋近似空間,對任意χ e U,N(x) = η {K e C ;χ e K}稱為 χ的鄰域。結合定義3和定義4,容易得到N(X) = Π md(x);定義3 設<U,O為覆蓋近似空間,χ e U,則定義χ關于<U,O的最小描述為 md(x) = {KsC:xsK a/Ss C a(xs S AScK^K = S)]定義4 設<U,C>為覆蓋近似空間,對任意χ e U,N(x) = η {K e C ;χ e K}稱為 χ的鄰域;結合定義3和定義4,容易得到N(X) =Hmd(X);定義5:設U是一有限非空論域,C是U上的一個子覆蓋,對于任意的;T£f/,X關于覆蓋近似空間〈U,O的下近似以X)和上近似C(X)分別定義為C(X) = (XGiZin^(X)CX)jC(X) = {xeU\Hmd(X) Π X 矣 0}X關于近似空間<U,C>的正域pc^c(X),負域Iie^(X)和邊界域bnc(X)分別定義為 Posc(X) = C(X),
negc(X) =~ C(X),bnc (X) = C(X) - C(X);即覆蓋粗糙集模型是Pawlak粗糙集模型的推廣;當C(X) = G(X)時,稱X關于近似空間<U,O可定義的,否則稱為粗糙的;定義6 設覆蓋近似空間<U,C>, U是一有限非空論域,C是由屬性集B生成的覆蓋元所構成的U上的一個子覆蓋,對于任意的;T£f/,X e X關于屬性集B的鄰域為Nb(X) = η {K e C ;X e K}定義7 設覆蓋近似空間<U,C>, U是一有限非空論域,C是由屬性集B生成的覆蓋元所構成的U上的一個子覆蓋,對于任意的;r ,X關于屬性集B的下近似集、上近似集、 下邊界和上邊界分別定義為C,(X) = {xeU\NB(x)QX},C^(X) = {xeU\NB(x)r\X ^0}4Cb (X)=X-Cb(X) ,Acb (X) = C^(X) _ XX關于屬性集B的正域/^cb (I),負域·Scb(I)和邊界域Κ·Β(Ι)分別定義為posCB (X) = Cg(X),mgCB (X) =~ C~B(X) ,bnCs (X) = C~B(X) ~C (X);所述方法的具體過程為步驟A、屬性集變化時近似集的性質分析過程為在覆蓋粗糙集中,一個覆蓋表示知識庫中的某種知識,覆蓋元代表知識粒,由覆蓋生成的集合逼近則代表基于知識庫對某事物的刻畫和描述;在信息系統(tǒng)中,根據(jù)對象的屬性值生成覆蓋元,所有的屬性生成的覆蓋元放在一起,構成論域U上的一個覆蓋,屬性集元素個數(shù)越多,則覆蓋元個數(shù)越多,由覆蓋生成的集合逼近則對某事物的刻畫和描述越精確; 當屬性集變化時,由屬性構成的覆蓋發(fā)生變化,近而影響對給定的集合的上、下近似集及邊界域的變化;下面當屬性集變化時對近似集性質進行分析設<U,C>是一個覆蓋近似空間,即U是一個非空有限集合。A是U的屬性集,對于 HJ ’ P = {al,a2,-,an}^A,則 Cp =IkO^kO1I,...,Kvth,...Και\,Και2,...,Kam,…,Kari\,Kari2, ···,構成的 U —個覆蓋,向屬性集P添加一個屬性a,c{a} = {Kal,Ka2,…,KaJJU Cpu {a} = Cp U C{a}仍是U的一個覆蓋, 此時有,7Vp(x)2#puw(X),且有Npu{a}(x) =Np(x) η N{a} (χ) 0相反,若從P中刪除一個屬性, 則覆蓋元減少,&⑴(引理1)設屬性a e Κ,ρ^Α,αΦΡ ,則幻 ^ Cpuw (幻'Q(X) 3 ^I(X)。證明對于屬性集P,其構成的覆蓋為CP,對于屬性集P U {a},其構成的覆蓋為 Cp U {a} = Cp U C {a},且 Cp c Cpuw。設 Vx e Cf(X),則有 tvp (χ) £ X。由引理 1 知,乂 (x) 2 Nmai (χ),
則有&,即 χ e Cpu ial ⑴,所以有⑷。設Vxe^^(JO,則有&(χ)ΠΧ#0,又由引理 1 知,Νρ(χ) Nma^x),則 TVp(X)AX矣0,即Xe ^(X)。所以有5002^00 ;(定理 1)設屬性a e A,i^J,fl#,則、⑷⑷;(推論 1)設屬性a e k,P^A P J'JAc,(X)□ Kcpuw(X);(推論 2)
設屬性a e A,尸 £乂,相尸,則(推論 3)設屬性集尸£乂,a e P,則&(I) 3 Cp_{a}(X)£ C^(X);(定理 2)設屬性集尸£j,ae P,則、(推論4)設屬性集P QA,a e P,則 (X) c (X);(推論 5)設屬性集尸£j,ae P,則H^JOeH·,(JO;(推論6)步驟B、屬性集變化時近似集增量更新方法過程設覆蓋近似空間 <仏0,1£^/,通過下面的定理來實現(xiàn)乂的上、下近似的更新設屬性 a e Κ,Ρ^Α,α^Ρ M\Cp υ ia} (X) = Ce(X) U Cial(X) U Y其中;Γ= U TVpuw(X)cXaxg U TVp(X)門(Χ)};(定理 3)
xeXxeX設屬性集尸£ j,a e p,貝丨JCp_{a](X) = Cl(X) - Ac^aj (X)(定理 4)設屬性a e A,尸£J,i^尸,則Q^(X) = Q(X)-Z其中Ζ= {χ|7νρυΜ(χ)ηΧ*0ΛΧΕ7νρ(χ)-7νρυΜ(χ)};(定理 5)設屬性集尸£ 乂,a e P,貝丨JC^i(X) = C~P(X)\jAcP_{a)(X);(定理 6)步驟C、具體過程描述為當屬性增加時,信息系統(tǒng)關于新增屬性會形成新的覆蓋元,這些覆蓋元構成論域的一個覆蓋,那么新增屬性所形成的覆蓋元與原來屬性所形成的覆蓋元合并在一起也構成論域的一族覆蓋。對于近似集的更新,如果是采用靜態(tài)增量更新方法(所謂靜態(tài)增量更新方法是指增加新屬性后按照初始求近似集的算法計算),那么,系統(tǒng)會把所有的覆蓋元合并在一起從新計算給定集合的上近似集、下近似集,會花費很多時間和空間去重復計算,為了節(jié)省時間和空間,以便更及時地去更新信息,則宜采用動態(tài)的更新方法,因為在屬性增加時,增加了新的覆蓋元,根據(jù)上近似集、下近似的定義及求解原理知,上近似集、下近似是所包含對象的最小描述的交集,那么所包含對象的最小描述的交集即對象的鄰域。屬性增加, 對于給定集合中所包含的對象的鄰域的并集形成一種分解,如果增加屬性后集合X所包含的對象集的鄰域的并集大小沒有改變,那么說明添加的屬性對集合X的上近似集、下近似集沒有影響,即集合X的上近似集、下近似集大小不變;如果增加屬性后集合X所包含的對象集的鄰域的并集發(fā)生了變化,則說明添加屬性后對集合X的上近似集、下近集產生了影響,即集合X的上近似集、下近似集發(fā)生了變化,此時根據(jù)對象的鄰域與近似集的關系,利用動態(tài)增量更新方法對近似集進行增量更新效率更高。當某一屬性刪除時,由刪除該屬性后所形成的覆蓋元隨之減少,分析屬性刪除后,集合X所包含的對象集的鄰域的并集是否發(fā)生了變化,如果對象的鄰域的并集保持原大小,則說明屬性刪除對集合X的上近似集、下近似集并沒有產生影響,則集合X的上近似集、下近似集的大小保持不變;如果刪除某一屬性后對于給定集合中所包含的對象的鄰域變大,此時,可以利用對象的鄰域、集合的邊界域與近似集的關系,利用近似集動態(tài)增量更新算法進行更新;
步驟Cl、屬性增加時近似集增量更新算法1.靜態(tài)新增屬性算法描述輸入S= (U,A,V,f),X。輸出G(I),巧(Z)。具體步驟步驟1、計算由屬性集PeW中單個屬性形成的覆蓋元,構成U的一個覆蓋Cp ;步驟2、對于 Xi e U,計算 N (Xi);步驟3、若Xi e U,且Λ^)£Ζ,則將對象Xi加入到對象子集X的下近似集中,即 Wi^Cp(X)-,步驟4、若\ e U,且門^^0,則將對象Xi加入到對象子集X的上近似集中, 即{如^⑷;步驟6、增加一個新的屬性a產生新的覆蓋元,合并原來的覆蓋構成一個新的覆蓋
Cp ο步驟7、重復步驟2、3、4,輸出^(Z),算法結束。2.動態(tài)增量更新算法描述輸入S= (U,Α,V,f),X。輸出q(Z),巧(Ζ)。具體步驟步驟1、計算由屬性集PeW中單個屬性形成的覆蓋元,構成U的一個覆蓋;步驟2、對于 Xi e U,計算 N (Xi);步驟3、若Xi e X,且W(Xi) £ Z,則將對象Xi加入到對象子集X的下近似集中,即 {xj ^>C/x);步驟4、若\ e U,且門^^0,則將對象\加入到對象子集X的上近似集中, 即{如^⑷;步驟5、增加一個新的屬性a產生新的覆蓋元,構成一個新的覆蓋,計算N{a} (χ);步驟6、如果 U (TVp(χ)Π (x))= U Np(X) JljC;(X) = Cp(χ),C;(X) = C^(X),轉向
xeXX&X-----
第8步;
步驟7、如果 ^(A(X)HiVw(X))C=MiVp(X),如果£Χ, 則 Cl(X) = Cp (X) U (Np (χ) η Ν{α} (χ)); 如果 TVp (X) π ^vw(X)D 1*0, 則 Q(X) = C⑷-(Np(χ)-Nnm(χ));步驟8、輸出^(Χ),巧(Z),算法結束;步驟C2、屬性減少時近似集動態(tài)增量更新算法1.靜態(tài)刪除屬性算法描述輸入S=(U,A,V,f),X;輸出么(X),G(Z);具體步驟為
步驟1、計算由屬性集PeW中單個屬性形成的覆蓋元,構成U的一個覆蓋Cp ;步驟2、對于 Xi e U,計算 N(Xi);步驟3、計算X的上、下近似仏(X),〔(X);步驟4、刪除一個屬性a,構成一個新的覆蓋Q;步驟5、重復步驟1、2、3,輸出g(Z),巧(X),算法結束;2.動態(tài)刪除屬性增量更新算法輸入S=(U,A,V,f),X。輸出仏(X),G(X)。具體步驟步驟1計算由屬性集PeW中單個屬性形成的覆蓋元,構成U的一個覆蓋Cp ;步驟2 Vxef/,計算 Np(X);步驟3計算X的上、下近似⑴,G(Z);步驟4刪除一個屬性a,構成一個新的覆蓋Q;步驟5計算NP_{a} GO,若=,應⑷= Q(X)= C(X),轉向
步驟7 ;步驟6 若 2A_w(x)〕27Vp(x),則 C;_{a} (X) = {xe Νρ_{α} (χ) | Νρ_{α} (χ) c Χ}, = {xe UI TVw(X) ΠX 本 0};步驟7輸出G(X) 'C^(X),算法結束。針對本發(fā)明所述方法結合實例及實驗數(shù)據(jù)再進行如下詳細闡述1、相關知識定義1[1](信息系統(tǒng))一個信息系統(tǒng)以四元組S = (U,Α,V,f)表示,其中,U :U = Ix1, X2,..., XnI為對象的非空有限集合,稱為論域;A= {α I α e Α}稱為屬性集嚴是信息函數(shù)f的值域,而Va表示值域;=表示信息系統(tǒng)的信息函數(shù), fa為屬性α的信息函數(shù)。定義2[2]設U是一有限非空論域,C是U上的一個子集族,若0任C且U C = U,則稱 C為論域U的一個覆蓋,稱元組〈U,O為覆蓋近似空間。定義3[2]設<U,O為覆蓋近似空間,χ e U,則定義χ關于<U,O的最小描述為 md(x) = {KeC:xeKA/Se C A(xeSAScK^K = S)}定義4[2]設<U,C>為覆蓋近似空間,對任意χ e U,N(X) = η {K e C ;x e K}稱為 χ的鄰域。結合定義3和定義4,容易得到N(X) = Π md(x)。例 1 設 U = e2, e3, e4, e4, e5, e6, e7, e8}, K1 = {e” e2, e3}, K2 = {e3, e6, e8}, K3 = {e4,e5,e6,e7,e8}, K1 U K2 U K3 = U,所以 C = (K1, K2, K3}是 U 的一個覆蓋。則稱元組<U,C>為覆蓋近似空間。定義3[2]設<U,O為覆蓋近似空間,χ e U,則定義χ關于<U,O的最小描述為 md(x) = {KsC:xsK a/Ss C a(xs S AScK^K = S)]例 2 設 U = e2, e3, e4, e4, e5, e6, e7, e8}, K1 = {e^ e2, e3}, K2 = {e3, e6, e8}, K3={e4, e5, e6, e7, e8}, C = (K1, K2, K3}, C 是 U 的一個覆蓋,貝U e2, e3, e4, e5, e6, e7, e8 關于 <U,C>的最小描述分別為md(ei) = IK1KmcKe2) = IK1KmcKe3) = (KljK2I^cKe4) = {K3},md(e5) = {K3},md(e6) = {K2, K3I, md(e7) = {K3},md(e8) = {K2,K3}。定義4[2]設<U,C>為覆蓋近似空間,對任意X e U,N(X) =n {K e C ;x e K}稱為 χ的鄰域。結合定義3和定義4,容易得到N(X) = Π md(x)。例 3 設 U = e2, e3, e4, e4, e5, e6, e7, e8}, K1 = {e^ e2, e3}, K2 = {e3, e6, e8}, K3 = {e4,e5, e6, e7, e8}, C = IK1, K2, K3},C 是 U 的一個覆蓋,則 e1; e3, e6 鄰域分別為IH(Ke1) = {Kj = {e17 e2, e3, e5, e6}, Me1) = Π IH(Ke1) = {Kj = {e17 e2, e3, e5,
e6l ;md(e3) = {k17 K2} = {{e17 e2, e3, e5, e6}, {e3, e6, e8}}, N(e3) = Π md(e3) = K1 Π K2 ={e3,e6};md (e6) = (K1, K2, K3},N(e6) = Π md (e6) = K1 Π K2 Π K3 = {e6}。定義設U是一有限非空論域,C是U上的一個子覆蓋,對于任意的;T ,X關于覆蓋近似空間〈U,O的下近似£(X)和上近似C(X)分別定義為C(X) = (XeiZin^(X)CX)jC(X) = {xeU\DraJ(x) Π X 矣 0}X關于近似空間<U,C>的正域pc^c(X),負域ne&(X)和邊界域bnc(X)分別定義為 Posc(X)= C(X),^egc(X) =~ C(X),bnc (X) = C(X) - C(X)。即覆蓋粗糙集模型是Pawlak粗糙集模型的推廣。當5(幻=以幻時,稱X關于近似空間<U,O可定義的,否則稱為粗糙的。例 4 設 U = Ie1, e2, e3, e4, e4, e5, e6, e7, e8},C 是 U 上的一個子覆蓋,K1 = Ie1, e2, Θ3}, K2{θβ j Gg j Gg}, Kβ {Θ^ j Θ^ j Gg j Θ^ j Gg}, K^ {Θ^j Θ7}, C {K” K] Κ3j K^}, T^r X {θβj e5, e6, e7},貝丨J有md(ei) = IK1KMe1) = {Kj = {e1 e2,e3},md(e2) = {Kj, N(e2) = {Kj = {e1 e2' ‘md(e3) = (K1,K2I,N(e3) = K1 Π K2 = |e3},md(e4) = {K3},N(e4) = {e4, e5, e6, e7,
e8l,md(e5) = {K3,K4},N (e5) = K3 Π K4 = {E5,e7},md (e6) = {K2,K3},N(e6) = K2 Π K3 — θ6' ,md (e7) = {K3,K4},N(e7) = K3 Π K4 = {e5,e7},md (e8) = {K2,K3},N(e3) = K2 Π K3 — θ6' ,X關于覆蓋近似空間<U,C>的下近似C(X) = {xe U \ N(x) c X} = {N(e,), N(e5), N(e7)} ={e3,e5,e7j;X關于覆蓋近似空間<U,C>的上近似C{X) = {xeU\N{x)[\X^Q)} = U ·,
X關于覆蓋近似空間<U,O的邊界域bnc(X) = C(X)-C(X) =;X關于覆蓋近似空間<U,O的正域Posc(X) = C(X) = {e3, e5, e7};X關于覆蓋近似空間<U,O的負域= 0。定義6設覆蓋近似空間<U,C>, U是一有限非空論域,C是由屬性集B生成的覆蓋元所構成的U上的一個子覆蓋,對于任意的;T£f/,X e X關于屬性集B的鄰域為Nb(X) = η {K e C ;X e K}定義7設覆蓋近似空間<U,C>, U是一有限非空論域,C是由屬性集B生成的覆蓋元所構成的U上的一個子覆蓋,對于任意的;r ,X關于屬性集B的下近似集、上近似集、 下邊界和上邊界分別定義為C,(X) = {xeU\NB(x)QX},C'B{X) = {xeU\NB{x)[\X4Cb (X)=X-Ca(X) ,Acb (X) = C^(X) -XX關于屬性集B的正域/^cb (幻,負域"嘆Cb (幻和邊界域Η·β (幻分別定義為poscb (X) = Cg(X),mgcb (X) =~ C~B(X) ,bnCs (X) = C~B(X) ~C (X)。2、屬性集變化時近似集的性質分析在覆蓋粗糙集中,一個覆蓋表示知識庫中的某種知識,覆蓋元代表知識粒,由覆蓋生成的集合逼近則代表基于知識庫對某事物的刻畫和描述。在信息系統(tǒng)中,根據(jù)對象的屬性值生成覆蓋元,所有的屬性生成的覆蓋元放在一起,構成論域U上的一個覆蓋,屬性集元素個數(shù)越多,則覆蓋元個數(shù)越多,由覆蓋生成的集合逼近則對某事物的刻畫和描述越精確。 當屬性集變化時,由屬性構成的覆蓋發(fā)生變化,近而影響對給定的集合的上、下近似集及邊界域的變化。下面當屬性集變化時對近似集性質進行分析。引理1設<U,C>是一個覆蓋近似空間,即U是一個非空有限集合。A是U的屬性集,對于HJ,P = {al,a2,-,an}^A,則 Cp =IKail,KwsK0mVK0^Kai2,...,Kam,...,Kani,Ka), ···,…,^^^構成的 U —個覆蓋,向屬性集P添加一個屬性a,C{a} = {Kal,Ka2,-,KaJ,則Cp U {a} = Cp U C{a}仍是U的一個覆蓋, 此時有,7Vp(x)2#puw(X),且有Npu{a}(x) =Np(x) η N{a} (χ) 0相反,若從P中刪除一個屬性, 則覆蓋元減少,Np(X) c Νρ_{α)(χ)。證明此引理由定義3-7可直接得到,此處證明略。定理1 設屬性 a e A,PczA,a^ P M&X^CPU{aM) 'C; (X) C^1(X)。證明對于屬性集P,其構成的覆蓋為CP,對于屬性集P U {a},其構成的覆蓋為 Cp U {a} = Cp U C {a},且 Cp c Cpuw。設 Vx e Cf(X),則有 tvp (χ) £ X。由引理 1 知,乂 (x) 2 Nmai (χ),
則有&,即 χ e Cpυ ial ⑴,所以有£CPU{a](X)。設Vxe ^;化),則有&(X)nx#0,又由引理 1 知,Np(x)]Nma、(x),則 Νρ(χ)ΠΧΦ0 ,BPxe^(X)。所以有G(Z)2^^00。推論1 設屬性 a e Κ,ρ^Α,α^Ρ J1J^cp W □ 4Cpuw (X)。
證明定義7 知,ACp(X)=X-Cp(X),ACfuw(X)=X-Cp[i{a](X),又由定理丄知, &(X) £ Chm(X),所以有、(X) 2 Acpuiai (X)。推論2 設屬性 a e k,P^A P J'JAc,(X)□ Kcpuw(X)。證明定義7 知,Kcp(Z) =G(Z),Iw(Z) = ^^(1)-X,又由定理 1 知, □ ^(I),所以有& (X) 3 Acwm (X)。推論3 設屬性 a e A, PqA ,a^ P Mbn^X^bncni{aSX)。證明邊界域的定義可得Ki(Z) = G(Z)-^1(Z), bnCpuJX) = C^M) ~CPUiaM),又由定理 1 知,&(X) £CPU{a} (Z) ,α~ρ(Χ) C^(X),所以有 bnCp(X)定理 2 設屬性集尸 £X,a e P,則&(幻□ Cp_{a](X)£ C^(X)。證明證明過程的原理類似于定理1,此處略。推論4 設屬性集尸 £x,a e P,則、P0£4CMaiP0。證明證明過程的原理類似于推論1,此處略。推論5 設屬性集尸 £ X,a e P,則(X) c (X)。證明證明過程的原理類似于推論2,此處略。推論6 設屬性集 P £A,a e P,則 OO £ bnCp^ (X)。證明證明過程的原理類似于推論3,此處略。3、屬性集變化時近似集增量更新方法設覆蓋近似空間 <仏0,1£^/,通過下面的定理來實現(xiàn)乂的上、下近似的更新定理 3 設屬性 a e k,P^A,a^PM\Cp υ ia} (X) = Ce(X) U Cial(X) U Y其中;T= {x U TVpuw(X) CXaxg U TVp (Χ)門(Χ)}。
χεΧΧΕΧ證明“ 二,,設Vxe CPU{a} OO,由下近似的定義則有χ e ” λ TVpl liai (χ) £ Z,所以一定有 (χ) £ χ ° 如果好 Q(^) u C1O1(X),則有 Jvp ⑴ η χ=0 λ Ν <α} (χ) η χ=0,所以有 2τνΡ(χ)ηχ=0Λ2τνΜ(χ)ηχ=0,但矛盾,所以有 χ e γ。所以有 Cpm(X) £ Q(X)Uqfl(X)UF?!?e ”因為C Cpum(X) ,CM(X) C Cpum(X) ,7c Cp[){a)(X), 所以有〔糊⑷⑷UCwWUr。綜上,Cpu ial(X) =Ce(X) υ
Cial(X) U Y。定理4設屬性集戶a e P,則Cp_{a](X) = Cl(X) - Acp^ (X)證明由定理2 知,C1(X) C^(X),又由定義 7 知,CP_{a)(X)U Acp^(X) = X, Cz(X)UAcp(X) = X,所以有.Cp_iaS(X) = C1(X)-(4C ,(X)-ACf (X)),所以有
Qzifi(X) = Q1(X)UAcp(X)-Ac^(X),由推論 4 知,、(幻£4c^00,所以有 Cp^(X) = Cl(X)-Acp(X)0定理5設屬性a e A,尸£乂,相尸,則
C^}(X) = Tp(X)-Z其中Z= {x|iVPU{a! (χ) Π X # 0 λ χe TVp (χ) - ΝΡ(){α) (χ)}。證明“二”設Vxe ^;化),則有 χ G Npu {a} (χ)且 Auw(X)DZ 矣0。若 xe G(Z), 則有X G Np(χ)且TVp(JC)AX矣0。由定理1知,&002‘00,又由引理4. 1得, JVp(X)3JVpuw(X),設 Z = GOO-^OO,則有 Ζ =, 所以有,^OOeGOO-Z?!癳” VxeC^(X)-Z,貝IJ 有 xe#puw(x)nz = 0。若 χ i C^(X),則 χ Au w ⑴ Π 0 矛盾。所以,χ e C^(X),C^M) 2 G(Z) - Z。綜上, Cpuw ⑷=Cp ⑷ _ Z。定理6設屬性集j,a e P,貝丨JQ^(X) = Q(X) U (X)證明由定理2知,‘002^00,Acp(X)^CpaJX)。又由定義7知 = k、(X)UX,X = C~P(X) - Acp (X),所以有 ‘00 = Q(X) U (AcMa! (X) - Acp (X)),
所以有 ‘PO = GOOU“OOU^vwOO 由推論 5 知,Zcf (Z)eSc^(Z),所以有 CZ^1(X) = C~P(X)\JAcP_{a)(X) O例5L:設 U={為九幢房子,P= {price, color, structure, surrounding}為屬性集,"price,,取值為{high, middle,low},"color,,取值為{good,bad},"structure,,取值為{reasonable, ordinary, unreasonable},"surrounding,,取值為{quiet, a little noisy, noisy, very noisy}。有四個專家參與評估房子的各種屬性狀態(tài),分別為{A,B, C,D},四人評估的結果可能各不相同。評估結果如下"price"
A:high = (X1,X4'xE丨,x7},middle = {x2,x8},low =={x3,X6'
B:high = (X1,X2‘X4:,x7, x8},middle = {x5},low =={x3,X6'
C:high = (X1,X4‘X7,},middle = {x8},low =( 'X3,X5,X6'
D:high = (X1,X4’X ,},middle = {x5},low =( 'X3,X6
"color"
A:good = (X1,X2■,Xc;J Xgl,bad {義4' X5,X7' Xf3,
B:good = (X1,X2■,Xc;j X5I,bad {義4'義6‘ X7' Xf3,
C:good = (X1,X2■,Xc;J xj,bad {X5‘義6‘ X7' Xf3,
D:good = (X1,X2■,Xc;},bad {義4,義5,義6,X7,Xf3,
"structure,,
A!reasonable=Ix1 x2,x3} ,ordinary = {x4,X5,3 ? X7 ? X^J ,unreasonable = {x9}
B!reasonable=Ix1 x2,x3} ,ordinary = {x4,X5,3 ? X7 ? Xc,} ,unreasonable = {x8}
C!reasonable=Ix1 x2,x3} ,ordinary = {x4,X5,3 X8J Xc,} ,unreasonable = {x7}
D!reasonable=Ixx2, x3},ordinary = {x‘1,X5,x6},unreasonable = {x7, X8,
X9I "surrounding,,
A :quiet ={x1 x2}, alittle noisy = {x3, x6}, noisy = {x4, x5, x7}, very noisy —B :quiet ={x1 x5}, alittle noisy = {x2, x3}, noisy = {x4, x7, x8}, very noisy —C :quiet ={xj,alittle noisy = {x2,x3},noisy = {x4,X7, x8},very noisy =D :quiet ={x1 x2, x4}, alittle noisy = {x3, x5}, noisy = {x7, x8}, very noisy假設每位專家的評估結果具有相同的重要度,如果要全面綜合這些意見,我們可以將四個專家給出的某個屬性值的所有對象合并在一起,這樣就形成了論域U的覆蓋,代表四個屬性"price"Ca high = (X1, x2, x4, x5, x7, x8}, middle = {x2, x5, x8}, low = {x2, X3, X5, X6, X8, x9}"color"Cb good = (X1, x2, x3, x4, x5, x6}, bad = {x4, x5, X6, x7, X8, x9}‘‘structure,,Cc :reasonable = {χ17 X2, x3}, ordinary = {x4, x5, X6, x7, X8, x9}, unreasonable =
{X” XgJ Xg}‘‘surrounding,,Cd :quiet = (X1, X2, X4, x5},a little noisy = {x2, X3, x5, x6},noisy = {x4, X5, x7, x8},very noisy = {x5, X6, X8, x9}給定集合X = Ie1, x3, e5, ,下面我們討論增加和刪除屬性時,關于集合X的下近似和上近似的更新。1增加一個新的屬性設P= {8,13,(1},尸£乂,因此有,(;=IKal,Ka2,Ka3,Kbl,Kb2,Kdl,Kd2,Kd3,KdJ ,Np(X1) =Ix1, x2,x4,X5I,Np(X2) = {x2, x5}, Np(X3) = {x2, x3, x5, x6}, Np(X4) = {x4, x5}, Np(X5)= {x5}, Np (x6) = {x5, x6}, Np(X7) = {x4, x5, x7, x8}, Np(X8) = {x5, x8}, Np (x9) = {x5, x6, x8, x9}, Cp(X) = {x5},C(Jn = f/。i.設屬性c e A,M p,將屬性c添加到P,集合X的下近似增量更新如下為求CDUic} (X),我們首先計算Y和£μ{Χ)。Y = {x [j NplJ{c}(x)^XAxe U Np(χ)ΠN{c}(χ)} ,Cf χ(Χ) = 0,
xeXxeXici v ‘ N{c} (x) = {N{c} (X1),N{c} (x3),N{c} (x5),N{c} (x8)},Np (χ) Π N{c} (χ) = {Np υ {c} (X1),Np υ {c} (x3),Np υ {c} (x5),Np υ {c} (x8)}。又因TVp(χ)D£ Z,有 Y = {χ3,Χ5,χ8}。因此,Cpυ ic} (X) = Cp(X) U Ciel(X) UY= {x3,X5, x8}。ii.設屬性c e A,M p,將屬性c添加到P,集合X的上近似增量更新如下為求xe C^1(X),我們首先計算Z。Z= {x|7VPU{c! (χ) Π X ^ 0 α χe TVp (χ) - NP[){c) (χ)} = 0。
因此,Cpuw(Z) = Cp (Z) - Z = f/。2刪除一個屬性設P= {a, b,(3},Ρ£Χ,因此有,Cp = IKal,Ka2,Ka3,Kbl,Kb2,Kcl,Kc2,Kc3},Np(X1)= (X1, x2}, Np(X2) = {x2}, Np(X3) = {x3}, Np(X4) = {x4, x5}, Np (x5) = {x5}, Np(X6) = {x5, x6}, Np(X7) = {x7, x8}, Np(X8) = {x8}, Np(X9) = {x8, x9}, Ce(X) = {x3, x5, x8} ,Cp(X) = U。i.設屬性C e p,將屬性C從p中刪除,集合χ的下近似更新如下為求^i(X),我們首先計算Ac^OO。由于=,所以有,Cp^(X) = Cl(X)-Acp JX) = {x5}。ii.設屬性c e P,將屬性c從P中刪除,集合X的上近似更新如下為求^(Z),我們首先計算(Z)。由于SCf_M(;n= {x2,x4,x6,x7,x9},所以有,C^(X) = G(X) U ^vm (X) = f/。4、算法思想及其描述當屬性增加時,信息系統(tǒng)關于新增屬性會形成新的覆蓋元,這些覆蓋元構成論域的一個覆蓋,那么新增屬性所形成的覆蓋元與原來屬性所形成的覆蓋元合并在一起也構成論域的一族覆蓋。對于近似集的更新,如果是采用靜態(tài)增量更新方法(所謂靜態(tài)增量更新方法是指增加新屬性后按照初始求近似集的算法計算),那么,系統(tǒng)會把所有的覆蓋元合并在一起從新計算給定集合的上近似集、下近似集,會花費很多時間和空間去重復計算,為了節(jié)省時間和空間,以便更及時地去更新信息,則宜采用動態(tài)的更新方法,因為在屬性增加時,增加了新的覆蓋元,根據(jù)上近似集、下近似的定義及求解原理知,上近似集、下近似是所包含對象的最小描述的交集,那么所包含對象的最小描述的交集即對象的鄰域。屬性增加, 對于給定集合中所包含的對象的鄰域的并集形成一種分解,如果增加屬性后集合X所包含的對象集的鄰域的并集大小沒有改變,那么說明添加的屬性對集合X的上近似集、下近似集沒有影響,即集合X的上近似集、下近似集大小不變;如果增加屬性后集合X所包含的對象集的鄰域的并集發(fā)生了變化,則說明添加屬性后對集合X的上近似集、下近集產生了影響,即集合X的上近似集、下近似集發(fā)生了變化,此時根據(jù)對象的鄰域與近似集的關系,利用動態(tài)增量更新方法對近似集進行增量更新效率更高。當某一屬性刪除時,由刪除該屬性后所形成的覆蓋元隨之減少,分析屬性刪除后,集合X所包含的對象集的鄰域的并集是否發(fā)生了變化,如果對象的鄰域的并集保持原大小,則說明屬性刪除對集合X的上近似集、下近似集并沒有產生影響,則集合X的上近似集、下近似集的大小保持不變;如果刪除某一屬性后對于給定集合中所包含的對象的鄰域變大,此時,可以利用對象的鄰域、集合的邊界域與近似集的關系,利用近似集動態(tài)增量更新算法進行更新。4. 1屬性增加時近似集增量更新算法1.靜態(tài)新增屬性算法描述輸入S=(U,A,V,f),X。輸出,C;(X)。具體步驟步驟1計算由屬性集PeW中單個屬性形成的覆蓋元,構成U的一個覆蓋Cp ;步驟2對于Xi e U,計算N (Xi);
步驟3若Xi e U,且Z,則將對象Xi加入到對象子集X的下近似集中,即
權利要求
1. 一種粗糙集擴展模型中近似集動態(tài)更新方法,所述方法是基于以下定義來實現(xiàn)的 定義1 一個信息系統(tǒng)以四元組S = (U,A,V,f)表示,其中,U :U= {X1,X2,... ,XnI為對象的非空有限集合,稱為論域;A= {α α eA}稱為屬性集嚴 是信息函數(shù)f的值域,而Va表示值域;=表示信息系統(tǒng)的信息函數(shù),fa為屬性α的信息函數(shù);定義2 設U是一有限非空論域,C是U上的一個子集族,若0任C且U C = U,則稱C為論域U的一個覆蓋,稱元組<U,C>為覆蓋近似空間;定義3 設<U,C>為覆蓋近似空間,χ e U,則定義χ關于<U,O的最小描述為 md(x) = {KeC:xeKA/SeC A(xeSAScK^K = S)}定義4 設<U,O為覆蓋近似空間,對任意χ e U,N(x) = η {K e C ;χ e K}稱為χ的鄰域;結合定義3和定義4,容易得到N(X) =Hmd(X);定義3 設<U,C>為覆蓋近似空間,χ e U,則定義χ關于<U,O的最小描述為 md(x) = {KsC:xsK a/Ss C a(xs S AScK^K = S)]定義4 設<U,C>為覆蓋近似空間,對任意χ e U,N(x) = η {K e C ;χ e K}稱為χ的鄰域;結合定義3和定義4,容易得到N(X) =Hmd(X);定義5 設U是一有限非空論域,C是U上的一個子覆蓋,對于任意的;T ,X關于覆蓋近似空間〈U,O的下近似以X)和上近似C(X)分別定義為 C(X) = {xe U\f]md(x) c X},C(X) = {xeU\Hmd(X) Π X 矣 0}X關于近似空間<u,O的正域PC^c(X),負域ne&(X)和邊界域bnc(X)分別定義為 Posc(X) = C(X),negc(X) =^C(X), bnc(X) = C(X)-C(X);即覆蓋粗糙集模型是Pawlak粗糙集模型的推廣; 當C(X) = G(X)時,稱X關于近似空間〈U,O可定義的,否則稱為粗糙的; 定義6 設覆蓋近似空間<U,C>,U是一有限非空論域,C是由屬性集B生成的覆蓋元所構成的U上的一個子覆蓋,對于任意的;T£f/,X e X關于屬性集B的鄰域為 Nb(x) = η {K e C ;χ e K}定義7 設覆蓋近似空間<U,C>, U是一有限非空論域,C是由屬性集B生成的覆蓋元所構成的U上的一個子覆蓋,對于任意的;T ,X關于屬性集B的下近似集、上近似集、下邊界和上邊界分別定義為C,(X) = {xeU\NB(x)QX},C^(X) = {xeU\NB(x)r\X^0}4cb (X)=X-CJ,X) 'Acb (X) = C^(X) - XX關于屬性集B的正域/^cb (Z),負域(Z)和邊界域Κ·Β (Z)分別定義為 POScb (X) = Ca(X),mgCB (X) =~ C~B(X) ,bnCs (X) = C^(X)-Ca(X);其特征在于所述方法的具體過程為步驟A、屬性集變化時近似集的性質分析過程為在覆蓋粗糙集中,一個覆蓋表示知識庫中的某種知識,覆蓋元代表知識粒,由覆蓋生成 的集合逼近則代表基于知識庫對某事物的刻畫和描述;在信息系統(tǒng)中,根據(jù)對象的屬性值 生成覆蓋元,所有的屬性生成的覆蓋元放在一起,構成論域U上的ー個覆蓋,屬性集元素個 數(shù)越多,則覆蓋元個數(shù)越多,由覆蓋生成的集合逼近則對某事物的刻畫和描述越精確 ’當屬 性集變化吋,由屬性構成的覆蓋發(fā)生變化,近而影響對給定的集合的上、下近似集及邊界域 的變化;下面當屬性集變化時對近似集性質進行分析設<U,O是ー個覆蓋近似空間,即U是ー個非空有限集合。A是U的屬性集,對于Vxe U,尸={ !,Or2,-",OrJej,貝Ijしp =^^,^2,-",Acw,".Ia^Iai2,-",Acw, ,八O^Ictjj2,, - ",^v5J構成的U—個覆蓋,向屬性集P添加ー個屬性a,C{a} = {Kal,Ka2,…,Kas},則Cpu {a} = Cp U C{a} 仍是U的一個覆蓋,此時有,^PW2^Vpuw(X),且有Npu {a}(x) =NpOO H N{a} (x) 相反,若從 P中刪除ー個屬性,則覆蓋元減少,nP⑴E Np-{a}㈨;設屬性 a e'Q(X)2Q^(X)5證明對于屬性集P,其構成的覆蓋為CP,對于屬性集P U {a},其構成的覆蓋為CPU{a} =Cp U C {a},RCp c Cpuw。設Vx e Cf(X),則有^⑶£ Z。由引理1知,ル⑴□ Nma]⑴,則有 JVpuw (X) c X,BP X G Cp u {al ⑴,所以有幻 £ Cpuw (X);設,則有^⑴,Np{xhNmJx),則 ⑴,即xe G(X);所 以有ら(Z) 2 ‘(JO;設屬性a e A,尸相尸,則4ら 設屬性 a G k, P ^ A,a€ P J1JAcp (X) □ Acpuw (X); 設屬性 a G k,p^A,a^P ,MbncP 3 hncma, (X); klSit生_尸〔ズ,a設屬性集尸£ズ,a e P,則4らW £ Acp^j (X); 設屬性集尸£ズ,a G P,則Xら(X) c AcMa! (X); 設屬性集尸£ズ,a e P,貝丨JMら(X) £ bnCp^ (X); 步驟B、屬性集變化時近似集増量更新方法過程設覆蓋近似空間<U,C>,Zeひ,通過下面的定理來實現(xiàn)X的上、下近似的更新 設屬性 a G k,P^A,a€P,W\ Cp u u) (X) = Ce(X) U Cm(X) U Y其中;r = {x UiVpuw(X)cXAXG U (X)HiVw(X)I ;設屬性集P£j,a G P,則 Cp^i(X) = Cl(X)-AcpaJX)設屬性 a G A, P c A,P Ml C^1 (X) = C; (X)-Z其中 Z = {x |7VPUW (x)f]X ^0 AXeNp(X)-NP[){a} (x)};設屬性集尸£j,a e P,則步驟C、具體過程描述為當屬性增加時,信息系統(tǒng)關于新增屬性會形成新的覆蓋元,這些覆蓋元構成論域的一個覆蓋,那么新增屬性所形成的覆蓋元與原來屬性所形成的覆蓋元合并在一起也構成論域的一族覆蓋。對于近似集的更新,如果是采用靜態(tài)增量更新方法,那么,系統(tǒng)會把所有的覆蓋元合并在一起從新計算給定集合的上近似集、下近似集,會花費很多時間和空間去重復計算,為了節(jié)省時間和空間,以便更及時地去更新信息,則宜采用動態(tài)的更新方法,因為在屬性增加時,增加了新的覆蓋元,根據(jù)上近似集、下近似的定義及求解原理知,上近似集、下近似是所包含對象的最小描述的交集,那么所包含對象的最小描述的交集即對象的鄰域。 屬性增加,對于給定集合中所包含的對象的鄰域的并集形成一種分解,如果增加屬性后集合X所包含的對象集的鄰域的并集大小沒有改變,那么說明添加的屬性對集合X的上近似集、下近似集沒有影響,即集合X的上近似集、下近似集大小不變;如果增加屬性后集合X所包含的對象集的鄰域的并集發(fā)生了變化,則說明添加屬性后對集合X的上近似集、下近集產生了影響,即集合X的上近似集、下近似集發(fā)生了變化,此時根據(jù)對象的鄰域與近似集的關系,利用動態(tài)增量更新方法對近似集進行增量更新效率更高。當某一屬性刪除時,由刪除該屬性后所形成的覆蓋元隨之減少,分析屬性刪除后,集合X所包含的對象集的鄰域的并集是否發(fā)生了變化,如果對象的鄰域的并集保持原大小,則說明屬性刪除對集合X的上近似集、下近似集并沒有產生影響,則集合X的上近似集、下近似集的大小保持不變;如果刪除某一屬性后對于給定集合中所包含的對象的鄰域變大,此時,可以利用對象的鄰域、集合的邊界域與近似集的關系,利用近似集動態(tài)增量更新算法進行更新; 步驟Cl、屬性增加時近似集增量更新算法·1.靜態(tài)新增屬性算法描述 輸入=S = (U, A, V, f),X ; 輸出g(z),^(x);具體步驟步驟1、計算由屬性集Pe」中單個屬性形成的覆蓋元,構成υ的一個覆蓋Cp ; 步驟2、對于Xi e U,計算N (Xi);步驟3、若\ e U,且則將對象&加入到對象子集X的下近似集中,即 {xt} ^ C1(X);步驟4、若Xi e U,且,則將對象Xi加入到對象子集X的上近似集中,即步驟6、增加一個新的屬性a產生新的覆蓋元,合并原來的覆蓋構成一個新的覆蓋CpV ; 步驟7、重復步驟2、3、4,輸出^(X),巧(X),算法結束;·2.動態(tài)增量更新算法描述 輸入=S = (U,A,V,f),X; 輸出g(z),^(x);具體步驟步驟1、計算由屬性集Pe」中單個屬性形成的覆蓋元,構成U的一個覆蓋; 步驟2、對于Xi e U,計算N (Xi);步驟3、若\ e X,且#(χ)£Ζ,則將對象&加入到對象子集X的下近似集中,即 {xt} ^ C1(X);步驟4、若Xi e U,且,則將對象Xi加入到對象子集X的上近似集中,即步驟5、增加一個新的屬性a產生新的覆蓋元,構成一個新的覆蓋,計算N{a} (χ); 步驟6、如果義⑷⑷0 } ) = 2乂《 ,mCl(X) = Cp(x) ^(X) = C;(X),轉向第8步;步驟 7、如果,如果Np (χ) η Ν{α} (χ) c X,則G(I) = υ (Np (χ) η Ν α} (χ));如果Np(X)ΠNw(X)DX ^0 Mc;(X) = Q(X)-(Np(X)-TVpuw(X));步驟8、輸出^(X),巧(X),算法結束;步驟C2、屬性減少時近似集動態(tài)增量更新算法1.靜態(tài)刪除屬性算法描述 輸入=S = (U,A,V,f),X;輸出eE00,^^n;具體步驟為步驟1、計算由屬性集」中單個屬性形成的覆蓋元,構成υ的一個覆蓋Cp ;步驟2、對于Xi e U,計算N (Xi);步驟3、計算X的上、下近似仏⑴,G(I);步驟4、刪除一個屬性a,構成一個新的覆蓋Q;步驟5、重復步驟1、2、3,輸出^(X),算法結束;·2.動態(tài)刪除屬性增量更新算法 輸入=S = (U,A,V,f),X;輸出GE00,G(;n; 具體步驟步驟1、計算由屬性集Pe」中單個屬性形成的覆蓋元,構成υ的一個覆蓋Cp ; 步驟 2、Vxef/,計算 Np(X); 步驟3、計算X的上、下近似仏⑴,G(I); 步驟4、刪除一個屬性a,構成一個新的覆蓋Q;步驟 5、計算 NP_{a} GO,若=,股⑷= C“x) = C(X),轉向步驟7 ;步驟 6、若2 Νρ_{α} (χ) 3 U^ Np (χ),則cP-M(χ) = ^xe Νρ- α}⑴ I Np-沾⑴ £ 'C^}(X) = {Xe ΝΡ_{α}(χ) | ΝΡ_{α}(χ)RX ^0};步驟7、輸出G(X) ^p(X),算法結束。
全文摘要
粗糙集擴展模型中近似集動態(tài)更新方法,它涉及一種近似集動態(tài)更新方法。本發(fā)明方法為了進一步完善基于覆蓋廣義粗糙集的理論體系,使其能夠更好地應用于實際的需求。本發(fā)明方法分析了對象的鄰域、邊界域與近似集的關系,給出了覆蓋粗糙集模型中近似集的增量更新方法。本發(fā)明方法給出了當屬性集增加或減少時,在覆蓋廣義粗糙集模型中近似集的動態(tài)變化趨勢及近似集的動態(tài)增量更新方法,不僅適用于單屬性增加刪除時近似集的增量更新,而且也適用于多個屬性變化的情況,通過實例驗證了這種方法的可行性,通過實驗仿真驗證所提出方法的性能,且從給出的實例的實驗仿真說明,基于覆蓋廣義粗糙集理論的動態(tài)增量更新方法不但有效,而且在效率上也有所提高。
文檔編號G06F17/00GK102279839SQ20111026188
公開日2011年12月14日 申請日期2011年9月6日 優(yōu)先權日2011年9月6日
發(fā)明者付忠傳, 劉永文, 崔剛, 張必英, 張策, 暴建民, 朱東杰, 王秀峰, 莫毓昌, 郝亮 申請人:哈爾濱工業(yè)大學