一種粗糙近似表示系統(tǒng)中de近似表示的加速模塊計(jì)算方法
【專利摘要】本發(fā)明公開了一種粗糙近似表示系統(tǒng)中DE近似表示加速模塊計(jì)算方法,包括構(gòu)建粗糙近似表示系統(tǒng),形成數(shù)據(jù)映射,輸入數(shù)據(jù),數(shù)據(jù)判斷及數(shù)據(jù)輸出,等五個(gè)步驟。本發(fā)明較傳統(tǒng)的智能信息識(shí)別計(jì)算方式有效的簡(jiǎn)化了數(shù)據(jù)計(jì)算的過程,提高了數(shù)據(jù)運(yùn)算效率。特別是在大數(shù)據(jù)處理環(huán)境下,本模塊可以有效地降低識(shí)別過程對(duì)計(jì)算系統(tǒng)硬件的要求,為提高各分系統(tǒng)活性,降低各分系統(tǒng)之間通訊開銷提供了有效的解決方案。
【專利說(shuō)明】
-種粗繼近似表示系統(tǒng)中DE近似表示的加速模塊計(jì)算方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于智能數(shù)據(jù)辨識(shí)處理技術(shù)領(lǐng)域,具體設(shè)及一種粗糖近似表示系統(tǒng)中DE近 似表示的加速模塊計(jì)算方法。
【背景技術(shù)】
[0002] 在捜索引擎、郵件分類等數(shù)據(jù)分類過程中,人們會(huì)使用多種判別方法將其所得數(shù) 據(jù)進(jìn)行分類整理。運(yùn)種分類的形成就是數(shù)據(jù)挖掘出來(lái)知識(shí),使用運(yùn)種知識(shí),人們可W探索, 如Google使用其捜索引擎探索量子計(jì)算機(jī)構(gòu)建的可能性等。
[0003] 使用擬單層覆蓋粗糖集理論構(gòu)建的知識(shí)表示系統(tǒng)可用于存儲(chǔ)整理分類知識(shí),并其 分類知識(shí)應(yīng)用于識(shí)別未知信息。隨著數(shù)據(jù)的快速增加存儲(chǔ)及識(shí)別過程速度也會(huì)降低,那么 在源數(shù)據(jù)數(shù)量日益增加的今天,快速地將未知數(shù)據(jù)集在已有數(shù)據(jù)集的基礎(chǔ)上進(jìn)行表示、識(shí) 別是我們面臨的挑戰(zhàn)。
[0004] -個(gè)需刻畫集在粗糖近似表示系統(tǒng)中DE近似表示主要依賴于近似表示系統(tǒng)中數(shù) 據(jù)集的覆蓋及系統(tǒng)中點(diǎn)集與覆蓋集的關(guān)系運(yùn)兩部分內(nèi)容。正是因?yàn)橐蕾囆?,在?shù)據(jù)量比較 大的時(shí)候,DE近似表示模塊也面臨著計(jì)算效能不高的情況,因此有必要發(fā)明一種新模塊,在 不改變運(yùn)算結(jié)果前提下,提高運(yùn)算效率。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明目的就在于克服上述不足,提供一種粗糖近似表示系統(tǒng)中DE近似表示的加 速模塊。
[0006] 為實(shí)現(xiàn)上述目的,本發(fā)明是通過W下技術(shù)方案來(lái)實(shí)現(xiàn): 一種粗糖近似表示系統(tǒng)中DE近似表示加速模塊計(jì)算方法,包括如下步驟: 第一步,構(gòu)建粗糖近似表示系統(tǒng),根據(jù)處理目標(biāo)數(shù)據(jù)內(nèi)容及特點(diǎn),構(gòu)建粗糖近似值表示 系統(tǒng),從該系統(tǒng)中選取相應(yīng)的向量數(shù)據(jù)組,并將所選取的數(shù)據(jù)向量組進(jìn)行分類匯總構(gòu)成數(shù) 據(jù)集覆蓋數(shù)據(jù)陣列; 第二步:形成數(shù)據(jù)映射,基于粗糖近似表示系統(tǒng),形成與數(shù)據(jù)集覆蓋數(shù)據(jù)陣列與待處理 數(shù)據(jù)的一對(duì)多映射,即整理系統(tǒng)中包含的所有覆蓋及覆蓋所對(duì)應(yīng)有數(shù)據(jù)元素; 第=步:輸入數(shù)據(jù),根據(jù)待處理目標(biāo)數(shù)據(jù),輸入需近似表示集X。 第四步:數(shù)據(jù)判斷,任選覆蓋集中一個(gè)覆蓋K,判斷K是否屬于X。若是,貝化屬于X的DE上 下近似表示,若否,則判斷K是否與X相交。若是,貝化屬于X的DE上近似表示,若否,貝化即不屬 于X的上近似表示,也不屬于X的下近似表示。 第五步:數(shù)據(jù)輸出,遍歷覆蓋集中覆蓋,重復(fù)第=步、第四步即可完整刻畫X的肥上下近 似表示并輸出。
[0007] 進(jìn)一步的,所述的第四步中,具體數(shù)據(jù)判斷過程為:若覆蓋K與集合X之間滿足 摟掛愛援Si,則K中所有元素包含于X的DE上下近似表示中,若覆蓋K與集合X之間滿足 K 抵、Xs C,貝化中所有元素包含于X的DE上近似表示中。
[0008] 本發(fā)明較傳統(tǒng)的智能信息識(shí)別計(jì)算方式有效的簡(jiǎn)化了數(shù)據(jù)計(jì)算的過程,提高了數(shù) 據(jù)運(yùn)算效率。特別是在大數(shù)據(jù)處理環(huán)境下,本模塊可W有效地降低識(shí)別過程對(duì)計(jì)算系統(tǒng)硬 件的要求,為提高各分系統(tǒng)活性,降低各分系統(tǒng)之間通訊開銷提供了有效的解決方案。
【附圖說(shuō)明】
[0009] 圖1是本發(fā)明系統(tǒng)總體流程圖; 圖2是本發(fā)明中DE近似表示生模塊示意圖; 圖3是本發(fā)明中DE下近似集使用算法1與算法2的計(jì)算速度; 圖4是本發(fā)明中DE上近似集使用算法1與算法2的計(jì)算速度。
【具體實(shí)施方式】
[0010] 下面將結(jié)合本發(fā)明的附圖及具體實(shí)施例,對(duì)本發(fā)明的技術(shù)方案進(jìn)行清楚、完整地 描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā) 明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施 例,都屬于本發(fā)明保護(hù)的范圍。
[00川實(shí)施例1 數(shù)據(jù)來(lái)源: 紅酒數(shù)據(jù)集(Wine化化),該集合包含173個(gè)對(duì)象,有13個(gè)條件屬性,1個(gè)決策屬性。 如圖1和2所述,一種粗糖近似表示系統(tǒng)中DE近似表示的加速模塊計(jì)算方法,包括如下 步驟: 一種粗糖近似表示系統(tǒng)中DE近似表示加速模塊計(jì)算方法,包括如下步驟: 第一步,構(gòu)建粗糖近似表示系統(tǒng),根據(jù)紅酒數(shù)據(jù)集(Wine化化),內(nèi)容及特點(diǎn),構(gòu)建粗糖 近似值表示系統(tǒng),從該系統(tǒng)中選取相應(yīng)的向量數(shù)據(jù)組,并將所選取的數(shù)據(jù)向量組進(jìn)行分類 匯總構(gòu)成數(shù)據(jù)集覆蓋數(shù)據(jù)陣列; 第二步:形成數(shù)據(jù)映射,基于粗糖近似表示系統(tǒng),形成與數(shù)據(jù)集覆蓋數(shù)據(jù)陣列與待處理 數(shù)據(jù)的一對(duì)多映射,即整理系統(tǒng)中包含的所有覆蓋及覆蓋所對(duì)應(yīng)有數(shù)據(jù)元素;
' 第=步:輸入數(shù)據(jù),根據(jù)待勿:理目標(biāo)數(shù)據(jù),輸入需近似表示集X,隨機(jī)生成一個(gè)需表示集' X={ 0, 32, 85, 172, 12, 115, 176, 13, 22, 168, 23, 40, 135, 23, 132, 147, 98}; 第四步:數(shù)據(jù)判斷,任選覆蓋集中一個(gè)覆蓋K,判斷K是否屬于X。若是,貝化屬于X的DE上 下近似表示,若否,則判斷K是否與X相交。若是,貝化屬于X的DE上近似表示,若否,貝化即不屬 于X的上近似表示,也不屬于X的下近似表示; X的DE下近似表示=y&!4244211224112, 1122122421421,2222411424112, 2222111412112, 2122222121441, 2142122121244, 4121144242424, 4121222221422, 2224211112111, 4121222121244, 4222111214112, 2422111414112, 4121244242242, 1112144122222, 4121444142244}, X的DE上近似表示=IJ 叫(4244211224112,1122122421421,2222411424112, 2222111412112, 2122222121441, 2142122121244, 4121144242424, 4121222221422, 2224211112111, 4121222121244, 4222111214112, 2422111414112, 4121244242242, 1112144122222, 4121122122424, 4121444142244}; 第五步:數(shù)據(jù)輸出,遍歷覆蓋集中覆蓋,重復(fù)第=步、第四步即可完整刻畫X的肥上下近 似表示并輸出, X的DE下近似表示={0,13,22,23,32,40,85,98,115,132,135,147,168, 172, 176}; X的DE上近似表示={ 0,11,12,13,22,23,32,40,85,98,115,132,135, 147, 168, 172, 176}。
[0012]實(shí)施例2 森林覆蓋類型數(shù)據(jù)(Forest Covertype Data)的部分?jǐn)?shù)據(jù),F(xiàn)orest Covertype Da1:a其 中包含581012個(gè)對(duì)象,有54個(gè)條件屬性,I個(gè)決策屬性; 如圖1和2所述的一種粗糖近似表示系統(tǒng)中DE近似表示加速模塊計(jì)算方法,包括如下步 驟: 第一步,構(gòu)建粗糖近似表示系統(tǒng),根據(jù)處理目標(biāo)數(shù)據(jù)內(nèi)容及特點(diǎn),構(gòu)建粗糖近似值表示 系統(tǒng),從該系統(tǒng)中選取相應(yīng)的向量數(shù)據(jù)組,并將所選取的數(shù)據(jù)向量組進(jìn)行分類匯總構(gòu)成數(shù) 據(jù)集覆蓋數(shù)據(jù)陣列,此處選用Forest Covedype Data中較滋滿的對(duì)象,約2906個(gè)對(duì) 象,條件屬性選取前6個(gè)條件屬性。 第二步:形成數(shù)據(jù)映射,基于粗糖近似表示系統(tǒng),形成與數(shù)據(jù)集覆蓋數(shù)據(jù)陣列與待處理 數(shù)據(jù)的一對(duì)多映射,即整理系統(tǒng)中包含的所有覆蓋及覆蓋所對(duì)應(yīng)有數(shù)據(jù)元素;
' 第=步:輸入數(shù)據(jù),根據(jù)待處理目標(biāo)數(shù)據(jù),輸入需近似表示集X,在數(shù)據(jù)中隨機(jī)選取I 25%-35%的數(shù)據(jù)對(duì)象組成一個(gè)測(cè)試用"需刻畫集",選取100個(gè)"需刻畫集r (局部);
第四步:數(shù)據(jù)判斷,任選覆蓋集中一個(gè)覆蓋K,判斷K是否屬于X。若是,貝化屬于X的DE上 下近似表示,若否,則判斷K是否與X相交。若是,貝化屬于X的DE上近似表示,若否,貝化即不屬 于X的上近似表示,也不屬于X的下近似表示。
[0013] 第五步:數(shù)據(jù)輸出,遍歷覆蓋集中覆蓋,重復(fù)第S步、第四步即可完整刻畫X的DE上 下近似表示并輸出。
[0014] 基于上述步驟進(jìn)行計(jì)算,傳統(tǒng)的粗糖近似表示空間中DE近似表示計(jì)算算法(簡(jiǎn)記 為算法1)與本發(fā)明DE表示加速算法(簡(jiǎn)記為算法2)計(jì)算100組需表示集X的DE近似表示。其 中,X中各個(gè)需要表示集的DE下近似集使用算法1與算法2的計(jì)算速度如圖3所示,其中由于 計(jì)算度量方面的考慮,將算法2的時(shí)間放大200000倍進(jìn)行表示。
[0015] X中各個(gè)需要表示集的DE上近似集使用算法1與算法2的計(jì)算速度如圖4所示,其 中由于計(jì)算度量方面的考慮,將算法2的時(shí)間放大1000倍進(jìn)行表示: W上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉 本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明掲露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在 本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述W權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1. 一種粗糙近似表示系統(tǒng)中DE近似表示加速模塊計(jì)算方法,其特征在于:所述的粗糙 近似表示系統(tǒng)中DE近似表示加速模塊計(jì)算方法包括如下步驟: 第一步,構(gòu)建粗糙近似表示系統(tǒng),根據(jù)處理目標(biāo)數(shù)據(jù)內(nèi)容及特點(diǎn),構(gòu)建粗糙近似值表示 系統(tǒng),從該系統(tǒng)中選取相應(yīng)的向量數(shù)據(jù)組,并將所選取的數(shù)據(jù)向量組進(jìn)行分類匯總構(gòu)成數(shù) 據(jù)集覆蓋數(shù)據(jù)陣列; 第二步:形成數(shù)據(jù)映射,基于粗糙近似表示系統(tǒng),形成與數(shù)據(jù)集覆蓋數(shù)據(jù)陣列與待處理 數(shù)據(jù)的一對(duì)多映射,即整理系統(tǒng)中包含的所有覆蓋及覆蓋所對(duì)應(yīng)有數(shù)據(jù)元素; 第三步:輸入數(shù)據(jù),根據(jù)待處理目標(biāo)數(shù)據(jù),輸入需近似表示集X; 第四步:數(shù)據(jù)判斷,任選覆蓋集中一個(gè)覆蓋K,判斷K是否屬于X,若是,則K屬于X的DE上 下近似表示,若否,則判斷K是否與X相交,若是,則K屬于X的DE上近似表示,若否,則K即不屬 于X的上近似表示,也不屬于X的下近似表示; 第五步:數(shù)據(jù)輸出,遍歷覆蓋集中覆蓋,重復(fù)第三步、第四步即可完整刻畫X的DE上下近 似表不并輸出。2. 根據(jù)權(quán)利要求1所述的一種粗糙近似表示系統(tǒng)中DE近似表示的加速模塊計(jì)算方法, 其特征在于:所述的第四步中,具體數(shù)據(jù)判斷過程為:若覆蓋K與集合X之間滿足 ,則K中所有元素包含于X的DE上下近似表示中,若覆蓋K與集合X之間滿足1??拿:?? XV0 ,則K中所有元素包含于X的DE上近似表示中。
【文檔編號(hào)】G06K9/62GK106022476SQ201610238081
【公開日】2016年10月12日
【申請(qǐng)日】2016年4月15日
【發(fā)明人】吳正江, 毋東, 張江麗
【申請(qǐng)人】河南理工大學(xué)