亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于Apriori算法的學(xué)生就業(yè)數(shù)據(jù)分析方法與流程

文檔序號(hào):11730115閱讀:1022來(lái)源:國(guó)知局
一種基于Apriori算法的學(xué)生就業(yè)數(shù)據(jù)分析方法與流程

本發(fā)明涉及高校學(xué)生就業(yè)數(shù)據(jù)分析領(lǐng)域,尤其涉及一種基于apriori算法的學(xué)生就業(yè)數(shù)據(jù)分析方法。



背景技術(shù):

計(jì)算機(jī)技術(shù)與信息技術(shù)的快速發(fā)展,對(duì)人類(lèi)社會(huì)進(jìn)步與發(fā)展產(chǎn)生了巨大影響。它使人類(lèi)社會(huì)由工業(yè)化進(jìn)入到信息化時(shí)代,同時(shí)隨著現(xiàn)代人生活節(jié)奏的加快及技術(shù)的進(jìn)步,人們獲取信息數(shù)據(jù)也更容易,進(jìn)而使數(shù)據(jù)的存儲(chǔ)量急劇增加。然而,面對(duì)大量的雜亂數(shù)據(jù),人們更加關(guān)注的并非數(shù)據(jù)本身,而是隱藏在數(shù)據(jù)背后的一些重要信息。面對(duì)這一挑戰(zhàn),數(shù)據(jù)挖掘應(yīng)運(yùn)而生。數(shù)據(jù)挖掘有許多研究方向,關(guān)聯(lián)規(guī)則挖掘就是其中之一,它反映了大量數(shù)據(jù)之間存在的相關(guān)聯(lián)系。

本發(fā)明是在針對(duì)典型的關(guān)聯(lián)規(guī)則挖掘算法apriori算法基礎(chǔ)上,并將其關(guān)聯(lián)規(guī)則挖掘的技術(shù)應(yīng)用到學(xué)生就業(yè)數(shù)據(jù)的分析之中。通過(guò)對(duì)學(xué)生的相關(guān)成績(jī)和就業(yè)數(shù)據(jù)的分析及研究,得到相關(guān)專(zhuān)業(yè)的學(xué)生就業(yè)與專(zhuān)業(yè)課程之間、學(xué)生綜合測(cè)評(píng)及技能鑒定等之間存在的關(guān)系,以此為學(xué)校的學(xué)生就業(yè)提供參考依據(jù),為學(xué)校的專(zhuān)業(yè)課程設(shè)置提供參考意見(jiàn)。



技術(shù)實(shí)現(xiàn)要素:

為了克服現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種基于apriori算法的學(xué)生就業(yè)數(shù)據(jù)分析方法。

本發(fā)明技術(shù)方案一種基于apriori算法的學(xué)生就業(yè)數(shù)據(jù)分析方法,其特征在于,包括以下步驟:

1)、為各個(gè)高校相關(guān)專(zhuān)業(yè)學(xué)生專(zhuān)業(yè)課成績(jī)、學(xué)生綜合測(cè)評(píng)成績(jī)、技能鑒定及就業(yè)數(shù)據(jù)提供接口,實(shí)現(xiàn)將高校學(xué)生就業(yè)資源整合到高校學(xué)生就業(yè)資源聯(lián)合檢索平臺(tái)上。

2)、將步驟101整合的事務(wù)數(shù)據(jù)庫(kù)資源采用apriori算法來(lái)生成子數(shù)據(jù)庫(kù),即通過(guò)挖掘數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則生成分級(jí)子數(shù)據(jù)庫(kù),具體步驟為:

a、預(yù)先設(shè)定最小支持?jǐn)?shù)mincount,掃描事務(wù)數(shù)據(jù)庫(kù)db并計(jì)數(shù)得到c1,找出滿足最小支持計(jì)數(shù)的1-頻繁項(xiàng)集,記為l1;

b、重新組合l1中的項(xiàng)集產(chǎn)生候選集c2,再次掃描事務(wù)數(shù)據(jù)庫(kù),找出滿足最小支持計(jì)數(shù)的2-頻繁項(xiàng)集l2;

3)、根據(jù)步驟102中得到的頻繁項(xiàng)集l2,由apriori_gen(l2)重新組合l2中的項(xiàng)集產(chǎn)生候選集c3,刪除候選集c3中不屬于l2的候選項(xiàng)集;如此循環(huán)下去,直到不能找到新的頻繁k-項(xiàng)集,即掃描事務(wù)數(shù)據(jù)庫(kù),發(fā)現(xiàn)li為空集,則算法結(jié)束,最后得到的頻集作為主數(shù)據(jù)庫(kù),然后利用所得到的分級(jí)子數(shù)據(jù)庫(kù)及主數(shù)據(jù)庫(kù)進(jìn)行聯(lián)合分析。得到相關(guān)專(zhuān)業(yè)的學(xué)生就業(yè)與專(zhuān)業(yè)課程之間、學(xué)生綜合測(cè)評(píng)及技能鑒定等之間存在的關(guān)系,以此為學(xué)校的學(xué)生就業(yè)提供參考依據(jù),為學(xué)校的專(zhuān)業(yè)課程設(shè)置提供參考意見(jiàn)。

本發(fā)明技術(shù)有益效果:

本發(fā)明提出一種基于apriori算法的學(xué)生就業(yè)數(shù)據(jù)分析方法。通過(guò)對(duì)各個(gè)高校相關(guān)專(zhuān)業(yè)學(xué)生就業(yè)資源整合,利用apriori算法,通過(guò)對(duì)學(xué)生的相關(guān)的成績(jī)和就業(yè)數(shù)據(jù)的分析及研究,得到相關(guān)專(zhuān)業(yè)的學(xué)生就業(yè)與專(zhuān)業(yè)課程之間、學(xué)生綜合測(cè)評(píng)及技能鑒定等之間存在的關(guān)系,以此為學(xué)校的學(xué)生就業(yè)提供參考依據(jù),為學(xué)校的專(zhuān)業(yè)課程設(shè)置提供參考意見(jiàn)。

附圖說(shuō)明

圖1為本發(fā)明的apriori算法流程圖,

圖2為本發(fā)明的apriori算法生成分級(jí)子數(shù)據(jù)庫(kù)示意圖,

圖3為本發(fā)明的apriori算法生成主數(shù)據(jù)庫(kù)示意圖。

具體實(shí)施方式

為便于本領(lǐng)域技術(shù)人員理解本發(fā)明技術(shù)方案,現(xiàn)結(jié)合說(shuō)明書(shū)附圖對(duì)本發(fā)明技術(shù)方案做進(jìn)一步的說(shuō)明。

本發(fā)明包括兩個(gè)部分,第一部分是apriori算法生成分級(jí)子數(shù)據(jù)庫(kù),即通過(guò)挖掘數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則生成分級(jí)子數(shù)據(jù)庫(kù)。第二部分是apriori算法生成主數(shù)據(jù)庫(kù),即在分級(jí)子數(shù)據(jù)庫(kù)的基礎(chǔ)上再利用apriori算法進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,獲得最終的主數(shù)據(jù)庫(kù)。

詳細(xì)方案描述

1、apriori算法生成分級(jí)子數(shù)據(jù)庫(kù)

apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法。其核心是基于兩階段頻集思想的遞推算法。該關(guān)聯(lián)規(guī)則在分類(lèi)上屬于單維、單層、布爾關(guān)聯(lián)規(guī)則。在這里,所有支持度大于最小支持度的項(xiàng)集稱(chēng)為頻繁項(xiàng)集,簡(jiǎn)稱(chēng)頻集。

apriori算法使用層次順序搜索的循環(huán)方法產(chǎn)生頻繁項(xiàng)集,即用頻繁k-項(xiàng)集探索產(chǎn)生(k+1)-項(xiàng)集。找出長(zhǎng)度為1的頻繁項(xiàng)集,記為l1,用于產(chǎn)生頻繁2-項(xiàng)集l2的集合,而l2用于產(chǎn)生頻繁3-項(xiàng)集l3的,如此循環(huán)下去,直到不能找到新的頻繁k-項(xiàng)集。

假設(shè)圖書(shū)電子資源事務(wù)數(shù)據(jù)庫(kù)db中包含4個(gè)事務(wù),即|db|=4,最小支持?jǐn)?shù)mincount=2,即最小支持度minsup=2/4=50%。挖掘頻繁項(xiàng)目集的具體過(guò)程如下所述:

(1)數(shù)據(jù)過(guò)濾

首先對(duì)事務(wù)數(shù)據(jù)庫(kù)db進(jìn)行掃描并且計(jì)數(shù),得到c1,取出計(jì)數(shù)大于最小支持?jǐn)?shù)的項(xiàng)集(其中項(xiàng)集dn8uhelbkzum的支持?jǐn)?shù)為1小于最小支持?jǐn)?shù)2,刪除dn8uhelbkzum項(xiàng)集),產(chǎn)生l1={{a},,{c},{f}}。第一次數(shù)據(jù)庫(kù)掃描產(chǎn)生的關(guān)聯(lián)規(guī)則會(huì)產(chǎn)生冗余數(shù)據(jù),繼續(xù)對(duì)數(shù)據(jù)庫(kù)進(jìn)行第二次掃描。

(2)分級(jí)子數(shù)據(jù)庫(kù)的生成

由apriori_gen(l1)(產(chǎn)生相應(yīng)的候選項(xiàng)集)生成c2,掃描數(shù)據(jù)庫(kù)db,對(duì)c2中的每個(gè)項(xiàng)集進(jìn)行計(jì)數(shù)(其中{a,b},{a,c}支持?jǐn)?shù)為1,小于最小支持?jǐn)?shù)2,刪除{a,b},{a,c}兩個(gè)項(xiàng)集),計(jì)算c2中每個(gè)候選集得到l2,所得到l2的中的頻繁項(xiàng)集{a,c},{b,c},{b,f},{c,f}作為事物數(shù)據(jù)庫(kù)的分級(jí)子數(shù)據(jù)庫(kù),生成過(guò)程如圖2所示。

2、apriori算法生成主數(shù)據(jù)庫(kù)

根據(jù)生成的分級(jí)子數(shù)據(jù)庫(kù)l2,由apriori_gen(l2)生成c3,掃描事務(wù)數(shù)據(jù)庫(kù)d,對(duì)c3中的每個(gè)項(xiàng)目進(jìn)行計(jì)數(shù),取出c3中大于最小支持?jǐn)?shù)的項(xiàng)集(其中{a,b,c},{a,b,f},{a,c,f}三個(gè)項(xiàng)集的支持?jǐn)?shù)為1,小于最小支持?jǐn)?shù)2,刪除該三項(xiàng),留下計(jì)數(shù)大于最小支持?jǐn)?shù)的項(xiàng)集),最終得到l3,其中{b,c,f}是最后得到的頻集作為主數(shù)據(jù)庫(kù),生成過(guò)程如圖3所示。

本發(fā)明方案在上面結(jié)合附圖對(duì)發(fā)明進(jìn)行了示例性描述,顯然發(fā)明具體實(shí)現(xiàn)并不受上述方式的限制,只要采用了本發(fā)明的方法構(gòu)思和技術(shù)方案進(jìn)行的各種非實(shí)質(zhì)性改進(jìn),或未經(jīng)改進(jìn)將發(fā)明的構(gòu)思和技術(shù)方案直接應(yīng)用于其它場(chǎng)合的,均在本發(fā)明的保護(hù)范圍之內(nèi)。



技術(shù)特征:

技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種基于Apriori算法的學(xué)生就業(yè)數(shù)據(jù)分析方法,主要為各個(gè)高校相關(guān)專(zhuān)業(yè)學(xué)生專(zhuān)業(yè)課成績(jī)、學(xué)生綜合測(cè)評(píng)成績(jī)、技能鑒定及就業(yè)數(shù)據(jù)的數(shù)據(jù)庫(kù)提供接口,實(shí)現(xiàn)將高校學(xué)生就業(yè)資源整合到高校學(xué)生就業(yè)資源聯(lián)合檢索平臺(tái)上。利用Apriori算法,通過(guò)對(duì)學(xué)生的相關(guān)成績(jī)和就業(yè)數(shù)據(jù)的分析及研究,得到相關(guān)專(zhuān)業(yè)的學(xué)生就業(yè)與專(zhuān)業(yè)課程之間、學(xué)生綜合測(cè)評(píng)及技能鑒定等之間存在的關(guān)系,以此為學(xué)校的學(xué)生就業(yè)提供參考依據(jù),為學(xué)校的專(zhuān)業(yè)課程設(shè)置提供參考意見(jiàn)。

技術(shù)研發(fā)人員:宋麗萍;韋建國(guó)
受保護(hù)的技術(shù)使用者:阜陽(yáng)職業(yè)技術(shù)學(xué)院
技術(shù)研發(fā)日:2017.03.23
技術(shù)公布日:2017.07.14
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1