基于項(xiàng)加權(quán)和項(xiàng)集關(guān)聯(lián)度的課程正負(fù)模式挖掘方法及系統(tǒng)的制作方法
【專利摘要】一種基于項(xiàng)加權(quán)和項(xiàng)集關(guān)聯(lián)度的課程正負(fù)關(guān)聯(lián)模式挖掘方法及挖掘系統(tǒng),利用教育數(shù)據(jù)預(yù)處理模塊對(duì)教務(wù)數(shù)據(jù)預(yù)處理;利用課程項(xiàng)集模式生成模塊生成課程候選項(xiàng)集,計(jì)算其支持度,由此得到課程頻繁項(xiàng)集和負(fù)項(xiàng)集,根據(jù)課程頻繁項(xiàng)集和負(fù)項(xiàng)集的關(guān)聯(lián)度進(jìn)行項(xiàng)集剪枝,得到有趣的課程頻繁項(xiàng)集和負(fù)項(xiàng)集;利用課程正負(fù)關(guān)聯(lián)規(guī)則模式生成模塊計(jì)算課程關(guān)聯(lián)規(guī)則興趣度和置信度,從課程頻繁項(xiàng)集和負(fù)項(xiàng)集挖掘矩陣加權(quán)課程強(qiáng)正負(fù)關(guān)聯(lián)規(guī)則;課程正負(fù)關(guān)聯(lián)模式顯示模塊將課程模式顯示給用戶,供用戶分析和使用。本發(fā)明方法挖掘的課程候選項(xiàng)集和挖掘時(shí)間明顯減少,避免了無(wú)效的課程關(guān)聯(lián)模式出現(xiàn),挖掘效率得到極大提高,其模式可為教務(wù)管理、決策以及教改提供科學(xué)依據(jù)。
【專利說(shuō)明】基于項(xiàng)加權(quán)和項(xiàng)集關(guān)聯(lián)度的課程正負(fù)模式挖掘方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于教育數(shù)據(jù)挖掘領(lǐng)域,具體是一種基于項(xiàng)加權(quán)和項(xiàng)集關(guān)聯(lián)度的課程正負(fù) 模式挖掘方法及系統(tǒng),適用于教務(wù)數(shù)據(jù)課程正負(fù)關(guān)聯(lián)模式發(fā)現(xiàn),其模式可為教學(xué)改革和教 育管理、決策提供科學(xué)的依據(jù)。該發(fā)明運(yùn)用于高校教務(wù)管理系統(tǒng),可以擴(kuò)展教務(wù)管理功能, 其關(guān)聯(lián)模式可以有助于教師改善和調(diào)整方法,提高教學(xué)質(zhì)量,同時(shí),可以幫助學(xué)生提高學(xué)習(xí) 效果。
【背景技術(shù)】
[0002] 教育數(shù)據(jù)無(wú)加權(quán)關(guān)聯(lián)模式挖掘方法、教育數(shù)據(jù)加權(quán)關(guān)聯(lián)規(guī)則挖掘方法和教育數(shù) 據(jù)矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘方法是目前常見的教育數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘方法。教育數(shù)據(jù)無(wú)加 權(quán)關(guān)聯(lián)規(guī)則挖掘方法是傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘方法在教育信息化領(lǐng)域的具體應(yīng)用。該方法 的特點(diǎn)是各個(gè)項(xiàng)目按平等一致的方式處理,只考慮項(xiàng)目頻度,其缺陷是:在挖掘時(shí)只考慮 課程的選修關(guān)聯(lián),沒有考慮課程之間具有不同的重要性,更沒有考慮學(xué)生選修課程后的 教學(xué)效果(即課程考試成績(jī))。典型的教育數(shù)據(jù)無(wú)加權(quán)關(guān)聯(lián)規(guī)則挖掘方法是Apriori方法 (R. Agrawal, T. Imielinski, A. Swami. Mining association rules between sets of items in large database[C]. In Proceeding of 1993 ACM SIGM0D International Conference on Management of Data, Washington D.C·,1993,(5): 207-216.)及其 改進(jìn)方法(董輝.基于興趣度的高職課程關(guān)聯(lián)規(guī)則挖掘[J].吉首大學(xué)學(xué)報(bào)(自然科學(xué) 版),2012, 33(3) :41-46.李忠嘩,王鳳利,何丕廉.關(guān)聯(lián)規(guī)則挖掘在課程相關(guān)分析中的 應(yīng)用[J].河北農(nóng)業(yè)大學(xué)學(xué)報(bào),2010, 33 (3) :116-119.)。
[0003] 針對(duì)傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘的缺陷,教育數(shù)據(jù)加權(quán)關(guān)聯(lián)規(guī)則挖掘方法不僅考慮課程的 選修關(guān)聯(lián),還給每門課程賦予一定的權(quán)值,以體現(xiàn)課程之間具有不同的重要性。典型的教 育數(shù)據(jù)加權(quán)關(guān)聯(lián)規(guī)則挖掘方法有Cai等(C. H. Cai, A. da, W. C. Fu, et al. Mining Association Rules with Weighted Items [C]//Proceedings of IEEE International database Engineering and Application Symposiums, 1998: 68-77.)提出的加權(quán)關(guān)聯(lián)規(guī) 則挖掘方法(即MINWAL方法)及其改進(jìn)方法(劉建煒,張穎.基于加權(quán)關(guān)聯(lián)規(guī)則算法的 學(xué)生成績(jī)數(shù)據(jù)挖掘研究[J].福建教育學(xué)院學(xué)報(bào),2012 (3) : 123-125.)。教育數(shù)據(jù)加權(quán)關(guān)聯(lián) 規(guī)則挖掘方法的缺陷是:只考慮課程之間的重要性,沒有考慮課程考試成績(jī)的影響。
[0004] 針對(duì)上述缺陷,教育數(shù)據(jù)矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘方法引入項(xiàng)目權(quán)值,考慮了考慮 學(xué)生所選修課程的教學(xué)效果,即考慮課程考試成績(jī),其典型的矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘方法 是譚義紅等提出的向量空間模型中完全加權(quán)關(guān)聯(lián)規(guī)則的挖掘方法(譚義紅,林亞平.向 量空間模型中完全加權(quán)關(guān)聯(lián)規(guī)則的挖掘[J].計(jì)算機(jī)工程與應(yīng)用,2003(13) :208-211.)以 及面向查詢擴(kuò)展的矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘方法MWARM(黃名選,嚴(yán)小衛(wèi),張師超.基于矩 陣加權(quán)關(guān)聯(lián)規(guī)則挖掘的偽相關(guān)反饋查詢擴(kuò)展[J].軟件學(xué)報(bào),2009,20(7) : 1854-1865.)。 當(dāng)前,矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘方法在教育數(shù)據(jù)分析中的典型應(yīng)用是余如等(余如,黃 麗霞,黃名選.教育信息化中課程考試成績(jī)數(shù)據(jù)關(guān)聯(lián)模式的發(fā)現(xiàn).計(jì)算機(jī)與現(xiàn)代 化,2014(2):10-14.)提出的課程成績(jī)數(shù)據(jù)關(guān)聯(lián)模式發(fā)現(xiàn)方法,獲得了顯著的效果?,F(xiàn)有 的教育數(shù)據(jù)完全加權(quán)關(guān)聯(lián)規(guī)則挖掘方法的缺陷是:現(xiàn)有的方法只能挖掘完全加權(quán)正關(guān)聯(lián)規(guī) 則模式,沒有解決矩陣加權(quán)負(fù)關(guān)聯(lián)模式挖掘問(wèn)題,另外,現(xiàn)有方法其所挖掘的關(guān)聯(lián)模式數(shù)量 仍然很龐大,增加用戶選擇所需模式的難度,無(wú)趣的、虛假的和無(wú)效的關(guān)聯(lián)模式還很多,很 難將其技術(shù)上升到應(yīng)用層面。
[0005] 針對(duì)上述問(wèn)題,本發(fā)明根據(jù)教育數(shù)據(jù)的特點(diǎn),提一種新的一種基于項(xiàng)加權(quán)和項(xiàng)集 關(guān)聯(lián)度的課程正負(fù)模式挖掘方法及系統(tǒng),。該發(fā)明方法克服了現(xiàn)有矩陣加權(quán)模式挖掘方法 的不足,不僅能挖掘矩陣加權(quán)課程正負(fù)關(guān)聯(lián)規(guī)則模式,還能夠有效地減少無(wú)趣的和無(wú)效的 課程關(guān)聯(lián)模式出現(xiàn),其課程候選項(xiàng)集和挖掘時(shí)間明顯減少,提高了挖掘效率,其課程關(guān)聯(lián)規(guī) 則模式更接近實(shí)際,可為教學(xué)改革和教育管理、決策提供科學(xué)的依據(jù),在教育信息化教務(wù)數(shù) 據(jù)分析與挖掘領(lǐng)域具有重要的應(yīng)用價(jià)值和廣闊的應(yīng)用前景。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的在于,針對(duì)教育數(shù)據(jù)課程正負(fù)關(guān)聯(lián)模式挖掘進(jìn)行深入探索,提出一 種基于項(xiàng)加權(quán)和項(xiàng)集關(guān)聯(lián)度的課程正負(fù)模式挖掘方法及系統(tǒng),應(yīng)用于教育數(shù)據(jù)挖掘領(lǐng)域, 為教育數(shù)據(jù)課程正負(fù)關(guān)聯(lián)模式挖掘與分析提供新的挖掘方法,通過(guò)課程正負(fù)關(guān)聯(lián)規(guī)則模式 分析發(fā)現(xiàn)教育領(lǐng)域潛在的教育、教學(xué)規(guī)律和教育發(fā)展趨勢(shì),提高任課教師提高教學(xué)質(zhì)量和 學(xué)生的學(xué)習(xí)效果。
[0007] 本發(fā)明所采取的技術(shù)方案是:一種基于項(xiàng)加權(quán)和項(xiàng)集關(guān)聯(lián)度的課程正負(fù)模式挖掘 方法,包括如下步驟: (1)教育數(shù)據(jù)預(yù)處理:待處理的教育數(shù)據(jù)進(jìn)行如下的預(yù)處理:將課程當(dāng)作項(xiàng)目,課程成 績(jī)當(dāng)作項(xiàng)目權(quán)值,課程權(quán)值規(guī)范化為〇至1之間,提取學(xué)生課程信息及其成績(jī),構(gòu)建課程信 息庫(kù)和課程項(xiàng)目庫(kù)。
[0008] (2)挖掘教育數(shù)據(jù)課程矩陣加權(quán)頻繁1-項(xiàng)集A :從課程項(xiàng)目庫(kù)中提取課程候選 1-項(xiàng)集G,累加 G項(xiàng)集權(quán)值fKG),計(jì)算其支持度cisop (6;),與比較,從中挖掘課程 矩陣加權(quán)頻繁1-項(xiàng)集乙加入ci/YS。候選1-項(xiàng)集q支持度的)公式如下:
【權(quán)利要求】
1. 一種基于項(xiàng)加權(quán)和項(xiàng)集關(guān)聯(lián)度的課程正負(fù)模式挖掘方法,其特征在于,包括如下步 驟: (1) 教育數(shù)據(jù)預(yù)處理:待處理的教育數(shù)據(jù)進(jìn)行如下的預(yù)處理:將課程當(dāng)作項(xiàng)目,課程成 績(jī)當(dāng)作項(xiàng)目權(quán)值,課程權(quán)值規(guī)范化為〇至1之間,提取學(xué)生課程信息及其成績(jī),構(gòu)建課程信 息庫(kù)和課程項(xiàng)目庫(kù); (2) 挖掘教育數(shù)據(jù)課程矩陣加權(quán)頻繁1-項(xiàng)集A :從課程項(xiàng)目庫(kù)中提取課程候選1-項(xiàng) 集G,計(jì)算其支持度cisop (6;),與ms比較,從中挖掘課程矩陣加權(quán)頻繁1-項(xiàng)集A加入 ciPIS] (3) 挖掘有趣的矩陣加權(quán)課程頻繁i-項(xiàng)集和負(fù)i-項(xiàng)集% (所述的i > 2),包括以 下(3. 1)步至(3. 3)步: (3. 1)候選i_項(xiàng)集G由課程頻繁(i-Ι)-項(xiàng)集Zh進(jìn)行Apriori連接,然后累加 G的 權(quán)值,計(jì)算其cisopCC;.); (3.2) 對(duì)于課程候選i_項(xiàng)集G支持度cisop(G)彡最小支持度閾值5^,計(jì)算課程頻繁 項(xiàng)集關(guān)聯(lián)度,如果其>最小頻繁關(guān)聯(lián)度閾值?/少,則該G為有趣的矩 陣加權(quán)課程頻繁i_項(xiàng)集并加入課程頻繁項(xiàng)集集合ci/YS ; (3. 3)對(duì)于課程候選i_項(xiàng)集6;.支持度ms,計(jì)算課程負(fù)項(xiàng)集關(guān)聯(lián)度 ciMTP(G),若其ciMTP(G) >最小負(fù)項(xiàng)集關(guān)聯(lián)度閾值?^,則該G為有趣矩陣加權(quán)課程負(fù) 項(xiàng)集%,并加入課程負(fù)項(xiàng)集集合; (4) 從課程頻繁項(xiàng)集集合ci/YS中挖掘有效的矩陣加權(quán)課程正負(fù)關(guān)聯(lián)規(guī)則模式,包括 以下(4. 1)步至(4. 6)步: (4. 1)從課程頻繁項(xiàng)集集合ci/YS中取出課程頻繁項(xiàng)集,找出的所有真子集; (4. 2)從4.的真子集集合中任意取出兩個(gè)真子集和心,當(dāng)cisop (J7)彡ms, cisop%)彡ms,并且
Λ U心=心,計(jì)算矩陣加權(quán)課程頻繁項(xiàng)集仏,心)的 相關(guān)系數(shù); (4.3) 當(dāng)>相關(guān)系數(shù)閾值
時(shí),計(jì)算咖,?i)的值,若其值 等于1,則得出矩陣加權(quán)課程強(qiáng)關(guān)聯(lián)規(guī)則/7 -厶,加入^7^/?;計(jì)算^_7?(1/7,1厶,5^, W)的值,若其值等于1,則得出矩陣加權(quán)課程強(qiáng)負(fù)關(guān)聯(lián)規(guī)則,乃一,厶,加入uWWP; (4. 4)當(dāng)矩陣加權(quán)課程項(xiàng)集(J7,心)的相關(guān)系數(shù)
計(jì)算 1厶,5^,5^)的值,若其值等于1,則得出矩陣加權(quán)課程強(qiáng)負(fù)關(guān)聯(lián)規(guī)則/7-14,加入 ^姻7?;計(jì)算^_7?(,/7,4,咖,^)的值,若其值等于1,則得出矩陣加權(quán)課程強(qiáng)負(fù)關(guān)聯(lián) 規(guī)則,/ 7 -厶,加入; (4. 5)繼續(xù)(4. 2)步驟,當(dāng)課程頻繁項(xiàng)集的真子集集合中每個(gè)真子集都被取出一 次,而且僅能取出一次,則轉(zhuǎn)入步驟(4.6)步; (4. 6)繼續(xù)(4. 1)步驟,當(dāng)課程頻繁項(xiàng)集集合中每個(gè)頻繁項(xiàng)集都被取出一次,而且 僅能取出一次,則(4)步運(yùn)行結(jié)束,轉(zhuǎn)入(5)步; (5) 從課程負(fù)項(xiàng)集集合中挖掘有效的矩陣加權(quán)課程負(fù)關(guān)聯(lián)規(guī)則模式,包括以下 (5. 1)步至(5. 6)步: (5. 1)從課程負(fù)項(xiàng)集集合中取出課程負(fù)項(xiàng)集%,找出%的所有真子集; (5. 2)從Λ;.的真子集集合中任意取出兩個(gè)真子集J7和心,當(dāng)cisop (J7)彡ms, cisop%)彡ms,并且J7
/盧V,.,計(jì)算矩陣加權(quán)課程負(fù)項(xiàng)集(/7, 4)的相 關(guān)系數(shù)ciPCCHQ ·, (5.3) 當(dāng)矩陣加權(quán)課程負(fù)項(xiàng)集(/7,心)的相關(guān)系數(shù)<
計(jì)算 ?i)的值,若其值等于1,則得出矩陣加權(quán)課程強(qiáng)負(fù)關(guān)聯(lián)規(guī)則 -' I! 一-| 4,加入 cjAii/?; (5.4) 當(dāng)矩陣加權(quán)課程負(fù)項(xiàng)集(/7,心)的相關(guān)系數(shù)_
計(jì)算 κ_τ?σ7,η4,?i)的值,若其值等于1,則得出矩陣加權(quán)課程強(qiáng)負(fù)關(guān)聯(lián)規(guī)則 ,4,加入ci·?;計(jì)算4,咖,ffii)的值,若其值等于1,則得出矩陣加權(quán)課 程強(qiáng)負(fù)關(guān)聯(lián)規(guī)則-厶,加入 (5. 5)繼續(xù)(5. 2)步驟,當(dāng)課程負(fù)項(xiàng)集Μ的真子集集合中每個(gè)真子集都被取出一次, 而且僅能取出一次,則轉(zhuǎn)入步驟(5. 6)步; (5. 6)繼續(xù)(5. 1)步驟,當(dāng)課程頻繁項(xiàng)集集合中每個(gè)負(fù)項(xiàng)集%都被取出一次,而且僅 能取出一次,則(5)步運(yùn)行結(jié)束; 至此,矩陣加權(quán)課程正負(fù)關(guān)聯(lián)模式挖掘結(jié)束; 所述的as為最小支持度閾值,為最小置信度閾值,為最小興趣度閾值,
為相關(guān) 系數(shù)閾值。
2. -種適用于權(quán)利要求1所述的基于項(xiàng)加權(quán)和項(xiàng)集關(guān)聯(lián)度的課程正負(fù)關(guān)聯(lián)模式挖掘 系統(tǒng),其特征在于,包括以下4個(gè)模塊 : 教育數(shù)據(jù)預(yù)處理模塊:將待處理的教育數(shù)據(jù)進(jìn)行預(yù)處理,提取學(xué)生課程信息及其成績(jī), 將課程成績(jī)權(quán)值規(guī)范化為〇至1之間,構(gòu)建課程信息庫(kù)和課程項(xiàng)目庫(kù); 課程項(xiàng)集模式生成模塊:該模塊從課程項(xiàng)目庫(kù)和課程信息庫(kù)挖掘矩陣加權(quán)課程候選 1-項(xiàng)集,計(jì)算其支持度,與支持度閾值比較得到課程頻繁1-項(xiàng)集,從i_項(xiàng)集(i > 2)起,頻 繁(i-Ι)-項(xiàng)集通過(guò)Apriori連接生成課程候選i-項(xiàng)集;計(jì)算課程候選i-項(xiàng)集支持度,與 最小支持度閾值比較得到課程頻繁i_項(xiàng)集和負(fù)i_項(xiàng)集;計(jì)算課程頻繁項(xiàng)集的關(guān)聯(lián)度,與課 程頻繁項(xiàng)集關(guān)聯(lián)度閾值比較得到有趣的課程頻繁項(xiàng)集;計(jì)算課程負(fù)項(xiàng)集關(guān)聯(lián)度,與負(fù)項(xiàng)集 關(guān)聯(lián)度閾值比較得到有趣的課程負(fù)項(xiàng)集; 課程正負(fù)關(guān)聯(lián)規(guī)則模式生成模塊:該模塊生成課程頻繁項(xiàng)集的真子集,計(jì)算課程關(guān)聯(lián) 規(guī)則模式的相關(guān)系數(shù)、興趣度和置信度,與相關(guān)系數(shù)閾值、興趣度閾值和置信度閾值比較, 從課程頻繁項(xiàng)集中挖掘有效的矩陣加權(quán)課程強(qiáng)正負(fù)關(guān)聯(lián)規(guī)則模式;然后生成課程負(fù)項(xiàng)集的 真子集,計(jì)算課程負(fù)關(guān)聯(lián)規(guī)則模式的相關(guān)系數(shù)、興趣度和置信度,與相關(guān)系數(shù)閾值、興趣度 閾值和置信度閾值比較,從課程負(fù)項(xiàng)集中挖掘有效的矩陣加權(quán)課程強(qiáng)負(fù)關(guān)聯(lián)規(guī)則模式; 課程正負(fù)關(guān)聯(lián)模式顯示模塊:該模塊將有效的矩陣加權(quán)課程正負(fù)關(guān)聯(lián)規(guī)則模式顯示給 用戶,供用戶分析和使用。
3. 根據(jù)權(quán)利要求2所述的挖掘系統(tǒng),其特征在于,所述的課程項(xiàng)集模式生成模塊包括 以下3個(gè)模塊: 課程候選項(xiàng)集生成模塊:該模塊從課程項(xiàng)目庫(kù)和課程信息庫(kù)挖掘矩陣加權(quán)課程候選 1-項(xiàng)集,計(jì)算其支持度,與支持度閾值比較得到課程頻繁1-項(xiàng)集,從i-項(xiàng)集α > 2)起,頻 繁(i-1)-項(xiàng)集通過(guò)Apriori連接生成課程候選i-項(xiàng)集,并計(jì)算其項(xiàng)集支持度; 課程頻繁項(xiàng)集生成模塊:該模塊對(duì)于其支持度大于或者等于支持度閾值的課程候選項(xiàng) 集,計(jì)算其課程頻繁項(xiàng)集的關(guān)聯(lián)度,與其關(guān)聯(lián)度閾值比較得到有趣的矩陣加權(quán)課程頻繁項(xiàng) 集; 課程負(fù)項(xiàng)集生成模塊:該模對(duì)于其支持度小于支持度閾值的課程候選項(xiàng)集,計(jì)算其課 程負(fù)項(xiàng)集的關(guān)聯(lián)度,與其關(guān)聯(lián)度閾值比較得到有趣的矩陣加權(quán)課程負(fù)項(xiàng)集。
4. 根據(jù)權(quán)利要求2所述的挖掘系統(tǒng),其特征在于,所述的課程正負(fù)關(guān)聯(lián)規(guī)則模式生成 模塊包括以下2個(gè)模塊: 來(lái)自課程頻繁項(xiàng)集的強(qiáng)正負(fù)關(guān)聯(lián)規(guī)則模式生成模塊:該模塊生成課程頻繁項(xiàng)集的真子 集,計(jì)算課程關(guān)聯(lián)規(guī)則模式的相關(guān)系數(shù)、興趣度和置信度,與相關(guān)系數(shù)閾值、興趣度閾值和 置信度閾值比較,從課程頻繁項(xiàng)集中挖掘有效的矩陣加權(quán)課程強(qiáng)正負(fù)關(guān)聯(lián)規(guī)則模式; 來(lái)自課程負(fù)項(xiàng)集的強(qiáng)負(fù)關(guān)聯(lián)規(guī)則模式生成模塊:該模塊生成課程負(fù)項(xiàng)集的真子集,計(jì) 算課程負(fù)關(guān)聯(lián)規(guī)則模式的相關(guān)系數(shù)、興趣度和置信度,與相關(guān)系數(shù)閾值、興趣度閾值和置信 度閾值比較,從課程負(fù)項(xiàng)集中挖掘有效的矩陣加權(quán)強(qiáng)負(fù)關(guān)聯(lián)規(guī)則模式。
5. 根據(jù)權(quán)利要求2-4中任一項(xiàng)所述的挖掘系統(tǒng),其特征在于,所述的挖掘系統(tǒng)中的支 持度閾值?·5,置信度閾值·?,興趣度閾值,相關(guān)系數(shù)閾值
由用戶輸入。
【文檔編號(hào)】G06Q50/20GK104217013SQ201410486033
【公開日】2014年12月17日 申請(qǐng)日期:2014年9月22日 優(yōu)先權(quán)日:2014年9月22日
【發(fā)明者】黃名選, 韋吉鋒 申請(qǐng)人:廣西教育學(xué)院