本發(fā)明涉及教育信息化技術(shù)領(lǐng)域,尤其涉及一種基于標(biāo)簽的教育資源推薦方法及系統(tǒng)。
背景技術(shù):
近十年來(lái),互聯(lián)網(wǎng)規(guī)模和覆蓋面的迅速增長(zhǎng)帶來(lái)了信息超載的問題,為了解決這個(gè)問題推薦系統(tǒng)變得流行起來(lái)。推薦系統(tǒng)被用于很多場(chǎng)景,例如:電影、音樂、新聞、研究論文等。在基于教育云的在線教育領(lǐng)域也采取了推薦系統(tǒng)去使得學(xué)生提升學(xué)習(xí)效率和體驗(yàn)度,并為學(xué)生提供個(gè)性化的學(xué)習(xí)服務(wù)。
推薦系統(tǒng)在教育領(lǐng)域的應(yīng)用也像國(guó)際上一樣受到越來(lái)越多的關(guān)注,但是關(guān)于教育資源的個(gè)性化網(wǎng)絡(luò)教育推薦系統(tǒng)的研究還不是很成熟。在我們的生活和學(xué)習(xí)中,很多教育資源網(wǎng)站、遠(yuǎn)程教育網(wǎng)站,這些網(wǎng)站的教育資源沒有實(shí)現(xiàn)個(gè)性化,給學(xué)習(xí)者帶來(lái)了很大的不便。國(guó)內(nèi)一些碩士、博士論文出現(xiàn)了一些關(guān)于教育資源推薦系統(tǒng)的研究,例如北方工業(yè)大學(xué)王榮的碩士論文《教育網(wǎng)站資源個(gè)性化推薦系統(tǒng)的研究》,其研究主要專注于改進(jìn)rock聚類和k最近鄰算法實(shí)現(xiàn)推薦系統(tǒng),主要是從推薦算法的角度研究資源推薦;一些大學(xué)的研究機(jī)構(gòu)主要是關(guān)于自適應(yīng)教學(xué)、自適應(yīng)導(dǎo)航方面,例如東北師范大學(xué)、華南師范大學(xué)出現(xiàn)很多的碩士、博士論文研究自適應(yīng)系統(tǒng),在這些自適應(yīng)系統(tǒng)中,雖然資源推薦這一部分也在考慮之中,但是其在這些研究中只是作為很小的一個(gè)方面。資源推送這一塊內(nèi)容是應(yīng)該受到更多的關(guān)注。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是通過對(duì)協(xié)同推薦算法進(jìn)行研究,結(jié)合學(xué)習(xí)者特征和學(xué)習(xí)資源領(lǐng)域特征,設(shè)計(jì)并開發(fā)出滿足協(xié)作學(xué)習(xí)和自助學(xué)習(xí)要求的一種基于標(biāo)簽的教育資源推薦方法及系統(tǒng)。
本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種基于標(biāo)簽的教育資源推薦方法,其步驟如下:
s1:輸入個(gè)人信息和要找的教育資源標(biāo)簽,讀取所述個(gè)人信息并根據(jù)所述教育資源標(biāo)簽在教育資源網(wǎng)絡(luò)中進(jìn)行初次篩選,得到第一組教育資源和第一組用戶集合;
s2:用戶隨機(jī)查看所述第一組教育資源中的一個(gè)教育資源,并對(duì)所述教育資源的難度、相關(guān)度和喜好程度進(jìn)行評(píng)分并得到關(guān)于這三個(gè)評(píng)分標(biāo)準(zhǔn)的評(píng)分向量;并根據(jù)所述第一組用戶集合中的其他用戶關(guān)于所述教育資源的評(píng)分向量構(gòu)建相似度函數(shù),并根據(jù)所述相似度函數(shù)的計(jì)算結(jié)果作正態(tài)分布曲線n(μ,σ),根據(jù)所述正態(tài)分布曲線對(duì)所述第一組用戶集合定義相似用戶群;
s3:從s2得到的所述相似用戶群中篩選出關(guān)于該標(biāo)簽喜好程度最高的教育資源,得到第二組教育資源和第二組用戶集合,對(duì)所述第二組教育資源重復(fù)s2得到第三組教育資源和第三組用戶集合;
s4:對(duì)多次篩選過程中出現(xiàn)過的其他用戶的出現(xiàn)次數(shù)計(jì)算加權(quán)平均數(shù)得到相似用戶的排序值q,并根據(jù)所述排序值q的范圍定義相同水平學(xué)習(xí)者群體并相互關(guān)聯(lián)。
s5:根據(jù)所述相同水平學(xué)習(xí)者群體和每個(gè)相同水平學(xué)習(xí)者的喜好程度顯示關(guān)于其他教育資源標(biāo)簽的教育資源記錄。
進(jìn)一步,所述個(gè)人信息包括用戶名、頭像、性別、年級(jí);所述標(biāo)簽包括學(xué)科、章節(jié)、關(guān)鍵詞;所述評(píng)分標(biāo)準(zhǔn)中的難度評(píng)分從易到難分為1-5,相關(guān)度評(píng)分從不相關(guān)到相關(guān)分為0-5,喜好程度評(píng)分從不喜歡到喜歡分為0-4。
進(jìn)一步,所述相似度函數(shù)定義為ω(α,β)=<α,β>/|α|·|β|,其中α為該用戶的評(píng)分向量(x1,y1,z1),β為其他某個(gè)用戶的評(píng)分向量(x2,y2,z2),其中,x為難度值,y為相關(guān)度值,z為喜好程度值;所述正態(tài)分布曲線n(μ,σ)中,μ為所述s4中的所有用戶的ω(α,β)的均數(shù),σ為s4中的所有用戶的ω(α,β)的方差;所述相似用戶為正態(tài)分布曲線n(μ,σ)中(μ-σ/3~μ+σ/3)范圍內(nèi)的用戶。
進(jìn)一步,所述相似用戶排序值
進(jìn)一步,將所述相似用戶排序值q從大到小進(jìn)行排列,排序在前30%的所述相似用戶排序值q對(duì)應(yīng)的用戶定義為所述相同水平學(xué)習(xí)者群體。
一種基于標(biāo)簽的教育資源推薦系統(tǒng),其特征在于,包括:
第一模塊,用于輸入個(gè)人信息和所要找的教育資源標(biāo)簽,讀取所述個(gè)人信息并根據(jù)所述教育資源標(biāo)簽在所述教育資源網(wǎng)絡(luò)中進(jìn)行初次篩選,得到所述第一組教育資源和所述第一組用戶集合;
第二模塊,用于隨機(jī)查看所述第一組教育資源中的一個(gè)教育資源,并對(duì)所述教育資源的難度、相關(guān)度和喜好程度進(jìn)行評(píng)分并得到關(guān)于這三個(gè)評(píng)分標(biāo)準(zhǔn)的評(píng)分向量;并根據(jù)所述第一組用戶集合中的其他用戶關(guān)于所述教育資源的評(píng)分向量構(gòu)建相似度函數(shù),并根據(jù)所述相似度函數(shù)的計(jì)算結(jié)果作正態(tài)分布曲線n(μ,σ),根據(jù)所述正態(tài)分布曲線對(duì)所述第一組用戶集合定義相似用戶群;
第三模塊,用于從上一步得到的所述相似用戶群中篩選出關(guān)于該標(biāo)簽喜好程度最高的教育資源,得到第二組教育資源和第二組用戶集合,并可重復(fù)進(jìn)行此步驟;
第四模塊,用于多次篩選過程中出現(xiàn)過的其他用戶的出現(xiàn)次數(shù)計(jì)算加權(quán)平均數(shù)得到相似用戶的排序值q,并根據(jù)所述排序值q的范圍定義相同水平學(xué)習(xí)者群體并相互關(guān)聯(lián);
第五模塊,用于根據(jù)所述相同水平學(xué)習(xí)者群體和每個(gè)相同水平學(xué)習(xí)者的喜好程度推薦關(guān)于所搜索的教育資源標(biāo)簽的教育資源。
基于上述技術(shù)方案,本發(fā)明的有益效果是:(1)從基于知識(shí)領(lǐng)域的橫向維度和基于學(xué)習(xí)者的縱向維度,分析學(xué)習(xí)者-標(biāo)簽-知識(shí)點(diǎn)之間的內(nèi)在關(guān)聯(lián),進(jìn)一步挖掘細(xì)分學(xué)習(xí)者群體,設(shè)計(jì)基于標(biāo)簽的教育資源推薦系統(tǒng)模型,為用戶提供高精度、細(xì)粒度的教育資源推薦服務(wù);(2)通過研究個(gè)性化教育的理論基礎(chǔ),主要包括以人為本的教育理論、建構(gòu)主義教育理論和多元智能理論等內(nèi)容,為個(gè)性化資源推薦系統(tǒng)的研究提供理論支撐;(3)研究推薦系統(tǒng)中所用到的推薦技術(shù)。包括關(guān)聯(lián)規(guī)則推薦、基于知識(shí)推薦、協(xié)同過濾的推薦等算法,同時(shí)加入了學(xué)習(xí)者個(gè)性特征和知識(shí)領(lǐng)域特征,以及學(xué)習(xí)者的歷史行為分析等。通過這樣的混合推薦使得推薦系統(tǒng)在推薦學(xué)習(xí)資源時(shí)能從不同的角度考慮學(xué)習(xí)者的根本需求,提高推薦的準(zhǔn)確性。
附圖說明
圖1為一種基于標(biāo)簽的教育資源推薦系統(tǒng)的示意圖。
具體實(shí)施方式
以下結(jié)合附圖對(duì)本發(fā)明的原理和特征進(jìn)行描述,所舉實(shí)例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
一種優(yōu)選的實(shí)施例,用戶首先輸入用戶名:張三,和要找的教育資源標(biāo)簽:高一向量,此時(shí)教育資源網(wǎng)絡(luò)中篩選出第一組教育資源共805個(gè)教育資源,和搜索過此標(biāo)簽的第一組用戶集合,共476個(gè)用戶;
隨機(jī)查看第一組教育資源中任意一個(gè)教育資源a,并對(duì)教育資源a的難度、相關(guān)度和喜好程度打分,三項(xiàng)分別為1分、3分、2分,建立評(píng)分向量得到a0(1,2,3),同時(shí),教育資源a共有205個(gè)評(píng)分,因此有205個(gè)評(píng)分向量a1、a2……a205,做相似度計(jì)算ω(a0,a1)=<a0,a1>/|a0|·|a1|、ω(a0,a2)=<a0,a2>/|a0|·|a2|……ω(a0,a205)=<a0,a205>/|a0|·|a1|,將ω(a0,a1)……ω(a0,a205)共205個(gè)相似度值計(jì)算正態(tài)分布曲線線n(μ,σ),得到μ=0.05,σ=0.86,將-0.236到0.336范圍內(nèi)的值所對(duì)應(yīng)的用戶定位為相似用戶群,第一組相似用戶群共有53個(gè)用戶。
從第一組相似用戶群的53個(gè)用戶中的任一個(gè)用戶選擇對(duì)“高一向量”教育資源喜好程度評(píng)分為4的資源,共86個(gè)教育資源,從中選擇任一教育資源b進(jìn)行評(píng)分,三項(xiàng)分別為2分、1分、3分,建立評(píng)分向量b0(2,1,3),同時(shí),教育資源b共有154個(gè)評(píng)分,因此有154個(gè)評(píng)分向量b1、b2……b154,做相似度計(jì)算ω(b0,b1)=<b0,b1>/|b0|·|b1|、ω(b0,b2)=<b0,b2>/|b0|·|b2|……ω(b0,b154)=<b0,b154>/|b0|·|b154|,將ω(b0,b1)……ω(b0,b154)共154個(gè)相似度值計(jì)算正態(tài)分布曲線n(μ,σ),得到μ=0.03,σ=0.82,同理,將-0.243到0.303范圍內(nèi)的值所對(duì)應(yīng)的用戶定位為相似用戶群,第二組相似用戶群共38個(gè)用戶。
重復(fù)以上步驟或多次查找教育資源后,推薦過程中出現(xiàn)過的其他用戶的出現(xiàn)次數(shù)計(jì)算加權(quán)平均數(shù)得到相似用戶的排序值q,例如用戶e在某次搜索中的第一次和第三次都出現(xiàn)過,同時(shí)第一次共有176個(gè)資源評(píng)分,第三次共有120個(gè)資源評(píng)分,則q=1/176+3/120=0.03,并根據(jù)此方法對(duì)所有出現(xiàn)過的其他用戶的出現(xiàn)次數(shù)進(jìn)行計(jì)算并由大到小排序,將排序前30%的q值對(duì)應(yīng)的用戶定義為相同水平學(xué)習(xí)者群體并相互關(guān)聯(lián);同時(shí)推薦出每個(gè)相同水平學(xué)習(xí)者中喜好程度為4的關(guān)于該教育資源標(biāo)簽的教育資源。
本發(fā)明還提供一種基于標(biāo)簽的教育資源推薦系統(tǒng),如圖1所示,包括:
第一模塊,用于輸入個(gè)人信息和所要找的教育資源標(biāo)簽,讀取個(gè)人信息并根據(jù)教育資源標(biāo)簽在教育資源網(wǎng)絡(luò)中進(jìn)行初次篩選,得到第一組教育資源和第一組用戶集合;
第二模塊,用于隨機(jī)查看第一組教育資源中的一個(gè)教育資源,并對(duì)教育資源的難度、相關(guān)度和喜好程度進(jìn)行評(píng)分并得到關(guān)于這三個(gè)評(píng)分標(biāo)準(zhǔn)的評(píng)分向量;并根據(jù)第一組用戶集合中的其他用戶關(guān)于教育資源的評(píng)分向量構(gòu)建相似度函數(shù),并根據(jù)相似度函數(shù)的計(jì)算結(jié)果作正態(tài)分布曲線n(μ,σ),根據(jù)正態(tài)分布曲線對(duì)第一組用戶集合定義相似用戶群;
第三模塊,用于從上一步得到的相似用戶群中篩選出關(guān)于該標(biāo)簽喜好程度最高的教育資源,得到第二組教育資源和第二組用戶集合,并可重復(fù)進(jìn)行此步驟;
第四模塊,用于多次推薦過程中出現(xiàn)過的其他用戶的出現(xiàn)次數(shù)計(jì)算加權(quán)平均數(shù)得到相似用戶的排序值q,并根據(jù)排序值q的范圍定義相同水平學(xué)習(xí)者群體并相互關(guān)聯(lián);
第五模塊,用于根據(jù)相同水平學(xué)習(xí)者群體和每個(gè)相同水平學(xué)習(xí)者的喜好程度顯示關(guān)于其他教育資源標(biāo)簽的教育資源記錄;
第六模塊,用于存儲(chǔ)每位用戶的每次搜索過程和結(jié)果。
以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。