一種基于建構(gòu)學(xué)習(xí)理論的個性化即時學(xué)習(xí)支持系統(tǒng)與方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明公開了一種社交網(wǎng)絡(luò)中用戶知識需求分析,個性化即時知識推薦的系統(tǒng)與 方法,屬于個性化知識推薦的領(lǐng)域。
【背景技術(shù)】
[0002] 現(xiàn)如今,人們?nèi)粘I钤絹碓诫x不開社交網(wǎng)絡(luò)。單就新浪微博數(shù)據(jù)顯示,截止2014 年十月,微博月活躍用戶數(shù)已經(jīng)達(dá)到1. 67億人。人們通過社交網(wǎng)絡(luò)來實現(xiàn)信息傳播、信息 分享、信息獲取。本文W新浪微博該一社交網(wǎng)絡(luò)為平臺進(jìn)行說明。
[0003] 微博功能日益強(qiáng)大,大量增長的微博信息在給人們帶來方便的同時也造成了信息 過載等問題。用戶每天接收的微博數(shù)據(jù)中包含了各個知識領(lǐng)域的不同知識,同時包含大量 與學(xué)術(shù)知識毫不相干的無用信息,導(dǎo)致用戶在"刷微博"的時候需要主動過濾大量的不相干 信息,篩選有用的信息來閱讀,大大增加了用戶刷微博時的負(fù)擔(dān)。
[0004] 此外,對于一些未曾接觸過的陌生知識,用戶通過在捜索引擎中輸入關(guān)鍵詞來檢 索相關(guān)的網(wǎng)頁,然后從中選擇有價值的網(wǎng)頁來閱讀。因此用戶每學(xué)習(xí)一條新知識都將經(jīng)歷 繁瑣的檢索篩選過程,并且該個過程并不能確保用戶最終檢索到的內(nèi)容是自己感興趣的。 因此用戶"刷微博"是一個走馬觀花,漫無目的的學(xué)習(xí)過程,沒有一個系統(tǒng)的規(guī)劃,該可能導(dǎo) 致用戶重復(fù)學(xué)習(xí),花費多余的時間。
[0005] 如何幫助微博用戶篩選有效的信息,過濾無用的、不感興趣的信息,并在此基礎(chǔ)上 分析用戶的興趣愛好,給用戶作出個性化的學(xué)習(xí)推薦,是一個亟待解決的問題。
[0006] 學(xué)習(xí)推薦系統(tǒng)在一定程度上解決了W上提出的問題。但現(xiàn)有的學(xué)習(xí)推薦系統(tǒng)還存 在一些不足之處;①不能實時獲取用戶的學(xué)習(xí)興趣。②推薦內(nèi)容用戶感興趣程度不高。⑨ 學(xué)習(xí)內(nèi)容形式復(fù)雜,導(dǎo)致學(xué)習(xí)負(fù)擔(dān)重,降低用戶學(xué)習(xí)興趣。④沒有針對用戶系統(tǒng)全面的學(xué)習(xí) 規(guī)劃。
[0007] 針對W上不足,本發(fā)明公布了一種基于建構(gòu)學(xué)習(xí)理論的個性化即時學(xué)習(xí)支持系統(tǒng) 與方法。
【發(fā)明內(nèi)容】
[000引本發(fā)明旨在彌補(bǔ)上述學(xué)習(xí)推薦系統(tǒng)的不足,它提供了一種社交網(wǎng)絡(luò)中根據(jù)用戶知 識需求即時給用戶推薦個性化學(xué)習(xí)資源的學(xué)習(xí)推薦系統(tǒng)。本發(fā)明重在為用戶營造一個個性 化的學(xué)習(xí)環(huán)境,幫助用戶即時發(fā)現(xiàn)學(xué)習(xí)興趣點,彌補(bǔ)知識缺陷,建構(gòu)完整的知識結(jié)構(gòu)。本發(fā) 明著重考慮兩點:①實時動態(tài)分析用戶知識需求,發(fā)現(xiàn)用戶期望的知識缺失,即時推薦學(xué)習(xí) 資源。②通過引入有向標(biāo)簽關(guān)系圖,實現(xiàn)基于建構(gòu)的學(xué)習(xí)資源推薦。
[0009] 本發(fā)明提供的基于微知識建構(gòu)的個性化即時學(xué)習(xí)支持系統(tǒng)與方法,包括W下步 驟:
[0010] 用戶知識背景分析;首先通過獲取大量微博認(rèn)證用戶的微博標(biāo)簽,統(tǒng)計分析不同 人群對不同微博標(biāo)簽的喜好,然后通過分析目標(biāo)用戶的微博標(biāo)簽預(yù)測該用戶所屬人群,進(jìn) 而預(yù)測目標(biāo)用戶對哪些知識領(lǐng)域感興趣。然后批量獲取用戶及其關(guān)注好友最新發(fā)表的微博 狀態(tài),按發(fā)表的時間先后整合成一個微博狀態(tài)文檔,運用改進(jìn)的TF-IDF算法自動提取文檔 關(guān)鍵詞。最終得到一組帶權(quán)重的關(guān)鍵詞,表示用戶當(dāng)前關(guān)注的知識點,即為用戶的知識背 景。
[0011] 構(gòu)建有向標(biāo)簽關(guān)系圖;有向標(biāo)簽關(guān)系圖存儲了所有知識點之間存在的一種內(nèi)在 聯(lián)系,即知識內(nèi)容上的包含、互斥等關(guān)系。整個標(biāo)簽關(guān)系圖的知識結(jié)構(gòu)是一個網(wǎng)狀的結(jié)構(gòu)。 標(biāo)簽關(guān)系圖包含的內(nèi)容可W分為幾個大的知識領(lǐng)域,每一個知識領(lǐng)域的知識結(jié)構(gòu)是樹形結(jié) 構(gòu)。每一個大的知識領(lǐng)域由一個知識的根結(jié)點一層層的往下細(xì)分,最后形成一個樹形結(jié)構(gòu)。
[0012] 構(gòu)建擴(kuò)展知識庫;擴(kuò)展知識庫是為了滿足用戶對知識的進(jìn)一步需求,當(dāng)用戶對系 統(tǒng)推薦的微知識感興趣時,系統(tǒng)將給用戶推薦針對該微知識的擴(kuò)展知識,該可能是一個和 該微知識相關(guān)的網(wǎng)站,或者是一篇文章。
[0013] 發(fā)現(xiàn)用戶期望的缺失知識;用戶在刷微博的同時學(xué)到的知識是零散的不全面的, 存在知識的缺失。有向標(biāo)簽關(guān)系圖提供的是一個完整的知識結(jié)構(gòu)體系,相當(dāng)于為用戶制定 了一個全面的學(xué)習(xí)計劃。將用戶當(dāng)前關(guān)注的知識點標(biāo)記在標(biāo)簽關(guān)系圖中,從中發(fā)現(xiàn)與用戶 當(dāng)前關(guān)注知識點密切相關(guān)的但是是用戶未曾接觸過的知識,推薦給用戶學(xué)習(xí),從而幫助用 戶達(dá)到知識查漏補(bǔ)缺的目的。
[0014] 實現(xiàn)基于建構(gòu)的學(xué)習(xí)資源推薦:將用戶期望的缺失知識作為待推薦知識,推薦給 用戶學(xué)習(xí)。用戶學(xué)習(xí)缺失知識的過程就是一個構(gòu)建知識的過程。用戶每學(xué)習(xí)一個缺失知識, 用戶的知識結(jié)構(gòu)就會更加完善。
【附圖說明】
[0015] 圖1學(xué)習(xí)推薦方法流程圖;
[0016] 圖2用戶知識背景分析流程圖
[0017] 圖3用戶所屬人群預(yù)測流程圖 [001引圖4用戶性別預(yù)測流程圖
[0019] 圖5獲取目標(biāo)用戶微博標(biāo)簽流程圖
[0020] 圖6用戶年齡預(yù)測流程圖
[0021] 圖7用戶職業(yè)預(yù)測流程圖
[0022] 圖8用戶當(dāng)前關(guān)注知識分析流程圖
[0023] 圖9標(biāo)簽關(guān)系圖
[0024] 圖10標(biāo)簽關(guān)系圖樹形分支
[0025] 圖11創(chuàng)建微知識庫流程圖
[0026] 圖12發(fā)現(xiàn)缺失的知識流程圖
[0027] 圖13系統(tǒng)架構(gòu)圖 [002引圖14系統(tǒng)工作流程圖
【具體實施方式】
[0029] 下面參照附圖來對本發(fā)明中的各個步驟進(jìn)行詳細(xì)描述。
[0030] 如圖1所示,本發(fā)明提供了一種基于建構(gòu)學(xué)習(xí)理論的個性化即時學(xué)習(xí)支持方法, 包括如下步驟:
[0031] 用戶知識背景分析;通過預(yù)測用戶所屬人群和發(fā)現(xiàn)用戶當(dāng)前關(guān)注的知識來分析用 戶知識背景。如圖2所示,用戶知識背景分析包括如下步驟:
[0032] 用戶所屬人群預(yù)測;運用貝葉斯定理通過微博標(biāo)簽預(yù)測用戶所屬人群。如圖3所 示,用戶所屬人群預(yù)測包括W下步驟:
[0033] 用戶性別預(yù)測:通過微博標(biāo)簽預(yù)測該用戶性別。如圖4所示,用戶性別預(yù)測包括W 下步驟:
[0034] 獲取大量微博認(rèn)證用戶的性別和標(biāo)簽;通過微博開放平臺提供的API獲取大量微 博認(rèn)證用戶的信息(包括用戶性別、年齡、職業(yè)、微博標(biāo)簽,發(fā)表過的微博狀態(tài))。
[0035] 按性別統(tǒng)計標(biāo)簽;將所有獲取的微博用戶標(biāo)簽按男性和女性劃分,得到男性喜愛 的微博標(biāo)簽庫和女性喜愛的微博標(biāo)簽庫。
[0036] 擴(kuò)充標(biāo)簽庫;如果某一個關(guān)鍵詞在用戶的微博狀態(tài)中頻繁的出現(xiàn),則可W認(rèn)為該 關(guān)鍵詞是該用戶的微博標(biāo)簽。統(tǒng)計所有男性用戶發(fā)表過的微博狀態(tài),通過微博去噪,分詞, 統(tǒng)計詞頻,將詞頻較高的關(guān)鍵詞作為男性喜愛的微博標(biāo)簽添加到男性喜愛的微博標(biāo)簽庫。 統(tǒng)計所有女性用戶發(fā)表過的微博狀態(tài),用同樣方法將詞頻較高的關(guān)鍵詞作為女性喜愛的微 博標(biāo)簽添加到女性喜愛的微博標(biāo)庫。
[0037] 計算每一個標(biāo)簽出現(xiàn)的概率:分別統(tǒng)計男性喜愛的微博標(biāo)簽庫和女性喜愛的微博 標(biāo)簽庫中每一個標(biāo)簽出現(xiàn)的概率。假設(shè)男性喜愛的微博標(biāo)簽庫總共有Tm個標(biāo)簽,女性喜愛 的微博標(biāo)簽庫總共有Tw個標(biāo)簽,其中標(biāo)簽X在男性喜愛的微博標(biāo)簽庫中出現(xiàn)Sm次,在女性 喜愛的微博標(biāo)簽庫中出現(xiàn)Sw次,則標(biāo)簽X在男性喜愛的微博標(biāo)簽庫中出現(xiàn)的概率為Sm/Tm, 在女性喜愛的微博標(biāo)簽庫中出現(xiàn)的概率為Sw/Tw。
[003引獲取目標(biāo)用戶的微博標(biāo)簽;通過用戶自身標(biāo)記的微博標(biāo)簽,用戶好友標(biāo)記的微博 標(biāo)簽、用戶發(fā)表及轉(zhuǎn)發(fā)的微博發(fā)現(xiàn)用戶喜愛的標(biāo)簽。如圖5所示,獲取目標(biāo)用戶微博標(biāo)簽包 括W下步驟:
[0039] 直接獲取用戶微博標(biāo)簽;通過微博開放平臺提供的API獲取目標(biāo)用戶的微博標(biāo) 簽。
[0040] 通過用戶關(guān)注好友獲取微博標(biāo)簽;關(guān)注好友是用戶主動選擇的,通常情況與目標(biāo) 用戶有相似的興趣喜好。獲取關(guān)注好友的微博標(biāo)簽,統(tǒng)計出現(xiàn)頻率較高的微博標(biāo)簽作為目 標(biāo)用戶喜愛的微博標(biāo)簽。
[0041] 通過用戶發(fā)表的微博狀態(tài)發(fā)現(xiàn)微博標(biāo)簽;用戶發(fā)表轉(zhuǎn)發(fā)的狀態(tài)中如果頻繁