本發(fā)明涉及智能推薦,尤其涉及一種基于知識圖譜的啟蒙圖書推薦系統(tǒng)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)的迅速發(fā)展和大數(shù)據(jù)的興起,在線圖書資源的數(shù)量和種類不斷增加。人們在尋找自己感興趣的圖書時,需要花費大量的時間和精力,傳統(tǒng)的圖書推薦系統(tǒng)主要依賴于用戶與圖書的評分矩陣,通過計算相似度為用戶進(jìn)行推薦。然而,隨著用戶和圖書數(shù)量的增長,傳統(tǒng)推薦算法面臨數(shù)據(jù)稀疏和特征挖掘不足的問題,難以滿足用戶的個性化需求。
2、知識圖譜作為一種語義網(wǎng)絡(luò),利用三元組的形式將實體和關(guān)系連接起來,包含大量的知識。其廣泛應(yīng)用于搜索引擎、問答系統(tǒng)和推薦系統(tǒng)等領(lǐng)域。在圖書推薦領(lǐng)域,知識圖譜可以輔助挖掘用戶和圖書間的潛在關(guān)聯(lián)關(guān)系,緩解數(shù)據(jù)稀疏性的問題,提高推薦系統(tǒng)的性能。
3、近年來,將知識圖譜與推薦算法相結(jié)合成為研究熱點。通過構(gòu)建圖書知識圖譜,將圖書領(lǐng)域的實體和關(guān)系進(jìn)行建模,結(jié)合神經(jīng)協(xié)同過濾模型,可以充分挖掘用戶與圖書間的特征交互,提高推薦的準(zhǔn)確性和多樣性。目前,已有部分研究將知識圖譜應(yīng)用于圖書推薦系統(tǒng)。例如,利用圖書的內(nèi)容特征、用戶的歷史行為及知識圖譜中的關(guān)聯(lián)信息,構(gòu)建基于知識圖譜的個體圖書推薦模型。通過引入神經(jīng)協(xié)同過濾技術(shù),可以進(jìn)一步挖掘用戶的潛在興趣偏好,提高推薦系統(tǒng)的性能。然而,現(xiàn)有方法在處理大規(guī)模知識圖譜數(shù)據(jù)和復(fù)雜的用戶行為特征時,仍存在一定的挑戰(zhàn),推薦結(jié)果缺乏解釋性,兒童的認(rèn)證與成人不同,針對學(xué)齡前的兒童無法進(jìn)行有效的推薦。
技術(shù)實現(xiàn)思路
1、本發(fā)明提出了一種基于知識圖譜的啟蒙圖書推薦系統(tǒng),旨在構(gòu)建啟蒙圖書知識圖譜,融合用戶個性化模型與神經(jīng)協(xié)同過濾算法,實現(xiàn)個性化的啟蒙圖書推薦,滿足用戶的閱讀需求。
2、一種基于知識圖譜的啟蒙圖書推薦系統(tǒng),包括如下模塊:
3、用戶信息獲取模塊,用以獲取采集處理用戶信息,包括初始信息獲取單元和補充信息獲取單元;
4、初始信息獲取單元用于用戶首次使用時,通過用戶的注冊信息獲取初始用戶信息;
5、補充信息獲取單元從用戶使用產(chǎn)生的互動信息對用戶信息進(jìn)行更新;
6、知識圖譜構(gòu)建模塊,用以構(gòu)建啟蒙圖書知識圖譜,通過啟蒙圖書數(shù)據(jù)庫獲取啟蒙圖書信息,并生成啟蒙圖書知識圖譜,包括圖書數(shù)據(jù)庫構(gòu)建單元、知識圖譜生成單元和圖譜更新單元;知識圖譜由一個三元組(h,r,t)組成,其中h表示頭實體,r表示關(guān)系,t表示尾實體;
7、個性化模型構(gòu)建模塊,用以構(gòu)建用戶的個性化模型,通過用戶基本信息生成用戶的特征信息,特征信息由個性化知識圖譜存儲,用戶的特征信息包含認(rèn)知發(fā)展階段,模塊包括特征信息單元、個性化圖譜生成單元和圖譜更新單元;
8、圖書推薦模塊,用以生成圖書推薦列表,包括個體推薦單元和群體推薦單元,個體推薦單元包括關(guān)聯(lián)推薦子單元和協(xié)同過濾子單元;
9、關(guān)聯(lián)推薦子單元通過啟蒙圖書知識圖譜與個性化圖譜的模糊關(guān)聯(lián)度生成候選圖書推薦列表;
10、協(xié)同過濾子單元通過協(xié)同過濾算法對候選圖書推薦列表進(jìn)行篩選,得到個體圖書推薦列表;
11、群體推薦單元通過對用戶的個性化模型使用缺失聚類算法進(jìn)行群體分析,得到群體圖書推薦列表;
12、反饋優(yōu)化模塊,用以通過用戶的互動信息動態(tài)優(yōu)化圖書推薦,包括反饋挖掘單元和推薦優(yōu)化單元;
13、反饋挖掘單元,用于對用戶的互動信息進(jìn)行數(shù)據(jù)挖掘,對個性化模型和啟蒙圖書知識圖譜進(jìn)行更新,并更新關(guān)聯(lián)推薦的關(guān)系權(quán)重,優(yōu)化推薦結(jié)果;
14、推薦優(yōu)化單元,用于根據(jù)興趣互動信息對初始圖書推薦列表進(jìn)行興趣加權(quán),從而獲取最終的推薦圖書;
15、可視化互動模塊,用以實現(xiàn)系統(tǒng)的互動界面,包括gui界面、需求獲取單元和使用記錄單元,gui界面用于呈現(xiàn)推薦圖書信息、用戶操作選項以及交互反饋,通過獲取用戶的需求,調(diào)整個性化模型,并對用戶的操作進(jìn)行記錄,持續(xù)優(yōu)化用戶的基本信息。
16、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述圖書推薦模塊的群體推薦單元包括:
17、在個性化模型數(shù)據(jù)庫中隨機(jī)獲取與用戶同認(rèn)知發(fā)展階段的若干個性化模型,作為群體分析樣本,對用戶的個性化模型樣本進(jìn)行屬性組成度分析,得到用戶的個性化模型樣本的各個屬性的組成度,組成度通過對應(yīng)屬性的值在群體分析樣本中的占比獲取,得到所有屬性的組成度后對進(jìn)行歸一化處理,使組成度的和為1;
18、按照設(shè)定組數(shù)將屬性進(jìn)行分組,使每組屬性的組成度的和接近,對不同組別的屬性進(jìn)行缺失聚類分析,缺失聚類分析通過將該組屬性去除后進(jìn)行聚類,得到多組缺失屬性下群體分析樣本的聚類結(jié)果;
19、獲取每組聚類結(jié)果中與用戶的個性化模型樣本同類的所有個性化模型的閱讀統(tǒng)計,并根據(jù)聚類分析的可信度和該組屬性的組成度對閱讀記錄對應(yīng)的啟蒙圖書進(jìn)行推薦值計算,可信度通過用戶的個性化模型樣本在聚類類別中的簇內(nèi)相似度獲取,以百分比形式表示;
20、第m本啟蒙圖書的推薦值的計算公式為:;其中x表示第x組屬性,θx表示第x組屬性的組成度,γx表示第x組聚類分析結(jié)果的可信度,i表示第m本啟蒙圖書在一組聚類分析結(jié)果內(nèi)第i個閱讀統(tǒng)計,o表示閱讀統(tǒng)計的時間;
21、重復(fù)上述過程3次,避免陷入局部最優(yōu)解,對3次群體分析的結(jié)果計算平均推薦值,對啟蒙圖書的平均推薦值進(jìn)行排序,取排序靠前的圖書作為群體圖書推薦列表。
22、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述個體推薦單元中的關(guān)聯(lián)推薦子單元,通過計算個性化知識圖譜中個性化模型與啟蒙圖書知識圖譜中各啟蒙圖書的關(guān)聯(lián)度生成候選圖書推薦列表;
23、具體為通過用戶的認(rèn)知發(fā)展階段對啟蒙圖書進(jìn)行階段限定,對階段限定中的啟蒙圖書進(jìn)行模糊關(guān)聯(lián)度計算;獲取與當(dāng)前用戶個性化模型與同認(rèn)知發(fā)展階段的個性化模型的語義相似度α,語義相似度僅通過用戶的個人特征信息獲取,值區(qū)間為(0,1),在所有同認(rèn)知發(fā)展階段的個性化模型中,根據(jù)是否閱讀過當(dāng)前計算模糊關(guān)聯(lián)度的書籍進(jìn)行閱讀限定,在閱讀限定的個性化模型中隨機(jī)抽取數(shù)量為j的個性化模型樣本,所有被抽取的個性化模型樣本的語義相似度的和mq滿足以下限定:β1j<mq≤β2j,其中β1和β2的取值區(qū)間為(0,1),2者為模糊調(diào)整參數(shù),2者的差值決定了樣本的隨機(jī)程度,越大則樣本的隨機(jī)性越高,對于結(jié)果而言,可避免局部最優(yōu)解,β1和β2的絕對值越大,則樣本的特定配對能力強(qiáng);
24、第n本啟蒙圖書的模糊關(guān)聯(lián)度計算的公式為:
25、;
26、式中ta、tb和tc分別表示階段限定中的啟蒙圖書的類型占比、關(guān)鍵詞占比和主題占比,αj表示第j個用戶的語義相似度,rj表示第j個用戶的閱讀值,通過閱讀時間與理解程度獲取,ij表示第j個用戶的閱讀記錄中的類型占比;
27、對啟蒙圖書的關(guān)聯(lián)度進(jìn)行排序,獲取排序靠前的圖書作為候選圖書推薦列表。
28、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述圖書推薦模塊中協(xié)同過濾子單元,通過個體圖書推薦模型對候選圖書推薦列表中的啟蒙圖書進(jìn)行神經(jīng)協(xié)同過濾,得到圖書推薦列表;
29、個體圖書推薦模型包括交叉壓縮子單元、圖書知識圖譜嵌入子和單元圖書推薦子單元;
30、交叉壓縮子單元,用于連接圖書推薦子單元和圖書知識圖譜嵌入子單元,通過構(gòu)建交叉矩陣實現(xiàn)知識圖譜嵌入子單元中的實體向量和圖書推薦子單元中的圖書向量進(jìn)行特征交互;
31、圖書知識圖譜嵌入子單元,利用多層感知機(jī)將啟蒙圖書知識圖譜中的實體和關(guān)系轉(zhuǎn)化為低維稠密的實體向量;
32、圖書推薦子單元,用于使用多層感知機(jī)將個性化圖譜中的用戶特征向量;將用戶特征向量和圖書特征向量輸入至神經(jīng)協(xié)同過濾網(wǎng)絡(luò)中,最終預(yù)測出用戶對于候選圖書進(jìn)行交互的概率,獲取個體圖書推薦列表。
33、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述推薦優(yōu)化單元包括:
34、將個體圖書推薦列表和群體圖書推薦列表進(jìn)行整合,作為圖書推薦列表,將圖書推薦列表在可視化界面上對目標(biāo)用戶兒童進(jìn)行展示,獲取兒童對圖書推薦列表中不同啟蒙圖書的興趣互動信息,興趣互動信息通過圖像分析算法獲取和/或用戶家長反饋信息獲??;
35、通過興趣互動信息獲取興趣權(quán)重對具有興趣權(quán)重的啟蒙圖書進(jìn)行加權(quán),獲取最終的推薦圖書。
36、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述子單元的構(gòu)建;
37、交叉壓縮子單元,將d維特征空間的圖書向量與實體向量進(jìn)行顯式交互操作,得到d*d維的交叉特征矩陣,將矩陣映射回d維特征空間,輸出下一層的圖書向量和實體向量,完成壓縮操作,得到圖書特征向量vl,公式表示為:el+1=c(vl,el)[e],vl+1=c(vl,el)[v],其中vl表示第l層的圖書向量,el表示第l層的實體向量,[e]和[v]用于區(qū)分交叉壓縮子單元中的實體向量輸出和圖書向量輸出;
38、圖書知識圖譜嵌入子單元,使用l層的多層感知機(jī)提取實體間的關(guān)系特征向量rl,將實體向量輸入至l層的交叉壓縮子單元獲取實體特征向量:hl=ev~s(h)[cl(v,h)[e]],式中s(h)表示與圖書實體h相關(guān)聯(lián)的圖書v的集合;將關(guān)系特征向量和實體特征向量進(jìn)行拼接,送入k層的多層感知機(jī)中得到預(yù)測的實體特征向量t^,使用歸一化內(nèi)積函數(shù)計算預(yù)測實體的三元組的得分:score(h,r,t)=fkg(t,t^);其中fkg表示歸一化內(nèi)積函數(shù),t表示三元組的尾實體,t^表示預(yù)測的實體特征向量;
39、圖書推薦子單元,使用l層的多層感知機(jī)提取用戶特征向量ul,將提取得到的用戶特征向量和圖書特征向量輸入神經(jīng)協(xié)同過濾網(wǎng)絡(luò),通過廣義矩陣分解和多層感知機(jī)對用戶特征和圖書特征進(jìn)行交互,輸出推薦圖書;
40、具體為,計算用戶特征向量和圖書特征向量的元素積,進(jìn)行廣義矩陣分解:
41、,其中2個元素表示廣義矩陣分解的對應(yīng)特征向量;
42、將用戶特征向量和圖書特征向量輸入多層感知機(jī),得到第l層的輸出ymlp;
43、計算模型的最終輸出為:,式中ρ表示權(quán)重向量。
44、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述個體圖書推薦模型的損失函數(shù)由圖書推薦模塊損失函數(shù)、圖書知識圖譜嵌入損失函數(shù)和正則化項三部分組成,圖書推薦模塊損失函數(shù)為計算模型實際點擊率和預(yù)測點擊率的損失值,正則化項,用于防止過擬合。
45、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述知識圖譜的構(gòu)建,知識圖譜包括模式層和數(shù)據(jù)層;
46、模式層,通過對領(lǐng)域的相關(guān)知識分析,確定領(lǐng)域的實體概念,確定實體概念對應(yīng)的類,確定實體的屬性和屬性值域,確定屬性描述特征;建立對應(yīng)領(lǐng)域本地庫,用于構(gòu)建知識圖譜;
47、數(shù)據(jù)層,通過數(shù)據(jù)庫獲取數(shù)據(jù),對數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,獲取數(shù)據(jù)的節(jié)點與關(guān)系,使用圖數(shù)據(jù)庫對知識圖譜進(jìn)行存儲。
48、作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述個性化模型由用戶的特征信息構(gòu)建,特征信息通過用戶信息處理得到,個性化模型包括用戶個人特征信息、閱讀記錄及統(tǒng)計、圖書搜索和瀏覽記錄及統(tǒng)計;其中用戶個人特征信息包含用戶的認(rèn)知發(fā)展階段和家庭簡要情況,使用個性化模型構(gòu)成個性化知識圖譜,用戶認(rèn)知發(fā)展階段通過輸入或觀察兒童的行為、語言能力、興趣愛好獲取。
49、本發(fā)明具有以下優(yōu)點:
50、本發(fā)明通過關(guān)聯(lián)推薦子單元,系統(tǒng)能夠根據(jù)用戶的認(rèn)知發(fā)展階段和興趣偏好,精準(zhǔn)地匹配適合用戶的啟蒙圖書,模糊關(guān)聯(lián)度計算確保了推薦圖書與用戶認(rèn)知水平的高度契合,避免了推薦不適齡的內(nèi)容,并在群體推薦單元通過缺失聚類分析,利用與用戶認(rèn)知發(fā)展階段相同的其他用戶的數(shù)據(jù)進(jìn)行分析,確保推薦結(jié)果不僅基于個體需求,還考慮群體趨勢,從而避免過于個性化導(dǎo)致的推薦局限性,增強(qiáng)了推薦的多樣性和適應(yīng)性。
51、本發(fā)明結(jié)合了個體推薦和群體推薦的優(yōu)點,既能根據(jù)用戶的個性化模型提供精確推薦,又能通過群體數(shù)據(jù)補充推薦內(nèi)容,提升了推薦的覆蓋面和精準(zhǔn)度,特別是在認(rèn)知發(fā)展階段的細(xì)分和適配上,能夠為不同階段的兒童提供合適的啟蒙圖書;通過對用戶興趣互動和反饋的實時分析,推薦系統(tǒng)能夠不斷優(yōu)化推薦內(nèi)容,以適應(yīng)用戶認(rèn)知和興趣的變化,提升了推薦結(jié)果的時效性和準(zhǔn)確性。