亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種數(shù)字化資源個(gè)性化推薦方法

文檔序號(hào):9326950閱讀:547來(lái)源:國(guó)知局
一種數(shù)字化資源個(gè)性化推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于網(wǎng)絡(luò)應(yīng)用個(gè)性化推薦技術(shù)領(lǐng)域,涉及數(shù)字化資源個(gè)性化推薦方法。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)快速發(fā)展,資源數(shù)量爆炸性增長(zhǎng),在面對(duì)如此浩瀚的資源海洋時(shí),用戶 很難在短時(shí)間內(nèi)找到自己真正需要的資源。因此,造成了信息迷航與信息過(guò)載的問(wèn)題。信 息迷航是指用戶在復(fù)雜的網(wǎng)絡(luò)信息空間中瀏覽信息時(shí)迷失方向,不清楚所要找的資源在 哪里,無(wú)法返回到某個(gè)節(jié)點(diǎn),在尋找的過(guò)程中忘記自己的初衷目的。而信息過(guò)載則是由于 Internet提供的復(fù)雜且廣泛的資源,致使資源的使用者常常受制于認(rèn)知能力和各方面知識(shí) 的約束,難以正確的獲取和使用網(wǎng)絡(luò)上給予的資源。
[0003] 數(shù)字化資源與傳統(tǒng)資源有所區(qū)別,它是文本、圖片、音頻、視頻、動(dòng)畫等多種資源的 結(jié)合,并提供豐富的交互能力,能夠激發(fā)用戶通過(guò)自主、合作、創(chuàng)造的方式來(lái)尋找和處理資 源。數(shù)字化資源相比傳統(tǒng)資源有以下優(yōu)勢(shì):1)擴(kuò)展性,用戶學(xué)習(xí)數(shù)字化資源不受時(shí)空和傳 遞呈現(xiàn)方式的限制,通過(guò)多種設(shè)備,可以獲得高質(zhì)量的數(shù)字化資源;2)多樣式,多種呈現(xiàn)形 式,豐富的內(nèi)容表現(xiàn)力,激發(fā)用戶的學(xué)習(xí)動(dòng)力;3)共享性,不同用戶可以共享數(shù)字化資源, 極大地提尚學(xué)習(xí)效率。
[0004] 用戶在網(wǎng)絡(luò)上檢索相關(guān)數(shù)字化資源時(shí),需要花費(fèi)大量的時(shí)間才能找到自己需要的 資源。這種瀏覽大量無(wú)關(guān)的信息無(wú)疑會(huì)使淹沒(méi)在信息過(guò)載和信息迷航問(wèn)題中的用戶迷茫, 為了解決這些問(wèn)題,個(gè)性化推薦方法應(yīng)運(yùn)而生。個(gè)性化推薦方法是建立在海量數(shù)據(jù)挖掘基 礎(chǔ)上的一種智能方法,充分利用用戶在網(wǎng)站上訪問(wèn)記錄,對(duì)用戶行為進(jìn)行用戶偏好分析,幫 助網(wǎng)站為其用戶提供個(gè)性化的服務(wù)。
[0005] 個(gè)性化推薦是根據(jù)用戶的興趣特點(diǎn)和行為記錄,向用戶推薦用戶感興趣的資源。 個(gè)性化推薦技術(shù)中,個(gè)性化是指使資源具有個(gè)性化的屬性。主要是在非一般大眾化的基礎(chǔ) 上增加獨(dú)特、擁有本身特點(diǎn)的需要,使資源具有個(gè)性,或者使其凸顯個(gè)性。個(gè)性化一般包含 兩層含義,第一、用戶個(gè)性化的過(guò)程,這是需要經(jīng)過(guò)培養(yǎng)逐步形成的;第二,資源個(gè)性化的過(guò) 程,資源的個(gè)性化以特定的方式得到體現(xiàn)和展示,此個(gè)性化的過(guò)程是每個(gè)用戶都應(yīng)擁有的 潛在需求的過(guò)程。
[0006] 在目前的推薦方法中,標(biāo)簽逐漸成為一種表現(xiàn)用戶特征的重要方式。標(biāo)簽類似于 一種關(guān)鍵字標(biāo)記,來(lái)源于標(biāo)注者對(duì)資源主觀感受的概括,被用于描述資源,當(dāng)一個(gè)資源被標(biāo) 注多個(gè)標(biāo)簽后,其相對(duì)于其他資源而言,已具有個(gè)性化的特點(diǎn);用戶在長(zhǎng)期學(xué)習(xí)數(shù)字化資源 的過(guò)程中,會(huì)形成屬于個(gè)人的標(biāo)簽庫(kù),其相對(duì)其他用戶而言,已擁有獨(dú)特的特征,在不同用 戶學(xué)習(xí)相同資源后,其又擁有共性,而個(gè)性化推薦方法就是利用這些特點(diǎn)向用戶推薦個(gè)性 化的資源和用戶。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)不足,使用能準(zhǔn)確表示頁(yè)面內(nèi)容的標(biāo)簽,更能體 現(xiàn)用戶的潛在興趣,并自動(dòng)為未訪問(wèn)頁(yè)面標(biāo)注標(biāo)簽,使得推薦結(jié)果更具人性化。
[0008] 本發(fā)明的目的是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的:一種數(shù)字化資源個(gè)性化推薦方法, 通過(guò)腳本獲取用戶瀏覽數(shù)字化資源歷史記錄,對(duì)其進(jìn)行分析,結(jié)合頁(yè)面標(biāo)簽,產(chǎn)生推薦結(jié)果 進(jìn)行個(gè)性化推薦,具體包括以下步驟:
[0009] (1)標(biāo)注標(biāo)簽,獲取指定網(wǎng)站的網(wǎng)站地圖,分析地圖文件獲得頁(yè)面URL,為每個(gè)URL 標(biāo)注標(biāo)簽,具體包括以下子步驟:
[0010] (I. 1)在獲取網(wǎng)站全部頁(yè)面URL后,去掉無(wú)效頁(yè)面,比如腳本文件URL,樣式表文件 URL以及一些錯(cuò)誤頁(yè)面;
[0011] (1.2)采用手工的方式為每個(gè)URL標(biāo)注至多10個(gè)最能代表頁(yè)面內(nèi)容的標(biāo)簽,保存 在數(shù)據(jù)庫(kù)中,生成網(wǎng)頁(yè)標(biāo)簽表;
[0012] (2)數(shù)據(jù)獲取,通過(guò)腳本獲取用戶瀏覽網(wǎng)站的訪問(wèn)記錄,具體包括以下子步驟:
[0013] (2. 1)用戶設(shè)置瀏覽器代理,通過(guò)代理服務(wù)器訪問(wèn)網(wǎng)站;
[0014] (2. 2)代理服務(wù)器根據(jù)預(yù)先設(shè)置的規(guī)則文件,在符合規(guī)則的頁(yè)面中嵌入腳本,腳本 在每次用戶瀏覽頁(yè)面時(shí),將用戶ID,頁(yè)面URL、頁(yè)面標(biāo)題、頁(yè)面訪問(wèn)時(shí)間、上一跳地址返回給 服務(wù)器,保存在數(shù)據(jù)庫(kù)中,生成訪問(wèn)記錄表;
[0015] (3)頁(yè)面相似度匹配,若用戶當(dāng)前訪問(wèn)頁(yè)面不在網(wǎng)頁(yè)標(biāo)簽表中,從網(wǎng)頁(yè)標(biāo)簽表中獲 取與
[0016] 當(dāng)前用戶訪問(wèn)頁(yè)面最相似的頁(yè)面,具體包括以下子步驟:
[0017] (3. 1)網(wǎng)頁(yè)關(guān)鍵字提取,獲取當(dāng)前訪問(wèn)頁(yè)面內(nèi)容,去掉HTML標(biāo)簽,獲得頁(yè)面中純文 本內(nèi)容;利用中文分詞工具,去掉嘆詞、副詞、形容詞、介詞等無(wú)意義的詞,得到η個(gè)有效詞 ( Wl,w2, . . .,wk,. . .,wn),統(tǒng)計(jì)每個(gè)有效詞%在該網(wǎng)頁(yè)中出現(xiàn)的次數(shù),用每個(gè)有效詞出現(xiàn) 的次數(shù)除以有效詞數(shù)n,得到每個(gè)有效詞在網(wǎng)頁(yè)中出現(xiàn)的詞頻數(shù)TF=</Vn掃描網(wǎng)頁(yè)標(biāo)簽 表中所有m個(gè)頁(yè)面,分別統(tǒng)計(jì)包含有效詞%的網(wǎng)頁(yè)數(shù)!^,用網(wǎng)站網(wǎng)頁(yè)總數(shù)m除以包含該詞 的網(wǎng)頁(yè)數(shù),得到包含有效詞wk的網(wǎng)頁(yè)占網(wǎng)頁(yè)總數(shù)的反比例m/w^,取丨DF=Iogim/乂),用TF與 IDF的乘積相乘得到有效詞%的TF - IDF,即
U按照這個(gè)過(guò)程,得 到η個(gè)有效詞的TF - IDF,將這些有效詞的TF - IDF按照降序排列,按順序取前p個(gè)作為本 頁(yè)面的關(guān)鍵字;
[0018] (3.2)從網(wǎng)頁(yè)標(biāo)簽表中m個(gè)網(wǎng)頁(yè)中取出一個(gè)頁(yè)面,按照步驟(3. 1)獲取頁(yè)面的ρ個(gè) 關(guān)鍵字,將兩個(gè)頁(yè)面的關(guān)鍵字合并為一個(gè)集合U1, t2,. . . tk,. . . tj,其中p < r < 2p,計(jì)算 集合中關(guān)鍵字4在兩個(gè)頁(yè)面中的詞頻數(shù),進(jìn)一步將每個(gè)關(guān)鍵字詞頻除以所有關(guān)鍵字總的 詞頻數(shù),即
,獲得每個(gè)關(guān)鍵字的相對(duì)詞頻
[0019] (3.3)根據(jù)步驟(3.2)計(jì)算得出的相對(duì)詞頻,得到兩個(gè)頁(yè)面的詞頻分量 (?... f/ ),計(jì)算兩個(gè)分量的余弦相似度;
[0020] (3. 4)依次計(jì)算當(dāng)前訪問(wèn)頁(yè)面和網(wǎng)頁(yè)標(biāo)簽表中所有頁(yè)面的余弦相似度,余弦相似 度最大,即為當(dāng)前訪問(wèn)頁(yè)面最相似頁(yè)面;
[0021] (4)個(gè)性化推薦,結(jié)合網(wǎng)頁(yè)標(biāo)簽表和訪問(wèn)記錄表,統(tǒng)計(jì)該用戶訪問(wèn)過(guò)的s個(gè)標(biāo)簽 α,ι2,...ik,...U以及每個(gè)標(biāo)簽的訪問(wèn)頻次(fI…C,…/f >,將每個(gè)標(biāo)簽訪問(wèn)除以所有 標(biāo)簽總的訪問(wèn)頻次,g卩
得到每個(gè)標(biāo)簽的相對(duì)訪問(wèn)頻次;根據(jù)相對(duì)訪問(wèn)頻次按照 降序排列,計(jì)算包含標(biāo)簽Ik的頁(yè)面的訪問(wèn)次數(shù),按照降序排列,生成基于標(biāo)簽1 ,的推薦列 表,合并S個(gè)標(biāo)簽生成的推薦列表,將最終推薦結(jié)果推薦給用戶。
[0022] 進(jìn)一步地,步驟(2)生成的訪問(wèn)記錄表,用戶所訪問(wèn)網(wǎng)站是互聯(lián)網(wǎng)已存在的,通過(guò) 用戶設(shè)置代理的方式,代理服務(wù)器會(huì)將預(yù)先設(shè)置的腳本嵌入在符合規(guī)則的網(wǎng)頁(yè)中,腳本獲 取用戶在該網(wǎng)站上的訪問(wèn)記錄并將其返回到服務(wù)器,保存在數(shù)據(jù)庫(kù)中;步驟(1)中生成的 網(wǎng)頁(yè)標(biāo)簽表,統(tǒng)計(jì)網(wǎng)頁(yè)標(biāo)簽表可以獲得該領(lǐng)域的標(biāo)簽庫(kù),在之后訪問(wèn)未標(biāo)注頁(yè)面時(shí),選取最 相似頁(yè)面的標(biāo)簽作為該頁(yè)面的標(biāo)簽,結(jié)合步驟(2)生成的訪問(wèn)記錄表和網(wǎng)頁(yè)標(biāo)簽表,用戶 訪問(wèn)的頁(yè)面都已標(biāo)注標(biāo)簽。
[0023] 本發(fā)明的有益效果是:本發(fā)明方法通過(guò)腳本獲取用戶瀏覽數(shù)字化資源歷史記錄, 對(duì)其進(jìn)行分析,結(jié)合頁(yè)面標(biāo)簽,產(chǎn)生推薦結(jié)果進(jìn)行個(gè)性化推薦。手工為頁(yè)面標(biāo)注標(biāo)簽,形成 標(biāo)簽庫(kù);對(duì)于未標(biāo)注頁(yè)面,進(jìn)行頁(yè)面相似度匹配,在已標(biāo)注頁(yè)面中找出最相似頁(yè)面,將該頁(yè) 面標(biāo)簽賦予未標(biāo)注頁(yè)面;統(tǒng)計(jì)用戶歷史記錄計(jì)算標(biāo)簽訪問(wèn)頻次,對(duì)用戶進(jìn)行個(gè)性化推薦。本 發(fā)明采用人工標(biāo)注的方式為頁(yè)面標(biāo)注標(biāo)簽,通過(guò)頁(yè)面相似度匹配自動(dòng)為未標(biāo)注頁(yè)面標(biāo)注標(biāo) 簽,生成的頁(yè)面標(biāo)簽更能夠體現(xiàn)頁(yè)面內(nèi)容,更能夠體現(xiàn)用戶的潛在興趣;用戶訪問(wèn)網(wǎng)站已存 在于網(wǎng)絡(luò)中,資源更加豐富和多樣,因此,本發(fā)明具有推薦精確和多樣的特點(diǎn),更能體現(xiàn)出 用戶的個(gè)性化。
【附圖說(shuō)明】
[0024] 圖1本發(fā)明方法的流程圖;
[0025] 圖2本發(fā)明方法的頁(yè)面相似度匹配流程圖。
【具體實(shí)施方式】
[0026] 下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
[0027] 如圖1所示,本發(fā)明一種數(shù)字化資源個(gè)性化推薦方法,包括以下步驟:
[0028] (1)標(biāo)注標(biāo)簽,獲取指定網(wǎng)站的網(wǎng)站地圖,分析地圖文件獲得頁(yè)面URL,為每個(gè)URL 標(biāo)注標(biāo)簽,包括以下子步驟:
[0029] (I. 1)利用網(wǎng)站地圖
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1