亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種數(shù)字信息推薦預(yù)測模型的訓(xùn)練方法和系統(tǒng)的制作方法

文檔序號:6437085閱讀:206來源:國知局
專利名稱:一種數(shù)字信息推薦預(yù)測模型的訓(xùn)練方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)字信息處理領(lǐng)域,具體地,涉及數(shù)字信息推薦領(lǐng)域。
背景技術(shù)
隨著互聯(lián)網(wǎng)的快速發(fā)展,用戶在各個門戶網(wǎng)站、電子商務(wù)網(wǎng)站、視頻或者音樂視聽網(wǎng)站都面臨信息過載的問題,因此挖掘用戶的可能喜好,提供個性化的服務(wù)對提高用戶的滿意度和忠誠度具有非常重大的意義。推薦系統(tǒng)正是在這個背景產(chǎn)生的,并且近二十年來得到了非常迅猛的發(fā)展。IT巨頭如亞馬遜,谷歌,雅虎等,國內(nèi)如當(dāng)當(dāng)網(wǎng),淘寶網(wǎng)等都在其不同的應(yīng)用中提供了個性化的推薦系統(tǒng),極大的方便了用戶并且也給商家?guī)砹司薮蟮睦?。推薦系統(tǒng)大致可以分為兩類基于內(nèi)容的推薦系統(tǒng)及基于協(xié)同過濾的推薦系統(tǒng)。 基于內(nèi)容的推薦系統(tǒng)主要是利用項目(item)的內(nèi)容信息,例如項目名字等文字信息來找出相似的項目集合,然后根據(jù)用戶喜歡的項目推薦該項目的相似項目。基于協(xié)同過濾的推薦系統(tǒng)主要是利用用戶對項目的反饋,例如用戶對項目的打分記錄,購買記錄,瀏覽記錄等挖掘用戶的可能喜好,推薦其可能喜歡的項目集合。因為基于內(nèi)容的推薦系統(tǒng)只與當(dāng)前用戶選擇的項目有關(guān),該方法沒有考慮到對用戶的歷史行為進(jìn)行建模,因此該方法無法滿足用戶的個性化需求。對于基于協(xié)同過濾的推薦系統(tǒng),其推薦過程主要包括下列步驟第一步獲得用戶對各個音樂的打分情況,然后對打分?jǐn)?shù)據(jù)進(jìn)行預(yù)處理;第二步是使用相關(guān)協(xié)同過濾的相關(guān)算法對打分?jǐn)?shù)據(jù)進(jìn)行建模,預(yù)測,這個過程是離線完成的;第三步是對于每個活躍用戶,將預(yù)測完的該用戶對各個音樂的可能打分值取最高的前K個(Top-K)項目進(jìn)行在線推薦。圖 1示出了上述推薦過程的流程圖。這類系統(tǒng)不需要考慮項目的屬性以及領(lǐng)域知識即可獲得很好的推薦效果,因此大多數(shù)推薦系統(tǒng)都是基于協(xié)同過濾技術(shù)的。然而由于在實際中用戶的打分?jǐn)?shù)往往比較少,所以協(xié)同過濾技術(shù)在應(yīng)用時面臨很多問題,例如冷啟動問題,數(shù)據(jù)稀疏問題等。其中數(shù)據(jù)稀疏性對產(chǎn)生精確推薦往往造成很大的影響。上述推薦系統(tǒng)均為考慮到用戶打分隨時間變化而呈現(xiàn)的規(guī)律性變化,從而未能準(zhǔn)確地為用戶進(jìn)行期望信息的推薦。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種推薦效果更理想的數(shù)字信息推薦預(yù)測模型的訓(xùn)練方法及系統(tǒng)。根據(jù)本發(fā)明的一個方面,提供了一種數(shù)字信息推薦預(yù)測模型的訓(xùn)練方法,包括1)接收打分?jǐn)?shù)據(jù);2)建立模型并利用所述打分?jǐn)?shù)據(jù)訓(xùn)練所述模型,其中所述模型中包括打分時間段對用戶的影響參數(shù)。上述方法中,所述模型還包括打分時間段對用戶偏差的影響參數(shù)。
上述方法中,所述模型還包括(ruj_buj)的補(bǔ)償參數(shù),其中、表示已知的用戶u對項目j打分的打分值,bUJ表示用戶u對項目j打分的打分值相對于平均打分值的偏差,其中項目表示數(shù)字信息的類別的具體內(nèi)容。上述方法中,所述(ruj_buj)的補(bǔ)償參數(shù)的系數(shù)為(| (Rk(i ;u) +I)"172,其中Rk(i ;u) =R(U) Π Sk(i),其中R(u)是用戶打分值已知的項目集合,Sk(i)表示與項目i最相似的k個項目的集合。上述方法中,所述模型還包括隱式反饋。上述方法中,所述隱式反饋的系數(shù)為(|Nk(i ;u) +I)"172,其中Nk(i ;u) =N(U) Π Sk(i),其中N(u)是用戶打過分的項目集合,Sk(i)表示與項目i最相似的k個項目的集合。上述方法中,所述Sk(i)是基于打分的項目相似集合、基于所述類別之間存在的關(guān)聯(lián)關(guān)系的項目相似集合和基于內(nèi)容的項目相似集合中的任意一個或任意二或三個的融合結(jié)果。上述方法中,所述步驟2)中所述建立模型是基于隱參數(shù)模型建立。上述方法中,所述步驟2)的所述訓(xùn)練是基于最小化損失函數(shù)來訓(xùn)練。上述方法中,所述最小化損失函數(shù)的求解是采用梯度下降法。根據(jù)本發(fā)明另一方面,還提供了一種數(shù)字信息推薦預(yù)測模型的訓(xùn)練系統(tǒng),包括接收模塊,用于接收打分?jǐn)?shù)據(jù);建模模塊,用于建立模型并利用所述打分?jǐn)?shù)據(jù)訓(xùn)練所述模型,其中所述模型中包括打分時間段對用戶的影響參數(shù)。根據(jù)本發(fā)明另一方面,還提供了一種數(shù)字信息推薦方法,包括利用根據(jù)上述訓(xùn)練方法訓(xùn)練的模型進(jìn)行數(shù)字信息推薦。根據(jù)本發(fā)明另一方面,還提供了一種數(shù)字信息推薦系統(tǒng),用于利用根據(jù)上述訓(xùn)練方法訓(xùn)練的模型進(jìn)行數(shù)字信息推薦。本發(fā)明所訓(xùn)練的預(yù)測模型考慮到用戶打分的時間與所打分?jǐn)?shù)之間的規(guī)律性關(guān)系, 具有較好的推薦效果。


圖1是基于協(xié)同過濾的推薦方法的流程圖;圖2是根據(jù)本發(fā)明優(yōu)選實施例的打分?jǐn)?shù)據(jù)集劃分示意圖;圖3是根據(jù)Yahoo! Music打分?jǐn)?shù)據(jù)集的時間段劃分示意圖。
具體實施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖,對根據(jù)本發(fā)明一個實施例的數(shù)字信息推薦預(yù)測模型的訓(xùn)練方法和系統(tǒng)進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。通常,由于用戶每天在不同的時間段心情狀態(tài)不同,所以在不同時間段具有不同的打分傾向。例如,用戶白天在工作時間可能比較忙碌,壓力相對有點(diǎn)大,這時他可能變得有一點(diǎn)苛刻,那么他的打分值相對比較低。然而到了夜晚之后,因為要做的事情相對比較少,心情比較輕松,所以這個時候他可能選擇聽一些自己喜歡聽的音樂,打的分值相對較高?;谶@一客觀規(guī)律,本發(fā)明提供了一種推薦效果更好的數(shù)字信息推薦預(yù)測模型的訓(xùn)練方法和系統(tǒng)。在詳細(xì)介紹本發(fā)明的訓(xùn)練方法前,首先介紹下本發(fā)明所涉及到的符號定義>用U,ν指代用戶,用i,j指代項目,其中項目包括歌曲、專輯、流派和演唱家;>用m表示用戶總數(shù),η表示項目的總數(shù);> rui是已知的u對i打分的打分值;.是對rui的預(yù)測值;>定義R是打分值已經(jīng)知道的(u,i)集合R= Ku,i) Irui是已經(jīng)知道的};>定義N是所有的打過分的(u,i)集合,即使打分值尚未知道-.R&N>定義T是測試集的打分集合;>定義R(U)是打分值已知的u打分的項目,N(U)是u打過分的所有項目集合 R(U) ^ N(u)
ο下面根據(jù)本發(fā)明一個優(yōu)選實施例,詳細(xì)介紹本發(fā)明的訓(xùn)練方法所涉及的步驟,主要包括打分?jǐn)?shù)據(jù)的預(yù)處理和根據(jù)預(yù)處理后的打分?jǐn)?shù)據(jù)建立和訓(xùn)練預(yù)測模型。1.打分?jǐn)?shù)據(jù)的預(yù)處理首先,獲取用戶對音樂項目的打分情況;然后,對打分?jǐn)?shù)據(jù)進(jìn)行預(yù)處理。優(yōu)選地,預(yù)處理過程包括刪除打分總數(shù)很少的用戶、總的打分?jǐn)?shù)很少的項目,以及不滿足打分要求的打分。預(yù)處理的主要步驟如下(1)對于打分?jǐn)?shù)據(jù)中的每個打分,如果打分值不在規(guī)定的范圍內(nèi)則刪除該打分,該規(guī)定的范圍例如

;(2)對于給出打分?jǐn)?shù)據(jù)的每個用戶,如果該用戶的打分總數(shù)小于規(guī)定的閾值(如 10),那么刪除與該用戶的所有打分?jǐn)?shù)據(jù),不使用該用戶進(jìn)行建模;(3)對于打分?jǐn)?shù)據(jù)中的每個項目(item),如果給該項目打分的用戶總數(shù)小于規(guī)定的閾值,例如10,那么刪除該項目的所有分?jǐn)?shù),不使用該項目進(jìn)行建模。根據(jù)該優(yōu)選實施例,經(jīng)過預(yù)處理的打分?jǐn)?shù)據(jù)格式如下,對于每個用戶有用戶ID,音樂項目ID,打分值,打分日期,打分的具體時間。優(yōu)選地,對于經(jīng)過預(yù)處理的打分?jǐn)?shù)據(jù)集,按照一定比例將每個用戶的打分集合根據(jù)用戶打分時間的先后順序進(jìn)行劃分,主要分為三個部分訓(xùn)練集、驗證集和測試集,其中訓(xùn)練集和驗證集用于學(xué)習(xí)模型的參數(shù),測試集主要用來評估模型的好壞。參見圖2,根據(jù)本發(fā)明的一個優(yōu)選實施例,80%的打分?jǐn)?shù)據(jù)屬于訓(xùn)練集,10%的打分?jǐn)?shù)據(jù)屬于驗證集,10%的打分?jǐn)?shù)據(jù)屬于測試集。2.建立預(yù)測模型根據(jù)本發(fā)明的優(yōu)選實施例,基于隱參數(shù)模型來建立本發(fā)明的預(yù)測模型。本領(lǐng)域普通技術(shù)人員可以理解,也可以基于圖挖掘或者矩陣分解等方法來建立本發(fā)明的預(yù)測模型。經(jīng)典的隱參數(shù)模型(SVD)是通過發(fā)掘已知打分值潛在的特征來表示預(yù)測的打分值。該情況下,SVD的模型形式如下rm=u + bi+bu+qTpu
其中μ是所有已知打分值的平均打分值,其根據(jù)已知打分值直接計算。bu表示的是用戶u所打的打分值相對于平均打分情況的偏差,h表示的是關(guān)于項目i的打分值相對于平均打分的偏差。Pu是和用戶U相關(guān)的特征向量,其中的每個元素表示和用戶U相關(guān)的隱參數(shù)。Qi是和項目i相關(guān)的特征向量,其中的每個元素表示和項目i相關(guān)的隱參數(shù)。根據(jù)關(guān)于用戶打分時間與用戶所打分?jǐn)?shù)值之間的規(guī)律的分析,可以將一天劃分為不同的時間段。例如將一天分為{上午,下午,夜晚}。當(dāng)然,也可以根據(jù)打分?jǐn)?shù)據(jù)集采用其它的劃分方法。圖3示出了根據(jù)Yahoo ! Music打分?jǐn)?shù)據(jù)集的時間段劃分示意圖,如圖所示,將一天劃分為4個階段,根據(jù)本發(fā)明的一個優(yōu)選實施例,每個時間段所對應(yīng)的系數(shù)如下
'0 ^e [4,9),
1^e [9,17),
period (t)= <
2ie[17,21),
,3其它情況基于上面打分時間與分?jǐn)?shù)值之間的關(guān)系,在經(jīng)典隱參數(shù)模型上進(jìn)行擴(kuò)展,可以得到如下的模型ruj (0 = bm + bupenom + qj (pu + pu,penod(f)) ( 1 ) 其中bui = μ +bu+bi; t是特定的打分時間,其不依賴于具體的打分日期,period (t) 表示打分時間段所對應(yīng)的系數(shù),bu,period(t)表示打分時間段對用戶偏差的影響參數(shù),Pu, period(t)表示打分時間段對用戶的影響參數(shù)。本領(lǐng)域普通技術(shù)人員可以理解,上述參數(shù)bu,
period
(t)也可以不存在。對于該模型中變量,可以利用訓(xùn)練集的打分?jǐn)?shù)據(jù)采用最小化損失函數(shù)來求解,即對于打分集合,最小化所有打分的預(yù)測結(jié)果和真實結(jié)構(gòu)之間的誤差和進(jìn)行求解,其中損失函數(shù)的形式如下
__Λmin T (rm-ruif + \ub2u + \ped
bu, period (J) + ^bi + ^pu WPu Il +KedP u, period (X)
tk ,y*,agU (以 ^ ^+λφ (I qt H2其中X*Ubu,λΜ,Abpei Apu, Aped, Aqi)表示損失函數(shù)的正規(guī)化因子,| |*| |表示的是向量*的模,對于該最小損失函數(shù)的求解可以采用梯度下降法。具體地,首先給每個變量賦一個范圍在例如[-0. 1,0. 1]的任意初值,然后根據(jù)如下迭代公式進(jìn)行迭代,當(dāng)損失函數(shù)的值最小時得到迭代結(jié)果。其中所涉及的迭代公式如下bu—bu+ γκ ■ (eui — \ ■ bu)bUj period(t) — bUj peri(i(t)+ Y bped · (eui_ λ bped · bu,peri0(i(t))bt bt + Ybi . (eui - Xbi . bt)Pu— Pu+ rPu ■ i^ui ■ cIi — \ . Pu )qt — qt + Yqi . (eui . Pu — \ . qt)Pu,period(t) 一 Pu,period(t)+ Yped · (eui · Qi-^ped · Pu)其中。=rM-rM,r 表示模型的學(xué)習(xí)速率(learning rate), λ #表示正規(guī)化因子,
6λ #統(tǒng)稱為元參數(shù)。根據(jù)本發(fā)明的一個優(yōu)選實施例,利用驗證集的打分?jǐn)?shù)據(jù)基于公式(3)的模型進(jìn)行學(xué)習(xí),具體地,可以采用交叉驗證或自動參數(shù)學(xué)習(xí)等方法來求解元參數(shù)。本領(lǐng)域普通技術(shù)人員可以理解,根據(jù)短時間動態(tài)信息(temporal information)的使用方法,參見 2009 年 Y. Koren 在 Proc. 15th ACM SIGKDD International Conference on Knowledge and Discovery and Data Mining(KDD' 09)上發(fā)表的 Collaborative Filtering with Temporal Dynamics—文,也可以綜合用戶的動態(tài)時間信息以及項目的動態(tài)時間信息等來建立本發(fā)明的上述模型,以達(dá)到更加準(zhǔn)確的預(yù)測結(jié)果。龍絲日月一 優(yōu)■■肺丨丨名d (1)戸斤表雜卿臓礎(chǔ)丨卜.,還鑑_才目似度因素。目前主流的考慮到項目相似度因素的推薦系統(tǒng)都是基于對項目的打分計算項目之間的相似度,然后采用鄰居模型進(jìn)行推薦,這種方法的不足是沒有考慮到項目的領(lǐng)域知識,并且推薦的精確度在打分?jǐn)?shù)據(jù)稀疏的情況也比較差。本發(fā)明為彌補(bǔ)這一不足提出了基于打分、音樂層次結(jié)構(gòu)和內(nèi)容三者融合的計算項目相似鄰居的方法。首先分別介紹計算三個項目相似集合的方法1)基于音樂層次結(jié)構(gòu)的項目相似集合計算方法音樂類別通??梢苑譃楦枨瑢]?,演唱家,流派,并且這些類別之間存在一種層次結(jié)構(gòu),不同類別在層次結(jié)構(gòu)中可能存在關(guān)聯(lián)關(guān)系。每個類別中包括多個項目,也就是說項目是指類別中的具體內(nèi)容,例如演唱家類別中包括李谷一、孫燕姿、孫楠等,流派類別包括抒情、歡快等。由于音樂類別之間存在層次關(guān)系,并且不同類別之間存在關(guān)聯(lián)關(guān)系,因此可以利用這一關(guān)聯(lián)關(guān)系計算項目相似集合。具體地,根據(jù)音樂的四種類別歌曲,專輯,演唱家,流派的不同采用如下步驟計算各自的項目相似集合對于每個歌曲i,它最相似的項目包括它所屬于的專輯,演唱家和流派。因此,首先,選擇在同一張專輯中的和該i具有相同流派的歌曲。然后,選擇其他專輯中滿足以下條件的歌曲a)和i具有相同的流派,b)被打分?jǐn)?shù)大于規(guī)定的閾值。最后,按照所選歌曲的打分?jǐn)?shù)將所選歌曲降序排序。對于每張專輯i,它最相似的項目包括它所屬于的演唱家,相關(guān)的類別,以及它包含的歌曲中和它具有相同流派的歌曲。因此,選擇其他的專輯和歌曲中打分?jǐn)?shù)大于規(guī)定閾值并且和i具有的相同流派的專輯和歌曲。然后按照打分?jǐn)?shù)降序排序。對于每個演唱家i,選擇該演唱家演唱的的Kl個打分次數(shù)最多的專輯和歌曲,然后選擇K2個與上說選擇的專輯以及歌曲關(guān)聯(lián)個數(shù)最多的流派。對于每個流派i,首先,選擇屬于該流派的K個打分次數(shù)最多的歌曲和專輯,然后, 選擇K個和流派i相關(guān)的歌曲和專輯關(guān)聯(lián)最多的演唱家。通常,限定每個項目相似集合的個數(shù)K,當(dāng)超過K時只取K個相似的項目,以此獲得 i的通過層次結(jié)構(gòu)計算的項目相似集合SH(i),規(guī)定為i的基于層次結(jié)構(gòu)計算的相似項目的2)基于打分的項目相似集合計算方法基于打分的相似度計算方法最常用的是采用皮爾森系數(shù)來計算兩個項目之間的相似度。在計算項目的相似鄰居集合時,采用亞馬遜(Amazon)的算法,具有比較高的計算效率,主要求解過程如下(I)輸入打分?jǐn)?shù)據(jù)集;(II)遍歷打分?jǐn)?shù)據(jù)中的每個項目,設(shè)當(dāng)前項目為Il ;(III)遍歷對Il打過分的所有用戶,設(shè)當(dāng)前用戶為U;(IV)遍歷U打過分的所有項目,設(shè)當(dāng)前項目為12 ;如果Il和12不同,并且12還沒有遍歷過,將12放入隊列Q,(V)反復(fù)執(zhí)行(III),(IV)直到遍歷完所有的打分。(VI)對于Q中的每個項目12,計算Il和12的相似度val ;然后插入到集合S中, 即:S[I1] [12] = val。(VII)反復(fù)執(zhí)行步驟(II)至(VI),直到計算完所有的項目獲得相似度矩陣S。預(yù)設(shè)一個閾值,規(guī)定當(dāng)相似度大于該閾值時認(rèn)為項目之間是相似的,以此獲得i 的基于分?jǐn)?shù)計算的項目相似集合SR(i)。3)基于內(nèi)容的項目相似集合計算方法由于可以獲得音樂的名字,因此也可以利用音樂項目的內(nèi)容用來計算項目的相似度。根據(jù)本發(fā)明一個優(yōu)選實施例,兩個項目之間基于內(nèi)容的相似度通過計算兩個音樂名字的最長公共字串得到,并當(dāng)相似度大于一定閾值時認(rèn)為兩個項目是相似的,以此獲得i的基于內(nèi)容的項目相似集合SC(i)。其中計算相似度的計算方式如下(I)假設(shè)兩個項目涉及的字符串分別為A,B,其中A的長度為M,B的長度為N, LCS[m] [η]表示字符串A中第1至m個字符組成的子串與B中第1至η個字符組成的子串的最大公共字串的長度,其中a和b分別屬于A和B ;(II)LCS的迭代公式如下
權(quán)利要求
1.一種數(shù)字信息推薦預(yù)測模型的訓(xùn)練方法,包括1)接收打分?jǐn)?shù)據(jù);2)建立模型并利用所述打分?jǐn)?shù)據(jù)訓(xùn)練所述模型,其中所述模型中包括打分時間段對用戶的影響參數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述模型還包括打分時間段對用戶偏差的影響參數(shù)。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述模型還包括(rUJ-bUJ)的補(bǔ)償參數(shù),其中、表示已知的用戶u對項目j打分的打分值,bUJ表示用戶u對項目j打分的打分值相對于平均打分值的偏差,其中項目表示數(shù)字信息的類別的具體內(nèi)容。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述(riu.-bup的補(bǔ)償參數(shù)的系數(shù)為 (I (Rk(i ;u)|+l)-1/2,其中Rk(i ;u) =R(U) Π Sk(i),其中R(U)是用戶打分值已知的項目集合,Sk(i)表示與項目i最相似的k個項目的集合。
5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述模型還包括隱式反饋。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述隱式反饋的系數(shù)為(|Nk(i; u)|+l)-/2,其中Nk(i ;U) =N(U) η Sk(i),其中N(U)是用戶打過分的項目集合,Sk(i)表示與項目 i最相似的k個項目的集合。
7.根據(jù)權(quán)利要求4或6所述的方法,其特征在于,所述Sk(i)是基于打分的項目相似集合、基于所述類別之間存在的關(guān)聯(lián)關(guān)系的項目相似集合和基于內(nèi)容的項目相似集合中的任意一個或任意二或三個的融合結(jié)果。
8.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述步驟2)中所述建立模型是基于隱參數(shù)模型建立。
9.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述步驟2)的所述訓(xùn)練是基于最小化損失函數(shù)來訓(xùn)練。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述最小化損失函數(shù)的求解是采用梯度下降法。
11.一種數(shù)字信息推薦預(yù)測模型的訓(xùn)練系統(tǒng),包括接收模塊,用于接收打分?jǐn)?shù)據(jù);建模模塊,用于建立模型并利用所述打分?jǐn)?shù)據(jù)訓(xùn)練所述模型,其中所述模型中包括打分時間段對用戶的影響參數(shù)。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述模型還包括打分時間段對用戶偏差的影響參數(shù)。
13.一種數(shù)字信息推薦方法,包括利用根據(jù)權(quán)利要求1至10任一項所述的方法訓(xùn)練的模型進(jìn)行數(shù)字信息推薦。
14.一種數(shù)字信息推薦系統(tǒng),用于利用根據(jù)權(quán)利要求1至11任一項所述的方法訓(xùn)練的模型進(jìn)行數(shù)字信息推薦。
全文摘要
本發(fā)明提供一種數(shù)字信息推薦預(yù)測模型的訓(xùn)練方法和系統(tǒng),該方法包括1)接收打分?jǐn)?shù)據(jù);2)建立模型并利用所述打分?jǐn)?shù)據(jù)訓(xùn)練所述模型,其中所述模型中包括打分時間段對用戶的影響參數(shù)。本發(fā)明所訓(xùn)練的預(yù)測模型考慮到用戶打分的時間與所打分?jǐn)?shù)之間的規(guī)律性關(guān)系,具有較好的推薦效果。
文檔編號G06F17/30GK102508894SQ20111033973
公開日2012年6月20日 申請日期2011年11月1日 優(yōu)先權(quán)日2011年11月1日
發(fā)明者史亮, 徐飛, 李文娜, 李銳, 王斌, 魯凱 申請人:中國科學(xué)院計算技術(shù)研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1