亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于圖書內(nèi)容的圖書推薦方法

文檔序號:6355056閱讀:474來源:國知局
專利名稱:一種基于圖書內(nèi)容的圖書推薦方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及到基于內(nèi)容的圖書推薦方法。
技術(shù)背景
近年來,隨著計(jì)算機(jī)與網(wǎng)絡(luò)技術(shù)的進(jìn)步,電子商務(wù)得到了快速發(fā)展,尤其是網(wǎng)上圖書零售發(fā)展十分迅速。網(wǎng)上圖書零售不但能給電子商務(wù)企業(yè)帶來可觀的收益,更重要的是能吸引人氣,帶來客戶流量,它已經(jīng)成為大型電子商務(wù)企業(yè)的核心業(yè)務(wù)之一。
由于網(wǎng)上書店可以在網(wǎng)站上呈現(xiàn)比實(shí)體書店更多的內(nèi)容,為了幫助客戶快速找到合適的圖書,同時(shí)也為了吸引客戶購買更多的圖書,需要采用圖書推薦系統(tǒng)自動為客戶生成圖書推薦。
目前,大多數(shù)的推薦系統(tǒng)都是針對商品類別進(jìn)行分類,然后通過協(xié)同推薦或同類商品銷售排行來進(jìn)行推薦。其缺點(diǎn)有二 第一,這些推薦系統(tǒng)都是針對百貨商品來分類的, 沒有針對圖書內(nèi)容做優(yōu)化,僅僅只能將圖書照搬百貨商品的做法分門別類做推薦,導(dǎo)致推薦效果不佳;第二,其采用的協(xié)同推薦方法對于已經(jīng)形成銷售規(guī)模,具備大量銷售數(shù)據(jù)的網(wǎng)站比較適用,但是對于剛剛上線的圖書網(wǎng)站,由于缺少交易數(shù)據(jù),難以形成有效的推薦。另外,目前很多的推薦系統(tǒng)都沒有反映存貨情況,向用戶推薦的商品最終卻缺貨,顯然會大大降低用戶體驗(yàn)。發(fā)明內(nèi)容
有鑒于此,一種能反映圖書內(nèi)容,能夠結(jié)合庫存信息、促銷信息的圖書推薦方法是十分有益的。
為了解決上述問題,本發(fā)明提供了一種基于書名、作者、內(nèi)容摘要、目錄等信息,并結(jié)合庫存數(shù)據(jù)和促銷信息的圖書推薦方法,其技術(shù)方案包括
在新加入一本圖書時(shí),首先獲取其內(nèi)容信息,并將這些內(nèi)容存為特征向量。比如, 將書名存為特征向量dt,將作者存為特征向量da,將內(nèi)容摘要存為特征向量ds,將目錄存為特征向量d。。這些特征向量將進(jìn)一步處理提取關(guān)鍵詞和權(quán)重,并用于圖書之間相關(guān)性計(jì)算的特征參數(shù)。
其次,針對上述4種特征向量分別進(jìn)行特征詞的提取和特征詞的權(quán)重計(jì)算,計(jì)算結(jié)果表示為
d = (w1 W2, ... , wn)
其中,Wi代表特征詞i出現(xiàn)的次數(shù)也即特征詞i的權(quán)重;
然后,利用基于權(quán)重融合的余弦相似度函數(shù)來計(jì)算圖書間的相關(guān)性,計(jì)算公式如下
C(Bx, By) = aXsim(dt,x,dt,y)+bXsim(da,x,da,y)
+cXsim(ds,x,ds,y)+dX sim(dc,x,dc,y)
其中,C是圖書之間的相關(guān)度,Bx By代表圖書χ和y,sim(dx, dy)是余弦相似度函數(shù),a、b、c、d是不同特征向量的權(quán)重;融合圖書的四種特征向量dt、da、ds、d。得到圖書間基于內(nèi)容的相關(guān)系數(shù)C。
接下來,根據(jù)和不同圖書之間相關(guān)系數(shù)C的大小,選取相關(guān)系數(shù)最大的N本圖書, 得到該圖書的推薦列表L0。
最后,結(jié)合庫存數(shù)據(jù)和促銷信息對LO重新排序得到最終的推薦列表L。
本發(fā)明還可以通過下述方法強(qiáng)化推薦效果
上述基于權(quán)重融合的余弦相似度函數(shù)用于計(jì)算圖書之間相關(guān)性,其權(quán)重取值設(shè)定為 a = b = c = d = 25%。
上述余弦相似度函數(shù)sim(dx,dy)用于計(jì)算項(xiàng)目dx和dy的相關(guān)程度,其計(jì)算公式為
權(quán)利要求
1.一種基于內(nèi)容的圖書推薦方法,其特征在于,包括如下步驟1)獲取圖書的書名、作者、內(nèi)容摘要、目錄,將上述內(nèi)容分別存為特征向量d,其中屯代表書名,da代表作者,4代表內(nèi)容摘要,d。代表目錄;2)針對特征向量d進(jìn)行特征詞提取和權(quán)重計(jì)算,計(jì)算結(jié)果表示為d = (W1, W2,…,wn)其中,Wi代表特征詞i出現(xiàn)的次數(shù)也即特征詞i的權(quán)重;3)利用基于權(quán)重融合的余弦相似度函數(shù)來計(jì)算圖書間的相關(guān)性,計(jì)算公式如下C (Bx, By) = aXsim(dt,x, dtjy) +bXsim(dajX, da,y)+cXsim(ds,x,ds, y)+dX sim(dc,x,dc,y)其中,C是圖書之間的相關(guān)度,BX民代表圖書乂和7,8加((1!£,(^)是余弦相似度函數(shù),a、 b、c、d是不同特征向量的權(quán)重;4)根據(jù)圖書之間的相關(guān)度計(jì)算結(jié)果,按相關(guān)度由高到低順序選取N本圖書,得到推薦圖書列表LO ;5)根據(jù)圖書的庫存數(shù)據(jù)以及銷售數(shù)據(jù)、促銷信息對LO重新排序,得到最終的推薦圖書列表L。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,特征向量權(quán)重a、b、c、d的取值為a= b =c = d = 25%。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,余弦相似度函數(shù)sim(dx,dy)的計(jì)算公式為
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,圖書庫存、銷售、促銷信息對LO重排序的方法如下首先在LO中去除庫存為0的圖書得到有存貨的圖書推薦列表Li,其次根據(jù)圖書銷售量大小對Ll重排序得到L2,最后將L2中促銷的圖書按序排在最前,得到最終的推薦列表L。
全文摘要
本發(fā)明公開了一種圖書推薦方法,主要包括以下步驟獲取圖書的內(nèi)容信息,主要包括書名、作者、內(nèi)容摘要、目錄;基于上述屬性信息計(jì)算圖書之間的相似度;根據(jù)相似度排名結(jié)合庫存、銷售、促銷數(shù)據(jù)推薦圖書。本發(fā)明僅利用圖書之間內(nèi)容上的相似性計(jì)算其相關(guān)性,最后把與該書最相關(guān)的圖書作為推薦結(jié)果。
文檔編號G06F17/30GK102542046SQ201110447928
公開日2012年7月4日 申請日期2011年12月27日 優(yōu)先權(quán)日2011年12月27日
發(fā)明者韓軍 申請人:紐海信息技術(shù)(上海)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1