專(zhuān)利名稱(chēng):一種面向垂直電子商務(wù)網(wǎng)站的首頁(yè)推薦方法
技術(shù)領(lǐng)域:
本發(fā)明屬于個(gè)性化推薦領(lǐng)域,對(duì)垂直電子網(wǎng)站的新用戶(hù)進(jìn)行首頁(yè)推薦。推薦的方 法是通過(guò)JavMcript腳本采集用戶(hù)的“訪問(wèn)帶入信息”,再結(jié)合“訪問(wèn)帶入信息——下單產(chǎn) 品信息”相關(guān)度矩陣計(jì)算該用戶(hù)和每件產(chǎn)品的相關(guān)度,推薦相關(guān)度最高的N件產(chǎn)品。
背景技術(shù):
隨著電子商務(wù)的不斷發(fā)展,商品種類(lèi)和個(gè)數(shù)快速增長(zhǎng),往往用戶(hù)需要花費(fèi)很長(zhǎng)時(shí) 間才能找到自己喜歡的商品。為了提高用戶(hù)的滿(mǎn)意度,減少在瀏覽查找過(guò)程中的用戶(hù)流失 問(wèn)題,個(gè)性化推薦方法應(yīng)運(yùn)而生。目前個(gè)性化推薦系統(tǒng)主要采用的方法是內(nèi)容過(guò)濾和協(xié)同過(guò)濾推薦。內(nèi)容過(guò)濾通過(guò) 采集用戶(hù)以前的瀏覽信息,購(gòu)買(mǎi)信息,推薦給用戶(hù)相似內(nèi)容的產(chǎn)品。協(xié)同過(guò)濾通過(guò)采集或者 計(jì)算得到用戶(hù)的評(píng)分信息,分為基于用戶(hù)的協(xié)同過(guò)濾和基于產(chǎn)品的協(xié)同過(guò)濾兩種。基于用 戶(hù)的協(xié)同過(guò)濾根據(jù)評(píng)分信息計(jì)算相似用戶(hù),推薦相似用戶(hù)購(gòu)買(mǎi)過(guò)的產(chǎn)品。基于產(chǎn)品的協(xié)同 過(guò)濾根據(jù)評(píng)分信息計(jì)算和用戶(hù)購(gòu)買(mǎi)過(guò)的產(chǎn)品相似的產(chǎn)品推薦給用戶(hù)。但是內(nèi)容過(guò)濾和協(xié)同 過(guò)濾都存在新用戶(hù)問(wèn)題,對(duì)沒(méi)有任何歷史數(shù)據(jù)的新用戶(hù)難以進(jìn)行有效推薦。新用戶(hù)推薦可以通過(guò)要求用戶(hù)注冊(cè)時(shí)填入個(gè)人信息(年齡,性別,職業(yè),愛(ài)好等)或 對(duì)用戶(hù)進(jìn)行問(wèn)卷調(diào)查得到相關(guān)數(shù)據(jù)再進(jìn)行推薦,但是這兩種方法由于需要額外的用戶(hù)操 作,用戶(hù)體驗(yàn)較差,常常造成用戶(hù)的流失。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是提出面向垂直電子商務(wù)網(wǎng)站新用戶(hù)的首頁(yè)推薦方 法,垂直電子商務(wù)網(wǎng)站旗下的商品都是同一類(lèi)型的商品,垂直電子商務(wù)的用戶(hù)中新用戶(hù)的 比例很高,很多新用戶(hù)是在下單購(gòu)買(mǎi)時(shí)才注冊(cè)登錄。一個(gè)垂直電子商務(wù)網(wǎng)站的新用戶(hù)既沒(méi) 有歷史行為信息數(shù)據(jù)(歷史評(píng)分,瀏覽,購(gòu)買(mǎi)等行為),大部分情況也沒(méi)有人口統(tǒng)計(jì)信息數(shù)據(jù) (年齡,性別,職業(yè)),所以傳統(tǒng)的推薦方法難以滿(mǎn)足這個(gè)特殊場(chǎng)景的需要。本發(fā)明的技術(shù)方案為一種針對(duì)垂直電子商務(wù)網(wǎng)站的首頁(yè)推薦方法。通過(guò) JavaScript腳本采集用戶(hù)的“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”。根據(jù)歷史數(shù)據(jù)計(jì)算“訪 問(wèn)帶入信息”各維度和“下單產(chǎn)品信息”各維度的相關(guān)度。當(dāng)一個(gè)新用戶(hù)訪問(wèn)網(wǎng)站首頁(yè)時(shí), 根據(jù)該用戶(hù)的“訪問(wèn)帶入信息”和通過(guò)歷史數(shù)據(jù)得到的相關(guān)度計(jì)算得到該用戶(hù)和所有產(chǎn)品 的相關(guān)度,推薦相關(guān)度最高的N件產(chǎn)品。—種面向垂直電子商務(wù)網(wǎng)站新用戶(hù)的首頁(yè)推薦方法,其特征是具體步驟如下
1)通過(guò)JavMcript腳本采集用戶(hù)“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”,建立歷史數(shù)據(jù) 庫(kù);(“訪問(wèn)帶入信息”包括用戶(hù)的地域信息,訪問(wèn)時(shí)間信息,瀏覽器信息,操作系統(tǒng)信息,系 統(tǒng)語(yǔ)言信息,訪問(wèn)方式信息以及可能有的搜索關(guān)鍵詞信息等;“下單產(chǎn)品信息”包括產(chǎn)品顏 色,款式,價(jià)格,材料,品牌等)
2)對(duì)“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”進(jìn)行預(yù)處理;把每個(gè)用戶(hù)的“訪問(wèn)帶入信息“處理為一組關(guān)鍵字的集合,”下單產(chǎn)品信息“處理為另一組關(guān)鍵字的集合,這兩組關(guān)鍵字共 同構(gòu)成一條記錄,存進(jìn)歷史數(shù)據(jù)庫(kù);
3)根據(jù)歷史數(shù)據(jù)庫(kù)中的所有記錄計(jì)算“訪問(wèn)帶入信息”各維度和“下單產(chǎn)品信息”各維 度的相關(guān)度,得到“訪問(wèn)帶入信息——下單產(chǎn)品信息”相關(guān)度矩陣;“訪問(wèn)帶入信息”和“下單 產(chǎn)品信息”的每個(gè)維度代表一個(gè)關(guān)鍵字,相關(guān)度矩陣是一個(gè)m X η的二維矩陣,m代表“訪 問(wèn)帶入信息”的維度數(shù),η代表“下單產(chǎn)品信息”的維度數(shù);
4)當(dāng)一個(gè)新用戶(hù)訪問(wèn)網(wǎng)站首頁(yè)時(shí),通過(guò)JavMcript腳本得到該用戶(hù)的“訪問(wèn)帶入信 息”,并處理為一組關(guān)鍵字的集合;
5)如果該用戶(hù)的“訪問(wèn)帶入信息”中包含搜索的關(guān)鍵詞,根據(jù)歷史數(shù)據(jù)庫(kù),用搜索的關(guān) 鍵詞和產(chǎn)品信息的特征關(guān)鍵字做匹配,匹配的目的是把產(chǎn)品集由全部產(chǎn)品約減為符合該用 戶(hù)搜索關(guān)鍵詞的產(chǎn)品的集合;如果不包含搜索的關(guān)鍵字,則直接進(jìn)入步驟(6);
6)根據(jù)該用戶(hù)的“訪問(wèn)帶入信息”和由歷史數(shù)據(jù)庫(kù)得到的相關(guān)度矩陣計(jì)算該用戶(hù)和產(chǎn) 品集中每件產(chǎn)品的相關(guān)度,將所有產(chǎn)品按相關(guān)度由大到小排序,想該用戶(hù)推薦相關(guān)度最高 的前N件產(chǎn)品。本發(fā)明的有益效果是本發(fā)明能夠適用于垂直電子商務(wù)網(wǎng)站的新用戶(hù)既沒(méi)有歷史 行為信息數(shù)據(jù)(歷史評(píng)分,瀏覽,購(gòu)買(mǎi)等行為),大部分情況也沒(méi)有人口統(tǒng)計(jì)信息數(shù)據(jù)等殊場(chǎng) 景的需要。垂直電子商務(wù)網(wǎng)站旗下的商品都是同一類(lèi)型的商品,垂直電子商務(wù)的用戶(hù)中新 用戶(hù)的比例很高,本發(fā)明方法是有益的。
圖1是針對(duì)垂直電子商務(wù)網(wǎng)站的首頁(yè)推薦方法的流程圖。
具體實(shí)施例方式參閱圖1,本發(fā)明通過(guò)采集新用戶(hù)的“訪問(wèn)帶入信息”來(lái)解決新用戶(hù)沒(méi)有任何數(shù)據(jù) 的問(wèn)題,并結(jié)合由歷史數(shù)據(jù)訓(xùn)練得到的“訪問(wèn)帶入信息——下單產(chǎn)品信息”的相關(guān)度矩陣來(lái) 計(jì)算新用戶(hù)和產(chǎn)品集中產(chǎn)品的相關(guān)度,推薦相關(guān)度最高的N件產(chǎn)品。其具體步驟如下
1)通過(guò)Jav必cript腳本采集用戶(hù)“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”,建立歷史數(shù) 據(jù)庫(kù)?!霸L問(wèn)帶入信息,,包括用戶(hù)的地域信息(如中國(guó)-江蘇-南京),訪問(wèn)時(shí)間信息(如 2010-12-1 08:00),瀏覽器信息(如IE 6. 0),操作系統(tǒng)信息(如Win32),系統(tǒng)語(yǔ)言信息 (如English),訪問(wèn)方式信息(如通過(guò)Google搜索訪問(wèn))以及可能有的搜索關(guān)鍵詞信息 等?!跋聠萎a(chǎn)品信息”包括產(chǎn)品顏色,款式,價(jià)格,材料,品牌等; “訪問(wèn)帶入信息”可以通過(guò)以下JavMcript腳本采集得到 var χ = navigator; var Name=x. appName ; // 瀏覽器
var Version= parseFloat (χ. appVersion) ; // 瀏覽器片反本 var Platform=X. platform;// i^i^M^i
var SystemLanguage=X. systemLanguage x. systemLanguage:χ. language;// 系統(tǒng)語(yǔ)
var Refer=encodeURIComponent(encodeURIComponent(document, referrer));// 訪問(wèn)方式
var Str=new Date();
var Date=Str. getTime () ;// 時(shí)|1]
var country=geoip_country_name () ; // 國(guó)家
var region=geoip_region_name () ; // 地區(qū)
var city=geoip_city () ;// 城市
“下單產(chǎn)品信息”可以通過(guò)查詢(xún)數(shù)據(jù)庫(kù)中的產(chǎn)品信息表得到。
2)對(duì)“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”進(jìn)行預(yù)處理;把每個(gè)用戶(hù)的“訪問(wèn)帶入信息 “處理為一組關(guān)鍵字的集合,”下單產(chǎn)品信息“處理為另一組關(guān)鍵字的集合,這兩組關(guān)鍵字共 同構(gòu)成一條記錄,存進(jìn)歷史數(shù)據(jù)庫(kù);
比如預(yù)處理后歷史數(shù)據(jù)庫(kù)中的一條記錄為
訪問(wèn)帶入信息(江蘇,南京,12月,上午,IE, Win32, English, Google,眼鏡) 下單產(chǎn)品信息(黑色,太陽(yáng)鏡,100-150元,塑料,寶姿)
3)計(jì)算“訪問(wèn)帶入信息”各維度和“下單產(chǎn)品信息”各維度的相關(guān)度,得到“訪問(wèn)帶入信 息——下單產(chǎn)品信息”相關(guān)度矩陣;“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”的每個(gè)維度代表一 個(gè)關(guān)鍵字,相關(guān)度矩陣是一個(gè)m X η的二維矩陣,m代表“訪問(wèn)帶入信息”的維度數(shù),η代表 “下單產(chǎn)品信息”的維度數(shù);
相關(guān)度矩陣的計(jì)算方法如下
假設(shè)“訪問(wèn)帶入信息”有m個(gè)維度,“下單產(chǎn)品信息”有η個(gè)維度,相關(guān)度矩陣為A(m, η)。Ai, j代表“訪問(wèn)帶入信息”第i個(gè)維度和“下單產(chǎn)品信息”第j個(gè)維度的相關(guān)度。歷史 數(shù)據(jù)庫(kù)中共有N條記錄,每條記錄由“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”組成。Ai,」的計(jì) 算方法是
—包含“訪問(wèn)帶入信息”第i佛度且包含“下機(jī)口口信息”第j個(gè)維戲記纖 w包含η方問(wèn)帶入信息”第己雜
4)當(dāng)一個(gè)新用戶(hù)訪問(wèn)網(wǎng)站首頁(yè)時(shí),通過(guò)JavMcript腳本得到該用戶(hù)的“訪問(wèn)帶入信 息”并處理為一組關(guān)鍵字的集合;
采集方法同步驟(1)。5)如果該用戶(hù)的“訪問(wèn)帶入信息”中包含搜索的關(guān)鍵字,用搜索的關(guān)鍵字和產(chǎn)品信 息做匹配,把產(chǎn)品集由全部產(chǎn)品約減為符合該用戶(hù)搜索關(guān)鍵字的產(chǎn)品的集合;如果不包含 搜索關(guān)鍵字,則直接進(jìn)入步驟(6)。如場(chǎng)景是一個(gè)筆記本在線銷(xiāo)售網(wǎng)站,用戶(hù)搜索的是“聯(lián) 想筆記本”,通過(guò)將搜索關(guān)鍵字和產(chǎn)品信息做匹配,把產(chǎn)品集由全部筆記本約減為所有的聯(lián) 想品牌的筆記本。6)根據(jù)該用戶(hù)的“訪問(wèn)帶入信息”和由歷史數(shù)據(jù)庫(kù)得到的相關(guān)度矩陣計(jì)算該用戶(hù) 和產(chǎn)品集中每件產(chǎn)品的相關(guān)度,將所有產(chǎn)品按相關(guān)度由大到小排序,想該用戶(hù)推薦相關(guān)度 最高的前N件產(chǎn)品。相關(guān)度計(jì)算方法如下
假設(shè)“訪問(wèn)帶入信息——下單產(chǎn)品信息”相關(guān)度矩陣是A(m,η),當(dāng)前用戶(hù)的“訪問(wèn)帶 入信息”用長(zhǎng)度為m的向量U表示。如果當(dāng)前用戶(hù)的“訪問(wèn)帶入信息”包含“訪問(wèn)帶入信息”的第i個(gè)維度,Ui= 1;否則Ui= 0。產(chǎn)品集中的某件產(chǎn)品用長(zhǎng)度為η的向量V表示。如果 該產(chǎn)品的“產(chǎn)品信息”包含“下單產(chǎn)品信息”的第i個(gè)維度,Vi = 1 ;否則Vi = 0。則當(dāng)前用 戶(hù)和該產(chǎn)品的相關(guān)度計(jì)算方法為 相關(guān)度=UXAXVt0
權(quán)利要求
1.一種面向垂直電子商務(wù)網(wǎng)站的首頁(yè)推薦方法,其特征是通過(guò)腳本(如JavMcript) 采集用戶(hù)的“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”;根據(jù)歷史數(shù)據(jù)計(jì)算“訪問(wèn)帶入信息”各維 度和“下單產(chǎn)品信息”各維度的相關(guān)度作為推薦基礎(chǔ);當(dāng)一個(gè)新用戶(hù)訪問(wèn)網(wǎng)站首頁(yè)時(shí),根據(jù) 該用戶(hù)的“訪問(wèn)帶入信息”和通過(guò)歷史數(shù)據(jù)得到的相關(guān)度矩陣計(jì)算得到該用戶(hù)和所有產(chǎn)品 的相關(guān)度,推薦相關(guān)度最高的N件產(chǎn)品。
2.根據(jù)權(quán)利要求1所述的一種面向垂直電子商務(wù)網(wǎng)站新用戶(hù)的首頁(yè)推薦方法,其特征 是具體步驟如下1)通過(guò)JavMcript腳本采集用戶(hù)“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”,建立歷史數(shù)據(jù) 庫(kù);“訪問(wèn)帶入信息”包括用戶(hù)的地域信息,訪問(wèn)時(shí)間信息,瀏覽器信息,操作系統(tǒng)信息,系統(tǒng) 語(yǔ)言信息,訪問(wèn)方式信息以及可能有的搜索關(guān)鍵詞信息等;“下單產(chǎn)品信息”包括產(chǎn)品顏色, 款式,價(jià)格,材料,品牌等2)對(duì)“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”進(jìn)行預(yù)處理;把每個(gè)用戶(hù)的“訪問(wèn)帶入信息 “處理為一組關(guān)鍵字的集合,”下單產(chǎn)品信息“處理為另一組關(guān)鍵字的集合,這兩組關(guān)鍵字共 同構(gòu)成一條記錄,存進(jìn)歷史數(shù)據(jù)庫(kù);3)根據(jù)歷史數(shù)據(jù)庫(kù)中的所有記錄計(jì)算“訪問(wèn)帶入信息”各維度和“下單產(chǎn)品信息”各維 度的相關(guān)度,得到“訪問(wèn)帶入信息——下單產(chǎn)品信息”相關(guān)度矩陣;“訪問(wèn)帶入信息”和“下單 產(chǎn)品信息”的每個(gè)維度代表一個(gè)關(guān)鍵字,相關(guān)度矩陣是一個(gè)m X η的二維矩陣,m代表“訪 問(wèn)帶入信息”的維度數(shù),η代表“下單產(chǎn)品信息”的維度數(shù);4)當(dāng)一個(gè)新用戶(hù)訪問(wèn)網(wǎng)站首頁(yè)時(shí),通過(guò)JavMcript腳本得到該用戶(hù)的“訪問(wèn)帶入信 息”,并處理為一組關(guān)鍵字的集合;5)如果該用戶(hù)的“訪問(wèn)帶入信息”中包含搜索的關(guān)鍵詞,根據(jù)歷史數(shù)據(jù)庫(kù),用搜索的關(guān) 鍵詞和產(chǎn)品信息的特征關(guān)鍵字做匹配,匹配的目的是把產(chǎn)品集由全部產(chǎn)品約減為符合該用 戶(hù)搜索關(guān)鍵詞的產(chǎn)品的集合;如果不包含搜索的關(guān)鍵字,則直接進(jìn)入步驟(6);6)根據(jù)該用戶(hù)的“訪問(wèn)帶入信息”和由歷史數(shù)據(jù)庫(kù)得到的相關(guān)度矩陣計(jì)算該用戶(hù)和產(chǎn) 品集中每件產(chǎn)品的相關(guān)度,將所有產(chǎn)品按相關(guān)度由大到小排序,想該用戶(hù)推薦相關(guān)度最高 的前N件產(chǎn)品。
3.根據(jù)權(quán)利要求2所述的面向垂直電子商務(wù)網(wǎng)站的首頁(yè)推薦方法,其特征是計(jì)算相關(guān) 度矩陣的計(jì)算方法如下假設(shè)“訪問(wèn)帶入信息”有m個(gè)維度,“下單產(chǎn)品信息”有η個(gè)維度,相關(guān)度矩陣為A (m, η) j代表“訪問(wèn)帶入信息”第i個(gè)維度和“下單產(chǎn)品信息”第j個(gè)維度的相關(guān)度;歷史數(shù) 據(jù)庫(kù)中共有N條記錄,每條記錄由“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”組成」的計(jì)算 方法是
全文摘要
面向垂直電子商務(wù)網(wǎng)站的首頁(yè)推薦方法,通過(guò)腳本(如JavaScript)采集用戶(hù)的“訪問(wèn)帶入信息”和“下單產(chǎn)品信息”;根據(jù)歷史數(shù)據(jù)計(jì)算“訪問(wèn)帶入信息”各維度和“下單產(chǎn)品信息”各維度的相關(guān)度作為推薦基礎(chǔ);當(dāng)一個(gè)新用戶(hù)訪問(wèn)網(wǎng)站首頁(yè)時(shí),根據(jù)該用戶(hù)的“訪問(wèn)帶入信息”和通過(guò)歷史數(shù)據(jù)得到的相關(guān)度矩陣計(jì)算得到該用戶(hù)和所有產(chǎn)品的相關(guān)度,推薦相關(guān)度最高的N件產(chǎn)品。本發(fā)明能夠適用于垂直電子商務(wù)網(wǎng)站的新用戶(hù)既沒(méi)有歷史行為信息數(shù)據(jù)(歷史評(píng)分,瀏覽,購(gòu)買(mǎi)等行為),大部分情況也沒(méi)有人口統(tǒng)計(jì)信息數(shù)據(jù)等殊場(chǎng)景的需要。垂直電子商務(wù)網(wǎng)站旗下的商品都是同一類(lèi)型的商品,垂直電子商務(wù)的用戶(hù)中新用戶(hù)的比例很高,本發(fā)明方法是有益的。
文檔編號(hào)G06F17/30GK102073717SQ20111000213
公開(kāi)日2011年5月25日 申請(qǐng)日期2011年1月7日 優(yōu)先權(quán)日2011年1月7日
發(fā)明者劉嘉, 惠成峰, 祁奇, 陳振宇 申請(qǐng)人:南京大學(xué)