專利名稱:一種基于用戶行為的電子商務(wù)信息推薦方法與裝置的制作方法
技術(shù)領(lǐng)域:
本申請(qǐng)涉及電子商務(wù)信息推薦技術(shù)領(lǐng)域,尤其涉及一種基于用戶行為的電子商務(wù)信息推薦方法與裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,電子商務(wù)蓬勃興起。電子商務(wù)是利用計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和遠(yuǎn)程通信技術(shù),使商務(wù)交易中的買賣雙方在不需謀面的情況下實(shí)現(xiàn)各種商貿(mào)活動(dòng)。要實(shí)現(xiàn)商貿(mào)交易,買方必須預(yù)先獲知商品的內(nèi)容信息以便決策是否購買該商品。商品內(nèi)容信息包括商品所屬行業(yè)類目、商品的提供商、商品價(jià)格以及與該商品相關(guān)的資訊信息等。在電子商務(wù)信息交易平臺(tái)上,獲知所述內(nèi)容信息的方式主要有兩種一種是用戶(買方)主動(dòng)搜索方式,即用戶在明確自己的購買需求后,將需求以關(guān)鍵詞的形式體現(xiàn)出來,然后利用該關(guān)鍵詞在海量的多樣性數(shù)據(jù)中檢索,從而獲得需要的內(nèi)容信息;另一種是用戶被動(dòng)接受型,即賣方通過電子商務(wù)交易平臺(tái)向用戶推薦商品的內(nèi)容信息,用戶被動(dòng)接受賣方推薦的商品內(nèi)容信息后,在該內(nèi)容信息的導(dǎo)引下購買相關(guān)產(chǎn)品。對(duì)于第二種方式,商貿(mào)交易的賣方為了提高交易成功率,往往不會(huì)將自己的所有信息直接推薦給用戶,而是首先分析用戶過去的行為建立用戶偏好數(shù)據(jù),然后根據(jù)用戶偏好針對(duì)性地推薦用戶可能感興趣的特定信息。這種推薦方式在電子商務(wù)信息交易中能顯著提高用戶體驗(yàn),增加賣家曝光的精準(zhǔn)度,能有效引導(dǎo)用戶迅速成為買家,從而降低交易成本。但是,電子商務(wù)信息的信息推薦者進(jìn)行用戶偏好分析時(shí)獲取的用戶歷史行為數(shù)據(jù)可能存在偏差、錯(cuò)誤,甚至包括以用戶名義惡意引導(dǎo)消費(fèi)傾向的作弊數(shù)據(jù),建立在這些數(shù)據(jù)基礎(chǔ)上的分析結(jié)果必然不能真實(shí)地反映用戶偏好特點(diǎn),從而導(dǎo)致推薦內(nèi)容信息偏離用戶需求,推薦效果受到影響。另外,由于電子商務(wù)網(wǎng)站的信息訪問量特別巨大,電子商務(wù)網(wǎng)站服務(wù)器中存在海量的用戶行為數(shù)據(jù),針對(duì)海量用戶行為數(shù)據(jù)分析得到用戶偏好數(shù)據(jù)對(duì)推薦系統(tǒng)自身處理能力是一種嚴(yán)峻考驗(yàn),海量的用戶行為數(shù)據(jù)減緩了推薦系統(tǒng)的分析處理速度。
發(fā)明內(nèi)容
有鑒于此,本申請(qǐng)的發(fā)明目的在于提供一種基于用戶行為的電子商務(wù)信息推薦方法與裝置,通過對(duì)用戶行為數(shù)據(jù)的優(yōu)化,一方面濾除可能存在的“偽數(shù)據(jù)”以校正用戶偏好數(shù)據(jù),從而確保根據(jù)用戶偏好數(shù)據(jù)推薦的內(nèi)容信息符合用戶的真實(shí)偏好;另一方面減少用于用戶偏好分析的數(shù)據(jù)量以提高偏好數(shù)據(jù)的分析速度,從而確保用戶快速的獲取到推薦的內(nèi)容信息。本申請(qǐng)?zhí)峁┑幕谟脩粜袨榈碾娮由虅?wù)信息推薦方法包括統(tǒng)計(jì)預(yù)設(shè)時(shí)期內(nèi)用戶行為類型和各行為類型對(duì)應(yīng)的用戶行為的頻率;判斷用戶行為類型數(shù)是否超過預(yù)設(shè)類型閥值,如果是,則保留小于等于預(yù)設(shè)類型閥值數(shù)的用戶行為類型;和/或,判斷各用戶行為的頻率是否超過預(yù)設(shè)頻率閥值,如果是,則將預(yù)設(shè)頻率閥值作為該用戶行為的頻率;
根據(jù)上述處理后的用戶行為類型和用戶行為的頻率分析用戶行為指向的內(nèi)容信息,得到用戶偏好數(shù)據(jù),所述用戶偏好數(shù)據(jù)為各內(nèi)容信息的頻率分布;利用用戶偏好數(shù)據(jù)向用戶推薦內(nèi)容信息。本申請(qǐng)還提供了一種基于用戶行為的電子商務(wù)信息推薦裝置,該裝置包括統(tǒng)計(jì)模塊、判斷模塊、偏好分析模塊和信息推薦模塊,其中所述統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)預(yù)設(shè)時(shí)期內(nèi)的用戶行為類型和各行為類型對(duì)應(yīng)的用戶行為的頻率;所述判斷模塊,用于判斷用戶行為類型數(shù)是否超過預(yù)設(shè)類型閥值,如果是,則保留小于等于預(yù)設(shè)類型閥值數(shù)的用戶行為類型;和/或,判斷各用戶行為的頻率是否超過預(yù)設(shè)頻率閥值,如果是,則將預(yù)設(shè)頻率閥值作為該用戶行為的頻率;所述偏好分析模塊,用于根據(jù)上述處理后的用戶行為類型和用戶行為的頻率分析用戶行為指向的內(nèi)容信息,得到用戶偏好數(shù)據(jù),所述用戶偏好數(shù)據(jù)為各內(nèi)容信息的頻率分布;所述信息推薦模塊,用于利用用戶偏好數(shù)據(jù)向用戶推薦內(nèi)容信息。本申請(qǐng)的技術(shù)方案通過判斷用戶行為類型數(shù)與用戶行為的頻率是否符合預(yù)設(shè)閥值的方式對(duì)用戶的歷史行為數(shù)據(jù)進(jìn)行優(yōu)化,在該優(yōu)化處理后的用戶行為數(shù)據(jù)基礎(chǔ)上分析得到用戶偏好,然后根據(jù)該偏好向用戶推薦相應(yīng)的內(nèi)容信息。與現(xiàn)有技術(shù)相比,本申請(qǐng)的優(yōu)化處理過程排除了用戶行為數(shù)據(jù)中的惡意行為、作弊行為等“偽數(shù)據(jù)”,使得根據(jù)該優(yōu)化數(shù)據(jù)進(jìn)行的偏好分析結(jié)果更真實(shí)地反映了用戶的偏好特點(diǎn),進(jìn)而使得根據(jù)該用戶偏好進(jìn)行的信息推薦的推薦效果更好,提高了電子商務(wù)信息的交易成功率。另外,由于根據(jù)偏好分析結(jié)果推薦的信息能夠符合用戶的實(shí)際需求愿望,這樣用戶只需根據(jù)電子商務(wù)交易平臺(tái)推薦的信息完成交易即可,而不必再反復(fù)查找其所需的內(nèi)容信息,降低了反復(fù)查找內(nèi)容信息給電子商務(wù)平臺(tái)帶來的訪問壓力。并且,由于本申請(qǐng)的優(yōu)化處理過程去除了用戶行為數(shù)據(jù)中的大量“偽數(shù)據(jù)”,減少了用于信息推薦分析的數(shù)據(jù)量,提高了信息推薦分析的速度,能夠更加快速的獲取到推薦信息。
圖I為本申請(qǐng)的方法的實(shí)施例一的流程圖;圖2為本申請(qǐng)的方法的實(shí)施例二的流程圖;圖3為本申請(qǐng)的方法的實(shí)施例三的流程圖;圖4為本申請(qǐng)的方法的實(shí)施例四的流程圖;圖5為本申請(qǐng)的方法的實(shí)施例五的流程圖;圖6為本申請(qǐng)的方法的實(shí)施例六的內(nèi)容信息推薦的流程圖;圖7為本申請(qǐng)的方法的實(shí)施例七的內(nèi)容信息推薦的流程圖;圖8為本申請(qǐng)的裝置的實(shí)施例八的組成框圖。
具體實(shí)施例方式本申請(qǐng)通過統(tǒng)計(jì)用戶行為類型和用戶行為類型對(duì)應(yīng)的用戶行為的頻率,將該統(tǒng)計(jì)結(jié)果與預(yù)設(shè)閥值進(jìn)行比較,以濾除用戶行為數(shù)據(jù)中的惡意行為、作弊行為等“偽數(shù)據(jù)”,然后在上述經(jīng)過優(yōu)化處理后的用戶行為數(shù)據(jù)基礎(chǔ)上進(jìn)行用戶偏好分析,根據(jù)分析得到的用戶偏好特點(diǎn)實(shí)現(xiàn)相應(yīng)內(nèi)容信息的推薦。為使本領(lǐng)域技術(shù)人員進(jìn)一步了解本申請(qǐng)的特征及技術(shù)內(nèi)容,下面結(jié)合附圖和實(shí)施例,對(duì)本申請(qǐng)的技術(shù)方案進(jìn)行詳細(xì)描述。實(shí)施例一電子商務(wù)信息交易平臺(tái)是虛擬的市場(chǎng),買賣主體不需要面對(duì)面磋商即可完成交易。交易的成功與否取決于交易中買方的求購愿望與賣方的供給內(nèi)容間的匹配程度。賣方主動(dòng)提供商品信息固然可以增加賣家的曝光率,提高交易成功概率,但是,如果賣方主動(dòng)供給內(nèi)容與買方需求偏差太大,賣方即便使出“渾身解數(shù)”,可能仍將甚微收獲。因此,為提高交易成功率,賣家的主動(dòng)推送行為往往需要建立在對(duì)用戶的分析基礎(chǔ)上,這種分析需要預(yù)先收集大量的用戶信息,包括用戶的歷史行為數(shù)據(jù)、用戶屬性數(shù)據(jù)等內(nèi)容,利用這些用戶訓(xùn)練得到某個(gè)內(nèi)容信息的傾向預(yù)測(cè)數(shù)據(jù),進(jìn)而將某個(gè)特定用戶的用戶偏好與該傾向預(yù)測(cè)數(shù)據(jù)進(jìn)行匹配以決定如何向用戶推薦相應(yīng)的內(nèi)容信息。分析用戶偏好通常建立在用戶的歷史行為數(shù)據(jù)基礎(chǔ)上,用戶歷史行為反映了用戶的求購愿望。比如,某個(gè)用戶行為在一段時(shí)間內(nèi)集中高頻出現(xiàn),該行為指向的內(nèi)容信息也集中出現(xiàn)在某些商品,則說明該用戶在該時(shí)期內(nèi)的偏好就是這些商品,該用戶有極大可能會(huì)購買該商品,如果信息提供商能夠提供與該偏好匹配的產(chǎn)品信息,必然增大了交易成功率。然而,正如背景技術(shù)所言,有些用戶的歷史行為數(shù)據(jù)可能不真實(shí),是“偽數(shù)據(jù)”,比如現(xiàn)實(shí)中可能存在這樣的情形在某個(gè)時(shí)期內(nèi)大部分用戶均關(guān)注某一產(chǎn)品,則說明該產(chǎn)品是該時(shí)段內(nèi)的新潮產(chǎn)品,由于用戶的個(gè)人偏好大多受大眾消費(fèi)趨勢(shì)的影響,那么單個(gè)用戶的偏好將轉(zhuǎn)向該商品信息,從而導(dǎo)致從事該商品交易的賣家利潤可觀?;诶麧櫟臓?zhēng)奪,有些賣家便抓住用戶的這種心理,以用戶名義在某時(shí)期內(nèi)大量重復(fù)某些行為,以圖誘導(dǎo)消費(fèi)趨勢(shì)。這樣用戶的歷史行為數(shù)據(jù)中將出現(xiàn)“作弊數(shù)據(jù)”,建立在這些數(shù)據(jù)基礎(chǔ)上的用戶偏好分析將“失真”,進(jìn)而導(dǎo)致推薦的內(nèi)容信息與用戶的真實(shí)需求偏離,降低交易成功率。另外,由于分析用戶偏好需要建立在海量的用戶的歷史行為數(shù)據(jù)基礎(chǔ)上,再加上某些賣家惡意以用戶名義在某時(shí)期內(nèi)大量重復(fù)某些行為,更進(jìn)一步的增加了進(jìn)行用戶偏好分析所依據(jù)的歷史行為數(shù)據(jù)量,導(dǎo)致用戶偏好的分析速度緩慢。本申請(qǐng)的實(shí)施例提供了一種基于用戶行為的電子商務(wù)信息推薦方法,該方法對(duì)用戶歷史行為數(shù)據(jù)進(jìn)行優(yōu)化處理以濾除“偽數(shù)據(jù)”。參見附圖1,本實(shí)施例提供的一種基于用戶行為的電子商務(wù)信息推薦方法包括步驟SlOl :統(tǒng)計(jì)預(yù)設(shè)時(shí)期內(nèi)用戶行為類型和各行為類型對(duì)應(yīng)的用戶行為的頻率;獲取用戶的偏好數(shù)據(jù)需要根據(jù)用戶的歷史行為進(jìn)行分析,分析的前提是要選擇一個(gè)參考時(shí)間段,即設(shè)定一個(gè)預(yù)設(shè)時(shí)期,該預(yù)設(shè)時(shí)期的長(zhǎng)短將影響到用戶偏好的分析結(jié)果預(yù)設(shè)時(shí)期長(zhǎng)度不同,選擇的用戶行為類型的數(shù)量和用戶行為的頻率便不同,由此得出的用戶偏好也可能大不相同,一般而言,該預(yù)設(shè)時(shí)期不宜選擇過長(zhǎng),過長(zhǎng)則無法準(zhǔn)確反應(yīng)用戶偏好的遷移特性和細(xì)微變化,也不宜選擇過短,過短則可能導(dǎo)致用戶的偏好不具有代表性;預(yù)設(shè)時(shí)期確定后,將統(tǒng)計(jì)分析該預(yù)設(shè)時(shí)期內(nèi)的用戶行為類型以及該行為類型對(duì)應(yīng)的用戶行為的頻率,這里的用戶行為類型包括但不限于檢索、瀏覽、點(diǎn)擊、保存行為,用戶行為的頻率是某種用戶行為類型在該預(yù)設(shè)時(shí)期內(nèi)發(fā)生的次數(shù),用戶行為類型與用戶行為頻率對(duì)應(yīng);為后面更見形象的說明起見,此處假設(shè)在預(yù)設(shè)時(shí)期T內(nèi)統(tǒng)計(jì)得到五種行為類型,分別為actl、act2、act3、act4、act5,每種行為類型對(duì)應(yīng)的用戶行為的頻率分別為fl、f2、f3、f4、f5,由于“偽數(shù)據(jù)”的存在,上述五種用戶行為類型可能是虛假的,不代表用戶真實(shí)行為。步驟S102 :判斷用戶行為類型數(shù)是否超過預(yù)設(shè)類型閥值,如果是,則保留預(yù)設(shè)類型閥值數(shù)的用戶行為類型;上面曾提到用戶行為可能包含有作弊行為,這些作弊行為在建立用戶行為偏好數(shù)據(jù)時(shí)需要予以剔除,否則將影響到根據(jù)偏好數(shù)據(jù)進(jìn)行推薦的推薦效果;進(jìn)行作弊數(shù)據(jù)剔除的依據(jù)是預(yù)設(shè)類型閥值,該預(yù)設(shè)閥值可以是通過分析一定時(shí)期內(nèi)大量的用戶行為得出的統(tǒng)計(jì)數(shù)據(jù),也可以是根據(jù)實(shí)際操作情況得出的一個(gè)經(jīng)驗(yàn)估計(jì)值,在此基礎(chǔ)上根據(jù)推薦效果進(jìn)行修正調(diào)整;上述舉例中,假設(shè)預(yù)設(shè)類型閥值Θ actth = 4,那么上述五種行為類型就超過了該預(yù)設(shè)閥值指定的數(shù)量,說明該用戶行為類型中包含有“偽行為”,這時(shí)則將上述的五種用戶行為類型按照預(yù)設(shè)類型閥值數(shù)進(jìn)行保留,即只留下四種用戶行為類型,該四種用戶行為類型分別為act2、act3、act4、act5,由于用戶行為類型與用戶行為的頻率相聯(lián)系,因而用戶行為的頻率也保留下f2、f3、f4、f5四個(gè)對(duì)應(yīng)的頻率值,需要說明的是這里過濾掉的是actl行為類型,實(shí)際上,也可以過濾掉其他行為類型,只要剩余的用戶行為類型數(shù)量不超過預(yù)設(shè)類型閥值即可;然而,盡管這種濾除操作并沒限定濾除對(duì)象,但在一些情況下結(jié)合其他因素進(jìn)行濾除則更為合理,比如,在用戶行為類型數(shù)超過預(yù)設(shè)類型閥值時(shí),優(yōu)先考慮濾除時(shí)間最早的行為類型,因?yàn)樵擃愋蛯?duì)用戶偏好的影響可能已經(jīng)“過時(shí)”,也可以優(yōu)先考慮將頻率最高的用戶行為對(duì)應(yīng)的用戶行為類型濾除,因?yàn)樵擃l率最高的用戶行為可能恰巧代表的是作弊行為。該優(yōu)選實(shí)施例的推廣應(yīng)用即為在用戶行為類型數(shù)超過預(yù)設(shè)類型閥值時(shí),保留低于預(yù)設(shè)頻率閥值的用戶行為對(duì)應(yīng)的用戶行為類型,從而使得用戶行為類型數(shù)不超過預(yù)設(shè)類型閥值,通過這兩種方式可以有效慮除作弊行為。步驟S103 :根據(jù)上述處理后的用戶行為類型和用戶行為的頻率分析用戶行為指向的內(nèi)容信息,得到用戶偏好數(shù)據(jù),所述用戶偏好數(shù)據(jù)為各內(nèi)容信息的頻率分布;用戶的每個(gè)行為均對(duì)應(yīng)一個(gè)或者多個(gè)行為對(duì)象,該行為對(duì)象即是用戶行為指向的內(nèi)容信息,該內(nèi)容信息可以是單個(gè)信息,也可以是復(fù)合信息,比如用戶在網(wǎng)絡(luò)中搜索了一件商品,用戶行為類型則為“搜索行為”,該“搜索行為”指向的內(nèi)容信息即是該商品,該商品的屬性可以包括商品價(jià)格、商品形狀、商品所屬行業(yè)類目等中的一種,也可以是上述商品屬性中的幾種,甚至還可進(jìn)一步延伸包括商品提供商、提供商的資質(zhì)情況等;在上述的舉例中,假設(shè)上述每種用戶行為類型指向的內(nèi)容信息分別是act2指向三種內(nèi)容信息Cl、C2、C3,該三種內(nèi)容信息出現(xiàn)的頻率分別為f21、f22、f23,此三種頻率的總和為f2,表示為 act2 (Cl [f21]、C2 [f22]、C3 [f23]) ;act3 (Cl [f31]、C2 [f32]、C3 [f33]、C4 [f34]、C5 [f35])、act4 (C2 [f42]、C3 [f43]、C5 [f45])、act5 (C2 [f52]、C3 [f53]、C4 [f54]、C5 [f55]);得到上述數(shù)據(jù)后,以用戶行為指向的內(nèi)容信息為依據(jù)繪制用戶偏好數(shù)據(jù)曲線,將該曲線頂點(diǎn)(頻率值最大)對(duì)應(yīng)的內(nèi)容信息作為用戶偏好上述數(shù)據(jù)共出現(xiàn)Cl、C2、C3、C4、C5五種內(nèi)容信息,他們的頻率值分別為 f21+f31、f22+f32+f42+f52、f23+f33+f43+f53、f34+f54、f35+f45+f55,選取其中頻率值最高的對(duì)應(yīng)的內(nèi)容信息作為該用戶的用戶偏好數(shù)據(jù),也可以先設(shè)定一個(gè)預(yù)設(shè)值,將超過該預(yù)設(shè)值的對(duì)應(yīng)的多個(gè)內(nèi)容信息作為該用戶的用戶偏好數(shù)據(jù)。步驟S104 :利用用戶偏好數(shù)據(jù)向用戶推薦內(nèi)容信息。上述步驟中已經(jīng)分析出了用戶的偏好數(shù)據(jù),則根據(jù)該偏好數(shù)據(jù)即可進(jìn)行內(nèi)容推薦。本申請(qǐng)的實(shí)施例通過將用戶的歷史行為類型和該類型對(duì)應(yīng)的頻率與預(yù)設(shè)閥值進(jìn)行比較,排除用戶歷史行為中的作弊數(shù)據(jù)、惡意數(shù)據(jù),在該處理后的數(shù)據(jù)基礎(chǔ)之上進(jìn)行用戶偏好分析,根據(jù)分析得到的用戶偏好數(shù)據(jù)實(shí)現(xiàn)內(nèi)容信息的推薦。與現(xiàn)有技術(shù)相比,本實(shí)例建立用戶偏好數(shù)據(jù)時(shí)對(duì)用戶行為數(shù)據(jù)進(jìn)行了優(yōu)化處理,消除了可能的“偽數(shù)據(jù)”,使得根據(jù)較為準(zhǔn)確的用戶行為數(shù)據(jù)得到的用戶偏好能真實(shí)地反映用戶的實(shí)際需求愿望,進(jìn)而獲得較好的推薦效果,提高電子商務(wù)信息交易的成功率。實(shí)際應(yīng)用中,由于推薦的商品信息能夠符合用戶的實(shí)際需求愿望,這樣用戶只需根據(jù)電子商務(wù)交易平臺(tái)推薦的信息完成交易即可,而不必再反復(fù)查找其所需的商品信息,降低了反復(fù)查找商品信息給電子商務(wù)平臺(tái)帶來的訪問壓力。另外,由于本申請(qǐng)的優(yōu)化處理過程去除了用戶行為數(shù)據(jù)中的大量“偽數(shù)據(jù)”,減少了用于信息推薦分析的數(shù)據(jù)量,提高了信息推薦分析的速度,能夠更加快速的獲取到推薦信息。上述實(shí)施例中,僅僅從用戶行為類型的角度對(duì)用戶行為數(shù)據(jù)進(jìn)行了優(yōu)化,實(shí)際上,還可以對(duì)用戶行為的頻率進(jìn)行優(yōu)化處理,因?yàn)樵陬A(yù)設(shè)時(shí)間段內(nèi)某個(gè)用戶行為的頻率也可能出現(xiàn)異常,比如“畸高”或“畸低”,這些情形可能反映出該數(shù)據(jù)是作弊數(shù)據(jù),也應(yīng)當(dāng)予以剔除。因此,上實(shí)施例的步驟S102之后還可以增加下述步驟判斷各用戶行為的頻率是否超過該用戶行為的預(yù)設(shè)頻率閥值,如果是,則將預(yù)設(shè)頻率閥值作為該用戶行為的頻率;經(jīng)過上述步驟后的用戶行為類型和行為頻率更加得到優(yōu)化,建立在此基礎(chǔ)上的用戶偏好更加準(zhǔn)確進(jìn)而取得更好的推薦效果。值得注意的一點(diǎn)是,上述步驟除可以和實(shí)施例一中步驟S102以并列方式進(jìn)行外,還可以替代步驟S102,同樣能達(dá)到改善推薦效果的目的。實(shí)施例二上述實(shí)施例雖然通過與預(yù)設(shè)類型(頻率)閥值的匹配濾除了用戶行為中的“偽數(shù)據(jù)”,經(jīng)過濾除處理后的用戶行為數(shù)據(jù)已能較好地反映用戶的真實(shí)偏好。但是,在預(yù)設(shè)時(shí)期T內(nèi)用戶行為的發(fā)生時(shí)間往往不同,發(fā)生時(shí)間的差異對(duì)分析用戶偏好的影響也不同,一般而言,越是靠近該預(yù)設(shè)時(shí)期T的結(jié)束時(shí)刻發(fā)生的用戶行為越接近用戶的真實(shí)偏好,越是靠近該預(yù)設(shè)時(shí)期T的起始時(shí)刻發(fā)生的用戶行為越偏離用戶的真實(shí)偏好。因此,有必要在上述實(shí)施例的基礎(chǔ)上對(duì)用戶行為數(shù)據(jù)進(jìn)行時(shí)間影響消除處理,實(shí)現(xiàn)這種處理的具體方式很多,只要能反映出發(fā)生時(shí)間靠后的用戶行為對(duì)用戶偏好建立的影響大,發(fā)生時(shí)間靠前的用戶行為對(duì)用戶偏好建立的影響小,即可實(shí)現(xiàn)本申請(qǐng)的發(fā)明目的。在實(shí)施例一的基礎(chǔ)上增加上述處理步驟后的方法構(gòu)成本申請(qǐng)的又一個(gè)實(shí)施例,參見附圖2,該實(shí)施例與實(shí)施例一除在步驟S102、S103之間添加下述內(nèi)容外,其他步驟相同。本實(shí)施例給出的時(shí)間影響消除處理的步驟包括對(duì)用戶行為進(jìn)行時(shí)間影響消除處理,該處理步驟包括對(duì)用戶行為賦予時(shí)間權(quán)重值,所述時(shí)間權(quán)重值為越靠近預(yù)設(shè)時(shí)期結(jié)束時(shí)刻權(quán)重值越高,越靠近預(yù)設(shè)時(shí)期的起始時(shí)刻權(quán)重值越低。本實(shí)施例對(duì)用戶行為數(shù)據(jù)進(jìn)行了時(shí)間影響消除處理,使得以用戶行為為基礎(chǔ)構(gòu)建用戶偏好的準(zhǔn)確度進(jìn)一步提高,進(jìn)而推薦效果得到更好改善。盡管時(shí)間影響消除的具體實(shí)現(xiàn)方式較多,但本申請(qǐng)的實(shí)施例優(yōu)選按照如下的方式計(jì)算時(shí)間權(quán)重值時(shí)間權(quán)重值=1/log(Doff)式中Dtjff為用戶行為發(fā)生時(shí)刻到預(yù)設(shè)時(shí)期結(jié)束時(shí)刻的時(shí)間差。用戶行為被賦予權(quán)重值后,用戶行為的頻率值乘以相應(yīng)的時(shí)間權(quán)重值以修正用戶行為頻率,按照這種方式優(yōu)化后的用戶行為數(shù)據(jù)將更能準(zhǔn)確地反映用戶在預(yù)設(shè)時(shí)期內(nèi)的偏好特征。實(shí)施例三用戶行為指向的內(nèi)容信息是分析用戶偏好的基礎(chǔ),但是,用戶在進(jìn)行某些用戶行為時(shí)指向的內(nèi)容信息受到用戶知識(shí)能力的限制,可能并不準(zhǔn)確,由此可能導(dǎo)致在此基礎(chǔ)上的分析出現(xiàn)偏差。比如,用戶實(shí)施了一個(gè)搜索行為,該搜索行為指向“關(guān)鍵詞1”,這個(gè)“關(guān)鍵詞I”是用戶根據(jù)自己掌握的知識(shí)所確定的關(guān)鍵詞,但該關(guān)鍵詞可能并不準(zhǔn)確,甚至有歧義、錯(cuò)誤,此刻則需進(jìn)行“偏差校正”,校正后的數(shù)據(jù)才能用于進(jìn)行用戶偏好分析。在實(shí)施例一的基礎(chǔ)上增加上述處理步驟后的方法可構(gòu)成本申請(qǐng)的再一個(gè)實(shí)施例,參見附圖3,該實(shí)施例與實(shí)施例一除在步驟S102、S103之間添加下述內(nèi)容外,其他步驟相同。本實(shí)施例給出的內(nèi)容/[目息偏差校正方法包括對(duì)內(nèi)容信息進(jìn)行標(biāo)準(zhǔn)化處理,該處理步驟包括根據(jù)標(biāo)準(zhǔn)產(chǎn)品單元和行業(yè)知識(shí)庫校正內(nèi)容信息。標(biāo)準(zhǔn)產(chǎn)品單元SPU(Standard Product Unit)是一組可復(fù)用、易檢索的標(biāo)準(zhǔn)化信息的集合,該集合描述了 “產(chǎn)品”的特性,存儲(chǔ)了產(chǎn)品的基本信息;行業(yè)知識(shí)庫是某行業(yè)的“知識(shí)”的集合,這些“知識(shí)”包括行業(yè)標(biāo)準(zhǔn)、行業(yè)業(yè)務(wù)模型、行業(yè)業(yè)務(wù)數(shù)據(jù)與信息模型、行業(yè)信息化全景圖、行業(yè)領(lǐng)域構(gòu)件、行業(yè)采購鏈、行業(yè)上下游產(chǎn)品等內(nèi)容,該知識(shí)庫涵蓋的內(nèi)容相當(dāng)豐富。用戶行為指向的內(nèi)容信息提取出來后,將其與標(biāo)準(zhǔn)產(chǎn)品單元和行業(yè)知識(shí)庫進(jìn)行匹配比較,如果兩者不一致,則用標(biāo)準(zhǔn)產(chǎn)品單元和行業(yè)知識(shí)庫中的標(biāo)準(zhǔn)語言描述該內(nèi)容信息,經(jīng)過這樣標(biāo)準(zhǔn)化處理后的內(nèi)容信息更加便于后續(xù)步驟的識(shí)別和處理,對(duì)于快速、準(zhǔn)確地完成用戶偏好分析具有良好效果。實(shí)施例四前述實(shí)施例選取了一個(gè)參考時(shí)間周期即預(yù)設(shè)時(shí)間T,通過對(duì)該時(shí)期內(nèi)的用戶行為類型和用戶行為的頻率進(jìn)行分析得到用戶偏好數(shù)據(jù)。但是,用戶在該時(shí)間周期內(nèi)可能發(fā)生偏好遷移(變化),也就是說,用戶可能在一個(gè)時(shí)段內(nèi)對(duì)內(nèi)容信息I感興趣,在另一個(gè)時(shí)段內(nèi)可能對(duì)與內(nèi)容信息I相關(guān)聯(lián)的內(nèi)容信息2感興趣(內(nèi)容信息I與內(nèi)容信息2形成遷移對(duì)),這種情形即是用戶偏好的遷移特性,在分析具有偏好遷移特性的用戶行為時(shí),需要注意的是只有遷移對(duì)的遷移終點(diǎn)對(duì)應(yīng)的內(nèi)容信息(內(nèi)容信息2)才真實(shí)地代表用戶當(dāng)下的興趣,對(duì)于遷移對(duì)的遷移起點(diǎn)對(duì)應(yīng)的內(nèi)容信息(內(nèi)容信息I)表示用戶已經(jīng)“放棄”該內(nèi)容信息,對(duì)此不再感興趣,因此,應(yīng)當(dāng)將遷移終點(diǎn)對(duì)應(yīng)的內(nèi)容信息作為用戶偏好,并據(jù)此進(jìn)行內(nèi)容信息的推薦。除用戶偏好發(fā)生遷移的情形外,在預(yù)設(shè)時(shí)期內(nèi)的某個(gè)時(shí)段內(nèi)可能存在用戶對(duì)某個(gè)內(nèi)容信息極度感興趣,用戶行為頻率極大,這種情形構(gòu)成用戶偏好的突發(fā)特性,該特性說明該用戶的偏好并不穩(wěn)定,僅代表該用戶的激情偏好,而不能代表整個(gè)預(yù)設(shè)時(shí)期的偏好,因此也應(yīng)當(dāng)在分析用戶偏好時(shí)予以剔除。與用戶偏好的突發(fā)特性相對(duì)應(yīng)的是用戶偏好的持續(xù)特性,即在一個(gè)時(shí)段內(nèi)用戶的偏好集中在某幾個(gè)內(nèi)容信息上,在另一個(gè)時(shí)段內(nèi)用戶偏好仍然集中在該幾個(gè)內(nèi)容信息上,這種情形說明該用戶的偏好較為穩(wěn)定,這些用戶行為數(shù)據(jù)則能較好地反映用戶偏好,根據(jù)此類用戶偏好進(jìn)行的內(nèi)容信息推薦有極大的可能符合該用戶的需求,進(jìn)而提高交易成功率。由此,本申請(qǐng)給出了又一個(gè)實(shí)施例,該實(shí)施例中增加將上述突 發(fā)性、遷移性用戶偏好過濾掉、保留下持續(xù)性用戶偏好。本實(shí)施例除將實(shí)施例一的步驟S103變化為下述內(nèi)容外,其他步驟相同。參見附圖4,本實(shí)施例給出的分析得到用戶偏好數(shù)據(jù)的步驟包括步驟A :根據(jù)用戶行為發(fā)生的時(shí)間將處理后的用戶行為類型和用戶行為頻率在預(yù)設(shè)時(shí)期內(nèi)分成至少兩個(gè)等長(zhǎng)時(shí)段單元;預(yù)設(shè)時(shí)期選取的時(shí)段長(zhǎng)度越短,用戶偏好的細(xì)微程度越大,通過比較不同時(shí)段的用戶偏好曲線,即可得到突發(fā)性用戶偏好和遷移性偏好;將預(yù)設(shè)時(shí)期T劃分成至少兩個(gè)等長(zhǎng)時(shí)段單元,根據(jù)實(shí)際的需要可選擇兩個(gè)或多個(gè)時(shí)段單元,時(shí)段單元越多,得到的用戶偏好變化情,也越細(xì)微,這里為方便起見,以兩個(gè)時(shí)段單元為例T1、T2,Τ1+Τ2 = T0步驟B:根據(jù)各時(shí)段單元內(nèi)的用戶行為類型和用戶行為頻率分析用戶行為指向的內(nèi)容信息,得到該時(shí)段單元的用戶偏好數(shù)據(jù);劃分時(shí)段單元后,分別分析Tl、Τ2時(shí)段單元的用戶行為類型和用戶行為頻率分析用戶行為指向的內(nèi)容信息,分析過程可以采取繪制曲線的方式進(jìn)行以用戶內(nèi)容信息為橫軸、用戶內(nèi)容信息出現(xiàn)的頻率為縱軸。步驟C :將各時(shí)段單元的用戶偏好數(shù)據(jù)進(jìn)行比對(duì)以濾除遷移性用戶偏好數(shù)據(jù)對(duì)中的遷遷移起點(diǎn)數(shù)據(jù)和/或突發(fā)性用戶偏好數(shù)據(jù),得到整個(gè)預(yù)設(shè)時(shí)期的用戶偏好數(shù)據(jù);得到Tl、Τ2這兩個(gè)時(shí)段的用戶偏好曲線圖后,將兩個(gè)曲線圖進(jìn)行比對(duì)分析,將兩個(gè)時(shí)段中均具有的內(nèi)容信息作為持續(xù)性偏好數(shù)據(jù)予以保留,將僅在前一個(gè)時(shí)段單元中出現(xiàn)的內(nèi)容信息作為遷移性用戶偏好的遷移起點(diǎn)予以濾除,將僅在后一個(gè)時(shí)段單元中出現(xiàn)的內(nèi)容信息作為遷移性用戶偏好的遷移終點(diǎn)予以保留,將在任何一個(gè)時(shí)段單元中出現(xiàn)的突發(fā)性用戶偏好數(shù)據(jù)予以濾除,進(jìn)而得到整個(gè)預(yù)設(shè)時(shí)段T的用戶偏好數(shù)據(jù)。本實(shí)施例通過將預(yù)設(shè)時(shí)期進(jìn)行細(xì)分,然后比對(duì)細(xì)分后的每個(gè)時(shí)段單元的用戶偏好數(shù)據(jù)的變化,濾除了遷移性、突發(fā)性用戶偏好數(shù)據(jù)。這樣得到的用戶偏好更為準(zhǔn)確地反映用戶在整個(gè)預(yù)設(shè)時(shí)期內(nèi)的用戶偏好,進(jìn)而在此用戶偏好數(shù)據(jù)基礎(chǔ)上進(jìn)行的信息內(nèi)容推薦的推薦效果更好。實(shí)施例五上述實(shí)施例為得到較為準(zhǔn)確的用戶行為數(shù)據(jù),進(jìn)行了一系列的優(yōu)化操作,濾除了用戶行為中的“偽數(shù)據(jù)”,為分析得到準(zhǔn)確的用戶偏好奠定了較好的基礎(chǔ)。但是,對(duì)于用戶行為指向的內(nèi)容信息是否準(zhǔn)確還待研究,因?yàn)榉治鲇脩羝玫穆淠_點(diǎn)是內(nèi)容信息,而這些內(nèi)容信息由電子商務(wù)信息賣家提供,賣家為爭(zhēng)奪市場(chǎng)利益、搶占用戶,也會(huì)惡意地在內(nèi)容信息上制造“偽數(shù)據(jù)”,比如,當(dāng)內(nèi)容信息包含產(chǎn)品價(jià)格信息時(shí),賣家可能惡意標(biāo)定低價(jià)以打擊對(duì)手,或者在壟斷情況下隨意標(biāo)定高價(jià)以攫取更多利潤,這些行為擾亂了電子商務(wù)信息交易市場(chǎng),基于這些“偽”的內(nèi)容信息進(jìn)行用戶偏好分析得到的結(jié)果可能大為“失真”。為此,有必要對(duì)內(nèi)容信息進(jìn)行“打假”。在實(shí)施例一的基礎(chǔ)上增加上述處理步驟后的方法可構(gòu)成本申請(qǐng)的又一個(gè)實(shí)施例,參見附圖5本實(shí)施例與實(shí)施例一除在步驟S102、S103之間添加下述內(nèi)容外,其他步驟相同。本實(shí)施例給出的排除上述“偽數(shù)據(jù)”的方法包括
判斷產(chǎn)品標(biāo)定價(jià)格是否在預(yù)設(shè)價(jià)格范圍內(nèi),如果否,則將產(chǎn)品價(jià)格設(shè)置在預(yù)設(shè)價(jià)格范圍內(nèi);和/或,判斷產(chǎn)品的所屬行業(yè)與提供該產(chǎn)品的供應(yīng)商的注冊(cè)行業(yè)是否一致,如果否,則將該產(chǎn)品信息濾除。經(jīng)過本實(shí)施例對(duì)內(nèi)容信息的優(yōu)化后,進(jìn)行用戶偏好分析的數(shù)據(jù)源更加準(zhǔn)確,有利于得到更加有效的用戶偏好數(shù)據(jù)。實(shí)施例六上述幾個(gè)實(shí)施例所述的方法在得到用戶的偏好數(shù)據(jù)后,信息推薦步驟的具體實(shí)現(xiàn)方法可以采用現(xiàn)有技術(shù)。現(xiàn)有技術(shù)通常是將內(nèi)容信息獨(dú)立和分別地進(jìn)行推薦,這種推薦效果并不好。為此,本申請(qǐng)的實(shí)施例提供了一種協(xié)同推薦的方法,該方法通過對(duì)大量的用戶內(nèi)容信息分析得到內(nèi)容信息的群體偏好數(shù)據(jù),然后根據(jù)用戶偏好數(shù)據(jù)和群體偏好數(shù)據(jù)進(jìn)行內(nèi)容信息推薦。本實(shí)施例除將實(shí)施例一的步驟S104變換為下述內(nèi)容外,其他步驟相同。參見附圖6,本實(shí)施例給出的內(nèi)容信息推薦的步驟包括步驟A’ 選取預(yù)設(shè)數(shù)量的其他用戶組成參考用戶集,計(jì)算所述用戶與參考用戶集內(nèi)各用戶的相似度,將相似度超過預(yù)設(shè)相似度閥值的用戶組成相似用戶集;根據(jù)用戶的歷史行為分析得到用戶偏好,進(jìn)而依據(jù)該用戶偏好向用戶推薦內(nèi)容信息,固然迎合了用戶的求購愿望,實(shí)現(xiàn)了提高交易成功率的目的,但是,實(shí)際上每個(gè)用戶的用戶偏好都不會(huì)局限在以往的用戶偏好上,他的偏好是不斷擴(kuò)展變化的,而這種擴(kuò)展變化往往受限于他自身的能力和獲得信息的渠道,導(dǎo)致不能得到較好的擴(kuò)展,此種情況下,與該用戶具有相似或相同用戶偏好的其他用戶的用戶偏好數(shù)據(jù)則值得借鑒,因?yàn)榭梢酝浦麄兂哂猩鲜鱿嗤挠脩羝猛?,還可能在其他方面也具有相同的偏好;基于這種分析,則需要選擇一定數(shù)量的用戶組成參考用戶集,計(jì)算參考用戶集中的用戶與該用戶的相似度,對(duì)相似度超過預(yù)設(shè)閥值的用戶則構(gòu)成該用戶的相似用戶集,相似用戶集內(nèi)的用戶的偏好數(shù)據(jù)對(duì)該用戶具有較高參考價(jià)值;需要說明的是計(jì)算用戶之間的相似度可以采用多種方法,比如聚類算法,該方法在現(xiàn)有技術(shù)中已有大量應(yīng)用,此處不再贅述。步驟B’ 分析相似用戶集內(nèi)各用戶的用戶行為得到該相似用戶集的群體偏好數(shù)據(jù),所述群體偏好數(shù)據(jù)為用戶行為指向的內(nèi)容信息的頻率分布;通過步驟A’獲得相似用戶集后,分析相似用戶集的各用戶的用戶行為得到群體偏好數(shù)據(jù),具體的分析方法和前述實(shí)施例的方式相同,群體偏好數(shù)據(jù)是與單個(gè)用戶的用戶偏好數(shù)據(jù)“同質(zhì)”的概念,只是數(shù)據(jù)量的不同在數(shù)據(jù)結(jié)果上存在差異,均表示用戶行為指向的內(nèi)容信息的頻率分布情況。步驟C’ 根據(jù)用戶偏好數(shù)據(jù)和所述群體偏好數(shù)據(jù)向用戶推薦內(nèi)容信息。本實(shí)施例通過計(jì)算相似度,找出與該用戶具有相似特征的其他用戶,并將其他用戶的用戶行為數(shù)據(jù)作為對(duì)該用戶進(jìn)行內(nèi)容信息推薦的參考,較好地?cái)U(kuò)展了向用戶推薦的內(nèi)容信息,增強(qiáng)了用戶體驗(yàn),進(jìn)一步拓寬了電子商務(wù)信息交易的領(lǐng)域和范圍。本實(shí)施例在計(jì)算得到用戶的相似用戶集時(shí),對(duì)“其他用戶”的選取并沒有作特別限定,實(shí)際上,由于地理環(huán)境的差異、各地風(fēng)土人情的不同,同一個(gè)地域范圍內(nèi)用戶的用戶偏好數(shù)據(jù)可能更具有參考價(jià)值,因此,本實(shí)施例優(yōu)選按照下面的方式選擇參考用戶集。判斷所述用戶IP地址對(duì)應(yīng)的地域與該用戶注冊(cè)的地域是否一致,如果是,則選取所述用戶注冊(cè)地域地的其他用戶組成參考用戶集;如果否,則選取所述用戶IP地址對(duì)應(yīng)的地域地的其他用戶組成參考用戶集。通過以用戶登錄地的用戶數(shù)據(jù)作為分析群體偏好的基礎(chǔ),不僅由于同一地域的用戶行為數(shù)據(jù)相比其他地方的用戶行為數(shù)據(jù)的可參考性更大,使得分析得到的用戶偏好結(jié)果更準(zhǔn)確,據(jù)此進(jìn)行推薦的推薦效果更好,極大提高了電子商務(wù)信息的交易成功率,而且由于采用就近原則,極大方便了用戶在電子商務(wù)信息交易完成后盡快獲得相應(yīng)的產(chǎn)品或服務(wù)。實(shí)施例七在實(shí)施例六中已經(jīng)提到得到用戶的偏好數(shù)據(jù)后,信息推薦步驟的具體實(shí)現(xiàn)方法可以采用現(xiàn)有技術(shù),也可以采用實(shí)施例六所述的協(xié)同推薦方法,協(xié)同推薦方法將待推薦用戶的自身偏好數(shù)據(jù)與一定范圍內(nèi)的群體偏好數(shù)據(jù)結(jié)合起來,擴(kuò)展了向待推薦用戶推薦的內(nèi)容信息,這是一種“橫向”擴(kuò)展,實(shí)際上,除橫向擴(kuò)展方式,本申請(qǐng)還提供一種縱向擴(kuò)展方式的實(shí)施例,即將用戶偏好數(shù)據(jù)中的多個(gè)用戶偏好與預(yù)設(shè)規(guī)則集進(jìn)行匹配,將匹配成功的某個(gè)或某些偏好作為向用戶推薦內(nèi)容信息的依據(jù),這種方法稱為聯(lián)合推薦方法。本實(shí)施例除將實(shí)施例一的步驟S104變換為下述內(nèi)容外,其他步驟相同。參見附圖7,本實(shí)施例給出的內(nèi)容信息推薦的步驟包括步驟A":選取預(yù)設(shè)數(shù)量的用戶組成規(guī)則創(chuàng)建用戶集,分析所述規(guī)則創(chuàng)建用戶集內(nèi)各用戶的用戶行為得到各用戶的用戶偏好數(shù)據(jù),根據(jù)各用戶的用戶偏好數(shù)據(jù)訓(xùn)練得到規(guī)則集,所述規(guī)則集為所述規(guī)則集為用以預(yù)測(cè)內(nèi)容信息推薦的各類用戶偏好的組合規(guī)則集;通過分析用戶的歷史行為得到的用戶偏好數(shù)據(jù),大多數(shù)情況下這種用戶偏好是復(fù)合偏好,也就是說該用戶偏好數(shù)據(jù)中包含了該用戶在各個(gè)層面、各個(gè)領(lǐng)域、各的時(shí)段的多個(gè)偏好,比如產(chǎn)品偏好、供應(yīng)商偏好、產(chǎn)品詞偏好等,向用戶進(jìn)行內(nèi)容信息推薦時(shí)盡管可以按照這些所有的偏好向用戶推薦,但是,這種“廣撒網(wǎng)”的方式在某些情況下并不能達(dá)到提高交易成功率的目的,反而容易導(dǎo)致用戶在眾多的內(nèi)容信息中無所選擇,因此,采用少而精、高命中率的方式向用戶推薦內(nèi)容信息將是一種可取的方式;為了從用戶的眾多偏好中找出“有效”的用戶偏好,需要首先選取一定數(shù)量的用戶組成規(guī)則創(chuàng)建用戶集并根據(jù)這些用戶的用戶偏好建立規(guī)則集,進(jìn)而利用該規(guī)則集作為選取用戶偏好的依據(jù);規(guī)則創(chuàng)建用戶集內(nèi)的各用戶偏好數(shù)據(jù)的獲取可以采用現(xiàn)有技術(shù)的方式得到,也可以按照本申請(qǐng)所提到方法對(duì)用戶行為數(shù)據(jù)優(yōu)化后分析得到;得到各用戶的用戶偏好數(shù)據(jù)后,將用戶的各個(gè)偏好與該偏好對(duì)應(yīng)的頻率組成該用戶的矢量特征組,然后對(duì)所有的矢量特征組進(jìn)行訓(xùn)練得到規(guī)則集,具體的訓(xùn)練方式現(xiàn)有技術(shù)已公開,這里不再贅述。步驟B":將待推薦用戶的用戶偏好數(shù)據(jù)與所述規(guī)則集進(jìn)行匹配,根據(jù)匹配成功的偏好數(shù)據(jù)向待推薦用戶推薦內(nèi)容信息。獲得到規(guī)則集后,將待推薦用戶的用戶偏好與規(guī)則集中的規(guī)則進(jìn)行匹配,如果匹配成功則將根據(jù)相應(yīng)的用戶偏好向該用戶推薦內(nèi)容信息。為了更加清楚的說明上述過程,這里舉例闡釋假設(shè)選取的規(guī)則創(chuàng)建用戶集為100個(gè),每個(gè)用戶的偏好包括產(chǎn)品、供應(yīng)商、產(chǎn)品詞、求購、資訊等五個(gè)偏好,通過分析100個(gè)用戶的歷史行為數(shù)據(jù)得到了各個(gè)用戶的偏好數(shù)據(jù),偏好數(shù)據(jù)包括內(nèi)容信息和該內(nèi)容信息的頻率,為了便于比較將頻率進(jìn)行歸一化處理,該歸一化的基準(zhǔn)可以是10次;通過按照現(xiàn)有技術(shù)的方法訓(xùn)練100個(gè)用戶的用戶偏好數(shù)據(jù)得到三條規(guī)則,現(xiàn)在需要向Al、B2、C3三個(gè)用戶進(jìn)行推薦,推薦時(shí)將Al的用戶偏好數(shù)據(jù)與規(guī)則集內(nèi)的規(guī)則進(jìn)行匹配,然后按照匹配成功的用戶偏好推薦內(nèi)容信息。上述過程請(qǐng)參見如下表格
權(quán)利要求
1.一種基于用戶行為的電子商務(wù)信息推薦方法,其特征在于,該方法包括統(tǒng)計(jì)預(yù)設(shè)時(shí)期內(nèi)的用戶行為類型和各行為類型對(duì)應(yīng)的用戶行為的頻率;判斷用戶行為類型數(shù)是否超過預(yù)設(shè)類型閥值,如果是,則保留小于等于預(yù)設(shè)類型閥值數(shù)的用戶行為類型;和/或,判斷各用戶行為的頻率是否超過預(yù)設(shè)頻率閥值,如果是,則將預(yù)設(shè)頻率閥值作為該用戶行為的頻率;根據(jù)上述處理后的用戶行為類型和用戶行為的頻率分析用戶行為指向的內(nèi)容信息,得到用戶偏好數(shù)據(jù),所述用戶偏好數(shù)據(jù)為各內(nèi)容信息的頻率分布;利用所述用戶偏好數(shù)據(jù)向用戶推薦內(nèi)容信息。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,在分析用戶行為指向的內(nèi)容信息前,所述方法還包括對(duì)用戶行為進(jìn)行時(shí)間影響消除處理,該處理步驟包括對(duì)用戶行為賦予時(shí)間權(quán)重值,所述時(shí)間權(quán)重值為越靠近預(yù)設(shè)時(shí)期結(jié)束時(shí)刻權(quán)重值越高,越靠近預(yù)設(shè)時(shí)期的起始時(shí)刻權(quán)重值越低。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述時(shí)間權(quán)重值按照下述公式得到時(shí)間權(quán)重值=1/log (Doff)式中Dtjff為用戶行為發(fā)生時(shí)刻到預(yù)設(shè)時(shí)期結(jié)束時(shí)刻的時(shí)間差。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,在分析用戶行為指向的內(nèi)容信息前,所述方法還包括對(duì)內(nèi)容信息進(jìn)行標(biāo)準(zhǔn)化處理,該處理步驟包括根據(jù)標(biāo)準(zhǔn)產(chǎn)品單元和行業(yè)知識(shí)庫校正內(nèi)容信息。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述分析用戶行為指向的內(nèi)容信息得到用戶偏好數(shù)據(jù)的步驟包括根據(jù)用戶行為的發(fā)生時(shí)間將處理后的用戶行為類型和用戶行為的頻率在預(yù)設(shè)時(shí)期內(nèi)分成至少兩個(gè)時(shí)段單元;根據(jù)各時(shí)段單元內(nèi)的用戶行為類型和用戶行為的頻率分析用戶行為指向的內(nèi)容信息,得到該時(shí)段單元的用戶偏好數(shù)據(jù);根據(jù)各時(shí)段單元的用戶偏好數(shù)據(jù)過濾掉遷移性、突發(fā)性偏好數(shù)據(jù)以得到整個(gè)預(yù)設(shè)時(shí)期的用戶偏好數(shù)據(jù)。
6.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述內(nèi)容信息包括產(chǎn)品信息時(shí),則所述分析用戶行為指向的內(nèi)容信息得到用戶偏好數(shù)據(jù)的步驟包括判斷產(chǎn)品標(biāo)定價(jià)格是否在預(yù)設(shè)價(jià)格范圍內(nèi),如果否,則將產(chǎn)品價(jià)格設(shè)置在預(yù)設(shè)價(jià)格范圍內(nèi);和/或,判斷產(chǎn)品的所屬行業(yè)與提供該產(chǎn)品的供應(yīng)商的注冊(cè)行業(yè)是否一致,如果否,則將該產(chǎn)品信息濾除。
7.根據(jù)權(quán)利要求I所述的方法,其特征在于,利用用戶偏好數(shù)據(jù)向用戶推薦內(nèi)容信息包括選取預(yù)設(shè)數(shù)量的其他用戶組成參考用戶集,計(jì)算待推薦用戶與參考用戶集內(nèi)各用戶的相似度,將相似度超過預(yù)設(shè)相似度閥值的用戶組成相似用戶集;分析相似用戶集內(nèi)各用戶的用戶行為得到該相似用戶集的群體偏好數(shù)據(jù),所述群體偏好數(shù)據(jù)為用戶行為指向的內(nèi)容信息的頻率分布;根據(jù)待推薦用戶的用戶偏好數(shù)據(jù)和所述群體偏好數(shù)據(jù)向待推薦用戶推薦內(nèi)容信息。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述選取預(yù)設(shè)數(shù)量的其他用戶組成參考用戶集包括判斷待推薦用戶的IP地址對(duì)應(yīng)的地域與該用戶注冊(cè)的地域是否一致,如果是,則選取待推薦用戶注冊(cè)地域地的其他用戶組成參考用戶集;如果否,則選取待推薦用戶的IP地址對(duì)應(yīng)的地域地的其他用戶組成參考用戶集。
9.根據(jù)權(quán)利要求I所述的方法,其特征在于,利用用戶偏好數(shù)據(jù)向用戶推薦內(nèi)容信息包括選取預(yù)設(shè)數(shù)量的用戶組成規(guī)則創(chuàng)建用戶集,分析所述規(guī)則創(chuàng)建用戶集內(nèi)各用戶的用戶行為得到各用戶的用戶偏好數(shù)據(jù),根據(jù)各用戶的用戶偏好數(shù)據(jù)訓(xùn)練得到規(guī)則集,所述規(guī)則集為用以預(yù)測(cè)內(nèi)容信息推薦的各類用戶偏好的組合規(guī)則集;將待推薦用戶的用戶偏好數(shù)據(jù)與所述規(guī)則集進(jìn)行匹配,根據(jù)匹配成功的偏好數(shù)據(jù)向待推薦用戶推薦內(nèi)容信息。
10.根據(jù)權(quán)利要求I所述的方法,其特征在于,當(dāng)用戶行為類型數(shù)超過預(yù)設(shè)類型閥值時(shí),保留的用戶行為類型包括頻率小于等于預(yù)設(shè)頻率閥值的用戶行為對(duì)應(yīng)的用戶行為類型。
11.一種基于用戶行為的電子商務(wù)信息推薦裝置,其特征在于,該裝置包括統(tǒng)計(jì)模塊、判斷模塊、偏好分析模塊和信息推薦模塊,其中所述統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)預(yù)設(shè)時(shí)期內(nèi)的用戶行為類型和各行為類型對(duì)應(yīng)的用戶行為的頻率;所述判斷模塊,用于判斷用戶行為類型數(shù)是否超過預(yù)設(shè)類型閥值,如果是,則保留小于等于預(yù)設(shè)類型閥值數(shù)的用戶行為類型;和/或,判斷各用戶行為的頻率是否超過預(yù)設(shè)頻率閥值,如果是,則將預(yù)設(shè)頻率閥值作為該用戶行為的頻率;所述偏好分析模塊,用于根據(jù)上述處理后的用戶行為類型和用戶行為的頻率分析用戶行為指向的內(nèi)容信息,得到用戶偏好數(shù)據(jù),所述用戶偏好數(shù)據(jù)為各內(nèi)容信息的頻率分布;所述信息推薦模塊,用于利用用戶偏好數(shù)據(jù)向用戶推薦內(nèi)容信息。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還包括時(shí)間影響消除模塊,用于在分析用戶行為指向的內(nèi)容信息前,對(duì)用戶行為賦予時(shí)間權(quán)重值,所述時(shí)間權(quán)重值為越靠近預(yù)設(shè)時(shí)期結(jié)束時(shí)刻權(quán)重值越高,越靠近預(yù)設(shè)時(shí)期起始時(shí)刻權(quán)重值越低。
13.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述偏好分析模塊包括時(shí)段單兀劃分子模塊、偏好分析子模塊和過濾子模塊,其中所述時(shí)段單元?jiǎng)澐肿幽K,用于根據(jù)用戶行為的發(fā)生時(shí)間將處理后的用戶行為類型和用戶行為的頻率在預(yù)設(shè)時(shí)期內(nèi)劃分成至少兩個(gè)時(shí)段單元;所述偏好分析子模塊,用于根據(jù)各時(shí)段單元內(nèi)的用戶行為類型和用戶行為的頻率分析用戶行為指向的內(nèi)容信息,得到該時(shí)段單元的用戶偏好數(shù)據(jù);所述過濾子模塊,用于根據(jù)各時(shí)段單元的用戶偏好數(shù)據(jù)過濾掉遷移性、突發(fā)性偏好數(shù)據(jù)以得到整個(gè)預(yù)設(shè)時(shí)期的用戶偏好數(shù)據(jù)。
14.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還包括相似度計(jì)算模塊,用于在選取預(yù)設(shè)數(shù)量的其他用戶組成參考用戶集后,計(jì)算待推薦用戶與參考用戶集內(nèi)各用戶的相似度,將相似度超過預(yù)設(shè)相似度閥值的用戶組成相似用戶集;則所述偏好分析模塊還用于分析相似用戶集內(nèi)各用戶的用戶行為得到該相似用戶集的群體偏好數(shù)據(jù),所述群體偏好數(shù)據(jù)為用戶行為指向的內(nèi)容信息的頻率分布;所述信息推薦模塊,還用于根據(jù)待推薦用戶的用戶偏好數(shù)據(jù)和所述群體偏好數(shù)據(jù)向待推薦用戶推薦內(nèi)容信息。
15.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還包括規(guī)則集創(chuàng)建模塊,用于在選取預(yù)設(shè)數(shù)量的用戶組成規(guī)則創(chuàng)建用戶集,調(diào)用偏好分析模塊分析所述規(guī)則創(chuàng)建用戶集內(nèi)各用戶的用戶行為得到各用戶的用戶偏好數(shù)據(jù),根據(jù)各用戶的用戶偏好數(shù)據(jù)訓(xùn)練得到規(guī)則集,所述規(guī)則集為用以預(yù)測(cè)內(nèi)容信息推薦的各類用戶偏好的組合規(guī)則集,則所述偏好分析模塊還用于分析規(guī)則創(chuàng)建用戶集內(nèi)各用戶的用戶行為得到各用戶的用戶偏好數(shù)據(jù);所述信息推薦模塊,還用于將待推薦用戶的用戶偏好數(shù)據(jù)與所述規(guī)則集進(jìn)行匹配,根
全文摘要
本發(fā)明提供了一種基于用戶行為的電子商務(wù)信息推薦方法。該方法包括統(tǒng)計(jì)預(yù)設(shè)時(shí)期內(nèi)用戶行為類型和各行為類型對(duì)應(yīng)的用戶行為的頻率;判斷用戶行為類型數(shù)和用戶行為的頻率是否超過預(yù)設(shè)閥值,如果是,則將超過的數(shù)據(jù)過濾掉;根據(jù)上述處理后的用戶行為類型和用戶行為的頻率分析用戶行為指向的內(nèi)容信息,得到用戶偏好數(shù)據(jù),所述用戶偏好數(shù)據(jù)為各內(nèi)容信息的頻率分布;根據(jù)所述用戶偏好數(shù)據(jù)進(jìn)行內(nèi)容信息推薦。本發(fā)明還提供了一種基于用戶行為的電子商務(wù)信息推薦裝置。本發(fā)明對(duì)用戶行為數(shù)據(jù)進(jìn)行優(yōu)化,剔除了可能存在的“偽數(shù)據(jù)”,使得在該數(shù)據(jù)基礎(chǔ)上分析得到的用戶偏好更加準(zhǔn)確真實(shí),處理速度得以提高,推薦效果更好。
文檔編號(hào)G06Q30/02GK102956009SQ20111023526
公開日2013年3月6日 申請(qǐng)日期2011年8月16日 優(yōu)先權(quán)日2011年8月16日
發(fā)明者顧湘余, 傅其樂, 祖仲林, 寧偉 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司