混合推薦系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明的各實(shí)施方式總體上涉及一種混合推薦系統(tǒng)。具體地,混合推薦系統(tǒng)使用離線(xiàn)測(cè)試和在線(xiàn)測(cè)試來(lái)生成并優(yōu)化推薦函數(shù)。該些函數(shù)生成可以被在線(xiàn)展現(xiàn)用于產(chǎn)品購(gòu)買(mǎi)的推薦。索引從該些推薦中創(chuàng)建。查找可以在該些索引上執(zhí)行,來(lái)為特定的用戶(hù)選擇推薦。所選擇的推薦可以在向用戶(hù)展現(xiàn)之前被過(guò)濾。
【專(zhuān)利說(shuō)明】混合推薦系統(tǒng)
【背景技術(shù)】
[0001]在線(xiàn)購(gòu)物和在線(xiàn)購(gòu)買(mǎi)歷年來(lái)顯著地增加。在線(xiàn)零售商之間的競(jìng)爭(zhēng)已經(jīng)變得激烈,并且這些在線(xiàn)零售商嘗試提供最好的用戶(hù)體驗(yàn),并且還嘗試實(shí)施技術(shù)來(lái)增加銷(xiāo)量。一個(gè)這樣的技術(shù)是通過(guò)推薦。對(duì)于在線(xiàn)零售商向?yàn)g覽特定產(chǎn)品的網(wǎng)頁(yè)的用戶(hù)提供推薦并不罕見(jiàn)。通常,該推薦將由其他用戶(hù)購(gòu)買(mǎi)的其他產(chǎn)品與用戶(hù)當(dāng)前正在瀏覽的產(chǎn)品一起標(biāo)識(shí)。然而,在許多情況中,推薦是過(guò)時(shí)的或者重復(fù)的或者不是零售商進(jìn)一步明確的目標(biāo)。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0002]在下面的描述中參考以下附圖詳細(xì)描述各實(shí)施方式。這些附圖圖示了各實(shí)施方式的示例。
[0003]圖1圖示了混合推薦系統(tǒng)。
[0004]圖2圖示了推薦引擎。
[0005]圖3圖示了可以用于本文所述方法和系統(tǒng)的計(jì)算機(jī)系統(tǒng)。
[0006]圖4圖示了可以由混合推薦系統(tǒng)執(zhí)行的方法。
[0007]圖5圖示了為了確定推薦函數(shù)需要考慮的因素的示例。
[0008]圖6圖示了用于確定推薦的詳細(xì)步驟和因素的示例。
[0009]圖7圖示了用于選擇推薦的過(guò)程的概要的示例。
[0010]圖8圖示了針對(duì)優(yōu)惠券的特定使用情形的示例。
[0011]圖9圖示了用于提供實(shí)時(shí)推薦和在選擇推薦時(shí)可以被考慮的因素的示例。
【具體實(shí)施方式】
[0012]為了簡(jiǎn)單和說(shuō)明的目的,本發(fā)明的各實(shí)施方式主要參考示例進(jìn)行描述。此外,許多特定的細(xì)節(jié)被陳述以便于提供對(duì)各實(shí)施方式的全面理解。然而,本領(lǐng)域技術(shù)人員容易理解各實(shí)施方式可以不限制于一個(gè)或多個(gè)這些特定細(xì)節(jié)而被實(shí)施。在一些情況中,眾所周知的方法和結(jié)構(gòu)沒(méi)有被詳細(xì)描述,從而不會(huì)不必要地使各實(shí)施方式的描述主題不明。
[0013]根據(jù)一個(gè)實(shí)施方式,混合推薦系統(tǒng)基于離線(xiàn)和在線(xiàn)測(cè)試確定用于產(chǎn)品購(gòu)買(mǎi)的推薦。離線(xiàn)測(cè)試分析和調(diào)節(jié)多個(gè)推薦函數(shù),并且在線(xiàn)測(cè)試可以用于驗(yàn)證或者進(jìn)一步調(diào)節(jié)推薦函數(shù),從而最大化一個(gè)或多個(gè)性能指標(biāo)。這些推薦函數(shù)可以用于創(chuàng)建推薦索引,該推薦索引代表針對(duì)不同產(chǎn)品和用戶(hù)的推薦。該索引繼而用于在實(shí)時(shí)環(huán)境中確定向正在瀏覽產(chǎn)品頁(yè)面的用戶(hù)提供的候選推薦。因此,該索引可以被生成以改進(jìn)響應(yīng)時(shí)間的技術(shù)問(wèn)題。此外,自動(dòng)函數(shù)調(diào)節(jié)是對(duì)數(shù)據(jù)稀缺問(wèn)題的技術(shù)方案,數(shù)據(jù)稀缺問(wèn)題是指缺乏數(shù)據(jù)來(lái)生成用于推薦函數(shù)的模型的問(wèn)題。不同的所推薦的函數(shù)可以被測(cè)試和調(diào)節(jié),以找到針對(duì)推薦函數(shù)的精度和模型復(fù)雜度之間的平衡。此外,當(dāng)存在數(shù)據(jù)稀缺時(shí),種類(lèi)層次(category-level)關(guān)系可以用于確定和調(diào)節(jié)推薦函數(shù)。此外,評(píng)分函數(shù)可以被應(yīng)用以選擇向用戶(hù)顯示的候選推薦。
[0014]根據(jù)一個(gè)實(shí)施方式,圖1公開(kāi)了混合推薦系統(tǒng)100。系統(tǒng)100包括混合推薦核110和推薦提供器子系統(tǒng)120。混合推薦核110生成推薦的推薦索引,并且推薦提供器子系統(tǒng)120從索引中確定向用戶(hù)提供的推薦。
[0015]混合推薦核110包括離線(xiàn)測(cè)試模塊111、在線(xiàn)測(cè)試模塊112、推薦函數(shù)優(yōu)化器113以及推薦引擎115。推薦函數(shù)102可以由用戶(hù)或者另一系統(tǒng)向系統(tǒng)100輸入。推薦函數(shù)是用于基于一個(gè)或多個(gè)參數(shù)確定推薦的函數(shù)。推薦函數(shù)102可以包括統(tǒng)計(jì)模型、評(píng)論、可調(diào)節(jié)參數(shù)、測(cè)試計(jì)劃、增強(qiáng)步驟、可應(yīng)用推薦場(chǎng)景、不同場(chǎng)景所需的變化等中的至少一個(gè)。不同的函數(shù)可以被測(cè)試,并且其參數(shù)周期地被調(diào)節(jié)以?xún)?yōu)化推薦函數(shù)。推薦函數(shù)102可以標(biāo)識(shí)購(gòu)買(mǎi)模式,標(biāo)識(shí)一起購(gòu)買(mǎi)的同等產(chǎn)品或者成對(duì)產(chǎn)品,分析包裹(bundles),考慮合并來(lái)自不同的購(gòu)買(mǎi)和時(shí)間段的籃等等?;@可以是在線(xiàn)購(gòu)物車(chē),在進(jìn)行交易來(lái)購(gòu)買(mǎi)產(chǎn)品之前,用戶(hù)選擇要購(gòu)買(mǎi)的產(chǎn)品被置于在線(xiàn)購(gòu)物車(chē)中。
[0016]離線(xiàn)測(cè)試模塊111仿真在測(cè)試數(shù)據(jù)集上提供推薦的結(jié)果,以基于一個(gè)或多個(gè)性能指標(biāo)測(cè)量推薦函數(shù)的有效性。在一個(gè)示例中,性能指標(biāo)包括查全率(例如,消費(fèi)者籃中的物品匹配我們的推薦的比率)和查準(zhǔn)率(例如,證明是成功(例如,使得購(gòu)買(mǎi)所推薦的產(chǎn)品)的推薦的百分比),但是其他的性能指標(biāo)也可以被使用。用于示例的物品或產(chǎn)品物品是適于購(gòu)買(mǎi)的產(chǎn)品。產(chǎn)品可以是商品或服務(wù)。在一個(gè)實(shí)施方式中,來(lái)自數(shù)據(jù)101的數(shù)據(jù)包括歷史購(gòu)買(mǎi)數(shù)據(jù)和用戶(hù)簡(jiǎn)檔。歷史購(gòu)買(mǎi)數(shù)據(jù)包括與在線(xiàn)銷(xiāo)售、離線(xiàn)銷(xiāo)售、交易、日期、瀏覽歷史等有關(guān)的任何數(shù)據(jù)。訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集可以從數(shù)據(jù)101生成。訓(xùn)練數(shù)據(jù)集可以用于創(chuàng)建推薦函數(shù)。例如,機(jī)器學(xué)習(xí)技術(shù)可以用于生成分類(lèi)器,所述分類(lèi)器標(biāo)識(shí)購(gòu)買(mǎi)模式并且確定用戶(hù)和其購(gòu)買(mǎi)模式之間的關(guān)系。這些關(guān)系可以用于從訓(xùn)練集生成推薦函數(shù)102。貝葉斯(Bayesian)網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、奇異值分解(SVD)、分類(lèi)器可以應(yīng)用于訓(xùn)練集以確定推薦函數(shù)。爬山算法或其他數(shù)學(xué)優(yōu)化技術(shù)可以用于優(yōu)化推薦函數(shù)102。
[0017]測(cè)試數(shù)據(jù)集用于測(cè)試由推薦函數(shù)102生成的推薦性能。例如,測(cè)試數(shù)據(jù)集被評(píng)估,以確定所推薦的產(chǎn)品的轉(zhuǎn)化數(shù)量,或者確定其他的性能指標(biāo)。推薦函數(shù)102可以包括被調(diào)節(jié)以嘗試改進(jìn)函數(shù)102的可調(diào)節(jié)參數(shù),并且它們?cè)诘^(guò)程中能夠被重新測(cè)試。
[0018]在線(xiàn)測(cè)試模塊112評(píng)估由在線(xiàn)測(cè)試系統(tǒng)104測(cè)試的推薦函數(shù)102的性能。在線(xiàn)測(cè)試系統(tǒng)104可以關(guān)于不同的用戶(hù)嘗試不同的推薦函數(shù)或推薦函數(shù)的不同變化,并且捕獲在線(xiàn)行為,包括交易。例如,在線(xiàn)測(cè)試系統(tǒng)104為了評(píng)定推薦引擎115的性能,通過(guò)將已經(jīng)向其提供了推薦的顧客組的表現(xiàn)與沒(méi)有給其推薦的對(duì)照組的表現(xiàn)進(jìn)行比較來(lái)執(zhí)行在線(xiàn)測(cè)試。推薦的效果能夠由離線(xiàn)測(cè)試模塊111在宏觀(guān)層次,通過(guò)比較性能指標(biāo),如每個(gè)顧客的平均籃大小、每個(gè)籃的平均銷(xiāo)量、以及每個(gè)顧客的平均銷(xiāo)量,而被評(píng)估。這些指標(biāo)也可以在更精細(xì)的層次被分析,例如在產(chǎn)品種類(lèi)層次,或者顧客群(customer segment)層次。備選地,推薦的有效性能夠在宏觀(guān)層次,通過(guò)將向顧客推薦的物品與最終放置在他們的購(gòu)物車(chē)中的物品匹配,或者通過(guò)針對(duì)那些物品的點(diǎn)通率(click-through rate)而被評(píng)定。性能指標(biāo)的其他示例以及評(píng)估推薦的關(guān)鍵性能指標(biāo)包括:基線(xiàn)分析指標(biāo),比如發(fā)生次數(shù)或訪(fǎng)問(wèn)次數(shù)是否超過(guò)閾值;針對(duì)每個(gè)所推薦物品的漏斗分析指標(biāo),比如點(diǎn)擊次數(shù)、物品添加到購(gòu)物車(chē)的次數(shù)、購(gòu)買(mǎi)的次數(shù);籃指標(biāo),比如包含所推薦物品的籃的百分比,由推薦驅(qū)動(dòng)的銷(xiāo)售百分比;顧客分析指標(biāo),比如重復(fù)訪(fǎng)問(wèn),顧客生命值;以及在運(yùn)行時(shí)的系統(tǒng)性能指標(biāo)。
[0019]推薦函數(shù)優(yōu)化器114可以基于性能指標(biāo)對(duì)推薦函數(shù)中的可調(diào)節(jié)參數(shù)建議調(diào)節(jié),并且可以允許用戶(hù)進(jìn)行調(diào)節(jié)。繼而,該函數(shù)能夠被重新測(cè)試。數(shù)據(jù)存儲(chǔ)116可以存儲(chǔ)推薦函數(shù)102、不同的數(shù)據(jù)集、性能指標(biāo)以及由核110使用的任何其他信息,以生成推薦索引。數(shù)據(jù)存儲(chǔ)116和數(shù)據(jù)存儲(chǔ)125可以是數(shù)據(jù)庫(kù)或其他類(lèi)型的存儲(chǔ)系統(tǒng)。
[0020]推薦引擎115基于優(yōu)化后的推薦函數(shù)生成推薦索引。推薦索引通過(guò)SKU或其他產(chǎn)品標(biāo)識(shí)符標(biāo)識(shí)一個(gè)或多個(gè)產(chǎn)品,該一個(gè)或多個(gè)產(chǎn)品針對(duì)用于在線(xiàn)銷(xiāo)售或離線(xiàn)銷(xiāo)售而提供的每個(gè)產(chǎn)品而將被推薦。這些索引存儲(chǔ)在例如數(shù)據(jù)存儲(chǔ)125中,并且由推薦提供器子系統(tǒng)120用于為用戶(hù)實(shí)時(shí)地提供推薦。存儲(chǔ)推薦索引的數(shù)據(jù)存儲(chǔ)125可以是低時(shí)延數(shù)據(jù)存儲(chǔ),低時(shí)延數(shù)據(jù)存儲(chǔ)向用戶(hù)提供推薦而不招致令人不滿(mǎn)意的延遲。數(shù)據(jù)存儲(chǔ)可以包括被應(yīng)用來(lái)進(jìn)行最終推薦選擇的附加過(guò)濾器或規(guī)則。推薦選擇模塊121,例如,通過(guò)執(zhí)行索引查找,選擇產(chǎn)品進(jìn)行推薦。動(dòng)態(tài)數(shù)據(jù)103可以標(biāo)識(shí)用戶(hù)當(dāng)前正在瀏覽的產(chǎn)品,以及其他用戶(hù)信息,因而查找能夠被執(zhí)行。過(guò)濾器模塊122應(yīng)用過(guò)濾器,比如確定產(chǎn)品是否無(wú)現(xiàn)貨或者是否符合零售商目標(biāo),來(lái)確定最終的產(chǎn)品推薦。用于確定和提供推薦的處理速度,通過(guò)使用關(guān)于推薦索引的查找、對(duì)后期處理推薦的最小計(jì)算量(過(guò)濾器)、快速附加、過(guò)濾器、以及推薦的排序表而被改進(jìn)。
[0021]接口服務(wù)層130可以作為對(duì)web瀏覽器140或應(yīng)用141的web服務(wù)而顯示提供的推薦。web服務(wù)可以包括用于通過(guò)因特網(wǎng)在兩個(gè)設(shè)備之間的通信的方法或協(xié)議。例如,接口服務(wù)層130可以提供與PHP (超文本預(yù)處理器,其是適于web開(kāi)發(fā)的開(kāi)源通用腳本語(yǔ)言)、JAVA、.NET等兼容的web服務(wù)。因此,推薦可以經(jīng)由網(wǎng)絡(luò)向用戶(hù)發(fā)送。
[0022]圖2示出了用于推薦引擎115的更詳細(xì)的框圖。推薦引擎115可以包括內(nèi)核201、顧客聚類(lèi)組件202、宏觀(guān)個(gè)性化組件203、微觀(guān)個(gè)性化組件204、時(shí)間效應(yīng)組件205、預(yù)測(cè)過(guò)濾組件206以及業(yè)務(wù)規(guī)則組件207。內(nèi)核201,例如基于由推薦引擎115的一個(gè)或多個(gè)組件實(shí)施的推薦函數(shù),生成標(biāo)識(shí)推薦產(chǎn)品的推薦索引。物品至物品、客戶(hù)至物品、以及其他的關(guān)聯(lián)由物品的購(gòu)買(mǎi)行為、顧客群的購(gòu)買(mǎi)行為以及特定用戶(hù)的購(gòu)買(mǎi)行為確定。查找可以關(guān)于索引而被執(zhí)行,以標(biāo)識(shí)一個(gè)或多個(gè)物品用以推薦。
[0023]圖2的左側(cè)示出由數(shù)據(jù)源提供的信息的示例。推薦引擎115,例如通過(guò)使用圖2中示出的組件處理若干數(shù)據(jù)源,確定用于用戶(hù)的目標(biāo)產(chǎn)品或服務(wù)推薦。數(shù)據(jù)源可以提供關(guān)于交易、顧客偏好、產(chǎn)品分類(lèi)(product taxonomy)、產(chǎn)品屬性、人口統(tǒng)計(jì)學(xué)等的信息。
[0024]例如,數(shù)據(jù)源可以提供與顧客人口統(tǒng)計(jì)學(xué)有關(guān)的信息,比如年齡、性別、位置等。顧客人口統(tǒng)計(jì)學(xué)以及其他數(shù)據(jù)(如用戶(hù)偏好)可以用于標(biāo)識(shí)顧客之間的相似度以進(jìn)行協(xié)同過(guò)濾。顧客人口統(tǒng)計(jì)學(xué)還能夠用于,通過(guò)應(yīng)用例如性別、年齡和婚姻狀況信息,對(duì)推薦后置過(guò)濾。
[0025]交易數(shù)據(jù)可以包括交易文件,交易文件除了其他信息外還包括物品被特定用戶(hù)購(gòu)買(mǎi)的時(shí)間、價(jià)格和數(shù)量。交易數(shù)據(jù)可以標(biāo)識(shí)顧客籃和追蹤屬于相同籃的物品。該類(lèi)型的信息可以用于通過(guò)分析籃來(lái)確定產(chǎn)品之間的隱藏關(guān)聯(lián),來(lái)生成“買(mǎi)這個(gè)的顧客也買(mǎi)了那個(gè)”類(lèi)型的推薦。從交易文件,每個(gè)用戶(hù)的交易歷史可以被標(biāo)識(shí),并且用作對(duì)解決了問(wèn)題“像您一樣的顧客也買(mǎi)了這個(gè)”的協(xié)同過(guò)濾技術(shù)的輸入。交易數(shù)據(jù)可以用于估計(jì)涉及顧客價(jià)值和顧客偏好的關(guān)鍵性能指示符的重要性。例如,從交易文件,一天中的時(shí)間標(biāo)識(shí)何時(shí)用戶(hù)訪(fǎng)問(wèn)店鋪以及一周或一個(gè)月的哪些天他/她執(zhí)行他的/她的購(gòu)買(mǎi)。顧客對(duì)零售商的價(jià)值以及顧客偏好的支付方法(如果這被適當(dāng)?shù)赜涗浟?也可以被確定。而且由每個(gè)用戶(hù)購(gòu)物的偏好種類(lèi),以及而且他們的產(chǎn)品或服務(wù)用法以及產(chǎn)品相關(guān)的偏好可以被確定。此外,從銷(xiāo)售數(shù)據(jù)的角度,銷(xiāo)售量、顧客的計(jì)數(shù)、以及購(gòu)買(mǎi)次數(shù)能夠被確定。[0026]數(shù)據(jù)源可以提供與產(chǎn)品層級(jí)有關(guān)的信息,產(chǎn)品層級(jí)包括產(chǎn)品層級(jí)的各種層次。例如,對(duì)于具有大的廣品范圍的零售商,大的廣品范圍可以具有“長(zhǎng)尾的(long tailed)”購(gòu)買(mǎi)模式或者其中用戶(hù)至物品的關(guān)聯(lián)索引是稀疏的,產(chǎn)品分類(lèi)能夠用于在產(chǎn)品層級(jí)的各種層次應(yīng)用關(guān)聯(lián)分析,并且因此充實(shí)了所推薦的物品列表。該方法還能夠用于處理“冷啟動(dòng)”問(wèn)題,其中針對(duì)還沒(méi)有銷(xiāo)售的物品需要推薦。
[0027]數(shù)據(jù)源可以提供涉及產(chǎn)品屬性的信息,以標(biāo)識(shí)特定產(chǎn)品種類(lèi)內(nèi)的產(chǎn)品之間的相似度。該類(lèi)型的信息能夠?qū)τ谠u(píng)定相同種類(lèi)內(nèi)的產(chǎn)品的相似度做出貢獻(xiàn)。產(chǎn)品屬性以及產(chǎn)品評(píng)級(jí)(如果可用)或者銷(xiāo)量能夠用于,執(zhí)行屬性權(quán)重分析并且估計(jì)每個(gè)屬性對(duì)零售商的收入的重要度。當(dāng)產(chǎn)品屬性不可用時(shí),產(chǎn)品描述可以用于標(biāo)識(shí)產(chǎn)品的相似度,例如通過(guò)應(yīng)用文本相似度函數(shù)。
[0028]當(dāng)可用時(shí),產(chǎn)品評(píng)級(jí)也能夠被處理以生成有用的推薦。根據(jù)一個(gè)用戶(hù)被估計(jì)為評(píng)級(jí)高的產(chǎn)品能夠被推薦給處于相似人口統(tǒng)計(jì)學(xué)中的另一用戶(hù)。店鋪特性可以用于說(shuō)明購(gòu)買(mǎi)位于所生成的推薦中的位置,以及說(shuō)明店鋪大小和其他的店鋪特性。
[0029]來(lái)自數(shù)據(jù)源的數(shù)據(jù)還能夠用于生成顧客分析記錄(CAR),顧客分析記錄提供涉及顧客行為和特點(diǎn)的信息。CAR可以包括顧客相關(guān)的KPI,如由顧客的購(gòu)買(mǎi)次數(shù)、他的/她的平均籃大小、時(shí)間(一周中的幾天、一天中的時(shí)間)和他的/她的購(gòu)買(mǎi)進(jìn)行的位置、到店鋪往返的平均次數(shù)、所購(gòu)買(mǎi)的產(chǎn)品種類(lèi)、偏好的支付方法等等。CAR能夠用于執(zhí)行微觀(guān)或宏觀(guān)分割(segmentation),并且用于輔助推薦個(gè)性化的性能。
[0030]顧客聚類(lèi)組件202標(biāo)識(shí)具有相似的購(gòu)買(mǎi)相關(guān)行為,并且具有相似人口統(tǒng)計(jì)學(xué)的用戶(hù)集群。宏觀(guān)個(gè)性化組件203可以使用該集群,基于由相同集群中的其他人購(gòu)買(mǎi)的物品,來(lái)確定集群中的用戶(hù)可以被推薦一個(gè)物品。
[0031]微觀(guān)個(gè)性化組件204基于對(duì)該用戶(hù)的個(gè)人信息生成推薦。
[0032]時(shí)間效應(yīng)組件205基于交易數(shù)據(jù)的季節(jié)性和近期性(recentness)生成推薦。例如,更近的交易數(shù)據(jù)被權(quán)衡得更重,并且與季節(jié)性的購(gòu)買(mǎi)有關(guān)的交易數(shù)據(jù)可以被權(quán)衡得更重。
[0033]預(yù)測(cè)過(guò)濾組件206基于他們的歷史購(gòu)買(mǎi)標(biāo)識(shí)針對(duì)用戶(hù)的未來(lái)購(gòu)買(mǎi)興趣。預(yù)測(cè)過(guò)濾組件206可以使用隱馬爾科夫(Hidden Markov)模型來(lái)進(jìn)行“用戶(hù)至物品”推薦。
[0034]業(yè)務(wù)規(guī)則組件207可以應(yīng)用于由推薦核201生成的一組推薦,以選擇將向用戶(hù)展現(xiàn)的最終推薦。例如,業(yè)務(wù)規(guī)則可以指示無(wú)論何時(shí)顯示書(shū)籍,則僅推薦書(shū)籍。在另一示例中,給出前5名促銷(xiāo)物品,而不是提供正常的推薦。
[0035]最終推薦可以被提供至測(cè)試平臺(tái),測(cè)試平臺(tái)可以包括離線(xiàn)測(cè)試模塊111和/或在線(xiàn)測(cè)試模塊112,離線(xiàn)測(cè)試模塊111和/或在線(xiàn)測(cè)試模塊112與圖1中示出的在線(xiàn)測(cè)試系統(tǒng)104 一起工作,來(lái)優(yōu)化推薦函數(shù)。
[0036]圖2中示出的推薦引擎115的組件執(zhí)行對(duì)確定物品至物品關(guān)聯(lián)的關(guān)聯(lián)分析。例如,因?yàn)榻灰讛?shù)據(jù)提供了涉及誰(shuí)購(gòu)買(mǎi)了什么、何時(shí)、以及何地的信息,所以交易數(shù)據(jù)用于標(biāo)識(shí)籃并且辨認(rèn)經(jīng)常被一起購(gòu)買(mǎi)的物品組。這能夠作為關(guān)聯(lián)分析的基礎(chǔ)。使用該信息,物品至物品(借此,物品能夠是產(chǎn)品或服務(wù))推薦被生成。例如,對(duì)于籃中的每個(gè)產(chǎn)品,通常與該產(chǎn)品一起購(gòu)買(mǎi)的產(chǎn)品被推薦。因此,“買(mǎi)了這個(gè)的顧客也買(mǎi)了那個(gè)”類(lèi)型的推薦被生成。因此,針對(duì)每個(gè)產(chǎn)品和每個(gè)籃的一組推薦能夠被生成。具體地,一起購(gòu)買(mǎi)的成對(duì)產(chǎn)品或者甚至多組產(chǎn)品之間的關(guān)聯(lián)用于推薦而被確定。
[0037]為了確定這些關(guān)聯(lián),推薦函數(shù)可以包括評(píng)分函數(shù)來(lái)分析顧客籃,并且籃中的每個(gè)物品組的重要性被估計(jì)。可以作為推薦函數(shù)使用的評(píng)分函數(shù)的示例包括,支持計(jì)數(shù)、支持(support)、置信、以及余弦度量(cosine metric)。用于為這些評(píng)分函數(shù)來(lái)計(jì)算值在下面被描述。
[0038]物品組的支持計(jì)數(shù)是包含該特定物品組的交易的數(shù)量。數(shù)學(xué)上,物品組X的支持計(jì)數(shù)定義為:
【權(quán)利要求】
1.一種混合推薦系統(tǒng),包括: 離線(xiàn)測(cè)試模塊,用于在數(shù)據(jù)集上離線(xiàn)測(cè)試推薦函數(shù),并且還用于基于根據(jù)所述離線(xiàn)測(cè)試確定的性能指標(biāo)來(lái)調(diào)節(jié)所述推薦函數(shù); 在線(xiàn)測(cè)試模塊,用于由在線(xiàn)測(cè)試系統(tǒng)促進(jìn)所述推薦函數(shù)的在線(xiàn)測(cè)試; 由處理器執(zhí)行的推薦引擎,用于從所述推薦函數(shù)的頂級(jí)表現(xiàn)集合生成推薦索引并且將所述推薦索引存儲(chǔ)在數(shù)據(jù)存儲(chǔ)中,所述推薦函數(shù)的頇級(jí)表現(xiàn)集合基于所述在線(xiàn)測(cè)試和離線(xiàn)測(cè)試確定; 選擇模塊,用于接收標(biāo)識(shí)用戶(hù)的當(dāng)前活動(dòng)的動(dòng)態(tài)數(shù)據(jù),并且在至少一個(gè)所述推薦索引上執(zhí)行查找以確定候選推薦;以及 過(guò)濾器模塊,用于基于過(guò)濾器或規(guī)則來(lái)選擇所述候選推薦的一個(gè)或多個(gè)候選推薦以向所述用戶(hù)展現(xiàn)。
2.根據(jù)權(quán)利要求1所述的混合推薦系統(tǒng),其中所述離線(xiàn)測(cè)試模塊用于從訓(xùn)練數(shù)據(jù)集生成至少一個(gè)所述推薦函數(shù),所述訓(xùn)練數(shù)據(jù)集根據(jù)包括歷史購(gòu)買(mǎi)數(shù)據(jù)的數(shù)據(jù)集確定,并且用于測(cè)試來(lái)自測(cè)試數(shù)據(jù)集的所述推薦函數(shù),所述測(cè)試數(shù)據(jù)集根據(jù)所述歷史購(gòu)買(mǎi)數(shù)據(jù)確定,其中所述訓(xùn)練數(shù)據(jù)集和所述測(cè)試數(shù)據(jù)集包括針對(duì)用于購(gòu)買(mǎi)的交易的非重疊時(shí)間段。
3.根據(jù)權(quán)利要求2所述的混合推薦系統(tǒng),其中所述離線(xiàn)測(cè)試模塊用于通過(guò)如下方式來(lái)測(cè)試來(lái)自所述測(cè)試數(shù)據(jù)集的所述推薦函數(shù):基于所述測(cè)試數(shù)據(jù)集中的信息來(lái)確定所述推薦函數(shù)的推薦,并且基于所述推薦來(lái)測(cè)量所述性能指標(biāo)。
4.根據(jù)權(quán)利要求3所述的混合推薦系統(tǒng),其中所述性能指標(biāo)包括查全率和查準(zhǔn)率,其中所述查全率性能指標(biāo)是購(gòu)物車(chē)中匹配推薦的物品的比率,并且所述查準(zhǔn)率性能指標(biāo)是成功的所述推薦的百分比。
5.根據(jù)權(quán)利要求3所述的混合推薦系統(tǒng),其中所述離線(xiàn)測(cè)試模塊用于將所述測(cè)量的性能指標(biāo)與基準(zhǔn)進(jìn)行比較,并且如果所述測(cè)量的性能指標(biāo)不滿(mǎn)足所述基準(zhǔn),則改變所述至少一個(gè)推薦函數(shù)的可調(diào)節(jié)參數(shù)。
6.根據(jù)權(quán)利要求1所述的混合推薦系統(tǒng),其中所述在線(xiàn)測(cè)試系統(tǒng)模塊用于將針對(duì)已經(jīng)基于所述推薦函數(shù)由所述在線(xiàn)測(cè)試系統(tǒng)向其提供推薦的用戶(hù)組的測(cè)量的指標(biāo),與針對(duì)沒(méi)有向其給出推薦的對(duì)照組的測(cè)量的指標(biāo)進(jìn)行比較,并且基于所述比較評(píng)估所述推薦函數(shù)。
7.根據(jù)權(quán)利要求6所述的混合推薦系統(tǒng),其中所述指標(biāo)包括宏觀(guān)性能指標(biāo)和微觀(guān)性能指標(biāo),所述宏觀(guān)性能指標(biāo)包括每個(gè)顧客的平均購(gòu)物車(chē)大小、每個(gè)購(gòu)物車(chē)的平均銷(xiāo)量以及每個(gè)顧客的平均銷(xiāo)量中的至少一個(gè),所述微觀(guān)性能指標(biāo)包括匹配針對(duì)顧客的推薦的物品和針對(duì)所述物品的點(diǎn)通率中的至少一個(gè)。
8.根據(jù)權(quán)利要求6所述的混合推薦系統(tǒng),其中所述在線(xiàn)測(cè)試模塊用于基于對(duì)所述指標(biāo)的所述評(píng)估而從所述推薦函數(shù)中選擇具有最高性能的所述推薦函數(shù)的頂級(jí)表現(xiàn)集合。
9.根據(jù)權(quán)利要求1所述的混合推薦系統(tǒng),其中所述推薦函數(shù)包括支持評(píng)分函數(shù)、支持計(jì)數(shù)評(píng)分函數(shù)、置信評(píng)分函數(shù)以及余弦指標(biāo)評(píng)分函數(shù)中的至少一個(gè)。
10.根據(jù)權(quán)利要求1所述的混合推薦系統(tǒng),其中所述推薦函數(shù)包括至少一個(gè)函數(shù),所述至少一個(gè)函數(shù)包括用于購(gòu)物車(chē)中物品的價(jià)格的參數(shù),以及購(gòu)買(mǎi)發(fā)生的地點(diǎn)和將要提供推薦的位置之間的距離。
11.根據(jù)權(quán)利要求1所述的混合推薦系統(tǒng),其中所述過(guò)濾器模塊用于應(yīng)用實(shí)時(shí)指標(biāo)和規(guī)則來(lái)選擇所述候選推薦以向所述用戶(hù)遞送。
12.根據(jù)權(quán)利要求1所述的混合推薦系統(tǒng),其中所述實(shí)時(shí)指標(biāo)包括所述用戶(hù)的當(dāng)前位置以及由所述用戶(hù)進(jìn)行的近期購(gòu)買(mǎi)。
13.根據(jù)權(quán)利要求1所述的混合推薦系統(tǒng),其中所述推薦包括針對(duì)要購(gòu)買(mǎi)的產(chǎn)品的推薦或優(yōu)惠券。
14.根據(jù)權(quán)利要求1所述的混合推薦系統(tǒng),其中所述推薦引擎執(zhí)行所述推薦函數(shù),以基于用于產(chǎn)品購(gòu)買(mǎi)的交易數(shù)據(jù)、用戶(hù)人口統(tǒng)計(jì)學(xué)和產(chǎn)品信息,來(lái)標(biāo)識(shí)產(chǎn)品集合之間的關(guān)聯(lián)以及用戶(hù)與產(chǎn)品之間的關(guān)聯(lián),并且所述關(guān)聯(lián)被存儲(chǔ)在所述索引中。
15.根據(jù)權(quán)利要求1所述的混合推薦系統(tǒng),其中所述索引被存儲(chǔ)在服務(wù)器集群上,并且映射和簡(jiǎn)化任務(wù)并行地被執(zhí)行以在所述索引上執(zhí)行所述查找。
16.一種非暫時(shí)性計(jì)算機(jī)可讀介質(zhì),包括機(jī)器可讀指令,所述機(jī)器可讀指令由至少一個(gè)處理器可執(zhí)行用于: 在數(shù)據(jù)集上離線(xiàn)測(cè)試推薦函數(shù); 基于根據(jù)所述測(cè)試確定的性能指標(biāo),調(diào)節(jié)所述推薦函數(shù); 由在線(xiàn)測(cè)試系統(tǒng)在線(xiàn)測(cè)試所述推薦函數(shù); 從基于所述在線(xiàn)測(cè)試和離線(xiàn)測(cè)試而確定的所述推薦函數(shù)的頂級(jí)表現(xiàn)集合生成推薦索引; 將所述推薦索引存儲(chǔ)在數(shù)據(jù)存儲(chǔ)中; 接收標(biāo)識(shí)用戶(hù)的當(dāng)前活動(dòng)的動(dòng)態(tài)數(shù)據(jù); 在至少一個(gè)所述推薦索引上執(zhí)行查找以確定候選推薦;以及 基于過(guò)濾器或規(guī)則,選擇一個(gè)或多個(gè)所述候選推薦以向所述用戶(hù)展現(xiàn)。
17.根據(jù)權(quán)利要求16所述的非暫時(shí)性計(jì)算機(jī)可讀介質(zhì),其中所述機(jī)器可讀指令用于: 從訓(xùn)練數(shù)據(jù)集生成至少一個(gè)所述推薦函數(shù),所述訓(xùn)練數(shù)據(jù)集根據(jù)包括歷史購(gòu)買(mǎi)數(shù)據(jù)的數(shù)據(jù)集確定;以及 所述離線(xiàn)測(cè)試包括測(cè)試來(lái)自測(cè)試數(shù)據(jù)集的所述推薦函數(shù),所述測(cè)試數(shù)據(jù)集根據(jù)所述歷史購(gòu)買(mǎi)數(shù)據(jù)確定,其中所述訓(xùn)練數(shù)據(jù)集合和所述測(cè)試數(shù)據(jù)集包括針對(duì)用于購(gòu)買(mǎi)的交易的非重疊時(shí)間段。
18.根據(jù)權(quán)利要求16所述的非暫時(shí)性計(jì)算機(jī)可讀介質(zhì),其中用于所述離線(xiàn)測(cè)試的所述機(jī)器可讀指令包括:用于基于所述測(cè)試數(shù)據(jù)集中的信息來(lái)確定所述推薦函數(shù)的推薦并且基于所述推薦來(lái)測(cè)量所述性能指標(biāo)的機(jī)器可讀指令。
19.根據(jù)權(quán)利要求16所述的非暫時(shí)性計(jì)算機(jī)可讀介質(zhì),其中用于所述在線(xiàn)測(cè)試的所述機(jī)器可讀指令包括用于如下的機(jī)器可讀指令:將針對(duì)已經(jīng)基于所述推薦函數(shù)由所述在線(xiàn)測(cè)試系統(tǒng)向其提供推薦的用戶(hù)組的測(cè)量的指標(biāo),與針對(duì)沒(méi)有向其給出推薦的對(duì)照組的測(cè)量的指標(biāo)進(jìn)行比較,并且 基于所述比較評(píng)估所述推薦函數(shù),以選擇所述推薦函數(shù)的所述頂級(jí)表現(xiàn)集合。
20.一種混合推薦系統(tǒng),用于確定向用戶(hù)展現(xiàn)的推薦以用于在線(xiàn)購(gòu)物,所述系統(tǒng)包括: 離線(xiàn)測(cè)試模塊,用于在數(shù)據(jù)集上離線(xiàn)測(cè)試推薦函數(shù),并且還用于基于根據(jù)所述離線(xiàn)測(cè)試確定的性能指標(biāo)來(lái)調(diào)節(jié)所述推薦函數(shù); 在線(xiàn)測(cè)試模塊,用于由在線(xiàn)測(cè)試系統(tǒng)促進(jìn)所述推薦函數(shù)的在線(xiàn)測(cè)試;由處理器執(zhí)行的推薦引擎,用于從所述推薦函數(shù)的頂級(jí)表現(xiàn)集合生成推薦索引并且將所述推薦索引存儲(chǔ)在數(shù)據(jù)存儲(chǔ)中,所述推薦函數(shù)的頂級(jí)表現(xiàn)集合基于所述在線(xiàn)測(cè)試和離線(xiàn)測(cè)試確定; 選擇模塊,用于接收標(biāo)識(shí)用戶(hù)的當(dāng)前活動(dòng)的動(dòng)態(tài)數(shù)據(jù)、所述用戶(hù)的購(gòu)買(mǎi)歷史以及針對(duì)所述用戶(hù)的偏好,并且基于所述用戶(hù)的所述當(dāng)前活動(dòng)、所述購(gòu)買(mǎi)歷史和所述偏好,在至少一個(gè)所述推薦索引上執(zhí)行查找以確定候選推薦,其中所述索引包括產(chǎn)品物品與產(chǎn)品物品的關(guān)聯(lián)以及顧客與產(chǎn)品的關(guān)聯(lián);以及 過(guò)濾器模塊,用于基于過(guò)濾器或規(guī)則來(lái)選擇所述候選推薦的一個(gè)或多個(gè)候選推薦以向所述用戶(hù)展現(xiàn)。·
【文檔編號(hào)】G06F17/30GK103824192SQ201310397766
【公開(kāi)日】2014年5月28日 申請(qǐng)日期:2013年9月2日 優(yōu)先權(quán)日:2012年8月31日
【發(fā)明者】S·D·柯克比, 周西勇, C·布基斯, G·帕薩利斯 申請(qǐng)人:埃森哲環(huán)球服務(wù)有限公司