專利名稱:在陌生領(lǐng)域中生成推薦項(xiàng)目的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息處理領(lǐng)域,更具體地說,涉及在陌生領(lǐng)域中生成推薦項(xiàng)目的方法和裝置。
背景技術(shù):
傳統(tǒng)的生成推薦項(xiàng)目的方法是基于對大量用戶的行為統(tǒng)計(jì),以例如排行榜、暢銷榜之類的形式進(jìn)行推薦。這種推薦方式?jīng)]有考慮到用戶之間的差異。以圖書在線銷售系統(tǒng)的推薦項(xiàng)目生成系統(tǒng)為例,專業(yè)書籍由于其面向的讀者群體有限,其銷量往往大大少于小說等的銷量,從而無法進(jìn)入暢銷榜形式進(jìn)行的推薦。但是,如果向經(jīng)常購買專業(yè)書籍的用戶推薦小說顯然并不能向該用戶進(jìn)行有效的推薦。這里的有效推薦可以是指所推薦的項(xiàng)目被用戶實(shí)際查看。當(dāng)然本領(lǐng)域中還有很多其他方法來衡量一個(gè)推薦是否是有效推薦。作為對這種無差異性推薦方法的改進(jìn),可以進(jìn)一步結(jié)合用戶自身的歷史行為數(shù)據(jù)來生成推薦項(xiàng)目。再次以圖書在線銷售系統(tǒng)的推薦項(xiàng)目生成系統(tǒng)為例,如果用戶購買了某本圖書,那么可以向用戶推薦同樣購買了該圖書的其他用戶所購買的其他圖書?;蛘呖梢愿鶕?jù)圖書之間的關(guān)聯(lián)性向用戶推薦與該圖書相關(guān)聯(lián)的其他圖書,所述關(guān)聯(lián)性例如同一出版社、同一作者、同一關(guān)鍵詞等。還可以根據(jù)用戶的歷史購買行為將用戶歸入某種的用戶類型,例如經(jīng)常購買旅行指南的用戶類型、經(jīng)常購買計(jì)算機(jī)教材的用戶類型或者經(jīng)常購買語言學(xué)習(xí)教材的用戶類型等,然后向用戶推薦同樣屬于該用戶類型的其他用戶所購買的其他圖書。當(dāng)然,還存在進(jìn)一步的其他改進(jìn)。當(dāng)今,圖書在線銷售系統(tǒng)往往是綜合性在線銷售系統(tǒng)的一部分。綜合性在線銷售系統(tǒng)可以包括許多銷售領(lǐng)域,例如圖書、音像制品、體育器材、服裝等。如果用戶在某個(gè)領(lǐng)域中沒有或者僅有很少的歷史行為數(shù)據(jù)可以分析,則難以向用戶進(jìn)行有效的推薦。這樣的領(lǐng)域稱為陌生領(lǐng)域。本領(lǐng)域技術(shù)人員可以根據(jù)需要定義陌生領(lǐng)域,例如將用戶的歷史行為數(shù)據(jù)量少于某閾值的領(lǐng)域作為該用戶的陌生領(lǐng)域。對于主要購買過音像制品、體育器材和服裝而很少或者根本不購買圖書的用戶,圖書即為所述陌生領(lǐng)域。在該用戶第一次或前幾次查看圖書時(shí),無法通過對該用戶在圖書這一陌生領(lǐng)域中的歷史行為數(shù)據(jù)的分析向該用戶進(jìn)行有效的推薦。例如如果用戶根本沒有購買過圖書,那么就不可能向用戶推薦同樣購買了某圖書的其他用戶所購買的其他圖書。即使用戶購買過少量圖書,很可能也無法可以根據(jù)用戶的歷史購買行為將用戶歸入某種的用戶類型。此外,除了在線銷售系統(tǒng)以外,對于存在領(lǐng)域劃分并且存在推薦需求的其他系統(tǒng), 例如搜索引擎系統(tǒng),也同樣存在上述問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了在陌生領(lǐng)域中生成推薦項(xiàng)目的方法和裝置。根據(jù)本發(fā)明的一個(gè)方面,一種在陌生領(lǐng)域中為當(dāng)前用戶生成推薦項(xiàng)目的方法包括在不同于所述陌生領(lǐng)域的參考領(lǐng)域中,選擇當(dāng)前用戶的參考用戶,其中所述當(dāng)前用戶和所述參考用戶的行為在所述參考領(lǐng)域中具有符合用戶近似度指標(biāo)條件的用戶近似度指標(biāo); 根據(jù)所述參考用戶在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的推薦項(xiàng)目。根據(jù)本發(fā)明的另一方面,一種在陌生領(lǐng)域中為當(dāng)前用戶生成推薦項(xiàng)目的裝置包括參考用戶確定模塊,配置為在不同于所述陌生領(lǐng)域的參考領(lǐng)域中,選擇當(dāng)前用戶的參考用戶,其中所述當(dāng)前用戶和所述參考用戶的行為在所述參考領(lǐng)域中具有符合用戶近似度指標(biāo)條件的用戶近似度指標(biāo);當(dāng)前用戶推薦模塊,配置為根據(jù)所述參考用戶在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的推薦項(xiàng)目。按照根據(jù)本發(fā)明實(shí)施例的技術(shù)方案,由于所述參考用戶在所述參考領(lǐng)域與當(dāng)前用戶的行為近似,那么有很大可能該參考用戶在所述陌生領(lǐng)域與所述當(dāng)前用戶的行為也近似,因此以該參考用戶在所述陌生領(lǐng)域的歷史行為數(shù)據(jù)作為參考為所述當(dāng)前用戶生成的推薦項(xiàng)目很可能是對該當(dāng)前用戶的有效推薦。還可以進(jìn)一步考慮參考領(lǐng)域和陌生領(lǐng)域之間的領(lǐng)域近似度指標(biāo)。如果某參考領(lǐng)域與所述陌生領(lǐng)域的領(lǐng)域近似度指標(biāo)高,說明在該參考領(lǐng)域中行為相似的用戶,在該陌生領(lǐng)域中的行為也應(yīng)該相似;如果在該參考領(lǐng)域中某參考用戶與當(dāng)前用戶的用戶相似度指標(biāo)也高,那么在所述陌生領(lǐng)域中該參考用戶與當(dāng)前用戶的行為也應(yīng)該相似,因此在該陌生領(lǐng)域中為該參考用戶生成的推薦項(xiàng)目很有可能對于當(dāng)前用戶是有效推薦。這樣,即使當(dāng)前用戶在陌生領(lǐng)域完全沒有歷史行為數(shù)據(jù)或者僅有少量的歷史行為數(shù)據(jù),也能向當(dāng)前用戶進(jìn)行有效的推薦。
所附權(quán)利要求中闡述了被認(rèn)為是本發(fā)明的特點(diǎn)的創(chuàng)造性特征。但是,通過參照附圖閱讀下面對說明性實(shí)施例的詳細(xì)說明可更好地理解發(fā)明本身以及其優(yōu)選使用模式、目標(biāo)、特征以及優(yōu)點(diǎn),在附圖中圖1是根據(jù)本發(fā)明實(shí)施例的生成推薦項(xiàng)目的方法的流程圖。圖2是根據(jù)本發(fā)明實(shí)施例的生成推薦項(xiàng)目的裝置的方框圖。
具體實(shí)施例方式下面參照附圖來說明本發(fā)明的實(shí)施例。在下面的說明中,闡述了許多具體細(xì)節(jié)以便更全面地了解本發(fā)明。但是,本技術(shù)領(lǐng)域技術(shù)人員容易理解,本發(fā)明的實(shí)現(xiàn)可不具有這些具體細(xì)節(jié)中的一些,并且本發(fā)明并不限于所介紹的特定實(shí)施例。相反,可以考慮用下面的特征和要素的任意組合來實(shí)施本發(fā)明,而無論它們是否涉及不同的實(shí)施例。因此,下面的方面、特征、實(shí)施例和優(yōu)點(diǎn)僅作說明之用而不應(yīng)被看作是所附權(quán)利要求的要素或限定,除非權(quán)利要求中明確提出。還需要說明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。此外,除非刻意地使用“直接”或者“間接”加以限定,否則本申請文件中的連接既包括直接連接,也包括間接地連接。此外,如前所述,除了在線銷售系統(tǒng)以外,對于存在領(lǐng)域劃分并且存在推薦需求的其他系統(tǒng),例如搜索引擎系統(tǒng),也同樣存在上述問題。雖然在以下描述中以在線銷售系統(tǒng)為例對本發(fā)明的實(shí)施例進(jìn)行了說明,但是本領(lǐng)域技術(shù)人員可以容易地將本發(fā)明的思想應(yīng)用于其他存在領(lǐng)域劃分并且存在推薦需求的系統(tǒng)。如圖1所示,根據(jù)本發(fā)明實(shí)施例的生成推薦項(xiàng)目的方法包括步驟101,在不同于所述陌生領(lǐng)域的至少一個(gè)參考領(lǐng)域中選擇當(dāng)前用戶的至少一個(gè)參考用戶,其中所述當(dāng)前用戶和所述參考用戶的行為在所述至少一個(gè)參考領(lǐng)域中具有符合條件的用戶近似度指標(biāo)。用戶近似度指標(biāo)所需要滿足的條件可以稱為用戶近似度指標(biāo)條件。根據(jù)本發(fā)明的一個(gè)實(shí)施例,可以將在所述參考領(lǐng)域中與當(dāng)前用戶屬于同一用戶類型的用戶作為當(dāng)前用戶的參考用戶。如果當(dāng)前用戶在所述參考領(lǐng)域中屬于多個(gè)用戶類型, 那么可以將屬于這些用戶類型的用戶都作為當(dāng)前用戶的參考用戶。本領(lǐng)域技術(shù)人員可以理解,在一個(gè)領(lǐng)域中屬于同一用戶類型的用戶其行為必然在一定程度上近似,從而具有符合用戶近似度指標(biāo)條件的用戶近似度指標(biāo)。換句話說,這相當(dāng)于推斷與當(dāng)前用戶屬于同一用戶類型的用戶均具有相同的并且符合所述用戶近似度指標(biāo)條件的用戶近似度指標(biāo)。可以對得出用戶近似度指標(biāo)的方法進(jìn)行改進(jìn),采用根據(jù)歷史行為數(shù)據(jù)計(jì)算的方法而不是從用戶類型推斷的方法來得到用戶近似度指標(biāo),從而使得所述用戶近似度指標(biāo)能更加精確地衡量這些參考用戶與當(dāng)前用戶的近似程度??梢詫⒏鶕?jù)歷史行為數(shù)據(jù)計(jì)算的方法和從用戶類型推斷的方法結(jié)合使用,即首先選擇在所述參考領(lǐng)域中與用戶具有屬于相同的用戶類型的用戶作為候選參考用戶,然后對候選參考用戶計(jì)算用戶近似度指標(biāo),最后根據(jù)用戶近似度指標(biāo)選擇參考用戶。下面詳細(xì)描述幾種計(jì)算同一參考領(lǐng)域中兩個(gè)用戶之間的用戶近似度指標(biāo)的實(shí)施例。根據(jù)本發(fā)明的一個(gè)實(shí)施例,可以根據(jù)這兩個(gè)用戶在所述參考領(lǐng)域中的歷史行為數(shù)據(jù)確定這兩個(gè)用戶共同購買的物品,然后根據(jù)所述共同購買的物品的數(shù)目計(jì)算出兩個(gè)用戶之間的用戶近似度指標(biāo)。本領(lǐng)域技術(shù)人員容易理解,對于搜索引擎系統(tǒng),可以通過共同點(diǎn)擊的搜索結(jié)果的數(shù)目計(jì)算出兩個(gè)用戶之間的用戶近似度指標(biāo)。推而廣之,對于各種存在領(lǐng)域劃分并且存在推薦需求的系統(tǒng),可以針對該系統(tǒng)定義共同行為。根據(jù)兩個(gè)用戶在參考領(lǐng)域中的歷史行為數(shù)據(jù)確定這兩個(gè)用戶在參考領(lǐng)域的共同行為的數(shù)目,然后根據(jù)所述共同行為的數(shù)目計(jì)算出兩個(gè)用戶之間的用戶近似度指標(biāo)。也就是說,當(dāng)所述共同行為數(shù)目滿足共同行為數(shù)目條件時(shí),就認(rèn)為用戶近似度指標(biāo)滿足了用戶近似度指標(biāo)條件??梢灾苯右运鰯?shù)目作為所述用戶近似度指標(biāo),例如假設(shè)用戶甲用戶乙共同購買了 3件物品,則所述用戶近似度指標(biāo)可以是3。也可以以所述數(shù)目與這兩個(gè)用戶購買的物品總數(shù)之間的比值作為所述用戶近似度指標(biāo),例如假設(shè)用戶甲購買了 7件物品而用戶乙購買了 8件物品,其中一樣的物品有3件,那么用戶甲和用戶乙購買的物品總數(shù)是12,則所述用戶近似度指標(biāo)可以是0. 25。顯然,這樣得到的近似度指標(biāo)較高,說明兩個(gè)用戶購買了很多相同的物品,即其行為是近似的。可以用計(jì)算購買物品向量的不相關(guān)指標(biāo)的方法來計(jì)算兩個(gè)用戶之間的用戶近似度指標(biāo)。例如,假設(shè)當(dāng)前用戶購買了物品A、物品B、物品C和物品D,用戶甲購買了物品A、 物品B、物品E和物品F,用戶乙購買了物品A、物品C、物品D和物品F??梢詫?dāng)前用戶的購買物品向量用{1,1,1,1,0,0}表示,其中前四個(gè)1表示當(dāng)前用戶購買了物品A、物品B、物品C和物品D,而后兩個(gè)0表示當(dāng)前用戶沒有購買物品E和物品F ;類似地,用戶甲的購買物品向量可以用{1,1,0,0,1,1}表示,用戶乙的購買物品向量用{1,0,1,1,0,1}表示。假設(shè)購買物品向量X和購買物品向量Y之間的不相關(guān)指標(biāo)定義為
權(quán)利要求
1.一種在陌生領(lǐng)域中為當(dāng)前用戶生成推薦項(xiàng)目的方法,包括在不同于所述陌生領(lǐng)域的參考領(lǐng)域中,選擇當(dāng)前用戶的參考用戶,其中所述當(dāng)前用戶和所述參考用戶的行為在所述參考領(lǐng)域中的用戶近似度指標(biāo)符合用戶近似度指標(biāo)條件;根據(jù)所述參考用戶在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的推薦項(xiàng)目。
2.根據(jù)權(quán)利要求1所述的方法,其中所述在不同于所述陌生領(lǐng)域的參考領(lǐng)域中選擇當(dāng)前用戶的參考用戶包括選擇在所述參考領(lǐng)域中與當(dāng)前用戶屬于同一用戶類型的用戶作為所述參考用戶。
3.根據(jù)權(quán)利要求1或2所述的方法,其中所述在不同于所述陌生領(lǐng)域的參考領(lǐng)域中選擇當(dāng)前用戶的參考用戶包括選擇在參考領(lǐng)域中與所述當(dāng)前用戶的共同行為數(shù)目符合共同行為數(shù)目條件的用戶作為所述參考用戶。
4.根據(jù)權(quán)利要求1至3中任意一項(xiàng)所述的方法,其中所述在不同于所述陌生領(lǐng)域的參考領(lǐng)域中選擇當(dāng)前用戶的參考用戶包括選擇在參考領(lǐng)域中與所述當(dāng)前用戶的共同行為評分符合共同行為評分條件的用戶作為所述參考用戶。
5.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括根據(jù)標(biāo)定用戶在所述陌生領(lǐng)域和所述參考領(lǐng)域中的歷史行為數(shù)據(jù),確定所述陌生領(lǐng)域和所述參考領(lǐng)域之間的領(lǐng)域近似度指標(biāo),其中所述陌生領(lǐng)域和所述參考領(lǐng)域?qū)τ谒鰳?biāo)定用戶而言均非陌生領(lǐng)域。
6.根據(jù)權(quán)利要求5所述的方法,其中根據(jù)所述參考用戶在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的推薦項(xiàng)目包括根據(jù)參考用戶所對應(yīng)的領(lǐng)域近似度指標(biāo)和用戶近似度指標(biāo)計(jì)算參考用戶權(quán)值;針對參考用戶權(quán)值符合參考用戶權(quán)值條件的參考用戶,根據(jù)其在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的推薦項(xiàng)目。
7.根據(jù)權(quán)利要求5所述的方法,其中根據(jù)所述參考用戶在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的推薦項(xiàng)目包括根據(jù)所述參考用戶在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的候選推薦項(xiàng)目,根據(jù)候選推薦項(xiàng)目所對應(yīng)的領(lǐng)域近似度指標(biāo)和用戶近似度指標(biāo)計(jì)算候選推薦項(xiàng)目權(quán)值;將候選推薦項(xiàng)目權(quán)值符合候選推薦項(xiàng)目權(quán)值條件的候選推薦項(xiàng)目作為用于所述當(dāng)前用戶的在該陌生領(lǐng)域中的推薦項(xiàng)目。
8.—種在陌生領(lǐng)域中為當(dāng)前用戶生成推薦項(xiàng)目的裝置,包括參考用戶確定模塊,配置為在不同于所述陌生領(lǐng)域的參考領(lǐng)域中,選擇當(dāng)前用戶的參考用戶,其中所述當(dāng)前用戶和所述參考用戶的行為在所述參考領(lǐng)域中具有符合用戶近似度指標(biāo)條件的用戶近似度指標(biāo);和當(dāng)前用戶推薦模塊,配置為根據(jù)所述參考用戶在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的推薦項(xiàng)目。
9.根據(jù)權(quán)利要求8所述的裝置,其中所述參考用戶確定模塊包括配置為選擇在所述參考領(lǐng)域中與當(dāng)前用戶屬于同一用戶類型的用戶作為所述參考用戶的模塊。
10.根據(jù)權(quán)利要求8或9所述的裝置,其中所述參考用戶確定模塊包括配置為選擇在參考領(lǐng)域中與所述當(dāng)前用戶的共同行為數(shù)目符合共同行為數(shù)目條件的用戶作為所述參考用戶的模塊。
11.根據(jù)權(quán)利要求8至10中任意一項(xiàng)所述的裝置,其中所述參考用戶確定模塊包括 配置為選擇在參考領(lǐng)域中與所述當(dāng)前用戶的共同行為評分符合共同行為評分條件的用戶作為所述參考用戶的模塊。
12.根據(jù)權(quán)利要求8所述的裝置,進(jìn)一步包括標(biāo)定模塊,配置為根據(jù)標(biāo)定用戶在所述陌生領(lǐng)域和所述參考領(lǐng)域中的歷史行為數(shù)據(jù), 確定所述陌生領(lǐng)域和所述參考領(lǐng)域之間的領(lǐng)域近似度指標(biāo),其中所述陌生領(lǐng)域和所述參考領(lǐng)域?qū)τ谒鰳?biāo)定用戶而言均非陌生領(lǐng)域。
13.根據(jù)權(quán)利要求12所述的裝置,其中所述當(dāng)前用戶推薦模塊包括配置為根據(jù)參考用戶所對應(yīng)的領(lǐng)域近似度指標(biāo)和用戶近似度指標(biāo)計(jì)算參考用戶權(quán)值的模塊;配置為針對參考用戶權(quán)值符合參考用戶權(quán)值條件的參考用戶,根據(jù)其在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的推薦項(xiàng)目的模塊。
14.根據(jù)權(quán)利要求12所述的裝置,其中所述當(dāng)前用戶推薦模塊包括配置為根據(jù)所述參考用戶在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的候選推薦項(xiàng)目的模塊;配置為根據(jù)候選推薦項(xiàng)目所對應(yīng)的領(lǐng)域近似度指標(biāo)和用戶近似度指標(biāo)計(jì)算候選推薦項(xiàng)目權(quán)值的模塊;配置為將候選推薦項(xiàng)目權(quán)值符合候選推薦項(xiàng)目權(quán)值條件的候選推薦項(xiàng)目作為用于所述當(dāng)前用戶的在該陌生領(lǐng)域中的推薦項(xiàng)目的模塊。
全文摘要
本發(fā)明提供了在陌生領(lǐng)域中為當(dāng)前用戶生成推薦項(xiàng)目的方法和裝置。所述方法包括在不同于所述陌生領(lǐng)域的參考領(lǐng)域中,選擇當(dāng)前用戶的參考用戶,其中所述當(dāng)前用戶和所述參考用戶的行為在所述參考領(lǐng)域中具有符合用戶近似度指標(biāo)條件的用戶近似度指標(biāo);根據(jù)所述參考用戶在所述陌生領(lǐng)域中的歷史行為數(shù)據(jù)為所述當(dāng)前用戶生成在該陌生領(lǐng)域中的推薦項(xiàng)目。根據(jù)本發(fā)明的技術(shù)方案,即使當(dāng)前用戶在陌生領(lǐng)域完全沒有歷史行為數(shù)據(jù)或者僅有少量的歷史行為數(shù)據(jù),也能向當(dāng)前用戶進(jìn)行有效的推薦。
文檔編號G06Q30/00GK102169566SQ201010116808
公開日2011年8月31日 申請日期2010年2月26日 優(yōu)先權(quán)日2010年2月26日
發(fā)明者吳賢, 張夏天, 袁泉, 趙石頑 申請人:國際商業(yè)機(jī)器公司