信息展示的方法及設(shè)備的制作方法
【專利摘要】本申請?zhí)峁┮环N信息展示的方法及設(shè)備,所述方法包括:根據(jù)歷史日志,建立用戶的喜好詞項集合,并建立每個喜好詞項與內(nèi)容項的對應(yīng)關(guān)系;基于詞項的語義對當(dāng)前的目標(biāo)用戶的喜好詞項進(jìn)行擴(kuò)展,得到所述目標(biāo)用戶的擴(kuò)展詞項,將所述喜好詞項和擴(kuò)展詞項作為所述目標(biāo)用戶對應(yīng)的關(guān)聯(lián)詞項集合;以及按預(yù)定規(guī)則從所述關(guān)聯(lián)詞項集合中提取預(yù)定數(shù)量的詞項作為所述目標(biāo)用戶的推薦詞項,并向所述目標(biāo)用戶展示與所述推薦詞項對應(yīng)的內(nèi)容項。通過采用本申請,可以有效利用用戶自身的行為信息提取用戶喜好詞項,并且,基于語義對用戶喜好詞項進(jìn)行擴(kuò)展,使得每個用戶都有充足的可能感興趣的詞項,解決用戶喜好內(nèi)容項稀疏帶來的推薦精準(zhǔn)度低的問題。
【專利說明】信息展示的方法及設(shè)備
【技術(shù)領(lǐng)域】
[0001] 本申請涉及計算機信息【技術(shù)領(lǐng)域】,尤其涉及一種信息展示的方法及設(shè)備。
【背景技術(shù)】
[0002] 當(dāng)今計算機互聯(lián)網(wǎng)快速發(fā)展,海量的互聯(lián)網(wǎng)推送信息,造成用戶無法快速準(zhǔn)確地 定位到自己所需要的信息。于是,個性化展示推薦系統(tǒng)受到了各大互聯(lián)網(wǎng)信息提供者的青 睞,它根據(jù)用戶的喜好及點擊行為等向用戶展示其可能感興趣的信息,進(jìn)而大大提升了信 息的點擊率(CTR)。因此,信息展示推薦系統(tǒng)和方法的優(yōu)化幫助互聯(lián)網(wǎng)站主提升其網(wǎng)站資源 的利用效率顯得尤為重要,并且已成為目前各大網(wǎng)站的關(guān)注問題。
[0003] 目前,展示信息的推薦的主流實現(xiàn)方法是采用協(xié)同過濾技術(shù),主要有基于用戶 (user-based)協(xié)同過濾及基于內(nèi)容項(item-based)協(xié)同過濾的兩種方法。
[0004] 基于用戶的協(xié)同過濾方法的步驟主要包括:(1)尋找與目標(biāo)用戶最相似的若干個 用戶組成相近用戶集合;(2)將相近集合中的用戶喜好的內(nèi)容或資源推薦給目標(biāo)用戶。
[0005] 基于內(nèi)容項的協(xié)同過濾方法的步驟主要包括:(1)確定目標(biāo)用戶喜好的內(nèi)容項; (2)分別尋找與其喜好內(nèi)容項最相似的其他內(nèi)容項,組成候選內(nèi)容項集合;(3)將候選內(nèi)容 項集合及目標(biāo)用戶本身喜好的內(nèi)容項有效融合后,推薦給目標(biāo)用戶。
[0006] 上述兩種基于協(xié)同過濾技術(shù)的信息展示方法,已被眾多大型網(wǎng)站采用,為不同用 戶進(jìn)行個性化的推薦,而且收到了不錯的效果,但是都存在一些不足。例如,只關(guān)注與用戶 對推薦的內(nèi)容項(item)的喜好程度,而沒有利用內(nèi)容項本身的內(nèi)容屬性,如標(biāo)題、標(biāo)簽或關(guān) 鍵詞等重要信息?;蛘呤牵瑳]有有效地利用用戶的歷史行為數(shù)據(jù)。因為,用戶對內(nèi)容項的喜 好,往往通過用戶對內(nèi)容項的點擊、打標(biāo)簽、評價等行為來衡定,而如用戶搜索信息(Query) 這種強烈顯示用戶意圖的信息卻沒能利用起來。此外,針對擁有大量用戶搜索行為、少量用 戶點擊行為的網(wǎng)站來說,由于用戶與對內(nèi)容項的點擊行為較少,會造成推薦的精度大幅度 下降,出現(xiàn)"稀疏性"問題。因此,這兩種協(xié)同過濾信息展示方法就顯得不適用了。
【發(fā)明內(nèi)容】
[0007] 本申請的主要目的在于提供一種信息展示的方法及設(shè)備,以解決現(xiàn)有技術(shù)存在的 由于用戶對網(wǎng)站推薦的內(nèi)容項的點擊行為少,而造成推薦精度較低的問題,其中:本申請?zhí)?供的一種信息展示的方法,包括:根據(jù)歷史日志,建立用戶的喜好詞項集合,并建立每個喜 好詞項與內(nèi)容項的對應(yīng)關(guān)系;基于詞項的語義對當(dāng)前的目標(biāo)用戶的喜好詞項進(jìn)行擴(kuò)展,得 到所述目標(biāo)用戶的擴(kuò)展詞項,將所述喜好詞項和擴(kuò)展詞項作為所述目標(biāo)用戶對應(yīng)的關(guān)聯(lián)詞 項集合;以及按預(yù)定規(guī)則從所述關(guān)聯(lián)詞項集合中提取預(yù)定數(shù)量的詞項作為所述目標(biāo)用戶的 推薦詞項,并向所述目標(biāo)用戶展示與所述推薦詞項對應(yīng)的內(nèi)容項。
[0008] 根據(jù)本申請的實施例,在該方法中,還包括:通過所述目標(biāo)用戶的cookie記錄來 標(biāo)識所述目標(biāo)用戶。
[0009] 根據(jù)本申請的實施例,在該方法中,根據(jù)歷史日志,建立用戶的喜好詞項集合,并 建立每個喜好詞項與內(nèi)容項的對應(yīng)關(guān)系包括:獲得所述目標(biāo)用戶的歷史行為信息;對所述 目標(biāo)用戶的歷史行為信息進(jìn)行分詞處理以提取出一個或多個詞項作為所述目標(biāo)用戶的喜 好詞項,并形成所述目標(biāo)用戶的喜好詞項集合;以及通過將詞項與內(nèi)容項進(jìn)行匹配,將所述 目標(biāo)用戶的喜好詞項集合中的每個詞項與相關(guān)的內(nèi)容項進(jìn)行關(guān)聯(lián),并建立每個喜好詞項與 內(nèi)容項的對應(yīng)關(guān)系表。
[0010] 根據(jù)本申請的實施例,在該方法中,根據(jù)歷史日志,建立用戶的喜好詞項集合,并 建立每個喜好詞項與內(nèi)容項的對應(yīng)關(guān)系包括:獲得所述目標(biāo)用戶的歷史行為信息和與所述 目標(biāo)用戶行為相似的其他用戶的歷史行為信息;對所述目標(biāo)用戶的歷史行為信息和與所述 目標(biāo)用戶行為相似的其他用戶的歷史行為信息進(jìn)行分詞處理以提取出一個或多個詞項作 為所述目標(biāo)用戶的喜好詞項,并形成所述目標(biāo)用戶的喜好詞項集合;以及通過將詞項與內(nèi) 容項進(jìn)行匹配,將所述目標(biāo)用戶的喜好詞項集合中的每個詞項與相關(guān)的內(nèi)容項進(jìn)行關(guān)聯(lián), 并建立每個詞項與內(nèi)容項的對應(yīng)關(guān)系表。
[0011] 根據(jù)本申請的實施例,在該方法中,所述歷史行為信息包括如下信息中的一項或 多項:用戶點擊的內(nèi)容項的標(biāo)題或內(nèi)容描述、用戶搜索使用的關(guān)鍵詞信息、用戶瀏覽的網(wǎng)頁 標(biāo)簽、用戶收藏的內(nèi)容項的標(biāo)題或內(nèi)容描述。
[0012] 根據(jù)本申請的實施例,在該方法中,基于詞項的語義對所述目標(biāo)用戶的喜好詞項 進(jìn)行擴(kuò)展,得到所述目標(biāo)用戶的擴(kuò)展詞項包括:將除所述目標(biāo)用戶外的其他用戶的喜好詞 項作為所述目標(biāo)用戶的備選詞項;獲取與所述目標(biāo)用戶的喜好詞項語義相關(guān)的一個或多 個語義集合,將獲取的每個語義集合作為一個潛在語義類;計算在每個潛在語義類下,所述 目標(biāo)用戶與其每個備選詞項的相關(guān)程度,從而得到所述目標(biāo)用戶與其每個備選詞項的相關(guān) 性;根據(jù)得到的所述目標(biāo)用戶與其每個備選詞項的相關(guān)性,對所述目標(biāo)用戶的備選詞項進(jìn) 行排序;以及根據(jù)對所述備選詞項進(jìn)行排序的結(jié)果選取預(yù)定數(shù)量的備選詞項作為所述目標(biāo) 用戶的擴(kuò)展詞項。
[0013] 根據(jù)本申請的實施例,在該方法中,按預(yù)定規(guī)則從所述關(guān)聯(lián)詞項集合中選取預(yù)定 數(shù)量的詞項作為所述目標(biāo)用戶的推薦詞項,并向所述目標(biāo)用戶展示與所述推薦詞項對應(yīng)的 內(nèi)容項包括:對所述關(guān)聯(lián)詞項集合中的詞項進(jìn)行排序;根據(jù)所述排序的結(jié)果選取預(yù)定數(shù)量 的詞項作為所述目標(biāo)用戶的推薦詞項;以及向所述目標(biāo)用戶展示與所述用戶的推薦詞項對 應(yīng)的內(nèi)容項。
[0014] 根據(jù)本申請的實施例,在該方法中,對所述關(guān)聯(lián)詞項集合中的詞項進(jìn)行排序包括: 獲取與所述目標(biāo)用戶的喜好詞項語義相關(guān)的一個或多個語義集合,將獲取的每個語義集合 作為一個潛在語義類;計算在每個潛在語義類下所述目標(biāo)用戶與其關(guān)聯(lián)詞項集合中每個詞 項的相關(guān)程度,從而得到所述目標(biāo)用戶與其每個詞項的相關(guān)性;以及根據(jù)得到的所述目標(biāo) 用戶與其每個詞項的相關(guān)性,對所述目標(biāo)用戶的關(guān)聯(lián)詞項集合中的詞項進(jìn)行排序。
[0015] 根據(jù)本申請的實施例,在該方法中,對所述關(guān)聯(lián)詞項集合中的詞項進(jìn)行排序還包 括:對所述目標(biāo)用戶的喜好詞項按照每個喜好詞項在所述目標(biāo)用戶的行為中發(fā)生的權(quán)重進(jìn) 行排序;對所述目標(biāo)用戶的擴(kuò)展詞項按照所述目標(biāo)用戶與其每個擴(kuò)展詞項的相關(guān)性進(jìn)行排 序;以及按照對所述喜好詞項進(jìn)行排序的結(jié)果及對所述擴(kuò)展詞項進(jìn)行排序的結(jié)果,將所有 喜好詞項排至所有擴(kuò)展詞項之前。
[0016] 根據(jù)本申請的實施例,在該方法中,對所述目標(biāo)用戶的喜好詞項進(jìn)行排序包括:根 據(jù)所述每個喜好詞項在所述目標(biāo)用戶行為中產(chǎn)生的次數(shù)及產(chǎn)生的時間來確定所述每個喜 好詞項在所述目標(biāo)用戶的行為中發(fā)生的權(quán)重;按所述每個喜好詞項在所述目標(biāo)用戶的行為 中發(fā)生的權(quán)重對所述目標(biāo)用戶的喜好詞項進(jìn)行排序。
[0017] 根據(jù)本申請的另一方面,提供一種信息展示的設(shè)備,包括:集合建立模塊,用于根 據(jù)歷史日志,建立用戶的喜好詞項集合,并建立每個喜好詞項與內(nèi)容項的對應(yīng)關(guān)系;詞項擴(kuò) 展模塊,用于基于詞項的語義對當(dāng)前的目標(biāo)用戶的喜好詞項進(jìn)行擴(kuò)展,得到所述目標(biāo)用戶 的擴(kuò)展詞項,將所述喜好詞項和擴(kuò)展詞項作為所述目標(biāo)用戶對應(yīng)的關(guān)聯(lián)詞項集合;以及展 示模塊,用于按預(yù)定規(guī)則從所述關(guān)聯(lián)詞項集合中提取預(yù)定數(shù)量的詞項作為所述目標(biāo)用戶的 推薦詞項,并向所述目標(biāo)用戶展示與所述推薦詞項對應(yīng)的內(nèi)容項。
[0018] 與現(xiàn)有技術(shù)相比,根據(jù)本申請的技術(shù)方案,通過在用戶層和內(nèi)容項層之間建立一 個詞項層,將用戶歷史行為信息分割成若干用戶的喜好的詞項,并且將各個詞項與其最相 關(guān)的若干個內(nèi)容項綁定到一起,有效地利用了用戶自身的行為信息及用戶喜好的內(nèi)容項的 標(biāo)題及內(nèi)容屬性信息。并且,本申請基于語義對用戶的喜好詞項進(jìn)行擴(kuò)展,從而使得每個 用戶都有充足的可能感興趣的詞項,解決了用戶喜好詞項稀疏帶來的推薦精準(zhǔn)度較低的問 題。
【專利附圖】
【附圖說明】
[0019] 此處所說明的附圖用來提供對本申請的進(jìn)一步理解,構(gòu)成本申請的一部分,本申 請的示意性實施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:
[0020] 圖1是本申請實施例涉及的信息展示的方法的流程圖;
[0021] 圖2是本申請實施例的圖1中的步驟S101的具體流程圖;
[0022] 圖3是本申請實施例的圖1中的步驟S101的另一實施方式的具體流程圖;
[0023] 圖4是本申請實施例的圖1中的步驟S102的具體流程圖;
[0024] 圖5是本申請實施例通過引入潛在語義類建立用戶與詞項的關(guān)聯(lián)的示意圖;
[0025] 圖6是本申請實施例的圖1中的步驟S103的具體流程圖;
[0026] 圖7是本申請實施例的圖6中的步驟S601的具體流程圖;
[0027] 圖8是本申請實施例的圖6中的步驟S601的另一實施方式的具體流程圖;
[0028] 圖9是本申請實施例的圖8中的步驟S801的具體流程圖;以及
[0029] 圖10是本申請實施例涉及的信息展示的設(shè)備1000的框圖。
【具體實施方式】
[0030] 本申請的主要思想在于,提供一種信息展示的方法及設(shè)備,通過在用戶層和內(nèi)容 項層之間建立一個詞項層,將用戶歷史行為信息分割成若干用戶的喜好的詞項,并與其最 相關(guān)的若干個內(nèi)容項綁定到一起。并且,基于語義對用戶的喜好詞項進(jìn)行擴(kuò)展,從而使得每 個用戶都有充足的可能感興趣的詞項,進(jìn)而提高展示的內(nèi)容項的點擊率,解決用戶喜好詞 項稀疏帶來的推薦精準(zhǔn)度較低的問題。
[0031] 為使本申請的目的、技術(shù)方案和優(yōu)點更加清楚,以下結(jié)合附圖及具體實施例,對本 申請作進(jìn)一步地詳細(xì)說明。
[0032] 根據(jù)本申請的實施例,提供了一種信息展示的方法。
[0033] 參考圖1,圖1是本申請實施例涉及的信息展示方法的流程圖。如圖1所示,在步驟 S101中,根據(jù)歷史日志,建立所用戶的喜好詞項集合,并建立每個喜好詞項與內(nèi)容項的對應(yīng) 關(guān)系。所謂詞項(term)就是自然語言中,具有基本語意特征的文字片段。用戶輸入的文字、 網(wǎng)頁的標(biāo)題、文章的內(nèi)容、歌曲名稱等等都可以認(rèn)為是由詞項組成的。每一種語言中的詞項 是相對穩(wěn)定的集合,單個詞項包含的文字?jǐn)?shù)量比用戶搜索使用的關(guān)鍵詞信息(Query)、語句 等包含的文字?jǐn)?shù)量一般要小,可節(jié)約存儲空間,同時詞項比更小的語言元素(單個漢字或 英語中的字母)具有更豐富的表意性,因此,采用詞項表述用戶的興趣或偏好。為有效利用 用戶本身的行為及用戶喜好的內(nèi)容項(商品頁面、廣告信息、音視頻節(jié)目、新聞、文檔或其他 類型的信息)的自身內(nèi)容屬性,如用戶搜索的信息,用戶點擊的頁面信息等內(nèi)容項的標(biāo)題、 描述等,在用戶與內(nèi)容項(item)之間引入詞項層,即建立目標(biāo)用戶的喜好詞項的集合。
[0034] 圖2為圖1中的步驟S101的一種具體流程圖,如圖2所示,包括步驟S201-S203。
[0035] 在步驟S201中,獲取所述目標(biāo)用戶的歷史行為信息。所述用戶的歷史行為信息包 括用戶歷史行為中的行為對象(即用戶行為所作用的對象)的描述信息,可以為如下信息中 的一項或多項:用戶點擊的內(nèi)容項的標(biāo)題或內(nèi)容描述、用戶搜索使用的關(guān)鍵詞信息、用戶瀏 覽的網(wǎng)頁標(biāo)簽、用戶收藏的內(nèi)容項的標(biāo)題或內(nèi)容描述。
[0036] 本申請中,通過所述目標(biāo)用戶的cookie記錄來標(biāo)識所述目標(biāo)用戶。通過識別 Cookie信息,可以識別用戶的唯一身份,還可以從cookie信息中獲取目標(biāo)用戶的行為信 息。
[0037] 在步驟S202中,對所述目標(biāo)用戶的歷史行為信息進(jìn)行分詞處理以提取出一個或 多個詞項作為所述目標(biāo)用戶的喜好詞項,并形成所述目標(biāo)用戶的喜好詞項集合。上述用戶 點擊、收藏的內(nèi)容項或標(biāo)簽、搜索使用的關(guān)鍵詞信息等都可能為用戶感興趣的內(nèi)容,將這些 內(nèi)容的標(biāo)題、標(biāo)簽或文字描述等通過分詞處理從而分割成多個詞項,并從中提取出若干核 心的詞項,所提取出的詞項可以為表示實際意義的所有詞項或部分出現(xiàn)頻率較高的詞項 (即出現(xiàn)頻率高于設(shè)定閾值的詞項),將這些詞項組成目標(biāo)用戶喜好的詞項的集合。
[0038] 在步驟S203中,通過將詞項與內(nèi)容項進(jìn)行匹配,將所述目標(biāo)用戶的喜好詞項集合 中的每個詞項與相關(guān)的內(nèi)容項進(jìn)行關(guān)聯(lián),并建立每個詞項與內(nèi)容項的對應(yīng)關(guān)系表。
[0039] 可以通過詞項與內(nèi)容項的描述信息的匹配建立詞項與內(nèi)容項的關(guān)聯(lián)關(guān)系。比如, 某一詞項出現(xiàn)在內(nèi)容項的標(biāo)題中,可以視為詞項與內(nèi)容項的標(biāo)題相匹配,也就是說,詞項與 內(nèi)容項有較高相關(guān)性,可建立目標(biāo)內(nèi)容項與詞項之間的綁定關(guān)系,建立每個詞項與內(nèi)容項 的對應(yīng)關(guān)系表。其中,根據(jù)詞項與內(nèi)容項的匹配,可以為一個詞項對應(yīng)多個相關(guān)的內(nèi)容項, 還可以為多個詞項對應(yīng)一個相關(guān)的內(nèi)容項,也可以為這兩種關(guān)系的融合,即多對多的關(guān)系, 也就是說,每個詞項對應(yīng)多個不同的相關(guān)的內(nèi)容項,而每個內(nèi)容項也都對應(yīng)多個不同的詞 項。而建立的詞項與內(nèi)容的對應(yīng)關(guān)系表,可以采用倒排索引的方式,以用戶喜好詞項作為索 弓丨,內(nèi)容項作為索引的目標(biāo),即建立詞項與內(nèi)容項的倒排表。如此一來,當(dāng)向目標(biāo)用戶進(jìn)行 展示時,就可以展示與目標(biāo)用戶喜好的詞項對應(yīng)的內(nèi)容項。
[0040] 可選地,步驟S101還可以采用聚類的方法提取用戶喜好詞項,也就是說,將與目 標(biāo)用戶行為相似的用戶的歷史行為信息也提取出來,與目標(biāo)用戶的歷史行為信息一起作為 所述目標(biāo)用戶的歷史行為信息。該步驟對于行為較少的用戶而言效果更佳。具體實施流程 圖可以參考圖3。
[0041] 如圖3所示,在步驟S301中,獲得所述目標(biāo)用戶的歷史行為信息和與所述目標(biāo)用 戶行為相似的其他用戶的歷史行為信息。
[0042] 在步驟S302中,對所述目標(biāo)用戶的歷史行為信息和與所述目標(biāo)用戶行為相似的 其他用戶的歷史行為信息進(jìn)行分詞處理以提取出一個或多個詞項作為所述目標(biāo)用戶的喜 好詞項,并形成所述目標(biāo)用戶的喜好詞項集合。
[0043] 在步驟S303中,通過詞項與內(nèi)容項的匹配,將所述目標(biāo)用戶的喜好詞項集合中的 每個詞項與相關(guān)的內(nèi)容項進(jìn)行關(guān)聯(lián),并建立每個詞項與內(nèi)容項的對應(yīng)關(guān)系表。
[0044] 在步驟S102中,基于詞項的語義對所述目標(biāo)用戶的喜好詞項進(jìn)行擴(kuò)展,得到所述 目標(biāo)用戶的擴(kuò)展詞項,將所述喜好詞項和擴(kuò)展詞項作為所述目標(biāo)用戶對應(yīng)的關(guān)聯(lián)詞項集 合。如果用戶行為過少,會導(dǎo)致從用戶的行為中提取出用戶的喜好詞項不足,因此,可以采 用基于語義的主題模型方法來對用戶喜好詞項集合進(jìn)行擴(kuò)展,例如,可以采用概率潛在語 義分析模型PLSA (Probabilistic Latent Semantic Analysis)、隱含狄利克雷分配模型 LDA (Latent Dirichlet Allocation)等。參考圖4,圖4為圖1中的步驟S102的一種具 體流程圖,包括步驟S401-S405。
[0045] 如圖4所示,在步驟S401中,將除所述目標(biāo)用戶外的其他用戶的喜好詞項作為所 述目標(biāo)用戶的備選詞項。具體的,可以是將與目標(biāo)用戶具有相同的特定特征的其他用戶的 喜好詞項作為所述目標(biāo)用戶的備選詞項。例如,對于某網(wǎng)站的某一目標(biāo)用戶,來源于該網(wǎng)站 的其他用戶的喜好詞項作為該用戶的備選詞項,這里,其他用戶與所述目標(biāo)用戶具有的相 同的特定特征即為兩者來源于同一網(wǎng)站。
[0046] 在步驟S402中,獲取與所述目標(biāo)用戶的喜好詞項語義相關(guān)的一個或多個語義集 合,將獲取的每個語義集合作為一個潛在語義類。語義集合,即為類別或?qū)傩韵嗤蛘咭饬x 相近的一些詞項組成的集合,例如,"牛仔褲"、"休閑褲"、"哈倫褲"、"鉛筆褲"等都屬于褲子 類,因此它們可以組成一個語義集合"褲子""直筒牛仔褲"、"微喇牛仔褲"、"小腳牛仔褲" 等都屬于牛仔褲,因此它們可以組成一個語義集合"牛仔褲","牛仔裙"、"襯衫"、"羊絨衫"、 "連衣裙"等都屬于衣服,因此它們可以組成一個語義集合"衣服"。在用戶與詞項之間引入 潛在語義層,也就是說,在用戶A與任意詞項之間的聯(lián)系中,引入一個或多個如上所述的語 義集合,這些語義集合可以為與目標(biāo)用戶A的喜好詞項語義相關(guān)的語義集合,例如,某一用 戶的喜好詞項有"休閑褲",則可以引入與"休閑褲"類似的"牛仔褲"集合,或者由于"牛仔 褲"類與"牛仔裙"類都屬于牛仔服飾類,因此,也可以引入"牛仔裙"集合。每個語義集合 可以作為一個潛在語義類,這樣就引入了一個或多個潛在語義類。
[0047] 圖5為通過引入潛在語義類建立用戶與詞項的關(guān)聯(lián)的示意圖,如圖5所示,通過引 入潛在語義類1、潛在語義類2、潛在語義類3、…、潛在語義類K,建立用戶1、用戶2、用戶 3、…、用戶n-1、用戶η與詞項1、詞項2、詞項3、…、詞項m-Ι、詞項m的關(guān)聯(lián),通過這些潛 在語義類,使得用戶不僅與自身行為中包含的詞項有聯(lián)系,且與其他用戶的喜好詞項同樣 具有聯(lián)系。
[0048] 在步驟S403中,計算在每個潛在語義類下,所述目標(biāo)用戶與其每個備選詞項的相 關(guān)程度,從而得到所述目標(biāo)用戶與其每個備選詞項的相關(guān)性。在引入了若干個潛在語義類 后,通過引入的潛在語義類,可以建立目標(biāo)用戶與其他用戶喜好詞項的聯(lián)系,即目標(biāo)用戶與 其備選詞項的聯(lián)系,進(jìn)而在每個潛在語義類下,計算目標(biāo)用戶與其備選詞項的相關(guān)程度,從 而綜合在每個潛在語義類下目標(biāo)用戶與備選詞項的相關(guān)程度,得到目標(biāo)用戶與其任意備選 詞項的相關(guān)性。
[0049] 例如,采用PLSA主題模型時,用戶A與任意備選詞項term B的相關(guān)性,即用戶A 對備選詞項term B的喜好程度,可由公式(1)來定義,即設(shè)潛在語義層一共有K個潛在語 義類,則可將用戶A與備選詞項term B之間的喜好程度,抽象到如下公式(1):
[0050]
【權(quán)利要求】
1. 一種信息展示的方法,其特征在于,包括: 根據(jù)歷史日志,建立用戶的喜好詞項集合,并建立每個喜好詞項與內(nèi)容項的對應(yīng)關(guān) 系; 基于詞項的語義對當(dāng)前的目標(biāo)用戶的喜好詞項進(jìn)行擴(kuò)展,得到所述目標(biāo)用戶的擴(kuò)展詞 項,將所述喜好詞項和擴(kuò)展詞項作為所述目標(biāo)用戶對應(yīng)的關(guān)聯(lián)詞項集合;以及 按預(yù)定規(guī)則從所述關(guān)聯(lián)詞項集合中提取預(yù)定數(shù)量的詞項作為所述目標(biāo)用戶的推薦詞 項,并向所述目標(biāo)用戶展示與所述推薦詞項對應(yīng)的內(nèi)容項。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:通過所述目標(biāo)用戶的cookie記 錄來標(biāo)識所述目標(biāo)用戶。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)歷史日志,建立用戶的喜好詞項集 合,并建立每個喜好詞項與內(nèi)容項的對應(yīng)關(guān)系包括: 獲得所述目標(biāo)用戶的歷史行為信息; 對所述目標(biāo)用戶的歷史行為信息進(jìn)行分詞處理以提取出一個或多個詞項作為所述目 標(biāo)用戶的喜好詞項,并形成所述目標(biāo)用戶的喜好詞項集合;以及 通過將詞項與內(nèi)容項進(jìn)行匹配,將所述目標(biāo)用戶的喜好詞項集合中的每個詞項與相關(guān) 的內(nèi)容項進(jìn)行關(guān)聯(lián),并建立每個喜好詞項與內(nèi)容項的對應(yīng)關(guān)系表。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)歷史日志,建立用戶的喜好詞項集 合,并建立每個喜好詞項與內(nèi)容項的對應(yīng)關(guān)系包括: 獲得所述目標(biāo)用戶的歷史行為信息和與所述目標(biāo)用戶行為相似的其他用戶的歷史行 為信息; 對所述目標(biāo)用戶的歷史行為信息和與所述目標(biāo)用戶行為相似的其他用戶的歷史行為 信息進(jìn)行分詞處理以提取出一個或多個詞項作為所述目標(biāo)用戶的喜好詞項,并形成所述目 標(biāo)用戶的喜好詞項集合;以及 通過將詞項與內(nèi)容項進(jìn)行匹配,將所述目標(biāo)用戶的喜好詞項集合中的每個詞項與相關(guān) 的內(nèi)容項進(jìn)行關(guān)聯(lián),并建立每個詞項與內(nèi)容項的對應(yīng)關(guān)系表。
5. 根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述歷史行為信息包括如下信息中的 一項或多項:用戶點擊的內(nèi)容項的標(biāo)題或內(nèi)容描述、用戶搜索使用的關(guān)鍵詞信息、用戶瀏覽 的網(wǎng)頁標(biāo)簽、用戶收藏的內(nèi)容項的標(biāo)題或內(nèi)容描述。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,基于詞項的語義對所述目標(biāo)用戶的喜好 詞項進(jìn)行擴(kuò)展,得到所述目標(biāo)用戶的擴(kuò)展詞項包括: 將除所述目標(biāo)用戶外的其他用戶的喜好詞項作為所述目標(biāo)用戶的備選詞項; 獲取與所述目標(biāo)用戶的喜好詞項語義相關(guān)的一個或多個語義集合,將獲取的每個語義 集合作為一個潛在語義類; 計算在每個潛在語義類下,所述目標(biāo)用戶與其每個備選詞項的相關(guān)程度,從而得到所 述目標(biāo)用戶與其每個備選詞項的相關(guān)性; 根據(jù)得到的所述目標(biāo)用戶與其每個備選詞項的相關(guān)性,對所述目標(biāo)用戶的備選詞項進(jìn) 行排序;以及 根據(jù)對所述備選詞項進(jìn)行排序的結(jié)果選取預(yù)定數(shù)量的備選詞項作為所述目標(biāo)用戶的 擴(kuò)展詞項。
7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,按預(yù)定規(guī)則從所述關(guān)聯(lián)詞項集合中選取 預(yù)定數(shù)量的詞項作為所述目標(biāo)用戶的推薦詞項,并向所述目標(biāo)用戶展示與所述推薦詞項對 應(yīng)的內(nèi)容項包括: 對所述關(guān)聯(lián)詞項集合中的詞項進(jìn)行排序; 根據(jù)所述排序的結(jié)果選取預(yù)定數(shù)量的詞項作為所述目標(biāo)用戶的推薦詞項;以及 向所述目標(biāo)用戶展示與所述用戶的推薦詞項對應(yīng)的內(nèi)容項。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,對所述關(guān)聯(lián)詞項集合中的詞項進(jìn)行排序 包括: 獲取與所述目標(biāo)用戶的喜好詞項語義相關(guān)的一個或多個語義集合,將獲取的每個語義 集合作為一個潛在語義類; 計算在每個潛在語義類下所述目標(biāo)用戶與其關(guān)聯(lián)詞項集合中每個詞項的相關(guān)程度,從 而得到所述目標(biāo)用戶與其每個詞項的相關(guān)性;以及 根據(jù)得到的所述目標(biāo)用戶與其每個詞項的相關(guān)性,對所述目標(biāo)用戶的關(guān)聯(lián)詞項集合中 的詞項進(jìn)行排序。
9. 根據(jù)權(quán)利要求7所述的方法,其特征在于,對所述關(guān)聯(lián)詞項集合中的詞項進(jìn)行排序 還包括: 對所述目標(biāo)用戶的喜好詞項按照每個喜好詞項在所述目標(biāo)用戶的行為中發(fā)生的權(quán)重 進(jìn)行排序; 對所述目標(biāo)用戶的擴(kuò)展詞項按照所述目標(biāo)用戶與其每個擴(kuò)展詞項的相關(guān)性進(jìn)行排序; 以及 按照對所述喜好詞項進(jìn)行排序的結(jié)果及對所述擴(kuò)展詞項進(jìn)行排序的結(jié)果,將所有喜好 詞項排至所有擴(kuò)展詞項之前。
10. 根據(jù)權(quán)利要求9所述的方法,其中,對所述目標(biāo)用戶的喜好詞項進(jìn)行排序包括: 根據(jù)所述每個喜好詞項在所述目標(biāo)用戶行為中產(chǎn)生的次數(shù)及產(chǎn)生的時間來確定所述 每個喜好詞項在所述目標(biāo)用戶的行為中發(fā)生的權(quán)重; 按所述每個喜好詞項在所述目標(biāo)用戶的行為中發(fā)生的權(quán)重對所述目標(biāo)用戶的喜好詞 項進(jìn)行排序。
11. 一種信息展示的設(shè)備,其特征在于,包括: 集合建立模塊,用于根據(jù)歷史日志,建立用戶的喜好詞項集合,并建立每個喜好詞項與 內(nèi)容項的對應(yīng)關(guān)系; 詞項擴(kuò)展模塊,用于基于詞項的語義對當(dāng)前的目標(biāo)用戶的喜好詞項進(jìn)行擴(kuò)展,得到所 述目標(biāo)用戶的擴(kuò)展詞項,將所述喜好詞項和擴(kuò)展詞項作為所述目標(biāo)用戶對應(yīng)的關(guān)聯(lián)詞項集 合;以及 展示模塊,用于按預(yù)定規(guī)則從所述關(guān)聯(lián)詞項集合中提取預(yù)定數(shù)量的詞項作為所述目標(biāo) 用戶的推薦詞項,并向所述目標(biāo)用戶展示與所述推薦詞項對應(yīng)的內(nèi)容項。
12. 根據(jù)權(quán)利要求11所述的設(shè)備,其特征在于,所述設(shè)備還包括:標(biāo)識模塊,用于通過 所述目標(biāo)用戶的cookie記錄來標(biāo)識所述目標(biāo)用戶。
13. 根據(jù)權(quán)利要求11所述的設(shè)備,其特征在于,所述集合建立模塊包括: 信息獲得模塊,用于獲得所述目標(biāo)用戶的歷史行為信息; 喜好詞項提取模塊,用于對所述目標(biāo)用戶的歷史行為信息進(jìn)行分詞處理以提取出一個 或多個詞項作為所述目標(biāo)用戶的喜好詞項,并形成所述目標(biāo)用戶的喜好詞項集合;以及 關(guān)聯(lián)模塊,用于通過將詞項與內(nèi)容項進(jìn)行匹配,將所述目標(biāo)用戶的喜好詞項集合中的 每個詞項與相關(guān)的內(nèi)容項進(jìn)行關(guān)聯(lián),并建立每個喜好詞項與內(nèi)容項的對應(yīng)關(guān)系表。
14. 根據(jù)權(quán)利要求11所述的設(shè)備,其特征在于,所述集合建立模塊包括: 信息獲得模塊,用于獲得所述目標(biāo)用戶的歷史行為信息和與所述目標(biāo)用戶行為相似的 其他用戶的歷史行為信息; 詞項提取模塊,用于對所述目標(biāo)用戶的歷史行為信息和與所述目標(biāo)用戶行為相似的其 他用戶的歷史行為信息進(jìn)行分詞處理以提取出一個或多個詞項作為所述目標(biāo)用戶的喜好 詞項,并形成所述目標(biāo)用戶的喜好詞項集合;以及 關(guān)聯(lián)模塊,用于通過將詞項與內(nèi)容項進(jìn)行匹配,將所述目標(biāo)用戶的喜好詞項集合中的 每個詞項與相關(guān)的內(nèi)容項進(jìn)行關(guān)聯(lián),并建立每個詞項與內(nèi)容項的對應(yīng)關(guān)系表。
15. 根據(jù)權(quán)利要求13或14所述的設(shè)備,其特征在于,所述信息獲得模塊獲得的所述歷 史行為信息包括如下信息中的一項或多項:用戶點擊的內(nèi)容項的標(biāo)題或內(nèi)容描述、用戶搜 索使用的關(guān)鍵詞信息、用戶瀏覽的網(wǎng)頁標(biāo)簽、用戶收藏的內(nèi)容項的標(biāo)題或內(nèi)容描述。
16. 根據(jù)權(quán)利要求11所述的設(shè)備,其特征在于,所述詞項擴(kuò)展模塊還包括: 備選詞項獲得模塊,用于將除所述目標(biāo)用戶外的其他用戶的喜好詞項作為所述目標(biāo)用 戶的備選詞項; 潛在語義類獲取模塊,用于獲取與所述目標(biāo)用戶的喜好詞項語義相關(guān)的一個或多個語 義集合,將獲取的每個語義集合作為一個潛在語義類; 相關(guān)性計算模塊,用于計算在每個潛在語義類下,所述目標(biāo)用戶與其每個備選詞項的 相關(guān)程度,從而得到所述目標(biāo)用戶與其每個備選的詞項的相關(guān)性; 備選詞項排序模塊,用于根據(jù)得到的所述目標(biāo)用戶與其每個備選詞項的相關(guān)性,對所 述目標(biāo)用戶的備選詞項進(jìn)行排序;以及 擴(kuò)展詞項選取模塊,用于根據(jù)對所述備選詞項進(jìn)行排序的結(jié)果選取預(yù)定數(shù)量的備選詞 項作為所述目標(biāo)用戶的擴(kuò)展詞項。
17. 根據(jù)權(quán)利要求11所述的設(shè)備,其特征在于,所述展示模塊包括: 詞項排序模塊,用于對所述關(guān)聯(lián)詞項集合中的詞項進(jìn)行排序; 推薦詞項選取模塊,用于根據(jù)所述排序的結(jié)果選取預(yù)定數(shù)量的詞項作為所述目標(biāo)用戶 的推薦詞項;以及 內(nèi)容項展示模塊,用于向所述目標(biāo)用戶展示與所述用戶的推薦詞項對應(yīng)的內(nèi)容項。
18. 根據(jù)權(quán)利要求17所述的設(shè)備,其特征在于,所述詞項排序模塊包括: 獲取模塊,用于獲取與所述目標(biāo)用戶的喜好詞項語義相關(guān)的一個或多個語義集合,將 獲取的每個語義集合作為一個潛在語義類; 計算模塊,用于計算在每個潛在語義類下所述目標(biāo)用戶與其關(guān)聯(lián)詞項集合中每個詞項 的相關(guān)程度,從而得到所述目標(biāo)用戶與其每個詞項的相關(guān)性;以及 第一排序模塊,用于根據(jù)得到的所述目標(biāo)用戶與其每個詞項的相關(guān)性,對所述目標(biāo)用 戶的關(guān)聯(lián)詞項集合中的詞項進(jìn)行排序。
19. 根據(jù)權(quán)利要求17所述的設(shè)備,其中,所述詞項排序模塊還包括: 喜好詞項排序模塊,用于對所述目標(biāo)用戶的喜好詞項按照每個喜好詞項在所述目標(biāo)用 戶的行為中發(fā)生的權(quán)重進(jìn)行排序; 擴(kuò)展詞項排序模塊,用于對所述目標(biāo)用戶的擴(kuò)展詞項按照所述目標(biāo)用戶與其每個擴(kuò)展 詞項的相關(guān)性進(jìn)行排序;以及 第二排序模塊,用于按照所述喜好詞項及擴(kuò)展詞項各自的排序結(jié)果,將所有喜好詞項 排至所有擴(kuò)展詞項之前。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其中,喜好詞項排序模塊包括: 權(quán)重確定子模塊,用于根據(jù)所述每個喜好詞項在所述目標(biāo)用戶行為中產(chǎn)生的次數(shù)及產(chǎn) 生的時間來確定所述每個喜好詞項在所述目標(biāo)用戶的行為中發(fā)生的權(quán)重; 排序子模塊,用于按所述每個喜好詞項在所述目標(biāo)用戶的行為中發(fā)生的權(quán)重對所述目 標(biāo)用戶的喜好詞項進(jìn)行排序。
【文檔編號】G06F17/30GK104111941SQ201310136190
【公開日】2014年10月22日 申請日期:2013年4月18日 優(yōu)先權(quán)日:2013年4月18日
【發(fā)明者】吳黎霞 申請人:阿里巴巴集團(tuán)控股有限公司