亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用戶(hù)興趣模型更新方法及相關(guān)裝置制造方法

文檔序號(hào):6633440閱讀:427來(lái)源:國(guó)知局
用戶(hù)興趣模型更新方法及相關(guān)裝置制造方法
【專(zhuān)利摘要】本發(fā)明實(shí)施例公開(kāi)了用戶(hù)興趣模型更新方法及相關(guān)裝置。用戶(hù)興趣模型通過(guò)概念層次樹(shù)表示,概念層次樹(shù)按概念層次由高至低包括興趣簇、興趣類(lèi)和興趣關(guān)鍵詞,一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多個(gè)興趣類(lèi)歸屬于同一興趣簇;方法包括:將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出興趣關(guān)鍵詞;對(duì)興趣關(guān)鍵詞聚類(lèi),得到至少一個(gè)興趣類(lèi);使用聚類(lèi)得到的興趣類(lèi)更新概念層次樹(shù)。可見(jiàn),在本發(fā)明實(shí)施例中,根據(jù)用戶(hù)的操作行為提取興趣關(guān)鍵詞,對(duì)新增信息(興趣關(guān)鍵詞)進(jìn)行聚類(lèi),使新增信息不至于雜亂無(wú)序得存在于用戶(hù)興趣模型中。新增信息即使較多,但聚類(lèi)后,得到的類(lèi)別的數(shù)目要遠(yuǎn)小于新增信息的數(shù)目,從而可減少對(duì)用戶(hù)興趣表達(dá)的準(zhǔn)確度的影響。
【專(zhuān)利說(shuō)明】用戶(hù)興趣模型更新方法及相關(guān)裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通信【技術(shù)領(lǐng)域】,具體涉及用戶(hù)興趣模型更新方法及相關(guān)裝置。

【背景技術(shù)】
[0002] 用戶(hù)推薦裝置可向用戶(hù)自動(dòng)推薦可能感興趣的網(wǎng)站、文章、新聞、商品等推薦信 息。當(dāng)前通信領(lǐng)域的用戶(hù)推薦裝置的推薦過(guò)程(例如數(shù)據(jù)分析平臺(tái)、推送平臺(tái))一般包含 用戶(hù)建模、項(xiàng)目匹配和推薦輸出三個(gè)階段。其中,用戶(hù)興趣建模在很大程度上決定了推薦的 成功率;用戶(hù)興趣建模是獲取和維護(hù)與用戶(hù)興趣、需求或習(xí)慣相關(guān)的知識(shí)的過(guò)程,其結(jié)果將 產(chǎn)生一個(gè)表示用戶(hù)特有興趣和需求的用戶(hù)興趣模型。
[0003] 當(dāng)用戶(hù)興趣發(fā)生改變時(shí),用戶(hù)興趣模型也需要進(jìn)行相應(yīng)的更新。用戶(hù)興趣建模更 新的一種現(xiàn)有方式是從用戶(hù)反饋中抽取新信息添加到用戶(hù)興趣模型中以更新用戶(hù)興趣模 型。在增加的新信息的數(shù)量比較多的情況下,用戶(hù)興趣模型對(duì)用戶(hù)興趣表達(dá)的準(zhǔn)確度就會(huì) 降低,進(jìn)而向用戶(hù)推薦的匹配項(xiàng)的精準(zhǔn)度就會(huì)受到影響。


【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的在于提供用戶(hù)模型更新方法及相關(guān)裝置,以解決在增加的新信息的 數(shù)量比較多的情況下,用戶(hù)興趣模型對(duì)用戶(hù)興趣表達(dá)的準(zhǔn)確度就會(huì)降低的問(wèn)題。
[0005] 本發(fā)明提供如下技術(shù)方案:
[0006] 根據(jù)本發(fā)明的第一方面,提供用戶(hù)興趣模型更新方法,所述用戶(hù)興趣模型通過(guò)概 念層次樹(shù)結(jié)構(gòu)表示,所述概念層次樹(shù)按概念層次由高至低包括興趣簇、興趣類(lèi)和興趣關(guān)鍵 詞,一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多個(gè)興趣類(lèi)歸屬于同一興趣簇;
[0007] 所述方法包括:
[0008] 將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,所述關(guān)鍵詞為興趣關(guān)鍵 詞;
[0009] 對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi);
[0010] 使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)。
[0011] 結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述用戶(hù)興趣模型包括短期興趣模 型和長(zhǎng)期興趣模型;所述概念層次樹(shù)中的興趣關(guān)鍵詞和表征用戶(hù)短期興趣方向的興趣類(lèi)被 記錄為歸屬于所述短期興趣模型;所述概念層次樹(shù)中的興趣簇被記錄為歸屬于所述長(zhǎng)期興 趣模型,或者,所述概念層次樹(shù)中的興趣簇和表征用戶(hù)長(zhǎng)期興趣方向的興趣類(lèi)被記錄為歸 屬于所述長(zhǎng)期興趣模型。
[0012] 結(jié)合第一方面或第一方面第一種可能的實(shí)現(xiàn)方式,在使用聚類(lèi)得到的興趣類(lèi)更新 所述概念層次樹(shù)之后,所述方法還包括:確定更新后的概念層次樹(shù)中所述聚類(lèi)得到的興趣 類(lèi)所歸屬的興趣簇;其中,確定出的興趣簇表示為增量興趣簇;使用所述增量興趣簇更新 所述更新后的概念層次樹(shù)。
[0013] 結(jié)合第一方面第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,每個(gè)興趣類(lèi) 對(duì)應(yīng)有持續(xù)時(shí)長(zhǎng)和關(guān)注度,所述關(guān)注度由該興趣類(lèi)下包含的各興趣關(guān)鍵詞的出現(xiàn)次數(shù)所決 定,所述持續(xù)時(shí)長(zhǎng)用于表征該興趣類(lèi)存在的時(shí)間跨度和在所述時(shí)間跨度內(nèi)用戶(hù)操作行為涉 及該興趣類(lèi)的頻率;所述時(shí)間跨度包括用戶(hù)操作行為首次涉及所述興趣類(lèi)的時(shí)間與用戶(hù)操 作行為最后一次涉及所述興趣類(lèi)的時(shí)間。
[0014] 結(jié)合第一方面第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,在所述概念 層次樹(shù)中不存在與所述聚類(lèi)得到的興趣類(lèi)同名的興趣類(lèi)時(shí),所述使用聚類(lèi)得到的興趣類(lèi)更 新所述概念層次樹(shù)包括:在所述概念層次樹(shù)中添加所述聚類(lèi)得到的興趣類(lèi)及其下屬的興趣 關(guān)鍵詞。
[0015] 結(jié)合第一方面第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,在所述概念 層次樹(shù)中添加所述聚類(lèi)得到的興趣類(lèi)及其下屬的興趣關(guān)鍵詞之后,所述方法還包括:將所 添加的、所述聚類(lèi)得到的興趣類(lèi)記錄為歸屬于短期興趣模型。
[0016] 結(jié)合第一方面第三種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,在所述概念 層次樹(shù)中存在與所述聚類(lèi)得到的興趣類(lèi)同名的興趣類(lèi)時(shí),所述使用聚類(lèi)得到的興趣類(lèi)更新 所述概念層次樹(shù)包括:將所述聚類(lèi)得到的興趣類(lèi)與所述同名的興趣類(lèi)合并,得到合并后的 興趣類(lèi);更新所述合并后的興趣類(lèi)對(duì)應(yīng)的持續(xù)時(shí)長(zhǎng)及關(guān)注度。
[0017] 結(jié)合第一方面第六種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,在使用聚類(lèi) 得到的興趣類(lèi)更新所述概念層次樹(shù)之后,所述方法還包括:在合并后的興趣類(lèi)的持續(xù)時(shí)長(zhǎng) 達(dá)到轉(zhuǎn)換閾值時(shí),將持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值的所述興趣類(lèi)記錄為歸屬于長(zhǎng)期興趣模型。
[0018] 結(jié)合第一方面第三種可能的實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,所述概念層 次樹(shù)中已存在的興趣簇和所述增量興趣簇各自均對(duì)應(yīng)關(guān)注度,所述已存在的興趣簇對(duì)應(yīng)的 關(guān)注度由所述已存在的興趣簇下包含的各興趣類(lèi)的關(guān)注度所決定;所述增量興趣簇對(duì)應(yīng)的 關(guān)注度由所述增量興趣簇下包含的各興趣類(lèi)的關(guān)注度所決定。
[0019] 結(jié)合第一方面第八種可能的實(shí)現(xiàn)方式,在第九種可能的實(shí)現(xiàn)方式中,在所述更新 后的概念層次樹(shù)中不存在與所述增量興趣簇同名的興趣簇時(shí),所述使用所述增量興趣簇更 新所述更新后的概念層次樹(shù)包括:向所述更新后的概念層次樹(shù)中添加所述增量興趣簇。
[0020] 結(jié)合第一方面第八種可能的實(shí)現(xiàn)方式,在第十種可能的實(shí)現(xiàn)方式中,在所述更新 后的概念層次樹(shù)中存在與所述增量興趣簇同名的興趣簇時(shí),所述使用所述增量興趣簇更新 所述更新后的概念層次樹(shù)包括:將所述增量興趣簇與同名的興趣簇合并,得到合并后的興 趣簇;所述增量興趣簇的關(guān)注度與同名興趣簇的關(guān)注度之和為合并后的興趣簇的關(guān)注度。
[0021] 結(jié)合第一方面第十種可能的實(shí)現(xiàn)方式,在第i^一種可能的實(shí)現(xiàn)方式中,所述增量 興趣簇表示為Un6w,所述Un6w的關(guān)注度表示為,所述增量興趣簇對(duì)應(yīng)的同名興趣簇 表示為u。,所述u。的關(guān)注度表示為,合并后的興趣簇的關(guān)注度表示為,則 =廠 >^仍?/^+(1_尸)><"^/^,_.,T 表示衰減因子。
[0022] 結(jié)合第一方面第九種或第十種可能的實(shí)現(xiàn)方式,在第十二種可能的實(shí)現(xiàn)方式中, 在向所述更新后的概念層次樹(shù)中添加所述增量興趣簇之后,或者,將所述增量興趣簇與同 名的興趣簇合并之后,所述方法還包括:去除關(guān)注度小于最低關(guān)注閾值的興趣簇。
[0023] 根據(jù)本發(fā)明的第二方面,提供一種用戶(hù)推薦方法,包括:
[0024] 更新用戶(hù)興趣模型;
[0025] 通過(guò)所述用戶(hù)興趣模型過(guò)濾推薦消息;
[0026] 將所述推薦消息推薦給用戶(hù);
[0027] 所述用戶(hù)興趣模型通過(guò)概念層次樹(shù)結(jié)構(gòu)表示,所述概念層次樹(shù)按概念層次由高至 低包括興趣簇、興趣類(lèi)和興趣關(guān)鍵詞,一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多 個(gè)興趣類(lèi)歸屬于同一興趣簇;
[0028] 所述更新用戶(hù)興趣模型包括:
[0029] 將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,所述關(guān)鍵詞為興趣關(guān)鍵 詞;
[0030] 對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi);
[0031] 使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)。
[0032] 根據(jù)本發(fā)明的第三方面,提供一種用戶(hù)興趣模型更新裝置,所述用戶(hù)興趣模型通 過(guò)概念層次樹(shù)結(jié)構(gòu)表示,所述概念層次樹(shù)按概念層次由高至低包括興趣簇、興趣類(lèi)和興趣 關(guān)鍵詞,一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多個(gè)興趣類(lèi)歸屬于同一興趣 簇;
[0033] 所述裝置包括:
[0034] 提取單元,用于將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,所述關(guān)鍵 詞為興趣關(guān)鍵詞;
[0035] 聚類(lèi)單元,用于對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi);
[0036] 第一更新單元,用于使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)。
[0037] 結(jié)合第三方面,在第一種可能的實(shí)現(xiàn)方式中,所述用戶(hù)興趣模型包括短期興趣模 型和長(zhǎng)期興趣模型;所述裝置還包括第一記錄單元和第二記錄單元,其中:第一記錄單元 用于,將所述概念層次樹(shù)中的興趣關(guān)鍵詞和表征用戶(hù)短期興趣方向的興趣類(lèi)記錄為歸屬于 所述短期興趣模型;第二記錄單元用于,將所述概念層次樹(shù)中的興趣簇記錄為歸屬于所述 長(zhǎng)期興趣模型,或者,將所述概念層次樹(shù)中的興趣簇和表征用戶(hù)長(zhǎng)期興趣方向的興趣類(lèi)記 錄為歸屬于所述長(zhǎng)期興趣模型。
[0038] 結(jié)合第三方面或第三方面第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中, 所述裝置還包括:確定單元,用于在所述第一更新單元使用聚類(lèi)得到的興趣類(lèi)更新所述概 念層次樹(shù)之后,確定更新后的概念層次樹(shù)中的興趣類(lèi)所歸屬的興趣族;其中,確定出的興趣 簇表示為增量興趣簇;第二更新單元,用于使用所述增量興趣簇更新所述更新后的概念層 次樹(shù)。
[0039] 結(jié)合第三方面第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,每個(gè)興趣類(lèi) 對(duì)應(yīng)有持續(xù)時(shí)長(zhǎng)和關(guān)注度,所述關(guān)注度由該興趣類(lèi)下包含的各興趣關(guān)鍵詞的出現(xiàn)次數(shù)所決 定,所述持續(xù)時(shí)長(zhǎng)用于表征該興趣類(lèi)存在的時(shí)間跨度和在所述時(shí)間跨度內(nèi)用戶(hù)操作行為涉 及該興趣類(lèi)的頻率;所述時(shí)間跨度包括用戶(hù)操作行為首次涉及所述興趣類(lèi)的時(shí)間與用戶(hù)操 作行為最后一次涉及所述興趣類(lèi)的時(shí)間。
[0040] 結(jié)合第三方面第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述第一更 新單元用于:在所述概念層次樹(shù)中存在與所述聚類(lèi)得到的興趣類(lèi)同名的興趣類(lèi)時(shí),將所述 聚類(lèi)得到的興趣類(lèi)與所述同名的興趣類(lèi)合并,得到合并后的興趣類(lèi);更新所述合并后的興 趣類(lèi)對(duì)應(yīng)的持續(xù)時(shí)長(zhǎng)及關(guān)注度。
[0041] 結(jié)合第三方面第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,所述第二記 錄單元用于:在合并后的興趣類(lèi)的持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值時(shí),將持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值的 所述合并后的興趣類(lèi)記錄為歸屬于長(zhǎng)期興趣模型。
[0042] 結(jié)合第三方面第三種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述概念層 次樹(shù)中已存在的興趣簇和所述增量興趣簇各自均對(duì)應(yīng)關(guān)注度,所述已存在的興趣簇對(duì)應(yīng)的 關(guān)注度由所述已存在的興趣簇下包含的各興趣類(lèi)的關(guān)注度所決定;所述增量興趣簇對(duì)應(yīng)的 關(guān)注度由所述增量興趣簇下包含的各興趣類(lèi)的關(guān)注度所決定。
[0043] 結(jié)合第三方面第六種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,所述第二更 新單元用于:在所述更新后的概念層次樹(shù)中不存在與所述增量興趣簇同名的興趣簇時(shí),向 所述更新后的概念層次樹(shù)中添加所述增量興趣簇。
[0044] 結(jié)合第三方面第六種可能的實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,所述第二更 新單元用于:在所述更新后的概念層次樹(shù)中存在與所述增量興趣簇同名的興趣簇時(shí),將所 述增量興趣簇與同名的興趣簇合并,得到合并后的興趣簇;所述增量興趣簇的關(guān)注度與同 名興趣簇的關(guān)注度之和為合并后的興趣簇的關(guān)注度。
[0045] 結(jié)合第三方面第七或第八種可能的實(shí)現(xiàn)方式,在第九種可能的實(shí)現(xiàn)方式中,還包 括:去除單元,用于在所述第二更新單元向所述更新后的概念層次樹(shù)中添加所述增量興趣 簇之后,或者,在所述第二更新單元將所述增量興趣簇與同名的興趣簇合并之后,去除關(guān)注 度小于最低關(guān)注閾值的興趣簇。
[0046] 根據(jù)本發(fā)明的第三方面,提供一種用戶(hù)推薦裝置,包括:
[0047] 用戶(hù)興趣模型更新裝置,用于更新用戶(hù)興趣模型;
[0048] 過(guò)濾裝置,用于通過(guò)所述用戶(hù)興趣模型過(guò)濾推薦消息;
[0049] 推薦裝置,用于將所述推薦消息推薦給用戶(hù);
[0050] 所述用戶(hù)興趣模型通過(guò)概念層次樹(shù)結(jié)構(gòu)表示,所述概念層次樹(shù)按概念層次由高至 低包括興趣簇、興趣類(lèi)和興趣關(guān)鍵詞,一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多 個(gè)興趣類(lèi)歸屬于同一興趣簇;
[0051] 所述用戶(hù)興趣模型更新裝置包括:
[0052] 提取單元,用于將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,所述關(guān)鍵 詞為興趣關(guān)鍵詞;
[0053] 聚類(lèi)單元,用于對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi);
[0054] 第一更新單元,用于使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)。
[0055] 可見(jiàn),在本發(fā)明實(shí)施例中,根據(jù)用戶(hù)的操作行為提取興趣關(guān)鍵詞,同時(shí)對(duì)新增信息 (興趣關(guān)鍵詞)進(jìn)行聚類(lèi)(歸類(lèi)),使新增信息不至于雜亂無(wú)序得存在于用戶(hù)興趣模型中。 新增信息即使較多,但聚類(lèi)后,得到的類(lèi)別的數(shù)目要遠(yuǎn)小于新增信息的數(shù)目,從而可減少對(duì) 用戶(hù)興趣表達(dá)的準(zhǔn)確度的影響。

【專(zhuān)利附圖】

【附圖說(shuō)明】
[0056] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用 的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本 領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的 附圖。
[0057] 圖Ia為本發(fā)明實(shí)施例提供的通用計(jì)算機(jī)結(jié)構(gòu)示例圖;
[0058] 圖Ib為本發(fā)明實(shí)施例提供的用戶(hù)興趣模型示例圖;
[0059] 圖2a_2c、圖5a_5c為本發(fā)明實(shí)施例提供的用戶(hù)興趣模型更新流程圖;
[0060] 圖3為本發(fā)明實(shí)施例提供的概念層次樹(shù)葉節(jié)點(diǎn)、父節(jié)點(diǎn)示例圖;
[0061] 圖4a_4b、圖6、圖8、圖9為本發(fā)明實(shí)施例提供的概念層次樹(shù)結(jié)構(gòu)示例圖;
[0062] 圖7為本發(fā)明實(shí)施例提供的增量興趣簇示意圖;
[0063] 圖10-13為本發(fā)明實(shí)施例提供的用戶(hù)興趣模型更新裝置結(jié)構(gòu)示例圖;
[0064] 圖14為本發(fā)明實(shí)施例提供的用戶(hù)興趣模型更新裝置或用戶(hù)推薦裝置通用硬件結(jié) 構(gòu)示例圖。

【具體實(shí)施方式】
[0065] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅 僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù) 人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。 [0066] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅 僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù) 人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。 [0067] 用戶(hù)推薦裝置可向用戶(hù)自動(dòng)推薦可能感興趣的網(wǎng)站、文章、新聞、商品等推薦信 息。當(dāng)前通信領(lǐng)域的用戶(hù)推薦裝置的推薦過(guò)程(例如數(shù)據(jù)分析平臺(tái)、推送平臺(tái))一般包含 用戶(hù)建模、項(xiàng)目匹配和推薦輸出三個(gè)階段。其中,用戶(hù)興趣建模在很大程度上決定了推薦的 成功率;用戶(hù)興趣建模是獲取和維護(hù)與用戶(hù)興趣、需求或習(xí)慣相關(guān)的知識(shí)的過(guò)程,其結(jié)果將 產(chǎn)生一個(gè)表示用戶(hù)特有興趣和需求的用戶(hù)興趣模型。
[0068] 項(xiàng)目匹配階段將以用戶(hù)興趣模型為依據(jù),運(yùn)用各種推薦技術(shù)尋找出與其相匹配的 項(xiàng)目,然后再推薦輸出給用戶(hù)。
[0069] 當(dāng)用戶(hù)興趣發(fā)生改變時(shí),用戶(hù)興趣模型也需要進(jìn)行相應(yīng)的更新。用戶(hù)興趣模型更 新的一種現(xiàn)有方式是從用戶(hù)反饋中抽取新信息添加到用戶(hù)模型中以更新用戶(hù)興趣模型。更 具體的,現(xiàn)有用戶(hù)模型更新可包括直接的信息增補(bǔ)以及涉及權(quán)重調(diào)整的信息增補(bǔ)兩種類(lèi) 型。
[0070] 其中,前者只是簡(jiǎn)單地添加了新信息,不會(huì)刪除或削減無(wú)效的舊信息,這樣將導(dǎo)致 推薦階段找出錯(cuò)誤的匹配項(xiàng)。
[0071] 后者會(huì)適當(dāng)調(diào)整用戶(hù)模型中新、舊信息的權(quán)重,使反映用戶(hù)最新偏好的新信息在 推薦中起到更為重要的作用,同時(shí)無(wú)效的舊信息將隨其權(quán)重的不斷減小而最終從模型中被 刪除。但推薦階段的匹配性能很容易受到被增加的新信息數(shù)量的影響。畢竟向用戶(hù)推薦的 匹配項(xiàng)數(shù)量是有限的(一般是5-10個(gè)),在增加的新信息的數(shù)量比較多的情況下,向用戶(hù)推 薦的匹配項(xiàng)的精準(zhǔn)度就會(huì)受到影響。
[0072] 本發(fā)明實(shí)施例要求保護(hù)用戶(hù)興趣模型更新方法。
[0073] 本方法可由基站、數(shù)據(jù)分析平臺(tái)、推送平臺(tái)等執(zhí)行。更具體的,可由數(shù)據(jù)分析平臺(tái)、 推送平臺(tái)等的服務(wù)器執(zhí)行。
[0074] 上述基站、服務(wù)器作為用戶(hù)興趣模型更新方法的執(zhí)行主體,其通用計(jì)算機(jī)結(jié)構(gòu)如 圖Ia所示,可包括總線、處理器101、存儲(chǔ)器102、通信接口 103、輸入設(shè)備104和輸出設(shè)備 105。處理器101、存儲(chǔ)器102、通信接口 103、輸入設(shè)備104和輸出設(shè)備105通過(guò)總線相互連 接。處理器101執(zhí)行存儲(chǔ)器102中所存放的程序代碼,可執(zhí)行本發(fā)明實(shí)施例要求保護(hù)的用 戶(hù)興趣模型更新方法。
[0075] 上述用戶(hù)興趣模型通過(guò)概念層次樹(shù)結(jié)構(gòu)表示。
[0076] 概念層次樹(shù)是基于本體論方法構(gòu)建的。樹(shù)中高層概念是低層概念的概括。
[0077] 圖Ib示出了用戶(hù)興趣模型(概念層次樹(shù))的一個(gè)簡(jiǎn)單的示例性結(jié)構(gòu),其概念層次 由高到低可包括:興趣簇、興趣類(lèi)、興趣關(guān)鍵詞。一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi), 一個(gè)或多個(gè)興趣類(lèi)歸屬于同一興趣簇。
[0078] 以圖Ib所示為例,"世界杯"是"國(guó)際足聯(lián)主席"、"烏龍球"、"帽子戲法"等(興趣 關(guān)鍵詞)的上層概念;"足球"是"世界杯"、"中超聯(lián)賽"等(興趣類(lèi))的上層概念,"運(yùn)動(dòng)" 是"足球"、"籃球"等(興趣簇)的上層概念。
[0079] 需要說(shuō)明的是,興趣簇之上還可有更上層的興趣簇。例如,足球這一興趣簇,其上 還有運(yùn)動(dòng)這一興趣簇。或者說(shuō),對(duì)于運(yùn)動(dòng)這一興趣簇,足球可視為它的興趣類(lèi)。
[0080] 其中,興趣簇一般可用于表征用戶(hù)的長(zhǎng)期興趣方向(長(zhǎng)期關(guān)注的主題)。興趣關(guān)鍵 詞和興趣類(lèi)一般用于表征用戶(hù)的短期興趣方向(即時(shí)興趣)。
[0081] 在本發(fā)明其他實(shí)施例中,用戶(hù)興趣模型在邏輯上可包括短期興趣模型和長(zhǎng)期興趣 模型。
[0082] 其中,概念層次樹(shù)中的興趣關(guān)鍵詞和表征用戶(hù)短期興趣方向的興趣類(lèi)被記錄為歸 屬短期興趣模型;
[0083] 而概念層次樹(shù)中的興趣簇則被記錄為歸屬于所述長(zhǎng)期興趣模型。
[0084] 當(dāng)然,在一些條件下,興趣類(lèi)也可由表征短期興趣方向轉(zhuǎn)變?yōu)楸碚鏖L(zhǎng)期興趣方向 (本文后續(xù)會(huì)進(jìn)行相關(guān)介紹),則在此情況下,概念層次樹(shù)中的興趣簇和表征用戶(hù)長(zhǎng)期興趣 方向的興趣類(lèi)被記錄為歸屬于長(zhǎng)期興趣模型。
[0085] 采用短期興趣方向(模型)和長(zhǎng)期興趣方向(模型)來(lái)混合表達(dá)用戶(hù)興趣,可使 用戶(hù)興趣的表達(dá)更為準(zhǔn)確。
[0086] 下面將介紹用戶(hù)興趣模型的具體更新(建立)流程。
[0087] 請(qǐng)參見(jiàn)圖2a,用戶(hù)興趣模型更新(建立)可包括如下步驟:
[0088] Sl :將用戶(hù)所有操作行為轉(zhuǎn)化為文本,從文本中提取關(guān)鍵詞(興趣關(guān)鍵詞)。
[0089] 用戶(hù)的所有操作行為會(huì)被記錄,并轉(zhuǎn)化為文本。
[0090] 以基站這一執(zhí)行主體為例,用戶(hù)的通話、短信、上網(wǎng)行為(例如瀏覽、點(diǎn)擊、評(píng)分、 評(píng)論、購(gòu)買(mǎi)等)均會(huì)被記錄,并轉(zhuǎn)化為文本。每隔一定時(shí)間,基站會(huì)進(jìn)行用戶(hù)興趣模型的更 新。例如,每周更新一次。此時(shí),會(huì)從一周內(nèi)記錄的文本中提取關(guān)鍵詞。
[0091] 如何轉(zhuǎn)化文本,以及如何提取關(guān)鍵詞可參考現(xiàn)有的方式,在此不作贅述。
[0092] 需要說(shuō)明的是,評(píng)分、評(píng)論、購(gòu)買(mǎi)明顯表征了用戶(hù)的即時(shí)興趣,而瀏覽、點(diǎn)擊則相對(duì) 不明顯(因?yàn)橛脩?hù)可能只是無(wú)目的的瀏覽、點(diǎn)擊),因此,本實(shí)施例采用了顯示加隱示的方 式采集用戶(hù)操作信息。
[0093] 在本發(fā)明其他實(shí)施例中,還可對(duì)提取出的興趣關(guān)鍵詞進(jìn)行過(guò)濾,以過(guò)濾掉常見(jiàn)詞 語(yǔ),保留重要的詞語(yǔ)。
[0094] 過(guò)濾方式可有多種,例如可米用 TF-IDF (term frequency - inverse document frequency)的計(jì)算方法進(jìn)行過(guò)濾。
[0095] TF-IDF實(shí)際上是TF*IDF,TF (詞頻,Term Frequency)表示詞條(關(guān)鍵詞)在文檔 d中出現(xiàn)的頻率,IDF(逆向文件頻率,Inverse Document Frequency)體現(xiàn)的是:如果包含 詞條的文檔越少,IDF越大,則說(shuō)明詞條具有很好的類(lèi)別區(qū)分能力。
[0096] TF可通過(guò)下式計(jì)算:
[0097] tJiJ _ V n UkJ
[0098] 式中,nu是某詞條(tj在某一特定文件Clj中的出現(xiàn)次數(shù),而分母則是在文件Cl j 中所有字詞的出現(xiàn)次數(shù)之和,i則表示文件七中所有字詞中的第i個(gè)。
[0099] IDF可通過(guò)下式計(jì)算: , \D\
[誦]峨:1〇g^^
[0101] 其中,Id I表示語(yǔ)料庫(kù)中的文件總數(shù),I Uiti G dj} I表示包含詞條ti的文件數(shù)目 (即nq尹0的文件數(shù)目)。若詞條\不在語(yǔ)料庫(kù)中,就會(huì)導(dǎo)致被除數(shù)為零,因此一般情況 下使用 l+l UAi G dj} I。
[0102] h 對(duì)應(yīng)的權(quán)重 tfidfu = tfi,jX idfp
[0103] 某一特定文件內(nèi)的高詞語(yǔ)頻率,以及該詞語(yǔ)在整個(gè)文件集合中的低文件頻率,可 以產(chǎn)生出高權(quán)重的TF-IDF。因此,TF-IDF傾向于過(guò)濾掉常見(jiàn)的詞語(yǔ),保留重要的詞語(yǔ)。
[0104] 可選擇tfidf^大于閾值的n個(gè)興趣關(guān)鍵詞進(jìn)行后續(xù)的聚類(lèi)。
[0105] S2 :對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi)。
[0106] 為與用戶(hù)興趣模型中已存在的興趣類(lèi)相區(qū)別,可將步驟S2中通過(guò)聚類(lèi)得到的興 趣類(lèi)稱(chēng)為新增興趣類(lèi)。
[0107] 其中,每一新增興趣類(lèi)包含多個(gè)提取出的興趣關(guān)鍵詞。無(wú)論是已存在的興趣類(lèi)還 是新增興趣類(lèi),均會(huì)對(duì)應(yīng)特征關(guān)鍵詞。
[0108] 上述特征關(guān)鍵詞為興趣類(lèi)的名稱(chēng),特征關(guān)鍵詞也是所對(duì)應(yīng)的興趣類(lèi)中各興趣關(guān)鍵 詞的上層概念。
[0109] 例如,提取出的興趣關(guān)鍵詞包含皇家馬德里、小組賽、國(guó)際米蘭、梅西、面膜、爽膚 水、精油。則會(huì)對(duì)這些興趣關(guān)鍵詞進(jìn)行聚類(lèi)。假定得到兩個(gè)新增興趣類(lèi),其中一個(gè)新增興趣 類(lèi)包含皇家馬德里、小組賽、國(guó)際米蘭、梅西,其特征關(guān)鍵詞為"歐冠"。另一個(gè)新增興趣類(lèi)包 含面膜、爽膚水、精油,該新增興趣類(lèi)的特征關(guān)鍵詞為"護(hù)膚"。
[0110] 請(qǐng)參見(jiàn)圖3,在概念層次樹(shù)中,興趣關(guān)鍵詞為葉節(jié)點(diǎn)(或稱(chēng)為兒節(jié)點(diǎn)),其上的父節(jié) 點(diǎn)(或稱(chēng)為上層節(jié)點(diǎn))為興趣類(lèi),以特征關(guān)鍵詞為興趣類(lèi)的名稱(chēng)。
[0111] 在具體實(shí)現(xiàn)時(shí),聚類(lèi)方式有多種。例如,可采用LDA (Latent Dirichlet Allocation,隱含狄利克雷分配模型)主題聚類(lèi)、PLSA(概率潛語(yǔ)義分析)主題聚類(lèi),根據(jù) LDA或PLSA聚類(lèi)得到的主題,可作為相應(yīng)興趣類(lèi)的特征關(guān)鍵詞。
[0112] 每一興趣類(lèi)會(huì)對(duì)應(yīng)一個(gè)滑動(dòng)時(shí)間窗,滑動(dòng)時(shí)間窗存儲(chǔ)的是該興趣類(lèi)的持續(xù)時(shí)長(zhǎng)。
[0113] 持續(xù)時(shí)長(zhǎng)用于表征興趣類(lèi)存在的時(shí)間跨度和在時(shí)間跨度內(nèi)用戶(hù)操作行為涉及興 趣類(lèi)的頻率。
[0114] 更具體的,時(shí)間跨度包括用戶(hù)操作行為首次涉及興趣類(lèi)的時(shí)間與用戶(hù)操作行為最 后一次(末次)涉及興趣類(lèi)的時(shí)間。
[0115] 例如,用戶(hù)首次看"足球"(興趣類(lèi))比賽的時(shí)間是2014年1月1日,末次看的時(shí) 間是2014年10月10日。那么2014年1月1日至2014年10月10日就是時(shí)間跨度。
[0116] 而在時(shí)間跨度內(nèi)用戶(hù)操作行為涉及興趣類(lèi)的頻率,可參考下例進(jìn)行理解:在時(shí)間 跨度2014年1月至2014年10月之間,用戶(hù)看了 27場(chǎng)足球比賽,則在上述時(shí)間跨度內(nèi),用 戶(hù)操作行為涉及"足球"這一興趣類(lèi)的頻率為3次/月。
[0117] 或者說(shuō),頻率也可表征每隔多長(zhǎng)時(shí)間用戶(hù)操作行為涉及興趣類(lèi),仍沿用前例,用戶(hù) 在2014年1月至2014年10月之間看了 27場(chǎng)足球比賽,則用戶(hù)的操作行為涉及興趣類(lèi)的 頻次為〇. 33月/次。
[0118] 更具體的,新增興趣類(lèi)對(duì)應(yīng)的時(shí)間跨度可包括在本更新周期內(nèi)用戶(hù)操作行為首次 涉及興趣類(lèi)的時(shí)間與用戶(hù)操作行為最后一次涉及興趣類(lèi)的時(shí)間。
[0119] 新增興趣類(lèi)對(duì)應(yīng)的在時(shí)間跨度內(nèi)用戶(hù)操作行為涉及興趣類(lèi)的頻率可參考下例進(jìn) 行理解:假定時(shí)間跨度為7天,用戶(hù)看了 2場(chǎng)足球比賽,則在上述時(shí)間跨度內(nèi)用戶(hù)操作行為 涉及"足球"這一興趣類(lèi)的頻率為3. 5次/天。
[0120] 同時(shí),每一興趣類(lèi)還對(duì)應(yīng)關(guān)注度??墒褂门d趣類(lèi)下的興趣關(guān)鍵詞的出現(xiàn)次數(shù)計(jì)算 興趣類(lèi)的關(guān)注度。最簡(jiǎn)單的方式就是將興趣類(lèi)下包含的各興趣關(guān)鍵詞的出現(xiàn)次數(shù)相加,相 加結(jié)果即為關(guān)注度?;蛘?,也可對(duì)出現(xiàn)次數(shù)進(jìn)行加權(quán)相加,加權(quán)相加結(jié)果作為關(guān)注度,在此 不作贅述。
[0121] 更具體的,新增興趣類(lèi)的關(guān)注度是本次更新周期內(nèi)各興趣關(guān)鍵詞的出現(xiàn)次數(shù)的相 加結(jié)果或加權(quán)相加結(jié)果。
[0122] S3 :使用新增興趣類(lèi)更新概念層次樹(shù)。
[0123] 此時(shí),可分兩種情況更新。
[0124] 第一種情況,概念層次樹(shù)中沒(méi)有與新增興趣類(lèi)同名的興趣類(lèi)。例如,新增興趣類(lèi)為 "歐冠",而請(qǐng)參見(jiàn)圖Ib所示的模型,沒(méi)有"歐冠"這一興趣類(lèi)。在第一種情況下,可直接在 概念層次樹(shù)中添加新增興趣類(lèi)"歐冠"及其下屬的興趣關(guān)鍵詞(請(qǐng)參見(jiàn)圖4a)。
[0125] 新增興趣類(lèi)的持續(xù)時(shí)長(zhǎng)如何確定請(qǐng)參見(jiàn)本文前述記載,在此不作贅述。
[0126] 也即,請(qǐng)參見(jiàn)圖2b,在概念層次樹(shù)中不存在與所述聚類(lèi)得到的興趣類(lèi)同名的興趣 類(lèi)時(shí),步驟S3可包括:
[0127] S31、在概念層次樹(shù)中添加聚類(lèi)得到的興趣類(lèi)及其下屬的興趣關(guān)鍵詞。
[0128] 第二種情況,概念層次樹(shù)中已存在與新增興趣類(lèi)同名的興趣類(lèi)。例如,得到的新增 興趣類(lèi)的名稱(chēng)為"歐冠",而概念層次樹(shù)中已有"歐冠"這一興趣類(lèi)。在此種情況下,可將新 增興趣類(lèi)與概念層次樹(shù)中的同名興趣類(lèi)進(jìn)行合并,得到合并后的興趣類(lèi),并更新合并后的 興趣類(lèi)對(duì)應(yīng)的持續(xù)時(shí)長(zhǎng)及關(guān)注度。
[0129] 也即,請(qǐng)參見(jiàn)圖2c,在概念層次樹(shù)中存在與所述聚類(lèi)得到的興趣類(lèi)同名的興趣類(lèi) 時(shí),步驟S3可包括:
[0130] S32、將聚類(lèi)得到的興趣類(lèi)與同名的興趣類(lèi)合并,得到合并后的興趣類(lèi);
[0131] 合并后的興趣類(lèi)包含新增興趣類(lèi)下屬的興趣關(guān)鍵詞,以及同名的興趣類(lèi)下屬的興 趣關(guān)鍵詞。
[0132] 例如,新增興趣類(lèi)中包含興趣關(guān)鍵詞"小組賽"和"皇家馬德里",其同名興趣類(lèi)下 包含興趣關(guān)鍵詞"小組賽"、"國(guó)際米蘭"和"梅西"。則合并后的興趣類(lèi)下包含"小組賽"、"皇 家馬德里""國(guó)際米蘭"和"梅西"四個(gè)興趣關(guān)鍵詞。
[0133] S33、更新合并后的興趣類(lèi)對(duì)應(yīng)的持續(xù)時(shí)長(zhǎng)及關(guān)注度。
[0134] 更具體的,合并后的興趣類(lèi)對(duì)應(yīng)的時(shí)間跨度的更新主要是對(duì)用戶(hù)操作行為最后一 次(末次)涉及興趣類(lèi)的時(shí)間進(jìn)行更新。
[0135] 例如,概念層次樹(shù)中已存在"足球"這一興趣類(lèi),其對(duì)應(yīng)的時(shí)間跨度為2014年1月 1日至2014年8月10日。而新增"足球"興趣類(lèi)對(duì)應(yīng)的時(shí)間跨度為2014年11月3日至 2014年11月9日。則合并后的興趣類(lèi)對(duì)應(yīng)的時(shí)間跨度為2014年1月1日至2014年11月 9曰。
[0136] 至于合并后的興趣類(lèi)所對(duì)應(yīng)的"頻率"也需重新計(jì)算。沿用前例來(lái)講,假定,用戶(hù) 在2014年1月1日至2014年8月10日之間看了 27場(chǎng)足球比賽,在2014年11月3日至 2014年11月9日之間看了 3場(chǎng)足球比賽。則在2014年1月1日至2014年11月9日之 間,用戶(hù)操作行為涉及"足球"這一興趣類(lèi)的頻率為3次/月。
[0137] 而合并后的興趣類(lèi)對(duì)應(yīng)的關(guān)注度,可為新增興趣類(lèi)的關(guān)注度與同名興趣類(lèi)的關(guān)注 度之和。
[0138] 此外,還要更新合并后的興趣類(lèi)下各興趣關(guān)鍵詞的出現(xiàn)次數(shù)。
[0139] 例如,新增興趣類(lèi)(名稱(chēng)為"歐冠")中,興趣關(guān)鍵詞"小組賽"的出現(xiàn)次數(shù)為10。 其同名興趣類(lèi)中"小組賽"的出現(xiàn)次數(shù)為5,則合并后,"小組賽"的出現(xiàn)次數(shù)更新為15。
[0140] 可見(jiàn),在本發(fā)明實(shí)施例中,會(huì)對(duì)新增信息(興趣關(guān)鍵詞)進(jìn)行聚類(lèi)(歸類(lèi)),使新增 信息不至于雜亂無(wú)序得存在于用戶(hù)興趣模型中。新增信息即使較多,但聚類(lèi)后,得到的類(lèi)別 的數(shù)目要遠(yuǎn)小于新增信息的數(shù)目,從而可減少對(duì)用戶(hù)興趣表達(dá)的準(zhǔn)確度的影響。
[0141] 由于興趣類(lèi)一般用于表征用戶(hù)短期興趣方向,因此,上述步驟S1-S3 -般為短期 興趣模型的更新步驟。
[0142] 在本發(fā)明其他實(shí)施例中,在步驟S31之后,上述方法還可包括如下步驟:
[0143] 將所添加的、聚類(lèi)得到的興趣類(lèi)記錄為歸屬于短期興趣模型。
[0144] 而若合并后的興趣類(lèi)中持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值,則合并后的興趣類(lèi)可用于表征用 戶(hù)長(zhǎng)期興趣方向。則可將該興趣類(lèi)歸屬于長(zhǎng)期興趣模型。
[0145] 因此,在本發(fā)明其他實(shí)施例中,在步驟S33之后,上述方法還可包括如下步驟:
[0146] 在合并后的興趣類(lèi)的持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值時(shí),將持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值的興趣 類(lèi)記錄為歸屬于長(zhǎng)期興趣模型。
[0147] 舉例來(lái)講,轉(zhuǎn)換閾值的時(shí)間跨度為3年,頻率為3次/月。如合并后的興趣類(lèi)(歐 冠)的時(shí)間跨度達(dá)到或超過(guò)3年,頻率達(dá)到或超過(guò)3次/月。則請(qǐng)參見(jiàn)圖4b (圖4b被虛線 框起來(lái)的部分為長(zhǎng)期興趣模型),則將"歐冠"這一興趣類(lèi)歸屬于長(zhǎng)期興趣模型。
[0148] 請(qǐng)參見(jiàn)圖5a,在本發(fā)明其他實(shí)施例中,上述所有實(shí)施例中的用戶(hù)興趣模型更新 (建立)還可包括如下步驟:
[0149] S4 :確定更新后的概念層次樹(shù)中興趣類(lèi)所歸屬的興趣簇。
[0150] 其中,確定出的興趣簇可稱(chēng)為增量興趣簇。
[0151] 在實(shí)際應(yīng)用中,步驟S4可具體包括:
[0152] 確定更新后的概念層次樹(shù)中聚類(lèi)得到的興趣類(lèi)所歸屬的興趣簇。例如,聚類(lèi)得到 了三個(gè)興趣類(lèi)"歐冠"、"世界杯"、"護(hù)膚"。可確定上述三個(gè)興趣類(lèi)所歸屬的興趣簇。
[0153] 或者,步驟S4也可具體包括:
[0154] 確定更新后的概念層次樹(shù)中的所有興趣類(lèi)所歸屬的興趣簇。
[0155] 也即,為"更新后的概念層次樹(shù)"中各興趣類(lèi)重新確定所歸屬的興趣簇。
[0156] 前述提及了,興趣簇之上還可有更上層的興趣簇。例如,足球這一興趣簇,其上還 有運(yùn)動(dòng)這一興趣簇?;蛘哒f(shuō),對(duì)于運(yùn)動(dòng)這一興趣簇,足球可視為它的興趣類(lèi)。
[0157] 則步驟S4還可涵蓋:確定更新后的概念層次樹(shù)中同一層次的興趣簇所歸屬的上 層興趣族。
[0158] 例如,請(qǐng)參見(jiàn)圖4b,步驟S4可用于確定"藍(lán)球"、"足球"、"數(shù)碼"、"IT產(chǎn)業(yè)"、"淘寶" 這些興趣簇所歸屬的上層興趣簇。
[0159] 在具體實(shí)施時(shí),可采用與步驟S3類(lèi)似的聚類(lèi)算法,例如LDA、PLSA對(duì)各興趣類(lèi)進(jìn)行 聚類(lèi),屬于同一類(lèi)的興趣類(lèi)構(gòu)成一個(gè)興趣簇。
[0160] 也可采用FPGrowth算法。
[0161] FPGrowth算法的思想基于項(xiàng)集、支持度。項(xiàng)的集合稱(chēng)為項(xiàng)集,如果項(xiàng)集I的相對(duì)支 持度滿(mǎn)足預(yù)定義的最小支持度閾值,則I是頻繁項(xiàng)集。
[0162] FPGrowth算法原理是:
[0163] 假定初始項(xiàng)集I = {a, b, c, d…可以組成的事務(wù)集T = {ab, ac, cd,abc.... . }, 事務(wù)集中的每一元素為一個(gè)子集/事務(wù),每一子集/事務(wù)包含初始項(xiàng)集中的至少兩個(gè)元素。
[0164] 例如,子集/事務(wù)ab包含初始項(xiàng)集I中的a和b,ab表征a和b在同一文本中出 現(xiàn),同理,子集/事務(wù)ac表示a和c在同一文本中出現(xiàn),以此類(lèi)推。
[0165] 事務(wù)集中子集所包含的項(xiàng)集元素的最大值可表示為N。以事務(wù)集T = {ab,ac,cd, abc}為例,貝U N = 3。
[0166] 現(xiàn)要找到集合S,S中的每一元素為一個(gè)子集/事務(wù),每一子集/事務(wù)包含初始項(xiàng) 集I中的至少兩個(gè)元素,并且,S中的元素在T里出現(xiàn)的頻率都達(dá)到一定的閾值。
[0167] 在本實(shí)施例中,初始項(xiàng)集中的元素為興趣類(lèi)的名稱(chēng),事務(wù)集中的元素來(lái)源于系統(tǒng) 記錄的所有文本。
[0168] 例如,初始項(xiàng)集I ={世界杯、歐冠、中超聯(lián)賽、數(shù)碼、IT產(chǎn)業(yè)、淘寶、亞馬遜},事務(wù) 集T ={世界杯歐冠、世界杯中超聯(lián)賽、世界杯歐冠中超聯(lián)賽、數(shù)碼IT產(chǎn)業(yè)、淘寶亞馬遜}。
[0169] 第一步:對(duì)I集合里的{a,b,c,d. .}和事務(wù)集T進(jìn)行判斷,從I中篩選出1階項(xiàng) 集,例如子集LI = {a,c,d,f,h},Ll中的元素在T里出現(xiàn)的頻率均達(dá)到一定閾值。
[0170] 舉例來(lái)講,項(xiàng)集I ={世界杯、歐冠、中超聯(lián)賽、數(shù)碼、IT產(chǎn)業(yè)、淘寶、亞馬遜},事務(wù) 集T ={世界杯歐冠、世界杯中超聯(lián)賽、世界杯歐冠中超聯(lián)賽、數(shù)碼IT產(chǎn)業(yè)、淘寶亞馬遜}, 篩選出的Ll ={世界杯、歐冠、數(shù)碼、IT產(chǎn)業(yè)、淘寶、亞馬遜}。
[0171] 第二步:對(duì)LI的元素進(jìn)行組合,生成2階候選項(xiàng)集H2 = {ac,ad,df?,…fh}, 對(duì)H2在和事務(wù)集T進(jìn)行判斷,從H2中篩選達(dá)到閾值的2階項(xiàng)集,例如2階項(xiàng)集L2 = {ac,df,dh,fh}。L2中的元素在T里的出現(xiàn)頻率均達(dá)到一定閾值。
[0172] 仍沿用前例,Ll ={世界杯、歐冠、數(shù)碼、IT產(chǎn)業(yè)、淘寶、亞馬遜},則H2 ={世界 杯歐冠、世界杯數(shù)碼、世界杯IT產(chǎn)業(yè)、世界杯淘寶、世界杯亞馬遜、歐冠數(shù)碼、歐冠IT產(chǎn)業(yè)、 歐冠淘寶、歐冠亞馬遜、數(shù)碼IT產(chǎn)業(yè)……}。
[0173] 篩選出的L2可為{世界杯歐冠、數(shù)碼IT產(chǎn)業(yè)、淘寶亞馬遜}。
[0174] 按上述方法一直類(lèi)推下去,直到n階候選項(xiàng)集中篩選不出滿(mǎn)足閾值的子集。
[0175] 這樣就找到了所有滿(mǎn)足閾值的集合LS,假定LS = {ac,df,dh,acd,acdh},則LS作 為概率頻繁模式項(xiàng)集。
[0176] LS中的元素對(duì)應(yīng)的上層概念可作為興趣簇的名稱(chēng)。這樣就把原始項(xiàng)集中的興趣類(lèi) 歸屬到了興趣簇??赏ㄟ^(guò)預(yù)設(shè)的匹配列表將LS中的元素與上層概念進(jìn)行匹配,在此不作贅 述。
[0177] 需要說(shuō)明的是,ac、dh、acd、acdh對(duì)應(yīng)同一個(gè)上層概念。
[0178] 請(qǐng)參見(jiàn)圖6,假定圖6中的各興趣簇的名稱(chēng)在經(jīng)過(guò)FPGrowth算法后得到的LS = {世界杯歐冠中超聯(lián)賽、世界杯歐冠、歐冠中超聯(lián)賽、數(shù)碼IT產(chǎn)業(yè)、淘寶亞馬遜},LS中各元 素對(duì)應(yīng)的上層概念分別為"足球"、"科技"、"購(gòu)物",并且,"足球"是"世界杯歐冠中超聯(lián)賽"、 "世界杯歐冠"和"歐冠中超聯(lián)賽"的上層概念。
[0179] 將對(duì)應(yīng)同一上層概念的興趣類(lèi)歸屬于同一興趣簇,并且,該興趣簇的名稱(chēng)即為該 上層概念。
[0180] 沿用前例,請(qǐng)參見(jiàn)圖7,將對(duì)應(yīng)"足球"的"世界杯"、"歐冠"和"中超聯(lián)賽"這三個(gè) 興趣類(lèi)歸屬于一個(gè)增量興趣簇,并且該增量興趣簇的名稱(chēng)為"足球";將"數(shù)碼"和"IT產(chǎn)業(yè)" 這兩個(gè)興趣類(lèi)歸屬于一個(gè)增量興趣簇,并且該興趣簇的名稱(chēng)為"科技";將"淘寶"和"亞馬 遜"這兩個(gè)興趣類(lèi)歸屬于一個(gè)增量興趣簇,并且該興趣簇的名稱(chēng)為"購(gòu)物"。
[0181] 同時(shí),將概率頻繁模式項(xiàng)集中不包含的初始項(xiàng)集元素對(duì)應(yīng)的興趣類(lèi)剪除。
[0182] 例如,LS = {ac,df,dh,acd,acdh},I = {a, b,c,d,e,f,g,h,1},則 "b"、"g"、"l" 并未包含在LS中,需將"b"、"g"、" I "對(duì)應(yīng)的興趣類(lèi)進(jìn)行剪枝。
[0183] 綜上,采用FPGrowth算法所對(duì)應(yīng)的步驟可包括:
[0184] 將興趣類(lèi)的名稱(chēng)作為初始項(xiàng)集中的元素;
[0185] 獲取事務(wù)集,所述事務(wù)集中的每一元素為一個(gè)子集,每一子集包含所述初始項(xiàng)集 中的至少兩個(gè)元素,表征所述至少兩個(gè)初始項(xiàng)集元素在同一文本中出現(xiàn);所述事務(wù)集中子 集所包含的項(xiàng)集元素的最大值為N ;
[0186] 從所述初始項(xiàng)集中篩選出一階項(xiàng)集,所述一階項(xiàng)集中的元素在所述事務(wù)集中的出 現(xiàn)頻率均達(dá)到預(yù)設(shè)頻率閾值;
[0187] 將所述一階項(xiàng)集中的元素進(jìn)行組合,得到i + 1階侯選集;所述i + 1階侯選集中每一 元素為一個(gè)子集,每一子集包含所述初始項(xiàng)集中的i+1個(gè)元素;i大于等于1,小于等于N ;
[0188] 在所述i + 1階侯選集中存在在所述事務(wù)集中的出現(xiàn)頻率達(dá)到預(yù)設(shè)頻率閾值的元 素時(shí),將所述i+1階侯選集中出現(xiàn)頻率均達(dá)到預(yù)設(shè)頻率閾值的元素添加至概率頻繁模式項(xiàng) 集,將i加1,返回將i階項(xiàng)集中元素進(jìn)行組合,得到i+1階侯選集的步驟;
[0189] 在所述i + 1階侯選集中不存在在所述事務(wù)集中的出現(xiàn)頻率達(dá)到預(yù)設(shè)頻率閾值的 元素時(shí),將概率頻繁模式項(xiàng)集中的元素對(duì)應(yīng)的上層概念作為增量興趣簇的名稱(chēng),將對(duì)應(yīng)同 一上層概念的興趣類(lèi)歸屬于同一增量興趣簇;
[0190] 將所述概率頻繁模式項(xiàng)集中不包含的初始項(xiàng)集元素所對(duì)應(yīng)的興趣類(lèi)剪除。
[0191] 需要說(shuō)明的是,在概念層次樹(shù)包含多層興趣簇時(shí),可直接將各層的興趣簇名稱(chēng)作 為初始項(xiàng)集中的元素,使用FPGrowth算法進(jìn)行聚類(lèi)。
[0192] S5 :使用增量興趣簇更新上述"更新后的概念層次樹(shù)"。
[0193] 考慮下述兩種情況:
[0194] 第一種情況:用戶(hù)興趣模型中不存在同名興趣簇:則在用戶(hù)興趣模型(長(zhǎng)期興趣 模型)中添加增量興趣簇。例如,增量興趣簇為"足球"、"科技"、"購(gòu)物",用戶(hù)興趣模型中不 存在與"足球"、"科技"、"購(gòu)物"同名的興趣簇,則可添加這幾個(gè)興趣簇,并將相應(yīng)的興趣類(lèi) 節(jié)點(diǎn)掛在其下(請(qǐng)參見(jiàn)圖8)。
[0195] 也即,請(qǐng)參見(jiàn)圖5b,在更新后的概念層次樹(shù)中不存在與增量興趣簇同名的興趣簇 時(shí),步驟S5可包括:
[0196] S51、向更新后的概念層次樹(shù)中添加增量興趣簇。
[0197] 在本發(fā)明其他實(shí)施例中,在步驟S51之后還可包括如下步驟:
[0198] 將添加的興趣簇記錄為歸屬于長(zhǎng)期興趣模型。
[0199] 第二種情況:用戶(hù)興趣模型(長(zhǎng)期興趣模型)中已存在同名興趣簇,例如已存在 "足球"、"科技"、"購(gòu)物"這幾個(gè)節(jié)點(diǎn),則請(qǐng)參見(jiàn)圖5c,步驟S5可包括 :
[0200] S52、將增量興趣簇與同名的興趣簇合并,得到合并后的興趣簇。增量興趣簇的關(guān) 注度與同名興趣簇的關(guān)注度之和為合并后的興趣簇的關(guān)注度。
[0201] 更具體的,所謂的合并,是將增量興趣簇下屬的興趣類(lèi)歸屬于同名興趣簇之下。
[0202] 需要說(shuō)明的是,可能會(huì)發(fā)生興趣類(lèi)改變歸屬的情況。例如,請(qǐng)參見(jiàn)圖9,"數(shù)碼"這 一興趣類(lèi),原與"淘寶"、"亞馬遜"一起歸屬于"購(gòu)物"。
[0203] 本次新增了 "IT產(chǎn)業(yè)"這一興趣類(lèi)。并且,在經(jīng)過(guò)FPGrowth算法后,得到的LS為 {世界杯歐冠中超聯(lián)賽、數(shù)碼IT產(chǎn)業(yè)、淘寶亞馬遜}。則"數(shù)碼"這一興趣類(lèi)將由歸屬于"購(gòu) 物",改為歸屬于"科技"。
[0204] 下面將介紹如何計(jì)算增量興趣簇的關(guān)注度和合并后的興趣簇的關(guān)注度。
[0205] 由于增量興趣簇下屬的各興趣類(lèi)都有自己的關(guān)注度,可將增量興趣簇下各興趣類(lèi) 的關(guān)注度疊加,將疊加結(jié)果作為增量興趣簇的關(guān)注度。
[0206] 如將增量興趣簇表示為Unrat,將Umw的關(guān)注度表示為CW?//,,將已存在的同 名興趣簇表示為u。,將u。的關(guān)注度表示為〇/?/<,將合并后的興趣簇的關(guān)注度表示為 Confitlm。
[0207] 貝忙0咕'〃〃,可通過(guò)〔0響乂=廠\〔0</"〇+(1-廠)\〔0/訴"_.計(jì)算。
[0208] 式中的T表示衰減因子。
[0209] 在本發(fā)明其他實(shí)施例中,T的取值范圍可為[0, 1]。
[0210] 而若概念層次樹(shù)中無(wú)同名興趣簇。例如,沒(méi)有"足球"這一興趣簇名稱(chēng),則C6^/z\ 可通過(guò)= .計(jì)算(對(duì)應(yīng)步驟S51)。
[0211] 在本發(fā)明其他實(shí)施例中,仍請(qǐng)參見(jiàn)圖5a,上述所有實(shí)施例在步驟S51或S52之后 (也即步驟S5),還可包括如下步驟:
[0212] S6 :從用戶(hù)模型中去除關(guān)注度小于最低關(guān)注閾值的興趣簇。
[0213] 興趣簇下的興趣類(lèi)、興趣關(guān)鍵詞也一并去除。例如,足球這一興趣簇被去除了,足 球下的世界杯等興趣類(lèi)也將一并去除。
[0214] 在本發(fā)明其他實(shí)施例中,還可自適應(yīng)調(diào)整長(zhǎng)期興趣模型和短期興趣模型在個(gè)性化 推薦系統(tǒng)中所占的比重。
[0215] 自適應(yīng)調(diào)整可由衰減因子和最低關(guān)注閾值的變化觸發(fā)。
[0216] 而衰減因子和最低關(guān)注閾值依人工設(shè)置而變化。
[0217] 在本發(fā)明其他實(shí)施例中,上述所有實(shí)施例在更新用戶(hù)興趣模型時(shí),還可包括如下 步驟:
[0218] 計(jì)算長(zhǎng)期興趣模型和短期興趣模型所占的比重。
[0219] 更具體的,可采用最小二乘法來(lái)確定長(zhǎng)期興趣模型和短期興趣模型在個(gè)性化推薦 系統(tǒng)中所占的比重。
[0220] 最小二乘法的方式如下:
[0221] 假定短期興趣模型中共有N個(gè)興趣類(lèi),其中第i個(gè)興趣類(lèi)的關(guān)注度為Xi,而第i 個(gè)興趣類(lèi)所歸屬的興趣簇的關(guān)注度可表示為 yi。需要注意的是,由于可能多個(gè)興趣類(lèi)對(duì)應(yīng) 同一興趣簇,例如,第1-3個(gè)興趣類(lèi)分別是世界杯、歐冠、中超聯(lián)賽,其均對(duì)應(yīng)足球這一興趣 簇,則X 1至X3對(duì)應(yīng)的Y1至y3是相等的。
[0222] Yi與Xi之間的關(guān)系用Yi = Sc^a1Xi表不??赏ㄟ^(guò)最小偏差平方和來(lái)獲取aQ和S 1 的具體取值。
[0223] 最小偏差平方和用公式表不為:-(a〇+aixi)]。
[0224] %和即為長(zhǎng)期興趣模型和短期興趣模型在個(gè)性化推薦系統(tǒng)中所占的比重。
[0225] 系統(tǒng)可將Btl和&1提供給用戶(hù)作為參考。
[0226] 用戶(hù)可參考系統(tǒng)給出的%和值,自行輸入數(shù)值,以調(diào)整長(zhǎng)期興趣模型和短期興 趣模型所占的比重。例如,計(jì)算得到的%等于0.2, &1等于0.8。用戶(hù)可根據(jù)需要,將%調(diào) 整為0.3,將&1調(diào)整為0.7。
[0227] %和&1的用處之一是,在項(xiàng)目匹配階段查找出匹配項(xiàng)后,將根據(jù)比重將匹配項(xiàng)推 薦輸出給用戶(hù)。
[0228] 例如,長(zhǎng)期興趣模型的比重為0. 3,短期興趣模型的比重為0. 7,則推薦給用戶(hù)的 匹配項(xiàng)中,有70%的匹配項(xiàng)對(duì)應(yīng)長(zhǎng)期興趣,而30%的匹配項(xiàng)對(duì)應(yīng)短期興趣。
[0229] 前述提及了,在持續(xù)時(shí)長(zhǎng)達(dá)到閾值時(shí),興趣類(lèi)可由表征短期興趣方向轉(zhuǎn)化為表征 長(zhǎng)期興趣方向。除此之外,還可根據(jù)用戶(hù)設(shè)置的%和將興趣類(lèi)由短期興趣方向轉(zhuǎn)化為長(zhǎng) 期興趣方向:由于關(guān)注度與出現(xiàn)次數(shù)有關(guān),因此,%和 &1確定后,可預(yù)測(cè)某一興趣類(lèi)中的興 趣關(guān)鍵詞再出現(xiàn)多少次該興趣類(lèi)可由表征短期興趣方向轉(zhuǎn)變?yōu)楸碚鏖L(zhǎng)期興趣,從而將該興 趣類(lèi)歸屬于長(zhǎng)期興趣模型。
[0230] 本發(fā)明還要求保護(hù)用戶(hù)推薦方法,本方法可由基站、數(shù)據(jù)分析平臺(tái)、推送平臺(tái)等執(zhí) 行。更具體的,可由數(shù)據(jù)分析平臺(tái)、推送平臺(tái)等的服務(wù)器執(zhí)行。上述基站、服務(wù)器等的通用 計(jì)算機(jī)結(jié)構(gòu)可參見(jiàn)圖la。在此不作贅述。
[0231] 上述用戶(hù)推薦方法可包括如下步驟:
[0232] 更新用戶(hù)興趣模型;
[0233] 通過(guò)用戶(hù)興趣模型過(guò)濾推薦消息;
[0234] 將推薦消息推薦給用戶(hù)。
[0235] 其中,上述用戶(hù)興趣模型通過(guò)概念層次樹(shù)結(jié)構(gòu)表示,上述概念層次樹(shù)按概念層次 由高至低包括興趣簇、興趣類(lèi)和興趣關(guān)鍵詞,一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一 個(gè)或多個(gè)興趣類(lèi)歸屬于同一興趣簇;
[0236] 上述更新用戶(hù)興趣模型包括:
[0237] 將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,上述關(guān)鍵詞為興趣關(guān)鍵 詞;
[0238] 對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi);
[0239] 使用聚類(lèi)得到的興趣類(lèi)更新上述概念層次樹(shù)。具體內(nèi)容請(qǐng)參見(jiàn)本文前述方法部分 的描述,在此不作贅述。
[0240] 本發(fā)明實(shí)施例所提供的技術(shù)方案,同樣也適用于用戶(hù)特征的分析場(chǎng)景。比如根據(jù) 用戶(hù)位置軌跡來(lái)分析用戶(hù)的職業(yè)特征的分析場(chǎng)景:
[0241] 通過(guò)對(duì)用戶(hù)位置在不同區(qū)域類(lèi)型的移動(dòng)軌跡,用戶(hù)興趣模型(這里可稱(chēng)為用戶(hù)位 置模型)可表征用戶(hù)所駐留的位置屬性,長(zhǎng)期興趣方向(模型)可表征用戶(hù)的長(zhǎng)期駐留區(qū) 域、短期興趣方向(模型)以及可表征用戶(hù)的短期駐留區(qū)域,以此可以找到用戶(hù)的駐留位置 特點(diǎn)并判斷其職業(yè)特征。同時(shí),通過(guò)實(shí)時(shí)更新,也保證了我們對(duì)用戶(hù)職業(yè)特征的有效跟蹤和 刷新。
[0242] 與之對(duì)應(yīng),本發(fā)明實(shí)施例還要求保護(hù)用戶(hù)興趣模型更新裝置。
[0243] 請(qǐng)參見(jiàn)圖10,上述用戶(hù)興趣模型更新裝置100可包括:
[0244] 提取單元1,用于將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,上述關(guān) 鍵詞為興趣關(guān)鍵詞;
[0245] 聚類(lèi)單元2,用于對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi);
[0246] 第一更新單元3,用于使用聚類(lèi)得到的興趣類(lèi)更新上述概念層次樹(shù)。
[0247] 具體內(nèi)容請(qǐng)參見(jiàn)本文前述記載,在此不作贅述。
[0248] 在本發(fā)明其他實(shí)施例中,上述所有實(shí)施例中的用戶(hù)興趣模型可包括短期興趣模型 和長(zhǎng)期興趣1吳型。
[0249] 請(qǐng)參見(jiàn)圖11,在本發(fā)明其他實(shí)施例中,上述所有實(shí)施例中的用戶(hù)興趣模型更新裝 置100還可包括第一記錄單元4和第二記錄單元5,其中:
[0250] 第一記錄單元4用于,將上述概念層次樹(shù)中的興趣關(guān)鍵詞和表征用戶(hù)短期興趣方 向的興趣類(lèi)記錄為歸屬于上述短期興趣模型。
[0251] 第二記錄單元5用于,將上述概念層次樹(shù)中的興趣簇記錄為歸屬于上述長(zhǎng)期興趣 模型,或者,
[0252] 將上述概念層次樹(shù)中的興趣簇和表征用戶(hù)長(zhǎng)期興趣方向的興趣類(lèi)記錄為歸屬于 上述長(zhǎng)期興趣模型。
[0253] 在本發(fā)明其他實(shí)施例中,請(qǐng)參見(jiàn)圖12,上述所有實(shí)施例中的用戶(hù)興趣模型更新裝 置100還可包括:
[0254] 確定單元6,用于在上述第一更新單元3使用聚類(lèi)得到的興趣類(lèi)更新上述概念層 次樹(shù)之后,確定更新后的概念層次樹(shù)中的興趣類(lèi)所歸屬的興趣族;其中,確定出的興趣族表 示為增量興趣簇;
[0255] 第二更新單元7,用于使用上述增量興趣簇更新上述更新后的概念層次樹(shù)。
[0256] 具體內(nèi)容請(qǐng)參見(jiàn)本文前述記載,在此不作贅述。
[0257] 每個(gè)興趣類(lèi)對(duì)應(yīng)有持續(xù)時(shí)長(zhǎng)和關(guān)注度,上述關(guān)注度由興趣類(lèi)下包含的各興趣關(guān)鍵 詞的出現(xiàn)次數(shù)所決定,上述持續(xù)時(shí)長(zhǎng)用于表征該興趣類(lèi)存在的時(shí)間跨度和在上述時(shí)間跨度 內(nèi)用戶(hù)操作行為涉及該興趣類(lèi)的頻率;上述時(shí)間跨度包括用戶(hù)操作行為首次涉及上述興趣 類(lèi)的時(shí)間與用戶(hù)操作行為最后一次涉及上述興趣類(lèi)的時(shí)間。
[0258] 在本發(fā)明其他實(shí)施例中,在上述使用聚類(lèi)得到的興趣類(lèi)更新上述概念層次樹(shù)的方 面,上述所有實(shí)施例中的第一更新單元3可用于 :
[0259] 在上述概念層次樹(shù)中不存在與上述聚類(lèi)得到的興趣類(lèi)同名的興趣類(lèi)時(shí),在上述概 念層次樹(shù)中添加上述聚類(lèi)得到的興趣類(lèi)及其下屬的興趣關(guān)鍵詞。
[0260] 需要說(shuō)明的是,在上述概念層次樹(shù)中不存在與上述聚類(lèi)得到的興趣類(lèi)同名的興趣 類(lèi)時(shí),上述聚類(lèi)得到的興趣類(lèi)表征用戶(hù)短期興趣方向。
[0261] 相應(yīng)的,在本發(fā)明其他實(shí)施例中,在將上述概念層次樹(shù)中的興趣關(guān)鍵詞和表征用 戶(hù)短期興趣方向的興趣類(lèi)記錄為歸屬于上述短期興趣模型的方面,上述所有實(shí)施例中的第 一記錄單元4可用于:
[0262] 將所添加的、上述聚類(lèi)得到的興趣類(lèi)記錄為歸屬于短期興趣模型。
[0263] 或者,在本發(fā)明其他實(shí)施例中,在上述使用聚類(lèi)得到的興趣類(lèi)更新上述概念層次 樹(shù)的方面,上述所有實(shí)施例中的第一更新單元3可用于 :
[0264] 在上述概念層次樹(shù)中存在與上述聚類(lèi)得到的興趣類(lèi)同名的興趣類(lèi)時(shí),將上述聚類(lèi) 得到的興趣類(lèi)與上述同名的興趣類(lèi)合并,得到合并后的興趣類(lèi);
[0265] 更新上述合并后的興趣類(lèi)對(duì)應(yīng)的持續(xù)時(shí)長(zhǎng)及關(guān)注度。
[0266] 而若合并后的興趣類(lèi)的持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值,則上述合并后的興趣類(lèi)表征用戶(hù) 長(zhǎng)期興趣方向。
[0267] 相應(yīng)的,在本發(fā)明其他實(shí)施例中,在將表征用戶(hù)長(zhǎng)期興趣方向的興趣類(lèi)記錄為歸 屬于上述長(zhǎng)期興趣模型的方面,上述所有實(shí)施例中的第二記錄單元5可用于:
[0268] 在合并后的興趣類(lèi)的持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值時(shí),將持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值的上述 合并后的興趣類(lèi)記錄為歸屬于長(zhǎng)期興趣模型。
[0269] 上述概念層次樹(shù)中已存在的興趣簇和上述增量興趣簇各自均對(duì)應(yīng)關(guān)注度,上述已 存在的興趣簇對(duì)應(yīng)的關(guān)注度由上述已存在的興趣簇下包含的各興趣類(lèi)的關(guān)注度所決定;上 述增量興趣簇對(duì)應(yīng)的關(guān)注度由上述增量興趣簇下包含的各興趣類(lèi)的關(guān)注度所決定。
[0270] 在本發(fā)明其他實(shí)施例中,在上述使用上述增量興趣簇更新上述更新后的概念層次 樹(shù)的方面,上述所有實(shí)施例中的第二更新單元7用于:
[0271] 在上述更新后的概念層次樹(shù)中不存在與上述增量興趣簇同名的興趣簇時(shí),向上述 更新后的概念層次樹(shù)中添加上述增量興趣簇。
[0272] 或者,上述第二更新單元7可用于:
[0273] 在上述更新后的概念層次樹(shù)中存在與上述增量興趣簇同名的興趣簇時(shí),將上述增 量興趣簇與同名的興趣簇合并,得到合并后的興趣簇;上述增量興趣簇的關(guān)注度與同名興 趣簇的關(guān)注度之和為合并后的興趣簇的關(guān)注度。
[0274] 在本發(fā)明其他實(shí)施例中,請(qǐng)參見(jiàn)圖13,上述所有實(shí)施例中的用戶(hù)興趣模型更新裝 置100還可包括:
[0275] 去除單元8,用于在上述第二更新單元7向上述更新后的概念層次樹(shù)中添加上述 增量興趣簇之后,或者,在上述第二更新單元7將上述增量興趣簇與同名的興趣簇合并之 后,去除關(guān)注度小于最低關(guān)注閾值的興趣簇。
[0276] 相應(yīng)的,本發(fā)明實(shí)施例還要求保護(hù)用戶(hù)推薦裝置,該系統(tǒng)可包括過(guò)濾裝置、推薦裝 置和前述的用戶(hù)興趣模型更新裝置。其中:
[0277] 用戶(hù)興趣模型更新裝置100,用于更新用戶(hù)興趣模型;
[0278] 過(guò)濾裝置,用于通過(guò)上述用戶(hù)興趣模型過(guò)濾推薦消息;
[0279] 推薦裝置,用于將上述推薦消息推薦給用戶(hù);
[0280] 上述用戶(hù)興趣模型更新裝置100的結(jié)構(gòu)可參見(jiàn)圖10-13及相關(guān)記載,在此不作贅 述。
[0281] 圖14示出了上述用戶(hù)興趣模型更新裝置或用戶(hù)推薦裝置的一種通用計(jì)算機(jī)系統(tǒng) 結(jié)構(gòu)。上述裝置可為主機(jī)、網(wǎng)關(guān)、用戶(hù)終端(UE)、基站等。
[0282] 更具體的,上述裝置可140包括總線、處理器141、存儲(chǔ)器142、通信接口 143、輸入 設(shè)備144和輸出設(shè)備145。處理器141、存儲(chǔ)器142、通信接口 143、輸入設(shè)備144和輸出設(shè) 備145通過(guò)總線相互連接。其中:
[0283] 總線可包括一通路,在計(jì)算機(jī)系統(tǒng)各個(gè)部件之間傳送信息。
[0284] 處理器141可以是通用處理器,例如通用中央處理器(CPU)、網(wǎng)絡(luò)處理器(Network Processor,簡(jiǎn)稱(chēng)NP)、微處理器等,也可以是特定應(yīng)用集成電路(application-specific integrated circuit, ASIC),或一個(gè)或多個(gè)用于控制本發(fā)明方案程序執(zhí)行的集成電路。還 可以是數(shù)字信號(hào)處理器(DSP)、專(zhuān)用集成電路(ASIC)、現(xiàn)成可編程門(mén)陣列(FPGA)或者其他 可編程邏輯器件、分立門(mén)或者晶體管邏輯器件、分立硬件組件。
[0285] 存儲(chǔ)器142中保存有執(zhí)行本發(fā)明技術(shù)方案的程序,還可以保存有操作系統(tǒng)和其他 應(yīng)用程序。具體地,程序可以包括程序代碼,程序代碼包括計(jì)算機(jī)操作指令。更具體的,存 儲(chǔ)器142可以是只讀存儲(chǔ)器(read-only memory,ROM)、可存儲(chǔ)靜態(tài)信息和指令的其他類(lèi)型 的靜態(tài)存儲(chǔ)設(shè)備、隨機(jī)存取存儲(chǔ)器(random access memory,RAM)、可存儲(chǔ)信息和指令的其 他類(lèi)型的動(dòng)態(tài)存儲(chǔ)設(shè)備、磁盤(pán)存儲(chǔ)器等等。
[0286] 輸入設(shè)備144可包括接收用戶(hù)輸入的數(shù)據(jù)和信息的裝置,例如鍵盤(pán)、鼠標(biāo)、攝像 頭、掃描儀、光筆、語(yǔ)音輸入裝置、觸摸屏等。
[0287] 輸出設(shè)備145可包括允許輸出信息給用戶(hù)的裝置,例如顯示屏、打印機(jī)、揚(yáng)聲器 等。
[0288] 通信接口 143可包括使用任何收發(fā)器一類(lèi)的裝置,以便與其他設(shè)備或通信網(wǎng)絡(luò)通 信,如以太網(wǎng),無(wú)線接入網(wǎng)(RAN),無(wú)線局域網(wǎng)(WLAN)等。
[0289] 在作為用戶(hù)興趣模型更新裝置時(shí),處理器141執(zhí)行存儲(chǔ)器142中所存放的程序代 碼,執(zhí)行以下操作以更新用戶(hù)興趣模型:
[0290] 將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,所述關(guān)鍵詞為興趣關(guān)鍵 詞;
[0291] 對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi);
[0292] 使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)。
[0293] 其中,用戶(hù)興趣模型可通過(guò)概念層次樹(shù)結(jié)構(gòu)表示,概念層次樹(shù)按概念層次由高至 低包括興趣簇、興趣類(lèi)和興趣關(guān)鍵詞,一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多 個(gè)興趣類(lèi)歸屬于同一興趣簇。
[0294] 在本發(fā)明其他實(shí)施例中,上述用戶(hù)興趣模型可包括短期興趣模型和長(zhǎng)期興趣模 型。
[0295] 上述概念層次樹(shù)中的興趣關(guān)鍵詞和表征用戶(hù)短期興趣方向的興趣類(lèi)被記錄為歸 屬于短期興趣模型;
[0296] 而概念層次樹(shù)中的興趣簇被記錄為歸屬于長(zhǎng)期興趣模型,或者,概念層次樹(shù)中的 興趣簇和表征用戶(hù)長(zhǎng)期興趣方向的興趣類(lèi)被記錄為歸屬于長(zhǎng)期興趣模型。
[0297] 在本發(fā)明其他實(shí)施例中,上述所有實(shí)施例中的處理器141執(zhí)行存儲(chǔ)器142中所存 放的程序代碼,還可執(zhí)行以下操作 :
[0298] 在使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)之后,確定更新后的概念層次樹(shù)中 聚類(lèi)得到的興趣類(lèi)所歸屬的興趣簇;其中,確定出的興趣簇表示為增量興趣簇;
[0299] 使用所述增量興趣簇更新所述更新后的概念層次樹(shù)。
[0300] 興趣類(lèi)對(duì)應(yīng)持續(xù)時(shí)長(zhǎng)和關(guān)注度。其中,關(guān)注度由興趣類(lèi)下包含的各興趣關(guān)鍵詞的 出現(xiàn)次數(shù)所決定,持續(xù)時(shí)長(zhǎng)用于表征所述興趣類(lèi)存在的時(shí)間跨度和在所述時(shí)間跨度內(nèi)用戶(hù) 操作行為涉及所述興趣類(lèi)的頻率,時(shí)間跨度包括用戶(hù)操作行為首次涉及所述興趣類(lèi)的時(shí)間 與用戶(hù)操作行為最后一次涉及所述興趣類(lèi)的時(shí)間。相關(guān)描繪請(qǐng)參見(jiàn)本文方法部分的記載, 在此不作贅述。
[0301] 在本發(fā)明其他實(shí)施例中,在所述概念層次樹(shù)中不存在與所述聚類(lèi)得到的興趣類(lèi)同 名的興趣類(lèi)時(shí),上述所有實(shí)施例中的處理器141執(zhí)行存儲(chǔ)器142中所存放的程序代碼,所執(zhí) 行的操作"使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)"可具體包括:
[0302] 在所述概念層次樹(shù)中添加所述聚類(lèi)得到的興趣類(lèi)及其下屬的興趣關(guān)鍵詞。
[0303] 此外,在本發(fā)明其他實(shí)施例中,上述所有實(shí)施例中的處理器141執(zhí)行存儲(chǔ)器142中 所存放的程序代碼,還可執(zhí)行以下操行 :
[0304] 將所添加的、所述聚類(lèi)得到的興趣類(lèi)記錄為歸屬于短期興趣模型。
[0305] 在本發(fā)明其他實(shí)施例中,在所述概念層次樹(shù)中存在與所述聚類(lèi)得到的興趣類(lèi)同名 的興趣類(lèi)時(shí),上述所有實(shí)施例中的處理器141執(zhí)行存儲(chǔ)器142中所存放的程序代碼,所執(zhí)行 的操作"使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)"可具體包括:
[0306] 將所述聚類(lèi)得到的興趣類(lèi)與所述同名的興趣類(lèi)合并,得到合并后的興趣類(lèi);
[0307] 更新所述合并后的興趣類(lèi)對(duì)應(yīng)的持續(xù)時(shí)長(zhǎng)及關(guān)注度。
[0308] 若合并后的興趣類(lèi)的持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值,則所述合并后的興趣類(lèi)用于表征用 戶(hù)長(zhǎng)期興趣方向。則相應(yīng)的,在本發(fā)明其他實(shí)施例中,上述所有實(shí)施例中的處理器141執(zhí)行 存儲(chǔ)器142中所存放的程序代碼,還可執(zhí)行以下操行:
[0309] 在合并后的興趣類(lèi)的持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值時(shí),將持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值的所述 興趣類(lèi)記錄為歸屬于長(zhǎng)期興趣模型。
[0310] 在本發(fā)明其他實(shí)施例中,上述所有實(shí)施例中的概念層次樹(shù)中已存在的興趣簇和所 述增量興趣簇各自均對(duì)應(yīng)關(guān)注度,所述已存在的興趣簇對(duì)應(yīng)的關(guān)注度由所述已存在的興趣 簇下包含的各興趣類(lèi)的關(guān)注度所決定;所述增量興趣簇對(duì)應(yīng)的關(guān)注度由所述增量興趣簇下 包含的各興趣類(lèi)的關(guān)注度所決定。
[0311] 在本發(fā)明其他實(shí)施例中,在所述更新后的概念層次樹(shù)中不存在與所述增量興趣簇 同名的興趣簇時(shí),上述所有實(shí)施例中的處理器141執(zhí)行存儲(chǔ)器142中所存放的程序代碼,所 執(zhí)行的操作"使用所述增量興趣簇更新所述更新后的概念層次樹(shù)"可具體包括:
[0312] 向所述更新后的概念層次樹(shù)中添加所述增量興趣簇。
[0313] 在本發(fā)明其他實(shí)施例中,在所述更新后的概念層次樹(shù)中存在與所述增量興趣簇同 名的興趣簇時(shí),上述所有實(shí)施例中的處理器141執(zhí)行存儲(chǔ)器142中所存放的程序代碼,所執(zhí) 行的操作"使用所述增量興趣簇更新所述更新后的概念層次樹(shù)"可具體包括:
[0314] 將所述增量興趣簇與同名的興趣簇合并,得到合并后的興趣簇;所述增量興趣簇 的關(guān)注度與同名興趣簇的關(guān)注度之和為合并后的興趣簇的關(guān)注度。
[0315] 在本發(fā)明其他實(shí)施例中,上述所有實(shí)施例中的增量興趣簇表示為Unew,所 述Un6w的關(guān)注度表示為,所述增量興趣簇對(duì)應(yīng)的同名興趣簇表示為u。, 所述u。的關(guān)注度表示合并后的興趣簇的關(guān)注度表示為,則

【權(quán)利要求】
1. 一種用戶(hù)興趣模型更新方法,其特征在于,所述用戶(hù)興趣模型通過(guò)概念層次樹(shù)結(jié)構(gòu) 表示,所述概念層次樹(shù)按概念層次由高至低包括興趣簇、興趣類(lèi)和興趣關(guān)鍵詞,一個(gè)或多個(gè) 興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多個(gè)興趣類(lèi)歸屬于同一興趣簇; 所述方法包括: 將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,所述關(guān)鍵詞為興趣關(guān)鍵詞; 對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi); 使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)。
2. 如權(quán)利要求1所述方法,其特征在于, 所述用戶(hù)興趣模型包括短期興趣模型和長(zhǎng)期興趣模型; 所述概念層次樹(shù)中的興趣關(guān)鍵詞和表征用戶(hù)短期興趣方向的興趣類(lèi)被記錄為歸屬于 所述短期興趣模型; 所述概念層次樹(shù)中的興趣簇被記錄為歸屬于所述長(zhǎng)期興趣模型,或者,所述概念層次 樹(shù)中的興趣簇和表征用戶(hù)長(zhǎng)期興趣方向的興趣類(lèi)被記錄為歸屬于所述長(zhǎng)期興趣模型。
3. 如權(quán)利要求1或2所述的方法,其特征在于,在使用聚類(lèi)得到的興趣類(lèi)更新所述概念 層次樹(shù)之后,所述方法還包括: 確定更新后的概念層次樹(shù)中所述聚類(lèi)得到的興趣類(lèi)所歸屬的興趣簇;其中,確定出的 興趣簇表示為增量興趣簇; 使用所述增量興趣簇更新所述更新后的概念層次樹(shù)。
4. 如權(quán)利要求3所述的方法,其特征在于,每個(gè)興趣類(lèi)對(duì)應(yīng)有持續(xù)時(shí)長(zhǎng)和關(guān)注度,所述 關(guān)注度由該興趣類(lèi)下包含的各興趣關(guān)鍵詞的出現(xiàn)次數(shù)所決定,所述持續(xù)時(shí)長(zhǎng)用于表征該興 趣類(lèi)存在的時(shí)間跨度和在所述時(shí)間跨度內(nèi)用戶(hù)操作行為涉及該興趣類(lèi)的頻率; 所述時(shí)間跨度包括用戶(hù)操作行為首次涉及所述興趣類(lèi)的時(shí)間與用戶(hù)操作行為最后一 次涉及所述興趣類(lèi)的時(shí)間。
5. 如權(quán)利要求4所述方法,其特征在于,在所述概念層次樹(shù)中不存在與所述聚類(lèi)得到 的興趣類(lèi)同名的興趣類(lèi)時(shí),所述使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)包括: 在所述概念層次樹(shù)中添加所述聚類(lèi)得到的興趣類(lèi)及其下屬的興趣關(guān)鍵詞。
6. 如權(quán)利要求5所述的方法,其特征在于, 在所述概念層次樹(shù)中添加所述聚類(lèi)得到的興趣類(lèi)及其下屬的興趣關(guān)鍵詞之后,所述方 法還包括: 將所添加的、所述聚類(lèi)得到的興趣類(lèi)記錄為歸屬于短期興趣模型。
7. 如權(quán)利要求4所述方法,其特征在于,在所述概念層次樹(shù)中存在與所述聚類(lèi)得到的 興趣類(lèi)同名的興趣類(lèi)時(shí),所述使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)包括: 將所述聚類(lèi)得到的興趣類(lèi)與所述同名的興趣類(lèi)合并,得到合并后的興趣類(lèi); 更新所述合并后的興趣類(lèi)對(duì)應(yīng)的持續(xù)時(shí)長(zhǎng)及關(guān)注度。
8. 如權(quán)利要求7所述方法,其特征在于,在更新所述合并后的興趣類(lèi)對(duì)應(yīng)的持續(xù)時(shí)長(zhǎng) 及關(guān)注度之后,所述方法還包括: 在合并后的興趣類(lèi)的持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值時(shí),將持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值的所述興趣 類(lèi)記錄為歸屬于長(zhǎng)期興趣模型。
9. 如權(quán)利要求4所述的方法,其特征在于,所述概念層次樹(shù)中已存在的興趣簇和所述 增量興趣簇各自均對(duì)應(yīng)關(guān)注度,所述已存在的興趣簇對(duì)應(yīng)的關(guān)注度由所述已存在的興趣簇 下包含的各興趣類(lèi)的關(guān)注度所決定;所述增量興趣簇對(duì)應(yīng)的關(guān)注度由所述增量興趣簇下包 含的各興趣類(lèi)的關(guān)注度所決定。
10. 如權(quán)利要求9所述方法,其特征在于,在所述更新后的概念層次樹(shù)中不存在與所 述增量興趣簇同名的興趣簇時(shí),所述使用所述增量興趣簇更新所述更新后的概念層次樹(shù)包 括: 向所述更新后的概念層次樹(shù)中添加所述增量興趣簇。
11. 如權(quán)利要求9所述方法,其特征在于,在所述更新后的概念層次樹(shù)中存在與所述增 量興趣簇同名的興趣簇時(shí),所述使用所述增量興趣簇更新所述更新后的概念層次樹(shù)包括: 將所述增量興趣簇與同名的興趣簇合并,得到合并后的興趣簇;所述增量興趣簇的關(guān) 注度與同名興趣簇的關(guān)注度之和為合并后的興趣簇的關(guān)注度。
12. 如權(quán)利要求11所述的方法,其特征在于,所述增量興趣簇表示為unOT,所 述Unew的關(guān)注度表示為CW?//,,,所述增量興趣簇對(duì)應(yīng)的同名興趣簇表示為U。, 所述U。的關(guān)注度表示為合并后的興趣簇的關(guān)注度表示為CCWtAim,則 =Txcw訴,,t) +(l-r)xco,成Wu.,T表示衰減因子。
13. 如權(quán)利要求10或11所述的方法,其特征在于,在向所述更新后的概念層次樹(shù)中添 加所述增量興趣簇之后,或者,將所述增量興趣簇與同名的興趣簇合并之后,所述方法還包 括:去除關(guān)注度小于最低關(guān)注閾值的興趣簇。
14. 一種用戶(hù)推薦方法,其特征在于,包括: 更新用戶(hù)興趣模型; 通過(guò)所述用戶(hù)興趣模型過(guò)濾推薦消息; 將所述推薦消息推薦給用戶(hù); 所述用戶(hù)興趣模型通過(guò)概念層次樹(shù)結(jié)構(gòu)表示,所述概念層次樹(shù)按概念層次由高至低包 括興趣簇、興趣類(lèi)和興趣關(guān)鍵詞,一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多個(gè)興 趣類(lèi)歸屬于同一興趣簇; 所述更新用戶(hù)興趣模型包括: 將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,所述關(guān)鍵詞為興趣關(guān)鍵詞; 對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi); 使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)。
15. -種用戶(hù)興趣模型更新裝置,其特征在于,所述用戶(hù)興趣模型通過(guò)概念層次樹(shù)結(jié)構(gòu) 表示,所述概念層次樹(shù)按概念層次由高至低包括興趣簇、興趣類(lèi)和興趣關(guān)鍵詞,一個(gè)或多個(gè) 興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多個(gè)興趣類(lèi)歸屬于同一興趣簇; 所述裝置包括: 提取單元,用于將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,所述關(guān)鍵詞為 興趣關(guān)鍵詞; 聚類(lèi)單元,用于對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi); 第一更新單元,用于使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)。
16. 如權(quán)利要求15所述裝置,其特征在于, 所述用戶(hù)興趣模型包括短期興趣模型和長(zhǎng)期興趣模型; 所述裝置還包括第一記錄單元和第二記錄單元,其中: 第一記錄單元用于,將所述概念層次樹(shù)中的興趣關(guān)鍵詞和表征用戶(hù)短期興趣方向的興 趣類(lèi)記錄為歸屬于所述短期興趣模型; 第二記錄單元用于,將所述概念層次樹(shù)中的興趣簇記錄為歸屬于所述長(zhǎng)期興趣模型, 或者,將所述概念層次樹(shù)中的興趣簇和表征用戶(hù)長(zhǎng)期興趣方向的興趣類(lèi)記錄為歸屬于所述 長(zhǎng)期興趣1吳型。
17. 如權(quán)利要求15或16所述的裝置,其特征在于,所述裝置還包括: 確定單元,用于在所述第一更新單元使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)之 后,確定更新后的概念層次樹(shù)中的興趣類(lèi)所歸屬的興趣族;其中,確定出的興趣族表不為增 量興趣簇; 第二更新單元,用于使用所述增量興趣簇更新所述更新后的概念層次樹(shù)。
18. 如權(quán)利要求17所述的裝置,其特征在于,每個(gè)興趣類(lèi)對(duì)應(yīng)有持續(xù)時(shí)長(zhǎng)和關(guān)注度,所 述關(guān)注度由該興趣類(lèi)下包含的各興趣關(guān)鍵詞的出現(xiàn)次數(shù)所決定,所述持續(xù)時(shí)長(zhǎng)用于表征該 興趣類(lèi)存在的時(shí)間跨度和在所述時(shí)間跨度內(nèi)用戶(hù)操作行為涉及該興趣類(lèi)的頻率; 所述時(shí)間跨度包括用戶(hù)操作行為首次涉及所述興趣類(lèi)的時(shí)間與用戶(hù)操作行為最后一 次涉及所述興趣類(lèi)的時(shí)間。
19. 如權(quán)利要求18述裝置,其特征在于,所述第一更新單元用于: 在所述概念層次樹(shù)中存在與所述聚類(lèi)得到的興趣類(lèi)同名的興趣類(lèi)時(shí),將所述聚類(lèi)得到 的興趣類(lèi)與所述同名的興趣類(lèi)合并,得到合并后的興趣類(lèi); 更新所述合并后的興趣類(lèi)對(duì)應(yīng)的持續(xù)時(shí)長(zhǎng)及關(guān)注度。
20. 如權(quán)利要求19所述裝置,其特征在于,所述第二記錄單元用于: 在合并后的興趣類(lèi)的持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值時(shí),將持續(xù)時(shí)長(zhǎng)達(dá)到轉(zhuǎn)換閾值的所述合并 后的興趣類(lèi)記錄為歸屬于長(zhǎng)期興趣模型。
21. 如權(quán)利要求18所述的裝置,其特征在于,所述概念層次樹(shù)中已存在的興趣簇和所 述增量興趣簇各自均對(duì)應(yīng)關(guān)注度,所述已存在的興趣簇對(duì)應(yīng)的關(guān)注度由所述已存在的興趣 簇下包含的各興趣類(lèi)的關(guān)注度所決定;所述增量興趣簇對(duì)應(yīng)的關(guān)注度由所述增量興趣簇下 包含的各興趣類(lèi)的關(guān)注度所決定。
22. 如權(quán)利要求21所述裝置,其特征在于,所述第二更新單元用于: 在所述更新后的概念層次樹(shù)中不存在與所述增量興趣簇同名的興趣簇時(shí),向所述更新 后的概念層次樹(shù)中添加所述增量興趣簇。
23. 如權(quán)利要求21所述裝置,其特征在于,所述第二更新單元用于: 在所述更新后的概念層次樹(shù)中存在與所述增量興趣簇同名的興趣簇時(shí),將所述增量興 趣簇與同名的興趣簇合并,得到合并后的興趣簇;所述增量興趣簇的關(guān)注度與同名興趣簇 的關(guān)注度之和為合并后的興趣簇的關(guān)注度。
24. 如權(quán)利要求22或23所述的裝置,其特征在于,還包括: 去除單元,用于在所述第二更新單元向所述更新后的概念層次樹(shù)中添加所述增量興趣 簇之后,或者,在所述第二更新單元將所述增量興趣簇與同名的興趣簇合并之后,去除關(guān)注 度小于最低關(guān)注閾值的興趣簇。
25. -種用戶(hù)推薦裝置,其特征在于,包括: 用戶(hù)興趣模型更新裝置,用于更新用戶(hù)興趣模型; 過(guò)濾裝置,用于通過(guò)所述用戶(hù)興趣模型過(guò)濾推薦消息; 推薦裝置,用于將所述推薦消息推薦給用戶(hù); 所述用戶(hù)興趣模型通過(guò)概念層次樹(shù)結(jié)構(gòu)表示,所述概念層次樹(shù)按概念層次由高至低包 括興趣簇、興趣類(lèi)和興趣關(guān)鍵詞,一個(gè)或多個(gè)興趣關(guān)鍵詞歸屬于同一興趣類(lèi),一個(gè)或多個(gè)興 趣類(lèi)歸屬于同一興趣簇; 所述用戶(hù)興趣模型更新裝置包括: 提取單元,用于將用戶(hù)的操作行為轉(zhuǎn)化為文本,從文本中提取出關(guān)鍵詞,所述關(guān)鍵詞為 興趣關(guān)鍵詞; 聚類(lèi)單元,用于對(duì)提取出的興趣關(guān)鍵詞進(jìn)行聚類(lèi),得到至少一個(gè)興趣類(lèi); 第一更新單元,用于使用聚類(lèi)得到的興趣類(lèi)更新所述概念層次樹(shù)。
【文檔編號(hào)】G06F17/30GK104376058SQ201410624042
【公開(kāi)日】2015年2月25日 申請(qǐng)日期:2014年11月7日 優(yōu)先權(quán)日:2014年11月7日
【發(fā)明者】涂丹丹, 許可 申請(qǐng)人:華為技術(shù)有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1