1.一種基于標(biāo)簽的用戶協(xié)同過濾內(nèi)容推薦方法,其特征在于,包括:
獲取多個(gè)待推薦內(nèi)容的標(biāo)簽信息;
根據(jù)所述標(biāo)簽信息之間的相似度,對所述標(biāo)簽信息進(jìn)行聚類,得到多個(gè)標(biāo)簽簇;
根據(jù)所述標(biāo)簽信息、所述標(biāo)簽簇得到多個(gè)用戶的興趣向量;所述多個(gè)用戶包括目標(biāo)用戶;
根據(jù)各個(gè)所述用戶的興趣向量,以及各個(gè)所述用戶的第一瀏覽記錄得到各個(gè)所述用戶之間的相似度,并根據(jù)各個(gè)所述用戶之間的相似度,確定與所述目標(biāo)用戶相關(guān)的用戶;所述第一瀏覽記錄包括:所述用戶瀏覽過的內(nèi)容的集合,以及對所述集合中的內(nèi)容瀏覽的時(shí)間;
根據(jù)所述目標(biāo)用戶和與所述目標(biāo)用戶相關(guān)的用戶之間的相似度,以及與所述目標(biāo)用戶相關(guān)的用戶的第一瀏覽記錄,得到所述目標(biāo)用戶對應(yīng)的各個(gè)所述待推薦內(nèi)容的推薦度,并根據(jù)所述推薦度對所述目標(biāo)用戶進(jìn)行內(nèi)容推薦。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述標(biāo)簽信息之間的相似度,對所述標(biāo)簽信息進(jìn)行聚類,得到多個(gè)標(biāo)簽簇,包括:
a、將所有的標(biāo)簽信息分別作為一個(gè)標(biāo)簽簇;
b、計(jì)算所述標(biāo)簽簇兩兩之間的相似度,確定相似度最大的兩個(gè)標(biāo)簽簇,若所述相似度大于預(yù)設(shè)閾值,則將所述兩個(gè)標(biāo)簽簇進(jìn)行合并;
c、判斷合并后的標(biāo)簽簇的個(gè)數(shù)是否等于預(yù)設(shè)個(gè)數(shù),若否,則重復(fù)所述b,直至標(biāo)簽簇的個(gè)數(shù)等于預(yù)設(shè)個(gè)數(shù)。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,根據(jù)所述標(biāo)簽信息之間的相似度,對所述標(biāo)簽信息進(jìn)行聚類,得到多個(gè)標(biāo)簽簇之后,還包括:
計(jì)算所述標(biāo)簽簇的中心和半徑,并根據(jù)所述標(biāo)簽簇的中心和半徑確定相交的標(biāo)簽簇;
將所述相交的標(biāo)簽簇中位于相交區(qū)域內(nèi)的標(biāo)簽信息,放入所述相交的標(biāo)簽簇中不包含所述標(biāo)簽信息的標(biāo)簽簇中。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,根據(jù)所述標(biāo)簽信息、所述標(biāo)簽簇得到多個(gè)用戶的興趣向量,包括:
分別將每個(gè)所述待推薦內(nèi)容的各個(gè)所述標(biāo)簽信息映射到所述標(biāo)簽簇中,得到每個(gè)所述待推薦內(nèi)容對應(yīng)的話題向量;
根據(jù)所述待推薦內(nèi)容對應(yīng)的話題向量以及與各個(gè)所述用戶的第二瀏覽記錄對應(yīng)的權(quán)重,得到各個(gè)所述用戶的興趣向量;所述第二瀏覽記錄包括所述用戶對所述待推薦內(nèi)容的瀏覽時(shí)長。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,分別將每個(gè)所述待推薦內(nèi)容的各個(gè)所述標(biāo)簽信息映射到所述標(biāo)簽簇中,得到每個(gè)所述待推薦內(nèi)容對應(yīng)的話題向量,包括:
確定所述待推薦內(nèi)容的各個(gè)所述標(biāo)簽信息歸屬的標(biāo)簽簇,將歸屬于第n個(gè)標(biāo)簽簇的標(biāo)簽信息的個(gè)數(shù)作為所述待推薦內(nèi)容對應(yīng)的話題向量的第n個(gè)元素;
其中,n的取值范圍為大于0,且n小于等于所述標(biāo)簽簇的個(gè)數(shù)。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)所述待推薦內(nèi)容對應(yīng)的話題向量以及與各個(gè)所述用戶的第二瀏覽記錄對應(yīng)的權(quán)重,得到各個(gè)所述用戶的興趣向量,包括:
將各個(gè)所述待推薦內(nèi)容對應(yīng)的話題向量的加權(quán)和作為所述用戶的興趣向量;
其中,所述話題向量對應(yīng)的權(quán)重為根據(jù)所述用戶對所述待推薦內(nèi)容的第二瀏覽記錄以及所述待推薦內(nèi)容的熱門度確定的。
7.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,根據(jù)各個(gè)所述用戶的興趣向量,以及所述用戶的瀏覽記錄得到各個(gè)所述用戶之間的相似度,包括:
根據(jù)如下公式(1)確定各個(gè)所述用戶之間的相似度;
其中,Wuv表示用戶u和用戶v的相似度,N(u)表示用戶u瀏覽過的內(nèi)容集合,N(v)表示用戶v瀏覽過的內(nèi)容集合,Tui表示用戶u瀏覽第i個(gè)內(nèi)容的時(shí)間點(diǎn),Tvi表示用戶v瀏覽第i個(gè)內(nèi)容的時(shí)間點(diǎn),|N(u)|和|N(v)|分別表示N(u)和N(v)包含的元素個(gè)數(shù);表示用戶u的興趣向量和用戶v的興趣向量的相似度;β為權(quán)重因子;α為預(yù)設(shè)的時(shí)間因子。
8.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,根據(jù)所述目標(biāo)用戶和與所述目標(biāo)用戶相關(guān)的用戶之間的相似度,以及與所述目標(biāo)用戶相關(guān)的用戶的第一瀏覽記錄,得到所述目標(biāo)用戶對應(yīng)的各個(gè)所述待推薦內(nèi)容的推薦度,包括:
根據(jù)如下公式(2)得到所述目標(biāo)用戶對應(yīng)的各個(gè)所述待推薦內(nèi)容的推薦度
其中,P(u,i)表示目標(biāo)用戶u對應(yīng)的第i個(gè)待推薦內(nèi)容的推薦度。S(u,k)表示和目標(biāo)用戶u相似度最大的k個(gè)用戶的集合,Wuv表示目標(biāo)用戶u和與目標(biāo)用戶相關(guān)的用戶v的相似度,Rvi表示用戶v對第i個(gè)待推薦內(nèi)容的興趣值,若用戶v瀏覽過第i個(gè)待推薦內(nèi)容,則Rvi為1;若用戶沒有瀏覽過第i個(gè)待推薦內(nèi)容,則Rvi為0;To表示當(dāng)前時(shí)間,Tvi表示用戶v對第i個(gè)待推薦內(nèi)容的瀏覽時(shí)間點(diǎn);α為預(yù)設(shè)的時(shí)間因子。
9.一種基于標(biāo)簽的用戶協(xié)同過濾內(nèi)容推薦裝置,其特征在于,包括:
獲取模塊,用于獲取多個(gè)待推薦內(nèi)容的標(biāo)簽信息;
聚類模塊,用于根據(jù)所述標(biāo)簽信息之間的相似度,對所述標(biāo)簽信息進(jìn)行聚類,得到多個(gè)標(biāo)簽簇;
興趣向量計(jì)算模塊,用于根據(jù)所述標(biāo)簽信息、所述標(biāo)簽簇得到多個(gè)用戶的興趣向量;所述多個(gè)用戶包括目標(biāo)用戶;
相似度計(jì)算模塊,用于根據(jù)各個(gè)所述用戶的興趣向量,以及各個(gè)所述用戶的第一瀏覽記錄得到各個(gè)所述用戶之間的相似度,并根據(jù)各個(gè)所述用戶之間的相似度,確定與所述目標(biāo)用戶相關(guān)的用戶;所述第一瀏覽記錄包括:所述用戶瀏覽過的內(nèi)容的集合,以及對所述集合中的內(nèi)容瀏覽的時(shí)間;
推薦模塊,用于根據(jù)所述目標(biāo)用戶和與所述目標(biāo)用戶相關(guān)的用戶之間的相似度,以及與所述目標(biāo)用戶相關(guān)的用戶的第一瀏覽記錄,得到所述目標(biāo)用戶對應(yīng)的各個(gè)所述待推薦內(nèi)容的推薦度,并根據(jù)所述推薦度對所述目標(biāo)用戶進(jìn)行內(nèi)容推薦。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述興趣向量計(jì)算模塊,包括:
話題向量計(jì)算單元,用于分別將每個(gè)所述待推薦內(nèi)容的各個(gè)所述標(biāo)簽信息映射到所述標(biāo)簽簇中,得到每個(gè)所述待推薦內(nèi)容對應(yīng)的話題向量;
興趣向量計(jì)算單元,用于根據(jù)所述待推薦內(nèi)容對應(yīng)的話題向量以及與各個(gè)所述用戶的第二瀏覽記錄對應(yīng)的權(quán)重,得到各個(gè)所述用戶的興趣向量;所述第二瀏覽記錄包括所述用戶對所述待推薦內(nèi)容的瀏覽時(shí)長。