亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用戶(hù)聚類(lèi)方法及裝置的制造方法

文檔序號(hào):9417852閱讀:320來(lái)源:國(guó)知局
一種用戶(hù)聚類(lèi)方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種用戶(hù)聚類(lèi)方法及裝置。
【背景技術(shù)】
[0002] 用戶(hù)聚類(lèi)是推薦系統(tǒng)之中常見(jiàn)的課題,利用kmeans算法進(jìn)行聚類(lèi)時(shí),現(xiàn)有的技術(shù) 方案往往是人工依靠經(jīng)驗(yàn)對(duì)用戶(hù)特征進(jìn)行賦權(quán),而且是無(wú)監(jiān)督的,無(wú)法用訓(xùn)練集來(lái)告知模 型哪些結(jié)果是好的。這種人工調(diào)權(quán)過(guò)程效率低下。需要反復(fù)的根據(jù)結(jié)果調(diào)整權(quán)重;而且人 工調(diào)權(quán)效果較差,效果好壞依賴(lài)工程師經(jīng)驗(yàn);人工調(diào)權(quán)只支持少量的特征維度,項(xiàng)目周期會(huì) 隨著維度的增加而增大,維度增大到10維以上,項(xiàng)目無(wú)法接受。

【發(fā)明內(nèi)容】

[0003] 本發(fā)明提供一種用戶(hù)聚類(lèi)方法及裝置,用以準(zhǔn)確、快速的將用戶(hù)進(jìn)行聚類(lèi)。
[0004] 本發(fā)明提供一種用戶(hù)聚類(lèi)方法,包括:
[0005] 將用戶(hù)分配到離自己最近的用戶(hù)群;
[0006] 根據(jù)用戶(hù)瀏覽過(guò)的商品和預(yù)設(shè)的目標(biāo)函數(shù),計(jì)算用戶(hù)群的目標(biāo)函數(shù)的值,所述目 標(biāo)函數(shù)用于表示所述用戶(hù)群之間針對(duì)商品的相似程度;
[0007] 當(dāng)所述目標(biāo)函數(shù)的值小于或等于預(yù)設(shè)閾值時(shí),將所有的用戶(hù)群作為聚類(lèi)結(jié)果;
[0008] 當(dāng)所述目標(biāo)函數(shù)的值大于預(yù)設(shè)閾值時(shí),按照目標(biāo)函數(shù)值下降的方向,調(diào)整用戶(hù)的 每個(gè)身份屬性特征向量的權(quán)重,重新將用戶(hù)分配到離自己最近的用戶(hù)群,直至所述目標(biāo)函 數(shù)的值小于或等于預(yù)設(shè)閾值。
[0009] 在一個(gè)實(shí)施例中,在將用戶(hù)分配到離自己最近的用戶(hù)群之前,所述方法還包括:
[0010] 隨機(jī)將用戶(hù)分到K個(gè)用戶(hù)群中,其中K為大于1的整數(shù),對(duì)用戶(hù)的每個(gè)身份屬性特 征向量分別賦予權(quán)重。
[0011] 在一個(gè)實(shí)施例中,所述按照目標(biāo)函數(shù)下降的方向,調(diào)整所述用戶(hù)的每個(gè)身份屬性 特征向量的權(quán)重,可包括:
[0012] 為用戶(hù)的每個(gè)身份屬性特征向量的權(quán)重分別增加預(yù)設(shè)步長(zhǎng);并分別確定所述每個(gè) 身份屬性特征向量的權(quán)重增加預(yù)設(shè)步長(zhǎng)后的目標(biāo)函數(shù)的值;
[0013] 將所述每個(gè)身份屬性特征向量的權(quán)重調(diào)整為最小的目標(biāo)函數(shù)的值所對(duì)應(yīng)的每個(gè) 身份屬性特征向量的權(quán)重。
[0014] 在一個(gè)實(shí)施例中,所述為所述用戶(hù)重新分配到離自己最近的用戶(hù)群,可包括:
[0015] 根據(jù)每個(gè)用戶(hù)群中用戶(hù)的每個(gè)身份屬性特征向量的權(quán)重確定每個(gè)用戶(hù)群的中心 占 .
[0016] 確定每一個(gè)用戶(hù)分別與K個(gè)用戶(hù)群的中心點(diǎn)的距離,將用戶(hù)重新分配到與所述用 戶(hù)距離最近的中心點(diǎn)所在的用戶(hù)群。
[0017] 在一個(gè)實(shí)施例中,所述目標(biāo)函數(shù)可以為: M
[0018]--- a x A
[0019] 將用戶(hù)群作為一個(gè)整體,對(duì)用戶(hù)群中的每個(gè)用戶(hù)瀏覽過(guò)的商品進(jìn)行統(tǒng)計(jì),按照瀏 覽次數(shù)由多到少的順序?qū)λ錾唐愤M(jìn)行排序;a為預(yù)設(shè)的按照降序從排序中選取的商品個(gè) 數(shù),M為其中一個(gè)用戶(hù)群與除所述用戶(hù)群之外的任一用戶(hù)群之間重復(fù)的商品數(shù),K為用戶(hù)群 的個(gè)數(shù)。
[0020] 在一個(gè)實(shí)施例中,所述用戶(hù)的身份屬性特征向量可包括以下信息中的一項(xiàng)或多 項(xiàng):年齡、職業(yè)、性別、居住地、學(xué)歷。
[0021] 本發(fā)明提供還一種用戶(hù)聚類(lèi)裝置,包括:
[0022] 分配模塊,用于將用戶(hù)分配到離自己最近的用戶(hù)群;
[0023] 計(jì)算模塊,用于根據(jù)用戶(hù)瀏覽過(guò)的商品和預(yù)設(shè)的目標(biāo)函數(shù),計(jì)算用戶(hù)群的目標(biāo)函 數(shù)的值,所述目標(biāo)函數(shù)用于表示所述用戶(hù)群之間針對(duì)商品的相似程度;
[0024] 聚類(lèi)結(jié)果模塊,用于當(dāng)所述目標(biāo)函數(shù)的值小于或等于預(yù)設(shè)閾值時(shí),將所有的用戶(hù) 群作為聚類(lèi)結(jié)果;
[0025] 權(quán)重調(diào)整模塊,用于當(dāng)所述目標(biāo)函數(shù)的值大于預(yù)設(shè)閾值時(shí),按照目標(biāo)函數(shù)值下降 的方向,調(diào)整用戶(hù)的每個(gè)身份屬性特征向量的權(quán)重,重新將用戶(hù)分配到離自己最近的用戶(hù) 群,直至所述目標(biāo)函數(shù)的值小于或等于預(yù)設(shè)閾值。
[0026] 在一個(gè)實(shí)施例中,所述裝置還包括:
[0027] 初始模塊,用于隨機(jī)將用戶(hù)分到K個(gè)用戶(hù)群中,其中K為大于1的整數(shù),對(duì)用戶(hù)的 每個(gè)身份屬性特征向量分別賦予權(quán)重。
[0028] 在一個(gè)實(shí)施例中,所述權(quán)重調(diào)整模塊,可包括:
[0029] 步長(zhǎng)增加子模塊,用于為用戶(hù)的每個(gè)身份屬性特征向量的權(quán)重分別增加預(yù)設(shè)步 長(zhǎng);
[0030] 第一確定子模塊,用于分別確定所述每個(gè)身份屬性特征向量的權(quán)重增加預(yù)設(shè)步長(zhǎng) 后的目標(biāo)函數(shù)的值;
[0031] 調(diào)整子模塊,用于將所述每個(gè)身份屬性特征向量的權(quán)重調(diào)整為最小的目標(biāo)函數(shù)的 值所對(duì)應(yīng)的每個(gè)身份屬性特征向量的權(quán)重。
[0032] 在一個(gè)實(shí)施例中,所述分配模塊,可包括:
[0033] 第二確定子模塊,用于根據(jù)每個(gè)用戶(hù)群中用戶(hù)的每個(gè)身份屬性特征向量的權(quán)重確 定每個(gè)用戶(hù)群的中心點(diǎn);
[0034] 重新分配子模塊,用于確定每一個(gè)用戶(hù)分別與K個(gè)用戶(hù)群的中心點(diǎn)的距離,將用 戶(hù)重新分配到與所述用戶(hù)距離最近的中心點(diǎn)所在的用戶(hù)群。
[0035] 在一個(gè)實(shí)施例中,所述目標(biāo)函數(shù)可以為: M
[0036] --- a X ?
[0037] 將用戶(hù)群作為一個(gè)整體,對(duì)用戶(hù)群中的每個(gè)用戶(hù)瀏覽過(guò)的商品進(jìn)行統(tǒng)計(jì),按照瀏 覽次數(shù)由多到少的順序?qū)λ錾唐愤M(jìn)行排序;a為預(yù)設(shè)的按照降序從排序中選取的商品個(gè) 數(shù),M為其中一個(gè)用戶(hù)群與除所述用戶(hù)群之外的任一用戶(hù)群之間重復(fù)的商品數(shù),K為用戶(hù)群 的個(gè)數(shù)。
[0038] 在一個(gè)實(shí)施例中,所述用戶(hù)的身份屬性特征向量可包括以下信息中的一項(xiàng)或多 項(xiàng):年齡、職業(yè)、性別、居住地、學(xué)歷。
[0039] 本發(fā)明實(shí)施例的上述技術(shù)方案,由于將用戶(hù)群之間的相似程度定義為目標(biāo)函數(shù), 在聚類(lèi)的過(guò)程中,始終朝著目標(biāo)函數(shù)下降的方向調(diào)整身份屬性特征向量的權(quán)重,因此本方 案將無(wú)監(jiān)督的聚類(lèi)變成了有監(jiān)督的聚類(lèi)、聚類(lèi)效果更好。
[0040] 本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書(shū)中闡述,并且,部分地從說(shuō)明書(shū)中變 得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫(xiě)的說(shuō)明 書(shū)、權(quán)利要求書(shū)、以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
[0041] 下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
【附圖說(shuō)明】
[0042] 附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書(shū)的一部分,與本發(fā)明的實(shí) 施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中:
[0043] 圖1為本發(fā)明實(shí)施例中一種用戶(hù)聚類(lèi)方法的流程圖;
[0044] 圖2為本發(fā)明實(shí)施例中一種用戶(hù)聚類(lèi)方法中步驟S40的流程圖;
[0045] 圖3為本發(fā)明實(shí)施例中一種用戶(hù)聚類(lèi)方法中步驟SlO的另一個(gè)流程圖;
[0046] 圖4為本發(fā)明實(shí)施例中一種用戶(hù)聚類(lèi)裝置的框圖;
[0047] 圖5為本發(fā)明實(shí)施例中一種用戶(hù)聚類(lèi)裝置中權(quán)重調(diào)整模塊44的框圖;
[0048] 圖6為本發(fā)明實(shí)施例中一種用戶(hù)聚類(lèi)裝置中分配模塊41的框圖.
【具體實(shí)施方式】
[0049] 以下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說(shuō)明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí) 施例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0050] 圖1所示為本發(fā)明實(shí)施例中一種用戶(hù)聚類(lèi)方法的流程圖,如圖1所示,包括以下步 驟 S10-S50 :
[0051] 步驟S10,將用戶(hù)分配到離自己最近的用戶(hù)群。
[0052] 步驟S20,根據(jù)用戶(hù)瀏覽過(guò)的商品和預(yù)設(shè)的目標(biāo)函數(shù),計(jì)算用戶(hù)群的目標(biāo)函數(shù)的 值,目標(biāo)函數(shù)用于表示用戶(hù)群之間針對(duì)商品的相似程度;
[0053] 步驟S30,判斷目標(biāo)函數(shù)的值是否小于或等于預(yù)設(shè)閾值;
[0054] 步驟S40,當(dāng)目標(biāo)函數(shù)的值小于或等于預(yù)設(shè)閾值時(shí),將所有的用戶(hù)群作為聚類(lèi)結(jié) 果;
[0055] 步驟S50,當(dāng)目標(biāo)函數(shù)的值大于預(yù)設(shè)閾值時(shí),按照目標(biāo)函數(shù)值下降的方向
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1