的用戶、賬戶和賬號(hào)等。在此說明書中,以待分類的對(duì)象為待分類的用戶為例進(jìn)行說 明。在支付寶中,待分類的用戶為近一年的活躍用戶,這些用戶的愛好和習(xí)慣是不明確的, 可以由服務(wù)器直接從支付寶的后臺(tái)數(shù)據(jù)庫中獲取。
[0046] 在對(duì)待分類的用戶進(jìn)行分類之前,將待分類的用戶通過5個(gè)一級(jí)特征向量表示, 該5個(gè)一級(jí)特征向量分別為:年齡、職業(yè)、所在城市、消費(fèi)能力和理財(cái)能力;上述每個(gè)一級(jí)特 征向量又可以再細(xì)分為二級(jí)特征向量,其中,年齡劃分為7個(gè)區(qū)間,則得到7個(gè)二級(jí)特征向 量;職業(yè)劃分為學(xué)生、教師和未知等8類,則可以得到8個(gè)二級(jí)特征向量;所在城市按級(jí)別 劃分為6類,則可以得到6個(gè)二級(jí)特征向量;消費(fèi)能力劃分為10檔,則可以得到10個(gè)二級(jí) 特征向量;理財(cái)能力劃分為6檔,則可以得到6個(gè)二級(jí)特征向量,綜上,根據(jù)上述一級(jí)特征向 量可以得到37個(gè)二級(jí)特征向量。
[0047] 可以理解的是,對(duì)任一待分類的用戶,都可以將其通過37個(gè)二級(jí)特征向量表示, 但是對(duì)不同的待分類的用戶,其對(duì)應(yīng)的37個(gè)二級(jí)特征向量的值是不相同的。
[0048]需要說明的,上述二級(jí)特征向量的值均為布爾值。舉例來說,一級(jí)特征向量:年 齡劃分的7個(gè)區(qū)間,也即根據(jù)一級(jí)特征:年齡,得到的二級(jí)特征向量為[1,18],(18, 25], (25, 30],(30, 40],(40, 60],(60, 70],(70, 100],則當(dāng)待分類的用戶的年齡為20歲時(shí),則該 待分類的用戶對(duì)應(yīng)的上述7個(gè)特征向量的值為:0,1,0,0,0,0,0。
[0049] 舉例來說,從支付寶后臺(tái)數(shù)據(jù)庫中獲取三個(gè)目標(biāo)用戶:用戶A、用戶B和用戶C,則 待分類的對(duì)象的集合為:{用戶A,用戶B,用戶C},待分類的對(duì)象為:用戶A、用戶B和用戶 C,且獲取到待分類的對(duì)象:用戶A的37個(gè)二級(jí)特征向量的值為:{ai,a2,…,a37},獲取到待 分類的對(duì)象:用戶B的37個(gè)二級(jí)特征向量的值為:{bpb2,…,b37},獲取到待分類的對(duì)象: 用戶C的37個(gè)二級(jí)特征向量的值為:{Cl,c2,…,c37},其中,或者Cl(l彡i彡37)為 0或1。最后將用戶A的37個(gè)二級(jí)特征向量的值、用戶B的37個(gè)二級(jí)特征向量的值和用戶 C的37個(gè)二級(jí)特征向量的值構(gòu)成第一集合,即第一集合為:{{ap a2,…,a37},{bpb2,…, ^37},{。1,。2,···,C37}1。
[0050] 步驟120,獲取目標(biāo)對(duì)象集合以及所述目標(biāo)對(duì)象集合中各個(gè)目標(biāo)對(duì)象的特征向量 的值,并將所述各個(gè)目標(biāo)對(duì)象的特征向量的值構(gòu)成第二集合。
[0051] 需要說明的是,目標(biāo)對(duì)象的定義與待分類的對(duì)象的定義是相同的。在此說明書中, 同樣以目標(biāo)對(duì)象為目標(biāo)用戶為例進(jìn)行說明。在支付寶中,目標(biāo)用戶為支付寶中使用理財(cái)?shù)?功能的優(yōu)質(zhì)用戶,這些用戶的愛好和習(xí)慣是明確的,也可以由服務(wù)器直接從支付寶的后臺(tái) 數(shù)據(jù)庫中獲取。
[0052] 對(duì)任一目標(biāo)用戶,同樣將其通過37個(gè)二維特征向量表示。
[0053] 如前述例子,從支付寶后臺(tái)數(shù)據(jù)庫中獲取兩個(gè)種子用戶:用戶X,用戶Y,則獲取到 目標(biāo)對(duì)象的集合為:{用戶X,用戶Y},目標(biāo)對(duì)象為:用戶X,用戶Y,且獲取到目標(biāo)對(duì)象:用戶 X的37個(gè)二級(jí)特征向量的值為:{Xl,x2,…,x37},獲取到目標(biāo)對(duì)象:用戶Y的37個(gè)二級(jí)特 征向量的值為:{yi,y2,…,y37},其中,Xi或者yjl彡i彡37)為0或1。最后將用戶X的 37個(gè)二級(jí)特征向量的值和用戶Y的37個(gè)二級(jí)特征向量的值構(gòu)成第二集合,即第二集合為: Ηχι,X〗,…,χ3?},{y"i,y〗,…,5^37}}。
[0054] 步驟130,對(duì)所述第一集合中特征向量的值進(jìn)行去重處理,得到第三集合,以及對(duì) 所述第二集合中特征向量的值進(jìn)行去重處理,得到第四集合。
[0055] 其中,對(duì)所述第一集合中特征向量的值進(jìn)行去重處理,得到第三集合包括:
[0056] 步驟1 :從所述第一集合中選取第一特征向量的值,將所述第一特征向量的值加 入中間集合,并將所述第一集合中所述第一特征向量的值刪除;
[0057] 步驟2:從所述第一集合中選取第二特征向量的值,將所述第二特征向量的值與 所述中間集合中的特征向量的值進(jìn)行比對(duì),將比對(duì)不一致的第二特征向量的值加入所述中 間集合中,并將所述第一集合中所述第二特征向量的值刪除;將比對(duì)一致的第二特征向量 的值直接從所述第一集合中刪除;
[0058] 步驟3:重復(fù)執(zhí)行步驟2,直至將所述第一集合中特征向量的值刪除完畢,將所述 中間集合作為第三集合。
[0059]如前述例子中,第一集合為:{{a^a;;,.··,&;"},{b!,b2,…,b37},{cpC;;,…,c37}}, 假設(shè)ai =h,其中,1 <i< 37,即用戶A的37個(gè)特征向量的值與用戶B的37個(gè)特征向量 的值是相同的。則得到第三集合的過程具體為:預(yù)先設(shè)定中間集合M,M為空;然后從第一集 合中選取第一特征向量的值,第一特征向量的值可以為第一集合中任一待分類的對(duì)象的特 征向量的值,例如,{apa;;,···,&;"};將{apa;;,···,&;"}加入M,則···,&;"}}, 并將第一集合中"·,α37}刪除,即第一集合更新為^{bpb;;,…, c37}};之后從第一集合中選取第二特征向量的值,第二特征向量的值為更新后的第一集合 中任一待分類的對(duì)象的特征向量的值,例如,{(^,c2,…,c37},將{Cl,c2,…,c37}與Μ中 的{a^a2,…,a37}進(jìn)行比對(duì),若任一q弇ajl彡i彡37),則說明上述第二特征向量的值 與Μ中特征向量的值不一致,將{Cl,c2,…,c37}加入Μ中,Μ更新為:{{ai,a2,…,a37}, {cpC;;,...,c37}},并將第一集合中{cpC;;,...,(337}刪除,即第一集合更新為:{{bpb;;,…, b37}};因?yàn)榈谝患现刑卣飨蛄康闹颠€沒有刪除完畢,所以再次從第一集合中選取第二特 征向量的值,例如,,…,b37},因?yàn)? 所以直接將,…,b37}從第一集合 中刪除。因?yàn)榈谝患现刑卣飨蛄康闹狄呀?jīng)刪除完畢,所以將M={{ai,a2,…,a37},{Cl,c2,.",(337}}作為第三集合。
[0060] 在上述將第二特征向量的值與中間集合中特征向量的值進(jìn)行比對(duì)的過程中,如果 Μ中還有其他特征向量的值,則還需要將第二特性向量的值與其他特征向量的值進(jìn)行比對(duì), 當(dāng)?shù)诙卣飨蛄康闹蹬c中間集合中所有特征向量的值均不一致時(shí),才將第二特征向量的值 加入中間集合中。
[0061] 可選地,在所述對(duì)所述第一集合中特征向量的值進(jìn)行去重處理,得到第三集合之 后,在所述對(duì)所述第二集合中特征向量的值進(jìn)行去重處理,得到第四集合之前,所述方法還 包括:
[0062] 統(tǒng)計(jì)所述第三集合中各特征向量的值在所述第二集合中重復(fù)出現(xiàn)的次數(shù)。
[0063] 如前述例子中,得到的第二集合為:{{χ^Χ2,…,x37},{y^y2,…,y』,而第三 集合為:{{apa2,…,a37},{c!,c2,…,c37}},假設(shè)a;=Xi=y;,其中,1 彡i彡 37,則{a!, a2,一437}在第二集合中重復(fù)出現(xiàn)的次數(shù)為2,而{Cl,c2,…,c37}在第二集合中重復(fù)出現(xiàn) 的次數(shù)為〇。
[0064] 其中,對(duì)所述第二集合中特征向量的值進(jìn)行去重處理,得到第四集合包括:
[0065] 步驟1 :從所述第二集合中選取第一特征向量的值,將所述第一特征向量的值加 入中間集合,并將所述第二集合中所述第一特征向量的值刪除;
[0066]步驟2:從所述第二集合中選取第二特征向量的值,將所述第二特征向量的值與 所述中間集合中的特征向量的值進(jìn)行比對(duì),將比對(duì)不一致的第二特征向量的值加入所述中 間集合中,并將所述第二集合中所述第二特征向量的值刪除;將比對(duì)一致的第二特征向量 的值直接從所述第二集合中刪除;
[0067] 步驟3 :重復(fù)執(zhí)行步驟2,直至將所述第二集合中特征向量的值刪除完畢,將所述 中間集合作為第四集合。
[0068] 前述例子中,第二集合為:{{χ^χζ,…,,iri,y2,…,,假設(shè)Xi=yi,其中, 1 <i< 37,即用戶X的37個(gè)特征向量的值與用戶Y的37個(gè)特征向量的值是相同的。貝1J 根據(jù)上述步驟得到的第四集合為:{Χι,χ2,…,χ37}。
[0069] 步驟140,對(duì)所述第三集合中任一特征向量的值,計(jì)算所述任一特征向量的值與 所述第四集合中各特征向量的值的相似度,得到與所述任一特征向量的值對(duì)應(yīng)的多個(gè)相似 度。
[0070] 可選地,在所述