對(duì)所述第二集合中特征向量的值進(jìn)行去重處理,得到第四集合之 后,所述方法還包括:
[0071] 根據(jù)笛卡爾積的連接方式,對(duì)所述第三集合中特征向量的值與所述第四集合中特 征向量的值進(jìn)行組合。
[0072] 所述計(jì)算所述任一特征向量的值與所述第四集合中各特征向量的值的相似度包 括:
[0073] 對(duì)組合的所述任一特征向量的值與所述第四集合中各特征向量的值計(jì)算相似度。
[0074] 如前述例子中,第三集合為:,…,a37},,…,c37}},第四集合為:{x^ x2,…,x37},根據(jù)笛卡爾積的連接方式,對(duì)所述第三集合中特征向量的值與所述第四集合中 特征向量的值進(jìn)行組合后為 ···,&;"}, …,(^,{叉!, x2,…,X37H。對(duì)第三集合中任一特征向量的值:…,a37},計(jì)算{a^a;;,…,a37}與{xpXr...,x37}的相似度S1〇
[0075] 其中,{a!,a2,…,a37}與{x!,x2,…,x37}的相似度計(jì)算公式如下:
[0076]
[0077]a;為{a!,a2,…,a37}中任一值,為{x!,x2,…,x37}中任一值。
[0078] 需要說明的是,當(dāng)上述組合還包括:{{a^a;;,…七?}與{zpz;;,…,z37}}時(shí),則對(duì) 第三集合中任一特征向量的值:{a^a;;,···,&;"},還需計(jì)算{a^a;;,···,&;"}與{z^z;;,…,z37}的相似度&,從而可以得到與任一特征向量的值:{ai,a2,…,a37}對(duì)應(yīng)的兩個(gè)相似度Si 和S2。
[0079] 步驟150,當(dāng)所述多個(gè)相似度之和大于預(yù)設(shè)的閾值時(shí),則識(shí)別所述任一特征向量的 值對(duì)應(yīng)的待分類的對(duì)象與所述目標(biāo)對(duì)象集合中的目標(biāo)對(duì)象為同一類對(duì)象。
[0080] 優(yōu)選地,將所述多個(gè)相似度之和與所述任一特征向量的值在所述第二集合中重復(fù) 出現(xiàn)的次數(shù)相乘,得到目標(biāo)相似度和;
[0081] 所述當(dāng)所述多個(gè)相似度之和大于預(yù)設(shè)的閾值時(shí),則識(shí)別所述任一特征向量的值對(duì) 應(yīng)的待分類的對(duì)象與所述目標(biāo)對(duì)象集合中的目標(biāo)對(duì)象為同一類對(duì)象包括:
[0082] 當(dāng)所述目標(biāo)相似度和大于預(yù)設(shè)的閾值時(shí),則識(shí)別所述任一特征向量的值對(duì)應(yīng)的待 分類的對(duì)象與所述目標(biāo)對(duì)象集合中的目標(biāo)對(duì)象為同一類對(duì)象。
[0083] 如前述例子中,對(duì)第三集合中任一特征向量的值:{apa2,…,a37},計(jì)算出{ap 3<2,···,8*37}與(Xl,X2,···,X37}的相似度Si,并計(jì)算出{?3·ι,3*2,···,8*37}與(Zi,Z2,···,Z37} 的相似度s2之后,將Si與S2相加得到Sadd ;而在步驟130中統(tǒng)計(jì)出{ai,a2,…,a37}在第二 集合中重復(fù)出現(xiàn)的次數(shù)為2,將Sadd與2相乘得到目標(biāo)相似度和為2*Sadd ;而假設(shè)2*Sadd大于 預(yù)設(shè)的閾值,則識(shí)別{apa2,…,a37}對(duì)應(yīng)的用戶A與目標(biāo)對(duì)象集合中的用戶X和用戶Y為 同一類對(duì)象。而由于&1 = 131,其中,1彡i彡37,因此,也可以識(shí)別{bplv.",b37}對(duì)應(yīng)的 用戶B與目標(biāo)對(duì)象集合中的用戶X和用戶Y為同一類對(duì)象。類似地,可以識(shí)別{Cl,c2,…, C37}對(duì)應(yīng)的用戶C與目標(biāo)對(duì)象集合中的用戶X和用戶Y為同一類對(duì)象或者不為同一類對(duì)象。
[0084] 在支付寶中,當(dāng)待分類的用戶為2億,而目標(biāo)用戶為80萬,且需要將2億待分類的 用戶進(jìn)行分群時(shí),通過本申請(qǐng)的方法,可以將計(jì)算量從2億*80萬(這個(gè)計(jì)算量在12小時(shí) 內(nèi)未能完成)降為2000*1500,而2000*1500的計(jì)算量可以分鐘級(jí)完成。由此,本申請(qǐng)實(shí)施 例提供的對(duì)象的分類方法可以大大減小計(jì)算量,從而保證待分類的對(duì)象的分類過程能夠在 可接受的時(shí)間范圍內(nèi)完成。
[0085] 本申請(qǐng)實(shí)施例提供的對(duì)象的分類方法,在獲取到第一集合和第二集合后,分別對(duì) 第一集合中特征向量的值和第二集合中特征向量的值進(jìn)行去重處理,然后將去重處理后得 到的第三集合中特征向量的值與第四集合中特征向量的值計(jì)算相似度,最后根據(jù)計(jì)算得到 的相似度對(duì)待分類的對(duì)象進(jìn)行分類,由此,可以大大減小計(jì)算量,從而保證待分類的對(duì)象的 分類過程能夠在可接受的時(shí)間范圍內(nèi)完成。
[0086] 圖2為本申請(qǐng)實(shí)施例二提供的業(yè)務(wù)的推送方法流程圖。該實(shí)施例二中根據(jù)實(shí)施例 一提供的對(duì)象的分類方法,識(shí)別第一對(duì)象與目標(biāo)對(duì)象集合中的對(duì)象為同一類對(duì)象時(shí),向第 一對(duì)象推送與目標(biāo)對(duì)象集合中的對(duì)象相同的業(yè)務(wù)。關(guān)于識(shí)別第一對(duì)象與目標(biāo)對(duì)象集合中的 對(duì)象為同一類對(duì)象的部分,可以參照實(shí)施例一。所述方法的執(zhí)行主體可以為具有處理能力 的設(shè)備:服務(wù)器或者系統(tǒng)或者裝置,如圖2所示,所述方法具體可包括以下步驟:
[0087] 步驟210,識(shí)別第一對(duì)象與目標(biāo)對(duì)象集合中的對(duì)象為同一類對(duì)象。
[0088] 需要說明的是,本實(shí)施例中的第一對(duì)象為實(shí)施例一中的待分類的對(duì)象集合中任一 待分類的對(duì)象。第一對(duì)象的定義同待分類的對(duì)象,在此不作贅述。
[0089] 其中,如圖2所示,所述識(shí)別第一對(duì)象與目標(biāo)對(duì)象集合中的對(duì)象為同一類對(duì)象,包 括:
[0090] 步驟2101,獲取所述第一對(duì)象的特征向量的值;
[0091] 步驟2102,獲取所述目標(biāo)對(duì)象集合以及所述目標(biāo)對(duì)象集合中各個(gè)對(duì)象的特征向量 的值,并將所述各個(gè)對(duì)象的特征向量的值構(gòu)成第一集合;
[0092] 步驟2103,對(duì)所述第一集合中特征向量的值進(jìn)行去重處理,得到第二集合;
[0093] 步驟2104,計(jì)算所述第一對(duì)象的特征向量的值與所述第二集合中各特征向量的值 的相似度,得到與所述第一對(duì)象的特征向量的值對(duì)應(yīng)的多個(gè)相似度;
[0094] 步驟2105,當(dāng)所述多個(gè)相似度之和大于預(yù)設(shè)的閾值時(shí),則識(shí)別所述第一對(duì)象與所 述目標(biāo)對(duì)象集合中的對(duì)象為同一類對(duì)象;
[0095]步驟220,向所述第一對(duì)象,推送與所述目標(biāo)對(duì)象集合中的對(duì)象相同的業(yè)務(wù)。
[0096] 可選地,所述對(duì)所述第一集合中特征向量的值進(jìn)行去重處理,得到第二集合包 括:
[0097] 步驟1 :從所述第一集合中選取第一特征向量的值,將所述第一特征向量的值加 入中間集合,并將所述第一集合中所述第一特征向量的值刪除;
[0098] 步驟2:從所述第一集合中選取第二特征向量的值,將所述第二特征向量的值與 所述中間集合中的特征向量的值進(jìn)行比對(duì),將比對(duì)不一致的第二特征向量的值加入所述中 間集合中,并將所述第一集合中所述第二特征向量的值刪除;將比對(duì)一致的第二特征向量 的值直接從所述第一集合中刪除;
[0099] 步驟3:重復(fù)執(zhí)行步驟2,直至將所述第一集合中特征向量的值刪除完畢,將所述 中間集合作為第二集合。
[0100] 可選地,在所述對(duì)所述第一集合中特征向量的值進(jìn)行去重處理,得到第二集合之 后,所述方法還包括:
[0101] 根據(jù)笛卡爾積的連接方式,對(duì)所述第一對(duì)象的特征向量的值與所述第四集合中特 征向量的值進(jìn)行組合。
[0102] 所述計(jì)算所述第一對(duì)象的特征向量的值與所述第二集合中各特征向量的值的相 似度包括:
[0103] 對(duì)組合的所述第一對(duì)象的特征向量的值與所述第二集合中各特征向量的值計(jì)算 相似度。
[0104] 可選地,在所述對(duì)所述第一集合中特征向量的值進(jìn)行去重處理,得到第二集合之 后,所述方法還包括:
[0105] 統(tǒng)計(jì)所述第一對(duì)象的特征向量的值在所述第二集合中重復(fù)出現(xiàn)的次數(shù)。
[0106] 可選地,在計(jì)算所述第一對(duì)象的特征向量的值與所述第二集合中各特征向量的值 的相似度之后,得到與所述第一對(duì)象的特征向量的值對(duì)應(yīng)的多個(gè)相似度所述方法還包括:
[0107] 將所述多個(gè)相似度之和與所述第一對(duì)象的特征向量的值在所述第二集合中重復(fù) 出現(xiàn)的次數(shù)相乘,得到目標(biāo)相似度和;
[0108] 所述當(dāng)所述多個(gè)相似度之和大于預(yù)設(shè)的閾值時(shí),則識(shí)別所述第一對(duì)象與所述目標(biāo) 對(duì)象集合中的對(duì)象為同一類對(duì)象包括:
[0109] 當(dāng)所述目標(biāo)相似度和大于預(yù)設(shè)的閾值時(shí),則識(shí)別所述第一對(duì)象與所述目標(biāo)對(duì)象集 合中的對(duì)象為同一類對(duì)象。
[0110] 本申請(qǐng)實(shí)施例提供的業(yè)務(wù)的推送方法,在獲取到第一集合后,對(duì)第一集合中特征 向量的值進(jìn)行去重處理,然后將第一對(duì)象的特征向量的值與去重處理后得到的第二集合中 特征向量的值計(jì)算相似度,由此,可以大大減小計(jì)算量,節(jié)約計(jì)算機(jī)資源,并且可以保證準(zhǔn) 確地向第一對(duì)象推送業(yè)務(wù)。
[0111] 與上述對(duì)象的分類方法對(duì)應(yīng)地,本申請(qǐng)實(shí)施例還提供的一種服務(wù)器,如圖3所示, 該服務(wù)器包