本發(fā)明實(shí)施例涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種數(shù)據(jù)處理方法、個(gè)體識(shí)別方法及相關(guān)裝置。
背景技術(shù):
目前,通常通過(guò)構(gòu)建賬號(hào)體系對(duì)用戶進(jìn)行識(shí)別。但是,在復(fù)雜的互聯(lián)網(wǎng)環(huán)境中,存在用戶在單個(gè)設(shè)備上注冊(cè)多個(gè)賬號(hào)、在不同業(yè)務(wù)系統(tǒng)中均存在多種身份(例如,在外賣業(yè)務(wù)場(chǎng)景中,系統(tǒng)內(nèi)存在用戶、商戶、銷售、騎士等角色,用戶可能在不同賬戶存在不同角色)、在多個(gè)設(shè)備上分別注冊(cè)有各類賬戶等復(fù)雜情況。而基于現(xiàn)有的賬號(hào)體系,難以在這種復(fù)雜情況下準(zhǔn)確地識(shí)別出多種復(fù)雜信息實(shí)際指向的個(gè)體。
以反作弊領(lǐng)域?yàn)槔?,通常需要?duì)獨(dú)立的自然人進(jìn)行識(shí)別?,F(xiàn)有技術(shù)僅能在用戶登錄的情況下基于已有的賬號(hào)體系識(shí)別用戶,至于具有復(fù)雜信息的用戶是否為單個(gè)自然人,則難以進(jìn)行準(zhǔn)確識(shí)別。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理方法、個(gè)體識(shí)別方法及相關(guān)裝置,用以解決現(xiàn)有技術(shù)無(wú)法準(zhǔn)確進(jìn)行個(gè)體識(shí)別的問(wèn)題。
第一方面,本發(fā)明實(shí)施例中提供了一種應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理方法,包括:
根據(jù)表征用戶身份的id屬性確定不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系;
根據(jù)所述不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系建立以用戶標(biāo)識(shí)和id屬性為節(jié)點(diǎn)的關(guān)聯(lián)關(guān)系圖;
基于所述關(guān)聯(lián)關(guān)系圖進(jìn)行拆分處理得到多個(gè)表征單個(gè)個(gè)體的連通子圖。
第二方面,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),用于存儲(chǔ)連通子圖(包括新建立的連通子圖或更新的連通子圖),該數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)包括:
索引模塊,用于存儲(chǔ)連通子圖中各個(gè)id屬性與所述連通子圖的標(biāo)識(shí)的映射;
內(nèi)容模塊(或者稱作數(shù)據(jù)詳情模塊),用于存儲(chǔ)所述連通子圖的標(biāo)識(shí)與所述連通子圖的映射。
第三方面,本發(fā)明實(shí)施例提供一種個(gè)體識(shí)別方法,包括:
根據(jù)搜索項(xiàng)查詢連通子圖,獲取與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖;
基于與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖進(jìn)行個(gè)體識(shí)別。
第四方面,本發(fā)明實(shí)施例提供一種應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理裝置,包括:
關(guān)系確定模塊,用于根據(jù)表征用戶身份的id屬性確定不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系;
關(guān)聯(lián)關(guān)系圖模塊,用于根據(jù)所述不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系建立以用戶標(biāo)識(shí)和id屬性為節(jié)點(diǎn)的關(guān)聯(lián)關(guān)系圖;
連通子圖模塊,用于基于所述關(guān)聯(lián)關(guān)系圖進(jìn)行拆分處理得到多個(gè)表征單個(gè)個(gè)體的連通子圖。
第五方面,本發(fā)明實(shí)施例提供一種個(gè)體識(shí)別裝置,包括:
查詢模塊,用于根據(jù)搜索項(xiàng)查詢連通子圖,獲取與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖;
識(shí)別模塊,用于基于與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖進(jìn)行個(gè)體識(shí)別。
在一個(gè)可能的設(shè)計(jì)中,所述數(shù)據(jù)處理裝置/個(gè)體識(shí)別裝置的結(jié)構(gòu)中包括處理器和存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)支持述數(shù)據(jù)處理裝置/個(gè)體識(shí)別裝置執(zhí)行上述第一方面/第三方面的方法的程序,所述處理器被配置為用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序。所述數(shù)據(jù)處理裝置/個(gè)體識(shí)別裝置還可以包括通信接口,用于數(shù)據(jù)處理裝置/個(gè)體識(shí)別裝置與其他設(shè)備或通信網(wǎng)絡(luò)通信。
第六方面,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),用于儲(chǔ)存前述數(shù)據(jù)處理裝置/個(gè)體識(shí)別裝置所用的計(jì)算機(jī)軟件指令,所述指令被執(zhí)行以實(shí)現(xiàn)前述第一方面/第三方面的方法。
本發(fā)明實(shí)施例能夠?qū)崿F(xiàn)準(zhǔn)確的個(gè)體識(shí)別,或者為準(zhǔn)確地實(shí)現(xiàn)個(gè)體識(shí)別提供數(shù)據(jù)基礎(chǔ)以及數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)。
本發(fā)明的這些方面或其他方面在以下實(shí)施例的描述中會(huì)更加簡(jiǎn)明易懂。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理方法的流程示意圖;
圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理方法的流程示意圖;
圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的示意圖;
圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的個(gè)體識(shí)別方法的流程示意圖;
圖5示出了與本發(fā)明一個(gè)實(shí)施例的應(yīng)用于自然人識(shí)別的數(shù)據(jù)處理方法的流程示意圖;
圖6a示出了一種實(shí)現(xiàn)圖5所示實(shí)施例中的處理504的流程;
圖6b-圖6g示出了在一種假設(shè)情況下對(duì)應(yīng)于圖5所示實(shí)施例中的相關(guān)步驟的連通子圖的示例;
圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理裝置的框圖;
圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的個(gè)體識(shí)別裝置的框圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。
在本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的描述的一些流程中,包含了按照特定順序出現(xiàn)的多個(gè)操作,但是應(yīng)該清楚了解,這些操作可以不按照其在本文中出現(xiàn)的順序來(lái)執(zhí)行或并行執(zhí)行,操作的序號(hào)如101、102等,僅僅是用于區(qū)分開(kāi)各個(gè)不同的操作,序號(hào)本身不代表任何的執(zhí)行順序。另外,這些流程可以包括更多或更少的操作,并且這些操作可以按順序執(zhí)行或并行執(zhí)行。需要說(shuō)明的是,本文中的“第一”、“第二”等描述,是用于區(qū)分不同的消息、設(shè)備、模塊等,不代表先后順序,也不限定“第一”和“第二”是不同的類型。
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
圖1是根據(jù)本發(fā)明實(shí)施例的一種應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理方法的流程示意圖的一例。參照?qǐng)D1,所述方法包括:
100:根據(jù)表征用戶身份的id屬性確定不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,表征用戶身份的id屬性可以包括:賬號(hào)系統(tǒng)中的passportid(簡(jiǎn)寫(xiě)為pass)、用戶的手機(jī)號(hào)、imei設(shè)備碼、手機(jī)sim卡、銀行卡號(hào)、微信支付賬號(hào)、支付寶支付賬號(hào)等互聯(lián)網(wǎng)應(yīng)用賬號(hào)。
102:根據(jù)所述不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系建立以用戶標(biāo)識(shí)和id屬性為節(jié)點(diǎn)的關(guān)聯(lián)關(guān)系圖。在本實(shí)施例中,采用102建立的關(guān)聯(lián)關(guān)系圖用于反映各個(gè)用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系。
104:基于所述關(guān)聯(lián)關(guān)系圖進(jìn)行拆分處理得到多個(gè)表征單個(gè)個(gè)體的連通子圖。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,基于連通圖理論采用連通圖算法對(duì)所述關(guān)聯(lián)關(guān)系圖進(jìn)行拆分處理。
采用本實(shí)施例提供的數(shù)據(jù)處理方法,采用網(wǎng)圖(即所述關(guān)聯(lián)關(guān)系圖)的方式構(gòu)建各個(gè)用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系,并通過(guò)拆分得到的連通子圖表征個(gè)體,有利于在個(gè)體具有復(fù)雜信息(例如,多賬戶、多設(shè)備等)的情況下準(zhǔn)確識(shí)別個(gè)體。
需要說(shuō)明的是,在本發(fā)明中提及的“個(gè)體”可以理解為具有復(fù)雜信息的對(duì)象,并且這些復(fù)雜信息實(shí)際指向或標(biāo)識(shí)同一個(gè)對(duì)象。例如,“自然人”可以作為“個(gè)體”的一種示例,網(wǎng)絡(luò)系統(tǒng)中與自然人類似或與自然人具有相似屬性的對(duì)象(例如,創(chuàng)建的虛擬人物)也可以視為一個(gè)“個(gè)體”。所述自然人是指現(xiàn)實(shí)中的一個(gè)獨(dú)立的人,一個(gè)自然人可能在互聯(lián)網(wǎng)系統(tǒng)中擁有多個(gè)用戶賬號(hào)。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,具體采用以下方式實(shí)現(xiàn)處理100:首先,從每一組表征用戶身份的id屬性中選取一種id屬性作為用戶標(biāo)識(shí),并將該用戶標(biāo)識(shí)與當(dāng)前組表征用戶身份的id屬性關(guān)聯(lián);然后,基于多組用戶標(biāo)識(shí)以及與用戶標(biāo)識(shí)關(guān)聯(lián)的id屬性,確定各個(gè)id屬性所關(guān)聯(lián)的用戶標(biāo)識(shí);其中,如果單個(gè)id屬性關(guān)聯(lián)至少兩個(gè)用戶標(biāo)識(shí),則確定該至少兩個(gè)用戶標(biāo)識(shí)具有關(guān)聯(lián)關(guān)系。
其中,每一組表征用戶身份的id屬性可以通過(guò)對(duì)多數(shù)據(jù)源的數(shù)據(jù)進(jìn)行挖掘而得到。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,在采用處理102建立的關(guān)聯(lián)關(guān)系圖中,具有關(guān)聯(lián)關(guān)系的用戶標(biāo)識(shí)通過(guò)二者共同關(guān)聯(lián)的id屬性連接。在所述關(guān)聯(lián)關(guān)系圖中,不重復(fù)地配置有所有用戶標(biāo)識(shí)和id屬性。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,保存采用處理100-104建立的連通子圖,以作為識(shí)別自然人的基礎(chǔ)。例如,采用如下便于根據(jù)id屬性查詢連通子圖的方式存儲(chǔ)所述連通子圖:存儲(chǔ)所述連通子圖中各個(gè)id屬性與所述連通子圖的標(biāo)識(shí)的映射,以便于根據(jù)id屬性查詢對(duì)應(yīng)的連通子圖的標(biāo)識(shí);存儲(chǔ)所述連通子圖的標(biāo)識(shí)與所述連通子圖的映射,以便于根據(jù)在先確定的連通子圖的標(biāo)識(shí)查詢對(duì)應(yīng)的連通子圖。
圖2是根據(jù)本發(fā)明實(shí)施例的一種應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理方法的流程示意圖的另一例。在該方法中,基于采用前述處理100-104建立的連通子圖更新歷史數(shù)據(jù),從而得到更新的連通子圖。具體而言,如圖2所示,除了包括處理100-104之外,還包括:
206:根據(jù)所述連通子圖中的id屬性查詢歷史數(shù)據(jù)獲取與所述連通子圖關(guān)聯(lián)的歷史連通子圖。其中,所述歷史數(shù)據(jù)用于反映在先確定的用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系。在一種具體示例中,所述歷史數(shù)據(jù)可以是在先建立的關(guān)聯(lián)關(guān)系圖或連通子圖。
208:基于所述連通子圖和所述歷史連通子圖,構(gòu)建更新的連通子圖。
采用本實(shí)現(xiàn)方式中,能夠?qū)?dāng)前確定的連通子圖和在先確定的連通子圖融合,實(shí)現(xiàn)連通子圖的更新。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,分批次地從連通子圖中選取連通子圖從而分批次地構(gòu)建更新的連通子圖,得到最終的更新結(jié)果。
具體而言,處理206可以通過(guò)以下方式實(shí)現(xiàn):從所有連通子圖中分批次地取多個(gè)連通子圖;根據(jù)所述多個(gè)連通子圖所關(guān)聯(lián)的所有id屬性查詢所述歷史數(shù)據(jù),獲取與所述所有id屬性中的各id屬性關(guān)聯(lián)的歷史連通子圖。處理208可以通過(guò)以下方式實(shí)現(xiàn):基于所述多個(gè)連通子圖和所述與各id屬性關(guān)聯(lián)的歷史連通子圖,確定其中所包含的用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系;基于其中所包含的用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系,采用圖論連通圖算法計(jì)算得到更新的連通子圖。換言之,在本實(shí)施例中可以重復(fù)地采用“選取部分連通子圖→查詢→更新”的循環(huán),得到最終的更新結(jié)果。采用這種方式有利于提高數(shù)據(jù)處理效率。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,采用圖1所示實(shí)施例中描述的方式存儲(chǔ)所述更新的連通子圖。
圖3是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的示意圖,該數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)用于存儲(chǔ)采用圖1或圖2所示實(shí)施例或其實(shí)現(xiàn)方式確定的連通子圖。如圖3所示,本實(shí)施例提供的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)包括索引模塊30和內(nèi)容(或者稱作數(shù)據(jù)詳情)模塊32。其中,索引模塊30存儲(chǔ)連通子圖中各個(gè)id屬性與連通子圖的標(biāo)識(shí)(map_key)的映射;而內(nèi)容模塊32則存儲(chǔ)連通子圖的標(biāo)識(shí)與連通子圖(map)(即連通子圖的內(nèi)容)的映射。
采用本實(shí)施例提供的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),在查詢連通子圖時(shí),可以根據(jù)id屬性查詢索引模塊30得到對(duì)應(yīng)的連通子圖的標(biāo)識(shí),然后根據(jù)連通子圖的標(biāo)識(shí)查詢內(nèi)容模塊32得到對(duì)應(yīng)的連通子圖。換言之,采用本實(shí)施例提供的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),能夠支持利用任意id屬性查詢關(guān)聯(lián)的連通子圖。
圖4是根據(jù)本發(fā)明實(shí)施例的一種個(gè)體識(shí)別方法的流程示意圖。該方法基于圖1所示實(shí)施例提供的連通子圖或圖2所示實(shí)施例提供的更新的連通子圖進(jìn)行查詢。具體而言,所述方法包括:
400:根據(jù)搜索項(xiàng)查詢連通子圖,獲取與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖。其中,搜索項(xiàng)為id屬性或者基于所述搜索項(xiàng)可以確定id屬性,與搜索項(xiàng)關(guān)聯(lián)的連通子圖為包含所述搜索項(xiàng)或包含基于所述搜索項(xiàng)確定的id屬性。
402:基于與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖進(jìn)行個(gè)體識(shí)別。
如前所述,連通子圖用于表征單個(gè)個(gè)體,因此,基于與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖可以確定所表征的個(gè),例如,自然人。
采用本實(shí)施例提供的方法,能夠基于連通子圖識(shí)別個(gè)體,對(duì)于在互聯(lián)網(wǎng)中具有復(fù)雜信息(例如,多賬號(hào)、多設(shè)備等)的自然人能夠進(jìn)行準(zhǔn)確的識(shí)別。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,采用以下方式實(shí)現(xiàn)處理402:根據(jù)配置信息從與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖選取滿足所述配置信息的部分連通子圖;基于所述部分連通子圖中包含的用戶標(biāo)識(shí)確定所述自然人。示例性地,在所述配置信息中可以配置黑名單、不需要關(guān)聯(lián)的id屬性等,這將在下文進(jìn)行詳細(xì)說(shuō)明。
圖5是根據(jù)本發(fā)明實(shí)施例的一種應(yīng)用于自然人識(shí)別的數(shù)據(jù)處理方法的流程示意圖。參照?qǐng)D5,所述方法包括:
500:數(shù)據(jù)獲取與預(yù)處理。數(shù)據(jù)獲取與預(yù)處理的目的是為了挖掘出表征用戶身份的多種id屬性,并將其格式化處理,以方便后續(xù)處理。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,采用以下方式實(shí)現(xiàn)處理500。
步驟a1:獲取原始數(shù)據(jù)。所述原始數(shù)據(jù)包括用戶注冊(cè)數(shù)據(jù)、用戶交易數(shù)據(jù)、用戶設(shè)備信息、用戶瀏覽日志、業(yè)務(wù)人員注冊(cè)數(shù)據(jù)、業(yè)務(wù)人員操作日志等。
步驟a2:對(duì)所述原始數(shù)據(jù)進(jìn)行清洗以去除無(wú)效的數(shù)據(jù)。其中,無(wú)效的數(shù)據(jù)是指由于硬軟件等方面的原因產(chǎn)生的不準(zhǔn)確的數(shù)據(jù)。例如,在獲取imei設(shè)備碼時(shí),某些相同型號(hào)的山寨機(jī)會(huì)產(chǎn)生相同的imei,如果不清洗,會(huì)導(dǎo)致錯(cuò)誤的關(guān)聯(lián)。
步驟a3:從清洗后的數(shù)據(jù)中挖掘表征用戶身份的id屬性,并生成以其中一種id屬性作為標(biāo)識(shí)的格式化數(shù)據(jù),格式如下:pass(id1,id2,idi,…,idn)。
下例中的pass1、pass2和pass3是用戶賬號(hào),被用作用戶標(biāo)識(shí),id則是與用戶賬號(hào)關(guān)聯(lián)的數(shù)據(jù),例如手機(jī)號(hào),設(shè)備碼,支付賬號(hào)等等。
例如,有兩個(gè)數(shù)據(jù)源a和b,二者分別提供了三個(gè)賬號(hào)的數(shù)據(jù)。其中,數(shù)據(jù)源a包括pass1(id1a),pass2(id1a),pass3(id2a),數(shù)據(jù)源b包括pass1(id1b),pass2(id2b),pass3(id2b)。通過(guò)挖掘id屬性,格式化后生成:pass1(id1a,id1b),pass2(id1a,id2b),pass3(id2a,id2b)。
502:基于500輸出的數(shù)據(jù)確定連通關(guān)系??蛇x地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,采用以下步驟實(shí)現(xiàn)處理502。
步驟b1:將上述步驟a3生成的數(shù)據(jù)轉(zhuǎn)換為以id為標(biāo)識(shí)、pass為內(nèi)容的結(jié)構(gòu),通過(guò)多個(gè)pass之間共同的id發(fā)現(xiàn)它們之間的關(guān)聯(lián)。例如,上例中的pass1(id1a,id1b),pass2(id1a,id2b),pass3(id2a,id2b)轉(zhuǎn)換為:
id1a:pass1,pass2
id2a:pass3
id1b:pass1
id2b:pass2,pass3
步驟b2:對(duì)步驟b1的結(jié)果數(shù)據(jù)進(jìn)行統(tǒng)計(jì),把含有相同id的pass賬號(hào)關(guān)聯(lián)在一起,從而生成任意兩個(gè)pass之間的關(guān)聯(lián)關(guān)系。例如,根據(jù)步驟b1中的結(jié)果,生成:
pass1,pass2:id1a
pass2,pass3:id2b
其中,pass1和pass2因?yàn)閕d1a而產(chǎn)生關(guān)聯(lián),pass2和pass3則根據(jù)id2b關(guān)聯(lián)。
步驟b3:根據(jù)步驟b2中得到的賬號(hào)之間的兩兩關(guān)聯(lián)關(guān)系,生成關(guān)系網(wǎng)圖,然后利用圖論連通圖算法,計(jì)算得出所有的連通子圖。繼續(xù)上面的例子,在步驟b3中,根據(jù)步驟b2得到的結(jié)果(pass1和pass2關(guān)聯(lián)、pass2和pass3關(guān)聯(lián)),得到pass1,pass2,pass3相互關(guān)聯(lián)。這里,將pass1,pass2,pass3以及與它們關(guān)聯(lián)的id構(gòu)成的連通子圖稱之為一個(gè)map。
至此,根據(jù)收集的用戶數(shù)據(jù)構(gòu)建了數(shù)據(jù)(包括用戶標(biāo)識(shí)和id)之間的連通關(guān)系。在本實(shí)施例的一種實(shí)現(xiàn)方式中,為了保證持續(xù)的更新,需要將新產(chǎn)生的連通關(guān)系與歷史的連通關(guān)系融合。其中,第一次構(gòu)建時(shí),通過(guò)冷啟動(dòng)產(chǎn)生第一批歷史數(shù)據(jù),之后持續(xù)融合更新。
504:更新連通關(guān)系。具體而言,將502中生成的所有連通子圖融合進(jìn)歷史連通關(guān)系中。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,如圖6a所示,處理504包括以下步驟:
步驟c1:構(gòu)造處理緩存。為了加快處理速度,分批次地從新生成的所有連通子圖中獲取多個(gè)連通子圖(即,map)進(jìn)行處理,所述處理緩存用于緩存這多個(gè)map。例如,假設(shè)當(dāng)前的處理緩存中包含如圖6b所示的3個(gè)新連通子圖,其中,pass3和pass4處于同一個(gè)連通子圖中,兩者因?yàn)閥、z而關(guān)聯(lián);a-z是除pass外其他類型的id。
步驟c2:查詢是否有歷史記錄。具體而言,利用處理緩存的map中所包含的所有id從歷史關(guān)聯(lián)關(guān)系中查詢,檢查各id是否在歷史關(guān)聯(lián)關(guān)系中出現(xiàn)過(guò)。如果出現(xiàn)過(guò),則返回對(duì)應(yīng)的歷史map并執(zhí)行步驟c3;如果沒(méi)有則直接寫(xiě)入存儲(chǔ)。
為了支持利用任意id查詢關(guān)聯(lián)的map,可以采用圖3所述的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)存儲(chǔ)map。具體請(qǐng)參見(jiàn)下文相關(guān)部分的說(shuō)明。
舉例而言,對(duì)于步驟c1中的pass1、pass2、pass3、pass4和它們所關(guān)聯(lián)的id(a-z)執(zhí)行查詢處理,發(fā)現(xiàn)b、c、e、x在歷史數(shù)據(jù)中關(guān)聯(lián)了如圖6c所示的兩個(gè)map。
步驟c3:數(shù)據(jù)融合處理。具體而言,融合采用步驟c2從歷史數(shù)據(jù)中查詢得到的map和當(dāng)前處理緩存中的map,重新生成pass與id之間的關(guān)系,然后確定pass之間的兩兩關(guān)聯(lián),進(jìn)而根據(jù)圖論連通圖算法計(jì)算連通子圖(類似于步驟b3)。
繼續(xù)上面的例子,對(duì)步驟c1和c2中的連通子圖進(jìn)行融合,生成如圖6d所示的連通子圖。
步驟c4:刪除黑名單id。例如,根據(jù)黑名單優(yōu)化上述步驟c3融合后得到的連通子圖。具體而言,刪除其中的黑名單id,所述黑名單id包括不準(zhǔn)確的id、過(guò)期的id等,可以自定義或配置。
繼續(xù)上面的例子,假設(shè)c在黑名單中,則拆除因?yàn)閏而產(chǎn)生的關(guān)聯(lián),如圖6e所示。
步驟c5:生成融合后的連通圖。例如,在通過(guò)步驟c4剔除黑名單id之后,重新構(gòu)造pass之間的關(guān)聯(lián)關(guān)系,生成最終map。
步驟c6:數(shù)據(jù)存儲(chǔ)。具體而言,將508生成的最終map寫(xiě)入存儲(chǔ)中。其中,存儲(chǔ)分為索引和數(shù)據(jù)詳情(內(nèi)容)兩部分。為便于后續(xù)查詢方便,為每一個(gè)map生成一個(gè)唯一的標(biāo)識(shí)map_key,利用map_key連接map中的每一個(gè)id和map詳情,從而滿足通過(guò)任意id查詢map的需求。
例如,以如圖6e所示的兩個(gè)map為例,假設(shè)生成的map_key分別為map_key_pass1,map_key_pass3,則
map索引:
a---→map_key_pass1;
b---→map_key_pass1;
d---→map_key_pass1;
…
pass1---→map_key_pass1;
…
x---→map_key_pass3;
y---→map_key_pass3;
…
pass6---→map_key_pass3;
map數(shù)據(jù)詳情:
map_key_pass1---→pass1,pass2,pass5,a,b,d,e,f
map_key_pass3---→pass3,pass4,pass6,x,y,z
基于上述存儲(chǔ)結(jié)構(gòu),在查詢時(shí)可以根據(jù)任意id從索引中查找出map_key,然后根據(jù)map_key從數(shù)據(jù)詳情中查詢出map數(shù)據(jù)。
506:識(shí)別自然人。采用前述500-504構(gòu)建了數(shù)據(jù)間的所有連通子圖,提供了基礎(chǔ)性的數(shù)據(jù)。因此,在處理506中可以基于前述構(gòu)建的連通子圖識(shí)別自然人。
在本實(shí)施例中的一種實(shí)現(xiàn)方式中,考慮到不同業(yè)務(wù)對(duì)于同一自然人的認(rèn)定不盡相同,例如,有的業(yè)務(wù)在判斷是否享受優(yōu)惠時(shí)認(rèn)為手機(jī)號(hào)應(yīng)該作為關(guān)聯(lián)id,而有的業(yè)務(wù)則不認(rèn)為手機(jī)號(hào)應(yīng)該作為關(guān)聯(lián)id,從而引入業(yè)務(wù)自定義配置來(lái)實(shí)現(xiàn)因業(yè)務(wù)不同而不同的識(shí)別處理。具體而言,在所述自定義配置中可以配置業(yè)務(wù)不產(chǎn)生關(guān)聯(lián)的id。這樣,在業(yè)務(wù)方獲取到map詳情數(shù)據(jù)后,刪除其中的在配置信息中包含的id并消除對(duì)應(yīng)的關(guān)聯(lián),從而生成符合業(yè)務(wù)要求的map數(shù)據(jù)。
舉例而言,假設(shè)查找id為a所關(guān)聯(lián)的map,得到的map信息如圖6f所示,而配置信息中將b配置為不產(chǎn)生關(guān)聯(lián)的id。則在處理506中,將圖6f所示的map中的b所產(chǎn)生的關(guān)聯(lián)刪除,如圖6g所示,其中虛線表示刪除關(guān)聯(lián)。這樣,最終返回的數(shù)據(jù)為:a、pass1(即,在所述配置信息配置的條件下,與a關(guān)聯(lián)的map包含a和pass1)。
采用處理506,可以基于自定義配置(即配置信息)滿足不同業(yè)務(wù)對(duì)于識(shí)別自然人的要求。
以上結(jié)合附圖對(duì)根據(jù)本發(fā)明的方法實(shí)施例進(jìn)行了詳細(xì)說(shuō)明。下面結(jié)合附圖對(duì)根據(jù)本發(fā)明實(shí)施例的裝置實(shí)施例進(jìn)行說(shuō)明。
圖7是根據(jù)本發(fā)明實(shí)施例的一種應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理裝置的框圖。參照?qǐng)D7,數(shù)據(jù)處理裝置包括關(guān)系確定模塊70、關(guān)聯(lián)關(guān)系圖模塊72和連通子圖模塊74,下面進(jìn)行詳細(xì)說(shuō)明。
在本實(shí)施例中,關(guān)系確定模塊70用于根據(jù)表征用戶身份的id屬性確定不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系。示例性地,關(guān)系確定模塊70可以包括:第一關(guān)聯(lián)子模塊,用于從每一組表征用戶身份的id屬性中選取一種id屬性作為用戶標(biāo)識(shí),并將該用戶標(biāo)識(shí)與當(dāng)前組表征用戶身份的id屬性關(guān)聯(lián);第二關(guān)聯(lián)子模塊,用于基于多組用戶標(biāo)識(shí)以及與用戶標(biāo)識(shí)關(guān)聯(lián)的id屬性,確定各個(gè)id屬性所關(guān)聯(lián)的用戶標(biāo)識(shí);關(guān)系確定子模塊,用于將關(guān)聯(lián)于同一id屬性的至少兩個(gè)用戶標(biāo)識(shí)確定為具有關(guān)聯(lián)關(guān)系。
在本實(shí)施例中,關(guān)聯(lián)關(guān)系圖模塊72用于根據(jù)所述不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系建立以用戶標(biāo)識(shí)和id屬性為節(jié)點(diǎn)的關(guān)聯(lián)關(guān)系圖。在所述關(guān)聯(lián)關(guān)系圖中,具有關(guān)聯(lián)關(guān)系的用戶標(biāo)識(shí)通過(guò)二者共同關(guān)聯(lián)的id屬性連接。
在本實(shí)施例中,連通子圖模塊74用于基于所述關(guān)聯(lián)關(guān)系圖進(jìn)行拆分處理得到多個(gè)表征單個(gè)個(gè)體的連通子圖。
采用本實(shí)施例提供的數(shù)據(jù)處理裝置,利用網(wǎng)圖的方式構(gòu)建各個(gè)用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系,并通過(guò)拆分得到的連通子圖表征個(gè)體,有利于在個(gè)體具有復(fù)雜信息(例如,多賬戶、多設(shè)備等)的情況下準(zhǔn)確識(shí)別個(gè)體。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,如圖7中虛線框所示,數(shù)據(jù)處理裝置還包括:查詢模塊76,用于根據(jù)所述連通子圖中的id屬性查詢歷史數(shù)據(jù)獲取與所述連通子圖關(guān)聯(lián)的歷史連通子圖;更新模塊78,用于基于所述連通子圖和所述歷史連通子圖,構(gòu)建更新的連通子圖。
其中,示例性地,所述查詢模塊76包括:取出子模塊,用于從所述連通子圖中分批次地取多個(gè)連通子圖;查詢子模塊,用于根據(jù)所述多個(gè)連通子圖所關(guān)聯(lián)的所有id屬性查詢所述歷史數(shù)據(jù),獲取與所述所有id屬性中的各id屬性關(guān)聯(lián)的歷史連通子圖。
其中,示例性地,所述更新模塊78包括:關(guān)系確定子模塊,用于基于所述多個(gè)連通子圖和所述與各id屬性關(guān)聯(lián)的歷史連通子圖,確定其中所包含的用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系;更新子模塊,用于基于關(guān)系確定子模塊確定的關(guān)聯(lián)關(guān)系,采用圖論連通圖算法計(jì)算得到更新的連通子圖。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,數(shù)據(jù)處理裝置還包括存儲(chǔ)模塊,用于存儲(chǔ)連通子圖模塊74生成的連通子圖和/或更新模塊78生成的更新的連通子圖。更具體而言,所述存儲(chǔ)模塊包括:第一存儲(chǔ)模塊,用于存儲(chǔ)連通子圖中各個(gè)id屬性與連通子圖的標(biāo)識(shí)的映射;第二存儲(chǔ)模塊,用于存儲(chǔ)連通子圖的標(biāo)識(shí)與連通子圖的映射。參照?qǐng)D3所示實(shí)施例,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,第一存儲(chǔ)模塊可以用作索引模塊30,第二存儲(chǔ)模塊可以用作內(nèi)容模塊32。
圖8是根據(jù)本發(fā)明實(shí)施例的一種個(gè)體識(shí)別裝置的框圖。參照?qǐng)D8,個(gè)體識(shí)別裝置包括查詢模塊80和識(shí)別模塊82。下面進(jìn)行詳細(xì)說(shuō)明。
在本實(shí)施例中,查詢模塊80用于根據(jù)搜索項(xiàng)查詢已經(jīng)確定的連通子圖(例如,圖1所示實(shí)施例中生成的連通子圖或圖2所示實(shí)施例中更新的連通子圖),獲取與搜索項(xiàng)關(guān)聯(lián)的連通子圖。識(shí)別模塊82則用于基于與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖進(jìn)行個(gè)體識(shí)別。
可選地,在本實(shí)施例的一種實(shí)現(xiàn)方式中,識(shí)別模塊82包括:選取子模塊,用于根據(jù)配置信息從與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖中選取滿足所述配置信息的部分連通子圖;識(shí)別子模塊,用于基于所述部分連通子圖中包含的用戶標(biāo)識(shí)確定所述個(gè)體。
在一個(gè)可能的設(shè)計(jì)中,前文所述的數(shù)據(jù)處理裝置/個(gè)體識(shí)別裝置的結(jié)構(gòu)中包括處理器和存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)支持所述數(shù)據(jù)處理裝置/個(gè)體識(shí)別裝置執(zhí)行前述對(duì)應(yīng)的方法實(shí)施例或其實(shí)現(xiàn)方式中提及的方法的程序,所述處理器被配置為用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序。
所述程序包括一條或多條計(jì)算機(jī)指令,其中,所述一條或多條計(jì)算機(jī)指令供所述處理器調(diào)用執(zhí)行。
在所述數(shù)據(jù)處理裝置中,所述處理器用于執(zhí)行所述指令以實(shí)現(xiàn)以下處理:
根據(jù)表征用戶身份的id屬性確定不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系;
根據(jù)所述不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系建立以用戶標(biāo)識(shí)和id屬性為節(jié)點(diǎn)的關(guān)聯(lián)關(guān)系圖;
基于所述關(guān)聯(lián)關(guān)系圖進(jìn)行拆分處理得到多個(gè)表征單個(gè)個(gè)體的連通子圖。
其中,關(guān)于各個(gè)步驟以及可選步驟的詳細(xì)說(shuō)明,請(qǐng)參照前文的相關(guān)描述,此處不再追溯。
在所述個(gè)體識(shí)別裝置中,所述處理器用于執(zhí)行所述指令以實(shí)現(xiàn)以下處理:
根據(jù)搜索項(xiàng)查詢連通子圖(包括更新的連通子圖或已建立的連通子圖),獲取與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖;
基于與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖進(jìn)行自然人識(shí)別。
其中,關(guān)于各個(gè)步驟以及可選步驟的詳細(xì)說(shuō)明,請(qǐng)參照前文的相關(guān)描述,此處不再追溯。
本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),用于儲(chǔ)存所述數(shù)據(jù)處理裝置/個(gè)體識(shí)別裝置所用的計(jì)算機(jī)軟件指令,所述計(jì)算機(jī)指令被執(zhí)行時(shí)實(shí)現(xiàn)上述相應(yīng)方法實(shí)施例或其實(shí)現(xiàn)方式中提及的方法。
【關(guān)于本發(fā)明的示例性應(yīng)用場(chǎng)景】
示例性地,本發(fā)明可以用于外賣系統(tǒng)的用戶營(yíng)銷和風(fēng)控場(chǎng)景中。其中,以應(yīng)用于用戶營(yíng)銷場(chǎng)景為例,當(dāng)多個(gè)用戶pass被判斷為屬于一個(gè)map時(shí),將這多個(gè)用戶pass認(rèn)定為同一個(gè)個(gè)體,這樣,如果其中一個(gè)pass已經(jīng)享受了優(yōu)惠,則其他pass不在享受優(yōu)惠,從而提高了營(yíng)銷資金的使用率。再以應(yīng)用于風(fēng)控場(chǎng)景為例,根據(jù)多個(gè)pass之間的關(guān)聯(lián)可以挖掘出它們的消費(fèi)行為,進(jìn)而判斷是否存在一個(gè)自然人使用多個(gè)pass賬號(hào)刷單套取補(bǔ)貼的情況。
相對(duì)于現(xiàn)有技術(shù)而言,本發(fā)明提供的各種實(shí)施例或其實(shí)現(xiàn)方式,能夠解決同設(shè)備上多賬戶注冊(cè)、用戶未登陸賬號(hào)、跨端跨設(shè)備以及多重身份等情況下難以識(shí)別個(gè)體(例如,自然人)的技術(shù)問(wèn)題,能夠準(zhǔn)確識(shí)別個(gè)體(例如,自然人)。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述裝置和模塊的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部模塊來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動(dòng)的情況下,即可以理解并實(shí)施。
通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實(shí)施方式可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件?;谶@樣的理解,上述技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如rom/ram、磁碟、光盤(pán)等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
最后應(yīng)說(shuō)明的是:以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
本發(fā)明公開(kāi)a1、一種應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理方法,包括:
根據(jù)表征用戶身份的id屬性確定不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系;
根據(jù)所述不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系建立以用戶標(biāo)識(shí)和id屬性為節(jié)點(diǎn)的關(guān)聯(lián)關(guān)系圖;
基于所述關(guān)聯(lián)關(guān)系圖進(jìn)行拆分處理得到多個(gè)表征單個(gè)個(gè)體的連通子圖。
a2、如a1所述的方法中,所述根據(jù)表征用戶身份的id屬性確定不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系,包括:
從每一組表征用戶身份的id屬性中選取一種id屬性作為用戶標(biāo)識(shí),并將該用戶標(biāo)識(shí)與當(dāng)前組表征用戶身份的id屬性關(guān)聯(lián);
基于多組用戶標(biāo)識(shí)以及與用戶標(biāo)識(shí)關(guān)聯(lián)的id屬性,確定各個(gè)id屬性所關(guān)聯(lián)的用戶標(biāo)識(shí);
如果單個(gè)id屬性關(guān)聯(lián)至少兩個(gè)用戶標(biāo)識(shí),則確定該至少兩個(gè)用戶標(biāo)識(shí)具有關(guān)聯(lián)關(guān)系。
a3、如a1或a2所述的方法中,在所述關(guān)聯(lián)關(guān)系圖中,具有關(guān)聯(lián)關(guān)系的用戶標(biāo)識(shí)通過(guò)二者共同關(guān)聯(lián)的id屬性連接。
a4、如a1所述的方法,還包括:
存儲(chǔ)所述連通子圖中各個(gè)id屬性與所述連通子圖的標(biāo)識(shí)的映射(例如,用作索引);
存儲(chǔ)所述連通子圖的標(biāo)識(shí)與所述連通子圖的映射(例如,用作與所述索引對(duì)應(yīng)的內(nèi)容/數(shù)據(jù)詳情)。
a5、如a1或a4所述的方法中,還包括:
根據(jù)所述連通子圖中的id屬性查詢歷史數(shù)據(jù)獲取與所述連通子圖關(guān)聯(lián)的歷史連通子圖;
基于所述連通子圖和所述歷史連通子圖構(gòu)建更新的連通子圖。
a6、如a5所述的方法,所述根據(jù)所述連通子圖中的id屬性查詢歷史數(shù)據(jù)獲取與所述連通子圖關(guān)聯(lián)的歷史連通子圖,包括:
從所述連通子圖中分批次地取多個(gè)連通子圖;
根據(jù)所述多個(gè)連通子圖所關(guān)聯(lián)的所有id屬性查詢所述歷史數(shù)據(jù),獲取與所述所有id屬性中的各id屬性關(guān)聯(lián)的歷史連通子圖。
a7、如a6所述的方法,所述基于所述連通子圖和所述歷史連通子圖構(gòu)建更新的連通子圖,包括:
基于所述多個(gè)連通子圖和所述與各id屬性關(guān)聯(lián)的歷史連通子圖,確定其中所包含的用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系;
基于其中所包含的用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系,采用圖論連通圖算法計(jì)算得到更新的連通子圖。
本發(fā)明還公開(kāi)了b8、一種數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),該數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)用于存儲(chǔ)采用如a1-a4中任一項(xiàng)所述的方法得到的連通子圖或采用如a5-a7中任一項(xiàng)所述的方法得到的更新的連通子圖,包括:
索引模塊,用于存儲(chǔ)連通子圖中各個(gè)id屬性與所述連通子圖的標(biāo)識(shí)的映射;
內(nèi)容模塊,用于存儲(chǔ)所述連通子圖的標(biāo)識(shí)與所述連通子圖的映射。
本發(fā)明還公開(kāi)了c9、一種個(gè)體識(shí)別方法,包括:
根據(jù)搜索項(xiàng)查詢采用如a1-a4中任一項(xiàng)所述的方法生成的連通子圖或采用如a5-a7中任一項(xiàng)所述的方法生成的更新的連通子圖,獲取與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖;
基于與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖進(jìn)行個(gè)體識(shí)別。
c10、如c9所述的方法,所述基于與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖進(jìn)行個(gè)體識(shí)別,包括:
根據(jù)配置信息從與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖選取滿足所述配置信息的部分連通子圖;
基于所述部分連通子圖中包含的用戶標(biāo)識(shí)確定所述個(gè)體。
本發(fā)明還公開(kāi)了d11、一種應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理裝置,包括:
關(guān)系確定模塊,用于根據(jù)表征用戶身份的id屬性確定不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系;
關(guān)聯(lián)關(guān)系圖模塊,用于根據(jù)所述不同用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系建立以用戶標(biāo)識(shí)和id屬性為節(jié)點(diǎn)的關(guān)聯(lián)關(guān)系圖;
連通子圖模塊,用于基于所述關(guān)聯(lián)關(guān)系圖進(jìn)行拆分處理得到多個(gè)表征單個(gè)個(gè)體的連通子圖。
d12、如d11所述的裝置,所述關(guān)系確定模塊包括:
第一關(guān)聯(lián)子模塊,用于從每一組表征用戶身份的id屬性中選取一種id屬性作為用戶標(biāo)識(shí),并將該用戶標(biāo)識(shí)與當(dāng)前組表征用戶身份的id屬性關(guān)聯(lián);
第二關(guān)聯(lián)子模塊,用于基于多組用戶標(biāo)識(shí)以及與用戶標(biāo)識(shí)關(guān)聯(lián)的id屬性,確定各個(gè)id屬性所關(guān)聯(lián)的用戶標(biāo)識(shí);
關(guān)系確定子模塊,用于將關(guān)聯(lián)于同一id屬性的至少兩個(gè)用戶標(biāo)識(shí)確定為具有關(guān)聯(lián)關(guān)系。
d13、如d11或d12所述的裝置,在所述關(guān)聯(lián)關(guān)系圖中,具有關(guān)聯(lián)關(guān)系的用戶標(biāo)識(shí)通過(guò)二者共同關(guān)聯(lián)的id屬性連接。
d14、如d11所述的裝置,還包括:
第一存儲(chǔ)模塊,用于存儲(chǔ)連通子圖中各個(gè)id屬性與所述連通子圖的標(biāo)識(shí)的映射;
第二存儲(chǔ)模塊,用于存儲(chǔ)所述連通子圖的標(biāo)識(shí)與所述連通子圖的映射。
d15、如d11或d14所述的裝置,還包括:
查詢模塊,用于根據(jù)所述連通子圖中的id屬性查詢歷史數(shù)據(jù)獲取與所述連通子圖關(guān)聯(lián)的歷史連通子圖;
更新模塊,用于基于所述連通子圖和所述歷史連通子圖,構(gòu)建更新的連通子圖。
d16、如d15所述的裝置,所述查詢模塊包括:
取出子模塊,用于從所述連通子圖中分批次地取多個(gè)連通子圖;
查詢子模塊,用于根據(jù)所述多個(gè)連通子圖所關(guān)聯(lián)的所有id屬性查詢所述歷史數(shù)據(jù),獲取與所述所有id屬性中的各id屬性關(guān)聯(lián)的歷史連通子圖。
d17、如d16所述的裝置,所述更新模塊包括:
關(guān)系確定子模塊,用于基于所述多個(gè)連通子圖和所述與各id屬性關(guān)聯(lián)的歷史連通子圖,確定其中所包含的用戶標(biāo)識(shí)之間的關(guān)聯(lián)關(guān)系;
更新子模塊,用于基于關(guān)系確定子模塊確定的關(guān)聯(lián)關(guān)系,采用圖論連通圖算法計(jì)算得到更新的連通子圖。
本發(fā)明還公開(kāi)e18、一種個(gè)體識(shí)別裝置,包括:
查詢模塊,用于根據(jù)搜索項(xiàng)查詢采用如a1-a4中任一項(xiàng)所述的方法生成的連通子圖或采用如權(quán)利要求a5-a7中任一項(xiàng)所述的方法生成的更新的連通子圖,獲取與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖;
識(shí)別模塊,用于基于與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖進(jìn)行個(gè)體識(shí)別。
e19、如e18所述的裝置,所述識(shí)別模塊包括:
選取子模塊,用于根據(jù)配置信息從與所述搜索項(xiàng)關(guān)聯(lián)的連通子圖中選取滿足所述配置信息的部分連通子圖;
識(shí)別子模塊,用于基于所述部分連通子圖中包含的用戶標(biāo)識(shí)確定所述個(gè)體。
本發(fā)明還公開(kāi)了f20、一種應(yīng)用于個(gè)體識(shí)別的數(shù)據(jù)處理裝置,包括存儲(chǔ)器和處理器;其中,
所述存儲(chǔ)器用于存儲(chǔ)一條或多條計(jì)算機(jī)指令,其中,所述一條或多條計(jì)算機(jī)指令供所述處理器調(diào)用執(zhí)行;
所述處理器用于執(zhí)行所述計(jì)算機(jī)指令以實(shí)現(xiàn)如a1-a7中任一項(xiàng)所述的數(shù)據(jù)處理方法。
本發(fā)明還公開(kāi)了g21、一種個(gè)體識(shí)別裝置,包括存儲(chǔ)器和處理器;其中,
所述存儲(chǔ)器用于存儲(chǔ)一條或多條計(jì)算機(jī)指令,其中,所述一條或多條計(jì)算機(jī)指令供所述處理器調(diào)用執(zhí)行;
所述處理器用于執(zhí)行所述計(jì)算機(jī)指令以實(shí)現(xiàn)如c9或c10所述的個(gè)體識(shí)別方法。
本發(fā)明還公開(kāi)了h22、一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被執(zhí)行時(shí)實(shí)現(xiàn)如a1-a7或c9-c10中任一項(xiàng)所述的方法。