本申請(qǐng)屬于信息處理技術(shù)領(lǐng)域,具體地說,涉及一種主體檢測(cè)方法及裝置。
背景技術(shù):
主體是指自然人、自然人形成的群體或者自然人在網(wǎng)絡(luò)中對(duì)應(yīng)的一個(gè)帳號(hào)。
在很多業(yè)務(wù)場(chǎng)景中,存在從一群主體中發(fā)現(xiàn)特殊主體的需求,也即,需要對(duì)主體進(jìn)行檢測(cè),以檢測(cè)出滿足一定條件的目標(biāo)主體。例如在一群用戶中尋找哪些用戶更有可能購買本公司生產(chǎn)的產(chǎn)品或服務(wù)。再比如,在數(shù)億人中尋找有實(shí)施恐怖襲擊風(fēng)險(xiǎn)的人;又如,從大量支付賬號(hào)中尋找存在風(fēng)險(xiǎn)的支付賬號(hào)等。
對(duì)主體的檢測(cè)是依據(jù)主體使用的介質(zhì)進(jìn)行的,主體使用的介質(zhì)可以包括不同的介質(zhì)類型,如主體的屬性,也即年齡、職業(yè)、收入、所在地等,主體的行為如從搜索引擎跳轉(zhuǎn)到商品頁面的瀏覽行為、在非安全環(huán)境修改密碼的行為等特征。
現(xiàn)有技術(shù)中,對(duì)主體的檢測(cè),通常是判斷主體是否使用了滿足目標(biāo)條件的介質(zhì),如果是,則可以確定主體為目標(biāo)主體。但是,由于一個(gè)主體通常具有多個(gè)介質(zhì),且不同介質(zhì)類型的介質(zhì)對(duì)主體的影響也是不同的,因此現(xiàn)有技術(shù)中的主體檢測(cè)并準(zhǔn)確。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本申請(qǐng)所要解決的技術(shù)問題是提供了主體檢測(cè)方法及裝置,提高了主體檢測(cè)的準(zhǔn)確性。
為了解決上述技術(shù)問題,本申請(qǐng)公開了一種主體檢測(cè)方法,
獲取檢測(cè)主體使用的目標(biāo)介質(zhì);所述目標(biāo)介質(zhì)為目標(biāo)主體使用過的介質(zhì);
獲取每一目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù);
根據(jù)各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體;
其中,所述每一目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)按照如下訓(xùn)練方式預(yù)先生成:
獲取攜帶標(biāo)簽的訓(xùn)練數(shù)據(jù);所述標(biāo)簽用于標(biāo)識(shí)使用目標(biāo)介質(zhì)的目標(biāo)主體以及非目標(biāo)主體;
針對(duì)每一個(gè)目標(biāo)介質(zhì),計(jì)算所述訓(xùn)練數(shù)據(jù)中使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù);
獲取所述目標(biāo)介質(zhì)的介質(zhì)類型;
根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。
優(yōu)選地,所述根據(jù)各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體包括:
將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,獲得所述檢測(cè)主體的主體分?jǐn)?shù);
根據(jù)所述主體分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體。
優(yōu)選地,所述獲取每一目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù)包括:
根據(jù)每一目標(biāo)介質(zhì)使用的子介質(zhì)以及每一子介質(zhì)使用的下一級(jí)子介質(zhì),建立介質(zhì)層級(jí)樹形結(jié)構(gòu);所述目標(biāo)介質(zhì)作為分支節(jié)點(diǎn)或者葉子節(jié)點(diǎn);
對(duì)于任一個(gè)分支節(jié)點(diǎn),獲取其子節(jié)點(diǎn)對(duì)應(yīng)的介質(zhì)分?jǐn)?shù),將各個(gè)子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)匯總獲得的分?jǐn)?shù)作為所述分支節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù);
對(duì)于任一個(gè)葉子節(jié)點(diǎn),獲取預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù),所述葉子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)為將所述葉子節(jié)點(diǎn)的父節(jié)點(diǎn)作為目標(biāo)主體,所述葉子節(jié)點(diǎn)作為所述目標(biāo)主體使用過的目標(biāo)介質(zhì),按照所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)的訓(xùn)練方式預(yù)先生成的。
優(yōu)選地,所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)為使用所述目標(biāo)介質(zhì)的主體為非目標(biāo)主體的概率;
所述根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)包括:
根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,按照如下第一計(jì)算公式,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù);
其中,A表示目標(biāo)主體,表示非目標(biāo)主體,xi表示非目標(biāo)主體使用的第i個(gè)目標(biāo)介質(zhì);m表示使用所述目標(biāo)介質(zhì)的非目標(biāo)主體數(shù);n表示使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù);F(m,n)表示被m個(gè)非目標(biāo)主體以及n個(gè)目標(biāo)主體使用,且屬于所述介質(zhì)類型的介質(zhì)的介質(zhì)數(shù)量。
優(yōu)選地,在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)小于第二閾值時(shí),F(xiàn)(m,n)從所述訓(xùn)練數(shù)據(jù)中統(tǒng)計(jì)獲得;
在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)大于第二閾值;或者在所述非目標(biāo)主體數(shù)大于第一閾值且所述目標(biāo)主體小于第二閾值時(shí):
其中,αn以及βn分別為將F(m,n)進(jìn)行擬合獲得的斜率以及截距;
所述第一計(jì)算公式具體為:
在所述非目標(biāo)主體數(shù)大于第一閾值且所屬目標(biāo)主體數(shù)大于第二閾值時(shí):
F(m,n)≈1;
所述第一計(jì)算公式具體為:
優(yōu)選地,所述將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,獲得所述檢測(cè)主體的主體分?jǐn)?shù)包括:
將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,按照如下第二計(jì)算公式,計(jì)算獲得所述檢測(cè)主體的主體分?jǐn)?shù);
其中,k表示所述檢測(cè)主體使用的目標(biāo)介質(zhì)總個(gè)數(shù);X表示所述訓(xùn)練數(shù)據(jù)中的非目標(biāo)主體數(shù),Y所述訓(xùn)練數(shù)據(jù)中的目標(biāo)主體數(shù),表示目標(biāo)介質(zhì)xi的介質(zhì)分?jǐn)?shù)。
一種主體檢測(cè)裝置,包括:
預(yù)計(jì)算模塊,用于獲取攜帶標(biāo)簽的訓(xùn)練數(shù)據(jù);所述標(biāo)簽用于標(biāo)識(shí)使用目標(biāo)介質(zhì)的目標(biāo)主體以及非目標(biāo)主體;針對(duì)每一個(gè)目標(biāo)介質(zhì),計(jì)算所述訓(xùn)練數(shù)據(jù)中使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù);獲取所述目標(biāo)介質(zhì)的介質(zhì)類型;根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù);
介質(zhì)獲取模塊,用于獲取檢測(cè)主體使用的目標(biāo)介質(zhì);所述目標(biāo)介質(zhì)為目標(biāo)主體使用過的介質(zhì);
分?jǐn)?shù)獲取模塊,用于獲取所述預(yù)計(jì)算模塊獲得的每一目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù);
檢測(cè)模塊,用于根據(jù)各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體。
優(yōu)選地,所述檢測(cè)模塊包括:
主體計(jì)算單元,用于將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,獲得所述檢測(cè)主體的主體分?jǐn)?shù);
檢測(cè)單元,用于根據(jù)所述主體分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體。
優(yōu)選地,所述分?jǐn)?shù)獲取模塊包括:
結(jié)構(gòu)建立單元,用于根據(jù)每一目標(biāo)介質(zhì)使用的子介質(zhì)以及每一級(jí)子介質(zhì)使用的下一級(jí)子介質(zhì),建立介質(zhì)層級(jí)樹形結(jié)構(gòu);所述目標(biāo)介質(zhì)作為分支節(jié)點(diǎn)或者葉子節(jié)點(diǎn);
分?jǐn)?shù)獲取單元,用于對(duì)于任一個(gè)分支節(jié)點(diǎn),獲取其子節(jié)點(diǎn)對(duì)應(yīng)的介質(zhì)分?jǐn)?shù),將各個(gè)子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)匯總獲得的分?jǐn)?shù)作為所述分支節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù);
對(duì)于任一個(gè)葉子節(jié)點(diǎn),獲取預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù),所述葉子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)為將所述葉子節(jié)點(diǎn)的父節(jié)點(diǎn)作為目標(biāo)主體,所述葉子節(jié)點(diǎn)作為所述目標(biāo)主體使用過的目標(biāo)介質(zhì),按照所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)的訓(xùn)練方式預(yù)先生成的。
優(yōu)選地,所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)為使用所述目標(biāo)介質(zhì)的主體為非目標(biāo)主體的概率;
所述預(yù)計(jì)算模塊根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)包括:
根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,按照如下第一計(jì)算公式,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù);
其中,A表示目標(biāo)主體,表示非目標(biāo)主體,xi表示非目標(biāo)主體使用的第i個(gè)目標(biāo)介質(zhì);m表示使用所述目標(biāo)介質(zhì)的非目標(biāo)主體數(shù);n表示使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù);F(m,n)表示被m個(gè)非目標(biāo)主體以及n個(gè)目標(biāo)主體使用,且屬于所述介質(zhì)類型的介質(zhì)的介質(zhì)數(shù)量。
優(yōu)選地,在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)小于第二閾值時(shí),F(xiàn)(m,n)從所述訓(xùn)練數(shù)據(jù)中統(tǒng)計(jì)獲得;
在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)大于第二閾值;或者在所述非目標(biāo)主體數(shù)大于第一閾值且所述目標(biāo)主體小于第二閾值時(shí):
其中,αn以及βn分別為將F(m,n)進(jìn)行擬合獲得的斜率以及截距;
所述第一計(jì)算公式具體為:;
在所述非目標(biāo)主體數(shù)大于第一閾值且所屬目標(biāo)主體數(shù)大于第二閾值時(shí):
F(m,n)≈1;
所述第一計(jì)算公式具體為:
優(yōu)選地,所述主體計(jì)算單元具體用于:
將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,按照如下第二計(jì)算公式,計(jì)算獲得所述檢測(cè)主體的主體分?jǐn)?shù);
其中,k表示所述檢測(cè)主體使用的目標(biāo)介質(zhì)總個(gè)數(shù);X表示所述訓(xùn)練數(shù)據(jù)中的非目標(biāo)主體數(shù),Y所述訓(xùn)練數(shù)據(jù)中的目標(biāo)主體數(shù),表示目標(biāo)介質(zhì)xi的介質(zhì)分?jǐn)?shù)。
與現(xiàn)有技術(shù)相比,本申請(qǐng)可以獲得包括以下技術(shù)效果:
對(duì)于目標(biāo)主體使用過的目標(biāo)介質(zhì)預(yù)先進(jìn)行訓(xùn)練,目標(biāo)介質(zhì)進(jìn)行打分,獲得目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),介質(zhì)分?jǐn)?shù)不僅根據(jù)使用目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù)進(jìn)行,還結(jié)合了介質(zhì)類型,以區(qū)分不同介質(zhì)類型對(duì)主體是否為目標(biāo)主體的影響程度,使得介質(zhì)分?jǐn)?shù)更加準(zhǔn)確、合理。在對(duì)檢測(cè)主體進(jìn)行檢測(cè)時(shí),根據(jù)檢測(cè)主體的各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),對(duì)檢測(cè)主體進(jìn)行判斷,介質(zhì)分?jǐn)?shù)能夠準(zhǔn)確表示使用該介質(zhì)的主體是否為目標(biāo)主體的概率,從而提高了主體檢測(cè)的準(zhǔn)確性。
當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品必不一定需要同時(shí)達(dá)到以上所述的所有技術(shù)效果。
附圖說明
此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
圖1是本申請(qǐng)實(shí)施例的一種主體檢測(cè)方法一個(gè)實(shí)施例的流程圖;
圖2是本申請(qǐng)實(shí)施例的介質(zhì)層級(jí)樹形結(jié)構(gòu)一種示意圖;
圖3是本申請(qǐng)實(shí)施例的一種主體檢測(cè)方法又一個(gè)實(shí)施例的流程圖;
圖4是本申請(qǐng)實(shí)施例的一種主體檢測(cè)裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
圖5是本申請(qǐng)實(shí)施例的一種主體檢測(cè)裝置又一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施方式
以下將配合附圖及實(shí)施例來詳細(xì)說明本申請(qǐng)的實(shí)施方式,藉此對(duì)本申請(qǐng)如何應(yīng)用技術(shù)手段來解決技術(shù)問題并達(dá)成技術(shù)功效的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。
本申請(qǐng)實(shí)施例的主體是指自然人、自然人形成的群體或者自然人在網(wǎng)絡(luò)中對(duì)應(yīng)的一個(gè)帳號(hào)。目標(biāo)主體是指滿足一定條件的主體,例如出現(xiàn)異常的賬號(hào)、具有風(fēng)險(xiǎn)的人、有購買潛力的用戶等等。
目標(biāo)介質(zhì)是指目標(biāo)主體使用過的介質(zhì),目標(biāo)主體未使用過的介質(zhì)即為非目標(biāo)介質(zhì)。不是目標(biāo)主體的主體即為非目標(biāo)主體。
由于現(xiàn)有技術(shù)中,對(duì)于主體是否為目標(biāo)主體的檢測(cè),主要是依據(jù)主體是否使用了滿足預(yù)設(shè)條件的介質(zhì)來確定。滿足預(yù)設(shè)條件的介質(zhì)可以根據(jù)通過對(duì)介質(zhì)打分獲得,對(duì)該介質(zhì)的打分通常是根據(jù)歷史擊中率計(jì)算得到。例如介質(zhì)類型為信用卡號(hào),某個(gè)具體信用卡號(hào)作為一介質(zhì),若使用過該信用卡號(hào)的有3個(gè)賬戶,2個(gè)賬戶為目標(biāo)主體,則歷史擊中率為2/3,該歷史擊中率即作為該信用卡號(hào)的介質(zhì)分?jǐn)?shù)。但是這種打分方式并不準(zhǔn)確,比如使用某個(gè)介質(zhì)的目標(biāo)主體數(shù)為1,非目標(biāo)主體數(shù)為0,則介質(zhì)分?jǐn)?shù)為1;而如果使用該介質(zhì)的目標(biāo)主體數(shù)為100,非目標(biāo)主體數(shù)為0,介質(zhì)分?jǐn)?shù)仍為1。根據(jù)經(jīng)驗(yàn)分布,介質(zhì)打分是不準(zhǔn)確的,從而導(dǎo)致主體檢測(cè)不準(zhǔn)確。且現(xiàn)有技術(shù)中,僅是考慮了單個(gè)介質(zhì)對(duì)主體的影響,而由于不同類型的介質(zhì)對(duì)主體是否為目標(biāo)主體的影響不同,因此也導(dǎo)致主體檢測(cè)不準(zhǔn)確。
發(fā)明人基于現(xiàn)有技術(shù)存在的問題,研究發(fā)現(xiàn),不同介質(zhì)類型的介質(zhì)對(duì)主體的影響程度是不一樣的。因此不同介質(zhì)類型,即便同樣的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù),介質(zhì)分?jǐn)?shù)也可能是不一樣的。因此在本申請(qǐng)實(shí)施例中,介質(zhì)分?jǐn)?shù)不僅根據(jù)使用目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù)計(jì)算獲得,還結(jié)合了介質(zhì)類型,以區(qū)分不同介質(zhì)類型對(duì)主體是否為目標(biāo)主體的影響程度,使得介質(zhì)分?jǐn)?shù)更加準(zhǔn)確、合理。介質(zhì)分?jǐn)?shù)表示使用該目標(biāo)介質(zhì)的主體為目標(biāo)主體的概率。在對(duì)檢測(cè)主體進(jìn)行檢測(cè)時(shí),根據(jù)檢測(cè)主體的各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),對(duì)檢測(cè)主體進(jìn)行判斷,介質(zhì)分?jǐn)?shù)能夠準(zhǔn)確表示使用該介質(zhì)的主體是否為目標(biāo)主體的概率,且綜合考慮各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),從而提高了主體檢測(cè)的準(zhǔn)確性。
下面將結(jié)合附圖對(duì)本申請(qǐng)技術(shù)方案進(jìn)行詳細(xì)描述。
圖1是本申請(qǐng)實(shí)施例提供的一種主體檢測(cè)方法一個(gè)實(shí)施例的流程圖,該方法可以包括以下幾個(gè)步驟:
101:獲取檢測(cè)主體使用的目標(biāo)介質(zhì)。
其中,所述目標(biāo)介質(zhì)為目標(biāo)主體使用過的介質(zhì),可以根據(jù)歷史數(shù)據(jù)確定。
102:獲取每一目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù)。
其中,所述介質(zhì)分?jǐn)?shù)可以表示使用所述目標(biāo)介質(zhì)的主體為目標(biāo)主體的概率。
當(dāng)然,所述介質(zhì)分?jǐn)?shù)也可以表示使用所述目標(biāo)介質(zhì)的主體為非目標(biāo)主體的概率。
從而根據(jù)介質(zhì)分?jǐn)?shù)可以用于判斷使用該目標(biāo)介質(zhì)的主體是否為目標(biāo)主體或者非目標(biāo)主體。
103:根據(jù)各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體。
本實(shí)施例中,根據(jù)各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),對(duì)檢測(cè)主體進(jìn)行判斷,而不是根據(jù)單一介質(zhì)進(jìn)行判斷,綜合考慮各個(gè)目標(biāo)介質(zhì)對(duì)目標(biāo)主體的影響,可以使得檢測(cè)結(jié)果更準(zhǔn)確。
其中,作為又一個(gè)實(shí)施例,根據(jù)各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體可以是:
將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,獲得所述檢測(cè)主體的主體分?jǐn)?shù);
根據(jù)所述主體分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體。
將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總可以有多種實(shí)現(xiàn)方式,比如可以結(jié)合目標(biāo)介質(zhì)的介質(zhì)類型進(jìn)行,根據(jù)不同介質(zhì)類型對(duì)主體是否為目標(biāo)主體的影響程度,可以為不同介質(zhì)類型賦予不同的權(quán)重,從而可以將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)與其對(duì)應(yīng)的權(quán)重相加、相乘等方式進(jìn)行匯總,即可以獲得檢測(cè)主體的主體分?jǐn)?shù)。
從而可以根據(jù)主體分?jǐn)?shù),用于檢測(cè)主體是否為目標(biāo)主體。
主體分?jǐn)?shù)可以表示使用各個(gè)目標(biāo)介質(zhì)的主體為目標(biāo)主體的概率,從而分?jǐn)?shù)越高,表示檢測(cè)主體成為目標(biāo)主體的可能性越大。
當(dāng)然也可以是表示使用各個(gè)目標(biāo)介質(zhì)的主體為非目標(biāo)主體的概率,從而分?jǐn)?shù)越低,表示檢測(cè)主體成為目標(biāo)主體的可能性越大。
為了實(shí)現(xiàn)判斷,可以根據(jù)實(shí)際情況設(shè)定分?jǐn)?shù)閾值,將主體分?jǐn)?shù)與分?jǐn)?shù)閾值進(jìn)行比較,即可以確定檢測(cè)主體是否為目標(biāo)主體。
其中,所述每一目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)可以按照如下訓(xùn)練方式預(yù)先生成:
104:獲取攜帶標(biāo)簽的訓(xùn)練數(shù)據(jù)。
其中,所述標(biāo)簽用于標(biāo)識(shí)使用目標(biāo)介質(zhì)的目標(biāo)主體以及非目標(biāo)主體。
訓(xùn)練數(shù)據(jù)可以是大量的歷史數(shù)據(jù),包括目標(biāo)主體使用的介質(zhì)以及非目標(biāo)主體使用的介質(zhì)等。
105:針對(duì)每一個(gè)目標(biāo)介質(zhì),計(jì)算所述訓(xùn)練數(shù)據(jù)中使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù)。
106:獲取所述目標(biāo)介質(zhì)的介質(zhì)類型。
介質(zhì)為介質(zhì)類型的一個(gè)具體數(shù)值。
例如目標(biāo)介質(zhì)的介質(zhì)類型為手機(jī)號(hào)碼,目標(biāo)介質(zhì)為一個(gè)具體的手機(jī)號(hào)碼。
目標(biāo)介質(zhì)的介質(zhì)類型為年齡,目標(biāo)介質(zhì)即為一個(gè)具體的年齡數(shù)值比如“15歲”。
107:根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。
根據(jù)實(shí)際情況可知,不同介質(zhì)類型,即便同樣的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù),介質(zhì)分?jǐn)?shù)也可能是不一樣的。也即不同介質(zhì)類型的目標(biāo)介質(zhì)對(duì)檢測(cè)主體是目標(biāo)主體的影響程度不同,因此不僅根據(jù)中使用目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù),還結(jié)合目標(biāo)介質(zhì)的介質(zhì)類型計(jì)算目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。
其中,根據(jù)所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)比如可以是:
根據(jù)目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù)計(jì)算歷史擊中率。不同介質(zhì)類型可以賦予不同的權(quán)重系數(shù),歷史擊中率與權(quán)重系數(shù)的乘積即可以作為目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù);其中,對(duì)檢測(cè)主體影響程度越大的目標(biāo)介質(zhì),權(quán)重系數(shù)越高,從而可以使得計(jì)算獲得目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)更加準(zhǔn)確。
當(dāng)然,根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)還可以采用其他實(shí)現(xiàn)方式,在下面實(shí)施例中會(huì)詳細(xì)進(jìn)行介紹。
本實(shí)施例中,根據(jù)目標(biāo)主體數(shù)、非目標(biāo)主體數(shù)以及介質(zhì)類型,計(jì)算目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。而不僅僅是根據(jù)目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù)據(jù)進(jìn)行計(jì)算,使得介質(zhì)分?jǐn)?shù)更加準(zhǔn)確。
其中,可以是根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型被使用的介質(zhì)數(shù)量,來計(jì)算目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。介質(zhì)數(shù)量具體可以選擇被所述非目標(biāo)主體數(shù)個(gè)非目標(biāo)主體以及目標(biāo)主體數(shù)個(gè)目標(biāo)主體使用,且屬于所述介質(zhì)類型的全部介質(zhì)的介質(zhì)數(shù)量。
例如介質(zhì)類型為手機(jī)號(hào)碼,目標(biāo)介質(zhì)即為一個(gè)具體的手機(jī)號(hào)碼,假設(shè)為A,使用手機(jī)號(hào)碼“A”的目標(biāo)主體數(shù)為n,非目標(biāo)主體數(shù)為m。
則介質(zhì)數(shù)量是指m個(gè)非目標(biāo)主體以及n個(gè)目標(biāo)主體使用過的手機(jī)號(hào)碼的數(shù)量。
根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)可以是根據(jù)經(jīng)驗(yàn)概率方式計(jì)算獲得。
因此,作為又一個(gè)實(shí)施例,根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,可以按照如下第一計(jì)算公式,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù);
其中,A表示目標(biāo)主體,表示非目標(biāo)主體,xi表示目標(biāo)主體使用的第i個(gè)目標(biāo)介質(zhì);m表示使用所述目標(biāo)介質(zhì)的非目標(biāo)主體數(shù);n表示使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù);F(m,n)表示被m個(gè)非目標(biāo)主體以及n個(gè)目標(biāo)主體使用,且屬于所述目標(biāo)介質(zhì)的介質(zhì)類型的全部介質(zhì)的介質(zhì)數(shù)量。
即可以作為介質(zhì)分?jǐn)?shù),表示使用目標(biāo)介質(zhì)xi的主體為非目標(biāo)主體的概率。當(dāng)然也可以計(jì)算P(A/xi),P(A/xi)表示使用目標(biāo)介質(zhì)xi的主體非目標(biāo)主體的概率,其中,
上述第一計(jì)算公式根據(jù)經(jīng)驗(yàn)分布獲得,當(dāng)經(jīng)驗(yàn)分布逼近實(shí)際分布時(shí),即獲得第一計(jì)算公式。
其推導(dǎo)過程如下:
思路一:使用目標(biāo)介質(zhì)xi的目標(biāo)主體數(shù)為n,非目標(biāo)主體數(shù)為m,假設(shè)有一個(gè)使用目標(biāo)介質(zhì)xi的新主體,其要么為目標(biāo)主體,要么為非目標(biāo)主體,新主體為目標(biāo)主體時(shí),使用目標(biāo)介質(zhì)xi的目標(biāo)主體數(shù)即變?yōu)閚+1;新主體為非目標(biāo)主體時(shí),使得目標(biāo)介質(zhì)xi的非目標(biāo)主體即變?yōu)閙+1。
思路二:而F(m,n)表示被m個(gè)非目標(biāo)主體以及n個(gè)目標(biāo)主體使用,且屬于所述目標(biāo)介質(zhì)的介質(zhì)類型的全部介質(zhì)的介質(zhì)數(shù)量。例如總共有1000個(gè)IP,被5個(gè)非目標(biāo)主體以及3個(gè)目標(biāo)主體使用,則介質(zhì)類型為IP的介質(zhì)數(shù)量即:F(5,3)=1000。一個(gè)介質(zhì)被m個(gè)非目標(biāo)主體以及n個(gè)目標(biāo)主體使用,由于用歷史擊中率n/m+n表示介質(zhì)分?jǐn)?shù)并不準(zhǔn)確且不具備適用性,因此,可以查找被m個(gè)非目標(biāo)主體以及n個(gè)目標(biāo)主體使用,屬于所述介質(zhì)類型的全部介質(zhì)的介質(zhì)數(shù)量,結(jié)合該介質(zhì)類型的介質(zhì)數(shù)量用于計(jì)算該介質(zhì)的介質(zhì)分?jǐn)?shù),使得介質(zhì)分?jǐn)?shù)表示使用該介質(zhì)的主體是否為目標(biāo)主體或非目標(biāo)主體更加準(zhǔn)確。
結(jié)合思路一以及思路二,計(jì)算新主體為非目標(biāo)主體時(shí)的概率分布,即可以獲得第一計(jì)算公式。在極端情況下,m和n均為0時(shí),可知第一計(jì)算公式也是成立的,滿足實(shí)際情況分布的。
利用第一計(jì)算公式可以準(zhǔn)確計(jì)算目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),能夠準(zhǔn)確合理的表示使用該目標(biāo)介質(zhì)的主體為目標(biāo)主體的概率,從而實(shí)現(xiàn)對(duì)主體的檢測(cè)。
而由于訓(xùn)練數(shù)據(jù)有限,當(dāng)m以及n值較大時(shí),F(xiàn)(m,n)往往是0,為了提高計(jì)算準(zhǔn)確度。作為又一個(gè)實(shí)施例:
在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)小于第二閾值時(shí),F(xiàn)(m,n)從所述訓(xùn)練數(shù)據(jù)中統(tǒng)計(jì)獲得;
在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)大于第二閾值;或者在所述非目標(biāo)主體數(shù)大于第一閾值且所述目標(biāo)主體小于第二閾值時(shí):可以對(duì)F(m,n)進(jìn)行擬合,采用擬合公式計(jì)算獲得,擬合公式可以有多種形式,作為一種可能可能的實(shí)現(xiàn)方式:
其中,αn以及βn分別為將F(m,n)進(jìn)行擬合獲得的斜率以及截距,常數(shù),也即采用擬合函數(shù)進(jìn)行計(jì)算F(m,n)
那么所述第一計(jì)算公式可以為:
在所述非目標(biāo)主體數(shù)大于第一閾值且所述目標(biāo)主體數(shù)大于第二閾值時(shí),F(xiàn)(m,n)往往為0,為了避免分母為0,可以另F(m,n)等于1,所述第一計(jì)算公式具體為:
也即在m和n均較大時(shí),可以利用歷史擊中率表示介質(zhì)分?jǐn)?shù)。
其中,第一閾值以及第二閾值可以根據(jù)實(shí)際情況,主體類型以及訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量進(jìn)行確定。
其中,作為又一個(gè)實(shí)施例,目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)可以用戶使用目標(biāo)介質(zhì)的主體為目標(biāo)主體的概率表示,即:
其中,表示非目標(biāo)主體,P(A/xi)即為介質(zhì)分?jǐn)?shù),表示使用目標(biāo)介質(zhì)xi的主體為目標(biāo)主體的概率。
作為又一個(gè)實(shí)施例,將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,獲得所述檢測(cè)主體的主體分?jǐn)?shù)可以是:
將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,按照如下第二計(jì)算公式,計(jì)算獲得所述檢測(cè)主體的主體分?jǐn)?shù);
其中,
k表示檢測(cè)主體使用的目標(biāo)介質(zhì)總個(gè)數(shù);X表示訓(xùn)練數(shù)據(jù)中的非目標(biāo)主體數(shù),Y所述訓(xùn)練數(shù)據(jù)中的目標(biāo)主體數(shù)。
為主體分?jǐn)?shù),表示使用介質(zhì)x1,x2,...xk的主體為非目標(biāo)主體的概率。
其中,為先驗(yàn)概率,需要進(jìn)行修正。
由于一個(gè)非目標(biāo)主體同時(shí)使用不同目標(biāo)介質(zhì)的幾率較小,因此可以假設(shè)非目標(biāo)主體使用不同目標(biāo)介質(zhì)的事件是互相獨(dú)立的。因此第二計(jì)算公式可以按照下述推導(dǎo)過程獲得:
其中,為目標(biāo)介質(zhì)xi的介質(zhì)分?jǐn)?shù),可以利用上述第一計(jì)算公式獲得。
當(dāng)然,作為又一個(gè)實(shí)施例,介質(zhì)分?jǐn)?shù)用P(A/xi)表示時(shí),則主體分?jǐn)?shù)可以可以為:
其中,
P(A/x1,x2,...xk)表示使用介質(zhì)x1,x2,...xk的主體為非目標(biāo)主體的概率。
由于一個(gè)目標(biāo)主體同時(shí)使用不同目標(biāo)介質(zhì)的幾率較大,而一個(gè)非目標(biāo)主體同時(shí)使用不同目標(biāo)介質(zhì)的幾率較小,因此可以假設(shè)非目標(biāo)主體使用不同目標(biāo)介質(zhì)的事件時(shí)互相獨(dú)立,可以利用公式計(jì)算獲得進(jìn)而即可以計(jì)算獲得P(A/x1,x2,...xk),保證主體分?jǐn)?shù)計(jì)算的準(zhǔn)確性。
通過本實(shí)施例將各個(gè)目標(biāo)介質(zhì)的分?jǐn)?shù)進(jìn)行匯總,對(duì)主體進(jìn)行打分,使得綜合考慮了不同介質(zhì)類型對(duì)主體為目標(biāo)主體的影響,提高了主體檢測(cè)的準(zhǔn)確性。
其中,由于一個(gè)主體使用多個(gè)目標(biāo)介質(zhì),而每一個(gè)目標(biāo)介質(zhì)可能包括多個(gè)子介質(zhì),每一個(gè)子介質(zhì)進(jìn)一步包括下一級(jí)的子介質(zhì),每一個(gè)目標(biāo)介質(zhì)又作為其子介質(zhì)的主體,存在介質(zhì)層級(jí)關(guān)系。主體為目標(biāo)主體依賴與其目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),而目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)依賴與其作為主體時(shí),使用的子介質(zhì)的介質(zhì)分?jǐn)?shù)。
例如,主體是壞人的可能性依賴于使用過手機(jī)號(hào)是壞手機(jī)號(hào)的可能以及使用過的郵箱是壞郵箱的可能等。而手機(jī)號(hào)的好壞又依賴于這個(gè)手機(jī)號(hào)相關(guān)的介質(zhì),如LBS信息,手機(jī)號(hào)的IP信息等。
因此對(duì)于一個(gè)主體可以劃分介質(zhì)層級(jí),形成樹形結(jié)構(gòu),如圖2所示,主體為根節(jié)點(diǎn),主體使用的目標(biāo)介質(zhì)可以為葉子節(jié)點(diǎn),也可以為分支節(jié)點(diǎn),分支節(jié)點(diǎn)具有子節(jié)點(diǎn),也即目標(biāo)介質(zhì)的子介質(zhì),或者子介質(zhì)的下一級(jí)介質(zhì)。分支節(jié)點(diǎn)為子節(jié)點(diǎn)的父節(jié)點(diǎn)。圖2中,葉子1、葉子2、葉子3、葉子4、葉子5以及葉子6為分支節(jié)點(diǎn),節(jié)點(diǎn)1、節(jié)點(diǎn)2、節(jié)點(diǎn)3為分支節(jié)點(diǎn),主體為根節(jié)點(diǎn)。
例如,如圖2中,葉子1、節(jié)點(diǎn)1以及節(jié)點(diǎn)2為主體使用的目標(biāo)介質(zhì)。
節(jié)點(diǎn)2的子介質(zhì)為葉子4以及節(jié)點(diǎn)3,葉子4以及節(jié)點(diǎn)3即為節(jié)點(diǎn)2作為主體時(shí)其使用的目標(biāo)介質(zhì)。
節(jié)點(diǎn)3的子介質(zhì)為葉子5以及葉子6,葉子5以及葉子6即為節(jié)點(diǎn)3作為主體時(shí)其使用的目標(biāo)介質(zhì)。
在目標(biāo)介質(zhì)為葉子節(jié)點(diǎn)時(shí),目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)可以按照步驟104~步驟107的操作預(yù)先生成;
在目標(biāo)介質(zhì)為分支節(jié)點(diǎn)時(shí),目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)為其各個(gè)子節(jié)點(diǎn)對(duì)應(yīng)的介質(zhì)分?jǐn)?shù),匯總獲得的分?jǐn)?shù),其中匯總方式即可以按照上述實(shí)施例中描述方式進(jìn)行。
因此,作為又一個(gè)實(shí)施例,如圖3所示,在本申請(qǐng)實(shí)施例提供的一種主體檢測(cè)方法又一個(gè)實(shí)施例中,該方法可以包括以下幾個(gè)步驟:
301:獲取檢測(cè)主體使用的目標(biāo)介質(zhì)。
其中,所述目標(biāo)介質(zhì)為目標(biāo)主體使用過的介質(zhì),可以根據(jù)歷史數(shù)據(jù)確定。
302:根據(jù)每一目標(biāo)介質(zhì)使用的子介質(zhì)以及每一子介質(zhì)使用的下一級(jí)子介質(zhì),建立介質(zhì)層級(jí)樹形結(jié)構(gòu)。
其中,所述目標(biāo)介質(zhì)作為分支節(jié)點(diǎn)或者葉子節(jié)點(diǎn)。
樹形結(jié)構(gòu)可以如圖2所示。
303:對(duì)于任一個(gè)分支節(jié)點(diǎn),獲取其子節(jié)點(diǎn)對(duì)應(yīng)的介質(zhì)分?jǐn)?shù),將各個(gè)子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)匯總獲得的分?jǐn)?shù)作為所述分支節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù);
304:對(duì)于任一個(gè)葉子節(jié)點(diǎn),獲取預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù),所述葉子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)為將所述葉子節(jié)點(diǎn)的父節(jié)點(diǎn)作為目標(biāo)主體,所述葉子節(jié)點(diǎn)作為所述目標(biāo)主體使用過的目標(biāo)介質(zhì),按照所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)的訓(xùn)練方式預(yù)先生成的。
通過計(jì)算分支節(jié)點(diǎn)以及葉子節(jié)點(diǎn)的分?jǐn)?shù),即可以獲得每一個(gè)目標(biāo)介質(zhì)的分?jǐn)?shù)。
也即在所述目標(biāo)介質(zhì)包括子介質(zhì)時(shí),獲取每一子介質(zhì)的介質(zhì)分?jǐn)?shù);將各個(gè)子介質(zhì)的介質(zhì)分?jǐn)?shù)匯總獲得的分?jǐn)?shù)作為所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù);
在所述目標(biāo)介質(zhì)不包括子介質(zhì)時(shí),獲取所述目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù)。
其中,在子介質(zhì)不包括下一級(jí)子介質(zhì)時(shí),所述子介質(zhì)的介質(zhì)分?jǐn)?shù)為將所述目標(biāo)介質(zhì)作為目標(biāo)主體,所述子介質(zhì)作為所述目標(biāo)主體使用過的目標(biāo)介質(zhì),按照所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)的訓(xùn)練方式預(yù)先生成;
而在子介質(zhì)包括下一級(jí)子介質(zhì)時(shí),子介質(zhì)的分?jǐn)?shù)為獲取下一級(jí)子介質(zhì)的介質(zhì)分?jǐn)?shù),將各個(gè)下一級(jí)子介質(zhì)的介質(zhì)分?jǐn)?shù)匯總獲得的分?jǐn)?shù)作為所述子介質(zhì)的介質(zhì)分?jǐn)?shù);而下一級(jí)子介質(zhì)的介質(zhì)分?jǐn)?shù)即可以依次類推。
其中,目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)的訓(xùn)練方式可以為圖1中步驟104~步驟107的所述,在此不再贅述。
305:將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,獲得所述檢測(cè)主體的主體分?jǐn)?shù)。
結(jié)合圖2,可知,首先計(jì)算6個(gè)葉子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù),然后按照自下而上的方式逐層匯總。
葉子5和葉子6匯總得到節(jié)點(diǎn)3的介質(zhì)分?jǐn)?shù),葉子2和葉子3匯總得到節(jié)點(diǎn)1的介質(zhì)分?jǐn)?shù),節(jié)點(diǎn)3和葉子4匯總得到節(jié)點(diǎn)2的介質(zhì)分?jǐn)?shù),最后節(jié)點(diǎn)1和節(jié)點(diǎn)2和葉子1匯總得到主體的主體分?jǐn)?shù)。
其中,匯總方式可以按照上述第二計(jì)算方式計(jì)算獲得。
葉子1的介質(zhì)分?jǐn)?shù),為將根節(jié)點(diǎn)作為主體,葉子1、節(jié)點(diǎn)1、節(jié)點(diǎn)2為目標(biāo)介質(zhì),按照步驟104~步驟107的訓(xùn)練方式預(yù)先生成。
葉子5以及葉子6的介質(zhì)分?jǐn)?shù),為將節(jié)點(diǎn)3作為目標(biāo)主體,葉子5以及葉子6作為目標(biāo)介質(zhì),按照步驟104~步驟107的訓(xùn)練方式預(yù)先生成。
葉子2以及葉子3的介質(zhì)分?jǐn)?shù),為將節(jié)點(diǎn)1作為目標(biāo)主體,葉子2以及葉子3作為目標(biāo)介質(zhì),按照步驟104~步驟107的訓(xùn)練方式預(yù)先生成。
葉子4的介質(zhì)分?jǐn)?shù),為將節(jié)點(diǎn)2作為目標(biāo)主體,葉子4作為目標(biāo)介質(zhì),按照步驟104~步驟107的訓(xùn)練方式預(yù)先生成。
306:根據(jù)所述主體分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體。
在本實(shí)施例中,通過將主體進(jìn)行介質(zhì)層級(jí)劃分,可以進(jìn)一步提高主體檢測(cè)的準(zhǔn)確性。
圖4為本申請(qǐng)實(shí)施例提供的一種主體檢測(cè)裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖,該裝置可以包括:
預(yù)計(jì)算模塊401,用于獲取攜帶標(biāo)簽的訓(xùn)練數(shù)據(jù);所述標(biāo)簽用于標(biāo)識(shí)使用目標(biāo)介質(zhì)的目標(biāo)主體以及非目標(biāo)主體;針對(duì)每一個(gè)目標(biāo)介質(zhì),計(jì)算所述訓(xùn)練數(shù)據(jù)中使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù);獲取所述目標(biāo)介質(zhì)的介質(zhì)類型;根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。
本實(shí)施例中,根據(jù)目標(biāo)主體數(shù)、非目標(biāo)主體數(shù)以及介質(zhì)類型,計(jì)算目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。而不僅僅是根據(jù)目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù)據(jù)進(jìn)行計(jì)算,使得介質(zhì)分?jǐn)?shù)更加準(zhǔn)確。
其中,可以是根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及屬于所述介質(zhì)類型的介質(zhì)被使用的介質(zhì)數(shù)量,來計(jì)算目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。介質(zhì)數(shù)量具體可以選擇被所述非目標(biāo)主體數(shù)個(gè)非目標(biāo)主體以及目標(biāo)主體數(shù)個(gè)目標(biāo)主體使用,且屬于所述述介質(zhì)類型的介質(zhì)的介質(zhì)數(shù)量。
介質(zhì)獲取模塊402,用于獲取檢測(cè)主體使用的目標(biāo)介質(zhì).
其中,所述目標(biāo)介質(zhì)為目標(biāo)主體使用過的介質(zhì);
分?jǐn)?shù)獲取模塊403,用于獲取所述預(yù)計(jì)算模塊獲得的每一目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù)。
其中,所述介質(zhì)分?jǐn)?shù)可以表示使用所述目標(biāo)介質(zhì)的主體為目標(biāo)主體的概率。
當(dāng)然,所述介質(zhì)分?jǐn)?shù)也可以表示使用所述目標(biāo)介質(zhì)的主體為非目標(biāo)主體的概率。
從而根據(jù)介質(zhì)分?jǐn)?shù)可以用于判斷使用該目標(biāo)介質(zhì)的主體是否為目標(biāo)主體或者非目標(biāo)主體。
檢測(cè)模塊404,用于根據(jù)各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體。
本實(shí)施例中,根據(jù)各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),對(duì)檢測(cè)主體進(jìn)行判斷,而不是根據(jù)單一介質(zhì)進(jìn)行判斷,綜合考慮各個(gè)目標(biāo)介質(zhì)對(duì)目標(biāo)主體的影響,可以使得檢測(cè)結(jié)果更準(zhǔn)確。
作為又一個(gè)實(shí)施例,預(yù)計(jì)算模塊可以根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,可以按照如下第一計(jì)算公式,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù);
其中,A表示目標(biāo)主體,表示非目標(biāo)主體,xi表示非目標(biāo)主體使用的第i個(gè)目標(biāo)介質(zhì);m表示使用所述目標(biāo)介質(zhì)的非目標(biāo)主體數(shù);n表示使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù);F(m,n)表示被m個(gè)非目標(biāo)主體以及n個(gè)目標(biāo)主體使用,且屬于所述目標(biāo)介質(zhì)的介質(zhì)類型的全部介質(zhì)的介質(zhì)數(shù)量。
表示使用目標(biāo)介質(zhì)xi的主體為非目標(biāo)主體的概率。
上述第一計(jì)算公式根據(jù)經(jīng)驗(yàn)分布獲得,當(dāng)經(jīng)驗(yàn)分布逼近實(shí)際分布時(shí),即獲得第一計(jì)算公式。
而由于訓(xùn)練數(shù)據(jù)有限,當(dāng)m以及n值較大時(shí),F(xiàn)(m,n)往往是0,為了提高計(jì)算準(zhǔn)確度。作為又一個(gè)實(shí)施例:
在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)小于第二閾值時(shí),F(xiàn)(m,n)從所述訓(xùn)練數(shù)據(jù)中統(tǒng)計(jì)獲得;
在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)大于第二閾值;或者在所述非目標(biāo)主體數(shù)大于第一閾值且所述目標(biāo)主體小于第二閾值時(shí):
其中,αn以及βn分別為將F(m,n)進(jìn)行擬合獲得的斜率以及截距,常數(shù),也即采用擬合函數(shù)進(jìn)行計(jì)算F(m,n)
那么所述第一計(jì)算公式具體為:
在所述非目標(biāo)主體數(shù)大于第一閾值且所述目標(biāo)主體數(shù)大于第二閾值時(shí):
F(m,n)≈1;
為了避免分母為0,可以另F(m,n)等于1,所述第一計(jì)算公式具體為:
也即在m和n均較大時(shí),利用歷史擊中率可以用于表示介質(zhì)分?jǐn)?shù)。
其中,第一閾值以及第二閾值可以根據(jù)實(shí)際情況,主體類型以及訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量進(jìn)行確定。
其中,作為又一個(gè)實(shí)施例,目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)可以用戶使用目標(biāo)介質(zhì)的主體為目標(biāo)主體的概率表示,即:
其中,表示非目標(biāo)主體,P(A/xi)即為介質(zhì)分?jǐn)?shù),表示使用目標(biāo)介質(zhì)xi的主體為目標(biāo)主體的概率。
其中,由于一個(gè)主體使用多個(gè)目標(biāo)介質(zhì),而每一個(gè)目標(biāo)介質(zhì)可能包括多個(gè)子介質(zhì),每一個(gè)子介質(zhì)進(jìn)一步包括下一級(jí)的子介質(zhì),每一個(gè)目標(biāo)介質(zhì)又作為其子介質(zhì)的主體,存在介質(zhì)層級(jí)關(guān)系。主體為目標(biāo)主體依賴與其目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),而目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)依賴與其作為主體時(shí),使用的子介質(zhì)的介質(zhì)分?jǐn)?shù)。因此對(duì)于一個(gè)主體可以劃分介質(zhì)層級(jí),形成樹形結(jié)構(gòu),
因此,作為又一個(gè)實(shí)施例,如圖5所示,與圖4所示實(shí)施例不同之處在于,
所述分?jǐn)?shù)獲取模塊403包括:
結(jié)構(gòu)建立單元501,用于根據(jù)每一目標(biāo)介質(zhì)使用的子介質(zhì)以及每一子介質(zhì)使用的下一級(jí)子介質(zhì),建立介質(zhì)層級(jí)樹形結(jié)構(gòu);所述目標(biāo)介質(zhì)作為分支節(jié)點(diǎn)或者葉子節(jié)點(diǎn);
分?jǐn)?shù)獲取單元502,用于對(duì)于任一個(gè)分支節(jié)點(diǎn),獲取其子節(jié)點(diǎn)對(duì)應(yīng)的介質(zhì)分?jǐn)?shù),將各個(gè)子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)匯總獲得的分?jǐn)?shù)作為所述分支節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù);
對(duì)于任一個(gè)葉子節(jié)點(diǎn),獲取預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù),所述葉子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)為將所述葉子節(jié)點(diǎn)的父節(jié)點(diǎn)作為目標(biāo)主體,所述葉子節(jié)點(diǎn)作為所述目標(biāo)主體使用過的目標(biāo)介質(zhì),利用所述預(yù)計(jì)算模塊預(yù)先生成的。
通過計(jì)算分支節(jié)點(diǎn)以及葉子節(jié)點(diǎn)的分?jǐn)?shù),即可以獲得每一個(gè)目標(biāo)介質(zhì)的分?jǐn)?shù)。
也即在所述目標(biāo)介質(zhì)包括子介質(zhì)時(shí),獲取每一子介質(zhì)的介質(zhì)分?jǐn)?shù);將各個(gè)子介質(zhì)的介質(zhì)分?jǐn)?shù)匯總獲得的分?jǐn)?shù)作為所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù);
在所述目標(biāo)介質(zhì)不包括子介質(zhì)時(shí),獲取所述目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù)。
其中,在子介質(zhì)不包括下一級(jí)子介質(zhì)時(shí),所述子介質(zhì)的介質(zhì)分?jǐn)?shù)為將所述目標(biāo)介質(zhì)作為目標(biāo)主體,所述子介質(zhì)作為所述目標(biāo)主體使用過的目標(biāo)介質(zhì),按照所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)的訓(xùn)練方式預(yù)先生成;
而在子介質(zhì)包括下一級(jí)子介質(zhì)時(shí),子介質(zhì)的分?jǐn)?shù)為獲取下一級(jí)子介質(zhì)的介質(zhì)分?jǐn)?shù),將各個(gè)下一級(jí)子介質(zhì)的介質(zhì)分?jǐn)?shù)匯總獲得的分?jǐn)?shù)作為所述子介質(zhì)的介質(zhì)分?jǐn)?shù);而下一級(jí)子介質(zhì)的介質(zhì)分?jǐn)?shù)即可以依次類推。
目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)可以通過預(yù)計(jì)算模塊計(jì)算獲得。
通過將主體進(jìn)行介質(zhì)層級(jí)劃分,可以進(jìn)一步提高主體檢測(cè)的準(zhǔn)確性。
此外,作為又一個(gè)實(shí)施例,如圖5中所示,所述檢測(cè)模塊404可以包括:
主體計(jì)算單元503,用于將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,獲得所述檢測(cè)主體的主體分?jǐn)?shù);
檢測(cè)單元504,用于根據(jù)所述主體分?jǐn)?shù),判斷所述檢測(cè)主體是否為目標(biāo)主體。
將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總可以有多種實(shí)現(xiàn)方式,比如可以結(jié)合目標(biāo)介質(zhì)的介質(zhì)類型進(jìn)行,根據(jù)不同介質(zhì)類型對(duì)主體是否為目標(biāo)主體的影響程度,可以為不同介質(zhì)類型賦予不同的權(quán)重,從而可以將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)與其對(duì)應(yīng)的權(quán)重相加、相乘等方式進(jìn)行匯總,即可以獲得檢測(cè)主體的主體分?jǐn)?shù)。
從而可以根據(jù)主體分?jǐn)?shù),用于檢測(cè)主體是否為目標(biāo)主體。
主體分?jǐn)?shù)可以表示使用各個(gè)目標(biāo)介質(zhì)的主體為目標(biāo)主體的概率,從分?jǐn)?shù)越高,表示檢測(cè)主體成為目標(biāo)主體的可能性越大。
當(dāng)然也可以是表示使用各個(gè)目標(biāo)介質(zhì)的主體為非目標(biāo)主體的概率,從分?jǐn)?shù)越低,表示檢測(cè)主體成為目標(biāo)主體的可能性越大。
為了實(shí)現(xiàn)判斷,可以根據(jù)實(shí)際情況設(shè)定分?jǐn)?shù)閾值,從而將主體分?jǐn)?shù)與分?jǐn)?shù)閾值進(jìn)行比較,以確定檢測(cè)主體是否為目標(biāo)主體。
其中,作為又一個(gè)實(shí)施例,所述主體計(jì)算單元可以具體用于:
將各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,按照如下第二計(jì)算公式,計(jì)算獲得所述檢測(cè)主體的主體分?jǐn)?shù);
其中,k表示檢測(cè)主體使用的目標(biāo)介質(zhì)總個(gè)數(shù);X表示訓(xùn)練數(shù)據(jù)中的非目標(biāo)主體數(shù),Y所述訓(xùn)練數(shù)據(jù)中的目標(biāo)主體數(shù)。
為主體分?jǐn)?shù),表示使用介質(zhì)x1,x2,...xk的主體為非目標(biāo)主體的概率。
其中,為先驗(yàn)概率,需要進(jìn)行修正。
由于一個(gè)非目標(biāo)主體同時(shí)使用不同目標(biāo)介質(zhì)的幾率較小,因此可以假設(shè)非目標(biāo)主體使用不同目標(biāo)介質(zhì)的事件是互相獨(dú)立的。因此第二計(jì)算公式可以按照下述推導(dǎo)過程獲得第二計(jì)算公式的推導(dǎo)過程可以如下:
其中,為目標(biāo)介質(zhì)xi的介質(zhì)分?jǐn)?shù),可以利用上述第一計(jì)算公式獲得。
當(dāng)然,作為又一個(gè)實(shí)施例,介質(zhì)分?jǐn)?shù)用P(A/xi)表示時(shí),則主體分?jǐn)?shù)可以為:
其中,
表示使用介質(zhì)x1,x2,...xk的主體為非目標(biāo)主體的概率。
通過本申請(qǐng)實(shí)施例,結(jié)合介質(zhì)類型對(duì)目標(biāo)介質(zhì)進(jìn)行介質(zhì)分?jǐn)?shù)計(jì)算,且根據(jù)檢測(cè)主體的各個(gè)目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),對(duì)檢測(cè)主體進(jìn)行判斷,而不是根據(jù)單一介質(zhì),綜合考慮了不同介質(zhì)類型的目標(biāo)介質(zhì),提高了主體檢測(cè)的準(zhǔn)確性。
在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類型的隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括非暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
如在說明書及權(quán)利要求當(dāng)中使用了某些詞匯來指稱特定組件。本領(lǐng)域技術(shù)人員應(yīng)可理解,硬件制造商可能會(huì)用不同名詞來稱呼同一個(gè)組件。本說明書及權(quán)利要求并不以名稱的差異來作為區(qū)分組件的方式,而是以組件在功能上的差異來作為區(qū)分的準(zhǔn)則。如在通篇說明書及權(quán)利要求當(dāng)中所提及的“包含”為一開放式用語,故應(yīng)解釋成“包含但不限定于”?!按笾隆笔侵冈诳山邮盏恼`差范圍內(nèi),本領(lǐng)域技術(shù)人員能夠在一定誤差范圍內(nèi)解決所述技術(shù)問題,基本達(dá)到所述技術(shù)效果。此外,“耦接”一詞在此包含任何直接及間接的電性耦接手段。因此,若文中描述一第一裝置耦接于一第二裝置,則代表所述第一裝置可直接電性耦接于所述第二裝置,或通過其他裝置或耦接手段間接地電性耦接至所述第二裝置。說明書后續(xù)描述為實(shí)施本申請(qǐng)的較佳實(shí)施方式,然所述描述乃以說明本申請(qǐng)的一般原則為目的,并非用以限定本申請(qǐng)的范圍。本申請(qǐng)的保護(hù)范圍當(dāng)視所附權(quán)利要求所界定者為準(zhǔn)。
還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的商品或者系統(tǒng)不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種商品或者系統(tǒng)所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的商品或者系統(tǒng)中還存在另外的相同要素。
上述說明示出并描述了本申請(qǐng)的若干優(yōu)選實(shí)施例,但如前所述,應(yīng)當(dāng)理解本申請(qǐng)并非局限于本文所披露的形式,不應(yīng)看作是對(duì)其他實(shí)施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述申請(qǐng)構(gòu)想范圍內(nèi),通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識(shí)進(jìn)行改動(dòng)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本申請(qǐng)的精神和范圍,則都應(yīng)在本申請(qǐng)所附權(quán)利要求的保護(hù)范圍內(nèi)。