置信分類方法及置信機(jī)器的制造方法
【專利摘要】本發(fā)明適用機(jī)器學(xué)習(xí)領(lǐng)域,提供了一種置信分類方法,該方法包括:確定待分類的樣例;用一類分類器對(duì)樣例進(jìn)行正例分類,分類結(jié)果為正例的表示為A,其余分類結(jié)果表示為B;用一類分類器再次對(duì)樣例進(jìn)行負(fù)例分類,分類結(jié)果為負(fù)例的表示為C,其余分類結(jié)果表示為D;如只屬于A或C的樣例稱為可信樣例,分配到接受域;屬于A∩C或?qū)儆贐∪D的樣例稱為不可信樣例,分配到拒絕域。本發(fā)明的技術(shù)方案具有無(wú)需設(shè)置閾值,無(wú)需計(jì)算置信度的優(yōu)點(diǎn)。
【專利說(shuō)明】置信分類方法及置信機(jī)器
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于機(jī)器學(xué)習(xí)領(lǐng)域,尤其涉及一種置信分類方法及置信機(jī)器。
【背景技術(shù)】
[0002] 置信機(jī)器就是在機(jī)器學(xué)習(xí)的過(guò)程中對(duì)學(xué)習(xí)的結(jié)果同時(shí)提供一個(gè)可信的程度判斷 或可以對(duì)學(xué)習(xí)結(jié)果進(jìn)行預(yù)設(shè)的分類處理。置信機(jī)器在醫(yī)療診斷等高風(fēng)險(xiǎn)的應(yīng)用領(lǐng)域有著重 要的現(xiàn)實(shí)意義。置信機(jī)器是機(jī)器學(xué)習(xí)領(lǐng)域中研究時(shí)間不長(zhǎng)的一個(gè)分支,實(shí)現(xiàn)置信機(jī)器學(xué)習(xí) 的理論基礎(chǔ)與方法并不多。有直接構(gòu)造置信度的方法,有間接構(gòu)造置信度的方法,有通過(guò) 設(shè)置拒絕選項(xiàng),可以進(jìn)行預(yù)設(shè)的分類處理,來(lái)排除低可信的部分,從而提高剩余部分的可信 度,實(shí)現(xiàn)置信分類。簡(jiǎn)捷有效的置信機(jī)器學(xué)習(xí)是置信機(jī)器研究的目標(biāo)之一。
[0003] 2005 年由VladimirVovk,AlexanderGammerman,GlennShafer出版了關(guān)于信任 機(jī)器學(xué)習(xí)的專著《AlgorithmicLearninginaRandomWorld》。2004年邱德紅等在計(jì)算 機(jī)研究與發(fā)展期刊Vol. 41,No. 9中發(fā)表了《基于算法隨機(jī)性理論和奇異描述的置信學(xué)習(xí)機(jī) 器》,根據(jù)Kolmogorov算法隨機(jī)性理論,為學(xué)習(xí)機(jī)器建立了一種置信機(jī)制,描述了置信學(xué)習(xí) 機(jī)器的算法。
[0004] 在實(shí)現(xiàn)現(xiàn)有技術(shù)的方案中,發(fā)現(xiàn)現(xiàn)有技術(shù)存在如下的技術(shù)問(wèn)題:
[0005] (1)需要計(jì)算置信度。目前現(xiàn)有的置信機(jī)器學(xué)習(xí)方法通常都要計(jì)算出每一個(gè)樣例 的置信度值,然后根據(jù)置信度值的大小進(jìn)行排序,來(lái)確定可靠性的高低。
[0006] (2)需要設(shè)置具體的閾值。如果需要?jiǎng)澐纸邮苡蚝途芙^域的話,則需要根據(jù)計(jì)算出 的置信度的排序結(jié)果,按照一定的要求,確定并設(shè)置具體的閾值。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明實(shí)施例的目的在于提供一種置信分類方法,其解決現(xiàn)有技術(shù)的置信度需要 計(jì)算置信度和設(shè)置閾值的問(wèn)題。
[0008] 本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一方面,一種置信分類方法,所述方法包括:
[0009] 確定待分類的樣例;
[0010] 用一類分類器對(duì)樣例進(jìn)行正例分類,分類結(jié)果為正例的表示為A,其余分類結(jié)果表 示為B;
[0011] 用一類分類器再次對(duì)樣例進(jìn)行負(fù)例分類,分類結(jié)果為負(fù)例的表示為C,其余分類結(jié) 果表示為D;
[0012] 如只屬于A或C的樣例稱為可信樣例,分配到接受域;屬于AnC或?qū)儆贐UD的 樣例稱為不可信樣例,分配到拒絕域。
[0013] 可選的,所述方法在分配到拒絕域之后還包括:對(duì)所述拒絕域的樣例采用集成分 類器系統(tǒng)繼續(xù)處理,所述繼續(xù)處理的方法具體為:
[0014] 第二輪采用一類分類器對(duì)拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為正例的表示為 A2,其余分類結(jié)果表不為B2;
[0015] 第二輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類結(jié)構(gòu)為負(fù)例的表 示為C2,其余分類結(jié)果表示為D2 ;
[0016] 如只屬于八2或(32的樣例稱為可信樣例,分配到接受域;屬于A2nC2或?qū)儆贐2UD2 的樣例稱為不可信樣例,分配到第二拒絕域。
[0017] 可選的,所述方法在分配到第二拒絕域之后還包括:
[0018] 第三輪采用一類分類器對(duì)第二拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為正例的表 示為A3,其余分類結(jié)果表示為B3 ;
[0019] 第三輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類結(jié)構(gòu)為負(fù)例的表 示為C3,其余分類結(jié)果表示為D3 ;
[0020] 如只屬于^或(:3的樣例稱為可信樣例,分配到接受域;屬于A3nC3或?qū)儆贐3UD3 的樣例稱為不可信樣例,分配到第三拒絕域。
[0021] 可選的,所述方法在分配到第三拒絕域之后還包括:
[0022] 第n輪采用一類分類器對(duì)第n-1拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為正例的 表示為An,其余分類結(jié)果表示為Bn ;
[0023] 第n輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類結(jié)構(gòu)為負(fù)例的表 示為Cn,其余分類結(jié)果表示為Dn ;
[0024] 如只屬于4"或(;的樣例稱為可信樣例,分配到接受域;屬于AnnCn或?qū)儆贐nUDn 的樣例稱為不可信樣例,分配到第n拒絕域;其中n>3。
[0025] 另一方面,提供一種置信機(jī)器,所述機(jī)器包括:
[0026] 樣例模塊,用于確定待分類的樣例;
[0027] -類分類器,用于對(duì)樣例進(jìn)行正例分類,分類結(jié)果為正例的表示為A,其余分類結(jié) 果表不為B ;
[0028] -類分類器,還用于再次對(duì)樣例進(jìn)行負(fù)例分類,分類結(jié)果為負(fù)例的表示為C,其余 分類結(jié)果表示為D;
[0029] 分配模塊,用于如只屬于A或C的樣例稱為可信樣例,分配到接受域;屬于A H C 或?qū)儆贐 U D的樣例稱為不可信樣例,分配到拒絕域。
[0030] 可選的,一類分類器,用于第二輪采用一類分類器對(duì)拒絕域的樣例進(jìn)行正例分類, 分類結(jié)果為正例的表示為A2,其余分類結(jié)果表示為B2 ;
[0031] -類分類器,還用于第二輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類, 分類結(jié)構(gòu)為負(fù)例的表示為C2,其余分類結(jié)果表示為D2 ;
[0032] 分配模塊,還用于如只屬于A2或C2的樣例稱為可信樣例,分配到接受域;屬于 A2HC2或?qū)儆贐2UD2的樣例稱為不可信樣例,分配到第二拒絕域。
[0033] 可選的,一類分類器,用于第三輪采用一類分類器對(duì)第二拒絕域的樣例進(jìn)行正例 分類,分類結(jié)果為正例的表示為A3,其余分類結(jié)果表示為B3 ;
[0034] 一類分類器,還用于第三輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類, 分類結(jié)構(gòu)為負(fù)例的表示為C3,其余分類結(jié)果表示為D3 ;
[0035] 分配模塊,還用于如只屬于A3或C3的樣例稱為可信樣例,分配到接受域;屬于 A3nC3或?qū)儆贐3UD3的樣例稱為不可信樣例,分配到第三拒絕域。
[0036] 可選的,一類分類器,用于第n輪采用一類分類器對(duì)第n-1拒絕域的樣例進(jìn)行正例 分類,分類結(jié)果為正例的表示為An,其余分類結(jié)果表示為Bn ;
[0037] -類分類器,還用于第n輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類, 分類結(jié)構(gòu)為負(fù)例的表示為Cn,其余分類結(jié)果表示為Dn ;
[0038] 分配模塊,還用于如只屬于An或Cn的樣例稱為可信樣例,分配到接受域;屬于 AnnCn或?qū)儆贐nUDn的樣例稱為不可信樣例,分配到第n拒絕域;其中n>3。
[0039] 在本發(fā)明實(shí)施例中,本發(fā)明提供的技術(shù)方案的采用二次置信分類來(lái)實(shí)現(xiàn)置信度的 分類,無(wú)需計(jì)算置信度,也無(wú)需設(shè)置閾值,所以其具有省略置信度計(jì)算和設(shè)置閾值的優(yōu)點(diǎn)。
【專利附圖】
【附圖說(shuō)明】
[0040] 圖1是本發(fā)明提供的一種置信分類方法的流程圖;
[0041] 圖2是本發(fā)明提供的一種置信機(jī)器的結(jié)構(gòu)圖;
[0042] 圖3是本發(fā)明提供的三層置信集成分類示意圖;
[0043] 圖4(a)是本發(fā)明提供的分類后A與C不相交示意圖;
[0044] 圖4(b)是本發(fā)明提供的分類后A與C相交示意圖。
【具體實(shí)施方式】
[0045] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。
[0046] 本發(fā)明【具體實(shí)施方式】提供一種置信分類方法,上述方法由置信機(jī)器執(zhí)行,該方法 如圖1所示,包括如下步驟:
[0047] 101、確定待分類的樣例;
[0048] 102、用一類分類器對(duì)樣例進(jìn)行正例分類,分類結(jié)果為正例的表示為A,其余分類結(jié) 果表不為B;
[0049] 103、用一類分類器再次對(duì)樣例進(jìn)行負(fù)例分類,分類結(jié)果為負(fù)例的表示為C,其余分 類結(jié)果表示為D;
[0050] 104、如只屬于A或C的樣例稱為可信樣例,分配到接受域;屬于AnC或?qū)儆贐UD 的樣例稱為不可信樣例,分配到拒絕域。
[0051] 需要說(shuō)明的是,上述步驟102和103邏輯執(zhí)行順序上沒(méi)有先后之分。
[0052] 本發(fā)明采用的置信分類通過(guò)區(qū)分可信樣例與不可信樣例、劃分接受域與拒絕域, 達(dá)到對(duì)分類結(jié)果的預(yù)設(shè)分類處理,實(shí)現(xiàn)置信分類。并且此種方法僅僅只需要進(jìn)行二次樣例 分類,即不需要計(jì)算置信度,也無(wú)需設(shè)置閾值。
[0053] 可選的,上述方法在104之后還可以包括:對(duì)拒絕域的樣例采用集成分類器系統(tǒng) (EnsembleClassifierSystem)繼續(xù)處理,繼續(xù)處理的方法具體可以為:
[0054] 105、第二輪采用一類分類器對(duì)拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為正例的表 示為A2,其余分類結(jié)果表示為B2 ;
[0055] 106、第二輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類結(jié)構(gòu)為負(fù)例 的表示為C2,其余分類結(jié)果表示為D2 ;
[0056] 107、如只屬于A2或C2的樣例稱為可信樣例,分配到接受域;屬于A2nC2或?qū)儆?B2UD2的樣例稱為不可信樣例,分配到第二拒絕域。
[0057] 可選的,上述方法在107之后還可以包括:
[0058] 第三輪采用一類分類器對(duì)第二拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為正例的表 示為A3,其余分類結(jié)果表示為B3 ;
[0059] 第三輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類結(jié)構(gòu)為負(fù)例的表 示為C3,其余分類結(jié)果表示為D3 ;
[0060] 如只屬于八3或(]3的樣例稱為可信樣例,分配到接受域;屬于A3nC3或?qū)儆贐3UD3 的樣例稱為不可信樣例,分配到第三拒絕域。
[0061] 可選的,上述方法還可以包括:
[0062] 第n輪采用一類分類器對(duì)第n-1拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為正例的 表示為An,其余分類結(jié)果表示為Bn ;
[0063] 第n輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類結(jié)構(gòu)為負(fù)例的表 示為Cn,其余分類結(jié)果表示為Dn ;
[0064] 如只屬的樣例稱為可信樣例,分配到接受域;屬于AnnCn或?qū)儆贐nUDn 的樣例稱為不可信樣例,分配到第n拒絕域,其中n>3,n為整數(shù)。
[0065] 上述每輪采用一類分類器的次數(shù)為二次。
[0066] 在繼續(xù)處理中,就是使用多層集成分類的方法,對(duì)第一次拒絕域中的樣例繼續(xù)進(jìn) 行置信分類處理,即第二次使用一類分類器對(duì)第一次拒絕域中的樣例進(jìn)行置信分類。如有 需要,可以第三次使用一類分類器對(duì)第二次拒絕域中的樣例進(jìn)行置信分類,從而實(shí)現(xiàn)同質(zhì) 的多層集成分類,達(dá)到增強(qiáng)分類的目的。
[0067] 上述方法的原理具體如下:
[0068] 用一類分類器進(jìn)行二兀置信分類(英文全稱:TowClassConfidence ClassificationBasedonOneClassClassifier,英文簡(jiǎn)稱:TCCC-OCC),就是首先使用一類 分類器進(jìn)行正例的分類,分類的結(jié)果為正例的表示為A,其余的表示為B;然后再使用一類 分類器進(jìn)行負(fù)例的分類,分類的結(jié)果為負(fù)例的表示為C,其余的表示為D??赡苡袃煞N情形 出現(xiàn),一種是A與C不相交,如圖4(a)所示;另一種情況是A與C相交,如圖4(b)所示。經(jīng) 過(guò)這樣分類之后,某個(gè)樣例可能出現(xiàn)在如下四種情況之一中:
[0069] ①該樣例只屬于A
[0070] ②該樣例只屬于C
[0071] ③該樣例既屬于A,又屬于C,即屬于A門C
[0072] ④該樣例既不屬于A,又不屬于C,即屬于BUD
[0073] 將上述情況用圖表示出來(lái),就如圖4所示。把只屬于A或只屬于C的樣例,稱為可 信的樣例,在圖中為用堅(jiān)線表示的部分;把既屬于A又屬于C的樣例稱為不可信樣例,在圖 中為用橫線表示的部分;把既不屬于A又不屬于C,即屬于BUD的樣例也稱為不可信樣例, 在圖中為用空白表示的部分。
[0074] 按照上述定義,把可信的樣例劃分到接受域,在圖中用堅(jiān)線表示的部分;把不可信 的樣例劃分到拒絕域,在圖中用橫線和空白表示的部分。
[0075] 在上述方法中,通過(guò)區(qū)分可信樣例與不可信樣例、劃分接受域與拒絕域,達(dá)到對(duì)分 類結(jié)果的預(yù)設(shè)分類處理,實(shí)現(xiàn)置信分類。
[0076] 為了對(duì)實(shí)驗(yàn)的結(jié)果更好的進(jìn)行對(duì)比與分析,對(duì)識(shí)別率(Recognitionrate)、拒絕 率(Rejectionrate)、可信性(Reliability)、錯(cuò)誤率(Errorrate)分別定義如下:
[0077] 識(shí)別率Recognition rate (RR)=已正確識(shí)別的樣例數(shù)/測(cè)試集樣例數(shù)目
[0078] 拒絕率Rejection rate (ReR)=已拒絕的樣例數(shù)/測(cè)試集樣例數(shù)目
[0079] 可信性Reliability(RE)=(已正確識(shí)別的樣例數(shù)+已拒絕的樣例數(shù))/測(cè)試集 樣例數(shù)目
[0080] 錯(cuò)誤率Errorrate(ER) = 100%-RE
[0081] 另外還定義正確率Correctrate(CR)=已正確識(shí)別的樣例數(shù)/已識(shí)別的樣例數(shù)
[0082]同理定義累計(jì)識(shí)別率(Recognitionrate)、累計(jì)正確率(Correctrate)、累計(jì)拒 絕率(Rejectionrate)、累計(jì)可信性(Reliability)、累計(jì)錯(cuò)誤率(Errorrate)如下:
[0083] 累計(jì)識(shí)別率Recognition rate (RR)=累計(jì)已正確識(shí)別的樣例數(shù)/測(cè)試集樣例數(shù) 巨
[0084] 累計(jì)正確率Correctrate(CR)=累計(jì)已正確識(shí)別的樣例數(shù)/累計(jì)已識(shí)別的樣例 數(shù)
[0085] 累計(jì)拒絕率Rejection rate (ReR)=累計(jì)已拒絕的樣例數(shù)/測(cè)試集樣例數(shù)目
[0086] 累計(jì)可信性Reliability(RE)=(累計(jì)已正確識(shí)別的樣例數(shù)+累計(jì)已拒絕的樣例 數(shù))/測(cè)試集樣例數(shù)目
[0087] 累計(jì)錯(cuò)誤率Errorrate(ER) = 100% -累計(jì)的RE
[0088] 從上述定義中可以看出,可信性等于識(shí)別率加上拒絕率,即Reliability= recognitionrate+rejectionrate,也就是說(shuō)拒絕的選項(xiàng)只是置信程度比較低,并不代表 錯(cuò)誤識(shí)別,可以繼續(xù)做進(jìn)一步的機(jī)器學(xué)習(xí)算法處理或人工處理。
[0089] 本發(fā)明巧妙的利用一類分類器,運(yùn)用兩次一元分類器對(duì)二元問(wèn)題進(jìn)行分類,并以 設(shè)置拒絕選項(xiàng)的方法,通過(guò)多層集成學(xué)習(xí)的方式進(jìn)行二元分類的置信學(xué)習(xí)。該方法實(shí)現(xiàn)了 在省略置信度計(jì)算以及省略設(shè)置具體閾值的情況下,仍可進(jìn)行置信分類,并在心臟病和糖 尿病等多個(gè)實(shí)驗(yàn)數(shù)據(jù)集上進(jìn)行了驗(yàn)證,取得了較好的實(shí)驗(yàn)效果,其集成分類的圖如圖3所 /J、",〇
[0090] 軟件算法流程如下:
[0091] 訓(xùn)練算法流程:
[0092] 輸入
[0093] X:二元訓(xùn)練數(shù)據(jù)樣本
[0094] Y:二元訓(xùn)練樣本標(biāo)簽
[0095] TrainSet: (X,Y)
[0096] n = I
[0097] 輸出
[0098] TCCC-OCC 1正:第一層正類分類器
[0099] TCCC-OCC 1負(fù):第一層負(fù)類分類器
[0100] TCCC-OCC 2正:第二層正類分類器
[0101] TCCC-OCC 2負(fù):第二層負(fù)類分類器
[0102]TCCC-OCC 3正:第三層正類分類器
[0103] TCCC-OCC 3負(fù):第三層負(fù)類分類器
[0104] 過(guò)程
[0105] 1、用TrainSet訓(xùn)練一類分類器,取得一元分類器的有關(guān)參數(shù)值
[0106] 2、用一類分類器在訓(xùn)練集TrainSet上對(duì)正例進(jìn)行訓(xùn)練,取得一類分類器正例識(shí) 別模型TCCC-OCCn正
[0107] 3、用一類分類器在訓(xùn)練集TrainSet上對(duì)負(fù)例進(jìn)行訓(xùn)練,取得一類分類器負(fù)例識(shí) 別模型TCCC-OCCn負(fù)
[0108] 4、生成接受域TrainSetA,拒絕域TrainSetR
[0109] 5、ifn〈3
[0110] TrainSet=拒絕域TrainSetR
[0111] endif
[0112] 6、n=n+1
[0113] 7、ifn>3
[0114] goto8
[0115] else
[0116] gotoI
[0117] endif
[0118] 8、結(jié)束
[0119] 分類算法流程:
[0120] 輸入
[0121] x:未知樣本
[0122] 輸出
[0123] 未知樣本的類別
[0124] or
[0125] 人工處理未知樣本
[0126] 過(guò)程
[0127] 1.使用TCCC-OCC 1正對(duì)未知樣本X進(jìn)行識(shí)別分類
[0128] 2.使用TCCC-OCC1負(fù)對(duì)未知樣本X進(jìn)行識(shí)別分類
[0129] 3.IfXG接受域thenreturn樣本類別
[0130] 4.使用TCCC-OCC2正對(duì)未知樣本X進(jìn)行識(shí)別分類
[0131] 5.使用TCCC-OCC2負(fù)對(duì)未知樣本X進(jìn)行識(shí)別分類
[0132] 6.IfXG接受域thenreturn樣本類別
[0133] 7.使用TCCC-OCC 3正對(duì)未知樣本X進(jìn)行識(shí)別分類
[0134] 8.使用TCCC-OCC3負(fù)對(duì)未知樣本X進(jìn)行識(shí)別分類
[0135] 9.IfXG接受域thenreturn樣本類別
[0136] 10.return人工處理未知樣本
[0137] 11.結(jié)束
[0138] 實(shí)驗(yàn)情況
[0139] 表1實(shí)驗(yàn)使用數(shù)據(jù)集情況表
[0140]
【權(quán)利要求】
1. 一種置信分類方法,其特征在于,所述方法包括: 確定待分類的樣例; 用一類分類器對(duì)樣例進(jìn)行正例分類,分類結(jié)果為正例的表示為A,其余分類結(jié)果表示為 B ; 用一類分類器再次對(duì)樣例進(jìn)行負(fù)例分類,分類結(jié)果為負(fù)例的表示為C,其余分類結(jié)果表 示為D ; 如只屬于A或C的樣例稱為可信樣例,分配到接受域;屬于Anc或?qū)儆贐UD的樣例 稱為不可信樣例,分配到拒絕域。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法在分配到拒絕域之后還包括:對(duì) 所述拒絕域的樣例采用集成分類器系統(tǒng)繼續(xù)處理,所述繼續(xù)處理的方法具體為: 第二輪采用一類分類器對(duì)拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為正例的表示為A2, 其余分類結(jié)果表不為B2 ; 第二輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類結(jié)構(gòu)為負(fù)例的表示為 C2,其余分類結(jié)果表不為D2 ; 如只屬于a2或c2的樣例稱為可信樣例,分配到接受域;屬于a2 n c2或?qū)儆赽2 u d2的 樣例稱為不可信樣例,分配到第二拒絕域。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法在分配到第二拒絕域之后還包 括: 第三輪采用一類分類器對(duì)第二拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為正例的表示為 A3,其余分類結(jié)果表不為B3 ; 第三輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類結(jié)構(gòu)為負(fù)例的表示為 C3,其余分類結(jié)果表不為D3 ; 如只屬于a3或c3的樣例稱為可信樣例,分配到接受域;屬于a3 n c3或?qū)儆赽3 u d3的 樣例稱為不可信樣例,分配到第三拒絕域。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法在分配到第三拒絕域之后還包 括: 第n輪采用一類分類器對(duì)第n-1拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為正例的表示 為An,其余分類結(jié)果表不為Bn ; 第n輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類結(jié)構(gòu)為負(fù)例的表示為 Cn,其余分類結(jié)果表不為Dn ; 如只屬于An或Cn的樣例稱為可信樣例,分配到接受域;屬于An n Cn或?qū)儆贐n U Dn的 樣例稱為不可信樣例,分配到第n拒絕域;其中n>3。
5. -種置信機(jī)器,其特征在于,所述機(jī)器包括: 樣例模塊,用于確定待分類的樣例; 一類分類器,用于對(duì)樣例進(jìn)行正例分類,分類結(jié)果為正例的表示為A,其余分類結(jié)果表 示為B ; 一類分類器,還用于再次對(duì)樣例進(jìn)行負(fù)例分類,分類結(jié)果為負(fù)例的表示為C,其余分類 結(jié)果表不為D ; 分配模塊,用于如只屬于A或C的樣例稱為可信樣例,分配到接受域;屬于A n C或?qū)? 于B U D的樣例稱為不可信樣例,分配到拒絕域。
6. 根據(jù)權(quán)利要求5所述的機(jī)器,其特征在于, 一類分類器,用于第二輪采用一類分類器對(duì)拒絕域的樣例進(jìn)行正例分類,分類結(jié)果為 正例的表示為A2,其余分類結(jié)果表示為B2 ; 一類分類器,還用于第二輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類 結(jié)構(gòu)為負(fù)例的表示為c2,其余分類結(jié)果表示為D2 ; 分配模塊,還用于如只屬于a2或(:2的樣例稱為可信樣例,分配到接受域;屬于a2 n c2或?qū)儆赽2 u d2的樣例稱為不可信樣例,分配到第二拒絕域。
7. 根據(jù)權(quán)利要求5所述的機(jī)器,其特征在于, 一類分類器,用于第三輪采用一類分類器對(duì)第二拒絕域的樣例進(jìn)行正例分類,分類結(jié) 果為正例的表示為A3,其余分類結(jié)果表示為B3 ; 一類分類器,還用于第三輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類 結(jié)構(gòu)為負(fù)例的表示為c3,其余分類結(jié)果表示為D3 ; 分配模塊,還用于如只屬于a3*c3的樣例稱為可信樣例,分配到接受域;屬于a3 n c3或?qū)儆赽3 U 03的樣例稱為不可信樣例,分配到第三拒絕域。
8. 根據(jù)權(quán)利要求5所述的機(jī)器,其特征在于, 一類分類器,用于第n輪采用一類分類器對(duì)第n-1拒絕域的樣例進(jìn)行正例分類,分類結(jié) 果為正例的表示為An,其余分類結(jié)果表示為Bn ; 一類分類器,還用于第n輪再次采用一類分類器對(duì)拒絕域的樣例進(jìn)行負(fù)例分類,分類 結(jié)構(gòu)為負(fù)例的表示為Cn,其余分類結(jié)果表示為Dn ; 分配模塊,還用于如只屬于An或Cn的樣例稱為可信樣例,分配到接受域;屬于An n Cn或?qū)儆贐n U Dn的樣例稱為不可信樣例,分配到第n拒絕域;其中n>3。
【文檔編號(hào)】G06F19/00GK104361224SQ201410606984
【公開(kāi)日】2015年2月18日 申請(qǐng)日期:2014年10月31日 優(yōu)先權(quán)日:2014年10月31日
【發(fā)明者】蔣方純, 田盛豐, 樂(lè)穎 申請(qǐng)人:深圳信息職業(yè)技術(shù)學(xué)院