一種多分類器閾值的設(shè)置方法
【專利摘要】一種多分類器閾值的設(shè)置方法,根據(jù)實際應(yīng)用環(huán)境條件,采用模式識別或機器學(xué)習(xí)算法得到實際應(yīng)用環(huán)境條件下的多個分類器;將多個分類器放入實際應(yīng)用環(huán)境下進(jìn)行N次測試分別得到多個分類器的N個閾值對N個閾值進(jìn)行分類,偏大的閾值valueX通過公式result_value=a*valueX-b*valueX*valueX進(jìn)行調(diào)整,偏小的閾值valueY通過公式result_value=(valueY-m)^3+k進(jìn)行調(diào)整;再根據(jù)調(diào)整后的各個閾值對各個分類器進(jìn)行設(shè)定。本發(fā)明對多分類器在不同應(yīng)用環(huán)境下的閾值進(jìn)行調(diào)整,對偏大和偏小的閾值分別進(jìn)行調(diào)整,保證分類器在進(jìn)行分類過程中正確性的提高和拒識率的降低;正常的閾值則直接使用,使得調(diào)整后的閾值應(yīng)用到分類器中能夠降低分類器的錯誤率,保證分類器在實際環(huán)境中的應(yīng)用。
【專利說明】—種多分類器閾值的設(shè)置方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及模式識別技術(shù),尤其涉及一種多分類器閾值的設(shè)置方法。
【背景技術(shù)】
[0002]在進(jìn)行模式識別過程中,通過采用相應(yīng)的識別算法獲得在具體應(yīng)用環(huán)境下的分類器。對于分類器而言,實際環(huán)境所得到的分類結(jié)果有時候是極端的兩面:是或否,但往往大多數(shù)的時候是一個數(shù)值,數(shù)值應(yīng)取到什么程度才算達(dá)到區(qū)分類別的要求,這個在實際應(yīng)用中是非常重要的,因為它直接反應(yīng)出分類器的分類能力,在模式識別領(lǐng)域中也體現(xiàn)為對置信度的設(shè)置。在實際情況下,分類器接收到非預(yù)期的情況下的取值情況,如果分類器沒有拒識的能力,那么在接收實際的結(jié)果后,根據(jù)最大結(jié)果做出的分類決策有時候也會帶來不便。在很多多分類器的應(yīng)用中人們常采用經(jīng)驗值來對閾值進(jìn)行設(shè)定,或者根據(jù)某個實際的應(yīng)用實例,通過統(tǒng)計分類器在這個實例中的分類效果來確定閾值,這種方法往往需要過多的人工干預(yù)同時也使得在分類器閾值設(shè)定方法上太過于固定,不靈活。
[0003]因此,現(xiàn)有技術(shù)還有待于改進(jìn)和發(fā)展。
【發(fā)明內(nèi)容】
[0004]鑒于上述現(xiàn)有技術(shù)的不足之處,本發(fā)明為解決現(xiàn)有技術(shù)的缺陷和不足,提出一種能夠?qū)Ψ诸惼鞯某醪介撝禂?shù)據(jù)進(jìn)行分析,根據(jù)預(yù)設(shè)的數(shù)學(xué)映射函數(shù)對分類數(shù)據(jù)進(jìn)行參數(shù)調(diào)整得到理想的多分類器閾值的方法。
[0005]本發(fā)明解決技術(shù)問題所采用的技術(shù)方案如下:
一種多分類器閾值的設(shè)置方法,其特征在于,包括如下步驟:
A.根據(jù)實際應(yīng)用環(huán)境條件,采用模式識別或機器學(xué)習(xí)算法得到實際應(yīng)用環(huán)境條件下的多個分類器1、;
B.將所述多個分類器分別放入實際應(yīng)用環(huán)境下進(jìn)行N次測試,得到多個分類器中各個分類器在實際應(yīng)用環(huán)境下N次測試的N個閾值;
C.對所述各個分類器N個閾值進(jìn)行統(tǒng)計分類,對偏大的閾值通過公式reSult_value=a*valueX_b*valueX*valueX進(jìn)行調(diào)整,對偏小的閾值通過公式result_value=(valueY_m) ~3+k進(jìn)行調(diào)整;其中,valueX為偏大的閥值,valueY為偏小的閥值,result_value為調(diào)整后的閾值,a、b、m、k為根據(jù)實際應(yīng)用環(huán)境條件確定的參數(shù);
D.根據(jù)調(diào)整后的各個閾值對各個分類器進(jìn)行分別設(shè)定。
[0006]作為進(jìn)一步改進(jìn)方案,所述模式識別或機器學(xué)習(xí)算法包括神經(jīng)網(wǎng)絡(luò)、支持向量機和均值聚類方法。
[0007]步驟C中所述對偏大的閾值通過公式result_value=a*valueX_b*valueX*valueX進(jìn)行調(diào)整后得到的閾值仍舊屬于偏大的閾值時則繼續(xù)通過該公式進(jìn)行調(diào)整。
[0008]步驟C中所述對偏小的閾值valueY通過公式result_value= (valueY-m) '3+k進(jìn)行調(diào)整后得到的閾值仍舊屬于偏小的閾值時則繼續(xù)通過該公式進(jìn)行調(diào)整。[0009]步驟C中所述偏大的閾值范圍為大于0.7,所述偏小的閾值范圍為小于0.4。
[0010]步驟C中參數(shù)a、b、m、k的范圍為:1≤a≤2,0.1 ^ b ^ 0.3,1.5≤m≤2.8、
0.1 ≤ k ≤ 0.25。
[0011]步驟C還包括:對偏大的閾值和偏小的閾值之外的正常閾值則直接使用。
[0012]所述正常閾值范圍為0.1~0.7。
[0013]與現(xiàn)有技術(shù)相比較,本發(fā)明對多分類器在不同應(yīng)用環(huán)境下的閾值進(jìn)行調(diào)整,對偏大和偏小的閾值分別進(jìn)行調(diào)整,保證分類器在進(jìn)行分類過程中正確性的提高和拒識率的降低;正常的閾值則直接使用,使得調(diào)整后的閾值應(yīng)用到分類器中能夠降低分類器的錯誤率,保證分類器在實際環(huán)境中的應(yīng)用。
【專利附圖】
【附圖說明】
[0014]圖1是本發(fā)明多分類器閾值的設(shè)置方法流程圖。
[0015]圖2是本發(fā)明多分類器閾值的設(shè)置方法中初步閾值中偏大閾值取值的曲線示意圖。
[0016]圖3是本發(fā)明多分類器閾值的設(shè)置方法中初步閾值中偏小閾值取值的曲線示意圖。
【具體實施方式】
[0017]為使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚、明確,以下參照附圖并舉實施例對本發(fā)明進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0018]在圖像識別的過程中往往需要根據(jù)需求建立多個分類器,以適應(yīng)環(huán)境需求,但是對于多個分類器要選取合適的閾值依靠需要不斷的嘗試和經(jīng)驗,這對于分類器的快速應(yīng)用很不利,本發(fā)明提供一種多分類器的閾值設(shè)置方法,如圖1所示,本發(fā)明多分類器的設(shè)置方法步驟如下:
S100,根據(jù)實際應(yīng)用環(huán)境條件,采用模式識別或機器學(xué)習(xí)算法得到實際應(yīng)用環(huán)境條件下的多個分類器1~Ν。
[0019]具體而言,通過對實際應(yīng)用環(huán)境的分析,采用相應(yīng)的模式識別或機器學(xué)習(xí)算法得到對應(yīng)的分類器,模式識別或機器學(xué)習(xí)算法包括神經(jīng)網(wǎng)絡(luò)、支持向量機、均值聚類等方法,以得到不同環(huán)境條件下的多個分類器,分類器的存在表示對某個條件下環(huán)境的區(qū)分情況,而分類器的分類好壞,則反映出對該條件的區(qū)分能力。實際環(huán)境表示的是要區(qū)分的實際應(yīng)用場景,如要區(qū)分物體所存在的環(huán)境,條件是對分類器設(shè)計的一個要求,即滿足指定的條件能得到對應(yīng)的各個分類器進(jìn)行分類。
[0020]根據(jù)條件1、條件2、條件3……條件M采用模式識別或機器學(xué)習(xí)中的算法得到對應(yīng)的不同分類器:分類器1、分類器2、分類器3……分類器Μ,即得到不同應(yīng)用環(huán)境條件下的多個分類器。
[0021]S200,將所述多個分類器分別放入實際應(yīng)用環(huán)境下進(jìn)行N次測試,得到多個分類器中各個分類器在實際應(yīng)用環(huán)境下N次測試的N個閾值valuel、value2......valueN。
[0022]對于所得到的多分類器1~Μ,把1~Μ各個分類器分別放入實際的環(huán)境中進(jìn)行N次測試(N次測試可以根據(jù)應(yīng)用環(huán)境來確定得到,為本領(lǐng)域技術(shù)人員公知的經(jīng)驗值,此處并不做限定),得到對應(yīng)的多個輸出值,并且所輸出的值有正確也有錯誤,把這些輸出值進(jìn)行統(tǒng)計根據(jù)具體應(yīng)用的要求,比如:保證錯誤率為5%。以下的基礎(chǔ)上在盡量保證正確率在95%以上,得到每個分類器各個不同的閾值valuel、value2、value3......valueN。
[0023]S300,對各個分類器N個閾值valuel、value2......valueN進(jìn)行統(tǒng)計分類,
對偏大的閾值 valueX 通過公式 result_value=a*valueX_b*valueX*valueX 進(jìn)行調(diào)整,對偏小的閾值valueY通過公式result_value= (valueY-m) "3+k進(jìn)行調(diào)整;其中,valueX E valuel~valueN, valueY E valuel~valueN,result_value 為調(diào)整后的閾值,a、b、m、k為根據(jù)實際應(yīng)用環(huán)境條件確定的參數(shù)。
[0024]對于每個分類器所確定的初步閾值(即N個閾值valuel、value2、value3......valueN),測試得到的初步閾值有時候比較低,有時候比較高,這只是針對實際環(huán)境測試下所得到的結(jié)果,反映的也只是實際環(huán)境的部分情況不能完全的反映出分類器的分類能力,需要做進(jìn)一步的閾值優(yōu)化,在這里我們引入一種函數(shù)映射,主要用于對實際環(huán)境測試下所得到初步閾值進(jìn)行調(diào)整,以使得分類器在實際環(huán)境中具有更好的分類能力。在上述輸出的所有初步閾值valuel、value2、value3……valueN值中,對于閾值的值而言,一般閾值的分布情況有如下三種:
一種是正常閾值,如0.5、0.6、0.7等,優(yōu)選范圍為0.4^0.7,其分布是合理的,也是在分類中符合人們經(jīng)驗的,所以對于這類值我們不需要進(jìn)行閾值調(diào)整,直接使用該閾值即可。
[0025]一種是偏大的閾值,如0.85、0.9、0.95等,若不進(jìn)行調(diào)整會使得閾值門檻過高,本可以區(qū)分的類別會出現(xiàn)未區(qū)分,使得分類器的正確率降低,拒識率提高,不利于分類器在實際環(huán)境中的應(yīng)用,所以對于這些偏大的值我們采用函數(shù)result_value=a*valueX_b*valueX*valueX來實現(xiàn)對偏高數(shù)值的閾值調(diào)整,其中valueX為偏高的初步閾值,a、b為給定的參數(shù),具體的取值根據(jù)實際應(yīng)用環(huán)境確定,優(yōu)選范圍為:l<a<2、
0.1 < b < 0.3。上述偏大閾值所形成的曲線趨勢如圖2所示:
圖2中橫坐標(biāo)為初步閾值value,標(biāo)定值value_max為偏大閾值節(jié)點,優(yōu)選為0.7,即大于該value_max的閾值為偏大閾值,縱坐標(biāo)為通過上述result_value=a*valueX_b*valueX*valueX 數(shù)學(xué)映射函數(shù)映射得到的 result_value 值,value_set為偏大閾值節(jié)點通過該數(shù)學(xué)映射函數(shù)映射得到的調(diào)整結(jié)果閾值,其中value_set〈value_max ;這樣保證了初步閾值value在偏大的情況下通過映射降低value值,保證了分類器在進(jìn)行分類過程中正確性的提高,以及拒識率的降低。
[0026]應(yīng)當(dāng)說明的是,對偏大閾值根據(jù)上述偏大閾值數(shù)學(xué)映射函數(shù)調(diào)整后得到的結(jié)果閾值如果仍舊屬于偏大的閾值范圍,則需要繼續(xù)通過該偏大閾值數(shù)學(xué)映射函數(shù)循環(huán)計算直到得到正常的閾值。
[0027]一種是偏小的閾值,如0.1,0.24,0.3等,若直接使用該閾值,則會因為新環(huán)境的變化讓分類器的輸出值變高,使得相應(yīng)的錯誤率增加,不利于分類器的應(yīng)用,所以對于偏小的值我們采用函數(shù)為:result_value=(valueY-m) "3+k來實現(xiàn)對偏低數(shù)值的閾值調(diào)整,其中valueY為偏小的初步閾值,m、k為所取的參數(shù)值,具體的取值根據(jù)實際的環(huán)境確定,優(yōu)選范圍為:1.5≤m≤2.8,0.1≤k≤0.25。偏小閾值所形成的曲線如圖3所示:
圖3中的橫坐標(biāo)為初步閾值value,標(biāo)定值value_min為偏小閾值節(jié)點,優(yōu)選為0.4,即小于該value_min的閾值為偏小閾值,縱坐標(biāo)為通過上述result_value= (valueY-m) '3+k數(shù)學(xué)映射函數(shù)所得到的值,value_set為偏小閾值節(jié)點通過該數(shù)學(xué)映射函數(shù)映射得到的調(diào)整結(jié)果閾值,其中value_set>value_min,這保證了分類器在較低閾值下通過函數(shù)映射提高原有的閾值,從而降低了分類器的錯誤率,保證了分類器在實際環(huán)境中的應(yīng)用。
[0028]應(yīng)當(dāng)說明的是,對偏小閾值根據(jù)上述偏小閾值數(shù)學(xué)映射函數(shù)調(diào)整后得到的結(jié)果閾值如果仍舊屬于偏大的閾值范圍,則需要繼續(xù)通過該偏大閾值數(shù)學(xué)函數(shù)循環(huán)計算直到得到正常的閾值。
[0029]S400,根據(jù)調(diào)整后的各個閾值對各個分類器進(jìn)行分別設(shè)定。
[0030]把所有的分類器根據(jù)上述方法進(jìn)行閾值的初步設(shè)定,并經(jīng)函數(shù)映射得到最后確定的閾值分布。 [0031]以下通過一個具體實施例來說明上述方法的具體應(yīng)用:
根據(jù)需求,需建立區(qū)分10種類別物體的圖像,這需要通過模式識別或者機器學(xué)習(xí)建立10組類別的分類器,所采用形成分類器的技術(shù)在這里不做限制,可以是神經(jīng)網(wǎng)絡(luò),支持向量機,均值聚類等,最重要的是每個分類器都能對測試環(huán)境給予一個輸出值,并且用這個輸出值來進(jìn)行各類之間區(qū)分度的判別。
[0032]例如,根據(jù)類別建立10個分類器,分別為:分類器1、分類器2、分類器3……分類器10。
[0033]對每個分類器我們通過實際環(huán)境獲取樣本,對這10個分類器進(jìn)行分別測試,測試次數(shù)為2000次。
[0034]例如,表1為分類器5所得到的2000個測試樣本的輸出值(初步閾值)分布結(jié)果,其中正確分類的結(jié)果分布在廣1.2之間的為887次,錯誤分類的結(jié)果分布在f 1.2之間的為I次,其他范圍的具體見表1,按照要求保證錯誤率在5%。以下的基礎(chǔ)上在確保正確識別率在95%以上,得到的初步閾值為:value5=0.28 ;
表1
【權(quán)利要求】
1.一種多分類器閾值的設(shè)置方法,其特征在于,包括如下步驟: A.根據(jù)實際應(yīng)用環(huán)境條件,采用模式識別或機器學(xué)習(xí)算法得到實際應(yīng)用環(huán)境條件下的多個分類器; B.將所述多個分類器分別放入實際應(yīng)用環(huán)境下進(jìn)行N次測試,得到多個分類器中各個分類器在實際應(yīng)用環(huán)境下N次測試的N個閾值; C.對所述各個分類器N個閾值進(jìn)行統(tǒng)計分類,對其中偏大的閾值通過公式reSult_value=a*valueX_b*valueX*valueX進(jìn)行調(diào)整,對其中偏小的閾值通過公式result_value=(valueY_m) ~3+k進(jìn)行調(diào)整;其中,valueX為偏大的閥值,valueY為偏小的閥值,result_value為調(diào)整后的閾值,a、b、m、k為根據(jù)實際應(yīng)用環(huán)境條件確定的參數(shù); D.根據(jù)調(diào)整后的各個閾值對各個分類器進(jìn)行分別設(shè)定。
2.根據(jù)權(quán)利要求1所述的多分類器閾值的設(shè)置方法,其特征在于,所述模式識別或機器學(xué)習(xí)算法包括神經(jīng)網(wǎng)絡(luò)、支持向量機和均值聚類方法。
3.根據(jù)權(quán)利要求1所述的多分類器的設(shè)置方法,其特征在于,步驟C中所述對偏大的閾值通過公式result_value=a*valueX_b*valueX*valueX進(jìn)行調(diào)整后得到的閾值仍舊屬于偏大的閾值時則繼續(xù)通過該公式進(jìn)行調(diào)整。
4.根據(jù)權(quán)利要求1所述的多分類器的設(shè)置方法,其特征在于,步驟C中所述對偏小的閾值valueY 通過公式result_value= (valueY-m) "3+k進(jìn)行調(diào)整后得到的閾值仍舊屬于偏小的閾值時則繼續(xù)通過該公式進(jìn)行調(diào)整。
5.根據(jù)權(quán)利要求1至4任一項所述的多分類器的設(shè)置方法,其特征在于,步驟C中所述偏大的閾值范圍為大于0.7,所述偏小的閾值范圍為小于0.4。
6.根據(jù)權(quán)利要求5所述的多分類器的設(shè)置方法,其特征在于,步驟C中參數(shù)a、b、m、k的范圍為:1≤a≤2,0.1≤b≤0.3、1.5≤m≤2.8,0.1≤k≤0.25。
7.根據(jù)權(quán)利要求6所述的多分類器的設(shè)置方法,其特征在于,步驟C還包括:對偏大的閾值和偏小的閾值之外的正常閾值則直接使用。
8.根據(jù)權(quán)利要求7所述的多分類器的設(shè)置方法,其特征在于,所述正常閾值范圍為.0.4~0.7。
【文檔編號】G06F15/17GK103761210SQ201410001014
【公開日】2014年4月30日 申請日期:2014年1月2日 優(yōu)先權(quán)日:2014年1月2日
【發(fā)明者】周龍沙, 邵詩強 申請人:Tcl集團(tuán)股份有限公司