專利名稱:一種基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)視覺、數(shù)字圖像處理和模式識別技術(shù)領(lǐng)域,特別是一種基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法。
背景技術(shù):
隨著信息時(shí)代的高速發(fā)展,傳統(tǒng)的密碼系統(tǒng)面臨著巨大的挑戰(zhàn),信息安全隨之得到空前的重視。生物特征識別技術(shù)由于其唯一性,穩(wěn)定性和可靠性逐漸成為傳統(tǒng)身份識別的最有效的替代品。隨著研究的逐步深入,接觸式的以及需要用戶高度配合的生物特征識別系統(tǒng)已經(jīng)滿足不了人們對設(shè)備易用性的需求,取而代之的是大范圍、遠(yuǎn)距離監(jiān)控場景下 的生物特征識別系統(tǒng)。隨著易用性的提高,生物特征樣本數(shù)量大幅增加,質(zhì)量千差萬別。基于高質(zhì)量的生物特征識別算法的處理效率以及準(zhǔn)確性都受到挑戰(zhàn)。亟待解決的問題是如何將生物特征樣本的質(zhì)量與識別系統(tǒng)的性能直接關(guān)聯(lián)起來。建立起這種關(guān)系,有三個(gè)方面的優(yōu)點(diǎn),第一,在具體識別操作之前可以大量去除根本無法識別的樣本,減少系統(tǒng)響應(yīng)時(shí)間,擴(kuò)大識別系統(tǒng)的吞吐量;第二,根據(jù)樣本質(zhì)量預(yù)測的識別性能自適應(yīng)改變識別系統(tǒng)算法,應(yīng)變復(fù)雜樣本質(zhì)量變化需求;第三,通過人為改變生物特征樣本質(zhì)量分布,可以測試相應(yīng)算法在極端條件下的識別效果,判斷算法的優(yōu)劣。目前,基于樣本質(zhì)量的生物特征識別系統(tǒng)的性能預(yù)測并不成熟,一些已有的工作僅僅集中在通過特征空間分布和性能間的關(guān)系來建立預(yù)測模型,詳見文獻(xiàn)[1]R. Wangand B.Bhanu,“Predicting fingerprint biometrics performance from a smallgallery,,,Pattern Recognition Letters, 28 (I) :40-48, 2007 ; [2]A. Johnson, J. Sun andA. Bobick. “Predicting large population data cumulative match characteristicperformance from small population data”, Audio-and Video-based BiometricPerson Authentication, volume 2688 of Lecture Notes in Computer Science, pages1061-1062。這部分工作更趨近于對特征統(tǒng)計(jì)理論模型的分析,而對于改善系統(tǒng)性能的幫助很小。當(dāng)然,也有工作側(cè)重于通過樣本質(zhì)量與識別性能的對應(yīng)關(guān)系建立預(yù)測模型,詳見文獻(xiàn)[3]G. Aggarwal, S. Biswas, P. Flynn and K. Bowyer, “Predicting performanceof face recognition systems An image characterization approach,,,In ComputerVision and Pattern Recognition Workshop, pages 52-59, june2011o 但是該方法有兩方面的局限性。首先,這是基于人臉識別系統(tǒng)的性能預(yù)測,并沒有推廣到生物特征識別領(lǐng)域;其次,回歸模型的采用上不能規(guī)避噪聲的影響,使得它的準(zhǔn)確性得到抑制;最后,由于非線性回歸有一定時(shí)間復(fù)雜度,使應(yīng)用受到限制。綜上所述,基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法具有重要的意義。
發(fā)明內(nèi)容
本發(fā)明的目的是針對上述現(xiàn)有技術(shù)存在的問題,提供一種基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法。本發(fā)明綜合了發(fā)明人曾經(jīng)提出的虹膜樣本質(zhì)量確定方法,詳見文獻(xiàn)[4]X. Li,Z. Sun and T. Tan,“Comprehensive assessment of iris image quality,,,In International Conference on Image Processing, pages 3178-3181,2011,提出了一套生物特征識別系統(tǒng)性能預(yù)測的方法,具體包括,生物特征樣本質(zhì)量參數(shù)的提取,平均分布采樣以及偏最小二乘回歸建模,從而建立了生物特征樣本質(zhì)量與識別性能的量化關(guān)系。本發(fā)明通過偏最小二乘回歸建模的方法,抑制了噪聲對預(yù)測模型的影響。在預(yù)測時(shí)間方面,本發(fā)明方法遠(yuǎn)遠(yuǎn)領(lǐng)先于其他方法,滿足了系統(tǒng)對時(shí)間復(fù)雜度的要求,取得了良好的預(yù)測綜合效果。本發(fā)明的基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法包括步驟SI,采集生物特征樣本,組成訓(xùn)練樣本庫;步驟S2,對訓(xùn)練樣本庫中的生物特征樣本進(jìn)行預(yù)處理,提取每一生物特征樣本的質(zhì)量參數(shù)向量,并將訓(xùn)練樣本庫中任意兩個(gè)生物特征樣本進(jìn)行配對,得到配對的兩個(gè)生物特征樣本的樣本質(zhì)量參數(shù)向量對; 步驟S3,根據(jù)訓(xùn)練樣本庫中樣本的標(biāo)記信息將所述步驟2中的生物特征樣本間的匹配分為類內(nèi)比對和類間比對;步驟S4,計(jì)算所述步驟2中配對的生物特征樣本之間的比對分?jǐn)?shù),并基于樣本的標(biāo)記信息將計(jì)算得到比對分?jǐn)?shù)分為類內(nèi)比對分?jǐn)?shù)和類間比對分?jǐn)?shù);步驟S5,分別對所述步驟S4計(jì)算得到的類內(nèi)比對分?jǐn)?shù)和類間比對分?jǐn)?shù)進(jìn)行平均采樣;步驟S6,基于平均采樣后的樣本的生物特征樣本質(zhì)量參數(shù)向量對以及樣本間的比對分?jǐn)?shù),通過偏最小二乘回歸(PLS-R)方法分別建立生物特征樣本質(zhì)量參數(shù)向量對與生物特征樣本比對分?jǐn)?shù)之間的類內(nèi)模型和類間模型;步驟S7,與所述步驟S2相似,對被測生物特征識別系統(tǒng)中的所有測試生物特征樣本進(jìn)行預(yù)處理,得到測試生物特征樣本的質(zhì)量參數(shù)向量;步驟S8,與所述步驟S3相似,根據(jù)樣本的標(biāo)記信息將測試生物特征樣本間的匹配分為類內(nèi)比對和類間比對;步驟S9,根據(jù)所述步驟S6訓(xùn)練得到的類內(nèi)模型和類間模型分別預(yù)測測試生物特征樣本間的類內(nèi)比對分?jǐn)?shù)和類間比對分?jǐn)?shù),并根據(jù)預(yù)測得到的類內(nèi)比對分?jǐn)?shù)和類間比對分?jǐn)?shù)的分布,計(jì)算代表生物特征識別系統(tǒng)總體性能的性能參數(shù)來測試所述生物特征識別系統(tǒng)預(yù)測的性能。通過本發(fā)明的基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法能夠建立生物特征樣本質(zhì)量和樣本匹配分?jǐn)?shù)的對應(yīng)關(guān)系,進(jìn)而預(yù)測生物特征識別系統(tǒng)的性能。本發(fā)明的基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法在匹配分?jǐn)?shù)選取時(shí)采用了平均采樣的方法,該方法保證在一定的分?jǐn)?shù)取值范圍內(nèi)分?jǐn)?shù)間分配的權(quán)重相同,從而有效地降低訓(xùn)練集中高概率分?jǐn)?shù)對回歸模型的影響。另外,本發(fā)明的基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法在匹配分?jǐn)?shù)回歸模型的建立上采用了偏最小二乘回歸的方法,優(yōu)點(diǎn)主要有三個(gè)方面。第一,偏最小二乘回歸方法在特征空間中每次選取的是區(qū)分度最大的特征,這就有效地抑制了噪聲點(diǎn)對回歸模型的影響;第二,由于在模型建立的過程中,運(yùn)用匹配分?jǐn)?shù)與質(zhì)量參數(shù)共同作用,從而突出兩方面的相關(guān)性;第三,訓(xùn)練結(jié)束后,回歸模塊只是矩陣相乘,這樣就大大降低了預(yù)測時(shí)間。
因此,本發(fā)明解決了基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測的問題,建立起生物特征樣本質(zhì)量和和樣本匹配分?jǐn)?shù)的對應(yīng)關(guān)系,在今后的應(yīng)用中,不僅可以根據(jù)樣本質(zhì)量分布預(yù)測生物特征識別系統(tǒng)的性能,而且還可以用于評價(jià)相應(yīng)生物特征識別算法對特定生物特征質(zhì)量的容忍度和魯棒性,進(jìn)而有效的推動(dòng)生物特征識別算法向正確的方向發(fā)展。
圖I為本發(fā)明基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法流程圖;圖2為決定虹膜樣本質(zhì)量的離焦、運(yùn)動(dòng)模糊、光照、眼皮及睫毛遮擋、斜眼及瞳孔伸縮示意圖;圖3(a)為原始采樣分?jǐn)?shù)分布示意圖;圖3(b)為平均采樣分?jǐn)?shù)分布示意圖;圖4(a)為本發(fā)明在ICE 2005Left數(shù)據(jù)庫上的等錯(cuò)誤率(EER)預(yù)測曲線圖;圖4(b)為本發(fā)明在ICE 2005Right數(shù)據(jù)庫上的等錯(cuò)誤率(EER)預(yù)測曲線圖;圖4(()為本發(fā)明在ICE 2005Left數(shù)據(jù)庫上的可區(qū)分指數(shù)(D-Index)預(yù)測曲線圖;圖4(d)為本發(fā)明在ICE 2005 Right數(shù)據(jù)庫上的可區(qū)分指數(shù)(D-Index)預(yù)測曲線圖;圖5為本發(fā)明在Lamp數(shù)據(jù)庫上的原始識別性能和預(yù)測識別性能曲線圖;圖6為本發(fā)明在Thous數(shù)據(jù)庫上的原始識別性能和預(yù)測識別性能曲線圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對本發(fā)明進(jìn)一步詳細(xì)說明。在這里以基于樣本質(zhì)量的虹膜識別性能預(yù)測為例解釋說明本發(fā)明的具體細(xì)節(jié)。如何量化虹膜樣本質(zhì)量與虹膜識別性能的關(guān)系不僅有助于虹膜樣本質(zhì)量評價(jià)算法的發(fā)展,而且對衡量虹膜識別算法對虹膜樣本的容忍度也有很重要的意義。本發(fā)明提出的基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法涉及到的生物特征樣本質(zhì)量參數(shù),平均采樣方法以及生物特征識別性能指標(biāo)定義如下生物特征樣本質(zhì)量參數(shù)是反應(yīng)生物特征樣本質(zhì)量的參數(shù)。虹膜識別具體涉及六種影響虹膜樣本質(zhì)量的狀態(tài),包括離焦模糊,如圖2(a)所示;運(yùn)動(dòng)模糊,如圖2(b)所示;光照,如圖2 (C)所示;眼皮及睫毛遮擋,如圖2(d)所示;斜眼,如圖2(e)所示;以及瞳孔伸縮,如圖2(f)所示。平均采樣方法是一種基于樣本間比對分?jǐn)?shù)分布的樣本采樣方法,該方法是本領(lǐng)域的通用技術(shù),在此不作贅述。生物特征識別性能指標(biāo)是反應(yīng)生物特征識別整體性能的評價(jià)指標(biāo)。本發(fā)明具體涉及兩種性能指標(biāo)的預(yù)測,包括等錯(cuò)誤率(EER)和可區(qū)分指數(shù)(D-Index)。等錯(cuò)誤率和可區(qū)分指數(shù)被定義如下等錯(cuò)誤率是錯(cuò)誤接受率與錯(cuò)誤拒絕率相等下的系統(tǒng)錯(cuò)誤率??蓞^(qū)分指數(shù)是衡量生物特征識別類內(nèi)比對分?jǐn)?shù)分布與類間比對分?jǐn)?shù)分布重疊程度的指標(biāo),具體定義如下
權(quán)利要求
1.一種基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法,其特征在于,該方法包括以下步驟 步驟Si,采集生物特征樣本,組成訓(xùn)練樣本庫; 步驟S2,對訓(xùn)練樣本庫中的生物特征樣本進(jìn)行預(yù)處理,提取每一生物特征樣本的質(zhì)量參數(shù)向量,并將訓(xùn)練樣本庫中任意兩個(gè)生物特征樣本進(jìn)行配對,得到配對的兩個(gè)生物特征樣本的樣本質(zhì)量參數(shù)向量對; 步驟S3,根據(jù)訓(xùn)練樣本庫中樣本的標(biāo)記信息將所述步驟2中的生物特征樣本間的匹配分為類內(nèi)比對和類間比對; 步驟S4,計(jì)算所述步驟2中配對的生物特征樣本之間的比對分?jǐn)?shù),并基于樣本的標(biāo)記信息將計(jì)算得到比對分?jǐn)?shù)分為類內(nèi)比對分?jǐn)?shù)和類間比對分?jǐn)?shù); 步驟S5,分別對所述步驟S4計(jì)算得到的類內(nèi)比對分?jǐn)?shù)和類間比對分?jǐn)?shù)進(jìn)行平均采樣;步驟S6,基于平均采樣后的樣本的生物特征樣本質(zhì)量參數(shù)向量對以及樣本間的比對分?jǐn)?shù),通過偏最小二乘回歸(PLS-R)方法分別建立生物特征樣本質(zhì)量參數(shù)向量對與生物特征樣本比對分?jǐn)?shù)之間的類內(nèi)模型和類間模型; 步驟S7,與所述步驟S2相似,對被測生物特征識別系統(tǒng)中的所有測試生物特征樣本進(jìn)行預(yù)處理,得到測試生物特征樣本的質(zhì)量參數(shù)向量; 步驟S8,與所述步驟S3相似,根據(jù)樣本的標(biāo)記信息將測試生物特征樣本間的匹配分為類內(nèi)比對和類間比對; 步驟S9,根據(jù)所述步驟S6訓(xùn)練得到的類內(nèi)模型和類間模型分別預(yù)測測試生物特征樣本間的類內(nèi)比對分?jǐn)?shù)和類間比對分?jǐn)?shù),并根據(jù)預(yù)測得到的類內(nèi)比對分?jǐn)?shù)和類間比對分?jǐn)?shù)的分布,計(jì)算代表生物特征識別系統(tǒng)總體性能的性能參數(shù)來測試所述生物特征識別系統(tǒng)預(yù)測的性能。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟S2和S7中的預(yù)處理包括生物特征樣本的定位以及提取有效的生物特征區(qū)域。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述生物特征樣本質(zhì)量參數(shù)是指影響識別性能的樣本自身因素和對樣本質(zhì)量產(chǎn)生影響的外界環(huán)境因素。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述類內(nèi)比對為比對的兩個(gè)生物特征樣本來自于同一個(gè)人的生物特征樣本;所述類間比對為比對的兩個(gè)生物特征樣本來自于不同人的生物特征樣本。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于所述步驟S4中的比對分?jǐn)?shù)根據(jù)下式計(jì)算
6.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述平均采樣為將原始的比對分?jǐn)?shù)劃分為k個(gè)區(qū)間,對應(yīng)每個(gè)區(qū)間取固定數(shù)目的樣本,以使經(jīng)過平均采樣后的比對分?jǐn)?shù)分布呈現(xiàn)平均分布。
7.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述類內(nèi)模型和類間模型的計(jì)算公式如下
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述預(yù)測因子為質(zhì)量參數(shù)向量對,所述預(yù)測因子對應(yīng)的響應(yīng)為比對分?jǐn)?shù)。
9.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述性能參數(shù)包括等錯(cuò)誤率(EER)和可區(qū)分因子(D-Index)以及接收機(jī)操作特性(ROC)曲線。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述等錯(cuò)誤率是錯(cuò)誤接受率與錯(cuò)誤拒絕率相等下的系統(tǒng)錯(cuò)誤率; 所述可區(qū)分指數(shù)是衡量生物特征識別類內(nèi)比對分?jǐn)?shù)分布與類間比對分?jǐn)?shù)分布重疊程度的指標(biāo) 其中,d'代表可區(qū)分指數(shù),“和U2分別代表類內(nèi)比對分?jǐn)?shù)分布與類間比對分?jǐn)?shù)分布的均值,%和O2分別指類內(nèi)比對分?jǐn)?shù)分布與類間比對分?jǐn)?shù)分布的方差; 所述接收機(jī)操作特性曲線是用來衡量系統(tǒng)錯(cuò)誤接受率與正確識別率關(guān)系的曲線。
全文摘要
本發(fā)明公開了一種基于樣本質(zhì)量的生物特征識別系統(tǒng)性能預(yù)測方法,該方法包括步驟提取生物特征樣本質(zhì)量參數(shù),根據(jù)生物特征樣本標(biāo)記信息將樣本間匹配劃分為類內(nèi)匹配和類間匹配,分別對類內(nèi)匹配分?jǐn)?shù)和類間匹配分?jǐn)?shù)進(jìn)行平均采樣,利用偏最小二乘回歸方法建立生物特征樣本質(zhì)量參數(shù)和樣本匹配分?jǐn)?shù)的關(guān)系。本發(fā)明針對生物特征樣本質(zhì)量和樣本匹配分?jǐn)?shù)的關(guān)系,提出了基于偏最小二乘回歸的方法預(yù)測識別系統(tǒng)的性能。本發(fā)明可用于大范圍的生物特征識別系統(tǒng)性能預(yù)測,以及測試實(shí)際生物特征識別算法對特定樣本樣本質(zhì)量的容忍度和魯棒性。
文檔編號G06K9/62GK102831437SQ20121028073
公開日2012年12月19日 申請日期2012年8月8日 優(yōu)先權(quán)日2012年8月8日
發(fā)明者譚鐵牛, 孫哲南, 李星光 申請人:中國科學(xué)院自動(dòng)化研究所