專利名稱:一種基于塊內(nèi)相關(guān)性的二維線性鑒別分析人臉識別方法
技術(shù)領(lǐng)域:
本發(fā)明屬模式識別技術(shù)領(lǐng)域,具體涉及一種基于塊內(nèi)相關(guān)性的二維線性鑒別分析人臉識別方法。
背景技術(shù):
人臉識別屬于模式識別的范疇,作為圖像分析與理解領(lǐng)域中最成功的應(yīng)用之一,人臉識別在商業(yè)應(yīng)用和研究領(lǐng)域都受到了廣泛的重視?,F(xiàn)有的人臉識別方法包括基于統(tǒng)計分析的人臉識別方法和基于模板匹配的人臉識別方法。
一幅具體的人臉圖像可以用一個n×n的矩陣A表示,也可以用一個n×n維的向量I表示。由于數(shù)據(jù)空間維的維數(shù)很高,造成識別時的比對相當(dāng)困難,通常需要使用降維的方法來壓縮數(shù)據(jù)。在基于統(tǒng)計分析的人臉識別方法中,PCA(Principal ComponentAnalysis,主元分析)和FDA(Fisher Linear Discriminant Analysis,F(xiàn)isher線性鑒別分析)就是常用的兩種一維降維識別方法。設(shè)H表示人臉圖像空間,e1,e2,…,eJ為H的一組標(biāo)準(zhǔn)正交向量,span(e1,e2,…,eJ)為這組向量張成的子空間,和φ分別表示兩幅人臉圖像,和φ在span(e1,e2,…,eJ)的投影分別為 和φ′=ΣJ=1J⟨φ,eJ⟩eJ,]]>其中<·,·>表示內(nèi)積。一維降維人臉識別方法用′和φ′之間的比對代替和φ之間的比對,也即使用人臉圖像在標(biāo)準(zhǔn)正交系上的傅立葉系數(shù)代替原始圖像數(shù)據(jù)作為識別特征。通常將e1,e2,…,eJ稱為特征臉,PCA和FDA的區(qū)別在于如何選擇特征臉。
在PCA人臉識別方法中(參考文獻(xiàn)[1]M.Turk and A.Pentland,″Face RecognitionUsing Eigenfaces″,Proc.IEEE Conf.on Computer Vision and Pattern Recognition,1991),將人臉圖像看作一個隨機向量Γ,取用Γ的協(xié)方差矩陣Σ的主元作為降維識別方法的特征臉,協(xié)方差矩陣為Σ=E(Γ-E[Γ])(Γ-E[Γ]T。所謂的“主元”就是對應(yīng)于協(xié)方差矩陣較大特征值并經(jīng)過標(biāo)準(zhǔn)正交化的那些特征向量。
盡管PCA方法在最小協(xié)方差意義下給出了模式樣本的最優(yōu)表示,但這一表示與模式分類并非直接相關(guān)。也就是說,從模式分類的角度,PCA方法所獲得的特征并非是最有效的,而FDA人臉識別方法(參考文獻(xiàn)[2]Peter N.Belhumeur,Joao P.Hespanha,″Eigenface vs.FisherfaceRecognition Using Class Specific Linear Projection,″IEEETransactions on Pattern Analysis and Machine Intelligence,vol.19,no.7,July 1997)則可以獲得樣本的最優(yōu)鑒別特征集,該特征集更利于模式的分類。在FDA人臉識別方法中,用隨機向量Γ1,Γ2,…,ΓM表示M個不同的人的人臉圖像,分別計算類內(nèi)散度矩陣Gw和類間散度矩陣Gb如下Gw=1MΣm=1MΣm,]]>Gb=1MΣm=1M(E[Γm]-E[Γ])(E[Γm]-E[Γ])T,]]>并取用矩陣Gw-1Gb的主元作為降維方法的特征臉,這里,Σm=E(Γm-E[Γm])(Γm-E[Γm])T是每一類的協(xié)方差矩陣。
在FDA方法中,模式樣本在投影后的新空間中有最大的類間離散度和最小的類內(nèi)離散度,即在該空間中有最佳的可分離性。實驗表明,在光照條件變化較大、訓(xùn)練樣本數(shù)較多的情況下,F(xiàn)DA方法要優(yōu)于基于PCA方法(參考文獻(xiàn)[2])。然而,F(xiàn)DA方法仍然有一些缺陷,其一,由于FDA方法中圖像是以向量的形式表示,即使圖像的尺寸較小,轉(zhuǎn)化為向量后的維數(shù)仍會相當(dāng)高,這使得矩陣Gw-1Gb的維數(shù)過大,造成特征臉的計算非常困難;其二,F(xiàn)DA方法中需要計算類內(nèi)散度矩陣Gw的逆,而在實際計算的時候是使用樣本平均來代替統(tǒng)計平均,由于每一類樣本圖像的數(shù)量往往是很少的,在矩陣維數(shù)很高的情況下,Gw的奇異性問題就很突出,這使得FDA方法的應(yīng)用受到很大的局限。
針對FDA方法的上述缺陷,去年(2005年)出現(xiàn)了一種稱為2DFDA的改進(jìn)方法(參考文獻(xiàn)[3]Hui Kong,Eam Khwang Teoh,Jian Gang Wang,Ronda Venkateswarlu,AFramework of 2D Fisher Discriminant AnalysisApplication to Face Recognition with SmallNumber of Training Samples.Computer Vision and Pattern Recognition,2005.CVPR 2005.IEEE Computer Society Conference on.Volume 2,20-25June2005Page(s)1083-1088 vol.2),其基本思想是直接用圖像的二維矩陣進(jìn)行類內(nèi)和類間散度矩陣的計算,并在此基礎(chǔ)上進(jìn)行鑒別分析。2DFDA不但避免了龐大的計算量,而且在絕大多數(shù)情況下解決了小樣本類內(nèi)散度矩陣奇異性的問題。
然而,通過對2DFDA的數(shù)學(xué)分析可以發(fā)現(xiàn),2DFDA僅僅利用圖像矩陣同一行象素之間的相關(guān)性來構(gòu)造類內(nèi)散度矩陣Gw。這樣做有二個缺點首先,2DFDA完全拋棄了行與行之間象素的相關(guān)性信息;其次,同一行內(nèi)相距較遠(yuǎn)的象素,它們的相關(guān)性較弱,對主元的確定幫助不大,徒耗計算資源。在人臉以別中,人臉的識別特征主要表現(xiàn)在局部區(qū)域,如人臉的主要器官眼睛、鼻子、嘴巴等,都屬于人臉的局部特征,但2DFDA方法使用的區(qū)域是圖像的同一行內(nèi)的象素,割裂了人臉局部區(qū)域象素的相關(guān)性,不利于人臉的正確識別的。
為了解決2DFDA方法的缺陷,本發(fā)明提出了一種改進(jìn)的2DFDA人臉識別方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種基于塊內(nèi)相關(guān)性的二維線性鑒別分析人臉識別方法,根據(jù)人臉圖像所具有的局域特征,即人臉圖像一個局部塊通常表示一個完整的語義,如鼻子、眼睛、嘴巴等等,采用將人臉圖像劃分成非重疊小塊,然后將每一個小塊中的元素按行相接產(chǎn)生相應(yīng)的行向量,再把行向量按順序排列成新的二維圖像矩陣的方法,最后將分塊、重排之后的二維圖像矩陣當(dāng)作輸入圖像,進(jìn)行2DFDA人臉識別。這樣的做法,充分利用了人臉局部區(qū)域各個像素之間的相關(guān)性信息,使得估計出圖像的二維協(xié)方差矩陣更為精確,可以達(dá)到更高的人臉識別率。
本發(fā)明方法包含建立一個反映人臉特征的人臉數(shù)據(jù)庫和一個通過計算歐式距離比較相似度的識別算法,步驟分為建庫和識別兩個階段。下面具體介紹這兩個階段1、建庫階段本階段的主要目的是建立一個包含人臉特征的數(shù)據(jù)庫。在識別階段,把待識別人臉圖像的特征與庫中人臉圖像的特征進(jìn)行比對,取相似度最大的人臉圖像作為識別結(jié)果。
(1)本階段使用的人臉圖像是標(biāo)準(zhǔn)的正面人臉圖像,由于人臉圖像的標(biāo)準(zhǔn)化對最終的識別結(jié)果有著直接的影響,所以首先對輸入圖像進(jìn)行標(biāo)準(zhǔn)化處理,該工作分為兩個部分光線歸一化和尺寸歸一化。
光線歸一化將所有輸入圖像的灰度統(tǒng)一到標(biāo)準(zhǔn)水平,然后進(jìn)行直方圖均衡。統(tǒng)一圖像灰度的過程如下首先要選取一張灰度適中的人臉圖像,作為灰度歸一化的標(biāo)準(zhǔn)圖像,計算并記下其灰度平均值W,然后對每一幅輸入圖像進(jìn)行灰度調(diào)整①計算出該幅圖像的灰度平均值w;②計算灰度調(diào)整比例Cw=W/w;③將該幅圖像所有像素的灰度值乘以Cw進(jìn)行調(diào)整。
尺寸歸一化根據(jù)第(2)步中算法的需要(即要保證每個子分塊所包含像素個數(shù)與原圖像一行的像素個數(shù)相同),將所有輸入圖像的尺寸調(diào)整為合適大小。
(2)對經(jīng)過標(biāo)準(zhǔn)化的圖像進(jìn)行分塊、重排的操作,構(gòu)造新的二維圖像矩陣。
任意一幅標(biāo)準(zhǔn)化圖像,都可以用一個m×n的二維矩陣來表示,矩陣元素表示像素的灰度值,將圖像矩陣記為A,即 將矩陣A劃分為p×q個大小相同的子矩陣,即 其中,每個分塊Akl(k=1,2,…,p;l=1,2,…,q)是m′×n′維的矩陣,即有p×m′=m,q×n′=n,并要求每個分塊的大小m′×n′=n(需要第(1)步中尺寸歸一化的配合)。
于是,每一幅圖像就被分為p×q=m個分塊,按順序記為Di,即 對每一分塊進(jìn)行逐行掃描,得到每一分塊對應(yīng)的行向量表示Vi 這里i=1,2,…,m,再將這些行向量按順序重排,構(gòu)造出新的二維圖像矩陣A′如下A′=V1V2...Vm]]>
新的二維圖像矩陣A′由m個n維(m′×n′=n)的行向量組成,尺寸與原圖像一樣,也是m×n維的,但新矩陣中每一個行向量選取的是原圖像處于同一局部塊內(nèi)的像素。
對所有的輸入圖像都進(jìn)行上面的圖像分塊、重排操作,得到對應(yīng)的二維圖像矩陣庫。
(3)計算最優(yōu)投影方向假設(shè)總共有C類訓(xùn)練樣本,每類樣本有Ni幅圖像,i=1,2,…,C,則訓(xùn)練樣本總數(shù)為N=Σi=1CNi.]]>進(jìn)行圖像分塊、重排的操作之后,第i類第j個樣本Aij對應(yīng)于m×n維的二維矩陣Ai′j,根據(jù)這些二維圖像矩陣可以計算出類內(nèi)和類間散度矩陣,計算公式如下類內(nèi)散度矩陣Gw=1NΣi=1CΣi=1Ni(Ai′j-Ai′‾)T(Ai′j-Ai′‾)]]>類間散度矩陣Gb=1NΣi=1CNi(Ai′‾-A′‾)T(Ai′‾-A′‾)]]>其中, 為所有訓(xùn)練樣本的均值, 為第i類的Ni幅訓(xùn)練樣本的均值。由定義可知,Gw和Gb都是n×n維的非負(fù)定矩陣,而且通常情況下Gw是可逆的。
由Fisher鑒別準(zhǔn)則J(X)=tr(PGb)tr(PGw)=|XTGbX||XTGwX|]]>尋找最優(yōu)投影矩陣X使J(X)最大化,可通過選取Gw-1Gb最大的前d個特征值所對應(yīng)的正交特征向量組X1,X2,…,Xd,利用這組最優(yōu)投影方向構(gòu)成Fisher最優(yōu)投影矩陣X=[X1,X2,…,Xd],X是一個n×d維的矩陣。
2DFDA的目標(biāo),就是要尋找Fisher最優(yōu)投影方向X,最大化投影后樣本的類間離散度,同時最小化樣本的類內(nèi)離散度。其物理意義是模式樣本在這些最優(yōu)投影方向上投影后,同一類的模式樣本相互集中,不同類的模式樣本相互分離。
(4)提取輸入圖像的特征矩陣建立數(shù)據(jù)庫給定的訓(xùn)練樣本Aij經(jīng)過分塊、重排后對應(yīng)于二維矩陣Ai′j,將其投影到Fisher投影矩陣X=[X1,X2,…,Xd]上,即
Yk=Ai′jXk,]]>k=1,2,…,d則可獲得一組投影特征向量Y1,Y2,…,Yd,它們構(gòu)成了訓(xùn)練樣本Aij的Fisher特征矩陣Bij=[Y1,Y2,···,Yd]=Ai′j(X1,X2,···,Xd)=Ai′jX,]]>Bij的大小為m×d(d<<n)。
將每一幅訓(xùn)練樣本Aij的Fisher特征矩陣Bij都保存在數(shù)據(jù)庫中,待識別階段使用。在上述步驟中,第(2)步是最重要的,體現(xiàn)了本發(fā)明的核心內(nèi)容。
2、識別階段對一幅待識別人臉圖像T,進(jìn)行與建庫階段第(1)、(2)步相同的圖像標(biāo)準(zhǔn)化與圖像分塊、重排操作之后,得到經(jīng)過重排的二維矩陣T′,將T′向最優(yōu)投影方向投影,得到圖像T的Fisher特征矩陣 計算Fisher特征矩陣BT與人臉庫中的每一個Fisher特征矩陣Bij(i=1,2,…C,j=1,2,…Ni)之間的歐氏距離d(BT,Bij)。歐氏距離的定義如下對任意兩幅圖像Ai和Aj,對分別對應(yīng)于Fisher特征矩陣 和 則有d(Bi,Bj)=Σk=1d||Yk(i)-Yk(j)||2]]>其中,||Yk(i)-Yk(j)||示兩個Fisher特征向量Yk(i)和Yk(j)之間的歐式距離。
判別待識別人臉圖像T所屬分類的過程如下對人臉庫中所有圖像A1,A2,…,AN(N為訓(xùn)練圖像總數(shù)),每一幅圖像都屬于某個確定的類別ωk(k=1,2,…,C),它們的特征矩陣分為B1,B2,…,BN。對于一幅給定的待識別人臉圖像T,其對應(yīng)的Fisher特征矩陣為BT,若有d(BT,Bl)=mindjd(BT,Bj)]]>(j=1,2,…,N),且Bl∈ωk,則分類的結(jié)果是B∈ωk。
本發(fā)明優(yōu)點二維線性判別分析(2DFDA)人臉識別方法是去年(2005年)提出的線性判別分析(FDA)人臉識別方法的一種改進(jìn)方法。時間雖短,但因其性能優(yōu)良為業(yè)界廣泛接受和肯定。但是,2DFDA方法在計算人臉特征向量時僅僅利用人臉圖像同一行象素之間的相關(guān)性,沒有考慮人臉圖像不同行象素之間的相關(guān)性。在人臉識別中,人臉的局部特征(鼻子、眼睛、嘴巴、下巴、額頭等等)起著舉足輕重的作用,因此,人臉識別方法應(yīng)該充分利用人臉圖像局部區(qū)域內(nèi)各個象素之間的相關(guān)性。本發(fā)明提出的方法是2DFDA的改進(jìn)算法。本發(fā)明先把人臉圖像分塊,然后把圖像塊內(nèi)的象素按照一定順序轉(zhuǎn)化為新圖像的行元素,最后對新圖像進(jìn)行2DFDA建庫和識別。本發(fā)明在保持2DFDA優(yōu)點的同時,以一種簡單實用的方式彌補了2DFDA的缺點。
圖1、基于塊內(nèi)相關(guān)性的人臉識別方法建庫階段的算法流程2、基于塊內(nèi)相關(guān)性的人臉識別方法識別階段的算法流程3、人臉圖像分塊、重排的操作示意圖。其中,圖(a)表示對原圖像進(jìn)行分塊,每一個小方塊代表一個分塊矩陣;圖(b)表示原圖像中的一個分塊矩陣,每一個小方塊代表一個像素;圖(c)表示將分塊矩陣逐行掃描排列成的行向量,每一個小方塊代表一個像素;圖(d)表示將所有行向量按順序重排產(chǎn)生的新的二維圖像矩陣,每一行表示一個行向量。
圖4、實施案例的結(jié)果人臉識別率比較(FERET數(shù)據(jù)集)圖5、實施案例的結(jié)果最佳人臉識別率比較(FERET數(shù)據(jù)集)圖6、實施案例的結(jié)果相同識別率下Fisher特征向量數(shù)目比較(FERET數(shù)據(jù)集)具體實施方式
下面以FERET人臉庫為例,說明本方法的實施過程。
選擇FERET庫中的60人,每人6幅圖像,共360幅圖像組成訓(xùn)練和測試人臉庫,包括了在不同表情、光線、遮擋等情況下的人臉,圖像尺寸為112×92。
隨機選取庫中3幅圖像/人用于訓(xùn)練,余下的3幅圖像/人用于測試。隨機抽取實驗重復(fù)30次,取識別率的平均值作為最終識別率。具體實施流程如下1、建庫階段(1)圖像標(biāo)準(zhǔn)化對圖像進(jìn)行預(yù)處理,包括光線歸一化和尺寸歸一化。經(jīng)過預(yù)處理之后,所有圖像的灰度統(tǒng)一到標(biāo)準(zhǔn)水平,且灰度層次比較分明(因為經(jīng)過了直方圖均衡化)。預(yù)處理后的圖像尺寸變?yōu)?6×80。
(2)圖像的分塊、重排分塊每個塊的大小為8×10,一共包含80個像素,和標(biāo)準(zhǔn)化后圖像一行的像素個數(shù)相同。每一幅圖像被分為96塊,塊數(shù)與標(biāo)準(zhǔn)化后圖像的行數(shù)相同。
重排按行掃描每個分塊得到對應(yīng)的行向量,將一幅圖像的96個行向量按順序排列得到一個96×80的矩陣,即重排之后的二維圖像矩陣。
(3)計算最優(yōu)投影向量組為了找出最合適的主元數(shù)目,本案例中對最優(yōu)投影向量組中向量(即主元)個數(shù)為1~10的情況都做實驗,即得到10種不同的最優(yōu)投影向量組。
(4)提取圖像的特征矩陣建立數(shù)據(jù)庫將分塊、重排后的二維圖像矩陣向最優(yōu)投影向量組投影,由于所取主元數(shù)目共20種情況,因此需要重復(fù)本步驟,每次實驗的過程類似,但由于最優(yōu)投影向量組不相同,所以得到的特征矩陣庫也不相同,最終產(chǎn)生10組特征矩陣庫。
2、識別階段對每一幅測試圖像,依次進(jìn)行圖像標(biāo)準(zhǔn)化,圖像的分塊、重排,提取特征矩陣三個步驟,由于主元數(shù)目的不同,會產(chǎn)生10組特征矩陣。然后計算特征矩陣與對應(yīng)的特征矩陣庫中每一個特征矩陣的距離,判別距離最近的為匹配人臉,這里所說的對應(yīng)關(guān)系是指產(chǎn)生本步驟中特征矩陣與產(chǎn)生特征矩陣庫所使用的主元數(shù)目是相同的。
統(tǒng)計匹配正確和錯誤的人臉圖像數(shù)目,計算不同主元數(shù)目下的人臉識別率,然后重復(fù)進(jìn)行隨機實驗,取30次實驗的人臉識別率平均值作為最終識別率。
主元構(gòu)成圖像空間的子空間,隨著主元數(shù)目的增加,主元構(gòu)成的子空間會向相鄰圖像空間擴張,各種降維識別方法(包括2DFDA方法)的識別效果也將逐漸趨同,因此,各種降維識別方法的識別性能,主要是指在低維子空間上獲得高的判別率。由本案例的實驗結(jié)果可以看出,在主元數(shù)目較少的時候,人臉識別率隨著主元數(shù)目的增加迅速上升,在主元數(shù)目為10的時候得到了最優(yōu)識別結(jié)果。
圖4顯示了利用了塊內(nèi)相關(guān)性的算法和沒有利用塊內(nèi)相關(guān)性的算法的在人臉識別率上的差別,上面那條曲線是利用了塊內(nèi)相關(guān)性的算法所得到的結(jié)果,在主元數(shù)目較少的情況下,明顯優(yōu)于沒有利用塊內(nèi)相關(guān)性的算法。實驗條件與前述相同,使用FERET人臉庫中的部分圖像,取60×3幅為訓(xùn)練樣本,60×3幅為測試樣本。
圖5顯示了不同訓(xùn)練樣本數(shù)目的情況下,利用了塊內(nèi)相關(guān)性的算法和沒有利用塊內(nèi)相關(guān)性的算法的最佳人臉識別率的差別,上面那條曲線是利用了塊內(nèi)相關(guān)性的算法所得到的結(jié)果。實驗條件是取訓(xùn)練k個訓(xùn)練樣本數(shù)/類(2≤k≤4),即60×k幅作為訓(xùn)練樣本,60×(6-k)幅為測試樣本。
圖6顯示了在相同識別率的情況下,利用了塊內(nèi)相關(guān)性的算法和沒有利用塊內(nèi)相關(guān)性的算法的對應(yīng)的Fisher特征向量數(shù)目的比較。實驗條件是取訓(xùn)練k個訓(xùn)練樣本數(shù)/類(2≤k≤4),即60×k幅作為訓(xùn)練樣本,60×(6-k)幅為測試樣本。
權(quán)利要求
1.一種基于塊內(nèi)相關(guān)性的人臉識別方法,其特征在于一個將人臉圖像分塊重排的算法、一個基于二維線性鑒別分析(簡稱2DFDA)的最優(yōu)投影方向計算方法和一個通過計算歐式距離比較相似度的識別算法。具體步驟分建庫和識別兩個階段(1)建庫階段①對訓(xùn)練樣本圖像進(jìn)行標(biāo)準(zhǔn)化,包括光線歸一化和尺寸歸一化;②對經(jīng)過標(biāo)準(zhǔn)化的訓(xùn)練樣本圖像進(jìn)行分塊、重排的操作,構(gòu)造新的二維圖像矩陣;③將上一步驟得到的二維圖像矩陣作為輸入圖像,選擇一定的特征值數(shù)目,使用2DFDA方法計算出Fisher最優(yōu)投影向量組X1,X2,…,Xd;④將新構(gòu)造出的二維圖像矩陣向Fisher最優(yōu)投影方向上投影,抽取出反映人臉特征的數(shù)據(jù),即Fisher特征矩陣,并將其全部保存在數(shù)據(jù)庫中,待識別階段使用。(2)識別階段①對測試圖像進(jìn)行標(biāo)準(zhǔn)化,包括光線歸一化和尺寸歸一化;②對經(jīng)過標(biāo)準(zhǔn)化的測試圖像進(jìn)行分塊、重排的操作,構(gòu)造新的二維圖像矩陣;③將新構(gòu)造出的二維圖像矩陣向最優(yōu)投影方向上投影,獲得相應(yīng)的Fisher特征矩陣;④計算測試圖像的特征矩陣與數(shù)據(jù)庫中各特征矩陣之間的歐式距離,將距離最近的特征矩陣對應(yīng)的人臉圖像判別為匹配圖像,匹配圖像對應(yīng)的分類即為識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的人臉識別方法,其特征在于所述的將人臉圖像分塊重排的算法如下任意一幅標(biāo)準(zhǔn)化圖像,都可以用一個m×n的二維矩陣來表示,矩陣元素表示像素的灰度值,將圖像矩陣記為A,即 將矩陣車A劃分為p×q個大小相同的子矩陣,即 其中,每個分塊Ak1(=1,2,…,p;l=1,2,…,q)是m′×n′維的矩陣,即有p×m′=m,q×n′=n,并要求每個分塊的大小m′×n′=n。于是,每一幅圖像就被分為,p×q=m個分塊,按順序記為Di(i=1,2,…m),即 對每一分塊進(jìn)行逐行掃描,得到每一分塊對應(yīng)的行向量表示V1(i=1,2,…m)Vi=[d11id12i···d1n'id21id22i···d2n'i···dm'1idm'2i···dm'n'i]]]>再將這些行向量按順序重排,構(gòu)造出新的二維圖像矩陣A′如下A'=V1V2...Vm]]>新的二維圖像矩陣A′由m個n維(m′×n′=n)的行向量組成,尺寸與原圖像一樣,也是m×n維的,但新矩陣中每一個行向量選取的是原圖像處于同一局部塊內(nèi)的像素。
3.根據(jù)權(quán)利要求1所述的人臉識別方法,其特征在于所述的基于二維線性鑒別分析(簡稱2DFDA)的最優(yōu)投影方向計算方法如下假設(shè)總共有C類訓(xùn)練樣本,每類樣本有Ni(i=1,2,…C)幅圖像,則訓(xùn)練樣本總數(shù)為N=Σi=1CNi]]>。進(jìn)行圖像分塊、重排的操作之后,第i類第j個樣本Aij對應(yīng)于m×n維的二維矩陣Ai′j,根據(jù)這些二維圖像矩陣可以計算出類內(nèi)和類間散度矩陣,計算公式如下類內(nèi)散度矩陣Gw=1NΣi=1CΣj=1Ni(Ai′j-Ai′‾)T(Ai′j-Ai′‾)]]>類間散度矩陣Gb=1NΣi=1CNi(Ai'‾-A'‾)T(Ai'‾-A'‾)]]>其中, 為所有訓(xùn)練樣本的均值, 為第i類的Ni幅訓(xùn)練樣本的均值。由定義可知,Gw和Gb都是n×n維的非負(fù)定矩陣,而且通常情況下Gw是可逆的。由Fisher鑒別準(zhǔn)則J(X)=tr(PGb)tr(PGw)=|XTGbX||XTGwX|]]>尋找最優(yōu)投影矩陣X使J(X)最大化,可通過選取Gw-1Gb最大的前d個特征值所對應(yīng)的正交特征向量組X1,X2,…,Xd,利用這組最優(yōu)投影方向構(gòu)成Fisher最優(yōu)投影矩陣X=[X1,X2,…,Xd],X是一個n×d維的矩陣。
4.根據(jù)權(quán)利要求1所述的人臉識別方法,其特征在于所述的通過計算歐式距離比較相似度的識別算法如下對任意兩幅圖像Ai和Aj,對分別對應(yīng)于Fisher特征矩陣 和Bj=[Y1(j),Y2(j),···,Yd(j)],]]>則有d(Bi,Bj)=Σk=1d||Yk(i)-Yk(j)||2]]>其中,‖Yk(i)-Yk(j)‖2示兩個Fisher特征向量Yk(i)和Yk(j)之間的歐式距離。對人臉庫中所有圖像A1,A2,…,AN(N為訓(xùn)練圖像總數(shù)),每一幅圖像都屬于某個確定的類別ωk(k=1,2,…,C),它們的特征矩陣分為B1,B2,…,BN。對于一幅給定的待識別人臉圖像T,其對應(yīng)的Fisher特征矩陣為BT,若有d(BT,Bl)=mindj(BT,Bj)]]>(j=1,2,…,N),且Bl∈ωk,則分類的結(jié)果是B∈ωk。
全文摘要
本發(fā)明屬模式識別技術(shù)領(lǐng)域,具體涉及一種基于塊內(nèi)相關(guān)性的二維線性鑒別分析(簡稱2DFDA)人臉識別方法。本方法根據(jù)人臉圖像所具有的局域特征,將人臉圖像劃分成非重疊小塊,然后將每一個小塊中的元素按行相接產(chǎn)生相應(yīng)的行向量,再把行向量按順序排列成新的二維圖像矩陣,最后將分塊、重排之后的二維圖像矩陣當(dāng)作輸入圖像,進(jìn)行2DFDA人臉識別。本方法的優(yōu)點在于充分利用了局部區(qū)域里行與列像素之間的相關(guān)性信息,能夠較好地保留人臉的局域特征信息,可以達(dá)到較高的人臉識別率,而且計算復(fù)雜度較低。
文檔編號G06K9/00GK101021897SQ20061013234
公開日2007年8月22日 申請日期2006年12月27日 優(yōu)先權(quán)日2006年12月27日
發(fā)明者馬爭鳴, 胡海峰, 李瑩, 張成言 申請人:中山大學(xué)