專利名稱:提取用作面貌識別和重現(xiàn)的特征向量的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種面貌識別和重現(xiàn)系統(tǒng),并尤其涉及一種用于提取用作面貌搜索和識別的特征向量的方法和裝置,本發(fā)明能通過分別產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的傅立葉特征向量和強度特征向量,然后合并此傅立葉特征向量和強度特征向量,而克服在頻域和空間域產(chǎn)生特征向量的局限性。
背景技術(shù):
在我們所生活的“信息社會”中,個人信息或特定組信息被認(rèn)為比其他財產(chǎn)更具有價值。為了保護此有價值信息不被第三人獲得,開發(fā)多種能夠有效識別企圖訪問該信息的人的身份的技術(shù),是及其重要的。在現(xiàn)有可用的鑒定技術(shù)中,由于面貌識別在用于識別他人的身份的同時,能夠不被其發(fā)現(xiàn)他/她的身份正被檢查,而且在鑒定過程中,無需被識別人以特定方式移動或行動,就能鑒定識別個人身份,因此面貌識別已被認(rèn)為是最方便且最有效的鑒定方法。
盡管對諸如信用卡、借記卡或電子ID之類的必需鑒定處理的終端用戶產(chǎn)品的社會需求越來越大,但目前只有包括基于密碼的鑒定技術(shù)的少數(shù)鑒定技術(shù)被證實有效。由于缺乏相對于基于密碼的鑒定技術(shù)的可替換的鑒定技術(shù),因而,產(chǎn)生了許多諸如利用計算機進行身份盜用犯罪之類的社會問題。由于面貌識別被認(rèn)為可以解決這些問題,因而引起了公眾的廣泛關(guān)注。另外,面貌識別極有可能被應(yīng)用到許多不同領(lǐng)域,例如終端訪問控制、公共場所控制、電子相冊以及犯罪者面貌識別。
同時,還存在多種不同類型的面貌識別技術(shù)。其中之一為基于主分量分析(PCA)的面貌識別技術(shù)。PCA是一種通過最小化數(shù)據(jù)損耗時將圖像數(shù)據(jù)投影到低維向量空間來壓縮數(shù)據(jù)的方法?;赑CA的面貌識別技術(shù),能通過從面貌圖像中提取主要特征向量,并根據(jù)所提取的主要特征向量將面貌圖像分入預(yù)定種類,從而識別面貌圖像。然而,該技術(shù)會產(chǎn)生諸如低識別速度和低可靠性的問題。盡管該技術(shù)不考慮面貌圖像亮度的變化而達到某種可靠程度,但無法對不同面貌表情和姿態(tài)提供可靠且令人滿意的面貌識別結(jié)果。
為克服基于PCA面貌識別技術(shù)的局限性,2002年10月奧地利克拉根福的Toshio Kamei等的“Report of the core experiments on Fourier spectral PCLDAbased face descriptor”“(基于面貌描述符的傅立葉頻譜PCLDA的核心實驗報告)”,ISO-IEC-JTC1-SC29WG11,M8559,中已公開了通過在頻域采用主分量線性判別分析(PCLDA)而從面貌圖像提取特征向量的方法,以及2002年9月,Tae-kyun Kim的“Component-based LDA Face Descriptor for ImageRetrieval”(用于圖像重現(xiàn)的基于分量的LDA面貌描述符),British MachineVision Conference 2002中,公開了一種采用LDA在空間域提取分量方向(component-wise)特征向量的方法。然而,以上兩種方法僅分別采用了頻域特征向量或空間域特征向量,因此它們在面貌識別和重現(xiàn)的精度方面存在各自的局限性。
發(fā)明內(nèi)容
本發(fā)明提供了一種提取用于面貌識別和重現(xiàn)的特征向量的方法,該方法通過分別產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的傅立葉特征向量和強度特征向量,然后合并此傅立葉特征向量和強度特征向量,而克服在頻域和空間域產(chǎn)生特征向量的局限性。
本發(fā)明還提供了一種提取用于面貌識別和重現(xiàn)的特征向量的裝置,所述裝置使用提取用于面貌識別和重現(xiàn)的特征向量的方法。
依據(jù)本發(fā)明的一方面,提供一種提取用于面貌識別和重現(xiàn)的特征向量的方法。利用第一和第二標(biāo)準(zhǔn)化向量,產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域的整體傅立葉特征向量,利用第三和第四標(biāo)準(zhǔn)化向量,產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的中心面貌區(qū)域的中心傅立葉特征向量。對于整體面貌區(qū)域產(chǎn)生整體強度特征向量,對于預(yù)定數(shù)量的面貌分量方向區(qū)域而產(chǎn)生局部強度特征向量。通過耦合第一和第二標(biāo)準(zhǔn)化向量以及整體強度特征,而產(chǎn)生整體合成特征向量,并通過耦合第三和第四標(biāo)準(zhǔn)化向量以及局部強度特征向量,而產(chǎn)生中心合成特征向量。
依據(jù)本發(fā)明的另一方面,提供了一種提取用于面貌識別和重現(xiàn)的特征向量的裝置,所述裝置包括第一單元和第二單元。所述第一單元利用第一和第二標(biāo)準(zhǔn)化向量,而產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域的整體傅立葉特征向量,并利用第三和第四標(biāo)準(zhǔn)化向量,而產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的中心面貌區(qū)域的中心傅立葉特征向量。所述第二單元產(chǎn)生用于整體面貌圖像的整體強度特征向量,和用于預(yù)定數(shù)量面貌分量方向區(qū)域的局部強度特征向量,并通過耦合第一和第二標(biāo)準(zhǔn)化向量以及所述整體強度特征向量,而產(chǎn)生整體合成特征向量,通過耦合第三和第四標(biāo)準(zhǔn)化向量以及所述局部強度特征向量,產(chǎn)生中心合成特征向量。
依據(jù)本發(fā)明的另一方面,提供了一種計算機可讀記錄介質(zhì),其上記錄能實現(xiàn)提取用于面貌識別和重現(xiàn)的特征向量的方法的程序
通過以下參照附圖對優(yōu)選實施例的詳細(xì)描述,本發(fā)明的以上及其他特點和優(yōu)點將更為明顯,其中圖1是根據(jù)本發(fā)明一個優(yōu)選實施例的用于提取用作面貌識別和重現(xiàn)的特征向量的裝置的方框圖;圖2是圖1中所示傅立葉特征產(chǎn)生器的詳細(xì)方框圖;圖3A和3B是圖2中所示的分塊面貌區(qū)域的詳細(xì)方框圖;圖4是圖1中所示的整體傅立葉特征向量產(chǎn)生器的詳細(xì)方框圖;圖5是圖1中所示的中心傅立葉特征向量產(chǎn)生器的詳細(xì)方框圖;圖6是圖1中所示的強度特征產(chǎn)生器的詳細(xì)方框圖;圖7是圖6中所示的姿態(tài)估計/補償單元的詳細(xì)方框圖;圖8是圖1中所示的整體合成特征向量產(chǎn)生器的詳細(xì)方框圖;圖9是圖1中所示的中心合成特征向量產(chǎn)生器的詳細(xì)方框圖;和圖10是示出了圖1中所示的傅立葉特征產(chǎn)生器所采用的光柵掃描的示意圖。
具體實施例方式
以下,將參照附圖對本發(fā)明優(yōu)選實施例進行詳細(xì)描述。
圖1是依據(jù)本發(fā)明一個優(yōu)選實施例的用于提取用作面貌識別和重現(xiàn)的特征向量的裝置的方框圖。參考圖1,該裝置包括頻率特征向量產(chǎn)生單元120和合成特征向量產(chǎn)生單元130。所述頻率特征向量產(chǎn)生單元120包括傅立葉特征產(chǎn)生單元121、整體傅立葉特征向量產(chǎn)生單元123、和中心傅立葉特征向量產(chǎn)生單元125,并且所述合成特征向量產(chǎn)生單元130包括傅立葉特征產(chǎn)生單元121、強度特征產(chǎn)生單元131、整體合成特征向量產(chǎn)生單元133、和中心合成特征向量產(chǎn)生單元135。
如圖1所示,通過將一原始面貌圖像按比例轉(zhuǎn)換,例如56行,每行包括例如46像素,從而獲得一標(biāo)準(zhǔn)化面貌圖像110。原始面貌圖像的右眼中心位于標(biāo)準(zhǔn)化面貌圖像110的第24列第16行,而左眼中心位于標(biāo)準(zhǔn)化面貌圖像110的第24列第31行。
在頻率特征向量產(chǎn)生單元120中,所述傅立葉特征產(chǎn)生單元121對于所述標(biāo)準(zhǔn)化面貌圖像110,即一整體面貌區(qū)域和一中心面貌區(qū)域,進行傅立葉變換,從而獲得整體面貌區(qū)域和中心面貌區(qū)域的傅立葉頻譜和傅立葉振幅,所述傅立葉特征產(chǎn)生單元121還利用整體面貌區(qū)域的傅立葉頻譜和傅立葉振幅,定義第一和第二特征向量,以及利用中心面貌區(qū)域的傅立葉頻譜和傅立葉振幅,定義第三和第四特征向量。第一至第四特征向量被投影到主分量線性判別分析(PCLDA)子空間,然后標(biāo)準(zhǔn)化為單元向量。第一和第二標(biāo)準(zhǔn)化向量是用于整體面貌區(qū)域的特征向量,而第三和第四標(biāo)準(zhǔn)化向量是用于中心面貌區(qū)域的特征向量。此處,通過對構(gòu)成標(biāo)準(zhǔn)化面貌圖像110的像素間的空間關(guān)系編碼,而獲得傅立葉特征向量。
所述整體傅立葉特征向量產(chǎn)生單元123,將傅立葉特征產(chǎn)生單元121所提供的第一和第二標(biāo)準(zhǔn)化向量結(jié)合為一個單個結(jié)合向量,將該結(jié)合向量投影到由預(yù)定基礎(chǔ)矩陣所定義的判別空間中,以預(yù)定方式量化所投影向量的每個分量,并將已量化向量存儲為整體傅立葉特征向量。
所述中心傅立葉特征向量產(chǎn)生單元125,將傅立葉特征產(chǎn)生單元121所提供的第三和第四標(biāo)準(zhǔn)化向量結(jié)合為一個單個結(jié)合向量,將該結(jié)合向量投影到由預(yù)定基礎(chǔ)矩陣所定義的判別空間中,以預(yù)定方式量化所投影向量的每個分量,并將已量化向量存儲為中心傅立葉特征向量。
在合成特征向量產(chǎn)生單元130中,所述強度特征產(chǎn)生單元131執(zhí)行標(biāo)準(zhǔn)化面貌圖像110的姿態(tài)估計和補償,將所述姿態(tài)補償面貌圖像各部分中的整體面貌區(qū)域和標(biāo)準(zhǔn)化面貌圖像110的預(yù)定數(shù)量分量,例如標(biāo)準(zhǔn)化面貌圖像110的5個分量,投影到所述PCLDA子空間,并將投影結(jié)果標(biāo)準(zhǔn)化為第五和第六單元向量。用于整體面貌區(qū)域的整體強度特征向量是第五特征向量,所述第五特征向量已被標(biāo)準(zhǔn)化為第五單元向量,且用于標(biāo)準(zhǔn)化面貌圖像110的各部分的局部強度特征向量為第六至第十特征向量,所述第六至第十特征向量的每一個均被標(biāo)準(zhǔn)化為第六單元向量。此處,通過編碼構(gòu)成整體面貌區(qū)域的像素與標(biāo)準(zhǔn)化面貌圖像110的五個分量的強度變化,而獲得所述強度特征向量。
所述整體合成特征向量產(chǎn)生單元133,將傅立葉特征產(chǎn)生單元121提供的第一和第二標(biāo)準(zhǔn)化向量,以及強度特征產(chǎn)生單元131提供的整體強度特征向量,結(jié)合為一個單個結(jié)合向量,將該結(jié)合向量投影到由預(yù)定基礎(chǔ)矩陣所定義的判別空間中,以預(yù)定方式量化所投影向量的每個分量,并將已量化向量存儲為整體合成特征向量。
所述中心合成特征向量產(chǎn)生單元135將傅立葉特征產(chǎn)生單元121提供的第三和第四標(biāo)準(zhǔn)化向量,以及強度特征產(chǎn)生單元131提供的局部強度特征向量,結(jié)合為一個單個結(jié)合向量,將該結(jié)合向量投影到由預(yù)定基礎(chǔ)矩陣所定義的判別空間中,以預(yù)定方式量化所投影向量的每個分量,并將已量化向量存儲為中心合成特征向量。
圖2是圖2中的傅立葉特征產(chǎn)生單元121的詳細(xì)方框圖。參考圖2,所述傅立葉特征產(chǎn)生單元121包括第一圖像分割單元210、整體傅立葉特征向量產(chǎn)生器220、和中心傅立葉特征向量產(chǎn)生器230。整體傅立葉特征向量產(chǎn)生器220包括第一和第二傅立葉變換器222和225、第一和第二PCLDA投影器223和226、以及第一向量標(biāo)準(zhǔn)化器227。中心傅立葉特征向量產(chǎn)生器230包括第三傅立葉變換器231、第三和第四PCLDA投影器233和234、以及第二向量標(biāo)準(zhǔn)化器235。
如圖2所示,第一圖像分割單元210將該標(biāo)準(zhǔn)化面貌圖像110分為一整體面貌區(qū)域221、一分塊面貌區(qū)域224、和一中心面貌區(qū)域231。
整體傅立葉特征向量產(chǎn)生器220獲得整體面貌區(qū)域221的傅立葉頻譜和分塊面貌區(qū)域224的傅立葉振幅,并然后利用該傅立葉頻譜和傅立葉振幅,產(chǎn)生整體傅立葉特征向量,以下將詳述此處理。
第一傅立葉變換器222執(zhí)行整體面貌區(qū)域221的傅立葉變換,從而將整體面貌區(qū)域221轉(zhuǎn)換為頻域分量。假設(shè)用f(x,y)表示整體面貌區(qū)域221,則可采用以下等式表示傅立葉頻譜F(u,v)。
F(u,v)=Σx=0M-1Σy=0N-1f(x,y)exp(-2πi(xuM+yvN))---(1)]]>
在等式(1)中,M=46,N=56,u=0,1,2,...,而且v=0,1,2,...,55。F(0,0)表示一DC分量。傅立葉頻譜F(u,v)用于獲得第一特征向量x1f,由通過光柵掃描傅立葉頻譜F(u,v)獲得的實數(shù)部分Re[F(u,v)]和虛數(shù)部分Im[F(u,v)]來定義該第一特征向量的元素(elements)。具體說,對如下表1所定義的掃描區(qū)域A和B中除高頻分量(u=12,13,...,34)之外的所有分量執(zhí)行光柵掃描。表1表示用于從傅立葉域提取特征向量的光柵掃描參數(shù)。
表1
在表1中,SA和SB分別表示掃描區(qū)域A和B的起點,而EA和EB分別表示掃描區(qū)域A和B的終點。掃描區(qū)域A和B以及光柵掃描的例子如圖10所示。如圖10所示,通過沿‘u’方向執(zhí)行光柵掃描,以從掃描區(qū)域A和B提取傅立葉分量。
由如下等式(2)表示作為光柵掃描結(jié)果所獲得的第一特征向量x1f。此處,第一特征向量x1f為644維。
x1f=Re[F(0,0)]Re[F(1,0)]···Rc[F(M-1,N4-1)]Im[F(0,0)]Im[F(1,0)]···Im[F(M-1,N4-1)]---(2)]]>
第一PCLDA投影器223將第一傅立葉變換器222所獲得的第一特征向量x1f投影到通過對第一特征向量x1f執(zhí)行PCLDA所獲得的判別空間。采用預(yù)定公知算法獲得的且本領(lǐng)域普通技術(shù)人員公知的第一基本矩陣Ψ1f對所述判別空間進行定義。
第二傅立葉變換器225,通過對分塊面貌區(qū)域224執(zhí)行傅立葉變換,而將分塊面貌區(qū)域224轉(zhuǎn)換為頻域。如圖3A所示的分塊面貌區(qū)域224,包括三個子空間,即整體區(qū)域311、四塊區(qū)域312和十六塊區(qū)域313。對分塊面貌區(qū)域224的每個子空間執(zhí)行傅立葉變換。此處,由f10(x,y)表示的整體區(qū)域311是通過除去標(biāo)準(zhǔn)化面貌圖像110的邊界行,并將結(jié)果面貌圖像剪切成44×56圖像獲得的。f10(x,y)可用以下等式(3)表示。
f10(x,y)=f(x+1,y)---(3)]]>在等式(3)中,x=0,1,2,...,43,且y=0,1,2,...,55。
用fk1(x,y)表示的四塊區(qū)域312和用fk2(x,y)表示的十六塊區(qū)域313是利用整體區(qū)域311獲得的。具體說,四塊區(qū)域312是通過將整體區(qū)域311分成大小均為22×28的四塊而獲得的。fk1(x,y)可用以下等式(4)表示。
fk1(x,y)=f10(x+22sk1,28tk1)---(4)]]>在等式(4)中,k=1,2,3,4,x=0,1,2,...,21,y=0,1,2,...,27,sk1=(k-1)mod2,且tk1=round(k-12).]]>用fk2(x,y)表示的十六塊區(qū)域313是通過將整體區(qū)域311分成大小均為11×14的16個塊而獲得的。fk2(x,y)可用以下等式(5)表示。
fk2(x,y)=f10(x+11sk2,y+14tk2)---(5)]]>在等式(5)中,k=1,2,3,...,16,x=0,1,2,...,10,y=0,1,2,...,13,sk2=(k-1)mod4,]]>且tk2=round(k-14).]]>通過第二傅立葉變換器225在整體區(qū)域311、四塊區(qū)域312和十六塊區(qū)域311上執(zhí)行傅立葉變換,可獲得傅立葉頻譜Fkj(u,v)和傅立葉振幅|Fkj(u,v)|,所獲得的結(jié)果可分別用以下等式(6)和(7)表示Fkj(u,v)=Σx=0Mj-1Σy=0Nj-1fkj(x,y)exp(-2πi(xuMj+yvNj))---(6)]]>|Fkj(u,v)|=Re[Fkj(u,v)]2+Im[Fkj(u,v)]2---(7)]]>在等式中,Re(z)和Im(z)分別表示復(fù)數(shù)z的實數(shù)部分和虛數(shù)部分。Mj表示整體區(qū)域311的寬,或者是四塊區(qū)域312或十六塊區(qū)域313中每個子塊的寬。例如M0=44、M1=22、和M2=11。Nj表示整體區(qū)域311的高,或者是四塊區(qū)域312或十六塊區(qū)域313中每個子塊的高。例如N0=56、N1=28、和N2=14。
對除了表1中所定義的高頻分量外的傅立葉振幅|Fkj(u,v)|,執(zhí)行光柵掃描,從而獲得第二特征向量x2f。按整體區(qū)域311的傅立葉振幅|F10(u,v)|、四塊區(qū)域312的傅立葉振幅|F11(u,v)|、|F21(u,v)|、|F31(u,v)|和|F41(u,v)|以及十六塊區(qū)域313的傅立葉振幅|F12(u,v)|、|F22(u,v)|、……、|F162(u,v)|的順序,對傅立葉振幅值執(zhí)行光柵掃描。
光柵掃描所獲得的第二特征向量x2f可用以下等式(8)表示。此處,第二特征向量x2f為856維。
x2f=|F10(0,0)||F10(1,0)|···|F10(43,13)||F11(0,0)||F11(1,0)|···|F41(21,6)||F12(0,0)||F22(1,0)|···|F162(10,2)|---(8)]]>第二PCLDA投影器226,將第二傅立葉變換器225所提取的第二特征向量x2f,投影到對第二特征向量x2f執(zhí)行PCLDA所獲得的判別空間。采用預(yù)定公知算法獲得的且本領(lǐng)域普通技術(shù)人員公知的第二基本矩陣Ψ2f,來定義所述判別空間。
第一向量標(biāo)準(zhǔn)化器227,通過標(biāo)準(zhǔn)化被第一PCLDA投影器223投影到該判別空間的第一特征向量,而產(chǎn)生第一標(biāo)準(zhǔn)化向量y1f。另外,第一向量標(biāo)準(zhǔn)化器227通過標(biāo)準(zhǔn)化被第二PCLDA投影器226投影到該判別空間的第二特征向量,而產(chǎn)生第二標(biāo)準(zhǔn)化向量y2f。第一和第二標(biāo)準(zhǔn)化向量y1f和y2f可分別用以下等式(9)和(10)表示y1f=ψ1fTx1f-m1f|ψ1fTx1f-m1f|---(9)]]>
y2f=ψ2fTx2f-m2f-m2f|ψ2fTx2f-m2f|---(10)]]>在等式(9)和(10)中,m1f和m2f表示被第一和第二PCLDA投影器223和226投影到判別空間的向量均值。第一和第二標(biāo)準(zhǔn)化向量y1f和y2f分別為70維和80維。
所述中心傅立葉特征向量產(chǎn)生器230,獲得中心面貌區(qū)域231的傅立葉頻譜和傅立葉振幅,并利用該中心面貌區(qū)域231的傅立葉頻譜和傅立葉振幅,產(chǎn)生中心傅立葉特征向量。所述中心傅立葉特征向量產(chǎn)生器230的工作方式與整體傅立葉特征向量產(chǎn)生器220相同。以下將詳細(xì)描述中心傅立葉特征向量產(chǎn)生器230的工作過程。
所述中心面貌區(qū)域231,是通過將f(x,y)表示的標(biāo)準(zhǔn)化面貌圖像110,剪切成起點為(7,12)和終點為(38,43)的32×32圖像而獲得的。
所述第三傅立葉變換器232,通過傅立葉變換,將g(x,y)表示的中心面貌區(qū)域231轉(zhuǎn)換為頻域,從而獲得傅立葉頻譜G(u,v)。對傅立葉頻譜G(u,v)執(zhí)行光柵掃描,從而獲得第三特征向量x1g。此處,對如表1的掃描區(qū)域A和B執(zhí)行光柵掃描。光柵掃描所獲得的第三特征向量x1g為256維。
第三PCLDA投影器233,將第三傅立葉變換器232提取的第三特征向量x1g,投影到通過對第三特征向量x1g執(zhí)行PCLDA所獲得的判別空間。采用預(yù)定公知算法獲得的且本領(lǐng)域普通技術(shù)人員公知的第三基本矩陣Ψ1g,來定義該判別空間。
第四傅立葉變換器235,通過對分塊面貌區(qū)域234執(zhí)行傅立葉變換,而將該分塊面貌區(qū)域234轉(zhuǎn)換為頻域。如圖3B所示,分塊面貌區(qū)域234包括三個子空間,即具有32×32大小且用g10(x,y)表示的32×32型中心區(qū)域321、由均為16×16大小的四個相同塊組成且用gk1(x,y)表示的四塊區(qū)域322、以及由均為8×8大小的十六個相同塊組成且用gk2(x,y)表示的十六塊區(qū)域323。對分塊面貌區(qū)域234的每個子空間,執(zhí)行傅立葉變換。中心區(qū)域321具有傅立葉振幅|G(u,v)|,而且四塊區(qū)域322和十六塊區(qū)域323的子塊gkj(x,y)的每一個具有振幅|Gkj(u,v)|。通過對以上傅立葉振幅執(zhí)行光柵掃描,可獲得第四特征向量x2g。對表1中的掃描區(qū)域A和B執(zhí)行光柵掃描。此處,光柵掃描所獲得的第四特征向量x2g為384維。
第四PCLDA投影器236,將第四傅立葉變換器235所提取的第四特征向量x2g,投影到通過對第四特征向量x2g執(zhí)行PCLDA所獲得的判別空間。采用預(yù)定公知算法獲得的且本領(lǐng)域普通技術(shù)人員公知的第四基本矩陣Ψ2g,來定義該判別空間。
為了利用由第三PCLDA投影器233投影到該判別空間的向量均值m1g而產(chǎn)生單元向量,第二向量標(biāo)準(zhǔn)化器237標(biāo)準(zhǔn)化所述第三特征向量。該標(biāo)準(zhǔn)化的結(jié)果是獲得第三標(biāo)準(zhǔn)化向量y1g。另外,為了利用由第四PCLDA投影器236投影到該判別空間的向量均值m2g而產(chǎn)生單元向量,第二向量標(biāo)準(zhǔn)化器237標(biāo)準(zhǔn)化所述第四特征向量,從而獲得第四標(biāo)準(zhǔn)化向量y2g。所述第三和第四標(biāo)準(zhǔn)化向量y1g和y2g分別為70維和80維。
圖4為圖1的整體傅立葉特征向量產(chǎn)生單元123的詳細(xì)方框圖。如圖4所示,整體傅立葉特征向量產(chǎn)生單元123包括第一耦合器410、第一LDA投影器420和第一量化器430。
參考圖4,第一耦合器410將來自傅立葉特征產(chǎn)生單元121中第一向量標(biāo)準(zhǔn)化器227的第一和第二標(biāo)準(zhǔn)化向量y1f和y2f耦合成具有,例如150維的單一耦合向量。
第一LDA投影器420將第一耦合器410提供的耦合向量,投影到由采用預(yù)定公知算法獲得且本領(lǐng)域普通技術(shù)人員公知的第五基本矩陣Ψ2f定義的線性判別空間。所得到的投影向量zf可用以下等式(11)表示。
zf=ψ3fTy1fy2f---(11)]]>采用以下等式(12),第一量化器430將第一LDA投影器420提供的投影向量的每個分量,剪切并量化為無符號的5位整數(shù),然后將所得到的向量作為整體傅立葉特征向量wif存儲。
圖5是圖1的中心傅立葉特征向量產(chǎn)生單元125的詳細(xì)方框圖。如圖5所示,中心傅立葉特征向量產(chǎn)生單元125包括第二耦合器510、第二LDA投影器520以及第二量化器530。
參考圖5,第二耦合器510將來自傅立葉特征產(chǎn)生單元121中第二向量標(biāo)準(zhǔn)化器237的第三和第四標(biāo)準(zhǔn)化向量y1g和y2g耦合成具有,例如150維的單一耦合向量。
第二LDA投影器520將第二耦合器510提供的耦合向量投影到采用預(yù)定公知算法獲得且本領(lǐng)域普通技術(shù)人員公知的第六基本矩陣Ψ3g定義的線性判別空間。所得到的投影向量zg可用以下等式(11)表示采用以下等式(13),第二量化器530將第二LDA投影器520提供的投影向量zg的每個分量,剪切并量化為無符號的5位整數(shù),然后將所得到的向量作為中心傅立葉特征向量wig存儲。
圖6是圖2的強度特征向量產(chǎn)生器230的詳細(xì)方框圖。如圖6所示,強度特征向量產(chǎn)生器230包括姿態(tài)估計和補償單元610、第二圖像分割器620、整體強度特征向量產(chǎn)生器630、以及局部強度特征向量產(chǎn)生器640。
參考圖6,姿態(tài)估計和補償單元610估計標(biāo)準(zhǔn)化面貌圖像110的姿態(tài),基于該姿態(tài)估計結(jié)果而對標(biāo)準(zhǔn)化面貌圖像110進行補償,并輸出結(jié)果正面面貌圖像。姿態(tài)估計和補償單元610調(diào)整由于標(biāo)準(zhǔn)化面貌圖像110的姿態(tài)變化所引起的不匹配。
第二圖像分割器620將從姿態(tài)估計和補償單元610輸出的姿態(tài)補償面貌圖像,分別分割成一個整體面貌區(qū)域和具有面貌分量1至5的第一至第五局部圖像。該整體面貌區(qū)域,具有由以下表2所定義的一預(yù)定光柵掃描區(qū)域。具體說,起點為(0,0)的整體面貌區(qū)域大小為46×56。起點分別為(9,4)、(6,16)、(17,16)、(7,25)和(16,25)的第一至第五局部圖像的大小,分別為29×27、24×21、24×21、24×24和24×24。
例如,下表定義了光柵掃描區(qū)域和面貌分量方向區(qū)域的向量維數(shù)。
表2
在所述整體強度特征向量產(chǎn)生器630中,通過沿列方向?qū)φw面貌區(qū)域執(zhí)行光柵掃描,第一光柵掃描器631產(chǎn)生包括用于整體面貌區(qū)域的強度值的第五特征向量xh。從整體面貌區(qū)域的左上點(0,0)開始至整體面貌區(qū)域的右下點(46,56)結(jié)束,而執(zhí)行列方向光柵掃描。此處,第五特征向量xh為,例如2576維。
第五PCLDA投影器632將來自第一光柵掃描器631的第五特征向量xh,投影到由采用預(yù)定公知算法獲得且本領(lǐng)域普通技術(shù)人員公知的第七基本矩陣Ψ1h所定義的判別空間。
第五向量標(biāo)準(zhǔn)化器633將投影向量標(biāo)準(zhǔn)化為單元向量yh,并將此單元向量yh作為整體強度特征向量存儲。該單元向量yh可用以下等式(14)表示。
yh=ψ1htxh-mh|ψ1hTxh-mh|---(14)]]>在等式(14)中,mh表示通過第五PCLDA投影器632,投影到該判別空間的向量均值,且具有40維。
在局部強度特征向量產(chǎn)生器640中,通過沿列方向?qū)γ總€局部面貌區(qū)域執(zhí)行光柵掃描,第二至第六光柵掃描器641a至645a,均產(chǎn)生包括用于每個局部面貌區(qū)域的強度值的第六特征向量xkc(k=1,2,....,5)。從每個局部面貌區(qū)域的左上點開始至每個局部面貌區(qū)域的右下點結(jié)束,來執(zhí)行列方向光柵掃描。對于表2所定義的每個光柵掃描區(qū)域,第六特征向量xkc(k=1,2,...,5)為783、504、504、576或576維。
第六至第十PCLDA投影器64lb至645b,將由第二至第六光柵掃描器641a至645a的每一個所提供的第六特征向量xkc(k=1,2,...,5),投影到由采用預(yù)定公知算法獲得且本領(lǐng)域普通技術(shù)人員公知的第八基本矩陣Ψkc(k=1,2,...,5)所定義的判別空間。
第六至第十向量標(biāo)準(zhǔn)化器641c至645c,將通過第六至第十PCLDA投影器641b至645b的每一個投影到該判別空間的向量,標(biāo)準(zhǔn)化為單元向量ykc(k=1,2,...,5),并將此單元向量ykc作為局部強度特征向量存儲。單元向量ykc可用以下等式(15)表示。
ykc=ψkcTxkc-mkc|ψkcTxkc-mkc|---(15)]]>在等式(15)中,mkc表示由第六至第十PCLDA投影器641b至645b的每一個,投影到該判別空間的向量均值,且為40維。
圖7是圖6的姿態(tài)估計和補償單元610的詳細(xì)方框圖。如圖7所示,姿態(tài)估計和補償單元610包括姿態(tài)估計器710和姿態(tài)補償器720,所述姿態(tài)估計器710包括n個主分量分析/特征空間距離(principal-component-analysis/distance-from-feature-spacePCA/DFFS)模塊711、712和713以及最小值檢測器714,所述姿態(tài)補償器720包括仿射轉(zhuǎn)換器721和反相映射器722。
采用PCA/DFFS方法,姿態(tài)估計器710估計標(biāo)準(zhǔn)化面貌圖像110的姿態(tài),使之屬于下表(3)中定義的九個姿態(tài)類之一。為此,第一至第n個PCA投影器711a、712a和713a(此處,n=9),將標(biāo)準(zhǔn)化面貌圖像110,投影到用于九個姿態(tài)類中每一個的投影矩陣Pi(i=1,2,...,9)的PCA子空間。可從訓(xùn)練面貌圖像中收集的典型圖像中學(xué)習(xí)并獲得,用于九個姿態(tài)類中每一個的PCA模型。將具有與九個姿態(tài)類所定義的相同姿態(tài)的面貌圖像,判定為每個姿態(tài)類的距離。
表3
第一至第n個DFFS計算器711b、712b和713b(此處,n=9),利用以下等式(16)計算九個姿態(tài)類中每一個的距離di(x)。該距離di(x)表示用于特定姿態(tài)類的PCA子空間所表示的面貌的精確程度。
di(x)=‖x‖2-‖Pi(x-Mi)‖2…(16)
在等式(16)中,x和Mi分別表示對標(biāo)準(zhǔn)化面貌圖像結(jié)果的列方向光柵掃描所獲得的向量,和用于特定姿態(tài)類(i)的PCA子空間的平均向量。投影矩陣Pi(i=1,2,...,9)是采用預(yù)定公知算法獲得且是本領(lǐng)域普通技術(shù)人員公知的。
最小值檢測器714檢測第一至第n個DFFS計算器711b、712b和713b(此處,n=9)所提供的距離di(x)中的最小值,并估計對應(yīng)于所檢測到的最小值的預(yù)定姿態(tài)類,以作為用于該標(biāo)準(zhǔn)化面貌圖像110的姿態(tài)類,如以下等式(17)所示。
imin=argimin{di(x)}i=1,2,...,9 …(17)在1994年7月,B.Moghaddam和A.Pentland在“Face Recognition usingView-based and Modular Eigenspaces,”Automatic Systems for the Identificationand Inspection of Humans,SPIE Vol.2277中,公開了上述PCA/DFFS方法。
姿態(tài)補償器720依據(jù)姿態(tài)估計器710所估計的姿態(tài)類,將標(biāo)準(zhǔn)化面貌圖像110補償為正面面貌圖像。為達到此目的,仿射變換器721裝入產(chǎn)生對應(yīng)于所估計姿態(tài)類的正面姿態(tài)類的預(yù)定仿射變換矩陣。從一姿態(tài)類到所述正面姿態(tài)類的仿射變換,依賴于姿態(tài)類和正面姿態(tài)類之間的對應(yīng)點。每個姿態(tài)類可將,例如,15個區(qū)別面貌特征的平均位置作為對應(yīng)點,詳細(xì)地說,就是在兩眉毛和眼睛的左和右邊界,在鼻子的左、右和下邊界,在嘴巴的左、右、上和下邊界。所述區(qū)別面貌特征可從被分配給每個姿態(tài)類的訓(xùn)練圖像中人工選擇。
反相映射器722通過利用來自仿射轉(zhuǎn)換器721的預(yù)定仿射轉(zhuǎn)換矩陣,將標(biāo)準(zhǔn)化面貌圖像110幾何反相映射成正面面貌圖像,從而提供一姿態(tài)補償面貌圖像730。從姿態(tài)類(j)至正面面貌圖像的仿射轉(zhuǎn)換,可采用下表4中所示的六維參數(shù)Aj={a,b,c,d,e,f}來表示,而且以上參數(shù)是通過正面面貌圖像中的區(qū)別面貌特征與每個姿態(tài)面貌圖像中的區(qū)別面貌特征的比率來計算的。
表4
反相映射面貌圖像上的點(x,y)的強度,可利用以下雙線性內(nèi)插公式(18)計算。
(1-dy)·{(1-dx)·f(x′,y′)+dx·f(x′+1,y′)}+dy·{(1-dx)·f(x′,y′+1)+dx·f(x′+1,y′+1)}…(18)在公式(18)中,x′=ceil(a·x+b·y+c)、y′=ceil(d·x+e·y+f)、dx=(a·x+b·y+c)-x′且dy=(d·x+e·y+f)-y′。f(x′,y′)表示在點(x′,y′)的標(biāo)準(zhǔn)化面貌圖像110的強度。
圖8是圖1的整體合成特征向量產(chǎn)生單元133的詳細(xì)方框圖。如圖8所示,整體合成特征向量產(chǎn)生單元133包括第三耦合器810、第三LDA投影器820和第三量化器830。
參考圖8,第三耦合器810將由傅立葉特征產(chǎn)生單元121的第一向量標(biāo)準(zhǔn)化器227提供的第一和第二標(biāo)準(zhǔn)化向量y1f和y2f與由整體強度特征向量產(chǎn)生器630提供的整體強度特征向量yh耦合成具有,例如190維的單一耦合向量。
第三LDA投影器820將第三耦合器810提供的耦合向量,投影到由采用預(yù)定公知算法獲得且本領(lǐng)域普通技術(shù)人員公知的第九基本矩陣Ψ2h所定義的線性判別空間。所得到的投影向量zh可用以下等式(19)表示zh=ψ2hTy1fy2fyh---(19)]]>采用以下等式(20),第三量化器830將第三LDA投影器820提供的投影向量zh的每個分量,剪切并量化為無符號的5位整數(shù),然后將所得到的向量作為整體合成特征向量wih存儲。
圖9是圖1的中心合成特征向量產(chǎn)生單元135的詳細(xì)方框圖。如圖9所示,中心合成特征向量產(chǎn)生單元135包括第四耦合器910、第四LDA投影器920和第四量化器930。
參考圖9,第四耦合器910將由傅立葉特征產(chǎn)生單元121的第二向量標(biāo)準(zhǔn)化器237提供的第三和第四標(biāo)準(zhǔn)化向量y1g和y2g,以及由局部強度特征向量產(chǎn)生器640提供的局部強度特征向量vkc,耦合成具有,例如350維的單一耦合向量。
第四LDA投影器920,將第四耦合器910提供的耦合向量,投影到由采用預(yù)定公知算法獲得且本領(lǐng)域普通技術(shù)人員公知的第十基本矩陣Ψ6c所定義的線性判別空間。所得到的投影向量zc可用以下等式(21)表示。
zc=ψ6cTy1gy2gy1cy2cy3cy4cy5c---(21)]]>采用以下等式(22),第四量化器930將第四LDA投影器920提供的投影向量的每個分量,剪切并量化為無符號的5位整數(shù),然后將所得到的向量作為中心合成特征向量wic存儲。
2002年9月,Tae-kyun Kim的“Component-based LDA face Descriptor forImage Retrieval,”British Machine Vision Conference 2002中已公開了以上所述的第一至第十基本矩陣(或投影矩陣)。
以下,將詳細(xì)描述依據(jù)本發(fā)明的提取特征向量的方法的面貌圖像重現(xiàn)性能。
作為根據(jù)本發(fā)明的提取特征向量方法的試驗,采用包括五個數(shù)據(jù)庫的一組MPEG-7面貌圖像數(shù)據(jù)。以上五個數(shù)據(jù)庫是擴展版本1的MPEG-7面貌圖像數(shù)據(jù)庫(E1)、Altkom數(shù)據(jù)庫(A2)、XM2VTS數(shù)據(jù)庫中的MPEG-7測試組(M3)、FERET數(shù)據(jù)庫F4以及Banca數(shù)據(jù)庫中的MPEG-7測試組(B5)。用于此試驗的圖像總數(shù)為11,845個。在此11,845個圖像中,3,655個圖像僅僅用作LDA投影的訓(xùn)練圖像,而其余的圖像用作估計依據(jù)本發(fā)明的圖像檢索算法的性能的測試圖像。那些測試圖像中,4190個圖像被用作提取面貌特征向量的基本圖像,而剩下的,則被用作面貌搜索圖像。表5表示用于此試驗的訓(xùn)練圖像和測試圖像的詳細(xì)信息。本試驗中每個圖像的普通信息都已預(yù)先給出,這樣才可能估計依據(jù)本發(fā)明的圖像重現(xiàn)算法的性能。
表5
依據(jù)本發(fā)明的圖像重現(xiàn)算法所執(zhí)行的重現(xiàn)精度,可采用平均標(biāo)準(zhǔn)化改進重現(xiàn)率(ANMRR)來測量,這已在2002年B.S.Manjunath,Philippe Salembier和Thomas Sikora的“Introduction to MPEG-7Multimedia Content DescriptionInterface,”John Wiley & Sons Ltd.中公開。
依據(jù)此試驗結(jié)果,當(dāng)只采用傅立葉特征向量和只采用強度特征向量時,根據(jù)本發(fā)明的圖像重現(xiàn)算法的重現(xiàn)精度分別為0.354和0.390。當(dāng)同時采用了傅立葉特征向量和強度特征向量時,根據(jù)本發(fā)明的圖像重現(xiàn)算法的重現(xiàn)精度為0.266。常規(guī)傅立葉特征向量和強度特征向量的大小分別為240(=48×5)位和200(=40×5)位,而依據(jù)本發(fā)明的傅立葉特征向量大小為320(=64×5)位。依據(jù)本發(fā)明的圖像重現(xiàn)算法的重現(xiàn)精度,隨特征向量大小的不同而不同。例如,當(dāng)大小為48(即240位)時,ANMRR是0.280。當(dāng)大小為64(即320位)時,ANMRR是0.266。當(dāng)大小為128(即640位)時,ANMRR是0.249。也就是說,如上所述,采用更大的特征向量,會增大重現(xiàn)精度,同時計算負(fù)載也會略為增大。而且,以上所有結(jié)果表明通過利用類似于本發(fā)明的傅立葉特征向量和強度特征向量,有可能提供精度重現(xiàn)技術(shù),并產(chǎn)生非常好的鑒定結(jié)果。
本發(fā)明可實現(xiàn)為寫在計算機可讀記錄介質(zhì)上的計算機可讀代碼。計算機可讀介質(zhì),包括幾乎各種可將計算機可讀數(shù)據(jù)寫于其上的記錄設(shè)備。例如,計算機可讀記錄介質(zhì)包括ROM、RAM、CD-ROM、磁帶、軟盤、光學(xué)數(shù)據(jù)存儲器和諸如通過因特網(wǎng)進行數(shù)據(jù)傳輸?shù)妮d波。計算機可讀記錄介質(zhì)也可分布到多種與網(wǎng)絡(luò)相連的計算機系統(tǒng)。所以,計算機可讀代碼可記錄在計算機可讀記錄介質(zhì)上且可以分散方式運行。
如上所述,依據(jù)本發(fā)明,通過指定面貌識別和重現(xiàn)系統(tǒng),可選擇使用頻率特征向量或合成特征向量。而且,依據(jù)本發(fā)明,可克服只采用頻域特征向量或只采用空間域特征向量的常規(guī)重現(xiàn)技術(shù)的局限性,且通過分別為預(yù)定標(biāo)準(zhǔn)化面貌圖像產(chǎn)生傅立葉特征向量和強度特征向量,然后將所述兩特征向量合并為單一合成特征向量,可相當(dāng)大地增強圖像重現(xiàn)精度。
以上參照其典型實施例,已對本發(fā)明進行了具體的說明和描述,本領(lǐng)域普通技術(shù)人員應(yīng)理解在不脫離所附權(quán)利要求定義的本發(fā)明精神和范圍的情況下,可對本發(fā)明進行各種形式和細(xì)節(jié)上的改變。
權(quán)利要求
1.一種提取用于面貌識別和重現(xiàn)的特征向量的方法,該方法包括以下步驟(a)利用第一和第二標(biāo)準(zhǔn)化向量,產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域的整體傅立葉特征向量,并利用第三和第四標(biāo)準(zhǔn)化向量,產(chǎn)生用于該標(biāo)準(zhǔn)化面貌圖像的中心面貌區(qū)域的中心傅立葉特征向量;以及(b)產(chǎn)生用于該整體面貌區(qū)域的整體強度特征向量和用于預(yù)定數(shù)目的面貌分量方向區(qū)域的局部強度特征向量,通過耦合所述第一和第二標(biāo)準(zhǔn)化向量以及該整體強度特征,而產(chǎn)生整體合成特征向量,并且通過耦合所述第三和第四標(biāo)準(zhǔn)化向量以及該局部強度特征向量,而產(chǎn)生中心合成特征向量。
2.根據(jù)權(quán)利要求1的方法,其中該步驟(a)包括(a1)通過在該整體面貌區(qū)域執(zhí)行傅立葉變換,而獲取用于該整體面貌區(qū)域的傅立葉頻譜和傅立葉振幅,并利用所獲得的該整體面貌區(qū)域的傅立葉頻譜和傅立葉振幅,而定義第一和第二特征向量;(a2)通過在該中心面貌區(qū)域執(zhí)行傅立葉變換,而獲取用于該中心面貌區(qū)域的傅立葉頻譜和傅立葉振幅,并利用所獲得的該中心面貌區(qū)域的傅立葉頻譜和傅立葉振幅,而定義第三和第四特征向量;(a3)通過將所述第一和第二特征向量投影到第一PCLDA子空間,并標(biāo)準(zhǔn)化所產(chǎn)生的特征向量,而產(chǎn)生所述第一和第二標(biāo)準(zhǔn)化向量,以及通過將所述第一和第二標(biāo)準(zhǔn)化向量耦合成單一耦合向量,且將該單一耦合向量投影到第一線性判別空間,而產(chǎn)生該整體傅立葉特征向量;以及(a4)通過將所述第三和第四特征向量投影到第二PCLDA子空間,并標(biāo)準(zhǔn)化所產(chǎn)生的特征向量,而產(chǎn)生所述第三和第四標(biāo)準(zhǔn)化向量,以及通過將所述第三和第四標(biāo)準(zhǔn)化向量耦合成單一耦合向量,且將該單一耦合向量投影到第二線性判別空間,而產(chǎn)生該中心傅立葉特征向量。
3.根據(jù)權(quán)利要求2的方法,其中在步驟(a1)中,從該整體面貌區(qū)域獲得該傅立葉頻譜,并從第一分塊面貌區(qū)域獲得該傅立葉振幅。
4.根據(jù)權(quán)利要求3的方法,其中該第一分塊面貌區(qū)域包括通過將該整體面貌區(qū)域剪切成預(yù)定大小圖像而獲得的整體區(qū)域、通過將該整體區(qū)域分成四塊而獲得的四塊區(qū)域、以及通過將該整體區(qū)域分成十六塊而獲得的十六塊區(qū)域。
5.根據(jù)權(quán)利要求2的方法,其中在步驟(a2) 中,從該中心面貌區(qū)域獲得該傅立葉頻譜,從第二分塊區(qū)域獲得該傅立葉振幅。
6.根據(jù)權(quán)利要求5的方法,其中該第二分塊面貌區(qū)域包括對應(yīng)該中心面貌區(qū)域的中心區(qū)域、通過將該中心區(qū)域分成四塊而獲得的四塊區(qū)域、以及通過將該中心區(qū)域分成十六塊而獲得的十六塊區(qū)域。
7.根據(jù)權(quán)利要求1的方法,其中該步驟(b)包括(b1)產(chǎn)生用于該標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域的所述第一和第二標(biāo)準(zhǔn)化向量,并產(chǎn)生用于該標(biāo)準(zhǔn)化面貌圖像的中心面貌區(qū)域的所述第三和第四標(biāo)準(zhǔn)化向量;(b2)產(chǎn)生用于整體面貌區(qū)域的整體強度特征向量,和用于預(yù)定數(shù)目面貌分量方向區(qū)域的局部強度特征向量;(b3)通過將所述第一和第二標(biāo)準(zhǔn)化向量以及該整體強度特征向量耦合成單一耦合向量,并將所耦合的向量投影到第三線性判別空間,從而產(chǎn)生整體合成特征向量;以及(b4)通過將所述第三和第四標(biāo)準(zhǔn)化向量以及該局部強度特征向量耦合成單一耦合向量,并將所耦合的向量投影到第四線性判別空間,從而產(chǎn)生中心合成特征向量。
8.根據(jù)權(quán)利要求7的方法,其中該步驟(b2)包括(b21)通過對該標(biāo)準(zhǔn)化面貌圖像執(zhí)行姿態(tài)估計和補償,從而將該標(biāo)準(zhǔn)化面貌圖像轉(zhuǎn)換成正面面貌圖像;(b22)通過對所得到的姿態(tài)補償面貌圖像的整體面貌區(qū)域執(zhí)行光柵掃描,從而定義第五特征向量;(b23)通過對姿態(tài)補償面貌圖像的多個面貌分量方向區(qū)域執(zhí)行光柵掃描,從而定義第六特征向量;(b24)通過將該第五特征向量投影到第三PCLDA子空間,并將所獲得的特征向量標(biāo)準(zhǔn)化為第五單元向量,從而產(chǎn)生該整體強度特征向量;以及(b25)通過將該第六特征向量投影到第四PCLDA子空間,并將所獲得的特征向量標(biāo)準(zhǔn)化為第六單元向量,從而產(chǎn)生該局部強度特征向量。
9.根據(jù)權(quán)利要求8的方法,其中在步驟(b21)中,采用PCA-DFFS方法來估計標(biāo)準(zhǔn)化面貌圖像的姿態(tài)。
10.根據(jù)權(quán)利要求7的方法,其中該步驟(b3)包括(b31)將(b1)產(chǎn)生的第一和第二標(biāo)準(zhǔn)化向量與(b2)產(chǎn)生的整體強度特征向量耦合成單一耦合向量;(b32)將所耦合的向量投影到第三線性判別空間;以及(b33)量化所投影向量的每個分量,并將所得到的向量作為整體合成特征向量存儲。
11.根據(jù)權(quán)利要求7的方法,其中該步驟(b4)包括(b41)將(b1)產(chǎn)生的第三和第四標(biāo)準(zhǔn)化向量與(b2)產(chǎn)生的局部強度特征向量耦合成單一耦合向量;(b42)將所耦合的特征向量投影到第四線性判別空間;以及(b43)量化所投影向量的每個分量,并將所得到的向量作為中心合成特征向量存儲。
12.一種提取用于面貌識別和重現(xiàn)的特征向量的方法,該方法包括以下步驟(a)產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域的整體傅立葉特征向量,和用于該標(biāo)準(zhǔn)化面貌圖像的中心面貌區(qū)域的中心傅立葉特征向量;(b)產(chǎn)生用于該整體面貌區(qū)域的整體強度特征向量,和用于預(yù)定數(shù)目面貌分量方向區(qū)域的局部強度特征向量;(c)通過將該整體傅立葉特征向量和該整體強度特征向量耦合成單一耦合向量,并將所耦合的向量投影到第一線性判別空間,從而產(chǎn)生整體合成特征向量;且(d)通過將該中心傅立葉特征向量和該局部強度特征向量耦合成單一耦合向量,并將所耦合的向量投影到第二線性判別空間,從而產(chǎn)生中心合成特征向量。
13.一種計算機可讀記錄介質(zhì),其上記錄能實現(xiàn)權(quán)利要求1至12任一方法的程序。
14.一種提取用于面貌識別和重現(xiàn)的特征向量的裝置,該裝置包括第一單元,利用第一和第二標(biāo)準(zhǔn)化向量,產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域的整體傅立葉特征向量,并利用第三和第四標(biāo)準(zhǔn)化向量,產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的中心面貌區(qū)域的中心傅立葉特征向量;以及第二單元,產(chǎn)生用于該整體面貌圖像的整體強度特征向量,和用于預(yù)定數(shù)目的面貌分量方向區(qū)域的局部強度特征向量,通過耦合所述第一和第二標(biāo)準(zhǔn)化向量以及整體強度特征向量,而產(chǎn)生整體合成特征向量,并且通過耦合所述第三和第四標(biāo)準(zhǔn)化向量以及局部強度特征向量,而產(chǎn)生中心合成特征向量。
15.根據(jù)權(quán)利要求14的裝置,其中該第一單元包括傅立葉特征產(chǎn)生器,產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域的第一和第二標(biāo)準(zhǔn)化向量,以及用于中心面貌區(qū)域的第三和第四標(biāo)準(zhǔn)化向量;整體傅立葉特征向量產(chǎn)生器,通過將所述第一和第二標(biāo)準(zhǔn)化向量耦合成單一耦合向量,并將所耦合的向量投影到第一線性判別空間,從而產(chǎn)生整體傅立葉特征向量;以及中心傅立葉特征向量產(chǎn)生器,通過將所述第三和第四標(biāo)準(zhǔn)化向量耦合成單一耦合向量,并將所耦合的向量投影到第二線性判別空間,從而產(chǎn)生中心傅立葉特征向量。
16.根據(jù)權(quán)利要求14的裝置,其中該第二單元包括傅立葉特征產(chǎn)生器,產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域的第一和第二標(biāo)準(zhǔn)化向量,并產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的中心面貌區(qū)域的第三和第四標(biāo)準(zhǔn)化向量;強度特征產(chǎn)生器,產(chǎn)生用于整體面貌區(qū)域的整體強度特征向量,和用于預(yù)定數(shù)目的面貌分量方向區(qū)域的局部強度特征向量;整體合成特征向量產(chǎn)生器,通過耦合第一和第二標(biāo)準(zhǔn)化向量以及整體強度特征向量,從而產(chǎn)生整體合成特征向量;以及中心合成特征向量產(chǎn)生器,通過耦合第三和第四標(biāo)準(zhǔn)化向量以及局部強度特征向量,從而產(chǎn)生中心合成特征向量。
17.根據(jù)權(quán)利要求16的裝置,其中所述傅立葉特征產(chǎn)生器包括整體傅立葉特征向量產(chǎn)生器,通過將由傅立葉變換整體面貌區(qū)域獲得的傅立葉頻譜和傅立葉振幅所定義的第一和第二特征向量投影到第一PCLDA子空間,并標(biāo)準(zhǔn)化所獲得的特征向量,從而產(chǎn)生第一和第二標(biāo)準(zhǔn)化向量;和中心傅立葉特征向量產(chǎn)生器,通過將由傅立葉變換該中心面貌區(qū)域獲得的傅立葉頻譜和傅立葉振幅所定義的第三和第四特征向量投影到第二PCLDA子空間,并標(biāo)準(zhǔn)化所獲得的特征向量,從而產(chǎn)生第三和第四標(biāo)準(zhǔn)化向量。
18.根據(jù)權(quán)利要求17的裝置,其中用于整體傅立葉特征向量產(chǎn)生器的傅立葉頻譜是從此整體面貌區(qū)域獲得的,并且用于該整體面貌區(qū)域的傅立葉振幅是從將整體面貌區(qū)域剪切成預(yù)定大小區(qū)域而獲得的整體區(qū)域、將該整體區(qū)域分成四塊而獲得的四塊區(qū)域和將該整體區(qū)域分成十六塊而獲得的十六塊區(qū)域中獲得的。
19.根據(jù)權(quán)利要求17的裝置,其中用于中心傅立葉特征向量產(chǎn)生器的傅立葉頻譜是從此中心面貌區(qū)域獲得的,并且用于該中心面貌區(qū)域的傅立葉振幅是從中心區(qū)域、將該中心區(qū)域分成四塊而獲得的四塊區(qū)域和將該中心區(qū)域分成十六塊而獲得的十六塊區(qū)域中獲得的。
20.根據(jù)權(quán)利要求16的裝置,其中該強度特征產(chǎn)生器包括姿態(tài)估計和補償單元,估計標(biāo)準(zhǔn)化面貌圖像的姿態(tài),并基于此估計結(jié)果將此標(biāo)準(zhǔn)化面貌圖像轉(zhuǎn)換成正面面貌圖像;整體強度特征向量產(chǎn)生器,通過將對標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域執(zhí)行光柵掃描所獲得的第五特征向量,投影到第三PCLDA子空間,并將所獲得的特征向量標(biāo)準(zhǔn)化為第五單元向量,從而產(chǎn)生整體強度特征向量;以及局部強度特征向量產(chǎn)生器,通過將對姿態(tài)補償面貌圖像的多個面貌分量方向區(qū)域執(zhí)行光柵掃描所獲得的第六特征向量,投影到第四PCLDA子空間,并將所獲得的特征向量標(biāo)準(zhǔn)化為第六單元向量,從而產(chǎn)生局部強度特征向量。
全文摘要
提供了一種提取用于面貌識別和重現(xiàn)的特征向量的方法和裝置。利用第一和第二標(biāo)準(zhǔn)化向量,產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的整體面貌區(qū)域的整體傅立葉特征向量,并利用第三和第四標(biāo)準(zhǔn)化向量,產(chǎn)生用于標(biāo)準(zhǔn)化面貌圖像的中心面貌區(qū)域的中心傅立葉特征向量。為整體面貌區(qū)域產(chǎn)生整體強度特征向量,為預(yù)定數(shù)目的面貌分量方向區(qū)域產(chǎn)生局部強度特征向量。通過耦合第一和第二標(biāo)準(zhǔn)化向量以及所述整體強度特征而產(chǎn)生整體合成特征向量,而且通過耦合第三和第四標(biāo)準(zhǔn)化向量以及局部強度特征向量而產(chǎn)生中心合成特征向量。
文檔編號G06K9/00GK1504961SQ200310120470
公開日2004年6月16日 申請日期2003年10月15日 優(yōu)先權(quán)日2002年10月15日
發(fā)明者金鉉優(yōu), 龜丁俊男, 金泰均, 黃元俊, 奇錫哲, 男 申請人:三星電子株式會社, 日本電氣株式會社