專利名稱:基于主元分析和支持向量機(jī)的人臉檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種通用快速的人臉檢測(cè)方法,該方法可以適用于視頻監(jiān)控系統(tǒng),該方法的主要特點(diǎn)是能夠通過(guò)對(duì)輸入圖像區(qū)域進(jìn)行主元分析,同時(shí)用支持向量機(jī)對(duì)分析的中間結(jié)果進(jìn)行分類,從而能夠達(dá)到快速高效地進(jìn)行人臉檢測(cè)的目的。
背景技術(shù):
人臉檢測(cè)技術(shù)在門禁系統(tǒng)、監(jiān)控系統(tǒng)、數(shù)碼相機(jī)以及社交網(wǎng)絡(luò)當(dāng)中有著十分廣泛的應(yīng)用和發(fā)展前景。首先,對(duì)于安全敏感區(qū)域的門禁系統(tǒng),可以借助人臉檢測(cè)來(lái)抓取人臉, 之后進(jìn)行識(shí)別,從而可以辨識(shí)進(jìn)入者的身份。其次,在諸如銀行、體育場(chǎng)、機(jī)場(chǎng)以及商場(chǎng)等等的人流量密集的公共場(chǎng)所中,可以對(duì)人群進(jìn)行監(jiān)控,利用人臉檢測(cè)技術(shù),不但可以監(jiān)測(cè)人流量的變化,而且同樣可以對(duì)檢測(cè)的結(jié)果進(jìn)行識(shí)別,更可以進(jìn)一步對(duì)可疑的目標(biāo)進(jìn)行自動(dòng)跟蹤,這對(duì)于防范恐怖襲擊、盜竊等突發(fā)事件大有幫助。再次,在使用數(shù)碼相機(jī)拍攝人物時(shí),可以通過(guò)人臉檢測(cè)功能來(lái)對(duì)相機(jī)進(jìn)行輔助對(duì)焦,從而增強(qiáng)了用戶的拍攝體驗(yàn)。最后,在目前流行的社交網(wǎng)絡(luò)當(dāng)中,可以對(duì)用戶分享照片當(dāng)中的人臉進(jìn)行檢測(cè)并加以分析,產(chǎn)生推薦的好友,也方便了用戶在虛擬社交系統(tǒng)中擴(kuò)大交友圈。目前比較成熟的人臉檢測(cè)算法有VoiIa等人提出的基于Harr-Iike特征的 Adaboost算法,它的最大優(yōu)點(diǎn)是訓(xùn)練誤差以指數(shù)形式趨向于0,且檢測(cè)誤差存在邊界。但由于要針對(duì)不同的訓(xùn)練集訓(xùn)練很多的弱分類器,其在訓(xùn)練過(guò)程中要耗費(fèi)非常大量的時(shí)間。
發(fā)明內(nèi)容
本發(fā)明要解決的是現(xiàn)有技術(shù)存在的上述問(wèn)題,旨在提供一種基于主元分析和支持向量機(jī)的人臉檢測(cè)方法。為解決上述技術(shù)問(wèn)題,本發(fā)明采用以下技術(shù)方案基于主元分析和支持向量機(jī)的人臉檢測(cè)方法,其特征在于在于按以下步驟進(jìn)行I)構(gòu)建人臉?lè)诸惼魍ㄟ^(guò)對(duì)大量不同的經(jīng)過(guò)預(yù)處理過(guò)的人臉樣本的構(gòu)成的向量空間進(jìn)行分析,找出最能表征其向量空間數(shù)據(jù)分布的一組正交基構(gòu)成主元向量集,對(duì)應(yīng)其方差最大的前幾個(gè)方向;對(duì)于人臉樣本以及非人臉樣本,在這組正交基上投影后,利用支持向量機(jī)的方法找出一個(gè)能夠區(qū)分兩類的超平面,從而構(gòu)建一個(gè)人臉?lè)诸惼鳎?)檢測(cè)階段對(duì)于需要測(cè)試的人臉,對(duì)其在主元向量集的投影,利用構(gòu)建好的分類器進(jìn)行判別。本發(fā)明基于主元分析和支持向量機(jī)的人臉檢測(cè)方法能夠準(zhǔn)確高效地進(jìn)行人臉檢測(cè)。
圖I是本發(fā)明訓(xùn)練階段的流程圖。圖2是本發(fā)明主元向量集的方向的示意圖。
圖3是本發(fā)明最優(yōu)超平面的示意圖。圖4是本發(fā)明進(jìn)行人臉測(cè)試階段的流程圖。
具體實(shí)施例方式參照附圖,本發(fā)明的基于主元分析和支持向量機(jī)的人臉檢測(cè)方法,包括兩個(gè)階段I.基于主元分析的人臉檢測(cè)訓(xùn)練階段在進(jìn)行人臉檢測(cè)之前,我們首先要對(duì)人臉模型進(jìn)行訓(xùn)練,訓(xùn)練集包括等同數(shù)量的人臉樣本和非人臉樣本。為了保證人臉檢測(cè)的高效并同時(shí)維持較低的錯(cuò)檢率,我們需要對(duì)輸入的人臉圖像進(jìn)行預(yù)處理,保留其較顯著的易于區(qū)分的特征。下面根據(jù)本發(fā)明的流程I對(duì)訓(xùn)練階段的各個(gè)步驟進(jìn)行詳細(xì)說(shuō)明 步驟一預(yù)處理訓(xùn)練集把所有用于作為訓(xùn)練的人臉以及非人臉圖像調(diào)整為統(tǒng)一的大小,轉(zhuǎn)換為灰度圖, 并做自適應(yīng)閾值化處理,即使用每幅轉(zhuǎn)換后圖像灰度的中值作為閾值。對(duì)于每幅圖像I,其灰度的中值為thresh,那么轉(zhuǎn)換后的圖像Γ如下其中I' iSr的每個(gè)像素灰度值。 步驟二 計(jì)算主元向量集對(duì)于預(yù)處理后訓(xùn)練集中的所有人臉圖像(m個(gè)),將其全部展開成列向量(η維,η 為圖像的像素?cái)?shù)目),組成人臉圖像集合Xnxm= [I⑴,1(2),...I(m)]。對(duì)X進(jìn)行SVD奇異值分解,即X = USV其中,Pkxn= [U1, U2, . . . Uk]的列向量即為所求的主元向量集,取前k個(gè)作為主元向量集Pkxn = [u1; U2,. . . Uk],它們是正交的,并且X在這些方向上的方差最大,如圖2所示。 后面的乘積SV的每一列表示X的每一列在這些主元向量集上的投影坐標(biāo)。因此,我們可以在Pkxn = [u1; u2, . . . Uk]所構(gòu)成的低維向量空間上表達(dá)人臉圖像。 步驟三計(jì)算人臉集和非人臉集在主元向量集上的投影坐標(biāo)對(duì)于非人臉集,按照步驟二中同樣的方法將其組成矩陣Y,人臉集和非人臉集在主元向量集上的投影坐標(biāo)分別計(jì)算如下人臉Projface= PtX非人臉Projnonface= PtY 步驟四根據(jù)投影訓(xùn)練出支持向量機(jī)模型在主元向量集P所構(gòu)成的向量空間中,屬于人臉的點(diǎn)標(biāo)記為I,非人臉的點(diǎn)標(biāo)記為-1,目的是需要找出一個(gè)超平面f(x) =wTx+b = 0,使得對(duì)于f(x) <0的點(diǎn)為非人臉, 反之為人臉。通過(guò)對(duì)如下優(yōu)化問(wèn)題的求解max 夂 s.t. y(l)(wrx(l) +b) = > γ, / = 1.+ .2 即可找到一個(gè)最優(yōu)的超平面,如圖3所示的最優(yōu)超平面,它能夠區(qū)分兩類數(shù)據(jù),并
5且到兩類數(shù)據(jù)的距離最遠(yuǎn),其中.
r=/W, Irll2.基于主元分析的人臉檢測(cè)檢測(cè)階段本階段對(duì)測(cè)試的圖像用支持向量機(jī)模型進(jìn)行分類,若分類的結(jié)果標(biāo)簽為1,那么表明檢測(cè)結(jié)果為人臉,反之為非人臉。下面根據(jù)流程4對(duì)檢測(cè)階段的各個(gè)步驟作以說(shuō)明 步驟一預(yù)處理測(cè)試圖像與訓(xùn)練階段中預(yù)處理相同,先將圖像調(diào)整到與訓(xùn)練階段的大小一致,然后轉(zhuǎn)換為灰度圖像,對(duì)這個(gè)灰度圖像進(jìn)行自適應(yīng)閾值化處理,變?yōu)槎祱D像。 步驟二 計(jì)算測(cè)試圖像在主元向量集上的投影坐標(biāo)將步驟一中的結(jié)果展開成為列向量X,其投影坐標(biāo)計(jì)算如下Projtest = Ρτχ其中P為主元向量集。 步驟三計(jì)算分類結(jié)果對(duì)于步驟二中的投影坐標(biāo),將其帶入訓(xùn)練階段得出的支持向量機(jī)模型,若分類結(jié)果標(biāo)簽為I,則為人臉,反之為非人臉。應(yīng)該理解到的是上述實(shí)施例只是對(duì)本發(fā)明的說(shuō)明,而不是對(duì)本發(fā)明的限制,任何不超出本發(fā)明實(shí)質(zhì)精神范圍內(nèi)的發(fā)明創(chuàng)造,均落入本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.基于主元分析和支持向量機(jī)的人臉檢測(cè)方法,其特征在于在于按以下步驟進(jìn)行1)構(gòu)建人臉?lè)诸惼魍ㄟ^(guò)對(duì)大量不同的經(jīng)過(guò)預(yù)處理過(guò)的人臉樣本的構(gòu)成的向量空間進(jìn)行分析,找出最能表征其向量空間數(shù)據(jù)分布的一組正交基構(gòu)成主元向量集,對(duì)應(yīng)其方差最大的前幾個(gè)方向;對(duì)于人臉樣本以及非人臉樣本,在這組正交基上投影后,利用支持向量機(jī)的方法找出一個(gè)能夠區(qū)分兩類的超平面,從而構(gòu)建一個(gè)人臉?lè)诸惼鳎?)檢測(cè)階段對(duì)于需要測(cè)試的人臉,對(duì)其在主元向量集的投影,利用構(gòu)建好的分類器進(jìn)行判別。
2.如權(quán)利要求I所述的基于主元分析和支持向量機(jī)的人臉檢測(cè)方法,其特征在于步驟I)按以下分步驟進(jìn)行步驟一預(yù)處理訓(xùn)練集把所有用于作為訓(xùn)練的人臉以及非人臉圖像調(diào)整為統(tǒng)一的大小,轉(zhuǎn)換為灰度圖,并使用每幅轉(zhuǎn)換后圖像灰度的中值作為閾值;對(duì)于每幅圖像I,其灰度的中值為thresh,那么轉(zhuǎn)換后的圖像Γ如下其中Γ iSl,的每個(gè)像素灰度值;步驟二 計(jì)算主元向量集對(duì)于預(yù)處理后訓(xùn)練集中的所有m個(gè)人臉圖像,將其全部展開成η維列向量,組成人臉圖像集合Xnxm = [Ι(1), Ι(2), ... I(m)];對(duì)X進(jìn)行SVD奇異值分解如下其中,η為圖像的像素?cái)?shù)目,Pkxn= [u1; u2, ...uk]的列向量即為所求的主元向量集, 取前k個(gè)作為主元向量集Pkxn = [U1, u2, . . . uk],它們是正交的,并且X在這些方向上的方差最大;后面的乘積SV的每一列表示X的每一列在這些主元向量集上的投影坐標(biāo),最終在 Pkxn = [u1; u2, . . . uk]所構(gòu)成的低維向量空間上表達(dá)人臉圖像;步驟三計(jì)算人臉集和非人臉集在主元向量集上的投影坐標(biāo)對(duì)于非人臉集,按照步驟二中同樣的方法將其組成矩陣Y,人臉集和非人臉集在主元向量集上的投影坐標(biāo)分別計(jì)算如下人臉Projface = PtX 非人臉Projnonface P Y步驟四根據(jù)投影訓(xùn)練出支持向量機(jī)模型在主元向量集P所構(gòu)成的向量空間中,屬于人臉的點(diǎn)標(biāo)記為1,非人臉的點(diǎn)標(biāo)記為-1, 目的是需要找出一個(gè)超平面f(x) =wTx+b = 0,使得對(duì)于f(x) <0的點(diǎn)為非人臉,反之為人臉;通過(guò)對(duì)如下優(yōu)化問(wèn)題的求解max γ, s.t. y(l)(wrx(l) + b) = > γ, i = \..2n找到一個(gè)最優(yōu)的超平面,該超平面能夠區(qū)分兩類數(shù)據(jù),并且到兩類數(shù)據(jù)的距離最遠(yuǎn),其
3.如權(quán)利要求I或2所述的基于主元分析和支持向量機(jī)的人臉檢測(cè)方法,其特征在于X = USV步驟2)按以下分步驟進(jìn)行步驟一預(yù)處理測(cè)試圖像與訓(xùn)練階段中預(yù)處理相同,先將圖像調(diào)整到與訓(xùn)練階段的大小一致,然后轉(zhuǎn)換為灰度圖像,對(duì)這個(gè)灰度圖像進(jìn)行自適應(yīng)閾值化處理,變?yōu)槎祱D像;步驟二 計(jì)算測(cè)試圖像在主元向量集上的投影坐標(biāo)首先將步驟一中的結(jié)果展開成為列向量X,其投影坐標(biāo)計(jì)算如下Projtest = Ρτχ 其中P為主元向量集。步驟三計(jì)算分類結(jié)果對(duì)于步驟二中的投影坐標(biāo),將其帶入訓(xùn)練階段得出的支持向量機(jī)模型,若分類結(jié)果標(biāo)簽為1,則為人臉,反之為非人臉。
全文摘要
本發(fā)明涉及一種通用快速的人臉檢測(cè)方法,該方法可以適用于視頻監(jiān)控系統(tǒng),該方法的主要特點(diǎn)是能夠通過(guò)對(duì)輸入圖像區(qū)域進(jìn)行主元分析,同時(shí)用支持向量機(jī)對(duì)分析的中間結(jié)果進(jìn)行分類,從而能夠達(dá)到快速高效地進(jìn)行人臉檢測(cè)的目的。
文檔編號(hào)G06K9/66GK102592145SQ20111044611
公開日2012年7月18日 申請(qǐng)日期2011年12月28日 優(yōu)先權(quán)日2011年12月28日
發(fā)明者黨路 申請(qǐng)人:浙江大學(xué)