本發(fā)明屬于模式識(shí)別領(lǐng)域,具體涉及計(jì)算機(jī)視覺、模式識(shí)別等相關(guān)理論知識(shí),用于人臉識(shí)別系統(tǒng)。
背景技術(shù):
隨著人們對(duì)快速有效的自動(dòng)身份驗(yàn)證的迫切需求,促使了生物特征識(shí)別技術(shù)的不斷發(fā)展,促進(jìn)了以指紋識(shí)別,虹膜識(shí)別,人臉識(shí)別等為主的生物特征識(shí)別技術(shù)的飛速發(fā)展。
生物特征識(shí)別技術(shù)是指通過計(jì)算機(jī)與光學(xué)、聲學(xué)、生物傳感器和生物統(tǒng)計(jì)學(xué)原理等高科技手段密切結(jié)合,利用人體固有的生理特性和行為特征來(lái)進(jìn)行個(gè)人身份鑒定的新型技術(shù)?,F(xiàn)階段用于生物識(shí)別的生物特征主要有手形、指紋、臉形、虹膜、視網(wǎng)膜、脈搏、耳廓等,基于這些特征,隨著現(xiàn)代電子技術(shù)和各種硬件技術(shù)的發(fā)展,生物特征采集器械和計(jì)算分析器械生產(chǎn)成本的明顯減少,而其精度和速度都成數(shù)量級(jí)地不斷提升,生物特征識(shí)別技術(shù)在取得了長(zhǎng)足的發(fā)展的同時(shí)也得到了廣泛的應(yīng)用。不僅如此,隨著生物特征識(shí)別技術(shù)的不斷發(fā)展,與生物特征識(shí)別技術(shù)相關(guān)領(lǐng)域的數(shù)字圖像處理、計(jì)算機(jī)視覺、模式識(shí)別、傳感器技術(shù)等領(lǐng)域也迎來(lái)了新的發(fā)展研究。
目前,生物特征識(shí)別技術(shù)應(yīng)用最廣泛的是指紋識(shí)別、虹膜識(shí)別,人臉識(shí)別。其中人臉識(shí)別由于無(wú)侵犯性、低成本、易安裝、無(wú)人工參與等優(yōu)點(diǎn)使得人臉識(shí)別技術(shù)得到了廣泛的研究與應(yīng)用。
在人臉識(shí)別的實(shí)際過程中,由于待檢測(cè)的人臉圖像常常受光照,遮擋,表情以及人臉偏轉(zhuǎn)角度等一些非穩(wěn)定性因素的影響,使得人臉識(shí)別的精準(zhǔn)度不太理想;同時(shí)由于提取的人臉特征是后面人臉匹配的關(guān)鍵性數(shù)據(jù),直接關(guān)系到整個(gè)識(shí)別系統(tǒng)的可行性,因而一個(gè)面對(duì)復(fù)雜場(chǎng)景下,魯棒性好,準(zhǔn)確率高,實(shí)時(shí)性好的人臉識(shí)別算法顯得尤為重要。
經(jīng)過幾十年的研究,研究者們提出了大量人臉識(shí)別算法,其中比較主要的識(shí)別算法有:
一、基于幾何特征的方法。幾何特征最早是用于人臉側(cè)面輪廓的描述與識(shí)別,首先根據(jù)側(cè)面輪廓曲線確定若干顯著點(diǎn),并由這些顯著點(diǎn)導(dǎo)出一組用于識(shí)別的特征度量如距離、角度等,然后由正面灰度圖中線附近的積分投影模擬側(cè)面輪廓圖。采用幾何特征進(jìn)行正面人臉識(shí)別一般是通過提取人眼、口、鼻等重要特征點(diǎn)的位置和眼睛等重要器官的幾何形狀作為分類特征。然而這種方法存在兩個(gè)問題,一是能量函數(shù)中各種代價(jià)的加權(quán)系數(shù)只能由經(jīng)驗(yàn)確定,難以推廣,二是能量函數(shù)優(yōu)化過程十分耗時(shí),難以實(shí)際應(yīng)用。
二、特征臉方法(Eigenface或PCA),也稱為基于主成分分析(principal component analysis,簡(jiǎn)稱PCA)的人臉識(shí)別方法。其基本思想是:從統(tǒng)計(jì)的觀點(diǎn),尋找人臉圖像分布的基本元素,即人臉圖像樣本集協(xié)方差矩陣的特征向量,以此近似地表征人臉圖像。這些特征向量稱為特征臉(Eigenface)。特征臉反映了隱含在人臉樣本集合內(nèi)部的信息和人臉的結(jié)構(gòu)關(guān)系。將眼睛、面頰、下頜的樣本集協(xié)方差矩陣的特征向量稱為特征眼、特征頜和特征唇,統(tǒng)稱特征子臉。特征子臉在相應(yīng)的圖像空間中生成子空間,稱為子臉空間。計(jì)算出測(cè)試圖像窗口在子臉空間的投影距離,若窗口圖像滿足閾值比較條件,則判斷其為人臉。特征臉方法是一種簡(jiǎn)單、快速、實(shí)用的基于變換系數(shù)特征的算法,但由于它在本質(zhì)上依賴于訓(xùn)練集和測(cè)試集圖像的灰度相關(guān)性,而且要求測(cè)試圖像與訓(xùn)練集比較像,所以它有著很大的局限性。
三、神經(jīng)網(wǎng)絡(luò)方法(Neural Networks,Net)。神經(jīng)網(wǎng)絡(luò)方法在人臉識(shí)別上的應(yīng)用比起前述幾類方法來(lái)有一定的優(yōu)勢(shì),因?yàn)閷?duì)人臉識(shí)別的許多規(guī)律或規(guī)則進(jìn)行顯性的描述是相當(dāng)困難的,而神經(jīng)網(wǎng)絡(luò)方法則可以通過學(xué)習(xí)的過程獲得對(duì)這些規(guī)律和規(guī)則的隱性表達(dá),它的適應(yīng)性更強(qiáng),一般也比較容易實(shí)現(xiàn)。神經(jīng)網(wǎng)絡(luò)方法通常需要將人臉作為一個(gè)一維向量輸入,因此輸入節(jié)點(diǎn)龐大,其識(shí)別重要的一個(gè)目標(biāo)就是降維處理。
以上的人臉識(shí)別算法都已日趨成熟,但對(duì)于光照,表情,環(huán)境變化,偏轉(zhuǎn)角度等復(fù)雜場(chǎng)景下的魯棒性還有待提高,同時(shí)其識(shí)別的精度和算法運(yùn)行的速度這一矛盾性問題也有待改善。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的發(fā)明目的在于:針對(duì)上述存在的問題,提供一種適用于復(fù)雜場(chǎng)景且計(jì)算復(fù)雜度低的基于PCANet的人臉特征提取的人臉識(shí)別方法。
PCANet可以被看作是最簡(jiǎn)單的卷積深度學(xué)習(xí)網(wǎng)絡(luò),PCANet的核心是利用PCA(特征臉方法)來(lái)學(xué)習(xí)多階段的濾波器。PCANet提取輸入圖像的圖像特征的過程可以分為三部分:PCA濾波器,二值哈希,分塊直方圖。其中PCA被用于學(xué)習(xí)多級(jí)濾波器,然后用binary hashing和block histograms分別做索引和合并,最后得出每一張輸入圖像的圖像特征,即將每幅圖像的特征化為1x n維的圖像特征向量。
本發(fā)明的基于PCANet的人臉識(shí)別方法包括下列步驟:
步驟1:圖像預(yù)處理。
對(duì)待識(shí)別圖像進(jìn)行灰度轉(zhuǎn)化,然后對(duì)得到的灰度圖進(jìn)行灰度增強(qiáng)處理,如利用直方圖均衡和圖像平滑去噪進(jìn)行灰度增強(qiáng)處理,灰度增強(qiáng)處理主要針對(duì)光線太暗和光照太強(qiáng)的圖片,從而削弱光照對(duì)后續(xù)結(jié)果的影響。
步驟2:人臉檢測(cè)。
對(duì)圖像預(yù)處理后的待識(shí)別圖像,進(jìn)行多角度人臉檢,以判斷當(dāng)前圖像是否存在人臉,以便于判斷是否進(jìn)行后續(xù)步驟。例如采用基于Adaboost方式的多角度人臉檢測(cè),,盡可能的把不同角度不同姿勢(shì)條件的人臉區(qū)域得到一個(gè)準(zhǔn)確的劃分,提供一個(gè)精確和高效的人臉定位,以提高后續(xù)識(shí)別步驟的效率。和傳統(tǒng)的人臉檢測(cè)方法相比,本發(fā)明可以準(zhǔn)確檢測(cè)到同一圖像幀里的多張人臉,并且基于Adaboost方式(角度范圍為0~45°)的多角度人臉檢測(cè),可以準(zhǔn)確有效的檢測(cè)到30度偏轉(zhuǎn)范圍內(nèi)的人臉,甚至是在45度偏轉(zhuǎn)范圍內(nèi)都有高效準(zhǔn)確的檢測(cè)結(jié)果,從而在很大程度上克服了傳統(tǒng)方法在多人臉檢測(cè)中不能準(zhǔn)確處理人臉角度偏轉(zhuǎn)的問題。
步驟3:人臉校正。
基于眉毛、眼睛、鼻子、嘴巴為基準(zhǔn),從標(biāo)準(zhǔn)正面人臉圖形中選取多個(gè)人臉特征點(diǎn),以所選取的人臉特征點(diǎn)的位置分布信息構(gòu)建人臉特征點(diǎn)的標(biāo)準(zhǔn)位置信息??梢酝ㄟ^大量標(biāo)準(zhǔn)正面人臉圖形的人臉特征點(diǎn)的位置分布信息統(tǒng)計(jì),得到人臉特征點(diǎn)的標(biāo)準(zhǔn)位置信息。
在比對(duì)檢測(cè)到的人臉過程中,以人臉特征點(diǎn)的標(biāo)準(zhǔn)位置信息進(jìn)行旋轉(zhuǎn)重建,實(shí)現(xiàn)人臉的校正,使得多角度人臉檢測(cè)的情況下得到正面人臉,從而使得后續(xù)的人臉匹配變得更加準(zhǔn)確高效;另外,基于構(gòu)建的標(biāo)準(zhǔn)位置信息進(jìn)行人臉校正的處理方式,和傳統(tǒng)的人臉校正模式相比,在很大程度上也減輕了本發(fā)明在人臉校正過程中的數(shù)據(jù)處理量。
步驟4:人臉匹配。
在步驟3處理后,得到了標(biāo)準(zhǔn)的人臉圖形(正面人臉圖像),然后再根據(jù)PCANet的特征提取方式,對(duì)待識(shí)別人臉圖像(正面人臉圖像)進(jìn)行特征提取。在特征提取時(shí),與現(xiàn)有的對(duì)整幅圖像直接采用PCANet的方式不同,本發(fā)明先對(duì)待識(shí)別人臉圖像基于面部器官對(duì)待識(shí)別人臉圖像進(jìn)行圖像分塊,將其劃分為不同的人臉區(qū)域,然后再使用PCANet分別提取各圖像塊(人臉區(qū)域)的人臉特征,由同一待識(shí)別人臉圖像的所有圖像塊的人臉特征構(gòu)成待識(shí)別圖像的人臉特征數(shù)據(jù),簡(jiǎn)稱待識(shí)別人臉特征數(shù)據(jù)。
采用遍歷匹配的方式,將待識(shí)別人臉特征數(shù)據(jù)與人臉數(shù)據(jù)庫(kù)中的人臉特征數(shù)據(jù)進(jìn)行人臉匹配,取最優(yōu)匹配作為人臉識(shí)別結(jié)果。例如取人臉數(shù)據(jù)庫(kù)中的所有人臉特征數(shù)據(jù)中,與待識(shí)別人臉特征數(shù)據(jù)的卡方距離最小的作為最優(yōu)匹配。其中,人臉數(shù)據(jù)庫(kù)中的人臉特征數(shù)據(jù)也是基于分塊的方式得到,即先將人臉圖像基于面部器官進(jìn)行圖像分塊,再使用PCANet分別提取各圖像塊的人臉特征得到各人臉圖像的人臉特征數(shù)據(jù)。且人臉數(shù)據(jù)庫(kù)中的人臉特征數(shù)據(jù)的讀寫方式為:序列化的寫和反序列化的讀,即采用google開源的protocol buffer交換技術(shù)。對(duì)人臉數(shù)據(jù)庫(kù)中的人臉特征數(shù)據(jù)進(jìn)行序列化處理,使得在匹配過程中,直接進(jìn)行二進(jìn)制流的讀寫,從而減少了原始數(shù)據(jù)到字節(jié)流數(shù)據(jù)轉(zhuǎn)換過程中的時(shí)間開銷。
另外,為了進(jìn)一步的保證識(shí)別的精度,通過預(yù)設(shè)閾值(經(jīng)驗(yàn)值,取決于實(shí)際應(yīng)用場(chǎng)合),當(dāng)最優(yōu)匹配與與待識(shí)別人臉特征數(shù)據(jù)的卡方距離小于或等于預(yù)設(shè)閾值時(shí),則認(rèn)為匹配準(zhǔn)確,將最優(yōu)匹配作為人臉識(shí)別結(jié)果;否則,認(rèn)為人臉識(shí)別失敗,即當(dāng)前待識(shí)別人臉圖像無(wú)法識(shí)別。
本發(fā)明在提取圖像特征時(shí)的,基于分塊思想的PCANet處理模式,可以針對(duì)不同的人臉區(qū)域提取更具表達(dá)性的人臉特征,從而得到更加高的識(shí)別率,同時(shí)由于多次對(duì)不同人臉區(qū)域使用PCA降維技術(shù)最后得到的特征數(shù)據(jù)維度比現(xiàn)有的人臉識(shí)別方法更低,很大程度上減少了識(shí)別處理的計(jì)算時(shí)間和存儲(chǔ)空間的開銷。同時(shí)在人臉匹配的過程中,由于每一個(gè)比對(duì)人臉的特征數(shù)據(jù)信息保存為一個(gè)1*n的矩陣數(shù)據(jù),而n的取值通常都在104或以上數(shù)量級(jí),所以數(shù)據(jù)庫(kù)中用于匹配待識(shí)別人臉特征數(shù)據(jù)的人臉的數(shù)據(jù)量非常龐大,本發(fā)明在確保人臉匹配的高準(zhǔn)確率的同時(shí),通過對(duì)所有數(shù)據(jù)庫(kù)中的人臉特征數(shù)據(jù)在讀寫人臉特征數(shù)據(jù)文件時(shí)采用google開源的protocol buffer交換技術(shù),進(jìn)一步減少了匹配處理的時(shí)間開銷,加快識(shí)別速度,從而使得整個(gè)人臉匹配過程時(shí)間的開銷達(dá)到毫秒級(jí)別的水平。
綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
(1)本發(fā)明采用散列化的特征提取方式(在不同的人臉區(qū)域分別使用PCANet進(jìn)行人臉特征提取),可以針對(duì)不同的人臉區(qū)域提取更具表達(dá)性的人臉特征;同時(shí)由于多次對(duì)不同人臉區(qū)域使用PCA降維技術(shù),使得最后得到的特征數(shù)據(jù)維度比現(xiàn)有的對(duì)整幅圖像直接采用PCANet的特征提取方式更低,降低了識(shí)別處理的時(shí)間和存儲(chǔ)空間開銷;
(2)在人臉檢測(cè)過程中,采用多角度的人臉檢測(cè)方式,同時(shí)為了確保后續(xù)識(shí)別的高準(zhǔn)確性,加入了基于眼睛、鼻子、嘴巴的標(biāo)準(zhǔn)正面人臉位置校正方式,使得整個(gè)識(shí)別處理更加貼合于實(shí)際應(yīng)用。
(3)在匹配時(shí),對(duì)數(shù)據(jù)庫(kù)的人臉特征數(shù)據(jù)采用序列化的寫和反序列化的讀,進(jìn)一步降低了識(shí)別處理的時(shí)間開銷,使得本發(fā)明的識(shí)別處理的時(shí)間效率達(dá)到毫秒級(jí)的水平。
附圖說明
圖1是本發(fā)明的實(shí)現(xiàn)流程圖;
圖2是本發(fā)明的人臉特征點(diǎn)標(biāo)注示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合實(shí)施方式和附圖,對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述。
參見圖1,本發(fā)明的基于PCANet的人臉識(shí)別方法主要包括:圖像預(yù)處理、人臉檢測(cè)、人臉校正、人臉特征提取、人臉匹配。
對(duì)于輸入的待識(shí)別圖像(前端視頻流或是圖片集的輸入數(shù)據(jù))首先進(jìn)行圖像預(yù)處理后,進(jìn)行人臉檢測(cè),若存在人臉,則進(jìn)一步判斷其是否為正面人臉圖像,若是,則直接進(jìn)行人臉特征提?。环駝t,先進(jìn)行旋轉(zhuǎn)校正后再進(jìn)行人臉特征提取。
在在進(jìn)行人臉校正處理時(shí),本發(fā)明基于標(biāo)準(zhǔn)正面人臉圖像的面部器官特征點(diǎn)的位置分布信息,構(gòu)建人臉特征點(diǎn)的標(biāo)準(zhǔn)位置信息。如圖2所示,共設(shè)置有49個(gè)面部器官特征點(diǎn),左右眉毛分別設(shè)置5個(gè)特征點(diǎn):眉頭、眉尾、標(biāo)識(shí)眉毛的3個(gè)特征點(diǎn),左右眼睛分別設(shè)置6個(gè)特征點(diǎn):2個(gè)眼角、標(biāo)識(shí)上下眼瞼的2個(gè)特征點(diǎn),鼻子設(shè)置9個(gè)特征點(diǎn):標(biāo)識(shí)鼻梁的4個(gè)特征點(diǎn)、標(biāo)識(shí)鼻頭的5個(gè)特征點(diǎn),嘴巴設(shè)置18個(gè)特征點(diǎn):左右嘴角、上下嘴唇輪廓分別設(shè)置8個(gè)特征點(diǎn)。圖2中的嘴巴特征點(diǎn)為張開狀態(tài),若為閉合狀態(tài),可以對(duì)應(yīng)減少特征點(diǎn)個(gè)數(shù),即閉合狀態(tài)時(shí),標(biāo)識(shí)上下嘴唇內(nèi)輪廓的特征點(diǎn)可能存在重疊,則可去冗余,以減少特征點(diǎn)個(gè)數(shù)。
然后將非正面的待識(shí)別人臉圖像,基于49個(gè)人臉特征點(diǎn)的標(biāo)準(zhǔn)位置信息,進(jìn)行旋轉(zhuǎn)校正,得到正面的待識(shí)別人臉圖像。
然后對(duì)待識(shí)別人臉圖像,先劃分為不同的人臉區(qū)域,如分別包括眉毛、眼睛、鼻子、嘴巴的人臉子區(qū)域,然后對(duì)人臉子區(qū)域采用PCANet方式進(jìn)行人臉特征提取后,與本地?cái)?shù)據(jù)庫(kù)中的人臉特征數(shù)據(jù)進(jìn)行匹配比對(duì),得到識(shí)別結(jié)果。
例如,從Purdue大學(xué)的AR人臉庫(kù)中隨機(jī)選取100個(gè)人,每人14張?jiān)诓煌庹?,不同表情的人臉圖片作為測(cè)試集,即測(cè)試集為100*14。本地?cái)?shù)據(jù)庫(kù)的規(guī)模為100*7,即目標(biāo)對(duì)象100人,每人有7張目標(biāo)匹配圖像。
通過本發(fā)明的PCANet的人臉識(shí)別方法,對(duì)上述測(cè)試集進(jìn)行測(cè)試驗(yàn)證,其測(cè)試結(jié)果為:
識(shí)別總?cè)藬?shù):700,識(shí)別失敗人數(shù):36,識(shí)別率:95%;識(shí)別總時(shí)間:218秒,識(shí)別平均時(shí)間:0.311429秒;因此,本發(fā)明識(shí)別準(zhǔn)確率高,魯棒性和識(shí)別效率良好。
以上所述,僅為本發(fā)明的具體實(shí)施方式,本說明書中所公開的任一特征,除非特別敘述,均可被其他等效或具有類似目的的替代特征加以替換;所公開的所有特征、或所有方法或過程中的步驟,除了互相排斥的特征和/或步驟以外,均可以任何方式組合。