一種基于深度學(xué)習(xí)的人臉識別門禁方法及系統(tǒng)與流程

文檔序號：12552040閱讀：483來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>核算裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及電子設(shè)備技術(shù)領(lǐng)域，更具體地說，涉及一種基于深度學(xué)習(xí)的人臉識別門禁方法及系統(tǒng)。

背景技術(shù)：

隨著人們生活水平的提高，人們更加注重家居環(huán)境的安全，安防觀念不斷加強(qiáng)；伴隨著這種需求的提高，智能門禁系統(tǒng)應(yīng)運(yùn)而生，越來越多的企業(yè)、商鋪、家庭都安裝了各種各樣的門禁系統(tǒng)。

當(dāng)前比較普遍使用的門禁系統(tǒng)不外乎視頻門禁、密碼門禁、射頻門禁或指紋門禁等等。其中，視頻門禁只是簡單地把視頻信息傳送給用戶，并無多少智能化，本質(zhì)上離不開“人防”，用戶不在場時并不能絕對保障家居安全；密碼門禁最大的硬傷是，密碼容易忘記，并且容易破解；射頻門禁的缺點(diǎn)則是“認(rèn)卡不認(rèn)人”，射頻卡容易丟失及易被他人盜用；另外，指紋門禁的安全隱患則是指紋容易復(fù)制。因此，現(xiàn)有技術(shù)中提供的上述門禁系統(tǒng)均對應(yīng)原因存在安全性較低的問題。

綜上所述，如何提供一種安全性較高的門禁系統(tǒng)對應(yīng)技術(shù)方案，是目前本領(lǐng)域技術(shù)人員亟待解決的問題。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明的目的是提供一種基于深度學(xué)習(xí)的人臉識別門禁方法及系統(tǒng)，以保證門禁系統(tǒng)具有較高的安全性。

為了實(shí)現(xiàn)上述目的，本發(fā)明提供如下技術(shù)方案：

一種基于深度學(xué)習(xí)的人臉識別門禁方法，包括：

接收門禁消除請求，判斷所述門禁消除請求是否由指定終端發(fā)送，如果否，則確定所述門禁消除請求由圖像采集終端發(fā)送；

獲取所述圖像采集終端采集的與所述門禁消除請求對應(yīng)的圖像信息，利用深度學(xué)習(xí)人臉識別算法對所述圖像信息進(jìn)行人臉識別，得到對應(yīng)的人臉識別結(jié)果；

判斷所述人臉識別結(jié)果是否對應(yīng)預(yù)設(shè)人臉，如果是，則指示門禁系統(tǒng)消除門禁，如果否，則拒絕消除門禁。

優(yōu)選的，獲取所述圖像采集終端采集的與所述門禁消除請求對應(yīng)的圖像信息之后，還包括：

利用深度學(xué)習(xí)照片識別算法對所述圖像信息進(jìn)行識別，如果識別出所述圖像信息為對真實(shí)的人臉進(jìn)行拍攝得到的，則執(zhí)行所述利用深度學(xué)習(xí)人臉識別算法對所述圖像信息進(jìn)行人臉識別的步驟，如果識別出所述圖像信息為對照片的人臉進(jìn)行拍攝得到的，則拒絕對所述圖像信息進(jìn)行人臉識別。

優(yōu)選的，還包括：

如果所述人臉識別結(jié)果不對應(yīng)預(yù)設(shè)人臉或者所述圖像信息為對照片的人臉進(jìn)行拍攝得到的，則發(fā)送攜帶有所述人臉識別結(jié)果或所述圖像信息的警報信息至所述指定終端。

優(yōu)選的，發(fā)送攜帶有所述人臉識別結(jié)果或所述圖像信息的警報信息至所述指定終端之后，還包括：

獲取所述指定終端接收到所述警報信息后返回的命令信息，執(zhí)行所述命令信息并將所述命令信息及對應(yīng)的人臉識別結(jié)果或圖像信息進(jìn)行存儲，以在再檢測到存儲的所述人臉識別結(jié)果或所述圖像信息時執(zhí)行對應(yīng)的命令信息。

優(yōu)選的，還包括：

如果所述人臉識別結(jié)果不對應(yīng)預(yù)設(shè)人臉或者為對照片的人臉進(jìn)行拍攝得到的，則向外界顯示驗(yàn)證失敗的信息。

優(yōu)選的，還包括：

如果所述門禁消除請求是由所述指定終端發(fā)送的，則指示所述門禁系統(tǒng)消除門禁。

優(yōu)選的，還包括：

利用人體紅外感應(yīng)器判斷是否有人進(jìn)入指定區(qū)域內(nèi)，如果是，則指示所述圖像采集終端進(jìn)入正常工作模式并進(jìn)行圖像信息的采集，如果否，則指示所述圖像采集終端保持預(yù)先設(shè)定的默認(rèn)休眠模式。

優(yōu)選的，獲取所述圖像采集終端采集的與所述門禁消除請求對應(yīng)的圖像信息之后，還包括：

將所述圖像信息中包含的CCD圖像信息及紅外圖像信息進(jìn)行融合，執(zhí)行所述利用深度學(xué)習(xí)人臉識別算法對所述圖像信息進(jìn)行人臉識別的步驟。

優(yōu)選的，利用深度學(xué)習(xí)人臉識別算法對所述圖像信息進(jìn)行人臉識別，包括：

利用基于GPU實(shí)現(xiàn)的深度學(xué)習(xí)人臉識別算法對所述圖像信息進(jìn)行人臉識別。

一種基于深度學(xué)習(xí)的人臉識別門禁系統(tǒng)，包括：

第一判斷模塊，用于：接收門禁消除請求，判斷所述門禁消除請求是否由指定終端發(fā)送，如果否，則確定所述門禁消除請求由圖像采集終端發(fā)送；

圖像處理模塊，用于：獲取所述圖像采集終端采集的與所述門禁消除請求對應(yīng)的圖像信息，利用深度學(xué)習(xí)人臉識別算法對所述圖像信息進(jìn)行人臉識別，得到對應(yīng)的人臉識別結(jié)果；

第二判斷模塊，用于：判斷所述人臉識別結(jié)果是否對應(yīng)預(yù)設(shè)人臉，如果是，則指示門禁系統(tǒng)消除門禁，如果否，則拒絕消除門禁。

本發(fā)明提供了一種基于深度學(xué)習(xí)的人臉識別門禁方法及系統(tǒng)，其中該方法包括：接收門禁消除請求，判斷所述門禁消除請求是否由指定終端發(fā)送，如果否，則確定所述門禁消除請求由圖像采集終端發(fā)送；獲取所述圖像采集終端采集的與所述門禁消除請求對應(yīng)的圖像信息，利用深度學(xué)習(xí)人臉識別算法對所述圖像信息進(jìn)行人臉識別，得到對應(yīng)的人臉識別結(jié)果；判斷所述人臉識別結(jié)果是否對應(yīng)預(yù)設(shè)人臉，如果是，則指示門禁系統(tǒng)消除門禁，如果否，則拒絕消除門禁。本申請公開的技術(shù)特征中，當(dāng)門禁消除請求是由圖像采集終端發(fā)送時，對該門禁消除系統(tǒng)對應(yīng)的圖像信息進(jìn)行深度學(xué)習(xí)人臉識別算法的識別，從而判斷出圖像信息的人臉識別結(jié)果是否對應(yīng)預(yù)設(shè)人臉，如果是，則說明圖像信息對應(yīng)人臉的主人具有消除門禁的權(quán)限，此時指示門禁系統(tǒng)消除門禁，否則，則說明圖像信息對應(yīng)人臉的主人不具有消除門禁的權(quán)限，此時拒絕消除門禁，由于人臉可以唯一的標(biāo)識一個人且不易偽造，因此本申請中通過人臉識別實(shí)現(xiàn)對門禁系統(tǒng)的控制，大大提高了門禁系統(tǒng)的安全性。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的實(shí)施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)提供的附圖獲得其他的附圖。

圖1為本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法的流程圖；

圖2為本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法中深度學(xué)習(xí)人臉識別算法的算法結(jié)構(gòu)圖；

圖3為本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法中深度學(xué)習(xí)人臉識別算法的模型圖；

圖4為本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法中圖像融合算法的架構(gòu)圖；

圖5為本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法中圖像融合算法的流程圖；

圖6為本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁系統(tǒng)的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

請參閱圖1，其示出了本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法的流程圖，可以包括：

S11：接收門禁消除請求，判斷門禁消除請求是否由指定終端發(fā)送，如果否，則確定門禁消除請求由圖像采集終端發(fā)送。

其中指定終端一般對應(yīng)門禁系統(tǒng)的主人，或者是其他預(yù)先設(shè)定的對門禁系統(tǒng)具有控制權(quán)限的人的終端，如果門禁消除系統(tǒng)不是由指定終端發(fā)送的，則說明圖像采集終端采集到了來訪人員的圖像信息進(jìn)而發(fā)送了門禁消除請求，此時需要獲取采集的圖像信息并判斷該圖像信息對應(yīng)來訪人員是否可以實(shí)現(xiàn)對門禁系統(tǒng)的控制。

S12：獲取圖像采集終端采集的與門禁消除請求對應(yīng)的圖像信息，利用深度學(xué)習(xí)人臉識別算法對圖像信息進(jìn)行人臉識別，得到對應(yīng)的人臉識別結(jié)果。

S13：判斷人臉識別結(jié)果是否對應(yīng)預(yù)設(shè)人臉，如果是，則指示門禁系統(tǒng)消除門禁，如果否，則拒絕消除門禁。

利用深度學(xué)習(xí)人臉識別算法對圖像信息進(jìn)行人臉識別，如果識別得到的人臉識別結(jié)果表明來訪人員對應(yīng)預(yù)設(shè)人臉，則說明來訪人員具有控制門禁系統(tǒng)的權(quán)限，此時指示門禁系統(tǒng)消除門禁，也即指示門禁系統(tǒng)打開門鎖，允許來訪人員入內(nèi)，否則，則說明來訪人員不具有控制門禁系統(tǒng)的權(quán)限，此時拒絕消除門禁。其中預(yù)設(shè)人臉為對門禁系統(tǒng)具有控制權(quán)限的人的人臉信息。

本申請公開的技術(shù)特征中，當(dāng)門禁消除請求是由圖像采集終端發(fā)送時，對該門禁消除系統(tǒng)對應(yīng)的圖像信息進(jìn)行深度學(xué)習(xí)人臉識別算法的識別，從而判斷出圖像信息的人臉識別結(jié)果是否對應(yīng)預(yù)設(shè)人臉，如果是，則說明圖像信息對應(yīng)人臉的主人具有消除門禁的權(quán)限，此時指示門禁系統(tǒng)消除門禁，否則，則說明圖像信息對應(yīng)人臉的主人不具有消除門禁的權(quán)限，此時拒絕消除門禁，由于人臉可以唯一的標(biāo)識一個人且不易偽造，因此本申請中通過人臉識別實(shí)現(xiàn)對門禁系統(tǒng)的控制，大大提高了門禁系統(tǒng)的安全性。

此外，本申請公開的技術(shù)方案采用當(dāng)前最先進(jìn)的基于深度學(xué)習(xí)人臉識別算法實(shí)現(xiàn)圖像信息的識別，與當(dāng)前使用較多的算法如PCA、SVM、LBP相比，深度學(xué)習(xí)對身份特征的識別準(zhǔn)確率更高，甚至超過了人的肉眼識別率，因此本申請公開的技術(shù)方案還具有人臉識別準(zhǔn)確率高的特點(diǎn)，進(jìn)一步提高了門禁系統(tǒng)的安全性。

另外需要說明的是本申請公開的技術(shù)方案中，側(cè)重于人臉驗(yàn)證而不是人臉識別，從而可以有效的減小類間差異，很容易擴(kuò)展到其他應(yīng)用，并且跨數(shù)據(jù)庫有效；當(dāng)數(shù)據(jù)塊中的類別越多時，其泛化能力也越強(qiáng)。具體來說，本申請所關(guān)注的領(lǐng)域是人臉識別的子領(lǐng)域——人臉驗(yàn)證，簡單來說就是判斷兩張圖片是不是同一個人。這樣一來，人臉驗(yàn)證問題很容易就可以轉(zhuǎn)化成人臉識別問題，人臉識別就是進(jìn)行多次人臉驗(yàn)證。使用深度學(xué)習(xí)方法學(xué)習(xí)到一組高維特征表示的集合用于人臉驗(yàn)證，然后通過進(jìn)行一個多類分類的人臉識別任務(wù)來學(xué)習(xí)特征，并把特征泛化到人臉驗(yàn)證和其他未曾識別過的新的身份驗(yàn)證。身份特征取自最后一個隱藏層的激活值。同時，對所有的身份進(jìn)行多類分類，而不是二類分類，這是基于兩個考慮：一是，把一個訓(xùn)練樣本訓(xùn)練成多個類中的一類，比進(jìn)行二類分類更加困難，這個挑戰(zhàn)能夠充分利用神經(jīng)網(wǎng)絡(luò)的超級學(xué)習(xí)能力以提取有效特征；二是，隱含地在卷積神經(jīng)網(wǎng)絡(luò)上增加了強(qiáng)規(guī)則化，有助于產(chǎn)生對分類有效的共享隱藏層表示。因此，學(xué)習(xí)到的特征有很好的泛化能力。本發(fā)明提供的上述算法架構(gòu)可以如圖2所示。

本申請的識別部分算法主要由深度卷積神經(jīng)網(wǎng)絡(luò)和判別分類器組成，具體可以如圖3所示，其中模型參數(shù)如下：

第一層卷積層：卷積核大小4×4，通道數(shù)為3；輸出特征圖大小為36×36，共20個通道。

第一層池化層：核大小為2×2；輸出采樣圖像大小為18×18，共20個通道。

第二層卷積層：卷積核大小3×3，通道數(shù)為20；輸出特征圖大小為16×16，共40個通道。

第二層池化層：核大小為2×2；輸出采樣圖像大小為8×8，共40個通道。

第三層卷積層：卷積核大小3×3，通道數(shù)為40；輸出特征圖大小為6×6，共80個通道。

第三層池化層：核大小為2×2；輸出采樣圖像大小為3×3，共80個通道。

第一個全連接層：使用Maxout激活函數(shù)，輸出160維向量。

第二個全連接層：使用Maxout激活函數(shù)，輸出160維向量。

該模型輸入一個39×39×3的RGB三通道彩色人臉圖像，首先經(jīng)過第一層卷積層進(jìn)行特征提取。卷積層提取特征圖的公式是：

f_ij＝sigmoid((W*x)_ij+b)

上述公式意指特征圖的i行j列像素是由卷積核與輸入圖像的每個通道的相同位置的卷積結(jié)果相加再取激活值。其中，W為神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)，b為偏置項(xiàng)參數(shù)，激活函數(shù)為sigmoid(z)＝1/(1+e^-z)。局部卷積操作相比全連接更容易感知到局部特征，尤其對人臉的五官特征，能夠敏感地提取出來，并且能大大減少權(quán)重參數(shù)。但是如此，權(quán)重參數(shù)仍然過多，容易發(fā)生過擬合，不易于學(xué)習(xí)特征，需要進(jìn)一步減少參數(shù)，于是在卷積層之后輸入池化層(也稱采樣層)。池化層意指特征圖中的局部區(qū)域使用同一個參數(shù)，能有效減少參數(shù)。這里使用最大值池化法，采樣公式如下：

其中p_ij是池化后的輸出圖像，x_ij是輸入圖像，上式中的最大值函數(shù)目的是求池化核范圍內(nèi)的最大像素值點(diǎn)，同一池化區(qū)域內(nèi)的像素共享同一個權(quán)重參數(shù)。這樣不僅取得了更低維度的特征，而且可以避免發(fā)生過擬合的問題。

其中卷積網(wǎng)絡(luò)較一般神經(jīng)網(wǎng)絡(luò)在圖像處理方面有如下優(yōu)點(diǎn)：

·輸入圖像和網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)能更好地吻合。

·特征提取和模式分類同時進(jìn)行，并同時在訓(xùn)練中產(chǎn)生。

·權(quán)重共享可以減少網(wǎng)絡(luò)的訓(xùn)練參數(shù)，使神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)變得更簡單，適應(yīng)性更強(qiáng)。

相比傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)，本發(fā)明使用多層感知器+卷積代替了原來的純卷積層。因?yàn)榫矸e是線性運(yùn)算，不易于學(xué)習(xí)非線性特征，而多層感知器學(xué)習(xí)非線性函數(shù)的能力很強(qiáng)?；谶@個思想，在原來的卷積層之前添加一個多層感知器，整合每個通道之間的信息，以提高模型的泛化能力。在實(shí)踐上，多層感知器可以用1×1的卷積核實(shí)現(xiàn)。另外，本模型的最后兩層全連接層中使用Maxout激活函數(shù)而不再使用sigmoid函數(shù)，原因跟多層感知器的作用類似。Maxout函數(shù)的表達(dá)式是Maxout(x)＝max(W^Tx+b)。Maxout函數(shù)體現(xiàn)的是函數(shù)逼近的思想，用連續(xù)多分片線性函數(shù)去逼近非線性函數(shù)，分片越多，逼近效果越好，對非線性特征的學(xué)習(xí)能力越強(qiáng)。這兩處措施都是為了進(jìn)一步提高模型的泛化能力，增強(qiáng)模型對非線性特征的學(xué)習(xí)能力。該算法第一步提取出一個高維的人臉圖像特征。此后問題成為一個度量學(xué)習(xí)問題，使用基于距離的判別方法對特征進(jìn)行判別，通常使用歐氏距離。對于訓(xùn)練集中屬于同類別(即同一個人)的圖像，希望同類訓(xùn)練集之間的歐氏距離越小越好；反之，希望不同類別的訓(xùn)練集之間的歐氏距離越大越好?；谶@個想法，可以定義一個代價函數(shù)的目標(biāo)就是讓卷積神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)這個代價函數(shù)，從而整體上提高模型的泛化能力。

給定輸入圖像x，訓(xùn)練集中與x屬于同一類(即同一個人，以下稱正類)的圖像x_p，訓(xùn)練集中與x不是同一類(即不是同一個人，以下稱負(fù)類)的圖像x_n，f(x)表示圖像x經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)提取的特征。先在訓(xùn)練集上找出兩個閾值，定義優(yōu)化目標(biāo)函數(shù)為：

約束條件為：

||f(x)-f(x_p)||+α＜||f(x)-f(x_n)||

其中α為f(x)的正類與負(fù)類之間的最大間隔。此優(yōu)化問題目的是求解兩個閾值a，b，設(shè)最優(yōu)解為令當(dāng)||f(x)-f(x_p)||＞a且||f(x)-f(x_n)||＞b時，可以判定x和x_p是同一個人，否則不是同一個人。求解上述問題優(yōu)化后可得到然后就可以定義代價函數(shù)了。的目標(biāo)是同類別訓(xùn)練集之間的歐氏距離最小，不同類別訓(xùn)練集之間的歐氏距離最大。于是可把問題描述為：

把兩個問題整合在一起，得到：

至此，得到了這個代價函數(shù)。這樣就把問題轉(zhuǎn)化為一個無約束凸優(yōu)化問題，這類問題可以直接使用隨機(jī)梯度下降法或者擬牛頓法求解。最后經(jīng)過隨機(jī)梯度下降法或者擬牛頓法所求得的卷積神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)就是最優(yōu)解。

提取出特征之后就變成一個簡單的機(jī)器學(xué)習(xí)問題了。使用SVM模型進(jìn)行人臉驗(yàn)證。對于二類分類問題，SVM模型具有非常良好的表現(xiàn)。SVM方法的主要策略是間隔最大化。從通常意義上來講，在對輸入空間的兩個集合進(jìn)行分類時，總是希望找到一個距離這兩個集合都比較遠(yuǎn)的決策超平面區(qū)分開，這是因?yàn)橐粋€點(diǎn)距離分離超平面的遠(yuǎn)近可以表示分類預(yù)測的確信程度，距離超平面越遠(yuǎn)，作出的分類決策就越準(zhǔn)確。基于這個思想，可以對已經(jīng)從卷積神經(jīng)網(wǎng)絡(luò)中提取出來的特征向量作為訓(xùn)練集去訓(xùn)練一個SVM模型。輸入兩張照片，經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)提取得到兩個特征圖，把這兩個特征圖輸入SVM模型，當(dāng)模型輸出+1時可以判斷兩張圖片屬于同一個人，輸出-1時則表示兩張圖片不屬于同一個人。

另外需要說明的是，本申請中門禁系統(tǒng)的門鎖可以使用電控鎖，具體來說門禁系統(tǒng)中常用的電控鎖包括電插鎖，磁力鎖，電鎖口等。其中，電插鎖主要由鎖體和鎖孔兩個部分組成，鎖體的關(guān)鍵部件是“鎖舌”。該款電鎖正是通過電流的通斷驅(qū)動“鎖舌”的伸縮，同時配合“磁片”以實(shí)現(xiàn)鎖門或開門的功能。也正是因?yàn)椤版i舌”的可伸縮功能，被稱為“電插鎖”。此外，其“暗藏式”的安裝特點(diǎn)適合于對鎖體保密性要求較高的場所。電磁鎖，是一種依靠電磁鐵和鐵塊之間產(chǎn)生吸力來閉合門的電控鎖，是斷電開門式的。通常的型號是280公斤力，由于吸力有限，可能會被多人或力氣大的人用力打開。因此電磁鎖通常用于辦公室內(nèi)部等非高安全級別的場合。若用于諸如監(jiān)獄等安全場合，需定做抗拉力500公斤以上的電磁鎖。因此，本申請可以根據(jù)不同的運(yùn)用場合使用不同類型的電磁鎖。而消除門禁系統(tǒng)即打開門鎖，對應(yīng)的拒絕消除門禁系統(tǒng)即保持門鎖的關(guān)閉狀態(tài)。

本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法，獲取圖像采集終端采集的與門禁消除請求對應(yīng)的圖像信息之后，還可以包括：

利用深度學(xué)習(xí)照片識別算法對圖像信息進(jìn)行識別，如果識別出圖像信息為對真實(shí)的人臉進(jìn)行拍攝得到的，則執(zhí)行利用深度學(xué)習(xí)人臉識別算法對圖像信息進(jìn)行人臉識別的步驟，如果識別出圖像信息為對照片的人臉進(jìn)行拍攝得到的，則拒絕對圖像信息進(jìn)行人臉識別。

需要說明的是本申請中在對圖像信息進(jìn)行處理前會進(jìn)行防止照片或視頻流惡意欺騙，確認(rèn)拍攝的照片內(nèi)容是真人而非人臉照片的步驟。具體來說，現(xiàn)實(shí)生活中有一些不法分子使用有效用戶的照片或者視頻去攻擊人臉識別系統(tǒng)，針對這個問題，以往的一些解決方法是，系統(tǒng)通過語音提示來訪者做出一定的面部動作(比如眨眼、微笑等)加以識別，防止不法分子盜用有效用戶的照片來惡意攻擊。但是，這種方法仍然有嚴(yán)重的安全隱患：不法分子可能還會使用有效用戶的臉部高清視頻流來攻擊系統(tǒng)，另外這些類似方法需要增加額外的硬件設(shè)備，增加系統(tǒng)的成本，且需要用戶作出一定的姿體配合，大大降低用戶的使用效率和體驗(yàn)感。基于這些考慮，提供了一種只對單一照片源的非侵入式實(shí)時判斷真人和照片的方法。

從機(jī)器學(xué)習(xí)的觀點(diǎn)來看，這個問題是最簡單的分類問題——二類分類，即判斷一張人臉照片的內(nèi)容是真人或者照片。設(shè)x是輸入圖像，y是判斷結(jié)果——假設(shè)y＝1表示輸入圖像是真實(shí)人臉，y＝0表示輸入圖像是人臉照片。從光學(xué)成像的角度分析，真實(shí)人臉是具有三維結(jié)構(gòu)的，而人臉照片只有二維結(jié)構(gòu)；人臉照片相對于真實(shí)人臉，缺少了一維信息，其反射光應(yīng)該比較均勻，而真實(shí)人臉的反射光具有隨機(jī)性，屬于漫反射；兩者成像具有不相同的深度信息。利用這個機(jī)理，利用深度卷積網(wǎng)絡(luò)的超強(qiáng)學(xué)習(xí)能力，提取出圖像的深層次特征，就可以對兩種圖像進(jìn)行分類。

本申請公開的深度學(xué)習(xí)照片識別算法的架構(gòu)可以如圖4所示，其中，卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)輸入層、卷積層、池化層、卷積層、池化層、全連接層、Logistic回歸層。其中第一個卷積層的卷積核大小為5×5，通道數(shù)為6；第二個卷積層的卷積核大小為5×5，通道數(shù)為12；兩個池化層窗口大小都是2×2。在這個網(wǎng)絡(luò)架構(gòu)里使用到的所有激活函數(shù)都是sigmoid函數(shù)：

sigmoid(z)＝1/(1+e^-z)

定義這個網(wǎng)絡(luò)要學(xué)習(xí)的假設(shè)函數(shù)是h_W，b(x)，這個函數(shù)有特殊的概率含義，它表示輸出結(jié)果等于1的概率，因此輸入圖像x的輸出結(jié)果為1和0的概率分別為：

P(y＝1|x；W，b)＝h_W，b(x)

P(y＝0|x；W，b)＝1-h_W，b(x)

可以把以上兩式合并成一個等式：

P(y|x；W，b)＝(h_W，b(x))y(1-h_W，b(x))^1-y y＝0，1

對這個等式使用極大似然估計(jì)，即可得到損失函數(shù)：

其中第二項(xiàng)是正則化項(xiàng)，目的是減小權(quán)重的幅度，防止過度擬合。在訓(xùn)練過程中，卷積神經(jīng)網(wǎng)絡(luò)先通過前向傳播根據(jù)上式計(jì)算出誤差，再通過誤差反向傳播計(jì)算偏導(dǎo)數(shù)，從而可以使用梯度下降法調(diào)整參數(shù)。最終算法收斂時的參數(shù)便是最優(yōu)最優(yōu)模型。以上算法能對單一靜態(tài)照片源直接進(jìn)行判斷，相比一些動態(tài)目標(biāo)跟蹤的方法，判斷結(jié)果更可靠，具有更強(qiáng)的實(shí)時性。

本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法，還可以包括：

如果人臉識別結(jié)果不對應(yīng)預(yù)設(shè)人臉或者為對照片的人臉進(jìn)行拍攝得到的，則發(fā)送攜帶有人臉識別結(jié)果或圖像信息的警報信息至指定終端。

通過將警報信息發(fā)送至指定終端，可以由指定終端根據(jù)得到的信息進(jìn)行對應(yīng)的操作，如指定終端對應(yīng)使用者確定出不允許任何其他人消除門禁系統(tǒng)入內(nèi)則可以通過指定終端控制門禁系統(tǒng)的門鎖保持關(guān)閉狀態(tài)，或者如果圖像信息對應(yīng)來訪人員為指定終端對應(yīng)使用者允許消除門禁入門的人員，則可以通過指定終端控制門禁系統(tǒng)的門鎖打開等，從而能夠使得指定終端的使用者實(shí)現(xiàn)對門禁系統(tǒng)的遠(yuǎn)程監(jiān)控，進(jìn)而方便快捷的實(shí)現(xiàn)對應(yīng)的控制。

本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法，發(fā)送攜帶有人臉識別結(jié)果或圖像信息的警報信息至指定終端之后，還可以包括：

獲取指定終端接收到警報信息后返回的命令信息，執(zhí)行命令信息并將命令信息及對應(yīng)的人臉識別結(jié)果或圖像信息進(jìn)行存儲，以在再檢測到存儲的人臉識別結(jié)果或圖像信息時執(zhí)行對應(yīng)的命令信息。

其中命令信息可以包括消除門禁系統(tǒng)、保持門禁系統(tǒng)的門鎖關(guān)閉狀態(tài)或者自動撥號110等，具體可以根據(jù)實(shí)際需要進(jìn)行設(shè)定，均在本發(fā)明的保護(hù)范圍之內(nèi)。由此，將對應(yīng)的信息及指定終端使用者回復(fù)的命令信息進(jìn)行存儲后，可以在后期直接按照存儲的命令信息實(shí)現(xiàn)對對應(yīng)圖像信息的處理，高效實(shí)現(xiàn)了門禁系統(tǒng)的控制。另外，對于預(yù)設(shè)網(wǎng)點(diǎn)內(nèi)任何一臺人臉設(shè)備的識別事件，報警事件，以及其他一切事件都可以發(fā)送到后臺管理中心進(jìn)行實(shí)時顯示，并作日志記錄，萬一發(fā)生犯罪事件時可用作證據(jù)，并且可聯(lián)動報警系統(tǒng)，推送報警消息至APP端，實(shí)現(xiàn)更加立體的安全防護(hù)。

本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法，還可以包括：

如果人臉識別結(jié)果不對應(yīng)預(yù)設(shè)人臉或者圖像信息為對照片的人臉進(jìn)行拍攝得到的，則向外界顯示驗(yàn)證失敗的信息。

進(jìn)行上述顯示的顯示模塊可以供來訪人員獲知其身份驗(yàn)證結(jié)果，另外為了方便與用戶的交互，該顯示模塊可以使用帶觸摸屏的LCD，從而可以使本作品的操作更簡單，便于用戶的使用，用戶也可以通過LCD來配置網(wǎng)絡(luò)模式、設(shè)定門鎖的狀態(tài)等。

本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法，還可以包括：

如果門禁消除請求是由指定終端發(fā)送的，則指示門禁系統(tǒng)消除門禁。

可以預(yù)先設(shè)定對門禁系統(tǒng)具有控制權(quán)限的指定終端，因此當(dāng)確定出門禁消除請求由指定終端發(fā)送時，可以直接指示門禁系統(tǒng)消除門禁，以保證門禁系統(tǒng)的安全性同時，方便用戶的使用。

本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法，還可以包括：

利用人體紅外感應(yīng)器判斷是否有人進(jìn)入指定區(qū)域內(nèi)，如果是，則指示圖像采集終端進(jìn)入正常工作模式并進(jìn)行圖像信息的采集，如果否，則指示圖像采集終端保持預(yù)先設(shè)定的默認(rèn)休眠模式。

其中指定區(qū)域可以根據(jù)實(shí)際需要進(jìn)行設(shè)定，如距離門禁系統(tǒng)的門鎖3米以內(nèi)等。由于整個門禁系統(tǒng)必須24小時不間斷工作，因此出于功耗的考慮，可以為門禁系統(tǒng)設(shè)置兩種工作模式：正常工作模式和默認(rèn)休眠模式。正常工作模式時，整個系統(tǒng)的所有模塊都處于上電工作狀態(tài)，耗電較大，而休眠模式時，只啟動人體紅外感應(yīng)器。當(dāng)有人接近設(shè)備時，人體紅外感應(yīng)模塊會感應(yīng)到有人接近，并發(fā)送信號請求處理器進(jìn)入正常工作狀態(tài)，啟動所有模塊。其中一般狀態(tài)下門禁系統(tǒng)默認(rèn)休眠模式，即使在需要正常工作后完成對應(yīng)操作后也會自動進(jìn)入休眠模式，即在無人進(jìn)入預(yù)設(shè)區(qū)域內(nèi)時，均保持休眠模式。

具體來說人體紅外感應(yīng)器是全自動感應(yīng)的，當(dāng)人進(jìn)入其感應(yīng)范圍則輸出高電平，人離開感應(yīng)范圍則自動延時關(guān)閉高電平，輸出低電平，系統(tǒng)收到這個低電平后就進(jìn)行相應(yīng)的喚醒操作。使用該模塊是為了減少不必要的資源消耗。如果沒有人在的時候，Linux中圖像采集的進(jìn)程和網(wǎng)絡(luò)通信的進(jìn)程不休眠，則會不斷的采集無用的圖像數(shù)據(jù)，發(fā)送到后臺處理。這樣不僅占用了后臺的資源，還使本作品的耗電量加大。

將圖像信息中包含的CCD圖像信息及紅外圖像信息進(jìn)行融合，執(zhí)行利用深度學(xué)習(xí)人臉識別算法對圖像信息進(jìn)行人臉識別的步驟。

需要說明的是，CCD圖像和紅外圖像各有其優(yōu)缺點(diǎn)，為了獲取更加清晰高效的圖像信息，對這兩種圖像信息進(jìn)行圖像融合。具體來說，在日常生活中使用得最普遍的是可見光圖像。對于人眼來說，可見光圖像具有豐富的細(xì)節(jié)和敏銳的色感，但它在惡劣的氣候條件下，對大氣的穿透能力較差，且夜間的成像能力也比較差；而紅外光卻正好相反，它在有煙霧的環(huán)境條件下，穿透能力相當(dāng)強(qiáng)，在夜間，由于不同物體之間存在著溫差，因此其所成的圖像仍能顯示物體的輪廓，但其缺點(diǎn)就是成像的分辨率較低。若結(jié)合這兩種光成像的優(yōu)點(diǎn)，對這些多光譜信息進(jìn)行適當(dāng)?shù)厝诤?，則可以消除環(huán)境因素引起的影像模糊，進(jìn)而可獲取清晰度增強(qiáng)的目標(biāo)圖像，提高對目標(biāo)圖像的探測和識別能力。

目前使用得比較多的紅外與可見光融合算法是基于變換域的方法，如小波變換、金字塔變換、Contourlet變換等。但上述方法不具備平移不變性，容易導(dǎo)致圖像邊緣細(xì)節(jié)模糊。還有一種具備平移不變性的非下采樣Contourlet變換(NCST)，但是算法復(fù)雜度太高。由于現(xiàn)有的大多數(shù)算法都難以區(qū)分噪聲和原始圖像的特征，從而導(dǎo)致融合后的圖像產(chǎn)生虛假或模糊信息。本發(fā)明使用一種基于非下采樣剪切波變換(NSST)的圖像融合算法，能大大提高算法的效率。本算法首先從紅外圖像中生成顯著度圖，然后根據(jù)顯著度圖指導(dǎo)紅外圖像進(jìn)行目標(biāo)分割，這樣可以對背景復(fù)雜或信噪比低的紅外圖像準(zhǔn)確分割。然后對紅外和可見光圖像分別進(jìn)行NSST變換，對兩幅圖像的目標(biāo)區(qū)域(即人臉區(qū)域)和背景區(qū)域采用不同的融合策略。本算法的主要流程圖可以如圖5所示。

其中基于顯著度圖的紅外目標(biāo)區(qū)域檢測，涉及顯著性目標(biāo)檢測。紅外成像與物體溫度相關(guān)，因此目標(biāo)區(qū)域(即人臉)相對背景區(qū)域是顯著的。這里使用基于頻率域的顯著區(qū)域提取方法，選擇高斯帶通濾波器來抽取圖像的顯著特征。高斯帶通濾波器定義如下：

σ₁,σ₂(σ₁>σ₂)是高斯濾波器的標(biāo)準(zhǔn)差，低頻截止頻率由σ₁決定，高頻截止頻率由σ₂決定。選擇合適的σ₁,σ₂值，就得到能夠保持期望空間頻率特征的顯著度圖。顯著度圖可由下式得到：

S(x，y)＝||I_μ-Iwhc(x，y)||

I_μ是紅外圖像均值向量，I_whc(x，y)是經(jīng)高斯濾波后的對應(yīng)的像素值。得到顯著度圖后，可根據(jù)顯著度圖中的顯著區(qū)域，選擇合適種子像素點(diǎn)，進(jìn)行圖像分割。

目標(biāo)區(qū)域融合規(guī)則：

為了盡可能保留紅外圖像的熱目標(biāo)信息，將紅外圖像的低頻子帶系數(shù)作為融合圖像的低頻帶系數(shù)：

L^F(x，y)＝Lⁱ(x，y)，(x，y)∈T

為了加強(qiáng)邊緣信息，高頻子帶系數(shù)選擇“模極大值法”。

其中高頻子帶和低頻子帶都是經(jīng)過NSST變換得到的。L^F,分別是融合后的低頻子帶和高頻子帶系數(shù)。

背景區(qū)域融合規(guī)則：使用基于多分辨率奇異值分解的融合規(guī)則，對矩陣R進(jìn)行奇異值分解：

R＝USV^T

R左乘U^T，得A＝U^TR＝SV^T。

其中S是半正定的對角奇異值矩陣。把奇異值按大到小排列，較大奇異值對應(yīng)A的前面幾行，對應(yīng)圖像中的低頻信息，能較大程度代表圖像原貌，較小奇異值對應(yīng)A的后面幾行，對應(yīng)高頻信息，能反映圖像細(xì)節(jié)。之后對A的前幾行元素重排得到低頻子帶，對低頻子帶不斷重復(fù)分解步驟，便可實(shí)現(xiàn)多分辨率奇異值分解。

本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁方法，利用深度學(xué)習(xí)人臉識別算法對圖像信息進(jìn)行人臉識別，可以包括：

利用基于GPU實(shí)現(xiàn)的深度學(xué)習(xí)人臉識別算法對圖像信息進(jìn)行人臉識別。

本發(fā)明從架構(gòu)上可分為三大部分：嵌入式設(shè)備、后臺人臉識別服務(wù)器、移動客戶端。其中嵌入式設(shè)備上采用基于ARM cortex–A系列的處理器開發(fā)，并搭載Linux操作系統(tǒng)。因?yàn)閏ortex–A系列的芯片多媒體處理能力好，其高數(shù)據(jù)吞吐量和高性能的結(jié)合能夠很好地滿足網(wǎng)絡(luò)處理應(yīng)用，Linux是支持多用戶、多任務(wù)、支持多線程和多CPU的操作系統(tǒng)且具有強(qiáng)大的網(wǎng)絡(luò)性能。由于深度學(xué)習(xí)算法并不直接運(yùn)行在嵌入式設(shè)備上(實(shí)際上深度學(xué)習(xí)算法計(jì)算量非常龐大，直接運(yùn)行在嵌入式設(shè)備上會大大降低效率)，因此嵌入式設(shè)備的主要功能是驅(qū)動CCD和紅外攝像頭模塊采集圖像；而后臺服務(wù)器是真正運(yùn)行深度學(xué)習(xí)算法的地方，與此同時，后臺使用GPU加速算法運(yùn)行，提高計(jì)算速度。識別結(jié)果可以繼續(xù)通過網(wǎng)絡(luò)通信協(xié)議返回給嵌入式設(shè)備端和移動客戶端。另外移動客戶端即可以指本申請中的指定終端。

另外需要說明的是，本申請中不同終端之間的數(shù)據(jù)傳輸可以采用SDIO-WIFI的模塊實(shí)現(xiàn)，該網(wǎng)卡符合IEEE 802.11b/g標(biāo)準(zhǔn)，可以確保網(wǎng)絡(luò)數(shù)據(jù)穩(wěn)定而高效地傳輸，其數(shù)據(jù)傳輸率可達(dá)54Mbps。該模塊使用SDIO的接口，比SPI接口的WIFI模塊要快很多。具體來說，SDIO總線和USB總線類似，SDIO總線也有兩端，其中一端是主機(jī)(HOST)端，另一端是設(shè)備端(DEVICE)，采用HOST-DEVICE這樣的設(shè)計(jì)是為了簡化DEVICE的設(shè)計(jì)，所有的通信都是由HOST端發(fā)出命令開始的。在DEVICE端只要能解析HOST的命令，就可以同HOST進(jìn)行通信了，SDIO的HOST可以連接多個DEVICE。由于系統(tǒng)運(yùn)行需要頻繁的發(fā)送網(wǎng)絡(luò)請求，和服務(wù)器后臺進(jìn)行數(shù)據(jù)交互，為防止網(wǎng)絡(luò)傳輸過程中網(wǎng)絡(luò)阻塞導(dǎo)致程序進(jìn)入無限等待狀態(tài)，系統(tǒng)采用多線程程序設(shè)計(jì)的思想，在每次進(jìn)行網(wǎng)絡(luò)請求時都臨時開辟線程對象，并在得到返回后通過消息機(jī)制通知主線程，讓主線程解析返回結(jié)果并可視化反饋給用戶，并釋放網(wǎng)絡(luò)請求線程資源。

本發(fā)明實(shí)施例還提供了一種基于深度學(xué)習(xí)的人臉識別門禁系統(tǒng)，如圖6所示，可以包括：

第一判斷模塊11，用于：接收門禁消除請求，判斷門禁消除請求是否由指定終端發(fā)送，如果否，則確定門禁消除請求由圖像采集終端發(fā)送；

圖像處理模塊12，用于：獲取圖像采集終端采集的與門禁消除請求對應(yīng)的圖像信息，利用深度學(xué)習(xí)人臉識別算法對圖像信息進(jìn)行人臉識別，得到對應(yīng)的人臉識別結(jié)果；

第二判斷模塊13，用于：判斷人臉識別結(jié)果是否對應(yīng)預(yù)設(shè)人臉，如果是，則指示門禁系統(tǒng)消除門禁，如果否，則拒絕消除門禁。

本發(fā)明實(shí)施例提供的一種基于深度學(xué)習(xí)的人臉識別門禁系統(tǒng)，還可以包括：

第三判斷模塊，用于：獲取圖像采集終端采集的與門禁消除請求對應(yīng)的圖像信息之后，利用深度學(xué)習(xí)照片識別算法對圖像信息進(jìn)行識別，如果識別出圖像信息為對真實(shí)的人臉進(jìn)行拍攝得到的，則執(zhí)行利用深度學(xué)習(xí)人臉識別算法對圖像信息進(jìn)行人臉識別的步驟，如果識別出圖像信息為對照片的人臉進(jìn)行拍攝得到的，則拒絕對圖像信息進(jìn)行人臉識別。