本發(fā)明涉及人臉識別領域,更具體地說,涉及一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法與裝置。
背景技術:
隨著科學技術的發(fā)展,人臉檢索技術也得到了快速發(fā)展。人臉檢索這項技術可以從某一個人上傳的一張照片中搜索出這個人的在網(wǎng)上的其他照片。例如用戶在社交網(wǎng)站中的相冊中,為一張照片的人物加上姓名,系統(tǒng)就可以利用人臉檢索技術自動為同一相冊中相同人臉的其他照片都加上這個姓名。另外,在搜索引擎中也有應用到人臉檢索這項技術實現(xiàn)“以圖搜圖”,也就是利用一張圖片可以檢索出與圖片中的人臉相同的其他所有圖片。
但是目前人臉檢索技術的精度普遍不高,尤其在雙胞胎方面幾乎沒辦法區(qū)分,而精度較高的人臉檢索技術,檢索時間又會很長。
因此,如何提高人臉檢索精度并且降低檢索時間,是本領域技術人員需要解決的問題。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,以提高人臉檢索精度并且降低檢索時間。
為實現(xiàn)上述目的,本發(fā)明實施例提供了如下技術方案:
一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,包括:
s101,利用毛孔訓練樣本與基于l1范數(shù)的代價函數(shù)得到神經(jīng)網(wǎng)絡;
s102,將測試圖像預處理得到灰度人臉圖像;
s103,將所述灰度人臉圖像遍歷分塊得到多塊人臉區(qū)域圖像塊;
s104,將檢索庫中未經(jīng)過匹配的一張待匹配圖像遍歷分塊得到多塊待匹配區(qū)域圖像塊;
s105,將所述人臉區(qū)域圖像塊與所述待匹配圖像塊利用所述神經(jīng)網(wǎng)絡進行匹配,得到匹配塊總數(shù);
s106,判斷所述匹配塊總數(shù)是否大于等于預設閾值,若是,則將此次的待匹配圖像作為檢索結果,停止檢索,若否,則返回s104。
其中,所述s101包括:
將毛孔訓練樣本輸入初始毛孔特征描述子生成網(wǎng)絡,得到初始特征描述子;
利用初始特征描述子最小化基于l1范數(shù)的代價函數(shù),訓練得到目標毛孔特征描述子生成網(wǎng)絡;
利用初始全連接層得到所述初始特征描述子的匹配結果,利用所述匹配結果與毛孔訓練樣本標簽的差值,訓練得到目標全連接層,其中所述目標全連接層與所述目標特征描述子生成網(wǎng)絡組成神經(jīng)網(wǎng)絡。
其中,所述s105包括:
s301,將一塊未匹配的人臉區(qū)域圖像塊與一塊未匹配的待匹配圖像塊用所述目標毛孔特征描述子生成網(wǎng)絡得到第一特征描述子與第二特征描述子;
s302,利用所述目標全連接層判斷所述第一特征描述子與所述第二特征描述子是否匹配,若是,則將匹配塊總數(shù)加一。
s303,判斷人臉區(qū)域圖像塊與待匹配圖像塊是否都已進行過匹配操作,若是,則停止匹配,若否,則返回s301。
其中,所述s102包括:
截取所述測試圖像的人臉部分圖像;
將所述人臉部分圖像進行灰度化處理得到灰度圖像;
將所述灰度圖像縮放至預設尺寸,得到灰度人臉圖像。
其中,所述s103,包括:
將所述灰度人臉圖像根據(jù)預設分塊尺寸不重疊的遍歷所述灰度人臉圖像,舍去多余邊緣得到多塊人臉區(qū)域圖像塊。
一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索裝置,包括:
神經(jīng)網(wǎng)絡獲取模塊,用于利用毛孔訓練樣本與基于l1范數(shù)的代價函數(shù)得到神經(jīng)網(wǎng)絡;
預處理模塊,用于將測試圖像預處理得到灰度人臉圖像;
第一分塊模塊,用于將所述灰度人臉圖像遍歷分塊得到多塊人臉區(qū)域圖像塊;
第二分塊模塊,用于將檢索庫中未經(jīng)過匹配的一張待匹配圖像遍歷分塊得到多塊待匹配區(qū)域圖像塊;
匹配模塊,用于將所述人臉區(qū)域圖像塊與所述待匹配圖像塊利用所述神經(jīng)網(wǎng)絡進行匹配,得到匹配塊總數(shù);
判斷模塊,用于判斷所述匹配塊總數(shù)是否大于等于預設閾值,若是,則將此次的待匹配圖像作為檢索結果,停止檢索,若否,則調(diào)用所述第二分塊模塊。
其中,所述神經(jīng)網(wǎng)絡獲取模塊,包括:
初始特征描述子獲取單元,用于將毛孔訓練樣本輸入初始毛孔特征描述子生成網(wǎng)絡,得到初始特征描述子;
目標毛孔特征描述子生成網(wǎng)絡訓練單元,用于利用初始特征描述子最小化基于l1范數(shù)的代價函數(shù),訓練得到目標毛孔特征描述子生成網(wǎng)絡;
目標全連接層訓練單元,用于利用初始全連接層得到所述初始特征描述子的匹配結果,利用所述匹配結果與毛孔訓練樣本標簽的差值,訓練得到目標全連接層,其中所述目標全連接層與所述目標特征描述子生成網(wǎng)絡組成神經(jīng)網(wǎng)絡。
其中,所述匹配模塊,包括:
特征描述子獲取單元,用于將一塊未匹配的人臉區(qū)域圖像塊與一塊未匹配的待匹配圖像塊用所述目標毛孔特征描述子生成網(wǎng)絡得到第一特征描述子與第二特征描述子;
匹配單元,用于利用所述目標全連接層判斷所述第一特征描述子與所述第二特征描述子是否匹配,若是,則將匹配塊總數(shù)加一。
判斷單元,用于判斷人臉區(qū)域圖像塊與待匹配圖像塊是否都已進行過匹配操作,若是,則停止匹配,若否,則調(diào)用所述特征描述子獲取單元。
其中,所述預處理模塊,包括:
測試圖像截取單元,用于截取所述測試圖像的人臉部分圖像;
灰度化處理單元,用于將所述人臉部分圖像進行灰度化處理得到灰度圖像;
縮放單元,用于將所述灰度圖像縮放至預設尺寸,得到灰度人臉圖像。
其中,所述第一分塊模塊,具體用于,將所述灰度人臉圖像根據(jù)預設分塊尺寸不重疊的遍歷所述灰度人臉圖像,舍去多余邊緣得到多塊人臉區(qū)域圖像塊。
通過以上方案可知,本發(fā)明實施例提供的一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,利用l1范數(shù)的代價函數(shù)與毛孔訓練樣本可以得到神經(jīng)網(wǎng)絡,通過神經(jīng)網(wǎng)絡在檢索庫中檢索與測試圖像匹配的圖像。由于基于li范數(shù)的代價函數(shù)得到的神經(jīng)網(wǎng)絡中的參數(shù)已經(jīng)確定,每次檢索時不會根據(jù)測試圖像不同重新定義參數(shù),因此檢索速度快,耗時很少,同時,基于l1范數(shù)確定的神經(jīng)網(wǎng)絡為深度學習的神經(jīng)網(wǎng)絡,因此有很強大的學習能力,能夠充分地學習到測試圖像特征信息,因此準確度很高。本發(fā)明實施例還提供一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索裝置,同樣可以實現(xiàn)上述技術效果。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例公開的一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法流程圖;
圖2為本發(fā)明實施例公開的一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法流程圖;
圖3為本發(fā)明實施例公開的一種神經(jīng)網(wǎng)絡示意圖;
圖4為本發(fā)明實施例公開的一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法流程圖;
圖5為本發(fā)明實施例公開的一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索裝置結構示意圖。
具體實施方式
下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明實施例公開了一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,以提高人臉檢索精度并且降低檢索時間。
參見圖1,本發(fā)明實施例提供的一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,具體包括:
s101,利用毛孔訓練樣本與基于l1范數(shù)的代價函數(shù)得到神經(jīng)網(wǎng)絡。
具體地,在檢索前首先需要根據(jù)毛孔訓練樣本與基于l1范數(shù)的代價函數(shù)訓練出神經(jīng)網(wǎng)絡,需要說明的是,在神經(jīng)網(wǎng)絡中有兩個小網(wǎng)絡,一個是描述子生成網(wǎng)絡,一個是全連接層。訓練神經(jīng)網(wǎng)絡的過程就是訓練描述子生成網(wǎng)絡與全連接層,訓練描述子生成網(wǎng)絡后會確定一個參數(shù),這個參數(shù)在每次檢索時都不會改變,每次檢索都是使用這個訓練好的神經(jīng)網(wǎng)絡,因此耗時不會很長。
s102,將測試圖像預處理得到灰度人臉圖像。
具體地,在接收到用戶的人臉檢索觸發(fā)指令時,獲得用戶的人臉測試圖像,并將測試圖像進行預處理,得到符合要求的灰度人臉圖像,以便匹配。
s103,將所述灰度人臉圖像遍歷分塊得到多塊人臉區(qū)域圖像塊。
在本方案中,是將圖像分成多個小塊后分塊進行匹配,因此,在匹配前還需要將會對灰度人臉圖像遍歷分塊,需要說明的是,遍歷分塊后得到的人臉區(qū)域圖像塊是不重疊的。
s104,將檢索庫中未經(jīng)過匹配的一張待匹配圖像遍歷分塊得到多塊待匹配區(qū)域圖像塊。
具體地,在檢索庫中按順序找出一張沒有進行檢測過的圖像作為待匹配圖像,用于與灰度人臉圖像進行匹配,并將這個圖像同樣遍歷分塊得到待匹配區(qū)域圖像塊。
s105,將所述人臉區(qū)域圖像塊與所述待匹配圖像塊利用所述神經(jīng)網(wǎng)絡進行匹配,得到匹配塊總數(shù)。
具體地,將每塊人臉區(qū)域圖像塊與每塊待匹配圖像塊都送入神經(jīng)網(wǎng)絡中進行匹配。需要說明的是,這里的匹配是指逐塊匹配,每一塊人臉區(qū)域圖像塊與對應的每一塊待匹配圖像塊進行匹配,確定兩塊圖像是否是匹配的,然后統(tǒng)計出所有匹配成功的總塊數(shù)。
s106,判斷所述匹配塊總數(shù)是否大于等于預設閾值,若是,則將此次的待匹配圖像作為檢索結果,停止檢索,若否,則返回s104。
具體地,判斷匹配成功的總數(shù)是否大于等于一個預設的閾值,如果大于,那么說明此次選擇的檢索庫中的待匹配圖像與測試圖像可以判定為同一人臉的圖像,則將這張圖像作為檢索結果,檢索完成。如果沒有大于這個閾值,那么需要返回s104繼續(xù)在檢索庫中選擇圖像并進行匹配等操作,直至檢索到檢索結果。
預設的閾值可以是所有塊圖像數(shù)量的4/5,也就是說當匹配塊總數(shù)大于等于所有塊圖像數(shù)量的4/5,則說明這張圖像可以作為檢索結果。
通過以上方案可知,本發(fā)明實施例提供的一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,利用l1范數(shù)的代價函數(shù)與毛孔訓練樣本可以得到神經(jīng)網(wǎng)絡,通過神經(jīng)網(wǎng)絡在檢索庫中檢索與測試圖像匹配的圖像。由于基于li范數(shù)的代價函數(shù)得到的神經(jīng)網(wǎng)絡中的參數(shù)已經(jīng)確定,每次檢索時不會根據(jù)測試圖像不同重新定義參數(shù),因此檢索速度快,耗時很少,同時,基于l1范數(shù)確定的神經(jīng)網(wǎng)絡為深度學習的神經(jīng)網(wǎng)絡,因此有很強大的學習能力,能夠充分地學習到測試圖像特征信息,因此準確度很高。
本發(fā)明實施例提供了一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,區(qū)別于上一實施例,本發(fā)明實施例對上一實施例中的s101做了具體地限定說明,其他內(nèi)容與上一實施例大致相同,具體內(nèi)容可以參照上一實施例,此處不再贅述,具體地,參見圖2與圖3,s101包括:
s201,將毛孔訓練樣本輸入初始毛孔特征描述子生成網(wǎng)絡,得到初始特征描述子。
具體地,將毛孔訓練楊本輸入到初始毛孔特征描述子生成網(wǎng)絡,經(jīng)過多層卷積、歸一操作,得到毛孔尺度的特征描述子。
s202,利用初始特征描述子最小化基于l1范數(shù)的代價函數(shù),訓練得到目標毛孔特征描述子生成網(wǎng)絡。
具體地,參照圖3,由上至下分別為卷積層、批歸一化層、卷基層、批歸一化層、局部響應歸一層、全連接層。
具體地,定義
定義基于l1范數(shù)的匹配對的特征描述子的距離
定義特征描述子的列相似度
需要說明的是,第一圖像為待測試圖像,第二圖像為待匹配圖像。在測試樣本中,包括一個待測試樣本圖像和一個待匹配測試圖像。在利用神經(jīng)網(wǎng)絡進行檢索時,測試圖像為第一圖像,待匹配圖像為第二圖像。
在訓練過程中,會不斷地產(chǎn)生特征描述子,利用特征描述子以最小化代價函數(shù)為手段,確定出目標特征描述子生成網(wǎng)絡的參數(shù),確定參數(shù)后,訓練目標特征描述子生成網(wǎng)絡完成。
s203,利用初始全連接層得到所述初始特征描述子的匹配結果,利用所述匹配結果與毛孔訓練樣本標簽的差值,訓練得到目標全連接層,其中所述目標全連接層與所述目標特征描述子生成網(wǎng)絡組成神經(jīng)網(wǎng)絡。
具體地,將初始特征描述子通過全連接層得到匹配結果,最小化匹配結果和毛孔訓練樣本標簽的差值,訓練得到全連接層。
需要說明的是,匹配結果就是毛孔訓練樣本中待測試樣本圖像和一個待匹配測試圖像的匹配結果,待測試樣本圖像和待匹配測試圖像可以是整張圖像,也可以是切塊后的圖像,在本方案中是切塊后的圖像。毛孔訓練樣本的標簽為已知的毛孔訓練樣本中待測試樣本圖像和一個待匹配測試圖像的預定匹配結果。
由此可見,在本方案中目標毛孔特征描述子生成網(wǎng)絡的參數(shù)在訓練時已確定,在檢索時參數(shù)不會再改變,因此耗費時間極少,同時深度學習的神經(jīng)網(wǎng)絡具有很強大的學習能力,能夠充分地學習到毛孔尺寸特征的信息,因此準確度高。
本發(fā)明實施例提供一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,區(qū)別于上一實施例,本發(fā)明實施例對上一實施例中的s105做了具體地限定說明,其他內(nèi)容與上一實施例大致相同,具體內(nèi)容可以參照上一實施例,此處不再贅述,具體地,參見圖4,s105包括:
s301,將一塊未匹配的人臉區(qū)域圖像塊與一塊未匹配的待匹配圖像塊用所述目標毛孔特征描述子生成網(wǎng)絡得到第一特征描述子與第二特征描述子。
具體地,在檢索時,將人臉區(qū)域圖像塊和待匹配圖像塊送入神經(jīng)網(wǎng)絡中的目標毛孔特征描述子生成網(wǎng)絡,得到每塊人臉區(qū)域圖像塊對應的第一特征描述子與每塊待匹配圖像塊對應的第二特征描述子。
s302,利用所述目標全連接層判斷所述第一特征描述子與所述第二特征描述子是否匹配,若是,則將匹配塊總數(shù)加一。
具體地,將每一個第一特征描述子與對應的第二特征描述子送入神經(jīng)網(wǎng)絡中的目標全連接層,得到第一特征描述子與對應的第二特征描述子的匹配結果,也就是判斷一個人臉區(qū)域圖像塊和對應的待匹配圖像塊是否匹配,如果匹配,那么將匹配塊總數(shù)加一,匹配塊總數(shù)就是所有匹配成功的圖像塊的總數(shù),從0開始,每匹配成功一次則匹配塊總數(shù)加一。
s303,判斷人臉區(qū)域圖像塊與待匹配圖像塊是否都已進行過匹配操作,若是,則停止匹配,若否,則返回s301。
判斷灰度人臉圖像的人臉區(qū)域圖像塊與待匹配圖像塊是否均已進行過匹配,如果都已進行匹配,那么s302得到的匹配塊總數(shù)就是最終的匹配塊總數(shù),如果還有未進行匹配的圖像塊,那么返回s301繼續(xù)匹配。
本發(fā)明實施例提供一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,區(qū)別于上一實施例,本發(fā)明實施例對上一實施例中的s102做了具體地限定說明,其他內(nèi)容與上一實施例大致相同,具體內(nèi)容可以參照上一實施例,此處不再贅述,具體地,s102包括:
截取所述測試圖像的人臉部分圖像;
將所述人臉部分圖像進行灰度化處理得到灰度圖像;
將所述灰度圖像縮放至預設尺寸,得到灰度人臉圖像。
具體地,首先對測試圖像進行人臉檢測,定位人臉并截取出人臉部分圖像,對截取后的人臉部分圖像進行灰度化處理,得到灰度圖像,根據(jù)檢索的環(huán)境,預設一個圖像尺寸,將灰度人臉圖像縮放至預設尺寸,進行以上預處理后,就得到了灰度人臉圖像。
本發(fā)明實施例提供一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,區(qū)別于上一實施例,本發(fā)明實施例對上一實施例中的s103做了具體地限定說明,其他內(nèi)容與上一實施例大致相同,具體內(nèi)容可以參照上一實施例,此處不再贅述,具體地,s103包括:
將所述灰度人臉圖像根據(jù)預設分塊尺寸不重疊的遍歷所述灰度人臉圖像,舍去多余邊緣得到多塊人臉區(qū)域圖像塊。
具體地,設定一個圖像的分塊尺寸,根據(jù)這個尺寸不重疊地遍歷灰度人臉圖像,舍去多余的邊緣,就可以得到多塊人臉區(qū)域圖像塊。
需要說明的是,在s104中,需要將檢索庫中未經(jīng)過匹配的一張待匹配圖像遍歷分塊得到多塊待匹配區(qū)域圖像塊,這里的遍歷分塊可以用同樣的方法實現(xiàn),具體地:
根據(jù)s103中的預設尺寸不重疊地遍歷待匹配圖像,舍去多余的邊緣,就可以得到多塊待匹配圖像塊。
下面對本發(fā)明實施例提供一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索裝置進行介紹,下文描述的一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索裝置與上文描述的一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法可以相互參照。
參見圖5,本發(fā)明實施例提供的一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索裝置,具體包括:
神經(jīng)網(wǎng)絡獲取模塊401,用于利用毛孔訓練樣本與基于l1范數(shù)的代價函數(shù)得到神經(jīng)網(wǎng)絡。
具體地,在檢索前首先需要神經(jīng)網(wǎng)絡獲取模塊401根據(jù)毛孔訓練樣本與基于l1范數(shù)的代價函數(shù)訓練出神經(jīng)網(wǎng)絡,需要說明的是,在神經(jīng)網(wǎng)絡中有兩個小網(wǎng)絡,一個是描述子生成網(wǎng)絡,一個是全連接層。訓練神經(jīng)網(wǎng)絡的過程就是訓練描述子生成網(wǎng)絡與全連接層,訓練描述子生成網(wǎng)絡后會確定一個參數(shù),這個參數(shù)在每次檢索時都不會改變,每次檢索都是使用這個訓練好的神經(jīng)網(wǎng)絡,因此耗時不會很長。
預處理模塊402,用于將測試圖像預處理得到灰度人臉圖像。
具體地,在接收到用戶的人臉檢索觸發(fā)指令時,預處理模塊402獲得用戶的人臉測試圖像,并將測試圖像進行預處理,得到符合要求的灰度人臉圖像,以便匹配。
第一分塊模塊403,用于將所述灰度人臉圖像遍歷分塊得到多塊人臉區(qū)域圖像塊。
在本方案中,是將圖像分成多個小塊后分塊進行匹配,因此,在匹配前還需要將會對灰度人臉圖像遍歷分塊,需要說明的是,通過第一分塊模塊403遍歷分塊后得到的人臉區(qū)域圖像塊是不重疊的。
第二分塊模塊404,用于將檢索庫中未經(jīng)過匹配的一張待匹配圖像遍歷分塊得到多塊待匹配區(qū)域圖像塊。
具體地,在檢索庫中按順序找出一張沒有進行檢測過的圖像作為待匹配圖像,用于與灰度人臉圖像進行匹配,并通過第二分塊模塊404將這個圖像同樣遍歷分塊得到待匹配區(qū)域圖像塊。
匹配模塊405,用于將所述人臉區(qū)域圖像塊與所述待匹配圖像塊利用所述神經(jīng)網(wǎng)絡進行匹配,得到匹配塊總數(shù)。
具體地,匹配模塊405將每塊人臉區(qū)域圖像塊與每塊待匹配圖像塊都送入神經(jīng)網(wǎng)絡中進行匹配。需要說明的是,這里的匹配是指逐塊匹配,每一塊人臉區(qū)域圖像塊與對應的每一塊待匹配圖像塊進行匹配,確定兩塊圖像是否是匹配的,然后統(tǒng)計出所有匹配成功的總塊數(shù)。
判斷模塊406,用于判斷所述匹配塊總數(shù)是否大于等于預設閾值,若是,則將此次的待匹配圖像作為檢索結果,停止檢索,若否,則調(diào)用所述第二分塊模塊。
具體地,判斷模塊406判斷匹配成功的總數(shù)是否大于等于一個預設的閾值,如果大于,那么說明此次選擇的檢索庫中的待匹配圖像與測試圖像可以判定為同一人臉的圖像,則將這張圖像作為檢索結果,檢索完成。如果沒有大于這個閾值,那么需要調(diào)用第二分塊模塊404,繼續(xù)在檢索庫中選擇圖像并進行匹配等操作,直至檢索到檢索結果。
預設的閾值可以是所有塊圖像數(shù)量的4/5,也就是說當匹配塊總數(shù)大于等于所有塊圖像數(shù)量的4/5,則說明這張圖像可以作為檢索結果。
通過以上方案可知,本發(fā)明實施例提供的一種基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,神經(jīng)網(wǎng)絡獲取模塊401利用l1范數(shù)的代價函數(shù)與毛孔訓練樣本可以得到神經(jīng)網(wǎng)絡,通過神經(jīng)網(wǎng)絡在檢索庫中檢索與測試圖像匹配的圖像。由于基于li范數(shù)的代價函數(shù)得到的神經(jīng)網(wǎng)絡中的參數(shù)已經(jīng)確定,每次檢索時不會根據(jù)測試圖像不同重新定義參數(shù),因此檢索速度快,耗時很少,同時,基于l1范數(shù)確定的神經(jīng)網(wǎng)絡為深度學習的神經(jīng)網(wǎng)絡,因此有很強大的學習能力,能夠充分地學習到測試圖像特征信息,因此準確度很高。
本發(fā)明實施例提供了一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,區(qū)別于上一實施例,本發(fā)明實施例對上一實施例中的神經(jīng)網(wǎng)絡獲取模塊401做了具體地限定說明,其他內(nèi)容與上一實施例大致相同,具體內(nèi)容可以參照上一實施例,此處不再贅述,具體地,神經(jīng)網(wǎng)絡獲取模塊401包括:
初始特征描述子獲取單元501,用于將毛孔訓練樣本輸入初始毛孔特征描述子生成網(wǎng)絡,得到初始特征描述子。
具體地,初始特征描述子獲取單元501將毛孔訓練楊本輸入到初始毛孔特征描述子生成網(wǎng)絡,經(jīng)過多層卷積、歸一操作,得到毛孔尺度的特征描述子。
目標毛孔特征描述子生成網(wǎng)絡訓練單元502,用于利用初始特征描述子最小化基于l1范數(shù)的代價函數(shù),訓練得到目標毛孔特征描述子生成網(wǎng)絡。
具體地,定義
定義基于l1范數(shù)的匹配對的特征描述子的距離
定義特征描述子的列相似度
需要說明的是,第一圖像為待測試圖像,第二圖像為待匹配圖像。在測試樣本中,包括一個待測試樣本圖像和一個待匹配測試圖像。在利用神經(jīng)網(wǎng)絡進行檢索時,測試圖像為第一圖像,待匹配圖像為第二圖像。
在訓練過程中,會不斷地產(chǎn)生特征描述子,目標毛孔特征描述子生成網(wǎng)絡訓練單元502利用特征描述子以最小化代價函數(shù)為手段,確定出目標特征描述子生成網(wǎng)絡的參數(shù),確定參數(shù)后,訓練目標特征描述子生成網(wǎng)絡完成。
目標全連接層訓練單元503,用于利用初始全連接層得到所述初始特征描述子的匹配結果,利用所述匹配結果與毛孔訓練樣本標簽的差值,訓練得到目標全連接層,其中所述目標全連接層與所述目標特征描述子生成網(wǎng)絡組成神經(jīng)網(wǎng)絡。
具體地,目標全連接層訓練單元503將初始特征描述子通過全連接層得到匹配結果,最小化匹配結果和毛孔訓練樣本標簽的差值,訓練得到全連接層。
需要說明的是,匹配結果就是毛孔訓練樣本中待測試樣本圖像和一個待匹配測試圖像的匹配結果,待測試樣本圖像和待匹配測試圖像可以是整張圖像,也可以是切塊后的圖像,在本方案中是切塊后的圖像。毛孔訓練樣本的標簽為已知的毛孔訓練樣本中待測試樣本圖像和一個待匹配測試圖像的預定匹配結果。
由此可見,在本方案中目標毛孔特征描述子生成網(wǎng)絡的參數(shù)在初始特征描述子獲取單元501訓練時已確定,在檢索時參數(shù)不會再改變,因此耗費時間極少,同時深度學習的神經(jīng)網(wǎng)絡具有很強大的學習能力,能夠充分地學習到毛孔尺寸特征的信息,因此準確度高。
本發(fā)明實施例提供一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,區(qū)別于上一實施例,本發(fā)明實施例對上一實施例中的匹配模塊405做了具體地限定說明,其他內(nèi)容與上一實施例大致相同,具體內(nèi)容可以參照上一實施例,此處不再贅述,具體地,匹配模塊405包括:
特征描述子獲取單元601,用于將一塊未匹配的人臉區(qū)域圖像塊與一塊未匹配的待匹配圖像塊用所述目標毛孔特征描述子生成網(wǎng)絡得到第一特征描述子與第二特征描述子。
具體地,在檢索時,特征描述子獲取單元601將人臉區(qū)域圖像塊和待匹配圖像塊送入神經(jīng)網(wǎng)絡中的目標毛孔特征描述子生成網(wǎng)絡,得到每塊人臉區(qū)域圖像塊對應的第一特征描述子與每塊待匹配圖像塊對應的第二特征描述子。
匹配單元602,用于利用所述目標全連接層判斷所述第一特征描述子與所述第二特征描述子是否匹配,若是,則將匹配塊總數(shù)加一。
具體地,匹配單元602將每一個第一特征描述子與對應的第二特征描述子送入神經(jīng)網(wǎng)絡中的目標全連接層,得到第一特征描述子與對應的第二特征描述子的匹配結果,也就是判斷一個人臉區(qū)域圖像塊和對應的待匹配圖像塊是否匹配,如果匹配,那么將匹配塊總數(shù)加一,匹配塊總數(shù)就是所有匹配成功的圖像塊的總數(shù),從0開始,每匹配成功一次則匹配塊總數(shù)加一。
判斷單元603,用于判斷人臉區(qū)域圖像塊與待匹配圖像塊是否都已進行過匹配操作,若是,則停止匹配,若否,則調(diào)用所述特征描述子獲取單元601。
判斷單元603判斷灰度人臉圖像的人臉區(qū)域圖像塊與待匹配圖像塊是否均已進行過匹配,如果都已進行匹配,那么匹配單元602得到的匹配塊總數(shù)就是最終的匹配塊總數(shù),如果還有未進行匹配的圖像塊,那么調(diào)用特征描述子獲取單元601繼續(xù)匹配。
本發(fā)明實施例提供一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,區(qū)別于上一實施例,本發(fā)明實施例對上一實施例中的預處理模塊402做了具體地限定說明,其他內(nèi)容與上一實施例大致相同,具體內(nèi)容可以參照上一實施例,此處不再贅述,具體地,預處理模塊402包括:
測試圖像截取單元,用于截取所述測試圖像的人臉部分圖像;
灰度化處理單元,用于將所述人臉部分圖像進行灰度化處理得到灰度圖像;
縮放單元,用于將所述灰度圖像縮放至預設尺寸,得到灰度人臉圖像。
具體地,首先測試圖像截取單元對測試圖像進行人臉檢測,定位人臉并截取出人臉部分圖像,灰度化處理單元對截取后的人臉部分圖像進行灰度化處理,得到灰度圖像,根據(jù)檢索的環(huán)境,預設一個圖像尺寸,縮放單元將灰度人臉圖像縮放至預設尺寸,進行以上預處理后,就得到了灰度人臉圖像。
本發(fā)明實施例提供一種具體的基于l1范數(shù)神經(jīng)網(wǎng)絡的人臉檢索方法,區(qū)別于上一實施例,本發(fā)明實施例對上一實施例中的第一分塊模塊403做了具體地限定說明,其他內(nèi)容與上一實施例大致相同,具體內(nèi)容可以參照上一實施例,此處不再贅述,具體地,第一分塊模塊403具體用于:
將所述灰度人臉圖像根據(jù)預設分塊尺寸不重疊的遍歷所述灰度人臉圖像,舍去多余邊緣得到多塊人臉區(qū)域圖像塊。
具體地,第一分塊模塊403設定一個圖像的分塊尺寸,根據(jù)這個尺寸不重疊地遍歷灰度人臉圖像,舍去多余的邊緣,就可以得到多塊人臉區(qū)域圖像塊。
需要說明的是,在第二分塊模塊404中,需要將檢索庫中未經(jīng)過匹配的一張待匹配圖像遍歷分塊得到多塊待匹配區(qū)域圖像塊,這里的遍歷分塊可以用同樣的方法實現(xiàn),具體地:
根據(jù)第一分塊模塊403的預設尺寸不重疊地遍歷待匹配圖像,舍去多余的邊緣,就可以得到多塊待匹配圖像塊。
本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。
對所公開的實施例的上述說明,使本領域專業(yè)技術人員能夠實現(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領域的專業(yè)技術人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。