本發(fā)明涉及圖像識別技術領域,尤其涉及一種基于神經網絡的圖像特征提取建模方法及裝置以及一種圖像識別方法及裝置。
背景技術:
圖像識別是計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。針對人臉的圖像識別即為人臉識別,它是一種基于人的臉部特征信息進行身份識別的生物識別技術,一般是用攝像機或攝像頭采集含有人臉的圖像或視頻流后,自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別,通常也叫做人像識別、面部識別。
目前,人臉識別算法均是基于人臉照片和與其對應的身份信息,使用神經網絡進行模型訓練,并最終使用分類器進行人臉識別。在人臉識別神經網絡中對模型的訓練中只考慮人臉圖片的身份信息,對于利用該模型的人臉識別的識別精度還有待進一步地提升。
技術實現(xiàn)要素:
基于此,有必要提供一種能夠在圖像識別應用場景中提高識別精度的基于神經網絡的圖像特征提取建模方法及裝置,以及一種應用通過該基于神經網絡的圖像特征提取建模方法及裝置建立的圖像特征模型的圖像識別方法及裝置。
一種基于神經網絡的圖像特征提取建模方法,包括:
從預設應用場景的訓練集中獲取第一圖片、第二圖片、所述第一圖片的第一分類及所述第二圖片的第二分類;
將所述第一圖片、所述第一分類、所述第二圖片及所述第二分類作為圖像對象驗證神經網絡的輸入,確定全局損失代價函數(shù)值;
根據(jù)所述全局損失代價函數(shù)值及訓練參數(shù)在所述訓練集上訓練所述圖像對象驗證神經網絡;
通過所述預設應用場景的測試集對所述圖像對象驗證神經網絡進行測試,并根據(jù)測試結果確定測試精度,根據(jù)所述測試精度及所述圖像對象驗證神經網絡確定目標圖像對象驗證特征提取模型。
一種圖像識別方法,包括:
獲取待識別圖片,并將所述待識別圖片作為上述的基于神經網絡的圖像特征提取建模方法確定的目標圖像對象驗證特征提取模型的輸入,確定待識別驗證特征;
將所述待識別驗證特征與訓練集中的圖片對應的圖片驗證特征進行對比,并將與所述待識別驗證特征距離最近的圖片驗證特征對應的圖片所屬的分類確定為所述待識別圖片的分類。
一種基于神經網絡的圖像特征提取建模裝置,包括:
圖片分類獲取模塊,用于從預設應用場景的訓練集中獲取第一圖片、第二圖片、所述第一圖片的第一分類及所述第二圖片的第二分類;
損失代價確定模塊,用于將所述第一圖片、所述第一分類、所述第二圖片及所述第二分類作為圖像對象驗證神經網絡的輸入,確定全局損失代價函數(shù)值;
神經網絡訓練模塊,用于根據(jù)所述全局損失代價函數(shù)值及訓練參數(shù)在所述訓練集上訓練所述圖像對象驗證神經網絡;
特征模型確定模塊,用于通過所述預設應用場景的測試集對所述圖像對象驗證神經網絡進行測試,并根據(jù)測試結果確定測試精度,根據(jù)所述測試精度及所述圖像對象驗證神經網絡確定目標圖像對象驗證特征提取模型。
一種圖像識別裝置,包括:
待識特征確定模塊,用于獲取待識別圖片,并將所述待識別圖片作為上述的基于神經網絡的圖像特征提取建模裝置確定的目標圖像對象驗證特征提取模型的輸入,確定待識別驗證特征;
對比分類確定模塊,用于將所述待識別驗證特征與訓練集中的圖片對應的圖片驗證特征進行對比,并將與所述待識別驗證特征距離最近的圖片驗證特征對應的圖片所屬的分類確定為所述待識別圖片的分類。
上述基于神經網絡的圖片特征提取建模方法及裝置,由于訓練模型的時候采用的全局損失代價函數(shù)值,不僅與第一圖片、第二圖片相關,還與第一圖片的第一分類、第二圖片的第二分類相關。因此,建模得到的圖像對象驗證特征模型與第一圖片的第一分類、第二圖片的第二分類相關。從而,可以達到將建模得到的圖像對象驗證特征模型應用在預設應用場景中進行圖像識別時,提高圖像識別精度的有益效果。
上述圖像識別方法及裝置,由于通過上述基于神經網絡的圖像特征提取建模方法或裝置確定的目標圖像對象驗證特征提取模型確定待識別驗證特征,并通過該待識別驗證特征與訓練集中的圖片驗證特征進行對比,最終確定待識別圖片的分類,因此,上述圖像識別方法及裝置的識別精度高。
附圖說明
圖1為一實施例的基于神經網絡的圖像特征提取建模方法的流程圖;
圖2為圖1的基于神經網絡的圖像特征提取建模方法的一個步驟的具體流程圖;
圖3為另一實施例的基于神經網絡的圖像特征提取建模方法的流程圖;
圖4為一實施例的基于神經網絡的圖像特征提取建模方法中進行人臉對齊處理前的示例圖;
圖5為圖4的示例圖進行人臉對齊處理后的結果圖;
圖6為圖1的基于神經網絡的圖像特征提取建模方法的另一個步驟的具體流程圖;
圖7為一實施例的圖像識別方法的流程圖;
圖8為一實施例的基于神經網絡的圖像特征提取建模裝置的結構圖;
圖9為另一實施例的基于神經網絡的圖像特征提取建模裝置的結構圖;
圖10為一實施例的圖像識別裝置的結構圖。
具體實施方式
為了便于理解本發(fā)明,下面將參照相關附圖對本發(fā)明進行更全面的描述。附圖中給出了本發(fā)明的較佳的實施例。但是,本發(fā)明可以以許多不同的形式來實現(xiàn),并不限于本文所描述的實施例。相反地,提供這些實施例的目的是使對本發(fā)明的公開內容的理解更加透徹全面。
除非另有定義,本文所使用的所有的技術和科學術語與屬于本發(fā)明的技術領域的技術人員通常理解的含義相同。本文中在本發(fā)明的說明書中所使用的術語只是為了描述具體的實施例的目的,不是旨在于限制本發(fā)明。本文所使用的術語“或/和”包括一個或多個相關的所列項目的任意的和所有的組合。
如圖1所示,為本發(fā)明一個實施例的基于神經網絡的圖像特征提取建模方法,包括:
S140:從預設應用場景的訓練集中獲取第一圖片、第二圖片、所述第一圖片的第一分類及所述第二圖片的第二分類。
預設應用場景可以為對圖像識別精度要求較高的場景,尤其是對人臉識別精度要求較高的場景,如銀行VTM(Virtual Teller Machine,遠程柜員機)驗證、珠寶店VIP(Very Important Person,貴賓)識別等場景。
每一張圖片上均包括待識別的對象,如,可以為待識別的物品或人。同一分類表示同一個對象,如可以為同一個人或同一個物品。
S160:將所述第一圖片、所述第一分類、所述第二圖片及所述第二分類作為圖像對象驗證神經網絡的輸入,確定全局損失代價函數(shù)值。
通過第一圖片及第二圖片,根據(jù)圖像對象驗證神經網絡中的圖像對象驗證特征提取模型可以分別確定第一圖片、第二圖片的對象特征及驗證特征,進而根據(jù)第一分類、第二分類以及這些對象特征、驗證特征確定全局損失代價函數(shù)的值。
圖像對象驗證神經網絡以現(xiàn)有技術的圖像對象識別神經網絡為基礎,包括以圖像對象識別神經網絡中的圖像對象識別特征提取模型為基礎確定的圖像對象驗證特征提取模型。
具體地,該圖像對象識別神經網絡為經過訓練的圖像對象識別神經網絡,是采用現(xiàn)有技術進行圖像識別的已經訓練好了的神經網絡。如此,在經過訓練的圖像對象識別神經網絡的基礎上進行后續(xù)訓練,而無需再從零開始訓練。因此,可以節(jié)約訓練時間,更快地找到最優(yōu)神經網絡。進一步地,經過訓練的圖像對象識別神經網絡為深度神經網絡,即圖像對象識別深度神經網絡。
根據(jù)圖像對象驗證特征提取模型可以構造圖像對象驗證神經網絡。優(yōu)選地,圖像對象驗證神經網絡為深度神經網絡,即圖像對象驗證深度神經網絡。
需要說明的是,圖像對象驗證特征提取模型在通過圖像對象識別特征提取模型得到圖像對象識別特征的基礎上,根據(jù)圖像對象識別特征得到圖像對象驗證特征。具體地,對圖像對象識別特征進行二范數(shù)歸一化處理,得到圖像對象驗證特征。二范數(shù)歸一化處理具體為,將圖像對象識別特征的每一個特征元素求平方和之后再開平方得到的結果作為圖像對象驗證特征的每個特征元素分母;再將圖像對象識別特征中的每個與驗證是否為同一對象相關的特征元素的特征值作為圖像對象驗證特征的一個特征元素的分子。
S170:根據(jù)所述全局損失代價函數(shù)值及訓練參數(shù)在所述訓練集上訓練所述圖像對象驗證神經網絡。
在一個實施例中,可以根據(jù)全局損失代價函數(shù)值和鏈式求導法則可以確定圖像對象驗證神經網絡的圖像對象驗證特征提取模型中的每一個參數(shù)的梯度值;根據(jù)所述全局損失代價函數(shù)值及訓練參數(shù)采用隨機梯度下降法在所述訓練集上訓練所述圖像對象驗證神經網絡。
訓練參數(shù)包括特征距離閾值及學習速率。在一個較優(yōu)實施例中,特征距離閾值的值可以默認設置為0.2或0.25;學習速率的值可以默認設置為0.0001。
S180:通過所述預設應用場景的測試集對所述圖像對象驗證神經網絡進行測試,并根據(jù)測試結果確定測試精度,根據(jù)所述測試精度及所述圖像對象驗證神經網絡確定目標圖像對象驗證特征提取模型。
只要測試集的容量足夠大,對圖像對象驗證神經網絡的訓練可以一直持續(xù)下去。在本實施例中,每次訓練預設時間之后,通過所述預設應用場景的測試集對所述圖像對象驗證神經網絡進行測試,并根據(jù)測試結果確定測試精度??梢圆捎矛F(xiàn)有方式根據(jù)測試結果確定測試精度。
當測試精度到達預設精度時,不再繼續(xù)訓練,此時的圖像對象驗證神經網絡為目標圖像對象驗證神經網絡。通過目標圖像對象驗證神經網絡可以確定目標圖像對象驗證特征提取模型。其中,預設精度為預先設置測試需要達到的精度要求。
在一個較優(yōu)的實施例中,采用交叉驗證的方式進行驗證。測試集為與訓練集沒有交集的圖像的集合,優(yōu)選地,圖像為人臉圖片。
在一個具體的實施例中,測試集制作方式為:將N個分類中除了用于制作訓練集的K個分類,剩下的N-K個分類的人臉照片用于制作測試集。測試集由隨機抽取的人臉圖片驗證對組成,抽取規(guī)則如下:
第n個分類的第a張人臉圖片,第n個分類的第b張人臉圖片(正樣本對)
...
第i個分類的第c張人臉圖片,第j個分類的第d張人臉圖片(負樣本對)
...
按照國際標準人臉驗證測試集的規(guī)則,此處正、負樣本對各取3000對,共6000對。測試規(guī)則為:將正樣本對中的兩張照片判斷成同一個人,則判斷正確,即xi=1;將負樣本對中的兩張照片判斷成不是同一個人,則判斷正確,即xi=1;其它則判斷錯誤,即xi=0。則測試精度定義為:
在其中一個實施例中,并不預先設置預設測試精度,預設精度的變化過程為先逐漸提升,當?shù)竭_某個精度之后將產生較大波動;這里把這個精度記為最大穩(wěn)定精度。因此,當測試精度不再穩(wěn)定提升時,即到達最大穩(wěn)定精度時,不再繼續(xù)訓練圖像對象驗證神經網絡,當前圖像對象驗證神經網絡即為最優(yōu)的圖像對象驗證神經網絡。取最優(yōu)的圖像對象驗證神經網絡中的一個圖像對象驗證特征提取模型,并僅以一張圖片為輸入、以圖像對象驗證特征為輸出、而省略圖像對象識別特征的輸出,從而得到最終的目標圖像對象驗證特征提取模型。
上述基于神經網絡的圖片特征提取建模方法,由于訓練模型的時候采用的全局損失代價函數(shù)值,不僅與第一圖片、第二圖片相關,還與第一圖片的第一分類、第二圖片的第二分類相關。因此,建模得到的圖像對象驗證特征模型與第一圖片的第一分類、第二圖片的第二分類相關。從而,可以達到將建模得到的圖像對象驗證特征模型應用在預設應用場景中進行圖像識別時,提高圖像識別精度的有益效果。
請繼續(xù)參閱圖1,在其中一個實施例中,步驟S140之后,步驟S160之前,還包括步驟:
獲取圖像對象識別神經網絡,并根據(jù)所述圖像對象識別神經網絡確定圖像對象驗證神經網絡。
獲取現(xiàn)有技術的進行圖像對象識別的圖像對象識別神經網絡,并根據(jù)所述圖像對象識別神經網絡確定圖像對象驗證神經網絡。
可以理解地,在其中一個圖像為人臉圖像的實施例中,圖像對象識別神經網絡為人臉身份識別神經網絡,優(yōu)選為,人臉身份識別深度神經網絡;圖像對象驗證神經網絡為人臉身份驗證神經網絡,優(yōu)選為,人臉身份驗證深度神經網絡。其中,人臉身份識別神經網絡和人臉身份驗證神經網絡的關系與圖像對象識別神經網絡和圖像對象驗證神經網絡的關系一致,故在此不作贅述。
請參閱圖2,在其中一個實施例中,所述圖像對象驗證神經網絡包括以圖像對象識別神經網絡的圖像對象識別特征提取模型為基礎確定的圖像對象驗證特征提取模型。
所述將所述第一圖片、所述第一分類、所述第二圖片及所述第二分類作為所述圖像對象驗證神經網絡的輸入,確定全局損失代價函數(shù)值的步驟,即S160,包括:
S261:將所述第一圖片與所述第一分類作為所述圖像對象驗證特征提取模型的模型輸入,確定第一對象特征與第一驗證特征,將所述第二圖片與所述第二分類作為所述圖像對象驗證特征提取模型的另一個模型輸入,確定第二對象特征與第二驗證特征;或者,所述圖像對象驗證特征提取模型包括相同的兩個,將所述第一圖片與所述第一分類作為其中一個所述圖像對象驗證特征提取模型的模型輸入,確定第一對象特征與第一驗證特征,將所述第二圖片與所述第二分類作為另一個所述圖像對象驗證特征提取模型的模型輸入,確定第二對象特征與第二驗證特征;。
具體地,可以將所述第一圖片與所述第一分類作為一個模型輸入、所述第二圖片與所述第二分類作為另一個模型輸入,分兩次先后作為所述圖像對象驗證神經網絡的所述圖像對象驗證特征提取模型的模型輸入,確定第一對象特征與第一驗證特征,以及第二對象特征與第二驗證特征。也可以是所述圖像對象驗證特征提取模型包括相同的兩個;將所述第一圖片與所述第一分類作為一個所述圖像對象驗證特征提取模型的模型輸入、將所述第二圖片與所述第二分類作為另一個所述圖像對象驗證特征提取模型的模型輸入,兩個圖像對象驗證特征提取模型并行執(zhí)行,最終分別確定第一對象特征與第一驗證特征,以及第二對象特征與第二驗證特征。
S263:根據(jù)所述第一對象特征及所述第一分類確定第一對象信息損失函數(shù)值。
可以采用現(xiàn)有神經網絡中常用的方式根據(jù)一個對象特征及一個分類確定損失函數(shù)值。具體地,根據(jù)第一對象特征確定一個得到的分類信息,根據(jù)得到的分類信息與獲取的第一分類是否屬于同一類別,確定識別結果,進而反應到損失函數(shù)值中。
S265:根據(jù)所述第二對象特征及所述第二分類確定第二對象信息損失函數(shù)值。
第二對象信息損失函數(shù)值與第一對象信息損失函數(shù)值的確定是一致的,故在此不作贅述。
S267:根據(jù)所述第一分類、所述第二分類、所述第一驗證特征及所述第二驗證特征確定驗證損失函數(shù)值。
具體地,驗證損失函數(shù)的公式為:
VerifyLoss=y(tǒng)d+(1-y)max(α-d,0)
其中,α為訓練參數(shù)中的特征距離閾值。VerifyLoss表示驗證損失函數(shù)值;y表示屬于同一分類;N1表示第一分類,N2表示第二分類;d為特征距離;表示第一驗證特征,表示第二驗證特征;表示二范數(shù)運算。
S269:根據(jù)所述第一對象信息損失函數(shù)值、所述第二對象信息損失函數(shù)值及所述驗證損失函數(shù)值確定全局損失代價函數(shù)值。
在本實施例中,全局損失代價函數(shù)值是關于第一對象信息損失函數(shù)值、第二對象信息損失函數(shù)值及驗證損失函數(shù)的線性函數(shù)值。具體地,全局損失代價函數(shù)的公式為:
Loss=Soft max Loss_1+Soft max Loss_2+VerifyLoss
其中,Loss為全局損失代價函數(shù)值,SoftmaxLoss_1為第一對象信息損失函數(shù)值;SoftmaxLoss_2為第二對象信息損失函數(shù)值;VerifyLoss為驗證損失函數(shù)值。
由于在訓練模型的過程中,全局損失代價函數(shù)值不僅與第一對象信息損失函數(shù)值及第二對象信息損失函數(shù)值相關,還與驗證損失函數(shù)值相關,因此,可以進一步提高將建模得到的圖像對象驗證特征模型應用在預設應用場景中時,圖像的識別精度。
請參閱圖3,在其中一個實施例中,步驟S340~S380依次對應為步驟S140~S180。所述圖像為人臉圖片;所述從預設應用場景的訓練集中獲取第一圖片、第二圖片、所述第一圖片的第一分類及所述第二圖片的第二分類的步驟(即步驟S340)之前,還包括:
S310:在所述預設應用場景中采集視頻圖片,并對所述視頻圖片進行人臉檢測得到人臉圖片。
使用攝像頭在預設應用場景中采集視頻圖片,并通過網絡傳輸和數(shù)據(jù)線存放在計算機中。通過現(xiàn)有方式對采集到的視頻圖片進行人臉檢測,將人臉圖片提取出來存儲在計算機硬盤中。
S320:獲取對所述人臉圖片進行分類的分類信息,根據(jù)所述分類信息對各所述人臉圖片進行分類,并對分類后的各所述人臉圖片進行人臉對齊處理,形成訓練集。
人工對檢測并提取出的人臉圖片進行分類,因此,計算機獲取人工輸入的分類信息,并根據(jù)分類信息分類。屬于相同分類的人臉照片放在一起并通過分類信息予以標記。
由于人臉圖片中的人臉角度和人臉位置是不一致的,為了保證提取到穩(wěn)定的特征并取得較好的人臉識別效果,需要通過現(xiàn)有方式對人臉圖片進行關鍵點對齊操作,以進行人臉對齊處理,去除人臉角度對人臉識別帶來的影響。其中,關鍵點包括眼睛、鼻尖和嘴角等的位置。如圖4所示為一個采集到的人臉圖片的,即進行人臉對齊處理前的示例圖,對齊后的人臉圖片如圖5所示。
請參閱圖6,在其中一個實施例中,所述根據(jù)所述損失代價函數(shù)值及訓練參數(shù)在所述訓練集上訓練所述圖像對象驗證神經網絡的步驟,即步驟S170,包括:
S671:獲取初始訓練參數(shù),根據(jù)所述全局損失代價函數(shù)值及所述初始訓練參數(shù)在所述訓練集上訓練所述圖像對象驗證神經網絡。
S673:更新訓練參數(shù),根據(jù)所述全局損失代價函數(shù)值及更新后的所述訓練參數(shù)在所述訓練集上訓練所述圖像對象驗證神經網絡。
如此,不斷調整圖像對象驗證神經網絡的訓練參數(shù)進行訓練,確定最優(yōu)地訓練參數(shù)。通過大量調試和試驗,發(fā)現(xiàn)針對本文描述的方法,特征距離閾值α=0.2且學習速率lr=0.001時,能得到最好的算法精度提升。
如圖7所示,本發(fā)明還提供一種應用上述基于神經網絡的圖像特征提取建模方法的圖像識別方法,包括:
S740:獲取待識別圖片,并將所述待識別圖片作為上述的基于神經網絡的圖像特征提取建模方法確定的目標圖像對象驗證特征提取模型的輸入,確定待識別驗證特征。
目標圖像對象驗證特征提取模型為通過上述基于神經網絡的圖像特征提取建模方法建立的目標圖像對象驗證特征提取模型。
具體地,通過攝像頭采集待識別圖片,并將該待識別圖片傳輸至計算機;計算機獲取該待識別圖片,將該待識別圖片輸入所建立的目標圖像對象驗證特征提取模型進行運算,從而可以確定待識別圖片的圖片特征,即待識別特征。
S760:將所述待識別驗證特征與訓練集中的圖片對應的圖片驗證特征進行對比,并將與所述待識別驗證特征距離最近的圖片驗證特征對應的圖片所屬的分類確定為所述待識別圖片的分類。
在本實施例中,預先通過目標圖像對象驗證特征提取模型確定訓練集中所有圖片的圖片驗證特征。確定待識別驗證特征之后,計算待識別驗證特征與訓練集中的各個圖片的圖片驗證特征的距離;與待識別驗證特征距離最近的圖片驗證特征對應的圖片所屬的分類即為待識別圖片的分類。
上述圖像識別方法,由于通過上述基于神經網絡的圖像特征提取建模方法確定的目標圖像對象驗證特征提取模型確定待識別驗證特征,并通過該待識別驗證特征與訓練集中的圖片驗證特征進行對比,最終確定待識別圖片的分類,因此,上述圖像識別方法的識別精度高。
請繼續(xù)參閱圖7,在其中一個實施例中,還包括:
S720:獲取目標圖像對象驗證特征提取模型。
本發(fā)明還提供一種與基于神經網絡的圖像特征提取建模方法對應的虛擬裝置。如圖8所示,一個實施例的基于神經網絡的圖像特征提取建模裝置,包括:
圖片分類獲取模塊840,用于從預設應用場景的訓練集中獲取第一圖片、第二圖片、所述第一圖片的第一分類及所述第二圖片的第二分類;
損失代價確定模塊860,用于將所述第一圖片、所述第一分類、所述第二圖片及所述第二分類作為圖像對象驗證神經網絡的輸入,確定全局損失代價函數(shù)值;
神經網絡訓練模塊870,用于根據(jù)所述全局損失代價函數(shù)值及訓練參數(shù)在所述訓練集上訓練所述圖像對象驗證神經網絡;
特征模型確定模塊880,用于通過所述預設應用場景的測試集對所述圖像對象驗證神經網絡進行測試,并根據(jù)測試結果確定測試精度,根據(jù)所述測試精度及所述圖像對象驗證神經網絡確定目標圖像對象驗證特征提取模型。
上述基于神經網絡的圖像特征提取建模裝置,由于訓練模型的時候采用的全局損失代價函數(shù)值,不僅與第一圖片、第二圖片相關,還與第一圖片的第一分類、第二圖片的第二分類相關。因此,建模得到的圖像對象驗證特征模型與第一圖片的第一分類、第二圖片的第二分類相關。從而,可以達到將建模得到的圖像對象驗證特征模型應用在預設應用場景中進行圖像識別時,提高圖像識別精度的有益效果。
請參閱圖9,在其中一個實施例中,還包括:
網絡獲取確定模塊950,用于獲取圖像對象識別神經網絡,并根據(jù)所述圖像對象識別神經網絡確定圖像對象驗證神經網絡。
請繼續(xù)參閱圖9,在其中一個實施例中,所述圖像對象驗證神經網絡包括以圖像對象識別神經網絡的圖像對象識別特征提取模型為基礎確定的圖像對象驗證特征提取模型。所述損失代價確定模塊960,包括:
圖片特征確定單元961(圖未示),用于圖片特征確定單元,用于將所述第一圖片與所述第一分類作為所述圖像對象驗證特征提取模型的模型輸入,確定第一對象特征與第一驗證特征,將所述第二圖片與所述第二分類作為所述圖像對象驗證特征提取模型的另一個模型輸入,確定第二對象特征與第二驗證特征;或者,所述圖像對象驗證特征提取模型包括相同的兩個;圖片特征確定單元961,用于將所述第一圖片與所述第一分類作為其中一個所述圖像對象驗證特征提取模型的模型輸入,確定第一對象特征與第一驗證特征,將所述第二圖片與所述第二分類作為另一個所述圖像對象驗證特征提取模型的模型輸入,確定第二對象特征與第二驗證特征;
第一損失確定單元(圖未示),用于根據(jù)所述第一對象特征及所述第一分類確定第一對象信息損失函數(shù)值;
第二損失確定單元(圖未示),用于根據(jù)所述第二對象特征及所述第二分類確定第二對象信息損失函數(shù)值;
驗證損失確定單元(圖未示),用于根據(jù)所述第一分類、所述第二分類、所述第一驗證特征及所述第二驗證特征確定驗證損失函數(shù)值;
全局損失確定單元(圖未示),用于根據(jù)所述第一對象信息損失函數(shù)值、所述第二對象信息損失函數(shù)值及所述驗證損失函數(shù)值確定全局損失代價函數(shù)值。
請繼續(xù)參閱圖9,在其中一個實施例中,所述圖像為人臉圖片;所述裝置,還包括:
圖片采集檢測模塊910,用于在所述預設應用場景中采集視頻圖片,并對所述視頻圖片進行人臉檢測得到人臉圖片;
圖片分類對齊模塊920,用于獲取對所述人臉圖片進行分類的分類信息,根據(jù)各所述分類信息對所述人臉圖片進行分類,并對分類后的各所述人臉圖片進行人臉對齊處理,形成訓練集。
在其中一個實施例中,所述神經網絡訓練模塊970,包括:
初始參數(shù)訓練單元971,用于獲取初始訓練參數(shù),根據(jù)所述全局損失代價函數(shù)值及所述初始訓練參數(shù)在所述訓練集上訓練所述圖像對象驗證神經網絡;
更新參數(shù)訓練單元973,用于更新訓練參數(shù),根據(jù)所述全局損失代價函數(shù)值及更新后的所述訓練參數(shù)在所述訓練集上訓練所述圖像對象驗證神經網絡。
本發(fā)明還提供一種與圖像識別方法對應的虛擬裝置。如圖10所示,一個實施例的圖像識別裝置,包括:
待識特征確定模塊1040,用于獲取待識別圖片,并將所述待識別圖片作為上述的基于神經網絡的圖像特征提取建模裝置確定的目標圖像對象驗證特征提取模型的輸入,確定待識別驗證特征;
對比分類確定模塊1060,用于將所述待識別驗證特征與訓練集中的圖片對應的圖片驗證特征進行對比,并將與所述待識別驗證特征距離最近的圖片驗證特征對應的圖片所屬的分類確定為所述待識別圖片的分類。
上述圖像識別裝置,由于根據(jù)通過上述基于神經網絡的圖像特征提取建模裝置確定的目標圖像對象驗證特征提取模型確定待識別驗證特征,并通過該待識別驗證特征與訓練集中的圖片驗證特征進行對比,最終確定待識別圖片的分類,因此,上述圖像識別裝置的識別精度高。
在其中一個實施例中,還包括:
特征模型獲取模塊1020,用于獲取目標圖像對象驗證特征提取模型。
以上實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發(fā)明專利范圍的限制。應當指出的是,對于本領域的普通技術人員來說,在不脫離本發(fā)明構思的前提下,還可以做出多個變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應以所附權利要求為準。