本公開涉及圖像處理領(lǐng)域,特別涉及一種模型訓(xùn)練方法及裝置。
背景技術(shù):
人臉識別技術(shù)被廣泛應(yīng)用于相機(jī)的自動對焦、門禁系統(tǒng)和身份辨識等不同領(lǐng)域,目前的人臉識別技術(shù)通常是根據(jù)預(yù)先訓(xùn)練的人臉識別模型對人臉圖像進(jìn)行識別。
在訓(xùn)練人臉識別模型時,需要從一個或多個預(yù)設(shè)圖像中提取訓(xùn)練樣本集,預(yù)設(shè)圖像中通常包括人臉圖像以及非人臉圖像,因此提取到的訓(xùn)練樣本集中通常包括若干個正樣本以及若干個負(fù)樣本,正樣本是預(yù)設(shè)圖像中包含的人臉圖像,負(fù)樣本是預(yù)設(shè)圖像中包含的非人臉圖像,通過對訓(xùn)練樣本集中包括的各個樣本進(jìn)行訓(xùn)練得到人臉識別模型。由于計算機(jī)速度和內(nèi)存的限制,選取出來的訓(xùn)練樣本集中通常僅能包含有限個數(shù)的樣本,因此,在從預(yù)設(shè)圖像中提取訓(xùn)練樣本集時,通常是從預(yù)設(shè)圖像中隨機(jī)提取部分圖像作為樣本,無法涵蓋所有的人臉圖像和非人臉圖像,最終導(dǎo)致訓(xùn)練得到人臉識別模型不夠準(zhǔn)確。
技術(shù)實現(xiàn)要素:
為了解決由于樣本數(shù)量有限而導(dǎo)致訓(xùn)練得到的的人臉識別模型不夠準(zhǔn)確的問題,本公開提供一種模型訓(xùn)練方法及裝置。所述技術(shù)方案如下:
根據(jù)本公開實施例的第一方面,提供一種模型訓(xùn)練方法,該方法包括:
從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,訓(xùn)練樣本集是測試樣本集的子集,訓(xùn)練樣本集中包括正樣本和負(fù)樣本,訓(xùn)練樣本集中的負(fù)樣本的個數(shù)小于測試樣本集中的負(fù)樣本的個數(shù);
根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別;
根據(jù)識別錯誤的樣本更新識別模型;
其中,正樣本是包括預(yù)定類型的圖像的樣本,負(fù)樣本是不包括預(yù)定類型的圖像的樣本。
可選的,根據(jù)識別錯誤的樣本更新識別模型,包括:
計算根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別時的錯誤率,錯誤率是識別錯誤的樣本在測試樣本集包括的樣本中所占的比例;
當(dāng)錯誤率達(dá)到預(yù)設(shè)閾值時,根據(jù)識別錯誤的樣本更新識別模型。
可選的,測試樣本集中包括正樣本和負(fù)樣本,該方法還包括:
對于測試樣本集中包括的每個樣本,確定樣本的樣本屬性,樣本屬性用于指示樣本是正樣本或負(fù)樣本;
當(dāng)識別到樣本中包括預(yù)定類型的圖像且樣本屬性用于指示樣本是負(fù)樣本時,或者,當(dāng)識別到樣本中不包括預(yù)定類型的圖像且樣本屬性用于指示樣本是正樣本時,確定樣本是識別錯誤的樣本。
可選的,訓(xùn)練樣本集中包括測試樣本集中的全部正樣本以及部分負(fù)樣本;根據(jù)識別錯誤的樣本更新識別模型,包括:
根據(jù)測試樣本集中的目標(biāo)負(fù)樣本更新識別模型,目標(biāo)負(fù)樣本是識別到的包括預(yù)定類型的圖像的負(fù)樣本。
可選的,根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別,包括:
根據(jù)識別模型對測試樣本集中除訓(xùn)練樣本集中的樣本之外的其他樣本進(jìn)行識別。
根據(jù)本公開實施例的第二方面,提供一種模型訓(xùn)練裝置,該裝置包括:
選取模塊,被配置為從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,訓(xùn)練樣本集是測試樣本集的子集,訓(xùn)練樣本集中包括正樣本和負(fù)樣本,訓(xùn)練樣本集中的負(fù)樣本的個數(shù)小于測試樣本集中的負(fù)樣本的個數(shù);
識別模塊,被配置為根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別;
更新模塊,被配置為根據(jù)識別錯誤的樣本更新識別模型;
其中,正樣本是包括預(yù)定類型的圖像的樣本,負(fù)樣本是不包括預(yù)定類型的圖像的樣本。
可選的,更新模塊包括:
計算子模塊,被配置為計算根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別時的錯誤率,錯誤率是識別錯誤的樣本在測試樣本集包括的樣本中所占的比例;
更新子模塊,被配置為當(dāng)錯誤率達(dá)到預(yù)設(shè)閾值時,根據(jù)識別錯誤的樣本更新識別模型。
可選的,測試樣本集中包括正樣本和負(fù)樣本,該裝置還包括:
第一確定模塊,被配置為對于測試樣本集中包括的每個樣本,確定樣本的樣本屬性,樣本屬性用于指示樣本是正樣本或負(fù)樣本;
第二確定模塊,被配置為當(dāng)識別到樣本中包括預(yù)定類型的圖像且樣本屬性用于指示樣本是負(fù)樣本時,或者,當(dāng)識別到樣本中不包括預(yù)定類型的圖像且樣本屬性用于指示樣本是正樣本時,確定樣本是識別錯誤的樣本。
可選的,訓(xùn)練樣本集中包括測試樣本集中的全部正樣本以及部分負(fù)樣本;
更新模塊,還被配置為根據(jù)測試樣本集中的目標(biāo)負(fù)樣本更新識別模型,目標(biāo)負(fù)樣本是識別到的包括預(yù)定類型的圖像的負(fù)樣本。
可選的,識別模塊,還被配置為根據(jù)識別模型對測試樣本集中除訓(xùn)練樣本集中的樣本之外的其他樣本進(jìn)行識別。
根據(jù)本公開實施例的第三方面,提供一種模型訓(xùn)練裝置,該裝置包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,處理器被配置為:
從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,訓(xùn)練樣本集是測試樣本集的子集,訓(xùn)練樣本集中包括正樣本和負(fù)樣本,訓(xùn)練樣本集中的負(fù)樣本的個數(shù)小于測試樣本集中的負(fù)樣本的個數(shù);
根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別;
根據(jù)識別錯誤的樣本更新識別模型;
其中,正樣本是包括預(yù)定類型的圖像的樣本,負(fù)樣本是不包括預(yù)定類型的圖像的樣本。
本公開的實施例提供的技術(shù)方案可以包括以下有益效果:
通過從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別,根據(jù)識別錯誤的樣本更新識別模型;解決了由于樣本數(shù)量有限而導(dǎo)致訓(xùn)練得到的人臉識別模型不夠準(zhǔn)確問題;在通過數(shù)量有限的樣本訓(xùn)練得到識別模型后,再次根據(jù)識別錯誤的樣本更新識別模型,可以對識別模型不斷進(jìn)行優(yōu)化,提高了識別模型在進(jìn)行識別時的準(zhǔn)確性。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并于說明書一起用于解釋本公開的原理。
圖1是根據(jù)一示例性實施例示出的一種模型訓(xùn)練方法的流程圖;
圖2是根據(jù)另一示例性實施例示出的一種模型訓(xùn)練方法的流程圖;
圖3是根據(jù)另一示例性實施例示出的一種模型訓(xùn)練方法的流程圖;
圖4是根據(jù)一示例性實施例示出的一種模型訓(xùn)練裝置的框圖;
圖5是根據(jù)另一示例性實施例示出的一種模型訓(xùn)練裝置的框圖;
圖6是根據(jù)一示例性實施例示出的一種終端設(shè)備的框圖。
具體實施方式
這里將詳細(xì)地對示例性實施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本公開相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
本公開各個實施例提供的模型訓(xùn)練方法,可以用于諸如便攜式計算機(jī)、臺式計算機(jī)、智能手機(jī)和平板電腦等終端設(shè)備中,該模型訓(xùn)練方法由終端設(shè)備中的處理器來實現(xiàn)??蛇x的,處理器是終端設(shè)備中的GPU(Graphics Processing Unit,圖形處理器)或CPU(Central Processing Unit,中央處理器)。
圖1是根據(jù)一示例性實施例示出的一種模型訓(xùn)練方法的流程圖,該方法可以用于上述終端設(shè)備中,該方法包括如下幾個步驟:
在步驟101中,從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型。
其中,訓(xùn)練樣本集是測試樣本集的子集,訓(xùn)練樣本集中包括正樣本和負(fù)樣本,訓(xùn)練樣本集中的負(fù)樣本的個數(shù)小于測試樣本集中的負(fù)樣本的個數(shù)。正樣本是包括預(yù)定類型的圖像的樣本,負(fù)樣本是不包括預(yù)定類型的圖像的樣本。
在步驟102中,根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別。
在步驟103中,根據(jù)識別錯誤的樣本更新識別模型。
綜上所述,本公開實施例提供的模型訓(xùn)練方法,通過從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別,根據(jù)識別錯誤的樣本更新識別模型;解決了由于樣本數(shù)量有限而導(dǎo)致的訓(xùn)練得到的人臉識別模型不夠準(zhǔn)確的問題;在通過數(shù)量有限的樣本訓(xùn)練得到識別模型后,再次根據(jù)識別錯誤的樣本更新識別模型,可以對識別模型不斷進(jìn)行優(yōu)化,提高了識別模型在進(jìn)行識別時的準(zhǔn)確性。
圖2是根據(jù)一示例性實施例示出的一種模型訓(xùn)練方法的流程圖,該方法可以用于上述終端設(shè)備中,該方法包括如下步驟:
在步驟201中,從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型。
測試樣本集中包括正樣本和負(fù)樣本,正樣本是包括預(yù)定類型的圖像的樣本,負(fù)樣本是不包括預(yù)定類型的圖像的樣本。測試樣本集中的樣本是用戶預(yù)先輸入的或者終端設(shè)備獲取到的一個圖片,和/或,測試樣本集中的樣本是用戶預(yù)先輸入的或終端設(shè)備獲取到的一個圖片中的部分區(qū)域??蛇x的,終端設(shè)備在接收用戶輸入的圖片或者獲取到圖片后,還對圖片進(jìn)行諸如圖像灰度化、均值濾波和歸一化等預(yù)處理。
可選的,每個正樣本對應(yīng)于用于指示樣本是正樣本的第一預(yù)設(shè)標(biāo)識,每個負(fù)樣本對應(yīng)于用于指示樣本是負(fù)樣本的第二預(yù)設(shè)標(biāo)識;或者,每個正樣本對應(yīng)于用于指示樣本是正樣本的預(yù)設(shè)標(biāo)識,負(fù)樣本不包含預(yù)設(shè)標(biāo)識。本實施例以正樣本對應(yīng)于用于指示樣本是正樣本的預(yù)設(shè)標(biāo)識,負(fù)樣本不包含預(yù)設(shè)標(biāo)識為例進(jìn)行說明。
在實際實現(xiàn)時,用戶將一個或多個圖片輸入終端設(shè)備時,對正樣本設(shè)置第一預(yù)設(shè)標(biāo)識,對負(fù)樣本設(shè)置第二預(yù)設(shè)標(biāo)識;或者,對正樣本設(shè)置預(yù)設(shè)標(biāo)識,對負(fù)樣本不設(shè)置預(yù)設(shè)標(biāo)識。
可選的,預(yù)定類型是人臉、數(shù)字、車輛和建筑物等任意類型,預(yù)定類型是識別模型用于識別的圖像的類型,比如,識別模型用于識別人臉時,預(yù)定類型是人臉。本實施例以預(yù)定類型是人臉為例進(jìn)行說明,則正樣本是包括人臉的樣本,負(fù)樣本是不包括人臉的樣本??蛇x的,負(fù)樣本是包括部分預(yù)定類型的圖像的樣本,比如,負(fù)樣本是包括半張人臉的樣本。
訓(xùn)練樣本集是測試樣本集的子集,訓(xùn)練樣本集中包括正樣本和負(fù)樣本,終端設(shè)備從測試樣本集中隨機(jī)選取若干個正樣本作為訓(xùn)練樣本集中的正樣本,從測試樣本集中隨機(jī)選取若干個負(fù)樣本作為訓(xùn)練樣本集中的負(fù)樣本。訓(xùn)練樣本集中的負(fù)樣本的個數(shù)小于測試樣本集中的負(fù)樣本的個數(shù),訓(xùn)練樣本集中的正樣本的個數(shù)小于或者等于測試樣本集中的正樣本的個數(shù)。通常情況下,訓(xùn)練樣本集中包含的負(fù)樣本的個數(shù)大于正樣本的個數(shù)。
可選的,終端設(shè)備對正樣本以及負(fù)樣本提取樣本特征,并根據(jù)預(yù)定算法對樣本特征訓(xùn)練得到識別模型。可選的,預(yù)定算法包括人工神經(jīng)網(wǎng)絡(luò)、Adaboost、SVM(Support Vector Machine,支持向量機(jī))、遺傳算法和樸素貝葉斯中的至少一種??蛇x的,人工神經(jīng)網(wǎng)絡(luò)可以是R-CNN(Region-based Convolutional Neural Networks,基于區(qū)域候選的深度卷積網(wǎng)絡(luò))、Fast R-CNN算法或Faster R-CNN算法。
在步驟202中,根據(jù)識別模型對測試樣本集中除訓(xùn)練樣本集中的樣本之外的其他樣本進(jìn)行識別。
對于測試樣本集中除訓(xùn)練樣本集中的樣本之外的每個樣本,終端設(shè)備提取樣本的樣本特征,將這些樣本特征輸入識別模型中,當(dāng)識別到樣本中包括預(yù)定類型的圖像時,表示根據(jù)識別模型將該樣本識別為正樣本;當(dāng)識別到樣本中不包括預(yù)定類型的圖像時,表示根據(jù)識別模型將該樣本識別為負(fù)樣本。
在步驟203中,對于測試樣本集中包括的每個樣本,確定樣本的樣本屬性,樣本屬性用于指示樣本是正樣本或負(fù)樣本。
終端設(shè)備通過檢測樣本是否包含預(yù)設(shè)標(biāo)識確定樣本的樣本屬性,當(dāng)檢測到樣本包含預(yù)設(shè)標(biāo)識時,確定樣本屬性用于指示樣本是正樣本;當(dāng)檢測到樣本不包含預(yù)設(shè)標(biāo)識時,確定樣本用于指示樣本是負(fù)樣本?;蛘?,當(dāng)檢測到樣本包含第一預(yù)設(shè)標(biāo)識時,確定樣本屬性用于指示樣本是正樣本;當(dāng)檢測到樣本包含第二預(yù)設(shè)標(biāo)識時,確定樣本用于指示樣本是負(fù)樣本。
在步驟204中,當(dāng)識別到樣本中包括預(yù)定類型的圖像且樣本屬性用于指示樣本是負(fù)樣本時,或者,當(dāng)識別到樣本中不包括預(yù)定類型的圖像且樣本屬性用于指示樣本是正樣本時,確定樣本是識別錯誤的樣本。
當(dāng)訓(xùn)練樣本集中包括的正樣本的個數(shù)也小于測試樣本集中包括的正樣本的個數(shù)時,終端設(shè)備會存在在正樣本中未識別到預(yù)定類型的圖像的情況,也會存在在負(fù)樣本中識別到預(yù)定類型的圖像的情況,在這些情況下,終端設(shè)備都認(rèn)為這些樣本都是識別錯誤的樣本。
在步驟205中,計算根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別時的錯誤率。
其中,錯誤率是識別錯誤的樣本在測試樣本集包括的樣本中所占的比例。
可選的,當(dāng)訓(xùn)練樣本集中包括的正樣本的個數(shù)小于測試樣本集中包括的正樣本的個數(shù),且訓(xùn)練樣本集中包括的負(fù)樣本的個數(shù)小于測試樣本集中包括的負(fù)樣本的個數(shù)時,錯誤率包括第一錯誤率和第二錯誤率。該步驟包括:計算識別到的不包括預(yù)定類型的圖像的正樣本在測試樣本集中所有正樣本中所占的比例作為第一錯誤率,計算識別到的不包括預(yù)定類型的圖像的正樣本在測試樣本集中所有正樣本中所占的比例作為第二錯誤率。比如,當(dāng)預(yù)定類型的圖像是人臉圖像時,測試樣本集中包括2000個正樣本,4000個負(fù)樣本,未識別到人臉的正樣本包括50個,識別到人臉的負(fù)樣本包括400個,則第一錯誤率為2.5%,第二錯誤率為10%。
在步驟206中,當(dāng)錯誤率達(dá)到預(yù)設(shè)閾值時,根據(jù)識別錯誤的樣本更新識別模型。
可選的,當(dāng)?shù)谝诲e誤率達(dá)到預(yù)設(shè)閾值時,將識別錯誤的正樣本加入訓(xùn)練樣本集中,補(bǔ)充訓(xùn)練樣本集中的正樣本;當(dāng)?shù)诙e誤率達(dá)到預(yù)設(shè)閾值時,將識別錯誤的負(fù)樣本加入訓(xùn)練樣本集,補(bǔ)充訓(xùn)練樣本集中的負(fù)樣本。使用識別錯誤的樣本再次對識別模型進(jìn)行迭代以更新識別模型。其中,預(yù)設(shè)閾值是系統(tǒng)預(yù)設(shè)值或用戶自定義值,本實施例對預(yù)設(shè)閾值的取值不作限定。
在步驟207中,當(dāng)錯誤率小于預(yù)設(shè)閾值時,結(jié)束流程。
綜上所述,本公開實施例中提供的模型訓(xùn)練方法,通過從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別,根據(jù)識別錯誤的樣本更新識別模型;解決了由于樣本數(shù)量有限而導(dǎo)致訓(xùn)練得到的人臉識別模型不夠準(zhǔn)確問題;在通過數(shù)量有限的樣本訓(xùn)練得到識別模型后,再次根據(jù)識別錯誤的樣本更新識別模型,可以對識別模型不斷進(jìn)行優(yōu)化,提高了識別模型在進(jìn)行識別時的準(zhǔn)確性。
可選的,在基于上述實施例的其他可選實施例中,由于測試樣本集中包括的正樣本的個數(shù)通常較少,且為了提高召回率,因此,通常可以選取測試樣本集中的所有正樣本作為訓(xùn)練樣本集中的樣本,則訓(xùn)練樣本集中包括測試樣本集中的全部正樣本以及部分負(fù)樣本,則上述步驟204-步驟206可被替代實現(xiàn)為如下步驟,如圖3所示:
在步驟301中,當(dāng)識別到樣本中包括預(yù)定類型的圖像且樣本屬性用于指示樣本是負(fù)樣本時,確定樣本是識別錯誤的樣本。
當(dāng)訓(xùn)練樣本集中包括測試樣本集中的全部正樣本時,終端設(shè)備在根據(jù)識別模型對測試樣本集中的樣本進(jìn)行識別時,可以將所有包含預(yù)定類型的圖像的樣本都識別出來,但仍然會存在在負(fù)樣本中識別到預(yù)定類型的圖像的情況,因此,識別錯誤的樣本僅包括識別到預(yù)定類型的圖像的負(fù)樣本。
在步驟302中,計算識別到的包括預(yù)定類型的圖像的負(fù)樣本在測試樣本集中所有負(fù)樣本中所占的比例為錯誤率。
在步驟303中,根據(jù)測試樣本集中的目標(biāo)負(fù)樣本更新識別模型,目標(biāo)負(fù)樣本是識別到的包括預(yù)定類型的圖像的負(fù)樣本。
下述為本公開裝置實施例,可以用于執(zhí)行本公開方法實施例。對于本公開裝置實施例中未披露的細(xì)節(jié),請參照本公開方法實施例。
圖4是根據(jù)一示例性實施例示出的一種模型訓(xùn)練裝置的框圖,如圖4所示,該裝置可以通過硬件、軟件或兩者的結(jié)合實現(xiàn)成為上述終端設(shè)備,該裝置包括但不限于:
選取模塊410,被配置為從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,訓(xùn)練樣本集是測試樣本集的子集,訓(xùn)練樣本集中包括正樣本和負(fù)樣本,訓(xùn)練樣本集中的負(fù)樣本的個數(shù)小于測試樣本集中的負(fù)樣本的個數(shù)。其中,正樣本是包括預(yù)定類型的圖像的樣本,負(fù)樣本是不包括預(yù)定類型的圖像的樣本。
識別模塊420,被配置為根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別。
更新模塊430,被配置為根據(jù)識別錯誤的樣本更新識別模型。
綜上所述,本公開實施例提供的模型訓(xùn)練裝置,通過從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別,根據(jù)識別錯誤的樣本更新識別模型;解決了由于樣本數(shù)量有限而導(dǎo)致訓(xùn)練得到的人臉識別模型不夠準(zhǔn)確問題;在通過數(shù)量有限的樣本訓(xùn)練得到識別模型后,再次根據(jù)識別錯誤的樣本更新識別模型,可以對識別模型不斷進(jìn)行優(yōu)化,提高了識別模型在進(jìn)行識別時的準(zhǔn)確性。
圖5是根據(jù)一示例性實施例示出的一種模型訓(xùn)練裝置的框圖,如圖5所示,該裝置可以通過硬件、軟件或兩者的結(jié)合實現(xiàn)成為上述終端設(shè)備,該裝置包括但不限于:
選取模塊510,被配置為從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,訓(xùn)練樣本集是測試樣本集的子集,訓(xùn)練樣本集中包括正樣本和負(fù)樣本,訓(xùn)練樣本集中的負(fù)樣本的個數(shù)小于測試樣本集中的負(fù)樣本的個數(shù)。
識別模塊520,被配置為根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別。
識別模塊520,還被配置為根據(jù)識別模型對測試樣本集中除訓(xùn)練樣本集中的樣本之外的其他樣本進(jìn)行識別。
第一確定模塊530,被配置為對于測試樣本集中包括的每個樣本,確定樣本的樣本屬性,樣本屬性用于指示樣本是正樣本或負(fù)樣本。
第二確定模塊540,被配置為當(dāng)識別到樣本中包括預(yù)定類型的圖像且樣本屬性用于指示樣本是負(fù)樣本時,或者,當(dāng)識別到樣本中不包括預(yù)定類型的圖像且樣本屬性用于指示樣本是正樣本時,確定樣本是識別錯誤的樣本。
更新模塊550,被配置為根據(jù)識別錯誤的樣本更新識別模型。
可選的,更新模塊550包括:
計算子模塊551,被配置為計算根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別時的錯誤率,錯誤率是識別錯誤的樣本在測試樣本集包括的樣本中所占的比例。
更新子模塊552,被配置為當(dāng)錯誤率達(dá)到預(yù)設(shè)閾值時,根據(jù)識別錯誤的樣本更新識別模型。
可選的,訓(xùn)練樣本集中包括測試樣本集中的全部正樣本以及部分負(fù)樣本;更新模塊550,還被配置為根據(jù)測試樣本集中的目標(biāo)負(fù)樣本更新識別模型,目標(biāo)負(fù)樣本是識別到的包括預(yù)定類型的圖像的負(fù)樣本。
綜上所述,本公開實施例提供的模型訓(xùn)練裝置,通過從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別,根據(jù)識別錯誤的樣本更新識別模型;解決了由于樣本數(shù)量有限而導(dǎo)致訓(xùn)練得到的人臉識別模型不夠準(zhǔn)確問題;在通過數(shù)量有限的樣本訓(xùn)練得到識別模型后,再次根據(jù)識別錯誤的樣本更新識別模型,可以對識別模型不斷進(jìn)行優(yōu)化,提高了識別模型在進(jìn)行識別時的準(zhǔn)確性。
關(guān)于上述實施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
本公開一示例性實施例提供了一種模型訓(xùn)練裝置,能夠?qū)崿F(xiàn)本公開提供的模型訓(xùn)練方法,該裝置包括:處理器、用于存儲處理器可執(zhí)行指令的存儲器;
其中,處理器被配置為:
從測試樣本集中選取訓(xùn)練樣本集,根據(jù)訓(xùn)練樣本集中包括的樣本訓(xùn)練得到識別模型,訓(xùn)練樣本集是測試樣本集的子集,訓(xùn)練樣本集中包括正樣本和負(fù)樣本,訓(xùn)練樣本集中的負(fù)樣本的個數(shù)小于測試樣本集中的負(fù)樣本的個數(shù);
根據(jù)識別模型對測試樣本集中包括的樣本進(jìn)行識別;
根據(jù)識別錯誤的樣本更新識別模型;
其中,正樣本是包括預(yù)定類型的圖像的樣本,負(fù)樣本是不包括預(yù)定類型的圖像的樣本。
圖6是根據(jù)一示例性實施例示出的一種模型訓(xùn)練裝置的框圖。例如,裝置600可以是移動電話,計算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,個人數(shù)字助理等。
參照圖6,裝置600可以包括以下一個或多個組件:處理組件602,存儲器604,電源組件606,多媒體組件608,音頻組件610,輸入/輸出(I/O)接口612,傳感器組件614,以及通信組件616。
處理組件602通??刂蒲b置600的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件602可以包括一個或多個處理器618來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件602可以包括一個或多個模塊,便于處理組件602和其他組件之間的交互。例如,處理組件602可以包括多媒體模塊,以方便多媒體組件608和處理組件602之間的交互。
存儲器604被配置為存儲各種類型的數(shù)據(jù)以支持在裝置600的操作。這些數(shù)據(jù)的示例包括用于在裝置600上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器604可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機(jī)存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。
電源組件606為裝置600的各種組件提供電力。電源組件606可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置600生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件608包括在裝置600和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件608包括一個前置攝像頭和/或后置攝像頭。當(dāng)裝置600處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
音頻組件610被配置為輸出和/或輸入音頻信號。例如,音頻組件610包括一個麥克風(fēng)(MIC),當(dāng)裝置600處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進(jìn)一步存儲在存儲器604或經(jīng)由通信組件616發(fā)送。在一些實施例中,音頻組件610還包括一個揚聲器,用于輸出音頻信號。
I/O接口612為處理組件602和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
傳感器組件614包括一個或多個傳感器,用于為裝置600提供各個方面的狀態(tài)評估。例如,傳感器組件614可以檢測到裝置600的打開/關(guān)閉狀態(tài),組件的相對定位,例如組件為裝置600的顯示器和小鍵盤,傳感器組件614還可以檢測裝置600或裝置600一個組件的位置改變,用戶與裝置600接觸的存在或不存在,裝置600方位或加速/減速和裝置600的溫度變化。傳感器組件614可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件614還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實施例中,該傳感器組件614還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件616被配置為便于裝置600和其他設(shè)備之間有線或無線方式的通信。裝置600可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如Wi-Fi,2G或3G,或它們的組合。在一個示例性實施例中,通信組件616經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,通信組件616還包括近場通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來實現(xiàn)。
在示例性實施例中,裝置600可以被一個或多個應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述模型訓(xùn)練方法。
在示例性實施例中,還提供了一種包括指令的非臨時性計算機(jī)可讀存儲介質(zhì),例如包括指令的存儲器604,上述指令可由裝置600的處理器618執(zhí)行以完成上述模型訓(xùn)練方法。例如,非臨時性計算機(jī)可讀存儲介質(zhì)可以是ROM、隨機(jī)存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。
本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。