本發(fā)明涉及圖像識別領(lǐng)域,尤其是涉及一種基于光滑多示例學(xué)習(xí)的目標(biāo)識別方法。
背景技術(shù):
:多示例學(xué)習(xí)是1997年由dietterich等人提出來的,當(dāng)時主要用在藥物活性預(yù)測上面。在那之后由于多示例學(xué)習(xí)在機器學(xué)習(xí)和機器視覺上的廣泛應(yīng)用,大量的多示例學(xué)習(xí)方法被提了出來。1998年dd(diversedensity)被提出來,這種方法通過在許多不同正包和少量負(fù)包中尋找區(qū)塊的方式來處理多示例學(xué)習(xí)問題,之后此方法又被發(fā)展成dd-svm。2002年和2005年有s.andrews和c.zhang等人分別提出了misvm和milboost方法,他們通過訓(xùn)練svm和boosting分類器進(jìn)行示例分類。最近2015年j.wu等人建立了一個深度學(xué)習(xí)框架和用bag-of-word模型來解決大規(guī)模的多示例學(xué)習(xí)問題。目前,通過多示例學(xué)習(xí)來進(jìn)行圖像中目標(biāo)識別的方法主要有以下三種:(1)有監(jiān)督的圖像目標(biāo)識別嚴(yán)重依賴于人工的參與,需要人工對圖像是否含有目標(biāo)物體進(jìn)行標(biāo)記,還要對含有物體的圖片中物體的位置進(jìn)行標(biāo)記。在樣本量很大的情況下,這是非常費時費力的,還有一定的局限性。(2)并不是所有的多示例學(xué)習(xí)方法都可以識別一個包中示例的標(biāo)簽,有些多示例學(xué)習(xí)方法只對包級別樣本進(jìn)行了分類。(3)在傳統(tǒng)的多示例學(xué)習(xí)方法中,用來在正樣本中定位目標(biāo)物體的檢測器是同過同一個樣本訓(xùn)練得到的,這使得在同一個窗口進(jìn)行重定位時產(chǎn)生偏重。以上三種方法由于自身的缺陷都未能得到很好的識別效果。技術(shù)實現(xiàn)要素:本發(fā)明的目的是針對上述問題提供一種基于光滑多示例學(xué)習(xí)的目標(biāo)識別方法。本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):一種基于光滑多示例學(xué)習(xí)的目標(biāo)識別方法,所述方法包括樣本訓(xùn)練步驟和目標(biāo)識別步驟,所述樣本訓(xùn)練步驟具體為:a1)提取訓(xùn)練圖片的示例特征;a2)根據(jù)步驟a1)提取的示例特征,進(jìn)行光滑處理得到示例相關(guān)的連續(xù)概率模型;a3)根據(jù)步驟a2)得到的示例相關(guān)的連續(xù)概率模型進(jìn)行訓(xùn)練,得到訓(xùn)練權(quán)重w;所述目標(biāo)識別步驟具體為:b1)提取待檢測圖片的示例特征;b2)根據(jù)步驟b1)得到的待檢測圖片的示例特征和步驟a3)得到的訓(xùn)練權(quán)重,計算確定待檢測圖片中是否存在需要識別的目標(biāo)。所述步驟a1)具體為:a11)以每張訓(xùn)練圖片作為一個訓(xùn)練包,產(chǎn)生與每一個訓(xùn)練包相對應(yīng)的示例;a12)對步驟a11)產(chǎn)生的所有示例進(jìn)行特征提取,得到每一個示例的特征值xij。所述特征提取包括顏色特征提取、形狀特征提取和紋理特征提取。所述步驟a2)具體為:a21)根據(jù)步驟a1)得到的示例特征,計算得到每一個示例的標(biāo)簽的連續(xù)概率模型pij;a22)根據(jù)步驟a21)得到的每一個示例的標(biāo)簽的連續(xù)概率模型pij,計算得到每一個訓(xùn)練圖片的連續(xù)概率模型pi。所述每一個示例的標(biāo)簽的連續(xù)概率模型pij具體為:pij=pr(yij=1|xij;w)=φ(wtxij)其中,yij為第i個圖片中的第j個示例。所述每一個訓(xùn)練圖片的連續(xù)概率模型pi具體為:其中,mi為第i張圖片包含的示例總量。所述根據(jù)步驟a2)得到的示例相關(guān)的連續(xù)概率模型進(jìn)行訓(xùn)練的目標(biāo)函數(shù)具體為:其中,pij為每一個示例的標(biāo)簽的連續(xù)概率模型,pi為每一個訓(xùn)練圖片的連續(xù)概率模型,xij為每一個示例的特征值,p為界定示例正負(fù)的閾值,m為svm模型邊緣值,mi為第i張圖片包含的示例總量,n為此次訓(xùn)練所用的樣本數(shù),yi為第i個圖片的標(biāo)簽,β和λ為調(diào)整參數(shù)。所述步驟a3)包括通過多折樣本訓(xùn)練對訓(xùn)練權(quán)重w進(jìn)行優(yōu)化,具體為:a31)將訓(xùn)練圖片中的正示例集隨機分成k折訓(xùn)練集,對k折訓(xùn)練集進(jìn)行遍歷;a32)每次進(jìn)行訓(xùn)練時,選取其中第k折以外的訓(xùn)練集進(jìn)行訓(xùn)練,得到與之對應(yīng)的訓(xùn)練權(quán)重;a33)將步驟a32)中得到的所有訓(xùn)練權(quán)重求取平均值,作為優(yōu)化后的訓(xùn)練權(quán)重。所述步驟b2)具體為:b21)根據(jù)步驟b1)得到的示例特征和步驟a3)得到的訓(xùn)練權(quán)重,計算得到待檢測圖片中每一個示例的標(biāo)簽的連續(xù)概率模型pij';b22)根據(jù)步驟b21)得到的每一個示例的標(biāo)簽的連續(xù)概率模型pij',計算得到待檢測圖片的連續(xù)概率模型pi';b23)判斷待檢測圖片的連續(xù)概率模型pi'是否為正,若是則表明待檢測圖片中存在目標(biāo),否則表明待檢測圖片中不存在目標(biāo);b24)對于存在目標(biāo)的待檢測圖片,選取b22)中連續(xù)概率模型pij'值最大所對應(yīng)的示例,即為待檢測圖片中的目標(biāo)位置。所述待檢測圖片中每一個示例的標(biāo)簽的連續(xù)概率模型pij'和待檢測圖片的連續(xù)概率模型pi'的求取方法與樣本訓(xùn)練步驟中的方法相同。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:(1)通過對提取的圖片的示例特征進(jìn)行光滑處理從而得到示例相關(guān)的連續(xù)概率模型,繼而將問題轉(zhuǎn)化為連續(xù)的分類識別問題,便于后續(xù)的訓(xùn)練和目標(biāo)識別。(2)進(jìn)行示例提取時,本發(fā)明采用了edgebox的方法,簡單易行,同時保證了提取速度。(3)在訓(xùn)練得到了訓(xùn)練權(quán)重后,還通過多折樣本訓(xùn)練對訓(xùn)練權(quán)重進(jìn)行了優(yōu)化,通過這種方式,重新定位確定檢測時使用的樣本不是訓(xùn)練時使用的樣本,很好的防止了過早的鎖定在錯誤的物體上。(4)本方法中對每一個訓(xùn)練包中的所有示例標(biāo)簽都進(jìn)行了訓(xùn)練,而非只是在包級別進(jìn)行樣本訓(xùn)練,訓(xùn)練更加準(zhǔn)確,從而使得識別的效果更好。(5)本方法可以實現(xiàn)對目標(biāo)的全自動識別,無需人工參與和標(biāo)記,識別耗時短且效率高。(6)本方法既可以進(jìn)行對待檢測圖片中是否存在目標(biāo)進(jìn)行識別,同時也可以確定目標(biāo)在待檢測圖片中的位置,實用性能強。附圖說明圖1為本發(fā)明的方法流程圖。具體實施方式下面結(jié)合附圖和具體實施例對本發(fā)明進(jìn)行詳細(xì)說明。本實施例以本發(fā)明技術(shù)方案為前提進(jìn)行實施,給出了詳細(xì)的實施方式和具體的操作過程,但本發(fā)明的保護(hù)范圍不限于下述的實施例?;诠饣嗍纠龑W(xué)習(xí)的目標(biāo)識別方法的流程圖如圖1所示。該方法包括樣本訓(xùn)練步驟和目標(biāo)識別步驟,樣本訓(xùn)練步驟具體為:a1)提取訓(xùn)練圖片的示例特征:a11)以每張訓(xùn)練圖片作為一個訓(xùn)練包,通過edgebox產(chǎn)生與每一個訓(xùn)練包相對應(yīng)的示例;a12)對步驟a11)產(chǎn)生的所有示例進(jìn)行特征提取,得到每一個示例的特征值xij;a2)根據(jù)步驟a1)提取的示例特征,進(jìn)行光滑處理得到示例相關(guān)的連續(xù)概率模型:a21)根據(jù)步驟a1)得到的示例特征,計算得到每一個示例的標(biāo)簽的連續(xù)概率模型pij,具體為:pij=pr(yij=1|xij;w)=φ(wtxij);其中,yij為第i個圖片中的第j個示例;a22)根據(jù)步驟a21)得到的每一個示例的標(biāo)簽的連續(xù)概率模型pij,計算得到每一個訓(xùn)練圖片的連續(xù)概率模型pi:其中,mi為第i張圖片包含的示例總量;a3)根據(jù)步驟a2)得到的示例相關(guān)的連續(xù)概率模型進(jìn)行訓(xùn)練,得到訓(xùn)練權(quán)重w,其中根據(jù)步驟a2)得到的示例相關(guān)的連續(xù)概率模型進(jìn)行訓(xùn)練的目標(biāo)函數(shù)具體為:其中,pij為每一個示例的標(biāo)簽的連續(xù)概率模型,pi為每一個訓(xùn)練圖片的連續(xù)概率模型,xij為每一個示例的特征值,p為界定示例正負(fù)的閾值,m為svm模型邊緣值,mi為第i張圖片包含的示例總量,n為此次訓(xùn)練所用的樣本數(shù),yi為第i個圖片的標(biāo)簽,β和λ為調(diào)整參數(shù);步驟a3)可以通過多折樣本訓(xùn)練對訓(xùn)練權(quán)重w進(jìn)行優(yōu)化,具體為:a31)將訓(xùn)練圖片中的正示例集隨機分成k折訓(xùn)練集,對k折訓(xùn)練集進(jìn)行遍歷;a32)每次進(jìn)行訓(xùn)練時,選取其中第k折以外的訓(xùn)練集進(jìn)行訓(xùn)練,得到與之對應(yīng)的訓(xùn)練權(quán)重;a33)將步驟a32)中得到的所有訓(xùn)練權(quán)重求取平均值,作為優(yōu)化后的訓(xùn)練權(quán)重;目標(biāo)識別步驟具體為:b1)提取待檢測圖片的示例特征;b2)根據(jù)步驟b1)得到的待檢測圖片的示例特征和步驟a3)得到的訓(xùn)練權(quán)重,計算確定待檢測圖片中是否存在需要識別的目標(biāo),具體為:b21)根據(jù)步驟b1)得到的示例特征,計算得到待檢測圖片中每一個示例的標(biāo)簽的連續(xù)概率模型pij';b22)根據(jù)步驟b21)得到的每一個示例的標(biāo)簽的連續(xù)概率模型pij',計算得到待檢測圖片的連續(xù)概率模型pi';b23)判斷待檢測圖片的連續(xù)概率模型pi'是否為正,若是則表明待檢測圖片中存在目標(biāo),否則表明待檢測圖片中不存在目標(biāo),其中,待檢測圖片中每一個示例的標(biāo)簽的連續(xù)概率模型pij'和待檢測圖片的連續(xù)概率模型pi'的求取方法與樣本訓(xùn)練步驟中的方法相同;b24)對于存在目標(biāo)的待檢測圖片,選取b22)中連續(xù)概率模型pij'值最大所對應(yīng)的示例,即為待檢測圖片中的目標(biāo)位置。根據(jù)上述步驟進(jìn)行具體的目標(biāo)識別試驗,過程為:(1)采用edgebox技術(shù)產(chǎn)生多示例學(xué)習(xí)中的示例集合,一張圖片作為一個包,每一個edgebox產(chǎn)生的框作為一個示例。(2)對圖片進(jìn)行預(yù)處理,并提取每個示例的顏色、形狀、紋理等特征作為示例特征。(3)示例標(biāo)簽的概率模型通過probit模型給出:pij=pr(yij=1|xij;w)=φ(wtxij),包的概率模型通過softmax模型給出:根據(jù)以上兩個公式和考慮到示例級別和報級別的損失得到目標(biāo)函數(shù):其中,pij為每一個示例的標(biāo)簽的連續(xù)概率模型,pi為每一個訓(xùn)練圖片的連續(xù)概率模型,xij為每一個示例的特征值,p為界定示例正負(fù)的閾值,m為svm模型邊緣值,mi為第i張圖片包含的示例總量,n為此次訓(xùn)練所用的樣本數(shù),yi為第i個圖片的標(biāo)簽,β和λ為調(diào)整參數(shù),pr為分布函數(shù),φ為軛數(shù)。(4)通過光滑方法把離散的多示例分類識別問題轉(zhuǎn)換為連續(xù)的分類識別問題的,示例的光滑模型在(3)中通過probit模型給出,包的光滑模型在(3)中通過softmax模型進(jìn)行定義,最后得到了(3)中的目標(biāo)函數(shù)。轉(zhuǎn)換為連續(xù)問題后就可以對目標(biāo)函數(shù)利用梯度下降等方法求得最小值,進(jìn)一步求解這個問題。(5)通過多折的樣本訓(xùn)練方法進(jìn)行樣本訓(xùn)練。把訓(xùn)練集中的正包隨機分成k折,遍歷這k折訓(xùn)練集,每次訓(xùn)練時使用第k折以外的正包進(jìn)行訓(xùn)練,使用訓(xùn)練好的w在第k折上利用(3)中的目標(biāo)函數(shù)確定檢測目標(biāo),迭代若干次,具體迭代次數(shù)由經(jīng)驗確定。最后再用每一份中的正窗口來訓(xùn)練最終的檢測器。在pascal06和pascal07這兩個數(shù)據(jù)集上的實驗結(jié)果的corloc值如下表,corloc即為本方法所提供的目標(biāo)位置窗口與物體精確位置標(biāo)記窗口重疊面積大于50%的數(shù)量/所有目標(biāo)定位次數(shù)。經(jīng)過大量的實驗證明,由下表可知,本實施例中提出的方法與其他常見多示例目標(biāo)定位方法相比具有更好的準(zhǔn)確率。:表1.結(jié)果分析數(shù)據(jù)集本發(fā)明bmcladmmmiforestpascal0654454336pascal0738312725當(dāng)前第1頁12