本發(fā)明涉及圖像分類
技術(shù)領(lǐng)域:
,特別涉及基于稀疏子空間多任務(wù)學(xué)習(xí)的圖像分類預(yù)測(cè)方法。
背景技術(shù):
:隨著互聯(lián)網(wǎng)通訊技術(shù)與數(shù)字影像技術(shù)的快速發(fā)展,人們獲得各種圖像信息越來(lái)越容易,導(dǎo)致互聯(lián)網(wǎng)中存在大量的圖像數(shù)據(jù),如何從大規(guī)模的圖像數(shù)據(jù)中準(zhǔn)確找到符合用戶需求的相關(guān)圖像一直是計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn)和挑戰(zhàn)?,F(xiàn)實(shí)世界中的樣本往往和多個(gè)類別相關(guān)聯(lián),例如,一幅圖片可以同時(shí)被標(biāo)注為“sea”,“sky”,“beach”等標(biāo)簽,這就需將樣本同時(shí)歸到多個(gè)類,這就是多標(biāo)注分類問(wèn)題。解決多標(biāo)注分類問(wèn)題一種常用的方法是對(duì)每個(gè)標(biāo)注構(gòu)造一個(gè)二元分類器,具有此標(biāo)注的樣本為正樣例其余樣本為負(fù)樣例,這種方法已經(jīng)被廣泛應(yīng)用于多種分類問(wèn)題中,但該方法存在如下的問(wèn)題:1)相比于傳統(tǒng)的單標(biāo)簽分類,多標(biāo)簽分類問(wèn)題則是一種更加復(fù)雜的分類問(wèn)題,傳統(tǒng)分類方法沒有考慮不同標(biāo)簽之間語(yǔ)義關(guān)聯(lián)性;2)圖像存在多種異構(gòu)特征,在表示特定高層語(yǔ)義時(shí)所起作用的重要程度不同,傳統(tǒng)分類方法沒有很好的對(duì)異構(gòu)特征進(jìn)行有效融合。技術(shù)實(shí)現(xiàn)要素:為了克服這一傳統(tǒng)方法未能考慮不同標(biāo)簽之間語(yǔ)義關(guān)聯(lián)性的不足,本發(fā)明提供一種基于稀疏子空間多任務(wù)學(xué)習(xí)的圖像分類預(yù)測(cè)方法,包括:步驟一:根據(jù)對(duì)訓(xùn)練圖像集提取的異構(gòu)視覺特征構(gòu)建特征數(shù)據(jù);步驟二:基于任務(wù)的相關(guān)性和異構(gòu)視覺特征的結(jié)構(gòu)性,根據(jù)特征數(shù)據(jù)的訓(xùn)練數(shù)據(jù)集建立稀疏子空間的多任務(wù)分類算法的目標(biāo)函數(shù);步驟三:基于稀疏子空間的多任務(wù)分類算法的目標(biāo)函數(shù),采用迭代優(yōu)化算法進(jìn)行求解,生成稀疏子空間多任務(wù)分類模型;步驟四:采用稀疏子空間多任務(wù)分類模型對(duì)圖像測(cè)試集進(jìn)行分類預(yù)測(cè)。進(jìn)一步地,所述異構(gòu)視覺特征至少包括顏色、紋理和形狀。進(jìn)一步地,步驟二中包括:對(duì)異構(gòu)特征的融合引入組稀疏正則化其中G是異構(gòu)特征子集的個(gè)數(shù),u是分類模型的權(quán)重向量;結(jié)合子空間相關(guān)性和稀疏機(jī)制建立多任務(wù)學(xué)習(xí)模型,構(gòu)成最終的目標(biāo)函數(shù):其中U和V為權(quán)重向量,Q是共享子空間。進(jìn)一步地,所述步驟三中分別對(duì)變量V、Q和W進(jìn)行迭代優(yōu)化,獲得穩(wěn)定最優(yōu)解,即生成稀疏子空間多任務(wù)分類模型。本發(fā)明利用多任務(wù)學(xué)習(xí)的思想來(lái)改善分類器的泛化性能,結(jié)合子空間相關(guān)性和稀疏機(jī)制建立多任務(wù)學(xué)習(xí)機(jī)制對(duì)圖像進(jìn)行分類,提高了分類器的泛化性能。具體地,一方面利用多個(gè)任務(wù)在潛在子空間的相關(guān)性建立分類模型,另一方面為了更加有效地利用圖像的異構(gòu)特征,在基于子空間的多任務(wù)學(xué)習(xí)中引入了一種基于組稀疏(groupsparsity)結(jié)構(gòu),進(jìn)而提出了稀疏子空間多任務(wù)學(xué)習(xí)的分類算法。最后,提出了一種有效的迭代優(yōu)化算法對(duì)基于稀疏子空間多任務(wù)學(xué)習(xí)的目標(biāo)函數(shù)進(jìn)行優(yōu)化,求得全局最優(yōu)解。具體實(shí)施方式為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明實(shí)施例提供一種基于稀疏子空間多任務(wù)學(xué)習(xí)的圖像分類方法,包括:步驟一:根據(jù)對(duì)訓(xùn)練圖像集提取的異構(gòu)視覺特征構(gòu)建特征數(shù)據(jù);步驟二:基于任務(wù)的相關(guān)性和異構(gòu)視覺特征的結(jié)構(gòu)性,根據(jù)特征數(shù)據(jù)的訓(xùn)練數(shù)據(jù)集建立稀疏子空間的多任務(wù)分類算法的目標(biāo)函數(shù);步驟三:基于稀疏子空間的多任務(wù)分類算法的目標(biāo)函數(shù),采用迭代優(yōu)化算法進(jìn)行求解,生成稀疏子空間多任務(wù)分類模型;步驟四:采用稀疏子空間多任務(wù)分類模型對(duì)圖像測(cè)試集進(jìn)行分類預(yù)測(cè)。上述步驟二和三中,具體公式推導(dǎo)如下:采用如下的目標(biāo)函數(shù)方式:損失函數(shù)+正則化模型由于增加了子空間信息,原表達(dá)變?yōu)椋篺(x)=uTx=wTx+vTQx。其中u,wandv為整體特征空間的權(quán)重系數(shù),高位特征空間的權(quán)重系數(shù)和共享的低維子空間的權(quán)重系數(shù)。L為損失函數(shù):其中X∈Rn×d,Y∈Rn×c,U∈Rd×c。令XU-Y=[z1,...,zn]T,則L(X,Y,U)=Tr((XU-Y)TD1(XU-Y))(3)其中:R為正則化模型通過(guò)添加懲罰項(xiàng)的形式,約束任務(wù)之間特征的相關(guān)性,提出了一種結(jié)構(gòu)化稀疏子空間模型:R(U,V,Q)=R1(U)+R2(U,V,Q)(5)其中R1為結(jié)構(gòu)稀疏正則化模型,定義為:其中由于||U||2,1和同價(jià),同理||U||G2,1與同價(jià),其中D2和D3定義如下:則R2為子空間共享模型,定義為:綜合以上的L和R,定義目標(biāo)函數(shù)如下:其中λ1,λ2andλ3為正則項(xiàng)系數(shù)?!袷紫葘?duì)V最小化:對(duì)V求導(dǎo),得出V=QU最小,代入(11)后,得到:因?yàn)門r((U-QTQU)T(U-QTQU))=Tr(UT(I-QTQ)(I-QTQ)U)并且(I-QTQ)(I-QTQ)=I-QTQ,所以得到●對(duì)U最小化:對(duì)U求導(dǎo),然后得到:設(shè)U=S-1XD1Y,其中S=(P-λ3QTQ)-1(15)P=XD1X+λ1D2+λ2D3+λ3I(16)公式(13)可以寫成:把U=S-1XD1Y代入公式(17)中,得到如下:上述問(wèn)題等價(jià)于:根據(jù)Sherman–Woodbury–Morrison公式:則公式(19)轉(zhuǎn)換為:等價(jià)于:通過(guò)矩陣變換,(22)可以寫成:使用迭代優(yōu)化算法進(jìn)行求解。上述介紹的迭代優(yōu)化算法流程如下所示。實(shí)驗(yàn)驗(yàn)證:選取了三個(gè)圖像分類數(shù)據(jù)集Kodak,MSRA-MM和NUS-WIDE,對(duì)不同的數(shù)據(jù)集提取了不同的特征,如表1所示:表1異構(gòu)特征子集描述KodakMSRA-MMNUS-WIDE顏色相關(guān)圖顏色相關(guān)圖顏色相關(guān)圖共生矩陣紋理特征邊緣方向直方圖邊緣方向直方圖邊緣方向直方圖人臉特征詞袋特征人臉特征顏色直方圖顏色直方圖顏色直方圖RGB顏色直方圖塊顏色矩塊顏色矩塊顏色矩小波紋理特征小波紋理特征小波紋理特征為了評(píng)估圖像標(biāo)注算法性能,本發(fā)明采用了ROC曲線下面積(areaundercurve,簡(jiǎn)稱AUC),包括MicroAUC和MacroAUC以及準(zhǔn)確率(precision)這3種評(píng)價(jià)指標(biāo)。隨機(jī)分別選取了300個(gè)帶標(biāo)注的圖像作為訓(xùn)練集(保證每個(gè)標(biāo)注至少出現(xiàn)一次),在剩余的數(shù)據(jù)中分別選取1200個(gè)未標(biāo)注圖像作為測(cè)試集,每組實(shí)驗(yàn)重復(fù)10次,然后算出10次結(jié)果的平均值。比較的算法包括:Lasso、Grouplasso和subspaceMTL,比較結(jié)果如表2-4所示:表2多種分類算法的MacroAUC比較LassoGrouplassosubspaceMTLSGLSMTLKodak0.71480.73950.78660.8245MSRA-MM0.62080.62390.67850.7022NUS-WIDE0.70820.71540.75130.7816表3多種分類算法的MicroAUC比較LassoGrouplassosubspaceMTLSGLSMTLKodak0.71920.73220.78540.8098MSRA-MM0.70580.71710.75440.7832NUS-WIDE0.72500.73340.75320.7793表4多種分類算法的精度比較LassoGrouplassosubspaceMTLSGLSMTLKodak0.88390.89160.91880.9312MSRA-MM0.82650.84700.91720.9411NUS-WIDE0.80550.83170.89330.9122從表2-4可以看出,本發(fā)明提出的基于稀疏子空間多任務(wù)學(xué)習(xí)的圖像分類算法在三個(gè)數(shù)據(jù)集上均達(dá)到了最高的分類性能,提升了傳統(tǒng)只基于稀疏學(xué)習(xí)算法或者只基于子空間多任務(wù)學(xué)習(xí)算法的分類性能。最后應(yīng)說(shuō)明的是以上各實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。當(dāng)前第1頁(yè)1 2 3