1.一種圖像分類中通用的判別性稀疏編碼字典學(xué)習(xí)方法,其特征在于,包括以下步驟:
(1)設(shè)計一種圖像分類中通用的判別性稀疏編碼字典學(xué)習(xí)方法,它獨立于分類器學(xué)習(xí),并對各種“字典”求解算法具有普適性:
假設(shè)“字典”U=[U+,U-],即字典U分為U+和U-兩部分,其中U+為正類字典,U-為負類字典。判別性“字典”的特點是“字典”中的“基”與類別相關(guān)聯(lián),即U+中的“基”總是傾向表達正類特征,而U-中的“基”總是傾向表達負類特征;因而,可依據(jù)正類樣本的特征集X+和負類樣本的特征集X-的重構(gòu)誤差對U+和U-分別進行學(xué)習(xí);若V=(vij)為稀疏表示系數(shù)矩陣,其中i=1,...,k,j=1,...,n,k和n分別是字典U中“基”的個數(shù)和局部特征的個數(shù),要使稀疏表達的重構(gòu)誤差最小,可通過優(yōu)化如下目標函數(shù)來分別更新U+和U-:
公式(1)和(2)中的優(yōu)化問題可通過共軛梯度法、Lagrange對偶法或K-SVD算法求解,得到U=[U+,U-];而其中的是V的子矩陣,分別與“字典”U+和U-相對應(yīng)和匹配,通過步驟(2)求得,抽取子矩陣和應(yīng)滿足分類表征“損失”小的基本原則,即類間差異性大,而表征損失??;
(2)求解稀疏表示系數(shù)矩陣V中的關(guān)鍵行向量作為公式(1)和(2)中的和
1)將V分解為V=[V+,V-],和分別是特征集X+和X-對應(yīng)的稀疏表示系數(shù)矩陣,則可計算:
其中,它們分別表示字典U中第i個“基”被用來表征正類和負類特征的使用“頻率”;顯然,值越大表示第i個“基”更傾向于表達正類特征,對應(yīng)的稀疏表示系數(shù)項在正類特征的表征中占更大的權(quán)重,應(yīng)被選擇到中,反之,則更傾向于表達負類特征,對應(yīng)的稀疏表示系數(shù)項在負類特征的表征中占更大的權(quán)重,應(yīng)被選擇到
2)按照各個“基”對應(yīng)的元素ai值由大到小的順序重新排列“基”,則前部分更傾向于表達正類特征,而后部分更傾向于表達負類特征,而按此順序重新排列對應(yīng)V的各行,得到矩陣
3)對進行分割,令
對于固定大小的特征集X+和X-,對的列分割位置總是不變的,即的列寬度大小分別和X+,X-保持一致。而在不同的行位置分割,可得到不同的和因而,需要查找最優(yōu)分割行,方法是:在列分割位置不變的前提下,針對不同的分割行位置,將公式(4)中的對角矩陣和置換為0矩陣,得到矩陣然后計算中正負特征稀疏表示系數(shù)間的類間距或Fisher判別準則函數(shù)值,以及將和置換為0矩陣后正負特征的表征損失或重構(gòu)誤差來確定最優(yōu)分割行。