亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種圖像分類中通用的判別性稀疏編碼字典學習方法與流程

文檔序號:12597385閱讀:539來源:國知局

本發(fā)明涉及稀疏編碼字典學習方法,特別涉及一種圖像分類中通用的判別性稀疏編碼字典學習方法。

技術背景

人類大腦視覺系統(tǒng)高度發(fā)達,能快速準確完成圖像處理任務;神經(jīng)科學研究成果也表明,稀疏編碼是人類大腦視覺系統(tǒng)中圖像表示的主要方式,大腦主視皮層V1區(qū)神經(jīng)元對視覺信息的反應具有稀疏性?;诖松碚J知機理,視覺稀疏表示理論與算法近年來得到快速迅猛發(fā)展,是目前機器視覺領域的研究熱點,已經(jīng)在圖像表征,圖像識別、分類和標注,圖像重構,視頻檢索,視覺跟蹤,事件檢測等方面得到廣泛應用。

在圖像表征方面,稀疏表示主要應用于BoF(Bag-of-Features)視覺表征模型的局部特征量化。BoF模型將圖像描述為局部特征的分布或者統(tǒng)計,具有尺度、旋轉或光照等不變性,相比較于全局特征,具有更強場景表達能力;基于BoF模型的空間“金字塔”匹配(Spatial Pyramid Matching)更是能對圖像場景中目標間位置關系進行表達;所有這些優(yōu)勢保證BoF模型能夠取得優(yōu)異視覺表征性能,并在圖像標注中得到很好應用。BoF視覺表征模型包含兩個步驟:(a)局部區(qū)域特征選擇和表達,(b)“字典”學習和特征量化;其中“字典”學習和特征量化尤為重要,很大程度地影響視覺表達的性能。所謂“字典”,是用以量化和重構視覺局部特征的一組基本模式(可稱之為“基”),最簡單的“字典”學習方法是對局部特征進行聚類,“字典”由聚類中心得到;隨后,特征量化則基于“字典”采用頻次直方圖方法,即用最近鄰法將每個局部特征與距離最近的“基”相關聯(lián),為提高魯棒性,也可用近鄰法將每個局部特征與多個“基”相關聯(lián),然后計算與每個“基”相關聯(lián)的局部特征頻次;最后,由“字典”中所有“基”的頻次構成圖像特征表達。然而,基于近鄰的方法仍顯粗糙,存在無法定義局部特征與“基”的關聯(lián)權重的缺點,從而導致較大量化誤差?;谙∈杈?Sparse Coding)的局部特征量化模型中,稀疏表示系數(shù)被定義為局部特征賦給“基”的最優(yōu)權重;該量化方法已被證實具有較強魯棒性,能獲得很好的圖像視覺表征效果。同時,該方法中也采取了“字典”和稀疏表示系數(shù)交替學習這種稀疏編碼常見優(yōu)化方法。學習稀疏編碼“字典”時,假設稀疏表示系數(shù)已知,使“字典”滿足重構損失最小約束;而學習稀疏表示系數(shù)時,則假設“字典”已知,使稀疏表示系數(shù)滿足稀疏約束和重構損失最小約束。

稀疏表示應用到圖像表征和標注中存在的問題是:傳統(tǒng)的無監(jiān)督稀疏編碼忽略了訓練樣本的類別信息,不是判別性表達,而對于信號分類而言,特征表示的模式判別能力起相當重要作用。解決這個問題的方法是學習具有判別性的“字典”,期望將“字典”的判別性傳遞至特征稀疏表示系數(shù)。已有相關工作假設一個線性分類器,將“字典”學習和分類器學習統(tǒng)一起來,從而提高稀疏表示判別能力,取得較好分類效果,然而,將這種方法擴展到許多更復雜分類器如人工神經(jīng)網(wǎng)絡(ANN)、非線性支持向量機(SVM)等,將使求解變得非常困難,而且,隨著數(shù)據(jù)特征及其分布特性的變化,合適的分類器類型也會發(fā)生改變,因而,這種結合具體分類器的學習方法具有一定的應用和拓展局限,有必要設計獨立于分類器學習的通用的判別性“字典”學習方法。本發(fā)明提出一種圖像分類中通用的判別性稀疏編碼字典學習方法。



技術實現(xiàn)要素:

本發(fā)明提出一種圖像分類中通用的判別性稀疏編碼字典學習方法,將突破已有方法的局限性,它不僅獨立于分類器學習,而且對各種“字典”學習算法具有普適性。

本發(fā)明采用的技術方案是:

一種圖像分類中通用的判別性稀疏編碼字典學習方法,其具體步驟如下:

(1)提取圖像的SIFT、HOG等局部特征,作為圖像特征集合,并依據(jù)圖像的類別標簽,獲得圖像集的正類特征集X+和負類特征集X-

(2)圖像分類中通用的判別性“字典”學習方法:

單幅場景圖像大都對應于多個“概念”標簽,利用“one-vs-all”方法轉化為兩類問題來解決。假設“字典”U=[U+,U-],判別性“字典”的特點是“字典”中的“基”與類別相關聯(lián),即正類字典U+中的“基”總是傾向表達正類特征,而負類字典U-中的“基”總是傾向表達負類特征。因而,可依據(jù)正類特征集X+和負類特征集X-的重構誤差對U+和U-分別進行學習;若稀疏表示系數(shù)矩陣V=(vij)(i=1,...,k,j=1,...,n,k和n分別是字典U中“基”的個數(shù)和局部特征的個數(shù))已知,要使稀疏表達的重構誤差最小,可通過優(yōu)化如下目標函數(shù)來分別更新U+和U-

公式(1)和(2)中的優(yōu)化問題可通過共軛梯度法、Lagrange對偶法或K-SVD等算法求解,得到U=[U+,U-];而其中的分別與“字典”U+和U-相對應和匹配,它們可從V抽取子矩陣獲得,子矩陣和應滿足分類表征“損失”小的基本原則,即類間差異性大,而表征損失小。

其中,按照如下步驟求解稀疏表示系數(shù)矩陣V中的關鍵行向量作為公式(1)和(2)中的和

1)將V分解為V=[V+,V-],和分別是X+和X-對應的的稀疏表示系數(shù)矩陣,則可計算:

其中,它們分別表示U中第i個“基”被用來表征正類和負類特征的使用“頻率”;顯然,值越大表示第i個“基”更傾向于表達正類特征,對應的稀疏表示系數(shù)項在正類特征的表征中占更大的權重,應被選擇到中,反之,則更傾向于表達負類特征,對應的稀疏表示系數(shù)項在負類特征的表征中占更大的權重,應被選擇到

2)按照各個“基”對應的元素ai值由大到小的順序重新排列“基”,則前部分更傾向于表達正類特征,而后部分更傾向于表達負類特征,而按此順序重新排列對應V的各行,得到

3)對進行分割,令

對于固定大小的特征集X+和X-,的列分割位置的確定方法是:的列寬度大小分別和X+,X-保持一致。而在不同的行位置分割,可得到不同的和查找最優(yōu)分割行的方法是:在列分割位置不變的前提下,針對不同的分割行位置,將公式(4)中的對角矩陣和置換為0矩陣,得到矩陣然后計算中正負特征稀疏表示系數(shù)間的類間距或Fisher判別準則函數(shù)值,以及將和置換為0矩陣后正負特征的表征損失或重構誤差。權衡類間距和表征損失,依據(jù)對不同的行分割位置的類間距和表征損失來確定最優(yōu)分割行。

與已有技術相比,本發(fā)明有益效果體現(xiàn)在:

本發(fā)明不僅獨立于分類器學習,而且對各種“字典”學習算法具有普適性。

附圖說明

圖1為本發(fā)明提出的具體的圖像分類和標注中通用的判別性稀疏編碼字典學習方法流程圖。

具體實施方式

一種圖像分類中通用的判別性稀疏編碼字典學習方法,其具體步驟如下:

(1)提取圖像的SIFT、HOG等局部特征,作為圖像特征集合,并依據(jù)圖像的類別標簽,獲得圖像集的正類特征集X+和負類特征集X-;

(2)圖像分類中通用的判別性“字典”學習:

單幅場景圖像大都對應于多個“概念”標簽,利用“one-vs-all”方法轉化為兩類問題來解決。假設“字典”U=[U+,U-],依據(jù)正類特征集X+和負類特征集X-的重構誤差對U+和U-分別進行學習;若稀疏表示系數(shù)矩陣V=(vij)(i=1,...,k,j=1,...,n,k和n分別是字典U中“基”的個數(shù)和局部特征的個數(shù))已知,要使稀疏表達的重構誤差最小,可通過優(yōu)化如下目標函數(shù)來分別更新U+和U-

公式(1)和(2)中的優(yōu)化問題可通過共軛梯度法、Lagrange對偶法或K-SVD等算法求解,得到U=[U+,U-];而其中的分別與“字典”U+和U-相對應和匹配,它們可從V抽取子矩陣獲得,子矩陣和應滿足分類表征“損失”小的基本原則,即類間差異性大,而表征損失小。

其中,按照如下步驟求解稀疏表示系數(shù)矩陣V中的關鍵行向量作為公式(1)和(2)中的和

1)將V分解為V=[V+,V-],和分別是X+和X-對應的的稀疏表示系數(shù)矩陣,則可計算:

其中,它們分別表示U中第i個“基”被用來表征正類和負類特征的使用“頻率”;顯然,值越大表示第i個“基”更傾向于表達正類特征,對應的稀疏表示系數(shù)項在正類特征的表征中占更大的權重,應被選擇到中,反之,則更傾向于表達負類特征,對應的稀疏表示系數(shù)項在負類特征的表征中占更大的權重,應被選擇到

2)按照各個“基”對應的元素ai值由大到小的順序重新排列“基”,則前部分更傾向于表達正類特征,而后部分更傾向于表達負類特征,而按此順序重新排列對應V的各行,得到

3)對進行分割,令

將和置換為0矩陣,得到然后計算中正負特征稀疏表示系數(shù)間的類間距或Fisher判別準則函數(shù)值,以及將和置換為0矩陣后正負特征的表征損失或重構誤差;權衡類間距和表征損失,依據(jù)對不同的行分割位置的類間距和表征損失來確定最優(yōu)分割行;

(3)在求得字典U=[U+,U-]的基礎上,利用BP(Basis Pursuit),BPDN-homotopy等算法求解稀疏表示系數(shù);返回到步驟(2),如此循環(huán)預先設定的次數(shù);

(4)利用稀疏編碼系數(shù)對局部特征進行量化,獲得圖像的判別性表達。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1