專利名稱:一種基于空間共聚集的圖像分類方法
技術(shù)領(lǐng)域:
本發(fā)明涉及模式識(shí)別技術(shù)領(lǐng)域,尤其是一種基于空間共聚集的圖像分類方法。
背景技術(shù):
目前,傳統(tǒng)的圖像分類方法缺乏有效地表達(dá)圖像空間信息的能力。這也是計(jì)算機(jī)視覺系統(tǒng)與人眼視覺系統(tǒng)相比在識(shí)別精度上仍存在著巨大差距的重要原因之一。常用的圖像分類方法往往不能有效的利用空間信息,如金字塔空間匹配算法,其僅僅是對(duì)少量空間區(qū)域表達(dá)的簡(jiǎn)單串聯(lián),雖然有一定的魯棒性,但是反映的空間信息的效率和判別力比較弱。有些方法直接利用特征的絕對(duì)空間位置,但由于特征的空間位置很容易發(fā)生偏移,這樣的方法往往在對(duì)齊過的數(shù)據(jù)庫上表現(xiàn)良好,而在未對(duì)齊的數(shù)據(jù)庫表現(xiàn)卻很差。因此,鑒于以往的方法很難以滿足對(duì)圖像分類的需要,本發(fā)明提出了一種基于空間共聚集的圖像分類方法來描述特征在圖像中的空間信息,該方法既對(duì)個(gè)別特征的偏移不敏感又能靈活的描述其空間分布。由于這種方法得到的圖像表達(dá)的維數(shù)很高,因此可以使用常用的特征選擇方法來進(jìn)行特征選擇,將選擇過的特征作為圖像的最終表達(dá)。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)存在的問題,本發(fā)明的目的是提供一種基于空間共聚集的圖像分類方法,該方法包括以下步驟步驟SI,收集多幅圖像,建立圖像分類數(shù)據(jù)庫,并將所述數(shù)據(jù)庫分為訓(xùn)練集和測(cè)試集;步驟S2,提取所述數(shù)據(jù)庫中所有圖像的局部特征;步驟S3,從所述訓(xùn)練集的圖像的局部特征中隨機(jī)抽取出一定數(shù)量的局部特征,利用聚類算法學(xué)習(xí)得到一視覺詞典D= [Clpd2,…,dK],其中,K表示視覺詞典的大小,即聚類中心的個(gè)數(shù)噸為一個(gè)列向量,表示一個(gè)視覺單詞,即聚類中心;步驟S4,對(duì)所述步驟S2提取得到的所有圖像的局部特征進(jìn)行編碼;步驟S5,在空間上將所述數(shù)據(jù)庫中的每一圖像分成多個(gè)矩形塊,并對(duì)每個(gè)矩形塊內(nèi)的局部特征分別進(jìn)行聚集,作為該矩形塊的特征表達(dá);步驟S6,通過聚集的方法,將空間相鄰的矩形塊合并成一個(gè)區(qū)域,并將參與合并的幾個(gè)矩形塊聚集的結(jié)果作為合并得到的區(qū)域的特征表達(dá);步驟S7,將所述步驟S6中得到的所有大小相同且無重疊的兩個(gè)區(qū)域進(jìn)行聚集,并將聚集的結(jié)果串聯(lián)到一起作為該圖像的特征表達(dá);步驟S8,類似于所述步驟S5-S7,得到所述訓(xùn)練集中所有圖像的特征表達(dá),并選取其中最具有區(qū)分力的特征作為所述訓(xùn)練集和測(cè)試集中圖像的最終特征表達(dá);步驟S9,基于所述步驟S8中選擇得到最具有區(qū)分力的特征訓(xùn)練支持向量機(jī),得到圖像分類器;步驟S10,提取所述測(cè)試集中圖像的最具有區(qū)分力的特征,并將該特征輸入所述分類器中進(jìn)行分類,從而得到所述測(cè)試集中該圖像的分類結(jié)果。根據(jù)本發(fā)明的方法,可以對(duì)單個(gè)特征的空間分布以及多個(gè)特征的共生信息進(jìn)行描述。通過以塊為基元使得對(duì)于特征空間位置的描述更加魯棒,而考慮各種區(qū)域的空間組合方式可以有助于挖掘更多的空間信息。
圖1是本發(fā)明基于空間共聚集的圖像分類方法流程圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對(duì)本發(fā)明進(jìn)一步詳細(xì)說明。傳統(tǒng)的圖像分類方法可以分為提取局部特征,訓(xùn)練視覺詞典,表達(dá)圖像,訓(xùn)練分類器和檢測(cè)新圖像五個(gè)部分。在此基礎(chǔ)上,本發(fā)明首先采用空間共聚集的方法來表達(dá)圖像,然后再對(duì)所有圖像的表達(dá)做特征選擇,僅將所選擇的特征作為圖像的最終表達(dá)。圖1是本發(fā)明基于空間共聚集的圖像分類方法流程圖,如圖1所示,該方法包括以下步驟步驟SI,收集多幅圖像,建立圖像分類數(shù)據(jù)庫,并將所述數(shù)據(jù)庫分為訓(xùn)練集和測(cè)試集;步驟S2,提取所述數(shù)據(jù)庫中所有圖像的局部特征;在該步驟中,可以以密集采樣的方式使用局部特征描述子或者局部特征檢測(cè)子來得到該圖像的局部特征,例如尺度不變特征變換SIFT、加速穩(wěn)健特征SURF等等。步驟S3,從所述訓(xùn)練集的圖像的局部特征中隨機(jī)抽取出一定數(shù)量的局部特征,利用聚類算法學(xué)習(xí)得到一視覺詞典;該步驟中,在隨機(jī)抽取得到局部特征后,采用現(xiàn)有技術(shù)中的聚類算法(比如K均值聚類算法)訓(xùn)練得到一視覺詞典D= [Cl17Cl2,…,dK],其中,K表示視覺詞典的大小,即聚類中心的個(gè)數(shù),Cli為一個(gè)列向量,表示一個(gè)視覺單詞,即聚類中心。步驟S4,對(duì)所述步驟S2提取得到的所有圖像的局部特征進(jìn)行編碼;所述編碼可使用現(xiàn)有技術(shù)中常用的多種編碼方式對(duì)局部特征&進(jìn)行編碼,下面以局部線性編碼為例進(jìn)行說明。對(duì)第i個(gè)局部特征&進(jìn)行局部線性編碼的步驟進(jìn)一步包括步驟S41,利用下式計(jì)算中間變量;
權(quán)利要求
1.一種基于空間共聚集的圖像分類方法,其特征在于,該方法包括以下步驟 步驟Si,收集多幅圖像,建立圖像分類數(shù)據(jù)庫,并將所述數(shù)據(jù)庫分為訓(xùn)練集和測(cè)試集; 步驟S2,提取所述數(shù)據(jù)庫中所有圖像的局部特征; 步驟S3,從所述訓(xùn)練集的圖像的局部特征中隨機(jī)抽取出一定數(shù)量的局部特征,利用聚類算法學(xué)習(xí)得到一視覺詞典D= [Cl17Cl2,…,dK],其中,K表示視覺詞典的大小,即聚類中心的個(gè)數(shù)噸為一個(gè)列向量,表示一個(gè)視覺單詞,即聚類中心; 步驟S4,對(duì)所述步驟S2提取得到的所有圖像的局部特征進(jìn)行編碼; 步驟S5,在空間上將所述數(shù)據(jù)庫中的每一圖像分成多個(gè)矩形塊,并對(duì)每個(gè)矩形塊內(nèi)的局部特征分別進(jìn)行聚集,作為該矩形塊的特征表達(dá); 步驟S6,通過聚集的方法,將空間相鄰的矩形塊合并成一個(gè)區(qū)域,并將參與合并的幾個(gè)矩形塊聚集的結(jié)果作為合并得到的區(qū)域的特征表達(dá); 步驟S7,將所述步驟S6中得到的所有大小相同且無重疊的兩個(gè)區(qū)域進(jìn)行聚集,并將聚集的結(jié)果串聯(lián)到一起作為該圖像的特征表達(dá); 步驟S8,類似于所述步驟S5-S7,得到所述訓(xùn)練集中所有圖像的特征表達(dá),并選取其中最具有區(qū)分力的特征作為所述訓(xùn)練集和測(cè)試集中圖像的最終特征表達(dá); 步驟S9,基于所述步驟S8中選擇得到最具有區(qū)分力的特征訓(xùn)練支持向量機(jī),得到圖像分類器; 步驟S10,提取所述測(cè)試集中圖像的最具有區(qū)分力的特征,并將該特征輸入所述分類器中進(jìn)行分類,從而得到所述測(cè)試集中該圖像的分類結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,以密集采樣的方式提取所述數(shù)據(jù)庫中所有圖像的局部特征。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S2中,所述局部特征為尺度不變特征變換特征或加速穩(wěn)健特征。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S3中,所述聚類算法為K均值聚類算法。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S4中,使用局部線性編碼對(duì)所有圖像的局部特征進(jìn)行編碼。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述步驟S4中,對(duì)第i個(gè)局部特征A進(jìn)行局部線性編碼的步驟包括 步驟S41,利用下式計(jì)算中間變量α .
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S5中,采用最大聚集方法、求和聚集方法或加權(quán)求和聚集方法對(duì)每個(gè)矩形塊內(nèi)的局部特征進(jìn)行聚集。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S6中,采用最大聚集方法、求和聚集方法或加權(quán)求和聚集方法將空間相鄰的矩形塊合并成一個(gè)區(qū)域。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S7中,采用最小聚集方法、求和聚集方法或加權(quán)求和聚集方法將所述步驟S6中得到的所有大小相同且無重疊的兩個(gè)區(qū)域進(jìn)行聚集。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S8中,使用grafting算法來選取最具有區(qū)分力的特征。
全文摘要
本發(fā)明公開了一種基于空間共聚集的圖像分類方法。在該方法中,首先,提取局部特征并用聚類算法得到視覺詞典;然后,用編碼算法對(duì)特征進(jìn)行編碼,將不同空間區(qū)域的特征聚集并串聯(lián)到一起;最后,用通用的特征選擇方法進(jìn)行特征選擇,并用選擇的特征作為圖像的表達(dá)以訓(xùn)練分類器用于對(duì)圖像進(jìn)行分類。本發(fā)明方法從不同空間區(qū)域組合的表達(dá)中選擇最有區(qū)分力,更加魯棒的特征作為圖片的表達(dá),從而可以反映特征在給定類別圖片中的空間分布和共生信息。本發(fā)明方法能以極少的特征數(shù)量達(dá)到分類精度優(yōu)于常規(guī)算法的效果。
文檔編號(hào)G06K9/62GK103034871SQ20121056074
公開日2013年4月10日 申請(qǐng)日期2012年12月20日 優(yōu)先權(quán)日2012年12月20日
發(fā)明者王亮, 黃永禎, 劉鋒 申請(qǐng)人:中國科學(xué)院自動(dòng)化研究所