專利名稱:一種基于回歸模型的圖像集合建模與匹配方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)視覺技術(shù)領(lǐng)域,特別涉及ー種基于回歸模型的圖像集合的建模與匹配方法。
背景技術(shù):
長(zhǎng)期以來,物體分類是計(jì)算機(jī)視覺研究中的ー項(xiàng)重要課題,分類器的訓(xùn)練和測(cè)試通常都是基于物體的單個(gè)或者很少量的樣本進(jìn)行的。隨著攝像機(jī)和大容量存儲(chǔ)設(shè)備等硬件技術(shù)的普及發(fā)展,在很多新的應(yīng)用場(chǎng)景,例如視頻監(jiān)控、視頻檢索等任務(wù)中,可以獲取到物體的大量圖像數(shù)據(jù),從而為后端分類問題的訓(xùn)練和測(cè)試階段提供大量的樣本,這些樣本通常以圖像集合的模式進(jìn)行建模表示。在這類識(shí)別問題中,每個(gè)集合通常包含屬于同一個(gè)物體類別的多個(gè)圖像樣本,這些圖像樣本涵蓋了物體廣泛的表觀變化模式,比如姿態(tài)視角的變化、非剛性變形、光照變化等等。 基于圖像集合的分類問題的難點(diǎn)在干,如何有效地刻畫與建模集合中多幅圖像的分布,并根據(jù)所建的模型綜合利用多祥本提供的信息。近年來,典型的做法主要有兩類,即分別從參數(shù)式與非參數(shù)式兩個(gè)角度對(duì)圖像集合建模,前者通常利用概率分布函數(shù)來表示圖像集合的樣本分布,進(jìn)而采用諸如K-L散度之類的度量來計(jì)算兩個(gè)概率分布函數(shù)之間的相似度。后者則根據(jù)圖像集合中樣本的本質(zhì)變化模式將其建模為線性子空間或者更為一般的非線性流形,基于這種建模方式,集合匹配分類的問題就可以轉(zhuǎn)化為子空間或者流形匹配的問題,從而采用子空間或者流形上的各種可能的相似性度量函數(shù)與匹配策略進(jìn)行分類??傮w而言,當(dāng)前采用的這兩類集合建模方法都對(duì)圖像集合中樣本分布的形式有一定程度的假設(shè),而在實(shí)際問題中集合樣本的來源通常是多種多祥的,當(dāng)與模型所假設(shè)的樣本分布形式差別較大時(shí),分類效果就會(huì)有很大的偏差。
發(fā)明內(nèi)容
本發(fā)明g在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題,特別創(chuàng)新地提出了一種基于回歸模型的圖像集合的建模與匹配方法。為了實(shí)現(xiàn)本發(fā)明的上述目的,本發(fā)明提供了ー種基于回歸模型的圖像集合建模與匹配方法,其包括如下步驟SI :組織訓(xùn)練圖像集合;S2 :建立特征-類別回歸模型;S3 :對(duì)測(cè)試圖像集合進(jìn)行投影;S4 :對(duì)測(cè)試圖像集合進(jìn)行分類。本發(fā)明針對(duì)具有任意樣本分布形式的圖像集合,采用樣本特征與相應(yīng)的類別標(biāo)記學(xué)習(xí)雙線性回歸模型,建立起集合樣本與其類別之間的本質(zhì)語義關(guān)聯(lián);針對(duì)未知類別標(biāo)記的集合,只需將其每個(gè)樣本進(jìn)行線性回歸然后綜合各樣本的類別響應(yīng)即可得到整體集合的類別輸出。該方法直觀高效,計(jì)算簡(jiǎn)便,其對(duì)集合樣本的分布形式和集合樣本的規(guī)模均無任何先驗(yàn)假設(shè),對(duì)集合中可能存在的噪聲數(shù)據(jù)具有很好的容忍性。本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中圖I是本發(fā)明基于回歸模型的圖像集合建模與匹配方法的流程圖;圖2為本發(fā)明所采用的偏最小ニ乘回歸方法的示意圖。
具體實(shí)施例方式下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。本發(fā)明提供了ー種基于回歸模型的圖像集合建模與匹配方法,如圖I所示,其包括如下步驟SI:組織訓(xùn)練圖像集合;S2 :建立特征-類別回歸模型;S3 :對(duì)測(cè)試圖像集合進(jìn)行投影;S4 :對(duì)測(cè)試圖像集合進(jìn)行分類。本發(fā)明組織訓(xùn)練圖像集合的方法為給定m個(gè)帶有類別標(biāo)簽的訓(xùn)練圖像集合,分別構(gòu)造用于存放觀察樣本特征表示向量的預(yù)測(cè)矩陣X和用于存放觀察樣本類別指示向量的響應(yīng)矩陣Y,其中,m為大于I的正整數(shù)。預(yù)測(cè)矩陣X的每一行對(duì)應(yīng)ー個(gè)觀察樣本的特征表示向量,該特征表示向量可以是但不限于圖像灰度特征、小波特征。響應(yīng)矩陣Y的每一行對(duì)應(yīng)ー個(gè)觀察樣本的類別屬性指示向量。具體地,假設(shè)給定的類別數(shù)為c,那么響應(yīng)矩陣Y的姆一行為c維的類別指示向量,如果ー個(gè)類別指示向量的第j個(gè)元素為1,其余元素全為0,即為
,則表明當(dāng)前觀察樣本屬于第j類,其中,c為大于I的正整數(shù),j為小于或等于c的正整數(shù)。本發(fā)明建立特征-類別回歸模型的方法為采用偏最小ニ乘回歸方法學(xué)習(xí)觀察圖像集合的預(yù)測(cè)矩陣X與響應(yīng)矩陣Y之間的線性回歸模型Y = XBpw如圖2所示,該模型的具體求解步驟如下首先,根據(jù)構(gòu)造的預(yù)測(cè)矩陣X和響應(yīng)矩陣Y,定義偏最小ニ乘回歸的目標(biāo)函數(shù)X = ΤΡτ+ΕY = UQT+F其中,T為預(yù)測(cè)數(shù)據(jù)X對(duì)應(yīng)的語義表示矩陣,U為響應(yīng)數(shù)據(jù)Y對(duì)應(yīng)的語義表示矩陣,P為X對(duì)應(yīng)的荷載矩陣,Q為Y對(duì)應(yīng)的荷載矩陣,E為X對(duì)應(yīng)的殘差矩陣,F(xiàn)為Y對(duì)應(yīng)的殘差矩陣。然后,采用迭代優(yōu)化方法最大化目標(biāo)語義空間變量T和U之間的協(xié)方差,在本實(shí)施方式中,可以采用但不限于NIPALS的方法求解目標(biāo)語義空間變量T和U之間的協(xié)方差,其中,變量T和U之間為線性關(guān)系,具有U = TD+H,其中,D為對(duì)角矩陣,H為殘差矩陣。最后,利用優(yōu)化所得的變量T和U,推導(dǎo)出預(yù)測(cè)矩陣X與響應(yīng)矩陣Y之間的關(guān)系Y= X(Pt)+DQt,得到線性回歸模型Bm= (Pt)+DQt。通過這ー線性回歸模型,可以建立不同類別觀察數(shù)據(jù)的樣本特征表示與其對(duì)應(yīng)類別屬性標(biāo)簽之間的本質(zhì)語義關(guān)聯(lián),從而用于測(cè)試階段的樣本投影分類。本發(fā)明對(duì)測(cè)試集合進(jìn)行投影的方法為給定未知類別的一個(gè)圖像集合,按照訓(xùn)練圖像集合的構(gòu)造方式,將每個(gè)圖像樣本對(duì)應(yīng)的特征表示向量作為觀察圖像預(yù)測(cè)矩陣Xt的一個(gè)行向量,利用訓(xùn)練階段學(xué)習(xí)所得的線性回歸模型Bpw得到測(cè)試圖像樣本集合對(duì)應(yīng)的類別指示向量的響應(yīng)矩陣Yt = XtBm。本發(fā)明對(duì)測(cè)試集合進(jìn)行分類的方法為通過綜合測(cè)試圖像集合內(nèi)各單樣本的類別指示向量的投票得到。具體有兩種投票方式第一種投票方式為首先根據(jù)各單樣本對(duì)應(yīng)的類別指示向量確定其所屬類別,之 后依據(jù)各類別所對(duì)應(yīng)的樣本數(shù)進(jìn)行最大數(shù)投票。具體操作為記錄響應(yīng)矩陣Yt每個(gè)行向量中最大元素所對(duì)應(yīng)的位置標(biāo)號(hào),之后根據(jù)各標(biāo)號(hào)出現(xiàn)的頻次進(jìn)行由大到小的排序,頻次最高的標(biāo)號(hào)即對(duì)應(yīng)該測(cè)試圖像集合的類別標(biāo)號(hào)。第二種投票方式為首先將所有單樣本的類別指示向量累加得到整體圖像集合的類別指示向量,之后依據(jù)該類別指示向量針對(duì)不同類別的響應(yīng)來進(jìn)行投票。具體操作為累加矩陣Yt的所有行向量得到一個(gè)整體和向量,記錄該和向量中最大元素值所對(duì)應(yīng)的位置標(biāo)號(hào),即為給定測(cè)試圖像集合的類別標(biāo)號(hào)。在本說明書的描述中,參考術(shù)語“ー個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“ー些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少ー個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,本領(lǐng)域的普通技術(shù)人員可以理解在不脫離本發(fā)明的原理和宗g的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由權(quán)利要求及其等同物限定。
權(quán)利要求
1.ー種基于回歸模型的圖像集合建模與匹配方法,其特征在于,包括如下步驟 Si:組織訓(xùn)練圖像集合; S2:建立特征-類別回歸模型; 53:對(duì)測(cè)試圖像集合進(jìn)行投影; 54:對(duì)測(cè)試圖像集合進(jìn)行分類。
2.如權(quán)利要求I所述的基于回歸模型的圖像集合建模與匹配方法,其特征在于,所述組織訓(xùn)練圖像集合的方法為給定m個(gè)帶有類別標(biāo)簽的訓(xùn)練圖像集合,分別構(gòu)造用于存放觀察樣本特征表示向量的預(yù)測(cè)矩陣X和用于存放觀察樣本類別指示向量的響應(yīng)矩陣Y,其中,預(yù)測(cè)矩陣X的每一行對(duì)應(yīng)ー個(gè)觀察樣本的特征表示向量,響應(yīng)矩陣Y的每一行對(duì)應(yīng)ー個(gè)觀察樣本的類別指示向量,所述m為大于I的正整數(shù)。
3.如權(quán)利要求I所述的基于回歸模型的圖像集合建模與匹配方法,其特征在于,建立特征-類別回歸模型的方法為采用偏最小ニ乘回歸方法學(xué)習(xí)預(yù)測(cè)矩陣X與響應(yīng)矩陣Y之間的線性回歸模型Y = XBm。
4.如權(quán)利要求3所述的基于回歸模型的圖像集合建模與匹配方法,其特征在于,所述線性回歸模型Y = XBpls包括如下求解步驟 511:根據(jù)構(gòu)造的預(yù)測(cè)矩陣X和響應(yīng)矩陣Y,定義偏最小ニ乘回歸的目標(biāo)函數(shù)X = TPt+EY = UQt+F 其中,T為預(yù)測(cè)數(shù)據(jù)X對(duì)應(yīng)的語義表示矩陣,U為響應(yīng)數(shù)據(jù)Y對(duì)應(yīng)的語義表示矩陣,P為X對(duì)應(yīng)的荷載矩陣,Q為Y對(duì)應(yīng)的荷載矩陣,E為X對(duì)應(yīng)的殘差矩陣,F(xiàn)為Y對(duì)應(yīng)的殘差矩陣; 512:采用迭代優(yōu)化方法最大化目標(biāo)語義空間中變量T和U之間的協(xié)方差,其中,T和U之間為線性關(guān)系,具有U = TD+H,其中,D為對(duì)角矩陣,H為殘差矩陣; 513:利用優(yōu)化所得的內(nèi)蘊(yùn)空間語義變量T和U,推導(dǎo)出預(yù)測(cè)矩陣X與響應(yīng)矩陣Y之間的線性回歸模型Y = X(Pt)+DQt,得到Bpls = (Pt)+DQt0
5.如權(quán)利要求I所述的基于回歸模型的圖像集合建模與匹配方法,其特征在于,對(duì)測(cè)試集合進(jìn)行投影的方法為給定未知類別的一個(gè)圖像集合,按照訓(xùn)練圖像集合的構(gòu)造方式,將每個(gè)圖像樣本對(duì)應(yīng)的特征表示向量作為觀察圖像預(yù)測(cè)矩陣Xt的ー個(gè)行向量,利用訓(xùn)練階段學(xué)習(xí)所得的線性回歸模型得到,得到測(cè)試圖像樣本集合對(duì)應(yīng)的類別指示向量的響應(yīng)矩陣Yt = XtBm。
6.如權(quán)利要求I所述的基于回歸模型的圖像集合建模與匹配方法,其特征在于,對(duì)測(cè)試集合進(jìn)行分類的方法為綜合測(cè)試圖像集合內(nèi)各單樣本的類別指示向量的投票得到。
7.如權(quán)利要求6所述的基于回歸模型的圖像集合建模與匹配方法,其特征在于,所述投票方式為根據(jù)各單樣本對(duì)應(yīng)的類別指示向量確定其所屬類別,之后依據(jù)各類別所對(duì)應(yīng)的樣本數(shù)進(jìn)行最大數(shù)投票。
8.如權(quán)利要求6所述的基于回歸模型的圖像集合建模與匹配方法,其特征在于,所述投票方式為將所有單樣本的類別指示向量累加得到整體圖像集合的類別指示向量,依據(jù)所述類別指示向量針對(duì)不同類別的響應(yīng)來進(jìn)行投票。
全文摘要
本發(fā)明提出了一種基于回歸模型的圖像集合建模與匹配方法,其包括如下步驟組織訓(xùn)練圖像集合;建立特征-類別回歸模型;對(duì)測(cè)試圖像集合進(jìn)行投影;對(duì)測(cè)試圖像集合進(jìn)行分類。本發(fā)明針對(duì)具有任意樣本分布形式的圖像集合,采用樣本特征與相應(yīng)的類別標(biāo)記學(xué)習(xí)雙線性回歸模型,建立起集合樣本與其類別之間的本質(zhì)語義關(guān)聯(lián);針對(duì)未知類別標(biāo)記的集合,只需將其每個(gè)樣本進(jìn)行線性回歸然后綜合各樣本的類別響應(yīng)即可得到整體集合的類別輸出。該方法直觀高效,計(jì)算簡(jiǎn)便,其對(duì)集合樣本的分布形式和集合樣本的規(guī)模均無任何先驗(yàn)假設(shè),對(duì)集合中可能存在的噪聲數(shù)據(jù)具有很好的容忍性。
文檔編號(hào)G06K9/62GK102663418SQ20121007688
公開日2012年9月12日 申請(qǐng)日期2012年3月21日 優(yōu)先權(quán)日2012年3月21日
發(fā)明者戴瓊海, 王瑞平 申請(qǐng)人:清華大學(xué)