一種非相鄰的圖結(jié)構(gòu)稀疏人臉識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種非相鄰的圖結(jié)構(gòu)稀疏人臉識(shí)別方法,屬稀疏表示人臉識(shí)別技術(shù)領(lǐng) 域。
【背景技術(shù)】
[0002] 壓縮感知(Compressed sensing, C巧針對(duì)具有稀疏性或在特定域上具有稀疏性的 信號(hào),通過實(shí)施遠(yuǎn)低于奈奎斯特采樣率的隨機(jī)采樣,利用信號(hào)的稀疏性和測(cè)量矩陣與測(cè)量 基之間的非相干性,可高概率地精確重構(gòu)原始信號(hào)。在壓縮感知理論的推動(dòng)下,近幾年,稀 疏編碼和稀疏表示技術(shù)得到了飛速發(fā)展。稀疏表示的思想是假設(shè)觀測(cè)數(shù)據(jù)y e RD可表示 成數(shù)據(jù)字典D G RDXP的稀疏線性組合,即巧=D a,式中a G RP是y在字典D下的表示系 數(shù)?;谙∈璞硎镜娜四樧R(shí)別方法是在已知y和D的條件下,通過壓縮感知重構(gòu)算法求解 稀疏表示系數(shù)a,再通過分析稀疏表示系數(shù)對(duì)樣本進(jìn)行判別歸類。
[0003] 稀疏表示的人臉識(shí)別技術(shù)可W分為傳統(tǒng)的稀疏表示人臉識(shí)別、非重疊的組結(jié)構(gòu)稀 疏人臉識(shí)別和可重疊的圖結(jié)構(gòu)稀疏人臉識(shí)別H個(gè)階段。
[0004] 傳統(tǒng)的稀疏表示分類模型(Sparse Representation-based Classification, SRC)是將一個(gè)人臉識(shí)別問題轉(zhuǎn)變?yōu)橐粋€(gè)稀疏表示問題,即將測(cè)試數(shù)據(jù)表 示成數(shù)據(jù)字典的稀疏線性組合,如圖1所示。SRC的數(shù)據(jù)字典是由已知分類的所有類別的訓(xùn) 練樣本構(gòu)成,若訓(xùn)練樣本有m個(gè)類別,每類別有q個(gè)訓(xùn)練數(shù)據(jù),每個(gè)圖像被堆疊為一維向量, 則數(shù)據(jù)字典可表示為 D = [dll. . . di。,......,d。. . . di。,......,dmi. . . dm。],式中[d。,...中。] 是第i類的訓(xùn)練樣本。如果y是第i類的測(cè)試數(shù)據(jù),則在理想的情況下,通過稀疏重構(gòu)所獲 得的表示系數(shù)中,字典原子[中1,...中。]所對(duì)應(yīng)的系數(shù)項(xiàng)為非零,而其他項(xiàng)為零,即表示 系數(shù)可表示為;5 = [D,…,G,%,…,聽,0,…,0],它是稀疏的,平均只有1/m個(gè)非零項(xiàng),測(cè)試數(shù)據(jù)可 表示為y = [d。,. . .,di。] [ a 11,. . .,a JT。但由于人臉圖像都具有類似的特征,使得其他 類別所對(duì)應(yīng)的表示系數(shù)并不一定為零,因而存在著挑戰(zhàn)的問題。
[0005] 在SRC的基礎(chǔ)上,有關(guān)文獻(xiàn)提出了魯棒的SRC模型(R-SRC),將噪聲的影響考慮 進(jìn)來,則測(cè)試數(shù)據(jù)y = y〇+e,y??杀硎緸橛?xùn)練字典D的稀疏線性組合,噪聲e G RD可表示 為單位矩陣A G RDXn的稀疏線性組合,將訓(xùn)練字典和單位矩陣合并可構(gòu)成新的過完備字 典基巧A],y可表示為新基下的稀疏線性組合,R-SRC模型對(duì)噪聲和偽裝具有很強(qiáng)的魯 棒性。有文獻(xiàn)綜合了此類稀疏分類模型,將各種保真函數(shù)與懲罰函數(shù)相結(jié)合,得到適合不 同條件的人臉識(shí)別模型,統(tǒng)稱為競(jìng)爭(zhēng)表示模型(coll油orative r巧resentation based classification, CRC)。有的文獻(xiàn)提出了擴(kuò)展的SRC模型巧SRC),ESRC模型假設(shè)各類別共 享相同的環(huán)境條件,其字典不僅包含訓(xùn)練樣本,還包括各類別的類內(nèi)差異,ESRC模型可W應(yīng) 用于單個(gè)訓(xùn)練樣本的場(chǎng)合。
[0006] 傳統(tǒng)的SRC模型將每個(gè)字典原子分隔開來,獨(dú)立處理,沒有考慮各原子之間 的關(guān)系,所產(chǎn)生的稀疏是非結(jié)構(gòu)的。近年來,研究人員根據(jù)SRC模型中數(shù)據(jù)字典的組 塊結(jié)構(gòu),提出了組結(jié)構(gòu)的稀疏表示分類模型(Group Sparse Representation-based Classification, GSRC),此模型利用了數(shù)據(jù)字典的組塊特性,限制了搜索空間,從而提高了 人臉識(shí)別的性能。但人們也發(fā)現(xiàn)如果組塊內(nèi)的成員能互相補(bǔ)充,互相促進(jìn),則能增強(qiáng)數(shù)據(jù)的 表示能力;但如果組塊內(nèi)成員的作用互相抵消,則組結(jié)構(gòu)會(huì)起到相反的作用。為此人們采用 聚類方法或非線性流行學(xué)習(xí)的方法,將相似的樣本進(jìn)行聚類,然后根據(jù)聚類結(jié)果將類內(nèi)樣 本進(jìn)一步劃分為多個(gè)小組,此方法一定程序上可W降低組塊劃分不當(dāng)造成的影響。但并不 是相似樣本構(gòu)成的組塊其表示能力就能增強(qiáng),組塊內(nèi)成員相似,意味著其產(chǎn)生的作用重復(fù), 因此相似樣本所起到的作用較??;反而是一些差異較大的樣本,由于他們互相補(bǔ)充,其數(shù)據(jù) 表示能力增強(qiáng)較大。另外,如果組塊內(nèi)成員差異較大,也有可能其成員的作用互相抵消,貝U 會(huì)降低組塊的作用。因此對(duì)數(shù)據(jù)字典進(jìn)行聚類處理,其作用有限。
[0007] 圖結(jié)構(gòu)是比組結(jié)構(gòu)更一般的數(shù)據(jù)結(jié)構(gòu),其組劃分是動(dòng)態(tài)的、可重疊的,其組劃分預(yù) 先是不可知的。為了尋找到最佳的組劃分,需要通過搜索的方式分析所有可能的組合,該種 搜索如果不加限制,則很可能產(chǎn)生組合爆炸,為此一般的圖稀疏方法都是限制組成員由相 鄰元素構(gòu)成,其組劃分的方法就好像是用一個(gè)滑動(dòng)窗口在數(shù)據(jù)上截取組塊,所截取的組塊, 其成員是由相鄰元素構(gòu)成。一般圖結(jié)構(gòu)稀疏方法比較適合自然數(shù)據(jù),因?yàn)樽匀粩?shù)據(jù)都具有 一定的連續(xù)性,由相鄰元素構(gòu)成的組塊可W表示具有連續(xù)特性的自然數(shù)據(jù)。然而SRC模型 其數(shù)據(jù)字典并沒有該樣的連續(xù)性,因而一般的圖結(jié)構(gòu)稀疏也不適合SRC模型。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明需要解決的問題包括;如何表示非相鄰的圖結(jié)構(gòu)?如何搜索表示能力最 強(qiáng)的組塊?為了避免搜索過程中的組合爆炸,采取什么樣的限制策略?使算法既具有可行 性,又能尋找到所需要的組塊。在算法實(shí)現(xiàn)過程中,如何衡量結(jié)構(gòu)稀疏度?并進(jìn)行量化實(shí) 現(xiàn)。最后選擇哪種壓縮感知重構(gòu)算法?
[0009] 本發(fā)明的技術(shù)方案是,本發(fā)明一種非相鄰的圖結(jié)構(gòu)稀疏人臉識(shí)別方法包括非相鄰 的圖結(jié)構(gòu)稀疏、分塊組合搜索方法、結(jié)構(gòu)稀疏度的衡量方法及實(shí)現(xiàn)結(jié)構(gòu)稀疏重構(gòu)的算法。
[0010] 本發(fā)明方法根據(jù)稀疏表示分類模型數(shù)據(jù)字典的結(jié)構(gòu)特點(diǎn),通過非相鄰的圖結(jié)構(gòu)稀 疏來增強(qiáng)系統(tǒng)的性能,非相鄰圖結(jié)構(gòu)的組塊是動(dòng)態(tài)的,可重疊的,預(yù)先不可知的,組成員可 W是不相鄰的;為了實(shí)現(xiàn)非相鄰圖結(jié)構(gòu)稀疏,所述方法采用組合搜索的方法獲得所有可能 的組塊,包括相鄰或不相鄰的組塊,從中尋找表示能力最強(qiáng)的組塊;為了避免在搜索中產(chǎn)生 組合爆炸,所述方法提出分塊組合搜索的方法用于限制搜索空間;此外,所述方法還提出W 編碼復(fù)雜度來衡量結(jié)構(gòu)稀疏度,采用結(jié)構(gòu)貪婪算法來實(shí)現(xiàn)結(jié)構(gòu)稀疏重構(gòu)。
[0011] 本發(fā)明是在SRC模型的基礎(chǔ)上,利用數(shù)據(jù)字典中的結(jié)構(gòu)先驗(yàn)知識(shí),通過非相鄰的 圖結(jié)構(gòu)稀疏來提高人臉識(shí)別的性能?,F(xiàn)有的結(jié)構(gòu)稀疏方案,無論是非重疊的組稀疏,還是可 重疊的圖稀疏,其組成員都要求是相鄰的,該種限制能縮小搜索范圍,比較適合具有連續(xù)性 的自然數(shù)據(jù)的處理。非相鄰的圖結(jié)構(gòu),其與一般的圖結(jié)構(gòu)的最大區(qū)別在于其組成員可W是 不相鄰的;一般的圖結(jié)構(gòu)稀疏方法為了縮小搜索范圍,都要求組塊成員是相鄰的,該種限制 符合一般自然數(shù)據(jù)的特征,因?yàn)樽匀粩?shù)據(jù)都具有連續(xù)性,其組塊由相鄰元素構(gòu)成,因此該種 限制并不會(huì)丟失所需要的組塊。但SRC數(shù)據(jù)字典的排列沒有連續(xù)的特性,系統(tǒng)所需要的組 塊很可能是不相鄰的,因此該種相鄰的組結(jié)構(gòu)或圖結(jié)構(gòu)并不適合SRC模型的結(jié)構(gòu)特征。為 此本發(fā)明提出非相鄰的圖結(jié)構(gòu),其組塊是動(dòng)態(tài)的,可重疊的,預(yù)先不可知的,組成員可W是 不相鄰的。
[0012] 為了實(shí)現(xiàn)非相鄰的圖結(jié)構(gòu)稀疏,需要搜索所有可能的組塊,包括相鄰或非相鄰,為 此,本發(fā)明設(shè)計(jì)使用組合搜索的方式來搜索所有可能組合。顯而易見,如果不加限制,該種 組合搜索很容易產(chǎn)生組合爆炸,造成不可行計(jì)算。
[0013] 為了避免搜索過程中的組合爆炸,設(shè)計(jì)了相應(yīng)限制策略W縮小搜索范圍;首先可 W僅搜索固定長(zhǎng)度的小組塊,把該些小組塊作為基塊,由基塊的聯(lián)合構(gòu)成其他形式的組塊; 若b是基塊的索引,B是所有基塊的索引集合,稱為基子集,則任何一個(gè)組塊的索引F都能 表示為基子集的并集,F(xiàn) = U b€cb。因此僅需要搜索基子集空間,就能搜索到所有需要的組 塊。
[0014] 但是通過W上方法所得到的基子集空間仍然是非常鹿大的,例如,如果表示系數(shù) 的維數(shù)為300,設(shè)置基塊大小為3,則其組合數(shù)將達(dá)到ci。4 J X ,如此大的基子 集空間將產(chǎn)生非常大的計(jì)算負(fù)擔(dān),因此需要進(jìn)一步縮小基子集空間。在數(shù)據(jù)維數(shù)較大時(shí),組 合搜索基本是不可行的,但數(shù)據(jù)維數(shù)不高時(shí),組合搜索是可行的。為此可W采用將數(shù)據(jù)進(jìn)行 分塊,再在數(shù)據(jù)塊內(nèi)進(jìn)行組合搜索,最后將各數(shù)據(jù)塊的搜索結(jié)果合并的方法解決。由于SRC 模型的數(shù)據(jù)字典是按類排列,對(duì)應(yīng)的表示系數(shù)可W按類別自然分塊,在每個(gè)類別的訓(xùn)練樣 本數(shù)不多的情況下,可W對(duì)類內(nèi)系數(shù)進(jìn)行組合搜索,獲得所有組合的基塊,再將各類別的基 塊合并成基子集空間。
[0015] 本發(fā)明分塊組合搜索方法將數(shù)據(jù)字典按類別自然分塊,再在數(shù)據(jù)塊內(nèi)進(jìn)行組合搜 索,最后將各數(shù)據(jù)塊的搜索結(jié)果合并的方法;該種分塊組合搜索所產(chǎn)生的空間是較小的,若 表示系數(shù)的維數(shù)是300,共60個(gè)類別,每類別5個(gè)樣本,每類別長(zhǎng)度為3的基塊組合共10個(gè), 則基子集空間的大小為60*C^二600《4.5xl06,分塊組合搜索的基子集空間遠(yuǎn)小于不 分塊的組合搜索。通過W上方法可W極大地縮減搜索空間,將一個(gè)NP的組合搜索問題變?yōu)?一個(gè)可行計(jì)算。
[0016] 分塊組合搜索的基子集空間雖然減小了,但它并沒有丟失SRC模型需要的組塊, 因?yàn)镾RC模型所需要的組塊,其成員都是由同類的樣本構(gòu)成,分塊組合搜索是在同類別的 樣本中進(jìn)行組合,因而不會(huì)丟失所有可能入選的組塊。再者分塊組合搜索的基子空間包括 不相鄰元素構(gòu)成的基塊,因此不管數(shù)據(jù)字典如何排列,其組塊成員都會(huì)進(jìn)入搜索空間,因此 數(shù)據(jù)字典的排列順序不會(huì)影響系統(tǒng)的性能。
[0017] 為了實(shí)現(xiàn)非相鄰的圖結(jié)構(gòu)稀疏,結(jié)構(gòu)稀疏度的衡量也是一個(gè)關(guān)鍵的問題。本發(fā)明 不是采用常規(guī)的復(fù)