面部快速識(shí)別系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種快速、高效的面部識(shí)別系統(tǒng)及方法。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)及圖像處理技術(shù)的發(fā)展,面部識(shí)別技術(shù)越來越多的應(yīng)用于安防系統(tǒng), 視頻交互應(yīng)用,圖像編輯及歸檔應(yīng)用,計(jì)算機(jī)視頻應(yīng)用等方面。
[0003] 通過給定的圖像推導(dǎo)出某一人物的身份是面部識(shí)別的一個(gè)挑戰(zhàn)性難題。目前,在 處理非可控制環(huán)境下大規(guī)模的面部識(shí)別系統(tǒng)上已經(jīng)有一些研究成果。近來,基于稀疏表示 的分類識(shí)別(SRC)的臉部識(shí)別技術(shù)及其擴(kuò)展提高了面部識(shí)別的性能。
[0004] SRC的主要思想在于:一個(gè)目標(biāo)面部圖像都可以由相同目標(biāo)在不同情況下(例如, 姿勢(shì),光照條件等等)獲取的可使用的圖像的稀疏線性組合表示。上述思想也可以應(yīng)用于 一個(gè)面部圖像本身是在較低維度空間中描述的,重要且容易的可識(shí)別特征所表示的情況 中。為加強(qiáng)稀疏性,可采用^優(yōu)化算法,然后,選擇產(chǎn)生最小重建誤差的面部類別用于目標(biāo) 物的歸類或確認(rèn)。
[0005] 但是,基于稀疏表示的面部識(shí)別通常是假設(shè)訓(xùn)練圖像是處于嚴(yán)格控制下,并且每 一類的樣本數(shù)目非常龐大。為了克服每一類樣本數(shù)需求量大的局限性,本發(fā)明采用稀疏性 與附加的信息量大的最小二乘法相結(jié)合的方法達(dá)到顯著的性能改進(jìn),并且額外成本小。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明一方面公開了一種面部識(shí)別方法,其采用了應(yīng)用于計(jì)算系統(tǒng)中的基于稀疏 表示及正則化的最小二乘法歸類方法。所述面部識(shí)別方法包括:獲取一個(gè)圖像作為一個(gè)測(cè) 試樣本y,將某一特定物體的一組訓(xùn)練圖像集合作為訓(xùn)練樣本矩陣T,獲取包含稀疏向量a 初始估值的訓(xùn)練樣本和測(cè)試樣本的稀疏表示;構(gòu)建一個(gè)新面部字典,其包含一個(gè)帶非零相 關(guān)系數(shù)的稀疏向量a的訓(xùn)練樣本。該面部識(shí)別方法也公開了通過求解正則化的最小二乘法 問題獲得新系數(shù),確定基于通過新系數(shù)計(jì)算的最低類殘余的測(cè)試樣本的面部特征。
[0007] 本發(fā)明的另一方面公開了一種面部識(shí)別系統(tǒng),其用于在計(jì)算系統(tǒng)中運(yùn)行使用基于 稀疏表示及正則化的最小二乘法歸類的面部識(shí)別方法。所述面部識(shí)別方法包括:獲取一個(gè) 圖像作為一個(gè)測(cè)試樣本y,將某一特定物體的一組訓(xùn)練圖像集合作為訓(xùn)練樣本矩陣T,獲取 包含稀疏向量a初始估值的訓(xùn)練樣本和測(cè)試樣本的稀疏表示;構(gòu)建一個(gè)新面部字典,其包 含一個(gè)帶非零相關(guān)系數(shù)的稀疏向量a的訓(xùn)練樣本。該面部識(shí)別方法也公開了通過求解正則 化的最小二乘法問題獲得新系數(shù),確定基于通過新系數(shù)計(jì)算的最低類殘余的測(cè)試樣本的面 部特征。
[0008] 本發(fā)明的其他方面,所屬技術(shù)領(lǐng)域技術(shù)人員能夠依據(jù)本發(fā)明的說明書,權(quán)利要求 書,以及附圖有效實(shí)施并充分公開。
【附圖說明】
[0009] 圖1為本發(fā)明【具體實(shí)施方式】中的一個(gè)具體工作系統(tǒng)的示意圖。
[0010] 圖2為本發(fā)明具體實(shí)施例的計(jì)算系統(tǒng)的結(jié)構(gòu)框圖。
[0011] 圖3為本發(fā)明具體實(shí)施例的視頻結(jié)構(gòu)的示意圖。
[0012] 圖4為本發(fā)明具體實(shí)施例的面部識(shí)別過程的示意圖。
【具體實(shí)施方式】
[0013] 附圖中展示的部分將被引以具體說明闡述本發(fā)明具體技術(shù)實(shí)施方案。說明書中引 用的數(shù)字代表附圖的相應(yīng)部分。
[0014] 圖1展示了本發(fā)明【具體實(shí)施方式】中的一個(gè)工作系統(tǒng)100。如圖1所示,所述工作系 統(tǒng)100可包括:計(jì)算系統(tǒng)102,通信網(wǎng)絡(luò)110,攝像機(jī)112,便攜式存儲(chǔ)設(shè)備114以及數(shù)據(jù)存 儲(chǔ)設(shè)備116。當(dāng)然可以減省一些設(shè)備,還可以添加其他合適的設(shè)備。
[0015] 計(jì)算系統(tǒng)102可以是任何具有計(jì)算能力的電子設(shè)備,例如電視機(jī)(TV),機(jī)頂盒,移 動(dòng)手機(jī),智能手機(jī),平板電腦,個(gè)人電腦(PC),服務(wù)器類計(jì)算機(jī),手提電腦,掌上電腦(PDA) 等。
[0016] 所述通信網(wǎng)絡(luò)110可包括任何數(shù)量的通信網(wǎng)絡(luò)和服務(wù)器,提供給計(jì)算系統(tǒng)102不 同類型的媒體,例如視頻流,照片和圖像等。攝像機(jī)112可以是計(jì)算系統(tǒng)102的內(nèi)置攝像機(jī), 或者是與計(jì)算系統(tǒng)102通過網(wǎng)絡(luò)連接的外置攝像機(jī)。攝像機(jī)112可以向計(jì)算系統(tǒng)102提供 圖像以及視頻。
[0017] 便攜式存儲(chǔ)設(shè)備114可包括任何合適的便攜式存儲(chǔ)裝置,例如記憶卡,閃存或者 其他類型的可移動(dòng)存儲(chǔ)媒介,用于存儲(chǔ)計(jì)算系統(tǒng)102的圖像或者視頻。進(jìn)一步的,數(shù)據(jù)存儲(chǔ) 設(shè)備116可以是內(nèi)置或者外置的數(shù)據(jù)存儲(chǔ)裝置,例如用于為計(jì)算系統(tǒng)102存儲(chǔ)圖像或者是 視頻的硬盤或者數(shù)據(jù)庫(kù)。
[0018] 在操作過程中,計(jì)算系統(tǒng)102可從攝像機(jī)112,便攜式存儲(chǔ)設(shè)備114,數(shù)據(jù)存儲(chǔ)設(shè)備 116,和/或通信網(wǎng)絡(luò)110獲取圖像和/或視頻,還可對(duì)圖像和/或視頻進(jìn)行進(jìn)行圖像處理, 例如面部識(shí)別。圖2為計(jì)算系統(tǒng)102的具體結(jié)構(gòu)框圖。
[0019] 如圖2所示,所述計(jì)算系統(tǒng)102可包括一個(gè)處理器202,隨機(jī)存儲(chǔ)器(RAM) 204,只 讀存儲(chǔ)器(ROM) 206,存儲(chǔ)單元208,顯示器210,輸入/輸出接口 212,數(shù)據(jù)庫(kù)214,通信接口 216以及圖像單元220。在不違背本實(shí)施方式原則的情況下,可以減省某些設(shè)備,也可以添 加一些其他類型的設(shè)備。
[0020] 所述處理器202可以是任何通用的微處理器,數(shù)位信號(hào)處理器或微控制器或者專 用集成電路(ASIC)。處理器202可執(zhí)行一序列的計(jì)算機(jī)程序指令來完成與計(jì)算系統(tǒng)102相 關(guān)的各種處理。處理器202執(zhí)行的計(jì)算機(jī)程序指令可由只讀存儲(chǔ)器206,或存儲(chǔ)單元208存 入隨機(jī)存儲(chǔ)器204。存儲(chǔ)單元208可包含任何合適類型的大容量存儲(chǔ)器,用來存儲(chǔ)處理器 202執(zhí)行時(shí)所需的任意類型信息。例如,存儲(chǔ)單元208可包括可提供存儲(chǔ)空間的一個(gè)或多個(gè) 硬盤裝置,光盤裝置,閃存或其他存儲(chǔ)裝置。
[0021] 顯示器210可向使用計(jì)算系統(tǒng)102的用戶提供信息。顯示器210可以是任何計(jì)算 機(jī)顯示器或電子顯示器(例如CRT或者IXD電子裝置)。用戶可通過輸入/輸出接口 212 向計(jì)算系統(tǒng)102輸入信息或者接收信息。例如,輸入/輸出接口 212可以是任意輸入裝置, 如鍵盤,鼠標(biāo),電子輸入板,語音裝置,或者其他光纖或無線輸入裝置。輸入/輸出接口 212 可接收來自圖像單元220的數(shù)據(jù),和/或向圖像單元220發(fā)送數(shù)據(jù)。
[0022] 進(jìn)一步的,數(shù)據(jù)庫(kù)214可包括任何類型的商業(yè)或者自定義數(shù)據(jù)庫(kù),也可包括用于 分析數(shù)據(jù)庫(kù)信息的分析工具。數(shù)據(jù)庫(kù)214可用于存儲(chǔ)圖像和圖形信息以及其他相關(guān)信息。 通信接口 216可提供通信連接功能,這樣計(jì)算系統(tǒng)102可經(jīng)由不同的通信協(xié)議,如傳輸控制 協(xié)議/網(wǎng)間協(xié)議(TCP/IP),超文本傳輸協(xié)議(HTTP)等,通過電腦網(wǎng)絡(luò)和通信網(wǎng)絡(luò)被遠(yuǎn)距離 訪問,和/或與其他系統(tǒng)溝通。圖像單元可以包括任何與處理器202相結(jié)合或匹配的圖像 采集,存儲(chǔ),和/或處理元件。
[0023] 在操作過程中,所述計(jì)算系統(tǒng)102,尤其是處理器202和/或圖像單元220可執(zhí)行 某特定程序來處理不同來源的圖像以識(shí)別相關(guān)的物體,和提供更進(jìn)一步的處理和應(yīng)用。例 如,計(jì)算系統(tǒng)102可回放視頻,并對(duì)視頻流中的圖像進(jìn)行面部識(shí)別。
[0024] -個(gè)視頻流可以分成多段不同的視頻片段,如圖3所示,一個(gè)視頻流可以分成許 多不同的場(chǎng)景,一個(gè)場(chǎng)景又可以進(jìn)一步細(xì)分為許多不同的鏡頭,一個(gè)鏡頭可以分為多個(gè)視 頻幀。每個(gè)視頻幀可以進(jìn)一步分為不同的物體,并且將視頻幀中的特征提取出來作進(jìn)一步 處理。所述面部識(shí)別可在物體層面運(yùn)行從而識(shí)別一個(gè)或者多個(gè)預(yù)設(shè)物體,如,人。
[0025] 所述面部識(shí)別可利用基于稀疏表示(SR)和正則化的最小二乘法(RLS)的分類算 法實(shí)現(xiàn)?;谙∈璞硎竞驼齽t化的最小二乘法的分類算法中,應(yīng)用了多種符號(hào)及計(jì)算方法。
[0026] 設(shè)表示面部測(cè)試樣本,其中,d表示所選面部特征的維度。令 P=[私…,3?e 表示項(xiàng)目c的樣本的集合堆疊為列的矩陣(字典)。pi表示第ith 個(gè)項(xiàng)目的樣本的第叫個(gè)集合,S卩E辦=11。
[0027] 在基于稀疏表示的分類識(shí)別(SRC)中,測(cè)試樣本y用如下算式表示:
[0028] y=Ta+e(1)
[0029] 其中,ee艫表示密集噪聲,aeP11表示一個(gè)非零元素的稀疏向量,其與一些T中的 樣本對(duì)應(yīng)。因此測(cè)試樣本可通過T中的樣本的稀疏線性組合所表示。通過求解下述最優(yōu)解 問題可以獲得a的系數(shù):
[0031] 在基于擴(kuò)展稀疏表示的分類識(shí)別(ESRC)中,測(cè)試樣本y用如下算式表示:
[0032] y=Ta+Vb+e(3)
[0033] 其中,reKdxi1表示可變字典,為每個(gè)目標(biāo)i表征,如同在SRC中,aeir?表示稀疏 向量。所述可變?cè)~典即以類內(nèi)變化的基礎(chǔ)為模型,例如光照改變,夸張的表情或遮擋。
[0034] V不能識(shí)別的不同類型的變量可由密集噪聲項(xiàng)6£鱸表示。向量6e麼也可考慮為 稀疏的,并且其系數(shù)在最終圖像不受控制的可視條件下,即識(shí)別目標(biāo)不具有多信息時(shí),能有 效識(shí)別。
[0035] 因此,測(cè)試樣本可以表示為識(shí)別物體身份Ta和識(shí)別稀疏噪音Vb的線性組合。可 變矩陣V可由每個(gè)樣本的不同之處和與其相對(duì)應(yīng)的類別矩心構(gòu)成,如下列算式所示:
[0038]進(jìn)一步,在ESRC中,可通過求解下述最優(yōu)解問題獲得稀疏向量a和b:
[0040] 類似于SRC,分類識(shí)別(或其他物體識(shí)別)通過選擇具有最小殘余的類別i進(jìn)行。 不同的是在計(jì)算每一類別的殘余時(shí),項(xiàng)目Vb要從測(cè)試樣本中剔除。
[0041] 進(jìn)一步的,在基于正則化的最小二乘法的分類表示(CR-RLS)中,正則化的最小二 乘法在對(duì)未知變量a沒有施加稀疏性限制的情況下用于表示測(cè)試樣本,分類則通過對(duì)每個(gè) 類別減少重建來實(shí)現(xiàn)。每個(gè)有效方法的最優(yōu)解問題可在相近形式中很容易的獲得,算式如 下:
[0043] 圖4是基于稀疏表示和正則化的最小二乘法(SR+RLS)的面部識(shí)別的具體實(shí)例。圖 4所示,首先,獲取測(cè)試樣本和訓(xùn)練矩陣T(S402)。所述測(cè)試樣本和訓(xùn)練矩陣T可通過以預(yù) 設(shè)物體為基礎(chǔ)的不同來源的視頻獲取。
[0044] 例如,對(duì)于一個(gè)特定的物體,該物體的不同圖像可以在不同的燈光條件,例如遮 擋,視角,環(huán)境,色彩,圖像尺寸等條件下獲取作為訓(xùn)練樣本。測(cè)試樣本可以是被識(shí)別的圖 像。所獲取的測(cè)試樣本和訓(xùn)練矩陣T可存儲(chǔ)在計(jì)算系統(tǒng)102 (例如,存儲(chǔ)器208)。
[0045]測(cè)試樣本,也就是向量y,可以從視頻幀或其他被識(shí)別的圖像中獲取,訓(xùn)練樣本,也 就是矩陣T,可以從相對(duì)應(yīng)的來源獲取。將向量y和矩陣T輸入面部識(shí)別算式中。
[0046] 更進(jìn)一步的,對(duì)訓(xùn)練樣本T展開主成分分析(PCA),從而將T映射到d維空間,即, 所選的面部特征維數(shù)。另外,可以對(duì)T的列進(jìn)行標(biāo)準(zhǔn)化處理以獲取I2-標(biāo)準(zhǔn)。
[0047] 進(jìn)一步的,可以獲取稀疏表示(SR) (S404)。也就是說,可獲取稀疏向量