硬件和軟件一起實(shí)現(xiàn)其功能。
[0032] 所述輸入視頻302可以包括任何合適類(lèi)型的資源的視頻內(nèi)容并且可以包含有多 種不同的視頻資源。源自于所述輸入視頻302的內(nèi)容可以包括視頻數(shù)據(jù)以及元數(shù)據(jù)。輸入 視頻的一系列視頻幀包含了輸入視頻302的內(nèi)容并用于其他模塊進(jìn)行處理。當(dāng)然,所述輸 入視頻也可以是一幅單獨(dú)的圖片。所述輸入視頻還可以被分為多個(gè)不同的視頻幀集合。
[0033] 所述面部檢測(cè)模塊304可以用于一系列視頻幀中定位面部。所述面部檢測(cè)模塊 304可以?xún)?nèi)置在電視機(jī)102中,或者作為一個(gè)獨(dú)立的模塊設(shè)置在電視機(jī)102外。
[0034] 所述運(yùn)算模塊306用于通過(guò)改進(jìn)的魯棒主成分分析算法(IRPCA)來(lái)初始化^半 二次的低秩表不算法(LRRHKhLl)并且通過(guò)所述h半二次的低秩表不算法來(lái)計(jì)算獲得所 述權(quán)重矩陣,從而在復(fù)雜的遮擋及噪聲、模糊的影響中恢復(fù)清晰的圖像。
[0035] 所述面部分類(lèi)模塊308用于通過(guò)魯棒協(xié)同表示算法(RCR)進(jìn)行分類(lèi)操作并且給出 選出的最終類(lèi)別辨認(rèn)特性。
[0036] 具體的,所述字典310可以包括任何合適的數(shù)據(jù)庫(kù)用于存儲(chǔ)面部圖像等。例如,一 個(gè)存儲(chǔ)有面部相關(guān)圖像收集結(jié)果的本地或在線數(shù)據(jù)庫(kù)。更具體的,對(duì)于在一部給定的電影 以及對(duì)應(yīng)的演員集合中進(jìn)行面部識(shí)別,每個(gè)演員(如目標(biāo)演員)的姓名以及電影名可以作 為檢索關(guān)鍵字,在字典中檢索獲得一系列圖像,其中每個(gè)圖像中均包含有一個(gè)或者多個(gè)演 員的面部。
[0037] 所述輸出模塊312用于輸出已辨認(rèn)面部。上述模塊可以整合到一起或者減省,也 可以添加一些其他功能模塊。
[0038] 圖4為本發(fā)明具體實(shí)施例的在所述面部識(shí)別系統(tǒng)的各個(gè)模塊中執(zhí)行的面部識(shí)別 程序400的方法流程圖。
[0039] 如圖4所示,首先,將輸入視頻分割為若干不同的視頻幀集合(S402)。由于視頻是 由一系列的視頻幀組成,并且在現(xiàn)有常用的視頻幀率(例如25幀/每秒)下,相鄰視頻幀的 變化非常小。因此,可以使用一些聚類(lèi)或者組合技術(shù)將整個(gè)視頻分割為若干個(gè)由相似的視 頻幀組成的視頻幀集合進(jìn)行進(jìn)一步的處理來(lái)替代原有獨(dú)立的處理每一視頻幀的處理方法。
[0040] 例如,圖5為將一個(gè)視頻流分割為若干個(gè)不同的視頻成分的示意圖。如圖5所示, 一個(gè)視頻流可以分割為若干個(gè)場(chǎng)景,一個(gè)場(chǎng)景可以分割為若干個(gè)鏡頭,并且一個(gè)鏡頭可以 分割為若干個(gè)視頻幀等。所述視頻幀可以進(jìn)一步分割為視頻幀的目標(biāo)及特征,所述目標(biāo)及 特征可以被提取用于進(jìn)一步的處理。
[0041] 繼續(xù)參閱圖4,在獲取輸入視頻序列后,所述視頻序列被簡(jiǎn)化為一個(gè)與通過(guò)記錄在 輸入視頻幀的每個(gè)攝像機(jī)參數(shù)設(shè)置,與初始攝像機(jī)參數(shù)設(shè)置對(duì)齊的已記錄攝像機(jī)參數(shù)設(shè)置 一致的視頻幀序列(S404)。
[0042] 典型的電影視頻序列是由多個(gè)攝影鏡頭以交錯(cuò)形式組成,并且"攝像機(jī)獲取的內(nèi) 容"是一個(gè)在給定的攝像機(jī)參數(shù)設(shè)置下連續(xù)的記錄過(guò)程。在此使用術(shù)語(yǔ)"攝像機(jī)參數(shù)設(shè)置 記錄結(jié)果"(camera registration)表示采用不同攝像機(jī)拍攝的視頻幀形成的某一視頻序 列或者視頻流的攝像機(jī)參數(shù)設(shè)置記錄結(jié)果。所述"攝像機(jī)參數(shù)設(shè)置記錄結(jié)果"的概念源自 于視頻編輯中視頻重構(gòu)的"攝像機(jī)獲取的內(nèi)容"(camera take)。
[0043] 典型的視頻序列是一個(gè)由多個(gè)鏡頭以交錯(cuò)形式組成,并且"攝像機(jī)獲取的內(nèi)容"是 一個(gè)在給定的攝像機(jī)參數(shù)設(shè)置下連續(xù)的記錄過(guò)程。通過(guò)記錄輸入視頻幀的每一個(gè)攝像機(jī)參 數(shù)設(shè)置,所述原始的鏡頭交錯(cuò)形式可以被分離為與初始攝像機(jī)參數(shù)設(shè)置對(duì)齊的"已記錄攝 像機(jī)參數(shù)設(shè)置"(registered camera)對(duì)應(yīng)的一系列視頻幀序列。
[0044] 在定義攝像機(jī)獲取的內(nèi)容后,檢測(cè)在視頻中每一視頻幀的面部(S406)。在每一視 頻幀中進(jìn)行面部檢測(cè)能夠在進(jìn)行面部識(shí)別之前有效的提供面部軌跡。這樣的,可以在每個(gè) 攝像機(jī)獲取的內(nèi)容中的每一視頻幀中進(jìn)行面部檢測(cè)。所述面部檢測(cè)能夠自動(dòng)的在一系列視 頻幀中定位面部的位置。
[0045] 在同一個(gè)攝像機(jī)獲取的內(nèi)容中檢測(cè)出的面部的集合可以作為面部軌跡。通過(guò)這種 方式,可以生成在整個(gè)視頻中的面部軌跡(S408)。具體的,一個(gè)新的面部軌跡通過(guò)在每一攝 像機(jī)獲取的內(nèi)容中的第一個(gè)檢測(cè)出的面部進(jìn)行初始化。對(duì)于攝像機(jī)獲取的內(nèi)容中的其他視 頻幀,當(dāng)來(lái)自于相鄰視頻幀之間的兩個(gè)檢測(cè)出的面部的距離超出預(yù)定的閾值時(shí),生成一個(gè) 新的面部軌跡。否則,將其加入到原有的面部軌跡中。
[0046] 進(jìn)一步的,使用基于魯棒協(xié)同表示分類(lèi)器,在具有復(fù)雜的遮擋及噪聲、模糊影 響的面部測(cè)試樣本中恢復(fù)一個(gè)清晰的圖像并進(jìn)行分類(lèi)(S410)?,F(xiàn)有的孤立點(diǎn)檢測(cè)算 法及分類(lèi)器能夠方便的整合到一個(gè)魯棒框架中用于協(xié)同表示。令y e 1^表示測(cè)試樣本, Γ =阢e irm表示c個(gè)目標(biāo)堆疊在列的樣本集合的矩陣(如字典),其中η e艫~表 示第ith個(gè)目標(biāo)的1個(gè)樣本集合從而令Σ ιηι=η。
[0047] 假設(shè)孤立點(diǎn)檢測(cè)結(jié)果輸入測(cè)試樣本y以及面部字典T,并且形成權(quán)重對(duì)角矩陣W。 這樣的w y是一個(gè)具有權(quán)重的測(cè)試樣本,其中孤立點(diǎn)部分(例如太陽(yáng)眼鏡的組成像素)被賦 予較小的權(quán)重(接近0)。所述孤立點(diǎn)檢測(cè)(OLD)的步驟通過(guò)如下算式表示:
[0048] ff = 0LD(y, T) (1)
[0049] 令分類(lèi)過(guò)程輸入測(cè)試樣本y、面部字典T以及權(quán)重對(duì)角矩陣W中,并輸出分類(lèi)結(jié)果 索引,所述分類(lèi)結(jié)果索引通過(guò)如下算式表示:
[0050] Identity (y) =CLF(y,T,ff) (2)
[0051] 算式1可以通過(guò)h半二次(Half Quardratic,HQ)最小化來(lái)求解,所述1丨半二次 優(yōu)化方法已經(jīng)被證明能夠在遮擋和噪聲、模糊等影響下保持魯棒。
[0052] 圖6為本發(fā)明具體實(shí)施例的魯棒協(xié)同表示方法的方法流程圖。如圖6所示,為了 初始化用于半二次(HQ)最小化的W,通過(guò)改進(jìn)的魯棒主成分分析來(lái)獲得一幅清晰的測(cè)試圖 像(S4102)。
[0053] 若函數(shù)K由兩組變量a和w所決定,函數(shù)k為半二次,從而使函數(shù)k為a的二次函 數(shù)。所述改進(jìn)的半二次函數(shù)k由一些非二次準(zhǔn)則J組成,并可以由如下算式表示:
[0055] J (a)為重構(gòu)函數(shù),由如下算式定義:
[0056] J (a) = Φ (a) +Q (a). (4)
[0057] 其中,Φ (a)和Q(a)分別定義如下:
[0061] 依據(jù)算式(4),(5)和(6),K(a,w)由如下算式表示::
[0063] 其中,Φ可以通過(guò)凸對(duì)偶關(guān)系,由Φ所定義。所述^半二次問(wèn)題通過(guò)a和w的交 替迭代不斷優(yōu)化以達(dá)到最小值。
[0066] 選擇使用的勢(shì)函數(shù)Φ以及其對(duì)應(yīng)的權(quán)重函數(shù)w可以通過(guò)Μ估計(jì)法或者其他能夠 滿(mǎn)足所述半二次勢(shì)函數(shù)情況的函數(shù)所確定。
[0067] 上述迭代算法是一種迭代重加權(quán)最小二乘法(IRLS)算法。因此,在半二次及重加 權(quán)最小二乘之間具有清晰的聯(lián)系。即使在某些情況下,對(duì)于任何初始值蹲,K(a,b)具有全 局收斂性,但是半二次函數(shù)在^框架中是否全局收斂仍然是不確定的。對(duì)于不同的初始值 獲得不同的W。選擇恰當(dāng)?shù)某跏贾祵?duì)于面部識(shí)別(FR)的效果非常重要。首先,列出兩個(gè) 最具潛力的初始值硭。然后,初始化的求解過(guò)程具體如下:
[0068] 1、該初始化可以是由測(cè)試樣本減去平均字典圖像。亦即硿¥ - )?,其中,
[0069] 2、義的另一個(gè)基于a°的可能解為a°的幼稚重構(gòu)。亦即,a°= T/y。
[0070] 第一種解的表示可能與測(cè)試樣本的面部偏離很多,由于平均面部并不需要與測(cè)試 樣本相似并且存在非常多錯(cuò)誤。因此,當(dāng)包含有錯(cuò)誤的平均面部進(jìn)行初始化時(shí),其會(huì)導(dǎo)致錯(cuò) 誤W。在測(cè)試樣本和字典中的面部存在一些小的模糊及噪聲影響時(shí),第二種解的表示可以形 成一個(gè)準(zhǔn)確的W。在此時(shí),在W中的所有元素均接近于0。但是,當(dāng)測(cè)試樣本中存在許多模 糊及噪聲影響時(shí),該幼稚重