一種面部識別方法及其系統(tǒng)的制作方法
【技術領域】
[0001] 本發(fā)明涉及計算機處理技術領域,尤其涉及一種面部識別方法及其系統(tǒng)。
【背景技術】
[0002] 面部識別系統(tǒng)在現(xiàn)今商業(yè)和娛樂產業(yè)中越發(fā)受到青睞。在視頻中進行面部識別是 一個以計算機視角,利用一系列包含有已知辨認特點的面部的給定圖像,在一個視頻序列 中定位及辨認面部的技術問題。例如,由于其在發(fā)展應用中的巨大潛力,視頻面部識別已經 在多個領域中推動使用,包括視頻保衛(wèi)監(jiān)控、現(xiàn)實增強、自動視頻標記、醫(yī)療分析、質量控制 以及視頻課程評估。雖然對于人腦而言,面部識別是一項非常簡單的任務,但由于目標的圖 像在方向、光照條件、形狀以及遮擋情況上存在有多種變化,因此,其對于機器而言是一項 挑戰(zhàn)。
[0003] 在使用現(xiàn)有的技術進行面部識別時仍存在許多的挑戰(zhàn)。近來,使用基于稀疏表達 的分類(SRC)及其相關拓展來進行面部識別(FR)已經被證明能夠提供現(xiàn)有最佳的識別效 果。其主要思想為:一個目標面部樣本可以由在不同情況下(例如姿態(tài)、光照情況、遮擋情 況等等)獲取的同一目標的可使用圖像的稀疏線性組合來表示。當面部圖像在低維空間 內,通過描述重要以及容易辨認的特征來表示時,上述思想也適用。為了進行稀疏表示,可 以應用^優(yōu)化算法。然后,選出服從最小重構錯誤的面部類別用于分類或者辨認那些具有 可使用的測試圖像或者樣本的目標。稀疏編碼也已經被提出可協(xié)同用于解決模糊人臉識別 以及盲圖像復原的問題。
[0004] 但是,應用li優(yōu)化算法來提升面部識別率僅能在某些特定的情況下取得成功。具 體而言,基于稀疏表示的面部識別假設訓練圖像已經被有效的控制并且每個類別中均具有 充足數(shù)量的樣本。
[0005] 從另外的角度來看,為了消除訓練數(shù)據中的孤立像素點,可以引入面部圖像的低 秩結構。在圖像屬于不同光照情況下的一些凸朗伯體模型的假設下,相類似面部圖像的低 秩結構被展現(xiàn)。為了從包含有錯誤的數(shù)據中恢復子空間結構,可以采用例如魯棒主成分分 析(RobustPCA)以及低秩表示(LRR)的方法。然而,上述方法均為直推式并且無法有效的 在新數(shù)據中清除噪聲、模糊等的影響。理想的面部識別效果不僅在于能夠從受到噪聲、模糊 等影響的訓練數(shù)據中恢復清晰的圖像,而且對于任何給定的測試樣本,均能夠在復雜的遮 擋情況及噪聲、模糊等影響的數(shù)據中恢復清晰的圖像。
[0006] 本發(fā)明公開的方法及其系統(tǒng)用于解決現(xiàn)有技術中的一個或者多個問題。
[0007] 發(fā)明概述
[0008] 本發(fā)明的一方面公開了一種面部識別方法。所述方法包括:將輸入視頻分割為若 干不同的視頻幀集合以及在輸入視頻的視頻幀中檢測面部。還包括,生成輸入視頻的面部 軌跡。進一步的,應用基于魯棒協(xié)同表示的分類算法,在具有復雜的遮擋及噪聲、模糊影響 的面部側視樣本中恢復清晰圖像并進行分類。另外,輸出具有已識別面部圖像的視頻。
[0009] 本發(fā)明另一方面公開了一種面部識別系統(tǒng)。所述系統(tǒng)包括:面部檢測模塊,用于在 輸入視頻的視頻幀中自動定位面部;算法模塊,用于通過改進的魯邦主成分分析算法估算 獲得清晰圖像從而初始化LRR-HQ-L1算法,并通過LRR-HQ-L1算法計算獲得權重矩陣;面郃 分類器,用于使用魯棒協(xié)同表示算法進行分類。字典,用于在數(shù)據庫中存儲面部圖像;以及 輸出模塊,輸出具有已識別面部圖像的視頻。
[0010] 本發(fā)明的其他方面,所屬技術領域技術人員能夠依據本發(fā)明的權利要求書,說明 書,以及附圖有效實施并充分公開。
[0011] 附圖簡要說明
[0012] 圖1為本發(fā)明【具體實施方式】的工作環(huán)境示意圖。
[0013] 圖2本發(fā)明【具體實施方式】的計算系統(tǒng)的結構框圖。
[0014] 圖3為本發(fā)明【具體實施方式】的面部識別系統(tǒng)的結構框圖。
[0015] 圖4為本發(fā)明【具體實施方式】的面部識別方法的方法流程圖。
[0016] 圖5為本發(fā)明【具體實施方式】的視頻流組成成分分割的示意圖。
[0017] 圖6為本發(fā)明【具體實施方式】的魯棒協(xié)同表示的示意圖。
[0018] 圖7為本發(fā)明另一【具體實施方式】的魯棒協(xié)同表示的示意圖。
[0019] 詳細說明
[0020] 附圖中展示的部分將被引用以具體說明,闡述本發(fā)明具體技術實施方案。說明書 中引用的數(shù)字代表附圖的相應部分。
[0021] 圖1為本發(fā)明【具體實施方式】中的工作環(huán)境100。如圖1所示,所述工作環(huán)境100包 括:電視機102,遙控器104,服務器106,用戶108,網絡系統(tǒng)110。還可以包括其他合適的 設備。
[0022] 電視機102可以是任何合適類型的電視機,例如等離子電視,LCD電視,背投式電 視,智能電視或者非智能電視。電視機102還可以包括一個計算系統(tǒng),例如個人電腦,掌上 電腦或者智能手機等。進一步的,所述電視機102還可以是任何內容演示的設備。所述設 備由遙控器104控制,能夠在一個到多個頻道中演示多個節(jié)目。
[0023] 所述遙控器104可以是任何合適類型的能夠遙控操作電視機102的遙控器,例如 配套的電視遙控器,通用電視遙控器,掌上電腦,智能手機或者其他能夠實現(xiàn)遙控功能的智 能設備。遙控器104還可以包括其他不同類型的設備,例如動作感應遙控設備,圖像感應遙 控設備以及其他一些簡單輸入設備,例如鍵盤,鼠標,聲控輸入設備等。
[0024] 具體的,所述服務器106可以是任何用于提供個人信息內容給用戶108的一個或 者多個計算機服務器。所述服務器106還用于輔助遙控器104和電視機102之間進行通信 連接,數(shù)據存儲和數(shù)據處理。電視機102,遙控器104以及服務器106通過網絡系統(tǒng)110,例 如有線網絡,手機網絡,或者其他具體的網絡建立通信連接。
[0025] 用戶108使用遙控器104控制電視機102播放不同的節(jié)目或者進行其他用戶感興 趣的活動。如果電視機102配備有動作感應或者圖像感應裝置,用戶還可以簡單的使用手 勢動作進行控制。用戶108可以是一個人也可以是多個,例如全部家庭成員在一起觀看電 視節(jié)目。
[0026] 電視機102,遙控器104和/或服務器106在一個合適的電子計算平臺實現(xiàn)其功 能。圖2是本發(fā)明【具體實施方式】中的一種可用于實現(xiàn)上述設備102、104和/或106的功能 的計算系統(tǒng)200的結構框圖。
[0027] 如圖2所示,所述計算系統(tǒng)包括一個處理器202,存儲器204,播放器206,通信模 塊208,數(shù)據庫210以及外圍設備212。所述計算系統(tǒng)可以減省上述設備,也可以添加一些 其他類型的設備,而不限于上述設備。
[0028] 所述處理器202可以是任何合適的處理器或處理器組。具體的,所述處理器202為 能夠進行多線程處理的多核心處理器。存儲器204可以是任何合適的存儲設備,例如R0M, RAM,閃存或者大容量存儲器,例如CD-ROM,硬盤等。存儲器204用于存儲為進行各種數(shù)據處 理而預設的計算機運行程序。
[0029] 所述外圍設備212具體包括:各種類型的傳感器以及輸入,輸出設備,例如鍵盤, 鼠標。通信模塊208具體包括:各類網絡交互設備,用于在設備間通過網絡系統(tǒng)建立連接。 數(shù)據庫210具體包括一到多個用于存儲不同數(shù)據以及對數(shù)據進行一些處理,例如搜索數(shù)據 的數(shù)據庫。
[0030] 在實際操作中,所示服務器106、電視機102和/或遙控器104可以為用戶108執(zhí) 行面部識別程序。
[0031] 圖3為本發(fā)明具體實施例的面部識別系統(tǒng)300的功能框圖。如圖3所示,所述面 部識別系統(tǒng)300包括輸入視頻302、面部檢測模塊304、運算模塊306、面部分類模塊308,、 詞典310以及輸出模塊312。上述系統(tǒng)可以減省所述設備,也可以添加一些其他類型的設 備,而不限于所述設備。所述系統(tǒng)300具體可以由硬件實現(xiàn)其功能,也可以由軟件實現(xiàn)其功 能,還可以結合