本發(fā)明涉及影像處理技術(shù)領(lǐng)域,具體涉及使用多種線索對多個人進行自動探測和追蹤的系統(tǒng)。
背景技術(shù):
相關(guān)技術(shù)中,某些視頻會議系統(tǒng)使用自動的基于音頻的探測技術(shù)和預置來移動攝像頭.然而,當前的視頻會議系統(tǒng)存在許多問題,一個這樣的問題是,基于音頻的發(fā)言者探測技術(shù)的準確度不高,另外,典型情況下,視頻會議系統(tǒng)不知道會場上有多少參加者、參加者位于何處。
技術(shù)實現(xiàn)要素:
為解決上述問題,本發(fā)明旨在提供使用多種線索對多個人進行自動探測和追蹤的系統(tǒng)。
本發(fā)明的目的采用以下技術(shù)方案來實現(xiàn):
使用多種線索對多個人進行自動探測和追蹤的系統(tǒng),包括初始化裝置、驗證裝置和多線索追蹤裝置;所述初始化裝置用于接收視頻的一楨并且在該楨中確定目標面孔的運動區(qū)域;所述驗證裝置用于驗證所述目標面孔是否在所述運動區(qū)域中,若驗證所述目標面孔在所述運動區(qū)域中,則向所述多線索追蹤裝置發(fā)送追蹤指令;所述多線索追蹤裝置用于根據(jù)追蹤指令使用多個線索來追蹤每個通過驗證后的面孔。
本發(fā)明的有益效果為:通過對視頻內(nèi)容進行目標面孔探測,相對于基于音頻的發(fā)言者探測技術(shù),準確度高,且能確定會場上有多少參加者、參加者位于何處,從而解決了上述的技術(shù)問題。
附圖說明
利用附圖對本發(fā)明作進一步說明,但附圖中的應用場景不構(gòu)成對本發(fā)明的任何限制,對于本領(lǐng)域的普通技術(shù)人員,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)以下附圖獲得其它的附圖。
圖1是本發(fā)明的結(jié)構(gòu)示意圖;
圖2是本發(fā)明多線索追蹤裝置的模塊連接示意圖。
附圖標記:
初始化裝置 1、驗證裝置 2、多線索追蹤裝置 3、拍攝調(diào)整裝置 4、目標模板設(shè)定模塊 31、候選運動區(qū)域提取模塊 32、已驗證面孔定位模塊 33、初始化子模塊 321、狀態(tài)轉(zhuǎn)移模型建立子模塊 322、觀測模型建立子模塊 324、候選運動區(qū)域計算子模塊 324、位置修正子模塊 325、重采樣子模塊 326。
具體實施方式
結(jié)合以下應用場景對本發(fā)明作進一步描述。
應用場景1
參見圖1、圖2,本應用場景的一個實施例的復雜場景下的使用多種線索對多個人進行自動探測和追蹤的系統(tǒng),包括初始化裝置1、驗證裝置2和多線索追蹤裝置3;所述初始化裝置1用于接收視頻的一楨并且在該楨中確定目標面孔的運動區(qū)域;所述驗證裝置2用于驗證所述目標面孔是否在所述運動區(qū)域中,若驗證所述目標面孔在所述運動區(qū)域中,則向所述多線索追蹤裝置3發(fā)送追蹤指令;所述多線索追蹤裝置3用于根據(jù)追蹤指令使用多個線索來追蹤每個通過驗證后的面孔。
優(yōu)選的,所述線索包括背景顏色、邊緣強度、運動。
本發(fā)明上述實施例通過對視頻內(nèi)容進行目標面孔探測,相對于基于音頻的發(fā)言者探測技術(shù),準確度高,且能確定會場上有多少參加者、參加者位于何處,從而解決了上述的技術(shù)問題。
優(yōu)選的,所述系統(tǒng)還包括拍攝調(diào)整裝置4,所述拍攝調(diào)整裝置4用于判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,如果是,則不調(diào)整攝像頭,如果否,根據(jù)所述已驗證面孔運動方向調(diào)整攝像頭。
本優(yōu)選實施例通過判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,調(diào)整攝像頭的位置,從而實現(xiàn)平滑的跟蹤效果。
優(yōu)選的,所述多線索追蹤裝置3包括目標模板設(shè)定模塊31、候選運動區(qū)域提取模塊32和已驗證面孔定位模塊33;所述目標模板設(shè)定模塊31用于將所述運動區(qū)域D1設(shè)定為目標模板;所述候選運動區(qū)域提取模塊32用于建立粒子狀態(tài)轉(zhuǎn)移和觀測模型并基于上述模型,采用粒子濾波預測已通過驗證的面孔的候選運動區(qū)域;所述已驗證面孔定位模塊33用于對所述候選運動區(qū)域和所述目標模板進行特征相似度量,識別已驗證面孔,并記錄已驗證面孔當前幀位置。
本優(yōu)選實施例構(gòu)建了多線索追蹤裝置3的模塊架構(gòu)。
優(yōu)選的,所述候選運動區(qū)域提取模塊32包括:
(1)初始化子模塊321:用于在所述運動區(qū)域D1內(nèi)隨機選取數(shù)量為n的粒子并對各粒子進行初始化處理,初始化處理后粒子的初始狀態(tài)為x0i,初始權(quán)值為{Qoi=1/n,i=1,...n};
(2)狀態(tài)轉(zhuǎn)移模型建立子模塊322:用于建立粒子狀態(tài)轉(zhuǎn)移模型,所述粒子狀態(tài)轉(zhuǎn)移模型采用下式:
式中,表示m時刻的新粒子,m≥2,為均值為0的高斯白噪聲,A為3階單位陣;m-1時刻的粒子通過狀態(tài)轉(zhuǎn)移模型傳播;
(3)觀測模型建立子模塊324,用于通過顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式建立粒子觀測模型;
(3)候選運動區(qū)域計算子模塊324:其利用最小方差估計來計算候選運動區(qū)域:
式中,xnow表示計算的當前幀圖像的候選運動區(qū)域,表示m時刻第j個粒子的對應狀態(tài)值;
(5)位置修正子模塊325:用于修正異常數(shù)據(jù):
式中,xpre表示計算的當前幀圖像的候選運動區(qū)域,表示m-1時刻第j個粒子的對應狀態(tài)值;
設(shè)置數(shù)據(jù)異常評價函數(shù)P=|xnow-xpre|,若P的值大于設(shè)定的經(jīng)驗值T,則xnow=xpre;
(6)重采樣子模塊326:用于通過重采樣操作刪除權(quán)值過小的粒子,重采樣時,利用系統(tǒng)當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系定義為:
其中,Nm表示采樣過程中m時刻的粒子數(shù)量,Nmax和Nmin分別表示最小和最大粒子數(shù),Nmin+1表示僅大于Nmin的粒子數(shù),Nmax-1表示僅小于Nmax的粒子數(shù),表示m時刻系統(tǒng)的新息殘差。
本優(yōu)選實施例采用基于顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式進行采樣粒子的權(quán)值更新,有效增強了跟蹤系統(tǒng)的魯棒性;設(shè)置位置修正子模塊325,能夠避免異常數(shù)據(jù)對整個系統(tǒng)帶來的影響;在重采樣子模塊326中,利用當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,并定義了采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系,較好地保證了粒子采樣的高效性和算法的實時性。
優(yōu)選地,所述粒子觀測模型的粒子權(quán)值更新公式為:
式中
其中,表示m時刻第j個粒子的最終更新權(quán)值,和分別表示m時刻和m-1時刻中第j個粒子基于顏色直方圖的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于運動邊緣的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于紋理特征直方圖的更新權(quán)值,Am為m時刻中第j個粒子基于顏色直方圖的觀測值與真實值之間的Bhattacharrya距離,Bm為m時刻中第j個粒子基于運動邊緣的觀測值與真實值之間的Bhattacharrya距離,Cm為m時刻中第j個粒子基于紋理特征直方圖的觀測值與真實值之間的Bhattacharrya距離,σ為高斯似然模型方差,λ1為基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,λ2為基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,λ3為基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子;
所述自適應調(diào)整因子的計算公式為:
其中,s=1時,表示m時刻中基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于顏色直方圖的特征值在j個粒子下的觀測概率值;s=2時,表示m時刻中基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于運動邊緣的特征值在j個粒子下的觀測概率值;s=3時,表示m時刻中基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于紋理特征直方圖的特征值在j個粒子下的觀測概率值;ξm-1表示在m-1時刻中所有粒子的空間位置方差值。
本優(yōu)選實施例提出粒子觀測模型的粒子權(quán)值更新公式和自適應調(diào)整因子的計算公式,對粒子的特征權(quán)值進行融合處理,有效克服了加性融合和乘性融合存在的缺陷,進一步增強了跟蹤系統(tǒng)的魯棒性。
在此應用場景中,選取粒子數(shù)n=50,跟蹤速度相對提高了8%,跟蹤精度相對提高了7%。
應用場景2
參見圖1、圖2,本應用場景的一個實施例的復雜場景下的使用多種線索對多個人進行自動探測和追蹤的系統(tǒng),包括初始化裝置1、驗證裝置2和多線索追蹤裝置3;所述初始化裝置1用于接收視頻的一楨并且在該楨中確定目標面孔的運動區(qū)域;所述驗證裝置2用于驗證所述目標面孔是否在所述運動區(qū)域中,若驗證所述目標面孔在所述運動區(qū)域中,則向所述多線索追蹤裝置3發(fā)送追蹤指令;所述多線索追蹤裝置3用于根據(jù)追蹤指令使用多個線索來追蹤每個通過驗證后的面孔。
優(yōu)選的,所述線索包括背景顏色、邊緣強度、運動。
本發(fā)明上述實施例通過對視頻內(nèi)容進行目標面孔探測,相對于基于音頻的發(fā)言者探測技術(shù),準確度高,且能確定會場上有多少參加者、參加者位于何處,從而解決了上述的技術(shù)問題。
優(yōu)選的,所述系統(tǒng)還包括拍攝調(diào)整裝置4,所述拍攝調(diào)整裝置4用于判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,如果是,則不調(diào)整攝像頭,如果否,根據(jù)所述已驗證面孔運動方向調(diào)整攝像頭。
本優(yōu)選實施例通過判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,調(diào)整攝像頭的位置,從而實現(xiàn)平滑的跟蹤效果。
優(yōu)選的,所述多線索追蹤裝置3包括目標模板設(shè)定模塊31、候選運動區(qū)域提取模塊32和已驗證面孔定位模塊33;所述目標模板設(shè)定模塊31用于將所述運動區(qū)域D1設(shè)定為目標模板;所述候選運動區(qū)域提取模塊32用于建立粒子狀態(tài)轉(zhuǎn)移和觀測模型并基于上述模型,采用粒子濾波預測已通過驗證的面孔的候選運動區(qū)域;所述已驗證面孔定位模塊33用于對所述候選運動區(qū)域和所述目標模板進行特征相似度量,識別已驗證面孔,并記錄已驗證面孔當前幀位置。
本優(yōu)選實施例構(gòu)建了多線索追蹤裝置3的模塊架構(gòu)。
優(yōu)選的,所述候選運動區(qū)域提取模塊32包括:
(1)初始化子模塊321:用于在所述運動區(qū)域D1內(nèi)隨機選取數(shù)量為n的粒子并對各粒子進行初始化處理,初始化處理后粒子的初始狀態(tài)為x0i,初始權(quán)值為{Qoi=1/n,i=1,...n};
(2)狀態(tài)轉(zhuǎn)移模型建立子模塊322:用于建立粒子狀態(tài)轉(zhuǎn)移模型,所述粒子狀態(tài)轉(zhuǎn)移模型采用下式:
式中,表示m時刻的新粒子,m≥2,為均值為0的高斯白噪聲,A為3階單位陣;m-1時刻的粒子通過狀態(tài)轉(zhuǎn)移模型傳播;
(3)觀測模型建立子模塊324,用于通過顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式建立粒子觀測模型;
(3)候選運動區(qū)域計算子模塊324:其利用最小方差估計來計算候選運動區(qū)域:
式中,xnow表示計算的當前幀圖像的候選運動區(qū)域,表示m時刻第j個粒子的對應狀態(tài)值;
(5)位置修正子模塊325:用于修正異常數(shù)據(jù):
式中,xpre表示計算的當前幀圖像的候選運動區(qū)域,表示m-1時刻第j個粒子的對應狀態(tài)值;
設(shè)置數(shù)據(jù)異常評價函數(shù)P=|xnow-xpre|,若P的值大于設(shè)定的經(jīng)驗值T,則xnow=xpre;
(6)重采樣子模塊326:用于通過重采樣操作刪除權(quán)值過小的粒子,重采樣時,利用系統(tǒng)當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系定義為:
其中,Nm表示采樣過程中m時刻的粒子數(shù)量,Nmax和Nmin分別表示最小和最大粒子數(shù),Nmin+1表示僅大于Nmin的粒子數(shù),Nmax-1表示僅小于Nmax的粒子數(shù),表示m時刻系統(tǒng)的新息殘差。
本優(yōu)選實施例采用基于顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式進行采樣粒子的權(quán)值更新,有效增強了跟蹤系統(tǒng)的魯棒性;設(shè)置位置修正子模塊325,能夠避免異常數(shù)據(jù)對整個系統(tǒng)帶來的影響;在重采樣子模塊326中,利用當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,并定義了采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系,較好地保證了粒子采樣的高效性和算法的實時性。
優(yōu)選地,所述粒子觀測模型的粒子權(quán)值更新公式為:
式中
其中,表示m時刻第j個粒子的最終更新權(quán)值,和分別表示m時刻和m-1時刻中第j個粒子基于顏色直方圖的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于運動邊緣的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于紋理特征直方圖的更新權(quán)值,Am為m時刻中第j個粒子基于顏色直方圖的觀測值與真實值之間的Bhattacharrya距離,Bm為m時刻中第j個粒子基于運動邊緣的觀測值與真實值之間的Bhattacharrya距離,Cm為m時刻中第j個粒子基于紋理特征直方圖的觀測值與真實值之間的Bhattacharrya距離,σ為高斯似然模型方差,λ1為基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,λ2為基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,λ3為基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子;
所述自適應調(diào)整因子的計算公式為:
其中,s=1時,表示m時刻中基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于顏色直方圖的特征值在j個粒子下的觀測概率值;s=2時,表示m時刻中基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于運動邊緣的特征值在j個粒子下的觀測概率值;s=3時,表示m時刻中基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于紋理特征直方圖的特征值在j個粒子下的觀測概率值;ξm-1表示在m-1時刻中所有粒子的空間位置方差值。
本優(yōu)選實施例提出粒子觀測模型的粒子權(quán)值更新公式和自適應調(diào)整因子的計算公式,對粒子的特征權(quán)值進行融合處理,有效克服了加性融合和乘性融合存在的缺陷,進一步增強了跟蹤系統(tǒng)的魯棒性。
在此應用場景中,選取粒子數(shù)n=55,跟蹤速度相對提高了7%,跟蹤精度相對提高了8%。
應用場景3
參見圖1、圖2,本應用場景的一個實施例的復雜場景下的使用多種線索對多個人進行自動探測和追蹤的系統(tǒng),包括初始化裝置1、驗證裝置2和多線索追蹤裝置3;所述初始化裝置1用于接收視頻的一楨并且在該楨中確定目標面孔的運動區(qū)域;所述驗證裝置2用于驗證所述目標面孔是否在所述運動區(qū)域中,若驗證所述目標面孔在所述運動區(qū)域中,則向所述多線索追蹤裝置3發(fā)送追蹤指令;所述多線索追蹤裝置3用于根據(jù)追蹤指令使用多個線索來追蹤每個通過驗證后的面孔。
優(yōu)選的,所述線索包括背景顏色、邊緣強度、運動。
本發(fā)明上述實施例通過對視頻內(nèi)容進行目標面孔探測,相對于基于音頻的發(fā)言者探測技術(shù),準確度高,且能確定會場上有多少參加者、參加者位于何處,從而解決了上述的技術(shù)問題。
優(yōu)選的,所述系統(tǒng)還包括拍攝調(diào)整裝置4,所述拍攝調(diào)整裝置4用于判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,如果是,則不調(diào)整攝像頭,如果否,根據(jù)所述已驗證面孔運動方向調(diào)整攝像頭。
本優(yōu)選實施例通過判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,調(diào)整攝像頭的位置,從而實現(xiàn)平滑的跟蹤效果。
優(yōu)選的,所述多線索追蹤裝置3包括目標模板設(shè)定模塊31、候選運動區(qū)域提取模塊32和已驗證面孔定位模塊33;所述目標模板設(shè)定模塊31用于將所述運動區(qū)域D1設(shè)定為目標模板;所述候選運動區(qū)域提取模塊32用于建立粒子狀態(tài)轉(zhuǎn)移和觀測模型并基于上述模型,采用粒子濾波預測已通過驗證的面孔的候選運動區(qū)域;所述已驗證面孔定位模塊33用于對所述候選運動區(qū)域和所述目標模板進行特征相似度量,識別已驗證面孔,并記錄已驗證面孔當前幀位置。
本優(yōu)選實施例構(gòu)建了多線索追蹤裝置3的模塊架構(gòu)。
優(yōu)選的,所述候選運動區(qū)域提取模塊32包括:
(1)初始化子模塊321:用于在所述運動區(qū)域D1內(nèi)隨機選取數(shù)量為n的粒子并對各粒子進行初始化處理,初始化處理后粒子的初始狀態(tài)為x0i,初始權(quán)值為{Qoi=1/n,i=1,...n};
(2)狀態(tài)轉(zhuǎn)移模型建立子模塊322:用于建立粒子狀態(tài)轉(zhuǎn)移模型,所述粒子狀態(tài)轉(zhuǎn)移模型采用下式:
式中,表示m時刻的新粒子,m≥2,為均值為0的高斯白噪聲,A為3階單位陣;m-1時刻的粒子通過狀態(tài)轉(zhuǎn)移模型傳播;
(3)觀測模型建立子模塊324,用于通過顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式建立粒子觀測模型;
(3)候選運動區(qū)域計算子模塊324:其利用最小方差估計來計算候選運動區(qū)域:
式中,xnow表示計算的當前幀圖像的候選運動區(qū)域,表示m時刻第j個粒子的對應狀態(tài)值;
(5)位置修正子模塊325:用于修正異常數(shù)據(jù):
式中,xpre表示計算的當前幀圖像的候選運動區(qū)域,表示m-1時刻第j個粒子的對應狀態(tài)值;
設(shè)置數(shù)據(jù)異常評價函數(shù)P=|xnow-xpre|,若P的值大于設(shè)定的經(jīng)驗值T,則xnow=xpre;
(6)重采樣子模塊326:用于通過重采樣操作刪除權(quán)值過小的粒子,重采樣時,利用系統(tǒng)當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系定義為:
其中,Nm表示采樣過程中m時刻的粒子數(shù)量,Nmax和Nmin分別表示最小和最大粒子數(shù),Nmin+1表示僅大于Nmin的粒子數(shù),Nmax-1表示僅小于Nmax的粒子數(shù),表示m時刻系統(tǒng)的新息殘差。
本優(yōu)選實施例采用基于顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式進行采樣粒子的權(quán)值更新,有效增強了跟蹤系統(tǒng)的魯棒性;設(shè)置位置修正子模塊325,能夠避免異常數(shù)據(jù)對整個系統(tǒng)帶來的影響;在重采樣子模塊326中,利用當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,并定義了采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系,較好地保證了粒子采樣的高效性和算法的實時性。
優(yōu)選地,所述粒子觀測模型的粒子權(quán)值更新公式為:
式中
其中,表示m時刻第j個粒子的最終更新權(quán)值,和分別表示m時刻和m-1時刻中第j個粒子基于顏色直方圖的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于運動邊緣的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于紋理特征直方圖的更新權(quán)值,Am為m時刻中第j個粒子基于顏色直方圖的觀測值與真實值之間的Bhattacharrya距離,Bm為m時刻中第j個粒子基于運動邊緣的觀測值與真實值之間的Bhattacharrya距離,Cm為m時刻中第j個粒子基于紋理特征直方圖的觀測值與真實值之間的Bhattacharrya距離,σ為高斯似然模型方差,λ1為基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,λ2為基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,λ3為基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子;
所述自適應調(diào)整因子的計算公式為:
其中,s=1時,表示m時刻中基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于顏色直方圖的特征值在j個粒子下的觀測概率值;s=2時,表示m時刻中基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于運動邊緣的特征值在j個粒子下的觀測概率值;s=3時,表示m時刻中基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于紋理特征直方圖的特征值在j個粒子下的觀測概率值;ξm-1表示在m-1時刻中所有粒子的空間位置方差值。
本優(yōu)選實施例提出粒子觀測模型的粒子權(quán)值更新公式和自適應調(diào)整因子的計算公式,對粒子的特征權(quán)值進行融合處理,有效克服了加性融合和乘性融合存在的缺陷,進一步增強了跟蹤系統(tǒng)的魯棒性。
在此應用場景中,選取粒子數(shù)n=60,跟蹤速度相對提高了6.5%,跟蹤精度相對提高了8.3%。
應用場景4
參見圖1、圖2,本應用場景的一個實施例的復雜場景下的使用多種線索對多個人進行自動探測和追蹤的系統(tǒng),包括初始化裝置1、驗證裝置2和多線索追蹤裝置3;所述初始化裝置1用于接收視頻的一楨并且在該楨中確定目標面孔的運動區(qū)域;所述驗證裝置2用于驗證所述目標面孔是否在所述運動區(qū)域中,若驗證所述目標面孔在所述運動區(qū)域中,則向所述多線索追蹤裝置3發(fā)送追蹤指令;所述多線索追蹤裝置3用于根據(jù)追蹤指令使用多個線索來追蹤每個通過驗證后的面孔。
優(yōu)選的,所述線索包括背景顏色、邊緣強度、運動。
本發(fā)明上述實施例通過對視頻內(nèi)容進行目標面孔探測,相對于基于音頻的發(fā)言者探測技術(shù),準確度高,且能確定會場上有多少參加者、參加者位于何處,從而解決了上述的技術(shù)問題。
優(yōu)選的,所述系統(tǒng)還包括拍攝調(diào)整裝置4,所述拍攝調(diào)整裝置4用于判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,如果是,則不調(diào)整攝像頭,如果否,根據(jù)所述已驗證面孔運動方向調(diào)整攝像頭。
本優(yōu)選實施例通過判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,調(diào)整攝像頭的位置,從而實現(xiàn)平滑的跟蹤效果。
優(yōu)選的,所述多線索追蹤裝置3包括目標模板設(shè)定模塊31、候選運動區(qū)域提取模塊32和已驗證面孔定位模塊33;所述目標模板設(shè)定模塊31用于將所述運動區(qū)域D1設(shè)定為目標模板;所述候選運動區(qū)域提取模塊32用于建立粒子狀態(tài)轉(zhuǎn)移和觀測模型并基于上述模型,采用粒子濾波預測已通過驗證的面孔的候選運動區(qū)域;所述已驗證面孔定位模塊33用于對所述候選運動區(qū)域和所述目標模板進行特征相似度量,識別已驗證面孔,并記錄已驗證面孔當前幀位置。
本優(yōu)選實施例構(gòu)建了多線索追蹤裝置3的模塊架構(gòu)。
優(yōu)選的,所述候選運動區(qū)域提取模塊32包括:
(1)初始化子模塊321:用于在所述運動區(qū)域D1內(nèi)隨機選取數(shù)量為n的粒子并對各粒子進行初始化處理,初始化處理后粒子的初始狀態(tài)為x0i,初始權(quán)值為{Qoi=1/n,i=1,...n};
(2)狀態(tài)轉(zhuǎn)移模型建立子模塊322:用于建立粒子狀態(tài)轉(zhuǎn)移模型,所述粒子狀態(tài)轉(zhuǎn)移模型采用下式:
式中,表示m時刻的新粒子,m≥2,為均值為0的高斯白噪聲,A為3階單位陣;m-1時刻的粒子通過狀態(tài)轉(zhuǎn)移模型傳播;
(3)觀測模型建立子模塊324,用于通過顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式建立粒子觀測模型;
(3)候選運動區(qū)域計算子模塊324:其利用最小方差估計來計算候選運動區(qū)域:
式中,xnow表示計算的當前幀圖像的候選運動區(qū)域,表示m時刻第j個粒子的對應狀態(tài)值;
(5)位置修正子模塊325:用于修正異常數(shù)據(jù):
式中,xpre表示計算的當前幀圖像的候選運動區(qū)域,表示m-1時刻第j個粒子的對應狀態(tài)值;
設(shè)置數(shù)據(jù)異常評價函數(shù)P=|xnow-xpre|,若P的值大于設(shè)定的經(jīng)驗值T,則xnow=xpre;
(6)重采樣子模塊326:用于通過重采樣操作刪除權(quán)值過小的粒子,重采樣時,利用系統(tǒng)當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系定義為:
其中,Nm表示采樣過程中m時刻的粒子數(shù)量,Nmax和Nmin分別表示最小和最大粒子數(shù),Nmin+1表示僅大于Nmin的粒子數(shù),Nmax-1表示僅小于Nmax的粒子數(shù),表示m時刻系統(tǒng)的新息殘差。
本優(yōu)選實施例采用基于顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式進行采樣粒子的權(quán)值更新,有效增強了跟蹤系統(tǒng)的魯棒性;設(shè)置位置修正子模塊325,能夠避免異常數(shù)據(jù)對整個系統(tǒng)帶來的影響;在重采樣子模塊326中,利用當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,并定義了采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系,較好地保證了粒子采樣的高效性和算法的實時性。
優(yōu)選地,所述粒子觀測模型的粒子權(quán)值更新公式為:
式中
其中,表示m時刻第j個粒子的最終更新權(quán)值,和分別表示m時刻和m-1時刻中第j個粒子基于顏色直方圖的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于運動邊緣的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于紋理特征直方圖的更新權(quán)值,Am為m時刻中第j個粒子基于顏色直方圖的觀測值與真實值之間的Bhattacharrya距離,Bm為m時刻中第j個粒子基于運動邊緣的觀測值與真實值之間的Bhattacharrya距離,Cm為m時刻中第j個粒子基于紋理特征直方圖的觀測值與真實值之間的Bhattacharrya距離,σ為高斯似然模型方差,λ1為基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,λ2為基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,λ3為基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子;
所述自適應調(diào)整因子的計算公式為:
其中,s=1時,表示m時刻中基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于顏色直方圖的特征值在j個粒子下的觀測概率值;s=2時,表示m時刻中基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于運動邊緣的特征值在j個粒子下的觀測概率值;s=3時,表示m時刻中基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于紋理特征直方圖的特征值在j個粒子下的觀測概率值;ξm-1表示在m-1時刻中所有粒子的空間位置方差值。
本優(yōu)選實施例提出粒子觀測模型的粒子權(quán)值更新公式和自適應調(diào)整因子的計算公式,對粒子的特征權(quán)值進行融合處理,有效克服了加性融合和乘性融合存在的缺陷,進一步增強了跟蹤系統(tǒng)的魯棒性。
在此應用場景中,選取粒子數(shù)n=65,跟蹤速度相對提高了6.5%,跟蹤精度相對提高了8.5%。
應用場景5
參見圖1、圖2,本應用場景的一個實施例的復雜場景下的使用多種線索對多個人進行自動探測和追蹤的系統(tǒng),包括初始化裝置1、驗證裝置2和多線索追蹤裝置3;所述初始化裝置1用于接收視頻的一楨并且在該楨中確定目標面孔的運動區(qū)域;所述驗證裝置2用于驗證所述目標面孔是否在所述運動區(qū)域中,若驗證所述目標面孔在所述運動區(qū)域中,則向所述多線索追蹤裝置3發(fā)送追蹤指令;所述多線索追蹤裝置3用于根據(jù)追蹤指令使用多個線索來追蹤每個通過驗證后的面孔。
優(yōu)選的,所述線索包括背景顏色、邊緣強度、運動。
本發(fā)明上述實施例通過對視頻內(nèi)容進行目標面孔探測,相對于基于音頻的發(fā)言者探測技術(shù),準確度高,且能確定會場上有多少參加者、參加者位于何處,從而解決了上述的技術(shù)問題。
優(yōu)選的,所述系統(tǒng)還包括拍攝調(diào)整裝置4,所述拍攝調(diào)整裝置4用于判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,如果是,則不調(diào)整攝像頭,如果否,根據(jù)所述已驗證面孔運動方向調(diào)整攝像頭。
本優(yōu)選實施例通過判斷所述通過驗證后的面孔的當前幀位置是否在當前畫面的中心區(qū)域,調(diào)整攝像頭的位置,從而實現(xiàn)平滑的跟蹤效果。
優(yōu)選的,所述多線索追蹤裝置3包括目標模板設(shè)定模塊31、候選運動區(qū)域提取模塊32和已驗證面孔定位模塊33;所述目標模板設(shè)定模塊31用于將所述運動區(qū)域D1設(shè)定為目標模板;所述候選運動區(qū)域提取模塊32用于建立粒子狀態(tài)轉(zhuǎn)移和觀測模型并基于上述模型,采用粒子濾波預測已通過驗證的面孔的候選運動區(qū)域;所述已驗證面孔定位模塊33用于對所述候選運動區(qū)域和所述目標模板進行特征相似度量,識別已驗證面孔,并記錄已驗證面孔當前幀位置。
本優(yōu)選實施例構(gòu)建了多線索追蹤裝置3的模塊架構(gòu)。
優(yōu)選的,所述候選運動區(qū)域提取模塊32包括:
(1)初始化子模塊321:用于在所述運動區(qū)域D1內(nèi)隨機選取數(shù)量為n的粒子并對各粒子進行初始化處理,初始化處理后粒子的初始狀態(tài)為x0i,初始權(quán)值為{Qoi=1/n,i=1,...n};
(2)狀態(tài)轉(zhuǎn)移模型建立子模塊322:用于建立粒子狀態(tài)轉(zhuǎn)移模型,所述粒子狀態(tài)轉(zhuǎn)移模型采用下式:
式中,表示m時刻的新粒子,m≥2,為均值為0的高斯白噪聲,A為3階單位陣;m-1時刻的粒子通過狀態(tài)轉(zhuǎn)移模型傳播;
(3)觀測模型建立子模塊324,用于通過顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式建立粒子觀測模型;
(3)候選運動區(qū)域計算子模塊324:其利用最小方差估計來計算候選運動區(qū)域:
式中,xnow表示計算的當前幀圖像的候選運動區(qū)域,表示m時刻第j個粒子的對應狀態(tài)值;
(5)位置修正子模塊325:用于修正異常數(shù)據(jù):
式中,xpre表示計算的當前幀圖像的候選運動區(qū)域,表示m-1時刻第j個粒子的對應狀態(tài)值;
設(shè)置數(shù)據(jù)異常評價函數(shù)P=|xnow-xpre|,若P的值大于設(shè)定的經(jīng)驗值T,則xnow=xpre;
(6)重采樣子模塊326:用于通過重采樣操作刪除權(quán)值過小的粒子,重采樣時,利用系統(tǒng)當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系定義為:
其中,Nm表示采樣過程中m時刻的粒子數(shù)量,Nmax和Nmin分別表示最小和最大粒子數(shù),Nmin+1表示僅大于Nmin的粒子數(shù),Nmax-1表示僅小于Nmax的粒子數(shù),表示m時刻系統(tǒng)的新息殘差。
本優(yōu)選實施例采用基于顏色直方圖、紋理特征直方圖和運動邊緣特征相結(jié)合的方式進行采樣粒子的權(quán)值更新,有效增強了跟蹤系統(tǒng)的魯棒性;設(shè)置位置修正子模塊325,能夠避免異常數(shù)據(jù)對整個系統(tǒng)帶來的影響;在重采樣子模塊326中,利用當前時刻預測和觀測的差值提供新息殘差,進而通過量測新息殘差對采樣的粒子進行在線自適應性調(diào)整,并定義了采樣過程中粒子數(shù)量和信息殘差之間的關(guān)系,較好地保證了粒子采樣的高效性和算法的實時性。
優(yōu)選地,所述粒子觀測模型的粒子權(quán)值更新公式為:
式中
其中,表示m時刻第j個粒子的最終更新權(quán)值,和分別表示m時刻和m-1時刻中第j個粒子基于顏色直方圖的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于運動邊緣的更新權(quán)值,表示m時刻和m-1時刻中第j個粒子基于紋理特征直方圖的更新權(quán)值,Am為m時刻中第j個粒子基于顏色直方圖的觀測值與真實值之間的Bhattacharrya距離,Bm為m時刻中第j個粒子基于運動邊緣的觀測值與真實值之間的Bhattacharrya距離,Cm為m時刻中第j個粒子基于紋理特征直方圖的觀測值與真實值之間的Bhattacharrya距離,σ為高斯似然模型方差,λ1為基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,λ2為基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,λ3為基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子;
所述自適應調(diào)整因子的計算公式為:
其中,s=1時,表示m時刻中基于顏色直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于顏色直方圖的特征值在j個粒子下的觀測概率值;s=2時,表示m時刻中基于運動邊緣的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于運動邊緣的特征值在j個粒子下的觀測概率值;s=3時,表示m時刻中基于紋理特征直方圖的特征權(quán)值歸一化的自適應調(diào)整因子,為m-1時刻中基于紋理特征直方圖的特征值在j個粒子下的觀測概率值;ξm-1表示在m-1時刻中所有粒子的空間位置方差值。
本優(yōu)選實施例提出粒子觀測模型的粒子權(quán)值更新公式和自適應調(diào)整因子的計算公式,對粒子的特征權(quán)值進行融合處理,有效克服了加性融合和乘性融合存在的缺陷,進一步增強了跟蹤系統(tǒng)的魯棒性。
在此應用場景中,選取粒子數(shù)n=70,跟蹤速度相對提高了6%,跟蹤精度相對提高了9%
最后應當說明的是,以上應用場景僅用以說明本發(fā)明的技術(shù)方案,而非對本發(fā)明保護范圍的限制,盡管參照較佳應用場景對本發(fā)明作了詳細地說明,本領(lǐng)域的普通技術(shù)人員應當理解,可以對本發(fā)明的技術(shù)方案進行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的實質(zhì)和范圍。