本發(fā)明涉及視頻監(jiān)控技術(shù)領(lǐng)域,更具體地,涉及一種基于相關(guān)濾波的端對(duì)端快速行人再識(shí)別方法。
背景技術(shù):
中國(guó)在改革開放以來,國(guó)民經(jīng)濟(jì)迅速增長(zhǎng),城市化進(jìn)程全面加快。越來越多的人口涌入大城市,參與城市的各項(xiàng)建設(shè)。城市人口密度過高,公共安全事件備受關(guān)注。為了保障廣大人民群眾的生命財(cái)產(chǎn)安全,大量的監(jiān)控?cái)z像頭被安裝在地鐵、街道和商場(chǎng)等各種公共場(chǎng)所。然而面對(duì)復(fù)雜的監(jiān)控網(wǎng)絡(luò)和海量的監(jiān)控?cái)?shù)據(jù),依靠人力監(jiān)察難以實(shí)現(xiàn)快速的處理,所以利用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)輔助甚至取代視頻監(jiān)控中人力參與的需求應(yīng)運(yùn)而生。其中在目標(biāo)檢測(cè)、行人跟蹤、人臉檢測(cè)等領(lǐng)域的技術(shù)研究成果層出不窮,很多技術(shù)研究都已經(jīng)用于實(shí)際生活中。
經(jīng)過近十年來的發(fā)展,在視頻監(jiān)控的技術(shù)研究中行人檢測(cè)、目標(biāo)追蹤和行人再識(shí)別形成了三個(gè)獨(dú)立的模塊。而其中行人再識(shí)別的模塊更多的是研究如何正確匹配兩個(gè)圖像的同一人下密集的外觀變化,如照明,姿勢(shì)和視點(diǎn)。但在實(shí)際的視頻監(jiān)控環(huán)境中,目標(biāo)行人往往隱藏在不同的圖片背景和人群之中。目前的行人再識(shí)別的研究大部分是需要行人已被檢測(cè)或者被手動(dòng)標(biāo)注之后,再來與目標(biāo)行人進(jìn)行匹配。如何能夠結(jié)合行人檢測(cè)與行人再識(shí)別,能夠?qū)⒛繕?biāo)行人從萬千包含其他行人以及不同背景的行人之中快速的識(shí)別出來,具有更大的實(shí)際應(yīng)用價(jià)值。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明為解決以上現(xiàn)有技術(shù)提供的行人再識(shí)別方法依賴于行人檢測(cè)的精確性的缺陷,提供了一種基于相關(guān)濾波的端對(duì)端快速行人再識(shí)別方法,該方法能夠直接從監(jiān)控場(chǎng)景圖片中再識(shí)別到目標(biāo)行人。
為實(shí)現(xiàn)以上發(fā)明目的,采用的技術(shù)方案是:
基于相關(guān)濾波的端對(duì)端快速行人再識(shí)別方法,包括以下步驟:
s1.分別提取目標(biāo)行人圖片和包含有背景與其他行人的圖片的顏色特征和梯度方向直方圖特征;其中目標(biāo)行人圖片提取的顏色特征和梯度方向直方圖特征作為正樣本特征數(shù)據(jù),包含有背景與其他行人的圖片提取的顏色特征和梯度方向直方圖特征作為負(fù)樣本特征數(shù)據(jù);
s2.將正負(fù)樣本特征數(shù)據(jù)進(jìn)行傅立葉變換后,作為輸入的訓(xùn)練樣本訓(xùn)練線性學(xué)習(xí)器,得到目標(biāo)行人的線性相關(guān)濾波矩陣;
s3.對(duì)監(jiān)控場(chǎng)景圖片進(jìn)行不同尺度的縮放,然后分別對(duì)每個(gè)縮放尺度下的監(jiān)控場(chǎng)景圖片提取顏色特征和梯度方向直方圖特征;
s4.將從不同縮放尺度下的監(jiān)控場(chǎng)景圖片中提取的顏色特征和梯度方向直方圖特征與訓(xùn)練好的線性相關(guān)濾波矩陣進(jìn)行卷積操作,每個(gè)縮放尺度對(duì)應(yīng)的監(jiān)控場(chǎng)景圖片響應(yīng)度最高的地方即為目標(biāo)行人可能匹配的位置;
s5.利用非極大值抑制的方法從不同縮放尺度下的監(jiān)控場(chǎng)景圖片目標(biāo)行人可能的匹配位置中確定目標(biāo)行人最可能的匹配位置和行人大小作為最終的匹配結(jié)果。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
1、本發(fā)明提供的方法能夠克服現(xiàn)有的行人再識(shí)別方法需要手動(dòng)標(biāo)注大量候選行人然后進(jìn)行再識(shí)別的問題,直接從大量的包含行人的圖片中進(jìn)行目標(biāo)行人再識(shí)別,此過程中無需結(jié)合行人檢測(cè)即可實(shí)現(xiàn)端到端的行人再識(shí)別。
2、本發(fā)明利用提取的顏色特征和梯度方向直方圖特征進(jìn)行行人的再識(shí)別,這樣的特征不僅包含有許多的表觀特性,也保留了行人各部位的位置關(guān)系,能夠更好地作為訓(xùn)練的特征,提高行人再識(shí)別的準(zhǔn)確率。
附圖說明
圖1為方法的流程示意圖。
圖2為正負(fù)訓(xùn)練樣本特征提取和類標(biāo)設(shè)置的示意圖。
圖3為顏色特征和梯度方向直方圖特征提取的示意圖。
圖4為訓(xùn)練及學(xué)習(xí)線性相關(guān)濾波矩陣的示意圖。
圖5為匹配的示意圖。
具體實(shí)施方式
附圖僅用于示例性說明,不能理解為對(duì)本專利的限制;
以下結(jié)合附圖和實(shí)施例對(duì)本發(fā)明做進(jìn)一步的闡述。
實(shí)施例1
如圖1~5所示,本發(fā)明提供的方法具體包括以下步驟:
s1.分別提取目標(biāo)行人圖片和包含有背景與其他行人的圖片的顏色特征和梯度方向直方圖特征;其中目標(biāo)行人圖片提取的顏色特征和梯度方向直方圖特征作為正樣本特征數(shù)據(jù),包含有背景與其他行人的圖片提取的顏色特征和梯度方向直方圖特征作為負(fù)樣本特征數(shù)據(jù);
s2.將正負(fù)樣本特征數(shù)據(jù)進(jìn)行傅立葉變換后,作為輸入的訓(xùn)練樣本訓(xùn)練線性學(xué)習(xí)器,得到目標(biāo)行人的線性相關(guān)濾波矩陣;
s3.對(duì)監(jiān)控場(chǎng)景圖片進(jìn)行不同尺度的縮放,然后分別對(duì)每個(gè)縮放尺度下的監(jiān)控場(chǎng)景圖片提取顏色特征和梯度方向直方圖特征;
s4.將從不同縮放尺度下的監(jiān)控場(chǎng)景圖片中提取的顏色特征和梯度方向直方圖特征與訓(xùn)練好的線性相關(guān)濾波矩陣進(jìn)行卷積操作,每個(gè)縮放尺度對(duì)應(yīng)的監(jiān)控場(chǎng)景圖片響應(yīng)度最高的地方即為目標(biāo)行人可能匹配的位置;
s5.利用非極大值抑制的方法從不同縮放尺度下的監(jiān)控場(chǎng)景圖片目標(biāo)行人可能的匹配位置中確定目標(biāo)行人最可能的匹配位置和行人大小作為最終的匹配結(jié)果。
其中,所述步驟s1中所使用到的數(shù)據(jù)主要包括需要再識(shí)別的行人圖片和其他的行人或者各種背景的圖片。正樣本是目標(biāo)行人圖片,負(fù)樣本是其他的行人和背景圖片。本發(fā)明采用隨機(jī)采樣的方式,針對(duì)每一張負(fù)樣本的圖片,選取其中的行人和隨機(jī)采取三個(gè)背景框作為特征提取的輸入。對(duì)每張圖片都會(huì)提取出大于4個(gè)的子樣本,如圖2所示。再將每一張圖片的特征進(jìn)行循環(huán)移位的操作獲取循環(huán)矩陣,適用于線性回歸的學(xué)習(xí)之中。由于正樣本的平移操作得到的應(yīng)該是負(fù)樣本,所以對(duì)每一個(gè)循環(huán)矩陣塊的類標(biāo)是映射的高斯類標(biāo)。
其中,所述步驟s2中線性相關(guān)濾波矩陣的訓(xùn)練學(xué)習(xí)是通過支持向量機(jī)的拉格朗日對(duì)偶最優(yōu)化表達(dá)式進(jìn)行求解,然后通過格拉姆矩陣的循環(huán)特性,將求解問題分解到子問題空間,將內(nèi)積操作轉(zhuǎn)換為傅立葉頻域的點(diǎn)乘操作而實(shí)現(xiàn)快速的學(xué)習(xí)過程。
上述方案中,假設(shè)輸入樣本x,樣本的類標(biāo)為y,樣本的個(gè)數(shù)為n,i代表的是第i個(gè)樣本,正則式的參數(shù)為λ,支持向量機(jī)的對(duì)偶最優(yōu)化表達(dá)式表示如下:
其中α=(g+λi)-1y,共軛
其中第f塊對(duì)角矩陣塊定義為
其中
d(*,*)代表的是每一個(gè)子問題的對(duì)偶表達(dá)式。對(duì)已經(jīng)劃分好的n×n的子空間
其中
在具體的實(shí)施過程中,如圖3所示,所述在提取顏色特征和梯度方向直方圖特征時(shí),首先將圖片分割成n*n塊子塊,然后分別對(duì)分割的n*n塊子塊進(jìn)行顏色特征和梯度方向直方圖特征的提取,各個(gè)子塊的顏色特征和梯度方向直方圖特征以向量的形式組成圖片的顏色特征和梯度方向直方圖特征;其中n為正整數(shù)。
在具體的實(shí)施過程中,所述提取的顏色特征包括r、g、b、y、cr、br、h、s八個(gè)顏色通道的特征。
其中,所述步驟s3中對(duì)每一張圖片按比例進(jìn)行不同尺寸的縮放,縮放的方法是采用線性插值的方法;對(duì)不同大小的圖片提取相應(yīng)的顏色直方圖和方向梯度直方圖特征構(gòu)建而成的特征矩陣。
其中,所述步驟s4中對(duì)不同的圖片的特征空間與特定行人濾波器進(jìn)行卷積操作,找到響應(yīng)度最大的地方,并記錄相應(yīng)得分;通過不同的比例圖片可以得到不同響應(yīng)最大值,并按照目標(biāo)行人比例確定行人框的大小。
其中,所述步驟s5中對(duì)于不同的位置大小的框利用極大值抑制的方法,找到最后最有可能的行人框和相應(yīng)的得分,得分的高低代表著這個(gè)找到的行人與目標(biāo)行人的匹配程度,匹配程度越高,則代表是目標(biāo)行人的可能性越大,如圖5所示。
顯然,本發(fā)明的上述實(shí)施例僅僅是為清楚地說明本發(fā)明所作的舉例,而并非是對(duì)本發(fā)明的實(shí)施方式的限定。對(duì)于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動(dòng)。這里無需也無法對(duì)所有的實(shí)施方式予以窮舉。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明權(quán)利要求的保護(hù)范圍之內(nèi)。