本發(fā)明涉及一種背景建模方法,具體涉及一種基于低秩矩陣恢復(fù)的背景建模方法。
背景技術(shù):
前景目標(biāo)的檢測(cè)是計(jì)算機(jī)視覺(jué)和數(shù)字圖像處理領(lǐng)域的一個(gè)重要研究?jī)?nèi)容。它是整個(gè)視頻處理系統(tǒng)的基本,許多后續(xù)的應(yīng)用處理都需要在它的基礎(chǔ)上才能進(jìn)行,例如目標(biāo)跟蹤、目標(biāo)分類(lèi)和目標(biāo)識(shí)別等。對(duì)于前景目標(biāo)的檢測(cè)來(lái)說(shuō),其原理就是從視頻流中將背景與前景目標(biāo)進(jìn)行分割,然后用于分割的這種方法,一般稱(chēng)為背景建模。
視頻背景建模的方法可以分為兩種模型,一種是基于參數(shù)的背景建模,該類(lèi)方法為每個(gè)像素點(diǎn)建立一個(gè)參數(shù)模型用以表示背景,比如說(shuō)經(jīng)典的混合高斯模型,可用于復(fù)雜運(yùn)動(dòng)的背景建模,但是該模型計(jì)算量相對(duì)比較大;另一類(lèi)是基于像素樣本的背景建模,這類(lèi)方法的背景模型可以及時(shí)初始化,具有較好的魯棒性,而且需要計(jì)算的數(shù)據(jù)量比較小,此外,還有基于顏色信息的背景建模方法和基于自組織神經(jīng)網(wǎng)絡(luò)的背景建模方法[5]等方法,其中,基于顏色信息的背景建模方法,簡(jiǎn)稱(chēng)color算法,該算法將像素點(diǎn)的差異分解成chromaticity差異和brightness差異,對(duì)光照具有很強(qiáng)的魯棒性,并有比較好的效果,計(jì)算速度也比較快;基于自組織神經(jīng)網(wǎng)絡(luò)背景建模算法即sobs算法,該算法對(duì)光照有一定的魯棒性,但map的模型比輸入圖片大,計(jì)算量比較大;虛擬背景提取(visualbackgroundextractor,vibe)算法是基于像素樣本背景模型的算法,該算法速度非???,計(jì)算量比較小,而且對(duì)噪聲有一定的魯棒性,檢測(cè)效果良好。但是這種算法的初始化容易出現(xiàn)鬼影,它會(huì)影響背景的建模和更新速度,也會(huì)對(duì)后續(xù)的運(yùn)動(dòng)物體跟蹤、分類(lèi)和識(shí)別等操作造成不利的影響。
低秩矩陣恢復(fù)方法在圖像處理、計(jì)算機(jī)視覺(jué)、模式識(shí)別、機(jī)器學(xué)習(xí)等領(lǐng)域有著極其廣泛的作用。在低秩矩陣恢復(fù)方法中,需要求解一個(gè)最小秩的優(yōu)化問(wèn)題。但是由于矩陣的秩是一個(gè)非凸、不連續(xù)的函數(shù),是一個(gè)np難題。因此一般求解它的凸松弛問(wèn)題,就是把最小秩松弛為最小核范數(shù),稀疏矩陣的l0范數(shù)松弛為l1范數(shù)。對(duì)于該問(wèn)題,當(dāng)數(shù)據(jù)只受到小的噪聲所干擾時(shí),一般通過(guò)奇異值分解(svd)的方法可以獲得穩(wěn)定的結(jié)果。由于在現(xiàn)代的實(shí)際應(yīng)用中會(huì)有大量異常點(diǎn)的出現(xiàn),因此提出了一種pca的變體方法rpca來(lái)尋找出來(lái)檢測(cè)這些異常點(diǎn)。wright和candes等人已經(jīng)證明,當(dāng)觀察的樣本數(shù)量n比較大的時(shí)候(即所給數(shù)據(jù)矩陣y的樣本數(shù)n很大時(shí)),最小秩的優(yōu)化問(wèn)題模型會(huì)接近平穩(wěn)。事實(shí)上,由于實(shí)際原因,在許多圖像處理和計(jì)算機(jī)視覺(jué)問(wèn)題中,觀察的樣本數(shù)量n會(huì)受到限制。此外,當(dāng)數(shù)值n受到限制時(shí),注意到現(xiàn)有的對(duì)于求解最小秩的優(yōu)化問(wèn)題的近似解決方法在應(yīng)對(duì)檢測(cè)異常點(diǎn)時(shí)效果不好。
技術(shù)實(shí)現(xiàn)要素:
鑒于此,本發(fā)明的目的是提供一種基于低秩矩陣恢復(fù)的背景建模方法,本發(fā)明將背景建模的方法轉(zhuǎn)換成了低秩矩陣恢復(fù)的最小秩求解問(wèn)題。然后使用基于原子范數(shù)的最小描述長(zhǎng)度準(zhǔn)則來(lái)解決矩陣秩的最優(yōu)化求解問(wèn)題,能夠較好地解決鬼影問(wèn)題,提取背景。
本發(fā)明的目的是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的,一種基于低秩矩陣恢復(fù)的背景建模方法,背景建模方法轉(zhuǎn)換成求解一個(gè)低秩矩陣恢復(fù)的問(wèn)題,首先將連續(xù)的幀圖像集合以像素值方式顯示,變成一個(gè)數(shù)據(jù)矩陣y,然后使用基于原子范數(shù)的最小描述長(zhǎng)度準(zhǔn)則來(lái)作為評(píng)價(jià)準(zhǔn)則選取最小秩的最優(yōu)化問(wèn)題,最后確定前景運(yùn)動(dòng)目標(biāo),提取背景,完成背景建模的目標(biāo)。
進(jìn)一步,采用基于原子范數(shù)最小描述長(zhǎng)度準(zhǔn)則的低秩矩陣分解恢復(fù)秩矩陣,其定義公式為:
其中,x表示低秩矩陣,e表示稀疏矩陣,rank(x)表示低秩矩陣的秩,rank(y)表示觀測(cè)矩陣的秩,||e||0k表示稀疏矩陣e中的非零項(xiàng)的真正數(shù)量,基于原子范數(shù)的低秩矩陣分解的目標(biāo)函數(shù)表示為:
r=y(tǒng)-x-e表示殘差矩陣,m表示需要選擇的模型,
進(jìn)一步,低秩矩陣恢復(fù)的具體方法為:
步驟一、輸入:觀測(cè)矩陣y,原子集合
步驟二、初始化:低秩矩陣x0=zeros(m,n),原子矩陣
步驟三、執(zhí)行以下循環(huán):
從原子集合
最小化描述長(zhǎng)度函數(shù)
更新低秩矩陣:
將尺度系數(shù)向量
計(jì)算低秩矩陣x和噪聲矩陣y-xt+1的描述長(zhǎng)度并更新
進(jìn)行下一次循環(huán),t←t+1;
循環(huán)結(jié)束
步驟四、輸出:低秩均值xt,噪聲矩陣et。
由于采用了上述技術(shù)方案,本發(fā)明具有如下的優(yōu)點(diǎn):
本發(fā)明所采用的方法與現(xiàn)有的技術(shù)相比,能夠在相同條件下取得更為良好的背景建模結(jié)果,解決了現(xiàn)有技術(shù)在解決鬼影方面的不足之處,優(yōu)于現(xiàn)有的技術(shù)。
附圖說(shuō)明
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述,其中:
圖1為本發(fā)明的原理框圖;
圖2為室內(nèi)場(chǎng)景背景建模實(shí)驗(yàn)圖,(a)為原始視頻數(shù)據(jù)y1的三幀圖像,(b)為采用rpca方法分解出來(lái)的低秩矩陣x,(c)為采用rpca方法分解出來(lái)的稀疏矩陣e,(d)為采用本發(fā)明方法分解出來(lái)的低秩矩陣x,(e)為采用本發(fā)明方法分解出來(lái)的稀疏矩陣e;
圖3為商業(yè)廣場(chǎng)背景建模實(shí)驗(yàn)低秩矩陣x部分,(a)為原始視頻數(shù)據(jù)y2的三幀圖像,(b)為采用rpca分解出來(lái)的低秩矩陣x,(c)為采用mdl-lr分解出來(lái)的低秩矩陣x,(d)為采用分解出來(lái)ppsv的低秩矩陣x,(e)為本發(fā)明提出方法分解出來(lái)的低秩矩陣x;
圖4為商業(yè)廣場(chǎng)背景建模實(shí)驗(yàn)稀疏矩陣e部分,(a)為采用rpca分解出來(lái)的稀疏矩陣e,(b)為采用mdl-lr分解出來(lái)的稀疏矩陣e,(c)為采用ppsv分解出來(lái)的稀疏矩陣e,(d)為本發(fā)明提出方法分解出來(lái)的稀疏矩陣e。
具體實(shí)施方式
以下將結(jié)合附圖,對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)的描述;應(yīng)當(dāng)理解,優(yōu)選實(shí)施例僅為了說(shuō)明本發(fā)明,而不是為了限制本發(fā)明的保護(hù)范圍。
該系統(tǒng)主要建立在低秩矩陣恢復(fù)的基礎(chǔ)上。首先將連續(xù)的幀圖像集合以像素值方式顯示,變成一個(gè)數(shù)據(jù)矩陣y。對(duì)于背景建模問(wèn)題,將其轉(zhuǎn)換成了求解一個(gè)低秩矩陣恢復(fù)的問(wèn)題。換句話來(lái)說(shuō),就是求解低秩矩陣的秩。然后使用基于原子范數(shù)的最小描述長(zhǎng)度準(zhǔn)則來(lái)作為評(píng)價(jià)準(zhǔn)則選取最小秩的最優(yōu)化問(wèn)題,最后確定前景運(yùn)動(dòng)目標(biāo),提取背景,完成背景建模的目標(biāo),其系統(tǒng)框架流程圖如圖1所示。
在低秩矩陣恢復(fù)中,需要求解一個(gè)最小秩的優(yōu)化問(wèn)題。
其中參數(shù)γ>0是正則化參數(shù),rank(x)表示矩陣
其中||x||*=∑iσi(x)表示x的核范數(shù),σi(x)表示矩陣x的第i個(gè)奇異值,||e||1表示稀疏矩陣e的l1范數(shù)?,F(xiàn)在已經(jīng)有很多方法可以用來(lái)有效地解決公式(2)的優(yōu)化問(wèn)題。
最小描述長(zhǎng)度準(zhǔn)則就是一個(gè)用來(lái)分別平衡模型復(fù)雜度和擬合度的目標(biāo)函數(shù),具體做法是從所有可能的候選模型μ集合中尋找一個(gè)最優(yōu)模型m。在mdl框架中,一個(gè)用最少字節(jié)來(lái)完全描述所給數(shù)據(jù)y的模型m被認(rèn)為是最好的。因此mdl問(wèn)題可以被表示成
函數(shù)
這樣可以獲得mdl優(yōu)化框架
-logp(m)代表模型的復(fù)雜度,-logp(y|m)代表了擬合度?,F(xiàn)代的mdl框架使用通用編碼作為核心函數(shù)來(lái)計(jì)算概率模型的編碼長(zhǎng)度,這種概率模型不是完全確定的,而且只屬于其中一類(lèi)候選模型。以下是一些編碼方法:一部分編碼,即將所給的數(shù)據(jù)y和最好的模型
本發(fā)明模型解決了低秩矩陣恢復(fù)的問(wèn)題,并且其定義公式為
k代表了稀疏矩陣e中的非零項(xiàng)的真正數(shù)量。根據(jù)上面所定義的,在mdl框架下的目標(biāo)函數(shù)可以寫(xiě)成
r=y(tǒng)-x-e表示殘差矩陣,在mdl框架中,有
在本發(fā)明所提出的mdlan方法中,其主要邏輯是由于在模型中新增低秩原子后編碼長(zhǎng)度會(huì)逐步增加,所以增加的原子只有最大程度減少其他部分的編碼長(zhǎng)度時(shí),如
就跟其他模型選擇算法一樣,在代價(jià)函數(shù)中考慮原子的個(gè)數(shù)會(huì)導(dǎo)致目標(biāo)函數(shù)是非凸的。對(duì)于這種情況,提出了一個(gè)優(yōu)化算法來(lái)準(zhǔn)確恢復(fù)低秩矩陣。算法的具體步驟請(qǐng)看表一。在算法mdlan的步驟3中,從集合
步驟一、輸入:觀測(cè)矩陣y,原子集合
步驟二、初始化:低秩矩陣x0=zeros(m,n),原子矩陣
步驟三、執(zhí)行以下循環(huán)
從原子集合
最小化描述長(zhǎng)度函數(shù)
更新低秩矩陣:
將尺度系數(shù)向量
計(jì)算低秩矩陣x和噪聲矩陣y-xt+1的描述長(zhǎng)度并更新
進(jìn)行下一次循環(huán),t←t+1;
循環(huán)結(jié)束
步驟四、輸出:低秩均值xt,噪聲矩陣et。
魯棒性主成分分析法(rpca),最小長(zhǎng)度描述準(zhǔn)則法(mdl-lr),奇異值部分和最小法(pssv)等理論是近年來(lái)在研究低秩矩陣恢復(fù)問(wèn)題上最先進(jìn)的方法,能夠有效的解決最小秩的優(yōu)化問(wèn)題,從而建立背景模型。因此本實(shí)驗(yàn)選取以上三種方法作為實(shí)驗(yàn)比較對(duì)象。
本實(shí)施例選取了在室內(nèi)拍攝具有80灰度幀的視頻序列作為樣本y1和在繁華商業(yè)中心拍攝的具有1186灰度幀的視頻序列作為樣本y2。由于許多人在場(chǎng)景中移動(dòng),圖片序列中地表的陰影部分變化非常明顯。為了驗(yàn)證本發(fā)明方法在觀察樣本數(shù)量受到限制時(shí)的有效性,對(duì)于樣本y2,實(shí)驗(yàn)只使用部分的連續(xù)幀(n=100)。每一幀的分辨率為256*320,然后把每一幀拉成一維向量形成觀察矩陣
對(duì)于樣本y1,從y1的80幀視頻序列中選取了3幀用于實(shí)驗(yàn)。實(shí)驗(yàn)方法采用了魯棒性主成分分析法(rpca)與本發(fā)明所提出的方法進(jìn)行了對(duì)比,實(shí)驗(yàn)結(jié)果如圖2。圖(a)是原始視頻數(shù)據(jù)y1的三幀圖像,圖(b,d)是分解出來(lái)的低秩矩陣x,圖(c,e)是分解出來(lái)的稀疏矩陣e。圖(b,c)是采用了rpca方法的結(jié)果,圖(d,e)是采用了本發(fā)明方法的結(jié)果。
實(shí)驗(yàn)結(jié)果表明,在通過(guò)rpca評(píng)估出的矩陣秩為7的情況下,在背景中仍舊產(chǎn)生了細(xì)小的鬼影(圖中用藍(lán)色橢圓框出部分),并且rpca只檢測(cè)到了176895個(gè)異常點(diǎn)(即稀疏矩陣e的非零項(xiàng)數(shù),用于對(duì)比方法所檢測(cè)異常點(diǎn)的能力)。與之相對(duì)比,本發(fā)明提出的方法評(píng)估出的矩陣秩為1,并且能夠檢測(cè)出252417個(gè)異常點(diǎn)。
對(duì)于樣本y2,從y2的100幀視頻序列中選取了3幀用于實(shí)驗(yàn)。實(shí)驗(yàn)方法采用了魯棒性主成分分析法(rpca),最小長(zhǎng)度描述準(zhǔn)則法(mdl-lr),奇異值部分和最小法(ppsv)與本發(fā)明的實(shí)驗(yàn)進(jìn)行了對(duì)比,實(shí)驗(yàn)結(jié)果如圖3、4。圖3中(a)圖是原始視頻數(shù)據(jù)y2的三幀圖像,(b)圖是rpca的低秩矩陣x,(c)圖是mdl-lr的低秩矩陣x,(d)圖是pssv的低秩矩陣x,(e)圖是本發(fā)明提出方法的低秩矩陣x,圖4中(a)圖是rpca的稀疏矩陣e,(b)圖是mdl-lr的稀疏矩陣e,(c)圖是pssv的稀疏矩陣e,(d)圖是本發(fā)明提出方法的稀疏矩陣e。
實(shí)驗(yàn)結(jié)果表明,這4種方法都能夠有效的進(jìn)行背景建模,將背景與前景的運(yùn)動(dòng)目標(biāo)進(jìn)行分離。但是所對(duì)比的三種方法都在低秩矩陣x中留下了或多或少的殘影(圖中用藍(lán)色橢圓框出部分),而本發(fā)明所提出的方法能夠有效去除該殘影。
以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并不用于限制本發(fā)明,顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。