供至步驟405的圖像,以更詳細(xì)地分析關(guān)注對象100的行 為。在VIDD配置的另一應(yīng)用中,提供至步驟405的信息是以諸如目擊者描述等的、針對關(guān) 注對象的語義描述的形式的。例如,向步驟405提供針對諸如走失兒童等的對象的語義描 述以定位并尋找回該對象。
[0091] 控制然后從步驟405進(jìn)入通過VIDD軟件1033所指示的處理器1005所進(jìn)行的步驟 410,其中,步驟410確定關(guān)注對象的多個屬性中的每一個的特有性,如以下參考圖12更加 詳細(xì)地所述。如上所述,可以通過處理器1005進(jìn)行方法步驟410,并且/或者可選地,可以 作為用于確定關(guān)注對象的屬性的特有性的軟件、硬件或者混合硬件/軟件模塊來實現(xiàn)。相 同論述適用于本說明書中所述的其它方法步驟。
[0092] 圖12描述用于示出在一個VIDD配置中,如何通過包含特定屬性標(biāo)簽(還稱為類 標(biāo)簽)針對關(guān)注對象的概率和該屬性標(biāo)簽針對一些其它對象的概率的元組來表示該屬性 標(biāo)簽的特有性的例子1200。因此,通過構(gòu)建包含關(guān)注對象的屬性標(biāo)簽的概率和該屬性標(biāo)簽 在種群中的頻率的元組,來表示屬性的特有性。在例子1200中,人1201是關(guān)注對象,并且 關(guān)注對象的一個屬性標(biāo)簽是"戴眼鏡" 1202。例子1200中屬性標(biāo)簽1202的概率1203是 95%,這表示關(guān)注對象1201戴著眼鏡的可能性是95%。在例子1200中,人的集合1204是 候選關(guān)注對象的種群,并且例子1200中的相應(yīng)屬性標(biāo)簽1205的概率1206是60%,這表示 種群1204中候選關(guān)注對象戴著眼鏡的可能性是60%。在例子1200中,用于表示給定屬性 標(biāo)簽"戴眼鏡"的特有性的元組為(1203, 1206)。
[0093] 概率1203、1206(參考圖4中的411)分別對應(yīng)于公式(1)中的項p(ai|x = 1)和 p (a; | X = 0),它們是不依賴于特定攝像機的視角的、針對關(guān)注對象對于屬性a;的特有性的 度量。
[0094] 在一個VIDD配置中,根據(jù)語義(書面或者口頭)描述,確定關(guān)注對象的屬性標(biāo)簽 ai的概率p (a i | X = 1)。在一個例子中,通過三個屬性,g卩,"眼鏡"、"衣袖長度"和"面部毛 發(fā)風(fēng)格"來指定關(guān)注對象,并且目擊者將關(guān)注對象描述為"穿著T恤衫、并且戴著眼鏡"。基 于目擊者的信任度(或者可信度),將屬性"衣袖長度"的"短袖"的概率分配為0. 9,并且 將屬性"眼鏡"的"戴眼鏡"的概率分配為〇. 95。此外,由于目擊者沒有提及是否留著胡子, 因而將屬性"面部毛發(fā)風(fēng)格"的"胡子被刮光"的概率分配為〇. 7。由于目擊者還有可能沒 有表述留著胡子,因而該屬性標(biāo)簽與"短袖"或者"戴眼鏡"相比,被分配以較低置信度。在 可選的VIDD配置中,通過保安員或者其它操作者人工檢查關(guān)注對象的一個以上的圖像,來 確定關(guān)注對象的屬性標(biāo)簽的概率。在又一 VIDD配置中,通過關(guān)注對象的一個以上的圖像的 自動標(biāo)注,來確定關(guān)注對象的屬性標(biāo)簽的概率。通過首先使用圖7A中的方法430的例子檢 測屬性、然后對于用于類標(biāo)簽的概率分布P(a 1= 1= 1)的公式(2)中的屬性推斷約束 進(jìn)行求解,實現(xiàn)自動標(biāo)注。
[0095] 為了在處理400的步驟410確定屬性標(biāo)簽的特有性,還必須確定一些其它對象 (也就是說,除關(guān)注對象以外的對象)的屬性標(biāo)簽的概率P (ai | X = 0)。在一個VIDD配置中, 與從共享屬性的所有其它對象的種群所隨機選擇的對象相對應(yīng),根據(jù)諸如通過調(diào)查和市場 調(diào)研所推論出的知識等的專業(yè)知識,確定屬性標(biāo)簽的概率。在另一 VIDD配置中,與從通過 用于拍攝所討論的場景的圖像120的任一攝像機先前所觀察到的對象的種群所隨機選擇 的對象相對應(yīng),根據(jù)先前觀察對象中的屬性的頻率,確定屬性標(biāo)簽的概率。在又一 VIDD配 置中,針對每日的不同時間和每年的不同季節(jié),保持獨立屬性統(tǒng)計,以應(yīng)對對象的屬性的周 期性變化(例如,與夜間相比,行人通常更多在白天期間戴太陽鏡)。然后在通過選擇與拍 攝候選對象的圖像時的時間相對應(yīng)的屬性統(tǒng)計,在方法400的步驟420檢測到候選對象時, 確定屬性標(biāo)簽的特有性。
[0096] 方法400然后從步驟410進(jìn)入通過VIDD軟件1033所指示的處理器1005所進(jìn)行的 步驟420,其中,通過PTZ攝像機140拍攝一個以上的幀,并且檢測和追蹤候選對象130。如 上所述,步驟420使用使用與在拍攝候選對象的圖像時的時間相對應(yīng)的屬性統(tǒng)計所確定的 屬性標(biāo)簽的特有性。在一個VIDD配置中,通過使用諸如高斯混合(MoG)等的統(tǒng)計背景像素 建模方法進(jìn)行前景分離,在步驟420檢測候選對象,其中,在具有固定攝像機設(shè)置的多個幀 上,保持背景模型。在另一 VIDD配置中,對于離散余弦變換塊進(jìn)行前景分離方法。在另一 VIDD配置中,例如使用超像素對幀的非監(jiān)督片段進(jìn)行前景分離。在又一 VIDD配置中,使用 諸如行人檢測器等監(jiān)督機學(xué)習(xí)方法來檢測候選對象。行人檢測器基于行人樣例的訓(xùn)練集, 將一組關(guān)注區(qū)域分類為是否包含行人。在一個VIDD配置中,步驟420的輸出是表示圖像平 面120上包含候選對象130的關(guān)注區(qū)域的矩形邊界框135 (參考圖1)。在另一 VIDD配置 中,步驟420的輸出是表示屬于候選對象的像素的區(qū)域和屬于背景的像素的區(qū)域的二值圖 像映射圖。
[0097] 在一些場景中,在步驟420檢測到一個以上的候選對象。在步驟420的一個實施方 案中,在對象檢測之后,進(jìn)行對所檢測到的候選對象的目標(biāo)追蹤,以將多個幀上的相同候選 對象的觀察相關(guān)聯(lián)。在一個VIDD配置中,通過假定布朗運動、并且將一個幀中的候選對象 與先前幀中最近的像素位置處的候選對象相關(guān)聯(lián)來進(jìn)行追蹤。在另一 VIDD配置中,通過使 用諸如卡爾曼濾波器或者粒子濾波器等的遞歸貝葉斯濾波器估計對象的運動來進(jìn)行追蹤。 在又一 VIDD配置中,除位置和速度信息以外,還使用與對象有關(guān)的外觀信息來進(jìn)行追蹤。
[0098] 方法400然后從步驟420進(jìn)入下面參考圖5更加詳細(xì)說明的、通過VIDD軟件1033 所指示的處理器1005所進(jìn)行的步驟425,步驟425確定候選對象130相對于攝像機140的 視角的相對定向。在一個VIDD配置中,使用機器學(xué)習(xí)方法來確定相對定向以將候選對象的 圖像分類成一組離散定向類(例如,"正視圖"、"側(cè)視圖"和"后視圖")。通過來自每一類的 一組樣例來訓(xùn)練分類器。在另一 VIDD配置中,使用基于模型的姿態(tài)估計來確定相對定向, 以基于諸如邊緣等的所提取的特征,使得候選對象的模型與候選對象的圖像擬合。在另一 VIDD配置中,基于通過公式(7)中的方位角Θ所表示的候選對象的運動方向來確定相對定 向。下面參考圖5、6A和6B更詳細(xì)地說明VIDD配置例子。
[0099] 方法400然后從步驟425進(jìn)入下面參考圖7A和7B更加詳細(xì)地說明的、通過VIDD 軟件1033所指示的處理器1005所進(jìn)行的步驟430,步驟430對在步驟420所檢測到的候選 對象的屬性進(jìn)行分類。在一個VIDD配置中,通過計算所檢測到的候選者和每一屬性類的一 個以上的模板圖像的特征之間的匹配得分,對屬性進(jìn)行分類。在另一 VIDD配置中,通過對 于從所檢測到的候選者的區(qū)域所提取的特征應(yīng)用預(yù)定閾值,對屬性進(jìn)行分類。例如,通過向 軀體區(qū)域中的像素的平均灰度應(yīng)用預(yù)定閾值,對包含類"淺色"和"深色"的屬性"襯衣顏色 深淺"進(jìn)行分類。在又一 VIDD配置中,使用監(jiān)督學(xué)習(xí)對屬性進(jìn)行分類,其中,通過每一類的 一組標(biāo)記訓(xùn)練圖像來學(xué)習(xí)分類器。
[0100] 方法400然后從步驟430進(jìn)入下面參考圖8更加詳細(xì)地說明的、通過VIDD軟件 1033所指示的處理器1005所進(jìn)行的步驟440,步驟440基于在步驟410所確定的關(guān)注對象 的屬性、在步驟430所確定的候選對象的屬性和在步驟425所確定的候選對象的相對定向, 確定候選對象是關(guān)注對象的置信度(根據(jù)公式(1)的(P(x|d,v))。在一個VIDD配置中, 步驟440計算公式(1)中的后驗概率??刂迫缓髲牟襟E440進(jìn)入通過VIDD軟件1033所指 示的處理器1005所進(jìn)行的判斷步驟450,步驟450判斷是否可以基于所計算出的后驗概率 441來確定候選對象的身份。在一個VIDD配置中,將在步驟440所確定的后驗概率與上閾 值和下閾值(例如,0.95和0.05)進(jìn)行比較。如果后驗概率高于上閾值或者低于下閾值,那 么候選對象的身份的置信度高,否則,候選對象的身份的置信度低。如果候選對象的身份的 置信度低,則控制按照"否"箭頭,并且從步驟450進(jìn)入以下參考圖9更加詳細(xì)所述的步驟 460。通過VIDD軟件1033所指示的處理器1005進(jìn)行步驟460,并且規(guī)劃新的攝像機設(shè)置。 如果候選對象的身份的置信度高,則控制按照"是"箭頭,并且從步驟450進(jìn)入步驟499。
[0101] 步驟460確定攝像機設(shè)置以通過提尚最特有可觀察屬性的可檢測性來提尚候選 對象的身份的估計的置信度。在一個VIDD配置中,基于預(yù)定規(guī)則生成一組固定的攝像機設(shè) 置,并且選擇使與候選對象的身份有關(guān)的信息的增加最大化的設(shè)置。例如,這些規(guī)則可以基 于諸如行人情況下的"頭部"、"軀體"和"腿部"等的、候選對象的特定區(qū)域的放大圖,生成 攝像機設(shè)置。在另一 VIDD配置中,進(jìn)行諸如迭代下降搜索等的數(shù)值優(yōu)化,以確定使與候選 對象的身份有關(guān)的信息的增加最大化的攝像機設(shè)置。在步驟460規(guī)劃了新的攝像機設(shè)置之 后,控制循環(huán)回至步驟420,其中,使用新的攝像機設(shè)置拍攝候選對象的新圖像,以更新候選 對象是關(guān)注對象的置信度。
[0102] 在結(jié)束步驟499,根據(jù)使用公式(1)所確定的最終后驗概率,確定候選對象的最終 身份。在一個VIDD配置中,將候選對象的最終后驗概率與預(yù)定上閾值和預(yù)定下閾值(例如, 0.95和0.05)進(jìn)行比較。如果后驗概率高于上閾值,則候選對象被分類為是關(guān)注對象。如 果后驗概率低于下閾值,則候選對象被分類為不是關(guān)注對象。
[0103] 圖4示出用于實現(xiàn)VIDD配置的一個例子400,其中,規(guī)劃一系列觀察以判斷單個 候選對象是否是關(guān)注對象。還可以相同地進(jìn)行該方法的變形例。在一個可選VIDD變形例 中,規(guī)劃一系列觀察以確定一個以上的候選對象的身份。在該變形例的一個實施方案中,步 驟420檢測并追蹤多個候選對象,并且步驟425確定每一候選對象的相對定向。獨立于其 它候選對象,步驟430對每一候選對象的屬性進(jìn)行分類。類似地,獨立于其它候選對象,步 驟440確定每一候選對象是否是關(guān)注對象的后驗概率。在一個VIDD配置中,步驟450判斷 是否至少一個候選對象具有作為關(guān)注對象的高置信度。如果是,控制進(jìn)入結(jié)束步驟499,在 步驟499,將具有最高后驗概率的對象分類為關(guān)注對象。如果不是,則控制進(jìn)入步驟460,步 驟460規(guī)劃新的攝像機設(shè)置,以使所有候選對象的身份的置信度最大化。
[0104] 在方法400的另一可選變形例中,用戶(例如,保安員)監(jiān)視方法400,并且在已 經(jīng)識別出關(guān)注對象時終止該處理。在該變形例的一個實施方案中,步驟440計算每一候選 對象的后驗概率,并然后從最大置信度到最小置信度,對作為關(guān)注對象的所有候選對象進(jìn) 行排序。在判斷步驟450的一個實施方案中,向用戶呈現(xiàn)頂部排序?qū)ο螅ɡ?,具有最高?驗概率的三個對象)。如果用戶判斷為這些對象中的一個是關(guān)注對象,則控制進(jìn)入結(jié)束步 驟499。如果用戶判斷為這些對象沒有一個是關(guān)注對象,則控制進(jìn)入步驟460,步驟460規(guī) 劃如以上VIDD配置所述的新的攝像機設(shè)置。
[0105] 圖5示出用于基于運動方向來確定候選對象的相對定向541的、圖4的方法400的 步驟425的示例性實現(xiàn)方案。作為例子,參考如圖6A和6B所述的、場景的圖像600中的候 選對象620來說明方法425。方法425基于在兩個不同時間所拍攝的一對幀中所觀察到的、 針對候選對象的位置變化的一階有限差分近似,確定運動方向。在方法440的步驟820 (參 考圖8)和方法460的步驟920(參考圖9)中,使用通過該方法所確定的相對定向541,以確 定每一屬性在給定攝像機設(shè)置下的可檢測性。
[0106] 在通過VIDD軟件1033所指示的處理器1005所進(jìn)行的開始步驟505,開始圖5中 的方法425,其中,作為輸入,接收場景的當(dāng)前幀600和在先前時間所拍攝的幀。當(dāng)前幀和先 前幀兩者都包含候選對象??刂迫缓髲牟襟E505進(jìn)入通過VIDD軟件1033所指示的處理器 1005所進(jìn)行的步驟510,步驟510確定表示候選對象的位置的當(dāng)前幀中的點??梢韵鄬τ?如在方法400的步驟420的一個實施方案中所檢測到的、包含候選對象的邊界框來確定該 點。例如,在步驟510的一個實施方案中,將邊界框的最下邊緣的中心(即,"腳印")作為 候選對象的位置。在步驟510的替代實施方案中,將邊界框的形心作為候選對象的位置,這 樣對于噪聲具有更強的穩(wěn)健性。步驟510的另一實施方案可以使用特定部位的位置來定位 候選對象。例如,針對行人的步驟510的另一替代實施方案,使用如使用"Ω形狀"檢測器 所檢測到的、候選對象的頭部位置。該位置的優(yōu)點是在不同幀上具有高精度的特有性和可 檢測性。又一可選VIDD配置,使用候選對象的前景掩模上的最低點(如在方法400的步驟 420的一個實施方案中所檢測到的)作為候選對象的位置。
[0107] 控制然后從步驟510進(jìn)入通過VIDD軟件1033所指示的處理器1005所進(jìn)行的步 驟520,步驟520確定表示候選對象的位置的、先前幀中的點。步驟520的實施方案與上述 步驟510的替代實施方案(應(yīng)用于先前幀)相同,其中,對于步驟510和520兩者,使用相 同實施方案。這樣確保當(dāng)前幀和先前幀之間的點的相對位置表示運動方向,而不是該點相 對于候選對象的位置的移位。
[0108] 方法425然后從步驟520進(jìn)入通過VIDD軟件1033所指示的處理器1005所進(jìn)行的 步驟530,步驟530基于在步驟510和520所確定的位置,確定候選對象的運動方向。在一 個VIDD配置中,步驟530計算表示候選對象的位置從先前幀到當(dāng)前幀的相對變化的矢量。
[0109] 圖6A作為例子示出步驟510、520和530的一個實施方案。首先,在步驟510,確 定當(dāng)前幀中候選對象620上的最低點640。然后,在步驟520,確定先前幀中候選對象610 上的最低點630。最后,計算從先前位置630到當(dāng)前位置640的矢量650,作為對于運動方 向的一階有限差分近似。將該矢量分解成被表示為Αχ的、在圖6A中以654所表示的圖像 在水平方向上的位置變化和表示為△ y的、在圖6Α中以652所表示的垂直方向上的位置變 化。
[0110] 控制然后從步驟530進(jìn)入通過VIDD軟件1033所指示的處理器1005所進(jìn)行的步驟 540,步驟540基于在步驟530所確定的運動方向,確定