本發(fā)明涉及視頻監(jiān)控技術(shù)領(lǐng)域,具體涉及一種人群聚集的智能監(jiān)控方法和系統(tǒng)。
背景技術(shù):
隨著寬帶網(wǎng)絡(luò)的普及、計算機技術(shù)的發(fā)展以及圖像處理技術(shù)的提高,視頻監(jiān)控技術(shù)正越來越廣泛地滲透到教育、政府、娛樂、醫(yī)療、酒店等各種領(lǐng)域。尤其在安防領(lǐng)域,視頻監(jiān)控是協(xié)助公共安全部門打擊犯罪、維持社會安定的重要手段。然而現(xiàn)有的視頻監(jiān)控分析方法只能基于所采集的監(jiān)控視頻進行事后的人工分析,無法根據(jù)對公共場所人群聚集情況的實時監(jiān)控而實時采取相應(yīng)的管控措施。因此,急需一種能夠?qū)崟r監(jiān)控人群聚集的智能監(jiān)控方式。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明實施例提供了一種人群聚集的智能監(jiān)控方法和系統(tǒng),解決了現(xiàn)有技術(shù)中的視頻監(jiān)控方式無法實時監(jiān)控人群聚集的問題。
本發(fā)明實施例提供的一種人群聚集的智能監(jiān)控方法,包括:實時采集視頻監(jiān)控數(shù)據(jù);提取實時采集的視頻監(jiān)控數(shù)據(jù)中的目標設(shè)施;實時提取所述視頻監(jiān)控數(shù)據(jù)中聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征信息;以及根據(jù)所述目標設(shè)施和聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征信息確定所述視頻監(jiān)控數(shù)據(jù)對應(yīng)監(jiān)控場景的人群聚集管控信息。
本發(fā)明實施例提供的一種人群聚集的智能監(jiān)控系統(tǒng),包括:環(huán)境感知裝置,用于實時采集視頻監(jiān)控數(shù)據(jù);地理標志分析裝置,用于提取所述環(huán)境感知裝置實時采集的視頻監(jiān)控數(shù)據(jù)中的目標設(shè)施;對象特征分析裝置,用于實時提取所述視頻監(jiān)控數(shù)據(jù)中聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征信息;以及決策裝置,用于根據(jù)所述地理標志分析裝置提取的目標設(shè)施,以及對象特征分析裝置實時提取的聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征信息確定所述視頻監(jiān)控數(shù)據(jù)對應(yīng)監(jiān)控場景的人群聚集管控信息。
本發(fā)明實施例提供的人群聚集的智能監(jiān)控方法和系統(tǒng),通過對視頻監(jiān)控數(shù)據(jù)中目標設(shè)施的提取,以及對聚集在該目標設(shè)施范圍內(nèi)人群的人群聚集特征信息的實時提取,實現(xiàn)了對人群聚集情況的實時監(jiān)控、分析與判斷。主要根據(jù)不同目標設(shè)施范圍內(nèi)人群聚集面積、聚集時間、人群運動方向及運動速度等特征實時判斷當前監(jiān)控場景下是否存在人群聚集/人群持續(xù)聚集的現(xiàn)象或者趨勢,并根據(jù)不同聚集情況實時采取相應(yīng)不同的管控策略,有效地緩解/防止了人群聚集現(xiàn)象或者人群持續(xù)聚集現(xiàn)象,為社會公共安全的維護工作提供了有效措施。
附圖說明
圖1所示為本發(fā)明一實施例提供的一種人群聚集的智能監(jiān)控方法的流程圖。
圖2所示為本發(fā)明另一實施例提供的一種人群聚集的智能監(jiān)控方法的流程圖。
圖3所示為本發(fā)明另一實施例提供的一種人群聚集的智能監(jiān)控方法的流程圖。
圖4所示為本發(fā)明一實施例提供的一種人群聚集的智能監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖。
圖5所示為本發(fā)明一實施例提供的一種人群聚集的智能監(jiān)控系統(tǒng)所基于的監(jiān)控視頻智能信息模型圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
圖1所示為本發(fā)明一實施例提供的一種人群聚集的智能監(jiān)控方法的流程示意圖。如圖1所示,該人群聚集的智能監(jiān)控方法包括:
步驟101:實時采集視頻監(jiān)控數(shù)據(jù)。
該視頻監(jiān)控數(shù)據(jù)為前端視頻采集設(shè)備所直接采集到的一些基本信息,直接作為后續(xù)進行進一步實時智能分析的基本資源數(shù)據(jù)。在本發(fā)明一實施例中,實時采集的視頻監(jiān)控數(shù)據(jù)也可直接發(fā)給監(jiān)控中心的監(jiān)控人員查看,使得監(jiān)控人員能夠?qū)崟r監(jiān)督整個人群聚集智能監(jiān)控過程的自動進行。
在本發(fā)明一實施例中,該實時采集的視頻監(jiān)控數(shù)據(jù)可包括監(jiān)控視頻以及以下幾項中的一種或多種:視頻采集位置信息和視頻采集時間信息。其中監(jiān)控視頻是后續(xù)進行目標設(shè)施和人群聚集特征信息提取的資源數(shù)據(jù),視頻采集位置信息和視頻采集時間信息可作為附加的屬性信息用于明確當前人群聚集監(jiān)控場景的時間和地點。
步驟102:提取實時采集的視頻監(jiān)控數(shù)據(jù)中的目標設(shè)施。
該目標設(shè)施為待監(jiān)控的場景設(shè)施,可由開發(fā)人員根據(jù)實際的監(jiān)控需求設(shè)定,例如,如果監(jiān)控人員所關(guān)注的為某火車站某層樓梯人群聚集的情況,可將目標設(shè)施設(shè)置為該火車站該層樓梯;如果監(jiān)控人員所關(guān)注的為某商場某售賣柜臺人群聚集的情況,可將目標設(shè)施設(shè)置為該商場該售賣柜臺。對于該設(shè)定的目標設(shè)施,可基于圖像對象提取技術(shù)直接從視頻圖像中提取出來。
步驟103:實時提取視頻監(jiān)控數(shù)據(jù)中聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征信息。
該目標設(shè)施范圍也可根據(jù)目標設(shè)施以及監(jiān)控人員的監(jiān)控需求而做不同設(shè)定,例如,如果監(jiān)控人員想監(jiān)控某火車站某層樓梯人群聚集的情況,則可將整層樓梯設(shè)為目標設(shè)施范圍,如果監(jiān)控人員將某商場某售賣柜臺設(shè)為目標設(shè)施,則目標設(shè)施范圍可從該售賣柜臺向四周或者一側(cè)進行一定面積的擴大,具體擴大的范圍也可根據(jù)實際的監(jiān)控需求而設(shè)定,本發(fā)明對此不做具體限定。
在本發(fā)明一實施例中,人群聚集特征信息可包括以下幾項中的一種或多種:人群聚集時間、人群聚集面積、人群運動方向和人群運動速度,用于進一步明確聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征。
步驟104:根據(jù)目標設(shè)施和目標設(shè)施范圍內(nèi)人群的人群聚集特征信息確定視頻監(jiān)控數(shù)據(jù)對應(yīng)監(jiān)控場景的人群聚集管控信息。
基于不同的目標設(shè)施和多樣化的人群聚集特征信息可實現(xiàn)多樣化的人群聚集管控策略。該人群聚集管控信息的確定過程可基于不同目標設(shè)施和人群聚集狀態(tài)下人群聚集管控策略的機器描述的預(yù)訓(xùn)練所得模型實現(xiàn)。例如,設(shè)定當人群的聚集面積達到5m2以上時,即視為人群聚集現(xiàn)象,人群聚集現(xiàn)象所持續(xù)的時間達到15分鐘以上時,即視為人群持續(xù)聚集現(xiàn)象。當目標設(shè)施為某商場的某售賣柜臺時,而實時監(jiān)控所得出的人群聚集面積已達到4m2且人群運動速度緩慢,此時可判斷當前場景下存在人群聚集現(xiàn)象發(fā)生的趨勢,為避免這種可能性,建議采取輕度人群聚集管控策略,如工作人員在監(jiān)控現(xiàn)場進行相應(yīng)的引導(dǎo)和指揮,防止人群聚集面積的持續(xù)擴大;當目標設(shè)施為某公園的某通道,而實時監(jiān)控所得出的人群聚集面積達到8m2,持續(xù)時間已達到20分鐘,且人群運動方向包括相反的兩個方向,運動速度幾乎為零,說明當前監(jiān)控場景下的人群聚集現(xiàn)象已達到持續(xù)聚集程度,可能妨礙公共安全(如:可能發(fā)生踩踏等安全事件),建議采取嚴格的人群聚集管控策略,比如可將其中一個方向的人群引導(dǎo)至另一通道的人群聚集管控策略。應(yīng)當理解,人群聚集管控信息與目標設(shè)施和實時提取的人群聚集特征信息之間的具體對應(yīng)關(guān)系也可由監(jiān)控人員根據(jù)實際需要而調(diào)整,但無論怎樣調(diào)整,這種對應(yīng)關(guān)系都是可以基于預(yù)訓(xùn)練所得模型而建立起來的,本發(fā)明對該具體的對應(yīng)關(guān)系并不做限定。
本發(fā)明實施例提供的人群聚集的智能監(jiān)控方法和系統(tǒng),通過對視頻監(jiān)控數(shù)據(jù)中目標設(shè)施的提取,以及對聚集在該目標設(shè)施范圍內(nèi)人群的人群聚集特征信息的實時提取,實現(xiàn)了對人群聚集情況的實時監(jiān)控、分析與判斷。主要根據(jù)不同目標設(shè)施范圍內(nèi)人群聚集面積、聚集時間、人群運動方向及運動速度等特征實時判斷當前監(jiān)控場景下是否存在人群聚集/人群持續(xù)聚集的現(xiàn)象或者趨勢,并根據(jù)不同聚集情況實時采取相應(yīng)不同的管控策略,有效地緩解/防止了人群聚集現(xiàn)象或者人群持續(xù)聚集現(xiàn)象,為社會公共安全的維護工作提供了有效措施。
在本發(fā)明一實施例中,該提取的目標設(shè)施以及實時提取的聚集在該目標設(shè)施范圍內(nèi)人群的人群聚集特征信息可被保存下來,以便于后續(xù)的查詢。例如,通過接收以人群聚集特征信息、視頻監(jiān)控時段或目標設(shè)施為查詢條件的查詢指令;以及調(diào)取與人群聚集特征信息對應(yīng)的所有視頻監(jiān)控時間段和目標設(shè)施,或調(diào)取與視頻監(jiān)控時段對應(yīng)的所有目標設(shè)施和人群聚集特征信息,或調(diào)取與目標設(shè)施對應(yīng)的所有視頻監(jiān)控時間段下的人群聚集特征信息。
圖2所示為本發(fā)明一實施例提供的一種人群聚集監(jiān)控方法的流程示意圖。與圖1所示的人群聚集監(jiān)控方法不同,圖2所示的方法進一步包括:
步驟201:基于提取的目標設(shè)施和實時提取的人群聚集特征信息生成語義分析結(jié)果。
再以上述為例,目標設(shè)施設(shè)置為某公園的某通道,實時監(jiān)控所得出的人群聚集面積達到8m2,持續(xù)時間已達到20分鐘,人群運動方向包括相反的兩個方向,運動速度幾乎為零,則該語義分析結(jié)果可表示為:某人群在某公園某通道持續(xù)聚集,其中人群運動方向包括相反的兩個方向,運動速度幾乎為零。
步驟202:基于語義分析結(jié)果以及不同目標設(shè)施和人群聚集特征信息所對應(yīng)人群聚集管控策略的機器描述的預(yù)訓(xùn)練所得模型,實時確定視頻監(jiān)控數(shù)據(jù)對應(yīng)監(jiān)控場景的人群聚集管控信息。
例如,基于上面的語義分析結(jié)果,可確定的人群聚集管控信息可為:某公園某通道存在持續(xù)聚集現(xiàn)象,可能妨礙公共安全(如:可能發(fā)生踩踏等安全事件),建議將其中一個方向的人群引導(dǎo)至另一通道。
圖3所示為本發(fā)明另一實施例提供的一種人群聚集監(jiān)控方法的流程示意圖。與圖2所示的方法不同,圖3所示的人群聚集監(jiān)控方法進一步包括:
步驟301:從視頻監(jiān)控數(shù)據(jù)中截取聚集在目標設(shè)施范圍內(nèi)的人群所處區(qū)域的區(qū)域視頻監(jiān)控數(shù)據(jù)。
步驟302:從該區(qū)域視頻監(jiān)控數(shù)據(jù)中實時提取聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征信息。
通過從視頻監(jiān)控數(shù)據(jù)中截取區(qū)域視頻監(jiān)控數(shù)據(jù),去掉了與當前監(jiān)控的聚集在目標設(shè)施范圍內(nèi)的人群無關(guān)的區(qū)域的視頻監(jiān)控數(shù)據(jù),減少了后續(xù)提取人群聚集特征信息的計算量,減輕硬件分析資源的計算負擔。
應(yīng)當注意,本發(fā)明所述方法中的步驟編號僅用作該步驟的附圖標記,并不表示執(zhí)行順序,因為一些動作可以按照與這里描述和標示的順序不同的順序出現(xiàn),本發(fā)明要求保護的主題內(nèi)容將不受這些動作的執(zhí)行順序所限制。另外,前述步驟的描述不排除該方法還可以包括可能取得附加效果的附加步驟。還應(yīng)當理解,不同的實施方式或者流程中描述的方法步驟可以相互組合或者替換。
圖4所示為本發(fā)明一實施例提供的一種人群聚集的智能監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖。如圖4所示,該人群聚集的智能監(jiān)控系統(tǒng)包括:
環(huán)境感知裝置401,用于實時采集視頻監(jiān)控數(shù)據(jù);
地理標志分析裝置402,用于提取環(huán)境感知裝置401所采集的視頻監(jiān)控數(shù)據(jù)中的目標設(shè)施;
對象特征分析裝置403,用于實時提取視頻監(jiān)控數(shù)據(jù)中聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征信息;以及
決策裝置404,用于根據(jù)地理標志分析裝置402提取的目標設(shè)施,以及對象特征分析裝置403實時提取的聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征信息確定視頻監(jiān)控數(shù)據(jù)對應(yīng)監(jiān)控場景的人群聚集管控信息。
在本發(fā)明一實施例中,該人群聚集的智能監(jiān)控系統(tǒng)進一步包括:
語義分析裝置405,用于基于地理標志分析裝置402提取的目標設(shè)施和對象特征分析裝置403實時提取的人群聚集特征信息生成語義分析結(jié)果;
其中,決策裝置404進一步用于:
基于語義分析裝置405所生成的語義分析結(jié)果以及不同目標設(shè)施和人群聚集特征信息所對應(yīng)人群聚集管控策略的機器描述的預(yù)訓(xùn)練所得模型,實時確定所述視頻監(jiān)控數(shù)據(jù)對應(yīng)監(jiān)控場景的人群聚集管控信息。
在本發(fā)明一實施例中,決策裝置404進一步用于:
接收以人群聚集特征信息、視頻監(jiān)控時段或目標設(shè)施為查詢條件的查詢指令;以及調(diào)取與人群聚集特征信息對應(yīng)的所有視頻監(jiān)控時間段和目標設(shè)施,或調(diào)取與視頻監(jiān)控時段對應(yīng)的所有目標設(shè)施和人群聚集特征信息,或調(diào)取與目標設(shè)施對應(yīng)的所有視頻監(jiān)控時間段下的人群聚集特征信息。
在本發(fā)明一實施例中,該人群聚集的智能監(jiān)控系統(tǒng)進一步包括:
對象區(qū)域提取裝置406,用于從視頻監(jiān)控數(shù)據(jù)中截取聚集在目標設(shè)施范圍內(nèi)的人群所處區(qū)域的區(qū)域視頻監(jiān)控數(shù)據(jù);
其中,對象特征分析裝置403進一步用于從該區(qū)域視頻監(jiān)控數(shù)據(jù)中實時提取聚集在目標設(shè)施范圍內(nèi)人群的人群聚集特征信息。
由此可見,本發(fā)明實施例所提供的人群聚集監(jiān)控系統(tǒng)其實是基于一種監(jiān)控視頻智能信息模型實現(xiàn)的。該監(jiān)控視頻智能信息模型中的信息流可分為不同的層面提取,而且相鄰的層面之間存在一定的依賴關(guān)系,如圖5所示。在環(huán)境感知裝置401采集視頻監(jiān)控數(shù)據(jù)的過程中,將視頻和現(xiàn)場感知數(shù)據(jù)(如:聲音、時間、相機的地理位置、溫度、氣象、相機位姿等)存入環(huán)境感知層,這些信息是傳統(tǒng)視頻監(jiān)控和智能視頻監(jiān)控提供監(jiān)控場景的基本要素,為頂層決策提供必要的支持。在前端處理過程中,將原始采集的視頻監(jiān)控數(shù)據(jù)進行初步處理(包括傳統(tǒng)預(yù)處理,以及基于統(tǒng)計學(xué)習方法的前端智能分析等),并將初步處理的結(jié)果存入特征層、地理標志層和對象層,分別對應(yīng)對象特征分析裝置403提取人群聚集特征信息的過程、地理標志分析裝置402提取目標設(shè)施的過程以及對象區(qū)域提取裝置406從原始采集的視頻監(jiān)控數(shù)據(jù)中截取區(qū)域視頻監(jiān)控數(shù)據(jù)的過程。在后端處理過程中,將根據(jù)不同的應(yīng)用需要,綜合前述的相應(yīng)各層,利用機器學(xué)習技術(shù)進行分析和處理,將相關(guān)的處理結(jié)果存入語義層,對應(yīng)語義分析裝置405生成語義分析結(jié)果的過程。對于語義分析裝置405中的語義分析結(jié)果,利用機器學(xué)習技術(shù)訓(xùn)練的判斷模型可以給出不同的決策建議供監(jiān)控人員參考;同時,監(jiān)控人員還可以向系統(tǒng)發(fā)出指令,以查詢監(jiān)控數(shù)據(jù)中相應(yīng)的內(nèi)容,這些屬于決策/理解層。其中的判斷模型以及通過其判斷得到的決策建議,屬于決策范疇。監(jiān)控人員在觀察過程中,向監(jiān)控系統(tǒng)發(fā)出某種指令以查詢某一事件中,具備某類特征的目標,系統(tǒng)將其指令解釋成符合本結(jié)構(gòu)模型的描述方式,對其所掌握的數(shù)據(jù)進行檢索,屬于理解范疇。
應(yīng)當理解,當人群聚集監(jiān)控系統(tǒng)包括前端視頻采集設(shè)備和后端視頻分析設(shè)備時,環(huán)境感知裝置401可設(shè)置在前端視頻采集設(shè)備中,而地理標志分析裝置402、對象區(qū)域提取裝置406、對象特征分析裝置403、語義分析裝置405、決策裝置404可分別設(shè)置在前端視頻采集設(shè)備中或設(shè)置在后端視頻分析設(shè)備中。只要人群聚集監(jiān)控系統(tǒng)中的所有裝置能夠?qū)崿F(xiàn)各自的分析提取功能以及信息流的逐步提取,以最終達到語義決策的目的即可。本發(fā)明對人群聚集監(jiān)控系統(tǒng)中的裝置具體設(shè)置在前端視頻采集設(shè)備還是后端視頻分析設(shè)備并不做限定。
本發(fā)明的教導(dǎo)還可以實現(xiàn)為一種計算機可讀存儲介質(zhì)的計算機程序產(chǎn)品,包括計算機程序代碼,當計算機程序代碼由處理器執(zhí)行時,其使得處理器能夠按照本發(fā)明實施方式的方法來實現(xiàn)如本文實施方式所述的人群聚集監(jiān)控方法。計算機存儲介質(zhì)可以為任何有形媒介,例如軟盤、CD-ROM、DVD、硬盤驅(qū)動器、甚至網(wǎng)絡(luò)介質(zhì)等。
應(yīng)當理解,雖然以上描述了本發(fā)明實施方式的一種實現(xiàn)形式可以是計算機程序產(chǎn)品,但是本發(fā)明的實施方式的方法或裝置可以被依軟件、硬件、或者軟件和硬件的結(jié)合來實現(xiàn)。硬件部分可以利用專用邏輯來實現(xiàn);軟件部分可以存儲在存儲器中,由適當?shù)闹噶顖?zhí)行系統(tǒng),例如微處理器或者專用設(shè)計硬件來執(zhí)行。本領(lǐng)域的普通技術(shù)人員可以理解上述的方法和設(shè)備可以使用計算機可執(zhí)行指令和/或包含在處理器控制代碼中來實現(xiàn),例如在諸如磁盤、CD或DVD-ROM的載體介質(zhì)、諸如只讀存儲器(固件)的可編程的存儲器或者諸如光學(xué)或電子信號載體的數(shù)據(jù)載體上提供了這樣的代碼。本發(fā)明的方法和裝置可以由諸如超大規(guī)模集成電路或門陣列、諸如邏輯芯片、晶體管等的半導(dǎo)體、或者諸如現(xiàn)場可編程門陣列、可編程邏輯設(shè)備等的可編程硬件設(shè)備的硬件電路實現(xiàn),也可以用由各種類型的處理器執(zhí)行的軟件實現(xiàn),也可以由上述硬件電路和軟件的結(jié)合例如固件來實現(xiàn)。
應(yīng)當理解,盡管在上文的詳細描述中提及了裝置的若干模塊或單元,但是這種劃分僅僅是示例性而非強制性的。實際上,根據(jù)本發(fā)明的示例性實施方式,上文描述的兩個或更多模塊/單元的特征和功能可以在一個模塊/單元中實現(xiàn),反之,上文描述的一個模塊/單元的特征和功能可以進一步劃分為由多個模塊/單元來實現(xiàn)。此外,上文描述的某些模塊/單元在某些應(yīng)用場景下可被省略。例如當硬件計算資源的計算能力不受限制時,也可不包括對象區(qū)域提取裝置。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。