基于海量數(shù)據(jù)的視頻交互查詢方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種基于海量數(shù)據(jù)的視頻交互查詢方法,應用于城市安防領域,所述方法包括:建立單個監(jiān)控攝像頭為中心的視頻對象空間定位坐標系;建立多監(jiān)控攝像頭間視頻數(shù)據(jù)關聯(lián);在視頻數(shù)據(jù)中增加空間坐標;將上述視頻數(shù)據(jù)進行實時壓縮;在壓縮過程中進行視頻語義特征的提取,并生成語義索引;按照統(tǒng)一的坐標系及統(tǒng)一的視頻格式進行存儲,視頻格式至少包括拍攝時間、空間坐標、語義索引;輸入語義、拍攝時間或/和空間坐標作為關鍵詞進行查詢;查找與所述關鍵詞相關聯(lián)的視頻數(shù)據(jù),并輸出查詢結果。本發(fā)明還提供對應的查詢系統(tǒng)。本發(fā)明可以通過精確的空間定位,實現(xiàn)海量視頻數(shù)據(jù)基于“屬性-空間”的雙向交互查詢。
【專利說明】基于海量數(shù)據(jù)的視頻交互查詢方法及系統(tǒng)
【技術領域】
[0001]本發(fā)明涉及視頻數(shù)據(jù)的查詢,尤其涉及一種基于海量數(shù)據(jù)的視頻交互查詢方法及系統(tǒng)。
【背景技術】
[0002]目前城市中的視頻數(shù)據(jù)已匯成海量(BigData)數(shù)據(jù),傳統(tǒng)的按照所在區(qū)域給監(jiān)控攝像頭標號進行文件目錄式存儲的方式,已經(jīng)無法滿足智能城市的視頻查詢需求。
[0003]一方面,由于視頻數(shù)據(jù)無法提供準確的位置信息,難以與電子地圖、GSP等開展高端應用結合,如基于某空間活動范圍的視頻資源條件式選取及關聯(lián)性查找。另一方面,視頻數(shù)據(jù)由于缺少語義檢索機制,無法實現(xiàn)對于特定視頻內容的快速搜索與準確定位。例如,根據(jù)車輛顏色形狀特征,搜索全市范圍內某一時段的交通監(jiān)控視頻,找到相關車輛的空間位置及活動軌跡,或者搜索某特定形態(tài)空間范圍(道路、河流、學校等)內及周邊的相關視頻數(shù)據(jù),自動發(fā)現(xiàn)可疑目標,監(jiān)控、追蹤、預測其活動范圍。
[0004]在實現(xiàn)對海量數(shù)據(jù)進行有效整理,在技術的實施上,主要參照了以下專利:
[0005]1.CN201310071391.1,《一種基于視頻分析的空間定位方法》,申請日2013-3-6,公開了基于視頻分析的空間定位法,建立了以單個攝像頭為中心的空間定位坐標系;
[0006]2.CN201310105427.3,《一種基于空間信息的多視頻關聯(lián)監(jiān)控定位裝置與方法》,申請日2013-3-28,公開了多攝像頭之間的視頻數(shù)據(jù)的空間集成與關聯(lián);
[0007]3.CN201310443075.2,《在視頻文件尾部添加地理位置信息的方法》,申請日
2013-9-25,公開了動態(tài)拍攝時地理位置的增加;
[0008]4.CN201310443078.6,《在視頻文件中添加地理位置信息并建立索引的方法》,申請日2013-9-25,公開了靜態(tài)拍攝時地理位置的增加;
[0009]5.CN201410115063.1,《視頻語義檢索與壓縮同步的攝像系統(tǒng)與方法》,申請日
2014-3-26,公開了視頻關鍵幀中索引內容的提??;
[0010]在上述技術的基礎上,有必要對提供一種實現(xiàn)海量視頻數(shù)據(jù)的“屬性-空間”雙向交互查詢功能。
【發(fā)明內容】
[0011]有鑒于此,我們需要發(fā)明一種新型的基于海量數(shù)據(jù)的視頻交互查詢方法及系統(tǒng),以實現(xiàn)更佳的“屬性-空間”雙向交互的查詢功能。
[0012]本發(fā)明提供的基于海量數(shù)據(jù)的視頻交互查詢方法,應用于城市安防領域中,其海量數(shù)據(jù)來源于由多個監(jiān)控攝像頭組成的視頻數(shù)據(jù)采集端,所述交互查詢方法包括如下步驟:基于視頻分析的空間定位方法,建立單個監(jiān)控攝像頭為中心的視頻對象空間定位坐標系;基于所述空間定位坐標系,建立多個監(jiān)控攝像頭之間視頻數(shù)據(jù)的關聯(lián);在監(jiān)控攝像頭所拍攝的視頻數(shù)據(jù)中增加空間坐標;將上述視頻數(shù)據(jù)進行實時壓縮;在壓縮過程中進行視頻語義特征的提取,并生成語義索引;按照統(tǒng)一的坐標系、統(tǒng)一的視頻格式進行存儲,以形成海量數(shù)據(jù)的視頻庫,所述統(tǒng)一的視頻格式至少包括拍攝時間、空間坐標、語義索引;輸入所述語義、或/和所述空間坐標作為關鍵詞進行查詢;在所述海量數(shù)據(jù)的視頻庫中查找與所述關鍵詞相關聯(lián)的視頻數(shù)據(jù),并輸出查詢結果。
[0013]優(yōu)選地,所述監(jiān)控攝像頭,在安裝時將其地理位置、監(jiān)控范圍一并存入服務器進行
統(tǒng)一管理。
[0014]優(yōu)選地,所述的視頻格式中還包括分辨率。
[0015]優(yōu)選地,在進行所述存儲時,判斷是否有重復的視頻,如果有,則刪除分辨率較差的視頻數(shù)據(jù)或按照分辨率的大小進行優(yōu)先級的排序。
[0016]優(yōu)選地,所述查詢結果是多個獨立的視頻片段,或自動銜接播放的視頻集合。
[0017]本發(fā)明提供的基于海量數(shù)據(jù)的視頻交互查詢系統(tǒng),應用于城市安防領域中,其海量數(shù)據(jù)來源于由多個監(jiān)控攝像頭組成的視頻數(shù)據(jù)采集端,所述交互查詢系統(tǒng)包括:所述監(jiān)控攝像頭,用于提供視頻數(shù)據(jù)的內容、拍攝時間、拍攝地點;服務器,用于對所述視頻數(shù)據(jù)進行統(tǒng)一管理,包括:索引生成模塊,用于設置索引規(guī)則;壓縮模塊,用于將所述視頻數(shù)據(jù)進行實時壓縮,根據(jù)所述索引規(guī)則進行視頻語義特征的提取,并生成語義索引;視頻數(shù)據(jù)庫,用于為采集的視頻數(shù)據(jù)建立統(tǒng)一的坐標系、以及統(tǒng)一的視頻格式,并根據(jù)所述的視頻格式中的部分內容進行關聯(lián);查詢終端,用于輸入所述語義、拍攝時間、空間坐標中的至少一者進行查詢,并輸出查詢結果。
[0018]優(yōu)選地,所述空間坐標包括經(jīng)緯度、相對位置、或標志建筑物中的一者。
[0019]優(yōu)選地,所述查詢結果是多個獨立的視頻片段,或自動銜接播放的視頻集合。
[0020]優(yōu)選地,所述視頻數(shù)據(jù)采集端,還用于提供視頻數(shù)據(jù)的分辨率。
[0021 ] 優(yōu)選地,所述述視頻數(shù)據(jù)庫還用于在進行所述關聯(lián)時,判斷是否有內容相同的視頻數(shù)據(jù),如果有,則刪除分辨率較差的視頻數(shù)據(jù)。
[0022]本發(fā)明通過對視頻數(shù)據(jù)在采集時附加了拍攝時間、空間坐標等信息,并增加視頻之間的關聯(lián)性、以及在壓縮時產(chǎn)生內容索引,將3W1H或5W1H的分析方法引入到海量數(shù)據(jù)的分析中,有效的提高了視頻數(shù)據(jù)交互查詢的有效性。
【專利附圖】
【附圖說明】
[0023]圖1是本發(fā)明中基于海量數(shù)據(jù)的視頻交互查詢方法的流程示意圖。
[0024]圖2是本發(fā)明中基于海量數(shù)據(jù)的視頻交互查詢系統(tǒng)的結構示意圖。
【具體實施方式】
[0025]為了使本發(fā)明的目的、技術方案及優(yōu)點更加清晰,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0026]一種基于海量數(shù)據(jù)的視頻交互查詢方法,應用于城市安防領域中,其海量數(shù)據(jù)主要來源于布設于城市各角落的監(jiān)控攝像頭。其中,監(jiān)控攝像頭在安裝時應將其地理位置、監(jiān)控范圍一并進行統(tǒng)一管理。
[0027]實施例1
[0028]一種基于海量數(shù)據(jù)的視頻交互查詢方法,主要包括如下步驟:[0029]在步驟SlOl中,基于視頻分析的空間定位方法,建立單個監(jiān)控攝像頭為中心的視頻對象空間定位坐標系。
[0030]在步驟S102中,基于所述空間定位坐標系,建立多個監(jiān)控攝像頭之間視頻數(shù)據(jù)的關聯(lián)。
[0031]所述關聯(lián)包括:
[0032](I)根據(jù)時間進行關聯(lián),如,用于展現(xiàn)下午6:00下班高峰期時個路段的交通運行情況;
[0033](2)根據(jù)地理信息進行關聯(lián),如,某一條街道上安裝有5個監(jiān)控攝像頭,可根據(jù)其監(jiān)控的范圍及相對距離等地理信息進行關聯(lián)。
[0034](3)根據(jù)視頻對象進行關聯(lián),如監(jiān)控到嫌疑車輛的視頻數(shù)據(jù)。即,基于運動連貫性的監(jiān)控以及基于邏輯關聯(lián)的監(jiān)控。根據(jù)視頻對象的關聯(lián)具體可參照專利CN201310105427.3,《一種基于空間信息的多視頻關聯(lián)監(jiān)控定位裝置與方法》,此處不再贅述。
[0035]在步驟S103中,在監(jiān)控攝像頭所拍攝的視頻數(shù)據(jù)中增加空間坐標。
[0036]在步驟S104中,將上述視頻數(shù)據(jù)進行實時壓縮。
[0037]在本步驟中,所述實時壓縮時的過程主要在攝像設備端進行,可以減小后續(xù)傳輸?shù)臄?shù)據(jù)量。
[0038]在步驟S105中,在壓縮過程中進行視頻語義特征的提取,并生成語義索引。
[0039]其中,所述視頻語義特征包括:低級語義特征,如視頻圖像顏色、紋理、形狀、速度等,高級語義特征,視頻中實體、概念、人物、事件等信息。
[0040]在步驟S106中,按照統(tǒng)一的坐標系、統(tǒng)一的視頻格式進行存儲,以形成海量數(shù)據(jù)的視頻庫。
[0041]統(tǒng)一的坐標系,是指基于某一特定范圍而形成的格式相同的二維或三維的空間坐標系,如某座城市的各經(jīng)緯度的二維坐標系。
[0042]所述統(tǒng)一的視頻格式至少包括拍攝時間、空間坐標、語義索引。
[0043]其中,從對數(shù)據(jù)內容的本質來看,本步驟即是從3W1H,甚至是5W1H的角度對視頻數(shù)據(jù)進行分析,即拍攝時間(When)、拍攝地點(Where)、索引關鍵詞(What)、數(shù)據(jù)內容(How)、以及索引的生成規(guī)則(Why、Who)進行提煉和設置。
[0044]視頻格式中還可以包括分辨率等。在本步驟中,進行存儲的過程中,如果有重復的視頻,可進行刪除或按照分辨率進行優(yōu)先級的排序。
[0045]其中空間坐標,可以是監(jiān)控攝像頭的絕對位置(經(jīng)緯度),也可以是相對位置(二個監(jiān)控攝像頭之間的距離等),或者是該經(jīng)緯度對應的標志性建筑物。
[0046]此外,需要補充說明的是:除數(shù)據(jù)內容外,其他可以為空。在檢索時,可以根據(jù)需求,自行定義或選擇是否檢索拍攝時間為空或拍攝地理位置為空的視頻數(shù)據(jù)內容。
[0047]在步驟S107中,輸入所述語義、空間坐標、拍攝時間中的至少一個作為關鍵詞進行查詢。
[0048]需要說明的是,在此處,空間坐標通常是以該空間坐標經(jīng)緯度對應的街道、建筑等作為查詢條件,此為行業(yè)內的通用作法,不再贅述。
[0049]如搜索“2014年4月I日”+ “深圳市南山區(qū)科苑路”+ “闖紅燈”,來查詢當天該空間坐標所處路段的違章情況;或者“某醫(yī)院”+ “急診車”,來查看其主要服務范圍,或出診時間的規(guī)律。
[0050]在步驟S108中,在所述海量數(shù)據(jù)的視頻庫中查找與所述關鍵詞相關聯(lián)的視頻數(shù)據(jù),并輸出查詢結果。
[0051]在本實施方式中,所述查詢結果,可以是多個獨立的視頻片段,也可以是根據(jù)喜好進行自動銜接播放的視頻集合體。
[0052]實施例2
[0053]請參閱圖2,所示為基于海量數(shù)據(jù)的視頻交互查詢系統(tǒng)的模塊圖。所述查詢系統(tǒng)包括:視頻數(shù)據(jù)采集端10、服務器20、及查詢終端30。
[0054]視頻數(shù)據(jù)采集端10,用于提供視頻數(shù)據(jù)的內容、拍攝時間、拍攝地點的位置信息。主要包括遍布于城市角落的多個監(jiān)控攝像頭11。
[0055]服務器20,用于對所述視頻數(shù)據(jù)進行統(tǒng)一管理,包括建立統(tǒng)一的視頻格式、將多來源視頻數(shù)據(jù)進行關聯(lián),及設置索引規(guī)則等。具體而言,服務器包括:
[0056]視頻數(shù)據(jù)庫21,用于為采集的視頻數(shù)據(jù)建立統(tǒng)一的坐標系、以及統(tǒng)一的視頻格式,并根據(jù)所述視頻格式中的部分內容進行關聯(lián)。
[0057]索弓I生成模塊22,用于設置索引規(guī)則,并提取視頻語義特征進行離線數(shù)據(jù)的檢驗。
[0058]所述視頻語義特征包括:低級語義特征,如視頻圖像顏色、紋理、形狀、速度等,高級語義特征,視頻中實體、概念、人物、事件等信息。
[0059]壓縮模塊23,用于將所述視頻數(shù)據(jù)進行實時壓縮,根據(jù)所述索引規(guī)則進行視頻語義特征的提取并生成語義索引。
[0060]查詢終端30,用于根據(jù)輸入所述語義、拍攝時間、空間坐標中的至少一者進行查詢,并輸出查詢結果。
[0061]在本實施方式中,所述查詢結果,可以是多個獨立的視頻片段,也可以是根據(jù)喜好進行自動銜接播放的視頻集合體。
[0062]有益效果:
[0063]I將原來無序管理的各種視頻數(shù)據(jù),通過添加坐標,建立空間索引,從而建立全市VIDEO GIS數(shù)據(jù)庫,形成了統(tǒng)一管理與高效利用機制;
[0064]2在此基礎上,對視頻數(shù)據(jù)進行基于“空間-內容”的雙重檢索,取代了大量繁瑣低效的人工行為,極大提高了城市安全管理的精度與效率;
[0065]3通過視頻壓縮與語義索引,極大減少了視頻數(shù)據(jù)量,并可永久保存視頻語義信息,避免視頻定期消除帶來的信息湮滅。
[0066]以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本【技術領域】的普通技術人員,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。
【權利要求】
1.一種基于海量數(shù)據(jù)的視頻交互查詢方法,應用于城市安防中,其特征在于,所述交互查詢方法包括如下步驟: 基于視頻分析的空間定位方法,建立單個監(jiān)控攝像頭為中心的視頻對象空間定位坐標系; 基于所述空間定位坐標系,建立多個監(jiān)控攝像頭之間視頻數(shù)據(jù)的關聯(lián); 在監(jiān)控攝像頭所拍攝的視頻數(shù)據(jù)中增加空間坐標; 將上述視頻數(shù)據(jù)進行實時壓縮; 在壓縮過程中進行視頻語義特征的提取,并生成語義索引; 按照統(tǒng)一的坐標系、統(tǒng)一的視頻格式進行存儲,以形成海量數(shù)據(jù)的視頻庫,所述統(tǒng)一的視頻格式至少包括拍攝時間、空間坐標、語義索引; 輸入所述語義、空間坐標、拍攝時間中的至少一個作為關鍵詞進行查詢; 在所述海量數(shù)據(jù)的視頻庫中查找與所述關鍵詞相關聯(lián)的視頻數(shù)據(jù),并輸出查詢結果。
2.如權利要求1所述的交互查詢方法,其特征在于,所述監(jiān)控攝像頭,在安裝時將其地理位置、監(jiān)控范圍一并存入服務器進行統(tǒng)一管理。
3.如權利要求1所述的交互查詢方法,其特征在于,所述的視頻格式中還包括分辨率。
4.如權利要求3所述的交互查詢方法,其特征在于,在進行所述存儲時,判斷是否有重復的視頻,如果有,則刪除分辨率較差的視頻數(shù)據(jù)或按照分辨率的大小進行優(yōu)先級的排序。
5.如權利要求1所述的交互查詢方法,其特征在于,所述查詢結果是多個獨立的視頻片段,或自動銜接播放的視頻集合。
6.一種基于海量數(shù)據(jù)的視頻交互查詢系統(tǒng),應用于城市安防中,其海量數(shù)據(jù)來源于由多個監(jiān)控攝像頭,其特征在于,所述交互查詢系統(tǒng)包括: 所述監(jiān)控攝像頭,用于提供視頻數(shù)據(jù)的內容、拍攝時間、拍攝地點; 服務器,用于對所述視頻數(shù)據(jù)進行統(tǒng)一管理,包括: 索引生成模塊,用于設置索引規(guī)則; 壓縮模塊,用于將所述視頻數(shù)據(jù)進行實時壓縮,根據(jù)所述索引規(guī)則進行視頻語義特征的提取并生成語義索引;及 視頻數(shù)據(jù)庫,用于為采集的視頻數(shù)據(jù)建立統(tǒng)一的坐標系、以及統(tǒng)一的視頻格式,并根據(jù)所述視頻格式中的部分內容進行關聯(lián);及 查詢終端,用于輸入所述語義、拍攝時間、空間坐標中的至少一者進行查詢,并輸出查詢結果。
7.如權利要求6所述的交互查詢系統(tǒng),其特征在于,所述空間坐標包括經(jīng)緯度、相對位置、或標志建筑物中的一者。
8.如權利要求6所述的交互查詢系統(tǒng),其特征在于,所述查詢結果是多個獨立的視頻片段,或自動銜接播放的視頻集合。
9.如權利要求6所述的交互查詢系統(tǒng),其特征在于,所述視頻數(shù)據(jù)采集端,還用于提供視頻數(shù)據(jù)的分辨率。
10.如權利要求9所述的交互查詢系統(tǒng),其特征在于,所述述視頻數(shù)據(jù)庫還用于在進行所述關聯(lián)時,判斷是否有內容相同的視頻數(shù)據(jù),如果有,則刪除分辨率較差的視頻數(shù)據(jù)。
【文檔編號】G06F17/30GK103984710SQ201410186144
【公開日】2014年8月13日 申請日期:2014年5月5日 優(yōu)先權日:2014年5月5日
【發(fā)明者】修文群 申請人:深圳先進技術研究院