專利名稱:一種基于運動目標的視頻內(nèi)容檢索方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻內(nèi)容檢索領(lǐng)域,尤其是一種基于運動目標的視頻內(nèi)容檢索方法及系統(tǒng)。
背景技術(shù):
隨著經(jīng)濟和信息技術(shù)的發(fā)展,人們對安全防范的需求也越來越高,視頻監(jiān)控作為安全防范領(lǐng)域的有效手段,應(yīng)用范圍越來越廣,應(yīng)用需求也在不斷地提高。在日常的應(yīng)用中,每天產(chǎn)生大量的視頻文件,如何從這些視頻文件中尋找用戶感興趣的內(nèi)容成為一個難題。采用人工方式進行檢索異常耗時費力,尤其在視頻數(shù)量急劇增加的情況下,這種方式越來越不可行。因此,采用信息技術(shù)自動檢索視頻內(nèi)容的研究成為當前的研究熱點,由于對視頻內(nèi)容的索引工作仍需要人工參與,同樣過于耗時。解決這個問題的根本途徑是根據(jù)視頻內(nèi)容的特點自動建立視頻內(nèi)容索引,在很多場合下,人們感興趣的是視頻中的運動目標,如果能對視頻中的運動目標進行自動索引,就能實現(xiàn)視頻內(nèi)容的快速檢索。目前,還沒有出現(xiàn)能夠?qū)σ曨l中的運動目標進行自動索引的技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的首要目的在于提供一種能夠?qū)σ曨l中的運動目標進行自動檢測和索引、 檢索速度快、準確性和魯棒性強的基于運動目標的視頻內(nèi)容檢索方法,該方法包括下列順序的步驟
(1)獲取視頻庫中所有視頻文件的初始圖像序列,對初始圖像序列進行分析處理,得到各個運動目標的位置,計算各個運動目標的視覺統(tǒng)計特征,并將各個運動目標的位置和視覺統(tǒng)計特征信息存儲到視頻索引數(shù)據(jù)庫內(nèi);
(2)用戶輸入待檢索對象,并從中選取待檢索運動目標,并計算出待檢索運動目標的視覺統(tǒng)計特征;
(3)在視頻索引數(shù)據(jù)庫中查找與待檢索運動目標最相似的視頻索引記錄;
(4)根據(jù)檢索到的視頻索引記錄,從視頻庫中選擇對應(yīng)的視頻片段,并在用戶監(jiān)控終端上顯示。本發(fā)明的另一目的在于提供一種基于運動目標的視頻內(nèi)容檢索系統(tǒng),包括 視頻索引模塊,從視頻庫中獲取所有視頻文件的圖像序列,利用背景減法對圖像序列
進行分析處理,獲取各個運動目標的位置及圖像,根據(jù)運動目標的圖像計算各個運動目標的視覺統(tǒng)計特征,在幀間進行運動目標跟蹤,并將各個運動目標的位置、視覺統(tǒng)計特征信息和各個運動目標的跟蹤結(jié)果存儲到視頻索引數(shù)據(jù)庫內(nèi);
檢索對象輸入模塊,用戶將待檢索對象輸入至檢索對象輸入模塊,并從待檢索對象中選取待檢索運動目標;視覺特征提取模塊,自動計算待檢索運動目標的視覺統(tǒng)計特征;
視頻檢索1旲塊,在視頻索引數(shù)據(jù)庫中查找與待檢索運動目標最相近的視頻索引記錄; 檢索結(jié)果輸出模塊,根據(jù)檢索得到的視頻索引記錄,在視頻庫中選擇對應(yīng)的視頻片段, 作為檢索結(jié)果在監(jiān)控終端上顯示。由上述技術(shù)方案可知,本發(fā)明基于運動目標對視頻內(nèi)容進行自動索引,并計算出運動目標的視覺統(tǒng)計特征,將視頻內(nèi)容檢索轉(zhuǎn)化為視覺統(tǒng)計特征的匹配。通過對視頻庫中所有視頻內(nèi)容中各個運動目標的檢測、跟蹤,可以實現(xiàn)視頻內(nèi)容的快速、自動索引,從而保證了視頻內(nèi)容檢索的高效性,提高了視頻檢索系統(tǒng)的適用性。本發(fā)明檢索速度快、準確性和魯棒性強。
圖I是本發(fā)明的工作流程圖2是本發(fā)明中視頻索引模塊的工作流程圖3是本發(fā)明的功能模塊示意圖4是本發(fā)明的視頻索引數(shù)據(jù)庫表結(jié)構(gòu)圖。
具體實施例方式一種基于運動目標的視頻內(nèi)容檢索方法,該方法包括下列順序的步驟(I)獲取視頻庫中所有視頻文件的初始圖像序列,對初始圖像序列進行分析處理,得到各個運動目標的位置,計算各個運動目標的視覺統(tǒng)計特征,并將各個運動目標的位置和視覺統(tǒng)計特征信息存儲到視頻索引數(shù)據(jù)庫內(nèi);(2)用戶輸入待檢索對象,并從中選取待檢索運動目標,并計算出待檢索運動目標的視覺統(tǒng)計特征;(3)在視頻索引數(shù)據(jù)庫中查找與待檢索運動目標最相似的視頻索引記錄;(4)根據(jù)檢索到的視頻索引記錄,從視頻庫中選擇對應(yīng)的視頻片段,并在用戶監(jiān)控終端上顯示。如圖I所示。所述的待檢索對象為待檢索的圖像或視頻片段。如果用戶輸入一幅圖像,則由用戶從圖像中選定待檢索對象區(qū)域;如果用戶輸入一段視頻,則由系統(tǒng)通過背景減法得到視頻中的所有運動目標,再由用戶從中選擇待檢索運動目標。如圖1、2所示,視頻索引模塊從視頻庫中獲取所有視頻文件的圖像序列,利用背景減法對圖像序列進行分析處理,獲取各個運動目標的位置及圖像,根據(jù)運動目標的圖像計算各個運動目標的視覺統(tǒng)計特征,在幀間進行運動目標跟蹤,并將各個運動目標的位置、 視覺統(tǒng)計特征信息和各個運動目標的跟蹤結(jié)果存儲到視頻索引數(shù)據(jù)庫內(nèi);用戶將待檢索對象輸入至檢索對象輸入模塊,并從待檢索對象中選取待檢索運動目標,視覺特征提取模塊自動計算待檢索運動目標的視覺統(tǒng)計特征,具體包括圓形度、長寬比等形狀特征,顏色均值、顏色直方圖等顏色特征,熵和灰度共生矩等紋理特征,最后得到運動目標的索引信息, 包括運動目標ID、幀ID、在幀圖像中的位置、視覺統(tǒng)計特征向量、視頻ID等信息,并保存到視頻索引庫中;視頻檢索1吳塊在視頻索引數(shù)據(jù)庫中查找與待檢索運動目標最相近的視頻索引記錄;檢索結(jié)果輸出模塊根據(jù)檢索得到的視頻索引記錄,在視頻庫中選擇對應(yīng)的視頻片段,作為檢索結(jié)果在監(jiān)控終端上顯示。如圖2所示,采用背景減法檢測運動目標的公式如下
權(quán)利要求
1.一種基于運動目標的視頻內(nèi)容檢索方法,該方法包括下列順序的步驟(1)獲取視頻庫中所有視頻文件的初始圖像序列,對初始圖像序列進行分析處理,得到各個運動目標的位置,計算各個運動目標的視覺統(tǒng)計特征,并將各個運動目標的位置和視覺統(tǒng)計特征信息存儲到視頻索引數(shù)據(jù)庫內(nèi);(2)用戶輸入待檢索對象,并從中選取待檢索運動目標,并計算出待檢索運動目標的視覺統(tǒng)計特征;(3)在視頻索引數(shù)據(jù)庫中查找與待檢索運動目標最相似的視頻索引記錄;(4)根據(jù)檢索到的視頻索引記錄,從視頻庫中選擇對應(yīng)的視頻片段,并在用戶監(jiān)控終端上顯示。
2.根據(jù)權(quán)利要求I所述的基于運動目標的視頻內(nèi)容檢索方法,其特征在于所述的待檢索對象為待檢索的圖像或視頻片段。
3.根據(jù)權(quán)利要求I所述的基于運動目標的視頻內(nèi)容檢索方法,其特征在于視頻索引模塊從視頻庫中獲取所有視頻文件的圖像序列,利用背景減法對圖像序列進行分析處理, 獲取各個運動目標的位置及圖像,根據(jù)運動目標的圖像計算各個運動目標的視覺統(tǒng)計特征,在幀間進行運動目標跟蹤,并將各個運動目標的位置、視覺統(tǒng)計特征信息和各個運動目標的跟蹤結(jié)果存儲到視頻索引數(shù)據(jù)庫內(nèi);用戶將待檢索對象輸入至檢索對象輸入模塊,并從待檢索對象中選取待檢索運動目標,視覺特征提取模塊自動計算待檢索運動目標的視覺統(tǒng)計特征;視頻檢索模塊在視頻索引數(shù)據(jù)庫中查找與待檢索運動目標最相近的視頻索引記錄;檢索結(jié)果輸出模塊根據(jù)檢索得到的視頻索引記錄,在視頻庫中選擇對應(yīng)的視頻片段,作為檢索結(jié)果在監(jiān)控終端上顯示。
4.根據(jù)權(quán)利要求3所述的基于運動目標的視頻內(nèi)容檢索方法,其特征在于采用背景減法檢測運動目標的公式如下
5.根據(jù)權(quán)利要求3所述的基于運動目標的視頻內(nèi)容檢索方法,其特征在于在獲得運動目標的初始位置后,隨著運動目標位置的變化,通過計算運動目標的質(zhì)心在下一幀的位移量,得到與前一幀運動目標相對位移最小的運動目標,將其視為同一運動目標,從而實現(xiàn)運動目標的跟蹤,算法如下設(shè)圖像中某運動目標在t-Ι時刻的質(zhì)心坐標為(xt-l,yt-l),則在t時刻,該運動目標的質(zhì)心坐標為(xt. yt) = {(xt,k> yt,k) min (sqrt ((xk; t-xt_!)2+ (yk; t-yt_!)2), k=l, 2, . . . }其中,(xk,t. yk’t)為t時刻第k個運動目標的質(zhì)心坐標,在將運動目標的跟蹤信息保存到視頻索引數(shù)據(jù)庫時,不同幀的同一運動目標具有相同的ID,從而將跟蹤結(jié)果保存下來。
6.根據(jù)權(quán)利要求3所述的基于運動目標的視頻內(nèi)容檢索方法,其特征在于視頻檢索模塊基于統(tǒng)計學(xué)習(xí)方法進行運動目標的特征比對,從中查找與待檢索運動目標最相近的視頻索引記錄,運動目標的特征比對采用支持向量機模型來完成。
7.根據(jù)權(quán)利要求4所述的基于運動目標的視頻內(nèi)容檢索方法,其特征在于對通過背景減法獲得的前景圖像進行預(yù)處理,首先對前景圖像進行形態(tài)學(xué)腐蝕,去除前景圖像中的噪聲,然后對前景圖像進行形態(tài)學(xué)膨脹,消除前景圖像中的孔洞。
8.一種基于運動目標的視頻內(nèi)容檢索系統(tǒng),包括視頻索引模塊,從視頻庫中獲取所有視頻文件的圖像序列,利用背景減法對圖像序列進行分析處理,獲取各個運動目標的位置及圖像,根據(jù)運動目標的圖像計算各個運動目標的視覺統(tǒng)計特征,在幀間進行運動目標跟蹤,并將各個運動目標的位置、視覺統(tǒng)計特征信息和各個運動目標的跟蹤結(jié)果存儲到視頻索引數(shù)據(jù)庫內(nèi);檢索對象輸入模塊,用戶將待檢索對象輸入至檢索對象輸入模塊,并從待檢索對象中選取待檢索運動目標;視覺特征提取模塊,自動計算待檢索運動目標的視覺統(tǒng)計特征;視頻檢索1旲塊,在視頻索引數(shù)據(jù)庫中查找與待檢索運動目標最相近的視頻索引記錄;檢索結(jié)果輸出模塊,根據(jù)檢索得到的視頻索引記錄,在視頻庫中選擇對應(yīng)的視頻片段, 作為檢索結(jié)果在監(jiān)控終端上顯示。
9.根據(jù)權(quán)利要求8所述的基于運動目標的視頻內(nèi)容檢索系統(tǒng),其特征在于所述的視頻索引模塊包括運動目標檢測模塊,獲取視頻庫中所有視頻文件的初始圖像序列,根據(jù)初始圖像序列, 采用背景減法檢測得到各個運動目標的位置;運動目標跟蹤模塊,在幀間進行運動目標跟蹤,并將運動目標的跟蹤結(jié)果保存在視頻索引庫中;視頻索引數(shù)據(jù)庫,存儲各個運動目標的位置、視覺統(tǒng)計特征信息和各個運動目標的跟蹤結(jié)果。
全文摘要
本發(fā)明涉及基于運動目標的視頻內(nèi)容檢索方法,該方法包括對視頻庫中所有視頻文件的初始圖像序列進行分析處理,得到各個運動目標的位置,計算各個運動目標的視覺統(tǒng)計特征,并存儲到視頻索引數(shù)據(jù)庫內(nèi);用戶輸入待檢索對象,并從中選取待檢索運動目標,計算出待檢索運動目標的視覺統(tǒng)計特征;查找與待檢索運動目標最相似的視頻索引記錄;根據(jù)檢索到的視頻索引記錄,從視頻庫中選擇對應(yīng)的視頻片段并顯示。本發(fā)明還公開了一種基于運動目標的視頻內(nèi)容檢索系統(tǒng)。本發(fā)明通過對視頻庫中所有視頻內(nèi)容中各個運動目標的檢測、跟蹤,可以實現(xiàn)視頻內(nèi)容的快速、自動索引,從而保證了視頻內(nèi)容檢索的高效性,提高了視頻檢索系統(tǒng)的適用性。
文檔編號G06T7/20GK102609548SQ20121011598
公開日2012年7月25日 申請日期2012年4月19日 優(yōu)先權(quán)日2012年4月19日
發(fā)明者李俊 申請人:李俊