一種檢索視頻的方法及裝置的制造方法
【專利摘要】本發(fā)明實施例提供一種檢索視頻的方法及裝置,用以解決現(xiàn)有技術(shù)中檢索視頻時計算量大、檢索效率低的問題,減小計算量,提高檢索視頻的效率。所述檢索視頻的方法,包括:接收用戶輸入的用于檢索視頻的原始圖像;確定所述原始圖像的元數(shù)據(jù),分別計算所述原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀圖像的元數(shù)據(jù)的交互信息量,得到多個交互信息量,利用預設規(guī)則從所述多個交互信息量中確定目標交互信息量,并將所述目標交互信息量所對應元數(shù)據(jù)的幀圖像所在的視頻確定為所述原始圖像所在的視頻;其中,所述視頻元數(shù)據(jù)庫中存儲多個視頻的元數(shù)據(jù),每個視頻的元數(shù)據(jù)包括該視頻的視頻摘要中多幀圖像的元數(shù)據(jù)。
【專利說明】
一種檢索視頻的方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明實施例涉及視頻技術(shù)領(lǐng)域,尤其涉及一種檢索視頻的方法及裝置。
【背景技術(shù)】
[0002] 隨著計算機和通信技術(shù)的高速發(fā)展,視頻資源的數(shù)量也隨之迅速增加,隨著視頻 資源的積累,如何在海量視頻資源中快速檢索出所需的視頻顯得至關(guān)重要。由于視頻數(shù)據(jù) 量大,且具有時間及空間結(jié)構(gòu),其表達、存儲、傳輸、組織具有更大的難度,只有合理地組織 視頻數(shù)據(jù),才能有效地瀏覽和檢索。
[0003] 現(xiàn)有的視頻圖像檢索技術(shù),大多是基于兩幅圖像的整個信息進行比較,也即在進 行檢索時,將用戶輸入的原始圖像的顏色直方圖與視頻中每幀圖像的顏色直方圖整個進行 比較,計算量大,另外,由于用戶通常提供的是一幅圖片中的一個部分,因此,在進行檢索 時,其他無關(guān)信息會影響計算量,進而影響判斷圖片相關(guān)性的準確性,影響檢索結(jié)果。
[0004] 綜上所述,現(xiàn)有技術(shù)在檢索視頻時,基于兩幅圖像的整個信息進行比較,計算量 大,檢索效率低。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實施例提供一種檢索視頻的方法及裝置,用以解決現(xiàn)有技術(shù)中檢索視頻時 計算量大、檢索效率低的問題,減小計算量,提高檢索視頻的效率。
[0006] 本發(fā)明實施例提供一種檢索視頻的方法,該方法包括:接收用戶輸入的用于檢索 視頻的原始圖像;確定所述原始圖像的元數(shù)據(jù),分別計算所述原始圖像的元數(shù)據(jù)與視頻元 數(shù)據(jù)庫中每幀圖像的元數(shù)據(jù)的交互信息量,得到多個交互信息量,利用預設規(guī)則從所述多 個交互信息量中確定目標交互信息量,并將所述目標交互信息量所對應元數(shù)據(jù)的幀圖像所 在的視頻確定為所述原始圖像所在的視頻;其中,所述視頻元數(shù)據(jù)庫中存儲多個視頻的元 數(shù)據(jù),每個視頻的元數(shù)據(jù)包括該視頻的視頻摘要中多幀圖像的元數(shù)據(jù)。
[0007] 本發(fā)明實施例提供一種檢索視頻的裝置,該裝置包括:接收單元,用于接收用戶輸 入的用于檢索視頻的原始圖像;處理單元,用于確定所述原始圖像的元數(shù)據(jù),分別計算所述 原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀圖像的元數(shù)據(jù)的交互信息量,得到多個交互信息 量,利用預設規(guī)則從所述多個交互信息量中確定目標交互信息量,并將所述目標交互信息 量所對應元數(shù)據(jù)的幀圖像所在的視頻確定為所述原始圖像所在的視頻;其中,所述視頻元 數(shù)據(jù)庫中存儲多個視頻的元數(shù)據(jù),每個視頻的元數(shù)據(jù)包括該視頻的視頻摘要中多幀圖像的 元數(shù)據(jù)。
[0008] 本發(fā)明實施例提供的一種檢索視頻的方法及裝置,接收用戶輸入的用于檢索視頻 的原始圖像,確定原始圖像的元數(shù)據(jù),分別計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀 圖像的元數(shù)據(jù)的交互信息量,得到多個交互信息量,由于視頻元數(shù)據(jù)庫中存儲多個視頻的 元數(shù)據(jù),每個視頻的元數(shù)據(jù)包括該視頻的視頻摘要中多幀圖像的元數(shù)據(jù),因此,在計算得到 多個交互信息量之后,利用預設規(guī)則從多個交互信息量中確定目標交互信息量,將目標交 互信息量所對應元數(shù)據(jù)的幀圖像所在的視頻確定為原始圖像所在的視頻,與現(xiàn)有技術(shù)中基 于兩幅圖像的整個信息進行比較,計算量大,且檢索結(jié)果不準確相比,通過構(gòu)造元數(shù)據(jù),計 算原始圖像的元數(shù)據(jù)與每個視頻的視頻摘要中每幀圖像的元數(shù)據(jù)的交互信息量,進而根據(jù) 交互信息量確定原始圖像所在的視頻,減小了計算量,提高檢索視頻的效率。
【附圖說明】
[0009] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根 據(jù)這些附圖獲得其他的附圖。
[0010] 圖1為本發(fā)明實施例提供的一種檢索視頻的方法的示意流程圖;
[0011] 圖2為本發(fā)明實施例提供的一種計算視頻的視頻元數(shù)據(jù)的示意流程圖;
[0012] 圖3為本發(fā)明實施例提供的一種檢索視頻的方法的具體流程的示意流程圖;
[0013] 圖4為本發(fā)明實施例提供的一種檢索視頻的裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0014] 為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0015] 首先對本發(fā)明實施例中提到的一些名詞進行解釋:
[0016]本發(fā)明實施例中提到的灰度直方圖(Histogram),相機上顯示的直方圖和位圖圖 像處理軟件(Ph〇t〇sh〇p,PS)使用的直方圖都是灰度直方圖,從圖形上說,它是一個二維圖, 用坐標表示,橫坐標表示圖像中各個像素點的灰度級,0到255個級別,縱坐標為各個灰度級 上像素點出現(xiàn)的次數(shù)或概率?;叶戎狈綀D具有一下特點:
[0017] (1)灰度直方圖表征了圖像的一維信息,只反映圖像中像素不同灰度值出現(xiàn)的次 數(shù)(或頻數(shù))而未反映像素所在位置;
[0018] (2)灰度直方圖與圖像之間的關(guān)系是多對一的映射關(guān)系,一幅圖像唯一確定出與 之對應的灰度直方圖,但不同圖像可能有相同的灰度直方圖。
[0019] (3)子圖灰度直方圖之和為整圖的灰度直方圖。
[0020] 本發(fā)明實施例中提到的概率密度函數(shù)可以由圖像的灰度直方圖中各個灰度值上 像素點的統(tǒng)計次數(shù)除以圖像總的像素個數(shù)得到。概率是指事件隨機發(fā)生的機率,對于均勻 分布函數(shù),概率密度等于一段區(qū)間(事件的取值范圍)的概率除以該段區(qū)間的長度,它的值 是非負的,可以很大也可以很小。單純的講概率密度沒有實際的意義,它必須有確定的有界 區(qū)間為前提,可以把概率密度看成是縱坐標,區(qū)間看成是橫坐標,概率密度對區(qū)間的積分就 是面積,而這個面積就是事件在這個區(qū)間發(fā)生的概率,所有面積的和為1。所以單獨分析一 個點的概率密度是沒有任何意義的,它必須要有區(qū)間作為參考和對比。
[0021] 元數(shù)據(jù)是具有描述、解釋、定位信息資源功能的結(jié)構(gòu)化信息,即元數(shù)據(jù)是描述數(shù)據(jù) 的數(shù)據(jù),或者描述信息的信息。本發(fā)明實施例中利用與視頻相關(guān)的元數(shù)據(jù)描述視頻的主要 內(nèi)容,從視頻中提取信息生成元數(shù)據(jù),在進行檢索時,使用元數(shù)據(jù)進行比較。
[0022]本發(fā)明實施例提供一種檢索視頻的方法,如圖1所示,該方法包括:
[0023]步驟11,接收用戶輸入的用于檢索視頻的原始圖像;
[0024]步驟13,確定原始圖像的元數(shù)據(jù),分別計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中 每幀圖像的元數(shù)據(jù)的交互信息量,得到多個交互信息量,利用預設規(guī)則從多個交互信息量 中確定目標交互信息量,并將目標交互信息量所對應元數(shù)據(jù)的幀圖像所在的視頻確定為原 始圖像所在的視頻;其中,視頻元數(shù)據(jù)庫中存儲多個視頻的元數(shù)據(jù),每個視頻的元數(shù)據(jù)包括 該視頻的視頻摘要中多幀圖像的元數(shù)據(jù)。
[0025]本發(fā)明實施例提供的方法中,接收用戶輸入的用于檢索視頻的原始圖像,確定原 始圖像的元數(shù)據(jù),分別計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀圖像的元數(shù)據(jù)的交互 信息量,得到多個交互信息量,由于視頻元數(shù)據(jù)庫中存儲多個視頻的元數(shù)據(jù),每個視頻的元 數(shù)據(jù)包括該視頻的視頻摘要中多幀圖像的元數(shù)據(jù),因此,在計算得到多個交互信息量之后, 利用預設規(guī)則從多個交互信息量中確定目標交互信息量,將目標交互信息量所對應元數(shù)據(jù) 的幀圖像所在的視頻確定為原始圖像所在的視頻,與現(xiàn)有技術(shù)中基于兩幅圖像的整個信息 進行比較,計算量大,且檢索結(jié)果不準確相比,通過構(gòu)造元數(shù)據(jù),計算原始圖像的元數(shù)據(jù)與 每個視頻的視頻摘要中每幀圖像的元數(shù)據(jù)的交互信息量,進而根據(jù)交互信息量確定原始圖 像所在的視頻,減小了計算量,提高檢索視頻的效率。
[0026]具體實施時,在計算得到多個交互信息量之后,利用預設規(guī)則從多個交互信息量 中確定目標交互信息量,并將目標交互信息量所對應元數(shù)據(jù)的幀圖像所在的視頻確定為原 始圖像所在的視頻,需要說明的是,目標交互信息量可以是一個,也可以是多個,根據(jù)預設 規(guī)則的不同,確定出的目標交互信息量也有不同,例如:預設規(guī)則是取最大值時,能確定出 一個目標交互信息量,但若預設規(guī)則是交互信息量的值大于預設閾值(根據(jù)經(jīng)驗值設定,例 如:90),能確定出多個目標交互信息量。當然,本領(lǐng)域技術(shù)人員應當理解的是,預設規(guī)則還 可以是其它規(guī)則,例如:將交互信息量按大小排序,取預設數(shù)量個交互信息量作為目標交互 信息量。較為優(yōu)選地,為了提高檢索視頻的準確率,預設規(guī)則為取最大值,也即在計算得到 多個交互信息量之后,確定多個交互信息量中的最大交互信息量,并將最大交互信息量所 對應元數(shù)據(jù)的幀圖像所在的視頻確定為原始圖像所在的視頻。
[0027] 具體實施時,任一圖像的元數(shù)據(jù)包括該圖像的灰度直方圖和概率密度函數(shù),概率 密度函數(shù)為該圖像灰度直方圖中各個灰度值上像素點的統(tǒng)計數(shù)量與該圖像的總像素點數(shù) 之比。
[0028] 值得說明的是,在計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀圖像的元數(shù)據(jù)的 交互信息量時,可以基于整張圖像的元數(shù)據(jù)計算交互信息量,但是由于用戶通常提供的只 是一張圖像的一部分,因此,為了避免圖像中其它無關(guān)信息的影響,可以將圖像的元數(shù)據(jù)分 為主題部分的元數(shù)據(jù)和背景部分的元數(shù)據(jù),具體來說:
[0029] 在一種可能的實施方式中,本發(fā)明實施例提供的方法中,任一圖像的元數(shù)據(jù)包括: 該圖像主題部分的元數(shù)據(jù)以及該圖像背景部分的元數(shù)據(jù);計算原始圖像的元數(shù)據(jù)與視頻元 數(shù)據(jù)庫中每幀圖像的元數(shù)據(jù)的交互信息量,包括:計算原始圖像主題部分的元數(shù)據(jù)與視頻 元數(shù)據(jù)庫中每幀圖像主題部分的元數(shù)據(jù)的交互信息量,和/或計算原始圖像背景部分的元 數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀圖像背景部分的元數(shù)據(jù)的交互信息量。
[0030] 本發(fā)明實施例提供的方法中,將原始圖像和視頻元數(shù)據(jù)庫中每幀圖像均劃分成由 主題部分和背景部分兩部分組成,根據(jù)用戶提供的原始圖像,選取其中一個或者全部計算 交互信息量,并根據(jù)交互信息量確定原始圖像所在的視頻,避免了檢索視頻時無關(guān)信息的 影響,提高了檢索視頻的準確性,同時,由于選取其中的一個或全部計算交互信息量,進一 步減小了計算量。
[0031] 在一種可能的實施方式中,本發(fā)明實施例提供的方法中,當任一圖像的元數(shù)據(jù)包 括:圖像主題部分的元數(shù)據(jù)以及圖像背景部分的元數(shù)據(jù)時,在確定原始圖像的元數(shù)據(jù)之前, 該方法還包括:利用預設比例參數(shù)將原始圖像分為主題部分和背景部分;確定原始圖像的 元數(shù)據(jù),包括:確定原始圖像的主題部分的元數(shù)據(jù)以及原始圖像的背景部分的元數(shù)據(jù)。 [0032]具體實施時,將圖像中的場景作為該幀圖像的背景部分,將人物的面部作為該幀 圖像的主題部分,每個人物都有獨特的特征,如人臉圖像,目前人臉檢測算法已日益成熟。 面部識別可用現(xiàn)在較為成熟的貝葉斯可區(qū)分特征(Bayesian Discriminating Features, BDF)的方法來檢測人臉,在該算法中,首先對輸入圖像進行一維Harr小波變換后投影到水 平和垂直坐標上,得到輸入圖像的概率統(tǒng)計信息,再運用貝葉斯分類器進行人臉檢測,通過 該方法檢測人物的面部特征,并利用預設比例參數(shù)對檢測出的目標區(qū)域進行向外擴展,從 而分割出圖像中的主題部分,分割主題部分之后剩下的就是背景部分。其中,預設比例參數(shù) 可以根據(jù)經(jīng)驗值設定,例如:預設比例參數(shù)取值為0.29。
[0033] 具體實施時,在檢索視頻時,首先需要建立視頻元數(shù)據(jù)庫,視頻元數(shù)據(jù)庫中存儲多 個視頻的元數(shù)據(jù),每個視頻的元數(shù)據(jù)包括該視頻的視頻摘要中多幀圖像的元數(shù)據(jù),在建立 視頻元數(shù)據(jù)庫時,首先需要建立視頻的視頻摘要,視頻摘要是對視頻中的關(guān)鍵幀進行合理 排序(例如:按時間順序排列)得到的鏡頭級的視頻摘要,建立視頻摘要的方法可以采用現(xiàn) 有技術(shù)中的方法,此處不再贅述。其中,關(guān)鍵幀代表鏡頭的主要內(nèi)容。
[0034] 對于任一視頻,建立視頻摘要之后,生成視頻元數(shù)據(jù)的步驟,如圖2所示,包括: [0035]步驟21,讀取視頻摘要幀序列中的第i幀,其中,i初始化值為1,并且i < N,N為視頻 摘要的總幀數(shù),N= 1000;
[0036] 步驟23,利用預設比例參數(shù)將該幀劃分為主題部分和背景部分,預設比例參數(shù)可 以根據(jù)經(jīng)驗值設定,例如:預設比例參數(shù)取值為〇. 29;
[0037] 步驟25,分別計算主題部分和背景部分的灰度直方圖和概率密度函數(shù);
[0038]步驟27,將得到的計算結(jié)果存入視頻元數(shù)據(jù)庫中。
[0039] 為更方便地管理和使用視頻元數(shù)據(jù)庫中存儲的每幀圖像的元數(shù)據(jù),對每個視頻的 元數(shù)據(jù)進行結(jié)構(gòu)化處理。具體實施時,定義圖像的灰度直方圖和概率密度函數(shù)為該圖像的 元數(shù)據(jù),保存元數(shù)據(jù)的格式描述為:視頻元數(shù)據(jù)結(jié)構(gòu)由文件序列號、視頻文件名、背景數(shù)據(jù) 結(jié)構(gòu)和主題數(shù)據(jù)結(jié)構(gòu)4個部分組成,其中,背景數(shù)據(jù)結(jié)構(gòu)由背景名和背景元數(shù)據(jù)構(gòu)成,主題 數(shù)據(jù)結(jié)構(gòu)由主題名和主題元數(shù)據(jù)構(gòu)成,背景元數(shù)據(jù)和主題元數(shù)據(jù)由視頻摘要中每幀圖像的 灰度直方圖和概率密度函數(shù)組成。
[0040] 將每個視頻的元數(shù)據(jù)結(jié)構(gòu)化處理后,利用元數(shù)據(jù)來計算用戶輸入的原始圖像與視 頻元數(shù)據(jù)庫中每幀圖像的背景部分和/或主題部分的交互信息量,通過交互信息量判斷二 者的相似性,進而利用預設規(guī)則從計算得到的多個交互信息量中確定目標交互信息量,并 將目標交互信息量所對應元數(shù)據(jù)的幀圖像所在的視頻,確定為用戶輸入的原始圖像所在的 視頻,具體實施時,原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中任一幀圖像的元數(shù)據(jù)的交互信息 量,等于原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中該幀圖像的元數(shù)據(jù)在紅R、綠G、藍B分量上的 交互信息量之和,其中,原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中該幀圖像的元數(shù)據(jù)在任一分 量上的奪互信息量誦討如下公式計筧得到:
[0041]
[0042] 兵屮,1衣不父且1目,g、M,F(xiàn)A〈a;衣不保妬囹傢仕該力、重上的概率密度函數(shù),PB(b)表 示視頻元數(shù)據(jù)庫中該幀圖像在該分量上的概率密度函數(shù),Pab (a,b)表示原始圖像和視頻元 數(shù)據(jù)庫中該幀圖像在該分量上的聯(lián)合概率密度函數(shù)。以R分量為例,PA(a)表示原始圖像在R 分量上的概率密度函數(shù),Pb (b)表示視頻元數(shù)據(jù)庫中該幀圖像在R分量上的概率密度函數(shù), PAB(a,b)表示原始圖像和視頻元數(shù)據(jù)庫中該幀圖像在R分量上的聯(lián)合概率密度函數(shù)。
[0043]作為較為具體的實施時,本發(fā)明實施例提供的檢索視頻的方法,以計算原始圖像 的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中第i幀圖像的元數(shù)據(jù)的交互信息量為例,基于元數(shù)據(jù)檢索視頻 的步驟,如圖3所示,包括:
[0044]步驟31,接收用戶輸入用于檢索視頻的原始圖像;
[0045] 步驟32,計算原始圖像的元數(shù)據(jù),即計算原始圖像的灰度直方圖和概率密度函數(shù);
[0046] 步驟33,計算原始圖像與視頻元數(shù)據(jù)庫中第i幀圖像的聯(lián)合概率密度函數(shù),具體來 說,根據(jù)原始圖像的灰度直方圖以及第i幀圖像的灰度直方圖計算聯(lián)合概率密度;
[0047] 步驟34,計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中第i幀圖像的元數(shù)據(jù)在R、G、B分 量上的交互信息量;
[0048]步驟35,計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中第i幀圖像的元數(shù)據(jù)的交互信 息量,具體來說,原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中第i幀圖像的元數(shù)據(jù)的交互信息量, 等于原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中第i幀圖像的元數(shù)據(jù)在R、G、B分量上的交互信息 量之和;
[0049] 步驟36,通過計算得到的交互信息量,判斷原始圖像與第i幀圖像的相關(guān)性,判斷 是否檢索完成。具體來說,當計算得到多個交互信息量時,利用預設規(guī)則從多個交互信息量 中確定目標交互信息量,例如:預設規(guī)則為取最大值,則取多個交互信息量中最大交互信息 量所對應元數(shù)據(jù)的幀圖像作為檢索到的相似性最大的圖像,將多個交互信息量中最大交互 信息量所對應元數(shù)據(jù)的幀圖像所在的視頻確定為用戶輸入的原始圖像所在的視頻。
[0050] 本發(fā)明實施例提供一種檢索視頻的裝置,如圖4所示,該裝置包括:接收單元41,用 于接收用戶輸入的用于檢索視頻的原始圖像;處理單元43,用于確定原始圖像的元數(shù)據(jù),分 別計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀圖像的元數(shù)據(jù)的交互信息量,得到多個交 互信息量,利用預設規(guī)則從多個交互信息量中確定目標交互信息量,并將目標交互信息量 所對應元數(shù)據(jù)的幀圖像所在的視頻確定為原始圖像所在的視頻;其中,視頻元數(shù)據(jù)庫中存 儲多個視頻的元數(shù)據(jù),每個視頻的元數(shù)據(jù)包括該視頻的視頻摘要中多幀圖像的元數(shù)據(jù)。
[0051] 本發(fā)明實施例提供的裝置中,接收用戶輸入的用于檢索視頻的原始圖像,確定原 始圖像的元數(shù)據(jù),分別計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀圖像的元數(shù)據(jù)的交互 信息量,得到多個交互信息量,由于視頻元數(shù)據(jù)庫中存儲多個視頻的元數(shù)據(jù),每個視頻的元 數(shù)據(jù)包括該視頻的視頻摘要中多幀圖像的元數(shù)據(jù),因此,在計算得到多個交互信息量之后, 利用預設規(guī)則從多個交互信息量中確定目標交互信息量,將目標交互信息量所對應元數(shù)據(jù) 的幀圖像所在的視頻確定為原始圖像所在的視頻,與現(xiàn)有技術(shù)中基于兩幅圖像的整個信息 進行比較,計算量大,且檢索結(jié)果不準確相比,通過構(gòu)造元數(shù)據(jù),計算原始圖像的元數(shù)據(jù)與 每個視頻的視頻摘要中每幀圖像的元數(shù)據(jù)的交互信息量,進而根據(jù)交互信息量確定原始圖 像所在的視頻,減小了計算量,提高檢索視頻的效率。
[0052] 在一種可能的實施方式中,本發(fā)明實施例提供的裝置中,任一圖像的元數(shù)據(jù)包括: 該圖像主題部分的元數(shù)據(jù)以及該圖像背景部分的元數(shù)據(jù);處理單元43計算原始圖像的元數(shù) 據(jù)與視頻元數(shù)據(jù)庫中每幀圖像的元數(shù)據(jù)的交互信息量,具體用于:計算原始圖像主題部分 的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀圖像主題部分的元數(shù)據(jù)的交互信息量,和/或計算原始圖 像背景部分的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀圖像背景部分的元數(shù)據(jù)的交互信息量。
[0053] 在一種可能的實施方式中,本發(fā)明實施例提供的裝置中,當任一圖像的元數(shù)據(jù)包 括:圖像主題部分的元數(shù)據(jù)以及圖像背景部分的元數(shù)據(jù)時,處理單元43在確定原始圖像的 元數(shù)據(jù)之前,還用于:利用預設比例參數(shù)將原始圖像分為主題部分和背景部分;處理單元43 確定原始圖像的元數(shù)據(jù),具體應用:確定原始圖像的主題部分的元數(shù)據(jù)以及原始圖像的背 景部分的元數(shù)據(jù)。
[0054] 在一種可能的實施方式中,本發(fā)明實施例提供的裝置中,原始圖像的元數(shù)據(jù)與視 頻元數(shù)據(jù)庫中任一幀圖像的元數(shù)據(jù)的交互信息量,等于原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫 中該幀圖像的元數(shù)據(jù)在紅R、綠G、藍B分量上的交互信息量之和,其中,處理單元43通過如下 公式計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中該幀圖像的元數(shù)據(jù)在任一分量上的交互信
息量:
[0055]
[0056] 共中,1表不父I信思重,PaU)表不原妬圖傢在該分重上的概率密度函數(shù),PB(b)表 示視頻元數(shù)據(jù)庫中該幀圖像在該分量上的概率密度函數(shù),Pab (a,b)表示原始圖像和視頻元 數(shù)據(jù)庫中該幀圖像在該分量上的聯(lián)合概率密度函數(shù)。
[0057] 在一種可能的實施方式中,本發(fā)明實施例提供的裝置中,任一圖像的元數(shù)據(jù)包括 該圖像的灰度直方圖和概率密度函數(shù),概率密度函數(shù)為該圖像灰度直方圖中各個灰度值上 像素點的統(tǒng)計數(shù)量與該圖像的總像素點數(shù)之比。
[0058] 本發(fā)明實施例提供的一種檢索視頻的裝置,可以集成在視頻軟件中,用于根據(jù)用 戶輸入的原始圖像檢索視頻,其中,接收單元41可以采用接收機或信號接收器,處理單元43 可以采用CPU處理器等。
[0059] 本發(fā)明實施例提供的一種檢索視頻的方法及裝置,接收用戶輸入的用于檢索視頻 的原始圖像,確定原始圖像的元數(shù)據(jù),分別計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每幀 圖像的元數(shù)據(jù)的交互信息量,得到多個交互信息量,由于視頻元數(shù)據(jù)庫中存儲多個視頻的 元數(shù)據(jù),每個視頻的元數(shù)據(jù)包括該視頻的視頻摘要中多幀圖像的元數(shù)據(jù),因此,在計算得到 多個交互信息量之后,利用預設規(guī)則從多個交互信息量中確定目標交互信息量,將目標交 互信息量所對應元數(shù)據(jù)的幀圖像所在的視頻確定為原始圖像所在的視頻,通過構(gòu)造元數(shù) 據(jù),計算原始圖像的元數(shù)據(jù)與每個視頻的視頻摘要中每幀圖像的元數(shù)據(jù)的交互信息量,進 而根據(jù)交互信息量確定原始圖像所在的視頻,減小了計算量,提高檢索視頻的效率。
[0060] 以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可 以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單 元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上。可以根據(jù)實際的需要選擇其 中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性 的勞動的情況下,即可以理解并實施。
[0061] 通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實施方式可 借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬件?;谶@樣的理解,上 述技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該 計算機軟件產(chǎn)品可以存儲在計算機可讀存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指 令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行各個實施 例或者實施例的某些部分所述的方法。
[0062] 最后應說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管 參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應當理解:其依然可 以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換; 而這些修改或者替換,并不使相應技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和 范圍。
【主權(quán)項】
1. 一種檢索視頻的方法,其特征在于,該方法包括: 接收用戶輸入的用于檢索視頻的原始圖像; 確定所述原始圖像的元數(shù)據(jù),分別計算所述原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每帖 圖像的元數(shù)據(jù)的交互信息量,得到多個交互信息量,利用預設規(guī)則從所述多個交互信息量 中確定目標交互信息量,并將所述目標交互信息量所對應元數(shù)據(jù)的帖圖像所在的視頻確定 為所述原始圖像所在的視頻; 其中,所述視頻元數(shù)據(jù)庫中存儲多個視頻的元數(shù)據(jù),每個視頻的元數(shù)據(jù)包括該視頻的 視頻摘要中多帖圖像的元數(shù)據(jù)。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,任一圖像的元數(shù)據(jù)包括:該圖像主題部分 的元數(shù)據(jù)W及該圖像背景部分的元數(shù)據(jù); 所述計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每帖圖像的元數(shù)據(jù)的交互信息量,包 括: 計算原始圖像主題部分的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每帖圖像主題部分的元數(shù)據(jù)的交 互信息量,和/或 計算原始圖像背景部分的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每帖圖像背景部分的元數(shù)據(jù)的交 互信息量。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,當任一圖像的元數(shù)據(jù)包括:圖像主題部分 的元數(shù)據(jù)W及圖像背景部分的元數(shù)據(jù)時,在確定所述原始圖像的元數(shù)據(jù)之前,該方法還包 括: 利用預設比例參數(shù)將所述原始圖像分為主題部分和背景部分; 所述確定原始圖像的元數(shù)據(jù),包括:確定原始圖像的主題部分的元數(shù)據(jù)W及所述原始 圖像的背景部分的元數(shù)據(jù)。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中任一 帖圖像的元數(shù)據(jù)的交互信息量,等于原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中該帖圖像的元數(shù) 據(jù)在紅R、綠G、藍B分量上的交互信息量之和,其中,原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中該 帖圖像的元數(shù)據(jù)在任一分量上的交互信息量通過如下公式計算得到:其中,I表示交互信息量,PA(a)表示原始圖像在該分量上的概率密度函數(shù),PB(b)表示視 頻元數(shù)據(jù)庫中該帖圖像在該分量上的概率密度函數(shù),PAB(a,b)表示原始圖像和視頻元數(shù)據(jù) 庫中該帖圖像在該分量上的聯(lián)合概率密度函數(shù)。5. 根據(jù)權(quán)利要求1-4中任一項所述的方法,其特征在于,任一圖像的元數(shù)據(jù)包括該圖像 的灰度直方圖和概率密度函數(shù),所述概率密度函數(shù)為該圖像灰度直方圖中各個灰度值上像 素點的統(tǒng)計數(shù)量與該圖像的總像素點數(shù)之比。6. -種檢索視頻的裝置,其特征在于,該裝置包括: 接收單元,用于接收用戶輸入的用于檢索視頻的原始圖像; 處理單元,用于確定所述原始圖像的元數(shù)據(jù),分別計算所述原始圖像的元數(shù)據(jù)與視頻 元數(shù)據(jù)庫中每帖圖像的元數(shù)據(jù)的交互信息量,得到多個交互信息量,利用預設規(guī)則從所述 多個交互信息量中確定目標交互信息量,并將所述目標交互信息量所對應元數(shù)據(jù)的帖圖像 所在的視頻確定為所述原始圖像所在的視頻; 其中,所述視頻元數(shù)據(jù)庫中存儲多個視頻的元數(shù)據(jù),每個視頻的元數(shù)據(jù)包括該視頻的 視頻摘要中多帖圖像的元數(shù)據(jù)。7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,任一圖像的元數(shù)據(jù)包括:該圖像主題部分 的元數(shù)據(jù)W及該圖像背景部分的元數(shù)據(jù); 所述處理單元計算原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每帖圖像的元數(shù)據(jù)的交互信 息量,具體用于: 計算原始圖像主題部分的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每帖圖像主題部分的元數(shù)據(jù)的交 互信息量,和/或 計算原始圖像背景部分的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中每帖圖像背景部分的元數(shù)據(jù)的交 互信息量。8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,當任一圖像的元數(shù)據(jù)包括:圖像主題部分 的元數(shù)據(jù)W及圖像背景部分的元數(shù)據(jù)時,所述處理單元在確定所述原始圖像的元數(shù)據(jù)之 前,還用于: 利用預設比例參數(shù)將所述原始圖像分為主題部分和背景部分; 所述處理單元確定原始圖像的元數(shù)據(jù),具體應用:確定原始圖像的主題部分的元數(shù)據(jù) W及所述原始圖像的背景部分的元數(shù)據(jù)。9. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中任一 帖圖像的元數(shù)據(jù)的交互信息量,等于原始圖像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中該帖圖像的元數(shù) 據(jù)在紅R、綠G、藍B分量上的交互信息量之和,其中,所述處理單元通過如下公式計算原始圖 像的元數(shù)據(jù)與視頻元數(shù)據(jù)庫中該帖圖像的元數(shù)據(jù)在任一分量上的交互信息量:其中,I表示交互信息量,PA(a)表示原始圖像在該分量上的概率密度函數(shù),PB(b)表示視 頻元數(shù)據(jù)庫中該帖圖像在該分量上的概率密度函數(shù),PAB(a,b)表示原始圖像和視頻元數(shù)據(jù) 庫中該帖圖像在該分量上的聯(lián)合概率密度函數(shù)。10. 根據(jù)權(quán)利要求6-9中任一項所述的裝置,其特征在于,任一圖像的元數(shù)據(jù)包括該圖 像的灰度直方圖和概率密度函數(shù),所述概率密度函數(shù)為該圖像灰度直方圖中各個灰度值上 像素點的統(tǒng)計數(shù)量與該圖像的總像素點數(shù)之比。
【文檔編號】G06F17/30GK105843930SQ201610189270
【公開日】2016年8月10日
【申請日】2016年3月29日
【發(fā)明人】蔡煒
【申請人】樂視控股(北京)有限公司, 樂視致新電子科技(天津)有限公司