一種基于視頻內(nèi)容的視頻檢索方法及系統(tǒng)與流程

文檔序號：11864775閱讀：451來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及視頻檢索技術(shù)領(lǐng)域，尤其涉及一種基于視頻內(nèi)容的視頻檢索方法及系統(tǒng)。

背景技術(shù)：

自上個世紀(jì)九十年代以來，隨著網(wǎng)絡(luò)媒體技術(shù)的發(fā)展以及社會網(wǎng)絡(luò)的發(fā)展，網(wǎng)絡(luò)寬帶不斷提高，越來越多的信息通過視頻、音頻、圖像等多媒體的形式展現(xiàn)在互聯(lián)網(wǎng)中，多媒體數(shù)據(jù)呈現(xiàn)出爆發(fā)式的增長；而在各種多媒體素材中，如視頻、音頻、文本、圖形、圖像和動畫等，因視頻數(shù)據(jù)以其生動性、直觀性和極大的親和力備受人們的喜愛，近年來，以提供視頻分享為主要業(yè)務(wù)的視頻網(wǎng)站也是蓬勃發(fā)展，國內(nèi)有愛奇藝、優(yōu)酷、土豆和CNTV等，國外有YouTube、Hulu、Yahoo、Video等；數(shù)量眾多的視頻分享網(wǎng)站極大的豐富了人們的視聽娛樂等活動。

海量的多媒體視頻豐富了人民的生活，隨著視頻數(shù)據(jù)的增多，對這些視頻數(shù)據(jù)的管理存在巨大的技術(shù)問題，需要投入大量人力物力對視頻進行分類處理和添加標(biāo)簽處理，但這些處理還是無法幫助用戶快速、準(zhǔn)確的檢索到用戶需要的視頻。

技術(shù)實現(xiàn)要素：

本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足，本發(fā)明提供了一種基于視頻內(nèi)容的視頻檢索方法及系統(tǒng)，有效的解決基于名稱的視頻檢索中存在的檢索內(nèi)容不準(zhǔn)確問題，提高用戶的使用體驗感。

為了解決上述技術(shù)問題，本發(fā)明提供了一種基于視頻內(nèi)容的視頻檢索方法，所述方法包括：

將用戶的檢索關(guān)鍵詞與背景主詞題集合的主題詞進行匹配，獲取匹配中與檢索關(guān)鍵詞相近的主題詞；

根據(jù)所述與檢索關(guān)鍵詞相近的主題詞進行視頻檢索，獲取所述與檢索關(guān)鍵詞相近的主題詞對應(yīng)的視頻；

根據(jù)獲取所述與檢索關(guān)鍵詞相近的主題詞對應(yīng)的視頻，獲取視頻基本信息；

根據(jù)所述視頻基本信息對所述視頻相似性進行估量，獲取視頻相似性估量結(jié)果；

對所述視頻相似性估量結(jié)果進行綜合加權(quán)估量，獲取視頻相似性綜合估量結(jié)果；

根據(jù)獲取視頻相似性綜合估量結(jié)果進行顯示。

優(yōu)選地，將用戶的檢索關(guān)鍵詞與背景主詞題集合的主題詞進行匹配之前，所述方法還包括：：

獲取數(shù)據(jù)庫中的所有視頻的字幕信息和音頻信息，將所述字幕信息和所述音頻信息轉(zhuǎn)化為第一視頻文本信息；

通過對所述第一視頻文本信息進行處理，獲取所述視頻文本信息主題詞；

通過所述視頻文本信息主題詞獲取與所述視頻文本信息主題詞相關(guān)的背景文獻信息，對所述背景文獻信息進行處理，獲取第一背景文獻主題詞信息；

根據(jù)所述視頻文本信息主題詞與所述第一背景文獻主題詞信息，獲取背景主題詞集合。

優(yōu)選地，所述視頻基本信息至少包括第二視頻文本信息、第二背景文獻主題詞信息和視頻評論信息中的任意一項信息。

優(yōu)選地，所述視頻評論信息的獲取步驟，包括：

對所述視頻進行數(shù)據(jù)爬蟲處理，獲取所述視頻評論信息。

優(yōu)選地，所述根據(jù)視頻基本信息對所述視頻相似性進行估量，獲取視頻相似性估量結(jié)果的步驟，包括：

根據(jù)所述第二視頻文本信息對所述視頻的相似性進行估量，獲取視頻相似性估量結(jié)果；

根據(jù)所述第二背景文獻主題詞信息對所述視頻的相似性進行估量，獲取視頻相似性估量結(jié)果；

根據(jù)所述視頻評論信息對所述視頻的相似性進行估量，獲取視頻相似性估量結(jié)果。

優(yōu)選地，所述根據(jù)所述第二視頻文本信息對所述視頻的相似性進行估量，獲取視頻相似性估量結(jié)果的步驟，包括：

根據(jù)所述第二視頻文本信息的字符串的相似度進行視頻相似性估量，獲取基于所述字符串的視頻相似性估量結(jié)果；

根據(jù)所述第二視頻文字信息的語料庫的相似度進行視頻相似性估量，獲取基于所述語料庫的視頻相似性估量結(jié)果；

根據(jù)所述第二視頻文本信息的文字內(nèi)容的相似度進行視頻相似性估量，獲取基于所述文字內(nèi)容的視頻相似性估量結(jié)果。

優(yōu)選地，所述根據(jù)所述第二背景文獻主題詞信息對所述視頻的相似性進行估量，獲取視頻相似性估量結(jié)果的步驟，包括：

根據(jù)所述第二背景文獻主題詞信息的集合相似度進行視頻相似性估量，獲取基于所述集合的視頻相似性估量結(jié)果；

根據(jù)所述第二背景文獻主題詞信息的詞匯相似度進行視頻相似性估量，獲取基于所述詞匯的視頻相似性估量結(jié)果。

優(yōu)選地，所述根據(jù)所述視頻評論信息對所述視頻的相似性進行估量，獲取視頻相似性估量結(jié)果的步驟，包括：

對所述視頻評論信息進行處理，獲取視頻評論信息中的視頻、用戶、評論的關(guān)系信息；

根據(jù)所述視頻評論信息中的視頻、用戶、評論的關(guān)系信息對所述視頻進行相似性估量，獲取基于所述視頻評論信息相似性估量結(jié)果。

優(yōu)選地，所述對所述視頻相似性估量結(jié)果進行綜合加權(quán)估量，獲取視頻相似性綜合估量結(jié)果的步驟，包括：

構(gòu)建視頻相似性綜合估量模型；

根據(jù)所述視頻相似性綜合估量模型對所述相似性估量結(jié)果進行數(shù)據(jù)訓(xùn)練，獲取訓(xùn)練結(jié)果。

對所述訓(xùn)練結(jié)果進行綜合加權(quán)處理，獲取綜合加權(quán)處理結(jié)果；

根據(jù)綜合加權(quán)處理結(jié)果獲取視頻相似性綜合估量結(jié)果。

另外，本發(fā)明還提供了一種基于視頻內(nèi)容的視頻檢索系統(tǒng)，所述系統(tǒng)包括：

匹配模塊：用于將用戶的檢索關(guān)鍵詞與背景主詞題集合相匹配，獲取與檢索關(guān)鍵詞相近的主題詞；

檢索模塊：用于根據(jù)所述與檢索關(guān)鍵詞相近的主題詞進行視頻檢索，獲取所述與檢索關(guān)鍵詞相近的主題詞對應(yīng)的視頻；

信息獲取模塊：用于根據(jù)所述與檢索關(guān)鍵詞相近的主題詞對應(yīng)的視頻，獲取視頻基本信息；

相似性估量模塊：用于根據(jù)所述視頻基本信息對所述視頻相似性進行估量，獲取視頻相似性估量結(jié)果；

綜合加權(quán)模塊：用于對所述視頻相似性估量結(jié)果進行綜合加權(quán)估量，獲取視頻相似性綜合估量結(jié)果；

顯示模塊：用于根據(jù)獲取視頻相似性綜合估量結(jié)果進行顯示。

在本發(fā)明實施例中，通過對視頻庫中的視頻先進行預(yù)處理，獲取視頻庫中每個視頻背景主題集合，根據(jù)用戶的檢索關(guān)鍵詞與視頻背景主題集合相匹配，獲取主題詞，根據(jù)主題詞進行視頻相似性估量，最終通過綜合加權(quán)的方式獲取視頻相似性的綜合估量結(jié)果，根據(jù)獲取的視頻相似性的綜合估量結(jié)果按高到低展現(xiàn)給用戶，完成對視頻的檢索；有效的解決基于名稱的視頻檢索中存在的檢索內(nèi)容不準(zhǔn)確問題，提高用戶的使用體驗感。

附圖說明

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)這些附圖獲得其它的附圖。

圖1是本發(fā)明實施例中的視頻檢索方法的方法流程示意圖；

圖2是本發(fā)明實施例中的背景主題集合獲取的方法流程示意圖；

圖3是本發(fā)明實施例中的獲取視頻相似性綜合估量結(jié)果的步驟流程示意圖；

圖4是本發(fā)明實施例中的視頻檢索系統(tǒng)的系統(tǒng)結(jié)構(gòu)組成示意圖；

圖5是本發(fā)明實施例中的綜合加權(quán)模塊的模塊結(jié)構(gòu)組成示意圖。

具體實施方式

下面將結(jié)合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發(fā)明一部分實施例，而不是全部的實施例。基于本發(fā)明中的實施例，本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。

圖1是本發(fā)明實施例中的視頻檢索方法的方法流程示意圖，如圖1所示，該方法包括：

S11：將用戶的檢索關(guān)鍵詞與背景主詞題集合的主題詞進行匹配，獲取匹配中與檢索關(guān)鍵詞相近的主題詞；

S12：根據(jù)與檢索關(guān)鍵詞相近的主題詞進行視頻檢索，獲取與檢索關(guān)鍵詞相近的主題詞對應(yīng)的視頻；

S13：根據(jù)獲取與檢索關(guān)鍵詞相近的主題詞對應(yīng)的視頻，獲取視頻基本信息；

S14：根據(jù)視頻基本信息對所述視頻相似性進行估量，獲取視頻相似性估量結(jié)果；

S15：對視頻相似性估量結(jié)果進行綜合加權(quán)估量，獲取視頻相似性綜合估量結(jié)果；

S16：根據(jù)獲取視頻相似性的綜合估量結(jié)果進行顯示。

對S11作進一步說明：

通過檢索框接收用戶輸入的檢索關(guān)鍵詞的方式來獲取到檢索關(guān)鍵詞，將獲取到的檢索關(guān)鍵詞與背景主題詞進行相互匹配，根據(jù)匹配結(jié)果獲取到與檢索關(guān)鍵詞相近的主題詞。

進一步的，在S11之前，圖2是本發(fā)明實施例中的背景主題集合獲取的方法流程示意圖，如圖2所示，該方法包括：

S111：獲取數(shù)據(jù)庫中的所有視頻的字幕信息和音頻信息，將字幕信息和音頻信息轉(zhuǎn)化為第一視頻文本信息；

S112：通過對第一視頻文本信息進行處理，獲取視頻文本信息主題詞；

S113：通過視頻文本信息主題詞獲取與視頻文本信息主題詞相關(guān)的背景文獻信息，對背景文獻信息進行處理，獲取第一背景文獻主題詞信息；

S114：根據(jù)視頻文本信息主題詞與第一背景文獻主題詞信息，獲取背景主題詞集合。

對S111做進一步說明：

首先提取視頻庫中的所有視頻，分別對各個視頻進行幀分割，采用OCR技術(shù)獲取每一幀上的字幕信息，并將前一幀的字幕信息與后一幀的字幕信息進行比較，若前后兩幀的字幕信息的相似度大于80％，則認為兩幀字幕信息相重復(fù)，只保存前一幀的字幕信息；采用這樣的方式直至獲取完視頻所有幀的字幕信息為止，獲取字幕信息；對視頻進行音頻信息分類處理，獲取到音頻信息，對該音頻信息采用ASR技術(shù)進行處理，將該音頻信息轉(zhuǎn)換為文字信息。

然后對字幕信息和文字信息進行垃圾字符串去除處理，該處理的規(guī)則可以如下：

(1)如果一個字符串包含的字符超過40個，則認定為垃圾字符串，過濾掉；

(2)如果一個字符串中的字母數(shù)字字符(或文字字符)的總數(shù)少于50％，則認定為垃圾字符串，過濾掉；

(3)如果一個字符串中有連續(xù)4個相同的字符，則認定為垃圾字符串，過濾掉；

(4)對于只含有字母數(shù)的字符串，檢查元音字母和輔音字母的數(shù)量，如果一種字母的數(shù)量少于另一種字母數(shù)量的10％，則認定為垃圾字符串，過濾掉；

(5)去掉一個字符串的首尾字母后，如果標(biāo)點字符的種類多于兩個，則認定為垃圾字符串，過濾掉；

(6)當(dāng)一個字符串的首尾都是小寫字母，如果中間任何位置出現(xiàn)大寫字母，則認定為垃圾字符，過濾掉。

基于以上規(guī)則，去掉字幕信息和文字信息中的大部分的垃圾字符串都被有效的過濾，同時，對于一些特定格式的字符串，如郵件地址或某些特定表示方式，采用正則表達式和配置文件的方式，將這些字符串予以保留；然后對剩下的字幕信息和文字信息進行去除重復(fù)的合并，獲取到視頻文字信息。

對S112做進一步說明：

采用KEA++算法對視頻文本信息進行處理，獲取文本信息的主題詞；在具體實施過程中，訓(xùn)練數(shù)據(jù)集：將視頻文本信息作為訓(xùn)練數(shù)據(jù)，并對視頻文本信息匯進行訓(xùn)練；控制詞匯表：提取視頻文本信息中的關(guān)鍵短語，將不同領(lǐng)域的關(guān)鍵短語分配到其所屬領(lǐng)域的控制詞匯表；主題詞生成：根據(jù)訓(xùn)練數(shù)據(jù)集和控制詞匯表，采用KEA++算法生成一個學(xué)習(xí)模型，采用該學(xué)習(xí)模型對視頻文本信息進行主題詞預(yù)測，生成主題詞。

對S113作進一步說明：

根據(jù)S112中獲取的到主題詞，采用該主題詞進行文獻檢索，獲取到與該主題詞相關(guān)的背景文獻信息，采用采用KEA++算法對背景文獻信息進行處理獲取背景文獻主題詞信息；在具體實施過程中，訓(xùn)練數(shù)據(jù)集：將背景文獻信息作為訓(xùn)練數(shù)據(jù)，并對背景文獻信息進行訓(xùn)練；控制詞匯表：提取背景文獻信息中的關(guān)鍵短語，將不同領(lǐng)域的關(guān)鍵短語分配到其所屬領(lǐng)域的控制詞匯表；主題詞生成：根據(jù)訓(xùn)練數(shù)據(jù)集和控制詞匯表，采用KEA++算法生成一個學(xué)習(xí)模型，采用該學(xué)習(xí)模型對背景文獻信息進行主題詞預(yù)測，生成背景文獻主題詞信息。

對S114做進一步說明：

根據(jù)KEA++算法生產(chǎn)的學(xué)習(xí)模型預(yù)測獲得的視頻文本信息主題詞和背景文獻主題詞信息中的主題詞和預(yù)測該主題詞與視頻的相關(guān)度概率和Lucene得分相乘，獲取最高相乘結(jié)果部分構(gòu)建主題詞集合。

其中Lucene的評分規(guī)則為對每個文獻信息或文本信息與其查詢請求的主題詞或關(guān)鍵詞的出現(xiàn)頻率(TF)、反向文獻信息或文本信息頻率(IDF)文獻信息或文本信息和每個查詢域的權(quán)重，以及查詢域的文獻信息或文本信息的長度相關(guān)。

對S12做進一步說明：

通過根據(jù)與檢索關(guān)鍵詞相近的主題詞對視頻數(shù)據(jù)庫內(nèi)的視頻進行檢索，從而獲取到與檢索關(guān)鍵詞相近的主題詞相對應(yīng)的視頻。

對S13做進一步說明：

根據(jù)上述S12獲取到與檢索關(guān)鍵詞相近的主題詞相對應(yīng)的視頻之后，獲取該視頻的視頻基本信息；其中，視頻基本信息至少包括視頻文本信息、背景文獻主題詞信息和視頻評論信息。

視頻文本信息和背景文獻主題詞信息是在S11對該視頻處理后的處理結(jié)果中提取出來，視頻評論信息是采用數(shù)據(jù)爬蟲的處理處理方式，爬去該視頻的評論信息，從而獲取到視頻評論信息。

對S14做進一步說明：

根據(jù)視頻基本信息對該視頻進行相似性估量，獲取視頻相似性估量結(jié)果；因為視頻基本信息至少包括視頻文本信息、背景文獻主題詞信息和視頻評論信息；在本實施例中，是分別采用視頻文本信息、背景文獻主題詞信息和視頻評論信息進行視頻相似性估量，獲取視頻相似性估量結(jié)果。

進一步的，根據(jù)視頻文本信息、背景文獻主題詞信息和視頻評論信息分別對視頻進行相似性估量，并且分別獲取他們的相似性估量的估量結(jié)果；即為根據(jù)視頻文本信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果；根據(jù)背景文獻主題詞信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果；根據(jù)視頻評論信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果。

進一步的，根據(jù)視頻文本信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果分為基于視頻文本信息的字符串的相似度進行視頻相似性估量、基于視頻文本信息的語料庫的相似度進行視頻相似性估量和基于視頻文本信息的文字內(nèi)容的相似度進行視頻相似性估量，從而獲取相似性估量結(jié)果。

其中，基于視頻文本信息的字符串的相似度進行視頻相似性估量采用字符串之間的余弦相似性計算字符串的相似性，公式如下：

$<mrow> <mi>cos</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msubsup> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <msub> <mi>W</mi> <mrow> <mi>j</mi> <mi>k</mi> </mrow> </msub> </mrow> <mrow> <msqrt> <mrow> <msubsup> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <msubsup> <mi>W</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> <mn>2</mn> </msubsup> </mrow> </msqrt> <msqrt> <msqrt> <mrow> <msubsup> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <msubsup> <mi>W</mi> <mrow> <mi>j</mi> <mi>k</mi> </mrow> <mn>2</mn> </msubsup> </mrow> </msqrt> </msqrt> </mrow> </mfrac> <mo>;</mo> </mrow>$

其中，T_i表示第i個字符串的向量，w_ik表示第i個字符串的第k維度，T_j表示第j個字符串的向量，w_jk表示第j個字符串向量的第k維度，k＝1,…,n，i、j＝1,…m。

其中，基于視頻文本信息的語料庫的相似度進行視頻相似性估量采用集合類似算法，公式如下：

$<mrow> <mi>D</mi> <mi>i</mi> <mi>c</mi> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mn>2</mn> <mo>×</mo> <mi>c</mi> <mi>o</mi> <mi>m</mi> <mi>m</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>s</mi> <mi>i</mi> <mi>z</mi> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mi>s</mi> <mi>i</mi> <mi>z</mi> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>;</mo> </mrow>$

其中，T_i表示視頻文本信息，T_j表示語料庫信息，comm(T_i,T_j)表示文本信息和語料庫信息出現(xiàn)相同字符串的個數(shù)，size(T_i)、size(T_j)分別表示視頻文本信息和語料庫信息的字符串集合的大小。

其中，基于視頻文本信息的文字內(nèi)容的相似度進行視頻相似性估量采用利用Lin算法進行計算，公式如下：

$<mrow> <mi>L</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mn>2</mn> <mo>×</mo> <mi>I</mi> <mi>C</mi> <mrow> <mo>(</mo> <mi>L</mi> <mi>C</mi> <mi>S</mi> <mo>(</mo> <mrow> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mrow> <mrow> <mi>I</mi> <mi>C</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mi>I</mi> <mi>C</mi> <mrow> <mo>(</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>$

其中，T_i,T_j是待比較的兩個字符串，LCS(T_i,T_j)是兩個字符串的最近祖先，IC(w)表示字符串T的信息量。

進一步的，根據(jù)背景文獻主題詞信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果分為根據(jù)背景文獻主題詞信息的集合相似度進行視頻相似性估量，獲取基于集合的視頻相似性估量結(jié)果；根據(jù)背景文獻主題詞信息的詞匯相似度進行視頻相似性估量，獲取基于詞匯的視頻相似性估量結(jié)果。

其中，根據(jù)背景文獻主題詞信息的集合相似度進行視頻相似性估量，獲取基于集合的視頻相似性估量結(jié)果采用集合相似性算法進行計算，公式如下：

$<mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <msub> <mi>S</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>S</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msubsup> <mo>Σ</mo> <mi>k</mi> <mi>h</mi> </msubsup> <msub> <mi>max</mi> <mi>h</mi> </msub> <mrow> <mo>(</mo> <mi>w</mi> <mi>u</mi> <mi>p</mi> <mo>(</mo> <mrow> <msub> <mi>t</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>t</mi> <mrow> <mi>j</mi> <mi>h</mi> </mrow> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>+</mo> <msubsup> <mo>Σ</mo> <mi>h</mi> <mi>m</mi> </msubsup> <msub> <mi>max</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <mi>w</mi> <mi>u</mi> <mi>p</mi> <mo>(</mo> <mrow> <msub> <mi>t</mi> <mrow> <mi>j</mi> <mi>h</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>t</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mrow> <mrow> <mi>s</mi> <mi>i</mi> <mi>z</mi> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>S</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mi>s</mi> <mi>i</mi> <mi>z</mi> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>S</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>$

其中，S_i、S_j為比較相近的兩個主題詞集合，t_ik、t_jh分別是集合S_i、S_j中的主題詞，wup(t_ik,t_jh)為兩個主題詞之間的wup相似度，max_h(wup(t_ik,t_jh))是主題詞t_ik與集合S_j中的所有主題詞的wup相似度的最大值，max_k(wup(t_jh,t_ik))是主題詞t_jh與集合S_i中的所有主題詞的wup相似度的最大值，size(S)表示集合的個數(shù)。

進一步的，根據(jù)視頻評論信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果，是通過對視頻評論信息進行處理，獲取視頻評論信息中的視頻、用戶、評論的關(guān)系信息；根據(jù)視頻評論信息中的視頻、用戶、評論的關(guān)系信息對視頻進行相似性估量，獲取基于視頻評論信息相似性估量結(jié)果。

對S15作進一步說明：

采用視頻相似性綜合估量算法構(gòu)建視頻相似性估量模型，根據(jù)視頻相似性綜合估量模型對相似性估量結(jié)果進行數(shù)據(jù)訓(xùn)練，獲取訓(xùn)練結(jié)果；對訓(xùn)練結(jié)果進行綜合加權(quán)處理，獲取綜合加權(quán)處理結(jié)果；根據(jù)綜合加權(quán)處理結(jié)果獲取視頻相似性綜合估量結(jié)果。

進一步的，圖3是本發(fā)明實施例中的獲取視頻相似性綜合估量結(jié)果的步驟流程示意圖，如圖3所示，該流程包括：

S151：構(gòu)建視頻相似性綜合估量模型；

S152：根據(jù)視頻相似性綜合估量模型對相似性估量結(jié)果進行數(shù)據(jù)訓(xùn)練，獲取訓(xùn)練結(jié)果；

S153：對訓(xùn)練結(jié)果進行綜合加權(quán)處理，獲取綜合加權(quán)處理結(jié)果；

S154：根據(jù)綜合加權(quán)處理結(jié)果獲取視頻相似性綜合估量結(jié)果。

對S151作進一步說明：

首先構(gòu)建Adaboost算法，采用Adaboost算法進行數(shù)據(jù)訓(xùn)練準(zhǔn)備，用[0,1]區(qū)間上的實數(shù)值表示視頻的相似程度，0表示完全不相同，1表示完全相同，數(shù)值越大相似度越高，對訓(xùn)練數(shù)據(jù)進行標(biāo)記，完成訓(xùn)練數(shù)據(jù)準(zhǔn)備，形成視頻相似性綜合估量模型。

對S152做進一步說明：

利用Adaboost算法依次對每個視頻相似性度量值定制一個弱回歸學(xué)習(xí)算法進行訓(xùn)練，具體包括視頻文字信息內(nèi)容、背景文獻主題詞內(nèi)容和視頻的評論的相似性，獲取訓(xùn)練結(jié)果。

對S153做進一步說明：

將訓(xùn)練之后的相似性結(jié)果進行綜合加權(quán)處理，其綜合加權(quán)為平均加權(quán)處理過程，相似性結(jié)果的權(quán)值因子都是相同的，獲取綜合加權(quán)處理結(jié)果。

對S154做進一步說明：

根據(jù)綜合加權(quán)結(jié)果的大小，進行排序，確定視頻相似性綜合估量的結(jié)果。

對S16作進一步說明：

根據(jù)獲取視頻相似性綜合估量結(jié)果進行顯示；是根據(jù)獲取視頻相似性的綜合估量結(jié)果大小，從高到低顯示給用戶，方便用戶進行查看。

圖4是本發(fā)明實施例中的視頻檢索系統(tǒng)的系統(tǒng)結(jié)構(gòu)組成示意圖，如圖4所示，該系統(tǒng)包括：

匹配模塊11：用于采用用戶的檢索關(guān)鍵詞與背景主詞題集合相匹配，獲取與檢索關(guān)鍵詞相近的主題詞；

信息獲取模塊12：用于根據(jù)與檢索關(guān)鍵詞相近的主題詞，獲取主題詞對應(yīng)的視頻中的視頻文本信息、背景文獻主題信息、視頻評論信息；

相似性估量模塊13：用于根據(jù)視頻文本信息、背景文獻主題詞信息、視頻評論信息對該視頻相似性進行估量，獲取視頻相似性估量結(jié)果；

綜合加權(quán)模塊14：用于對該視頻相似性估量結(jié)果進行綜合加權(quán)估量，獲取視頻相似性綜合估量結(jié)果；

顯示模塊15：用于根據(jù)獲取視頻相似性的綜合估量結(jié)果按高到低顯示給該用戶。

優(yōu)選地，該信息獲取模塊12包括：

視頻獲取單元：用于根據(jù)檢索關(guān)鍵詞相近的主題詞進行視頻檢索，獲取主題詞對應(yīng)的視頻；

信息獲取單元：用于根據(jù)視頻獲取視頻文本信息、獲取視頻背景文獻信息、獲取視頻評論信息。

需要說明的是，信息獲取模塊包括視頻獲取單元和信息獲取單元，采用視頻獲取單元通過與檢索關(guān)鍵詞相近的主題詞進行視頻檢索，獲取檢索到的視頻，采用信息獲取單元對這些視頻進行處理，獲取這些視頻的視頻文本信息、視頻背景文獻信息和視頻評論信息。

進一步的，視頻獲取單元通過與檢索關(guān)鍵詞相近的主題詞進行視頻檢索，獲取檢索到的視頻，在信息獲取單元中采用OCR技術(shù)和ASR技術(shù)對這些視頻進行處理，獲取的文字信息后，對這些文字信息進行冗余去除處理，將去除冗余的文字信息進行合并，獲取到視頻文本信息；根據(jù)獲取到的視頻文本信息，對該視頻文本信息進行KEA++處理，獲取視頻主題詞，采用這些視頻主題詞進行文獻檢索，獲取背景文獻信息，對這些背景文獻信息進行KEA++和Lucene處理，獲取背景文獻主題詞信息；在檢索獲取視頻后，采用數(shù)據(jù)爬蟲處理的方式對視頻進行處理，獲取該視頻的視頻評論信息。

優(yōu)選地，該信息獲取單元包括數(shù)據(jù)爬蟲處理子單元；

數(shù)據(jù)爬蟲處理子單元，用于對視頻進行數(shù)據(jù)爬蟲處理，獲取視頻評論信息。

優(yōu)選地，該相似性估量模塊13包括：

文本信息估量單元：用于根據(jù)視頻文本信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果；

主題詞信息估量單元：用于根據(jù)背景文獻主題詞信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果；

評論信息估量單元：用于根據(jù)視頻評論信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果。

需要說明的是，采用文本信息估量單元對視頻文本信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果；采用主題詞信息估量單元對背景文獻主題詞信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果；采用評論信息估量單元對視頻評論信息對視頻的相似性進行估量，獲取視頻相似性估量結(jié)果；其中，文本信息估量單元、主題詞信息估量單元和評論信息估量單元的執(zhí)行順序不限定，可以同時執(zhí)行也可以分開執(zhí)行。

優(yōu)選地，該文本信息估量單元包括：

字符串估量子單元：用于根據(jù)視頻文本信息的字符串的相似度進行視頻相似性估量，獲取基于字符串的視頻相似性估量結(jié)果；

語料庫估量子單元：用于根據(jù)視頻文字信息的語料庫的相似度進行視頻相似性估量，獲取基于語料庫的視頻相似性估量結(jié)果；

文字內(nèi)容估量子單元：用于根據(jù)視頻文本信息的文字內(nèi)容的相似度進行視頻相似性估量，獲取基于文字內(nèi)容的視頻相似性估量結(jié)果。

需要說明的是，采用字符串估量子單元來根據(jù)視頻文本信息的字符串的相似度進行視頻相似性估量，獲取基于字符串的視頻相似性估量結(jié)果；采用語料庫估量子單元來根據(jù)視頻文字信息的語料庫的相似度進行視頻相似性估量，獲取基于語料庫的視頻相似性估量結(jié)果；采用文字內(nèi)容估量子單元根據(jù)視頻文本信息的文字內(nèi)容的相似度進行視頻相似性估量，獲取基于文字內(nèi)容的視頻相似性估量結(jié)果；其中，采用字符串估量子單元、語料庫估量子單元和文字內(nèi)容估量子單元進行視頻相似性估量時，它們的估量順序是不固定的，可以是同時進行或分開先后進行。

優(yōu)選地，主題詞信息估量單元包括：

集合估量子單元：用于根據(jù)背景文獻主題詞信息的集合相似度進行視頻相似性估量，獲取基于集合的視頻相似性估量結(jié)果；

詞匯估量子單元：用于根據(jù)背景文獻主題詞信息的詞匯相似度進行視頻相似性估量，獲取基于詞匯的視頻相似性估量結(jié)果。

需要說明的是，采用集合估量子單元來根據(jù)背景文獻主題詞信息的集合相似度進行視頻相似性估量，獲取基于集合的視頻相似性估量結(jié)果；采用詞匯估量子單元來根據(jù)背景文獻主題詞信息的詞匯相似度進行視頻相似性估量，獲取基于詞匯的視頻相似性估量結(jié)果，其中，采用集合估量子單元和詞匯估量子單元進行視頻相似性估量時，它們的估量順序是不固定的，可以是同時進行或分開先后進行。

優(yōu)選地，評論信息估量單元包括：

評論信息處理子單元：用于對視頻評論信息進行處理，獲取視頻評論信息中的視頻、用戶、評論的關(guān)系信息；

估量子單元：用于根據(jù)視頻評論信息中的視頻、用戶、評論的關(guān)系信息對視頻進行相似性估量，獲取基于視頻評論信息相似性估量結(jié)果。

優(yōu)選地，綜合加權(quán)模塊14包括：

構(gòu)建單元141：用于構(gòu)建視頻相似性綜合估量模型；

訓(xùn)練單元142：用于根據(jù)視頻相似性綜合估量模型對相似性估量結(jié)果進行數(shù)據(jù)訓(xùn)練，獲取訓(xùn)練結(jié)果。

加權(quán)處理單元143：用于對訓(xùn)練結(jié)果進行綜合加權(quán)處理，獲取綜合加權(quán)處理結(jié)果；

綜合估量獲取單元144：用于根據(jù)綜合加權(quán)處理結(jié)果獲取視頻相似性綜合估量結(jié)果。

需要說明的是，采用構(gòu)建單元141來構(gòu)建視頻相似性綜合估量模型；采用訓(xùn)練單元142來根據(jù)構(gòu)建好的視頻相似性估量模型對視頻相似性估量結(jié)果進行數(shù)據(jù)訓(xùn)練，獲取訓(xùn)練結(jié)果；采用加權(quán)處理單元143對訓(xùn)練結(jié)果進行綜合加權(quán)處理，獲取綜合加權(quán)處理結(jié)果；采用綜合估量獲取單元144來根據(jù)綜合加權(quán)處理結(jié)果獲取視頻相似性綜合估量結(jié)果。

具體地，本發(fā)明實施例的系統(tǒng)相關(guān)功能模塊的工作原理可參見方法實施例的相關(guān)描述，這里不再贅述。

本領(lǐng)域普通技術(shù)人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成，該程序可以存儲于一計算機可讀存儲介質(zhì)中，存儲介質(zhì)可以包括：只讀存儲器(ROM，Read Only Memory)、隨機存取存儲器(RAM，Random Access Memory)、磁盤或光盤等。

另外，以上對本發(fā)明實施例所提供的一種基于視頻內(nèi)容的視頻檢索方法及系統(tǒng)進行了詳細介紹，本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述，以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想；同時，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā)明的思想，在具體實施方式及應(yīng)用范圍上均會有改變之處，綜上所述，本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：羅笑南;徐頌華;姜濤;林格;
技術(shù)所有人：中山大學(xué);
我是此專利的發(fā)明人

上一篇：基于機器學(xué)習(xí)的中文自動文摘方法與流程
上一篇：基于人名的郵箱地址推薦方法及系統(tǒng)與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

視頻內(nèi)容檢索相關(guān)技術(shù)

基于內(nèi)容的視頻檢索相關(guān)技術(shù)

視頻檢索系統(tǒng)相關(guān)技術(shù)

基于內(nèi)容的圖像檢索相關(guān)技術(shù)

linux檢索文件內(nèi)容相關(guān)技術(shù)

文件內(nèi)容檢索工具相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于視頻內(nèi)容的視頻檢索方法及系統(tǒng)與流程