本申請(qǐng)涉及視頻處理,尤其是涉及一種視頻去重方法、裝置、設(shè)備、可讀存儲(chǔ)介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)短視頻興起、每天產(chǎn)生的短視頻成幾何級(jí)數(shù)暴漲。出現(xiàn)了大量優(yōu)質(zhì)內(nèi)容創(chuàng)造者,也出現(xiàn)了各種剽竊、抄襲的情況。特別是人工智能(artificial?intelligence,ai)技術(shù)的興起,更是助長了這種“改編”風(fēng)氣。通過ai技術(shù)改寫原創(chuàng)標(biāo)題、改編短視頻聲音、甚至篡改短視頻畫面以躲避平臺(tái)審查。
2、為了規(guī)避上述情況,需要對(duì)短視頻進(jìn)行去重處理,相關(guān)的去重處理過程中,需要將短視頻與視頻庫中的各個(gè)短視頻進(jìn)行相似性比對(duì),以根據(jù)比對(duì)結(jié)果進(jìn)行去重處理。然而,這種方式的相似性比對(duì)范圍相對(duì)較大,導(dǎo)致視頻去重效率很低。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例的目的在于提供一種視頻去重方法、裝置、設(shè)備、可讀存儲(chǔ)介質(zhì)及程序產(chǎn)品,從而解決由于相似性比對(duì)范圍大導(dǎo)致視頻去重效率低的問題。
2、第一方面,為了達(dá)到上述目的,本申請(qǐng)的實(shí)施例提供一種視頻去重方法,包括:
3、獲取目標(biāo)視頻的多個(gè)維度的特征信息,所述多個(gè)維度包括類別、標(biāo)簽和關(guān)鍵詞中的至少兩項(xiàng);
4、依次將多個(gè)維度中的每一維度的特征信息,分別與視頻庫的對(duì)應(yīng)維度的視頻索引進(jìn)行比較,獲得所述視頻庫中與所述目標(biāo)視頻的每一維度分別對(duì)應(yīng)的候選視頻集合;其中,所述視頻索引用于表示所述視頻庫中相應(yīng)維度的特征信息與所述視頻庫中的候選視頻之間的索引關(guān)系;
5、獲取多個(gè)所述候選視頻集合的交集視頻;
6、在所述目標(biāo)視頻與所述交集視頻中的任一視頻的相似度大于相似度閾值時(shí),確定所述目標(biāo)視頻為待去重視頻。
7、可選地,獲取目標(biāo)視頻的多個(gè)維度的特征信息,包括以下至少兩個(gè)步驟:
8、對(duì)所述目標(biāo)視頻的視頻標(biāo)題進(jìn)行分詞并計(jì)算詞權(quán)重,獲得標(biāo)簽維度的特征信息;
9、對(duì)所述標(biāo)簽維度的特征信息進(jìn)行歸類,獲得類別維度的特征信息;
10、將所述目標(biāo)視頻的音頻數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù),并在所述文本數(shù)據(jù)中提取關(guān)鍵詞維度的特征信息。
11、可選地,所述方法還包括:
12、對(duì)于去重檢測合格的視頻,基于所述去重檢測合格的視頻的每一維度的特征信息,創(chuàng)建和/或更新所述視頻庫的對(duì)應(yīng)維度的視頻索引。
13、可選地,所述在所述目標(biāo)視頻與所述交集視頻中的任一視頻的相似度大于相似度閾值時(shí),確定所述目標(biāo)視頻為待去重視頻之前,所述方法還包括:
14、根據(jù)關(guān)鍵詞維度的特征信息,在所述目標(biāo)視頻中,提取與所述關(guān)鍵詞維度的特征信息相關(guān)的關(guān)鍵幀;
15、根據(jù)所述目標(biāo)視頻的關(guān)鍵幀和所述交集視頻的各個(gè)視頻的關(guān)鍵幀,確定所述目標(biāo)視頻與所述交集視頻的各個(gè)視頻的相似度,其中,所述交集視頻的各個(gè)視頻的關(guān)鍵幀與所述交集視頻的各個(gè)視頻的關(guān)鍵詞維度的特征信息對(duì)應(yīng)。
16、可選地,根據(jù)關(guān)鍵詞維度的特征信息,在所述目標(biāo)視頻中,提取與所述關(guān)鍵詞維度的特征信息相關(guān)的關(guān)鍵幀,包括:
17、在所述目標(biāo)視頻中,識(shí)別與所述關(guān)鍵詞維度的特征信息對(duì)應(yīng)的視頻片段;
18、根據(jù)所述關(guān)鍵詞維度的特征信息在文本數(shù)據(jù)中的位置,提取識(shí)別到的各個(gè)所述視頻片段的關(guān)鍵幀,所述文本數(shù)據(jù)由所述目標(biāo)視頻的音頻數(shù)據(jù)轉(zhuǎn)換得到。
19、可選地,根據(jù)所述目標(biāo)視頻的關(guān)鍵幀和所述交集視頻的各個(gè)視頻的關(guān)鍵幀,確定所述目標(biāo)視頻與所述交集視頻的各個(gè)視頻的相似度,包括:
20、對(duì)所述目標(biāo)視頻的關(guān)鍵幀進(jìn)行圖像處理,獲得所述目標(biāo)視頻的關(guān)鍵幀的特征向量;
21、根據(jù)所述目標(biāo)視頻的各個(gè)關(guān)鍵幀的特征向量,生成所述目標(biāo)視頻的特征向量;
22、依次計(jì)算所述目標(biāo)視頻的特征向量與所述交集視頻的各個(gè)視頻的特征向量的向量積,其中,所述交集視頻的各個(gè)視頻的特征向量由所述交集視頻的各個(gè)視頻的關(guān)鍵幀的特征向量生成;
23、根據(jù)各個(gè)所述向量積,確定所述目標(biāo)視頻與所述交集視頻中對(duì)應(yīng)所述向量積的視頻的相似度。
24、第二方面,為了達(dá)到上述目的,本申請(qǐng)的實(shí)施例提供一種視頻去重裝置,包括:
25、第一獲取模塊,用于獲取目標(biāo)視頻的多個(gè)維度的特征信息,所述多個(gè)維度包括類別、標(biāo)簽和關(guān)鍵詞中的至少兩項(xiàng);
26、第二獲取模塊,用于依次將多個(gè)維度中的每一維度的特征信息,分別與視頻庫的對(duì)應(yīng)維度的視頻索引進(jìn)行比較,獲得所述視頻庫中與所述目標(biāo)視頻的每一維度分別對(duì)應(yīng)的候選視頻集合;其中,所述視頻索引用于表示所述視頻庫中相應(yīng)維度的特征信息與所述視頻庫中的候選視頻之間的索引關(guān)系;
27、第三獲取模塊,用于獲取多個(gè)所述候選視頻集合的交集視頻;
28、第一確定模塊,用于在所述目標(biāo)視頻與所述交集視頻中的任一視頻的相似度大于相似度閾值時(shí),確定所述目標(biāo)視頻為待去重視頻。
29、第三方面,為了達(dá)到上述目的,本申請(qǐng)的實(shí)施例提供一種視頻去重設(shè)備,包括:收發(fā)機(jī)、處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的視頻去重方法。
30、第四方面,為了達(dá)到上述目的,本申請(qǐng)的實(shí)施例提供一種可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的視頻去重方法。
31、第五方面,為了達(dá)到上述目的,本申請(qǐng)的實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的視頻去重方法。
32、本申請(qǐng)的上述技術(shù)方案至少具有如下有益效果:
33、本申請(qǐng)實(shí)施例的視頻去重方法,首先,獲取目標(biāo)視頻的多個(gè)維度的特征信息,所述多個(gè)維度包括類別、標(biāo)簽和關(guān)鍵詞中的至少兩項(xiàng);其次,依次將多個(gè)維度中的每一維度的特征信息,分別與視頻庫的對(duì)應(yīng)維度的視頻索引進(jìn)行比較,獲得所述視頻庫中與所述目標(biāo)視頻的每一維度分別對(duì)應(yīng)的候選視頻集合;其中,所述視頻索引用于表示所述視頻庫中相應(yīng)維度的特征信息與所述視頻庫中的候選視頻之間的索引關(guān)系;再次,獲取多個(gè)所述候選視頻集合的交集視頻;最終,在所述目標(biāo)視頻與所述交集視頻中的任一視頻的相似度大于相似度閾值時(shí),確定所述目標(biāo)視頻為待去重視頻,這里,所述交集視頻為用于與目標(biāo)視頻進(jìn)行相似性比對(duì)的一個(gè)或多個(gè)視頻,相對(duì)于視頻庫中的所有視頻,此處的交集視頻的數(shù)量明顯減少了很多,如此能夠縮小視頻相似性比對(duì)的范圍,從而提升視頻去重效率。
1.一種視頻去重方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的視頻去重方法,其特征在于,獲取目標(biāo)視頻的多個(gè)維度的特征信息,包括以下至少兩個(gè)步驟:
3.根據(jù)權(quán)利要求1所述的視頻去重方法,其特征在于,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的視頻去重方法,其特征在于,所述在所述目標(biāo)視頻與所述交集視頻中的任一視頻的相似度大于相似度閾值時(shí),確定所述目標(biāo)視頻為待去重視頻之前,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的視頻去重方法,其特征在于,根據(jù)關(guān)鍵詞維度的特征信息,在所述目標(biāo)視頻中,提取與所述關(guān)鍵詞維度的特征信息相關(guān)的關(guān)鍵幀,包括:
6.根據(jù)權(quán)利要求4所述的視頻去重方法,其特征在于,根據(jù)所述目標(biāo)視頻的關(guān)鍵幀和所述交集視頻的各個(gè)視頻的關(guān)鍵幀,確定所述目標(biāo)視頻與所述交集視頻的各個(gè)視頻的相似度,包括:
7.一種視頻去重裝置,其特征在于,包括:
8.一種視頻去重設(shè)備,其特征在于,包括:收發(fā)機(jī)、處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6中任一項(xiàng)所述的視頻去重方法。
9.一種可讀存儲(chǔ)介質(zhì),其特征在于,所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6中任一項(xiàng)所述的視頻去重方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6中任一項(xiàng)所述的視頻去重方法。