技術總結
本發(fā)明提供了一種視頻基因的生成方法和裝置,其中,該方法包括:獲取與當前視頻相關的源數(shù)據(jù);其中,源數(shù)據(jù)包括與當前視頻相關的網(wǎng)頁文本、當前視頻內(nèi)的字幕文本和當前視頻對應的音頻數(shù)據(jù)中的一種或多種;按照源數(shù)據(jù)中單體數(shù)據(jù)出現(xiàn)的頻率從源數(shù)據(jù)中提取當前視頻的特征數(shù)據(jù);根據(jù)提取到的特征數(shù)據(jù)和預先建立的視頻基因詞庫確定當前視頻的基因詞;其中,預先建立的視頻基因詞庫包括樣本視頻、樣本視頻的特征數(shù)據(jù)和樣本視頻的基因詞;其中,樣本視頻的特征數(shù)據(jù)包括字幕文本的向量化詞語和音頻數(shù)據(jù)的特征數(shù)據(jù)。本發(fā)明可以更加細化和精確地描述視頻特征。
技術研發(fā)人員:崔玉斌;宋征;趙明
受保護的技術使用者:北京聚愛聊網(wǎng)絡科技有限公司
文檔號碼:201610670921
技術研發(fā)日:2016.08.15
技術公布日:2017.01.04