技術(shù)總結(jié)
本發(fā)明涉及一種音視頻自動疊加字幕的方法和裝置,包括:從音視頻文件中提取音頻數(shù)據(jù);自動識別音頻信息并生成字幕文件;對音視頻文件進行延時處理;將音視頻文件與字幕文件合成帶字幕的音視頻文件。本發(fā)明通過采用獨立裝置將音視頻文件中的音頻信息分離提取出來,進而采用獨立裝置將該音頻數(shù)據(jù)自動識別并生成對應(yīng)的字幕信息,最后通過合成裝置將該字幕信息與原音視頻文件嚴格時間同步并疊加起來形成帶字幕信息的音視頻文件,改變了傳統(tǒng)的人工制作字幕的字幕添加方式,有效節(jié)省了時間、提高效率,同時,采用硬件設(shè)備精準同步和大大提高了字幕與音視頻畫面的同步效果,提高了觀賞體驗。
技術(shù)研發(fā)人員:應(yīng)鳴;孫偉濤;吳奕剛
受保護的技術(shù)使用者:杭州當虹科技有限公司
文檔號碼:201710095914
技術(shù)研發(fā)日:2017.02.22
技術(shù)公布日:2017.05.31