技術總結
本發(fā)明提供一種字幕生成方法及裝置,涉及多媒體處理領域,該方法包括先抽取音頻信息,然后識別出音頻信息中的第一語言,再將第一語言轉化為第二語言獲得第二語言文本信息,最后將第二語言文本信息加載到對應音頻信息的相應位置,從而生成視頻字幕。該方法能夠在視頻中自動生成其他語言的字幕,對于沒有所需語言字幕的視頻文件,可以通過該方式生成所需語言的字幕,從而用戶能夠更好的觀看該視頻文件。該方法能夠自動生成多語言字幕,可作為手機等智能設備播放器的一個附加功能,解決了現(xiàn)有技術中字幕生成時需要人工翻譯、花費較多時間和精力、生成速度慢的缺陷,同時簡化了字幕制作的流程,能夠快速便捷的生成字幕。
技術研發(fā)人員:唐熊
受保護的技術使用者:樂視控股(北京)有限公司;樂視移動智能信息技術(北京)有限公司
文檔號碼:201610490947
技術研發(fā)日:2016.06.28
技術公布日:2016.11.23