本技術(shù)涉及金融科技,尤其涉及一種視頻生成方法和裝置、電子設備及存儲介質(zhì)。
背景技術(shù):
1、目前,在各種業(yè)務領(lǐng)域中,常常會利用視頻為各個對象進行業(yè)務知識科普,以便于對象能充分了解不同的業(yè)務。例如,在保險領(lǐng)域中,保險代理人常常利用保險視頻來向投保對象介紹不同類型的保險以及科普與保險相關(guān)的各種知識。
2、但是,由于各個投保對象的興趣偏好和實際需求往往會存在一定的差異,如果利用通用的保險視頻來為各個投保對象進行保險介紹,往往會存在保險視頻的視頻內(nèi)容與實際講解不一致的情況。對此,相關(guān)技術(shù)中考慮到了由保險代理人來針對不同的投保對象來制作和運營不同的保險視頻,這一方式往往較大程度地依賴于保險代理人的視頻制作經(jīng)驗,會存在著保險視頻的制作和生成效率不高的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例的主要目的在于提出一種視頻生成方法和裝置、電子設備及存儲介質(zhì),旨在提高保險視頻的生成效率。
2、為實現(xiàn)上述目的,本技術(shù)實施例的第一方面提出了一種視頻生成方法,所述方法包括:
3、響應于目標對象在交互界面上發(fā)起的保險視頻生成請求,獲取保險視頻描述數(shù)據(jù);
4、對所述保險視頻描述數(shù)據(jù)進行關(guān)鍵信息提取,得到保險視頻描述關(guān)鍵句;
5、基于預設的視頻生成模型對所述保險視頻描述關(guān)鍵句進行視頻生成,得到所述保險視頻描述數(shù)據(jù)對應的保險視頻腳本;
6、基于所述保險視頻腳本,在多個候選視頻素材片段中篩選出目標視頻素材片段,并將所述目標視頻素材片段組合成初始保險視頻;
7、基于所述保險視頻腳本中的剪輯指令數(shù)據(jù)對所述初始保險視頻進行剪輯處理,得到剪輯后保險視頻;
8、對所述剪輯后保險視頻進行字幕生成,得到目標保險視頻。
9、在一些實施例,所述基于預設的視頻生成模型對所述保險視頻描述關(guān)鍵句進行視頻生成,得到所述保險視頻描述數(shù)據(jù)對應的保險視頻腳本,包括:
10、基于所述視頻生成模型對所述保險視頻描述關(guān)鍵句進行嵌入處理,得到視頻描述嵌入特征;
11、對所述視頻描述嵌入特征進行特征編碼,得到視頻描述編碼特征;
12、對所述視頻描述編碼特征進行自注意力計算,得到視頻幀特征表示向量、和剪輯指令特征向量;
13、對所述視頻幀特征表示向量、和所述剪輯指令特征向量進行特征解碼,得到所述保險視頻腳本。
14、在一些實施例,所述基于所述保險視頻腳本,在多個候選視頻素材片段中篩選出目標視頻素材片段,包括:
15、在所述保險視頻腳本中提取視頻場景描述信息;
16、對所述候選視頻素材片段進行內(nèi)容提取,得到所述候選視頻素材片段的視頻片段內(nèi)容;
17、針對各個所述候選視頻素材片段,對所述視頻場景描述信息和所述視頻片段內(nèi)容進行內(nèi)容相似計算,得到視頻內(nèi)容相似度;
18、在多個所述候選視頻素材片段中,篩選出所述視頻內(nèi)容相似度大于預設閾值的所述候選視頻素材片段作為所述目標視頻素材片段。
19、在一些實施例,所述基于所述保險視頻腳本中的剪輯指令數(shù)據(jù)對所述初始保險視頻進行剪輯處理,得到剪輯后保險視頻,包括:
20、如果所述剪輯指令數(shù)據(jù)中的剪輯指令為將所述初始保險視頻中的參考對象替換成目標對象,則獲取所述目標對象的目標對象圖像;
21、對所述目標對象圖像進行對象特征提取,得到所述目標對象的對象面部隱特征;
22、對所述初始保險視頻的各個視頻幀進行分割處理,得到各個所述視頻幀對應的視頻背景圖像;
23、基于所述視頻背景圖像、和所述對象面部隱特征進行視頻生成,得到所述剪輯后保險視頻。
24、在一些實施例,在所述基于所述保險視頻腳本中的剪輯指令數(shù)據(jù)對所述初始保險視頻進行剪輯處理,得到剪輯后保險視頻之后,所述方法還包括:
25、接收所述目標對象在所述交互界面輸入的視頻調(diào)整數(shù)據(jù);
26、對所述視頻調(diào)整數(shù)據(jù)進行解析,得到剪輯調(diào)整順序、附加動畫素材以及所述附加動畫素材的渲染信息;
27、基于所述剪輯調(diào)整順序?qū)λ黾糨嫼蟊kU視頻的多個視頻幀進行重排,得到重排保險視頻;
28、基于所述渲染信息將所述附加動畫素材添加到所述重排保險視頻的目標視頻幀中。
29、在一些實施例,在所述對所述剪輯后保險視頻進行字幕生成,得到目標保險視頻之后,所述方法還包括:
30、響應于目標對象在交互界面上發(fā)起的視頻導出請求,獲取視頻導出格式和視頻導出分辨率;
31、基于所述視頻導出格式和所述視頻導出分辨率,將所述目標保險視頻導出到本地數(shù)據(jù)庫。
32、在一些實施例,所述響應于目標對象在交互界面上發(fā)起的保險視頻生成請求,獲取保險視頻描述數(shù)據(jù),包括:
33、響應于所述保險視頻生成請求,獲取所述目標對象在所述交互界面上輸入的視頻描述語音數(shù)據(jù),其中,所述視頻描述語音數(shù)據(jù)用于描述所要生成的保險視頻的視頻內(nèi)容;
34、對所述視頻描述語音數(shù)據(jù)進行特征提取,得到所述視頻描述語音數(shù)據(jù)的語音梅爾頻譜特征;
35、基于所述語音梅爾頻譜特征進行語音識別,得到所述視頻描述語音數(shù)據(jù)對應的保險視頻描述數(shù)據(jù)。
36、為實現(xiàn)上述目的,本技術(shù)實施例的第二方面提出了一種視頻生成裝置,所述裝置包括:
37、獲取單元,用于響應于目標對象在交互界面上發(fā)起的保險視頻生成請求,獲取保險視頻描述數(shù)據(jù);
38、提取單元,用于對所述保險視頻描述數(shù)據(jù)進行關(guān)鍵信息提取,得到保險視頻描述關(guān)鍵句;
39、第一生成單元,用于基于預設的視頻生成模型對所述保險視頻描述關(guān)鍵句進行視頻生成,得到所述保險視頻描述數(shù)據(jù)對應的保險視頻腳本;
40、篩選單元,用于基于所述保險視頻腳本,在多個候選視頻素材片段中篩選出目標視頻素材片段,并將所述目標視頻素材片段組合成初始保險視頻;
41、剪輯單元,用于基于所述保險視頻腳本中的剪輯指令數(shù)據(jù)對所述初始保險視頻進行剪輯處理,得到剪輯后保險視頻;
42、第二生成單元,用于對所述剪輯后保險視頻進行字幕生成,得到目標保險視頻。
43、為實現(xiàn)上述目的,本技術(shù)實施例的第三方面提出了一種電子設備,所述電子設備包括存儲器、處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述第一方面所述的視頻生成方法。
44、為實現(xiàn)上述目的,本技術(shù)實施例的第四方面提出了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述第一方面所述的視頻生成方法。
45、本技術(shù)提出的視頻生成方法和裝置、電子設備及存儲介質(zhì),其通過響應于目標對象在交互界面上發(fā)起的保險視頻生成請求,獲取保險視頻描述數(shù)據(jù),并對保險視頻描述數(shù)據(jù)進行關(guān)鍵信息提取,得到保險視頻描述關(guān)鍵句,能夠精簡保險視頻描述數(shù)據(jù)的有效內(nèi)容,消除不相干內(nèi)容對視頻生成的影響。進一步地,基于預設的視頻生成模型對保險視頻描述關(guān)鍵句進行視頻生成,得到保險視頻描述數(shù)據(jù)對應的保險視頻腳本,并基于保險視頻腳本,在多個候選視頻素材片段中篩選出目標視頻素材片段,并將目標視頻素材片段組合成初始保險視頻,能利用視頻生成模型和收集到的候選視頻素材片段自動化地生成初始保險視頻,提高初始保險視頻的生成效率。進一步地,將初始保險視頻作為模板視頻,基于保險視頻腳本中的剪輯指令數(shù)據(jù)對初始保險視頻進行剪輯處理,得到剪輯后保險視頻,能夠?qū)崿F(xiàn)對模板視頻的靈活調(diào)整,使剪輯后保險視頻滿足個性化需求。最后,對剪輯后保險視頻進行字幕生成,得到目標保險視頻,能夠提高保險視頻的生成效率,并降低制作個性化的目標保險視頻的復雜度和成本。