本技術(shù)涉及圖像處理領(lǐng)域,尤其涉及一種人臉圖像合成方法、設(shè)備及計算機(jī)可讀介質(zhì)。
背景技術(shù):
1、在圖像處理領(lǐng)域中,若需要對一個人物圖像中的人臉部分進(jìn)行修改,一般需要由用戶手動標(biāo)注出人臉部分的位置,然后根據(jù)用戶的需要對這部分位置的圖像進(jìn)行進(jìn)一步的調(diào)整,最終在人物圖像中合成一個新的人臉圖像。但是目前的方案中,整個處理過程較為復(fù)雜,需要人工參與的環(huán)節(jié)較多,難以高效地實(shí)現(xiàn)人臉圖像的自動化合成。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)的一個目的是提供一種人臉圖像合成方法、設(shè)備及計算機(jī)可讀介質(zhì),用以解決現(xiàn)有方案中處理過程復(fù)雜,難以高效地實(shí)現(xiàn)自動化處理的問題。
2、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例提供了一種人臉圖像合成方法,所述方法包括:
3、獲取用于確定圖像風(fēng)格的提示文本,并對所述提示文本進(jìn)行特征抽取,獲取風(fēng)格特征;
4、獲取第一人臉圖像,并對所述第一人臉圖像進(jìn)行特征抽取,獲取人臉圖像特征;
5、獲取包含第二人臉圖像的人物圖像,并對所述人物圖像進(jìn)行特征抽取,獲取人物圖像特征;
6、將所述風(fēng)格特征和所述人臉圖像特征進(jìn)行特征拼接,生成第一拼接特征,并將所述人臉圖像特征與所述人物圖像特征進(jìn)行特征拼接,生成第二拼接特征;
7、根據(jù)所述第一拼接特征和所述第二拼接特征,獲取生成特征,其中,所述生成特征中包括了所述風(fēng)格特征、人臉圖像特征和人物圖像特征;
8、基于注意力機(jī)制對所述生成特征和高斯樣本特征進(jìn)行特征融合,獲取目標(biāo)特征;
9、根據(jù)所述目標(biāo)特征,生成包含第三人臉圖像的輸出圖像,其中,所述輸出圖像融合了所述第一人臉圖像、第二人臉圖像的圖像特征以及提示文本所確定的圖像風(fēng)格。
10、進(jìn)一步地,獲取第一人臉圖像,并對所述第一人臉圖像進(jìn)行特征抽取,獲取人臉圖像特征,包括:
11、獲取多張第一人臉圖像,并對每張第一人臉圖像進(jìn)行特征抽取,生成多個待融合人臉圖像特征;
12、對多個所述待融合人臉圖像特征進(jìn)行特征融合,生成人臉圖像特征。
13、進(jìn)一步地,對多個所述待融合人臉圖像特征進(jìn)行特征融合,生成人臉圖像特征,包括:
14、對每個待融合人臉圖像特征采用不同的三個多層感知機(jī)模型進(jìn)行編碼,分別得到單張人臉q特征矩陣、單張人臉k特征矩陣和單張人臉v特征矩陣,同時將多個待融合人臉圖像特征進(jìn)行特征拼接,并輸入到另一個多層感知機(jī)模型進(jìn)行編碼,得到整體q特征矩陣;
15、分別將每個待融合人臉圖像特征所對應(yīng)的單張人臉k特征矩陣與整體q特征矩陣進(jìn)行矩陣乘法,獲取對應(yīng)的注意力權(quán)重矩陣;
16、分別將每個待融合人臉圖像特征所對應(yīng)的單張人臉v特征矩陣,與對應(yīng)的注意力權(quán)重矩陣進(jìn)行矩陣乘法,獲取對應(yīng)的第一融合特征;
17、將各個待融合人臉圖像特征所對應(yīng)的第一融合特征進(jìn)行合并,獲取第二融合特征;
18、分別將每個待融合人臉圖像特征所對應(yīng)的單張人臉q特征矩陣,作為交叉注意力機(jī)制模型的q特征矩陣,將所述第二融合特征作為所述交叉注意力機(jī)制模型的k特征矩陣和v特征矩陣,輸入至所述交叉注意力機(jī)制模型中,獲取對應(yīng)的第三融合特征;
19、將各個待融合人臉圖像特征所對應(yīng)的第三融合特征進(jìn)行合并,并結(jié)合所述第二融合特征,獲取人臉圖像特征。
20、進(jìn)一步地,將各個待融合人臉圖像特征所對應(yīng)的第一融合特征進(jìn)行合并,獲取第二融合特征,包括:
21、將各個待融合人臉圖像特征所對應(yīng)的第一融合特征中的元素分別乘以對應(yīng)的第一權(quán)重后,進(jìn)行元素相加并取平均值,獲取第二融合特征;
22、將各個待融合人臉圖像特征所對應(yīng)的第三融合特征進(jìn)行合并,并結(jié)合所述第二融合特征,獲取人臉圖像特征,包括:
23、將各個待融合人臉圖像特征所對應(yīng)的第三融合特征中的元素分別乘以對應(yīng)的第二權(quán)重后,進(jìn)行元素相加并取平均值,獲取第四融合特征;
24、將所述第四融合特征與所述第二融合特征進(jìn)行元素相加,獲取人臉圖像特征。
25、進(jìn)一步地,根據(jù)所述第一拼接特征和所述第二拼接特征,獲取生成特征,其中,所述生成特征中包括了所述風(fēng)格特征、人臉圖像特征和人物圖像特征,包括:
26、將所述第一拼接特征和所述第二拼接特征進(jìn)行特征拼接,獲取第三拼接特征;
27、將所述第三拼接特征采用多層感知機(jī)模型進(jìn)行編碼,獲取第四拼接特征;
28、將所述第四拼接特征按照特征拼接時的維度進(jìn)行特征分離,獲取第一混合特征和第二混合特征;
29、將所述第一混合特征和第二混合特征進(jìn)行合并,獲取生成特征,其中,所述生成特征中包括了所述風(fēng)格特征、人臉圖像特征和人物圖像特征。
30、進(jìn)一步地,將所述第一混合特征和第二混合特征進(jìn)行合并,獲取生成特征,包括:
31、將所述第一混合特征中的元素乘以對應(yīng)的第三權(quán)重,并將所述第二混合特征中的元素乘以對應(yīng)的第四權(quán)重后,進(jìn)行元素相加,獲得生成特征,其中,所述第三權(quán)重與第四權(quán)重的和為1。
32、進(jìn)一步地,基于注意力機(jī)制對所述生成特征和高斯樣本特征進(jìn)行特征融合,獲取目標(biāo)特征,包括:
33、將所述生成特征作為注意力機(jī)制模型的k特征矩陣和v特征矩陣;
34、基于預(yù)設(shè)的高斯分布進(jìn)行采樣,獲取高斯樣本特征,并將所述高斯樣本特征作為注意力機(jī)制模型的q特征矩陣;
35、將所述k特征矩陣、v特征矩陣和q特征矩陣輸入至注意力機(jī)制模型,獲取目標(biāo)特征。
36、進(jìn)一步地,根據(jù)所述目標(biāo)特征,生成包含第三人臉圖像的輸出圖像,包括:
37、對所述目標(biāo)特征進(jìn)行降噪處理,獲取降噪目標(biāo)特征;
38、根據(jù)所述降噪目標(biāo)特征,生成包含第三人臉圖像的輸出圖像。
39、本技術(shù)的一些實(shí)施例還提供了一種人臉圖像合成設(shè)備,其中,該設(shè)備包括用于存儲計算機(jī)程序指令的存儲器和用于執(zhí)行計算機(jī)程序指令的處理器,其中,當(dāng)該計算機(jī)程序指令被該處理器執(zhí)行時,觸發(fā)所述設(shè)備執(zhí)行前述的人臉圖像合成方法。
40、本技術(shù)的另一些實(shí)施例還提供了一種計算機(jī)可讀介質(zhì),其上存儲有計算機(jī)程序指令,所述計算機(jī)程序指令可被處理器執(zhí)行以實(shí)現(xiàn)所述的人臉圖像合成方法。
41、相較于現(xiàn)有技術(shù),本技術(shù)實(shí)施例提供的一種人臉圖像合成方案,該方案首先獲取用于確定圖像風(fēng)格的提示文本、第一人臉圖像以及包含第二人臉圖像的人物圖像,分別進(jìn)行特征抽取后獲得風(fēng)格特征、人臉圖像特征和人物圖像特征,然后將所述風(fēng)格特征和所述人臉圖像特征進(jìn)行特征拼接,生成第一拼接特征,并將所述人臉圖像特征與所述人物圖像特征進(jìn)行特征拼接,生成第二拼接特征,根據(jù)所述第一拼接特征和所述第二拼接特征,獲取生成特征,其中,所述生成特征中包括了所述風(fēng)格特征、人臉圖像特征和人物圖像特征,由此完成對上述三種特征的融合。而后可以基于注意力機(jī)制對所述生成特征和高斯樣本特征進(jìn)行特征融合,獲取目標(biāo)特征,并根據(jù)所述目標(biāo)特征,生成包含第三人臉圖像的輸出圖像。由此,所述輸出圖像融合了所述第一人臉圖像、第二人臉圖像的圖像特征以及提示文本所確定的圖像風(fēng)格,用戶僅需要輸入提示文本和需要融合的人臉圖像,即可對人物圖像中的人臉部分進(jìn)行相應(yīng)的修改,整個處理過程對于用戶而言操作簡單,能夠?qū)崿F(xiàn)高效的自動化處理。