本公開屬于圖像處理,更具體地說,是涉及一種圖像拖拽編輯方法及系統(tǒng)。
背景技術(shù):
1、傳統(tǒng)的圖像編輯條件包括文本條件和圖像條件,但這些條件在表示一些編輯屬性(如形狀和位置)方面顯得不足。為了解決這個(gè)問題,最近的研究提出了一項(xiàng)新任務(wù),即圖像拖拽編輯。在拖拽編輯中,用戶輸入拖拽點(diǎn)(起始點(diǎn)和目標(biāo)點(diǎn))作為編輯條件,通過將物體移動(dòng)到目標(biāo)位置,實(shí)現(xiàn)了對于形狀、位置等屬性的精準(zhǔn)控制。
2、目前,拖拽編輯的編輯結(jié)果可能會(huì)出現(xiàn)與用戶期望結(jié)果相差較大的情況,如圖1所示,圖1中的拖拽點(diǎn)條件的起始點(diǎn)在馬的頭部,目標(biāo)點(diǎn)在右上方,用戶期望的編輯結(jié)果是讓馬抬頭,但是實(shí)際的編輯結(jié)果是讓馬脖子變長。因此,需要對拖拽編輯的方法做出進(jìn)一步改進(jìn)。
技術(shù)實(shí)現(xiàn)思路
1、本公開的目的在于提供一種圖像拖拽編輯方法及系統(tǒng),以得到符合用戶預(yù)期的拖拽編輯結(jié)果。
2、本公開實(shí)施例的第一方面,提供了一種圖像拖拽編輯方法,包括:
3、基于第一圖像和第一圖像的拖拽點(diǎn)信息進(jìn)行意圖推理,得到n個(gè)語義意圖;所述第一圖像為拖拽編輯前的原始圖像;
4、基于n個(gè)語義意圖分別對第一圖像進(jìn)行編輯,得到n個(gè)第二圖像;所述n個(gè)第二圖像用于指示用戶從所述n個(gè)第二圖像中選取目標(biāo)圖像。
5、本公開實(shí)施例的第二方面,提供了一種圖像拖拽編輯裝置,包括:
6、意圖推理模塊,用于基于用戶針對第一圖像輸入的拖拽點(diǎn)進(jìn)行意圖推理,得到n個(gè)語義意圖;所述第一圖像為拖拽編輯前的原始圖像;
7、協(xié)同引導(dǎo)模塊,用于基于n個(gè)語義意圖分別對第一圖像進(jìn)行編輯,得到n個(gè)第二圖像;所述n個(gè)第二圖像用于指示用戶從所述n個(gè)第二圖像中選取目標(biāo)圖像。
8、本公開實(shí)施例的第三方面,提供了一種圖像拖拽編輯系統(tǒng),包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的圖像拖拽編輯方法的步驟。
9、本公開實(shí)施例的第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的圖像拖拽編輯方法的步驟。
10、本公開實(shí)施例提供的圖像拖拽編輯方法及系統(tǒng)的有益效果在于:
11、本公開實(shí)施例考慮到同一個(gè)拖拽點(diǎn)條件可以表示多種語義意圖,而現(xiàn)有方法忽略了這種語義多樣性,僅按照一種語義進(jìn)行拖拽編輯,導(dǎo)致拖拽編輯后的圖像與用戶期望的結(jié)果不符。因此,本公開實(shí)施例首先基于第一圖像和第一圖像的拖拽點(diǎn)信息進(jìn)行意圖推理,得到幾種可能的意圖。通過明確地引入語義,增強(qiáng)了語義感知,同時(shí)豐富了編輯結(jié)果的多樣性,用戶可以從中選擇自己期望的目標(biāo)圖像,也即實(shí)現(xiàn)了拖拽編輯結(jié)果與用戶期望的結(jié)果一致。
1.一種圖像拖拽編輯方法,其特征在于,包括:
2.如權(quán)利要求1所述的圖像拖拽編輯方法,其特征在于,所述語義意圖包括起始提示和目標(biāo)提示,所述起始提示用于指示第一圖像的描述信息,所述目標(biāo)指示用于指示第二圖像的描述信息;
3.如權(quán)利要求2所述的圖像拖拽編輯方法,其特征在于,所述去噪處理的過程包括多個(gè)依次執(zhí)行的去噪步驟,所述圖像拖拽編輯方法還包括:
4.如權(quán)利要求3所述的圖像拖拽編輯方法,其特征在于,所述基于第一概率和第二概率的相對大小計(jì)算圖像質(zhì)量引導(dǎo)函數(shù),包括:
5.如權(quán)利要求2所述的圖像拖拽編輯方法,其特征在于,所述去噪處理的過程包括多個(gè)依次執(zhí)行的去噪步驟,所述加噪處理的過程包括多個(gè)依次執(zhí)行的加噪步驟,所述圖像拖拽編輯方法還包括:
6.如權(quán)利要求5所述的圖像拖拽編輯方法,其特征在于,所述基于所述第一特征向量、所述第二特征向量、起始拖拽位置和目標(biāo)拖拽位置計(jì)算拖拽區(qū)域的能量函數(shù),包括:
7.如權(quán)利要求2所述的圖像拖拽編輯方法,其特征在于,所述去噪處理的過程包括多個(gè)依次執(zhí)行的去噪步驟,所述加噪處理的過程包括多個(gè)依次執(zhí)行的加噪步驟,所述圖像拖拽編輯方法還包括:
8.一種圖像拖拽編輯裝置,其特征在于,包括:
9.一種圖像拖拽編輯系統(tǒng),包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述方法的步驟。