一種針對(duì)可控高質(zhì)量AI作畫圖片描述的生成方法及系統(tǒng)與流程

文檔序號(hào)：40372942發(fā)布日期：2024-12-20 11:55閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種針對(duì)可控高質(zhì)量AI作畫圖片描述的生成方法及系統(tǒng)與流程

本發(fā)明涉及人工智能，尤其涉及一種針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法及系統(tǒng)。

背景技術(shù)：

1、現(xiàn)有的圖像生成技術(shù)存在諸多問題，如用戶描述不準(zhǔn)確時(shí)只能生成模式化圖像，難以滿足個(gè)性化和創(chuàng)新需求，無法引導(dǎo)用戶思維發(fā)散，且用戶反饋也不能有效用于后續(xù)生成結(jié)果。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供一種針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法及系統(tǒng)，從而解決現(xiàn)有技術(shù)中存在的前述問題。

2、為了實(shí)現(xiàn)上述目的，本發(fā)明采用的技術(shù)方案如下：

3、一種針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，包括如下步驟，

4、s1、要素提?。哼\(yùn)用自然語言處理技術(shù)對(duì)用戶繪圖意向進(jìn)行分析和識(shí)別，抽取其中的關(guān)鍵繪圖要素；

5、s2、提示增強(qiáng)優(yōu)化：基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型理解要素的含義及要素之間的關(guān)系，并基于生成式對(duì)抗網(wǎng)絡(luò)分別對(duì)用戶繪圖意向進(jìn)行擴(kuò)展和補(bǔ)充，以生成多種不同方向的繪圖提示詞；

6、s3、繪圖生成篩選：基于繪圖提示詞，利用擴(kuò)散模型圖像生成算法生成符合繪圖提示詞描述的圖像，并通過引入圖像質(zhì)量評(píng)估體系，獲取符合預(yù)期質(zhì)量標(biāo)準(zhǔn)的各種風(fēng)格的圖像。

7、優(yōu)選的，步驟s1具體包括如下內(nèi)容，

8、s11、利用自然語言處理技術(shù)中的預(yù)處理技術(shù)對(duì)文本進(jìn)行預(yù)處理，并通過自然語言處理技術(shù)中的拼寫檢查工具和字典匹配工具，糾正文本中存在的拼寫錯(cuò)誤，使得文本更加清晰和準(zhǔn)確，實(shí)現(xiàn)用戶繪圖意向文本的初步處理；

9、s12、將初步處理后的文本輸入到詞法分析器中，詞法分析器根據(jù)語言的規(guī)則和詞匯庫，將連續(xù)的文本分割成獨(dú)立的詞語；

10、s13、命名實(shí)體識(shí)別算法基于預(yù)先訓(xùn)練的模式和語義知識(shí)，通過模式匹配和語義理解，識(shí)別出文本中代表核心對(duì)象的名詞，確定文本中的關(guān)鍵的實(shí)體；

11、s14、將文本輸入到情感分析模型中，確定圖像的整體氛圍和情感表達(dá)；

12、s15、利用文本分類和關(guān)鍵詞提取算法對(duì)文本進(jìn)行深入挖掘，提取出圖像的細(xì)節(jié)相關(guān)描述，并通過統(tǒng)計(jì)詞頻、詞性和上下文相關(guān)性的方式確定關(guān)鍵信息要素。

13、優(yōu)選的，步驟s2具體包括如下內(nèi)容，

14、s21、將提取出的要素輸入到基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型中，進(jìn)行要素深度學(xué)習(xí)理解，理解要素的含義及要素之間的關(guān)系；

15、s22、將提取出的要素輸入到生成式對(duì)抗網(wǎng)絡(luò)中，進(jìn)行意向擴(kuò)展補(bǔ)充，生成多個(gè)對(duì)用戶繪圖意向的擴(kuò)展和補(bǔ)充版本；

16、s23、運(yùn)用注意力機(jī)制，著重關(guān)注和新對(duì)象、情感表達(dá)和關(guān)鍵細(xì)節(jié)要素；

17、s24、借助遷移學(xué)習(xí)，將其他類似任務(wù)中獲取的經(jīng)驗(yàn)應(yīng)用到當(dāng)前的繪圖提示優(yōu)化中；

18、s25、運(yùn)用變分自編碼技術(shù)，探索生成多種不同方向的繪圖提示詞。

19、優(yōu)選的，步驟s21具體為，深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)通過神經(jīng)元之間的連接和權(quán)重，對(duì)將以數(shù)值向量表示的要素進(jìn)行數(shù)學(xué)運(yùn)算和變化；模型利用其先前在大量繪圖相關(guān)數(shù)據(jù)學(xué)習(xí)中獲得的知識(shí)和模式，比較輸入的要素與已學(xué)習(xí)到的類似模式，嘗試?yán)斫庖刂g的潛在關(guān)聯(lián)；通過多次前向傳播和反向傳播過程，不斷調(diào)整神經(jīng)元之間的鏈接權(quán)重，準(zhǔn)確理解要素的含義及要素之間的關(guān)系。

20、優(yōu)選的，步驟s22具體為，生成式對(duì)抗網(wǎng)絡(luò)中生成器根據(jù)輸入的要素和學(xué)習(xí)到的知識(shí)，初步生成多個(gè)對(duì)用戶繪圖意向的擴(kuò)展和補(bǔ)充版本；生成式對(duì)抗網(wǎng)絡(luò)中的判別器評(píng)估生成的結(jié)果是否真實(shí)和合理，通過兩者的對(duì)抗訓(xùn)練，不斷優(yōu)化生成的內(nèi)容，最終生成多個(gè)對(duì)用戶繪圖意向的擴(kuò)展和補(bǔ)充版本。

21、優(yōu)選的，步驟s3具體包括如下內(nèi)容，

22、s31、利用多種繪圖提示詞，調(diào)用擴(kuò)散模型圖像生成算法逐步生成符合繪圖提示詞描述的圖像；

23、s32、引入圖像質(zhì)量評(píng)估體系，從多個(gè)維度對(duì)符合繪圖提示詞描述的圖像進(jìn)行視覺質(zhì)量評(píng)分；

24、s33、設(shè)定質(zhì)量評(píng)分的閾值，過濾掉質(zhì)量評(píng)分低于該閾值的圖像，保留質(zhì)量評(píng)分高于該閾值的圖像；

25、s34、不斷重復(fù)上述生成和篩選過程，直到獲取符合預(yù)期質(zhì)量標(biāo)準(zhǔn)的各種風(fēng)格的圖像。

26、優(yōu)選的，步驟s21具體包括如下內(nèi)容，

27、s311、擴(kuò)散模型創(chuàng)建一個(gè)隨機(jī)噪聲圖像作為初始輸入，在前向擴(kuò)散過程中不斷迭代，逐漸向初始的噪聲圖像中添加高斯噪聲；

28、s312、擴(kuò)散模型學(xué)習(xí)了從添加了噪聲的圖像中逐步恢復(fù)到清晰的圖像，當(dāng)形成新圖像時(shí)，將給定的繪圖提示詞作為條件輸入，擴(kuò)散模型根據(jù)提示詞和當(dāng)前加噪的圖像預(yù)測(cè)如何去除噪聲，逐步恢復(fù)圖像的結(jié)構(gòu)和內(nèi)容；

29、s313、在反向擴(kuò)散過程中，擴(kuò)散模型逐步去噪，模型預(yù)測(cè)出應(yīng)該對(duì)像素值進(jìn)行的調(diào)整，以使圖像逐漸變得更加清晰和有意義；

30、s314、經(jīng)過多次反向擴(kuò)散迭代，圖像逐漸清晰并形成具有特定內(nèi)容和特征的圖像，最終生成符合繪圖提示詞描述的圖像。

31、優(yōu)選的，步驟s1之前還包括，

32、s0、意向采集：通過引導(dǎo)或用戶直接描述的方式收集用戶繪圖意向。

33、優(yōu)選的，步驟s3之后還包括，

34、s4、圖像返回與用戶引導(dǎo)在生成：將符合預(yù)期質(zhì)量標(biāo)準(zhǔn)的圖像返回給用戶，引導(dǎo)用戶在此基礎(chǔ)上進(jìn)一步生成新圖像；重復(fù)步驟s0～s4，直至用戶收到滿意的圖像。

35、本發(fā)明的目的還在于提供一種針對(duì)可控高質(zhì)量ai作畫圖片描述的生成系統(tǒng)，系統(tǒng)能夠?qū)崿F(xiàn)上述所述的方法，系統(tǒng)包括，

36、意向采集模塊：通過引導(dǎo)或用戶直接描述的方式收集用戶繪圖意向；

37、要素提取模塊：運(yùn)用自然語言處理技術(shù)對(duì)用戶繪圖意向進(jìn)行分析和識(shí)別，抽取其中的關(guān)鍵繪圖要素；

38、提示增強(qiáng)優(yōu)化模塊：基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型理解要素的含義及要素之間的關(guān)系，并基于生成式對(duì)抗網(wǎng)絡(luò)分別對(duì)用戶繪圖意向進(jìn)行擴(kuò)展和補(bǔ)充，以生成多種不同方向的繪圖提示詞；

39、繪圖生成篩選模塊：基于繪圖提示詞，利用擴(kuò)散模型圖像生成算法生成符合繪圖提示詞描述的圖像，并通過引入圖像質(zhì)量評(píng)估體系，獲取符合預(yù)期質(zhì)量標(biāo)準(zhǔn)的各種風(fēng)格的圖像；

40、圖像返回與用戶引導(dǎo)再生成模塊：將符合預(yù)期質(zhì)量標(biāo)準(zhǔn)的圖像返回給用戶，引導(dǎo)用戶在此基礎(chǔ)上進(jìn)一步生成新圖像；重復(fù)遍歷上述模塊，直至用戶收到滿意的圖像。

41、本發(fā)明的有益效果是：1、本發(fā)明能夠精準(zhǔn)理解用戶哪怕不夠精確的繪圖意向，從而生成滿足其個(gè)性化和創(chuàng)新需求的高質(zhì)量圖像，不再模式化。2、本發(fā)明能夠引導(dǎo)用戶思維發(fā)散，激發(fā)創(chuàng)意，實(shí)現(xiàn)有效交互，充分利用反饋優(yōu)化結(jié)果，大幅提高圖像質(zhì)量，還增加了生成的多樣性和靈活性以適應(yīng)各種需求和場(chǎng)景。

技術(shù)特征：

1.一種針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，其特征在于：包括如下步驟，

2.根據(jù)權(quán)利要求1所述的針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，其特征在于：步驟s1具體包括如下內(nèi)容，

3.根據(jù)權(quán)利要求1所述的針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，其特征在于：步驟s2具體包括如下內(nèi)容，

4.根據(jù)權(quán)利要求3所述的針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，其特征在于：步驟s21具體為，深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)通過神經(jīng)元之間的連接和權(quán)重，對(duì)將以數(shù)值向量表示的要素進(jìn)行數(shù)學(xué)運(yùn)算和變化；模型利用其先前在大量繪圖相關(guān)數(shù)據(jù)學(xué)習(xí)中獲得的知識(shí)和模式，比較輸入的要素與已學(xué)習(xí)到的類似模式，嘗試?yán)斫庖刂g的潛在關(guān)聯(lián)；通過多次前向傳播和反向傳播過程，不斷調(diào)整神經(jīng)元之間的鏈接權(quán)重，準(zhǔn)確理解要素的含義及要素之間的關(guān)系。

5.根據(jù)權(quán)利要求3所述的針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，其特征在于：步驟s22具體為，生成式對(duì)抗網(wǎng)絡(luò)中生成器根據(jù)輸入的要素和學(xué)習(xí)到的知識(shí)，初步生成多個(gè)對(duì)用戶繪圖意向的擴(kuò)展和補(bǔ)充版本；生成式對(duì)抗網(wǎng)絡(luò)中的判別器評(píng)估生成的結(jié)果是否真實(shí)和合理，通過兩者的對(duì)抗訓(xùn)練，不斷優(yōu)化生成的內(nèi)容，最終生成多個(gè)對(duì)用戶繪圖意向的擴(kuò)展和補(bǔ)充版本。

6.根據(jù)權(quán)利要求1所述的針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，其特征在于：步驟s3具體包括如下內(nèi)容，

7.根據(jù)權(quán)利要求6所述的針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，其特征在于：步驟s21具體包括如下內(nèi)容，

8.根據(jù)權(quán)利要求1所述的針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，其特征在于：步驟s1之前還包括，

9.根據(jù)權(quán)利要求9所述的針對(duì)可控高質(zhì)量ai作畫圖片描述的生成方法，其特征在于：步驟s3之后還包括，

10.一種針對(duì)可控高質(zhì)量ai作畫圖片描述的生成系統(tǒng)，其特征在于：系統(tǒng)能夠?qū)崿F(xiàn)上述權(quán)利要求1至9任一所述的方法，系統(tǒng)包括，

技術(shù)總結(jié)
本發(fā)明公開了一種針對(duì)可控高質(zhì)量AI作畫圖片描述的生成方法及系統(tǒng)，方法包括運(yùn)用自然語言處理技術(shù)對(duì)用戶繪圖意向進(jìn)行分析和識(shí)別，抽取其中的關(guān)鍵繪圖要素；基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型理解要素的含義及要素之間的關(guān)系，并基于生成式對(duì)抗網(wǎng)絡(luò)分別對(duì)用戶繪圖意向進(jìn)行擴(kuò)展和補(bǔ)充，以生成多種不同方向的繪圖提示詞；基于繪圖提示詞，利用擴(kuò)散模型圖像生成算法生成符合繪圖提示詞描述的圖像，并通過引入圖像質(zhì)量評(píng)估體系，獲取符合預(yù)期質(zhì)量標(biāo)準(zhǔn)的各種風(fēng)格的圖像。優(yōu)點(diǎn)是：能夠引導(dǎo)用戶思維發(fā)散，激發(fā)創(chuàng)意，實(shí)現(xiàn)有效交互，充分利用反饋優(yōu)化結(jié)果，大幅提高圖像質(zhì)量，還增加了生成的多樣性和靈活性以適應(yīng)各種需求和場(chǎng)景。

技術(shù)研發(fā)人員：張華偉,陳鵬
受保護(hù)的技術(shù)使用者：新壹（北京）科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張華偉,陳鵬
技術(shù)所有人：新壹（北京）科技有限公司
我是此專利的發(fā)明人

上一篇：一種環(huán)保瓦楞紙箱的制作方法
上一篇：一種給水管道試壓裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種針對(duì)可控高質(zhì)量AI作畫圖片描述的生成方法及系統(tǒng)與流程