一種減少算力損耗的多模態(tài)大模型緩存系統(tǒng)及方法與流程

文檔序號(hào)：40385651發(fā)布日期：2024-12-20 12:08閱讀：3來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及人工智能，尤其涉及一種減少算力損耗的多模態(tài)大模型緩存系統(tǒng)及方法。

背景技術(shù)：

1、隨著人工智能技術(shù)的飛速發(fā)展，大模型(large?models)在自然語言處理、圖像識(shí)別、推薦系統(tǒng)等領(lǐng)域得到了廣泛應(yīng)用。大模型通常指的是參數(shù)量達(dá)到億級(jí)甚至十億級(jí)的深度學(xué)習(xí)模型，如openai的gpt-4、谷歌的transformer等。這些模型能夠處理復(fù)雜的任務(wù)，提供高質(zhì)量的預(yù)測(cè)結(jié)果，但隨之而來的是對(duì)計(jì)算資源的巨大需求。

2、在大模型的推理應(yīng)用中，每當(dāng)用戶提出一個(gè)查詢或者輸入一個(gè)提示語(prompt)，模型就需要進(jìn)行一次完整的推理過程，包括數(shù)據(jù)處理、模型推理和結(jié)果生成等步驟。這個(gè)過程需要消耗大量的計(jì)算資源，每次推理的成本可能非常高昂，尤其是在文生圖片、文生視頻、文生音頻這種多模態(tài)場(chǎng)景，算力、時(shí)間與能源的耗費(fèi)尤甚。這種重復(fù)的計(jì)算不僅造成了算力的浪費(fèi)，也增加了運(yùn)行成本，限制了模型的廣泛應(yīng)用。

3、為了解決這個(gè)問題，研究者們提出了各種方法來優(yōu)化模型的推理過程。其中一種常見的方法是模型剪枝(model?pruning)，通過減少模型中的參數(shù)數(shù)量來降低計(jì)算復(fù)雜度。另一種方法是知識(shí)蒸餾(knowledge?distillation)，將大模型的知識(shí)轉(zhuǎn)移到一個(gè)小模型上，從而減少推理時(shí)的資源消耗。此外，還有一些工作嘗試通過硬件優(yōu)化，如使用專用的人工智能芯片來加速模型的推理過程。然而，上述方法都有其局限性。模型剪枝和知識(shí)蒸餾可能會(huì)導(dǎo)致模型性能的下降，而硬件優(yōu)化則需要額外的投資和復(fù)雜的部署過程。因此，有必要探索一種新的方法，能夠在不犧牲模型性能的前提下，有效地減少大模型的算力損耗和運(yùn)行成本。

技術(shù)實(shí)現(xiàn)思路

1、為了解決以上技術(shù)問題，本發(fā)明提供了一種減少算力損耗的多模態(tài)大模型緩存系統(tǒng)。

2、本發(fā)明的技術(shù)方案是：

3、一種減少算力損耗的多模態(tài)大模型緩存系統(tǒng)，包括：

4、提示語格式化模塊，用于接收并預(yù)處理用戶輸入的原始提示語，將其轉(zhuǎn)換為標(biāo)準(zhǔn)化的新提示詞；

5、緩存存儲(chǔ)模塊，用于存儲(chǔ)格式化后的提示語及其對(duì)應(yīng)的多模態(tài)生成結(jié)果，并對(duì)外提供搜索能力；

6、緩存查詢模塊，用于在每次推理前，對(duì)新提示詞進(jìn)行搜索，如果搜索到對(duì)應(yīng)的多模態(tài)推理結(jié)果，則直接返回，否則進(jìn)入模型推理流程；

7、緩存評(píng)價(jià)模塊，用于對(duì)緩存中的數(shù)據(jù)進(jìn)行評(píng)價(jià)，為緩存更新模塊提供判斷依據(jù)；

8、緩存更新模塊，用于根據(jù)緩存評(píng)價(jià)模塊的評(píng)價(jià)結(jié)果，對(duì)緩存中的數(shù)據(jù)進(jìn)行更新或刪除操作。

9、進(jìn)一步的，

10、提示語格式化模塊通過預(yù)定義的規(guī)則或算法，將原始提示語轉(zhuǎn)換為標(biāo)準(zhǔn)化格式，確保不同形式的提示語在經(jīng)過處理后能映射到相同的標(biāo)識(shí)符。

11、提示語格式化模塊進(jìn)一步包括用于去除無關(guān)字符、統(tǒng)一大小寫、分詞處理、提取關(guān)鍵詞以及向量化表示和哈希編碼。

12、進(jìn)一步的，

13、緩存存儲(chǔ)模塊采用鍵值對(duì)存儲(chǔ)系統(tǒng)，鍵為新提示詞，值對(duì)應(yīng)的多模態(tài)推理結(jié)果。

14、進(jìn)一步的，

15、其中，緩存評(píng)價(jià)模塊的評(píng)價(jià)依據(jù)包括數(shù)據(jù)的訪問頻率、新鮮度、準(zhǔn)確性、命中率、用戶滿意度。緩存更新模塊根據(jù)緩存評(píng)價(jià)模塊的評(píng)價(jià)結(jié)果，對(duì)緩存中的數(shù)據(jù)進(jìn)行更新或刪除操作。

16、此外，本發(fā)明還提供了一種減少算力損耗的多模態(tài)大模型緩存方法，通過將輸入的原始提示語通過分析，總結(jié)為設(shè)定長(zhǎng)度的、格式固定的新提示詞，隨后將生成的多模態(tài)結(jié)果與轉(zhuǎn)換后的新提示詞進(jìn)行綁定，并存入存儲(chǔ)介質(zhì)中，在之后的推理中，每次推理前也會(huì)首先對(duì)新提示詞進(jìn)行轉(zhuǎn)換，隨后在存儲(chǔ)介質(zhì)中搜索，如果搜索到了，則可以直接返回生成的多模態(tài)結(jié)果，如果未搜索到，則進(jìn)行推理生成，并將生成的結(jié)果放入存儲(chǔ)介質(zhì)中，作為之后的緩存。

17、進(jìn)一步的，

18、通過預(yù)定義的規(guī)則或算法，將原始提示語轉(zhuǎn)換為標(biāo)準(zhǔn)化格式，以確保不同形式的提示語在經(jīng)過處理后能映射到相同的標(biāo)識(shí)符。將原始提示語轉(zhuǎn)換過程包括去除無關(guān)字符、統(tǒng)一大小寫、分詞處理、提取關(guān)鍵詞以及向量化表示和哈希編碼。

19、進(jìn)一步的，

20、采用鍵值對(duì)存儲(chǔ)系統(tǒng)，鍵為新提示詞，值對(duì)應(yīng)的多模態(tài)推理結(jié)果。

21、進(jìn)一步的，

22、其中，緩存評(píng)價(jià)模塊的評(píng)價(jià)依據(jù)包括數(shù)據(jù)的訪問頻率、新鮮度、準(zhǔn)確性、命中率、用戶滿意度；根據(jù)緩存評(píng)價(jià)模塊的評(píng)價(jià)結(jié)果，對(duì)緩存中的數(shù)據(jù)進(jìn)行更新或刪除操作。

23、本發(fā)明的有益效果是

24、本發(fā)明不僅能夠顯著降低算力損耗，提高數(shù)據(jù)處理效率，還能夠根據(jù)實(shí)時(shí)數(shù)據(jù)和用戶需求動(dòng)態(tài)調(diào)整緩存策略，確保了數(shù)據(jù)的可訪問性和用戶體驗(yàn)的最大化提高。這種創(chuàng)新的緩存方法及系統(tǒng)在多模態(tài)數(shù)據(jù)處理領(lǐng)域具有廣泛的應(yīng)用前景，能夠?yàn)橄嚓P(guān)行業(yè)帶來顯著的經(jīng)濟(jì)和社會(huì)效益。

技術(shù)特征：

1.一種減少算力損耗的多模態(tài)大模型緩存系統(tǒng)，其特征在于，

2.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，

3.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，

4.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，

5.根據(jù)權(quán)利要求1所述的系統(tǒng)，其特征在于，

6.一種減少算力損耗的多模態(tài)大模型緩存方法，其特征在于，

7.根據(jù)權(quán)利要求6所示的方法，其特征在于，

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，

9.根據(jù)權(quán)利要求6所述的方法，其特征在于，

10.根據(jù)權(quán)利要求6所述的方法，其特征在于，

技術(shù)總結(jié)
本發(fā)明提供一種減少算力損耗的多模態(tài)大模型緩存系統(tǒng)及方法，屬于人工智能技術(shù)領(lǐng)域，本發(fā)明通過將提示語進(jìn)行預(yù)處理，將原提示語轉(zhuǎn)換成固定的格式，并將結(jié)果與轉(zhuǎn)換后的提示語進(jìn)行緩存，如果下次有同樣的提示語，則可以直接返回緩存，從而大大減少算力的損耗，加快請(qǐng)求響應(yīng)，實(shí)現(xiàn)了從降低運(yùn)行成本、降低能源消耗到促進(jìn)模型推廣、提升用戶體驗(yàn)等一系列目標(biāo)。

技術(shù)研發(fā)人員：王大帥,李超,陳堯,吳夢(mèng)真
受保護(hù)的技術(shù)使用者：浪潮云信息技術(shù)股份公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王大帥,李超,陳堯,吳夢(mèng)真
技術(shù)所有人：浪潮云信息技術(shù)股份公司
我是此專利的發(fā)明人

上一篇：一種預(yù)制梁板橫向頂推滑移裝置的制作方法
上一篇：一種水利工程用升降式水利閘門的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種減少算力損耗的多模態(tài)大模型緩存系統(tǒng)及方法與流程