一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法與流程

文檔序號：40385525發(fā)布日期：2024-12-20 12:08閱讀：11來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法與流程

本發(fā)明屬于自然語言處理和計(jì)算機(jī)視覺，尤其是一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法。

背景技術(shù)：

1、命名實(shí)體識別技術(shù)近年來受到了廣泛的關(guān)注，是統(tǒng)一數(shù)據(jù)管理系統(tǒng)中最基礎(chǔ)的領(lǐng)域之一；盡管現(xiàn)有的命名實(shí)體識別相關(guān)工作取得了顯著的性能，但是在統(tǒng)一數(shù)據(jù)管理系統(tǒng)中往往存在以下缺陷：

2、一、單一模態(tài)的局限性使得我們無法從文本信息中獲取足夠的上下文來準(zhǔn)確識別實(shí)體。

3、例如，在沒有具體上下文的情況下，“apple”這個詞既可以指代一種水果，也可以指代一家科技公司，這就造成了詞義歧義問題。

4、二、文本信息本身可能并不完整，缺乏必要的視覺線索，這對于理解某些文本內(nèi)容至關(guān)重要。

5、比如，由于語言和文化差異，同一文本描述可能對應(yīng)不同的場景；再如，描述一場比賽時，文本可能不會詳細(xì)到每個運(yùn)動員的具體動作或場景，導(dǎo)致信息缺失。

6、三、噪音和非結(jié)構(gòu)化數(shù)據(jù)也是一大難題。

7、不同來源和傳播途徑的文本，如個人發(fā)布的社交媒體內(nèi)容、官方文件、紙質(zhì)書籍或網(wǎng)頁等，這些文本往往是非結(jié)構(gòu)化的，并且可能包含不同程度的錯別字、語法錯誤或語義傳遞錯誤，這對傳統(tǒng)命名實(shí)體識別模型的理解能力提出了挑戰(zhàn)。

8、同時，多樣化的表達(dá)方式也增加了實(shí)體識別的難度，因?yàn)橥粋€實(shí)體可能有多種稱呼或?qū)懛ǎ煌膶?shí)體可能在文本中表現(xiàn)出一定的相似性。

9、四、語言依賴性也是一個不容忽視的問題。

10、傳統(tǒng)的命名實(shí)體識別模型通常針對單一語言進(jìn)行訓(xùn)練和優(yōu)化，這使得它們難以處理多語言或跨語言的實(shí)體識別任務(wù)。

11、上述問題共同構(gòu)成了命名實(shí)體識別任務(wù)中的復(fù)雜挑戰(zhàn)，需要研發(fā)出更加靈活和智能的方法來解決。

技術(shù)實(shí)現(xiàn)思路

1、為了解決上述技術(shù)問題，本發(fā)明提供一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，通過四個任務(wù)單元架構(gòu)的獨(dú)創(chuàng)設(shè)計(jì)，充分利用了多模態(tài)信息，更好地進(jìn)行命名實(shí)體識別；在數(shù)據(jù)增強(qiáng)階段，采用圖文檢索方法，對生成數(shù)據(jù)進(jìn)行進(jìn)一步的相似內(nèi)容抽取，在最后的命名實(shí)體識別部分引入大模型和混合專家模型，更好地處理多模態(tài)信息，提高模型的訓(xùn)練效果和泛化能力，從而提升模型在命名實(shí)體識別任務(wù)中的表現(xiàn)。

2、一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，設(shè)計(jì)有四個任務(wù)單元架構(gòu)，包括：基于文生圖模型的數(shù)據(jù)增強(qiáng)任務(wù)、圖文檢索任務(wù)、基于混合專家模型的多模態(tài)信息融合任務(wù)以及基于大模型的生成式命名實(shí)體識別任務(wù)，其中：

3、①所述基于文生圖模型的數(shù)據(jù)增強(qiáng)任務(wù)：

4、用于加強(qiáng)命名實(shí)體識別任務(wù)效果，通過引入圖像信息，使得文本信息和所述圖像信息可以相互驗(yàn)證，減少了單一模態(tài)下的信息缺失及誤識別風(fēng)險；文生圖模型能構(gòu)造出與文本語義更加匹配、噪聲信息更少的圖像，該方法生成的圖文對作為數(shù)據(jù)庫；

5、作為一種舉例說明，提取來自所述文本信息和圖像信息混合的高級特征，可以有效地加強(qiáng)實(shí)體細(xì)節(jié)與圖像信息和文本信息的對齊關(guān)系，從而提升命名實(shí)體識別任務(wù)的性能。

6、②所述圖文檢索任務(wù)：

7、對當(dāng)前輸入的目標(biāo)圖文對樣本的圖像信息和文本信息進(jìn)行特征計(jì)算，得到相應(yīng)圖像特征和文本特征，隨后遍歷數(shù)據(jù)庫中的每一對圖文對，分別計(jì)算其圖像信息和文本信息的特征，然后分別計(jì)算其與目標(biāo)圖文對樣本的圖像特征和文本特征之間的余弦相似度，并取加權(quán)平均值作為最終得到的圖文對相似度；

8、作為一種舉例說明，通過對所述數(shù)據(jù)庫的檢索，抽取相似度最高的k個圖文對，進(jìn)一步提升相關(guān)圖文特征的信息完備性。

9、作為一種舉例說明，所述檢索的相似度最高的k個圖文對，作為知識增強(qiáng)樣本。

10、③所述基于混合專家模型的多模態(tài)信息融合任務(wù)：

11、用于確保每個輸入的文本信息和圖像信息的特征都能得到最優(yōu)處理，以增強(qiáng)對圖文特征的處理；將輸入的圖文特征通過交叉注意力機(jī)制處理后得到混合特征，然后經(jīng)過路由器的一個或多個線性層，得到各專家分?jǐn)?shù)，再路由到各個混合專家模型進(jìn)一步處理；

12、作為一種舉例說明，基于所述混合專家模型的多模態(tài)信息融合任務(wù)在多模態(tài)特征融合階段引入了混合專家機(jī)制，通過所述路由器將混合特征按計(jì)算分?jǐn)?shù)分發(fā)給各混合專家模型，以擴(kuò)展參數(shù)規(guī)模，提高所述多模態(tài)信息融合模型的魯棒性，使其能夠更好地應(yīng)對噪聲干擾。

13、作為一種舉例說明，所述圖文檢索任務(wù)以及基于混合專家模型的多模態(tài)信息融合任務(wù)均是基于多模態(tài)模型open-flamingo進(jìn)行改進(jìn)，通過clip模型對文本信息和圖像信息對進(jìn)行特征提取，進(jìn)而與所述數(shù)據(jù)庫中的其它圖文對進(jìn)行相似度檢索。

14、④所述基于大模型的生成式命名實(shí)體識別任務(wù)：

15、首先，對于知識增強(qiáng)樣本，通過vision?encoder和language?encoder分別進(jìn)行編碼，并與目標(biāo)圖文對樣本的圖像信息和文本信息進(jìn)行組合，其中文本信息需要與指令進(jìn)行拼接后再進(jìn)行編碼，分別編碼及組合后得到的圖文特征輸入到多模態(tài)信息融合模型中進(jìn)行處理；

16、然后，將傳統(tǒng)的命名實(shí)體識別分類任務(wù)改進(jìn)為生成任務(wù)，利用所述基于混合專家模型的多模態(tài)信息融合任務(wù)與大模型的解碼進(jìn)行結(jié)合；對于每層解碼層，先將輸入的圖文特征經(jīng)過第三單元架構(gòu)進(jìn)行處理，隨后由解碼層進(jìn)一步處理；

17、最后，對所述圖文特征進(jìn)行實(shí)體生成，以最小化語言模型損失l為目標(biāo)訓(xùn)練模型。

18、作為一種舉例說明，引入所述大模型對傳統(tǒng)命名實(shí)體識別任務(wù)的輸出方式進(jìn)行了改進(jìn)，通過所述生成式的輸出方式，優(yōu)化多模態(tài)命名實(shí)體識別模型在為可見類上的泛化能力，深化多模態(tài)命名實(shí)體識別模型的知識基礎(chǔ)。

19、本發(fā)明的有益效果：

20、本發(fā)明設(shè)計(jì)架構(gòu)科學(xué)可靠，增強(qiáng)了改進(jìn)命名實(shí)體識別的效果。利用大模型本身豐富的知識，為命名實(shí)體識別提供額外知識，增強(qiáng)外部信息，從而輔助命名實(shí)體識別效果。

21、本發(fā)明充分利用圖像知識，并利用混合專家模型篩選重要信息，去除干擾信息，增強(qiáng)命名實(shí)體識別的魯棒性。

22、本發(fā)明利用圖文檢索方法檢索相似的命名實(shí)體識別例子，為目標(biāo)樣本識別提供增強(qiáng)的知識，增強(qiáng)實(shí)體識別性能，與現(xiàn)有技術(shù)相比，本發(fā)明提出的方法具有良好的性能和魯棒性。

技術(shù)特征：

1.一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，其特征在于，設(shè)計(jì)有四個任務(wù)單元架構(gòu)，包括：基于文生圖模型的數(shù)據(jù)增強(qiáng)任務(wù)、圖文檢索任務(wù)、基于混合專家模型的多模態(tài)信息融合任務(wù)以及基于大模型的生成式命名實(shí)體識別任務(wù)，其中：

2.根據(jù)權(quán)利要求1所述的一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，其特征在于，提取來自所述文本信息和圖像信息混合的高級特征，可以增強(qiáng)所述文生圖模型對復(fù)雜實(shí)體的理解。

3.根據(jù)權(quán)利要求1所述的一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，其特征在于，所述余弦相似度，其公式設(shè)計(jì)為：

4.根據(jù)權(quán)利要求1所述的一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，其特征在于，通過對所述數(shù)據(jù)庫的檢索，抽取相似度最高的k個圖文對，用以提升相關(guān)圖文特征的信息完備性。

5.根據(jù)權(quán)利要求4所述的一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，其特征在于，所述相似度最高的k個圖文對，作為知識增強(qiáng)樣本。

6.根據(jù)權(quán)利要求1所述的一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，其特征在于，基于所述混合專家模型的多模態(tài)信息融合任務(wù)在多模態(tài)特征融合階段引入了混合專家機(jī)制，通過所述路由器將混合特征按計(jì)算分?jǐn)?shù)分發(fā)給各混合專家模型，以擴(kuò)展參數(shù)規(guī)模，提高所述多模態(tài)信息融合模型的魯棒性，使其能夠更好地應(yīng)對噪聲干擾。

7.根據(jù)權(quán)利要求1所述的一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，其特征在于，所述圖文檢索任務(wù)以及基于混合專家模型的多模態(tài)信息融合任務(wù)均是基于多模態(tài)模型open-flamingo進(jìn)行改進(jìn)，通過clip模型對文本信息和圖像信息對進(jìn)行特征提取，進(jìn)而與所述數(shù)據(jù)庫中的其它圖文對進(jìn)行相似度檢索。

8.根據(jù)權(quán)利要求1所述的一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，其特征在于，引入所述大模型對傳統(tǒng)命名實(shí)體識別任務(wù)的輸出方式進(jìn)行了改進(jìn)，通過所述生成式的輸出方式，優(yōu)化多模態(tài)命名實(shí)體識別模型在為可見類上的泛化能力，深化多模態(tài)命名實(shí)體識別模型的知識基礎(chǔ)。

9.根據(jù)權(quán)利要求1所述的一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，其特征在于，所述最小化語言模型損失l，其公式設(shè)計(jì)為：

技術(shù)總結(jié)
本發(fā)明提供一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法，設(shè)計(jì)有四個任務(wù)單元架構(gòu)，包括：基于文生圖模型的數(shù)據(jù)增強(qiáng)任務(wù)、圖文檢索任務(wù)、基于混合專家模型的多模態(tài)信息融合任務(wù)以及基于大模型的生成式命名實(shí)體識別任務(wù)，本發(fā)明設(shè)計(jì)架構(gòu)科學(xué)可靠，增強(qiáng)了改進(jìn)命名實(shí)體識別的效果，利用大模型本身豐富的知識，為命名實(shí)體識別提供額外知識，增強(qiáng)外部信息，從而輔助命名實(shí)體識別效果；充分利用圖像知識，并利用混合專家模型篩選重要信息，去除干擾信息，增強(qiáng)命名實(shí)體識別的魯棒性；利用檢索模型檢索相似的命名實(shí)體識別例子，為目標(biāo)樣本識別提供增強(qiáng)的知識，增強(qiáng)實(shí)體識別性能，與現(xiàn)有技術(shù)相比，本發(fā)明提出的方法具有良好的性能。

技術(shù)研發(fā)人員：趙彥濤,劉娜,崔凌瀟,胡慧云,孔竣達(dá),肖波,范富嶺,徐寧,戴娜娜,范明陽,姚圣平,張凱,張海濤
受保護(hù)的技術(shù)使用者：國網(wǎng)山東省電力公司德州供電公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：趙彥濤,劉娜,崔凌瀟,胡慧云,孔竣達(dá),肖波,范富嶺,徐寧,戴娜娜,范明陽,姚圣平,張凱,張海濤
技術(shù)所有人：國網(wǎng)山東省電力公司德州供電公司
我是此專利的發(fā)明人

上一篇：一種化工原料用催化反應(yīng)裝置的制作方法
上一篇：一種鐵路砟石清掃刷的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于大模型和混合專家的增強(qiáng)感知命名實(shí)體識別方法與流程