一種基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)的制作方法

文檔序號(hào)：40463047發(fā)布日期：2024-12-27 09:28閱讀：6來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)的制作方法

本發(fā)明涉及醫(yī)學(xué)知識(shí)檢索，更具體的說是涉及一種基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)。

背景技術(shù)：

1、傳統(tǒng)的問答系統(tǒng)多依賴于關(guān)鍵詞匹配和模板生成，這些方法在處理簡單查詢時(shí)效果尚可，但在面對(duì)復(fù)雜的醫(yī)學(xué)問題時(shí)，往往難以提供準(zhǔn)確和深入的答案。近年來，知識(shí)圖譜和大語言模型生成技術(shù)的發(fā)展為提高問答系統(tǒng)的性能提供了新的可能性。知識(shí)圖譜能夠組織和表示復(fù)雜的醫(yī)學(xué)概念和關(guān)系，而大語言生成技術(shù)則能夠?qū)⑦@些知識(shí)以自然語言的形式表達(dá)出來。一些系統(tǒng)采用了基于檢索的增強(qiáng)生成方法（retrieval-augmented?generation,rag），通過檢索大量文本數(shù)據(jù)來增強(qiáng)生成模型的訓(xùn)練，以提高生成答案的準(zhǔn)確性和相關(guān)性。然而，這些系統(tǒng)在醫(yī)學(xué)領(lǐng)域的應(yīng)用還不夠成熟，知識(shí)來源類型比較單一。

技術(shù)實(shí)現(xiàn)思路

1、針對(duì)以上問題，本發(fā)明的目的在于提供一種基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，能夠?qū)碜灾R(shí)圖譜、醫(yī)學(xué)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)等多源醫(yī)學(xué)知識(shí)進(jìn)行深入的整合、推理和綜合判斷，通過應(yīng)用檢索增強(qiáng)的生成技術(shù)，能夠從多維度知識(shí)中提取信息，并生成準(zhǔn)確、全面且具有高度可解釋性的答案。

2、本發(fā)明為實(shí)現(xiàn)上述目的，通過以下技術(shù)方案實(shí)現(xiàn)：

3、本發(fā)明公開了一種基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，包括：

4、用戶交互模塊，用于獲取用戶輸入的醫(yī)學(xué)問題，并將醫(yī)學(xué)問題發(fā)送至問題解析模型；

5、問題解析模型，用于采用自然語言處理技術(shù)對(duì)醫(yī)學(xué)問題進(jìn)行分析，識(shí)別并提取醫(yī)學(xué)問題中的關(guān)鍵信息；所述關(guān)鍵信息包括：關(guān)鍵詞、短語和查詢意圖；

6、知識(shí)管理模塊，用于通過維護(hù)和更新知識(shí)圖譜、醫(yī)學(xué)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫，構(gòu)建醫(yī)學(xué)知識(shí)庫；對(duì)醫(yī)學(xué)文獻(xiàn)進(jìn)行向量化處理，將醫(yī)學(xué)文獻(xiàn)轉(zhuǎn)換為數(shù)值向量形式；構(gòu)建向量索引，以對(duì)醫(yī)學(xué)文獻(xiàn)的檢索和訪問；

7、醫(yī)學(xué)知識(shí)檢索模塊，用于利用向量索引，根據(jù)問題解析模塊提取的關(guān)鍵信息，檢索相關(guān)的醫(yī)學(xué)文獻(xiàn)節(jié)點(diǎn)，獲取相應(yīng)的多源醫(yī)學(xué)知識(shí)信息；

8、答案生成模塊，用于對(duì)多源醫(yī)學(xué)知識(shí)信息進(jìn)行整合，生成多源醫(yī)學(xué)知識(shí)片段；將多源醫(yī)學(xué)知識(shí)片段輸入到預(yù)訓(xùn)練的大型語言模型中，利用大模型的深度語義理解能力，生成綜合總結(jié)答案。

9、進(jìn)一步，所述醫(yī)學(xué)問題包括：

10、用藥咨詢、藥品問答、健康問答、疾病相關(guān)的流行病學(xué)信息。

11、進(jìn)一步，所述采用自然語言處理技術(shù)對(duì)醫(yī)學(xué)問題進(jìn)行分析，識(shí)別并提取醫(yī)學(xué)問題中的關(guān)鍵信息，包括：

12、采用bilstm-crf模型對(duì)醫(yī)學(xué)問題進(jìn)行分詞處理，將醫(yī)學(xué)問題分割成單詞或短語；

13、采用基于深度學(xué)習(xí)的ner系統(tǒng)識(shí)別出醫(yī)學(xué)問題中的特定實(shí)體；特定實(shí)體包括：人名、地點(diǎn)和組織；

14、基于lstm網(wǎng)絡(luò)確定用戶的查詢意圖。

15、進(jìn)一步，所述通過維護(hù)和更新知識(shí)圖譜、醫(yī)學(xué)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫，構(gòu)建醫(yī)學(xué)知識(shí)庫，包括：

16、收集醫(yī)學(xué)文本數(shù)據(jù)，所述醫(yī)學(xué)文本數(shù)據(jù)包括臨床指南、行業(yè)標(biāo)準(zhǔn)、診療規(guī)范、醫(yī)學(xué)百科；

17、對(duì)收集到的醫(yī)學(xué)文本數(shù)據(jù)進(jìn)行清洗和標(biāo)準(zhǔn)化處理，去除無關(guān)信息，確保醫(yī)學(xué)文本數(shù)據(jù)的質(zhì)量和一致性；

18、使用命名實(shí)體識(shí)別技術(shù)，從醫(yī)學(xué)文本數(shù)據(jù)中識(shí)別出醫(yī)學(xué)術(shù)語，并確定相應(yīng)的醫(yī)學(xué)實(shí)體；

19、將識(shí)別出的醫(yī)學(xué)術(shù)語映射到標(biāo)準(zhǔn)化的醫(yī)學(xué)術(shù)語集；

20、提取醫(yī)學(xué)實(shí)體間的關(guān)系，對(duì)醫(yī)學(xué)實(shí)體的屬性和醫(yī)學(xué)實(shí)體間的關(guān)系進(jìn)行標(biāo)準(zhǔn)化處理；通過模式匹配將醫(yī)學(xué)實(shí)體和醫(yī)學(xué)實(shí)體的本體對(duì)齊，以統(tǒng)一不同數(shù)據(jù)源中的概念體系，并生成知識(shí)圖譜；

21、對(duì)知識(shí)圖譜的內(nèi)容進(jìn)行審核和驗(yàn)證。

22、進(jìn)一步，所述通過維護(hù)和更新知識(shí)圖譜、醫(yī)學(xué)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫，構(gòu)建醫(yī)學(xué)知識(shí)庫，還包括：

23、建構(gòu)醫(yī)學(xué)術(shù)語表結(jié)構(gòu)，確定醫(yī)學(xué)術(shù)語的字段、內(nèi)容和屬性；

24、將醫(yī)學(xué)術(shù)語相應(yīng)信息導(dǎo)入醫(yī)學(xué)術(shù)語表結(jié)構(gòu)中，對(duì)醫(yī)學(xué)術(shù)語表進(jìn)行編輯，生成醫(yī)學(xué)術(shù)語庫；

25、進(jìn)行醫(yī)學(xué)術(shù)語庫的版本管理。

26、進(jìn)一步，所述通過維護(hù)和更新知識(shí)圖譜、醫(yī)學(xué)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫，構(gòu)建醫(yī)學(xué)知識(shí)庫，還包括：

27、收集醫(yī)學(xué)文獻(xiàn)、期刊、會(huì)議論文、臨床指南、病例報(bào)告，作為醫(yī)學(xué)文檔；

28、對(duì)醫(yī)學(xué)文檔進(jìn)行數(shù)據(jù)預(yù)處理，去除醫(yī)學(xué)文檔中無關(guān)信息，并格式化醫(yī)學(xué)文檔；

29、根據(jù)醫(yī)學(xué)領(lǐng)域、文檔類型對(duì)醫(yī)學(xué)文檔進(jìn)行分類；

30、基于不同的分類，將醫(yī)學(xué)文檔按大小切分成文本片段；

31、使用bert模型將文本片段進(jìn)行文本向量化，將文本向量存儲(chǔ)到醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫中。

32、進(jìn)一步，所述構(gòu)建向量索引，包括：

33、將文本向量存儲(chǔ)到索引結(jié)構(gòu)中；

34、將余弦相似度設(shè)定為比較文本向量的相似性度量標(biāo)準(zhǔn)。

35、進(jìn)一步，所述利用向量索引，根據(jù)問題解析模塊提取的關(guān)鍵信息，檢索相關(guān)的醫(yī)學(xué)文獻(xiàn)節(jié)點(diǎn)，獲取相應(yīng)的多源醫(yī)學(xué)知識(shí)信息，包括：

36、將問題解析模塊提取的關(guān)鍵信息轉(zhuǎn)換問查詢向量；

37、根據(jù)查詢向量利用向量索引找到與查詢向量相似的文本向量，并計(jì)算相應(yīng)的余弦相似度；

38、根據(jù)余弦相似度對(duì)找到的文本向量進(jìn)行降序排列，返回相關(guān)的醫(yī)學(xué)文檔，作為多源醫(yī)學(xué)知識(shí)信息。

39、進(jìn)一步，所述對(duì)多源醫(yī)學(xué)知識(shí)信息進(jìn)行整合，生成多源醫(yī)學(xué)知識(shí)片段，包括：

40、基于多源醫(yī)學(xué)知識(shí)信息對(duì)應(yīng)文本向量的余弦相似度，提取出余弦相似度降序排名前三的文本向量，生成多源醫(yī)學(xué)知識(shí)片段。

41、對(duì)比現(xiàn)有技術(shù)，本發(fā)明有益效果在于：本發(fā)明公開了一種基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，基于大語言模型，通過結(jié)合醫(yī)學(xué)知識(shí)圖譜、專業(yè)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)，構(gòu)建了一個(gè)深入且全面的醫(yī)學(xué)知識(shí)基礎(chǔ)。本系統(tǒng)采用文檔向量化和高效的向量索引技術(shù)，實(shí)現(xiàn)了對(duì)海量醫(yī)學(xué)數(shù)據(jù)的快速檢索，在生成回答時(shí)，不僅依賴于單一的知識(shí)源，而是綜合考慮來自知識(shí)圖譜、術(shù)語庫和文獻(xiàn)庫的信息，并結(jié)合大模型的深度語義理解能力，進(jìn)行綜合判斷和智能推理，生成準(zhǔn)確、深入且易于理解的醫(yī)學(xué)答案。

42、由此可見，本發(fā)明與現(xiàn)有技術(shù)相比，具有突出的實(shí)質(zhì)性特點(diǎn)和顯著的進(jìn)步，其實(shí)施的有益效果也是顯而易見的。

技術(shù)特征：

1.一種基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，其特征在于，所述醫(yī)學(xué)問題包括：

3.根據(jù)權(quán)利要求1所述的基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，其特征在于，所述采用自然語言處理技術(shù)對(duì)醫(yī)學(xué)問題進(jìn)行分析，識(shí)別并提取醫(yī)學(xué)問題中的關(guān)鍵信息，包括：

4.根據(jù)權(quán)利要求1所述的基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，其特征在于，所述通過維護(hù)和更新知識(shí)圖譜、醫(yī)學(xué)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫，構(gòu)建醫(yī)學(xué)知識(shí)庫，包括：

5.根據(jù)權(quán)利要求1所述的基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，其特征在于，所述通過維護(hù)和更新知識(shí)圖譜、醫(yī)學(xué)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫，構(gòu)建醫(yī)學(xué)知識(shí)庫，還包括：

6.根據(jù)權(quán)利要求1所述的基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，其特征在于，所述通過維護(hù)和更新知識(shí)圖譜、醫(yī)學(xué)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫，構(gòu)建醫(yī)學(xué)知識(shí)庫，還包括：

7.根據(jù)權(quán)利要求6所述的基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，其特征在于，所述構(gòu)建向量索引，包括：

8.根據(jù)權(quán)利要求7所述的基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，其特征在于，所述利用向量索引，根據(jù)問題解析模塊提取的關(guān)鍵信息，檢索相關(guān)的醫(yī)學(xué)文獻(xiàn)節(jié)點(diǎn)，獲取相應(yīng)的多源醫(yī)學(xué)知識(shí)信息，包括：

9.根據(jù)權(quán)利要求8所述的基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，其特征在于，所述對(duì)多源醫(yī)學(xué)知識(shí)信息進(jìn)行整合，生成多源醫(yī)學(xué)知識(shí)片段，包括：

技術(shù)總結(jié)
本發(fā)明提出的一種基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)，屬于醫(yī)學(xué)知識(shí)檢索技術(shù)領(lǐng)域。系統(tǒng)包括：用戶交互模塊，用于獲取醫(yī)學(xué)問題；問題解析模型，用于對(duì)醫(yī)學(xué)問題進(jìn)行分析，識(shí)別并提取醫(yī)學(xué)問題中的關(guān)鍵信息；知識(shí)管理模塊，用于通過維護(hù)和更新知識(shí)圖譜、醫(yī)學(xué)術(shù)語庫和醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫，構(gòu)建醫(yī)學(xué)知識(shí)庫；對(duì)醫(yī)學(xué)文獻(xiàn)進(jìn)行向量化處理；構(gòu)建向量索引，以對(duì)醫(yī)學(xué)文獻(xiàn)的檢索和訪問；醫(yī)學(xué)知識(shí)檢索模塊，用于利用向量索引，根據(jù)關(guān)鍵信息檢索相關(guān)的醫(yī)學(xué)文獻(xiàn)節(jié)點(diǎn)，獲取相應(yīng)的多源醫(yī)學(xué)知識(shí)信息；答案生成模塊，用于對(duì)多源醫(yī)學(xué)知識(shí)信息進(jìn)行整合，生成多源醫(yī)學(xué)知識(shí)片段；將多源醫(yī)學(xué)知識(shí)片段輸入到預(yù)訓(xùn)練的大型語言模型中，生成綜合總結(jié)答案。

技術(shù)研發(fā)人員：王范冰,鄧小寧,金劍,馬杰,王兵卡,蔡卓人
受保護(hù)的技術(shù)使用者：北方健康醫(yī)療大數(shù)據(jù)科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/26

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王范冰,鄧小寧,金劍,馬杰,王兵卡,蔡卓人
技術(shù)所有人：北方健康醫(yī)療大數(shù)據(jù)科技有限公司
我是此專利的發(fā)明人

上一篇：一種具有殺菌功能的玄關(guān)柜的制作方法
上一篇：一種沖壓鋁件模具用的鑲件的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于多來源醫(yī)學(xué)知識(shí)檢索增強(qiáng)的智能問答系統(tǒng)的制作方法