本發(fā)明涉及人工智能,具體涉及一種基于意圖識(shí)別的檢索增強(qiáng)生成、問答方法及系統(tǒng)。
背景技術(shù):
1、檢索增強(qiáng)生成(retrieval-augmented?generation,rag)是一種將信息檢索與生成模型相結(jié)合的技術(shù),旨在提高生成文本的準(zhǔn)確性和豐富性。目前,行業(yè)內(nèi)通常利用語(yǔ)言模型來對(duì)原始輸入進(jìn)行語(yǔ)義理解,進(jìn)而進(jìn)行檢索。例如,專利cn117909466a提出了一種領(lǐng)域問答系統(tǒng),該系統(tǒng)僅通過一個(gè)小語(yǔ)言模型對(duì)用戶輸入進(jìn)行意圖識(shí)別及問題改寫,并直接基于改寫后的問題進(jìn)行檢索。但是,由于語(yǔ)言模型泛化能力的局限性,在實(shí)際使用過程中,往往出現(xiàn)語(yǔ)言模型的語(yǔ)義理解結(jié)果與用戶實(shí)際意圖偏差較大的問題,基于語(yǔ)言模型的語(yǔ)義理解結(jié)果直接進(jìn)行檢索增強(qiáng)的效果并不佳。
技術(shù)實(shí)現(xiàn)思路
1、發(fā)明目的:本發(fā)明旨在提出一種基于意圖識(shí)別的檢索增強(qiáng)生成、問答方法及系統(tǒng),該方案能夠根據(jù)具體的下游業(yè)務(wù)場(chǎng)景進(jìn)行提示信息的精準(zhǔn)改寫,從而提高檢索增強(qiáng)生成結(jié)果的準(zhǔn)確性。
2、
技術(shù)實(shí)現(xiàn)要素:
為實(shí)現(xiàn)上述目的,本發(fā)明提出以下技術(shù)方案:
3、第一方面,提供了一種基于意圖識(shí)別的檢索增強(qiáng)生成方法,包括:
4、獲取用戶輸入的第一提示文本;
5、利用大語(yǔ)言模型的思維鏈對(duì)所述第一提示文本進(jìn)行基于意圖識(shí)別的鏈?zhǔn)酵评?,以確定所述第一提示文本的問題類型;
6、根據(jù)所述第一提示文本的問題類型,選擇對(duì)應(yīng)的提示改寫模型,利用所述提示改寫模型采用退一步提示策略來將所述第一提示文本抽象為更概括的、指向預(yù)設(shè)業(yè)務(wù)類型的第二提示文本;
7、基于所述第二提示文本,在信息源中檢索相關(guān)信息;
8、利用所述相關(guān)信息對(duì)所述第一提示文本進(jìn)行增強(qiáng),以生成所述第一提示文本的響應(yīng)信息。
9、作為第一方面所述方法的一種可選實(shí)施方式,利用大語(yǔ)言模型的思維鏈對(duì)所述第一提示文本進(jìn)行基于意圖識(shí)別的鏈?zhǔn)酵评?,以確定所述第一提示文本的問題類型,具體包括:
10、根據(jù)預(yù)先設(shè)置的角色任務(wù)和預(yù)先構(gòu)建的問題類型,構(gòu)建提示信息;
11、將所述第一提示文本分解為具有邏輯順序的若干子問題;
12、按照所述若干子問題的邏輯順序,對(duì)所述若干子問題進(jìn)行逐步推理,并在每一步驟的推理過程中,基于上一步驟的推理結(jié)果和當(dāng)前的子問題進(jìn)行增強(qiáng)檢索,并基于檢索結(jié)果、所述提示信息、上一步驟的推理結(jié)果和當(dāng)前的子問題,得到當(dāng)前步驟的推理結(jié)果;
13、將所述若干子問題的推理結(jié)果進(jìn)行整合,得到總的推理結(jié)果;
14、根據(jù)所述總的推理結(jié)果來確定所述第一提示文本對(duì)應(yīng)的問題類型。
15、作為第一方面所述方法的一種可選實(shí)施方式,每個(gè)問題類型對(duì)應(yīng)的提示改寫模型是針對(duì)所述問題類型以及所述問題類型對(duì)應(yīng)的業(yè)務(wù)類型來訓(xùn)練的。
16、第二方面,提供了一種問答方法,包括:
17、獲取目標(biāo)問題;
18、采用上述的基于意圖識(shí)別的檢索增強(qiáng)生成方法對(duì)所述目標(biāo)問題進(jìn)行檢索增強(qiáng)生成,以得到針對(duì)所述目標(biāo)問題的答復(fù)。
19、第三方面,提供了一種基于意圖識(shí)別的檢索增強(qiáng)生成系統(tǒng),包括:
20、第一數(shù)據(jù)獲取模塊,配置為獲取用戶輸入的第一提示文本;
21、意圖識(shí)別模塊,配置為利用大語(yǔ)言模型的思維鏈對(duì)所述第一提示文本進(jìn)行基于意圖識(shí)別的鏈?zhǔn)酵评?,以確定所述第一提示文本的問題類型;
22、提示改寫模塊,配置為根據(jù)所述第一提示文本的問題類型,選擇對(duì)應(yīng)的提示改寫模型,利用所述提示改寫模型采用退一步提示策略來將所述第一提示文本抽象為更概括的、指向預(yù)設(shè)業(yè)務(wù)類型的第二提示文本;
23、檢索增強(qiáng)模塊,配置為基于所述第二提示文本,在信息源中檢索相關(guān)信息;利用所述相關(guān)信息對(duì)所述第一提示文本進(jìn)行增強(qiáng),以生成所述第一提示文本的響應(yīng)信息。
24、作為第三方面所述系統(tǒng)的一種可選實(shí)施方式,所述意圖識(shí)別模塊具體用于:
25、根據(jù)預(yù)先設(shè)置的角色任務(wù)和預(yù)先構(gòu)建的問題類型,構(gòu)建提示信息;
26、將所述第一提示文本分解為具有邏輯順序的若干子問題;
27、按照所述若干子問題的邏輯順序,對(duì)所述若干子問題進(jìn)行逐步推理,并在每一步驟的推理過程中,基于上一步驟的推理結(jié)果和當(dāng)前的子問題進(jìn)行增強(qiáng)檢索,并基于檢索結(jié)果、所述提示信息、上一步驟的推理結(jié)果和當(dāng)前的子問題,得到當(dāng)前步驟的推理結(jié)果;
28、將所述若干子問題的推理結(jié)果進(jìn)行整合,得到總的推理結(jié)果;
29、根據(jù)所述總的推理結(jié)果來確定所述第一提示文本對(duì)應(yīng)的問題類型。
30、作為第三方面所述系統(tǒng)的一種可選實(shí)施方式,所述系統(tǒng)還包括預(yù)訓(xùn)練模塊,所述預(yù)訓(xùn)練模塊配置為針對(duì)每一個(gè)預(yù)設(shè)的問題類型和所述問題類型對(duì)應(yīng)的業(yè)務(wù)類型,預(yù)先訓(xùn)練所述問題類型對(duì)應(yīng)的提示改寫模型。
31、第四方面,提供了一種問答系統(tǒng),包括:
32、第二數(shù)據(jù)獲取模塊,配置為獲取目標(biāo)問題;
33、答復(fù)生成模塊,配置為采用上述的基于意圖識(shí)別的檢索增強(qiáng)生成方法對(duì)所述目標(biāo)問題進(jìn)行檢索增強(qiáng)生成,以得到針對(duì)所述目標(biāo)問題的答復(fù)。
34、第五方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在電子設(shè)備上運(yùn)行時(shí),使得所述電子設(shè)備執(zhí)行上述的基于意圖識(shí)別的檢索增強(qiáng)生成方法,或者,執(zhí)行上述的問答方法。
35、第六方面,提供了一種電子設(shè)備,包括:
36、至少一個(gè)存儲(chǔ)器,用于存儲(chǔ)程序;
37、至少一個(gè)處理器,用于執(zhí)行所述存儲(chǔ)器存儲(chǔ)的程序,當(dāng)所述存儲(chǔ)器存儲(chǔ)的程序被執(zhí)行時(shí),所述處理器用于執(zhí)行上述的基于意圖識(shí)別的檢索增強(qiáng)生成方法,或者,執(zhí)行上述的問答方法。
38、有益效果:本說明書實(shí)施例所述的基于意圖識(shí)別的檢索增強(qiáng)生成方法的有益效果在于,該方法采用思維鏈分析技術(shù)對(duì)用戶輸入的第一提示文本進(jìn)行意圖分析,能夠更準(zhǔn)確地識(shí)別第一提示文本的意圖。在此基礎(chǔ)上,采用多模型協(xié)作的架構(gòu),基于第一提示文本的意圖識(shí)別結(jié)果,精準(zhǔn)選擇對(duì)應(yīng)的提示改寫模型來對(duì)第一提示文本進(jìn)行進(jìn)一步修正,利用不同問題類型的改寫模型的優(yōu)勢(shì),提升了問題改寫的效果和質(zhì)量,以使改寫后的第二提示文本能夠精準(zhǔn)指向預(yù)設(shè)業(yè)務(wù)類型,從而可以靈活地匹配下游任務(wù)。最后,采用退一步提示法,讓大語(yǔ)言模型從更高層次的抽象問題入手,能夠從更廣泛的信息中找到解答線索,提高了答案的全面性和準(zhǔn)確性。
39、本說明書實(shí)施例所述的基于意圖識(shí)別的檢索增強(qiáng)生成系統(tǒng)、問答方法及系統(tǒng)同樣具有上述有益效果。
1.基于意圖識(shí)別的檢索增強(qiáng)生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用大語(yǔ)言模型的思維鏈對(duì)所述第一提示文本進(jìn)行基于意圖識(shí)別的鏈?zhǔn)酵评恚源_定所述第一提示文本的問題類型,具體包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,每個(gè)問題類型對(duì)應(yīng)的提示改寫模型是針對(duì)所述問題類型以及所述問題類型對(duì)應(yīng)的業(yè)務(wù)類型來訓(xùn)練的。
4.一種問答方法,其特征在于,包括:
5.一種基于意圖識(shí)別的檢索增強(qiáng)生成系統(tǒng),其特征在于,包括:
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述意圖識(shí)別模塊具體用于:
7.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括預(yù)訓(xùn)練模塊,所述預(yù)訓(xùn)練模塊配置為針對(duì)每一個(gè)預(yù)設(shè)的問題類型和所述問題類型對(duì)應(yīng)的業(yè)務(wù)類型,預(yù)先訓(xùn)練所述問題類型對(duì)應(yīng)的提示改寫模型。
8.一種問答系統(tǒng),其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在電子設(shè)備上運(yùn)行時(shí),使得所述電子設(shè)備執(zhí)行如權(quán)利要求1至3任一所述的方法,或者,執(zhí)行如權(quán)利要求4所述的方法。
10.一種電子設(shè)備,包括: