進行對話的方法與流程

文檔序號：40319989發(fā)布日期：2024-12-18 12:56閱讀：12來源：國知局

本公開涉及進行對話的方法、計算設(shè)備、存儲介質(zhì)和程序產(chǎn)品等。

背景技術(shù)：

1、大語言模型在解決領(lǐng)域適用性問題時，往往需要通過微調(diào)來實現(xiàn)領(lǐng)域內(nèi)效果增強。然而由于部分領(lǐng)域數(shù)據(jù)在模型預(yù)訓練時沒涉及到，因此通常需要較多的微調(diào)樣本，而過多的微調(diào)樣本容易導致數(shù)據(jù)失衡從而產(chǎn)生額外的幻覺問題。

技術(shù)實現(xiàn)思路

1、本公開實施例提供了進行對話的方法以及相應(yīng)的執(zhí)行這些方法的計算設(shè)備、非暫時性機器可讀存儲介質(zhì)和計算機程序產(chǎn)品。

2、根據(jù)本公開實施例的第一個方面，提供了一種進行對話的方法，包括：接收請求文本；使用文本分類模型對所述請求文本進行分類，獲得所述請求文本所屬的問答領(lǐng)域；構(gòu)建提示，其中所述提示包括所述請求文本以及所述請求文本所屬的所述問答領(lǐng)域；以及將所述提示輸入大語言模型，得到與所述請求文本對應(yīng)的回答。

3、可選地，所述大語言模型是經(jīng)過微調(diào)的大語言模型，對大語言模型進行微調(diào)的過程包括：獲得屬于第一問答領(lǐng)域的一個或多個多輪對話；在所述一個或多個多輪對話中的相鄰兩輪對話之間插入至少一輪噪音對話，其中所述至少一輪噪音對話為與所述第一問答領(lǐng)域不同的問答領(lǐng)域的對話；以及使用一個或多個插入了所述至少一輪噪音對話的多輪對話作為微調(diào)樣本，對大語言模型進行微調(diào)，直到滿足微調(diào)停止條件，其中所述微調(diào)停止條件包括損失函數(shù)不再下降或者測試集指標達標或者迭代達到預(yù)設(shè)的微調(diào)次數(shù)。

4、可選地，所述相鄰兩輪對話是從所述一個或多個多輪對話中隨機選擇的相鄰兩輪對話；所述至少一輪噪音對話是從與所述第一問答領(lǐng)域不同的問答領(lǐng)域的對話中隨機選擇得到的。

5、可選地，所述噪音對話與所述相鄰兩輪對話有相關(guān)性，其中所述相關(guān)性包括：所述噪音對話包含與所述相鄰兩輪對話中的至少一輪對話中的實體相同或相似的實體；或者所述噪音對話中的一個槽位與所述相鄰兩輪對話中的至少一輪對話中的一個實體相似；或者所述噪音對話中的一個實體與所述相鄰兩輪對話中的至少一輪對話中的一個槽位相似；或者所述噪音對話與所述相鄰兩輪對話中的至少一輪對話的相似度超過閾值；或者在預(yù)定的一組噪音對話中所述噪音對話與所述相鄰兩輪對話中的至少一輪對話的相似度最高。

6、可選地，所述文本分類模型的訓練過程包括：預(yù)定義多個問答領(lǐng)域；按照所述預(yù)定義的多個問答領(lǐng)域分別標注多個對話作為訓練樣本；使用所述訓練樣本訓練所述文本分類模型，直到滿足訓練停止條件，其中所述訓練停止條件包括損失函數(shù)不再下降或者測試集指標達標或者迭代達到預(yù)設(shè)的訓練次數(shù)。

7、可選地，將所述提示輸入大語言模型，得到與所述請求文本對應(yīng)的回答，包括：使用所述大語言模型為所述提示生成一個或多個推理路徑；所述大語言模型至少基于所述一個或多個推理路徑為所述提示生成一個或多個候選回答；從所述一個或多個候選回答中確定所述回答。

8、根據(jù)本公開實施例的第二個方面，提供了一種對話裝置，包括：接收單元，用于接收請求文本；分類單元，用于使用文本分類模型對所述請求文本進行分類，獲得所述請求文本所屬的問答領(lǐng)域；構(gòu)建單元，用于構(gòu)建提示，其中所述提示包括所述請求文本以及所述請求文本所屬的所述問答領(lǐng)域；以及回復單元，用于將所述提示輸入大語言模型，得到與所述請求文本對應(yīng)的回答。

9、根據(jù)本公開實施例的第三個方面，提供了一種計算設(shè)備，包括：處理器；以及存儲器，其上存儲有可執(zhí)行代碼，當可執(zhí)行代碼被處理器執(zhí)行時，使處理器執(zhí)行如上述第一個方面中的任一方案所述的方法。

10、根據(jù)本公開實施例的第四個方面，提供了一種非暫時性機器可讀存儲介質(zhì)，其上存儲有可執(zhí)行代碼，當可執(zhí)行代碼被電子設(shè)備的處理器執(zhí)行時，使處理器執(zhí)行如上述第一個方面中的任一方案所述的方法。

11、根據(jù)本公開實施例的第五個方面，提供了一種計算機程序產(chǎn)品，包括可執(zhí)行代碼，當所述可執(zhí)行代碼被電子設(shè)備的處理器執(zhí)行時，使所述處理器執(zhí)行如上述第一個方面中的任一方案所述的方法。

技術(shù)特征：

1.一種進行對話的方法，包括：

2.根據(jù)權(quán)利要求1所述的方法，其中，

3.根據(jù)權(quán)利要求2所述的方法，其中，

4.根據(jù)權(quán)利要求2所述的方法，其中，

5.根據(jù)權(quán)利要求1所述的方法，其中，

6.根據(jù)權(quán)利要求1所述的方法，其中，將所述提示輸入大語言模型，得到與所述請求文本對應(yīng)的回答，包括：

7.一種對話裝置，包括：

8.一種計算設(shè)備，包括：

9.一種非暫時性機器可讀存儲介質(zhì)，其上存儲有可執(zhí)行代碼，當所述可執(zhí)行代碼被電子設(shè)備的處理器執(zhí)行時，使所述處理器執(zhí)行如權(quán)利要求1-6中任一項所述的方法。

10.一種計算機程序產(chǎn)品，包括可執(zhí)行代碼，當所述可執(zhí)行代碼被電子設(shè)備的處理器執(zhí)行時，使所述處理器執(zhí)行如權(quán)利要求1-6中任何一項所述的方法。

技術(shù)總結(jié)
本公開涉及一種進行對話的方法，其包括：接收請求文本；使用文本分類模型對所述請求文本進行分類，獲得所述請求文本所屬的問答領(lǐng)域；構(gòu)建提示，其中所述提示包括所述請求文本以及所述請求文本所屬的所述問答領(lǐng)域；以及將所述提示輸入大語言模型，得到與所述請求文本對應(yīng)的回答。利用本公開的方法，能夠有效解決大模型幻覺問題。

技術(shù)研發(fā)人員：安旭
受保護的技術(shù)使用者：武漢星紀魅族科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/17

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：安旭
技術(shù)所有人：武漢星紀魅族科技有限公司
我是此專利的發(fā)明人

上一篇：一種竹材分揀機的上料裝置的制作方法
上一篇：一種薄膜邊料造粒機的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

進行對話的方法與流程