本申請涉及自然語言處理,尤其涉及一種文本處理模型的訓(xùn)練方法、文本處理方法及相關(guān)設(shè)備。
背景技術(shù):
1、經(jīng)典的案例推理(case-based?reasoning,cbr)系統(tǒng)至少包含如下三個主要步驟:檢索(retrieve)、重用(reuse)和修訂(revise),即通過重用和修訂檢索到的相似案例,來推斷待解決問題的解決方案。
2、然而,上述三個主要步驟需要借助不同的技術(shù)實現(xiàn),這些技術(shù)之間相互割裂,無法使案例推理系統(tǒng)的性能發(fā)揮到更佳的狀態(tài),導(dǎo)致推理結(jié)果不準(zhǔn)確。
技術(shù)實現(xiàn)思路
1、本申請實施例的目的提供一種文本處理模型的訓(xùn)練方法、文本處理方法及相關(guān)設(shè)備,有利于提高案例推理效果,得到的解答文本更準(zhǔn)確、更適應(yīng)業(yè)務(wù)。
2、為了實現(xiàn)上述目的,本申請實施例采用下述技術(shù)方案:
3、第一方面,本申請實施例提供一種文本處理模型的訓(xùn)練方法,包括:
4、通過文本處理模型,從案例庫中選取與第一問題文本相似度滿足條件的第一案例文本,以及基于所述第一問題文本和所述第一案例文本,生成第一提示詞;
5、基于所述第一提示詞,確定所述第一問題文本的第一解答文本;
6、基于所述第一解答文本對所述文本處理模型進(jìn)行優(yōu)化,得到訓(xùn)練后的文本處理模型。
7、第二方面,本申請實施例提供一種文本處理方法,包括:
8、通過文本處理模型,從案例庫中選取與目標(biāo)問題文本相似度滿足條件的目標(biāo)案例文本,以及基于所述目標(biāo)問題文本和所述目標(biāo)案例文本,生成目標(biāo)提示詞;
9、基于所述目標(biāo)提示詞,確定所述目標(biāo)問題文本的目標(biāo)解答文本。
10、第三方面,本申請實施例提供一種文本處理模型的訓(xùn)練裝置,包括:
11、第一生成單元,用于通過文本處理模型,從案例庫中選取與第一問題文本相似度滿足條件的第一案例文本,以及基于所述第一問題文本和所述第一案例文本,生成第一提示詞;
12、第一確定單元,用于基于所述第一提示詞,確定所述第一問題文本的第一解答文本;
13、優(yōu)化單元,用于基于所述第一解答文本對所述文本處理模型進(jìn)行優(yōu)化,得到訓(xùn)練后的文本處理模型。
14、第四方面,本申請實施例提供一種文本處理裝置,包括:
15、第二生成單元,用于通過文本處理模型,從案例庫中選取與目標(biāo)問題文本相似度滿足條件的目標(biāo)案例文本,以及基于所述目標(biāo)問題文本和所述目標(biāo)案例文本,生成目標(biāo)提示詞;
16、第二確定單元,用于基于所述目標(biāo)提示詞,確定所述目標(biāo)問題文本的目標(biāo)解答文本。
17、第五方面,本申請實施例提供一種電子設(shè)備,包括:
18、處理器;
19、用于存儲所述處理器可執(zhí)行指令的存儲器;
20、其中,所述處理器被配置為執(zhí)行所述指令,以實現(xiàn)如第一方面所述的文本處理模型的訓(xùn)練方法;或者,所述處理器被配置為執(zhí)行所述指令,以實現(xiàn)如第二方面所述的文本處理方法。
21、第六方面,本申請實施例提供一種計算機(jī)可讀存儲介質(zhì),當(dāng)所述存儲介質(zhì)中的指令由電子設(shè)備的處理器執(zhí)行時,使得電子設(shè)備能夠執(zhí)行如第一方面所述的文本處理模型的訓(xùn)練方法;或者,當(dāng)所述存儲介質(zhì)中的指令由電子設(shè)備的處理器執(zhí)行時,使得電子設(shè)備能夠執(zhí)行如第二方面所述的文本處理方法。
22、第七方面,本申請實施例提供一種計算機(jī)程序產(chǎn)品,所述計算機(jī)程序產(chǎn)品包括存儲了計算機(jī)程序的非瞬時性計算機(jī)可讀存儲介質(zhì),所述計算機(jī)程序可操作來使計算機(jī)執(zhí)行如第一方面所述的文本處理模型的訓(xùn)練方法或者如第二方面所述的文本處理方法中的部分或全部步驟。
23、本申請實施例采用的上述至少一個技術(shù)方案能夠達(dá)到以下有益效果:
24、引入文本處理模型來實現(xiàn)上述案例推理系統(tǒng)的各個步驟,具體包括:首先,利用文本處理模型從案例庫中選取與第一問題相似度滿足條件的第一案例文本,實現(xiàn)檢索步驟;其次,基于第一問題文本和第一案例文本生成第一提示詞,進(jìn)而基于第一提示詞對第一問題文本進(jìn)行案例推理,得到第一問題文本的第一解答文本,實現(xiàn)重用和修訂步驟。在此基礎(chǔ)上,利用機(jī)器學(xué)習(xí)領(lǐng)域的優(yōu)化算法,將使第一解答文本滿足質(zhì)量要求作為目標(biāo)導(dǎo)向,基于第一解答文本對文本處理模型進(jìn)行優(yōu)化,實現(xiàn)對文本處理模型的端到端優(yōu)化訓(xùn)練,這個優(yōu)化過程會將上述檢索、重用和修訂等步驟緊密關(guān)聯(lián)起來,即上一個步驟的處理結(jié)果會作為影響下一個步驟的處理過程,進(jìn)而對整個案件推理過程產(chǎn)生影響。因此,上述優(yōu)化過程可以實現(xiàn)案例推理過程的整體優(yōu)化,而無需對每個步驟進(jìn)行單獨的優(yōu)化,避免各個步驟的實現(xiàn)技術(shù)之間相互割裂而導(dǎo)致的整體案例推理性能不佳的問題。由此,訓(xùn)練后的文本處理模型在整體上具有較高的準(zhǔn)確性,基于文本處理模型進(jìn)行案例推理,不僅能夠提升推理結(jié)果的準(zhǔn)確性,而且能夠適配到各種任務(wù)上,更適應(yīng)技術(shù)迭代和頻繁變化的業(yè)務(wù)場景。
1.一種文本處理模型的訓(xùn)練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從案例庫中選取與第一問題文本相似度滿足條件的第一案例文本,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述案例庫中的每個案例文本和所述第一問題文本進(jìn)行跨注意力運算,得到每個所述案例文本的相似度,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述第一問題文本和所述第一案例文本,生成第一提示詞,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于所述第一案例文本,確定與所述第一問題文本匹配的第一提示模板,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于所述第一案例文本的相似度和所述多個模板元素的可選取值集合,確定與所述第一問題文本匹配的第一提示模板,包括:
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于所述第一案例文本的相似度和所述多個模板元素的可選取值集合,確定與所述第一問題文本匹配的第一提示模板,包括:
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述通過文本處理模型,從案例庫中選取與第一問題文本相似度滿足條件的第一案例文本之前,所述方法還包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述第二提示模板包括應(yīng)答提示模板;
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述第二提示模板包括修正提示模板,所述候選案例文本還包括所述第二問題文本的候選解答文本;
11.根據(jù)權(quán)利要求1至10中任一項所述的方法,其特征在于,在所述基于所述第一解答文本對所述文本處理模型進(jìn)行優(yōu)化,得到訓(xùn)練后的文本處理模型之后,所述方法還包括:
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述第一案例文本包括案例問題文本;
13.一種文本處理方法,其特征在于,包括:
14.一種文本處理模型的訓(xùn)練裝置,其特征在于,包括:
15.一種文本處理裝置,其特征在于,包括:
16.一種電子設(shè)備,其特征在于,包括:
17.一種計算機(jī)可讀存儲介質(zhì),其特征在于,當(dāng)所述存儲介質(zhì)中的指令由電子設(shè)備的處理器執(zhí)行時,使得電子設(shè)備能夠執(zhí)行如權(quán)利要求1至12中任一項所述的文本處理模型的訓(xùn)練方法;或者,當(dāng)所述存儲介質(zhì)中的指令由電子設(shè)備的處理器執(zhí)行時,使得電子設(shè)備能夠執(zhí)行如權(quán)利要求13所述的文本處理方法。
18.一種計算機(jī)程序產(chǎn)品,其特征在于,所述計算機(jī)程序產(chǎn)品包括存儲了計算機(jī)程序的非瞬時性計算機(jī)可讀存儲介質(zhì),所述計算機(jī)程序可操作來使計算機(jī)執(zhí)行如權(quán)利要求1至12中任一項所述的文本處理模型的訓(xùn)練方法或者如權(quán)利要求13所述的文本處理方法中的部分或全部步驟。