本技術(shù)涉及人工智能,尤其涉及一種模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著人工智能技術(shù)的發(fā)展,模型已經(jīng)在自然語言處理、計(jì)算機(jī)視覺、多模態(tài)任務(wù)等多個(gè)領(lǐng)域展現(xiàn)出顯著效果。大模型通過大規(guī)模的訓(xùn)練數(shù)據(jù),能夠模擬人類的認(rèn)知過程,從而實(shí)現(xiàn)復(fù)雜問題的理解和處理。
2、相關(guān)技術(shù)中,以金融領(lǐng)域?yàn)槔?,?dāng)用戶通過金融應(yīng)用進(jìn)行投資管理時(shí),大模型會(huì)基于多種因素來為用戶提供合理的投資方案,而小模型僅會(huì)根據(jù)某一因素為用戶提供投資方案,這是因?yàn)榇竽P碗m然功能強(qiáng)大,但它們?cè)谶\(yùn)行時(shí)需要大量的計(jì)算資源,這在資源受限的環(huán)境下尤其成問題,因此會(huì)將大模型的推理能力遷移至小模型中,以避免推理時(shí)的計(jì)算資源占用問題,然而,推理能力遷移后的小模型在實(shí)際使用過程中,由于受限于模型的規(guī)模,所推理出的結(jié)果精準(zhǔn)度較低。故相關(guān)技術(shù)亟待提供一種模型訓(xùn)練方法以解決上述技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的主要目的在于提出一種模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),可以提高推理能力遷移后的小模型的推理能力,進(jìn)一步提高其推理出的結(jié)果的精準(zhǔn)度。
2、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第一方面提出了一種模型訓(xùn)練方法,所述方法包括:
3、獲取多個(gè)樣本數(shù)據(jù),將每個(gè)樣本數(shù)據(jù)分別輸入至第一推理模型,輸出多個(gè)初始思維鏈數(shù)據(jù);
4、確定每個(gè)所述初始思維鏈數(shù)據(jù)與對(duì)應(yīng)的樣本數(shù)據(jù)的一致性評(píng)分;
5、基于每個(gè)所述初始思維鏈數(shù)據(jù)的一致性評(píng)分,從多個(gè)所述初始思維鏈數(shù)據(jù)中篩選出候選思維鏈數(shù)據(jù);
6、對(duì)所述候選思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)提純處理,以得到目標(biāo)思維鏈數(shù)據(jù);
7、將所述目標(biāo)思維鏈數(shù)據(jù)輸入至待訓(xùn)練的第二推理模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的第二推理模型。
8、在一些實(shí)施例,所述對(duì)所述候選思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)提純處理,以得到目標(biāo)思維鏈數(shù)據(jù),包括:
9、對(duì)與樣本數(shù)據(jù)的一致性不符的候選思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)初步提純,得到提純思維鏈數(shù)據(jù);
10、將所述提純思維鏈數(shù)據(jù)輸入至待訓(xùn)練的第二推理模型,得到輸出思維鏈數(shù)據(jù);
11、當(dāng)所述輸出思維鏈數(shù)據(jù)與所述提純思維鏈數(shù)據(jù)的一致性不符時(shí),對(duì)所述提純思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)迭代提純,并將數(shù)據(jù)迭代提純后的提純思維鏈數(shù)據(jù)確定為所述提純思維鏈數(shù)據(jù),并返回執(zhí)行所述將所述提純思維鏈數(shù)據(jù)輸入至待訓(xùn)練的第二推理模型,得到輸出思維鏈數(shù)據(jù)的步驟,直至所述輸出思維鏈數(shù)據(jù)與所述提純思維鏈數(shù)據(jù)的一致性相符為止,將提純思維鏈數(shù)據(jù)確定為目標(biāo)思維鏈數(shù)據(jù)。
12、在一些實(shí)施例,所述對(duì)與樣本數(shù)據(jù)的一致性不符的候選思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)初步提純,得到提純思維鏈數(shù)據(jù),包括:
13、對(duì)與樣本數(shù)據(jù)的語義一致性不符的候選思維鏈數(shù)據(jù)進(jìn)行詞語替換;和\或
14、對(duì)與樣本數(shù)據(jù)的邏輯一致性不符的候選思維鏈數(shù)據(jù)進(jìn)行邏輯調(diào)整,得到提純思維鏈數(shù)據(jù);
15、所述對(duì)所述提純思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)迭代提純,并將數(shù)據(jù)迭代提純后的提純思維鏈數(shù)據(jù)確定為所述提純思維鏈數(shù)據(jù),包括:
16、對(duì)與輸出思維鏈數(shù)據(jù)的語義一致性不符的提純思維鏈數(shù)據(jù)進(jìn)行詞語替換;和\或
17、對(duì)與輸出思維鏈數(shù)據(jù)的邏輯一致性不符的提純思維鏈數(shù)據(jù)進(jìn)行邏輯調(diào)整,將詞語替換和\或詞語替換后的提純思維鏈數(shù)據(jù)確定為所述提純思維鏈數(shù)據(jù)。
18、在一些實(shí)施例,在所述對(duì)與樣本數(shù)據(jù)的語義一致性不符的候選思維鏈數(shù)據(jù)進(jìn)行詞語替換之前,還包括:
19、提取所述候選思維鏈數(shù)據(jù)的候選語義特征、候選邏輯特征;
20、提取所述樣本數(shù)據(jù)的樣本語義特征、樣本邏輯特征;
21、將候選語義特征與樣本語義特征的語義特征相似度未達(dá)到預(yù)設(shè)語義相似度的候選思維鏈數(shù)據(jù),確定為與樣本數(shù)據(jù)的語義一致性不符的候選思維鏈數(shù)據(jù);
22、將候選邏輯特征與樣本邏輯特征的邏輯特征相似度未達(dá)到預(yù)設(shè)邏輯相似度的候選思維鏈數(shù)據(jù),確定為與樣本數(shù)據(jù)的邏輯一致性不符的候選思維鏈數(shù)據(jù)。
23、在一些實(shí)施例,在所述對(duì)與輸出思維鏈數(shù)據(jù)的語義一致性不符的提純思維鏈數(shù)據(jù)進(jìn)行詞語替換之前,還包括:
24、提取所述提純思維鏈數(shù)據(jù)的提純語義特征、提純邏輯特征;
25、提取所述輸出思維鏈數(shù)據(jù)的輸出語義特征、輸出邏輯特征;
26、將提純語義特征與輸出語義特征的語義特征相似度未達(dá)到預(yù)設(shè)語義相似度的提純思維鏈數(shù)據(jù),確定為與輸出思維鏈數(shù)據(jù)的語義一致性不符的提純思維鏈數(shù)據(jù);
27、將提純邏輯特征與輸出邏輯特征的邏輯特征相似度未達(dá)到預(yù)設(shè)邏輯相似度的提純思維鏈數(shù)據(jù),確定為與輸出思維鏈數(shù)據(jù)的邏輯一致性不符的提純思維鏈數(shù)據(jù)。
28、在一些實(shí)施例,所述確定每個(gè)所述初始思維鏈數(shù)據(jù)與對(duì)應(yīng)的樣本數(shù)據(jù)的一致性評(píng)分,包括:
29、獲取每個(gè)所述初始思維鏈數(shù)據(jù)的初始邏輯特征、初始語義特征,以及每個(gè)所述初始思維鏈數(shù)據(jù)對(duì)應(yīng)的所述樣本數(shù)據(jù)的樣本邏輯特征、樣本語義特征;
30、確定每個(gè)所述初始思維鏈數(shù)據(jù)的初始語義特征,與對(duì)應(yīng)的所述樣本數(shù)據(jù)的樣本語義特征的目標(biāo)語義特征相似度;
31、確定每個(gè)所述初始思維鏈數(shù)據(jù)的初始邏輯特征,與對(duì)應(yīng)的所述樣本數(shù)據(jù)的樣本邏輯特征的目標(biāo)邏輯特征相似度;
32、基于每個(gè)所述初始思維鏈數(shù)據(jù)的目標(biāo)語義特征相似度以及目標(biāo)邏輯特征相似度,確定每個(gè)所述初始思維鏈數(shù)據(jù)的一致性評(píng)分。
33、在一些實(shí)施例,所述基于每個(gè)所述初始思維鏈數(shù)據(jù)的一致性評(píng)分,從多個(gè)所述初始思維鏈數(shù)據(jù)中篩選出候選思維鏈數(shù)據(jù),包括:
34、將每個(gè)所述初始思維鏈數(shù)據(jù)中一致性評(píng)分大于或等于預(yù)設(shè)一致性評(píng)分的初始思維鏈數(shù)據(jù),確定為候選思維鏈數(shù)據(jù)。
35、在一些實(shí)施例,在所述將所述目標(biāo)思維鏈數(shù)據(jù)輸入至待訓(xùn)練的第二推理模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的第二推理模型之后,還包括:
36、獲取目標(biāo)數(shù)據(jù),將所述目標(biāo)數(shù)據(jù)輸入到訓(xùn)練后的第二推理模型,得到預(yù)測(cè)結(jié)果。
37、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第二方面提出了一種模型訓(xùn)練裝置,包括:
38、第一輸入單元,用于獲取多個(gè)樣本數(shù)據(jù),將每個(gè)樣本數(shù)據(jù)分別輸入至第一推理模型,輸出多個(gè)初始思維鏈數(shù)據(jù);
39、確定單元,用于確定每個(gè)所述初始思維鏈數(shù)據(jù)與對(duì)應(yīng)的樣本數(shù)據(jù)的一致性評(píng)分;
40、篩選單元,用于基于每個(gè)所述初始思維鏈數(shù)據(jù)的一致性評(píng)分,從多個(gè)所述初始思維鏈數(shù)據(jù)中篩選出候選思維鏈數(shù)據(jù);
41、數(shù)據(jù)提純單元,用于對(duì)所述候選思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)提純處理,以得到目標(biāo)思維鏈數(shù)據(jù);
42、第二輸入單元,用于將所述目標(biāo)思維鏈數(shù)據(jù)輸入至待訓(xùn)練的第二推理模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的第二推理模型。
43、在一些實(shí)施例,數(shù)據(jù)提純單元,包括:
44、第一數(shù)據(jù)提純子單元,用于對(duì)與樣本數(shù)據(jù)的一致性不符的候選思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)初步提純,得到提純思維鏈數(shù)據(jù);
45、輸入子單元,用于將所述提純思維鏈數(shù)據(jù)輸入至待訓(xùn)練的第二推理模型,得到輸出思維鏈數(shù)據(jù);
46、第二數(shù)據(jù)提純子單元,當(dāng)所述輸出思維鏈數(shù)據(jù)與所述提純思維鏈數(shù)據(jù)的一致性不符時(shí),對(duì)所述提純思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)迭代提純,并將數(shù)據(jù)迭代提純后的提純思維鏈數(shù)據(jù)確定為所述提純思維鏈數(shù)據(jù),并返回執(zhí)行所述將所述提純思維鏈數(shù)據(jù)輸入至待訓(xùn)練的第二推理模型,得到輸出思維鏈數(shù)據(jù)的步驟,直至所述輸出思維鏈數(shù)據(jù)與所述提純思維鏈數(shù)據(jù)的一致性相符為止,將提純思維鏈數(shù)據(jù)確定為目標(biāo)思維鏈數(shù)據(jù)。
47、在一些實(shí)施例,所述第一數(shù)據(jù)提純子單元,用于:
48、對(duì)與樣本數(shù)據(jù)的語義一致性不符的候選思維鏈數(shù)據(jù)進(jìn)行詞語替換;和\或
49、對(duì)與樣本數(shù)據(jù)的邏輯一致性不符的候選思維鏈數(shù)據(jù)進(jìn)行邏輯調(diào)整,得到提純思維鏈數(shù)據(jù);
50、所述第二數(shù)據(jù)提純子單元,用于:
51、對(duì)與輸出思維鏈數(shù)據(jù)的語義一致性不符的提純思維鏈數(shù)據(jù)進(jìn)行詞語替換;和\或
52、對(duì)與輸出思維鏈數(shù)據(jù)的邏輯一致性不符的提純思維鏈數(shù)據(jù)進(jìn)行邏輯調(diào)整,將詞語替換和\或詞語替換后的提純思維鏈數(shù)據(jù)確定為所述提純思維鏈數(shù)據(jù)。
53、在一些實(shí)施例,所述第一數(shù)據(jù)提純子單元,還用于:
54、提取所述候選思維鏈數(shù)據(jù)的候選語義特征、候選邏輯特征;
55、提取所述樣本數(shù)據(jù)的樣本語義特征、樣本邏輯特征;
56、將候選語義特征與樣本語義特征的語義特征相似度未達(dá)到預(yù)設(shè)語義相似度的候選思維鏈數(shù)據(jù),確定為與樣本數(shù)據(jù)的語義一致性不符的候選思維鏈數(shù)據(jù);
57、將候選邏輯特征與樣本邏輯特征的邏輯特征相似度未達(dá)到預(yù)設(shè)邏輯相似度的候選思維鏈數(shù)據(jù),確定為與樣本數(shù)據(jù)的邏輯一致性不符的候選思維鏈數(shù)據(jù)。
58、在一些實(shí)施例,所述第二數(shù)據(jù)提純子單元,還用于:
59、提取所述提純思維鏈數(shù)據(jù)的提純語義特征、提純邏輯特征;
60、提取所述輸出思維鏈數(shù)據(jù)的輸出語義特征、輸出邏輯特征;
61、將提純語義特征與輸出語義特征的語義特征相似度未達(dá)到預(yù)設(shè)語義相似度的提純思維鏈數(shù)據(jù),確定為與輸出思維鏈數(shù)據(jù)的語義一致性不符的提純思維鏈數(shù)據(jù);
62、將提純邏輯特征與輸出邏輯特征的邏輯特征相似度未達(dá)到預(yù)設(shè)邏輯相似度的提純思維鏈數(shù)據(jù),確定為與輸出思維鏈數(shù)據(jù)的邏輯一致性不符的提純思維鏈數(shù)據(jù)。
63、在一些實(shí)施例,所述確定單元,用于:
64、獲取每個(gè)所述初始思維鏈數(shù)據(jù)的初始邏輯特征、初始語義特征,以及每個(gè)所述初始思維鏈數(shù)據(jù)對(duì)應(yīng)的所述樣本數(shù)據(jù)的樣本邏輯特征、樣本語義特征;
65、確定每個(gè)所述初始思維鏈數(shù)據(jù)的初始語義特征,與對(duì)應(yīng)的所述樣本數(shù)據(jù)的樣本語義特征的目標(biāo)語義特征相似度;
66、確定每個(gè)所述初始思維鏈數(shù)據(jù)的初始邏輯特征,與對(duì)應(yīng)的所述樣本數(shù)據(jù)的樣本邏輯特征的目標(biāo)邏輯特征相似度;
67、基于每個(gè)所述初始思維鏈數(shù)據(jù)的目標(biāo)語義特征相似度以及目標(biāo)邏輯特征相似度,確定每個(gè)所述初始思維鏈數(shù)據(jù)的一致性評(píng)分。
68、在一些實(shí)施例,所述篩選單元,用于:
69、將每個(gè)所述初始思維鏈數(shù)據(jù)中一致性評(píng)分大于或等于預(yù)設(shè)一致性評(píng)分的初始思維鏈數(shù)據(jù),確定為候選思維鏈數(shù)據(jù)。
70、在一些實(shí)施例,所述裝置,還用于:
71、獲取目標(biāo)數(shù)據(jù),將所述目標(biāo)數(shù)據(jù)輸入到訓(xùn)練后的第二推理模型,得到預(yù)測(cè)結(jié)果。
72、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第三方面提出了一種電子設(shè)備,所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述第一方面所述的方法。
73、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第四方面提出了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面所述的方法。
74、本技術(shù)提出的模型訓(xùn)練方法和裝置、電子設(shè)備及存儲(chǔ)介質(zhì),其通過獲取多個(gè)樣本數(shù)據(jù),將每個(gè)樣本數(shù)據(jù)分別輸入至第一推理模型,輸出多個(gè)初始思維鏈數(shù)據(jù);確定每個(gè)所述初始思維鏈數(shù)據(jù)與對(duì)應(yīng)的樣本數(shù)據(jù)的一致性評(píng)分;基于每個(gè)所述初始思維鏈數(shù)據(jù)的一致性評(píng)分,從多個(gè)所述初始思維鏈數(shù)據(jù)中篩選出候選思維鏈數(shù)據(jù);對(duì)所述候選思維鏈數(shù)據(jù)進(jìn)行數(shù)據(jù)提純處理,以得到目標(biāo)思維鏈數(shù)據(jù);將所述目標(biāo)思維鏈數(shù)據(jù)輸入至待訓(xùn)練的第二推理模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的第二推理模型。以此,通過在推理能力遷移的過程中,通過一致性評(píng)分以及數(shù)據(jù)提純處理的方式對(duì)思維鏈數(shù)據(jù)進(jìn)行優(yōu)化,最終得到用于對(duì)待訓(xùn)練的第二推理模型進(jìn)行訓(xùn)練的目標(biāo)思維鏈數(shù)據(jù),使得訓(xùn)練后的第二推理模型可以學(xué)習(xí)到與第一推理模型相符的推理能力,進(jìn)一步提高其推理出的結(jié)果的精準(zhǔn)度。