亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)與流程

文檔序號:40403164發(fā)布日期:2024-12-20 12:26閱讀:4來源:國知局
指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)與流程

本發(fā)明涉及車輛模型,尤其涉及一種指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)。


背景技術(shù):

1、在人工智能(ai)大模型訓(xùn)練領(lǐng)域,訓(xùn)練過程通常分為三個階段:通用知識預(yù)訓(xùn)練、專業(yè)領(lǐng)域預(yù)訓(xùn)練,以及專業(yè)領(lǐng)域的指令微調(diào)訓(xùn)練。指令微調(diào)訓(xùn)練以其高度的靈活性和可遷移性,已成為ai大模型訓(xùn)練中的一種流行方法。這種訓(xùn)練方式可以針對特定的任務(wù)或領(lǐng)域,對預(yù)訓(xùn)練模型進(jìn)行進(jìn)一步的優(yōu)化,以提高模型在特定任務(wù)上的表現(xiàn)。

2、當(dāng)前指令生成技術(shù)主要包括獲取預(yù)設(shè)語料庫中的多個文本,進(jìn)行預(yù)處理得到輸入表示。將輸入表示按預(yù)設(shè)規(guī)則處理,得到塊級別的文本。將塊級別文本輸入檢索庫進(jìn)行檢索,獲取一定數(shù)量的檢索文本。將輸入表示及檢索文本一起輸入預(yù)設(shè)模型中進(jìn)行訓(xùn)練,得到增強(qiáng)后的模型。

3、盡管現(xiàn)有的微調(diào)指令生成技術(shù)取得了一定進(jìn)展,但仍存在明顯不足。首先,對文本的格式有一定的要求,這限制了訓(xùn)練數(shù)據(jù)的多樣性和廣泛性。其次在處理文本時,段落的劃分可能不夠準(zhǔn)確,這可能影響模型對文本內(nèi)容的理解和訓(xùn)練效果。最后由于上述限制生成的訓(xùn)練數(shù)據(jù)可能存在質(zhì)量問題,這會直接影響模型訓(xùn)練的效果和最終性能。因此,迫切需要一種更為高效、準(zhǔn)確的方法,以提高訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性,同時降低對人工校對和數(shù)據(jù)準(zhǔn)備的依賴,提升整個訓(xùn)練流程的效率。


技術(shù)實(shí)現(xiàn)思路

1、本申請的主要目的在于提供一種指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì),旨在解決如何提高生成的指令微調(diào)數(shù)據(jù)的準(zhǔn)確性的技術(shù)問題。

2、為實(shí)現(xiàn)上述目的,本申請?zhí)岢鲆环N指令微調(diào)數(shù)據(jù)生成方法,所述方法包括:

3、獲取文本數(shù)據(jù);

4、將所述文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式,得到文本信息;

5、基于多個預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板,得到掩碼模板內(nèi)容;

6、將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配,得到問答對數(shù)據(jù);

7、基于所述問答對數(shù)據(jù),生成指令微調(diào)數(shù)據(jù)。

8、在一實(shí)施例中,所述基于多個預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板,得到掩碼模板內(nèi)容的步驟,包括:

9、確定多個預(yù)設(shè)模板,每個模板對應(yīng)不同的問答對生成場景,包括摘要模板、判斷模板、補(bǔ)全模板和歸因模板;

10、根據(jù)多個所述預(yù)設(shè)模板,構(gòu)建掩碼模板,其中掩碼模板包括一個或多個占位符,用于后續(xù)填充實(shí)際文本內(nèi)容;

11、根據(jù)所述掩碼模板,得到所述掩碼模板內(nèi)容。

12、在一實(shí)施例中,所述將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配,得到問答對數(shù)據(jù)的步驟,包括:

13、使用所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配,確定是否生成問答對;

14、當(dāng)匹配成功時,根據(jù)掩碼模板內(nèi)容填充所述文本信息,生成問答對數(shù)據(jù);

15、將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配之后,還包括:

16、當(dāng)匹配不成功時,擴(kuò)大所述文本信息范圍進(jìn)行匹配,直至達(dá)到文本數(shù)據(jù)范圍。

17、在一實(shí)施例中,所述基于所述問答對數(shù)據(jù),生成指令微調(diào)數(shù)據(jù)的步驟,包括:

18、基于所述問答對數(shù)據(jù)利用關(guān)鍵詞提取技術(shù),得到關(guān)鍵信息;

19、結(jié)合掩碼模板和所述關(guān)鍵信息,生成指令微調(diào)數(shù)據(jù)。

20、在一實(shí)施例中,所述將所述文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式,得到文本信息的步驟之后,包括:

21、識別并記錄轉(zhuǎn)換過程中的信息遺漏和錯識別問題;

22、根據(jù)所述信息遺漏和錯識別問題對所述文本信息進(jìn)行逐項(xiàng)校對,得到校對結(jié)果;

23、基于所述校對結(jié)果對所述文本信息進(jìn)行修正,得到修正后的文本信息。

24、在一實(shí)施例中,所述基于所述問答對數(shù)據(jù),生成指令微調(diào)數(shù)據(jù)的步驟之后,包括:

25、應(yīng)用預(yù)設(shè)裁判模型對所述指令微調(diào)數(shù)據(jù)進(jìn)行評估,得到評估結(jié)果;

26、根據(jù)評估結(jié)果對所述指令微調(diào)數(shù)據(jù)進(jìn)行分類,得到分類結(jié)果;

27、根據(jù)所述分類結(jié)果輸出指令數(shù)據(jù)至智能模型進(jìn)行優(yōu)化。

28、在一實(shí)施例中,所述根據(jù)評估結(jié)果對所述指令微調(diào)數(shù)據(jù)進(jìn)行分類,得到分類結(jié)果的步驟之后,包括:

29、根據(jù)所述分類結(jié)果,得到高置信度數(shù)據(jù)和低置信度數(shù)據(jù);

30、對所述低置信度的數(shù)據(jù)進(jìn)行校驗(yàn)和修正,得到修正后的數(shù)據(jù);

31、對修正后的數(shù)據(jù)重新進(jìn)行評估,直至滿足預(yù)設(shè)質(zhì)量標(biāo)準(zhǔn)。

32、此外,為實(shí)現(xiàn)上述目的,本申請還提出一種指令微調(diào)數(shù)據(jù)生成裝置,所述指令微調(diào)數(shù)據(jù)生成裝置包括:

33、獲取模塊,用于獲取文本數(shù)據(jù);

34、轉(zhuǎn)換模塊,用于將所述文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式,得到文本信息;

35、構(gòu)建模塊,用于基于多個預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板,得到掩碼模板內(nèi)容;

36、匹配模塊,用于將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配,生成問答對數(shù)據(jù);

37、結(jié)果模塊,用于基于所述問答對數(shù)據(jù),生成指令微調(diào)數(shù)據(jù)。

38、此外,為實(shí)現(xiàn)上述目的,本申請還提出一種介質(zhì),所述介質(zhì)為計算機(jī)可讀介質(zhì),所述介質(zhì)上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如上文所述的指令微調(diào)數(shù)據(jù)生成方法的步驟。

39、此外,為實(shí)現(xiàn)上述目的,本申請還提供一種計算機(jī)程序產(chǎn)品,所述計算機(jī)程序產(chǎn)品包括計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如上文所述的指令微調(diào)數(shù)據(jù)生成方法的步驟。

40、本申請通過獲取文本數(shù)據(jù),將文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式,得到文本信息,基于多個預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板,得到掩碼模板內(nèi)容,將文本信息與掩碼模板內(nèi)容進(jìn)行匹配,得到問答對數(shù)據(jù),基于問答對數(shù)據(jù),生成指令微調(diào)數(shù)據(jù)。通過文本數(shù)據(jù)轉(zhuǎn)換、掩碼模板匹配,生成指令微調(diào)數(shù)據(jù),提高了指令微調(diào)數(shù)據(jù)的準(zhǔn)確性。



技術(shù)特征:

1.一種指令微調(diào)數(shù)據(jù)生成方法,其特征在于,所述方法包括:

2.如權(quán)利要求1所述的方法,其特征在于,所述基于多個預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板,得到掩碼模板內(nèi)容的步驟,包括:

3.如權(quán)利要求1所述的方法,其特征在于,所述將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配,得到問答對數(shù)據(jù)的步驟,包括:

4.如權(quán)利要求1所述的方法,其特征在于,所述基于所述問答對數(shù)據(jù),生成指令微調(diào)數(shù)據(jù)的步驟,包括:

5.如權(quán)利要求1所述的方法,其特征在于,所述將所述文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式,得到文本信息的步驟之后,包括:

6.如權(quán)利要求1所述的方法,其特征在于,所述基于所述問答對數(shù)據(jù),生成指令微調(diào)數(shù)據(jù)的步驟之后,包括:

7.如權(quán)利要求6所述的方法,其特征在于,所述根據(jù)評估結(jié)果對所述指令微調(diào)數(shù)據(jù)進(jìn)行分類,得到分類結(jié)果的步驟之后,包括:

8.一種指令微調(diào)數(shù)據(jù)生成裝置,其特征在于,所述裝置包括:

9.一種指令微調(diào)數(shù)據(jù)生成設(shè)備,其特征在于,所述設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運(yùn)行的指令微調(diào)數(shù)據(jù)生成程序,所述指令微調(diào)數(shù)據(jù)生成程序配置為實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的指令微調(diào)數(shù)據(jù)生成方法的步驟。

10.一種介質(zhì),其特征在于,所述介質(zhì)上存儲有指令微調(diào)數(shù)據(jù)生成程序,所述指令微調(diào)數(shù)據(jù)生成程序被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的指令微調(diào)數(shù)據(jù)生成方法的步驟。


技術(shù)總結(jié)
本申請公開了一種指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì),涉及車輛模型技術(shù)領(lǐng)域,包括:通過獲取文本數(shù)據(jù),將文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式,得到文本信息,基于多個預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板,得到掩碼模板內(nèi)容,將文本信息與掩碼模板內(nèi)容進(jìn)行匹配,得到問答對數(shù)據(jù),基于問答對數(shù)據(jù),生成指令微調(diào)數(shù)據(jù)。通過文本數(shù)據(jù)轉(zhuǎn)換、掩碼模板匹配,生成指令微調(diào)數(shù)據(jù),提高了指令微調(diào)數(shù)據(jù)的準(zhǔn)確性。

技術(shù)研發(fā)人員:聶家威
受保護(hù)的技術(shù)使用者:嵐圖汽車科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/19
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1