本申請涉及人工智能領域,尤其涉及一種模型驗證方法、裝置、電子設備、存儲介質(zhì)及程序產(chǎn)品。
背景技術:
1、隨著電子技術的發(fā)展,nlp(natural?language?processing,自然語言處理)技術的應用越來越廣泛。語言模型是處理nlp任務常用的工具之一。
2、一部分語言模型具有文本生成能力,可以對輸入模型的文本進行應答。該應答的實質(zhì)可以理解為,在模型訓練階段積累了一些知識儲備,在進行應答的過程中利用積累的知識儲備對輸入模型的文本進行文本補全處理,而不是根據(jù)輸入模型的文本執(zhí)行數(shù)據(jù)查詢操作并基于查詢結(jié)果對輸入模型的文本進行應答處理。
技術實現(xiàn)思路
1、本申請實施例提供了一種模型驗證方法、裝置、電子設備、存儲介質(zhì)及程序產(chǎn)品,可以高效地驗證第一文本生成模型是否可靠。
2、第一方面,本申請實施例提供了一種模型驗證方法,包括:
3、將第一文本輸入第一文本生成模型進行文本生成,得到所述第一文本的第一應答文本;
4、根據(jù)所述第一應答文本或所述第一文本,生成第二文本;
5、將所述第二文本輸入所述第一文本生成模型進行文本生成,得到所述第二文本的第二應答文本;
6、根據(jù)所述第一應答文本和所述第二應答文本,確定所述第一文本生成模型的驗證結(jié)果。
7、第二方面,本申請實施例提供了一種模型驗證裝置,包括:
8、生成單元,用于將第一文本輸入第一文本生成模型進行文本生成處理,得到所述第一文本的第一應答文本;
9、所述生成單元,還用于根據(jù)所述第一應答文本或所述第一文本,生成第二文本;
10、所述生成單元,還用于將所述第二文本輸入所述第一文本生成模型進行文本生成處理,得到所述第二文本的第二應答文本;
11、確定單元,用于根據(jù)所述第一應答文本和所述第二應答文本,確定所述第一文本生成模型的驗證結(jié)果。
12、第三方面,本申請實施例提供了一種電子設備,包括:處理器;以及,被配置為存儲計算機可執(zhí)行指令的存儲器,所述計算機可執(zhí)行指令在被執(zhí)行時使所述處理器執(zhí)行如第一方面所述的模型驗證方法。
13、第四方面,本申請實施例提供了一種計算機可讀存儲介質(zhì),用于存儲計算機可執(zhí)行指令,所述計算機可執(zhí)行指令在被處理器執(zhí)行時實現(xiàn)如第一方面所述的模型驗證方法。
14、第五方面,本申請實施例提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如第一方面所述的模型驗證方法。
15、可以看出,在本申請實施例中,首先,將第一文本輸入第一文本生成模型進行文本生成,得到第一文本的第一應答文本;然后,根據(jù)第一應答文本或第一文本,生成第二文本;接著,將第二文本輸入第一文本生成模型進行文本生成,得到第二文本的第二應答文本;最后,根據(jù)第一應答文本和第二應答文本,確定第一文本生成模型的驗證結(jié)果。以此,考慮到第一文本生成模型的文本生成的實質(zhì)是對輸入的文本進行文本補全,而不是數(shù)據(jù)查詢,因此,第一文本生成模型根據(jù)輸入的第一文本進行文本生成所得到的第一應答文本的文本內(nèi)容可能是真實可靠的,也可能是第一文本生成模型編造的,通過將根據(jù)第一應答文本或第一文本生成的第二文本輸入第一文本生成模型進行文本生成所得到的第二應答文本,進而,第一應答文本和第二應答文本可以相互驗證對方文本內(nèi)容的真實性。針對任意一個文本生成模型,該模型輸出錯誤內(nèi)容越頻繁,其準確性越低,模型越不可靠,該模型輸出錯誤內(nèi)容越稀有,其準確性越高,模型越可靠。因此,通過第一應答文本和第二應答文本相互驗證對方文本內(nèi)容的真實性,可以驗證第一文本生成模型是否可靠。另外,在整個驗證過程中,第二文本不是人工編寫的,而是根據(jù)第一應答文本或第一文本所生成的,減少了人工參與,提高了對話效率,從而間接提高了模型驗證效率。因此,本申請實施例提供的模型驗證方法可以高效地驗證第一文本生成模型是否可靠。
1.一種模型驗證方法,其特征在于,包括:
2.根據(jù)權利要求1所述的方法,其特征在于,所述第二文本包括第一子文本;根據(jù)所述第一應答文本,生成所述第二文本,包括:
3.根據(jù)權利要求1所述的方法,其特征在于,所述第二文本包括第二子文本;根據(jù)所述第一文本,生成所述第二文本,包括:
4.根據(jù)權利要求1所述的方法,其特征在于,所述將第一文本輸入第一文本生成模型進行文本生成,得到所述第一文本的第一應答文本之前,所述方法還包括:
5.根據(jù)權利要求2所述的方法,其特征在于,所述根據(jù)所述第一應答文本和所述第二應答文本,確定所述第一文本生成模型的驗證結(jié)果,包括:
6.根據(jù)權利要求5所述的方法,其特征在于,所述根據(jù)所述第三文本與所述目標信息源的比對結(jié)果,確定所述第一文本生成模型的驗證結(jié)果,包括:
7.根據(jù)權利要求2所述的方法,其特征在于,所述根據(jù)所述第一應答文本和所述第二應答文本,確定所述第一文本生成模型的驗證結(jié)果,包括:
8.根據(jù)權利要求1所述的方法,其特征在于,所述方法還包括:
9.根據(jù)權利要求1所述的方法,其特征在于,所述第一文本生成模型的驗證結(jié)果包括所述第一文本生成模型的驗證分數(shù);所述第一文本生成模型的數(shù)量為多個;所述方法還包括:
10.一種模型驗證裝置,其特征在于,包括:
11.一種電子設備,其特征在于,包括:
12.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)用于存儲計算機可執(zhí)行指令,所述計算機可執(zhí)行指令在被處理器執(zhí)行時實現(xiàn)如權利要求1至9中任一項所述的模型驗證方法。
13.一種計算機程序產(chǎn)品,其特征在于,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1至9任一項所述的模型驗證方法。