1.一種數(shù)據(jù)增強(qiáng)方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于預(yù)設(shè)的約束條件,對(duì)所述多個(gè)擴(kuò)展實(shí)體詞進(jìn)行實(shí)體詞處理,得到多個(gè)樣本語句,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述約束條件包括保持各所述目標(biāo)擴(kuò)展實(shí)體詞的文本內(nèi)容不變,且,插詞填充后每個(gè)目標(biāo)擴(kuò)展實(shí)體詞的上下文內(nèi)容屬于指定實(shí)體詞標(biāo)簽中的實(shí)體詞;所述按照所述約束條件對(duì)各所述目標(biāo)擴(kuò)展實(shí)體詞進(jìn)行插詞填充處理,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取各所述目標(biāo)擴(kuò)展實(shí)體詞之間插槽中待填充的文本信息,包括:
5.根據(jù)權(quán)利要求2-4任一項(xiàng)所述的方法,其特征在于,所述文本生成模型的訓(xùn)練過程包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)各所述語料中各實(shí)體詞的重要性量化值,得到各所述語料的多個(gè)語料序列,包括:
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,訓(xùn)練數(shù)據(jù)對(duì)包括語料和所述語料的多組語料序列對(duì);所述根據(jù)各所述語料的多個(gè)語料序列,得到各所述語料的訓(xùn)練數(shù)據(jù)對(duì),包括:
8.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,所述數(shù)據(jù)集包括各所述實(shí)體詞的實(shí)體詞標(biāo)簽;所述根據(jù)數(shù)據(jù)集內(nèi)各初始語句中的實(shí)體詞,獲取多個(gè)擴(kuò)展實(shí)體詞,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述根據(jù)各所述平均文本向量,對(duì)候選實(shí)體詞集合中的各候選實(shí)體詞進(jìn)行有效性驗(yàn)證,包括:
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述根據(jù)所述目標(biāo)實(shí)體詞標(biāo)簽對(duì)應(yīng)的實(shí)體詞,對(duì)所述候選實(shí)體詞進(jìn)行有效性驗(yàn)證,包括:
11.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,對(duì)所述多個(gè)樣本語句中的擴(kuò)展實(shí)體詞進(jìn)行標(biāo)注,得到所述數(shù)據(jù)集的增強(qiáng)數(shù)據(jù)集,包括:
12.一種數(shù)據(jù)增強(qiáng)裝置,其特征在于,所述裝置包括: