1.一種基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建法律文本語(yǔ)法樹(shù)的方法,其特征在于,所述方法包括:
獲取法律服務(wù)的訓(xùn)練文本;
對(duì)所述訓(xùn)練文本進(jìn)行詞向量稀疏表示;
根據(jù)所述詞向量稀疏表示通過(guò)DNN對(duì)所述訓(xùn)練文本進(jìn)行語(yǔ)義標(biāo)注;
根據(jù)所述語(yǔ)義標(biāo)注對(duì)所述訓(xùn)練文本進(jìn)行依存描述,構(gòu)建得到法律文本語(yǔ)法樹(shù)。
2.根據(jù)權(quán)利要求1所述的基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建法律文本語(yǔ)法樹(shù)的方法,其特征在于,所述獲取法律服務(wù)的訓(xùn)練文本,包括:
由網(wǎng)絡(luò)爬蟲從互聯(lián)網(wǎng)獲取法律服務(wù)相關(guān)的數(shù)據(jù);
去除所述數(shù)據(jù)中的非法律要素,得到訓(xùn)練文本。
3.根據(jù)權(quán)利要求1所述的基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建法律文本語(yǔ)法樹(shù)的方法,其特征在于,所述對(duì)所述訓(xùn)練文本進(jìn)行詞向量稀疏表示,包括:
將所述訓(xùn)練文本經(jīng)過(guò)分詞處理后提交給預(yù)設(shè)的CBOW模型轉(zhuǎn)化為詞向量的稀疏表示。
4.根據(jù)權(quán)利要求3所述的基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建法律文本語(yǔ)法樹(shù)的方法,其特征在于,所述轉(zhuǎn)化為詞向量的稀疏表示包括:
對(duì)所述訓(xùn)練文本中一段長(zhǎng)度為的詞序列,所述CDOW模型的輸入為:
;
其中, 表示目標(biāo)詞所處的上下文語(yǔ)境,表示以為中心,分別向前向后個(gè)詞構(gòu)成的詞序列,,一般取奇數(shù);表示上下文語(yǔ)境中的第個(gè)詞,表示對(duì)應(yīng)的詞向量。
5.根據(jù)權(quán)利要求3所述的基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建法律文本語(yǔ)法樹(shù)的方法,其特征在于,所述CBOW模型的輸出層對(duì)應(yīng)一個(gè)二叉樹(shù),通過(guò)哈弗曼編碼實(shí)現(xiàn)詞向量的稀疏表示。
6.根據(jù)權(quán)利要求1所述的基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建法律文本語(yǔ)法樹(shù)的方法,其特征在于,所述DNN的輸入層為所述訓(xùn)練文本中由個(gè)詞序列構(gòu)成的一個(gè)句子,表示為,以及該句子所對(duì)應(yīng)的詞性標(biāo)注序列和關(guān)系標(biāo)簽序列。
7.一種基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建法律文本語(yǔ)法樹(shù)的裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取法律服務(wù)的訓(xùn)練文本;
處理模塊,用于對(duì)所述訓(xùn)練文本進(jìn)行詞向量稀疏表示;
標(biāo)注模塊,用于根據(jù)所述詞向量稀疏表示通過(guò)DNN對(duì)所述訓(xùn)練文本進(jìn)行語(yǔ)義標(biāo)注;
構(gòu)建模塊,用于根據(jù)所述語(yǔ)義標(biāo)注對(duì)所述訓(xùn)練文本進(jìn)行依存描述,構(gòu)建得到法律文本語(yǔ)法樹(shù)。