1.一種基于語義及語法結(jié)構(gòu)的語句分析方法,其特征在于,包括以下步驟:
步驟1:輸入原始句子;
步驟2:利用所述原始句子產(chǎn)生初步訓(xùn)練語料;
步驟3:獲取人工修正后的訓(xùn)練語料,定義為中間訓(xùn)練語料;
步驟4:驗證所述中間訓(xùn)練語料標(biāo)注的正確性,如果所述中間訓(xùn)練語料的標(biāo)注均正確,將所述中間訓(xùn)練語料定義為最終訓(xùn)練語料,并進(jìn)入步驟5;否則返回步驟3循環(huán)執(zhí)行;
步驟5:將所述最終訓(xùn)練語料帶入訓(xùn)練模型。
2.根據(jù)權(quán)利要求1所述的基于語義及語法結(jié)構(gòu)的語句分析方法,其特征在于,原始句子產(chǎn)生初步訓(xùn)練語料的具體步驟為:
步驟2.1:分詞;
步驟2.2:詞性標(biāo)注;
步驟2.3:依存句法分析;
步驟2.4:語義角色分析。
3.根據(jù)權(quán)利要求1所述的基于語義及語法結(jié)構(gòu)的語句分析方法,其特征在于:所述步驟3中,由具有語言學(xué)背景的專家對所述初步訓(xùn)練語料的標(biāo)注進(jìn)行人工修改和補正。
4.根據(jù)權(quán)利要求1所述的基于語義及語法結(jié)構(gòu)的語句分析方法,其特征在于:所述步驟4中的驗證所述中間訓(xùn)練語料標(biāo)注正確性的具體步驟為:
步驟11:判斷所述中間訓(xùn)練語料中資料欄位數(shù)量是否正確;是,則進(jìn)行步驟12;否,則返回步驟3循環(huán)執(zhí)行;
步驟12:判斷所述中間訓(xùn)練語料中是否包含動詞;是,則進(jìn)行步驟13;否,則返回步驟3循環(huán)執(zhí)行;
步驟13:判斷所述中間訓(xùn)練語料中動詞是否有相對應(yīng)的語義角色標(biāo)記;是,則進(jìn)行步驟14;否,則返回步驟3循環(huán)執(zhí)行;
步驟14:判斷所述中間訓(xùn)練語料中每個分詞的依存關(guān)系是否有正確連結(jié);是,則進(jìn)行步驟5;否,則返回步驟3循環(huán)執(zhí)行。
5.根據(jù)權(quán)利要求1所述的基于語義及語法結(jié)構(gòu)的語句分析方法,其特征在于:所述訓(xùn)練模型為詞性標(biāo)注模型,或者為依存句法分析模型,或者為語義角色標(biāo)注模型。
6.基于權(quán)利要求1所述方法的語句分析系統(tǒng),其特征在于:包括語句分析模塊,用于將原始句子生成初步訓(xùn)練語料;
語料驗證模塊,用于驗證所述中間訓(xùn)練語料標(biāo)注的正確性。
7.根據(jù)權(quán)利要求6所述的語句分析系統(tǒng),其特征在于:所述語句分析模塊中含有分詞模型、詞性標(biāo)注模型、依存句法分析模型和語義角色標(biāo)注模型。
8.根據(jù)權(quán)利要求7所述的語句分析系統(tǒng),其特征在于:所述語料驗證模塊中含有資料欄位數(shù)查詢模型、動詞查詢模型、語義角色標(biāo)記查詢模型和依存關(guān)系驗證模型。