亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

藏語句法和語義角色聯(lián)合標注方法

文檔序號:6511758閱讀:1020來源:國知局
藏語句法和語義角色聯(lián)合標注方法
【專利摘要】本發(fā)明涉及將少數(shù)民族文字處理成漢語的方法,尤其涉及一種藏語句法和語義角色聯(lián)合標注方法。其包括下列步驟:a)單復句區(qū)分;b)語義角色標記;c)謂詞識別;d)動詞語義分類;e)句法結(jié)構(gòu)標注;f)編輯修訂語義角色標注結(jié)果。本發(fā)明提取藏語句法和語義特征,一方面,可以直接利用藏語的語法標記,標注句子中所表達的施事、受事、時間、地點、方式等語義角色信息;另一方面,針對謂詞的語義角色標注結(jié)果,可以反作用于句法解析過程,減少句法標記不能唯一確定的影響,從而提高句處理系統(tǒng)的性能。
【專利說明】藏語句法和語義角色聯(lián)合標注方法
【技術(shù)領域】
[0001]本發(fā)明涉及將少數(shù)民族文字處理成漢語的方法,尤其涉及一種藏語句法和語義角色聯(lián)合標注方法。
【背景技術(shù)】
[0002]藏文信息處理領域研究內(nèi)容百花齊放,在字、詞和短語處理方面陸續(xù)取得了突破,句處理階段的攻關已經(jīng)開始。
[0003]語義分析是計算語言學領域最具挑戰(zhàn)性的課題之一,也是制約語言信息技術(shù)大規(guī)模應用的主要瓶頸。語義分析就是根據(jù)句子結(jié)構(gòu)和句中實詞的詞義,推導出句子的實際語義,這是句處理的主要目標。
[0004]語義角色標注的任務,就是找出句子中謂詞的相應語義角色成分,如:施事、受事、時間、地點、方式等,這些成分的標注對于理解一個句子的語義起著重要作用。
[0005]句法分析是根據(jù)給定語法,推導出句子的語法結(jié)構(gòu),一是確定句子所包含的譜系結(jié)構(gòu),一是確定句子的組成成分。句法分析結(jié)果的表達形式是句法樹。
[0006]一般的語義角色標注方法,是在給定句法樹的情況下,研究如何應用于各種特征作用于機器學習算法。
[0007]傳統(tǒng)的語義角色標注研究,一般是在句法處理基礎上進行的。但是目前,很難獲得藏語深層句法分析的結(jié)果。現(xiàn)有的藏文句法分析系統(tǒng)在通用領域的表現(xiàn)也不盡如人意。

【發(fā)明內(nèi)容】

[0008]針對現(xiàn)有技術(shù)上存在的不足,本發(fā)明提供一種藏語句法和語義角色聯(lián)合標注方法。
[0009]為了實現(xiàn)上述目的,本發(fā)明是通過如下的技術(shù)方案來實現(xiàn):
[0010]一種藏語句法和語義角色聯(lián)合標注方法,其包括下列步驟:
[0011]a)單復句區(qū)分:將長句劃分為若干短句;
[0012]b)語義角色標記:格標記,包括語法角色成分、名物化或非謂動詞組塊標記,去除非標注內(nèi)容;
[0013]c)謂詞識別:針對謂詞特征,確定謂詞所屬的語義結(jié)構(gòu)類別是形容詞謂語句或動詞謂語句;
[0014]d)動詞語義分類:針對動詞后綴標記特征,確定動詞語義結(jié)構(gòu)類型;
[0015]e)句法結(jié)構(gòu)標注:針對動詞語義結(jié)構(gòu)類型,利用淺層語義分析,篩選、識別語義角色,再次對語義結(jié)構(gòu)類型分類;
[0016]f)編輯修訂語義角色標注結(jié)果。
[0017]上述的藏語句法和語義角色聯(lián)合標注方法,其步驟b)標記在句子里充當施事、受事、涉事、領屬、對象、目的、處所、材料、來源或工具的語法角色成分,去除語氣詞、指示代詞、不定指示詞、疑問代詞、復數(shù)后綴或敬語語素,不考慮時態(tài)信息。[0018]上述的藏語句法和語義角色聯(lián)合標注方法,其步驟b)中的名物化標記包括做事者或方式、方法、情形或手工、手藝、材料、事物或動作、有關事物或習慣、規(guī)則或態(tài)度、情況或心靈、精神或數(shù)量、標準、地方或時候或空閑或更迭、輪流或某方面。
[0019]上述的藏語句法和語義角色聯(lián)合標注方法,其步驟b)中的所述語法角色為ArgO-5, ArgO表示動作的施事,Argl表示動作的影響,Arg2_5根據(jù)謂詞確定為不同的語義含義。
[0020]上述的藏語句法和語義角色聯(lián)合標注方法,其步驟b)中的所述語法角色成分包括施事主語、領有主語、受事賓語、對象賓語、結(jié)果賓語、處所賓語、動詞謂語和形容詞謂語。
[0021]上述的藏語句法和語義角色聯(lián)合標注方法,其步驟c)中所述謂詞包括動詞、助動詞、動詞后綴或語氣詞。
[0022]上述的藏語句法和語義角色聯(lián)合標注方法,其步驟c)中所述謂詞包括通格或共同格、受格、施格、領有格、位格、與格、對象格、從屬格、工具格、從格、結(jié)果格或使役格。
[0023]上述的藏語句法和語義角色聯(lián)合標注方法,其步驟d)中動詞包括及物動詞、不及物動詞、自主動詞、不自主動詞、情態(tài)助動詞、性狀動詞、動作動詞、心理動詞、感知動詞、變化動詞、趨向動詞、述說動詞、關系動詞、領有動詞、存在動詞、互動動詞、使役動詞。
[0024]有益效果:
[0025]本發(fā)明提取藏語句法和語義特征,一方面,可以直接利用藏語的語法標記,標注句子中所表達的施事、受事、時間、地點、方式等語義角色信息;另一方面,針對謂詞的語義角色標注結(jié)果,可以反作用于句法解析過程,減少句法標記不能唯一確定的影響,從而提高句處理系統(tǒng)的性能。
【具體實施方式】
[0026]為使本發(fā)明實現(xiàn)的技術(shù)手段、創(chuàng)作特征、達成目的與功效易于明白了解,下面結(jié)合【具體實施方式】,進一步闡述本發(fā)明。
[0027]本發(fā)明其包括下列步驟:
[0028]a)單復句區(qū)分:將長句劃分為若干短句;
[0029]b)語義角色標記:格標記,包括語法角色成分、名物化或非謂動詞組塊標記,去除非標注內(nèi)容;
[0030]根據(jù)藏語的格標記和語義角色標注需要,明確藏文的語義角色。核心的語義角色為ArgO-5, ArgO表示動作的施事(施事格),Argl表示動作的影響(結(jié)果格),Arg2_5根據(jù)謂語動詞不同會有不同的語義含義,增加部分附加語義角色,如ArgM-LOC (位格)。
[0031]標記在句子里充當施事、受事、涉事、領屬、對象、目的、處所、材料、來源或工具的語法角色成分,去除語氣詞、指示代詞、不定指示詞、疑問代詞、復數(shù)后綴或敬語語素,不考慮時態(tài)信息。
[0032]藏語具有豐富的格標記,與語義角色標注有關的有三十多種,如:施格、賓格、受益格、同類比較格、占有格、目的格等。有的格對應于一種語義角色(如施格);有的格標記可能對應于多個語義角色,或者一個語義角色對應多種格標記,如Argl (結(jié)果格、受益格)等。
[0033]c)謂詞識別:針對謂詞特征,確定謂詞所屬的語義結(jié)構(gòu)類別是形容詞謂語句或動詞謂語句;[0034]謂詞詞性主要區(qū)分形容詞謂語句和動詞謂語句,形容詞謂語句根據(jù)句式特征識另IJ,動詞謂語句:與謂語動詞相關的句法標記,如時、體后綴,語氣詞,助動詞等。
[0035]d)動詞語義分類:針對動詞后綴標記特征,確定動詞語義結(jié)構(gòu)類型;
[0036]基于動詞后綴語義信息的句式分析。
[0037]e)句法結(jié)構(gòu)標注:針對動詞語義結(jié)構(gòu)類型,利用淺層語義分析,篩選、識別語義角色,再次對語義結(jié)構(gòu)類型分類;
[0038]f)編輯修訂語乂角色標注結(jié)果.
[0039]本發(fā)明中的標注內(nèi)容包括:
[0040]1.句法成份標記
[0041]
【權(quán)利要求】
1.一種藏語句法和語義角色聯(lián)合標注方法,其特征在于,包括下列步驟: a)單復句區(qū)分:將長句劃分為若干短句; b)語義角色標記:格標記,包括語法角色成分、名物化或非謂動詞組塊標記,去除非標注內(nèi)容; c)謂詞識別:針對謂詞特征,確定謂詞所屬的語義結(jié)構(gòu)類別是形容詞謂語句或動詞謂語句; d)動詞語義分類:針對動詞后綴標記特征,確定動詞語義結(jié)構(gòu)類型; e)句法結(jié)構(gòu)標注:針對動詞語義結(jié)構(gòu)類型,利用淺層語義分析,篩選、識別語義角色,再次對語義結(jié)構(gòu)類型分類; f)編輯修訂語義角色標注結(jié)果。
2.根據(jù)權(quán)利要求1所述的藏語句法和語義角色聯(lián)合標注方法,其特征在于,步驟b)標記在句子里充當施事、受事、涉事、領屬、對象、目的、處所、材料、來源或工具的語法角色成分,去除語氣詞、指示代詞、不定指示詞、疑問代詞、復數(shù)后綴或敬語語素,不考慮時態(tài)信息。
3.根據(jù)權(quán)利要求1所述的藏語句法和語義角色聯(lián)合標注方法,其特征在于,步驟b)中的名物化標記包括做事者或方式、方法、情形或手工、手藝、材料、事物或動作、有關事物或習慣、規(guī)則或態(tài)度、情況或心靈、精神或數(shù)量、標準、地方或時候或空閑或更迭、輪流或某方面。
4.根據(jù)權(quán)利要求1所述的藏語句法和語義角色聯(lián)合標注方法,其特征在于,步驟b)中的所述語法角色為ArgO-5, ArgO表示動作的施事,Argl表示動作的影響,Arg2_5根據(jù)謂詞確定為不同的語義含義。
5.根據(jù)權(quán)利要求1所述的藏語句法和語義角色聯(lián)合標注方法,其特征在于,步驟b)中的所述語法角色成分包括施事主語、領有主語、受事賓語、對象賓語、結(jié)果賓語、處所賓語、動詞謂語和形容詞謂語。
6.根據(jù)權(quán)利要求1所述的藏語句法和語義角色聯(lián)合標注方法,其特征在于,步驟c)中所述謂詞包括動詞、助動詞、動詞后綴或語氣詞。
7.根據(jù)權(quán)利要求1所述的藏語句法和語義角色聯(lián)合標注方法,其特征在于,步驟c)中所述謂詞包括通格或共同格、受格、施格、領有格、位格、與格、對象格、從屬格、工具格、從格、結(jié)果格或使役格。
8.根據(jù)權(quán)利要求1所述的藏語句法和語義角色聯(lián)合標注方法,其特征在于,步驟d)中動詞包括及物動詞、不及物動詞、自主動詞、不自主動詞、情態(tài)助動詞、性狀動詞、動作動詞、心理動詞、感知動詞、變化動詞、趨向動詞、述說動詞、領有動詞、存在動詞、互動動詞、使役動詞。
【文檔編號】G06F17/27GK103440236SQ201310421074
【公開日】2013年12月11日 申請日期:2013年9月16日 優(yōu)先權(quán)日:2013年9月16日
【發(fā)明者】邱莉榕 申請人:中央民族大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1