技術特征:
技術總結
本發(fā)明屬于數(shù)據(jù)處理技術領域,公開了一種基于自然語義分析的用例提取方法,用例提取方法包括:通過大量相關專業(yè)需求文檔,訓練屬于自己領域的詞庫;對詞庫精度進行優(yōu)化,排除干擾分詞結果的錯誤詞匯;運用相關領域的語料庫進行分詞,并標識出用例以及參與者;在分詞的基礎上提取句子主干,并建立基于語義分析的語義樹;針對提取的句子主干通過模型匹配進行用例的識別以及提取。本發(fā)明新詞發(fā)現(xiàn)算法利用三個特性很好的對所需要的新詞進行了提取,在機器學習過程中,進行了大量的參數(shù)調(diào)控等,同時也進行了大量的樣本學習,歸納出5類漢語語法模型,從而實現(xiàn)用例提取及參與者的匹配,最終準確度確定在95%以上。
技術研發(fā)人員:康雁;柳青;王珺;張顏淞;林英;劉宇;岳遠澤;丁玉鋒
受保護的技術使用者:云南大學
技術研發(fā)日:2017.04.07
技術公布日:2017.08.11