亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種文本語義信息分析系統(tǒng)和方法

文檔序號:6403080閱讀:509來源:國知局
專利名稱:一種文本語義信息分析系統(tǒng)和方法
技術領域
本發(fā)明涉及信息分析技術領域,尤其涉及一種基于類自然語言規(guī)則的文本語義信息抽取系統(tǒng)和方法。
背景技術
在對文本進行語義處理之前,文本的預處理是極其重要的一個環(huán)節(jié),預處理效果的好壞直接決定了文本語義分析的結果。在針對互聯(lián)網文本進行分析之前,其預處理有其獨特方面:一方面互聯(lián)網文本相對比較散,干擾性文字比較多;另一方面,半結構化的文本特征也提供了相對豐富的語義信息。因此,現有技術中,在進行文本語義處理的過程中,如何做到對文本信息進行有效利用,這將給文本語義分析帶來更多的便利。

發(fā)明內容
針對現有技術存在的問題,本發(fā)明的目的在于提出了一種文本語義信息抽取系統(tǒng)和方法。為達此目的,本發(fā)明采用以下技術方案:一種文本語義信息分析方法,包括:根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則;根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息。優(yōu)選地,所述根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則包括:獲取目標文本樣本; 根據預置規(guī)則集對目標文本樣本進行標注;根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計,提取目標規(guī)則集合,并根據目標規(guī)則集合建立類自然語言規(guī)則。優(yōu)選地,所述獲取目標文本樣本之后還包括:對目標文本樣本進行切分,獲得句子集合,再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。優(yōu)選地,所述根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息包括:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配,再根據匹配結果進行語義歸納,獲得目標文本的語義信息。一種文本語義信息分析系統(tǒng),包括:規(guī)則建立模塊,用于根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則;數據匹配模塊,與規(guī)則建立模塊連接,用于根據所述類自然語言規(guī)則對目標文本進行數據匹配;語義信息獲取模塊,與數據匹配模塊連接,用于根據匹配結果獲得目標文本的語
義信息。

優(yōu)選地,所述規(guī)則建立模塊具體用于:獲取目標文本樣本,根據預置規(guī)則集對目標文本樣本進行標注,根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計,提取目標規(guī)則集合,并根據目標規(guī)則集合建立類自然語言規(guī)則。優(yōu)選地,所述規(guī)則建立模塊還用于:對目標文本樣本進行切分,獲得句子集合,再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。優(yōu)選地,所述數據匹配模塊具體用于:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配;所述語義信息獲取模塊具體用于:根據匹配結果進行語義歸納,獲得目標文本的語義信息?;谝陨霞夹g方案的公開,本發(fā)明具備如下有益效果:本發(fā)明中,根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則,根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息,實現了基于類自然語言規(guī)則進行文本語義信息分析,類自然語言規(guī)則易于理解和編寫,天然的可組合性,數據匹配和信息抽取過程統(tǒng)一,語音分析的精準度高,類自然語言規(guī)則高度可重用,模型通用性強。


圖1是本發(fā)明提出的一種文本語義信息分析方法的流程示意圖。圖2是本發(fā)明提出的一種文本語義信息分析系統(tǒng)的結構示意圖。
具體實施例方式如圖1所示,為本發(fā)明提出的一種文本語義信息分析方法的流程示意圖。參照圖1,本發(fā)明提出的一種文本語義信息分析方法,包括:步驟SI,根據預置 規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則;步驟S2,根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語
義信息。在步驟SI中,所述根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則包括:步驟Sll,獲取目標文本樣本;步驟S12,根據預置規(guī)則集對目標文本樣本進行標注;步驟S13,根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計,提取目標規(guī)則集合,并根據目標規(guī)則集合建立類自然語言規(guī)則。在步驟Sll之后,所述獲取目標文本樣本之后還包括:對目標文本樣本進行切分,獲得句子集合,再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。在步驟S2根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義息包括:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配,再根據匹配結果進行語義歸納,獲得目標文本的語義信息。如圖2所示,為本發(fā)明提出的一種文本語義信息分析系統(tǒng)的結構示意圖。參照圖2,本發(fā)明提出的一種文本語義信息分析系統(tǒng),包括:規(guī)則建立模塊,用于根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則;數據匹配模塊,與規(guī)則建立模塊連接,用于根據所述類自然語言規(guī)則對目標文本進行數據匹配;
語義信息獲取模塊,與數據匹配模塊連接,用于根據匹配結果獲得目標文本的語
義信息。進一步地,所述規(guī)則建立模塊具體用于:獲取目標文本樣本,根據預置規(guī)則集對目標文本樣本進行標注,根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計,提取目標規(guī)則集合,并根據目標規(guī)則集合建立類自然語言規(guī)則。進一步地,所述規(guī)則建立模塊還用于:對目標文本樣本進行切分,獲得句子集合,再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。進一步地,所述數據匹配模塊具體用于:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的 數據匹配;所述語義信息獲取模塊具體用于:根據匹配結果進行語義歸納,獲得目標文本的語義信息。本發(fā)明中,根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則,根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息,實現了基于類自然語言規(guī)則進行文本語義信息分析,類自然語言規(guī)則易于理解和編寫,天然的可組合性,數據匹配和信息抽取過程統(tǒng)一,語音分析的精準度高,類自然語言規(guī)則高度可重用,模型通用性強。以上所述,僅為本發(fā)明較佳的具體實施方式
,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內,根據本發(fā)明的技術方案及其發(fā)明構思加以等同替換或改變,都應涵蓋在本發(fā)明的保護范圍之內。
權利要求
1.一種文本語義信息分析方法,其特征在于,包括: 根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則; 根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息。
2.根據權利要求1所述的文本語義信息分析方法,其特征在于,所述根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則包括: 獲取目標文本樣本; 根據預置規(guī)則集對目標文本樣本進行標注; 根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計,提取目標規(guī)則集合,并根據目標規(guī)則集合建立類自然語言規(guī)則。
3.根據權利要求2所述的文本語義信息分析方法,其特征在于,所述獲取目標文本樣本之后還包括:對目標文本樣本進行切分,獲得句子集合,再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。
4.根據權利要求1-3中任一項所述的文本語義信息分析方法,其特征在于,所述根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息包括:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配,再根據匹配結果進行語義歸納,獲得目標文本的語義信息。
5.一種文本語義信息分析系統(tǒng),其特征在于,包括: 規(guī)則建立模塊,用于根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則; 數據匹配模塊,與規(guī)則建立模塊連接,用于根據所述類自然語言規(guī)則對目標文本進行數據匹配; 語義信息獲取模塊,與數據匹配模塊連接,用于根據匹配結果獲得目標文本的語義信肩、O
6.根據權利要求5所述的文本語義信息分析系統(tǒng),其特征在于,所述規(guī)則建立模塊具體用于:獲取目標文本樣本,根據預置規(guī)則集對目標文本樣本進行標注,根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計,提取目標規(guī)則集合,并根據目標規(guī)則集合建立類自然語言規(guī)則。
7.根據權利要求6所述的文本語義信息分析系統(tǒng),其特征在于,所述規(guī)則建立模塊還用于:對目標文本樣本進行切分,獲得句子集合,再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。
8.根據權利要求5所述的文本語義信息分析系統(tǒng),其特征在于,所述數據匹配模塊具體用于:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配;所述語義信息獲取模塊具體用于:根據匹配結果進行語義 歸納,獲得目標文本的語義信息。
全文摘要
本發(fā)明公開了一種文本語義信息分析系統(tǒng)和方法,根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則,根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息,實現了基于類自然語言規(guī)則進行文本語義信息分析。在本發(fā)明中,類自然語言規(guī)則易于理解和編寫,天然的可組合性,數據匹配和信息抽取過程統(tǒng)一,語音分析的精準度高,類自然語言規(guī)則高度可重用,模型通用性強。
文檔編號G06F17/27GK103246641SQ20131018228
公開日2013年8月14日 申請日期2013年5月16日 優(yōu)先權日2013年5月16日
發(fā)明者李營 申請人:李營
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1