一種文本語義信息分析系統(tǒng)和方法

文檔序號：6403080閱讀：509來源：國知局

專利名稱：一種文本語義信息分析系統(tǒng)和方法
技術領域：
本發(fā)明涉及信息分析技術領域，尤其涉及一種基于類自然語言規(guī)則的文本語義信息抽取系統(tǒng)和方法。
背景技術：
在對文本進行語義處理之前，文本的預處理是極其重要的一個環(huán)節(jié)，預處理效果的好壞直接決定了文本語義分析的結果。在針對互聯(lián)網文本進行分析之前，其預處理有其獨特方面:一方面互聯(lián)網文本相對比較散，干擾性文字比較多；另一方面，半結構化的文本特征也提供了相對豐富的語義信息。因此，現有技術中，在進行文本語義處理的過程中，如何做到對文本信息進行有效利用，這將給文本語義分析帶來更多的便利。

發(fā)明內容
針對現有技術存在的問題，本發(fā)明的目的在于提出了一種文本語義信息抽取系統(tǒng)和方法。為達此目的，本發(fā)明采用以下技術方案:一種文本語義信息分析方法，包括:根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則；根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息。優(yōu)選地，所述根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則包括:獲取目標文本樣本；根據預置規(guī)則集對目標文本樣本進行標注；根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計，提取目標規(guī)則集合，并根據目標規(guī)則集合建立類自然語言規(guī)則。優(yōu)選地，所述獲取目標文本樣本之后還包括:對目標文本樣本進行切分，獲得句子集合，再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。優(yōu)選地，所述根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息包括:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配，再根據匹配結果進行語義歸納，獲得目標文本的語義信息。一種文本語義信息分析系統(tǒng)，包括:規(guī)則建立模塊，用于根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則；數據匹配模塊，與規(guī)則建立模塊連接，用于根據所述類自然語言規(guī)則對目標文本進行數據匹配；語義信息獲取模塊，與數據匹配模塊連接，用于根據匹配結果獲得目標文本的語
義信息。

優(yōu)選地，所述規(guī)則建立模塊具體用于:獲取目標文本樣本，根據預置規(guī)則集對目標文本樣本進行標注，根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計，提取目標規(guī)則集合，并根據目標規(guī)則集合建立類自然語言規(guī)則。優(yōu)選地，所述規(guī)則建立模塊還用于:對目標文本樣本進行切分，獲得句子集合，再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。優(yōu)選地，所述數據匹配模塊具體用于:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配；所述語義信息獲取模塊具體用于:根據匹配結果進行語義歸納，獲得目標文本的語義信息?；谝陨霞夹g方案的公開，本發(fā)明具備如下有益效果:本發(fā)明中，根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則，根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息，實現了基于類自然語言規(guī)則進行文本語義信息分析，類自然語言規(guī)則易于理解和編寫，天然的可組合性，數據匹配和信息抽取過程統(tǒng)一，語音分析的精準度高，類自然語言規(guī)則高度可重用，模型通用性強。

圖1是本發(fā)明提出的一種文本語義信息分析方法的流程示意圖。圖2是本發(fā)明提出的一種文本語義信息分析系統(tǒng)的結構示意圖。
具體實施例方式如圖1所示，為本發(fā)明提出的一種文本語義信息分析方法的流程示意圖。參照圖1，本發(fā)明提出的一種文本語義信息分析方法，包括:步驟SI，根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則；步驟S2，根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語
義信息。在步驟SI中，所述根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則包括:步驟Sll，獲取目標文本樣本；步驟S12，根據預置規(guī)則集對目標文本樣本進行標注；步驟S13，根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計，提取目標規(guī)則集合，并根據目標規(guī)則集合建立類自然語言規(guī)則。在步驟Sll之后，所述獲取目標文本樣本之后還包括:對目標文本樣本進行切分，獲得句子集合，再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。在步驟S2根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義息包括:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配，再根據匹配結果進行語義歸納，獲得目標文本的語義信息。如圖2所示，為本發(fā)明提出的一種文本語義信息分析系統(tǒng)的結構示意圖。參照圖2，本發(fā)明提出的一種文本語義信息分析系統(tǒng)，包括:規(guī)則建立模塊，用于根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則；數據匹配模塊，與規(guī)則建立模塊連接，用于根據所述類自然語言規(guī)則對目標文本進行數據匹配；
語義信息獲取模塊，與數據匹配模塊連接，用于根據匹配結果獲得目標文本的語
義信息。進一步地，所述規(guī)則建立模塊具體用于:獲取目標文本樣本，根據預置規(guī)則集對目標文本樣本進行標注，根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計，提取目標規(guī)則集合，并根據目標規(guī)則集合建立類自然語言規(guī)則。進一步地，所述規(guī)則建立模塊還用于:對目標文本樣本進行切分，獲得句子集合，再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。進一步地，所述數據匹配模塊具體用于:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配；所述語義信息獲取模塊具體用于:根據匹配結果進行語義歸納，獲得目標文本的語義信息。本發(fā)明中，根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則，根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息，實現了基于類自然語言規(guī)則進行文本語義信息分析，類自然語言規(guī)則易于理解和編寫，天然的可組合性，數據匹配和信息抽取過程統(tǒng)一，語音分析的精準度高，類自然語言規(guī)則高度可重用，模型通用性強。以上所述，僅為本發(fā)明較佳的具體實施方式
，但本發(fā)明的保護范圍并不局限于此，任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內，根據本發(fā)明的技術方案及其發(fā)明構思加以等同替換或改變，都應涵蓋在本發(fā)明的保護范圍之內。
權利要求
1.一種文本語義信息分析方法，其特征在于，包括: 根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則；根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息。
2.根據權利要求1所述的文本語義信息分析方法，其特征在于，所述根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則包括: 獲取目標文本樣本；根據預置規(guī)則集對目標文本樣本進行標注；根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計，提取目標規(guī)則集合，并根據目標規(guī)則集合建立類自然語言規(guī)則。
3.根據權利要求2所述的文本語義信息分析方法，其特征在于，所述獲取目標文本樣本之后還包括:對目標文本樣本進行切分，獲得句子集合，再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。
4.根據權利要求1-3中任一項所述的文本語義信息分析方法，其特征在于，所述根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息包括:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配，再根據匹配結果進行語義歸納，獲得目標文本的語義信息。
5.一種文本語義信息分析系統(tǒng)，其特征在于，包括: 規(guī)則建立模塊，用于根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則；數據匹配模塊，與規(guī)則建立模塊連接，用于根據所述類自然語言規(guī)則對目標文本進行數據匹配；語義信息獲取模塊，與數據匹配模塊連接，用于根據匹配結果獲得目標文本的語義信肩、O
6.根據權利要求5所述的文本語義信息分析系統(tǒng)，其特征在于，所述規(guī)則建立模塊具體用于:獲取目標文本樣本，根據預置規(guī)則集對目標文本樣本進行標注，根據目標規(guī)則集對標注后的目標文本樣本進行統(tǒng)計，提取目標規(guī)則集合，并根據目標規(guī)則集合建立類自然語言規(guī)則。
7.根據權利要求6所述的文本語義信息分析系統(tǒng)，其特征在于，所述規(guī)則建立模塊還用于:對目標文本樣本進行切分，獲得句子集合，再根據預置規(guī)則集和目標規(guī)則集對句子集合進行分析。
8.根據權利要求5所述的文本語義信息分析系統(tǒng)，其特征在于，所述數據匹配模塊具體用于:根據所述類自然語言規(guī)則對目標文本進行句子級、段落級的數據匹配；所述語義信息獲取模塊具體用于:根據匹配結果進行語義歸納，獲得目標文本的語義信息。
全文摘要
本發(fā)明公開了一種文本語義信息分析系統(tǒng)和方法，根據預置規(guī)則集和目標規(guī)則集建立類自然語言規(guī)則，根據所述類自然語言規(guī)則對目標文本進行數據匹配并獲得目標文本的語義信息，實現了基于類自然語言規(guī)則進行文本語義信息分析。在本發(fā)明中，類自然語言規(guī)則易于理解和編寫，天然的可組合性，數據匹配和信息抽取過程統(tǒng)一，語音分析的精準度高，類自然語言規(guī)則高度可重用，模型通用性強。
文檔編號G06F17/27GK103246641SQ20131018228
公開日2013年8月14日申請日期2013年5月16日優(yōu)先權日2013年5月16日
發(fā)明者李營申請人:李營

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：李營
技術所有人：李營
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯(lián)網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯(lián)網安全、大數據安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種文本語義信息分析系統(tǒng)和方法