亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于參數(shù)概念表達(dá)動詞語義的方法及系統(tǒng)與流程

文檔序號:12748007閱讀:來源:國知局

技術(shù)特征:

1.一種基于參數(shù)概念表達(dá)動詞語義的方法,其特征在于,包括如下步驟:

步驟1:抽取動詞與賓語,以及動詞與主語的依存關(guān)系;

步驟2:根據(jù)動詞與賓語、動詞與主語的依存關(guān)系計算動詞參數(shù)對于模式的熵值,并計算動詞參數(shù)對于該動詞的互信息值,計算得到動詞參數(shù)權(quán)重;

步驟3:將動詞參數(shù)進行概念化,即尋找具有最大動詞參數(shù)權(quán)重的k團。

2.根據(jù)權(quán)利要求1所述的基于參數(shù)概念表達(dá)動詞語義的方法,其特征在于,所述步驟2包括:

步驟2.1:計算動詞參數(shù)對于模式的熵值,熵值越大,則動詞參數(shù)的質(zhì)量越好,所述質(zhì)量是指某個詞作為這個動詞的參數(shù)的可靠度;

<mrow> <msub> <mi>Entropy</mi> <mi>v</mi> </msub> <mrow> <mo>(</mo> <mi>e</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>m</mi> <mo>&Element;</mo> <msub> <mi>M</mi> <mrow> <mi>e</mi> <mo>,</mo> <mi>v</mi> </mrow> </msub> </mrow> </munder> <mi>P</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mi>log</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>;</mo> </mrow>

式中:Entropyv(e)表示詞e對于動詞v的模式熵,P(m)表示模式m出現(xiàn)的概率,m表示模式m,即詞e和動詞v的不同搭配組合,Me,v表示詞e和動詞v的所有搭配組合;

步驟2.2:計算動詞參數(shù)對于動詞的互信息值,互信息值越高,則動詞參數(shù)的質(zhì)量越好,具體地,采用的二值的互信息,計算公式如下:

<mrow> <msub> <mi>MI</mi> <mi>v</mi> </msub> <mrow> <mo>(</mo> <mi>e</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>f</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> <mi>p</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>,</mo> <mi>e</mi> <mo>)</mo> </mrow> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mfrac> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>,</mo> <mi>e</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>e</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&gt;</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

式中:MIv(e)表示詞e相對于動詞v的互信息,p(v,e)表示在語料中動詞v和詞e一起出現(xiàn)的概率,p(v)表示動詞v出現(xiàn)的概率,p(e)表示詞e出現(xiàn)的概率;

步驟2.3:計算動詞參數(shù)的權(quán)重值Qv(e),計算公式如下:

Qv(e)=Entropyv(e)×MIv(e)。

3.根據(jù)權(quán)利要求1所述的基于參數(shù)概念表達(dá)動詞語義的方法,其特征在于,所述步驟3包括:采用分支限界的算法找到最大權(quán)重的k團;其中,所述分支限界的算法是指:構(gòu)造一個搜索樹,樹的每一層,除去根節(jié)點,均表示的是是否選擇某個參數(shù)概念,其中左分支就是選擇該參數(shù)概念,右分支表示不選擇該參數(shù)概念;當(dāng)選擇到的參數(shù)概念數(shù)量為k時,判斷此k個參數(shù)概念是否在圖中是一個團,如果是,則返回正確;如果不是一個團,則返回錯誤。

4.一種基于參數(shù)概念表達(dá)動詞語義的系統(tǒng),其特征在于,包括:

依存關(guān)系抽取模塊:用于抽取動詞與賓語,以及動詞與主語的依存關(guān)系;

動詞參數(shù)權(quán)重計算模塊:用于根據(jù)動詞與賓語、動詞與主語的依存關(guān)系計算動詞參數(shù)對于模式的熵值,并計算動詞參數(shù)對于該動詞的互信息值,計算得到動詞參數(shù)權(quán)重;

動詞參數(shù)概念化模塊,用于將動詞參數(shù)進行概念化,即尋找具有最大動詞參數(shù)權(quán)重的k團。

5.根據(jù)權(quán)利要求4所述的基于參數(shù)概念表達(dá)動詞語義的系統(tǒng),其特征在于,所述動詞參數(shù)權(quán)重計算模塊包括:

熵值計算模塊:計算動詞參數(shù)對于模式的熵值,熵值越大,則動詞參數(shù)的質(zhì)量越好,所述質(zhì)量是指某個詞作為這個動詞的參數(shù)的可靠度;計算公式中如下:

<mrow> <msub> <mi>Entropy</mi> <mi>v</mi> </msub> <mrow> <mo>(</mo> <mi>e</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>m</mi> <mo>&Element;</mo> <msub> <mi>M</mi> <mrow> <mi>e</mi> <mo>,</mo> <mi>v</mi> </mrow> </msub> </mrow> </munder> <mi>P</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mi>log</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>;</mo> </mrow>

式中:Entropyv(e)表示詞e對于動詞v的模式熵,P(m)表示模式m出現(xiàn)的概率,m表示模式m,即詞e和動詞v的不同搭配組合,Me,v表示詞e和動詞v的所有搭配組合;

互信息值計算模塊:計算動詞參數(shù)對于動詞的互信息值,互信息值越高,則動詞參數(shù)的質(zhì)量越好,具體地,采用的二值的互信息,計算公式如下:

<mrow> <msub> <mi>MI</mi> <mi>v</mi> </msub> <mrow> <mo>(</mo> <mi>e</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>f</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> <mi>p</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>,</mo> <mi>e</mi> <mo>)</mo> </mrow> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mfrac> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>,</mo> <mi>e</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>e</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&gt;</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

式中:MIv(e)表示詞e相對于動詞v的互信息,p(v,e)表示在語料中動詞v和詞e一起出現(xiàn)的概率,p(v)表示動詞v出現(xiàn)的概率,p(e)表示詞e出現(xiàn)的概率;

動詞參數(shù)的權(quán)重值計算模塊:計算動詞參數(shù)的權(quán)重值Qv(e),計算公式如下:

Qv(e)=Entropyv(e)×MIv(e)。

6.根據(jù)權(quán)利要求4所述的基于參數(shù)概念表達(dá)動詞語義的系統(tǒng),其特征在于,所述動詞參數(shù)概念化模塊采用分支限界的算法找到最大權(quán)重的k團;其中,所述分支限界的算法是指:構(gòu)造一個搜索樹,樹的每一層,除去根節(jié)點,均表示的是是否選擇某個參數(shù)概念,其中左分支就是選擇該參數(shù)概念,右分支表示不選擇該參數(shù)概念;當(dāng)選擇到的參數(shù)概念數(shù)量為k時,判斷此k個參數(shù)概念是否在圖中是一個團,如果是,則返回正確;如果不是一個團,則返回錯誤。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1