基于概率主題模型和中藥基本屬性的方劑功能預(yù)測方法與流程

文檔序號(hào)：12551084閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>基于概率主題模型和中藥基本屬性的方劑功能預(yù)測方法與流程

技術(shù)特征：

1.基于概率主題模型和中藥基本屬性的方劑功能預(yù)測方法，其特征在于包括以下步驟：

步驟1、數(shù)據(jù)預(yù)處理

針對(duì)方劑大辭典數(shù)據(jù)庫，應(yīng)用中醫(yī)藥學(xué)語分詞系統(tǒng)對(duì)方劑信息進(jìn)行分詞處理，提取出方劑名、方劑功效、方劑對(duì)應(yīng)的中藥、中藥劑量和劑量單位，對(duì)劑量單位進(jìn)行統(tǒng)一化，對(duì)方劑中的中藥劑量進(jìn)行標(biāo)準(zhǔn)化；針對(duì)中藥數(shù)據(jù)庫，應(yīng)用中醫(yī)藥學(xué)分詞系統(tǒng)對(duì)中藥的功效、性味和歸經(jīng)三大屬性進(jìn)行分詞，去停用詞，對(duì)提取出來的結(jié)構(gòu)化屬性數(shù)據(jù)進(jìn)行0-1量化處理，得到每味中藥的屬性向量，存入數(shù)據(jù)庫，所述的方劑大辭典數(shù)據(jù)庫和中藥數(shù)據(jù)庫均為半結(jié)構(gòu)化數(shù)據(jù)；

步驟2、根據(jù)方劑名和方劑對(duì)應(yīng)的中藥，得到“方劑-中藥”矩陣，將方劑功效作為隱含主題，應(yīng)用LDA概率主題模型對(duì)“方劑-中藥”矩陣進(jìn)行主題建模，在模型中結(jié)合配伍數(shù)據(jù)庫得到方劑功效和中藥之間治療關(guān)系的概率屬性向量，存入數(shù)據(jù)庫；

步驟3、根據(jù)每幅方劑的中藥列表和統(tǒng)一化后的中藥劑量，計(jì)算中藥在方劑中的頻次，取頻次最高的兩味中藥作為君藥和臣藥，并根據(jù)中藥的頻次利用TFIDF模型提取中藥在方劑中的權(quán)重系數(shù)，構(gòu)造方劑的權(quán)重向量，存入數(shù)據(jù)庫；

步驟4、按照中醫(yī)傳統(tǒng)理論中的組方原則，方劑中的中藥有君臣佐使之分，而方劑的功效主要由君藥和臣藥決定；針對(duì)方劑大辭典數(shù)據(jù)庫中的每副方劑，合并君藥的屬性向量、臣藥的屬性向量以及方劑的權(quán)重向量，構(gòu)成方劑的特征向量，輸入SVM分類器對(duì)模型進(jìn)行訓(xùn)練，通過one-versus-rest方法構(gòu)造多類別分類器；

步驟5、輸入需要預(yù)測的新方劑信息，新方劑信息包括中藥名和相應(yīng)的劑量；根據(jù)方劑功效和中藥之間關(guān)系的概率屬性向量，應(yīng)用貝葉斯公式計(jì)算該方劑隸屬于某個(gè)功效的概率值，根據(jù)概率值從大到小排序，選取在特定閾值范圍內(nèi)的功效，得到功效集合一U₁；

步驟6、根據(jù)步驟4得到待預(yù)測方劑的特征向量，輸入SVM多分類器進(jìn)行方劑功效預(yù)測，得到功效集合二U₂；

步驟7、將功效集合一和功效集合二作并集操作，得到最終的方劑功效集合U＝U₁∪U₂。

2.根據(jù)權(quán)利要求1所述的基于概率主題模型和中藥基本屬性的方劑功能預(yù)測方法，其特征在于所述步驟1的具體實(shí)現(xiàn)內(nèi)容包括：

①將中藥的不同劑量單位按照下列規(guī)則統(tǒng)一換算成克：

一兩＝31.25克

一錢＝3.125克

一分＝0.3125克

②按照下列公式對(duì)方劑中不同中藥的劑量繼續(xù)標(biāo)準(zhǔn)化：

$<mrow> <msup> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>*</mo> </msup> <mo>=</mo> <mfrac> <msub> <mi>d</mi> <mi>i</mi> </msub> <mrow> <msub> <mi>d</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>d</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mrow> </mfrac> </mrow>$

其中：d_i表示方劑中某中藥的劑量，代表標(biāo)準(zhǔn)化后的中藥劑量，d_max表示某中藥常用劑量中的最大值；d_min表示某中藥常用劑量中的最小值；

③所述的方劑功效包括和解劑、固澀劑、安神劑、開竅劑、治燥劑、治風(fēng)劑、瀉下劑、消導(dǎo)化積劑、表里雙解劑、清熱劑、溫里劑、理氣劑、理血?jiǎng)?、癰瘍劑、祛暑劑、祛濕劑、祛痰劑、補(bǔ)益劑、解表劑、驅(qū)蟲劑；

④所述的中草藥性味指藥物的性質(zhì)和氣味，即四氣五味，包括寒、熱、溫、涼、辛、甘、酸、苦、咸；歸經(jīng)采用十二臟腑經(jīng)絡(luò)法表述，歸心、肝、脾、肺、腎、胃、大腸、小腸、膀胱、膽、心包、三焦經(jīng)；功效以雙字詞為單位描述，針對(duì)性味中出現(xiàn)的“微寒”和“微熱”用0.5量化，性味中其余雙字詞的描述采用0-1量化構(gòu)造向量空間。

3.根據(jù)權(quán)利要求2所述的基于概率主題模型和中藥基本屬性的方劑功能預(yù)測方法，其特征在于所述步驟2的具體實(shí)現(xiàn)過程如下：

2-1.設(shè)定超參數(shù)α＝2.5，β＝0.1；

2-2.利用Gibbs采樣方法對(duì)LDA概率主題模型進(jìn)行參數(shù)估計(jì)，迭代次數(shù)為100；

2-3.完成采樣后，查詢中藥配伍數(shù)據(jù)庫:

若中藥h_i不具備相關(guān)的配伍藥，按照下式計(jì)算“中藥-功效”的概率矩陣ψ：

$<mrow> <msub> <mi>ψ</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msubsup> <mi>n</mi> <mrow> <mo>-</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> <msub> <mi>h</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <mi>β</mi> </mrow> <mrow> <msubsup> <mi>n</mi> <mrow> <mo>-</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> <mrow> <mo>(</mo> <mo>·</mo> <mo>)</mo> </mrow> </msubsup> <mo>+</mo> <mi>W</mi> <mi>β</mi> </mrow> </mfrac> </mrow>$

若中藥h_i和h_j為配伍藥對(duì)，計(jì)算“藥對(duì)-功效”的概率矩陣θ：

$<mrow> <msub> <mi>θ</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>h</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <msubsup> <mi>n</mi> <mrow> <mo>-</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> <msub> <mi>h</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <mi>β</mi> <mo>)</mo> <mo>(</mo> <msubsup> <mi>n</mi> <mrow> <mo>-</mo> <mi>j</mi> <mo>,</mo> <mi>k</mi> </mrow> <msub> <mi>h</mi> <mi>j</mi> </msub> </msubsup> <mo>+</mo> <mi>β</mi> <mo>)</mo> </mrow> <mrow> <msubsup> <mi>n</mi> <mrow> <mo>-</mo> <mi>i</mi> <mo>,</mo> <mo>-</mo> <mi>j</mi> <mo>,</mo> <mi>k</mi> </mrow> <mrow> <mo>(</mo> <mo>·</mo> <mo>)</mo> </mrow> </msubsup> <mo>+</mo> <mi>W</mi> <mi>β</mi> </mrow> </mfrac> </mrow>$

其中，W代表中藥的總數(shù)，表示中藥h_i分配給功效k的次數(shù)，不包括當(dāng)前分配；代表分配給功效k的中藥總次數(shù)，不包括中藥h_i分配給功效k的次數(shù)；代表分配給功效k的中藥總次數(shù)，不包括中藥h_i，h_j分配給功效k的次數(shù)。

4.根據(jù)權(quán)利要求3所述的基于概率主題模型和中藥基本屬性的方劑功能預(yù)測方法，其特征在于所述步驟3的具體實(shí)現(xiàn)過程如下：

3-1.針對(duì)每幅方劑p，假定中藥味數(shù)為N_p，計(jì)算中藥h_i在方劑中的頻次F(h_i)，取頻次最高的兩味中藥作為君藥和臣藥；

$<mrow> <mi>F</mi> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>d</mi> <mi>i</mi> <mo>*</mo> </msubsup> <mo>/</mo> <msubsup> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>N</mi> <mi>p</mi> </msub> </msubsup> <msubsup> <mi>d</mi> <mi>j</mi> <mo>*</mo> </msubsup> </mrow>$

3-2.利用TFIDF模型計(jì)算中藥h_i對(duì)方劑的重要程度，根據(jù)每味中藥在方劑中的TFIDF值構(gòu)造方劑p的權(quán)重向量m代表來自方劑數(shù)據(jù)庫中的唯一中藥總數(shù)；

$<mrow> <mi>T</mi> <mi>F</mi> <mi>I</mi> <mi>D</mi> <mi>F</mi> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>F</mi> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mo>(</mo> <mfrac> <msub> <mi>N</mi> <mi>p</mi> </msub> <mrow> <mo>|</mo> <mo>{</mo> <mi>j</mi> <mo>:</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> <mo>}</mo> <mo>|</mo> </mrow> </mfrac> <mo>)</mo> </mrow>$

其中，若方劑p包含中藥h_i，則t_i＝TFIDF(h_i)，否則t_i＝0。

5.根據(jù)權(quán)利要求4所述的基于概率主題模型和中藥基本屬性的方劑功能預(yù)測方法，其特征在于所述步驟5的具體實(shí)現(xiàn)過程如下：

5-1.用戶輸入待預(yù)測方劑h_i代表中藥，應(yīng)用貝葉斯公式計(jì)算該方劑隸屬于功效k的概率：

$<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>|</mo> <msup> <mi>H</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>)</mo> </mrow> </msup> <mo>)</mo> </mrow> <mo>&Proportional;</mo> <munder> <mo>Π</mo> <mrow> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msup> <mi>H</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>)</mo> </mrow> </msup> <mo>,</mo> <mi>i</mi> <mo>&NotEqual;</mo> <mi>j</mi> </mrow> </munder> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>|</mo> <mi>k</mi> <mo>)</mo> </mrow> <mi>p</mi> <msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mrow> <mo>{</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>0</mn> <mo>}</mo> </mrow> </msub> <mo>·</mo> <mi>p</mi> <mrow> <mo>(</mo> <mo>(</mo> <mrow> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>h</mi> <mi>j</mi> </msub> </mrow> <mo>)</mo> <mo>|</mo> <mi>k</mi> <mo>)</mo> </mrow> <mi>p</mi> <msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mrow> <mo>{</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>}</mo> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <munder> <mo>Π</mo> <mrow> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msup> <mi>H</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>)</mo> </mrow> </msup> <mo>,</mo> <mi>i</mi> <mo>&NotEqual;</mo> <mi>j</mi> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>ψ</mi> <mi>k</mi> </msub> <msub> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>{</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>0</mn> <mo>}</mo> </mrow> </msub> <mi>p</mi> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>·</mo> <mrow> <mo>(</mo> <msub> <mi>θ</mi> <mi>k</mi> </msub> <msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>h</mi> <mi>j</mi> </msub> </mrow> <mo>)</mo> </mrow> <mrow> <mo>{</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>}</mo> </mrow> </msub> <mi>p</mi> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>&Proportional;</mo> <munder> <mo>Π</mo> <mrow> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msup> <mi>H</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>)</mo> </mrow> </msup> <mo>,</mo> <mi>i</mi> <mo>&NotEqual;</mo> <mi>j</mi> </mrow> </munder> <msub> <mi>ψ</mi> <mi>k</mi> </msub> <msub> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>{</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>0</mn> <mo>}</mo> </mrow> </msub> <mo>·</mo> <msub> <mi>θ</mi> <mi>k</mi> </msub> <msub> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>h</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>{</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>}</mo> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced>$

其中，x_i＝1表示中藥h_i存在配伍藥對(duì)，否則x_i＝0；

5-2.針對(duì)方劑H^(p)，返回滿足下式的功效k，取閾值T＝1e-8，得到功效集合一：

p(k|H^(p))＞T。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)