自動(dòng)挖掘配伍關(guān)系系統(tǒng)及其方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及知識(shí)發(fā)現(xiàn)技術(shù)領(lǐng)域,尤其涉及自動(dòng)挖掘配伍關(guān)系系統(tǒng)及其方法。
【背景技術(shù)】
[0002] 隨著社會(huì)信息化進(jìn)程的飛速發(fā)展,人類已經(jīng)進(jìn)入了一個(gè)"信息爆炸"的時(shí)代,海量 的數(shù)據(jù)已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了人們的分析和理解能力,于是數(shù)據(jù)庫(kù)技術(shù)和人工智能技術(shù)應(yīng)運(yùn)而 生。但是,單純的數(shù)據(jù)庫(kù)技術(shù)和人工智能技術(shù)基本上停留在對(duì)原始數(shù)據(jù)的標(biāo)引和檢索,并未 能更深入地挖掘出數(shù)據(jù)內(nèi)部隱藏的知識(shí)。
[0003] 知識(shí)發(fā)現(xiàn)技術(shù)是隨著數(shù)據(jù)庫(kù)技術(shù)和人工智能技術(shù)的發(fā)展而出現(xiàn)的一種新技術(shù)。它 運(yùn)用數(shù)據(jù)庫(kù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行前端處理,從而利用機(jī)器學(xué)習(xí)方法從處理后的數(shù)據(jù)庫(kù)中提取 有用的知識(shí)。知識(shí)發(fā)現(xiàn)技術(shù)系統(tǒng)能夠在用戶的指令下,從數(shù)據(jù)庫(kù)管理系統(tǒng)獲取數(shù)據(jù),經(jīng)過(guò)數(shù) 據(jù)聚集生成多維數(shù)據(jù)集,通過(guò)一定的知識(shí)發(fā)現(xiàn)技術(shù)進(jìn)行模式提取,并進(jìn)行模式評(píng)價(jià),最終獲 得知識(shí)。此項(xiàng)技術(shù)涉及到機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)、智能數(shù)據(jù)庫(kù)、知識(shí)獲取、數(shù)據(jù)可視化、 高性能計(jì)算、專家系統(tǒng)等多個(gè)領(lǐng)域。從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)出來(lái)的知識(shí)可以用在信息管理、過(guò)程控 制、科學(xué)研宄、決策支持等許多方面。
[0004] 但是,目前的知識(shí)發(fā)現(xiàn)技術(shù)并不能做到對(duì)相關(guān)的知識(shí)進(jìn)行自動(dòng)挖掘并配伍關(guān)系。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種將檢索到的知識(shí)進(jìn)行自動(dòng)挖掘和配伍關(guān)系的自動(dòng)挖 掘配伍關(guān)系系統(tǒng)及其方法。
[0006] 本發(fā)明提供的自動(dòng)挖掘配伍關(guān)系系統(tǒng),以基礎(chǔ)數(shù)據(jù)總庫(kù)為依托,具有這樣的特征, 包括:數(shù)據(jù)準(zhǔn)備部,連接基礎(chǔ)數(shù)據(jù)總庫(kù),對(duì)基礎(chǔ)數(shù)據(jù)總庫(kù)中的基礎(chǔ)數(shù)據(jù)依次進(jìn)行數(shù)據(jù)集成、 數(shù)據(jù)選擇、預(yù)處理形成新數(shù)據(jù)庫(kù);數(shù)據(jù)挖掘部,與數(shù)據(jù)準(zhǔn)備部相連,對(duì)新數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖 掘形成挖掘數(shù)據(jù);以及結(jié)果表達(dá)和解釋部,與數(shù)據(jù)挖掘部相連,對(duì)挖掘數(shù)據(jù)進(jìn)行結(jié)果表達(dá)和 解釋,其中,數(shù)據(jù)準(zhǔn)備部,具有:檢索模塊,根據(jù)基礎(chǔ)數(shù)據(jù)總庫(kù)建立,對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行檢索, 自動(dòng)生成檢索表達(dá)式并存儲(chǔ),并生成檢索數(shù)據(jù)庫(kù);識(shí)別閱讀模塊,與檢索模塊相連,根據(jù)檢 索模塊建立,對(duì)檢索數(shù)據(jù)庫(kù)中的指定字段中閱讀文本,查找出若干個(gè)關(guān)鍵詞,并生成關(guān)鍵詞 庫(kù);篩選關(guān)鍵詞模塊,與識(shí)別閱讀模塊相連,根據(jù)檢索模塊和識(shí)別閱讀模塊建立,對(duì)關(guān)鍵詞 庫(kù)中的若干個(gè)關(guān)鍵詞進(jìn)行篩選,并形成布爾邏輯表達(dá)式;以及語(yǔ)義數(shù)據(jù)庫(kù)生成模塊,與篩選 關(guān)鍵詞模塊相連,根據(jù)檢索模塊、識(shí)別閱讀模塊和篩選關(guān)鍵詞模塊建立,根據(jù)布爾邏輯表達(dá) 式,在基礎(chǔ)數(shù)據(jù)總庫(kù)中搜索,并生成新數(shù)據(jù)庫(kù)。
[0007] 優(yōu)選的,篩選關(guān)鍵詞模塊,包含:納入關(guān)鍵詞模塊,將若干個(gè)關(guān)鍵詞通過(guò)檢索模塊 進(jìn)行逐個(gè)檢索,選出高頻或相關(guān)系數(shù)高的若干個(gè)關(guān)鍵詞,計(jì)算出若干個(gè)關(guān)鍵詞的組合重疊 情況,分析用詞習(xí)慣和語(yǔ)言規(guī)律;以及排出關(guān)鍵詞模塊,與納入關(guān)鍵詞模塊相連,將人工識(shí) 別去除的去除關(guān)鍵詞記錄下來(lái),并生成棄用規(guī)則。
[0008] 優(yōu)選的,檢索模塊包含搜索界面,通過(guò)人工輸入檢索關(guān)鍵詞。
[0009] 優(yōu)選的,識(shí)別閱讀模塊通過(guò)切詞、斷詞、組詞等閱讀過(guò)程,生成一組關(guān)鍵詞庫(kù)。
[0010] 本發(fā)明還提供的自動(dòng)挖掘配伍關(guān)系方法,以基礎(chǔ)數(shù)據(jù)總庫(kù)為依托,其特征在于,包 括以下步驟:
[0011] 步驟a:根據(jù)基礎(chǔ)數(shù)據(jù)總庫(kù)建立檢索模塊,對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行檢索,自動(dòng)生成檢索表 達(dá)式并存儲(chǔ),并生成檢索數(shù)據(jù)庫(kù),
[0012] 步驟b:根據(jù)檢索模塊建立識(shí)別閱讀模塊,對(duì)檢索數(shù)據(jù)庫(kù)中的指定字段中閱讀文 本,查找出若干個(gè)關(guān)鍵詞,并生成關(guān)鍵詞庫(kù),
[0013] 步驟c:根據(jù)檢索模塊和識(shí)別閱讀模塊建立篩選關(guān)鍵詞模塊,對(duì)關(guān)鍵詞庫(kù)中的若 干個(gè)關(guān)鍵詞進(jìn)行篩選,并形成布爾邏輯表達(dá)式,
[0014] 步驟d:根據(jù)檢索模塊、識(shí)別閱讀模塊和篩選關(guān)鍵詞模塊建立語(yǔ)義數(shù)據(jù)庫(kù)生成模 塊,根據(jù)布爾邏輯表達(dá)式,在基礎(chǔ)數(shù)據(jù)總庫(kù)中搜索,并生成新數(shù)據(jù)庫(kù),
[0015] 步驟e:對(duì)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘形成挖掘數(shù)據(jù),以及
[0016] 步驟f:對(duì)挖掘數(shù)據(jù)進(jìn)行結(jié)果表達(dá)和解釋。
[0017]優(yōu)選的,步驟c,具有:
[0018] 步驟C-I:將若干個(gè)關(guān)鍵詞通過(guò)檢索模塊進(jìn)行逐個(gè)檢索,選出高頻或相關(guān)系數(shù)高 的若干個(gè)關(guān)鍵詞,計(jì)算出若干個(gè)關(guān)鍵詞的組合重疊情況,分析用詞習(xí)慣和語(yǔ)言規(guī)律,以及
[0019] 步驟c-2 :將人工識(shí)別去除的去除關(guān)鍵詞記錄下來(lái),并生成棄用規(guī)則。
[0020] 優(yōu)選的,檢索模塊包含搜索界面,通過(guò)人工輸入檢索關(guān)鍵詞。
[0021] 優(yōu)選的,識(shí)別閱讀模塊通過(guò)切詞、斷詞、組詞等閱讀過(guò)程,生成一組關(guān)鍵詞庫(kù)。
[0022] 發(fā)明作用和效果
[0023] 根據(jù)本發(fā)明所涉及自動(dòng)挖掘配伍關(guān)系系統(tǒng)及其方法能夠在根據(jù)基礎(chǔ)數(shù)據(jù)總庫(kù)里 的基礎(chǔ)數(shù)據(jù)依次進(jìn)行數(shù)據(jù)集成、數(shù)據(jù)選擇、預(yù)處理形成新數(shù)據(jù)庫(kù),對(duì)新數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘 形成挖掘數(shù)據(jù),對(duì)所述挖掘數(shù)據(jù)進(jìn)行結(jié)果表達(dá)和解釋。本發(fā)明提出的中醫(yī)方劑自動(dòng)挖掘配 伍關(guān)系系統(tǒng)及其方法是能進(jìn)行知識(shí)自動(dòng)挖掘、并查找出配伍關(guān)系的自動(dòng)挖掘配伍關(guān)系系統(tǒng) 及其方法。
【附圖說(shuō)明】
[0024] 圖1是本發(fā)明在實(shí)施例中的自動(dòng)挖掘配伍關(guān)系系統(tǒng)的結(jié)構(gòu)連接框圖;
[0025] 圖2是本發(fā)明在實(shí)施例中的自動(dòng)挖掘配伍關(guān)系方法的流程圖;
[0026] 圖3是本發(fā)明在實(shí)施例中的基礎(chǔ)數(shù)據(jù)總庫(kù)的數(shù)據(jù)表;
[0027] 圖4是本發(fā)明在實(shí)施例中的檢索數(shù)據(jù)庫(kù)的數(shù)據(jù)表;
[0028] 圖5是本發(fā)明在實(shí)施例中的關(guān)鍵詞庫(kù)的數(shù)據(jù)表;
[0029] 圖6是本發(fā)明在實(shí)施例中的啟用規(guī)則中的關(guān)鍵詞庫(kù)數(shù)據(jù)表;
[0030] 圖7是本發(fā)明在實(shí)施例中的乳巖方劑數(shù)據(jù)的數(shù)據(jù)表;
[0031] 圖8是本發(fā)明在實(shí)施例中的數(shù)據(jù)挖掘結(jié)果的數(shù)據(jù)表;
[0032] 圖9是本發(fā)明在實(shí)施例中的通過(guò)藥物關(guān)聯(lián)規(guī)則方劑生成藥物配伍關(guān)系的配伍關(guān) 系圖;
[0033] 圖10是本發(fā)明在實(shí)施例中的局部放大藥物關(guān)系圖的關(guān)系圖;以及
[0034] 圖11是本發(fā)明在實(shí)施例中的數(shù)據(jù)挖掘部挖掘數(shù)據(jù)的藥物分類的通用關(guān)聯(lián)圖。
【具體實(shí)施方式】
[0035] 以下參照附圖對(duì)本發(fā)明所涉及的自動(dòng)挖掘配伍關(guān)系系統(tǒng)及其方法作詳細(xì)的描述。
[0036] 實(shí)施例
[0037] 本實(shí)施例中的自動(dòng)挖掘配伍關(guān)系系統(tǒng)及其方法用于中醫(yī)古方的挖掘與配伍關(guān)系, 主要是對(duì)組成、癥狀、功用等字段進(jìn)行規(guī)范化設(shè)計(jì),轉(zhuǎn)換成多維頻繁模式可挖掘數(shù)據(jù),完成 藥物配伍和功效數(shù)據(jù)挖掘研宄,發(fā)掘其中的規(guī)律。利用神經(jīng)網(wǎng)絡(luò)方法、聚類、關(guān)聯(lián)規(guī)則的挖 掘和可視化等方法,開(kāi)展方藥的知識(shí)發(fā)現(xiàn)研宄,證實(shí)和發(fā)掘方藥中隱含的有價(jià)值的信息,揭 示方藥配伍規(guī)律,為中醫(yī)的新藥開(kāi)發(fā)提供參考依據(jù)。
[0038] 圖1是本發(fā)明在實(shí)施例中的自動(dòng)挖掘配伍關(guān)系系統(tǒng)的結(jié)構(gòu)連接框圖。
[0039] 如圖1所示,本實(shí)例中的自動(dòng)挖掘配伍關(guān)系系統(tǒng)以基礎(chǔ)數(shù)據(jù)總庫(kù)10為依托,具有: 數(shù)據(jù)準(zhǔn)備部20、數(shù)據(jù)挖掘部30和結(jié)果表達(dá)和解釋部40。
[0040] 數(shù)據(jù)準(zhǔn)備部20與基礎(chǔ)數(shù)據(jù)總庫(kù)10相連,包含:檢索模塊11、識(shí)別閱讀模塊12、篩 選關(guān)鍵詞模塊13和語(yǔ)義數(shù)據(jù)庫(kù)生成模塊14,對(duì)基礎(chǔ)數(shù)據(jù)總庫(kù)10中的基礎(chǔ)數(shù)據(jù)依次進(jìn)行數(shù) 據(jù)集成、數(shù)據(jù)選擇、預(yù)處理形成新數(shù)據(jù)庫(kù)。
[0041] 檢索模塊11根據(jù)所述基礎(chǔ)數(shù)據(jù)總庫(kù)10建立,包含搜索界面,通過(guò)人工輸入檢索關(guān) 鍵詞對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行檢索,自動(dòng)生成檢索表達(dá)式并存儲(chǔ),并生成檢索數(shù)據(jù)庫(kù)。
[0042] 識(shí)別閱讀模塊12與檢索模塊11相連,根據(jù)檢索模塊11建立,對(duì)檢索數(shù)據(jù)庫(kù)中的 指定字段中閱讀文本,通過(guò)切詞、斷詞、組詞等閱讀過(guò)程,查找出若干個(gè)關(guān)鍵詞,并生成一組 關(guān)鍵詞庫(kù)。
[0043] 篩選關(guān)鍵詞模塊13,與識(shí)別閱讀模塊12相連,包括:納入關(guān)鍵詞模塊13a和排出 關(guān)鍵詞模塊13b,根據(jù)檢索模塊11和識(shí)別閱讀模塊12建立,對(duì)關(guān)鍵詞庫(kù)中的若干個(gè)關(guān)鍵詞 進(jìn)行篩選,并形成布爾邏輯表達(dá)式。
[0044] 納入關(guān)鍵詞模塊13a將若干個(gè)關(guān)鍵詞通過(guò)檢索模塊11進(jìn)行逐個(gè)檢索,選出高頻或 相關(guān)系數(shù)高的若干個(gè)關(guān)鍵詞,計(jì)算出若干個(gè)關(guān)鍵詞的組合重疊情況,分析用詞習(xí)慣和語(yǔ)言 規(guī)律。
[0045] 排出關(guān)鍵詞模塊13b與納入關(guān)鍵詞模塊13a相連,將人工識(shí)別去除的去除關(guān)鍵詞 記錄下來(lái),并生成棄用規(guī)則。
[0046] 語(yǔ)義數(shù)據(jù)庫(kù)生成模塊14與篩選關(guān)鍵詞模塊相連,根據(jù)檢索模塊11、識(shí)別閱讀模塊 12和篩選關(guān)鍵詞模塊13建立,根據(jù)布爾邏輯表達(dá)式,在基礎(chǔ)數(shù)據(jù)總