專利名稱:一種建立中醫(yī)數(shù)據(jù)庫的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種建立中醫(yī)數(shù)據(jù)庫的方法,特別涉及一種可以進(jìn)行科學(xué)分析、統(tǒng)計(jì)的中醫(yī)數(shù)據(jù)庫的建立方法。
背景技術(shù):
中醫(yī)學(xué)的精髓在哪里?在《黃帝內(nèi)經(jīng)》、《神農(nóng)本草經(jīng)》等醫(yī)學(xué)巨著里,在張仲景、張景岳等中醫(yī)大家的學(xué)術(shù)思想里。然而中醫(yī)學(xué)是實(shí)踐醫(yī)學(xué),其精髓也應(yīng)存在于歷代名老中醫(yī)的臨床醫(yī)案里。但上述醫(yī)書、案例等資料浩如煙海,人工是不可能進(jìn)行科學(xué)的分析和統(tǒng)計(jì)的。隨著計(jì)算機(jī)軟硬件技術(shù)的發(fā)展,利用計(jì)算機(jī)系統(tǒng)建立數(shù)據(jù)庫,對(duì)中醫(yī)進(jìn)行分析和統(tǒng)計(jì)提供了可能。但現(xiàn)有的數(shù)據(jù)庫常常是將醫(yī)學(xué)書籍和醫(yī)案進(jìn)行簡(jiǎn)單的錄入,多半只具有檢索功能,不能進(jìn)行科學(xué)分析和統(tǒng)計(jì),例如,不能定量地說明其中哪些病因或病理結(jié)果對(duì)引起某證候更重要,哪些癥狀對(duì)辨識(shí)某證候更重要,哪些用藥對(duì)治療某證候更重要,更很少介紹哪些病因或病理結(jié)果、癥狀和用藥對(duì)某證候一定不重要。
發(fā)明內(nèi)容本發(fā)明為了克服以上技術(shù)的不足,提供了一種可以進(jìn)行科學(xué)分析、統(tǒng)計(jì)的中醫(yī)數(shù)據(jù)庫的建立方法。
本發(fā)明是通過以下措施來實(shí)現(xiàn)的本發(fā)明的建立中醫(yī)數(shù)據(jù)庫的方法,是利用計(jì)算機(jī)系統(tǒng),將醫(yī)案參數(shù)按二值變量,錄入計(jì)算機(jī),其中醫(yī)案涉及的參數(shù)賦值為1,未涉及的參數(shù)賦值為0。
本發(fā)明的建立中醫(yī)數(shù)據(jù)庫的方法,所述的醫(yī)案參數(shù)為病名、病位、病因或病理結(jié)果、證型、癥狀及用藥的二種或二種以上。
本發(fā)明的建立中醫(yī)數(shù)據(jù)庫的方法,所述的計(jì)算機(jī)系統(tǒng)以VisualFoxPro 6.0為開發(fā)平臺(tái),編制計(jì)算機(jī)軟件。
采用本發(fā)明的方法,將一些醫(yī)案建立數(shù)據(jù)庫,然后進(jìn)行統(tǒng)計(jì)分析,可望使分類、命名和診斷嚴(yán)重不統(tǒng)一的中醫(yī)證候統(tǒng)計(jì)規(guī)范化,并能為中醫(yī)教學(xué)、臨床和科研提供參考數(shù)據(jù)。
利用本發(fā)明的數(shù)據(jù)庫,使用Logistic回歸分析統(tǒng)計(jì)方法篩選并定量地表達(dá)了脾、肺、腎、肝、心、胃在疾病過程中的常見臨床證候,與某一證候正相關(guān)和負(fù)相關(guān)的病因或病理結(jié)果、癥狀和用藥。并據(jù)統(tǒng)計(jì)結(jié)果總結(jié)出五臟疾病的發(fā)病規(guī)律和生理功能。
對(duì)常見臨床癥狀的臨床證型、發(fā)病部位、病因或病理結(jié)果、伴隨癥狀和常用藥物進(jìn)行統(tǒng)計(jì),對(duì)常見臨床證型的病因或病理結(jié)果、常見癥狀和常用藥物進(jìn)行統(tǒng)計(jì),編輯成“中醫(yī)統(tǒng)計(jì)診斷”,將部分癥狀、證型、病因或病理結(jié)果、用藥統(tǒng)計(jì)規(guī)范化,對(duì)疾病的診斷、用藥、制藥提供一種規(guī)范化的指導(dǎo),促進(jìn)中藥的標(biāo)準(zhǔn)化、規(guī)范化、科學(xué)化。
利用本發(fā)明的方法建立的中醫(yī)數(shù)據(jù)庫,具備數(shù)字化輸入,輸入簡(jiǎn)單、快捷。利用本發(fā)明的中醫(yī)數(shù)據(jù)庫,可以對(duì)醫(yī)案進(jìn)行科學(xué)的統(tǒng)計(jì)、分析,實(shí)現(xiàn)中醫(yī)辨證用藥的標(biāo)準(zhǔn)化、規(guī)范化、科學(xué)化。
附圖為本發(fā)明中脾虛濕盛的病因個(gè)數(shù)與AIC的關(guān)系具體實(shí)施方式
下面以《全國中醫(yī)圖書聯(lián)合目錄》為例建立數(shù)據(jù)庫。
1數(shù)據(jù)庫的建立1.1醫(yī)案的納入標(biāo)準(zhǔn)①以《全國中醫(yī)圖書聯(lián)合目錄》為指導(dǎo),以山東中醫(yī)藥大學(xué)圖書館藏書為基礎(chǔ),挑選宋、元、明、清及近代的中醫(yī)臨床名家的醫(yī)案;②醫(yī)案的辨證用藥遵循中醫(yī)學(xué)的傳統(tǒng)思路;③若屬對(duì)患者多次復(fù)診的醫(yī)案,則由二診時(shí)的療效決定是否僅錄入初診部分,以使各醫(yī)案之間相對(duì)獨(dú)立。
1.2醫(yī)案的排除標(biāo)準(zhǔn)①?zèng)]有臨床癥狀或用藥的醫(yī)案;②參考西醫(yī)診斷或理化檢查結(jié)果用藥的醫(yī)案;③復(fù)診的醫(yī)案;④表述不規(guī)范,容易產(chǎn)生歧義的醫(yī)案。
1.3編制計(jì)算機(jī)軟件以高等中醫(yī)院校全國統(tǒng)編教材《中醫(yī)診斷學(xué)》、《中藥學(xué)》、《中醫(yī)內(nèi)科學(xué)》等為藍(lán)本,對(duì)所有醫(yī)案涉及的內(nèi)容如病名(501個(gè))、病位(80個(gè))、病因或病理結(jié)果(100個(gè))、綜合證型(186個(gè))、癥狀(817個(gè))及用藥(781味)等進(jìn)行分類、編號(hào)和西文命名。以Visual FoxPro 6.0為開發(fā)平臺(tái),編制計(jì)算機(jī)操作軟件,使得這些內(nèi)容都成為取值為0或1的二值變量。
1.4醫(yī)案的錄入錄入員只需用鼠標(biāo)將某一醫(yī)案所涉及的內(nèi)容點(diǎn)擊一遍,即把他們賦值為1,其他未點(diǎn)擊的部分則自動(dòng)賦值為0。在錄入過程中,要求尊重原著,不容許任何主觀意志的介入。初步錄入的醫(yī)案經(jīng)由核查人員的兩次審核合格后方被正式錄用。共錄入了156位中醫(yī)臨床名家的醫(yī)案22,459條。
1.5數(shù)據(jù)庫的優(yōu)化將所有變量分成癥狀、病名、辨證及用藥四類,使得每一類中的變量都是相對(duì)獨(dú)立的變量。如果在某一類中沒有任何變量取值為1,則將所有該類中的變量視為數(shù)據(jù)空缺。
2統(tǒng)計(jì)采用國際通用的SAS 6.12統(tǒng)計(jì)軟件的非條件Logistic多元逐步回歸法進(jìn)行統(tǒng)計(jì)。這里的“非條件”是針對(duì)成組設(shè)計(jì)的資料進(jìn)行的分析,Logistic回歸是處理二值型因變量的回歸方法,逐步回歸包括兩個(gè)相反的過程①不斷從模型以外的變量中挑選“重要”的引入模型。②對(duì)引入模型的變量進(jìn)行綜合分析,將那些“不重要”的變量從模型中剔除。
2.1自變量的篩選原則①以某一被研究對(duì)象如肝氣郁結(jié)為因變量,從80個(gè)常見病位中篩選伴隨的發(fā)病部位,從100個(gè)常見病因或病理結(jié)果中篩選病因或病理結(jié)果,從817個(gè)常見癥狀中篩選癥狀,從781種常用藥物中篩選用藥,被選中的對(duì)象稱為自變量。②隨著被選入的自變量數(shù)增加,模型反映實(shí)際問題的能力(即擬合優(yōu)度)不斷增強(qiáng),表述擬合優(yōu)度的指標(biāo)AIC不斷下降。如圖1為研究脾虛濕盛證的病因時(shí)獲得的自變量個(gè)數(shù)與AIC的關(guān)系,顯然,當(dāng)自變量數(shù)為4時(shí),AIC的下降速度由快轉(zhuǎn)慢。從判斷回歸方程預(yù)測(cè)準(zhǔn)確性的統(tǒng)計(jì)量Concordant(和諧)的值也容易發(fā)現(xiàn),當(dāng)自變量數(shù)是4時(shí),Concordent=74.5%,當(dāng)自變量數(shù)增加至14個(gè)時(shí),Concordent=81.7%。亦即,后增的10個(gè)病因僅使模型的預(yù)測(cè)準(zhǔn)確性升高7.2%。故4個(gè)病因是我們期望獲得的自變量較少而擬合優(yōu)度較高的簡(jiǎn)約模型。③進(jìn)入模型的自變量在進(jìn)行Waldχ2檢驗(yàn)時(shí)應(yīng)至少在α=0.05水平上統(tǒng)計(jì)顯著。
2.2統(tǒng)計(jì)結(jié)果的表達(dá)以肝氣郁結(jié)的統(tǒng)計(jì)結(jié)果為例。全國統(tǒng)編教材《中醫(yī)診斷學(xué)》認(rèn)為,肝氣郁結(jié)的常見癥狀是脅痛、脅脹、善太息、月經(jīng)紫黯、乳房脹痛、咽如物梗,吐咽不解、瘕聚、脈弦等。但在這些癥狀中哪些是肝氣郁結(jié)的主要癥狀,哪些是肝氣郁結(jié)的特異性癥狀,我們沒有統(tǒng)一的認(rèn)識(shí)。借助上述統(tǒng)計(jì)分析,我們發(fā)現(xiàn)肝氣郁結(jié)的癥狀Logit(p)=-3.7425+1.2319脈弦(0.2938)+1.5179脅脹(0.0925)+1.2752脅痛(0.1396)+2.2004太息(0.0605)+1.4912月經(jīng)紫黯(0.0672)+1.1407噯氣(0.0708)-0.9208咳嗽(-0.1791)+1.7171咽如物梗,吐咽不解(0.0655)+0.5222脈沉(0.0846)+1.0890瘕聚(0.0656)+1.7796乳房脹痛(0.0489)-0.7652發(fā)熱(-0.1357)。
模型評(píng)價(jià)對(duì)于每一自變量都有Waldχ2>26.9,p=0.0001。Concordant=67.6%。
其中,①所有癥狀是從817個(gè)臨床癥狀中篩選出來的;②癥狀的排列順序?yàn)檫M(jìn)行Logistic回歸時(shí)各癥狀進(jìn)入模型的先后順序;③癥狀前的數(shù)值是偏回歸系數(shù),其正、負(fù)號(hào)表示該癥狀對(duì)肝氣郁結(jié)的正、負(fù)面影響。偏回歸系數(shù)的自然指數(shù)又稱發(fā)生比率(Odds Ratio)。例如善太息的發(fā)生比率為exp(2.2004)=9.0287,表示僅有善太息一個(gè)癥狀發(fā)生時(shí)診斷為肝氣郁結(jié)的概率與不診斷為肝氣郁結(jié)的概率之比,是所有癥狀都不發(fā)生時(shí)診斷肝氣郁結(jié)的概率與不診斷肝氣郁結(jié)的概率之比的9.0287倍。亦即,善太息是診斷肝氣郁結(jié)的重要癥狀或特異性癥狀。同理,發(fā)熱的發(fā)生比率是exp(-0.7652)=0.4652,說明發(fā)熱一般不見于肝氣郁結(jié)。容易理解,對(duì)于某一證候來說,偏回歸系數(shù)為負(fù)值的癥狀可用作該證候的鑒別診斷;④由于各癥狀的度量尺度不同,如“脅脹”由不發(fā)生到發(fā)生的變化與“脈弦”由不發(fā)生到發(fā)生的變化是不同的,使得不同癥狀對(duì)診斷肝氣郁結(jié)的影響大小不能比較。若將數(shù)據(jù)庫中各癥狀和因變量的值分別減去其平均值,再除以各自的標(biāo)準(zhǔn)差(這一過程又叫變量的標(biāo)準(zhǔn)化),就使之轉(zhuǎn)化為無量綱的變量,就使各癥狀對(duì)診斷肝氣郁結(jié)的影響大小具有了可比性。在上述統(tǒng)計(jì)結(jié)果中,各癥狀后的數(shù)值(括號(hào)內(nèi))是標(biāo)準(zhǔn)化回歸系數(shù),其大小表示在整體考慮所有被納入的癥狀時(shí),各個(gè)癥狀對(duì)診斷肝氣郁結(jié)的影響程度。因此,標(biāo)準(zhǔn)化回歸系數(shù)較高的癥狀如脈弦是肝氣郁結(jié)的主要癥狀。
由回歸方程可知,按照各癥狀對(duì)肝氣郁結(jié)的貢獻(xiàn)度,由大到小依次是脈弦(0.2938)、脅痛(0.1396)、脅脹(0.0925)、脈沉(0.0846)、噯氣(0.0708)、月經(jīng)紫黯(0.0672)、瘕聚(0.0656)、咽如物梗,吐咽不解(0.0655)、善太息(0.0605)、乳房脹痛(0.0489)。按照各癥狀對(duì)判斷肝氣郁結(jié)的特異性,由強(qiáng)到弱依次是2.2004太息、1.7796乳房脹痛、1.7171咽如物梗,吐咽不解、1.5179脅脹、1.4912月經(jīng)紫黯、1.2752脅痛、1.2319脈弦、1.1407噯氣、1.0890瘕聚、0.5222脈沉。而咳嗽、發(fā)熱不是肝氣郁結(jié)的癥狀,可用做鑒別診斷。
3已有的統(tǒng)計(jì)結(jié)果(1)臟腑病辨證用藥的Logistic回歸分析 統(tǒng)計(jì)篩選并定量地表達(dá)了脾、肺、腎、肝、心、胃在疾病過程中的常見臨床證候,與某一證候正相關(guān)和負(fù)相關(guān)的病因或病理結(jié)果、癥狀和用藥。并據(jù)統(tǒng)計(jì)結(jié)果總結(jié)出五臟疾病的發(fā)病規(guī)律和生理功能。
(2)《中醫(yī)統(tǒng)計(jì)診斷》對(duì)332個(gè)常見臨床癥狀的臨床證型、發(fā)病部位、病因或病理結(jié)果、伴隨癥狀和常用藥物進(jìn)行了統(tǒng)計(jì)。對(duì)110個(gè)常見臨床證型的病因或病理結(jié)果、常見癥狀和常用藥物也進(jìn)行了統(tǒng)計(jì)。編輯成的《中醫(yī)統(tǒng)計(jì)診斷》作為“新世紀(jì)全國高等中醫(yī)藥院校創(chuàng)新教材”由中國中醫(yī)藥出版社出版,這一工作可望使《中醫(yī)診斷學(xué)》中的部分癥狀、證型、病因或病理結(jié)果、用藥統(tǒng)計(jì)規(guī)范化。
權(quán)利要求
1.一種中醫(yī)數(shù)據(jù)庫的建立方法,其特征在于利用計(jì)算機(jī)系統(tǒng),將醫(yī)案參數(shù)按二值變量,錄入計(jì)算機(jī),其中醫(yī)案涉及的參數(shù)賦值為1,未涉及的參數(shù)賦值為0。
2.根據(jù)權(quán)利要求1所述的中醫(yī)數(shù)據(jù)庫的建立方法,其特征在于所述的醫(yī)案參數(shù)為病名、病位、病因或病理結(jié)果、證型、癥狀及用藥的二種或二種以上。
3.根據(jù)權(quán)利要求1所述的中醫(yī)數(shù)據(jù)庫的建立方法,其特征在于所述的計(jì)算機(jī)系統(tǒng)以Visual FoxPro 6.0為開發(fā)平臺(tái),編制計(jì)算機(jī)軟件。
全文摘要
本發(fā)明涉及一種建立中醫(yī)數(shù)據(jù)庫的方法,以解決目前的中醫(yī)數(shù)據(jù)庫不能進(jìn)行科學(xué)分析、統(tǒng)計(jì)的問題。本發(fā)明的建立中醫(yī)數(shù)據(jù)庫的方法,是利用計(jì)算機(jī)系統(tǒng),將醫(yī)案參數(shù)按二值變量,錄入計(jì)算機(jī),其中醫(yī)案涉及的參數(shù)賦值為1,未涉及的參數(shù)賦值為0。利用本發(fā)明的方法建立的中醫(yī)數(shù)據(jù)庫,具備數(shù)字化輸入,輸入簡(jiǎn)單、快捷。利用本發(fā)明的中醫(yī)數(shù)據(jù)庫,可以對(duì)醫(yī)案進(jìn)行科學(xué)的統(tǒng)計(jì)、分析,實(shí)現(xiàn)中醫(yī)辨證用藥的標(biāo)準(zhǔn)化、規(guī)范化、科學(xué)化。
文檔編號(hào)G06F17/30GK1658196SQ20051004222
公開日2005年8月24日 申請(qǐng)日期2005年3月24日 優(yōu)先權(quán)日2005年3月24日
發(fā)明者張啟明 申請(qǐng)人:山東中醫(yī)藥大學(xué)