亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于評(píng)論文本信息增強(qiáng)的藥物不良反應(yīng)預(yù)測(cè)方法

文檔序號(hào):40444502發(fā)布日期:2024-12-24 15:18閱讀:18來(lái)源:國(guó)知局
一種基于評(píng)論文本信息增強(qiáng)的藥物不良反應(yīng)預(yù)測(cè)方法

本發(fā)明涉及生物信息學(xué),尤其是涉及一種基于患者評(píng)論文本信息增強(qiáng)的藥物不良反應(yīng)預(yù)測(cè)方法。


背景技術(shù):

1、目前,藥物不良反應(yīng)(adverse?drug?reactions,adrs)已經(jīng)成為醫(yī)學(xué)界和民眾關(guān)注的熱點(diǎn),用藥安全問(wèn)題日益得到全社會(huì)的重視。由于藥物開(kāi)發(fā)時(shí)試驗(yàn)人群的數(shù)量及試驗(yàn)周期等限制,會(huì)造成具有潛在藥物不良反應(yīng)的新藥流入市場(chǎng)的可能。因此,如何判斷和預(yù)測(cè)藥物的不良反應(yīng)具有重大的理論價(jià)值和實(shí)用價(jià)值。

2、(1)藥物不良反應(yīng)研究數(shù)據(jù)源

3、當(dāng)前基于數(shù)據(jù)分析的藥物不良反映研究,其研究數(shù)據(jù)的來(lái)源主要有三種類型:藥物知識(shí)庫(kù)、社交網(wǎng)絡(luò)評(píng)論文本和監(jiān)測(cè)數(shù)據(jù)庫(kù)。

4、基于藥物知識(shí)庫(kù)的研究,主要依賴于對(duì)藥物不良反應(yīng)相關(guān)知識(shí),藥物化學(xué)結(jié)構(gòu)信息、藥物-藥物相互作用信息、藥物靶標(biāo)信息、蛋白質(zhì)-蛋白質(zhì)相互作用信息、藥物副作用信息、藥物-疾病關(guān)聯(lián)信息、基因表達(dá)譜等,涵蓋了與藥物相關(guān)的化學(xué)、表型、基因組和細(xì)胞網(wǎng)絡(luò)等知識(shí),如今有pubchem、drugbank、ctd、ttd、sider等數(shù)據(jù)庫(kù)整合了大量的藥物相關(guān)的結(jié)構(gòu)化數(shù)據(jù),為發(fā)現(xiàn)藥物不良反應(yīng)提供了豐富的數(shù)據(jù)基礎(chǔ)。如使用sider、adrecs中的藥物副作用頻率數(shù)據(jù)集對(duì)基于藥物-副作用協(xié)同傳播模型進(jìn)行訓(xùn)練,并取得了較好的效果。

5、基于社交網(wǎng)絡(luò)評(píng)論文本的研究則是利用互聯(lián)網(wǎng)上公開(kāi)的大量無(wú)約束評(píng)論、博客、微博等社交媒體數(shù)據(jù),識(shí)別出與藥物使用有關(guān)的評(píng)論信息,如用藥原因、用藥方式、不良反應(yīng)描述等,并基于自然語(yǔ)言處理技術(shù)和機(jī)器學(xué)習(xí)算法對(duì)這些評(píng)論信息進(jìn)行抽取、分類和分析,來(lái)進(jìn)行藥物不良反應(yīng)的知識(shí)發(fā)現(xiàn)。如:趙明珍等利用信息熵的原理識(shí)別疾病和藥物不良反應(yīng)實(shí)體,提出基于skip-gram模型的生物試題關(guān)聯(lián)度計(jì)算方法,以尋求潛在藥物不良反應(yīng)的關(guān)聯(lián)蛋白質(zhì)。

6、基于監(jiān)測(cè)數(shù)據(jù)庫(kù)的研究其中faers因其數(shù)據(jù)豐富、公開(kāi)透明、術(shù)語(yǔ)與格式統(tǒng)一的特點(diǎn)常作為藥物不良反應(yīng)信號(hào)挖掘的數(shù)據(jù)來(lái)源,如楊莉、夏茹楠等通過(guò)對(duì)faers數(shù)據(jù)庫(kù)進(jìn)行挖掘,分別得到伊沙佐米、阿昔替尼的不良反應(yīng)信號(hào)。

7、(2)藥物不良反應(yīng)預(yù)測(cè)方法

8、利用數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等計(jì)算方法分析海量的生物醫(yī)學(xué)數(shù)據(jù),實(shí)現(xiàn)對(duì)藥物不良反應(yīng)的精準(zhǔn)預(yù)測(cè)已成為了該領(lǐng)域的熱門研究方法。但是,數(shù)據(jù)挖掘的方法常用于發(fā)現(xiàn)已出現(xiàn)的不良反應(yīng),無(wú)法預(yù)測(cè)潛在的不良反應(yīng)。機(jī)器學(xué)習(xí)的方法進(jìn)行藥物不良反應(yīng)預(yù)測(cè),在特定數(shù)據(jù)集上表現(xiàn)良好。例如,學(xué)得杜瑤將患病前后和用藥前后基因的表達(dá)量變化情況作為解釋變量,利用隨機(jī)森林算法對(duì)藥物副作用進(jìn)行預(yù)測(cè),相較于傳統(tǒng)的k近鄰算法有了顯著提升。但是,傳統(tǒng)的機(jī)器學(xué)習(xí)模型的性能在很大程度上依賴于訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量,其泛化能力可能不足。

9、為此,有學(xué)者使用聯(lián)合深度學(xué)習(xí)與藥物蛋白質(zhì)鏈路預(yù)測(cè)的方法構(gòu)建多消息傳遞神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)藥物不良反應(yīng),也有學(xué)者提出一種高階相似網(wǎng)絡(luò)的協(xié)同傳播模型對(duì)藥物不良反應(yīng)的發(fā)生頻率,吳菊華等開(kāi)發(fā)了一種知識(shí)圖譜嵌入的卷積神經(jīng)網(wǎng)絡(luò)adr預(yù)測(cè)模型,通過(guò)整合藥物靶點(diǎn)、適應(yīng)癥、酶和載體蛋白等藥物特征信息,進(jìn)行adr預(yù)測(cè),該模型將所有類型adr進(jìn)行統(tǒng)一預(yù)測(cè),減少過(guò)往研究需要為每種adr單獨(dú)開(kāi)發(fā)預(yù)測(cè)模型的冗余工作量,提高預(yù)測(cè)效率和和精度。以上方法均是使用公共數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行的預(yù)測(cè),而忽略了實(shí)際用藥中新出現(xiàn)的藥物不良反應(yīng),以及實(shí)際用藥時(shí)的患者差異,這些數(shù)據(jù)可以豐富預(yù)測(cè)時(shí)的信息,提高藥物不良反應(yīng)預(yù)測(cè)的準(zhǔn)確性,及時(shí)發(fā)現(xiàn)新出現(xiàn)的風(fēng)險(xiǎn),可以幫助臨床上為患者提供更安全、更個(gè)性化的治療方案。

10、(3)藥物不良反應(yīng)預(yù)測(cè)結(jié)果分析

11、以往的藥物不良反應(yīng)預(yù)測(cè)驗(yàn)證僅限于利用藥物不良反應(yīng)數(shù)據(jù)庫(kù)中的藥物不良反應(yīng)關(guān)聯(lián)驗(yàn)證預(yù)測(cè)結(jié)果的合理性,或者依據(jù)文獻(xiàn)報(bào)告對(duì)構(gòu)建好的模型進(jìn)行個(gè)案分析,表明模型具有良好的預(yù)測(cè)性能,并未對(duì)預(yù)測(cè)出的藥物不良反應(yīng)產(chǎn)生機(jī)制進(jìn)行后續(xù)的研究,本研究構(gòu)建藥物靶點(diǎn)-不良反應(yīng)靶點(diǎn)ppi網(wǎng)絡(luò),以及富集分析的方法,對(duì)預(yù)測(cè)結(jié)果在生物學(xué)水平上進(jìn)行解釋與驗(yàn)證分析,完善現(xiàn)有研究的整個(gè)預(yù)測(cè)、驗(yàn)證流程,使預(yù)測(cè)結(jié)果更為科學(xué)可靠。

12、綜上,目前已存在針對(duì)各種相關(guān)數(shù)據(jù)庫(kù)進(jìn)行的藥物不良反應(yīng)研究,但是潛在藥物不良反應(yīng)預(yù)測(cè)通常使用的是藥物化合物信息,忽略了用藥過(guò)程中的個(gè)體差異,而且現(xiàn)有研究大多是對(duì)已表現(xiàn)、已上報(bào)的藥物不良反應(yīng)進(jìn)行識(shí)別,并未將識(shí)別后的信息加入到預(yù)測(cè)工作中,實(shí)現(xiàn)的僅僅是已知的藥物不良反應(yīng)發(fā)現(xiàn),有可能忽視實(shí)際用藥經(jīng)驗(yàn)和罕見(jiàn)的不良反應(yīng)信息,大多數(shù)技術(shù)只是對(duì)藥物可能引發(fā)的藥物不良反應(yīng)進(jìn)行了預(yù)測(cè),而只有了解藥物引發(fā)不良反應(yīng)的原因才能夠避免藥物不良反應(yīng)的發(fā)生。本文通過(guò)整合多個(gè)數(shù)據(jù)源,以增加補(bǔ)充更多藥物-不良反應(yīng)之間的關(guān)聯(lián)關(guān)系信息,實(shí)現(xiàn)更準(zhǔn)確的預(yù)測(cè)效果,預(yù)測(cè)未出現(xiàn)的藥物不良反應(yīng)可能,為藥物的臨床應(yīng)用提供參考。在藥物不良反應(yīng)預(yù)測(cè)結(jié)果驗(yàn)證方面,本文專注討論藥物作用靶點(diǎn)之間的相互作用以及這些作用引起的不良反應(yīng)機(jī)制,即藥物是如何影響藥物靶點(diǎn)基因的表達(dá),進(jìn)而影響其互作用蛋白,導(dǎo)致相關(guān)通路的改變,最終引發(fā)藥物的不良反應(yīng)。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的是提供一種基于評(píng)論文本信息增強(qiáng)的藥物不良反應(yīng)預(yù)測(cè)方法,綜合利用藥物評(píng)論網(wǎng)站、臨床試驗(yàn)數(shù)據(jù)以及藥物數(shù)據(jù)源,綜合利用用戶實(shí)際經(jīng)驗(yàn)和反饋等多樣化的數(shù)據(jù),添加患者特征,豐富藥物及不良反應(yīng)之間的關(guān)系,提供了更加全面的藥物安全性評(píng)估,另外gcn模型相較于其他模型,訓(xùn)練與預(yù)測(cè)更為快速,可以減輕計(jì)算難度。

2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于評(píng)論文本信息增強(qiáng)的藥物不良反應(yīng)預(yù)測(cè)方法,包括以下步驟:

3、步驟1,藥物不良反應(yīng)詞典的構(gòu)建:

4、以galeano’s數(shù)據(jù)集為基準(zhǔn)數(shù)據(jù)集,以meddra本體中的藥物不良反應(yīng)首選術(shù)語(yǔ)及其同義詞為詞表來(lái)源,并采用直接編碼的方式對(duì)不良反應(yīng)術(shù)語(yǔ)進(jìn)行編碼,構(gòu)建藥物不良反應(yīng)詞典;

5、步驟2,基于評(píng)論文本的藥物不良反應(yīng)信息的提取:

6、通過(guò)python爬蟲(chóng)程序從藥物評(píng)論網(wǎng)站中采集藥物不良反應(yīng)評(píng)論文本數(shù)據(jù);

7、使用java程序,以及構(gòu)建好的藥物不良反應(yīng)詞典對(duì)基于評(píng)論文本的藥物不良反應(yīng)信息數(shù)據(jù)實(shí)現(xiàn)分詞、去停用詞處理及實(shí)體抽取處理,得到基于評(píng)論文本的藥物不良反應(yīng)關(guān)聯(lián);

8、步驟3,藥物不良反應(yīng)信息的整合:

9、在faers中篩選基準(zhǔn)數(shù)據(jù)集中的藥物,去除其中無(wú)效或不完整的記錄后,獲取這些藥物在報(bào)告表單中的不良反應(yīng)數(shù)據(jù);將相同藥物的不同不良反應(yīng)進(jìn)行整合,得到基于faers數(shù)據(jù)庫(kù)的藥物-不良反應(yīng)關(guān)聯(lián)信息;

10、將提取到的基于評(píng)論文本的藥物不良反應(yīng)關(guān)聯(lián)、基于faers數(shù)據(jù)庫(kù)的藥物不良反應(yīng)關(guān)聯(lián)、相關(guān)用藥信息,與基準(zhǔn)數(shù)據(jù)集的數(shù)據(jù)進(jìn)行合并,得到融合評(píng)論、faers數(shù)據(jù)庫(kù)信息的藥物-不良反應(yīng)關(guān)聯(lián)矩陣;

11、步驟4,公共數(shù)據(jù)庫(kù)藥物特征信息的整合:

12、在drugbank中獲取數(shù)據(jù)集中藥物smiles化學(xué)分子式、作用靶點(diǎn)等信息,在ttd數(shù)據(jù)庫(kù)中獲取藥物的適應(yīng)癥信息,在adrecs數(shù)據(jù)庫(kù)中獲取數(shù)據(jù)集中不良反應(yīng)的層次結(jié)構(gòu)信息(其中包括不良反應(yīng)的上下層級(jí)關(guān)系、結(jié)構(gòu)號(hào)),作為后續(xù)計(jì)算藥物、不良反應(yīng)相似度的依據(jù),最終得到藥物-分子結(jié)構(gòu)、藥物-靶標(biāo)、藥物-適應(yīng)癥、不良反應(yīng)層級(jí)關(guān)系、藥物-不良反應(yīng)五種關(guān)聯(lián)關(guān)系以及患者特征信息;

13、步驟5,相似度的計(jì)算:

14、①綜合藥物相似度:

15、首先將smiles字符串轉(zhuǎn)換為分子指紋,對(duì)于兩個(gè)藥物分子的指紋,計(jì)算它們的交集和并集,使用tanimoto系數(shù)計(jì)算藥物-分子結(jié)構(gòu)的相似度,得到藥物分子結(jié)構(gòu)相似度矩陣;

16、然后分別計(jì)算藥物共同作用的靶標(biāo)或治療的適應(yīng)癥的交集、并集,根據(jù)jaccard系數(shù)分別計(jì)算藥物-靶標(biāo)相似度、藥物-適應(yīng)癥相似度,得到藥物靶標(biāo)、適應(yīng)癥相似度矩陣;

17、用藥患者的特征也作為藥物相似度計(jì)算依據(jù)之一,處理性別、年齡、患病情況、用藥時(shí)長(zhǎng)等數(shù)據(jù)的缺失值和異常值,將性別作為數(shù)值型變量使用,對(duì)用藥時(shí)長(zhǎng)、年齡進(jìn)行分區(qū)方式轉(zhuǎn)換為分類變量,患病情況(病種)根據(jù)疾病類型進(jìn)行分類,對(duì)以上特征類型使用獨(dú)熱編碼,并對(duì)患病情況使用word2vec進(jìn)行特征構(gòu)造,將上述所有特征(包括one-hot編碼的特征和word2vec生成的特征)拼接起來(lái),形成一個(gè)患者的特征向量,多個(gè)患者的特征形成一個(gè)特征矩陣,特征矩陣經(jīng)過(guò)降維技術(shù)轉(zhuǎn)換為一個(gè)一維向量,代表一種藥物的患者特征;根據(jù)余弦相似度計(jì)算藥物基于患者特征的相似度,得到藥物基于患者特征的相似度矩陣;

18、最后通過(guò)加權(quán)相似度融合算法,得到綜合的藥物相似度矩陣;

19、②不良反應(yīng)相似度:

20、不良反應(yīng)之間的相似度根據(jù)有向無(wú)環(huán)圖dag計(jì)算,對(duì)于每一個(gè)不良反應(yīng)構(gòu)建一個(gè)基于不良反應(yīng)層級(jí)結(jié)構(gòu)的有向無(wú)環(huán)圖dag,其中包含與不良反應(yīng)相關(guān)的語(yǔ)義描述符,a,其dag可表示為dag(a)={ta,ea},其中ta是a包括其自身的祖先節(jié)點(diǎn)的集合,ea是dag中所有邊的集合;

21、描述符t在dag(a)中對(duì)“a”的貢獻(xiàn)通過(guò)公式計(jì)算,然后,對(duì)dag(a)中所有描述符的貢獻(xiàn)求和,即可得到“a”的語(yǔ)義值,基于語(yǔ)義值計(jì)算不良反應(yīng)si和sj之間的語(yǔ)義相似度如下得到不良反應(yīng)相似矩陣;

22、步驟6,異構(gòu)圖的構(gòu)建:

23、基于綜合藥物相似度矩陣、不良反應(yīng)相似度矩陣和藥物-不良反應(yīng)關(guān)聯(lián)矩陣,構(gòu)建異構(gòu)圖g;

24、步驟7,圖卷積網(wǎng)絡(luò)模型的搭建:

25、將構(gòu)建好的異構(gòu)圖引入到gcn編碼器中,分別提取藥物和疾病嵌入,將測(cè)試數(shù)據(jù)集中的關(guān)聯(lián)設(shè)置為0,編碼器可表示為:

26、

27、其中,len為編碼層的總數(shù),是度矩陣,是矩陣a添加自連接后的自環(huán)鄰接矩陣,hl是第l層的節(jié)點(diǎn)特征矩陣,h(l+1)是第l+1層的節(jié)點(diǎn)特征矩陣,(wen)l是第l層的學(xué)習(xí)權(quán)重矩陣,使用relu作為激活函數(shù);

28、對(duì)得到的節(jié)點(diǎn)表示使用內(nèi)積解碼器進(jìn)行解碼,得到藥物和不良反應(yīng)的最終嵌入:

29、

30、其中ed∈rm×d為藥物的最終嵌入,ea∈rn×d為不良反應(yīng)的最終嵌入,al是一個(gè)初始化為1/(l+1)的權(quán)重;

31、將sigmoid作為激活函數(shù)引入到gcn解碼器中,使用內(nèi)積解碼器得到預(yù)測(cè)關(guān)聯(lián)矩陣:

32、a′=sigmoid(ed·w·ea)

33、其中a′ij是藥物di和不良反應(yīng)aj的關(guān)聯(lián)預(yù)測(cè)得分,w∈rd×d是可訓(xùn)練的參數(shù)矩陣;

34、模型優(yōu)化部分使用加權(quán)交叉熵?fù)p失測(cè)量原始矩陣與重構(gòu)關(guān)聯(lián)矩陣之間的損失loss,并使用adam算法對(duì)損失loss進(jìn)行優(yōu)化;

35、步驟8,模型訓(xùn)練與評(píng)估:

36、選擇十折交叉驗(yàn)證來(lái)訓(xùn)練、評(píng)估模型性能,使用準(zhǔn)確率、f1分?jǐn)?shù)、精確率、召回率及roc曲線和auc值等指標(biāo)對(duì)圖卷積網(wǎng)絡(luò)(gcn)模型的性能進(jìn)行評(píng)估;

37、十折交叉驗(yàn)證將整個(gè)數(shù)據(jù)集隨機(jī)分成十個(gè)子集,將其中一個(gè)數(shù)據(jù)集作為測(cè)試集,其余九個(gè)數(shù)據(jù)集合并作為訓(xùn)練集,使用訓(xùn)練集訓(xùn)練模型,使用測(cè)試集評(píng)估模型的性能,重復(fù)以上步驟直到每個(gè)子集都被用作一次測(cè)試集,在所有十折中,計(jì)算模型性能指標(biāo)的平均值并作為最終結(jié)果;

38、步驟9,藥物的不良反應(yīng)案例預(yù)測(cè):

39、以治療癲癇病的藥物為案例,在訓(xùn)練好的模型中預(yù)測(cè)藥物可能產(chǎn)生的不良反應(yīng),選擇預(yù)測(cè)值大于0.7的藥物-不良反應(yīng)關(guān)聯(lián)對(duì)作為最后的預(yù)測(cè)結(jié)果,提示用藥可能產(chǎn)生的不良反應(yīng)風(fēng)險(xiǎn);

40、步驟10,藥物不良反應(yīng)發(fā)生機(jī)制的分析:

41、針對(duì)案例分析中準(zhǔn)確度排名前十的藥物-不良反應(yīng)關(guān)聯(lián),在drugbank中獲取藥物靶點(diǎn)信息,string獲取藥物靶點(diǎn)相關(guān)基因,從genecards中獲取不良反應(yīng)相關(guān)基因,對(duì)藥物靶點(diǎn)-靶點(diǎn)相關(guān)基因-不良反應(yīng)相關(guān)基因進(jìn)行交集處理,得到交集基因,使用cytoscape構(gòu)建ppi互作網(wǎng)絡(luò)圖,對(duì)交集基因開(kāi)展go和kegg分析,對(duì)靶基因中的生物學(xué)過(guò)程和潛在的影響通路進(jìn)行進(jìn)一步的分析;揭示藥物造成不良反應(yīng)的機(jī)制,驗(yàn)證預(yù)測(cè)結(jié)果的合理性。

42、進(jìn)一步地,步驟2中以藥物評(píng)論網(wǎng)站中所有的藥物評(píng)論文本為采集對(duì)象,采集到的信息包括評(píng)論文本以及評(píng)論者的性別、年齡、患病情況、用藥時(shí)長(zhǎng)等。

43、進(jìn)一步地,步驟5的①中,計(jì)算公式如下:

44、tanimoto系數(shù):

45、

46、其中a、b分別為藥物a、b的分子指紋;

47、jaccard系數(shù):

48、

49、其中a、b分別為藥物a、b的靶點(diǎn)(適應(yīng)癥)集合;

50、余弦相似度:

51、

52、其中a、b分別為藥物a、b的患者特征向量。

53、進(jìn)一步地,步驟5的②中,計(jì)算公式如下:

54、向無(wú)環(huán)圖dag:

55、

56、其中θ是連接節(jié)點(diǎn)t與其子節(jié)點(diǎn)t的邊的語(yǔ)義貢獻(xiàn)因子。

57、進(jìn)一步地,步驟6中異構(gòu)圖g表示為:

58、

59、其中sd、sa分別為藥物綜合相似性矩陣及不良反應(yīng)相似度矩陣,~sd、~sa分別為藥物及不良反應(yīng)相似性矩陣經(jīng)過(guò)拉普拉斯變換后的矩陣,a為藥物與不良反應(yīng)之間的關(guān)聯(lián)矩陣。

60、進(jìn)一步地,步驟7中編碼器層數(shù)為2,為了充分利用藥物和不良反應(yīng)節(jié)點(diǎn)的嵌入,自適應(yīng)地動(dòng)態(tài)調(diào)整不同gcn層的重要性權(quán)重,在節(jié)點(diǎn)特征表示過(guò)程中加入注意力機(jī)制。

61、進(jìn)一步地,步驟8中評(píng)價(jià)指標(biāo)計(jì)算公式如下所示:

62、使用準(zhǔn)確率:

63、

64、其中,tp為模型正確預(yù)測(cè)為正類的樣本數(shù)量;tn為模型正確預(yù)測(cè)為負(fù)類的樣本數(shù)量;fp為模型錯(cuò)誤預(yù)測(cè)為正類的樣本數(shù)量;fn為模型錯(cuò)誤預(yù)測(cè)為負(fù)類的樣本數(shù)量。

65、精確率:

66、

67、其中,tp為模型正確預(yù)測(cè)為正類的樣本數(shù)量;fp為模型錯(cuò)誤預(yù)測(cè)為正類的樣本數(shù)量。

68、召回率:

69、

70、其中,tp為模型正確預(yù)測(cè)為正類的樣本數(shù)量;fn為模型錯(cuò)誤預(yù)測(cè)為負(fù)類的樣本數(shù)量。

71、f1分?jǐn)?shù):

72、

73、其中,precision為精確率,recall為召回率。

74、roc曲線:

75、對(duì)于不同的閾值,計(jì)算模型的tpr和fpr,在笛卡爾坐標(biāo)系中,以fpr為橫軸,tpr為縱軸,繪制點(diǎn),連接所有計(jì)算得到的點(diǎn),形成roc曲線;

76、

77、其中,tp為模型正確預(yù)測(cè)為正類的樣本數(shù)量;tn為模型正確預(yù)測(cè)為負(fù)類的樣本數(shù)量;fp為模型錯(cuò)誤預(yù)測(cè)為正類的樣本數(shù)量;fn為模型錯(cuò)誤預(yù)測(cè)為負(fù)類的樣本數(shù)量。

78、auc值為roc曲線下的面積。

79、本發(fā)明所述的一種基于評(píng)論文本信息增強(qiáng)的藥物不良反應(yīng)預(yù)測(cè)方法的優(yōu)點(diǎn)和積極效果是:

80、1、綜合利用藥物評(píng)論網(wǎng)站、臨床試驗(yàn)數(shù)據(jù)以及藥物數(shù)據(jù)源,綜合利用用戶實(shí)際經(jīng)驗(yàn)和反饋等多樣化的數(shù)據(jù),添加患者特征,豐富藥物及不良反應(yīng)之間的關(guān)系,提供了更加全面的藥物安全性評(píng)估,另外gcn模型相較于其他模型,訓(xùn)練與預(yù)測(cè)更為快速,可以減輕計(jì)算難度。

81、下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1