本發(fā)明屬于智能醫(yī)學(xué),具體是基于卷積神經(jīng)網(wǎng)絡(luò)算法構(gòu)建哮喘的泛凋亡相關(guān)生物標(biāo)志的預(yù)測(cè)模型方法及應(yīng)用。
背景技術(shù):
1、支氣管哮喘(簡(jiǎn)稱哮喘)是一種由多種細(xì)胞及細(xì)胞組分參與的慢性氣道炎癥性疾病,其病因越來(lái)越多地歸因于遺傳易感性、宿主因素和環(huán)境暴露之間的相互作用。臨床表現(xiàn)為反復(fù)發(fā)作的喘息、氣急,伴或不伴胸悶或咳嗽等癥狀,同時(shí)伴有氣道高反應(yīng)性和可逆性氣流受限。在全球范圍內(nèi),以傷殘調(diào)整壽命年衡量,哮喘在傷殘導(dǎo)致的壽命年中排名第16位,在疾病負(fù)擔(dān)的主要原因中排名第28位。全球約有3億人患有哮喘,到2025年可能還會(huì)有1億人受到影響。關(guān)于哮喘的發(fā)病機(jī)制尚未完全闡明,但目前研究發(fā)現(xiàn)哮喘的核心過(guò)程主要包括上皮細(xì)胞功能障礙、持續(xù)的氣道炎癥和氣道重塑。氣道上皮表達(dá)模式識(shí)別受體(prrs),對(duì)病原相關(guān)分子模式(pamps)和損傷相關(guān)分子模式(damps)作出快速反應(yīng),最終通過(guò)合成和分泌炎性介質(zhì)介導(dǎo)炎癥和免疫反應(yīng)。避免接觸引起哮喘的過(guò)敏原和長(zhǎng)期的藥物控制仍然是預(yù)防哮喘發(fā)作的主要措施。吸入糖皮質(zhì)激素(ics)是迄今為止最有效的治療哮喘的方法,因?yàn)樗鼈兡軌蛎鞔_地抑制哮喘氣道的特征性炎癥。但長(zhǎng)期吸入糖皮質(zhì)激素不僅容易引起糖皮質(zhì)激素相關(guān)副作用,而且與糖皮質(zhì)激素抵抗型哮喘有關(guān)。到目前為止,關(guān)于哮喘的靶向治療藥物仍然較少,且價(jià)格高昂,不適合普遍使用。故尋找參與哮喘發(fā)生發(fā)展的關(guān)鍵基因、通路及靶蛋白能為哮喘的靶向治療提供有力支持。
2、程序性細(xì)胞死亡(programmed?cell?death,pcd)是生物體發(fā)育的重要組成部分,在宿主防御和維持體內(nèi)平衡中發(fā)揮著重要作用。多種pcd途徑與先天免疫相關(guān),包括焦亡、細(xì)胞凋亡、壞死性凋亡。早期研究強(qiáng)調(diào)每個(gè)通路的獨(dú)特調(diào)控,但新興的研究發(fā)現(xiàn)了這些看似不同的細(xì)胞死亡復(fù)合物之間的共調(diào)控和串?dāng)_。泛凋亡是malireddi等人于2019年提出的一種新的細(xì)胞死亡方式,以細(xì)胞焦亡、凋亡和壞死性凋亡為特征,但不能單獨(dú)用其中任何一種來(lái)解釋。啟動(dòng)泛凋亡的關(guān)鍵復(fù)合體稱為泛凋亡小體。它是一種細(xì)胞死亡誘導(dǎo)復(fù)合物,具有焦亡、凋亡和壞死性凋亡的分子特征,可以誘導(dǎo)和調(diào)控泛凋亡。目前關(guān)于泛凋亡的具體機(jī)制尚未闡明,但已有研究發(fā)現(xiàn)其發(fā)生發(fā)展與多種疾病密切相關(guān)。研究發(fā)現(xiàn)氣道給予di?abzi可誘導(dǎo)肺組織中的caspase-3、gasdermin?d蛋白(gsdmd)裂解和mlkl磷酸化,誘導(dǎo)細(xì)胞凋亡、焦亡、壞死性凋亡的發(fā)生,引起肺部炎癥風(fēng)暴。此外,還發(fā)現(xiàn)肺組織中的zbp1上調(diào)、caspase-8、asc和ripk3蛋白表達(dá)增加,可促進(jìn)泛凋亡小體的表達(dá),誘導(dǎo)泛凋亡。研究發(fā)現(xiàn),與癌旁組織相比,fadd在肺癌組織中高表達(dá);同時(shí)它也是泛凋亡和細(xì)胞凋亡過(guò)程的適配器。有研究通過(guò)生信分析首次證實(shí)了泛凋亡在銀屑病中的作用,并預(yù)測(cè)了樞紐基因和免疫特征。
3、目前關(guān)于泛凋亡在哮喘中所發(fā)揮的作用仍未清楚。但越來(lái)越多的研究表明哮喘與細(xì)胞焦亡、細(xì)胞凋亡、壞死性凋亡之間存在著密切聯(lián)系。研究表明哮喘患者支氣管肺泡灌洗液中nod樣受體熱蛋白結(jié)構(gòu)域相關(guān)蛋白3(nlrp3)和半胱氨酸天冬氨酸特異性蛋白酶1(caspase-1)的表達(dá)顯著高于健康個(gè)體,在屋塵螨(hdm)或清蛋白(ova)模型中也發(fā)現(xiàn)了類似的結(jié)果。還有研究發(fā)現(xiàn),呼吸道上皮細(xì)胞可能通過(guò)激活nlrp?3和促進(jìn)gsdmd拼接而發(fā)生焦亡,從而增加呼吸道炎癥和高反應(yīng)性。綜上所述,我們可以發(fā)現(xiàn)氣道上皮細(xì)胞的焦亡是哮喘炎癥的起始。嗜酸性粒細(xì)胞在氣道中的持續(xù)存在與疾病癥狀的嚴(yán)重程度有關(guān),這可能不僅取決于氣道嗜酸性粒細(xì)胞的數(shù)量,還與其募集后的生存機(jī)制有關(guān)。研究發(fā)現(xiàn),嗜酸性粒細(xì)胞凋亡數(shù)量與哮喘癥狀嚴(yán)重程度呈負(fù)相關(guān),提示細(xì)胞凋亡可能是哮喘變應(yīng)性炎癥的重要觸發(fā)機(jī)制。oikonomou?n等人研究發(fā)現(xiàn),fadd或caspase-8缺乏引起上皮細(xì)胞中ripk3-mlkl依賴的壞死性凋亡,引起皮膚和腸道等屏障組織的炎癥,確定了上皮細(xì)胞壞死性凋亡是炎癥的有力驅(qū)動(dòng)者。綜上所述,我們可以了解到哮喘的炎癥反應(yīng)與焦亡、凋亡和壞死性凋亡之間都具有一定的關(guān)聯(lián),由此我們推測(cè)泛凋亡可能與哮喘的發(fā)生發(fā)展具有密切聯(lián)系。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明需要解決的技術(shù)問(wèn)題是提供一種基于卷積神經(jīng)網(wǎng)絡(luò)算法構(gòu)建哮喘的泛凋亡相關(guān)生物標(biāo)志的預(yù)測(cè)模型方法及應(yīng)用,用于研究哮喘的發(fā)病機(jī)制,給哮喘提供新的治療指導(dǎo)。
2、為實(shí)現(xiàn)上述目的,本發(fā)明采用了以下的技術(shù)方案:
3、基于卷積神經(jīng)網(wǎng)絡(luò)算法構(gòu)建哮喘的泛凋亡相關(guān)生物標(biāo)志的預(yù)測(cè)模型,該模型通過(guò)卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建,輸入數(shù)據(jù)包括但不限于10個(gè)特征性泛凋亡相關(guān)基因pdgs的表達(dá)數(shù)據(jù),包括ly96、mlkl、cycs、chmp6、chmp7、casp8、casp4、aim2、casp9和tnfrsf1a。
4、所述模型經(jīng)過(guò)100個(gè)周期的訓(xùn)練,優(yōu)化器為sgd,每次卷積之后和激活前使用批量歸一化加快運(yùn)行速度,并在完全連接層添加了10%的丟失減少過(guò)度擬合,初始學(xué)習(xí)率為0.01,并采用自適應(yīng)調(diào)整策略。
5、所述基于卷積神經(jīng)網(wǎng)絡(luò)算法構(gòu)建哮喘的泛凋亡相關(guān)生物標(biāo)志的預(yù)測(cè)模型的構(gòu)建方法,包括以下步驟:
6、(1)從geo數(shù)據(jù)庫(kù)獲取包括gse165934、gse182503、gse2125、gse40885的數(shù)據(jù)集,從genecards數(shù)據(jù)庫(kù)獲取泛凋亡相關(guān)基因prgs;
7、(2)使用limma包對(duì)數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化和注釋,獲得正常樣本和哮喘樣本之間的差異表達(dá)基因degs列表,從中選取degs,構(gòu)建venn圖,找到共同的degs即co-degs,通過(guò)venn圖將co-degs和prgs取交集生成pdgs;
8、(3)采用clusterprofiler?r程序包對(duì)pdgs進(jìn)行g(shù)o功能分析和kegg通路分析,以明確其在哮喘中的生物學(xué)過(guò)程、分子功能、細(xì)胞組分和生物學(xué)通路;
9、(4)通過(guò)機(jī)器學(xué)習(xí)模型篩選出哮喘的特征性泛凋亡相關(guān)基因;
10、(5)借助cibersort算法進(jìn)行免疫浸潤(rùn)分析,評(píng)估哮喘患者組與健康者組免疫細(xì)胞浸潤(rùn)水平及各免疫細(xì)胞之間的相關(guān)性;
11、(6)通過(guò)string在線分析工具和cytoscape軟件構(gòu)建lncrna-mirna-mrna網(wǎng)絡(luò);
12、(7)利用卷積神經(jīng)網(wǎng)絡(luò)算法構(gòu)建哮喘的泛凋亡相關(guān)生物標(biāo)志的預(yù)測(cè)模型,以python軟件在ubuntu?20.045lts進(jìn)行訓(xùn)練和驗(yàn)證,優(yōu)化器選擇sgd,每次卷積之后和激活前使用批量歸一化,完全連接層添加10%的丟失,進(jìn)行100個(gè)周期的訓(xùn)練。
13、步驟(1)所述從genecards數(shù)據(jù)庫(kù)獲取泛凋亡相關(guān)基因prgs具體是只保留蛋白質(zhì)編碼基因和相關(guān)性得分>0.500的基因。
14、步驟(2)所述degs按以下標(biāo)準(zhǔn)選?。阂孕U蟮膒值<0.05和|logfc|>0為標(biāo)準(zhǔn)確定degs;所述pdgs按以下標(biāo)準(zhǔn)選?。阂詐值<0.05和|logfc|>0為標(biāo)準(zhǔn)確定pdgs。
15、步驟(4)所述機(jī)器學(xué)習(xí)模型為svm支持向量機(jī)、lasso回歸分析和rf隨機(jī)森林回歸。
16、步驟(4)所述通過(guò)機(jī)器學(xué)習(xí)模型篩選出哮喘的特征性泛凋亡相關(guān)基因具體操作如下:
17、(1)通過(guò)svm-rfe支持向量機(jī)篩選得到特征性基因;
18、(2)利用glmnet軟件包進(jìn)行l(wèi)asso回歸分析,將基因表達(dá)值作為預(yù)測(cè)變量,樣本組作為響應(yīng)變量;
19、利用cv.glmne函數(shù)對(duì)模型進(jìn)行交叉驗(yàn)證,并繪制cv圖,確定最佳正則化參數(shù)以選擇最優(yōu)模型,再根據(jù)lasso回歸的系數(shù),識(shí)別具有非零系數(shù)的基因,即被選中的待征基因;
20、使用glm函數(shù)對(duì)篩選所得的特征基因構(gòu)建初始邏輯回歸模型,通過(guò)檢査模型系數(shù)的p值,選擇具有顯著性的基因(p<0.05)作為新的模型變量;基于顯著性基因,構(gòu)建新的邏輯回歸模型,并使用步進(jìn)法進(jìn)行變量選擇;提取新模型的系數(shù)、概要統(tǒng)計(jì)信息以及置信區(qū)間,計(jì)算每個(gè)基因的odds?ratio、95%置信區(qū)間和p值;最后,通過(guò)訓(xùn)練好的最終模型對(duì)樣本進(jìn)行預(yù)測(cè),計(jì)算風(fēng)險(xiǎn)得分,篩選得到特征性基因;
21、(3)通過(guò)rf隨機(jī)森林回歸,有放回地從訓(xùn)練集中抽取n各樣本數(shù)據(jù),形成新的訓(xùn)練集,針對(duì)每一個(gè)訓(xùn)練集,隨機(jī)抽取一部分變量進(jìn)行訓(xùn)練,形成單一的決策樹(shù)模型;所有子模型均對(duì)同一個(gè)預(yù)測(cè)數(shù)據(jù)輸出其預(yù)測(cè)結(jié)果,最終取投票形式,輸出次數(shù)最多的分類類別作為模型的最終輸出結(jié)果;
22、(4)將步驟(1)、(2)、(3)獲得的有價(jià)值基因的交叉基因作為關(guān)鍵基因。
23、本發(fā)明獲得的有益效果是:
24、通過(guò)分析哮喘相關(guān)的泛凋亡基因,研究可能識(shí)別出新的生物標(biāo)志物,有助于更好地理解哮喘的分子機(jī)制。構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)模型提供了一種高效的方法來(lái)預(yù)測(cè)和診斷哮喘,通過(guò)分析潛在的生物標(biāo)志物,可以提高哮喘早期診斷的準(zhǔn)確性。通過(guò)監(jiān)測(cè)特征性基因的表達(dá)水平,可能實(shí)現(xiàn)對(duì)哮喘疾病進(jìn)程的實(shí)時(shí)監(jiān)控,及時(shí)調(diào)整治療方案。
25、識(shí)別特定的哮喘相關(guān)基因有助于發(fā)展個(gè)性化醫(yī)療策略,根據(jù)患者的基因表達(dá)特征定制治療方案。了解哮喘的泛凋亡相關(guān)途徑和基因可揭示新的藥物靶點(diǎn),有助于開(kāi)發(fā)針對(duì)性更強(qiáng)、副作用更少的治療方法。