一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)piRNA分類方法

文檔序號(hào)：40384180發(fā)布日期：2024-12-20 12:06閱讀：4來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>醫(yī)藥醫(yī)療技術(shù)的改進(jìn);醫(yī)療器械制造及應(yīng)用技術(shù)

本發(fā)明屬于生物信息學(xué)領(lǐng)域，涉及一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)pirna分類方法，其中包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)等技術(shù)。

背景技術(shù)：

1、pirna是一類與piwi蛋白家族成員相互作用的小rna分子，它們?cè)诨虺聊娃D(zhuǎn)座元件調(diào)控中扮演著關(guān)鍵角色。在人類癌癥中，特別是種系和體細(xì)胞組織中，piwi蛋白和與其相互作用的pirna的表達(dá)與較差的臨床預(yù)后相關(guān)，這表明它們?cè)诎┌Y發(fā)展中可能發(fā)揮著重要作用。因此，精確且高通量的分類與疾病相關(guān)的pirna對(duì)于優(yōu)先選擇潛在的實(shí)驗(yàn)篩選候選物至關(guān)重要。通過計(jì)算分類，可以減少實(shí)驗(yàn)室工作量，節(jié)約成本和時(shí)間，快速識(shí)別潛在的藥物靶點(diǎn)相互作用，從而加速候選物質(zhì)進(jìn)入實(shí)驗(yàn)驗(yàn)證階段。利用機(jī)器學(xué)習(xí)方法分類與疾病相關(guān)的pirna，可以通過分析大量的分子結(jié)構(gòu)和生物信息數(shù)據(jù)，加速藥物發(fā)現(xiàn)和設(shè)計(jì)過程。這些方法不僅可以縮短藥物研發(fā)周期，降低研發(fā)成本，還能促進(jìn)新藥物的發(fā)現(xiàn)。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明提出了一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)pirna分類方法，該方法對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理后直接輸入到深層架構(gòu)，使用圖注意力網(wǎng)絡(luò)處理圖結(jié)構(gòu)數(shù)據(jù)，并應(yīng)用參數(shù)值為450的swish激活函數(shù)緩解梯度消失問題。

2、一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)pirna分類方法，包括數(shù)據(jù)預(yù)處理、圖注意力網(wǎng)絡(luò)訓(xùn)練、加載并分類數(shù)據(jù)三個(gè)步驟，具體步驟如下：

3、步驟1、使用數(shù)據(jù)加載函數(shù)，得到鄰接矩陣a、節(jié)點(diǎn)特征x；進(jìn)行數(shù)據(jù)完整性檢查，確保所有必要的數(shù)據(jù)組件均已正確加載且未損壞；對(duì)鄰接矩陣添加自環(huán)處理，即在每個(gè)節(jié)點(diǎn)對(duì)應(yīng)的對(duì)角線位置上加上1；直接將原始數(shù)據(jù)特征送入深層架構(gòu)進(jìn)行特征提取和分類。

4、步驟2、定義一個(gè)包含兩個(gè)圖注意力層的深層架構(gòu)，第一個(gè)圖注意力層應(yīng)用參數(shù)值為450的swish激活函數(shù)，第二個(gè)圖注意力層使用softmax?激活函數(shù)，對(duì)輸入值進(jìn)行非線性映射和平滑梯度處理；在圖注意力層中對(duì)權(quán)重矩陣和注意力機(jī)制的權(quán)重應(yīng)用l2正則化；在每個(gè)圖注意力層之后配置dropout層；利用預(yù)先訓(xùn)練好的模型權(quán)重來初始化圖注意力層，然后進(jìn)行訓(xùn)練并保存訓(xùn)練好的模型。

5、步驟3、通過步驟1定義的數(shù)據(jù)加載函數(shù)加載數(shù)據(jù)，并預(yù)處理；將預(yù)處理后的數(shù)據(jù)輸入步驟2中訓(xùn)練好的模型，并將模型輸出的分類概率轉(zhuǎn)換為具體的類別標(biāo)簽；最后，分析和解釋每個(gè)pirna分類結(jié)果。

6、一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)pirna分類方法，步驟1的實(shí)現(xiàn)過程如下：

7、使用load_data函數(shù)加載圖數(shù)據(jù)集，返回鄰接矩陣a、節(jié)點(diǎn)特征x以及訓(xùn)練、驗(yàn)證和測(cè)試標(biāo)簽y_train、y_val、y_test，以及對(duì)應(yīng)的索引idx_train、idx_val、idx_test。鄰接矩陣a是一個(gè)形狀為?( n, n)?的方陣，其中 n是圖中節(jié)點(diǎn)的數(shù)量，矩陣中的每個(gè)元素a[ i][ j]表示節(jié)點(diǎn) i和節(jié)點(diǎn) j之間是否存在邊；對(duì)數(shù)據(jù)進(jìn)行完整性檢查，確保所有必要的數(shù)據(jù)組件均已正確加載且未損壞；為了讓模型在處理每個(gè)節(jié)點(diǎn)時(shí)能夠考慮到節(jié)點(diǎn)自身的特征，對(duì)鄰接矩陣添加自環(huán)處理，即在每個(gè)節(jié)點(diǎn)對(duì)應(yīng)的對(duì)角線位置上加上1，即a=a+；表示鄰接矩陣添加的自環(huán)；分配訓(xùn)練集、驗(yàn)證集和測(cè)試集的標(biāo)簽以及構(gòu)建相應(yīng)的索引；預(yù)處理后直接將原始數(shù)據(jù)特征送入深層架構(gòu)進(jìn)行特征提取和分類。

8、一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)pirna分類方法，步驟2的實(shí)現(xiàn)過程如下：

9、定義一個(gè)包含兩個(gè)圖注意力層的深層架構(gòu)，其中第一圖注意力層接收每個(gè)節(jié)點(diǎn)的特征向量，記為x_in；該層包含attn_heads個(gè)注意力頭，每個(gè)頭的輸出特征維度為8；并通過參數(shù)值為450的swish激活函數(shù)進(jìn)行非線性變換，對(duì)輸入值進(jìn)行非線性映射和平滑梯度處理，同時(shí)應(yīng)用l2正則化進(jìn)行權(quán)重衰減；第一個(gè)圖注意力層的輸出經(jīng)過dropout處理后，送入第二個(gè)圖注意力層；第二個(gè)圖注意力層接收鄰接矩陣，通過注意力機(jī)制來加權(quán)鄰接節(jié)點(diǎn)的特征以捕捉節(jié)點(diǎn)間的復(fù)雜依賴關(guān)系。最后，采用softmax激活函數(shù)，輸出每個(gè)節(jié)點(diǎn)屬于兩個(gè)類別的概率分布；同樣使用l2正則化，防止模型過擬合；利用預(yù)先訓(xùn)練好的模型權(quán)重來初始化圖注意力層，然后進(jìn)行訓(xùn)練并保存訓(xùn)練好的模型，以便進(jìn)行后續(xù)的分類任務(wù)。

10、一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)pirna分類方法，步驟3的實(shí)現(xiàn)過程如下：

11、對(duì)新的pirna數(shù)據(jù)進(jìn)行分類，首先通過步驟1中的load_data函數(shù)加載數(shù)據(jù)，這包括每個(gè)pirna的鄰接矩陣a、特征矩陣x。在數(shù)據(jù)預(yù)處理階段，對(duì)鄰接矩陣a添加自環(huán)以增強(qiáng)模型對(duì)節(jié)點(diǎn)自身特征的關(guān)注；加載步驟2中保存的模型；將預(yù)處理后的數(shù)據(jù)輸入模型，模型輸出每個(gè)pirna的分類概率，最終根據(jù)這些概率確定每個(gè)pirna的最終分類結(jié)果。

技術(shù)特征：

1.一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)pirna分類方法，其特征在于，對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理后直接輸入到深層架構(gòu)，使用圖注意力網(wǎng)絡(luò)處理圖結(jié)構(gòu)數(shù)據(jù)，并應(yīng)用參數(shù)值為450的swish激活函數(shù)緩解梯度消失問題，包括數(shù)據(jù)預(yù)處理、圖注意力網(wǎng)絡(luò)訓(xùn)練、加載并分類數(shù)據(jù)三個(gè)步驟，其具體步驟如下：

技術(shù)總結(jié)
本發(fā)明屬于生物信息學(xué)領(lǐng)域，涉及一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)piRNA分類方法。piRNA是一類與PIWI蛋白家族成員相互作用的小RNA分子，主要參與基因沉默和轉(zhuǎn)座元件的調(diào)控。首先，保留數(shù)據(jù)的原始特征，對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理后直接輸入到深層架構(gòu)；其次，使用圖注意力網(wǎng)絡(luò)處理圖結(jié)構(gòu)數(shù)據(jù)，通過注意力機(jī)制捕捉節(jié)點(diǎn)間的復(fù)雜依賴關(guān)系，并通過特征轉(zhuǎn)換和聚合提高分類性能；最后，應(yīng)用參數(shù)值為450的Swish激活函數(shù)緩解梯度消失問題。該方法能夠處理復(fù)雜的生物數(shù)據(jù)，提高預(yù)測(cè)的準(zhǔn)確率，并促進(jìn)新藥發(fā)現(xiàn)和疾病機(jī)理研究。

技術(shù)研發(fā)人員：張得印,周樹森,臧睦君,劉通,柳嬋娟,王慶軍
受保護(hù)的技術(shù)使用者：魯東大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張得印,周樹森,臧睦君,劉通,柳嬋娟,王慶軍
技術(shù)所有人：魯東大學(xué)
我是此專利的發(fā)明人

上一篇：一種餅干印模成型機(jī)的制作方法
上一篇：一種污染物敏感材料生產(chǎn)混合裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、司老師：1.制漿造紙 2.植物資源精細(xì)化工與化學(xué) 3.生物質(zhì)精煉 4.天然產(chǎn)物化學(xué)
2、薛老師：1.CRISPR-Cas系統(tǒng) 2.基因編輯 3.基因修復(fù) 4.天然產(chǎn)物合成 5.單分子技術(shù)開發(fā)與應(yīng)用
3、戴老師：1.天然藥物（中藥）合成生物學(xué)研究 2.酵母生物學(xué)與工程化研究
4、孟老師：1. 基于糖類的抗腫瘤藥物的合成和活性評(píng)價(jià)及糖類疫苗的研制 2.功能糖類的化學(xué)酶法合成及構(gòu)效關(guān)系研究 3.多糖及仿生材料功能的開發(fā)及應(yīng)用
5、滿老師：1.天然產(chǎn)品的提取分離與活性研究 2.天然產(chǎn)物活性與安全性評(píng)價(jià) 3.中藥組方配伍機(jī)制研究
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于圖注意力網(wǎng)絡(luò)的疾病相關(guān)piRNA分類方法