亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種新的基于基因本體信息的蛋白質(zhì)序列表示方法與流程

文檔序號:12669611閱讀:來源:國知局

技術(shù)特征:

1.一種新的基于基因本體信息的蛋白質(zhì)序列表示方法,其特征在于包括以下步驟:

(1)使用BLAST程序搜索Swiss-Prot數(shù)據(jù)庫找到蛋白質(zhì)序列P所有的相似蛋白質(zhì)序列;

(2)將訓(xùn)練數(shù)據(jù)集中所有蛋白質(zhì)輸入到GO數(shù)據(jù)庫中,搜尋每個蛋白質(zhì)所具有的GO本體信息,GO數(shù)據(jù)庫網(wǎng)站為http://www.geneontology.org/;

(3)在基因本體庫中搜尋P蛋白質(zhì)所具有的標(biāo)注基因本體信息,如果P蛋白質(zhì)沒有相關(guān)信息,則按照與P蛋白質(zhì)相似度的高低,依次搜尋相似蛋白質(zhì)序列的GO信息,直到找到至少一個GO本體信息作為P蛋白質(zhì)的GO信息,表示為;

(4)假設(shè)P蛋白質(zhì)功能或者其它預(yù)測問題具有M個標(biāo)簽,分別表示為A1,A2,…,AM,將P蛋白質(zhì)定義為M個元素的離散向量,如下式所示:

δ1表示P蛋白質(zhì)屬于第一個標(biāo)簽的概率,δ2表示P蛋白質(zhì)屬于第二個標(biāo)簽的概率,依次類推,δM表示P蛋白質(zhì)屬于第M個標(biāo)簽的概率,它們初始值都為0;

δi(i=1,2,…,M)的計算方法如下:

依次對P蛋白質(zhì)所含有GO信息在訓(xùn)練數(shù)據(jù)集中找到對應(yīng)的蛋白質(zhì),如在訓(xùn)練集中有n個蛋白質(zhì)含有信息的蛋白質(zhì),分別為P1、P2、…、Pn,假設(shè)P1所屬的標(biāo)簽為Ai和Aj,則δi和δj分別加1,P2具有標(biāo)簽為Ar、At、Ay,則δr、δt、δy分別加1,直至將P蛋白質(zhì)所具有的GO信息按照上述方法計算完畢,這樣就得到了含有GO信息的蛋白質(zhì)描述新方法。

2.根據(jù)權(quán)利要求1所述的基于基因本體信息的蛋白質(zhì)序列表示方法,其特征在于:所述方法用于蛋白質(zhì)亞細(xì)胞多標(biāo)簽定位預(yù)測中,相關(guān)預(yù)測器預(yù)測絕對成功率提高5~10%。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1