一種跨物種的密碼子優(yōu)化方法以及系統(tǒng)與流程

文檔序號：40386271發(fā)布日期：2024-12-20 12:09閱讀：8來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>醫(yī)藥醫(yī)療技術(shù)的改進(jìn);醫(yī)療器械制造及應(yīng)用技術(shù)

本發(fā)明涉及序列優(yōu)化，尤其涉及一種跨物種的密碼子優(yōu)化方法、系統(tǒng)、電子設(shè)備、計算機可讀存儲介質(zhì)及計算機程序產(chǎn)品。

背景技術(shù)：

1、蛋白質(zhì)在醫(yī)藥、工業(yè)酶制劑和農(nóng)業(yè)等多個領(lǐng)域中具有廣泛應(yīng)用，而高質(zhì)量的蛋白質(zhì)折疊和修飾對于其功能的發(fā)揮至關(guān)重要。

2、為了提高蛋白質(zhì)的表達(dá)水平，通常會進(jìn)行核酸序列(主要是mrna或dna序列)的優(yōu)化。

3、傳統(tǒng)的核酸序列優(yōu)化方法，如替換同義密碼子，旨在通過不改變蛋白質(zhì)氨基酸序列的前提下，提高蛋白質(zhì)的表達(dá)量。然而，上述優(yōu)化方法與生物相關(guān)性低，因此，在進(jìn)行跨物種的核酸序列優(yōu)化上，上述優(yōu)化方法的適用性不高。

4、因此，需提出一種跨物種的密碼子優(yōu)化方法、系統(tǒng)、電子設(shè)備、計算機可讀存儲介質(zhì)及計算機程序產(chǎn)品。

技術(shù)實現(xiàn)思路

1、本說明書提供一種跨物種的密碼子優(yōu)化方法、系統(tǒng)、電子設(shè)備、計算機可讀存儲介質(zhì)及計算機程序產(chǎn)品，可以基于原始物種的原始氨基酸序列和目標(biāo)物種的類別信息，進(jìn)行密碼子優(yōu)化，生成其他同物種對應(yīng)的核酸序列，提高了蛋白表達(dá)效率。

2、本技術(shù)提供的一種跨物種的密碼子優(yōu)化方法采用如下的技術(shù)方案，包括：

3、獲取基本信息，所述基本信息包括：原始物種的原始氨基酸序列和目標(biāo)物種的類別信息；

4、確定所述原始氨基酸序列中的當(dāng)前序列位置；基于所述基本信息和預(yù)測序列集合，構(gòu)建當(dāng)前輸入信息；結(jié)合所述當(dāng)前輸入信息和預(yù)設(shè)預(yù)測策略，預(yù)測并生成下一序列位置的密碼子向量；將所述下一序列位置作為新的當(dāng)前序列位置，將所述當(dāng)前序列位置的密碼子向量加入至預(yù)測序列集合中，循環(huán)執(zhí)行本步驟直至達(dá)到輸出條件；

5、基于所述預(yù)測序列集合，生成若干個候選核酸序列，將所述候選核酸序列作為與所述目標(biāo)物種對應(yīng)的優(yōu)化結(jié)果。

6、可選的，所述基于所述基本信息和預(yù)測序列集合，構(gòu)建當(dāng)前輸入信息，包括：

7、基于所述目標(biāo)物種的標(biāo)識信息查找對應(yīng)的物種類別單元；

8、將所述原始氨基酸序列、所述物種類別單元、標(biāo)識單元、所述預(yù)測序列集合進(jìn)行順序組合，得到所述當(dāng)前輸入信息。

9、可選的，所述結(jié)合所述當(dāng)前輸入信息和預(yù)設(shè)預(yù)測策略，預(yù)測并生成下一序列位置的密碼子向量，包括：

10、基于所述當(dāng)前輸入信息和/或上一層解碼器的輸出結(jié)果，構(gòu)建當(dāng)前層解碼器的輸入結(jié)果；

11、基于所述當(dāng)前層解碼器的輸入結(jié)果，生成注意力輸出矩陣，作為當(dāng)前層解碼器的輸出結(jié)果；

12、將所述下一層解碼器作為新的當(dāng)前層解碼器。

13、可選的，所述基于所述當(dāng)前層解碼器的輸入結(jié)果，生成注意力輸出矩陣，作為當(dāng)前層解碼器的輸出結(jié)果，包括：

14、對所述輸入結(jié)果中的每一個詞嵌入向量進(jìn)行線性變換，得到變換結(jié)果；變換結(jié)果包括：查詢向量、鍵向量和值向量；

15、將旋轉(zhuǎn)編碼矩陣應(yīng)用于查詢向量和鍵向量，對其進(jìn)行旋轉(zhuǎn)編碼，得到新的查詢向量和新的鍵向量；

16、根據(jù)查詢向量、鍵向量和值向量，得到注意力輸出矩陣；

17、將所有頭的注意力輸出矩陣進(jìn)行拼接，對拼接結(jié)果進(jìn)行線性變換，得到最終的多頭注意力輸出，將其作為當(dāng)前層解碼器的輸出結(jié)果。

18、可選的，輸出條件包括：當(dāng)前序列位置是原始氨基酸序列的最后一個序列位置。

19、可選的，還包括：對所述候選序列進(jìn)行篩選，確定目標(biāo)密碼子序列；

20、所述對所述候選序列進(jìn)行篩選，確定目標(biāo)密碼子序列，包括：

21、按照序列篩選條件對若干個所述候選序列進(jìn)行篩選，得到優(yōu)選密碼子序列；

22、測定所述優(yōu)選密碼子序列對應(yīng)的蛋白表達(dá)水平，選擇蛋白表達(dá)水平最高的優(yōu)選密碼子序列作為目標(biāo)密碼子序列。

23、本技術(shù)提供的一種跨物種的密碼子優(yōu)化系統(tǒng)采用如下的技術(shù)方案，包括：

24、獲取模塊，用于獲取基本信息，所述基本信息包括：原始物種的原始氨基酸序列和目標(biāo)物種的類別信息；

25、預(yù)測模塊，用于將所述基本信息輸入至跨物種的密碼子優(yōu)化模型，得到預(yù)測序列集合；

26、優(yōu)化模塊，基于所述預(yù)測序列集合，生成若干個候選核酸序列，將所述候選核酸序列作為與所述目標(biāo)物種對應(yīng)的優(yōu)化結(jié)果。

27、可選的，預(yù)測模塊，包括：

28、位置確定子模塊，用于確定所述原始氨基酸序列中的當(dāng)前序列位置；

29、信息構(gòu)建子模塊，用于基于所述基本信息和預(yù)測序列集合，構(gòu)建當(dāng)前輸入信息；

30、預(yù)測子模塊，用于結(jié)合所述當(dāng)前輸入信息和預(yù)設(shè)預(yù)測策略，預(yù)測并生成下一序列位置的密碼子向量；

31、循環(huán)子模塊，用于將所述下一序列位置作為新的當(dāng)前序列位置，將所述當(dāng)前序列位置的密碼子向量加入至預(yù)測序列集合中，循環(huán)執(zhí)行本步驟直至達(dá)到輸出條件；

32、可選的，所述信息構(gòu)建子模塊，包括：

33、第一構(gòu)建單元，用于基于所述目標(biāo)物種的標(biāo)識信息查找對應(yīng)的物種類別單元；

34、第二構(gòu)建單元，用于將所述原始氨基酸序列、所述物種類別單元、標(biāo)識單元、所述預(yù)測序列集合進(jìn)行順序組合，得到所述當(dāng)前輸入信息。

35、可選的，所述預(yù)測子模塊，包括：

36、第一預(yù)測單元，用于基于所述當(dāng)前輸入信息和/或上一層解碼器的輸出結(jié)果，構(gòu)建當(dāng)前層解碼器的輸入結(jié)果；

37、第二預(yù)測單元，用于基于所述當(dāng)前層解碼器的輸入結(jié)果，生成注意力輸出矩陣，作為當(dāng)前層解碼器的輸出結(jié)果；

38、將所述下一層解碼器作為新的當(dāng)前層解碼器。

39、可選的，所述第二預(yù)測單元，包括：

40、變換子單元，用于對所述輸入結(jié)果中的每一個詞嵌入向量進(jìn)行線性變換，得到變換結(jié)果；變換結(jié)果包括：查詢向量、鍵向量和值向量；

41、旋轉(zhuǎn)編碼子單元，用于將旋轉(zhuǎn)編碼矩陣應(yīng)用于查詢向量和鍵向量，對其進(jìn)行旋轉(zhuǎn)編碼，得到新的查詢向量和新的鍵向量；

42、注意力計算子單元，用于根據(jù)查詢向量、鍵向量和值向量，得到注意力輸出矩陣；

43、輸出子單元，用于將所有頭的注意力輸出矩陣進(jìn)行拼接，對拼接結(jié)果進(jìn)行線性變換，得到最終的多頭注意力輸出，將其作為當(dāng)前層解碼器的輸出結(jié)果。

44、可選的，輸出條件包括：當(dāng)前序列位置是原始氨基酸序列的最后一個序列位置。

45、可選的，還包括：篩選模塊，用于對所述候選序列進(jìn)行篩選，確定目標(biāo)密碼子序列；

46、可選的，所述篩選模塊，包括：

47、第一篩選子模塊，用于按照序列篩選條件對若干個所述候選序列進(jìn)行篩選，得到優(yōu)選密碼子序列；

48、第二篩選子模塊，用于測定所述優(yōu)選密碼子序列對應(yīng)的蛋白表達(dá)水平，選擇蛋白表達(dá)水平最高的優(yōu)選密碼子序列作為目標(biāo)密碼子序列。

49、本說明書還提供一種電子設(shè)備，其中，該電子設(shè)備包括：

50、處理器；以及，

51、存儲計算機可執(zhí)行指令的存儲器，所述可執(zhí)行指令在被執(zhí)行時使所述處理器執(zhí)行上述任一項方法。

52、本說明書還提供一種計算機可讀存儲介質(zhì)，其中，所述計算機可讀存儲介質(zhì)存儲一個或多個程序，所述一個或多個程序當(dāng)被處理器執(zhí)行時，實現(xiàn)上述任一項方法。

53、本說明書還提供一種計算機程序產(chǎn)品，其中，所述計算機程序產(chǎn)品包括：計算機程序/指令，所述計算機程序/指令被處理器執(zhí)行時，實現(xiàn)上述任一項方法。

54、本技術(shù)中，通過獲取基本信息，所述基本信息包括：原始物種的原始氨基酸序列和目標(biāo)物種的類別信息；確定所述原始氨基酸序列中的當(dāng)前序列位置；基于所述基本信息和預(yù)測序列集合，構(gòu)建當(dāng)前輸入信息；結(jié)合所述當(dāng)前輸入信息和預(yù)設(shè)預(yù)測策略，預(yù)測并生成下一序列位置的密碼子向量；將所述下一序列位置作為新的當(dāng)前序列位置，將所述當(dāng)前序列位置的密碼子向量加入至所述預(yù)測序列集合中，循環(huán)執(zhí)行本步驟直至達(dá)到輸出條件；基于所述預(yù)測序列集合，生成若干個候選核酸序列，將所述候選核酸序列作為與所述目標(biāo)物種對應(yīng)的優(yōu)化結(jié)果，提高了優(yōu)化結(jié)果的生物相關(guān)性，提高了蛋白表達(dá)效率和表達(dá)的穩(wěn)定性。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊偉,冀鼎覺,尹姝卉,劉陽
技術(shù)所有人：上海賽隴生物科技有限公司
我是此專利的發(fā)明人

上一篇：一種汽車空調(diào)電磁離合器帶輪摩擦盤的制作方法
上一篇：一種可折疊煙包輸送裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、司老師：1.制漿造紙 2.植物資源精細(xì)化工與化學(xué) 3.生物質(zhì)精煉 4.天然產(chǎn)物化學(xué)
2、薛老師：1.CRISPR-Cas系統(tǒng) 2.基因編輯 3.基因修復(fù) 4.天然產(chǎn)物合成 5.單分子技術(shù)開發(fā)與應(yīng)用
3、戴老師：1.天然藥物（中藥）合成生物學(xué)研究 2.酵母生物學(xué)與工程化研究
4、孟老師：1. 基于糖類的抗腫瘤藥物的合成和活性評價及糖類疫苗的研制 2.功能糖類的化學(xué)酶法合成及構(gòu)效關(guān)系研究 3.多糖及仿生材料功能的開發(fā)及應(yīng)用
5、滿老師：1.天然產(chǎn)品的提取分離與活性研究 2.天然產(chǎn)物活性與安全性評價 3.中藥組方配伍機制研究
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種跨物種的密碼子優(yōu)化方法以及系統(tǒng)與流程