亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

同時(shí)確定多種樣本的線粒體基因組序列信息的方法和系統(tǒng)的制作方法

文檔序號(hào):9887977閱讀:1557來源:國知局
同時(shí)確定多種樣本的線粒體基因組序列信息的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物技術(shù)領(lǐng)域,具體地,涉及同時(shí)確定多種樣本的線粒體基因組序列 ig息的方法和系統(tǒng)。
【背景技術(shù)】
[0002] 線粒體(mitochondrion)是真核生物細(xì)胞內(nèi)的重要細(xì)胞器,幾乎存在于各類真核 生物細(xì)胞內(nèi),處于新陳代謝和生物能量轉(zhuǎn)換的中心地位。在后生動(dòng)物中,大部分物種線粒體 的基因組大小大概在16Kb左右,編碼13個(gè)蛋白質(zhì),2個(gè)rRNA以及22個(gè)tRNA。并且其基因 組具有相當(dāng)一致的結(jié)構(gòu)特點(diǎn):十分細(xì)小和致密,基因的排列緊密,沒有或很少的基因間隔序 列,所有的基因都不含有內(nèi)含子。
[0003] 線粒體因其獨(dú)特的系統(tǒng)發(fā)育歷史常被用作系統(tǒng)發(fā)育研究的重要分子標(biāo)記物。例 如,國際生命條形碼項(xiàng)目(the International Barcode of Life, iBOL, http://ibol.org) 利用線粒體的coxl基因作為動(dòng)物的物種鑒別序列,已經(jīng)獲得近15萬個(gè)物種的數(shù)據(jù)庫,線粒 體上的其他蛋白基因,如CYTB、ND1等都是有助于物種鑒定和系統(tǒng)發(fā)育關(guān)系的構(gòu)建的很好 的分子標(biāo)記。
[0004] 然而,如何快速有效的獲得大量物種的線粒體基因組仍然是個(gè)難題。

【發(fā)明內(nèi)容】

[0005] 需要說明的是,本發(fā)明是基于發(fā)明人的下列發(fā)現(xiàn)而完成的:
[0006] 傳統(tǒng)的線粒體的基因組測序一般都是通過物理分離線粒體、常規(guī)PCR或LA-PCR 的方法分離得到研究者所關(guān)注物種的線粒體DNA,然后通過酶切或超聲打斷的方法得到短 的DNA片段,通過第一代測序儀(基于Sanger測序原理)測序并通過軟件進(jìn)行組裝得到 全長線粒體基因組序列。而這些傳統(tǒng)方法都不可避免的需要針對(duì)單個(gè)物種設(shè)計(jì)引物,并逐 個(gè)進(jìn)行擴(kuò)增和測序。受到引物設(shè)計(jì)和測序通量的限制,該過程非常耗時(shí),成本高,無法快速 的用于大量生物的全線粒體基因組測序。近年來第二代測序技術(shù)(the next generation sequencing technology, NGS)使人們有能力完成大量樣品的線粒體基因組測序。同時(shí),也 使低廉地獲取大量不同物種的全線粒體基因組成為可能。NGS所能夠提供的測序通量大大 超過任何單個(gè)線粒體基因組的測序需求,以Illumina HiSeq 2000為例,單個(gè)run的測序通 量達(dá)到600G,足以對(duì)30萬個(gè)線粒體基因組進(jìn)行100X的測序。雖然將不同的樣品混合可以 解決通量浪費(fèi)的問題,但是怎樣將混合的測序結(jié)果一一對(duì)應(yīng)回混合樣本中的原初個(gè)體是目 前研究的瓶頸。目前常用的技術(shù)采用物理分隔或在樣本測序前添加帶有索引標(biāo)簽的接頭來 區(qū)分同一個(gè)測序反應(yīng)中的多個(gè)樣品。此技術(shù)的應(yīng)用雖然能夠極大的增加一次測序反應(yīng)中測 序樣本的數(shù)量,但由于此方法需要對(duì)每一個(gè)樣本單獨(dú)建庫,其成本會(huì)隨著所需測序樣本的 數(shù)量呈線性增長,因此大大限制了索引標(biāo)簽序列在混合樣本中的應(yīng)用。
[0007] 從測序技術(shù)發(fā)展的早期開始,研究人員們就在找尋一種能夠大規(guī)模測序和分析 物種的方法。不同的研究人員都從理論的角度上驗(yàn)證了混合測序分析的可行性。2010年 Timmermans等人將該思路應(yīng)用在了 30個(gè)鞘翅目的線粒體全基因組測序上,證實(shí)了宏線粒 體基因組測序分析的可行性,他們利用大片段PCR擴(kuò)增富集線粒體基因組,并利用羅氏454 測序30個(gè)混合的甲蟲線粒體,擴(kuò)增特定基因片段以輔助組裝。然而該研究中使用的LA-PCR 受引物的限制很大,尤其對(duì)于不同科目的物種需要針對(duì)性的設(shè)計(jì)引物。而且因?yàn)?,其混合?物種親緣關(guān)系較近,導(dǎo)致混合組裝過程中產(chǎn)生鉗合體的概率大大增加,同時(shí)也需要一系列 特定基因片段的sanger測序結(jié)果輔助組裝,進(jìn)一步增加了人力物力成本。
[0008] 因而,現(xiàn)階段大量物種的線粒體基因組組裝的方法仍有待改進(jìn)。
[0009] 本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。為此,本發(fā)明的一個(gè)目的 在于提出一種能夠快速有效的同時(shí)確定大量物種的線粒體基因組信息的手段。具體地,本 發(fā)明旨在通過利用NGS的高通量和低成本的優(yōu)勢,結(jié)合宏基因組分析技術(shù),通過生物信息 學(xué)的方法混合組裝動(dòng)物線粒體基因組。
[0010] 根據(jù)本發(fā)明的一個(gè)方面,本發(fā)明提供了一種同時(shí)確定多種樣本的線粒體基因組序 列信息的方法,所述多種樣本所屬種相互不同。根據(jù)本發(fā)明的實(shí)施例,該方法包括以下步 驟:提供所述多種樣本中每一種的基因組DNA并混合,以便獲得DNA混合物;將所述DNA混 合物進(jìn)行文庫構(gòu)建,以便獲得DNA測序文庫;對(duì)所述DNA測序文庫進(jìn)行測序,以便獲得多個(gè) 測序序列;將所述多個(gè)測序序列進(jìn)行篩選,以便獲得目標(biāo)序列;將所述目標(biāo)序列進(jìn)行序列 組裝,以便獲得多個(gè)組裝序列;將所述多種樣本中每一種進(jìn)行形態(tài)學(xué)物種分類,以便獲得多 種樣本的形態(tài)學(xué)物種分類信息;基于多種樣本的形態(tài)學(xué)物種分類信息,參考線粒體蛋白基 因數(shù)據(jù)庫,將所述組裝序列進(jìn)行物種分配,以便確定多種樣本中每一種的組裝序列;以及基 于所述多種樣本中每一種的組裝序列,分別構(gòu)建各樣本的線粒體基因組,確定線粒體基因 組序列信息。
[0011] 發(fā)明人驚奇地發(fā)現(xiàn),利用本發(fā)明的方法能夠一次性平行獲得大量物種的線粒體基 因組。并且,根據(jù)本發(fā)明的實(shí)施例,本發(fā)明的方法所需人力、物力和時(shí)間成本低,對(duì)實(shí)驗(yàn)材料 即各物種樣本DNA的要求不高,易于推廣應(yīng)用。
[0012] 根據(jù)本發(fā)明的另一方面,本發(fā)明還提供了一種用于同時(shí)確定多種樣本的線粒體基 因組序列信息的系統(tǒng),所述多種樣本所屬種相互不同。根據(jù)本發(fā)明的實(shí)施例,該系統(tǒng)包括: DNA混合物提供裝置,所述DNA混合物提供裝置用于提供所述多種樣本中每一種的基因組 DNA并混合,以便獲得DNA混合物;文庫構(gòu)建裝置,所述文庫構(gòu)建裝置與所述DNA混合物提 供裝置相連,用于將所述DNA混合物進(jìn)行文庫構(gòu)建,以便獲得DNA測序文庫;測序裝置,所 述測序裝置與所述文庫構(gòu)建裝置相連,用于對(duì)所述DNA測序文庫進(jìn)行測序,以便獲得多個(gè) 測序序列;篩選裝置,所述篩選裝置與所述測序裝置相連,用于將所述多個(gè)測序序列進(jìn)行篩 選,以便獲得目標(biāo)序列;序列組裝裝置,所述序列組裝裝置與所述篩選裝置相連,用于將所 述目標(biāo)序列進(jìn)行序列組裝,以便獲得多個(gè)組裝序列;形態(tài)學(xué)物種分類裝置,所述形態(tài)學(xué)物種 分類裝置用于將所述多種樣本中每一種進(jìn)行形態(tài)學(xué)物種分類,以便獲得多種樣本的形態(tài)學(xué) 物種分類信息;組裝序列物種分配裝置,所述組裝序列物種分配裝置分別與所述序列組裝 裝置和所述形態(tài)學(xué)物種分類裝置相連,用于基于多種樣本的形態(tài)學(xué)物種分類信息,參考線 粒體蛋白基因數(shù)據(jù)庫,將所述組裝序列進(jìn)行物種分配,以便確定多種樣本中每一種的組裝 序列;以及線粒體基因組構(gòu)建裝置,所述線粒體基因組構(gòu)建裝置與所述組裝序列物種分配 裝置相連,用于基于所述多種樣本中每一種的組裝序列,分別構(gòu)建各樣本的線粒體基因組, 確定線粒體基因組序列信息。
[0013] 根據(jù)本發(fā)明的實(shí)施例,利用本發(fā)明的系統(tǒng)能夠一次性平行獲得大量物種的線粒體 基因組。并且,發(fā)明人發(fā)現(xiàn),本發(fā)明的方法所需人力、物力和時(shí)間成本低,對(duì)實(shí)驗(yàn)材料即各物 種樣本DNA的要求不高,易于推廣應(yīng)用。
[0014] 其中,需要說明的是,在本文中所采用的表達(dá)方式"蛋白基因"、"蛋白編碼基因"、 "線粒體蛋白基因"均是指線粒體蛋白編碼基因。
[0015] 本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0016] 本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變 得明顯和容易理解,其中:
[0017] 圖1顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的同時(shí)確定多種樣本的線粒體基因組序列信 息的方法的流程示意圖;
[0018] 圖2顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,組裝序列物種分配的流程示意圖;
[0019] 圖3顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,49個(gè)物種樣本的線粒體基因組組裝結(jié)果示意 圖;
[0020] 圖4顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,49個(gè)物種樣本的組裝序列涵括線粒體蛋白基 因情況的不意圖;
[0021] 圖5顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,49個(gè)物種樣本中其中三個(gè)果蠅種的C0I基因 進(jìn)化距離及其組裝質(zhì)量示意圖;
[0022] 圖6顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,利用軟件Geneious注釋6個(gè)組裝線粒體基因 組的結(jié)果示意圖;
[0023] 圖7顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于同時(shí)確定多種樣本的線粒體基因組序 列信息的系統(tǒng)的結(jié)構(gòu)示意圖;
[0024] 圖8顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,篩選裝置400的結(jié)構(gòu)示意圖;
[0025] 圖9顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,序列組裝裝置500的結(jié)構(gòu)示意圖;
[0026] 圖10顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例,組裝序列物種分配裝置700的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0027] 下面詳細(xì)描述本發(fā)明的實(shí)施例。下面描述的實(shí)施例是示例性的,僅用于解釋本發(fā) 明,而不能理解為對(duì)本發(fā)明的限制。
[0028] 根據(jù)本發(fā)明的一個(gè)方面,本發(fā)明提供了一種同時(shí)確定多種樣本的線粒體基因組序 列信息的方法,所述多種樣本所屬種相互不同。發(fā)明人驚奇地發(fā)現(xiàn),利用本發(fā)明的方法能夠 一次性平行獲得大量物種的線粒體基因組。并且,根據(jù)本發(fā)明的實(shí)施例,本發(fā)明的方法所需 人力、物力和時(shí)間成本低,對(duì)實(shí)驗(yàn)材料即各物種樣本DNA的要求不高,易于推廣應(yīng)用。
[0029] 具體地,根據(jù)本發(fā)明的實(shí)施例,本發(fā)明的同時(shí)確定多種樣本的線粒體基因組序列 信息的方法包括以下步驟:
[0030] 首先,提供所述多種樣本中每一種的基因組DNA并混合,以便獲得DNA混合物。
[0031 ] 其次,將所述DNA混合物進(jìn)行文庫構(gòu)建,以便獲得DNA測序文庫。根據(jù)本發(fā)明的實(shí) 施例,所述DNA測序文庫的插入片段長度為250bp。
[0032] 再次,對(duì)所述DNA測序文庫進(jìn)行測序,以便獲得多個(gè)測序序列。根據(jù)本發(fā)明的實(shí)施 例,利用HiSeq2000測序平臺(tái)進(jìn)行所述測序。由此,前述的DNA測序文庫也將按照HiSeq2000 測序平臺(tái)的文庫構(gòu)建策略構(gòu)建。
[0033] 接著,將所述多個(gè)測序序列進(jìn)行篩選,以便獲得目標(biāo)序列。根據(jù)本發(fā)明的實(shí)施例, 將所述多個(gè)測序序列進(jìn)行篩選,進(jìn)一步包括:將所述多個(gè)測序序列進(jìn)行去接頭污染和質(zhì)量 控制處理,以便獲得經(jīng)過去接頭污染和質(zhì)量控制處理的測序序列;將所述經(jīng)過去接頭污染 和質(zhì)量控制處理的測序序列進(jìn)行第一比對(duì),以便獲得第一比對(duì)序列;將所述第一比對(duì)序列 分剪成長度為51bp的Kmer片段;以及從所述多個(gè)測序序列中尋找與所述Kme
當(dāng)前第1頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1