通過測序少量遺傳物質(zhì)的高通量基因分型的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及提供在含有少量靶核酸的樣品,例如相對(duì)少的分析物,例如少數(shù)或單 個(gè)細(xì)胞或者自由流動(dòng)的腫瘤或胎兒核酸中,快速發(fā)現(xiàn)、驗(yàn)證和評(píng)估整個(gè)基因組中遺傳變異 或染色體異常的方法和系統(tǒng),該整個(gè)基因組包括性染色體和/或線粒體基因組。
【背景技術(shù)】
[0002] 人類基因組中遺傳變異的最常見形式是一類已知為單核苷酸多態(tài)性(SNP)的遺 傳變異。SNP在許多研宄中是連接序列變異和表型改變的重要標(biāo)志物。因此,SNP的鑒定也 被稱為SNP分型,是在分子診斷中的重要工具,并且其目的是確定不同于參考序列的至少 一個(gè)堿基的位置?;蚍中褪轻槍?duì)個(gè)體的等位基因鑒別的過程?;蛐偷湫偷厥鞘褂脧臄?shù) 以千計(jì)的細(xì)胞中提取的DNA來鑒別的。
[0003] 相對(duì)于使用從大量細(xì)胞中提取的DNA,最近,技術(shù)已經(jīng)發(fā)展到允許少量分析物的 高容量、低成本的全基因組基因分型,如單個(gè)細(xì)胞或有限量的細(xì)胞。由于可用DNA的小量 (對(duì)于正常二倍體人細(xì)胞是~7pg或?qū)τ趩伪扼w細(xì)胞是~3. 3pg),單個(gè)細(xì)胞或有限量細(xì)胞 的SNP-和基因-分型是艱巨的任務(wù)。為了克服起始物質(zhì)的這種小量,廣泛的全基因組擴(kuò)增 (WGA)通常在進(jìn)一步的下游分析之前實(shí)施。已經(jīng)描述了不同的WGA方法,并且其基于多重置 換擴(kuò)增(MDA)(例如Genomiphi和Repli-G試劑盒)或基于PCR的全基因組擴(kuò)增方法(例 如GenomePlex)。在該擴(kuò)增之后,通過作為本領(lǐng)域已知的基于"SNP芯片"微陣列的平臺(tái)而 實(shí)現(xiàn)成功的基因分型。這些平臺(tái)需要基因組序列和變異性的大量的現(xiàn)有技術(shù)知識(shí),并且一 旦設(shè)計(jì)完成就是僅僅適用于那些目標(biāo)可變核苷酸位點(diǎn)的。該方法引入實(shí)質(zhì)性確認(rèn)偏倚,并 且固有地排除對(duì)稀有的或人群特異性的變體的檢測或者其在高度不同的物種中的應(yīng)用。
[0004] 新型的測序技術(shù)通過高通量平行測序(即下一代測序或NGS)能夠在全基因組水 平評(píng)估數(shù)萬個(gè)靶點(diǎn)的變體,高通量平行測序能夠快速全基因組測序。NGS通常產(chǎn)生是傳統(tǒng)的 Sanger測序的幾個(gè)數(shù)量級(jí)高的數(shù)據(jù)。為了檢索來自NGS研宄的SNP-和/或基因型數(shù)據(jù),需 要數(shù)據(jù)的廣泛生物信息學(xué)/統(tǒng)計(jì)學(xué)解釋,其中包括用于堿基檢出和基因組比對(duì)的算法,隨 后是用于SNP鑒定和/或基因型判定的工具。除了全基因組擴(kuò)增,部分基因組擴(kuò)增(PGA) 有時(shí)被優(yōu)選用于促進(jìn)某些目的DNA片段(例如基因或外顯子的集合,線粒體基因組,等等) 的富集。已經(jīng)報(bào)道全基因組和靶向擴(kuò)增策略與高通量大規(guī)模平行測序的效果相關(guān)。
[0005] 近期,已經(jīng)從完整的基因組和捕獲外顯子組文庫中實(shí)現(xiàn)單個(gè)細(xì)胞測序,并且由此, 在不同的領(lǐng)域中獲得了更深的見解,如腫瘤生物學(xué)和配子形成。Navin和同事開發(fā)了一種 基于FACS的方法,以從乳腺癌樣品的不同切片分離單獨(dú)的細(xì)胞核,并實(shí)施全基因組擴(kuò)增, 隨后是大規(guī)模平行測序。該WGA產(chǎn)物在足以計(jì)算變體拷貝數(shù)的低覆蓋率(~0,2X)下進(jìn) 行測序。然而,不利的是,他們方法不允許檢測單個(gè)細(xì)胞中的體細(xì)胞堿基突變。Xu等人 (Cell2012 148(5) :886-95)和 Hou 等人(Cell2012 148(5) :873-85)使用口移液法從實(shí)體 腫瘤和血液腫瘤中分離單獨(dú)的細(xì)胞。擴(kuò)增之后,高通量單個(gè)細(xì)胞測序之前進(jìn)行外顯子組捕 獲,使這兩個(gè)個(gè)研宄組能夠在復(fù)雜的腫瘤中分析體細(xì)胞堿基突變的基因全景??梢垣@得30X 至40X的測序深度,但大多數(shù)的單個(gè)細(xì)胞外顯子組以5X的最小深度進(jìn)行測序。為了評(píng)估編 碼區(qū)域內(nèi)真正的體細(xì)胞突變,所推定的變體要根據(jù)多個(gè)標(biāo)準(zhǔn)來過濾,包括在至少3至5個(gè)不 同的單個(gè)細(xì)胞樣品中存在突變。相比之下,Wang和同事使用一種革命性的微流體系統(tǒng)分離 單個(gè)精子細(xì)胞和實(shí)施平行的樣品加工,其中包括全基因組擴(kuò)增以提高擴(kuò)增的性能。WGA之 后,實(shí)施高通量全基因組測序分析,以確定同源重組和基因轉(zhuǎn)變事件以及堿基替換和染色 體非整倍體的從頭突變率。由于以6至8倍序列覆蓋的擴(kuò)增偏倚,只有30-50%的基因組 被代表。此外,Wang等人在多重反應(yīng)中以較低基因組覆蓋測序MDA的單個(gè)精子細(xì)胞以進(jìn)行 非整倍性檢測。W02012108920提供了用于非侵入性產(chǎn)前倍性檢出的方法。來自單個(gè)細(xì)胞 的DNA或從孕婦獲得的血漿樣品中的胎兒DNA,在半巢式多重PCR中使用數(shù)百至數(shù)千的引物 對(duì),用特定目標(biāo)擴(kuò)增法(STA)進(jìn)行擴(kuò)增。測序擴(kuò)增子以確定三種染色體的倍性狀態(tài)。總體 上,讀取計(jì)數(shù)信息的完整基因組分析使得能夠進(jìn)行在基因組內(nèi)大規(guī)模拷貝數(shù)偏差的全基因 組檢測,和多路的單個(gè)外顯子測序使得能夠測單個(gè)突變。然而迄今為止,從單個(gè)細(xì)胞的高通 量大規(guī)模測序數(shù)據(jù)中沒有實(shí)現(xiàn)準(zhǔn)確的SNP-檢出。
[0006] 此外缺乏從含有有限量DNA的樣品的少量分析物中實(shí)現(xiàn)高通量大規(guī)模測序的方 法,現(xiàn)有技術(shù)的方法也具有若干缺點(diǎn)。例如,現(xiàn)有技術(shù)的方法需要SNP陣列或多重引物組的 開發(fā)和設(shè)計(jì)。在每個(gè)實(shí)例中,這些方法需要基因組的詳細(xì)知識(shí),大量的時(shí)間和計(jì)算工作量和 一些試錯(cuò)運(yùn)行和優(yōu)化,以便應(yīng)用該方法到新基因組中。此外,用戶需要獲得昂貴的陣列和 引物/探針以及該方法需要很長的時(shí)間實(shí)施,因此從樣品至結(jié)果經(jīng)常需要好幾天時(shí)間。此 外,現(xiàn)有技術(shù)的方法不允許一次進(jìn)行若干個(gè)樣品的高通量分析,因?yàn)殛嚵胁辉试S大量的樣 品同時(shí)被檢測和多重PCR分析,例如在W02012108920中所述,不允許增加可同時(shí)運(yùn)行的測 定數(shù)量。與此相反,本發(fā)明提供了一種用于對(duì)包含少量目標(biāo)DNA的樣品進(jìn)行測序的簡單方 法,其是很容易轉(zhuǎn)移應(yīng)用到其它的基因組(例如未測序或部分測序的基因組),允許同時(shí)進(jìn) 行高通量分析和多個(gè)樣品測序,該方法是低運(yùn)營時(shí)間和低成本的,并且不要求昂貴的消耗 品(如陣列或數(shù)千個(gè)特異性引物組)。根據(jù)本發(fā)明的方法產(chǎn)生簡化代表性文庫可以在大約 3_6h內(nèi)完成,而下一代測序允許在約2-4小時(shí)內(nèi)完成測序(例如使用離子流平臺(tái))。由此, 結(jié)果可以在約5-10h獲得,這與往往需要多天的現(xiàn)有技術(shù)的方法相比快得多。尤其是在植 入前診斷中,這樣的時(shí)間減少是一個(gè)關(guān)鍵性優(yōu)勢。
[0007] 考慮到測序和裝配完整基因組的相對(duì)高的成本和復(fù)雜性,已經(jīng)開發(fā)了若干種策 略,使來源于僅部分測序基因組的迅速和具有成本效益的全基因組發(fā)現(xiàn)和遺傳變異的基因 分型(SNP,INDEL,CNV)。截至目前,若干種新的方法已經(jīng)被開發(fā),以減少測序工作量并限 制篩選到幾千個(gè)單核苷酸多態(tài)性(SNP),其與全基因組測序或偏倚的SNP芯片分析相比具 有高度降低的成本。這些方法已經(jīng)旨在構(gòu)建簡化代表性文庫(reduced representation libraries或RRL)以降低測序前的基因組的復(fù)雜性,通過(1)富集基因組的子集,要么通 過捕獲/靶向已知片段,或者(2)通過經(jīng)由限制性內(nèi)切酶消化的高度重復(fù)性的、大型復(fù)雜片 段的移除。后一種方法的實(shí)例包括多態(tài)性序列的復(fù)雜性降低(CRoPS),復(fù)用鳥槍基因分型 (multiplexed shotgun genotyping),限制性位點(diǎn)相關(guān)的DNA測序(RAD-seq)和基于測序 的基因分型或GBS。所有的方法都是基于一個(gè)簡單和靈活的限制性內(nèi)切酶消化和銜接子連 接,接著通過深度測序,特別是用于不具有參考基因組的那些物種。
[0008] 所述基于測序的基因分型(GBS)方法是簡單、快速、高度特異性和可重復(fù)性的方 法,并且允許訪問序列捕獲方法無法進(jìn)入的基因組區(qū)域。在缺乏完整基因組序列的物種中, GBS允許在樣品基因分型的過程中構(gòu)建參考圖譜,而基因組可得的物種可以從附加的序列 信息極大地受益以改善除外顯子組之外的新的多態(tài)性的發(fā)現(xiàn)。GBS是特別有用的,因?yàn)樗?我們將查詢的基因組區(qū)域減少到可測量數(shù)量的基因座,取決于面對(duì)的應(yīng)用,該基因座典型 地從從數(shù)千個(gè)至十萬個(gè)。
[0009] RAD-tag測序是還例如公開在EP 1885882中,而CROPS技術(shù)被描述于van Orsouw 等人(Plos One 2(11) :ell72.doi:10.1371/journal. pone. 0001172)中。
[0010] 發(fā)明簡述
[0011] 仍然需要通過對(duì)少量分析物的測序而進(jìn)行基因分型的改善系統(tǒng)和方法,少量分析 物如,例如單個(gè)細(xì)胞,有限量的細(xì)胞或含有僅有限可用量的目的遺傳物質(zhì)的樣品。
[0012] 本發(fā)明的一個(gè)一般目的是提供通過對(duì)少量分析物的測序而進(jìn)行基因檢測 (genetic testing)的可替代系統(tǒng)和方法,少量分析物如單個(gè)細(xì)胞,雙細(xì)胞,少數(shù)細(xì)胞或含 有有限量的目的遺傳物質(zhì)的樣品。
[0013] 本發(fā)明的一個(gè)目的是提供通過單個(gè)細(xì)胞的測序而進(jìn)行基因分型和/或基因檢測 的可替代系統(tǒng)和方法。
[0014] 本發(fā)明的另一個(gè)目的是提供通過對(duì)少數(shù)細(xì)胞的測序而進(jìn)行基因分型和/或基因 檢測的可替代系統(tǒng)和方法。如下文進(jìn)一步詳述,少數(shù)細(xì)胞相當(dāng)于樣品中含有最多30個(gè)靶細(xì) 胞,特別是一個(gè)或兩個(gè)靶細(xì)胞。備選地,細(xì)胞的數(shù)目是基于樣品中存在的目的遺傳物質(zhì)的 量,并且在本發(fā)明的上下文中對(duì)應(yīng)于這樣的樣品,其中目的遺傳物質(zhì)以l〇〇pg或更低的量 存在。
[0015] 本發(fā)明的又一個(gè)目的是提供通過對(duì)樣品測序而進(jìn)行基因分型和/或基因檢測的 備選系統(tǒng)和方法,該樣品包含少量的靶核酸,也被稱為目的遺傳物質(zhì)。
[0016] 通過根據(jù)本發(fā)明的獨(dú)立權(quán)利要求的方法和手段可以實(shí)現(xiàn)這個(gè)目的。從屬權(quán)利要求 涉及優(yōu)選的實(shí)施方案。
[0017] 在一個(gè)方面,本發(fā)明提供了用于少量分析物基因檢測的方法,該方法包括以下步 驟:
[0018] i?分離至少一種小分析物,
[0019] ii.通過對(duì)在所述少量分析物中存在的目的遺傳物質(zhì)的簡化代表性文庫的測序, 進(jìn)行大規(guī)模平行(全基因組)的遺傳多態(tài)性分型,
[0020] iii.用于變體發(fā)現(xiàn),基因分型和/或單體型分型。
[0021] 在要求準(zhǔn)確和效率和在小的時(shí)間框架內(nèi)的輸出遞送的程序中,諸如例如在植入前 遺傳學(xué)診斷,本發(fā)明的方法是特別有利的。優(yōu)選地,小分析物是如遺傳物質(zhì)或含有遺傳物質(zhì) 的細(xì)胞的物理物質(zhì)。更優(yōu)選地,分析物是在植入前遺傳學(xué)診斷或篩查中使用的分析物。分 析物可以是單個(gè)細(xì)胞,雙細(xì)胞,少數(shù)細(xì)胞或僅僅少量的核酸。因?yàn)閺纳贁?shù)或單個(gè)細(xì)胞獲得的 基因DNA的量是有限的。在一些實(shí)施方案中,從分析物中獲得遺傳物質(zhì)的步驟可能需要在 測序之前擴(kuò)增。
[0022] 從而,本發(fā)明還提供了用于小分析物基因檢測的方法,該方法包括以下步驟:
[0023]i?分離至少一種小分析物,
[0024] ii.擴(kuò)增在所述少量分析物中存在的遺傳物質(zhì)的DNA片段以形成擴(kuò)增產(chǎn)物,
[0025]iv.通過對(duì)所述擴(kuò)增產(chǎn)物的簡化代表性文庫的測序,進(jìn)行大規(guī)模平行(全基因組) 的遺傳多態(tài)性分型,
[0026]V.應(yīng)用于變體的發(fā)現(xiàn),基因分型和/或單體型分型。
[0027] 在該分析物是細(xì)胞(單個(gè)或多個(gè))的情況下,本發(fā)明的方法包括裂解分離細(xì)胞以 釋放核酸(例如,DNA或RNA)的額外步驟。
[0028] 因此,本發(fā)明還提供用于少量分析物基因測試的方法,該方法包括以下步驟:
[0029] i?分離至少一種小分析物,
[0030] ii.擴(kuò)增所述遺傳物質(zhì)的DNA片段以形成擴(kuò)增產(chǎn)物,
[0031] iv.通過對(duì)所述擴(kuò)增產(chǎn)物的簡化代表性文庫的測序,進(jìn)行大規(guī)模平行(全基因組) 的遺傳多態(tài)性分型,
[0032] V.應(yīng)用于變體的發(fā)現(xiàn),基因分型和/或單體型分型。
[0033] 替代細(xì)胞,分析物可以簡單地是少量的遺傳物質(zhì),例如諸如在母體液體(例如血 液)中胎兒DNA。
[0034] 因此,在一個(gè)相關(guān)方面中,本發(fā)明提供用于少量遺傳物質(zhì)的基因分型和/或單體 型分型的方法,該方法包括以下步驟:
[0035] i?提供少量的遺傳物質(zhì),
[0036] ii.擴(kuò)增遺傳物質(zhì)的DNA片段,
[0037] iii.通過對(duì)所述擴(kuò)增產(chǎn)物的簡化代表性文庫的測序,進(jìn)行大規(guī)模平行(全基因 組)的遺傳多態(tài)性分型,
[0038] iv.應(yīng)用于變體的發(fā)現(xiàn),基因分型和/或單體型分型。
[0039] 在特定的實(shí)施方案中,本發(fā)明提供用于單個(gè)細(xì)胞基因分型和/或單體型分型的方 法,該方法包括以下步驟:
[0040] i.分離和裂解單個(gè)細(xì)胞,
[0041] ii.擴(kuò)增該單個(gè)細(xì)胞的DNA片段,
[0042] iii.通過對(duì)所述擴(kuò)增產(chǎn)物的簡化代表性文庫的測序,進(jìn)行大規(guī)模平行(全基因 組)的遺傳多態(tài)性分型(基因分型),
[0043] iv.用于變體的發(fā)現(xiàn),基因分型和/或單體型分型的流水線處理(pipeline)。
[0044] 在另一個(gè)特定的實(shí)施方案中,本發(fā)明提供用于雙細(xì)胞基因分型和/或單體型分型 的方法,該方法包括以下步驟:
[0045] i.分離和裂解兩個(gè)細(xì)胞,
[0046] ii.對(duì)于每個(gè)細(xì)胞,擴(kuò)增該單個(gè)細(xì)胞的DNA片段,
[0047] iii.對(duì)于每個(gè)細(xì)胞,通過對(duì)所述單個(gè)細(xì)胞擴(kuò)增產(chǎn)物的簡化代表性文庫的深度測 序,進(jìn)行大規(guī)模平行(全基因組)的遺傳多態(tài)性分型(基因分型),
[0048] iv.生成由兩個(gè)分別基因分型的單個(gè)細(xì)胞之間遺傳多態(tài)性檢出一致所組成的虛擬 基因型,
[0049] V.重構(gòu)所述虛擬基因型的單體型分型或所述虛擬基因型的選擇,
[0050] iv.用于變體的發(fā)現(xiàn),基因分型和/或單體型分型的流水線處理。
[0051] 在一個(gè)備選的實(shí)施方案中,本發(fā)明提供了用于至少一個(gè)細(xì)胞的基因分型和/或單 體型分型的方法,該方法包括以下步驟:
[0052] i.分離和裂解至少一個(gè)細(xì)胞,
[0053] ii.擴(kuò)增至少細(xì)胞的DNA片段,
[0054] iii.通過對(duì)所述擴(kuò)增產(chǎn)物的簡化代表性文庫的深度測序,進(jìn)行大規(guī)模平行(全基 因組)的遺傳多態(tài)性分型(基因分型),
[0055] iv.用于變體的發(fā)現(xiàn),基因分型和/或單體型分型的流水線處理。
[0056] 在又一個(gè)特定的實(shí)施方案中,本發(fā)明提供用于靶核酸的分析的方法,所述方法包 括以下步驟