倍、至少10倍、至少50倍或至少 100倍、至少500倍或至少1,000倍)。用于從各種樣品(例如臨床、法醫(yī)、考古學和環(huán)境樣 品)提取DNA的方法是本領域公知的。這些樣品中的DNA可以是高度片段化的,例如片段化 至10bp至5kb例如20bp至200bp范圍內(nèi)的平均大?。▍⒁?,例如Sawyer等人,PLoSONE 7:e34131)。在特定的實施方案中,樣品可以是來自古代來源(例如,死于至少10年前、至 少100年前的來源或死于至少1,000年前的來源,諸如在墳墓位置發(fā)現(xiàn)的硬組織、木乃伊 等)的硬組織諸如骨、毛發(fā)、指甲、趾甲或牙的樣品。從這樣的組織提取DNA的方法是已知 的(參見,例如Higgins等人(SciJustice2013 53:433_41)、Knapp等人(Ann.Anat. 2012 194:3-6)、Amory等人(ForensicSci.Int. 2007166:218-29)和Benoit等人(Med.Sci. Law. 2013 53:100-6)以及Rohland(MethodsMol.Biol. 2012 840:21-8))。從法醫(yī)樣品(例 如來自犯罪現(xiàn)場的樣品)提取DNA的方法是公知的。
[0066] 從樣品提取DNA之后,將DNA連接至通用銜接子,所述通用銜接子為連接至包含在 所提取的DNA樣品中的DNA片段的兩端的銜接子。在某些情況下,通用銜接子可以是Y銜 接子,其實例描述于下文。在特定的情況下,可以通過使用聚合酶磨平所提取的DNA的末端 并隨后經(jīng)由平末端連接來連接銜接子而完成連接。在其它實施方案中,可以使用Taq聚合 酶來磨平末端,所述聚合酶添加另外的3'A(從而產(chǎn)生3'A懸垂),并且可以使用具有5'T 懸垂的銜接子完成連接。將顯而易見的是,銜接子可以因含有鑒定與其連接的樣品的分子 條形碼(這允許樣品在測序之前進行合并)而是"索引的"。備選地或另外地,銜接子可以 含有隨機條形碼或類似物。這樣的銜接子可以被連接至片段并且對應于特定區(qū)域的基本上 每一片段用不同的序列進行標記。這允許鑒定PCR重復并允許分子進行計數(shù)。
[0067] 在銜接子連接之后,可以任選地例如通過PCR擴增樣品。在這些實施方案中,可以 使用一種或多種與所添加的銜接子(或它們的互補物)雜交的引物擴增樣品中的銜接子 連接的核酸。在其中添加Y銜接子的實施方案中,可以通過PCR使用以下兩種引物擴增銜 接子連接的核酸:與銜接子的上鏈的單鏈區(qū)域雜交的第一引物,以及與銜接子的下鏈的單 鏈區(qū)域的互補物雜交的第二引物。在銜接子已被添加至樣品中的核酸并且銜接子連接的 核酸已被任選地擴增之后,銜接子連接的核酸可以在溶液中在高嚴格條件下與親和標記的 RNA探針進行雜交,所述親和標記的RNA探針通過以下步驟產(chǎn)生:在親和標記的核糖核苷酸 的存在下,體外轉(zhuǎn)錄已被連接至RNA啟動子銜接子(例如T7啟動子)的參考基因組樣品的 文庫。參考樣品可來自與內(nèi)源性DNA的來源相似或相同的物種,即足夠相似以至于它們的 DNA將在高嚴格條件(例如在至少42°C、至少50°C或至少60°C的溫度下進行至少24hr)下 雜交。在某些實施方案中,可以通過苯酚乳液重締合(PERT) (Miller等人,NucleicAcids Res. 1995 23:2339 - 2340)或振蕩苯酚乳液重締合(osPERT)(Bruzel等人Genomics. 2006 87:286-9)以使序列快速重締合來完成雜交。
[0068] 例如,參考樣品可以是已被片段化至期望大小的(例如人)基因組DNA,所述期望 大小為例如l〇〇bp至10kb例如100bp至500bp范圍內(nèi)的平均大小,盡管還預期了這些范圍 之外的大小??梢酝ㄟ^使用物理學方法(例如超聲處理、噴霧法或剪切)、化學方法、酶學方 法(例如使用稀有切割的限制酶)或使用轉(zhuǎn)座元件將基因組片段化來制備這樣的片段。片 段化之后,可以使用常規(guī)方法將片段連接至RNA聚合酶啟動子。如果使用轉(zhuǎn)座子,還可以在 切割過程中將RNA聚合酶啟動子添加至片段。已連接至RNA啟動子的片段可隨后被體外轉(zhuǎn) 錄成親和標記的RNA探針。在某些情況下,參考樣品可以被加工以選擇或去除特定序列。例 如,在使用之前,參考樣品可以被加工以去除重復序列,例如微衛(wèi)星序列、LINE和/或SINE 等。
[0069] 在溶液中雜交之后,在基底(例如固體支持物或小珠)上捕獲雜交的DNA分子。在 這些實施方案中,雜交的產(chǎn)物結合至包含針對親和標記的捕獲劑的基底,并且親和標記結 合至捕獲劑??梢栽谂c通用銜接子的一條或多條鏈互補或具有相同序列的一種或多種RNA寡核苷酸的存在下完成該步驟。在某些情況下,這些RNA寡核苷酸可本身使用體外轉(zhuǎn)錄制 備,例如通過將兩個寡核苷酸退火在一起以產(chǎn)生包含轉(zhuǎn)錄區(qū)域上游的雙鏈RNA啟動子的雙 鏈體,其中轉(zhuǎn)錄區(qū)域可以被轉(zhuǎn)錄以產(chǎn)生RNA寡核苷酸。在這些實施方案中,RNA寡核苷酸可 以與通用銜接子的連續(xù)序列的至少50% (例如至少60%、至少70%或更多)互補或具有相 同的序列。
[0070] 在捕獲之后,洗滌基底以去除任何未結合的DNA分子,以及可釋放所捕獲的DNA分 子。在一些實施方案中,通過用NaOH處理支持物來釋放所捕獲的DNA分子,NaOH切割體外 轉(zhuǎn)錄的RNA分子,從而釋放DNA分子。此步驟可以通過用RNA酶H、RNA酶A處理或通過將 基底加熱至足以使所附著的雙鏈體變性的溫度來執(zhí)行。
[0071] 在釋放所捕獲的DNA分子之后,它們可以任選地被擴增(例如使用與所添加的銜 接子序列或它們的互補物雜交的引物)和測序。在某些實施方案中,所釋放的DNA可以使 用與在以下中的使用相容的引物來擴增:例如Illumina可逆終止法、Roche焦磷酸測序法 (454)、LifeTechnologies連接測序法(SOLiD平臺)或LifeTechnologies離子激流平 臺。這樣的方法的實例描述于以下文獻中:Margulies等人(Nature2005 437:376 - 80); Ronaghi等人(AnalyticalBiochemistryl996 242:84 - 9);Shendure等人(Science2005 309:1728-32);Imelfort等人(BriefBioinform· 2009 10:609-18);Fox等人(Methods MolBiol. 2009;553:79-108);Appleby等人(MethodsMolBiol. 2009;513:19-39)和 Morozova等人(Genomics. 2008 92:255-64),其通過引用并入關于方法的一般性描述和方 法的具體步驟,包括每一步的所有起始產(chǎn)物、試劑和最終產(chǎn)物。
[0072] 在另一個實施方案中,可以使用納米孔測序法(例如Soni等人ClinChem2007 53:1996-2001中所描述的或OxfordNanoporeTechnologies所描述的)對所釋放的DNA進 行測序。納米孔測序法是單分子測序技術,其中DNA的單個分子在其通過納米孔時被直接 測序。納米孔是直徑為1納米數(shù)量級的小孔。將納米孔浸入導電流體并且對其施加電勢(電 壓)導致因離子傳導通過納米孔而產(chǎn)生的微電流。流動的電流量對納米孔的尺寸和形狀敏 感。隨著DNA分子通過納米孔,DNA分子上的每個核苷酸以不同的程度阻塞納米孔,從而以 不同的程度改變通過納米孔的電流的量級。因此,隨著DNA分子通過納米孔在電流中的此 改變代表了DNA序列的讀數(shù)。納米孔測序技術被公開于美國專利號5, 795, 782、6, 015, 714、 6, 627, 067、7, 238, 485 和 7, 258, 838 以及美國專利申請?zhí)?2006003171 和 20090029477 中。
[0073] 所分離的片段可以直接測序,或在一些實施方案中,所釋放的片段可以被擴增 (例如通過PCR)以產(chǎn)生被測序的擴增產(chǎn)物。在某些實施方案中,擴增產(chǎn)物可以含有與在 以下中的使用相容的序列:例如如上所述的Illumina可逆終止法、Roche焦磷酸測序法 (454)、LifeTechnologies連接測序法(SOLiD平臺)或LifeTechnologies離子激流平 臺。
[0074] 在某些實施方案中,所測序的樣品可以包含來自多個樣品的核酸庫,其中樣品中 的核酸具有分子條形碼以指示它們的來源。在一些實施方案中,進行分析的核酸可以源自 單個來源(例如,單個有機體、病毒、組織、細胞、受試者等),而在其它實施方案中,核酸樣 品可以是提取自多個來源的核酸庫(例如,來自多個有機體、病毒、組織、細胞、受試者等的 核酸庫),其中"多個"意指兩個或更多個。因此,在某些實施方案中,核酸樣品可以含有來 自2個或更多個來源、3個或更多個來源、5個或更多個來源、10個或更多個來源、50個或更 多個來源、100個或更多個來源、500個或更多個來源、1000個或更多個來源、5000個或更多 個來源、多至且包括約10, 〇〇〇個或更多個來源的核酸。分子條形碼可以允許來自不同來源 的序列在它們被分析之后進行區(qū)分。
[0075] 上文描述的方法可以用于從各種不同的樣品分離內(nèi)源性DNA,對所述內(nèi)源性DNA 可以進行基因分型(例如測序)以研究從其獲得樣品的個體。例如,方法可以用于分離代 表個體基因組的至少10%、至少30%、至少50%或至少70%或更多的片段,并且所述片段 可以被測序和任選地與參考樣品的基因組進行比較。
[0076] 在一些情況下,上文描述的方法可以用于法醫(yī)樣品的分析,例如以通過DNA分析 鑒定人。本文使用的"法醫(yī)"是證據(jù)(例如在犯罪現(xiàn)場或事故現(xiàn)場發(fā)現(xiàn)的、隨后被用于法庭 的證據(jù))的研究。"法醫(yī)科學"是用于回答法律體系(特別是刑事或民事司法體系)的目 標問題的任何科學,其提供用于法庭(例如刑事調(diào)查和審判)使用的公正的科學證據(jù)。例 如,法醫(yī)科學是多學科科目,其主要借鑒化學和生物學,但也借鑒例如物理學、地質(zhì)學、心理 學和社會科學。人法醫(yī)學的一個方面(法醫(yī)DNA分型)的目標是確定從法醫(yī)樣品(例如來 自犯罪現(xiàn)場的證據(jù)或來自個體的DNA樣品)獲取的DNA的身份或基因型。這樣的DNA證據(jù) 的典型來源包括毛發(fā)、骨、牙和體液諸如唾液、精液和血。常常存在快速鑒定大量人、人遺骸 和/或生物學樣品的需要。例如,這樣的遺骸或樣品可能與戰(zhàn)爭相關人員傷亡、空難和恐怖 主義行動有關。
[0077] 試劑盒
[0078] 本公開內(nèi)容還提供了含有用于實施本發(fā)明的上述方法的試劑的試劑盒。本發(fā)明的 試劑盒含有至少:a)通用銜接子(其可以包含5'T懸垂);c)包含已連接至RNA啟動子銜 接子的片段化的人基因組DNA的文庫,或由該文庫制得的親和標記的轉(zhuǎn)錄本的文庫;d)與 通用銜接子的序列互補或與其具有相同序列的RNA寡核苷酸,或用于通過體外轉(zhuǎn)錄制備所 述RNA寡核苷酸的DNA寡核苷酸。如果試劑盒不含有親和標記的轉(zhuǎn)錄本的文庫,則試劑盒 可以含有:e)從RNA啟動子引發(fā)RNA合成的DNA依賴性RNA聚合酶;f)包含親和標記的核 糖核苷酸(例如生物素-UTP)的核糖核苷酸混合物;以及g)包含針對親和標記的捕獲劑的 基底(例如小珠)。
[0079] 試劑盒可以任選地含有其它成分,例如:連接酶、聚合酶(例如DNA聚合酶諸如 Taq聚合酶和RNA聚合酶諸如T7RNA聚合酶)、核苷酸、緩沖劑、雜交試劑例如用于執(zhí)行PERT 或osPERT的試劑等。根據(jù)所期望的,試劑盒的各種成分可以存在于單獨的容器中或者某些 相容的成分可以預先組合在單個容器中。
[0080] 除了上述成分之外,本發(fā)明的試劑盒還可以包括用于使用試劑盒的成分實施本發(fā) 明的方法的說明書,即用于樣品分析的說明書。用于實施本發(fā)明的方法的說明書一般被記 錄在合適的記錄介質(zhì)上。例如,說明書可以被打印在諸如紙張或塑料等的基材上。如此,說 明書可以存在于試劑盒中作為包裝說明書,存在于試劑盒或其成分的容器的標簽中(即, 與包裝或分包裝關聯(lián))等。在其它實施方案中,說明書作為存在于合適的計算機可讀存儲 介質(zhì)(例如CD-ROM、軟盤等)上的電子存儲數(shù)據(jù)文件存在。在其它實施方案中,實際的說 明書不存在于試劑盒中,而是提供了用于從遠程來源(例如通過網(wǎng)絡)獲得說明書的工具。 該實施方案的實例是包括網(wǎng)址的試劑盒,其中可以在該網(wǎng)址查看說明書和/或從該網(wǎng)址下 載說明書。與說明書一樣,用于獲得說明書的此工具被記錄在合適的基材上。 實施例
[0081] 通過以下實施例可以進一步理解本教導內(nèi)容的各方面,實施例不應被視為以任何 方式限制本教導內(nèi)容的范圍。
[0082] 在本研究中,我們使用我們稱之為全基因組溶液中捕獲(WISC)