包含基因組DNA和cDNA兩者的總核酸的富集和新一代測(cè)序的制作方法
【專利說(shuō)明】
[0001] 相關(guān)申請(qǐng)的奪叉引用
[0002] 本申請(qǐng)要求保護(hù)于2013年3月11日提交的題目為ENRICHMENT AND NEXT GENERATION SE QUENCING OF TOTAL NUCLEIC ACID 的美國(guó)臨時(shí)申請(qǐng) No. 61/776, 666 的權(quán) 益,出于所有目的,其通過(guò)引用整體并入本文。
技術(shù)領(lǐng)域
[0003] 本發(fā)明涉及通過(guò)分析核酸混合物來(lái)進(jìn)行新一代測(cè)序和疾病診斷,例如癌癥診斷。
【背景技術(shù)】
[0004] 核酸序列分析工具是鑒定基因改變的基礎(chǔ),所述基因改變可進(jìn)而用于診斷遺傳疾 病、預(yù)測(cè)對(duì)藥物治療的響應(yīng)性以及分析藥物的藥物基因組學(xué)。一個(gè)實(shí)例是癌癥診斷。導(dǎo)致 癌癥的遺傳變異包括單核苷酸變異(SNV)、插入和缺失(Indel)、拷貝數(shù)變異(CNV)以及易 位等。因?yàn)榉治鼋?jīng)常涉及在有限量的樣品中測(cè)定稀有遺傳改變,所以靈敏度是很大的挑戰(zhàn)。 當(dāng)分析組織樣品(例如,癌樣品)中的體細(xì)胞突變時(shí),所述組織樣品通常包含與攜有突變之 細(xì)胞混合的正常細(xì)胞,尤其如此。
[0005] 新一代測(cè)序(NGS)是用于分子特征譜和表征與疾?。ㄖT如癌癥)相關(guān)的不同類型 遺傳變異的有力工具。人基因組DNA復(fù)雜并且具有許多重復(fù)序列。這提出了對(duì)序列分析的 另外挑戰(zhàn)。首先,目的核酸可能在核酸混合物中顯著為非代表性。其次,分析復(fù)雜DNA樣品 的成本可能極為昂貴,特別是在分析基因組DNA并檢測(cè)多個(gè)遺傳突變的情況下。雖然已經(jīng) 開發(fā)出了許多新一代測(cè)序方法,但是仍然需要靈敏、準(zhǔn)確和有效的方法用于核酸制備和測(cè) 序分析。
[0006] 本文所引用的所有參考文獻(xiàn)的內(nèi)容均通過(guò)引用以其整體并入本文。
[0007] 發(fā)明概沐
[0008] 在一個(gè)方面,本申請(qǐng)?zhí)峁┝藦臏y(cè)試樣品(例如,人測(cè)試樣品)獲得富集的目的核酸 群的方法,其包括:(a)提供包含獲自測(cè)試樣品之基因組DNA序列和cDNA序列的核酸混合 物;(b)使核酸混合物與一組探針在足以使所述核酸與所述探針雜交的條件下接觸,其中 所述探針與存在于所述核酸混合物中的目的核酸互補(bǔ);以及(c)將與所述探針雜交的核酸 與未雜交的那些核酸分離;從而獲得富集的目的核酸群。在一些實(shí)施方案中,通過(guò)將由所述 測(cè)試樣品產(chǎn)生的基因組DNA文庫(kù)與cDNA文庫(kù)混合來(lái)獲得所述核酸混合物。在一些實(shí)施方 案中,通過(guò)(i)將所述測(cè)試樣品中的RNA逆轉(zhuǎn)錄為cDNA以及(ii)產(chǎn)生包含基因組DNA序 列和cDNA序列的DNA文庫(kù)以提供核酸混合物來(lái)獲得所述核酸混合物。
[0009] 在根據(jù)(或適用于)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,至少一種所述探 針與存在于基因組DNA序列中的目的核酸以及存在于cDNA序列中的目的核酸互補(bǔ)。
[0010] 在根據(jù)(或適用于)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,基因組DNA序列 與cDNA序列以預(yù)定比率存在于混合物中。
[0011] 在根據(jù)(或適用于)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,目的核酸包含多 個(gè)外顯子序列、多個(gè)內(nèi)含子序列、多個(gè)內(nèi)含子-外顯子接合點(diǎn)或多個(gè)非編碼區(qū)序列。
[0012] 在根據(jù)(或適用于)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,探針組包含至少 約100個(gè)不同的探針。
[0013] 在根據(jù)(或適用于)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,與核酸混合物內(nèi) 的互補(bǔ)區(qū)相比,探針至少約IOX摩爾過(guò)量。
[0014] 在根據(jù)(或適用于)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,探針包含與原癌 基因、腫瘤抑制基因、酪氨酸激酶基因、磷酸酶基因或血管基因互補(bǔ)的序列。
[0015] 在根據(jù)(或適用于)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,在使探針與核酸 混合物接觸之前或之后,將探針與固體支持物連接。在一些實(shí)施方案中,所述方法還包括從 固體支持物洗脫探針以及與探針雜交的目的核酸。
[0016] 在根據(jù)(或適用于)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,其還包括擴(kuò)增所 述目的核酸。
[0017] 在根據(jù)(或適用于)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,其還包括分析所 富集的核酸,例如,對(duì)所富集的目的核酸進(jìn)行測(cè)序。
[0018] 在另一方面,提供了表征測(cè)試樣品中的核酸的方法,其包括:(a)提供包含獲自測(cè) 試樣品的基因組DNA序列和cDNA序列的核酸混合物;以及(b)對(duì)混合物中的基因組DNA序 列和cDNA序列同時(shí)進(jìn)行測(cè)序。在一些實(shí)施方案中,通過(guò)將由測(cè)試樣品產(chǎn)生的基因組DNA文 庫(kù)與cDNA文庫(kù)混合來(lái)獲得所述核酸混合物。在一些實(shí)施方案中,通過(guò)(i)將測(cè)試樣品中的 RNA逆轉(zhuǎn)錄為cDNA以及(ii)產(chǎn)生包含基因組DNA序列和cDNA序列的DNA文庫(kù)以提供核酸 混合物來(lái)獲得所述核酸混合物。
[0019] 在根據(jù)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,表征包括確定測(cè)試樣品中基因 組DNA序列中的變異,所述變異包括但不限于染色體重排、單核苷酸變異(SNV)或拷貝數(shù)變 異(CNV)。在一些實(shí)施方案中,染色體重排包括DNA序列的缺失、插入和易位。
[0020] 在根據(jù)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,表征包括確定測(cè)試樣品中RNA 轉(zhuǎn)錄物中的變異,所述變異包括但不限于缺失、插入、易位、SNV或差別基因表達(dá)。
[0021] 在根據(jù)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,其中所述方法包括在測(cè)序步驟 之前從核酸混合物富集目的核酸。在一些實(shí)施方案中,富集包括(a)使所述核酸混合物與 一組探針在足以使所述核酸與所述探針雜交的條件下接觸,其中所述探針與存在于所述核 酸混合物中的目的核酸互補(bǔ);以及(b)將與所述探針雜交的核酸與未雜交的那些核酸分 離;從而獲得富集的目的核酸群。
[0022] 在根據(jù)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,所述方法還包括在測(cè)序步驟之 前,向所富集的核酸群添加初始的核酸混合物。在一個(gè)可替選的實(shí)施方案中,所述方法還包 括在測(cè)序步驟之前,向所富集的核酸群添加基因組DNA序列。在另一個(gè)可替選的實(shí)施方案 中,所述方法還包括在測(cè)序步驟之前,向所富集的核酸群添加cDNA序列。
[0023] 在根據(jù)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,所述核酸混合物還包含來(lái)自對(duì) 照樣品的基因組DNA序列,所述對(duì)照樣品例如為,來(lái)自相同個(gè)體或不同個(gè)體的對(duì)照樣品。
[0024] 在根據(jù)上述實(shí)施方案中任一個(gè)的一些實(shí)施方案中,所述核酸混合物還包含來(lái)自對(duì) 照樣品的cDNA序列,所述對(duì)照樣品例如為,來(lái)自相同個(gè)體或不同個(gè)體的對(duì)照樣品。
[0025] 還提供了適用于本文所述的任一方法的試劑盒和制品。
[0026] 由以下的詳細(xì)描述并經(jīng)過(guò)本發(fā)明的實(shí)踐,本發(fā)明的另一些實(shí)施方案、特征和優(yōu)點(diǎn) 將變得明顯。
[0027] 為簡(jiǎn)明起見(jiàn),在本說(shuō)明書中引用的出版物的公開內(nèi)容(包括專利)通過(guò)引用并入 本文。
[0028]發(fā)明詳沐
[0029] 本發(fā)明提供了核酸制備和富集方法,所述方法允許對(duì)來(lái)源于相同測(cè)試樣品(例 如,來(lái)自單個(gè)個(gè)體的測(cè)試樣品)的基因組DNA和RNA(cDNA)同時(shí)進(jìn)行分析和測(cè)序。同時(shí)分 析使得最大化利用稀有寶貴樣品并簡(jiǎn)化了在臨床環(huán)境中的核酸操作和分析?;蚪MDNA和 RNA(cDNA)的組合分析提供了測(cè)試樣品中基因組和轉(zhuǎn)錄組有關(guān)的互補(bǔ)信息。這使得可獲得 測(cè)試樣品的完整核酸特征譜,其反映了基因組變異和轉(zhuǎn)錄水平上的變異兩者。此外,通過(guò)分 析基因組DNA所獲得的信息和通過(guò)分析RNA(cDNA)所獲得的信息可彼此重疊,從而使得互 相驗(yàn)證并增加核酸分析的可信度。
[0030] 因此,在一個(gè)方面,本發(fā)明提供了從包含獲自相同測(cè)試樣品的基因組DNA序列和 cDNA序列的核酸混合物來(lái)獲得富集的目的核酸群的方法。
[0031] 在另一方面,提供了表征(例如,測(cè)序)包含獲自相同測(cè)試樣品的基因組DNA序列 和cDNA序列的核酸混合物中的核酸的方法。
[0032] 還提供了用于本文所述的方法的試劑盒、組合物和制品。
[0033] 定義
[0034] 術(shù)語(yǔ)"富集"是指增加樣品中的特定核酸序列相對(duì)于在富集之前作為整體最初存 在于所述樣品中的核酸序列水平之相對(duì)豐度的過(guò)程。因此,富集步驟提供了相對(duì)百分比或 分?jǐn)?shù)的增加,而不是直接增加例如目的核酸序列的絕對(duì)拷貝數(shù)。在富集步驟之后,可將樣品 稱為富集的核酸群。
[0035] 如本文所使用的,核酸樣品的"復(fù)雜度"是指存在于該樣品中的不同獨(dú)特序列的數(shù) 量。如果樣品比其所來(lái)源的核酸樣品更不復(fù)雜,則認(rèn)為所述樣品具有"降低的復(fù)雜度"。
[0036] 如本文所使用的,"固體支持物"是指具有與標(biāo)簽結(jié)合的性質(zhì)的固體或半固體材 料,所述性質(zhì)為固有的或經(jīng)過(guò)與一些賦予該性質(zhì)的組分(例如,抗體、鏈霉親和素、核酸或 其他結(jié)合配體)連接而獲得。這樣的結(jié)合可以為直接或間接的。固體支持物的實(shí)例包括但 不限于硝化纖維素和尼龍膜、基于瓊脂糖或纖維素的珠(例如,Sepharose)以及順磁珠。
[0037] 如本文所使用的,術(shù)語(yǔ)"文庫(kù)"是指核酸序列的集合。
[0038] 如本文所使用的,術(shù)語(yǔ)"特異性雜交"意指核酸與具有互補(bǔ)序列的核酸雜交。如本 文所使用的,核酸分子的一部分可與另一個(gè)核酸分子上的互補(bǔ)序列特異性雜交。即,對(duì)于一 部分該序列與另一個(gè)分子"特異性雜交"而言,并不需要核酸序列的整個(gè)長(zhǎng)度雜交。
[0039] 可在本文中互換使用的核酸或寡核苷酸的"部分"或"區(qū)域"是2個(gè)或更多個(gè)堿基 的連續(xù)序列。在另一些實(shí)施方案中,區(qū)域或部分為至少約3個(gè)、5個(gè)、10個(gè)、15個(gè)、20個(gè)、25 個(gè)連續(xù)核苷酸的任意一個(gè)。
[0040] 如本文中所使用的,序列"突變"或"變異"是指與參考序列相比,在目的序列中的 任何序列改變。參考序列可以是野生型序列或希望與目的序列對(duì)比的序列。突變包括序列 中的單個(gè)核苷酸改變或多于一個(gè)核苷酸的改變,其出于諸如替換、缺失或插入的機(jī)制。
[0041]當(dāng)例如第一核酸或引物的至少兩個(gè)連續(xù)堿基可以以反向平行關(guān)系與第二核酸的 至少一個(gè)子序列組合或者與第二核酸的至少一個(gè)子序列雜交以形成雙鏈體時(shí),核酸或引物 與另一核酸"互補(bǔ)"。在一些實(shí)施方案中,在例如引物與靶核酸序列之間的互補(bǔ)性并非100% 完美的。
[0042] 本文所使用的術(shù)語(yǔ)"目的核酸"是指研究者的目的核酸。
[0043] 如本文所使用的"擴(kuò)增"通常是指產(chǎn)生期望序列的兩個(gè)或更多個(gè)拷貝的過(guò)程。如 本文所使用的,"核酸"是指任何長(zhǎng)度的核苷酸聚合物,并且包括DNA和RNA。核苷酸可以為 脫氧核糖核苷酸、核糖核苷酸、經(jīng)修飾的核苷酸或堿基和/或其類似物,或者可通過(guò)DNA或 RNA聚合酶并入聚合物的任何物質(zhì)。核酸可包括經(jīng)修飾的核苷酸,例如,甲基化核苷酸及其 類似物。
[0044] 如本文所使用的,"寡核苷酸"通常是指(通常但并非必須為)長(zhǎng)度不超過(guò)約200 個(gè)核苷酸的短的、通常為單鏈的、通常為合成的核酸。術(shù)語(yǔ)"寡核苷酸"和"核酸"并不互相 排斥。上述對(duì)于核酸的描述等于并完全適用于寡核苷酸。
[0045] 本文所使用的"斷裂"核酸是指將核酸破碎成不同的核酸片段??衫缤ㄟ^(guò)剪切 或通過(guò)酶促反應(yīng)來(lái)實(shí)現(xiàn)斷裂。
[0046] "引物"通常為短的單鏈核酸,通常具有游離3' -OH基團(tuán),其通過(guò)與靶序列雜交來(lái) 與目的靶標(biāo)結(jié)合,并且隨后促進(jìn)與靶標(biāo)互補(bǔ)之核酸的聚合。
[0047] "雜交"和"退火"是指其中一個(gè)或更多個(gè)核酸反應(yīng)以形成復(fù)合物的反應(yīng),所述復(fù) 合物通過(guò)核苷酸殘基的堿基之間的氫鍵穩(wěn)定化。氫鍵鍵合可通過(guò)Watson-Crick堿基配對(duì)、 Hoogstein結(jié)合或以任何其他的序列特異性方式來(lái)發(fā)生。
[0048] 本文所使用的"接頭(adaptor) "是指可與核酸片段結(jié)合的寡核苷酸。
[0049] 如本文所使用的,關(guān)于兩個(gè)核酸(例如接頭和核酸片段)的術(shù)語(yǔ)"連接"是指共價(jià) 連接兩個(gè)單獨(dú)的核酸以產(chǎn)生具有連續(xù)骨架的單個(gè)更大核酸。
[0050] 術(shù)語(yǔ)"3' "通常是指在核酸或寡核苷酸中的一個(gè)區(qū)域或位置,其為在同一核酸或寡 核苷酸中的另一區(qū)域或位置的下游。
[0051] 術(shù)語(yǔ)"5' "通常是指在核酸或寡核苷酸中的一個(gè)區(qū)域或位置,其為在同一核酸或寡 核苷酸中的另一區(qū)域或位置的上游。
[0052] 本文所使用的"陣列"包括具有核酸或其他分子的空間或光學(xué)上可定位的區(qū)域的 排列。當(dāng)陣列是核酸陣列時(shí),所述核酸可在沿著核酸鏈的任意一個(gè)點(diǎn)或多個(gè)點(diǎn)處被物理上 吸附至陣列、化學(xué)上吸附至陣列或與陣列共價(jià)連接。
[0053] 如本文所使用的,術(shù)語(yǔ)"單核苷酸變異"或簡(jiǎn)稱"SNV"是指基因組序列中相對(duì)于野 生型等位基因的單核苷酸位置處的改變。
[0054] 術(shù)語(yǔ)"拷貝數(shù)變異"或簡(jiǎn)稱"CNV"是指基因組序列中相對(duì)于野生型基因組DNA的 基因拷貝數(shù)的改變。
[0055] 如本文所使用的,術(shù)語(yǔ)"變性"是指核酸雙鏈體分離為兩個(gè)單鏈。
[0056] 應(yīng)理解,本文所述的本發(fā)明的方面和實(shí)施方案包括"由各方面和實(shí)施方案組成"和 /或"基本上由各方面和實(shí)施方案組成"。
[0057] 如本文所使用的,除非另外指明,否則未用數(shù)量詞修飾的名詞包括復(fù)數(shù)形式。
[0058] 如本領(lǐng)域技術(shù)人員所理解的,本文提及"約"的值或參數(shù)包括(描述)涉及該值或 參數(shù)本身的實(shí)施方案。例如,提及"約X"的描述包括對(duì)"X"的描述。
[0059] 本發(fā)明的方法
[0060] 在一些實(shí)施方案中,本申請(qǐng)?zhí)峁┝藦臏y(cè)試樣品獲得富集的目的核酸群的方法,其 包括:(a)使所述核酸混合物與一組探針在足以使所述核酸與所述探針雜交的條件下接 觸,其中所述探針與存在于所述核酸混合物中的目的核酸互補(bǔ),并且其中核酸混合物包含 獲自測(cè)試樣品的基因組DNA序列和cDNA序列;以及(b)將與所述探針雜交的核酸與未雜交 的那些分離;從而獲得富集的目的核酸群。
[0061] 在一些實(shí)施方案中,提供了從測(cè)試樣品獲得富集的目的核酸群的方法,其包括: (a)提供包含獲自測(cè)試樣品的基因組DNA序列和cDNA序列的核酸混合物;(b)使所述核酸 混合物與一組探針在足以使所述核酸與所述探針雜交的條件下接觸,其中所述探針與存在 于所述核酸混合物中的目的核酸互補(bǔ);以及(c)將與所述探針雜交的核酸與未雜交的那些 分離;從而獲得富集的目的核酸群。
[0062] 在一些實(shí)施方案中,提供了從測(cè)試樣品獲得富集的目的核酸群的方法,其包括: (a)將由測(cè)試樣品產(chǎn)生的基因組DNA文庫(kù)與由測(cè)試樣品產(chǎn)生的cDNA文庫(kù)混合以提供核酸 混合物;(b)在使所述核酸混合物與一組探針足以使所述核酸與所述探針雜交的條件下接 觸,其中所述探針與存在于所述核酸混合物中的目的核酸互補(bǔ);以及(c)將與所述探針雜 交的核酸與未雜交的那些分離;從而獲得富集的目的核酸群。在一些實(shí)施方案中,提供了 從測(cè)試樣品獲得富集的目的核酸群的方法,其包括:(a)以預(yù)定比率(例如,以約10 : 1、 5 : 1、2 : 1、1 : 1、1 : 2、1 : 5、1 : 10的比率)將由測(cè)試樣品產(chǎn)生的基因組DNA文