用于核酸組裝和高通量測序的方法
【專利說明】
[0001] 相關(guān)申請
[0002] 本申請要求2012年6月25日提交的美國臨時專利申請?zhí)?1/664, 118和2012年 11月30日提交的美國臨時專利申請?zhí)?1/731,627的權(quán)益和優(yōu)先權(quán),上述各申請通過引用 全文納入本文。
技術(shù)領(lǐng)域
[0003] 本文提供了涉及合成和組裝有預(yù)定序列的高保真核酸和核酸庫的方法和設(shè)備。更 具體的,提供了用于多核苷酸合成、錯誤降低和/或高通量測序驗證的方法和設(shè)備。
[0004] 發(fā)明背景
[0005] 使用重組DNA化學(xué)技術(shù),從自然中復(fù)制和擴(kuò)增DNA序列并隨后分解成組成部分是 常見的。作為組成部分,隨后序列重組或重新組裝成新的DNA序列。然而,對天然可得序列 的依賴性嚴(yán)重限制了研究者探索的可能性。雖然現(xiàn)在可以從單個核苷直接合成短DNA序 列,但通常直接構(gòu)建多核苷酸的大片段或組件(即長于約400堿基對的多核苷酸序列)是 不可行的。
[0006] 能通過微芯片上的大規(guī)模平行定制合成進(jìn)行寡核苷酸合成(Zhou等,(2004) Nucleic Acids Res. 32:5409 ;Fodor 等(1991)Science 251:767)。然而,當(dāng)前微芯片的表 面積非常小,并且因而僅能生成少量的寡核苷酸。在釋放到溶液中時,寡核苷酸以每條序列 皮摩爾或更低濃度存在,該濃度不足以有效驅(qū)動雙分子活化反應(yīng)。無法對目前用于組裝少 量變體核酸的方法以成本節(jié)約的方式進(jìn)行放大以生成大量特定的變體。同樣,仍然需要用 于商保真基因組裝等的改良的方法和裝置。
[0007] 此外,通常通過化學(xué)反應(yīng)合成微芯片上的寡核苷酸。錯誤的化學(xué)反應(yīng)導(dǎo)致寡核苷 酸中隨機(jī)的堿基錯誤?;瘜W(xué)核酸合成中關(guān)鍵限制因素之一是錯誤率?;瘜W(xué)合成的寡核苷酸 的錯誤率(例如每100個堿基中1個的缺失和約每400個堿基中1個的錯配和插入)超過 了通過酶的方式復(fù)制現(xiàn)有核酸(例如PCR)所得的錯誤率。因此,迫切需要一種新的技術(shù)來 以成本節(jié)約的方式生產(chǎn)高產(chǎn)量的高保真多核苷酸。
[0008] 概述
[0009] 本發(fā)明的各方面涉及制備和/或組裝高保真聚合物的方法、系統(tǒng)和組合物。本發(fā) 明還提供了進(jìn)行核酸組裝反應(yīng)和組裝核酸的設(shè)備和方法。本發(fā)明的一個目的是提供合成定 制多核苷酸的可行、經(jīng)濟(jì)的方法。本發(fā)明的另一個目的是提供生產(chǎn)合成的多核苷酸的方法, 該方法的錯誤率低于通過本領(lǐng)域已知方法制備的合成的多核苷酸。
[0010] 根據(jù)一些實施方式,本發(fā)明提供了一種用于生產(chǎn)具有預(yù)定序列的目標(biāo)核酸的方 法。在一些實施方式中,該方法包括提供多個寡核苷酸的步驟,其中各寡核苷酸包含(i)與 目標(biāo)核酸的序列的不同部分相同的內(nèi)部序列,(ii)內(nèi)部序列5'端之側(cè)的5'側(cè)接序列和內(nèi) 部序列3'端之側(cè)的3'側(cè)接序列,各側(cè)接序列包含引物對的引物識別位點(diǎn)和限制性酶識別 位點(diǎn)。在一些實施方式中,該方法還包括使用引物對擴(kuò)增至少一組寡核苷酸,從而生成多個 經(jīng)擴(kuò)增的寡核苷酸。隨后可使多個經(jīng)擴(kuò)增的寡核苷酸在單個池中接觸限制性酶和連接酶, 其中限制性酶能夠識別限制性酶識別位點(diǎn),從而生成目標(biāo)核酸。
[0011] 在一些實施方式中,該方法包括對組裝的目標(biāo)核酸進(jìn)行測序確認(rèn)。在一些實施方 式中,經(jīng)擴(kuò)增的雙鏈寡核苷酸可包含一個序列錯誤或錯配。在一些實施方式中,該方法包括 對多個經(jīng)擴(kuò)增的寡核苷酸進(jìn)行錯誤去除。在一些實施方式中,可使多個經(jīng)擴(kuò)增的寡核苷酸 接觸錯配結(jié)合劑。所述錯配結(jié)合劑可選擇性地結(jié)合包含錯配的雙鏈寡核苷酸,導(dǎo)致結(jié)合和 剪切作用。在一些實施方式中,可使多個經(jīng)擴(kuò)增的寡核苷酸接觸錯配識別劑,例如化學(xué)品, 如賴氨酸、哌啶等。
[0012] 在一些實施方式中,在適于促進(jìn)消化和連接的條件下將限制性酶和連接酶加入單 個經(jīng)擴(kuò)增的寡核苷酸的池中,從而生成包含組裝的目標(biāo)核酸序列和側(cè)接區(qū)的混合物。在一 些實施方式中,各側(cè)接區(qū)包含共有的引物識別位點(diǎn)。在一些實施方式中,所述限制性酶是 IIS型限制性酶。使用IIS型限制性酶進(jìn)行消化可產(chǎn)生多個粘性末端的雙鏈結(jié)構(gòu)寡核苷酸 且所述多個粘性末端的雙鏈結(jié)構(gòu)寡核苷酸可以特定的線性排列形式進(jìn)行連接。
[0013] 在一些實施方式中,該方法包括使用能夠識別位于目標(biāo)核酸的5'端和3'端的引 物識別位點(diǎn)的引物對擴(kuò)增目標(biāo)核酸。在一些實施方式中,該方法包括對目標(biāo)核酸進(jìn)行測序 以確認(rèn)其序列準(zhǔn)確性,例如通過高通量測序。在一些實施方式中,該方法包括從核酸序列池 中分離至少一種具有預(yù)定序列的目標(biāo)核酸。
[0014] 根據(jù)一些實施方式,本發(fā)明提供了一種進(jìn)一步加工分離的核酸的方法。在一些實 施方式中,該方法包括組裝至少兩種目標(biāo)核酸。組裝的步驟可以是通過分級組裝。在一些 實施方式中,可對至少兩種目標(biāo)核酸進(jìn)行限制性酶消化和連接,從而形成長的目標(biāo)核酸構(gòu) 建體,例如長度至少約10千堿基或100千堿基。
[0015] 根據(jù)一些實施方式,本發(fā)明提供了一種用于生產(chǎn)載體中具有預(yù)定序列的目標(biāo)核酸 的方法。在一些實施方式中,提供了多個寡核苷酸,各寡核苷酸包含(i)與目標(biāo)核酸的序列 的不同部分相同的內(nèi)部序列,(ii)內(nèi)部序列5'端之側(cè)的5'側(cè)接序列和內(nèi)部序列3'端之側(cè) 的3'側(cè)接序列,各側(cè)接序列包含引物對的引物識別位點(diǎn)和限制性內(nèi)切酶的限制性酶識別位 點(diǎn)。在一些實施方式中,可使用引物對擴(kuò)增至少一組寡核苷酸,從而生成多個經(jīng)擴(kuò)增的寡核 苷酸。在一些實施方式中,可對多個經(jīng)擴(kuò)增的寡核苷酸進(jìn)行錯誤去除和/或校正。在一些實 施方式中,提供了具有限制性內(nèi)切酶的限制性酶識別位點(diǎn)的環(huán)形載體。在一些實施方式中, 可使多個經(jīng)擴(kuò)增的寡核苷酸和環(huán)形載體在單個池中接觸限制性酶和連接酶,其中限制性酶 能夠識別限制性酶識別位點(diǎn),從而在載體中組裝目標(biāo)核酸。在一些實施方式中,該方法還包 括將載體轉(zhuǎn)化至宿主細(xì)胞中并測序以驗證目標(biāo)核酸序列。
[0016] 根據(jù)一些實施方式,本發(fā)明提供了一種用于組裝具有預(yù)定序列的目標(biāo)核酸的組合 物。在一些實施方式中,所述組合物包含多個寡核苷酸,其中各寡核苷酸包含(i)與目標(biāo)核 酸的序列的不同部分相同的內(nèi)部序列,(ii)內(nèi)部序列5'端之側(cè)的5'側(cè)接序列和內(nèi)部序列 3'端之側(cè)的3'側(cè)接序列,各側(cè)接序列包含引物對的引物識別位點(diǎn)和限制性內(nèi)切酶的限制性 酶識別位點(diǎn)。在一些實施方式中,所述組合物還包含限制性內(nèi)切酶和/或連接酶。在一些 實施方式中,所述組合物還包含載體,所述載體包含限制性內(nèi)切酶的一對酶識別位點(diǎn)。在一 些實施方式中,所述限制性內(nèi)切酶是IIS型限制性內(nèi)切酶。
[0017] 在一些實施方式中,對多個寡核苷酸進(jìn)行擴(kuò)增和/或錯誤校正。
[0018] 在本發(fā)明的一些方面中,生成具有預(yù)定序列的目標(biāo)核酸的方法包括提供第一混合 物,其包含(i)限制性酶和(ii)第一寡核苷酸池,所述第一寡核苷酸池包括:包含與目標(biāo)核 酸5'端相同序列的第一寡核苷酸、包含與目標(biāo)核酸3'端相同序列的第二寡核苷酸和包含 與目標(biāo)核酸序列另外部分相同序列的多寡核苷酸組,各寡核苷酸具有對應(yīng)于下一寡核苷酸 中序列區(qū)域的重疊序列區(qū)域,第一池中的寡核苷酸合起來包含目標(biāo)核酸序列;并使混合物 與連接酶接觸,從而生成目標(biāo)核酸。隨后可對目標(biāo)核酸進(jìn)行測序驗證。
[0019] 在一些實施方式中,本發(fā)明的方法包括提供一個構(gòu)建寡核苷酸池并涉及不同階段 時寡核苷酸的擴(kuò)增。術(shù)語"構(gòu)建寡核苷酸"指可用于組裝比構(gòu)建寡核苷酸本身長的核酸分 子的單鏈寡核苷酸。構(gòu)建寡核苷酸可以是單鏈寡核苷酸或雙鏈寡核苷酸。在一些實施方式 中,構(gòu)建寡核苷酸是合成的寡核苷酸并可以在基質(zhì)上平行地合成。
[0020] 在一些實施方式中,該方法還包括在提供第一混合物前提供多個構(gòu)建寡核苷酸的 步驟,其中各構(gòu)建寡核苷酸包含(i)與目標(biāo)核酸的序列的不同部分相同的內(nèi)部序列,(ii) 內(nèi)部序列5'端之側(cè)的5'側(cè)接序列和內(nèi)部序列3'端之側(cè)的3'側(cè)接序列,各側(cè)接序列包含 引物對的引物識別位點(diǎn)和限制性酶識別位點(diǎn)。在一些實施方式中,各側(cè)接區(qū)可包含共同的 引物識別位點(diǎn)。在一些實施方式中,可擴(kuò)增多個構(gòu)建寡核苷酸。在一些實施方式中,寡核苷 酸可包含序列錯誤或錯配。在一些實施方式中,可對多個經(jīng)擴(kuò)增的寡核苷酸進(jìn)行錯誤去除。 例如,可使多個經(jīng)擴(kuò)增的寡核苷酸接觸錯配結(jié)合劑,所述錯配結(jié)合劑選擇性結(jié)合并剪切包 含錯配的雙鏈寡核苷酸。
[0021] 在一些實施方式中,可在適于促進(jìn)消化和連接的條件下將限制性酶和連接酶加入 單個經(jīng)擴(kuò)增的寡核苷酸的池中,從而生成包含組裝的目標(biāo)核酸序列和側(cè)接區(qū)的混合物。在 一些實施方式中,所述限制性酶可以是IIS型限制性酶且使用IIS型限制性酶進(jìn)行的消化 可生成多個粘性末端雙鏈寡核苷酸,其中所述多個粘性末端雙鏈寡核苷酸以特殊的線性排 列進(jìn)行連接。
[0022] 在一些實施方式中,該方法還包括使用能夠識別位于第一寡核苷酸5'端和第二寡 核苷酸3'端的引物識別位點(diǎn)的引物對擴(kuò)增目標(biāo)核酸。
[0023] 在一些實施方式中,該方法還包括對目標(biāo)核酸進(jìn)行測序以確認(rèn)其序列準(zhǔn)確性,例 如通過高通量測序。
[0024] 在一些實施方式中,該方法還包括從核酸序列池中分離至少一種具有預(yù)定序列的 目標(biāo)核酸。
[0025] 在一些實施方式中,該方法還包括加工目標(biāo)核酸。
[0026] 在一些實施方式中,該方法還包括提供第二混合物,其包含(i)限制性酶和(ii) 第二寡核苷酸池,所述第二寡核苷酸池包含:包含與目標(biāo)核酸5'端相同序列的第一寡核苷 酸、包含與目標(biāo)核酸3'端相同的序列的第二寡核苷酸和包含與目標(biāo)核酸序列另外部分相同 序列的多寡核苷酸組,各寡核苷酸具有對應(yīng)于下一寡核苷酸中序列區(qū)域的重疊序列區(qū)域, 第二池中的寡核苷酸合起來包含第二目標(biāo)核酸。在一些實施方式中,使第二混合物接觸連 接酶,從而生成第二目標(biāo)核酸。在一些實施方式中,第一池中的第二寡核苷酸包含限制性內(nèi) 切酶的限制性內(nèi)切酶識別位點(diǎn)且第二池中的第一寡核苷酸包含限制性內(nèi)切酶的限制性內(nèi) 切酶識別位點(diǎn)。
[0027] 在一些實施方式中,該方法還包括組裝至少兩個目標(biāo)核酸。在一些實施方式中,組 裝的步驟是通過分級組裝。在一些實施方式中,對所述至少兩個目標(biāo)核酸進(jìn)行限制性內(nèi)切 酶消化和連接,從而形成長的目標(biāo)核酸構(gòu)建體。在一些實施方式中,所述長的目標(biāo)核酸構(gòu)建 體的長度為至少約10千堿基或至少約100千堿基。
[0028] 在一些方面,本發(fā)明涉及用于組裝具有預(yù)定序列的目標(biāo)核酸的組合物,所述組合 物包含多個寡核苷酸,其包含:包含與目標(biāo)核酸5'端相同序列的第一寡核苷酸、包含與目 標(biāo)核酸3'端相同的序列的第二寡核苷酸和包含與目標(biāo)核酸序列另外部分相同序列的一個 或多個寡核苷酸,各寡核苷酸具有對應(yīng)于下一寡核苷酸中序列區(qū)域的重疊序列區(qū)域,多個 寡核苷酸合起來包含目標(biāo)核酸;多個共有序列包含引物對的引物識別位點(diǎn)和限制性內(nèi)切酶 識別位點(diǎn)。在一些實施方式中,所述組合物還包含限制性內(nèi)切酶和/或連接酶。所述限制 性內(nèi)切酶可以是IIS型限制性內(nèi)切酶。
[0029] 在一些實施方式中,可對多個寡核苷酸進(jìn)行擴(kuò)增和/或錯誤校正。在一些實施方 式中,所述組合物還可包含線性化的載體,所述載體包含與第一寡核苷酸相容的5'端和與 第二寡核苷酸相容的3'端。
[0030] 附圖簡要說明
[0031] 圖1顯示了根據(jù)本發(fā)明的一個實施方式的高保真核酸組裝的示例性過程。
[0032] 圖2顯示了具有預(yù)定序列的多核苷酸的組裝方法的非限制性示例。
[0033] 圖3顯示了將具有預(yù)定序列的多核苷酸組裝至載體中的組裝方法的非限制性示 例。
[0034] 圖4顯示了具有預(yù)定序列的多核苷酸的分級組裝方法的非限制性示例。
[0035] 圖5顯示了具有限制性內(nèi)切酶識別位點(diǎn)(下劃線)的質(zhì)粒pG9-l的核苷酸序列。
[0036] 圖6顯示了測序驗證的非限制性示例性方法。
[0037] 發(fā)明詳述
[0038] 本發(fā)明的各方面對于優(yōu)化核酸組裝反應(yīng)和減少不準(zhǔn)確組裝的核酸數(shù)目是有用的。 本發(fā)明的方法和組合物可促進(jìn)獲得具有預(yù)定序列的目標(biāo)序列的方法。因此,本發(fā)明的方法 和組合物可增加獲得正確組裝的核酸的可能性,從而減少生產(chǎn)具有預(yù)定序列的核酸相關(guān)的 成本和時間。
[0039] 本發(fā)明的各方面可用于提高一種或多種初始或中間組裝反應(yīng)的產(chǎn)量。在一些實施 方式中,本發(fā)明的方法和組合物可通過避免需要分離多個組裝步驟(例如酶消化、純化和 連接步驟)來提高總組裝過程的效率。因此,本發(fā)明的一些方面允許可預(yù)測和/或可靠的 組裝策略并可顯著減少基因合成所需的時間和步驟并提高中間產(chǎn)物或最終核酸產(chǎn)物的產(chǎn) 量和/或準(zhǔn)確性。
[0040] 在本發(fā)明的一些方面中,組裝過程包括設(shè)計和實施核酸組裝策略,該核酸組裝策 略能夠調(diào)和已知或預(yù)測會干擾一個或多個組裝步驟的序列特征。例如,可分析待合成的核 酸序列中會干擾一個或多個組裝步驟的序列特征,如重復(fù)的序列,具有顯著高或低GC含量 的序列和/或與二級結(jié)構(gòu)相關(guān)的其他序列。本領(lǐng)域技術(shù)人員應(yīng)理解,某些序列特征會干擾 多重組裝反應(yīng)(例如基于聚合酶的延伸反應(yīng))和/或促進(jìn)不需要的組裝產(chǎn)物的形成,從而 減少或阻止正確的核酸產(chǎn)物的組裝。在一些實施方式中,如果在目標(biāo)核酸序列中鑒定到多 個干擾序列特征,有用的策略可涉及在組裝期間分離干擾序列特征。例如,可在涉及多個中 間片段或結(jié)構(gòu)模塊(其被設(shè)計以僅包含少量的干擾序列(例如〇、1、2或3個))的過程中 組裝目標(biāo)核酸。在一些實施方式中,各中間片段或結(jié)構(gòu)模塊可含有最多一種干擾序列特征。 因此,可有效地組裝各中間片段。在一些實施方式中,核酸片段或結(jié)構(gòu)模塊的設(shè)計可排除來 自其5'和/或3'端的干擾序列特征。因此,可從設(shè)計用于組裝反應(yīng)的相鄰起始核酸之間 的互補(bǔ)重疊區(qū)域中排除干擾序列特征。這會防止或減少對序列特異性雜交反應(yīng)的干擾,該 序列特異性雜交反應(yīng)對核酸的正確組裝是重要的。在一些實施方式中,從中間體結(jié)構(gòu)模塊 的3'和/或5'端排除干擾序列特征是足夠的。例如,干擾序列特征可位于來自結(jié)構(gòu)模塊 3'端和/或5'端的至少一個核苷酸處,優(yōu)選位于來自結(jié)構(gòu)模塊3'端和/或5'端的2、3、 4、5或更多個核苷酸(例如5-10、10-15、15-20或更多個核苷酸)處。
[0041] 本發(fā)明的各方面可與體外和/或體內(nèi)核酸組裝步驟聯(lián)用。
[0042] 本文提供的方法和組合物的各方面對增加核酸合成和組裝反應(yīng)的精確性、產(chǎn)率、 通量、和/或成本效益是有用的。本文使用的術(shù)語"核酸"、"多核