條形編碼核酸的制作方法
【專利說(shuō)明】
[0001] 本申請(qǐng)要求2012年11月5日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/722, 357的優(yōu)先權(quán)權(quán)益, 該美國(guó)臨時(shí)申請(qǐng)的全部?jī)?nèi)容以引用的方式并入本文。
[0002] 序列表通過(guò)電子提交而隨本文一起提交并且以引用的方式并入本文,所述序 列表被包含在被命名為" RUBCP0031W0_ST25.txt"的文件中,所述文件是2KB(如在 MicrosoftWindows?中所測(cè)量)并且在2013年11月5日創(chuàng)建。
技術(shù)領(lǐng)域
[0003] 本發(fā)明大體上涉及分子生物學(xué)和核酸測(cè)序的領(lǐng)域。更具體地說(shuō),它涉及條形編碼 (barcoding)核酸的方法。
【背景技術(shù)】
[0004] 條形碼可以被用于鑒定核酸分子,例如其中測(cè)序可以揭示與所關(guān)注的核酸分子連 接的特定條形碼。在一些情況下,可以使用序列特異性事件來(lái)鑒定核酸分子,其中所述條形 碼的至少一部分在所述序列特異性事件中被識(shí)別出,例如所述條形碼的至少一部分可以參 與連接反應(yīng)或延伸反應(yīng)。所述條形碼因此可以允許對(duì)與其連接的gDNA分子進(jìn)行鑒定、選擇 或擴(kuò)增。
[0005] -種使條形碼與所關(guān)注的核酸分子結(jié)合的方法包括制備Ion gDNA片段文庫(kù),如由 生命科技公司(Life Technologies)對(duì)于Ion Torrent系統(tǒng)所述。在這種方法中,使gDNA 的片段與銜接子連接,其中使每一個(gè)基因組DNA片段的至少一端與包含條形碼的銜接子連 接??梢允褂肞CR用針對(duì)所述銜接子的引物對(duì)所連接的銜接子和gDNA片段進(jìn)行切口修復(fù)、 尺寸選擇、以及擴(kuò)增以產(chǎn)生擴(kuò)增的文庫(kù)。舉例來(lái)說(shuō),可以使用包括16種不同的條形碼的連 接銜接子制備16種不同的gDNA樣品,每一種gDNA樣品具有獨(dú)特的條形碼,因此可以將每 一種樣品通過(guò)PCR使用相同的PCR引物單獨(dú)地?cái)U(kuò)增,然后匯集(混合在一起)或者可以首 先將每一種樣品匯集,然后使用相同的PCR引物同時(shí)擴(kuò)增。因此,每一種gDNA樣品可以通 過(guò)它所附接的獨(dú)特的條形碼來(lái)被鑒定。然而,所需的不同的連接銜接子的數(shù)目等于條形碼 的數(shù)目。舉例來(lái)說(shuō),以混合物的形式產(chǎn)生能夠被測(cè)序的256種樣品文庫(kù)將需要256種不同 的連接銜接子。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的實(shí)施方案提供了制備用于測(cè)序的帶雙重條形碼的核酸分子的方法。在核 酸分子的同一端上具有第一條形碼和第二條形碼可以容許測(cè)序讀取從第二條形碼開始,繼 續(xù)經(jīng)過(guò)第一條形碼,然后進(jìn)入到核酸分子中。因此可以在單次讀取中獲得對(duì)第二條形碼、第 一條形碼以及所述核酸分子的序列進(jìn)行的鑒定,而不是不得不使得從核酸分子的每一端進(jìn) 行測(cè)序讀取以從核酸分子的遠(yuǎn)端向后對(duì)單個(gè)條形碼的序列進(jìn)行讀取,正如在使用雙重測(cè)序 條形碼的傳統(tǒng)方法中的情況那樣。
[0007] 因而,本發(fā)明的一個(gè)實(shí)施方案涉及一種制備帶雙重條形碼的核酸分子的方法,所 述方法包括:使莖-環(huán)寡核苷酸的一條鏈與核酸分子結(jié)合以形成第一條形碼結(jié)合的核酸分 子,所述莖-環(huán)寡核苷酸包含分子內(nèi)反向重復(fù)序列和環(huán),所述反向重復(fù)序列包含第一條形 碼;通過(guò)鏈置換或通過(guò)切口平移聚合將所述莖-環(huán)寡核苷酸的一條鏈從所述第一條形碼結(jié) 合的核酸分子中置換,以形成帶第一條形碼的核酸分子;使引物與所述帶第一條形碼的核 酸分子退火,所述引物包括與所述帶第一條形碼的核酸分子互補(bǔ)的第一部分和包含第二條 形碼的第二部分;以及使退火的引物延伸以形成帶雙重條形碼的核酸分子,所述帶雙重條 形碼的核酸分子包含所述第二條形碼、所述第一條形碼、以及所述核酸分子的至少一部分。 在一些方面,所述引物的第一部分與所述第一條形碼或所述第一條形碼的一部分退火。在 其它方面,所述引物的第一部分不在所述第一條形碼內(nèi)退火。可以通過(guò)使用聚合酶,例如經(jīng) 由聚合酶鏈反應(yīng)或PCR來(lái)進(jìn)行延伸。所述核酸分子可以是基因組DNA、cDNA、擴(kuò)增的DNA、核 酸文庫(kù)、或其片段。
[0008] 在本發(fā)明的一個(gè)實(shí)施方案中,存在一種制備核酸分子的方法,所述方法包括:提供 雙鏈核酸分子;以及使莖-環(huán)寡核苷酸的一條鏈與所述雙鏈核酸分子附接以產(chǎn)生寡核苷酸 附接的核酸分子,所述莖-環(huán)寡核苷酸包含反向重復(fù)序列和環(huán)。在一些實(shí)施方案中,所述雙 鏈核酸分子可以是雙鏈DNA分子。在具體實(shí)施方案中,所述附接被進(jìn)一步限定為使所述寡 核苷酸與所述雙鏈核酸分子在所述寡核苷酸附接的核酸分子中產(chǎn)生非共價(jià)接合的條件下 附接,所述非共價(jià)接合如切口、缺口或5'端側(cè)翼結(jié)構(gòu)(flap structure)。在本發(fā)明的具體 方面,所述附接被進(jìn)一步限定為連接(ligating)。連接可以被限定為使所述莖-環(huán)寡核苷 酸銜接子的3'端與所述靶核酸分子的5'端連接。所述方法可以進(jìn)一步包括通過(guò)鏈置換或 通過(guò)切口平移聚合將所述寡核苷酸的一條鏈從所述寡核苷酸附接的核酸分子中置換。在一 個(gè)具體實(shí)施方案中,諸如通過(guò)例如聚合酶鏈反應(yīng)、RNA轉(zhuǎn)錄、或鏈置換使所述寡核苷酸附接 的核酸分子的至少一部分?jǐn)U增。本發(fā)明的方法可以進(jìn)一步包括使與寡核苷酸附接的核酸分 子擴(kuò)增,其中所述莖-環(huán)銜接子的分子內(nèi)反向重復(fù)序列的至少一部分被排除在擴(kuò)增的寡核 苷酸附接的核酸分子之外。
[0009] 連接實(shí)施方案可以被進(jìn)一步限定為包括:在所述雙鏈核酸分子上產(chǎn)生可連接的末 端;在所述莖-環(huán)寡核苷酸上產(chǎn)生可連接的末端;以及使所述莖-環(huán)寡核苷酸的可連接的 末端的一條鏈與所述核酸分子的末端的一條鏈連接,從而在所述寡核苷酸附接的核酸分子 中產(chǎn)生非共價(jià)接合,如切口、缺口、或5'端側(cè)翼結(jié)構(gòu)。在另外的方面,所述方法包括在所述 核酸分子上產(chǎn)生平末端;在所述莖-環(huán)寡核苷酸上產(chǎn)生平末端;以及使所述莖-環(huán)寡核苷 酸的平末端的一條鏈與所述核酸分子的平末端的一條鏈連接,從而在所述寡核苷酸連接的 核酸分子中產(chǎn)生切口。
[0010] 在一些方面,所述方法可以包括使莖-環(huán)寡核苷酸銜接子的一條鏈與靶核酸分子 的每一端連接。在一些方面,與靶核酸分子的每一端連接的莖-環(huán)銜接子的反向重復(fù)序列 可以包含相同的序列。在這個(gè)方面,所述莖-環(huán)銜接子與所述靶核酸分子的每一端的結(jié)合 將產(chǎn)生包含末端反向重復(fù)序列的核酸分子,從而允許所述分子形成莖環(huán)。在其它方面,與靶 核酸分子的每一端結(jié)合的莖-環(huán)銜接子的反向重復(fù)序列可以不包含相同的序列。在這個(gè)方 面,使所述莖-環(huán)銜接子與所述靶核酸分子的每一端結(jié)合將產(chǎn)生缺乏末端反向重復(fù)序列的 核酸分子并且因此所述分子將不能形成莖環(huán)。
[0011] 在另外的實(shí)施方案中,所述寡核苷酸附接的核酸分子包含具有3'端羥基的切口, 其中存在從所述寡核苷酸附接的核酸分子的至少一部分的3'端羥基進(jìn)行的聚合。
[0012] 鏈置換或切口平移聚合可以被進(jìn)一步限定為在環(huán)中或鄰近于環(huán)的莖區(qū)域中的不 可復(fù)制堿基或區(qū)域處停止的聚合。
[0013] 在本發(fā)明的一個(gè)具體方面,所述方法進(jìn)一步包括以下步驟:使用核酸內(nèi)切酶對(duì)雙 鏈DNA分子進(jìn)行消化以產(chǎn)生DNA片段,其中所述寡核苷酸變成與所述DNA片段的一條鏈連 接,并且其中通過(guò)使寡核苷酸連接的DNA片段進(jìn)行在環(huán)中或鄰近于環(huán)的莖區(qū)域中的堿基 或序列處停止的鏈置換或切口平移聚合,所述寡核苷酸連接的DNA片段的聚合排除所述 莖-環(huán)銜接子的分子內(nèi)反向重復(fù)序列的至少一部分。
[0014] 在一些實(shí)施方案中,所述莖-環(huán)寡核苷酸被進(jìn)一步限定為包含可裂解的堿基。具 體來(lái)說(shuō),在一些情況下,所述可裂解的堿基存在于寡核苷酸的環(huán)中或鄰近于環(huán)的莖的序列 中??闪呀獾膲A基或序列可以包含與糖-磷酸骨架或堿基附接的脫堿基位點(diǎn)或序列、六乙 二醇和/或龐大的化學(xué)部分。在具體實(shí)施方案中,所述脫堿基位點(diǎn)或序列是通過(guò)單一溶液 中的一種或多種酶而引入的。在另一個(gè)具體的實(shí)施方案中,所述莖-環(huán)寡核苷酸的環(huán)包含 至少一個(gè)脫氧尿苷。
[0015] 在具體方面,所述莖-環(huán)寡核苷酸的5'端缺少磷酸酯。
[0016] 條形碼還被稱為"條碼",可以基于選擇特定的核酸序列而產(chǎn)生。舉例來(lái)說(shuō), Illumina?測(cè)序可以利用6個(gè)堿基以有效地產(chǎn)生48種不同的條形碼。Ion Torrent測(cè)序儀 (例如Ion Proton?測(cè)序儀或Ion PGM?測(cè)序儀)可以利用6個(gè)堿基產(chǎn)生16種條形碼。在一 些實(shí)施方案中,可以應(yīng)用規(guī)則以產(chǎn)生如下的條形碼,所述條形碼允許即使在測(cè)序期間出現(xiàn) 兩處錯(cuò)誤也可以正確地鑒定不同的條形碼。條形編碼描述于例如美國(guó)專利7, 902, 122和美 國(guó)專利公開2009/0098555中??梢允褂肬. S. 5, 935, 793或US 2010/0227329中所述的方法 通過(guò)引物延伸,例如經(jīng)由PCR,來(lái)?yè)饺霔l形碼。在一些實(shí)施方案中,可以經(jīng)由使用連接將條形 碼摻入到核酸