用鄰接標(biāo)簽序列復(fù)制dna用于基因組和表觀基因組測序的制作方法
【專利摘要】本文提供了用于從模板多核苷酸精確測序和檢測表觀遺傳信息的方法和設(shè)備。也提供了用于長片段鏈置換擴(kuò)增多核苷酸的方法、具有用于多步處理的選擇性可滲透屏障的微流體設(shè)備,和使用微流體設(shè)備進(jìn)行多核苷酸擴(kuò)增的方法。
【專利說明】用鄰接標(biāo)簽序列復(fù)制DNA用于基因組和表觀基因組測序
相關(guān)申請的交叉引用
本申請要求2013年11月15日提交的美國申請?zhí)?1/904,637的優(yōu)先權(quán),其內(nèi)容通過參考以其整體并入本文。
發(fā)明背景
本公開屬于DNA擴(kuò)增和測序,以及微流體處理設(shè)備的領(lǐng)域。理想地,基因組測序可以低成本實(shí)現(xiàn)單細(xì)胞的基因組和表觀基因組序列的100%精確度和端對端鄰接(end-to-endcontiguity)。
不清楚目前的納米孔測序技術(shù)是否能夠以低成本實(shí)現(xiàn)快速從頭基因組測序(de novogenome sequencing)的測序序列(read)長度、精確度和通量(Branton等2008 ; Cherf等2012;Clarke等2009;Kumar等2012;Manrao等2012;McNalIy等2010;WalIace等2010;Wanunu2012)。由于將DNA捕獲至納米孔中的低效率(Branton等2008 ;Wanunu等2010),在沒有一些樣品制備(包括片段化和擴(kuò)增)的情況下,對單細(xì)胞的基因組測序是不可行的。主要基于通過使用DNA聚合酶的合成進(jìn)行測序的當(dāng)代測序儀就測序通量和精確度而言是引人注意的(例如對于Illumina HiSeq 2500,每次運(yùn)行接近I萬億堿基,對于大部分測序序列具有99.9%的原始精確度(raw accuracy)),盡管相對短的測序序列(幾百堿基或更短)。每堿基(per-base)測序成本也已經(jīng)明顯地快速下降。但是,許多技術(shù)挑戰(zhàn)仍待克服,以就每堿基精確度、組裝的鄰接和單倍型(haplotype)的完全分型(phasing)而言,達(dá)到用于個(gè)性化醫(yī)療的基因組序列的質(zhì)量(Baker等2012;Marx 2013)。
首先,使用通過這些高通量測序儀產(chǎn)生的短測序序列(數(shù)百堿基或更短),用具有高度重復(fù)性的序列進(jìn)行基因組的組裝非常具有挑戰(zhàn)性(Baker等2012 ;Bradnam等2013; Li等2010 ;Marx 2013 ; Salzberg等2012;Treangen等2012)。以完全單倍型分辨率(resolut1n),從頭測序和二倍體基因組的組裝更加困難。第二,通過目前的測序技術(shù)可實(shí)現(xiàn)的精確度仍然相對較低(一千萬中I個(gè)錯(cuò)誤的一致性誤差率是最佳報(bào)道(Peters等2012))。測序錯(cuò)誤主要是由于測序化學(xué)的限制,其最多具有99.9%的原始測序序列精確度(即錯(cuò)誤率是10—3),以及通過樣品制備過程,尤其是通過DNA聚合酶的DNA擴(kuò)增,引入的錯(cuò)誤,所述DNA擴(kuò)增通常的錯(cuò)誤率不大于10-6。
單細(xì)胞從頭基因組測序甚至更具有挑戰(zhàn)性,因?yàn)楫?dāng)前的技術(shù)需要來自許多細(xì)胞(取決于平臺(tái),20-10,000個(gè))等同物的DNA輸入(Kalisky等2011)。但是,對單細(xì)胞的基因組測序的能力在基礎(chǔ)生物醫(yī)學(xué)研究中具有非常重要的應(yīng)用,并且在臨床實(shí)踐中對基因組測序的應(yīng)用甚至具有更大的影響(Kalisky等2011)。例如,這允許綜合表征引起正常細(xì)胞分化和疾病,比如癌癥的細(xì)胞異質(zhì)性(Ma等2012 ;Navin等2011、Navin等2011、Potter等2013 ;Powell等2012),使用循環(huán)腫瘤細(xì)胞或細(xì)針活組織檢查、突變檢測而早期檢測癌癥(Lu等2012 ;Wang等2012),用于通過對在IVF診所中植入之前從早期人胚胎提取的單細(xì)胞的全基因組測序而進(jìn)行遺傳篩選(Lorthongpanich等2013 ;Martin等2013; Zhang等2013)。在后者的情況下,僅僅一個(gè)或非常少幾個(gè)細(xì)胞是可用的,并且測序和單倍型精確度是最重要的,因?yàn)榻Y(jié)果將直接影響新生兒的生命。需要以最高的精確度鑒定母本和父本染色體的兩個(gè)等位基因的遺傳缺陷。
在從頭單細(xì)胞基因組測序之前,可擴(kuò)增基因組DNA。理想地,使用的方法以全覆蓋和非常小的偏差從細(xì)胞擴(kuò)增整個(gè)基因組。數(shù)種技術(shù)可用于該目的。常用的MDA(多重置換擴(kuò)增)方法(Dean等2002 ;Lage等2003)通常導(dǎo)致非常大的覆蓋偏差,具有多達(dá)四個(gè)數(shù)量級(jí)的變異,以及某些序列的頻繁丟失。用于單細(xì)胞全基因組擴(kuò)增的MALBAC(多次退火環(huán)狀循環(huán)擴(kuò)增,Multiple Annealing and Looping Based Amplificat1n Cycles)(Lu等2012;Zong等2012)和MIDAS(MIcrowell置換擴(kuò)增系統(tǒng))(GoIe等,Nature B1tech,印刷中)是較好的(Fan等2011、Gole等Nature B1tech.1n press、Zong等2012),但是就序列覆蓋度和偏差以及擴(kuò)增錯(cuò)誤(突變和嵌合體的產(chǎn)生)而言,它們?nèi)跃哂芯窒扌裕@是成問題的。這些導(dǎo)致不完全的組裝、浪費(fèi)以及更高的測序成本(高一個(gè)或多個(gè)數(shù)量級(jí)),原因是需要許多倍的覆蓋度,以獲取低豐度序列。許多突變和嵌合體也導(dǎo)致組裝和測序錯(cuò)誤(Lasken等2007 ;Voet等2013)。另夕卜,這些技術(shù)都未提供分辨單倍型的機(jī)制。
這些技術(shù)至少在概念上源自開創(chuàng)性的滾環(huán)擴(kuò)增(RCA)技術(shù)(Lizardi等1998)。通過RCA擴(kuò)增基本上是無錯(cuò)誤的,因?yàn)橥ㄟ^滾環(huán)鏈置換機(jī)制,使用高保真DNA聚合酶,由單引物重復(fù)復(fù)制相同的初始環(huán)狀DNA模板。我們已經(jīng)開發(fā)了不依賴于序列和長度的線性DNA擴(kuò)增的方法,其使用切割內(nèi)切核酸酶介導(dǎo)的鏈置換擴(kuò)增(nicking endonuclease-mediated stranddisplacement amplificat1n) (Joneja等2011)。使用切割內(nèi)切核酸酶是不理想的,因?yàn)榛蚪M中有許多識(shí)別序列。本文所述的長片段鏈置換擴(kuò)增(Long Range StrandDisplacement Amplificat1n,LR-SDA)技術(shù)被設(shè)計(jì),從而通過使用獨(dú)特的機(jī)制來克服上述限制。LR-SDA與其他方法截然不同,因?yàn)閺姆磻?yīng)溶液中去除了游離引物并且在過程中不產(chǎn)生游離3’端,防止了嵌合體形成。LR-SDA能夠?qū)崿F(xiàn)在非常長的重疊片段中進(jìn)行DNA的基本上無錯(cuò)誤的擴(kuò)增,其利于基因組序列的精確測序和單倍型分型(haplotyping)。
新一代的測序技術(shù)已經(jīng)實(shí)現(xiàn)了以空前的高通量和精確度進(jìn)行DNA測序,并且也已經(jīng)大大降低了每個(gè)堿基的測序成本。需要的是下述能力:獲取鄰接信息以重新分型單倍型并且組裝基因組,以及提高一致性測序序列精確度,達(dá)到可以以無錯(cuò)誤地完全端對端組裝對基因組測序的程度。
【發(fā)明內(nèi)容】
本文提供了一種技術(shù)平臺(tái),其包括新方法和裝置,用于以完全的單倍型分辨率和超高精確度對單細(xì)胞進(jìn)行從頭基因組測序。策略是用成對的鄰接標(biāo)簽序列復(fù)制DNA區(qū)段,以實(shí)現(xiàn)確定地組裝,和測序并且獨(dú)立地組裝相同DNA分子的兩條鏈,以改提高精確度。該平臺(tái)的核心部分是稱為“標(biāo)簽序列化鄰接復(fù)制(Barcoding Contiguity Replicat1n,BCR)''的技術(shù)。在BCR中,雙鏈DNA分子的兩條鏈均以區(qū)段被復(fù)制,并且區(qū)段與獨(dú)特的鄰接標(biāo)簽序列硬連接。不像之前的方法,復(fù)制不需要對初始DNA分子片段化或任何其他損傷。一旦具有標(biāo)簽序列的區(qū)段被測序,簡單查找區(qū)段兩端的成對的標(biāo)簽序列便允許確定地連接區(qū)段,從而分別組裝每條鏈而不必依賴于重疊序列的比對。相同DNA分子的兩條鏈的獨(dú)立測序以及組裝提供了冗余信息,用于糾正錯(cuò)誤和填充缺口,顯著改善了單倍型分辨的組裝的質(zhì)量和測序精確度。第二個(gè)技術(shù)是稱為長片段鏈置換擴(kuò)增(LR-SDA)的新方法,用于以全覆蓋度和低偏差對單細(xì)胞進(jìn)行無錯(cuò)誤的全基因組擴(kuò)增,其也不需要片段化或損傷初始DNA。由染色體的兩條鏈復(fù)制的長重疊單鏈產(chǎn)物用于進(jìn)給BCR測序管道(pipeline)。第三個(gè)有效的技術(shù)是微流體處理器,其被開發(fā)來使BCR和LR-SDA自動(dòng)化,從而測序就緒(sequencing-ready)文庫可由單細(xì)胞,或包含細(xì)胞或基因組材料,比如RNA或DNA的任何樣品制備,用于使用現(xiàn)有高通量測序平臺(tái)進(jìn)行脫設(shè)備(off-device)測序。
本公開的方法能夠?qū)崿F(xiàn)具有任何長度的DNA區(qū)段的復(fù)制和在任何兩個(gè)相鄰區(qū)段的末端添加獨(dú)特的標(biāo)簽序列對,而不片段化初始DNA分子。本公開的方法允許擴(kuò)增基因組DNA的兩條鏈以及隨后由每條鏈區(qū)段復(fù)制具有鄰接標(biāo)簽序列的擴(kuò)增產(chǎn)物。標(biāo)簽序列允許以長片段或甚至100%鄰接從頭組裝整個(gè)單獨(dú)的DNA分子或染色體。因此,使用可提供足夠的測序序列長度以對復(fù)制的區(qū)段以及區(qū)段兩端的獨(dú)特標(biāo)簽序列測序或可從每一片段兩端和相鄰部分測序的任何測序技術(shù),本公開的方法能夠?qū)崿F(xiàn)對基因組和表觀基因組的從頭測序。
用于片段化DNA同時(shí)用成對的末端標(biāo)簽序列標(biāo)記DNA的僅有的現(xiàn)有技術(shù)依賴于使用酶,尤其是轉(zhuǎn)座酶來片段化和標(biāo)記DNA( Steemers,F(xiàn).等,“Linking sequence reads usingpaired code tags”,公開號(hào)WO 2012/061832 Al,【公開日】:2012年5月10日)。構(gòu)建序列鄰接的其他方法主要依賴于稀釋DNA片段或分子,和隨后比對測序的DNA片段或分子,這對于具有重復(fù)序列的二倍體基因組(例如人基因組)是成問題的,或者對于多倍體基因組(例如植物云杉)甚至是更有問題的。在本公開的方法中,初始DNA從不被片段化和損傷。相同的DNA分子可被使用多次和隨后的表觀基因組測序或其他方法。
本公開的方法提供了相對于現(xiàn)有技術(shù)的許多優(yōu)勢。(I)可以以用鄰接信息標(biāo)簽序列化(barcoded)的區(qū)段復(fù)制初始DNA,而不用片段化或損傷初始DNA,并且該方法可重復(fù)多次。(2)兩條鏈被獨(dú)立地復(fù)制和標(biāo)簽序列化。因此,可獨(dú)立地測序和組裝雙鏈DNA的兩條鏈。這明顯提高測序精確度和以長片段鄰接或以整體對DNA分子或染色體測序的能力。(3)本公開的方法允許在對基因組測序之后以及基因組DNA已經(jīng)被處理(例如通過焦亞硫酸氫鹽(disulfite)處理)之后對表觀基因組測序,以檢測化學(xué)修飾。(4)本公開的方法能夠?qū)崿F(xiàn)靶DNA的線性擴(kuò)增,而不片段化或損傷初始DNAJ5)本公開的方法對于從單細(xì)胞進(jìn)行基因組和表觀基因組測序是理想的。(6)公開的微流體設(shè)備能夠?qū)崿F(xiàn)方法的自動(dòng)化。(7)本公開的方法能夠制備DNA樣品,包括擴(kuò)增和測序文庫構(gòu)建,用于任何測序平臺(tái),包括Illumina HiSeq和MySeq平臺(tái)、Life Technologies 1n Torrent平臺(tái)、Pacific B1sciences SMRT平臺(tái)、納米孔測序以及可能出現(xiàn)的其他平臺(tái)。(8)公開的具有聚合物屏障的微流體設(shè)備對于某些離子和分子(例如,Na+、核苷酸或短寡核苷酸)是選擇性可滲透的,并且能夠?qū)崿F(xiàn)多步物理、化學(xué)和生物化學(xué)過程在僅僅一個(gè)或少數(shù)幾個(gè)微流體室中進(jìn)行。這樣的微流體設(shè)備可用于例如重復(fù)變性、雜交、引物延伸和DNA合成,以及涉及多種試劑交換和洗滌的其他試驗(yàn)。
【附圖說明】
圖1.用于單細(xì)胞的從頭基因組測序的BCR技術(shù)。其圖解了一對同源親本染色體如何被測序,其中單倍型被分辨。CBdPCB1,:具有互補(bǔ)序列的鄰接標(biāo)簽序列對。每個(gè)復(fù)制的區(qū)段在3’和5’端具有兩個(gè)標(biāo)簽序列。通過成對的標(biāo)簽序列給出了區(qū)段之間的連接性。例如,通過查找片段末端的標(biāo)簽序列并且將它們?nèi)缦路诌x,可簡單地組裝父本染色體的頂鏈:--cb2—(CB2’一 CB5) —(CB5’一 CBs)—CBs’一等。在該例子中,BCR允許以完全的鄰接組裝兩個(gè)親本同源單倍染色體的四條單鏈,產(chǎn)生完全單倍型分辨率和高的每堿基測序精確度。示意圖也圖解了核酸的標(biāo)簽序列化鄰接復(fù)制的一般程序以及如何將該方法應(yīng)用至核酸測序。核酸包括雙鏈脫氧核糖核酸(DNA)、核糖核酸(RNA)和DNA/RNA混合物,以及單鏈DNA和RNA。如果核酸是DNA,則DNA聚合酶用于復(fù)制靶分子。如果核酸是RNA,則逆轉(zhuǎn)錄酶用于復(fù)制靶分子。為了清楚起見,雙鏈靶DNA (d sDNA)用于此處的圖解。由鄰接標(biāo)簽序列編碼的雙向引物用于闡釋一般程序。詳細(xì)程序需要下述步驟:I)使雙鏈DNA分子變性,以分開兩條互補(bǔ)鏈。2)使分開的鏈與具有標(biāo)簽序列的寡核苷酸引物池雜交,所述引物各自包含經(jīng)通用連接體序列與獨(dú)特的鄰接標(biāo)簽序列連接的引物。具有標(biāo)簽序列引物的例子描述在圖2中。3)使雜交引物延伸,以使用沒有鏈置換能力的聚合酶復(fù)制靶DNA分子區(qū)段,以到達(dá)鄰近下游引物的5’端。然后,將復(fù)制的片段的3’端連接至鄰近下游具有標(biāo)簽序列的雙向引物的5’端。4)使具有標(biāo)簽序列的復(fù)制的鄰接DNA片段與初始靶DNA分開并且將其找回(retrieved)。如果需要,重復(fù)步驟2至步驟4期望的次數(shù)。組合所有的DNA片段并且使用高通量DNA測序平臺(tái)測序。5)使用鄰接標(biāo)簽序列(并且,如果需要,使用重疊序列)將序列組裝成單獨(dú)的單鏈DNA。使用來自兩條單獨(dú)的鏈的冗余序列糾正由于測序和復(fù)制錯(cuò)誤而產(chǎn)生的錯(cuò)誤。比對兩條互補(bǔ)鏈,以重構(gòu)整個(gè)初始DNA分子或基因組。
圖2.鄰接標(biāo)簽序列化引物和連接信息。該圖闡釋了鄰接標(biāo)簽序列的兩個(gè)設(shè)計(jì)實(shí)施例以及如何通過獨(dú)特的標(biāo)簽序列對提供鄰接連接信息的構(gòu)思。(A)雙向標(biāo)簽序列。(B)單向標(biāo)簽序列。每個(gè)鄰接標(biāo)簽序列經(jīng)連接體序列連接至引物。可也包括接頭序列。每個(gè)鄰接標(biāo)簽序列具有獨(dú)特的序列,長度通常在6至30個(gè)堿基之間,這取決于具體的應(yīng)用。提供標(biāo)簽序列,作為具有大量獨(dú)特的不同序列的寡核苷酸池,所述獨(dú)特的不同序列使用I至4個(gè)堿基(A、C、G和T,或其他核苷酸類似物)的混合物在沿著序列的每個(gè)位置被化學(xué)合成。標(biāo)簽序列總是成對出現(xiàn),其由獨(dú)特的序列和其反向互補(bǔ)序列組成。每個(gè)引物具有隨機(jī)或半隨機(jī)序列之一,所述隨機(jī)或半隨機(jī)序列也是使用I至4個(gè)堿基(A、C、G和T,或其他核苷酸類似物)的混合物在沿著序列的每個(gè)位置被化學(xué)合成。引物的長度可以不同,但是通常在6至20個(gè)堿基之間。(C).每對標(biāo)簽序列提供由靶分子復(fù)制的兩個(gè)相鄰DNA區(qū)段的連接信息??赏ㄟ^匹配在每個(gè)區(qū)段兩端的標(biāo)簽序列與具有反向互補(bǔ)標(biāo)簽序列的區(qū)段,簡單地彼此連接復(fù)制的DNA區(qū)段。在該例子中,CBi ’和CBi鄰接標(biāo)簽序列對將區(qū)段1-Ι連接至區(qū)段i,其接著通過CBj ’和CBj鄰接標(biāo)簽序列對連接至區(qū)段i+1。
圖3.具有成對標(biāo)簽序列的隨機(jī)引物的合成。標(biāo)簽序列成對出現(xiàn),每對由一條獨(dú)特的序列和其反向互補(bǔ)序列組成??稍谑褂弥爱a(chǎn)生標(biāo)簽序列對,或可在BCR過程中復(fù)制互補(bǔ)的標(biāo)簽序列。(A)合成雙向隨機(jī)引物??梢曰瘜W(xué)合成所有的寡核苷酸。如所示,使所有的寡核苷酸雜交,以形成組裝體。如下進(jìn)行互補(bǔ)標(biāo)簽序列的復(fù)制和連接:1)與連接體雜交的序列用作引物,以通過DNA聚合酶合成反向互補(bǔ)標(biāo)簽序列;2)將延伸的產(chǎn)物連接至接頭序列。(B)合成單向隨機(jī)引物。在該情況下,將標(biāo)簽序列對之一連接至用于復(fù)制靶DNA的引物。在該例子中,連接體被設(shè)計(jì)為具有一段均聚物A堿基(例如30個(gè)A)。使引物(例如25個(gè)T)與用作DNA聚合酶弓I物的多聚腺甘酸段雜交。然后,通過DNA聚合酶來酶復(fù)制標(biāo)簽序列。然后,使用DNA連接酶(例如T4DNA連接酶)將復(fù)制的標(biāo)簽序列連接至接頭序列。用于復(fù)制標(biāo)簽序列的連接體寡核苷酸可被設(shè)計(jì)為包含利于其隨后去除的特征,例如,用于通過USER酶進(jìn)行酶降解的若干dU。(C)合成具有發(fā)夾結(jié)構(gòu)的鄰接標(biāo)簽序列化雙向引物。在該情況下,通過發(fā)夾結(jié)構(gòu)連接互補(bǔ)的鄰接標(biāo)簽序列對。發(fā)夾序列可用作接頭。化學(xué)或酶可切割的堿基比如dU堿基可被加入到發(fā)夾序列的中間,用于隨后化學(xué)或酶切割發(fā)夾結(jié)構(gòu)。例如,在dU堿基處的切割可通USER酶實(shí)現(xiàn)。
圖4.用于BCR的雙向和單向方法。一般而言,優(yōu)選添加接頭和其他序列至標(biāo)簽序列化引物,以利于和簡化下游處理,比如擴(kuò)增和測序。(A)雙向引物方法。每條隨機(jī)引物由通過標(biāo)簽序列對保持在一起的兩條序列以及其他序列,比如連接體和接頭序列組成。引物用于使用沒有任何鏈置換能力的DNA聚合酶復(fù)制DNA區(qū)段。然后,將每個(gè)復(fù)制的區(qū)段的3’端通過連接而連接至下游相鄰區(qū)段的5’端。(B)單向引物方法。每條隨機(jī)引物由僅僅一條序列組成并且經(jīng)短的多聚T(例如25個(gè)T)連接至標(biāo)簽序列和其他序列。引物用于復(fù)制DNA。然后,末端脫氧核糖核苷酸轉(zhuǎn)移酶(TdT)用于將短的多聚腺甘酸尾添加至復(fù)制片段的3’端。然后,多聚腺甘酸用作引物,以通過DNA聚合酶復(fù)制連接體。然后,連接體通過連接而被連接至標(biāo)簽序列??蛇x地,具有鏈置換能力的DNA聚合酶用于通過鏈置換DNA合成而復(fù)制連接體和標(biāo)簽序列。
圖5.使用雙向方法的BCR的例子。(A)由作為模板的phiX174ssDNA組成的模型系統(tǒng)用于進(jìn)行BCR反應(yīng)。雙向(BP)引物由通過標(biāo)簽序列保持在一起的兩個(gè)9-堿基序列和測序接頭組成。一條寡核苷酸是34個(gè)堿基長,而另一條是37個(gè)堿基長。下游引物是30個(gè)堿基長,其5’被磷酸化。(B)引物與模板雜交。對于引物延伸DNA合成,使用T4DNA聚合酶如下進(jìn)行反應(yīng):120C,1min; 20 °C,1min ;然后37 °C,2min。對于延伸加連接反應(yīng),然后,與T4DNA聚合酶一起添加T4DNA連接酶,并且在延伸合成之后,反應(yīng)在20°C繼續(xù)進(jìn)行I小時(shí)。在由P1、BP和P2引物復(fù)制之后,由BP引物產(chǎn)生65堿基的片段(紅色框)、由Pl產(chǎn)生143堿基的片段,和由P2產(chǎn)生長的產(chǎn)物。連接產(chǎn)生兩個(gè)產(chǎn)物,Pl和BP之間的131堿基的片段,以及BP和P2之間的另一非常長的片段。(C)使用與BP引物并列的上游20堿基引物(連接I和連接2)以及BP引物的5’端部分(連接3)的簡單連接??捎^察到,產(chǎn)生了 57堿基的產(chǎn)物。BP引物比雙向引物的單5 ’端部分更有效地連接。20mer跑出凝膠而未顯示在凝膠上。
圖6.回收產(chǎn)物的方法和多循環(huán)BCR。使用接頭上的內(nèi)置(built in)引物,通過簡單的鏈置換DNA合成,從初始DNA分子剝離復(fù)制的片段。親和性標(biāo)簽,比如生物素可被連接至接頭引物,以通過親和性捕獲回收BCR產(chǎn)物同時(shí)留下初始DNA分子,用于另一輪的BCR。
圖7.長片段鏈置換擴(kuò)增(LR-SDA)的基本原理。該示意圖闡釋了稱為長片段鏈置換擴(kuò)增(LR-SDA)的方法,用于復(fù)制長DNA分子,而不用片段化或損傷初始DNA分子。整個(gè)過程需要下述步驟:I)使雙鏈DNA分子變性,并且使隨機(jī)引物以期望的平均間隔在控制條件下雜交至分離的ssDNA。通過使用適當(dāng)濃度或適量的總引物來控制相鄰的雜交引物之間的平均距離。距離可在100至2000個(gè)堿基之間,或,如果需要,則更長。2)在雜交的引物使用DNA聚合酶延伸短距離之后,去除過多的未雜交的引物。使用具有高持續(xù)合成能力和強(qiáng)鏈置換能力的DNA聚合酶或不同DNA聚合酶的組合,以重疊片段復(fù)制靶DNA。非常長的片段是期望的。平均長度可以是50,000個(gè)堿基或更多。3)將復(fù)制的長重疊DNA片段與初始DNA模板分開并且收集。這可通過使用變性劑(例如甲酰胺,KOH)或加熱,或變性劑和加熱二者,使雙鏈區(qū)域變性而進(jìn)行。隨機(jī)引物可被設(shè)計(jì)為在5’端包含親和性標(biāo)簽(例如生物素),以便所有復(fù)制的片段均攜帶親和性標(biāo)簽。然后,通過親和性捕獲將片段與初始靶DNA分開。用于該目的的方法和設(shè)備描述在圖8中。如果需要,LR-SDA法可重復(fù)期望的次數(shù),并且所有的擴(kuò)增產(chǎn)物可被組合。
圖8.用于單細(xì)胞基因組和表觀基因組測序的BCR工作流程和微流體處理器。左:工作流程。右上:具有流體通道(中心“I”線)和閥門以及閥門線(水平延伸線)的處理器的照片。右下:具有4個(gè)處理室的區(qū)域的圖解。粗虛線:PDMS層上的流體通道。細(xì)黑線:另一PDMS層上的閥門和控制線。PBl至PB4:具有各種滲透性和表面功能的聚合物屏障。Cl至C4:處理室。El至E4:在結(jié)合PDMS層的玻璃或硅片上制備的電極。如顯示的,該原型具有32個(gè)入口 /出口和4個(gè)處理室。根據(jù)需要,其可被擴(kuò)展而包括另外的模塊,比如流體動(dòng)力學(xué)細(xì)胞陷阱(cell trap)模塊和分饋(fract1nat1n)模塊。
圖9.通過電場和流體動(dòng)力學(xué)流用于單細(xì)胞陷阱的微流體設(shè)備。(A)具有4個(gè)聚合物屏障的設(shè)備。(B)HeLa細(xì)胞的運(yùn)輸和捕獲。(C)流體動(dòng)力學(xué)單細(xì)胞陷阱。(D)在收縮通道(constrict1n channel)的開口處捕獲單個(gè)HeLa細(xì)胞。(E)以稍微不同的尺寸捕獲HeLa細(xì)胞。(F):使用有限元分析(finite element analysis)計(jì)算建模流體流(COMSOL)。大部分流體流線(streamline)被引導(dǎo)至捕獲位點(diǎn)。一旦單細(xì)胞進(jìn)入并且被捕獲,流線則重定向至旁路路徑。
圖10.用于使用可滲透的聚合物屏障的多步驟處理的微流體設(shè)備。(Α)λ基因組DNA通過電場的快速捕獲、釋放和運(yùn)輸。釋放DNA并且以一組速度(group velocity)運(yùn)輸,因?yàn)樽杂扇芤?free-solut1n)中的DNA的電泳移動(dòng)性是非長度依賴性的。(B)使用具有不同滲透性的聚合物操作核酸。使用不同濃度的PA (19:1丙烯酸酰胺:雙)和PEG-DA:19%PA+1% PEG-DA、15 % PA+5 % PEG-DA和20 %PA+10% PEG-DA形成三種聚合物。30_mer寡核苷酸可通過19:1和15:5聚合物運(yùn)輸?shù)遣荒鼙?0:10聚合物運(yùn)輸,而76-堿基tRNA可通過19:1聚合物運(yùn)輸?shù)遣荒鼙?5:5和20:10聚合物運(yùn)輸。顯示來自影片的快照。這表明30-mer可與76-mer tRNA分開。除了具有各種濃度和比例的丙烯酸酰胺單體和交聯(lián)劑的聚丙烯酰胺類聚合物之外,可使用其他聚合物比如瓊脂糖。可定制聚合物屏障的孔隙率或滲透率,以符合具體試驗(yàn)的要求。
圖11.用于基因組測序的LR-SDA和BCR。該示意圖闡釋LR-SDA如何可用于從全基因組擴(kuò)增基因組DNA,以產(chǎn)生長的重疊DNA片段,其然后用于BCR和基因組測序。
圖12.用于表觀基因組測序的BCR。該示意圖闡釋用于DNA的標(biāo)簽序列化鄰接復(fù)制的一般程序,和該方法如何應(yīng)用于表觀基因組測序。該程序需要下述步驟:(I)使用如圖1中描述的BCR方法對靶DNA/基因組測序并且組裝。(2)根據(jù)任何標(biāo)準(zhǔn)方法,用亞硫酸氫鹽處理初始靶DNA。亞硫酸氫鹽處理將未甲基化的胞嘧啶(C)轉(zhuǎn)化成尿嘧啶(U),同時(shí)甲基化的胞嘧啶(Cm)保持完整。(3)然后對亞硫酸氫鹽處理的基因組DNA進(jìn)行BCR并且使用高通量DNA測序平臺(tái)對產(chǎn)物測序。使用鄰接標(biāo)簽序列(并且,如果需要,使用重疊序列的比對)將序列組裝成分開的單鏈DNA。使用冗余序列糾正由于測序和復(fù)制錯(cuò)誤而導(dǎo)致的錯(cuò)誤。比對兩條互補(bǔ)鏈,以重建整個(gè)DNA分子或基因組??赏ㄟ^使用來自兩條單獨(dú)的鏈的冗余信息,進(jìn)行進(jìn)一步的錯(cuò)誤糾正。最后,通過比較亞硫酸氫鹽處理的序列組裝體與初始未處理的序列組裝體,解碼甲基化的C序列,或表觀基因組序列。
發(fā)明詳述
1.介紹
本公開解決了從頭基因組測序中的三個(gè)主要挑戰(zhàn):I)單倍型分型和基因組組裝、2)精確度和3)單細(xì)胞測序。BCR技術(shù)的關(guān)鍵構(gòu)思闡釋在圖1中。首先,分離雙鏈染色體DNA分子的兩條鏈,并且使其與連接獨(dú)特的鄰接標(biāo)簽序列的隨機(jī)引物池雜交。引物延伸,以復(fù)制初始DNA分子。然后,將每個(gè)復(fù)制的區(qū)段的3’端通過連接或其他機(jī)制連接至相鄰區(qū)段的5’端。這樣,區(qū)段與獨(dú)特的成對連接性標(biāo)簽序列硬連接。一旦找回具有標(biāo)簽序列的區(qū)段并且使用高通量測序平臺(tái)對其測序,那么簡單查找在區(qū)段兩端的成對標(biāo)簽序列允許確定地連接區(qū)段,從而分別組裝每條鏈的整個(gè)序列,而不用依賴于重疊序列的比對。相同DNA分子的兩條鏈的獨(dú)立測序和組裝提供了用于糾正錯(cuò)誤和填充缺口的冗余信息,明顯提高了單倍型分辨的組裝的質(zhì)量和測序精確度。
BCR技術(shù)固有地以非常低的樣品輸入(優(yōu)選來自單細(xì)胞或少數(shù)幾個(gè)細(xì)胞)而最佳地工作,因此對于單細(xì)胞的從頭基因組測序是理想的,因?yàn)橛邢薜妮斎胧沟脤λ芯哂袠?biāo)簽序列的區(qū)段進(jìn)行測序從而不中斷地端對端組裝染色體的每條鏈所需的覆蓋深度最小化。實(shí)踐中,期望在一個(gè)反應(yīng)中復(fù)制整個(gè)染色體而沒有任何缺口是不切實(shí)際的,因?yàn)橐镫s交潛在的低效和隨機(jī)性。幸運(yùn)地,初始DNA分子從不被片段化,從而可進(jìn)行多輪BCR。至少,有足夠的覆蓋度來構(gòu)建長片段支架序列(scaffold),以利于單倍型分辨的組裝??紤]到這些,用我們的LR-SDA技術(shù)增強(qiáng)了 BCR方法,用于以全覆蓋度和低偏差進(jìn)行單細(xì)胞的基本上無錯(cuò)誤的全基因組擴(kuò)增。由染色體的兩條鏈復(fù)制的長重疊單鏈產(chǎn)物可用于進(jìn)給BCR測序管道,以提供大量原始測序讀數(shù)。而且,我們不必排除使用序列比對,因?yàn)榇蟛糠中蛄锌赏ㄟ^簡單的比對而相對容易地被組裝。
已經(jīng)提議了成對的編碼標(biāo)記策略(Steemers等2012)。在提議的轉(zhuǎn)座酶標(biāo)記策略中,使用攜帶獨(dú)特的成對標(biāo)簽序列標(biāo)簽的工程化的轉(zhuǎn)座酶,將成對的編碼標(biāo)簽插入基因組DNA中?;蚪MDNA被片段化或破壞。除了序列偏好的已知問題,還需要大量的輸入材料(10,000或更多個(gè)細(xì)胞)。我們的BCR技術(shù)以根本不同和更理想的方式實(shí)施成對的編碼標(biāo)簽策略。值得注意的是,其明顯的優(yōu)勢是不用片段化初始DNA分子和低樣品輸入,其直接導(dǎo)致成本節(jié)省和更高質(zhì)量的組裝,因?yàn)檎一鼐哂谐蓪Φ臉?biāo)簽序列標(biāo)簽的片段需要的測序覆蓋的深度明顯降低??紤]到測序深度,找回具有成對的鄰接標(biāo)簽序列的任何序列的概率與使用的細(xì)胞的數(shù)量或DNA分子的拷貝數(shù)成反比。
使用微流體處理器最佳實(shí)施BCR。本文公開了新的微流體技術(shù),其使得下一代微流體設(shè)備成為可能(Lee等2013)。在微流體通道期望的位置制備具有分子光滑表面的選擇性可滲透的聚合物屏障??蓾B透的聚合物屏障允許通過電場快速操作細(xì)胞和生物分子,以及無縫(seamless)實(shí)施多步驟過程,比如單微流體室中的酶反應(yīng)、洗滌、溶液交換和生物分子分離。也公開了整合的微流體平臺(tái),其用于使BCR和LR-SDA用于對單細(xì)胞進(jìn)行從頭基因組測序。也公開了在具有選擇性可滲透的聚合物屏障的微流體設(shè)備中,使用聚合酶鏈?zhǔn)椒磻?yīng)(等溫),擴(kuò)增DNA的方法。
I1.定義
除非另外定義,否則本文使用的技術(shù)和科學(xué)術(shù)語具有如本領(lǐng)域技術(shù)人員通常理解的相同意思。見,例如,Lackie,Dict1nary of Cell and Molecular B1logy,Elsevier(2007年第4片反);Sambrook等,Molecular Cloning ,A Laboratory Manual ,Cold Springs HarborPress(Cold Springs Harbor,NY 1989)。與本文所述的方法、設(shè)備和材料類似或等同的任何方法、設(shè)備和材料可用于本發(fā)明的實(shí)施。提供下述定義,以利于理解本文頻繁使用的某些術(shù)語,而并不意味著限制本公開的范圍。
模板多核苷酸是用作例如通過DNA或RNA聚合酶復(fù)制的模板的多核苷酸。模板多核苷酸可以是基因組RNA或DNA、質(zhì)粒或任何來源的多核苷酸。模板多核苷酸可以是雙鏈的或單鏈的。雙鏈模板多核苷酸可在復(fù)制之前被變性。 如本文所使用,術(shù)語“復(fù)制”、“擴(kuò)增”、“聚合”、“延伸”等術(shù)語是指制備至少一個(gè)拷貝的模板多核苷酸或其互補(bǔ)序列。單獨(dú)的核苷酸被聚合而形成多核苷酸,通常經(jīng)酶促。DNA和RNA聚合酶通常依賴于引物,并且使開始形成的多核苷酸鏈從雜交至模板多核苷酸的引物延伸。化學(xué)合成可也用于產(chǎn)生隨機(jī)序列或期望序列的多核苷酸。
親和性試劑(affinity reagent)指特異性結(jié)合其相關(guān)親和性試劑并且可用于將與親和性試劑連接的靶分子(例如,核酸)與非靶物質(zhì)分離的任何試劑。例子包括生物素和鏈霉抗生物素、均聚物核酸(例如,多聚腺苷酸和多聚T序列段)、多聚組氨酸和鎳、GST和谷胱甘肽、抗體和抗原(和其特異性結(jié)合片段)、受體和配體(和特其異性結(jié)合片段)等。
術(shù)語“特異性”、“特異性結(jié)合”和類似術(shù)語指這樣的分子,所述分子(例如,多核苷酸或親和性試劑)相比與非靶化合物結(jié)合,以至少2倍更大親和性,例如,至少任意4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、25倍、50倍、或100倍更大的親和性結(jié)合其靶。例如,相比與非靶序列結(jié)合,特異性結(jié)合給定靶序列的引物或親和性試劑通常以至少2倍更大的親和性結(jié)合靶序列。在多核苷酸的情況下,通過互補(bǔ)百分?jǐn)?shù)和互補(bǔ)區(qū)域的長度確定特異性。
“標(biāo)簽序列鄰接復(fù)制引物”或“BCR引物”指本文所述的單向或雙向多核苷酸雙鏈體。BCR弓丨物包括標(biāo)簽序列、一條或兩條引物序列(分別針對單向或雙向),任選的接頭,和任選地連接要素的連接體序列。BCR引物可形成發(fā)夾。例如,在BCR引物“頂部”的鏈(例如,標(biāo)簽序列或接頭鏈)可通過連接體連接。BCR引物在本文也指寡核苷酸對或雙鏈體DNA組裝體。
如本文所使用,術(shù)語“單向”指具有僅僅一條引物序列(即,在雙鏈體DNA組裝體的一條鏈上)的BCR引物。引物可具有待通過聚合酶延伸的游離3’端,或待連接從鄰近BCR引物延伸的多核苷酸的游離5’端?!皢蜗颉笨梢仓钙渲蠦CR引物的僅僅一條鏈被整合到延伸的多核苷酸中的方法。術(shù)語“雙向”指具有兩條引物序列的BCR引物,一條引物序列在雙鏈體DNA組裝體的一條鏈上。雙向BCR引物因此具有待延伸的游離3 ’端,和用于連接延伸的多核苷酸的游離5’端。“雙向”可也指其中BCR引物的兩條鏈被整合到延伸的多肽中的方法。
術(shù)語“接頭”指可用于分離,或作為擴(kuò)增或測序引物的模板的已知序列。典型地,接頭包括約4-50、8-20或10-25個(gè)核苷酸。接頭可也連接至親和性試劑。
術(shù)語“標(biāo)簽序列”指用于鑒別多核苷酸序列在模板多核苷酸上的相對位置的獨(dú)特的多核苷酸序列(例如,4-25、10-22、5-15個(gè)核苷酸)。該術(shù)語可指單鏈多核苷酸的雙鏈體,或雙鏈體的任一單獨(dú)的互補(bǔ)鏈。
“核酸”或“寡核苷酸”或“多核苷酸”指共價(jià)連接在一起的至少兩個(gè)核苷酸。術(shù)語核苷酸通常指單體。寡核苷酸(例如,引物)的長度通常從約5、6、7、8、9、10、12、15、25、30、40、50或更多個(gè)核苷酸上至約100個(gè)核苷酸。核酸和多核苷酸是具有任何長度的聚合物,所述長度包括更長的長度,例如,200、300、500、1000、2000、3000、5000、7000、10,000 等。核酸一般包含磷酸二酯鍵,但是在一些情況下,包括核酸類似物,所述核酸類似物可具有交替的骨架,包括,例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基亞氨基磷酸酯(O-methylphophoroamidite)鍵(見Eckstein,01igonucleotides and Analogues: APractical Method,Oxford University Press);和肽核酸骨架和鍵。其他類似物核酸包括具有正骨架、非離子骨架和非核糖骨架的那些,包括美國專利號(hào)5,235,033和5,034,506以及ASC Symposium Series 580,Carbohydrate Modificat1ns in Antisense Research,Sanghui&Cook編輯,6和7章中描述的那些。包含一個(gè)或多個(gè)碳環(huán)糖的核酸也包括在核酸的一個(gè)定義中。可出于各種原因修飾核糖-磷酸骨架,例如,以增加這樣的分子在生理學(xué)環(huán)境中或作為生物芯片上的探針的穩(wěn)定性和半衰期。可制備天然存在的核酸和類似物的混合物,可選地,可制備不同核酸類似物的混合物,以及天然存在的核酸和類似物的混合物。
術(shù)語“探針”或“引物”或“引物序列”指與感興趣的多核苷酸(例如,模板多核苷酸、接頭等)雜交的一個(gè)或多個(gè)核酸片段。探針或引物可以具有任何長度,這取決于其將應(yīng)用的具體的技術(shù)。例如,PCR引物,或用于啟動(dòng)聚合的引物通常長度是4-40或10-30個(gè)核苷酸,而核酸探針通常更長并且長度可大于100個(gè)核苷酸。探針或引物可以是未標(biāo)記的或標(biāo)記的(例如,用親和性試劑或可檢測的標(biāo)簽標(biāo)記)。本領(lǐng)域技術(shù)人員可調(diào)整與靶向的多核苷酸雜交的引物或探針的長度和復(fù)雜性,以針對提供最佳雜交和針對給定雜交程序的信號(hào)產(chǎn)生,并且提供必要的分辨率和嚴(yán)格性。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,具體引物和探針的精確序列可在一定程度上被修飾,或不與靶向的多核苷酸完全互補(bǔ),但是保持結(jié)合(例如,特異性雜交)至靶向的多核苷酸的能力。例如,可產(chǎn)生具有隨機(jī)序列的引物,并且用于以比與已知序列100%互補(bǔ)的引物更低的嚴(yán)格性與未知的序列雜交。
“缺乏鏈置換活性”的核酸聚合酶指隨著其沿著模板多核苷酸移動(dòng)而基本上不能置換現(xiàn)有封阻鏈(blocking strand)的聚合酶。例子包括T4、T7、工程化的嗜熱Phus1r^PQ5DNA聚合酶。本領(lǐng)域技術(shù)人員理解,術(shù)語“缺乏(lacking)”很少是絕對的,因此,缺乏鏈置換活性的聚合酶可在某些條件下以14-1O12例子中一個(gè)的概率置換封阻核苷酸。另一方面,具有鏈置換活性的核酸聚合酶隨著其沿著模板多核苷酸移動(dòng)而置換現(xiàn)有封阻鏈。例子包括BstDNA聚合酶(大片段)、Phi29DNA聚合酶和測序酶V2.0。
可滲透的聚合物屏障指這樣的聚合物基質(zhì),所述聚合物基質(zhì)通過簡單的擴(kuò)散或在電泳力下,對某些化學(xué)實(shí)體或分子是選擇性可滲透的,但是對大分子是較不可滲透的或不可滲透的。例子是通過聚合19%丙烯酰胺單體和I %N,N’_亞甲基雙丙烯酰胺交聯(lián)單體產(chǎn)生的20%的聚丙烯酰胺的聚合凝膠基質(zhì)。這樣的聚合物對于小的無機(jī)和有機(jī)離子(例如,鈉離子、氯化物離子、三(羥甲基)氨基甲烷、2-(N-嗎啉代)乙磺酸離子)和小的聚合電解質(zhì)(例如,6-20mer寡核苷酸)是可滲透的,但是對于大的生物分子,比如1000核苷酸長的DNA分子是非常不或幾乎不可滲透的。聚合物通常通過聚合單體和交聯(lián)劑產(chǎn)生。單體包括但不限于丙烯酰胺、丙烯酸、乳酸和它們的衍生物。交聯(lián)劑包括但不限于N,N’_亞甲基雙丙烯酰胺、具有各種長度(PEG-DA)的聚乙烯連接體的二丙烯酸酯和雙丙烯酰胱胺。單體和交聯(lián)劑也可以是包含官能團(tuán)的衍生物,包括但不限于伯氨基(-冊2)、羧基(-C00H)、巰基(-SH)、疊氮基(-N3)、炔基、生物素、馬來酰亞胺等。具有不同孔隙率或滲透率的聚合物屏障可由本領(lǐng)域技術(shù)人員通過改變單體和交聯(lián)劑的濃度而制備。例如,可使用5 %、10 %、15 %、20 %、25 %、30 %、40%或更高濃度的聚丙烯酰胺,同時(shí)丙烯酰胺與雙丙烯酰胺的比例的范圍是從100:1、50:
1、40:1、30:1、25:1、20:1、10:1、5:1、1:1至0:1。
II1.BCR化學(xué)(BCR Chemistry)
如圖1中闡釋,BCR過程是相對直接的。要考慮的關(guān)鍵要素包括:(I)具有獨(dú)特的鄰接標(biāo)簽序列的引物的設(shè)計(jì)和合成、(2)基因組DNA的復(fù)制、(3)標(biāo)簽序列的連接或復(fù)制、(4)BCR產(chǎn)物的找回和測序和(5)使用成對的標(biāo)簽序列標(biāo)簽進(jìn)行序列組裝。
A.用鄰接標(biāo)簽序列和BCR方法設(shè)計(jì)和合成引物
首先,標(biāo)簽序列的總數(shù)需要足以使每一標(biāo)簽序列對是獨(dú)特的。假設(shè)以平均長度為600個(gè)堿基的區(qū)段復(fù)制的120億堿基(1.2xl01()堿基)的二倍體人基因組(每個(gè)同源染色體對中4條鏈的幾乎所有堿基),則待復(fù)制的區(qū)段的總數(shù)是2千萬(2xl07)。如果我們提供一百萬倍過量的標(biāo)簽序列,則需要的獨(dú)特編碼(code)的總數(shù)是2xl013(?30皮摩爾)。實(shí)踐中,可能沒必要使用如此大的過量。即使這樣,該大量的獨(dú)特編碼可使用具有隨機(jī)序列的22-堿基長的寡核苷酸編碼(422 = 1.8xl013)。使用l-μ摩爾級(jí)(scale)的寡核苷酸合成,可非常便宜(〈$100)地產(chǎn)生上述量的30,000倍。具有隨機(jī)序列的10至25-堿基長的寡核苷酸可用于編碼標(biāo)簽序列。第二,具有隨機(jī)序列的引物用于與靶DNA雜交,以進(jìn)行復(fù)制。在大部分全基因組擴(kuò)增策略,比如]\?從和00?-?0?(4?^8011等2008汀61611丨118等1992)中,長度是6至15個(gè)堿基的隨機(jī)引物是常用的。我們的設(shè)計(jì)根據(jù)用于復(fù)制和標(biāo)簽序列連接的機(jī)制而受到限制??赏ㄟ^許多方法設(shè)計(jì)和合成具有鄰接標(biāo)簽序列的引物。兩個(gè)設(shè)計(jì)實(shí)施例描繪在圖2A和圖2B中。圖2C圖解了如何通過鄰接標(biāo)簽序列對提供連接信息。在該例子中,成對的標(biāo)簽序列CB1’和CB1提供了用于將復(fù)制區(qū)段1-Ι連接至復(fù)制區(qū)段i的物理連接信息,復(fù)制區(qū)段i進(jìn)而又通過另一對標(biāo)簽序列CBj,和CBj連接至復(fù)制區(qū)段i+Ι。
可由本領(lǐng)域技術(shù)人員產(chǎn)生具有標(biāo)簽序列的引物。圖3中示意性描述了用于合成引物的兩種方法。可相對容易地合成具有鄰接標(biāo)簽序列的引物。所有的寡核苷酸可被合成化學(xué)。通過酶DNA合成,使用與常用連接體序列雜交的常用引物,復(fù)制標(biāo)簽序列。來自3’端的兩個(gè)或更多個(gè)堿基被設(shè)計(jì)為包含硫代磷酸酯,而不是通常的磷酸二酯鍵,以使它們抵抗通過DNA聚合酶的3’至5’核酸外切酶校正活性而導(dǎo)致的移除。可類似地設(shè)計(jì)接頭序列。隨機(jī)引物的長度的范圍是6至12個(gè)堿基。雖然不是絕對必要的,但是可添加連接體和接頭序列(例如Illumina接頭),以利于下游處理。連接體序列可也用于指示或追蹤DNA鏈。應(yīng)理解,也可使用其他方法。
用于BCR的兩種方法闡釋在圖4中。每種方法都具有優(yōu)勢和劣勢。雙向方法提供了實(shí)施上更大的的簡單化。復(fù)制和連接可在一個(gè)步驟中進(jìn)行。因?yàn)槊織l隨機(jī)引物均由兩條隨機(jī)序列組成,總體引發(fā)序列的有效長度可能更長,并且兩條序列不完美的雜交可能是問題。BCR化學(xué)的效率取決于引物設(shè)計(jì)、雜交過程和隨后的酶反應(yīng)。我們用該方法的初步研究顯示了成功。另一方面,單向方法提供了較簡單的引物設(shè)計(jì)。與MDA類似,6至9個(gè)堿基長的隨機(jī)引物將有效發(fā)揮作用。25-至30-堿基長的多聚T可用作連接體。挑戰(zhàn)是克服在通過TdT添加多聚腺甘酸尾以借助于DNA合成引發(fā)標(biāo)簽序列復(fù)制過程中的低效和變化。雖然通過TdT進(jìn)行多核苷酸加尾是常用的技術(shù),但是在3’-凹入端添加多核苷酸不是非常有效的方法,并且影響B(tài)CR化學(xué)的效率??蛇M(jìn)一步優(yōu)化和改善該化學(xué)的效率。應(yīng)理解,其他方法可也用于實(shí)施BCR構(gòu)思。
在BCR中,使用的DNA聚合酶不應(yīng)具有任何鏈置換能力。許多聚合酶,包括嗜溫T4和T7DNA聚合酶和工程化的嗜熱Phus1n和Q5DNA聚合酶可用于該應(yīng)用。偶然地,這些聚合酶具有3 ’ -5 ’校正活性和高保真度(錯(cuò)誤率為?10—6,與phi29DNA聚合酶類似)。大部分DNA聚合酶和連接酶(例如T4DNA連接酶)可有效使用短至6個(gè)堿基的引物。
一種考慮是標(biāo)簽序列和接頭序列是否明顯改變引物的性能,比如雜交和酶的利用。為了研究該問題,由5.4kb單鏈環(huán)形phiX174病毒粒子DNA和連接至標(biāo)簽序列和接頭序列的短寡核苷酸引物組成的簡單的模型系統(tǒng)用于測試方法。如圖5中顯示,引物可有效被DNA聚合酶和DNA連接酶使用并且雙向方法很有效。對于單向方法,如上面提到的,通過TdT添加多核苷酸不是如此有效。類似的簡單模型系統(tǒng)可用于研究BCR化學(xué)的各種引物設(shè)計(jì)和酶反應(yīng)。
B.產(chǎn)物回收和多循環(huán)BCR
可設(shè)計(jì)引物,以利于產(chǎn)物的簡單回收。如圖6中顯示,使用phi29DNA聚合酶的簡單的鏈置換反應(yīng)將產(chǎn)物轉(zhuǎn)化成dsDNA并且將其從模板剝離。然后通過連接在如本文所描述的微流體處理器的聚合物屏障表面上的鏈霉抗生物素捕獲產(chǎn)物。一旦回收了產(chǎn)物,初始DNA被運(yùn)輸回來,用于另一輪的BCR。對單細(xì)胞進(jìn)行兩個(gè)循環(huán)或更多循環(huán)的BCR。目的是三重的:I)補(bǔ)償由于引物雜交的隨機(jī)性而導(dǎo)致的低效和變化,2)增加用于下游處理和測序的模板的數(shù)量,3)提供更多冗余,用于更高精確度。但是,考慮到測序覆蓋的深度,循環(huán)數(shù)可限于數(shù)個(gè)循環(huán)(2-10),以使具有成對的標(biāo)簽序列的片段的回收最大化。
C.單細(xì)胞的全基因組BCR
可使用由合成寡核苷酸和短的DNA模板組成的簡單模型系統(tǒng),然后連續(xù)稀釋phiX174ssDNA,來優(yōu)化BCR化學(xué)。在該情況下,BCR化學(xué)的表征在IlluminaMySeq或其他高通量測序平臺(tái)上需要少于單條帶(lane)。各種引物設(shè)計(jì)和BCR化學(xué)可被非常廣泛和便宜地表征。通過一組標(biāo)準(zhǔn)評(píng)估BCR化學(xué)的性能:I)沿著DNA分子的BCR片段的長度和位置分布,2)覆蓋百分?jǐn)?shù),3)具有匹配的成對標(biāo)簽序列的片段的百分?jǐn)?shù),和(4)可通過成對的標(biāo)簽序列的簡單的查找和分選而組裝的重疊群(contig)的長度。一旦BCR化學(xué)被確認(rèn),利用微流體處理器,方案用于單個(gè)人細(xì)胞的全基因組BCR,在這第V和VI部分更詳細(xì)描述。
D.BCR的概述
本文提供了復(fù)制模板多核苷酸的方法,其不片段化或損傷模板多核苷酸。在一些實(shí)施方式中,該方法包括(a)使模板多核苷酸與多個(gè)寡核苷酸對接觸,其中每個(gè)寡核苷酸對的每個(gè)成員包括獨(dú)特的標(biāo)簽序列,其與其在寡核苷酸對的另一成員上的互補(bǔ)序列雜交,并且其中寡核苷酸對之一或兩者包括與模板多核苷酸雜交的引物序列,(b)使模板多核苷酸和多個(gè)寡核苷酸對與缺乏鏈置換活性的聚合酶和對于聚合必要的試劑接觸,和(c)允許多核苷酸鏈從引物序列的3’端延伸,以產(chǎn)生延伸的多核苷酸,其包括標(biāo)簽序列、引物序列和與模板多核苷酸互補(bǔ)的序列,從而復(fù)制模板多核苷酸。在一些實(shí)施方式中,每個(gè)成員進(jìn)一步包括接頭序列,其任選地連接至親和性試劑。在一些實(shí)施方式中,每個(gè)成員進(jìn)一步包括至少一種連接體序列。在一些實(shí)施方式中,寡核苷酸對通過連接體連接,以在相對引物序列的端上形成發(fā)夾。在一些實(shí)施方式中,如果雙向引物用于復(fù)制,則步驟(C)進(jìn)一步包括通過酶或化學(xué)連接將延伸的多核苷酸連接至相鄰的下游具有標(biāo)簽序列的引物,或者如果單向具有標(biāo)簽序列的引物用于復(fù)制,則通過添加短的均聚物多核苷酸,使用末端脫氧核糖核苷酸轉(zhuǎn)移酶以引發(fā)在單向引物上的序列,并且使用DNA聚合酶合成互補(bǔ)的標(biāo)簽序列和接頭序列,將延伸的多核苷酸連接至相鄰的下游具有標(biāo)簽序列的引物。
在一些實(shí)施方式中,方法進(jìn)一步包括(d)收集延伸的多核苷酸(例如,使用親和性試劑或根據(jù)尺寸,例如使用如本文所描述的微流體設(shè)備)。在一些實(shí)施方式中,方法進(jìn)一步包括
(e)對延伸的多核苷酸測序。在一些實(shí)施方式中,方法進(jìn)一步包括(f)基于獨(dú)特的標(biāo)簽序列組裝延伸的多核苷酸的序列。
在一些實(shí)施方式中,方法進(jìn)一步包括在步驟(a)之前,使模板多核苷酸變性。在一些實(shí)施方式中,方法進(jìn)一步包括允許多個(gè)寡核苷酸對與模板多核苷酸雜交,并且在步驟(a)和
(b)之間洗掉未雜交的寡核苷酸對。 在一些實(shí)施方式中,模板多核苷酸是基因組DNA。在一些實(shí)施方式中,方法進(jìn)一步包括檢測基因組DNA上甲基化的或其他化學(xué)修飾的核苷酸。
在一些實(shí)施方式中,寡核苷酸對的兩個(gè)成員均包括與模板多核苷酸雜交的引物序列。在一些實(shí)施方式中,寡核苷酸對的一個(gè)成員包括與模板多核苷酸雜交的引物序列。在一些實(shí)施方式中,引物序列是隨機(jī)引物序列。本領(lǐng)域技術(shù)人員認(rèn)識(shí)到,在使用隨機(jī)引物的情況下,寡核苷酸對的僅僅一條引物序列將與模板多核苷酸雜交。在一些實(shí)施方式中,引物不是隨機(jī)的,但是被設(shè)計(jì)為與模板上已知的序列雜交。
在一些實(shí)施方式中,接頭序列與預(yù)定的引物序列互補(bǔ)(例如,用于檢測、測序或擴(kuò)增)。
IV.用于全基因組擴(kuò)增的LR-SDA化學(xué)
[0056]LR-SDA技術(shù)被設(shè)計(jì)為通過使用獨(dú)特機(jī)制克服用于單細(xì)胞的全基因組擴(kuò)增的現(xiàn)有方法,包括之前描述的DOP-PCR、MDA、MALBAC和MIDAS,的許多限制。LR-SDA的基本原理闡釋在圖7中。首先,引物沿著ssDNA在單個(gè)事件中雜交。通過高保真DNA聚合酶,來自多個(gè)引物的長片段鏈置換導(dǎo)致多次擴(kuò)增每條序列。已知,SDA是較不序列依賴性的,因此全基因組可非常均勻地被擴(kuò)增。第二,由初始DNA分子復(fù)制長的線性s sDNA產(chǎn)物,從而不再傳播由DNA聚合酶產(chǎn)生的錯(cuò)誤(錯(cuò)誤率是?1x10—6)。假設(shè)聚合酶錯(cuò)誤是隨機(jī)分布的,它們可使用冗余覆蓋度度來糾正,導(dǎo)致基本上無錯(cuò)誤的擴(kuò)增(三重覆蓋的一致性錯(cuò)誤率〈10—18)。第三,因?yàn)椴淮嬖谟坞x引物并且不產(chǎn)生游離3’端(產(chǎn)物僅僅具有游離的5’端),所以不產(chǎn)生嵌合體。第四,通過間隔隨機(jī)引物和擴(kuò)增時(shí)間,可在一定程度上控制產(chǎn)物的重疊覆蓋和長度?;谖覀兪褂铆h(huán)狀DNA模板(相當(dāng)于無限長的線性DNA)的經(jīng)驗(yàn),在I小時(shí)內(nèi)可容易產(chǎn)生長達(dá)50至10kb的單鏈產(chǎn)物。如果引物以500個(gè)堿基的平均距離間隔開和平均產(chǎn)物長度是50,000個(gè)堿基,則實(shí)現(xiàn)100倍擴(kuò)增。最后,因?yàn)槌跏糄NA分子沒有被片段化,因此,如果需要,可進(jìn)行多循環(huán)的LR-SDA0
LR-SDA與其他方法的根本上不同在于從反應(yīng)溶液去除了游離引物并且在過程中不產(chǎn)生游離3’端,防止了嵌合體形成。但是,為了確保隨機(jī)引物的初始雜交,必須使用大量過量的引物。過多引物的去除對于實(shí)踐上的實(shí)施是挑戰(zhàn)。本文所述的具有聚合物屏障的微流體技術(shù)的開發(fā)部分受該復(fù)雜性的激發(fā)(Lee等2013)。利用這種突破的微流體技術(shù),LR-SDA可實(shí)現(xiàn)單細(xì)胞全基因組擴(kuò)增。引物設(shè)計(jì)是本領(lǐng)域已知的。而且,為了利于下游處理,親和性標(biāo)簽(例如生物素)和任選的接頭序列可連接至6至12個(gè)堿基長的隨機(jī)引物,在3’端的最后兩個(gè)堿基處具有抗內(nèi)切核酸酶硫代磷酸二酯鍵。Phi29DNA聚合酶和/或測序酶V2.0可用于鏈置換合成。環(huán)狀phiX174病毒粒子DNA模板可用作模型系統(tǒng),以優(yōu)化化學(xué)??赏ㄟ^堿凝膠電泳和單分子拉伸(stretching)和成像初始分析LR-SDA產(chǎn)物。方案可用于單個(gè)人細(xì)胞的LR-SDA??赏ㄟ^單分子拉伸和成像量化產(chǎn)物長度和分布。qPCR可用于分析隨機(jī)選擇的基因組的區(qū)域,以量化均勾性和覆蓋度。LR-SDA可被開發(fā)為用于許多應(yīng)用的單機(jī)(stand-alone)技術(shù)。在本文中,其用于通過實(shí)現(xiàn)無錯(cuò)誤的全基因組擴(kuò)增來強(qiáng)化BCR化學(xué)。關(guān)于使用微流體處理器的單細(xì)胞的全基因組LR-SDA的進(jìn)一步的實(shí)驗(yàn)細(xì)節(jié)描述在V.3部分中。
本文提供了用于擴(kuò)增模板多核苷酸的方法,其不片段化或損傷模板多核苷酸。在一些實(shí)施方式中,方法包括(a)使模板多核苷酸與多個(gè)引物接觸,(b)使模板多核苷酸和多個(gè)引物與具有鏈置換活性的聚合酶和對于聚合必要的試劑接觸,和(C)允許多核苷酸鏈從與模板多核苷酸雜交的多個(gè)引物中的至少一個(gè)多個(gè)引物的3’端延伸,以產(chǎn)生伸長的擴(kuò)增產(chǎn)物,從而擴(kuò)增模板多核苷酸。
在一些實(shí)施方式中,方法進(jìn)一步包括在步驟(a)之前使模板多核苷酸變性。在一些實(shí)施方式中,方法進(jìn)一步包括允許多個(gè)引物與模板多核苷酸雜交,并且在步驟(a)和(b)之間洗掉未雜交的引物。在一些實(shí)施方式中,步驟(C)包括允許延伸達(dá)預(yù)定的時(shí)間,以產(chǎn)生部分伸長的擴(kuò)增產(chǎn)物,洗掉未雜交的引物,添加具有鏈置換活性的聚合酶和對于聚合必要的試劑,和允許延伸繼續(xù)。
在一些實(shí)施方式中,引物是隨機(jī)引物。在一些實(shí)施方式中,每條引物被連接至親和性試劑。在一些實(shí)施方式中,方法進(jìn)一步包括親和純化伸長的擴(kuò)增產(chǎn)物。在一些實(shí)施方式中,方法進(jìn)一步包括基于尺寸分離伸長的擴(kuò)增產(chǎn)物(例如,使用如本文所描述的微流體設(shè)備、電泳或?qū)游龇?。在一些實(shí)施方式中,在通過親和純化或分離去除伸長的擴(kuò)增產(chǎn)物之后重復(fù)步驟
(a)-(c)。在一些實(shí)施方式中,具有與模板上已知的序列雜交的序列的引物可用于選擇性擴(kuò)增。
V.實(shí)現(xiàn)單細(xì)胞基因組的從頭測序的微流體平臺(tái)
示例性BCR工作流程描述在圖8中。使用全自動(dòng)微流體處理器是理想的,為了如下若干原因:I)實(shí)現(xiàn)自動(dòng)單細(xì)胞捕獲和運(yùn)輸;2)通過降低表面與材料比,使樣品損失最小化;3)通過使用小的反應(yīng)體積,使反應(yīng)效率最大化(Marcy等2007) ;4)實(shí)現(xiàn)不適宜或難以在管中進(jìn)行的多步過程;5)消除由于操作人員而導(dǎo)致的差異;和6)加速過程和減少試劑和勞動(dòng)力成本??墒褂镁哂芯酆衔锲琳系奈⒘黧w處理器(圖9和圖10)(Lee等2013)。所有的過程可在單個(gè)處理器中進(jìn)行,在擴(kuò)增步驟之前不需要樣品轉(zhuǎn)移,實(shí)現(xiàn)了以無縫的和自動(dòng)方式由單細(xì)胞快速、有效和可靠地制備測序就緒的文庫。
A.微流體處理器:總體設(shè)計(jì)、制造和操作。
已經(jīng)設(shè)計(jì)了具有聚合物屏障的原型微流體處理器,以使從單細(xì)胞捕獲、LR-SDA和BCR、至IjPCR和測序文庫制備的整體工作流程能夠在單緊湊設(shè)備中進(jìn)行。設(shè)備由載玻片(1x50x75mm3),和一個(gè)用于閥門和一個(gè)用于流體通道的兩個(gè)聚二甲基娃氧燒(PDMS)層組成。制備閥門和通道層并且結(jié)合在一起,以及使用標(biāo)準(zhǔn)PDMS技術(shù)將其與載玻片結(jié)合(Lee等2013 ;Unger等2000)。如圖8中闡釋,在設(shè)備的中心是具有有期望的選擇性滲透性和功能的聚合物屏障的4個(gè)處理室,能夠使多步驟程序在單個(gè)微流體隔室中進(jìn)行。可制備不同的聚合物微觀結(jié)構(gòu),并且使用Lee等2013中報(bào)道的技術(shù)原位進(jìn)一步官能化,以及任選地使用僅僅一個(gè)閥門或不用閥門而制備具有分子光滑表面的聚合物微觀結(jié)構(gòu)。例如,聚合物屏障I(PBl)可被設(shè)計(jì)為具有非常高的密度和高度交聯(lián)的聚合物,其僅僅對于小的帶電種類,比如離子和游離核苷酸是可滲透的,并且主要用于捕獲和快速釋放細(xì)胞和DNA,而PB2被設(shè)計(jì)為僅僅對于短的寡核苷酸(例如〈100堿基)是可滲透的,用于快速去除游離引物。PB3可用鏈霉抗生物素官能化,用于BCR產(chǎn)物回收,而PB4被設(shè)計(jì)為用于分餾等。通過化學(xué)或光化學(xué)啟動(dòng)的聚合,由在期望的位置使用閥門或其他機(jī)制捕獲的單體溶液原位形成聚合物微觀結(jié)構(gòu)。作為單體的丙烯酰胺、雙丙烯酰胺和聚乙烯二丙烯酸酯(PEG-DA)和交聯(lián)劑的組合是有效的。通過改變單體和交聯(lián)劑的濃度調(diào)整聚合物的滲透率。高密度聚合物通常由40 %丙烯酰胺、2 %雙丙烯酰胺和20%PEG-DA形成。PEG-DA用于在屏障的表面上暴露PEG部分,以防止非特異性結(jié)合和表面污垢。這樣的高密度聚合物的孔尺寸是數(shù)納米級(jí)別的或更小,對小離子仍是可滲透的,但是實(shí)際上對于更短的寡核苷酸不可滲透。通過水溶液和Ar氣體之間的界面形成聚合物,產(chǎn)生分子光滑的表面。更小的孔尺寸和光滑表面對于防止DNA分子的捕獲、最小化樣品損失是重要的。因此,為了快速捕獲和有效釋放DNA,使用具有PEG連接體的高密度聚合物。我們也證明I )20-30%的聚合物通常對于去除短的引物和多達(dá)100個(gè)堿基長的寡核苷酸是有效的,和2)10-20%的聚合物塊(polymer plugs)對于分饋和尺寸選擇是理想的。取決于應(yīng)用,可使用各種濃度的其他聚合物,和各種比例的交聯(lián)劑。各種表面涂層(例如,具有生物素、短寡核苷酸、PEG部分、伯胺基團(tuán)等)可用于減少非特異性結(jié)合,或參與官能團(tuán)的親和性捕獲或添加。
為了施加電場或電勢,將Pt電線插入流體流動(dòng)槽(f 1wce11)的入口 /出口,并且跨過選擇性電極對施加期望的電勢。也可設(shè)計(jì)電極(PtSAu)并且在處理器的玻璃基板上制作,與我們常規(guī)用于細(xì)胞、微珠和生物分子的芯片上的電場操作類似(Barbee等2009 !Barbee等2010; Hsiao等2010)。對于溫度控制和快速熱循環(huán),可使用經(jīng)計(jì)算機(jī)和定制軟件控制的具有Pel tier熱電設(shè)備的高性能定制裝置(Barbee等2011)。使用一組電磁閥(solenoid valve)和定制的電子系統(tǒng)以及軟件包裝,通過氣壓驅(qū)動(dòng)PDMS閥門致動(dòng)和流體流動(dòng)。軟件和硬件可升級(jí),以包括更多的電磁閥,以致動(dòng)整個(gè)過程。另外,為了簡化微流體處理器的操作,可構(gòu)建平臺(tái),其中預(yù)先配置的流體(管連接)和電子(電接觸)與處理器相互作用(interface),以允許設(shè)備可靠的裝載和操作。設(shè)備可進(jìn)一步擴(kuò)展,以根據(jù)需要包括另外的模塊,比如流體動(dòng)力學(xué)細(xì)胞陷阱模塊和分餾以及樣品回收模塊。微流體設(shè)備可由塑料、玻璃、硅、金屬或其他非PDMS彈性體或柔性聚合物制作。
B.使用聚合物屏障的單細(xì)胞捕獲和多步驟處理。
我們已經(jīng)證實(shí)了使用電場和流體動(dòng)力學(xué)單細(xì)胞捕獲快速運(yùn)輸和捕獲細(xì)胞的能力(圖9)(Lee等2013)。為了簡單,電場可用于捕獲單細(xì)胞。流體動(dòng)力學(xué)單細(xì)胞陷阱可也并入設(shè)備中,以易于自動(dòng)化,因?yàn)檫m當(dāng)設(shè)計(jì)的陷阱確保了接近100%有效的單細(xì)胞捕獲以及允許去除無細(xì)胞DNA。我們也已經(jīng)證明了多步驟方法可在單個(gè)室中進(jìn)行,以及帶電的生物分子的電泳運(yùn)輸而不用溶液流動(dòng)(圖9)??赏ㄟ^使用聚合物凝膠塊的電泳進(jìn)行DNA分餾。
通過使溶液流過或流入室中進(jìn)行洗滌和溶液交換,同時(shí)通過電場使DNA分子保持在高密度聚合物的表面上,除非另外指明。在任何反應(yīng)之前,簡單地通過反轉(zhuǎn)電場,使DNA分子從表面釋放至室的中心。所有的閥門根據(jù)需要保持打開或閉合。
為了更好地理解其如何工作,如下詳細(xì)描述大體過程。圖8中顯示的雙向方法(圖4)和處理器用于闡釋該方法。(I)使用電場將單細(xì)胞捕獲在室Cl中。當(dāng)保持電場時(shí),使裂解液和DNA變性溶液(例如200mMK0H+20mMEDTA+l %SDS)流入室中,以裂解細(xì)胞和使雙鏈染色體DNA分子分離。通過快速洗滌去除裂解液和細(xì)胞碎片,同時(shí)在室中保持電場。(2)使BCR引物流入室中,并且通過在期望的溫度(例如12°C)孵育允許其與ssDNA雜交。任選地,可在低溫(例如O0C )使用室C2中的PB2經(jīng)電泳去除過多的引物。(3)使包含dNTP ’ s、ATP和DNA聚合酶和連接酶(例如T4DNA聚合酶和連接酶)的反應(yīng)混合物流入室中,以使用期望的溫度曲線(例如,在4°C、12°C、25°C、然后37°C各自2分鐘,用于合成,和在22°C 15分鐘,用于連接)進(jìn)行BCR反應(yīng)。
(4)快速洗滌之后,使包含phi29DNA聚合酶和dNTP’s的緩沖液流入室中,以進(jìn)行鏈置換合成,以從初始DNA模板剝離產(chǎn)物。(5)通過使用電極EI和E3轉(zhuǎn)移DNA分子,將生物素化的BCR產(chǎn)物捕獲在共價(jià)連接至聚合物(PB3)表面的鏈霉抗生物素上。然后,將初始染色體DNA分子轉(zhuǎn)移回到室Cl,用于其他輪的BCR反應(yīng)。(6)混合所有的BCR產(chǎn)物并且通過PCR使用室C3中的Illumina測序引物擴(kuò)增。(7)使用室C4中的PB4去除過多的PCR引物,然后使用常規(guī)的流體流動(dòng)或電泳轉(zhuǎn)移來找回。使用IlluminaMySeq或H1-Seq系統(tǒng),或其他高通量測序平臺(tái),比如Pacific B1sciences ’ SMRT,1n Torrent Proton Systems(離子激流質(zhì)子系統(tǒng))和454/Roche Pyrosequencer,對文庫測序。
C.微流體設(shè)備的概述
本文提供了用于進(jìn)行需要試劑交換、洗滌等的多步方法的微流體設(shè)備。在一些實(shí)施方式中,微流體設(shè)備包括(a)至少一個(gè)室,(b)與至少一個(gè)室可操作地連接的多個(gè)流體通道,(C)至少一個(gè)聚合物屏障,其將至少一個(gè)室的內(nèi)部與(i)多個(gè)流體通道之一以及(ii)被配置為在流體通道和室中產(chǎn)生電場的電極分離,其中至少一個(gè)室包括至少一個(gè)閥門,每個(gè)閥門將至少一個(gè)室的內(nèi)部與未通過聚合物屏障與至少一個(gè)室分開的多個(gè)流體通道中的一個(gè)分開。聚合物屏障是半滲透性的(例如,對于離子或核苷酸單體),并且被設(shè)計(jì)為具有尺寸截止,從而當(dāng)電極在(b)(i)和室中的流體通道中產(chǎn)生電場時(shí),大于尺寸截止的核酸保留在至少一個(gè)室中。
在一些實(shí)施方式中,微流體設(shè)備由載片(例如,玻璃或塑料)、包圍流體通道的聚合物層和包圍至少一個(gè)室的聚合物層形成。在一些實(shí)施方式中,聚合物是PDMS(聚二甲基硅氧烷)。
在一些實(shí)施方式中,微流體設(shè)備包括2-100個(gè)室,例如,2、3、4、5、6、7、8、9、10或更多個(gè)室,其每個(gè)具有至少一個(gè)聚合物屏障和至少一個(gè)閥門。在一些實(shí)施方式中,微流體設(shè)備包括至少一個(gè)不包括聚合物屏障的另外的室。
在一些實(shí)施方式中,獨(dú)立地選擇每個(gè)室中聚合物屏障的尺寸截止。在一些實(shí)施方式中,至少一個(gè)聚合物屏障的尺寸截止在電極在流體通道和室中產(chǎn)生電場時(shí)保留所有核酸。在一些實(shí)施方式中,至少一個(gè)聚合物屏障的尺寸截止保留大于30個(gè)核苷酸的核酸。在一些實(shí)施方式中,至少一個(gè)聚合物屏障的尺寸截止保留大于100個(gè)核苷酸的核酸。在一些實(shí)施方式中,至少一個(gè)聚合物屏障的尺寸截止保留大于500個(gè)核苷酸的核酸。
在一些實(shí)施方式中,至少一個(gè)聚合物屏障包括丙烯酰胺、雙丙烯酰胺和PEG-DA。在一些實(shí)施方式中,至少一個(gè)聚合物屏障被涂布以親和性試劑。
進(jìn)一步提供了包括4_108(例如,100-106)個(gè)微流體設(shè)備的微流體陣列。
D.單細(xì)胞的全基因組LR-SDA
這需要若干步驟。(I):如上述進(jìn)行細(xì)胞捕獲和DNA變性。(2)使隨機(jī)引物流入室中,并且通過在期望的溫度或溫度曲線(例如12°C或30至4°C )孵育允許其與ssDNA雜交。(3)允許緩沖液中包含DNA聚合酶(例如T4DNA Po I)和dNTP ’ s的反應(yīng)混合物流入室中,并且在低溫(例如4-12°C)孵育短時(shí)間段,以使引物延伸短的距離,(4)使用室C2中的PB2在低溫(例如0-40C )經(jīng)電泳去除過多的引物。(5)使包含DNA聚合酶和dNTP’s的新的反應(yīng)混合物流入室中,以在30-32°C進(jìn)行LR-SDA。(5)通過在50至200mM K0H/20mM EDTA中流動(dòng)使LR-SDA分子與初始DNA分子分離;(6)通過使用電極El和E3轉(zhuǎn)移DNA分子,將生物素化的BCR產(chǎn)物捕獲在與聚合物(PB3)的表面共價(jià)連接的鏈霉抗生物素上。然后,將初始染色體DNA分子轉(zhuǎn)移回到室Cl,用于其他輪的LR-SDA反應(yīng)或其他方法。(7)然后,在室C3中對LR-SDA產(chǎn)物進(jìn)行BCR反應(yīng),隨后在室C4中進(jìn)行PCR擴(kuò)增,并且如上述測序。圖11中闡釋了使用LR-SDA預(yù)擴(kuò)增DNA,用于隨后BCR和基因組測序。如果BCR未被整合至該方法中,則LR-SDA產(chǎn)物可被找回,用于隨后的處理和應(yīng)用。相同的方法可用于從大于一個(gè)細(xì)胞或病毒粒子擴(kuò)增基因組材料。 本文提供了使用如本文所描述的具有選擇性可滲透的聚合物屏障的流體設(shè)備,用于擴(kuò)增(例如,等溫或多溫度擴(kuò)增)多核苷酸的方法。在一些實(shí)施方式中,該方法包括:(a)將靶多核苷酸捕獲在聚合物屏障的表面上,(b)使捕獲的多核苷酸在變性條件下,例如在存在20mM至200mM的氫氧化鉀或SM尿素的情況下,與引物對接觸,(c)通過用適于雜交的緩沖液替換變性化學(xué)物質(zhì)使引物與模板雜交,同時(shí)多核苷酸模板和引物通過電場保留在聚合物表面上,(d)使引發(fā)的模板多核苷酸與聚合酶和對于聚合必要的試劑接觸,(e)允許多核苷酸鏈從引物序列的3’端延伸至多核苷酸模板的末端,和根據(jù)需要多次(f)重復(fù)(a)至(e),以擴(kuò)增模板多核苷酸。在一些實(shí)施方式中,多個(gè)引物對用于擴(kuò)增多個(gè)模板多核苷酸。在一些實(shí)施方式中,使用的DNA聚合酶具有強(qiáng)的鏈置換能力和防錯(cuò)誤讀取能力。在一些實(shí)施方式中,靶多核苷酸長度的范圍是50堿基至100,000堿基(例如,50-200、100-500、50-1000)或更長。
E.單細(xì)胞的從頭基因組測序
我們已經(jīng)使用HeLa細(xì)胞作為開發(fā)我們的單細(xì)胞微流體技術(shù)的模型。使用F粘粒文庫,已經(jīng)以長片段單倍型分辨率對HeLa細(xì)胞的基因組進(jìn)行測序(Adey等2013)。也可使用EBV轉(zhuǎn)化的類淋巴母細(xì)胞細(xì)胞系GM2043 I,并且其已經(jīng)使用多個(gè)平臺(tái)被測序,包括Comp IeteGenomics的標(biāo)準(zhǔn)短測序序列和LFR(Drmanac等;Peters等2012)、對外顯子組和BAC克隆的Illumina SBS短測序序列(Lo等2013;Peters等2012)。其他測序細(xì)胞類型可也用于測試。本公開的方法可用于對任何類型的遺傳物質(zhì)(例如,病毒或細(xì)胞遺傳物質(zhì))測序。
V1.用于單細(xì)胞從頭表觀基因組測序的BCR和LR-SDA
由于BCR技術(shù)若干非常獨(dú)特的特征,其對于單細(xì)胞表觀基因組(例如,甲基化組)測序是理想的。首先,在該過程中,初始DNA分子從不被損傷或片段化。如之前描述的,可首先獲得具有高精確度和單倍型分辨率的基因組序列。這用作組裝甲基化組或表觀基因組的藍(lán)本或參考。然后,具有化學(xué)修飾堿基的初始DNA分子用于表觀基因組測序。DNA損傷和片段化是與亞硫酸氫鹽處理DNA相關(guān)的最常見問題。在沒有來自相同細(xì)胞的相同基因組作為參考的情況下,重建表觀基因組是不可行的。本文公開的方法避免了該問題。第二,因?yàn)楠?dú)立地復(fù)制、測序和組裝兩條鏈,冗余信息可用于糾正由于化學(xué)轉(zhuǎn)換過程中的任何低效導(dǎo)致的錯(cuò)誤。第三,通過使用LR-SDA預(yù)先擴(kuò)增初始的和轉(zhuǎn)換的DNA,可明顯改善序列覆蓋度。圖12中闡釋了基本概念。
本文提供了對化學(xué)修飾的多核苷酸測序的方法,包括:(a)在不片段化或損傷初始修飾的多核苷酸的情況下,通過BCR復(fù)制修飾的多核苷酸,(b)對BCR產(chǎn)物測序和組裝多核苷酸的序列,而不需要有關(guān)對堿基的化學(xué)修飾的信息,(c)通過化學(xué)或酶方式轉(zhuǎn)化多核苷酸中修飾的堿基,例如通過用亞硫酸氫鹽和其他化學(xué)物質(zhì)處理,以將未甲基化的C(胞嘧啶)堿基轉(zhuǎn)化成U(尿嘧啶)堿基,或用甲基化敏感的限制性內(nèi)切核酸酶處理,(d)復(fù)制和測序轉(zhuǎn)化的多核苷酸,(e)通過比對轉(zhuǎn)化的序列與(b)中測定的參考序列,用有關(guān)修飾堿基的信息確定初始修飾的多核苷酸的序列。在一些實(shí)施方式中,待確定的修飾的堿基是甲基化的或羥甲基化的胞嘧啶堿基。
本文所述的實(shí)施例和實(shí)施方式是僅僅為了示意性目的并且本領(lǐng)域技術(shù)人員可想到其各種修飾或改變,并且這些包括在本申請的精神和范圍內(nèi)以及所附的權(quán)利要求的范圍內(nèi)。本文引用的所有的申請、專利、專利申請和數(shù)據(jù)庫實(shí)體通過引用以它們的整體為了所有的目的而并入本文。 VI1.應(yīng)用
本公開能夠?qū)崿F(xiàn)下述方法和裝置。
1.一種方法,其稱為“標(biāo)簽序列鄰接復(fù)制” (BCR),用于復(fù)制具有鄰接標(biāo)簽序列的核酸,而不用片段化或損傷初始核酸分子。
2.BCR方法提供復(fù)制的DNA序列的物理連接性信息,以簡化序列組裝,而不需要大量的計(jì)算,其中通過簡單的查找和排序測序的DNA區(qū)段上的鄰接標(biāo)簽序列而連接或組裝序列。
3.包括兩個(gè)短的核酸(或類似物)序列的雙向BCR引物,每個(gè)序列連接至一對標(biāo)簽序列之一,所述一對標(biāo)簽序列是互補(bǔ)的并且形成雙鏈體DNA組裝體,其中兩個(gè)短的核酸序列是隨機(jī)的或?qū)Π行蛄惺翘禺愋缘摹?br> 4.包括短的核酸(或類似物)的單向BCR引物,所述短的核酸(或類似物)連接至一對標(biāo)簽序列之一,所述一對標(biāo)簽序列是互補(bǔ)的并且形成雙鏈體DNA組裝體。
5.單向BCR引物,其包括連接至標(biāo)簽序列的短的核酸(或類似物),和任選地其他連接體和接頭序列。
6.雙向引物的雙鏈體組裝體,每條鏈獨(dú)立地包括用于下游處理,包括回收BCR產(chǎn)物、擴(kuò)增和測序的序列或元件。
7.用于BCR引物的標(biāo)簽序列,包括DNA和/或RNA和/或核酸類似物序列,其長度是4、5、6、
7、8、9、10、11、12、13、14、15、16、17、18、19、20 堿基或更長。
8.用于作為BCR引物雙鏈體一部分與靶序列(例如,模板多核苷酸)雜交的核酸序列,其中核酸包括DNA和/或RNA和/或核酸類似物,其長度是4、5、6、7、8、9、10、11、12、4_25、10-30個(gè)堿基或更長。
9.具有獨(dú)特的標(biāo)簽序列的BCR引物池,其具有等摩爾比的11-1O5、15-1O50,12-1O20,105-101Q、101Q-102Q、12q-1O25或更多獨(dú)特的序列或的分子種類。
10.具有獨(dú)特標(biāo)簽序列的BCR引物池,其具有限定摩爾比的1l-1O^lO5-1O5tMO2-1O'105-101Q、101Q-102Q、12q-1O25或更多的獨(dú)特序列或分子種類。
11.通過化學(xué)和酶合成構(gòu)建BCR引物的方法,其中互補(bǔ)的標(biāo)簽序列通過酶DNA合成來復(fù)制,隨后進(jìn)行連接。
12.不需要片段化或損傷初始分子的用于核酸區(qū)段的BCR的單向方法,其中單鏈靶分子與單向引物雜交并且使用DNA聚合酶或沒有任何鏈置換能力的聚合酶以區(qū)段進(jìn)行復(fù)制;通過末端脫氧核糖核苷酸轉(zhuǎn)移酶用均聚物尾部(例如6_20T’s)延伸每個(gè)復(fù)制的片段的3’端;并且與均聚物尾部互補(bǔ)的序列用于從鄰近的下游引物引發(fā)互補(bǔ)的標(biāo)簽序列的合成。
13.不需要片段化或損傷初始分子的用于核酸區(qū)段的BCR的雙向方法,其中具有標(biāo)簽序列的單鏈靶分子與雙向引物雜交并且使用DNA聚合酶或沒有任何鏈置換能力的聚合酶以區(qū)段復(fù)制,然后使用DNA或RNA連接酶將每個(gè)復(fù)制片段的3’端連接至鄰近下游雙向引物的5’端。
14.不要片段化或損傷初始分子的用于核酸區(qū)段的BCR的雙向方法,其中具有標(biāo)簽序列的單鏈靶分子與雙向引物雜交并且中使用DNA聚合酶或沒有任何鏈置換能力的聚合酶以區(qū)段復(fù)制,然后通過化學(xué)反應(yīng)比如點(diǎn)擊化學(xué)(例如商業(yè)上可得自Jena B1science或LifeTechnologies的試劑盒)或硫碘代親核置換將每個(gè)復(fù)制片段的3’端連接至鄰近下游雙向引物的5’ 端(見,例如,Montanari等(1993) J.0rg.Chem.58:5628)。 15.通過鏈置換合成使用來自連接至BCR引物的雙鏈體組裝體的引物,回收BCR產(chǎn)物的方法。
16.用于多循環(huán)BCR的方法,其中對相同的靶DNA或RNA分子進(jìn)行多輪BCR。
17.—種方法,其稱為“長片段鏈置換(LR-SDA)”,用于以均勻覆蓋度基本上無錯(cuò)誤地?cái)U(kuò)增DNA,其中分離的單鏈DNA分子與隨機(jī)的或半隨機(jī)引物雜交并且使用DNA聚合酶或具有強(qiáng)的鏈置換能力和高的持續(xù)合成能力的聚合酶通過長片段鏈置換DNA合成進(jìn)行復(fù)制,以產(chǎn)生非常長的重疊單鏈DNA片段。
18.LR-SD方法,其中隨機(jī)引物包括DNA和/或RNA和/或核酸類似物序列,其長度為4、5、6、7、8、9、10、11、12、4-20、10-30、15-30 個(gè)堿基或更長。
19.LR-SD方法,其中隨機(jī)引物由DNA和/或RNA和它們的類似物序列組成,其長度為4、5、
6、7、8、9、10、11、12、4-20、10-30、15-30個(gè)堿基或更長,其連接至接頭序列,用于下游處理比如親和性捕獲、擴(kuò)增和測序。
20.LR-SD方法,其中在雜交的隨機(jī)引物已經(jīng)被延伸短的距離,例如約20、10-200、約30、40、50、10-50、51-100、101-200、50-500個(gè)堿基或更長之后,去除游離引物。
21.LR-SD方法,其中通過在控制條件下雜交引物,引物間隔的平均距離是20-50、50-500、51-100、101-200、201-500、501-1000、1001-10,000、10,001-100,000個(gè)堿基或更長。
22.LR-SD方法,其中擴(kuò)增的單鏈分子的平均長度是50-1000、100-1000、1001-2000、2001-5000、5001-10,000、100001-100,000個(gè)堿基或更長。
23.LR-SD方法,其中通過使用與親和性標(biāo)簽比如生物素連接的引物回收擴(kuò)增的分子,并且通過親和性捕獲捕獲標(biāo)記的擴(kuò)增分子,例如,通過抗生物素蛋白捕獲生物素化的分子。
24.多循環(huán)LR-SD方法,其中對相同的靶DNA分子進(jìn)行多輪LR-SDA。
25.來自LR-SDA的單鏈產(chǎn)物在BCR和隨后測序中的用途。
26.具有聚合物屏障的微流體處理器,用于操作細(xì)胞和生物分子。
27.具有聚合物屏障的微流體處理器,用于在單個(gè)或若干微流體室中的多步驟處理,包括酶反應(yīng)、生物分子捕獲和分離。
28.微流體處理器,能夠?qū)崿F(xiàn)自動(dòng)單細(xì)胞捕獲、DNA提取和復(fù)制/擴(kuò)增,以及測序文庫構(gòu)建,用于單細(xì)胞的基因組和表觀基因組測序。
29.用于單細(xì)胞的表觀基因組測序的方法和設(shè)備,其中首先測序基因組并且使用BCR或LR-SDA/BCR方法組裝,然后用亞硫酸氫鹽處理初始DNA分子并且對處理的DNA分子測序,以及使用BCR或LR-SDA/BCR方法組裝。
30.用于單細(xì)胞的從頭基因組和甲基化組測序的方法和裝置,其中捕獲單細(xì)胞并且使用BCR或LR-SDA/BCR方法測序。
31.用于單倍型分辨率的方法,其中通過BCR獨(dú)立地復(fù)制、測序和組裝來自雙鏈染色體對的個(gè)體鏈。
32.用于基因組測序中錯(cuò)誤糾正的方法,用于精確的基因組測序,其中獨(dú)立地分開雙鏈DNA分子的兩條鏈、對其復(fù)制、測序和組裝,并且來自互補(bǔ)鏈的冗余信息用于錯(cuò)誤糾正,明顯改善單倍型和測序精確度。
引用的參考文獻(xiàn)
Adey,A,Burton,JN,Kitzman,JO,Hiatt,JB,Lewis,AP,Martin,BK,Qiu,RL,Lee,C andShendure,J.2013.The haplotype-resolved genome and epigenome of the aneuploidHeLa cancer cell line.Nature 500:207-+.Arneson,N,Hughes,S,Houlston,R and Done,S.2008.Whole-Genome Amplificat1nby Degenerate Oligonucleotide Primed PCR(DOP-PCR).CSH Protoc 2008:pdbprot4919.Baday,M,Hastie,A,Cravens,A,Kudeki,DEjXiaojM and Selvin,P.2012.AdvanceHigh Resolut1n DNA Mapping Technique to Identify GenomicVariat1ns.B1physical Journal 102:420a_420a.Baker,S,Joecker,A,Church,G,Snyder,M,West,J,Salzberg,S,Worthey,E,Smith,T,WangjJ and Reid,JG.2012.Genome interpretat1n and assembly-recent progressand next steps.Nat B1technol 30:1081-1083.Barbee,KD,Chandrangsu,M and Huang,X.2011.Fabricat1n of DNA polymer brusharrays by destructive micropatterning and rolling—circleampIificat1n.MacromoI B1scill:607-617.Barbee,KD,Hsiao,AP,Heller,MJ and Huang,X.2009.Electric field directedassembly of high-density microbead arrays.Lab Chip 9:3268-3274.Barbee,KD,Hsiao,AP,Ro IIer,EE and Huang,X.2010.Multiplexed proteindetect1n using antibody-conjugated microbead arrays in a microfabricatedelectrophoretic device.Lab Chip 10:3084-3093.Bradnam,KR,F(xiàn)ass,JN, Alexandrov, A,Baranay,P,Bechner,M, BiroI,I,Boisvert,S,Chapman,JA,Chapuis,G,Chikhi,R et al.2013.Assemblathon 2:evaluating de novomethods of genome assembly in three vertebrate species.Gigascience 2:10.Branton,D,Deamer,DW,MarziaIi,A,BayIey,H,Benner,SA,ButIer,T,Di VentrajMjGaraj,S,Hibbs,A,Huang,X et al.2008.The potential and challenges of nanoporesequencing.Nat B1technol 26:1146-1153.Campbe 11,PJ,Stephens,PJ,Pleasance,ED,0’ Meara,S,Li,H,Santarius,T,Stebbings,LA,Leroy,C,Edkins,S,Hardy,C et al.2008.1dentificat1n ofsomatically acquired rearrangements in cancer using genome-wide massivelyparallel paired—end sequencing.Nature Genetics 40:722-729.Carnevali,P,Baccash,J,Halpern,AL, Nazarenko,I,Ni I sen,GB,Pant,KP,Ebert,JC,Brownley,A,Morenzoni,M,Karpinchyk,V et al.2011.Computat1nal techniques forhuman genome resequencing using mated gapped reads.J Comput B1l 19:279-292.Cherf,GM,Lieberman,KR,Rashid,H,Lam,CE,Karplus,K and Akeson,M.2012.Automated forward and reverse ratcheting of DNA in a nanopore at 5-Aprecis1n.Nat B1technol 30:344-348.Clarke,J,Wu,HC,Jayasinghe,L,PateI,AjReidjS and Bayley,H.2009.Continuousbase identificat1n for singIe—mo I ecuIe nanopore DNA sequencing.NatNanotechnol 4:265-270.Dean,F(xiàn)B,Hosono,S,F(xiàn)ang,LjWujXjFaruqi,AF,Bray-Ward,P,Sun,Z,Zong,Q,Du,Y,Du,Jet al.2002.Comprehensive human genome amplificat1n using multipledisplacement ampIificat1n.Proc Natl Acad Sci USA 99:5261-5266.Dong,Y,Xie,M,Jiang,Y,Xiao,NQ,Du,XY,Zhang,WG,Tosser-Klopp,G,Wang,JH,Yang,SjLiangjJ et al.2013.Sequencing and automated whole-genome optical mapping ofthe genome of a domestic goat(Capra hircus).Nature B1technology 31:135-141.Drmanac,R,Sparks,AB,Callow,MJ,Halpern,AL,Burns,NL,Kermani,BG,Carnevali,P,Nazarenko,I,Nilsen,GB,Yeung,G et al.2009.Human genome sequencing usingunchained base reads on self-assembling DNA nanoarrays.Science327:78-81.Fan,HC,Wang,J,Potanina,A and Quake , SR.2011.Whole-genome molecularhaplotyping of single cells.Nature b1technology 29:51-57.Gole,JjGore,AjRichardsjAjChiujY-JjFungjH-LjBushmanjDjChiangjH-1, Chun,J,Lo,Y-H and ZhangjK-Nature B1tech.1n press.Massively parallel polymerasecloning and genome sequencing of single cells using nano litermicrowells.Nature B1technology
Hastie,AR,Dong,LL,Smith,A,F(xiàn)inklestein,J,Lam,ET,Huo,NX,Cao,H,Kwok,PY,Deal,KRjDvorakjJ et al.2013.Rapid Genome Mapping in Nanochannel Arrays for HighlyComplete and Accurate De Novo Sequence Assembly of the Complex Aegilopstauschii Genome.PLoS One 8:
Hsiao,AP,Barbee ,KD and Huang,X.2010.Microfluidic Device for Capture andIsolat1n of Single Cells.Proc Soc Photo Opt Instrum Eng 7759:
Joneja,A and Huang,X.2011.Linear nicking endonuclease-mediated strand—displacement DNA amplificat1n.Anal B1chem 414:58-69.KaliskyjTjBlaineyjP and Quake,SR.2011.Genomic Analysis at the Single-CellLevel.Annual Review Genetics,Vol 45 45:431-445.KaliskyjT and Quake , SR.2011.Single-cell genomics.Nature Methods 8:311 —
314.Karow,J.(2013),In Sequence.Genomeffeb.Kitzman,JO,Mackenzie,AP,Adey,A,Hiatt,JB,Patwardhan,RP,Sudmant,PH,Ng,SB,Alkan,C,Qiu,R,Eichler,EE et al.2011.Haplotype-resolved genome sequencing of aGujarati Indian individual.Nature b1technology 29:59-63.Kumar,S,Tao,C,Chien,M,Hellner,B,BalijepalIi,A,Robertson,Jff,Li,ZjRussojJJjReiner,JE,Kasianowicz,JJ et al.2012.PEG-1abeled nucleotides and nanoporedetect1n for single molecule DNA sequencing by synthesis.Sci Rep 2:684.Lage,JM,Leamon,JH,Pejovic,T,Hamann,S,Lacey,M,Dillon,D,Segraves,R,VossbrinckjBjGonzalez,AjPinkel,D et al.2003.Whole genome analysis of geneticalterat1ns in small DNA samples using hyperbranched strand displacementamplificat1n and array-CGH.Genome Res 13:294-307.Lam,ET,Hastie,A,Lin,C,Ehrlich,D,Das,SK,Austin,MD,Deshpande,P,Cao,H,Nagarajan,NjXiao,M et al.2012.Genome mapping on nanochannel arrays forstructural variat1n analysis and sequence assembly.Nature B1technology 30:771-776.LaskenjRS.2013.Single-cell sequencing in its prime.Nature B1technology31:211-212.LaskenjRS and Stockwell,TB.2007.Mechanism of chimera format1n during theMultiple Displacement Amplificat1n react1n.BMC B1technol 7:19.Lee,HS,Chu,WK,Zhang,K and Huang,X.2013.Microfluidic devices withpermeable polymer barriers for capture and transport of b1molecules andcells.Lab Chip 13:3389-3397.Li,RQ,Zhu,HM,Ruan,J,Qian,WB,F(xiàn)ang,XD,Shi,ZB,Li,YR,Li,ST,Shan,G,Kristiansen,K et al.2010.De novo assembly of human genomes with massivelyparallel short read sequencing.Genome Research 20:265-272.Lizardi,PM,Huang,X,Zhu,Z,Bray-ffard,P,Thomas,DC and Ward,DC.1998.Mutat1ndetect1n and singIe—mo I ecuIe counting using isothermal rolling—circleampIificat1n.Nat Genet 19:225-232.Lo,C,Liu,R,Lee,J,Robasky,K,Byrne,SjLucchesi,C,Aach,J,Church,G,Bafna,V andZhangjK.2013.0n the design of clone-based haplotyping.Genome b1logy 14:R100.Lorthongpanich,C,Cheow,LF,Balu,S,Quake,SR,Knowles,BB,Burkholder,WF,SolterjD and Messerschmidt,DM.2013.Single-Ce11 DNA-Methylat1n AnalysisReveals Epigenetic Chimerism in Preimplantat1n Embryos.Science 341:1110—1112.Lu,SJ,Zong,CH,F(xiàn)an,W,Yang,MY,Li,JS,Chapman,AR,Zhu,P,Hu,XS,Xu,LY,Yan,LY etal.2012.Probing Me1tic Recombinat1n and Aneuploidy of Single Sperm Cells byWhole-Genome Sequencing.Science 338:1627-1630.MajQCjEnnisjCA and Aparic1,S.20I2.0pening Pandora’s Box—the new b1logyof driver mutat1ns and clonal evolut1n in cancer as revealed by nextgenerat1n sequencing.Curr Opin Genet Dev 22:3-9.Manrao,EA,Derrington,IM,Laszlo,AH,Langford,Kff,Hopper,MK,GiIlgren,N,PavlenokjMjNiederweis,M and Gundlach,JH.2012.Reading DNA at single-nucleotideresolut1n with a mutant MspA nanopore and phi29 DNA polymerase.NatB1technol 30:349-353.MarcyjYjIshoeyjTjLaskenjRSjStockwell,TB,WaIenz,BP,Halpern,AL,Beeson,KY,Goldberg , SM and Quake,SR.2007.Nanol iter reactors improve multipledisplacement amplificat1n of genomes from single cells.PLoS Genet 3:1702—1708.Martin,J,Cervero,AjMirjP,Martinez-Conejero,JA,PelIicer,A and Simon,C.2013.The impact of next-generat1n sequencing technology on preimplantat1ngenetic diagnosis and screening.Fertil Steril 99:1054—1061 el053.Marx,V.2013.Next-generat1n sequencing:The genome jigsaw.Nature 501:263—268.McNally,B,Singer,A,Yu,Z,Sun ,Y,Weng,Z and MellerjA.2010.0pticalrecognit1n of converted DNA nucleotides for singIe~molecule DNA sequencingusing nanopore arrays.Nano Lett 10:2237-2244.Nagano,T,Lubling,Y,Stevens,TJ,Schoenfelder,S,Yaffe,E,DeanjWjLaue,ED,Tanay,A and Fraser,P.2013.Single-cell H1-C reveals cell—to—cell variabilityin chromosome structure.Nature 502:59-+.Navin,N and Hicks ,J.2011.Future medical applicat1ns of single-celIsequencing in cancer.Genome Medicine 3:
Navin,N,KendalI,J,Troge,J,Andrews,P,Rodgers,L,McIndoo,J,Cook,K,Stepansky,A,Levy ,D,Esposito ,D et al.2011.Tumour evolut1n inferred by single-celIsequencing.Nature 472:90-94.Peters,BA,Kermani,BG,Sparks,AB,Alferov,0,Hong,P,Alexeev,A,Jiang,Y,Dahl,F(xiàn),Tang,YT,Haas,J et al.2012.Accurate whole-genome sequencing and haplotypingfrom 10 to 20 human cells.Nature 487:190-195.Peters,BA,Kermani,BG,Sparks,AB,Alferov,0,Hong,P,Alexeev,A,Jiang,Y,Dahl,F(xiàn),Tang,YT,Haas,J et al.2012.Accurate whole-genome sequencing and haplotypingfrom 10 to 20 human cells.Nature 487:190-195.Potter,NE,Ermini,L,PapaemmanuiI,EjCazzanigajGjVijayaraghavanjGjTitleyj I,F(xiàn)ord,A,CampbelI,P,Kearney,L and Greaves,M.2013.Single cell mutat1nalprofiling and clonal phylogeny in cancer.Genome Res
Powell,AA,Talasaz,AH,Zhang,HY,Coram,MA,Reddy,A,Deng,GjTelli,ML,Advani,RH,CarlsonjRffjMollickjJA et al.2012.Single Cell Profiling of Circulating TumorCells: Transcript1nal Heterogeneity and Diversity from Breast Cancer CellLines.PLoS One 7:
SalzbergjSLjPhillippyjAMjZiminjAjPuiujDjMagocjTjKorenjSjTreangenjTJjSchatz,MC,Delcher,AL,Roberts,M et al.2012.GAGE: A critical evaluat1n ofgenome assemblies and assembly algorithms.Genome Research 22:557-567.Schmitt,MW,Kennedy,SR,Salk,JJ,F(xiàn)ox,EJ,Hiatt,JB and Loeb,LA.2012.Detect1nof ultra-rare mutat1ns by next-generat1n sequencing.Proc Natl Acad Sci U SA 109:14508-14513.Steemers,F(xiàn)J,Gunderson,K,Royce,T,PignatelIi,NjGoryshin,IY,Carucc1,N,Maffi tt,M,Jendrisak,J,Amini,S,Kaper,F(xiàn) et al., inventors;11lumina Inc.,assignee.Linking sequence reads using paired code tags.Patent Applicat1nNumber,PCT/US2012/059642.WIPO Publicat1n NumberjWO 2012/061832 AljMay 10,2012.SukjEKjMcEwenjGKjDuitamajJjNowickjKjSchulz,S,Palczewski,S,Schreiber,S,Holloway,DT,McLaughlin,S,Peckham,H et al.2011.A comprehensively molecularhaplotype-resolved genome of a European individual.Genome research 21:1672-1685.Tabor,S and RichardsonjCC.1989.Selective inactivat1n of the exonucleaseactivity of bacter1phage T7 DNA polymerase by in vitro mutagenesis.J B1lChem 264:6447-6458.Telenius,H,Carter,NP,Bebb,CE,Nordenskjold,M,Ponder,BA and Tunnacliffe,A.1992.Degenerate oligonucleotide-primed PCR!general amplificat1n of targetDNA by a single degenerate primer.Genomics 13:718-725.Treangen,TJ and Salzberg,SL.2012.Repetitive DNA and next-generat1nsequencing:computat1nal challenges and solut1ns.Nature Reviews Genetics 13:36-46.Unger,MA,Chou,HP,Thorsen,T, Scherer , A and Quake , SR.2000.Monolithicmicrofabricated valves and pumps by multilayer soft lithography.Science 288:113-116.Voet,T,Kumar,P,Van Loo,P,Cooke,SLjMarshall,JjLinjMLjEsteki,MZ,Van der AajN,Mateiu,L,McBride,DJ et al.2013.Single-cell paired—end genome sequencingreveals structural variat1n per cell cycle.Nucleic Acids Research 41:6119-6138.Voet,T,Kumar,P,Van Loo,P,Cooke,SL,MarshalI,JjLinjMLjZamani Esteki,MjVander Aa,NjMateiu,LjMcBride,DJ et al.2013.SingIe-cell paired—end genomesequencing reveals structural variat1n per cell cycle.Nucleic Acids Res 41:6119-6138.Wallace,EVjStoddart,D,Heron,AJ,Mikhai1va,E,MagliajG,Donohoe,TJ andBayley,H.2010.1dentificat1n of epigenetic DNA modificat1ns with a proteinnanopore.Chem Commun(Camb)46:8195-8197.Wang,JB,Fan,HC,Behr,B and Quake,SR.2012.Genome-wide Single-Cell Analysisof Recombinat1n Activity and De Novo Mutat1n Rates in Human Sperm.Cell 150:402-412.ffanunu,M.2012.Nanopores:A journey towards DNA sequencing.Phys Life Rev 9:125-158.Wanunu,M,Morrison,W,Rabin,Y,Grosberg,AY and Meller,A.2010.Electrostaticfocusing of unlabelled DNA into nanoscale pores using a salt gradient.NatNanotechnol5:160-165.Zhang,C,Chen,S,Yin,X,Pan,X,Lin,G,Tan,Y,Tan,K,Xu,Z,Hu,P,Li,X et al.2013.Asingle cell level based method for copy number variat1n analysis by lowcoverage massively parallel sequencing.PLoS One 8:e54236.Zong,C,Lu,S,Chapman,AR and Xie,XS.2012.Genome-wide detect1n of single-nucleotide and copy-number variat1ns of a single human cell.Science 338:1622-1626.
【主權(quán)項(xiàng)】
1.一種用于對模板多核苷酸測序的方法,所述方法包括: (a)使所述模板多核苷酸與多個(gè)寡核苷酸對接觸,其中每個(gè)寡核苷酸對的每個(gè)成員包括(i)接頭序列,(ii)獨(dú)特的標(biāo)簽序列,其與所述寡核苷酸對的另一成員上的互補(bǔ)序列雜交,并且其中所述寡核苷酸對中之一或兩者包括(iii)與所述模板多核苷酸雜交的引物序列; (b)使所述模板多核苷酸和多個(gè)寡核苷酸對與缺乏鏈置換活性的聚合酶和對于聚合必要的試劑接觸;和 (c)使得多核苷酸鏈從所述引物序列的3’端延伸,以產(chǎn)生包括組分(i)-(iii)和與所述模板多核苷酸互補(bǔ)的序列的延伸的多核苷酸; (d)收集所述延伸的多核苷酸; (e)對所述延伸的多核苷酸測序;和 (f)基于獨(dú)特的標(biāo)簽序列組裝所述延伸的多核苷酸的序列,從而對所述模板多核苷酸測序, 其中所述方法不包括使所述模板多核苷酸片段化或去除所述模板多核苷酸上的表觀遺傳標(biāo)記物。2.權(quán)利要求1所述的方法,進(jìn)一步包括在步驟(a)之前使所述模板多核苷酸變性。3.權(quán)利要求1或2所述的方法,進(jìn)一步包括使得所述多個(gè)寡核苷酸對與所述模板多核苷酸雜交,并且在步驟(a)和(b)之間洗掉未雜交的寡核苷酸對。4.前述權(quán)利要求任一項(xiàng)所述的方法,其中所述寡核苷酸對的每個(gè)成員進(jìn)一步包括(iv)至少一種連接體序列,并且所述延伸的多核苷酸包括組分(i)-(iv)和與所述模板多核苷酸互補(bǔ)的序列。5.前述權(quán)利要求任一項(xiàng)所述的方法,其中所述模板多核苷酸是基因組DNA。6.權(quán)利要求5所述的方法,進(jìn)一步包括檢測所述基因組DNA上的甲基化的堿基。7.前述權(quán)利要求任一項(xiàng)所述的方法,其中所述寡核苷酸對的兩個(gè)成員均包括(iii)與所述模板多核苷酸雜交的引物序列。8.前述權(quán)利要求任一項(xiàng)所述的方法,其中所述引物序列(iii)是隨機(jī)引物序列。9.前述權(quán)利要求任一項(xiàng)所述的方法,其中所述接頭序列與預(yù)定的引物序列互補(bǔ)。10.前述權(quán)利要求任一項(xiàng)所述的方法,其中所述接頭序列連接至親和性試劑。11.一種擴(kuò)增模板多核苷酸的方法,所述方法包括: (a)使所述模板多核苷酸與多個(gè)引物接觸; (b)使所述模板多核苷酸和多個(gè)引物與具有鏈置換活性的聚合酶和對于聚合必要的試劑接觸; (c)使多核苷酸鏈從與所述模板多核苷酸雜交的所述多個(gè)引物中的至少一個(gè)引物的3’端延伸,以產(chǎn)生伸長的擴(kuò)增產(chǎn)物,從而擴(kuò)增所述模板多核苷酸。12.權(quán)利要求11所述的方法,進(jìn)一步包括在步驟(a)之前使所述模板多核苷酸變性。13.權(quán)利要求11或12所述的方法,進(jìn)一步包括使所述多個(gè)引物與所述模板多核苷酸雜交,并且在步驟(a)和(b)之間洗掉未雜交的引物。14.權(quán)利要求11-13任一項(xiàng)所述的方法,其中步驟(c)包括使延伸進(jìn)行預(yù)定的時(shí)間,以產(chǎn)生部分伸長的擴(kuò)增產(chǎn)物,洗掉未雜交的引物,添加具有鏈置換活性的聚合酶和對于聚合必要的試劑,并且使延伸繼續(xù)。15.前述權(quán)利要求任一項(xiàng)所述的方法,其中所述引物是隨機(jī)引物。16.權(quán)利要求11-15任一項(xiàng)所述的方法,其中所述引物連接至親和性試劑。17.權(quán)利要求16所述的方法,進(jìn)一步包括親和純化所述伸長的擴(kuò)增產(chǎn)物。18.權(quán)利要求11-15任一項(xiàng)所述的方法,進(jìn)一步包括基于尺寸分離所述伸長的擴(kuò)增產(chǎn)物。19.權(quán)利要求17或18所述的方法,進(jìn)一步包括在通過親和純化或分離去除所述伸長的擴(kuò)增產(chǎn)物之后重復(fù)步驟(a)-(c)。20.權(quán)利要求11-19任一項(xiàng)所述的方法,其中所述模板多核苷酸是基因組DNA。21.—種微流體設(shè)備,其包括: (a)至少一個(gè)室; (b)與所述至少一個(gè)室可操作地連接的多個(gè)流體通道; (C)至少一個(gè)聚合物屏障,其將所述至少一個(gè)室與(i)所述多個(gè)流體通道之一和(ii)被配置為在所述流體通道和室中產(chǎn)生電場的電極分開; 其中所述至少一個(gè)室包括至少一個(gè)閥門,每個(gè)閥門將所述至少一個(gè)室與未通過所述聚合物屏障與所述至少一個(gè)室分開的所述多個(gè)流體通道之一分開,和 其中所述聚合物屏障是半滲透的并且具有尺寸截止,以便當(dāng)所述電極在所述流體通道和室中產(chǎn)生電場時(shí),大于尺寸截止的核酸保留在所述至少一個(gè)室中。22.權(quán)利要求21所述的微流體設(shè)備,其包括2-10個(gè)室,每個(gè)室包括至少一個(gè)聚合物屏障和至少一個(gè)閥門。23.權(quán)利要求22所述的微流體設(shè)備,其中每個(gè)室中的所述聚合物屏障的所述尺寸截止被獨(dú)立地選擇。24.權(quán)利要求21-23任一項(xiàng)所述的微流體設(shè)備,其中所述至少一個(gè)聚合物屏障的尺寸截止在所述電極在所述流體通道和室中產(chǎn)生電場時(shí)保留所有核酸。25.權(quán)利要求21-23任一項(xiàng)所述的微流體設(shè)備,其中所述至少一個(gè)聚合物屏障的尺寸截止保留長于30個(gè)核苷的核酸。26.權(quán)利要求21-23任一項(xiàng)所述的微流體設(shè)備,其中所述至少一個(gè)聚合物屏障的尺寸截止保留長于100個(gè)核苷的核酸。27.權(quán)利要求21-26任一項(xiàng)所述的微流體設(shè)備,其中所述至少一個(gè)聚合物屏障包括丙烯酸酰胺、雙丙烯酸酰胺和PEG-DA。28.權(quán)利要求21-27任一項(xiàng)所述的微流體設(shè)備,其中所述至少一個(gè)聚合物屏障被涂布以親和性試劑。
【文檔編號(hào)】C12Q1/68GK105899682SQ201480072855
【公開日】2016年8月24日
【申請日】2014年11月13日
【發(fā)明人】黃曉華
【申請人】加利福尼亞大學(xué)董事會(huì)