專利名稱:用于高通量篩選的組合序列條形碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及分子生物學(xué)領(lǐng)域,尤其涉及用于測序方法的樣本DNA的制備。更具體地,本發(fā)明涉及用于高通量測序的核苷酸序列標(biāo)識符的用途。
背景技術(shù):
對低成本測序的高度需求已帶動了高通量測序技術(shù)的發(fā)展。在這種技術(shù)中,平行生產(chǎn)數(shù)以百萬計(jì)的序列。例如,454 Life Sciences,現(xiàn)在Roche Applied Sciences開發(fā)出了樣本DNA的高通量測序技術(shù),其涉及步驟使DNA片段化,將接頭連接至DNA片段,用包被有引物的珠捕獲單一 DNA片段,在油中的水滴內(nèi)部在珠上擴(kuò)增各DNA片段(乳液PCR(emulsion PCR)),隨后各珠裝載到皮升的孔中,并用焦磷酸測序?qū)Ω鲾U(kuò)增的DNA片段進(jìn)行測序。一般情況下,高通量測序技術(shù)涉及將接頭連接至DNA片段(接頭可包括用于捕獲的引物結(jié)合位點(diǎn))、DNA片段的擴(kuò)增和/或測序。因?yàn)榭梢援a(chǎn)生大量的序列,來自不同來源的樣本往往組合于單次高通量測序運(yùn)行中。為了從樣本池(pool)中追溯各樣本的來源,目前的高通量測序應(yīng)用依賴于核苷酸序列標(biāo)識符的使用。術(shù)語核苷酸序列標(biāo)識符(NSI,(基于序列的條形碼或序列索引是可互換的術(shù)語并且具有相同的含義。核苷酸序列標(biāo)識符是一段特定的核苷酸序列,該序列被用作標(biāo)識符。核苷酸序列標(biāo)識符包含在引物結(jié)合位點(diǎn)的接頭下游,從而當(dāng)從引物結(jié)合位點(diǎn)測序時(shí),標(biāo)識符序列的核苷酸序列得以確定。將包含不同核苷酸序列標(biāo)識符的不同接頭連接至不同樣本,之后可以合并樣本。當(dāng)合并樣本的序列被確定時(shí),核苷酸序列標(biāo)識符隨著接頭所連接的片段的部分序列被一起測序。因此核苷酸序列標(biāo)識符的存在或不存在確定池中樣本DNA的存在或不存在。隨著核苷酸序列標(biāo)識符被一起測序的內(nèi)部序列的序列,進(jìn)一步使得能夠?qū)⒃撔蛄兄付ǖ狡渌鶃碓吹奶囟颖?,因?yàn)楹塑账嵝蛄袠?biāo)識符用來鑒定樣本DNA來源。例如,由Roche開發(fā)的高通量測序系統(tǒng)(Genome Sequencer FLX系統(tǒng))使用多重標(biāo)識符序列(multiplexed identifier sequence,MID)。MIDs 是 lO-mer 序列,其并入接頭以便將序列讀取指定到單個(gè)樣本。目前正在使用的有超過100個(gè)不同的MIDs (454 LifeScience Corp (2009) Technical Bulletin No. 005-2009)。相似的核苷酸序列標(biāo)識符可用于其它測序系統(tǒng)。例如,Rigola等人 PLoS ONE. 2009; 4 (3) : e4761 和 WO 2007/037678 中描述了這樣的方法,在其中核苷酸序列標(biāo)識符并入引物5'端。通常,核苷酸序列標(biāo)識符和靶序列沒有顯著的互補(bǔ)性。因此,引物在5'端含有包含核苷酸序列標(biāo)識符的一段以及在3'端含有和靶序列互補(bǔ)的序列。當(dāng)用引物對(引物包括核苷酸序列標(biāo)識符)擴(kuò)增樣本時(shí),擴(kuò)增子將包括核苷酸序列標(biāo)識符。當(dāng)隨后合并樣本,并進(jìn)行高通量測序方法時(shí),核苷酸序列標(biāo)識符將用來鑒定所測序的擴(kuò)增子的來源。因此,通過確定核苷酸序列標(biāo)識符確定擴(kuò)增子的來源。同時(shí),已被擴(kuò)增并隨著核苷酸序列標(biāo)識符一起被測序的內(nèi)部序列也可以被追溯到其所來源的樣本。在這兩種情況下,包括核苷酸序列標(biāo)識符的接頭或引物概念是相同的,即確定使用高通量測序平臺從多個(gè)DNA樣本所產(chǎn)生的序列的樣本來源,其中DNA樣本在樣本制備過程中的某些時(shí)刻已被多路化(multiplexed),如被組合或被合并。
發(fā)明內(nèi)容
自推出以來,高通量測序技術(shù)能力的能力每兩年提高一個(gè)數(shù)量級。采用高通量測序,使得可以多路化越來越多的樣本數(shù),為了鑒定樣本來源所需的獨(dú)特接頭或引物的數(shù)目也越來越多。盡管使用100個(gè)不同引物或接頭可能已具有挑戰(zhàn)性,當(dāng)數(shù)目增至1000時(shí),這可能會成為瓶頸。因此,需要能夠減少所要使用的引物和/或接頭的數(shù)目,因?yàn)檫@可簡化樣本制備、可減少工作量、可優(yōu)化技術(shù)性能并能降低成本。本發(fā)明使得能夠減少所需不同的引物和/或接頭的數(shù)目。通過使用所謂的“分割條形碼(split barcode)”可減少數(shù)目。根據(jù)本發(fā)明的分割條形碼是出現(xiàn)在至少兩個(gè)接頭和/或引物上的核苷酸序列標(biāo)識符。使用例如引物對和/或一對接頭制備樣本DNA (或樣本DNA的組合),對中的各引物或接頭含有一個(gè)核苷酸序列標(biāo)識符。產(chǎn)生的擴(kuò)增子或接頭連接的DNA片段包括至少兩個(gè)核苷酸序列標(biāo)識符。對于各不同樣本,可以使用核苷酸標(biāo)識符的獨(dú)特組合。核苷酸序列標(biāo)識符的組合,也一起表 示為分割條形碼,用作標(biāo)識符。
圖I.用兩個(gè)核苷酸序列標(biāo)識符從樣本DNA制備擴(kuò)增子的方法。提供樣本DNA(l),樣本DNA包括兩側(cè)為兩個(gè)引物結(jié)合位點(diǎn)(Pl和P2)的內(nèi)部序列(IS),以及一對擴(kuò)增引物
(2),擴(kuò)增引物在3'端包括和引物結(jié)合位點(diǎn)互補(bǔ)的序列以及在其5'(端)包括核苷酸序列標(biāo)識符(NSI1和NSI2)。用擴(kuò)增引物擴(kuò)增樣本DNA (3),產(chǎn)生在兩側(cè)帶有兩個(gè)核苷酸序列標(biāo)識符的擴(kuò)增子(5'表示核苷酸鏈的5'端,3'端沒有注解)。圖2.用兩個(gè)核苷酸序列標(biāo)識符從樣本DNA制備接頭連接的DNA片段的方法。提供樣本DNA (I ),使其片段化提供DNA片段(2),提供包括第一和第二 NSI (NSII和NSI2)的一對接頭(3),接頭連接到DNA片段的兩端,產(chǎn)生接頭連接的DNA片段(4) (5'表不核苷酸鏈的5'端)。圖3.用2、3或4個(gè)核苷酸序列標(biāo)識符從樣本DNA制備擴(kuò)增的接頭連接的DNA片段的方法。 提供樣本DNA (I ),使其片段化提供DNA片段(2),提供一對接頭,其中的至少一個(gè)包括NSI (NSl和任選(NS2))且兩者都包括引物結(jié)合位點(diǎn)(Pl和P2),接頭連接DNA片段
(3),即內(nèi)部序列(IS),產(chǎn)生接頭連接的DNA片段(4),其在接頭連接的DNA片段兩端包括引物結(jié)合序列。提供一對擴(kuò)增引物(5),各在3'端包括和序列引物結(jié)合位點(diǎn)互補(bǔ)的序列,以及至少一個(gè)擴(kuò)增引物在5'端包括核苷酸序列標(biāo)識符(NSI3或任選(NSI4))。用擴(kuò)增引物的對擴(kuò)增接頭連接的DNA片段(6)。結(jié)果(7)是含有至少兩個(gè)NSI的擴(kuò)增的接頭連接的DNA片段。所述至少兩個(gè)NSI可以在IS兩側(cè),和/或所述至少兩個(gè)NSI可以在IS同一側(cè)(5'表不核苷酸鏈的5'端;括號表不在方法中納入第二和/或第四NSI是任選的)。圖4.用2、3或4個(gè)核苷酸序列標(biāo)識符從樣本DNA制備接頭連接的擴(kuò)增子的方法。提供樣本DNA (I ),樣本DNA包括兩側(cè)為兩個(gè)引物結(jié)合位點(diǎn)(PI和P2 )的內(nèi)部序列(I S ),以及一對擴(kuò)增引物(2),擴(kuò)增引物在V端包括和引物結(jié)合位點(diǎn)互補(bǔ)的序列,以及引物中的至少一個(gè)在5'端包括核苷酸序列標(biāo)識符(NSI1和任選(NSI2))。用擴(kuò)增引物擴(kuò)增樣本DNA
(3),產(chǎn)生帶有至少一個(gè)核苷酸序列標(biāo)識符的擴(kuò)增子(4)。提供一對接頭,接頭包括第三和任選第四核苷酸NSI (NSI3和任選(NSI4)),接頭連接至擴(kuò)增子的各端,從而提供接頭連接的擴(kuò)增子(6)。所述至少兩個(gè)NSI可以在IS兩側(cè),和/或所述至少兩個(gè)NSI可以在IS同一側(cè)(5'表不核苷酸鏈的5'端;括號表不此方法中納入第二和/或第四NSI是任選的)。圖5.用于確定接頭連接的DNA片段的兩個(gè)核苷酸序列標(biāo)識符的序列的方法。提供樣本DNA (I ),使其片段化提供DNA片段(2),提供包括第一和第二 NSI (NSII和NSI2)的一對接頭(3),接頭連接到DNA片段的各端,產(chǎn)生接頭連接的DNA片段(4)。各接頭包括測序引物結(jié)合位點(diǎn)(SEQ1和SEQ2),任選各包括擴(kuò)增引物結(jié)合位點(diǎn)((Pl)和(P2))。位點(diǎn)在接頭中存在的順序是(P) -SEQ-NSIJn (Pl) -SEQl-NSII。連接到DNA片段的接頭一側(cè)是含有NSI的一側(cè)??扇芜x用針對引物結(jié)合位點(diǎn)的引物擴(kuò)增接頭連接的DNA片段(4)。接頭連接的DNA片段的各鏈,可作為用于測序反應(yīng)的模板。所用的一個(gè)模板鏈表示如下3' - (PD-SEQl-NSI 1-IS-NSI2 (P2)-SEQ2-5/,其中測序引物是用來針對 SEQl 的。 提供測序引物,從而從各模板從SEQl或SEQ2確定NSI的序列??煞謩e確定該序列??蛇B續(xù)確定該序列,如,比如在配對末端測序中(5'表示核苷酸鏈的5'端)。圖6.用于確定接頭連接的DNA片段的兩個(gè)核苷酸序列標(biāo)識符序列的方法單讀取雙標(biāo)簽。提供樣本DNA (I ),使其片段化提供DNA片段(2),提供包括第一和第二 NSI (NSII和NSI2)的一對接頭,接頭連接到DNA片段的各端(3),產(chǎn)生接頭連接的DNA片段(4)。各接頭包括測序引物結(jié)合位點(diǎn)(SEQI或SEQ2 ),任選各包括擴(kuò)增引物結(jié)合位點(diǎn)((PI)或(P2 ))。位點(diǎn)在兩個(gè)接頭中存在的順序(Pl)-SEQl-NSII和SEQ2-NSI2- (P2)。接頭連接至DNA片段,從而(PI)和(P2 )位點(diǎn)是接頭連接的DNA片段的外側(cè)位點(diǎn)(4 ),可任選用針對其的弓I物擴(kuò)增接頭連接的DNA片段(5)。在使用SEQl和SEQ2測序引物結(jié)合位點(diǎn)(即使用相應(yīng)的不同測序引物)的兩個(gè)不同的測序反應(yīng)中,接頭連接的DNA片段的一條鏈,可作為測序的模板。所用的模板鏈表示如下3' - (PD-SEQl-NSI 1-IS-SEQ2-NSI2- (P2)-5/ (5'表示核苷酸鏈的5'端)。圖7.用于從樣本DNA確定擴(kuò)增子的兩個(gè)核苷酸序列標(biāo)識符的序列的方法。提供樣本DNA (I ),樣本DNA包括兩側(cè)為兩個(gè)引物結(jié)合位點(diǎn)(PI和P2 )的內(nèi)部序列(I S ),以及一對擴(kuò)增引物(2),擴(kuò)增引物在3'端包括和引物結(jié)合位點(diǎn)互補(bǔ)的序列以及在5'端包括測序引物結(jié)合位點(diǎn)(SEQ)。在擴(kuò)增引物中上述二者之間,設(shè)置核苷酸序列標(biāo)識符。用擴(kuò)增引物擴(kuò)增樣本DNA (3),產(chǎn)生在各側(cè)帶有兩個(gè)核苷酸序列標(biāo)識符的擴(kuò)增子,在擴(kuò)增子的外端有兩個(gè)SEQ (SEQ1和SEQ2)。擴(kuò)增子的各鏈可作為用于測序反應(yīng)的模板。所用的一個(gè)模板鏈表示如下3' -SEQl-NSI 1-P1-IS-P2-NSI2-SEQ2-5',測序引物是用來針對SEQl的。提供測序引物,從而從各模板確定NSI序列??煞謩e確定該序列??蛇B續(xù)確定該序列,如,比如在配對末端測序中(5'表不核苷酸鏈的5'端)。圖8.用于從樣本DNA確定擴(kuò)增子的兩個(gè)核苷酸序列標(biāo)識符的序列的方法單讀取雙標(biāo)簽。提供樣本DNA (1),樣本DNA包括兩側(cè)為兩個(gè)引物結(jié)合位點(diǎn)(Pl和P2)的內(nèi)部序列(IS),以及一對擴(kuò)增引物(2),擴(kuò)增引物在3'端包括和弓I物結(jié)合位點(diǎn)互補(bǔ)的序列(Cl或C2)。除此之外,引物還包括NSI和測序引物結(jié)合位點(diǎn),包括不同位點(diǎn)/序列的不同引物表示如下5, -SEQl-NSII-Cl和C2-SEQ2-NSI2-5'。用擴(kuò)增引物擴(kuò)增樣本DNA (3),產(chǎn)生在各側(cè)帶有核苷酸序列標(biāo)識符的擴(kuò)增子,在擴(kuò)增子的一個(gè)外端有SEQ1,在另一外端有NSI2
(4)。在使用SEQl和SEQ2測序引物結(jié)合位點(diǎn)(即使用相應(yīng)的不同測序引物)的兩個(gè)不同的測序反應(yīng)中,擴(kuò)增子的一條鏈可作為測序的模板。所用的模板鏈表示如下3' -SEQl-NSII-P1-IS-P2-SEQ2-NSI2-5' (5'表示核苷酸鏈的 5'端)。圖9.用于從樣本DNA確定擴(kuò)增子的四個(gè)核苷酸序列標(biāo)識符的序列的方法單讀取雙標(biāo)簽。提供樣本DNA (1),樣本DNA包括兩側(cè)為兩個(gè)引物結(jié)合位點(diǎn)(Pl和P2)的內(nèi)部序列(IS),以及一對擴(kuò)增引物(2),擴(kuò)增引物在V端包括和引物結(jié)合位點(diǎn)互補(bǔ)的序列(Cl或C2)。除此之外,引物還包括NSI,以及引物之一還包括測序引物結(jié)合位點(diǎn)。包括不同區(qū)段的不同引物表示如下5' -NSIl-Cl和C2-SEQ2-NSI2-5'。用擴(kuò)增引物擴(kuò)增樣本DNA(3), 產(chǎn)生在擴(kuò)增子的一個(gè)外端帶有兩個(gè)核苷酸序列標(biāo)識符的擴(kuò)增子。之后,提供一對接頭(4)。一個(gè)接頭包括測序引物結(jié)合位點(diǎn)(SEQl)和NSI (NSI3),另一引物包括NSI (NSH)0接頭連接至擴(kuò)增子的各端,產(chǎn)生接頭連接的擴(kuò)增子,其中SEQl區(qū)段在接頭連接的擴(kuò)增子的外端
(5),SEQl和SEQ2在IS的兩側(cè)。在使用SEQl和SEQ2測序引物結(jié)合位點(diǎn)(即使用相應(yīng)的不同測序引物)的兩個(gè)不同的測序反應(yīng)中,接頭連接的DNA片段的一條鏈可作為測序模板。所用的模板鏈表示如下3' -SEQ1-NSI3-NSI1-IS-SEQ2-NSI2-NSI4-5' (5'表示核苷酸鏈的5'端)。圖10.用于從樣本DNA確定擴(kuò)增子的四個(gè)核苷酸序列標(biāo)識符的序列的方法。提供樣本DNA (1),樣本DNA包括兩側(cè)為兩個(gè)引物結(jié)合位點(diǎn)(Pl和P2)的內(nèi)部序列(IS),以及一對擴(kuò)增引物(2),擴(kuò)增引物在:V端包括和引物結(jié)合位點(diǎn)互補(bǔ)的序列(CI或C2)。此外,引物還包括NSI。包括不同區(qū)段的不同引物表示如下5' -NSIl-Cl和C2-NSI2-5/。用擴(kuò)增引物擴(kuò)增樣本DNA(3),產(chǎn)生在擴(kuò)增子的一個(gè)外端帶有兩個(gè)核苷酸序列標(biāo)識符的擴(kuò)增子。之后,提供一對接頭(4)。各接頭包括測序引物結(jié)合位點(diǎn)(SEQ1或SEQ2)和NSI (NSI3或NSI4)。接頭連接至擴(kuò)增子的各端,產(chǎn)生接頭連接的擴(kuò)增子,其中SEQl和SEQ2區(qū)段在接頭連接的擴(kuò)增子的外端(5)。接頭連接的擴(kuò)增子的各鏈可作為測序反應(yīng)的模板。提供測序引物,從而從各模板確定NSI序列??煞謩e確定該序列。可連續(xù)確定該序列,如,比如在配對末端測序中。所用的模板鏈之一表示如下3' -SEQ1-NSI3-NSI-1-P1-IS-P2-NSI2-NSI4-SEQ2-5',其中使用的測序引物是針對SEQl的(5'表示核苷酸鏈的Y端)。圖11.用引物對的擴(kuò)增(UT1,通用尾I ;BC1,條形碼部分1,UT2通用尾2 ;BCP2,條形碼部分2)。A.通用尾I可以是序列引物位點(diǎn)I (粗黑箭頭)和通用尾2可以是序列引物位點(diǎn)2 (點(diǎn)畫箭頭),如,在Illumina GA配對末端測序的情況中的P5和P7。B.通用尾I可以是序列引物位點(diǎn)I (粗黑箭頭)和通用尾2可以是序列引物位點(diǎn)2 (虛線箭頭),如,在具有從同一鏈的兩次引物事件的Illumina GA測序的情況中的P5和P7。圖12. —對條形碼接頭的連接(P5,P5+seq. pr.位點(diǎn);BC1,條形碼部分I ;BC2,條形碼部分2 ;P7, P7+seq. pr.位點(diǎn);B,平端接頭)。A. EcoRI和Msel條形碼接頭連接至EcoRI/Msel消化的DNA,其中條形碼部分I(EcoRI側(cè))和2 (Msel側(cè))的組合唯一地限定樣本。B. EcoRI和平端條形碼接頭連接至樣本,其中先用EcoRI消化樣本,隨后是EcoRI條形碼接頭連接(條形碼1),隨后將接頭連接的片段進(jìn)行片段化,補(bǔ)平(polishing)任選端,隨后是平端接頭連接(條形碼2),其中條形碼部分I (EcoRI側(cè))和條形碼部分2 (平端偵D的組合唯一地限定樣本。
具體實(shí)施例方式定義在如下描述和實(shí)施例中,使用了一些術(shù)語。為了提供對說明書和權(quán)利要求(包括這種術(shù)語所給出的范圍)清楚一致的理解,提供下面的定義。除非此處另有指明,否則所用的所有技術(shù)和科學(xué)術(shù)語,同本發(fā)明所屬領(lǐng)域的普通技術(shù)人員所通常理解的,具有相同含義。所有出版物、專利申請、專利和其它參考文獻(xiàn)的公開通過參考其全部并入此處。
實(shí)施本發(fā)明方法中所用常規(guī)技術(shù)的方法對于技術(shù)人員而言將是顯而易見的。分子生物學(xué)、生物化學(xué)、計(jì)算化學(xué)、細(xì)胞培養(yǎng)、重組DNA、生物信息學(xué)、基因組學(xué)、測序和相關(guān)領(lǐng)域中的常規(guī)技術(shù)操作對于本領(lǐng)域技術(shù)人員是公知的,并在例如以下參考文獻(xiàn)中進(jìn)行了討論Sambrook 等人,Molecular Cloning. A LaboratoryManual,第二版,Cold Spring HarborLaboratory Press, Cold Spring Harbor, N. Y.,1989 ;Ausubel 等人,Current Protocols inMolecular Biology, John Wiley & Sons, NewYork, 1987 及其定期更新;以及叢書 Methodsin Enzymology, Academic Press, SanDiego0如本文所用,單數(shù)形式“一”、“一個(gè)”和“該”包括復(fù)數(shù)指代,除非上下文清楚地另有指明。例如,分離DNA包括分離多個(gè)DNA分子(如10個(gè)、100個(gè)、1000個(gè)、I萬個(gè)、10萬個(gè)、
百萬個(gè)、或者更多分子)。“核苷酸序列”,根據(jù)本發(fā)明可包括核苷酸(比如嘧啶和嘌呤堿基,分別優(yōu)選為胞嘧啶、胸腺嘧啶和尿嘧啶,以及腺嘌呤和鳥嘌呤)的任何聚合物或寡聚物,及其組合(見AlbertL. Lehninger, Principles of Biochemistry, 793-800 (Worth Pub. 1982),其被整體引用并納入此處用于各個(gè)目的)。本發(fā)明考慮任何脫氧核糖核苷酸、核糖核苷酸或肽核酸組分,及其任何化學(xué)變體,比如這些堿基的甲基化、羥甲基化或糖基化形式等。聚合物或寡聚物在組成方面可以是異質(zhì)的或均質(zhì)的,并且可以分離自天然發(fā)生的來源或者可以是人工或合成生產(chǎn)的。此外,核苷酸序列可以是DNA或RNA,或其混合物,并且可以以單鏈或雙鏈形式永久或暫時(shí)存在,包括同源雙鏈、異源雙鏈和雜交狀態(tài)?!皹颖綝NA”根據(jù)本發(fā)明是指源自生物體并包含DNA的樣本?!皹颖綝NA”不僅可包括來自包含DNA的生物體的細(xì)胞,還包括從來自生物體的細(xì)胞分離的DNA。只要“樣本DNA”包括可用于本發(fā)明方法中的DNA,這樣的樣本DNA就可用于本發(fā)明。從其可獲得樣本DNA的生物體是例如植物、哺乳動物、真菌和微生物。樣本DNA也可包括表達(dá)的序列標(biāo)簽或cDNA,其中由于RNA表達(dá)于生物體的細(xì)胞中,通過反轉(zhuǎn)錄將其轉(zhuǎn)換成雙鏈DNA。樣本DNA也可包括獲自生物體不同位點(diǎn)、和/或獲自幾個(gè)不同生物體的合并的樣本DNA。合并的樣本DNA可被合并于例如一個(gè)3-D池方案(pooling scheme)中,從而可確定包括在樣本DNA中的各樣本的來源(例如,如W02007/037678中描述的)?!捌位疍NA”包括當(dāng)應(yīng)用到樣本DNA時(shí)產(chǎn)生DNA片段的任何技術(shù)。本領(lǐng)域公知的技術(shù)是超聲、剪切和/或酶限制,但也可考慮其它技術(shù)?!跋拗菩詢?nèi)切酶”或“限制性酶”是一種酶,其識別例如雙鏈DNA分子中的特異性核苷酸序列(識別位點(diǎn)),并將在每個(gè)識別位點(diǎn)處或附近切割DNA分子的兩條鏈,產(chǎn)生平的或3'-或5'-突出端。識別的特異性核苷酸序列可確定切割的頻率,如6個(gè)核苷酸的核苷酸序列發(fā)生在平均每4096個(gè)核苷酸上,4個(gè)核苷酸的核苷酸序列發(fā)生得更頻繁地,出現(xiàn)在平均每256個(gè)核苷酸上。I型限制性酶在不同于其識別位點(diǎn)的地方切割,離其識別位點(diǎn)有一定的距離(至少lOOObp)。識別位點(diǎn)是不對稱的,并且由兩個(gè)部分組成一一個(gè)含3-4個(gè)核苷酸,另一個(gè)含4-5個(gè)核苷酸一由約6-8個(gè)核苷酸的間隔分開。II型限制性酶具有通常未分割的和回文的且4-8個(gè)核苷酸長的識別位點(diǎn)。它們在同一位點(diǎn)識別和切割DNA。IIs型在其識別序列之外進(jìn)行切割,HB型在其識別位點(diǎn)的兩側(cè)切割DNA來切掉識別位點(diǎn)。III型限制性酶(如,EcoP15)識別兩個(gè)單獨(dú)的反向的非回文序列。它們在識別位點(diǎn)后切割DNA約20-30個(gè)堿基對。IV型限制性酶切割甲基化DNA?!把a(bǔ)平”包括用于使具有3'或5'突出的雙鏈核苷酸序列變?yōu)槠蕉说娜魏渭夹g(shù)。 例如,在這種情況,使用超聲或使用酶使樣本DNA片段化產(chǎn)生交錯(cuò)的(突出)端。DNA聚合酶I、大(Klenow)片段可以用來填補(bǔ)5'突出(也稱為3'凹端)且去掉3'突出,或綠豆核酸酶可以用來去掉3'或5'突出?!斑B接”根據(jù)本發(fā)明涉及單獨(dú)雙鏈核苷酸序列的連接。雙鏈DNA分子可以是平端的,或可具有兼容的突出(粘性突出),從而突出可以彼此雜交。DNA片段的連接可以是利用連接酶、DNA酶的酶促的。然而,也可使用非-酶促連接,只要DNA片段被連接上,即形成共價(jià)鍵。通常,在連接反應(yīng)中,形成單獨(dú)鏈的羥基和磷酸基團(tuán)之間的磷酸二酯鍵。雙鏈核苷酸序列可在連接之前被磷酸化?!皵U(kuò)增引物”是指可以引發(fā)DNA合成的單鏈核苷酸序列。DNA聚合酶沒有引物不能從頭合成DNA。擴(kuò)增引物雜交至DNA,即形成堿基對??梢孕纬蓧A基對的核苷酸彼此是互補(bǔ)的,例如胞嘧啶和鳥嘌呤、胸腺嘧啶和腺嘌呤、腺嘌呤和尿嘧啶、鳥嘌呤和尿嘧啶。擴(kuò)增弓I物和存在的DNA鏈之間的互補(bǔ)性無需為100 %,即并非引物的所有堿基都需要與存在的DNA鏈堿基配對。擴(kuò)增引物所雜交(或部分雜交)的存在的DNA鏈(如樣本DNA或接頭連接的DNA片段)的序列,通常被稱為引物結(jié)合位點(diǎn)(PBS)。從與存在的DNA鏈雜交的引物的3'端,使用存在的鏈作為模板并入核苷酸(模板指導(dǎo)的DNA合成)。我們也可涉及合成的寡核苷酸分子,其在擴(kuò)增反應(yīng)中用作“引物”。擴(kuò)增反應(yīng)中新合成的核苷酸序列可被稱為內(nèi)部序列。一旦進(jìn)行PCR反應(yīng),內(nèi)部序列通常是兩個(gè)引物結(jié)合位點(diǎn)之間的序列。根據(jù)本發(fā)明,可以在擴(kuò)增步驟中使用引物向DNA引入額外的序列。這可以通過提供具有額外序列(如標(biāo)識符、測序接頭或捕獲配體如生物素部分)的引物來實(shí)現(xiàn)??梢酝ㄟ^在引物的5'端提供修飾,而在來自引發(fā)DNA合成的引物部分上游弓I入修飾?!皵U(kuò)增”或“擴(kuò)增”是指多核苷酸的擴(kuò)增反應(yīng),S卩,一群多核苷酸從一個(gè)或多個(gè)起始序列被復(fù)制。擴(kuò)增可涉及各種的擴(kuò)增反應(yīng),包括但不限于聚合酶鏈反應(yīng)(PCR)、線性聚合酶反應(yīng)、基于核酸序列的擴(kuò)增、滾環(huán)擴(kuò)增等反應(yīng)。通常情況下,擴(kuò)增引物用于擴(kuò)增,擴(kuò)增反應(yīng)的產(chǎn)物是擴(kuò)增子?!皽y序引物”指的是單鏈核苷酸序列,其可以引發(fā)DNA的合成,并用于測序DNA。擴(kuò)增引物也可用作測序引物。測序引物可用作擴(kuò)增引物。沒有引物DNA聚合酶不能從頭合成DNA。測序引物雜交至DNA,即形成堿基對??梢孕纬蓧A基對的核苷酸彼此是互補(bǔ)的,例如胞嘧啶和鳥嘌呤、胸腺嘧啶和腺嘌呤、腺嘌呤和尿嘧啶、鳥嘌呤和尿嘧啶。擴(kuò)增弓I物和存在的DNA鏈之間的互補(bǔ)性無需為100 %,即并非引物的所有堿基都需要與存在的DNA鏈堿基配對。測序引物所雜交(部分雜交)的存在的DNA (如樣本DNA或接頭連接的DNA片段)鏈的序列,通常被稱為測序引物結(jié)合位點(diǎn)(SEQ)。從與存在的DNA鏈雜交的測序引物的3'端,使用存在的鏈作為模板并入核苷酸(模板指導(dǎo)的DNA合成)。在合成過程中,可以檢測到特定核苷酸(A、T、C或G)的并入,如焦磷酸測序法或者當(dāng)使用熒光標(biāo)記的核苷酸時(shí)。或者,可以使用鏈終止法,如Sanger測序或染料終止測序。在任何情況下,只要可以通過用測序引物合成DNA并檢測并入的核苷酸和/或合成的片段來確定DNA模板的核苷酸順序,就可以考慮這些和其它方法?!皽y序”是指確定核酸樣本如DNA或RNA中核苷酸(堿基序列)的順序??色@得許多
技術(shù),如Sanger測序和高通量測序技術(shù)(HTS)。Sanger測序可涉及通過(毛細(xì)管)電泳檢測的測序,其中多達(dá)384個(gè)毛細(xì)管可在一次運(yùn)行中進(jìn)行序列分析。高通量測序涉及在一次當(dāng)中平行測序數(shù)千或數(shù)百萬或更多的序列。HTS可以被定義為下一代測序(即基于固相焦磷酸測序的技術(shù))或定義為下-下代測序(基于單核苷酸實(shí)時(shí)測序(SMRT))。HTS技術(shù)是可用的,如 Roche、Illumina 和 Applied Biosystems (Life Technologies)所提供的。其它高通量測序技術(shù)由如下描述和 / 或獲得Helicos、Pacific Biosciences、Complete Genomics、Ion TorrentSystems、Oxford Nanopore Technologies^Nabsys>ZS Genetics、GnuBio。這些測序技術(shù)的每一個(gè)在實(shí)際測序步驟前有自己的制備樣本的方式。這些步驟可包括在高通量測序方法中。在某些情況下,出于效率或經(jīng)濟(jì)的原因,特別是用于測序步驟的步驟可能被整合到實(shí)際測序步驟前的樣本制備操作中。例如,連接到片段的接頭可包含可用于隨后測序步驟的區(qū)段(所謂的測序接頭)?;蛴糜谠跍y序之前擴(kuò)增片段子集的引物,在其序列中可包含引入?yún)^(qū)段的部分,該區(qū)段可被用于之后的測序步驟中,例如,通過經(jīng)由擴(kuò)增步驟在擴(kuò)增子中引入可用于隨后測序步驟的測序接頭或捕獲部分。還取決于所使用的測序技術(shù),擴(kuò)增步驟也可以省略?!敖宇^”是具有有限數(shù)目的堿基對的短雙鏈DNA分子,例如約10至約100個(gè)堿基對的長度,它是這樣設(shè)計(jì)的,它們可以被連接到DNA片段或擴(kuò)增子的端部。接頭通常由兩個(gè)合成的寡核苷酸組成,合成的寡核苷酸具有至少部分地彼此互補(bǔ)的核苷酸序列。接頭可能有平端、可能有交錯(cuò)端、或平端和交錯(cuò)端。交錯(cuò)端是一個(gè)3'或5'突出。當(dāng)在溶液中在適當(dāng)?shù)臈l件下混合兩個(gè)合成的寡核苷酸時(shí),它們將彼此退火形成雙鏈結(jié)構(gòu)。退火后,接頭分子的一端可以經(jīng)過設(shè)計(jì),從而使得它和限制性片段的端兼容,并可以連接至此;接頭的其它端可以經(jīng)過設(shè)計(jì),從而使得它不被連接,但不一定是這樣,例如當(dāng)接頭連接于DNA片段之間時(shí)。在某些情況下,接頭可以連接至片段上以提供進(jìn)行接頭連接片段的后續(xù)操作的起點(diǎn),例如用于擴(kuò)增或測序。在后者的情況下,所謂的測序接頭可被連接至片段上。發(fā)明詳述根據(jù)本發(fā)明的第一方面,提供了至少兩個(gè)核苷酸序列標(biāo)識符的組合在制備用于高通量測序的樣本DNA中的用途。因此,提供了包括這樣的步驟的方法,其中至少兩個(gè)核苷酸序列標(biāo)識符的組合用于制備用于高通量測序的樣本DNA。通過根據(jù)此處的樣本DNA的制備,意味著這樣制備樣本DNA從而至少兩個(gè)NSI包括在樣本DNA中,即至少兩個(gè)NSI包括在例如擴(kuò)增子和/或接頭連接的DNA片段或其擴(kuò)增子中。因此所述至少兩個(gè)NSI包括在樣本DNA的核苷酸序列中從而單個(gè)多核苷酸分子包括至少兩個(gè)NSI。NSI的組合作為樣本DNA的獨(dú)特標(biāo)識符(分割條形碼)。從設(shè)計(jì)的角度,對可用的核苷酸序列標(biāo)識符的數(shù)目沒有實(shí)際限制。例如,一個(gè)核苷酸就已經(jīng)可以作為核苷酸序列標(biāo)識符。因此,可設(shè)計(jì)4個(gè)不同的核苷酸序列標(biāo)識符A、G、C或T。這種單個(gè)核苷酸標(biāo)識符兩側(cè)的序列可用于引導(dǎo)NSI的鑒定。通過增加條形碼的大小,可能性的數(shù)目增加。三個(gè)DNA堿基允許64種可能的3-mer序列(43)、256種可能的4_mers序列(=44)、1024種可能的5-mers序列(=45)、以及4096種可能的7_mers序列(=46)等。然而實(shí)際上,優(yōu)選選擇來自這些序列的子集,來避免在相同實(shí)驗(yàn)中使用僅有一個(gè)堿基區(qū)別(t匕如,例如在4-mers情況中GATC和GATT)的核苷酸序列標(biāo)識符,因?yàn)檫@可導(dǎo)致在一個(gè)堿基擴(kuò)增-或測序誤差的情況下的錯(cuò)誤指定。相似地,可優(yōu)選避免使用具有兩個(gè)相同的連續(xù)的堿基的核苷酸序列標(biāo)識符(如在5-mer情況中AATGC具有兩個(gè)連續(xù)的A),因?yàn)槟承㎞GS平臺對所謂的“同聚物”序列有較高的誤差率。盡管這種選擇準(zhǔn)則,通常不缺少合適的核苷酸序列標(biāo)識符,因?yàn)槠溟L度增加一個(gè)堿基就產(chǎn)生高四倍的可從中選擇的起始數(shù)目。
因此,例如當(dāng)在制備的樣本DNA的高通量測序方法中確定兩個(gè)NSI序列時(shí),兩個(gè)NSI的組合確定制備的樣本DNA的來源。這種方式可顯著減少NSI的數(shù)目,并且因此例如可顯著減少所要用的不同引物和/或接頭的數(shù)目。例如,對于100個(gè)樣本,目前使用100個(gè)NSI,如包括NSI的100個(gè)不同正向引物同一個(gè)反向引物組合。根據(jù)本發(fā)明,通過使用分割條形碼,10個(gè)NSI就足夠了,并且因此可使用10個(gè)不同的正向引物和10個(gè)不同的反向引物,由此可產(chǎn)生100個(gè)獨(dú)特組合。因此,所要用的引物總數(shù)顯著減少,數(shù)目從101個(gè)引物降低到20個(gè)引物。因此,降低了樣本制備流程的復(fù)雜程度、增加了樣本等同表示(representation)的可能、降低了工作量和所需的儲存容量并降低了實(shí)驗(yàn)成本。在另一實(shí)施方式中,提供了至少兩個(gè)NSI的組合在制備用于高通量測序的樣本DNA中的用途,其中在高通量測序中使用多個(gè)制備的樣本DNA,其中各樣本DNA制備包括至少兩個(gè)NSI的獨(dú)特組合,其中第一 NSI選自一組NSI,且第二 NSI選自一組NSI。所用的NSI的組包括所有NSI。對于各樣本DNA,核苷酸序列標(biāo)識符選自這樣的組。這意味著對于樣本DNA對于至少兩個(gè)NSI,可以在NSI的組合中選擇相同的NSI。此外,對于樣本DNA對于至少兩個(gè)NSI,可以在NSI的組合中選擇不同的NSI。只要NSI的組合對于各樣本DNA是獨(dú)特的,這種組合就可用。NSI的組還可包括至少兩個(gè)NSI的亞組,其中各第一和第二 NSI可選自不同亞組。除了第一和第二 NSI,其它可用的NSI選自NSI的組。一組NSI可包括至少4、10、100或1000個(gè)NSI。應(yīng)當(dāng)理解,其中貫穿本發(fā)明提供一組NSI,該組可實(shí)質(zhì)上提供,即不是物理上的。例如該組可在計(jì)算機(jī)上(in silico)和/或物理上(in physico)提供。例如,一組NSI可作為一個(gè)序列列表而提供。NSI可選自該列表并用于在計(jì)算機(jī)上設(shè)計(jì)引物和/或接頭。因此應(yīng)理解,提供一組NSI和提供接頭的隨后步驟可包括在計(jì)算機(jī)上提供一組NSI (其選自計(jì)算機(jī)上的NSI組)、在計(jì)算機(jī)上設(shè)計(jì)接頭、和隨后物理上提供包括NSI的接頭?;蛘?,還可物理上提供NSI并直接使用,例如,在這樣的情形中,其中使用由核苷酸序列標(biāo)識符組成的接頭?;蛘呃?,可物理上提供NSI并連結(jié)(如連接或其它)至其它核苷酸鏈,從而產(chǎn)生接頭和/或擴(kuò)增引物,從而提供包括NSI的接頭和/或擴(kuò)增引物。
本發(fā)明的原理是通過使用至少兩個(gè)不同核苷酸序列標(biāo)識符產(chǎn)生大量獨(dú)特組合,其中核苷酸序列標(biāo)識符并入各樣本,以及探索倍增的能力以便減少預(yù)付的試劑成本。在表I中顯示了對于兩個(gè)NSI的一些數(shù)學(xué)最優(yōu)情況。表I.具有兩個(gè)NSI的NSI最優(yōu)組合
權(quán)利要求
1.至少兩個(gè)核苷酸序列標(biāo)識符的組合在制備用于高通量測序的樣本DNA中的用途。
2.根據(jù)權(quán)利要求I的用途,其中在高通量測序中使用多個(gè)制備的樣本DNA,其中樣本DNA的各制備包括至少兩個(gè)核苷酸序列標(biāo)識符的獨(dú)特組合,其中第一核苷酸序列標(biāo)識符選自一組核苷酸序列標(biāo)識符,且第二核苷酸序列標(biāo)識符選自核苷酸序列標(biāo)識符的組。
3.根據(jù)權(quán)利要求2的用途,其中除了第一和第二核苷酸序列標(biāo)識符以外,還使用選自核苷酸序列標(biāo)識符的組的其它核苷酸序列標(biāo)識符。
4.根據(jù)權(quán)利要求1-3的用途,其中制備的樣本DNA包括擴(kuò)增子。
5.根據(jù)權(quán)利要求1-4的用途,其中制備的樣本DNA包括接頭連接的DNA片段。
6.根據(jù)權(quán)利要求1-5的用途,其中制備的樣本DNA包括擴(kuò)增的接頭連接的片段和/或接頭連接的擴(kuò)增子。
7.根據(jù)權(quán)利要求1-6的用途,其中在高通量測序方法中使用制備的樣本DNA的單一DNA模板。
8.根據(jù)權(quán)利要求7的用途,其中單一DNA模板包括兩個(gè)測序引物結(jié)合位點(diǎn),其中各測序引物結(jié)合位點(diǎn)位于不同核苷酸序列標(biāo)識符的3’。
9.用于鑒定連接的和/或擴(kuò)增的樣本DNA的樣本來源的方法,包括 a)提供接頭和/或擴(kuò)增引物,其中至少第一接頭或擴(kuò)增引物包括選自核苷酸序列標(biāo)識符的組的第一核苷酸序列標(biāo)識符,提供第二接頭或擴(kuò)增引物,其包括選自核苷酸序列標(biāo)識符的組的第二核苷酸序列標(biāo)識符,其中任選地,提供其它接頭或擴(kuò)增引物,其包括選自核苷酸序列標(biāo)識符的組的其它核苷酸序列標(biāo)識符; b)提供多個(gè)樣本DNA; c)使用接頭和/或擴(kuò)增引物在樣本DNA上進(jìn)行連接和/或擴(kuò)增反應(yīng),以提供包括第一、第二和任選其它核苷酸序列標(biāo)識符的連接的和/或擴(kuò)增的樣本DNA ; d)使用高通量測序確定至少第一、第二和任選其它核苷酸序列標(biāo)識符的序列; e)確定連接的和/或擴(kuò)增的樣本DNA的樣本來源。
10.用于從多個(gè)樣本DNA鑒定擴(kuò)增子樣本來源的方法,其包括步驟 a)提供多個(gè)樣本DNA; b)提供一組核苷酸序列標(biāo)識符; c)提供第一擴(kuò)增引物,各第一引物包括選自核苷酸序列標(biāo)識符的組的第一核苷酸序列標(biāo)識符; d)提供第二擴(kuò)增引物,各第二引物包括選自核苷酸序列標(biāo)識符的組的第二核苷酸序列標(biāo)識符; e)用一對獨(dú)特的第一和第二擴(kuò)增引物擴(kuò)增各樣本DNA,得到擴(kuò)增子; f)任選地,合并至少部分?jǐn)U增子; g)使用高通量測序確定擴(kuò)增子的第一標(biāo)識符序列和第二標(biāo)識符序列的序列; h)確定擴(kuò)增子的樣本來源。
11.用于從多個(gè)樣本DNA鑒定接頭連接的DNA片段的樣本來源的方法,其包括步驟 a)提供多個(gè)樣本DNA; b)提供一組核苷酸序列標(biāo)識符; c)提供第一接頭,各第一接頭包括選自核苷酸序列標(biāo)識符的組的第一核苷酸序列標(biāo)識符; d)提供第二接頭,各第二接頭包括選自核苷酸序列標(biāo)識符的組的第二核苷酸序列標(biāo)識符; e)各樣本DNA進(jìn)行片段化; f)將一對獨(dú)特的第一和第二接頭連接至各片段化的樣本DNA,得到接頭連接的DNA片段; g)任選地,合并至少部分接頭連接的DNA片段; h)使用高通量測序確定接頭連接的DNA片段的第一標(biāo)識符序列和第二標(biāo)識符序列的序列; i)確定接頭連接的DNA片段的樣本來源。
12.用于鑒定接頭連接的擴(kuò)增子的樣本來源的方法,其包括步驟 a)提供多個(gè)樣本DNA; b)提供一組核苷酸序列標(biāo)識符; c)提供第一擴(kuò)增引物; d)提供第二擴(kuò)增引物; e)用一對第一和第二擴(kuò)增引物擴(kuò)增樣本DNA,得到擴(kuò)增子; f)任選地,合并樣本DNA的至少部分?jǐn)U增子,其中各樣本DNA是利用不同的引物對進(jìn)行擴(kuò)增的; g)任選,擴(kuò)增子進(jìn)行片段化; h)提供第一接頭,各第一接頭包括選自核苷酸序列標(biāo)識符的組的第一核苷酸序列標(biāo)識符; i)提供第二接頭,各第二接頭包括選自核苷酸序列標(biāo)識符的組的第二核苷酸序列標(biāo)識符; j )任選,提供其它接頭,各接頭包括選自核苷酸序列標(biāo)識符的組的其它核苷酸序列標(biāo)識符; k)將第一接頭連接至(片段化的)擴(kuò)增子; I)任選地,合并來自步驟k)的至少部分接頭連接的擴(kuò)增子; m)用第二和其它接頭重復(fù)連接步驟,各連接步驟之后任選地,合并至少部分獲得的接頭連接的擴(kuò)增子; η)使用高通量測序確定步驟m)中獲得的接頭連接的擴(kuò)增子的第一、第二和任選其它標(biāo)識符序列的序列; ο)確定接頭連接的擴(kuò)增子的樣本來源。
13.用于從多個(gè)樣本DNA鑒定擴(kuò)增的接頭連接的DNA片段的樣本來源的方法,其包括步驟 a)提供多個(gè)樣本DNA; b)提供一組核苷酸序列標(biāo)識符; c)提供第一接頭,各第一接頭包括選自核苷酸序列標(biāo)識符的組的第一核苷酸序列標(biāo)識符; d)任選地,提供第二接頭,各第二接頭任選包括選自核苷酸序列標(biāo)識符的組的第二核苷酸序列標(biāo)識符; e)各樣本DNA進(jìn)行片段化; f)將至少第一接頭和任選第二接頭連接至片段化的樣本DNA,得到接頭連接的DNA片段; g)任選地,合并至少部分接頭連接的DNA片段; h)提供第一擴(kuò)增引物,各第一引物包括選自核苷酸序列標(biāo)識符的組的第三核苷酸序列標(biāo)識符; i)任選地,提供第二擴(kuò)增引物,各第二引物任選包括選自核苷酸序列標(biāo)識符的組的第四核苷酸序列標(biāo)識符; j)用第一擴(kuò)增引物和任選第二擴(kuò)增引物擴(kuò)增接頭連接的DNA片段,其中第一、任選第二、第三和任選第四核苷酸序列標(biāo)識符的組合對于各樣本是獨(dú)特的,得到擴(kuò)增的接頭連接的DNA片段; k)任選地,合并至少部分?jǐn)U增的接頭連接的DNA片段; I)使用高通量測序確定擴(kuò)增的接頭連接的DNA片段的第一、任選第二、第三和任選第四標(biāo)識符序列的序列; m)確定擴(kuò)增的接頭連接的DNA片段的樣本來源。
14.用于鑒定接頭連接的擴(kuò)增子的樣本來源的方法,其包括步驟 a)提供多個(gè)樣本DNA; b)提供一組核苷酸序列標(biāo)識符; c)提供第一擴(kuò)增引物,各第一引物包括選自核苷酸序列標(biāo)識符的組的第一核苷酸序列標(biāo)識符; d)提供第二擴(kuò)增引物,各第二引物任選包括選自核苷酸序列標(biāo)識符的組的第二核苷酸序列標(biāo)識符; e)用一對第一和第二擴(kuò)增引物擴(kuò)增各樣本DNA,得到擴(kuò)增子; f)任選地,合并至少部分樣本DNA的擴(kuò)增子,其中各樣本DNA是利用不同的引物對進(jìn)行擴(kuò)增的; g)任選,擴(kuò)增子進(jìn)行片段化; h)提供第一接頭,各第一接頭包括選自核苷酸序列標(biāo)識符的組的第三核苷酸序列標(biāo)識符; i )任選,提供第二接頭,各第二接頭任選包括選自核苷酸序列標(biāo)識符的組的第四核苷酸序列標(biāo)識符; j )將至少第一接頭和任選第二接頭連接至(片段化的)擴(kuò)增子,其中第一、任選第二、第三和任選第四核苷酸序列標(biāo)識符的組合對于各樣本是獨(dú)特的,得到接頭連接的擴(kuò)增子;k)任選地,合并至少部分接頭連接的擴(kuò)增子; I)使用高通量測序確定接頭連接的擴(kuò)增子的第一、任選第二、第三和任選第四標(biāo)識符序列的序列; m)確定接頭連接的擴(kuò)增子的樣本來源。
15.根據(jù)權(quán)利要求9-14任一項(xiàng)的方法,其中在使用高通量測序確定標(biāo)識符序列的序列的步驟中,從制備的樣本DNA的單一 DNA模板確定標(biāo)識符序列的序列。
16.根據(jù)權(quán)利要求15的方法,其中在單一DNA模板中,第一第二和任選其它標(biāo)識符序列是內(nèi)部序列的至少3'或5'。
17.根據(jù)權(quán)利要求16的方法,其中單一DNA模板包括兩個(gè)測序引物結(jié)合位點(diǎn),其中各測序引物結(jié)合位點(diǎn)位于不同核苷酸序列標(biāo)識符的3',并且其中在高通量測序方法中從單一DNA模板的兩個(gè)測序引物結(jié)合位點(diǎn)用兩個(gè)測序引物進(jìn)行兩個(gè)不同測序反應(yīng)。
18.根據(jù)權(quán)利要求16的方法,其中單一DNA模板包括兩個(gè)測序引物結(jié)合位點(diǎn),其中至少一個(gè)測序引物結(jié)合位點(diǎn)位于至少兩個(gè)核苷酸序列標(biāo)識符的3',并且其中在高通量測序方法中從單一 DNA模板的兩個(gè)測序引物結(jié)合位點(diǎn)用兩個(gè)測序引物進(jìn)行兩個(gè)不同測序反應(yīng)。
全文摘要
本發(fā)明涉及至少兩個(gè)核苷酸序列標(biāo)識符的組合在制備用于高通量測序的樣本DNA中的方法和用途。因此,在多種制備的樣本DNA的高通量測序中,樣本DNA的各制備包括至少兩個(gè)核苷酸序列標(biāo)識符的獨(dú)特組合,其中第一核苷酸序列標(biāo)識符選自核苷酸序列標(biāo)識符的一組,且第二核苷酸序列標(biāo)識符選自核苷酸序列標(biāo)識符的一組。
文檔編號C12N15/10GK102933721SQ201180028072
公開日2013年2月13日 申請日期2011年6月8日 優(yōu)先權(quán)日2010年6月9日
發(fā)明者M·J·T·萬艾克, H·J·A·萬德爾珀?duì)?申請人:凱津公司