相關(guān)申請(qǐng)
本申請(qǐng)要求于2016年4月1日提交的申請(qǐng)?zhí)枮?01610206799.9的中國(guó)專利申請(qǐng)的優(yōu)先權(quán),其全部?jī)?nèi)容通過引用并入本申請(qǐng)。
本發(fā)明涉及dna連接酶介導(dǎo)的擴(kuò)增技術(shù),特別地涉及一種dna連接酶介導(dǎo)的擴(kuò)增低含量dna的技術(shù)。該擴(kuò)增技術(shù)可用于snp或者基因拷貝數(shù)檢測(cè)。
背景技術(shù):
在人類和其他哺乳動(dòng)物中,很多疾病都與基因的突變密切相關(guān)。突變有多種形式,比如在單個(gè)個(gè)體或細(xì)胞中最為常見類型的突變往往會(huì)發(fā)生在dna序列的單一位點(diǎn)上(singlenucleotidepolymorphism,snp);而另一種常見的突變則為拷貝數(shù)變異(copynumbervariation,cnv)。
snp是指主要是指在基因組水平上由單個(gè)核苷酸的變異所引起的dna序列多態(tài)性。snp所表現(xiàn)的多態(tài)性只涉及到單個(gè)堿基的變異,這種變異可由單個(gè)堿基的轉(zhuǎn)換(transition)或顛換(transversion)所引起,也可由堿基的插入或缺失所致,但通常所說的snp并不包括后兩種情況。在人類基因組中單核苷酸變異的頻率約為0.1%,即大概每1000個(gè)堿基就有一個(gè)snp。研究表明可以通過snp發(fā)現(xiàn)疾病相關(guān)基因突變,雖然有些snp并不直接導(dǎo)致疾病,但由于其所處位置與某些疾病基因相鄰,因而也成為某些疾病的重要標(biāo)記物。
cnv一般指長(zhǎng)度為1kb以上的基因組大片段的拷貝數(shù)增加或者減少,其主要表現(xiàn)為亞顯微水平的缺失和重復(fù)。cnv是基因組結(jié)構(gòu)變異(structuralvariation,sv)的重要組成部分。cnv位點(diǎn)的突變率遠(yuǎn)高于snp,是人類疾病的重要致病因素之一。cnv可以導(dǎo)致呈孟德爾遺傳的單基因病與罕見疾病,同時(shí)與復(fù)雜疾病也相關(guān),例如大量研究表明一些不同類型的腫瘤中均存在cnv。cnv致病的可能機(jī)制有基因劑量效應(yīng)、基因斷裂、基因融合和位置效應(yīng)等。對(duì)cnv的深入研究,可以使我們對(duì)人類基因組的構(gòu)成、個(gè)體間的遺傳差異、以及遺傳致病因素有新的認(rèn)識(shí)。對(duì)cnv的檢測(cè)也有可能有助于準(zhǔn)確判斷個(gè)體的疾病類型、亞型或抗藥性等,從而可以有針對(duì)性地制定特殊的治療方案。
當(dāng)前用于探究snp和cnv的強(qiáng)大工具就是單細(xì)胞測(cè)序。單細(xì)胞測(cè)序是指在單細(xì)胞水平(并不限于一個(gè)細(xì)胞,而是指相對(duì)少量的細(xì)胞(如少于103個(gè)細(xì)胞),或等同單細(xì)胞水平的量的dna(如單染色體或0.5-3pg的基因組dna))上進(jìn)行基因測(cè)序的技術(shù)。由于單個(gè)細(xì)胞里的dna或rna僅僅處在皮克(picograms,pg)級(jí)的水平,其遠(yuǎn)遠(yuǎn)達(dá)不到現(xiàn)有測(cè)序儀的最低上樣需求,因此必須先對(duì)單細(xì)胞內(nèi)的微量核酸分子進(jìn)行擴(kuò)增以便用于測(cè)序。在單細(xì)胞水平上進(jìn)行基因擴(kuò)增會(huì)帶來一些問題:1.前對(duì)于單細(xì)胞轉(zhuǎn)錄組的擴(kuò)增技術(shù),很難得到全長(zhǎng)轉(zhuǎn)錄本。2.擴(kuò)增存在偏性,即,有些轉(zhuǎn)錄本或者某些區(qū)域容易被擴(kuò)增一些,使得最終的基因的表達(dá)量之間的數(shù)量關(guān)系并沒有真實(shí)的反應(yīng)細(xì)胞里的真實(shí)情況。3.在擴(kuò)增過程中會(huì)引入一些錯(cuò)誤,由于模板量非常低,上述錯(cuò)誤會(huì)經(jīng)由擴(kuò)增被放大很多倍。4.擴(kuò)增過程3’和5’端的偏性會(huì)導(dǎo)致表達(dá)量計(jì)算過程中出現(xiàn)問題。而對(duì)于snp和cnv來說,擴(kuò)增過程中的偏性會(huì)大大影響snp和cnv識(shí)別的準(zhǔn)確度和分辨率。
因此,目前急需一種能夠盡量降低擴(kuò)增中引入的誤差和/或有效去除擴(kuò)增偏性的方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的一個(gè)方面提供了一種在dna水平上擴(kuò)增目標(biāo)區(qū)域的方法,特別是在低含量的dna中擴(kuò)增目標(biāo)區(qū)域的方法。
在一些實(shí)施方式中,所述在dna水平上擴(kuò)增目標(biāo)區(qū)域的方法包括:重復(fù)n個(gè)循環(huán)的第一輪擴(kuò)增,其中n為整數(shù)且1≤n≤40,所述第一輪擴(kuò)增包括以下步驟:i)變性dna模板以獲得單條目標(biāo)dna鏈;ii)將用于擴(kuò)增目標(biāo)區(qū)域的第一輪擴(kuò)增引物對(duì)雜交至所述目標(biāo)dna鏈上,每對(duì)所述第一輪擴(kuò)增引物對(duì)包括一個(gè)上游引物和一個(gè)下游引物,所述上游引物雜交至目標(biāo)區(qū)域的第一核酸序列,所述下游引物雜交至目標(biāo)區(qū)域的第二核酸序列,其中第一核酸序列和第二核酸序列在同一條目標(biāo)dna鏈上,并且所述第一核酸序列和第二核酸序列之間間隔m個(gè)核苷酸,其中m為≥0的整數(shù),其中第一核酸序列在所述目標(biāo)dna鏈上位于第二核酸序列的下游,并且所述下游引物包含磷酸化的5’末端;iii)可選地,在所述上游引物和/或一個(gè)下游引物3’末端以所述反義鏈作為模板進(jìn)行延伸;iv)通過將上述上游引物或其延伸產(chǎn)物與上述下游引物或其延伸產(chǎn)物連接得到包含目標(biāo)區(qū)域的半擴(kuò)增產(chǎn)物,其中所述半擴(kuò)增產(chǎn)物為所述單條目標(biāo)dna鏈的反義鏈。在另一些實(shí)施方式中,所述初始dna模板為雙鏈dna。在一些實(shí)施方式中,所述初始dna模板為單鏈dna。
在一些實(shí)施方式中,第一核酸序列和第二核酸序列的長(zhǎng)度范圍為不低于6bp、不低于7bp、不低于8bp、不低于9bp、不低于10bp、不高于50bp、不高于40bp、不高于30bp、6-50bp、6-40bp、6-30bp、6-20bp。在一些實(shí)施方式中,第一核酸序列和第二核酸序列的長(zhǎng)度范圍為6-30bp。
在一些實(shí)施方式中,m=0,即第一核酸序列與第二核酸序列緊鄰。在一些實(shí)施方式中,m≤100,即第一核酸序列與第二核酸序列之間間隔不高于100bp。在一些實(shí)施方式中,第一核酸序列與第二核酸序列之間間隔不高于90bp、不高于80bp、不高于70bp、不高于60bp、不高于50bp、不高于40bp、不高于30bp、不高于20bp、不高于10bp。在另一些實(shí)施方式中,第一核酸序列與第二核酸序列之間間隔不低于90bp、不低于80bp、不低于70bp、不低于60bp、不低于50bp、不低于40bp、不低于30bp、不低于20bp、不低于10bp。
在一些實(shí)施方式中,所述上游引物包含接頭序列。在一些實(shí)施方式中,所述上游引物和所述下游引物均包含接頭序列。在一些實(shí)施方式中,所述上游引物和所述下游引物包含雜交序列。在一些特定的實(shí)施方式中,所述雜交序列中進(jìn)一步包含隨機(jī)序列。在一些實(shí)施方式中,所述上游引物包括的雜交序列包括或?yàn)殡S機(jī)序列,所述下游引物包含的雜交序列為特異性識(shí)別所述目標(biāo)區(qū)域的雜交序列。在一些實(shí)施方式中,所述上游引物和所述下游引物包含的雜交序列均為特異性識(shí)別所述目標(biāo)區(qū)域的雜交序列。
在一些實(shí)施方式中,所述上游引物具有5’末端接頭序列。在一些實(shí)施方式中,所述上游引物具有5’末端接頭序列,所述下游引物具有3’末端接頭序列。
在一些實(shí)施方式中,第一核酸序列與第二核酸序列緊鄰,通過使用耐高溫連接酶將上游引物3’端與下游引物或下游引物的延伸產(chǎn)物的5’端直接連接得到半擴(kuò)增產(chǎn)物。
在一些實(shí)施方式中,第一核酸序列與第二核酸序列之間間隔m個(gè)核苷酸,通過dna聚合酶在上游引物3’端延伸m個(gè)核苷酸至與下游引物5’端緊鄰的位置,獲得上游引物的延伸產(chǎn)物。在一些實(shí)施方式中,通過使用耐高溫連接酶將上游引物的延伸產(chǎn)物與下游引物或其延伸產(chǎn)物連接得到半擴(kuò)增產(chǎn)物。
在一些實(shí)施方式中,第一輪擴(kuò)增為線性擴(kuò)增,所述半擴(kuò)增產(chǎn)物即為第一輪擴(kuò)增產(chǎn)物,在dna水平上擴(kuò)增目標(biāo)區(qū)域的方法進(jìn)一步包括:對(duì)所述半擴(kuò)增產(chǎn)物進(jìn)行測(cè)序以確定所述目標(biāo)區(qū)域的序列。
在一些實(shí)施方式中,所述上游引物包括的雜交序列為隨機(jī)序列,所述第一輪擴(kuò)增進(jìn)一步包括:v)將所述上游引物雜交至所述半擴(kuò)增產(chǎn)物,并且在所述上游引物的3’末端以所述半擴(kuò)增產(chǎn)物作為模板進(jìn)行延伸,獲得第一輪擴(kuò)增產(chǎn)物。
在一些實(shí)施方式中,在dna水平上擴(kuò)增目標(biāo)區(qū)域的方法進(jìn)一步包括:使用所述第一輪擴(kuò)增產(chǎn)物為模板通過聚合酶鏈?zhǔn)椒磻?yīng)pcr擴(kuò)增所述目標(biāo)區(qū)域以生成指數(shù)擴(kuò)增產(chǎn)物。在一些實(shí)施方式中,在dna水平上擴(kuò)增目標(biāo)區(qū)域的方法進(jìn)一步包括:對(duì)所述指數(shù)擴(kuò)增產(chǎn)物進(jìn)行測(cè)序以確定所述目標(biāo)區(qū)域的序列。
在一些實(shí)施方式中,在dna水平上擴(kuò)增目標(biāo)區(qū)域的方法進(jìn)一步包括:將所述目標(biāo)序列的測(cè)序結(jié)果與參考樣本相比較以確定所述目標(biāo)序列的拷貝數(shù)。在一些實(shí)施方式中,所述參考樣本序列具有兩個(gè)拷貝。
本發(fā)明的另一個(gè)方面提供了一種用于在dna水平上擴(kuò)增目標(biāo)區(qū)域的試劑盒。在一些實(shí)施方式中,所述試劑盒包括:第一輪擴(kuò)增引物對(duì),其中每對(duì)所述引物對(duì)包括一個(gè)上游引物和一個(gè)下游引物,所述上游引物和下游引物雜交至目標(biāo)dna鏈上,其中所述上游引物雜交至所述目標(biāo)區(qū)域的第一核酸序列,所述下游引物雜交至所述目標(biāo)區(qū)域的第二核酸序列,其中所述第一核酸序列和所述第二核酸序列之間間隔m個(gè)核苷酸,其中m為≥0的整數(shù),其中所述第一核酸序列在所述目標(biāo)dna鏈上位于第二核酸序列的下游,并且所述下游引物包含磷酸化的5’末端;以及連接試劑,其中所述連接試劑用于將所述上游引物或其延伸產(chǎn)物與所述下游引物或其延伸產(chǎn)物連接得到半擴(kuò)增產(chǎn)物。
在一些實(shí)施方式中,所述連接試劑包括連接酶及連接酶反應(yīng)溶液。在一些實(shí)施方式中,所述連接酶為耐高溫連接酶。
在一些實(shí)施方式中,用于在dna水平上擴(kuò)增目標(biāo)區(qū)域的試劑盒進(jìn)一步包括:延伸試劑,所述延伸試劑用于在所述上游引物和/或所述下游引物3’末端以所述反義鏈作為模板進(jìn)行延伸,得到所述上游引物和/或所述下游引物的延伸產(chǎn)物。在一些實(shí)施方式中,延伸試劑包括dna聚合酶、反應(yīng)試劑以及dntp,所述dntp由datp、dttp、dgtp、dctp中的任意一種或多種組成。在一些實(shí)施方式中,所述延伸試劑還可用于當(dāng)所述上游引物雜交至所述半擴(kuò)增產(chǎn)物上時(shí),在所述上游引物的3’末端以所述半擴(kuò)增產(chǎn)物作為模板進(jìn)行延伸,獲得第一輪擴(kuò)增產(chǎn)物。
在一些實(shí)施方式中,所述上游引物具有5’末端接頭序列。在一些實(shí)施方式中,所述上游引物具有5’末端接頭序列,所述下游引物具有3’末端接頭序列。在一些實(shí)施方式中,所述上游引物和所述下游引物包含雜交序列。在一些特定的實(shí)施方式中,所述雜交序列中進(jìn)一步包含隨機(jī)序列。在一些實(shí)施方式中,所述上游引物包括的雜交序列包括或?yàn)殡S機(jī)序列,所述下游引物包含的雜交序列為特異性識(shí)別所述目標(biāo)區(qū)域的雜交序列。在一些實(shí)施方式中,所述上游引物和所述下游引物包含的雜交序列均為特異性識(shí)別所述目標(biāo)區(qū)域的雜交序列。在一些實(shí)施方式中,用于在dna水平上擴(kuò)增目標(biāo)區(qū)域的試劑盒進(jìn)一步包括:指數(shù)擴(kuò)增試劑,所述指數(shù)擴(kuò)增試劑用于以所述第一輪擴(kuò)增產(chǎn)物為模板擴(kuò)增所述目標(biāo)區(qū)域得到指數(shù)擴(kuò)增產(chǎn)物。在一些實(shí)施方式中,指數(shù)擴(kuò)增試劑包括dna聚合酶、反應(yīng)試劑以及dntp。
在一些實(shí)施方式中,指數(shù)擴(kuò)增試劑進(jìn)一步包括指數(shù)擴(kuò)增通用引物,其中所述指數(shù)擴(kuò)增通用引物包括與第一輪擴(kuò)增中所述上游引物的5’末端接頭序列相同或反向互補(bǔ)的序列和/或第一輪所述下游引物的3’末端接頭序列相同或反向互補(bǔ)的序列。
在一些實(shí)施方式中,用于在dna水平上擴(kuò)增目標(biāo)區(qū)域的試劑盒進(jìn)一步包括:測(cè)序試劑,所述測(cè)序試劑用于對(duì)所述第一輪擴(kuò)增產(chǎn)物或所述指數(shù)擴(kuò)增產(chǎn)物進(jìn)行測(cè)序。
附圖說明
通過下面說明書和所附的權(quán)利要求書并與附圖結(jié)合,將會(huì)更加充分地描述本申請(qǐng)內(nèi)容的上述和其他特征??梢岳斫?,這些附圖僅描繪了本申請(qǐng)內(nèi)容的若干實(shí)施方式,因此不應(yīng)認(rèn)為是對(duì)本申請(qǐng)內(nèi)容范圍的限定。通過采用附圖,本申請(qǐng)內(nèi)容將會(huì)得到更加明確和詳細(xì)的說明。
圖1為本申請(qǐng)擴(kuò)增方法中第一輪擴(kuò)增為線性擴(kuò)增時(shí)的基本原理示意圖;
圖2為本申請(qǐng)擴(kuò)增方法中第一輪擴(kuò)增不為線性擴(kuò)增時(shí)的基本原理示意圖;
圖3為本申請(qǐng)擴(kuò)增方法中指數(shù)擴(kuò)增的基本原理示意圖;
圖4為本申請(qǐng)一種示例性的擴(kuò)增方法用于dna拷貝數(shù)差異(cnv)檢測(cè)的基本原理示意圖;
圖5為本申請(qǐng)中的擴(kuò)增方法的一種具體實(shí)施方式。
具體實(shí)施方式
本發(fā)明的一個(gè)方面提供了一種在dna水平上擴(kuò)增目標(biāo)區(qū)域的方法,特別是在低含量dna中擴(kuò)增目標(biāo)區(qū)域的方法。本發(fā)明至少部分基于以下發(fā)現(xiàn),即,dna連接酶介導(dǎo)的dna擴(kuò)增方法可以實(shí)現(xiàn):1)降低在擴(kuò)增過程中引入的誤差;2)有效去除擴(kuò)增偏性,這兩個(gè)效果中的一個(gè)或兩個(gè)。
在一些實(shí)施方式中,本申請(qǐng)?zhí)峁┑脑赿na水平上擴(kuò)增目標(biāo)區(qū)域的方法包括:重復(fù)n個(gè)循環(huán)的第一輪擴(kuò)增,其中n為整數(shù)且1≤n≤40,所述第一輪擴(kuò)增包括以下步驟:i)變性dna模板以獲得單條目標(biāo)dna鏈;ii)將用于擴(kuò)增目標(biāo)區(qū)域的引物對(duì)雜交至所述目標(biāo)dna單鏈上,每對(duì)所述引物對(duì)包括一個(gè)上游引物和一個(gè)下游引物,所述上游引物雜交至目標(biāo)區(qū)域的第一核酸序列,所述下游引物雜交至目標(biāo)區(qū)域的第二核酸序列,其中第一核酸序列和第二核酸序列之間間隔m個(gè)核苷酸,其中m為≥0的整數(shù),其中第一核酸序列在所述目標(biāo)dna鏈上位于第二核酸序列的下游,并且所述下游引物包含磷酸化的5’末端;iii)可選地,在所述上游引物和/或一個(gè)下游引物3’末端以所述反義鏈作為模板進(jìn)行延伸;iv)通過將上述上游引物或其延伸產(chǎn)物與上述下游引物或其延伸產(chǎn)物連接得到半擴(kuò)增產(chǎn)物。
本申請(qǐng)所述的“dna”是指由脫氧核苷酸組成的遺傳指令的長(zhǎng)鏈聚合物生物大分子?!癲na水平”是指核苷酸水平。dna中的每個(gè)核苷酸由含氮堿基、五碳糖(2-脫氧核糖)和磷酸基團(tuán)組成。相鄰的核苷酸通過脫氧核糖和磷酸形成酯鍵相連從而組成長(zhǎng)鏈骨架組成。核苷酸分子兩端并不對(duì)稱,其分別含有磷酸基團(tuán)和羥基基團(tuán),dna鏈中相鄰的核苷酸分子彼此間形成磷酸二酯鍵,而dna鏈兩端的分子分別保留了一個(gè)磷酸基團(tuán)和一個(gè)羥基基團(tuán),其中含有磷酸基團(tuán)的一端被稱為5’末端,而含有羥基基團(tuán)的一端被稱為3’末端。在同一dna鏈上的某一dna片段/堿基a相對(duì)于另一片段/堿基b的位置可以用上下游來表示,上下游是一個(gè)相對(duì)概念,當(dāng)描述dna片段/堿基a位于片段/堿基b的上游時(shí),是指該dna片段/堿基a相對(duì)于片段/堿基b而言更接近于其所處dna鏈的5’末端,反之當(dāng)描述dna片段/堿基a位于片段/堿基b的下游時(shí),是指該dna片段/堿基a相對(duì)于片段/堿基b而言更接近于其所處dna鏈的3’末端。
dna的核苷酸中的含氮堿基一般有四種,分別為腺嘌呤(a)、鳥嘌呤(g)和胞嘧啶(c)、胸腺嘧啶(t)。兩條dna長(zhǎng)鏈上的堿基通過氫鍵配對(duì),其中腺嘌呤(a)和胸腺嘧啶(t)配對(duì),鳥嘌呤(g)和胞嘧啶(c)配對(duì),從而使得大部分dna以雙鏈雙螺旋結(jié)構(gòu)存在,而該雙鏈結(jié)構(gòu)在經(jīng)熱或堿處理時(shí)會(huì)發(fā)生氫鏈的斷裂,從而使得雙鏈dna分子變性分離為兩條單鏈dna。
本申請(qǐng)中所述的“目標(biāo)區(qū)域”泛指一切目標(biāo)檢測(cè)位置。在一些優(yōu)選的實(shí)施方式中,所述目標(biāo)區(qū)域是已知的與某些疾病(例如腫瘤、炎癥、出生缺陷等)有關(guān)的cnv或snp區(qū)域。在一些優(yōu)選的實(shí)施方式中,所述目標(biāo)區(qū)域是與染色體微重復(fù)和微缺失綜合征(mms)相關(guān)的基因組區(qū)域。
在進(jìn)行第1個(gè)循環(huán)的第一輪擴(kuò)增時(shí),本文所述的“dna模板”是指初始dna模板;而在n>1的第n次循環(huán)時(shí),本文所述的“dna模板”是指第n-1次循環(huán)中步驟iii)中獲得的擴(kuò)增產(chǎn)物(半擴(kuò)增產(chǎn)物和/或第一輪擴(kuò)增產(chǎn)物)中所包含的雙鏈模板。
本申請(qǐng)所述的“初始dna模板”是指用于本申請(qǐng)的擴(kuò)增方法的最初的作為模板的dna樣本。本申請(qǐng)中用于擴(kuò)增的初始dna模板可以為單鏈dna,也可以為雙鏈dna。
初始dna模板可來源于任意形式的生物樣本。本申請(qǐng)所述的“生物樣本”包括但不限于細(xì)胞(包括但不限于:細(xì)菌、病毒或動(dòng)植物細(xì)胞)、組織(包括但不限于:正常、壞死、癌、癌旁組織等)、體液(包括但不限于:血液、血漿、血清、唾液、羊水穿刺液、胸腔積液、腹腔積液)等。本申請(qǐng)涉及的生物樣本可以來自任何物種或生物種類,包括但不限于,人類、哺乳動(dòng)物、牛、豬、羊、馬、嚙齒動(dòng)物、禽類、魚類、斑馬魚、蝦、植物、酵母、病毒或細(xì)菌。本領(lǐng)域技術(shù)人員可以通過任何公知的方法獲取該生物樣本,包括但不限于通過細(xì)胞培養(yǎng)、手術(shù)、解剖、抽血、擦拭、灌洗等取樣方式。生物樣品可以以任何適當(dāng)?shù)男问教峁缈梢砸孕迈r分離、石蠟包埋、冷藏、冷凍等形式提供。
在一些實(shí)施方式中,生物樣本為細(xì)胞,初始dna模板為基因組dna。在一些實(shí)施方式中,初始dna模板來源于單細(xì)胞。在一些實(shí)施方式中,初始dna模板來源于多個(gè)細(xì)胞,例如來源于兩個(gè)或多個(gè)同類細(xì)胞。本申請(qǐng)所述的“多個(gè)細(xì)胞”是指不超過103、不超過102、不超過10個(gè)或者103以上的細(xì)胞。上述單個(gè)細(xì)胞或多個(gè)同類細(xì)胞可以來自,例如,植入前的胚胎、孕婦外周血中的胚胎細(xì)胞、單精子、卵細(xì)胞、受精卵、癌細(xì)胞、細(xì)菌細(xì)胞、腫瘤循環(huán)細(xì)胞、腫瘤組織細(xì)胞、或者從任意組織獲得的單個(gè)或多個(gè)同類細(xì)胞。可以通過本領(lǐng)域公知的方法獲得單細(xì)胞,包括但不限于,流式細(xì)胞分選、熒光激活細(xì)胞分選法、磁珠分離、半自動(dòng)細(xì)胞挑取儀等。在一些實(shí)施方式中,可以根據(jù)單個(gè)細(xì)胞不同的性質(zhì)來進(jìn)行挑選特定類型的細(xì)胞,例如表達(dá)某種特定的生物標(biāo)記的細(xì)胞。
在另一些實(shí)施方式中,生物樣本為體液。在一些實(shí)施方式中,初始dna模板來源于血液、血清、血漿或羊水。在一些實(shí)施方式中,初始dna模板為細(xì)胞外的游離dna?!凹?xì)胞外的游離dna”是指在循環(huán)系統(tǒng)(例如,血液)中發(fā)現(xiàn)的游離于細(xì)胞外的dna。其來源一般認(rèn)為是由于細(xì)胞凋亡過程中釋放的基因組dna。研究發(fā)現(xiàn),人體內(nèi)絕大部分的細(xì)胞外的游離dna的大小在160bp左右(參見fanetal.,(2010)analysisofthesizedistributionsoffetalandmaternalcell-freednabypaired-endsequencing,clinchem56:81279-86)。在一些實(shí)施方式中,在所述細(xì)胞外的游離dna中包含循環(huán)腫瘤dna。“循環(huán)腫瘤dna”是指來源于腫瘤細(xì)胞的細(xì)胞外游離dna。腫瘤細(xì)胞在人體內(nèi)會(huì)因?yàn)榧?xì)胞凋亡、免疫反應(yīng)等原因釋放其基因組dna到血液中。由于正常細(xì)胞也同樣會(huì)將其基因組dna釋放到血液中,因此,一般情況下,循環(huán)腫瘤dna只占細(xì)胞外游離dna的很小一部分。在一些實(shí)施方式中,初始dna模板為源于懷孕母體的細(xì)胞外游離dna,其中包含胎兒游離dna。“胎兒游離dna”是指在母體血液中包含的來源于胎兒的細(xì)胞外游離dna片段。
本領(lǐng)域技術(shù)人員可以通過公知的任何方法從生物樣品中獲得初始dna模板。在一些實(shí)施方式中,可以通過對(duì)組織或細(xì)胞進(jìn)行裂解(例如可以通過熱裂解、堿裂解、酶裂解、機(jī)械裂解等方式)并釋放細(xì)胞內(nèi)的核酸物質(zhì),之后經(jīng)過純化等處理步驟最終獲得初始dna模板。在一些特定的實(shí)施方式中,裂解后的核酸物質(zhì)無需進(jìn)行純化即可作為初始dna模板用于后續(xù)擴(kuò)增。在一些實(shí)施方式中,可以通過從血液或血清中分離或富集其中包含的細(xì)胞外游離dna,從而獲得初始dna模板。
如前所述本申請(qǐng)的方法可以用于擴(kuò)增一些寶貴的樣本例如低含量的初始dna模板,如來源于人類的卵細(xì)胞、生殖細(xì)胞、體外受精的胚胎細(xì)胞等的初始dna模板,或者如腫瘤循環(huán)dna、胎兒游離dna等。本申請(qǐng)中所述的“低含量的初始dna模板”是指來源于單細(xì)胞的dna模板、來源于不超過103、不超過102、不超過10個(gè)或者103以上細(xì)胞的dna模板、或者指等同單細(xì)胞水平的量的初始dna模板,例如≤0.5pg、≤3pg、≤5pg、≤10pg、≤50pg、≤100pg、≤0.5ng、≤1ng、≤3ng、>3ng的初始dna模板。
本申請(qǐng)中所述的“變性dna模板”是指通過本領(lǐng)域技術(shù)人員公知的任何方法,包括但不限于通過熱變性(例如高于90℃)、堿(例如naoh)處理等方法分離雙鏈dna的兩條鏈。當(dāng)dna模板為雙鏈時(shí),通過上述變性方法獲得單條目標(biāo)dna鏈。當(dāng)初始dna模板為單鏈dna時(shí),在第一個(gè)循環(huán)的擴(kuò)增中,可以不包括變性手段,初始的單鏈dna即為所述單條目標(biāo)dna鏈;又或者在第一個(gè)循環(huán)的擴(kuò)增中,也可以包括變性手段(例如加熱至高于90℃或者加熱堿溶液等),但對(duì)初始的單鏈dna模板不產(chǎn)生實(shí)質(zhì)性的影響,因此即便經(jīng)過變性步驟,初始的單鏈dna還是所述單條目標(biāo)dna鏈。本申請(qǐng)中所述的“目標(biāo)dna鏈”是指在擴(kuò)增中步驟ii)內(nèi)用于擴(kuò)增目標(biāo)區(qū)域的“引物對(duì)”能夠雜交至的那條鏈。
本申請(qǐng)中所述的“引物”是指一段短的單鏈dna片段,其可雜交至dna或rna鏈上與之互補(bǔ)的區(qū)域并作為dna聚合作用的起始點(diǎn),dna聚合酶可在其3’末端依次添加與dna模板鏈互補(bǔ)的核苷酸從而合成新的dna鏈。
本申請(qǐng)中所述的“互補(bǔ)”是指核酸能夠通過傳統(tǒng)的watson-crick堿基配對(duì)方式或其他非傳統(tǒng)方式與另一核酸之間形成氫鍵的能力?;パa(bǔ)百分比被用來表示在一條核酸鏈分子中能與第二核酸序列形成氫鍵(例如,watson-crick堿基對(duì))的殘基數(shù)量百分比,例如一條10個(gè)核酸組成的核酸鏈中5、6、7、8、9或10個(gè)核酸能夠和第二核酸序列通過氫鍵互補(bǔ),則相應(yīng)的互補(bǔ)百分比為50%、60%、70%、80%、90%或100%?!巴耆パa(bǔ)”是指核酸序列的全部的連續(xù)殘基與第二核酸序列上相同數(shù)目的全部連續(xù)殘基依次形成氫鍵。“基本互補(bǔ)”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50個(gè)或更多的核酸區(qū)域內(nèi)具有與第二核酸序列至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%的互補(bǔ)百分比,或者指在嚴(yán)格條件下能夠雜交的兩個(gè)核酸分子。
第一輪擴(kuò)增中的“引物對(duì)”包括一個(gè)上游引物和一個(gè)下游引物,其中上游引物能夠雜交至單鏈dna上目標(biāo)區(qū)域的第一核酸序列,下游引物能夠雜交至單鏈dna上目標(biāo)區(qū)域的第二核酸序列,其中第一核酸序列在包含目標(biāo)區(qū)域的單鏈dna上位于第二核酸序列的下游。“雜交”是指包含互補(bǔ)堿基序列的兩條dna鏈,可以通過在互補(bǔ)的堿基序列處彼此形成氫鍵配對(duì),從而生成穩(wěn)定的雙鏈區(qū)。即,上游引物能夠與目標(biāo)區(qū)域的第一核酸序列形成氫鍵配對(duì)從而生成穩(wěn)定的雙鏈區(qū),下游引物能夠與目標(biāo)區(qū)域的第二核酸序列形成氫鍵配對(duì)從而生成穩(wěn)定的雙鏈區(qū)。上游引物和下游引物可以包含任意的可與天然核酸進(jìn)行堿基配對(duì)的核苷酸,包括但不限于a、t、g、和c四種天然堿基以及本領(lǐng)域技術(shù)人員公知的其他核苷酸類似物、經(jīng)修飾的核苷酸等,只要能夠與目標(biāo)區(qū)域上的第一或第二核酸序列配對(duì)并實(shí)現(xiàn)擴(kuò)增反應(yīng)即可。
在一些實(shí)施方式中,上游引物和/或下游引物分別包含接頭序列。接頭序列在本申請(qǐng)中是指位于上游引物5’端、下游引物3’端的特定序列,其長(zhǎng)度可以在8-40bp、8-32bp、10-30bp、12-28bp、15-25bp、18-22bp、20-24bp之間。上下游引物包含的接頭序列可以是相同的或者是不同的。在本申請(qǐng)中,選擇適當(dāng)?shù)慕宇^序列,從而使得所述接頭序列不與目標(biāo)區(qū)域結(jié)合,并且能夠避免上下游引物自身或者上下游引物之間的聚合。在一些實(shí)施方式中,后續(xù)的指數(shù)擴(kuò)增中所用的擴(kuò)增引物包括部分或全部與上、下游接頭序列互補(bǔ)的序列。在一些實(shí)施方式中,選擇接頭序列以使得半擴(kuò)增產(chǎn)物/第一輪擴(kuò)增產(chǎn)物/指數(shù)擴(kuò)增產(chǎn)物能夠直接被用于測(cè)序。
在一些實(shí)施方式中,上游引物和下游引物包含雜交序列。雜交序列在本申請(qǐng)中是指位于上游引物3’端、下游引物5’端的特定序列,其長(zhǎng)度可以在10-40bp、15-35bp、18-32bp、20-30bp、22-28bp、24-26bp之間。在本申請(qǐng)的一些實(shí)施方式中,“雜交序列”由隨機(jī)序列組成。在本申請(qǐng)的一些實(shí)施方式中,“雜交序列”由至少4個(gè)、至少5個(gè)、至少6個(gè)、至少7個(gè)、至少8個(gè)連續(xù)的隨機(jī)序列組成。在本申請(qǐng)的一些實(shí)施方式中,“雜交序列”由固定序列組成。在本申請(qǐng)的一些實(shí)施方式中,“雜交序列”基本由固定序列組成,但在該固定序列的一個(gè)或多個(gè)堿基位置引入隨機(jī)序列,上述一個(gè)或多個(gè)堿基位置可以位于雜交序列的3’或5’端也可以位于雜交序列的中間部分,并且上述一個(gè)或多個(gè)堿基位置可以是連續(xù)的也可以是不連續(xù)的。當(dāng)雜交序列由或基本由固定序列組成時(shí),可以根據(jù)目標(biāo)區(qū)域選擇適當(dāng)?shù)墓潭ㄐ蛄?,例如選擇與已知目標(biāo)區(qū)域序列上相鄰或間隔的兩個(gè)區(qū)域序列互補(bǔ)的序列作為引物中的固定序列。由于基因組中很多位點(diǎn)存在多種突變或者存在單核苷酸多態(tài)性(snp),因此當(dāng)目標(biāo)區(qū)域的第一核酸序列和/或第二核酸序列區(qū)域內(nèi)包括此等位點(diǎn)時(shí),可以在引物的固定序列中引入隨機(jī)序列從而使得包括不同的位點(diǎn)突變和snp的模板均被擴(kuò)增,并且使得上述不同的位點(diǎn)突變和snp能夠在后續(xù)可能存在的測(cè)序步驟中被檢測(cè)出。在本申請(qǐng)的一些實(shí)施方式中,上游引物包含由連續(xù)的隨機(jī)序列組成的雜交序列,下游引物包含由特異性結(jié)合目標(biāo)區(qū)域的固定序列組成的雜交序列。
“隨機(jī)序列”中的核苷酸序列可以有多種變化的可能,在引物的某一個(gè)特定堿基位置引入隨機(jī)序列的意思是指,該引物實(shí)際上為一個(gè)引物混合物,其中包含了在上述特定堿基位置包含不同的核苷酸序列的引物的集合。隨機(jī)序列中每個(gè)堿基位點(diǎn)可以僅包括a、t、g、c中的任意兩種、三種或四種核苷酸。可以通過簡(jiǎn)并標(biāo)識(shí)方法表示該堿基位置的核苷酸種類,例如,在隨機(jī)序列中的某一堿基位置僅包含a、g兩種核苷酸,即可表示為該位點(diǎn)序列為r(即r=a/g),其他的簡(jiǎn)并標(biāo)識(shí)包括:y=c/t、m=a/c、k=g/t、s=c/g、w=a/t、h=a/c/t、b=c/g/t、v=a/c/g、d=a/g/t、n=a/c/g/t。隨機(jī)序列的長(zhǎng)度可以為1bp、2bp、3bp、4bp、5bp、6bp、7bp、8bp、9bp、10bp或10bp以上。假設(shè)隨機(jī)序列的長(zhǎng)度為1bp,該1bp的位置包含的隨機(jī)核苷酸標(biāo)識(shí)為n,則包含該隨機(jī)序列的引物為4種引物的混合物?;蛘呒僭O(shè),隨機(jī)序列為3bp,其中每個(gè)位置包含的隨機(jī)核苷酸標(biāo)識(shí)為h(3種核苷酸a/c/t),則包含該隨機(jī)序列的引物為3x3x3=27種引物的混合物。在一些實(shí)施方式中,為了排除一些不希望的情況或者增加與目標(biāo)dna區(qū)域的匹配程度,在最大程度的隨機(jī)性(即包含全部a、t、g、c四種可能性)的基礎(chǔ)上進(jìn)一步增加了某些限定條件,從而選擇隨機(jī)序列上或隨機(jī)序列中的某個(gè)位點(diǎn)上所包含的核苷酸的種類。例如,在某些實(shí)施方式中,接頭序列包含大量g、t,因而為減少雜交序列與接頭序列產(chǎn)生互補(bǔ)配對(duì)的可能性,可選擇在隨機(jī)序列中排除包含c、a,隨機(jī)序列的每個(gè)位點(diǎn)以k標(biāo)識(shí)。
此外,本申請(qǐng)中所述的下游引物包含磷酸化的5’末端,即下游引物雜交序列的5’末端包含磷酸基團(tuán),而上游引物雜交至的第一核酸序列和下游引物雜交至的第二核酸序列之間間隔了m個(gè)核苷酸,其中m為≥0的整數(shù);當(dāng)m=0時(shí),第一核酸序列與第二核酸序列緊鄰,則直接利用dna連接酶連接上游引物的3’端與下游引物的5’獲得半擴(kuò)增產(chǎn)物;或者當(dāng)m>0時(shí),第一核酸序列與第二核酸序列之間存在間隔,在這種情況下所述第一輪擴(kuò)增在步驟ii)之后的步驟iii)延伸步驟中,通過dna聚合酶在上游引物3’端延伸m個(gè)核苷酸至與下游引物5’端緊鄰的位置,獲得上游引物的延伸產(chǎn)物,之后再利用dna連接酶將上游引物的延伸產(chǎn)物和下游引物或下游引物的延伸產(chǎn)物相連得到半擴(kuò)增產(chǎn)物。
本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際情況選擇利用任何公知的dna聚合酶并且采用任何公知的方法對(duì)上游引物進(jìn)行延伸,其中所述dna聚合酶包括但不限于適合的核酸聚合酶包括,但不限于:taq聚合酶、pfudna聚合酶、
本申請(qǐng)所述的“dna連接酶”是指具有可以通過在兩個(gè)dna分子的借由形成磷酸二酯鍵將dna在3′端的尾端與5′端的前端連在一起。
在一些實(shí)施方式中,所述dna連接酶是t4dna連接酶,其可以催化具有粘端或平端的雙鏈dna或rna的5’-p末端和3’-oh末端之間以磷酸二酯鍵結(jié)合,該催化反應(yīng)需atp作為輔助因子,但其最佳反應(yīng)溫度在約6℃左右,高于65℃則失去酶活性。t4dna連接酶可以修補(bǔ)雙鏈dna、雙鏈rna或dna/rna雜合物上的單一條鏈上面具有的缺口。
在一些所述方式中,所述dna連接酶為耐高溫的dna連接酶。
在一些實(shí)施方式中,所述dna連接酶是耐高溫的雙鏈dna連接酶(例如但不限于
在另一些實(shí)施方式中,所述dna連接酶是耐高溫的單鏈dna連接酶(例如但不限于circligasetmssdnaligase,epicentre科技公司),其是一種熱穩(wěn)定的、atp依賴的連接酶,其能夠催化單鏈dna的5’-磷酸和3’-羥基基團(tuán)的連接,從而使單鏈dna環(huán)化。circligasetmssdnaligase與t4dnaligase和不同,t4dnaligase和
當(dāng)上下游引物均包含接頭序列時(shí),一輪線性擴(kuò)增后得到的擴(kuò)增產(chǎn)物為一條兩端具有接頭序列中間為目標(biāo)區(qū)域的反向互補(bǔ)序列的dna鏈(半擴(kuò)增產(chǎn)物)與dna模板鏈之間通過氫鍵連接形成雙鏈區(qū)域的產(chǎn)物分子(見圖1)??梢岳斫獾氖?,當(dāng)上下游引物的雜交序列由或基本由與目標(biāo)序列的特定區(qū)域反向互補(bǔ)的序列組成時(shí),由于下游引物5’端包含接頭序列,3’端包括磷酸基團(tuán),在擴(kuò)增過程中下游引物不能延伸,上游引物延伸至緊鄰下游引物3’端時(shí),利用dna連接酶將該上游引物延伸產(chǎn)物與下游引物連接得到半擴(kuò)增產(chǎn)物與dna模板鏈之間形成的雙鏈分子,其中在這兩條鏈中,半擴(kuò)增產(chǎn)物不能作為下一個(gè)循環(huán)擴(kuò)增的模板,每個(gè)循環(huán)的擴(kuò)增實(shí)際只能利用初始的目標(biāo)dna鏈作為模板,因此該擴(kuò)增方式被稱為線性擴(kuò)增。在這種情況下,在第n輪線性擴(kuò)增后(其中n>1),所述線性擴(kuò)增產(chǎn)物包括n-1條單鏈半擴(kuò)增產(chǎn)物,以及一條半擴(kuò)增產(chǎn)物與dna模板鏈之間形成的雙鏈分子。在一些實(shí)施方式中,線性擴(kuò)增重復(fù)不少于5個(gè)、不少于10個(gè)、不少于15個(gè)、不少于20個(gè)、不少于30個(gè)循環(huán)。在一些實(shí)施方式中,線性擴(kuò)增重復(fù)不高于100個(gè)、不高于90個(gè)、不高于80個(gè)、不高于70個(gè)、不高于60個(gè)循環(huán)、不高于50個(gè)循環(huán)。
在一些實(shí)施方式中,上游引物由5’端至3’端分別包括接頭序列和由連續(xù)的隨機(jī)序列組成的雜交序列,下游引物包括由或基本由與目標(biāo)序列的特定區(qū)域反向互補(bǔ)的序列組成的雜交序列且不包含接頭序列,在第一輪擴(kuò)增的第一個(gè)循環(huán)中得到的半擴(kuò)增產(chǎn)物為一條5’端具有接頭序列、中間為目標(biāo)區(qū)域的反向互補(bǔ)序列的部分或全部的dna鏈,其與dna模板鏈之間通過氫鍵連接形成雙鏈區(qū)域的產(chǎn)物分子(見圖3)??梢岳斫獾氖牵c下游引物包含3’端接頭序列的情況相反,當(dāng)上游引物的雜交序列由隨機(jī)序列組成,下游引物的雜交序列由或基本由與目標(biāo)序列的特定區(qū)域反向互補(bǔ)的序列組成時(shí),上游引物雜交至dna模板鏈的多個(gè)任意位置并向下游延伸,由于下游引物5’端不包含接頭序列,在擴(kuò)增過程中下游引物也向下延伸,當(dāng)上游引物雜交至下游引物識(shí)別區(qū)域的上游時(shí),其可繼續(xù)向下游延伸至緊鄰下游引物3’端,隨后利用dna連接酶將該上游引物延伸產(chǎn)物與下游引物或下游引物的延伸產(chǎn)物連接得到半擴(kuò)增產(chǎn)物與dna模板鏈之間形成的雙鏈分子,由于上游引物的雜交序列由隨機(jī)序列組成,其也能識(shí)別半擴(kuò)增產(chǎn)物上的位置,因此此時(shí)能夠以上游引物作為引物進(jìn)一步將半擴(kuò)增產(chǎn)物作為下一輪擴(kuò)增的模板進(jìn)行擴(kuò)增。在這種情況下,在第一輪擴(kuò)增的多個(gè)循環(huán)后,所述第一輪擴(kuò)增產(chǎn)物包括多條單鏈半擴(kuò)增產(chǎn)物,以及兩端分別包含上游引物的接頭序列和與上游引物接頭序列互補(bǔ)的序列的雙鏈分子。
在一些實(shí)施方式中,本申請(qǐng)?zhí)峁┑脑诔跏糳na模板上擴(kuò)增目標(biāo)區(qū)域的方法進(jìn)一步包括:在n個(gè)循環(huán)的第一輪擴(kuò)增之后,以第一輪擴(kuò)增片段為模板,通過聚合酶鏈?zhǔn)椒磻?yīng)(pcr)擴(kuò)增所述目標(biāo)區(qū)域以生成指數(shù)擴(kuò)增產(chǎn)物。所述聚合酶鏈?zhǔn)椒磻?yīng)pcr包括但不限于常規(guī)pcr、滾環(huán)pcr、反向pcr、巢式pcr等。本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際情況決定pcr的反應(yīng)溫度、反應(yīng)程序、反應(yīng)cycle數(shù)等反應(yīng)條件。在指數(shù)擴(kuò)增中可以采用指數(shù)擴(kuò)增通用引物,其包括與第一輪擴(kuò)增中上游引物的接頭序列(如有)相同或反向互補(bǔ)的序列和/或與線性擴(kuò)增中下游引物的接頭序列(如有)相同或反向互補(bǔ)的序列。
在一些實(shí)施方式中,本申請(qǐng)?zhí)峁┑脑诔跏糳na模板上擴(kuò)增目標(biāo)區(qū)域的方法包括測(cè)序步驟,其中所述測(cè)序步驟可以在第一輪擴(kuò)增之后,即用于測(cè)序的序列是第一輪擴(kuò)增產(chǎn)物;或者其中所述測(cè)序步驟可以在指數(shù)擴(kuò)增之后,即用于測(cè)序的序列是指數(shù)擴(kuò)增產(chǎn)物。在一些特定的實(shí)施方式中,為了使得指數(shù)擴(kuò)增產(chǎn)物能夠成為可直接用于測(cè)序的dna文庫(kù),可以選擇第一輪擴(kuò)增的上下游引物中的接頭序列使其包括一段與測(cè)序用引物的部分或全部相同或反向互補(bǔ)的特定序列,從而使得第一輪擴(kuò)增產(chǎn)物能夠成為可直接用于測(cè)序的dna文庫(kù)。在一些特定的實(shí)施方式中,為了使得指數(shù)擴(kuò)增產(chǎn)物能夠成為可直接用于測(cè)序的dna文庫(kù),指數(shù)擴(kuò)增的上下游引物在其5’端還可以進(jìn)一步包括一段測(cè)序所需的配接序列(adapter),例如但不限于,與測(cè)序用引物的部分或全部相同或反向互補(bǔ)的特定序列、與測(cè)序用平臺(tái)的測(cè)序板上捕獲序列的部分或全部相同或反向互補(bǔ)的特定序列。在一些特定的實(shí)施方式中,為了使得指數(shù)擴(kuò)增產(chǎn)物能夠成為可直接用于測(cè)序的dna文庫(kù),可以選擇第一輪擴(kuò)增的上下游引物中的接頭序列使其包括一段與測(cè)序用引物的部分或全部相同或反向互補(bǔ)的特定序列,相應(yīng)地指數(shù)擴(kuò)增的引物中包含與線性擴(kuò)增的上下游引物中的接頭序列相同或反向互補(bǔ)的序列,也即指數(shù)擴(kuò)增的引物中包含一段與測(cè)序用引物的部分或全部相同或反向互補(bǔ)的特定序列。
本申請(qǐng)中所述的“dna測(cè)序文庫(kù)”是指豐度達(dá)到可測(cè)序的程度的dna片段集合,其中所述dna片段集合中每條片段的一端或兩端包含與測(cè)序用引物部分或全部反向互補(bǔ)的特定序列,從而可以直接用于后續(xù)的測(cè)序上機(jī)。
以下將根據(jù)附圖簡(jiǎn)要說明本申請(qǐng)所述的dna酶介導(dǎo)的擴(kuò)增方法的兩個(gè)示例以及本申請(qǐng)所述的dna酶介導(dǎo)的擴(kuò)增擴(kuò)增方法的一種應(yīng)用。
第一輪擴(kuò)增
圖1是第一輪擴(kuò)增的一種示例性實(shí)施方式,其中所述第一輪擴(kuò)增為線性擴(kuò)增。如圖1所示,初始dna模板為一條包括目標(biāo)區(qū)域a的雙鏈dna模板,第一輪擴(kuò)增的引物對(duì)中包括一條上游引物和一條下游引物,其中上游引物從5’端到3’端依次為接頭序列和雜交序列,并且雜交序列中包含兩個(gè)不連續(xù)堿基位置的隨機(jī)序列n,其中下游引物從5’端到3’端依次為雜交序列和接頭序列,并且下游引物的5’端包含磷酸基團(tuán)。選擇接頭序列使其不與dna模板的任何位置發(fā)生雜交反應(yīng)。選擇上游引物的雜交序列使其除了在兩個(gè)隨機(jī)序列所處的堿基位置以外其余位置與目標(biāo)區(qū)域a內(nèi)的第一核酸序列完全互補(bǔ)配對(duì)。選擇下游引物的雜交序列使其與目標(biāo)區(qū)域a內(nèi)的第二核酸序列完全互補(bǔ)配對(duì)。其中在所述目標(biāo)dna鏈上所述第一核酸序列位于所述第二核酸序列的下游,并且兩個(gè)區(qū)域之間間隔m個(gè)核苷酸。
重復(fù)n個(gè)循環(huán)的擴(kuò)增步驟(其中n為>1的整數(shù)):1)通過高溫變性步驟從雙鏈dna模板中分離出目標(biāo)dna鏈(例如反義鏈);2)通過退火步驟將上游引物和下游引物分別雜交至所述目標(biāo)區(qū)域a內(nèi)的第一核酸序列和第二核酸序列處;3)通過dna聚合酶在上游引物的3’末端進(jìn)行延伸直至緊鄰下游引物5’末端位置,得到上游引物的延伸產(chǎn)物;4)通過耐高溫dna連接酶(例如
圖2是第一輪擴(kuò)增的另一種示例性實(shí)施方式,如圖2所示,初始dna模板為一條包括目標(biāo)區(qū)域a的雙鏈dna模板,第一輪擴(kuò)增的引物對(duì)中包括一條上游引物和一條下游引物,其中上游引物從5’端到3’端依次為接頭序列和雜交序列,其中雜交序列中包含多個(gè)連續(xù)堿基位置的隨機(jī)序列n,其中下游引物由或基本由與目標(biāo)序列的特定區(qū)域反向互補(bǔ)的序列組成,并且下游引物的5’端包含磷酸基團(tuán)。選擇接頭序列使其不與dna模板的任何位置發(fā)生雜交反應(yīng)。選擇下游引物的雜交序列使其與目標(biāo)區(qū)域a內(nèi)的第二核酸序列完全或基本完全互補(bǔ)配對(duì),上游引物的雜交序列與與目標(biāo)區(qū)域a內(nèi)的第一核酸序列完全或基本完全互補(bǔ)配對(duì),其中在所述目標(biāo)dna鏈上所述第一核酸序列位于所述第二核酸序列的下游,并且兩個(gè)區(qū)域之間間隔m個(gè)核苷酸。
重復(fù)n個(gè)循環(huán)的線性擴(kuò)增步驟(其中n為>1的整數(shù)):1)通過高溫變性步驟從雙鏈dna模板中分離出目標(biāo)dna鏈(例如反義鏈);2)通過退火步驟將上游引物和下游引物分別雜交至所述目標(biāo)區(qū)域a內(nèi)的第一核酸序列和第二核酸序列處;3)通過dna聚合酶在上游引物和/或下游引物的3’末端進(jìn)行延伸,上游引物被延伸至緊鄰下游引物5’末端位置,得到上游引物的延伸產(chǎn)物;4)通過耐高溫dna連接酶(例如
指數(shù)擴(kuò)增
如圖3所示,在第一輪擴(kuò)增后,通過引入指數(shù)擴(kuò)增引物對(duì)實(shí)現(xiàn)指數(shù)擴(kuò)增,其中所述指數(shù)擴(kuò)增引物對(duì)包括指數(shù)擴(kuò)增上游引物和指數(shù)擴(kuò)增下游產(chǎn)物。其中指數(shù)擴(kuò)增上游引物從5’端到3’端依次包括與擬使用的測(cè)序平臺(tái)(例如ngs測(cè)序)中的測(cè)序上游引物的部分或全部反向互補(bǔ)或相同的序列、與第一輪擴(kuò)增上下游引物的接頭序列(如有)相同或互補(bǔ)的序列。指數(shù)擴(kuò)增的下游引物從5’端到3’端依次包括與擬使用的測(cè)序平臺(tái)(例如ngs測(cè)序)中的測(cè)序下游引物的部分或全部反向互補(bǔ)或相同的序列、與第一輪擴(kuò)增上下游引物的接頭序列(如有)相同或反向互補(bǔ)的序列。此處所述上下游引物與線性擴(kuò)增中所述的上下游引物的概念不同,第一輪擴(kuò)增中的步驟ii中上下游引物雜交至同一條目標(biāo)dna鏈上,而指數(shù)擴(kuò)增的上下游引物能夠分別雜交至dna雙鏈的兩條鏈上。在一些實(shí)施方式中,所述指數(shù)擴(kuò)增上下游引物序列相同。
在指數(shù)擴(kuò)增中的首輪擴(kuò)增為以第一輪擴(kuò)增中獲得的半擴(kuò)增產(chǎn)物或第一輪擴(kuò)增產(chǎn)物為模板進(jìn)行擴(kuò)增,在擴(kuò)增過程中形成的dna雙鏈分子每條鏈均可再次作為模板進(jìn)行下一輪的擴(kuò)增。在經(jīng)數(shù)輪指數(shù)擴(kuò)增后得到的產(chǎn)物為兩端均具有與ngs測(cè)序平臺(tái)中的測(cè)序引物的部分或全部反向互補(bǔ)或相同的序列,即生成的擴(kuò)增產(chǎn)物為可以直接用于ngs測(cè)序的dna文庫(kù)。
dna連接酶介導(dǎo)的擴(kuò)增方法在cnv檢測(cè)中的應(yīng)用
如圖4所示為上述包括線性擴(kuò)增和指數(shù)擴(kuò)增步驟的dna連接酶介導(dǎo)的擴(kuò)增方法在cnv檢測(cè)中的應(yīng)用。其中假設(shè)目標(biāo)dna序列為模板dna2,期望測(cè)定該dna序列在其來源于的生物樣本中的拷貝數(shù)。已知參考樣本(模板dna1)的拷貝數(shù)為2,在平行操作的dna連接酶介導(dǎo)的擴(kuò)增實(shí)驗(yàn)中擴(kuò)增兩種模板dna,如圖所示,若模板dna2的拷貝數(shù)為3,則經(jīng)數(shù)輪線性擴(kuò)增再經(jīng)指數(shù)擴(kuò)增放大后,模板dna2的指數(shù)擴(kuò)增產(chǎn)物的豐度相對(duì)于模板dna1的指數(shù)擴(kuò)增產(chǎn)物的豐度為3∶2,由此豐度比值可以反推知模板dna2的拷貝數(shù)為3。
應(yīng)當(dāng)理解,此處僅為本申請(qǐng)所述擴(kuò)增方法的一個(gè)示例性應(yīng)用,并不旨在限制本申請(qǐng)所述的擴(kuò)增方法僅能用于上述檢測(cè)。本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際需要靈活選擇本申請(qǐng)所述的擴(kuò)增方法適用的范圍。
本申請(qǐng)的另一個(gè)方面提供了,一種用于在dna水平上擴(kuò)增目標(biāo)區(qū)域的試劑盒。在一些實(shí)施方式中,所述試劑盒包括:第一輪擴(kuò)增引物對(duì),其中每對(duì)所述引物對(duì)包括一個(gè)上游引物和一個(gè)下游引物,所述上游引物和下游引物雜交至目標(biāo)dna鏈上,其中所述上游引物雜交至所述目標(biāo)區(qū)域的第一核酸序列,所述下游引物雜交至所述目標(biāo)區(qū)域的第二核酸序列,其中所述第一核酸序列和所述第二核酸序列之間間隔m個(gè)核苷酸,其中m為≥0的整數(shù),其中所述第一核酸序列在所述目標(biāo)dna鏈上位于第二核酸序列的下游,并且所述下游引物包含磷酸化的5’末端;以及連接試劑,其中所述連接試劑用于將所述上游引物或其延伸產(chǎn)物與所述下游引物或其延伸產(chǎn)物連接得到半擴(kuò)增產(chǎn)物。
在一些實(shí)施方式中,所述連接試劑包括連接酶及連接酶反應(yīng)溶液。在一些實(shí)施方式中,所述連接酶為耐高溫連接酶。在一些實(shí)施方式中,所述耐高溫連接酶為
在一些實(shí)施方式中,用于在dna水平上擴(kuò)增目標(biāo)區(qū)域的試劑盒進(jìn)一步包括:延伸試劑,所述延伸試劑用于在所述上游引物和/或下游引物的3’末端以所述反義鏈作為模板進(jìn)行延伸,得到上游引物和/或下游引物的的延伸產(chǎn)物。在一些實(shí)施方式中,延伸試劑包括dna聚合酶、反應(yīng)試劑以及dntp,所述dntp由datp、dttp、dgtp、dctp中的任意一種或多種組成。在一些實(shí)施方式中,所述上游引物具有5’末端接頭序列。在一些實(shí)施方式中,所述上游引物具有5’末端接頭序列,所述下游引物具有3’末端接頭序列。在一些實(shí)施方式中,所述上游引物具有5’末端接頭序列,所述下游引物不具有接頭序列。在一些實(shí)施方式中,所述第一輪擴(kuò)增為線性擴(kuò)增,所述半擴(kuò)增產(chǎn)物即為第一輪擴(kuò)增產(chǎn)物。在一些實(shí)施方式中,所述第一輪擴(kuò)增不為線性擴(kuò)增,所述上游引物包括的雜交序列包括或?yàn)殡S機(jī)序列,所述下游引物包含的雜交序列為特異性識(shí)別所述目標(biāo)區(qū)域的雜交序列,所述延伸試劑還可用于當(dāng)所述上游引物雜交至所述半擴(kuò)增產(chǎn)物上時(shí),在所述上游引物的3’末端以所述半擴(kuò)增產(chǎn)物作為模板進(jìn)行延伸,獲得第一輪擴(kuò)增產(chǎn)物。
在一些實(shí)施方式中,用于在dna水平上擴(kuò)增目標(biāo)區(qū)域的試劑盒進(jìn)一步包括:指數(shù)擴(kuò)增試劑,所述指數(shù)擴(kuò)增試劑用于以所述第一輪擴(kuò)增產(chǎn)物為模板擴(kuò)增所述目標(biāo)區(qū)域得到指數(shù)擴(kuò)增產(chǎn)物。
在一些實(shí)施方式中,指數(shù)擴(kuò)增試劑包括dna聚合酶、反應(yīng)試劑以及dntp。在一些實(shí)施方式中,指數(shù)擴(kuò)增試劑進(jìn)一步包括指數(shù)擴(kuò)增通用引物,其中所述指數(shù)擴(kuò)增通用引物包括與第一輪擴(kuò)增中所述上游引物的5’末端接頭序列相同或反向互補(bǔ)的序列和/或第一輪所述下游引物的3’末端接頭序列相同或反向互補(bǔ)的序列。。
在一些實(shí)施方式中,用于在dna水平上擴(kuò)增目標(biāo)區(qū)域的試劑盒進(jìn)一步包括:測(cè)序試劑,所述測(cè)序試劑用于對(duì)所述半擴(kuò)增產(chǎn)物或所述第一輪擴(kuò)增產(chǎn)物或所述指數(shù)擴(kuò)增產(chǎn)物進(jìn)行測(cè)序。在一些實(shí)施方式中,指數(shù)擴(kuò)增試劑包括指數(shù)擴(kuò)增通用引物。在一些實(shí)施方式中,指數(shù)擴(kuò)增試劑進(jìn)一步包括dna聚合酶、反應(yīng)試劑以及dntp。
實(shí)施例
以下將通過一些非限制性實(shí)施例進(jìn)一步描述本發(fā)明。需要說明的是這些實(shí)施例僅用于進(jìn)一步說明本發(fā)明的技術(shù)特征,并非旨在也不能夠被解釋為對(duì)本發(fā)明的限制。所述實(shí)驗(yàn)例不包含本領(lǐng)域一般技術(shù)人員所公知的傳統(tǒng)方法(不同種類樣本中dna的提取、純化等)的詳細(xì)描述。
實(shí)施例1:連接酶介導(dǎo)的dna擴(kuò)增方法用于在早期胚胎中檢測(cè)染色體拷貝數(shù)異常
目前試管嬰兒的成功率在20-30%之間,染色體非整倍體(染色體數(shù)目異常)是試管嬰兒失敗、流產(chǎn),以及極少數(shù)情況下的異常妊娠和活產(chǎn)的主要原因。提高試管嬰兒的成功率,關(guān)鍵在于選擇優(yōu)質(zhì)胚胎。有數(shù)據(jù)顯示第3天的胚胎約60%存在染色體異常,即只有約40%的胚胎是正常的,因此胚胎植入著床之前,可以對(duì)早期胚胎的染色體數(shù)目進(jìn)行檢測(cè)篩查具有遺傳物質(zhì)異常的胚胎,從而挑選正常的胚胎植入子宮,以期獲得正常的妊娠,提高試管嬰兒的成功率。
本申請(qǐng)?zhí)峁┑倪B接酶介導(dǎo)的dna擴(kuò)增方法可用于準(zhǔn)確快速地?cái)U(kuò)增目標(biāo)區(qū)域,并可通過后續(xù)對(duì)目標(biāo)區(qū)域的測(cè)序來檢測(cè)這種拷貝數(shù)的變異。
初始dna模板
受精卵在體外培養(yǎng),可以在卵裂期(例如,體外培養(yǎng)24小時(shí)內(nèi))取單個(gè)卵裂球細(xì)胞或者在囊胚期(例如,體外培養(yǎng)第3天)取外胚滋養(yǎng)層的多個(gè)細(xì)胞(1-8個(gè)細(xì)胞)進(jìn)行染色體拷貝數(shù)異常的檢測(cè)。采集卵裂細(xì)胞或者囊胚外胚滋養(yǎng)層細(xì)胞的方法可以為任何本領(lǐng)域技術(shù)人員公知的方法,例如但不限于wangl,cramdsetal.validationofcopynumbervariationsequencingfordetectingchromosomeimbalancesinhumanpreimplantationembryos.biolreprod,2014,91(2):37中所述的方法。使用pbs將經(jīng)分離的卵裂球細(xì)胞或滋養(yǎng)層細(xì)胞洗滌3次,并用25μl的pbs溶液重懸,作為包含基因組dna的樣品溶液直接應(yīng)用于第一反應(yīng)溶液體系中。起始的樣品溶液中包含約3-24pg總基因組dna。
目標(biāo)區(qū)域
針對(duì)全部23條染色體進(jìn)行檢測(cè),其中一個(gè)示例性的目標(biāo)區(qū)域?yàn)閤染色體上的lamp2基因(位于x染色體上從堿基對(duì)120442594-120442644)區(qū)域,以下所述的引物也是相應(yīng)地針對(duì)該示例性的目標(biāo)區(qū)域的。
參考樣本
以已知染色體拷貝數(shù)正常的血液樣本作為參照進(jìn)行平行試驗(yàn)。當(dāng)?shù)谝惠啍U(kuò)增為線性擴(kuò)增,上下游引物均包含接頭序列。
線性引物
上游引物(seqidno.3)從5’到3’為接頭序列+雜交序列(包含隨機(jī)序列)。
接頭序列為(5’到3’)seqidno.1:5’-cctacacgacgctcttccgatct-3’。
雜交序列為(5’到3’)seqidno.2:5’-cttaccrgagccattaaccaaatac-3’。
下游引物(seqidno.6)從5’到3’為雜交序列(不包含隨機(jī)序列)+接頭序列,并且包含5’磷酸基團(tuán)。
雜交序列為(5’到3’)seqidno.4:5’-atctgaaggaagtgaacatcagcat-3’。
接頭序列為(5’到3’)seqidno.5:5’-gtgactggagttcagacgtgtgc-3’。
線性擴(kuò)增
在線性擴(kuò)增中使用耐高溫連接酶
指數(shù)擴(kuò)增
線性擴(kuò)增結(jié)束后,可以利用dna純化試劑盒純化線性擴(kuò)增產(chǎn)物后用于指數(shù)擴(kuò)增,或者直接在線性擴(kuò)增體系中加入指數(shù)擴(kuò)增通用引物對(duì)進(jìn)行指數(shù)擴(kuò)增。
指數(shù)擴(kuò)增上游引物從5’到3’為測(cè)序所必要的配接序列+線性擴(kuò)增上游引物的接頭序列的相同序列。
測(cè)序所必要的配接序列:
seqidno.7:5’-aatgatacggcgaccaccgagatctacacacactctttc-3’。
線性擴(kuò)增上游引物的接頭序列的相同序列seqidno.8:
5’-cctacacgacgctcttccgatct-3’。
指數(shù)擴(kuò)增上游引物seqidno.9:
5’-aatgatacggcgaccaccgagatctacacacactctttccctacacgacgctcttccgatct-3’。
指數(shù)擴(kuò)增下游引物從5’到3’為測(cè)序所必要的配接序列+線性擴(kuò)增下游引物的接頭引物的反向互補(bǔ)序列
測(cè)序所必要的配接序列seqidno.10:
5’-caagcagaagacggcatacgagatgatcggaaga-3’。
線性擴(kuò)增下游引物的接頭引物的反向互補(bǔ)序列seqidno.11:
5’-gcacacgtctgaactccagtcac-3’。
指數(shù)擴(kuò)增下游引物seqidno.12:
5’-caagcagaagacggcatacgagatgatcggaagagcacacgtctgaactccagtcac-3’。
在指數(shù)擴(kuò)增中使用的反應(yīng)條件與經(jīng)典的聚合酶鏈反應(yīng)所用條件的相似,例如使用taq聚合酶,先對(duì)dna進(jìn)行94℃的2分鐘初始變性,之后重復(fù)30個(gè)循環(huán)94℃的30秒變性,58℃引物退火20秒和65℃延伸30秒的步驟。
dna測(cè)序
由于上述指數(shù)擴(kuò)增步驟中產(chǎn)生的指數(shù)擴(kuò)增產(chǎn)物兩端已包含部分或全部與測(cè)序用引物互補(bǔ)的序列,因此該指數(shù)擴(kuò)增產(chǎn)物可以被認(rèn)為是可直接進(jìn)行測(cè)序的dna文庫(kù)。使用高通量dna測(cè)序的方法對(duì)dna文庫(kù)進(jìn)行測(cè)序。測(cè)序前可以通過利用寡核苷酸探針對(duì)目標(biāo)測(cè)序dna進(jìn)行富集。
分析測(cè)序結(jié)果得出參考樣本與待檢測(cè)樣本各自的相對(duì)豐度,并且通過將參考樣本和待檢測(cè)樣本的相對(duì)豐度進(jìn)行比對(duì)得出待檢測(cè)早期胚胎樣本中是否存在染色體拷貝數(shù)異常。
實(shí)施例2:引物的設(shè)計(jì)及使用
本申請(qǐng)的一種實(shí)施方式中,第一輪線性擴(kuò)增使用一個(gè)包含隨機(jī)序列和接頭序列的上游引物a和一個(gè)特異性識(shí)別目標(biāo)序列的下游引物b。以下為下游引物b的設(shè)計(jì)及評(píng)估的一個(gè)示例。設(shè)計(jì)特異性識(shí)別染色體相關(guān)區(qū)域而不識(shí)別或較少識(shí)別基因組的其他位置的引物b。在人基因組數(shù)據(jù)庫(kù),例如hg19數(shù)據(jù)庫(kù)中blast設(shè)計(jì)好的引物b,獲得hg19頻率,其代表引物b在hg19基因組中的完美匹配數(shù),同時(shí)在與疾病對(duì)應(yīng)的目標(biāo)區(qū)域內(nèi)blast引物,獲得mms頻率,其代表微重復(fù)和微缺失綜合征(mms)目標(biāo)區(qū)域內(nèi)的完美匹配數(shù)。當(dāng)“hg19頻率”和“mms頻率”一致時(shí),則意味著引物b針對(duì)對(duì)該mms區(qū)域有特異性。在引物具有特異性的前提下,盡量選擇在目標(biāo)mms區(qū)域有更多完美匹配數(shù)目的引物。本申請(qǐng)中利用上述引物a和引物b對(duì)目標(biāo)區(qū)域進(jìn)行擴(kuò)增的一種實(shí)施方法如下:在第一輪pcr使用一個(gè)由5’端到3’端包括接頭序列、內(nèi)切酶識(shí)別位點(diǎn)以及隨機(jī)六聚體組成的上游引物和一個(gè)特異性針對(duì)目標(biāo)區(qū)域(微重復(fù)和缺失綜合征(mms)相關(guān)的目標(biāo)區(qū)域)的下游引物,通過將上游引物或其延伸產(chǎn)物與下游引物連接得到擴(kuò)增產(chǎn)物,它包含特定區(qū)域(引物b序列)兩端分別包含接頭序列和接頭序列的互補(bǔ)序列的片段集合(第一輪擴(kuò)增產(chǎn)物)。在第二輪pcr中,使用指數(shù)擴(kuò)增引物c來放大所有的信號(hào)獲得指數(shù)擴(kuò)增產(chǎn)物,所述指數(shù)擴(kuò)增引物c包含與第一輪擴(kuò)增上游引物的全部接頭序列和部分內(nèi)切酶識(shí)別位點(diǎn)序列。經(jīng)過兩輪pcr,可以使用限制性內(nèi)切酶消化指數(shù)擴(kuò)增產(chǎn)物,并在凝膠電泳中檢驗(yàn)各樣本中目標(biāo)區(qū)域的拷貝數(shù),或者可以通過第二代測(cè)序檢驗(yàn)樣本中目標(biāo)區(qū)域的拷貝數(shù)情況。
以貓眼綜合征(ces)為例,其與第22號(hào)染色體上部分區(qū)域的拷貝數(shù)異常相關(guān)。根據(jù)上述設(shè)計(jì)評(píng)估原則,能夠用于檢測(cè)貓眼綜合征的引物b如表1所示,而相應(yīng)的引物b在染色體上識(shí)別的位置定位如表2所示。
表1:特異性針對(duì)貓眼綜合征的引物b的評(píng)估
表2:特異性針對(duì)貓眼綜合征的引物b在染色體上識(shí)別位置的定位
利用
在第一輪pcr中使用如下的上下游引物:
上游引物a(seqidno.15):5’-gttctacacgagtcactgcagnnnnnnn-3’
下游引物b(seqidno.13):5’-cttcgatcacacg-3’。
在第一輪擴(kuò)增中使用耐高溫連接酶
使用
測(cè)序結(jié)果中包含引物b的序列的讀數(shù)量將被記錄以表征所述mms區(qū)域?qū)?yīng)的拷貝數(shù),在測(cè)序過程中非mms區(qū)域的正常雙拷貝區(qū)域被用作內(nèi)參。使用標(biāo)準(zhǔn)z檢測(cè)來評(píng)估m(xù)ms區(qū)域讀數(shù)量與正常雙拷貝區(qū)域的讀數(shù)量的比值以便確認(rèn)mms區(qū)域的拷貝數(shù)情況(比值>1代表拷貝數(shù)增加,比值<1代表拷貝數(shù)減少)。
根據(jù)本實(shí)施例描述的設(shè)計(jì)及評(píng)估方法,針對(duì)不同的cnv相關(guān)疾病挑選出了一系列特異性識(shí)別相關(guān)疾病相關(guān)區(qū)域的下游引物b,具體如下表3所示。
表3:針對(duì)不同cnv相關(guān)疾病設(shè)計(jì)選擇的特異性下游引物
應(yīng)當(dāng)理解,上述的實(shí)驗(yàn)操作僅為示例性的,本領(lǐng)域技術(shù)人員可以采用任何市售的試劑盒完成上述任一步驟,其中在這些步驟中任選地使用的試劑、反應(yīng)條件、反應(yīng)時(shí)間等各不相同但基本原理基本一致。
盡管在上文的實(shí)施例中詳細(xì)地描述了本發(fā)明公開的方法的一些具體步驟的操作方法,但是這種描述僅僅是示例性的而并非是對(duì)本發(fā)明的限制。實(shí)際上,根據(jù)本發(fā)明的實(shí)施例,本技術(shù)領(lǐng)域的一般技術(shù)人員可以通過研究說明書、公開的內(nèi)容及附圖和所附的權(quán)利要求書,理解和實(shí)施對(duì)披露的實(shí)施方式的其他改變。在權(quán)利要求中,措詞“包括”不排除其他的元素和步驟,并且措辭“一”、“一個(gè)”不排除復(fù)數(shù)。說明書中“基本上”是指大于80%、大于85%、大于90%、大于95%、大于98%、或者大于99%的程度。
序列表
<110>廣州市基準(zhǔn)醫(yī)療有限責(zé)任公司
<120>dna連接酶介導(dǎo)的dna擴(kuò)增技術(shù)
<130>064938-8003cn02
<150>cn201610206799.9
<151>2016-04-01
<160>139
<170>patentinversion3.5
<210>1
<211>23
<212>dna
<213>人工序列
<220>
<223>合成的
<400>1
cctacacgacgctcttccgatct23
<210>2
<211>25
<212>dna
<213>人工序列
<220>
<223>合成的
<220>
<221>variation
<222>(7)..(7)
<223>r=aorg
<400>2
cttaccrgagccattaaccaaatac25
<210>3
<211>48
<212>dna
<213>人工序列
<220>
<223>合成的
<220>
<221>variation
<222>(30)..(30)
<223>r=aorg
<400>3
cctacacgacgctcttccgatctcttaccrgagccattaaccaaatac48
<210>4
<211>25
<212>dna
<213>人工序列
<220>
<223>合成的
<400>4
atctgaaggaagtgaacatcagcat25
<210>5
<211>23
<212>dna
<213>人工序列
<220>
<223>合成的
<400>5
gtgactggagttcagacgtgtgc23
<210>6
<211>48
<212>dna
<213>人工序列
<220>
<223>合成的
<400>6
atctgaaggaagtgaacatcagcatgtgactggagttcagacgtgtgc48
<210>7
<211>39
<212>dna
<213>人工序列
<220>
<223>合成的
<400>7
aatgatacggcgaccaccgagatctacacacactctttc39
<210>8
<211>23
<212>dna
<213>人工序列
<220>
<223>合成的
<400>8
cctacacgacgctcttccgatct23
<210>9
<211>62
<212>dna
<213>人工序列
<220>
<223>合成的
<400>9
aatgatacggcgaccaccgagatctacacacactctttccctacacgacgctcttccgat60
ct62
<210>10
<211>34
<212>dna
<213>人工序列
<220>
<223>合成的
<400>10
caagcagaagacggcatacgagatgatcggaaga34
<210>11
<211>23
<212>dna
<213>人工序列
<220>
<223>合成的
<400>11
gcacacgtctgaactccagtcac23
<210>12
<211>57
<212>dna
<213>人工序列
<220>
<223>合成的
<400>12
caagcagaagacggcatacgagatgatcggaagagcacacgtctgaactccagtcac57
<210>13
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>13
cttcgatcacacg13
<210>14
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>14
atcgcacacgccc13
<210>15
<211>28
<212>dna
<213>人工序列
<220>
<223>合成的
<220>
<221>misc_feature
<222>(16)..(21)
<223>pstienzymedigestionsite
<220>
<221>variation
<222>(22)..(28)
<223>n=aortorcorg
<220>
<221>misc_feature
<222>(22)..(28)
<223>nisa,c,g,ort
<400>15
gttctacacgagtcactgcagnnnnnnn28
<210>16
<211>19
<212>dna
<213>人工序列
<220>
<223>合成的
<400>16
gttctacacgagtcactgc19
<210>17
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>17
ccgtatcggttcc13
<210>18
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>18
ccaagacccgtac13
<210>19
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>19
taataggaacgcg13
<210>20
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>20
atgtagtcgccgt13
<210>21
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>21
tttcgtagcgtgc13
<210>22
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>22
atactggcgagta13
<210>23
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>23
cggcgccggacaa13
<210>24
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>24
ctcgtcgacccac13
<210>25
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>25
cgcgcggttagca13
<210>26
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>26
cgcggttagcatg13
<210>27
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>27
taagagcgcgttc13
<210>28
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>28
atcgtagtgtacc13
<210>29
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>29
ccgatgtgcgcag13
<210>30
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>30
cgtgcccgcgtca13
<210>31
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>31
cgcctgcgattat13
<210>32
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>32
atctcgatacgat13
<210>33
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>33
cgaatcggacgag13
<210>34
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>34
aatcggacgagac13
<210>35
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>35
actatggtatccg13
<210>36
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>36
cgctatacggact13
<210>37
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>37
tcgccgccggttc13
<210>38
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>38
gccgccggttcta13
<210>39
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>39
taaatcacggcgg13
<210>40
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>40
gcgcgcttagcta13
<210>41
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>41
gcgcactatcgat13
<210>42
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>42
cacgatacggcca13
<210>43
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>43
agcgcactatcga13
<210>44
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>44
agtccaattcgtg13
<210>45
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>45
gtcggcgaccctt13
<210>46
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>46
aggacgacgctac13
<210>47
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>47
tcgtctggtacga13
<210>48
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>48
taaagggacgcgc13
<210>49
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>49
cgtggttcgcggc13
<210>50
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>50
tcctaacgcgccg13
<210>51
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>51
cagtcgctcggtt13
<210>52
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>52
ccgtggttcgcgg13
<210>53
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>53
atgcgcgcatgtc13
<210>54
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>54
cgggtccacgact13
<210>55
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>55
ctcgcgagtgtac13
<210>56
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>56
tcgcgagtgtaca13
<210>57
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>57
ttgcgtgacgcag13
<210>58
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>58
caacggcgttgct13
<210>59
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>59
aacggcgttgcta13
<210>60
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>60
gcgttgctacacg13
<210>61
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>61
acgagtcgtcgat13
<210>62
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>62
cggctaaacccgc13
<210>63
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>63
gcggctcgtgcgt13
<210>64
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>64
acgagtcgtcgat13
<210>65
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>65
cggctaaacccgc13
<210>66
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>66
gcggctcgtgcgt13
<210>67
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>67
cactaactcgcgc13
<210>68
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>68
cactaactcgcgc13
<210>69
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>69
actaactcgcgcc13
<210>70
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>70
actaactcgcgcc13
<210>71
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>71
tcacgtacaccgc13
<210>72
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>72
acgtacaccgcag13
<210>73
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>73
cggctacggagat13
<210>74
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>74
acgcaaaggcgac13
<210>75
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>75
ctcttagccggtt13
<210>76
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>76
tagccggttaggg13
<210>77
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>77
cccgccgacggtc13
<210>78
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>78
ccgacggtctcgc13
<210>79
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>79
cagtgaaacgacg13
<210>80
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>80
cagcggcgatcgg13
<210>81
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>81
gaacggagcgcat13
<210>82
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>82
gcttaggcgctta13
<210>83
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>83
gtcgagcctcgag13
<210>84
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>84
tcgagcctcgagt13
<210>85
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>85
cggacggcatttc13
<210>86
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>86
tataacgtacgaa13
<210>87
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>87
aacgtacgaagtc13
<210>88
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>88
gtactatcgaacg13
<210>89
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>89
ttagtcggcttcg13
<210>90
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>90
cacgcgatgcaac13
<210>91
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>91
tttgcggcgtttc13
<210>92
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>92
acacggtcggtaa13
<210>93
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>93
cgttcgaacgtgg13
<210>94
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>94
tcgaacgtggcga13
<210>95
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>95
accgccctcgcat13
<210>96
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>96
cgaataccgccct13
<210>97
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>97
cgaccatgcggct13
<210>98
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>98
acgcaacgcctcc13
<210>99
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>99
cgagcttcgtgcg13
<210>100
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>100
cgtgtagctcgat13
<210>101
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>101
gagtgatacgcgg13
<210>102
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>102
gtgatacgcggac13
<210>103
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>103
tgatacgcggaca13
<210>104
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>104
gatacgcggacaa13
<210>105
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>105
tcgcacagacgtt13
<210>106
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>106
cggcggcgatctt13
<210>107
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>107
atcgcacacgccc13
<210>108
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>108
cttcgatcacacg13
<210>109
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>109
gccgaacccgaga13
<210>110
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>110
cacgagtcggtgc13
<210>111
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>111
tacgcccaggtat13
<210>112
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>112
atcgggacccgat13
<210>113
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>113
atcgagggttacc13
<210>114
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>114
tcgccgtccacga13
<210>115
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>115
ctgtcgtgtgcgg13
<210>116
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>116
atgcgtgaagtcg13
<210>117
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>117
atgactccgacgt13
<210>118
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>118
cggttgaataagc13
<210>119
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>119
acgctgaaatcgg13
<210>120
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>120
gtacgcgggctta13
<210>121
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>121
tatcggacaaggc13
<210>122
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>122
atcatgaacgacg13
<210>123
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>123
attgtcaacgacc13
<210>124
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>124
tagggttaccgcc13
<210>125
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>125
aggtagtcgccta13
<210>126
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>126
tcgacaacgtttc13
<210>127
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>127
tcgaacactggta13
<210>128
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>128
gctcgttatagat13
<210>129
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>129
ttcgaattgaccg13
<210>130
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>130
cgaattgaccgta13
<210>131
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>131
tcgtgcttcgggc13
<210>132
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>132
cggagtctacggg13
<210>133
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>133
gcggttaactagt13
<210>134
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>134
cgattgccaaacg13
<210>135
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>135
gatgtcgataacc13
<210>136
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>136
aatcgtctatgcg13
<210>137
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>137
atcgtctatgcgc13
<210>138
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>138
cgccgtatgcaac13
<210>139
<211>13
<212>dna
<213>人工序列
<220>
<223>合成的
<400>139
gccttaatccgct13